TW202043249A - 編輯rna的方法和組合物 - Google Patents

編輯rna的方法和組合物 Download PDF

Info

Publication number
TW202043249A
TW202043249A TW109112632A TW109112632A TW202043249A TW 202043249 A TW202043249 A TW 202043249A TW 109112632 A TW109112632 A TW 109112632A TW 109112632 A TW109112632 A TW 109112632A TW 202043249 A TW202043249 A TW 202043249A
Authority
TW
Taiwan
Prior art keywords
drna
rna
target
seq
nucleotides
Prior art date
Application number
TW109112632A
Other languages
English (en)
Inventor
袁鵬飛
趙豔霞
劉能銀
易澤軒
湯剛斌
魏文勝
璩良
伊宗裔
朱詩優
王春慧
曹中正
周卓
Original Assignee
大陸商博雅輯因(北京)生物科技有限公司
北京大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商博雅輯因(北京)生物科技有限公司, 北京大學 filed Critical 大陸商博雅輯因(北京)生物科技有限公司
Publication of TW202043249A publication Critical patent/TW202043249A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/352Nature of the modification linked to the nucleic acid via a carbon atom
    • C12N2310/3521Methyl
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/533Physical structure partially self-complementary or closed having a mismatch or nick in at least one of the strands

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Compositions Of Macromolecular Compounds (AREA)

Abstract

本發明提供一種通過在宿主細胞中引入脫氨酶招募RNA來編輯RNA的方法,用於使靶標RNA中的腺苷脫氨基。本申請還提供了在所述RNA編輯方法中使用的脫氨酶招募RNA,以及包含它的組合物。

Description

編輯RNA的方法和組合物
[相關申請及引用並入]
本申請要求於2019年4月15日提交的國際申請號為PCT/CN2019/082713的國際申請,和於2019年12月30日提交的國際申請號為PCT/CN2019/129952的國際申請的優先權。其內容在此通過提及以其整體並入。
前述申請及其中引用的所有文件、申請過程中引用的所有文件(“被引用文件”)以及被引用的文件中引用以及本文中被引用或引用的所有文件(“本文引用的文件”),並且在此引用的文件中引用或參考的所有文件,以及在此提及的任何產品或在通過引用並入本文的任何文件中的任何制造商的說明,描述,產品規格和產品表,均通過引用並入本文,並且可以在本發明的實踐中使用。更具體地,所有參考文獻通過引用的方式並入,如同每個單獨文件被具體地和單獨地通過引用並入一樣。
本發明涉及利用工程化RNA來編輯RNA的方法和組合物,工程化RNA能夠招募腺苷脫氨酶用以使靶標RNA中的一個或多個腺苷脫氨基。
基因組編輯是生物醫學研究和疾病療法開發的有力工具。到目前為止,最流行的基因組編輯技術是成簇規律間隔的短回文重複序列(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)-Cas系統,它是從細菌和古細菌的適應性免疫系統開發出來的。CRISPR-Cas可以精確打靶和切割基因組DNA,從而產生雙鏈DNA斷裂(DSB)。DSB可以通過非同源末端連接(NHEJ)途徑修複,常常導致插入或缺失(Indel),後者在大多數情況下使基因失活。替選地,同源定向修複(HDR)途徑可以使用同源模板dsDNA或ssDNA修複所述DSB,從而實現精確的基因組編輯。
最近,利用脫氨酶蛋白(諸如作用於RNA的腺苷脫氨酶,ADAR),開發了用於RNA編輯的新工具。在哺乳動物細胞中,有三種類型的ADAR蛋白,ADAR1(兩個同種型,p110和p150),ADAR2和ADAR3(無催化活性)。ADAR蛋白的催化底物是雙鏈RNA,它可以從腺苷(A)核苷堿基中去除-NH2基團,將A變為肌苷(I),後者被識別為鳥苷(G)並且在隨後的細胞轉錄和翻譯過程中與胞苷(C)配對。研究人員將λN肽與人類ADAR1或ADAR2脫氨酶結構域相融合來構建λN-ADARDD系統,該系統可由BoxB莖環和反義RNA組成的融合RNA來引導,結合特定的RNA靶標。該方法可以在靶標A堿基處將靶標A編輯為I(引入A-C錯配),從而導致從A至G的RNA堿基編輯。用於RNA編輯的其他方法包括將反義RNA融合至R/G基序(ADAR-招募RNA支架)以通過在哺乳動物細胞中過表達ADAR1或ADAR2蛋白來編輯靶標RNA,以及利用dCas13-ADAR精確打靶和編輯RNA。在PCT / EP2017 / 071912申請中,公開了一種RNA編輯的方法,其不需要外源蛋白質或核酸上的招募結構域。包含與靶標RNA互補序列的合成RNA被用於誘導A到G堿基的編輯。該方法中使用的RNA短(短於54 nt),且必須進行特殊修飾以提高編輯效率。
核酸編輯在生物學研究和治療學的發展中具有巨大的潛力。目前用於DNA或RNA編輯的多數工具依賴於將外源蛋白引入活的生物體,由於可能的異常效應子活性,遞送限制和免疫原性,它們可能面臨潛在的風險或技術障礙。還有其他一些工具需要複雜的化學修飾,但是仍然導致低的編輯效率。在一些方面,本申請提供了利用短RNA使得脫氨基酶進行靶向RNA編輯的可編程方法;在一些實施方案中,所述脫氨基酶是一種ADAR(作用於RNA的腺苷脫氨酶)蛋白;在一些實施方案中,所述ADAR是一種內源性ADAR蛋白。在一些方面,本申請提供了一種工程改造的RNA,其與靶標轉錄物部分互補以招募ADAR1或ADAR2以在靶標RNA中的特定位點將腺苷變為肌苷。本文所述的方法統稱為“LEAPER”(利用內源性ADAR進行RNA的可編程編輯),而招募ADAR的RNA可互換地稱為“dRNA”或“arRNA”。
在一個方面,本申請提供了一種用於編輯宿主細胞中的靶標RNA的方法,包含將脫氨酶招募RNA(dRNA)或編碼脫氨酶招募RNA的構建體引入宿主細胞,其中,所述dRNA包含與靶標RNA雜交的互補RNA序列,並且其中,所述dRNA能夠招募招募脫氨基酶將靶核苷酸脫氨基,在一些實施方案中,作用於RNA的腺苷脫氨酶(ADAR)以使靶標RNA中的靶標腺苷(A)脫氨基。在某些實施方案中,所述宿主細胞是真核細胞。在一些實施方案中,所述宿主細胞是哺乳動物細胞。在一些實施方案中,所述宿主細胞是人類細胞。在一些實施方案中,所述宿主細胞是鼠細胞。在一些實施方案中,所述宿主細胞是原核細胞。在一些實施方案中,宿主細胞是原代細胞。在一些實施方案中,宿主細胞是T細胞。
在某些實施方案中,ADAR天然地或內源地存在於宿主細胞中,例如,天然地或內源地存在於真核細胞中。在一些實施方案中,ADAR由宿主細胞內源表達。在某些實施方案中,ADAR對宿主細胞而言是外源的。在一些實施方案中,ADAR由核酸(例如DNA或RNA)編碼。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入宿主細胞。在一些實施方案中,該方法不包含將任何蛋白質引入宿主細胞中。在某些實施方案中,所述ADAR是ADAR1和/或ADAR2。在一些實施方案中,ADAR是選自由hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2構成的組的一種或多種ADAR。
在某些實施方案中,Cas(CRISPR相關蛋白)不識別所述dRNA。在一些實施方案中,所述dRNA不包含CRISPR / Cas系統中使用的crRNA,tracrRNA或gRNA。在一些實施方案中,該方法不包含將Cas或Cas融合蛋白引入宿主細胞中。
在某些實施方案中,所述靶標RNA中的靶標A的脫氨基作用導致所述靶標RNA中的錯義突變、過早的終止密碼子、異常剪接或可變剪接。在一些實施方案中,靶標RNA編碼蛋白質,而所述靶標RNA中靶標A的脫氨基作用導致所述蛋白質的點突變、截短、延伸和/或錯誤折疊。在一些實施方案中,所述靶標RNA中靶標A的脫氨基作用導致靶標RNA中的錯義突變、過早的終止密碼子、異常剪接或可變剪接的回複。在一些實施方案中,其中所述靶標RNA編碼截短的、延長的、突變的或錯誤折疊的蛋白質,靶標RNA中的靶標A的脫氨基作用通過靶標RNA中的錯義突變、過早的終止密碼子、異常剪接或可變剪接的回複產生有功能的、全長的、正確折疊的和/或野生型蛋白質。在一些實施方案中,靶標RNA是調節RNA,並且靶標A的脫氨基作用導致由靶標RNA調節的下遊分子的表達的變化。在某些實施方案中,該方法用於利用內源性腺苷脫氨酶在靶標RNA上的編輯產生由靶標RNA編碼的蛋白質的點突變和/或錯誤折疊、和/或在靶標RNA中產生過早的終止密碼子、異常剪接位點、和/或的可變剪接位點。
在某些實施方案中,提供了用於編輯宿主細胞中的多種靶標RNA的方法,其中所述方法包含將多種dRNA或編碼所述多種dRNA的構建體引入宿主細胞中,其中所述多種脫氨酶招募RNA中的每一種包含與多種靶標RNA中的相應靶標RNA雜交的互補RNA序列,並且其中每種dRNA能夠招募作用於RNA的腺苷脫氨酶(ADAR)以使相應靶標RNA中的靶標腺苷(A)脫氨基。
在一些實施方案中,提供了經編輯的RNA或宿主細胞,其具有通過如上所述的RNA編輯方法中的任一種生產的經編輯的RNA。
在一個方面,本申請提供了治療或預防個體疾病或病症的方法,包含根據如上所述的RNA編輯方法的任何一種編輯與個體細胞中的疾病或病症相關的靶標RNA。在一些實施方案中,該方法包含離體編輯細胞中的靶標RNA。在一些實施方案中,該方法包含將經編輯的細胞施用於個體。在一些實施方案中,該方法包含向個體施用有效量的dRNA或者編碼或包含該dRNA的構建體。在一些實施方案中,該方法還包含向細胞中引入ADAR或編碼ADAR的構建體(例如,病毒載體)。在一些實施方案中,該方法還包含向個體施用ADAR或編碼該ADAR的構建體(例如,病毒載體)。在一些實施方案中,疾病或病症是遺傳性的基因疾病。在一些實施方案中,所述疾病或病症與一種或多種獲得性基因突變(例如,藥物抗性)相關。
本申請的一個方面提供了一種dRNA,包含與靶標RNA雜交的互補RNA序列,其通過招募脫氨基酶,使靶標RNA中的靶標腺苷脫氨基。在一些實施方案中,所述脫氨基酶是作用於RNA的腺苷脫氨酶(ADAR),使靶標RNA中的靶標腺苷脫氨基。
在根據本文所述的方法或dRNA的任何一項的一些實施方案中,所述dRNA包含下述RNA序列,其包含與靶標RNA結合時,直接與在靶標RNA中待編輯的靶標腺苷相對的胞苷(C)、腺苷(A)或尿苷(U)。所述直接與在靶標RNA中待編輯的靶標腺苷相對的胞苷(C)、腺苷(A)及尿苷(U)統稱為“靶向核苷酸”,或分別稱為“靶向C”,“靶向A”,及“靶向U”。在某些實施方案中,所述RNA序列還包含一個或多個鳥苷,每個鳥苷直接與靶標RNA中的非靶標腺苷相對。在某些實施方案中,靶標RNA序列中靶標A的5'最近鄰位是選自U,C,A和G的核苷酸,優先度U>C≈A> G,而且靶標RNA序列中靶標A的3'最近鄰位是選自G,C,A和U的核苷酸,優先度G> C>A≈U。在某些實施方案中,在靶標RNA中靶標A處於選自:由UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU構成的組的三堿基基序中。在某些實施方案中,其中所述三堿基基序是UAG,所述dRNA包含與所述三堿基基序中的U直接相對的A,與靶標A直接相對的C,和與三堿基基序中的G直接相對的C,G或U。在某些實施方案中,其中所述三堿基基序是靶標RNA中的UAG,所述dRNA包含與靶標RNA的UAG相對的ACC,ACG或ACU。
在根據本文所述的方法或dRNA的任何一項的一些實施方案中,所述脫氨酶招募RNA包含超過40、45、50、55、60、65、70、75或80個的核苷酸。在某些實施方案中,脫氨酶招募的RNA長度為40-260、45-250、50-240、60-230、 65-220、70-210、70-200、70-190、70-180、70-170,70-160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-150或105-140個核苷酸。在一些實施方案中,dRNA長約60-200個核苷酸(例如約60-150、65-140、68-130或70-120個核苷酸)。
在根據本文所述的任何方法或dRNA的一些實施方案中,本文所述的dRNA包含,從5'端至3'端:5'部分,與靶RNA中的靶標A正好相對的胞苷錯配,和3'部分。在一些實施方案中,3’部分不短於約7nt(例如不短於8nt,不短於9nt,以及不短於10nt)核苷酸。在一些實施方案中,3'部分長約7nt-25nt核苷酸(例如長約8nt-25nt,9nt-25nt,10nt-25nt,11nt-25nt,12nt-25nt,13nt-25nt,14nt-25nt,15nt-25nt。,16nt-25nt,17nt-25nt,18nt-25nt,19nt-25nt,20nt-25nt,21nt-25nt,22nt-25nt,23nt-25nt,24nt-25nt,例如10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5'部分不短於約25個核苷酸(例如不短於約30nt,不短於約35nt,不短於約40nt和不短於約45nt)核苷酸。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸)。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸),而3'部分的長度約為7nt-25nt核苷酸(例如長約10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5′部分比3′部分長。在一些實施方案中,5'部分長約55個核苷酸,而3'部分長約15個核苷酸。在一些實施方案中,胞苷錯配在dRNA中的位置可以如本文實施例中描述的任何的dRNA中所述,並且dRNA可以為例如Xnt-c-Ynt的格式,其中X表示5’部分的長度,Y表示3'部分的長度:55nt-c-35nt,55nt-c-25nt,55nt-c-24nt,55nt-c-23nt,55nt-c-22nt,55nt-c- 21nt,55nt-c-20nt,55nt-c-19nt,55nt-c-18nt,55nt-c-17nt,55nt-c-16nt,55nt-c-15nt,55nt-c-14nt,55nt-c-13nt, 55nt-c-12nt,55nt-c-11nt,55nt-c-10nt,55nt-c-9nt,55nt-c-8nt,55nt-c-7nt,55nt-n-20nt,50nt-n-20nt,45nt- n-20nt,55nt-n-15nt,50nt-n-15nt,45nt-c-45nt,45nt-c-55nt,54nt-c-12nt,53nt-c-13nt,52nt-c-14nt,51nt-c- 15nt,50nt-c-16nt,49nt-c-17nt,48nt-c-18nt,47nt-c-19nt,46nt-c-20nt,45nt-c-21nt,44nt-c-22nt,43nt-c-23nt, 54nt-c-15nt,53nt-c-16nt,52nt-c-17nt,51nt-c-18nt,50nt-c-19nt,49nt-c-20nt,48nt-c-21nt,47nt-c-22nt,46nt- c-23nt,54nt-c-17nt,53nt-n-18nt,52nt-n-19nt,51nt-n-20nt,50nt-n-21nt,49nt-n-22nt,和48nt-c-23。
在某些實施方案中,靶標RNA選自由前信使RNA,信使RNA,核糖體RNA,轉移RNA,長非編碼RNA和小RNA(例如miRNA)組成的組的RNA。
在根據本文所述的方法或dRNA的任何一項的一些實施方案中,所述dRNA是單鏈RNA。在一些實施方案中,所述互補RNA序列是單鏈的,並且其中所述dRNA還包含一個或多個雙鏈區。
在一些實施方案中,所述dRNA包含一種或多種修飾,例如2'-O-甲基化和/或硫代磷酸酯化。在一些實施方案中,dRNA長約60-200個核苷酸,並包含一種或多種修飾(例如2'-O-甲基化和/或硫代磷酸酯化)。在一些實施方案中,所述dRNA在首尾各3個核苷酸中包含2′-O-甲基化和/或在首尾各3個核苷酸間連接中包含硫代磷酸酯化。在一些實施方案中,所述dRNA在首尾各3個核苷酸中包含2′-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,和在一個或多個尿苷中,例如在所有尿苷中,包含2′-O-甲基化。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在單個或多個或所有尿苷中包含2'-O-甲基化,以及與靶標腺苷相對的核苷酸,和/或與靶標腺苷相對的核苷酸最鄰近的一個或兩個核苷酸中包含修飾。在某些實施方案中,與靶腺苷相對的核苷和/或與靶腺苷相對的核苷最鄰近的一個或兩個核苷的修飾是2’-O-甲基化。在某些實施方案中,與靶腺苷相對的核苷酸和/或與靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是硫代磷酸酯連接,例如3′-硫代磷酸酯連接。在某些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在所有尿苷中包含2'-O-甲基化,並且與靶腺苷相對的核苷酸的3'端或5'端緊鄰的核苷酸中包含2'-O-甲基化。在某些實施方案中,所述dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在第首尾各3個核苷酸間連接中包含硫代磷酸酯化,在所有尿苷中包含2'-O-甲基化,並且在與靶腺苷相對核苷酸和/或其5'和/或3'最鄰近核苷酸中包含3'-硫代磷酸酯化。在一些實施方案中,dRNA在首尾各5個核苷酸中包含2’-O-甲基化,並且在首尾各5個核苷酸間連接中包含硫代磷酸酯化。
在根據本文所述的任何一種方法的某些實施方案中,在靶RNA上進行編輯的效率為至少約30%,例如至少約32%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%中的任何一個或更高。
在一些實施方案中,提供了編碼上述任何一種dRNA的構建體(例如,病毒載體或質粒)。在一些實施方案中,所述構建體包含與編碼dRNA的序列可操作地連接的啟動子。在一些實施方案中,所述構建體是DNA構建體。
在一些實施方案中,提供了文庫,其包含根據上述任何一種dRNA的多個dRNA或根據上述任何一種構建體的多個構建體。
還提供了組合物,宿主細胞,試劑盒和制品,其包含本文所述的任何一種dRNA,本文所述的任何一種構建體,或本文所述的任何一種文庫。
本申請提供RNA編輯方法(本文稱為“LEAPER”方法)和經特殊設計的RNA,本文稱為脫氨酶招募RNA(“dRNA”)或ADAR-招募RNA(“arRNA”),以編輯宿主細胞中的靶標RNA。不受任何理論或假設的約束,所述dRNA通過序列特異的方式與其靶標RNA雜交而起作用,形成雙鏈RNA,其招募作用於RNA的腺苷脫氨酶(Adenosine Deaminase Acting on RNA, ADAR)以使靶標RNA中的靶標腺苷脫氨基。因此,在一些實施方案中,在無宿主細胞中異位表達或過表達ADAR蛋白的情況下可以實現有效的RNA編輯。本發明還提供了使用所述RNA編輯方法治療或預防個體疾病或病症的方法和組合物。
本文所述的RNA編輯方法不使用包含ADAR和特異性結合向導核酸的蛋白質(諸如Cas)的融合蛋白。本文描述的脫氨酶招募RNA(deaminase-recruiting RNA (“dRNA”))不包含CRISPR / Cas系統中使用的crRNA,tracrRNA或gRNA。在一些實施方案中,dRNA不包含ADAR招募結構域或化學修飾。在一些實施方案中,arRNA可以從質粒或病毒載體表達,或合成為寡核苷酸,其可以實現所需的編輯效率。不受任何理論或根本機制的束縛,已發現具有特定長度,錯配位置和/或修飾模式的某些dRNA表現出更高的RNA編輯效率。因此,本申請進一步提供了優於先前報道的RNA編輯方法。
本文所述的LEAPER方法對靶標轉錄物和罕見的全局脫靶具有可控的脫靶率。發明人已經使用LEAPER方法通過修複特定的癌症相關點突變來恢複p53功能。本文所述的LEAPER方法還可以應用於包括多種人類原代細胞的廣泛的細胞類型,並且可以用於在源自Hurler綜合征患者的原代成纖維細胞中恢複α-L-艾杜糖醛酸酶催化活性,而無需引起先天免疫應答。在一些實施方案中,LEAPER方法涉及單分子(即,dRNA)系統。本文所述的LEAPER方法可實現精確而有效的RNA編輯,從而為基礎研究和治療提供了變革性的潛力。
[定義]
將參照特定實施方案並參考某些附圖來描述本發明,但是本發明不受限於此,而是僅由請求項進行限定。請求項中的任何參考標記不應被解釋為為範圍的限制。當在本說明書和請求項中使用術語“包括”時,不排除其他因素或者步驟。對於提及單數名詞時使用不定冠詞或定冠詞的情況,例如“一個”或“一種”,“該”,它包括了該名詞的複數形式,除非另有特別說明。對於本文中對核苷酸的數值範圍的描述,明確考慮了其間的每個中間數值。例如,對於40-260個核苷酸的範圍,除了40個核苷酸和260個核苷酸的數量之外,還考慮了40到260個核苷酸之間的任何整數個核苷酸。
提供以下術語或定義,僅用於幫助理解本發明。除非本文中具體定義,否則本文使用的所有術語對本發明所屬領域技術人員具有相同的含義。從業者特別針對Sambrook等人,Molecular Cloning:A Laboratory Manual,2nd ed,Cold Spring Harbor Press,Plainsview,New York(1989);和Ausubel等人,Current Protocols in Molecular Biology(Supplement 47),John Wiley&Sons,New York(1999),關於本領域的定義和術語。本文提供的定義不應被解釋為具有比本領域普通技術人員所理解的範圍更窄的範圍。
術語“脫氨酶招募RNA”,“dRNA”,“ADAR-招募RNA”和“arRNA”在本文中可互換使用,指能招募ADAR在RNA中使靶標腺苷脫氨的工程化的RNA。
術語“多核苷酸”,“核苷酸序列”和“核酸”可互換使用。它們是指任何長度的聚合形式的核苷酸,脫氧核糖核苷酸或核糖核苷酸,或者其類似物。兩個核苷酸通過磷酸二酯鍵連接,多個核苷酸通過磷酸二酯鍵連接以形成多核苷酸或核酸。核苷酸之間的連接可以被硫代磷酸化,稱為“硫代磷酸酯連接”或“硫代磷酸化連接”。
本文所用的術語“腺嘌呤”,“鳥嘌呤”,“胞嘧啶”,“胸腺嘧啶”,“尿嘧啶”和“次黃嘌呤”是指核堿基本身。術語“腺苷”,“鳥苷”,“胞苷”,“胸苷”,“尿苷”和“肌苷”是指與核糖或脫氧核糖的糖部分連接的核堿基。術語“核苷”是指與核糖或脫氧核糖連接的核堿基。術語“核苷酸”是指各自的核堿基 - 核糖基 - 磷酸酯或核堿基 - 脫氧核糖基 - 磷酸酯。有時術語腺苷和腺嘌呤(縮寫“A”),鳥苷和鳥嘌呤(縮寫“G”),胞嘧啶和胞苷(縮寫“C”),尿嘧啶和尿苷(縮寫“U”),胸腺嘧啶和胸苷(縮寫“T”),肌苷和次黃嘌呤(縮寫“I”),可互換使用,指相應的核堿基,核苷或核苷酸。有時,術語核堿基,核苷和核苷酸可互換使用,除非上下文明確要求不同。
在本申請的上下文中,“靶標RNA”是指將脫氨酶招募RNA序列設計為與其具有完全互補性或基本互補性的RNA序列,並且靶標序列與dRNA之間雜交形成含有靶標腺苷的雙鏈RNA(dsRNA)區域,其招募作用於RNA的腺苷脫氨酶(ADAR),該酶使靶標腺苷脫氨基。在一些實施方案中,ADAR天然地存在於宿主細胞中,例如真核細胞(優選哺乳動物細胞,更優選人類細胞)。在一些實施方案中,將所述ADAR引入宿主細胞中。
如本文所用,“互補性”是指核酸通過傳統的Watson-Crick堿基配對與另一種核酸形成氫鍵的能力。百分比互補性表示核酸分子中可與第二核酸形成氫鍵(即,Watson-Crick堿基配對)的殘基的百分比(例如,10個中的約5、6、7、8、9、10 個分別為約50%,60%,70%,80%,90%和100%互補)。“完全互補”是指核酸序列的所有連續殘基與第二核酸序列中相同數量的連續殘基形成氫鍵。如本文所用,“基本上互補”是指在約40、50、60、70、80、100、150、200、250或更多個核苷酸的區域內,至少約70%,75%,80%,85%,90%,95%,97%,98%,99%或100%中的任何一個的互補程度,或指在嚴格條件下雜交的兩條核酸。
如本文所用,雜交的“嚴格條件”是指與靶標序列具有互補性的核酸主要與靶標序列雜交並且基本上不與非靶標序列雜交的條件。嚴格條件通常是序列依賴性的,並且取決於許多因素而變化。通常,序列越長,序列與其靶標序列發生特異性雜交的溫度越高。Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology- Hybridization With Nucleic Acid Probes Part I,Second Chapter“Principles of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N,Y中詳細描述了嚴格條件的非限制性實例。
“雜交”是指其中一種或多種多核苷酸反應形成複合物的反應,所述複合物通過核苷酸殘基的堿基之間的氫鍵穩定。所述氫鍵可以通過Watson Crick堿基配對,Hoogstein結合或以任何其他序列特異性的方式發生。能夠與給定序列雜交的序列稱為給定序列的“互補序列”。
如本文所用,術語“細胞”,“細胞系”和“細胞培養物”可互換使用,並且所有這些名稱包括後代。應理解,由於故意或無意的突變,所有後代的DNA內容可能不完全相同。本發明包括了具有與原始細胞相同的功能或生物活性的變體後代。
[RNA編輯方法]
在本發明中,本文所用的dRNA包含的RNA序列含有與靶標RNA結合時與靶標RNA中待編輯的靶標腺苷直接相對的胞苷(C),腺苷(A)或尿苷(U)。與靶標腺苷直接相對的胞苷(C),腺苷(A)和尿苷(U)統稱為“靶向核苷酸”,或分別稱為“靶向C”,“靶向A”和“靶向U”。靶向核苷酸和與靶向核苷酸直接相鄰的兩個核苷酸形成三聯體,其在本文中稱為“靶向三聯體”。
在一些實施方案中,本發明提供了用於編輯宿主細胞(例如,真核細胞)中的靶標RNA的方法,包含將脫氨酶招募RNA(dRNA)或編碼dRNA的構建體引入宿主細胞,其中所述dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募作用於RNA的腺苷脫氨酶(ADAR)以使靶標RNA中的靶標腺苷(A)脫氨基。
在一些實施方案中,本發明提供了用於編輯宿主細胞(例如,真核細胞)中的靶標RNA的方法,包含將dRNA或編碼dRNA的構建體引入宿主細胞,其中所述dRNA包含與靶標RNA雜交的互補RNA序列,並且其中所述dRNA招募宿主細胞的內源表達的ADAR,以使靶標RNA中的靶標A脫氨基。在一些實施方案中,該方法不包含將任何蛋白質或編碼蛋白質的構建體(例如,Cas,ADAR或ADAR和Cas的融合蛋白)引入宿主細胞。
在一些實施方案中,提供了用於編輯宿主細胞(例如,真核細胞)中的靶標RNA的方法,包含引入:(a)dRNA或編碼dRNA的構建體,和(b)ADAR或編碼ADAR的構建體到宿主細胞中,其中所述dRNA包含與靶標RNA雜交的互補RNA序列,並且其中所述dRNA招募ADAR,以使靶標RNA中的靶標A脫氨基。在一些實施方案中,所述ADAR是宿主細胞的內源編碼的ADAR,其中所述ADAR引入包含在宿主細胞中過表達ADAR。在一些實施方案中,所述ADAR對宿主細胞是外源的。在一些實施方案中,所述編碼ADAR的構建體是載體,例如質粒,或病毒載體(例如,慢病毒載體)。
在一些實施方案中,提供了用於編輯宿主細胞(例如,真核細胞)中的多種(例如,至少約2、3、4、5、10、20、50、100或更多種)靶標RNA的方法,其包含引入多個dRNA或編碼多個dRNA的構建體至宿主細胞,其中每個dRNA包含與所述多個靶標RNA中的相應靶標RNA雜交的互補RNA序列,並且其中每個dRNA能夠招募ADAR,以使相應靶標RNA的靶標A脫氨基。
在一些實施方案中,提供了用於編輯宿主細胞(例如,真核細胞)中的多個(例如,至少約2、3、4、5、10、20、50、100或更多個)靶標RNA的方法,其包含引入多個dRNA或編碼多個dRNA的構建體至宿主細胞,其中每個dRNA包含與所述多個靶標RNA的相應靶標RNA雜交的互補RNA序列,並且其中每個dRNA招募內源表達的ADAR,以使相應靶標RNA中的靶標A脫氨基。
在一些實施方案中,提供了用於編輯宿主細胞(例如,真核細胞)中的多種(例如,至少約2、3、4、5、10、20、50、100、1000或更多種)靶標RNA的方法,包括引入(a)多個dRNA或者編碼多個dRNA的構建體,和(b)ADAR或者編碼ADAR的構建體到宿主細胞中,其中每個dRNA包含互補RNA序列,其與所述多個靶標RNA中的相應靶標RNA雜交,並且其中每個dRNA招募ADAR,以使相應靶標RNA中的靶標A脫氨基。
在一個方面,本申請提供了通過引入多種脫氨酶招募RNA,一種或多種編碼脫氨酶招募RNA的構建體或本文所述的文庫至宿主細胞,來編輯宿主細胞中的多種RNA的方法。
在某些實施方案中,用於編輯靶標RNA的方法包含引入多種脫氨酶招募RNA或包含多種脫氨酶招募RNA的一種或多種構建體至宿主細胞中,以招募作用於RNA的腺苷脫氨酶(ADAR)以進行脫氨基反應(針對一個或多個靶標RNA中的一個或多個靶標腺苷),其中每種脫氨酶招募RNA包含與相應靶標RNA互補的RNA序列。
在一個方面,本申請提供了用於在宿主細胞(例如,真核細胞)中產生靶標RNA和/或由靶標RNA編碼的蛋白質的一種或多種修飾的方法,包含引入dRNA或編碼該dRNA的構建體到宿主細胞中,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中所述一個或多個修飾選自下組:由靶標RNA編碼的蛋白質的點突變,由靶標RNA編碼的蛋白質的錯誤折疊,靶標RNA中的過早的終止密碼子,靶標RNA中的異常剪接位點和靶標RNA中的可變剪接位點。
在某些實施方案中,用於在宿主細胞(例如,真核細胞)靶標RNA和/或由靶標RNA編碼的蛋白質中產生的一種或多種修改的方法包含引入多種脫氨酶招募RNA或編碼多個脫氨酶招募RNA的構建體至宿主細胞中,其中每個dRNA包含與所述多個靶標RNA中的相應靶標RNA雜交的互補RNA序列,並且其中每個dRNA能夠招募ADAR以使相應的靶標RNA的靶標A脫氨基。
在一個方面,本申請提供了根據本文所述的dRNA的任何一種的脫氨酶招募RNA的用途,用於編輯宿主細胞中的靶標RNA。在某些實施方案中,脫氨酶招募RNA包含與待編輯的靶標RNA雜交的互補RNA序列。
在一個方面,本申請提供了根據本文所述的dRNA的任何一種的脫氨酶招募RNA的用途,用於在靶標RNA和/或由靶標RNA編碼的蛋白質上產生一種或多種修飾,其中所述一種或多種修飾選自下組:由靶標RNA編碼的蛋白質的點突變,由靶標RNA編碼的蛋白質的錯誤折疊,靶標RNA中的過早的終止密碼子,靶標RNA中的異常剪接位點,以及靶標RNA中的可變剪接位點。在某些實施方案中,所述脫氨酶招募RNA包含與待編輯的靶標RNA雜交的互補RNA序列。
本發明還涉及利用內源性腺苷脫氨酶編輯真核細胞中的靶標RNA的方法,包含將如本文所述的dRNA或編碼dRNA的構建體引入真核細胞中以招募天然內源性腺苷脫氨酶(ADAR),其作用於RNA以對靶標RNA序列中的靶標腺苷進行脫氨基反應。
在根據本文描述的任何一種方法或用途的某些實施方案中,dRNA包含多於約40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250個核苷酸中的任何一種。在某些實施方案中,dRNA為約40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70-160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任何一種。在一些實施方案中,dRNA長約60-200個核苷酸,例如長約60-150、65-140、68-130或70-120個核苷酸。在一些實施方案中,dRNA為約71個核苷酸長。在一些實施方案中,dRNA為約111個核苷酸長。
在根據本文描述的任何一種方法或用途的某些實施方案中,dRNA不包含ADAR-招募結構域。“ADAR-招募結構域”可以是與ADAR高親和力結合的核苷酸序列或結構,或與在工程化的ADAR構建體中與ADAR融合的結合配偶體結合的核苷酸序列。示例性ADAR招募域包括,但不限於,GluR-2,GluR-B(R/G),GluR-B(Q/R),GluR-6(R/G),5HT2C和FlnA(Q/R)域;參見,例如Wahlstedt,Helene和Marie,"Site-selective versus promiscuous A-to-I editing." Wiley Interdisciplinary Reviews: RNA 2.6 (2011): 761-771,其通過引用以其整體並入本文。在一些實施方案中,dRNA不包含雙鏈部分。在一些實施方案中,dRNA不包含發夾結構,諸如MS2莖環。在一些實施方案中,dRNA是單鏈的。在一些實施例中,所述dRNA不包含DSB結合結構域。在一些實施方案中,dRNA由互補RNA序列組成(或基本由其組成)。
在根據本文描述的任何一種方法或用途的某些實施方案中,dRNA不包含化學修飾。在一些實施方案中,dRNA不包含化學修飾的核苷酸,諸如2’-O-甲基核苷酸或具有硫代磷酸酯鍵的核苷酸。在一些實施方案中,dRNA僅在前三個殘基和後三個殘基處包含2'-O-甲基化和硫代磷酸酯連接。在一些實施方案中,dRNA不是反義寡核苷酸(ASO)。
在根據本文所述的方法或用途的任何一種的某些實施方案中,所述宿主細胞是原核細胞。在一些實施方案中,所述宿主細胞是真核細胞。優選地,所述宿主細胞是哺乳動物細胞。最優選地,所述宿主細胞是人類細胞。在一些實施方案中,所述宿主細胞是小鼠細胞。在一些實施方案中,所述宿主細胞是植物細胞或真菌細胞。
在根據本文描述的任何一種方法或用途的一些實施方案中,宿主細胞是細胞系,諸如HEK293T,HT29,A549,HepG2,RD,SF268,SW13和HeLa細胞。在一些實施方案中,宿主細胞是原代細胞,諸如成纖維細胞,上皮細胞或免疫細胞。在一些實施方案中,宿主細胞是T細胞。在一些實施方案中,宿主細胞是有絲分裂後細胞。在一些實施方案中,宿主細胞是中樞神經系統(CNS)的細胞,諸如腦細胞,例如小腦細胞。
在一些實施方案中,提供了在原代宿主細胞(例如,T細胞或CNS細胞)中編輯靶標RNA的方法,其包括將dRNA或編碼該dRNA的構建體引入宿主細胞,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA招募宿主細胞的內源表達的ADAR以使靶標RNA中的靶標A脫氨基。
在根據本文所述的方法或用途的任何一種的某些實施方案中,所述ADAR對宿主細胞是內源的。在一些實施方案中,作用於RNA的腺苷脫氨酶(ADAR)天然地或內源地存在於宿主細胞中,例如,天然地或內源地存在於真核細胞中。在一些實施方案中,所述ADAR由宿主細胞內源表達。在某些實施方案中,將所述ADAR外源引入宿主細胞中。在一些實施例中,所述ADAR是ADAR1和/或ADAR2。在某些實施方案中,所述ADAR是選自下組的一種或多種ADAR:hADAR1,hADAR2,小鼠ADAR1和ADAR2。在一些實施方案中,ADAR是ADAR1,諸如ADAR1的p110同種型(“ADAR1p110 ”)和/或ADAR1的p150同種型(“ADAR1p150 ”)。在一些實施方案中,ADAR是ADAR2。在一些實施方案中,ADAR是宿主細胞表達的ADAR2,例如小腦細胞表達的ADAR2。
在一些實施方案中,ADAR是宿主細胞外源的ADAR。在一些實施方案中,ADAR是天然存在的ADAR的過度活躍的突變體。在一些實施方案中,ADAR是包含E1008Q突變的ADAR1。在一些實施方案中,ADAR不是包含結合結構域的融合蛋白。在一些實施方案中,ADAR不包含工程化的雙鏈核酸結合結構域。在一些實施方案中,ADAR不包含與融合至dRNA中的互補RNA序列的MS2發夾結合的MCP結構域。在一些實施例中,ADAR不包括DSB。
在根據本文描述的任何一種方法或用途的一些實施方案中,宿主細胞具有高表達水平的ADAR1(諸如ADAR1p110 和/或ADAR1p150 ),例如相對於 -微管蛋白的蛋白質表達水平的至少約10%,20%,50%,100%,2x,3x,5x或更高中的任何一項。在一些實施方案中,宿主細胞具有高表達水平的ADAR2,例如相對於 -微管蛋白的蛋白質表達水平的至少約10%,20%,50%,100%,2x,3x,5x或更高中的任何一項。在一些實施方案中,宿主細胞具有低表達水平的ADAR3,例如相對於 -微管蛋白的蛋白質表達水平不超過約5x,3x,2x,100%,50%,20%或更少中的任何一項。
在根據本文所述的方法或用途的任何一種的某些實施方案中,所述互補RNA序列包含與靶標RNA中的靶標A直接相對的胞苷、腺苷或尿苷。在一些實施方案中,互補RNA序列包含與靶標RNA中的靶標A直接相對的胞苷錯配。在一些實施方案中,胞苷錯配位於距互補RNA序列的5'端至少5個核苷酸,例如至少10、15、20、25、30或更多個核苷酸。在一些實施方案中,胞苷錯配位於距互補RNA序列的3'端至少20個核苷酸,例如至少25、30、35或更多個核苷酸。在一些實施方案中,胞苷錯配不位於距互補RNA序列的3'端20(例如15、10、5或更少)個核苷酸內。在一些實施方案中,胞苷錯配位於距互補RNA序列的3'端至少20個核苷酸(例如,至少25、30、35或更多個核苷酸)和5'端至少5個核苷酸(例如,至少10、15、20,25、30或更多個核苷酸)。在一些實施方案中,胞苷錯配位於互補RNA序列的中心。在一些實施方案中,胞苷錯配位於dRNA中互補序列中心的20個核苷酸(例如15、10、9、8、7、6、5、4、3、2或1個核苷酸)內。在根據本文描述的任何一種方法或用途的某些實施方案中,互補RNA序列還包含一個或多個鳥苷,諸如1、2、3、4、5、6或多個G,分別與靶標RNA中的非靶標腺苷直接相對。在一些實施方案中,互補RNA序列包含與靶標RNA中的非靶腺苷相對的兩個或更多個連續錯配核苷酸(例如2、3、4、5或更多個錯配核苷酸)。在一些實施方案中,靶標RNA包含不超過約20個非靶標A,諸如不超過約15、10、9、8、7、6、5、4、3、2或1個非靶標A中的任何一項。與非靶標A相對的G和連續錯配核苷酸可降低ADAR的脫靶編輯作用。
在根據本文所述的任何方法或dRNA的一些實施方案中,本文所述的dRNA的特征可包括,從5'端至3'端:一個5'部分,一個與靶RNA中的靶標A正好相對的胞苷錯配,和一個3'部分。在一些實施方案中,3’部分不小於約7nt(例如不短於8nt,不短於9nt,以及不短於10nt)核苷酸。在一些實施方案中,3'部分長約7nt-25nt核苷酸(例如長約8nt-25nt,9nt-25nt,10nt-25nt,11nt-25nt,12nt-25nt,13nt-25nt,14nt-25nt,15nt-25nt。,16nt-25nt,17nt-25nt,18nt-25nt,19nt-25nt,20nt-25nt,21nt-25nt,22nt-25nt,23nt-25nt,24nt-25nt,例如10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5'部分不小於約25個核苷酸(例如不小於約30nt,不小於約35nt,不小於約40nt和不小於約45nt)核苷酸。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸)。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸),而3'部分的長度約為7nt-25nt核苷酸(例如長約10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5′部分比3′部分長。在一些實施方案中,5'部分長約55個核苷酸,而3'部分長約15個核苷酸。
在一些實施方案中,胞苷錯配在dRNA中的位置可以如本文實施例中描述的任何的dRNA中所述,並且dRNA可以為如Xnt-c-Ynt的格式,其中X表示5’部分的長度, Y表示3'部分的長度:55nt-c-35nt,55nt-c-25nt,55nt-c-24nt,55nt-c-23nt,55nt-c-22nt,55nt-c- 21nt,55nt-c-20nt,55nt-c-19nt,55nt-c-18nt,55nt-c-17nt,55nt-c-16nt,55nt-c-15nt,55nt-c-14nt,55nt-c-13nt, 55nt-c-12nt,55nt-c-11nt,55nt-c-10nt,55nt-c-9nt,55nt-c-8nt,55nt-c-7nt,55nt-n-20nt,50nt-n-20nt,45nt- n-20nt,55nt-n-15nt,50nt-n-15nt,45nt-c-45nt,45nt-c-55nt,54nt-c-12nt,53nt-c-13nt,52nt-c-14nt,51nt-c- 15nt,50nt-c-16nt,49nt-c-17nt,48nt-c-18nt,47nt-c-19nt,46nt-c-20nt,45nt-c-21nt,44nt-c-22nt,43nt-c-23nt, 54nt-c-15nt,53nt-c-16nt,52nt-c-17nt,51nt-c-18nt,50nt-c-19nt,49nt-c-20nt,48nt-c-21nt,47nt-c-22nt,46nt- c-23nt,54nt-c-17nt,53nt-n-18nt,52nt-n-19nt,51nt-n-20nt,50nt-n-21nt,49nt-n-22nt,和48nt-c-23。
在根據本文描述的任何一種方法或用途的某些實施方案中,互補RNA序列還包含一個或多個鳥苷(G),例如1、2、3、4、5、6或更多個G,每個與靶標RNA中的非靶標腺苷直接相對。在一些實施方案中,互補RNA序列包含與靶標RNA中的非靶標腺苷相對的兩個或更多個連續錯配核苷酸(例如2、3、4、5或更多個錯配核苷酸)。在一些實施方案中,靶標RNA包含不超過約20個非靶標A,例如不超過約15、10、9、8、7、6、5、4、3、2或1個非靶標A。與非靶標A相對的G和連續錯配的核苷酸可以降低ADAR的脫靶編輯作用。
在根據本文描述的任何一種方法或用途的某些實施方案中,靶標A的5'側最近鄰位是選自U,C,A和G的核苷酸,優先度U>C≈A>G且靶標A的3'側最近鄰位是選自G,C,A和U的核苷酸,優先度G>C>A≈U。在某些實施方案中,靶標RNA中的靶標A是選自下組的三堿基基序:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。在某些實施方案中,所述三堿基基序是UAG,並且所述dRNA包含與所述三堿基基序中的U直接相對的A,與所述靶標A直接相對的C,和與三堿基基序中的G直接相對的C,G或U。在某些實施方案中,所述三堿基基序是靶標RNA中的UAG,並且所述dRNA包含與靶標RNA的UAG相對的ACC,ACG或ACU。在某些實施方案中,三堿基基序是靶標RNA中的UAG,並且dRNA包含與靶標RNA的UAG相對的ACC。
在一些實施方案中,dRNA包含一種或多種修飾。dRNA的示例性修飾包括但不限於硫代磷酸酯骨架修飾,核糖中的2'取代(例如2'-O-甲基化和2'-氟取代),LNA和L-RNA。在一些實施方案中,dRNA包含一種或多種修飾,例如2’-O-甲基化和/或硫代磷酸酯化。在一些實施方案中,dRNA約為60-200(此範圍涵蓋數字60和200之間的任何連續正整數,例如60、65、70、75、80、85、90、95、100、105、110、115、120、130、140、150、160、170、180、190、200)個核苷酸長度,並且包含一個或多個修飾(例如2'-O-甲基化和/或3'-硫代磷酸酯化)。在一些實施方案中,dRNA長約60-200個核苷酸,並包含一個或多個修飾。在一些實施方案中,dRNA長約60-200個核苷酸,並且包含2′-O-甲基化和/或硫代磷酸酯化修飾。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2′-O-甲基化和/或在首尾各3個核苷酸間連接中包含硫代磷酸酯化。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2′-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,和在一個或多個尿苷中,例如在所有尿苷中,包含2′-O-甲基化。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在單個或多個或所有尿苷中包含2'-O-甲基化,以及與靶標腺苷相對的核苷酸,和/或與靶標腺苷相對的核苷酸最鄰近的一個或兩個核苷酸中包含修飾。在某些實施方案中,與靶腺苷相對的核苷酸和/或與靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是2’-O-甲基化。在某些實施方案中,與靶腺苷相對的核苷酸和/或與靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是硫代磷酸酯連接,例如3′-硫代磷酸酯連接。在某些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在所有尿苷中包含2'-O-甲基化,並且與靶腺苷相對的核苷酸的3'端或5'端緊鄰的核苷酸中包含2'-O-甲基化。在某些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在第首尾各3個核苷酸間連接中包含硫代磷酸酯化,在單個或多個或所有尿苷中包含2'-O-甲基化,並且在與靶腺苷相對核苷酸和/或其5'和/或3'最鄰近核苷酸中包含3'-硫代磷酸酯化連接。在一些實施方案中,dRNA在首尾各5個核苷酸中包含2’-O-甲基化,並且在首尾各5個核苷酸間連接中包含硫代磷酸酯化。
在根據本文所述的方法或用途的任何一種的某些實施方案中,所述靶標RNA是選自下組的任何一種:前信使RNA,信使RNA,核糖體RNA,轉移RNA,長非編碼RNA和小RNA(例如,miRNA)。在一些實施方案中,靶標RNA是前信使RNA。在一些實施方案中,靶標RNA是信使RNA。
在根據本文描述的任何一種方法或用途的某些實施方案中,該方法進一步包括將ADAR3的抑制劑引入宿主細胞。在一些實施方案中,ADAR3的抑制劑是針對ADAR3的RNAi,諸如針對ADAR3的shRNA或針對ADAR3的siRNA。在一些實施方案中,該方法進一步包括將幹擾素的刺激劑引入宿主細胞。在一些實施方案中,ADAR可由幹擾素誘導,例如,ADAR是ADARp150 。在一些實施方案中,幹擾素的刺激劑是IFNα。在一些實施方案中,ADAR3的抑制劑和/或幹擾素的刺激劑由編碼dRNA的相同構建體(例如,載體)編碼。
在根據本文描述的任何一種方法或用途的某些實施方案中,靶標RNA的編輯效率為至少約20%,諸如至少約25%,30%,35%,40%,45%,50%,55%,60%,65%,70%, 75%, 80%, 85%, 90%或更高中的任何一項。在一些實施方案中,編輯的效率通過Sanger測序來確定。在一些實施方案中,編輯的效率由下一代測序確定。
在根據本文描述的任何一種方法或用途的某些實施方案中,該方法具有低的脫靶編輯率。在一些實施方案中,該方法對靶標RNA中的非靶標A具有低於約1%(例如,不超過約0.5%,0.1%,0.05%,0.01%,0.001%或更低中的任何一項)的編輯效率。在一些實施方案中,該方法不編輯靶標RNA中的非靶標A。在一些實施方案中,該方法對非靶標RNA中的A具有低於約0.1%(例如,不超過約0.05%,0.01%,0.005%,0.001%,0.0001%或更低中的任何一項)的編輯效率。
在根據本文描述的任何一種方法或用途的某些實施方案中,該方法不誘導免疫應答,諸如先天免疫應答。在一些實施方案中,該方法不誘導宿主細胞中幹擾素和/或白介素的表達。在一些實施方案中,該方法在宿主細胞中不誘導IFN-β和/或IL-6表達。
本發明還提供了經編輯的RNA或宿主細胞,所述宿主細胞具有通過本文所述的方法的任何一種所產生的經編輯的RNA。在一些實施方案中,經編輯的RNA包含肌苷。在一些實施方案中,所述宿主細胞包含具有錯義突變,過早的終止密碼子,可變剪接位點或異常剪接位點的RNA。在一些實施方案中,所述宿主細胞包含突變的,截短的或錯誤折疊的蛋白質。
如本文所述的“宿主細胞”是指可用作宿主細胞的任何細胞類型,前提是其可如本文所述的被修飾。例如,所述宿主細胞可以是具有作用於RNA的內源性表達的腺苷脫氨酶(ADAR)的宿主細胞,或者可以是通過本領域已知的方法引入作用於RNA的腺苷脫氨酶(ADAR)的宿主細胞。例如,所述宿主細胞可以是原核細胞,真核細胞或植物細胞。在一些實施方案中,所述宿主細胞源自預先建立的細胞系,例如哺乳動物細胞系,包括人類細胞系或非人類細胞系。在一些實施方案中,所述宿主細胞源自個體,例如人類個體。
本文使用的“引入(introducing)”或“引入(introduction)”是指將一種或多種多核苷酸(例如dRNA)或一種或多種構建體(包括本文所述的載體,它的一種或多種轉錄物)遞送至所述宿主細胞。本發明用作能夠打靶地編輯RNA的基礎平臺,例如,前信使RNA,信使RNA,核糖體RNA,轉移RNA,長非編碼RNA和小RNA(例如miRNA)。本申請的方法可以采用許多遞送系統,包括但不限於:病毒,脂質體,電穿孔,顯微注射和接合作用,以實現如本文所述的dRNA或構建體向宿主細胞中的引入。常規的基於病毒和非病毒的基因轉移方法可用於將核酸引入哺乳動物細胞或靶標組織。此類方法可用於將編碼本申請的dRNA的核酸施用於培養的細胞或宿主生物體中。非病毒載體遞送系統包括DNA質粒,RNA(例如本文所述的構建體的轉錄物),裸核酸和與遞送載體複合的核酸,例如脂質體。所述病毒載體遞送系統包括DNA和RNA病毒,其具有遊離或整合的基因組以遞送至所述宿主細胞。
非病毒遞送核酸的方法包括脂質轉染,核轉染,顯微注射,生物射彈,病毒體,脂質體,免疫脂質體,聚合陽離子或脂質:核酸接合物,電穿孔,納米顆粒,外泌體,微泡或基因槍,裸DNA和人工病毒粒子。
使用基於RNA或DNA病毒的系統來遞送核酸在使病毒打靶特定細胞和使病毒的有效負載運輸到細胞核方面具有高效率。
在根據本文描述的任何一種方法或用途的某些實施方案中,該方法包括將編碼dRNA的病毒載體(諸如,慢病毒載體)引入宿主細胞。在一些實施方案中,該方法包括將編碼dRNA的質粒引入宿主細胞。在一些實施方案中,該方法包括將dRNA(例如,合成dRNA)引入(例如,通過電穿孔)到宿主細胞中。在一些實施方案中,該方法包括將dRNA轉染到宿主細胞中。
在脫氨基之後,根據靶標RNA中的靶標腺苷的位置,可以使用不同方法確定靶標RNA和/或靶標RNA編碼的蛋白質的修飾。例如,為了確定在靶標RNA中是否已將“A”編輯為“I”,可以使用本領域已知的RNA測序方法來檢測RNA序列的修飾。當靶標腺苷位於mRNA的編碼區中時,RNA編輯可以引起mRNA編碼的氨基酸序列的改變。例如,可以將點突變引入mRNA,或者mRNA中的先天的或獲得性的點突變被回複以產生野生型基因產物,因為“A”轉化為了“I”。通過本領域已知的方法進行氨基酸測序可用於發現編碼蛋白質中氨基酸殘基的任何變化。終止密碼子的修飾可以通過評估功能性的、伸長的、截短的、全長的和/或野生型的蛋白質的存在來確定。例如,當靶標腺苷位於UGA,UAG或UAA終止密碼子中時,靶標A(UGA或UAG)或多個A(UAA)的修飾可創造出通讀突變和/或延長的蛋白質,或者,由靶標RNA編碼的截短蛋白質可以被回複以產生有功能的、全長的和/或野生型的蛋白質。靶標RNA的編輯還可以在靶標RNA中產生異常剪接位點和/或可變的剪接位點,從而導致延長的,截短的或錯誤折疊的蛋白質,或者靶標RNA中經編碼的異常剪接或可變剪接位點經回複以產生有功能的、正確折疊的、全長的和/或野生型的蛋白質。在一些實施方案中,本申請考慮編輯先天的和獲得性的基因變化,例如,錯義突變,過早的終止密碼子,異常剪接或由靶標RNA編碼的可變剪接位點。使用已知方法評估由靶標RNA編碼的蛋白質的功能,可以發現RNA編輯是否實現了期望的效果。因為腺苷(A)對肌苷(I)的脫氨基可以糾正編碼蛋白質的突變RNA中的靶標位置處的突變A,所以對脫氨基為肌苷的鑒定可以提供功能蛋白質是否存在的評估,或者突變的腺苷引起的、與疾病或藥物抗性相關的RNA是否已回複或部分回複的評估。類似地,因為腺苷(A)對肌苷(I)的脫氨基作用可能在所得蛋白質中引入點突變,所以對脫氨基為肌苷的鑒定可以找出疾病原因或疾病相關因素的功能性指征。
當靶標腺苷的存在引起異常剪接時,讀出值可以是異常剪接的發生和頻率的評估。另一方面,當期望的目標腺苷的脫氨基作用被引入剪接位點時,可以使用類似的方法來檢查是否發生所需的剪接類型。使用本領域技術人員熟知的方法在靶標腺苷脫氨基之後鑒別出肌苷存在的示例性合適方法是RT-PCR和測序。
靶標腺苷的脫氨作用包括例如點突變,過早的終止密碼子,異常剪接位點,可變剪接位點和所得蛋白質的錯誤折疊。這些效應可以誘導與疾病相關的RNA和/或蛋白質的結構和功能變化,無論它們是先天遺傳的還是由獲得性基因突變引起的,或者可以誘導與耐藥性發生相關的RNA和/或蛋白質的結構和功能變化。因此,通過改變與疾病相關的RNA和/或蛋白質的結構和/或功能,可以將dRNA,編碼dRNA的構建體和本申請的RNA編輯方法用於預防或治療遺傳性疾病或病症,或與獲得性基因突變相關的疾病或病症。
在一些實施方案中,靶標RNA是調節RNA。在一些實施方案中,待編輯的靶標RNA是核糖體RNA,轉移RNA,長非編碼RNA或小RNA(例如,miRNA,pri-miRNA,pre-miRNA,piRNA,siRNA,snoRNA,snRNA, exRNA或scaRNA)。靶標腺苷的脫氨基作用包括例如核糖體RNA,轉移RNA,長非編碼RNA或小RNA(例如,miRNA),包括了三維結構和/或功能損失或功能獲得的變化。在一些實施方案中,靶標RNA中靶標A的脫氨基作用改變了靶標RNA的一種或多種下遊分子(例如,蛋白質,RNA和/或代謝物)的表達水平。所述下遊分子的表達水平的變化可以是表達水平的增加或減少。
本申請的一些實施方案涉及宿主細胞中靶標RNA的多重編輯,其可用於篩選靶標基因的不同變體或宿主細胞中的不同基因。在一些實施方案中,其中所述方法包含將多個dRNA引入所述宿主細胞,所述多個dRNA中的至少兩個dRNA具有不同的序列和/或具有不同的靶標RNA。在一些實施方案中,每種dRNA具有不同的序列和/或不同的靶標RNA。在一些實施方案中,該方法在宿主細胞中的單個靶標RNA中產生多個(例如,至少2、3、5、10、50、100、1000或更多個)修飾。在一些實施方案中,該方法產生宿主細胞中多種(例如,至少2、3、5、10、50、100、1000或更多種)靶標RNA的修飾。在一些實施方案中,該方法包含:編輯多個宿主細胞群中的多個靶標RNA。在一些實施方案中,每個宿主細胞群接收不同的dRNA或具有與其他宿主細胞群不同的靶標RNA的dRNA。
[脫氨酶招募RNA,構建體和文庫]
在一個方面,本申請提供了可用於本文所述方法的任何一種的脫氨酶招募RNA。本節中描述的任何一種dRNA可用於本文所述的RNA編輯和治療方法中。設定本文描述的dRNA的任何特征和參數可以彼此組合,就好像每個組合被單獨描述一樣。本文描述的dRNA不包含CRISPR / Cas系統中使用的tracrRNA,crRNA或gRNA。
在一些實施方案中,提供了一種脫氨酶招募RNA(dRNA),其通過招募ADAR對靶標RNA中的靶標腺苷進行脫氨基作用,所述ADAR包含與靶標RNA雜交的互補RNA序列。
在一個方面,本發明提供了包含本文所述的任何一種脫氨酶招募RNA的構建體。在某些實施方案中,所述構建體是病毒載體(優選地,慢病毒載體)或質粒。在一些實施方案中,所述構建體編碼單個dRNA。在一些實施方案中,所述構建體編碼多個(例如,約1、2、3、4、5、10、20或更多個中的任一項)dRNA。
在一個方面,本申請提供了包含多種脫氨酶招募RNA或本文所述的多種構建體的文庫。
在一個方面,本申請提供了包含所述脫氨酶招募RNA或本文所述構建體的組合物或宿主細胞。在某些實施方案中,所述宿主細胞是原核細胞或真核細胞。優選地,所述宿主細胞是哺乳動物細胞。最優選地,所述宿主細胞是人類細胞。
在根據本文所述的dRNA,構建體,文庫或組合物中的任一種的某些實施方案中,所述互補RNA序列包含直接與靶標腺苷相對的胞苷,腺苷或尿苷(其在靶標RNA中待編輯)。在某些實施方案中,所述互補RNA序列還包含一種或多種鳥苷,其各自與靶標RNA中的非靶標腺苷直接相對。在某些實施方案中,靶標A的5'側最近鄰位是選自U,C,A和G的核苷酸,優先度U>C≈A> G且靶標A的3'側最近鄰位是選自G,C,A和U的核苷酸,優先度G> C>A≈U。在一些實施例中,靶標A的5'側最近鄰位是U。在一些實施例中,靶標A的5'側最近鄰位是C或A。在一些實施例中,靶標A的3'側最近鄰位是G。在一些實施方案中,靶標A的3'側最近鄰位是C。
在根據本文所述的dRNA,構建體,文庫或組合物中的任一種的某些實施方案中,靶標RNA中的靶標A是選自下組的三堿基基序:UAG,UAC,UAA,UAU,CAG,CAC, CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。在某些實施方案中,所述三堿基基序是UAG,並且dRNA包含與三堿基基序中的U直接相對的A,與靶標A直接相對的C,和與三堿基基序中的G直接相對的C,G或U。在某些實施方案中,所述三堿基基序是靶標RNA中的UAG,並且所述dRNA包含與靶標RNA的UAG相對的ACC,ACG或ACU。
在一些實施方案中,dRNA包含與靶標RNA中的靶標A直接相對的胞苷錯配。在一些實施方案中,胞苷錯配靠近互補RNA序列的中心,諸如在距互補RNA序列的中心20、15、10、5、4、3、2或1個核苷酸內。在一些實施方案中,胞苷錯配距互補RNA序列的5'末端至少5個核苷酸。在一些實施方案中,胞苷錯配距互補RNA序列的3'末端至少20個核苷酸。
在根據本文所述的dRNA,構建體,文庫或組合物中的任一種的某些實施方案中,所述dRNA包含至少約40、45、50、55、60、65、70、75、80、90,100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250個核苷酸中的任一項。在某些實施方案中,所述dRNA的長度為40-260、45-250、50- 240、60-230、65-220、70-210、70-200、70-190、70-180、70-170 ,70-160、70-150、70- 140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-150或105-140個核苷酸中的任一項。
在一些實施方案中,所述dRNA長約60-200(例如約60-150,65-140,68-130,或70-120)個核苷酸。包含SEQ ID NO:25-44、142-205、341-342中任一項的核酸序列。
本申請的dRNA包含與靶標RNA雜交的互補RNA序列。所述互補RNA序列與靶標RNA完全互補或基本上互補,以允許互補RNA序列與靶標RNA雜交。在一些實施方案中,所述互補RNA序列具有100%的與靶標RNA的序列互補性。在一些實施方案中,所述互補RNA序列具有至少大約70%,80%,85%,90%,95%,96%,97%,98%或99%或更高的任一項的互補性(在至少約為靶標RNA中20、40、60、80、100、150、200或更多個核苷酸中的任何一項的連續伸長(stretch)內)。在一些實施方案中,通過互補RNA序列和靶標RNA之間的雜交形成的dsRNA具有一個或多個(例如,1、2、3、4、5、6、7、8、9、10或更多個)非Watson-Crick堿基對(即錯配)。
ADAR,例如,人類ADAR酶編輯具有不同特異性的雙鏈RNA(dsRNA)結構,這取決於許多因素。一個重要因素是構成dsRNA序列的兩條鏈的互補程度。所述dRNA和靶標RNA之間的完美互補性通常導致ADAR的催化結構域以非判別性方式使腺苷脫氨基。可以通過在dsRNA區域中引入錯配來修飾ADAR的特異性和效率。例如,優選推薦A-C錯配以增加待編輯的腺苷脫氨的特異性和效率。相反,在除了靶標A的其他A(腺苷)位置(即“非靶標A”),G-A錯配可以減少脫靶編輯。所述dRNA與其靶標RNA之間的dsRNA形成不一定需要完美的互補性,前提是dRNA和靶標RNA之間的雜交和dsRNA的生成具有實質的互補性。在一些實施方案中,其dRNA序列或單鏈RNA區域具有至少約70%,80%,85%,90%,95%,96%,97%,98%或99%序列中的任何一項的與靶標RNA的互補性(當理想比對時)。可以使用用於對准序列的任何合適的算法來確定理想比對,其非限制性的示例包括Smith-Waterman算法,Needleman-Wimsch算法,基於Burrows-Wheeler變換的算法(例如Burrows Wheeler Aligner)。
與靶標腺苷相鄰的核苷酸也影響脫氨基的特異性和效率。例如,在靶標RNA序列中待編輯的靶標腺苷的5'側最近鄰位具有優先度U>C≈A> G並且在靶標RNA序列中待編輯的靶標腺苷的3'側最近鄰位具有在腺苷脫氨基的特異性和效率方面的優先度:G> C>A≈U。在一些實施方案中,當在靶標RNA中靶標腺苷可以是選自下組的三堿基基序:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC, GAA和GAU時,所述腺苷脫氨基的特異性和效率高於其他的三堿基基因中的腺苷。在一些實施方案中,待編輯的靶標腺苷處於三堿基基序UAG,UAC,UAA,UAU,CAG,CAC,AAG,AAC或AAA中時,所述腺苷脫氨基的效率高於其他基序中的腺苷。對於相同的三堿基基序,dRNA的不同設計也可導致不同的脫氨基效率。以三堿基基序UAG為例,在一些實施方案中,當dRNA包含與待編輯的靶標腺苷直接相對的胞苷(C)時,所述腺苷(A)直接與尿苷相對,而胞苷(C),鳥苷(G)或尿苷(U)與鳥苷直接相對,靶標腺苷脫氨基的效率高於使用其他dRNA序列的脫氨基的效率。在一些實施方案中,當dRNA包含與靶標RNA的UAG相對的ACC,ACG或ACU時,所述靶標RNA的UAG中A的編輯效率可達到約25%-30%。
除了靶標腺苷外,靶標RNA中可能存在一種或多種不希望編輯的腺苷。對於這些腺苷,優選盡可能降低它們的編輯效率。本發明發現,鳥苷與靶標RNA中的腺苷直接相對處,脫氨基效率顯著降低。因此,為了減少脫靶脫氨基作用,可以將dRNA設計成包含一種或多種鳥苷,其直接與靶標RNA中除待編輯的靶標腺苷之外的一種或多種腺苷相對。
編輯靶標RNA序列的所需特異性水平和效率可取決於不同的應用。按照本專利申請中的說明,本領域技術人員將能夠根據其需要設計具有與靶標RNA序列互補或基本上互補的序列的dRNA,並且通過一些試驗和錯誤,獲得他們期望的結果。如本文所用,術語“錯配”是指雙鏈RNA(dsRNA)中相對的核苷酸,其根據Watson-Crick堿基配對規則不形成完美的堿基對。錯配堿基對包括:例如G-A,C-A,U-C,A-A,G-G,C-C,U-U堿基對。以A-C匹配為例,其中靶標A在靶標RNA中被編輯,dRNA被設計為包含與待編輯的A相對的C,在通過靶標RNA和dRNA之間的雜交形成的dsRNA中產生A-C錯配。
在一些實施方案中,通過dRNA和靶標RNA之間的雜交形成的dsRNA不包含錯配。在一些實施方案中,通過dRNA和靶標RNA之間的雜交形成的dsRNA包含一個或多個,例如1、2、3、4、5、6、7或更多個錯配中的任何一個(例如,不同類型錯配中相同類型的錯配)。在一些實施方案中,通過dRNA和靶標RNA之間的雜交形成的dsRNA包含一種或多種錯配,例如,選自G-A,C-A,U-C,A-A,G-G,C-C和U-U中的1、2、3、4、5、6、7種錯配。
通過dRNA和靶標RNA之間的雜交形成的dsRNA中的錯配核苷酸可以形成凸起,其可以提高靶標RNA的編輯效率。可能存在一個(僅在靶標腺苷處形成)或更多個由錯配形成的凸起。額外的誘發凸起的錯配可以在靶標腺苷的上遊和/或下遊。所述凸起可以是單錯配凸起(由一個錯配的堿基對引起)或多錯配的凸起(由多於一個連續的錯配堿基對引起,優選兩個或三個連續的錯配堿基對)。
dRNA中的互補RNA序列是單鏈的。所述dRNA可以是完全單鏈的或具有一個或多個(例如,1、2、3或更多個)雙鏈區和/或一個或多個莖環區。在一些實施方案中,互補RNA序列是至少約40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190、200或更多個核苷酸中的任何一項。在某些實施方案中,互補RNA序列的長度為40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70- 160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任一項。在一些實施方案中,dRNA長約60-200(例如約60-150、65-140、68-130或70-120)個核苷酸。在一些實施方案中,互補RNA序列為約71個核苷酸長。在一些實施方案中,互補RNA序列為約111個核苷酸長。
在一些實施方案中,除互補RNA序列外,dRNA還可包含用於穩定dRNA的區域,例如,一個或多個雙鏈區和/或莖環區。在一些實施方案中,dRNA的雙鏈區或莖環區可包含不超過約200、150、100、50、40、30、20、10個或更少個堿基對中的任一項。在一些實施方案中,dRNA不包含莖環或雙鏈區。在一些實施方案中,dRNA包含ADAR招募結構域。在一些實施方案中,dRNA不包含ADAR招募結構域。
所述dRNA可包含一個或多個修飾。在一些實施方案中,dRNA具有一個或多個經修飾的核苷酸,包括核堿基修飾和/或骨架修飾。在一些實施方案中,dRNA長約60-200個核苷酸,並包含一種或多種修飾(例如2'-O-甲基化和/或硫代磷酸酯化)。在一些實施方案中,經修飾的dRNA包含,從5'端至3'端:一個5'部分,一個與靶RNA中的靶標A正好相對的胞苷錯配,和一個3'部分,其中,3’部分不短於約7nt(例如不短於8nt,不短於9nt,以及不短於10nt)核苷酸。。在一些實施方案中,5'部分不短於約25個(例如不短於約30nt,不短於約35nt,不短於約40nt和不短於約45nt)核苷酸。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸)。在一些實施方案中,3'部分長約7nt-25nt核苷酸(例如長約。10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5'部分長約25nt-85nt核苷酸(例如長約25nt-80nt,25nt-75nt,25nt-70nt,25nt-65nt,25nt-60nt,30nt-55nt,40nt-55nt或45nt-55nt核苷酸),而3'部分長約7nt-25nt核苷酸(例如長約10nt-15nt或21nt-25nt核苷酸)。在一些實施方案中,5′部分比3′部分長。在一些實施方案中,5'部分長約55個核苷酸,並且3'部分長約15個核苷酸。在一些實施方案中,胞苷錯配在dRNA中的位置可以如本文實施例中描述的任何的dRNA中所述,並且dRNA可以為如Xnt-c-Ynt的格式,其中X代表5’部分的長度,Y代表3'部分的長度:55nt-c-35nt,55nt-c-25nt,55nt-c-24nt,55nt-c-23nt,55nt-c-22nt,55nt-c-21nt,55nt-c-20nt,55nt-c-19nt,55nt-c-18nt,55nt-c-17nt,55nt-c-16nt,55nt-c-15nt,55nt-c-14nt,55nt-c-13nt,55nt-c-12nt,55nt-c-11nt,55nt-c-10nt,55nt-c-9nt,55nt-c-8nt,55nt-c-7nt,55nt-n-20nt,50nt-n-20nt,45nt-n-20nt,55nt-n-15nt,50nt-n-15nt,45nt-c-45nt,45nt-c-55nt,54nt-c-12nt,53nt-c-13nt,52nt-c-14nt,51nt-c-15nt,50nt-c-16nt,49nt-c-17nt,48nt-c-18nt,47nt-c-19nt,46nt-c-20nt,45nt-c-21nt,44nt-c-22nt,43nt-c-23nt,54nt-c-15nt,53nt-c-16nt,52nt-c-17nt,51nt-c-18nt,50nt-c-19nt,49nt-c-20nt,48nt-c-21nt,47nt-c-22nt,46nt-c-23nt,54nt-c-17nt,53nt-n-18nt,52nt-n-19nt,51nt-n-20nt,50nt-n-21nt,49nt-n-22nt,和48nt-c-23。
在一些實施方案中,dRNA長約為60-200個核苷酸且包含一種或多種修飾(例如2’-O-甲基化和/或硫代磷酸酯化)。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2′-O-甲基化和/或在首尾各3個核苷酸間連接中包含硫代磷酸酯化。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2′-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,和在一個或多個尿苷中,例如在所有尿苷中,包含2′-O-甲基化。在一些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在單個或多個或所有尿苷中包含2'-O-甲基化,以及與靶標腺苷相對的核苷酸,和/或與靶標腺苷相對的核苷酸最鄰近的一個或兩個核苷酸中包含修飾。在某些實施方案中,與靶腺苷相對的核苷酸和/或與靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是2’-O-甲基化。在某些實施方案中,與靶腺苷相對的核苷酸和/或與靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是硫代磷酸酯連接,例如3′-硫代磷酸酯連接。在某些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在首尾各3個核苷酸間連接中包含硫代磷酸酯化,在所有尿苷中包含2'-O-甲基化,並且與靶腺苷相對的核苷酸的3'端或5'端緊鄰的核苷酸中包含2'-O-甲基化。在某些實施方案中,dRNA在首尾各3個核苷酸中包含2'-O-甲基化,在第首尾各3個核苷酸間連接中包含硫代磷酸酯化,在所有尿苷中包含2'-O-甲基化,並且在與靶腺苷相對核苷酸和/或其5'和/或3'最鄰近核苷酸中包含3'-硫代磷酸酯化。在一些實施方案中,dRNA在首尾各5個核苷酸中包含2’-O-甲基化,並且在首尾各5個核苷酸間連接中包含硫代磷酸酯化。本申請還考慮包含本文所述dRNA的構建體。如本文所用的術語“構建體”是指包含編碼核苷酸序列的DNA或RNA分子,所述編碼核苷酸序列可以轉錄成RNA或表達成蛋白質。在一些實施方案中,所述構建體含有一個或多個調控元件,其可操作地連接於編碼RNA或蛋白質的核苷酸序列。當所述構建體被引入宿主細胞時,在合適的條件下,所述構建體中的編碼核苷酸序列可以被轉錄或表達。
在一些實施方案中,所述構建體包含與編碼核苷酸序列可操作地連接或空間連接的啟動子,使得所述啟動子控制編碼核苷酸序列的轉錄或表達。所述啟動子可位於其控制下的編碼核苷酸序列的5'側(上遊)。所述啟動子和編碼序列之間的距離可以與該啟動子與其起源於啟動子的基因中它控制的基因之間的距離大致相同。如本領域所知,可以適應該距離的變化而不喪失啟動子功能。在一些實施方案中,所述構建體包含5'UTR和/或3'UTR,其調節編碼核苷酸序列的轉錄或表達。
在一些實施方案中,所述構建體是編碼本申請中公開的任何一種dRNA的載體。術語“載體”是指能夠轉運與其連接的另一種核酸的核酸分子。所述載體包括但不限於單鏈,雙鏈或部分雙鏈的核酸分子;包含一個或多個遊離末端的,沒有遊離末端的(例如環狀)核酸分子;包含DNA,RNA或兩者的核酸分子;以及本領域已知的其他多核苷酸種類。一種類型的載體是“質粒”,它是指環狀的雙鏈DNA環,其中可以插入額外的DNA區段,例如通過標准分子克隆技術。某些載體能夠在引入它們的宿主細胞中自主複制(例如,具有細菌複制起點的細菌載體和附加型哺乳動物載體)。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到宿主細胞的基因組中,由此與宿主基因組一起複制。此外,某些載體能夠指導它們可操作地連接的編碼核苷酸序列的轉錄或表達。此類載體在本文中稱為“表達載體”。
所述重組表達載體可以包含適合於在宿主細胞中轉錄或表達核酸的形式的本發明的核酸。在一些實施方案中,所述重組表達載體包括一種或多種調節元件,其可以基於待用於轉錄或表達的宿主細胞進行選擇,其與待轉錄或表達的核酸序列可操作地連接。在所述重組表達載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許核苷酸序列表達的方式與調節元件連接(例如在體外的或在宿主細胞中的轉錄/翻譯系統中,當載體被引入所述宿主細胞時)。
在一些實施方案中,提供了構建體(例如,載體,例如病毒載體),其包含編碼dRNA的核苷酸序列。在一些實施方案中,提供了構建體(例如,載體,諸如病毒載體),其包含編碼所述ADAR的核苷酸序列。在一些實施方案中,提供了構建體,其包含編碼所述dRNA的第一核苷酸序列和編碼所述ADAR的第二核苷酸序列。在一些實施方案中,第一核苷酸序列和第二核苷酸序列與相同的啟動子可操作地連接。在一些實施方案中,第一核苷酸序列和第二核苷酸序列與不同的啟動子可操作地連接。在一些實施方案中,所述啟動子是可誘導的。在一些實施方案中,所述構建體不編碼ADAR。在一些實施方案中,載體還包含編碼ADAR3的抑制劑(例如,ADAR3 shRNA或siRNA)和/或幹擾素的刺激劑(例如,IFN-α)的核酸序列。
[治療方法]
本文所述的RNA編輯方法和組合物可用於治療或預防個體的疾病或病症,包括但不限於:遺傳性的基因疾病以及耐藥性。
在一些實施方案中,提供了一種離體編輯個體(例如人類個體)細胞中的靶標RNA的方法,包括使用本文所述的任何一種RNA編輯方法編輯靶標RNA。
在一些實施方案中,提供了一種離體編輯個體(例如人類個體)細胞中的靶標RNA的方法,包括將dRNA或編碼該dRNA的構建體引入個體的細胞中,其中所述dRNA包含與靶標RNA雜交的互補RNA序列,並且其中所述dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基。在一些實施方案中,所述靶標RNA與個體的疾病或病症相關。在一些實施方案中,所述疾病或病症是遺傳性的基因疾病或與一種或多種獲得性基因突變(例如,抗藥性)相關的疾病或病症。在一些實施方案中,該方法還包含從個體獲得細胞。
在一些實施方案中,提供了治療或預防個體(例如,人類個體)中的疾病或病症的方法,包含使用本文描述的RNA編輯方法的任何一種編輯個體細胞中與疾病或病症相關的靶標RNA。
在一些實施方案中,提供了治療或預防個體(例如,人類個體)中的疾病或病症的方法,包括將dRNA或編碼該dRNA的構建體引入從個體離體的分離細胞中,其中所述dRNA包含與和疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中所述dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基。在一些實施方案中,所述ADAR是分離細胞中的內源表達的ADAR。在一些實施方案中,該方法包含將ADAR或編碼該ADAR的構建體引入分離的細胞。在一些實施方案中,該方法還包含培養具有經編輯的RNA的細胞。在一些實施方案中,該方法還包含向個體施用具有經編輯的RNA的細胞。在一些實施方案中,所述疾病或病症是遺傳性的基因疾病或與一種或多種獲得性基因突變(例如抗藥性)相關的疾病或病症。
在一些實施方案中,提供了治療或預防個體(例如,人類個體)中的疾病或病症的方法,包含將dRNA或編碼該dRNA的構建體引入從個體離體的分離細胞中,其中所述dRNA包含與和疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中所述dRNA能夠招募宿主細胞的內源表達的ADAR以使所述靶標RNA中的靶標A脫氨基。在一些實施方案中,該方法還包含培養具有經編輯的RNA的細胞。在一些實施方案中,該方法還包含向個體施用具有經編輯的RNA的細胞。在一些實施方案中,所述疾病或病症是遺傳性的基因疾病或與一種或多種獲得性基因突變(例如抗藥性)相關的疾病或病症。
在一些實施方案中,提供了治療或預防個體(例如,人類個體)中的疾病或病症的方法,包含向個體施用有效量的dRNA或編碼該dRNA的構建體,其中所述dRNA包含與和疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中所述dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基。在一些實施方案中,所述ADAR是個體細胞中的內源表達的ADAR。在一些實施方案中,該方法包含向個體施用ADAR或編碼該ADAR的構建體。在一些實施方案中,所述疾病或病症是遺傳性的基因疾病或與一種或多種獲得性基因突變(例如抗藥性)相關的疾病或病症。
適用於使用本申請的方法治療的疾病和病症包括與突變相關的疾病,諸如G至A突變,例如導致RNA轉錄物中的錯義突變,過早的終止密碼子,異常剪接或可變剪接的G至A突變。可以通過本申請的方法恢複的與疾病相關的突變的例子包括但不限於與癌症相關的TP53W53X (例如,158G>A),I型粘多糖貯積病(MPS I)與IDUAW402X (例如,外顯子9中的TGG>TAG突變),與埃勒斯-當洛斯綜合征相關的COL3A1W1278X (例如3833G>A突變),與原發性肺動脈高壓相關的BMPR2W298X (例如893G>A),與朱伯特綜合征相關的AHI1W725X (例如2174G>A),與範科尼貧血相關的FANCCW506X (例如1517G>A),與原發性家族性肥厚性心肌病相關的MYBPC3W1098X (例如3293G>A),和與X染色體連鎖性嚴重聯合免疫缺陷症相關的IL2RGW237X (例如710G>A)。在一些實施方案中,疾病或病症是癌症。在一些實施方案中,該疾病或病症是單基因疾病。在一些實施方案中,該疾病或病症是多基因疾病。
在一些實施方案中,提供了治療與個體中具有突變(例如,G>A突變)的靶標RNA相關的癌症的方法,其包括將dRNA或編碼dRNA的構建體引入從個體離體的分離細胞中,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是TP53W53X (例如158G>A)。在一些實施方案中,dRNA包含SEQ ID NO:195、196或197的核酸序列。
在一些實施方案中,提供了一種用個體中具有突變(例如,G> A突變)的靶標RNA治療或預防癌症的方法,其包括向個體施用有效量的dRNA或編碼該dRNA的構建體。其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR使靶標RNA中的靶標A脫氨基,從而拯救靶標RNA的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是TP53W53X (例如158G>A)。在一些實施方案中,dRNA包含SEQ ID NO:195、196或197的核酸序列。
在一些實施方案中,提供了一種治療與個體中具有突變(例如,G>A突變)的靶標RNA相關的MPS I(例如,Hurler綜合征或Scheie綜合征)的方法,包括dRNA或將編碼dRNA的構建體引入從個體離體的分離細胞中,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此而拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是IDUAW402X (例如,外顯子9中的TGG>TAG突變)。在一些實施方案中,dRNA包含SEQ ID NO:204或205的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防MPS I(例如,Hurler綜合征或Scheie綜合征)的方法,包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救了靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是IDUAW402X (例如,外顯子9中的TGG>TAG突變)。在一些實施方案中,dRNA包含SEQ ID NO:204或205的核酸序列。
在一些實施方案中,提供了一種治療個體中與具有突變(例如,G>A突變)的靶標RNA相關的埃勒斯-當洛斯綜合征疾病或狀況的方法,其包括dRNA或編碼dRNA的構建體引入從個體離體的分離細胞中,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是COL3A1W1278X (例如3833G>A突變)。在一些實施方案中,dRNA包含SEQ ID NO:198的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防埃勒斯-當洛斯綜合征的方法,其包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是COL3A1W1278X (例如3833G>A突變)。在一些實施方案中,dRNA包含SEQ ID NO:198的核酸序列。
在一些實施方案中,提供了一種治療與個體中具有突變(例如,G>A突變)的靶標RNA相關的原發性肺動脈高壓的方法,其包括將dRNA或編碼dRNA的構建體引入從離個體體的分離細胞,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,從而拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是BMPR2W298X (例如,893G>A)。在一些實施方案中,dRNA包含SEQ ID NO:199的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防原發性肺動脈高壓的方法,其包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是BMPR2W298X (例如,893G>A)。在一些實施方案中,dRNA包含SEQ ID NO:199的核酸序列。
在一些實施方案中,提供了治療與個體中具有突變(例如,G>A突變)的靶標RNA有關的朱伯特綜合征的方法,其包括將dRNA或編碼dRNA的構建體引入從個體離體的分離細胞,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是AHI1W725X (例如2174G>A)。在一些實施方案中,dRNA包含SEQ ID NO:200的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防朱伯特綜合征的方法,其包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是AHI1W725X (例如2174G>A)。在一些實施方案中,dRNA包含SEQ ID NO:200的核酸序列。
在一些實施方案中,提供了治療與個體中具有突變(例如,G>A突變)的靶標RNA相關的範科尼貧血的方法,其包括將dRNA或編碼dRNA的構建體引入從個體離體的分離細胞中,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是FANCCW506X (例如1517G>A)。在一些實施方案中,dRNA包含SEQ ID NO:201的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防範科尼貧血的方法,其包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是FANCCW506X (例如1517G>A)。在一些實施方案中,dRNA包含SEQ ID NO:201的核酸序列。
在一些實施方案中,提供了一種治療與個體中具有突變(例如,G>A突變)的靶標RNA相關的原發性家族性肥厚性心肌病的方法,其包括將dRNA或編碼dRNA的構建體引入從個體離體的分離細胞,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是MYBPC3W1098X (例如3293G>A)。在一些實施方案中,dRNA包含SEQ ID NO:202的核酸序列。
在一些實施方案中,提供了用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防原發性家族性肥厚性心肌病的方法,其包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是MYBPC3W1098X (例如3293G>A)。在一些實施方案中,dRNA包含SEQ ID NO:202的核酸序列。
在一些實施方案中,提供了一種治療與個體中具有突變(例如,G>A突變)的靶標RNA有關的X染色體連鎖性嚴重聯合免疫缺陷的方法,其包括dRNA或編碼dRNA的構建體引入從個體離體的分離細胞,其中dRNA包含與靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是分離的細胞中內源表達的ADAR。在一些實施方案中,該方法包括將ADAR或編碼ADAR的構建體引入分離的細胞。在一些實施方案中,靶標RNA是IL2RGW237X (例如710G>A)。在一些實施方案中,dRNA包含SEQ ID NO:203的核酸序列。
在一些實施方案中,提供了一種用個體中具有突變(例如,G>A突變)的靶標RNA治療或預防的X染色體連鎖性嚴重聯合免疫缺陷的方法,包括向個體施用有效量的dRNA或編碼dRNA的構建體,其中dRNA包含與與疾病或病症相關的靶標RNA雜交的互補RNA序列,並且其中dRNA能夠招募ADAR以使靶標RNA中的靶標A脫氨基,由此拯救靶標RNA中的突變。在一些實施方案中,ADAR是個體細胞中內源表達的ADAR。在一些實施方案中,該方法包括向個體施用ADAR或編碼ADAR的構建體。在一些實施方案中,靶標RNA是IL2RGW237X (例如710G>A)。在一些實施方案中,dRNA包含SEQ ID NO:203的核酸序列。
如本文所用,“治療(treatment)”或“治療(treating)”是用於獲得包括臨床結果的有益或期望結果的方法。出於本發明的目的,有益的或期望的臨床結果包括但不限於以下一種或多種:減少由疾病引起的另外一種症狀,減少疾病的程度,穩定化疾病(例如,預防或延遲疾病的惡化),預防或延遲疾病的傳播(例如,轉移),預防或延遲疾病的發生或複發,延緩或減緩疾病的進展,改善疾病症態,提供緩解(無論是部分的還是全部的)疾病,減少治療疾病所需的一種或多種其他藥物的劑量,延遲疾病的進展,提高生活質量和/或延長生存期。“治療”還包括減少疾病或病症的病理後果。本發明的方法考慮了這些治療方面中的任何一個或多個。
術語“個體”,“受試者”和“患者”在本文中可互換使用以描述哺乳動物,包括人類。所述個體包括但不限於:人類,牛,馬,貓,犬,齧齒類動物或靈長類動物。在一些實施方案中,所述個體是人。在一些實施方案中,所述個體患有疾病或病症,例如耐藥性。在一些實施方案中,所述個體需要治療。
如本領域所理解的,“有效量”是指足以產生所需治療結果的組合物(例如,dRNA或編碼該dRNA的構建體)的量(例如,降低疾病或病症的一種或多種症狀的嚴重性或持續時間,穩定疾病或病症的一種或多種症狀的嚴重程度,或消除疾病或病症的一種或多種症狀)。對於治療用途,有益的或期望的結果包括例如減少由疾病引起的一種或多種症狀(生物化學的,組織學的和/或行為學的),包括其在疾病發展期間呈現的並發症和中間病理表型,提高那些患有疾病或病症的人的生活質量,減少治療疾病所需的其他藥物的劑量,增強另一種藥物的效果,延遲疾病的進展和/或延長患者的存活。
通常,組合物的劑量,時間表和施用途徑(例如,dRNA或編碼該dRNA的構建體)可以根據個體的大小和狀況,並根據標准藥學實踐來確定。示例性施用途徑包括靜脈內,動脈內,腹膜內,肺內,囊內,肌肉內,氣管內,皮下,眼內,鞘內或透皮。
本申請的RNA編輯方法不僅可以用於動物細胞,例如哺乳動物細胞,還可以用於修飾植物或真菌的RNA,例如,在具有內源表達的ADAR的植物或真菌中。本文描述的方法可用於產生具有改善性質的基因工程植物和真菌。
[組合物,試劑盒和制品]
本文還提供了包含任何一種dRNA,構建體,文庫或具有如本文所述的經編輯的RNA的宿主細胞的組合物(例如藥物組合物)。
在一些實施方案中,提供了藥物組合物,其包含本文所述的dRNA或者編碼該dRNA的構建體的任一種,以及藥學上可接受的載體,賦形劑或穩定劑(Remington's Pharmaceutical Sciences,第16版, Osol, A. Ed. (1980)。可接受的載體,賦形劑或穩定劑在所用劑量和濃度下對接受者無毒,包括緩沖劑,諸如磷酸鹽,檸檬酸鹽和其他有機酸;抗氧化劑,包括抗壞血酸和甲硫氨酸;防腐劑(諸如十八烷基二甲基苄基氯化銨;六甲基氯化銨;苯紮氯銨,苄索氯銨;苯酚,丁基或苄醇;對羥基苯甲酸烷基酯,諸如對羥基苯甲酸甲酯或對羥基苯甲酸丙酯;兒茶酚;間苯二酚;環己醇;3-戊醇;和間甲酚);低分子量(少於約10個殘基)的多肽;蛋白質,如血清白蛋白,明膠或免疫球蛋白;親水性聚合物,諸如聚乙烯吡咯烷酮;氨基酸,諸如甘氨酸,穀氨醯胺,天冬醯胺,組氨酸,精氨酸或賴氨酸;單糖,二糖和其他碳水化合物,包括葡萄糖,甘露糖或糊精;螯合劑諸如EDTA;糖類,諸如蔗糖,甘露醇,海藻糖或山梨糖醇;成鹽的反離子諸如鈉;金屬絡合物(例如鋅蛋白複合物);和/或非離子表面活性劑,諸如TWEENTM ,PLURONICSTM 或聚乙二醇(PEG)。在一些實施方案中,提供了凍幹制劑。用於體內施用的藥物組合物必須是無菌的。這可以通過例如通過無菌過濾膜過濾而容易地實現。
進一步提供了可用於本文所述的RNA編輯方法或治療方法中的任一種的試劑盒,其包含如本文所述的任何一種dRNA,構建體,組合物,文庫或者經編輯的宿主細胞。
在一些實施方案中,提供了用於編輯宿主細胞中的靶標RNA的試劑盒,其包含dRNA,其中所述dRNA包含與靶標RNA雜交的互補RNA序列,其中所述dRNA能夠招募ADAR以使靶標RNA中的A脫氨基。在一些實施方案中,所述試劑盒還包含ADAR或編碼ADAR的構建體。在一些實施方案中,試劑盒進一步包含ADAR3的抑制劑或其構建體。在一些實施方案中,試劑盒進一步包含幹擾素的刺激物或其構建體。在一些實施方案中,所述試劑盒還包括用於實施本文所述的任何一種RNA編輯方法的說明書。
本申請的試劑盒處於合適的包裝中。合適的包裝包括但不限於:小瓶,瓶子,廣口瓶,軟包裝(例如,密封的聚酯薄膜或塑料袋)等。試劑盒可選地提供額外的組分,例如轉染或轉導試劑,細胞培養基,緩沖液和解釋性信息。
因此,本申請還提供了制品。所述制品可包括容器和容器上或與容器相關的標簽或包裝說明書。合適的容器包括小瓶(例如密封的小瓶),瓶子,罐子,軟包裝等。在一些實施方案中,所述容器容納藥物組合物,並且可以具有無菌進入口(例如,所述容器可以是靜脈內溶液袋或具有可由皮下注射針刺穿的塞子的小瓶)。容納藥物組合物的容器可以是多次使用的小瓶,其允許重組制劑的重複施用(例如2-6次施用)。包裝說明書是指通常包括在治療產品的商業包裝中的說明書,其包含關於使用這些產品的適應症,用法,劑量,施用,禁忌症和/或警告的信息。另外,所述制品還可包含第二容器,其包含藥學上可接受的緩沖液,例如抑菌性注射用水(BWFI),磷酸鹽緩沖鹽水,林格氏溶液和右旋糖溶液。它還可以包括從商業和用戶角度所需的其他材料,包括其他緩沖劑,稀釋劑,過濾器,針頭和注射器。
所述試劑盒或制品可包括多個單位劑量的藥物組合物和使用說明書,其以足以在藥房(例如,醫院藥房以及配藥藥房)中儲存和使用的量包裝。
示例性實施方案
在本文提供的實施方案中是:
一種用於在宿主細胞中編輯靶標RNA的方法,包括將脫氨酶招募RNA(dRNA)或編碼所述dRNA的構建體引入宿主細胞,其中所述dRNA包含與所述靶標RNA雜交的互補RNA序列,並且其中所述脫氨酶招募RNA能夠招募作用於RNA的腺苷脫氨酶(ADAR)以使所述靶標RNA中的靶標腺苷脫氨基。
如實施方案1所述的方法,其中所述RNA序列包含與所述靶標RNA中的所述靶腺苷直接相對的胞苷,腺苷或尿苷。
如實施方案2所述的方法,其中所述RNA序列包含與所述靶標RNA中的所述靶腺苷直接相對的胞苷錯配。
如實施方案3所述的方法,其中所述胞苷錯配位於所述dRNA中距所述互補序列的3'端至少20個核苷酸,並且距所述互補序列的5'端至少5個核苷酸。
如實施方案4所述的方法,其中所述胞苷錯配位於所述dRNA中所述互補序列中心(例如,在中心)的10個核苷酸內。
如實施方案1-5中任一項所述的方法,其中所述RNA序列進一步包含一個或多個鳥苷,其各自與所述靶標RNA中的非靶腺苷相對。
如實施方案1-6中任一項所述的方法,其中所述互補序列包含與所述靶標RNA中的非靶腺苷相對的兩個或更多個連續錯配核苷酸。
如實施方案1-7中任一項所述的方法,其中所述靶標RNA中所述靶標腺苷的5'側最近鄰位是選自U,C,A和G的核苷酸,優先度U>C≈A>G,而所述靶標RNA中所述靶標腺苷的3'側最近鄰位是選自G,C,A和U的核苷酸,優先度G>C>A≈U。
如實施方案1至8中任一項所述的方法,其中所述靶標RNA中的所述靶標腺苷位於選自:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU構成的組的三堿基基序中。
如實施方案9所述的方法,其中所述三堿基基序是UAG,並且其中所述脫氨酶招募RNA包含與所述三堿基基序中的尿苷直接相對的A,與所述靶腺苷直接相對的胞苷,以及與所述三堿基基序中的鳥苷直接相對胞苷,鳥苷或尿苷。
如實施方案1-10中任一項所述的方法,其中所述脫氨酶招募RNA的長度為約40-260個核苷酸。
如實施方案11所述的方法,其中所述脫氨酶招募RNA的長度為約60-230個核苷酸。
如實施方案11或12所述的方法,其中所述dRNA的長度大於約60個核苷酸。
如實施方案11-13中任一項所述的方法,其中所述dRNA的長度為約100至約150(例如,約110-150)個核苷酸。
如實施方案1-14中任一項所述的方法,其中所述靶標RNA是選自:由前信使RNA,信使RNA,核糖體RNA,轉移RNA,長非編碼RNA和小RNA構成的組的RNA。
如實施方案15所述的方法,其中所述靶標RNA是前信使RNA。
如實施方案1-16中任一項所述的方法,其中所述ADAR由所述宿主細胞內源表達。
如實施方案1-16中任一項所述的方法,其中所述ADAR對於所述宿主細胞是外源的。
如實施方案18所述的方法,其進一步包括將所述ADAR引入所述宿主細胞。
如實施方案18或19所述的方法,其中所述ADAR包含E1008突變。
如實施方案1-20中任一項所述的方法,其中所述脫氨酶招募RNA是單鏈RNA。
如實施方案1-20中任一項所述的方法,其中所述互補RNA序列是單鏈的,並且其中所述脫氨酶招募RNA還包含一個或多個雙鏈區。
如實施方案1-22中任一項所述的方法,其中所述dRNA不包含ADAR-招募結構域(例如,DSB結合結構域,GluR2結構域或MS2結構域)。
如實施方案1-23中任一項所述的方法,其中所述dRNA不包含化學修飾的核苷酸(例如,2’-O-甲基化或硫代磷酸酯化)。
如實施方案24所述的方法,其中所述靶標RNA中的靶標腺苷的脫氨基作用導致所述靶標RNA編碼的蛋白質的點突變、截短、延伸和/或錯誤折疊;或者憑借所述靶標RNA中的錯義突變、過早的終止密碼子、異常剪接或可變剪接的回複導致有功能的、全長的、正確折疊的和/或野生型的蛋白。
如實施方案1-25中任一項所述的方法,其中所述宿主細胞是真核細胞。
如實施方案26所述的方法,其中所述宿主細胞是哺乳動物細胞。
如實施方案27所述的方法,其中所述宿主細胞是人或小鼠細胞。
如實施方案27或28所述的方法,其中所述ADAR是ADAR1和/或ADAR2。
如實施方案1-29中任一項所述的方法,其中所述宿主細胞是原代細胞。
如實施方案30所述的方法,其中所述宿主細胞是T細胞。
如實施方案30所述的方法,其中所述宿主細胞是有絲分裂後細胞。
如實施方案1-32中任一項所述的方法,其進一步包括將ADAR3的抑制劑引入所述宿主細胞。
如實施方案1-33中任一項所述的方法,其進一步包括將幹擾素的刺激劑引入所述宿主細胞。
如實施方案1-34中任一項所述的方法,包括引入各自靶向不同靶標RNA的多個dRNA。
如實施方案1-35中任一項所述的方法,其中所述編輯靶標RNA的效率為至少約30%(例如,至少約為30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%或更高)。
如實施方案1-36中任一項所述的方法,其中所述dRNA不誘導免疫應答。
憑借如實施方案1-37中任一項所述的方法產生的經編輯的RNA或具有經編輯的RNA的宿主細胞。
一種用於治療或預防個體的疾病或病症的方法,其包括根據實施方案1-37中任一項的方法編輯與個體細胞中的疾病或病症相關的靶標RNA。
如實施方案39所述的方法,其中所述疾病或病症是遺傳性的基因疾病或與一種或多種獲得性基因突變相關的疾病或病症。
如實施方案39或40所述的方法,其中所述靶標RNA具有G至A突變。
如實施方案39-41中任一項所述的方法,其中所述疾病或病症是單基因疾病或病症。
如實施方案39-42中任一項所述的方法,其中所述疾病或病症是多基因疾病或病症。
如實施方案39-43中任一項所述的方法,其中: (i) 所述靶標RNA是TP53 ,並且所述疾病或病症是癌症; (ii) 所述靶標RNA是IDUA ,並且所述疾病或病症是I型粘多糖貯積病(MPS I); (iii) 所述靶標RNA是COL3A1 ,並且所述疾病或病症是埃勒斯-當洛斯綜合征; (iv) 所述靶標RNA是BMPR2 ,並且所述疾病或病症是朱伯特綜合征; (v) 所述靶標RNA是FANCC ,並且所述疾病或病症是範科尼貧血; (vi) 所述靶標RNA是MYBPC3 ,並且所述疾病或病症是原發性家族性肥厚性心肌病;或 (vii) 所述靶標RNA是IL2RG ,並且所述疾病或病症是X染色體連鎖性嚴重聯合免疫缺陷。
一種通過招募作用於RNA的腺苷脫氨酶(ADAR)使靶標RNA中的靶標腺苷脫氨基作用的脫氨酶招募RNA(dRNA),其包含與所述靶標RNA雜交的互補RNA序列。
如實施方案47所述的脫氨酶招募RNA,其中所述RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷,腺苷或U。
如實施方案48所述的dRNA,其中所述RNA序列包含與所述靶標RNA中的靶標腺苷直接相對的胞苷錯配。
如實施方案49所述的dRNA,其中所述胞苷錯配位於所述dRNA中距所述互補序列的3'端至少20個核苷酸,和距所述互補序列的5'端至少5個核苷酸。
如實施方案50所述的dRNA,其中所述胞苷錯配位於所述dRNA中互補序列中心(例如,在中心)的10個核苷酸內。
如實施方案47-51中任一項所述的脫氨酶招募RNA,其中所述RNA序列進一步包含一個或多個鳥苷,其各自與所述靶標RNA中的非靶標腺苷直接相對。
如實施方案47-51中任一項所述的dRNA,其中所述互補序列包含與所述靶標RNA中的非靶標腺苷相對的兩個或更多個連續錯配核苷酸。
如實施方式47-53中任一項所述的脫氨酶招募RNA,其中所述靶標RNA中的所述靶標腺苷位於選自:由UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU構成的組的三堿基基序中。
如實施方案54所述的脫氨酶招募RNA,其中所述三堿基基序是UAG,並且其中所述dRNA包含與所述三堿基基序中的尿苷直接相對的腺苷,與所述靶腺苷直接相對的胞嘧啶,以及與所述三堿基基序中的鳥苷直接相對的胞苷、鳥苷或尿苷。
如實施方案55所述的脫氨酶招募RNA,其中所述三堿基基序是所述靶標RNA中的UAG,並且其中所述脫氨酶招募RNA包括與所述靶標RNA的UAG相對的ACC,ACG或ACU。
如實施方案47-56中任一項所述的脫氨酶招募RNA,其中脫氨酶招募RNA的長度為約40-260個核苷酸。
如實施方案57所述的dRNA,其中所述dRNA的長度為約70個核苷酸。
如實施方案57或58所述的dRNA,其中所述dRNA的長度為約100至約150個核苷酸(例如,約110-150個)。
如實施方案47-59中任一項所述的dRNA,其中所述dRNA不包含ADAR招募結構域(例如,DSB結合結構域,GluR2結構域或MS2結構域)。
如實施方案47-60中任一項所述的dRNA,其中所述dRNA不包含化學修飾的核苷酸(例如,2'-O-甲基化或硫代磷酸酯化)。
一種編碼實施方案47-61中任一項所述的脫氨酶招募RNA的構建體。
如實施方案62所述的構建體,其中所述構建體是病毒載體(例如,慢病毒載體)或質粒。
一種文庫,其包含實施方案47-61中任一項所述的多個脫氨酶招募RNA或實施方案62或63所述的構建體。
一種組合物,其包含實施方案47-61中任一項所述的脫氨酶招募RNA,實施方案62或63所述的構建體,或實施方案64所述的文庫。
一種宿主細胞,其包含實施方案47-61中任一項所述的脫氨酶招募RNA或實施方案62或63所述的構建體。
如實施方案66所述的宿主細胞,其中所述宿主細胞是真核細胞。
如實施方案66或67所述的宿主細胞,其中所述宿主細胞是原代細胞。
一種用於在宿主細胞中編輯靶標RNA的試劑盒,其包含脫氨酶招募RNA,其中所述脫氨酶招募RNA包含與所述靶標RNA雜交的互補RNA序列,其中所述脫氨酶招募RNA能夠招募ADAR以使所述靶標RNA中的靶標腺苷脫氨基。
60-200個核苷酸的脫氨酶招募RNA(dRNA),其中: 1)所述dRNA包含能夠與靶標RNA雜交的互補RNA序列; 2)所述dRNA能夠招募脫氨酶或包含脫氨酶的構建體或包含脫氨酶催化結構域的構建體以使所述靶標RNA中的靶標腺苷脫氨。 3)所述dRNA包含一種或多種化學修飾。
如實施方案68所述的dRNA,其中所述dRNA長於約60nt,65nt,70nt,80nt,90nt,100nt或110nt中的任何一個。
如實施方案1或實施方案69所述的dRNA,其包含與互補靶標RNA區域的一個或多個錯配,擺動配對(Wobble)和/或單側突起(Bulge)。
如實施方案68-70中任一項所述的dRNA,其中所述互補RNA序列包含與靶標RNA中的靶標腺苷直接相對的胞苷,腺苷或尿苷。
如實施方案71所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷位於距3'端至少約7個核苷酸,例如距3'端至少約8、9、10或更多個核苷酸,或距3'端約7-25nt。
如實施方案71-72中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷位於距5'端至少約25個核苷酸,例如距5'端至少約30、35、40、45、50或55個核苷酸,或距5'端約45-55nt。
如實施方案71-73中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷側翼的5'和3'序列的長度不相等。
如實施方案71-74中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷側翼的5'序列的長度長於3'序列。
如實施方案68-75中任一項所述的dRNA,其包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷。
如實施方案68-76中任一項所述的dRNA,其中所述互補RNA序列包含一個或多個鳥苷,各自與所述靶標RNA中的非靶標腺苷相對。
如實施方案68-77中任一項所述的dRNA,其中所述互補序列包含與所述靶標RNA中的非靶標腺苷相對的兩個或更多個連續錯配的核苷酸。
如實施方案68-78中任一項所述的dRNA,其中靶標RNA中的所述靶標腺苷的5'最近鄰是選自U,C,A和G的核苷酸,優選U>C≈A>G,且所述靶標RNA中的所述靶標腺苷的3'最近鄰是選自G,C,A和U的核苷酸,優選G>C>A≈U。
如實施方案68-79中任一項所述的dRNA,其中所述靶標腺苷位於靶標RNA中的一個三堿基基序,所述三堿基基序選自下組:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。
如實施方案80所述的dRNA,其中所述三堿基基序是UAG,並且其中所述dRNA包含與所述三堿基基序中的尿苷直接相對的A,與所述靶標腺苷直接相對的胞苷,以及與所述三堿基基序中的鳥苷直接相對的胞苷、鳥苷或尿苷。
如實施方案81所述的dRNA,其包含與UAG的三堿基基序直接相對的5'-CCA-3'。
如實施方案68-82中任一項所述的dRNA,其中所述化學修飾是甲基化和/或硫代磷酸酯化,例如2'-O-甲基化和/或核苷酸間硫代磷酸酯連接。
如實施方案83所述的dRNA,其中所述化學修飾包括在首尾各1-5、2-5、3-5或4-5個核苷酸的2'-O-甲基化和/或在首尾各1-5、2-5、3-5或4-5個核苷酸間連接的硫代磷酸酯化。
如實施方案83或實施方案84所述的dRNA,其中所述化學修飾包括在與所述靶標腺苷相對的核苷酸和/或其5'和/或3'最鄰近的核苷酸的2'-O-甲基化和/或3'-硫代磷酸酯化。
如實施方案1-85中任一項所述的dRNA,所述化學修飾選自下組: 1)首尾各3個核苷酸的2'-O-甲基化和/或首尾各3個核苷酸間連接的硫代磷酸酯化; 2)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,單個或多個尿苷(例如,所有尿苷)的2'-O-甲基化; 3)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,單個或多個或所有尿苷的2'-O-甲基化,以及與所述靶標腺苷相對的所述核苷酸和/或其5'和/或3'最鄰近的核苷酸的修飾; 4)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,所有尿苷的2'-O-甲基化,和與所述靶標腺苷相對的所述核苷酸的3'端和/或5'端最鄰近的核苷酸的2'-O-甲基化; 5)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,所有尿苷的2'-O-甲基化,以及與所述靶標腺苷相對的所述核苷酸和/或其5'和/或3'最鄰近的核苷酸的3'硫代磷酸酯化;和 6)首尾各5個核苷酸的2'-O-甲基化和首尾各5個核苷酸間連接的硫代磷酸酯化。
如實施方案86所述的dRNA,其中與所述靶標腺苷相對的所述核苷酸和/或與所述靶標腺苷相對的所述核苷酸最鄰近的一個或兩個核苷酸的修飾是2'-O-甲基化或硫代磷酸酯化連接,例如3'-硫代磷酸酯化連接。
如實施方案68-87中任一項所述的dRNA,其不包含能夠形成用於結合ADAR酶的分子內莖環結構的ADAR招募結構域。
一種構建體,其包含或編碼如68-88中任一項所述的dRNA。
一種用於在宿主細胞中編輯靶標RNA的方法,其包括將如實施方案68-89中任一項所述的dRNA通過感染,電轉染,脂質轉染,胞吞作用,脂質體或脂質納米顆粒遞送等引入宿主細胞,所述宿主細胞包括但不限於真核細胞,原代細胞,T細胞,哺乳動物細胞,人類細胞,鼠細胞等。
如實施方案90所述的方法,其進一步包括將ADAR3的抑制劑引入所述宿主細胞。
如實施方案90或實施方案91所述的方法,其進一步包括將幹擾素的刺激物引入所述宿主細胞。
如實施方案90-92中任一項所述的方法,其包括引入各自靶向不同靶標RNA的多個dRNA。
如實施方案90-93中任一項所述的的方法,其中所述dRNA不誘導免疫應答。
如實施方案90-94中任一項所述的的方法,其還包括將外源ADAR引入所述宿主細胞。
如實施方案95所述的方法,其中所述ADAR是包含E1008突變的ADAR1。
包含如實施方案68-89中任一項所述dRNA的組合物,細胞,文庫或試劑盒。
實施例
下面的實施例僅是本申請的示例,因此不應以任何方式被認為限制本發明。通過示例而非限制的方式提供以下實施例和詳細描述。
材料和方法
[質粒構建]
通過PCR擴增mCherry和EGFP(EGFP第一密碼子ATG缺失)編碼DNA來克隆雙熒光報道分子,在PCR期間通過引物添加3×GS接頭和打靶的DNA序列。然後通過II型限制酶BsmB1(Thermo)和T4 DNA連接酶(NEB)切割和連接PCR產物,然後將其插入pLenti骨架中(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)。
從Lbu質粒(Addgene#83485)PCR擴增dLbuCas13 DNA。ADAR1DD和ADAR2DD從ADAR1(p150)cDNA和ADAR2 cDNA中擴增,這兩種cDNA都來自廈門大學的漢氏實驗室。通過重疊PCR將ADAR1DD或ADAR2DD與dLbuCas13 DNA融合,並將融合的PCR產物插入pLenti骨架中。
為了在哺乳動物細胞中表達dRNA,直接合成dRNA序列(針對短dRNA)並通過合成重疊的ssDNA進行退火或PCR擴增,並通過Golden-gate克隆將產物克隆到U6表達下的相應載體中。
從ADAR1(p150)cDNA中PCR擴增全長ADAR1(p110)和ADAR1(p150),並從ADAR2 cDNA中PCR擴增全長ADAR2,然後將其克隆到pLenti骨架中。
對於三種版本的雙熒光報道分子(報道分子-1,-2和-3),mCherryEGFP (EGFP的起始密碼子ATG被刪除)編碼序列進行PCR擴增,使用BsmBI(Thermo Fisher Scientific,ER0452)消化,然後用T4 DNA連接酶(NEB,M0202L)介導的與GGGGS接頭的連接。隨後將連接產物插入pLenti-CMV-MCS-PURO主鏈。
對於表達dLbuCas13-ADARDD (E1008Q)的構建體,從ADAR1p150 構建體(來自廈門大學韓家淮實驗室的贈予)擴增了ADAR1DD 基因。通過PCR從Lbu_C2c2_R472A_H477A_R1048A_H1053A質粒(Addgene#83485)擴增了dLbuCas13基因。通過重疊PCR生成ADAR1DD (高活性E1008Q變體),然後融合至dLbuCas13。將連接產物插入pLenti-CMV-MCS-BSD主鏈。
對於表達arRNA的構建體,合成arRNA的序列並將金門(golden-gate)克隆到pLenti-sgRNA-lib 2.0(Addgene#89638)主鏈中,並且由hU6啟動子驅動arRNA的轉錄。對於表達ADAR的構建體,從ADAR1p150 構建體中擴增出全長ADAR1p110 和ADAR1p150 ,並從ADAR2構建體中擴增出全長ADAR2(廈門大學韓家淮實驗室的贈予)。然後將擴增的產物克隆到pLenti-CMV-MCS-BSD主鏈中。
對於表達具有致病性突變的基因的構建體,TP53的全長編碼序列(從Vigenebio訂購)和其他6種與疾病相關的基因(COL3A1BMPR2AHI1FANCCMYBPC3IL2RG ,來自中國醫學科學院病原生物學研究所的王建偉實驗室的贈予)通過誘變PCR從編碼具有引入G>A突變的相應基因的構建體中擴增出。通過Gibson克隆方法59 將擴增產物克隆到pLenti-CMV-MCS-mCherry主鏈中。
[哺乳動物細胞系和細胞培養]
哺乳動物細胞系培養達爾伯克改良伊格爾培養基(Dulbecco's Modified Eagle Medium,10-013-CV,Corning,Tewksbury,MA,USA),加入10%胎牛血清(蘭州百靈生物技術有限公司,蘭州,中國),在37℃、5%CO2 下補充以1%青黴素-鏈黴素。所述ADAR1-KO細胞系購自EdiGene China,基因分型結果也由EdiGene China提供。
HeLa和B16細胞系來自Z. Jiang的實驗室(北京大學)。HEK293T細胞系來自C. Zhang的實驗室(北京大學)。RD細胞系來自J Wang的實驗室(北京協和醫學院和中國醫學科學院,病原生物學研究所)。SF268細胞系來自中國醫學科學院,基礎醫學研究所,細胞中心。A549和SW13細胞系來自EdiGene Inc. HepG2,HT29,NIH3T3和MEF細胞系在我們北京大學的實驗室中維護。將這些哺乳動物細胞系在含10%胎牛血清(CellMax,SA201.02)的達爾伯克改良伊格爾培養基(Corning,10-013-CV)中培養,並在37°C於5%CO2 下補充1%青黴素-鏈黴素。除非另有說明,否則按照制造商的說明用X-tremeGENE HP DNA轉染試劑(Roche,06366546001)轉染細胞。
人原發性肺成纖維細胞(#3300)和人原發性支氣管上皮細胞(#3210)購自ScienCell Research Laboratories,Inc.,並在成纖維細胞培養基(ScienCell,#2301)和支氣管上皮細胞培養基(ScienCell, #3211)中培養。兩種培養基均補充有15%的胎牛血清(BI)和1%的青黴素-鏈黴素。原代細胞GM06214(Hurler綜合征患者來源的成纖維細胞;IDUA基因外顯子9的1293核苷酸處TGG>TAG[Trp402Ter(W402X)]突變的純合子)和GM01323(Scheie綜合征患者來源的成纖維細胞;擁有相較於WT細胞0.3%的IDUA活性,症狀比Hurler綜合征輕很多;複合雜合子:內含子5中,即外顯子6的-7位具有G>A轉換(IVS5AS-7G>A),及在IDUA基因外顯子9的1293位核苷酸的TGG>TAG [Trp402Ter(W402X)]。在本發明的實施例中作為陽性對照。)GM06214和GM01323原代細胞是從卡瑞爾醫學研究所(Coriell Institute for Medical Research)訂購的,並在含15%胎牛血清(BI)和1%青黴素-鏈黴素的達爾伯克改良伊格爾培養基(Corning,10-013-CV)中培養。將所有細胞在37°C在5%CO2 下培養。
[報道系統的轉染,FACS分析和Sanger測序]
對於雙熒光報道編輯實驗,將293T-WT細胞或293T-ADAR1- KO細胞接種在6孔板(6×105 個細胞/孔)中,24小時後,接種1.5μg報道質粒和1.5μgdRNA質粒。根據供應商的方案,使用X-tremeGENE HP DNA轉染試劑(06366546001; Roche,Mannheim,德國)共轉染。48至72小時後,收集細胞並進行FACS分析。為了進一步確認報道分子mRNA編輯,我們使用FACS Aria流式細胞儀(BD Biosciences)分選來自用報道分子和dRNA質粒轉染的293T-WT細胞的EGFP陽性細胞,然後進行總RNA分離(TIANGEN,DP430)。然後通過RT-PCR(TIANGEN,KR103-04)將RNA逆轉錄成cDNA,並用相應的引物對(23個PCR循環)PCR擴增靶標基因座,並純化PCR產物用於Sanger測序。
對於ADAR1(p110),ADAR1(p150)或ADAR2的回複和過表達實驗,將293T-WT細胞或293T-ADAR1-KO細胞接種於12孔板(2.5×105 個細胞/孔)中,24小時後,使用X-tremeGENE HP DNA轉染試劑(06366546001,Roche,Mannheim,德國)共轉染0.5μg的報道質粒,0.5μg的dRNA質粒和0.5μg的ADAR1/2質粒(pLenti骨架作為對照)。48至72小時後,收集細胞並進行FACS分析。
對於內源mRNA實驗,將293T-WT細胞接種在6孔板(6×105 個細胞/孔)中,當約70%匯合時,使用X-tremeGENE HP DNA轉染試劑(06366546001,羅氏,曼海姆,德國)轉染3μg的dRNA質粒。72小時後,通過FACS收集細胞和分選的GFP陽性或BFP陽性細胞(根據相應的熒光標記物)用於以下的RNA分離。
[人原代T細胞的分離與培養]
從健康人供體的白細胞分離產物中分離出原代人T細胞。簡而言之,通過Ficoll離心(Dakewei,AS1114546)分離外周血單個核細胞(PBMC),並使用EasySep人T細胞分離試劑盒(STEMCELL,17951)從PBMC通過磁陰性選擇分離T細胞。分離後,將T細胞在X-vivo15培養基,10%FBS和IL2(1000 U/ml)中培養,並用CD3/CD28 DynaBeads(ThermoFisher,11131D)刺激2天。健康捐獻者的白細胞分離術產品購自AllCells LLC中國。所有健康的捐助者均提供了知情同意。
[Lenti病毒包裝物和報道分子細胞系構建]
通過X-tremeGENE HP DNA轉染試劑將表達質粒與兩種病毒包裝質粒pR8.74和pVSVG(Addgene)一起共轉染到HEK293T-WT細胞中。72小時後,收集上清液病毒並儲存在-80℃。用慢病毒感染HEK293T-WT細胞,72小時後,通過FACS分選mCherry陽性細胞並培養以通過有限稀釋方法選擇出穩定表達具有低EGFP背景的雙熒光報道系統的單克隆細胞系。
對於穩定的報道分子細胞系,將報道分子構建體(pLenti-CMV-MCS-PURO骨架)與兩個病毒包裝質粒pR8.74和pVSVG一起共轉染到HEK293T細胞中。72小時後,收集上清病毒並保存在-80℃。用慢病毒感染HEK293T細胞,然後通過FACS分選mCherry陽性細胞並培養來選擇穩定表達無可檢測EGFP背景的雙熒光報道系統的單克隆細胞系。HEK293TADAR1 –/–TP53 –/– 細胞系是根據以前報道的方法60 生成的。將靶向ADAR1的sgRNA和含有CMV驅動的嘌呤黴素抗性基因的PCR擴增供體DNA共轉染到HEK293T細胞中。然後在轉染後7天用嘌呤黴素處理細胞。從嘌呤黴素抗性細胞中分離出單個克隆,然後通過測序和蛋白質印跡進行驗證。
[內源或外源表達轉錄物的RNA編輯]
為了評估在雙熒光報道分子上的RNA編輯,將HEK293T細胞或HEK293TADAR1-/- 細胞接種在6孔板中(6×105 個細胞/孔)。24小時後,將細胞用1.5μg報道分子質粒和1.5μgarRNA質粒共轉染。為了檢查ADAR1p110 ,ADAR1p150 或ADAR2蛋白表達的影響,通過EGFP陽性比率和深度測序來測定編輯效率。
將HEK293TADAR1-/- 細胞接種在12孔板中(2.5×105 個細胞/孔)。24小時後,將細胞與0.5μg報道分子質粒,0.5μgarRNA質粒和0.5μgADAR1/2質粒(pLenti骨架作為對照)共轉染。通過EGFP陽性比率和深度測序測定編輯效率。
為了評估內源mRNA轉錄物上的RNA編輯,將HEK293T細胞接種在6孔板中(6×105 個細胞/孔)。二十四小時後,將細胞用3μgarRNA質粒轉染。通過深度測序分析編輯效率。
為了評估多個細胞系中的RNA編輯效率,將8-9×104(RD,SF268,HeLa)或1.5×105 (HEK293T)個細胞接種在12孔板中。對於難以轉染的細胞,例如HT29,A549,HepG2,SW13,NIH3T3,MEF和B16,將2-2.5×105 個細胞接種在6孔板中。24小時後,將報道分子和arRNA質粒共轉染到這些細胞中。通過EGFP陽性比率測定編輯效率。
為了評估EGFP陽性比率,在轉染後48至72小時,通過熒光激活細胞分選(FACS)分析分選並收集細胞。mCherry信號用作報道分子/表達arRNA的細胞的熒光選擇標記,計算EGFP+ /mCherry+ 細胞的百分比作為編輯效率的讀數。
為了NGS定量A至I編輯率,在轉染後48至72小時,通過FACS測定法分選和收集細胞,然後進行RNA分離(TIANGEN,DP420)。然後,通過RT-PCR(TIANGEN,KR103-04)將總RNA反轉錄為cDNA,並使用如表1中列出的相應引物PCR擴增目標基因座。
表1
引物的名稱 序列 (5'--->3')
mCherry-SpeI-F tataactagtatggtgagcaagggcgaggag (SEQ ID NO: 206)
mCherry-BsmBI-R1 tatacgtctcatctacagattcttccggcgtgtataccttc (SEQ ID NO: 207)
EGFP-BsmBI-F1 (報道分子-1) tatacgtctcatagagatccccggtcgccaccgtgagcaagggcgaggagctg (SEQ ID NO: 208)
EGFP-AscI-R tataggcgcgccttacttgtacagctcgtccatgcc (SEQ ID NO: 209)
mCherry-BsmBI-R2 tatacgtctcaaggcgctgcctcctccgccgctgcctcctccgccgctgcctcctccgccctgcagctt gtacagctcgtccatgccgccggtg (SEQ ID NO: 210)
EGFP-BsmBI-F2 (報道分子-2) tatacgtctcagcctgctcgcgatgctagagggctctgccagtgagcaagggcgaggagctg (SEQ ID NO: 211)
LbuCas13-SpeI-F tataactagtatggtggattacaaggatgacgacgataagatgaaagtgacgaaggtaggaggcatttcg (SEQ ID NO: 212)
LbuCas13-AscI-R atatggcgcgccgttttcagactttttctcttccattttgtattcaaacataatcttcac (SEQ ID NO: 213)
hADAR1DD -AscI-F tataggcgcgccaggcggaggaggcagcggcggaggaggcagcctcctcctctcaaggtccccagaagc (SEQ ID NO: 214)
hADAR1DD -SbfI-R tatacctgcaggctacaccttgcgttttttcttgggtactgggcagagataaaagttcttttcc (SEQ ID NO: 215)
Deep-seq-F (報道分子-1) cactccaccggcggcatggacgag (SEQ ID NO: 216)
Deep-seq-R (報道分子-1) cacgctgaacttgtggccgtttacgtcg (SEQ ID NO: 217)
ADAR1-p150-SpeI-F tataactagtatgaatccgcggcaggggtattccctcagc (SEQ ID NO: 218)
ADAR1-p150-AscI-R tataggcgcgccctacttatcgtcgtcatccttgtaatctactgggcagagataaaagttcttttcctcctgg (SEQ ID NO: 219)
ADAR2-SpeI-F tataactagtatggatatagaagatgaagaaaacatgagttc (SEQ ID NO: 220)
ADAR2-AscI-R tataggcgcgccctacttatcgtcgtcatccttgtaatcgggcgtgagtgagaactggtcctgctcg (SEQ ID NO: 221)
ADAR1-p110-SpeI-F tataactagtatggccgagatcaaggagaaaatctgc (SEQ ID NO: 222)
ADAR1-p110-AscI-R tataggcgcgccctacttatcgtcgtcatccttgtaatctactgggcagagataaaagttcttttcctcctgg (SEQ ID NO: 223)
KRAS-deep-seq-F cgccatttcggactgggag (SEQ ID NO: 224)
KRAS-deep-seq-R agagacaggtttctccatcaattac (SEQ ID NO: 225)
PPIB-deep-seq-F gagcccgcgagcaacc (SEQ ID NO: 226)
PPIB-deep-seq-R gcagcaggaagaagacggac (SEQ ID NO: 227)
FANCC-deep-seq-F1 (TAC位點) agaagcagttgaagaccagactc (SEQ ID NO: 228)
FANCC-deep-seq-R (TAC位點) ggccttcacctggaccatag (SEQ ID NO: 229)
FANCC-deep-seq-F2 (TAC位點) agagaagcagttgaagaccaga (SEQ ID NO: 230)
FANCC-deep-seq-R2 (TAC位點) cggccttcacctggaccata (SEQ ID NO: 231)
FANCC-deep-seq-F3 (TAC位點) cagagaagcagttgaagaccaga (SEQ ID NO: 232)
FANCC-deep-seq-R3 (TAC位點) cggccttcacctggaccata (SEQ ID NO: 233)
SMAD4-deep-seq-F1 tttgtgaaaggctggggacc (SEQ ID NO: 234)
SMAD4-deep-seq-R1 acaggattgtattttgtagtccacc (SEQ ID NO: 235)
SMAD4-deep-seq-F2 aggatgagttttgtgaaaggctg (SEQ ID NO: 236)
SMAD4-deep-seq-R2 attttgtagtccaccatcctgata (SEQ ID NO: 237)
SMAD4-deep-seq-F3 gatgagttttgtgaaaggctgg (SEQ ID NO: 238)
SMAD4-deep-seq-R3 attttgtagtccaccatcctgataa (SEQ ID NO: 239)
TRAPPC12-deep-seq-F cgaagagaacgagaccgcat (SEQ ID NO: 240)
TRAPPC12-deep-seq-R gaagatggtgcacaccggg (SEQ ID NO: 241)
TARDBP-deep-seq-F gacagatgcttcatcagcagtg (SEQ ID NO: 242)
TARDBP-deep-seq-R cgaacaaagccaaaccccttt (SEQ ID NO: 243)
COL3A1-deep-seq-F tctgttaatggacaaatagaaagcc (SEQ ID NO: 244)
COL3A1-deep-seq-R ggaacattcaaaggattggcact (SEQ ID NO: 245)
BMPR2-deep-seq-F agtcactgcagatggacgca (SEQ ID NO: 246)
BMPR2-deep-seq-R atctcgatgggaaattgcaggt (SEQ ID NO: 247)
AHI1-deep-seq-F tcagagttttacctcatccttcttt (SEQ ID NO: 248)
AHI1-deep-seq-R cctgaatacatatgatgaccttcag (SEQ ID NO: 249)
FANCC-deep-seq-F (位點2) agggcacagacacagacctc (SEQ ID NO: 250)
FANCC-deep-seq-R (位點2) agggctttcaatgccaagacg (SEQ ID NO: 251)
MYBPC3-deep-seq-F tgacaagccaagtcctccc (SEQ ID NO: 252)
MYBPC3-deep-seq-R attgccaatgatgagctctgg (SEQ ID NO: 253)
IL2RG-deep-seq-F ttatagacataagttctccttgcct (SEQ ID NO: 254)
IL2RG-deep-seq-R tcaatcccatggagccaaca (SEQ ID NO: 255)
1-deep-seq-F (報道分子-3) tacacgacgctcttccgatcttaagtagaggccgccactccaccggcggc (SEQ ID NO: 256)
2-deep-seq-F (報道分子-3) tacacgacgctcttccgatctatcatgcttagccgccactccaccggcggc (SEQ ID NO: 257)
3-deep-seq-F (報道分子-3) tacacgacgctcttccgatctgatgcacatctgccgccactccaccggcggc (SEQ ID NO: 258)
4-deep-seq-F (報道分子-3) tacacgacgctcttccgatctcgattgctcgacgccgccactccaccggcggc (SEQ ID NO: 259)
5-deep-seq-F (報道分子-3) tacacgacgctcttccgatcttcgatagcaattcgccgccactccaccggcggc (SEQ ID NO: 260)
6-deep-seq-F (報道分子-3) tacacgacgctcttccgatctatcgatagttgcttgccgccactccaccggcggc (SEQ ID NO: 261)
7-deep-seq-F (報道分子-3) tacacgacgctcttccgatctgatcgatccagttaggccgccactccaccggcggc (SEQ ID NO: 262)
8-deep-seq-F (報道分子-3) tacacgacgctcttccgatctcgatcgatttgagcctgccgccactccaccggcggc (SEQ ID NO: 263)
9-deep-seq-F (報道分子-3) tacacgacgctcttccgatctacgatcgatacacgatcgccgccactccaccggcggc (SEQ ID NO: 264)
10-deep-seq-F (報道分子-3) tacacgacgctcttccgatcttacgatcgatggtccagagccgccactccaccggcggc (SEQ ID NO: 265)
1-deep-seq-R (報道分子-3) agacgtgtgctcttccgatcttaagtagagtcgccgtccagctcgaccag (SEQ ID NO: 266)
2-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctatcatgcttatcgccgtccagctcgaccag (SEQ ID NO: 267)
3-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctgatgcacatcttcgccgtccagctcgaccag (SEQ ID NO: 268)
4-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctcgattgctcgactcgccgtccagctcgaccag (SEQ ID NO: 269)
5-deep-seq-R (報道分子-3) agacgtgtgctcttccgatcttcgatagcaattctcgccgtccagctcgaccag (SEQ ID NO: 270)
6-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctatcgatagttgctttcgccgtccagctcgaccag (SEQ ID NO: 271)
7-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctgatcgatccagttagtcgccgtccagctcgaccag (SEQ ID NO: 272)
8-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctcgatcgatttgagccttcgccgtccagctcgaccag (SEQ ID NO: 273)
9-deep-seq-R (報道分子-3) agacgtgtgctcttccgatctacgatcgatacacgatctcgccgtccagctcgaccag (SEQ ID NO: 274)
10-deep-seq-R (報道分子-3) agacgtgtgctcttccgatcttacgatcgatggtccagatcgccgtccagctcgaccag (SEQ ID NO: 275)
ST3GAL1-deep-seq-F ggggaactcgggcaacct (SEQ ID NO: 276)
ST3GAL1-deep-seq-R gaatcggatctgccccgtg (SEQ ID NO: 277)
EHD2-deep-seq-F catcgaggccaagctggaa (SEQ ID NO: 278)
EHD2-deep-seq-R gtagtgaggagggagacccc (SEQ ID NO: 279)
OSTM1-AS1-deep-seq-F aagcctccttccttccccaa (SEQ ID NO: 280)
OSTM1-AS1-deep-seq-R atcgatacactccctagccca (SEQ ID NO: 281)
IL6-qPCR-F1 acaaattcggtacatcctcgac (SEQ ID NO: 282)
IL6-qPCR-R1 ttcagccatctttggaaggtt (SEQ ID NO: 283)
INF-β-qPCR-F1 acgccgcattgaccatctat (SEQ ID NO: 284)
INF-β-qPCR-R1 tagccaggaggttctcaaca (SEQ ID NO: 285)
GAPDH-F1 ggcatggactgtggtcatgag (SEQ ID NO: 286)
GAPDH-R1 tgcaccaccaactgcttagc (SEQ ID NO: 287)
報道分子-1-qPCR-F ccccgtaatgcagaagaagacc (SEQ ID NO: 288)
報道分子-1-qPCR-R gtccttcagcttcagcctctg (SEQ ID NO: 289)
PPIB-qPCR-F aacgcaacatgaaggtgctc (SEQ ID NO: 290)
PPIB-qPCR-R accttgacggtgactttggg (SEQ ID NO: 291)
KRAS-qPCR-F cagtgcaatgagggaccagt (SEQ ID NO: 292)
KRAS-qPCR-R aggaccataggtacatcttcagag (SEQ ID NO: 293)
SMAD4-qPCR-F cgaacgagttgtatcacctgga (SEQ ID NO: 294)
SMAD4-qPCR-R cgatggctgtccctcaaagt (SEQ ID NO: 295)
FANCC-qPCR-F agttgctcttttcactcaaggtc (SEQ ID NO: 296)
FANCC-qPCR-R ttctctctgagttcagacgct (SEQ ID NO: 297)
PPIB-deep-seq-F (AAG位點) tacacgacgctcttccgatcttaagtagagtggcacaggaggaaagagcatc (SEQ ID NO: 298)
PPIB-deep-seq-R (AAG位點) agacgtgtgctcttccgatcttaagtagaggcaccacctccatgccctc (SEQ ID NO: 299)
PPIB-deep-seq-F (CAG位點) tacacgacgctcttccgatcttaagtagagcatcgcagactgcggcaag (SEQ ID NO: 300)
PPIB-deep-seq-R (CAG位點) agacgtgtgctcttccgatcttaagtagagagtccatgggcctgtggaatgt (SEQ ID NO: 301)
FANCC-deep-seq-F2 (AAG/CAG位點) gaaaaactggcccgagagc (SEQ ID NO: 302)
FANCC-deep-seq-R2 (AAG/CAG位點) ctgagtctgggctgagggac (SEQ ID NO: 303)
IDUA-deep-seq-F cgcttccaggtcaacaacac (SEQ ID NO: 304)
IDUA-deep-seq-R ctcgcgtagatcagcaccg (SEQ ID NO: 305)
p53-deep-seq-F cccctctgagtcaggaaacat (SEQ ID NO: 306)
p53-deep-seq-R gaagatgacaggggccagg (SEQ ID NO: 307)
IFN-β-qPCR-F  tagcactggctggaatgag (SEQ ID NO: 308)
IFN-β-qPCR-R  gtttcggaggtaacctgtaag (SEQ ID NO: 309)
ISG56-qPCR-F  tacagcaaccatgagtacaa (SEQ ID NO: 310)
ISG56-qPCR-R  tcaggtgtttcacataggc (SEQ ID NO: 311)
ISG54-qPCR-F  ctgcaaccatgagtgagaa (SEQ ID NO: 312)
ISG54-qPCR-R  cctttgaggtgctttagatag (SEQ ID NO: 313)
IL-6-qPCR-F  gccctgagaaaggagacat (SEQ ID NO: 314)
IL-6-qPCR-R  ctgttctggaggtactctaggtat (SEQ ID NO: 315)
IL-8-qPCR-F  tttgaagagggctgagaa (SEQ ID NO: 316)
IL-8-qPCR-R  tgttctggatatttcatgg (SEQ ID NO: 317)
RANTES-qPCR-F  catctgcctccccatattcc (SEQ ID NO: 318)
RANTES-qPCR-R  tccatcctagctcatctccaaa (SEQ ID NO: 319)
IL-12-qPCR-F  tgctccagaaggccagac (SEQ ID NO: 320)
IL-12-qPCR-R  ttcataaatactactaaggcacagg (SEQ ID NO: 321)
IL-1β-qPCR-F acagatgaagtgctccttcca (SEQ ID NO: 322)
IL-1β-qPCR-R gtcggagattcgtagctggat (SEQ ID NO: 323)
MCP1-qPCR-F cattgtggccaaggagatctg (SEQ ID NO: 324)
MCP1-qPCR-R cttcggagtttgggtttgctt (SEQ ID NO: 325)
MIP1A-qPCR-F catcacttgctgctgacacg (SEQ ID NO: 326)
MIP1A-qPCR-R tgtggaatctgccgggag (SEQ ID NO: 327)
IP10-qPCR-F ctgactctaagtggcatt (SEQ ID NO: 328)
IP10-qPCR-R tgatggccttcgattctg (SEQ ID NO: 329)
GAPDH-qPCR-F2 cggagtcaacggatttggtcgta (SEQ ID NO: 330)
GAPDH-qPCR-R2 agccttctccatggtggtgaagac (SEQ ID NO: 331)
將PCR產物純化用於Sanger測序或NGS(Illumina HiSeq X Ten)。
[深度測序]
對於內源mRNA編輯實驗,將293T-WT細胞接種在6孔板上(6×105 個細胞/孔),當約70%匯合時,使用X-tremeGENE HP DNA轉染試劑(Roche)以3μg的dRNA轉染HEK293細胞。72小時後,通過FACS分選GFP陽性或BFP陽性細胞(根據相應的熒光標記),然後進行RNA分離。然後通過RT-PCR將分離的RNA逆轉錄成cDNA,並用相應的引物對擴增特異性靶標基因座(23個PCR循環),並在Illumina NextSeq上測序。
[在多個細胞系中進行測試]
除了HEK293T(陽性對照)和HEK293T ADAR1- / - (陰性對照)細胞,選擇一種小鼠細胞系(NIH3T3)以及源自不同組織和器官的七種人細胞系(RD,HeLa,SF268,A549,HepG2,HT-29,SW13)進行實驗。對於具有較高轉染效率的細胞系,將約8-9×104 個細胞(RD,HeLa,SF268)或1.5×105 個(HEK293T)接種到12孔板的每個孔上,至於難以轉染的那些(A549,HepG2, HT-29,SW13,NIH3T3),把2-2.5×105 個細胞接種於6孔板中。並且將所有這些細胞維持在37℃在達爾伯克改良伊格爾培養基(DMEM,Corning)中,該培養基補充有10%胎牛血清(FBS,CellMax)和5%CO2 。24小時後,用X-tremeGENE HP DNA轉染試劑(Roche)將CG2報道基因和71nt dRNA(35-C-35)質粒共轉染到不同類型的細胞中。轉染後48小時,用胰蛋白酶處理細胞並通過FACS(BD)分析。因為具有低轉染效率的細胞具有相當少的mCherry和BFP陽性細胞,對於那些鋪在6孔板上的細胞,我們將用於FACS分析的總細胞數增加至1×105 個。
[針對靶標位點的RNA編輯分析]
對於深度測序分析,使用arRNA覆蓋序列的靶標位點序列(上遊和下遊20-nt)產生索引。使用BWA版本0.7.10-r789對讀段進行比對和定量。然後通過Samtools對比對BAM進行分選,並使用REDitools 1.0.4版分析RNA編輯位點。參數如下:-U [AG或TC] -t 8 -n 0.0 -T 6-6 -e -d -u。通過費舍爾精確檢驗(Fisher’s exact test)(p值<0.05)計算出的arRNA靶向區域內所有顯著的A>G轉化(p值<0.05)都被arRNA視為編輯。除靶標腺苷外的轉化均為脫靶編輯。同時出現在對照組和實驗組中的突變被認為是SNP。
[轉錄組範圍的RNA測序分析]
將具有BFP表達盒的表達對照RNA151 或arRNA151 -PPIB的質粒轉染到HEK293T細胞中。轉染後48小時,通過FACS富集BFP+ 細胞,並用RNAprep Pure Micro試劑盒(TIANGEN,DP420)純化RNA。然後使用NEBNext聚(A)mRNA磁性分離模塊(New England Biolabs,E7490)純化mRNA,並用用於Illumina的NEBNext Ultra II RNA文庫制備試劑盒(New England Biolabs,E7770)處理,然後使用Illumina HiSeq X Ten平臺(2×150-bp配對末端;每個樣品30G)進行深度測序分析。為了排除轉染引起的非特異性作用,我們加入了模擬組,其中僅用轉染試劑處理細胞。每個組包含四個副本。
生物信息學分析管道由Vogel等人22 引用。使用FastQC進行分析的質量控制,質量修整基於Cutadapt(每個讀段的前6-bp被修整,最高20-bp被質量修整)。使用AWK腳本過濾掉引入的arRNA。修剪後,將長度小於90-nt的讀段過濾掉。隨後,通過STAR軟件61 將過濾的讀段映射到參考基因組(GRCh38-hg38)。我們使用GATK Haplotypcaller62 來調用變體。GATK生成的原始VCF文件已通過GATK VariantFiltration,bcftools和ANNOVAR63 進行了過濾和注釋。在dbSNP,1000 Genome64 的變體中,過濾出EVS。然後選擇每組四個重複的共享變體作為RNA編輯位點。將模擬組的RNA編輯水平視為背景,通過減去模擬組的變體獲得對照RNA151 和arRNA151 -PPIB的整體靶標。
為了評估LEAPER是否幹擾自然的編輯穩態,我們分析了由模擬組和arRNA151 -PPIB組(或對照RNA151 組)共享的全局編輯位點。使用Pearson相關系數分析評估了天生A-至-I編輯位點的差異RNA編輯率。計算了模擬組和arRNA151 -PPIB組(或對照RNA151 組)之間編輯率的皮爾森相關性,並在圖6中進行了注釋。
Figure 02_image001
X意指模擬組中每個位點的編輯率;Y意指對照RNA151 組(圖6A)或arRNA151 -PPIB組(圖6B)中每個位點的編輯率;σ x 是X的標准偏差;σ Y 是Y的標准偏差;μ x X 的平均值;μ Y Y 的平均值;E是期望值。
分析RNA-Seq數據以詢問由RNA編輯事件誘導的可能的轉錄變化。使用HISAT2和STRINGTIE軟件進行了轉錄組範圍的基因表達的分析65 。我們使用Cutadapt和FastQC進行測序數據的質量控制。然後使用HISAT2將測序讀段映射到參考基因組(GRCh38-hg38),然後如上所述進行Pearson相關系數分析。
[蛋白質印跡]
我們分別使用了針對ADAR1(Santa Cruz,sc-271854),ADAR2(Santa Cruz,sc-390995),ADAR3(Santa Cruz,sc-73410),p53(Santa Cruz,sc-99),KRAS(Sigma,SAB1404011); GAPDH(Santa Cruz,sc-47724)和β-微管蛋白(CWBiotech,CW0098)的小鼠單克隆一抗。HRP偶聯的山羊抗小鼠IgG(H+L,115-035-003)二抗購自Jackson ImmunoResearch。分選2×106 個細胞進行裂解,並上樣等量的每種裂解物進行SDS-PAGE。然後,將樣品蛋白質轉移到PVDF膜(Bio-Rad實驗室)上,並用針對一種ADAR酶(抗ADAR1,1:500;抗ADAR2,1:100;抗ADAR3,1:800)的一抗進行免疫印跡),然後進行二抗溫育(1:10,000)和暴露。用剝離緩沖液(CWBiotech,CW0056)剝離ADAR蛋白後,將β-微管蛋白重新探測到同一PVDF膜上。重複實驗三遍。使用Image Lab軟件進行半定量分析。
[細胞因子表達測定]
將HEK293T細胞接種在12孔板(2×105 個細胞/孔)上。當約70%匯合時,將細胞用1.5μg的arRNA轉染。作為陽性對照,轉染了1μg的聚(I:C)(Invitrogen,tlrl-picw)。48小時後,收集細胞並進行RNA分離(TIANGEN,DP430)。然後,通過RT-PCR(TIANGEN,KR103-04)將總RNA逆轉錄成cDNA,並通過定量PCR(TAKARA,RR820A)測量IFN-β和IL-6的表達。引物的序列在上表中列出。
[p53的轉錄調控活性測定]
將表達TP53W53X cDNA的質粒和表達arRNA的質粒與p53-螢火蟲-熒光素酶順式報道質粒(YRGene,VXS0446)和海腎-熒光素酶質粒(來自北京大學Z. Jiang實驗室的贈予)一起共轉染到HEK293TTP53-/- 細胞中用於檢測p53的轉錄調控活性。48小時後,收獲細胞並根據制造商的方案用Promega Dual-Glo熒光素酶測定系統(Promega,E4030)測定。簡而言之,將150μLDual-Glo熒光素酶試劑添加到收獲的細胞離心沉澱中,並在30分鐘後,通過Infinite M200讀取器(TECAN)將100μLDual-Glo熒光素酶試劑(細胞裂解)添加到96孔白板中,測量螢火蟲的發光。30分鐘後,依次向每個孔中添加100μLDual-Glo終止劑和Glo試劑,以測量海腎發光,並計算螢火蟲發光與海腎發光的比。
[原代細胞中的電穿孔]
對於在人原代肺成纖維細胞或人原代支氣管上皮細胞中表達arRNA的質粒進行電穿孔,將20μg質粒用NucleofectorTM 2b裝置(Lonza)和Basic NucleofectorTM 試劑盒(Lonza,VPI-1002)電穿孔,並且電穿孔程序是U-023。對於在人原代T細胞中表達arRNA的質粒電穿孔,將20μg質粒通過NucleofectorTM 2b Device(Lonza)和Human T細胞NucleofectorTM Kit(Lonza,VPA-1002)電穿孔到人原代T中,電穿孔程序是T-024。電穿孔後48小時,通過FACS測定分選和收集細胞,然後進行以下深度測序以用於靶向RNA編輯測定。電穿孔效率根據熒光標記進行歸一化。
為了在人原代T細胞或原代GM06214細胞中進行化學合成arRNA或對照RNA電穿孔,將RNA寡核苷酸於終濃度為2μM的100μLopti-MEM培養基(Gbico,31985070)中。然後用上述電穿孔混合物重懸1×10E6 GM06214細胞或3×10E6 T細胞,並用Agile Pulse In Vivo裝置(BTX)在450 V電穿孔1 ms。然後將細胞轉移到溫暖的培養基中用於以下測定。
[α-L-異丁烯酸酶(IDUA)催化活性測定]
將收獲的細胞離心沉澱重懸並在冰上用在1×PBS緩沖液中的28μL0.5%Triton X-100溶解30分鐘。然後將25μL細胞裂解液加入25μL190μM4-甲基傘形酮-α-L-艾杜糖醛酸酶底物(Cayman,2A-19543-500)中,將其溶解在0.4 M含0.2%Triton X-100的甲酸鈉緩沖液中,pH 3.5,並在黑暗中在37°C溫育90分鐘。加入200μL 0.5M NaOH/甘氨酸緩沖液,pH 10.3,淬滅催化反應,然後在4°C下離心2分鐘。將上清液轉移至96孔板,並使用Infinite M200讀取器(TECAN)在365 nm激發波長和450 nm發射波長下測量熒光。
實施例 1. 測試基於報道分子的本發明的 RNA 編輯方法
據報道,Cas13家族蛋白(C2c2)可以編輯哺乳動物細胞中的RNA。我們在多種條件下進一步測試了該系統。首先,我們通過在mCherry和EGFP基因之間引入含有終止密碼子的3×GS接頭打靶序列,構建了基於mCherry和EGFP熒光的雙熒光報道系統。此外,我們刪除了EGFP的起始密碼子ATG,以減少EGFP翻譯的遺漏。
雙熒光報道分子-1包含mCherry序列(SEQ ID NO:1),該序列包含3×GS接頭和靶標A(SEQ ID NO:2)的序列,以及eGFP序列(SEQ ID NO:3)。 atggtgagcaagggcgaggaggataacatggccatcatcaaggagttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggccgcccctacgagggcacccagaccgccaagctgaaggtgaccaagggtggccccctgcccttcgcctgggacatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagcaccccgccgacatccccgactacttgaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcgagttcatctacaaggtgaagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaagaagaccatgggctgggaggcctcctccgagcggatgtaccccgaggacggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacggcggccactacgacgctgaggtcaagaccacctacaaggccaagaagcccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatcacctcccacaacgaggactacaccatcgtggaacagtacgaacgcgccgagggccgccactccaccggcggcatggacgagctgtacaag (mCherry的序列) (SEQ ID NO:1) ctgcag ggcggaggaggcagcggcggaggaggcagcggcggaggaggcagc agaaggtatacacgccggaagaatctgta gagatccccggtcgccacc(序列包含3×GS接頭 (以斜體且加粗的字符示出) 以及靶標 A (以加大且加粗的A示出) (SEQ ID NO:2) gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaa ( eGFP的序列) (SEQ ID NO:3)
雙熒光報道分子-2包含mCherry序列(SEQ ID NO:1),序列包含3×GS接頭(顯示為斜體且加粗的字符)和靶標A(顯示為加大且加粗的A)(SEQ ID NO:4),以及eGFP的序列(SEQ ID NO:3)。 ctgcag ggcggaggaggcagcggcggaggaggcagcggcggaggaggcagc gcctgctcgcgatgcta gagggctctgcca(序列包含3×GS接頭(顯示為斜體且加粗的字符)和靶標A(顯示為加大且加粗的字符)(SEQ ID NO:4)
雙熒光報道分子-3包含mCherry序列(SEQ ID NO:1),包含1×GS接頭(顯示為斜體且加粗的字符)和靶標A(SEQ ID NO:5)的序列,以及eGFP的序列(SEQ ID NO:3)。 ctgcag ggcggaggaggcagc gcctgctcgcgatgcta gagggctctgcca(序列包含1×GS接頭(顯示為斜體且加粗的字符)和靶標A(顯示為加大且加粗的A)(SEQ ID NO:5)
我們將mCherry-3×GS接頭-TAG-EGFP克隆到pLenti骨架中,並將報道質粒裝入慢病毒中,感染293T細胞,構建表達雙熒光報道基因的穩定細胞系。然後,我們選擇具有低EGFP熒光背景的單個克隆作為報道系統。我們將LbucC2c2 crRNA向導平鋪了28到78個核苷酸長的間隔區橫跨打靶腺苷,以測試最佳的crRNA設計。我們發現更長的crRNA向導賦予更高的EGFP陽性效率。引人注目的是,當我們轉染打靶的crRNA質粒而不共轉染任何表達dC2c2-ADARDD的質粒時,EGFP蛋白基本上被表達。例如,帶有下述序列的crRNA向導:ggaccaccccaaaaaugaauauaaccaaaacugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO:6)被賦予了超過25%的EGFP陽性效率。這表明終止密碼子UAG中的腺嘌呤在很大程度上被編輯。相反,隨機crRNA不能使EGFP陰性細胞呈陽性(圖6A,6B和6C)。基於這些結果,我們推斷:單個RNA轉錄物的過表達就可以利用內源ADAR酶來編輯RNA。
此外,我們刪除了RNA向導分子上的支架RNA序列,創造了直線的向導RNA。我們發現:70核苷酸長的、與帶有AC錯配的打靶標RNA互補的RNA(aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc(SEQ ID NO:7)可以有效地使EGFP陰性細胞轉化為EGFP陽性細胞,而70-nt的隨機RNA(ugaacagcuccucgcccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugccuccuccgcc(SEQ ID NO:8)不能(圖1A,1B,1C和1D)。因此,我們將該RNA指定為dRNA(脫氨酶招募RNA)。為了驗證細胞內源性ADAR可被招募以通過dRNA進行腺嘌呤脫氨基作用,我們在ADAR1 p110和ADAR1 p150雙敲除293T細胞系中進行了實驗(圖6E和6F)。因為ADAR1普遍表達,而ADAR2主要在腦中高水平表達。因此我們提出:通過dRNA打靶腺嘌呤脫氨基作用主要由ADAR1而不是ADAR2介導。正如預期的那樣,打靶的dRNA不能在293T-ADAR1- / - 細胞中觸發EGFP表達,但是過表達外源ADAR1 p110,p150或ADAR2可以回複293T-ADAR1 - / - 細胞中的EGFP表達(圖1E和1F),這提示:在293T細胞中,dRNA可以招募ADAR1或ADAR2來介導靶標RNA上的腺嘌呤脫氨基作用。此外,我們發現:ADAR1-p110和ADAR2具有比ADAR1-p150更高的編輯活性(圖1G和圖6G),這可能是由於ADAR1-p110和ADAR1-p150的不同細胞定位。
為了確定EGFP的熒光恢複是由打靶的RNA編輯事件引起的,我們通過RT-PCR直接測量dRNA介導的報道分子2轉錄物的編輯,然後進行靶向的Sanger測序和二代測序。測序結果顯示:靶標腺嘌呤(A-C錯配位點)中的A至G堿基轉化,並且,編輯率可達到13%(圖6H和圖1H)。此外,我們還在靶標腺嘌呤附近的序列窗口期間觀察到略微的A到G編輯,這很可能是由於雙鏈RNA區域增加,之後,我們將嘗試用幾種策略去除非預期的編輯。
實施例 2. 優化設計 dRNA 的因素
接下來,我們開始優化dRNA以實現更高的編輯效率。首先,我們的目的是確定在靶標腺嘌呤相對位置哪個堿基更有利於編輯。以前的研究表明,靶標腺苷的相對的堿基會有效地影響編輯。因此,我們在與靶標A相對的中間位置設計了具有錯配N(A,U,C和G)的71nt dRNA。基於FACS結果,我們發現,四種不同的dRNA有效編輯如下:C> A> U > G(圖2A和2B)。最近,據報道,靶標UAG位置中的小泡可能有利於編輯效率。因此,我們設計了含有兩個或三個錯配堿基的靶標UAG位點的dRNA來檢驗我們的假設。使用Golden Gate克隆方法,在具有BFP標記的dRNA載體上設計和構建了16種不同的71nt dRNA。我們發現,具有CCA和GCA序列的dRNA具有最高的效率,這意味著,小泡對A-I編輯幾乎沒有貢獻,至少在UAG靶標位點的情況下。此外,NCA序列的四個dRNA具有較高百分比的GFP陽性細胞,推論出,互補的U-A堿基對可能對ADAR編輯很重要(圖2C和2D)。隨後,我們基於報道分子測試不同長度的dRNA的效率。dRNA設計為中間位置的錯配C,長度範圍為31 nt至221 nt。我們發現,編輯效率隨著dRNA的增加而增加。報道系統的編輯高峰位於171nt dRNA。51nt dRNA可以以良好的效率(18%)激活報道系統(圖2E和2F)。最後,我們檢查了dRNA錯配C的位置是否影響編輯效率。dRNA保持相同的71nt長度,設計了與轉錄起始位置不同的錯配C。基於FACS結果,我們發現,其相對應的錯配C的位置可能影響編輯效率,並且,位於dRNA的5'側或3'側的錯配C具有較低的效率(圖2G和2H)。
通過Gibson克隆構建出16種不同的包含靶標序列的報道分子,其含有所有可能的3種堿基基序,然後克隆到pLenti骨架(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)中。所述靶標序列如下所示。
含有所有可能的3堿基基序的靶標序列:
TAT: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 9)
TAA: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 10)
TAC: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 11)
TAG: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgctagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 12)
AAT: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 13)
AAA: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 14)
AAC: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 15)
AAG: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcaagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 16)
CAT: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 17)
CAA: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 18)
CAC: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 19)
CAG: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgccagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 20)
GAT: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgatagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 21)
GAA: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgaaagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 22)
GAC: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgacagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 23)
GAG: atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctcgcgatgcgagagggctctgccagtgagcaagggcgaggagctgttcaccggggtggtgcccatc (SEQ ID NO: 24)
dRNA保持相同的111bp長度,並且,在中心處朝向靶標A設計了錯配C。
在12孔細胞培養群集中,將2×105 個細胞HEK293T鋪板到每個孔中,並進行每個實驗三次重複。24小時後,使用X-tremeGENE HP DNA轉染試劑(Roche)將0.5μg的dRNA質粒和0.5μg的報道分子靶標質粒共轉染至細胞。48小時後,用胰蛋白酶處理細胞並通過FACS(BD)選擇出mCherry 陽性細胞。收獲總共4×105 個細胞,並使用RNAprep純細胞/細菌試劑盒(TIANGEN DP430)提取總RNA。使用Quantscript RT試劑盒(TIANGEN KR103-04)從2μg的總RNA合成cDNA。並通過PCR擴增111個靶標區域並進行深度測序。
我們發現,所有16種不同的3堿基基序都可以通過本申請的示例性RNA編輯方法進行編輯,盡管效率可變。總之,結果表明,要編輯的A的5'側最近鄰位具有優先度U>C≈A> G並且要編輯的A的3'側最近鄰位具有優先度G> C>A≈U。數據以圖3A中的條形圖或者圖3B中的熱圖表示。
實施例 3. 編輯從內源基因轉錄的 RNA
接下來,我們測試了dRNA是否可以介導從內源基因轉錄的mRNA。我們設計了打靶四種基因KRAS,PPIB,β-肌動蛋白和GAPDH的dRNA。對於KRAS mRNA,我們設計了91、111、131、151、171和191個核苷酸長度的dRNA(圖4A),其序列如下所示。
91-nt KRAS-dRNA uagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgc (SEQ ID NO: 25)
111-nt KRAS-dRNA gauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagc (SEQ ID NO: 26)
131-nt KRAS-dRNA uccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacuaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccu (SEQ ID NO: 27)
151-nt KRAS-dRNA aucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgc (SEQ ID NO: 28)
171-nt KRAS-dRNA cuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuuc (SEQ ID NO: 29)
191-nt KRAS-dRNA uaggaauccucuauuguuggaucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaaccaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgccgccgccuucagugccugcg (SEQ ID NO: 30)
二代測序結果顯示:dRNA可編輯靶標KRAS mRNA,編輯效率高達11.7%(圖4B)。對於內源性PPIB mRNA,靶標的三個位點:位點1,位點2和位點3。我們為每個位點設計了151個核苷酸長度的dRNA(圖4C),其序列如下所示。
151-nt PPIB-dRNA (位點 1) gaggcgcagcauccacaggcggaggcgaaagcagcccggacagcugaggccggaagaggguggggccgcgguggccagggagccggcgccgccacgcgcgggugggggggacugggguugcucgcgggcuccgggcgggcggcgggcgccg (SEQ ID NO: 31)
151-nt PPIB-dRNA (位點 2) uccuguagcuaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggcccacaucuucaucuccaauucguaggucaaaauacaccuugacggugacuuugggccccuucuucuucucaucggcc (SEQ ID NO: 32)
151-nt PPIB-dRNA (位點 3) gcccuggaucaugaaguccuugauuacacgauggaauuugcuguuuuuguagccaaauccuuucucuccuguagccaaggccacaaaauuauccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccggccuacaucuuca (SEQ ID NO: 33)
二代測序的結果顯示:dRNA可以以高達14%的編輯效率有效地編輯PPIB mRNA位點1(圖4D)。對於PPIB mRNA位點2和位點3,編輯效率為1.5%和0.6%(圖4E和4F)。對於內源性β-肌動蛋白mRNA,我們為每個位點選擇了兩個靶標位點和經設計的dRNA(圖4G),其序列如下所示。
72-nt β-肌動蛋白-dRNA (位點 1) gcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcggug (SEQ ID NO: 34)
131-nt β-肌動蛋白-dRNA (位點 1) gccaugccaaucucaucuuguuuucugcgcaaguuagguuuugucaagaaaggguguaacgcaaccaagucauaguccgccuagaagcauuugcgguggacgauggaggggccggacucgucauacuccug (SEQ ID NO: 35)
70-nt β-肌動蛋白-dRNA (位點 2) ggacuuccuguaacaacgcaucucauauuuggaaugaccauuaaaaaaacaacaaugugcaaucaaaguc (SEQ ID NO: 36)
我們發現,dRNA可以編輯位點1和位點2的β-肌動蛋白mRNA,每個位點的編輯效率高達1.4%(圖4H和圖8A)。我們還觀察到更長的dRNA被賦予更高的編輯效率,dRNA-71nt為0.6%,dRNA-131nt為1.4%(圖3H)。對於另一個管家基因GAPDH,我們使用71nt dRNA(CAAGGUGCGGCUCCGGCCCCUCCCCUCUUCAAGGGGUCCACAUGGCAACUGUGAGGAGGGGAGAUUCAGUG(SEQ ID NO:37)),編輯效率為0.3%,可能是由於dRNA的長度短(圖8B)。
實施例 4. 對示例性 LEAPER 方法的脫靶分析
對於治療應用,編輯的精確度是關鍵的。接下來,我們試圖表征本申請的示例性RNA編輯系統的特異性。我們選擇內源性PPIB位點1和KRAS位點進行分析。對於PPIB位點1,我們可以看到,在dRNA覆蓋區域之間,在靶標A76的側翼存在幾個A堿基,例如A22,A30,A33,A34,A39,A49,A80,A91,A107和A140。這揭示了,那些側翼的A堿基幾乎沒有受到編輯,而靶標A76堿基(A-C錯配)顯示高達14%的編輯效率(圖5A和5B)。
對於KRAS位點,我們可以在dRNA覆蓋區域中看到,在靶標A56堿基側翼存在許多腺嘌呤,多達29個側翼的A堿基。根據KRAS mRNA編輯結果,我們發現雖然靶標A56堿基(A-C錯配)顯示高達11.7%的編輯效率,但是可以編輯側翼的腺嘌呤(圖5C和5D)。編輯了多種脫靶的腺嘌呤,而諸如A41,A43,A45,A46,A74,A79的腺嘌呤顯示出更多的編輯。我們發現那些未經編輯的A堿基的5'側最近鄰位是G或C,而那些有效編輯的腺嘌呤的5'側最近鄰位是T或A。基於這一觀察,我們開始設計dRNA以最小化對那些易於編輯的腺嘌呤的脫靶編輯。在我們的研究中,我們發現ADAR優選:A-C與A-A,A-U錯配,並且A-G錯配是最不優選的。因此,我們提出,對於5'側最近鄰位為U或A的脫靶A堿基,A-G錯配可能會減少或消除脫靶效應。之前的研究報道了A-G錯配可能會阻礙ADAR的脫氨基編輯。
接下來,基於圖5D中的統計結果和現有知識,我們設計了三種91-nt dRNA變體和四種111-nt dRNA變體(具有如下所示的序列),其含有不同的A-G錯配組合:dRNA-AG1(A41,A46,A74); dRNA-AG2(A41,A43,A45,A46,A74,A79); dRNA-AG3(A31,A32,A33,A41,A43,A45,A46,A47,A74,A79); dRNA-AG4(A7,A31,A32,A33,A40,A41,A43,A45,A46,A47,A74,A79,A95)(圖4E)。
KRAS-dRNA-91-AG2
UAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 38)
KRAS-dRNA-91-AG3
UAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 39)
KRAS-dRNA-91-AG4
UAGCUGGAUCGUCAAGGCACUCGUGCCGACGCCACCAGCUCCAACCACCACAAGGGGAGAGGCAGUCAGGGUCAGCAGGCCUCUCUCCCGC (SEQ ID NO: 40)
KRAS-dRNA-111-AG1
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:41)
KRAS-dRNA-111-AG2
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGUggAgAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:42)
KRAS-dRNA-111-AG3
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGCACCUGGGAGC (SEQ ID NO:43)
KRAS-dRNA-111-AG4
GCUCCCCGGUGCGGGAGAGAGGCCUGCUGACCCUGACUGCCUCUCCCCUUGUGGUGGUUGGAGCUGGUGGCGUCGGCACGAGUGCCUUGACGAUCCAGCUAAUUCAGAAUC (SEQ ID NO: 44)然後將這些dRNA轉染到HEK293T細胞中,並將空白載體和71-nt非打靶dRNA對照:(tctcagtccaatgtatggtccgagcacaagctctaatcaaagtccgcgggtgtagaccggttgccatagga(SEQ ID NO:45))用作陰性對照。對於91-nt dRNA,深度測序結果顯示,dRNA-91-AG2的中上靶(on-target)編輯(A56)降至2.8%,dRNA-91-AG3的降至2.3%,dRNA-91-AG4的降至0.7%,這是與沒有A-G錯配的dRNA-91的上靶編輯(A56)效率7.9%相比(圖4F)。對於91-nt dRNA,dRNA-111-AG2的中上靶編輯(A56)降低至5.1%,而dRNA -111-AG3的降低至4.9%,這是與沒有A-G錯配的dRNA-111的上靶編輯(A56)效率15.1%相比(圖4F),其表明較長的dRNA可以承受更多的A-G錯配。接下來我們選擇111-nt dRNA進行詳細的脫靶分析。除A7和A79外,顯著消除了側翼的A堿基編輯(圖4G)。對於A7堿基,可以通過該位點的進一步A-G錯配設計來防止脫靶效應,這在當前的dRNA設計中是不存在的。對於A79堿基,引入相鄰的兩個A-G錯配A78 / A79可能有助於消除脫靶效應。基於這樣的結果,應用本申請的RNA編輯系統治療基因疾病是非常有希望和鼓舞人心的。
實施例 5. 在多個細胞系中測試示例性 LEAPER 方法
通過HEK293T細胞中的結果,我們認為,由線性dRNA及其靶標RNA形成的雙鏈RNA可以招募內源ADAR蛋白用於A-I編輯。為了證實這一假設,我們選擇了更多的細胞系來測試我們的RNA編輯方法。結果如圖9所示。多個細胞系的結果證明了我們RNA編輯方法有普遍性。首先,盡管具有多種編輯效率,但使用dRNA招募內源性ADAR適合於多種人類細胞系(其源自7種不同的組織和器官)。此外,該方法不僅可以在人類細胞中起作用,而且可以在小鼠細胞中起作用,從而提供了在小鼠上進行實驗的可能性。
實施例 6. 利用內源性 ADAR 進行 RNA 編輯
為了探索有效的RNA編輯平臺,我們將高活性E1008Q突變體ADAR1(ADAR1DD )40 的脫氨酶結構域與催化失活的LbuCas13(dCas13a),一種RNA引導的靶向RNA的CRISPR效應子41 融合(圖10A)。為了評估RNA編輯效率,我們構建了一個包含通過包含3x GGGGS編碼區和框內UAG終止密碼子的序列連接mCherryEGFP 基因的替代報道分子(報道分子-1,圖10B)。報道分子轉染的細胞僅表達mCherry蛋白,而在報道分子轉錄物的UAG上進行靶向編輯可以將終止密碼子轉換為UIG,因此允許下遊EGFP表達。這樣的報道分子使我們能夠通過監測EGFP水平來測量A-至-I編輯效率。然後,我們設計了hU6啟動子驅動的crRNA(CRISPR RNA),其包含進行Cas13a識別的5'支架和可變長度的間隔區序列以用於靶向(crRNACas13a ,緊隨LbuCas13 crRNA序列)。
2. LbuCas13 crRNA序列
名稱 序列 來源
LbuCas13/Cas13a crRNA支架 Ggaccaccccaaaaaugaaggggacuaaaac (SEQ ID NO: 46) 圖10
Ctrl crRNA70 Aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc (SEQ ID NO: 47) 圖10
crRNA15 的間隔區 gcagagccucCagc (SEQ ID NO: 48) 圖10
crRNA22 的間隔區 cucacuggcagagccucCagc (SEQ ID NO: 49) 圖10
crRNA28 的間隔區 cccuugcucacuggcagagccucCagc (SEQ ID NO: 50) 圖10
crRNA35 的間隔區 cucucgcccuugcucacuggcagagccucCagc (SEQ ID NO: 51) 圖10
crRNA40 的間隔區 cucucgcccuugcucacuggcagagccucCagcaucgc (SEQ ID NO: 52) 圖10
crRNA47 的間隔區 ugaacagcucucgcccuugcucacuggcagagccucCagcaucgc (SEQ ID NO: 53) 圖10
crRNA70 的間隔區 ugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgcc (SEQ ID NO: 54) 圖10
與靶轉錄物互補的序列均包含與UAG密碼子相對的CCA,從而導致胞苷(C)與腺苷(A)錯配(圖10B),因為腺苷脫氨作用優先發生在A-C錯配位點13,14 。為了測試crRNA的最佳長度,在穩定表達報道分子-1的HEK293T細胞中,將不同長度的非靶向或靶向crRNA與dCas13a-ADAR1DD 蛋白共表達。用含有至少40-nt長的匹配序列的crRNA觀察到了由EGFP表達出現所指示的明顯的RNA編輯作用,crRNA越長,EGFP陽性百分比就越高(圖10C)。令人驚訝地,僅長crRNACas13a 的表達似乎足以激活EGFP表達,並且dCas13a-ADAR1DD 的共表達反而降低了crRNA活性(圖10C,10d)。EGFP表達顯然是序列依賴性的,因為70-nt(不包括用於長度計算的5'支架)對照RNA不能激活EGFP的表達(圖10C,10D)。
令人驚訝的發現是,某些長期工程化的crRNACas13a 能夠獨立於dCas13a-ADAR1DD 進行RNA編輯,我們決定從crRNA中刪除Cas13a招募的支架序列。因為crRNA70 具有觸發EGFP表達的最高活性(圖10C,10D),所以我們選擇了表3中的相同的70-nt長的向導RNA,而沒有Cas13a招募支架進行進一步測試(圖11A和以下在實施例中使用的arRNA和對照RNA序列)。
表3.
名稱 序列 (5' ---> 3') 來源
對照RNA70 Aaaccgagggaucauaggggacugaauccaccauucuucucccaaucccugcaacuccuucuuccccugc (SEQ ID NO: 55) 圖11
arRNA70 ugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgcc (SEQ ID NO: 56)
對照RNA71 Ucucaguccaauguaugguccgagcacaagcucuaaucaaaguccgcggguguagaccgguugccauagga (SEQ ID NO: 57) 圖14和圖16
arRNA71 acagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 58)
arRNA71 -CAA acagcuccucgcccuugcucacuggcagagcccucAagcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 59) 圖16A
arRNA71 -CUA acagcuccucgcccuugcucacuggcagagcccucUagcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 60)
arRNA71 -CGA acagcuccucgcccuugcucacuggcagagcccucGagcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 61)
arRNA71 -GCA acagcuccucgcccuugcucacuggcagagcccuGCAgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 62) 圖16B, C
arRNA71 -UCA acagcuccucgcccuugcucacuggcagagcccuUCAgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 63)
arRNA71 -ACA acagcuccucgcccuugcucacuggcagagcccuACAgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 64)
arRNA71 -CCU acagcuccucgcccuugcucacuggcagagcccuCCUgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 65)
arRNA71 -GCU acagcuccucgcccuugcucacuggcagagcccuGCUgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 66)
arRNA71 -UCU acagcuccucgcccuugcucacuggcagagcccuUCUgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 67)
arRNA71 -ACU acagcuccucgcccuugcucacuggcagagcccuACUgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 68)
arRNA71 -CCC acagcuccucgcccuugcucacuggcagagcccuCCCgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 69)
arRNA71 -GCC acagcuccucgcccuugcucacuggcagagcccuGCCgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 70)
arRNA71 -UCC acagcuccucgcccuugcucacuggcagagcccuUCCgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 71)
arRNA71 -ACC acagcuccucgcccuugcucacuggcagagcccuACCgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 72)
arRNA71 -CCG acagcuccucgcccuugcucacuggcagagcccuCCGgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 73)
arRNA71 -GCG acagcuccucgcccuugcucacuggcagagcccuGCUgcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 74)
arRNA71 -UCG acagcuccucgcccuugcucacuggcagagcccuUCGgcaucgcgagcaggcgcugccuccuccgccgcug(SEQ ID NO: 75)
arRNA71 -ACG acagcuccucgcccuugcucacuggcagagcccuACGgcaucgcgagcaggcgcugccuccuccgccgcug(SEQ ID NO: 76)
arRNA31 -報道分子-1 acuggcagagcccucCagcaucgcgagcagg (SEQ ID NO: 77) 圖16D和圖27
arRNA51 -報道分子-1 gcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccucc (SEQ ID NO: 78)
arRNA91 -報道分子-1 acagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcug (SEQ ID NO: 79)
arRNA111 -報道分子-1 accccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgc (SEQ ID NO: 80)
arRNA131 -報道分子-1 gcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugc (SEQ ID NO: 81)
arRNA151 -報道分子-1 ucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguaca (SEQ ID NO: 82)
arRNA171 -報道分子-1 gccguuuacgucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 83)
arRNA191 -報道分子-1 ugaacuuguggccguuuacgucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguacagcucguccaugccgccggug (SEQ ID NO: 84)
arRNA211 -報道分子-1 ccggacacgcugaacuuguggccguuuacgucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguacagcucguccaugccgccgguggaguggcggc (SEQ ID NO: 85)
arRNA31 -報道分子-2 gcgaccggggaucucCacagauucuuccggc (SEQ ID NO: 86)
arRNA51 -報道分子-2 gcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccu (SEQ ID NO: 87)
arRNA71 -報道分子-2 ccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccu(SEQ ID NO: 88)
arRNA91 -報道分子-2 gugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgc (SEQ ID NO: 89)
arRNA111 -報道分子-2 caccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccucc (SEQ ID NO: 90)
arRNA131 -報道分子-2 ccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccu (SEQ ID NO: 91)
arRNA151 -報道分子-2 uccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccu (SEQ ID NO: 92)
arRNA171 -報道分子-2 cggcgacguauccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuugua (SEQ ID NO: 93)
arRNA191 -報道分子-2 uguggccguuuacgucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguacagcucgucc (SEQ ID NO: 94)
arRNA211 -報道分子-2 acgcugaacuuguggccguuuacgucgccguccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuuguacagcucguccaugccgccgg (SEQ ID NO: 95)
arRNA71 (C+70)-報道分子-1 Cagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugcagcuu (SEQ ID NO: 96) 圖16E
arRNA71 (5+C+65)-報道分子-1 cccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgcccugc (SEQ ID NO: 97)
arRNA71 (10+C+60)-報道分子-1 cagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccuccuccgc (SEQ ID NO: 98)
arRNA71 (15+C+55)-報道分子 1 acuggcagagcccuccCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcugccucc (SEQ ID NO: 99)
arRNA71 (20+C+50)-報道分子-1 ugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgccgcug (SEQ ID NO: 100)
arRNA71 (25+C+45)-報道分子-1 gcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccuccuccgc (SEQ ID NO: 101)
arRNA71 (30+C+40)-報道分子-1 uccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgccgcugccucc (SEQ ID NO: 102)
arRNA71 (40+C+30)-報道分子-1 ggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgc (SEQ ID NO: 103)
arRNA71 (45+C+25)-報道分子-1 accccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccucc (SEQ ID NO: 104)
arRNA71 (50+C+20)-報道分子-1 gcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcug (SEQ ID NO: 105)
arRNA71 (55+C+15)-報道分子-1 gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcagg (SEQ ID NO: 106)
arRNA71 (60+C+10)-報道分子-1 accaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcga (SEQ ID NO: 107)
arRNA71 (65+C+5)-報道分子-1 gcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcau (SEQ ID NO: 108)
arRNA71 (70+C)-報道分子-1 guccagcucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucC (SEQ ID NO: 109)
arRNA71 (C+70)-報道分子-2 Cacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccuccucc (SEQ ID NO: 110)
arRNA71 (5+C+65)-報道分子-2 aucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgcugccu (SEQ ID NO: 111)
arRNA71 (10+C+60)-報道分子-2 cggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccuccgccgc (SEQ ID NO: 112)
arRNA71 (15+C+55)-報道分子-2 gcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccuccucc (SEQ ID NO: 113)
arRNA71 (20+C+50)-報道分子-2 cgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgcugccu (SEQ ID NO: 114)
arRNA71 (25+C+45)-報道分子-2 gcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccuccgccgc (SEQ ID NO: 115)
arRNA71 (30+C+40)-報道分子-2 cccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugcugccuccucc (SEQ ID NO: 116)
arRNA71 (40+C+30)-報道分子-2 cagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccuucugc (SEQ ID NO: 117)
arRNA71 (45+C+25)-報道分子-2 gugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcguguauaccu (SEQ ID NO: 118)
arRNA71 (50+C+20)-報道分子-2 ccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggcgugua (SEQ ID NO: 119)
arRNA71 (55+C+15)-報道分子-2 caccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuuccggc (SEQ ID NO: 120)
arRNA71 (60+C+10)-報道分子-2 augggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacagauucuu (SEQ ID NO: 121)
arRNA71 (65+C+5)-報道分子-2 ccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucCacaga (SEQ ID NO: 122)
arRNA71 (70+C)-報道分子-2 cucgaccaggaugggcaccaccccggugaacagcuccucgcccuugcucacgguggcgaccggggaucucC (SEQ ID NO: 123)
arRNA111 -CCA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 124) 圖16F, G
arRNA111 -GCA-報道分子-3 (UAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugCagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 125)
arRNA111 -UCA-報道分子-3 (UAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuCagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 126)
arRNA111 -ACA-報道分子-3 (UAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaCagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 127)
arRNA111 -CCG-報道分子-3 (CAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 128)
arRNA111 -GCG-報道分子-3 (CAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugCggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 129)
arRNA111 -UCG-報道分子-3 (CAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuCggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 130)
arRNA111 -ACG-報道分子-3 (CAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaCggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 131)
arRNA111 -CCU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 132)
arRNA111 -GCU-報道分子-3 (AAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugCugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 133)
arRNA111 -ACU-報道分子-3 (AAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaCugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 134)
arRNA111 -UCU-報道分子-3 (AAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuCugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 135)
arRNA111 -CCC-報道分子-3 (GAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucCcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 136)
arRNA111 -GCC-報道分子-3 (GAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugCcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 137)
arRNA111 -UCC-報道分子-3 (GAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuCcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 138)
arRNA111 -ACC-報道分子-3 (GAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaCcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 139)
對照RNA111 Uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucucugcuggggaauugcgcgauauucaggauuaaaagaagugc (SEQ ID NO: 140) 圖17
對照RNA151 Acuacaguugcuccgauauuuaggcuacgucaauaggcacuaacuuauuggcgcuggugaacggacuuccucucgaguaccagaagaugacuacaaaacuccuuuccauugcgaguaucggagucuggcucaguuuggccagggaggcacu (SEQ ID NO: 141)
arRNA51 -PPIB cggaagaggguggggccgcgguggcCagggagccggcgccgccacgcgcgg (SEQ ID NO: 142) 圖17B
arRNA71 -PPIB cagcugaggccggaagaggguggggccgcgguggcCagggagccggcgccgccacgcgcggguggggggga (SEQ ID NO: 143)
arRNA111 -PPIB ggaggcgaaagcagcccggacagcugaggccggaagaggguggggccgcgguggcCagggagccggcgccgccacgcgcgggugggggggacugggguugcucgcgggcuc (SEQ ID NO: 144)
arRNA151 -PPIB gaggcgcagcauccacaggcggaggcgaaagcagcccggacagcugaggccggaagaggguggggccgcgguggcCagggagccggcgccgccacgcgcgggugggggggacugggguugcucgcgggcuccgggcgggcggcgggcgccg (SEQ ID NO: 145)
arRNA51 -KRAS ucuugccuacgccaccagcuccaacCaccacaaguuuauauucagucauuu (SEQ ID NO: 146)
arRNA71 -KRAS gucaaggcacucuugccuacgccaccagcuccaacCaccacaaguuuauauucagucauuuucagcaggcc
arRNA111 -KRAS GauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacCaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagc (SEQ ID NO: 147)
arRNA151 -KRAS aucauauucguccacaaaaugauucugaauuagcuguaucgucaaggcacucuugccuacgccaccagcuccaacCaccacaaguuuauauucagucauuuucagcaggccucucucccgcaccugggagccgcugagccucuggccccgc (SEQ ID NO: 148)
arRNA51 -SMAD4 ucggcaugguaugaaguacuucgucCaggagcuggagggcccgguguaagu (SEQ ID NO: 149)
arRNA71 -SMAD4 gggucugcaaucggcaugguaugaaguacuucgucCaggagcuggagggcccgguguaagugaauuucaau (SEQ ID NO: 150)
arRNA111 -SMAD4 gaccucagucuaaagguugugggucugcaaucggcaugguaugaaguacuucgucCaggagcuggagggcccgguguaagugaauuucaauccagcaagguguuucuuuga (SEQ ID NO: 151)
arRNA151 -SMAD4 uaagggccccaacgguaaaagaccucagucuaaagguugugggucugcaaucggcaugguaugaaguacuucgucCaggagcuggagggcccgguguaagugaauuucaauccagcaagguguuucuuugaugcucugucuuggguaaucc (SEQ ID NO: 152)
arRNA51 -FANCC (TAC位點) ugggggguucggcugccgacaucagCaauugcucugccaccaucucagccc (SEQ ID NO: 153)
arRNA71 -FANCC (TAC位點) agcagggccgugggggguucggcugccgacaucagCaauugcucugccaccaucucagcccauccuccgaa (SEQ ID NO: 154)
arRNA111 -FANCC (TAC位點) aguagaaggccaagagccacagcagggccgugggggguucggcugccgacaucagCaauugcucugccaccaucucagcccauccuccgaagugaaugaacaggaaccagc (SEQ ID NO: 155)
arRNA151 -FANCC (TAC位點) ccucccaucacgggggccguaguagaaggccaagagccacagcagggccgugggggguucggcugccgacaucagCaauugcucugccaccaucucagcccauccuccgaagugaaugaacaggaaccagcucucaaagggaccuccgcag (SEQ ID NO: 156)
arRNA151 -PPIB (AAG位點) gccaaacaccacatgcttgccatctagccaggctgtcttgactgtcgtgatgaagaactgggagccgttggtgtcCttgcctgcgttggccatgctcacccagccaggcccgtagtgcttcagtttgaagttctcatcggggaagcgctca (SEQ ID NO: 157)  
arRNA151 -PPIB (CAG位點) gggagtgggtccgctccaccagatgccagcaccggggccagtgcagctcagagccctgtggcggactacagggccCgcacagacggtcactcaaagaaagatgtccctgtgccctactccttggcgatggcaaagggcttctccacctcga (SEQ ID NO: 158)  
arRNA151 -FANCC (AAG位點) tgcattttgtaaaatagatactagcagattgtcccaagatgtgtacagctcattctcacagcccagcgagggcacCtactccacaaatgcgtggccacaggtcatcacctgtcctgtggccctggcgagcctgatccctcacgccgggcac (SEQ ID NO: 159) 圖17C
arRNA151 -FANCC (CAG位點) gctcattctcacagcccagcgagggcacttactccacaaatgcgtggccacaggtcatcacctgtcctgtggcccCggcgagcctgatccctcacgccgggcacccacacggcctgcgtgccttctagacttgagttcgcagctctttaag (SEQ ID NO: 160)  
arRNA151 -IDUA (CAG位點) tcggccgggccctgggggcggtgggcgctggccaggacgcccaccgtgtggttgctgtccaggacggtcccggccCgcgacacttcggcccagagctgctcctcatccagcagcgccagcagccccatggccgtgagcaccggcttgcgca (SEQ ID NO: 161)  
arRNA111 -TARDBP ugaccagucuuaagaucuuucuugaccugcaccauaagaacuucuccaaagguacCaaaauacucuuucagguccuguucgguuguuuuccaugggagacccaacacuauu (SEQ ID NO: 162) 圖17D
arRNA111 -CGA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 163) 圖17G
arRNA111 -GGA-報道分子-3 (UAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 164)
arRNA111 -UGA-報道分子-3 (UAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 165)
arRNA111 -AGA-報道分子-3 (UAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 166)
arRNA111 -CGG-報道分子-3 (CAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 167)
arRNA111 -GGG-報道分子-3 (CAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugGggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 168)
arRNA111 -UGG-報道分子-3 (CAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuGggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 169)
arRNA111 -AGG-報道分子-3 (CAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaGggcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 170)
arRNA111 -CGU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 171)
arRNA111 -GGU-報道分子-3 (AAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 172)
arRNA111 -AGU-報道分子-3 (AAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 173)
arRNA111 -UGU-報道分子-3 (AAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 174)
arRNA111 -CGC-報道分子-3 (GAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 175)
arRNA111 -GGC-報道分子-3 (GAC) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccugGcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 176)
arRNA111 -UGC-報道分子-3 (GAA) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuuGcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 177)
arRNA111 -AGC-報道分子-3 (GAU) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuaGcgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 178)
arRNA111 -CGA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 179) 圖17H
arRNA111 -GGA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuGGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 180)
arRNA111 -UGA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuUGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 181)
arRNA111 -AGA-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuAGagcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 182)
arRNA111 -CGU-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGUgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 183)
arRNA111 -CGG-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGGgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 184)
arRNA111 -CGC-報道分子-3 (UAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGCgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 185)
arRNA111 -CGU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 186)
arRNA111 -GGU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuGGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 187)
arRNA111 -UGU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuUGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 188)
arRNA111 -AGU-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccuAGugcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 189)
arRNA111 -CGA- 報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGAgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 190)
arRNA111 -CGC-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGCgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 191)
arRNA111 -CGG-報道分子-3 (AAG) gaugggcaccaccccggugaacagcuccucgcccuugcucacuggcagagcccucGGgcaucgcgagcaggcgcugccuccuccgcccugcagcuuguacagcucguccau (SEQ ID NO: 192)
arRNA111 -KRAS-AG6 gauucugaauuagcuguaucgucaaggcacucgugccgacgccaccagcuccaacCaccacaaguggagagucagucauuuucagcaggccucucucccgcaccugggagc (SEQ ID NO: 193) 圖17I
arRNA111 -KRAS-AG9 gauucugaauuagcuggaucgucaaggcacucgggccgacgccaccagcuccaacCaccacaaguggagagucagucauuuucagcaggccucucucccgcaccggggagc (SEQ ID NO: 194)
arRNA111 -TP53 gggagcagccucuggcauucugggagcuucaucuggaccugggucuucagugaacCauuguucaauaucguccggggacagcaucaaaucauccauugcuugggacggcaa (SEQ ID NO: 195) 圖23
arRNA111 -TP53-AG1 gggagcagccucuggcauucugggagcuucaucuggaccugggucuucagugaacCauuguucaagaucguccggggacagcaucaaaucauccauugcuugggacggcaa (SEQ ID NO: 196)
arRNA111 -TP53-AG4 gggagcagccucuggcagucggggagcuucaucuggaccugggucuucagugaacCauuguucaagaucguccggggacagcaucaaaucauccagugcuugggacggcaa (SEQ ID NO: 197)
arRNA111 -COL3A1 cauauuacagaauaccuugauagcauccaauuugcauccuugguuagggucaaccCaguauucuccacucuugaguucaggauggcagaauuucaggucucugcaguuucu (SEQ ID NO: 198) 圖26
arRNA111 -BMPR2 gugaagauaagccaguccucuaguaacagaaugagcaagacggcaagagcuuaccCagucacuuguguggagacuuaaauacuugcauaaagauccauugggauaguacuc (SEQ ID NO: 199)
arRNA111 -AHI1 gugaacgucaaacugucggaccaauauggcagaaucuucucucaucucaacuuucCauauccguaucauggaaucauagcauccuguaacuacuagcucucuuacagcugg (SEQ ID NO: 200)
arRNA111 -FANCC (位點2) gccaaugaucucgugaguuaucucagcagugugagccaucagggugaugacauccCaggcgaucguguggccuccaggagcccagagcaggaaguugaggagaaggugccu (SEQ ID NO: 201)
arRNA111 -MYBPC3 caagacggugaaccacuccauggucuucuugucggcuuucugcacuguguaccccCagagcuccguguugccgacauccugggguggcuuccacuccagagccacauuaag (SEQ ID NO: 202)
arRNA111 -IL2RG aggauucucuuuugaaguauugcucccccaguggauuggguggcuccauucacucCaaugcugagcacuuccacagaguggguuaaagcggcuccgaacacgaaacgugua (SEQ ID NO: 203)
arRNA111 -IDUA-V1 gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggccCagagcugcuccucauccagcagcgccagcagccccauggccgugagcaccggcuu (SEQ ID NO: 204) 圖29
arRNA111 -IDUA-V2 gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggccCagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug (SEQ ID NO: 205)
事實證明,這種線性向導RNA在接近40%攜帶報道分子-1的總細胞中誘導了EGFP的強表達(圖11B,上圖)。由於內源性ADAR蛋白可以編輯雙鏈RNA(dsRNA)底物12 ,因此我們認為長向導RNA可以與靶標轉錄物退火形成dsRNA底物,轉而招募內源性ADAR蛋白用於靶向編輯。因此,我們將這樣的向導RNA稱為arRNA(ADAR招募RNA)。
為了驗證內源性ADAR蛋白是否確實是上述觀察的原因,我們著手研究在ADAR缺陷細胞中arRNA介導的RNA編輯。由於在HEK293T細胞中幾乎檢測不到ADAR2 mRNA(圖12A),因此我們生成了HEK293TADAR1-/- 細胞,從而使該細胞系在ADAR1和ADAR2中均缺乏(圖11C,D)。實際上,ADAR1的消耗消除了arRNA70 誘導的EGFP信號(圖11B,下圖)。此外,HEK293TADAR1-/- 細胞中ADAR1p110 ,ADAR1p150 或ADAR2的外源表達(圖11C,D)成功地挽救了通過arRNA70 誘導EGFP的丟失(圖11E,圖12B),證明了arRNA誘導的EGFP報道分子其表達完全取決於天然的ADAR1,其活性可以通過其同種型(p110和p150)或ADAR2重建。對arRNA70 靶向區域的Sanger測序分析顯示,UAG中預測的腺苷位點有一個A/G重疊峰,表明明顯的A至I(G)轉化(圖11F)。下一代測序(NGS)進一步證實了A至I的轉化率約為全部報道分子轉錄物的13%(圖11G)。定量PCR分析表明arRNA70 不會減少靶標轉錄物的表達(圖13),排除了arRNA可能的RNAi效應。總體而言,我們的數據表明,arRNA能夠通過工程化的A-C錯配對靶標轉錄物產生顯著水平的編輯。
實施例 7. LEAPER 可以在多個細胞系中進行 RNA 編輯
因為內源性ADAR蛋白的表達是LEAPER介導的RNA編輯的前提,所以我們測試了LEAPER在一組來自不同組織的細胞系中的性能,這些細胞系包括HT29,A549,HepG2,RD,SF268,SW13和HeLa。我們首先使用蛋白質印跡分析檢查了所有三種ADAR蛋白的內源表達。ADAR1在所有測試的細胞系中都高度表達,其在蛋白質印跡中的身份已通過陰性對照HEK293TADAR1 –/– 系得到證實(圖14A,B)。僅在HepG2和HeLa細胞中檢測到ADAR3(圖14A,B)。在任何細胞中均未檢測到ADAR2,其結果並非由於蛋白質印跡失敗,因為可以從過表達ADAR2的HEK293T細胞中檢測到ADAR2蛋白(圖14A,B)。這些發現與先前報道的ADAR1普遍表達,而ADAR2和ADAR3的表達僅限於某些組織一致11
然後我們著手在這些細胞系中測試靶向報道分子-1的重新設計的71-nt arRNA(arRNA71)的編輯效率(圖15A和上面列出的這項研究中使用的arRNA和對照RNA的序列)。
LEAPER在該arRNA71 的所有測試的細胞中都工作,盡管效率有所不同(圖14C)。這些結果與先前的報道一致,除了HepG2和HeLa細胞外,ADAR1/2蛋白水平與RNA編輯產量相關42 。編輯效率與ADAR1水平的次優相關性可能是由於這兩個系中都有大量的ADAR3表達(圖14A,B),因為據報道ADAR3在RNA編輯中起抑制作用。重要的是,LEAPER還用於小鼠起源的三種不同細胞系(NIH3T3,小鼠胚胎成纖維細胞(MEF)和B16)(圖14D),為通過動物和疾病模型測試其治療潛力鋪平了道路。總體而言,我們得出的結論是,LEAPER是一種用於廣譜細胞類型以及不同生物體的多功能工具。
實施例 8. LEAPER 的特性和優化
為了更好地表征和優化LEAPER,我們研究了靶標轉錄物的UAG三聯體內與腺苷相對的核苷酸的選擇。在HEK293T細胞中,靶向報道分子-1的arRNA71 顯示出可變的編輯效率,具有與靶向UAG相對的變化的三聯體(5’-CNA,N表示A / U / C / G之一)(上面列出的在這項研究中使用的arRNA和對照RNA的序列)。A-C錯配導致最高的編輯效率,而A-G錯配產生最少但明顯的編輯(圖16A)。然後,我們研究了arRNA中A-C錯配側翼核苷酸的優先度。我們測試了胞苷(5'-N1 CN2 )周圍的所有16個5'和3'相鄰位點組合(上面列出的在這項研究中使用的arRNA和對照RNA的序列),發現3'相鄰腺苷是有效編輯所必需的,而腺苷是5'位點上最不利的核苷酸(圖16B,C)。因此,我們得出結論,arRNA上的CCA基序賦予了靶向UAG位點的最高編輯效率。值得注意的是,arRNA中的3'相鄰鳥苷(5'-N1 CG)表現出顯著的抑制作用(圖16B,C)。
RNA的長度似乎在指導對靶轉錄物的編輯中與arRNA效率有關(圖10C),與先前的報道一致42 。為了完全理解這種效果,我們測試了可變長度的arRNA,它們靶向兩種不同的報道分子轉錄物-報道分子-1和報道分子-2(圖15A,B)。對於任一報道分子靶向,設計和測試了10種不同大小的arRNA,範圍從31-nt到211-nt,CCA三聯體(用於UAG靶向)正好位於中間(上面列出的這項研究中使用的arRNA和對照RNA的序列)。基於報道分子EGFP活性,對於兩個報道分子,arRNA的長度與編輯效率正相關,在111-191-nt處達到峰值(圖16D)。盡管一個arRNA51 似乎起作用,但71-nt是arRNA對兩個報道分子均起作用的最短長度(圖16D)。
接下來,我們研究了arRNA內A-C錯配位置對編輯效率的影響。我們將所有要測試的arRNA的長度固定為71-nt,並將靶向UAG的ACC三聯體從arRNA中的5'滑到3'(上面列出的這項研究中使用的arRNA和對照RNA的序列)。事實證明,在兩個報道分子中,將A-C錯配置於中間區域會導致較高的編輯產率,且錯配位點接近3'端的arRNA優於接近5'端的arRNA(圖16E)。為方便起見,對所有我們的後續研究,我們都將A-C錯配置於arRNA的中心。
我們還測試了LEAPER的靶向靈活性,並試圖確定靶標上的UAG是否是進行RNA編輯的唯一基序。對於報道分子-3上的所有16個三聯體組合(5'-N1 AN2 )(圖15C),我們使用了固定長度(111-nt)的相應arRNA,並確保了除了編輯位點(AC錯配)外,arRNA和報道分子的完美序列匹配(圖16F和上面列出的這項研究中使用的arRNA和對照RNA的序列)。NGS結果表明,所有N1 AN2 基序均可編輯。UAN2 和GAN2 分別是最優選和最不優選的基序(圖16F,G)。總體而言,靶標腺苷的最近鄰位優先度為5'U>C≈A>G和3' G>C>A≈U(圖16G)。
實施例 9. 使用 LEAPER 編輯內源轉錄物
接下來,我們檢查了LEAPER是否可以對內源轉錄物進行有效的編輯。使用不同長度的arRNA,我們靶向PPIBKRASSMAD4 基因轉錄物中的UAG基序,以及FANCC 基因轉錄物中的UAC基序(圖17A,上面列出的這項研究中使用的arRNA和對照RNA序列)。令人鼓舞的是,所有四種轉錄物中的靶標腺苷位點均由其相應的所有四種大小的arRNA編輯,盡管根據NGS結果的效率有所不同(圖17B)。與我們先前的觀察一致,更長的arRNA傾向於產生更高的編輯率。值得注意的是,151-nt的arRNAPPIB 編輯了PPIB 基因總轉錄物的〜50%(圖17B)。沒有arRNA在其靶標轉錄物(圖18A)或最終蛋白質水平(例如KRAS,圖18B)上顯示出RNAi作用。此外,LEAPER能夠在非UAN位點上達到理想的編輯率(圖17C和上面列出的這項研究中使用的arRNA和對照RNA的序列),顯示LEAPER在編輯內源轉錄物上的靈活性。為了進一步探索LEAPER的功能,我們測試了LEAPER是否可以同時靶向多個位點。我們通過共表達兩個arRNA(上面列出的這項研究中使用的arRNA和對照RNA的序列)觀察到TARDBPFANCC 轉錄物的多重編輯,其效率甚至高於單個arRNA(圖17D)的那些,表明LEAPER非常適合並行編輯多個靶標。
值得注意的是,ADAR1/2傾向於使RNA雙鏈體中的多個腺苷雜亂地脫氨基44 ,並且A-C錯配不是指導A至I轉換的唯一基序(圖16A)。因此,可以合理地假設,arRNA覆蓋範圍內靶標轉錄物上的所有腺苷均受到可變水平的編輯,這是不需要的修飾的主要來源。arRNA越長,這樣的脫靶的可能性就越高。因此,我們檢查了這些靶標轉錄物中arRNA覆蓋區域內的所有腺苷位點。對於PPIB 轉錄物,在整個測序窗口中,對於可變大小的arRNA,觀察到很少的脫靶編輯(圖17E,F)。但是,在靶向KRASSMAD4FANCC 基因的情況下,檢測到多個脫靶編輯(圖19A-F)。特別是對於KRAS ,在arRNA111 的測序窗口中,30個腺苷中有11個進行了大量的A至I轉化(圖19A,B)。
我們接下來嘗試開發策略以最小化這樣的不需要的脫靶效應。因為A-G錯配抑制了UAG靶向的編輯(圖16A),所以我們假設將鳥苷與非靶標腺苷配對可能會減少不良的編輯。然後,我們測試了報道分子-3中所有可能的三聯體組合(5'-N1 AN2 )中A-G錯配對腺苷的影響(圖15C和上面列出的這項研究中使用的arRNA和對照RNA序列)。與A-C錯配(圖16F)相比,除了UAG或AAG靶向(〜2%)(圖17G),A-G錯配確實降低了所有測試靶標上腺苷的編輯。為了進一步降低不想要的位點的編輯率,我們繼續測試了兩個連續錯配的影響。結果表明,與UAG或AAG相對的三聯體的3'端核苷酸處的額外錯配消除了其相應的腺苷編輯(圖17H以及上面列出的這項研究中使用的arRNA和對照RNA的序列)。根據這些發現,我們嘗試應用此規則以減少KRAS 轉錄物中的脫靶(圖19A)。我們首先設計了一個arRNA(arRNA111 -AG6),其在arRNA111 覆蓋的所有“易編輯”基序上產生了AG錯配(圖17I,圖19A和上述研究中使用的arRNA和對照RNA的序列),包括AAU (第61位),UAU(第63位),UAA(第65位),AAA(第66位),UAG(第94位)和AAG(第99位)。該arRNA111 -AG6消除了大部分脫靶編輯,同時保持了約5%的脫靶編輯率。與圖17G中的發現一致,單個A-G錯配不能完全最小化AAG基序(第99位)的編輯(圖17I和圖19A)。然後,我們在arRNA111 -AG6上添加了更多錯配,包括雙重錯配(與靶標基序5'-AAG相對的5'-CGG),以及三個另外的A-G錯配以減輕第27、98和115位腺苷的編輯(arRNA111- AG9)(上面列出的這項研究中使用的arRNA和對照RNA的序列)。因此,我們實現了大大提高的編輯特異性,而又沒有在靶標位點(A76)上額外損失編輯率(圖17I)。總之,結合其他規則的工程化的LEAPER可以對內源轉錄物進行有效和更精確的RNA編輯。
實施例 10. LEAPER RNA 編輯特異性
除了在arRNA覆蓋的dsRNA區域內可能的脫靶效應外,我們還擔心通過arRNA的部分堿基配對對其他轉錄物的潛在脫靶效應。然後,我們進行了轉錄組範圍的RNA測序分析,以評估LEAPER的全局脫靶效應。在進行RNA序列分析之前,先用對照RNA151PPIB 特異性arRNA(arRNA151 -PPIB)表達質粒轉染細胞。我們在對照RNA151 組中確定了六個潛在脫靶(圖20A),在arRNA151 -PPIB的五個潛在脫靶(圖20B),基於NGS分析的PPIB 脫靶率為~37%(圖20B)。進一步的分析表明,除來自EIF2AK2 轉錄物的兩個位點外,所有位點均位於SINE(Alu)或LINE區域(圖20A,B),均易於受到ADAR介導的編輯45 ,表明這些脫靶可能不是從靶標轉錄物和arRNA或對照RNA的配對中得出的。值得注意的是,兩組均出現了脫靶轉錄物,WDR73SMYD4 ,表明它們不太可能是依賴序列的RNA編輯。實際上,最小自由能分析表明,所有這些可能的脫靶轉錄物均不能與對照RNA151 或arRNA151 -PPIB形成穩定的雙鏈體(圖20C)。為了進一步測試arRNA是否產生依賴序列的脫靶,我們通過使用NCBI BLAST比較arRNA151 -PPIB和arRNA111 -FANCC的序列相似性來選擇潛在的脫靶位點。arRNA151 -PPIB的TRAPPC12 轉錄物以及arRNA111 -FANCC的ST3GAL1OSTM1-AS1EHD2 轉錄物中的三個位點是最佳候選者(圖20D和圖21A)。NGS分析表明,在這些預測的脫靶位點中均未檢測到編輯(圖20D和圖21B)。這些結果表明,LEAPER允許在靶標位點進行有效編輯,同時保持轉錄組範圍的特異性,而沒有檢測到依賴序列的脫靶編輯。
實施例 11. LEAPER 在哺乳動物細胞中的安全性評估
因為arRNA依賴於內源性ADAR蛋白來編輯靶標轉錄物,所以我們想知道外源性arRNA的添加是否通過占用過多的ADAR1或ADAR2蛋白來影響天然RNA編輯事件。因此,我們從轉錄組範圍的RNA測序結果中分析了模擬組和arRNA151 -PPIB組共享的A-to-I RNA編輯位點,並分析了模擬組和對照RNA151 組之間的比較。與模擬組相比,對照RNA151 組和arRNA151 -PPIB組均未顯示出顯著差異(圖22A,B),這表明LEAPER對內源ADAR1催化天然A-to-I編輯事件的正常功能影響很小。
同時,我們使用RNA-seq數據進行了差異基因表達分析,以驗證arRNA是否影響全局基因表達。我們發現,與模擬組相比,對照RNA151 和arRNA151 -PPIB均不影響全局基因表達(圖22C,D)。與我們先前的觀察結果一致(圖18A),arRNA對PPIB 的表達未顯示任何RNAi作用(圖22C,D)。
考慮到arRNA與靶轉錄物形成RNA雙鏈體並且RNA雙鏈體可引起先天免疫應答,我們研究了arRNA的引入是否具有這樣的作用。為了測試這一點,我們選擇了靶向已證明有效的四個基因轉錄物的arRNA。我們沒有觀察到幹擾素-β(IFN-β)(圖22E)或白介素6(IL-6)(圖22F)的任何mRNA誘導,這是先天性免疫激活的兩個標志。作為陽性對照,雙鏈RNA的合成類似物-聚(I:C)誘導了強烈的IFN-β和IL-6表達(圖22E,F)。LEAPER似乎不會在靶細胞中誘導免疫原性,一種對安全治療很重要的特征。
實施例 12. 通過 LEAPER 恢複 p53 的轉錄調節活性
現在我們已經建立了無需引入外源蛋白質就可以進行RNA編輯的新方法,我們試圖證明其治療作用。我們首先針對了腫瘤抑制基因TP53 ,該基因在維持細胞穩態中起著至關重要的作用,但在>50%的人類癌症中經常發生突變46TP53 中的c.158G>A突變是臨床相關的無意義突變(Trp53Ter),導致無功能的截短蛋白46 。我們設計了一個arRNA111 和兩個替代性arRNA(arRNA111 -AG1和arRNA111 -AG4)(上面列出的本研究中使用的arRNA和對照RNA的序列),它們均靶向TP53W53X 轉錄物(圖23A),後兩個被設計為最小化潛在脫靶。我們產生了HEK293TTP53 –/– 細胞系,以消除天然p53蛋白的作用。靶向TP53W53X 的所有三種形式的arRNA都在突變的腺苷位點上轉化了TP53W53X 轉錄物的~25-35%(圖23B),可變減少arRNA111 -AG1和arRNA111 -AG4的不想要的編輯(圖24)。蛋白質印跡表明,基於HEK293TTP53 –/– 細胞中的TP53W53X 轉錄物,arRNA111 ,arRNA111 -AG1和arRNA111 -AG4均可挽救全長p53蛋白的產生,而對照RNA111 則不能(圖23C)。
為了驗證修複的p53蛋白是否功能完全,我們用p53-熒光素酶順式報道系統測試了p53的轉錄調節活性47 48 。所有三個版本的arRNA均可恢複p53活性,而優化版本的arRNA111 -AG1表現最佳(圖23D)。總之,我們證明了LEAPER能夠修複與癌症相關的TP53 的提前終止密碼子(pre-mature stop codon)並恢複其功能。
實施例 13.LEAPER 對致病性突變的校正
接下來,我們調查了LEAPER是否可用於校正更多的致病突變。針對六個致病基因的臨床相關突變:埃勒斯-當洛斯綜合征的COL3A1 ,原發性肺動脈高壓的BMPR2 ,朱伯特綜合征的AHI1 ,範科尼貧血的FANCC ,原發性家族性肥厚性心肌病的MYBPC3 和X染色體連鎖嚴重聯合免疫缺陷病的IL2RG ,我們為每個攜帶相應致病性G>A突變的基因設計了111-nt arRNA(圖25和上面列出的這項研究中使用的arRNA和對照RNA的序列,以及這項研究中使用的以下與疾病相關的cDNA)。
表4. 這項研究中使用的與疾病相關的cDNA
候選者 疾病 突變體腺苷
NM_000090.3 (COL3A1 ) 埃勒斯-當洛斯綜合征, 4型 c.3833G>A (p.Trp1278Ter)
NM_001204.6(BMPR2 ) 原發性肺動脈高壓 c.893G>A (p.Trp298Ter)
NM_017651.4 (AHI1 ) 朱伯特綜合征3 c.2174G>A (p.Trp725Ter)
NM_000136.2 (FANCC ) 範科尼貧血,補充組C c.1517G>A (p.Trp506Ter)
NM_000256.3 (MYBPC3 ) 原發性家族性肥厚性心肌病 c.3293G>A (p.Trp1098Ter)
NM_000206.2 (IL2RG ) X染色體連鎖嚴重聯合免疫缺陷病 c.710G>A (p.Trp237Ter)
通過在HEK293T細胞中共表達arRNA/cDNA對,我們在所有測試中鑒定了顯著量的具有A>G校正的靶轉錄物(圖24)。由於G>A突變占人類已知致病點突變的近一半10,49 ,因此LEAPER進行的A>G轉化可為治療提供巨大的機會。
實施例 14. LEAPER 在多個人類原代細胞中進行 RNA 編輯
為了進一步探索LEAPER的臨床實用性,我們著手在多個人類原代細胞中測試該方法。首先,我們在人原代肺成纖維細胞和人原代支氣管上皮細胞中用151-nt arRNA(上面列出的這項研究中使用的arRNA和對照RNA的序列)測試了LEAPER,以編輯報道分子-1(圖15A)。在兩個人原代細胞中,LEAPER均可獲得35-45%的EGFP陽性細胞(圖27A)。然後,我們測試了LEAPER在這兩個原代細胞和人類原代T細胞中編輯內源性基因PPIB 的結果,發現arRNA151 -PPIB在人類原發性肺成纖維細胞,原發性支氣管上皮細胞(圖27B)和原代T細胞(圖27C)中的編輯率可分別達到>40%,>80%和>30%。LEAPER在人原代細胞中的高編輯效率因其在治療中的潛在應用而特別令人鼓舞。
實施例 15. 通過慢病毒表達和 arRNA 的化學合成的有效編輯
然後我們研究了是否可以通過臨床上更相關的方法來遞送LEAPER。我們首先通過基於慢病毒的表達測試了arRNA的作用。感染後2天(dpi),靶向報道分子-1的arRNA151 在HEK293T細胞中的40%以上帶有報道分子-1的總細胞中誘導了強EGFP表達。在8 dpi時,EGFP比率保持在〜38%的可比水平(圖28A和上面列出的這項研究中使用的arRNA和對照RNA序列),表明LEAPER可以適合需要連續施用的療法。對於天然基因編輯,我們通過慢病毒轉導在HEK293T細胞中遞送了靶向PPIB 的arRNA151 ,並在6 dpi時觀察到超過6%的靶標編輯(圖28B)。
我們接下來測試了用於LEAPER的合成的arRNA寡核苷酸和電穿孔遞送方法。化學合成具有111-nt的靶向PPIB 轉錄物的arRNA和對照RNA,並在arRNA的前三個和後三個核苷酸處進行2'-O-甲基和硫代磷酸酯鍵修飾(圖28C)。通過電穿孔引入T細胞後,arRNA111 -PPIB寡核苷酸在PPIB 轉錄物上實現了~20%的編輯(圖28D),這表明LEAPER有望開發出寡核苷酸藥物。
實施例 16. 通過 LEAPER 恢複源自 Hurler 綜合征患者的原代成纖維細胞中的 α-L- 艾杜糖醛酸酶活性
最後,我們檢查了LEAPER在治療單基因疾病-Hurler綜合征方面的潛力,該疾病是由於α-L-艾杜糖醛酸酶(IDUA),一種負責粘多糖的降解的溶酶體代謝酶的缺乏而導致的I型粘多糖貯積病最嚴重的亞型(MPS I)50 。我們選擇了從Hurler綜合征患者最初分離的原代成纖維細胞GM06214。GM06214細胞在IDUA 基因的外顯子9中含有純合的TGG>TAG突變,從而導致蛋白質中的Trp402Ter突變。我們通過具有化學修飾的合成RNA寡核苷酸設計了兩個版本的arRNA,所述化學修飾是序列首尾核苷酸中的2’-O-甲基化和核苷酸間硫代磷酸酯連接,分別是靶向IDUA 的成熟mRNA和pre-mRNA的arRNA111 -IDUA-V1和arRNA111 -IDUA-V2(圖29A以及在上面列出的這項研究中使用arRNA和對照RNA的序列)。通過電穿孔將arRNA111 -IDUA-V1或arRNA111 -IDUA-V2引入GM06214細胞後,我們通過NGS分析測量了靶標RNA編輯率,並在不同的時間點用4-MU-α-L-艾杜糖醛酸酶底物測量了α-L-艾杜糖醛酸酶的催化活性。在電穿孔後,arRNA111 -IDUA-V1和arRNA111 -IDUA-V2均可隨著時間的推移逐漸恢複IDUA 缺失的GM06214細胞中IDUA的催化活性,而arRNA111 -IDUA-V2的性能要比arRNA111-IDUA-V1好得多,而在三個對照組中無α-L-艾杜糖醛酸酶活性可以檢測到(圖29B)。
為了進一步評價LEAPER在GM06214中恢複的IDUA活性減輕Hurler綜合征的程度,我們檢查了GM01323細胞中的IDUA活性,GM01323細胞是來自患有Scheie綜合征的患者的另一種原代成纖維細胞,該綜合征是一種比Hurler輕得多的MPS I亞型,由於IDUA 基因雜合基因型導致殘留IDUA活性而引起的。我們發現電穿孔後48小時,在具有arRNA111 -IDUA-V2的GM06214細胞中IDUA的催化活性高於GM01323細胞(圖29B)。與這些結果一致,NGS分析表明arRNA111 -IDUA-V2將近30%的A轉換為I,比arRNA111 -IDUA-V1的轉化率高得多(圖29C)。進一步的分析表明,在IDUA轉錄物的arRNA覆蓋區域內檢測到最少的不需要的編輯(圖29D)。重要的是,LEAPER不會在原代細胞中觸發免疫反應,如我們證明的,與RNA雙鏈體聚(I:C)用作陽性對照不同,arRNA111 -IDUA-V1和arRNA111 -IDUA-V2均未誘導一組涉及I型幹擾素和促炎反應的基因的表達(圖29E)。這些結果表明LEAPER在靶向某些單基因疾病方面的治療潛力。
實施例 17.GM06214 突變基因型的檢測
將GM06214細胞培養於含有15%血清和1%成纖維細胞生長添加物(ScienCell,GFS,目錄號2301)的成纖維細胞培養基(ScienCell,FM培養基,目錄號2301)中,培養箱為37°C及5%CO2 ,持續2-3天。當細胞為90%匯合時,將其用0.25%的胰蛋白酶消化,然後用含有15%血清的成纖維細胞培養基終止消化。根據操作說明書,使用TianGene®(天根生化科技(北京)有限公司,TIANGEN Biotech(Beijing)Co.,Ltd.)細胞DNA提取試劑盒(目錄號DP304-03)進行DNA提取。
使用NCBI-Primer blast(網站:https://www.ncbi.nlm.nih.gov/tools/primer-blast/)設計IDUA突變位點上遊和下遊序列的引物。SEQ ID NO:304:CGCTTCCAGGTCAACAACAC(正向引物hIDUA-F1);SEQ ID NO:305:CTCGCGTAGATCAGCACCG(反向引物hIDUA-R1)。進行PCR,並對PCR產物進行Sanger測序。如圖34所示,經確認該細胞的突變是導致該疾病的G至A突變。
實施例 18. GM06214 細胞的轉染條件測試
當GM06214達到90%匯合度時消化GM06214細胞,並在消化終止後計數。對於電轉染,將600萬個細胞用400μl預混合的電轉染溶液(Lonza,目錄號:V4XP-3024)重懸,並加入20μg GFP質粒(Lonza,目錄號:V4XP-3024)。混合後,取20μl懸浮液作為電轉染體系,用於使用Lonza NucleofectorTM 儀器的8種條件中的每一種的測試,所述8種條件包括7種測試電轉染條件(參見圖35)和一個陰性對照。每種條件的測試做一個重複。電轉染後,將細胞迅速轉移到含有15%血清的2ml成纖維細胞培養基(ScienCell,FM培養基,目錄號:2301)中。將每種條件的細胞接種至2個孔(6孔培養板)中,並在5%CO2和37°C的培養箱中進行培養。電轉染後24小時,消化每種電轉染條件的2個孔其中一孔的細胞,通過流式細胞儀測量GFP陽性細胞的比例。電轉染後48小時,消化每種電轉染條件的2個孔中的另一孔中的細胞,並通過流式細胞儀測量GFP陽性細胞的比例。如圖35所示,細胞的最佳電轉染條件是CA-137條件。
實施例 19. IDUA 酶活性和 A G 突變率的檢測
設計和合成寡聚dRNA,用於靶向由IDUA基因轉錄的具有mRNA前體和成熟RNA的突變位點的序列。dRNA的序列如下所示。所有的dRNA序列都以CM0模式進行了修飾(2'-O-甲基化位於序列首尾各3個核苷酸,序列的首尾各3個核苷酸間連接是硫代磷酸酯化)。
SEQ ID NO 204:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauccagcagcgccagcagcgcaccccuggggugagcaccggcuu(前-55nt-c-55nt);
SEQ ID NO 205:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug(m-55nt-c-55nt);
SEQ ID NO 341:uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccggauguucuccgcggggauaucgcgauauucaggauuaaaagaagugc(隨機-111nt)。
其中,合成的dRNA中與突變堿基相對應的堿基是C,其在結合時與突變堿基形成A-C錯配。合成的dRNA的長度優選的為111nt。使用實施例18中獲得的最佳電轉染條件電轉染細胞。電轉染後48小時,收集細胞用於酶活性測定和A至G突變率檢測。
確定A至G突變率:
將設計的dRNA溶解在無RNA酶的水中(TransGene Biotech,目錄號:GI201-01)至所需濃度,並儲存在-80℃。當GM06214細胞生長至約90%匯合度時,將細胞消化,並在消化終止後計數。將100萬個細胞和200 pmol的dRNA混合並稀釋至100μl,然後在CA-137的條件下進行電轉染。電轉染後48小時,對細胞計數並測量其生活力。將細胞轉移至無RNase的離心管中並進行離心。棄去上清液。使用QIAGEN RNA提取試劑盒(QIAGEN,目錄號74134)提取RNA。根據說明,通過吸液將0.35ml Buffer RLT Plus與5×105 個細胞混合(如果直接從冷凍細胞中提取RNA,建議細胞用PBS洗滌一次)。將細胞裂解液轉移至gDNA Eliminator旋轉柱(spin column),並在≥8000 g離心30 s。丟棄柱子並保留液體。加入與液體相同體積的70%乙醇。混合後,立即將混合物轉移到RNeasyMinElute旋轉柱中,並在≥8000 g離心15 s,並丟棄廢液。將700μl的緩沖液RW1添加到RNeasyMinElute旋轉柱中,並在≥8000g離心15 s。棄去廢液,加入500μl緩沖液RPE,然後將RNeasyMinElute旋轉柱在≥8000 g離心15 s。丟棄廢液,加入500μl的80%乙醇,然後將RNeasyMinElute旋轉柱在≥8000 g離心2分鐘。廢液被丟棄。將RNeasyMinElute丟柱放入新的2 ml收集柱中,並蓋上蓋在最大速度離心5分鐘以幹燥柱子。將RNeasyMinElute旋轉柱放入新的1.5 ml收集柱中,並將14μl無RNase的水滴加到柱膜的中央,然後將柱子以最大速度離心1分鐘以洗脫RNA。
通過Nanodrop(Thermo,Nanodrop2000)測定提取的RNA的濃度,並將1μg RNA進行逆轉錄(Thermo,逆轉錄酶,目錄號28025013)。逆轉錄體系如表5-6所示。在65℃溫育5分鐘後,立即在冰浴中冷卻逆轉錄體系。在37℃繼續溫育50分鐘。逆轉錄酶在70°C滅活15分鐘。在表7所示的條件下進行PCR。PCR後,取2μl PCR產物用於瓊脂糖凝膠電泳。根據電泳結果,確定PCR產物的濃度,以及條帶大小是否正確。純化後,用PCR產物制備文庫以用於二代測序。
5. 逆轉錄體系-1
  體積(μl)
總RNA(1μg) X
寡聚胸腺嘧啶(Oligo dT) 1
10nM dNTP 1
無RNA酶的水 10-X
總體積 12
65℃,5分鐘,並立即轉移到冰上
6. 逆轉錄體系-2
  體積(ul)
表 5的產物 12μl
5X First-Strand 緩沖液 4
0.1 M DTT 2
RNaseOUT™ 重組核糖核酸酶抑制劑 1
M-MLV 1
總體積 20
7. PCR條件
步驟 時間 循環
98℃ 2min 1個循環
98℃ 15s 28-35個循環
63℃ 30s
72℃ 15s
72℃ 2min 1個循環
本實施例中的酶活性測定:
將GM06214細胞消化,離心並重懸於28μl含有0.1%Triton X-100的1×PBS中,並在冰上裂解30分鐘。然後將25μl細胞裂解液添加到25μl含190μm4-甲基傘形酮-α-L-艾杜糖醛酸酶(4-methylumbelliferyl-α-L-iduronidase,Cayman,2A-19543-500,溶於含有0.2%Triton X-100,pH 3.5的0.4M甲酸鈉緩沖液)中,在暗處於37°C溫育90分鐘。加入pH為10.3的200μl 0.5M NaOH /甘氨酸溶液(北京化工,NAOH,目錄號:AR500G;Solarbio,甘氨酸,目錄號G8200)滅活催化反應。在4°C離心2分鐘後,將其上清液轉移至96孔板,使用Infinite M200儀器(TECAN)測定熒光值。激發光的波長為365nm和450nm。熒光表示酶活性,在圖中表示為GM01323中酶活性的倍數。
如圖36所示,結果是靶向mRNA前體的dRNA引起的酶活性和A至G突變率顯著高於靶向成熟mRNA的那些。因此,以下實施例中使用的dRNA均靶向mRNA前體(pre-mRNA)。
實施例 20. 電轉染化學修飾的 dRNA IDUA- 報道分子細胞系中編輯效率的檢測
如圖37A所示,將側翼分別具有約100bp的IDUA突變位點的序列插入慢病毒質粒上表達mcherry和GFP蛋白的序列之間以構建質粒。將構建的質粒包裝到病毒中,之後用於感染293T細胞。整合到基因組後,選擇IDUA報道分子單克隆細胞。因為單克隆細胞受到插入序列中IDUA突變位點的TAG終止密碼子的影響,所以它們僅表達mcherry蛋白。當細胞被dRNA編輯時,TAG(然後突變為TGG)後的GFP可正常表達。因此,GFP的表達被視為細胞中dRNA的編輯效率。如下表8所示,設計了4種優選的具有從51nt至111nt的不同長度的dRNA。所有的dRNA序列都以CM0模式修飾。在實施例18的電轉染條件下,用不同長度的dRNA電轉染細胞。在轉染後第1天至第7天的每一天,通過確定細胞中GFP的比例初步評價編輯效率。如圖37B所示,編輯效率的峰值出現在第二天(48h)。最高編輯效率的序列是91nt:45-c-45,其高於111nt:55-c-55的編輯效率。因此,並非在所有情況下dRNA越長,編輯效率越高。此外,51nt dRNA的編輯效率很低。
表8
111nt-隨機 SEQ ID NO : 140:uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucucugcuggggaauugc gcgauauucaggauuaaaagaagugc
91nt-隨機 SEQ ID NO : 342: uaauccugaauaucgcgcaauuccccagcagagaacaucgcggugugaacgucccuuuauaccgggcagguauagcugaaaucagc guggc
71nt-隨機 SEQ ID NO : 343:uuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucucugcuggggaauugcgcg aua
51nt-隨機 SEQ ID NO 8:uuccccagcagagaacaucgcggugugaacgucccuuuauaccgggcaggu
55nt-c-55nt SEQ ID NO : 205:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggg gggccgucgccgcguggggucguug
45nt-c-45nt SEQ ID NO : 344:gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgc cgcgu
35nt-c-35nt SEQ ID NO : 345:uguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggcc
25nt-c-25nt SEQ ID NO: 346:ggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcg
實施例 21. 在用不同長度的化學修飾的 dRNA 轉染後在不同時間點,測定 GM06214 細胞中細胞內 IDUA 酶活性和 RNA 編輯效率
使用實施例18中的條件電轉染不同長度的dRNA(參見表8)至GM06214細胞中,和使用實施例19中的方法測定酶活性和編輯效率。在電轉染後的第2、4、6、8、10、12和14日,測試細胞內酶活性。在第2天和第4天,測試細胞中RNA編輯的效率。如圖38A所示,91nt:45-c-45引起最高的酶活性,並且IDUA酶活性一直保持高水平直至電轉染後第6天。在圖38B中,91nt的dRNA和111nt的dRNA呈現大致相同的編輯效率。同樣,51nt的dRNA顯示低的編輯效率。
實施例 22. 篩選化學修飾的 dRNA 的優選序列
通過研究文獻,我們認為電轉染不適合將來的疾病治療。因此,我們將電轉染換成了Lipofectamine RNAiMAX(Invitrogen,目錄號13778-150),用於將dRNA轉染到細胞中。結果表明,Lipofectamine RNAiMAX具有比電轉染更高的轉染效率。首先將序列在兩個末端同時截短,然後固定該序列的一個端,截短另一端。以這種方式,獲得了等長的14個dRNA和4個隨機序列,如下表9所示。所有的dRNA序列都以CM0模式修飾。如圖39所示,在轉染後48小時測定IDUA酶活性(圖39A,使用實施例19中所述的方法)和RNA編輯效率(圖39B,使用NGS)。事實證明,由81nt:55-c-25(SEQ ID NO 24)和71nt:55-c-15(SEQ ID NO 25)引起的IDUA酶活性和RNA編輯效率高於其他dRNA引起的IDUA酶活性和RNA編輯效率。具有較短3'端和較長5'端的dRNA往往具有較高的效率。此外,無論3'或5'端如何變化,當dRNA的長度減少至61nt或更少時,其編輯效率似乎都急劇下降。
表9.
111nt-隨機 SEQ ID NO :140:uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucucugcuggggaauugcgcgauauucaggauuaaaagaagugc
91nt-隨機 SEQ ID NO : 342:uaauccugaauaucgcgcaauuccccagcagagaacaucgcggugugaacgucccuuuauaccgggcagguauagcugaaaucagcguggc
71nt-隨機 SEQ ID NO : 343:uuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucucugcuggggaauugcgcgaua
51nt-隨機 SEQ ID NO 8:uuccccagcagagaacaucgcggugugaacgucccuuuauaccgggcaggu
55nt-c-55nt SEQ ID NO : 205:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
45nt-c-45nt SEQ ID NO : 344:gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcgu
35nt-c-35nt SEQ ID NO : 345:uguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggcc
25nt-c-25nt SEQ ID NO: 346:ggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcg
55nt-c-45nt SEQ ID NO : 347:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcgu
55nt-c-35nt SEQ ID NO : 348:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggcc
55nt-c-25nt SEQ ID NO : 349:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcg
55nt-c-15nt SEQ ID NO : 350:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
55nt-c-5nt SEQ ID NO : 351:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagc
45nt-c-55nt SEQ ID NO : 352:gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
35nt-c-55nt SEQ ID NO: 353:uguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
25nt-c-55nt SEQ ID NO : 354:ggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
15nt-c-55nt SEQ ID NO : 355:ugcgacacuucggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
5nt-c-55nt SEQ ID NO: 356: cggcccagagcugcuccucaucugcggggcgggggggggccgucgccgcguggggucguug
實施例 23. 確定化學修飾的 dRNA 3' 末端的任選長度
在實施例22中,在由具有81nt:55-c-25和71nt:55-c-15序列的dRNA編輯的細胞中檢測到較高的IDUA酶活性和編輯效率。為了找出3'端的最短和最佳長度,將3'端的序列從25nt(81nt:55-c-25)截短至5nt(61nt:55-c-5),如表10所示。所有dRNA序列均以CM0模式修飾。在分別用81nt:55-c-25至66nt:55-c-10的dRNA轉染的細胞(圖40A)和分別用72nt:55-c-16至61nt:55-c-5的dRNA轉染的細胞上(圖40B)進行了兩次IDUA酶活性測定。3'端長度從25nt到9nt的dRNA輕易地將GM06214細胞中的酶促活性提高到GM0123細胞的20倍以上。據此,3'端的最佳長度為25nt-7nt。此外,與3'和5'端的長度相等的45nt-c-45nt相比,3'端較短的dRNA始終具有更高的編輯效率。
本文使用的IDUA酶活性測定描述如下。轉染前一天,將每孔3×105 個細胞鋪板在6孔板中。轉染當天換上新的培養基。使用20nM Lipofectamine RNAiMAX試劑轉染後48小時,將GM06214細胞消化,離心並重懸於33μl含0.1%Triton X-100的1×PBS中,並在冰上裂解30分鐘。然後將裂解液在4℃離心2分鐘。將25μl細胞裂解液添加到25μl含190μM 4-甲基傘形甲醯基-α-L-艾杜糖苷酸酶(4-methylumbelliferyl-α-L-iduronidase,Glycosynth,44076)的底物中,該底物溶解於0.4M含有0.2%Triton X-100(pH 3.5)的甲酸鈉緩沖液,並在黑暗中於37°C溫育30分鐘。加入pH為10.3的200μl 0.5M NaOH/甘氨酸溶液(北京化工,NAOH,目錄號:AR500G;Solarbio,甘氨酸,目錄號:G8200)以滅活催化反應。將其全部上清液用Infinite M200儀器(TECAN)進行檢測。激發光的波長為365nm和450nm。酶活性表示為GM01323中酶活性的倍數。
表10.
55nt-c-25nt SEQ ID NO : 349:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggcg
55nt-c-24nt SEQ ID NO : 357:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggggc
55nt-c-23nt SEQ ID NO: 358:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgggg
55nt-c-22nt SEQ ID NO: 359:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggg
55nt-c-21nt SEQ ID NO: 360:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgg
55nt-c-20nt SEQ ID NO: 361:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
55nt-c-19nt SEQ ID NO: 362:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugc
55nt-c-18nt SEQ ID NO: 363:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucug
55nt-c-17nt SEQ ID NO: 364:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucu
55nt-c-16nt SEQ ID NO: 365:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauc
55nt-c-15nt SEQ ID NO : 350:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
55nt-c-14nt SEQ ID NO: 366:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccuca
55nt-c-13nt SEQ ID NO: 367:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccuc
55nt-c-12nt SEQ ID NO: 368:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccu
55nt-c-11nt SEQ ID NO: 369:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcucc
55nt-c-10nt SEQ ID NO: 370:gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuc
55nt-c-9nt SEQ ID NO: 371: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcu
55nt-c-8nt SEQ ID NO: 372: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugc
55nt-c-7nt SEQ ID NO: 373: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcug
55nt-c-6nt SEQ ID NO: 374: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcu
55nt-c-5nt SEQ ID NO: 375: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagc
random-70nt SEQ ID NO: 376: uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccgcgauguucu
random-67nt SEQ ID NO: 377: uaccgcuacagccacgcugauuucagcuauaccugcccgguauaaagggacguucacaccgcgaug
實施例 24. 3' 端長度固定時確定化學修飾的 dRNA 5' 端最佳長度
在兩種不同長度(76nt:55-c-20和71nt:55-c-15)的dRNA上分別進行5'端截短。如表11所示,其3'端長度固定,5'端逐漸被截短。所有dRNA序列均以CM0模式修飾。如圖41所示,根據IDUA酶活性測定的結果可知,5'端在55nt和45nt之間的dRNA轉染的細胞具有較高的IDUA酶活性。轉染使用Lipofectamine RNAiMAX。根據圖39,當長度減少到小於61nt時,即使是3'和5'末端長度不等的dRNA的編輯效率都大大降低。
表11.
55nt-c-20nt SEQ ID NO:  361: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
50nt-c-20nt SEQ ID NO:378: ccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
45nt-c-20nt SEQ ID NO: 379: gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
40nt-c-20nt SEQ ID NO: 380: guugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
35nt-c-20nt SEQ ID NO: 381: uguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
55nt-c-15nt SEQ ID NO :  350: gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
50nt-c-15nt SEQ ID NO:382: ccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
45nt-c-15nt SEQ ID NO:383: gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
40nt-c-15nt SEQ ID NO:384: guugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
35nt-c-15nt SEQ ID NO: 385: uguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
實施例25. 確定靶向核苷酸位置與化學修飾的dRNA對IDUA突變位點的編輯效率之間的關系
根據以上數據,dRNA的編輯效率與靶向核苷酸在dRNA上的長度和位置有關。通常,靶向核苷酸越靠近5'端,編輯效率越低。因此,在本實施例中,設計了具有3種固定長度的3組dRNA。每組中的dRNA都是通過將靶向核苷酸從序列中間逐漸移向5'末端設計而成的。避開了不容易合成的結構。序列如表12所示。所有dRNA序列均以CM0模式修飾。使用Lipofectamine RNAiMAX將dRNA轉染到GM06214細胞中。48小時後,收獲細胞並根據實施例23中所述的方法測試酶活性。根據如圖42所示的數據,至少當dRNA的總長度固定為67nt,70nt或72nt時,靶向核苷酸的位置變化似乎並不影響代表編輯效率的酶活性。
表12.
長度 C 的位置 序列號 序列
67nt滑動 55nt-c-11nt SEQ ID NO: 369 gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcucc
54nt-c-12nt SEQ ID NO: 386 acgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccu
53nt-c-13nt SEQ ID NO: 387 cgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccuc
52nt-c-14nt SEQ ID NO: 388 gcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccuca
51nt-c-15nt SEQ ID NO: 389 cccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
50nt-c-16nt SEQ ID NO: 390 ccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauc
49nt-c-17nt SEQ ID NO: 391 caccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucu
48nt-c-18nt SEQ ID NO: 392 accgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucug
47nt-c-19nt SEQ ID NO: 393 ccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugc
46nt-c-20nt SEQ ID NO: 394 cgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
45nt-c-21nt SEQ ID NO: 395 gugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgg
44nt-c-22nt SEQ ID NO: 396 ugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggg
43nt-c-23nt SEQ ID NO: 397 gugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgggg
70nt滑動 55nt-c-14nt SEQ ID NO: 366 gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccuca
54nt-c-15nt SEQ ID NO: 398 acgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucau
53nt-c-16nt SEQ ID NO: 399 cgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauc
52nt-c-17nt SEQ ID NO: 400 gcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucu
51nt-c-18nt SEQ ID NO: 401 cccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucug
50nt-c-19nt SEQ ID NO: 402 ccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugc
49nt-c-20nt SEQ ID NO: 403 caccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
48nt-c-21nt SEQ ID NO: 404 accgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgg
47nt-c-22nt SEQ ID NO: 405 ccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggg
46nt-c-23nt SEQ ID NO: 406 cgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgggg
72nt滑動 55nt-c-16nt SEQ ID NO: 365 gacgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucauc
54nt-c-17nt SEQ ID NO: 407 acgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucu
53nt-c-18nt SEQ ID NO: 408 cgcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucug
52nt-c-19nt SEQ ID NO: 409 gcccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugc
51nt-c-20nt SEQ ID NO: 410 cccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcg
50nt-c-21nt SEQ ID NO: 411 ccaccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgg
49nt-c-22nt SEQ ID NO: 412 caccgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcggg
48nt-c-23nt SEQ ID NO: 413 accgugugguugcuguccaggacggucccggccugcgacacuucggcccagagcugcuccucaucugcgggg
實施例 26. 化學修飾對 dRNA 編輯效率的影響
合成RNA的化學修飾增加了RNA穩定性並降低了脫靶的可能性。RNA相對常見的化學修飾是2'-O-甲基化(2'-O-Me)和硫代磷酸酯化連接。具有不同長度:71nt或76nt以及化學修飾的組合的dRNA如表13所示。使用Lipofectamine RNAiMAX用不同的dRNA轉染GM06214細胞,以編輯細胞內IDUA。轉染48小時後收集細胞,並使用實施例23中所示的方法測定IDUA酶活性。根據在圖42A中所示的結果,除CM5外(第五種修飾:除靶向核苷酸和其兩側各5nt外,所有核苷酸均被2'-O-Me修飾),所有修飾均引起良好的酶活性。對靶向核苷酸或與其最臨近的兩個核苷酸進行的修飾不會降低編輯效率。
通過計算A到G的取代率來進一步確定編輯效率。該方法描述如下:在GM06214細胞的IDUA基因中包含靶標腺苷的序列是CTAG,其在使用dRNA進行RNA編輯後被突變為CTGG。CTAG是限制性內切酶BfaI的識別位點。因此,A到G取代成功則不導致被BfaI消化,而野生型被BfaI消化。編輯後,提取GM06214細胞的RNA並逆轉錄為cDNA。使用cDNA進行PCR。引物是hIDUA-62F:CCTTCCTGAGCTACCACCCG(SEQ ID NO:415)和hIDUA-62R:CCAGGGCTCGAACTCGGTAG(SEQ ID NO:416)。PCR後,將產物純化並與BfaI(NEB,目錄號:R0568L)一起溫育。使用瓊脂糖凝膠電泳確定A到G的取代率或編輯效率。通過計算凝膠電泳圖像的灰度值,將結果表示為未切割部分(有A到G取代)相對PCR產物中總核酸的百分比。結果如圖42B所示。這與圖42A中酶活性測定的結果相似。
表13.
名稱 長度 修飾模式 序列
HIV2-76-CM1 55nt-c-20nt CM1: CM0中的修飾,以及所有U均為具有2'-O-Me Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C-C-A-G-A-G-C-Um-G-C-Um-C-C-Um-C-A-Um-C-Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-76-CM2 55nt-c-20nt CM2: CM1中的修飾,且靶向三聯體為CCAm Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C-C-Am-G-A-G-C-Um-G-C-Um-C-C-Um-C-A-Um-C-Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-76-CM3 55nt-c-20nt CM3: CM1中的修飾,且靶向三聯體為CmCA Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-Cm-C-A-G-A-G-C-Um-G-C-Um-C-C-Um-C-A-Um-C-Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-76-CM4 55nt-c-20nt CM4: CM1中的修飾,且靶向三聯體為C*C*A* Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C*C*A*G-A-G-C-Um-G-C-Um-C-C-Um-C-A-Um-C-Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-76-CM5 55nt-c-20nt CM5: CM1中的修飾,以及除靶向核苷酸及其每一側的各5nt之外全部有2'-O-Me的所有核苷酸 Gm*Am*Cm*Gm-Cm-Cm-Cm-Am-Cm-Cm-Gm-Um-Gm-Um-Gm-Gm-Um-Um-Gm-Cm-Um-Gm-Um-Cm-Cm-Am-Gm-Gm-Am-Cm-Gm-Gm-Um-Cm-Cm-Cm-Gm-Gm-Cm-Cm-Um-Gm-Cm-Gm-Am-Cm-Am-Cm-Um-Um-C-G-G-C-C-C-A-G-A-G-C-Um-Gm-Cm-Um-Cm-Cm-Um-Cm-Am-Um-Cm-Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-76-CM6 55nt-c-20nt CM6: 每個末端的5個末端堿基為具有2'-O-Me,且首尾各5個核苷酸間連接為硫代磷酸酯化的 Gm*Am*Cm*Gm*Cm*C-C-A-C-C-G-U-G-U-G-G-U-U-G-C-U-G-U-C-C-A-G-G-A-C-G-G-U-C-C-C-G-G-C-C-U-G-C-G-A-C-A-C-U-U-C-G-G-C-C-C-A-G-A-G-C-U-G-C-U-C-C-U-C-A-U*Cm*Um*Gm*Cm*Gm (SEQ ID NO: 361)
HIV2-71-CM1 55nt-c-15nt CM1: CM0中的修飾,以及所有U均為具有2'-Me Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C-C-A-G-A-G-C-Um-G-C-Um-C-C-Um*Cm*Am*Um (SEQ ID NO: 350)
HIV2-71-CM2 55nt-c-15nt CM2: CM1中的修飾,且靶向三聯體為CCAm Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C-C-Am-G-A-G-C-Um-G-C-Um-C-C-Um*Cm*Am*Um (SEQ ID NO: 350)
HIV2-71-CM3 55nt-c-15nt CM3: CM1中的修飾,且靶向三聯體為CmCA Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-Cm-C-A-G-A-G-C-Um-G-C-Um-C-C-Um*Cm*Am*Um (SEQ ID NO: 350)
HIV2-71-CM4 55nt-c-15nt CM4: CM1中的修飾,且靶向三聯體為C*C*A* Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C*C*A*G-A-G-C-Um-G-C-Um-C-C-Um*Cm*Am*Um (SEQ ID NO: 350)
HIV2-71-CM5 55nt-c-15nt CM5: CM1中的修飾,以及除靶向核苷及其每側的各5nt之外所有核苷酸為具有2'-O-Me Gm*Am*Cm*Gm-Cm-Cm-Cm-Am-Cm-Cm-Gm-Um-Gm-Um-Gm-Gm-Um-Um-Gm-Cm-Um-Gm-Um-Cm-Cm-Am-Gm-Gm-Am-Cm-Gm-Gm-Um-Cm-Cm-Cm-Gm-Gm-Cm-Cm-Um-Gm-Cm-Gm-Am-Cm-Am-Cm-Um-Um-C-G-G-C-C-C-A-G-A-G-C-Um-Gm-Cm-Um-Cm-Cm-Um*Cm*Am*Um (SEQ ID NO: 350)
HIV2-71-CM6 55nt-c-15nt CM6: 在每個末端的各5個末端堿基為具有2'-O-Me,且首尾各5個核苷酸間連接為硫代磷酸酯化的 Gm*Am*Cm*Gm*Cm*C-C-A-C-C-G-U-G-U-G-G-U-U-G-C-U-G-U-C-C-A-G-G-A-C-G-G-U-C-C-C-G-G-C-C-U-G-C-G-A-C-A-C-U-U-C-G-G-C-C-C-A-G-A-G-C-U-G-C-U-C*Cm*Um*Cm*Am*Um (SEQ ID NO: 350)
注:“m”指核苷酸核糖上的2'-O-Me,“*”是指硫代磷酸酯化連接。
實施例 27. 對修飾模式的進一步驗證
在另一序列上對CM1的修飾模式進行了測試。使用現有技術中優選的修飾模式作為對照。如表14所示,測試序列為55nt-c-15nt-CM1,36nt-c-13nt-CM11為陽性對照,其除編輯三聯體“CCA”外,所有核苷酸均被2'-O-Me修飾,並且首尾各四個核苷酸間連接被硫代磷酸酯化。另外,36nt-c-13nt-CM11僅為51nt,這在本發明中不是優選的長度,而在現有技術中是一種優選的長度。使用LipofectamineRNAiMAX將dRNA轉染至GM06214細胞48小時後,使用實施例23所示的方法檢測IDUA酶活性。如圖44所示,55nt-c-15nt-CM1具有比36nt-c-13nt-CM11顯著更高的編輯效率。
表14.
名稱 修飾模式 序列
55nt-c-15nt-CM1 CM1   Gm*Am*Cm*G-C-C-C-A-C-C-G-Um-G-Um-G-G-Um-Um-G-C-Um-G-Um-C-C-A-G-G-A-C-G-G-Um-C-C-C-G-G-C-C-Um-G-C-G-A-C-A-C-Um-Um-C-G-G-C-C-C-A-G-A-G-C-Um-G-C-Um-C-C-Um*Cm*Am *Um(SEQ ID NO: 366)
36nt-c-13nt-CM11 CM11: 除靶向三聯體CroCroAro以外的所有核苷酸均被2-O'-Me修飾,且首尾各4個核苷酸間連接為硫代磷酸酯化的 Cm*Um*Gm*Um*Cm-Cm-Am-Gm-Gm-Am-Cm-Gm-Gm-Um-Cm-Cm-Cm-Gm-Gm-Cm-Cm-Um-Gm-Cm-Gm-Am-Cm-Am-Cm-Um-Um-Cm-Gm-Gm-Cm-C-C-A-Gm-Am-Gm-Cm-Um-Gm-Cm-Um*Cm*Cm*Um*Cm (SEQ ID NO: 414)
注:“m”指核苷酸核糖上的2-O'-Me,“*”是指硫代磷酸酯化連接。
實施例28. 在其它細胞中進一步測試dRNA
該實施例著重於使用LEAPER技術修複USH2A c.11864 G> A(p.Trp3955 *)突變。在此實施例中設計的報道系統如圖45A所示。在USH2A c.11864 G> A(p.Trp3955 *)的情況下,正常的TGG序列被突變為中止密碼子TAG。因此,突變的mRNA的翻譯會在該TAG處提前終止。293T(293T細胞來自北京大學C.Zhang的實驗室)報道系統是一種慢病毒載體,如圖45A所示的mRNA由CMV啟動子驅動。該系統包括以下部分:1)可穩定表達的mCherry紅色熒光蛋白,2)USH2A基因的突變位點及其兩側相鄰的100個堿基對,3)GFP綠色熒光蛋白。成功編輯突變位點時,TAG密碼子將轉換為TIG,從而允許翻譯繼續進行,並且USH2A序列後的GFP可以正常翻譯。因此,GFP的表達代表了編輯效率。
dRNA在體外合成。該實施例中使用的所有dRNA序列如表15所示。所有dRNA序列均以CM0模式修飾。測試的具體步驟如下:
293T報告細胞在含10%FBS(Vistech,SE100-011)的DMEM(Hyclone SH30243.01)中培養。匯合時,將細胞以15,000個細胞/孔轉移到12孔板中。時間記錄為0小時。
在24小時,使用Lipofectamine RNAiMAX試劑(Invitrogen 13778150)用12.5pmol的dRNA轉染各孔中的293T細胞。轉染方案由產品手冊提供。
在72小時,用胰蛋白酶(Invitrogen,13778-150)消化每個孔中的細胞,並使用流式細胞儀檢測FITC(異硫氰酸熒光素)的強度。
如圖45B所示為3'和5'端長度相等的dRNA在細胞中的編輯效率。NC代表沒有dRNA轉染的對照細胞。根據上述實施例,用111nt,91nt和71nt的dRNA轉染的細胞GFP陽性率超過90%,而用51nt dRNA轉染的細胞引起的GFP陽性率非常低。由左側的MFI(平均熒光強度)數據,111nt dRNA引起的熒光強度最高。
如圖45C所示,分別將3'和5'端長度不同的dRNA和3'和5'端相等的111nt dRNA分別轉染到細胞中。如本實施例中所使用的,具有55nt 5'端的dRNA,其3'端為55nt,45nt,35nt,25nt或5nt。類似地,具有55nt 3'末端的dRNA,其5'端為55nt,45nt,35nt,25nt或5nt。根據圖45C的結果,當dRNA的長度減少到61nt時,編輯效率急劇下降,而較長的dRNA具有明顯更高的編輯效率。其中,55nt-c-25nt的dRNA具有最高的編輯效率。因此,將dRNA的3'端固定為25nt,而5'端的長度則從55nt到25nt。用這些dRNA轉染的細胞的結果顯示在圖45D中。有來自兩個不同批次的兩個55nt-c-25nt的dRNA。顯然5'端越短,編輯效率越低。另外,圖45D中的結果再次表明,為了確保編輯效率,dRNA的長度優選地不小於61nt。
表15.
長度 序列號 序列
55nt-C-55nt SEQ ID NO: 414 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
45nt-C-45nt SEQ ID NO: 415 gcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgau
35nt-C-35nt SEQ ID NO: 416 cuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcu
25nt-C-25nt SEQ ID NO: 417 agcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
55nt-C-45nt SEQ ID NO: 418 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgau
55nt-C-35nt SEQ ID NO: 419 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcu
55nt-C-25nt SEQ ID NO: 420 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
55nt-C-15nt SEQ ID NO: 421 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacug
55nt-C-5nt SEQ ID NO: 422 agcccaaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacaga
45nt-C-55nt SEQ ID NO: 423 gcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
35nt-C-55nt SEQ ID NO: 424 cuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
25nt-C-55nt SEQ ID NO: 425 agcuuccagaguuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
15nt-C-55nt SEQ ID NO: 426 guuuguguuaaugaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
5nt-C-55nt SEQ ID NO: 427 augaccacagacucuccacugaacccuuggaguuacaggcucugacccgauauucguagag
50nt-C-25nt SEQ ID NO: 428 aaggagcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
45nt-C-25nt SEQ ID NO: 429 gcuggaaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
40-C-25nt SEQ ID NO: 430 aaaaucuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
35nt-C-25nt SEQ ID NO: 431 cuugagguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
30-C-25nt SEQ ID NO: 432 gguggagcuuccagaguuuguguuaaugaccacagacucuccacugaacccuugga
ADAR1(p110) Cdna
5’-atggccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggctaaaaatattggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctatagacaagggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaatacgaacagtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaatatacccacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataaagttagaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctcaaaagcagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatccgcgcagcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcaccctacaagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagtcaaacctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcatcaatggccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagccatgacaattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacagagaaagaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagccccgtcaccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggccctgcccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagcaagaaagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatggcttctgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtcaggaagattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctcccatggctttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaaagttgggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcggctctccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacaggggccagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactggcagcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccctccttgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagcttgggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgcagaaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcgaaggatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtatatcagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacagaatcccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggcacaatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccatgtcctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagcccatttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgtgacaagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagagtcagcatatatgattccaaaaggcaatccgggaagactaaggagacaagcgtcaactggtgtctggctgatggctatgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaaaaagaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggtgaggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggctatgggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagtagattacaaggatgacgacgataag( 標記標簽 ) TAG-3’ (SEQ ID NO:332)
ADAR1(p150) cDNA
5’atgaatccgcggcaggggtattccctcagcggatactacacccatccatttcaaggctatgagcacagacagctcagataccagcagcctgggccaggatcttcccccagtagtttcctgcttaagcaaatagaatttctcaaggggcagctcccagaagcaccggtgattggaaagcagacaccgtcactgccaccttccctcccaggactccggccaaggtttccagtactacttgcctccagtaccagaggcaggcaagtggacatcaggggtgtccccaggggcgtgcatctcggaagtcaggggctccagagagggttccagcatccttcaccacgtggcaggagtctgccacagagaggtgttgattgcctttcctcacatttccaggaactgagtatctaccaagatcaggaacaaaggatcttaaagttcctggaagagcttggggaagggaaggccaccacagcacatgatctgtctgggaaacttgggactccgaagaaagaaatcaatcgagttttatactccctggcaaagaagggcaagctacagaaagaggcaggaacaccccctttgtggaaaatcgcggtctccactcaggcttggaaccagcacagcggagtggtaagaccagacggtcatagccaaggagccccaaactcagacccgagtttggaaccggaagacagaaactccacatctgtctcagaagatcttcttgagccttttattgcagtctcagctcaggcttggaaccagcacagcggagtggtaagaccagacagtcatagccaaggatccccaaactcagacccaggtttggaacctgaagacagcaactccacatctgccttggaagatcctcttgagtttttagacatggccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggctaaaaatattggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctatagacaagggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaatacgaacagtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaatatacccacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataaagttagaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctcaaaagcagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatccgcgcagcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcaccctacaagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagtcaaacctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcatcaatggccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagccatgacaattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacagagaaagaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagccccgtcaccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggccctgcccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagcaagaaagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatggcttctgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtcaggaagattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctcccatggctttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaaagttgggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcggctctccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacaggggccagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactggcagcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccctccttgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagcttgggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgcagaaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcgaaggatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtatatcagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacagaatcccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggcacaatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccatgtcctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagcccatttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgtgacaagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagagtcagcatatatgattccaaaaggcaatccgggaagactaaggagacaagcgtcaactggtgtctggctgatggctatgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaaaaagaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggtgaggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggctatgggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagtagattacaaggatgacgacgataaG( 標記標簽 ) TAG-3’ (SEQ ID NO:333)
ADAR2 cDNA
5’-atggatatagaagatgaagaaaacatgagttccagcagcactgatgtgaaggaaaaccgcaatctggacaacgtgtcccccaaggatggcagcacacctgggcctggcgagggctctcagctctccaatgggggtggtggtggccccggcagaaagcggcccctggaggagggcagcaatggccactccaagtaccgcctgaagaaaaggaggaaaacaccagggcccgtcctccccaagaacgccctgatgcagctgaatgagatcaagcctggtttgcagtacacactcctgtcccagactgggcccgtgcacgcgcctttgtttgtcatgtctgtggaggtgaatggccaggtttttgagggctctggtcccacaaagaaaaaggcaaaactccatgctgctgagaaggccttgaggtctttcgttcagtttcctaatgcctctgaggcccacctggccatggggaggaccctgtctgtcaacacggacttcacatctgaccaggccgacttccctgacacgctcttcaatggttttgaaactcctgacaaggcggagcctcccttttacgtgggctccaatggggatgactccttcagttccagcggggacctcagcttgtctgcttccccggtgcctgccagcctagcccagcctcctctccctgccttaccaccattcccacccccgagtgggaagaatcccgtgatgatcttgaacgaactgcgcccaggactcaagtatgacttcctctccgagagcggggagagccatgccaagagcttcgtcatgtctgtggtcgtggatggtcagttctttgaaggctcggggagaaacaagaagcttgccaaggcccgggctgcgcagtctgccctggccgccatttttaacttgcacttggatcagacgccatctcgccagcctattcccagtgagggtcttcagctgcatttaccgcaggttttagctgacgctgtctcacgcctggtcctgggtaagtttggtgacctgaccgacaacttctcctcccctcacgctcgcagaaaagtgctggctggagtcgtcatgacaacaggcacagatgttaaagatgccaaggtgataagtgtttctacaggaacaaaatgtattaatggtgaatacatgagtgatcgtggccttgcattaaatgactgccatgcagaaataatatctcggagatccttgctcagatttctttatacacaacttgagctttacttaaataacaaagatgatcaaaaaagatccatctttcagaaatcagagcgaggggggtttaggctgaaggagaatgtccagtttcatctgtacatcagcacctctccctgtggagatgccagaatcttctcaccacatgagccaatcctggaagaaccagcagatagacacccaaatcgtaaagcaagaggacagctacggaccaaaatagagtctggtgaggggacgattccagtgcgctccaatgcgagcatccaaacgtgggacggggtgctgcaaggggagcggctgctcaccatgtcctgcagtgacaagattgcacgctggaacgtggtgggcatccagggatccctgctcagcattttcgtggagcccatttacttctcgagcatcatcctgggcagcctttaccacggggaccacctttccagggccatgtaccagcggatctccaacatagaggacctgccacctctctacaccctcaacaagcctttgctcagtggcatcagcaatgcagaagcacggcagccagggaaggcccccaacttcagtgtcaactggacggtaggcgactccgctattgaggtcatcaacgccacgactgggaaggatgagctgggccgcgcgtcccgcctgtgtaagcacgcgttgtactgtcgctggatgcgtgtgcacggcaaggttccctcccacttactacgctccaagattaccaaacccaacgtgtaccatgagtccaagctggcggcaaaggagtaccaggccgccaaggcgcgtctgttcacagccttcatcaaggcggggctgggggcctgggtggagaagcccaccgagcaggaccagttctcactcacgcccgattacaaggatgacgacgataag( 標記標簽 ) TAG-3’ (SEQ ID NO:334)
疾病相關基因的編碼序列( CDS
COL3A1
5’-atgatgagctttgtgcaaaaggggagctggctacttctcgctctgcttcatcccactattattttggcacaacaggaagctgttgaaggaggatgttcccatcttggtcagtcctatgcggatagagatgtctggaagccagaaccatgccaaatatgtgtctgtgactcaggatccgttctctgcgatgacataatatgtgacgatcaagaattagactgccccaacccagaaattccatttggagaatgttgtgcagtttgcccacagcctccaactgctcctactcgccctcctaatggtcaaggacctcaaggccccaagggagatccaggccctcctggtattcctgggagaaatggtgaccctggtattccaggacaaccagggtcccctggttctcctggcccccctggaatctgtgaatcatgccctactggtcctcagaactattctccccagtatgattcatatgatgtcaagtctggagtagcagtaggaggactcgcaggctatcctggaccagctggccccccaggccctcccggtccccctggtacatctggtcatcctggttcccctggatctccaggataccaaggaccccctggtgaacctgggcaagctggtccttcaggccctccaggacctcctggtgctataggtccatctggtcctgctggaaaagatggagaatcaggtagacccggacgacctggagagcgaggattgcctggacctccaggtatcaaaggtccagctgggatacctggattccctggtatgaaaggacacagaggcttcgatggacgaaatggagaaaagggtgaaacaggtgctcctggattaaagggtgaaaatggtcttccaggcgaaaatggagctcctggacccatgggtccaagaggggctcctggtgagcgaggacggccaggacttcctggggctgcaggtgctcggggtaatgacggtgctcgaggcagtgatggtcaaccaggccctcctggtcctcctggaactgccggattccctggatcccctggtgctaagggtgaagttggacctgcagggtctcctggttcaaatggtgcccctggacaaagaggagaacctggacctcagggacacgctggtgctcaaggtcctcctggccctcctgggattaatggtagtcctggtggtaaaggcgaaatgggtcccgctggcattcctggagctcctggactgatgggagcccggggtcctccaggaccagccggtgctaatggtgctcctggactgcgaggtggtgcaggtgagcctggtaagaatggtgccaaaggagagcccggaccacgtggtgaacgcggtgaggctggtattccaggtgttccaggagctaaaggcgaagatggcaaggatggatcacctggagaacctggtgcaaatgggcttccaggagctgcaggagaaaggggtgcccctgggttccgaggacctgctggaccaaatggcatcccaggagaaaagggtcctgctggagagcgtggtgctccaggccctgcagggcccagaggagctgctggagaacctggcagagatggcgtccctggaggtccaggaatgaggggcatgcccggaagtccaggaggaccaggaagtgatgggaaaccagggcctcccggaagtcaaggagaaagtggtcgaccaggtcctcctgggccatctggtccccgaggtcagcctggtgtcatgggcttccccggtcctaaaggaaatgatggtgctcctggtaagaatggagaacgaggtggccctggaggacctggccctcagggtcctcctggaaagaatggtgaaactggacctcagggacccccagggcctactgggcctggtggtgacaaaggagacacaggaccccctggtccacaaggattacaaggcttgcctggtacaggtggtcctccaggagaaaatggaaaacctggggaaccaggtccaaagggtgatgccggtgcacctggagctccaggaggcaagggtgatgctggtgcccctggtgaacgtggacctcctggattggcaggggccccaggacttagaggtggagctggtccccctggtcccgaaggaggaaagggtgctgctggtcctcctgggccacctggtgctgctggtactcctggtctgcaaggaatgcctggagaaagaggaggtcttggaagtcctggtccaaagggtgacaagggtgaaccaggcggtccaggtgctgatggtgtcccagggaaagatggcccaaggggtcctactggtcctattggtcctcctggcccagctggccagcctggagataagggtgaaggtggtgcccccggacttccaggtatagctggacctcgtggtagccctggtgagagaggtgaaactggccctccaggacctgctggtttccctggtgctcctggacagaatggtgaacctggtggtaaaggagaaagaggggctccgggtgagaaaggtgaaggaggccctcctggagttgcaggaccccctggaggttctggacctgctggtcctcctggtccccaaggtgtcaaaggtgaacgtggcagtcctggtggacctggtgctgctggcttccctggtgctcgtggtcttcctggtcctcctggtagtaatggtaacccaggacccccaggtcccagcggttctccaggcaaggatgggcccccaggtcctgcgggtaacactggtgctcctggcagccctggagtgtctggaccaaaaggtgatgctggccaaccaggagagaagggatcgcctggtgcccagggcccaccaggagctccaggcccacttgggattgctgggatcactggagcacggggtcttgcaggaccaccaggcatgccaggtcctaggggaagccctggccctcagggtgtcaagggtgaaagtgggaaaccaggagctaacggtctcagtggagaacgtggtccccctggaccccagggtcttcctggtctggctggtacagctggtgaacctggaagagatggaaaccctggatcagatggtcttccaggccgagatggatctcctggtggcaagggtgatcgtggtgaaaatggctctcctggtgcccctggcgctcctggtcatccaggcccacctggtcctgtcggtccagctggaaagagtggtgacagaggagaaagtggccctgctggccctgctggtgctcccggtcctgctggttcccgaggtgctcctggtcctcaaggcccacgtggtgacaaaggtgaaacaggtgaacgtggagctgctggcatcaaaggacatcgaggattccctggtaatccaggtgccccaggttctccaggccctgctggtcagcagggtgcaatcggcagtccaggacctgcaggccccagaggacctgttggacccagtggacctcctggcaaagatggaaccagtggacatccaggtcccattggaccaccagggcctcgaggtaacagaggtgaaagaggatctgagggctccccaggccacccagggcaaccaggccctcctggacctcctggtgcccctggtccttgctgtggtggtgttggagccgctgccattgctgggattggaggtgaaaaagctggcggttttgccccgtattatggagatgaaccaatggatttcaaaatcaacaccgatgagattatgacttcactcaagtctgttaatggacaaatagaaagcctcattagtcctgatggttctcgtaaaaaccccgctagaaactgcagagacctgaaattctgccatcctgaactcaagagtggagaatactg ggttgaccctaaccaaggatgcaaattggatgctatcaaggtattctgtaatatggaaactggggaaacatgcataagtgccaatcctttgaatgttccacggaaacactggtggacagattctagtgctgagaagaaacacgtttggtttggagagtccatggatggtggttttcagtttagctacggcaatcctgaacttcctgaagatgtccttgatgtgcagctggcattccttcgacttctctccagccgagcttcccagaacatcacatatcactgcaaaaatagcattgcatacatggatcaggccagtggaaatgtaaagaaggccctgaagctgatggggtcaaatgaaggtgaattcaaggctgaaggaaatagcaaattcacctacacagttctggaggatggttgcacgaaacacactggggaatggagcaaaacagtctttgaatatcgaacacgcaaggctgtgagactacctattgtagatattgcaccctatgacattggtggtcctgatcaagaatttggtgtggacgttggccctgtttgctttttataa-3’ (SEQ ID NO:335)
BMPR2
5’-atgacttcctcgctgcagcggccctggcgggtgccctggctaccatggaccatcctgctggtcagcgctgcggctgcttcgcagaatcaagaacggctatgtgcgtttaaagatccgtatcagcaagaccttgggataggtgagagtagaatctctcatgaaaatgggacaatattatgctcgaaaggtagcacctgctatggcctttgggagaaatcaaaaggggacataaatcttgtaaaacaaggatgttggtctcacattggagatccccaagagtgtcactatgaagaatgtgtagtaactaccactcctccctcaattcagaatggaacataccgtttctgctgttgtagcacagatttatgtaatgtcaactttactgagaattttccacctcctgacacaacaccactcagtccacctcattcatttaaccgagatgagacaataatcattgctttggcatcagtctctgtattagctgttttgatagttgccttatgctttggatacagaatgttgacaggagaccgtaaacaaggtcttcacagtatgaacatgatggaggcagcagcatccgaaccctctcttgatctagataatctgaaactgttggagctgattggccgaggtcgatatggagcagtatataaaggctccttggatgagcgtccagttgctgtaaaagtgttttcctttgcaaaccgtcagaattttatcaacgaaaagaacatttacagagtgcctttgatggaacatgacaacattgcccgctttatagttggagatgagagagtcactgcagatggacgcatggaatatttgcttgtgatggagtactatcccaatggatctttatgcaagtatttaagtctccacacaagtgactg ggtaagctcttgccgtcttgctcattctgttactagaggactggcttatcttcacacagaattaccacgaggagatcattataaacctgcaatttcccatcgagatttaaacagcagaaatgtcctagtgaaaaatgatggaacctgtgttattagtgactttggactgtccatgaggctgactggaaatagactggtgcgcccaggggaggaagataatgcagccataagcgaggttggcactatcagatatatggcaccagaagtgctagaaggagctgtgaacttgagggactgtgaatcagctttgaaacaagtagacatgtatgctcttggactaatctattgggagatatttatgagatgtacagacctcttcccaggggaatccgtaccagagtaccagatggcttttcagacagaggttggaaaccatcccacttttgaggatatgcaggttctcgtgtctagggaaaaacagagacccaagttcccagaagcctggaaagaaaatagcctggcagtgaggtcactcaaggagacaatcgaagactgttgggaccaggatgcagaggctcggcttactgcacagtgtgctgaggaaaggatggctgaacttatgatgatttgggaaagaaacaaatctgtgagcccaacagtcaatccaatgtctactgctatgcagaatgaacgcaacctgtcacataataggcgtgtgccaaaaattggtccttatccagattattcttcctcctcatacattgaagactctatccatcatactgacagcatcgtgaagaatatttcctctgagcattctatgtccagcacacctttgactataggggaaaaaaaccgaaattcaattaactatgaacgacagcaagcacaagctcgaatccccagccctgaaacaagtgtcaccagcctctccaccaacacaacaaccacaaacaccacaggactcacgccaagtactggcatgactactatatctgagatgccatacccagatgaaacaaatctgcataccacaaatgttgcacagtcaattgggccaacccctgtctgcttacagctgacagaagaagacttggaaaccaacaagctagacccaaaagaagttgataagaacctcaaggaaagctctgatgagaatctcatggagcactctcttaaacagttcagtggcccagacccactgagcagtactagttctagcttgctttacccactcataaaacttgcagtagaagcaactggacagcaggacttcacacagactgcaaatggccaagcatgtttgattcctgatgttctgcctactcagatctatcctctccccaagcagcagaaccttcccaagagacctactagtttgcctttgaacaccaaaaattcaacaaaagagccccggctaaaatttggcagcaagcacaaatcaaacttgaaacaagtcgaaactggagttgccaagatgaatacaatcaatgcagcagaacctcatgtggtgacagtcaccatgaatggtgtggcaggtagaaaccacagtgttaactcccatgctgccacaacccaatatgccaatgggacagtactatctggccaaacaaccaacatagtgacacatagggcccaagaaatgttgcagaatcagtttattggtgaggacacccggctgaatattaattccagtcctgatgagcatgagcctttactgagacgagagcaacaagctggccatgatgaaggtgttctggatcgtcttgtggacaggagggaacggccactagaaggtggccgaactaattccaataacaacaacagcaatccatgttcagaacaagatgttcttgcacagggtgttccaagcacagcagcagatcctgggccatcaaagcccagaagagcacagaggcctaattctctggatctttcagccacaaatgtcctggatggcagcagtatacagataggtgagtcaacacaagatggcaaatcaggatcaggtgaaaagatcaagaaacgtgtgaaaactccctattctcttaagcggtggcgcccctccacctgggtcatctccactgaatcgctggactgtgaagtcaacaataatggcagtaacagggcagttcattccaaatccagcactgctgtttaccttgcagaaggaggcactgctacaaccatggtgtctaaagatataggaatgaactgtctgtga-3’ (SEQ ID NO:336)
AHI1
5’-atgcctacagctgagagtgaagcaaaagtaaaaaccaaagttcgctttgaagaattgcttaagacccacagtgatctaatgcgtgaaaagaaaaaactgaagaaaaaacttgtcaggtctgaagaaaacatctcacctgacactattagaagcaatcttcactatatgaaagaaactacaagtgatgatcccgacactattagaagcaatcttccccatattaaagaaactacaagtgatgatgtaagtgctgctaacactaacaacctgaagaagagcacgagagtcactaaaaacaaattgaggaacacacagttagcaactgaaaatcctaatggtgatgctagtgtagaggaagacaaacaaggaaagccaaataaaaaggtgataaagacggtgccccagttgactacacaagacctgaaaccggaaactcctgagaataaggttgattctacacaccagaaaacacatacaaagccacagccaggcgttgatcatcagaaaagtgagaaggcaaatgagggaagagaagagactgatttagaagaggatgaagaattgatgcaagcatatcagtgccatgtaactgaagaaatggcaaaggagattaagaggaaaataagaaagaaactgaaagaacagttgacttactttccctcagatactttattccatgatgacaaactaagcagtgaaaaaaggaaaaagaaaaaggaagttccagtcttctctaaagctgaaacaagtacattgaccatctctggtgacacagttgaaggtgaacaaaagaaagaatcttcagttagatcagtttcttcagattctcatcaagatgatgaaataagctcaatggaacaaagcacagaagacagcatgcaagatgatacaaaacctaaaccaaaaaaaacaaaaaagaagactaaagcagttgcagataataatgaagatgttgatggtgatggtgttcatgaaataacaagccgagatagcccggtttatcccaaatgtttgcttgatgatgaccttgtcttgggagtttacattcaccgaactgatagacttaagtcagattttatgatttctcacccaatggtaaaaattcatgtggttgatgagcatactggtcaatatgtcaagaaagatgatagtggacggcctgtttcatcttactatgaaaaagagaatgtggattatattcttcctattatgacccagccatatgattttaaacagttaaaatcaagacttccagagtgggaagaacaaattgtatttaatgaaaattttccctatttgcttcgaggctctgatgagagtcctaaagtcatcctgttctttgagattcttgatttcttaagcgtggatgaaattaagaataattctgaggttcaaaaccaagaatgtggctttcggaaaattgcctgggcatttcttaagcttctgggagccaatggaaatgcaaacatcaactcaaaacttcgcttgcagctatattacccacctactaagcctcgatccccattaagtgttgttgaggcatttgaatggtggtcaaaatgtccaagaaatcattacccatcaacactgtacgtaactgtaagaggactgaaagttccagactgtataaagccatcttaccgctctatgatggctcttcaggaggaaaaaggtaaaccagtgcattgtgaacgtcaccatgagtcaagctcagtagacacagaacctggattagaagagtcaaaggaagtaataaagtggaaacgactccctgggcaggcttgccgtatcccaaacaaacacctcttctcactaaatgcaggagaacgaggatgtttttgtcttgatttctcccacaatggaagaatattagcagcagcttgtgccagccgggatggatatccaattattttatatgaaattccttctggacgtttcatgagagaattgtgtggccacctcaatatcatttatgatctttcctggtcaaaagatgatcactacatccttacttcatcatctgatggcactgccaggatatggaaaaatgaaataaacaatacaaatactttcagagttttacctcatccttcttttgtttacacggctaaattccatccagctgtaagagagctagtagttacaggatgctatgattccatgatacggatatg gaaagttgagatgagagaagattctgccatattggtccgacagtttgacgttcacaaaagttttatcaactcactttgttttgatactgaaggtcatcatatgtattcaggagattgtacaggggtgattgttgtttggaatacctatgtcaagattaatgatttggaacattcagtgcaccactggactataaataaggaaattaaagaaactgagtttaagggaattccaataagttatttggagattcatcccaatggaaaacgtttgttaatccataccaaagacagtactttgagaattatggatctccggatattagtagcaaggaagtttgtaggagcagcaaattatcgggagaagattcatagtactttgactccatgtgggacttttctgtttgctggaagtgaggatggtatagtgtatgtttggaacccagaaacaggagaacaagtagccatgtattctgacttgccattcaagtcacccattcgagacatttcttatcatccatttgaaaatatggttgcattctgtgcatttgggcaaaatgagccaattcttctgtatatttacgatttccatgttgcccagcaggaggctgaaatgttcaaacgctacaatggaacatttccattacctggaatacaccaaagtcaagatgccctatgtacctgtccaaaactaccccatcaaggctcttttcagattgatgaatttgtccacactgaaagttcttcaacgaagatgcagctagtaaaacagaggcttgaaactgtcacagaggtgatacgttcctgtgctgcaaaagtcaacaaaaatctctcatttacttcaccaccagcagtttcctcacaacagtctaagttaaagcagtcaaacatgctgaccgctcaagagattctacatcagtttggtttcactcagaccgggattatcagcatagaaagaaagccttgtaaccatcaggtagatacagcaccaacggtagtggctctttatgactacacagcgaatcgatcagatgaactaaccatccatcgcggagacattatccgagtgtttttcaaagataatgaagactggtggtatggcagcataggaaagggacaggaaggttattttccagctaatcatgtggctagtgaaacactgtatcaagaactgcctcctgagataaaggagcgatcccctcctttaagccctgaggaaaaaactaaaatagaaaaatctccagctcctcaaaagcaatcaatcaataagaacaagtcccaggacttcagactaggctcagaatctatgacacattctgaaatgagaaaagaacagagccatgaggaccaaggacacataatggatacacggatgaggaagaacaagcaagcaggcagaaaagtcactctaatagagta-3’ (SEQ ID NO:337)
FANCC
5’-atggctcaagattcagtagatctttcttgtgattatcagttttggatgcagaagctttctgtatgggatcaggcttccactttggaaacccagcaagacacctgtcttcacgtggctcagttccaggagttcctaaggaagatgtatgaagccttgaaagagatggattctaatacagtcattgaaagattccccacaattggtcaactgttggcaaaagcttgttggaatccttttattttagcatatgatgaaagccaaaaaattctaatatggtgcttatgttgtctaattaacaaagaaccacagaattctggacaatcaaaacttaactcctggatacagggtgtattatctcatatactttcagcactcagatttgataaagaagttgctcttttcactcaaggtcttgggtatgcacctatagattactatcctggtttgcttaaaaatatggttttatcattagcgtctgaactcagagagaatcatcttaatggatttaacactcaaaggcgaatggctcccgagcgagtggcgtccctgtcacgagtttgtgtcccacttattaccctgacagatgttgaccccctggtggaggctctcctcatctgtcatggacgtgaacctcaggaaatcctccagccagagttctttgaggctgtaaacgaggccattttgctgaagaagatttctctccccatgtcagctgtagtctgcctctggcttcggcaccttcccagccttgaaaaagcaatgctgcatctttttgaaaagctaatctccagtgagagaaattgtctgagaaggatcgaatgctttataaaagattcatcgctgcctcaagcagcctgccaccctgccatattccgggttgttgatgagatgttcaggtgtgcactcctggaaaccgatggggccctggaaatcatagccactattcaggtgtttacgcagtgctttgtagaagctctggagaaagcaagcaagcagctgcggtttgcactcaagacctactttccttacacttctccatctcttgccatggtgctgctgcaagaccctcaagatatccctcggggacactggctccagacactgaagcatatttctgaactgctcagagaagcagttgaagaccagactcatgggtcctgcggaggtccctttgagagctggttcctgttcattcacttcggaggatgggctgagatggtggcagagcaattactgatgtcggcagccgaaccccccacggccctgctgtggctcttggccttctactacggcccccgtgatgggaggcagcagagagcacagactatggtccaggtgaaggccgtgctgggccacctcctggcaatgtccagaagcagcagcctctcagcccaggacctgcagacggtagcaggacagggcacagacacagacctcagagctcctgcacaacagctgatcaggcaccttctcctcaacttcctgctctgggctcctggaggccacacgatcgcctg ggatgtcatcaccctgatggctcacactgctgagataactcacgagatcattggctttcttgaccagaccttgtacagatggaatcgtcttggcattgaaagccctagatcagaaaaactggcccgagagctccttaaagagctgcgaactcaagtctag-3’ (SEQ ID NO:338)
MYBPC3
5’-atgcctgagccggggaagaagccagtctcagcttttagcaagaagccacggtcagtggaagtggccgcaggcagccctgccgtgttcgaggccgagacagagcgggcaggagtgaaggtgcgctggcagcgcggaggcagtgacatcagcgccagcaacaagtacggcctggccacagagggcacacggcatacgctgacagtgcgggaagtgggccctgccgaccagggatcttacgcagtcattgctggctcctccaaggtcaagttcgacctcaaggtcatagaggcagagaaggcagagcccatgctggcccctgcccctgcccctgctgaggccactggagcccctggagaagccccggccccagccgctgagctgggagaaagtgccccaagtcccaaagggtcaagctcagcagctctcaatggtcctacccctggagcccccgatgaccccattggcctcttcgtgatgcggccacaggatggcgaggtgaccgtgggtggcagcatcaccttctcagcccgcgtggccggcgccagcctcctgaagccgcctgtggtcaagtggttcaagggcaaatgggtggacctgagcagcaaggtgggccagcacctgcagctgcacgacagctacgaccgcgccagcaaggtctatctgttcgagctgcacatcaccgatgcccagcctgccttcactggcagctaccgctgtgaggtgtccaccaaggacaaatttgactgctccaacttcaatctcactgtccacgaggccatgggcaccggagacctggacctcctatcagccttccgccgcacgagcctggctggaggtggtcggcggatcagtgatagccatgaggacactgggattctggacttcagctcactgctgaaaaagagagacagtttccggaccccgagggactcgaagctggaggcaccagcagaggaggacgtgtgggagatcctacggcaggcacccccatctgagtacgagcgcatcgccttccagtacggcgtcactgacctgcgcggcatgctaaagaggctcaagggcatgaggcgcgatgagaagaagagcacagcctttcagaagaagctggagccggcctaccaggtgagcaaaggccacaagatccggctgaccgtggaactggctgaccatgacgctgaggtcaaatggctcaagaatggccaggagatccagatgagcggcagcaagtacatctttgagtccatcggtgccaagcgtaccctgaccatcagccagtgctcattggcggacgacgcagcctaccagtgcgtggtgggtggcgagaagtgtagcacggagctctttgtgaaagagccccctgtgctcatcacgcgccccttggaggaccagctggtgatggtggggcagcgggtggagtttgagtgtgaagtatcggaggagggggcgcaagtcaaatggctgaaggacggggtggagctgacccgggaggagaccttcaaataccggttcaagaaggacgggcagagacaccacctgatcatcaacgaggccatgctggaggacgcggggcactatgcactgtgcactagcgggggccaggcgctggctgagctcattgtgcaggaaaagaagctggaggtgtaccagagcatcgcagacctgatggtgggcgcaaaggaccaggcggtgttcaaatgtgaggtctcagatgagaatgttcggggtgtgtggctgaagaatgggaaggagctggtgcccgacagccgcataaaggtgtcccacatcgggcgggtccacaaactgaccattgacgacgtcacacctgccgacgaggctgactacagctttgtgcccgagggcttcgcctgcaacctgtcagccaagctccacttcatggaggtcaagattgacttcgtacccaggcaggaacctcccaagatccacctggactgcccaggccgcataccagacaccattgtggttgtagctggaaataagctacgtctggacgtccctatctctggggaccctgctcccactgtgatctggcagaaggctatcacgcaggggaataaggccccagccaggccagccccagatgccccagaggacacaggtgacagcgatgagtgggtgtttgacaagaagctgctgtgtgagaccgagggccgggtccgcgtggagaccaccaaggaccgcagcatcttcacggtcgagggggcagagaaggaagatgagggcgtctacacggtcacagtgaagaaccctgtgggcgaggaccaggtcaacctcacagtcaaggtcatcgacgtgccagacgcacctgcggcccccaagatcagcaacgtgggagaggactcctgcacagtacagtgggagccgcctgcctacgatggcgggcagcccatcctgggctacatcctggagcgcaagaagaagaagagctaccggtggatgcggctgaacttcgacctgattcaggagctgagtcatgaagcgcggcgcatgatcgagggcgtggtgtacgagatgcgcgtctacgcggtcaacgccatcggcatgtccaggcccagccctgcctcccagcccttcatgcctatcggtccccccagcgaacccacccacctggcagtagaggacgtctctgacaccacggtctccctcaagtggcggcccccagagcgcgtgggagcaggaggcctggatggctacagcgtggagtactgcccagagggctgctcagagtgggtggctgccctgcaggggctgacagagcacacatcgatactggtgaaggacctgcccacgggggcccggctgcttttccgagtgcgggcacacaatatggcagggcctggagcccctgttaccaccacggagccggtgacagtgcaggagatcctgcaacggccacggcttcagctgcccaggcacctgcgccagaccattcagaagaaggtcggggagcctgtgaaccttctcatccctttccagggcaagccccggcctcaggtgacctggaccaaagaggggcagcccctggcaggcgaggaggtgagcatccgcaacagccccacagacaccatcctgttcatccgggccgctcgccgcgtgcattcaggcacttaccaggtgacggtgcgcattgagaacatggaggacaaggccacgctggtgctgcaggttgttgacaagccaagtcctccccaggatctccgggtgactgacgcctggggtcttaatgtggctctggagtggaagccaccccaggatgtcggcaacacggagctctg ggggtacacagtgcagaaagccgacaagaagaccatggagtggttcaccgtcttggagcattaccgccgcacccactgcgtggtgccagagctcatcattggcaatggctactacttccgcgtcttcagccagaatatggttggctttagtgacagagcggccaccaccaaggagcccgtctttatccccagaccaggcatcacctatgagccacccaactataaggccctggacttctccgaggccccaagcttcacccagcccctggtgaaccgctcggtcatcgcgggctacactgctatgctctgctgtgctgtccggggtagccccaagcccaagatttcctggttcaagaatggcctggacctgggagaagacgcccgcttccgcatgttcagcaagcagggagtgttgactctggagattagaaagccctgcccctttgacgggggcatctatgtctgcagggccaccaacttacagggcgaggcacggtgtgagtgccgcctggaggtgcgagtgcctcagtga-3’ (SEQ ID NO:339)
IL2RG
5’-atgttgaagccatcattaccattcacatccctcttattcctgcagctgcccctgctgggagtggggctgaacacgacaattctgacgcccaatgggaatgaagacaccacagctgatttcttcctgaccactatgcccactgactccctcagtgtttccactctgcccctcccagaggttcagtgttttgtgttcaatgtcgagtacatgaattgcacttggaacagcagctctgagccccagcctaccaacctcactctgcattattggtacaagaactcggataatgataaagtccagaagtgcagccactatctattctctgaagaaatcacttctggctgtcagttgcaaaaaaaggagatccacctctaccaaacatttgttgttcagctccaggacccacgggaacccaggagacaggccacacagatgctaaaactgcagaatctggtgatcccctgggctccagagaacctaacacttcacaaactgagtgaatcccagctagaactgaactggaacaacagattcttgaaccactgtttggagcacttggtgcagtaccggactgactgggaccacagctggactgaacaatcagtggattatagacataagttctccttgcctagtgtggatgggcagaaacgctacacgtttcgtgttcggagccgctttaacccactctgtggaagtgctcagcattg gagtgaatggagccacccaatccactgggggagcaatacttcaaaagagaatcctttcctgtttgcattggaagccgtggttatctctgttggctccatgggattgattatcagccttctctgtgtgtatttctggctggaacggacgatgccccgaattcccaccctgaagaacctagaggatcttgttactgaataccacgggaacttttcggcctggagtggtgtgtctaagggactggctgagagtctgcagccagactacagtgaacgactctgcctcgtcagtgagattcccccaaaaggaggggcccttggggaggggcctggggcctccccatgcaaccagcatagcccctactgggcccccccatgttacaccctaaagcctgaaacctga-3’ (SEQ ID NO:340)
討論
基因組編輯技術正在徹底改變生物醫學研究。高活性核酸酶,諸如鋅指核酸酶(ZFN)1 ,轉錄激活因子樣效應子核酸酶(TALEN)2-4 和CRISPR的Cas蛋白(聚簇規則間隔短回文重複序列)系統5-7 已成功工程化成可操縱無數生物中的基因組。最近,已經利用脫氨基酶精確地改變了基因密碼而不破壞雙鏈DNA。通過將胞苷或腺苷脫氨酶與CRISPR-Cas9系統聯合,研究人員創建了可編程的堿基編輯器,使基因組DNA中的C•G轉化為T•A或A•T轉化為G•C8-10 ,為糾正致病突變提供新的機會。
除了DNA之外,RNA是用於基因校正的引人注目的靶標,因為RNA修飾可以改變蛋白質功能而不會對基因組產生任何永久性變化。目前已利用ADAR腺苷脫氨酶對RNA實現精確的堿基編輯。在哺乳動物中已鑒定出三種ADAR蛋白,即ADAR1(亞型p110和p150),ADAR2和ADAR3(催化失活)11,12 ,其底物是雙鏈RNA,其中與胞嘧啶(C)錯配的腺苷(A)優先被脫氨基為肌苷(I)。肌苷被認為在翻譯過程中可模擬鳥苷(G)13,14 。為了實現靶向RNA編輯,將ADAR蛋白或其催化結構域與λN肽15-17 ,SNAP-tag18-22 或Cas蛋白(dCas13b)23 融合,並設計了一個向導RNA來招募嵌合的ADAR蛋白至特定位點。或者,也有報道稱過表達的ADAR1或ADAR2蛋白與帶有R/G基序的向導RNA一起可以實現靶向RNA的編輯24-27
在哺乳動物系統中所有這些已報道的核酸編輯方法都依賴於兩種成分的異位表達:一種酶和一種向導RNA。盡管這些二進制系統在大多數研究中都能有效地工作,但是某些固有的障礙限制了它們的廣泛應用,尤其是在治療中。因為基因治療最有效的體內遞送是通過病毒載體28 ,並且高度理想的腺相關病毒(AAV)載體受到負荷大小(〜4.5 kb)的限制,因此使同時容納蛋白質和向導RNA成為挑戰29,30 。最近有報道稱,由於RNA的過度過度編輯31 ,ADAR1的過度表達賦予多發性骨髓瘤致癌性,並產生大量的全局脫靶編輯32 。此外,異位表達蛋白質或其非人類來源的結構域具有引發免疫原性的潛在風險30,33 。此外,預先存在的適應性免疫和p53介導的DNA損傷反應可能會損害治療性蛋白質(諸如Cas934-38 )的功效。盡管已經嘗試利用內源性機制進行RNA編輯,但是僅通過將預組裝的靶標轉錄物:RNA雙鏈體注射入非洲爪蟾(Xenopus )胚胎中進行嘗試。非常需要不依賴蛋白質異位表達的強健的核酸編輯替代技術。在這裏,我們開發了一種利用內源性ADAR進行RNA編輯的新方法。我們表明,表達經過精心設計的向導RNA可以對內源RNA進行高效且精確的編輯,並糾正致病突變。該一元核酸編輯平臺可以為治療和研究開辟新的途徑。
特別地,我們表明具有足夠長度的線性arRNA的表達能夠引導內源ADAR蛋白在靶標轉錄物上將腺苷編輯成肌苷。該系統稱為LEAPER,它利用內源性ADAR蛋白來實現可編程的核酸編輯,因此比現有方法具有優勢。
LEAPER的罕見品質是其簡單性,因為它僅依賴於小分子RNA來引導內源蛋白質進行RNA編輯。這使人想起RNAi,其中小的dsRNA可以調用靶向RNA降解的天然機制51 。由於體積小,arRNA可以很容易地通過多種病毒和非病毒載體遞送。與RNAi不同,LEAPER催化精確的A至I轉換,而不會產生目標轉錄物的切割或降解(圖18A)。盡管arRNA的長度要求比RNAi長,但它既不誘導細胞水平的免疫刺激作用(圖22E,f和圖29E),也不影響內源性ADAR蛋白的功能(圖22A,B),使其為RNA靶向的安全策略。引人注目的是,據報道,ADAR蛋白或其催化結構域的異位表達會引起大量全局脫靶編輯32 ,並可能引發癌症31
最近,幾個研究小組報道,由於效應蛋白的表達,胞嘧啶堿基編輯器可在小鼠胚胎,水稻或人類細胞系中產生大量脫靶的單核苷酸變體,這說明了LEAPER在潛在治療應用中的優勢52-54 。令人欣慰的是,LEAPER能夠進行有效的編輯,同時又引起罕見的全局脫靶編輯(圖20和圖21)。此外,LEAPER可以最大程度地減少潛在的免疫原性或克服其他需要引入外源蛋白質的方法通常存在的遞送障礙。
對於LEAPER,我們建議使用最小大小高於70-nt的arRNA以實現所需的活性。在天然環境中,ADAR蛋白非特異性編輯具有300-nt以上雙鏈體的Alu重複序列55 。值得注意的是,Alu重複序列形成穩定的分子內雙鏈體,而LEAPER導致arRNA與mRNA或pre-mRNA之間的分子間雙鏈體,這應該是不穩定的,更難以形成。因此,我們假設長於70 nt的RNA雙鏈體在化學計量上對於招募或船塢ADAR蛋白進行有效編輯很重要。實際上,更長的arRNA導致異位表達的報道分子和內源轉錄物的更高編輯產量(圖16D和圖17B)。但是,由於ADAR蛋白混雜地使RNA雙鏈體中的腺苷堿基脫氨基,因此更長的arRNA可能在靶向窗口內引起更多的脫靶。
雖然LEAPER可以有效地靶向天然轉錄物,但是它們的編輯效率和脫靶率卻有所不同。對於PPIB 轉錄物靶向,我們可以將50%的靶標腺苷轉化為肌苷,而在覆蓋窗口內沒有明顯的脫靶(圖17B,F)。對於其他轉錄物,脫靶變得更加嚴重。我們設法減少了脫靶,諸如引入A-G錯配或連續錯配以抑制不希望的編輯。但是,太多的錯配會降低上靶效率。考慮到效率和潛在的脫靶,我們建議使用長度在100到150-nt之間的arRNA對內源轉錄物進行編輯。如果有選擇,最好選擇腺苷較少的區域,以最大程度地減少不想要的編輯的機會。令人鼓舞的是,我們沒有在arRNA靶向的轉錄雙鏈體之外檢測到任何脫靶(圖20)。
我們已經優化了arRNA的設計以實現提高的編輯效率,並證明了可以利用LEAPER來操縱基因功能或糾正致病突變。我們還表明,LEAPER不僅限於在UAG上運行,它還可以與任何腺苷一起使用,而不管其側翼核苷酸如何(圖16F,G和圖17C)。這樣的靈活性對於由某些單點突變引起的遺傳疾病的潛在治療校正是有利的。有趣的是,在編輯IDUA 轉錄物時,靶向pre-mRNA的arRNA比靶向成熟RNA更有效,這表明核是ADAR蛋白的主要作用位點,並且LEAPER可通過修飾pre-mRNA中的剪接位點來操縱剪接。更重要的是,LEAPER證明了同時靶向多個基因轉錄物的高效性(圖17D)。LEAPER的這種多路複用能力可能會在將來用於治療某些多基因疾病。
在RNA水平上進行遺傳校正是有益的。首先,在目標轉錄物上進行編輯不會永久改變基因組或全套轉錄組(transcriptome repertoire),從而使RNA編輯方法比基因組編輯方法更安全地用於治療。此外,暫時編輯非常適合於臨時控制治療特定狀態偶爾改變導致的疾病。其次,LEAPER和其他RNA編輯方法不會在基因組上引入DSB,從而避免了產生不希望的大DNA片段缺失的風險37 。采用切口酶Cas9的DNA堿基編輯方法仍可在基因組中產生插入缺失8 。此外,獨立於天然DNA修複機制,LEAPER也應在有絲分裂後的細胞中起作用,諸如ADAR2高表達的小腦細胞11
我們已經證明,LEAPER可以應用於廣泛的細胞類型,諸如人類細胞系(圖14C),小鼠細胞系(圖14D)和包括原代T細胞的人類原代細胞(圖27和圖28D)。通過慢病毒遞送或合成的寡核苷酸進行的有效編輯為治療發展提供了更大的潛力(圖28)。此外,LEAPER可以在多種應用中產生表型或生理變化,包括恢複p53的轉錄調控活性(圖7),糾正致病突變(圖26)以及恢複源自Hurler綜合征患者原代成纖維細胞的α-L-艾杜糖醛酸酶活性(圖29)。因此可以設想,LEAPER在疾病治療方面具有巨大潛力。
Stafforst及其同事報道了一種新的,看似相似的RNA編輯方法,稱為RESTORE,其通過使用合成的反義寡核苷酸招募內源性ADAR而起作用56 。RESTORE和LEAPER之間的根本區別在於用於招募內源性ADAR的向導RNA的獨特性質。RESTORE的向導RNA限於化學合成反義寡核苷酸(ASO),具體取決於複雜的化學修飾,而LEAPER的arRNA可以多種方式生成,可以通過病毒或非病毒載體進行化學合成和表達(圖28和圖29)。重要的是,ASO經過大量化學修飾,因此只能在疾病治療中短暫起作用。相比之下,arRNA可以通過表達產生,一種對於不斷編輯而言尤其重要的特征。
關於LEAPER的效率和特異性,仍有改進的餘地。由於LEAPER依賴於內源性ADAR,因此靶細胞中ADAR蛋白的表達水平是成功編輯的決定因素之一。根據先前的報道57 和我們的觀察(圖14A,B),ADAR1p110 在組織中普遍表達,確保了LEAPER的廣泛適用性。ADAR1p150 是幹擾素誘導的同種型58 ,並已證明在LEAPER中具有功能(圖11E,圖12B)。因此,在某些情況下,幹擾素刺激性RNA與arRNA的共轉染可能會進一步提高編輯效率。或者,由於ADAR3發揮抑制作用,因此抑制ADAR3可能會增強表達ADAR3的細胞的編輯效率。此外,arRNA的其他修飾可能會提高其編輯效率。例如,與某些ADAR招募支架融合的arRNA可能會增加局部ADAR蛋白濃度,從而提高編輯產量。到目前為止,我們只能利用內源性ADAR1/2蛋白進行A至I堿基的轉化。探索是否可以類似地利用更多的天然機制來修飾遺傳元件,特別是實現有效的核酸編輯,是令人興奮的。
總體上,我們提供了原理證明,可以共同選擇細胞中的內源性機制來編輯RNA轉錄物。我們證明了LEAPER是一個簡單,高效和安全的系統,為基於基因編輯的療法和研究開辟了一條新途徑。
參考文獻 1. Porteus, M. H. & Carroll, D. Gene targeting using zinc finger nucleases.Nat Biotechnol 23 , 967-973 (2005). 2. Boch, J.et al. Breaking the code of DNA binding specificity of TAL-type III effectors.Science 326 , 1509-1512 (2009). 3. Moscou, M. J. & Bogdanove, A. J. A simple cipher governs DNA recognition by TAL effectors.Science 326 , 1501 (2009). 4. Miller, J. C.et al. A TALE nuclease architecture for efficient genome editing.Nat Biotechnol 29 , 143-148 (2011). 5. Jinek, M.et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337 , 816-821 (2012). 6. Cong, L.et al. Multiplex genome engineering using CRISPR/Cas systems.Science 339 , 819-823 (2013). 7. Mali, P.et al. RNA-guided human genome engineering via Cas9.Science 339 , 823-826 (2013). 8. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature 533 , 420-424 (2016). 9. Ma, Y.et al. Targeted AID-mediated mutagenesis (TAM) enables efficient genomic diversification in mammalian cells.Nat Methods 13 , 1029-1035 (2016). 10. Gaudelli, N. M.et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage.Nature 551 , 464-471 (2017). 11. Tan, M. H.et al. Dynamic landscape and regulation of RNA editing in mammals.Nature 550 , 249-254 (2017). 12. Nishikura, K. Functions and regulation of RNA editing by ADAR deaminases.Annu Rev Biochem 79 , 321-349 (2010). 13. Bass, B. L. & Weintraub, H. An unwinding activity that covalently modifies its double-stranded RNA substrate.Cell 55 , 1089-1098 (1988). 14. Wong, S. K., Sato, S. & Lazinski, D. W. Substrate recognition by ADAR1 and ADAR2.RNA 7 , 846-858 (2001). 15. Montiel-Gonzalez, M. F., Vallecillo-Viejo, I., Yudowski, G. A. & Rosenthal, J. J. Correction of mutations within the cystic fibrosis transmembrane conductance regulator by site-directed RNA editing.Proc Natl Acad Sci U S A 110 , 18285-18290 (2013). 16. Sinnamon, J. R.et al. Site-directed RNA repair of endogenous Mecp2 RNA in neurons.Proc Natl Acad Sci U S A 114 , E9395-E9402 (2017). 17. Montiel-Gonzalez, M. F., Vallecillo-Viejo, I. C. & Rosenthal, J. J. An efficient system for selectively altering genetic information within mRNAs.Nucleic Acids Res 44 , e157 (2016). 18. Hanswillemenke, A., Kuzdere, T., Vogel, P., Jekely, G. & Stafforst, T. Site-Directed RNA Editing in Vivo Can Be Triggered by the Light-Driven Assembly of an Artificial Riboprotein.J Am Chem Soc 137 , 15875-15881 (2015). 19. Schneider, M. F., Wettengel, J., Hoffmann, P. C. & Stafforst, T. Optimal guideRNAs for re-directing deaminase activity of hADAR1 and hADAR2 in trans.Nucleic Acids Res 42 , e87 (2014). 20. Vogel, P., Hanswillemenke, A. & Stafforst, T. Switching Protein Localization by Site-Directed RNA Editing under Control of Light.ACS synthetic biology 6 , 1642-1649 (2017). 21. Vogel, P., Schneider, M. F., Wettengel, J. & Stafforst, T. Improving site-directed RNA editing in vitro and in cell culture by chemical modification of the guideRNA.Angewandte Chemie 53 , 6267-6271 (2014). 22. Vogel, P.et al. Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs.Nat Methods 15 , 535-538 (2018). 23. Cox, D. B. T.et al. RNA editing with CRISPR-Cas13.Science 358 , 1019-1027 (2017). 24. Fukuda, M.et al. Construction of a guide-RNA for site-directed RNA mutagenesis utilising intracellular A-to-I RNA editing.Scientific reports 7 , 41478 (2017). 25. Wettengel, J., Reautschnig, P., Geisler, S., Kahle, P. J. & Stafforst, T. Harnessing human ADAR2 for RNA repair - Recoding a PINK1 mutation rescues mitophagy.Nucleic Acids Res 45 , 2797-2808 (2017). 26. Heep, M., Mach, P., Reautschnig, P., Wettengel, J. & Stafforst, T. Applying Human ADAR1p110 and ADAR1p150 for Site-Directed RNA Editing-G/C Substitution Stabilizes GuideRNAs against Editing.Genes (Basel) 8 (2017). 27. A-guided adenosine deaminases.Nat Methods 16 , 239-242 (2019). 28. Yin, H., Kauffman, K. J. & Anderson, D. G. Delivery technologies for genome editing.Nat Rev Drug Discov 16 , 387-399 (2017). 29. Platt, R. J.et al. CRISPR-Cas9 knockin mice for genome editing and cancer modeling.Cell 159 , 440-455 (2014). 30. Chew, W. L.et al. A multifunctional AAV-CRISPR-Cas9 and its host response.Nat Methods 13 , 868-874 (2016). 31. Teoh, P. J.et al. Aberrant hyperediting of the myeloma transcriptome by ADAR1 confers oncogenicity and is a marker of poor prognosis.Blood 132 , 1304-1317 (2018). 32. Vallecillo-Viejo, I. C., Liscovitch-Brauer, N., Montiel-Gonzalez, M. F., Eisenberg, E. & Rosenthal, J. J. C. Abundant off-target edits from site-directed RNA editing can be reduced by nuclear localization of the editing enzyme.RNA biology 15 , 104-114 (2018). 33. Mays, L. E. & Wilson, J. M. The complex and evolving story of T cell activation to AAV vector-encoded transgene products.Mol Ther 19 , 16-27 (2011). 34. Wagner, D. L.et al. High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population.Nat Med 25 , 242-248 (2019). 35. Simhadri, V. L.et al. Prevalence of Pre-existing Antibodies to CRISPR-Associated Nuclease Cas9 in the USA Population.Mol Ther Methods Clin Dev 10 , 105-112 (2018). 36. Charlesworth, C. T.et al. Identification of preexisting adaptive immunity to Cas9 proteins in humans.Nat Med 25 , 249-254 (2019). 37. Haapaniemi, E., Botla, S., Persson, J., Schmierer, B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response.Nat Med 24 , 927-930 (2018). 38. Ihry, R. J.et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells.Nat Med 24 , 939-946 (2018). 39. Woolf, T. M., Chase, J. M. & Stinchcomb, D. T. Toward the therapeutic editing of mutated RNA sequences.Proc Natl Acad Sci U S A 92 , 8298-8302 (1995). 40. Zheng, Y., Lorenzo, C. & Beal, P. A. DNA editing in DNA/RNA hybrids by adenosine deaminases that act on RNA.Nucleic Acids Res 45 , 3369-3377 (2017). 41. Abudayyeh, O. O.et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science 353 , aaf5573 (2016). 42. Daniel, C., Widmark, A., Rigardt, D. & Ohman, M. Editing inducer elements increases A-to-I editing efficiency in the mammalian transcriptome.Genome Biol 18 , 195 (2017). 43. Chen, C. X.et al. A third member of the RNA-specific adenosine deaminase gene family, ADAR3, contains both single- and double-stranded RNA binding domains.RNA 6 , 755-767 (2000). 44. Savva, Y. A., Rieder, L. E. & Reenan, R. A. The ADAR protein family.Genome Biol 13 , 252 (2012). 45. Nishikura, K. A-to-I editing of coding and non-coding RNAs by ADARs.Nat Rev Mol Cell Biol 17 , 83-96 (2016). 46. Floquet, C., Deforges, J., Rousset, J. P. & Bidou, L. Rescue of non-sense mutated p53 tumor suppressor gene by aminoglycosides.Nucleic Acids Res 39 , 3350-3362 (2011). 47. Kern, S. E.et al. Identification of p53 as a sequence-specific DNA-binding protein.Science 252 , 1708-1711 (1991). 48. Doubrovin, M.et al. Imaging transcriptional regulation of p53-dependent genes with positron emission tomography in vivo.Proc Natl Acad Sci U S A 98 , 9300-9305 (2001). 49. Landrum, M. J.et al. ClinVar: public archive of interpretations of clinically relevant variants.Nucleic Acids Res 44 , D862-868 (2016). 50. Ou, L.et al. ZFN-Mediated In Vivo Genome Editing Corrects Murine Hurler Syndrome.Mol Ther 27 , 178-187 (2019). 51. Fire, A.et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.Nature 391 , 806-811 (1998). 52. Zuo, E.et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos.Science (2019). 53. Jin, S.et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice.Science (2019). 54. Kim, D., Kim, D. E., Lee, G., Cho, S. I. & Kim, J. S. Genome-wide target specificity of CRISPR RNA-guided adenine base editors.Nat Biotechnol 37 , 430-435 (2019). 55. Levanon, E. Y.et al. Systematic identification of abundant A-to-I editing sites in the human transcriptome.Nat Biotechnol 22 , 1001-1005 (2004). 56. Merkle, T.et al. Precise RNA editing by recruiting endogenous ADARs with antisense oligonucleotides.Nat Biotechnol 37 , 133-138 (2019). 57. Wagner, R. W.et al. Double-stranded RNA unwinding and modifying activity is detected ubiquitously in primary tissues and cell lines.Mol Cell Biol 10 , 5586-5590 (1990). 58. Patterson, J. B. & Samuel, C. E. Expression and regulation by interferon of a double-stranded-RNA-specific adenosine deaminase from human cells: evidence for two forms of the deaminase.Mol Cell Biol 15 , 5376-5388 (1995). 59. Gibson, D. G.et al. Enzymatic assembly of DNA molecules up to several hundred kilobases.Nat Methods 6 , 343-345 (2009). 60. Zhou, Y., Zhang, H. & Wei, W. Simultaneous generation of multi-gene knockouts in human cells.FEBS Lett 590 , 4343-4353 (2016). 61. Dobin, A.et al. STAR: ultrafast universal RNA-seq aligner.Bioinformatics 29 , 15-21 (2013). 62. Van der Auwera, G. A.et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline.Curr Protoc Bioinformatics 43 , 11 10 11-33 (2013). 63. Wang, K., Li, M. & Hakonarson, H. ANNOVAR: functionl annotation of genetic variants from high-throughput sequencing data.Nucleic Acids Res 38 , e164 (2010). 64. Genomes Project, C.et al. An integrated map of genetic variation from 1,092 human genomes.Nature 491 , 56-65 (2012). 65. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T. & Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown.Nat Protoc 11 , 1650-1667 (2016).
圖1A-1H顯示使用利用了內源ADAR1蛋白的單個dRNA的RNA編輯。圖1A和1B顯示使用內源ADAR1蛋白編輯RNA的示意圖。圖1C顯示使用利用了內源ADAR1蛋白質的dRNA編輯報道分子mRNA。圖1D顯示圖1B中的結果的統計分析。圖1E顯示ADAR1敲除和ADAR1(p110),ADAR1(p150)和ADAR2的回複結果。圖1F顯示圖1D中的結果的統計分析。圖1G顯示ADAR1(p110),ADAR1(p150)或ADAR2過表達對293T-WT細胞中dRNA介導的RNA編輯的影響。圖1H顯示深度測序(即二代測序,NGS)結果證實了在打靶位點處從A至G的編輯。 圖2A-2H顯示dRNA的優化。圖2A顯示與打靶腺苷相對的四種堿基(A,U,C和G)識別的示意圖。圖2B顯示與打靶腺苷相對的堿基識別對dRNA的RNA編輯效率的影響。圖2C顯示帶有與UAG打靶位點的一個,兩個或三個堿基錯配的dRNA的示意圖。圖2D顯示與UAG打靶位點的一個,兩個或三個堿基錯配對於用dRNA編輯的報道RNA的影響。dRNA優選打靶腺苷上的A-C錯配。圖2E顯示帶有變化的長度的dRNA的示意圖。圖2F顯示基於雙熒光報道分子-2,dRNA長度對於RNA編輯效率的影響。圖2G顯示不同A-C錯配位置的示意圖。圖2H顯示A-C錯配位置對於RNA編輯效率的影響。 圖3A-3B顯示通過本申請的示例性RNA編輯方法的內源RNA編輯的編輯靈活性。圖3A顯示在所有16種不同的3-堿基基序上內源RNA編輯效率的百分比定量。圖3B顯示對16種不同3堿基基序的內源RNA編輯的5'側和3'側堿基優先度的熱圖。 圖4A-4H顯示在293T細胞中用dRNA編輯內源基因的mRNA。圖4A顯示KRAS mRNA靶標和帶有變化的長度的dRNA的示意圖。圖4B顯示在293T細胞中用dRNA編輯內源KRAS基因的mRNA。空白載體,dRNA-91nt質粒被分別轉染到293T-WT細胞中。在60個小時後,分離RNA用於RT-PCR,然後擴增cDNA並在Illumina NextSeq上測序。圖4C顯示PPIB mRNA靶標(位點1,位點2和位點3)和相應的dRNA設計的示意圖。圖4D,4E和4F顯示在293T細胞中用dRNA編輯內源PPIB基因的mRNA。圖4G顯示β-肌動蛋白mRNA靶標和dRNA(71-nt和131-nt)的示意圖。圖4H顯示在293T細胞中用dRNA編輯內源β-肌動蛋白基因的mRNA。 圖5A-5G顯示脫靶分析。圖5A顯示序列窗口的示意圖,其中為PPIB mRNA靶標(PPIB位點1)分析了從A至I的編輯。黑色箭頭標明了目標腺苷。圖5B顯示通過151-nt dRNA打靶PPIB mRNA靶標(PPIB位點1)進行從A至I的RNA編輯的深度測序定量。圖5C顯示序列窗口的示意圖,其中為了KRAS mRNA靶標分析了從A至I的編輯。黑色箭頭表示靶向的腺苷。圖5D顯示打靶KRAS mRNA靶標的91-nt和111-nt dRNA編輯A至I的RNA的深度測序定量。圖5E顯示含有不同的A-G錯配組合的設計的的四種91-nt或111-nt的dRNA的示意圖。基於在圖5D中的統計結果以及關於不同氨基酸的基因代碼的現有知識,設計了A-G錯配。圖5F顯示dRNA以及在圖5E中不同種類的dRNA變體對靶向的A56編輯的結果。圖5G顯示通過111-nt dRNA和打靶KRAS mRNA靶標的4種111-nt dRNA變體對從A至I的RNA編輯的深度測序定量。 圖6A-6H顯示使用利用了內源ADAR1蛋白的單個dRNA的RNA編輯。圖6A顯示dLbuCas13-ADARDD融合蛋白的RNA編輯的示意圖。無催化活性的dLbuCas13與ADAR1或ADAR2的RNA脫氨酶結構域相融合。圖6B顯示雙熒光報道mRNA靶標和向導RNA的設計的示意圖。圖6C顯示圖6A和圖6B中的結果的統計分析。圖6D顯示293T-WT細胞中ADAR1和ADAR2的mRNA水平。圖6E顯示憑借基因組PCR在293T-ADAR1-KO細胞系中對ADAR1基因進行基因分型的結果。圖6F顯示在293T-WT和293T-ADAR1-KO細胞系中ADAR1(p110)和ADAR1(p150)的表達水平(通過蛋白質印跡法)。圖6G顯示ADAR1(p110),ADAR1(p150)或ADAR2過表達對在293T-WT細胞中由dRNA介導的RNA編輯的影響(通過FACS)。圖6H顯示Sanger測序結果顯示在靶標腺苷位點處的從A至G的編輯。 圖7A-7C顯示對dRNA的優化。圖7A顯示帶有變化的長度的dRNA的示意圖以及基於雙熒光報道分子-1憑借帶有變化的長度的dRNA對靶向的mRNA進行編輯的結果。圖7B顯示基於雙熒光報道分子-1,不同的A-C錯配位置和A-C錯配位置對RNA編輯效率的影響的示意圖。圖7C顯示基於雙熒光報道分子-3,不同的A-C錯配位置和A-C錯配位置對RNA編輯效率的影響的示意圖。 圖8A-8B顯示在293T細胞中用dRNA編輯內源基因的mRNA。圖8A顯示在293T細胞中用dRNA編輯內源β-肌動蛋白基因(位點2)的mRNA。圖8B顯示在293T細胞中用dRNA編輯內源GAPDH基因的mRNA。 圖9顯示在不同細胞系中憑借dRNA進行RNA編輯。圖9A顯示報道分子質粒和dRNA質粒被共轉染到不同細胞系中,結果顯示dRNA在多種細胞系中可以很好地起作用,這表明了dRNA應用的普遍性。 圖10A-10D顯示對有效的示例性RNA編輯平臺的探索。圖10A,dLbuCas13a-ADAR1DD(E1008Q)融合蛋白和相應的crRNA的示意圖。使用3× GGGGS接頭將催化的無活性LbuCas13a融合到ADAR1的脫氨酶結構域(超活性E1008Q變體)上。crRNA(crRNACas13a )由Lbu-crRNA支架和間隔區組成,該間隔區與靶向RNA互補,具有所示的A-C錯配。圖10B,雙熒光報道系統和具有所示的多個長度的間隔區的Lbu-crRNA的示意圖。圖10C,EGFP陽性(EGFP+ )細胞的定量。將穩定表達報道分子-1 (Reporter-1)的HEK293T細胞用所示長度的crRNACas13a 轉染,並伴或不伴dLbuCas13a-ADAR1DD (E1008Q)的共表達,然後進行FACS分析。數據表示為平均值±s.e.m. (n = 3)。圖10D,用對照(Ctrl crRNA70 )或靶向間隔區(crRNA70 )進行的實驗的代表性FACS結果。 圖11A-11G顯示利用內源性ADAR1蛋白進行靶向RNA編輯的示例性方法。圖11A,報道分子-1和70-nt arRNA的示意圖。圖11B,在穩定表達報道分子-1的野生型(HEK293T,上圖)或ADAR1敲除(HEK293TADAR1 –/– ,下圖)細胞中,arRNA誘導的EGFP表達的代表性FACS分析。圖11C,蛋白質印跡分析顯示野生型和HEK293TADAR1 –/– 細胞以及轉染有ADAR1亞型(p110和p150)的HEK293TADAR1 –/– 細胞中ADAR1蛋白的表達水平。圖11D,蛋白質印跡分析顯示野生型和HEK293TADAR1 –/– 細胞以及轉染有ADAR2的HEK293TADAR1 –/– 細胞中ADAR2蛋白的表達水平。圖11E,EGFP陽性(EGFP+ )細胞的定量。將報道分子-1和所示表達ADAR的構建體與對照RNA70 或靶向arRNA70 一起共轉染到HEK293TADAR1 –/– 細胞中,然後進行FACS分析。通過轉染效率對EGFP+ 百分比進行歸一化,轉染效率由mCherry+ 確定。數據為平均值±s.e.m. (n = 4)。圖11F,電泳圖顯示對照RNA70 (上圖)或arRNA70 (下圖)靶向區域的Sanger測序結果。圖11G,通過深度測序對靶位點的A至I轉化率進行定量。 圖12A-12B顯示ADAR1/ADAR2的mRNA表達水平,和arRNA介導的RNA編輯。圖12A,定量PCR顯示HEK293T細胞中ADAR1ADAR2 的mRNA水平。數據表示為平均值±s.e.m. (n = 3)。圖12B,來自圖1E的代表性FACS結果。 圖13顯示定量PCR結果,該結果證明了示例性LEAPER方法對HEK293T細胞中111-nt arRNA或對照RNA靶向報道分子-1轉錄物的表達水平的影響。數據表示為平均值±s.e.m. (n = 3);未配對的雙面學生t檢驗,ns,不顯著。 圖14A-14D顯示在多個細胞系中用示例性LEAPER方法進行的靶向RNA編輯。圖14A,蛋白質印跡結果顯示在所示人細胞系中ADAR1,ADAR2和ADAR3的表達水平。將β-微管蛋白用作上樣對照。顯示的數據是三個獨立實驗的代表。ADAR1 –/– /ADAR2代表過表達ADAR2的ADAR1-敲除HEK293T細胞。圖14B,通過β-微管蛋白表達歸一化的相對ADAR蛋白表達水平。圖14C,所示人細胞用報道分子-1,以及71-nt對照arRNA(對照RNA71 )或71-nt靶向arRNA(arRNA71 )轉染,然後進行FACS分析。圖14D,如圖14C所述分析所示小鼠細胞系。通過轉染效率對EGFP+ 百分比進行歸一化,該轉染效率由mCherry+ 確定。圖14B,14c和14d中的誤差線均表示平均值±s.e.m.(n = 3);未配對的雙面學生t檢驗,*P <0.05;**P <0.01; ***P <0.001;****P <0.0001; ns,不顯著。 圖15A-15C顯示報道分子-1(圖15A),-2(圖15B)和-3(圖15C)以及它們相應的arRNA的示意圖。 圖16A-16G顯示示例性LEAPER方法的表征和優化。圖16A,上圖,具有與靶UAG相對的改變的三聯體(5'-CNA,N表示A,U,C或G)的arRNA設計的示意圖。下圖,EGFP+ 百分比,其顯示與靶標腺苷相對的可變堿基對RNA編輯效率的影響。圖16B,上圖,具有A-C錯配(5'-N1 CN2 )中的胞苷側翼的改變的相鄰堿基的arRNA的設計。下圖,N1 CN2 的16種不同組合對RNA編輯效率的影響。圖16C,A-C錯配中的胞苷的5'和3'最鄰近位點的優先度的概述。圖16D,上圖,具有可變長度的arRNA的設計。下圖,基於報道分子-1和報道分子-2,arRNA長度對RNA編輯效率的影響。圖16E,上圖,具有可變A-C錯配位置的arRNA的設計。下圖,基於報道分子 1和報道分子-2,A-C錯配位置對的RNA編輯效率的影響。圖16F,上圖,報道分子-3的三聯體基序的設計,在靶標腺苷(5'-N1 AN2 )周圍具有可變最鄰近堿基,在111-nt arRNA(arRNA111 )上具有相對基序(5'-N2 CN1 )。下圖,深層測序結果顯示5'-N1 AN2 基序中靶標腺苷的編輯率。圖16G,在“報道分子-3”上LEAPER介導的編輯的5'和3'堿基優先度的概述。16A,16B,16D,16E和16F中的誤差線均表示平均值±s.e.m. (n = 3)。 圖17A-17I顯示用示例性LEAPER方法對內源轉錄物的編輯。圖17A,四個疾病相關基因(PPIBKRASSMAD4FANCC )和相應arRNA的靶向內源轉錄物的示意圖。圖17B,深度測序結果顯示通過引入指定長度的arRNA,對PPIBKRASSMAD4FANCC 轉錄物的靶標腺苷的編輯率。圖17C,深度測序結果顯示在內源PPIB,FANCC和IDUA轉錄物的非UAN位點的編輯率。圖17D,兩個111-nt arRNA的多重編輯率。所示arRNA可以單獨轉染或共轉染到HEK293T細胞中。從共轉染的細胞中測量兩個位點的靶向編輯。圖17E,由151-nt arRNA覆蓋的PPIB 轉錄物序列的示意圖。黑色箭頭指示靶標腺苷。所有腺苷標記為紅色。圖17F,腺苷的編輯率的熱圖,其被靶向PPIB 基因的所示長度的arRNA覆蓋(以藍色粗體框標記的)。對於111ntarRNA或arRNA151 -PPIB覆蓋的區域,由於缺乏有效的PCR引物來擴增該區域,因此通過RNA-seq確定A22,A30,A33和A34的編輯率。否則,通過有針對性的深度測序分析來確定編輯率。圖17G,上圖,報道分子-3的三聯體基序的設計,在靶標腺苷(5'-N1 AN2 )周圍具有可變最鄰近堿基,在111-nt arRNA(arRNA111 )中具有相對基序(5'-N2’ GN1’ )。下圖,深層測序結果顯示編輯率。圖17H,上圖,在5'-N1 GN2 與5'-UAG或5'-AAG基序相對的基序中具有兩個連續錯配的arRNA的設計。深度測序結果顯示在與5'-UAG基序(左下)或5'-AAG基序(右下)相對的5'-N1 GN2 基序中具有兩個連續錯配的arRNA111 的編輯率。圖17I,由靶向KRAS 基因的工程化的arRNA111變體覆蓋的腺苷的編輯率的熱圖。圖17B,17C,17D,17G和17H中的數據表示為平均值±s.e.m.(n = 3);未配對的雙面學生t檢驗,*P <0.05; **P <0.01; ***P <0.001; ****P <0.0001; NS,不顯著。(fi )的數據表示為平均值(n = 3)。 圖18A-18B顯示示例性LEAPER方法對靶向轉錄物和蛋白質產物的表達水平的影響。圖18A,定量PCR顯示HEK293T細胞中相應的151-nt arRNA或對照RNA的PPIB,KRAS,SMAD4和FANCC的靶向轉錄物的表達水平。數據表示為平均值±s.e.m. (n = 3);未配對的雙面學生t檢驗,*P <0.05;**P <0.01;***P <0.001;****P <0.0001; ns,不顯著。圖18B,蛋白質印跡結果顯示在HEK293T細胞中,151-nt arRNA對靶向KRAS基因的蛋白質產物的影響。將β-微管蛋白用作上樣對照。 圖19A-19F顯示用示例性LEAPER方法對內源轉錄物的編輯。圖19A,由151-nt arRNA覆蓋的KARS 轉錄物序列的示意圖。箭頭指示靶標腺苷。所有腺苷標記為紅色。圖19B,由KARS 轉錄物中所示arRNA覆蓋的腺苷的編輯率的熱圖(以藍色粗框標記的)。圖19C,由151-nt arRNA覆蓋的SMAD4 轉錄物的示意圖。圖19D,由SMAD4 轉錄物中所示arRNA覆蓋的腺苷的編輯率的熱圖。圖19E,由151-nt arRNA覆蓋的FANCC轉錄物的示意圖。圖19F,由FANCC 轉錄物中所示arRNA覆蓋的腺苷的編輯率的熱圖。對於每個arRNA,雙鏈體RNA的區域以藍色粗體框突出顯示。數據(圖19B,19D和19F)表示為平均值(n=3)。 圖20A-20D顯示LEAPER的RNA編輯的轉錄組範圍特異性。20A和20B,對照RNA151 和arRNA151 -PPIB的轉錄組範圍脫靶分析。上靶位點(PPIB)以紅色突出顯示。在對照RNA和靶向PPIB的RNA組中識別出的潛在脫靶位點標記為藍色。圖20C,脫靶位點和相應的對照RNA151 或arRNA151 -PPIB之間的預期退火親和力。使用在線網站工具RNAhybrid預測脫靶位點(編輯位點的上遊和下遊150 nt)和相應的對照RNA151 或arRNA151 -PPIB形成的雙鏈RNA的最小自由能(ΔG)。圖20D,上圖,arRNA151 -PPIB和指定的潛在脫靶位點之間的高度互補區域的示意圖,其可通過藉由NCBI-BLAST搜索同源序列來預測。下圖,深度測序顯示arRNA151 -PPIB的上靶位點和所有預測的脫靶位點的編輯率。數據表示為平均值±s.e.m. (n = 3)。 圖21A-21B顯示潛在脫靶的評估。圖21A,arRNA111 -FANCC的高度互補區和指定的潛在脫靶序列的示意圖,其是通過藉由NCBI-BLAST搜索同源序列來預測的。圖21B,深度測序顯示arRNA111 -FANCC的上靶位點和所有預測的脫靶位點的編輯率。所有數據均表示為平均值±s.e.m.(n = 3)。 圖22A-22F顯示在哺乳動物細胞中應用示例性LEAPER方法的安全性評估。圖22A和22B,通過轉錄組範圍的RNA測序對對照RNA151 (a ) arRNA151 -PPIB(b )對天然編輯位點的作用的轉錄組範圍的分析。皮爾遜相關系數分析(Pearson’s correlation coefficient analysis)用於評估天然編輯位點的差異RNA編輯率。圖22C和22D,用轉錄組水平上的RNA-seq數據對對照RNA151 (c ) arRNA151 -PPIB(d )的作用進行差異基因表達分析。皮爾遜相關系數分析用於評估差異基因表達。圖22E和22F,arRNA轉染對先天免疫應答的影響。將所示arRNA或聚(I:C)轉染到HEK293T細胞中。然後使用定量PCR分析總RNA,以確定IFN-β (e )和IL-6 (f )的表達水平。數據(ef )表示為平均值±s.e.m.(n = 3)。 圖23A-23D顯示通過LEAPER恢複突變體TP53W53X的轉錄調節活性。圖23A,上圖,由含有c.158G>A臨床相關無義突變(Trp53Ter)的111-nt arRNA覆蓋的TP53 轉錄物序列的示意圖。黑色箭頭指示靶標腺苷。所有腺苷標記為紅色。下圖,設計了兩個針對TP53W53X 轉錄物的優化arRNA,其中arRNA111 -AG1在A46th 處具有A-G錯配,而arRNA111 -AG4分別在A16th ,A46th ,A91th 和A94th 處具有A-G錯配,以最大程度地減少“易編輯”基序的潛在脫靶。圖23B,深度測序結果顯示通過arRNA111 ,arRNA111 -AG1和arRNA111 -AG4對TP53W53X 轉錄物進行靶向編輯。圖23C,蛋白質印跡顯示從HEK293TTP53 –/– 細胞中的TP53W53X 轉錄物中恢複全長p53蛋白的產物。圖23D,使用p53-螢火蟲-熒光素酶報道系統檢測恢複的p53蛋白的轉錄調節活性,該系統通過共轉染的海藻-熒光素酶載體進行了歸一化。數據(bcd )表示為平均值±s.e.m.(n = 3);未配對的雙面學生t檢驗,*P <0.05;**P <0.01;***P <0.001;****P <0.0001; ns,不顯著。 圖24顯示通過示例性的LEAPER方法對突變體TP53W53X轉錄物的編輯。上圖,是111 nt arRNA覆蓋的TP53 轉錄序列的示意圖。箭頭指示靶標腺苷。所有腺苷標記為紅色。下圖,是TP53 轉錄物中所示arRNA覆蓋的腺苷編輯率的熱圖。 圖25顯示從ClinVar數據和相應的111-nt arRNA中選擇的含有G至A突變的疾病相關cDNA的示意圖。 圖26顯示通過示例性的LEAPER方法對病原性突變的校正。通過相應的111 nt arRNA從ClinVar數據對疾病相關的G> A突變進行A至I校正,靶向所示的來自六個致病基因的臨床相關突變(圖25以及以下arRNA和對照RNA和疾病相關的cDNA的序列的表)。數據表示為平均值±s.e.m. (n = 3);未配對的雙面學生t檢驗,*P <0.05;**P <0.01;***P <0.001;****P <0.0001; ns,不顯著。 圖27A-27C顯示通過示例性LEAPER方法在多個人原代細胞中的RNA編輯。圖27A,由LEAPER介導的RNA編輯誘導的EGFP陽性(EGFP+ )細胞的定量。用報道分子-1,以及151-nt對照RNA(對照RNA151 )或151-nt靶向arRNA(arRNA151 )轉染人原代肺成纖維細胞和人原代支氣管上皮細胞,然後進行FACS分析。圖27B和27C,深度測序結果顯示人原代肺成纖維細胞,人原代支氣管上皮細胞(b )和人原代T細胞(c )中PPIB 轉錄物的編輯率。ab 和未治療組(c )中的數據表示為平均值±s.e.m. (n = 3);對照RNA151 和arRNA151 (c )的數據表示為平均值±s.e.m.(n = 2)。 圖28A-28D顯示arRNA的慢病毒轉導和合成arRNA寡核苷酸的電穿孔的靶向編輯。圖28A,EGFP+ 細胞的定量。將穩定表達報道分子-1的HEK293T細胞用表達Ctrl-RNA或靶向arRNA的151-nt的慢病毒感染。感染後2天和8天進行FACS分析。EGFP+ 細胞的比率通過慢病毒轉導效率(BFP+ 比率)歸一化。圖28B,深度測序結果顯示慢病毒將151-nt arRNA轉導入HEK293T細胞後,PPIB 轉錄物的編輯率。圖28C,PPIB 序列和相應的111-nt靶向arRNA的示意圖。*(紅色)表示具有2'-O-甲基和硫代磷酸酯鍵修飾的核苷酸。圖28D,深度測序結果顯示當將111nt合成arRNA寡核苷酸電穿孔到人原代T細胞中時,PPIB 轉錄物的編輯率。 圖29A-29E顯示通過示例性LEAPER方法在源自Hurler綜合征患者的原代成纖維細胞中α-L-艾杜糖醛酸酶活性的恢複。圖29A,上圖,源自患者的成纖維細胞GM06214中致病突變的遺傳信息;中間圖,IDUA 基因的外顯子9(Trp402Ter)中含有純合TGG>TAG突變的GM06214細胞(黑色)的IDUA 成熟mRNA序列的示意圖,相應的111-nt靶向arRNA111 -IDUA-V1(藍色);下圖,GM06214細胞的IDUA 前mRNA序列(黑色)和相應的111-nt靶向arRNA111 -IDUA-V2的示意圖(藍色)。*(紅色)表示具有2'-O-甲基和硫代磷酸酯鍵修飾的核苷酸。圖29B,在不同時間點,用4-甲基傘形酮α-L-艾杜糖醛酸酶底物測量α-L-艾杜糖醛酸酶的催化活性。數據表示為平均值±s.e.m. (n = 2)。圖29C,深度測序結果顯示在電穿孔後48小時,在GM06214細胞中,IDUA 轉錄物的靶向編輯率。圖29D,上圖,由111-nt arRNA覆蓋的IDUA 轉錄序列的示意圖。箭頭指示靶標腺苷。所有腺苷標記為紅色。下圖,由IDUA 轉錄物中所示arRNA覆蓋的腺苷編輯率的熱圖(以藍色粗體框顯示)。e ,定量PCR顯示在arRNA或聚(I:C)電穿孔後,I型幹擾素、幹擾素刺激基因和促炎基因的表達。數據表示為平均值(n = 3)。 圖30A-30C顯示雙熒光報道分子(報道分子-1,-2和-3),mCherry和EGFP的三種形式。圖30A,報道分子-1的結構,圖30B,報道分子-2的結構,圖30C,報道分子-3的結構。 圖31顯示Lenti-dCas13-ADAR1DD的結構。 圖32顯示了pLenti-MCS-mCherry的骨架結構。 圖33顯示pLenti-arRNA-BFP的骨架結構。 圖34顯示了在GM06214細胞中檢測到的IDUA基因型。其基因組中存在c.1205 G>A突變。 圖35顯示了細胞的電轉染條件的測試結果。 圖36顯示了用電穿孔分別使用設計為靶向IDUA pre-mRNA和mRNA的dRNA轉染的細胞中IDUA的酶活性和所希望的突變的比率。 圖37A-37B顯示使用IDUA報道分子的測試。圖37A顯示了IDUA-報道分子的構造。圖37B顯示了使用電穿孔時293T-IDUA-報道分子細胞(具有IDUA-報道分子的293T細胞)中不同長度的dRNA(對稱截短)的編輯效率。 圖38顯示了用不同長度的dRNA(對稱截短)電轉染的GM06214細胞在不同時間點測定的酶活性和編輯效率。 圖39A-39B顯示了在使用LipofectamineRNAiMAX轉染不同dRNA(對稱截短,3'末端截短和5'末端截短)的細胞中測定的IDUA酶活性(圖39A)和A至G突變率(圖39B)。 圖40A-40B顯示了使用Lipofectamine RNAiMAX轉染不同長度dRNA的GM06214細胞的酶活性的比較。圖40A中,dRNA 3'末端的堿基從55-c-25逐個減少至55-c-10。圖40B中,dRNA 3'末端的堿基從55-c-16逐個減少至55-c-5。 圖41顯示了用Lipofectamine RNAiMAX轉染不同長度(3′末端的長度固定為15nt或20nt,而5′末端的長度逐漸減小)dRNA的GM06214細胞中酶活性的比較。 圖42顯示了使用LipofectamineRNAiMAX轉染了3組dRNA的GM06214細胞中酶活性的比較。對於每組中的dRNA,從靶向核苷酸到5'末端的距離不同。此圖還顯示出小於60 nt的dRNA編輯效率低。 圖43A-43B顯示了具有不同化學修飾的71nt和76nt dRNA的編輯效率。圖43A顯示了使用酶活性的編輯效率。圖43B顯示了使用A到G比率的編輯效率。 圖44顯示了使用本發明中的dRNA以及現有技術中用於外源酶非依賴性RNA堿基編輯的優選RNA轉染的細胞的酶活性的比較。 圖45A-45D顯示了使用本發明的經化學修飾的dRNA對USH2A模型(c.11864 G> A,p.Trp3955*)中的突變的RNA編輯結果。MFI和%GFP代表編輯效率。圖45A顯示USH2A構建體的構造。圖45B顯示3'和5'末端長度相等的dRNA的編輯效率。圖45C顯示了3'和5'末端長度不同的dRNA的編輯效率。圖45D顯示了少於60個核苷酸的dRNA的相對較低的編輯效率。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119

Claims (31)

  1. 一種60-200個核苷酸的脫氨酶招募RNA(dRNA),其中: a)所述dRNA包含能夠與靶標RNA雜交的互補RNA序列; b)所述dRNA能夠招募脫氨酶或包含脫氨酶的構建體或包含脫氨酶的催化結構域的構建體以使所述靶標RNA中的靶標腺苷脫氨;以及 c)所述dRNA包含一種或多種化學修飾。
  2. 如請求項1所述的dRNA,其中所述dRNA長於約60nt,65nt,70nt,80nt,90nt,100nt或110nt中的任何一個。
  3. 如請求項1或請求項2所述的dRNA,其包含與互補的靶標RNA區域的一個或多個錯配,擺動配對(wobble)和/或單側突起(bulge)。
  4. 如請求項1至請求項3中任一項所述的dRNA,其中所述互補RNA序列包含與所述靶標RNA中的靶標腺苷直接相對的胞苷,腺苷或尿苷。
  5. 如請求項4所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷位於距3'末端至少約7個核苷酸,例如距3'末端至少約8、9或10個核苷酸。
  6. 如請求項4至請求項5中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷,腺苷或尿苷位於距所述5'末端至少約25個核苷酸,例如距5'末端至少約30、35、40、45、50或55個核苷酸。
  7. 如請求項4至請求項6中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷、腺苷或尿苷側翼的5'和3'序列的長度不相等。
  8. 如請求項4至請求項7中任一項所述的dRNA,其中與所述靶標腺苷直接相對的所述胞苷、腺苷或尿苷側翼的5'序列的長度長於所述3'序列。
  9. 如請求項1至請求項8中任一項所述的dRNA,其在所述靶標RNA中包含與所述靶標腺苷直接相對的胞苷。
  10. 如請求項1至請求項9中任一項所述的dRNA,其中所述互補RNA序列包含一個或多個鳥苷,其各自與所述靶標RNA中的非靶標腺苷相對。
  11. 如請求項1至請求項10中任一項所述的dRNA,其中所述互補序列包含與所述靶標RNA中的非靶標腺苷相對的兩個或多個連續錯配的核苷酸。
  12. 如請求項1至請求項11中任一項所述的dRNA,其中所述靶標RNA中的所述靶標腺苷的5'最近鄰是選自U,C,A和G的核苷酸,優選U>C≈A>G,並且所述靶標RNA中的所述靶標腺苷的3'最近鄰是選自G,C,A和U的核苷酸,優選G>C>A≈U。
  13. 如請求項1至請求項12中任一項所述的dRNA,其中所述靶標腺苷位於所述靶標RNA中的一個三堿基基序,所述三堿基基序選自下組:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU。
  14. 如請求項13所述的dRNA,其中所述三堿基基序是UAG,並且其中所述dRNA包含與所述三堿基基序中的尿苷直接相對的A,與所述靶標腺苷直接相對的胞苷,以及與所述三堿基基序中的鳥苷直接相對的胞苷、鳥苷或尿苷。
  15. 如請求項14所述的dRNA,其包含與UAG的三堿基基序直接相對的5'-CCA-3'。
  16. 如請求項1至請求項15中任一項所述的dRNA,其中所述化學修飾包括甲基化和/或硫代磷酸酯化。
  17. 如請求項16所述的dRNA,其中所述化學修飾包括2'-O-甲基化和/或核苷酸間硫代磷酸酯連接。
  18. 如請求項16所述的dRNA,其中所述化學修飾包括首尾各1-5、2-5、3-5、4-5個核苷酸的2'-O-甲基化和/或首尾各1-5、2-5、3-5、4-5個核苷酸間連接的硫代磷酸酯化。
  19. 如請求項16至請求項18中任一項所述的dRNA,其中所述化學修飾包括與所述靶標腺苷相對的核苷酸和/或其5'和/或3'最鄰近的核苷酸的2'-O-甲基化和/或3'-硫代磷酸酯化。
  20. 如請求項1至請求項19中任一項所述的dRNA,所述化學修飾選自下組: 1)首尾各3個核苷酸的2'-O-甲基化和/或首尾各3個核苷酸間連接的硫代磷酸酯化; 2)首尾各3個核苷酸的2'-O-甲基化和/或首尾各3個核苷酸間連接的硫代磷酸酯化,和單個或多個或所有尿苷的2'-O-甲基化; 3)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,單個或多個或所有尿苷中的2'-O-甲基化,以及與所述靶標腺苷相對的核苷酸和/或其5'和/或3'最鄰近的核苷酸的修飾; 4)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,單個或多個或所有尿苷的2'-O-甲基化,以及與所述靶標腺苷相對的核苷酸的3'端和/或5'端最鄰近的核苷酸的2'-O-甲基化; 5)首尾各3個核苷酸的2'-O-甲基化,首尾各3個核苷酸間連接的硫代磷酸酯化,單個或多個或所有尿苷的2'-O-甲基化,以及與所述靶標腺苷相對的核苷酸和/或其5'和/或3'最鄰近的核苷酸的硫代磷酸酯化連接; 6)首尾各1-5個核苷酸的2'-O-甲基化和/或首尾各1-5個核苷酸間連接的硫代磷酸酯化。
  21. 如請求項20所述的dRNA,其中與所述靶標腺苷相對的核苷酸和/或與所述靶腺苷相對的核苷酸最鄰近的一個或兩個核苷酸的修飾是2'-O-甲基化和/或硫代磷酸酯化連接。
  22. 如請求項1至請求項21中任一項所述的dRNA,其不包含能夠形成用於結合ADAR酶的分子內莖環結構的ADAR招募結構域。
  23. 一種包含或編碼如請求項1至請求項22中任一項所述的dRNA的構建體。
  24. 一種用於在宿主細胞中編輯靶標RNA的方法,包括將如請求項1至請求項23中任一項所述的dRNA引入宿主細胞。
  25. 如請求項24所述的方法,其進一步包括將ADAR3的抑制劑引入所述宿主細胞。
  26. 如請求項24或請求項25所述的方法,其進一步包括將幹擾素的刺激物引入所述宿主細胞。
  27. 如請求項24至請求項26中任一項所述的方法,其包括引入各自靶向不同靶標RNA的多個dRNA。
  28. 如請求項24至請求項27中任一項所述的方法,其中所述dRNA不誘導免疫應答。
  29. 如請求項24至請求項28中任一項所述的方法,進一步包括將外源ADAR引入所述宿主細胞。
  30. 如請求項29所述的方法,其中所述ADAR是包含E1008突變的ADAR1。
  31. 一種構建體,組合物,細胞,文庫或試劑盒,其包含如請求項1至請求項23中任一項所述的dRNA。
TW109112632A 2019-04-15 2020-04-15 編輯rna的方法和組合物 TW202043249A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
WOPCT/CN2019/082713 2019-04-15
CN2019082713 2019-04-15
WOPCT/CN2019/129952 2019-12-30
CN2019129952 2019-12-30

Publications (1)

Publication Number Publication Date
TW202043249A true TW202043249A (zh) 2020-12-01

Family

ID=72837012

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109112632A TW202043249A (zh) 2019-04-15 2020-04-15 編輯rna的方法和組合物

Country Status (18)

Country Link
US (2) US20220307020A1 (zh)
EP (1) EP3956449A4 (zh)
JP (1) JP2022526455A (zh)
KR (1) KR20220004674A (zh)
CN (1) CN113939591A (zh)
AU (1) AU2020259548B2 (zh)
BR (1) BR112021020608A8 (zh)
CA (1) CA3136735A1 (zh)
CL (1) CL2021002695A1 (zh)
CO (1) CO2021015214A2 (zh)
CR (1) CR20210572A (zh)
EC (1) ECSP21080618A (zh)
IL (1) IL287248A (zh)
MX (1) MX2021012645A (zh)
PE (1) PE20212214A1 (zh)
SG (1) SG11202111401RA (zh)
TW (1) TW202043249A (zh)
WO (1) WO2020211780A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022150974A1 (en) * 2021-01-12 2022-07-21 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas
US11661596B2 (en) 2019-07-12 2023-05-30 Peking University Targeted RNA editing by leveraging endogenous ADAR using engineered RNAs
US11702658B2 (en) 2019-04-15 2023-07-18 Edigene Therapeutics (Beijing) Inc. Methods and compositions for editing RNAs

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017281497B2 (en) 2016-06-22 2023-04-06 Proqr Therapeutics Ii B.V. Single-stranded RNA-editing oligonucleotides
CA3159944A1 (en) 2019-12-02 2021-06-10 David HUSS Therapeutic editing
KR20220119129A (ko) * 2019-12-30 2022-08-26 에디진 테라퓨틱스 (베이징) 인크. Leaper 기술에 기반한 mps ih 치료 방법 및 조성물
MX2022008197A (es) * 2019-12-30 2022-08-02 Edigene Therapeutics Beijing Inc Metodo para el tratamiento del sindrome de usher y composicion del mismo.
CN113528582B (zh) * 2020-04-15 2022-05-17 博雅辑因(北京)生物科技有限公司 基于leaper技术靶向编辑rna的方法和药物
US20230242916A1 (en) * 2020-04-15 2023-08-03 Edigene Therapeutics (Beijing) Inc. Method and drug for treating hurler syndrome
JP2023529316A (ja) * 2020-05-26 2023-07-10 シェイプ セラピューティクス インコーポレイテッド ゲノム編集のための組成物及び方法
US20230194709A9 (en) * 2021-06-29 2023-06-22 Seagate Technology Llc Range information detection using coherent pulse sets with selected waveform characteristics
WO2023020574A1 (en) * 2021-08-18 2023-02-23 Peking University Engineered adar-recruiting rnas and methods of use thereof
WO2023143539A1 (en) * 2022-01-28 2023-08-03 Edigene Therapeutics (Beijing) Inc. Engineered adar-recruiting rnas and methods of use thereof
WO2023152371A1 (en) 2022-02-14 2023-08-17 Proqr Therapeutics Ii B.V. Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia
WO2024013360A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Chemically modified oligonucleotides for adar-mediated rna editing
WO2024013361A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Oligonucleotides for adar-mediated rna editing and use thereof
GB202215614D0 (en) 2022-10-21 2022-12-07 Proqr Therapeutics Ii Bv Heteroduplex rna editing oligonucleotide complexes
WO2024110565A1 (en) 2022-11-24 2024-05-30 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of hereditary hfe-hemochromatosis
GB202218090D0 (en) 2022-12-01 2023-01-18 Proqr Therapeutics Ii Bv Antisense oligonucleotides for the treatment of aldehyde dehydrogenase 2 deficiency
WO2024121373A1 (en) 2022-12-09 2024-06-13 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of cardiovascular disease

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
US5773244A (en) 1993-05-19 1998-06-30 Regents Of The University Of California Methods of making circular RNA
US9222088B2 (en) 2010-10-22 2015-12-29 Curna, Inc. Treatment of alpha-L-iduronidase (IDUA) related diseases by inhibition of natural antisense transcript to IDUA
US9650627B1 (en) 2012-07-19 2017-05-16 University Of Puerto Rico Site-directed RNA editing
EP3957735A1 (en) 2014-03-05 2022-02-23 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
JP6997623B2 (ja) 2014-12-12 2022-02-04 エム. ウルフ、トッド オリゴヌクレオチドを利用して細胞内の核酸を編集するための組成物および方法
EP3712269A1 (en) * 2014-12-17 2020-09-23 ProQR Therapeutics II B.V. Targeted rna editing
US11390865B2 (en) 2015-07-14 2022-07-19 Fukuoka University Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex
DE102015012522B3 (de) * 2015-09-26 2016-06-02 Eberhard Karls Universität Tübingen Verfahren und Substanzen zur gerichteten RNA-Editierung
US10617707B2 (en) 2016-04-25 2020-04-14 Proqr Therapeutics Ii B.V. Oligonucleotides to treat eye disease
AU2017281497B2 (en) * 2016-06-22 2023-04-06 Proqr Therapeutics Ii B.V. Single-stranded RNA-editing oligonucleotides
WO2018041873A1 (en) 2016-09-01 2018-03-08 F. Hoffmann-La Roche Ag Process for the preparation of (6s)-6-isopropyl-10-methoxy-9-(3-methoxypropoxy)-2-oxo-6,7-dihydrobenzo[a]quinolizine-3-carboxylic acid
KR102501980B1 (ko) * 2016-09-01 2023-02-20 프로큐알 테라퓨틱스 Ⅱ 비.브이. 화학적으로 변형된 단일 가닥 rna-편집 올리고뉴클레오타이드
GB201616202D0 (en) 2016-09-23 2016-11-09 Proqr Therapeutics Ii Bv Antisense oligonucleotides for the treatment of eye deisease
WO2018134301A1 (en) 2017-01-19 2018-07-26 Proqr Therapeutics Ii B.V. Oligonucleotide complexes for use in rna editing
EP3589751A4 (en) 2017-03-03 2021-11-17 The Regents of The University of California RNA TARGETING OF MUTATIONS VIA SUPPRESSOR RNA AND DEAMINASES
AU2018265022A1 (en) 2017-05-10 2019-11-21 The Regents Of The University Of California Directed editing of cellular RNA via nuclear delivery of CRISPR/Cas9
WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
CA3073848A1 (en) 2017-09-21 2019-03-28 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
CA3111479A1 (en) 2017-09-26 2019-04-04 The Board Of Trustees Of The University Of Illinois Crispr/cas system and method for genome editing and modulating transcription
JP2020537516A (ja) 2017-10-04 2020-12-24 ザ・ブロード・インスティテュート・インコーポレイテッド 標的化された核酸編集のためのシステム、方法、及び組成物
CA3084632A1 (en) 2017-12-21 2019-06-27 Crispr Therapeutics Ag Materials and methods for treatment of usher syndrome type 2a
EP3752611A1 (en) 2018-02-14 2020-12-23 ProQR Therapeutics II B.V. Antisense oligonucleotides for rna editing
US20210115419A1 (en) 2018-03-23 2021-04-22 Massachusetts Eye And Ear Infirmary CRISPR/Cas9-Mediated Exon-Skipping Approach for USH2A-Associated Usher Syndrome
EP3814498A1 (en) * 2018-06-29 2021-05-05 Eberhard-Karls-Universität Tübingen Artificial nucleic acids for rna editing
GB2590880A (en) 2018-09-06 2021-07-07 Univ California RNA and DNA base editing via engineered ADAR recruitment
ES2962434T3 (es) 2018-10-12 2024-03-19 Univ Beijing Procedimientos y composiciones para editar ARN
JP7144618B2 (ja) 2018-12-20 2022-09-29 北京大学 バーコード付きガイドrna構築体を使用する効率的な遺伝子スクリーニングのための組成物及び方法
CN114040970A (zh) 2019-02-13 2022-02-11 比姆医疗股份有限公司 使用腺苷脱氨酶碱基编辑器编辑疾病相关基因的方法,包括遗传性疾病的治疗
CN109943586B (zh) 2019-03-15 2021-02-26 上海交通大学 一种植物circRNA过表达载体及其构建方法
EP3956449A4 (en) 2019-04-15 2023-03-29 EdiGene Therapeutics (Beijing) Inc. METHODS AND COMPOSITIONS FOR EDITING RNAs
EP3964579A4 (en) 2019-04-30 2023-07-26 EdiGene (GuangZhou) Inc. METHOD OF PREDICTING THE EFFECTIVENESS OF THE TREATMENT OF HEMOGLOBINOPATHY
JP2022536546A (ja) 2019-07-12 2022-08-17 北京大学 遺伝子操作rnaを用いた内因性adarによる標的化rna編集
EP4026910A1 (en) 2019-09-04 2022-07-13 Edigene Inc. Method for evaluating gene editing therapy based on off-target assessment
CA3162030A1 (en) 2019-12-16 2021-06-24 Riguo FANG Small molecule compounds for amplifying hematopoietic stem cells, and combination thereof
KR20220119129A (ko) 2019-12-30 2022-08-26 에디진 테라퓨틱스 (베이징) 인크. Leaper 기술에 기반한 mps ih 치료 방법 및 조성물
MX2022008197A (es) 2019-12-30 2022-08-02 Edigene Therapeutics Beijing Inc Metodo para el tratamiento del sindrome de usher y composicion del mismo.
TW202136513A (zh) 2019-12-31 2021-10-01 大陸商博雅輯因(北京)生物科技有限公司 靶向編輯rna的新方法
DE102020126779A1 (de) 2020-10-13 2022-04-14 Fritsch Bakery Technologies GmbH & Co. KG Teigverarbeitungsmaschine zum Bearbeiten von Produkten
EP4277990A1 (en) 2021-01-12 2023-11-22 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11702658B2 (en) 2019-04-15 2023-07-18 Edigene Therapeutics (Beijing) Inc. Methods and compositions for editing RNAs
US11661596B2 (en) 2019-07-12 2023-05-30 Peking University Targeted RNA editing by leveraging endogenous ADAR using engineered RNAs
WO2022150974A1 (en) * 2021-01-12 2022-07-21 Peking University Targeted rna editing by leveraging endogenous adar using engineered rnas

Also Published As

Publication number Publication date
BR112021020608A8 (pt) 2023-03-21
US20220307020A1 (en) 2022-09-29
MX2021012645A (es) 2021-11-12
CN113939591A (zh) 2022-01-14
IL287248A (en) 2021-12-01
US11702658B2 (en) 2023-07-18
WO2020211780A1 (en) 2020-10-22
US20220098587A1 (en) 2022-03-31
PE20212214A1 (es) 2021-11-19
AU2020259548A1 (en) 2021-12-09
ECSP21080618A (es) 2021-12-30
SG11202111401RA (en) 2021-11-29
AU2020259548B2 (en) 2023-10-12
CA3136735A1 (en) 2020-10-22
JP2022526455A (ja) 2022-05-24
BR112021020608A2 (pt) 2022-02-22
KR20220004674A (ko) 2022-01-11
CO2021015214A2 (es) 2022-02-07
CL2021002695A1 (es) 2022-07-01
EP3956449A1 (en) 2022-02-23
EP3956449A4 (en) 2023-03-29
CR20210572A (es) 2022-04-07

Similar Documents

Publication Publication Date Title
AU2020259548B2 (en) Methods and compositions for editing RNAs
AU2019357450B2 (en) Methods and compositions for editing RNAs
US11661596B2 (en) Targeted RNA editing by leveraging endogenous ADAR using engineered RNAs
CA2968336A1 (en) Construct for site directed editing of an adenosine nucleotide in target rna
WO2022150974A1 (en) Targeted rna editing by leveraging endogenous adar using engineered rnas
TW202339775A (zh) 工程化的 adar 募集 rna 及其使用方法