TW202214853A - 一種改善的rna編輯方法 - Google Patents

一種改善的rna編輯方法 Download PDF

Info

Publication number
TW202214853A
TW202214853A TW110124834A TW110124834A TW202214853A TW 202214853 A TW202214853 A TW 202214853A TW 110124834 A TW110124834 A TW 110124834A TW 110124834 A TW110124834 A TW 110124834A TW 202214853 A TW202214853 A TW 202214853A
Authority
TW
Taiwan
Prior art keywords
target
rna
arrna
base
residue
Prior art date
Application number
TW110124834A
Other languages
English (en)
Inventor
袁鵬飛
易澤軒
劉能銀
Original Assignee
大陸商博雅輯因(北京)生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商博雅輯因(北京)生物科技有限公司 filed Critical 大陸商博雅輯因(北京)生物科技有限公司
Publication of TW202214853A publication Critical patent/TW202214853A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申請涉及一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基)、靶標殘基、和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基或下游殘基直接相對的錯配。本申請還涉及用於上述方法的arRNA、藉由RNA編輯方法獲得的RNA以及包含該RNA的宿主細胞,以及藉由RNA編輯方法治療疾病的應用。

Description

一種改善的RNA編輯方法
本發明屬於基因編輯領域,具體地屬於RNA編輯領域,包括將脫氨酶招募RNA(dRNA,也稱arRNA)或編碼該arRNA的構建體引入宿主細胞,在宿主細胞的靶標殘基位置編輯靶標RNA。
CRISPR技術
近年來,以CRISPR(Clustered regularly interspaced short palindromic repeats,WO2014018423A3)為首的基因組編輯技術正在飛速發展,並對生物以及醫學諸多領域產生了深遠的影響。許多科研工作者和生物技術公司也在致力於將該技術推上臨床。2019年9月,北京大學鄧宏魁教授與其合作者發表文章,首次報導了利用CRISPR技術編輯幹細胞並將其回輸至患者,以治療其愛滋病和白血病的臨床實驗結果,為CRISPR技術在基因治療方向的轉化做出了巨大的貢獻。
儘管CRISPR技術存在極大的潛在應用前景,但該技術也存在一系列缺陷,導致該技術從科研階段向臨床治療應用中的轉化步履維艱。問題之一便是CRISPR技術用到的核心作用酶:Cas9。基於CRISPR的DNA編輯技術,必須引入外源表達Cas9或擁有相似功能的其它核酸酶,從而造成了以下幾個問題。首先,需要外源表達的核酸酶通常具有較大分子量,這使得藉由病毒載劑將其遞送至體內的效率急劇下降。其次,Cas9的表達在多人的研究中被證實存在潛在致癌風險。p53是研究最多的抑癌基因,Haapaniemi等人研究發現,Cas9系統能夠啟動p53引起的DNA損傷(Haapaniemi et al., 2018),而Enache等人也發現Cas9蛋白的過表達能夠選擇性富集p53失活突變的細胞 (Enache et al., 2020)。此外,Adikusuma發現Cas9編輯後的小鼠受精卵中存在大量大片段DNA缺失 (Adikusuma et al., 2018),而Cullot等人更是發現,Cas9進行編輯後基因組上會出現上百萬鹼基的大片段缺失,更重要的是,此等缺失的片段中包括5個原癌基因和7個抑癌基因 (Cullot et al., 2019)。最後,外源表達的Cas9通常是細菌來源的,例如金黃葡萄球菌或釀膿鏈球菌,而非人類或哺乳動物天然存在的,這使得其可能引起患者體內的免疫反應。Charlesworth等人研究發現在人血清中存在Cas9的IgG抗體 (Charlesworth et al., 2019)。這一態樣可能會使外源表達的核酸酶被中和,從而失去應有的活性,另一態樣也可能會對患者自身造成損傷甚至毒性或者阻礙進一步的干預治療。
RNA層面的A到I編輯
為了避免DNA編輯中潛在的風險,科學家們也同時對RNA編輯產生了濃厚的興趣。存在於DNA中的遺傳信息,需要轉錄成RNA,並進一步翻譯成蛋白質才能發揮正常的生理功能,這被稱為生物的中心法則。相比於DNA層面的編輯,RNA層面的編輯,在避開了基因組損傷的同時,又能在最終生物功能上做出改變。常見的RNA編輯之一,是ADAR (Adenosine deaminases acting on RNA)介導的腺苷A到鳥苷I的編輯。麻省理工學院張鋒(Feng Zhang)教授課題組2017年曾報導一種名為REPAIR (RNA Editing for Programmable A to I Replacement)的RNA編輯技術藉由外源表達Cas13-ADAR融合蛋白及單嚮導RNA (single guide RNA, sgRNA)同樣可以實現靶向目標RNA的A到I的編輯 (Cox et al., 2017)。該方法中,Cas13與sgRNA結合,行使靶向的功能,將融合蛋白帶至需要編輯的位元點,同時ADAR去胺基化結構域發揮催化作用,實現A到I的編輯。但是該方法同CRISPR技術一樣,仍需要外源蛋白的表達。無法解決外源蛋白表達造成的問題。
為了解決以上問題,以便將核酸編輯技術更好地應用於醫學領域,迫切地需要找到一種新的核酸編輯技術,尤其是不依賴於外源蛋白表達的新技術。2019年7月,北京大學生命科學學院魏文勝教授課題組在Nature Biotechnology上發表文章, “Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs”,首次報導了新的核酸編輯技術:LEAPER (Leveraging Endogenous ADAR for Programmable Editing of RNA, Qu et al., 2019)(WO2020074001A1)。與CRISPR(WO2014018423A3)及REPAIR技術(WO2019005884A1)不同的是,該技術從原理上擺脫了對外源核酸酶過表達的依賴,使得該技術在向醫學領域轉化的過程中,有更大的優勢。但該技術只能實現腺苷A到肌酐I的編輯,即腺苷A到鳥苷G的編輯(因為肌酐I在蛋白質翻譯過程中會被識別為鳥酐G),因此其應用上依然有所局限。與CRISPR技術類似,該技術同樣需要一段RNA作為嚮導,以便將內源的核酸酶招募至所需編輯的位點。該段嚮導RNA被命名為arRNA (adar-recruiting RNA)。
2019年1月,Thorsten Stafforst課題組也曾報導與LEAPER技術類似的核酸編輯技術,名為RESTORE (Recruiting Endogenous ADAR to Specific Transcripts for Oligonucleotide-mediated RNA Editing, WO2020001793A1)。與LEAPER類似,RESTORE也能夠擺脫對外源蛋白的依賴。但與LEAPER不同的是,首先,RESTORE技術需要在IFN-γ存在的前提下才能有較高的編輯效率,而IFN-γ是決定自體免疫發展和嚴重程度的關鍵因數(Pollard et al., 2013),這使得該技術在醫學領域的應用大打折扣。另一態樣,RESTORE技術中同樣也用到一段嚮導RNA,而其使用的嚮導RNA必須為化學合成的寡核苷酸,並且所述合成的寡核苷酸需要人為引入大量的化學修飾以保證其穩定性。在此等化學修飾中,有一部分修飾可能會存在潛在的毒性或是免疫原性,也有一部分修飾會導致相同鹼基鏈的不同構象,使得相同序列的RNA可能有數十種不同的構象組合。相比之下,LEAPER技術不僅可以藉由化學合成RNA完成,也可以藉由腺相關病毒(AAV)、慢病毒等載劑遞送至患者細胞內發揮功能,這使得其在遞送手段的選擇上更加靈活多變。
A到I編輯位點的上下游殘基或序列
在DNA的編輯中,經過編輯的位點會藉由複製傳遞至所有子代細胞中,因此DNA層面的編輯就算效率相對低一些,也可以藉由對子代細胞的篩選等方式富集編輯過的細胞。於此不同的是,在RNA編輯的過程中,所造成的編輯是不會被遺傳的。因此,一態樣RNA編輯中的脫靶靶點無法遺傳到子代,這使得RNA層面的編輯比DNA編輯更安全,另一態樣也使得RNA編輯的效率顯得更為重要。在A到I的RNA編輯中,無論是REPAIR(WO2019005884A1)、RESTORE(WO2020001793A1)還是LEAPER(WO2020074001A1)體系,都用到ADAR作為催化反應的關鍵酶。在哺乳動物細胞中,有三種類型的ADAR蛋白,ADAR1(兩個同種型,p110和p150),ADAR2和ADAR3(無催化活性)。ADAR蛋白的催化底物是雙鏈RNA,它可以從腺苷(A)核苷鹼基中去除-NH2基團,將A變為肌苷(I),後者被識別為鳥苷(G)並且在之後的細胞生理過程中,例如逆轉錄和翻譯過程中,或病毒RNA在胞內複製過程中,與胞苷(C)配對。由於ADAR的特定性質,一些同樣的因素影響著REPAIR、RESTORE及LEAPER編輯系統對RNA的編輯效率。這其中之一便是編輯位點的上下游殘基及序列。被編輯的腺苷A(靶標A),即這裡的靶標殘基,在mRNA中5'上游和3'下游相鄰的鹼基各是什麼鹼基對編輯的效率影響較為明顯。為敘述方便,我們將與靶標殘基相鄰的5'上游鹼基(上游殘基)、靶標殘基以及與靶標殘基相鄰的3'下游鹼基(下游殘基)按照5'到3'的順序連起來形成的基序稱為“三鹼基基序”。由於靶標A的上游殘基和下游殘基均可以為A、U、C、G,因此所述三鹼基基序可以有16種組合,即AAA、AAU、AAC、AAG、UAA、UAU、UAC、UAG、CAA、CAU、CAC、CAG、GAA、GAU、GAC、GAG。針對不同的三鹼基基序,在REPAIR、RESTORE、LEAPER體系中均有不同的編輯效率,這種針對不同三鹼基基序編輯效率不同的情況在本文中稱為“三連偏好性”。
在REPAIR體系中,由於採用了Cas13-ADAR的融合蛋白,該體系的三連偏好性略有不同。如圖1所示 (Cox et al, 2017),REPAIR體系對三鹼基基序GAC的編輯效率最低,而對UAU編輯效率最高,相差約2~3倍。
在RESTORE體系中,作者沒有直接展示對三鹼基基序偏好性的資料,但是文章中曾引用另一篇文章(Vogel et al., 2018),並說明可能與該體系偏好一致 (Merkle et al., 2019)。如圖2所示(Vogel et al., 2018),圖中三角形為SA1Q,具體實施方法為將人ADAR1催化結構域與人O 6-烷基鳥嘌呤DNA烷基轉移酶(O 6-alkylguanine-DNA-alkyl transferase, hAGT)C端結構域(SNAP-tag)進行融合,並在835位胺基酸進行麸胺酸到穀氨醯胺的突變(E-Q),再藉由SNAP-tag與嚮導RNA進行共價交聯(Keppler, A. et al., 2003;Stafforst, T., et al., 2012);圖中方塊形為SA2Q具體實施方法為將人ADAR2催化結構域與人O 6-烷基鳥嘌呤DNA烷基轉移酶(O 6-alkylguanine-DNA-alkyl transferase, hAGT)C端結構域(SNAP-tag)進行融合,並在1310位胺基酸進行麸胺酸到穀氨醯胺的突變(E-Q),再藉由SNAP-tag與嚮導RNA進行共價交聯(Keppler, A. et al., 2003;Stafforst, T., et al., 2012)。可以看到在兩種不同的ADAR中,其三連偏好性具有趨勢類似的明顯差異。在5'上游殘基是G的時候,即GAA、GAU、GAC、GAG中其編輯效率通常遠低於其它三鹼基基序,甚至接近未編輯時的水準,而UAG是其中編輯效率最高的幾個三鹼基基序之一。如圖2所示,該體系對UAG的編輯效率最多可達到其對上游殘基為G的三鹼基基序的編輯效率的10倍。
在LEAPER體系中,作者直接測試了該體系的三連偏好性 (Qu et al., 2019)。如圖3所示,在LEAPER體系中,由於該體系與RESTORE體系相同,均採用完整的未經修飾和修改的ADAR,所以並不難理解,其呈現出與RESTORE體系類似的三連偏好性。從圖3中我們可以看出,LEAPER體系中編輯效率最低的也是GAA、GAU、GAC、GAG的三鹼基基序,並且接近於零,而效率最高的三鹼基基序是UAG,LEAPER體系對UAG的編輯效率同樣最多可達到其對上游殘基為G的三鹼基基序的編輯效率的10倍以上。綜上所述,在REPAIR體系中,由於採用了外源過表達的Cas13-ADAR,因此其三連偏好性略有不同。而在LEAPER體系與RESTORE體系中,由於均採用未經修飾和更改的ADAR,其三連偏好性呈現出近似的模式。在所有三鹼基基序中,利用這類以未經修飾和更改的ADAR進行編輯時,其針對UAG的編輯效率最高或者是最高的幾個三鹼基基序之一。而當5’上游殘基為G的時候,其編輯效率明顯降低,甚至接近於零,兩者之間相差10倍以上。這說明在現有技術中,利用內源ADAR進行RNA編輯的體系,幾乎無法對三鹼基基序中5’上游殘基為G的位點進行編輯。
在現有技術中,利用脫胺基酶進行RNA編輯的技術體系的三連偏好性限制了現有RNA編輯技術的應用範疇。例如,現有的RNA編輯技術對於三鹼基基序中上游殘基為G的位點近乎束手無策,而這使得該體系在疾病治療的應用之中大打折扣。當我們面對遺傳病時,如果其致病基因突變的上游殘基剛好是G,我們便很難使用已知的RNA編輯手段進行糾正和治療。而本發明所要解決的問題,正是針對現有技術中所偏好的三鹼基基序以外的其它三鹼基基序,例如UAG以外的其它三鹼基基序,藉由對用於招募脫胺基酶到達靶標RNA進行精准編輯的招募RNA(deaminase recruiting RNA,dRNA或arRNA)序列進行調整,從而在無需對現有脫胺基酶做任何修飾或更改的情況下突破三連偏好性的限制,使三鹼基基序中上游殘基為G或者C時編輯效率大大提高。
因此,一態樣,本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基或下游殘基直接相對的錯配。
在一些實施方案中,本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和下游殘基直接相對的錯配。
在某些實施方案中,所述三鹼基基序的上游殘基為G。在某些實施方案中,所述三鹼基基序的上游殘基為A。在某些實施方案中,所述三鹼基基序的上游殘基為C。在某些實施方案中,所述三鹼基基序的下游殘基為C。在某些實施方案中,所述三鹼基基序的下游殘基為U。在某些實施方案中,所述三鹼基基序的下游殘基為A。在某些實施方案中,所述三鹼基基序選自GAG,GAC,GAA,GAU,AAG,AAC,AAA,AAU,CAG,CAC,CAA,CAU,UAA,UAC和UAU。
根據本申請提供的方法,在一些實施方案中,當所述三鹼基基序的上游殘基為G時,其中所述互補RNA中與所述上游殘基相對的鹼基為G。在一些實施方案中,當所述三鹼基基序上游殘基為G時,其中所述互補RNA中與所述上游殘基相對的鹼基為A。在一些實施方案中,所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為ACG或ACA。在一些實施方案中,所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為ACG。在一些實施方案中,所述三鹼基基序是GAA,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為UCA、CCG、CCC或UCC。在某些實施方案中,所述三鹼基基序是GAA,所述互補RNA序列中與所述三鹼基基序直接相對的三連互補鹼基為UCA。在一些實施方案中,所述三鹼基基序是GAC,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為GCG或GCA。在某些實施方案中,所述三鹼基基序是GAC,所述互補RNA序列與所述三鹼基基序直接相對的三連互補鹼基為GCG。在一些實施方案中,所述三鹼基基序是GAG,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為CCG、CCA、CCC、UCC或UCG。在某些實施方案中,所述三鹼基基序是GAG,所述互補RNA序列中與所述三鹼基基序直接相對的三連互補鹼基為CCG。
在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷(C),腺苷(A)或尿苷(U)。在一些特定的實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C。
根據本發明所述的方法,在一些實施方案中,所述互補RNA序列與靶標RNA雜交時還包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。在某些實施方案中,與一個或多個非靶標腺苷相對的錯配核苷為鳥苷。
在一些實施方案中,所述三鹼基基序上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G或A。在一些實施方案中,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G或A,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G或A,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。
在本申請的上述RNA編輯方法中,RNA的編輯效率相對於現有技術提高至少90%至1100%,例如提高至少100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%。
在一些實施方案中,所述靶RNA中的靶標腺苷(A)藉由腺苷脫氨酶(Adenosine Deaminase Acting on RNA,ADAR)脫胺基。在某些實施方案中,所述腺苷脫氨酶為天然ADAR或其同源蛋白。在某些實施方案中,所述腺苷脫氨酶為經過修飾但保留了腺苷脫氨酶活性的腺苷脫氨酶功能變體,例如在天然ADAR或其同源蛋白基礎上經一個或多個位點突變修飾但仍然具有腺苷脫氨酶活性的變體。在某些實施方案中,所述腺苷脫氨酶為包含ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為包含經突變喪失催化活性的Cas13蛋白與ADAR功能結構域或ADAR同源蛋白功能結構域或腺苷脫氨酶功能變體的融合蛋白。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶藉由外源引入所述宿主細胞中或藉由導入該脫氨酶的構建體在宿主細胞中表達。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為包含λN肽與ADAR功能結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為SNAP-tag標記的ADAR或SNAP-tag標記的ADAR功能變體。在某些實施方案中,所述ADAR是ADAR1和/或ADAR2。在一些實施方案中,ADAR是選自由hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2構成的組的一種或多種ADAR。
在某些實施方案中,所述ADAR由所述宿主細胞表達。在某些實施方案中,ADAR天然地或內源地存在於宿主細胞中,例如,天然地或內源地存在於真核細胞中。在某些實施方案中,所述ADAR蛋白經外源引入所述宿主細胞中。在某些實施方案中,將所述ADAR或編碼所述ADAR的構建體引入宿主細胞。在一些實施方案中,所述構建體選自包括但不限於以下的任一項:線性核酸、質體、病毒等。在上述方法中,所述ADAR包括上述天然ADAR、其同源蛋白、經過修飾但保留了腺苷脫氨酶活性的腺苷脫氨酶功能變體(例如在天然ADAR或其同源蛋白基礎上經一個或多個位點突變修飾但仍然具有腺苷脫氨酶活性的變體)或包含ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在一些實施方案中,所述方法不包含將任何蛋白質引入宿主細胞中。在某些實施方案中,所述ADAR是ADAR1和/或ADAR2。在一些實施方案中,ADAR是選自由hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2構成的組的一種或多種ADAR。
本申請另一態樣提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其中所述靶標殘基是胞苷,所述arRNA招募作用於RNA的具有胞苷脫氨酶活性的脫氨酶(或稱為“胞苷脫氨酶”,在本申請中,具有胞苷脫氨酶活性的脫氨酶和胞苷脫氨酶表示相同含義,可互換使用),以使所述靶標RNA中的靶標胞苷脫氨。在一些實施方案中,將具有胞苷脫氨酶活性的脫氨酶或包含編碼具有胞苷脫氨酶活性的脫氨酶的的構建體引入宿主細胞。在所述方法中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中靶標殘基為胞苷(C),其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和/或下游殘基直接相對的錯配。
在一些實施方案中,所述靶標胞苷所在的三鹼基基序選自以下任一項:GCG, GCC,GCA,GCU,ACG,ACC,ACA,ACU,CCG,CCC,CCA,CCU,UCA,UCC,UCU和UCG。在一些實施方案中,所述arRNA在對應於靶標RNA的靶標殘基的位置包含非配對核苷酸,以形成和靶標殘基的錯配。在一些實施方案中,所述arRNA中可與所述靶標RNA雜交的互補RNA序列包含與所述靶RNA中的所述靶標胞苷直接相對的胞苷,腺苷或尿苷。在某些實施方案中,所述互補RNA序列包含與所述靶標胞苷直接相對的尿苷。在某些實施方案中,所述arRNA在對應於靶RNA的非靶標編輯位點包含一個或多個非配對核苷酸,以形成與靶標RNA的非靶標位點的一個或多個錯配。
在一些實施方案中,所述三鹼基基序上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G。在一些實施方案中,所述三鹼基基序下游殘基為A,且其中所述互補RNA中與所述下游殘基相對的鹼基為U或A。在一些實施方案中,所述三鹼基基序為ACA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUU或GUU。在一些實施方案中,所述三鹼基基序為ACA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUU。在一些實施方案中,所述三鹼基基序為UCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUA、GUA或CUA。在一些實施方案中,所述三鹼基基序為UCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUA。在一些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG或UCG。在一些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG。在一些實施方案中,所述三鹼基基序為CCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUG。
在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶是對ADAR蛋白或包含ADAR催化結構域的融合蛋白進行基因修飾後獲得C到U催化活性的脫氨酶。在某些實施方案中,所述胞苷脫氨酶為經修飾的ADAR2,且包含選自如下一個或多個突變的ADAR2催化結構域: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。在某些實施方案中,胞苷脫氨酶為包含如下全部突變的ADAR2催化結構域的融合蛋白:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶還包含靶向結構域。在某些實施方案中,所述靶向結構域包含但不限於選自以下的任一項:經突變喪失催化活性的Cas13蛋白、λN肽、SNAP-tag。包含經突變喪失催化活性的Cas13蛋白。在一些實施方案中,所述融合蛋白包含經突變喪失催化活性的Cas13蛋白和具有胞苷脫氨酶活性的ADAR2催化結構域。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶藉由外源引入所述宿主細胞中或藉由導入該脫氨酶的構建體在宿主細胞中表達。
在某些實施方案中,所述方法包括將所述胞苷脫氨酶或融合蛋白或編碼所述胞苷脫氨酶或融合蛋白的構建體引入包含靶標RNA的細胞,其中編碼所述胞苷脫氨酶或融合蛋白的構建體選自包括但不限於以下的任一項:線性核酸、質體、病毒、及線性核酸。在某些實施方案中,所述靶標RNA中的三鹼基基序中的靶標殘基為胞苷,所述三鹼基基序的上游殘基選自G,C,A和U的核苷酸,較佳的次序是G>C>A≈U。
根據本申請的上述方法,所述arRNA為單鏈RNA。在一些實施方案中,所述互補RNA序列完全是單鏈。在某些實施方案中,所述arRNA包含一個或多個(例如,1、2、3或更多個)雙鏈區和/或一個或多個莖環區。在某些實施方案中,所述arRNA僅由所述互補RNA序列組成。
根據本發明所述的方法,在一些實施方案中,所述arRNA的長度為約20-260個核苷酸,例如所述arRNA的長度為40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70- 160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任一項。在一些實施方案中,所述arRNA長約60-200個核苷酸(例如約60-150、65-140、68-130或70-120中的任何一個)。在一些實施方案中,所述arRNA還包含ADAR招募結構域。
根據本發明所述的方法,在一些實施方案中,所述arRNA包含一種或多種化學修飾。在一些實施方案中所述化學修飾包含甲基化和/或硫代磷酸化,例如2′-O-甲基化(2′-O-Me)和/或核苷酸間硫代磷酸酯鍵。在某些實施方案中,所述arRNA的首尾的3個或5個核苷酸包含2'-O-Me修飾,和/或其首尾的3個、4個或5個核苷酸間的連接含有硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA中的一個或多個或所有尿苷包含2′-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含2'-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含3'-硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA不包含任何化學修飾。
本發明還提供所述經本發明提供的編輯靶標RNA的方法所產生的經編輯的RNA或包含經編輯的RNA的宿主細胞。
本發明所提供的在宿主細胞的靶標殘基位置編輯靶標RNA的方法可用於個體中治療或預防疾病或病症中。因此本發明還提供一種用於在個體中治療或預防疾病或病症的方法,包括使用前述本發明所提供的任意一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法編輯個體細胞中與所述疾病或病症相關的靶標RNA。在一些實施方案中,所述疾病或病症是遺傳性基因疾病或與一種或多種獲得性基因突變(例如,藥物抗性)相關的疾病或病症。
本發明還提供了可以在本發明所提供的方法中使用的一種藉由招募作用於RNA的脫氨酶對靶標RNA中的靶標殘基脫胺基的RNA(arRNA),其包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中的靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中的靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與靶標RNA的上游殘基和/或下游殘基直接相對的錯配。
根據本發明所提供的arRNA,所述arRNA包含與所述靶標RNA中的所述靶標腺苷直接相對的C。在某些實施方案中,所述arRNA與靶標RNA雜交時還包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。在某些實施方案中,與一個或多個非靶標腺苷相對的錯配核苷為鳥苷。在某些實施方案中,所述三鹼基基序是GAU,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為ACG或ACA。在某些實施方案中,所述三鹼基基序是GAU,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為ACG。在某些實施方案中,所述三鹼基基序是GAA,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為UCA、CCG、CCC或UCC。在某些實施方案中,所述三鹼基基序是GAA,所述arRNA中與所述三鹼基基序直接相對的三連互補鹼基為UCA。在某些實施方案中,所述三鹼基基序是GAC,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為GCG或GCA。在某些實施方案中,所述三鹼基基序是GAC,所述arRNA與所述三鹼基基序直接相對的三連互補鹼基為GCG。在某些實施方案中,所述三鹼基基序是GAG,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為CCG、CCA、CCC、UCC或UCG。在某些實施方案中,所述三鹼基基序是GAG,所述arRNA中與所述三鹼基基序直接相對的三連互補鹼基為CCG。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA的長度為約20-260個核苷酸,例如40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70- 160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任一項。在一些實施方案中,所述arRNA長約60-200個核苷酸(例如約60-150、65-140、68-130或70-120中的任何一個)。在一些實施方案中,所述arRNA還包含ADAR招募結構域。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA包含一種或多種化學修飾。在一些實施方案中所述化學修飾包含甲基化和/或硫代磷酸化,例如2′-O-甲基化(2′-O-Me)和/或核苷酸間硫代磷酸酯鍵。在某些實施方案中,所述arRNA的首尾的3個或5個核苷酸包含2'-O-Me修飾,和/或其首尾的3個、4個或5個核苷酸間的連接含有硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA中的一個或多個或所有尿苷包含2′-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含2'-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含3'-硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA不包含任何化學修飾。
本發明還提供一種病毒載劑、質體或線性核酸鏈,其包含本發明所提供的上述任一種arRNA,且所述arRNA不包含任何化學修飾。本發明還提供一種文庫,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。本發明還提供一種組合物,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。本發明還提供一種宿主細胞,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。在一些實施方案中,所述包含本發明所提供的上述任一種arRNA的宿主細胞是一種真核細胞。
本發明提供一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞。所述arRNA包含互補RNA序列,所述互補RNA序列與其靶標RNA雜交,形成雙鏈RNA,招募作用於RNA的脫氨酶以使靶標RNA中的靶標殘基脫胺基,經過脫胺基作用後所述殘基中的鹼基類型發生改變。本申請提供了一種編輯靶標RNA的方法,其中藉由對arRNA與所述靶標RNA的設計顯著提升了現有技術中使用ADAR的RNA編輯系統對不符合ADAR自然偏好性的UAG以外的其他三鹼基基序的編輯效率,打破了RNA編輯應用中長久以來在編輯位點選擇上存在的限制。藉由本申請的方法,可以大大拓展藉由RNA編輯方法治療疾病的範疇和效果,使更多疾病,例如更多因基因突變引起的遺傳性疾病有機會藉由RNA編輯的方法得到安全有效的治療。藉由使用本申請提供的方法和/或arRNA,未來RNA編輯療法所能治療的G->A突變引起的疾病,其突變位點所在的三鹼基基序可以有更靈活的選擇。例如,當所述突變位點所在三鹼基基序為GAU時,現有技術的編輯效率根本無法達到治療要求,而藉由本申請提供的方法所達到的編輯效率則超過了現有技術的至少10倍。此外,由於經過適當改造後的ADAR蛋白可以進行C->U的RNA鹼基編輯,因此本發明的方法還可以提升RNA編輯系統對靶標殘基為C的不同三鹼基基序的編輯效率。
因此,本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和/或下游殘基直接相對的錯配。
本文所述的“靶標RNA”為預進行編輯的RNA。本申請中“鹼基”和“殘基”,指核鹼基,例如“腺嘌呤”,“鳥嘌呤”,“胞嘧啶”,“胸腺嘧啶”,“尿嘧啶”和“次黃嘌呤”。術語“腺苷”,“鳥苷”,“胞苷”,“胸苷”,“尿苷”和“肌苷”是指與核醣或去氧核醣的醣部分連接的核鹼基。術語“核苷”是指與核醣或去氧核醣連接的核鹼基。術語“核苷酸”是指各自的核鹼基-核醣基-磷酸酯或核鹼基-去氧核醣基-磷酸酯。有時術語腺苷和腺嘌呤(縮寫“A”),鳥苷和鳥嘌呤(縮寫“G”),胞嘧啶和胞苷(縮寫“C”),尿嘧啶和尿苷(縮寫“U”),胸腺嘧啶和胸苷(縮寫“T”),肌苷和次黃嘌呤(縮寫“I”),可互換使用,指相應的核鹼基,核苷或核苷酸。核酸鏈內的前一個核苷酸的3’羥基和下一個核苷酸的5’磷酸形成3’,5’磷酸二酯鍵,3’脫掉1個羥基-OH,在本文中被稱為“核苷酸殘基”或“殘基”。有時,術語核鹼基、鹼基、核苷、核苷酸、核苷酸殘基和殘基可互換使用,除非上下文明確要求不同。
如本文所用,核酸的“互補”是指一條核酸藉由傳統的Watson-Crick鹼基配對與另一條核酸形成氫鍵的能力。百分比互補性表示核酸分子中可與另一核酸分子形成氫鍵(即,Watson-Crick鹼基配對)的殘基的百分比(例如,10個中的約5、6、7、8、9、10 個分別為約50%,60%,70%,80%,90%和100%互補)。“完全互補”是指核酸序列的所有連續殘基與第二核酸序列中相同數量的連續殘基形成氫鍵。如本文所用,“基本上互補”是指在約40、50、60、70、80、100、150、200、250或更多個核苷酸的區域內,至少約70%,75%,80%,85%,90%,95%,97%,98%,99%或100%中的任何一個的互補程度,或指在嚴格條件下雜交的兩條核酸。對於單個鹼基或單個核苷酸,按照Watson-Crick鹼基配對原則,A與T或U、C與G或I配對時,被稱為互補或匹配,反之亦然;而除此以外的鹼基配對都稱為不互補或不匹配。
“雜交”是指其中一種或多種多核苷酸反應形成複合物的反應,所述複合物藉由核苷酸殘基的鹼基之間的氫鍵穩定。所述氫鍵可以藉由Watson Crick鹼基配對,Hoogstein結合或以任何其他序列特異性的方式發生。能夠與給定序列雜交的序列稱為給定序列的“互補序列”。
術語“RNA編輯”(RNA editing)是在RNA上發生的鹼基插入、缺失或替換等現象。許多用於RNA編輯的系統中常常會使用的一種酶是作用於RNA的腺苷脫氨酶(Adenosine deaminases acting on RNA,ADAR)、其變體或包含其功能結構域的複合物。ADAR蛋白家族能結合到特定RNA的雙鏈區域,它可以從腺苷(A)核苷鹼基中去除-NH2基團,將A變為肌苷(I),後者在翻譯過程中被識別為鳥苷(G)並且在隨後的細胞翻譯過程中與胞苷(C)配對。A->I (Adenosine-to-inosine)的RNA編輯是動物中最普遍的RNA編輯類型,廣泛的參與轉錄水準和轉錄後水準的多種基因調控機制,比如在轉錄組水準改變胺基酸序列,調控mRNA剪切、mRNA穩定性和環狀RNA形成等等(Nishkura K. 2010)。在哺乳動物細胞中,有三種類型的ADAR蛋白,ADAR1(兩個同種型,p110和p150),ADAR2和ADAR3(無催化活性)。研究人員將λN肽與人類ADAR1或ADAR2脫氨酶結構域相融合來構建λN-ADARDD系統,該系統可由BoxB莖環和反義RNA組成的融合RNA來引導,結合特定的RNA靶標。該方法可以在靶標A鹼基處將靶標A編輯為I(引入A-C錯配),從而導致從A至G的RNA鹼基編輯。用於RNA編輯的其他方法包括將反義RNA融合至R/G基序(ADAR-招募RNA支架)以藉由在哺乳動物細胞中過表達ADAR1或ADAR2蛋白來編輯靶標RNA,以及利用dCas13-ADAR精確打靶和編輯RNA。RNA層面的編輯,一態樣避開了基因組損傷的同時,另一態樣又能在最終生物功能上做出改變。
術語“脫氨酶招募RNA”、“dRNA”、“arRNA”或“ADAR招募RNA”在本文中可互換使用,指能募集招募ADAR,ADAR變體或某些包含其結構域的複合體,在RNA中使靶標腺苷脫氨或使靶標胞苷脫氨的RNA。在本申請上下文中,“靶標RNA”是指將脫氨酶招募RNA序列設計為與其具有完全互補性或基本互補性的RNA序列,靶標RNA上包含靶標殘基。“靶標殘基”在本文中是指藉由RNA編輯,例如藉由引入ADAR酶及arRNA,進行修改的核苷酸殘基。靶標序列與arRNA之間雜交形成包含靶標殘基的雙鏈RNA(dsRNA)區域,其招募作用於靶標殘基的腺苷脫氨酶(ADAR)或其變體,該酶或其變體使靶標殘基脫胺基。
“三鹼基基序”表示包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基)的三個連續鹼基序列。在本申請“三鹼基基序”的語境中,“靶標殘基”位於“編輯位點”,因此如無特別說明,可以互換使用。三鹼基基序中上游殘基和下游殘基往往決定了針對靶標殘基的RNA編輯是否可以以較高的效率進行編輯。例如,針對不同的三鹼基基序,在REPAIR(WO2019005884A1)、RESTORE(WO2020001793A1)、LEAPER(WO2020074001A1)等RNA編輯體系中均有不同的編輯效率,這種針對不同三鹼基基序編輯效率不同的情況在本文中稱為“三連偏好性”。
互補RNA序列中與所述靶標RNA中三鹼基基序直接相對的三個鹼基,即與所述靶標殘基直接相對的鹼基(本申請中稱為“靶向鹼基”),以及所述鹼基的5'最近鄰殘基和所述鹼基的3'最近鄰殘基所組成的三連基序,在本文中被稱為“三連互補鹼基”。
在本文中,所有三鹼基基序和三連互補鹼基均為5'到3'的順序。
在本申請的方法中,靶標RNA與arRNA之間雜交形成含有靶標殘基的雙鏈RNA(dsRNA)區域,其招募作用於RNA的脫氨酶,該酶使靶標殘基脫胺基。本發明所提供的方法包括設計arRNA並將所述arRNA或編碼所述arRNA的構建體引入宿主細胞。所述arRNA序列中的互補RNA序列與所述靶標RNA雜交形成的雙鏈RNA可招募作用於RNA的脫氨酶以使靶標RNA中的靶標殘基脫胺基,經過脫胺基作用後所述殘基中的鹼基類型可發生改變。由於經脫胺基作用,腺苷(A)可轉化為肌酐(I),而I被識別為鳥苷(G),實現A至G的編輯。同樣的,胞苷(C)脫胺基可轉化為尿苷(U),實現C至U的編輯。
RNA編輯存在三連偏好性,例如圖2及圖3所示。對上游殘基為鳥苷(G)的三鹼基基序更低的三連偏好性是目前以ADAR為基礎的RNA編輯方法的共性。同樣的,在C至U的編輯中,公開文獻也顯示了明顯的三連偏好性。正是由於這種三連偏好性的限制,為滿足實際應用的需要,獲得較高的編輯效率,現有技術中的各種基於脫氨酶的RNA編輯系統必須儘量選取一些三連偏好性更高的三鹼基基序進行編輯。這就束縛了RNA編輯的應用範疇。本申請提供了改進的、在宿主細胞的靶標殘基位置編輯靶標RNA的方法,包括在arRNA中與三鹼基基序直接相對的鹼基處引入更多錯配,顯著提升現有技術中使用ADAR的RNA編輯系統對不符合脫氨酶三連偏好性的三鹼基基序中靶標鹼基的編輯效率,打破了RNA編輯應用中長久以來在編輯位點選擇上存在的限制。
因此,一態樣,本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含互補RNA序列,所述互補RNA序列與靶標RNA雜交,形成雙鏈RNA,招募作用於RNA的脫氨酶以使靶標RNA中的靶標殘基脫胺基。所述靶標殘基位於靶標RNA中的一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基)。從5'到3',由所述上游殘基、靶標殘基及下游殘基依次連接而成的三連體被稱為“三鹼基基序”。在本申請中,所有三鹼基基序都是以5'到3'的方式描述的。而與所述靶標RNA中三鹼基基序相對的互補RNA序列中的三鹼基也為5'到3'的順序。
本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基或下游殘基直接相對的錯配。
在一些實施方案中,本申請提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和下游殘基直接相對的錯配。
在某些實施方案中,所述三鹼基基序的上游殘基為G。在某些實施方案中,所述三鹼基基序的上游殘基為A。在某些實施方案中,所述三鹼基基序的上游殘基為C。在某些實施方案中,所述三鹼基基序的下游殘基為C。在某些實施方案中,所述三鹼基基序的下游殘基為U。在某些實施方案中,所述三鹼基基序的下游殘基為A。在某些實施方案中,所述三鹼基基序選自GAG,GAC,GAA,GAU,AAG,AAC,AAA,AAU,CAG,CAC,CAA,CAU,UAA,UAC和UAU。在某些實施方案中,所述三鹼基基序為GAU。在某些實施方案中,所述三鹼基基序為GAG。在某些實施方案中,所述三鹼基基序為GAA。在某些實施方案中,所述三鹼基基序為GAC。在一些實施方案中,所述靶標RNA中的上游殘基選自G,C,A和U的核苷酸,較佳次序為G>C≈A>U。在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷(C),腺苷(A)或尿苷(U)。在一些特定的實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C。
根據本發明所述的方法,在一些實施方案中,所述互補RNA序列與靶標RNA雜交時還包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。在某些實施方案中,與一個或多個非靶標腺苷相對的錯配核苷為鳥苷。在一些實施方案中,所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為ACG或ACA。在一些實施方案中,所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為ACG。在一些實施方案中,所述三鹼基基序是GAA,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為UCA、CCG、CCC或UCC。在某些實施方案中,所述三鹼基基序是GAA,所述互補RNA序列中與所述三鹼基基序直接相對的三連互補鹼基為UCA。在一些實施方案中,所述三鹼基基序是GAC,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為GCG或GCA。在某些實施方案中,所述三鹼基基序是GAC,所述互補RNA序列與所述三鹼基基序直接相對的三連互補鹼基為GCG。在一些實施方案中,所述三鹼基基序是GAG,並且其中所述互補RNA序列包含與所述三鹼基基序直接相對的三連互補鹼基為CCG、CCA、CCC、UCC或UCG。在某些實施方案中,所述三鹼基基序是GAG,所述互補RNA序列中與所述三鹼基基序直接相對的三連互補鹼基為CCG。在一些實施方案中,所述三鹼基基序上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G或A。在一些實施方案中,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G或A,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G或A,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。在一些實施方案中,所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的C,所述三鹼基基序上游殘基為G,其中所述互補RNA中與所述上游殘基相對的鹼基為G,所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。藉由本申請的方法,RNA的編輯效率相對於現有技術提高至少90%至1100%,例如提高至少100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%等。
在一些實施方案中,所述靶RNA中的靶標腺苷(A)藉由腺苷脫氨酶(Adenosine Deaminase Acting on RNA,ADAR)脫胺基。在某些實施方案中,所述腺苷脫氨酶為天然ADAR或其同源蛋白。在某些實施方案中,所述腺苷脫氨酶為經過修飾但保留了腺苷脫氨酶活性的腺苷脫氨酶功能變體,例如在天然ADAR或其同源蛋白基礎上經一個或多個位點突變修飾但仍然具有腺苷脫氨酶活性的變體。在某些實施方案中,所述腺苷脫氨酶為包含ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為包含經突變喪失催化活性的Cas13蛋白與ADAR功能結構域或ADAR同源蛋白功能結構域或腺苷脫氨酶功能變體的融合蛋白。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶藉由外源引入所述宿主細胞中或藉由導入該脫氨酶的構建體在宿主細胞中表達。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為包含λN肽與ADAR功能結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述包含ADAR蛋白催化結構域的融合蛋白為SNAP-tag標記的ADAR或SNAP-tag標記的ADAR功能變體。在某些實施方案中,所述ADAR是ADAR1和/或ADAR2。在一些實施方案中,ADAR是選自由hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2構成的組的一種或多種ADAR。
在某些實施方案中,所述ADAR由所述宿主細胞表達。在某些實施方案中,ADAR天然地或內源地存在於宿主細胞中,例如,天然地或內源地存在於真核細胞中。在某些實施方案中,所述ADAR蛋白經外源引入所述宿主細胞中。在某些實施方案中,將所述ADAR或編碼所述ADAR的構建體引入宿主細胞。在一些實施方案中,所述構建體包括但不限於線性核酸、質體、病毒等。在上述方法中,所述ADAR包括上述天然ADAR、其同源蛋白、經過修飾但保留了腺苷脫氨酶活性的腺苷脫氨酶功能變體(例如在天然ADAR或其同源蛋白基礎上經一個或多個位點突變修飾但仍然具有腺苷脫氨酶活性的變體)或包含ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述包含ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白為包括靶向結構域和所述ADAR催化結構域或其同源蛋白催化結構域或腺苷脫氨酶功能變體的融合蛋白。在某些實施方案中,所述靶向結構域選自包含但不限於以下的任一項:經突變喪失催化活性的Cas13蛋白、λN肽、SNAP-tag。在一些實施方案中,ADAR是選自由hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2構成的組的一種或多種ADAR。在一些實施方案中,所述方法不包含將任何蛋白質引入宿主細胞中。在某些實施方案中,所述ADAR是ADAR1和/或ADAR2。
本申請另一態樣提供了一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),靶標殘基為胞苷(C),其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和/或下游殘基直接相對的錯配,並且所述方法進一步包括將具有胞苷脫氨酶活性的脫氨酶或胞苷脫氨酶或編碼該脫氨酶的構建體引入宿主細胞。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶是對ADAR蛋白或包含ADAR催化結構域的融合蛋白進行基因修飾後獲得C到U催化活性的脫氨酶。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶還包含靶向結構域。
在一些實施方案中,所述靶標胞苷所在的三鹼基基序選自以下任一項:GCG, GCC,GCA,GCU,ACG,ACC,ACA,ACU,CCG,CCC,CCA,CCU,UCA,UCC,UCU和UCG。在一些實施方案中,所述arRNA在對應於靶標RNA的靶標殘基的位置包含非配對核苷酸,以形成和靶標殘基的錯配。在一些實施方案中,所述arRNA中可與所述靶標RNA雜交的互補RNA序列包含與所述靶RNA中的所述靶標胞苷直接相對的胞苷,腺苷或尿苷。在某些實施方案中,所述互補RNA序列包含與所述靶標胞苷直接相對的胞苷。在某些實施方案中,所述arRNA在對應於靶RNA的非靶標編輯位點包含一個或多個非配對核苷酸,以形成與靶標RNA的非靶標位點的一個或多個錯配。實施例4中分別偵測了三鹼基基序中只有靶標殘基單個錯配的情況及三鹼基基序中有多個殘基錯配的情況下,胞苷到尿苷的編輯效率,結果如圖22所示。可見在三鹼基基序上游殘基為A或U時,多個錯配可以達到與只有靶標殘基單個錯配的情況相當的編輯效率,而在三鹼基基序的上游殘基為G時,只有靶標殘基單個錯配的情況下編輯效率極低,而此時引入更多錯配可以顯著提升C到U的編輯效率。因此,在一些實施方案中,所述三鹼基基序的上游殘基為G,並且其中所述互補RNA序列包含與所述上游殘基直接相對的G。在一些實施方案中為ACA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUU或GUU。在一些實施方案中,所述三鹼基基序為ACA,並且其中所述互補RNA序列較佳地包含與所述三鹼基基序相對的AUU。在一些實施方案中,所述三鹼基基序為UCA ,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUA、GUA或CUA。在一些實施方案中,所述三鹼基基序為UCA,並且其中所述互補RNA序列較佳地包含與所述三鹼基基序相對的AUA。在某些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG或UCG。在一些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列較佳地包含與所述三鹼基基序相對的UUG。在一些實施方案中,所述三鹼基基序為CCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUG。在某些實施方案中,所述靶標RNA中的三鹼基基序中的靶標殘基為胞苷,所述三鹼基基序的上游殘基選自G,C,A和U的核苷酸,較佳的次序是G>C>A≈U。
在一些實施方案中,所述arRNA藉由招募具有胞苷脫氨酶活性的脫氨酶至靶標RNA對靶標RNA中的靶標胞苷(C)脫胺基並使其轉變為尿苷。其中所述胞苷脫氨酶為經過修飾(例如經過一個或多個位點胺基酸缺失或突變)具有胞苷脫胺基活性的腺苷脫氨酶或腺苷脫氨酶同源蛋白變體。在某些實施方案中,所述經修飾具有胞苷脫胺基活性的腺苷脫氨酶包含現有技術中公開的,例如Abudayyeh et al., 2019中公開的一個或多個突變的、具有胞苷脫胺基活性的腺苷脫氨酶片段。在某些實施方案中,所述經修飾具有胞苷脫胺基活性的腺苷脫氨酶為包含選自如下一個或多個突變的ADAR2:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。在某些特定的實施方案中所述經修飾具有胞苷脫胺基活性的腺苷脫氨酶為包含以下全部突變的ADAR2: E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。在某些實施方案中,胞苷脫氨酶為包含如下全部突變的ADAR2催化結構域的融合蛋白:E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T。在一些實施方案中,所述具有胞苷脫氨酶活性的脫氨酶還包含靶向結構域的。在某些實施方案中,所述靶向結構域包含但不限於選自以下的任一項:經突變喪失催化活性的Cas13蛋白、λN肽、SNAP-tag。
在某些實施方案中,所述方法包括將所述胞苷脫氨酶或所述融合蛋白或編碼所述腺苷脫氨酶或所述融合蛋白的構建體引入宿主細胞。在某些實施方案中,所述構建體包括但不限於線性核酸、質體、病毒等。
根據本申請的上述方法,所述arRNA為單鏈RNA。在一些實施方案中,所述互補RNA序列完全是單鏈。在某些實施方案中,所述arRNA包含一個或多個(例如,1、2、3或更多個)雙鏈區和/或一個或多個莖環區。在某些實施方案中,所述arRNA僅由所述互補RNA序列組成。
根據本發明所述的方法,在一些實施方案中,所述互補RNA序列與靶標序列之間存在兩個或兩個以上的錯配。在一些實施方案中,所述互補RNA序列的三連互補鹼基以外以外還存在一個或多個與靶標序列之間的錯配。在一些實施方案中,當所述互補RNA序列與靶標序列雜交時,可出現一個或多個擺動配對。在一些實施方案中,當所述互補RNA序列與靶標序列雜交時,可出現一個或多個單側突起。在一些實施方案中,當所述互補RNA序列與靶標序列雜交時,可出現一個或多個擺動配對及一個或多個單側突起。
根據本發明所述的方法,在一些實施方案中,所述arRNA的長度為約20-260個核苷酸,例如所述arRNA的長度小於或等於約30、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、120、130、140、150、160、170、180、190、200或更多個核苷酸中的任一項。在某些實施方案中,互補RNA序列的長度為40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70- 160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任一項。在一些實施方案中,所述arRNA長約60-200個核苷酸(例如約60-150、65-140、68-130或70-120中的任何一個)。在一些實施方案中,所述arRNA還包含ADAR招募結構域。
根據本發明所述的方法,在一些實施方案中,所述arRNA包含一種或多種化學修飾。在一些實施方案中所述化學修飾包含甲基化和/或硫代磷酸化,例如2′-O-甲基化(2′-O-Me)和/或核苷酸間硫代磷酸酯鍵。在某些實施方案中,所述arRNA的首尾的3個或5個核苷酸包含2'-O-Me修飾,和/或其首尾的3個或5個核苷酸間的連接含有硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA中的一個或多個或所有尿苷包含2′-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含2'-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含3'-硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA不包含任何化學修飾。
根據本發明所述的方法,在一些實施方案中,所述靶RNA是選自信使RNA前體、信使RNA、核醣體RNA、轉運RNA、長鏈非編碼RNA和小RNA的RNA。在一些實施方案中,本發明所述的方法在靶標RNA的靶標殘基上進行編輯可導致靶標RNA的錯義突變、提前出現的終止密碼子、異常剪接或可變剪接,或逆轉靶標RNA中的錯義突變、提前出現的終止密碼子、異常剪接或可變剪接。在一些實施方案中,本發明所述的方法在靶標RNA中編輯靶標殘基可導致靶標RNA編碼的蛋白的點突變、截短、延長和/或錯誤折疊,或藉由逆轉靶標RNA的錯義突變、提前出現的終止密碼子、異常剪接、或可變剪接獲得功能性的、全長、正確折疊的和/或野生型的蛋白質。
根據本發明所述的方法,在一些實施方案中,所述宿主細胞是真核細胞。在某些實施方案中,所述宿主細胞是哺乳動物細胞。在某些實施方案中,所述宿主細胞是人或小鼠細胞。
使用本發明所提供的任意一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,可以產生經編輯的RNA或包含經編輯的RNA的宿主細胞。因此本發明還提供所述經本發明提供的編輯靶標RNA的方法所產生的經編輯的RNA或包含經編輯的RNA的宿主細胞。
本發明所提供的在宿主細胞的靶標殘基位置編輯靶標RNA的方法可用於個體中治療或預防疾病或病症中。因此本發明還提供一種用於在個體中治療或預防疾病或病症的方法,包括使用前述本發明所提供的任意一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法編輯個體細胞中與所述疾病或病症相關的靶標RNA。在一些實施方案中,所述疾病或病症是遺傳性基因疾病或與一種或多種獲得性基因突變(例如,藥物抗性)相關的疾病或病症。
本發明還提供了可以在本發明所提供的方法中使用的一種藉由招募作用於RNA的脫氨酶對靶標RNA中的靶標殘基脫胺基的RNA(arRNA),其包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中的靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中的靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與靶標RNA的上游殘基和/或下游殘基直接相對的錯配。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA靶向的靶標RNA中的三鹼基基序的靶標殘基是腺苷,所述靶標RNA中的上游殘基是選自G,C,A和U的核苷酸,較佳的G>C≈A>U。在一些實施方案中,所述三鹼基基序選自GAG,GAC,GAA,GAU,AAG,AAC,AAA,AAU,CAG,CAC,CAA,CAU,UAA,UAC和UAU。在某些實施方案中,所述arRNA包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷(C),腺苷(A)或尿苷(U)。在一些特定的實施方案中,所述arRNA包含與所述靶標RNA中的所述靶標腺苷直接相對的C。在某些實施方案中,所述arRNA與靶標RNA雜交時還包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。在某些實施方案中,與一個或多個非靶標腺苷相對的錯配核苷為鳥苷。在一些實施方案中,所述三鹼基基序的上游殘基為G,並且所述互補RNA中與所述上游殘基相對的鹼基為G或A。在某些實施方案中,所述三鹼基基序是GAU,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為ACG或ACA。在某些實施方案中,所述三鹼基基序是GAU,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為ACG。在某些實施方案中,所述三鹼基基序是GAA,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為UCA、CCG、CCC或UCC。在某些實施方案中,所述三鹼基基序是GAA,所述arRNA中與所述三鹼基基序直接相對的三連互補鹼基為UCA。在某些實施方案中,所述三鹼基基序是GAC,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為GCG或GCA。在某些實施方案中,所述三鹼基基序是GAC,所述arRNA與所述三鹼基基序直接相對的三連互補鹼基為GCG。在某些實施方案中,所述三鹼基基序是GAG,並且其中所述arRNA包含與所述三鹼基基序直接相對的三連互補鹼基為CCG、CCA、CCC、UCC或UCG。在某些實施方案中,所述三鹼基基序是GAG,所述arRNA中與所述三鹼基基序直接相對的三連互補鹼基為CCG。在某些實施方案中,所述arRNA包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA靶向的靶標RNA中的三鹼基基序中的靶標殘基可以是胞苷(C),稱為靶標胞苷。在某些實施方案中,所述三鹼基基序的上游殘基是選自G,C,A和U的核苷酸,較佳次序為G>C>A≈U。在某些實施方案中,所述靶標胞苷所在的三鹼基基序選自以下任一項:GCG, GCC,GCA,GCU,ACG,ACC,ACA,ACU,CCG,CCC,CCA,CCU,UCA,UCC,UCU和UCG。在某些實施方案中,所述三鹼基基序的上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G。在一些實施方案中,所述三鹼基基序下游殘基為A,且其中所述互補RNA中與所述下游殘基相對的鹼基為U或A。在一些實施方案中,所述三鹼基基序為ACA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUU、或GUU。在一些實施方案中,所述三鹼基基序為ACA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUU。在一些實施方案中,所述三鹼基基序為UCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUA、GUA或CUA。在一些實施方案中,所述三鹼基基序為UCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUA。在一些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG或UCG。在一些實施方案中,所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG。在一些實施方案中,所述三鹼基基序為CCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUG。在某些實施方案中,所述arRNA在對應於靶標RNA的靶標殘基的位置包含非配對核苷酸,以形成和靶標殘基的錯配。在某些實施方案中,所述arRNA中可與所述靶標RNA雜交的互補RNA序列包含與所述靶RNA中的所述靶標胞苷直接相對的胞苷,腺苷或尿苷。在某些實施方案中,所述互補RNA序列包含與所述靶標胞苷直接相對的胞苷。在某些實施方案中,所述arRNA在對應於靶RNA的非靶標編輯位點包含一個或多個非配對核苷酸,以形成與靶標RNA的非靶標位點的一個或多個錯配。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA為單鏈RNA。在一些實施方案中,所述互補RNA序列完全是單鏈。在某些實施方案中,所述arRNA包含一個或多個(例如,1、2、3或更多個)雙鏈區和一個或多個莖環區。在某些實施方案中,所述arRNA包含一個或多個(例如,1、2、3或更多個)雙鏈區。在某些實施方案中,所述arRNA包含一個或多個(例如,1、2、3或更多個)莖環區。在某些實施方案中,所述arRNA包含能夠形成用於招募ADAR酶的分子內莖環結構的區域。在某些實施方案中,所述arRNA不包含能夠形成用於招募ADAR酶的分子內莖環結構的區域。在某些實施方案中,所述arRNA僅由所述互補RNA序列組成。
根據本發明所提供的arRNA,在一些實施方案中,當所述互補RNA序列與靶標序列雜交時,可出現一個或多個擺動配對。在一些實施方案中,當所述互補RNA序列於靶標序列雜交時,可出現一個或多個單側突起。在一些實施方案中,當所述互補RNA序列於靶標序列雜交時,可出現一個或多個擺動配對及一個或多個單側突起。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA的長度為約20-260個核苷酸,例如所述arRNA的長度小於或等於約30、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、120、130、140、150、160、170、180、190、200或更多個核苷酸中的任一項。在某些實施方案中,互補RNA序列的長度為40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70- 160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、110-175、110-150或105-140個核苷酸中的任一項。在一些實施方案中,所述arRNA長約60-200個核苷酸(例如約60-150、65-140、68-130或70-120中的任何一個)。在一些實施方案中,所述arRNA還包含ADAR招募結構域。
根據本發明所提供的arRNA,在一些實施方案中,所述arRNA包含一種或多種化學修飾。在一些實施方案中所述化學修飾包含甲基化和/或硫代磷酸化,例如2′-O-甲基化(2′-O-Me)和/或核苷酸間硫代磷酸酯鍵。在某些實施方案中,所述arRNA的首尾的3個或5個核苷酸包含2'-O-Me修飾,和/或其首尾的3個或5個核苷酸間的連接含有硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA中的一個或多個或所有尿苷包含2′-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含2'-O-Me修飾。在某些實施方案中,所述arRNA中靶向核苷和/或與靶向核苷的5'端和/或3'端相鄰的核苷(例如5'端和/或3'端直接相鄰的一個或兩個核苷)包含3'-硫代磷酸酯鍵修飾。在某些實施方案中,所述arRNA不包含任何化學修飾。
本發明還提供一種病毒載劑、質體或線性核酸鏈,其包含本發明所提供的上述任一種arRNA,且所述arRNA不包含任何化學修飾。本發明還提供一種文庫,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。本發明還提供一種組合物,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。本發明還提供一種宿主細胞,其包含本發明所提供的上述任一種arRNA或本發明所提供的上述任一種病毒載劑、質體或線性核酸鏈。在一些實施方案中,所述包含本發明所提供的上述任一種arRNA的宿主細胞是一種真核細胞。
實施例
參照LEAPER技術路線(WO2020074001A1),外源轉入一小段與包含靶標腺苷(A)的靶標RNA部分或完全互補的arRNA,並利用該RNA招募內源ADAR對靶標A進行A到I的編輯。所述arRNA於體外合成,長度為71nt~111nt。如圖4所示,相對於LEAPER等使用ADAR蛋白或其功能結構域的現有編輯技術中使用的ADAR蛋白招募RNA,本發明所使用的arRNA中與靶標序列中的三鹼基基序直接相對的三個鹼基對所述三鹼基基序的互補性更弱,即,除與靶標A的錯配以外,arRNA中與三鹼基基序直接相對的三個鹼基中還包含與上游殘基和/或下游殘基錯配的鹼基。正是這一改變,打破了三連偏好性,使得現有及未來使用ADAR的編輯方法可以對上游殘基為G的三鹼基基序或其他UAG以外的三鹼基基序進行更自由和更高效的編輯。
實施例 1 :三鹼基基序報告體系及對應 arRNA 的構建
首先我們構建了包含16種三鹼基基序的報告體系。由於LEAPER文獻中,測試過當三鹼基基序為UAG時其編輯效率的差異 (Qu et al., 2019),本實施例中,為保持對照的一致性,在編輯位點以外arRNA可以互補配對的部分均採用與LEAPER文獻中相同的序列設計,如圖5所示。原始質體Reporter1由北京大學生命科學學院魏文勝教授饋贈,質體圖譜如圖14所示,所述質體包含表4中所示序列。合成如表1所示的16種三鹼基基序相關引子,並根據“J.薩姆布魯克、M.R.格林,分子克隆實驗指南(第四版),2017”中业内研究人員所熟知的方法,使用表2中所示的材料,進行PCR擴增(Q5® High-Fidelity 2X Master Mix,NEB M0492L)、酶切(XbaI,NEB R0145L;AscI,NEB R0558L)、瓊脂醣凝膠膠回收 (Seakem LE 瓊脂醣, Lonza 5502; GeneJET Gel Extraction and DNA Cleanup Micro Kit, Thermo Fisher K0832)以及組裝(NEBuilder® HiFi DNA Assembly Master Mix, NEB E2621L),並組裝至Reporter1中,替代Reporter1中原靶標RNA編碼序列,之後轉化至感受態細胞(Trans1-T1 Phage  Resistant  Chemically Competent Cell,全式金 CD501-02)並於次日挑取克隆進行定序。將定序結果正確的克隆經過質體提取並包裝成慢病毒。使用此等包裝有不同三鹼基基序編碼基因的慢病毒分別侵染293T細胞。侵染48小時後,得到16種可分別轉錄包含不同三鹼基基序的mRNA(靶標RNA)的293T細胞,即為最終的三鹼基基序報告體系細胞,其命名與表2中所示三鹼基基序相同。
為測試arRNA中與三鹼基基序上游殘基和/或下游殘基的錯配是否能提升針對其中某一特定三鹼基基序的編輯效率,本實施例中藉由化學合成的方式合成了16種arRNA,設計原則按照取mRNA上三鹼基基序中的標靶A的3’下游55nt到5’上游25nt的RNA片段反向互補單鏈RNA,其中與三鹼基基序中的靶標A相對應的鹼基為C。在arRNA上其他鹼基不變的情況下,與上游殘基及下游殘基相對應的鹼基分別選自A、C、G或U中的一個,正是藉由這4種與上游殘基相對應的鹼基以及這4種與下游殘基相對應的鹼基的不同組合便得到了所述4×4=16種arRNA。其具體序列如表3所示。
實施例 2 :藉由 GFP 陽性比例比較不同 arRNA UAG 三鹼基基序的編輯效率
如圖5所示,為實施例1中所述的16種靶標RNA,其在靶標序列的3’端均帶有GFP綠色螢光蛋白核酸序列。該序列正常情況下可以正確翻譯併發綠色螢光。但當三鹼基基序為UAG時,由於UAG是終止密碼子,則會導致翻譯在該處停止,進而無法翻譯成GFP。在本實施例中,藉由LEAPER體系對UAG三鹼基基序中的A進行編輯。如果編輯成功,則UAG會轉變為UIG,而UIG在翻譯過程中會被識別成UGG,從而不再終止翻譯,從而使得其下游的GFP正常翻譯。因此,藉由GFP陽性比例的大小,我們便可以粗略判斷不同arRNA編輯效率的高低。
本研究中所有測試均使用RNAi MAX試劑(Invitrogen 13778150)將實施例1中所述16種arRNA分別轉染至細胞中,具體步驟見下:
I. 細胞培養使用含有10%FBS (Vistech SE100-011)的DMEM (Hyclone SH30243.01)。報告體系細胞以150000細胞/孔傳至12孔板。此時記時間為0點。
II. 細胞傳代後24小時,用RNAi MAX試劑(Invitrogen 13778150)將12.5pmol的arRNA轉入每個孔。轉染步驟參照供應商說明書。
III. 細胞傳代後72小時,用胰酶 (Invitrogen 25300054)分別消化各孔細胞,並於流式細胞儀分析FITC通道強度。
所述細胞為轉錄包含UAG三鹼基基序的mRNA的293T細胞。arRNA培養細胞72小時(轉染後48小時)藉由流式細胞儀分析FITC通道強度。結果如圖7所示,其中UT為不做任何轉染的對照,Vech為加入RNAiMAX轉染試劑而不轉染任何dRNA的對照。
此後,我們對該實驗進行了重複。
實驗結果如圖8所示。首次實驗中arRNA是採用乾粉直接溶解的,溶解之後在-80℃進行保存。重複實驗中,由於arRNA經過-80℃的一次凍融,整體效率有所下降,但與首次測試相比,結果總趨勢不變。其中,arRNA Ran為轉染隨機RNA序列的對照。
現有技術中,LEAPER體系使用與本實施例中相似報告系統對UAG三鹼基基序的編輯效率結果如圖9所示(Qu et al., 2019)。圖9中橫軸編號為arRNA序列名稱,與圖7、8中橫軸名稱的下標部分對應。為了方便比較,圖7、8中arRNA與圖9中arRNA的排列順序一致。由於本實施例中採用化學合成的arRNA進行轉染,而圖9中採用的是質體轉染,因此本實施例中的整體編輯效率相對較高,但與圖9的整體趨勢相同。即當三鹼基基序為UAG時,arRNA中與靶標A對應的鹼基為C,且與上游殘基U和下游殘基G對應的鹼基為分別與U和G配對的A和C時效率最高,即對應arRNA為arRNA CCA。而當三鹼基基序為UAG時,如果在arRNA中與其上游殘基U和下游殘基G對應的鹼基為其他非配對鹼基時,編輯效率不但沒有顯著提升,反而出現下降。
對於UAG三鹼基基序的編輯,本實施例中的研究結果與文獻中報導的基本一致,即:對於UAG三鹼基基序的編輯,藉由在arRNA上與三鹼基基序對應的三個鹼基中引入更多不匹配部分並不能提高編輯效率。
實施例3:GAN三鹼基基序的RNA編輯效率測定
本實施例中對分別包含有UAG、GAA、GAU、GAC、GAG這幾個三鹼基基序的報告系統細胞分別做了16種arRNA的轉染,轉染步驟同實施例2。
72h(轉染後48h)後藉由TRIZOL收樣並提取RNA(TRIzol Reagent,ambion REF15596026),取1μg RNA反轉錄,反轉錄體系為20μL(TransScript® One-Step gDNA Removal and cDNA Synthesis SuperMix,全式金 AT311-02),取1μL反轉錄產物用以下一對引子進行PCR:ggagtgagtacggtgtgcGACGAGCTGTACAAGCTGCAGGG(SEQ ID NO: 1)、gagttggatgctggatggTGGTGCAGATGAACTTCAGGGTCAG(SEQ ID NO: 2) (小寫字母表示Hi-Tom套組要求的引子接頭)進行PCR擴增,並藉由Hi-Tom套組建庫(諾禾致源,REF PT045)。
之後按照如下步驟進行二代定序,並分析編輯位點中A->G的編輯效率。
i. Illumina定序
將構建好的定序文庫,藉由 NovaSeq6000 平臺以PE150方式進行高通量定序。
ii. 定序資料處理
高通量定序得到的原始資料以 fastp (v0.19.6) 進行質控,過濾掉低品質、帶有接頭序列、含有 polyG等的序列。將得到的高品質定序數據以自主開發的拆分腳本按照相應的 barcode 序列拆分到每個樣本,使用BWA (v0.7.17-r1188) 軟體與擴增的目的地區域的序列進行比對,藉由 SAMtools (v1.9) 進行格式轉換生成 BAM 檔、統計比對資訊並重新排序和建立索引。
iii. 編輯效率分析
使用JACUSA (v1.3.0) 軟體偵測所有潛在的RNA編輯位點,所用參數為:call-1 -a B,R,D,I,Y,M:4 -C ACGT -c 2 -p 1 -P UNSTRANDED -R -u DirMult-CE。過濾掉同時在對照和處理樣本中出現的高頻點突變之後,以 A -> G突變之外的平均突變頻率的三倍作為閾值,將編輯位元點A -> G突變頻率在閾值之上的部分作為真實的靶標A突變為G的頻率。
對於UAG三鹼基基序,實驗結果如圖10所示。從圖中可以明顯地看出,編輯效率最高的是按照現有技術中報導的原則設計的arRNA序列,即僅有靶標鹼基處有錯配的arRNA CCA。這與此前實驗GFP的結果一致。
而對於現有技術中,編輯效率極低的三鹼基基序:GAN(其中N為四種核醣核苷酸中的任一種),本發明的arRNA設計方式則體現出意想不到的編輯效率,結果如圖11所示。本發明的arRNA設計方式在GAU上的效率趨勢尤為明顯。當mRNA序列所含有的三鹼基基序為GAU時,按照現有技術常用方法設計出的arRNA ACC基本沒有任何編輯效率,這與文獻報導一致。但是,當我們減弱互補性,即使arRNA中與三鹼基基序中的5’上游殘基G相對的鹼基為非配對鹼基,即C以外的其他鹼基,例如使用arRNA ACG時,其編輯效率便可有大幅度提高。如圖11A所示,所述提升幅度超過現有技術中固有設計(arRNA ACC)的10倍,而根據現有技術設計的arRNA ACC與之前報導的一致,編輯效率極低。除此之外,對於三鹼基基序GAU,本實例中的arRNA ACA、arRNA CCU、arRNA UCC等適當減弱了與三鹼基基序互補性的arRNA設計相對於現有技術中的固有設計arRNA ACC也出現了明顯相對更高的編輯效率。值得注意的是,針對三鹼基基序GAU,當arRNA中與靶標A相對的鹼基為C,與下游殘基相對的鹼基為下游殘基U的互補鹼基A,而與上游殘基G相對的為錯配鹼基G時(即arRNA ACG)效率最高。
同樣,對於三鹼基基序GAC,適當減弱了與三鹼基基序互補性的arRNA也顯示出意料之外的高編輯效率。如圖11C的柱狀圖所示,按照現有技術的固有原則設計出的arRNA GCC基本沒有編輯效率,而引入了更多錯配的arRNA GCG和arRNA GCA則出現了明顯更高的編輯效率。此外,針對三鹼基基序GAC,當arRNA中與靶標A相對的鹼基為C,與下游殘基相對的鹼基為下游殘基C的互補鹼基G,而與上游殘基G相對的為錯配鹼基G時(即arRNA GCG)效率最高。
與此類似的,對於三鹼基基序GAG的編輯中(圖11B),按照現有技術固定模式設計的的arRNA CCC並不是效率最高的,而經過適當減弱互補性的arRNA CCG和arRNA CCA的編輯效率明顯更高。與前述三鹼基基序GAU和GAC情況類似,針對三鹼基基序GAG,當arRNA中與靶標A相對的鹼基為C,與下游殘基相對的鹼基為下游殘基G的互補鹼基C,而與上游殘基G相對的為錯配鹼基G時(即arRNA CCG)效率最高。
同樣,對於GAA,按照現有技術固定模式設計的的arRNA UCC編輯效率並不高,但是當arRNA中與靶標A相對的鹼基為C時,與下游殘基A相對的鹼基為互補鹼基U,而與上游殘基G的互補鹼基為錯配鹼基A時即arRNA UCA其編輯效率提升。
為了進一步確認以上結果,我們對mRNA為GAA、GAU、GAC、GAG的三鹼基基序進行了重複實驗。重複實驗中針對每個特定的三鹼基基序,我們僅重複了三種arRNA設計:
1. 按照固有技術設計的arRNA,即靶標A相對的鹼基為C,其餘兩個鹼基設計均符合鹼基互補配對原則,此時與靶標A的上游殘基G配對的鹼基為C。
2. 按照本發明的設計,使與靶標A的上游殘基G配對的鹼基為A。
3. 按照本發明的設計,使與靶標A的上游殘基G配對的鹼基為G。
如圖13所示,無論三鹼基基序為GAA、GAU、GAC、GAG,我們都可以明確地發現,當與靶標殘基A的上游殘基G配對的鹼基為A時,其編輯效率均有一定程度的提升,而當與靶標殘基A的上游殘基G配對的鹼基為G時,其編輯效率通常最高。此外,當將靶標殘基A的上游殘基G的配對鹼基從固有技術的C改為G時,對於不同三鹼基基序的效率提升倍數為GAU > GAC ≈ GAA > GAG;而當將與靶標殘基A的上游殘基G配對的鹼基從固有技術中的C改為A時, 對於不同三鹼基基序的效率提升倍數為GAC > GAU ≈ GAG ≈ GAA。
根據現有技術的文獻報導,三鹼基基序GAU、GAC、GAA為編輯效率最弱的三個,且效率接近於零(圖3),因此在RNA編輯的過程中應當儘量避開。而本發明卻藉由向arRNA中創造性引入針對三鹼基基序的更多錯配鹼基,打破了這一限制。根據本發明實施例可以看出,當arRNA中與三鹼基基序相對的三個鹼基中,與靶標A相對的鹼基為C,且與上游和/或下游殘基相對的鹼基為錯配鹼基時,編輯效率可顯著提升。並且,針對上游殘基為G的情況,往往是與下游殘基相對的鹼基為互補鹼基,而與上游殘基G相對的為錯配鹼基A時編輯效率更高,與上游殘基G相對的為錯配鹼基G時編輯效率最高。
實施例4:C到U的RNA編輯的三連偏好性研究
i.突變型ADAR2-r16-293T的構建
參照參RESUCE技術(WO2019071048A9),對ADAR2催化結構域進行誘變,突變位點與該文獻中r16相同(dADAR2(E488Q/V351G/S486A/T375S/S370C/P462A/N597I/L332I/I398V/K350I/M383L/D619G/S582T/V440I/S495N/K418E/S661T) r16, https://benchling.com/s/seq-19Ytwwh0i0vSIbyXYZ95)。藉由常規DNA合成技術,體外DNA合成pLenti-ADAR2質體載劑(pLenti-ADAR2質體骨架由魏文勝教授實驗室惠贈)上ADAR2 XmaI酶切位點至AscI酶切位點之間的序列,並包含上述突變,藉由上述兩個限制性內切酶,藉由酶切連接用新合成的DNA片段替換原質體pLenti-ADAR2上所對應的片段,替換後質體命名為pLenti-ADAR2-r16,其含有參照RESCUE技術(WO2019071048A9)對催化結構域突變的ADAR2基因命名為ADAR2-r16。ADAR2-r16全長cDNA序列為如表6。藉由二代慢病毒包裝體系(pCAG-VSVG 由Arthur Nienhuis & Patrick Salmon 惠贈(Addgene plasmid # 35616 ; http://n2t.net/addgene:35616 ; RRID:Addgene_35616); pCMVR8.74 由 Didier Trono惠贈 (Addgene plasmid # 22036 ; http://n2t.net/addgene:22036 ; RRID:Addgene_22036)),將pLenti-ADAR2-r16包裝成慢病毒,侵染293T細胞並於48小時後以10μg/mL終濃度Blasticidin (Solarbio B9300)抗性篩選。篩選過後存活的細胞稱為ADAR2-r16-293T。
ii.BFP報告體系的構建
BFP報告體系參照參考文獻(Vu, L. T., Nguyen, T. T. K., Md Thoufic, A. A., Suzuki, H., & Tsukahara, T. (2016). Chemical RNA editing for genetic restoration: the relationship between the structure and deamination efficiency of carboxyvinyldeoxyuridine oligodeoxynucleotides. Chemical biology & drug design, 87(4), 583-593)構建,全部BFP cDNA序列由體外DNA合成,具體序列如表7所示。BFP cDNA序列藉由CMV啟動子後的多克隆位點克隆至pCDH-CMV質體載劑(pCDH-CMV質體骨架由Kazuhiro Oka惠贈,Addgene plasmid # 72265; http://n2t.net/addgene:72265; RRID: Addgene_72265)。報告體系中C到U編輯位點為BFP序列第199位的鹼基C,則199、200和201位為CAC,對應第66位組氨酸。
該序列第198, 199, 200位的鹼基依次為CCA,命名為BFP-CCA,縮略為C*。當199位的鹼基C在RNA水準藉由去胺基化被編輯為U之後,將改變第66位胺基酸,使BFP螢光蛋白從原先的藍色螢光變為綠色螢光,從而可以藉由流式細胞儀FITC(Fluorescein isothiocyanate)通道偵測到信號。而由於198位核苷酸從C突變為A、T、G後,其參與編碼的第65位元胺基酸密碼子為ACC、ACA、ACT、ACG均編碼蘇氨酸,因此該位突變為同義突變。這使得該報告體系可以同時測定和比較在mRNA上199位靶標殘基的上游殘基為不同鹼基時,C到U編輯的效率。使用定點誘變套組(Q5® Site-Directed Mutagenesis Kit, NEB E0554S)向198位置鹼基中引入突變,198, 199, 200三個位置鹼基分別為:GCA,命名為BFP-GCA,縮略為G*;ACA,命名為BFP-ACA,縮略為A*;TCA命名為BFP-TCA,縮略為T*。199位的C突變為T,CTA命名為BFP-CUA,縮略為CUA。將上述構建好的BFP-GCA、BFP-ACA、BFP-TCA、BFP-CCA四種質體藉由二代慢病毒包裝體系(與前述ADAR2-r16慢病毒包裝條件相同)包裝成慢病毒,並侵染293T或ADAR2-r16-293T,並於48h後用500μg/mL Geneticin (Gibco, Catalog number:  10131035)或10μg/mL終濃度Blasticidin (Solarbio B9300)抗性篩選,篩選後存活的細胞分別命名為293T-GCA、293T-ACA、293T-TCA、293T-CCA和ADAR2-r16-GCA、ADAR2-r16-ACA、ADAR2-r16-TCA、ADAR2-r16-CCA。
iii. 設計合成arRNA
本實施例中的術語“arRNA”與本文中所有的術語“dRNA”具有相同的含義,可互換使用。本實施例中arRNA與三鹼基基序中靶標殘基相對的鹼基位於arRNA的中間位置,5’上游以及3’下游按照相同長度向兩邊延伸。由於合成長度的限制,本實施例首先選取長度為91nt的RNA進行體外合成,根據第46位元核苷酸(靶向鹼基)的不同,當第46位核苷酸分別為A、U、G、C時,四種合成的arRNA分別縮略為A*、U*、G*、C*。四種合成的arRNA具體序列見下表5。與LEAPER技術設計方法(WO2020074001A1)不同的是,本批實驗中四條arRNA的設計只改變了與靶標殘基C相對的靶向鹼基,即第46位的A、U、G、C,而在arRNA第47位(對應報告體系第198位)的鹼基在四條arRNA中均按照引入突變前的BFP序列即CCA設計。隨後,在三鹼基基序的靶標殘基為胞苷且‘下游殘基為腺苷的情況下合成了分別包含不同三連互補鹼基的arRNA,具體序列見表8。arRNA的第46位核苷酸固定為U,第45、47位核苷酸分別為A、U、G、C,因此共16種。每條arRNA依照以下的原則命名:所有arRNA命名以"arRNA"開頭,後以下角標的方式展示arRNA上的三連互補鹼基。在mRNA靶標殘基C對應arRNA靶向鹼基為U的基礎上,展示三連互補鹼基,且所述三連互補鹼基的展示順序為5’-3’的順序。例如,arRNA對於三鹼基基序CCA,靶標殘基C的上游殘基為C,對應arRNA靶向鹼基的3’最近鄰殘基為G;靶標殘基C對應arRNA靶向鹼基為U;靶標殘基C的下游殘基為A,對應arRNA靶向鹼基的5’最近鄰殘基U,則arRNA包含的三連互補鹼基為UUG,此時按照命名規則,該反義RNA命名為:arRNA UUG。為了將首批合成的A*、U*、G*、C*四種arRNA與第二批合成的16種RNA進行命名規則的統一,首批合成的A*、U*、G*、C*四種arRNA在後續實驗中分別命名為arRNA UAG、arRNA UUG、arRNA UGG、arRNA UCG。需要特別注明的是,兩次實驗中,第一次合成的arRNA UUG與第二次合成的arRNA UUG兩條序列完全相同,但經由兩個不同批次合成。
iv. 靶標C對位反義RNA測試
ADAR2-r16-293T以300000個細胞/孔的密度鋪板至6孔板,鋪板後24小時,用Lipofectamine™ 3000 Transfection Reagent轉染 (Invitrogen, Catalog number:  L3000015),轉染步驟按照說明書進行,按照說明書採用不同Lipofectamine 3000轉染試劑濃度進行兩次重複試驗,Repeat 1採用3.75μL,Repeat 2採用7.5μL每孔轉染試劑濃度。每孔BFP以及相關質體即BFP-GCA,(縮略為G*);BFP-ACA (縮略為A*);BFP-TCA (縮略為T*); BFP-CUA (縮略為CUA),添加2.5μg,合成的嚮導RNA添加25pmol,轉染後48h藉由FACS偵測FITC通道信號強度。陽性細胞平均螢光強度(Mean Fluorescent Intensity, MFI)統計結果如圖15所示。
圖15中mRNA行表示對應孔中添加的BFP報告體系質體,arRNA行表示對應孔中添加的arRNA。BFP報告體系中,198, 199, 200三個鹼基在原始序列中為CCA,而當198位C變為A或T或G的時候,均使得65位的胺基酸為蘇氨酸,所以BFP-GCA、BFP-CCA、BFP-ACA、BFP-TCA四種不同報告體系198位的不同不會造成原本蛋白功能的改變。如圖15所示,當不加入任何arRNA時,報告體系本底GFP信號MFI約為5×10 4(報告體系標注為U*, arRNA標注為/;以及報告體系標注為A*,arRNA標注為/)。而當藉由DNA水準的點突變,使199位C突變為T時(mRNA中三鹼基基序為CUA),GFP信號MFI約為2.4×10 6~3.1×10 6,比本底值高約100倍。因此說明,當199位C如果在RNA水準全部變為U後,會在GFP信號MFI造成約100倍的提升。
而當加入arRNA後,在DNA水準199位C不變的基礎上,如圖15所示,在最終GFP信號MFI上,最多能提升至超過5×10 5,螢光強度約為199位C點突變成T後螢光強度的20%。
為進一步確定該編輯能力以及鹼基偏好性,進一步設計並重複了以上實驗,結果如圖16所示,實驗條件與圖15實驗基本一致,唯一不同的是重複1和重複2均採用3.75μL的轉染試劑。即:當三鹼基基序為GCA和CCA時,對應arRNA為U^(arRNA UUG)的效率>為C^(arRNA UCG)效率。與圖15相比,圖16中相同實驗條件MFI下降了將近一倍,這是由於圖15中arRNA為乾粉溶解後立即實驗,而圖16實驗為圖15實驗arRNA溶液經過-80℃凍融一次後再進行實驗。但可以看到的是,雖然最大值相比圖15有所降低,但圖16的實驗基本重複了圖15中編輯效率最高的4個結果,並且效率高低呈現相同趨勢:以本實施例的試驗設計條件,固定arRNA中的三連互補鹼基的5’端鹼基為U且3’端鹼基為G,只著重對三連互補鹼基中與靶標C相對的鹼基進行研究,則得出的結論為:三連互補鹼基中間殘基U^ >C^的編輯效率,當改變三鹼基基序中的上游殘基時,申請人發現三鹼基基序GCA的最高編輯效率大於CCA的最高效率。
v. 三連偏好性測試
為使後續結果具有更好的一致性,按照ii.BFP報告體系的構建中描述,申請人將BFP-GCA、BFP-ACA、BFP-TCA、BFP-CCA四種質體藉由慢病毒包裝整合進入無ADAR2-r16的普通293T中,以及穩定整合ADAR2-r16的293T中,步驟及命名見ii.BFP報告體系的構建。由於報告體系已整合入細胞基因組,三連偏好性測試中arRNA的轉染與靶標C對位反義RNA測試中arRNA的轉染採用了不同的轉染試劑。靶標C對位反義RNA測試中arRNA的轉染由於需要同時轉染質體,如上所述採用了Lipofectamine 3000,三連偏好性測試中由於只需轉染arRNA,無需轉染質體,因此採用了Lipofectamine™ RNAiMAX Transfection Reagent (Invitrogen, Catalog number:  13778100)。含有不同報告體系的293T或者ADAR2-r16-293T,以150000個細胞/孔的密度鋪板至12孔板,鋪板後24小時用RNAiMAX試劑轉染15pmol的arRNA,轉染後48h藉由FACS偵測FITC通道信號強度,統計GFP+細胞百分。
在arRNA的三連互補鹼基中僅有與靶標C的錯配,且標靶C對應的錯配鹼基為U,而與靶標C的上游殘基以及下游殘基完全匹配的情況下(即:當報告體系為BFP-GCA時,arRNA中與其互補的三連互補鹼基為UUC;當報告體系為BFP-ACA時,arRNA中與其互補的三連互補鹼基為UUU;當報告體系為BFP-TCA時,arRNA中與其互補的三連互補鹼基為UUA;當報告體系為BFP-CCA時,arRNA中與其互補的三連互補鹼基為UUG),測試結果如圖17所示。圖中,未處理表示不添加arRNA對照,隨機RNA序列表示添加91nt隨機序列RNA對照(具體序列見表8 Ran-91),arRNA表示按如上規則添加對應匹配的arRNA。從圖17我們可以看出,當三連鹼基為TCA或者ACA時,該體系有較高的編輯效率,而當三連鹼基為GCA或CCA時,編輯效率近乎為零。
三連鹼基測試的結果一度給本研究帶來巨大的困擾。由於圖15的測試,包含了靶標C對應A/U/C/G四種不同鹼基,而圖17的試驗中,C均與U配對,因此我們將圖15對應的實驗中,arRNA靶標C對應鹼基為U時的資料單獨調出來重新作圖,即圖18。與圖17對比可以發現兩次實驗的結論有明顯的相悖。儘管兩圖的統計方式並不一致,但同批實驗中的趨勢明顯不同,根據圖15資料重做的圖中,明顯GCA和CCA效率高,而圖17中,明顯TCA和ACA高。
vi. 編輯位點5’上游不匹配的意外發現
兩次實驗結果的矛盾,是完全出乎我們預料的。經過再三重複以及對兩次arRNA的仔細比較我們意外地發現並重複了兩次實驗中RNA設計的微妙差別。如圖19A所示,為圖18中使用的mRNA三鹼基基序與arRNA三連互補鹼基的配對關係,而圖19B顯示了圖17中使用的mRNA三鹼基基序與arRNA三連互補鹼基的配對關係。藉由比較可以發現,兩者的不同在於,前者(圖19A)與靶標C的上游殘基相對的arRNA鹼基為G,除靶標C的上游殘基為C時,其他情況下上游殘基與arRNA均形成錯配;而後者(圖19B)與靶標C的上游殘基相對的arRNA鹼基均為其嚴格互補的鹼基。因此,我們推測,造成上述矛盾的原因在於,三連互補鹼基中的上游殘基與arRNA的錯配,或導致三連偏好性的改變。。
為進一步驗證以上推測,我們把iv. 靶標C對位反義RNA測試中合成的arRNA以及v. 三連偏好性測試中合成的arRNA放到一起進行測試,並同時統計了GFP百分比和MFI。測試條件與v. 三連偏好性測試完全一致。其中,圖20及圖21中的上圖均為iv. 靶標C對位反義RNA測試中合成的arRNA的測試結果,圖20及圖21中的下圖均為v. 三連偏好性測試中合成的arRNA的測試結果。對應arRNA的添加同此前iv、v兩次測試。如圖20(%GFP)、圖21(MFI)所示,重複1和重複2為兩次獨立的實驗。從圖20和圖21中,我們可以看出,儘管兩圖統計方式不同,但兩圖擁有近似的趨勢。在上圖中,GCA和CCA有著較高的編輯效率,而TCA和ACA效率較低,這與iv. 靶標C對位反義RNA測試中結論一致。而在下圖中,TCA與ACA效率較高,而GCA和CCA近乎為零,這與v. 三連偏好性測試中測試結論一致。因此,證實了我們的推測,即看似相悖的兩個結論,實則是由於arRNA的設計方式不同造成的。我們也意外的發現,對於GCA這種三鹼基基序,如果按已有技術設計arRNA,其編輯效率幾乎為零,但如果額外加入G-G錯配,則會顯著提升其編輯效率。
上述發現進一步啟發我們,是否在三鹼基基序中引入其它額外不匹配序列可進一步提高編輯效率呢?在此啟發下,我們在標靶C在arRNA上相對鹼基為U的前提下,進一步向arRNA三連互補鹼基與三鹼基基序靶向鹼基的上游殘基和/或下游殘基相對的位置引入更多突變。由於與上游殘基相對的鹼基可以是A、U、C、G,同時與下游殘基相對的鹼基也可以是A、U、C、G,所以其三連互補鹼基共有16種,即:AUA、AUU、AUC、AUG、UUA、UUU、UUC、UUG、CUA、CUU、CUC、CUG、GUA、GUU、GUC、GUG。鑒於此,我們合成了包含以上16種三連互補鹼基的arRNA,並根據其三連互補鹼基命名了16種對應的arRNA,具體序列見表8。我們將這16種不同的arRNA藉由RNAiMAX轉染到此前構建好的8種含報告子的細胞株中,即BFP-ACA-293T和BFP-ACA-293T-ADAR2-r16 (圖22B);BFP-TCA-293T 和BFP-TCA-293T-ADAR2-r16 (圖22A);BFP-CCA-293T和BFP-CCA-293T-ADAR2-r16 (圖22D);BFP-GCA-293T 和BFP-GCA-293T-ADAR2-r16 (圖22C),轉染條件、測試時間同圖17相關實驗。4個圖中的對照為同一樣品;“91nt隨機序列”為加入91nt隨機序列的對照,“僅載劑”為僅添加RNAiMAX轉染試劑而無RNA的對照,“Opti-DMEM培養基”為僅添加同體積Opti-DMEM而不含RNAiMAX轉染試劑的對照,“未處理”為不進行轉染的對照,其中arRNA UAG、arRNA UUG、arRNA UCG、arRNA UGG分別與CCA-arRNA UAG、CCA-arRNA UUG、CCA-arRNA UCG、CCA-arRNA UGG具有完全相同的序列,但經由兩次不同批次合成。
如圖22所示,顯示了引入多個錯配的較佳項,即當三鹼基基序為ACA時,arRNA中三連互補鹼基為AUU或GUU時編輯效率更高,且三連互補鹼基為AUU相對更高;當三鹼基基序為UCA(質體中為TCA), arRNA中三連互補鹼基為AUA、GUA或CUA時編輯效率更高,且三連互補鹼基為AUA時更高;當三鹼基基序為GCA時,arRNA中三連互補鹼基為UUG或UCG時編輯效率更高,且UUG時更高;當三鹼基基序為CCA時,arRNA中三連互補鹼基為AUG時編輯效率更高。
此外,靶標RNA中的上游殘基不同可導致編輯效率的不同。為更好地定義本發明的適用範疇,及對三鹼基基序的較佳順序,本實施例同時也比較了在有上游殘基和/或下游殘基直接相對的錯配的情況下編輯效率及只有靶標殘基錯配的情況的編輯效率。結果也顯示在圖22中,可以發現,在三鹼基基序上游殘基為A或U時,有上游殘基和/或下游殘基直接相對的錯配可以達到與只有靶標殘基單個錯配的情況相當的編輯效率。例如當三鹼基基序為ACA時,僅與靶標殘基有單個鹼基錯配的三連互補鹼基UUU與有上游殘基和/或下游殘基直接相對的錯配的AUU及GUU的編輯效率相當;當三鹼基基序為UCA時,僅與靶標殘基有單個錯配的三連互補鹼基UUA與有上游殘基和/或下游殘基直接相對的錯配的AUA編輯效率相當。而當三鹼基基序為GCA時,僅與靶標殘基有單個鹼基錯配的三連互補鹼基UUC效率接近於0,具有上游殘基和/或下游殘基直接相對的錯配的UUG和UCG的編輯效率可以是UUC的數倍至10餘倍。當三鹼基基序為CCA時,引入了上游殘基和/或下游殘基直接相對的錯配的AUG也與UCG有近似的編輯效率。由此可見,依照編輯效率提升量排序,與三鹼基基序中上游殘基錯配的較佳順序為G>C>A≈U,也就是說,當三鹼基基序的上游殘基為G時引入與所述上游殘基錯配的G可以顯著提高編輯效率。
最後,值得一提的是,由於圖22中的資料由同批次試驗得出,採用了相同實驗條件和偵測方法,因此便於我們橫向比較C到U的RNA編輯技術對ACA、UCA、CCA、GCA四種不同三鹼基基序的編輯效率。如圖22所示,三鹼基基序中,ACA、UCA的最高效率均為10% GFP+左右;而對GCA,如果僅有與靶標鹼基的錯配,則編輯效率接近於0,如果除包含靶標鹼基錯配外,還引入與上游殘基和/或下游殘基直接相對的錯配,則編輯效率可提升至6%~8% GFP+,但對於CCA,儘管引入了上游殘基和/或下游殘基直接相對的錯配,最高效率均未超過2.5% GFP+。
工業實用性
本案例突破了現有RNA編輯技術中對於GAU、GAC等三鹼基基序編輯效率過低的限制,使得此等以G開頭的三鹼基基序依然可以有可觀的編輯效率,從而打破了現有RNA編輯技術中對於GAU、GAC等位點束手無策的尷尬局面,顯著提升了現有技術中使用ADAR的RNA編輯系統,例如LEAPR(WO2020074001A1)、RESTORE(WO2020001793A1)等,對不符合ADAR自然偏好性的UAG以外的其他三鹼基基序的編輯效率。同時,本申請提供的技術方案也突破了現有RNA編輯技術中對GCA等三鹼基基序編輯效率過低的限制,相比現有RESCUE技術(WO2019071048A9)對GCA三鹼基基序編輯的低效率,該案例藉由引入額外的鹼基錯配極大提升了對GCA的編輯能力。該案例打破了RNA編輯應用中長久以來在編輯位點選擇上存在的限制。例如在疾病療法開發態樣,本發明使得更多因基因突變引起的遺傳性疾病可以有機會藉由RNA編輯的方法更加安全高效地進行治療。
序列表
表1:構建16種三鹼基基序報告體系所用引子
引子名稱 SEQ ID NO 引子序列
Vector-F 3 Ctgttttgacctccatagaagacaccgactctagacgtggaacagtacgaacgcgc
GAT-R 4 Cactggcagagccctatcgcatcgcgagcaggcgct
GAT-F 5 Tgctcgcgatgcgatagggctctgccagtgagc
Vector-R 6 gggtttaaacccctgcagggtgtacaccggcgcgccttacttgtacagctcgtccatgc
GAA-R 7 Cactggcagagccctttcgcatcgcgagcaggcgct
GAA-F 8 Tgctcgcgatgcgaaagggctctgccagtgagc
GAG-R 9 Cactggcagagccctctcgcatcgcgagcaggcgct
GAG-F 10 Tgctcgcgatgcgagagggctctgccagtgagc
GAC-R 11 Cactggcagagccctgtcgcatcgcgagcaggcgct
GAC-F 12 Tgctcgcgatgcgacagggctctgccagtgagc
AAA-R 13 Cactggcagagcccttttgcatcgcgagcaggcgct
AAA-F 14 Tgctcgcgatgcaaaagggctctgccagtgagc
AAT-R 15 cactggcagagccctattgcatcgcgagcaggcgct
AAT-F 16 tgctcgcgatgcaatagggctctgccagtgagc
AAC-R 17 cactggcagagccctgttgcatcgcgagcaggcgct
AAC-F 18 tgctcgcgatgcaacagggctctgccagtgagc
AAG-R 19 cactggcagagccctcttgcatcgcgagcaggcgct
AAG-F 20 tgctcgcgatgcaagagggctctgccagtgagc
CAA-R 21 cactggcagagccctttggcatcgcgagcaggcgct
CAA-F 22 tgctcgcgatgccaaagggctctgccagtgagc
CAT-R 23 cactggcagagccctatggcatcgcgagcaggcgct
CAT-F 24 tgctcgcgatgccatagggctctgccagtgagc
CAC-R 25 cactggcagagccctgtggcatcgcgagcaggcgct
CAC-F 26 tgctcgcgatgccacagggctctgccagtgagc
CAG-R 27 cactggcagagccctctggcatcgcgagcaggcgct
CAG-F 28 tgctcgcgatgccagagggctctgccagtgagc
TAA-R 29 cactggcagagccctttagcatcgcgagcaggcgct
TAA-F 30 tgctcgcgatgctaaagggctctgccagtgagc
TAG-R 31 cactggcagagccctctagcatcgcgagcaggcgct
TAG-F 32 tgctcgcgatgctagagggctctgccagtgagc
TAC-R 33 cactggcagagccctgtagcatcgcgagcaggcgct
TAC-F 34 tgctcgcgatgctacagggctctgccagtgagc
TAT-R 35 cactggcagagccctatagcatcgcgagcaggcgct
TAT-F 36 tgctcgcgatgctatagggctctgccagtgagc
表2:構建16種三鹼基基序報告體系所用材料以及組裝順序
片段 來源 質體/範本 酶/引子 正確條帶 組裝 三鹼基基序
0 酶切 Reporter1 XbaI AscI 7951 0 1 2 GAU
1 PCR Reporter1 Vector-F GAT-R 153
2 PCR Reporter1 GAT-F Vector-R 735
3 PCR Reporter1 Vector-F GAA-R 153 0 3 4 GAA
4 PCR Reporter1 GAA-F Vector-R 735
5 PCR Reporter1 Vector-F GAG-R 153 0 5 6 GAG
6 PCR Reporter1 GAG-F Vector-R 735
7 PCR Reporter1 Vector-F GAC-R 153 0 7 8 GAC
8 PCR Reporter1 GAC-F Vector-R 735
9 PCR Reporter1 Vector-F AAA-R 153 0 9 10 AAA
10 PCR Reporter1 AAA-F Vector-R 735
11 PCR Reporter1 Vector-F AAT-R 153 0 11 12 AAU
12 PCR Reporter1 AAT-F Vector-R 735
13 PCR Reporter1 Vector-F AAC-R 153 0 13 14 AAC
14 PCR Reporter1 AAC-F Vector-R 735
15 PCR Reporter1 Vector-F AAG-R 153 0 15 16 AAG
16 PCR Reporter1 AAG-F Vector-R 735
17 PCR Reporter1 Vector-F CAA-R 153 0 17 18 CAA
18 PCR Reporter1 CAA-F Vector-R 735
19 PCR Reporter1 Vector-F CAT-R 153 0 19 20 CAU
20 PCR Reporter1 CAT-F Vector-R 735
21 PCR Reporter1 Vector-F CAC-R 153 0 21 22 CAC
22 PCR Reporter1 CAC-F Vector-R 735
23 PCR Reporter1 Vector-F CAG-R 153 0 23 24 CAG
24 PCR Reporter1 CAG-F Vector-R 735
25 PCR Reporter1 Vector-F TAA-R 153 0 25 26 UAA
26 PCR Reporter1 TAA-F Vector-R 735
27 PCR Reporter1 Vector-F TAG-R 153 0 27 28 UAG
28 PCR Reporter1 TAG-F Vector-R 735
29 PCR Reporter1 Vector-F TAC-R 153 0 29 30 UAC
30 PCR Reporter1 TAC-F Vector-R 735
31 PCR Reporter1 Vector-F TAT-R 153 0 31 32 UAU
32 PCR Reporter1 TAT-F Vector-R 735
表3: 實施例1-3中使用的arRNA序列
arRNA SEQ ID NO 序列(5’-3’)
arRNA UCU 37 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUUCUGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA ACU 38 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUACUGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA GCU 39 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUGCUGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA CCU 40 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCUGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA UCA 41 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUUCAGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA ACA 42 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUACAGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA GCA 43 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUGCAGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA CCA 44 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCAGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA UCG 45 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUUCGGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA ACG 46 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUACGGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA GCG 47 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUGCGGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA CCG 48 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCGGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA UCC 49 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUUCCGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA ACC 50 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUACCGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA GCC 51 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUGCCGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA CCC 52 mG*mA*mU*GGGCACCACCCCGGUGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCCGCAUCGCGAGCAGGCGCUGCCmU*mC*mC
arRNA 隨機 53 mC*mA*mA*UAGGCACUAACUUAUUGGCGCUGGUGAACGGACUUCCUCUCGAGUACCAGAAGAUGACUACAAAACUCCUUUCCAUUGCGAGUAUmC*mG*mG
注: m表示對其右側鹼基進行二甲氧修飾(2’-O-me);*表示其前後兩個核苷酸之間由硫代磷酸二脂鍵(Phosphorothioate)連接;底線標記的核酸在arRNA與靶標RNA雜交時與靶標RNA上的三鹼基基序直接相對的3個鹼基
表4:報告子1參考序列:(SEQ ID NO:54)
ctaggcttttgcaaaaagctatcgctagctcgagcacgtgttgacaattaatcatcggcatagtatatcggcatagtataatacgacaaggtgaggaactaaaccATGGCCAAGCCTTTGTCTCAAGAAGAATCCACCCTCATTGAAAGAGCAACGGCTACAATCAACAGCATCCCCATCTCTGAAGACTACAGCGTCGCCAGCGCAGCTCTCTCTAGCGACGGCCGCATCTTCACTGGTGTCAATGTATATCATTTTACTGGGGGACCTTGTGCAGAACTCGTGGTGCTGGGCACTGCTGCTGCTGCGGCAGCTGGCAACCTGACTTGTATCGTCGCGATCGGAAATGAGAACAGGGGCATCTTGAGCCCCTGCGGACGGTGCCGACAGGTGCTTCTCGATCTGCATCCTGGGATCAAAGCCATAGTGAAGGACAGTGATGGACAGCCGACGGCAGTTGGGATTCGTGAATTGCTGCCCTCTGGTTATGTGTGGGAGGGCTAAGcacttcgtggccgaggagcaggactgagaattccagtcgacaatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaagctgacgtcctttccatggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcctggaattcgagctcggtacctttaagaccaatgacttacaaggcagctgtagatcttagccactttttaaaagaaaaggggggactggaagggctaattcactcccaacgaagacaagatctgctttttgcttgtactgggtctctctggttagaccagatctgagcctgggagctctctggctaactagggaacccactgcttaagcctcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgttgtgtgactctggtaactagagatccctcagacccttttagtcagtgtggaaaatctctagcagtagtagttcatgtcatcttattattcagtatttataacttgcaaagaaatgaatatcagagagtgagaggaacttgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctggctctagctatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggcttttgcgtcgagacgtacccaattcgccctatagtgagtcgtattacgcgcgctcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcgacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttcccaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagcgcgcaattaaccctcactaaagggaacaaaagctggagctgcaagcttaatgtagtcttatgcaatactcttgtagtcttgcaacatggtaacgatgagttagcaacatgccttacaaggagagaaaaagcaccgtgcatgccgattggtggaagtaaggtggtacgatcgtgccttattaggaaggcaacagacgggtctgacatggattggacgaaccactgaattgccgcattgcagagatattgtatttaagtgcctagctcgatacaataaacgggtctctctggttagaccagatctgagcctgggagctctctggctaactagggaacccactgcttaagcctcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgttgtgtgactctggtaactagagatccctcagacccttttagtcagtgtggaaaatctctagcagtggcgcccgaacagggacctgaaagcgaaagggaaaccagagctctctcgacgcaggactcggcttgctgaagcgcgcacggcaagaggcgaggggcggcgactggtgagtacgccaaaaattttgactagcggaggctagaaggagagagatgggtgcgagagcgtcagtattaagcgggggagaattagatcgcgatgggaaaaaattcggttaaggccagggggaaagaaaaaatataaattaaaacatatagtatgggcaagcagggagctagaacgattcgcagttaatcctggcctgttagaaacatcagaaggctgtagacaaatactgggacagctacaaccatcccttcagacaggatcagaagaacttagatcattatataatacagtagcaaccctctattgtgtgcatcaaaggatagagataaaagacaccaaggaagctttagacaagatagaggaagagcaaaacaaaagtaagaccaccgcacagcaagcggccgctgatcttcagacctggaggaggagatatgagggacaattggagaagtgaattatataaatataaagtagtaaaaattgaaccattaggagtagcacccaccaaggcaaagagaagagtggtgcagagagaaaaaagagcagtgggaataggagctttgttccttgggttcttgggagcagcaggaagcactatgggcgcagcctcaatgacgctgacggtacaggccagacaattattgtctggtatagtgcagcagcagaacaatttgctgagggctattgaggcgcaacagcatctgttgcaactcacagtctggggcatcaagcagctccaggcaagaatcctggctgtggaaagatacctaaaggatcaacagctcctggggatttggggttgctctggaaaactcatttgcaccactgctgtgccttggaatgctagttggagtaataaatctctggaacagattggaatcacacgacctggatggagtgggacagagaaattaacaattacacaagcttaatacactccttaattgaagaatcgcaaaaccagcaagaaaagaatgaacaagaattattggaattagataaatgggcaagtttgtggaattggtttaacataacaaattggctgtggtatataaaattattcataatgatagtaggaggcttggtaggtttaagaatagtttttgctgtactttctatagtgaatagagttaggcagggatattcaccattatcgtttcagacccacctcccaaccccgaggggacccgacaggcccgaaggaatagaagaagaaggtggagagagagacagagacagatccattcgattagtgaacggatctcgacggttaacttttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacataatagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaattttatcgataagcttgggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgactctagaggatccggactagtATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTCGCGATGCgatAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAAGGCGCGCCGGTGTACACCCTGCAGGGGTTTAAACCCacgcgtcgaccagtggtcgaccctgtggaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggc
表5
RNA名稱 對應arRNA名稱 RNA序列
A* arRNA UAG gcugcuucauguggucgggguagcggcugaagcacugcacgccguAggucaggguggucacgagggugggccagggcacgggcagcuugcc (SEQ ID NO:55)
U* arRNA UUG gcugcuucauguggucgggguagcggcugaagcacugcacgccguUggucaggguggucacgagggugggccagggcacgggcagcuugcc (SEQ ID NO:56)
C* arRNA UCG gcugcuucauguggucgggguagcggcugaagcacugcacgccguCggucaggguggucacgagggugggccagggcacgggcagcuugcc(SEQ ID NO:57)
G* arRNA UGG gcugcuucauguggucgggguagcggcugaagcacugcacgccguGggucaggguggucacgagggugggccagggcacgggcagcuugcc(SEQ ID NO:58)
注:大小寫字母無區別,大寫字母只為突出序列間差異。
表6. ADAR2-r16全長cDNA序列 (SEQ ID NO:59)
ATGGATATAGAAGATGAAGAAAACATGAGTTCCAGCAGCACTGATGTGAAGGAAAACCGCAATCTGGACAACGTGTCCCCCAAGGATGGCAGCACACCTGGGCCTGGCGAGGGCTCTCAGCTCTCCAATGGGGGTGGTGGTGGCCCCGGCAGAAAGCGGCCCCTGGAGGAGGGCAGCAATGGCCACTCCAAGTACCGCCTGAAGAAAAGGAGGAAAACACCAGGGCCCGTCCTCCCCAAGAACGCCCTGATGCAGCTGAATGAGATCAAGCCTGGTTTGCAGTACACACTCCTGTCCCAGACTGGGCCCGTGCACGCGCCTTTGTTTGTCATGTCTGTGGAGGTGAATGGCCAGGTTTTTGAGGGCTCTGGTCCCACAAAGAAAAAGGCAAAACTCCATGCTGCTGAGAAGGCCTTGAGGTCTTTCGTTCAGTTTCCTAATGCCTCTGAGGCCCACCTGGCCATGGGGAGGACCCTGTCTGTCAACACGGACTTCACATCTGACCAGGCCGACTTCCCTGACACGCTCTTCAATGGTTTTGAAACTCCTGACAAGGCGGAGCCTCCCTTTTACGTGGGCTCCAATGGGGATGACTCCTTCAGTTCCAGCGGGGACCTCAGCTTGTCTGCTTCCCCGGTGCCTGCCAGCCTAGCCCAGCCTCCTCTCCCTGCCTTACCACCATTCCCACCCCCGAGTGGGAAGAATCCCGTGATGATCTTGAACGAACTGCGCCCAGGACTCAAGTATGACTTCCTCTCCGAGAGCGGGGAGAGCCATGCCAAGAGCTTCGTCATGTCTGTGGTCGTGGATGGTCAGTTCTTTGAAGGCTCGGGGAGAAACAAGAAGCTTGCCAAGGCCCGGGCTGCGCAGTCTGCCCTGGCCGCCATTTTTAACTTGCACTTGGATCAGACGCCATCTCGCCAGCCTATTCCCAGTGAGGGTCTTCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGATCTAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGCCCGATTACAAGGATGACGACGATAAGTAG
表7. BFP cDNA序列 (SEQ ID NO:60)
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCTGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCCACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGCGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTGA
表8 實施例4中使用的相關arRNA(arRNA)序列
對應arRNA名稱 SEQ ID NO. RNA序列
arRNA UUU 61 gcugcuucauguggucgggguagcggcugaagcacugcacgccgUUUgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA AUU 62 gcugcuucauguggucgggguagcggcugaagcacugcacgccgAUUgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA GUU 63 gcugcuucauguggucgggguagcggcugaagcacugcacgccgGUUgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA CUU 64 gcugcuucauguggucgggguagcggcugaagcacugcacgccgCUUgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA UUA 65 gcugcuucauguggucgggguagcggcugaagcacugcacgccgUUAgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA AUA 66 gcugcuucauguggucgggguagcggcugaagcacugcacgccgAUAgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA GUA 67 gcugcuucauguggucgggguagcggcugaagcacugcacgccgGUAgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA CUA 68 gcugcuucauguggucgggguagcggcugaagcacugcacgccgCUAgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA UUG 56 gcugcuucauguggucgggguagcggcugaagcacugcacgccgUUGgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA AUG 69 gcugcuucauguggucgggguagcggcugaagcacugcacgccgAUGgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA GUG 70 gcugcuucauguggucgggguagcggcugaagcacugcacgccgGUGgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA CUG 71 gcugcuucauguggucgggguagcggcugaagcacugcacgccgCUGgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA UUC 72 gcugcuucauguggucgggguagcggcugaagcacugcacgccgUUCgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA AUC 73 gcugcuucauguggucgggguagcggcugaagcacugcacgccgAUCgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA GUC 74 gcugcuucauguggucgggguagcggcugaagcacugcacgccgGUCgucaggguggucacgagggugggccagggcacgggcagcuugcc
arRNA CUC 75 gcugcuucauguggucgggguagcggcugaagcacugcacgccgCUCgucaggguggucacgagggugggccagggcacgggcagcuugcc
Ran-91 76 uaauccugaauaucgcgcaauuccccagcagagaacaucgcggugugaacgucccuuuauaccgggcagguauagcugaaaucagcguggc
注:大小寫字母無區別,大寫字母只為突三連互補鹼基。
參考文獻1.  Adikusuma, F., Piltz, S., Corbett, M. A., Turvey, M., McColl, S. R., Helbig, K. J., ... & Thomas, P. Q. (2018). Large deletions induced by Cas9 cleavage. Nature, 560(7717), E8-E9. 2.  Cox, D. B., Gootenberg, J. S., Abudayyeh, O. O., Franklin, B., Kellner, M. J., Joung, J., & Zhang, F. (2017). RNA editing with CRISPR-Cas13. Science, 358(6366), 1019-1027. 3.  Charlesworth, C. T., Deshpande, P. S., Dever, D. P., Camarena, J., Lemgart, V. T., Cromer, M. K., ... & Behlke, M. A. (2019). Identification of preexisting adaptive immunity to Cas9 proteins in humans. Nature medicine, 25(2), 249-254. 4.  Cullot, G., Boutin, J., Toutain, J., Prat, F., Pennamen, P., Rooryck, C., ... & Bibeyran, A. (2019). CRISPR-Cas9 genome editing induces megabase-scale chromosomal truncations. Nature communications, 10(1), 1-14. 5.  Enache, O. M., Rendo, V., Abdusamad, M., Lam, D., Davison, D., Pal, S., ... & Thorner, A. R. (2020). Cas9 activates the p53 pathway and selects for p53-inactivating mutations. Nature Genetics, 1-7. 6.  Haapaniemi, E., Botla, S., Persson, J., Schmierer, B., & Taipale, J. (2018). CRISPR–Cas9 genome editing induces a p53-mediated DNA damage response. Nature medicine, 24(7), 927-930. 7.  Merkle, T., Merz, S., Reautschnig, P., Blaha, A., Li, Q., Vogel, P., ... & Stafforst, T. (2019). Precise RNA editing by recruiting endogenous ADARs with antisense oligonucleotides. Nature biotechnology, 37(2), 133-138. 8.  Qu, L., Yi, Z., Zhu, S., Wang, C., Cao, Z., Zhou, Z., ... & Bao, Y. (2019). Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs. Nature biotechnology, 37(9), 1059-1069. 9.  Vogel, P., Moschref, M., Li, Q., Merkle, T., Selvasaravanan, K. D., Li, J. B., & Stafforst, T. (2018). Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs. Nature methods, 15(7), 535-538. 10.  Nishikura K. (2010). Functions and regulation of RNA editing by ADAR deaminases. Annual review of biochemistry, 79, 321–349 11.  Paul Vogel, Matin Moschref, Qin Li, Tobias Merkle, Karthika D. Selvasaravanan, Jin Billy Li & Thorsten Stafforst. (2018). Efficient and precise editing of endogenous transcripts with SNAP-tagged ADARs. Nat Methods 15, 535–538 (2018). 12.  Abudayyeh, O. O., Gootenberg, J. S., Franklin, B., Koob, J., Kellner, M. J., Ladha, A., ... & Zhang, F. (2019). A cytosine deaminase for programmable single-base RNA editing. Science, 365(6451), 382-386. 13.  Vu, L. T., Nguyen, T. T. K., Md Thoufic, A. A., Suzuki, H., & Tsukahara, T. (2016). Chemical RNA editing for genetic restoration: the relationship between the structure and deamination efficiency of carboxyvinyldeoxyuridine oligodeoxynucleotides. Chemical biology & drug design, 87(4), 583-593. 14.  Keppler, A., Gendreizig, S., Gronemeyer, T., Pick, H., Vogel, H., & Johnsson, K. (2003). A general method for the covalent labeling of fusion proteins with small molecules in vivo. Nature Biotechnology, 21(1), 86-89. 15.  Stafforst, T., & Schneider, M. F. (2012). An RNA–Deaminase Conjugate Selectively Repairs Point Mutations. Angewandte Chemie, 51(44), 11166-11169.
圖1 REPAIR體系的三連偏好性(Cox et al., 2017)。 圖2 SNAP-ADAR體系的三連偏好性(Vogel et al., 2018)。 圖3 LEAPER體系的三連偏好性(Qu et al., 2019)。 圖4 LEAPER體系的基本流程與本案例的改進。 圖5 構建16種三鹼基基序的報告體系。 圖6 16種三連互補鹼基的設計,按現有技術中LEAPER體系arRNA設計原則與三鹼基基序對應的結果。 圖7 UAG三鹼基基序報告體系的首次測試。 圖8 UAG三鹼基基序報告體系的重複實驗。 圖9 LEAPER體系文獻報導對UAG三鹼基基序報告體系的測試(Qu et al., 2019)。 圖10 UAG三鹼基基序的編輯效率測定。 圖11A-11C GAN三鹼基基序的編輯效率測定,包括GAU(圖11A)、GAG(圖11B)、和GAC(圖11C)。 圖12 本案例的arRNA設計改進。 圖13A-13D 按照本案例改進arRNA設計後編輯效率的提升,包括針對三鹼基基序GAA(圖13A)、GAU(圖13B)、GAG(圖13C)、和GAC(圖13D)的arRNA設計改進。 圖14 Reporter1質體圖譜以及序列。 圖15 顯示對C到U編輯體系的測試,其中靶標殘基為C,測試上游殘基及三連互補鹼基中與靶標C相對的鹼基的變化對編輯效率的影響。圖中“/”代表未添加對應質體或arRNA,僅添加相同體積水。 圖16 顯示圖15中部分資料的重複結果。圖中“/”代表未添加對應質體或arRNA,僅添加相同體積水。 圖17 對C到U編輯體系的測試。其中arRNA的三連互補鹼基中僅有與靶標C的錯配,且標靶C對應的錯配鹼基為U,而與靶標C的上游殘基以及下游殘基完全匹配的情況下的測試結果。 圖18 遴選出圖15數據中mRNA三鹼基基序為N*CA(如橫軸所示),arRNA三連互補鹼基為GUU的資料,用於與圖17中資料做比較。 圖19A-19B 顯示了對圖18和圖17中使用的各三鹼基基序和三連互補鹼基的配對分析。其中,圖19A中的三鹼基基序和三連互補鹼基用於得出圖18中的結果,圖19B中的三鹼基基序和三連互補鹼基用於得出圖17中的結果。 圖20 使用報告體系對多個錯配及單個錯配情況下編輯效率的比較,結果以%GFP顯示。其中三鹼基基序中與靶標殘基C配對的鹼基為C,與靶標殘基的下游殘基相對的為U。圖中“mRNA 5’鹼基”表示三鹼基基序的中的上游殘基。對於其他未提及的鹼基,mRNA與arRNA均形成嚴格的互補配對。 圖21 使用報告體系對多個錯配及單個錯配情況下編輯效率的比較,是圖20中所示相同試驗以平均螢光強度(MFI)顯示的結果。 圖22A-22D 顯示不同設計的arRNA對ACA(圖22A)、TCA(圖22B)、CCA(圖22C)和GCA(圖22D)三鹼基基序的編輯效率測試。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032

Claims (57)

  1. 一種在宿主細胞的靶標殘基位置編輯靶標RNA的方法,其包括將脫氨酶招募RNA(arRNA)或編碼該arRNA的構建體引入宿主細胞,其中所述arRNA包含與靶標RNA雜交的互補RNA序列,其中所述靶標殘基位於一個三鹼基基序中,所述三鹼基基序包含靶標RNA中靶標殘基的5'最近鄰殘基(上游殘基),靶標殘基和靶標RNA中靶標殘基的3'最近鄰殘基(下游殘基),其中所述三鹼基基序不是UAG,並且其中所述互補RNA序列包含與所述靶標RNA上的上游殘基和/或下游殘基直接相對的錯配。
  2. 如請求項1所述的方法,其中所述互補RNA序列包含與所述靶標RNA的上游殘基直接相對的錯配。
  3. 如請求項1或2所述的方法,其中,所述互補RNA序列包含與所述靶標RNA的下游殘基直接相對的錯配。
  4. 如請求項1-3中任一項所述的方法,其中所述靶標殘基是腺苷。
  5. 如請求項4所述的方法,其中所述上游殘基選自G、A、或C。
  6. 如請求項1-4中任一項所述的方法,其中所述三鹼基基序選自GAG,GAC,GAA,GAU,AAG,AAC,AAA,AAU,CAG,CAC,CAA,CAU,UAA,UAC和UAU。
  7. 如請求項4-6中任一項所述的方法,其中所述互補RNA序列包含與所述靶標RNA中的所述靶標腺苷直接相對的胞苷,腺苷或尿苷。
  8. 如請求項4-7中任一項所述的方法,其中所述互補RNA序列還包含一個或多個錯配,所述錯配各自與所述靶標RNA中的非靶標腺苷相對。
  9. 如請求項4-8中任一項所述的方法,其中所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序相對的ACG、UCC、CCU或ACA。
  10. 如請求項9中所述的方法,其中所述三鹼基基序是GAU,並且其中所述互補RNA序列包含與所述三鹼基基序相對的ACG。
  11. 如請求項4-8中任一項所述的方法,其中所述三鹼基基序是GAA,並且其中所述互補RNA序列包括與所述三鹼基基序相對的UCA、CCG、CCC或UCG。
  12. 如請求項11中所述的方法,其中所述三鹼基基序是GAA,所述互補RNA序列包括與所述三鹼基基序相對的UCA或UCG。
  13. 如請求項4-8中任一項所述的方法,其中所述三鹼基基序是GAC,並且其中所述互補RNA序列包含與所述三鹼基基序相對的GCG或GCA。
  14. 如請求項13所述的方法,其中所述三鹼基基序是GAC,所述互補RNA序列包含與所述三鹼基基序相對的GCG。
  15. 如請求項4-8中任一項所述的方法,其中所述三鹼基基序是GAG,並且其中所述互補RNA序列包含與所述三鹼基基序相對的CCG、CCA、CCC、UCC或UCG。
  16. 如請求項15所述的方法,其中所述三鹼基基序是GAG ,所述互補RNA序列包含與所述三鹼基基序相對的CCG。
  17. 如請求項4-8中任一項所述的方法,其中所述靶標RNA中的上游殘基選自G,C,A和U的核苷酸,較佳次序為G>C≈A>U。
  18. 如請求項4-8中任一項所述的方法,其中所述三鹼基基序上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G或A。
  19. 如請求項4-18中任一項所述的方法,其中所述三鹼基基序的下游殘基與所述互補RNA中相對的鹼基嚴格互補。
  20. 如請求項4-19中任一項所述的方法,其中所述arRNA招募作用於RNA的腺苷脫氨酶(ADAR)或包含ADAR催化結構域的融合蛋白以使所述靶標RNA中的靶標腺苷脫氨。
  21. 如請求項20所述的方法,其中所述包含ADAR催化結構域的融合蛋白進一步包含靶向結構域。
  22. 如請求項20或21所述的方法,其中所述ADAR蛋白或包含ADAR催化結構域的融合蛋白或編碼所述ADAR蛋白或包含ADAR催化結構域的融合蛋白的構建體經外源引入所述宿主細胞中。
  23. 如請求項20所述的方法,其中所述ADAR蛋白由所述宿主細胞內源表達。
  24. 如請求項1-3中任一項所述的方法,其中所述靶標殘基是胞苷,所述arRNA招募作用於RNA的具有胞苷脫氨酶活性的脫氨酶,以使所述靶標RNA中的靶標胞苷脫氨。
  25. 如請求項24所述的方法,其中所述靶標RNA中的靶標胞苷所在的三鹼基基序選自以下任一項:GCG, GCC,GCA,GCU,ACG,ACC,ACA,ACU,CCG,CCC,CCA,CCU,UCA,UCC,UCU和UCG。
  26. 如請求項24或25所述的方法,其中所述互補RNA序列包含與所述靶RNA中的所述靶標胞苷相對的胞苷,腺苷或尿苷。
  27. 如請求項24至26中任一項所述的方法,其中所述互補RNA序列還包含一個或多個錯配,所述錯配各自與所述靶RNA中的非靶標胞苷相對。
  28. 如請求項24-27中任一項所述的方法,其中所述三鹼基基序上游殘基為G,且其中所述互補RNA中與所述上游殘基相對的鹼基為G。
  29. 如請求項24-27中任一項所述的方法,其中所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG或UCG。
  30. 如請求項29所述的方法,其中所述三鹼基基序為GCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的UUG。
  31. 如請求項24-27中任一項所述的方法,其中所述三鹼基基序為CCA,並且其中所述互補RNA序列包含與所述三鹼基基序相對的AUG。
  32. 如請求項24-27中任一項所述的方法,其中所述靶標RNA中的上游殘基選自G,C,A和U的核苷酸,較佳次序為G>C>A≈U。
  33. 如請求項24-32中任一項所述的方法,其中所述具有胞苷脫氨酶活性的脫氨酶是對ADAR蛋白或包含ADAR催化結構域的融合蛋白進行基因修飾後獲得C到U催化活性的脫氨酶。
  34. 如請求項33所述的方法,其中所述具有胞苷脫氨酶活性的脫氨酶還包含靶向結構域。
  35. 如請求項21或34所述的方法,其中所述靶向結構域選自以下所述的任一項:SNAP-tag、λN肽、或催化失活的Cas13蛋白。
  36. 如請求項22或24所述的方法,其中所述構建體為選自以下的任一項:病毒載劑、質體或線性核酸鏈。
  37. 如請求項1-36中任一項所述的方法,其中所述arRNA的長度為約20-260個核苷酸。
  38. 如請求項1-37中任一項所述的方法,其中所述arRNA是單鏈RNA。
  39. 如請求項1-38中任一項所述的方法,其中所述互補RNA序列是單鏈的,並且其中所述arRNA還包含一個或多個雙鏈區域。
  40. 如請求項1-39中任一項所述的方法,其中所述arRNA還包含ADAR招募結構域。
  41. 如請求項1-40中任一項所述的方法,其中所述arRNA包含一種或多種化學修飾。
  42. 如請求項1-40中任一項所述的方法,其中所述arRNA不包含任何化學修飾。
  43. 如請求項1-42中任一項所述的方法,其中所述靶標RNA是選自信使RNA前體、信使RNA、核醣體RNA、轉運RNA、長鏈非編碼RNA和小RNA的RNA。
  44. 如請求項1-43中任一項中所述的方法,其中在靶標RNA的靶標殘基上進行編輯導致靶標RNA的錯義突變、提前出現的終止密碼子、異常剪接或可變剪接,或逆轉靶標RNA中的錯義突變、提前出現的終止密碼子、異常剪接或可變剪接。
  45. 如請求項1-44中任一項所述的方法,其中在靶標RNA中編輯靶標殘基導致靶標RNA編碼的蛋白的點突變、截短、延長和/或錯誤折疊,或藉由逆轉靶標RNA的錯義突變、提前出現的終止密碼子、異常剪接、或可變剪接獲得功能性的、全長、正確折疊的和/或野生型的蛋白質。
  46. 請求項1-45中任一項所述的方法,其中所述宿主細胞是真核細胞。
  47. 如請求項46所述的方法,其中所述宿主細胞是哺乳動物細胞。
  48. 如請求項47所述的方法,其中所述宿主細胞是人或小鼠細胞。
  49. 如請求項1-48中任一項所述的方法產生的經編輯的RNA或包含經編輯的RNA的宿主細胞。
  50. 一種文庫,其包含多個根據請求項49中所述的RNA或多個如請求項49所述經編輯的RNA的宿主細胞。
  51. 一種用於在個體中治療或預防疾病或病症的方法,其包括如請求項1-48中任一項所述的方法編輯個體細胞中與所述疾病或病症相關的靶標RNA。
  52. 如請求項51所述的方法,其中所述疾病或病症是遺傳性基因疾病或與一種或多種獲得性基因突變相關的疾病或病症。
  53. 一種arRNA,其包括如請求項1-49中任一項所述方法中使用的arRNA。
  54. 一種病毒載劑、質體或線性核酸鏈,其包含如請求項53所述的arRNA,且所述arRNA不包含任何化學修飾。
  55. 一種文庫,其包含多個如請求項53所述的arRNA或多個根據請求項54中所述的病毒載劑、質體或線性核酸鏈。
  56. 一種組合物,其包含如請求項53所述的arRNA或如請求項54所述的病毒載劑、質體或線性核酸鏈。
  57. 一種宿主細胞,其包含如請求項53所述的arRNA或如請求項54所述的病毒載劑、質體或線性核酸鏈。
TW110124834A 2020-07-06 2021-07-06 一種改善的rna編輯方法 TW202214853A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
WOPCT/CN2020/100467 2020-07-06
CN2020100467 2020-07-06

Publications (1)

Publication Number Publication Date
TW202214853A true TW202214853A (zh) 2022-04-16

Family

ID=79552779

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110124834A TW202214853A (zh) 2020-07-06 2021-07-06 一種改善的rna編輯方法

Country Status (9)

Country Link
US (1) US20230272379A1 (zh)
EP (1) EP4177345A4 (zh)
JP (1) JP2023532375A (zh)
KR (1) KR20230035362A (zh)
CN (1) CN116194582A (zh)
AU (1) AU2021305359A1 (zh)
CA (1) CA3185231A1 (zh)
TW (1) TW202214853A (zh)
WO (1) WO2022007803A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017281497B2 (en) 2016-06-22 2023-04-06 Proqr Therapeutics Ii B.V. Single-stranded RNA-editing oligonucleotides
WO2023152371A1 (en) 2022-02-14 2023-08-17 Proqr Therapeutics Ii B.V. Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia
WO2023185231A1 (en) * 2022-04-02 2023-10-05 Edigene Therapeutics (Beijing) Inc. Engineered adar-recruiting rnas and methods of use for usher syndrome
WO2024013361A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Oligonucleotides for adar-mediated rna editing and use thereof
WO2024013360A1 (en) 2022-07-15 2024-01-18 Proqr Therapeutics Ii B.V. Chemically modified oligonucleotides for adar-mediated rna editing
GB202215614D0 (en) 2022-10-21 2022-12-07 Proqr Therapeutics Ii Bv Heteroduplex rna editing oligonucleotide complexes
WO2024099575A1 (en) * 2022-11-11 2024-05-16 Eberhard Karls Universität Tübingen Artificial nucleic acids for site-directed editing of a target rna
WO2024110565A1 (en) 2022-11-24 2024-05-30 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of hereditary hfe-hemochromatosis
GB202218090D0 (en) 2022-12-01 2023-01-18 Proqr Therapeutics Ii Bv Antisense oligonucleotides for the treatment of aldehyde dehydrogenase 2 deficiency
WO2024121373A1 (en) 2022-12-09 2024-06-13 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of cardiovascular disease
GB202300865D0 (en) 2023-01-20 2023-03-08 Proqr Therapeutics Ii Bv Delivery of oligonucleotides
WO2024175550A1 (en) 2023-02-20 2024-08-29 Proqr Therapeutics Ii B.V. Antisense oligonucleotides for the treatment of atherosclerotic cardiovascular disease

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015527889A (ja) 2012-07-25 2015-09-24 ザ ブロード インスティテュート, インコーポレイテッド 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用
US11390865B2 (en) * 2015-07-14 2022-07-19 Fukuoka University Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex
EP3645054A4 (en) 2017-06-26 2021-03-31 The Broad Institute, Inc. COMPOSITIONS BASED ON CRISPR / CAS-ADENIN-DEAMINASE, SYSTEMS AND METHODS FOR TARGETED NUCLEIC ACID EDITING
WO2019071048A1 (en) 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
CN112752844A (zh) 2018-06-29 2021-05-04 蒂宾根大学 用于rna编辑的人工核酸
GB2590880A (en) * 2018-09-06 2021-07-07 Univ California RNA and DNA base editing via engineered ADAR recruitment
KR102666695B1 (ko) 2018-10-12 2024-05-23 페킹 유니버시티 Rna를 편집하기 위한 방법 및 조성물

Also Published As

Publication number Publication date
WO2022007803A1 (zh) 2022-01-13
JP2023532375A (ja) 2023-07-27
EP4177345A1 (en) 2023-05-10
CA3185231A1 (en) 2022-01-13
KR20230035362A (ko) 2023-03-13
CN116194582A (zh) 2023-05-30
AU2021305359A1 (en) 2023-02-16
EP4177345A4 (en) 2024-06-26
US20230272379A1 (en) 2023-08-31

Similar Documents

Publication Publication Date Title
WO2022007803A1 (zh) 一种改善的rna编辑方法
US11702658B2 (en) Methods and compositions for editing RNAs
US20230242916A1 (en) Method and drug for treating hurler syndrome
IL263332B2 (en) RNA-editing single-stranded oligonucleotides
AU2015367378A1 (en) Targeted RNA editing
WO2021136520A1 (zh) 一种靶向编辑rna的新方法
CN113528582B (zh) 基于leaper技术靶向编辑rna的方法和药物
JP2024504608A (ja) 遺伝子操作rnaを使用した内因性adarの活用による標的化rnaの編集
EP3870707A1 (en) Compositions and methods related to nucleic acid anticoagulants
CN113122524B (zh) 一种靶向编辑rna的新方法
WO2018223843A1 (zh) 用于dna编辑的系统及其应用
TW202339774A (zh) 基於leaper技術治療mpsi的方法和組合物
WO2008138066A1 (en) Suppression of viruses involved in respiratory infection or disease