CN111793627A - 利用人工构建rna编辑酶进行rna定点编辑及相关应用 - Google Patents

利用人工构建rna编辑酶进行rna定点编辑及相关应用 Download PDF

Info

Publication number
CN111793627A
CN111793627A CN201910277423.0A CN201910277423A CN111793627A CN 111793627 A CN111793627 A CN 111793627A CN 201910277423 A CN201910277423 A CN 201910277423A CN 111793627 A CN111793627 A CN 111793627A
Authority
CN
China
Prior art keywords
rna
editing
domain
sequence
editing enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910277423.0A
Other languages
English (en)
Inventor
王泽峰
韩文建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institutes for Biological Sciences SIBS of CAS
Original Assignee
Shanghai Institutes for Biological Sciences SIBS of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institutes for Biological Sciences SIBS of CAS filed Critical Shanghai Institutes for Biological Sciences SIBS of CAS
Priority to CN201910277423.0A priority Critical patent/CN111793627A/zh
Priority to PCT/CN2020/082183 priority patent/WO2020207286A1/zh
Priority to CN202080000996.XA priority patent/CN112055750A/zh
Priority to EP20786915.7A priority patent/EP3954774A4/en
Priority to JP2021560203A priority patent/JP2022529329A/ja
Priority to US17/601,963 priority patent/US20220195416A1/en
Publication of CN111793627A publication Critical patent/CN111793627A/zh
Priority to JP2024003552A priority patent/JP2024041916A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/50Hydrolases (3) acting on carbon-nitrogen bonds, other than peptide bonds (3.5), e.g. asparaginase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明提供了利用人工构建RNA编辑酶进行RNA定点编辑及相关应用。具体地,本发明提供了将用于结合RNA的RNA识别结构域(RNA recognition domain)和发挥功能的效用结构域(effector domain)融合,组成新的功能蛋白,其通过识别结构域特异性靶向目标RNA并利用效用结构域来进行RNA编辑。本发明可用于在RNA水平进行基因编辑,从而消除致病性RNA以纠正致病错误点突变;或者对表达的RNA分子进行编辑从而对基因功能进行特异性操控。

Description

利用人工构建RNA编辑酶进行RNA定点编辑及相关应用
技术领域
本发明属于生物领域,具体地,本发明涉及利用人工构建RNA编辑酶进行RNA定点编辑及相关应用。
背景技术
DNA是生物体内最主要的遗传物质。目前,已知的人类疾病中很大一部分是由遗传突变导致的,单碱基突变是其中最大的一类。因此,开发一种方法来改变基因组中单个碱基的序列,高效、精准地修复致病单碱基突变对研究和治疗遗传病非常有意义。
目前的针对单碱基突变疾病的基因治疗策略,主要是通过在DNA或RNA水平直接修复或替代突变基因、而从治疗疾病的策略。主要方法有基于CRISPR技术的针对DNA的碱基编辑系统ABE和CBE,这些技术都能在一定程度上进行碱基编辑,但是也还存在很多不足:
(1)目前的CRISPR介导的碱基编辑系统精确度不足,进行单碱基编辑效率较低,普遍存在一个编辑窗口,在对靶位点进行编辑的时候,会引入额外的突变。
(2)CRISPR系统非常庞大,目前的基因导入技术很难一次性将整个CRISPR系统包裹在同一个体系里,进行递送,所以在治疗过程中存在低效的基因导入,编辑效率低。
(3)受转基因大小的限制,有些基因组位点很难转入。
(4)作为细菌蛋白的Cas蛋白引起的免疫应答和毒性。
(5)基因插入时产生的突变或整合时发生的一些意料外的事件。
尤其重要的是,由于基因组DNA的改变会伴随细胞一生,因而基因组DNA编辑的长期安全性担忧一直是个较大的问题。
因此,本领域技术人员急需开发一种能够有效地对基因进行编辑的方法,以便对单碱基突变疾病进行有效的基因治疗。
发明内容
本发明的目的是提供一种能够有效地对基因进行编辑的方法及其应用。
在本发明的第一方面,提供了一种RNA编辑酶,所述RNA编辑酶包括:
(a)RNA识别结构域,所述RNA识别结构域用于识别待编辑的RNA序列的RNA识别序列,并结合于所述的RNA识别序列;
(b)效用结构域,所述的效用结构域用于对待编辑的RNA序列进行核苷酸编辑;
其中,所述的RNA识别结构域与所述的效用结合域是可操作地连接的。
在另一优选例中,所述效用结构域选自下组:ADAR家族成员的脱氨基催化结构域、APOBEC家族成员的脱氨基催化结构域、RNA甲基化酶、RNA去甲基化酶、加尿嘧啶合成酶、或其组合。
在另一优选例中,所述的RNA识别结构域含有n个识别单元,所述的每个识别单元用于识别一个RNA碱基,其中n为5-30的正整数。
在另一优选例中,n为6-24,更佳地为8-20,例如,6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24。
在另一优选例中,每个识别单元为α-螺旋的重复序列,并且所述重复序列上特定位置的三个氨基酸来负责结合RNA碱基。
在另一优选例中,所述的n个识别单元是串联的,构成RNA碱基识别区。
在另一优选例中,所述的RNA识别结构域还包括任选的分别位于RNA碱基识别区两侧的保护区,用于保护所述的RNA碱基识别区。
在另一优选例中,所述的RNA识别结构域来自PUF蛋白。
在另一优选例中,所述的RNA识别结构域不包括PUF蛋白中位于RNA碱基识别区上游的结构域(保护区除外),但可包括或不包括PUF蛋白中位于RNA碱基识别区下游的结构域(保护区除外)。
在另一优选例中,所述的保护区是在RNA碱基识别区的两端的没有功能的重复序列。
在另一优选例中,所述的RNA编辑酶还包括选自下组的一种或多种元件:连接肽、标签序列、信号肽序列、定位肽序列、或其组合。
在另一优选例中,所述的定位肽序列包括细胞核定位信号序列、线粒体定位信号序列、或其组合。
在另一优选例中,所述的一种或多种元件与所述的RNA识别结构域和效用结构域是可操作地连接的。
在另一优选例中,所述的一种或多种元件各自独立地位于所述的RNA编辑酶的N端和/或C端和/或中间。
在另一优选例中,所述的信号肽位于所述的RNA编辑酶的N端。
在另一优选例中,所述的连接肽、标签序列、和/或定位肽信号各自独立地位于所述识别结构域和效用结构域之间。
在另一优选例中,所述的RNA为单链。
在另一优选例中,所述RNA编辑酶包括RNA识别结构域和效用结构域,以及任选的连接肽、标签序列、信号肽序列和/或定位肽序列。
在另一优选例中,所述RNA编辑酶的结构如下式I至式IV中任一所示:
D-L2-A-L1-B (I);
D-L2-B-L1-A (II);
A-L1-B-L2-D (III);
B-L1-A-L2-D (IV);
式中,各“-”独立地为连接肽或肽键;
A为RNA识别结构域;
B为效用结构域;
L1和L2各自独立地为无或连接肽;
D为无或定位肽。
在另一优选例中,所述的定位肽位于所述RNA编辑酶的N、C端或中间。
在另一优选例中,所述RNA识别结构域为可识别并结合RNA的结构域,较佳地来源于RNA结合蛋白。
在另一优选例中,所述RNA识别结构域为PUF蛋白片段。
在另一优选例中,所述PUF蛋白片段为PUF蛋白中可识别结合RNA的结构域的片段。
在另一优选例中,所述PUF蛋白包括PUF蛋白及其同源蛋白。
在另一优选例中,所述PUF蛋白来自哺乳动物,较佳地来自灵长动物,更佳地来自人。
在另一优选例中,所述RNA识别结构域具有如SEQ ID NO.:1所示的氨基酸序列。
GRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG(SEQ ID NO.:1)
在另一优选例中,所述ADAR家族成员包括:dADAR、ADAR1、ADAR2、TadA、或其组合。
在另一优选例中,所述ADAR家族成员来源于人或果蝇或细菌。
在另一优选例中,所述ADAR家族成员包括:果蝇ADAR、人ADAR1、人ADAR2、大肠杆菌TadA、或其组合。
在另一优选例中,所述ADAR1包括天然的ADAR1和ADAR1突变体。
在另一优选例中,所述ADAR1突变体在对应于天然的ADAR1的氨基酸序列中第1008位发生突变;优选地,所述第1008位谷氨酸(E)突变为谷氨酰胺(Q)。
在另一优选例中,所述效应结构域来自ADAR1,具有SEQ ID NO.:2所示的氨基酸序列:
KAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV(SEQ ID NO.:2)
或者所述效应结构域是ADAR1-E1008Q效应结构域,其氨基酸序列与SEQ ID No.:2相同,但SEQ ID No.:2中第211位从E突变为Q:
KAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGQGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV(SEQ ID No.:2,其中第211位从E突变为Q)。
在另一优选例中,所述ADAR2突变体在对应于天然的ADAR2的氨基酸序列中第488位发生突变;优选地,所述第488位谷氨酸(E)突变为谷氨酰胺(Q)。
在另一优选例中,所述效应结构域具有SEQ ID NO.:2、3或4所示的氨基酸序列或其衍生序列。
在另一优选例中,所述的衍生序列包括:SEQ ID No.:2,并且第211位从E突变为Q);SEQ ID No.:3,其中第227位从E突变为Q;SEQ ID No.:4,其中第187位从E突变为Q。
在另一优选例中,所述效应结构域选自下组:
(i)具有SEQ ID NO.:3所示的氨基酸序列ADAR2-isoform1效应结构域
(ii)具有SEQ ID NO.:3所示的氨基酸序列且第227位从E突变为Q的ADAR2-isoform1-E488Q效应结构域;和
(iii)具有SEQ ID NO.:4所示的氨基酸序列ADAR2-isoform2效应结构域;
(iv)具有SEQ ID NO.:4所示的氨基酸序列且第187位从E突变为Q的ADAR2-isoform2-E488Q效应结构域;
在另一优选例中,ADAR2-isoform1效应结构域氨基酸序列如下:
DQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEGSRSYTQAGVQWCNHGSLQPRPPGLLSDPSTSTFQGAGTTEPADRHPNRKARGQLRTKIESGEGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP(SEQ IDNO.:3)
在另一优选例中,ADAR2-isoform1-E488Q效应结构域的氨基酸序列如下:
DQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEGSRSYTQAGVQWCNHGSLQPRPPGLLSDPSTSTFQGAGTTEPADRHPNRKARGQLRTKIESGQGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP(黄色氨基酸为488位氨基酸突变位点)(SEQ ID No.:3,其中,第227位从E突变为Q)
在另一优选例中,ADAR2-isoform2效应结构域的氨基酸序列如下:
DQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEEPADRHPNRKARGQLRTKIESGEGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP(SEQ ID NO.:4)
在另一优选例中,ADAR2-isoform2-E488Q效应结构域的氨基酸序列如下:
DQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEEPADRHPNRKARGQLRTKIESGQGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP(黄色氨基酸为488位氨基酸突变位点)(SEQ ID No.:4,第187位从E突变为Q)
在另一优选例中,所述APOBEC家族成员包括:Apobec1、Apobec3A、Apobec3G、或其组合。
在另一优选例中,所述APOBEC家族成员来源于人或鼠,较佳地来源于人。
在另一优选例中,所述APOBEC家族成员选自下组:人Apobec1、人Apobec3A、人Apobec3B、人Apobec3C、人Apobec3D、人Apobec3F、人Apobec3G、人Apobec3H、人AID、小鼠Apobec1、小鼠Apobec3A、小鼠AID、大鼠Apobec1、大鼠Apobec3A、大鼠AID或其组合。
在另一优选例中,所述APOBEC3A具有SEQ ID NO.:5所示的氨基酸序列(全长氨基酸序列)。
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN(SEQ ID NO.:5)。
在另一优选例中,所述RNA甲基化酶包括:METTL3、METTL14、或其组合。
在另一优选例中,所述RNA去甲基化酶为α-酮戊二酸依赖性双加氧酶FTO(Alpha-ketoglutarate-dependent dioxygenase FTO)。
在另一优选例中,所述加尿嘧啶合成酶为pseudouridine7。
在另一优选例中,所述RNA编辑酶的编辑窗口为第7-14位,较佳地为8-13位,更佳地为9-11位,其中从PUF结合位点的5'端第一位开始起算(即为第1位)。
在另一优选例中,所述RNA编辑酶不含RNA和/或DNA。
在另一优选例中,所述RNA编辑酶中的RNA识别结构域和效用结构域以头-尾、头-头、尾-头、或尾-尾的方式相连。
在另一优选例中,所述RNA编辑酶中的RNA识别结构域和效用结构域直接相连或通过连接肽连接。
在另一优选例中,所述RNA编辑酶的C端或N端还包括有NLS序列和MLS序列。
NLS细胞核定位信号序列:PKKKRKV(SEQ ID No.:13)。
MLS线粒体定位信号序列:MLFNLRILLNNAAFRNGHNFMVRNFRCGQPLQNKVQ(SEQ IDNo.:14)。
在另一优选例中,所述连接肽为无或柔性肽。
在另一优选例中,所述连接肽选自下组:Linker2、Linker7、XTEN、Linker20、Linker40、或其组合。
在另一优选例中,所述连接肽的长度为0-40aa,较佳地为2-20aa。
在另一优选例中,所述连接肽具有SEQ ID NO.:6-9中任一所示的氨基酸序列:
Linker2:EF
Linker7:EFTGNGS(SEQ ID NO.:6)
XTEN:SGSETPGTSESATPES(SEQ ID NO.:7)
Linker20:DQTPSRQPIPSEGLQLHLPQ(SEQ ID NO.:8)
Linker41:KAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGS(SEQ ID NO.:9)
在本发明第二方面,提供了一种分离的多核苷酸,所述多核苷酸编码本发明第一方面中所述的RNA编辑酶。
在本发明第三方面,提供了一种载体,所述载体包括本发明第二方面所述的多核苷酸。
在另一优选例中,所述的载体包括DNA、RNA。
在另一优选例中,所述的载体选自下组:质粒、病毒载体、转座子、或其组合。
在另一优选例中,所述的载体包括DNA病毒、逆转录病毒载体。
在另一优选例中,所述的载体选自下组:慢病毒载体、腺病毒载体、腺相关病毒载体、或其组合。
在另一优选例中,所述载体为慢病毒载体。
在另一优选例中,所述载体包含一个或多个启动子,所述启动子可操作地与所述核酸序列、增强子、内含子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。
在另一优选例中,所述载体为含有或插入有本发明第二方面所述的多核苷酸的载体。
在本发明第四方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第三方面所述的载体、或染色体中整合有外源的本发明第二方面所述的多核苷酸、或表达本发明第一方面所述的RNA编辑酶。
在另一优选例中,所述宿主细胞为原核细胞或真核细胞。
在另一优选例中,所述宿主细胞是人细胞或非人哺乳动物细胞。
在本发明第五方面,提供了一种制剂,其特征在于,所述制剂包括本发明第一方面所述的RNA编辑酶、或第二方面所述的多核苷酸、或第三方面所述的载体,以及药学上可接受的载体或赋形剂。
在另一优选例中,所述制剂为液体制剂。
在本发明第六方面,提供了一种本发明第一方面所述的RNA编辑酶、或第二方面所述的多核苷酸、或第四方面所述的宿主细胞的用途,其特征在于,用于制备
(a)基因治疗的药物或制剂;和/或
(b)对RNA进行编辑的试剂。
在另一优选例中,所述对RNA进行编辑包括将RNA中的A突变为G和/或将C突变为U。
在本发明第七方面,提供了一种编辑RNA的方法,所述方法包括步骤:
(1)提供待编辑的RNA和本发明第一方面所述的RNA编辑酶;和
(2)利用权利要求1所述的RNA编辑酶对所述RNA进行编辑。
在另一优选例中,所述方法为体外或体内的。
在另一优选例中,所述方法为非诊断和非治疗目的。
在另一优选例中,所述编辑RNA包括将RNA中的A突变为G和/或将C突变为U。
在本发明第八方面,提供了一种制备本发明第一方面所述RNA编辑酶的方法,所述方法包括步骤:
在适合表达的条件下,培养本发明第四所述的宿主细胞,从而表达出所述的RNA编辑酶;和分离所述RNA编辑酶。
在另一优选例中,所述宿主细胞为原核细胞或真核细胞。
本发明的第九方面,提供了一种治疗疾病的方法,所述方法包括:给需要的对象使用如本发明第一方面所述的RNA编辑酶、或本发明第二方面所述的多核苷酸、或本发明第三方面所述的载体、或本发明第五方面所述的制剂。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了构建不同的A→G RNA编辑酶。
图2显示了利用PARSEs对靶RNA进行编辑。
图3显示了置换PUF和ADAR的位置产生的酶不能对靶RNA进行编辑。
图4显示了PARSEs对靶RNA编辑的效率和脱靶率分析。
图5显示了利用ePARSE1修复GRIA2基因异常RNA编辑事件。
图6显示了利用ePARSE2修复相关基因致病点突变。
图7显示了延长PARSE系统中PUF结构域的识别和结合靶RNA的能力。
图8显示了构建APRSEs对靶RNA进行编辑。
图9显示了PUF元件的结构示意图。
具体实施方式
本发明人经过广泛而深入的研究,首次开发了一种结构独特的RNA编辑酶。本发明人意外地发现,基于RNA结合的识别结构域和效用结构域的新型RNA编辑酶,可以非常有效地靶向特定的RNA区域并进行高效准确的RNA编辑。本发明的RNA编辑酶不仅可以高效准确地进行RNA编辑,而且可以有效地防止回复突变,因此具有更为灵活、安全、高效等优点。在此基础上,发明人完成了本发明。
术语说明
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。
如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
PUF蛋白(Pumilio homolog 1)
PUF蛋白是一种序列特异性RNA结合蛋白,具有保守的RNA结合结构域,通过结合靶mRNA的3'-UTR来调控mRNA的稳定性或翻译效率。典型的PUF结合结构域包含8个α-螺旋的重复序列,每个重复序列为36个氨基酸,负责识别结合1个碱基,在结合结构域的两端,各有一个没有功能的重复序列,来保护中间的8个重复序列。α-螺旋的重复序列上特定位置的三个氨基酸来负责结合RNA碱基,其中,第12和16位置的侧链氨基酸通过氢键于RNA碱基结合,13号位置的氨基酸起到一个辅助结合的作用,不同的氨基酸组合负责识别不同的碱基(见图9)。经过改造和设计PUF蛋白的每一个重复序列,本申请新设计的PUF可以识别并结合任意8个碱基的RNA序列。经过改造,可以增加和减少PUF重复序列的数量,来拓展PUF对RNA的结合能力,使本申请的PUF可以识别6~16个碱基,更进一步可以识别20个碱基。在不同的物种中,PUF蛋白有很多同源蛋白,具有和PUF蛋白相似的序列特征和类似的功能。
在本发明的一个优选例中,选用了人源的PUM1作为识别RNA的工具。
ADAR
ADAR(Double-stranded RNA-specific adenosine deaminase)蛋白是一类作用于RNA双链的RNA脱氨酶,在双链RNA(Double-stranded RNA)中催化腺苷水解脱氨基形成肌苷(adenosine-to-inosine,A-to-I),称为A-to-I RNA编辑,肌苷(I)在翻译的过程中被识别为鸟苷(G),实现A-to-G的RNA编辑。该蛋白家族的主要成员有ADAR1,ADAR2和ADAR3,该酶产生的基因编辑会影响基因的表达和功能,包括通过改变密码子的mRNA翻译,从而改变蛋白质的氨基酸序列;通过改变剪接位点识别序列进行pre-mRNA剪接;通过改变参与核酸酶识别的序列来实现RNA的稳定性;RNA病毒基因组在病毒RNA复制过程中通过改变序列实现遗传的稳定性以及调控一些依赖于结构的RNA的代谢活动,如microRNA的产生、靶向或蛋白质-RNA的相互作用。
代表性的ADAR包括ADAR1、ADAR2-isoform1和ADAR2-isoform1、或其同源蛋白。
一种代表性的ADAR1全长氨基酸序列如下:
MNPRQGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLRSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV*(SEQ ID No.:10)
一种代表性的ADAR2-isoform1全长氨基酸序列如下:
MDIEDEENMSSSSTDVKENRNLDNVSPKDGSTPGPGEGSQLSNGGGGGPGRKRPLEEGSNGHSKYRLKKRRKTPGPVLPKNALMQLNEIKPGLQYTLLSQTGPVHAPLFVMSVEVNGQVFEGSGPTKKKAKLHAAEKALRSFVQFPNASEAHLAMGRTLSVNTDFTSDQADFPDTLFNGFETPDKAEPPFYVGSNGDDSFSSSGDLSLSASPVPASLAQPPLPVLPPFPPPSGKNPVMILNELRPGLKYDFLSESGESHAKSFVMSVVVDGQFFEGSGRNKKLAKARAAQSALAAIFNLHLDQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEGSRSYTQAGVQWCNHGSLQPRPPGLLSDPSTSTFQGAGTTEPADRHPNRKARGQLRTKIESGEGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP*(SEQ IDNo.:11)
一种代表性ADAR2-isoform2全长氨基酸序列如下:
MDIEDEENMSSSSTDVKENRNLDNVSPKDGSTPGPGEGSQLSNGGGGGPGRKRPLEEGSNGHSKYRLKKRRKTPGPVLPKNALMQLNEIKPGLQYTLLSQTGPVHAPLFVMSVEVNGQVFEGSGPTKKKAKLHAAEKALRSFVQFPNASEAHLAMGRTLSVNTDFTSDQADFPDTLFNGFETPDKAEPPFYVGSNGDDSFSSSGDLSLSASPVPASLAQPPLPVLPPFPPPSGKNPVMILNELRPGLKYDFLSESGESHAKSFVMSVVVDGQFFEGSGRNKKLAKARAAQSALAAIFNLHLDQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHEPILEEPADRHPNRKARGQLRTKIESGEGTIPVRSNASIQTWDGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP*(SEQ ID No.:12)
APOBECs蛋白
APOBEC(apolipoprotein B mRNA editing enzyme,catalytic polypeptide-like)是一类进化保守的胞苷脱氨酶,作用于DNA/RNA的单链区,在单链DNA/RNA上催化胞苷水解脱氨基形成尿苷(cytosine-to-uracil,C-to-U),实现C-to-U的DNA/RNA编辑,该蛋白家族的主要成员有AID、Apobec1、Apobec2、Apobec3A、Apobec3B、Apobec3C、Apobec3D、Apobec3F、Apobec3G、Apobec3H和Apobec4。
RNA编辑酶
如本文所用,“本发明RNA编辑酶”、“人工RNA编辑酶”、“融合蛋白”或“本发明多肽”均指本发明第一方面所述的RNA编辑酶。
本发明的所述RNA编辑酶包括:
(a)RNA识别结构域,所述RNA识别结构域用于识别待编辑的RNA序列的RNA识别序列,并结合于所述的RNA识别序列;
(b)效用结构域,所述的效用结构域用于对待编辑的RNA序列进行核苷酸编辑;
其中,所述的RNA识别结构域与所述的效用结合域是可操作地连接的。
如本文所用,“可操作(地)相连(于)”或“可操作(地)连接(于)”是指这样一种并列关系,其中所述元件所处的关系使得它们可以按预期的方式发挥功能。例如,如果RNA识别结构域与效用结构域相连接时(可直接相连、或通过连接元件相连、或通过其他位于两者之间的功能元件连接),那么只要RNA识别结构域与效用结构域可各自发挥其功能,即RNA识别结构域识别并并结合于预定的RNA识别序列,而效用结构域可对待编辑的RNA序列进行核苷酸编辑,那么两者就是可操作地连接的。类似地,如果启动子可以引起一段编码序列转录或表达的话,则该启动子是可操作地相连于编码序列的。
如本文所用,术语“本发明RNA编辑酶”还包括具有上述活性的序列的变异形式。这些变异形式包括(但并不限于):1-3个(通常为1-2个,更佳地1个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为3个以内,较佳地为2个以内,更佳地为1个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的结构和功能。此外,所述术语还包括单体和多聚体形式的本发明多肽。该术语还包括线性以及非线性的多肽(如环肽)。
本发明还包括上述RNA编辑酶的活性片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明RNA编辑酶的功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或几个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)抗原肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合于此多肽序列而形成的多肽(与前导序列、分泌序列或6His等标签序列融合而形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
一类优选的活性衍生物指与式I的氨基酸序列相比,有至多3个,较佳地至多2个,更佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。
表A
Figure BDA0002020484090000131
Figure BDA0002020484090000141
本发明还提供本发明RNA编辑酶的类似物。这些类似物与SEQ ID NO.:8、9或13所示的多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
编码序列
本发明还涉及编码根据本发明的RNA编辑酶的多核苷酸。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA可以是编码链或非编码链。本发明的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。目前,已经可以完全通过化学合成来得到编码本发明多肽(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞。上述多核苷酸、载体或宿主细胞可以是分离的。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的,但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的蛋白质片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码本发明RNA编辑酶的功能。
编码本发明的融合蛋白的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据已公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术在所述NK细胞上表达本发明RNA编辑酶的方法。
通过常规的重组DNA技术,可利用本发明的多核苷酸序列获得表达本发明RNA编辑酶的NK细胞。一般来说包括步骤:将本发明所述的第一表达盒和/或第二表达盒转导入NK细胞内,从而获得所述NK细胞。
本领域的技术人员熟知的方法能用于构建含本发明RNA编辑酶的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,枯草芽胞杆菌,链霉菌属的细菌细胞;真菌细胞如毕赤酵母、酿酒酵母细胞;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、NS0、COS7、或293细胞的动物细胞等。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的蛋白质。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
载体
本发明还提供了含有本发明多核苷酸的载体。源于逆转录病毒诸如慢病毒的载体是实现长期基因转移的合适工具,因为它们允许转基因长期、稳定的整合并且其在子细胞中增殖。慢病毒载体具有超过源自致癌逆转录病毒诸如鼠科白血病病毒的载体的优点,因为它们可转导非增殖的细胞,诸如肝细胞。它们也具有低免疫原性的优点。
简单概括,通常通过可操作地连接本发明的表达盒或核酸序列至启动子,并将其并入表达载体。该载体适合于复制和整合真核细胞。典型的克隆载体包含可用于调节期望核酸序列表达的转录和翻译终止子、初始序列和启动子。
本发明的表达构建体也可利用标准的基因传递方案,用于核酸免疫和基因疗法。基因传递的方法在本领域中是已知的。见例如美国专利号5,399,346、5,580,859、5,589,466,在此通过引用全文并入。在另一个实施方式中,本发明提供了基因疗法载体。
所述表达盒或核酸序列可被克隆入许多类型的载体。例如,该表达盒或核酸序可被克隆入如此载体,其包括但不限于质粒、噬菌粒、噬菌体衍生物、动物病毒和粘粒。特定的感兴趣载体包括表达载体、复制载体、探针产生载体和测序载体。
进一步地,表达载体可以以病毒载体形式提供给细胞。病毒载体技术在本领域中是公知的并在例如Sambrook等(2001,Molecular Cloning:A Laboratory Manual,ColdSpring Harbor Laboratory,New York)和其他病毒学和分子生物学手册中进行了描述。可用作载体的病毒包括但不限于逆转录病毒、腺病毒、腺伴随病毒、疱疹病毒和慢病毒。通常,合适的载体包含在至少一种有机体中起作用的复制起点、启动子序列、方便的限制酶位点和一个或多个可选择的标记(例如,WO01/96584;WO01/29058;和美国专利号6,326,193)。
已经开发许多基于病毒的系统,用于将基因转移入哺乳动物细胞。例如,逆转录病毒提供了用于基因传递系统的方便的平台。可利用在本领域中已知的技术将选择的基因插入载体并包装入逆转录病毒颗粒。该重组病毒可随后被分离和传递至体内或离体的对象细胞。许多逆转录病毒系统在本领域中是已知的。
额外的启动子元件,例如增强子,可以调节转录开始的频率。通常地,这些位于起始位点上游的30-110bp区域中,尽管最近已经显示许多启动子也包含起始位点下游的功能元件。启动子元件之间的间隔经常是柔性的,以便当元件相对于另一个被倒置或移动时,保持启动子功能。在胸苷激酶(tk)启动子中,启动子元件之间的间隔可被增加隔开50bp,活性才开始下降。取决于启动子,表现出单个元件可合作或独立地起作用,以起动转录。
合适的启动子的一个例子为早期巨细胞病毒(CMV)启动子序列。该启动子序列为能够驱动可操作地连接至其上的任何多核苷酸序列高水平表达的强组成型启动子序列。合适的启动子的另一个例子为延伸生长因子-1α(EF-1α)。然而,也可使用其他组成型启动子序列,包括但不限于类人猿病毒40(SV40)早期启动子、小鼠乳癌病毒(MMTV)、人免疫缺陷病毒(HIV)长末端重复(LTR)启动子、MoMuLV启动子、鸟类白血病病毒启动子、艾伯斯坦-巴尔(Epstein-Barr)病毒即时早期启动子、鲁斯氏肉瘤病毒启动子、以及人基因启动子,诸如但不限于肌动蛋白启动子、肌球蛋白启动子、血红素启动子和肌酸激酶启动子。进一步地,本发明不应被限于组成型启动子的应用。诱导型启动子也被考虑为本发明的一部分。诱导型启动子的使用提供了分子开关,其能够当这样的表达是期望的时,打开可操作地连接诱导型启动子的多核苷酸序列的表达,或当表达是不期望的时关闭表达。诱导型启动子的例子包括但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子和四环素启动子。
被引入细胞的表达载体也可包含可选择的标记基因或报道基因中的任一个或两者,以便于从通过病毒载体寻求被转染或感染的细胞群中鉴定和选择表达细胞。在其他方面,可选择的标记可被携带在单独一段DNA上并用于共转染程序。可选择的标记和报道基因两者的侧翼都可具有适当的调节序列,以便能够在宿主细胞中表达。有用的可选择标记包括例如抗生素抗性基因,诸如neo等等。
报道基因用于鉴定潜在转染的细胞并用于评价调节序列的功能性。通常地,报道基因为以下基因:其不存在于受体有机体或组织或由受体有机体或组织进行表达,并且其编码多肽,该多肽的表达由一些可容易检测的性质例如酶活性清楚表示。在DNA已经被引入受体细胞后,报道基因的表达在合适的时间下进行测定。合适的报道基因可包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶或绿色萤光蛋白基因的基因(例如,Ui-Tei等,2000FEBSLetters479:79-82)。合适的表达系统是公知的并可利用已知技术制备或从商业上获得。通常,显示最高水平的报道基因表达的具有最少5个侧翼区的构建体被鉴定为启动子。这样的启动子区可被连接至报道基因并用于评价试剂调节启动子-驱动转录的能力。
将基因引入细胞和将基因表达入细胞的方法在本领域中是已知的。在表达载体的内容中,载体可通过在本领域中的任何方法容易地引入宿主细胞,例如,哺乳动物(如人T细胞)、细菌、酵母或昆虫细胞。例如,表达载体可通过物理、化学或生物学手段转移入宿主细胞。
将多核苷酸引入宿主细胞的物理方法包括磷酸钙沉淀、脂质转染法、粒子轰击、微注射、电穿孔等等。生产包括载体和/或外源核酸的细胞的方法在本领域中是公知的。见例如Sambrook等(2001,Molecular Cloning:A Laboratory Manual,Cold Spring HarborLaboratory,New York)。将多核苷酸引入宿主细胞的优选方法为磷酸钙转染。
将多核苷酸引入宿主细胞的生物学方法包括使用DNA和RNA载体。病毒载体,特别是逆转录病毒载体,已经成为最广泛使用的将基因插入哺乳动物例如人细胞的方法。其他病毒载体可源自慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺伴随病毒等等。见例如美国专利号5,350,674和5,585,362。
将多核苷酸引入宿主细胞的化学手段包括胶体分散系统,诸如大分子复合物、纳米胶囊、微球、珠;和基于脂质的系统,包括水包油乳剂、胶束、混合胶束和脂质体。用作体外和体内传递工具(delivery vehicle)的示例性胶体系统为脂质体(例如,人造膜囊)。
在使用非病毒传递系统的情况下,示例性传递工具为脂质体。考虑使用脂质制剂,以将核酸引入宿主细胞(体外、离体(ex vivo)或体内)。在另一方面,该核酸可与脂质相关联。与脂质相关联的核酸可被封装入脂质体的水性内部中,散布在脂质体的脂双层内,经与脂质体和寡核苷酸两者都相关联的连接分子附接至脂质体,陷入脂质体,与脂质体复合,分散在包含脂质的溶液中,与脂质混合,与脂质联合,作为悬浮液包含在脂质中,包含在胶束中或与胶束复合,或以其他方式与脂质相关联。与组合物相关联的脂质、脂质/DNA或脂质/表达载体不限于溶液中的任何具体结构。例如,它们可存在于双分子层结构中,作为胶束或具有“坍缩的(collapsed)”结构。它们也可简单地被散布在溶液中,可能形成大小或形状不均一的聚集体。脂质为脂肪物质,其可为天然发生或合成的脂质。例如,脂质包括脂肪小滴,其天然发生在细胞质以及包含长链脂肪族烃和它们的衍生物诸如脂肪酸、醇类、胺类、氨基醇类和醛类的该类化合物中。
制剂
本发明提供了如本发明第五方面所述的制剂。在一个实施方式中,所述制剂为液态制剂。优选地,所述制剂为注射剂。
在一个实施方式中,所述制剂可包括缓冲液诸如中性缓冲盐水、硫酸盐缓冲盐水等等;碳水化合物诸如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸诸如甘氨酸;抗氧化剂;螯合剂诸如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);和防腐剂。
本发明的技术方案,具有如下有益效果:
(1)本发明的RNA编辑酶是一种不含任何RNA成分的单一成分蛋白酶,由内源性人蛋白序列组成,因而这些工程蛋白在基因治疗中比CRISPR-Cas系统的免疫原性和系统复杂度都更低。而且,该系统相较于DNA编辑具有更加灵活、安全的特征。
(2)本发明的RNA编辑酶脱靶率低、编辑效率高。
(3)本发明的RNA编辑酶编辑精度高,可实现单碱基基因编辑。
(4)本发明的RNA编辑酶是一种蛋白酶,可以通过细胞器定位信号将该酶靶向到细胞器或细胞核中发挥功能,比如说在RNA编辑酶N端或C端连接一个细胞核定位信号NLS,将编辑酶定位到细胞核中发挥功能,或者连接一个线粒体定位信号MLS,将该酶定位到线粒体中发挥编辑功能。
下面结合具体实施,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实验方法
将RNA腺苷脱氨酶ADAR家族的成员和RNA胞苷脱氨酶APOBEC家族的成员的脱氨基催化结构域克隆出来,和RNA结合蛋白PUF进行融合,形成两种不同的RNA编辑酶。根据上述设计,在细胞水平验证PARSE RNA编辑酶可以对RNA进行编辑。根据上述设计,在细胞水平验证APRSE RNA编辑酶可以对RNA进行编辑。检测这些酶的编辑效率和精度,分析这些酶的offtarget。利用构建好的RNA编辑酶对一些单碱基致病突变进行修复,用PARSE来修复GRIA2,COL3A1和DMD的致病点突变。
具体地,包括以下步骤:
1.基于已有的RNA结合蛋白PUF,利用分子克隆的技术将编码ADAR蛋白的dADAR,ADAR1,ADAR2基因分别克隆出来,然后将这两个基因拼接在一起,形成新的融合基因,通过这个新的融合基因编码PARSE蛋白,构建形成不同的A to I RNA定点编辑酶。利用分子克隆的技术将不同的RNA胞苷脱氨酶(human apobec1,human apobec3a,human3b,human3c,human3d,human3g,human3h,humanAID,mouse APOBEC1,mouse APOBEC3A,mouse AID,RatAPOBEC1)融合到PUF上,构建形成不同的C→U RNA定点编辑酶。
2.在细胞水平检测这些新的RNA编辑酶的编辑活性,将PARSE RNA编辑酶和GFP报告基因质粒同时转入细胞,48h后收集GFP报告基因的RNA并进行测序,检测RNA编辑事件。
3.在细胞水平检测这些新的RNA编辑酶的编辑活性,将APRSE RNA编辑酶和GFP报告基因质粒同时转入细胞,48h后收集GFP报告基因的RNA并进行测序,检测RNA编辑事件。
4.通过RNA seq高通量测序技术,检测和分析RNA编辑酶的效率、精度和脱靶率。
5.利用构建好的RNA编辑酶对一些单碱基致病突变进行修复,用PARSE来修复GRIA2,COL3A1和DMD的致病点突变。
实施例1
ADAR是可以催化RNA腺苷脱氨形成肌苷(adenosine-to-inosine,A-to-I)的腺苷编辑酶,将三种不同来源的ADAR催化结构域克隆出来,通过linker和RNA结合蛋白PUF进行融合,开发了三个不同的人工RNA编辑酶(RNA editase),将该系统命名为artificial PUF-ADAR RNA sequence editors(PARSE-d,PARSE1,PARSE2)(图1)
在细胞水平检测PARSE-d,PARSE1 PARSE2这三种RNA编辑酶的编辑活性,将PARSERNA编辑酶和GFP报告基因质粒同时转入细胞,48h后收集GFP报告基因的RNA并进行测序,检测RNA编辑事件,证明PARSE-d,PARSE1PARSE2都具有对靶RNA进行高效编辑的能力(图2A)。通过构建含有一个提前终止密码子的GFP mRNA,通过PARSE来实现特定位点的A到G的编辑,从而恢复GFP基因的表达,来证明PARSE具有高精度的定点编辑能力(图2B)。
将三种不同来源的ADAR催化结构域克隆出来,通过linker和RNA结合蛋白PUF进行融合,将ADAR放置于新设计的融合蛋白的N端,PUF放置于新设计的融合蛋白的C端,形成一个新的ADAR催化结构域在前,PUF RNA结合蛋白在后的新RNA编辑酶,用这种新合成的RNA编辑酶去编辑靶RNA,未检测到编辑事件的产生(图3)。这证明依赖于ADAR的RNA编辑酶对RNA结合蛋白的位置是有严格要求的,本发明RNA编辑酶具有优良的RNA编辑活性。
实施例2
通过优化ADAR催化结构域来提高ADAR对靶RNA的编辑效率,并通过RNA seq高通量测序技术,检测和分析RNA编辑酶的效率、精准度和脱靶率。在ADAR1和ADAR2的催化结构域中各引入了一个新的点突变,来提高ADAR的编辑效率(图4A),利用RNA seq高通量测序技术,检测和分析RNA编辑酶的效率、精度,发现PARSE1,ePARSE1,PARSE2,ePARSE2都可以对靶RNA进行编辑,效率分别为42%,65%,67%,78%(图4B)。通过RNA-seq结果分析显示:PARSE编辑存在一定程度的脱靶率,但是与靶位点的编辑效率相比,脱靶效率较低,可在后期优化的过程中通过降低PARSE的转染量来降低脱靶率(图4C)。
利用构建好的ePARSE1对GRIA2基因的致病编辑位点进行修复,GRIA2是一个钙离子通道蛋白的亚基,该蛋白的第607位氨基酸突变后会导致钙离子通道蛋白不能关闭,产生致病表型。利用ePARSE1对该位点进行定点修复,结果显示,修复效率在68%,即可以在细胞水平完成对GRIA2(p.Q607R)致病点突变的修复,为进一步治疗该基因突变提供了一个有力工具(图5A),并且该位点的脱靶效率较低(图5B),显示了通过ePARSE1来治疗这种疾病的很好的应用前景。
利用构建好的ePARSE2对COL3A1和DMD基因的致病点突变进行定点修复,结果显示,修复效率分别在33%,25%,30%,即可以在细胞水平完成对对COL3A1和DMD基因的致病点突变的定点修复,为进一步治疗该基因突变提供了一个有力工具(图6A,6B,6C),显示了通过ePARSE2来治疗这种类型疾病的良好的应用前景。
实施例3
对RNA结合蛋白PUF进行优化,提高PARSE编辑RNA的精度,减少脱靶效率,通过对PUF进行优化,将识别8个碱基的PUF8优化到识别并结合十个碱基的PUF10(图7),在靶位点并没有降低编辑效率,但是随着提高PUF的识别并结合碱基的数量,我们认为这个策略可以有效降低脱靶效应,并具有进一步优化的潜力,我们可以将PUF优化到识别并结合12个碱基,16个碱基,甚至更长,可以极大拓展PARSE的应用范围。
实施例4
APOBECs可以催化胞苷-尿苷(cytidine-to-uridine,C-to-U)的核苷酸编辑,将各种不同来源的APOBEC家族的RNA胞苷脱氨酶(human apobec1,human apobec3a,human3b,human3c,human3d,human3g,human3h,humanAID,mouse APOBEC1,mouse APOBEC3A,mouseAID,Rat APOBEC1)催化结构域克隆出来,通过linker和RNA结合蛋白PUF进行融合,形成多种不同的新的C to U RNA定点编辑酶,将该系统命名为artificial APOBEC-PUF RNAsequence editors(APRSE),并进一步细分为可以进入细胞核的APRSE-NLS和在细胞质中表达的APRSE,下图以Apobec3A为例进行说明(图8A)。
在细胞水平检测APRSE-NLS,APRSE这两种RNA编辑酶的编辑活性,将APRSE RNA编辑酶和GFP报告基因质粒同时转入细胞,48h后收集GFP报告基因的RNA并进行测序,检测RNA编辑事件,证明APRSE-NLS,APRSE都具有对靶RNA进行高效编辑的能力(图8B,8C),结果表明APRSE具有高精度的定点编辑能力,直接对APRSE结合位点下游的第二个碱基进行高精度、高效率的编辑,不同编辑位点的编辑效率在30%~80%之间。
讨论
相较于直接对DNA进行特异性编辑操控,对RNA进行特异性操控是可逆的,并有着更大的灵活性。靶向RNA的基因治疗方案可以有效避免针对DNA基因治疗的不足之处。因此,在RNA水平对基因进行操控有着更好的可控性和安全性,使得这类基因治疗更利于基础研究向临床转化。
目前的RNA水平的碱基编辑主要有基于CRISPR-Cas13的REPAIR和通过寡聚核苷酸片段招募细胞内源RNA腺苷脱氨酶ADAR进行RNA编辑的方法。基于CRISPR-Cas13的REPAIR同样存在和上述DNA编辑相同的问题,包括系统过于庞大,编辑效率和编辑精度低,容易引起免疫反应等问题;基于寡聚核苷酸片段招募细胞内源RNA腺苷脱氨酶进行RNA编辑的方法,目前的应用范围太小,也存在递送困难及功效较单一,系统比较复杂。
本发明人将结合RNA的识别结构域(RNA recognition domain)和发挥功能的效用结构域(effector domain)融合,组成新的功能蛋白,其通过识别结构域特异性靶向目标RNA并利用效用结构域来进行RNA编辑,通过纠正DNA的错误点突变来消除致病性RNA。该人工构建的RNA编辑酶是一种不含任何RNA成分的单一成分蛋白酶,由内源性人蛋白序列组成,因而这些工程蛋白在基因治疗中比CRISPR-Cas系统的免疫原性和系统复杂度都更低。而且,该系统相较于DNA编辑具有更加灵活、安全的特征。
此外,由于基于单一蛋白的人工RNA编辑酶可以连接不同的细胞定位序列来定位于不同的亚细胞结构(包括细胞核,细胞质,线粒体,叶绿体等),人工RNA编辑酶可以对不同亚细胞结构中的RNA进行特异编辑。以线粒体为例,目前尚无针对线粒体基因的有效编辑手段,因此人工RNA编辑酶可以在线粒体基因操控上有无法替代的作用。
因此,通过合成生物学手段构建模块化的人工RNA结合蛋白,将RNA编辑蛋白融合到RNA结合蛋白上,从而特异操控靶向RNA的编辑,是一种靶向RNA的全新治疗思路。由于人工设计的PUF因子可以被重新编程来识别几乎任何8-核苷酸序列,理论上可以被用来编辑任何给定的RNA转录本。期望通过应用这套系统,来靶向编辑一些与疾病相关的突变。这套系统为靶向编辑人类细胞中RNA提供了有用的工具,有希望治疗一些由核酸突变引起的疾病。而且人工构建的PUF-Factor是一种不含任何RNA成分的简单酶,由内源性人蛋白序列组成,这些工程蛋白在基因治疗中可能是一种比CRISPR-Cas系统更简单、更实用的替代方案。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种RNA编辑酶,其特征在于,所述RNA编辑酶包括:
(a)RNA识别结构域,所述RNA识别结构域用于识别待编辑的RNA序列的RNA识别序列,并结合于所述的RNA识别序列;
(b)效用结构域,所述的效用结构域用于对待编辑的RNA序列进行核苷酸编辑;
其中,所述的RNA识别结构域与所述的效用结合域是可操作地连接的。
2.如权利要求1所述的RNA编辑酶,其特征在于,所述效用结构域选自下组:ADAR家族成员的脱氨基催化结构域、APOBEC家族成员的脱氨基催化结构域、RNA甲基化酶、RNA去甲基化酶、加尿嘧啶合成酶、或其组合。
3.如权利要求1所述的RNA编辑酶,其特征在于,所述的RNA识别结构域含有n个识别单元,所述的每个识别单元用于识别一个RNA碱基,其中n为5-30的正整数。
4.如权利要求1所述的RNA编辑酶,其特征在于,所述的RNA编辑酶还包括选自下组的一种或多种元件:连接肽、标签序列、信号肽序列、定位肽序列、或其组合。
5.如权利要求1所述的RNA编辑酶,其特征在于,所述RNA编辑酶包括RNA识别结构域和效用结构域,以及任选的连接肽、标签序列、信号肽序列和/或定位肽序列。
6.如权利要求1所述的RNA编辑酶,其特征在于,所述RNA编辑酶的结构如下式I至式IV中任一所示:
D-L2-A-L1-B (I);
D-L2-B-L1-A (II);
A-L1-B-L2-D (III);
B-L1-A-L2-D (IV);
式中,各“-”独立地为连接肽或肽键;
A为RNA识别结构域;
B为效用结构域;
L1和L2各自独立地为无或连接肽;
D为无或定位肽。
7.如权利要求2所述的RNA编辑酶,其特征在于,所述ADAR家族成员包括:dADAR、ADAR1、ADAR2、TadA、或其组合。
8.一种分离的多核苷酸,其特征在于,所述多核苷酸编码权利要求1所述的RNA编辑酶。
9.一种载体,其特征在于,所述载体包括权利要求8所述的多核苷酸。
10.一种如权利要求1所述的RNA编辑酶、权利要求8所述的多核苷酸、或权利要求9所述的载体所述的宿主细胞的用途,其特征在于,用于制备
(a)基因治疗的药物或制剂;和/或
(b)对RNA进行编辑的试剂。
CN201910277423.0A 2019-04-08 2019-04-08 利用人工构建rna编辑酶进行rna定点编辑及相关应用 Pending CN111793627A (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201910277423.0A CN111793627A (zh) 2019-04-08 2019-04-08 利用人工构建rna编辑酶进行rna定点编辑及相关应用
PCT/CN2020/082183 WO2020207286A1 (zh) 2019-04-08 2020-03-30 利用人工构建rna编辑酶进行rna定点编辑及相关应用
CN202080000996.XA CN112055750A (zh) 2019-04-08 2020-03-30 利用人工构建rna编辑酶进行rna定点编辑及相关应用
EP20786915.7A EP3954774A4 (en) 2019-04-08 2020-03-30 RNA SITE-TARGETED EDITING USING MANUFACTURED RNA EDITING ENZYMES AND RELATED USES
JP2021560203A JP2022529329A (ja) 2019-04-08 2020-03-30 人工的に構築されたrna編集酵素による部位特異的rna編集および関連使用
US17/601,963 US20220195416A1 (en) 2019-04-08 2020-03-30 Rna site-directed editing using artificially constructed rna editing enzymes and related uses
JP2024003552A JP2024041916A (ja) 2019-04-08 2024-01-12 人工的に構築されたrna編集酵素による部位特異的rna編集および関連使用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277423.0A CN111793627A (zh) 2019-04-08 2019-04-08 利用人工构建rna编辑酶进行rna定点编辑及相关应用

Publications (1)

Publication Number Publication Date
CN111793627A true CN111793627A (zh) 2020-10-20

Family

ID=72750978

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910277423.0A Pending CN111793627A (zh) 2019-04-08 2019-04-08 利用人工构建rna编辑酶进行rna定点编辑及相关应用
CN202080000996.XA Pending CN112055750A (zh) 2019-04-08 2020-03-30 利用人工构建rna编辑酶进行rna定点编辑及相关应用

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202080000996.XA Pending CN112055750A (zh) 2019-04-08 2020-03-30 利用人工构建rna编辑酶进行rna定点编辑及相关应用

Country Status (5)

Country Link
US (1) US20220195416A1 (zh)
EP (1) EP3954774A4 (zh)
JP (2) JP2022529329A (zh)
CN (2) CN111793627A (zh)
WO (1) WO2020207286A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114685685A (zh) * 2022-04-20 2022-07-01 上海科技大学 编辑rna的融合蛋白及其应用
WO2023207607A1 (zh) * 2022-04-29 2023-11-02 北京大学 用于修饰线粒体dna的脱氨酶突变体、组合物和方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023196274A1 (en) * 2022-04-07 2023-10-12 Trustees Of Boston University Compositions and methods relating to nucleic acid interaction reporters

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5399346A (en) 1989-06-14 1995-03-21 The United States Of America As Represented By The Department Of Health And Human Services Gene therapy
US5585362A (en) 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US5350674A (en) 1992-09-04 1994-09-27 Becton, Dickinson And Company Intrinsic factor - horse peroxidase conjugates and a method for increasing the stability thereof
AU1086501A (en) 1999-10-15 2001-04-30 Carnegie Institution Of Washington Rna interference pathway genes as tools for targeted genetic interference
US6326193B1 (en) 1999-11-05 2001-12-04 Cambria Biosciences, Llc Insect control agent
US9499805B2 (en) * 2010-06-18 2016-11-22 The University Of North Carolina At Chapel Hill Methods and compositions for synthetic RNA endonucleases
WO2016106236A1 (en) * 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
US11390865B2 (en) * 2015-07-14 2022-07-19 Fukuoka University Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex
WO2018017144A1 (en) * 2016-07-19 2018-01-25 Brandeis University Compositions and methods for identifying rna binding polypeptide targets
EP3589751A4 (en) * 2017-03-03 2021-11-17 The Regents of The University of California RNA TARGETING OF MUTATIONS VIA SUPPRESSOR RNA AND DEAMINASES
US20200248169A1 (en) * 2017-06-26 2020-08-06 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing
US20210079366A1 (en) * 2017-12-22 2021-03-18 The Broad Institute, Inc. Cas12a systems, methods, and compositions for targeted rna base editing
WO2019183049A1 (en) * 2018-03-19 2019-09-26 Massachusetts Institute Of Technology Methods and kits for dynamic targeted hypermutation
CN110527697B (zh) * 2018-05-23 2023-07-07 中国科学院分子植物科学卓越创新中心 基于CRISPR-Cas13a的RNA定点编辑技术

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114685685A (zh) * 2022-04-20 2022-07-01 上海科技大学 编辑rna的融合蛋白及其应用
CN114685685B (zh) * 2022-04-20 2023-11-07 上海科技大学 编辑rna的融合蛋白及其应用
WO2023207607A1 (zh) * 2022-04-29 2023-11-02 北京大学 用于修饰线粒体dna的脱氨酶突变体、组合物和方法

Also Published As

Publication number Publication date
WO2020207286A1 (zh) 2020-10-15
US20220195416A1 (en) 2022-06-23
JP2024041916A (ja) 2024-03-27
JP2022529329A (ja) 2022-06-21
EP3954774A4 (en) 2023-04-26
EP3954774A1 (en) 2022-02-16
CN112055750A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
US20230242899A1 (en) Methods and compositions for modulating a genome
CN113286880A (zh) 调控基因组的方法和组合物
US6475798B2 (en) P element derived vector and methods for its use
DK3138911T3 (en) CRISPR-BASED RE-MODIFICATION AND REGULATION
AU2019222568B2 (en) Engineered Cas9 systems for eukaryotic genome modification
CN115651927A (zh) 编辑rna的方法和组合物
EP3954774A1 (en) Rna site-directed editing using artificially constructed rna editing enzymes and related uses
CA3125047A1 (en) Integration of nucleic acid constructs into eukaryotic cells with a transposase from oryzias
JP2020530990A (ja) in vivoでの外因性ドナー核酸とのCRISPR/Cas誘導性組換えの評価
KR20220016869A (ko) 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법
AU2020221274B2 (en) Crispr/Cas fusion proteins and systems
KR20220062079A (ko) 지질 나노입자에 의해 전달되는 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
EP1098987B1 (en) Method for transformation of animal cells
WO2018164457A1 (ko) C2cL 엔도뉴클레아제를 포함하는 유전체 교정용 조성물 및 이를 이용한 유전체 교정 방법
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
US20220145332A1 (en) Cell penetrating transposase
US20060160219A1 (en) Method of transferring mutation into target nucleic acid
WO2023220649A2 (en) Effector protein compositions and methods of use thereof
WO2024091958A1 (en) Effector proteins, compositions, systems and methods for the modification of serpina1
WO2023108047A1 (en) Mutant myocilin disease model and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201020

WD01 Invention patent application deemed withdrawn after publication