发明内容
为解决上述现有技术中存在的问题,本发明提供了一种基于生物信息学筛选siRNA的方法、由所述的方法得到的siRNA、包含该siRNA的药物组合物、所述的siRNA的制药用途、以及基于生物信息学筛选siRNA的装置。
具体而言,本发明提供:
(1)一种基于生物信息学筛选siRNA的方法,其中,通过该方法得到的siRNA能够沉默或抑制人呼吸道病毒基因,而不沉默或抑制人类基因;
其中,所述方法包括:
1)提供所述人呼吸道病毒的全基因序列;
2)以所述人呼吸道病毒的所述全基因序列为模板,设计N条第一候选siRNA序列,使得所述第一候选siRNA序列能够沉默或抑制所述人呼吸道病毒基因,其中N≥2;并且
3)通过比对分析来排除对人类基因能够产生脱靶效应的第一候选siRNA序列,得到第二siRNA序列,该第二siRNA不沉默或抑制人类基因。
(2)根据(1)所述的方法,其中,在进行所述步骤3)之前,将由所述步骤2)得到的所述第一候选siRNA序列按其种子区与靶序列形成的双螺旋热力学稳定性(seed duplex stability)进行排序,然后将其中稳定性最高的M条第一候选siRNA序列进行所述步骤3),其中M≥1。
(3)根据(1)所述的方法,其中在所述步骤3)中,该第二siRNA序列所针对的靶位点与所述人类基因组序列有1个以上碱基不匹配;
优选地,对所得到的第二siRNA序列进行进一步选择,使得该第二siRNA序列所针对的靶位点与所述人类基因组序列的碱基匹配数最低,并且/或者使得该第二siRNA序列的种子区与所述人类基因组序列的3’端非编码区有1个以上碱基不匹配。
(4)根据(1)-(3)中任意一项所述的方法,其中所述方法还包括:
4)将步骤3)得到的第二siRNA序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到第三siRNA序列的正义链,并且在该第二siRNA序列的互补序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到该第三siRNA序列的反义链。
(5)根据(1)所述的方法,其中所述人呼吸道病毒包括流感病毒、副流感病毒、呼吸道合胞病毒、麻疹病毒、腮腺炎病毒、腺病毒、风疹病毒、鼻病毒、冠状病毒和/或呼肠病毒;优选为流感病毒;更优选为甲型流感病毒;进一步优选为H1、H3、H5、H7或H9甲型流感病毒。
(6)一种根据(1)-(5)中任意一项所述的方法得到的siRNA。
(7)根据(6)所述的siRNA,其中所述siRNA具有化学修饰,并且所述化学修饰包括:磷酸骨架修饰、核糖修饰和/或碱基修饰。
(8)一种药物组合物,其包含作为活性成分的(6)或(7)所述的siRNA以及药用辅料;优选地,所述药物组合物被制成为喷雾剂。
(9)根据(6)或(7)所述的siRNA在制备用于预防和/或治疗人呼吸道病毒感染的疾病的药物中的用途。
(10)一种用于基于生物信息学筛选siRNA的装置,其中,通过该装置得到的siRNA能够沉默或抑制人呼吸道病毒基因,而不沉默或抑制人类基因;
其中,所述装置包括:
1)第一单元,该第一单元用于提供所述人呼吸道病毒的全基因序列;
2)第二单元,该第二单元用于以所述人呼吸道病毒的所述全基因序列为模板,设计N条第一候选siRNA序列,使得所述第一候选siRNA序列能够沉默或抑制所述人呼吸道病毒基因,其中N≥2;以及
3)第三单元,该第三单元用于通过比对分析来排除对人类基因能够产生脱靶效应的第一候选siRNA序列,得到第二siRNA序列,该第二siRNA不沉默或抑制人类基因。
本发明与现有技术相比具有以下优点和积极效果:
具体实施方式
以下通过具体实施方式的描述对本发明作进一步说明,但这并非是对本发明的限制,本领域技术人员根据本发明的基本思想,可以做出各种修改或改进,但是只要不脱离本发明的基本思想,均在本发明的范围之内。
众所周知,药物是新突发传染病防治的最重要的有效手段之一,但是由于药物研发自身规律的限制,需要较长的研发周期,无法适应新突发传染病,特别是病毒性传染病防控的需要。因此亟需建立新技术,开辟新途径以满足新突发病毒性传染病应急防治药物的研发,使其能在短时间内用于传染病疫情的控制,从而达到早期防治以减低病死率并控制传播速度。
此外,对于绝大多数细菌性感染引起的传染病,虽然存在耐药等问题,但基本都可以用抗生素为主的各种药物控制;然而对于病毒性传染病的药物治疗人类基本是束手无策,除HBV、HIV等屈指可数的几种病毒有治疗药物外,其它绝大度数病毒感染根本没有特效的防治药物,基本采用对症治疗,甚至依靠病人自身的抵抗力。即使现有的几种药物也存在特异性差、耐药及毒副作用大等问题。
进一步而言,小核酸药物虽然在肿瘤、病毒及心血管等重大疾病防治药物研发中已有多个进入临床前研究,但在药物递送、靶向、产业化制备规模及成本、对人的安全性等方面依然存在瓶颈问题,在病毒感染传染病应急药物研发领域这些问题更加突出,因此需要开拓新思路,建立新技术和新途径来解决上述瓶颈问题,以加快其产业化步伐,特别是提高应急新药研发中从“基因到药物”的效率。
为此,本发明人通过深入研究小核酸的设计与筛选评价方法,发现并提供了能够针对新突发性呼吸道病毒疫情的,迅速、安全、有效且特异性强的新型应对方法,该方法通过采用生物信息学手段来筛选评价小核酸,从而能够得到对人呼吸道病毒的特异性抑制作用强,而由脱靶效应产生的人体毒副作用低的小核酸。小核酸本事易于合成,因此可快速合成和放大;并且在应对新突发性呼吸道病毒疫情时,由该小核酸制成的药物在进行生物学试验和临床试验验证药效前,就可通过药物的快速审批通道快速上市。这样能够针对突发性呼吸道病毒疫情进行快速反应,避免重大疫情的蔓延。
因此,由本发明方法得到的小核酸在应对新突发性呼吸道病毒疫情暴发方面的干预效果,具有其它传统药物所不具备的优势:所得小核酸药物可以在初步得到突变病毒的序列后,在相对较短的时间内(一周或数周),即可完成病毒抑制药物的设计、筛选和大规模生产。这是因为传统新药创制需要进行长时间的药效、急毒/慢毒等临床前实验以及I、II、III期临床试验的摸索,而经过数年试验,药物研发成功后,病毒可能已经发生变异,使得这类药物的研究成为“马后炮”。本发明根据生物信息学的最新进展,可以进行人类及病毒基因组高通量扫描,通过比对分析,筛选出对人类基因基本无毒副作用的序列,使得原本需要数年完成的摸索,有可能在短期即可完成,进而申报成药,从而形成遏制由新呼吸道病毒引起的疫情爆发流行的有效手段,这是所有现行病毒治疗药物(如疫苗、单克隆抗体药)的研发过程所无法比拟的。
本发明的一个目的在于提供一种基于生物信息学筛选siRNA的方法。本发明的另一个目的在于提供由所述的方法得到的siRNA。本发明的又一个目的在于提供包含该siRNA的药物组合物。本发明的又一个目的在于提供所述的siRNA的制药用途。本发明的又一个目的在于提供基于生物信息学筛选siRNA的装置。
(一)基于生物信息学筛选siRNA的方法
本发明的第一个方面提供了一种基于生物信息学筛选siRNA的方法,其中,通过该方法得到的siRNA能够沉默或抑制人呼吸道病毒基因,而不沉默或抑制人类基因;
其中,所述方法包括:
1)提供所述人呼吸道病毒的全基因序列;
2)以所述人呼吸道病毒的所述全基因序列为模板,设计N条第一候选siRNA序列,使得所述第一候选siRNA序列能够沉默或抑制所述人呼吸道病毒基因,其中N≥2;并且
3)通过比对分析来排除对人类基因能够产生脱靶效应的第一候选siRNA序列,得到第二siRNA序列,该第二siRNA不沉默或抑制人类基因。
在本文中,术语“生物信息学(Bioinformatics)”在本领域是已知的,其是指在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。通常而言,生物信息学将分子生物学与信息技术(尤其是因特网技术)结合在一起。生物信息学的研究材料和结果包括各种各样的生物学数据,其研究工具包括计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
在本文中,术语“siRNA(小干扰核酸,简称小核酸)”在本领域是已知的,其是指带有特定基因密码的双链短小核酸,一般长度为21-23bp(碱基对)。siRNA双链中和信使RNA(mRNA)的靶向序列相同的链称为正义链,与之互补的另一条链为反义链。siRNA包括5’-磷酸末端、19nt的双链区、3’-羟基末端和2个不配对的3’端核苷酸突起,可指导mRNA的裂解。一般而言,一个基因通常含有数千个bp,siRNA是其中长度为21~23bp的某一段特异序列。siRNA可以克隆到siRNA表达载体,其功能是在哺乳动物细胞内和特定靶基因的信使核糖核酸(mRNA)结合,使之降解,失去靶基因表达而“沉默”下来,即“关闭”该基因的功能。这种siRNA降解mRNA从而阻断特定蛋白质合成的机制即为核酸干扰(RNAi)。
在本文中,术语“核酸干扰(或RNA干扰)(RNA interference,RNAi)”在本领域是已知的,其是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。RNAi一经发现,迅速成为生物学研究领域最为活跃的热点之一,《Science》在2001年将其列为十大科学成就之一,2002年又将其列为十大科技之首;《Nature》也将siRNA评为2002年度最重要的科技发现之一;2006年发现RNAi机理的两位美国科学家法尔和梅洛获得诺贝尔医学奖。RNAi技术可以特异性剔除或关闭特定基因的表达,是一种快速、有效、特异的抑制基因表达的工具,已被广泛用于探索基因功能、病毒性疾病(主要是艾滋病和肝炎)及恶性肿瘤的基因治疗领域。一方面,RNAi是基因功能检验的试金石,利用RNAi技术可以大幅度缩短人类对人类基因功能与作用的了解和认识的时间;另一方面,可以利用RNAi技术获得使致病基因失活的新型基因药物,即siRNA药物。
在本文中,术语“脱靶效应(off-target effect)”在本领域是已知的,其是指siRNA作用过程中存在非特异性,可能与非靶基因之外的其它基因作用而非特异地阻断基因表达,产生意料之外的效用。与siRNA相关的脱靶效应分成三大类型:microRNA(miRNA)样脱靶效应、免疫刺激、RNAi元件饱和。
在本文中,术语“呼吸道病毒”在本领域是已知的,其是指一大类能侵犯呼吸道引起呼吸道局部病变或仅以呼吸道为侵入门户,主要引起呼吸道外组织器官病变的病毒。呼吸道病毒包括正粘病毒科(Orthomyxoviridae)中的流感病毒;副粘病毒科(Paramyxoviridae)中的副流感病毒、呼吸道合胞病毒、麻疹病毒、腮腺炎病毒以及其它病毒科中的一些病毒,如腺病毒、风疹病毒、鼻病毒、冠状病毒和呼肠病毒等。据统计,90%以上急性呼吸道感染由病毒引起。
在本文中,术语“流行性感冒病毒”(influenza virus,简称流感病毒)是本领域是已知的,其有甲(A)乙(B)丙(C)三型,引起人和动物(猪、马、海洋哺乳动物和禽类等)流行性感冒(简称流感)。
在本文中,术语“人类基因组”是本领域是已知的,是指人类(Homo sapiens)的基因组,由23对染色体组成,含有约31.6亿个DNA碱基对。其中一部分的碱基对组成了大约20000到25000个基因。全部人类基因组测序工作已于2006年完成,并且人类基因组序列是公开可得的。
在本发明方法中,步骤1)所述的“提供所述人呼吸道病毒的全基因序列”包括提供已知的人呼吸道病毒的全基因序列或新的人呼吸道病毒的全基因序列。已知的人呼吸道病毒的全基因序列可以直接从公共数据库Genebank得到,新的人呼吸道病毒的全基因序列可以通过已知方法对新病毒株进行分离、提取(例如)RNA、测定序列得到,并可进一步进行基因分型。
在本发明方法中,步骤2)所述的“以所述人呼吸道病毒的所述全基因序列为模板,设计N条第一候选siRNA序列,使得所述第一候选siRNA序列能够沉默或抑制所述人呼吸道病毒基因,其中N≥2”优选包括:以人呼吸道病毒的全基因序列的保守区为模板,使用已知的公共或商业siRNA设计工具(例如Invitrogen、GenScript、Dharmacon和/或siDirect等)按本领域公知的siRNA设计原则设计第一候选siRNA序列。
siRNA设计原则的一个例子为:在所述人呼吸道病毒的所述全基因序列的保守区的基因启动子后50-100个碱基开始,寻找基因序列中符合下列条件的19-21bp(例如19bp)核苷酸序列:(1)以G或C起始,以A或T结尾;(2)末端最后7个碱基至少有5个是A或T;(3)避免4个连续的碱基,如AAAA或CCCC,从而增加碱基的复杂度;和/或(4)GC含量为30-52%之间。
优秀地,可以分别使用不同的已知公共或商业siRNA设计工具,并分别得到各自的第一候选siRNA序列及其排序的结果,这些序列及其排序结果可以相同或不同,将这些结果进行比较并选取综合评分较高的那些第一候选siRNA序列。
在本发明方法中,以所述人呼吸道病毒的所述全基因序列为模板,设计得到的第一候选siRNA序列的数目N至少为2条,可以为50-150条,甚至更多。本领域技术人员能够理解的是,基于不同长度的人呼吸道病毒的基因序列,得到的第一候选siRNA序列的数目不同。例如,对于长度约为1.5kbp的人呼吸道病毒的基因序列,能够得到约至少50条第一候选siRNA序列。
优选地,在进行所述步骤3)之前,将由所述步骤2)得到的所述第一候选siRNA序列按其种子区与靶序列形成的双螺旋热力学稳定性(seed duplex stability)进行排序,然后将其中稳定性最高的M条第一候选siRNA序列进行所述步骤3),其中M≥1。双螺旋热力学稳定性(seed duplex stability)与双螺旋的熔融温度(Tm)对应,因此也可将由所述步骤2)得到的所述第一候选siRNA序列按其种子区与靶序列形成的双螺旋的熔融温度(Tm)进行排序,选择Tm低于21.5℃或更低的M条第一候选siRNA序列进行所述步骤3),其中M≥1。双螺旋热力学稳定性或双螺旋的熔融温度可按参考文献“Ui-Tei K,Naito Y,Nishi K,Juni A,Saigo K.(2008).Thermodynamicstability and Watson-Crick base pairing in the seed duplex are majordeterminants of the efficiency of the siRNA-based off-target effect.Nucleic Acids Res.36,7100-7109.”中所述的方法得到。
在本发明方法中,步骤3)中,所述比对分析包括序列同源性比对、序列功能域分析和结构分析。可以通过对公共数据(包括涉及脱靶效应的序列同源性、序列功能域和结构方面的数据)的整合来建立比对分析数据库和模型,以进行该比对分析。由此得到的比对分析结果可以通过建立另一独立的比对分析数据库和模型来进行验证。
序列同源性比对包括:以人类基因组序列为模板,将第一候选siRNA序列所针对的靶位点同人类基因组序列进行同源性比对,得到第二siRNA序列,其中该第二siRNA序列所针对的靶位点与所述人类基因组序列有1个以上碱基不匹配。优选地,排除同人类基因组序列具有较高序列同源性(例如16个以上碱基)的序列,以确保第一候选siRNA序列所针对的靶位点不会对人类基因发生沉默或抑制作用,而仅对人呼吸道病毒基因具有特异的沉默或抑制作用。优选地,所得到的第二siRNA序列所针对的靶位点与所述人类基因组序列有2个以上、3个以上或更多个以上碱基不匹配。
序列功能域分析包括:将第一候选siRNA序列所针对的靶位点进行序列同源性比对,把涉及人类基因组中特定功能基因(例如其表达变化能够显著造成对人体的毒副作用的功能基因)的那些排除。
结构分析包括:将第一候选siRNA序列的二级结构和人类基因的mRNA的二级结构进行分析,把那些能够由于二级结构之间的相互作用产生脱靶效应的第一候选siRNA序列排除。
优选地,在所述步骤3)中,对所得到的第二siRNA序列进行进一步选择,使得该第二siRNA序列所针对的靶位点与所述人类基因组序列的碱基匹配数最低,并且/或者使得该第二siRNA序列的种子区与所述人类基因组序列的3’端非编码区有1个以上碱基不匹配。优选地,该第二siRNA序列的种子区与所述人类基因组序列的3’端非编码区有2个以上、3个以上或更多个以上碱基不匹配。
优选地,本发明方法还包括:4)将步骤3)得到的第二siRNA序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到第三siRNA序列的正义链,并且在该第二siRNA序列的互补序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到该第三siRNA序列的反义链。
优选地,在本发明方法中,所述的人呼吸道病毒包括流感病毒、副流感病毒、呼吸道合胞病毒、麻疹病毒、腮腺炎病毒、腺病毒、风疹病毒、鼻病毒、冠状病毒和/或呼肠病毒;更优选为流感病毒;进一步优选为甲型流感病毒;还进一步优选为H1、H3、H5、H7或H9甲型流感病毒;还进一步优选为H1N1、H3N2、H5N1、H7N7、H7N9甲型流感病毒。
(二)根据本发明方法得到的siRNA
本发明另一个方面提供了由本发明方法得到的siRNA。
基于生物信息学筛选siRNA的方法得到的本发明的siRNA可以采用本领域的常规方法进行制备,包括(例如):化学合成、体外转录、siRNA表达载体、siRNA框架等。
优选地,所述siRNA具有化学修饰,以增加siRNA的稳定性,同时有效抑制靶基因的表达、并且降低或阻止siRNAs免疫活性。优选地,所述化学修饰可包括:磷酸骨架修饰、核糖修饰和/或碱基修饰。所述化学修饰的具体选择可为本领域已知的那些,例如参考文献“孙莉萍等,‘siRNA的化学修饰和临床应用’,《生命的化学》2005年第25卷第4期”中所述的那些。
由于通过本发明方法得到的siRNA对人呼吸道病毒的特异性抑制作用强,而对人体的由于脱靶效应产生的毒副作用低,因此在应对新突发性呼吸道病毒疫情时,由该小核酸制成的药物在进行生物学试验和临床试验验证药效前,就可通过药物的快速审批通道快速上市。这样能够针对突发性呼吸道病毒疫情进行快速反应,避免重大疫情的蔓延。当然,由本发明方法得到的siRNA的效果也可通过已知的方法进行验证。
(三)药物组合物
本发明的又一个方面提供了一种药物组合物,其包含作为活性成分的本发明siRNA以及药用辅料。
优选地,本发明的药物组合物中含有一种以上本发明siRNA,例如可为多种siRNA构成的多siRNA库,以通过siRNA间竞争进一步抑制脱靶效应。
优选地,所述药物组合物被制成为喷雾剂。可以将siRNA用脂质体包裹,通过脂质体介导来进入细胞,以提高siRNA的生物利用率。
(四)制药用途
本发明的又一个方面提供了本发明siRNA在制备用于预防和/或治疗人呼吸道病毒感染的疾病的药物中的用途。
(五)用于基于生物信息学筛选siRNA的装置
本发明的又一个方面提供了一种用于基于生物信息学筛选siRNA的装置,其中,通过该装置得到的siRNA能够沉默或抑制人呼吸道病毒基因,而不沉默或抑制人类基因;
其中,所述装置包括:
1)第一单元,该第一单元用于提供所述人呼吸道病毒的全基因序列;优选地,该第一单元可以为检测单元和/或数据分析单元;
2)第二单元,该第二单元用于以所述人呼吸道病毒的所述全基因序列为模板,设计N条第一候选siRNA序列,使得所述第一候选siRNA序列能够沉默或抑制所述人呼吸道病毒基因,其中N≥2;优选地,该第二单元可以为数据分析单元;
3)第三单元,该第三单元用于通过比对分析来排除对人类基因能够产生脱靶效应的第一候选siRNA序列,得到第二siRNA序列,并且该第二siRNA不沉默或抑制人类基因;优选地,该第三单元可以为数据分析单元。
优选地,所述装置还包括:4)第四单元,该第四单元用于将第三单元得到的第二siRNA序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到第三siRNA序列的正义链,并且在该第二siRNA序列的互补序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到该第三siRNA序列的反义链。优选地,该第四单元可以为数据分析单元。
以下通过实施例的方式进一步解释或说明本发明内容,但这些实施例不应被理解为对本发明保护范围的限制。
实施例1
从NCBI(美国国立生物技术信息中心,网址:www.ncbi.nlm.nih.gov)获得一种H7N9甲型流感病毒基因组HA蛋白的cRNA序列(GeneBank登记号为:KC853766.1),长度1689bp。
以该cRNA序列为模板,使用siDirect在线设计工具,设计第一候选siRNA序列。具体而言,将该cRNA序列输入siDirect在线设计工具(网址:http://sidirect2.rnai.jp/),得到67条第一候选siRNA序列。
将所得到的第一候选siRNA序列按其种子区与靶序列形成的双螺旋热力学稳定性(seed duplex stability)进行排序,得到其中稳定性最高(Tm值≤10℃)的第一候选siRNA序列,其对应的靶位点序列共4条:
序列1:5’-ACCAAAGTAAACACATTAACTGA-3’
序列2:5’-TAGAATTTTCAGCCGATTTAATT-3’
序列3:5’-ATCAAATAACAGGAAAATTAAAC-3’
序列4:5’-GTCTTCATATGTGTAAAGAATGG-3’
通过比对分析来排除对人类基因能够产生脱靶效应的第一候选siRNA序列,筛选得到第二siRNA序列,其中该第二siRNA序列所针对的靶位点与所述人类基因组序列均有2个以上碱基不匹配。并且,该第二siRNA序列的种子区与所述人类基因组序列的3’端非编码区均有2个以上碱基不匹配。
将得到的第二siRNA序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到第三siRNA序列的正义链,并且在该第二siRNA序列的互补序列的3’末端加上2个脱氧胸腺嘧啶核苷酸,得到该第三siRNA序列的反义链。例如由序列1得到的第三siRNA序列的正义链和反义链为:
正义链5’-AGUUAAUGUGUUUACUUUGdtdt-3’;
反义链5’-CAAAGUAAACACAUUAACUdtdt-3’。
由此得到的siRNA经生物学实验验证能够沉默或抑制人呼吸道病毒基因,而不沉默或抑制人类基因。