用于肺腺癌诊断的分子标志物及其应用
技术领域
本发明属于生物医药领域,涉及用于肺腺癌诊断的分子标志物及其应用。
背景技术
肺癌是最常见和导致死亡率最高的癌症。非小细胞肺癌(NSCLC)是最主要的肺癌亚组分组,占到了肺癌的大约80%左右,其中包括腺癌、鳞癌及大细胞癌(Siegel R L,Miller K D,Jemal A.Cancer statistics,2018[J].CA Cancer J Clin,2018,68(1):7-30)。尽管对于肺癌己经做了大量的研究与临床管理以及近些年肺癌诊断及治疗的手段得到了发展,例如表皮生长因子(EGFR)和间变性淋巴瘤受体络氨酸激酶(ALK)基因检测及靶点治疗,然而肺癌的预后依然较差,5年生存率只有11%。这主要是由于对癌症转移早期的诊断非常困难。许多基因的异常表达被发现与肺癌的发生发展有关,但是这些异常表达并不能完全解释所有的临床表现。因此,发现新的诊断及预后肺癌生物标志物用于靶向治疗对于肺癌研究是至关重要的。传统的癌症研究方法主要集中在蛋白编码基因上,但是随着新的生物技术的发展,例如深度测序技术,使得研究者可以发现更多的基因表达的转录本,不仅是翻译基因(Kapranov P,Cheng J,Dike S,et al.RNA maps reveal new RNAclasses and a possible function for pervasive transcription[J].Science,2007,316(5830):1484-1488.)。例如没有编码能力的非编码基因(ncRNA)(Gibb E A,Brown C J,Lam W L.The functional role of long non-coding RNA in human carcinomas[J].MolCancer,2011,10:38.),MicroRNAs(miRNAs)是ncRNAs一个亚分类,由19~24核苷酸组成,其可在调控转录后水平的靶基因从而抑制mRNA的翻译或结构。除miRNAs以外,长链非编码RNA(1ncRNAs)也是ncRNAs其中的一种,与miRNAs相比1ncRNAs的研究还处于起步阶段。
LncRNA是一种长度大于200个核苷酸的非编码RNA,也正因其长度区分于其他ncRNAs,例如miRNA。研究报告显示,通过人类基因组已检测到的1ncRNAs超过了30000个(Pennisi E.Long noncoding RNAs may alter chromosome's3D structure[J].Science,2013,340(6135):910.)。基于1ncRNAs在基因上的表达位置,可将1ncRNAs进一步被划分为内含子,基因间,双向,正义和反义1ncRNAs五种类型(Ponting C P,Oliver P L,ReikW.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(4):629-641.)。进一步研究发现,LncRNAs可在转录、转录后及翻译水平调控其靶基因(Mercer T R,Mattick J S.Structure and function of long noncoding RNAs in epigeneticregulation[J].Nat Struct Mol Biol,2013,20(3):300-307.)。LncRNAs可通过与靶基因的互补序列结合从而导致靶基因的沉默或活性下降。与此同时,1ncRNAs还可招募组蛋白修饰蛋白或竞争性结合启动调控靶基因表达构象改变的关键蛋白。癌症进程中,1ncRNAs与miRNAs之间存在一种内在关联。尽管1ncRNAs在90年代早期就被发现,但其表达和功能研究近些年缓慢展开。科学家们已经揭示了1ncRNAs的大部分功能,包括X染色体失活、基因组印迹、基因调控、细胞周期调控、蛋白脚手架及染色体修饰等功能。大量研究证据已经表明1ncRNAs的异常表达和人类疾病有着密切的关联,包括癌症(Chen G,Wang Z,Wang D,etal.LncRNADisease:a database for long-non-coding RNA-associated diseases[J].Nucleic Acids Res,2013,41(Database issue):D983-D986.)。LncRNAs在癌症中的异常表达是其重要的发病原因,例如诱发肿瘤迁移的发展。迄今为止,已发现大量的1ncRNAs参与了癌症的发生发展进程,例如乳腺癌中的BCAR4、前列腺癌的PCA3、肝癌的HULC。同样,1ncRNAs作为肺癌诊疗标记物也有着巨大的临床应用前景。深入研究与肺癌相关的lncRNA,对于指导研发临床肺腺癌分子诊断及分子靶向药物具有重要的意义。
发明内容
为了弥补现有技术的不足,本发明的目的在于提供一种与肺腺癌发生发展相关的lncRNA,从而为肺腺癌的诊断和治疗提供分子靶标,实现患者的个性化诊疗。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一方面提供了一种试剂,所述试剂能够检测样本中RP11-492E3.2基因的水平。
进一步,所述试剂包括:
特异性识别RP11-492E3.2的探针;或
特异性扩增RP11-492E3.2的引物。
进一步,特异性扩增RP11-492E3.2基因的引物序列如SEQ ID NO.1~2所示。
本发明的第二发面提供了一种试剂盒,所述试剂盒包括本发明第一方面所述的试剂,所述试剂能够检测RP11-492E3.2基因的水平。
本发明的第三方面提供了一种芯片,所述芯片包括本发明第一方面所述的试剂,所述试剂能够检测能够检测RP11-492E3.2基因的水平。
本发明的第四方面提供了一种试纸,所述试纸包括本发明第一方面所述的试剂,所述试剂能够检测能够检测RP11-492E3.2基因的水平。
本发明的第五方面提供了一种药物组合物,所述组合物包括有效量的RP11-492E3.2的抑制剂。
进一步,所述抑制剂为降低RP11-492E3.2表达水平的试剂。
进一步,所述抑制剂选自:以RP11-492E3.2或其转录本为靶序列、且能够抑制RP11-492E3.2基因表达或基因转录的干扰分子,包括:shRNA(小发夹RNA)、小干扰RNA(siRNA)、dsRNA、微小RNA、反义核酸,或能表达或形成所述shRNA、小干扰RNA、dsRNA、微小RNA、反义核酸的构建物。优选的,所述抑制剂为siRNA。
进一步,所述组合物还包括与所述抑制剂配伍的其他药类以及药学上可接受的载体和/或辅料。
进一步,药学上可接受的载体可以是一种也可以是多种,所述载体包括但不限于粘合剂、增甜剂、崩解剂、稀释剂、调味剂、包衣剂、防腐剂、润滑剂和/或延时剂(timedelayagent)。
本发明的药物还可与其他治疗肺腺癌的药物联用,其他治疗性化合物可以与主要的活性成分同时给药,甚至在同一组合物中同时给药。
本发明的第六方面提供了一种筛选治疗肺腺癌的候选物质的方法,所述方法包括:
用待筛选物质处理表达或含有RP11-492E3.2基因的培养体系;和
检测所述体系中RP11-492E3.2基因的水平;
其中,若所述待筛选物质可抑制RP11-492E3.2基因的水平,则表明该筛选物质是治疗肺腺癌的候选物质。
本发明的第七方面提供了如下任一项所述的应用:
a.本发明第一方面所述的试剂在制备诊断肺腺癌的产品中的应用;
b.本发明第二方面所述的试剂盒在制备诊断肺腺癌的产品中的应用;
c.本发明第三方面所述的芯片在制备诊断肺腺癌的产品中的应用;
d.本发明第四方面所述的试纸在制备诊断肺腺癌的产品中的应用;
e.RP11-492E3.2构建预测肺腺癌的计算模型中的应用;
f.本发明第五方面所述的药物组合物在制备治疗肺腺癌的产品中的应用。
本发明的优点与有益效果:
本发明首次发现了RP11-492E3.2的差异表达与肺腺癌的发生发展相关,通过检测RP11-492E3.2的表达水平可以判断受试者是否患有肺腺癌,为肺腺癌的诊断和治疗提供了分子靶标。
附图说明
图1是利用QPCR检测RP11-492E3.2基因在肺腺癌组织中的表达情况图。
具体的实施方式
本发明经过广泛而深入的研究,通过高通量测序以及生物信息学分析方法,检测肺腺癌标本中lncRNA在肿瘤组织和癌旁组织的表达,发现其中具有明显表达差异的lncRNA,探讨其与肺腺癌的发生发展之间的关系,从而为肺腺癌的诊断及靶向治疗寻找更好的途径和方法。通过筛选,本发明首次发现了与肺腺癌发生发展相关的lncRNA RP11-492E3.2,为肺腺癌的早期诊断及治疗提供了新的肿瘤标志物和治疗靶点。
RP11-492E3.2基因
RP11-492E3.2是位于人9号染色上,本发明中的RP11-492E3.2包括野生型、突变型或其片段。一种代表性的RP11-492E3.2基因序列如ENST00000443993.1所示。
本领域技术人员知道,在对原始测序结果进行生物信息学分析时,通常会将测序结果和已知的基因进行比对,只要测序片段可以比对到相关基因上,就可以看做是该基因的表达,因此,在提及差异表达的基因时,该基因的不同的转录本同时包含在本发明中。
本领域技术人员应当理解,测定基因表达的手段不是本发明的重要方面。可以在转录水平上检测生物标志物的表达水平。本发明可以利用本领域内已知的任何方法测定基因表达。
检测技术
本发明的lncRNA使用本领域普通技术人员已知的多种核酸技术进行检测,这些技术包括但不限于:核酸测序、核酸杂交和核酸扩增技术。
核酸测序技术的示例性非限制性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。本领域的普通技术人员将认识到,由于RNA在细胞中不太稳定并且在实验中更易受到核酸酶攻击,因此在测序前通常将RNA逆转录成DNA。
核酸测序技术的另一示例性非限制性实例包括下一代测序(深度测序/高通量测序),高通量测序技术是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组的DNA的随机片段附着到光学透明的玻璃表面,这些DNA片段经过延伸和桥式扩增后,在玻璃表面形成数以亿计的簇,每个簇是具有数千份相同模板的单分子簇,然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性的边合成边测序技术对待测的模板DNA进行测序。
核酸杂交技术的示例性非限制性实例包括但不限于原位杂交(ISH)、微阵列和Southern或Northern印迹。原位杂交(ISH)是一种使用标记的互补DNA或RNA链作为探针以定位组织一部分或切片(原位)或者如果组织足够小则为整个组织(全组织包埋ISH)中的特异性DNA或RNA序列的杂交。DNA ISH可用于确定染色体的结构。RNA ISH用于测量和定位组织切片或全组织包埋内的mRNA和其他转录本(例如,ncRNA)。通常对样本细胞和组织进行处理以原位固定靶转录本,并增加探针的进入。探针在高温下与靶序列杂交,然后将多余的探针洗掉。分别使用放射自显影、荧光显微术或免疫组织化学,对组织中用放射、荧光或抗原标记的碱基标记的探针进行定位和定量。ISH也可使用两种或更多种通过放射性或其他非放射性标记物标记的探针,以同时检测两种或更多种转录本。
将Southern和Northern印迹分别用于检测特异性DNA或RNA序列。使从样本中提取的DNA或RNA断裂,在基质凝胶上通过电泳分离,然后转移到膜滤器上。使滤器结合的DNA或RNA与和所关注的序列互补的标记探针杂交。检测结合到滤器的杂交探针。该程序的一种变化形式是反向Northern印迹,其中固定到膜的底物核酸为分离的DNA片段的集合,而探针是从组织提取并进行了标记的RNA。
核酸扩增技术的示例性非限制性实例包括但不限于:聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本领域的普通技术人员将认识到,某些扩增技术(例如,PCR)需要在扩增前将RNA逆转录成DNA(例如,RT-PCR),而其他扩增技术则直接扩增RNA(例如,TMA和NASBA)。
通常称为PCR的聚合酶链式反应使用变性、引物对与相反链的退火以及引物延伸的多个循环,以指数方式增加靶核酸序列的拷贝数;TMA的转录介导的扩增(在基本上恒定的温度、离子强度和pH的条件下自身催化地合成靶核酸序列的多个拷贝,其中靶序列的多个RNA拷贝自身催化地生成另外的拷贝;LCR的连接酶链式反应使用与靶核酸的相邻区域杂交的两组互补DNA寡核苷酸;其他扩增方法包括例如:通常称为NASBA的基于核酸序列的扩增;使用RNA复制酶(通常称为Qβ复制酶)扩增探针分子本身的扩增;基于转录的扩增方法;以及自我维持的序列扩增。
本发明中非扩增或扩增的核酸可通过任何常规的手段检测。
芯片、试剂盒、试纸
本发明提供了检测中RP11-492E3.2基因的表达水平的产品,所述产品包括(但不限于)芯片、试剂盒、试纸。其中芯片包括:固相载体;以及有序固定在所述固相载体上的寡核苷酸探针,所述的寡核苷酸探针特异性地对应于RP11-492E3.2所示的部分或全部序列。
所述固相载体包括无机载体和有机载体,所述无机载体包括但不限于有硅载体、玻璃载体、陶瓷载体等;所述有机载体包括聚丙烯薄膜、尼龙膜等。
“探针”指短至几个到长达数百碱基的核酸片段如RNA或DNA,所述核酸片段可以与mRNA建立特异性结合并且可以因维持标记(Labeling)作用而确定特定mRNA的存在。探针可以按寡核苷酸探针、单链DNA(singlestrandedDNA)探针、双链DNA(doublestrandedDNA)探针和RNA探针等形式制备。在本发明中,可以通过使用本发明的标记多核苷酸及互补探针实施杂交,借助是否杂交来预测肺腺癌预后。可以基于本领域已知内容修改对探针和杂交条件的恰当选择。
“杂交”或“核酸杂交”或“杂交”通常指两个具有互补碱基序列,在适当条件下将形成热力学上稳定的双链结构的单链核酸分子的杂交。如本文所用的术语“杂交”可指在严格或非严格条件下的杂交。条件的设置在本领域技术人员的技术范围内,可根据本领域中说明的实验方案确定。
本发明中的示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。
本发明提供了一种试剂盒,所述试剂盒可用于检测RP11-492E3.2的表达。所述试剂盒包括用于扩增RP11-492E3.2的特异性引物对;标准DNA模板;PCR反应液。在一个优选的实施方案中,所述特异性引物对包括上游引物和下游引物,序列如SEQ ID NO.1~2所示。
作为更优选的实施方案,所述试剂盒为荧光定量PCR检测试剂盒,所述引物适用于SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针的检测。
在一个更优选的实施方案中,所述试剂盒中的PCR反应液为荧光定量PCR反应液,并一步包含荧光染料。
在一个更优选的实施方案中,所述荧光定量PCR反应液包括dNTP、Mg2+、Taq酶及buffer缓冲液,所述荧光染料为SYBR Green II,Taq酶为热启动酶。
本发明提供了一种试纸,所述试纸可用于检测RP11-492E3.2的表达;所述试纸包括特异性识别RP11-492E3.2的探针或特异性扩增RP11-492E3.2的引物对。
作为一种优选的实施方案,所述试纸还包括纤维膜,纤维膜包括但不限于硝酸纤维素膜或尼龙膜。
在一个更为优选的实施方案,纤维膜上还设有检测线和质控线。
药物筛选
本发明提供了一种筛选治疗肺腺癌药物的方法,即:
在实验组中,向培养体系中加入待测化合物,并测定RP11-492E3.2的表达水平;在对照组中,向同样的培养体系中不加入待测化合物,并测定RP11-492E3.2的表达水平;其中,如果实验组中RP11-492E3.2的表达水平小于对照组,则说明该待筛选的物质为RP11-492E3.2的候选物质。
在本发明中,所述的方法还包括:对上面步骤获得的候选物质进一步测试其抑制肺腺癌的效果,若测试化合物对肺腺癌有显著的抑制效果,则说明该化合物为治疗肺腺癌的候选物质。
所述培养体系包括(但不限于)细胞体系、亚细胞体系、溶液体系、组织体系、器官体系或动物体系(如动物模型,优选非人哺乳动物的动物模型,如鼠、兔、羊、猴等)等。
当将通过本发明的筛选方法分离的化合物作为药物施用于人或其它哺乳动物,其包括但不限于小鼠、大鼠、豚鼠、兔、猫、犬、羊、猪、牛、猴子、狒狒、黑猩猩时,分离的化合物可以直接施用,或者可以利用已知的药物制备方法配制成各种剂型。例如,根据需要,所述药物可以作为糖衣片剂、胶囊剂、酏剂和微胶囊口服施用;或者用水或任何其它药物可接受的液体配制成无菌溶液或悬浮液,以注射剂的形式非口服施用。例如,可以将化合物以一般接受的药物施用方式所需的单位剂型(unit dose)、与药学可接受的载体或介质混合在一起,所述载体或介质包括但不限于无菌水、生理盐水、植物油、乳化剂、悬浮剂、表面活性剂、稳定剂、调味剂、赋形剂(excipient)、媒介物(vehicle)、防腐剂、粘合剂等。根据这些制剂中有效成分的含量,可以获得在指定范围内的合适的给药量。
统计学分析
在本发明的具体实施例中,实验都是按照至少重复3次来完成的,结果数据都是以平均值±标准差的方式来表示,采用SPSS18.0统计软件来进行统计分析的,两者之间的差异采用t检验,认为当P<0.05时具有统计学意义。
下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1筛选与肺腺癌相关的基因标志物
1、样品收集
收集35例肺腺癌组织以及相应的癌旁组织,全部患者在手术前均未接受其他治疗,从中任选4例肺腺癌组织及相应的癌旁组织进行高通量测序。
2、RNA样品的制备及定量分析
利用QIAGEN的组织RNA提取试剂盒进行组织RNA的提取,具体操作按说明书进行。
将上述提取的RNA进行琼脂糖凝胶电泳,利用Nanodrop2000对所提RNA的浓度和纯度进行检测,琼脂糖凝胶电泳检测RNA完整性,Agilent2100测定RIN值。单次建库要求RNA总量5μg,浓度≥200ng/μL,OD260/280介于1.8~2.2之间。
3、构建cDNA文库及测序
cDNA文库的构建及测序由华大基因完成,步骤如下:
1)去除rRNA
使用Ribo-Zero试剂盒除去总RNA中的核糖体RNA;
2)片段化RNA
对完整的RNA序列,利用金属离子进行随机打断,将RNA随机断裂成200bp左右的小片段。
3)反转合成cDNA
利用Illumina的TruseqTM RNA sample Prep Kit进行cDNA文库的构建,在逆转录酶的作用下,利用随机引物,以lncRNA为模板反转合成一链cDNA,进行二链合成时,dNTPs试剂中用dUTP代替dTTP,使cDNA第二链中碱基包含A/U/C/G。
4)连接adaptor
加入End Repair Mix将双链cDNA的粘性末端补成平末端,随后在3’末端加上一个A碱基,用于连接Y字形的接头。
5)UNG酶消化cDNA二链
用UNG酶将cDNA第二链消化,从而使文库中仅包含cDNA第一链。
6)使用Illumina X-Ten测序平台,进行2*150bp测序。
4、高通量转录组测序数据分析
删除不易检测到的lncRNA(即该lncRNA的read count值在case中为0的样本数大于总的case样本量的20%或该lncRNA的read count值在normal中为0的样本数大于总的normal样本量的20%)后,使用R-3.3.3工具的DESeq2进行差异表达分析,差异表达lncRNA筛选标准:FDR<0.05,abs(log2FC)>2。
5、结果
测序分析结果显示,与癌旁组织相比,RP11-492E3.2在肺腺癌组织中的表达水平显著上调。
实施例2 QPCR测序验证RP11-492E3.2基因的差异表达
1、对收集的35例组织样本进行RP11-492E3.2基因差异表达的验证。
2、RNA提取
利用QIAGEN的组织RNA提取试剂盒提取RNA样品,具体操作详见说明书。
3、QPCR
1)逆转录反应
采用天根公司的FastQμant cDNA第一链合成试剂盒(货号:KR106)进行lncRNA反转录,首先去除基因组DNA反应,在试管中加入5×gDNA Bμffer2.0μl,总RNA 1μg,加RnaseFree ddH2O使总体积至10μl,水浴锅中42℃加热3min.
将10×Fast RT Bμffer2.0μl,RT Enzyme Mix1.0μl,FQ-RT Primer Mix2.0μl,RNase Free ddH2O5.0μl,混合后加入上述试管中一起混合共20μl,水浴锅中42℃加热15min,95℃加热3min。
2)引物设计
根据Genebank中RP11-492E3.2基因和GAPDH基因的编码序列设计QPCR扩增引物,由博迈德生物公司合成。具体引物序列如下:
RP11-492E3.2基因:
正向引物为5’-TATTATGAGCCAGGAGAT-3’(SEQ ID NO.1);
反向引物为5’-GGTGAACTATTCTTATGGA-3’(SEQ ID NO.2)。
GAPDH基因:
正向引物为5’-AATCCCATCACCATCTTCCAG-3’(SEQ ID NO.3);
反向引物为5’-GAGCCCCAGCCTTCTCCAT-3’(SEQ ID NO.4)。
3)QPCR扩增检验
用SuperReal PreMix Plus(SYBR Green)(货号:FP205),进行扩增,实验操作按产品说明书进行。
采用20μl反应体系:2×SuperReal PreMix Plus10μl,正反向引物(10μM)各0.6μl,5×ROX Reference Dye△2μl,DNA模板2μl,灭菌蒸馏水4.8μl。每个样本设置3个平行管,所有扩增反应均重复三次以上以保证结果的可靠性。
扩增程序为:95°15min,(95℃10s,55℃30s,72℃32s)×40个循环,95℃15s,60℃60s,95℃15s)。
4)cDNA模板浓度的筛选
将各样本cDNA混合后,以此为模板进行10倍梯度(10、100、1000、10000、100000倍)稀释,稀释后样品各取2μl作模板,分别用目的基因引物和内参基因引物进行扩增,同时在60-95℃进行融解曲线分析,根据扩增效率高和溶解曲线单峰原则进行模板浓度的筛选。
根据溶解曲线,可以看出,当cDNA的进行10倍稀释时,PCR的扩增效率较高,溶解曲线单峰比较好。
5)样品RealTime PCR检测
将各样品cDNA 10倍稀释后取2μl作模板,分别用目的基因引物和内参基因引物进行扩增。同时在60-95℃进行溶解曲线分析,通过融解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
4、结果
QPCR结果如图1所示,与癌旁组织相比,RP11-492E3.2在肺腺癌组织中表达上调,上调约19倍,差异具有统计学意义(P<0.05),提示RP11-492E3.2在肺腺癌的诊断中具有较高的应用价值。
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 用于肺腺癌诊断的分子标志物及其应用
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tattatgagc caggagat 18
<210> 2
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggtgaactat tcttatgga 19
<210> 3
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aatcccatca ccatcttcca g 21
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gagccccagc cttctccat 19