肺腺癌相关长链非编码RNA及其应用
技术领域
本发明属于生物医药领域,涉及肺腺癌相关长链非编码RNA及其应用,具体的涉及长链非编码RNA LINC01936。
背景技术
肺癌是一个全球性的健康问题,至今仍威胁着成千上万的生命。2016年,美国肺癌的新发总人数在各种类型的肿瘤中位居第二,是第二大最常被诊断的癌症,同时肺癌也是导致癌症死亡的主要原因(Rezende L F M,Sa T H,Markozannes G,et al.Physicalactivity and cancer:an umbrella review of the literature including 22majoranatomical sites and 770 000cancer cases[J].Br J Sports Med,2017.)。在中国,肺癌的发病率逐年上升,死亡率却居高不下,均居于第一位,对中国人民的健康以及生命造成了巨大的威胁,成为严重的社会问题,经济负担加剧。组织学分类中,肺癌包括:非小细胞肺癌以及小细胞肺癌;其中约85%为非小细胞肺癌,按病理分类为鳞癌,腺癌以及大细胞癌等。非小细胞肺癌的发病原因目前还不明确,大样本多中心研究数据表明:吸烟、环境因素、电离辐射、职业接触、遗传因素和慢性肺部感染均是非小细胞肺癌发病的危险因素(FaticaA,Bozzoni 1.Long non-coding RNAs:new players in cell differentiation anddevelopment[J].Nature Reviews Genetics,2014,15(1):7.),其临床表现包括局部症状、全身症状、肺外症状、浸润和转移症状,局部症状包括咳嗽、胸痛、胸闷,咯血和声嘶等。其中,咳嗽多是非小细胞肺癌的首发症状,在非小细胞肺癌早期,临床表现多缺乏特异性,易被忽视,相当一部分患者在确诊为肺癌时已是晚期,错过了最佳治疗时机,而尽管手术、化疗、放疗、分子靶向治疗等多种治疗手段近年来已取得了许多突破,肺癌的治疗仍面临着许多挑战,导致目前非小细胞肺癌的5年总生存率仅达到15%左右(Qu S,Yang X,Li X,etal.Circular RNA:a new star of noncoding RNAs[J].Cancer letters,2015,365(2):141-148.)。
在基因组时代,出现了大量的高通量测序技术和肺癌基因特征的数据库,为肺癌的诊断和预后特征评估提供了重要的依据。转录组侧序技术(RNAsequencing,RNA-seq)是最近开发的深度测序技术,它可以识别未映射的基因、未识别的非编码RNA和剪接变体,为肺癌的临床诊疗提供了新的工具(Wang Y,Qian C-Y,Li X-P,et al.Genome-scale longnoncoding RNA expression pattern in squamous cell lung cancer[J].Scientificreports,2015,5:11671.)。在非编码RNA的筛选中,已经发现了不少微小RNA(MicroRNA,miRNA)及长链非编码RNA(long non-coding RNA,1ncRNA)与肺癌的诊断和预后密切相关。但是关于lncRNA的研究仍处于起步阶段。深入研究与肺癌相关的lncRNA,寻找可应用于临床的标志物,对于肺腺癌的早期诊断以及个性化治疗具有重要的意义。
发明内容
为了弥补现有技术的不足,本发明的目的在于提供一种与肺腺癌相关的lncRNA,通过检测该lncRNA的表达水平,实现肺腺癌的辅助诊断。
为了实现上述目的,本发明采用如下技术方案:
本发明提供了检测LINC01936的试剂在制备诊断肺腺癌的产品中的应用。
进一步,LINC01936在肺腺癌患者中表达下调。
进一步,所述产品包括通过RT-PCR、实时定量PCR、原位杂交、芯片或高通量测序平台检测LINC01936的表达水平的试剂。
进一步,所述试剂选自:
特异性识别LINC01936的探针;或
特异性扩增LINC01936的引物。
进一步,所述特异性扩增LINC01936的引物序列如SEQ ID NO.1~2所示。
本发明提供了一种诊断肺腺癌的产品,所述产品包括检测LINC01936表达水平的试剂。
进一步,所述产品包括芯片、试剂盒、核酸膜条。
进一步,所述芯片包括特异性识别LINC01936的寡核苷酸探针;所述试剂盒包括特异性扩增LINC01936的引物,或特异性识别LINC01936的寡核苷酸探针;所述核酸膜条包括特异性识别LINC01936的寡核苷酸探针。
本发明提供了LINC01936在构建预测肺腺癌的计算模型中的应用。
本发明提供了LINC01936在制备治疗肺腺癌的药物组合物中的应用。
进一步,所述药物组合物包括LINC01936的促进剂。
进一步,所述促进剂为增加LINC01936表达水平的试剂。
进一步,所述组合物还包括与所述促进剂配伍的其他药类以及药学上可接受的载体和/或辅料。药学上可接受的载体可以是一种也可以是多种,所述载体包括但不限于粘合剂、增甜剂、崩解剂、稀释剂、调味剂、包衣剂、防腐剂、润滑剂和/或延时剂(timedelayagent)。
本发明的药物还可与其他治疗肺腺癌的药物联用,其他治疗性化合物可以与主要的活性成分同时给药,甚至在同一组合物中同时给药。
本发明的优点与有益效果:
本发明首次发现了LINC01936的差异表达与肺腺癌的发生发展相关,通过检测LINC01936的表达水平可以判断受试者是否患有肺腺癌,为肺腺癌的诊断和治疗提供了分子靶标。
附图说明
图1是利用QPCR检测LINC01936基因在肺腺癌组织中的表达情况图。
具体的实施方式
本发明经过广泛而深入的研究,通过高通量测序以及生物信息学分析方法,检测肺腺癌标本中lncRNA在肿瘤组织和癌旁组织的表达,发现其中具有明显表达差异的lncRNA,探讨其与肺腺癌的发生发展之间的关系,从而为肺腺癌的诊断及靶向治疗寻找更好的途径和方法。通过筛选,本发明首次发现了与肺腺癌发生发展相关的lncRNALINC01936,为肺腺癌的早期诊断及治疗提供了新的肿瘤标志物和治疗靶点。
LINC01936基因
LINC01936是位于人2号染色上,基因ID为285043。本发明中的LINC01936包括野生型、突变型或其片段。一种代表性的LINC01936基因序列如NR_122048.1所示。
本领域技术人员知道,在对原始测序结果进行生物信息学分析时,通常会将测序结果和已知的基因进行比对,只要测序片段可以比对到相关基因上,就可以看做是该基因的表达,因此,在提及差异表达的基因时,该基因的不同的转录本同时包含在本发明中。
本领域技术人员应当理解,测定基因表达的手段不是本发明的重要方面。可以在转录水平上检测生物标志物的表达水平。本发明可以利用本领域内已知的任何方法测定基因表达。
检测技术
本发明的lncRNA使用本领域普通技术人员已知的多种核酸技术进行检测,这些技术包括但不限于:核酸测序、核酸杂交和核酸扩增技术。
核酸测序技术的示例性非限制性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。本领域的普通技术人员将认识到,由于RNA在细胞中不太稳定并且在实验中更易受到核酸酶攻击,因此在测序前通常将RNA逆转录成DNA。
核酸测序技术的另一示例性非限制性实例包括下一代测序(深度测序/高通量测序),高通量测序技术是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组的DNA的随机片段附着到光学透明的玻璃表面,这些DNA片段经过延伸和桥式扩增后,在玻璃表面形成数以亿计的簇,每个簇是具有数千份相同模板的单分子簇,然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性的边合成边测序技术对待测的模板DNA进行测序。
核酸杂交技术的示例性非限制性实例包括但不限于原位杂交(ISH)、微阵列和Southern或Northern印迹。原位杂交(ISH)是一种使用标记的互补DNA或RNA链作为探针以定位组织一部分或切片(原位)或者如果组织足够小则为整个组织(全组织包埋ISH)中的特异性DNA或RNA序列的杂交。DNA ISH可用于确定染色体的结构。RNA ISH用于测量和定位组织切片或全组织包埋内的mRNA和其他转录本(例如,ncRNA)。通常对样本细胞和组织进行处理以原位固定靶转录本,并增加探针的进入。探针在高温下与靶序列杂交,然后将多余的探针洗掉。分别使用放射自显影、荧光显微术或免疫组织化学,对组织中用放射、荧光或抗原标记的碱基标记的探针进行定位和定量。ISH也可使用两种或更多种通过放射性或其他非放射性标记物标记的探针,以同时检测两种或更多种转录本。
将Southern和Northern印迹分别用于检测特异性DNA或RNA序列。使从样本中提取的DNA或RNA断裂,在基质凝胶上通过电泳分离,然后转移到膜滤器上。使滤器结合的DNA或RNA与和所关注的序列互补的标记探针杂交。检测结合到滤器的杂交探针。该程序的一种变化形式是反向Northern印迹,其中固定到膜的底物核酸为分离的DNA片段的集合,而探针是从组织提取并进行了标记的RNA。
核酸扩增技术的示例性非限制性实例包括但不限于:聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本领域的普通技术人员将认识到,某些扩增技术(例如,PCR)需要在扩增前将RNA逆转录成DNA(例如,RT-PCR),而其他扩增技术则直接扩增RNA(例如,TMA和NASBA)。
通常称为PCR的聚合酶链式反应使用变性、引物对与相反链的退火以及引物延伸的多个循环,以指数方式增加靶核酸序列的拷贝数;TMA的转录介导的扩增(在基本上恒定的温度、离子强度和pH的条件下自身催化地合成靶核酸序列的多个拷贝,其中靶序列的多个RNA拷贝自身催化地生成另外的拷贝;LCR的连接酶链式反应使用与靶核酸的相邻区域杂交的两组互补DNA寡核苷酸;其他扩增方法包括例如:通常称为NASBA的基于核酸序列的扩增;使用RNA复制酶(通常称为Qβ复制酶)扩增探针分子本身的扩增;基于转录的扩增方法;以及自我维持的序列扩增。
本发明中非扩增或扩增的核酸可通过任何常规的手段检测。
芯片、试剂盒、核酸膜条
本发明提供了检测中LINC01936基因的表达水平的产品,所述产品包括(但不限于)芯片、试剂盒、试纸。其中芯片包括:固相载体;以及有序固定在所述固相载体上的寡核苷酸探针,所述的寡核苷酸探针特异性地对应于LINC01936所示的部分或全部序列。
所述固相载体包括无机载体和有机载体,所述无机载体包括但不限于有硅载体、玻璃载体、陶瓷载体等;所述有机载体包括聚丙烯薄膜、尼龙膜等。
“探针”指短至几个到长达数百碱基的核酸片段如RNA或DNA,所述核酸片段可以与mRNA建立特异性结合并且可以因维持标记(Labeling)作用而确定特定mRNA的存在。探针可以按寡核苷酸探针、单链DNA(singlestrandedDNA)探针、双链DNA(doublestrandedDNA)探针和RNA探针等形式制备。在本发明中,可以通过使用本发明的标记多核苷酸及互补探针实施杂交,借助是否杂交来预测肺腺癌预后。可以基于本领域已知内容修改对探针和杂交条件的恰当选择。
“杂交”或“核酸杂交”或“杂交”通常指两个具有互补碱基序列,在适当条件下将形成热力学上稳定的双链结构的单链核酸分子的杂交。如本文所用的术语“杂交”可指在严格或非严格条件下的杂交。条件的设置在本领域技术人员的技术范围内,可根据本领域中说明的实验方案确定。
本发明中的示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。
本发明提供了一种试剂盒,所述试剂盒可用于检测LINC01936的表达。所述试剂盒包括用于扩增LINC01936的特异性引物对;标准DNA模板;PCR反应液。在一个优选的实施方案中,所述特异性引物对包括上游引物和下游引物,序列如SEQ ID NO.1~2所示。
作为更优选的实施方案,所述试剂盒为荧光定量PCR检测试剂盒,所述引物适用于SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针的检测。
在一个更优选的实施方案中,所述试剂盒中的PCR反应液为荧光定量PCR反应液,并一步包含荧光染料。
在一个更优选的实施方案中,所述荧光定量PCR反应液包括dNTP、Mg2+、Taq酶及buffer缓冲液,所述荧光染料为SYBR Green II,Taq酶为热启动酶。
本发明提供了一种核酸膜条,所述核酸膜条可用于检测LINC01936的表达;所述核酸膜条包括特异性识别LINC01936的探针。
作为一种优选的实施方案,核酸膜条还包括固定LINC01936的探针的基底,所述基底可以是任何适于固定寡核苷酸探针的基底,例如尼龙膜、硝酸纤维素膜、聚丙烯膜、玻璃片、硅胶晶片、微缩磁珠等。
统计学分析
在本发明的具体实施例中,实验都是按照至少重复3次来完成的,结果数据都是以平均值±标准差的方式来表示,采用SPSS18.0统计软件来进行统计分析的,两者之间的差异采用t检验,认为当P<0.05时具有统计学意义。
下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:ColdSpring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1筛选与肺腺癌相关的基因标志物
1、样品收集
收集35例肺腺癌组织以及相应的癌旁组织,全部患者在手术前均未接受其他治疗,从中任选4例肺腺癌组织及相应的癌旁组织进行高通量测序。
2、RNA样品的制备及定量分析
利用QIAGEN的组织RNA提取试剂盒进行组织RNA的提取,具体操作按说明书进行。
将上述提取的RNA进行琼脂糖凝胶电泳,利用Nanodrop2000对所提RNA的浓度和纯度进行检测,琼脂糖凝胶电泳检测RNA完整性,Agilent2100测定RIN值。单次建库要求RNA总量5μg,浓度≥200ng/μL,OD260/280介于1.8~2.2之间。
3、构建cDNA文库及测序
cDNA文库的构建及测序由华大基因完成,步骤如下:
1)去除rRNA
使用Ribo-Zero试剂盒除去总RNA中的核糖体RNA;
2)片段化RNA
对完整的RNA序列,利用金属离子进行随机打断,将RNA随机断裂成200bp左右的小片段。
3)反转合成cDNA
利用Illumina的TruseqTM RNA sample Prep Kit进行cDNA文库的构建,在逆转录酶的作用下,利用随机引物,以lncRNA为模板反转合成一链cDNA,进行二链合成时,dNTPs试剂中用dUTP代替dTTP,使cDNA第二链中碱基包含A/U/C/G。
4)连接adaptor
加入End Repair Mix将双链cDNA的粘性末端补成平末端,随后在3’末端加上一个A碱基,用于连接Y字形的接头。
5)UNG酶消化cDNA二链
用UNG酶将cDNA第二链消化,从而使文库中仅包含cDNA第一链。
6)使用Illumina X-Ten测序平台,进行2*150bp测序。
4、高通量转录组测序数据分析
删除不易检测到的lncRNA(即该lncRNA的read count值在case中为0的样本数大于总的case样本量的20%或该lncRNA的read count值在normal中为0的样本数大于总的normal样本量的20%)后,使用R-3.3.3工具的DESeq2进行差异表达分析,差异表达lncRNA筛选标准:FDR<0.05,abs(log2FC)>2。
5、结果
测序分析结果显示,与癌旁组织相比,LINC01936在肺腺癌组织中的表达水平显著下调。
实施例2 QPCR测序验证LINC01936基因的差异表达
1、对收集的35例组织样本进行LINC01936基因差异表达的验证。
2、RNA提取
利用QIAGEN的组织RNA提取试剂盒提取RNA样品,具体操作详见说明书。
3、QPCR
1)逆转录反应
采用天根公司的FastQμant cDNA第一链合成试剂盒(货号:KR106)进行lncRNA反转录,首先去除基因组DNA反应,在试管中加入5×gDNA Bμffer 2.0μl,总RNA 1μg,加RnaseFree ddH2O使总体积至10μl,水浴锅中42℃加热3min.
将10×Fast RT Bμffer 2.0μl,RT Enzyme Mix 1.0μl,FQ-RT Primer Mix 2.0μl,RNase Free ddH2O 5.0μl,混合后加入上述试管中一起混合共20μl,水浴锅中42℃加热15min,95℃加热3min。
2)引物设计
根据Genebank中LINC01936基因和GAPDH基因的编码序列设计QPCR扩增引物,由博迈德生物公司合成。具体引物序列如下:
LINC01936基因:
正向引物为5’-CTGGCTCTCAACACTCACT-3’(SEQ ID NO.1);
反向引物为5’-TGTGCTCACCTGCTTCTG-3’(SEQ ID NO.2)。
GAPDH基因:
正向引物为5’-AATCCCATCACCATCTTCCAG-3’(SEQ ID NO.3);
反向引物为5’-GAGCCCCAGCCTTCTCCAT-3’(SEQ ID NO.4)。
3)QPCR扩增检验
用SuperReal PreMix Plus(SYBR Green)(货号:FP205),进行扩增,实验操作按产品说明书进行。
采用20μl反应体系:2×SuperReal PreMix Plus 10μl,正反向引物(10μM)各0.6μl,5×ROX Reference Dye△2μl,DNA模板2μl,灭菌蒸馏水4.8μl。每个样本设置3个平行管,所有扩增反应均重复三次以上以保证结果的可靠性。
扩增程序为:95°15min,(95℃10s,55℃30s,72℃32s)×40个循环,95℃15s,60℃60s,95℃15s)。
4)cDNA模板浓度的筛选
将各样本cDNA混合后,以此为模板进行10倍梯度(10、100、1000、10000、100000倍)稀释,稀释后样品各取2μl作模板,分别用目的基因引物和内参基因引物进行扩增,同时在60-95℃进行融解曲线分析,根据扩增效率高和溶解曲线单峰原则进行模板浓度的筛选。
根据溶解曲线,可以看出,当cDNA的进行10倍稀释时,PCR的扩增效率较高,溶解曲线单峰比较好。
5)样品RealTime PCR检测
将各样品cDNA 10倍稀释后取2μl作模板,分别用目的基因引物和内参基因引物进行扩增。同时在60-95℃进行溶解曲线分析,通过融解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
4、结果
QPCR结果如图1所示,与癌旁组织相比,LINC01936在肺腺癌组织中表达下调,下调约5.5倍,差异具有统计学意义(P<0.05),提示LINC01936可作为检测指标应用于肺腺癌的辅助诊断。
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 肺腺癌相关长链非编码RNA及其应用
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctggctctca acactcact 19
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgtgctcacc tgcttctg 18
<210> 3
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aatcccatca ccatcttcca g 21
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gagccccagc cttctccat 19