肺腺癌相关基因AC093110.3及其应用
技术领域
本发明属于生物医药领域,涉及肺腺癌相关基因AC093110.3及其应用。
背景技术
肺癌是所有癌症中死亡率最高的一种癌症。肺癌可以分为非小细胞肺癌(nonsmall cell lung cancer,NSCLC)和小细胞肺癌(small cell lung cancer,SCLC)。其中NSCLC约占肺癌总数的80%-85%,其病情发展迅速,转移速度快,复发率较高。大部分病人发现时已发展至中晚期,预后差,5年生存率不足15%。早期接受治疗的NSCLC患者复发率达40%,且70%以上患者被发现时已是局部侵犯或远隔转移而无法手术。因此,尽管医疗水平不断的提高,NSCLC治疗的效果依然非常差。深入研究肺腺癌发病的分子机制,寻找可应用于临床的分子靶点,成为目前研究的热点。
1ncRNAs是一类长度大于200bp的长非编码RNA,200是根据去掉小RNA的RNA纯化方法的一个方便使用的阈值(KAPRANOV P,CHENG J,DIKE S,et al.RNA maps reveal newRNA classes and a possible function for pervasive transcription[J].Science.2007,316(5830):1484-1488.),由RNA聚合酶II转录。它包含了5’帽端以及3’多聚腺苷酸结构,在哺乳动物里普遍存在。这类RNA没有编码蛋白的能力。与编码基因相比,1ncRNAs的保守性更低且组织和细胞特异性更强。它的功能机制包括通过顺式或反式来调控染色体修饰和基因表达等(CECH T R,STEITZ J A.The noncoding RNA revolution-trashing old rules to forge new ones[J].Cell.2014,157(1):77-94)。顺式作用指的是1ncRNAs与附近基因相互作用,而反式作用指的是1ncRNAs与远端基因相互作用。目前的研究中,1ncRNAs被发现参与了许多细胞生理过程。有一些1ncRNAs被发现是致癌或者抑癌基因,因此有作为癌症治疗靶点的潜力。此外,在癌症中,1ncRNAs曾经被报道其通过与染色质修复复合物相结合,从而起到主要的转录调控作用。
鉴于1ncRNAs在肿瘤发生发展过程中起到十分重要的作用,研究lncRNA在肺腺癌发生发展中的作用,对于肺腺癌的早期诊断和个性化均具有重要的指导意义。
发明内容
为了弥补现有技术的不足,本发明的目的在于提供一种与肺腺癌相关的lncRNA,通过检测该lncRNA的表达水平,实现肺腺癌的辅助诊断。
为了实现上述目的,本发明采用如下技术方案:
本发明提供了AC093110.3在制备诊断肺腺癌的产品中的应用。
进一步,AC093110.3在肺腺癌患者中表达下调。
进一步,所述产品包括通过RT-PCR、实时定量PCR、原位杂交、芯片或高通量测序平台检测AC093110.3的表达水平的试剂。
进一步,所述试剂选自:
特异性识别AC093110.3的探针;或
特异性扩增AC093110.3的引物。
进一步,所述特异性扩增AC093110.3的引物序列如SEQ ID NO.1~2所示。
本发明提供了一种诊断肺腺癌的产品,所述产品包括检测AC093110.3表达水平的试剂。
进一步,所述产品包括芯片、试剂盒、核酸膜条。
进一步,所述芯片包括特异性识别AC093110.3的寡核苷酸探针;所述试剂盒包括特异性扩增AC093110.3的引物,或特异性识别AC093110.3的寡核苷酸探针;所述核酸膜条包括特异性识别AC093110.3的寡核苷酸探针。
本发明提供了AC093110.3在构建预测肺腺癌的计算模型中的应用。
本发明提供了AC093110.3在制备治疗肺腺癌的药物组合物中的应用。
进一步,所述药物组合物包括AC093110.3的促进剂。
进一步,所述促进剂为增加AC093110.3表达水平的试剂。
进一步,所述组合物还包括与所述促进剂配伍的其他药类以及药学上可接受的载体和/或辅料。药学上可接受的载体可以是一种也可以是多种,所述载体包括但不限于粘合剂、增甜剂、崩解剂、稀释剂、调味剂、包衣剂、防腐剂、润滑剂和/或延时剂(timedelayagent)。
本发明的药物还可与其他治疗肺腺癌的药物联用,其他治疗性化合物可以与主要的活性成分同时给药,甚至在同一组合物中同时给药。
本发明的优点与有益效果:
本发明首次发现了AC093110.3在肺腺癌患者表达下调,通过检测AC093110.3的表达水平可以判断受试者是否患有肺腺癌,为肺腺癌的诊断和治疗提供分子靶标。
附图说明
图1是利用QPCR检测AC093110.3基因在肺腺癌组织中的表达情况图。
具体的实施方式
本发明经过广泛而深入的研究,通过高通量测序以及生物信息学分析方法,检测肺腺癌标本中lncRNA在肿瘤组织和癌旁组织的表达,发现其中具有明显表达差异的lncRNA,探讨其与肺腺癌的发生发展之间的关系,从而为肺腺癌的诊断及靶向治疗寻找更好的途径和方法。通过筛选,本发明首次发现了与肺腺癌发生发展相关的lncRNAAC093110.3,为肺腺癌的早期诊断及治疗提供了新的肿瘤标志物和治疗靶点。
AC093110.3基因
AC093110.3是位于人2号染色上,基因编号为ENSG00000238018。本发明中的AC093110.3包括野生型、突变型或其片段。一种代表性的AC093110.3基因序列如ENST00000456363.1所示。
本领域技术人员知道,在对原始测序结果进行生物信息学分析时,通常会将测序结果和已知的基因进行比对,只要测序片段可以比对到相关基因上,就可以看做是该基因的表达,因此,在提及差异表达的基因时,该基因的不同的转录本同时包含在本发明中。
本领域技术人员应当理解,测定基因表达的手段不是本发明的重要方面。可以在转录水平上检测生物标志物的表达水平。本发明可以利用本领域内已知的任何方法测定基因表达。
检测技术
本发明的lncRNA使用本领域普通技术人员已知的多种核酸技术进行检测,这些技术包括但不限于:核酸测序、核酸杂交和核酸扩增技术。
核酸测序技术的示例性非限制性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。本领域的普通技术人员将认识到,由于RNA在细胞中不太稳定并且在实验中更易受到核酸酶攻击,因此在测序前通常将RNA逆转录成DNA。
核酸测序技术的另一示例性非限制性实例包括下一代测序(深度测序/高通量测序),高通量测序技术是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组的DNA的随机片段附着到光学透明的玻璃表面,这些DNA片段经过延伸和桥式扩增后,在玻璃表面形成数以亿计的簇,每个簇是具有数千份相同模板的单分子簇,然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性的边合成边测序技术对待测的模板DNA进行测序。
核酸杂交技术的示例性非限制性实例包括但不限于原位杂交(ISH)、微阵列和Southern或Northern印迹。原位杂交(ISH)是一种使用标记的互补DNA或RNA链作为探针以定位组织一部分或切片(原位)或者如果组织足够小则为整个组织(全组织包埋ISH)中的特异性DNA或RNA序列的杂交。DNA ISH可用于确定染色体的结构。RNA ISH用于测量和定位组织切片或全组织包埋内的mRNA和其他转录本(例如,ncRNA)。通常对样本细胞和组织进行处理以原位固定靶转录本,并增加探针的进入。探针在高温下与靶序列杂交,然后将多余的探针洗掉。分别使用放射自显影、荧光显微术或免疫组织化学,对组织中用放射、荧光或抗原标记的碱基标记的探针进行定位和定量。ISH也可使用两种或更多种通过放射性或其他非放射性标记物标记的探针,以同时检测两种或更多种转录本。
将Southern和Northern印迹分别用于检测特异性DNA或RNA序列。使从样本中提取的DNA或RNA断裂,在基质凝胶上通过电泳分离,然后转移到膜滤器上。使滤器结合的DNA或RNA与和所关注的序列互补的标记探针杂交。检测结合到滤器的杂交探针。该程序的一种变化形式是反向Northern印迹,其中固定到膜的底物核酸为分离的DNA片段的集合,而探针是从组织提取并进行了标记的RNA。
核酸扩增技术的示例性非限制性实例包括但不限于:聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本领域的普通技术人员将认识到,某些扩增技术(例如,PCR)需要在扩增前将RNA逆转录成DNA(例如,RT-PCR),而其他扩增技术则直接扩增RNA(例如,TMA和NASBA)。
通常称为PCR的聚合酶链式反应使用变性、引物对与相反链的退火以及引物延伸的多个循环,以指数方式增加靶核酸序列的拷贝数;TMA的转录介导的扩增(在基本上恒定的温度、离子强度和pH的条件下自身催化地合成靶核酸序列的多个拷贝,其中靶序列的多个RNA拷贝自身催化地生成另外的拷贝;LCR的连接酶链式反应使用与靶核酸的相邻区域杂交的两组互补DNA寡核苷酸;其他扩增方法包括例如:通常称为NASBA的基于核酸序列的扩增;使用RNA复制酶(通常称为Qβ复制酶)扩增探针分子本身的扩增;基于转录的扩增方法;以及自我维持的序列扩增。
本发明中非扩增或扩增的核酸可通过任何常规的手段检测。
芯片、试剂盒、核酸膜条
本发明提供了检测中AC093110.3基因的表达水平的产品,所述产品包括(但不限于)芯片、试剂盒、试纸。其中芯片包括:固相载体;以及有序固定在所述固相载体上的寡核苷酸探针,所述的寡核苷酸探针特异性地对应于AC093110.3所示的部分或全部序列。
所述固相载体包括无机载体和有机载体,所述无机载体包括但不限于有硅载体、玻璃载体、陶瓷载体等;所述有机载体包括聚丙烯薄膜、尼龙膜等。
术语“芯片”也称为“阵列”,指包含连接的核酸或肽探针的固体支持物。阵列通常包含按照不同的已知位置连接至基底表面的多种不同的核酸或肽探针。这些阵列,也称为“微阵列”,通常可以利用机械合成方法或光引导合成方法来产生这些阵列,所述光引导合成方法合并了光刻方法和固相合成方法的组合。阵列可以包含平坦的表面,或者可以是珠子、凝胶、聚合物表面、诸如光纤的纤维、玻璃或任何其它合适的基底上的核酸或肽。可以以一定的方式来包装阵列,从而允许进行全功能装置的诊断或其它方式的操纵。
“微阵列”是杂交阵列原件有序排列在基质上,所述杂交阵列原件诸如聚核苷酸探针(例如寡核苷酸)或结合剂(例如抗体)。所述基质可以是固体基质,例如,玻璃或二氧化硅玻片、珠、纤维光学粘结剂或半固态基质,例如硝酸纤维素膜。核苷酸序列可以是DNA、RNA或其中的任何排列。
“探针”指短至几个到长达数百碱基的核酸片段如RNA或DNA,所述核酸片段可以与mRNA建立特异性结合并且可以因维持标记(Labeling)作用而确定特定mRNA的存在。探针可以按寡核苷酸探针、单链DNA(singlestrandedDNA)探针、双链DNA(doublestrandedDNA)探针和RNA探针等形式制备。在本发明中,可以通过使用本发明的标记多核苷酸及互补探针实施杂交,借助是否杂交来预测肺腺癌预后。可以基于本领域已知内容修改对探针和杂交条件的恰当选择。
“杂交”或“核酸杂交”或“杂交”通常指两个具有互补碱基序列,在适当条件下将形成热力学上稳定的双链结构的单链核酸分子的杂交。如本文所用的术语“杂交”可指在严格或非严格条件下的杂交。条件的设置在本领域技术人员的技术范围内,可根据本领域中说明的实验方案确定。
本发明中的示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。
本发明提供了一种试剂盒,所述试剂盒包括检测AC093110.3基因的试剂,选自下组的一种或多种物质:容器、使用说明书、阳性对照物、阴性对照物、缓冲剂、助剂或溶剂。
本发明的试剂盒中还可附有试剂盒的使用说明书,其中记载了如何采用试剂盒进行检测,和如何利用检测结果对肿瘤发展进行判断、对治疗方案进行选择。
试剂盒的组分可以以水介质的形式或以冻干的形式来包装。试剂盒中适当的容器通常至少包括一种小瓶、试管、长颈瓶、宝特瓶、针筒或其它容器,其中可放置一种组分,并且优选地,可进行适当地等分。在试剂盒中存在多于一种的组分时,试剂盒中通常也将包含第二、第三或其它附加的容器,其中分离地放置附加的组分。然而,不同组合的组分可被包含在一个小瓶中。本发明的试剂盒通常也将包括一种用于容纳反应物的容器,密封以用于商业销售。这种容器可包括注模或吹模的塑料容器,其中可保留所需的小瓶。
在一个优选的实施方案中,检测AC093110.3基因的试剂包括一对特异性引物。
更为优选的,引物序列如SEQ ID NO.1~2所示。
本发明提供了一种核酸膜条,所述核酸膜条可用于检测AC093110.3的表达;所述核酸膜条包括特异性识别AC093110.3的探针。
作为一种优选的实施方案,核酸膜条还包括固定AC093110.3的探针的基底,所述基底可以是任何适于固定寡核苷酸探针的基底,例如尼龙膜、硝酸纤维素膜、聚丙烯膜、玻璃片、硅胶晶片、微缩磁珠等。
预测计算模型
正如熟练技术人员会领会的,可以以不同方式实施和实现将标志物水平与某种可能性或风险关联起来的步骤。优选地,在数学上组合蛋白质和一种或多种其它标志物的测定浓度,并将组合值与根本的诊断问题关联起来。可以通过任何适宜的现有技术数学方法将标志物值的测定组合。
优选地,在标志物组合中应用的数学算法是一种对数函数。优选地,应用此类数学算法或此类对数函数的结果是单一值。根据根本的诊断问题,能容易地将此类值与例如个体关于肺腺癌的风险或与有助于评估肺腺癌患者的其它有意诊断用途关联起来。以一种优选的方式,此类对数函数是如下获得的:a)将个体分类入组,例如正常人、有肺腺癌风险的个体、具有肺腺癌的患者等等,b)通过单变量分析来鉴定在这些组之间差异显著的标志物,c)对数回归分析以评估标志物的可用于评估这些不同组的独立差别值,并d)构建对数函数来组合独立差别值。在这种类型的分析中,标志物不再是独立的,而是代表一个标志物组合。
用于将标志物组合与疾病关联起来的对数函数优选采用通过应用统计方法开发和获得的算法。例如,适宜的统计方法是判别分析(DA)(即线性、二次、规则DA)、Kernel方法(即SVM)、非参数方法(即k-最近邻居分类器)、PLS(部分最小二乘)、基于树的方法(即逻辑回归、CART、随机森林方法、助推/装袋方法)、广义线性模型(即对数回归)、基于主分量的方法(即SIMCA)、广义叠加模型、基于模糊逻辑的方法、基于神经网络和遗传算法的方法。熟练技术人员在选择适宜的统计方法来评估本发明的标志物组合并由此获得适宜的数学算法方面不会有问题。在一个实施方案中,用于获得评估肺腺癌中使用的数学算法的统计方法选自DA(即线性、二次、规则判别分析)、Kernel方法(即SVM)、非参数方法(即k-最近邻居分类器)、PLS(部分最小二乘)、基于树的方法(即逻辑回归、CART、随机森林方法、助推方法)、或广义线性模型(即对数回归)。
统计学分析
在本发明的具体实施例中,实验都是按照至少重复3次来完成的,结果数据都是以平均值±标准差的方式来表示,采用SPSS18.0统计软件来进行统计分析的,两者之间的差异采用t检验,认为当P<0.05时具有统计学意义。
下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1筛选与肺腺癌相关的基因标志物
1、样品收集
收集35例肺腺癌组织以及相应的癌旁组织,全部患者在手术前均未接受其他治疗,从中任选4例肺腺癌组织及相应的癌旁组织进行高通量测序。
2、RNA样品的制备及定量分析
利用QIAGEN的组织RNA提取试剂盒进行组织RNA的提取,具体操作按说明书进行。
将上述提取的RNA进行琼脂糖凝胶电泳,利用Nanodrop2000对所提RNA的浓度和纯度进行检测,琼脂糖凝胶电泳检测RNA完整性,Agilent2100测定RIN值。单次建库要求RNA总量5μg,浓度≥200ng/μL,OD260/280介于1.8~2.2之间。
3、构建cDNA文库及测序
cDNA文库的构建及测序由华大基因完成,步骤如下:
1)去除rRNA
使用Ribo-Zero试剂盒除去总RNA中的核糖体RNA;
2)片段化RNA
对完整的RNA序列,利用金属离子进行随机打断,将RNA随机断裂成200bp左右的小片段。
3)反转合成cDNA
利用Illumina的TruseqTM RNA sample Prep Kit进行cDNA文库的构建,在逆转录酶的作用下,利用随机引物,以lncRNA为模板反转合成一链cDNA,进行二链合成时,dNTPs试剂中用dUTP代替dTTP,使cDNA第二链中碱基包含A/U/C/G。
4)连接adaptor
加入End Repair Mix将双链cDNA的粘性末端补成平末端,随后在3’末端加上一个A碱基,用于连接Y字形的接头。
5)UNG酶消化cDNA二链
用UNG酶将cDNA第二链消化,从而使文库中仅包含cDNA第一链。
6)使用Illumina X-Ten测序平台,进行2*150bp测序。
4、高通量转录组测序数据分析
删除不易检测到的lncRNA(即该lncRNA的read count值在case中为0的样本数大于总的case样本量的20%或该lncRNA的read count值在normal中为0的样本数大于总的normal样本量的20%)后,使用R-3.3.3工具的DESeq2进行差异表达分析,差异表达lncRNA筛选标准:FDR<0.05,abs(log2FC)>2。
5、结果
测序分析结果显示,与癌旁组织相比,AC093110.3在肺腺癌组织中的表达水平显著下调。
实施例2 QPCR测序验证AC093110.3基因的差异表达
1、对收集的35例组织样本进行AC093110.3基因差异表达的验证。
2、RNA提取
利用QIAGEN的组织RNA提取试剂盒提取RNA样品,具体操作详见说明书。
3、QPCR
1)逆转录反应
采用天根公司的FastQμant cDNA第一链合成试剂盒(货号:KR106)进行lncRNA反转录,首先去除基因组DNA反应,在试管中加入5×gDNA Bμffer 2.0μl,总RNA 1μg,加RnaseFree ddH2O使总体积至10μl,水浴锅中42℃加热3min.
将10×Fast RT Bμffer 2.0μl,RT Enzyme Mix 1.0μl,FQ-RT Primer Mix 2.0μl,RNase Free ddH2O 5.0μl,混合后加入上述试管中一起混合共20μl,水浴锅中42℃加热15min,95℃加热3min。
2)引物设计
根据Genebank中AC093110.3基因和GAPDH基因的编码序列设计QPCR扩增引物,由博迈德生物公司合成。具体引物序列如下:
AC093110.3基因:
正向引物为5’-TGAGGAGGAAGTATGAGT-3’(SEQ ID NO.1);
反向引物为5’-ATGTGTCAGTGGAATCAG-3’(SEQ ID NO.2)。
GAPDH基因:
正向引物为5’-AATCCCATCACCATCTTCCAG-3’(SEQ ID NO.3);
反向引物为5’-GAGCCCCAGCCTTCTCCAT-3’(SEQ ID NO.4)。
3)QPCR扩增检验
用SuperReal PreMix Plus(SYBR Green)(货号:FP205),进行扩增,实验操作按产品说明书进行。
采用20μl反应体系:2×SuperReal PreMix Plus 10μl,正反向引物(10μM)各0.6μl,5×ROX Reference Dye△2μl,DNA模板2μl,灭菌蒸馏水4.8μl。每个样本设置3个平行管,所有扩增反应均重复三次以上以保证结果的可靠性。
扩增程序为:95°15min,(95℃10s,55℃30s,72℃32s)×40个循环,95℃15s,60℃60s,95℃15s)。
4)cDNA模板浓度的筛选
将各样本cDNA混合后,以此为模板进行10倍梯度(10、100、1000、10000、100000倍)稀释,稀释后样品各取2μl作模板,分别用目的基因引物和内参基因引物进行扩增,同时在60-95℃进行融解曲线分析,根据扩增效率高和溶解曲线单峰原则进行模板浓度的筛选。
根据溶解曲线,可以看出,当cDNA的进行10倍稀释时,PCR的扩增效率较高,溶解曲线单峰比较好。
5)样品RealTime PCR检测
将各样品cDNA 10倍稀释后取2μl作模板,分别用目的基因引物和内参基因引物进行扩增。同时在60-95℃进行溶解曲线分析,通过融解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
4、结果
QPCR结果如图1所示,与癌旁组织相比,AC093110.3在肺腺癌组织中表达下调,下调约10倍,差异具有统计学意义(P<0.05),提示AC093110.3可作为检测指标应用于肺腺癌的辅助诊断。
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 肺腺癌相关基因AC093110.3及其应用
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tgaggaggaa gtatgagt 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgtgtcagt ggaatcag 18
<210> 3
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aatcccatca ccatcttcca g 21
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gagccccagc cttctccat 19