CN113593648A - 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统 - Google Patents

基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统 Download PDF

Info

Publication number
CN113593648A
CN113593648A CN202110846048.4A CN202110846048A CN113593648A CN 113593648 A CN113593648 A CN 113593648A CN 202110846048 A CN202110846048 A CN 202110846048A CN 113593648 A CN113593648 A CN 113593648A
Authority
CN
China
Prior art keywords
lncrna
autophagy
breast cancer
information
prognosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110846048.4A
Other languages
English (en)
Inventor
张如月
朱卿文
杨田硕
郭金秀
张待娣
张佳丽
杨哲
郭金牛
于嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN202110846048.4A priority Critical patent/CN113593648A/zh
Publication of CN113593648A publication Critical patent/CN113593648A/zh
Priority to LU502513A priority patent/LU502513B1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统,其中,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法用于乳腺癌的预后,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法包括:根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息;对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型;基于所述与自噬相关的lncRNA预后模型进行预后。本发明的基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统能够对乳腺癌样本的预后进行较为精准的判定。

Description

基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统
技术领域
本发明是关于生物医学检测技术领域,特别是关于一种基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统。
背景技术
乳腺癌是世界上最常见的恶性肿瘤,也是女性癌症相关死亡的主要原因,发病率和死亡率分别为24.2%和15.0%。目前乳腺癌的治疗选择通常是将手术与各种辅助治疗相结合,如化疗、放射治疗、内分泌治疗、靶向治疗和免疫治疗。大多数患者在一段时间内对初步治疗有反应,但仍有一些乳腺癌,特别是三阴性乳腺癌,会发展成更具侵袭性的肿瘤形式,导致预后较差。
为了能够对乳腺癌样本进行预后,现有技术中通常侧重研究单一生物标志物在乳腺癌中的作用机制及临床价值,发明人发现乳腺癌具有很强的异质性,而现有的基于自噬相关lncRNA模型的乳腺癌预后评估方法对于乳腺癌样本的预后结果不够准确,会有较大偏差。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统,其能够对乳腺癌样本的预后进行较为精准的判定。
为实现上述目的,本发明提供了一种基于自噬相关lncRNA模型的乳腺癌预后评估方法,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法用于乳腺癌的预后,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法包括:根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息;对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型;基于所述与自噬相关的lncRNA预后模型进行预后。
在本发明的一实施方式中,所述根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息包括:提取多个乳腺癌样本的RNA信息以及临床信息,并且提取多个正常乳腺样本的RNA信息;从所述多个乳腺癌样本的所述RNA信息中提取出各个lncRNA信息以及与人类自噬基因相关的各个mRNA信息,并且从所述多个正常乳腺样本的RNA信息中提取出各个lncRNA信息,并且对所述多个乳腺癌样本的lncRNA信息以及所述多个正常乳腺样本的各个lncRNA信息进行差异化分析,将差异表达值在预设范围的各个lncRNA信息进行提取;分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取;将提取出的所述相关性符合预设条件的所有lncRNA与GSE20685数据集中的所有lncRNA进行对比,将所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行提取;对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析,从中提取出与预后相关的所有lncRNA及其对应的显著性水平值;对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析,从中提取出与预后相关的所有lncRNA,其中,所述与预后相关的所有lncRNA的显著性水平值小于预设阈值,所述与预后相关的所有lncRNA为所述与自噬相关的lncRNA信息。
在本发明的一实施方式中,提取多个乳腺癌样本的RNA信息以及临床信息包括:从TCGA数据库中提取多个乳腺癌样本的RNA信息以及临床信息作为所述lncRNA预后模型的训练数据。
在本发明的一实施方式中,分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取包括:采用皮尔逊相关性分析法分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性;将皮尔逊相关性分析结果中的相关系数的平方大于第一阈值且显著性水平小于第二阈值的lncRNA提取出来。
在本发明的一实施方式中,对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析包括:采用单因素cox回归分析法对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析;对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析包括:采用多因素cox风险回归分析法对所述与预后相关的所有lncRNA以及所述多个乳腺癌样本的临床数据进行分析。
在本发明的一实施方式中,所述与自噬相关的lncRNA预后模型中包括3个与乳腺癌预后相关的lncRNA,分别为USP30-AS1、MIR205HG以及LINC01087。
在本发明的一实施方式中,所述与自噬相关的lncRNA预后模型为:
预后评分Z=(-0.360×USP30-AS1)+(-0.144×MIR205HG)+(-0.120×LINC01087)。
基于同样的发明构思,本发明还提供了一种基于自噬相关lncRNA模型的乳腺癌预后评估系统,所述基于自噬相关lncRNA模型的乳腺癌预后评估系统用于乳腺癌的预后,所述基于自噬相关lncRNA模型的乳腺癌预后评估系统包括:与自噬相关的lncRNA确定模块、预后模型建立模块以及预后模块。与自噬相关的lncRNA确定模块用于根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息;预后模型建立模块与所述与自噬相关的lncRNA确定模块相耦合,用于对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型;预后模块与所述预后模型建立模块相耦合,用于基于所述与自噬相关的lncRNA预后模型进行预后。
基于同样的发明构思,本发明还提供了一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如上述任意一项实施方式所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
基于同样的发明构思,本发明还提供了一种电子设备,其包括:至少一个处理器以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任意一项实施方式所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
与现有技术相比,根据本发明的基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统,考虑到lncRNA和自噬在乳腺癌生物学中的重要意义,确定了一个与自噬相关的lncRNA模型来预测乳腺癌样本的预后,为乳腺癌的诊断和治疗提供理论依据,能够对乳腺癌样本的预后进行较为精准的判定,优选地,通过对自噬相关的lncRNA进行更加准确地提取,并在内外部数据库进行验证,能够使得可以所选择出的与自噬相关的lncRNA能够反应大部分乳腺癌样本的情况,使得最终的预后模型具有普适性,使得更多的患者受益,并且能够进一步提高乳腺癌的预后准确性。
附图说明
图1是根据本发明一实施方式的基于自噬相关lncRNA模型的乳腺癌预后评估方法的步骤组成;
图2是根据本发明一实施方式的与自噬相关的lncRNA信息提取步骤;
图3是根据本发明一实施方式的lncRNA的差异表达分布火山图;
图4是根据本发明一实施方式的单变量cox回归分析得到的5个lncRNA的相关信息;
图5是根据本发明一实施方式的多变量cox回归分析得到的3个lncRNA的相关信息;
图6是根据本发明一实施方式的TCGA训练组中的乳腺癌样本的Kaplan-Meier生存分析曲线;
图7是根据本发明一实施方式的TCGA训练组中的乳腺癌样本的ROC曲线;
图8是根据本发明一实施方式的TCGA训练组中的乳腺癌样本的预后特征的风险评分、乳腺癌样本的生存状态和表达热图;
图9是根据本发明一实施方式的GSE20685验证组中的乳腺癌样本的Kaplan-Meier生存分析曲线;
图10是根据本发明一实施方式的GSE20685验证组中的乳腺癌样本的ROC曲线;
图11是根据本发明一实施方式的GSE20685验证组中的乳腺癌样本的预后特征的风险评分、乳腺癌样本的生存状态和表达热图;
图12是根据本发明一实施方式的TCGA训练组的单因素和多因素Cox回归分析结果;
图13是根据本发明一实施方式的GSE20685验证组的单因素和多因素Cox回归分析结果;
图14是根据本发明一实施方式的基因集富集分析结果;
图15是根据本发明一实施方式的基于自噬相关lncRNA模型的乳腺癌预后评估系统的模块组成。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
为了克服现有的基于自噬相关lncRNA模型的乳腺癌预后评估方法的判定不够准确的问题,发明人进行如下思考和研究,乳腺癌具有很强的异质性,多参数信号在预测乳腺癌预后方面比单一生物标志物更有价值,并且还发现自噬与肿瘤的发生、发展和转移密切相关。其中,LncRNA是一种长度超过200bp的不能编码蛋白质的小RNA,虽然它们不能被翻译成蛋白质,但它们参与了蛋白质翻译的过程,LncRNA通过调节各种自噬相关DNA、RNA或蛋白质的生物学效应,在复杂的自噬调控网络中起着关键作用。例如,西罗莫司和三氧化二砷等自噬药物可以诱导肿瘤细胞自噬,并改善某些癌症患者的预后,但只有少数患者从基于自噬的治疗中受益。
因此,基于上述思考和研究,本发明提供了一种预后策略,通过整合与乳腺癌预后密切相关的多个自噬lncRNAs,并进行建模,从而对乳腺癌样本预后进行精准判定,以便选择最佳治疗方案来提高患者生存率。
图1是根据本发明一实施方式的基于自噬相关lncRNA模型的乳腺癌预后评估方法,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法用于乳腺癌的预后,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法包括:步骤S1~步骤S3。
在步骤S1中根据多个乳腺癌样本的RNA(核糖核酸分子)信息确认出与自噬相关的lncRNA(长链非编码核糖核酸分子)信息。
在步骤S2中对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型。
在步骤S3中基于所述与自噬相关的lncRNA预后模型进行预后。
由此,本实施方式中考虑到lncRNA和自噬在乳腺癌生物学中的重要意义,确定了一个与自噬相关的lncRNA模型来预测乳腺癌样本的预后,为乳腺癌的诊断和治疗提供理论依据,相较于现有技术,预后结果更加准确。
为了能够更加准确地提取出乳腺癌样本的与自噬相关的lncRNA,在本发明的一优选实施方式中,步骤S1具体包括:步骤S101~步骤S105,如图2所示。
在步骤S101中,提取多个乳腺癌样本的RNA信息以及临床信息,并且提取多个正常乳腺样本的RNA信息。可选地,从TCGA数据库(癌症基因组图谱数据库)中提取多个乳腺癌样本的RNA信息以及临床信息作为所预后模型的训练数据。其中,临床信息可以包括年龄、性别、临床分期和TNM等数据。预后模型的验证数据可以从外部数据库GEO数据库中的GSE20685数据集中选择。其中,TNM是肿瘤学中对肿瘤的一种分期形式,T是原发灶,N是淋巴结,M是远处转移。
在步骤S102中,从所述多个乳腺癌样本的所述RNA信息中提取出各个lncRNA信息以及与人类自噬基因相关的各个mRNA信息,并且从所述多个正常乳腺样本的RNA信息中提取出各个lncRNA信息,并且对所述多个乳腺癌样本的lncRNA信息以及所述多个正常乳腺样本的各个lncRNA信息进行差异化分析,将差异表达值在预设范围的各个lncRNA信息进行提取。
具体而言,在提取所述自噬基因相关的mRNA信息时,首先根据GENCODE(基因代码)提供的注释,从人类自噬数据中提取自噬基因,并提取乳腺癌的RNA中与自噬基因相关的各个mRNA。另外,在进行差异化分析时,可以采用DESeq2工具来筛选出在乳腺癌样本和正常乳腺样本中差异表达值在预设范围的各个lncRNA,其中,可以通过将参数设置为log2(差异倍数)>0.5,p<0.05的条件,从而得到差异表达值在预设范围的各个lncRNA。将经过差异化分析筛选方式选出的lncRNA用于后续步骤中,进行相关性分析,从而提取出更加准确的与自噬相关的lncRNA,有助于提高最终模型预后的准确性。
在步骤S103中,分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取。可选地,可以采用皮尔逊相关性分析法分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性;将皮尔逊相关性分析结果中的相关系数R的平方大于第一阈值以及显著性水平P1小于第二阈值的lncRNA提取出来。其中,第一阈值可以设置为0.4及以上,第二阈值可以设置为0.05及以下。该步骤S103中提取出来的lncRNA为初选的与自噬相关的lncRNA。
在步骤S104中,将提取出的所述相关性符合预设条件的所有lncRNA与GSE20685(乳腺癌基因芯片数据库)数据集中的所有lncRNA进行对比,将所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行提取。其中,对提取的所有lncRNA通过log2转换进行了归一化处理。该步骤S104中将初选的与自噬相关的lncRNA与所述GSE20685数据集中的lncRNA求取了交集,能够使得可以所选择出的与自噬相关的lncRNA能够反应大部分乳腺癌样本的情况,使得最终的预后模型具有普适性,使得更多的患者受益。
在步骤S105中,对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析,从中提取出与预后相关的所有lncRNA,其中,所述与预后相关的所有lncRNA的显著性水平值P2小于预设阈值,所述与预后相关的所有lncRNA为所述与自噬相关的lncRNA信息及其对应的显著性水平值P2。可选地,可以采用单因素cox回归分析法对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析。可选地,预设阈值可以设置为0.05及以下。在步骤S105中对步骤S104中选择出的lncRNA进一步进行了筛选,选出了更加准确与预后相关的所有lncRNA,可以进一步提高预后模型的准确性。
综上,在该可选的实施方式中,可以更加准确地提取出乳腺癌样本的与自噬相关的lncRNA,进一步提高乳腺癌的预后准确性以及普适性。
为了能够建立更准确的预后模型,在本发明的一实施方式,在步骤S2中对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型包括:采用逐步多因素cox比例风险回归分析法对所述与预后相关的所有lncRNA以及所述多个乳腺癌样本的临床数据进行分析。其中,为了避免过拟合,采用Akaike信息准则(AIC)得到最优模型,其中,模型风险评分=βlncRNA1×exprlncRNA1+βlncRNA2×exprlncRNA2+...+βlncRNAn×exprlncRNAn。β为相应lncRNA的回归系数,expr为lncRNA的表达水平,单位为FPKM,计算乳腺癌样本的风险分数。其中,得到的最优模型为与自噬相关的lncRNA预后模型。基于该最优模型进行预后具有准确性以及普适性。另外还需要说明的一点是,在进行预后时,也可以基于模型中的自噬相关的lncRNA,构建诺模图,将诺模图中的点分配给多变量Cox分析模型中的每个变量。通过在总点轴和每个预测轴之间绘制一条垂直线,可以计算出乳腺癌样本未来若干年的估计存活率,这可以帮助专业人员为乳腺癌样本做出临床决策。
为了能够验证本发明的效果,在一实施方式中,整体的预后过程如下。首先,根据上述步骤101,在TCGA数据库中提取了1109例乳腺癌样本和113例正常乳腺样本的RNA信息及1109例乳腺癌样本的相关临床信息(年龄、性别、临床分期和TNM分期等信息)作训练组来构建预后模型,为了验证模型的预测能力和普遍适用性,本实施方式中使用了外部数据库GEO数据库中GSE20685数据集作为验证组,其中验证组中含有327名乳腺癌样本;并根据上述步骤S102从1109例乳腺癌样本和113例正常乳腺样本的RNA信息中的每例均提取了19658个mRNA和14142个lncRNA。根据log2(差异倍数)>0.5,p<0.05的条件利用“DESeq2”工具包筛选出在乳腺癌样本和正常乳腺样本中7903个差异表达的lncRNAs,其中在乳腺癌组织中高表达的lncRNA有6065个,低表达的有1838个,图3为本实施方式的lncRNA的差异表达分布图。根据人类自噬数据库中的222个自噬基因,从上述乳腺癌样本的mRNA中提取出了210个自噬mRNA;然后根据上述步骤S103采用皮尔逊分析法提取出197个与自噬基因相关且皮尔逊相关性分析结果中的相关系数R的平方大于>0.4以及显著性水平P<0.05的差异lncRNAs;然后根据上述步骤S104从197个自噬相关lncRNA和GSE20685中的1146个的lncRNA中得到了26个共有lncRNA用来做后续分析;然后根据上述步骤S105通过使用单变量cox回归分析,从训练数据集中的26个自噬相关lncRNA中识别出5个与患者OS密切相关的lncRNA,其中,P值小于0.05,如图4所示为该5个lncRNA对应的风险比(hazard ratio)信息;然后根据步骤S2将5个候选lncRNA进行逐步多变量cox比例风险回归分析,为了避免过拟合,采用Akaike信息准则得到最优模型;最后在步骤S3中根据最优模型进行预后。其中,该最优模型为3个与自噬相关的lncRNA的模型,如图5所示为该3个lncRNA对应的风险比(hazard ratio)信息。表1时该预后模型中的3个lncRNA的详细信息。
表1
Figure BDA0003180798440000101
预后模型风险评分式子如下。预后评分Z=(-0.360×USP30-AS1)+(-0.144×MIR205HG)+(-0.120×LINC01087)。该预后模型中只有3个与自噬相关的lncRNA,不仅减少了检测成本以及提高检测效率,更能帮助患者从自噬治疗中受益,为乳腺癌的诊断和治疗提供理论依据。
为了进一步评估模型对乳腺癌预后的预测能力,本实施方式中依据风险评分公式计算每位患者的风险评分,将患者按风险评分的中位值分为高风险组和低风险组。并且还对TCGA训练组中的乳腺癌样本进行了Kaplan-Meier生存分析和ROC曲线(受试者工作特征曲线)分析。分析结果分别如图6和图7所示,图6表明高危组乳腺癌样本的OS(总生存期)低于低危组。图7表明签名的风险评分在ROC曲线下面积AUC为0.841,表明具有可信的诊断价值。低危组和高危组预后特征的风险评分、乳腺癌样本的生存状态和表达热图如图8所示。为了评估预后特征在乳腺癌样本OS预测中的可靠性,在GSE20685数据集进行了相同的分析,结果显示高危评分患者的OS也低于低风险评分者,生存分析曲线如图9所示。且ROC曲线的AUC值为0.811,如图10所示,具有可信的诊断价值。低危组和高危组预后特征的风险评分、乳腺癌样本的生存状态和表达热图如图11所示。这个分析结果是与训练集一致。最后,单因素和多因素Cox回归分析结果表明无论是训练数据集还是测试数据集,该模型的风险评分可以排除临床特征(性别、年龄、临床分期和TNM分期)的影响,可以显著预测乳腺癌样本的预后,图12是根据本发明一实施方式的TCGA训练组的单因素和多因素Cox回归分析结果;图13是根据本发明一实施方式的GSE20685验证组的单因素和多因素回归分析结果;在图12和图13中,A代表单因素Cox回归分析结果,B代表多因素Cox回归分析结果。以上结果证实该模型可以被视为一个独立的预测因子去预测乳腺癌样本的预后。此外,本实施方式中还通过确定lncRNA与乳腺癌样本的临床特征(年龄、性别、临床分期和TNM分期)之间的相关性,进一步评估了该模型在乳腺癌样本中的临床价值。结果表明,年龄较大的患者的风险评分趋于显著增加,提示高龄、晚期和淋巴转移可能与乳腺癌的进展有关,如表2所示。
表2
Figure BDA0003180798440000111
为了进一步探索该预后模型在乳腺癌样本中的潜在生物学行为,本实施方式中还采用基因集富集分析方法确定了总共11个基因组,这些基因组的标称P值<0.05和FDR(假阳率)q值<0.25。结果表明,高危组和低危组之间差异表达的基因在癌症相关和自噬相关通路中富集。其中Wnt、TGF(转化生长因子)β等致癌通路在高危组中显着富集,而且还发现葡萄糖代谢途径在高危组是显着的,例如糖酵解/糖异生途径、TCA循环途径。值得注意的是,TGF-b信号通路和糖代谢通路与自噬密切相关,如图14所示,GSEA的结果揭示了这些自噬相关基因有助于致癌激活通路和自噬相关通路,这可能为靶向治疗乳腺癌提供足够的证据。
基于同样的发明构思,一实施方式还提供了一种基于自噬相关lncRNA模型的乳腺癌预后评估系统。如图15所示,所述基于自噬相关lncRNA模型的乳腺癌预后评估系统包括:与自噬相关的lncRNA确定模块10、预后模型建立模块11、预后模块12。与自噬相关的lncRNA确定模块10用于根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息。
预后模型建立模块11与所述与自噬相关的lncRNA确定模块10相耦合,用于对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型。
预后模块12与所述预后模型建立模块11相耦合,用于基于所述与自噬相关的lncRNA预后模型进行预后。
由此,本实施方式中考虑到lncRNA和自噬在乳腺癌生物学中的重要意义,确定了一个与自噬相关的lncRNA模型来预测乳腺癌样本的预后,为乳腺癌的诊断和治疗提供理论依据,相较于现有技术,预后结果更加准确。
为了能够更加准确地提取出乳腺癌样本的与自噬相关的lncRNA,在本发明的一优选实施方式中,所述与自噬相关的lncRNA确定模块10具体用于提取多个乳腺癌样本的RNA信息以及临床信息,并且提取多个正常乳腺样本的RNA信息;从所述多个乳腺癌样本的所述RNA信息中提取出各个lncRNA信息以及与人类自噬基因相关的各个mRNA信息,并且从所述多个正常乳腺样本的RNA信息中提取出各个lncRNA信息,并且对所述多个乳腺癌样本的lncRNA信息以及所述多个正常乳腺样本的各个lncRNA信息进行差异化分析,将差异表达值在预设范围的各个lncRNA信息进行提取;分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取;将提取出的所述相关性符合预设条件的所有lncRNA与GSE20685数据集中的所有lncRNA进行对比,将所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行提取;对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析,从中提取出与预后相关的所有lncRNA及其对应的显著性水平值;对所述与预后相关的所有lncRNA进行提取,其中,提取出的所述与预后相关的所有lncRNA为所述与自噬相关的lncRNA信息。由此,在该可选的实施方式中,可以更加准确地提取出乳腺癌样本的与自噬相关的lncRNA,进一步提高乳腺癌的预后准确性以及普适性。
还需说明的一点是,前述实施例中的基于自噬相关lncRNA模型的乳腺癌预后评估方法的各种变化方式和具体实例同样适用于本实施例的基于自噬相关lncRNA模型的乳腺癌预后评估系统,通过前述对基于自噬相关lncRNA模型的乳腺癌预后评估方法的详细描述,本领域技术人员可以清楚知道本实施例中基于自噬相关lncRNA模型的乳腺癌预后评估系统的实施方法,所以为了说明书的简洁,此处不再赘述。
基于同样的发明构思,一实施方式还提供了一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行上述任意一项实施方式所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
基于同样的发明构思,一实施方式还提供了一种电子设备,所述电子设备包括:至少一个处理器以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任意一项实施方式所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (10)

1.一种基于自噬相关lncRNA模型的乳腺癌预后评估方法,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法用于乳腺癌的预后,其特征在于,所述基于自噬相关lncRNA模型的乳腺癌预后评估方法包括:
根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息;
对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床信息进行分析,建立与自噬相关的lncRNA预后模型;
基于所述与自噬相关的lncRNA预后模型进行预后。
2.如权利要求1所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,所述根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息包括:
提取多个乳腺癌样本的RNA信息以及临床信息,并且提取多个正常乳腺样本的RNA信息;
从所述多个乳腺癌样本的所述RNA信息中提取出各个lncRNA信息以及与人类自噬基因相关的各个mRNA信息,并且从所述多个正常乳腺样本的RNA信息中提取出各个lncRNA信息,并且对所述多个乳腺癌样本的lncRNA信息以及所述多个正常乳腺样本的各个lncRNA信息进行差异化分析,将差异表达值在预设范围的各个lncRNA信息进行提取;
分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取;
将提取出的所述相关性符合预设条件的所有lncRNA与GSE20685数据集中的所有lncRNA进行对比,将所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行提取;
对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析,从中提取出与预后相关的所有lncRNA,其中,所述与预后相关的所有lncRNA的显著性水平值小于预设阈值,所述与预后相关的所有lncRNA为所述与自噬相关的lncRNA信息。
3.如权利要求2所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,提取多个乳腺癌样本的RNA信息以及临床信息包括:
从TCGA数据库中提取多个乳腺癌样本的RNA信息以及临床信息作为所述lncRNA预后模型的训练数据。
4.如权利要求2所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性,将所述相关性符合预设条件的所有lncRNA进行提取包括:
采用皮尔逊相关性分析法分析所述差异表达值在预设范围的各个lncRNA信息与所述与人类自噬基因相关的各个mRNA信息的相关性;
将皮尔逊相关性分析结果中的相关系数的平方大于第一阈值且显著性水平小于第二阈值的lncRNA提取出来。
5.如权利要求2所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,
对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析包括:采用单因素cox回归分析法对所述相关性符合预设条件且存在于所述GSE20685数据集中的lncRNA进行分析;
对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析包括:采用逐步多因素cox比例风险回归分析法对所述与预后相关的所有lncRNA以及所述多个乳腺癌样本的临床数据进行分析。
6.如权利要求1所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,所述与自噬相关的lncRNA预后模型中包括3个与乳腺癌预后相关的lncRNA,分别为USP30-AS1、MIR205HG以及LINC01087。
7.如权利要求1所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法,其特征在于,所述与自噬相关的lncRNA预后模型为:
预后评分Z=(-0.360×USP30-AS1)+(-0.144×MIR205HG)+(-0.120×LINC01087)。
8.一种基于自噬相关lncRNA模型的乳腺癌预后评估系统,所述基于自噬相关lncRNA模型的乳腺癌预后评估系统用于乳腺癌的预后,其特征在于,所述基于自噬相关lncRNA模型的乳腺癌预后评估系统包括:
与自噬相关的lncRNA确定模块,用于根据多个乳腺癌样本的RNA信息以及多个正常乳腺样本的RNA信息确认出与自噬相关的lncRNA信息;
预后模型建立模块,与所述与自噬相关的lncRNA确定模块相耦合,用于对所述与自噬相关的lncRNA信息以及所述多个乳腺癌样本的临床数据进行分析,建立与自噬相关的lncRNA预后模型;以及
预后模块,与所述预后模型建立模块相耦合,用于基于所述与自噬相关的lncRNA预后模型进行预后。
9.一种存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~7任意一项所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~7任意一项所述的基于自噬相关lncRNA模型的乳腺癌预后评估方法。
CN202110846048.4A 2021-07-26 2021-07-26 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统 Pending CN113593648A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110846048.4A CN113593648A (zh) 2021-07-26 2021-07-26 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统
LU502513A LU502513B1 (en) 2021-07-26 2022-07-15 Breast cancer prognosis evaluation method and system based on autophagy-related incrna model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110846048.4A CN113593648A (zh) 2021-07-26 2021-07-26 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统

Publications (1)

Publication Number Publication Date
CN113593648A true CN113593648A (zh) 2021-11-02

Family

ID=78250112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110846048.4A Pending CN113593648A (zh) 2021-07-26 2021-07-26 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统

Country Status (2)

Country Link
CN (1) CN113593648A (zh)
LU (1) LU502513B1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029854A (zh) * 2020-07-09 2020-12-04 南阳师范学院 一种预测结肠癌预后的标志物及其应用
CN112185546A (zh) * 2020-09-23 2021-01-05 山东大学第二医院 一种用于乳腺癌患者预后预测的模型及建立方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029854A (zh) * 2020-07-09 2020-12-04 南阳师范学院 一种预测结肠癌预后的标志物及其应用
CN112185546A (zh) * 2020-09-23 2021-01-05 山东大学第二医院 一种用于乳腺癌患者预后预测的模型及建立方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RUYUE ZHANG ET AL.: "Identification and validation of an autophagy-related lncRNA signature for patients with breast cancer", 《FRONTIERS IN ONCOLOGY》 *
XIAOYING LI ET AL.: "A novel autophagy-related lncRNA prognostic risk model for breast cancer", 《JOURNAL OF CELLULAR AND MOLECULAR MEDICINE》 *
ZHUOLUN SUN ET AL.: "An autophagy-related long non-coding RNA prognostic signature accurately predicts survival outcomes in bladder urothelial carcinoma patients", 《AGING (ALBANY NY)》 *

Also Published As

Publication number Publication date
LU502513B1 (en) 2023-01-16

Similar Documents

Publication Publication Date Title
Biswas et al. A clonal expression biomarker associates with lung cancer mortality
JP2021521536A (ja) 生体試料の多検体アッセイのための機械学習実装
WO2019178277A1 (en) Anomalous fragment detection and classification
CN109767810B (zh) 高通量测序数据分析方法及装置
JP2023156402A (ja) ターゲットシーケンシングのためのモデル
CA3133639A1 (en) Systems and methods for deriving and optimizing classifiers from multiple datasets
WO2020132544A1 (en) Anomalous fragment detection and classification
CN111575376A (zh) 一组用于评估肾透明细胞癌预后的联合基因组及其应用
CN110603597A (zh) 用于生物标记识别的系统和方法
CN113066585A (zh) 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法
AU2020215312A1 (en) Method of predicting survival rates for cancer patients
CN113421609A (zh) 一种基于lncRNA对的结肠癌预后预测模型及其构建方法
CN112831562A (zh) 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒
EP3743518A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
WO2018049506A1 (en) Mirna prostate cancer marker
US20170233828A1 (en) Glycosyltransferase gene expression profile to identify multiple cancer types and subtypes
He et al. Identification of a combined RNA prognostic signature in adenocarcinoma of the lung
CN112746108B (zh) 用于肿瘤预后分层评估的基因标志物、评估方法及应用
CN113593648A (zh) 基于自噬相关lncRNA模型的乳腺癌预后评估方法及系统
US20220301654A1 (en) Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids
JP7332695B2 (ja) 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定
Ma et al. Optimizing the Prognostic Model of Cervical Cancer Based on Artificial Intelligence Algorithm and Data Mining Technology
TWI834642B (zh) 異常片段偵測及分類
Wang Mixture Model Approaches To Integrative Analysis Of Multi-Omics Data And Spatially Correlated Genomic Data
Yao et al. Development and Validation of a RNA Binding Protein-Associated Prognostic Model for Uterine Corpus Endometrial Carcinoma

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination