CN113957145A - m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用 - Google Patents

m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用 Download PDF

Info

Publication number
CN113957145A
CN113957145A CN202111215141.1A CN202111215141A CN113957145A CN 113957145 A CN113957145 A CN 113957145A CN 202111215141 A CN202111215141 A CN 202111215141A CN 113957145 A CN113957145 A CN 113957145A
Authority
CN
China
Prior art keywords
lung cancer
cell lung
small cell
risk
lncrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111215141.1A
Other languages
English (en)
Other versions
CN113957145B (zh
Inventor
赫捷
孙楠
张志慧
张超奇
吴芃
张国超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital and Institute of CAMS and PUMC filed Critical Cancer Hospital and Institute of CAMS and PUMC
Priority to CN202111215141.1A priority Critical patent/CN113957145B/zh
Publication of CN113957145A publication Critical patent/CN113957145A/zh
Application granted granted Critical
Publication of CN113957145B publication Critical patent/CN113957145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用。本发明所要保护的一个技术方案是检测WARS2‑IT1、AC005162、AC130352、AC015971、FOXP1‑IT1、AC040963和LINC00355七种lncRNA的表达量的物质在制备预测小细胞肺癌患者预后的系统和/或化疗获益的系统中的应用。通过将所述七种lncRNA基因表达量数据进行处理得到待测患者的风险值,并计算确定风险值的阈值,根据所述阈值可判断待预测小细胞肺癌患者的预后和化疗获益情况。该发明可为未来化疗在SCLC患者中的临床应用提供参考依据,将有助于提高临床小细胞肺癌的治疗疗效。

Description

m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用
技术领域
本发明涉及生物医学领域,具体涉及m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用。
背景技术
小细胞肺癌(Small cell lung cancer,SCLC)是高致死性的高级别神经内分泌肿瘤,其特点在于肿瘤倍增时间短、生长迅速和早期转移扩散。SCLC约占肺癌的15%,患者五年生存率不足7%。尽管分子靶向药物、免疫检查点抑制剂等新的治疗措施不断发展,小细胞肺癌患者的治疗策略近几十年仍未有明显的突破,化疗仍然是小细胞肺癌患者不可替代的一线治疗方案。然而,大多数小细胞肺癌患者即使对化疗敏感,但治疗后快速产生耐药。且患者病情进展迅速,极易发生转移,治疗手段十分有限。因此,临床亟需精准筛选预测化疗获益及预后的标志物,以便提高患者治疗效果,提高患者的预后。
N6-甲基腺苷(N6-methyladenosine,m6A)是真核生物RNA中最丰富和最普遍的RNA修饰,是癌症生物学的重要组成部分。m6A相关的生物学过程是动态、多层面、可逆的过程,主要由甲基化酶、甲基转移酶和结合蛋白介导功能的发挥。该修饰方式可以调控多种RNA相关的生物学进程,包括RNA降解、稳定、翻译、剪切和运输,最终调节靶基因的表达。
长链非编码RNA(Long-coding RNAs,lncRNAs)是核苷酸长度长于200的RNA亚群。LncRNAs参与m6A调节的肿瘤的发生和发展。m6A和lncRNA都参与多项生物学进程,具有预测患者预后和治疗靶点的潜力,而二者之间相关性的研究少之又少。综上所述,鉴于小细胞肺癌的高度恶性、有限的治疗措施和较差的预后,识别并建立小细胞肺癌的预后预测和化疗获益预测标志物意义重大。
发明内容
本发明所要解决的技术问题是如何预测小细胞肺癌预后和/或化疗反应和/或确定小细胞肺癌的预后预测和/或化疗反应预测的标志物。
为了解决上述技术问题,本发明首先提供了检测WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355这七种lncRNA的表达量的物质在制备预测小细胞肺癌患者预后的系统和/或预测小细胞肺癌患者化疗获益的系统中的应用。
上文所述应用中,所述WARS2-IT1可为WARS2-IT1(Gene ID:104472716,updatedon 24-Jul-2021)。所述AC005162可为AC005162(GenBank:AC005162.1,updated on 31-JAN-2004)。所述AC130352可为AC130352(GenBank:AC130352.6,updated on 13-DEC-2002)。所述AC015971(GenBank:AC015971.4,updated on 16-APR-2005)。所述FOXP1-IT1可为FOXP1-IT1(Gene ID:100506815,updated on 24-Jul-2021)。所述AC040963可为AC040963(GenBank:AC040963.6,updated on Jun-26-2002)。所述LINC00355可为LINC00355(Gene ID:144766,updated on 16-Aug-2021)。
上文所述应用中,所述物质可包括检测所述七种lncRNA基因的表达量所需的试剂和/或仪器。
上文所述应用中,所述预测小细胞肺癌患者预后的系统可包括所述物质和lncRNA基因表达量数据处理模块。所述lncRNA基因表达量数据处理模块可用于将来自待预测小细胞肺癌患者的分离的小细胞肺癌组织中所述七种lncRNA基因的表达量转换为风险值,根据所述风险值预测所述待预测小细胞肺癌患者的预后。
上文所述应用中,所述预测小细胞肺癌患者化疗获益的系统也可包括所述物质和lncRNA基因表达量数据处理模块。所述lncRNA基因表达量数据处理模块用于将来自待预测小细胞肺癌患者的分离的小细胞肺癌组织中所述七种lncRNA基因的表达量转换为风险值,根据所述风险值预测所述待预测小细胞肺癌患者是否从化疗中获益。
上文所述应用中,所述lncRNA基因表达量数据处理模块可根据公式I得到所述风险值。
所述公式I可为:风险值=(0.5622×WARS2-IT1基因表达量)+(1.0842×AC005162基因表达量)+(1.1170×AC130352基因表达量)+(1.5938×AC015971基因表达量)-(0.6460×FOXP1-IT1基因表达量)-(0.0665×AC040963基因表达量)-(0.5835×LINC00355基因表达量)。
上文所述应用中,所述lncRNA基因表达量数据处理模块可利用R语言软件中的survminer软件包中的surv_cutpoint确定所述风险值的阈值。
为了解决上述技术问题,本发明还提供了七种lncRNA作为标志物在预测小细胞肺癌患者的预后中的应用。所述七种lncRNA可为WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355。
为了解决上述技术问题,本发明还提供了七种lncRNA作为标志物在预测小细胞肺癌患者的化疗获益中的应用。所述七种lncRNA可为WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355。
上文所述应用中,所述WARS2-IT1可为WARS2-IT1(Gene ID:104472716,updatedon 24-Jul-2021)。所述AC005162可为AC005162(GenBank:AC005162.1,updated on 31-JAN-2004)。所述AC130352可为AC130352(GenBank:AC130352.6,updated on 13-DEC-2002)。所述AC015971(GenBank:AC015971.4,updated on 16-APR-2005)。所述FOXP1-IT1可为FOXP1-IT1(Gene ID:100506815,updated on 24-Jul-2021)。所述AC040963可为AC040963(GenBank:AC040963.6,updated on Jun-26-2002)。所述LINC00355可为LINC00355(Gene ID:144766,updated on 16-Aug-2021)。
为了解决上述技术问题,本发明还提供了预测小细胞肺癌患者预后和/或预测小细胞肺癌患者化疗获益的装置。所述装置可包括用于获取WARS2-IT1基因、AC005162基因、AC130352基因、AC015971基因、FOXP1-IT1基因、AC040963基因和LINC00355基因这七种lncRNA基因的表达量的模块。
上文所述装置中,所述WARS2-IT1可为WARS2-IT1(Gene ID:104472716,updatedon 24-Jul-2021)。所述AC005162可为AC005162(GenBank:AC005162.1,updated on 31-JAN-2004)。所述AC130352可为AC130352(GenBank:AC130352.6,updated on 13-DEC-2002)。所述AC015971(GenBank:AC015971.4,updated on 16-APR-2005)。所述FOXP1-IT1可为FOXP1-IT1(Gene ID:100506815,updated on 24-Jul-2021)。所述AC040963可为AC040963(GenBank:AC040963.6,updated on Jun-26-2002)。所述LINC00355可为LINC00355(Gene ID:144766,updated on 16-Aug-2021)。
上文所述装置还可包括所述lncRNA基因表达量数据处理模块。所述lncRNA基因表达量数据处理模块可用于将来自待预测小细胞肺癌患者的分离的小细胞肺癌组织中所述八种lncRNA基因的表达量转换为风险值,根据所述风险值预测所述待预测小细胞肺癌患者的预后和/或是否从化疗中获益。
上文所述的预测小细胞肺癌患者预后的系统和/或预测小细胞肺癌患者化疗获益的系统也属于本发明的保护范围。
上文所述的小细胞肺癌组织可来自所述待预测小细胞肺癌患者的分离的小细胞肺癌组织经过福尔马林固定石蜡包埋制备的样本。
上文所述化疗可为辅助化疗。
上文所述七种lncRNA可均来自于人(Homo sapiens)。
本发明从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载GSE65002队列作为训练队列建立了基于SCLC中7个免疫相关lncRNA(包括WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355)的分子模型(风险值预测模型)来预测SCLC患者的化疗反应和预后风险。并在国家癌症中心收集158例小细胞肺癌患者福尔马林固定石蜡包埋的FFPE组织样本作为验证队列,用于模型验证。结果表明本发明建立的N6-甲基腺苷(m6A)相关lncRNA的风险值预测模型在对不同生存时间、不同临床亚组的小细胞肺癌患者的总生存期或无复发生存期的预后预测和化疗获益预测中均得到了很好的验证,预测能力都是最好的;7个免疫相关lncRNA可作为小细胞肺癌的预后预测和辅助化疗获益预测的标志物。该发明可为未来化疗在SCLC患者中的临床应用提供参考依据,可用于指导可进行化疗的患者,使不受益者免于化疗,避免过度治疗,将有助于提高临床小细胞肺癌的治疗疗效。
附图说明
图1为SCLC中最具预后意义的m6A相关lncRNA的筛选。(A)为基于GSE40275数据库中30个m6A调节元件的表达谱的SCLC和正常肺组织的主成分分析。(B)为来自GSE40275的30个m6A调节元件表达的热图。(C)为训练队列中m6A相关lncRNA与SCLC预后之间关联的森林图。
图2为训练队列中m6A相关lnRNA预测模型的构建。(A)为模型中m6A相关lncRNA的LASSO系数分布。横坐标为系数(B)为m6A相关lnRNA与风险值(Risk score)之间的相关性矩阵图。横坐标的颜色代表相关性的高低。(C)为训练队列中患者生存状态的风险值分布,上图为患者风险值,纵坐标为风险值,横坐标为不同的患者;中图为训练队列患者预后情况,纵坐标为生存时间,横坐标为不同的患者,深色点表示患者死亡,浅色点表示存活;下图为训练队列中七个m6A相关lncRNA的表达分布。(D)为训练队列患者的OS的Kaplan-Meier曲线。纵坐标为总生存率,横坐标为患者术后生存时间(月)。(E)为m6A相关lncRNA特征的ROC分析。
图3为预测模型在独立队列的验证和临床应用。(A)为独立队列中158名患者OS的Kaplan-Meier曲线。纵坐标为总生存率,横坐标为患者术后生存时间(月)(B)为独立队列中OS的风险值和多个临床特征的ROC分析。纵坐标为灵敏性,横坐标为1-特异性(C)独立队列中患者OS的风险值和不同临床参数的C指数分析。纵坐标为不同临床参数,横坐标为C指数值。(D)为独立队列中158名患者RFS的Kaplan-Meier曲线。纵坐标为无复发生存率,横坐标为患者术后生存时间(月)(E)为独立队列中RFS的风险值和多个临床特征的ROC分析。纵坐标为灵敏性,横坐标为1-特异性(F)为独立队列患者RFS的风险值和不同临床参数的C指数分析。纵坐标为不同临床参数,横坐标为C指数值。(G)为独立队列接受辅助化疗的亚组中OS的Kaplan-Meier曲线。纵坐标为无复发生存率,横坐标为患者术后生存时间(月)(H)为独立队列接受辅助化疗的亚组中OS的ROC分析。纵坐标为灵敏性,横坐标为1-特异性(I)为独立队列接受辅助化疗的亚组的OS的风险值和不同临床参数的C指数分析。纵坐标为不同临床参数,横坐标为C指数值。(J)为独立队列接受辅助化疗的亚组中RFS的Kaplan-Meier曲线。(K)为独立队列接受辅助化疗的亚组中RFS的ROC分析。纵坐标为灵敏性,横坐标为1-特异性(L)为独立队列接受辅助化疗的亚组的RFS的风险值和不同临床参数的C指数分析。纵坐标为不同临床参数,横坐标为C指数值。
图4为各临床亚组中预测模型的OS预测性能。(A)验证队列中男性患者OS的Kaplan-Meier曲线。(B)验证队列中女性患者OS的Kaplan-Meier曲线。(C)验证队列中年老患者OS的Kaplan-Meier曲线。(D)验证队列中青年患者OS的Kaplan-Meier曲线。(E)验证队列中吸烟患者OS的Kaplan-Meier曲线。(F)验证队列中非吸烟患者OS的Kaplan-Meier曲线。纵坐标为总生存率,横坐标为术后时间。
图5为各临床亚组中预测模型的RFS预测性能。(A)验证队列中男性患者RFS的Kaplan-Meier曲线。(B)验证队列中女性患者RFS的Kaplan-Meier曲线。(C)验证队列中年老患者RFS的Kaplan-Meier曲线。(D)验证队列中青年患者RFS的Kaplan-Meier曲线。(E)验证队列中吸烟患者RFS的Kaplan-Meier曲线。(F)验证队列中非吸烟患者RFS的Kaplan-Meier曲线。纵坐标为无复发生存率,横坐标为术后时间。
图6为预测模型对生存期和化疗获益的预测能力分析。(A)训练队列和独立队列中风险值和多个临床特征的单变量Cox回归分析。(B)训练队列和独立队列中风险评分和多个临床特征的多变量Cox回归分析(C)独立队列接受辅助化疗的亚组中风险评分和多个临床特征的单变量Cox回归分析。(D)独立队列接受辅助化疗的亚组中风险评分和多个临床特征的多变量Cox回归分析。纵坐标为HR的对数值,横坐标为不同临床特征。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、小细胞肺癌患者m6A相关lncRNA预测模型的建立和应用
从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载GSE65002队列作为训练队列,用于构建小细胞肺癌预测模型;并在国家癌症中心(NCC)收集小细胞肺癌患者福尔马林固定石蜡包埋的FFPE组织作为验证队列,用于模型验证。所有患者的临床特征如表1所示。
表1小细胞肺癌患者的临床特征
Figure BDA0003310344140000061
注:SCLC:小细胞肺癌;OS:总生存期。
验证队列中,小细胞肺癌患者的入选标准均如下:1)患者经过国家癌症中心诊断为小细胞肺癌;2)患者诊疗信息完善;3)患者术前未接受辅助治疗;4)患者病理组织经过2位临床病理医师的独立评估,均确认为小细胞肺癌。
辅助化疗以铂类药物为基础。
一、小细胞肺癌患者m6A相关lncRNA预测模型的建立
1.1m6A相关lncRNA预测模型的建立
(1)在训练队列中,为了建立小细胞肺癌患者m6A分子的治疗疗效及预后预测模型,采用单因素Cox比例回归模型,研究m6A相关基因对总生存期(OS)预后指标的影响。
为了使预测模型更加优化和实用,采用逐步Cox比例风险回归模型,最终构建出一个包括如下筛选获得的7个m6A相关的lncRNA基因的预后模型(m6A相关的lncRNA筛选过程见实施例2):WARS2-IT1(Gene ID:104472716,updated on 24-Jul-2021)、AC005162(GenBank:AC005162.1,updated on 31-JAN-2004)、AC130352(GenBank:AC130352.6,updated on 13-DEC-2002)、AC015971(GenBank:AC015971.4,updated on 16-APR-2005)、FOXP1-IT1(Gene ID:100506815,updated on 24-Jul-2021)、AC040963(GenBank:AC040963.6,updated on Jun-26-2002)和LINC00355(Gene ID:144766,updated on 16-Aug-2021)。
(2)根据每个患者目的基因的相对表达量,通过LASSO分析,得出如下公式I用于计算每个患者的风险值(图2中A):
风险值=(0.5622×WARS2-IT1基因表达量)+(1.0842×AC005162基因表达量)+(1.1170×AC130352基因表达量)+(1.5938×AC015971基因表达量)-(0.6460×FOXP1-IT1基因表达量)-(0.0665×AC040963基因表达量)-(0.5835×LINC00355基因表达量)
下文中,将公式I简称为风险值预测模型。
(3)风险值预测模型中,各m6A相关lncRNA和风险值的关系如图2中B所示。
1.3m6A相关lncRNA预测模型的验证
(1)通过R语言软件的“survminer”软件包的“surv_cutpoint”确定阈值,具体方法如下:将待预测小细胞肺癌患者的风险值与匹配的预后信息,输入至R语言软件中,在“survminer”软件包的“surv_cutpoint”的算法下,软件会自动计算出P值最小的分割点,该分割点即为高风险组和低风险组的阈值(最优cutoff点)。
结果显示,训练队列中,计算出的高风险组和低风险组的阈值为3.4995,患者风险值大于等于3.4995的为高风险组,患者风险值小于3.4995的为低风险组。(图2中C)
(2)采用Kaplan-Meier生存分析法分析训练队列的高风险组和低风险组患者的总生存率OS差异
利用Kaplan-Meier分析上述(1)得到的高风险组和低风险组的风险值和生存数据。Kaplan-Meier生存分析结果显示,训练队列中高风险组患者的OS比低分患者短(P<0.001)(图2中D)。
(3)风险值预测模型的ROC分析
将训练队列患者的1年、3年和5年预后情况与风险值预测模型进行ROC检验,结果显示,该风险值预测模型对患者多时间段的预后均具有很好的预测价值,具体的,1年:AUC=0.775;2年:AUC=0.826;5年:AUC=0.86(图2中E)。
二、小细胞肺癌患者m6A相关lncRNA预测模型对预后预测能力的验证
为了验证步骤一中建立的风险值预测模型的可重复性和效果,用验证队列对风险值预测模型的有效性进行验证。
2.1收集158例SCLC患者(表1)的FFPE组织作为验证队列,提取FFPE组织样本的RNA,通过PCR检测基因的表达量。
具体检测方法如下:
1)组织样本处理
a.取小细胞肺癌和癌旁组织,各100mg,放入2mL无酶EP管中,加入1mL RNAisoPlus(中国大连宝生物(TaKaRa)公司);
b.加4粒灭菌后的钢珠,放入高速低温组织研磨仪,参数设置为50Hz,匀浆处理5min,去除组织匀浆液;
c.用4℃离心机,用12000rpm/min离心10min,吸取上清液加入新的EP管中,置于冰上。
2)RNA浓度测定
a.打开NanoDrop,选择RNA检测模式,用1μL无酶水清洗探头3次,吸水纸擦干;
b.用1μL无酶水,校准仪器,调零;
c.加1μL待测样品至探头,检测RNA浓度,检测完毕后,用吸水纸擦干;
d.重复上一步骤,至所有样品检测完成;
e.用无酶水清洗探头3次。
3)RNA质控
通过NanoDrop检测的RNA浓度,同时观察以下两个值:
a.A260/A280比值:为RNA浓度与蛋白浓度的比值,1.8-2.0间表示质控合格;
b.A260/A230比值:为RNA浓度与共提取污染的比值,1.8-2.2间表示质控合格。
4)反转录
用cDNA反转录试剂盒(中国大连宝生物(TaKaRa)公司),具体如下:
a.去除基因组DNA:体系详见表2.
表2去除基因组DNA体系
Figure BDA0003310344140000081
在冰上进行配置反应体系,混匀并短暂离心,42℃反应2min。
b.反转录反应:体系详见表3。
表3反转录体系
Figure BDA0003310344140000082
将反应体系短暂离心并放置于PCR仪中,程序为37℃,15min,85℃反应5s,获得FFPE组织样本的cDNA。
4)PCR扩增
采用SYBR Green试剂(中国大连宝生物(TaKaRa)公司),通过循环阈值(Cyclethreshold valve,Ct)和标准曲线对起始模板进行定量分析。所需要的基因特异性引物均由捷瑞科技有限公司合成,检测各个目的基因和GAPDH基因的引物序列如表4(序列1-序列16)所示。
以3)获得的cDNA为模板,每个基因表达的检测需要设置三个复孔,其反应体系如下(表5):
表4目的基因引物序列
Figure BDA0003310344140000091
表5 PCR扩增体系
Figure BDA0003310344140000092
按照上述体系进行配置,并在冰上避光加入到PCR仪器专用的八联排离心管中,涡旋混匀。注意轻弹无气泡后离心。
在ABI 7900HT荧光定量PCR仪中,设置反应条件如下:95℃10min;95℃10s,60℃10s,72℃10s,共40个循环,溶解曲线。以GAPDH作为内参,按公式ΔCt=Ct Gene-Ct GAPDH进行数据分析,Folds=2-ΔΔCt公式计算目的基因的相对表达量。
2.2按照步骤1.2中(2)的方法分别对验证队列的患者FFPE样本的7个基因的相对表达量进行检测,计算风险值。
2.3风险值预测模型对验证队列总生存率(Overall survival,OS)的预后预测
(1)按照步骤1.3中(1)的方法,将验证队列的患者样本的风险值与OS,输入至R语言软件中确定OS阈值。结果确定阈值为0.1220,根据阈值,将患者分为高风险组和低风险组,患者风险值大于等于0.1220的为高风险组,患者风险值小于0.1220的为低风险组。
(2)采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的总生存率OS差异
利用Kaplan-Meier分析上述(1)得到的高风险组和低风险组的风险值和生存数据。Kaplan-Meier生存分析OS,结果显示,验证队列中高风险组(图3中A的High risk)患者的OS比低分(图3中A的Low risk)患者短(P<0.001)(图3中A)。
(3)不同临床亚组中风险值预测模型的效用验证
在验证队列不同的临床亚组(性别、是否吸烟)中,风险值预测模型效用也得到了很好的验证。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行对5年OS的ROC分析,结果证实,与患者年龄、性别、是否吸烟和肿瘤分期等比较,预测模型预测能力最好(图3中B)。具体的,风险值预测模型(图3中B的Risk score):AUC=0.645、性别(图3中B的sex):AUC=0.548、年龄(图3中B的age):AUC=0.582、是否吸烟(图3中B的smoking):AUC=0.579和分期(图3中B的Staging):AUC=0.593。对临床常用的病理参数,年龄(图3中C的Age)、性别(图3中C的Sex)、是否吸烟(图3中C的Smoking)和肿瘤分期(图3中C的SCLC_Staging)与预测模型(图3中C的Risk Score)同时进行OS的多因素Cox分析,结果显示风险值预测模型对OS的预测能力最好(图3中C)。
2.4预测模型对验证队列无复发生存期(Relapse-free survival,RFS)的预后预测
(1)按照步骤1.3中(1)方法,将验证队列的患者样本的风险值与RFS预后信息,输入至R语言软件中确定RFS阈值。结果确定阈值为0.1220,根据阈值,将患者分为高风险组和低风险组,患者风险值大于等于0.1220的为高风险组,患者风险值小于0.1220的为低风险组。
(2)采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的总生存率OS差异
利用Kaplan-Meier分析上述(1)得到的高风险组和低风险组的风险值和生存数据。Kaplan-Meier生存分析OS,结果显示,NCC验证队列中高风险组(图3中D的High risk)患者的OS比低分(图3中D的Low risk)患者短(P<0.001)(图3中D)。
(3)不同临床亚组中风险值预测模型的效用验证
在验证队列不同的临床亚组(性别、是否吸烟)中,风险值预测模型效用也得到了很好的验证。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行对5年OS的ROC分析,结果证实,与患者年龄(图3中E的Age)、性别(图3中E的Sex)、是否吸烟(图3中E的Smoking)和肿瘤分期(图3中E的Staging)等比较,风险值预测模型(图3中E的Risk score)预测能力最好(图3中E)。具体的,风险值预测模型:AUC=0.666、性别:AUC=0.581、年龄:AUC=0.54、是否吸烟:AUC=0.591和肿瘤分期:AUC=0.608。对临床常用的病理参数,年龄(图3中F的Age)、性别(图3中F的Sex)、是否吸烟(图3中F的Smoking)和肿瘤分期(图3中F的SCLC_Staging)与风险值预测模型(图3中F的Risk Score)同时进行OS的多因素Cox分析,结果显示风险值预测模型对OS的预测能力最好(图3中F)。
三、小细胞肺癌患者m6A相关lncRNA预测模型对辅助化疗获益程度预测能力的验证
为了验证预测模型对辅助化疗获益程度预测的能力,选取表1的验证队列中接受辅助化疗的138例患者对预测模型的有效性进行验证。
3.1风险值预测模型对辅助化疗后OS获益的验证
(1)按照步骤1.3中(1)方法,将验证队列138例接受辅助化疗的的患者样本的风险值与辅助化疗后OS,输入至R语言软件中确定辅助化疗后OS阈值。结果确定阈值为0.0143,根据阈值,将患者分为高风险组和低风险组,患者风险值大于等于0.0143的为高风险组,患者风险值小于0.0143的为低风险组。
(2)采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的总生存率OS差异
利用Kaplan-Meier分析上述(1)得到的高风险组和低风险组的风险值和生存数据。Kaplan-Meier生存分析OS,结果显示,验证队列中高风险组(图3中G的High risk)患者的OS比低分(图3中G的Low risk)患者短(P<0.001)(图3中G)。
(3)不同临床亚组中预测模型的效用验证
在验证队列不同的临床亚组(性别、是否吸烟)中,风险值预测模型效用也得到了很好的验证。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行对5年OS的ROC分析,结果证实,与患者年龄(图3中H的Age)、性别(图3中H的Sex)、是否吸烟(图3中H的Smoking)和肿瘤分期(图3中H的Staging)等比较,风险值预测模型(图3中H的Risk score)预测能力最好(图3中H)。具体的,风险值预测模型:AUC=0.629、性别AUC=0.525、年龄AUC=0.589、是否吸烟AUC=0.569和分期AUC=0.596。对临床常用的病理参数,年龄(图3中I的Age)、性别(图3中I的Sex)、是否吸烟(图3中I的Smoking)和肿瘤分期(图3中I的SCLC_Staging)与风险值预测模型(图3中I的Risk Score)同时进行OS的多因素Cox分析,结果显示风险值预测模型对OS的预测能力最好(图3中I)。
3.2风险值预测模型对辅助化疗后RFS获益的验证
(1)按照步骤1.3中(1)方法,将验证队列138例接受辅助化疗的患者样本的风险值与辅助化疗后RFS,输入至R语言软件中确定RFS阈值。结果确定阈值为0.0143,根据阈值,将患者分为高风险组和低风险组,患者风险值大于等于0.0143的为高风险组,患者风险值小于0.0143的为低风险组。
(2)采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的总生存率OS差异
利用Kaplan-Meier分析上述(1)得到的高风险组和低风险组的风险值和生存数据。Kaplan-Meier生存分析OS,结果显示,验证队列中高风险组(图3中J的High risk)患者的OS比低分(图3中J的Low risk)患者短(P<0.001)(图3中J)。
(3)不同临床亚组中预测模型的效用验证
在验证队列不同的临床亚组(性别、是否吸烟)中,风险值预测模型效用也得到了很好的验证。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行对5年OS的ROC分析,结果证实,与患者年龄(图3中K的Age)、性别(图3中K的Sex)、是否吸烟(图3中K的Smoking)和肿瘤分期(图3中K的Staging)等比较,风险值预测模型(图3中K的Risk score)预测能力最好(图3中K)。具体的,风险值预测模型:AUC=0.635、性别:AUC=0.55、年龄:AUC=0.565、是否吸烟:AUC=0.59和分期:AUC=0.631。对临床常用的病理参数,年龄(图3中L的Age)、性别(图3中L的Sex)、是否吸烟(图3中L的Smoking)和肿瘤分期(图3中L的SCLC_Staging)与风险值预测模型(图3中L的Risk Score)同时进行OS的多因素Cox分析,结果显示预测模型对OS的预测能力最好(图3中L)。
3.3预测模型对不同临床亚组的Kaplan-Meier分析
(1)通过对SCLC患者的不同亚组的OS进行Kaplan-Meier分析,结果显示,在年龄、性别和是否吸烟等临床亚组中,高风险组患者的OS比低分患者短。具体的,在男性患者中,高风险组(图4中A的High risk)患者的OS比低分(图4中A的Low risk)患者短(P<0.001);在女性患者中,高风险组(图4中B的High risk)患者的OS比低分(图4中B的Low risk)患者短(P=0.013);在老年患者中,高风险组(图4中C的High risk)患者的OS比低分(图4中C的Lowrisk)患者短(P<0.001);在青年患者中,高风险组(图4中D的High risk)患者的OS比低分(图4中D的Low risk)患者短(P=0.001);在吸烟患者中,高风险组(图4中E的High risk)患者的OS比低分(图4中E的Low risk)患者短(P=0.001);在非吸烟患者中,高风险组(图4中F的High risk)患者的OS比低分(图4中F的Low risk)患者短(P=0.002)(图4)。
(2)通过对SCLC患者的不同亚组的RFS进行Kaplan-Meier分析,结果显示,在年龄、性别和是否吸烟等临床亚组中,高风险组患者的OS比低分患者短。具体的,在男性患者中,高风险组患者(图5中A的High risk)的OS比低分(图5中A的Low risk)患者短(P<0.001);在女性患者中,高风险组(图5中B的High risk)患者的OS比低分(图5中B的Low risk)患者短(P=0.001);在老年患者中,高风险组(图5中C的High risk)患者的OS比低分(图5中C的Lowrisk)患者短(P=0.001);在青年患者中,高风险组(图5中D的High risk)患者的OS比低分(图5中D的Low risk)患者短(P=0.001);在吸烟患者中,高风险组(图5中E的High risk)患者的OS比低分(图5中E的Low risk)患者短(P<0.001);在非吸烟患者中,高风险组(图5中F的High risk)患者的OS比低分(图5中F的Low risk)患者短(P=0.002)(图5)。
四、小细胞肺癌患者m6A相关lncRNA风险值预测模型预测能力分析
4.1、风险值预测模型对SCLC患者预后预测能力验证
(1)风险值预测模型对训练队列中OS的预测能力
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行OS的单因素Cox分析,结果显示,相比于性别(图6中A的Traning Cohort组Sex行:P=0.947,95%CI:0.287-3.341)、年龄(图6中A的Traning Cohort组Age行:P=0.890,95%CI:0.407-2.181)、是否吸烟(图6中A的Traning Cohort组Smoking行:P=0.389,95%CI:0.593-3.831)和肿瘤分期(图6中A的Traning Cohort组SCLC staging行:P=0.002,95%CI:1.706-10.374),风险值预测模型对OS的预测能力最好(图6中A的Traning Cohort组Risk score行:P<0.001,95%CI:3.166-58.485)。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行OS的多因素Cox分析,结果显示,相比于性别(图6中B的Traning Cohort组Sex行:P=0.426,95%CI:0.337-13.145)、年龄(图6中B的Traning Cohort组Age行:P=0.228,95%CI:0.709-4.232)、是否吸烟(图6中B的Traning Cohort组Smoking行:P=0.501,95%CI:0.162-2.432)和肿瘤分期(图6中B的Traning Cohort组SCLC staging行:P=0.095,95%CI:0.857-6.887),风险值预测模型对OS的预测能力最好(图6中B的Traning Cohort组Riskscore行:P=0.004,95%CI:2.093-51.652)。
(2)预测模型对验证队列中OS的预测能力
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行OS的单因素Cox分析,结果显示,相比于性别(图6中A的Validation Cohort(OS)组Sex行:P=0.615,95%CI:0.684-1.898)、年龄(图6中A的Validation Cohort(OS)组Age行:P=0.105,95%CI:0.929-2.156)、是否吸烟(图6中A的Validation Cohort(OS)组Smoking行:P=0.334,95%CI:0.799-1.933)和肿瘤分期(图6中A的Validation Cohort(OS)组SCLCstaging行:P=0.001,95%CI:1.183-2.007),预测模型对OS的预测能力最好(图6中A的Validation Cohort(OS)组Risk score行:P<0.001,95%CI:1.871-4.737)。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与预测模型同时进行OS的多因素Cox分析,结果显示,相比于性别(图6中B的Validation Cohort(OS)组Sex行:P=0.891,95%CI:0.489-1.862)、年龄(图6中B的Validation Cohort(OS)组Age行:P=0.094,95%CI:0.939-2.214)、是否吸烟(图6中B的Validation Cohort(OS)组Smoking行:P=0.210,95%CI:0.810-2.611)和肿瘤分期(图6中B的Validation Cohort(OS)组SCLCstaging行:P=0.008,95%CI:1.101-1.882),风险值预测模型对OS的预测能力最好(图6中B的Validation Cohort(OS)组Risk score行:P=0.004,95%CI:2.093-51.652)。
(3)预测模型对验证队列中RFS的预测能力
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行RFS的单因素Cox分析,结果显示,相比于性别(图6中A的Validation Cohort(RFS)组Sex行:P=0.153,95%CI:0.873-2.379)、年龄(图6中A的Validation Cohort(RFS)组Age行:P=0.453,95%CI:0.785-1.721)、是否吸烟(图6中A的Validation Cohort(RFS)组Smoking行:P=0.140,95%CI:0.902-2.076)和肿瘤分期(图6中A的Validation Cohort(RFS)组SCLC staging行:P=0.003,95%CI:1.132-1.865),风险值预测模型对OS的预测能力最好(图6中A的Validation Cohort(RFS)组Risk score行:P<0.001,95%CI:1.755-4.070)。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行RFS的多因素Cox分析,结果显示,相比于性别(图6中B的Validation Cohort(RFS)组Sex行:P=0.407,95%CI:0.694-2.462)、年龄(图6中B的Validation Cohort(RFS)组Age行:P=0.463,95%CI:0.778-1.737)、是否吸烟(图6中B的Validation Cohort(RFS)组Smoking行:P=0.266,95%CI:0.793-2.312)和肿瘤分期(图6中B的Validation Cohort(RFS)组SCLC staging行:P=0.035,95%CI:1.020-1.689),风险值预测模型对OS的预测能力最好(图6中B的Validation Cohort(RFS)组Risk score行:P<0.001,95%CI:1.763-4.165)。
4.2、预测模型对接受辅助化疗SCLC患者获益程度的预测能力验证
(1)预测模型对验证队列中辅助化疗后OS的预测能力
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与预测模型同时进行OS的单因素Cox分析,结果显示,相比于性别(图6中C的Validation Cohort(OS)组Sex行:P=0.982,95%CI:0.594-1.705)、年龄(图6中C的Validation Cohort(OS)组Age行:P=0.115,95%CI:0.916-2.247)、是否吸烟(图6中C的Validation Cohort(OS)组Smoking行:P=0.439,95%CI:0.757-1.900)和肿瘤分期(图6中C的Validation Cohort(OS)组SCLCstaging行:P=0.002,95%CI:1.177-2.087),风险值预测模型对OS的预测能力最好(图6中C的Validation Cohort(OS)组Risk score行:P<0.001,95%CI:1.651-4.288)。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与预测模型同时进行OS的多因素Cox分析,结果显示,相比于性别(图6中D的Validation Cohort(OS)组Sex行:P=0.596,95%CI:0.414-1.660)、年龄(图6中D的Validation Cohort(OS)组Age行:P=0.180,95%CI:0.866-2.152)、是否吸烟(图6中D的Validation Cohort(OS)组Smoking行:P=0.258,95%CI:0.773-2.609)和肿瘤分期(图6中D的Validation Cohort(OS)组SCLCstaging行:P=0.014,95%CI:1.077-1.934),风险值预测模型对OS的预测能力最好(图6中D的Validation Cohort(OS)组Risk score行:P=0.004,95%CI:1.499-3.996)。
(2)预测模型对验证队列中辅助化疗后RFS的预测能力
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与预测模型同时进行RFS的单因素Cox分析,结果显示,相比于性别(图6中C的Validation Cohort(RFS)组Sex行:P=0.320,95%CI:0.775-2.183)、年龄(图6中C的Validation Cohort(RFS)组Age行:P=0.396,95%CI:0.788-1.824)、是否吸烟(图6中A的Validation Cohort(RFS)组Smoking行:P=0.130,95%CI:0.905-2.169)和肿瘤分期(图6中C的Validation Cohort(RFS)组SCLCstaging行:P=0.005,95%CI:1.127-1.937),风险值预测模型对OS的预测能力最好(图6中C的Validation Cohort(RFS)组Risk score行:P<0.001,95%CI:1.605-4.063)。
对临床常用的病理参数,年龄、性别、是否吸烟和肿瘤分期与风险值预测模型同时进行RFS的多因素Cox分析,结果显示,相比于性别(图6中D的Validation Cohort(RFS)组Sex行:P=0.822,95%CI:0.557-2.091)、年龄(图6中D的Validation Cohort(RFS)组Age行:P=0.558,95%CI:0.741-1.741)、是否吸烟(图6中D的Validation Cohort(RFS)组Smoking行:P=0.302,95%CI:0.766-2.360)和肿瘤分期(图6中D的Validation Cohort(RFS)组SCLC staging行:P=0.064,95%CI:0.985-1.725),预测模型对OS的预测能力最好(图6中D的Validation Cohort(RFS)组Risk score行:P<0.001,95%CI:1.463-3.792)。
综上所述,本发明通过确定SCLC中m6A相关lncRNA的表达谱,并建立了基于7个m6A相关lncRNA(包括WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355)的分子模型来预测SCLC患者的化疗反应和预后风险,结果表明本发明所建立的m6A相关lncRNA的风险值预测模型可以有效对小细胞肺癌的预后和化疗获益进行预测;7个m6A相关lncRNA可作为小细胞肺癌的预后预测和化疗获益预测的标志物。该发明可能会为未来化疗在SCLC患者中的临床应用提供参考依据,将有助于提高临床小细胞肺癌的治疗疗效。
实施例2、m6A相关lncRNA的筛选过程
1.1m6A相关lncRNA的筛选
(1)m6A各调节元件在肿瘤组织和正常组织中的表达
本发明从已发表文献中((1).Li Y,Xiao J,Bai J,Tian Y,Qu Y,Chen X,Wang Q,Li X,Zhang Y,and Xu J,Molecular characterization and clinical relevance of m(6)A regulators across 33cancer types.Mol Cancer,2019.18(1):137.(2).Liu J,Harada BT,and He C,Regulation of Gene Expression by N(6)-methyladenosine inCancer.Trends Cell Biol,2019.29(6):487-499.(3).Huang H,Weng H,and Chen J,m(6)A Modification in Coding and Non-coding RNAs:Roles and TherapeuticImplications in Cancer.Cancer Cell,2020.37(3):270-288.(4).Nombela P,Miguel-López B,and Blanco S,The role of m(6)A,m(5)CandΨRNA modifications in cancer:Novel therapeutic opportunities.Mol Cancer,2021.20(1):18.),总结了30个m6A的调节元件,包括11个Writer调节元件(METTL3,METTL14,METTL16,METTL5,WTAP,VIRMA,RBM15,RBM15B,ZC3H13,CBLL1,和ZCCHC4),2个Eraser调节元件(FTO和ALKBH5),以及17各Reader调节元件(YTHDF1,YTHDF2,YTHDF3,YTHDC1,YTHDC2,HNRNPA2B1,HNRNPC,FMR1,EIF3A,IGF2BP1,IGF2BP2,IGF2BP3,ELAVL1,G3BP1,G3BP2,PRRC2A和RBMX)。
通过从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载GSE40275数据,对比m6A调节元件在肿瘤组织和正常组织中的表达。结果显示,m6A调节元件在肿瘤组织和正常组织中表达差异明显(图1中A)。通过热图分析发现,m6A调节元件在肿瘤组织中呈现高表达(图1中B)。
(2)m6A相关lncRNA的筛选
从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载GSE60052数据作为训练队列进行分析。首先排除了训练队列中表达值为0的lncRNA,之后将剩余的lncRNA与m6A调节元件分别进行Pearson分析。同时满足|Pearson R|>0.5和P<0.0001条件的lncRNA被筛选为m6A相关lncRNA。最终,有289个lncRNA被选中。
(3)m6A相关lncRNA与预后的相关性
选取训练队列中有预后信息的患者,分别分析上步筛选出的m6A相关lncRNA对预后的影响。结果显示,有19个m6A相关lncRNA对患者总生存期存在相关性(P<0.2)(图1中C)。
为了使构建的小细胞肺癌预测模型更加优化和实用,最终筛选出如下7个lncRNA基因用于构建模型:WARS2-IT1(Gene ID:104472716,updated on 24-Jul-2021)、AC005162(GenBank:AC005162.1,updated on 31-JAN-2004)、AC130352(GenBank:AC130352.6,updated on 13-DEC-2002)、AC015971(GenBank:AC015971.4,updated on 16-APR-2005)、FOXP1-IT1(Gene ID:100506815,updated on 24-Jul-2021)、AC040963(GenBank:AC040963.6,updated on Jun-26-2002)和LINC00355(Gene ID:144766,updated on 16-Aug-2021)。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国医学科学院肿瘤医院
<120> m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用
<130> GNCSQ212673
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aacttgttgg gacctggagc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
caaatctcta gggcaggggc 20
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aggatcccat ccttttccat aaa 23
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
accctatgac cagcctctga 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtgagtcgtc ctccatgtcg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggccagagag ctcgtcattt 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agctacctct tccacccgat 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gtgaagccaa aggtcaggga 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
caaagcaaag cctcctaccc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tgctggtaag agccaacgtg 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggggaatgtc agtggcaaga 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tgattggaag ggtcggtgtg 20
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgtttgggaa actctctacg ct 22
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ggaaaagcag gcaccaacac 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aaatcaagtg gggcgatgct 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
caaatgagcc ccagccttct 20

Claims (10)

1.检测WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355这七种lncRNA的表达量的物质在制备预测小细胞肺癌患者预后的系统和/或预测小细胞肺癌患者化疗获益的系统中的应用。
2.根据权利要求1所述的应用,其特征在于:所述物质包括检测所述七种lncRNA基因的表达量所需的试剂和/或仪器。
3.根据权利要求1或2所述的应用,其特征在于:所述预测小细胞肺癌患者预后的系统包括所述物质和lncRNA基因表达量数据处理模块,所述lncRNA基因表达量数据处理模块用于将来自待预测小细胞肺癌患者的分离的小细胞肺癌组织中所述七种lncRNA基因的表达量转换为风险值,根据所述风险值预测所述待预测小细胞肺癌患者的预后。
4.根据权利要求1或2所述的应用,其特征在于:所述预测小细胞肺癌患者化疗获益的系统包括所述物质和lncRNA基因表达量数据处理模块,所述lncRNA基因表达量数据处理模块用于将来自待预测小细胞肺癌患者的分离的小细胞肺癌组织中所述七种lncRNA基因的表达量转换为风险值,根据所述风险值预测所述待预测小细胞肺癌患者是否从化疗中获益。
5.根据权利要求3或4所述的应用,其特征在于:所述lncRNA基因表达量数据处理模块根据公式I得到所述风险值;
所述公式I为:风险值=(0.5622×WARS2-IT1基因表达量)+(1.0842×AC005162基因表达量)+(1.1170×AC130352基因表达量)+(1.5938×AC015971基因表达量)-(0.6460×FOXP1-IT1基因表达量)-(0.0665×AC040963基因表达量)-(0.5835×LINC00355基因表达量)。
6.根据权利要求3、4或5所述的应用,其特征在于:所述lncRNA基因表达量数据处理模块利用R语言软件中的survminer软件包中的surv_cutpoint确定所述风险值的阈值。
7.七种lncRNA作为标志物在预测小细胞肺癌患者的预后中的应用,所述七种lncRNA为WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355。
8.七种lncRNA作为标志物在预测小细胞肺癌患者的化疗获益中的应用,所述七种lncRNA为WARS2-IT1、AC005162、AC130352、AC015971、FOXP1-IT1、AC040963和LINC00355。
9.预测小细胞肺癌患者预后和/或预测小细胞肺癌患者化疗获益的装置,所述装置包括用于获取WARS2-IT1基因、AC005162基因、AC130352基因、AC015971基因、FOXP1-IT1基因、AC040963基因和LINC00355基因这七种lncRNA基因的表达量的模块。
10.权利要求1-6中任一所述的预测小细胞肺癌患者预后的系统和/或预测小细胞肺癌患者化疗获益的系统。
CN202111215141.1A 2021-10-19 2021-10-19 m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用 Active CN113957145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111215141.1A CN113957145B (zh) 2021-10-19 2021-10-19 m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111215141.1A CN113957145B (zh) 2021-10-19 2021-10-19 m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用

Publications (2)

Publication Number Publication Date
CN113957145A true CN113957145A (zh) 2022-01-21
CN113957145B CN113957145B (zh) 2023-09-26

Family

ID=79465191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111215141.1A Active CN113957145B (zh) 2021-10-19 2021-10-19 m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用

Country Status (1)

Country Link
CN (1) CN113957145B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008157353A1 (en) * 2007-06-15 2008-12-24 University Of South Florida Methods of diagnosing and treating cancer
WO2013028554A2 (en) * 2011-08-19 2013-02-28 Myriad Genetics, Inc. Gene signatures for lung cancer prognosis and therapy selection
CN106893784A (zh) * 2017-05-02 2017-06-27 北京泱深生物信息技术有限公司 用于预测肝癌预后的lncRNA标志物
CN112048559A (zh) * 2020-09-10 2020-12-08 辽宁省肿瘤医院 基于m6A相关的IncRNA网络胃癌预后的模型构建及临床应用
CN112582028A (zh) * 2020-12-30 2021-03-30 华南理工大学 一种肺癌预后预测模型、构建方法及装置
CN113502330A (zh) * 2021-08-13 2021-10-15 中山大学附属第六医院 m6A相关lncRNA在制备预测结直肠癌预后产品中的应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008157353A1 (en) * 2007-06-15 2008-12-24 University Of South Florida Methods of diagnosing and treating cancer
WO2013028554A2 (en) * 2011-08-19 2013-02-28 Myriad Genetics, Inc. Gene signatures for lung cancer prognosis and therapy selection
CN106893784A (zh) * 2017-05-02 2017-06-27 北京泱深生物信息技术有限公司 用于预测肝癌预后的lncRNA标志物
CN112048559A (zh) * 2020-09-10 2020-12-08 辽宁省肿瘤医院 基于m6A相关的IncRNA网络胃癌预后的模型构建及临床应用
CN112582028A (zh) * 2020-12-30 2021-03-30 华南理工大学 一种肺癌预后预测模型、构建方法及装置
CN113502330A (zh) * 2021-08-13 2021-10-15 中山大学附属第六医院 m6A相关lncRNA在制备预测结直肠癌预后产品中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
仲小敏;刘华;蒋超;仲琴;万一元;: "胃癌组织中lncRNA FOXF1-AS1的表达及其与临床病理特征及预后的关系", 现代肿瘤医学, no. 02 *
杜小梅;吕建宁;李雯;: "长链非编码RNA EXOC7在非小细胞肺癌中的表达及临床意义分析", 临床肺科杂志, no. 04 *

Also Published As

Publication number Publication date
CN113957145B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
JP7042784B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
EP3524689B1 (en) Method for predicting the prognosis of breast cancer patient
ES2384107T3 (es) Indicadores moleculares de pronóstico de cáncer de mama y predicción de la respuesta al tratamiento
WO2017215230A1 (zh) 一组胃癌基因的应用
KR101785795B1 (ko) 두경부암 예후 예측용 바이오마커 마이크로 rna
WO2021036620A1 (zh) 一组卵巢癌预后相关基因的应用
CN110423816B (zh) 乳腺癌预后量化评估系统及应用
Block et al. Association of miR-548c-5p, miR-7-5p, miR-210-3p, miR-128-3p with recurrence in systemically untreated breast cancer
JP2011525106A (ja) 瀰漫性b大細胞型リンパ腫のマーカーおよびその使用方法
ES2829415T3 (es) Algoritmo de perfil de expresión génica para calcular una puntuación de recurrencia para un paciente con cáncer de riñón
WO2021164492A1 (zh) 一组结肠癌预后相关基因的应用
Caputo et al. Gene expression assay in the management of early breast cancer
US20150240312A1 (en) Copy number aberration driven endocrine response gene signature
CN113462773A (zh) 一种预测胃癌患者生存风险、免疫治疗响应和细胞焦亡诱导剂适用性的标志物及其应用
CN114277132B (zh) 免疫相关的lncRNA表达谱预测小细胞肺癌辅助化疗获益及预后的应用
CN113736879B (zh) 用于小细胞肺癌患者预后的系统及其应用
CN113528670B (zh) 一种用于预测肝癌患者术后晚期复发风险的生物标志物及检测试剂盒
CN113957145A (zh) m6A相关lncRNA在预测小细胞肺癌预后和化疗反应的应用
CN114457160A (zh) miRNA分子作为早期肺癌检测标志物的应用
CN113862369A (zh) 与肺腺癌对含铂双药化疗敏感性相关的标志物及其应用
KR101504818B1 (ko) 위암에 대한 예후 예측 시스템
Yang et al. Bioinformatics analysis of SH2D4A in Glioblastoma Multiforme to evaluate immune features and predict prognosis
EP2607494A1 (en) Biomarkers for lung cancer risk assessment
CN116891896A (zh) 一种用于判断癌症免疫治疗效果的生物标记物组合、评估模型与应用
Song et al. Identification and validation of an epithelial-mesenchymal transition-related lncRNA pairs prognostic model for gastric cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant