CN115472294B - 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法 - Google Patents

预测小细胞转化肺腺癌患者转化速度的模型及其构建方法 Download PDF

Info

Publication number
CN115472294B
CN115472294B CN202211419548.0A CN202211419548A CN115472294B CN 115472294 B CN115472294 B CN 115472294B CN 202211419548 A CN202211419548 A CN 202211419548A CN 115472294 B CN115472294 B CN 115472294B
Authority
CN
China
Prior art keywords
transformation
model
mrna
patient
small cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211419548.0A
Other languages
English (en)
Other versions
CN115472294A (zh
Inventor
谢同济
邢镨元
李研
应建明
李峻岭
王守正
杨琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital and Institute of CAMS and PUMC filed Critical Cancer Hospital and Institute of CAMS and PUMC
Priority to CN202211419548.0A priority Critical patent/CN115472294B/zh
Publication of CN115472294A publication Critical patent/CN115472294A/zh
Application granted granted Critical
Publication of CN115472294B publication Critical patent/CN115472294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

本公开提供了一种预测小细胞转化肺腺癌患者转化速度的模型及其构建方法,该方法包括:标本采集和临床信息收集、mRNA的提取和数据处理、定义转化所需时间、连续变量的二分类化、变量筛选和模型构建、检验独立预测价值,最终建立预测小细胞转化肺腺癌患者转化速度的模型。本公开构建的预测小细胞转化肺腺癌患者转化速度的模型有助于对患者进行个性化管理,对于高打分患者即转化速度较快的患者,应当增加耐药监测频次。

Description

预测小细胞转化肺腺癌患者转化速度的模型及其构建方法
技术领域
本公开涉及小细胞转化速度预测领域,特别涉及一种预测小细胞转化肺腺癌患者转化速度的模型及其构建方法。
背景技术
与传统的化疗相比,以酪氨酸激酶抑制剂(tyrosine kinase inhibitor,TKI)为代表的小分子靶向治疗在驱动基因阳性非小细胞肺癌尤其是肺腺癌(lungadenocarcinoma,LUAD)的治疗中取得了更好的疗效。然而患者在TKI治疗约1年后将不可避免地出现耐药现象。常见的耐药机制包括:驱动基因的二次突变,如表皮生长因子受体(epithelial growth factor receptor, EGFR)基因发生T790M耐药突变;非驱动基因的改变,如 MET基因扩增;上皮间质转化;病理类型转化等。其中 EGFR突变型LUAD患者向小细胞肺癌(small cell lung cancer,SCLC)的病理类型转化代表了一种罕见的耐药机制,在 EGFR突变型LUAD中发生率约为3-14%。
近年来,已有研究从基因组、表观遗传组及转录组等多个层面对小细胞转化的机制进行探索,但由于这些研究对患者的临床诊断和预后信息探索甚少,故尚无法对临床应用提供指导。并且,由于小细胞转化发生率低,标本获取较难,小细胞转化的研究经常面临无法被全面检测和样本量不足的困难。综上所述,现有的技术还无法实现对于肺腺癌患者的小细胞转化速度进行预测。
发明内容
为了解决现有技术中存在的上述问题,本公开的目的是为了提供一种预测小细胞转化肺腺癌患者转化速度的模型及其构建方法,以期解决现有技术中存在的问题。
为了实现上述目的,本公开采用了以下的技术方案:
本公开提供了一种预测小细胞转化肺腺癌患者转化速度的模型,包括:检测肺腺癌患者肿瘤样本中 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量。
在一种实施方式中,所述预测小细胞转化肺腺癌患者转化速度的模型的模型表达式为:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
本公开提供了一种如上任一所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,包括:
步骤S1、测定预选mRNA的表达量从肺腺癌患者肿瘤样本中提取预选mRNA,对提取的所述预选mRNA进行定量和质量检测,并测定提取的所述预选mRNA的表达量,将获得数据与参考mRNA进行归一处理,备用;其中,采用RNA提取试剂盒提取预选mRNA,采用单分子数字定量分析系统测定上述预选mRNA的表达量;
步骤S2、获取样本患者的小细胞的转化所需时间和小细胞的转化状态定义样本患者发生小细胞转化所需时间为自所述样本患者接受晚期一线治疗开始至样本患者病理诊断为小细胞癌转化的时间间隔;
步骤S3、连续变量的二分类化将上述预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用surv_cutpoint函数确定每个预选mRNA的表达量的最佳界值,以及基于上述最佳界值,将上述样本患者进行二分类化,得到二分类化预选mRNA的表达量;
步骤S4、生存分析将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,进行生存分析,得到分析结果;
步骤S5、变量筛选基于上述二分类化预选mRNA的表达量和上述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA;
步骤S6、模型构建将上述第一目标mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型。
在一种实施方式中,上述预选mRNA包括与癌症发生发展相关的730个mRNA。
在一种实施方式中,上述基于上述最佳界值,将上述样本患者进行二分类化,得到二分类化预选mRNA的表达量,包括:
基于上述最佳界值,将上述预选mRNA的表达量大于最佳界值定义为上述预选mRNA具有高表达量,将上述预选mRNA的表达量小于等于最佳界值定义为上述预选mRNA具有低表达量;
对于每个预选mRNA的表达量,将具有高表达量的样本患者纳入上述预选mRNA的高表达组,将具有低表达量的样本患者纳入上述预选mRNA的低表达组,得到二分类化预选mRNA的表达量。
在一种实施方式中,上述将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,进行生存分析,得到分析结果,包括:
将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用Kaplan-Meier法和单因素比例风险模型进行生存分析获取每个预选mRNA的p值和风险比,得到分析结果。
在一种实施方式中,上述基于上述二分类化预选mRNA的表达量和上述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA,包括:
基于上述分析结果,从上述预选mRNA中选择所述分析结果中p值均小于0.05的预选mRNA;
基于上述二分类化预选mRNA的表达量,从上述p值均小于0.05的预选mRNA中选择上述高表达组的样本患者数量与上述低表达组的样本患者数量的差值在预设范围内的预选mRNA,作为第一目标mRNA。
在一种实施方式中,上述将上述第一目标mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型,包括:
将上述第一目标mRNA的表达量作为自变量,其中,将上述高表达量定义为1,将上述低表达量定义为0,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量;
采用LASSO-COX回归模型降低模型的过拟合,从上述第一目标mRNA中确定第二目标mRNA,采用十折交叉验证确定最小交叉验证误差下的预测小细胞转化肺腺癌患者转化速度的模型(即最优第二目标mRNA及其系数的组合),其中,上述预测小细胞转化肺腺癌患者转化速度的模型所保留的第二目标mRNA为 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3
本公开还提供了一种检测 C19orf40、DAXX、JUN、WNT11、WIF1、IL11RA、PLAU、 CACNA2D3的mRNA表达量的试剂在制备预测小细胞转化肺腺癌患者转化速度的试剂盒中的应用,所述试剂盒中包括进行如下计算模型分数的说明和/或工具:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
本公开还提供了一种预测小细胞转化肺腺癌患者转化速度的方法,所述方法不用于诊断用途,所述方法包括检测肺腺癌患者肿瘤样本中 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量,根据如下公式计算模型分数:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3,以及通过模型分数判断小细胞转化肺腺癌患者转化速度,模型分数大于-0.855为转化速度快,模型分数小于等于-0.855为转化速度慢。
本公开提供的上述技术方案的有益效果至少包括:
本公开的预测小细胞转化肺腺癌患者转化速度的模型及其构建方法,本公开采用mRNA数据构建了预测 EGFR基因敏感突变阳性肺腺癌患者在接受EGFR-TKI治疗后发生小细胞转化速度的模型。预测小细胞转化肺腺癌患者转化速度的模型对患者转化所需时间的风险区分能力优于参与建模的单个mRNA,且经过多因素COX回归分析显示,模型分数是一个独立的预测因素。本公开构建的预测小细胞转化肺腺癌患者转化速度的模型有助于对患者进行个性化管理,对于打分结果不同的患者可以进行针对性的建议,例如对高打分患者即转化速度较快的患者,应当增加耐药监测频次,必要时进行二次活检确认是否发生了小细胞转化。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。通过阅读参照以下附图所作的对非限制性实施例的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1为本公开实施例提供的第一目标mRNA的单因素COX分析结果的森林图;
图2为本公开实施例提供的患者的年龄、性别、 EGFR突变类型和模型分数进行单因素COX分析结果的森林图;
图3为本公开实施例提供的性别、 EGFR突变类型和模型分数进行多因素COX分析结果的森林图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本申请。
本公开提供了一种预测小细胞转化肺腺癌患者转化速度的模型,包括:检测肺腺癌患者肿瘤样本中 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量。
在一种实施方式中,所述预测小细胞转化肺腺癌患者转化速度的模型的模型表达式为:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
本公开提供了一种预测小细胞转化肺腺癌患者转化速度的模型的构建方法,包括如下步骤:
步骤S1、测定预选mRNA的表达量。
在一种实施方式中,上述预选mRNA包括与癌症发生发展相关的730个mRNA。
在一种实施方式中,上述测定预选mRNA的表达量,包括:
第一步,采用RNA提取试剂盒提取预选mRNA;具体地,从接受EGFR-TKI治疗的 EGFR基因敏感突变阳性肺腺癌患者肿瘤样本中提取预选mRNA,将所述接受EGFR-TKI治疗的 EGFR基因敏感突变阳性肺腺癌患者作为样本患者;
第二步,采用单分子数字定量分析系统(nCounter FLEX)测定上述预选mRNA的表达量。
作为示例,采用石蜡包埋的组织RNA提取试剂盒提取福尔马林固定石蜡包埋(FFPE)标本的预选mRNA,采用荧光定量仪对上述预选mRNA进行定量和质量检测,采用生物分析仪检测上述预选mRNA片段和质量,采用单分子数字定量分析系统测定730个上述预选mRNA的表达量,将测定结果表达量的原始计数作为获得数据与参考mRNA进行归一。
步骤S2、获取样本患者的小细胞的转化所需时间和小细胞的转化状态。
在一种实施方式中,定义样本患者发生小细胞转化所需时间为自所述样本患者接受晚期一线治疗开始至样本患者病理诊断为小细胞癌转化的时间间隔。
步骤S3、连续变量的二分化。将上述预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用surv_cutpoint函数确定每个预选mRNA的表达量的最佳界值,以及基于上述最佳界值,将上述样本患者进行二分类化,得到二分类化预选mRNA的表达量。
在一种实施方式中,上述基于上述最佳界值,将上述样本患者进行二分类化,得到二分类化预选mRNA的表达量,包括:
第一步,基于上述最佳界值,将上述预选mRNA的表达量大于最佳界值定义为上述预选mRNA具有高表达量,将上述预选mRNA的表达量小于等于最佳界值定义为上述预选mRNA具有低表达量;
第二步,对于每个预选mRNA的表达量,将具有高表达量的样本患者纳入上述预选mRNA的高表达组,将具有低表达量的样本患者纳入上述预选mRNA的低表达组。
步骤S4、生存分析。将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,进行生存分析,得到分析结果。
在一种实施方式中,上述将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,进行生存分析,得到分析结果,包括:将上述二分类化预选mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用Kaplan-Meier(KM)法和单因素比例风险(COX)模型进行生存分析获取每个预选mRNA的p值和风险比,得到分析结果。
步骤S5、变量筛选。基于上述二分类化预选mRNA的表达量和上述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA。
在一种实施方式中,上述基于上述二分类化预选mRNA的表达量和上述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA,包括:
第一步,基于上述分析结果,从上述预选mRNA中选择所述分析结果中p值均小于0.05的预选mRNA。具体地,上述预选mRNA中筛选出同时满足KM法和单因素COX模型的具有统计学意义的p值均小于0.05的预选mRNA。
第二步,基于上述二分类化预选mRNA的表达量,从上述p值均小于0.05的预选mRNA中选择上述高表达组的样本患者数量与上述低表达组的样本患者数量的差值在预设范围内的预选mRNA,作为第一目标mRNA。作为示例,上述预设范围可以根据实际情况进行设定,本实施例中从上述p值均小于0.05的预选mRNA中选择上述高表达组的样本患者数量与上述低表达组的样本患者数量较为均衡的预选mRNA,作为第一目标mRNA。
步骤S6、模型构建。将上述第一目标mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型。
在一种实施方式中,上述将上述第一目标mRNA的表达量作为自变量,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型,包括:
第一步,将上述第一目标mRNA的表达量作为自变量,其中,将上述高表达量定义为1,将上述低表达量定义为0,将上述小细胞的转化所需时间和上述小细胞的转化状态作为因变量;
第二步,采用LASSO-COX回归模型降低模型的过拟合,从上述第一目标mRNA中确定第二目标mRNA,采用十折交叉验证确定最小交叉验证误差下的预测小细胞转化肺腺癌患者转化速度的模型(即最优第二目标mRNA及其系数的组合),其中,上述预测小细胞转化肺腺癌患者转化速度的模型所保留的第二目标mRNA为 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3。进一步地,上述预测小细胞转化肺腺癌患者转化速度的模型的模型分数为上述第二目标mRNA的表达量与各自系数乘积的总和。
在一种实施方式中,上述预测小细胞转化肺腺癌患者转化速度的模型在建立好后,还需要检验独立预测价值,具体包括:
第一步,采用上述预测小细胞转化肺腺癌患者转化速度的模型对每个患者进行打分,基于分数得到小细胞转化风险。作为示例,可以根据所有分数的中位值判断小细胞转化风险高低,其中,将大于中位值的分数定义为高风险,将小于等于中位值的分数定义为低分险。
第二步,获取患者的年龄、性别、 EGFR突变类型和上述分数作为参数,采用单因素COX模型进行分析,筛选p值小于0.25的参数作为混杂因素。
第三步,将上述混杂因素采用多因素比例风险模型进行分析。
本公开还提供了一种预测小细胞转化肺腺癌患者转化速度的模型,上述预测小细胞转化肺腺癌患者转化速度的模型采用上述任一所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法建立,上述预测小细胞转化肺腺癌患者转化速度的模型包括检测肺腺癌患者 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量。
在一种实施方式中,上述预测小细胞转化肺腺癌患者转化速度的模型的模型表达式为:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
本公开还提供了一种检测 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量的试剂在制备预测小细胞转化肺腺癌患者转化速度的试剂盒中的应用,所述试剂盒中包括进行如下计算模型分数的说明和/或工具:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
本公开还提供了一种预测小细胞转化肺腺癌患者转化速度的方法,所述方法不用于诊断用途,所述方法包括检测肺腺癌患者肿瘤样本中 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量,根据如下公式计算模型分数:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3,以及通过模型分数判断小细胞转化肺腺癌患者转化速度,模型分数大于-0.855为转化速度快,模型分数小于等于-0.855为转化速度慢。
本公开的方法可用于诊断或者非诊断用途,上述非诊断用途的例子包括但不限于肿瘤科研、保险和医疗规划用人群风险状态普查等。
本公开提供的上述技术方案的有益效果至少包括:
本公开的预测小细胞转化肺腺癌患者转化速度的模型及其构建方法,本公开采用mRNA数据构建了预测 EGFR基因敏感突变阳性肺腺癌患者在接受EGFR-TKI治疗后发生小细胞转化速度的模型。预测小细胞转化肺腺癌患者转化速度的模型对患者转化所需时间的风险区分能力优于参与建模的单个mRNA,且经过多因素COX回归分析显示,模型分数是一个独立的预测因素。本公开构建的预测小细胞转化肺腺癌患者转化速度的模型有助于对患者进行个性化管理,对于打分结果不同的患者可以进行针对性的建议,例如对高打分患者即转化速度较快的患者,应当增加耐药监测频次,必要时进行二次活检确认是否发生了小细胞转化。
下面结合实施例对本公开进行详细说明。
(1)、标本采集和临床信息收集:回顾性收集2011年1月1日至2022年5月31日在中国医学科学院肿瘤医院就诊并接受EGFR-TKI治疗后发生小细胞转化 EGFR基因敏感突变阳性晚期肺腺癌患者18例,作为样本患者,纳入样本患者集合。
纳入标准为:1)通过聚合酶链反应(PCR)或二代测序(NGS)诊断组织学或细胞学证实的伴有敏感 EGFR突变的晚期肺腺癌患者;2)接受EGFR-TKIs作为一线或后线治疗;3)基于高质量的肿瘤活检或保存良好的细胞学标本诊断为小细胞转化;4)具有肺腺癌时期的FFPE标本。
排除标准为:1)既往诊断为神经内分泌肿瘤;2)无法获取临床资料;3)FFPE质量低。
定义年龄为从出生到开始接受一线治疗的时间,并将样本患者按照55岁的年龄分界线将年龄小于等于55岁的样本患者定义为年轻,将年龄大于55岁的样本患者定义为年长。本实施例经中国医学科学院肿瘤医院伦理委员会批准(批准号:21/243-2914)。
(2)、mRNA的提取和数据处理:使用RNeasy FFPE Kit(Qiagen, CA, USA)提取FFPE标本的预选mRNA,由Qubit 3.0 Fluorometer (Thermo Fisher Scientific, Carlsbad,CA, USA)进行定量,采用2100 Bioanalyzer(Agilent, CA, USA)检测预选mRNA片段和质量。由nCounter FLEX分析系统(NanoString, Seattle, WA, USA)共计测定“NanostringnCounter Pancancer Pathway”中730个预选mRNA的表达量。通过NanoString的nSolver4.0将分析产生的原始计数与参考mRNA进行归一。
(3)、定义转化所需时间:定义样本患者发生小细胞转化所需时间为自所述样本患者接受晚期一线治疗开始至样本患者病理诊断为小细胞癌转化的时间间隔;其中,样本患者为 EGFR基因敏感突变阳性肺腺癌患者。同时,获取小细胞的转化状态。
(4)、连续变量的二分类化、变量筛选和模型构建:以上述预选mRNA表达为自变量,以小细胞的转化所需时间和转化状态为因变量,使用“surviminer”包中的“surv_cutpoint”函数确定每个预选mRNA的最佳界值,并根据最佳界值将样本患者分为低表达组(小于或等于最佳界值)和高表达组(大于最佳界值)。以二分类化的预选mRNA为自变量,以小细胞的转化所需时间和转化状态为因变量进行单因素生存分析,生存分析采用KM法和单因素COX模型。筛选730个mRNA中同时满足KM法和单因素COX分析的p值均小于0.05的,且在最佳界值分组下两组人数较为均衡的预选mRNA,作为第一目标mRNA进行模型构建。请参考图1,图1为第一目标mRNA的单因素COX分析结果的森林图,可以发现包括 CACNA2D3JUNWNT11WIF1PLAUIL11RA等在内的17个mRNA是小细胞转化所需时间的保护因素(即风险比小于1);而包括 DAXXC19orf40在内的10个mRNA是小细胞转化所需时间的危险因素(即风险比大于1)。建模时,以第一目标mRNA的二分类表达量为自变量,其中,高表达定义为1,低表达定义为0,以小细胞转化所需时间和转化状态为因变量。模型构建采用LASSO-COX回归以最大限度地降低过拟合,从上述第一目标mRNA中确定第二目标mRNA,采用十折交叉验证确定最小交叉验证误差下的模型,得到预测小细胞转化肺腺癌患者转化速度的模型。预测小细胞转化肺腺癌患者转化速度的模型的模型分数为上述第二目标mRNA的表达量与各自系数乘积的总和。
(5)、检验独立预测价值:使用预测小细胞转化肺腺癌患者转化速度的模型对每个患者进行打分,并根据中位值进行风险高低的划分(高风险:大于分数中位值;低风险:小于或等于分数中位值)。首先对患者的年龄、性别、 EGFR突变类型和模型分数进行单因素COX分析以筛选可能的混杂因素(p值小于0.25)。本实施例中得到的中位值为-0.855,因此,在本实施例中,高风险:大于-0.855;低风险:小于或等于-0.855。请参考图2,图2为患者的年龄、性别、 EGFR突变类型和模型分数进行单因素COX分析结果的森林图,可以发现模型分数为单因素分析中唯一有统计学意义即p值均小于0.05的变量。对比图1中各参与模型构建的第一目标mRNA的风险比,预测小细胞转化肺腺癌患者转化速度的模型的模型分数(风险比为24.329,见图2)对患者预测风险的区别能力强于参与建模的8个第二目标mRNA的单独区别能力。具体而言,对于属于保护性因素的 CACNA2D3JUNWNT11WIF1PLAUIL11RA,分别计算风险比的倒数为15.873(1/0.063)、4.367(1/0.229)、4.292(1/0.233)、3.636(1/0.275)、3.460(1/0.289)、2.976(1/0.336),均小于24.329;对于属于危险性因素的 DAXXC19orf40,风险比分别为4.558、11.032,亦均小于24.329。此外,本实施例还对预测小细胞转化肺腺癌患者转化速度的模型的模型分数预测价值的独立性进行判断,选取p值小于0.25的因素作为混杂因素进行多因素COX分析,即性别(p值为0.115)和 EGFR突变类型(p值为0.187)。请参考图3,图3为性别、 EGFR突变类型和模型分数进行多因素COX分析结果的森林图,可以发现,预测小细胞转化肺腺癌患者转化速度的模型的模型分数可以独立于性别和 EGFR突变类型预测 EGFR基因敏感突变阳性肺腺癌患者在接受EGFR-TKI治疗后发生小细胞转化的速度(p值为0.008)。
(6)、一种预测小细胞转化肺腺癌患者转化速度的模型,采用上任一所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法建立,上述预测小细胞转化肺腺癌患者转化速度的模型包括检测肺腺癌患者 C19orf40DAXXJUNWNT11WIF1IL11RAPLAUCACNA2D3的mRNA表达量。上述预测小细胞转化肺腺癌患者转化速度的模型的模型表达式为:模型分数=1.154× C19orf40+0.028× DAXX-0.111× JUN-0.130× WNT11-0.367× WIF1-0.551× IL11RA-0.717× PLAU-1.039× CACNA2D3
(7)、一种预测小细胞转化肺腺癌患者转化速度的模型在 EGFR基因敏感突变阳性肺腺癌患者中的应用。具体地,采用上述预测小细胞转化肺腺癌患者转化速度的模型对 EGFR基因敏感突变阳性肺腺癌患者进行打分,基于分数进行分析判断小细胞转化风险高的 EGFR基因敏感突变阳性肺腺癌患者,便于对小细胞转化风险高的 EGFR基因敏感突变阳性肺腺癌患者进行耐药监测频次的制定。
以上说明书中描述的只是本公开的具体实施方式,各种举例说明不对本公开的实质内容构成限制,所属技术领域的普通技术人员在阅读了说明书后可以对以前所述的具体实施方式做修改或变形,而不背离本公开的实质和范围。

Claims (8)

1.一种预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,包括:
步骤S1、测定预选mRNA的表达量
从肺腺癌患者肿瘤样本中提取预选mRNA,对提取的所述预选mRNA进行定量和质量检测,并测定提取的所述预选mRNA的表达量,将获得数据与参考mRNA进行归一处理,备用;
步骤S2、获取样本患者的小细胞的转化所需时间和小细胞的转化状态
定义样本患者发生小细胞转化所需时间为自所述样本患者接受晚期一线治疗开始至样本患者病理诊断为小细胞癌转化的时间间隔;
步骤S3、连续变量的二分类化
将所述预选mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,采用surv_cutpoint函数确定每个预选mRNA的表达量的最佳界值,以及基于所述最佳界值,将所述样本患者进行二分类化,得到二分类化预选mRNA的表达量;
步骤S4、生存分析
将所述二分类化预选mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,进行生存分析,得到分析结果;
步骤S5、变量筛选
基于所述二分类化预选mRNA的表达量和所述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA;
步骤S6、模型构建
将所述第一目标mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型;所述模型用于检测肺腺癌患者肿瘤样本中C19orf40、DAXX、JUN、WNT11、WIF1、IL11RA、PLAU、CACNA2D3的mRNA表达量;所述预测小细胞转化肺腺癌患者转化速度的模型的模型表达式为:模型分数=1.154×C19orf40+0.028×DAXX-0.111×JUN-0.130×WNT11-0.367×WIF1-0.551×IL11RA-0.717×PLAU-
1.039×CACNA2D3。
2.根据权利要求1所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,所述预选mRNA包括与癌症发生发展相关的730个mRNA。
3.根据权利要求1所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,所述基于所述最佳界值,将所述样本患者进行二分类化,得到二分类化预选mRNA的表达量,包括:
基于所述最佳界值,将所述预选mRNA的表达量大于最佳界值定义为所述预选mRNA具有高表达量,将所述预选mRNA的表达量小于等于最佳界值定义为所述预选mRNA具有低表达量;
对于每个预选mRNA的表达量,将具有高表达量的样本患者纳入所述预选mRNA的高表达组,将具有低表达量的样本患者纳入所述预选mRNA的低表达组。
4.根据权利要求3所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,所述将所述二分类化预选mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,进行生存分析,得到分析结果,包括:
将所述二分类化预选mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,采用Kaplan-Meier法和单因素比例风险模型进行生存分析获取每个预选mRNA的p值和风险比,得到分析结果。
5.根据权利要求4所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,所述基于所述二分类化预选mRNA的表达量和所述分析结果,将符合预设条件的预选mRNA作为第一目标mRNA,包括:
基于所述分析结果,从所述预选mRNA中选择所述分析结果中p值均小于0.05的预选mRNA;
基于所述二分类化预选mRNA的表达量,从所述p值均小于0.05的预选mRNA中选择所述高表达组的样本患者数量与所述低表达组的样本患者数量的差值在预设范围内的预选mRNA,作为第一目标mRNA。
6.根据权利要求3所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法,其特征在于,所述将所述第一目标mRNA的表达量作为自变量,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量,采用LASSO-COX回归模型建立预测小细胞转化肺腺癌患者转化速度的模型,包括:
将所述第一目标mRNA的表达量作为自变量,其中,将所述高表达量定义为1,将所述低表达量定义为0,将所述小细胞的转化所需时间和所述小细胞的转化状态作为因变量;
采用LASSO-COX回归模型降低模型的过拟合,从所述第一目标mRNA中确定第二目标mRNA,采用十折交叉验证确定最小交叉验证误差下的预测小细胞转化肺腺癌患者转化速度的模型。
7.检测C19orf40、DAXX、JUN、WNT11、WIF1、IL11RA、PLAU、CACNA2D3的mRNA表达量的试剂在制备预测小细胞转化肺腺癌患者转化速度的试剂盒中的应用,所述预测小细胞转化肺腺癌患者转化速度基于权利要求1-6任一项所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法实现,其特征在于,所述试剂盒中包括进行如下计算模型分数的说明和/或工具:模型分数=1.154×C19orf40+0.028×DAXX-0.111×JUN-0.130×WNT11-
0.367×WIF1-0.551×IL11RA-0.717×PLAU-1.039×CACNA2D3。
8.预测小细胞转化肺腺癌患者转化速度的方法,所述方法不用于诊断用途,其特征在于,所述方法包括检测肺腺癌患者肿瘤样本中C19orf40、DAXX、JUN、WNT11、WIF1、IL11RA、PLAU、CACNA2D3的mRNA表达量,根据如下公式计算模型分数:模型分数=1.154×C19orf40+0.028×DAXX-0.111×JUN-0.130×WNT11-
0.367×WIF1-0.551×IL11RA-0.717×PLAU-1.039×CACNA2D3,以及
通过模型分数判断小细胞转化肺腺癌患者转化速度,模型分数大于-0.855为转化速度快,模型分数小于等于-0.855为转化速度慢,所述模型基于权利要求1-6任一项所述的预测小细胞转化肺腺癌患者转化速度的模型的构建方法实现。
CN202211419548.0A 2022-11-14 2022-11-14 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法 Active CN115472294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211419548.0A CN115472294B (zh) 2022-11-14 2022-11-14 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211419548.0A CN115472294B (zh) 2022-11-14 2022-11-14 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法

Publications (2)

Publication Number Publication Date
CN115472294A CN115472294A (zh) 2022-12-13
CN115472294B true CN115472294B (zh) 2023-04-07

Family

ID=84338124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211419548.0A Active CN115472294B (zh) 2022-11-14 2022-11-14 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法

Country Status (1)

Country Link
CN (1) CN115472294B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109082471A (zh) * 2018-09-18 2018-12-25 蚌埠医学院 一种肺腺癌患者预后预测用外周血mRNA标记物及其筛选方法和应用
CN109609636A (zh) * 2018-12-29 2019-04-12 上海交通大学医学院附属瑞金医院 一种肺腺癌差异性表达circRNA的检测试剂盒及其应用
CN115036026A (zh) * 2022-07-26 2022-09-09 复旦大学附属金山医院(上海市金山区眼病防治所、上海市金山区核化伤害应急救治中心) 一种预测肺腺癌放疗预后模型的试剂盒及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106442991B (zh) * 2015-08-06 2018-07-27 中国人民解放军军事医学科学院生物医学分析中心 用于预测肺腺癌患者预后及判断辅助化疗获益的系统
KR102086935B1 (ko) * 2015-11-05 2020-03-09 비지아이 션전 폐 선암종을 검출하기 위한 생체마커 및 그의 사용
US20180126003A1 (en) * 2016-05-04 2018-05-10 Curevac Ag New targets for rna therapeutics
CN107881234B (zh) * 2017-11-09 2021-05-04 南京卡迪睿伯生物技术有限公司 一组肺腺癌相关基因标签及其应用
CN114107492B (zh) * 2021-01-07 2024-04-26 首都医科大学附属北京胸科医院 一种用于肿瘤分子分型、治疗用药评估的分子标志物及其检测引物和试剂盒
CN114990218A (zh) * 2022-06-01 2022-09-02 杭州市第一人民医院 一种预测肺癌脑转移的试剂盒

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109082471A (zh) * 2018-09-18 2018-12-25 蚌埠医学院 一种肺腺癌患者预后预测用外周血mRNA标记物及其筛选方法和应用
CN109609636A (zh) * 2018-12-29 2019-04-12 上海交通大学医学院附属瑞金医院 一种肺腺癌差异性表达circRNA的检测试剂盒及其应用
CN115036026A (zh) * 2022-07-26 2022-09-09 复旦大学附属金山医院(上海市金山区眼病防治所、上海市金山区核化伤害应急救治中心) 一种预测肺腺癌放疗预后模型的试剂盒及其应用

Also Published As

Publication number Publication date
CN115472294A (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
JP6824923B2 (ja) 胃腸癌での増殖の徴候及び予後
JP7042717B2 (ja) 癌の臨床転帰を予測する方法
US11220716B2 (en) Methods for predicting the prognosis of breast cancer patient
US8868352B2 (en) Predicting response to chemotherapy using gene expression markers
US7622251B2 (en) Molecular indicators of breast cancer prognosis and prediction of treatment response
US20100137164A1 (en) Biomarkers for predicting prostate cancer progression
WO2018001295A1 (zh) 分子标志物、内参基因及其应用、检测试剂盒以及检测模型的构建方法
JP2008521412A (ja) 肺癌予後判定手段
AU2020204502B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
US10718030B2 (en) Methods for predicting effectiveness of chemotherapy for a breast cancer patient
CA3122109A1 (en) Systems and methods for using fragment lengths as a predictor of cancer
CN109337978B (zh) miRNA在制备高级浆液性上皮性卵巢癌化疗耐药性评价试剂盒中的应用
CN115482935B (zh) 预测小细胞转化的肺腺癌患者预后模型及其建立方法
CN115472294B (zh) 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法
TW202242143A (zh) 乳癌復發與轉移風險預估方法與套組
CN115637292B (zh) 预测肺腺癌患者小细胞转化风险的模型及其建立方法
CN115961042A (zh) Igfbp1基因或chaf1a基因在作为胃腺癌预后分子标志物中的应用
NZ752676B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
NZ711680B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant