CN115762801A - 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用 - Google Patents

一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用 Download PDF

Info

Publication number
CN115762801A
CN115762801A CN202210531561.9A CN202210531561A CN115762801A CN 115762801 A CN115762801 A CN 115762801A CN 202210531561 A CN202210531561 A CN 202210531561A CN 115762801 A CN115762801 A CN 115762801A
Authority
CN
China
Prior art keywords
breast cancer
biomarker
lipid metabolism
prediction model
biomarkers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210531561.9A
Other languages
English (en)
Other versions
CN115762801B (zh
Inventor
王佳妮
马飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital and Institute of CAMS and PUMC filed Critical Cancer Hospital and Institute of CAMS and PUMC
Priority to CN202210531561.9A priority Critical patent/CN115762801B/zh
Publication of CN115762801A publication Critical patent/CN115762801A/zh
Application granted granted Critical
Publication of CN115762801B publication Critical patent/CN115762801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用,属于生物医药技术领域。所述生物标志物为:WE(5:0_16:2)+NH4,LPE(20:4)‑H,ChE(20:5)+H;以及基于本发明生物标志物的乳腺癌NAT治疗反应预测模型。本发明克服了肿瘤异质性加之病理活检取材困难的问题,提供了稳定的乳腺癌NAT外周血脂质代谢生物标志物;同时基于乳腺癌NAT外周血脂质代谢生物标志物构建了乳腺癌NAT治疗反应预测模型。本发明构建的乳腺癌NAT治疗反应预测模型,训练集的曲线下面积(AUC)为0.84,验证集AUC为0.72,当临界值为0.57时,准确度为0.84,特异性为0.92,敏感性为0.71。

Description

一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志 物及应用
技术领域
本发明涉及一种预测乳腺癌新辅助治疗(Neoadjuvant therapy,NAT)反应的外周血脂质代谢生物标志物及应用,具体涉及一种基于集成机器学习算法筛选的预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用,属于生物医药技术领域。
背景技术
新辅助治疗(NAT)在乳腺癌治疗管理中至关重要,其优势在于原发肿瘤降期,提高保乳手术率,预测肿瘤治疗敏感性,评估患者治疗获益。既往研究表明,新辅助治疗获得病理完全缓解(complete pathologic response,pCR) 的患者无病生存期(EFS)和总生存期(OS)均优于肿瘤残存者。因此,pCR是评价新辅助治疗获益人群的有力指标,常在前瞻性新辅助化疗临床研究中作为EFS的替代研究终点。乳腺癌是一种高度异质性的恶性肿瘤,其发生发展是多基因共同参与的过程,存在着不同的亚型,这些亚型无论在发生发展机制、分子生物学特征以及临床表现上都存在着很大的差异,个体化治疗背景下,乳腺癌治疗需根据雌激素受体以及HER2基因扩增情况进行不同选择。高侵袭性乳腺癌(HER2过表达型及三阴型)有更高pCR率,可高达30-50%;侵袭性较低的Luminal型乳腺癌(ER/PR阳性,HER2阳性或阴性)NAT后获得pCR机率较低,尤其是Luminal A型,对NAT敏感性较差,获得pCR率不足10%,生存预测价值有限。HER2基因是乳腺癌最重要的癌基因之一,HER2基因的扩增导致生长信号通路异常活跃,脱离正常细胞周期,直至发生癌变。20%-35%乳腺癌为HER2基因扩增型,这一类型乳腺癌侵袭性强,预后更差。研究证实在新辅助化疗的基础上联合抗HER2靶向治疗,可使HER2阳性乳腺癌的 pCR率从20%-25%提高到40%-55%。但仍有许多患者并未从新辅助治疗中明确获益,却又经受治疗带来的不良反应和死亡风险,因此,亟需探索发掘可以预测NAT反应应答的生物标记物,进而更精准的指导乳腺癌的个体化治疗,避免治疗不足或治疗过度。
生物体是一个完整系统,体液、细胞和组织中的内源性代谢物处于动态平衡。肿瘤细胞作为一种高增殖、高代谢性细胞类型,往往伴随显著异常的脂质代谢,在肿瘤进展早期就已经发生。既往研究证实,酶与脂质合成在乳腺癌组织中过表达,与肿瘤进展密切相关。与正常乳腺组织相比,乳腺癌重新合成脂肪酸并渗入膜磷脂的力度增加。脂质组学是一种基于高通量分析技术,通过系统性解析脂质组特征,高效研究脂类家族、脂质分子在肿瘤演化过程中的改变与功能,阐明相关生物机制。Wang等应用基质辅助激光解吸附电离成像质谱(MALDIIMS)描述高侵袭性和低侵袭性乳腺癌细胞系之间的脂质组学差异。在高侵袭性细胞类型中,包括鞘磷脂(Sphingomyelins,SM)在内的8种脂质下调,而包括PG和PA在内的31种脂质上调。这项研究的结论是,细胞膜上的FA合成产物,如含油酸的PG,可能是侵袭乳腺癌细胞的重要线粒体衰竭因子。因此,近年来,人们通过脂质组学分析来探索新的具有诊断潜力的生物标志物。脂质代谢特征的改变可能是预测pCR的潜在生物标志物。
前期报导的几项研究探讨了脂质组学在乳腺癌诊疗预后中的潜在应用价值。Kang等分析34对手术乳腺组织(34个乳腺肿瘤,34个相邻的正常样本),旨在区分肿瘤和正常组织及乳腺癌的不同亚型和预后相关性。通过脂质组学分析,PC34:1在乳腺癌中过表达;此外,脂质MALDI质谱在Luminal型、HER2阳性和三阴型乳腺癌亚型之间存在显著差异,具有重要的预后相关性。Hilvo等使用超高效液相色谱法-串联质谱法(UHPLC-MS/MS)对267例乳腺组织进行了全面的脂类分析。结果发现,肿瘤组织中磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰肌醇(PI)、鞘磷脂(SM)在ER阴性的肿瘤中上调。ER阴性和3级肿瘤的棕榈酸酯从头合成的高速率及其与磷脂膜的结合,提供了一个特征性的预后因子。
然而,肿瘤组织的脂质分布具有空间异质性,特征PC16:0/16:0,PC 16:0/18:1,PC18:1/18:1,PC18:0/18:1定位于可达的肿瘤区域,而LPC16:0/0:0定位于坏死的肿瘤区域。难以克服的肿瘤异质性加之病理活检取材困难的问题,促使脂质组学在肿瘤研究领域开始着力寻找外周血及体液循环标志物,指导临床优化治疗策略。Min等应用高效液相色谱-电喷雾串联质谱法 (LC-ESI-MS-MS)对乳腺癌患者尿液中的磷脂(PLs),即磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酰甘油(PG)、甘油磷脂酸(PA)与健康对照组进行了分析。在乳腺癌组中,两个PS分子(18:1/18:1和18:2/18:0)显著升高,术后其浓度降至正常水平。与健康对照组相比,乳腺癌患者的PI18:0/20:4明显降低。该研究提示,乳腺癌患者尿液中发现的脂质成分可用于复发的早期诊断。Hilvo 等开展的一项对新辅助化疗乳腺癌患者外周血的脂质组学研究表明,特定三酰甘油(TGs)水平改变与患者新辅助治疗pCR率相关,血清三酰基甘油(TGs) 含有C18:1脂肪酰基链在pCR患者中浓度较低。一些TGs还与总体及无病生存有关,强调了全身脂代谢状态在化疗反应中的重要性。Wei等开展的另一项研究也进行了血清代谢物分析,以确定预测乳腺癌新辅助化疗的潜在生物标志物。结果发现,pCR患者血清代谢产物在苏氨酸、谷氨酰胺和异亮氨酸水平上存在显著差异;此外,游离亚油酸(C18:2)在获得pCR患者中含量较低。
基于高通量组学的数据分类,通常会面临存在大量噪音信息及高维数据中样本量较少,特征因子多的困境。单维统计学检验法难以反映多个变量因素对组别分类的影响,选出的潜在标志物间可能存在高度相关性,导致其分析结果的准确度和优化度较低。在机器学习法中,特征选择算法被广泛应用于选择潜在的靶分子作为生物标志物来区分实验组和对照组的样本。目前主流的特征选择算法有过滤法、包装法、嵌入法等。相比而言,机器学习法不仅适用于多维变量分析,可筛选出与组别相关性高且分子间相关性低的靶分子,而且还可构建具有预测新样本组别功能的模型。但单一特征选择方法产生的最终的模型结果往往表现不够理想,导致从单个实验数据集里选择出的生物标志物稳定性差,实际应用能力低,很难应用到其他同类型的实验样本上。集成的学习法选择生物标记物通过整合使用多个相同或者不同类型的机器学习算法,选出那些经常出现在具有高准确率的分类模型中的潜在靶分析,从而最大限度地提高生物标志物的稳定性。因此,在具有显著性差异的物质数据的基础上使用集成机器学习法进行二次筛选,通过构建并结合多个特征选择算法,使用一定的策略整合得到最终结果,从而最大限度提高生物标记物的稳定性。
既往研究证实了应用脂质组学检测乳腺癌肿瘤组织预测治疗疗效及患者预后的价值,但以克服连续病理活检和肿瘤异质性的困难为目的,评估患者外周血浆中脂质组学代谢物与乳腺癌NAT反应相关性的研究尚未广泛开展。
发明内容
本发明针对上述问题,提供了一种预测乳腺癌新辅助治疗(Neoadjuvanttherapy,NAT)反应的外周血脂质代谢生物标志物及应用,本发明基于集成机器学习算法筛选标志物,整合统计检验和目前主流使用的多种特征选择算法,最大限度地提高了生物标志物的稳定性。本发明技术方案如下:
一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物为:WE (5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H。
进一步的,所述生物标记物来源为:新辅助化疗乳腺癌患者外周血浆样本中的脂类化合物。
进一步的,本发明还提供了一种乳腺癌NAT治疗反应预测模型,所述预测模型中包括上述外周血脂质代谢生物标志物,所述生物标志物为:WE (5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H。
进一步的,所述一种乳腺癌NAT治疗反应预测模型的公示如式一所示:
Figure RE-GDA0004042365230000051
其中,预测模型的逻辑回归系数如表1所示:
表1.生物标记物逻辑回归系数
候选生物标记物 逻辑回归系数
截距 -1.07
WE(5:0_16:2)+NH4 -0.471
LPE(20:4)-H -3.57
ChE(20:5)+H -0.572
进一步,所述乳腺癌NAT治疗反应预测模型在预测乳腺癌患者对新辅助疗效方面的应用。
进一步的,本发明还包括所述外周血脂质代谢生物标志物在制备改善乳腺癌患者预后的药物中的应用。
本发明与现有技术相比具有以下优点:
1.本发明克服了肿瘤异质性加之病理活检取材困难的问题,提供了稳定的乳腺癌NAT外周血脂质代谢生物标志物;同时基于乳腺癌NAT外周血脂质代谢生物标志物构建了乳腺癌NAT治疗反应预测模型。
2.本发明构建的乳腺癌NAT治疗反应预测模型,训练集的曲线下面积 (AUC)为0.84,验证集为0.72,当截止值为0.57时,准确度为0.84,特异性为0.92,敏感性为0.71。
附图说明
图1为候选生物标记物分类模型的曲线下面积累积趋势图;
图2为三种单一模型评价的受试者工作曲线分析、特异性、敏感度的箱线图;其中横坐标:曲线下面积、特异性和灵敏度的得分值,其越接近1越好;纵坐标:使用的三种算法模型,LR是逻辑回归,SVM是支持向量机,RF是随机森林;
图3为三种单一模型评价的受试者工作曲线图,其中横坐标:假阳性率(1- 特异性);纵坐标:真阳性率(敏感度);
图4为三种单一模型评价的准确率、敏感度、特异性曲线图;
图5为随机森林计算生物标记物的重要性系数;其中,横坐标:重要性;纵坐标:候选生物标记物。
图6为乳腺癌NAT治疗反应预测模型的准确率,特异性,敏感度和临界值之间的趋势关系图;
图7为基于样本中(原数据集分为训练集和验证集)候选生物标记物表达量的受试者工作曲线分析图。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
实施例1:一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物的获得,以及乳腺癌NAT治疗反应预测模型的构建。
1)临床样本收集:
研究基于前期开展的一项“不同亚型乳腺癌术前化疗方案的优化以及探索相关生物标记物的研究”(试验注册号ClincalTrials.gov NCT02041338),入组 119名临床分期诊断IIa至IIIc期,拟行新辅助治疗的乳腺癌患者。
纳入标准:
a.治疗前经核芯针组织穿刺活检确诊为浸润性乳腺癌。
b.新辅助治疗前进行双侧乳腺MRI或超声、胸片、腹部超声或CT以及骨扫描等检查确定确定临床分期为IIa-IIIc期可手术或局部晚期乳腺癌。
c.通过免疫组化(immnnohistochemistry,IHC)和/或荧光原位杂交 (florescentin situ hybridization,FISH)方法确定肿瘤的雌激素受体(estrogen receptor,ER)、孕激素受体(progesteronereceptor,PR)表达及人表皮生长因子受体2(human epidermalgrowth factor receptor 2,HER2)状态。ER、PR阴性的判定标准均为<1%的肿瘤细胞核染色,HER2阳性的定义为IHC染色3+或FISH 结果提示HER2基因扩增。
d.患者在术前接受4-6周期的紫杉醇175mg/m2d1+卡铂AUC4d2/14天+- 曲妥珠单抗8mg/kg首次,6mg/kg每3周或4mg/kg首次,2mg/kg每周[TC(H)] 方案或紫杉醇175mg/m2d1+表柔比星75mg/m2,d1(或分两天给药)/21天+- 曲妥珠单抗8mg/kg首次,6mg/kg每3周或4mg/kg首次,2mg/kg每周[AT(H)] 方案治疗,当出现不可耐受的毒性、疾病进展或者合并医生认为不宜继续化疗的其他情况时中止治疗。
e.新辅助治疗结束后可手术患者2个月内进行乳腺癌根治术或保乳术,联合前哨淋巴结活检术或腋窝淋巴结清扫。
排除标准:
a.合并远处转移的IV期乳腺癌;
b.男性乳腺癌;
c.有其他恶性肿瘤病史或合并有其他恶行肿瘤;
d.合并其他严重疾病或医学情况不能耐受新辅助治疗或手术治疗。
本研究由中国医学科学院肿瘤医院伦理委员会批准,入组患者均提供知情同意书,同意参加研究及采集生物学标本。患者在新辅助治疗过程中每2周期进行一次体格检查和影像学检查(乳腺MRI或超声)评估临床疗效,依据实体瘤疗效评价标准(ResponseEvaluation Criteria in Solid Tumors,RECIST)1.1 版本进行疗效评判,临床疗效可分为完全缓解(complete remission,CR)、部分缓解(partial remission,PR)、疾病稳定(stable disease,SD)及疾病进展 (progressive disease,PD)。根据术后病理情况进行病理学疗效评价,其中病理学完全缓解(pathologic complete response,pCR)定义为切除的乳腺组织及淋巴结经病理学检查未发现浸润性癌成份,可以仅残存原位癌成份。
2)外周血标本的采集处理
本研究收集119例乳腺癌患者新辅助化疗前(C0)及治疗2周期后(C2)血浆样本。使用EDTA抗凝管采集入组患者基线(C0)、治疗2周期后(C2)外周血4mL,采血后立即上下颠倒混匀,2h内完成血浆初次分离。血浆分离流程: 将采血管在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5 mL或2.0mL的离心管中,在吸取血浆过程中注意不能吸到中间白细胞层;吸取中间白细胞层,吸取1-2mL,即有核血细胞样本,用做对照。将初次分离的血浆样本进行二次分离,在4℃条件下16000g离心10min,将上清转移到新的离心管中,即血浆样本。将血浆样本于-80℃保存,血细胞样本于-20℃保存,待检测时再取出,避免反复冻融。
3)非靶向脂质组学(LC-MS/MS)检测分析
样本预处理:4℃解冻后取血浆样本100μL,加入水混匀、预冷甲醇、MTBE后涡旋混合,室温静置30min;14000g10℃离心15min,取上层有机相,氮气吹干;加入200uL异丙醇溶液复溶,涡旋,14000g10℃离心15min,取上清备用。
色谱-质谱分析:
a.色谱条件:采用UHPLCNexeraLC-30A超高效液相色谱系统进行分离 (柱温45℃;流速300μL/min;进样量2μL)。
b.质谱条件:采用电喷雾电离(ESI)正离子和负离子模式进行检测;采用QExactive plus质谱仪(Thermo Scientific TM)进行质谱分析。
数据处理:采用LipidSearch software version4.1(Thermo Scientific TM)进行峰识别、脂质鉴定、峰提取、峰对齐,定量等处理。
4)乳腺癌脂质组学特征谱建立
利用绝对定量脂质组学,动态监测脂质组成、浓度、链长和饱和度等多个层面的外周脂质组学概况,完成差异物质鉴定及统计分析:
LipidSearch提取后数据,删除组内缺失值>50%的脂质分子,应用软件 SIMCA-P14.1(Umetrics,Umea,Sweden)进行预处理。
进行单维(Student’s t-test和变异倍数分析)及多维统计分析(主成份分析PCA、正交偏最小二乘判别分析OPLs-DA分析),VIP>1且P value<0.05 为筛选标准,筛选显著性差异脂质进行层次聚类分析。
5)数据预处理及统计法预筛选:使用Z-score标准化,治疗应答者,即病理完全缓解(pCR)和非应答者,即非病理完全缓解(non-pCR)组按1:1.5 的比例随机抽样进行后续分析。根据"变量权重值(VIP)>1、差异倍数(FC)>2 或FC<0.5和p<0.05"的标准,对候选脂质代谢生物标志物进行筛选。利用T 检验法或其他统计学方法对所有物质数据进行分析,筛选出在比较组中具有显著性差异的物质。
6)集成机器学习二次筛选:在具有显著性差异的物质数据的基础上使用集成机器学习法进行二次筛选,通过构建并结合多个特征选择算法,使用一定的策略整合得到最终结果。用到的特征选择方法有过滤法,封装法和包裹法等。每个特征选择方法都会产生一组潜在标志物集合。给每个候选标志物集合中的物质进行打分评估,打分规则依据候选生物标志物被方法选中的频率重要性和相关系数等指标计算每个候选标志物的累计分数。根据每个候选标志物的分数从高到低进行排序。分数越高表明该物质在区分样本组中的贡献越大。利用受试者工作特征(ROC)分析来评价选择最优潜在标志物的组合。根据物质的分数排名从高到低依次把物质加入最优候选标志物组合中,计算每次加入一个物质后的最优候选标志物集合所构建的模型的曲线下面积 (AUC)值,直到AUC值的变化趋于平缓不再上升,则停止在最优候选标志物组合中加入其他标志物;最终获得本发明预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物为:WE(5:0_16:2)+NH4,LPE(20:4)-H,ChE (20:5)+H。
7)基于上述外周血脂质代谢生物标志物为:WE(5:0_16:2)+NH4,LPE (20:4)-H,ChE(20:5)+H。此外,本发明还构建了乳腺癌NAT治疗反应预测模型:
①候选生物标记物的选择
为了有效进行候选生物标记物的挑选,利用ROC分析来评价各物质对模型的AUC值的影响强度。AUC值是一个用来评价二分类模型优劣的常用指标, AUC的全称是Area underthe Curve of ROC(受试者工作特征receiver operating characteristic),ROC曲线下方面积。AUC值越高,通常表明模型分类的效果越好。AUC值评价模型分类准确程度见表1-1所示,
表1-1.AUC值评价模型分类的准确程度
曲线下面积 模型分类准确程度
0.9<AUC<1.0 优秀
0.8<AUC<0.9 很好
0.7<AUC<0.8 良好
0.8<AUC<0.9 欠佳
AUC累积曲线如表1-1所示,AUC累积曲线显示,权重排名前3的物质,能显著提高样本分类能力;而排名3位以后的物质,对分类能力不再有明显贡献,因此选择前3个物质作为候选的生物标志物: _WE(5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H_,如表2。
表2
候选生物标记物 排名 累积曲线下面积
WE(5:0_16:2)+NH4 1 0.79166667
LPE(20:4)-H 2 0.81466667
ChE(20:5)+H 3 0.83233333
TG(18:3_18:2_18:2)+NH4 4 0.826
TG(16:0_17:1_18:1)+NH4 5 0.826
TG(16:0_16:1_18:2)+NH4 6 0.826
②最优潜在标志物组合模型的验证和评价
为了完成候选生物标志物的验证及评价候选生物标志物对分类模型的效果,利用目前常用的三种机器学习模型:逻辑回归(Logistic Regression,LR)、随机森林(RandomForest,RF)、支持向量机(Support Vector Machine,SVM),对标记物组合构建的模型进行5折交叉验证。通过ROC曲线分析,判定上述候选标志物对不同样本组别分类的性能优劣。ROC图上横轴表示假阳性率(false postive rate FPR)即1-特异性(Specificity),指真实的阴性样本被错误判为阳性的比例;纵轴表示真阳性率(true postive rate TPR)也称为敏感度(Sensitivity),指真实的阳性样本被正确判为阳性的比例。单一模型指标主要看ROC曲线下的面积值(AUC值),特异性和敏感度。图1、图2、图3分别以箱线图、ROC 曲线形式,展示了预测模型的AUC、特异性和灵敏度的结果。其中,ROC曲线下的面积值越接近1,其临床诊断效能越大,特异性和敏感度的指标都是越高效能越好。本分析结果中,各评价指标均效果较理想,说明筛选出的后续生物标记物有较优秀的分类能力和效果。
图4进一步展示了三种单一模型评价的准确率、敏感度和特异性值,与临界值的关系曲线图。一个ROC曲线是由多组敏感度和假阳性率(1-特异性)构成。
候选生物标记物的特征评价利用了上述随机森林算法构建的分类模型,计算出候选生物标记物的重要性系数,用于比较每个生物标记物对模型的贡献大小,候选生物标记物的重要性系数越高表明该生物标记物和分类组别的关系越近,对区分不同组别的作用贡献越大。图5为随机森林计算生物标记物的重要性系数;其中,横坐标:重要性;纵坐标:候选生物标记物。候选生物标记物的相关信息,及在各比较组之间的表达水平与统计结果,表达水平分析的结果表明,挑选出的候选生物标记物在比较组中均存在极显著的差异表达:一般来说,诊断模型中的各生物标记物之间的相关性越低,说明所选择的生物标记物之间的重叠性越低,模型组合更为优化。对候选生物标记物的表达量计算Pearson相关系数,大部分的候选生物标记物的相关性较低。
8)诊断模型构建
生物标记物诊断模型是利用逻辑回归算法来构建的。逻辑回归是一种常用的分类模型,可以预测事件发生的概率,分析某一个事件发生的影响因素,应用十分广泛。表3为生物标记物的逻辑回归系数及截距的描述。
表3.生物标记物逻辑回归系数
候选生物标记物 逻辑回归系数
截距 -1.07
WE(5:0_16:2)+NH4 -0.471
LPE(20:4)-H -3.57
ChE(20:5)+H -0.572
模型公式如式一所示:
Figure RE-GDA0004042365230000131
将生物标志物的表达水平值带入上述模型公式所计算的概率值p见表1,如p值超出cutoff值则判别为诊断阳性。为了获得该界值,我们采用约登指数 (Youden'sindex)界定出诊断判定的最佳临界值。约登指数是衡量总体诊断有效性的常用指标,当给予敏感性和特异性同等权重时,最大约登指数所对应的临界值是生物标志物鉴别能力的最佳临界点,因为此时敏感度和特异性之和最大,最佳临界值能同时具有比较好的敏感度和特异性。实际上,最优临界值不一定是唯一的,可能有多个,可根据对敏感度和特异性的不同需求进行选择。高灵敏度常应用于:诊断病情严重但疗效好的疾病,以防漏诊;该病可能由多种疾病引起,用于排除某一疾病的可能性;普查或定期健康检查,用于筛选某一疾病。高特异度常用于:诊断患者有某疾病的概率较大时以便确诊;疾病严重但疗效和预后均不好的疾病,以防误诊;疾病的根治方法有较大损害时需确诊,以免造成病人不必要的损害。利用约登指数计算的最佳的临界值和对应指标见表4。模型的准确率,特异性,敏感度和临界值之间的趋势关系如图6,展示了准确率和临界值的变化关系,敏感度和特异性与临界值之间的变化关系。曲线上每一点都有所对应的临界值,可根据最佳临界值找到对应的准确率、敏感度和特异性。敏感度和特异性关系通常是成负相关。本分析最后界定出的临界值为0.57。
表4.
项目 赋值
临界值 0.57
特异度 0.92
敏感度 0.71
准确率 0.84
模型的诊断能力评价
基于样本中(原数据集分为训练集和测试集)候选生物标记物的表达量,利用上述构建的诊断模型进行受试者工作曲线分析,结果如图7。训练集AUC 值为0.84,测试集AUC值为0.72。说明候选生物标记物逻辑回归的模型对测试集的样本分类效果较好。二分类模型判别标准临界值为0.57时,该模型在测试集中的准确率为0.84,特异性为0.92,敏感度为0.71。
试验例1:
本实验通过对脂质代谢组的数据进行上述分析,在235份血浆样本中共发现了8大类,39个亚类,2292个脂质代谢物分子。通过基线关联候选脂质组学特征,集成机器学习算法最终筛选出了3个生物标志物分别是 WE(5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H,构建乳腺癌NAT治疗反应预测模型,训练集的曲线下面积(AUC)为0.84,验证集为0.72,当临界值为0.57 时,准确度为0.84,特异性为0.92,敏感性为0.71。

Claims (6)

1.一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物,其特征在于,所述乳腺癌NAT外周血生物标志物为:WE(5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H。
2.根据权利要求1所述的外周血脂质代谢生物标志物,其特征在于,所述外周血脂质代谢生物标志物的来源为:新辅助化疗乳腺癌患者外周血浆样本中的脂类化合物。
3.一种乳腺癌NAT治疗反应预测模型,其特征在于,所述预测模型中包括如权利要求1或2所述的外周血脂质代谢生物标志物,所述生物标志物为:WE(5:0_16:2)+NH4,LPE(20:4)-H,ChE(20:5)+H。
4.根据权利要求3所述的乳腺癌NAT治疗反应预测模型,其特征在于,所述预测模型的公示如式一所示:
Figure FDA0003643542990000011
其中,预测模型的逻辑回归系数如表3所示:
表3.生物标记物逻辑回归系数
候选生物标记物 逻辑回归系数 截距 -1.07 WE(5:0_16:2)+NH4 -0.471 LPE(20:4)-H -3.57 ChE(20:5)+H -0.572
5.如权利要求3或4所述乳腺癌NAT治疗反应预测模型在预测乳腺癌患者对新辅助治疗反应方面的应用。
6.如权利要求1或2所述外周血脂质代谢生物标志物在制备改善乳腺癌患者预后的药物中的应用。
CN202210531561.9A 2022-05-13 2022-05-13 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用 Active CN115762801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210531561.9A CN115762801B (zh) 2022-05-13 2022-05-13 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210531561.9A CN115762801B (zh) 2022-05-13 2022-05-13 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用

Publications (2)

Publication Number Publication Date
CN115762801A true CN115762801A (zh) 2023-03-07
CN115762801B CN115762801B (zh) 2024-01-23

Family

ID=85349940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210531561.9A Active CN115762801B (zh) 2022-05-13 2022-05-13 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用

Country Status (1)

Country Link
CN (1) CN115762801B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116933160A (zh) * 2023-09-19 2023-10-24 中国农业科学院农产品加工研究所 基于脂质特征-机器学习的肉品种和部位鉴别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150141280A1 (en) * 2012-07-06 2015-05-21 National University Of Ireland, Galway Mirna oncologic biomarker of breast cancer
CN106353498A (zh) * 2016-08-25 2017-01-25 邓友平 辅助诊断乳腺癌的脂质化合物及其相关试剂盒
CN107092801A (zh) * 2017-05-05 2017-08-25 北京骐骥生物技术有限公司 利用脂质生物标志物预测乳腺癌的方法
CN107488737A (zh) * 2017-10-12 2017-12-19 中国医学科学院肿瘤医院 一种检测外周血tcr可变区编码基因的液体活检试剂盒及其应用
US20180024132A1 (en) * 2016-07-07 2018-01-25 Berg Llc Lipid, protein, and metabolite markers for the diagnosis and treatment of prostate cancer
CN108885220A (zh) * 2016-03-10 2018-11-23 新加坡科技研究局 用于诊断癌症的脂质生物标志物
CN110923318A (zh) * 2019-12-10 2020-03-27 中国医学科学院肿瘤医院 用于在乳腺癌患者中预测新辅助化疗疗效的标志物及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150141280A1 (en) * 2012-07-06 2015-05-21 National University Of Ireland, Galway Mirna oncologic biomarker of breast cancer
CN108885220A (zh) * 2016-03-10 2018-11-23 新加坡科技研究局 用于诊断癌症的脂质生物标志物
US20180024132A1 (en) * 2016-07-07 2018-01-25 Berg Llc Lipid, protein, and metabolite markers for the diagnosis and treatment of prostate cancer
CN106353498A (zh) * 2016-08-25 2017-01-25 邓友平 辅助诊断乳腺癌的脂质化合物及其相关试剂盒
CN107092801A (zh) * 2017-05-05 2017-08-25 北京骐骥生物技术有限公司 利用脂质生物标志物预测乳腺癌的方法
CN107488737A (zh) * 2017-10-12 2017-12-19 中国医学科学院肿瘤医院 一种检测外周血tcr可变区编码基因的液体活检试剂盒及其应用
CN110923318A (zh) * 2019-12-10 2020-03-27 中国医学科学院肿瘤医院 用于在乳腺癌患者中预测新辅助化疗疗效的标志物及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢菲;周波;曹迎明;王殊;杨德启;: "不同生物学标志物对乳腺癌新辅助化疗疗效的预测价值", 中国癌症杂志, no. 06, pages 58 - 62 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116933160A (zh) * 2023-09-19 2023-10-24 中国农业科学院农产品加工研究所 基于脂质特征-机器学习的肉品种和部位鉴别方法
CN116933160B (zh) * 2023-09-19 2024-01-09 中国农业科学院农产品加工研究所 基于脂质特征-机器学习的肉品种和部位鉴别方法

Also Published As

Publication number Publication date
CN115762801B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
Ros-Mazurczyk et al. Serum lipid profile discriminates patients with early lung cancer from healthy controls
US10697968B2 (en) Lipid markers for early diagnosis of breast cancer
JP2013532830A (ja) 前立腺癌に関するバイオマーカー及びそれを使用する方法
Liang et al. Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma
CN113960215A (zh) 用于肺腺癌诊断的标志物及其应用
US20150008314A1 (en) Diagnostic and prognostic biomarkers for cancer
US20220137053A1 (en) Lipid biomarkers for cancer screening and monitoring
Zhou et al. Metabolic detection of malignant brain gliomas through plasma lipidomic analysis and support vector machine-based machine learning
CN115762801B (zh) 一种预测乳腺癌新辅助治疗反应的外周血脂质代谢生物标志物及应用
EP2904397B1 (en) Means and methods for diagnosing recurrence of prostate cancer after prostatectomy
Kozar et al. Identification of novel diagnostic biomarkers in endometrial cancer using targeted metabolomic profiling
Sottile et al. A pilot study evaluating serum pro-prostate-specific antigen in patients with rising PSA following radical prostatectomy
CN112630432A (zh) Flna、fbln1、tsp-1作为标志物在制备石棉相关疾病检测试剂盒中的应用
WO2022133738A1 (zh) 一种术前鉴别甲状腺良恶性结节的生物标志物、试剂盒及其应用
CN111583994A (zh) 肿瘤标志物截断值联合模型及其应用
WO2024048514A1 (ja) 子宮頸がんおよび/または子宮頸部上皮内腫瘍の検査方法
US20240219390A1 (en) Cancer biomarkers
KR102070916B1 (ko) 췌장암 환자의 예후를 예측하기 위한 바이오마커 및 이의 용도
CN118006776A (zh) 早期肺腺癌标志物及其筛选方法、诊断模型、诊断装置
KR102519776B1 (ko) 류마티스 관절염의 진단 및 발병 예측용 바이오마커
CN116466087A (zh) 与血管正常化相关的血浆蛋白作为肺腺癌早期诊断及预后标志物及其应用
US20200025767A1 (en) Detection and treatment of of early-stage ovarian cancer
AU2022265529A1 (en) Cancer biomarkers
CN113433239A (zh) 一种用于贲门癌诊断的标志物及试剂盒
Wolrab et al. Cancer Lipidomics–From the Perspective of Analytical Chemists

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant