CN114121150A - 癌症药物敏感性预测方法、系统、存储介质及终端 - Google Patents

癌症药物敏感性预测方法、系统、存储介质及终端 Download PDF

Info

Publication number
CN114121150A
CN114121150A CN202010879274.8A CN202010879274A CN114121150A CN 114121150 A CN114121150 A CN 114121150A CN 202010879274 A CN202010879274 A CN 202010879274A CN 114121150 A CN114121150 A CN 114121150A
Authority
CN
China
Prior art keywords
drug sensitivity
cancer
cancer drug
proteome
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010879274.8A
Other languages
English (en)
Inventor
曾嵘
张卫
吴家睿
李辰
孙怡迪
于冠宇
崔静如
楼征
张杭
黄亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Cell Science of CAS
First Affiliated Hospital of Naval Military Medical University of PLA
Original Assignee
Center for Excellence in Molecular Cell Science of CAS
First Affiliated Hospital of Naval Military Medical University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Cell Science of CAS, First Affiliated Hospital of Naval Military Medical University of PLA filed Critical Center for Excellence in Molecular Cell Science of CAS
Priority to CN202010879274.8A priority Critical patent/CN114121150A/zh
Publication of CN114121150A publication Critical patent/CN114121150A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种癌症药物敏感性预测方法、系统、存储介质及终端,包括以下步骤:获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值;获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集;基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;基于训练好的弹性网络进行癌症药物敏感性的预测。本发明的癌症药物敏感性预测方法、系统、存储介质及终端采用基于激酶底物特征边的机器学习模型实现靶向药物的药效判别,从而提供癌症药物敏感性的准确预测。

Description

癌症药物敏感性预测方法、系统、存储介质及终端
技术领域
本发明涉及癌症药物敏感性预测的技术领域,特别是涉及一种癌症药物敏感性预测方法、系统、存储介质及终端。
背景技术
结直肠癌是世界范围内死亡率排名第四的癌症,每年约有900,000万人死于结直肠癌。人群的老龄化、不健康的现代饮食方式以及其它可变的环境因子(包括吸烟、肥胖以及体力活动过低等)都是增加结直肠癌患病率的风险因子。结直肠癌通常是由位于结肠或者直肠内壁的息肉产生的,从息肉到癌症的发生通常会持续10-20年之久。96%以上的结肠癌都是这种从内壁生长的类型,也称为腺癌。在肠道内的肿瘤一旦突破结肠或者直肠的壁,就可能扩散进入血液或者淋巴结,癌细胞可能随着循环系统进一步被带到其它组织或者器官,比如肝脏,肺或者腹膜,即癌症发生了转移。肝脏是结直肠癌转移的主要场所,而脑转移只占到了4%的比例,但是脑转移的病人只有3-6个月的存活期。研究表明,结直肠癌是一种高异质性的肿瘤并且根据分子特征定义了不同的亚型,不同的亚型间存在明显的预后和治疗响应的差异。不仅有肿瘤内异质性,转移组织之间以及不同的个体间也存在着巨大的异质性,这也给结直肠癌尤其是转移性结直肠癌的研究带来了巨大的挑战。
目前,虽然结直肠癌相关的预后标志物以及治疗取得了很大的进展,但是结直肠癌的死亡率,尤其是转移性结直肠,依然占据全球癌症相关死亡人数的10%。目前为止,只有DNA错配修复状态、RAS突变以及BRAF突变状态这几个分子标志物在临床治疗决策中被考虑。研究表明,肿瘤的转移灶和原发灶的突变模式和主要的驱动基因非常相似。蛋白质是行使生物功能的直接大分子,基于质谱(Mass Spectrum,MS)的蛋白质组学可以定量整体蛋白质的丰度以及翻译后修饰,从而提供基因组之外更丰富的信息。多组学数据的特征被认为能够贡献于每个病人对治疗的反应从而有助于个性化医疗以及精准医疗的实施。结合测序技术和质谱方法能够提供一个更为全面的图景,通过功能蛋白质组学和信号网络将癌症‘基因组’和‘表型’连接起来。
通过对146例结直肠患者的临床组织进行蛋白质基因组学的整合分析,获知蛋白质表达谱划分3个具有显著不同分子特征和预后的分子亚型,基因组和蛋白质组的整合分析也表明了不同亚型之间的体细胞突变和拷贝数变异差异以及对蛋白质表达水平的影响。磷酸化蛋白质数据能显著区分转移性结直肠癌和早发性结直肠癌,转移性结直肠癌的转移灶相比于原发灶在基因组水平上并没有明显差异,但是在蛋白质和磷酸化水平上却有明显不同。基于蛋白质磷酸化数据的激酶富集和网络分析说明了原发灶和转移灶的异质性。包括转移癌组织和原位癌组织的临床组织的体内异种移植药物实验能够验证组织的个性化药物反应。因此,如何实现不同药物的敏感性预测成为当前亟待解决的热点课题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种癌症药物敏感性预测方法、系统、存储介质及终端,采用基于激酶底物特征边的机器学习模型实现靶向药物的药效判别,从而提供癌症药物敏感性的准确预测。
为实现上述目的及其他相关目的,本发明提供一种癌症药物敏感性预测方法,包括以下步骤:获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值;获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集;基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;基于训练好的弹性网络进行癌症药物敏感性的预测。
于本发明一实施例中,基于微型患者源异种移植模型获取所述药物敏感值。
于本发明一实施例中,所述微型患者源异种移植模型包括原位癌组织和转移癌组织。
于本发明一实施例中,所述节点特征值为原位癌组织或肝转移癌组织中激酶蛋白质表达水平或底物磷酸化修饰水平相对于正常组织的表达量比值的log2转换数值。
于本发明一实施例中,所述边强度特征表示每一对激酶和底物之间的相关性,根据
Figure BDA0002653620240000021
将分子定量的数据node转换为表征分子之间相关性的边强度edge,其中xi,j,k代表来自于第k类的第j个样本的分子i的表达值,
Figure BDA0002653620240000022
Figure BDA0002653620240000023
分别表示该分子i在l类的平均值和标准差,u和v表示分子。
于本发明一实施例中,在训练所述弹性网络时,计算预设药物敏感值和实际药物敏感值之间的皮尔森相关系数及P值以判断所述弹性网络的预测效果。
于本发明一实施例中,对于所述训练数据集中的激酶底物磷酸化的边强度特征或节点特征值,首先根据预设条件进行预选,再根据预选得到的边强度特征或节点特征值训练所述弹性网络。
对应地,本发明提供一种癌症药物敏感性预测系统,包括获取模块、划分模块、训练模块和预测模块;
所述获取模块用于获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值;
所述划分模块用于获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集;
所述训练模块用于基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;
所述预测模块用于基于训练好的弹性网络进行癌症药物敏感性的预测。
本发明提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的癌症药物敏感性预测方法。
最后,本发明提供一种终端,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述的癌症药物敏感性预测方法。
如上所述,本发明的癌症药物敏感性预测方法、系统、存储介质及终端,具有以下有益效果:
(1)采用基于激酶底物特征边的机器学习模型实现靶向药物的药效判别,从而提供癌症药物敏感性的准确预测;
(2)为扩充对转移性结直肠癌的理解提供了丰富的资源,并且为结直肠癌等癌症的个性化用药提供了宝贵的信息。
附图说明
图1显示为本发明的癌症药物敏感性预测方法于一实施例中的流程图;
图2显示为本发明的癌症药物敏感性预测系统于一实施例中的结构示意图;
图3显示为本发明的终端于一实施例中的结构示意图。
元件标号说明
21 获取模块
22 划分模块
23 训练模块
24 预测模块
31 处理器
32 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
由于磷酸化蛋白质数据能够显著区分出转移性癌和早发性结癌。同时通过结合蛋白质和磷酸化蛋白质组数据建立的激酶和底物相互作用网络能够有效地反应每个肿瘤对药物的反应。这些结果为癌转移病人的预测和治疗提供了蛋白质和磷酸化蛋白质的新特征。故本发明的癌症药物敏感性预测方法、系统、存储介质及终端采用基于激酶底物特征边的机器学习模型实现靶向药物的药效判别,从而提供癌症药物敏感性的准确预测。需要说明的是,本发明的癌症药物敏感性预测方法适用于所有激酶抑制剂类药物、与激酶底物网络调控相关的癌症药物。以下仅以结直肠癌药物为例进行描述,但并不限于结直肠癌药物。
如图1所示,于一实施例中,本发明的癌症药物敏感性预测方法包括以下步骤:
步骤S1、获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值。
于本发明一实施例中,基于微型患者源异种移植模型获取所述药物敏感值。为了准确预测结直肠癌药物敏感性,通过临床采集多个结直肠癌患者的微型患者源异种移植模型的药物敏感值和蛋白质组及磷酸化蛋白质组数据。其中,所述微型患者源异种移植模型包括原位癌组织和转移癌组织。
具体地,对结直肠癌患者的原位癌组织和肝转移癌组织分别进行了全外显子组测序(Whole Exome Sequencing,WES)、蛋白质组、磷酸化蛋白质组的数据采集与分析。WES是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。利用Spectronaut TM软件分别检索CCRC蛋白质组或磷酸化蛋白质组的杂交谱图库,进行蛋白质样品或磷酸化蛋白质样品的DIA原始数据文件的分析。校准设置为非线性iRT校准,并启用了精度iRT。使用5%q-value为阈值进行肽段前体离子、蛋白质水平数据筛选与鉴定,而诱饵库(decoys)的最大数量设置为文库大小的0.1。定量值选取MS/MS水平上的XIC峰面积,并启用交叉运行归一化。对于磷酸化蛋白质组数据,设置最小定量值为修饰肽段水平,并启用PTM定位,将定位概率阈值设为0以便对磷酸化肽段及磷酸化位点进行小结。根据MaxQuant策略,对磷酸化肽段及磷酸化位点进行定量计算,从而获得CCRC蛋白质组及磷酸化蛋白质组数据集。
在本发明中,所述药物敏感值采用肿瘤细胞生长抑制率(TCGI)来表示。于一实施例中,对于肿瘤标本,先用Hank’s平衡盐溶液(HBSS)清洗以去除黏液和坏死的肿瘤组织。迅速切碎后,用胶原酶在37℃下消化1-2h,600g离心制粒5min,磁珠去除血细胞和成纤维细胞。然后用HBSS洗涤细胞,填充到
Figure BDA0002653620240000051
胶囊中。每个胶囊包含大约2000个癌细胞。5周龄雌性nu/nu小鼠经皮肤小切口皮下植入3个胶囊。给予小鼠适当的对照或药物(对照组、阿法替尼Afatinib、吉非替尼Gefitinib或瑞格菲尼Regorafenib)。阿法替尼、吉非替尼、瑞格菲尼均口服,单次给药连续7天,剂量分别为20mg/kg、75mg/kg、30mg/kg体重。所有药物都用0.5%羟丙基甲基纤维素(HPMC)和0.2%Tween-80溶液溶解。对照组为等量0.5%HPMC和0.2%Tween-80溶液,相关小鼠以同样方式处理。每个治疗(对照或药物)都是在六份胶囊中完成的。所有小鼠胶囊取出后,使用CellTiter Glo发光细胞活力测定试剂盒测定每个胶囊中的肿瘤细胞增殖情况,再计算肿瘤细胞生长抑制率(TCGI)(%)。
步骤S2、获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集。
具体地,获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值。在进行网络训练时,首先需要将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集。所述训练数据集用于训练网络,所述测试数据集用于检验所训练的网络的可靠性。
其中,所述节点特征值为原位癌组织或肝转移癌组织中激酶蛋白质表达水平或底物磷酸化修饰水平相对于正常组织的表达量比值的log2转换数值。
所述边强度特征表示每一对激酶和底物之间的相关性,根据
Figure BDA0002653620240000061
将分子定量的数据node转换为表征分子之间相关性的边强度edge,其中xi,j,k代表来自于第k类的第j个样本的分子i的表达值,
Figure BDA0002653620240000062
Figure BDA0002653620240000063
分别表示该分子i在l类的平均值和标准差,u和v表示分子。在激酶底物网络中,node u代表激酶的表达量(蛋白质水平,癌组织与正常组织之间的比值取log2后的转换值),node v则代表底物磷酸化水平的表达量(磷酸化修饰水平,癌组织与正常组织之间的比值取log2后的转换值),<u,v>则表示特定的激酶和底物磷酸化之间的调控关系。
如果数据集总共有C个不同的类群,每一对分子之间将会有C个边的特征。假设总共有N个分子,转换将产生C×N×(N-1)/2个边的特征。注意第k类的分子u和v组成的边的特征向量
Figure BDA0002653620240000064
的均值是皮尔森相关系数:
Figure BDA0002653620240000065
PCC是用来刻画两个点之间相关性的指征,对于每一对分子将会产生C个PCC。
步骤S3、基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络。
弹性网络是一种使用L1、L2范数作为先验正则项训练的线性回归模型.这种组合允许学习到一个只有少量参数是非零稀疏的模型,就像Lasso一样,但是它仍然保持一些像Ridge的正则性质,是一不断叠代的方法。
于本发明一实施例中,对于所述训练数据集中的边强度特征或节点特征值,首先根据预设条件进行预选,再根据预选得到的边强度特征或节点特征值训练所述弹性网络。优选地,所述预设条件为边强度特征或节点特征值的皮尔森相关系数大于0.3。
具体地,将所述训练数据集中的边强度特征或节点特征值输入所述弹性网络,使预测得到的药物敏感值无限接近实际得到的药物敏感值。在所述弹性网络训练完成后,将所述测试数据集中的边强度特征或节点特征值输入训练好的弹性网络,验证预测得到的药物敏感值是否接近实际得到的药物敏感值;若是,则停止网络训练;若否,则继续训练所述弹性网络,直至预测得到的药物敏感值无限接近实际得到的药物敏感值。
于本发明一实施例中,在训练所述弹性网络时,计算预设药物敏感值和实际药物敏感值之间的皮尔森相关系数及P值以判断所述弹性网络的预测效果。
步骤S4、基于训练好的弹性网络进行癌症药物敏感性的预测。
具体地,对于待预测敏感性的癌症药物,将服用该药物的患者的蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值输入训练好的弹性网络,输出即为所述药物的敏感性预测值。
下面通过具体实施例来进一步阐述本发明的癌症药物敏感性预测方法。
在该实施例中,对来146例结直肠癌病人(CCRC)进行了多组学特征的研究,其中包括70例转移性结直肠癌(mCRC)以及76例早发性结直肠癌。采集每一个病人的原位癌组织(T)、远端正常组织(N)、正常癌旁组织(P)以及配对的血细胞(BC)。对于43个转移性的结直肠癌,还采集了肝转移的转移灶样本(LM)。首先对330个样本进行了外显子测序(WES),包括146对配对的原位癌和外周血或远端正常组织以及38个远端肝转移组织。同时通过MaxQuant和SpectronautTM产生了CCRC的蛋白质组以及磷酸化蛋白质组数据的混合色谱库,蛋白质组色谱库包含179382个前体离子、113291个肽段、11510个蛋白质家族以及9942个基因产物,而磷酸化蛋白质色谱库包含了116121个磷酸化前体离子、65851个磷酸化肽段、9977个磷酸化蛋白质家族以及7125个磷酸化基因产物。通过数据非依赖性采集(DIA)的方法对480个样本(包括146对T-N-P组织以及43个LM组织)分别进行了蛋白质和磷酸化的定量,得到了8450个蛋白质和47786个磷酸化位点的定量信息。CCRC数据集的病人都是在2015年到2019年之间进行了结直肠癌的手术,随访天数的中位数为1240天。
基于蛋白质组的分型反映了显著不同的基因组合蛋白质组特征,但是不同的亚型间并没有表现出显著的转移性结直肠癌的富集。故进一步探究磷酸化蛋白质组再区分转移性结直肠癌和早发性结直肠癌中的作用。首先从原发癌和正常组织之间鉴定到了1487个差异的磷酸化位点,为了更好地诠释转移和磷酸化蛋白质组数据之间的关系,在每一个蛋白质分型的亚类内部进行了差异磷酸化位点的一致性聚类分析。令人惊奇的是,磷酸化蛋白质组能够在每个蛋白质亚型内部区分出转移性结直肠癌和原发性结直肠癌(P=1.47x 10-5;卡房检验),并因此产生了6个基于磷酸化蛋白质组的分型。SC1、SC3和SC5主要包含转移性结直肠癌,而SC2、SC4和SC6中则主要是早发性结直肠癌。我们对磷酸化6个亚型之间差异的磷酸化位点进行了C-means聚类并发现了4个主要的变化模式。KEGG通路富集分析表明在SC1、SC3和SC5中高表达的磷酸化位点主要富集于细胞黏连、粘附连接、mTOR信号通路以及淋巴细胞跨膜转移通路。而在SC1、SC3和SC5中低表达的磷酸化位点则主要富集在ERBB2信号通路、抗原呈递以及Fc gamma R-介导的吞噬作用等。进一步根据
Figure BDA0002653620240000081
(PSP)中实验验证过的激酶和底物关系探究了每一个SC的磷酸化蛋白质调控网络。网络分析发现在SC1、SC3和SC5中激酶和底物之间的相关性大多为负相关,而SC2和SC4中正相关性变多。但是SC6的特征也是激酶和底物之间的负相关性较多,暗示着CC3中的早发性结直肠癌更像转移性的结直肠癌并可能有更差的预后。
考虑到癌症治疗中,蛋白质激酶与可行性药物靶点的密切联系,通过与远端正常组织比较,根据每个CC亚型中转移性CRC的原发癌组织和肝转移癌组织中富集的底物磷酸化水平来推测上游激酶的活性。通过激酶底物富集分析(Kinase-Substrate EnrichmentAnalysis,KSEA)可知,不同的CC亚类富集了不同的上游激酶,并且同一个CC亚类的原发癌组织和肝转移癌组织对同一上游激酶表现出不同的活性。例如,CDK5在CC1原位癌组织中呈现高活性,但CC1的肝转移癌组织和其他CC亚类中活性不高。同样的,MAPK1的高活性仅体现在CC3原位癌组织和肝转移癌组织中。
为了在蛋白质水平、磷酸化修饰水平上量化分析激酶活性和寻找临床可用的药物,分析了42对N-T或N-LM组织中激酶对应的磷酸化底物的丰度。将定量蛋白质组数据与
Figure BDA0002653620240000082
(PSP)或NetworKIN 3.0相结合,共发现251对激酶-磷酸化底物关系对。mCRC患者在不同癌组织和不同蛋白质亚型中,磷酸化底物和上游激酶的高度异质性。根据每对激酶-磷酸化底物之间的皮尔逊相关系数,构建每个蛋白质组亚型中原发性和转移性肿瘤的激酶-底物相关性网络。在CC1转移瘤中,CDK4与其磷酸化底物之间存在正相关,而在CC1原位瘤中未发现显著相关;MAPK3及其磷酸化底物在CC1或CC3亚群的原位瘤和转移性肿瘤之间发现了显著的相关性差异。在每个蛋白质组亚型之间,原位瘤和转移瘤之间的激酶-磷酸化底物相关性网络也存在显著差异。CC3激酶-磷酸化底物相关性网络与CC1的相似性大于与CC2的相似性。另外,CC亚型内部原位瘤和转移瘤之间的激酶-磷酸化底物相关性网络的差异也大于不同CC亚型的同种原位瘤之间的差异。这些观察结果提示,在临床治疗中与激酶-底物网络相应的激酶抑制剂药物会有个性化和肿瘤部位特异性的药物响应情况。
为了进一步探索结肠癌患者的药物反应潜力,为来源于22位患者的31个癌组织(9对原位癌-肝转移癌和13个其他原位癌组织)构建了31个miniPDX模型,并用三种激酶抑制剂(Afatinib、Gefitinib和Regorafenib)进行体内药理学试验。通过肿瘤细胞生长抑制(TCGI,%)来测量各肿瘤的药物反应效果,并确定了来自同一患者的原发性和转移性肿瘤对同一药物可能表现出不同的反应。
特别是,CCRC-0323患者对regorafenib表现出非常高的敏感性,这与患者的RAF1基因突变有关;然而,CCRC-0323患者虽然有ERBB2突变,但对ERBB2抑制剂Afatinib无良好应答。相比之下,CCRC-0397患者虽然没有携带RAF1突变,但对上述两种激酶抑制剂药物均敏感。研究发现,在31例miniPDX模型对应的肿瘤组织中,三种激酶抑制剂对应的基因很少发生突变,因而在目前的临床实践中,这些患者被排除在使用相应药物治疗的考虑之外;然而,一些患者在体内药物测试中显示出良好敏感性;这些都表明在指示治疗适宜性方面,基于磷酸化蛋白质组数据的判别可能比基因突变的存在与否更为敏感和更为直接。
接下来,探讨激酶-磷酸化底物网络和药物敏感性之间的关系。首先基于已有报道的方法构建了组织特异性的激酶-底物网络。激酶-底物关系对是基于
Figure BDA0002653620240000092
(PSP)数据库或NetworKIN 3.0预测。计算每个患者原发组织和转移组织的激酶-磷酸化底物之间的边强度。对于每个激酶-底物关系对,正的边强度表示激酶和底物磷酸化之间具有相同方向的表达量变化,负的边强度则表示反相关。
基于磷酸化蛋白质组数据和上述激酶-底物数据库或预测,提炼到1696个激酶-底物磷酸化的边强度特征,随后构建了弹性网络用于预测激酶抑制剂药物的反应。9对原位癌-肝转移癌的18个miniPDX体内药效数据和边强度特征作为训练集,其他的13个原位癌组织模型的相关数据作为训练集。值得注意的是,所有三种激酶抑制剂的预测和观察到的TCGI%之间都有很高的相关性。弹性网络分别选择了21对、17对和21对激酶-磷酸化底物的边特征用于预测激酶抑制剂药物Afatinib、Gefitinib和Regorafenib的药效反应,如表1所示。
表1、弹性网络分别选择的21对、17对和21对激酶-磷酸化底物的边特征
Figure BDA0002653620240000091
Figure BDA0002653620240000101
Figure BDA0002653620240000111
由表可知,与Afatinib敏感性密切相关的大多数选择的边特征,呈现激酶-磷酸化底物的负相关,而与Regorafenib敏感性相关的激酶-磷酸化底物的边特征,则呈现激酶-磷酸化底物的正相关。具体而言,EFGR与PTPN1-Y8这对激酶-磷酸化底物关系对的正相关,EFGR与IRS1-S3这对激酶-磷酸化底物关系对的负相关,这两个边特征都有助于判别Afatinib的治疗敏感性效果;这表明肿瘤治疗的药物反应性或敏感性不是由单一因素决定的,也不是表现出严格的正相关关系,而是反映了多组学数据中多个分子特征的总和。对于多靶点的激酶抑制剂药物Regorafenib而言,RAF1、PDGRFB和EHPA2这三种激酶相关的边特征都会综合影响该药物的反应判别,而RAF1相关的边特征对疗效判别起了主要的作用。相比之下,基于激酶或磷酸化底物表达值数据的点特征所构建的药物反应判别模型在预测药效的准确性比边特征要差。这些结果表明,激酶-磷酸化底物相关性网络在预测结肠癌患者的临床组织药物敏感性方面具有强大的潜力和深远的临床应用前景。
如图2所示,于一实施例中,本发明的癌症药物敏感性预测系统包括获取模块21、划分模块22、训练模块23和预测模块24。
所述获取模块21用于获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值。
所述划分模块22与所述获取模块21相连,用于获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集。
所述训练模块23与所述划分模块22相连,用于基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;
所述预测模块34与所述训练模块23相连,用于基于训练好的弹性网络进行癌症药物敏感性的预测。
其中,获取模块21、划分模块22、训练模块23和预测模块24的结构和原理与上述癌症药物敏感性预测方法中的步骤一一对应,故在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Singnal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
本发明的存储介质上存储有计算机程序,该程序被处理器执行时实现上述的癌症药物敏感性预测方法。所述存储介质包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
如图3所示,于一实施例中,本发明的终端包括:处理器31及存储器32。
所述存储器32用于存储计算机程序。
所述存储器32包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器31与所述存储器32相连,用于执行所述存储器32存储的计算机程序,以使所述终端执行上述的癌症药物敏感性预测方法。
优选地,所述处理器31可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明的癌症药物敏感性预测方法、系统、存储介质及终端采用基于激酶底物特征边的机器学习模型实现靶向药物的药效判别,从而提供癌症药物敏感性的准确预测;为扩充对转移性结直肠癌的理解提供了丰富的资源,并且为结直肠癌等癌症的个性化用药提供了宝贵的信息。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种癌症药物敏感性预测方法,其特征在于:包括以下步骤:
获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值;
获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集;
基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;
基于训练好的弹性网络进行癌症药物敏感性的预测。
2.根据权利要求1所述的癌症药物敏感性预测方法,其特征在于:基于微型患者源异种移植模型获取所述药物敏感值。
3.根据权利要求2所述的癌症药物敏感性预测方法,其特征在于:所述微型患者源异种移植模型包括原位癌组织和转移癌组织。
4.根据权利要求1所述的癌症药物敏感性预测方法,其特征在于:所述节点特征值为原位癌组织或肝转移癌组织中激酶蛋白质表达水平或底物磷酸化修饰水平相对于正常组织的表达量比值的log2转换数值。
5.根据权利要求1所述的癌症药物敏感性预测方法,其特征在于:所述边强度特征表示每一对激酶和底物之间的相关性,根据
Figure FDA0002653620230000011
将分子定量的数据node转换为表征分子之间相关性的边强度edge,其中xi,j,k代表来自于第k类的第j个样本的分子i的表达值,
Figure FDA0002653620230000012
Figure FDA0002653620230000013
分别表示该分子i在l类的平均值和标准差,u和v表示分子。
6.根据权利要求1所述的癌症药物敏感性预测方法,其特征在于:在训练所述弹性网络时,计算预设药物敏感值和实际药物敏感值之间的皮尔森相关系数及P值以判断所述弹性网络的预测效果。
7.根据权利要求1所述的癌症药物敏感性预测方法,其特征在于:对于所述训练数据集中的边强度特征或节点特征值,首先根据预设条件进行预选,再根据预选得到的边强度特征或节点特征值训练所述弹性网络。
8.一种癌症药物敏感性预测系统,其特征在于:包括获取模块、划分模块、训练模块和预测模块;
所述获取模块用于获取多个患者的蛋白质组、磷酸化蛋白质组数据和药物敏感值;
所述划分模块用于获取蛋白质组及磷酸化蛋白质组数据的边强度特征或节点特征值,将多个药效敏感值和对应的边强度特征或节点特征值划分为训练数据集和测试数据集;
所述训练模块用于基于所述训练数据集训练弹性网络以预测癌症药物敏感性,基于所述测试数据集来验证所述弹性网络;
所述预测模块用于基于训练好的弹性网络进行癌症药物敏感性的预测。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述的癌症药物敏感性预测方法。
10.一种终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行权利要求1至7中任一项所述的癌症药物敏感性预测方法。
CN202010879274.8A 2020-08-27 2020-08-27 癌症药物敏感性预测方法、系统、存储介质及终端 Pending CN114121150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010879274.8A CN114121150A (zh) 2020-08-27 2020-08-27 癌症药物敏感性预测方法、系统、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010879274.8A CN114121150A (zh) 2020-08-27 2020-08-27 癌症药物敏感性预测方法、系统、存储介质及终端

Publications (1)

Publication Number Publication Date
CN114121150A true CN114121150A (zh) 2022-03-01

Family

ID=80374699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010879274.8A Pending CN114121150A (zh) 2020-08-27 2020-08-27 癌症药物敏感性预测方法、系统、存储介质及终端

Country Status (1)

Country Link
CN (1) CN114121150A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116110509A (zh) * 2022-11-15 2023-05-12 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110014637A1 (en) * 2008-01-25 2011-01-20 Marian Hajduch Method For Determining The Sensitivity Of Patients Suffering From A Cancer Disease To Biological Therapy
WO2011034919A2 (en) * 2009-09-15 2011-03-24 H. Lee Moffitt Cancer Center And Research Institute, Inc. Sh2 domain profiling to characterize tyrosine phosphorylation signaling in cancer
US20120115754A1 (en) * 2009-04-10 2012-05-10 Robby Ruijtenbeek Method for diagnosing and/or typing renal cell carcinoma
CN107609326A (zh) * 2017-07-26 2018-01-19 同济大学 癌症精准医疗中的药物敏感性预测方法
US20180136220A1 (en) * 2015-05-29 2018-05-17 Cedars-Sinai Medical Center Correlated peptides for quantitative mass spectrometry
US20180291421A1 (en) * 2015-10-14 2018-10-11 Nitto Boseki Co., Ltd. Method for determining drug-sensitive human cell lines by analysis method in which measurement of activity of two types of protein kinase is used
CN108877953A (zh) * 2018-06-06 2018-11-23 中南大学 一种基于多相似性网络的药物敏感性预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110014637A1 (en) * 2008-01-25 2011-01-20 Marian Hajduch Method For Determining The Sensitivity Of Patients Suffering From A Cancer Disease To Biological Therapy
US20120115754A1 (en) * 2009-04-10 2012-05-10 Robby Ruijtenbeek Method for diagnosing and/or typing renal cell carcinoma
WO2011034919A2 (en) * 2009-09-15 2011-03-24 H. Lee Moffitt Cancer Center And Research Institute, Inc. Sh2 domain profiling to characterize tyrosine phosphorylation signaling in cancer
US20180136220A1 (en) * 2015-05-29 2018-05-17 Cedars-Sinai Medical Center Correlated peptides for quantitative mass spectrometry
US20180291421A1 (en) * 2015-10-14 2018-10-11 Nitto Boseki Co., Ltd. Method for determining drug-sensitive human cell lines by analysis method in which measurement of activity of two types of protein kinase is used
CN107609326A (zh) * 2017-07-26 2018-01-19 同济大学 癌症精准医疗中的药物敏感性预测方法
CN108877953A (zh) * 2018-06-06 2018-11-23 中南大学 一种基于多相似性网络的药物敏感性预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LI-RONG YU ET, AL.: "Phosphoproteomics for the discovery of kinases as cancer biomarkers and drug targets", PROTEOMICS CLIN. APPL., vol. 1, 31 December 2007 (2007-12-31) *
SOPHIA DOLL ET, AL.: "The Case for Proteomics and Phospho-Proteomics in Personalized Cancer Medicine", PROTEOMICS CLIN. APPL., vol. 13, 31 December 2019 (2019-12-31) *
石文昊;童梦莎;李恺;王钰;丁琛;: "基于质谱的磷酸化蛋白质组学:富集、检测、鉴定和定量", 生物化学与生物物理进展, no. 12, 20 December 2018 (2018-12-20) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116110509A (zh) * 2022-11-15 2023-05-12 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置
CN116110509B (zh) * 2022-11-15 2023-08-04 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置

Similar Documents

Publication Publication Date Title
Das et al. Integration of online omics-data resources for cancer research
JP2020522690A (ja) 肺疾病の特定又はモニタリング方法及びシステム
Han et al. Unique protein expression signatures of survival time in kidney renal clear cell carcinoma through a pan-cancer screening
Yu et al. A strategy for evaluating pathway analysis methods
RU2741703C1 (ru) Платформа анализа генетической информации oncobox
CN114121150A (zh) 癌症药物敏感性预测方法、系统、存储介质及终端
Ye et al. Combinatory strategy using nanoscale proteomics and machine learning for T cell subtyping in peripheral blood of single multiple myeloma patients
Zhang et al. A method for identifying discriminative isoform-specific peptides for clinical proteomics application
Bhattacharya et al. DeCompress: tissue compartment deconvolution of targeted mRNA expression panels using compressed sensing
Abu-Asab et al. Identifying early events of gene expression in breast cancer with systems biology phylogenetics
Jørgensen et al. Untangling the intracellular signalling network in cancer—A strategy for data integration in acute myeloid leukaemia
CN113593717B (zh) 当归六黄汤治疗溃疡性结肠炎作用机制的研究方法
Mishra et al. Pan-cancer analysis for studying cancer stage using protein expression data
Liu et al. A novel gene and pathway-level subtyping analysis scheme to understand biological mechanisms in complex disease: a case study in rheumatoid arthritis
Liu et al. Identification and validation of a novel tumor driver gene signature for diagnosis and prognosis of head and neck squamous cell carcinoma
Arslan et al. Large-scale systematic feasibility study on the pan-cancer predictability of multi-omic biomarkers from whole slide images with deep learning
Yang et al. A novel signature based on Anoikis associated with BCR-free survival for prostate cancer
Melas et al. Identification of signaling pathways related to drug efficacy in hepatocellular carcinoma via integration of phosphoproteomic, genomic and clinical data
Chen et al. Identification and analysis of genes involved in stages of colon cancer
Liu et al. Uncovering nasopharyngeal carcinoma from chronic rhinosinusitis and healthy subjects using routine medical tests via machine learning
Hung et al. Revealing pathway maps of renal cell carcinoma by gene expression change
Zhou et al. The inflammatory response‐related robust machine learning signature in endometrial cancer: Based on multi‐cohort studies
Ulaganathan Network-based Computational Drug Repurposing and Repositioning for Breast Cancer Disease
Neumann et al. PATH-16. HISTOPATHOLOGICAL EPENDYMOMA VARIANTS ARE ASSOCIATED WITH DISTINCT CLINICAL PARAMETERS AND DNA METHYLATION PATTERNS
Meng et al. Mapping the immunological battlefield in gastric cancer: prognostic implications of an immune gene expression signature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination