CN110277174B - 一种基于神经网络的抗癌药物协同作用的预测方法 - Google Patents
一种基于神经网络的抗癌药物协同作用的预测方法 Download PDFInfo
- Publication number
- CN110277174B CN110277174B CN201910513981.2A CN201910513981A CN110277174B CN 110277174 B CN110277174 B CN 110277174B CN 201910513981 A CN201910513981 A CN 201910513981A CN 110277174 B CN110277174 B CN 110277174B
- Authority
- CN
- China
- Prior art keywords
- neural network
- dimensional tensor
- characteristic
- dimensional
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Toxicology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Chemical & Material Sciences (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种基于神经网络的抗癌药物协同作用的预测方法,该方法是利用神经网络模型实现的,所述神经网络模型包含卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型;利用卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,能更加方便、快速降低数据的维度,减少模型训练的复杂度;该方法能够从多维度特征学习抗癌药物的潜在协同关系,其预测模型的预测精度高,可以帮助临床实验减少时间和金钱成本,快速定位有效的药物组合。
Description
技术领域
本发明涉及生物信息学及深度学习技术领域,尤其是一种基于神经网络的抗癌药物协同作用的预测方法。
背景技术
药物的抗药性在癌症的治疗中仍然是一个巨大的挑战,药物联合治疗有望降低病人对抗癌药物的耐药性。虽然药物联合治疗在癌症的治疗中是一个公认可行的概念,但由于药物组合空间太大,识别新的药物组合是一个重要的任务,基于最近的大规模药物组合筛选数据,利用计算模型测试药物组合已经成为节约时间和成本的有效方法,基于目前的科技发展水平,计算模型仅考虑了癌症细胞系的基因表达数据,且在处理更高维的数据(几万乃至几十万)时,模型需要训练的参数多到难以训练,对GPU资源要求高,运行速度慢,因此需要设计一种基于神经网络的抗癌药物协同作用的预测方法。
本发明就是为了解决以上问题而进行的改进。
发明内容
本发明需要解决的技术问题是提供一种方便、快速降低数据的维度,减少模型训练的复杂度,快速定位有效的药物组合的基于神经网络的抗癌药物协同作用的预测方法。
本发明为解决其技术问题所采用的技术方案是:
一种基于神经网络的抗癌药物协同作用的预测方法,该方法是利用神经网络模型实现的,所述神经网络模型包含卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,该方法的实施步骤为:
S1、搜集整合抗癌药物的化学特征和癌症细胞系的基因表达特征、基因突变特征、基因拷贝数变异特征,对应于已知的大规模药物组合筛选数据形成相应的二维张量;
S2、标准化步骤S1中的抗癌药物化学特征的二维张量,并将此二维张量输入到神经网络模型中输出一个特征维度的二维张量;
S3、标准化步骤S1中的癌症细胞系的基因表达特征的二维张量,并将此二维张量输入到神经网络模型中输出一个特征维度的二维张量;
S4、将步骤S1中的基因突变特征、基因拷贝数变异特征使用one-hot编码并形成相应的二维张量;
S5、将步骤S4中的二维张量输入到神经网络模型中输出特征维度的二维张量;
S6、将步骤S2、S3和S5中产生的特征二维张量进行连接合并,将整合后的二维张量输入到神经网络模型中进行深度学习训练;
S7、对步骤S2-S6中构建的各种神经网络模型进行优化调整参数,验证模型;
进一步的,所述步骤S1中整合抗癌药物的化学特征和癌症细胞系的基因表达特征、基因突变特征、基因拷贝数变异特征是从互联网公开的数据库中搜集的;
更进一步的,所述步骤S1中的二维张量为药物A-药物B和药物B-药物A的化学特征二维张量、基因表达特征二维张量、基因突变特征二维张量、基因拷贝数变异特征二维张量;
所述步骤S2中还需共享药物组合中不同抗癌药物化学特征的DNN层权重,输出的为特征维度为2048的二维张量;
具体的,所述步骤S3中的神经网络模型为卷积神经网络CNN1D降维模型;
所述二维张量输入到基因表达特征的卷积神经网络CNN1D降维模型中,还需要连接一个密集连接层DNN层;
其中,所述步骤S4中癌症细胞系基因突变数据和基因拷贝数变异数据是文本格式;
所述步骤S5中的特征维度的二维张量分别为256的二维张量和128的二维张量;
所述步骤S6中的神经网络模型为3层锥形神经网络DNN回归模型。
工作原理:通过卷积神经网络CNN1D对基因表达特征降维、通过神经网络DNN对基因突变特征和基因拷贝数变异特征降维,将降维后数据特征的二维张量连接合并,然后采用3层锥形结构神经网络DNN模型构建药物组合在癌症细胞系上协同作用的预测模型。
本发明的优点在于:利用卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,能更加方便、快速降低数据的维度,减少模型训练的复杂度;该方法能够从多维度特征学习抗癌药物的潜在协同关系,其预测模型的预测精度高,可以帮助临床实验减少时间和金钱成本,快速定位有效的药物组合。
附图说明
图1是本发明提出的一种基于神经网络的抗癌药物协同作用的预测方法中神经网络预测模型的结构图。
图2是相同药物组合的不同药物顺序结果图。
图3是模型在测试集上的ROC(受试者工作特征)曲线。
图4是模型在测试集上的预测结果图。
其中,图1中input1和input2表示第一种药物和第二种药物的化学特征的输入、input3表示癌症细胞系的基因表达特征的输入、inpu4表示癌症细胞系的基因突变特征的输入、input5表示癌症细胞系的基因拷贝数变异特征的输入、InputLayer代表输入层、Conv1D代表卷积CNN1D层、Flatten代表展平层、Dense代表DNN层、Dropout代表随机失活层;图2中X轴代表药物A-药物B-细胞系的协同作用值、Y轴代表药物B-药物A-细胞系的协同作用值、Pearson代表相同药物组合的不同药物顺序之间的皮尔逊系数;图3中X轴FalsePositive Rate是假正例率、Y轴True Positive Rate是真正例率、AUC代表曲线下的面积;图4中X轴代表实验测得的协同作用值、Y轴代表模型预测的协同作用值。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合图示与具体实施例,进一步阐述本发明。
参照图1至图4所示,该一种基于神经网络的抗癌药物协同作用的预测方法,该方法是利用神经网络模型实现的,所述神经网络模型包含卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,该方法的实施步骤为:
步骤S1,从互联网公开数据库搜集整合抗癌药物的化学特征和癌症细胞系的基因表达特征、基因突变特征、基因拷贝数变异特征,对应于已知的大规模药物组合筛选数据(药物组合-细胞系-协同作用值),形成药物A-药物B和药物B-药物A的化学特征二维张量、基因表达特征二维张量、基因突变特征二维张量、基因拷贝数变异特征二维张量;
步骤S2,标准化抗癌药物化学特征的二维张量,然后将二维张量输入到药物的神经网络模型中,并且共享药物组合中不同抗癌药物化学特征的DNN层权重,最后输出为一个特征维度为2048的二维张量;
步骤S3,标准化癌症细胞系基因表达特征二维张量,然后将二维张量输入到基因表达特征的卷积神经网络CNN1D降维模型中,再连接一个密集连接层DNN层,最后输出特征维度为4096的二维张量;
步骤S4,癌症细胞系基因突变数据和基因拷贝数变异数据是文本格式,对其使用one-hot编码,形成基因突变特征和基因拷贝数变异特征二维张量;
步骤S5,然后将步骤S4中的二维张量输入到各自的神经网络DNN模型中降维,最后分别输出特征维度为256和128的二维张量;
步骤S6,将步骤S2、S3和S5中产生的特征二维张量进行连接合并,将整合后的二维张量输入到神经网络模型中进行深度学习训练;
S7、对步骤S2-S6中构建的各种神经网络模型进行优化调整参数,验证模型。
其中,CNN1D降维一般包括下列步骤:
第一步、对数据进行标准化处理。标准化处理即对数据张量的每个维度中的所有元素,减去其维度的均值,再除以每个维度的标准差,得到的新数据张量就是标准化后的数据
第二步、因为卷积神经网络CNN1D只能处理样本为二维的数据,所以需要将样本向量变形为二维张量。
第三步、将变形后的数据张量输入到卷积神经网络CNN1D降维模型中,优化调整参数。
第四步、将降维后的样本数据再展平为一维数据。
具体结果如表1和表2所示:
表1:模型在测试集上的回归性能
MSE是均方误差(mean squared error),MAE是平均绝对误差(Mean AbsoluteDeviation),Pearson correlation是皮尔逊相关系数(Pearson correlationcoefficient),R2是决定系数(coefficient ofdetermination),Rank correlation是秩相关系数(Coefficient ofRank Correlation)。
模型 | ACC | ROC AUC | PR AUC | Kappa | |
本发明 | 0.951 | 0.933 | 0.586 | 0.450 | |
现有技术 | 0.950 | 0.927 | 0.531 | 0.442 |
表2:模型在测试集上的分类性能
分类性能的协同作用值阈值为30,协同作用值高于30的药物组合被认为是正类,低于30的药物组合被认为是拮抗的和低协同的。ACC是准确率(Accuracy),ROC AUC是ROC曲线下的面积(Receiver Operating Characteristic Area under Curve),PRAUC是PR曲线下的面积(Precision RecallArea under Curve),Kappa是kappa系数(Cohen's Kappa)。
通过卷积神经网络CNN1D对基因表达特征降维、通过神经网络DNN对基因突变特征和基因拷贝数变异特征降维,将降维后数据特征的二维张量连接合并,然后采用3层锥形结构神经网络DNN模型构建药物组合在癌症细胞系上协同作用的预测模型。
利用卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,能更加方便、快速降低数据的维度,减少模型训练的复杂度;该方法能够从多维度特征学习抗癌药物的潜在协同关系,其预测模型的预测精度高,可以帮助临床实验减少时间和金钱成本,快速定位有效的药物组合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等同物界定。
Claims (5)
1.一种基于神经网络的抗癌药物协同作用的预测方法,该方法是利用神经网络模型实现的,其特征在于:
所述神经网络模型包含卷积神经网络CNN1D降维和神经网络DNN回归构建的预测模型,该方法的实施步骤为:
S1、搜集整合抗癌药物的化学特征和癌症细胞系的基因表达特征、基因突变特征、基因拷贝数变异特征,对应于已知的大规模药物组合筛选数据形成相应的二维张量;
S2、标准化步骤S1中的抗癌药物化学特征的二维张量,并将此二维张量输入到神经网络模型中输出一个特征维度的二维张量,其中,步骤S2中,共享药物组合中不同抗癌药物化学特征的DNN层权重,输出的为特征维度为2048的二维张量;
S3、标准化步骤S1中的癌症细胞系的基因表达特征的二维张量,并将此二维张量输入到神经网络模型中输出一个特征维度的二维张量,其中,步骤S3中的神经网络模型为卷积神经网络CNN1D降维模型,所述二维张量输入到基因表达特征的卷积神经网络CNN1D降维模型中时,连接一个密集连接层DNN层;
S4、将步骤S1中的基因突变特征、基因拷贝数变异特征使用one-hot编码并形成相应的二维张量;
S5、将步骤S4中的二维张量输入到神经网络模型中输出特征维度的二维张量;
S6、将步骤S2、S3和S5中产生的特征二维张量进行连接合并,将整合后的二维张量输入到神经网络模型中进行深度学习训练,其中,步骤S6中的神经网络模型为3层锥形神经网络DNN回归模型;
S7、对步骤S2-S6中构建的各种神经网络模型进行优化调整参数,验证模型。
2.如权利要求1所述的一种基于神经网络的抗癌药物协同作用的预测方法,其特征在于,所述步骤S1中整合抗癌药物的化学特征和癌症细胞系的基因表达特征、基因突变特征、基因拷贝数变异特征是从互联网公开的数据库中搜集的。
3.如权利要求2所述的一种基于神经网络的抗癌药物协同作用的预测方法,其特征在于,所述步骤S1中的二维张量为药物A-药物B和药物B-药物A的化学特征二维张量、基因表达特征二维张量、基因突变特征二维张量、基因拷贝数变异特征二维张量。
4.如权利要求1所述的一种基于神经网络的抗癌药物协同作用的预测方法,其特征在于,所述步骤S4中癌症细胞系基因突变数据和基因拷贝数变异数据是文本格式。
5.如权利要求1所述的一种基于神经网络的抗癌药物协同作用的预测方法,其特征在于,所述步骤S5中的特征维度的二维张量分别为256的二维张量和128的二维张量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910513981.2A CN110277174B (zh) | 2019-06-14 | 2019-06-14 | 一种基于神经网络的抗癌药物协同作用的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910513981.2A CN110277174B (zh) | 2019-06-14 | 2019-06-14 | 一种基于神经网络的抗癌药物协同作用的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110277174A CN110277174A (zh) | 2019-09-24 |
CN110277174B true CN110277174B (zh) | 2023-10-13 |
Family
ID=67960778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910513981.2A Active CN110277174B (zh) | 2019-06-14 | 2019-06-14 | 一种基于神经网络的抗癌药物协同作用的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110277174B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112599207A (zh) * | 2020-12-23 | 2021-04-02 | 上海海洋大学 | 基于通路活性及弹性网的癌症药物敏感性预测方法 |
CN112635080A (zh) * | 2021-01-15 | 2021-04-09 | 复星领智(上海)医药科技有限公司 | 基于深度学习的药物预测方法和设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6658396B1 (en) * | 1999-11-29 | 2003-12-02 | Tang Sharon S | Neural network drug dosage estimation |
US7058616B1 (en) * | 2000-06-08 | 2006-06-06 | Virco Bvba | Method and system for predicting resistance of a disease to a therapeutic agent using a neural network |
CN1876172A (zh) * | 2005-06-02 | 2006-12-13 | 北京中医药大学 | Bp神经网络模型方法制备药物组合物 |
CN107609326A (zh) * | 2017-07-26 | 2018-01-19 | 同济大学 | 癌症精准医疗中的药物敏感性预测方法 |
CN108280320A (zh) * | 2018-01-23 | 2018-07-13 | 上海市同济医院 | 一种基于深度学习的快速精准高通量药物筛选系统 |
CN108389201A (zh) * | 2018-03-16 | 2018-08-10 | 北京推想科技有限公司 | 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020077756A1 (en) * | 1999-11-29 | 2002-06-20 | Scott Arouh | Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation |
EP3542296B1 (en) * | 2016-11-18 | 2021-04-14 | NantOmics, LLC | Methods and systems for predicting dna accessibility in the pan-cancer genome |
-
2019
- 2019-06-14 CN CN201910513981.2A patent/CN110277174B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6658396B1 (en) * | 1999-11-29 | 2003-12-02 | Tang Sharon S | Neural network drug dosage estimation |
US7058616B1 (en) * | 2000-06-08 | 2006-06-06 | Virco Bvba | Method and system for predicting resistance of a disease to a therapeutic agent using a neural network |
CN1876172A (zh) * | 2005-06-02 | 2006-12-13 | 北京中医药大学 | Bp神经网络模型方法制备药物组合物 |
CN107609326A (zh) * | 2017-07-26 | 2018-01-19 | 同济大学 | 癌症精准医疗中的药物敏感性预测方法 |
CN108280320A (zh) * | 2018-01-23 | 2018-07-13 | 上海市同济医院 | 一种基于深度学习的快速精准高通量药物筛选系统 |
CN108389201A (zh) * | 2018-03-16 | 2018-08-10 | 北京推想科技有限公司 | 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法 |
Non-Patent Citations (3)
Title |
---|
S4-120304 "Prediction results of retrained ETSI EG 202 396-3 model";Audience等;《3GPP tsg_sa\WG4_CODEC》;20120407;全文 * |
戴康 ; 王晓琼 ; .神经网络在药动学评价中的应用.医药导报.2007,(09),全文. * |
神经网络用于抗癌药物蛋白质酪氨酸激酶抑制剂苄叉丙二腈衍生物QSAR研究;李志良等;《广西化工》;20001231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110277174A (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | A generic sure independence screening procedure | |
Witten et al. | New insights and faster computations for the graphical lasso | |
Sussman et al. | A consistent adjacency spectral embedding for stochastic blockmodel graphs | |
US20160048578A1 (en) | Determination of composite clusters | |
CN110287983A (zh) | 基于最大相关熵深度神经网络单分类器异常检测方法 | |
CN110277174B (zh) | 一种基于神经网络的抗癌药物协同作用的预测方法 | |
Reddy et al. | Comparison of deep learning models for biometric-based mobile user authentication | |
Yang et al. | Semi‐supervised low‐rank representation graph for pattern recognition | |
Henríquez et al. | Twitter sentiment classification based on deep random vector functional link | |
Koval | Data preparation for neural network data analysis | |
Mahapatra et al. | Reduced feature based efficient cancer classification using single layer neural network | |
Baswade et al. | A comparative study of k-means and weighted k-means for clustering | |
CN107292320A (zh) | 系统及其指标优化方法及装置 | |
CN113470799A (zh) | 一种医院综合质量监督平台智能化编辑器 | |
CN108846128A (zh) | 一种基于自适应噪音降噪编码器的跨领域文本分类方法 | |
Madhu et al. | A new paradigm for development of data imputation approach for missing value estimation | |
CN116303386A (zh) | 一种基于关系图谱的缺失数据智能插补方法和系统 | |
Gomes et al. | Multi-level hypothesis testing for populations of heterogeneous networks | |
Yaghini et al. | GOFAM: a hybrid neural network classifier combining fuzzy ARTMAP and genetic algorithm | |
EP3444759A1 (en) | Synthetic rare class generation by preserving morphological identity | |
Gogebakan et al. | Mixture model clustering using variable data segmentation and model selection: a case study of genetic algorithm | |
Djumanov et al. | Methods and algorithms of selection the informative attributes in systems of adaptive data processing for analysis and forecasting | |
Ni et al. | An adaptive extreme learning machine algorithm and its application on face recognition | |
US20160342643A1 (en) | System and Method for Cleansing Website Traffic Data | |
Thangavel et al. | Optimization of code book in vector quantization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |