CN114613512A - 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质 - Google Patents

一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114613512A
CN114613512A CN202210199573.6A CN202210199573A CN114613512A CN 114613512 A CN114613512 A CN 114613512A CN 202210199573 A CN202210199573 A CN 202210199573A CN 114613512 A CN114613512 A CN 114613512A
Authority
CN
China
Prior art keywords
breast cancer
drug
screening
candidate
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210199573.6A
Other languages
English (en)
Inventor
陈龙
王海晖
黄茜
陈言璞
钟学洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Institute of Technology
Original Assignee
Wuhan Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Institute of Technology filed Critical Wuhan Institute of Technology
Priority to CN202210199573.6A priority Critical patent/CN114613512A/zh
Publication of CN114613512A publication Critical patent/CN114613512A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质,该方法包括:根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;建立初始抗乳腺癌候选药物筛选神经网络模型;根据所述抗乳腺癌候选药物用药特征数据,对所述初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;将待筛选抗乳腺癌候选药物数据输入至所述目标抗乳腺癌候选药物筛选神经网络模型,对所述待筛选抗乳腺癌候选药物进行筛选。本发明通过粒子群算法优化神经网络模型,实现对药物的筛选,降低了个体差异的影响,并且能够对多种药物进行筛选。

Description

一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质
技术领域
本发明涉及医疗与人工智能技术领域,尤其涉及一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质。
背景技术
乳腺癌是目前世界上最常见,致死率较高的癌症之一,其发展与雌激素受体密切相关。据2021年全球癌症统计结果显示,约1810万新发癌症病例中,乳腺癌占11.6%;960万新发癌症死亡病例中,乳腺癌占6.6%;于女性癌症新发病例及死亡病例中均高居第1位;在我国女性患者中,乳腺癌的发病率高于其他癌症,形势严峻。
目前的乳腺癌治疗采用精准化及综合性的治疗原则,采用数据挖掘的技术和相应的智能优化算法来解决医疗企业在治疗乳腺癌的候选药物的选择过程中的操作变量之间的关系。还可以通过选择耐药乳腺癌细胞株筛选的方法,确认细胞株对于抗乳腺癌药物的抗性,适用于针对特定的耐药性药物,得到匹配的增敏性药物,从而有利于针对特定耐药乳腺癌患者进行精准化医学治疗。
采用数据挖掘的技术和相应的智能优化算法时,由于个体差异大,用药不存在绝对的最好、最快、最有效。选择耐药乳腺癌细胞株筛选的方法仅针对特定的耐药性药物,有利于针对特定耐药乳腺癌患者进行精准化医学治疗。
发明内容
有鉴于此,有必要提供一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质,用以解决现有技术中个体差异大,难以找到最佳用药方法以及只能考虑特定药物的治疗情况的问题。
为达到上述技术目的,本发明采取了以下技术方案:
第一方面,本发明提供了一种抗乳腺癌候选药物筛选方法,包括:
根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立初始抗乳腺癌候选药物筛选神经网络模型;
根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
将待筛选抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,对待筛选抗乳腺癌候选药物进行筛选。
优选的,根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型,包括:
将抗乳腺癌候选药物用药特征数据进行处理,得到抗乳腺癌候选药物用药样本数据;
通过粒子群算法,确定初始抗乳腺癌候选药物筛选神经网络模型的参数;
根据抗乳腺癌候选药物用药样本数据以及初始抗乳腺癌候选药物筛选神经网络模型的参数,确定目标抗乳腺癌候选药物筛选神经网络模型。
优选的,根据抗乳腺癌候选药物用药样本数据以及初始抗乳腺癌候选药物筛选神经网络模型的参数,确定目标抗乳腺癌候选药物筛选神经网络模型,包括:
以抗乳腺癌候选药物用药样本数据作为输入,以IC50值和对应的pIC50值作为输出,对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,直至达到预设精度要求或者预设迭代次数,得到目标抗乳腺癌候选药物筛选神经网络模型。
优选的,设置初始抗乳腺癌候选药物筛选神经网络模型的参数,包括:设置初始抗乳腺癌候选药物筛选神经网络模型的隐含层参数、输入层参数以及输出层参数。
优选的,设置初始抗乳腺癌候选药物筛选神经网络模型的参数之后,还包括:根据预设优化器,确定初始抗乳腺癌候选药物筛选神经网络模型的网络参数。
优选的,根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据,包括:
对抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据;
根据预设方法,从完善的抗乳腺癌候选药物用药数据筛选出初始抗乳腺癌候选药物用药特征数据;
对初始抗乳腺癌候选药物用药特征数据进行评价测试,得到抗乳腺癌候选药物用药特征数据。
优选的,对抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据,包括:
当抗乳腺癌候选药物用药数据中只含有部分时间点的位点,且残缺的数据较多,不能补充时,将此类位点删除;
当抗乳腺癌候选药物用药数据中全部数据为空值的位点,将此类位点按行删除;
当抗乳腺癌候选药物用药数据中部分数据为空值的位点,采用预设时间范围内的数据平均值替换此类位点;
计算抗乳腺癌候选药物用药数据余下的每一列数据的平均值,将所有数据除以其对应列的平均值代替原始值,若平均值为零,那么用零代替原始值,得到完善的抗乳腺癌候选药物用药数据。
第二方面,本发明还提供了一种抗乳腺癌候选药物筛选装置,包括:
处理模块,用于根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立模块,用于建立初始抗乳腺癌候选药物筛选神经网络模型;
优化模块,用于根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
筛选模块,用于将待筛选抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,对待筛选抗乳腺癌候选药物进行筛选。
第三方面,本发明还提供了一种电子设备,包括存储器和处理器,其中,
存储器,用于存储程序;
处理器,与存储器耦合,用于执行存储器中存储的程序,以实现上述任一种实现方式中的抗乳腺癌候选药物筛选方法中的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,用于存储计算机可读取的程序或指令,程序或指令被处理器执行时,能够实现上述任一种实现方式中的抗乳腺癌候选药物筛选方法中的步骤。
采用上述实施例的有益效果是:本发明提供的一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质,对初始抗乳腺癌候选药物数据进行处理完善,建立初始神经网络模型,基于粒子群算法,对初始神经网络模型进行训练,得到训练完备的神经网络模型,再通过训练完备的神经网络模型对抗乳腺癌候选药物进行筛选,避免了不同个体差异带来的影响,并且可以针对多种药物进行筛选。
附图说明
图1为本发明提供的抗乳腺癌候选药物筛选方法的一实施例的流程示意图;
图2为本发明提供的抗乳腺癌候选药物筛选神经网络模型优化的一实施例的流程示意图;
图3为本发明提供的对抗乳腺癌候选药物用药数据进行处理的一实施例的流程示意图;
图4为本发明提供的对抗乳腺癌候选药物用药数据进行预处理的一实施例的流程示意图;
图5为本发明提供的抗乳腺癌候选药物筛选装置的一实施例的结构示意图;
图6为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明提供了一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质,以下分别进行说明。
请参阅图1,图1为本发明提供的抗乳腺癌候选药物筛选方法的一实施例的流程示意图,本发明的一个具体实施例,公开了一种抗乳腺癌候选药物筛选方法,包括:
S101、根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
S102、建立初始抗乳腺癌候选药物筛选神经网络模型;
S103、根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
S104、将待筛选抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,对待筛选抗乳腺癌候选药物进行筛选。
在本发明具体的实施例中,步骤S101获取到的抗乳腺癌候选药物用药数据数量多,采集可能会出现缺陷,导致采集数据不完整,首先需要对采集数据进行处理,完善采集数据,然后对采集数据进行预处理,从中筛选出符合要求的数据,用于后续使用。
在本发明具体的实施例中,步骤S102建立的初始抗乳腺癌候选药物筛选神经网络模型为BP神经网络模型,通过该神经网络模型对抗乳腺癌候选药物进行筛选。
在本发明具体的实施例中,步骤S103需要对初始抗乳腺癌候选药物筛选神经网络模型进行训练,提高其筛选的准确性,将抗乳腺癌候选药物用药特征数据作为输入,实现对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,最终得到满足要求的目标抗乳腺癌候选药物筛选神经网络模型。
在本发明具体的实施例中,步骤S104对待筛选的抗乳腺癌候选药物数据进行筛选,将待筛选的抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,即可得到待筛选抗乳腺癌候选药物的筛选结果。
与现有技术相比,本实施例提供的一种抗乳腺癌候选药物筛选方法,对初始抗乳腺癌候选药物数据进行处理完善,建立初始神经网络模型,基于粒子群算法,对初始神经网络模型进行训练,得到训练完备的神经网络模型,再通过训练完备的神经网络模型对抗乳腺癌候选药物进行筛选,避免了不同个体差异带来的影响,并且可以针对多种药物进行筛选。
请参阅图2,图2为本发明提供的抗乳腺癌候选药物筛选神经网络模型优化的一实施例的流程示意图,在本发明的一些实施例中,根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型,包括:
S201、将抗乳腺癌候选药物用药特征数据进行处理,得到抗乳腺癌候选药物用药样本数据;
S202、通过粒子群算法,确定初始抗乳腺癌候选药物筛选神经网络模型的参数;
S203、根据抗乳腺癌候选药物用药样本数据以及初始抗乳腺癌候选药物筛选神经网络模型的参数,确定目标抗乳腺癌候选药物筛选神经网络模型。
在本发明具体的实施例中,步骤S201将抗乳腺癌候选药物用药特征数据进行分组,分别得到数据训练集、数据验证集以及数据测试集,即为抗乳腺癌候选药物用药样本数据,分别用于对抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试。
在本发明具体的实施例中,步骤S202神经网络模型具有多个参数,如输入层维度、输出层节点隐含层节点等,通过粒子群算法,确定抗乳腺癌候选药物筛选神经网络模型的参数。
在本发明具体的实施例中,步骤S203通过对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试以及粒子群算法确定抗乳腺癌候选药物筛选神经网络模型的参数,最终得到满足要求的目标抗乳腺癌候选药物筛选神经网络模型。
在上述实施例中,通过对抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,并且通过粒子群算法确定模型的参数,使模型能够满足对抗乳腺癌候选药物进行筛选的要求。
在本发明的一些实施例中,根据抗乳腺癌候选药物用药样本数据以及初始抗乳腺癌候选药物筛选神经网络模型的参数,确定目标抗乳腺癌候选药物筛选神经网络模型,包括:
以抗乳腺癌候选药物用药样本数据作为输入,以IC50值和对应的pIC50值作为输出,对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,直至达到预设精度要求或者预设迭代次数,得到目标抗乳腺癌候选药物筛选神经网络模型。
在上述实施例中,通过对初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试以及粒子群算法确定抗乳腺癌候选药物筛选神经网络模型的参数,对模型的筛选结果进行不断的优化调整,当其满足预设的精度要求或者设置的迭代次数时,即得到了目标抗乳腺癌候选药物筛选神经网络模型。
在本发明的一些实施例中,设置初始抗乳腺癌候选药物筛选神经网络模型的参数,包括:设置初始抗乳腺癌候选药物筛选神经网络模型的隐含层参数、输入层参数以及输出层参数。
在上述实施例中,设置神经网络模型的隐含层和输出层的激励函数为ReLU激活函数,网络训练函数为traingdx,网络性能函数为均方差损失函数MSE,再设定隐含层的神经元数初步设为10,可以根据实际情况进行合适的调整。
在本发明的一些实施例中,设置初始抗乳腺癌候选药物筛选神经网络模型的参数之后,还包括:根据预设优化器,确定初始抗乳腺癌候选药物筛选神经网络模型的网络参数。
在上述实施例中,优化器采用的是Adam,优化器的作用就是为了获得最优的网络参数。Adam这个名字来源于自适应矩估计(Adaptive Moment Estimation),也是梯度下降算法的一种变形,但是每次迭代参数的学习率都有一定的范围,不会因为梯度很大而导致学习率(步长)也变得很大,参数的值相对比较稳定。设定的网络参数,将网络迭代次数epochs为500次,期望误差goal为0.00001,学习速率lr为0.001。
请参阅图3,图3为本发明提供的对抗乳腺癌候选药物用药数据进行处理的一实施例的流程示意图,在本发明的一些实施例中,根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据,包括:
S301、对抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据;
S302、根据预设方法,从完善的抗乳腺癌候选药物用药数据筛选出初始抗乳腺癌候选药物用药特征数据;
S303、对初始抗乳腺癌候选药物用药特征数据进行评价测试,得到抗乳腺癌候选药物用药特征数据。
在本发明具体的实施例中,步骤S301得到的数据可能有部分缺失,对于缺失不大的数据,可以进行人为补齐,对于缺失较大的数据,则需要舍弃,因此需要提前对抗乳腺癌候选药物用药数据进行预处理,以免影响其结果。
在本发明具体的实施例中,步骤S302的预设方法为随机森林算法,通过构建多颗决策树,确定初始抗乳腺癌候选药物用药特征数据,使用OOB分别计算每颗决策树的误差;在保持其它特征不变的情况下,随机对第i个特征进行重新排序,然后再次计算其误差;根据公式
Figure BDA0003527016140000101
计算每个特征的重要性;对得到的特征重要性进行排序,选出前20个最优特征作为主要特征,即初始抗乳腺癌候选药物用药特征数据。将每颗决策树的误差分别记为:Erroob1,Erroob2,…,Erroobk,在保持其它特征不变的情况下,随机对第i个特征进行重新排序,然后再次计算其误差,并将误差值记为Erri1,Erri2,…,Errik。
在本发明具体的实施例中,步骤S303采用三折交叉评判初始抗乳腺癌候选药物用药特征数据的好坏,将初始采样(样本集1,2)分割成3份,一份被保留作为验证模型的数据(测试集),其他2份用来训练(训练集)。交叉验证重复3次,每份验证一次,平均3次的结果或者使用其它结合方式,最终得到一个单一估测,这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,3折交叉验证是最常用的。综合以上情况,在个数120附近,主要特征的准确度有所下降,且个数为120的时候,模型在训练集和测试集的表现均良好,所有选择个数为120,此时它选择出来的特征就是我们要的特征。
在上述实施例中,先对抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据,然后通过随机森林算法,从完善的抗乳腺癌候选药物用药数据中选择出初始抗乳腺癌候选药物用药特征数据,再通过三折交叉对其进行评价,最终确定抗乳腺癌候选药物用药特征数据。
请参阅图4,图4为本发明提供的对抗乳腺癌候选药物用药数据进行预处理的一实施例的流程示意图,在本发明的一些实施例中,对抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据,包括:
S401、当抗乳腺癌候选药物用药数据中只含有部分时间点的位点,且残缺的数据较多,不能补充时,将此类位点删除;
S402、当抗乳腺癌候选药物用药数据中全部数据为空值的位点,将此类位点按行删除;
S403、当抗乳腺癌候选药物用药数据中部分数据为空值的位点,采用预设时间范围内的数据平均值替换此类位点;
S404、计算抗乳腺癌候选药物用药数据余下的每一列数据的平均值,将所有数据除以其对应列的平均值代替原始值,若平均值为零,那么用零代替原始值,得到完善的抗乳腺癌候选药物用药数据。
在本发明具体的实施例中,步骤S401将抗乳腺癌候选药物用药数据中只含有部分时间点的位点,且残缺的数据较多,不能补充的位点删除,此类位点已经不足以满足筛选要求,因此将其删除,避免对最终结果产生不利影响。
在本发明具体的实施例中,步骤S402抗乳腺癌候选药物用药数据中全部数据为空值的位点,由于残缺数据较多,不具有参考意义,因此将此类位点也进行删除。
在本发明具体的实施例中,步骤S403抗乳腺癌候选药物用药数据中部分数据为空值的位点,可以通过预设时间范围内的数据平均值替换此类位点,预设时间范围可以设置在该数据前后两个小时内,当然也可以根据实际情况进行设置。
在本发明具体的实施例中,步骤S404对于上述数据以外的抗乳腺癌候选药物用药数据,计算每一列数据的平均值,用该平均值代替对应列的原始数据,且平均值为零时,直接用零代替原始值,经过上述数据预处理后,最终得到完善的抗乳腺癌候选药物用药数据。
在上述实施例中,根据抗乳腺癌候选药物用药数据的缺失情况,对其进行不同的处理,使其连贯、完整,否则数据会存在较大误差,对最终模型的筛选结果也会产生影响,通过对其进行补充、删除等处理,提高最终筛选结果的准确性。
为了更好实施本发明实施例中的抗乳腺癌候选药物筛选方法,在抗乳腺癌候选药物筛选方法基础之上,对应的,请参阅图5,图5为本发明提供的抗乳腺癌候选药物筛选装置的一实施例的结构示意图,本发明实施例提供了一种抗乳腺癌候选药物筛选装置500,包括:
处理模块501,用于根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立模块502,用于建立初始抗乳腺癌候选药物筛选神经网络模型;
优化模块503,用于根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
筛选模块504,用于将待筛选抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,对待筛选抗乳腺癌候选药物进行筛选。
这里需要说明的是:上述实施例提供的装置500可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述方法实施例中的相应内容,此处不再赘述。
请参阅图6,图6为本发明实施例提供的电子设备的结构示意图。基于上述抗乳腺癌候选药物筛选方法,本发明还相应提供了一种抗乳腺癌候选药物筛选设备,抗乳腺癌候选药物筛选设备可以是移动终端、桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该抗乳腺癌候选药物筛选设备包括处理器610、存储器620及显示器630。图6仅示出了电子设备的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
存储器620在一些实施例中可以是抗乳腺癌候选药物筛选设备的内部存储单元,例如抗乳腺癌候选药物筛选设备的硬盘或内存。存储器620在另一些实施例中也可以是抗乳腺癌候选药物筛选设备的外部存储设备,例如抗乳腺癌候选药物筛选设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器620还可以既包括抗乳腺癌候选药物筛选设备的内部存储单元也包括外部存储设备。存储器620用于存储安装于抗乳腺癌候选药物筛选设备的应用软件及各类数据,例如安装抗乳腺癌候选药物筛选设备的程序代码等。存储器620还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器620上存储有抗乳腺癌候选药物筛选程序640,该抗乳腺癌候选药物筛选程序640可被处理器610所执行,从而实现本申请各实施例的抗乳腺癌候选药物筛选方法。
处理器610在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器620中存储的程序代码或处理数据,例如执行抗乳腺癌候选药物筛选方法等。
显示器630在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器630用于显示在抗乳腺癌候选药物筛选设备的信息以及用于显示可视化的用户界面。抗乳腺癌候选药物筛选设备的部件610-630通过系统总线相互通信。
在一实施例中,当处理器610执行存储器620中抗乳腺癌候选药物筛选程序640时实现如上的抗乳腺癌候选药物筛选方法中的步骤。
本实施例还提供了一种计算机可读存储介质,其上存储有抗乳腺癌候选药物筛选程序,该抗乳腺癌候选药物筛选程序被处理器执行时实现以下步骤:
根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立初始抗乳腺癌候选药物筛选神经网络模型;
根据抗乳腺癌候选药物用药特征数据,对初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
将待筛选抗乳腺癌候选药物数据输入至目标抗乳腺癌候选药物筛选神经网络模型,对待筛选抗乳腺癌候选药物进行筛选。
综上,本实施例提供的一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质,对初始抗乳腺癌候选药物数据进行处理完善,建立初始神经网络模型,基于粒子群算法,对初始神经网络模型进行训练,得到训练完备的神经网络模型,再通过训练完备的神经网络模型对抗乳腺癌候选药物进行筛选,避免了不同个体差异带来的影响,并且可以针对多种药物进行筛选。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种抗乳腺癌候选药物筛选方法,其特征在于,包括:
根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立初始抗乳腺癌候选药物筛选神经网络模型;
根据所述抗乳腺癌候选药物用药特征数据,对所述初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
将待筛选抗乳腺癌候选药物数据输入至所述目标抗乳腺癌候选药物筛选神经网络模型,对所述待筛选抗乳腺癌候选药物进行筛选。
2.根据权利要求1所述的抗乳腺癌候选药物筛选方法,其特征在于,所述根据所述抗乳腺癌候选药物用药特征数据,对所述初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型,包括:
将所述抗乳腺癌候选药物用药特征数据进行处理,得到抗乳腺癌候选药物用药样本数据;
通过粒子群算法,确定所述初始抗乳腺癌候选药物筛选神经网络模型的参数;
根据所述抗乳腺癌候选药物用药样本数据以及所述初始抗乳腺癌候选药物筛选神经网络模型的参数,确定目标抗乳腺癌候选药物筛选神经网络模型。
3.根据权利要求2所述的抗乳腺癌候选药物筛选方法,其特征在于,所述根据所述抗乳腺癌候选药物用药样本数据以及所述初始抗乳腺癌候选药物筛选神经网络模型的参数,确定所述目标抗乳腺癌候选药物筛选神经网络模型,包括:
以所述抗乳腺癌候选药物用药样本数据作为输入,以IC50值和对应的pIC50值作为输出,对所述初始抗乳腺癌候选药物筛选神经网络模型进行训练、验证和测试,直至达到预设精度要求或者预设迭代次数,得到所述目标抗乳腺癌候选药物筛选神经网络模型。
4.根据权利要求2所述的抗乳腺癌候选药物筛选方法,其特征在于,所述设置所述初始抗乳腺癌候选药物筛选神经网络模型的参数,包括:设置所述初始抗乳腺癌候选药物筛选神经网络模型的隐含层参数、输入层参数以及输出层参数。
5.根据权利要求4所述的抗乳腺癌候选药物筛选方法,其特征在于,所述设置所述初始抗乳腺癌候选药物筛选神经网络模型的参数之后,还包括:根据预设优化器,确定所述初始抗乳腺癌候选药物筛选神经网络模型的网络参数。
6.根据权利要求1所述的抗乳腺癌候选药物筛选方法,其特征在于,所述根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据,包括:
对所述抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据;
根据预设方法,从所述完善的抗乳腺癌候选药物用药数据筛选出初始抗乳腺癌候选药物用药特征数据;
对初始抗乳腺癌候选药物用药特征数据进行评价测试,得到抗乳腺癌候选药物用药特征数据。
7.根据权利要求6所述的抗乳腺癌候选药物筛选方法,其特征在于,所述对所述抗乳腺癌候选药物用药数据进行预处理,得到完善的抗乳腺癌候选药物用药数据,包括:
当所述抗乳腺癌候选药物用药数据中只含有部分时间点的位点,且残缺的数据较多,不能补充时,将此类位点删除;
当所述抗乳腺癌候选药物用药数据中全部数据为空值的位点,将此类位点按行删除;
当所述抗乳腺癌候选药物用药数据中部分数据为空值的位点,采用预设时间范围内的数据平均值替换此类位点;
计算所述抗乳腺癌候选药物用药数据余下的每一列数据的平均值,将所有数据除以其对应列的平均值代替原始值,若平均值为零,那么用零代替原始值,得到完善的抗乳腺癌候选药物用药数据。
8.一种抗乳腺癌候选药物筛选装置,其特征在于,包括:
处理模块,用于根据预设方法对抗乳腺癌候选药物用药数据进行处理,得到抗乳腺癌候选药物用药特征数据;
建立模块,用于建立初始抗乳腺癌候选药物筛选神经网络模型;
优化模块,用于根据所述抗乳腺癌候选药物用药特征数据,对所述初始抗乳腺癌候选药物筛选神经网络模型行训练、验证和测试,得到目标抗乳腺癌候选药物筛选神经网络模型;
筛选模块,用于将待筛选抗乳腺癌候选药物数据输入至所述目标抗乳腺癌候选药物筛选神经网络模型,对所述待筛选抗乳腺癌候选药物进行筛选。
9.一种电子设备,其特征在于,包括存储器和处理器,其中,
所述存储器,用于存储程序;
所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述权利要求1至7中任一项所述抗乳腺癌候选药物筛选方法中的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时,能够实现上述权利要求1至7中任一项所述抗乳腺癌候选药物筛选方法中的步骤。
CN202210199573.6A 2022-03-01 2022-03-01 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质 Pending CN114613512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210199573.6A CN114613512A (zh) 2022-03-01 2022-03-01 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210199573.6A CN114613512A (zh) 2022-03-01 2022-03-01 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114613512A true CN114613512A (zh) 2022-06-10

Family

ID=81861773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210199573.6A Pending CN114613512A (zh) 2022-03-01 2022-03-01 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114613512A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376706A (zh) * 2022-10-26 2022-11-22 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376706A (zh) * 2022-10-26 2022-11-22 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置

Similar Documents

Publication Publication Date Title
US12020134B2 (en) Debugging correctness issues in training machine learning models
CN111767228B (zh) 基于人工智能的界面测试方法、装置、设备和介质
CN110458697A (zh) 用于评估风险的方法和装置
CN111950656B (zh) 图像识别模型生成方法、装置、计算机设备和存储介质
US10592672B2 (en) Testing insecure computing environments using random data sets generated from characterizations of real data sets
CN110798467B (zh) 目标对象识别方法、装置、计算机设备及存储介质
EP4027348A2 (en) Affinity prediction method and apparatus, method and apparatus for training affinity prediction model, device and medium
CN112184304A (zh) 一种辅助决策的方法、系统、服务器和存储介质
US9304895B1 (en) Evolutionary technique with n-pool evolution
CN113268665A (zh) 基于随机森林的信息推荐方法、装置、设备及存储介质
CN114613512A (zh) 一种抗乳腺癌候选药物筛选方法、装置、设备及存储介质
CN113742069A (zh) 基于人工智能的容量预测方法、装置及存储介质
CN112131587B (zh) 一种智能合约伪随机数安全检验方法、系统、介质和装置
CN113659575A (zh) 一种电力系统暂态稳定性预测方法及装置
CN112269875B (zh) 文本分类方法、装置、电子设备及存储介质
CN113515625A (zh) 测试结果分类模型训练方法、分类方法及装置
CN111967581A (zh) 分群模型的解释方法、装置、计算机设备和存储介质
WO2020167156A1 (ru) Способ отладки обученной рекуррентной нейронной сети
CN113176995A (zh) 基于测试场景的接口测试方法、装置、设备及介质
CN114528973A (zh) 业务处理模型的生成方法、业务处理方法和装置
CN113095963A (zh) 房地产成本数据处理方法、装置、计算机设备和存储介质
US10025700B1 (en) Data mining technique with n-Pool evolution
CN112017790B (zh) 基于对抗网络的电子病历筛查方法、装置、设备及介质
CN116541454B (zh) 事件配置方法、装置、计算机设备和存储介质
CN117437975B (zh) 一种蛋白质结合位点预测方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination