CN108021941B - 药物肝毒性预测方法及装置 - Google Patents

药物肝毒性预测方法及装置 Download PDF

Info

Publication number
CN108021941B
CN108021941B CN201711236048.2A CN201711236048A CN108021941B CN 108021941 B CN108021941 B CN 108021941B CN 201711236048 A CN201711236048 A CN 201711236048A CN 108021941 B CN108021941 B CN 108021941B
Authority
CN
China
Prior art keywords
sample
data
drug data
weight
drug
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201711236048.2A
Other languages
English (en)
Other versions
CN108021941A (zh
Inventor
丁莎
林涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201711236048.2A priority Critical patent/CN108021941B/zh
Publication of CN108021941A publication Critical patent/CN108021941A/zh
Application granted granted Critical
Publication of CN108021941B publication Critical patent/CN108021941B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供了一种药物肝毒性预测方法及装置,涉及药物预测技术领域。所述方法包括获取待测药物数据后,根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;再基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。通过预设的分类器组和投票策略对药物数据进行分类的方式,获得药物数据的肝毒性,提高预测效率、预测精度,适应了制药行业的未来发展需求,能为制药行业带来开发周期和开发成本的更有效控制。

Description

药物肝毒性预测方法及装置
技术领域
本发明涉及药物预测技术领域,具体而言,涉及一种药物肝毒性预测方法及装置。
背景技术
现代药物的研发过程是一种寻找能够与特异治疗标靶相互作用并具有理想ADME/T性质化合物的过程。在此过程中,30%的研发失败源自于药物的安全性问题,其中又有5%-10%的药物由于在临床应用阶段对肝脏的损伤而被取消甚至被召回。对药物肝毒性的准确预测,使得研发者在药物研发的早期阶段就能够发现可能会引起肝毒性的候选药物,减少药物研发失败所带来的巨大研发损失。
传统的药物肝毒性预测方法主要使用基于动物活体实验的毒理学实验方法对药物的肝毒性进行预测。由于需要在活体动物上验证药物的实际应用效果,所以传统方法存在着周期长、花费高且需要耗费大量活体动物等缺点。此外,安全、环保、动物保护等方面的法规要求日益严格,全球化的市场竞争也使得药物开发周期不断缩短,药物开发的资源投入越来越大。传统药物肝毒性预测方法所存在的缺点,以及当前社会发展所体现出的特点,都为药物的药物开发人员提出了挑战。
发明内容
本发明的目的在于提供一种药物肝毒性预测方法及装置,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本发明实施例提供了一种药物肝毒性预测方法,应用于一电子设备,所述方法包括:获取待测药物数据;根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
第二方面,本发明实施例提供了一种药物肝毒性预测装置,运行于一电子设备,所述装置包括:获取单元、分类单元和投票单元。获取单元,用于获取待测药物数据。分类单元,用于根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果。投票单元,用于基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
本发明实施例的有益效果是:获取待测药物数据后,根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;再基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。通过预设的分类器组和投票策略对药物数据进行分类的方式,获得药物数据的肝毒性,提高预测效率、预测精度,适应了制药行业的未来发展需求,能为制药行业带来开发周期和开发成本的更有效控制。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种可应用于本发明实施例的电子设备的结构框图;
图2为本发明实施例提供的一种药物肝毒性预测方法的流程图;
图3为本发明实施例提供的另一种药物肝毒性预测方法的流程图;
图4为本发明实施例提供的药物肝毒性预测装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1示出了一种可应用于本发明实施例中的电子设备100的结构框图。如图1所示,电子设备100可以包括存储器102、存储控制器104、一个或多个(图1中仅示出一个)处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116和药物肝毒性预测装置。
存储器102、存储控制器104、处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。药物肝毒性预测方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器102中的软件功能模块,例如所述药物肝毒性预测装置包括的软件功能模块或计算机程序。
存储器102可以存储各种软件程序以及模块,如本申请实施例提供的药物肝毒性预测方法及装置对应的程序指令/模块。处理器106通过运行存储在存储器102中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的肝毒性药物肝毒性预测方法。
存储器102可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器106可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出模块110用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出模块110可以是,但不限于,鼠标和键盘等。
音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示模块114在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块114可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器106进行计算和处理。
射频模块116用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通信网络或者其他设备进行通信。
可以理解,图1所示的结构仅为示意,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
于本发明实施例中,电子设备100可以作为用户终端,或者作为服务器。用户终端可以为PC(personal computer)电脑、平板电脑、手机、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。
请参阅图2,本发明实施例提供了一种药物肝毒性预测方法,应用于一电子设备,所述方法可以包括步骤S240、步骤S250和步骤S260。
步骤S240:获取待测药物数据;
步骤S250:根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;
步骤S260:基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
请参阅图3,为了获取预设的分类器组,在步骤S240之前,所述方法还可以包括步骤S200、步骤S210、步骤S220和步骤S230。
步骤S200:获取多个样本药物数据。
从药物数据库或实验等中获取多个样本药物数据。多个样本药物数据统称为一个初始样本集,记为D,xi∈D为第i个样本药物数据,i=1,2,…,n,n为所述多个样本药物数据的总个数。
步骤S210:基于预设的样本权重确定方法及所述多个样本药物数据,获得所述多个样本药物数据中每个所述样本药物数据对应的权重。
作为一种实施方式,进一步地,基于步骤S210:基于所述多个样本药物数据,获取每个所述样本药物数据对应的k个最近邻样本数据;若判断得出所述样本药物数据的类标与对应的k个最近邻样本数据中的每个最近邻样本数据的类标均不相同,将预设值赋值于该样本药物数据对应的权重。
对于初始样本集D中的任意一个样本药物数据即xi∈D,获取所述样本药物数据xi对应的k个最近邻样本数据;若判断得出所述样本药物数据的类标与对应的k个最近邻样本数据中的每个最近邻样本数据的类标均不相同,得出该样本药物数据xi为噪音样本,将预设值赋值于该样本药物数据对应的权重。即获得该样本药物数据对应的权重为所述预设值。
在本实施例中,所述预设值可以为0.01。即weight(xi)=0.01,weight(xi)为xi对应的权重。
作为另一种实施方式,基于步骤S210,若判断得出所述样本药物数据的类标与对应的所述k个最近邻样本数据中的至少一个最近邻样本数据的类标相同,计算得出该样本药物数据与对应的k个最近邻样本数据的平均距离;基于所述平均距离,获得该样本药物数据对应的权重。进一步地,计算所述平均距离的倒数;将所述倒数赋值于该样本药物数据对应的权重。
对于初始样本集D中的任意一个样本药物数据即xi∈D,获取所述样本药物数据xi对应的k个最近邻样本数据;若判断得出所述样本药物数据的类标与对应的所述k个最近邻样本数据中的至少一个最近邻样本数据的类标相同,将此时条件下的k个最近邻样本数据称作为该样本药物数据对应的k个最近的异类样本数据,得出该样本药物数据xi不是噪音样本,计算得出该样本药物数据与对应的k个最近邻样本数据即对应的k个最近的异类样本数据的平均距离,记为d(xi),该样本药物数据对应的权重被赋值为weight(xi)=1/d(xi),weight(xi)为xi对应的权重。
基于以上,以此获得所述多个样本药物数据中每个所述样本药物数据对应的权重。
同时,基于weight′overall=weightoverall+weight(xi),i=1,2,…,n,获得所述多个样本药物数据对应的整体权重,其中,weightoverall为上一个整体权重,weight′overall为当前整体权重,xi为第i个样本药物数据,weight(xi)为第i个样本药物数据对应的权重,n为所述多个样本药物数据的总个数。
步骤S220:根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行采样,生成样本集。
进一步地,基于步骤S220,根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。
进一步地,根据每个所述样本药物数据对应的权重及预设的整体权重更新规则,获得所述多个样本药物数据对应的整体权重;根据所述整体权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。样本采样的随机性保证了基分类器的多样性不会有明显的下降。
进一步地,所述预设的整体权重更新规则可以为weight′overall=weightoverall+weight(xi),i=1,2,…,n。
基于weight′overall=weightoverall+weight(xi),i=1,2,…,n,获得所述多个样本药物数据对应的整体权重,其中,weightoverall为上一个整体权重,weight′overall为当前整体权重,xi为第i个样本药物数据,weight(xi)为第i个样本药物数据对应的权重,n为所述多个样本药物数据的总个数。
步骤S230:在所述样本集上训练预先获取的多个基分类器,获得分类器组。
在样本集即Si,i=1,2,…,n,Si∈D上训练预先获取的多个基分类器即Ci,i=1,2,…M,M为所述基分类器的个数后,将训练后的多个基分类器作为预设的分类器组即{C1,C2,…,CM}。再根据预设的分类器组对获取到的待测药物数据进行分类,获得多个初始分类结果;基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
本发明实施例提供的一种药物肝毒性预测方法,获取待测药物数据后,根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;再基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。通过预设的分类器组和投票策略对药物数据进行分类的方式,获得药物数据的肝毒性,提高预测效率、预测精度,适应了制药行业的未来发展需求,能为制药行业带来开发周期和开发成本的更有效控制。
请参阅图4,本发明实施例提供了一种药物肝毒性预测装置400,运行于一电子设备,所述装置400可以包括获取单元450、分类单元460和投票单元470。
获取单元450,用于获取待测药物数据。
分类单元460,用于根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果。
投票单元470,用于基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
所述装置400还可以包括样本获取单元410、权重计算单元420、生成单元430、训练单元440。
样本获取单元410,用于获取多个样本药物数据。
权重计算单元420,用于基于预设的样本权重确定方法及所述多个样本药物数据,获得所述多个样本药物数据中每个所述样本药物数据对应的权重。
权重计算单元420可以包括权重计算子单元421。
权重计算子单元421,用于基于所述多个样本药物数据,获取每个所述样本药物数据对应的k个最近邻样本数据;若判断得出所述样本药物数据的类标与对应的k个最近邻样本数据中的每个最近邻样本数据的类标均不相同,将预设值赋值于该样本药物数据对应的权重。
权重计算子单元421,还用于若判断得出所述样本药物数据的类标与对应的所述k个最近邻样本数据中的至少一个最近邻样本数据的类标相同,计算得出该样本药物数据与对应的k个最近邻样本数据的平均距离;基于所述平均距离,获得该样本药物数据对应的权重。
权重计算子单元421,还用于计算所述平均距离的倒数;将所述倒数赋值于该样本药物数据对应的权重。
根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。
生成单元430,用于根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行采样,生成样本集。
生成单元430可以包括生成子单元431。
生成子单元431,用于根据每个所述样本药物数据对应的权重及预设的整体权重更新规则,获得所述多个样本药物数据对应的整体权重;根据所述整体权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。
所述预设的整体权重更新规则可以为weight′overall=weightoverall+weight(xi),i=1,2,…,n。
生成子单元431,还用于:
基于weight′overall=weightoverall+weight(xi),i=1,2,…,n,获得所述多个样本药物数据对应的整体权重,其中,weightoverall为上一个整体权重,weight′overall为当前整体权重,xi为第i个样本药物数据,weight(xi)为第i个样本药物数据对应的权重,n为所述多个样本药物数据的总个数。
训练单元440,用于在所述样本集上训练预先获取的多个分类器,获得分类器组。
以上各单元可以是由软件代码实现,此时,上述的各单元可存储于存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。
本发明实施例提供的药物肝毒性预测装置400,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (5)

1.一种药物肝毒性预测方法,其特征在于,应用于一电子设备,所述方法包括:
获取多个样本药物数据;
基于所述多个样本药物数据,获取每个所述样本药物数据对应的k个最近邻样本数据;
若判断得出所述样本药物数据的类标与对应的k个最近邻样本数据中的每个最近邻样本数据的类标均不相同,将预设值赋值于该样本药物数据对应的权重;
若判断得出所述样本药物数据的类标与对应的所述k个最近邻样本数据中的至少一个最近邻样本数据的类标相同,计算得出该样本药物数据与对应的k个最近邻样本数据的平均距离;
计算所述平均距离的倒数;
将所述倒数赋值于该样本药物数据对应的权重;
根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行采样,生成样本集;
在所述样本集上训练预先获取的多个基分类器,获得分类器组;
获取待测药物数据;
根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;
基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
2.根据权利要求1所述的方法,其特征在于,获取多个样本药物数据根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行采样,生成样本集,包括:
根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。
3.根据权利要求2所述的方法,其特征在于,根据每个所述样本药物数据对应的权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集,包括:
根据每个所述样本药物数据对应的权重及预设的整体权重更新规则,获得所述多个样本药物数据对应的整体权重;
根据所述整体权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集。
4.根据权利要求3所述的方法,其特征在于,所述预设的整体权重更新规则为weight′overall=weightoverall+weight(xi),i=1,2,…,n,根据每个所述样本药物数据对应的权重及预设的整体权重更新规则,获得所述多个样本药物数据对应的整体权重,包括:
基于weight′overall=weightoverall+weight(xi),i=1,2,…,n,获得所述多个样本药物数据对应的整体权重,其中,weightoverall为上一个整体权重,weight′overall为当前整体权重,xi为第i个样本药物数据,weight(xi)为第i个样本药物数据对应的权重,n为所述多个样本药物数据的总个数。
5.一种药物肝毒性预测装置,其特征在于,运行于一电子设备,所述装置包括:
样本获取单元,用于获取多个样本药物数据;
权重计算单元,基于所述多个样本药物数据,获取每个所述样本药物数据对应的k个最近邻样本数据;若判断得出所述样本药物数据的类标与对应的k个最近邻样本数据中的每个最近邻样本数据的类标均不相同,将预设值赋值于该样本药物数据对应的权重;若判断得出所述样本药物数据的类标与对应的所述k个最近邻样本数据中的至少一个最近邻样本数据的类标相同,计算得出该样本药物数据与对应的k个最近邻样本数据的平均距离;计算所述平均距离的倒数;将所述倒数赋值于该样本药物数据对应的权重;
生成单元,用于根据每个所述样本药物数据对应的权重及预设的整体权重更新规则,获得所述多个样本药物数据对应的整体权重;根据所述整体权重,对所述多个样本药物数据进行有放回的随机采样,生成样本集;
训练单元,用于在所述样本集上训练预先获取的多个分类器,获得分类器组;
获取单元,用于获取待测药物数据;
分类单元,用于根据预设的分类器组对所述待测药物数据进行分类,获得多个初始分类结果;
投票单元,用于基于所述多个初始分类结果及预设的投票策略规则,获得分类结果,所述分类结果表示所述待测药物数据的肝毒性。
CN201711236048.2A 2017-11-30 2017-11-30 药物肝毒性预测方法及装置 Expired - Fee Related CN108021941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711236048.2A CN108021941B (zh) 2017-11-30 2017-11-30 药物肝毒性预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711236048.2A CN108021941B (zh) 2017-11-30 2017-11-30 药物肝毒性预测方法及装置

Publications (2)

Publication Number Publication Date
CN108021941A CN108021941A (zh) 2018-05-11
CN108021941B true CN108021941B (zh) 2020-08-28

Family

ID=62077700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711236048.2A Expired - Fee Related CN108021941B (zh) 2017-11-30 2017-11-30 药物肝毒性预测方法及装置

Country Status (1)

Country Link
CN (1) CN108021941B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111243682A (zh) * 2020-01-10 2020-06-05 京东方科技集团股份有限公司 药物的毒性预测方法及装置、介质和设备
CN112116560B (zh) * 2020-08-20 2023-09-26 华南理工大学 一种焊接图像缺陷识别方法、装置、存储介质及设备
CN117672506A (zh) * 2021-03-02 2024-03-08 华中科技大学同济医学院附属协和医院 培美曲塞化疗后肾脏与骨髓抑制风预测模型及其构建方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998034177A3 (de) * 1997-01-31 1998-11-19 Siemens Ag Verfahren zur kombination von ausgangssignalen mehrerer schätzer, insbesondere von mindestens einem neuronalen netz, zu einem gesamtschätzer ermittelten ergebnissignal
CN103218405A (zh) * 2013-03-20 2013-07-24 西安电子科技大学 基于维数约简的集成迁移文本分类方法
CN103487412A (zh) * 2013-09-30 2014-01-01 上海交通大学 一种酚类化合物肝毒性快速预测模型的构建方法
CN104239907A (zh) * 2014-07-16 2014-12-24 华南理工大学 面向变化场景的远红外行人检测方法
CN104598586A (zh) * 2015-01-18 2015-05-06 北京工业大学 大规模文本分类的方法
CN105335350A (zh) * 2015-10-08 2016-02-17 北京理工大学 一种基于集成学习的语种识别方法
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
CN105809191A (zh) * 2016-03-07 2016-07-27 四川大学 一种融合Bagging的随机树慢性肾病分期预测算法
CN106066936A (zh) * 2016-05-30 2016-11-02 北京千安哲信息技术有限公司 一种提高药物不良反应预测精度的方法及系统
CN106886792A (zh) * 2017-01-22 2017-06-23 北京工业大学 一种基于分层机制构建多分类器融合模型的脑电情感识别方法
CN106934414A (zh) * 2017-02-15 2017-07-07 华南理工大学 一种基于带噪音标签数据的渐进性集成分类方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998034177A3 (de) * 1997-01-31 1998-11-19 Siemens Ag Verfahren zur kombination von ausgangssignalen mehrerer schätzer, insbesondere von mindestens einem neuronalen netz, zu einem gesamtschätzer ermittelten ergebnissignal
CN103218405A (zh) * 2013-03-20 2013-07-24 西安电子科技大学 基于维数约简的集成迁移文本分类方法
CN103487412A (zh) * 2013-09-30 2014-01-01 上海交通大学 一种酚类化合物肝毒性快速预测模型的构建方法
CN104239907A (zh) * 2014-07-16 2014-12-24 华南理工大学 面向变化场景的远红外行人检测方法
CN104598586A (zh) * 2015-01-18 2015-05-06 北京工业大学 大规模文本分类的方法
CN105335350A (zh) * 2015-10-08 2016-02-17 北京理工大学 一种基于集成学习的语种识别方法
CN105589806A (zh) * 2015-12-17 2016-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
CN105809191A (zh) * 2016-03-07 2016-07-27 四川大学 一种融合Bagging的随机树慢性肾病分期预测算法
CN106066936A (zh) * 2016-05-30 2016-11-02 北京千安哲信息技术有限公司 一种提高药物不良反应预测精度的方法及系统
CN106886792A (zh) * 2017-01-22 2017-06-23 北京工业大学 一种基于分层机制构建多分类器融合模型的脑电情感识别方法
CN106934414A (zh) * 2017-02-15 2017-07-07 华南理工大学 一种基于带噪音标签数据的渐进性集成分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
药物安全性的计算机预测研究;唐赟;《中国化学会第14届全国计算机化学学术会议暨分子模拟国际论坛》;20171117;第57页 *

Also Published As

Publication number Publication date
CN108021941A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
TWI718422B (zh) 對模型預測值進行融合的方法、裝置和設備
US10893064B2 (en) Identifying service issues by analyzing anomalies
US20180173495A1 (en) Duplicate and similar bug report detection and retrieval using neural networks
CN108021941B (zh) 药物肝毒性预测方法及装置
CN109214421B (zh) 一种模型训练方法、装置、及计算机设备
CN107369154B (zh) 图像的检测装置
US11146580B2 (en) Script and command line exploitation detection
WO2018078408A1 (en) Reducing scale estimate errors in shelf images
US11645456B2 (en) Siamese neural networks for flagging training data in text-based machine learning
JP6920378B2 (ja) 再修理用基板の検出装置、方法およびコンピュータ読み取り可能な記憶媒体
EP4073978B1 (en) Intelligent conversion of internet domain names to vector embeddings
JP2015004754A (ja) 対話装置、対話方法および対話プログラム
US11706305B2 (en) Methods and apparatus for user identification via community detection
CN111061979A (zh) 一种用户标签的推送方法、装置、电子设备和介质
CN118094118B (zh) 数据集质量评估方法、系统、电子设备及存储介质
US20240163344A1 (en) Methods and apparatus to perform computer-based community detection in a network
CN107071553B (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
JP2019067214A (ja) 判定プログラム、判定方法、端末装置、学習データ、及びモデル
CN104933047B (zh) 一种确定搜索词的价值的方法和装置
CN111563399A (zh) 获取电子病历的结构化信息的方法及装置
CN114004674A (zh) 模型训练方法、商品推送方法、装置和电子设备
CN110807119B (zh) 人脸查重方法及装置
US11962855B1 (en) Methods, apparatus, and articles of manufacture to determine whether audience measurement meters are co-located
US20240144676A1 (en) Methods, systems, articles of manufacture and apparatus for providing responses to queries regarding store observation images
CN116383084A (zh) 一种测试数据获取方法、装置、终端设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200828

Termination date: 20211130

CF01 Termination of patent right due to non-payment of annual fee