CN110459330A - 药物适应症预测方法及装置 - Google Patents
药物适应症预测方法及装置 Download PDFInfo
- Publication number
- CN110459330A CN110459330A CN201910566839.4A CN201910566839A CN110459330A CN 110459330 A CN110459330 A CN 110459330A CN 201910566839 A CN201910566839 A CN 201910566839A CN 110459330 A CN110459330 A CN 110459330A
- Authority
- CN
- China
- Prior art keywords
- information
- drug
- patient
- treatment
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种药物适应症预测方法及装置。其中,方法包括:对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;其中,用药信息、症状诊断信息和治疗结局信息均由0‑1变量构成。本发明实施例提供的药物适应症预测方法及装置,利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,挖掘出用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,根据其中具有关联关系的组合获取药物适应症预测结果,能一次性获得多种药物的适应症预测结果,预测的效率更高,全面性更好。
Description
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种药物适应症预测方法及装置。
背景技术
适应症(Indication)指药物、手术等方法适合运用的范围、标准。药物适应症即指药物所适合运用的疾病范围等。传统的药物适应症预测是通过化学和生物学角度判断,从而预测出药物适应症,例如瑞巴派特会促进角膜和结膜产生黏蛋白,从而致使眼内形成一稳定水性层,因此预测其可用于干眼症,再通过临床试验确定药物的适应症。
传统的药物适应症挖掘周期很长,需要长期的研究才能初步判断一种药物的可能药物适应症,这会导致药物适应症预测的效率较低;其次传统的药物适应症生成研究是基于化学和生物学的,这会导致药物适应症的研究的过程受到化学和生物学的限制,不能保证药物的全部适应症均能找出,一些特殊的适应症会被遗漏。
综上,传统药物适应症预测的效率和全面性均存在不足。
发明内容
本发明实施例提供一种药物适应症预测方法及装置,用以解决或者至少部分地解决现有技术进行药物适应症预测的效率低的缺陷。
第一方面,本发明实施例提供一种药物适应症预测方法,包括:
对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;
利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;
其中,所述用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
优选地,所述利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果的具体步骤包括:
对于所述用药信息中任一药物与症状诊断信息中任一适应症的两两组合中的每一种组合,根据非迭代的KSA方法获取所述组合的似然比检验统计量;
若判断获知所述组合的似然比检验统计量大于预设的显著性阈值,则将所述组合中的适应症作为所述组合中的药物的适应症预测结果。
优选地,所述对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息的具体步骤包括:
对所述各患者的诊疗数据进行自然语言处理;
对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息、症状诊断信息和治疗结局信息。
优选地,所述用药信息包括每一患者的M个药物变量;每一所述药物变量为0-1变量;M为所述各患者的诊疗数据中药物的种数;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息的具体步骤包括:
提取自然语言处理之后的所述各患者的诊疗数据中的药物名称,获取每一患者治疗期间使用的各种药物;
对各患者治疗期间使用的各种药物进行去重处理,获得M种药物;
对于每一患者,将所述患者治疗期间使用的各种药物对应的药物变量的取值均确定为1,否则确定为0。
优选地,所述症状诊断信息包括每一患者的N个症状变量;每一所述症状变量为0-1变量;N为所述各患者的诊疗数据中适应症的种数;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述症状诊断信息的具体步骤包括:
提取自然语言处理之后的所述各患者的诊疗数据中有关症状描述的关键字,获取每一患者患有的各种症状;
对各患者患有的各种症状进行去重处理,获得N种适应症;
对于每一患者,将所述患者患有的各种症状对应的症状变量的取值均确定为1,否则确定为0。
优选地,所述治疗结局信息包括各患者的治疗结局变量;所述治疗结局变量为0-1变量;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息的具体步骤包括:
对于每一患者,判断自然语言处理之后的所述患者的诊疗数据中是否包括预设的关键词;
若存在,则将所述患者的治疗结局变量的取值确定为1;若不存在,则将所述患者的治疗结局变量的取值确定为0。
优选地,所述利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果之后,还包括:
根据所述药物适应症预测结果和已知的药物适应症,构建用药知识图谱。
第二方面,本发明实施例提供一种药物适应症预测装置,包括:
信息提取模块,用于对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;
关联筛选模块,用于利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;
其中,所述用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,执行所述程序时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的药物适应症预测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的药物适应症预测方法的步骤。
本发明实施例提供的药物适应症预测方法及装置,通过对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息,并利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,挖掘出用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,根据其中具有关联关系的组合获取药物适应症预测结果,能一次性获得多种药物的适应症预测结果,预测的效率更高,且能覆盖更多的适应症,预测的全面性更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例提供的药物适应症预测方法的流程示意图;
图2为根据本发明实施例提供的药物适应症预测装置的结构示意图;
图3为根据本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种药物适应症预测方法及装置,其发明构思是,采用逻辑运算扫描检测(Boolean Operation-based Screening andTesting,简称BOOST)算法,基于大量真实世界临床患者的诊疗信息,从中挖掘出真实世界临床治疗过程中切实有效的药物-适应症知识,获得药物适应症预测结果,能克服传统药物适应症预测方法效率低、全面性差的缺陷。
图1为根据本发明实施例提供的药物适应症预测方法的流程示意图。如图1所示,该方法包括:步骤S101、对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息。
其中,用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
具体地,各患者的诊疗数据,为真实世界的临床诊疗数据。每一患者的诊疗数据,至少包括入院诊断数据、主诉数据、用药医嘱数据和出院诊断数据。
用药信息,用于表示患者治疗期间使用的药物。用药信息包括各患者的用药信息。
症状诊断信息,用于表示患者患有的症状。症状诊断信息,包括各患者患有的症状诊断信息。患者的每一种症状,均作为一种适应症。
治疗结局信息,用于表示症状的变化,即治疗效果(或治疗结局),如减轻、加重、治愈、好转或无明显好转等。
为了便于后面的步骤,可以将用药信息、症状诊断信息和治疗结局信息均由0-1变量表示。
对于任一种药物,用0-1变量表示某一患者治疗期间是否使用该药物。例如,该变量的值为1表示使用该药物,为0表示未使用该药物。
对于任一适应症,用0-1变量表示某一患者是否患有该症状。例如,该变量的值为1表示患有该症状,为0表示未患有该症状。
对于任一患者,用0-1变量表示该患者的治疗结局(是否有治疗效果)。例如,该变量的值为1表示有治疗效果,为0表示无治疗效果。
获得用药信息、症状诊断信息和治疗结局信息之后,可以根据用药信息、症状诊断信息和治疗结局信息构建药物-适应症数据库。
药物-适应症数据库的具体格式可以为:每一行对应一个患者;各列分别对应用药信息、症状诊断信息和治疗结局信息。若各患者的诊疗数据中患者的个数为L、药物的种类为M种、适应症的种类为N种,则药物-适应症数据库的大小为L×(M+N+1)。
步骤S102、利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果。
需要说明的是,逻辑运算扫描检测(BOOST)算法利用Kirkwood近似叠加(Kirkwoodsuperposition approximation,KSA)法快速初筛、对数线性模型(log-linear model)检验的策略,穷举检测一阶交互效应。本发明各实施例中,交互效应为药物与适应症之间的交互效应。
穷举用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,利用BOOST算法,根据用药信息、症状诊断信息和治疗结局信息,判断该药物与该适应症之间是否具有关联关系。交互效应足够大,说明具有关联关系,否则不具有关联关系。
若具有关联关系,说明该药物具有非常大的用于治疗该适应症的可能性,则将该适应症作为该药物的适应症预测结果;若不具有关联关系,说明该药物不具有或具有非常小的用于治疗该适应症的可能性,则不将该适应症作为该药物的适应症预测结果。
由于用药信息、症状诊断信息和治疗结局信息均由0-1变量构成,可以采用布尔表示法的运算方式,能降低计算机的计算内存,不仅能提高空间效率还能提高CPU效率,计算速度更快。
需要说明的是,诊疗数据的规模越大,即患者的数量越多,预测的效率越高,预测结果的全面性越好、准确性越高。
通过上述步骤获得的药物适应症预测结果,可以作为潜在的尚未被广泛的认可的药物-适应症规则,为未来的药物-适应症研究方向提供指导。
本发明实施例通过对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息,并利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,挖掘出用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,根据其中具有关联关系的组合获取药物适应症预测结果,能一次性获得多种药物的适应症预测结果,预测的效率更高,且能覆盖更多的适应症,预测的全面性更好。
基于上述各实施例的内容,利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果的具体步骤包括:对于用药信息中任一药物与症状诊断信息中任一适应症的两两组合中的每一种组合,根据非迭代的KSA方法获取组合的似然比检验统计量。
具体地,将用药信息中的每一种药物与症状诊断信息中的每一种适应症进行两两组合,若药物的种类为M种、适应症的种类为N种,则可以获得M×N种组合。
对于上述M×N种组合中的每一种组合,采用非迭代的KSA方法获取该组合的似然比检验统计量,评估各组合中的药物-适应症的关联关系并进行显著性筛选。
根据用药信息、症状诊断信息和治疗结局信息,构建既包含主效应又包含交互效应的对数线性模型该模型以目标变量为治疗结局,自变量为一组药物-适应症组合。
模型可以表示为
其中,中的Xp和Xq为上标,不是指数含义;Y表示治疗结局;Xp表示用药信息中的第p种药物对应的变量;Xq表示症状诊断信息中的第q种适应症对应的变量;i,j,k的取值均为0或1;表示变量Xp在类别i的模型系数;表示变量Xq在类别j的模型系数;表示Xp在类别i且Xq在类别j的模型系数;β0表示模型系数。
计算该模型的极大似然比极大似然比的公式如下
其中,nijk表示当Xp=i,Xq=j,Y=k时药物-适应症数据库中样本的实际频数。
根据KSA方法计算极大似然比并获取统计量 称为似然比检验统计量。极大似然比用于估计只包含主效应但不包含交互效应的对数线性模型的极大似然比
其中,为通过KSA方法获得的pijk的估计值;πij.表示Xp=i,Xq=j时的边际概率;πi.k表示Xp=i,Y=k时的边际概率;π.jk表示Xq=j,Y=k时的边际概率;πi..表示Xp=i时的边际概率;π.j.表示Xq=j时的边际概率;π..k表示Y=k时的边际概率;中的上标K表示KSA方法,不是指数含义;表示πijk和pijk的相对熵;
若判断获知组合的似然比检验统计量大于预设的显著性阈值,则将组合中的适应症作为组合中的药物的适应症预测结果。
需要说明的是,显著性阈值可根据实际情况预先自定义,显著性阈值设定越高,代表的显著性水平越低,通过检验的药物-适应症组合的关联性越显著。
由于是对的近似代替,即是的上限。
若组合(用药信息中的第p种药物和症状诊断信息中的第q种适应症)的似然比检验统计量小于或等于预设的显著性阈值,说明第p种药物和第q种适应症之间没有显著的关联关系;若大于预设的显著性阈值,说明第p种药物和第q种适应症之间有显著的关联关系。
获取M×N种组合的似然比检验统计量之后,保留其中大于预设的显著性阈值的若干种组合。若干种,指一种或多种。
根据保留的上述若干种组合,可以获得药物适应症预测结果。即对于上述若干种组合中的每一组合,将该组合中的适应症作为该组合中的药物的适应症预测结果。该组合中的适应症作为该组合中的药物的适应症预测结果,说明该适应症是该药物的潜在的适应症。
需要说明的是,获得药物适应症预测结果之后,还可以对药物适应症预测结果进行检验,进一步衡量预测结果中各药物-适应症组合的关联强度。
根据用药信息、症状诊断信息和治疗结局信息,构建只包含主效应但不包含交互效应的对数线性模型该模型以目标变量为治疗结局,自变量为一组药物-适应症组合。
期望频数模型的极大似然比是期望频数的极大似然估计的最大值。中的上标H表示模型不是指数含义。
有无交互效应的对数线性模型的极大似然比之差为
其中,
因此,
对于用药信息中的第p种药物和症状诊断信息中的第q种适应症,越大,说明该种药物与该种适应症的关联强度越高;反之,关联强度越低。可以根据预测结果中各组合的将预测结果按照进行排序,进行一步筛选,进一步提高预测的准确率。
本发明实施例利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,挖掘出用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,根据其中具有关联关系的组合获取药物适应症预测结果,能一次性获得多种药物的适应症预测结果,预测的效率更高,且能覆盖更多的适应症,预测的全面性更好。
基于上述各实施例的内容,对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息的具体步骤包括:对各患者的诊疗数据进行自然语言处理。
需要说明的是,诊疗数据通常为非结构化的文本资料,计算机无法直接识读,因此,进行数据清洗时可以先采用自然语言处理的方法,将诊疗数据转化为计算机可以识读的数据。
对自然语言处理之后的各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取用药信息、症状诊断信息和治疗结局信息。
对各患者的诊疗数据进行自然语言处理之后,通过文本信息抽取方法提取其中的关键词,并对抽取结果进行数据结构化,转换为以0-1变量构成的用药信息、症状诊断信息和治疗结局信息。
本发明实施例通过自然语言处理、文本信息抽取和数据结构化,从各患者的诊疗数据中提取出用药信息、症状诊断信息和治疗结局信息,从而能利用逻辑运算扫描检测算法进行药物适应症预测,能提高预测的效率和全面性。
基于上述各实施例的内容,用药信息包括每一患者的M个药物变量;每一药物变量为0-1变量;M为各患者的诊疗数据中药物的种数。
具体地,用药信息可以用矩阵表示。该矩阵中的每一行对应一个患者,每一列对应一种药物。
该矩阵中的每一行向量均包括M个元素,每一元素均为药物变量。药物变量,表示某一患者治疗期间是否使用某一种药物。
相应地,对自然语言处理之后的各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取用药信息的具体步骤包括:提取自然语言处理之后的各患者的诊疗数据中的药物名称,获取每一患者治疗期间使用的各种药物。
具体地,对于自然语言处理之后的每一患者的诊疗数据,可以提取上述数据中的用药医嘱数据中的药物名称,获得该患者治疗期间使用的若干种不重复的药物。
对各患者治疗期间使用的各种药物进行去重处理,获得M种药物。
可以理解的是,不同的患者可能使用同一种药物,对各患者治疗期间使用的各种药物进行去重处理,可以获得M种不重复的药物。上述M种不重复的药物,为各患者治疗期间所用的全部药物。
对于每一患者,将患者治疗期间使用的各种药物对应的药物变量的取值均确定为1,否则确定为0。
具体地,对于每一患者,对于上述M种药物中的每一种药物,若该患者治疗期间使用了该药物,则将该药物对应的药物变量的取值确定为1;若该患者治疗期间未使用该药物,则将该药物对应的药物变量的取值确定为0;确定每一种药物对应的药物变量的取值,即可获得该患者的用药信息。
获得每一患者的用药信息之后,即获得全部用药信息。
本发明实施例通过文本信息抽取和数据结构化,获得0-1变量构成的用药信息,从而能利用逻辑运算扫描检测算法进行药物适应症预测,能提高预测的效率和全面性。
基于上述各实施例的内容,症状诊断信息包括每一患者的N个症状变量;每一症状变量为0-1变量;N为各患者的诊疗数据中适应症的种数。
具体地,症状诊断信息可以用矩阵表示。该矩阵中的每一行对应一个患者,每一列对应一种适应症(症状)。
该矩阵中的每一行向量均包括N个元素,每一元素均为症状变量。症状变量,表示某一患者是否患有某一症状。
相应地,对自然语言处理之后的各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取症状诊断信息的具体步骤包括:提取自然语言处理之后的各患者的诊疗数据中有关症状描述的关键字,获取每一患者患有的各种症状。
具体地,对于自然语言处理之后的每一患者的诊疗数据,可以提取上述数据中的入院诊断数据、主诉数据和出院诊断数据中有关症状描述的关键字,获得该患者患有的若干种不重复的症状。
对各患者患有的各种症状进行去重处理,获得N种适应症。
可以理解的是,不同的患者患有同一种症状,对各患者患有的各种症状进行去重处理,可以获得N种不重复的症状。上述N种不重复的症状,为各患者患有的全部症状。
对于每一患者,将患者患有的各种症状对应的症状变量的取值均确定为1,否则确定为0。
具体地,对于每一患者,对于上述N种症状中的每一种症状,若该患者患有该症状,则将该症状对应的症状变量的取值确定为1;若该患者未患有该症状,则将该症状对应的症状变量的取值确定为0;确定每一种症状对应的症状变量的取值,即可获得该患者的症状诊断信息。
获得每一患者的症状诊断信息之后,即获得全部症状诊断信息。
本发明实施例通过文本信息抽取和数据结构化,获得0-1变量构成的症状诊断信息,从而能利用逻辑运算扫描检测算法进行药物适应症预测,能提高预测的效率和全面性。
基于上述各实施例的内容,治疗结局信息包括各患者的治疗结局变量;治疗结局变量为0-1变量。
具体地,用药信息可以用向量表示。该向量中的每一个元素均为治疗结局变量,分别对应一个患者。治疗结局变量,表示某一患者的治疗结局。治疗结局包括治疗有效和治疗无效。
相应地,对自然语言处理之后的各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取用药信息的具体步骤包括:对于每一患者,判断自然语言处理之后的患者的诊疗数据中是否包括预设的关键词;若存在,则将患者的治疗结局变量的取值确定为1;若不存在,则将患者的治疗结局变量的取值确定为0。
具体地,预设的关键词为表示治疗有效的词语,如“好转”、“痊愈”等。需要说明的是,“未见明显好转”则不属于包括预设的关键词。
对于自然语言处理之后的每一患者的诊疗数据,若上述数据中的出院诊断数据中包括预设的关键词,则说明该患者的治疗结局为治疗有效,将该患者的治疗结局变量的取值确定为1;若上述数据中的出院诊断数据中不包括预设的关键词,则说明该患者的治疗结局为治疗无效,将该患者的治疗结局变量的取值确定为0。
确定每一患者的治疗结局变量的取值之后,即获得治疗结局信息。
本发明实施例通过文本信息抽取和数据结构化,获得0-1变量构成的治疗结局信息,从而能利用逻辑运算扫描检测算法进行药物适应症预测,能提高预测的效率和全面性。
基于上述各实施例的内容,利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果之后,还包括:根据药物适应症预测结果和已知的药物适应症,构建用药知识图谱。
具体地,已知的药物适应症,为根据已有的说明书或用药指南中已知的传统的药物-适应症关联规则。
药物适应症预测结果,为预测的药物-适应症关联规则。
根据预测的药物-适应症关联规则和传统药物-适应症关联规则,可以进一步挖掘出非传统的药物-适应症关联规则。
对于挖掘出的任一非传统的药物-适应症关联规则,可以通过根据专家评估数据和/或实验数据,确认该关联规则是否符合医学认知,将符合医学认知的有效的非传统药物-适应症关联知识补充到传统用药知识中,为构建用药知识图谱提供真实世界的证据,构建出完整的用药知识图谱。
本发明实施例通过结合药物适应症预测结果和已知的药物适应症,对已知的药物适应症进行补充和扩充,从而能构建出更完整的用药知识图谱。
图2为根据本发明实施例提供的药物适应症预测装置的结构示意图。基于上述各实施例的内容,如图2所示,该装置包括信息提取模块201和关联筛选模块202,其中:
信息提取模块201,用于对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;
关联筛选模块202,用于利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;
其中,用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
具体地,信息提取模块201对各患者的诊疗数据进行数据清洗,提取出用药信息、症状诊断信息和治疗结局信息。
用药信息,用于表示患者治疗期间使用的药物。用药信息包括各患者的用药信息。
症状诊断信息,用于表示患者患有的症状。症状诊断信息,包括各患者患有的症状诊断信息。患者的每一种症状,均作为一种适应症。
治疗结局信息,用于表示症状的变化,如减轻、加重、治愈、好转或无明显好转等。
关联筛选模块202穷举用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,利用BOOST算法,根据用药信息、症状诊断信息和治疗结局信息,判断该药物与该适应症之间是否具有关联关系。交互效应足够大,说明具有关联关系,否则不具有关联关系。
若具有关联关系,说明该药物具有非常大的用于治疗该适应症的可能性,则将该适应症作为该药物的适应症预测结果;若不具有关联关系,说明该药物不具有或具有非常小的用于治疗该适应症的可能性,则不将该适应症作为该药物的适应症预测结果。
本发明实施例提供的药物适应症预测装置,用于执行本发明上述各实施例提供的药物适应症预测方法,该药物适应症预测装置包括的各模块实现相应功能的具体方法和流程详见上述药物适应症预测方法的实施例,此处不再赘述。
该药物适应症预测装置用于前述各实施例的药物适应症预测方法。因此,在前述各实施例中的药物适应症预测方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例通过对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息,并利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,挖掘出用药信息中每一药物与症状诊断信息中每一适应症之间的交互效应,根据其中具有关联关系的组合获取药物适应症预测结果,能一次性获得多种药物的适应症预测结果,预测的效率更高,且能覆盖更多的适应症,预测的全面性更好。
图3为根据本发明实施例提供的电子设备的结构框图。基于上述实施例的内容,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例所提供的药物适应症预测方法,例如包括:对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;其中,用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的药物适应症预测方法,例如包括:对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;其中,用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的药物适应症预测方法,例如包括:对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;其中,用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种药物适应症预测方法,其特征在于,包括:
对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;
利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;
其中,所述用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
2.根据权利要求1所述的药物适应症预测方法,其特征在于,所述利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果的具体步骤包括:
对于所述用药信息中任一药物与症状诊断信息中任一适应症的两两组合中的每一种组合,根据非迭代的KSA方法获取所述组合的似然比检验统计量;
若判断获知所述组合的似然比检验统计量大于预设的显著性阈值,则将所述组合中的适应症作为所述组合中的药物的适应症预测结果。
3.根据权利要求1所述的药物适应症预测方法,其特征在于,所述对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息的具体步骤包括:
对所述各患者的诊疗数据进行自然语言处理;
对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息、症状诊断信息和治疗结局信息。
4.根据权利要求3所述的药物适应症预测方法,其特征在于,所述用药信息包括每一患者的M个药物变量;每一所述药物变量为0-1变量;M为所述各患者的诊疗数据中药物的种数;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息的具体步骤包括:
提取自然语言处理之后的所述各患者的诊疗数据中的药物名称,获取每一患者治疗期间使用的各种药物;
对各患者治疗期间使用的各种药物进行去重处理,获得M种药物;
对于每一患者,将所述患者治疗期间使用的各种药物对应的药物变量的取值均确定为1,否则确定为0。
5.根据权利要求3所述的药物适应症预测方法,其特征在于,所述症状诊断信息包括每一患者的N个症状变量;每一所述症状变量为0-1变量;N为所述各患者的诊疗数据中适应症的种数;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述症状诊断信息的具体步骤包括:
提取自然语言处理之后的所述各患者的诊疗数据中有关症状描述的关键字,获取每一患者患有的各种症状;
对各患者患有的各种症状进行去重处理,获得N种适应症;
对于每一患者,将所述患者患有的各种症状对应的症状变量的取值均确定为1,否则确定为0。
6.根据权利要求3所述的药物适应症预测方法,其特征在于,所述治疗结局信息包括各患者的治疗结局变量;所述治疗结局变量为0-1变量;
相应地,对自然语言处理之后的所述各患者的诊疗数据进行文本信息抽取,并对抽取结果进行数据结构化,获取所述用药信息的具体步骤包括:
对于每一患者,判断自然语言处理之后的所述患者的诊疗数据中是否包括预设的关键词;
若存在,则将所述患者的治疗结局变量的取值确定为1;若不存在,则将所述患者的治疗结局变量的取值确定为0。
7.根据权利要求1至6任一所述的药物适应症预测方法,其特征在于,所述利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果之后,还包括:
根据所述药物适应症预测结果和已知的药物适应症,构建用药知识图谱。
8.一种药物适应症预测装置,其特征在于,包括:
信息提取模块,用于对各患者的诊疗数据进行数据清洗,获取用药信息、症状诊断信息和治疗结局信息;
关联筛选模块,用于利用逻辑运算扫描检测算法,根据用药信息、症状诊断信息和治疗结局信息,获取药物适应症预测结果;
其中,所述用药信息、症状诊断信息和治疗结局信息均由0-1变量构成。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的药物适应症预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的药物适应症预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910566839.4A CN110459330A (zh) | 2019-06-27 | 2019-06-27 | 药物适应症预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910566839.4A CN110459330A (zh) | 2019-06-27 | 2019-06-27 | 药物适应症预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110459330A true CN110459330A (zh) | 2019-11-15 |
Family
ID=68481718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910566839.4A Pending CN110459330A (zh) | 2019-06-27 | 2019-06-27 | 药物适应症预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110459330A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111834017A (zh) * | 2020-07-09 | 2020-10-27 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种精神药物治疗效果预测方法,系统和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268290A1 (en) * | 2012-04-02 | 2013-10-10 | David Jackson | Systems and methods for disease knowledge modeling |
US20170098062A1 (en) * | 2013-06-26 | 2017-04-06 | International Business Machines Corporation | Method and system for exploring the associations between drug side-effects and therapeutic indications |
CN107403069A (zh) * | 2017-07-31 | 2017-11-28 | 京东方科技集团股份有限公司 | 一种药物‑疾病关联关系分析系统及方法 |
CN109273097A (zh) * | 2018-09-07 | 2019-01-25 | 郑州大学第附属医院 | 一种药物适应症的自动生成方法及装置 |
-
2019
- 2019-06-27 CN CN201910566839.4A patent/CN110459330A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130268290A1 (en) * | 2012-04-02 | 2013-10-10 | David Jackson | Systems and methods for disease knowledge modeling |
US20170098062A1 (en) * | 2013-06-26 | 2017-04-06 | International Business Machines Corporation | Method and system for exploring the associations between drug side-effects and therapeutic indications |
CN107403069A (zh) * | 2017-07-31 | 2017-11-28 | 京东方科技集团股份有限公司 | 一种药物‑疾病关联关系分析系统及方法 |
CN109273097A (zh) * | 2018-09-07 | 2019-01-25 | 郑州大学第附属医院 | 一种药物适应症的自动生成方法及装置 |
Non-Patent Citations (3)
Title |
---|
DONGHE LI ET AL.: ""Efficient Strategy to Identify Gene-Gene Interactions and Its Application to Type 2 Diabetes"", 《GENOMICS & INFORMATIC》 * |
XIANG WAN ET AL.: ""BOOST: A Fast Approach to Detecting Gene-Gene Interactions in Genome-wide Case-Control Studies"", 《AMERICAN JOURNAL OF HUMAN GENETICS》 * |
王志勇 等: ""病历智能分析系统的研究与实现"", 《中国数字医学》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111834017A (zh) * | 2020-07-09 | 2020-10-27 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种精神药物治疗效果预测方法,系统和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yeung et al. | Focus U-Net: A novel dual attention-gated CNN for polyp segmentation during colonoscopy | |
CN109637669B (zh) | 基于深度学习的治疗方案的生成方法、装置及存储介质 | |
CN109215754A (zh) | 病历数据处理方法、装置、计算机设备和存储介质 | |
CN107194158A (zh) | 一种基于图像识别的疾病辅助诊断方法 | |
CN115984622B (zh) | 基于多模态和多示例学习分类方法、预测方法及相关装置 | |
WO2022032824A1 (zh) | 图像分割方法、装置、设备及存储介质 | |
CN112885478A (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
Park et al. | Deep learning on time series laboratory test results from electronic health records for early detection of pancreatic cancer | |
CN113724814B (zh) | 一种分诊方法、装置、计算设备及存储介质 | |
Marathe et al. | Prediction of heart disease and diabetes using naive Bayes algorithm | |
CN111199796A (zh) | 一种疾病辅助决策方法、装置及电子设备 | |
Li et al. | Intradialytic hypotension prediction using covariance matrix-driven whale optimizer with orthogonal structure-assisted extreme learning machine | |
CN110459330A (zh) | 药物适应症预测方法及装置 | |
Bajpai et al. | Early Prediction of Cardiac Arrest Using Hybrid Machine Learning Models | |
CN116246762B (zh) | 基于人工智能的处方剂量优化方法、装置、设备及介质 | |
Bhat et al. | A risk assessment and prediction framework for diabetes mellitus using machine learning algorithms | |
US11817216B2 (en) | Search method and information processing system | |
Boyanapalli et al. | Ovarian cancer detection in computed tomography images using ensembled deep optimized learning classifier | |
CN108320788A (zh) | 医院业务分析方法及装置 | |
CN116524995A (zh) | 基于人工智能的药物疗效预测方法及相关设备 | |
CN115631823A (zh) | 相似病例推荐方法及系统 | |
Amer et al. | Biolearner: a machine learning-powered smart heart disease risk prediction system utilizing biomedical markers | |
Patnaik | Intelligent Decision Support System in Healthcare using Machine Learning Models | |
Yu et al. | Pyramid multi-loss vision transformer for thyroid cancer classification using cytological smear | |
CN112435745B (zh) | 就诊策略推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191115 |
|
RJ01 | Rejection of invention patent application after publication |