CN105825054B - 一种药物信息预测系统 - Google Patents

一种药物信息预测系统 Download PDF

Info

Publication number
CN105825054B
CN105825054B CN201610147701.7A CN201610147701A CN105825054B CN 105825054 B CN105825054 B CN 105825054B CN 201610147701 A CN201610147701 A CN 201610147701A CN 105825054 B CN105825054 B CN 105825054B
Authority
CN
China
Prior art keywords
drug
data
prior
mrow
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610147701.7A
Other languages
English (en)
Other versions
CN105825054A (zh
Inventor
黄亦谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kilo-Ampere Wise Man Information Technology Co Ltd
Original Assignee
Beijing Kilo-Ampere Wise Man Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kilo-Ampere Wise Man Information Technology Co Ltd filed Critical Beijing Kilo-Ampere Wise Man Information Technology Co Ltd
Priority to CN201610147701.7A priority Critical patent/CN105825054B/zh
Publication of CN105825054A publication Critical patent/CN105825054A/zh
Application granted granted Critical
Publication of CN105825054B publication Critical patent/CN105825054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及药物信息预测技术领域,公开了一种药物信息预测系统和方法,该系统包括:接收装置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;以及处理装置,用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能性。通过上述技术方案,本发明根据所接收的预测对象特征数据来预测相应的预测对象使用某种药物的可能性,实现了自动化地利用预测对象的已有信息来预测可能的药物信息。

Description

一种药物信息预测系统
技术领域
本发明涉及药物信息预测技术,具体地,涉及一种药物信息预测系统和方法。
背景技术
在某种疾病发现、治疗的过程中,医生根据病人的病症表现进行相应的用药,在治疗疾病的过程中,积累了大量的病人病症表现与病人用药方案。利用这些病人特征与用药方案之间的关系可以指导医生对病人选择合适的药物。现有的相关分析方法通常是人为地将病人信息与已有信息进行简单的比较,而缺少自动化的实现方式。
发明内容
本发明的目的是提供一种药物信息预测系统和方法,用于解决自动化地预测对象使用某种药物的可能性。
为了实现上述目的,本发明提供了一种药物信息预测系统,该系统包括:接收装置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;以及处理装置,用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能性。
相应地,本发明还提供了一种药物信息预测方法,该方法包括:接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;以及通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能性。
通过上述技术方案,本发明根据所接收的预测对象特征数据来预测相应的预测对象使用某种药物的可能性,实现了自动化地利用预测对象的已有信息来预测可能的药物信息。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是本发明提供的药物信息预测系统的框图;
图2是本发明提供的药物信息预测流程的图示;以及
图3是本发明提供的药物信息预测方法的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1是本发明提供的药物信息预测系统的框图,如图1所示,该系统包括接收装置和处理装置。接收装置用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;处理装置用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测预测对象使用多种药物中的每一种药物的可能性。
这里,“预测对象”意指将要进行药物使用可能性预测的对象,本领域技术人员应当理解,需要对哪个对象进行药物使用可能性预测,就需要接收该对象的特征数据,因为每个对象的特征数据是不同的,这里预测对象的特征数据被称为“预测对象特征数据”。每一种药物所对应的对象特征是不同的,所以需要针对每一种药物分别预测预测对象使用该种药物的可能性。接收装置接收的针对多种药物中的每一种药物的预测对象特征数据可以是一个预测对象的,也可以是多个预测对象的,但是,无论是一个还是多个预测预测的特征数据,都需要针对每一个预测对象分别进行每一种药物使用可能性的预测。
预测对象特征数据包括预测对象治疗前的特征数据,例如,预测对象的基本数据、临床检查数据、尿常规数据、生化数据、生命体征数据等。
本发明提供的药物信息预测技术是根据预先建立的预测模型来进行的,这里的预测模型可以为通过任意一种神经网络算法所建立的预测模型,只要适当地设置训练数据即可,本发明在下文中提供了建立预测模型的优选方式。
对于每一种药物,通过预先建立的预测模型可以得到预测对象使用每一种药物的可能性,假设有m种药物,那么对于第j个预测对象来说,预测对象j使用这m种药物的可能性可以表示为(pj1 pj2 … pjm)。
图1所示的处理装置还用于将可能性与推荐阈值进行比较,将可能性大于推荐阈值的药物设定作为预测对象的推荐药物。例如,可以将推荐阈值 Tp设置为0.8,多种药物的使用可能性中大于0.8的使用可能性所对应的药物作为该预测对象的推荐药物。也就是说,预测得到针对一预测对象的多种药物中的每一种药物的可能性,即可以得到多个可能性,将该多个可能性与推荐阈值(例如,0.8)进行比较,可能性大于0.8的药物即为推荐药物,最终得到的推荐药物可以是一种,也可以是多种。
下面具体介绍如何建立预测模型。
图1所示的接收装置还用于接收多个先验对象中的每一个先验对象针对多种药物中的每一种药物的先验对象特征数据;处理装置还用于将所接收的多个先验对象的先验对象特征数据作为训练数据,来建立预测模型。
这里,“先验对象”意指因数据采集需要而对其采集数据的对象,对先验对象所采集的特征数据称为“先验对象特征数据”,先验对象特征数据作为训练数据来建立预测模型。先验对象特征数据包括先验对象治疗前的特征数据,例如,可以将先验对象的基本数据、临床检查数据、尿常规数据、生化数据、生命体征数据等作为输入,将是否使用某种药物作为输出。
处理装置还用于对所接收的多个先验对象的先验对象特征数据进行数据处理,并采用数据处理后的先验对象特征数据作为训练数据。本领域技术人员应当理解,不同的特征数据具有不同的单位和表征形式,所以需要对所接收的先验对象特征数据进行数据处理,同理,对于上文中描述的预测对象特征数据也需要进行与先验对象特征数据相同的数据处理。下面仅以先验对象特征数据为例介绍数据处理过程。
数据处理包括:针对所述多种药物中的每一种药物,将多个先验对象分为使用和不使用两类,并用第一矩阵表示使用的先验对象特征,用第二矩阵表示不使用的先验对象特征;针对每一个特征,利用第一矩阵和第二矩阵的对应列进行秩和检验,得到统计显著性;将统计显著性小于显著性阈值的对象特征数据作为显著特征数据;通过第三矩阵表示使用的显著特征数据,通过第四矩阵表示不使用的显著特征数据;采用第三矩阵和第四矩阵作为训练数据;其中,第一至第四矩阵中各行分别表示不同的先验对象,各列分别表示不同特征对应的特征数据,显著特征数据对应的特征为显著特征。
具体来说,针对每一种药物,首先建立两个矩阵,第一矩阵用来表示使用该药物的先验对象特征数据,第二矩阵用来表示不使用该药物的先验对象特征数据。其中,第一矩阵和第二矩阵的一行表示一个先验对象的所有特征数据,一列表示所有先验对象的一个特征,举例来说,第一行表示第一个先验对象的所有特征数据,第二行表示第二个先验对象的所有特征数据,第一列表示第一个特征的特征数据,第二列表示第二个特征的特征数据。对于每一个特征,利用第一矩阵和第二矩阵的对应列进行秩和检验,得到统计显著性,可以设置显著性阈值T设置为0.01,统计显著性小于0.01的特征数据作为显著特征数据,显著特征数据对应的特征即为显著特征。通过显著特征对第一矩阵和第二矩阵中的先验对象特征数据进行数据提取,将第一矩阵和第二矩阵中显著特征的特征数据提取出来,并通过第三矩阵表示使用该药物的显著特征数据,通过第四矩阵表示不使用该药物的显著特征数据。第三矩阵和第四矩阵为作为训练数据的数据。
由于不同特征的数据具有不同的量纲,数据处理还包括:在将多个先验对象分为使用和不使用两类之前,对先验对象特征数据进行离散化或数值化,然后进行归一化。其中,先验对象治疗前的特征数据有的是连续型数据有的是离散型数据,对于连续性数据,可以保留数值,对于离散型数据,可以将数据转化为离散值,例如,1、2等。在对先验对象特征数据进行离散化或数值化之后,对离散化或数值化之后的数据进行归一化。
处理装置还用于:对预测对象特征数据离散化或数值化,然后进行归一化;根据预测对象特征数据中的显著特征对应的数据来预测所述可能性。也就是说,还需要对预测对象特征数据进行预处理,其中,离散化、数值化、归一化的过程与对先验对象特征数据进行处理的过程类似。通过上文的描述,通过先验对象特征数据可以得到哪些特征为显著特征,这样可以仅采用预测对象的显著特征数据来对使用某种药物的可能性进行预测。
处理装置还用于:在没有推荐药物的情况下,重新设定显著性阈值;在重新设定显著性阈值之后仍没有推荐药物的情况下,重新设定推荐阈值。具体来说,如果通过以上技术方案没有得到推荐药物,可以改变显著性阈值,例如,将显著性阈值重新设定为0.05,再重复本发明提供的过程,以得到推荐药物。然而,如果已经降低了显著性阈值,仍然没有推荐药物,那么可以重新设定推荐阈值,例如,可以将推荐阈值重新设定为0.5。
下面结合图2通过一个具体实施例对本发明进行更加详细的阐述。
图2是本发明提供的药物信息预测流程的图示,如图2所示:
步骤201,接收装置接收先验对象特征数据,一般为治疗前的对象数据。
步骤202,对先验对象特征数据进行离散化或数值化及归一化。对于接收到的先验对象特征数据,将其中连续性数据保留数值,将其中离散型数据 (例如,阴性、阳性)可以将数据转化为离散值,然后在对数值化或离散化后的特征数据进行归一化。例如可以通过下式(1)进行归一化:
其中,xi为一对象的特征数据,xmin为所接收到的同一特征对应的多个先验对象的特征数据中的最小值,xmax为所接收到的同一特征对应的多个先验对象的特征数据中的最大值。在归一化操作之后,将所有特征数据通过矩阵的形式表示出来,假设有p个先验对象,n个特征,那么所有先验对象所对应的特征数据可以表示为式(2):
其中xij表示第i个先验对象的第j个特征的取值,fj表示第j个特征。
步骤203,选择先验对象特征数据中的显著特征数据。对于一种研究疾病,已有的用药集合可以表示为{d1,d2,…,dm},di表示药物i,共有m种药物。针对药物di,将先验对象分为两组:使用药物di和不使用药物di,其中,将使用药物di的特征表示为式(3):
其中,表示使用药物di的先验对象特征矩阵,a表示使用药物di的先验对象的数量;
将不使用药物di的特征表示为式(4)
其中,表示不使用药物di的先验对象特征矩阵。
对每一个特征fj,利用矩阵的对应列进行秩和检验,得到统计显著性,设置显著性阈值T=0.01,选择T<0.01的特征作为药物di的显著特征。针对m种药物,对每一种药物获得对应的显著特征。
针对药物di,从式(3)和式(4)中将药物di的显著特征对应的特征数据提取出来,得到式(5)和式(6):
其中,b表示药物di的显著特征个数,保留显著特征对应列而生成的矩阵,为正样本训练数据。保留显著特征对应列而生成的矩阵,为负样本训练数据。
步骤204,利用支持向量机并利用式(5)和式(6)的数据建立预测模型。
步骤205,接收预测对象特征数据
步骤206,对预测对象特征数据进行离散化或数值化及归一化,该过程参考步骤202。
步骤207,选择预测对象特征数据中的显著特征数据,通过步骤203可以知道哪些特征为显著特征,将预测对象j所选择的显著特征数据表示为 (xj1 xj2 … xjb)。
步骤208,将预测对象作为测试数据,预测预测对象j使用药物di的可能性pji。对每一种药物进行预测,得到预测对象j使用每一种药物的可能性,表示为(pj1 pj2 … pjm)。
步骤209,设置推荐阈值Tp=0.8,pji>Tp所对应的药物为预测对象j的推荐药物。
以上i、j、m、n、p、a、b均为正整数。
通过上文描述,通过图2所示的过程没有推荐药物的情况下,可以通过改变显著性阈值T或推荐阈值Tp来得到推荐药物。
图3是本发明提供的药物信息预测方法的流程图,如图3所示,该方法包括:接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;通过预先建立的预测模型,根据所接收的预测对象特征数据来预测预测对象使用多种药物中的每一种药物的可能性。
应当说明的是,本发明提供的药物信息预测方法的具体细节及益处与本发明提供的药物信息预测系统类似,于此不予赘述。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (2)

1.一种药物信息预测系统,其特征在于,该系统包括:
接收装置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据,并接收多个先验对象中的每一个先验对象针对所述多种药物中的每一种药物的先验对象特征数据;以及
处理装置,用于将所接收的所述多个先验对象的所述先验对象特征数据进行数据处理,并采用数据处理后的先验对象特征数据作为训练数据来建立预测模型,具体包括以下步骤:
-对所述先验对象特征数据进行离散化或数值化,并通过式(1)进行归一化处理:
<mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> <mrow> <msub> <mi>x</mi> <mi>max</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>-</mo> <mn>1</mn> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,xi为一先验对象的特征数据,xmin为所接收到的同一特征对应的多个先验对象的特征数据中的最小值,xmax为所接收到的同一特征对应的多个先验对象的特征数据中的最大值;
-在所述归一化操作之后,将所述先验对象的特征数据由式(2)来表示:
其中xij表示第i个先验对象的第j个特征的取值,fj表示第j个特征,p为先验对象的数量,n为特征的数量;
-选择所述先验对象的特征数据中的显著特征数据,具体选择过程为:针对同一种疾病的药物的集合可以表示为{d1,d2,…,dm},di表示药物,以及m表示药物数量,根据药物di将先验对象分为使用药物di和不使用药物di的两组先验对象,其中使用药物di的特征由式(3)表示:
其中,表示使用药物di的先验对象特征矩阵,a表示使用药物di的先验对象的数量;
不使用药物di的特征由式(4)表示:
其中,表示不使用药物di的先验对象特征矩阵;
利用矩阵的对应列对每一个特征fj进行秩和检验以得到相应的统计显著性,将该统计显著性与显著性阈值进行对比以确定药物di的显著特征,其具体过程为:
针对药物di,从式(3)和式(4)中将药物di的显著特征对应的特征数据提取出来,得到式(5)和式(6):
其中,b表示药物di的显著特征个数,为正样本训练数据且为保留显著特征对应列而生成的矩阵,为负样本训练数据且为保留显著特征对应列而生成的矩阵;
-基于支持向量机并利用式(5)和式(6)所得到的数据建立预测模型;
所述处理装置还用于对所接收的所述预测对象特征数据离散化或数值化,然后进行归一化,以及基于所建立的所述预测模型选择预测对象特征数据中的显著特征数据,并根据从所述预测对象特征数据所选择的所述显著特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能性;
所述处理装置还用于将所述可能性与推荐阈值进行比较,将所述可能性大于所述推荐阈值的药物设定作为所述预测对象的推荐药物。
2.根据权利要求1所述的系统,其特征在于,所述处理装置还用于:
在没有所述推荐药物的情况下,重新设定所述显著性阈值;以及
在重新设定所述显著性阈值之后仍没有推荐药物的情况下,重新设定所述推荐阈值。
CN201610147701.7A 2016-03-15 2016-03-15 一种药物信息预测系统 Active CN105825054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610147701.7A CN105825054B (zh) 2016-03-15 2016-03-15 一种药物信息预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610147701.7A CN105825054B (zh) 2016-03-15 2016-03-15 一种药物信息预测系统

Publications (2)

Publication Number Publication Date
CN105825054A CN105825054A (zh) 2016-08-03
CN105825054B true CN105825054B (zh) 2018-01-09

Family

ID=56987255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610147701.7A Active CN105825054B (zh) 2016-03-15 2016-03-15 一种药物信息预测系统

Country Status (1)

Country Link
CN (1) CN105825054B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108478227B (zh) * 2018-01-03 2022-05-10 东软医疗系统股份有限公司 一种确定药物及其剂量值的方法和装置
CN108417271B (zh) * 2018-01-11 2021-11-19 复旦大学 基于精神障碍亚型分类的精神抑制药物推荐方法与系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901345B (zh) * 2009-05-27 2013-02-27 复旦大学 一种差异蛋白质组学的分类方法
WO2012021899A2 (en) * 2010-08-13 2012-02-16 Intellimedicine, Inc. System and methods for the production of personalized drug products

Also Published As

Publication number Publication date
CN105825054A (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
US11636309B2 (en) Systems and methods for modeling probability distributions
Galatzer-Levy et al. Quantitative forecasting of PTSD from early trauma responses: A machine learning application
Jensen et al. Mining electronic health records: towards better research applications and clinical care
CN109545317B (zh) 基于住院预测模型判定住院行为的方法及相关产品
CN107403069B (zh) 一种药物-疾病关联关系分析系统及方法
US20100114601A1 (en) System and methods for prescribing therapeutic and preventive regimens
CN107705842A (zh) 智能分诊系统及其工作方法
US20160183828A1 (en) Electronic apparatus for establishing prediction model based on electroencephalogram
CN112216361A (zh) 基于人工智能的随访计划单生成方法、装置、终端及介质
Bandres-Ciga et al. Mendelian randomization—a journey from obscurity to center stage with a few potholes along the way
CN113077875B (zh) Ct影像的处理方法及装置
CN105825054B (zh) 一种药物信息预测系统
Allesøe et al. Deep learning for cross-diagnostic prediction of mental disorder diagnosis and prognosis using Danish nationwide register and genetic data
AbdAlmageed et al. Assessment of facial morphologic features in patients with congenital adrenal hyperplasia using deep learning
Fong et al. An evaluation of patient safety event report categories using unsupervised topic modeling
Gupta et al. A hybrid convolutional neural network model to detect COVID‐19 and pneumonia using chest X‐ray images
JP7044113B2 (ja) 提示方法、提示システム、及びプログラム
Holliday et al. Susceptibility locus on chromosome 1q23-25 for a schizophrenia subtype resembling deficit schizophrenia identified by latent class analysis
WO2023013959A1 (ko) 아밀로이드 베타 축적 예측 장치 및 방법
CN110750621A (zh) 单据数据核查处理方法、装置、计算机设备和存储介质
Ketpupong et al. Applying text mining for classifying disease from symptoms
Helwe et al. CCS coding of discharge diagnoses via deep neural networks
Machado et al. Enrichment analysis applied to disease prognosis
US20100312732A1 (en) Methods and systems for response detection and efficacy
Jurisica Integrative computational biology, AI, and radiomics: building explainable models by integration of imaging, omics, and clinical data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant