CN108109700B - 一种慢性病药物疗效评价方法和装置 - Google Patents

一种慢性病药物疗效评价方法和装置 Download PDF

Info

Publication number
CN108109700B
CN108109700B CN201711376708.7A CN201711376708A CN108109700B CN 108109700 B CN108109700 B CN 108109700B CN 201711376708 A CN201711376708 A CN 201711376708A CN 108109700 B CN108109700 B CN 108109700B
Authority
CN
China
Prior art keywords
data
clustering
information
chronic
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711376708.7A
Other languages
English (en)
Other versions
CN108109700A (zh
Inventor
王莹莹
张剑冬
李奇
蔡云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201711376708.7A priority Critical patent/CN108109700B/zh
Publication of CN108109700A publication Critical patent/CN108109700A/zh
Application granted granted Critical
Publication of CN108109700B publication Critical patent/CN108109700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种慢性病药物疗效评价方法和装置。其中,所述方法包括:确定聚类方法;根据所述聚类方法对病例的真实特征数据进行聚类,得到不同类别对应的用药信息和诊断信息;根据所述不同类别对应的用药信息和诊断信息分析每种药物的疗效。本发明所提供的方法既可以应用于慢性病药物效果的评估相关的理论研究,又可以同时应用于临床的疾病并发症的预测、预警与用药推荐,分析结果详细、准确、误差小,数据样本数越庞大分析结果可信度越高,给医务工作者对于患者慢性病的治疗方案的分析和判断带来了巨大的方便,对生物学及医学相关领域的分析具有重要意义。

Description

一种慢性病药物疗效评价方法和装置
技术领域
本发明涉及生物信息技术领域,更具体地说,涉及一种慢性病药物疗效评价方法和装置。
背景技术
慢性病全称是慢性非传染性疾病,不是特指某种疾病,而是对一类起病隐匿,病程长且病情迁延不愈,缺乏确切的传染性生物病因证据,病因复杂,且有些尚未完全被确认的疾病的概括性总称。常见的慢性病主要有心脑血管疾病、癌症、糖尿病、慢性呼吸系统疾病,其中心脑血管疾病包含高血压、脑卒中和冠心病。
2012年全国18岁及以上成人高血压患病率为25.5%,糖尿病患病率为9.7%。根据2013年全国肿瘤登记结果分析,我国癌症发病率为235/10万,肺癌和乳腺癌分别位居男、女性发病首位,十年来我国癌症发病率呈上升趋势。
目前,现有的对于慢性病疗效评价的传统方法是设立对照组或通过治疗前后对比,然后利用t检验或卡方检验等统计学方法考察药物的疗效,但是这些传统方法通常每次只能针对单一疾病,且分析结果粗略、笼统、误差大,且由于部分患者数据庞大繁杂导致分析结果可信度低,给医务工作者对于患者慢性病的治疗方案的分析和判断造成了巨大的阻碍。
发明内容
有鉴于此,本发明提供一种慢性病药物疗效评价方法,包括:
S1,确定聚类方法;
S2,根据所述聚类方法对病例的真实特征数据进行聚类,得到不同类别对应的用药信息和诊断信息;
S3,根据所述不同类别对应的用药信息和诊断信息分析每种药物的疗效。
优选地,所述S1,包括:
S11,根据所述病例的所述真实特征数据生成符合所述真实特征数据的统计特征的仿真数据;
S12,对所述仿真数据通过不同的聚类方法进行聚类,生成聚类结果信息;
S13,对所述聚类结果信息进行评价,得到评价分数,并根据所述评价分数确定聚类方法。
优选地,所述S11包括:
S111,提取所述病例中的所述真实特征数据;
S112,根据所述真实特征数据生成与所述真实特征数据对应的随机数,并将所述随机数作为所述仿真数据。
优选地,所述S12包括:
S121,确定聚类方法的类别;
S122,在每个所述类别中选择一种或多种所述聚类方法;
S123,对所述仿真数据通过不同的聚类方法进行聚类,并生成与所述聚类方法对应的聚类结果信息。
优选地,所述S1之前,还包括:
S4,获取所述病例中包含时间节点的用药信息和诊断信息;
S5,根据所述包含时间节点的用药信息和诊断信息,生成真实特征数据。
优选地,所述包含时间节点的用药信息和诊断信息包括数值数据和类别数据;
所述S5包括:
S51,对所述数值数据进行标准化,将其整理成为矩阵形式,得到矩阵信息;
S52,对所述类别数据进行分类数值化,得到疾病程度数据信息;
S53,根据所述矩阵信息和所述疾病程度数据信息生成真实特征数据。
优选地,所述数值数据包括离散型数据和连续型数据;
所述S51包括:
S511,将所述数值数据中的离散型数据和连续型数据整理为列代表特征,行代表样本的矩阵形式;
S512,将所述离散型数据和所述连续型数据去除存在大量缺失值的行,并对剩余缺失值进行填充补足;
S513,对所述矩阵形式中的行和列进行行标准化和列标准化,得到矩阵信息。
优选地,所述类别数据包括疾病类别名称;
所述S52包括:
S521,根据所述类别数据的疾病类别名称生成表示严重等级的程度数据;
S522,将所述程度数据进行标准化,得到疾病程度数据信息。
此外,为解决上述问题,本发明还提供一种慢性病药物疗效评价装置,包括存储器以及处理器,所述存储器用于存储慢性病药物疗效评价程序,所述处理器运行所述慢性病药物疗效评价程序以使所述计算机设备执行如上述所述的慢性病药物疗效评价方法。
此外,为解决上述问题,本发明还提供一种计算机可读存储介质,其所述计算机可读存储介质上存储有慢性病药物疗效评价程序,所述慢性病药物疗效评价程序被处理器执行时实现如上述所述慢性病药物疗效评价方法。
本发明提供的一种慢性病药物疗效评价方法和装置。其中,所述方法包括:S1,确定聚类方法;S2,根据所述聚类方法对病例的真实特征数据进行聚类,得到不同类别对应的用药信息和诊断信息;S3,根据所述不同类别对应的用药信息和诊断信息分析每种药物的疗效。本发明首先基于病例中的真实特征数据确定适合于真实特征数据的聚类方法,并基于此构建慢病用药疗效评估的复杂模型,从而得到不同类别对应的用药信息和诊断信息,并可得到对于不同药物疗效的分析,能够使病人的诊断数据和用药数据得到充分利用,获得更准确和通用的评估模型,本发明所提供的方法既可以应用于慢性病药物效果的评估相关的理论研究,又可以同时应用于临床的疾病并发症的预测、预警与用药推荐,分析结果详细、准确、误差小,数据样本数越庞大分析结果可信度越高,给医务工作者对于患者慢性病的治疗方案的分析和判断带来了巨大的方便,对生物学及医学相关领域的分析具有重要意义。
附图说明
图1为本发明慢性病药物疗效评价方法实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明慢性病药物疗效评价方法第一实施例的流程示意图;
图3为本发明慢性病药物疗效评价方法第二实施例的流程示意图;
图4为本发明慢性病药物疗效评价方法第二实施例中包括步骤S1细化步骤的流程示意图;
图5为本发明慢性病药物疗效评价方法第三实施例的流程示意图;
图6为本发明慢性病药物疗效评价方法第四实施例的流程示意图;
图7为本发明慢性病药物疗效评价方法第五实施例的流程示意图;
图8为本发明慢性病药物疗效评价方法第五实施例中包括步骤S51和步骤S52的细化步骤的流程示意图;
图9为本发明慢性病药物疗效评价方法的具体功能实施方式及工作流程的系统整体流程框架图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面详细描述本发明的实施例,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的终端的硬件运行环境的结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏、输入单元比如键盘、遥控器,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器,例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。此外,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、数据接口控制程序、网络连接程序以及慢性病药物疗效评价程序。
本发明提供的一种慢性病药物疗效评价方法和装置。其中,所述方法分析结果详细、准确、误差小,数据样本数越庞大分析结果可信度越高,给医务工作者对于患者慢性病的治疗方案的分析和判断带来了巨大的方便,对生物学及医学相关领域的分析具有重要意义。该技术可以采用相关的软件或硬件实现,下面通过实施例进行描述。
实施例1:
参照图2,本发明第一实施例提供一种慢性病药物疗效评价方法,包括:
步骤S1,确定聚类方法;
上述,需要理解的是,聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
上述,聚类方法包括基于划分的聚类、层次聚类、基于密度的聚类和基于模型的聚类等多个类别。
上述,在本实施例中,在进行对病例的数据分析之前,首先要确定最适合的最优的聚类方法,然后在进行其他运算。
步骤S2,根据所述聚类方法对病例的真实特征数据进行聚类,得到不同类别对应的用药信息和诊断信息;
上述,即为对真实数据的建模过程,将真实特征数据输入所选择或所确定的聚类方法中进行通过所述聚类方法的聚类,从而得到不同类别的数据,即不同类别对应的用药信息和诊断信息。
步骤S3,根据所述不同类别对应的用药信息和诊断信息分析每种药物的疗效。
上述,即为本实施例中的对于结果的评价与分析,将通过聚类得到的每一类分别对应着不同的治疗疗效,根据疗效信息与用药信息统计分析每种药物的疗效。
本实施例首先基于病例中的真实特征数据确定适合于真实特征数据的聚类方法,并基于此构建慢病用药疗效评估的复杂模型,从而得到不同类别对应的用药信息和诊断信息,并可得到对于不同药物疗效的分析,能够使病人的诊断数据和用药数据得到充分利用,获得更准确和通用的评估模型,本实施例所提供的方法既可以应用于慢性病药物效果的评估相关的理论研究,又可以同时应用于临床的疾病并发症的预测、预警与用药推荐,分析结果详细、准确、误差小,数据样本数越庞大分析结果可信度越高,给医务工作者对于患者慢性病的治疗方案的分析和判断带来了巨大的方便,对生物学及医学相关领域的分析具有重要意义。
实施例2:
参照图3和图4,本发明第二实施例提供一种慢性病药物疗效评价方法,基于上述图2所示的第一实施例,
所述S1,包括:
S11,根据所述病例的所述真实特征数据生成符合所述真实特征数据的统计特征的仿真数据;
本实施例中,通过模特卡洛模拟的方法对聚类方法进行选择。
上述,需要理解的是,蒙特卡罗(MonteCarlo)方法,又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在上世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡罗方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。这也是以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。为象征性地表明这一方法的概率统计特征,故借用赌城蒙特卡罗命名。
需要理解的是,蒙特卡洛方法的原理是,当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,并用它们作为问题的解。这就是蒙特卡罗方法的基本思想。蒙特卡罗方法通过抓住事物运动的几何数量和几何特征,利用数学方法来加以模拟,即进行一种数字模拟实验。它是以一个概率模型为基础,按照这个模型所描绘的过程,通过模拟实验的结果,作为问题的近似解。可以把蒙特卡罗解题归结为三个主要步骤:构造或描述概率过程;实现从已知概率分布抽样;建立各种估计量。
上述,在利用蒙特卡洛方法进行模拟时,首先根据所述病例的所述真实特征数据生成符合所述真实特征数据的统计特征的仿真数据。
S12,对所述仿真数据通过不同的聚类方法进行聚类,生成聚类结果信息;
聚类方法包括基于划分的聚类、层次聚类、基于密度的聚类和基于模型的聚类等多个类别,在进行聚类时,通过不同的聚类方法进行聚类,生成与每个聚类方法相对应的聚类结果信息。
S13,对所述聚类结果信息进行评价,得到评价分数,并根据所述评价分数确定聚类方法。
通过评价分数来评价聚类方法的优劣,对所有评价分数进行排序等方法提取优选方法。
所述S11,包括:
S111,提取所述病例中的所述真实特征数据;
从获取到的病例中的数据中提取真实特征数据。
S112,根据所述真实特征数据生成与所述真实特征数据对应的随机数,并将所述随机数作为所述仿真数据。
上述,需要理解的是,随机数是专门的随机试验的结果。在统计学的不同技术中需要使用随机数,比如在从统计总体中抽取有代表性的样本的时候,或者在将实验动物分配到不同的试验组的过程中,或者在进行蒙特卡罗模拟法计算的时候等等。产生随机数有多种不同的方法。这些方法被称为随机数发生器。随机数最重要的特性是:它所产生的后面的那个数与前面的那个数毫无关系。
数据库中包含有所获得的一定基数患者的病例,在其中,根据每一列的特征数据,生成对应的随机数,从而抽取其中数据并作为仿真数据。其中,所述仿真数据带有原数据的统计特征。此外,可以通过其他方式获得与原数据具有相同统计特征的数据的方法,例如,取一定范围内数据的均值,通过计算一定范围内数据的标准偏差进行模拟数据的生成,通过间隔一定数量的对数据进行提取等等方法,从而使所提取到的数据与原数据具有相同的统计特征。
实施例3:
参照图5,本发明第三实施例提供一种慢性病药物疗效评价方法,基于上述图3所示的第二实施例,所述S12包括:
S121,确定聚类方法的类别;
S122,在每个所述类别中选择一种或多种所述聚类方法;
上述,聚类方法分为基于划分的聚类、层次聚类、基于密度的聚类和基于模型的聚类等多个类别,从每个类别中选择一种或多种对仿真数据进行聚类,包括但不限于K-Means、K-MEDOIDS、BIRCH、CURE、DBSCAN、STING等。
S123,对所述仿真数据通过不同的聚类方法进行聚类,并生成与所述聚类方法对应的聚类结果信息。
由于该场景下聚类没有外部标签信息,因此采用内部评价分数,利用下述方法计算用于评价聚类结果的评价分数,选择至少两种方法进行计算,具体方法包括但不限于Dunn and Dunn like Indices,Davies Bouldin Index,SD Validity Index,S_DbwValidity Index,Silhouette Width,R Squared index等。分析比较不同聚类方法的评价分数,选择最合适的聚类方法。
实施例4:
参照图6,本发明第四实施例提供一种慢性病药物疗效评价方法,基于上述图2所示的第一实施例,所述步骤S4,包括:
所述S1之前,还包括:
S4,获取所述病例中包含时间节点的用药信息和诊断信息;
本实施例中所采用的病例为电子病历。
上述,需要理解的是,电子病历(EMR,Electronic Medical Record)也叫计算机化的病案系统或称基于计算机的病人记录(CPR,Computer-Based Patient Record)。它是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历。它的内容包括纸张病历的所有信息。美国国立医学研究所将定义为:EMR是基于一个特定系统的电子化病人记录,该系统提供用户访问完整准确的数据、警示、提示和临床决策支持系统的能力。
上述,电子病历中,包括患者的不同时间节点的用药信息和诊断信息,即为包括症状和用药信息。其中,症状可以为ICD-10编码或文字所规范化的信息;所述用药信息可以包括但不限于药物通用名或商品名。
此外,在本实施例中,如果诊断信息中的症状信息不可获取,则可根据血压值(包括收缩压、舒张压)、血糖相关指标的结果(空腹血糖值、餐后1小时血糖、餐后2小时血糖、糖化血红蛋白等)、血脂相关指标的结果(如总胆固醇、甘油三酯、低密度胆固醇、高密度胆固醇)等是否达标来确定疾病进展。
S5,根据所述包含时间节点的用药信息和诊断信息,生成真实特征数据。
根据分组对输入数据进行分类和整理,从诊断信息中提取不同的与疗效相关的数据作为特征,从而得到真实特征数据。
实施例5:
参照图7和图8,本发明第五实施例提供一种慢性病药物疗效评价方法,基于上述图6所示的第四实施例,
所述包含时间节点的用药信息和诊断信息包括数值数据和类别数据;
所述S5包括:
S51,对所述数值数据进行标准化,将其整理成为矩阵形式,得到矩阵信息;
上述,为本实施例中的数据整理过程,根据数值的类型对其进行标准化,将其整理为矩阵形式,从而得到矩阵信息。
所述数值数据包括离散型数据和连续型数据;
所述S51包括:
S511,将所述数值数据中的离散型数据和连续型数据整理为列代表特征,行代表样本的矩阵形式;
根据数值的类型对其进行标准化,将其整理为列代表特征,行代表样本的矩阵形式。
上述,需要理解的是,矩阵是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。在物理学中,矩阵于电路学、力学、光学和量子物理中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,请参考矩阵理论。在天体物理、量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。
S512,将所述离散型数据和所述连续型数据去除存在大量缺失值的行,并对剩余缺失值进行填充补足;
S513,对所述矩阵形式中的行和列进行行标准化和列标准化,得到矩阵信息。
上述,在本实施例中,将离散型数据首先去除包含30%以上缺失值的行,进而将剩余的数据中的缺失值补充为0。
上述,在本实施例中,将连续型数据首先去除包含30%以上缺失值的行,进而将剩余的数据的缺失值以如下方式(包括但不限于)填充:几何平均值、算数平均值、中位数、零。在此之后进行列标准化与行标准化处理。
S52,对所述类别数据进行分类数值化,得到疾病程度数据信息;
所述类别数据包括疾病类别名称;
所述S52包括:
S521,根据所述类别数据的疾病类别名称生成表示严重等级的程度数据;
S522,将所述程度数据进行标准化,得到疾病程度数据信息。
S53,根据所述矩阵信息和所述疾病程度数据信息生成真实特征数据。
上述,对于症状之类的类别数据,可以根据其含义转换为表示严重程度等级之类的数值数据,然后再按数值数据进行处理。
此外,本发明还提供一种慢性病药物疗效评价装置,包括存储器以及处理器,所述存储器用于存储慢性病药物疗效评价程序,所述处理器运行所述慢性病药物疗效评价程序以使所述计算机设备执行如上述所述的慢性病药物疗效评价方法。
此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有慢性病药物疗效评价程序,所述慢性病药物疗效评价程序被处理器执行时实现如上述所述慢性病药物疗效评价方法。
为了更好的理解本发明所提供的慢性病药物疗效评价方法,通过如下实施例对功能实施方式及工作流程对本发明进行进一步说明:
本实施方式及工作流程选取公开的数据为测试数据,对比图9的系统整体流程框架图,进行实例分析。
1、输入真实数据:输入51770例糖尿病患者电子病历中的包含时间节点的诊断信息和用药信息。其中,症状包括糖尿病、脑卒中;用药信息包括阿卡波糖/拜唐苹、伏格列波糖/安立泰/倍欣/华怡平、吡格列酮/欧迪贝/艾汀/安可妥/贝糖宁、罗格列酮/尼克平/太罗、阿格列汀、西格列汀/捷偌维/健诺、索马鲁肽、恩格列净、利拉鲁肽/诺和力、艾塞那肽/百泌达、辛伐他汀/舒降之/辛可、阿托伐他汀/立普妥、氟伐他汀、瑞舒伐他汀/可定。
2、特征选择与提取:根据分组对输入数据进行分类和整理,得到每个患者的为一行,列为症状、是否高血压、年龄及所有的药物使用数目。
3、利用蒙特卡洛模拟的方法选择合适的聚类方法:利用蒙特卡洛生成仿真数据,通过K-Means、K-MEDOIDS、BIRCH、CURE、DBSCAN、STING对仿真数据进行聚类,采用Dunn andDunn like Indices,Silhouette Width分析比较不同聚类方法的评价分数,结果表明K-means为最适合的算法。
4、真实数据建模:将真实特征数据输入所选的聚类方法进行聚类,得到明显的两类。
5、用药信息统计分析:对聚类得到的2类,统计其对应的用药信息,发现第一类多数服用阿卡波糖,且年龄在65-80区间段;第二类多服用氟伐他汀,且多患有高血压。
6、结果评价与分析:结合症状信息,聚类得到的第一类患者多数并未由糖尿病后再患脑卒中,表明阿卡波糖可在一定程度上预防糖尿病病人患脑卒中,说明其药物疗效较好;相反的,聚类得到的第二类患者多数在糖尿病后又患脑卒中,说明氟伐他汀在预防糖尿病患者脑卒中方面效果并不好,但是由于该类中患者多患有高血压,故也可能由于血压控制不理想所致,不能直接下氟伐他汀效果不好的结论。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种慢性病药物疗效评价方法,其特征在于,包括:
S1,确定聚类方法;所述S1,包括:
S11,根据病例的真实特征数据生成符合所述真实特征数据的统计特征的仿真数据;
S12,对所述仿真数据通过不同的聚类方法进行聚类,生成聚类结果信息;聚类方法包括基于划分的聚类、层次聚类、基于密度的聚类和基于模型的聚类多个类别,在进行聚类时,通过不同的聚类方法进行聚类,生成与每个聚类方法相对应的聚类结果信息;
S13,对所述聚类结果信息进行评价,得到评价分数,并根据所述评价分数确定聚类方法;
S2,根据所述聚类方法对病例的真实特征数据进行聚类,得到不同类别对应的用药信息和诊断信息;
S3,根据所述不同类别对应的用药信息和诊断信息分析每种药物的疗效;
所述S1之前,还包括:
S4,获取病例中包含时间节点的用药信息和诊断信息;
S5,根据所述包含时间节点的用药信息和诊断信息,生成真实特征数据。
2.如权利要求1所述慢性病药物疗效评价方法,其特征在于,所述S11包括:
S111,提取所述病例中的所述真实特征数据;
S112,根据所述真实特征数据生成与所述真实特征数据对应的随机数,并将所述随机数作为所述仿真数据。
3.如权利要求1所述慢性病药物疗效评价方法,其特征在于,所述S12包括:
S121,确定聚类方法的类别;
S122,在每个所述类别中选择一种或多种所述聚类方法;
S123,对所述仿真数据通过不同的聚类方法进行聚类,并生成与所述聚类方法对应的聚类结果信息。
4.如权利要求1所述慢性病药物疗效评价方法,其特征在于,
所述包含时间节点的用药信息和诊断信息包括数值数据和类别数据;
所述S5包括:
S51,对所述数值数据进行标准化,将其整理成为矩阵形式,得到矩阵信息;
S52,对所述类别数据进行分类数值化,得到疾病程度数据信息;
S53,根据所述矩阵信息和所述疾病程度数据信息生成真实特征数据。
5.如权利要求4所述慢性病药物疗效评价方法,其特征在于,所述数值数据包括离散型数据和连续型数据;
所述S51包括:
S511,将所述数值数据中的离散型数据和连续型数据整理为列代表特征,行代表样本的矩阵形式;
S512,将所述离散型数据和所述连续型数据去除存在大量缺失值的行,并对剩余缺失值进行填充补足;
S513,对所述矩阵形式中的行和列进行行标准化和列标准化,得到矩阵信息。
6.如权利要求4所述慢性病药物疗效评价方法,其特征在于,
所述类别数据包括疾病类别名称;
所述S52包括:
S521,根据所述类别数据的疾病类别名称生成表示严重等级的程度数据;
S522,将所述程度数据进行标准化,得到疾病程度数据信息。
7.一种慢性病药物疗效评价装置,其特征在于,包括存储器以及处理器,所述存储器用于存储慢性病药物疗效评价程序,所述处理器运行所述慢性病药物疗效评价程序以使计算机设备执行如权利要求1-6中任一项所述的慢性病药物疗效评价方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有慢性病药物疗效评价程序,所述慢性病药物疗效评价程序被处理器执行时实现如权利要求1-6任一项所述慢性病药物疗效评价方法。
CN201711376708.7A 2017-12-19 2017-12-19 一种慢性病药物疗效评价方法和装置 Active CN108109700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711376708.7A CN108109700B (zh) 2017-12-19 2017-12-19 一种慢性病药物疗效评价方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711376708.7A CN108109700B (zh) 2017-12-19 2017-12-19 一种慢性病药物疗效评价方法和装置

Publications (2)

Publication Number Publication Date
CN108109700A CN108109700A (zh) 2018-06-01
CN108109700B true CN108109700B (zh) 2021-05-25

Family

ID=62210354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711376708.7A Active CN108109700B (zh) 2017-12-19 2017-12-19 一种慢性病药物疗效评价方法和装置

Country Status (1)

Country Link
CN (1) CN108109700B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360661A (zh) * 2018-07-12 2019-02-19 上海金仕达卫宁软件科技有限公司 慢性病个性化精准用药指导方法及系统
CN109243620B (zh) * 2018-09-07 2020-10-02 上海交通大学医学院附属新华医院 基于血药浓度监测的药效优化方法及装置
CN109273097B (zh) * 2018-09-07 2021-04-13 郑州大学第一附属医院 一种药物适应症的自动生成方法、装置、设备及存储介质
CN109166626B (zh) * 2018-10-29 2021-09-14 中山大学 一种消化性溃疡病人的医疗指标缺失数据补全方法
CN109544372B (zh) * 2018-10-30 2024-04-09 平安医疗健康管理股份有限公司 基于人工智能的门诊慢性病资质监控方法及相关装置
CN109378074A (zh) * 2018-10-31 2019-02-22 平安医疗健康管理股份有限公司 基于人工智能的慢性病管理方法及相关装置
CN109360658B (zh) * 2018-11-01 2021-06-08 北京航空航天大学 一种基于词向量模型的疾病模式挖掘方法及装置
CN109616216A (zh) * 2018-11-30 2019-04-12 平安医疗健康管理股份有限公司 医疗费用预测方法、装置、设备及计算机可读存储介质
CN109659004A (zh) * 2018-12-13 2019-04-19 平安医疗健康管理股份有限公司 辅助用药检测方法、装置、设备及计算机可读存储介质
CN110503158A (zh) * 2019-08-28 2019-11-26 山东健康医疗大数据有限公司 一种基于时间因素的药物疾病相关性分析方法
CN110812241A (zh) * 2019-10-18 2020-02-21 平安科技(深圳)有限公司 基于时序聚类的用药提醒方法及相关设备
CN111178444B (zh) * 2019-12-31 2023-06-02 山东中医药大学第二附属医院 一种基于向量分析的中药配方治疗效果统计方法
CN111696678B (zh) * 2020-06-15 2023-05-26 中南大学 一种基于深度学习的用药决策方法和系统
CN111739646A (zh) * 2020-06-22 2020-10-02 平安医疗健康管理股份有限公司 数据验证方法、装置、计算机设备及可读存储介质
CN113554183B (zh) * 2021-08-03 2022-05-13 同济大学 一种基于无监督机器学习算法的极值预测方法
CN116504354B (zh) * 2023-06-28 2024-01-09 合肥工业大学 一种基于智慧医疗的智能化服务推荐方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469108A (zh) * 2015-11-17 2016-04-06 深圳先进技术研究院 基于生物学数据的聚类方法及系统、聚类结果评价方法及系统
CN105574351A (zh) * 2015-12-31 2016-05-11 北京千安哲信息技术有限公司 医学数据处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469108A (zh) * 2015-11-17 2016-04-06 深圳先进技术研究院 基于生物学数据的聚类方法及系统、聚类结果评价方法及系统
CN105574351A (zh) * 2015-12-31 2016-05-11 北京千安哲信息技术有限公司 医学数据处理方法

Also Published As

Publication number Publication date
CN108109700A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108109700B (zh) 一种慢性病药物疗效评价方法和装置
Galeano et al. Predicting the frequencies of drug side effects
Huang et al. A regularized deep learning approach for clinical risk prediction of acute coronary syndrome using electronic health records
CN111710420B (zh) 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质
Bent et al. The digital biomarker discovery pipeline: An open-source software platform for the development of digital biomarkers using mHealth and wearables data
CN111260448A (zh) 基于人工智能的药品推荐方法及相关设备
CN111785366B (zh) 患者治疗方案的确定方法、装置及计算机设备
WO2017017554A1 (en) Reliability measurement in data analysis of altered data sets
CN115050442A (zh) 基于挖掘聚类算法的病种数据上报方法、装置及存储介质
Sanders Jr et al. Machine learning: at the heart of failure diagnosis
US20210117867A1 (en) Method and apparatus for subtyping subjects based on phenotypic information
CN112071431B (zh) 基于深度学习和知识图谱的临床路径自动生成方法及系统
Karlsson et al. Predicting adverse drug events using heterogeneous event sequences
Osuwa et al. Importance of continuous improvement of machine learning algorithms from a health care management and management information systems perspective
US20190189248A1 (en) Methods, systems and apparatus for subpopulation detection from biological data based on an inconsistency measure
CN112366002A (zh) 一种基于知识库对院内真实世界不良用药的评估方法
US11317870B1 (en) System and method for health assessment on smartphones
CN112258135A (zh) 处方数据的审核方法、装置和计算机可读存储介质
CN115775635A (zh) 基于深度学习模型的药品风险识别方法、装置及终端设备
Hsiao et al. Hybrid-pattern recognition modeling with arrhythmia signal processing for ubiquitous health management
CN112071439B (zh) 药物副作用关系预测方法、系统、计算机设备和存储介质
EP3230907B1 (en) System and method for uniformly correlating unstructured entry features to associated therapy features
CN114444563A (zh) 一种异常医疗费用的检测方法、装置及存储介质
CN113902186A (zh) 一种基于电子病历的患者死亡风险预测方法、系统、终端及可读存储介质
Dang et al. Sequence-based measure for assessing drug-side effect causal relation from electronic medical records

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant