CN109215795A - 病例复杂度预测方法及系统 - Google Patents

病例复杂度预测方法及系统 Download PDF

Info

Publication number
CN109215795A
CN109215795A CN201810909242.0A CN201810909242A CN109215795A CN 109215795 A CN109215795 A CN 109215795A CN 201810909242 A CN201810909242 A CN 201810909242A CN 109215795 A CN109215795 A CN 109215795A
Authority
CN
China
Prior art keywords
case
ramification
degree
target
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810909242.0A
Other languages
English (en)
Other versions
CN109215795B (zh
Inventor
曹健
朱能军
沈坤炜
陈小松
朱思吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Original Assignee
Shanghai Jiaotong University
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd filed Critical Shanghai Jiaotong University
Priority to CN201810909242.0A priority Critical patent/CN109215795B/zh
Publication of CN109215795A publication Critical patent/CN109215795A/zh
Application granted granted Critical
Publication of CN109215795B publication Critical patent/CN109215795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本发明提供了一种病例复杂度预测方法及系统,包括:计算每个历史病例的讨论分歧度;获取每个历史病例的特征数据;根据历史病例的特征数据和讨论分歧度建立回归模型;根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度;根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型;利用治疗方案推荐模型给出目标病例的推荐结果,计算推荐结果的不确定性;线性组合目标病例的讨论分歧度和推荐结果的不确定性,从而确定反应目标病例复杂度的综合指标。本发明能够充分利用多学科医疗决策团队的历史投票数据和历史病例数据,从多个维度,即讨论的分歧度和推荐结果的不确定性,定义病例的复杂度指标。

Description

病例复杂度预测方法及系统
技术领域
本发明涉及医疗决策和机器学习领域,具体地,涉及融合讨论分歧度和推荐不确定性的病例复杂度预测方法及系统。
背景技术
随着医疗学科越来越精细化,仅仅根据单个医生的经验制定的治疗方案会存在一定的风险,因此,建立多学科医疗决策团队在一定程度上保证了决策的合理性,但多学科讨论也影响了决策过程的效率,会造成了对医疗资源的浪费。为了提高多学科医疗决策的效率,大量研究工作集中在对治疗方案推荐系统的研究,同时也有一部分研究工作关注优化决策过程。但是,无论是从建立推荐系统的角度来看,还是从优化决策过程的角度来看,这些研究工作大都以同等的方式对待每一个病例。然而,现实中,各个病例的复杂度往往是不一样的,比如有些病例会比另外一些病例复杂很多。在这种情况下,如果能够准确地预测每个病例的复杂度,就能促进分类处理病例,从而更加合理的分配医疗资源。
最简单的考虑病例复杂度的方法是基于规则的,例如,根据患者年龄,病灶个数等,这种方法的缺陷在于不能充分利用历史数据信息。另外,根据多学科团队的历史行为数据和推荐模型的推荐结果定义病例的复杂度的研究也相对匮乏。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种病例复杂度预测方法及系统。
根据本发明提供的一种病例复杂度预测方法,包括:
讨论分歧度计算步骤:计算每个历史病例的讨论分歧度;
特征数据获取步骤:获取每个历史病例的特征数据;
回归模型建立步骤:根据历史病例的特征数据和讨论分歧度建立回归模型;
预测步骤:根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度;
推荐模型建立步骤:根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型;
不确定性计算步骤:利用治疗方案推荐模型给出目标病例的推荐结果,计算推荐结果的不确定性;
线性组合步骤:线性组合目标病例的讨论分歧度和推荐结果的不确定性,从而确定反应目标病例复杂度的综合指标。
较佳的,还包括:
分类步骤:根据得到的综合指标与预设阈值的比较,将目标病例划分到对应的分类。
较佳的,所述讨论分歧度计算步骤根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度;
计算讨论分歧度H(Vi)的公式包括:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。
较佳的,所述回归模型包括:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。
较佳的,所述不确定性计算步骤包括:
确定相似近邻的个数,利用相似近邻的治疗方案集合的信息熵计算出推荐结果的不确定性。
根据本发明提供的一种病例复杂度预测系统,包括:
讨论分歧度计算模块:计算每个历史病例的讨论分歧度;
特征数据获取模块:获取每个历史病例的特征数据;
回归模型建立模块:根据历史病例的特征数据和讨论分歧度建立回归模型;
预测模块:根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度;
推荐模型建立模块:根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型;
不确定性计算模块:利用治疗方案推荐模型给出目标病例的推荐结果,计算推荐结果的不确定性;
线性组合模块:线性组合目标病例的讨论分歧度和推荐结果的不确定性,从而确定反应目标病例复杂度的综合指标。
较佳的,还包括:
分类模块:根据得到的综合指标与预设阈值的比较,将目标病例划分到对应的分类。
较佳的,所述讨论分歧度计算模块根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度;
计算讨论分歧度H(Vi)的公式包括:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。
较佳的,所述回归模型包括:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。
较佳的,所述不确定性计算模块包括:
确定相似近邻的个数,利用相似近邻的治疗方案集合的信息熵计算出推荐结果的不确定性。
与现有技术相比,本发明具有如下的有益效果:
本发明能够充分利用多学科医疗决策团队的历史投票数据和历史病例数据,从多个维度,即讨论的分歧度和推荐结果的不确定性,定义病例的复杂度指标,从而达到更科学、更准确的预测每一个目标病例的复杂度,为更合理的、个性化的处理每一个目标病例奠定了基础。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的工作流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
如图1所示,本发明提供的一种病例复杂度预测方法,包括:
步骤1:根据每一个历史病例的投票结果的信息熵计算其讨论分歧度如下:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。假设有3人参与了某个病例的投票,其中2人投了A选项,1人投了B选项,则该投票结果的分歧度为:H=-(2/3*log(2/3)+1/3*log(1/3))。
步骤2:确定每一个病例的特征数据,如年龄,BMI,ER,病例类型等,这里不同的特征类型需要做一定的预处理,如分类变量特征需要做数值编码等。
步骤3:通过历史病例的特征数据以及对应的讨论分歧度建立线性回归模型如下:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。通过梯度下降的方法确定θ的值。本步骤涉及的机器学习算法,并不局限于线性回归模型,也可以是其他回归模型,如,SVM回归等。
步骤4:利用步骤3中学出的线性回归模型和目标病例特征数据预测出目标病例的讨论分歧度,即
步骤5:根据历史病例特征数据集和对应的确定了的治疗方案,建立治疗方案推荐模型,如K-近邻(KNN)模型。这里也可以利用其他的机器学习模型建立推荐系统。KNN模型的核心是对每一维特征之间的距离加权求和,得到两个样本之间的距离,然后根据该距离确定一定数量的近邻病例,再在这些病例当中采样加权投票的方式确定最终推荐方案。
步骤6:利用治疗方案推荐模型给出目标病例的推荐结果,并确定推荐结果的不确定性。以KNN模型为例,其推荐结果的不确定性的计算过程如下:
步骤6.1:确定相似近邻的个数,如最相似的三个近邻设为Top-3。
步骤6.2:利用步骤1中所示的信息熵公式计算出这些近邻的治疗方案集合的不确定性如,Top-3近邻中存在两种推荐方案,其中2个近邻为a方案,1个近邻为b方案,则其推荐结果的不确定性I=-(2/3*log(2/3)+1/3*log(1/3))。
步骤7:线性组合步骤4中得到的讨论分歧度和步骤6中得到的推荐结果的不确定性,从而得到可以反映病例复杂度的综合指标=alpha*H+(1-alpha)*I,其中alpha为平衡参数,如取0.5表示讨论分歧度和推荐结果的不确定在预测病例复杂度的过程中同等重要。
步骤8:根据病例复杂度大小和确定的阈值,将病例划分到不同的分类,从而实现不同类的病例采用不同的处理方式。比如,为疑难病例分配更多的医疗资源,而对简单常规病例采样简易决策流程等。
在上述一种病例复杂度预测方法的基础上,本发明还提供一种病例复杂度预测系统,包括:
讨论分歧度计算模块:根据每一个历史病例的投票结果的信息熵计算其讨论分歧度如下:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。假设有3人参与了某个病例的投票,其中2人投了A选项,1人投了B选项,则该投票结果的分歧度为:H=-(2/3*log(2/3)+1/3*log(1/3))。
特征数据获取模块:确定每一个病例的特征数据,如年龄,BMI,ER,病例类型等,这里不同的特征类型需要做一定的预处理,如分类变量特征需要做数值编码等。
回归模型建立模块:通过历史病例的特征数据以及对应的讨论分歧度建立线性回归模型如下:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。通过梯度下降的方法确定θ的值。本步骤涉及的机器学习算法,并不局限于线性回归模型,也可以是其他回归模型,如,SVM回归等。
预测模块:利用回归模型建立模块中学出的线性回归模型和目标病例特征数据预测出目标病例的讨论分歧度,即
推荐模型建立模块:根据历史病例特征数据集和对应的确定了的治疗方案,建立治疗方案推荐模型,如K-近邻(KNN)模型。这里也可以利用其他的机器学习模型建立推荐系统。KNN模型的核心是对每一维特征之间的距离加权求和,得到两个样本之间的距离,然后根据该距离确定一定数量的近邻病例,再在这些病例当中采样加权投票的方式确定最终推荐方案。
不确定性计算模块:利用治疗方案推荐模型给出目标病例的推荐结果,并确定推荐结果的不确定性。以KNN模型为例,其推荐结果的不确定性的计算过程如下:
不确定性计算模块.1:确定相似近邻的个数,如最相似的三个近邻设为Top-3。
不确定性计算模块.2:利用讨论分歧度计算模块中所示的信息熵公式计算出这些近邻的治疗方案集合的不确定性如,Top-3近邻中存在两种推荐方案,其中2个近邻为a方案,1个近邻为b方案,则其推荐结果的不确定性I=-(2/3*log(2/3)+1/3*log(1/3))。
线性组合模块:线性组合预测模块中得到的讨论分歧度和不确定性计算模块中得到的推荐结果的不确定性,从而得到可以反映病例复杂度的综合指标=alpha*H+(1-alpha)*I,其中alpha为平衡参数,如取0.5表示讨论分歧度和推荐结果的不确定在预测病例复杂度的过程中同等重要。
分类模块:根据病例复杂度大小和确定的阈值,将病例划分到不同的分类,从而实现不同类的病例采用不同的处理方式。比如,为疑难病例分配更多的医疗资源,而对简单常规病例采样简易决策流程等。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种病例复杂度预测方法,其特征在于,包括:
讨论分歧度计算步骤:计算每个历史病例的讨论分歧度;
特征数据获取步骤:获取每个历史病例的特征数据;
回归模型建立步骤:根据历史病例的特征数据和讨论分歧度建立回归模型;
预测步骤:根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度;
推荐模型建立步骤:根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型;
不确定性计算步骤:利用治疗方案推荐模型给出目标病例的推荐结果,计算推荐结果的不确定性;
线性组合步骤:线性组合目标病例的讨论分歧度和推荐结果的不确定性,从而确定反应目标病例复杂度的综合指标。
2.根据权利要求1所述的病例复杂度预测方法,其特征在于,还包括:
分类步骤:根据得到的综合指标与预设阈值的比较,将目标病例划分到对应的分类。
3.根据权利要求1所述的病例复杂度预测方法,其特征在于,所述讨论分歧度计算步骤根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度;
计算讨论分歧度H(Vi)的公式包括:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。
4.根据权利要求1所述的病例复杂度预测方法,其特征在于,所述回归模型包括:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。
5.根据权利要求1所述的病例复杂度预测方法,其特征在于,所述不确定性计算步骤包括:
确定相似近邻的个数,利用相似近邻的治疗方案集合的信息熵计算出推荐结果的不确定性。
6.一种病例复杂度预测系统,其特征在于,包括:
讨论分歧度计算模块:计算每个历史病例的讨论分歧度;
特征数据获取模块:获取每个历史病例的特征数据;
回归模型建立模块:根据历史病例的特征数据和讨论分歧度建立回归模型;
预测模块:根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度;
推荐模型建立模块:根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型;
不确定性计算模块:利用治疗方案推荐模型给出目标病例的推荐结果,计算推荐结果的不确定性;
线性组合模块:线性组合目标病例的讨论分歧度和推荐结果的不确定性,从而确定反应目标病例复杂度的综合指标。
7.根据权利要求6所述的病例复杂度预测系统,其特征在于,还包括:
分类模块:根据得到的综合指标与预设阈值的比较,将目标病例划分到对应的分类。
8.根据权利要求6所述的病例复杂度预测系统,其特征在于,所述讨论分歧度计算模块根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度;
计算讨论分歧度H(Vi)的公式包括:
其中C为该次投票中所有投票选项的集合,Pic为选项c在这次投票结果Vi中的比例。
9.根据权利要求6所述的病例复杂度预测系统,其特征在于,所述回归模型包括:
其中,θ为模型参数,也即各个特征的权重,记录病例特数据值,λθ为正则项参数,T为矩阵的转置符号。
10.根据权利要求6所述的病例复杂度预测系统,其特征在于,所述不确定性计算模块包括:
确定相似近邻的个数,利用相似近邻的治疗方案集合的信息熵计算出推荐结果的不确定性。
CN201810909242.0A 2018-08-10 2018-08-10 病例复杂度预测方法及系统 Active CN109215795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810909242.0A CN109215795B (zh) 2018-08-10 2018-08-10 病例复杂度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810909242.0A CN109215795B (zh) 2018-08-10 2018-08-10 病例复杂度预测方法及系统

Publications (2)

Publication Number Publication Date
CN109215795A true CN109215795A (zh) 2019-01-15
CN109215795B CN109215795B (zh) 2020-11-06

Family

ID=64988270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810909242.0A Active CN109215795B (zh) 2018-08-10 2018-08-10 病例复杂度预测方法及系统

Country Status (1)

Country Link
CN (1) CN109215795B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599182A (zh) * 2019-02-18 2019-04-09 湖南金特尔信息技术有限公司 一种基因靶向治疗方案推荐系统及相关系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120016206A1 (en) * 2010-07-16 2012-01-19 Navya Network Inc. Treatment decision engine with applicability measure
CN107358019A (zh) * 2017-05-25 2017-11-17 上海交通大学医学院附属瑞金医院 适用于概念漂移的医疗方案的推荐系统及方法
CN107463771A (zh) * 2017-07-14 2017-12-12 北京华搏信息技术有限公司 一种病例分组的方法和系统
CN107480426A (zh) * 2017-07-20 2017-12-15 广州慧扬健康科技有限公司 自迭代病历档案聚类分析系统
CN108320804A (zh) * 2018-01-30 2018-07-24 上海蓬海涞讯数据技术有限公司 基于疾病复杂程度评价系统实现疾病复杂程度量化评价的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120016206A1 (en) * 2010-07-16 2012-01-19 Navya Network Inc. Treatment decision engine with applicability measure
CN107358019A (zh) * 2017-05-25 2017-11-17 上海交通大学医学院附属瑞金医院 适用于概念漂移的医疗方案的推荐系统及方法
CN107463771A (zh) * 2017-07-14 2017-12-12 北京华搏信息技术有限公司 一种病例分组的方法和系统
CN107480426A (zh) * 2017-07-20 2017-12-15 广州慧扬健康科技有限公司 自迭代病历档案聚类分析系统
CN108320804A (zh) * 2018-01-30 2018-07-24 上海蓬海涞讯数据技术有限公司 基于疾病复杂程度评价系统实现疾病复杂程度量化评价的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG YAN 等: "A Multi-Disciplinary Medical Treatment Decision Support", 《COMPUTER AND COMMUNICATIONS》 *
李树春 等: "基于高频脑电非线性动力学参数的疾病诊断专家系统研", 《佳木斯大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599182A (zh) * 2019-02-18 2019-04-09 湖南金特尔信息技术有限公司 一种基因靶向治疗方案推荐系统及相关系统

Also Published As

Publication number Publication date
CN109215795B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
Lin et al. Multi-attribute group decision-making under probabilistic uncertain linguistic environment
Safari et al. Identifying and evaluating enterprise architecture risks using FMEA and fuzzy VIKOR
Choi et al. A patent-based cross impact analysis for quantitative estimation of technological impact: The case of information and communication technology
Kocijan et al. Dynamic systems identification with Gaussian processes
Li et al. Mixed interval–fuzzy two-stage integer programming and its application to flood-diversion planning
Azadeh et al. An integrated support vector regression–imperialist competitive algorithm for reliability estimation of a shearing machine
Wang et al. A decomposition-based approach to flexible flow shop scheduling under machine breakdown
Yu et al. Multicriteria decision making with 2‐dimension linguistic aggregation techniques
Lee et al. Oracle estimation of a change point in high-dimensional quantile regression
Shafaei et al. An adaptive neuro fuzzy inference system for makespan estimation in multiprocessor no-wait two stage flow shop
Chen et al. Optimal variability sensitive condition-based maintenance with a Cox PH model
CN113435998B (zh) 贷款逾期预测方法、装置、电子设备及存储介质
Joshi Multi-criteria decision-making based on bi-parametric exponential fuzzy information measures and weighted correlation coefficients
CN112163715A (zh) 生成式对抗网络的训练方法及装置、电力负荷预测方法
Mohammad Nezhad et al. An artificial neural network meta-model for constrained simulation optimization
Yao et al. Statistical interpretations of three-way decisions
Wang et al. An order-based estimation of distribution algorithm for stochastic hybrid flow-shop scheduling problem
Chen et al. Optimizing 3D printing facility selection for ubiquitous manufacturing using an evolving fuzzy big data analytics approach
Priore et al. Learning-based scheduling of flexible manufacturing systems using support vector machines
CN109215795A (zh) 病例复杂度预测方法及系统
Chen Multi-criteria decision-making methods with optimism and pessimism based on Atanassov's intuitionistic fuzzy sets
Poryazov et al. Intuitionistic fuzzy representation of uncertainty in biomedical operations
Isken et al. Queueing inspired feature engineering to improve and simplify patient flow simulation metamodels
CN114358350A (zh) 会议预定模型的使用方法、装置、设备及存储介质
Liu et al. Construction of an IoT customer operation analysis system based on big data analysis and human-centered artificial intelligence for web 4.0

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant