CN109215795A

CN109215795A - 病例复杂度预测方法及系统

Info

Publication number: CN109215795A
Application number: CN201810909242.0A
Authority: CN
Inventors: 曹健; 朱能军; 沈坤炜; 陈小松; 朱思吉
Original assignee: Shanghai Jiaotong University; Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Current assignee: Shanghai Jiaotong University; Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Priority date: 2018-08-10
Filing date: 2018-08-10
Publication date: 2019-01-15
Anticipated expiration: 2038-08-10
Also published as: CN109215795B

Abstract

本发明提供了一种病例复杂度预测方法及系统，包括：计算每个历史病例的讨论分歧度；获取每个历史病例的特征数据；根据历史病例的特征数据和讨论分歧度建立回归模型；根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度；根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型；利用治疗方案推荐模型给出目标病例的推荐结果，计算推荐结果的不确定性；线性组合目标病例的讨论分歧度和推荐结果的不确定性，从而确定反应目标病例复杂度的综合指标。本发明能够充分利用多学科医疗决策团队的历史投票数据和历史病例数据，从多个维度，即讨论的分歧度和推荐结果的不确定性，定义病例的复杂度指标。

Description

病例复杂度预测方法及系统

技术领域

本发明涉及医疗决策和机器学习领域，具体地，涉及融合讨论分歧度和推荐不确定性的病例复杂度预测方法及系统。

背景技术

随着医疗学科越来越精细化，仅仅根据单个医生的经验制定的治疗方案会存在一定的风险，因此，建立多学科医疗决策团队在一定程度上保证了决策的合理性，但多学科讨论也影响了决策过程的效率，会造成了对医疗资源的浪费。为了提高多学科医疗决策的效率，大量研究工作集中在对治疗方案推荐系统的研究，同时也有一部分研究工作关注优化决策过程。但是，无论是从建立推荐系统的角度来看，还是从优化决策过程的角度来看，这些研究工作大都以同等的方式对待每一个病例。然而，现实中，各个病例的复杂度往往是不一样的，比如有些病例会比另外一些病例复杂很多。在这种情况下，如果能够准确地预测每个病例的复杂度，就能促进分类处理病例，从而更加合理的分配医疗资源。

最简单的考虑病例复杂度的方法是基于规则的，例如，根据患者年龄，病灶个数等，这种方法的缺陷在于不能充分利用历史数据信息。另外，根据多学科团队的历史行为数据和推荐模型的推荐结果定义病例的复杂度的研究也相对匮乏。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种病例复杂度预测方法及系统。

根据本发明提供的一种病例复杂度预测方法，包括：

讨论分歧度计算步骤：计算每个历史病例的讨论分歧度；

特征数据获取步骤：获取每个历史病例的特征数据；

回归模型建立步骤：根据历史病例的特征数据和讨论分歧度建立回归模型；

预测步骤：根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度；

推荐模型建立步骤：根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型；

不确定性计算步骤：利用治疗方案推荐模型给出目标病例的推荐结果，计算推荐结果的不确定性；

线性组合步骤：线性组合目标病例的讨论分歧度和推荐结果的不确定性，从而确定反应目标病例复杂度的综合指标。

较佳的，还包括：

分类步骤：根据得到的综合指标与预设阈值的比较，将目标病例划分到对应的分类。

较佳的，所述讨论分歧度计算步骤根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度；

计算讨论分歧度H(V_i)的公式包括：

其中C为该次投票中所有投票选项的集合，P_ic为选项c在这次投票结果V_i中的比例。

较佳的，所述回归模型包括：

其中，θ为模型参数，也即各个特征的权重，记录病例特数据值，λ_θ为正则项参数，T为矩阵的转置符号。

较佳的，所述不确定性计算步骤包括：

确定相似近邻的个数，利用相似近邻的治疗方案集合的信息熵计算出推荐结果的不确定性。

根据本发明提供的一种病例复杂度预测系统，包括：

讨论分歧度计算模块：计算每个历史病例的讨论分歧度；

特征数据获取模块：获取每个历史病例的特征数据；

回归模型建立模块：根据历史病例的特征数据和讨论分歧度建立回归模型；

预测模块：根据建立的回归模型和目标病例的特征数据预测目标病例的讨论分歧度；

推荐模型建立模块：根据历史病例的特征数据和对应的治疗方案建立治疗方案推荐模型；

不确定性计算模块：利用治疗方案推荐模型给出目标病例的推荐结果，计算推荐结果的不确定性；

线性组合模块：线性组合目标病例的讨论分歧度和推荐结果的不确定性，从而确定反应目标病例复杂度的综合指标。

较佳的，还包括：

分类模块：根据得到的综合指标与预设阈值的比较，将目标病例划分到对应的分类。

较佳的，所述讨论分歧度计算模块根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度；

计算讨论分歧度H(V_i)的公式包括：

较佳的，所述回归模型包括：

较佳的，所述不确定性计算模块包括：

与现有技术相比，本发明具有如下的有益效果：

本发明能够充分利用多学科医疗决策团队的历史投票数据和历史病例数据，从多个维度，即讨论的分歧度和推荐结果的不确定性，定义病例的复杂度指标，从而达到更科学、更准确的预测每一个目标病例的复杂度，为更合理的、个性化的处理每一个目标病例奠定了基础。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明的工作流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

如图1所示，本发明提供的一种病例复杂度预测方法，包括：

步骤1：根据每一个历史病例的投票结果的信息熵计算其讨论分歧度如下：

其中C为该次投票中所有投票选项的集合，P_ic为选项c在这次投票结果V_i中的比例。假设有3人参与了某个病例的投票，其中2人投了A选项，1人投了B选项，则该投票结果的分歧度为：H＝-(2/3*log(2/3)+1/3*log(1/3))。

步骤2：确定每一个病例的特征数据，如年龄，BMI，ER，病例类型等，这里不同的特征类型需要做一定的预处理，如分类变量特征需要做数值编码等。

步骤3：通过历史病例的特征数据以及对应的讨论分歧度建立线性回归模型如下：

其中，θ为模型参数，也即各个特征的权重，记录病例特数据值，λ_θ为正则项参数，T为矩阵的转置符号。通过梯度下降的方法确定θ的值。本步骤涉及的机器学习算法，并不局限于线性回归模型，也可以是其他回归模型，如，SVM回归等。

步骤4：利用步骤3中学出的线性回归模型和目标病例特征数据预测出目标病例的讨论分歧度，即

步骤5：根据历史病例特征数据集和对应的确定了的治疗方案，建立治疗方案推荐模型，如K-近邻(KNN)模型。这里也可以利用其他的机器学习模型建立推荐系统。KNN模型的核心是对每一维特征之间的距离加权求和，得到两个样本之间的距离，然后根据该距离确定一定数量的近邻病例，再在这些病例当中采样加权投票的方式确定最终推荐方案。

步骤6：利用治疗方案推荐模型给出目标病例的推荐结果，并确定推荐结果的不确定性。以KNN模型为例，其推荐结果的不确定性的计算过程如下：

步骤6.1：确定相似近邻的个数，如最相似的三个近邻设为Top-3。

步骤6.2：利用步骤1中所示的信息熵公式计算出这些近邻的治疗方案集合的不确定性如，Top-3近邻中存在两种推荐方案，其中2个近邻为a方案，1个近邻为b方案，则其推荐结果的不确定性I＝-(2/3*log(2/3)+1/3*log(1/3))。

步骤7：线性组合步骤4中得到的讨论分歧度和步骤6中得到的推荐结果的不确定性，从而得到可以反映病例复杂度的综合指标＝alpha*H+(1-alpha)*I，其中alpha为平衡参数，如取0.5表示讨论分歧度和推荐结果的不确定在预测病例复杂度的过程中同等重要。

步骤8：根据病例复杂度大小和确定的阈值，将病例划分到不同的分类，从而实现不同类的病例采用不同的处理方式。比如，为疑难病例分配更多的医疗资源，而对简单常规病例采样简易决策流程等。

在上述一种病例复杂度预测方法的基础上，本发明还提供一种病例复杂度预测系统，包括：

讨论分歧度计算模块：根据每一个历史病例的投票结果的信息熵计算其讨论分歧度如下：

特征数据获取模块：确定每一个病例的特征数据，如年龄，BMI，ER，病例类型等，这里不同的特征类型需要做一定的预处理，如分类变量特征需要做数值编码等。

回归模型建立模块：通过历史病例的特征数据以及对应的讨论分歧度建立线性回归模型如下：

预测模块：利用回归模型建立模块中学出的线性回归模型和目标病例特征数据预测出目标病例的讨论分歧度，即

推荐模型建立模块：根据历史病例特征数据集和对应的确定了的治疗方案，建立治疗方案推荐模型，如K-近邻(KNN)模型。这里也可以利用其他的机器学习模型建立推荐系统。KNN模型的核心是对每一维特征之间的距离加权求和，得到两个样本之间的距离，然后根据该距离确定一定数量的近邻病例，再在这些病例当中采样加权投票的方式确定最终推荐方案。

不确定性计算模块：利用治疗方案推荐模型给出目标病例的推荐结果，并确定推荐结果的不确定性。以KNN模型为例，其推荐结果的不确定性的计算过程如下：

不确定性计算模块.1：确定相似近邻的个数，如最相似的三个近邻设为Top-3。

不确定性计算模块.2：利用讨论分歧度计算模块中所示的信息熵公式计算出这些近邻的治疗方案集合的不确定性如，Top-3近邻中存在两种推荐方案，其中2个近邻为a方案，1个近邻为b方案，则其推荐结果的不确定性I＝-(2/3*log(2/3)+1/3*log(1/3))。

线性组合模块：线性组合预测模块中得到的讨论分歧度和不确定性计算模块中得到的推荐结果的不确定性，从而得到可以反映病例复杂度的综合指标＝alpha*H+(1-alpha)*I，其中alpha为平衡参数，如取0.5表示讨论分歧度和推荐结果的不确定在预测病例复杂度的过程中同等重要。

分类模块：根据病例复杂度大小和确定的阈值，将病例划分到不同的分类，从而实现不同类的病例采用不同的处理方式。比如，为疑难病例分配更多的医疗资源，而对简单常规病例采样简易决策流程等。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以，本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构；也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种病例复杂度预测方法，其特征在于，包括：

讨论分歧度计算步骤：计算每个历史病例的讨论分歧度；

特征数据获取步骤：获取每个历史病例的特征数据；

2.根据权利要求1所述的病例复杂度预测方法，其特征在于，还包括：

3.根据权利要求1所述的病例复杂度预测方法，其特征在于，所述讨论分歧度计算步骤根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度；

计算讨论分歧度H(V_i)的公式包括：

4.根据权利要求1所述的病例复杂度预测方法，其特征在于，所述回归模型包括：

5.根据权利要求1所述的病例复杂度预测方法，其特征在于，所述不确定性计算步骤包括：

6.一种病例复杂度预测系统，其特征在于，包括：

讨论分歧度计算模块：计算每个历史病例的讨论分歧度；

特征数据获取模块：获取每个历史病例的特征数据；

7.根据权利要求6所述的病例复杂度预测系统，其特征在于，还包括：

8.根据权利要求6所述的病例复杂度预测系统，其特征在于，所述讨论分歧度计算模块根据每个历史病例的投票结果的信息熵计算该历史病例的讨论分歧度；

计算讨论分歧度H(V_i)的公式包括：

9.根据权利要求6所述的病例复杂度预测系统，其特征在于，所述回归模型包括：

10.根据权利要求6所述的病例复杂度预测系统，其特征在于，所述不确定性计算模块包括：