CN113555110A

CN113555110A - 一种训练多疾病转诊模型的方法及设备

Info

Publication number: CN113555110A
Application number: CN202110800315.4A
Authority: CN
Inventors: 何兰青; 熊健皓; 赵昕; 和超; 张大磊
Original assignee: Shanghai Eaglevision Medical Technology Co Ltd; Beijing Airdoc Technology Co Ltd
Current assignee: Shanghai Eaglevision Medical Technology Co Ltd; Beijing Airdoc Technology Co Ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-10-26
Anticipated expiration: 2041-07-15
Also published as: WO2023284192A1; CN113555110B

Abstract

本发明实施例提供了一种训练多疾病转诊模型的方法及设备，该方法包括：获取训练集，其包括多个样本中每个样本的决策轮廓和转诊标签，以及多种转诊分类中每种转诊分类的决策模板；获取机器学习模型，其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果，其中，根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离，根据决策距离输出相应样本的转诊结果；利用训练集对机器学习模型进行训练，基于转诊结果和转诊标签对多个决策权重进行调整，得到多疾病转诊模型。本发明可以根据决策轮廓中不同元素对转诊结果的贡献差异，提升模型的转诊分类性能。

Description

一种训练多疾病转诊模型的方法及设备

技术领域

本发明涉及疾病转诊技术领域，具体来说涉及基于决策模板法的疾病转诊技术领域，更具体地说，涉及一种训练多疾病转诊模型的方法及设备。

背景技术

随着计算机技术的进步和医疗数据的累积，通过各种机器学习方法已经可以实现对多种疾病高效的辅助诊断和预测。分类模型是一种最典型的机器学习模型，可以对数据样本进行分类，例如逻辑回归模型，会输出输入的样本属于某个类别的概率，再通过比较概率与阈值的大小确定样本是否属于某个类别；Softmax回归是将逻辑回归扩展到多个类别的分类模型，输出属于各个类别的概率，一般以概率最大的类别作为样本的分类结果。在医疗应用的场景中，会以某种疾病阳性作为一个类别。基于分类模型，可以实现一套多病种转诊系统，即将样本输入分类器模型进行多种疾病的判断，当分类器将样本分类为某个疾病阳性时，则进行转诊作进一步诊断；若分类器将样本分类为无疾病，则不进行转诊。

多病种转诊系统需要融合多个分类器模型，即使限定系统的输入为单模态，例如图像，对不同的病种，可以有不同的分类器进行判断，即便对某一种疾病，也可以有不同版本的分类器。如果输入为多模态，那么在不同模态下也会有不同的分类器。系统中包含的每个分类器，都会对某种或某几种疾病给出分类的输出，需要收集这些输出，并给出最终结果，即是否转诊和转诊的原因。

利用现有的决策模板法计算转诊结果时，决策轮廓中所有元素对转诊结果的影响是相同的，导致转诊结果不够准确。

发明内容

因此，本发明的目的在于克服上述现有技术的缺陷，提供一种训练多疾病转诊模型的方法及设备。

本发明的目的是通过以下技术方案实现的：

根据本发明的第一方面，提供一种训练多疾病转诊模型的方法，包括：获取训练集，其包括多个样本中每个样本的决策轮廓和转诊标签，以及多种转诊分类中每种转诊分类的决策模板；获取机器学习模型，其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果，其中，根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离，根据决策距离输出相应样本的转诊结果；利用训练集对机器学习模型进行训练，基于转诊结果和转诊标签对多个决策权重进行调整，得到多疾病转诊模型。本发明对现有技术进行改进，构建相应的机器学习模型，利用样本训练机器学习模型对多个决策权重的值进行调整，利用调整后的多个决策权重，可以实现对相应的距离分量采用相应的决策权重进行加权求和，从而根据决策轮廓中不同元素对转诊结果的贡献差异，提升模型的转诊分类性能。

在本发明的一些实施例中，基于转诊结果和转诊标签计算损失值并根据所述损失值对所述可学习的决策权重进行调整。

在本发明的一些实施例中，所述多种转诊分类包括单一类，其中，所述单一类为一种疾病对应的转诊分类。

在本发明的一些实施例中，单一类对应的决策模块是按照以下方式获得的：将具有该单一类对应的转诊标签的所有样本的决策轮廓求平均，得到该单一类的决策模板。

在本发明的一些实施例中，所述多种转诊分类包括复合类，其中，所述复合类为至少两种疾病的复合转诊分类。由于一些疾病本身存在共性，疾病分类器在分类时可能存在错分的情况，因此，可以将多种疾病复合在一起，形成复合类。增加复合类后，可以同时判断是否可能存在多种潜在疾病的可能。

在本发明的一些实施例中，所述多种转诊分类包括复合类，其中，所述复合类为错分比例达到预设阈值的至少两种疾病的复合转诊分类。

在本发明的一些实施例中，复合类对应的决策模板是按照以下方式获得的：将该复合类所包含的疾病下彼此被错分的所有样本的决策轮廓求平均，得到该复合类的决策模板。若对疾病被错分的程度不加甄别组成复合类，会增加计算量，导致输出结果的时延增加，而且，一些疾病被错分的程度可能较小，复合类的出现反而可能导致对这些疾病分类的准确率的下降。因此，在一些潜在疾病难于被区分时，才将其复合形成复合类，同时输出样本可能患有的多种疾病对应的转诊结果，便于更准确地将患者转诊至进一步对疾病进行确诊或者诊断的医疗部门或者医疗机构

在本发明的一些实施例中，所述机器学习模型为预定义的数学函数模型或者分类神经网络模型。

在本发明的一些实施例中，在计算损失值时，根据相应类别的样本被错分的程度为每种类别的样本设置相应的惩罚调节参数。由此，以降低相应类别的样本被错分的概率。本发明可以根据被错分的情况，针对不同的疾病设置不同的惩罚调节参数，从而针对性地训练模型减少对某些疾病错分的概率，从而更精准地提供转诊建议。

在本发明的一些实施例中，所述损失值可以按照以下公式计算：

其中，i表示样本x_i的序号i，ln表示自然对数，e表示常数e，

表示第一惩罚调整参数，n_c表示第二惩罚调节参数，

表示样本x_i的决策轮廓DP(x_i)与其转诊标签y_i对应的转诊分类的决策模板

之间的决策距离，

或者

DP(x)表示样本x的决策轮廓，DT_c表示第c类的决策模板，a_i,j表示决策轮廓与决策模板中第i行第j列的元素间的距离分量对应的决策权重，y_k＝c表示第k个样本属于第c类，d_i,j(x_k)表示第i个分类器预测第k个样本属于第j类的概率，N_c表示训练集中属于第c类的样本数。

根据本发明的第二方面，提供一种用于训练多疾病转诊模型的设备，包括：数据获取模块，用于获取训练集，其包括多个样本中每个样本的决策轮廓和转诊标签，以及多种转诊分类中每种转诊分类的决策模板；模型获取模块，用于获取机器学习模型，该机器学习模型被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果，其中，根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离，根据决策距离输出相应样本的转诊结果；模型训练模块，用于利用训练集对机器学习模型进行训练，训练时基于转诊结果和转诊标签对多个决策权重进行调整，得到多疾病转诊模型。

根据本发明的第三方面，提供一种用于多疾病转诊的系统，包括：数据获取模块，用于获取用户的决策轮廓和多种转诊分类中每种转诊分类的决策模板；多疾病转诊模型，用于根据决策轮廓、决策模板和多个决策权重确定转诊结果，输出该用户的转诊结果，其中所述多疾病转诊模型是根据第一方面所述的方法或者第二方面所述的设备训练得到的。

根据本发明的第四方面，提供一种电子设备，包括：一个或多个处理器；以及存储器，其中存储器用于存储一个或多个可执行指令；所述一个或多个处理器被配置为经由执行所述一个或多个可执行指令以实现第一方面所述方法的步骤。

附图说明

以下参照附图对本发明实施例作进一步说明，其中：

图1为决策轮廓的示意图；

图2为根据本发明实施例的训练多疾病转诊模型的方法的流程示意图。

具体实施方式

为了使本发明的目的，技术方案及优点更加清楚明白，以下结合附图通过具体实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如在背景技术部分提到的，利用现有的决策模板法计算转诊结果时，决策轮廓中所有元素对结果的影响是相同的，导致转诊结果不够准确。因此，本发明对现有技术进行改进，构建相应的机器学习模型，利用样本训练机器学习模型对多个决策权重的值进行调整，利用调整后的多个决策权重，可以实现对相应的距离分量采用相应的决策权重进行加权求和，从而根据决策轮廓中不同元素对转诊结果的贡献差异，提升模型的转诊分类性能。

为了说明本发明的技术方案，此处先对一些现有的术语概念进行说明。

1)决策轮廓(也可称决策轮廓矩阵)：假定系统包括对c-1种疾病进行转诊的功能，加上健康无疾病的情况，共c个类别，同时有L个分类器，对样本x可以得到L个分类输出。这些分类输出整合为一个Lxc矩阵，即样本x的决策轮廓：

其中，d_i,j(x)表示第i个分类器预测样本属于第j类的概率。决策轮廓的一行对应一个分类器的输出，如图1所示的横框标识出的数据即为分类器D_i(x)的输出。决策轮廓的一列对应所有分类器对某一类的输出，如图1所示的竖框标识出的数据即为分类器D₁…D_L对第j类的输出。

若某个分类器i不输出类别j的概率，则在DP(x)中对应元素d_i,j(x)始终为0。举例而言，如果系统只由若干个二分类器组成，则DP(x)是一个稀疏矩阵。

这是一个可以对三种疾病进行转诊，包含针对每种疾病的二分类器的系统。如果系统中还包含独立判断是否为正常无疾病类别的二分类器，则样本的决策轮廓形如：

2)决策模板(也可称决策模板矩阵)：即将训练集中标签为某一类别的所有样本的决策轮廓取平均：

其中，N_i表示训练集中属于第i类的样本数，y_j＝i表示第j个样本属于第i类，

即表示对属于第i类的所有样本求和，DP(x_j)表示第j个样本的决策轮廓。

由此可以得到某个样本的决策轮廓与各个类别决策模板间的距离：

其中，Distance(A,B)表示A、B两个矩阵间的距离，较常用的有欧式距离、马氏距离等。D(x)每一项的大小，可以作为样本属于每一类别的可能性度量，从而得到样本x最终的分类结果，即决策模板法。

例如，系统中有四个二分类器，1号分类器给出样本是否为无疾病正常样本的概率，2、3、4号分类器分别给出样本有三种疾病的概率。对某个样本，四个分类器给出的分数分别为0.6、0.1、0.2、0.3，则这个样本的决策轮廓为：

训练集中所有同标签样本的决策轮廓的均值即为该类别的决策模板。假设无疾病正常类别的决策模板为：

那么上述样本与正常类别的距离即为：

以此类推求得Distance(DP(x),DT_i)，得到D(x)。

用上述方法，可以得到样本的决策轮廓和相应转诊类别的决策模板。但从以上计算方式可看出，现有技术中决策轮廓中相应的元素对诊断结果的贡献是相同的，没有考虑不同位置元素贡献度的差异。因为不同分类器、不同类别敏感程度的差异，矩阵中某个位置的元素对距离的贡献不应该是相同的，所以并不合适使用欧氏距离。马氏距离虽然考虑了不同位置元素贡献度的差异，但只使用了整体样本的分布特性，并没有纳入类别的信息。因此，计算二者的距离时，本发明提出可学习权重的方法，对此设置了可学习的决策权重。本发明在纳入样本类别信息后，将距离计算转变为一个机器学习问题。

根据本发明的一个实施例，参见图2，提供一种训练多疾病转诊模型的方法，包括：步骤S1、S2、S3。为了更好地理解本发明，下面结合具体的实施例针对每一个步骤分别进行详细说明。

步骤S1：获取训练集，其包括多个样本中每个样本的决策轮廓和转诊标签，以及多种转诊分类中每种转诊分类的决策模板。

根据本发明的一个实施例，在构建训练集时，选择多个正常人和多个患者作为样本的数据来源。将正常人的特征数据输入到多个训练好的疾病分类器中，得到多个输出结果，将多个输出结果按照预定顺序组织为该正常人对应的样本的决策轮廓。为正常人添加表示无疾病的转诊标签。将患者的特征数据输入到多个训练好的疾病分类器中，得到多个输出结果，将多个输出结果按照预定顺序组织为该患者对应的样本的决策轮廓。根据该患者所患的疾病为患者添加相应疾病对应的转诊标签。某一转诊分类的决策模板为训练集中转诊标签为该转诊类别的所有样本的决策轮廓取平均。

步骤S2：获取机器学习模型，其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果，其中，根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离，根据决策距离输出相应样本的转诊结果。

根据本发明的一个可选实施例，所述机器学习模型为预定义的数学函数模型。在该数学函数模型中，距离可以采用不同的距离定义。

例如，基于L2距离来改进时，该预定义的数学函数模型被配置为按照以下公式计算决策距离：

其中，DP(x)表示样本x的决策轮廓，DT_c表示第c类的决策模板，a_i,j表示决策轮廓与决策模板中第i行第j列的元素间的距离分量对应的决策权重，y_k＝c表示第k个样本属于第c类，d_i,j(x_k)表示第i个分类器预测第k个样本属于第j类的概率，N_c表示训练集中属于第c类的样本数。其中，

即为决策轮廓与决策模板中第i行第j列的元素间的距离分量。假设所有的a_i,j＝1，该式即为L2范数下的矩阵距离(L2距离)，但矩阵不同位置的元素对分类的贡献大小不是相同的，具体每个元素有多大贡献需要从数据中学习，因此设置决策权重a_i,j为可学习参数。

又例如，基于L1距离来改进时，该预定义的数学函数模型被配置为按照以下公式计算决策距离：

其中，

即为决策轮廓与决策模板中第i行第j列的元素间的距离分量。

根据本发明的一个可选实施例，所述机器学习模型为分类神经网络模型。例如，先把决策轮廓与决策模板中第i行第j列的元素间的距离分量计算出来，作为分类神经网络模型的输入，模型的权重参数即为可学习的决策权重，训练分类神经网络模型学习不同距离分量的贡献，最终得到的分类神经网络模型中的权重参数即为多个决策权重。

步骤S3：利用训练集对机器学习模型进行训练，基于转诊结果和转诊标签对多个决策权重进行调整，得到多疾病转诊模型。

根据本发明的一个实施例，基于转诊结果和转诊标签计算损失值并根据所述损失值对所述可学习的决策权重进行调整。训练的目的是基于转诊结果和转诊标签对多个决策权重进行调整以最小化分类损失。分类损失可以采用Softmax损失(Softmax Loss)。将Distance(DP(x),DT_c)作为输入，以样本的真实标签作为监督信息，可以进行Softmax回归，根据本发明的一个实施例，损失值可以按照以下方式计算：

其中，Distance(DP(x),DT_y)表示样本x与其转诊标签y的决策距离，Distance(DP(x),DT_c)表示样本x与所有类别的决策距离。训练的目的，即是求得使Softmax Loss最小的参数a_i,j。

根据本发明的一个实施例，可以根据错分的严重程度，对SoftmaxLoss中的项进行加权。某种疾病特别严重，则该疾病样本和被错分为该疾病的样本产生的Loss会被放大，若某些疾病彼此容易错分，且分错的后果较轻，可以适当减小这些错分样本的Loss。损失值还可以按照以下公式计算：

其中，i表示样本x_i的序号i，ln表示自然对数，e表示常数e，

表示第一惩罚调整参数，n_c表示第二惩罚调节参数，

之间的决策距离。

越大，y_i类样本被错分为其他类别时惩罚越大，n_c越小，其他样本被错分为c类时惩罚越大。如果y_i类样本被错分较多，例如，达到30％(被错分的程度严重)，希望减少这种错分的情况，则可以将

设置为2，n_c设置为0.5，更能确保该类不容易被错分；此处仅为示意，用户在训练模型时可以根据错分的程度视情况自定义配置。应当理解的是，若

n_c都等于1，则相当于此公式计算的损失值等于前一实施例计算的Softmax Loss。该实施例的技术方案至少能够实现以下有益技术效果：本发明可以针对不同的疾病设置不同的惩罚调节参数，从而针对性地训练模型减少对某些疾病错分的概率，从而更精准地提供转诊建议。

根据本发明的一个实施例，在训练时，可将所有的样本分批次用于对机器学习模型的训练，或者将所有的样本作为整体用于对机器学习模型的训练。

常规地，将每种疾病作为一个转诊分类。根据本发明的一个实施例，所述多种转诊分类包括单一类，其中，所述单一类为一种疾病对应的转诊分类。单一类对应的决策模块是按照以下方式获得的：将具有该单一类对应的转诊标签的所有样本的决策轮廓求平均，得到该单一类的决策模板。

由于一些疾病本身存在共性，疾病分类器在分类时可能存在错分的情况，因此，可以将多种疾病复合在一起，形成复合类。根据本发明的一个实施例，所述多种转诊分类包括复合类，其中，所述复合类为至少两种疾病的复合转诊分类。假设系统支持保留复数的转诊原因，以增加两种疾病的复合类为例，可以对决策模板进行以下改进：使用距离可学习的决策模板法，对全体训练集进行重新分类。收集训练集中错分的样本和本身有并发标注(即有多个疾病标签)的样本，标注为特殊的复合类。例如训练集中标注为疾病1，但被错分为疾病2的样本，会和标注为疾病2，被错分为疾病1的，以及本身有疾病1、2两种标注的样本合到一起，组成1、2的复合类别。这是因为疾病1、2之间混淆样本的决策轮廓分布与本身有疾病1、2两种标注的样本应该具有共性，无法通过类别1、2的决策模板得到准确的分类，同时系统给这二者1、2的复合结果都是可接受的，因此将二者复合。类别的复合操作不包括无疾病的正常类别，只对有疾病的情况进行复合。于是训练集的类别数从c类变为

转化为新的训练集。对新的训练集再进行决策模板的建模和决策距离对应的决策权重的学习，得到支持复合类别的决策模板法。最终的系统包括若干个分类器，

个类别的决策模板，和一组决策距离参数，样本输入系统后，系统会给出

种结果，无疾病不转诊，或转诊，转诊原因包括c-1类单疾病和

类两种疾病组合。该实施例的技术方案至少能够实现以下有益技术效果：增加复合类后，可以同时判断是否可能存在多种潜在疾病的可能。

若对疾病被错分的程度不加甄别组成复合类，会增加计算量，导致输出结果的时延增加，而且，一些疾病被错分的程度可能较小，复合类的出现反而可能导致对这些疾病分类的准确率的下降。因此，可以进一步改进，根据本发明的一个实施例，所述复合类为错分比例达到预设阈值的至少两种疾病的复合转诊分类。错分比例的定义可以根据实际需要自定义设置。例如，错分比例可以定义为复合类对应的多种转诊类别下彼此错分的样本数量除以训练集中所有被错分的样本数量。或者，错分比例可以定义为复合类对应的多种疾病下彼此错分的样本数量除以复合类对应的多种转诊类别下的所有样本的数量。根据本发明的一个实施例，复合类对应的决策模板是按照以下方式获得的：将该复合类所包含的转诊类别下彼此被错分的所有样本的决策轮廓求平均，得到该复合类的决策模板。该实施例的技术方案至少能够实现以下有益技术效果：该实施例在一些潜在疾病难于被区分时，才将其复合形成复合类，同时输出样本可能患有的多种疾病对应的转诊结果，便于更准确地将患者转诊至进一步对疾病进行确诊或者诊断的医疗部门或者医疗机构。

本发明可以应用于二分类器和/或多分类器的场景，下面简单举例说明。

根据本发明的一个实施例，假设有两个用于疾病分类的二分类器(疾病分类模型)，分别给出病例样本有糖尿病的概率和有高血压的概率。如果全是单一类，这时整个数据可以划分为三个转诊类别：无疾病、糖尿病、高血压。如果需要形成复合类，这时整个数据可以划分为四个转诊类别：无疾病、糖尿病、高血压、糖尿病和高血压。某个样本经过这两个分类器，得到患糖尿病概率d1，高血压概率d2。则该样本决策轮廓为

上述四个类别样本的决策轮廓均值即为该类别决策模板，按前文方法得到样本与四个类别决策模板的距离D(x)，带入Softmax Loss中。调节可优化参数a_i,j，优化训练集的Softmax Loss到最小。

根据本发明的一个实施例，本发明可以组合二分类器和多分类器的数据形成决策模板。例如，一个分类器给出是样本属于正常、糖尿病前、中、后期的概率分别为d0、d1、d2、d3，另一个分类器给出样本属于高血压的概率为d4，则样本决策轮廓为：

优化的过程类似前一个实施例，此处不再赘述。

根据本发明的一个实施例，提供一种用于训练多疾病转诊模型的设备，包括：数据获取模块，用于获取训练集，其包括多个样本中每个样本的决策轮廓和转诊标签，以及多种转诊分类中每种转诊分类的决策模板；模型获取模块，用于获取机器学习模型，该机器学习模型被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果，其中，根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离，根据决策距离输出相应样本的转诊结果；模型训练模块，用于利用训练集对机器学习模型进行训练，训练时基于转诊结果和转诊标签对多个决策权重进行调整，得到多疾病转诊模型。

根据本发明的一个实施例，提供一种用于多疾病转诊的系统，包括：数据获取模块，用于获取用户的决策轮廓和多种转诊分类中每种转诊分类的决策模板；多疾病转诊模型，用于根据决策轮廓、决策模板和多个决策权重确定转诊结果，输出该用户的转诊结果，其中所述多疾病转诊模型是根据训练多疾病转诊模型的方法或者用于训练多疾病转诊模型的设备训练得到的。可选的，该多疾病转诊模型可以被配置为：计算决策轮廓和每个转诊分类对应的决策模板的决策距离，得到多个决策距离，取最小决策距离对应的转诊分类作为转诊结果。或者，可选的，该多疾病转诊模型可以被配置为：计算决策轮廓和每个转诊分类对应的决策模板的决策距离，得到多个决策距离；根据多个决策距离进行Softmax分类计算，取计算得到的最大概率值对应的转诊分类作为转诊结果。

需要说明的是，虽然上文按照特定顺序描述了各个步骤，但是并不意味着必须按照上述特定顺序来执行各个步骤，实际上，这些步骤中的一些可以并发执行，甚至改变顺序，只要能够实现所需要的功能即可。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。