CN110047584A

CN110047584A - 基于深度学习的医院分诊方法、系统、装置及介质

Info

Publication number: CN110047584A
Application number: CN201910329178.3A
Authority: CN
Inventors: 江瑞; 黄浩
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2019-07-23

Abstract

本发明提供一种基于深度学习的医院分诊方法、系统、装置及介质，包括：采集患者的主诉文本；从主诉文本中识别出症状实体类；构建症状库，所述症状库存储有患病的多个症状；根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量，症状库中的一个症状对应患者向量的一个维度，当症状实体类与症状对应时，所述维度为1，当症状实体类与症状不对应时，所述维度为0；将患者向量输入卷积神经网络模型进行分类，得到不同科室的分诊概率；对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。上述提高分诊效率和准确率，降低医院导诊的人工开销。

Description

基于深度学习的医院分诊方法、系统、装置及介质

技术领域

本发明涉及医疗技术领域，更具体地，涉及一种基于深度学习的医院分诊方法、系统、装置及介质。

背景技术

分诊是患者就医治疗的起始环节，选择恰当的科室，直接关系到治疗效果或能否得到有效治疗。然而随着医学研究的深入，医学分工也逐步细化，不同科室专精于某类疾病的诊治。而患者大都不具备深厚的医学知识，很难识别自己的病况并根据自己的状况选择最恰当的科室。医院导诊护士可能缺少全面的医学知识，比如，只掌握部分医院科室诊治疾病的典型症状，这就造成了人工导诊准确率不高。

在某些医学场景下，比如我国的大型医院，患者流量巨大。这里有巨大的导诊需求。然而，高水平的导诊护士相对缺乏，在实际诊疗过程中给医患双方造成巨大损失。

发明内容

鉴于上述问题，本发明提供一种提高分诊效率和准确率，降低医院导诊的人工开销的基于深度学习的医院分诊方法、系统、装置及介质。

根据本发明的一个方面，提供一种基于深度学习的医院分诊方法，包括：

采集患者的主诉文本；

从主诉文本中识别出症状实体类；

构建症状库，所述症状库存储有患病的多个症状；

根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量，症状库中的一个症状对应患者向量的一个维度，当症状实体类与症状对应时，所述维度为1，当症状实体类与症状不对应时，所述维度为0；

将患者向量输入卷积神经网络模型进行分类，得到不同科室的分诊概率；

对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。

优选地，所述卷积神经网络模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

进一步，优选地，所述卷积神经网络模型包括：三个卷积层、两个池化层、全连接层和Softmax层。

更进一步，优选地，所述卷积神经网络模型的构建步骤包括：

通过下式(1)构建第一卷积层

其中，ch表示第一卷积层的第ch通道，d₁为第一卷积层的卷积核的半径，表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b^1,ch表示第一卷积层的第ch通道的卷积核的偏置值，为第一卷积层的卷积核权重矩阵W^1,ch的第j个元素，x_t+j表示输入向量X的第t+j个元素，ReLu表示线性整流函数；

通过下式(2)构建第一池化层

其中，表示第一池化层在第ch个通道上的第t个位置上的输出值；

通过下式(3)构建第二卷积层

其中，表示第二卷积层的第ch通道上第t个位置上的神经元的输出值，dim₂表示第二卷积层的第ch通道的激活矩阵a^2,ch的维数，d₂为第二卷积层的卷积核的半径，b^2,ch则表示第二卷积层的第ch通道的卷积核的偏置值，为第二卷积层的卷积核权重矩阵W² ^,ch的在(i,j)位置上的元素，表示第一池化层输出矩阵z¹的(i,j)位置上的元素；

通过下式(4)构建第二池化层

其中，表示表示第二池化层在第ch个通道上的第t个位置上的输出值；

通过下式(5)构建第三卷积层

a³＝ReLu(b³+W³z²) (5)

其中，a³表示第三卷积层的输出，b³表示第三卷积层的卷积核的偏置，W³表示第三卷积层的卷积核的权重参数，z²表示第二池化层输出矩阵；

通过下式(6)构建全连接层和Softmax层，

P＝Softmax(b⁴+a³W⁴) (6)

其中，b⁴表示全连接层的偏置，W⁴表示全连接层的的权重参数，P表示各科室的分诊概率构成的分诊概率矩阵。

优选地，所述症状库包括120个不同症状；第一卷积层中，卷积核大小为k＝11，共产生ch＝60个通道，输入填充大小为5，输入的一维特征的长度为120，卷积步长为1；第一池化层和第二池化层采用max-pooling池化操作，步长为2；第二卷积层中，卷积核大小为5，共产生30个通道，输入填充大小为2,输入的一维特征的长度为60，卷积步长为1；第三卷积层中，卷积核大小为1，产生1个通道，输入填充大小为0,输入的一维特征的长度为30，卷积步长为1。

根据本发明的另一个方面，提供一种基于深度学习的医院分诊系统，包括：

采集模块，采集患者的主诉文本，将所述主诉文本发送给症状识别模块；

症状识别模块，接收采集模块发送的主诉文本，从主诉文本中识别出症状实体类，发送给患者向量生成模块；

症状库，存储有患病的多个症状，发送给患者向量生成模块；

患者向量生成模块，根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量，症状库中的一个症状对应患者向量的一个维度，当症状实体类与症状对应时，所述维度为1，当症状实体类与症状不对应时，所述维度为0，将患者向量发送给分类模块；

分类模块，将患者向量输入卷积神经网络模型进行分类，得到不同科室的分诊概率；

推荐模块，对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。

优选地，所述卷积神经网络模型包括：第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层和Softmax层，其中：

第一卷积层通过下式(1)构建

第一池化层通过下式(2)构建

第二卷积层通过下式(3)构建

第二池化层通过下式(4)构建

第三卷积层通过下式(5)构建

a³＝ReLu(b³+W³z²) (5)

通过下式(6)构建全连接层和Softmax层，

P＝Softmax(b⁴+a³W⁴) (6)

另外，本发明还提供一种电子装置，包括存储器和处理器，所述存储器中存储有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊被所述处理器执行时，实现上述基于深度学习的医院分诊方法的步骤。

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中包括有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊程序被处理器执行时，实现上述基于深度学习的医院分诊方法的步骤。

上述基于深度学习的医院分诊方法、系统、装置及介质通过构建患者向量输入卷积神经网络模型自动获得各科室的分诊概率，提高了分诊的准确率，削减了医院导诊的人工开销，提供自助式分诊服务。

附图说明

图1是本发明所述基于深度学习的医院分诊方法的流程图；

图2是本发明所述基于深度学习的医院分诊系统的构成框图；

图3是本发明所述从主诉文本提取症状实体类的示意图；

图4是本发明所述生成患者向量的示意图；

图5是本发明所述卷积神经网络模型的示意图；

图6是本发明所述根据分诊概率推荐分诊科室的示意图。

具体实施方式

在下面的描述中，出于说明的目的，为了提供对一个或多个实施例的全面理解，阐述了许多具体细节。然而，很明显，也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中，为了便于描述一个或多个实施例，公知的结构和设备以方框图的形式示出。

下面将参照附图来对根据本发明的各个实施例进行详细描述。

图1是本发明所述基于深度学习的医院分诊方法的流程图，如图1所示，所述医院分诊方法包括：

步骤S1，采集患者的主诉文本，所述主诉文本是对于患者身体状况的描述文本；

步骤S2，从主诉文本中识别出症状实体类，所述症状实体类是从主诉文本中识别出的描述症状的关键词，例如，使用已有的算法(如LSTM-CRF算法)从输入文本中识别出症状实体类；

步骤S3，构建症状库，所述症状库存储有患病的多个症状；

步骤S4，根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量，症状库中的一个症状对应患者向量的一个维度，当症状实体类与症状对应时，所述维度为1，当症状实体类与症状不对应时，所述维度为0；

步骤S5，将患者向量输入卷积神经网络(CNN)模型进行分类，得到不同科室的分诊概率；

步骤S6，对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。优选地，所述卷积神经网络模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

在本发明的一个可选实施例中，所述卷积神经网络模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

优选地，所述卷积神经网络模型包括：三个卷积层、两个池化层、全连接层和Softmax层。

上述卷积神经网络模型的构建步骤包括：

通过下式(1)构建第一卷积层

通过下式(2)构建第一池化层

其中，表示第一池化层在第ch个通道上的第t个位置上的输出值，t_表示在t＝t_时刻的数值，这里t_∈{2t-1,2t}表示对求最大值的索引范围；

通过下式(3)构建第二卷积层

通过下式(4)构建第二池化层

通过下式(5)构建第三卷积层

a³＝ReLu(b³+W³Z²) (5)

通过下式(6)构建全连接层和Softmax层，

P＝Softmax(b⁴+a³W⁴) (6)

图2是本发明所述基于深度学习的医院分诊系统的构成框图，如图2所示，所述医院分诊系统包括：

采集模块1，采集患者的主诉文本，将所述主诉文本发送给症状识别模块2；

症状识别模块2，接收采集模块发送的主诉文本，从主诉文本中识别出症状实体类，发送给患者向量生成模块4；

症状库3，存储有患病的多个症状，发送给患者向量生成模块4；

患者向量生成模块4，根据症状库3的症状和症状识别模块2识别的症状实体类将患者的主诉文本编码为患者向量，症状库3中的一个症状对应患者向量的一个维度，当症状实体类与症状对应时，所述维度为1，当症状实体类与症状不对应时，所述维度为0，将患者向量发送给分类模块5；

分类模块5，将患者向量输入卷积神经网络模型50进行分类，得到不同科室的分诊概率；

推荐模块6，对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。

在上述医院分诊系统中，所述卷积神经网络模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

在一个可选实施例中，第一卷积层通过公式(1)构建，第一池化层通过公式(2)构建，第二卷积层通过公式(3)构建，第二池化层通过公式(4)构建，第三卷积层通过公式(5)构建，全连接层和Softmax层通过公式(6)构建。

上述各实施例中的卷积神经网络模型的训练方法包括：

构建训练集和验证集，所述症状库按照顺序存储多个症状，构成症状序列，将各种疾病包含的症状与所述症状序列进行比对，获得各种疾病的疾病向量，将疾病向量与科室标识符向对应，进一步地，还可以与医院标识符相对应，也就是说，所述训练集包括疾病向量，所述验证集包括各疾病向量对应的科室标识符，还可以包括科室标识符对应的医院标识符，一个科室标识符可以对应一个医院标识符，也可以对应多个医院标识符，一个疾病向量可以对应一个科室标识符，也可以对应多个科室标识符，因为不同的医院可能将某些疾病划分的科室不同；

将训练集代入卷积神经网络模型，通过验证集根据损失函数(交叉熵)使用反向传播算法对卷积神经网络模型进行参数调整。

在本申请的一个具体实施例中，在步骤S2中，使用自然语言处理领域已有的命名实体识别算法，提取主诉文本中的症状实体类，如图3所示，主诉文本为“从昨天开始腹泻，有些头痛、腰酸”，从主诉文本中识别出症状实体类-“腹泻”，“头痛”和“腹痛”。

在步骤S3，症状库依次存储有120个症状，例如通过《疾病大全》中收集的120个症状构建症状库使用，这120个症状覆盖面广，用词准确，基本满足分诊需要。

在步骤S4中，上述120个症状作为每个患者向量的表示基准，具体地，如图4所示，每个患者由一个120维度的向量表示，向量的每个维度表示一个症状。若某个患者有某个症状，则这个维度为1，否则为0，例如，如图4所示，一个患者有三个症状实体类“腹泻”，“头痛”和“腹痛”，则这个患者的向量表示这三个症状实体类的维度分别是1，其他症状的维度为0。

在步骤S5中，如图5所示，包括：

构建卷积神经网络模型50，所述卷积神经网络结构包括第一卷积层51、第一池化层52、第二卷积层53、第二池化层54、第三卷积层55及全连接层56和Softmax层57，具体地：

第一卷积层51中，卷积核大小为k＝11，共产生c＝60个通道，输入填充大小为p＝5,输入的一维特征的长度为i＝120，d₁＝5，卷积步长s＝1。

设模型的输入为：X＝{x_t}

则

其中，Cat表示将向量或标量进行连接，其结果在原来基础上提升一个维度，a^1,ch表示第一卷积层的第ch通道的输出向量，为一个120维的向量；a¹＝Cat[a^1,1，a^1,2,…,a^1,60]^T，a¹为第一卷积层的输出矩阵，维度为120×60，

第一池化层52采用max-pooling(最大池化)，其步长s＝2， z^1,ch表示第一池化层的第ch通道的输出向量，为一个60维的向量；z¹＝Cat[z^1,1,z^1,2,…,z^1,60]^T，z¹为第一池化层的输出矩阵，维度为60×60。

第二卷积层53中，卷积核大小为k＝5，共产生c＝30个通道，输入填充大小为p＝2,d₂＝2，输入的一维特征的长度为i＝60，卷积步长s＝1。

表示第二卷积层的第ch通道上第t个位置上的神经元的输出值，a^2,ch表示第二卷积层的第ch通道的输出向量，维数是60维，第二卷积层的卷积核权重矩阵W^2,ch,维数5×60，即W^2,ch∈R^5×60。

a²＝Cat[a^2,1,a^2,2,…,a^2,30]^T，a²为第二卷积层的输出矩阵，维数是60×30。

第二池化层54采用max-pooling(最大池化)，其步长s＝2

z^2,ch表示第二池化层的第ch通道的输出向量，为一个30维的向量；

z²＝Cat[z^2,1,z^2,2,…,z^2,30]^T，z²为第二池化层的输出矩阵，维数是30×30，表示第二池化层每个通道输出值连接成的二维矩阵。

第三卷积层55中，卷积核大小为k＝1，共产生c＝1个通道，输入填充大小为p＝0,输入的一维特征的长度为i＝30，卷积步长s＝1，在公式(5)中，a³∈R^1×30，b³∈R^1×30，W³∈R¹ ^×30。

全连接层56和Softmax层57中，b⁴∈R^1×30，W⁴∈R^30×30，P∈R^1×30。

卷积神经网络模型构建完成后，对构建的卷积神经网络模型进行训练，例如，使用《疾病大全》2535个病例对模型进行训练，保存卷积神经网络模型的参数；

神经网络模型训练完成后，将新的患者向量输入训练后的卷积神经网络模型，得到所述患者向量的分诊结果，如图6所示，将P∈R^1×30分的各个元素按照概率大小排序，提取概率最大的前3个概率所代表的门诊。

上述各实施例中的基于深度学习的医院分诊方法应用于电子装置本发明还提供一种电子装置，包括存储器和处理器，所述存储器中存储有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊被所述处理器执行时，实现上述基于深度学习的医院分诊方法的步骤。

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中包括有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊程序被处理器执行时，实现上述各实施例中的基于深度学习的医院分诊方法的步骤。

存储器用于存储安装于所述电子装置的基于深度学习的医院分诊程序等，还可以用于暂时地存储已经输出或者将要输出的数据，所述存储器包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中，所述可读存储介质可以是所述电子装置1的内部存储单元，例如该电子装置的硬盘。在另一些实施例中，所述可读存储介质也可以是所述电子装置1的外部存储器，例如所述电子装置上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

处理器在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)，微处理器或其他数据处理芯片，用于运行存储器中存储的程序代码或处理数据，例如执行基于深度学习的医院分诊程序等。

上述电子装置还可以包括网络接口，通信总线、输入模块(键盘、鼠标、触摸屏、摄像头类的语音输入设备等)等。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质中包括有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊程序被处理器执行时，实现上述各实施例中的基于深度学习的医院分诊方法的步骤

尽管前面公开的内容示出了本发明的示例性实施例，但是应当注意，在不背离权利要求限定的范围的前提下，可以进行多种改变和修改。根据这里描述的发明实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外，尽管本发明的元素可以以个体形式描述或要求，但是也可以设想具有多个元素，除非明确限制为单个元素。

Claims

1.一种基于深度学习的医院分诊方法，其特征在于，包括：

采集患者的主诉文本；

从主诉文本中识别出症状实体类；

构建症状库，所述症状库存储有患病的多个症状；

2.根据权利要求1所述的基于深度学习的医院分诊方法，其特征在于，所述卷积神经网络模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

3.根据权利要求2所述的基于深度学习的医院分诊方法，其特征在于，所述卷积神经网络模型包括：三个卷积层、两个池化层、全连接层和Softmax层。

4.根据权利要求3所述的基于深度学习的医院分诊方法，其特征在于，所述卷积神经网络模型的构建步骤包括：

通过下式(1)构建第一卷积层

其中，ch表示第一卷积层的第ch通道，d₁为第一卷积层的卷积核的半径，表示第一卷积层的第ch通道在第t个位置的神经元的激活值，b^1，ch表示第一卷积层的第ch通道的卷积核的偏置值，为第一卷积层的卷积核权重矩阵W^1，ch的第j个元素，x_t+j表示输入向量X的第t+j个元素，ReLu表示线性整流函数；

通过下式(2)构建第一池化层

通过下式(3)构建第二卷积层

其中，表示第二卷积层的第ch通道上第t个位置上的神经元的输出值，dim₂表示第二卷积层的第ch通道的激活矩阵a^2，ch的维数，d₂为第二卷积层的卷积核的半径，b^2，ch则表示第二卷积层的第ch通道的卷积核的偏置值，为第二卷积层的卷积核权重矩阵W^2，ch的在(i，j)位置上的元素，表示第一池化层输出矩阵z¹的(i，j)位置上的元素；

通过下式(4)构建第二池化层

通过下式(5)构建第三卷积层

a³＝ReLu(b³+W³z²) (5)

通过下式(6)构建全连接层和Softmax层，

P＝Soffmax(b⁴+a³W⁴) (6)

5.根据权利要求4所述的基于深度学习的医院分诊方法，其特征在于，所述症状库包括120个不同症状；第一卷积层中，卷积核大小为k＝11，共产生ch＝60个通道，输入填充大小为5，输入的一维特征的长度为120，卷积步长为1；第一池化层和第二池化层采用max-pooling池化操作，步长为2；第二卷积层中，卷积核大小为5，共产生30个通道，输入填充大小为2，输入的一维特征的长度为60，卷积步长为1；第三卷积层中，卷积核大小为1，产生1个通道，输入填充大小为0，输入的一维特征的长度为30，卷积步长为1。

6.一种基于深度学习的医院分诊系统，其特征在于，包括：

7.根据权利要求6所述的基于深度学习的医院分诊系统，其特征在于，所述卷积神经网络模型包括：第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层和Softmax层，其中：

第一卷积层通过下式(1)构建

第一池化层通过下式(2)构建

第二卷积层通过下式(3)构建

第二池化层通过下式(4)构建

第三卷积层通过下式(5)构建

a³＝ReLu(b³+W³2²) (5)

通过下式(6)构建全连接层和Softmax层，

P＝Softmax(b⁴+a³W⁴) (6)

8.一种电子装置，其特征在于，包括存储器和处理器，所述存储器中存储有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊程序被所述处理器执行时，实现如权利要求1至5中任一项权利要求所述基于深度学习的医院分诊方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括有基于深度学习的医院分诊程序，所述基于深度学习的医院分诊程序被处理器执行时，实现如权利要求1至5中任一项权利要求所述基于深度学习的医院分诊方法的步骤。