CN110047584A - 基于深度学习的医院分诊方法、系统、装置及介质 - Google Patents

基于深度学习的医院分诊方法、系统、装置及介质 Download PDF

Info

Publication number
CN110047584A
CN110047584A CN201910329178.3A CN201910329178A CN110047584A CN 110047584 A CN110047584 A CN 110047584A CN 201910329178 A CN201910329178 A CN 201910329178A CN 110047584 A CN110047584 A CN 110047584A
Authority
CN
China
Prior art keywords
symptom
indicate
convolutional layer
patient
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910329178.3A
Other languages
English (en)
Inventor
江瑞
黄浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910329178.3A priority Critical patent/CN110047584A/zh
Publication of CN110047584A publication Critical patent/CN110047584A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种基于深度学习的医院分诊方法、系统、装置及介质,包括:采集患者的主诉文本;从主诉文本中识别出症状实体类;构建症状库,所述症状库存储有患病的多个症状;根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0;将患者向量输入卷积神经网络模型进行分类,得到不同科室的分诊概率;对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。上述提高分诊效率和准确率,降低医院导诊的人工开销。

Description

基于深度学习的医院分诊方法、系统、装置及介质
技术领域
本发明涉及医疗技术领域,更具体地,涉及一种基于深度学习的医院分诊方法、系统、装置及介质。
背景技术
分诊是患者就医治疗的起始环节,选择恰当的科室,直接关系到治疗效果或能否得到有效治疗。然而随着医学研究的深入,医学分工也逐步细化,不同科室专精于某类疾病的诊治。而患者大都不具备深厚的医学知识,很难识别自己的病况并根据自己的状况选择最恰当的科室。医院导诊护士可能缺少全面的医学知识,比如,只掌握部分医院科室诊治疾病的典型症状,这就造成了人工导诊准确率不高。
在某些医学场景下,比如我国的大型医院,患者流量巨大。这里有巨大的导诊需求。然而,高水平的导诊护士相对缺乏,在实际诊疗过程中给医患双方造成巨大损失。
发明内容
鉴于上述问题,本发明提供一种提高分诊效率和准确率,降低医院导诊的人工开销的基于深度学习的医院分诊方法、系统、装置及介质。
根据本发明的一个方面,提供一种基于深度学习的医院分诊方法,包括:
采集患者的主诉文本;
从主诉文本中识别出症状实体类;
构建症状库,所述症状库存储有患病的多个症状;
根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0;
将患者向量输入卷积神经网络模型进行分类,得到不同科室的分诊概率;
对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。
优选地,所述卷积神经网络模型包括:多个卷积层、多个池化层、全连接层和Softmax层。
进一步,优选地,所述卷积神经网络模型包括:三个卷积层、两个池化层、全连接层和Softmax层。
更进一步,优选地,所述卷积神经网络模型的构建步骤包括:
通过下式(1)构建第一卷积层
其中,ch表示第一卷积层的第ch通道,d1为第一卷积层的卷积核的半径,表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b1,ch表示第一卷积层的第ch通道的卷积核的偏置值,为第一卷积层的卷积核权重矩阵W1,ch的第j个元素,xt+j表示输入向量X的第t+j个元素,ReLu表示线性整流函数;
通过下式(2)构建第一池化层
其中,表示第一池化层在第ch个通道上的第t个位置上的输出值;
通过下式(3)构建第二卷积层
其中,表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,dim2表示第二卷积层的第ch通道的激活矩阵a2,ch的维数,d2为第二卷积层的卷积核的半径,b2,ch则表示第二卷积层的第ch通道的卷积核的偏置值,为第二卷积层的卷积核权重矩阵W2 ,ch的在(i,j)位置上的元素,表示第一池化层输出矩阵z1的(i,j)位置上的元素;
通过下式(4)构建第二池化层
其中,表示表示第二池化层在第ch个通道上的第t个位置上的输出值;
通过下式(5)构建第三卷积层
a3=ReLu(b3+W3z2) (5)
其中,a3表示第三卷积层的输出,b3表示第三卷积层的卷积核的偏置,W3表示第三卷积层的卷积核的权重参数,z2表示第二池化层输出矩阵;
通过下式(6)构建全连接层和Softmax层,
P=Softmax(b4+a3W4) (6)
其中,b4表示全连接层的偏置,W4表示全连接层的的权重参数,P表示各科室的分诊概率构成的分诊概率矩阵。
优选地,所述症状库包括120个不同症状;第一卷积层中,卷积核大小为k=11,共产生ch=60个通道,输入填充大小为5,输入的一维特征的长度为120,卷积步长为1;第一池化层和第二池化层采用max-pooling池化操作,步长为2;第二卷积层中,卷积核大小为5,共产生30个通道,输入填充大小为2,输入的一维特征的长度为60,卷积步长为1;第三卷积层中,卷积核大小为1,产生1个通道,输入填充大小为0,输入的一维特征的长度为30,卷积步长为1。
根据本发明的另一个方面,提供一种基于深度学习的医院分诊系统,包括:
采集模块,采集患者的主诉文本,将所述主诉文本发送给症状识别模块;
症状识别模块,接收采集模块发送的主诉文本,从主诉文本中识别出症状实体类,发送给患者向量生成模块;
症状库,存储有患病的多个症状,发送给患者向量生成模块;
患者向量生成模块,根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0,将患者向量发送给分类模块;
分类模块,将患者向量输入卷积神经网络模型进行分类,得到不同科室的分诊概率;
推荐模块,对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。
优选地,所述卷积神经网络模型包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层和Softmax层,其中:
第一卷积层通过下式(1)构建
其中,ch表示第一卷积层的第ch通道,d1为第一卷积层的卷积核的半径,表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b1,ch表示第一卷积层的第ch通道的卷积核的偏置值,为第一卷积层的卷积核权重矩阵W1,ch的第j个元素,xt+j表示输入向量X的第t+j个元素,ReLu表示线性整流函数;
第一池化层通过下式(2)构建
其中,表示第一池化层在第ch个通道上的第t个位置上的输出值;
第二卷积层通过下式(3)构建
其中,表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,dim2表示第二卷积层的第ch通道的激活矩阵a2,ch的维数,d2为第二卷积层的卷积核的半径,b2,ch则表示第二卷积层的第ch通道的卷积核的偏置值,为第二卷积层的卷积核权重矩阵W2 ,ch的在(i,j)位置上的元素,表示第一池化层输出矩阵z1的(i,j)位置上的元素;
第二池化层通过下式(4)构建
其中,表示表示第二池化层在第ch个通道上的第t个位置上的输出值;
第三卷积层通过下式(5)构建
a3=ReLu(b3+W3z2) (5)
其中,a3表示第三卷积层的输出,b3表示第三卷积层的卷积核的偏置,W3表示第三卷积层的卷积核的权重参数,z2表示第二池化层输出矩阵;
通过下式(6)构建全连接层和Softmax层,
P=Softmax(b4+a3W4) (6)
其中,b4表示全连接层的偏置,W4表示全连接层的的权重参数,P表示各科室的分诊概率构成的分诊概率矩阵。
另外,本发明还提供一种电子装置,包括存储器和处理器,所述存储器中存储有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊被所述处理器执行时,实现上述基于深度学习的医院分诊方法的步骤。
此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊程序被处理器执行时,实现上述基于深度学习的医院分诊方法的步骤。
上述基于深度学习的医院分诊方法、系统、装置及介质通过构建患者向量输入卷积神经网络模型自动获得各科室的分诊概率,提高了分诊的准确率,削减了医院导诊的人工开销,提供自助式分诊服务。
附图说明
图1是本发明所述基于深度学习的医院分诊方法的流程图;
图2是本发明所述基于深度学习的医院分诊系统的构成框图;
图3是本发明所述从主诉文本提取症状实体类的示意图;
图4是本发明所述生成患者向量的示意图;
图5是本发明所述卷积神经网络模型的示意图;
图6是本发明所述根据分诊概率推荐分诊科室的示意图。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
下面将参照附图来对根据本发明的各个实施例进行详细描述。
图1是本发明所述基于深度学习的医院分诊方法的流程图,如图1所示,所述医院分诊方法包括:
步骤S1,采集患者的主诉文本,所述主诉文本是对于患者身体状况的描述文本;
步骤S2,从主诉文本中识别出症状实体类,所述症状实体类是从主诉文本中识别出的描述症状的关键词,例如,使用已有的算法(如LSTM-CRF算法)从输入文本中识别出症状实体类;
步骤S3,构建症状库,所述症状库存储有患病的多个症状;
步骤S4,根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0;
步骤S5,将患者向量输入卷积神经网络(CNN)模型进行分类,得到不同科室的分诊概率;
步骤S6,对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。优选地,所述卷积神经网络模型包括:多个卷积层、多个池化层、全连接层和Softmax层。
在本发明的一个可选实施例中,所述卷积神经网络模型包括:多个卷积层、多个池化层、全连接层和Softmax层。
优选地,所述卷积神经网络模型包括:三个卷积层、两个池化层、全连接层和Softmax层。
上述卷积神经网络模型的构建步骤包括:
通过下式(1)构建第一卷积层
其中,ch表示第一卷积层的第ch通道,d1为第一卷积层的卷积核的半径,表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b1,ch表示第一卷积层的第ch通道的卷积核的偏置值,为第一卷积层的卷积核权重矩阵W1,ch的第j个元素,xt+j表示输入向量X的第t+j个元素,ReLu表示线性整流函数;
通过下式(2)构建第一池化层
其中,表示第一池化层在第ch个通道上的第t个位置上的输出值,t_表示在t=t_时刻的数值,这里t_∈{2t-1,2t}表示对求最大值的索引范围;
通过下式(3)构建第二卷积层
其中,表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,dim2表示第二卷积层的第ch通道的激活矩阵a2,ch的维数,d2为第二卷积层的卷积核的半径,b2,ch则表示第二卷积层的第ch通道的卷积核的偏置值,为第二卷积层的卷积核权重矩阵W2 ,ch的在(i,j)位置上的元素,表示第一池化层输出矩阵z1的(i,j)位置上的元素;
通过下式(4)构建第二池化层
其中,表示表示第二池化层在第ch个通道上的第t个位置上的输出值;
通过下式(5)构建第三卷积层
a3=ReLu(b3+W3Z2) (5)
其中,a3表示第三卷积层的输出,b3表示第三卷积层的卷积核的偏置,W3表示第三卷积层的卷积核的权重参数,z2表示第二池化层输出矩阵;
通过下式(6)构建全连接层和Softmax层,
P=Softmax(b4+a3W4) (6)
其中,b4表示全连接层的偏置,W4表示全连接层的的权重参数,P表示各科室的分诊概率构成的分诊概率矩阵。
图2是本发明所述基于深度学习的医院分诊系统的构成框图,如图2所示,所述医院分诊系统包括:
采集模块1,采集患者的主诉文本,将所述主诉文本发送给症状识别模块2;
症状识别模块2,接收采集模块发送的主诉文本,从主诉文本中识别出症状实体类,发送给患者向量生成模块4;
症状库3,存储有患病的多个症状,发送给患者向量生成模块4;
患者向量生成模块4,根据症状库3的症状和症状识别模块2识别的症状实体类将患者的主诉文本编码为患者向量,症状库3中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0,将患者向量发送给分类模块5;
分类模块5,将患者向量输入卷积神经网络模型50进行分类,得到不同科室的分诊概率;
推荐模块6,对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。
在上述医院分诊系统中,所述卷积神经网络模型包括:多个卷积层、多个池化层、全连接层和Softmax层。
优选地,所述卷积神经网络模型包括:三个卷积层、两个池化层、全连接层和Softmax层。
在一个可选实施例中,第一卷积层通过公式(1)构建,第一池化层通过公式(2)构建,第二卷积层通过公式(3)构建,第二池化层通过公式(4)构建,第三卷积层通过公式(5)构建,全连接层和Softmax层通过公式(6)构建。
上述各实施例中的卷积神经网络模型的训练方法包括:
构建训练集和验证集,所述症状库按照顺序存储多个症状,构成症状序列,将各种疾病包含的症状与所述症状序列进行比对,获得各种疾病的疾病向量,将疾病向量与科室标识符向对应,进一步地,还可以与医院标识符相对应,也就是说,所述训练集包括疾病向量,所述验证集包括各疾病向量对应的科室标识符,还可以包括科室标识符对应的医院标识符,一个科室标识符可以对应一个医院标识符,也可以对应多个医院标识符,一个疾病向量可以对应一个科室标识符,也可以对应多个科室标识符,因为不同的医院可能将某些疾病划分的科室不同;
将训练集代入卷积神经网络模型,通过验证集根据损失函数(交叉熵)使用反向传播算法对卷积神经网络模型进行参数调整。
在本申请的一个具体实施例中,在步骤S2中,使用自然语言处理领域已有的命名实体识别算法,提取主诉文本中的症状实体类,如图3所示,主诉文本为“从昨天开始腹泻,有些头痛、腰酸”,从主诉文本中识别出症状实体类-“腹泻”,“头痛”和“腹痛”。
在步骤S3,症状库依次存储有120个症状,例如通过《疾病大全》中收集的120个症状构建症状库使用,这120个症状覆盖面广,用词准确,基本满足分诊需要。
在步骤S4中,上述120个症状作为每个患者向量的表示基准,具体地,如图4所示,每个患者由一个120维度的向量表示,向量的每个维度表示一个症状。若某个患者有某个症状,则这个维度为1,否则为0,例如,如图4所示,一个患者有三个症状实体类“腹泻”,“头痛”和“腹痛”,则这个患者的向量表示这三个症状实体类的维度分别是1,其他症状的维度为0。
在步骤S5中,如图5所示,包括:
构建卷积神经网络模型50,所述卷积神经网络结构包括第一卷积层51、第一池化层52、第二卷积层53、第二池化层54、第三卷积层55及全连接层56和Softmax层57,具体地:
第一卷积层51中,卷积核大小为k=11,共产生c=60个通道,输入填充大小为p=5,输入的一维特征的长度为i=120,d1=5,卷积步长s=1。
设模型的输入为:X={xt}
其中,Cat表示将向量或标量进行连接,其结果在原来基础上提升一个维度,a1,ch表示第一卷积层的第ch通道的输出向量,为一个120维的向量;a1=Cat[a1,1,a1,2,…,a1,60]T,a1为第一卷积层的输出矩阵,维度为120×60,
第一池化层52采用max-pooling(最大池化),其步长s=2, z1,ch表示第一池化层的第ch通道的输出向量,为一个60维的向量;z1=Cat[z1,1,z1,2,…,z1,60]T,z1为第一池化层的输出矩阵,维度为60×60。
第二卷积层53中,卷积核大小为k=5,共产生c=30个通道,输入填充大小为p=2,d2=2,输入的一维特征的长度为i=60,卷积步长s=1。
表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,a2,ch表示第二卷积层的第ch通道的输出向量,维数是60维,第二卷积层的卷积核权重矩阵W2,ch,维数5×60,即W2,ch∈R5×60
a2=Cat[a2,1,a2,2,…,a2,30]T,a2为第二卷积层的输出矩阵,维数是60×30。
第二池化层54采用max-pooling(最大池化),其步长s=2
z2,ch表示第二池化层的第ch通道的输出向量,为一个30维的向量;
z2=Cat[z2,1,z2,2,…,z2,30]T,z2为第二池化层的输出矩阵,维数是30×30,表示第二池化层每个通道输出值连接成的二维矩阵。
第三卷积层55中,卷积核大小为k=1,共产生c=1个通道,输入填充大小为p=0,输入的一维特征的长度为i=30,卷积步长s=1,在公式(5)中,a3∈R1×30,b3∈R1×30,W3∈R1 ×30
全连接层56和Softmax层57中,b4∈R1×30,W4∈R30×30,P∈R1×30
卷积神经网络模型构建完成后,对构建的卷积神经网络模型进行训练,例如,使用《疾病大全》2535个病例对模型进行训练,保存卷积神经网络模型的参数;
神经网络模型训练完成后,将新的患者向量输入训练后的卷积神经网络模型,得到所述患者向量的分诊结果,如图6所示,将P∈R1×30分的各个元素按照概率大小排序,提取概率最大的前3个概率所代表的门诊。
上述各实施例中的基于深度学习的医院分诊方法应用于电子装置本发明还提供一种电子装置,包括存储器和处理器,所述存储器中存储有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊被所述处理器执行时,实现上述基于深度学习的医院分诊方法的步骤。
此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊程序被处理器执行时,实现上述各实施例中的基于深度学习的医院分诊方法的步骤。
存储器用于存储安装于所述电子装置的基于深度学习的医院分诊程序等,还可以用于暂时地存储已经输出或者将要输出的数据,所述存储器包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储器,例如所述电子装置上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
处理器在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器中存储的程序代码或处理数据,例如执行基于深度学习的医院分诊程序等。
上述电子装置还可以包括网络接口,通信总线、输入模块(键盘、鼠标、触摸屏、摄像头类的语音输入设备等)等。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊程序被处理器执行时,实现上述各实施例中的基于深度学习的医院分诊方法的步骤
尽管前面公开的内容示出了本发明的示例性实施例,但是应当注意,在不背离权利要求限定的范围的前提下,可以进行多种改变和修改。根据这里描述的发明实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明的元素可以以个体形式描述或要求,但是也可以设想具有多个元素,除非明确限制为单个元素。

Claims (9)

1.一种基于深度学习的医院分诊方法,其特征在于,包括:
采集患者的主诉文本;
从主诉文本中识别出症状实体类;
构建症状库,所述症状库存储有患病的多个症状;
根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0;
将患者向量输入卷积神经网络模型进行分类,得到不同科室的分诊概率;
对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。
2.根据权利要求1所述的基于深度学习的医院分诊方法,其特征在于,所述卷积神经网络模型包括:多个卷积层、多个池化层、全连接层和Softmax层。
3.根据权利要求2所述的基于深度学习的医院分诊方法,其特征在于,所述卷积神经网络模型包括:三个卷积层、两个池化层、全连接层和Softmax层。
4.根据权利要求3所述的基于深度学习的医院分诊方法,其特征在于,所述卷积神经网络模型的构建步骤包括:
通过下式(1)构建第一卷积层
其中,ch表示第一卷积层的第ch通道,d1为第一卷积层的卷积核的半径,表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b1,ch表示第一卷积层的第ch通道的卷积核的偏置值,为第一卷积层的卷积核权重矩阵W1,ch的第j个元素,xt+j表示输入向量X的第t+j个元素,ReLu表示线性整流函数;
通过下式(2)构建第一池化层
其中,表示第一池化层在第ch个通道上的第t个位置上的输出值;
通过下式(3)构建第二卷积层
其中,表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,dim2表示第二卷积层的第ch通道的激活矩阵a2,ch的维数,d2为第二卷积层的卷积核的半径,b2,ch则表示第二卷积层的第ch通道的卷积核的偏置值,为第二卷积层的卷积核权重矩阵W2,ch的在(i,j)位置上的元素,表示第一池化层输出矩阵z1的(i,j)位置上的元素;
通过下式(4)构建第二池化层
其中,表示表示第二池化层在第ch个通道上的第t个位置上的输出值;
通过下式(5)构建第三卷积层
a3=ReLu(b3+W3z2) (5)
其中,a3表示第三卷积层的输出,b3表示第三卷积层的卷积核的偏置,W3表示第三卷积层的卷积核的权重参数,z2表示第二池化层输出矩阵;
通过下式(6)构建全连接层和Softmax层,
P=Soffmax(b4+a3W4) (6)
其中,b4表示全连接层的偏置,W4表示全连接层的的权重参数,P表示各科室的分诊概率构成的分诊概率矩阵。
5.根据权利要求4所述的基于深度学习的医院分诊方法,其特征在于,所述症状库包括120个不同症状;第一卷积层中,卷积核大小为k=11,共产生ch=60个通道,输入填充大小为5,输入的一维特征的长度为120,卷积步长为1;第一池化层和第二池化层采用max-pooling池化操作,步长为2;第二卷积层中,卷积核大小为5,共产生30个通道,输入填充大小为2,输入的一维特征的长度为60,卷积步长为1;第三卷积层中,卷积核大小为1,产生1个通道,输入填充大小为0,输入的一维特征的长度为30,卷积步长为1。
6.一种基于深度学习的医院分诊系统,其特征在于,包括:
采集模块,采集患者的主诉文本,将所述主诉文本发送给症状识别模块;
症状识别模块,接收采集模块发送的主诉文本,从主诉文本中识别出症状实体类,发送给患者向量生成模块;
症状库,存储有患病的多个症状,发送给患者向量生成模块;
患者向量生成模块,根据症状库的症状和识别的症状实体类将患者的主诉文本编码为患者向量,症状库中的一个症状对应患者向量的一个维度,当症状实体类与症状对应时,所述维度为1,当症状实体类与症状不对应时,所述维度为0,将患者向量发送给分类模块;
分类模块,将患者向量输入卷积神经网络模型进行分类,得到不同科室的分诊概率;
推荐模块,对各个科室的分诊概率进行排序,返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。
7.根据权利要求6所述的基于深度学习的医院分诊系统,其特征在于,所述卷积神经网络模型包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层和Softmax层,其中:
第一卷积层通过下式(1)构建
其中,ch表示第一卷积层的第ch通道,d1为第一卷积层的卷积核的半径,表示第一卷积层的第ch通道在第t个位置的神经元的激活值,b1,ch表示第一卷积层的第ch通道的卷积核的偏置值,为第一卷积层的卷积核权重矩阵W1,ch的第j个元素,xt+j表示输入向量X的第t+j个元素,ReLu表示线性整流函数;
第一池化层通过下式(2)构建
其中,表示第一池化层在第ch个通道上的第t个位置上的输出值;
第二卷积层通过下式(3)构建
其中,表示第二卷积层的第ch通道上第t个位置上的神经元的输出值,dim2表示第二卷积层的第ch通道的激活矩阵a2,ch的维数,d2为第二卷积层的卷积核的半径,b2,ch则表示第二卷积层的第ch通道的卷积核的偏置值,为第二卷积层的卷积核权重矩阵W2,ch的在(i,j)位置上的元素,表示第一池化层输出矩阵z1的(i,j)位置上的元素;
第二池化层通过下式(4)构建
其中,表示表示第二池化层在第ch个通道上的第t个位置上的输出值;
第三卷积层通过下式(5)构建
a3=ReLu(b3+W322) (5)
其中,a3表示第三卷积层的输出,b3表示第三卷积层的卷积核的偏置,W3表示第三卷积层的卷积核的权重参数,z2表示第二池化层输出矩阵;
通过下式(6)构建全连接层和Softmax层,
P=Softmax(b4+a3W4) (6)
其中,b4表示全连接层的偏置,W4表示全连接层的的权重参数,P表示各科室的分诊概率构成的分诊概率矩阵。
8.一种电子装置,其特征在于,包括存储器和处理器,所述存储器中存储有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊程序被所述处理器执行时,实现如权利要求1至5中任一项权利要求所述基于深度学习的医院分诊方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括有基于深度学习的医院分诊程序,所述基于深度学习的医院分诊程序被处理器执行时,实现如权利要求1至5中任一项权利要求所述基于深度学习的医院分诊方法的步骤。
CN201910329178.3A 2019-04-23 2019-04-23 基于深度学习的医院分诊方法、系统、装置及介质 Pending CN110047584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910329178.3A CN110047584A (zh) 2019-04-23 2019-04-23 基于深度学习的医院分诊方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910329178.3A CN110047584A (zh) 2019-04-23 2019-04-23 基于深度学习的医院分诊方法、系统、装置及介质

Publications (1)

Publication Number Publication Date
CN110047584A true CN110047584A (zh) 2019-07-23

Family

ID=67278793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910329178.3A Pending CN110047584A (zh) 2019-04-23 2019-04-23 基于深度学习的医院分诊方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN110047584A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993081A (zh) * 2019-12-03 2020-04-10 济南大学 一种医生在线推荐方法及系统
CN111370102A (zh) * 2020-02-06 2020-07-03 清华大学 科室导诊方法、装置以及设备
CN111882005A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 数据类别确定方法及装置、终端设备、存储介质
CN111951959A (zh) * 2020-08-23 2020-11-17 云知声智能科技股份有限公司 基于强化学习的对话式导诊方法、装置及存储介质
CN111951943A (zh) * 2020-09-27 2020-11-17 平安科技(深圳)有限公司 智能分诊方法、装置、电子设备及存储介质
WO2021051496A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 诊断结果识别、模型训练的方法、计算机设备及存储介质
CN112951394A (zh) * 2021-03-10 2021-06-11 中电健康云科技有限公司 一种基于深度学习的医院分诊和预测医学检查项目的方法
WO2021164388A1 (zh) * 2020-09-25 2021-08-26 平安科技(深圳)有限公司 分诊融合模型训练方法、分诊方法、装置、设备及介质
WO2021174728A1 (zh) * 2020-03-04 2021-09-10 平安国际智慧城市科技股份有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN113707285A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 科室分诊方法、系统、设备以及存储介质
CN113724854A (zh) * 2021-07-27 2021-11-30 广州医科大学附属第二医院 一种基于机器学习的分级分诊方法、系统及计算机设备
CN113782165A (zh) * 2021-04-02 2021-12-10 北京京东拓先科技有限公司 分诊方法及装置、计算机可存储介质
CN114357168A (zh) * 2021-12-31 2022-04-15 成都信息工程大学 一种文本分类方法
US11404449B2 (en) 2020-04-08 2022-08-02 Tcl China Star Optoelectronics Technology Co., Ltd. Display panel
CN111370102B (zh) * 2020-02-06 2024-07-05 清华大学 科室导诊方法、装置以及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108766561A (zh) * 2018-05-31 2018-11-06 平安医疗科技有限公司 病症信息处理方法、装置、计算机设备和存储介质
CN108806785A (zh) * 2018-05-29 2018-11-13 四川长虹电器股份有限公司 一种基于卷积神经网络的诊疗科室推荐方法及系统
CN108899070A (zh) * 2018-05-31 2018-11-27 平安医疗科技有限公司 处方推荐生成方法、装置、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806785A (zh) * 2018-05-29 2018-11-13 四川长虹电器股份有限公司 一种基于卷积神经网络的诊疗科室推荐方法及系统
CN108766561A (zh) * 2018-05-31 2018-11-06 平安医疗科技有限公司 病症信息处理方法、装置、计算机设备和存储介质
CN108899070A (zh) * 2018-05-31 2018-11-27 平安医疗科技有限公司 处方推荐生成方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LINA SULIEMAN等: ""Classifying patient portal messages using Convolutional Neural Networks"", 《JOURNAL OF BIOMEDICAL INFORMATICS》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021051496A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 诊断结果识别、模型训练的方法、计算机设备及存储介质
CN110993081A (zh) * 2019-12-03 2020-04-10 济南大学 一种医生在线推荐方法及系统
CN110993081B (zh) * 2019-12-03 2023-08-11 济南大学 一种医生在线推荐方法及系统
CN111370102A (zh) * 2020-02-06 2020-07-03 清华大学 科室导诊方法、装置以及设备
CN111370102B (zh) * 2020-02-06 2024-07-05 清华大学 科室导诊方法、装置以及设备
WO2021174728A1 (zh) * 2020-03-04 2021-09-10 平安国际智慧城市科技股份有限公司 分诊数据处理方法、装置、计算机设备及存储介质
US11404449B2 (en) 2020-04-08 2022-08-02 Tcl China Star Optoelectronics Technology Co., Ltd. Display panel
CN111951959A (zh) * 2020-08-23 2020-11-17 云知声智能科技股份有限公司 基于强化学习的对话式导诊方法、装置及存储介质
WO2021164388A1 (zh) * 2020-09-25 2021-08-26 平安科技(深圳)有限公司 分诊融合模型训练方法、分诊方法、装置、设备及介质
CN111951943A (zh) * 2020-09-27 2020-11-17 平安科技(深圳)有限公司 智能分诊方法、装置、电子设备及存储介质
CN111951943B (zh) * 2020-09-27 2021-01-05 平安科技(深圳)有限公司 智能分诊方法、装置、电子设备及存储介质
CN111882005B (zh) * 2020-09-28 2020-12-15 平安科技(深圳)有限公司 数据类别确定方法及装置、终端设备、存储介质
CN111882005A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 数据类别确定方法及装置、终端设备、存储介质
CN112951394A (zh) * 2021-03-10 2021-06-11 中电健康云科技有限公司 一种基于深度学习的医院分诊和预测医学检查项目的方法
CN113782165A (zh) * 2021-04-02 2021-12-10 北京京东拓先科技有限公司 分诊方法及装置、计算机可存储介质
WO2022206599A1 (zh) * 2021-04-02 2022-10-06 北京京东拓先科技有限公司 分诊方法及装置、计算机可存储介质
CN113724854A (zh) * 2021-07-27 2021-11-30 广州医科大学附属第二医院 一种基于机器学习的分级分诊方法、系统及计算机设备
CN113707285A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 科室分诊方法、系统、设备以及存储介质
CN114357168A (zh) * 2021-12-31 2022-04-15 成都信息工程大学 一种文本分类方法
CN114357168B (zh) * 2021-12-31 2022-08-02 成都信息工程大学 一种文本分类方法

Similar Documents

Publication Publication Date Title
CN110047584A (zh) 基于深度学习的医院分诊方法、系统、装置及介质
Tseng et al. The application of data mining techniques to oral cancer prognosis
Qayyum et al. Medical image retrieval using deep convolutional neural network
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
CN107391906B (zh) 基于神经网络和图谱结构的健康饮食知识网络构建方法
Nowaková et al. Medical image retrieval using vector quantization and fuzzy S-tree
CN113707297B (zh) 医疗数据的处理方法、装置、设备及存储介质
Maghari et al. Books’ rating prediction using just neural network
Pakhira et al. Validity index for crisp and fuzzy clusters
JP5154832B2 (ja) 文書検索システム及び文書検索方法
CN104572675B (zh) 一种相似病历检索的系统及方法
CN108446260A (zh) 基于语义近似匹配算法进行自动化疾病编码转换的方法及系统
CN106844308A (zh) 一种使用语义识别进行自动化疾病编码转换的方法
CN109739978A (zh) 一种文本聚类方法、文本聚类装置及终端设备
CN105117397B (zh) 一种基于本体的医学文档语义关联检索方法
CN110428907A (zh) 一种基于非结构化电子病历的文本挖掘方法及系统
CN109684476A (zh) 一种文本分类方法、文本分类装置及终端设备
Lin et al. TCM clinic records data mining approaches based on weighted-LDA and multi-relationship LDA model
Joshi et al. Progressive transfer learning approach for identifying the leaf type by optimizing network parameters
Kazemi et al. A comparative study on content-based paper-to-paper recommendation approaches in scientific literature
CN107193996A (zh) 相似病历匹配检索系统
Chow et al. A new document representation using term frequency and vectorized graph connectionists with application to document retrieval
Sun et al. Multitask recalibrated aggregation network for medical code prediction
Biseda et al. Prediction of ICD codes with clinical BERT embeddings and text augmentation with label balancing using MIMIC-III
US11544619B2 (en) Dimension reduction of claims data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190723