WO2022174491A1

WO2022174491A1 - 基于人工智能的病历质控方法、装置、计算机设备及存储介质

Info

Publication number: WO2022174491A1
Application number: PCT/CN2021/083138
Authority: WO
Inventors: 朱昭苇; 孙行智; 胡岗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-02-19
Filing date: 2021-03-26
Publication date: 2022-08-25
Also published as: CN112863683A; CN112863683B

Abstract

提供了一种基于人工智能的病历质控方法、装置、计算机设备及存储介质，其中方法包括获取待检病例的文本，将所述文本进行重要文本信息筛选，获得所述文本中的重要文本信息；获取待检病例的图像，将所述图像进行重要图像信息筛选，获得所述图像中的重要图像信息；将所述重要文本信息和所述重要图像信息进行向量融合，获得融合向量；将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果，待检病历可存储于区块链中。

Description

基于人工智能的病历质控方法、装置、计算机设备及存储介质

本申请要求于2021年2月19日提交中国专利局、申请号为202110195596.5，发明名称为“基于人工智能的病历质控方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及基于人工智能的病历质控方法、装置、计算机设备及存储介质。

背景技术

病历质控是医院管理与建设中重要一环，其中病历诊断质控对于医生的评估和事件追溯具有重要价值。诊断质控一般包括误诊和漏诊，从医院和医生的角度看，误诊的检测对于维持医院正常运转更加的重要。

我国人口基数庞大，就医人数也远超世界平均水平。发明人意识到，病例数极大的情况下病例诊断质控不可能采用大批量人工审核方式，常用方法是随机采样一个小样本进行质控，但随机采样的样本不能以偏概全，质控效果不佳。

发明内容

本申请实施例的目的在于提出一种基于人工智能的病历质控方法、装置、计算机设备及存储介质，以解决采用人工审核方式进行病历质控效率低、效果不佳的问题。

为了解决上述技术问题，本申请实施例提供一种基于人工智能的病历质控方法，采用了如下所述的技术方案：

获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。

为了解决上述技术问题，本申请实施例还提供一种基于人工智能的病历质控装置，采用了如下所述的技术方案：

第一获取模块，用于获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

第二获取模块，用于获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

融合模块，用于将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

处理模块，用于将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时还实现如下步骤：

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

一种计算机可读存储介质，计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下步骤：

与现有技术相比，本申请实施例主要有以下有益效果：

通过获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。结合图像和文本信息利用预先训练的质控模型进行病历是否合格的判断，相对与人工抽样的病历质检方式更高效、更准确。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2根据本申请的基于人工智能的病历质控方法的一个实施例的流程图；

图3是图2中步骤S201之前的一种具体实施方式的流程图；

图4是图2中步骤S203之前的一种具体实施方式的流程图；

图5是图2中步骤S204之前的一种具体实施方式的流程图；

图6是根据本申请的基于人工智能的病历质控装置的一个实施例的结构示意图；

图7是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于人工智能的病历质控方法一般由服务器/ 终端设备执行，相应地，基于人工智能的病历质控装置一般设置于服务器/终端设备中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的基于人工智能的病历质控的方法的一个实施例的流程图。所述的基于人工智能的病历质控方法，包括以下步骤：

步骤S201，获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息。

在本实施例中，基于人工智能的病历质控方法运行于其上的电子设备(例如图1所示的服务器/终端设备)可以通过有线连接方式或者无线连接方式获取待检病例的文本。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

在本实施例中文本重要信息筛选模型基于注意力机制的Transformer模型。主要原理是通过Query、Key、Value三个矩阵计算重要性。例如一句话“咳嗽三天”，每个字都会初始化Query、Key、Value三个权重矩阵。计算“咳”重要性时，利用“咳”的Query矩阵和所有字(包括“咳”本身)的Key矩阵进行点积，得到临时结果A，再将A和“咳”的Value矩阵相乘得到最终的权重。通过上述计算得到每个字的权重，将权重与预设的阈值比较，筛选出重要文本信息。其中文本重要信息筛选模型的训练参见图3。

步骤S202，获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息。

在本实施例中，获取待检病例的图像，将获取到图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选。图像重要信息筛选模型基于E2E模型，这里为了区别与本申请其他实施例中应用的E2E模型，将其称为第一E2E模型。E2E模型的训练，从输入端到输出端会得到一个预测结果，将预测结果和真实结果进行比较得到误差，将误差反向传播到网络的各个层之中，调整网络的权重和参数直到模型收敛或者达到预期的效果为止，中间所有的操作都包含在神经网络内部，不再分成多个模块处理。

在本实施例中，具体的，第一E2E模型的训练目标为将图像分成多个子图像，区分每个子图像的分类。例如根据文本信息“咳嗽三天”要区分出分类为肺部的子图像。首先初始化每个子图像的权重，整个图像的特征向量由各子图像的特征向量及权重进行加权计算。将整个图像的特征向量和文本特征向量拼接后，得到拼接后的向量，通过非线性激活函数后，输入到第一E2E模型中，比较输出结果与预期结果的一致性，调整第一E2E模型的各节点的参数以及各子图像的权重，至第一E2E模型收敛后，认为各子图像权重值分配达到最优。将各子图像权重值与预设的阈值比较，筛选出图像中的重要图像信息。

步骤S203，将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量。

在本实施例中，将重要文本信息和重要图像信息通过预先训练的总体重要性评估模型进行融合，总体重要性评估模型基于第二E2E模型，将重要文本信息和重要图像信息进行特征提取，分别获得重要图像特征向量V1和重要文本特征向量V2，再计算重要图像特征向量与图像基参考向量的相似度a1，重要文本特征向量与文本基参考向量的相似度a2，其中图像基参考向量和文本基参考向量根据已经被确认的合格的病历的图像和文本向量计算均值得到。再根据训练第二E2E模型得到的图像平滑因子终值b1和文本平滑因子终值b2，结合a1，a2对V1和V2融合，得到融合向量V,具体地，V＝a1*b1*V1+a2*b2*V2。其中第二E2E模型的训练请参阅图4。通过上述方式对重要图像特征向量和重要文本特征向量进行融合，使融合向量综合了图像特征和文本特征，同时考虑到两个特征向量对结果的影响不同，引入a1b1和a2b2作为两个特征向量的权重，使病历质控更准确。

步骤S204，将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。

在本实施例中，预先训练的质控模型基于第三E2E模型，第三E2E模型经过训练，学习合格的病历的特征，对接收到融合了病历图像特征和文本特征的融合向量进行分类，输出待检病历是否合格的分类结果。其中第三E2E模型的训练过程请参阅图5。

本申请通过获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。结合图像和文本信息利用预先训练的质控模型进行病历是否合格的判断，相对与人工抽样的病历质检方式更高效、更准确。

如图3所示，在本实施例的一些可选的实现方式中，在步骤S201之前，上述电子设备还可以执行以下步骤：

获取第一训练集，所述第一训练集包含输入语料和预期的输出结果；

将所述第一训练集中的输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果；

通过第一损失函数比较所述预测结果和所述预期的输出结果是否一致；

调整所述Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，获得训练好的文本重要信息筛选模型。

在本实施例中，预先训练的文本重要信息筛选模型为基于注意力机制的Transformer模型。先获取第一训练集，第一训练集包含输入语料和预期的输出结果，将输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果，比较预测结果和预期的输出结果是否一致，这里通过第一损失函数比较两者的一致性，这里第一损失函数采用Softmax交叉熵损失函数，调整Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，self attention机制的Transformer模型训练完毕，得到训练好的文本重要信息筛选模型。

本申请通过获取第一训练集，利用训练集中的数据对基于注意力机制的Transformer模型进行训练，是Transformer模型输出的预测结果与预期的输出结果一致，使Transformer模型具有筛选文本中重要信息的能力。

在一些可选的实现方式中，在步骤S202中，上述电子设备可以执行以下步骤：

将所述图像进行分割，获得K个子图像；

将所述K个子图像输入到预设的SE-ResNet模型进行特征提取，获得所述K个子图像对应的K个子图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

将所述K个子图像特征向量和所述重要文本特征向量输入到所述第一E2E模型进行权重学习，获得所述K个子图像特征向量对应的K个子权重；

将所述K个子权重与预设的第一阈值比较，确定所述子权重大于所述第一阈值的子图像为所述图像的重要图像信息。

在本实施例中，利用预设SE-ResNet模型对子图像特征进行处理，利用预设Bi-GRU模型对文本特征进行处理，分别得到表征子图像特征的子图像特征向量和表征文本特征的重要文本特征向量，然后将K个子图像特征向量和重要文本特征向量输入到第一E2E模型进行权重学习，获得K个子图像特征向量对应的K个子权重；将K个子权重与预设的第一阈值比较，确定子权重大于第一阈值的子图像为所述图像的重要图像信息。

如图4所示，在一些可选的实现方式中，在步骤S203前，上述电子设备可以执行以下步骤：

获取第二训练集，所述第二训练集包含病历样本，所述病历样本包含样本图像向量和样本文本向量，所述病历样本标注诊断标签；

根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；

计算所述样本图像向量与所述图像基参考向量的相似度，得到图像相关因子；

计算所述样本文本向量与所述文本基参考向量的相似度，得到文本相关因子；

根据所述图像相关因子、所述文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；

将所述样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应所述样本融合向量输出的预测标签；

通过第二损失函数比较所述预测标签和所述诊断标签是否一致；

调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得所述图像平滑因子的终值和所述文本平滑因子的终值。

在本实施例中，总体重要性评估模型基于第二E2E模型，第二E2E模型的训练通过上述步骤训练。这里训练的目标为得到图像平滑因子的终值和所述文本平滑因子的终值。首先获取第二训练集，第二训练集包含病历样本，病历样本包含样本图像向量和样本文本向量，且每个样本标注诊断标签；根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；这里标准图像集和标准文本集来之经过确认的合格病历。

再计算样本图像向量与图像基参考向量的相似度，得到图像相关因子；计算样本文本向量与文本基参考向量的相似度，得到文本相关因子；根据图像相关因子、文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；即通过加权求和的方法进行融合。

将样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应输出的预测标签；通过第二损失函数比较预测标签和标注的诊断标签是否一致；这里第二损失函数同样采用softmax交叉熵损失函数，

调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得图像平滑因子的终值和所述文本平滑因子的终值。

在一些可选的实现方式中，在步骤S203中，上述电子设备可以执行以下步骤：

将所述重要图像信息输入到预设的SE-ResNet模型进行特征提取，获得所述重要图像信息对应的重要图像特征向量；

计算所述重要图像特征向量与所述图像基参考向量的相似度，得到图像特征相关因子；

计算所述重要文本特征向量与所述文本基参考向量的相似度，得到文本特征相关因子；

根据所述图像平滑因子的终值和所述文本平滑因子的终值，以及所述图像特征相关因子和所述文本特征相关因子，对所述重要图像特征向量和所述重要文本特征向量进行融合计算，获得融合了所述重要文本信息和所述重要图像信息的融合向量。

在本实施例中，重要图像特征向量V1与图像基参考向量的相似度a1、重要文本特征向量V2与文本基参考向量的相似度a2采用余弦相似度算法进行计算，图像平滑因子的终值b1和文本平滑因子的终值b2来自对上述第二E2E模型训练时得到的图像平滑因子的终值和文本平滑因子的终值，最终融合向量V＝a1*b1*V1+a2*b2*V2。

如图5所示，在一些可选的实现方式中，在步骤S204前，上述电子设备可以执行以下步骤：

获取第三训练集，所述第三训练集包含病历样本融合向量，所述病历样本融合向量为融合了病历样本图像信息和病历样本文本信息的向量，所述病历样本标注了诊断是否合格；

将所述病历样本融合向量输入到所述第三E2E模型中，获得所述第三E2E模型响应所述病历样本融合向量输出的分类结果；

通过第三损失函数比较所述分类结果与所述标注是否一致；

调整所述第三E2E模型各节点的参数，至所述第三损失函数达到最小值时结束，得到训练好的质控模型。

在本实施例中，质控模型基于第三E2E模型，获取第三训练集，第三训练集包含病历样本融合向量，且每一个融合向量标注了对应病历的诊断是否合格；将病历样本融合向量输入到第三E2E模型中，第三E2E模型响应病历样本融合向量输出分类结果，通过第三损失函数比较分类结果与标注是否一致；这里第三损失函数同样采用softmax交叉熵损失函数，调整第三E2E模型各节点的参数，至第三损失函数达到最小值时，训练结束，得到训练好的质控模型。

需要强调的是，为进一步保证上述待检病例的文本和图像信息的私密和安全性，上述待检病例的文本和图像信息还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如流程模块。一般地，流程模块包括执行特定任务或实现特定抽象数据类型的例程、流程、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，流程模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该流程在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图6，作为对上述图2所示方法的实现，本申请提供了一种基于人工智能的病历质控装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例所述的基于人工智能的病历质控装置600包括：第一获取模块601、第一获取模块602、融合模块603以及处理模块604。其中：

第一获取模块601，用于获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

第二获取模块602，用于获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

融合模块603，用于将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

处理模块604，用于将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。

在本实施例的一些可选的实现方式中，所述基于人工智能的病历质控装置，还包括：

第一获取子模块，用于获取第一训练集，所述第一训练集包含输入语料和预期的输出结果；

第一预测子模块，用于将所述第一训练集中的输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果；

第一比较子模块，用于通过第一损失函数比较所述预测结果和所述预期的输出结果是否一致；

第一调整子模块，用于调整所述Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，获得训练好的文本重要信息筛选模型。

在本实施例的一些可选的实现方式中，所述第二获取模块中，还包括：

第一分割子模块，用于将所述图像进行分割，获得K个子图像；

第一特征提取子模块，用于将所述K个子图像输入到预设的SE-ResNet模型进行特征提取，获得所述K个子图像对应的K个子图像特征向量；

第二特征提取子模块，用于将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

第一处理子模块，用于将所述K个子图像特征向量和所述重要文本特征向量输入到所述第一E2E模型进行权重学习，获得所述K个子图像特征向量对应的K个子权重；

第一确定子模块，用于将所述K个子权重与预设的第一阈值比较，确定所述子权重大于所述第一阈值的子图像为所述图像的重要图像信息。

第二获取子模块，用于获取第二训练集，所述第二训练集包含病历样本，所述病历样本包含样本图像向量和样本文本向量，所述病历样本标注诊断标签；

第一计算子模块，用于根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；

第二计算子模块，用于计算所述样本图像向量与所述图像基参考向量的相似度，得到图像相关因子；

第三计算子模块，用于计算所述样本文本向量与所述文本基参考向量的相似度，得到文本相关因子；

第一融合子模块，用于根据所述图像相关因子、所述文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；

第二预测子模块，用于将所述样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应所述样本融合向量输出的预测标签；

第二比较子模块，用于通过第二损失函数比较所述预测标签和所述诊断标签是否一致；

第二调整子模块，用于调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得所述图像平滑因子的终值和所述文本平滑因子的终值。

在本实施例的一些可选的实现方式中，在所述融合模块中包括：

第三特征提取子模块，用于将所述重要图像信息输入到预设的SE-ResNet模型进行特征提取，获得所述重要图像信息对应的重要图像特征向量；

第四特征提取子模块，用于将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

第四计算子模块，用于计算所述重要图像特征向量与所述图像基参考向量的相似度，得到图像特征相关因子；

第五计算子模块，用于计算所述重要文本特征向量与所述文本基参考向量的相似度，得到文本特征相关因子；

第二融合子模块，用于根据所述图像平滑因子的终值和所述文本平滑因子的终值，以及所述图像特征相关因子和所述文本特征相关因子，对所述重要图像特征向量和所述重要文本特征向量进行融合计算，获得融合了所述重要文本信息和所述重要图像信息的融合向量。

第二获取子模块，用于获取第三训练集，所述第三训练集包含病历样本融合向量，所述病历样本融合向量为融合了病历样本图像信息和病历样本文本信息的向量，所述病历样本标注了诊断是否合格；

第三预测子模块，用于将所述病历样本融合向量输入到所述第三E2E模型中，获得所述第三E2E模型响应所述病历样本融合向量输出的分类结果；

第三比较子模块，用于通过第三损失函数比较所述分类结果与所述标注是否一致；

第三调整子模块，用于调整所述第三E2E模型各节点的参数，至所述第三损失函数达到最小值时结束，得到训练好的质控模型。

在本实施例的一些可选的实现方式中，所述基于人工智能的病历质控装置还包括：

存储模块，用于将所述待检病例的文本和图像存储至区块链中。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图7，图7为本实施例计算机设备基本结构框图。

所述计算机设备7包括通过系统总线相互通信连接存储器71、处理器72、网络接口73。需要指出的是，图中仅示出了具有组件71-73的计算机设备7，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器71至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器71可以是所述计算机设备7的内部存储单元，例如该计算机设备7的硬盘或内存。在另一些实施例中，所述存储器71也可以是所述计算机设备7的外部存储设备，例如该计算机设备7上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器71还可以既包括所述计算机设备7的内部存储单元也包括其外部存储设备。本实施例中，所述存储器71通常用于存储安装于所述计算机设备7的操作系统和各类应用软件，例如基于人工智能的病历质控方法的计算机可读指令等。此外，所述存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器72在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制所述计算机设备7的总体操作。本实施例中，所述处理器72用于运行所述存储器71中存储的计算机可读指令或者处理数据，例如运行所述基于人工智能的病历质控方法的计算机可读指令。

所述网络接口73可包括无线网络接口或有线网络接口，该网络接口73通常用于在所述计算机设备7与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于人工智能的病历质控方法的步骤。

所述计算机可读存储介质可以是非易失性，也可以是易失性。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

一种基于人工智能的病历质控方法，包括下述步骤：

获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。
根据权利要求1所述的基于人工智能的病历质控方法，其中，所述预先训练的文本重要信息筛选模型为基于注意力机制的Transformer模型，在所述获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息的步骤之前，还包括：

获取第一训练集，所述第一训练集包含输入语料和预期的输出结果；

将所述第一训练集中的输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果；

通过第一损失函数比较所述预测结果和所述预期的输出结果是否一致；

调整所述Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，获得训练好的文本重要信息筛选模型。
根据权利要求1所述的基于人工智能的病历质控方法，其中，所述预先训练的图像重要信息筛选模型基于第一E2E模型，在所述获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息的步骤中，还包括：

将所述图像进行分割，获得K个子图像；

将所述K个子图像输入到预设的SE-ResNet模型进行特征提取，获得所述K个子图像对应的K个子图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

将所述K个子图像特征向量和所述重要文本特征向量输入到所述第一E2E模型进行权重学习，获得所述K个子图像特征向量对应的K个子权重；

将所述K个子权重与预设的第一阈值比较，确定所述子权重大于所述第一阈值的子图像为所述图像的重要图像信息。
根据权利要求1所述的基于人工智能的病历质控方法，其中，所述总体重要性评估模型基于第二E2E模型，在所述将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量的步骤之前，还包括：

获取第二训练集，所述第二训练集包含病历样本，所述病历样本包含样本图像向量和样本文本向量，所述病历样本标注诊断标签；

根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；

计算所述样本图像向量与所述图像基参考向量的相似度，得到图像相关因子；

计算所述样本文本向量与所述文本基参考向量的相似度，得到文本相关因子；

根据所述图像相关因子、所述文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；

将所述样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应所述样本融合向量输出的预测标签；

通过第二损失函数比较所述预测标签和所述诊断标签是否一致；

调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得所述图像平滑因子的终值和所述文本平滑因子的终值。
根据权利要求4所述的基于人工智能的病历质控方法，其中，在所述将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量的步骤中包括：

将所述重要图像信息输入到预设的SE-ResNet模型进行特征提取，获得所述重要图像信息对应的重要图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

计算所述重要图像特征向量与所述图像基参考向量的相似度，得到图像特征相关因子；

计算所述重要文本特征向量与所述文本基参考向量的相似度，得到文本特征相关因子；

根据所述图像平滑因子的终值和所述文本平滑因子的终值，以及所述图像特征相关因子和所述文本特征相关因子，对所述重要图像特征向量和所述重要文本特征向量进行融合计算，获得融合了所述重要文本信息和所述重要图像信息的融合向量。
根据权利要求1所述的基于人工智能的病历质控方法，其中，所述质控模型基于第三E2E模型，在所述将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果的步骤之前，还包括：

获取第三训练集，所述第三训练集包含病历样本融合向量，所述病历样本融合向量为融合了病历样本图像信息和病历样本文本信息的向量，所述病历样本标注了诊断是否合格；

将所述病历样本融合向量输入到所述第三E2E模型中，获得所述第三E2E模型响应所述病历样本融合向量输出的分类结果；

通过第三损失函数比较所述分类结果与所述标注是否一致；

调整所述第三E2E模型各节点的参数，至所述第三损失函数达到最小值时结束，得到训练好的质控模型。
根据权利要求1所述的基于人工智能的病历质控方法，还包括，将所述待检病例的文本和图像存储至区块链中。
一种基于人工智能的病历质控装置，包括：

第一获取模块，用于获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

第二获取模块，用于获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

融合模块，用于将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

处理模块，用于将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时还实现如下步骤：

获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。
如权利要求9所述的计算机设备，其中，所述预先训练的文本重要信息筛选模型为基于注意力机制的Transformer模型，在所述获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息的步骤之前，还包括：

获取第一训练集，所述第一训练集包含输入语料和预期的输出结果；

将所述第一训练集中的输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果；

通过第一损失函数比较所述预测结果和所述预期的输出结果是否一致；

调整所述Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，获得训练好的文本重要信息筛选模型。
如权利要求9所述的计算机设备，其中，所述预先训练的图像重要信息筛选模型基于第一E2E模型，在所述获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息的步骤中，还包括：

将所述图像进行分割，获得K个子图像；

将所述K个子图像输入到预设的SE-ResNet模型进行特征提取，获得所述K个子图像对应的K个子图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

将所述K个子图像特征向量和所述重要文本特征向量输入到所述第一E2E模型进行权重学习，获得所述K个子图像特征向量对应的K个子权重；

将所述K个子权重与预设的第一阈值比较，确定所述子权重大于所述第一阈值的子图像为所述图像的重要图像信息。
如权利要求9所述的计算机设备，其中，所述总体重要性评估模型基于第二E2E模型，在所述将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量的步骤之前，还包括：

获取第二训练集，所述第二训练集包含病历样本，所述病历样本包含样本图像向量和样本文本向量，所述病历样本标注诊断标签；

根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；

计算所述样本图像向量与所述图像基参考向量的相似度，得到图像相关因子；

计算所述样本文本向量与所述文本基参考向量的相似度，得到文本相关因子；

根据所述图像相关因子、所述文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；

将所述样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应所述样本融合向量输出的预测标签；

通过第二损失函数比较所述预测标签和所述诊断标签是否一致；

调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得所述图像平滑因子的终值和所述文本平滑因子的终值。
如权利要求12所述的计算机设备，其中，在所述将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量的步骤中包括：

将所述重要图像信息输入到预设的SE-ResNet模型进行特征提取，获得所述重要图像信息对应的重要图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

计算所述重要图像特征向量与所述图像基参考向量的相似度，得到图像特征相关因子；

计算所述重要文本特征向量与所述文本基参考向量的相似度，得到文本特征相关因子；

根据所述图像平滑因子的终值和所述文本平滑因子的终值，以及所述图像特征相关因子和所述文本特征相关因子，对所述重要图像特征向量和所述重要文本特征向量进行融合计算，获得融合了所述重要文本信息和所述重要图像信息的融合向量。
如权利要求9所述的计算机设备，其中，所述质控模型基于第三E2E模型，在所述将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果的步骤之前，还包括：

获取第三训练集，所述第三训练集包含病历样本融合向量，所述病历样本融合向量为融合了病历样本图像信息和病历样本文本信息的向量，所述病历样本标注了诊断是否合格；

将所述病历样本融合向量输入到所述第三E2E模型中，获得所述第三E2E模型响应所述病历样本融合向量输出的分类结果；

通过第三损失函数比较所述分类结果与所述标注是否一致；

调整所述第三E2E模型各节点的参数，至所述第三损失函数达到最小值时结束，得到训练好的质控模型。
如权利要求9所述的计算机设备，还包括，将所述待检病例的文本和图像存储至区块链中。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下步骤：

获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息；

获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息；

将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量；

将所述融合向量输入到预先训练的质控模型中，得到所述待检病历是否合格的分类结果。
如权利要求16所述的计算机可读存储介质，其中，所述预先训练的文本重要信息筛选模型为基于注意力机制的Transformer模型，在所述获取待检病例的文本，将所述文本输入到预先训练的文本重要信息筛选模型进行重要文本信息筛选，获得所述文本中的重要文本信息的步骤之前，还包括：

获取第一训练集，所述第一训练集包含输入语料和预期的输出结果；

将所述第一训练集中的输入语料输入到基于注意力机制的Transformer模型中，获取所述Transformer模型响应所述输入语料输出的预测结果；

通过第一损失函数比较所述预测结果和所述预期的输出结果是否一致；

调整所述Transformer模型各节点的参数，至所述第一损失函数达到最小值时结束，获得训练好的文本重要信息筛选模型。
如权利要求16所述的计算机可读存储介质，其中，所述预先训练的图像重要信息筛选模型基于第一E2E模型，在所述获取待检病例的图像，将所述图像输入到预先训练的图像重要信息筛选模型进行重要图像信息筛选，获得所述图像中的重要图像信息的步骤中，还包括：

将所述图像进行分割，获得K个子图像；

将所述K个子图像输入到预设的SE-ResNet模型进行特征提取，获得所述K个子图像对应的K个子图像特征向量；

将所述重要文本信息输入到预设的Bi-GRU模型进行特征提取，获得所述重要文本信息对应的重要文本特征向量；

将所述K个子图像特征向量和所述重要文本特征向量输入到所述第一E2E模型进行权重学习，获得所述K个子图像特征向量对应的K个子权重；

将所述K个子权重与预设的第一阈值比较，确定所述子权重大于所述第一阈值的子图像为所述图像的重要图像信息。
如权利要求16所述的计算机可读存储介质，其中，所述总体重要性评估模型基于第二E2E模型，在所述将所述重要文本信息和所述重要图像信息输入预先训练的总体重要性评估模型进行向量融合，获得融合了所述重要文本信息和所述重要图像信息的融合向量的步骤之前，还包括：

获取第二训练集，所述第二训练集包含病历样本，所述病历样本包含样本图像向量和样本文本向量，所述病历样本标注诊断标签；

根据预设的标准图像集和预设的标准文本集分别计算所述标准图像集中各图像向量的均值和所述标准文本集中各文本向量的均值，得到图像基参考向量和文本基参考向量；

计算所述样本图像向量与所述图像基参考向量的相似度，得到图像相关因子；

计算所述样本文本向量与所述文本基参考向量的相似度，得到文本相关因子；

根据所述图像相关因子、所述文本相关因子以及预设的图像平滑因子初始值和预设的文本平滑因子初始值，将所述样本图像向量和所述样本文本向量进行向量融合，得到样本融合向量；

将所述样本融合向量输入到所述第二E2E模型，获得所述第二E2E模型响应所述样本融合向量输出的预测标签；

通过第二损失函数比较所述预测标签和所述诊断标签是否一致；

调整所述第二E2E模型各及节点的参数以及所述图像平滑因子、所述文本平滑因子的值，至所述第二损失函数达到最小值时结束，获得所述图像平滑因子的终值和所述文本平滑因子的终值。
如权利要求19所述的计算机可读存储介质，还包括，将所述待检病例的文本和图像存储至区块链中。