CN113555078A

CN113555078A - 模式驱动的胃镜检查报告智能生成方法和系统

Info

Publication number: CN113555078A
Application number: CN202110668395.2A
Authority: CN
Inventors: 丁帅; 杨善林; 曹云霞; 王浩; 刘雅静; 张宏敏; 王亚雷
Original assignee: Anhui Medical University; Hefei University of Technology
Current assignee: Anhui Medical University; Hefei University of Technology
Priority date: 2021-06-16
Filing date: 2021-06-16
Publication date: 2021-10-26
Anticipated expiration: 2041-06-16
Also published as: CN113555078B

Abstract

本发明提供一种模式驱动的胃镜检查报告智能生成方法、系统、存储介质和电子设备，涉及胃镜检查报告智能生成技术领域。本发明融合胃镜检查图像以及预先构建的报告词典，在Transformer的编码器‑解码器框架基础上搭建预先训练的图片部位识别网络，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS；契合临床报告生成过程，融入了胃镜医生专业知识与经验；参考相同检查部位报告的关键模式信息，有效提高了生成报告的自动化程度，大大减轻胃镜医生撰写检查报告的工作压力。

Description

模式驱动的胃镜检查报告智能生成方法和系统

技术领域

本发明涉及胃镜检查报告智能生成技术领域，具体涉及一种模式驱动的胃镜检查报告智能生成方法、系统、存储介质和电子设备。

背景技术

在医学领域，医学影像数据是医生进行疾病诊断和提供治疗方案的重要工具。在放射科、超声科等科室，检查医师会根据患者检查的影像数据来撰写检查报告，以供主治医生进行疾病的诊断和治疗方案的制定。撰写医学报告需要检查医师对疾病症状的表现形式、描述方式等专业知识有深入的了解，对于没有经验或者经验不足的检查医师，撰写医学报告可能会容易出错。而对于经验丰富的检查医师，此任务同样费时费力。因此，促进医学报告自动化生成，可以节省检查医师的时间，降低他们的工作压力，还有助于提高基层医疗机构的影像科诊疗水平。同时，生成的报告可供许多潜在用户使用，如影像科医生可使用检查报告来监视患者身体状况的变化并采取相关干预措施，提高临床疾病诊断效率。

目前，为了促进医学影像报告自动生成，业内学者提出了许多基于图像字幕生成的计算机辅助报告生成系统，该系统可以从医学图像中提取发现并生成包含细粒度信息的文本报告。现有的研究主要使用胸部X射线数据，采用编码器-解码器体系结构，从图像中提取疾病标签信息，生成文本型报告。为了让生成报告更加简洁、准确，相关研究引入注意力机制，捕获图像中的重点信息，提高报告描述的精确度。

但是，上述计算机辅助报告生成系统研究虽然在一定程度上解决了医学影像报告自动生成问题，但仍然存在不足。譬如，缺乏对胃镜检查报告生成的相关研究，以及胃镜检查报告生成的自动化水平低。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种模式驱动的胃镜检查报告智能生成方法、系统、存储介质和电子设备，解决了胃镜检查报告自动化生成水平低的技术问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种模式驱动的胃镜检查报告智能生成方法，包括：

S1、预处理胃镜检查图片，获取所述胃镜检查图片的视觉特征和部位特征向量；

S2、融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量；

S3、将所述整体特征向量输入Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值；

S4、将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息；

S5、根据所述目标文本序列向量和预先构建的报告词典，获取胃镜检查报告。

优选的，所述S2中整体特征向量表示为

X＝I·L＝{x₁，x₂，…，x_S} (1)

其中，所述整体特征向量X为S维；I与L分别表示所述视觉特征与部位特征向量：

I＝f_v(Img)＝{i₁，i₂，...，i_S} (2)

L＝f_t(Img)＝{l₁，l₂，...，l_S} (3)

所述视觉特征向量I与部位特征向量L均为S维；f_v表示视觉特征提取函数；f_t表示部位特征提取函数；Img表示所述胃镜检查图片。

优选的，所述S4具体包括：

S41、将当前时刻的关键模式信息和上一时刻生成的词条输入所述位置模式存储器中，更新当前时刻的关键模式信息；

S42、根据所述当前时刻的关键模式信息和隐藏层状态值，通过所述解码器解码得到当前时刻的词条，获取所述胃镜检查图片对应的目标文本序列向量。

优选的，所述S41具体包括：

S411、在任意t时刻，将所述P_t-1输入所述位置模式存储器的多头注意力层，获取查询向量Q，

Q＝P_t-1·W_q (4)

S412、将所述P_t-1和上一时刻生成的词条y_t-1进行级联后输入所述位置模式存储模块的多头注意力层，获取键向量K、值向量V，

K＝[P_t-1；y_t-1]·W_k (5)

V＝[P_t-1；y_t-1]·W_v (6)

其中，W_q、W_k、W_v分别表示线性转换器对查询向量Q、键向量K和值向量V的训练权重；

S413、根据所述查询向量Q、键向量K和值向量V，获取输出结果M；

其中，dk表示向量K的维度大小；softmax表示激活函数；

S414、根据所述M，获取所述当前时刻的关键模式信息P_t；

其中，f_mlp表示多层感知器；

表示将上一时刻的输出结果M_t-1输入多层感知器获取的向量结果；Z表示隐藏层状态值；f_g表示门机制。

优选的，所述S42具体包括：

S421、根据所述当前时刻的关键模式信息P_t和隐藏层状态值Z，通过所述解码器解码得到当前时刻的词条y_t指：

y_t＝f_d(Z；P_t) (10)

其中，f_d表示解码器；

S422、根据所述y_t，最终获取所述胃镜检查图片对应的目标文本序列向量Y＝{y₁，y₂，...，y_T}。

优选的，所述S5中报告词典的构建过程包括：

根据临床胃镜检查医生在书写检查报告时的用词规则和范式，以及胃镜检查报告文本语料库来构建报告词典；所述词典包括位置名词、位置表征、病灶形状、病灶表征、修饰词以及常用的程度副词。

优选的，所述关键模式信息与所述胃镜检查图片所属检查部位一一对应，所述检查部位种类至少包括食道、贲门、胃体胃底、胃角、胃窦、幽门或者十二指肠；所述胃镜检查报告的模板与所述检查部位种类一一对应。

一种模式驱动的胃镜检查报告智能生成系统，包括：

预处理模块，用于预处理胃镜检查图片，获取所述胃镜检查图片的视觉特征和部位特征向量；

融合模块，用于融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量；

编码模块，用于将所述整体特征向量输入Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值；

解码模块，用于将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息；

获取模块，用于根据所述目标文本序列向量和预先构建的报告词典，获取胃镜检查报告。

一种存储介质，其存储有用于模式驱动的胃镜检查报告智能生成的计算机程序，其中，所述计算机程序使得计算机执行如上所述的胃镜检查报告智能生成方法。

一种电子设备，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行如上所述的胃镜检查报告智能生成方法。

(三)有益效果

本发明提供了一种模式驱动的胃镜检查报告智能生成方法、系统、存储介质和电子设备。与现有技术相比，具备以下有益效果：

本发明包括融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量；将所述整体特征向量输入Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值；将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息；根据所述目标文本序列向量和预先构建的报告词典，获取胃镜检查报告。本发明融合胃镜检查图像以及预先构建的报告词典，在Transformer的编码器-解码器框架基础上搭建预先训练的图片部位识别网络，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS；契合临床报告生成过程，融入了胃镜医生专业知识与经验；参考相同检查部位报告的关键模式信息，有效提高了生成报告的自动化程度，大大减轻胃镜医生撰写检查报告的工作压力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种模式驱动的胃镜检查报告智能生成方法的流程示意图；

图2为本发明实施例提供的一种模式驱动的胃镜检查报告智能生成方法的框架图；

图3为本发明实施例提供的一种位置模式存储模块的框架图；

图4为本发明实施例提供的一种模式驱动的胃镜检查报告智能生成系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种模式驱动的胃镜检查报告智能生成方法、系统、存储介质和电子设备，解决了胃镜检查报告自动化生成水平低的技术问题，实现有效提高胃镜检查报告生成智能化水平，改善临床上胃镜检查报告质量与生成效率。

本申请实施例中的技术方案为解决上述技术问题，总体思路如下：

本发明实施例包括融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量；将所述整体特征向量输入Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值；将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息；根据所述目标文本序列向量和预先构建的报告词典，获取胃镜检查报告。本发明实施例融合胃镜检查图像以及预先构建的报告词典，在Transformer的编码器-解码器框架基础上搭建预先训练的图片部位识别网络，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS；契合临床报告生成过程，融入了胃镜医生专业知识与经验；参考相同检查部位报告的关键模式信息，有效提高了生成报告的自动化程度，大大减轻胃镜医生撰写检查报告的工作压力。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

实施例：

第一方面，如图1～2所示，本发明实施例提供了一种模式驱动的胃镜检查报告智能生成方法，包括：

本发明融合胃镜检查图像以及预先构建的报告词典，在Transformer的编码器-解码器框架基础上搭建预先训练的图片部位识别网络，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS；契合临床报告生成过程，融入了胃镜医生专业知识与经验；参考相同检查部位报告的关键模式信息，有效提高了生成报告的自动化程度，大大减轻胃镜医生撰写检查报告的工作压力。

下面将结合具体内容详细介绍本方案的各个步骤：

S1、预处理胃镜检查图片，获取所述胃镜检查图片的视觉特征和部位特征向量。

首先，本发明实施例需要提取输入的胃镜检查图片的视觉特征与部位特征信息，将源数据转换为序列数据，作为后续所有模块的输入源序列。

对于给定的胃镜检查图片Img，采用Resnet101网络来提取其视觉特征向量I＝{i₁，i₂，...，i_S}，特征提取过程如公式(1)所示：

I＝f_v(Img) (1)

其中，所述视觉特征向量I为S维；f_v表示视觉特征提取函数。

在后续需要生成的胃镜检查报告中，同一部位的文本报告存在相似的书写格式以及描述规则，为了提高报告生成效率与准确度，本发明实施例提取所述胃镜检查图片的部位特征信息，作为后续位置模式存储器的特征信息来源。

具体采用Resnext101网络来提取部位特征向量L＝{l₁，l₂，...，l_S}，特征提取过程如公式(2)所示：

L＝f_t(Img) (2)

其中，所述部位特征向量L为S维；f_t表示部位特征提取函数。

S2、融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量。

将所述I和L进行融合得到图片的整体特征向量X＝{x₁，x₂，...，x_S}，作为编码器的输入源序列，融合过程如公式(3)所示

X＝I·L＝{x₁，x₂，…，x_S} (3)

S3、将所述整体特征向量输Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值。

本步骤采用Transformer模型的标准编码器框架，将输入序列X＝{x₁，x₂，...，x_S}转换为一个连续的表达向量Z＝{z₁，z₂，...，z_S}，z_S来自对整体特征向量X编码后的隐藏层状态值，其计算过程如公式(4)所示：

Z＝f_e(x₁，x₂，…，x_S) (4)

其中，f_e表示编码器。

S4、将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器(Location ModeStorage，LMS)，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息。

对于同一检查部位的胃镜检查图片数据，其报告内容与格式之间存在相似的模式，这种信息可以用作彼此之间的参考信息来辅助报告生成过程。

为了充分利用部位间的模式信息，如图2所示，本发明实施例在解码器部分引入位置模式存储器用于计算检查报告模式之间的交互和生成过程，再将其以矩阵形式输入至解码器中。

所述关键模式信息与所述部位特征向量，即所述胃镜检查图片所属检查部位一一对应，所述检查部位种类至少包括食道、贲门、胃体胃底、胃角、胃窦、幽门或者十二指肠。

本发明实施例可以按照不同检查部位的检查报告模板实现自动化生成检查报告，提高胃镜检查报告智能化生成水平，降低胃镜检查医生的工作压力，具体模板信息以及生成报告内容如表1所示，所述胃镜检查报告的模板与所述检查部位种类一一对应(不难看出的是，表1仅举例罗列其中几种情况)。

表1

所述S4具体包括：

S41、将当前时刻的关键模式信息和上一时刻生成的词条输入所述位置模式存储器中，更新当前时刻的关键模式信息。

S411、如图3所示，在任意t时刻，将所述P_t-1输入所述位置模式存储器的多头注意力层，获取查询向量Q，

Q＝P_t-1·W_q (5)

K＝[P_t-1；y_t-1]·W_k (6)

V＝[P_t-1；y_t-1]·W_v (7)

其中，W_q、W_k、W_v分别表示线性转换器对查询向量Q、键向量K和值向量V的训练权重。

本步骤中鉴于位置模式存储模块与解码过程一起执行，可能存在梯队消失或梯度爆炸等问题，故引入残差连接和门机制。

其中，dk表示向量K的维度大小；softmax表示激活函数；

S414、根据所述M，获取所述当前时刻的关键模式信息P_t；

其中，f_mlp表示多层感知器；

y_t＝f_d(Z；P_t) (10)

其中，f_d表示解码器；

如图2所示，本步骤中将所述目标文本序列向量Y＝{y₁，y₂，...，y_T}依次输入线性层Linear和激活函数层Softmax，获取每个词条对应的概率值，根据预先构建的报告词典，最终生成胃镜检查报告。

所述报告词典的构建过程包括：

具体示例如表2所示。

表2胃镜检查报告词典

第二方面，如图4所示，本发明实施例提供了一种模式驱动的胃镜检查报告智能生成系统，包括：

可理解的是，本发明提供的模式驱动的胃镜检查报告智能生成系统与本发明提供的模式驱动的胃镜检查报告智能生成方法相对应，其有关内容的解释、举例和有益效果等部分可以参考胃镜检查报告智能生成方法中的相应部分，此处不再赘述。

第三方面，本发明实施例提供了一种存储介质，其存储有用于模式驱动的胃镜检查报告智能生成的计算机程序，其中，所述计算机程序使得计算机执行如上所述的胃镜检查报告智能生成方法。

第四方面，本发明实施例提供了一种电子设备，包括：

一个或多个处理器；

存储器；以及

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例包括融合所述视觉特征和部位特征向量，获取所述胃镜检查图片的整体特征向量；将所述整体特征向量输入Transformer模型的编码器中，获取所述整体特征向量编码后的隐藏层状态值；将所述隐藏层状态值输入所述Transformer模型的解码器中，获取所述胃镜检查图片对应的目标文本序列向量，所述解码器引入位置模式存储器，所述位置模式存储器记录有与所述部位特征向量对应的关键模式信息；根据所述目标文本序列向量和预先构建的报告词典，获取胃镜检查报告。本发明融合胃镜检查图像以及预先构建的报告词典，在Transformer的编码器-解码器框架基础上搭建预先训练的图片部位识别网络，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS；契合临床报告生成过程，融入了胃镜医生专业知识与经验；参考相同检查部位报告的关键模式信息，有效提高了生成报告的自动化程度，大大减轻胃镜医生撰写检查报告的工作压力。

2、本发明实施例考虑到相同检查部位的报告文本之间存在着某种相似性，如：病灶的描述词条、报告的书写格式等，在Transformer架构的基础上额外搭建预先训练的图片部位识别网络Resnext101，提取图片的部位特征信息；同时，设计胃镜检查位置模式存储模块LMS用于记录先前报告生成过程中相同检查部位的关键模式信息，加强临床疾病信息的利用率，提高生成报告的准确度。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种模式驱动的胃镜检查报告智能生成方法，其特征在于，包括：

2.如权利要求1所述的胃镜检查报告智能生成方法，其特征在于，所述S2中整体特征向量表示为

X＝I·L＝{x₁，x₂，…，x_S} (1)

I＝f_v(Img)＝{i₁，i₂，...，i_S} (2)

L＝f_t(Img)＝{l₁，l₂，...，l_S} (3)

3.如权利要求1所述的胃镜检查报告智能生成方法，其特征在于，所述S4具体包括：

4.如权利要求3所述的胃镜检查报告智能生成方法，其特征在于，所述S41具体包括：

Q＝P_t-1·W_q (4)

K＝[P_t-1；y_t-1]·W_k (5)

V＝[P_t-1；y_t-1]·W_v (6)

其中，d_k表示向量K的维度大小；softmax表示激活函数；

S414、根据所述M，获取所述当前时刻的关键模式信息P_t；

其中，f_mlp表示多层感知器；

5.如权利要求4所述的胃镜检查报告智能生成方法，其特征在于，所述S42具体包括：

y_t＝f_d(Z；P_t) (10)

其中，f_d表示解码器；

6.如权利要求1～5任一项所述的胃镜检查报告智能生成方法，其特征在于，所述S5中报告词典的构建过程包括：

7.如权利要求1～5任一项所述的胃镜检查报告智能生成方法，其特征在于，

所述关键模式信息与所述胃镜检查图片所属检查部位一一对应，所述检查部位种类至少包括食道、贲门、胃体胃底、胃角、胃窦、幽门或者十二指肠；所述胃镜检查报告的模板与所述检查部位种类一一对应。

8.一种模式驱动的胃镜检查报告智能生成系统，其特征在于，包括：

9.一种存储介质，其特征在于，其存储有用于模式驱动的胃镜检查报告智能生成的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1～7任一项所述的胃镜检查报告智能生成方法。

10.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行如权利要求1～7任一项所述的胃镜检查报告智能生成方法。