CN112529857A

CN112529857A - 基于目标检测与策略梯度的超声图像诊断报告生成方法

Info

Publication number: CN112529857A
Application number: CN202011399345.0A
Authority: CN
Inventors: 曾宪华; 许杨
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Guangzhou Dayu Chuangfu Technology Co ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-03-19
Anticipated expiration: 2040-12-03
Also published as: CN112529857B

Abstract

本发明请求保护一种基于目标检测与策略梯度的超声图像诊断报告生成方法，包括以下步骤：首先将图像输入目标检测模型中，预测器官区域的位置信息，根据预测出的位置信息提取出器官区域部分的特征编码；将提取到的特征编码输入到语言生成模型中，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个句子序列即为最终输出的诊断报告。构造的损失函数包括目标检测模型的区域位置和疾病信息的误差，以及语言生成模型通过将生成的诊断报告与对应的标签诊断报告使用回报函数来计算得到的负期望值，训练的目的是最小化回报负期望。本发明能够生成超声图像对应的诊断报告，保持诊断报告的病理信息准确且语法自然。

Description

基于目标检测与策略梯度的超声图像诊断报告生成方法

技术领域

本发明属于医学图像辅助诊断技术领域，属于医学图像诊断报告生成方法。

背景技术

超声图像在临床中广泛应用于疾病的诊断与治疗，诊断报告需要高水平的医生花费大量的时间来撰写，若是能利用计算机算法自动生成对应患者医学图像的诊断报告，这将会有助于辅助医生的诊断。超声图像诊断报告通常更侧重于描述异常部位的病理信息，因为它们能够描述疾病类别和指导治疗。如果能够定位异常部位的图像区域并对其进行正确的分析，这将极大有利于诊断报告的描述。大多数自然图像中都有多个不同的对象，不同的对象之间存在视觉上的位置信息，通常对象的前景与背景的分界较为明显。不同于自然图像，超声图像的噪声较大，且不同对象的前景与背景的分界较为模糊，难以准确的识别超声图像中的对象及其位置信息。同时，医学图像诊断报告算法通常使用极大似然估计来训练，生成文本的对数似然分数和文本描述质量不太具有相关性，比如生成文本的对数似然分数较高时，文本的描述质量不一定很好。为了缓解这个问题，研究者们发明了用于评估文本质量的标准语法度量指标，但这些度量指标是离散和不可微分的，传统方法很难对其进行优化。

基于上述问题，设计了一种新的方法，结合目标检测算法协同视觉和类别信息，提取包含更多器官区域的特征，减少背景对识别的影响。然后利用长短期记忆网络LSTM来解码特征，使用策略梯度算法对不可微分的标准语法度量指标进行优化，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个句子序列即为最终输出的诊断报告。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种能够有效的对输入的超声图像生成诊断报告，同时保证了生成的诊断报告在语法上自然、语义上准确的基于目标检测与策略梯度的超声图像诊断报告生成方法。本发明的技术方案如下：

一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其包括以下步骤：

1)、获取原始的超声图像I作为输入图像，将I输入至目标检测模型Faster RCNN中，利用卷积神经网络从输入图像中提取特征，然后根据病灶区域推荐网络来生成区域预测，通过最小化区域位置和疾病信息的误差来优化目标检测模型；

2)、将超声图像输入到经过训练的目标检测模型中，预测出器官区域的位置信息，并根据预测出的位置信息提取出器官区域部分的特征编码；

3)、语言生成模型的预训练：将提取出的特征编码输入到语言生成模型中，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个诊断报告，将生成的诊断报告与诊断报告标签计算交叉熵损失从而优化语言生成模型；

4)、构建多指标回报函数：使用多种评估文本质量的标准语法度量指标构建回报函数，计算得到的数值和生成的诊断报告的质量呈正相关；

5)、将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下采样生成的诊断报告；

6)、将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下测试时刻生成的诊断报告；

7)、将步骤5)与步骤6)中生成得到的两组诊断报告使用回报函数进行计算；步骤4)中定义的回报函数是用于计算诊断报告的质量指数的，利用回报函数计算得到的数值来优化，最终优化的是网络；

8)、使用策略梯度算法根据步骤7)中的回报函数计算得到最终的梯度，并对语言生成模型的网络参数进行优化，最终优化的语言生成模型网络，回报函数仅是用来计算梯度。

进一步的，所述步骤1)中，获取原始的超声图像作为输入图像，输入到目标检测模型中，利用卷积神经网络从图像中提取特征，然后使用候选区域预测网络来生成区域预测，通过最小化区域位置和疾病信息的误差来优化目标检测模型，具体包括：

目标检测模型包含两部分损失，分别是区域位置和疾病信息的误差，训练的目标是最小化这两个误差，将这一步骤定义为：

其中，i表示病灶区域推荐网络推荐的病灶区域编号，

表示推荐的病灶区域真实的病理信息，q_i表示病灶区域检测模型计算得到的病理信息，t_i,j表示病灶区域检测模型计算得到的病灶区域位置补偿，

表示平滑函数，

表示病灶区域真实的位置补偿，这里的j∈{x,y,w,h}，分别表示病灶区域中心位置的横坐标，纵坐标，以及病灶区域边框的宽和高。

进一步的，所述步骤2)中，将超声图像输入到目标检测模型中，根据预测出的位置信息提取出器官区域部分的特征编码，定义为：

其中，

为经过训练的目标检测模型，I为输入的超声图像，v为最终输出的特征编码。

进一步的，在步骤3)中，所述语言生成模型预训练的具体方法为：语言生成模型主要包含一个长短期记忆网络LSTM]，将提取出的特征编码输入到语言生成模型中，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个诊断报告，将生成的诊断报告与诊断报告标签计算交叉熵损失从而优化语言生成模型，所述长短期记忆网络LSTM定义为：

i_t＝f_sigmoid(W_ivv_t+W_ihh_t-1)

g_t＝f_sigmoid(W_gvv_t+W_ghh_t-1)

o_t＝f_sigmoid(W_ovv_t+W_ohh_t-1)

m_t＝g_t⊙m_t-1+i_t⊙(W_mvv_t+W_mhh_t-1)

h_t＝o_t⊙f_tanh(m_t)

c_t＝f_softmax(h_t)

其中，LSTM的核心是记忆单元m_t，由三个门控制，这三个门分别是输入门i_t、遗忘门g_t和输出门o_t，h_t、h_t-1分别表示当前和上一个时间步的隐层信息，m_t-1表示上一个时间步的记忆单元，f_sigmoid、f_tanh、f_softmax分别表示sigmoid函数、tanh函数、softmax函数，W_iv、W_gv、W_ov、W_mv分别表示输入门、遗忘门、输出门、记忆单元与输入层的连接权重，W_ih、W_gh、W_oh、W_mh分别表示输入门、遗忘门、输出门、记忆单元与隐层的连接权重，v_t、c_t分别表示输入与输出。

进一步的，所述步骤4)中，构建多指标回报函数的具体方法为：使用多种评估文本质量的标准语法度量指标，分别计算生成的诊断报告与标签的值并加权求和，所述回报函数定义为：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

其中，B(·),M(·),R(·),C(·)分别代表Bleu[2],Meteor[3],Rouge[4]andCider[5],c^s为生成的诊断报告，c^*为对应的标签。

进一步的，所述步骤5)将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下采样生成的诊断报告，过程定义为：

c^s＝f_softmax(h_t)

其中，c^s为当前参数下采样生成的诊断报告；

所述步骤6)将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下测试时刻生成的诊断报告，过程定义为：

c^max＝argmaxp_θ(c^s∣v)

其中，c^max为当前参数下测试时刻得到的诊断报告。p_θ表示当前参数下的策略、v表示特征编码。

进一步的，所述步骤7)中，将步骤5)与步骤6)中生成得到的两组诊断报告使用回报函数进行计算，具体包括：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

R(c^max)＝B(c^max,c^*)+M(c^max,c^*)+R(c^max,c^*)+C(c^max,c^*)

其中，R(c^s)和R(c^max)为步骤5)与步骤6)中生成得到的两组诊断报告对应的回报值。

进一步的，所述步骤8)中，使用策略梯度算法根据回报函数计算得到最终的梯度，并对语言生成模型进行优化，具体包括：

在策略梯度理论框架下，定义语言生成模型为Agent，环境则是每个时间步输入的单词与图像特征，语言生成模型的参数θ定义了一个策略p_θ，Agent与环境交互通过p_θ采样得到一个单词序列c^s，将生成的序列与相应的标签进行比较，通过回报函数计算便得到了奖励，以此来优化语言生成模型的参数。

进一步的，将损失定义为回报函数的负期望：

在策略梯度算法下，梯度

的计算过程如下：

其中，

为经过训练的目标检测模型，I为输入的超声图像，c、c^s分别表示标签与生成的单词序列，E表示期望的计算。

为了便于计算，通常可以使用单次采样的样本来近似计算，这时梯度为：

为了使训练更加稳定，添加基线来减少方差，这时的梯度为：

在当前参数下，通过回报函数计算测试时刻获得的序列和当前生成的序列，最终的梯度为：

本发明的优点及有益效果如下：

本发明创新点：1)提出了基于目标检测的特征提取方法。超声图像噪声较大，且不同对象的前景与背景的分界较为模糊，难以准确的识别超声图像中的对象及其位置信息。本发明结合目标检测算法协同视觉和类别信息，将病灶区域器官的位置检测出来，提取包含更多器官区域的特征，减少噪声和背景对识别的影响。2)构建多指标回报函数。现有的方法通常使用极大似然估计来训练，生成文本的对数似然分数和文本描述质量不太具有相关性。为了缓解这个问题，本发明使用多种评估文本质量的标准语法度量指标构建回报函数，克服了上述缺点。3)策略梯度优化。上述构建的多指标回报函数是离散和不可微分的，传统方法难以对其进行优化。本发明利用长短期记忆网络LSTM来解码特征，并使用策略梯度算法对不可微分的多指标回报函数进行优化，以达到生成的诊断报告在语法上越来越自然，语义上也越来越准确的目的。

附图说明

图1是本发明提供优选实施例的算法框架图；

图2为本发明的部分实验结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的技术方案是：

为了解决医学图像具有噪声大、不同对象的前景与背景的分界较为模糊，识别难度较大的问题。输入图像到目标检测模型中，预测器官区域的位置，根据预测出的位置信息可以提取出含有更多器官部分的特征编码。将提取到的特征编码输入到语言生成模型中，语言生成模型主要由长短期记忆网络LSTM组成，LSTM在每一个时刻解码特征编码并生成单词，最后将生成的单词组成一个句子序列即为最终输出的诊断报告。此外，用于评价文本质量的语法度量指标是离散的和不可微的，在此基础上构造了一个新的回报函数，并通过策略梯度算法对回报函数进行优化，训练的目的是最小化回报负期望，以获得更好的文本描述质量，使得诊断报告的病理信息准确且语法自然。

下面将详细说明本发明的技术方案：

一种超声图像诊断报告生成方法，包括：

步骤一：训练目标检测模型

获取原始的超声图像作为输入图像，输入到目标检测模型中，利用卷积神经网络从图像中提取特征，然后使用候选区域预测网络来生成区域预测，通过最小化区域位置和疾病信息的误差来优化目标检测模型，具体包括：

其中，i表示病灶区域推荐网络推荐的病灶区域编号，

表示平滑函数，

步骤二：提取特征编码

将超声图像输入到目标检测模型中，根据预测出的位置信息提取出器官区域部分的特征编码，定义为：

其中，

步骤三：语言生成模型定义与预训练

语言生成模型预训练的具体方法为：语言生成模型主要包含一个长短期记忆网络LSTM，将提取出的特征编码输入到语言生成模型中，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个诊断报告，将生成的诊断报告与诊断报告标签计算交叉熵损失从而优化语言生成模型，所述长短期记忆网络LSTM定义为：

i_t＝f_sigmoid(W_ivv_t+W_ihh_t-1)

g_t＝f_sigmoid(W_gvv_t+W_ghh_t-1)

o_t＝f_sigmoid(W_ovv_t+W_ohh_t-1)

m_t＝g_t⊙m_t-1+i_t⊙(W_mvv_t+W_mhh_t-1)

h_t＝o_t⊙f_tanh(m_t)

c_t＝f_softmax(h_t)

步骤四：构建多指标回报函数

构建多指标回报函数的具体方法为：使用多种评估文本质量的标准语法度量指标，分别计算生成的诊断报告与标签的值并加权求和，所述回报函数定义为：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

其中，B(·),M(·),R(·),C(·)分别代表Bleu,Meteor,Rouge and Cider,c^s为生成的诊断报告，c^*为对应的标签。

步骤五：获取采样生成得到的诊断报告

将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下采样生成的诊断报告，所述过程定义为：

c^s＝f_softmax(h_t)

其中，c^s为当前参数下采样生成的诊断报告。

步骤六：获取测试时刻得到的诊断报告

将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下测试时刻生成的诊断报告，过程定义为：

c^max＝argmaxp_θ(c^s∣v)

步骤七：回报函数的计算

将步骤5)与步骤6)中生成得到的两组诊断报告使用回报函数进行计算，具体包括：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

R(c^max)＝B(c^max,c^*)+M(c^max,c^*)+R(c^max,c^*)+C(c^max,c^*)

步骤八：策略梯度优化

使用策略梯度算法根据回报函数计算得到最终的梯度，并对语言生成模型进行优化，在策略梯度理论框架下，定义语言生成模型为Agent，环境则是每个时间步输入的单词与图像特征，语言生成模型的参数θ定义了一个策略p_θ，Agent与环境交互通过p_θ采样得到一个单词序列c^s，将生成的序列与相应的标签进行比较，通过回报函数计算便得到了奖励，以此来优化语言生成模型的参数。将损失定义为回报函数的负期望：

在策略梯度算法下，梯度

的计算过程如下：

其中，

若直接使用上式计算梯度，会带来高方差的问题。为了使训练更加稳定，可以添加基线来减少方差。这时的梯度为：

综上所述，本发明的创新和优势：

本发明提出的一种基于目标检测与多指标策略梯度优化的超声图像诊断报告生成方法，可以实现超声图像的诊断报告生成，生成的诊断报告具有语法上自然，语义上准确的特点。

本发明提出的一种基于目标检测与多指标策略梯度优化的超声图像诊断报告生成方法，结合目标检测算法协同视觉和类别信息，将病灶区域器官的位置检测出来，提取包含更多器官区域的特征，减少噪声和背景对识别的影响。

本发明提出的一种基于目标检测与多指标策略梯度优化的超声图像诊断报告生成方法，构建多指标回报函数，克服了现有的方法生成文本的对数似然分数和文本描述质量不太具有相关性这一问题。

本发明提出的一种基于目标检测与多指标策略梯度优化的超声图像诊断报告生成方法，使用策略梯度算法对不可微分的多指标回报函数进行优化。

[1]Hochreiter S,JüRgen A Schmidhuber.Long Short-Term Memory[J].NeuralComputation,1997.

[2]Papineni K,Roukos S,Ward T,et al.BLEU:a method for automaticevaluation of machine translation[C]//Proceedings of the 40th Annual Meetingon Association for Computational Linguistics.Association for ComputationalLinguistics,2002:311-318.

[3]Banerjee S,Lavie A.METEOR:An automatic metric for MT evaluationwith improved correlation with human judgments[C]//Proceedings of the ACLWorkshop on Intrinsic and Extrinsic Evaluation Measures for MachineTranslation and/or Summarization.2005:65-72.

[4]Lin C Y.Rouge:A package for automatic evaluation of summaries[C]//Text Summarization Branches Out.2004:74-81.

[5]Vedantam R,Lawrence Zitnick C,Parikh D.Cider:Consensus-based imagedescription evaluation[C]//Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition.2015:4566-4575.

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims

1.一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，包括以下步骤：

8)、使用策略梯度算法根据步骤7)中的回报函数计算得到最终的梯度，并对语言生成模型的网络参数进行优化。

2.根据权利要求1所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤1)中，获取原始的超声图像作为输入图像，输入到目标检测模型中，利用卷积神经网络从图像中提取特征，然后使用候选区域预测网络来生成区域预测，通过最小化区域位置和疾病信息的误差来优化目标检测模型，具体包括：

其中，i表示病灶区域推荐网络推荐的病灶区域编号，

表示推荐的病灶区域真实的病理信息，qi表示病灶区域检测模型计算得到的病理信息，t_i,j表示病灶区域检测模型计算得到的病灶区域位置补偿，

表示平滑函数，

3.根据权利要求2所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤2)中，将超声图像输入到目标检测模型中，根据预测出的位置信息提取出器官区域部分的特征编码，定义为：

其中，

4.根据权利要求3所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，在步骤3)中，所述语言生成模型预训练的具体方法为：语言生成模型主要包含一个长短期记忆网络LSTM，将提取出的特征编码输入到语言生成模型中，在每一个不同时刻解码特征编码并生成单词，最后将生成的单词组成一个诊断报告，将生成的诊断报告与诊断报告标签计算交叉熵损失从而优化语言生成模型，所述长短期记忆网络LSTM定义为：

i_t＝f_sigmoid(W_ivv_t+W_ihh_t-1)

g_t＝f_sigmoid(W_gvv_t+W_ghh_t-1)

o_t＝f_sigmoid(W_ovv_t+W_ohh_t-1)

c_t＝f_softmax(h_t)

5.根据权利要求4所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤4)中，构建多指标回报函数的具体方法为：使用多种评估文本质量的标准语法度量指标，分别计算生成的诊断报告与标签的值并加权求和，所述回报函数定义为：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

其中，B(·),M(·),R(·),C(·)分别代表Bleu[2],Meteor[3],Rouge[4]and Cider[5],c^s为生成的诊断报告，c^*为对应的标签。

6.根据权利要求5所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤5)将提取出的特征编码输入预训练后的语言生成模型中，得到在当前参数下采样生成的诊断报告，过程定义为：

c^s＝f_softmax(h_t)

其中，c^s为当前参数下采样生成的诊断报告；

c^max＝arg max p_θ(c^s∣v)

其中，c^max为当前参数下测试时刻得到的诊断报告，p_θ表示当前参数下的策略、v表示特征编码。

7.根据权利要求6所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤7)中，将步骤5)与步骤6)中生成得到的两组诊断报告使用回报函数进行计算，具体包括：

R(c^s)＝B(c^s,c^*)+M(c^s,c^*)+R(c^s,c^*)+C(c^s,c^*)

R(c^max)＝B(c^max,c^*)+M(c^max,c^*)+R(c^max,c^*)+C(c^max,c^*)

8.根据权利要求7所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，所述步骤8)中，使用策略梯度算法根据回报函数计算得到最终的梯度，并对语言生成模型进行优化，具体包括：

9.根据权利要求8所述的一种基于目标检测与策略梯度的超声图像诊断报告生成方法，其特征在于，将损失定义为回报函数的负期望：

在策略梯度算法下，梯度

的计算过程如下：

其中，

为经过训练的目标检测模型，I为输入的超声图像，c、c^s分别表示标签与生成的单词序列，E表示期望的计算；