CN114664404A - 一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 - Google Patents
一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 Download PDFInfo
- Publication number
- CN114664404A CN114664404A CN202210210339.9A CN202210210339A CN114664404A CN 114664404 A CN114664404 A CN 114664404A CN 202210210339 A CN202210210339 A CN 202210210339A CN 114664404 A CN114664404 A CN 114664404A
- Authority
- CN
- China
- Prior art keywords
- image
- fetal heart
- time step
- features
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
本发明公开了一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,本发明方法的核心步骤包括:首先对传入的一批胎儿心脏超声图像进行两种不同的数据增强,将增强的图像编码为特征表示;根据此特征的投影计算对比损失的同时,将此特征传入注意力模块中计算得到图像特征指导解码器解码生成句子;在每个时间步,解码器的输入都与前一个时间步的隐藏状态做多次交互,将交互之后的特征输入到LSTM进行解码操作,根据真实词和生成词计算交叉熵损失。训练完成之后,学到一个胎儿心脏超声图像诊断报告生成模型。将模型封装到系统,系统用此模型对图像进行推理,生成的报告显示在系统界面右下角。
Description
技术领域
本发明属于人工智能中的医学图像主题生成技术领域,涉及一种胎儿心脏超声图像诊断报告自动生成系统的实现方法。
背景技术
在人口越来越多的今天,新生儿的身体健康对人们非常重要,有许多胎儿出生就夭折,大多数都是死于先天性心脏疾病。因此,胎儿的心脏诊断至关重要,医生可以在孕妇怀孕期间时,通过超声图像了解胎儿的健康问题,并撰写对应的诊断报告。对于经验丰富的医生来说,撰写诊断报告这种简单的工作是很枯燥乏味的,对于经验不足的医生来说,这样的工作不仅枯燥乏味,而且容易出错。因此为胎儿心脏超声图像自动生成文本是一大便利,不仅能减少医生不必要的工作量,降低经验不足的医生出错的概率,还能降低患者等待的时间。
由于胎儿心脏超声图像具有纹理不清晰、噪声大、背景信息单一等特点,为胎儿心脏超声图像生成诊断报告具有很大的挑战。当胎儿心脏超声图像内存在多个目标时,如果形状不固定,由于胎儿心脏超声图像成像时的仪器角度不同,同一个器官在不同的图像上的大小、形状不一定一样,不同器官在同一个图中形状有可能一样,很难判断是否是同一个器官。相比于自然图像简洁明了的描述,胎儿心脏超声图像中很多诊断报告都比较长,偏向于模板化,且胎儿心脏超声图像大都是针对少量疾病类别的图像,图像间差异较小,单纯的监督学习方法不能很好的拟合数据真实的分布,以至于不能很好地获取图像中有用的信息。
发明内容
针对以上问题,提出了一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,此方法利用注意力机制来关注图像中的重点区域,并使用多次交互的方式对注意力进行增强,这有利于模型识别图像重点区域以及生成较长诊断报告的能力。同时,使用对比学习,将图像类间差异增大,类内差异减小,增强图像的表示能力,更好地获取图像中有用的信息,进而提升整体模型的性能。最后将模型封装到系统中,医生可以通过简单的交互式界面进行辅助诊断。
本发明旨在解决以上现有技术的问题,提出了一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,包括以下步骤:
1)将输入的胎儿心脏超声图像进行两种数据增强后编码为特征表示,根据特征计算对比损失
2)根据步骤1)得到的图像编码特征,使用注意力机制计算出全局图像特征和局部注意特征;
3)结合步骤2)得到的局部注意特征、图像对应真实句子的词向量和解码器上一个时间步的上下文向量得到新的特征;
4)将步骤3)得到的特征与解码器的隐藏状态进行交互,将交互后的输入和隐藏状态传入到解码器LSTM中;
5)将步骤2)计算得到的全局图像特征与解码器生成的当前时间步的隐藏状态一起传入到注意力块中,将注意力块生成的特征和解码器的隐藏状态使用GLU激活函数计算得到新的特征,称为上下文信息,利用上下文信息预测生成词,并根据真实词和生成词计算交叉熵损失
6)、循环步骤1)到步骤5)训练模型。
7)将步骤6)训练得到的模型封装到胎儿心脏超声图像诊断报告自动生成系统中。
本发明具有以下有益技术效果:
本发明提出的方法,可以利用注意力机制自动关注图像的重点区域,充分利用图像和句子模态间的高阶交互信息,并使用了一种多阶交互的方式来对注意力进行增强,减少上下文信息的丢失,使其能够解决部分诊断报告过长的问题。对于胎儿心脏超声图像大都是针对少量疾病类别的图像,图像间差异较小,类间差异与类内差异界限不明确的问题,使用对比学习思想,构建对比损失训练,让相似度高的样本接近,相似度低的样本远离,从而提高编码器对图像的表示能力,提高整体模型生成句子的准确性。更有效地辅助医生进行诊断。
附图说明
图1是本发明的总体框架图;
图2是构建对比损失的示意图;
图3是解码器端每个时间步工作的图。
图4是胎儿心脏超声图像诊断报告自动生成系统数据预处理的示意图。
图5是胎儿心脏超声图像诊断报告自动生成系统诊断超声图像的示意图。
图6是胎儿心脏超声图像诊断报告自动生成系统生成的诊断报告完整图。
图7是胎儿心脏超声图像诊断报告自动生成系统的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
如图1所示,一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,包括:
1)、构建胎儿心脏超声图像数据集,对训练的一批胎儿心脏超声图像进行必要的预处理操作。
2)、图像编码为特征表示。
3)、如图2所示,构建并计算对比损失。
4)、根据步骤2)得到的图像编码表示,使用注意力机制计算出全局图像特征和局部注意特征。
5)、结合步骤4)得到的局部注意特征、图像对应真实句子的词向量和解码器上一个时间步的上下文向量得到新的特征。
6)、如图3所示,将步骤5)得到的特征与解码器的隐藏状态进行交互,以减少上下文信息的丢失,更好地建模长距离语义。将交互后的输入和隐藏状态传入到解码器LSTM中。
7)、将步骤4)计算得到的全局图像特征与解码器生成的当前时间步的隐藏状态一起传入到注意力块中,以更好地利用图像信息和语义信息之间的高阶交互。将注意力块生成的特征和解码器的隐藏状态使用GLU激活函数计算得到新的特征,称为上下文信息。并利用上下文信息预测生成词。
8)、结合步骤3)的对比损失与步骤7)的预测词和真实词之间的交叉熵损失,训练模型。
9)、将训练好的模型封装到胎儿心脏超声图像诊断报告自动生成系统中,系统主要包括两个功能,分别是图像增强、生成报告;在使用系统时,首先选择性地对图像预处理,然后点击系统的生成报告按钮,系统会使用模型推理,生成对应胎儿心脏超声图像的诊断报告,显示到系统右下角,并且可以手动地保存报告与图像。
10)、系统使用包括:如图4所示,首先可以选择性的对图像进行预处理工作。预处理之后,如图5所示,传入图像,点击生成报告,系统会根据步骤2)、步骤4)、步骤5)、步骤6)、步骤7)进行推理,将生成的报告显示在系统右下角的框内。如图5所示,生成的诊断报告和图像一起保存到doc文档中,供用户打印。如图6所示,生成的诊断报告结果和图像一起保存到文件中。图7为使用系统生成图像对应诊断报告的流程图。
进一步的,所述步骤1)首先使用两种数据增强方法,对训练的一个批次大小为B的图像使用两种不同的数据增强方式增强得到新的图像{faug1(I1),...,faug1(IB),faug2(I1),...,faug2(IB)},数据增强方式faug1、faug2包括随机旋转、水平翻转、垂直翻转等方式。
进一步的,所述步骤2)的具体操作为:将步骤1)得到的增强后的图像当做新的一批图像,批次大小变为原来的两倍,将这些图像传入到编码器中,编码器采用了残差网络Resnet-101:
Vi=Resnet101(Ii)
其中τ是超参数温度系数,能调节对困难样本的关注程度,温度系数越小,越能将原始样本和最相似的负样本分开。sim(zi,zj)为zi,zj这两个特征向量的余弦相似度,计算公式如下所示:
总的对比损失函数为这一批图像的对比损失函数之和:
其中k∈[1,2,...,B],第k个图像和第k+B个图像为同一张图像的两种不同数据增强后的图像。l表示损失函数。
进一步的,从所述步骤4)开始,后面步骤所有的描述都是对于一副图像而言,一批图像中的其他图像操作同理。对于一批图像特征中的一个图像特征Vi做处理,得到注意力块的初始查询Q(0)、键K(0)、值V(0),Vi的值如步骤2)所示:
K(0)=Vi
V(0)=Vi
然后使用注意力机制计算得到图像注意力特征:
其中M为注意力块的叠加个数。每个注意力块的计算过程FX-Linear(K,V,Q),计算公式如下所示:
其中Wk、Wb、We、Wv、都是嵌入矩阵,ki表示第i个键,查询Q和每个键ki之间的联合双线性查询-键表示,σ为激活函数,Bs为变换后的双线性查询-键表示,为Bs的第i个元素,和表示嵌入的维度,βs为Bs的分布,为βs的第i个元素,为计算得到的全局通道描述符,βc为信道上的注意分布,vi为值序列V的第i个值,⊙表示元素乘积;
注意力块叠加的计算公式如下:
其中 表示嵌入矩阵,m={1,2,3,...,M+1},M表示叠加的注意模块个数。表示m个注意力块叠加之后得到的特征,表示初始键序列K(0)经过m个注意力块叠加之后得到K(m)的第i个元素,表示表示初始值序列V(0)经过m个注意力块叠加之后得到V(m)的第i个元素。
叠加注意力块M个后,得到全局图像特征vglobal和局部注意特征vatt如下:
进一步的,所述步骤5)中的具体细节为:对于解码器LSTM当前时间步t,根据步骤4)计算得到的局部注意特征vatt和当前时间步的词向量,解码器LSTM当前时间步的输入为:
xt=[vatt+c′t-1,et]
进一步的,所述步骤6)多次交互输入与隐藏状态的计算过程如下:
其中et是当前时间步的词向量,⊙代表元素乘积,c′t-1是上一个时间步的上下文信息。是嵌入矩阵,Dx,Dh是输入特征xt和隐藏状态ht-1的维度,xt与ht-1分别为当前输入特征和LSTM上一个时间步的隐藏状态,等同于xt,等同于ht-1。当t为0时,即第一个时间步的时候,h-1、c′-1为初始化。输入特征每次都与最新计算的隐藏状态的嵌入做元素乘积得到新的特征,隐藏状态每次都与最新计算的特征的嵌入做元素乘积得到新的隐藏状态。与为计算后最终的特征与隐藏状态。
多次交互后的输入特征和隐藏状态输入到解码器LSTM中:
其中ct表示LSTM第t个时间步的单元状态。
进一步的,所述步骤7)的具体操作为:将解码器当前时间步的隐藏状态ht作为注意力块的查询,步骤4)计算得到的图像全局特征vglobal同时作为键和值,传入到注意力块中计算得到新的特征使用全连接层调整的维度后与当前时间步的隐藏状态一起使用GLU激活函数,可以得到当前时间步的上下文信息c′t:
c′t=GLU([WdeFX-Linear(vglobal,vglobal,ht),ht])
其中Wde是嵌入矩阵,FX-Linear表示一个X-Linear注意力块的计算。
使用上下文信息预测当前时间步输出词向量的分布,即生成的向量中各个词所占的概率:
wt=Softmax(W|Σ|c′t)
其中W|Σ|是嵌入矩阵,|Σ|是词表的大小。最后直接取概率最大的词作为当前时间步的输出。
解码器LSTM工作过程中,第一个时间步的词向量代表的是一个“<start>”的特殊字符,最后一个时间步生成的词向量代表特殊字符“<end>”。重复步骤4)到步骤7)中生成词的过程,直到生成“<end>”为止,句子生成完毕。
训练的交叉熵损失函数如下所示:
进一步的,所述步骤8)的具体细节为:综合步骤3)和步骤7)的损失函数,构造整个模型训练的总损失函数。由于两个损失在训练中的重要性会有所区别,组合的总损失函数如下所示:
Lall=αLc+βL(θ)
其中超参数α和β为两个损失在训练中的权重。
进一步的,所述步骤9)将训练好的模型封装到胎儿心脏超声图像诊断报告自动生成系统中,用户在点击生成报告时,系统进行的操作为:首先使用Resnet101作为编码器提取图像的一组区域特征,通过注意模块得到全局特征和注意特征,注意特征在每个时间步与词嵌入向量、前一个时间步的上下文向量融合作为解码器的输入,在每个时间步,输入都与前一个时间步的隐藏状态做多次交互,以更好地获得前面时间步的信息,融合之后的特征和新的隐藏状态输入到LSTM解码,LSTM每个时间步的输出与图像全局特征经过注意模块计算并使用GLU激活函数得到上下文信息,上下文信息经过全连接层解码为预测的词。直到预测词为特殊字符“<end>”为止,推理过程结束。推理过程结束后,将所有生成的词组成句子,显示到系统界面中。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (8)
1.一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,其特征在于,包括以下步骤:
1)将输入的胎儿心脏超声图像进行两种数据增强后编码为特征表示,根据特征计算对比损失;
2)根据步骤1)得到的图像编码特征,使用注意力机制计算出全局图像特征和局部注意特征;
3)结合步骤2)得到的局部注意特征、图像对应真实句子的词向量和解码器上一个时间步的上下文向量得到新的输入特征;
4)将步骤3)得到的输入特征与解码器的隐藏状态进行交互,将交互后得到的新的输入特征和新的隐藏状态传入到解码器LSTM中;
5)将步骤2)计算得到的全局图像特征与解码器生成的当前时间步的隐藏状态一起传入到注意力块中,将注意力块生成的特征和解码器的隐藏状态使用GLU激活函数计算得到新的特征,称为上下文信息,利用上下文信息预测生成词,并根据真实词和生成词计算交叉熵损失;
6)、循环步骤1)到步骤5)训练模型;
7)将步骤6)训练得到的模型封装到胎儿心脏超声图像诊断报告自动生成系统中。
2.根据权利要求1所述一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,其特征在于:步骤1)所述将输入图像编码为特征表示,同时计算对比损失。
3.根据权利要求2所述一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,其特征在于:步骤2)所述使用注意力机制计算出全局图像特征vglobal和局部注意特征vatt。
4.根据权利要求1所述一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,其特征在于:所述步骤3)具体为:对于解码器LSTM当前时间步t,根据局部注意特征vatt和当前时间步的词向量,得到解码器LSTM当前时间步的输入xt。
8.根据权利要求1所述一种胎儿心脏超声图像诊断报告自动生成系统的实现方法,其特征在于:所述步骤7)将训练好的模型封装到系统中,系统主要包括两个功能,分别是图像增强、生成报告;在使用系统时,首先选择性地对图像预处理,然后点击系统的生成报告按钮,系统会使用模型推理,生成对应胎儿心脏超声图像的诊断报告,显示到系统右下角,并且可以手动地保存报告与图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210210339.9A CN114664404A (zh) | 2022-03-04 | 2022-03-04 | 一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210210339.9A CN114664404A (zh) | 2022-03-04 | 2022-03-04 | 一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114664404A true CN114664404A (zh) | 2022-06-24 |
Family
ID=82026976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210210339.9A Pending CN114664404A (zh) | 2022-03-04 | 2022-03-04 | 一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114664404A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117292782A (zh) * | 2023-06-08 | 2023-12-26 | 王其景 | 一种电子报告自动生成的方法及系统 |
-
2022
- 2022-03-04 CN CN202210210339.9A patent/CN114664404A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117292782A (zh) * | 2023-06-08 | 2023-12-26 | 王其景 | 一种电子报告自动生成的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230092027A1 (en) | Method and apparatus for training medical image report generation model, and image report generation method and apparatus | |
He et al. | Pathvqa: 30000+ questions for medical visual question answering | |
CN110111864B (zh) | 一种基于关系模型的医学报告生成系统及其生成方法 | |
CN112614561A (zh) | 一种基于层级自注意力序列编码的脑ct医学报告生成方法 | |
CN112309528B (zh) | 一种基于视觉问答方法的医疗影像报告生成方法 | |
CN115293128A (zh) | 基于多模态对比学习放射学报告生成模型训练方法及系统 | |
CN113140023B (zh) | 一种基于空间注意力的文本到图像生成方法及系统 | |
CN112069827B (zh) | 一种基于细粒度主题建模的数据到文本生成方法 | |
CN113408430A (zh) | 基于多级策略和深度强化学习框架的图像中文描述系统及方法 | |
CN111144410A (zh) | 一种跨模态的图像语义提取方法、系统、设备及介质 | |
CN112948505A (zh) | 一种实体关系分类的模型构建方法、设备及存储介质 | |
Gajbhiye et al. | Automatic report generation for chest x-ray images: a multilevel multi-attention approach | |
CN112052889A (zh) | 基于双门控递归单元解码的喉镜图像识别方法 | |
CN116822534A (zh) | 基于细粒度特征的机翻评估指标的解释方法、解释器模型及计算机可读存储介质 | |
CN115690245A (zh) | 一种基于属性驱动gan的文本生成图像的方法 | |
CN117352121A (zh) | 一种医学影像报告的生成方法及装置 | |
CN114664404A (zh) | 一种胎儿心脏超声图像诊断报告自动生成系统的实现方法 | |
CN112216379A (zh) | 一种基于智能联合学习的疾病诊断系统 | |
CN117333462A (zh) | 一种基于肝脏属性分析的超声诊断智能交互系统 | |
CN115964475A (zh) | 一种用于医疗问诊的对话摘要生成方法 | |
CN115659991A (zh) | 一种基于共现关系分层注意力的脑ct医学报告自动生成方法 | |
CN115588486A (zh) | 一种基于Transformer的中医诊断生成装置及其应用 | |
CN115422388A (zh) | 一种视觉对话方法及系统 | |
CN112562819B (zh) | 一种针对先心病的超声多切面数据的报告生成方法 | |
Huang et al. | An annotation model on end-to-end chest radiology reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |