CN108376558B - 一种多模态核磁共振影像病历报告自动生成方法 - Google Patents
一种多模态核磁共振影像病历报告自动生成方法 Download PDFInfo
- Publication number
- CN108376558B CN108376558B CN201810069685.3A CN201810069685A CN108376558B CN 108376558 B CN108376558 B CN 108376558B CN 201810069685 A CN201810069685 A CN 201810069685A CN 108376558 B CN108376558 B CN 108376558B
- Authority
- CN
- China
- Prior art keywords
- image
- network
- term memory
- long
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000005481 NMR spectroscopy Methods 0.000 title claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 51
- 230000015654 memory Effects 0.000 claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 3
- 230000011218 segmentation Effects 0.000 claims description 18
- 230000007787 long-term memory Effects 0.000 claims description 10
- 230000006403 short-term memory Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 238000003709 image segmentation Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000265 homogenisation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 2
- 239000003550 marker Substances 0.000 claims 1
- 238000004195 computer-aided diagnosis Methods 0.000 abstract description 4
- 230000000306 recurrent effect Effects 0.000 abstract description 4
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 238000003745 diagnosis Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 8
- 210000004556 brain Anatomy 0.000 description 6
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 210000001154 skull base Anatomy 0.000 description 3
- 210000004885 white matter Anatomy 0.000 description 3
- 210000000133 brain stem Anatomy 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000002683 foot Anatomy 0.000 description 2
- 210000001652 frontal lobe Anatomy 0.000 description 2
- 208000029824 high grade glioma Diseases 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 201000011614 malignant glioma Diseases 0.000 description 2
- 231100000915 pathological change Toxicity 0.000 description 2
- 230000036285 pathological change Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000001103 thalamus Anatomy 0.000 description 2
- 208000024806 Brain atrophy Diseases 0.000 description 1
- 206010019909 Hernia Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004289 cerebral ventricle Anatomy 0.000 description 1
- 210000000877 corpus callosum Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 210000004744 fore-foot Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000003140 lateral ventricle Anatomy 0.000 description 1
- 210000005240 left ventricle Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000013421 nuclear magnetic resonance imaging Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Image Analysis (AREA)
Abstract
本发明属于医疗数据分析与智能处理技术领域,具体是一种多模态核磁共振影像病历报告自动生成方法。本发明采用深度学习模型,其中,在使用卷积神经网络提取影像特征的基础上引入注意力矩阵,通过点乘运算给不同位置的特征赋予不同的权重,得到不同注意力下的影像特征;接着使用一个长短期记忆循环神经网络,根据不同注意力下的影像特征生成病历报告中每个句子的主题向量;再使用另一个长短期记忆循环神经网络,根据句子的主题向量生成每一个词;然后将这些词连接起来得到最后的病历报告。本发明在没有病历模版的情况下自动生成医学影像的病历中的描述文本,对缓解放射科医生的工作以及搭建智能化的计算机辅助诊断系统有着深远的意义。
Description
技术领域
本发明属于医疗数据分析与智能处理技术领域,具体涉及为核磁共振影像自动生成自然语言形式病历报告的方法。
背景技术
根据2017年中国医学科学院肿瘤医院院长、国家癌症中心主任、中国科学院郝捷院士在放射肿瘤学学术年会上就《中国肿瘤的现状和趋势》的发言,可以发现,我国现在的肿瘤死亡率高于全球平均水平的17%,其原因包括缺乏有效的肿瘤筛查机制、缺乏高效且均质化的肿瘤诊疗体系,阻碍了患者的早期诊断以及有效的后期治疗。精准医疗以及基于计算机和大数据的医疗影像辅助诊断系统发挥着重要的作用。为了解决医学影像自动化诊断的问题,本发明通过收集影像及其诊断报告数据,并使用先进的大数据和深度学习的技术,让计算机学习放射科专家的影像诊断技术来自动撰写最终的病历报告。与人工撰写相比,这种方法能够更加稳定且高效地完成影像的自动诊断;同时通过将该病例报告自动生成系统应用于基层医院,可以从一定程度上解决诊疗技术的均质化问题。
本发明针对的影像检查方式是核磁共振成像技术。核磁共振是磁矩不为零的原子核,在外磁场作用下自旋能级发生塞曼分裂,共振吸收某一定频率的射频辐射的物理过程。与电子计算断层扫描技术(CT)技术相比,这种技术更加健康,因此也越来越成为常用的成像检查方式。本发明需要收集患者脑部的Flair,T1,T2和T2ce四种模态的核磁共振影像,并根据这些影像数据自动生成病例报告。
通过对四个模态的影像特征的分析,能发现有意义的模式,指导计算机自动生成报告,包括信号的特点、组织结构的情况以及初步诊断结果。传统的方法,通过影像特征分析得到病历属性的分类情况,需要针对每一个属性使用单独模型进行运算,而且得到的结果不是可读的文本,缺乏相关性排序。因此,需要有一个能够端到端地解决影像诊断病历报告的生成的技术,并就不同的影像对报告进行相应的组织,从而使得影像辅助诊断系统更加智能,更加稳定。
本发明针对多模态的核磁共振影像数据,提出一种基于深度学习的影像报告自动生成的方法。首先,将四种模态的影像按照预定义的方式分成不同的小块,使用U-Net卷积神经网络自动提取影像特征;接着将赋予了不同注意力的影像特征输入到一个长短期记忆网络中得到病例报告中每个句子的主题向量;最后根据这个主题向量使用第二个长短期记忆网络生成完整的句子。将这些句子组合起来就得到了初步的病历报告结果。本发明方法通过深度学习的技术,在没有病历模版的情况下自动生成医学影像的病历报告,对缓解放射科医生的工作以及搭建智能化的计算机辅助诊断系统有着深远的意义。
发明内容
本发明的目的在于提供一种根据多模态核磁共振影像自动生成自然语言形式病历报告的方法。
本发明方法通过结合卷积神经网络提取医学影像特征,以及循环神经网络生成文本序列,在没有病历模版的情况下自动生成医学影像的病历中的描述文本,优点在于能够自动提取影像特征并生成自然语言形式的病历报告,不需要人工干预。
本发明提供的根据多模态核磁共振影像自动生成自然语言形式病历报告的方法,其核心是能够通过自动提取多模态医学影像中不同位置的特征来指导涉及多个主题的病历报告的生成。为此,本发明中的深度学习模型,在使用卷积神经网络提取影像特征的基础上引入了注意力矩阵,通过点乘运算给不同位置的特征赋予不同的权重,得到不同注意力下的影像特征。接着使用一个长短期记忆循环神经网络,根据不同注意力下的影像特征来生成病历报告中每个句子的主题向量;再使用另一个长短期记忆循环神经网络,根据句子的主题向量来生成每一个词。将这些词连接起来就得到最后的病历报告。本发明方法通过结合卷积神经网络提取医学影像特征,以及循环神经网络生成文本序列,在没有病历模版的情况下自动生成医学影像的病历中的描述文本,对缓解放射科医生的工作以及搭建智能化的计算机辅助诊断系统有着深远的意义。
本发明提供的多模态核磁共振影像病历报告自动生成方法,是基于深度神经网络完成的,具体步骤为:
(1)影像预处理:由于核磁共振影像的偏差场扭曲问题,首先使用N4ITK方法(N.J.Tustison et al.,“N4ITK:Improved n3bias correction,”IEEE Trans.Med.Imag.,vol.29,no.6,pp.1310–1320,Jun.2010.)来进行矫正。其次,由于在不同患者或者不同时间点上得到的核磁共振影像无法保证同一模态在相同的组织上有着相同的亮度分布,还采用了Nyul(L.G.Nyúl,J.K.Udupa,and X.Zhang,“New variants of a method of MRI scalestandardization,”IEEE Trans.Med.Imag.,vol.19,no.2,pp.143– 150,Feb.2000.)等人提出的亮度均一化方法进行处理。
(2)深度神经网络的配置:神经网络模型包括提取影像特征的卷积神经网络、用于生成每个句子主题向量的长短期记忆网络以及用于生成完整句子的长短期记忆网络:
(2.0)卷积神经网络提取影像特征:首先将每一张图像分成不同的小块,即影像可以表示为使用U-Net结构(Ronneberger,Olaf,Philipp Fischer,and ThomasBrox."U-net:Convolutional networks for biomedical image segmentation." InInternational Conference on Medical Image Computing and Computer-Assisted In-tervention,pp.234-241.Springer,Cham,2015)对每个小块进行病灶分割任务,并以网络最后一个3×3卷积层的输出作为这个小块的特征。由此得到影像对应的特征为
以保证在所有位置出的注意力系数的总和为1;
(2.2)使用长短期记忆网络生成主题序列:每一个时间步s,通过步骤(2.1)所述方法得到影像特征,作为该时刻的长短期网络的输入,得到输出的隐藏状态则该时刻对应的主题向量为在计算主题向量的同时,还需要计算停止的概率:
当该估计值超过一定的阈值时,停止产生句子;
(2.3)使用长短期记忆网络生成完整的句子:使用主题向量和特殊的start标记作为网络初始两个时间步的输入,在之后的时间步中,以前一个时间步的隐藏状态作为输入(J.Krause,J.Johnson,R.Krishna,and L.Fei-Fei.A hierarchical approach forgenerating descriptive image paragraphs.In The IEEE Conference on ComputerVision and Pattern Recognition(CVPR),July 2017)。在每一个时间步上通过:
得到用来预测该位置处的词向量(这里使用One-Hot编码的方式编码词向量),即可得到每一个词语。
(3)初始化模型的参数:
(3.1)在U-Net卷积神经网络中需要初始化每个卷积层的权重和偏置;
(3.2)在计算添加了注意力的影像特征时,需要初始化Watt,Wv,Wh;
(3.3)生成主题向量的长短期记忆网络中,需要初始化长短期记忆网络中输入门、遗忘门和输出门对应的权重参数,以及生成主题向量时权重Wt,sent和Wt,ctx,判断是否停止需要的权重WSTOP,WSTOP,s-1和WSTOP,s;
(3.4)生成完整句子的长短期记忆网络中,相应地输入门、遗忘门和输出门的权重参数,以及转换为词向量时的Wout参数。
(4)迭代优化参数:通过随机梯度下降算法,对网络参数进行优化。
步骤(4)中,所述对网络参数进行优化,具体流程为:
(4.0)首先使用完整的U-Net卷积网络进行影像分割的训练。对每一个输入的影像区域 In,计算得到预测的分割结果,并与实际的分割结果比较得到误差E。计算误差E相对每个卷积操作权重的梯度值,并用该梯度值乘上学习率(模型超参)作为参数的更新值。按上述过程迭代直至误差变化小于一定的值;
(4.1)使用上述训练好的模型,去掉最后一层计算分割结果的卷积层。将计算得到的初步影像特征按(2)中所述的方法,经过注意力矩阵和两个长短期记忆网络得到预测的词向量。模型的误差包括分割任务的误差,主题生成的长短期记忆网络中判断停止的概率误差以及与目标的词向量(这里使用One-Hot编码的方式表示词向量)之间的误差。按下式:
计算最终的误差E。再分别计算误差与Wv, Watt,W,Wh,Wt,sent,Wt,ctx,WSTOP,WSTOP,s-1,WSTOP,S,Wout,以及长短期记忆网络中与其他门结构(输入门、遗忘门和输出门)相关参数的梯度,使用对应的学习率来控制参数的更新值。通过若干次迭代,直到误差变化小于一定阈值,停止训练。这里,Watt为注意力矩阵的系数;Wv和Wh分别为注意力机制中视觉信息和语义信息的权重;Wt,sent和Wt,ctx为生成主题向量时对应长短期记忆网络隐状态和上下文信息的系数,WSTOP,WSTOP,s-1,WSTOP,S分别为用于计算是否停止产生句子时的系数,Wout为第二个长短期记忆网络的隐层状态转为词向量时的系数。
本发明方法通过结合卷积神经网络提取医学影像特征,以及循环神经网络生成文本序列,在没有病历模版的情况下自动生成医学影像的病历中的描述文本,对缓解放射科医生的工作以及搭建智能化的计算机辅助诊断系统有着深远的意义。
附图说明
图1为本发明所提出的方法模型结构图。其中,“病历文本”示例为左侧丘脑、大脑脚及脑干大片不规则异常信号,边界尚清,范围约39*38*32mm,T1WI flair为高低混杂信号,高信号为主,T2WI为高信号,T1WI病灶内部呈中等信号,外份呈低信号,增强后病灶不均匀明显强化,实性部分明显不均匀强化,囊性部分无强化。左侧脑室、三脑室受压。脑中线结构向右移位约10mm。鞍区结构未见特殊。颅底结构、信号无病理性变化。左侧丘脑、左侧大脑脚及脑干左份囊实性占位,考虑MT,高级别胶质瘤可能。大脑廉下疝形成。
图2为影像数据示例。其中,(a)Flair模态,(b)T1模态,(c)T1ce模态,(d)T2 模态。
图3为病灶分割结果示例。其中,(a)Flair模态分割结果,(b)T1模态分割结果,(c)T1ce模态分割结果,(d)T2模态分割结果。
具体实施方式
下面展示该方法的具体实施方式:
(1)数据预处理
(1.1)影像数据:使用N4ITK和Nyul两种方法对影像的亮度进行调整,得到如图1所示的结果;将影像分成44*44*20的若干相邻区域,对于每个区域提取132*132*108的小块,即在三个方向上增加44的填充(对于原影像边界外的区域用0填充);对影像分割结果的ground truth按44*44*20的区域进行分割。(注:为了增加训练集大小,可以使 44*44*20的区域存在重叠)
(1.2)文本数据:1)将文本中重复的空格和标点符号去除;2)将文本以句号为标志,处理为以句为单位的样本。3)使用FoolNLTK对文本进行分词,并使用gensim得到词典和词向量模型(设定向量的维度为512)。例如['颅底','结构','、','信号','无病','理性','变化'],‘形态’依次可以转成如下向量的形式:
(2)初始化模型的参数:
(2.1)在U-Net卷积神经网络中使用Xavier的方法初始化每个卷积层的权重和偏置;
(2.2)在计算添加了注意力的影像特征时,需要初始化Watt,Wv,Wh;
(2.3)生成主题向量的长短期记忆网络中,需要初始化长短期记忆网络中输入门、遗忘门和输出门对应的权重参数,以及生成主题向量时权重Wt,sent和Wt,ctx,判断是否停止需要的权重WSTOP,WSTOP,s-1和WSTOP,s;
(2.4)生成完整句子的长短期记忆网络中,相应地输入门、遗忘门和输出门的权重参数,以及转换为词向量时的Wout参数。
(3)模型训练,迭代优化参数:通过随机梯度下降算法,对网络参数进行优化;具体流程为:
(3.0)UNet卷积网络的训练:首先使用完整的U-Net卷积网络进行影像分割的训练。对每一个输入的影像区域In,网络最后一层Convolution和Softmax函数会将提取的特征转化属于某一个类别(具体为影像背景-类0、正常组织-类3、水肿部分-类1、坏死部分-类2 和生长部分-类4)的概率。例如,网络某个输出的概率向量为[0.1657,0.1830,0.1455,0.3676,0.1382],则网络对该位置处组织的预测为类3正常组织。对于这个样本计算均方误差为:
(0.1657-0)2+(0.1830-0)2+(0.1455-0)2+(0.3676-1)2+(0.1382-0)2=0.50114474
使用该误差计算参数的梯度,乘上对应的学习率(初始化为0.03,每个30个迭代乘0.1)。按上述过程迭代直至误差变化小于一定的值。
(3.1)获得影像的特征:使用上述训练好的模型,提取网络最后两层(Convolution和 Softmax)得到图像的特征(R64×44×44×20,其中64是每个位置的特征向量)。对于一个 240×240×155的影像,使用预处理部分介绍的方法可以得到288个patch。因此这个影像对应的特征为288×64×44×44×20。
(3.2)添加注意力:由于需要和第一个长短期记忆网络结合,因此需要先初始化第一个长短期记忆网络,具体为初始化第一个时间步的隐藏状态(R512×1)使用一个 64×44×44×20×512的矩阵将前一步提取的每个区域的图像特征转化为和长短期记忆网络输入维度一致的向量。继而经过一个全联接层和Softmax函数得到对应这个区域的注意力矩阵(R64×44×44×20)。使用这个注意力矩阵点乘影像特征的矩阵,并对所有的小块求和,得到具有注意力的矩阵。
(3.3)生成主题向量:对上一步得到的矩阵,使用512×64×44×44×20得到维度为512 的向量,作为第一个时间步的输入状态。每一个时间步将得到维度为512的输出向量,结合该时间步对应的影像输入经过全联接和tanh之后得到最终的主题向量(R512×1)。注意,前一个时间步的输出也将作为注意力机制的输入,更新之后的影像特征作为下一个时间步的输入。其次,使用相邻两个时间步的主题向量经过另一个全链接和tanh激活层的结构得到是否停止产生句子的概率预测。这里将阈值设为0.5,如果概率小于0.5则停止生成,否则继续生成下一个值。将病历文本最多句子数量设为6个,得到一个6维的向量,计算其与实际文本的平方误差。如果预测值为[0.3254,0.1263,0.3318,0.9163,0.7134,0.6178],对应的实际样本为[0,0,0,0,1,1],则对应的误差为:
(0.3254-0)2+(0.1263-0)2+(0.3318-0)2+(0.9163-0)2+(0.7134-1)2+ (0.6178-1)2=1.29975018
(3.4)生成每个词:将上一步得到的主题向量(R512×1)作为第二个长短期记忆网络第一个时间步的输入,每个时间步的输出设为512维,与该语料中的词进行距离的比较,来获得对该位置处的词的预测并将距离差作为该网络的误差。上述过程中的三个误差部分(卷积网络和两个长短期记忆网络)赋予不同的权重,并进行多任务的训练。将分割部分误差的权重设为0.3,主题停止预测误差的权重设为0.3,生成词的误差对应的权重设为0.4,作为多任务的误差。
(3.5)通过将词模型生成的词的预测用句号拼接,可以得到类似如下结果的病历文本:右侧额叶大片不规则异常信号,边界尚清,范围约62*72*59mm,T2WI flair病灶为稍高信号,周围白质片状高信号,T2WI病灶内部呈稍低信号,边缘呈稍高信号,周围白质片状稍高信号,T1WI病灶内部呈稍低信号,边缘呈稍高信号,周围白质片状稍低信号,增强后病灶不均匀明显强化。胼胝体、侧脑室前脚受压。中线结构左移约16mm范围。脑室系统扩大。脑池及脑沟形态、大小、信号未见异常。鞍区结构未见特殊。颅底结构、信号无病理性变化。右侧额叶跨中线囊实性占位,考虑MT,高级别胶质瘤可能。脑萎缩。
通过本发明方法,使用卷积神经网络自动提取多模态影像的特征,并结合注意力机制,使用长短期记忆网络来生成主题向量;将主题向量输入到另一个长短期记忆网络生成完整句子,最后得到一份自然语言形式的病历报告。相比于传统使用分类的方法得到不同的属性取值有着较大的突破;并且该方法通过学习优质的影像报告将为搭建智能化的影像诊断辅助系统,甚至解决诊疗技术非均质性问题提供有效的途径。
Claims (2)
1.一种多模态核磁共振影像病历报告自动生成方法,是基于深度神经网络完成的,其特征在于,具体步骤为:
(1)影像预处理:包括,对于核磁共振影像的偏差场扭曲问题,使用N4ITK方法来进行矫正;对于不同患者或者不同时间点上得到的核磁共振影像无法保证同一模态在相同的组织上有着相同的亮度分布问题,采用亮度均一化方法进行处理;
(2)深度神经网络的配置:神经网络模型包括提取影像特征的卷积神经网络、用于生成每个句子主题向量的长短期记忆网络以及用于生成完整句子的长短期记忆网络;
(2.0)用卷积神经网络提取影像特征:首先将每一张图像分成不同的小块,即把影像表示为使用U-Net卷积神经网络对每个小块进行病灶分割任务,并以网络最后一个3×3卷积层的输出作为这个小块的特征,由此得到影像对应的特征:
(2.2)使用长短期记忆网络生成主题序列:每一个时间步s,通过步骤(2.1)得到的影像特征,作为该时间步的长短期记忆网络的输入,得到输出的隐藏状态该时间步对应的主题向量为在计算主题向量的同时,还计算停止的概率当停止的概率P超过一定的阈值时,停止产生句子;
(3)初始化模型的参数,包括:
(3.1)在U-Net卷积神经网络中初始化每个卷积层的权重和偏置;
(3.2)在计算添加了注意力的影像特征时,初始化Watt,Wv,Wh;
(3.3)生成主题向量的长短期记忆网络中,初始化长短期记忆网络中输入门、遗忘门和输出门对应的权重参数,以及生成主题向量时权重和Wt,ctx,判断是否停止需要的权重WSTOP,WSTOP,s-1和WSTOP,S;
(3.4)生成完整句子的长短期记忆网络中,相应地输入门、遗忘门和输出门的权重参数,以及转换为词向量时的Wout参数;
(4)迭代优化参数:通过随机梯度下降算法,对网络参数进行优化。
2.根据权利要求1所述的多模态核磁共振影像病历报告自动生成方法,其特征在于,步骤(4)中所述对网络参数进行优化,具体流程为:
(4.0)首先使用完整的U-Net卷积网络进行影像分割的训练;对每一个输入的影像区域In,计算得到预测的分割结果,并与实际的分割结果比较得到误差E;计算误差E相对每个卷积操作权重的梯度值,并用该梯度值乘上学习率作为参数的更新值;按上述过程迭代直至误差变化小于一定的值;
(4.1)使用上述训练好的模型,去掉最后一层计算分割结果的卷积层;将计算得到的初步影像特征按步骤(2)中所述的方法,经过注意力矩阵和两个长短期记忆网络得到预测的词向量;模型的误差包括分割任务的误差,主题生成的长短期记忆网络中判断停止的概率误差以及与目标的词向量之间的误差;按下式:
计算最终的误差E;再分别计算误差与Watt,Wv,Wh,Wt,sent,Wt,ctx,WsTOP,WSTOP,s-1,WSTOP,S,Wout以及卷积网络参数和长短期记忆网络参数的梯度,使用对应的学习率来控制参数的更新值;通过若干次迭代,直到误差变化小于一定阈值,停止训练;
使用该训练的模型,输入患者四个模态的影像,即得到自然语言的病历报告以及病灶分割结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810069685.3A CN108376558B (zh) | 2018-01-24 | 2018-01-24 | 一种多模态核磁共振影像病历报告自动生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810069685.3A CN108376558B (zh) | 2018-01-24 | 2018-01-24 | 一种多模态核磁共振影像病历报告自动生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108376558A CN108376558A (zh) | 2018-08-07 |
CN108376558B true CN108376558B (zh) | 2021-08-20 |
Family
ID=63016756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810069685.3A Active CN108376558B (zh) | 2018-01-24 | 2018-01-24 | 一种多模态核磁共振影像病历报告自动生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108376558B (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190619A (zh) * | 2018-08-23 | 2019-01-11 | 重庆大学 | 一种基于目标掩膜的图像描述方法 |
CN109191472A (zh) * | 2018-08-28 | 2019-01-11 | 杭州电子科技大学 | 基于改进U-Net网络的胸腺细胞图像分割方法 |
CN109065128A (zh) * | 2018-09-28 | 2018-12-21 | 郑州大学 | 一种加权图正则化稀疏脑网络构建方法 |
CN109545302B (zh) * | 2018-10-22 | 2023-12-22 | 复旦大学 | 一种基于语义的医学影像报告模板生成方法 |
CN109509178B (zh) * | 2018-10-24 | 2021-09-10 | 苏州大学 | 一种基于改进的U-net网络的OCT图像脉络膜分割方法 |
CN109528196B (zh) * | 2018-11-14 | 2022-07-01 | 北京工业大学 | 一种肝静脉压力梯度无创性评估方法 |
CN110009598B (zh) * | 2018-11-26 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 用于图像分割的方法和图像分割设备 |
CN109727270B (zh) * | 2018-12-10 | 2021-03-26 | 杭州帝视科技有限公司 | 心脏核磁共振图像的运动机理和纹理特征分析方法和系统 |
CN109887606B (zh) * | 2019-02-28 | 2022-10-18 | 莫毓昌 | 一种基于注意力的双向递归神经网络的诊断预测方法 |
US11210547B2 (en) * | 2019-03-20 | 2021-12-28 | NavInfo Europe B.V. | Real-time scene understanding system |
CN109961834B (zh) * | 2019-03-22 | 2023-06-27 | 上海联影医疗科技股份有限公司 | 影像诊断报告的生成方法及设备 |
CN110135427B (zh) * | 2019-04-11 | 2021-07-27 | 北京百度网讯科技有限公司 | 用于识别图像中的字符的方法、装置、设备和介质 |
CN109871838B (zh) * | 2019-04-18 | 2019-11-05 | 电子科技大学 | 基于级联深度网络的阿尔茨海默症病灶脑区的提取方法 |
CN110148195B (zh) * | 2019-05-22 | 2023-05-05 | 山东颐邦齐鲁医生集团管理有限公司 | 一种磁共振图像生成方法、系统、终端及存储介质 |
CN110559007A (zh) * | 2019-07-23 | 2019-12-13 | 北京赛迈特锐医疗科技有限公司 | 头颅ct平扫影像智能诊断系统及其诊断方法 |
CN112397159B (zh) * | 2019-08-19 | 2024-03-22 | 金色熊猫有限公司 | 临床试验报告自动录入方法及装置、电子设备、存储介质 |
TWI793391B (zh) * | 2019-12-27 | 2023-02-21 | 廣達電腦股份有限公司 | 醫療影像辨識系統及醫療影像辨識方法 |
CN111476772B (zh) * | 2020-04-03 | 2023-05-26 | 推想医疗科技股份有限公司 | 基于医学影像的病灶分析方法和装置 |
CN112242185A (zh) * | 2020-09-09 | 2021-01-19 | 山东大学 | 基于深度学习的医学图像报告自动生成方法及系统 |
CN112150449B (zh) * | 2020-09-29 | 2022-11-25 | 太原理工大学 | 一种脑卒中病灶分割方法和系统 |
CN112164446B (zh) * | 2020-10-13 | 2022-04-22 | 电子科技大学 | 一种基于多网络融合的医疗影像报告生成方法 |
CN112529857B (zh) * | 2020-12-03 | 2022-08-23 | 重庆邮电大学 | 基于目标检测与策略梯度的超声图像诊断报告生成方法 |
US11610306B2 (en) | 2020-12-16 | 2023-03-21 | Industrial Technology Research Institute | Medical image analysis method and device |
CN112863648B (zh) * | 2020-12-31 | 2022-08-26 | 四川大学华西医院 | 脑肿瘤术后mri多模态输出系统及方法 |
CN113159134A (zh) * | 2021-03-29 | 2021-07-23 | 宁波市科技园区明天医网科技有限公司 | 基于乳腺结构化报告的智能化诊断评估方法 |
CN113096796B (zh) * | 2021-04-01 | 2022-09-02 | 四川大学华西医院 | 脑出血血肿扩大风险智能化预测系统及方法 |
CN113470777B (zh) * | 2021-06-04 | 2024-04-09 | 江苏大学 | 一种肿瘤辅助诊断报告生成方法、装置、电子设备、存储介质 |
CN114550915A (zh) * | 2022-02-22 | 2022-05-27 | 深圳市医未医疗科技有限公司 | 一种在影像诊断中自动生成报告的方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650756A (zh) * | 2016-12-28 | 2017-05-10 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于知识迁移的多模态循环神经网络的图像文本描述方法 |
CN107169035A (zh) * | 2017-04-19 | 2017-09-15 | 华南理工大学 | 一种混合长短期记忆网络和卷积神经网络的文本分类方法 |
CN107391609A (zh) * | 2017-07-01 | 2017-11-24 | 南京理工大学 | 一种双向多模态递归网络的图像描述方法 |
CN107463786A (zh) * | 2017-08-17 | 2017-12-12 | 王卫鹏 | 基于结构化报告模板的医学影像知识库建立方法 |
CN107480206A (zh) * | 2017-07-25 | 2017-12-15 | 杭州电子科技大学 | 一种基于多模态低秩双线性池化的图像内容问答方法 |
CN107608943A (zh) * | 2017-09-08 | 2018-01-19 | 中国石油大学(华东) | 融合视觉注意力和语义注意力的图像字幕生成方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096225B (zh) * | 2014-05-13 | 2019-10-22 | 深圳华大生命科学研究院 | 辅助疾病诊疗的分析系统、装置及方法 |
US9881208B2 (en) * | 2016-06-20 | 2018-01-30 | Machine Learning Works, LLC | Neural network based recognition of mathematical expressions |
CN107038336A (zh) * | 2017-03-21 | 2017-08-11 | 科大讯飞股份有限公司 | 一种电子病历自动生成方法及装置 |
CN107247881B (zh) * | 2017-06-20 | 2020-04-28 | 北京大数医达科技有限公司 | 一种多模态智能分析方法及系统 |
-
2018
- 2018-01-24 CN CN201810069685.3A patent/CN108376558B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650756A (zh) * | 2016-12-28 | 2017-05-10 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于知识迁移的多模态循环神经网络的图像文本描述方法 |
CN107169035A (zh) * | 2017-04-19 | 2017-09-15 | 华南理工大学 | 一种混合长短期记忆网络和卷积神经网络的文本分类方法 |
CN107391609A (zh) * | 2017-07-01 | 2017-11-24 | 南京理工大学 | 一种双向多模态递归网络的图像描述方法 |
CN107480206A (zh) * | 2017-07-25 | 2017-12-15 | 杭州电子科技大学 | 一种基于多模态低秩双线性池化的图像内容问答方法 |
CN107463786A (zh) * | 2017-08-17 | 2017-12-12 | 王卫鹏 | 基于结构化报告模板的医学影像知识库建立方法 |
CN107608943A (zh) * | 2017-09-08 | 2018-01-19 | 中国石油大学(华东) | 融合视觉注意力和语义注意力的图像字幕生成方法及系统 |
Non-Patent Citations (2)
Title |
---|
From medical image to automatic medical report generation;P.Kisilev 等;《IBM Journal of Research and Development》;20150424;第59卷;1-7 * |
基于双线性函数注意力Bi-LSTM模型的机器阅读理解;刘飞龙 等;《计算机科学》;20170615;第44卷(第6A期);92-96,122 * |
Also Published As
Publication number | Publication date |
---|---|
CN108376558A (zh) | 2018-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108376558B (zh) | 一种多模态核磁共振影像病历报告自动生成方法 | |
Bi et al. | Automatic liver lesion detection using cascaded deep residual networks | |
US11423540B2 (en) | Segmentation of anatomical regions and lesions | |
Liao et al. | Estimation of the volume of the left ventricle from MRI images using deep neural networks | |
CN112465827B (zh) | 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法 | |
Tong et al. | Shape constrained fully convolutional DenseNet with adversarial training for multiorgan segmentation on head and neck CT and low‐field MR images | |
CN108664976B (zh) | 一种基于超像素的模糊谱聚类脑肿瘤图像自动分割方法 | |
CN110992351B (zh) | 基于多输入卷积神经网络的sMRI图像分类方法和装置 | |
CN107766874B (zh) | 一种超声容积生物学参数的测量方法及测量系统 | |
Sreelakshmy et al. | [Retracted] An Automated Deep Learning Model for the Cerebellum Segmentation from Fetal Brain Images | |
Xue et al. | Deep hybrid neural-like P systems for multiorgan segmentation in head and neck CT/MR images | |
CN114419314A (zh) | 自动标注医学图像的系统和方法 | |
CN115496732B (zh) | 一种半监督心脏语义分割算法 | |
Hou et al. | Automatic report generation for chest X-ray images via adversarial reinforcement learning | |
Sokooti et al. | Hierarchical prediction of registration misalignment using a convolutional LSTM: Application to chest CT scans | |
CN116364227A (zh) | 基于记忆能力学习的医学影像报告自动生成方法 | |
CN116310343A (zh) | 一种基于特征解耦的多模态脑肿瘤mri分割方法 | |
Wang et al. | Multi-view fusion segmentation for brain glioma on CT images | |
CN118279361A (zh) | 基于无监督深度学习和模态转换的多模态医学图像配准方法 | |
CN114387282A (zh) | 一种医学影像器官精准自动分割方法及系统 | |
CN112750131A (zh) | 基于尺度和序列关系的骨盆核磁共振图像肌肉骨骼分割方法 | |
Chen et al. | A multiple organ segmentation system for CT image series using Attention-LSTM fused U-Net | |
CN117237627A (zh) | 一种多模态mri脑肿瘤图像分割方法 | |
Luan et al. | Accurate and robust auto‐segmentation of head and neck organ‐at‐risks based on a novel CNN fine‐tuning workflow | |
Kathalkar et al. | Artificial neural network based brain cancer analysis and classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |