CN112819716B - 基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 - Google Patents
基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 Download PDFInfo
- Publication number
- CN112819716B CN112819716B CN202110130545.4A CN202110130545A CN112819716B CN 112819716 B CN112819716 B CN 112819716B CN 202110130545 A CN202110130545 A CN 202110130545A CN 112819716 B CN112819716 B CN 112819716B
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- net
- gaussian
- contrast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000006870 function Effects 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims abstract description 6
- 238000005070 sampling Methods 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10116—X-ray image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
基于高斯‑拉普拉斯金字塔的无监督学习X光图像增强方法,该方法首先使用高斯‑拉普拉斯金字塔算法生成高对比度高噪声图像XGL;然后,将原始图像Xori输入至X光图像增强网络中,得到网络输出图像Xnet;在整个过程中,使用对比度相似度损失函数计算图像Xnet与图像XGL之间的对比度相似度值,使用结构相似度损失函数计算图像Xnet与原始图像Xori之间的结构相似度值,将两者乘以相应的系数后相加得到总相似度值,不断迭代优化使之收敛至最小。最终完成优化,满足要求的生成图像Xnet即为最终的输出图像Xoutput。与现有X光图像增强方法相比,本发明处理后的图像对比度增强幅度合适、图像局部和整体的语义信息完整,同时处理后的图像结构平滑,噪声少,整体图像质量高。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法。
背景技术
X光图像增强技术是图像处理领域一个备受关注的研究问题,通过放大X光图像中感兴趣区域结构的显示对比度,显著提高图像的视觉质量及可理解性,对于医学临床诊断和工业探伤等应用中的各类人工与自主感知设备具有重要意义。特别地,随着基于深度学习的计算机视觉技术的迅速发展,图像增强作为计算机视觉的应用热点之一,其算法效果也得到了显著的提升。
基于深度学习的图像增强算法通常分为有监督学习算法和无监督学习算法。有监督学习算法多适用于有对应基准图像的处理任务;无监督学习算法则适用于没有对应基准图像但有先验知识、物理模型的处理任务。X光图像因其成像特点,难以获得对应的基准图像,无法通过有监督学习构建算法,因此需要基于无监督学习来设计X光图像增强算法。高斯-拉普拉斯金字塔是一种传统的图像增强算法,尽管处理后会使得图像噪声放大,但该算法也显著提升X光图像的对比度,所以常用于工业和医学X光图像的增强任务。因此,将高斯-拉普拉斯金字塔算法作为先验知识,通过设计一个基于先验知识的无监督学习X光图像增强算法,有望进一步提高X光图像增强效果。
发明内容
本发明的目的在于提供一种基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,以高质量地增强X光图像的对比度。
为达到上述目的,本发明采用如下技术方案来实现:
基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,该方法首先使用高斯-拉普拉斯金字塔算法生成高对比度高噪声图像XGL;然后,将原始图像Xori输入至X光图像增强网络中,得到网络输出图像Xnet;在整个过程中,使用对比度相似度损失函数计算图像Xnet与图像XGL之间的对比度相似度值,使用结构相似度损失函数计算图像Xnet与原始图像Xori之间的结构相似度值,将两者乘以相应的系数后相加得到总相似度值,不断迭代优化使之收敛至最小以优化图像Xnet;最终,完成优化,满足高对比度低噪声需求的图像Xnet即为最终的输出图像Xoutput。
本发明进一步的改进在于,该方法具体包括如下实现步骤:
1)先验知识图像的生成
首先使用高斯金子塔生成每次下采样的结果,使用拉普拉斯金字塔生成每次下采样丢失的残差信息;然后使用伽马变换对拉普拉斯金字塔中每层的图像做增强处理;最后使用高斯金字塔中的图像和增强后的拉普拉斯金字塔中的图像做上采样重建,即可得到高对比度高噪声的图像XGL;
2)增强图像获取
X光图像增强网络采用编解码结构,其编码器和解码器各有4层;首先,将原始X光图像Xori输入至该神经网络中,通过编码器不断下采样来多尺度地提取图像的特征信息,其中在编码器每层的卷积操作中使用膨胀卷积层替代标准卷积层;然后,使用跳层连接将每层提取的特征信息连接至解码器对应层以进行图像重建,最终的重建图像即为该神经网络的生成图像Xnet;
3)增强效果优化
使用对比度相似度损失函数Lossconstract计算生成图像Xnet与原图XGL之间的对比度相似度值,使用结构相似度损失函数Lossstructure计算生成图像Xnet与原图Xori之间的结构相似度值,将两者乘以相应的系数后相加,即可得到总相似度值,不断迭代优化使之收敛至最小,最终完成优化,满足要求的生成图像Xnet即为最终的输出图像Xoutput。
本发明进一步的改进在于,步骤1)中,根据X光图像分辨率大小将金字塔设置为K层,K满足{K|2K-1<H≤2K,2K-1<W≤2K},其中H为X光图像高,W为X光图像宽;对比度增强阶段分为下采样分解和上采样重建两个阶段;
下采样分解阶段:1)将原始X光图像Xori赋值给图像XInput;2)对分辨率大小为HInput×WInput的图像XInput进行高斯滤波,并使用最近邻插值法下采样得到大小为HInput/2×WInput/2的图像XGauss,将图像XGauss从下至上存入高斯金子塔中;3)对图像XGauss进行高斯滤波,并使用最近邻插值法上采样得到大小为HInput×WInput的图像XE;4)用图像XGauss逐像素减去图像XE得到图像XLaplace,将图像XLaplace从下至上存入拉普拉斯金字塔中;5)将图像XGauss赋值给图像XInput;重复2)~5)过程直至高斯金字塔每层都被占据,即完成了分离阶段;其中,HInput为输入图像的高,WInput为输入图像的宽,高斯滤波器核大小为5×5;
上采样重建阶段:1)从高斯金字塔顶取出图像XGauss并赋值给图像XR,其分辨率大小为HR×WR;2)对XR进行高斯滤波并使用最近邻插值法上采样得到分辨率大小为2HR×2WR的图像XF;3)取出拉普拉斯金字塔第K层的图像XLaplace并使用伽马变换对图像XLaplace做增强得到图像XEnhance;4)将图像XF和图像XEnhance逐像素相加得到图像XRec;5)将图像XRec赋值给图像XR,将K-1赋值给K;重复2)~5)直至取到拉普拉斯金字塔的第一层,即完成融合重建阶段;
完成上述两阶段后,即可得到高对比度高噪声的X光图像。
本发明进一步的改进在于,步骤2)中,编解码结构X光图像增强网络由一个下采样编码器和一个上采样解码器组成,其编码器和解码器各有4层;首先,将分辨率调整至512×512×1大小的原图用两个重复的标准卷积单元扩充维度至512×512×64;然后依次进行下采样编码和上采样解码;在下采样编码中,每层编码器的网络结构一样,均由一个步长为2的2×2最大池化操作、一个膨胀率为4的膨胀卷积单元、一个膨胀率为2的膨胀卷积单元、一个膨胀率为1的膨胀卷积单元组成;每经过一层编码器,图像特征的分辨率缩小一倍,通道数量增加一倍;在上采样解码中,每层解码器的网络结构一样,均由一个双线性插值上采样操作和两个相同的标准卷积单元组成;每层解码器都从编码器中接受相应的图像特征用于图像重建,即跳层连接;每经过一层解码器,分辨率放大一倍,特征通道数量减少一倍;在解码器最后一层即顶层,在将图像上采样至512×512×64后,利用1×1的标准卷积核进行卷积运算生成一张512×512×1的输出图像,该图像即为输出图像;其中,上述提到的标准卷积单元,包含一个3×3的标准卷积层,一个批标准化层,一个修正线性单元激活函数;上述提到的膨胀卷积单元结构,包含一个膨胀卷积层,一个批标准化层,一个修正线性单元激活函数,其中根据膨胀率的不同分为不同的膨胀卷积单元。
本发明进一步的改进在于,高对比度高噪声的图像XGL的表达式为:
XGL=fGL(Xori)
其中,fGL表示高斯-拉普拉斯金字塔算法,Xori表示原始X光图像。
本发明进一步的改进在于,输出图像Xoutput的表达式为:
Xoutput=fnet(XGL,Xori)
其中,fnet表示X光图像增强网络。
本发明进一步的改进在于,步骤3)中,Lossconstract和Lossstructure表达式为:
其中,μnet是图像Xnet的均值,μGL是图像XGL的均值;σnet是图像Xnet的方差,σori是图像Xori的方差,σtotal是图像Xnet和图像Xori的协方差;c1、c2为常数,避免分母和分子中有0值,c1、c2在这里均取9×10-4;
将对比度相似度损失函数和结构相似度损失函数乘以相应的系数后相加,即得到总相似度损失函数Losstotal:
Losstotal=λconstract×Lossconstract+λstructure×Lossstructure
其中,λconstract为对比度相似度损失函数的系数,在这里取1000;λstructure为结构相似度损失函数的系数,在这里取1。
与现有技术相比,本发明至少具有如下有益的技术效果:
本发明提供的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,通过使用深度神经网络融合高对比度高噪声图像的对比度信息及原始图像的结构信息,有效解决现有算法引起的对比度增强不足和噪声放大问题。X光图像因其成像原理而无法获取对应的基准图像,故无法使用有监督学习设计算法架构,因此在整体算法架构设计中,使用高斯-拉普拉斯金字塔算法作为先验知识,采用无监督学习的算法架构,针对X光的图像特点设计了专门的神经网络结构和损失函数,使得算法无需基准图像,也可有效地增强X光图像的对比度。
进一步,因X光图像成像机理与可见光图像不同,导致了针对可见光图像设计的先验知识、物理模型无法适用于X光图像中。本发明采用高斯-拉普拉斯金字塔算法作为先验知识,该算法能够多尺度地增强X光图像的对比度,得到的增强图像局部和整体对比度增强效果好、语义信息完整。
本发明提出的编解码结构X光图像增强网络使用编码器提取不同分辨率下的图像特征,然后将每层特征信息跳层连接至解码器对应层进行图像重建,其中,在编码器每层的卷积操作中使用膨胀卷积替代标准卷积。因此,本发明提出的编解码结构能够多尺度地提取图像的高层特征和底层特征;同时,由于使用膨胀卷积替换编码器中的标准卷积,扩大了神经网络的感受野,使得编码器提取的特征更加完整、丰富。最终,融合重建得到的图像结构清晰,语义信息完整。
本发明提出对比度相似度损失函数Lossconstract和结构相似度损失函数Lossstructure作为神经网络的损失函数,避免了逐像素计算图像之间的差异,使得输出图像即拥有高对比度高噪声图像XGL的高对比度和原始图像Xori的平滑的纹理,又避免了输出图像拥有高对比度高噪声图像XGL的噪声,同时边界不像原始图像Xori一样过度的模糊。
附图说明
图1为本发明基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法的整体框架;
图2为本发明所使用的编解码结构X光图像增强网络示意图;
图3为本发明高斯-拉普拉斯金字塔算法示意图;
图4为本发明三种膨胀率的膨胀卷积示意图,其中图4(a)中的膨胀率=1,图4(b)中的膨胀率=2,图4(c)中的膨胀率=4。
具体实施方式
以下结合附图和实施例对本发明作进一步的详细说明。
参考图1-4,本发明提供的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,包括以下步骤:
1)先验知识图像的生成:首先使用高斯金子塔生成每次下采样的结果,使用拉普拉斯金字塔生成每次下采样丢失的残差信息;然后使用伽马变换对拉普拉斯金字塔中每层的图像做增强处理;最后使用高斯金字塔中的图像和增强后的拉普拉斯金字塔中的图像做上采样重建,即可得到高对比度高噪声的图像XGL;
2)增强图像获取:采用编解码结构(Encoder-Decoder)神经网络作为X光图像增强网络,其编码器和解码器各有4层,首先,将原始X光图像Xori输入至该神经网络中,通过编码器(Encoder)不断下采样来多尺度地提取图像的特征信息,其中在编码器每层的卷积操作中使用膨胀卷积层替代标准卷积层;然后,使用跳层连接(Skip-Connection)将每层提取的特征信息连接至解码器(Decoder)对应层以进行图像重建,最终的重建图像即为该神经网络的生成图像Xnet;
3)增强效果优化:使用对比度相似度损失函数Lossconstract计算生成图像Xnet与原图XGL之间的对比度相似度值,使用结构相似度损失函数Lossstructure计算生成图像Xnet与原图Xori之间的结构相似度值,将两者乘以相应的系数后相加得到总相似度值,不断迭代优化使之收敛至最小。最终完成优化,满足要求的生成图像Xnet即为最终的输出图像Xoutput。
本发明在对原始X光图像数据集进行打乱、调整大小等常规数据预处理操作后,本发明提出的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法主要包括先验知识图像的生成、增强图像获取和增强效果优化三个步骤:
1)图1是本发明的整体框架示意图。具体地,首先将原始X光图像Xori输入至高斯-拉普拉斯金字塔中得到图像XGL,即:
XGL=fGL(Xori)
其中,fGL表示高斯-拉普拉斯金字塔算法。
然后将原始X光图像Xori输入至X光图像增强网络中,使用总相似度损失函数Losstotal计算相似度值,并不断迭代优化使之收敛至最小,即可得到最终的输出图像Xoutput,即:
Xoutput=fnet(XGL,Xori)
其中,fnet表示本发明所使用的X光图像增强网络。
2)先验知识图像的生成。本发明使用高斯-拉普拉斯金字塔算法作为先验知识生成高对比度高噪声图像,图3是高斯-拉普拉斯金字塔算法的流程图。具体的,根据X光图像分辨率大小将金字塔设置为K层,K满足{K|2K-1<H≤2K,2K-1<W≤2K},其中H为X光图像高,W为X光图像宽。对比度增强阶段可分为下采样分解和上采样重建两个阶段。
下采样分解阶段:1)将原始X光图像Xori赋值给图像XInput;2)对分辨率大小为HInput×WInput的图像XInput进行高斯滤波,并使用最近邻插值法下采样得到大小为HInput/2×WInput/2的图像XGauss,将图像XGauss从下至上存入高斯金子塔中;3)对图像XGauss进行高斯滤波,并使用最近邻插值法上采样得到大小为HInput×WInput的图像XE;4)用图像XGauss逐像素减去图像XE得到图像XLaplace,将图像XLaplace从下至上存入拉普拉斯金字塔中;5)将图像XGauss赋值给图像XInput;重复2)~5)过程直至高斯金字塔每层都被占据,即完成了分离阶段;其中,HInput为输入图像的高,WInput为输入图像的宽,高斯滤波器核大小为5×5。
上采样重建阶段:1)从高斯金字塔顶取出图像XGauss并赋值给图像XR,其分辨率大小为HR×WR;2)对XR进行高斯滤波并使用最近邻插值法上采样得到分辨率大小为2HR×2WR的图像XF;3)取出拉普拉斯金字塔第K层的图像XLaplace并使用伽马变换对图像XLaplace做增强得到图像XEnhance;4)将图像XF和图像XEnhance逐像素相加得到图像XRec。5)将图像XRec赋值给图像XR,将K-1赋值给K;重复2)~5)直至取到拉普拉斯金字塔的第一层,即完成融合重建阶段。
完成上述两阶段后,即可得到高对比度高噪声的X光图像。
3)增强图像获取。本发明采用编解码结构神经网络作为X光图像增强网络,图2是本发明所使用的神经网络结构示意图。该网络由一个下采样编码器(左边)和一个上采样解码器(右边)组成。然后依次进行下采样编码和上采样解码。在下采样编码中,每层编码器的网络结构一样,均由一个步长为2的2×2最大池化操作、一个膨胀率为4的膨胀卷积单元、一个膨胀率为2的膨胀卷积单元、一个膨胀率为1的膨胀卷积单元组成。每经过一层编码器,图像特征的分辨率缩小一倍,通道数量增加一倍。在上采样解码中,每层解码器的网络结构一样,均由一个双线性插值上采样操作和两个相同的标准卷积单元组成。每层解码器都从编码器中接受相应的图像特征用于图像重建,即跳层连接。每经过一层解码器,分辨率放大一倍,特征通道数量减少一倍。在解码器最后一层(顶层),在将图像上采样至512×512×64后,利用1×1的标准卷积核进行卷积运算生成一张512×512×1的输出图像,该图像即为输出图像。其中,上述提到的标准卷积单元,包含一个3×3的标准卷积层,一个批标准化层(Batch Normalization),一个修正线性单元(Rectified Linear Unit,ReLU)激活函数;上述提到的膨胀卷积单元结构,包含一个膨胀卷积层(见图4),一个批标准化层,一个修正线性单元激活函数,其中根据膨胀率的不同分为不同的膨胀卷积单元。
4)增强效果优化。在使用神经网络获得生成图像Xnet后,使用总相似度损失函数Losstotal计算生成图像Xnet与高对比度高噪声图像XGL、原始图像Xori之间的相似度值,不断迭代优化使之收敛至最小。完成优化,满足需求的生成图像Xnet即为最终输出图像Xoutput。
为了提升学习收敛速度,防止陷入局部最优点,本发明选择Adam优化器对模型参数进行更新。本发明选取NIH Chest X-rays数据集的一部分做训练,得到最终的模型。至此,模型训练完成,可进行线上推理任务。
Claims (7)
1.基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,该方法首先使用高斯-拉普拉斯金字塔算法生成高对比度高噪声图像XGL;然后,将原始图像Xori输入至X光图像增强网络中,得到网络输出图像Xnet;在整个过程中,使用对比度相似度损失函数计算图像Xnet与高对比度高噪声图像XGL之间的对比度相似度值,使用结构相似度损失函数计算图像Xnet与原始图像Xori之间的结构相似度值,将两者乘以相应的系数后相加得到总相似度值,不断迭代优化使之收敛至最小以优化图像Xnet;最终,完成优化,满足高对比度低噪声需求的图像Xnet即为最终的输出图像Xoutput。
2.根据权利要求1所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,该方法具体包括如下实现步骤:
1)先验知识图像的生成
首先使用高斯金子塔生成每次下采样的结果,使用拉普拉斯金字塔生成每次下采样丢失的残差信息;然后使用伽马变换对拉普拉斯金字塔中每层的图像做增强处理;最后使用高斯金字塔中的图像和增强后的拉普拉斯金字塔中的图像做上采样重建,即可得到高对比度高噪声图像XGL;
2)增强图像获取
X光图像增强网络采用编解码结构,其编码器和解码器各有4层;首先,将原始X光图像Xori输入至该神经网络中,通过编码器不断下采样来多尺度地提取图像的特征信息,其中在编码器每层的卷积操作中使用膨胀卷积层替代标准卷积层;然后,使用跳层连接将每层提取的特征信息连接至解码器对应层以进行图像重建,最终的重建图像即为该神经网络的生成图像Xnet;
3)增强效果优化
使用对比度相似度损失函数Lossconstract计算生成图像Xnet与高对比度高噪声图像XGL之间的对比度相似度值,使用结构相似度损失函数Lossstructure计算生成图像Xnet与原图Xori之间的结构相似度值,将两者乘以相应的系数后相加,即可得到总相似度值,不断迭代优化使之收敛至最小,最终完成优化,满足要求的生成图像Xnet即为最终的输出图像Xoutput。
3.根据权利要求2所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,步骤1)中,根据X光图像分辨率大小将金字塔设置为K层,K满足{K|2K-1<H≤2K,2K-1<W≤2K},其中H为X光图像高,W为X光图像宽;对比度增强阶段分为下采样分解和上采样重建两个阶段;
下采样分解阶段:1)将原始X光图像Xori赋值给图像XInput;2)对分辨率大小为HInput×WInput的图像XInput进行高斯滤波,并使用最近邻插值法下采样得到大小为HInput/2×WInput/2的图像XGauss,将图像XGauss从下至上存入高斯金子塔中;3)对图像XGauss进行高斯滤波,并使用最近邻插值法上采样得到大小为HInput×WInput的图像XE;4)用图像XGauss逐像素减去图像XE得到图像XLaplace,将图像XLaplace从下至上存入拉普拉斯金字塔中;5)将图像XGauss赋值给图像XInput;重复下采样分解阶段步骤2)~5)过程直至高斯金字塔每层都被占据,即完成了分离阶段;其中,HInput为输入图像的高,WInput为输入图像的宽,高斯滤波器核大小为5×5;
上采样重建阶段:1)从高斯金字塔顶取出图像XGauss并赋值给图像XR,其分辨率大小为HR×WR;2)对XR进行高斯滤波并使用最近邻插值法上采样得到分辨率大小为2HR×2WR的图像XF;3)取出拉普拉斯金字塔第K层的图像XLaplace并使用伽马变换对图像XLaplace做增强得到图像XEnhance;4)将图像XF和图像XEnhance逐像素相加得到图像XRec;5)将图像XRec赋值给图像XR,将K-1赋值给K;重复上采样重建阶段的步骤2)~5)直至取到拉普拉斯金字塔的第一层,即完成融合重建阶段;
完成上述两阶段后,即可得到高对比度高噪声的X光图像。
4.根据权利要求2所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,步骤2)中,编解码结构X光图像增强网络由一个下采样编码器和一个上采样解码器组成,其编码器和解码器各有4层;首先,将分辨率调整至512×512×1大小的原图用两个重复的标准卷积单元扩充维度至512×512×64;然后依次进行下采样编码和上采样解码;在下采样编码中,每层编码器的网络结构一样,均由一个步长为2的2×2最大池化操作、一个膨胀率为4的膨胀卷积单元、一个膨胀率为2的膨胀卷积单元、一个膨胀率为1的膨胀卷积单元组成;每经过一层编码器,图像特征的分辨率缩小一倍,通道数量增加一倍;在上采样解码中,每层解码器的网络结构一样,均由一个双线性插值上采样操作和两个相同的标准卷积单元组成;每层解码器都从编码器中接受相应的图像特征用于图像重建,即跳层连接;每经过一层解码器,分辨率放大一倍,特征通道数量减少一倍;在解码器最后一层即顶层,在将图像上采样至512×512×64后,利用1×1的标准卷积核进行卷积运算生成一张512×512×1的输出图像,该图像即为输出图像;其中,上述提到的标准卷积单元,包含一个3×3的标准卷积层,一个批标准化层,一个修正线性单元激活函数;上述提到的膨胀卷积单元结构,包含一个膨胀卷积层,一个批标准化层,一个修正线性单元激活函数,其中根据膨胀率的不同分为不同的膨胀卷积单元。
5.根据权利要求3所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,高对比度高噪声图像XGL的表达式为:
XGL=fGL(Xori)
其中,fGL表示高斯-拉普拉斯金字塔算法,Xori表示原始X光图像。
6.根据权利要求4所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,输出图像Xoutput的表达式为:
Xoutput=fnet(XGL,Xori)
其中,fnet表示X光图像增强网络。
7.根据权利要求2所述的基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法,其特征在于,步骤3)中,Lossconstract和Lossstructure表达式为:
其中,μnet是图像Xnet的均值,μGL是高对比度高噪声图像XGL的均值;σnet是图像Xnet的方差,σori是图像Xori的方差,σtotal是图像Xnet和图像Xori的协方差;c1、c2为常数,避免分母和分子中有0值,c1、c2在这里均取9×10-4;
将对比度相似度损失函数和结构相似度损失函数乘以相应的系数后相加,即得到总相似度损失函数Losstotal:
Losstotal=λconstract×Lossconstract+λstructure×Lossstructure
其中,λconstract为对比度相似度损失函数的系数,在这里取1000;λstructure为结构相似度损失函数的系数,在这里取1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110130545.4A CN112819716B (zh) | 2021-01-29 | 2021-01-29 | 基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110130545.4A CN112819716B (zh) | 2021-01-29 | 2021-01-29 | 基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819716A CN112819716A (zh) | 2021-05-18 |
CN112819716B true CN112819716B (zh) | 2023-06-09 |
Family
ID=75860381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110130545.4A Active CN112819716B (zh) | 2021-01-29 | 2021-01-29 | 基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819716B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113436112B (zh) * | 2021-07-21 | 2022-08-26 | 杭州海康威视数字技术股份有限公司 | 一种图像增强方法、装置及设备 |
CN113436237B (zh) * | 2021-08-26 | 2021-12-21 | 之江实验室 | 一种基于高斯过程迁移学习的复杂曲面高效测量系统 |
CN114331918B (zh) * | 2022-03-08 | 2022-08-02 | 荣耀终端有限公司 | 图像增强模型的训练方法、图像增强方法及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07212751A (ja) * | 1994-01-12 | 1995-08-11 | Fuji Photo Film Co Ltd | 階層画像ファイルにおける画像データ形成方法および装置 |
EP1933272A1 (en) * | 2006-12-11 | 2008-06-18 | Agfa HealthCare NV | Method of generating a contrast enhanced image using multiscale analysis |
CN102834844A (zh) * | 2010-04-05 | 2012-12-19 | 微软公司 | 多分辨率图像金字塔的生成 |
CN105006001A (zh) * | 2015-08-19 | 2015-10-28 | 常州工学院 | 一种基于非线性结构相似度偏差的有参图像的质量评估方法 |
CN108986050A (zh) * | 2018-07-20 | 2018-12-11 | 北京航空航天大学 | 一种基于多分支卷积神经网络的图像和视频增强方法 |
CN109544448A (zh) * | 2018-11-09 | 2019-03-29 | 浙江工业大学 | 一种拉普拉斯金字塔结构的团网络超分辨率图像重建方法 |
CN111292259A (zh) * | 2020-01-14 | 2020-06-16 | 西安交通大学 | 一种综合多尺度与注意力机制的深度学习图像去噪方法 |
CN111583141A (zh) * | 2020-04-30 | 2020-08-25 | 济南浪潮高新科技投资发展有限公司 | 一种虚拟现实图像增强方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170360B2 (en) * | 2008-11-21 | 2012-05-01 | Drs Rsta, Inc. | Method and system for enhancing images using multi-resolution histogram shaping |
US20100142790A1 (en) * | 2008-12-04 | 2010-06-10 | New Medical Co., Ltd. | Image processing method capable of enhancing contrast and reducing noise of digital image and image processing device using same |
US10902571B2 (en) * | 2019-05-20 | 2021-01-26 | Disney Enterprises, Inc. | Automated image synthesis using a comb neural network architecture |
-
2021
- 2021-01-29 CN CN202110130545.4A patent/CN112819716B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07212751A (ja) * | 1994-01-12 | 1995-08-11 | Fuji Photo Film Co Ltd | 階層画像ファイルにおける画像データ形成方法および装置 |
EP1933272A1 (en) * | 2006-12-11 | 2008-06-18 | Agfa HealthCare NV | Method of generating a contrast enhanced image using multiscale analysis |
CN102834844A (zh) * | 2010-04-05 | 2012-12-19 | 微软公司 | 多分辨率图像金字塔的生成 |
CN105006001A (zh) * | 2015-08-19 | 2015-10-28 | 常州工学院 | 一种基于非线性结构相似度偏差的有参图像的质量评估方法 |
CN108986050A (zh) * | 2018-07-20 | 2018-12-11 | 北京航空航天大学 | 一种基于多分支卷积神经网络的图像和视频增强方法 |
CN109544448A (zh) * | 2018-11-09 | 2019-03-29 | 浙江工业大学 | 一种拉普拉斯金字塔结构的团网络超分辨率图像重建方法 |
CN111292259A (zh) * | 2020-01-14 | 2020-06-16 | 西安交通大学 | 一种综合多尺度与注意力机制的深度学习图像去噪方法 |
CN111583141A (zh) * | 2020-04-30 | 2020-08-25 | 济南浪潮高新科技投资发展有限公司 | 一种虚拟现实图像增强方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Unsupervised Representation Learning with Laplacian Pyramid Auto-encoders;zhao Qilu etal.;《http:arXiv:1801.05278v2》;20180512;全文 * |
基于高斯金字塔和拉普拉斯金字塔融合的图像对比度增强算法研究;马永强等;《信息与电脑》;20181231;第2018年卷(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112819716A (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819716B (zh) | 基于高斯-拉普拉斯金字塔的无监督学习x光图像增强方法 | |
Zhang et al. | FFDNet: Toward a fast and flexible solution for CNN-based image denoising | |
CN110211045B (zh) | 基于srgan网络的超分辨率人脸图像重建方法 | |
Huang et al. | Iterative weighted sparse representation for X‐ray cardiovascular angiogram image denoising over learned dictionary | |
CN112132959B (zh) | 数字岩心图像处理方法、装置、计算机设备及存储介质 | |
CN115409733B (zh) | 一种基于图像增强和扩散模型的低剂量ct图像降噪方法 | |
Li et al. | Underwater image high definition display using the multilayer perceptron and color feature-based SRCNN | |
CN111861886B (zh) | 一种基于多尺度反馈网络的图像超分辨率重建方法 | |
CN116665065B (zh) | 基于十字交叉注意力的高分辨率遥感影像变化检测方法 | |
CN114581330A (zh) | 一种基于多尺度混合注意力的太赫兹图像去噪方法 | |
CN115984117B (zh) | 基于通道注意力的变分自编码图像超分辨率方法及系统 | |
CN109636722A (zh) | 一种基于稀疏表示的在线字典学习超分辨率重建的方法 | |
Mikaeli et al. | Single-image super-resolution via patch-based and group-based local smoothness modeling | |
Xia et al. | Deep residual neural network based image enhancement algorithm for low dose CT images | |
CN114418987A (zh) | 一种多阶段特征融合的视网膜血管分割方法及系统 | |
CN113240581A (zh) | 一种针对未知模糊核的真实世界图像超分辨率方法 | |
CN116188272B (zh) | 适用于多模糊核的两阶段深度网络图像超分辨率重建方法 | |
CN116797541A (zh) | 一种基于Transformer的肺部CT图像超分辨率重建方法 | |
Li et al. | Multi-scale feature fusion network for low-dose CT denoising | |
CN116797456A (zh) | 图像超分辨率重建方法、系统、设备和存储介质 | |
Jin et al. | Low-dose CT image restoration based on noise prior regression network | |
Zhuge et al. | Single image denoising with a feature-enhanced network | |
CN115205308A (zh) | 一种基于线状滤波和深度学习的眼底图像血管分割方法 | |
CN112598581B (zh) | 一种rdn超分辨网络的训练方法及图像生成方法 | |
CN116188352A (zh) | 一种基于增强边缘特征的肺结节分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |