CN106709872B - 一种快速图像超分辨率重构方法 - Google Patents
一种快速图像超分辨率重构方法 Download PDFInfo
- Publication number
- CN106709872B CN106709872B CN201611120441.0A CN201611120441A CN106709872B CN 106709872 B CN106709872 B CN 106709872B CN 201611120441 A CN201611120441 A CN 201611120441A CN 106709872 B CN106709872 B CN 106709872B
- Authority
- CN
- China
- Prior art keywords
- resolution
- image
- low
- dictionary
- image block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 12
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种快速图像超分辨率重构方法,该方法利用自然图像纹理具有相似性这一先验,将训练图像数据库中的图像分割为图像块,并拉伸为向量;然后利用这些向量训练稀疏编码字典;对对应的高低分辨率图像数据集训练稀疏编码字典,可以得到对应的高、低分辨率字典;对于新输入的低分辨率图像,先利用低分辨率字典计算稀疏编码,而后用高分辨率字典乘以此编码得到高分辨率图像。在稀疏系数求解过程中,先对固定字典计算标准正交基的稀疏系数,对于新输入的稀疏系数采用标准正交基的稀疏系数加权求和的方式快速求取。在图像块处理过程中,采用CUDA技术并行处理各个图像块,可将处理时间缩短为传统CPU计算的万分之一。本发明用于快速获取单幅图像的超分辨率图像。
Description
技术领域
本发明涉及一种快速图像超分辨率重构方法,属于计算机视觉技术领域,具体涉及稀疏表示理论、快速稀疏编码求解技术、CUDA并行加速技术和单图像超分辨率方法。
背景技术
人们对于图像质量的追求是没有止境的,而决定图像质量的关键因素是图像分辨率。单图像超分辨率就是利用单帧低分辨率图像重构出高分辨率图像。超分辨率图像不仅是图像大小变大,其结构信息和纹理细节应当比有图像有更好的辨识性。传统图像插值算法假设图像具有连续性,使得计算出的高分辨率图像在高频区域产生模糊。
为了获得更好的高频细节,必须引入更多的先验信息。Yang等人(参考文献Jianchao,Yang,John Wright,Thomas Huang,and M.Yi."Image super-resolution assparse representation of raw image patches."In Proc.IEEE Conf.on ComputerVision and Pattern Recognition,pp.1-8.2008.)提出了利用自然图像训练对应的高低分辨率字典的方法来学习自然图像的纹理先验,并用此先验补充单幅图像超分辨率的高频细节。此方法设计大量图像块的稀疏编码求解,计算量大,耗时长。
Yang的方法耗时长的原因在于:一是稀疏编码求解是一个优化过程,求解步骤中需要迭代多次。二是对于图像块的操作虽然是简单重复,但是没有一个很好的并行方法,导致处理时间上堆叠。
发明内容
针对Yang方法耗时长的问题,本发明提出了一种快速图像超分辨率重构方法。本发明提出一种全新的稀疏编码求解思路,并用CUDA并行求解图像块的稀疏编码和高分辨率重构,极大加速了求解过程。
本发明的技术方案是:
一种快速图像超分辨率重构方法,包括如下步骤:
S1.准备对应的高、低分辨率图像数据库,将彩色图像转化为灰度图像。
随机选取任一自然图像测试集中的不少于50张图像,选取的这些图像组成高分辨率图像数据库;然后将选取的所有图像按照β:1比例降采样得到对应的低分辨率图像,这些低分辨率图像组成低分辨率图像数据库;
将高、低分辨率图像数据库中的图像转化为灰度图像,并将得到的高、低分辨率的灰度图像分别划分为的图像块,其中N为高、低分辨率图像分块的像素数。
S2.利用划分的图像块,分别训练低分辨率字典Dl∈RN×n和高分辨率字典Dh∈RN×n,其中N为高、低分辨率图像分块的像素数,n为字典宽度,且n>>N。训练方法为求解如下优化问题:
D=arg minD,α||Y-DX||+λ||X||0s.t.||xi||0≤1
其中Y=(y1,...,yp)为训练图像块向量为列构成的矩阵,X=(x1,...,xp)为解向量构成的矩阵。
当Y分别为高分辨率、低分辨率图像块向量构成的矩阵时,便可分别得到高、低分辨率字典。
S3.设高、低分辨率字典Dh和Dl所在空间的标准正交基集合为{ek},k=1,...,N,求出{ek}的低分辨率字典稀疏编码集合{αl k}。
对于已知字典Dl和标准正交基向量ek,ek的编码向量为
其中α是arg min中待优化的变量,λ是常数,||·||1表示1-范数。
S4.输入待处理的低分辨率彩色图像Y,将彩色图像Y转换到YCbCr空间,对其亮度通道进行以下操作:从图像的左上角开始每间隔1个像素分割出一个的图像块,并将其均拉伸成向量,对每个图像块向量y用CUDA内核函数并行计算实现以下操作:
a.图像块向量y表示为其中xk为系数,ek为标准正交基向量,所以有y=(x1,x2,...,xN)T。
b.已知低分辨率字典Dl和图像块向量y,估计稀疏编码优化问题
上述优化问题的解αl的估计值为
其中||·||1表示1-范数,表示2-范数的平方,λ为预设常数。
c.计算每一个图像块向量y对应的高分辨率图像块x,计算方式为x=Dhα*;将图像块x放入高分辨率图像X0中,图像块x放入的位置与其对应的原始图像中的图像块所在位置对应;放入图像块x的高分辨率图像区域中每一个像素被认为填充了一次,用矩阵M记录高分辨率图像X0中每一个像素被填充的次数;所有图像块x放入完毕后即得到高分辨率图像X0。
S5.输出超分辨率图像X*=X0./M,其中./表示元素除法。
本发明利用自然图像纹理具有相似性这一先验,将训练图像数据库中的图像分割为图像块,并拉伸为向量;然后利用这些向量训练稀疏编码字典;对对应的高低分辨率图像数据集训练稀疏编码字典,可以得到对应的高、低分辨率字典。
对于新输入的低分辨率原始图像,先利用低分辨率字典计算稀疏编码,而后用高分辨率字典乘以此编码得到高分辨率图像。在稀疏系数求解过程中,先对固定字典计算标准正交基的稀疏系数,对于新输入的稀疏系数采用标准正交基的稀疏系数加权求和的方式快速求取。
附图说明
图1是本发明方法的整体流程图,包含训练过程和单帧图像超分辨率过程;
图2是CUDA内核函数并行原理图;
图3是本发明的CUDA内核函数设计图;
图4是本发明超分辨率结果与三次插值和Yang方法的对比;
图5是本发明超分辨率执行时间与三次插值与Yang方法的对比。
图6是图像分块方式示意图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1展示了字典训练和单帧图像超分辨率的整体流程。
步骤一:1)准备对应的高、低分辨率图像数据库,将彩色图像转化为灰度图像。随机选取任一自然图像测试集(如ImageNet)中的不少于50张图像,选取的这些图像组成高分辨率图像数据库。将选取的这些图像按照β:1比例降采样得到对应的低分辨率图像,这些低分辨率图像组成低分辨率图像数据库;由于本发明的图像超分辨率基于图像的亮度信息,而非色彩信息,故高、低分辨率图像数据库的色彩信息无需保留,直接将高、低分辨率图像数据库中的图像转化为灰度图像,并将得到的高、低分辨率的灰度图像分别划分为的图像块。其中N=25为高、低分辨率图像分块的像素数。设图像块对的数目为p。
步骤二:利用划分的图像块,分别训练低分辨率字典Dl∈RN×n和高分辨率字典Dh∈RN×n。其中n=100为字典宽度。训练方法为求解如下优化问题:
D=arg minD,α||Y-DX||+λ||X||0s.t.||xi||0≤1
其中Y=(y1,...,yp}为训练图像块向量为列构成的矩阵,X=(x1,...,xp)为解向量构成的矩阵。当Y分别为高分辨率、低分辨率图像块向量构成的矩阵时,便可分别得到高、低分辨率字典。
步骤三:设高、低分辨率字典Dh和Dl所在空间的标准正交基集合为{ek},k=1,...,N,求出{ek}的低分辨率字典稀疏编码{αl k}。
具体地,对于已知字典Dl和标准正交基向量ek,ek的编码向量为
其中α是arg min中待优化的变量,λ是常数,||·||1表示1-范数。
步骤四:输入待处理的低分辨率彩色图像Y,将彩色图像Y转换到YCbCr空间,对其亮度通道进行以下操作:从图像的左上角开始每间隔1个像素分割出一个的图像块,并将其均拉伸成向量,对每个图像块向量y用CUDA内核函数并行计算实现以下操作:
a.图像块向量y表示为其中xk为系数,ek为标准正交基向量,所以有y=(x1,x2,...,xN)T。
b.已知低分辨率字典Dl和图像块向量y,估计稀疏编码优化问题
上述优化问题的解αl的估计值为
其中||·||1表示1-范数,表示2-范数的平方,λ为预设常数。
c.计算每一个图像块向量y对应的高分辨率图像块x,计算方式为x=Dhα*;将图像块x放入高分辨率图像X0中,图像块x放入的位置与其对应的原始图像中的图像块所在位置对应,如图6所示。放入图像块x的高分辨率图像区域中每一个像素被认为填充了一次,用矩阵M记录高分辨率图像X0中每一个像素被填充的次数;所有图像块x放入完毕后即得到高分辨率图像X0;
图2展示了CUDA并行加速的原理。其核心思想是GPU多线程具有相同的函数体和不同的数据。CUDA可以利用GPU上千个核心创建众多线程并行计算。图3展示了本发明CUDA内核的设计思路。直接利用一维线程编组方式并行执行多图像块处理过程。
步骤五:输出超分辨率图像X*=X0./M。其中./表示元素除法。图4和图5的分别展示了本发明方法在超分辨率效果和运行时间上的优越性。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应该提出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.一种快速图像超分辨率重构方法,其特征在于,包括如下步骤:
S1.准备对应的高、低分辨率图像数据库,将彩色图像转化为灰度图像。
随机选取任一自然图像测试集中的不少于50张图像,选取的这些图像组成高分辨率图像数据库;然后将选取的所有图像按照β:1比例降采样得到对应的低分辨率图像,这些低分辨率图像组成低分辨率图像数据库;
将高、低分辨率图像数据库中的图像转化为灰度图像,并将得到的高、低分辨率的灰度图像分别划分为的图像块,其中N为高、低分辨率图像分块的像素数;
S2.利用划分的图像块,分别训练低分辨率字典Dl∈RN×n和高分辨率字典Dh∈RN×n,其中N为高、低分辨率图像分块的像素数,n为字典宽度,且n>>N;
S3.设高、低分辨率字典Dh和Dl所在空间的标准正交基集合为{ek},k=1,...,N,求出{ek}的低分辨率字典稀疏编码集合{αl k};
对于已知字典Dl和标准正交基向量ek,ek的编码向量为
其中λ是常数,||·||1表示1-范数;
S4.输入待处理的低分辨率彩色图像Y,将彩色图像Y转换到YCbCr空间,对其亮度通道进行以下操作:从图像的左上角开始每间隔1个像素分割出一个的图像块,并将其均拉伸成向量,对每个图像块向量y用CUDA内核函数并行计算实现以下操作:
a.图像块向量y表示为其中xk为系数,ek为标准正交基向量,所以有y=(x1,x2,...,xN)T;
b.已知低分辨率字典Dl和图像块向量y,估计稀疏编码优化问题
上述优化问题的解αl的估计值为
其中||·||1表示1-范数,表示2-范数的平方,λ为预设常数;
c.计算每一个图像块向量y对应的高分辨率图像块x,计算方式为x=Dhα*;将图像块x放入高分辨率图像X0中,图像块x放入的位置与其对应的原始图像中的图像块所在位置对应;放入图像块x的高分辨率图像区域中每一个像素被认为填充了一次,用矩阵M记录高分辨率图像X0中每一个像素被填充的次数;所有图像块x放入完毕后即得到高分辨率图像X0;
S5.输出超分辨率图像X*=X0./M,其中./表示元素除法。
2.根据权利要求1所述的快速图像超分辨率重构方法,其特征在于,S2中训练低分辨率字典Dl∈RN×n和高分辨率字典Dh∈RN×n方法为求解如下优化问题:
D=argminD,α||Y-DX||+λ||X||0s.t.||xi||0≤1
其中Y=(y1,...,yp)为训练图像块向量为列构成的矩阵,X=(x1,...,xp)为解向量构成的矩阵;
当Y分别为高分辨率、低分辨率图像块向量构成的矩阵时,便可分别得到高、低分辨率字典。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611120441.0A CN106709872B (zh) | 2016-12-08 | 2016-12-08 | 一种快速图像超分辨率重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611120441.0A CN106709872B (zh) | 2016-12-08 | 2016-12-08 | 一种快速图像超分辨率重构方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106709872A CN106709872A (zh) | 2017-05-24 |
CN106709872B true CN106709872B (zh) | 2018-06-29 |
Family
ID=58936197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611120441.0A Active CN106709872B (zh) | 2016-12-08 | 2016-12-08 | 一种快速图像超分辨率重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106709872B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510569B (zh) * | 2018-01-26 | 2020-11-03 | 北京大学 | 一种基于多通道的艺术字生成方法及系统 |
CN108830792B (zh) * | 2018-05-09 | 2022-03-11 | 浙江师范大学 | 一种利用多类字典的图像超分辨率方法 |
CN108596838B (zh) * | 2018-05-09 | 2022-02-18 | 北京环境特性研究所 | 一种基于学习的单帧人脸图像超分方法及装置 |
CN108665509A (zh) * | 2018-05-10 | 2018-10-16 | 广东工业大学 | 一种超分辨率重构方法、装置、设备及可读存储介质 |
CN110111258A (zh) * | 2019-05-14 | 2019-08-09 | 武汉高德红外股份有限公司 | 基于多核处理器的红外超分辨率重建图像方法及系统 |
CN112967357B (zh) * | 2021-02-19 | 2023-05-23 | 中国人民解放军国防科技大学 | 一种基于卷积神经网络的频谱地图构建方法 |
CN116205806B (zh) * | 2023-01-28 | 2023-09-19 | 荣耀终端有限公司 | 一种图像增强方法及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101226634A (zh) * | 2008-01-30 | 2008-07-23 | 哈尔滨工业大学 | 基于核回归的单帧图像快速超分辨率重建方法 |
CN101226631A (zh) * | 2007-12-12 | 2008-07-23 | 华为技术有限公司 | 一种超分辨率图像重构方法和装置 |
CN105205783A (zh) * | 2015-09-14 | 2015-12-30 | 河海大学 | 一种联合先验估计的sar图像盲超分辨率重建方法 |
CN106157249A (zh) * | 2016-08-01 | 2016-11-23 | 西安电子科技大学 | 基于光流法和稀疏邻域嵌入的单图像超分辨率重建算法 |
-
2016
- 2016-12-08 CN CN201611120441.0A patent/CN106709872B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101226631A (zh) * | 2007-12-12 | 2008-07-23 | 华为技术有限公司 | 一种超分辨率图像重构方法和装置 |
CN101226634A (zh) * | 2008-01-30 | 2008-07-23 | 哈尔滨工业大学 | 基于核回归的单帧图像快速超分辨率重建方法 |
CN105205783A (zh) * | 2015-09-14 | 2015-12-30 | 河海大学 | 一种联合先验估计的sar图像盲超分辨率重建方法 |
CN106157249A (zh) * | 2016-08-01 | 2016-11-23 | 西安电子科技大学 | 基于光流法和稀疏邻域嵌入的单图像超分辨率重建算法 |
Also Published As
Publication number | Publication date |
---|---|
CN106709872A (zh) | 2017-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106709872B (zh) | 一种快速图像超分辨率重构方法 | |
Baldassarre et al. | Deep koalarization: Image colorization using cnns and inception-resnet-v2 | |
CN110443842B (zh) | 基于视角融合的深度图预测方法 | |
US11537873B2 (en) | Processing method and system for convolutional neural network, and storage medium | |
WO2021022929A1 (zh) | 一种单帧图像超分辨率重建方法 | |
Sun et al. | Hybrid pixel-unshuffled network for lightweight image super-resolution | |
CN109671023A (zh) | 一种人脸图像超分辨率二次重建方法 | |
CN108492248A (zh) | 基于深度学习的深度图超分辨率方法 | |
US20210256707A1 (en) | Learning to Segment via Cut-and-Paste | |
CN109509211A (zh) | 同时定位与建图技术中的特征点提取与匹配方法及系统 | |
Wei et al. | Improving resolution of medical images with deep dense convolutional neural network | |
CN107633482A (zh) | 一种基于序列图像的超分辨率重建方法 | |
CN113192003B (zh) | 一种拼接图像质量评价方法 | |
Zhao et al. | Color2embed: Fast exemplar-based image colorization using color embeddings | |
CN115082966A (zh) | 行人重识别模型训练方法、行人重识别方法、装置和设备 | |
CN112598604A (zh) | 一种盲脸复原方法及系统 | |
Zheng et al. | Unsupervised pose flow learning for pose guided synthesis | |
CN115862131A (zh) | 一种用于人体运动识别的视频数据筛选方法 | |
Zheng et al. | Pose flow learning from person images for pose guided synthesis | |
CN110610508B (zh) | 一种静态视频分析方法及系统 | |
CN111899161A (zh) | 一种超分辨率重建方法 | |
CN114782249A (zh) | 一种图像的超分辨率重建方法、装置、设备以及存储介质 | |
CN117957577A (zh) | 用于神经渲染的多核系统 | |
Jiang | Color and Texture Dual Pipeline Lightweight Style Transfer | |
JP7106144B2 (ja) | 画像解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |