CN108305219A - 一种基于不相关稀疏字典的图像去噪方法 - Google Patents
一种基于不相关稀疏字典的图像去噪方法 Download PDFInfo
- Publication number
- CN108305219A CN108305219A CN201711495141.5A CN201711495141A CN108305219A CN 108305219 A CN108305219 A CN 108305219A CN 201711495141 A CN201711495141 A CN 201711495141A CN 108305219 A CN108305219 A CN 108305219A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- uncorrelated
- image
- sparse
- sparse dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 13
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 3
- 230000001351 cycling effect Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 11
- 238000013456 study Methods 0.000 abstract description 7
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000005284 basis set Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于不相关稀疏字典的图像去噪方法,将字典元素之间的互相关性作为字典学习优化方法中的约束条件融合进字典学习模型,得到新的不相关字典学习模型,从而更高效地学习得到不相关字典;在这个模型中,字典的表示误差和互相关性都是优化目标,都需要极小化;通过求解这个优化模型得到最优不相关稀疏字典。本发明得到不相关稀疏字典用于图像去噪的结果优于使用传统字典的图像去噪结果。
Description
技术领域
本发明属于图像处理领域,尤其涉及一种基于不相关稀疏字典的图像去噪 方法。
背景技术
根据稀疏表示理论,一个信号可以利用少数几个典型基元的线性组合有效 表示。这个信号可以通过寻找利用一个预定义的稀疏字典最稀疏的线性表示获 得精确表示。稀疏表示的这种优良特性使其广泛应用于图像处理与图像恢复领 域,例如图像去噪、图像超分辨率和图像修复。作为稀疏表示理论的基础,稀 疏字典的选择在稀疏表示问题中起到了至关重要的作用。
如何从信号中学习得到一个自适应的稀疏字典,以此来获得信号的最优表 示,许多相关研究已经开展。“Sparse coding with an overcomplete basis set: A strategyemployed by v1”,Bruno A Olshausen and David J Field;Vision research,vol.37,no.23,pp.3311–3325,1997中最早提出了稀疏字典学习问 题并且指出稀疏字典中的基元和已知的图像滤波器作用相同。“Learning overcomplete representations”,Michael SLewicki and Terrence J Sejnowski; Neural computation,vol.12,no.2,pp.337–365,2000.提出了第一种利用训 练信号数据的概率模型学习过完备字典的方法。“Method ofoptimal directions for frame design”,Kjersti Engan,Sven Ole Aase,and J HakonHusoy,1999 IEEE International Conference on Acoustics,Speech,and SignalProcessing.IEEE,1999,vol.5,pp.2443–2446中利用框架设计技术提出了称 为最优方向法(MOD)的稀疏字典学习方法。“K-SVD:An algorithm for designing overcompletedictionaries for sparse representation”,Michal Aharon,Michael Elad,and AlfredBruckstein,IEEE Transactions on Signal Processing,vol.54,no.11,pp.4311–4322,2006提出了K-SVD稀疏字典学习 方法,这种方法可以视为K均值聚类算法的推广。这两种稀疏字典学习方法 的总体思路都是在稀疏编码和字典更新两个步骤中交替迭代求解。其他稀疏字 典学习方法还包括“Learning unions of orthonormal bases with thresholdedsingular value decomposition”,Sylvain Lesage,Remi Gribonval,Frederic Bimbot,and Laurent Benaroya,IEEE International Conference on Acoustics, Speech,andSignal Processing(ICASSP’05).IEEE,2005,vol.5,pp.v–293、 “Dictionaries forsparse representation modeling”,Ron Rubinstein,Alfred M Bruckstein,andMichael Elad,Proceedings of the IEEE,vol.98,no.6,pp. 1045–1057,2010、和“Onlinelearning for matrix factorization and sparse coding”,Julien Mairal,FrancisBach,Jean Ponce,and Guillermo Sapiro,The Journal of Machine LearningResearch,vol.11,pp.19–60,2010。
现有的这些稀疏字典学习方法大部分都只关注学习得到的字典对信号的表 示能力,例如字典的多尺度表示和对信号数据的自适应性。但是根据“Greed is good:Algorithmic results for sparse approximation”,Joe lA Tropp,IEEE Transactionson Information Theory,vol.50,no.10,pp.2231–2242,2004和 “From sparse solutionsof systems of equations to sparse modeling of signals and images”,Alfred MBruckstein,David L Donoho,and Michael Elad, SIAM review,vol.51,no.1,pp.34–81,2009的研究,字典的相关性等内在属 性对其性能有直接影响。因此,不相关稀疏字典有利于提高稀疏表示的性能。 大部分不相关字典学习方法在字典更新阶段降低当前字典元素之间的相关性或 者增加一个后处理的步骤。“Sparse modeling with universal priorsand learned incoherent dictionaries”,Ignacio Ramirez,Federico Lecumberry,andGuillermo Sapiro,Tech.Rep.,Tech Report,IMA,University of Minnesota, 2009提出在字典更新阶段利用Gram矩阵范数来改善学习字典的互相关性和 累积相关性。“Ink-SVD:Learning incoherent dictionaries for sparse representations”,Boris Mailh′e,Daniele Barchiesi,and Mark D Plumbley, 2012 IEEE International Conference onAcoustics,Speech and Signal Processing(ICASSP).IEEE,2012,pp.3573–3576提出INK-SVD字典学习 方法,该方法在已有的K-SVD迭代方法中加入一个去相关步骤,通过使用贪心算法去除字典中成对元素之间的相关性得到需要的较低互相关性。在此基础 上,“Learning incoherent dictionaries for sparse approximation using iterativeprojections and rotations”,Daniele Barchiesi and Mark D Plumbley, IEEETransactions on Signal Processing,vol.61,pp.2055–2065,2013通过 在字典更新阶段加入去相关步骤和字典旋转步骤做了进一步改进。通过迭代投 影和对字典的旋转操作得到所需的低互相关性。现有这些不相关字典学习方法 通常把去相关操作作为字典学习过程中额外增加的一个后处理步骤,没有融合 进字典学习方法,因此不能获得最优不相关字典。
发明内容
本发明的技术解决问题是:克服现有稀疏字典学习方法存在的不足,提供 一种基于不相关稀疏字典的图像去噪方法。
为实现上述目的,本发明采用如下的技术方案:
一种基于不相关稀疏字典的图像去噪方法,包括以下步骤:
步骤1、将带噪声图像I均匀地以块大小重叠地随机采 样作为训练数据Y;
步骤2、根据训练数据Y得到不相关稀疏字典Φ,Φ的大小为 m×k,k为大于m的整数;
步骤3、对于带噪声图像,按照从上到下、从左到右的方式依次 重叠地提取图像块p,p的大小为
步骤4、对于每个图像块p,求解如下l0范数极小化问题得到其 稀疏系数
步骤5、去噪后的图像块为
步骤6、将有重叠区域的图像块放置到原图对应位置,重叠区域 取平均值,得到最终去噪图像
附图说明
图1本发明不相关稀疏字典与K-SVD字典迭代收敛速度对比示意图。
具体实施方式
本发明提供一种基于不相关稀疏字典的图像去噪方法,将字典元素之间的 互相关性作为字典学习优化方法中的约束条件融合进字典学习模型,得到新的 不相关字典学习模型,从而更高效地学习得到不相关字典。在这个模型中,字 典的表示误差和互相关性都是优化目标,都需要极小化。通过求解这个优化模 型得到最优不相关稀疏字典。
问题描述:
采用表示训练图像集,Y中的每一列表示训练集 中图像块的列向量形式。表示训练得到的字典,表示稀疏 系数矩阵,其中每一列xi表示与训练样本图像块yi对应的稀疏系数,则稀疏表 示字典学习可以表示为:
其中,T0表示稀疏系数的阈值。为了求解该问题,通常从一个初始字典开 始,通过在如下两个步骤之间交替求解直至收敛:在稀疏编码阶段,给定稀疏 字典Y求解稀疏系数X;在更新阶段,给定稀疏系数X更新稀疏字典以使整体 表示误差最小。
本发明的技术解决方案是:不相关稀疏字典学习方法,包括以下步骤:
(1)定义互相关性μ(Φ)来度量字典中不同元素之间的相关性,其定义为:
其中<φi,φi>表示归一化后的两个向量φi和φj之间的内积。
(2)为了获得最优字典,将字典元素之间的互相关性作为字典更新阶段 的约束项增加到优化目标函数中,同时最小化字典表示误差和字典 元素之间的互相关性。
(3)定义矩阵G=ΦTΦ,则互相关性μ(Φ)也可以定义为G矩阵中非对角
线元素中的最大值,即:因此矩阵元素Gij的绝对值 表示了字典Φ中第i列和第j列之间的相关性,然后由于 |Gij|≤μ,i≠j以及G矩阵对角线元素都为1,对字典Φ互相关性的 约束可以加到矩阵G上。
(4)进一步地,将对矩阵G的约束改写为B≤G≤A,其中B和A分别 表示矩阵G元素值的下限和上限。
(5)由于矩阵G=ΦTΦ,则G矩阵应具有低秩和半正定性,则获得如下 优化字典更新模型:
其中一项为数据保真项,等价于
(6)为了高效求解上述优化问题,采用如下交替迭代求解算法:
(7)引入辅助变量P和Q,得到如下优化问题:
(8)得到上式的增广拉格朗日形式为:
(9)上式可以分解为如下几个子问题进行交替求解:
Sk+1=Sk+μ1(G-P) (9)
Tk+1=Tk+μ2(G-Q) (10)
其中关于G极小化的优化问题(6)可以通过引入辅助变量N使用分离的 方法进行求解,原问题可以重新表示为:
上式可以分离为如下两个子问题进行求解:
其中Lk+1=Lk-(G-N)。
由于(12)式的目标函数是一个严格凸函数,(12)式中求解G可以通过 对目标函数求关于G的导数并令其为0的方式求得。(13)式是一个低秩矩阵 重建问题,可以通过奇异值阈值的方式高效求解。(7)式可以转化为一个二次 规划问题,通过使用标准二次优化求解方法求解。(8)式等价于如下问题:
公式(14)可以通过对矩阵的特征值进行阈值操作并保留正值 元素求解。
(10)求解得到矩阵G后,通过对G进行矩阵分解即可得到优化字典Φ。 具体地,由于这种矩阵分解并不唯一,需要引入一个称为旋转的后处理步骤。 用W表示一个正交矩阵,则有:
(WΦ)T(WΦ)=ΦTΦ=G (15)
因此可以对Φ使用正交矩阵W来极小化表示误差,即表示为:
其中I表示单位矩阵,W可以通过对矩阵ΦXYT进行奇异值分解求得,即 ΦXYT=U∑VT,则使(16)式极小化的正交矩阵W为:W=VUT。完整 的不相关字典更新算法如算法1所示。为了加速算法收敛性,优化求解过程中 使用了如下连续方法:
μk+1=ρ*μk (17)
其中,ρ是一个预定义的常数。
通过上述求解步骤,不相关字典的更新可以通过几步奇异值分解操作和 一次特征值分解操作完成。这比传统的K-SVD字典学习方法的字典更新更有 效,在K-SVD字典更新中,在字典的每一列更新中都需要进行一次奇异值分 解操作,而奇异值分解对于大规模矩阵计算非常耗时,因此上述字典学习方法 比传统K-SVD字典学习方法计算效率更高,尤其对于大规模字典学习问题。
算法1:不相关字典更新
输入:训练图像数据Y,稀疏系数X。
输出:不相关稀疏字典Φ。
初始化变量:S,T,N,L,P,Q,α,β,μ1,μ2,μ3,∈, k=0,其中,S,T,N,L,P,Q均表示辅助变量,α,β,μ1,μ2, μ3表示罚因子参数,∈表示循环终止参数,
当循环条件满足时,进入循环:
Lk+1=Lk-(G-N)
Sh+1=Sk+μ1(G-P)
Tk+1=Tk+μ2(G-Q)
结束循环;
对矩阵G进行矩阵分解:ΦTΦ=G;
进行后处理:Φ=WΦ;
输出不相关稀疏字典Φ。
实施例1:
基于上述不相关稀疏字典的图像去噪方法
(1)将带噪声图像I均匀地以块大小重叠地随机采样作 为训练数据Y;的大小优选取8;
(2)对训练数据Y使用算法1获得不相关稀疏字典Φ,Φ的大小 为m×k,k为大于m的整数,优选取256;
(3)对于带噪声图像,按照从上到下、从左到右的方式依次重叠 地提取图像块p,p的大小为
(4)对于每个图像块p,求解如下l0范数极小化问题得到其稀疏 系数
(5)去噪后的图像块为
(6)将有重叠区域的图像块放置到原图对应位置,重叠区域取平 均值,得到最终去噪图像
本发明得到不相关稀疏字典用于图像去噪的结果优于使用传统字 典的图像去噪结果,如表1所示。同时本发明的不相关稀疏字典学习 迭代收敛速度显著高于传统K-SVD字典迭代收敛速度,如图1所示。
表1本发明的图像去噪结果与其他图像去噪结果的峰值信噪比值 对比
Claims (2)
1.一种基于不相关稀疏字典的图像去噪方法,其特征在于,包括以下步骤:
步骤1、将带噪声图像I均匀地以块大小重叠地随机采样作为训练数据Y;
步骤2、根据训练数据Y得到不相关稀疏字典Φ,Φ的大小为m×k,k为大于m的整数;
步骤3、对于带噪声图像,按照从上到下、从左到右的方式依次重叠地提取图像块p,p的大小为
步骤4、对于每个图像块p,求解如下l0范数极小化问题得到其稀疏系数
步骤5、去噪后的图像块为
步骤6、将有重叠区域的图像块放置到原图对应位置,重叠区域取平均值,得到最终去噪图像
2.如权利要求1所述的基于不相关稀疏字典的图像去噪方法,其特征在于,得到不相关稀疏字典Φ具体包括:
获取训练图像数据Y、稀疏系数X;
初始化变量:S,T,N,L,P,Q,α,β,μ1,μ2,μ3,∈,k=0,其中,S,T,N,L,P,Q均表示辅助变量,α,β,μ1,μ2,μ3表示罚因子参数,∈表示循环终止参数,
当循环条件满足时,进入循环:
Lk+1=Lk-(G-N)
Sk+1=Sk+μ1(G-P)
Tk+1=Tk+μ2(G-Q)
结束循环;
对矩阵G进行矩阵分解:ΦTΦ=G;
进行后处理:Φ=WΦ;
输出不相关稀疏字典Φ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711495141.5A CN108305219B (zh) | 2017-12-31 | 2017-12-31 | 一种基于不相关稀疏字典的图像去噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711495141.5A CN108305219B (zh) | 2017-12-31 | 2017-12-31 | 一种基于不相关稀疏字典的图像去噪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108305219A true CN108305219A (zh) | 2018-07-20 |
CN108305219B CN108305219B (zh) | 2022-01-14 |
Family
ID=62868334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711495141.5A Active CN108305219B (zh) | 2017-12-31 | 2017-12-31 | 一种基于不相关稀疏字典的图像去噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108305219B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163615A (zh) * | 2020-09-25 | 2021-01-01 | 电子科技大学 | 一种基于门限优化字典学习的未知目标判别方法 |
CN112782226A (zh) * | 2020-12-31 | 2021-05-11 | 四川沐迪圣科技有限公司 | 光激励红外热成像无损检测方法、系统、存储介质及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789633A (zh) * | 2012-07-02 | 2012-11-21 | 河海大学常州校区 | 基于k-svd和局部线性嵌套的图像降噪系统和方法 |
US20130156340A1 (en) * | 2011-12-20 | 2013-06-20 | Fatih Porikli | Image Filtering by Sparse Reconstruction on Affinity Net |
CN104021528A (zh) * | 2014-06-12 | 2014-09-03 | 南昌大学 | 一种基于解析稀疏模型的字典学习算法 |
-
2017
- 2017-12-31 CN CN201711495141.5A patent/CN108305219B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156340A1 (en) * | 2011-12-20 | 2013-06-20 | Fatih Porikli | Image Filtering by Sparse Reconstruction on Affinity Net |
CN102789633A (zh) * | 2012-07-02 | 2012-11-21 | 河海大学常州校区 | 基于k-svd和局部线性嵌套的图像降噪系统和方法 |
CN104021528A (zh) * | 2014-06-12 | 2014-09-03 | 南昌大学 | 一种基于解析稀疏模型的字典学习算法 |
Non-Patent Citations (3)
Title |
---|
CHEN SHEN 等: "A image denoising algorithm based on sparse dictionary", 《2017 7TH IEEE INTERNATIONAL CONFERENCE ON ELECTRONICS INFORMATION AND EMERGENCY COMMUNICATION (ICEIEC)》 * |
金燕 等: "基于稀疏优化字典的图像去噪算法", 《浙江工业大学学报》 * |
黄丽韶 等: "基于方法噪声稀疏表字典学习的图像去噪算法", 《系统仿真学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163615A (zh) * | 2020-09-25 | 2021-01-01 | 电子科技大学 | 一种基于门限优化字典学习的未知目标判别方法 |
CN112163615B (zh) * | 2020-09-25 | 2022-04-22 | 电子科技大学 | 一种基于门限优化字典学习的未知目标判别方法 |
CN112782226A (zh) * | 2020-12-31 | 2021-05-11 | 四川沐迪圣科技有限公司 | 光激励红外热成像无损检测方法、系统、存储介质及终端 |
CN112782226B (zh) * | 2020-12-31 | 2024-05-03 | 四川沐迪圣科技有限公司 | 光激励红外热成像无损检测方法、系统、存储介质及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN108305219B (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Convtransformer: A convolutional transformer network for video frame synthesis | |
Lin et al. | Gait recognition via effective global-local feature representation and local temporal aggregation | |
CN111325165B (zh) | 考虑空间关系信息的城市遥感影像场景分类方法 | |
Zarka et al. | Deep network classification by scattering and homotopy dictionary learning | |
Zhao et al. | Invertible image decolorization | |
CN108446589B (zh) | 复杂环境下基于低秩分解和辅助字典的人脸识别方法 | |
CN110363068B (zh) | 一种基于多尺度循环生成式对抗网络的高分辨行人图像生成方法 | |
Mishra et al. | A comparative analysis of image transformations for handwritten Odia numeral recognition | |
CN108564061B (zh) | 一种基于二维主元分析的图像识别方法和系统 | |
CN106529586A (zh) | 基于补充文本特征的图像分类方法 | |
Yger et al. | Supervised logeuclidean metric learning for symmetric positive definite matrices | |
Singh et al. | Scatternet hybrid deep learning (shdl) network for object classification | |
CN111768354A (zh) | 基于多尺度人脸部位特征字典的人脸图像复原系统 | |
Yu et al. | Quaternion-based sparse representation of color image | |
CN113379597A (zh) | 人脸超分辨率重构方法 | |
Yin et al. | Dynamic difference learning with spatio-temporal correlation for deepfake video detection | |
Li et al. | Spectral feature fusion networks with dual attention for hyperspectral image classification | |
CN116030495A (zh) | 基于倍率学习的低分辨率行人重识别算法 | |
Tang et al. | Analysis dictionary learning: an efficient and discriminative solution | |
CN108305219A (zh) | 一种基于不相关稀疏字典的图像去噪方法 | |
CN117274059A (zh) | 基于图像编码-解码的低分辨率图像重构方法及其系统 | |
CN115713680A (zh) | 一种基于语义引导的人脸图像身份合成方法 | |
CN114693577A (zh) | 一种基于Transformer的红外偏振图像融合方法 | |
Yu et al. | Multiprior learning via neural architecture search for blind face restoration | |
Meng et al. | A novel gray image denoising method using convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |