CN109658467B - 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法 - Google Patents

一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法 Download PDF

Info

Publication number
CN109658467B
CN109658467B CN201811515947.0A CN201811515947A CN109658467B CN 109658467 B CN109658467 B CN 109658467B CN 201811515947 A CN201811515947 A CN 201811515947A CN 109658467 B CN109658467 B CN 109658467B
Authority
CN
China
Prior art keywords
dictionary
matrix
sensing
gradient
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811515947.0A
Other languages
English (en)
Other versions
CN109658467A (zh
Inventor
李胜
陈强
何熊熊
孙明轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811515947.0A priority Critical patent/CN109658467B/zh
Publication of CN109658467A publication Critical patent/CN109658467A/zh
Application granted granted Critical
Publication of CN109658467B publication Critical patent/CN109658467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Endoscopes (AREA)

Abstract

一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法,针对内窥镜图像处理中存在单字典训练速度慢和重构效果差的问题,设计一种适用于大批量图片的云并行多字典训练算法,再结合多字典平均梯度下降改善了感知矩阵的优化效果,最后利用多字典平均策略重构图像。本发明多字典改进型压缩感知框架的应用提高了字典训练的速度,平均梯度下降和多字典重构也改善了图像的恢复效果,本发明在只使用一个感知矩阵的前提下,证明了多字典平均梯度下降对感知矩阵的优化。

Description

一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法
技术领域
本发明涉及一种基于多字典改进型压缩感知框架的内窥镜感知重构方法,利用了多字典优化感知矩阵。
背景技术
压缩感知是一种在感知的过程中就完成了压缩的技术,能够用很小的感知模块完成信号的采样压缩,然后利用训练好的字典重构出近似的原信号,突破了香农采样定理的限制。随着云计算和分布式计算的快速发展,通过分布式并行计算来提高运算速度变得越来越重要。在内窥镜图像应用领域,样本图片往往非常多,经典的单字典训练算法十分耗时,而图片尺寸也非常大使得投影误差被放大,造成重构效果差的问题。
发明内容
为了克服现有的应用于多样本大尺寸图像集效果差的问题,本发明提供一种基于多字典改进型压缩感知框架的重构方法,在还是使用一个感知矩阵的前提下,大大加快了字典训练速度也改善了感知矩阵设计的优化效果,最终提高了图像重构效果。为了解决上述技术问题提出的技术方案如下:
一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法,包括以下步骤:
步骤1,利用大量的医疗内窥镜图像训练出多个独立同分布的字典,过程如下:
1.1令Ψ代表字典矩阵,将大量的内窥镜图像均匀的分成P个子集,从每个子集当中随机抽取等量的内窥镜图像,然后将图像转为灰度值尺度为0~255的灰度图像,对这些图像按大小为8*8的像素块进行切割,切割下来的像素块分别拉成列原子大小为64*1的像素条,按一个子集为一组分别,将一个组的像素条拼成组成P个行尺度为64的原始信号矩阵,列尺度由抽取的图像数量和图像的大小决定,基于这些原始信号矩阵引入K次奇异值分解算法,使用云并行计算的能力,P条线路同时训练,由于数据是均匀随机抽取得到的,所以可以得到P个独立同分布字典;
1.2K次奇异值分解多字典训练优化方程为:
Figure BDA0001901962830000021
其中Ψ(t)∈R64×100,t=1,2,...,P是训练得到的P个字典,Y(t)是原始信号矩阵,Φ∈R20×64是感知矩阵,S是稀疏系数,且S是一个正整数;
步骤2,针对大尺寸内窥镜图像设计基于多字典的感知矩阵优化算法,目标函数使用多字典进行迭代梯度下降,过程如下:
2.1考虑图像应用场景,设计感知矩阵优化目标函数的格拉姆矩阵逼近单位矩阵的同时,引入基于弗罗贝尼乌斯范数的正则化惩罚项项来减小感知矩阵的能量;
2.2目标函数为:
Figure BDA0001901962830000022
其中G∈R100×100代表目标格拉姆矩阵,
Figure BDA0001901962830000023
是弗罗贝尼乌斯范数,λ代表正则化项的权衡因子,用来权衡最优化问题中逼近单位阵和感知矩阵能量的相互影响,该目标函数的优化目标是得到一个较好的适用于大尺寸图像的感知矩阵;
2.3考虑到秩约束,上述目标函数其实是一个非凸函数,将字典矩阵视为一个变量,采用随机梯度下降的平均梯度策略优化,分别计算基于P个字典的目标函数关于感知矩阵的梯度:
Figure BDA0001901962830000024
再求P个目标函数关于感知矩阵梯度的平均值:
Figure BDA0001901962830000031
Figure BDA0001901962830000032
是梯度平均值,作为感知矩阵更新的梯度变量值,带入变步长梯度下降公式中得到更新后的感知矩阵:
Figure BDA0001901962830000033
其中α是梯度下降的变步长参数,αi=0.1*e-0.01*i,i是迭代次数,当迭代次数达到设定阈值时,终止迭代,得到优化后的感知矩阵;
步骤3,利用多字典进行图像重构,其过程如下:
用训练好的感知矩阵来采样原信号X,得到原图像的采样测量值为Y:
Y=ΦX   (6)
这里应用经典的正交匹配追踪算法(OMP)来计算得到压缩感知中的稀疏系数S,代入P个字典经由正交匹配追踪算法解出P个稀疏系数,P个稀疏系数可以组成P个重构图像结果:
X(t)=Ψ(t)S(t)   (7)
其中t=1,2,...,P,X(t)是由第t个字典重构得到的恢复信号,Ψ(t)是第t个字典,S(t)是第t个稀疏系数,再求P个恢复信号的平均值:
Figure BDA0001901962830000034
其中平均值X是基于多字典的改进型压缩感知框架得到的最终重构图像。
本发明的有益效果为:本发明与现有的压缩感知框架相比,考虑了大批量图像字典训练耗时长的问题,基于独立同分布的原理提出了多字典并行运算的方法,在字典训练方面大幅度的提高了运算速度,同时考虑到了大尺寸图像应用在设计感知矩阵存在投影误差大的问题,利用了步骤1设计的多字典进行平均梯度下降,提高了非凸优化问题的优化性能,设计出了一个更适用于大尺度图像的感知矩阵,最后利用多字典平均策略进行图像重构,显著提高了图像恢复效果。
附图说明
图1为多字典K次奇异值分解算法训练示意图;
图2为多字典平均梯度下降算法示意图;
图3为多字典重构图像算法示意图;
图4为基于多字典的改进型压缩感知框架流程图。
具体实施方式
为使本发明的目的、优势和技术特点更加清晰透彻,下面结合附图和内窥镜图像实例对本发明做进一步阐述说明。
参照图1~图4,一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法,为了解决现有的在内窥镜图像采样处理中存在数据量太大,图像尺寸过于庞大的问题,减少字典训练的耗时和改善重构效果,本发明提供了一种基于多字典的改进型压缩感知框架,利用多字典并行运算加速字典训练、优化感知矩阵和重构图像,从而更好更快的完成内窥镜图像处理流程。
压缩感知是一种在感知的同时就完成了压缩的采样技术,突破了香农采样的定理的限制,能以较少的测量值还原出原来的整个信号,具有很高的压缩比。
如图1所示,K-SVD是K次奇异值分解的简写,本发明利用大批量的内窥镜图像训练出了多个独立同分布的字典,在此基础上发明了一种基于多字典改进型压缩感知框架的内窥镜图像重构方法,所述设计方法包括以下步骤:收集大量的医疗内窥镜数据集,按不同部位类别分类,再均匀随机分成P个图像子集,从每个子集当中随机抽取等量的内窥镜图像,利用计算机将图像转为灰度图像,并按大小为8*8的像素块进行裁剪,不足的地方用灰度0补齐,然后分别拉成列原子大小为64*1的像素条,按原来所属的子集类别分别组成P个训练数据矩阵T∈R64*M,其中M是矩阵列的个数,基于这些原始训练数据矩阵引入字典更新算法K次奇异值分解,分别训练出P个独立同分布的字典,尺寸为64*100,K次奇异值分解字典训练优化方程为:
Figure BDA0001901962830000041
其中Ψ(t)∈R64×100,t=1,2,...,P是训练得到的P个字典矩阵,Y(t)是已知的原始数据信号矩阵,Φ∈R64×100是用于采样的感知矩阵,S是稀疏系数,这里可以应用了化整为零的思想,采用多路并行运算的能力来加速字典训练。
如图2所示,针对大尺寸内窥镜图像在应用压缩感知技术时投影误差大,导致恢复效果差的问题,设计了基于多字典的感知矩阵优化算法,感知矩阵目标优化函数使用了多字典进行了迭代梯度下降,过程如下:
考虑到是图像应用场景,设计感知矩阵优化目标函数的格拉姆矩阵逼近单位矩阵的同时,引入基于弗罗贝尼乌斯范数的正则化表达式来减小感知矩阵的能量;
优化目标函数为:
Figure BDA0001901962830000051
其中Gt∈R100×100代表目标格拉姆矩阵,
Figure BDA0001901962830000052
是弗罗贝尼乌斯范数,λ代表正则化项的权衡因子。考虑到秩约束,上述目标函数是一个非凸函数,将字典矩阵视为一个变量,采用随机梯度下降的平均梯度策略优化,分别计算基于P个字典的优化目标函数关于感知矩阵的梯度:
Figure BDA0001901962830000053
其中Gt是目标格拉姆矩阵,再求P个目标函数关于感知矩阵的梯度平均值:
Figure BDA0001901962830000054
将梯度平均值
Figure BDA0001901962830000055
作为感知矩阵更新的梯度变量值,代入变步长梯度下降公式中,得到更新后的感知矩阵:
Figure BDA0001901962830000061
其中α是梯度下降的变步长参数,αi=0.1*e-0.01*i,i是迭代次数,当迭代次数达到设定阈值时,终止迭代,得到优化后的感知矩阵;
最后利用多字典进行图像平均重构,其过程如下:
用训练好的感知矩阵来采样原信号X,得到原图像的采样测量值为Y:
Y=ΦX   (6)
这里应用经典的正交匹配追踪算法(OMP)来计算得到压缩感知中的稀疏系数S,代入P个字典经由OMP算法解出P个稀疏系数,P个稀疏系数可以组成P个重构图像结果:
X(t)=Ψ(t)S(t)   (7)
其中t=1,2,...,P,X(t)是由第t个字典重构得到的恢复信号,Ψ(t)是第t个字典,S(t)是第t个稀疏系数,再求P个恢复信号的平均值:
Figure BDA0001901962830000062
其中平均值X是基于多字典的改进型压缩感知框架得到的最终重构图像。
在本实例中,将基于改进型多字典压缩感知框架的多字典数设定为100个字典,基于如上介绍的步骤完成内窥镜图像的字典训练、感知矩阵设计、图像感知和图像重构,并将其与传统的单字典设计进行耗时和恢复精度的比较,如下表1。
算法 训练耗时(秒) 图像恢复精度PSNR(dB)
单字典 24.729050 36.18
多字典 0.818469 41.24
表1
综上所述,在只用一个感知矩阵的前提下,应用并行运算训练多字典加快了字典的训练速度,同时改善了感知矩阵的优化效果,在大批量大尺寸的内窥镜图像应用中,有效的加快了系统的整体性能,提高了图像重构质量。
以上阐述的是本发明给出的一个实施例表现出的优良优化效果,显然本发明不只是限于上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及范围的前提下对其可作种种变形加以实施。

Claims (1)

1.一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法,其特征在于:所述方法包括以下步骤:
步骤1,大量的内窥镜图像训练出多个独立同分布的字典,过程如下:
1.1令Ψ代表字典矩阵,将大量的内窥镜图像均匀的分成P个子集,从每个子集当中随机抽取等量的内窥镜图像,然后将图像转为灰度值尺度为0~255的灰度图像,对这些图像按大小为8*8的像素块进行切割,切割下来的像素块分别拉成列原子大小为64*1的像素条,按一个子集为一组分别,将一个组的像素条拼成组成P个行尺度为64的原始信号矩阵,列尺度由抽取的图像数量和图像的大小决定,基于这些原始信号矩阵引入K次奇异值分解算法,使用并行计算的能力,P条线路同时训练,由于数据是均匀随机抽取得到的,所以可以得到P个独立同分布字典;
1.2K-SVD多字典训练优化方程为:
Figure FDA0001901962820000011
其中Ψ(t)∈R64×100,t=1,2,...,P是训练得到的P个字典,Y(t)是原始信号矩阵,Φ∈R20 ×64是感知矩阵,S是稀疏系数,且S是一个正整数;
步骤2,针对大尺寸内窥镜图像设计基于多字典的感知矩阵优化算法,目标函数使用多字典进行迭代梯度下降,过程如下:
2.1考虑图像应用场景,设计感知矩阵优化目标函数的格拉姆矩阵逼近单位矩阵的同时,引入基于弗罗贝尼乌斯范数的正则化惩罚项来减小感知矩阵的能量;
2.2目标函数为:
Figure FDA0001901962820000012
其中Gt∈R100×100代表目标格拉姆矩阵,
Figure FDA0001901962820000013
是弗罗贝尼乌斯范数,λ代表正则化项的权衡因子,用来权衡最优化问题中逼近单位阵和感知矩阵能量的相互影响,该目标函数的优化目标是得到一个较好的适用于大尺寸图像的感知矩阵;
2.3考虑到秩约束,上述目标函数其实是一个非凸函数,将字典矩阵视为一个变量,采用随机梯度下降的平均梯度策略优化,分别计算基于P个字典的目标函数关于感知矩阵的梯度:
Figure FDA0001901962820000021
其中Gt是目标格拉姆矩阵,再求P个目标函数关于感知矩阵梯度的平均值:
Figure FDA0001901962820000022
Figure FDA0001901962820000023
是梯度平均值,作为感知矩阵更新的梯度变量值,带入变步长梯度下降公式中得到更新后的感知矩阵:
Figure FDA0001901962820000024
其中α是梯度下降的变步长参数,αi=0.1*e-0.01*i,i是迭代次数,当迭代次数达到设定阈值时,终止迭代,得到优化后的感知矩阵;
步骤3,利用多字典进行图像重构,其过程如下:
用训练好的感知矩阵来采样原信号X,得到原图像的采样测量值为Y:
Y=ΦX                            (6)
这里应用经典的正交匹配追踪算法(OMP)来计算得到压缩感知中的稀疏系数S,代入P个字典经由正交匹配追踪算法解出P个稀疏系数,P个稀疏系数可以组成P个重构图像结果:
X(t)=Ψ(t)S(t)                          (7)
其中t=1,2,...,P,X(t)是由第t个字典重构得到的恢复信号,Ψ(t)是第t个字典,S(t)是第t个稀疏系数,再求P个恢复信号的平均值:
Figure FDA0001901962820000031
其中平均值X是基于多字典的改进型压缩感知框架得到的最终重构图像。
CN201811515947.0A 2018-12-12 2018-12-12 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法 Active CN109658467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811515947.0A CN109658467B (zh) 2018-12-12 2018-12-12 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811515947.0A CN109658467B (zh) 2018-12-12 2018-12-12 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法

Publications (2)

Publication Number Publication Date
CN109658467A CN109658467A (zh) 2019-04-19
CN109658467B true CN109658467B (zh) 2023-04-18

Family

ID=66113704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811515947.0A Active CN109658467B (zh) 2018-12-12 2018-12-12 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法

Country Status (1)

Country Link
CN (1) CN109658467B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135488B (zh) * 2019-05-10 2022-08-26 南京邮电大学 融合字典训练与观测矩阵优化的数据高质压缩方法
CN111257845B (zh) * 2020-02-11 2020-09-22 中国人民解放军国防科技大学 一种基于近似消息传递的不在网格目标角度估计方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103247034A (zh) * 2013-05-08 2013-08-14 中国科学院光电研究院 一种基于稀疏光谱字典的压缩感知高光谱图像重构方法
KR20140073605A (ko) * 2012-11-23 2014-06-17 삼성전자주식회사 동영상을 위한 양자화 테이블 추정 방법 및 장치
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN108242065A (zh) * 2017-12-26 2018-07-03 天津大学 一种基于ldpc矩阵的光场图像压缩感知方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140073605A (ko) * 2012-11-23 2014-06-17 삼성전자주식회사 동영상을 위한 양자화 테이블 추정 방법 및 장치
CN103247034A (zh) * 2013-05-08 2013-08-14 中国科学院光电研究院 一种基于稀疏光谱字典的压缩感知高光谱图像重构方法
CN107274462A (zh) * 2017-06-27 2017-10-20 哈尔滨理工大学 基于熵和几何方向的分类多字典学习磁共振图像重建方法
CN108242065A (zh) * 2017-12-26 2018-07-03 天津大学 一种基于ldpc矩阵的光场图像压缩感知方法

Also Published As

Publication number Publication date
CN109658467A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN105513026B (zh) 一种基于图像非局部相似的压缩感知重构方法
CN107657217B (zh) 基于运动目标检测的红外与可见光视频的融合方法
CN101980284B (zh) 基于两尺度稀疏表示的彩色图像降噪方法
CN103810755B (zh) 基于结构聚类稀疏表示的压缩感知光谱图像重建方法
CN102332153B (zh) 基于核回归的图像压缩感知重构方法
CN102708576A (zh) 基于结构字典的分块图像压缩感知重建方法
CN111598786B (zh) 一种基于深度去噪自编码网络的高光谱图像解混方法
CN106972862B (zh) 基于截断核范数最小化的组稀疏压缩感知图像重构方法
CN109658467B (zh) 一种基于多字典改进型压缩感知框架的内窥镜图像感知重构方法
CN102542542A (zh) 基于非局部稀疏模型的图像去噪方法
CN107590779A (zh) 一种基于图像块聚类字典训练的图像去噪去模糊方法
CN110060225B (zh) 一种基于快速有限剪切波变换与稀疏表示的医学图像融合法
CN108182694A (zh) 一种基于插值的运动估计与自适应视频重建方法
CN109344966A (zh) 一种高效张量化全连接神经网络的方法
CN111147863B (zh) 基于张量的视频快照压缩成像恢复方法
CN106934398B (zh) 基于超像素聚类和稀疏表示的图像去噪方法
CN112784747B (zh) 高光谱遥感图像多尺度本征分解方法
CN104866905A (zh) 一种基于beta过程的非参数稀疏张量字典的学习方法
Alsayyh et al. A Novel Fused Image Compression Technique Using DFT, DWT, and DCT.
CN105931184B (zh) 基于联合优化的sar图像超分辨率方法
CN116468818A (zh) 一种基于稀疏表示和贝叶斯估计的mri图像重构方法
CN112529826B (zh) 截断式张量贝叶斯多光谱图像压缩感知重构方法
CN114926557A (zh) 一种结合注意力机制的多尺度图像压缩重构方法
CN105528623A (zh) 一种基于地物类别分类冗余字典的成像光谱图像稀疏表示方法
Yufeng et al. Research on SAR image change detection algorithm based on hybrid genetic FCM and image registration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant