CN112492312B - 基于小波变换的图像压缩恢复方法、装置、设备和介质 - Google Patents

基于小波变换的图像压缩恢复方法、装置、设备和介质 Download PDF

Info

Publication number
CN112492312B
CN112492312B CN202011302950.1A CN202011302950A CN112492312B CN 112492312 B CN112492312 B CN 112492312B CN 202011302950 A CN202011302950 A CN 202011302950A CN 112492312 B CN112492312 B CN 112492312B
Authority
CN
China
Prior art keywords
frequency
low
information
frequency information
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011302950.1A
Other languages
English (en)
Other versions
CN112492312A (zh
Inventor
陈昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202011302950.1A priority Critical patent/CN112492312B/zh
Publication of CN112492312A publication Critical patent/CN112492312A/zh
Application granted granted Critical
Publication of CN112492312B publication Critical patent/CN112492312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本申请实施例属于人工智能技术领域,涉及一种基于小波变换的图像压缩恢复方法,包括通过小波变换将原始图像分解为低频信息和高频信息;压缩所述低频信息,得到第一低频压缩信息;将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;压缩所述第一低频压缩信息,得到第二低频压缩信息;并将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像。本申请还提供一种基于小波变换的图像压缩恢复装置、计算机设备及存储介质。采用本方法提高了图像还原的质量。

Description

基于小波变换的图像压缩恢复方法、装置、设备和介质
技术领域
本申请涉及图像处理技术领域,特别是涉及一种基于小波变换的图像压缩恢复方法、装置、计算机设备和存储介质。
背景技术
随着人工智能在金融领域中的广泛应用,在移动端开展金融行为的场景越来越丰富,这些场景中均涉及到较为严格的审批业务;审批业务中均需要进行客户图像的插曲,并且需要将这些图像进行压缩后上传到云端进行候选的算法处理。一般而言,经过压缩后的图像相对于真实图像会有一定的信息损失,会导致后续算法的性能下降。目前较为常见的做法是使用机器学习的方式根据压缩后的图像估计出损失掉的信息,从而达到补偿的目的。
典型的压缩过程从数学上来说是一个非单设的映射,而绝大多数方法忽略了这一点,从而导致恢复过程中会有不适定性,具体会体现在恢复后的图像某些细节存在一定的随机性,这会给后续算法引入额外的随机性,降低了图像恢复的质量。
发明内容
基于此,针对上述技术问题,本申请提供一种基于小波变换的图像压缩恢复方法、装置、计算机设备及存储介质,以解决现有技术中的图像恢复随机性太强,恢复后的图像质量低的技术问题。
一种基于小波变换的图像压缩恢复方法,所述方法包括:
通过小波变换将原始图像分解为低频信息和高频信息;
压缩所述低频信息,得到第一低频压缩信息;
将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;
压缩所述第一低频压缩信息,得到第二低频压缩信息;并
将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像。
一种基于小波变换的图像压缩恢复装置,所述装置包括:
分解模块,用于通过小波变换将原始图像分解为低频信息和高频信息;
第一压缩模块,用于压缩所述低频信息,得到第一低频压缩信息;
分布模块,用于将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;
第二压缩模块,用于压缩所述第一低频压缩信息,得到第二低频压缩信息;并
恢复模块,用于将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于小波变换的图像压缩恢复方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于小波变换的图像压缩恢复方法的步骤。
上述基于小波变换的图像压缩恢复方法、装置、计算机设备和存储介质,通过将在发送端将原始图像分解为低频信息和高频信息,并基于低频信息和高频信息通过训练好的特征分布模型得到图像中信息最容易丢失的高频信息的分布,通过这种方式能够极大程度上逼近原有的高频信息;在接收端接收到高频信息分布和二次压缩后的低频信息后,再基于特征分布模型,通过逆变换的方式对原始图像进行还原。通过这种方式恢复得到的图像,本申请的技术方案相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于小波变换的图像压缩恢复方法的应用环境示意图;
图2为基于小波变换的图像压缩恢复方法的流程示意图;
图3为图2中步骤206中提到的分析模块的结构示意图;
图4为基于小波变换的图像压缩恢复装置的示意图;
图5为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于小波变换的图像压缩恢复方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于小波变换的图像压缩恢复方法一般由服务端/终端执行,相应地,基于小波变换的图像压缩恢复装置一般设置于服务端/终端设备中。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。终端102将原始图像上传到服务端104,服务端对原始图像进行分解、压缩后,通过训练好的特征分布模型得到高频信息的高频信息分布,并将其与低频信息一起作为最终压缩结果,基于所述最终压缩结果对原始图像进行恢复操作,得到恢复后的原始图像。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于小波变换的图像压缩恢复方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,通过小波变换将原始图像分解为低频信息和高频信息。
在一些实施例中,本申请的技术方案可以应用于包括发送端和接收端的图像传输系统中。在一些实施例中,本申请的服务端接收终端上传的原始图像,并指示发送端对原始图像进行压缩等处理后,再发送到服务端上的接收端,然后指示接收端对压缩后的图像进行恢复操作,得到还原后的原始图像。
对所述原始图像的每一行像素进行一维离散,获得原始图像在水平方向上的低频分量L和高频分量H;对所述水平方向上的低频分量L和高频分量H的每一列再进行一维离散,得到原始图像在水平和垂直方向上的低频分量LL、水平方向上的低频和垂直方向上的高频分量LH、水平方向上的高频和垂直方向上的低频HL,以及水平和垂直方向上的高频分量HH;将所述原始图像在水平和垂直方向上的低频分量LL、所述水平方向上的低频,以及垂直方向上的低频HL作为所述低频信息,并将所述水平方向上的高频和所述水平和垂直方向上的高频分量HH,作为所述高频信息。
首先发送端对原始图像的每一行进行一维离散(1D-DWT),获得原始图像在水平方向上的低频分量L和高频分量H,然后对变换所得的低频分量L和高频分量H再进行1D-DWT,获得原始图像在水平和垂直方向上的低频分量LL、水平方向上的低频和垂直方向上的高频分量LH、水平方向上的高频和垂直方向上的低频HL、以及水平和垂直方向上的高频分量HH,至此可以得到一张低频分量图,即低频信息,以及三张高频分布图,即高频信息。
示例的,低频信息是篮球图像中的球形信息,而高频信息是指篮球上的花纹信息,即,低频一般是大范围大尺度的信息,也就是背景,而高频反映的是小范围细节信息。本申请的技术方案就是为了得到高频信息的分布,然后结合低频信息对压缩后的图像进行还原。
步骤204,压缩所述低频信息,得到第一低频压缩信息。
Lanczoc算法是一种将对称矩阵通过正交相似变换变成对称三对角矩阵的算法。通过该算法进行压缩,是指采用lanczos插值算法,将原始图像压缩地更小,比如说一张256x256的图像,可通过该步骤将其压缩成128x128大小,该算法相对于一般的插值算法,信息保真度更高。具体地,将低频信息所代表的图像压缩为原始图像的0.2至0.4倍。其中,选择这个范围的依据是:一般来说,将图像压缩成原有的2的n次方分之一是常用做法,这里压缩到这样的范围,是均衡考虑网络传输以及压缩后图像保真度的结果。优选的,将其压缩为原始图像的0.25倍,根据多次试验,在选择0.25时,经过多次测试,即将原图压缩为原有的4分之一时,可以得到一个较好的结果,同时满足网络设计。
步骤206,将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布。
原始图像经过压缩再进行恢复的过程,往往会因为高频信息的丢失而导致恢复后的图像质量退化,并且这个过程必然会发生。如果能恢复并保持高频信息,则恢复过程可以最大程度还原原始图像;尽管从理论上无法真正完全还原高频信息,但是根据采样定理,如果能够获知高频信息的相关分布,并据此进行采样,可以理论上无限逼近真实的高频信息,因此与其真正获取高频信息不如获取这样的分布,然而从理论上讲,这样的分布是同低频信息有关的;但是自然图像中这种高频信息往往服从一种高斯分布,这样一来,可以通过神经网络学习到样本中的高频信息的这种高斯分布,并通过神经网络学习到反射过程。这样一来,可以通过神经网络来获取高频信息在高斯分布中某一个特定点,即可极大程度上逼近原有的高频信息,再据此进行图像压缩后恢复,即可获取极大逼近缘由被压缩的图像。这种方式相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。
所以我们可以:将样本图像输入到待训练的特征分布模型中,得到所述样本图像中高频信息的样本高频信息分布;基于所述样本高频信息分布,通过蒙特卡洛估计法对待训练的特征分布模型进行迭代,得到训练好的特征分布模型。
具体地:预先构建特征分布模型,该特征分布模型由神经网络构成;对此,可以做出如下推导:假设,对于第l层,输入的hl内容将其划分为低频信息h1与高频信息h2两部分,则l+1层可以划分为:
Figure BDA0002787469040000061
Figure BDA0002787469040000062
其中,
Figure BDA0002787469040000063
Figure BDA0002787469040000064
是hl的两部分,
Figure BDA0002787469040000065
Figure BDA0002787469040000066
是hl+1的两部分,可变换为:
Figure BDA0002787469040000067
Figure BDA0002787469040000068
通常而言,作为神经网络,为了加强其对于非线性函数的拟合能力,又会在每一层后加上sigmoid函数操作,其中,sigmoid函数为神经元的激励函数,其作用就是引入非线性函数,将变量映射到0,1之间。则上述推导加上sigmoid函数后,可写成:
Figure BDA0002787469040000069
Figure BDA00027874690400000610
Figure BDA00027874690400000611
Figure BDA00027874690400000612
其中,
Figure BDA00027874690400000613
η、ψ以及ρ是任意的函数。自此,由上述公式可以看出,如果神经网络能够学习上述的函数φ、ρ、ψ以及ρ,则可以做到可逆的推导,即如果获知l+1层的输入信息,即可推导出l层的,同样的,如果获知l层的信息,也可以得到l+1层的。该推导过程重点在于构建网络让其可以学会这样一种可逆变换,具体说来,我们就可以构建起网络子结构。
如图3所示,按照上述公式所构建出的已知l层信息
Figure BDA00027874690400000614
Figure BDA00027874690400000615
可逆得到下一层信息
Figure BDA00027874690400000616
Figure BDA00027874690400000617
实际上在应用过程中是有4层附图3中所构成的子模块结构,构成的序贯结构作为这里的分析模块,其中,分析模块是指图3这样的一个结构,一个一个串接起来,构成一个神经网络中的模块,这个模块称之为分析模块,其中,高频部分是指高频信息,低频部分是指低频信息,图中的ψ、η和ρ是任意的函数,箭头方向表示信息走向。该分析模块主要将输入的高频信号转变为一个分布,该分布是对于原有高频信息的一种抽象解释。其中,序贯结构包含单输入与单输出,其神经网络由网络层堆叠而成。每一个网络层仅以上一层网络的输出为输入,并将经过处理后的输出送给下一层,典型代表模型是VGG系列网络。
这里提到的
Figure BDA0002787469040000075
η、ψ以及ρ等函数,是使用密集连接的密集连接卷积网络(DenseNet,Dense Convolutional Network)子结构所拟合;需要注意的是,最后一层是一个全连接层用于输出一个分布,这里的训练采用的类似于生成式对抗网络(GAN,GenerativeAdversarial Networks)那样的训练,用于生成一个去耦合的分布,在GAN中,实际训练的目标是将预测数据集的分布同目标数据集的分布尽量去接近,所以这里指的是训练一种分布。本申请这里的分布,可以认为是一种高斯分布。该部分可有如下推导:
假定真实图像x,对于真实图像存在一个任意形态的分布q(x),对于真实图像x可用分为低频信息y和高频信息z,如果能够获得一个网络权重为θ的网络,存在公式(1):
Figure BDA0002787469040000071
可由低频信息y与高频信息z恢复出真实图像x,其中,公式(1)中的n表示第n个真实图像。
由因为低频信息在本申请中是实际上直接由真实图像x获得,这里低频信息y可以替代为公式(2):
Figure BDA0002787469040000072
即,低频信息y的分布,总可以使用真实图像x的分布来进行替代。现在将所有问题变为讨论数据的分布问题,很容易得到以下特征分布模型,公式(3):
Figure BDA0002787469040000073
即,如果该特征分布模型训练完毕,理应通过逆变换可以由被替换的低频信息y分布与高频信息分布来获得真实图像x的分布。至此特征分布模型的训练目标,可以由图像之间的变换,变为衡量模型输出的高频信息分布与图像真实分布的差距Ldistr(θ),公式(4):
Figure BDA0002787469040000074
这里做一定的变换,采用蒙特卡洛估计法,可以将上述两个分布的差异Ldistr(θ)转变为如下结果,公式(5):
Figure BDA0002787469040000081
这里的σ与T是GAN训练中的discriminator鉴别器。至此,就可以通过缩小这样的一个“距离”,来达到让特征分布模型学习一个高频信息相关分布的目的。若收集1万张合格的自然图像进行上述训练,最终获得一个可逆的神经网络结构,其中,GAN里面的距离是一种JS散度(Jensen-Shannon divergence),又称为JS距离,JS距离的表达式形式就是这样的,这里所指的距离,就是该公式(5)。
与GAN类似,输入样本图像对特征分布模型进行训练,将样本图像输入公式(3),输入的样本图像作为目标,得到一个分布p(x),不同的是本申请用discriminator鉴别器判别这里生成的这种高频信息分布和我们经过压缩得到的第二低频压缩信息所对应的低频图像是否能合成出输入的样本图像,这样一来就会拟合这样的分布,在本申请的一些实施例中,该分布一般是指高频分布指标。即,在训练初始,并不知道是什么分布,所以可以先用一个高斯分布替代,然后只管最后合成的图像达不达到需求,即Ldistr(θ),按照蒙特卡洛估计法,discriminate鉴别器可等效为一个马尔可夫采样过程,随着迭代,会使得这个分布逼近真实分布,从而合成的图像越来越像真实图像,最终得到我们想要的特征分布模型。
图像经过压缩再进行恢复的过程往往会因为高频信息的丢失而导致恢复后图像质量退化,并且这个过程必然发生。如果能有什么办法恢复并保持高频信息,则恢复过程可以最大程度还原原始图像;尽管从理论上无法真正还原高频信息,但是根据采样定理,如果能够获知高频信息的分布,并据此进行采样,可以理论上无限逼近真实的高频信息,因此与其真正获取高频信息倒不如想办法获取这样的分布,然而从理论上来讲,这样的分布是同低频信息有关的;但是自然图像中这种高频信息往往服从一种高斯分布,这样一来,可以通过神经网络学习到样本中的高斯分布,并通过神经网络学习到反射的过程,这样一来就可以由神经网络来获取高斯分布中某一个特定点,即可极大程度上逼近原有的高频信息,再据此进行图像压缩后恢复即可获取极大逼近原有被压缩的图像;这样的方式相对于其他恢复方式完全不考虑高频信息的做法是一种巨大的进步,可以得到更接近真实图像的还原图像。
步骤208,压缩所述第一低频压缩信息,得到第二低频压缩信息。
继续采用lanczos算法对第一低频压缩信息进行压缩,这里压缩的目标是指按照最终需要压缩的尺度进行压缩,比如,需要将某无损的原始图像从发送端传输到接收端时,需要对其进行压缩以提高数据传输效率,就需要先对该原始图像进行小波转换后,再对得到的低频信息进行压缩,得到第一低频压缩信息;为了保证图像在接收端的无损恢复,本申请就基于变换得到的高频信息以及压缩得到的第一低频压缩信息,通过训练好的特征分布模型得到信息分布,并对第一低频压缩信息继续进行压缩,将得到的第二低频压缩信息与得到的这个信息分布作为最终压缩发给接收端。本申请通过这种压缩方式得到第二低频压缩信息,该第二低频压缩信息与信息分布构成的最终压缩结果进行传输,这样的结果可供存储,可供网络传输,而且传输效率可以大大提升。
步骤210,将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像。
接收端在接收到发送端发送的最终压缩结果后,服务端会指示接收端对其进行恢复处理,得到原图像。恢复过程是指在获得最终压缩结果,将其恢复到原来需求图像的步骤;该步骤分为两部分:
发送端发送最终压缩结果后,接收端通过lanczos算法将第二低频压缩信息进行还原处理,得到所述低频信息,并通过所述特征分布模型对所述低频信息和所述高频信息分布进行逆变换,得到恢复后的原始图像。具体的,将压缩后得到的第二低频压缩信息,通过resize模块采用lanczos插值算法放缩到原来低频信息的像素大小。其中,resize模块可以实现转换图像尺寸同时,还将像素值缩放到(0,1)之间。
基于获得的低频信息以及高频信息分布,按照特征分布模型,采用逆变换的方式,将高频信息通过采样恢复出来;在获得低频图像的情况下,同时根据传输来的高频信息分布,构建高频信息的分布,进行抽样,这样就可以填充高频矩阵;基于采样恢复的高频信息以及低频信息,使用Haar小波重构出图像,该重构出的图像作为压缩恢复后的原图像。
上述基于小波变换的图像压缩恢复方法,通过将在发送端将原始图像分解为低频信息和高频信息,并基于低频信息和高频信息通过训练好的特征分布模型得到图像中信息最容易丢失的高频信息的分布,通过这种方式能够极大程度上逼近原有的高频信息;在接收端接收到高频信息分布和二次压缩后的低频信息后,再基于特征分布模型,通过逆变换的方式对原始图像进行还原。通过这种方式恢复得到的图像,本申请的技术方案相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种基于小波变换的图像压缩恢复装置,该基于小波变换的图像压缩恢复装置与上述实施例中基于小波变换的图像压缩恢复方法一一对应。该基于小波变换的图像压缩恢复装置包括:
分解模块402,用于通过小波变换将原始图像分解为低频信息和高频信息;
第一压缩模块404,用于压缩所述低频信息,得到第一低频压缩信息;
分布模块406,用于将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;
第二压缩模块408,用于压缩所述第一低频压缩信息,得到第二低频压缩信息;并
恢复模块410,用于将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像。
进一步地,分解模块402,包括:
第一离散子模块,用于对所述原始图像的每一行像素进行一维离散,获得原始图像在水平方向上的低频分量L和高频分量H;
第二离散子模块,用于对所述水平方向上的低频分量L和高频分量H的每一列像素进行一维离散,得到原始图像在水平和垂直方向上的低频分量LL、水平方向上的低频和超值方向上的高频分量LH、水平方向上的高频和垂直方向上的低频HL,以及水平和垂直方向上的高频分量HH;
分解子模块,用于将所述原始图像在水平和垂直方向上的低频分量LL、所述水平方向上的低频,以及垂直方向上的低频HL作为所述低频信息,并将所述水平方向上的高频和所述水平和垂直方向上的高频分量HH,作为所述高频信息。
进一步地,在分布模块406之前,还包括:
样本模块,用于将样本图像输入到待训练的特征分布模型中,得到所述样本图像中高频信息的样本高频信息分布;
迭代模块,用于基于所述样本高频信息分布,通过蒙特卡洛估计法对待训练的特征分布模型进行迭代,得到训练好的特征分布模型。
上述基于小波变换的图像压缩恢复装置,通过将在发送端将原始图像分解为低频信息和高频信息,并基于低频信息和高频信息通过训练好的特征分布模型得到图像中信息最容易丢失的高频信息的分布,通过这种方式能够极大程度上逼近原有的高频信息;在接收端接收到高频信息分布和二次压缩后的低频信息后,再基于特征分布模型,通过逆变换的方式对原始图像进行还原。通过这种方式恢复得到的图像,本申请的技术方案相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储还原后的原始图像。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于小波变换的图像压缩恢复方法。本实施例通过将在发送端将原始图像分解为低频信息和高频信息,并基于低频信息和高频信息通过训练好的特征分布模型得到图像中信息最容易丢失的高频信息的分布,通过这种方式能够极大程度上逼近原有的高频信息;在接收端接收到高频信息分布和二次压缩后的低频信息后,再基于特征分布模型,通过逆变换的方式对原始图像进行还原。通过这种方式恢复得到的图像,本申请的技术方案相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现上述实施例中基于小波变换的图像压缩恢复方法的步骤,例如图2所示的步骤202至步骤210,或者,处理器执行计算机可读指令时实现上述实施例中基于小波变换的图像压缩恢复装置的各模块/单元的功能,例如图4所示模块402至模块410的功能。本实施例通过将在发送端将原始图像分解为低频信息和高频信息,并基于低频信息和高频信息通过训练好的特征分布模型得到图像中信息最容易丢失的高频信息的分布,通过这种方式能够极大程度上逼近原有的高频信息;在接收端接收到高频信息分布和二次压缩后的低频信息后,再基于特征分布模型,通过逆变换的方式对原始图像进行还原。通过这种方式恢复得到的图像,本申请的技术方案相对于其他恢复方式完全不考虑高频信息的做法具有很大的进步。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种基于小波变换的图像压缩恢复方法,其特征在于,所述方法包括:
通过小波变换将原始图像分解为低频信息和高频信息;
压缩所述低频信息,得到第一低频压缩信息;
将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;
压缩所述第一低频压缩信息,得到第二低频压缩信息;并
将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像;
所述特征分布模型为:
Figure FDA0003859651260000011
其中,x为原始图像,y为低频信息,z为高频信息,q(x)为原始图像任意形态的分布,p(z)为高频信息分布,θ为网络权重。
2.根据权利要求1所述的方法,其特征在于,所述通过小波变换将原始图像分解为低频信息和高频信息,包括:
对所述原始图像的每一行像素进行一维离散,获得原始图像在水平方向上的低频分量L和高频分量H;
对所述水平方向上的低频分量L和高频分量H的每一列像素进行一维离散,得到原始图像在水平和垂直方向上的低频分量LL、水平方向上的低频和垂直方向上的高频分量LH、水平方向上的高频和垂直方向上的低 频分量HL,以及水平和垂直方向上的高频分量HH;
将所述原始图像在所述水平和垂直方向上的低频分量LL作为所述低频信息,并将所述水平方向上的低频和垂直方向上的高频分量LH、所述水平方向上的高频和垂直方向上的低频分量HL,以及所述水平和垂直方向上的高频分量HH作为所述高频信息。
3.根据权利要求1所述的方法,其特征在于,所述压缩所述低频信息,得到第一低频压缩信息,包括:
通过lanczos算法对所述低频信息进行压缩,得到所述第一低频压缩信息。
4.根据权利要求3所述的方法,其特征在于,所述通过lanczos算法对所述低频信息进行压缩,得到所述第一低频压缩信息,包括:
通过lanczos算法将所述低频信息压缩为所述原始图像的0.2至0.4倍,得到所述第一低频压缩信息。
5.根据权利要求1所述的方法,其特征在于,在所述将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布之前,还包括:
将样本图像输入到待训练的特征分布模型中,得到所述样本图像中高频信息的样本高频信息分布;
基于所述样本高频信息分布,通过蒙特卡洛估计法对待训练的特征分布模型进行迭代,得到训练好的特征分布模型。
6.根据权利要求1所述的方法,其特征在于,所述对所述最终压缩结果进行恢复处理,得到原始图像,包括:
通过lanczos算法将第二低频压缩信息进行还原处理,得到所述低频信息,并通过所述特征分布模型对所述低频信息和所述高频信息分布进行逆变换,得到恢复后的原始图像。
7.一种基于小波变换的图像压缩恢复装置,其特征在于,包括:
分解模块,用于通过小波变换将原始图像分解为低频信息和高频信息;
第一压缩模块,用于压缩所述低频信息,得到第一低频压缩信息;
分布模块,用于将所述高频信息和所述第一低频压缩信息输入到训练好的特征分布模型中,得到高频信息分布;
第二压缩模块,用于压缩所述第一低频压缩信息,得到第二低频压缩信息;并
恢复模块,用于将所述第二低频压缩信息与所述高频信息分布作为最终压缩结果,并对所述最终压缩结果进行恢复处理,得到原始图像;
所述特征分布模型为:
Figure FDA0003859651260000021
其中,x为原始图像,y为低频信息,z为高频信息,q(x)为原始图像任意形态的分布,p(z)为高频信息分布,θ为网络权重。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202011302950.1A 2020-11-19 2020-11-19 基于小波变换的图像压缩恢复方法、装置、设备和介质 Active CN112492312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011302950.1A CN112492312B (zh) 2020-11-19 2020-11-19 基于小波变换的图像压缩恢复方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011302950.1A CN112492312B (zh) 2020-11-19 2020-11-19 基于小波变换的图像压缩恢复方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN112492312A CN112492312A (zh) 2021-03-12
CN112492312B true CN112492312B (zh) 2022-11-08

Family

ID=74932000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011302950.1A Active CN112492312B (zh) 2020-11-19 2020-11-19 基于小波变换的图像压缩恢复方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112492312B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079378B (zh) * 2021-04-15 2022-08-16 杭州海康威视数字技术股份有限公司 图像处理方法、装置和电子设备
CN113822955B (zh) * 2021-11-18 2022-02-22 腾讯医疗健康(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246591A (zh) * 2008-03-03 2008-08-20 北京航空航天大学 基于图像边缘特征的恢复图像重构方法
CN105392014A (zh) * 2015-11-05 2016-03-09 天津津航计算技术研究所 一种优化的小波变换图像压缩方法
CN106296600A (zh) * 2016-08-01 2017-01-04 大连理工大学 一种基于小波变换图像分解的对比度增强方法
CN110163237A (zh) * 2018-11-08 2019-08-23 腾讯科技(深圳)有限公司 模型训练及图像处理方法、装置、介质、电子设备
CN110706186A (zh) * 2019-07-12 2020-01-17 北京理工大学 基于压缩感知及Renyi熵的水下信息抗干扰方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246591A (zh) * 2008-03-03 2008-08-20 北京航空航天大学 基于图像边缘特征的恢复图像重构方法
CN105392014A (zh) * 2015-11-05 2016-03-09 天津津航计算技术研究所 一种优化的小波变换图像压缩方法
CN106296600A (zh) * 2016-08-01 2017-01-04 大连理工大学 一种基于小波变换图像分解的对比度增强方法
CN110163237A (zh) * 2018-11-08 2019-08-23 腾讯科技(深圳)有限公司 模型训练及图像处理方法、装置、介质、电子设备
CN110706186A (zh) * 2019-07-12 2020-01-17 北京理工大学 基于压缩感知及Renyi熵的水下信息抗干扰方法

Also Published As

Publication number Publication date
CN112492312A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
CN112492312B (zh) 基于小波变换的图像压缩恢复方法、装置、设备和介质
CN110782395B (zh) 图像处理方法及装置、电子设备和计算机可读存储介质
Khashman et al. Image compression using neural networks and Haar wavelet
Kim et al. MAMNet: Multi-path adaptive modulation network for image super-resolution
WO2022105117A1 (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN108615074B (zh) 基于压缩感知的神经网络处理系统及方法
CN112906721B (zh) 图像处理方法、装置、设备及计算机可读存储介质
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
CN111415311B (zh) 资源节约型图像质量增强模型
CN116403063A (zh) 基于多区域特征融合的无参考屏幕内容图像质量评估方法
Li et al. A regularised deep matrix factorised model of matrix completion for image restoration
CN112669244A (zh) 人脸图像增强方法、装置、计算机设备以及可读存储介质
WO2019092900A1 (ja) 情報処理装置及び情報処理方法
Wang et al. A customized deep network based encryption-then-lossy-compression scheme of color images achieving arbitrary compression ratios
CN115866253B (zh) 一种基于自调制的通道间变换方法、装置、终端及介质
CN114677545B (zh) 一种基于相似性剪枝和高效模块的轻量化图像分类方法
CN111083479A (zh) 一种视频帧预测方法、装置及终端设备
CN113362249B (zh) 文字图像合成方法、装置、计算机设备及存储介质
WO2022178975A1 (zh) 基于噪声场的图像降噪方法、装置、设备及存储介质
CN112966150A (zh) 一种视频内容抽取的方法、装置、计算机设备及存储介质
CN113554719A (zh) 一种图像编码方法、解码方法、存储介质及终端设备
CN116260969B (zh) 一种自适应的通道渐进式编解码方法、装置、终端及介质
TWI771250B (zh) 用於降低資料維度的裝置及方法、用於轉換資料維度的裝置的操作方法
WO2022178970A1 (zh) 语音降噪器训练方法、装置、计算机设备和存储介质
Kim et al. Swin Transformer Fusion Network for Image Quality Assessment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant