CN105847800A - 基于全相位离散正弦双正交变换的图像压缩方法及系统 - Google Patents
基于全相位离散正弦双正交变换的图像压缩方法及系统 Download PDFInfo
- Publication number
- CN105847800A CN105847800A CN201610331215.0A CN201610331215A CN105847800A CN 105847800 A CN105847800 A CN 105847800A CN 201610331215 A CN201610331215 A CN 201610331215A CN 105847800 A CN105847800 A CN 105847800A
- Authority
- CN
- China
- Prior art keywords
- image
- discrete sine
- coefficient
- conversion
- phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
- H04N19/426—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了基于全相位离散正弦双正交变换的图像压缩方法及系统,包括在编码端对图像进行类JPEG压缩编码的步骤及接收端进行解压缩的步骤;其中,在编码端对图像进行类JPEG压缩编码时:对输入的源图像进行分块,对每个图像块进行全相位离散正弦双正交变换,对变换后的系数进行均一量化,对量化后的系数进行Zig‑zag扫描,对扫描重排后的系数进行哈夫曼编码,得到输出图像;对应的,在接收端进行解压缩时采用与在编码端对图像进行压缩编码相逆的步骤,得到重建图像。使用全相位离散正弦双正交变换算法进行类JPEG编码,有效地提高了图像的压缩性能,减少了低比特率下重建图像中的块效应。
Description
技术领域
本发明涉及图像处理领域,具体涉及基于全相位离散正弦双正交变换的图像压缩方法及系统。
背景技术
图像视频压缩技术是多媒体处理的核心,随着网络流媒体、多媒体无线传感网的兴起,人们对图像以及视频清晰度的要求越来越高。但是由于网络带宽的限制,目前人们对数据压缩性能的要求越来越高。因此针对图像及视频数据压缩问题,提出了相关的图像视频编码技术,并制订了相关标准。在这些视频和图像编码的标准中,其核心之一是离散余弦变换。由于图像经过离散余弦变换后的系数矩阵具有稀疏性质,非常适用于数据压缩。
基于离散余弦变换的JPEG编码,可以有效地对静态图像进行压缩,去除图像的空间冗余,节省存储空间。但是基于离散余弦变换的JPEG编码在低比特率下具有严重的块效应,并且量化表相对复杂。
同时随着相机分辨率的提升,日常生活中获得的图像分辨率也越来越高。对于图像像素较高的原始位图,由于数据量增大,若利用传统CPU串行的结构特点处理,会消耗大量的时间,效率低下,实时性不强。
所以亟需一种可以改善以上问题的方案。
发明内容
为解决现有技术存在的不足,本发明公开了基于全相位离散正弦双正交变换的图像压缩方法及系统,本发明基于全相位列率滤波和离散正弦变换提出了一种新型变换即全相位离散正弦双正交变换,并将其应用于图像压缩领域。在量化过程中,采用统一的量化步长即均一量化,省去JPEG标准中的复杂量化表,这样做可节省内存,简化计算,提升编码速度。
为实现上述目的,本发明的具体方案如下:
基于全相位离散正弦双正交变换的图像压缩方法,包括在编码端对图像进行压缩编码的步骤及接收端进行解压缩的步骤;
其中,在编码端对图像进行压缩编码时:对输入的源图像进行分块,对每个图像块进行全相位离散正弦双正交变换,对变换后的系数进行均一量化,对量化后的系数进行Zig-zag扫描,对扫描重排后的系数进行哈夫曼编码,得到输出图像;
对应的,在接收端进行解压缩时采用与在编码端对图像压缩编码相逆的步骤,得到重建图像。
进一步的,在接收端进行解压缩时的过程为:接收压缩后的图像比特序列;对序列进行哈夫曼解码;对解码后的数据进行Zig-zag反扫描;对扫描后得到的系数反量化;对反量化后的变换系数进行逆全相位离散正弦双正交变换;将逆变换处理后的数据写入硬盘;得到重建图像。
进一步的,全相位离散正弦双正交变换为将全相位列率滤波器用于离散正弦变换得到的一种新型变换。
进一步的,全相位离散正弦双正交变换采用H.265标准使用的VII型大小为N×N二维离散正弦变换的变换矩阵,由于离散正弦变换为正交变换,将N个响应的平均值y(n)作为序列x(n)的全相位列率滤波输出,其中转换矩阵V建立了时域的单位脉冲响应和正交变换域的列率响应之间的关系。
进一步的,分块进行全相位离散正弦双正交变换并根据不同的比特率需求,制定相应的量化步长,对变换系数进行均一量化。
进一步的,上述基于全相位离散正弦双正交变换的图像压缩采用基于GPU的并行算法进行加速,主要包括基于GPU的并行算法的图像压缩的步骤及基于GPU的并行算法的图像解压缩的步骤。
进一步的,基于GPU的并行算法的全相位离散正弦双正交变换的图像压缩包括:
在编码端的主机端,CPU预先在内存中申请两块内存空间x和y,分别用于存放从硬盘中读取的数据,以及压缩后的数据。将源图像数据从硬盘中加载到内存x,在设备端的显存中申请两块大小一样的内存X1和X2;
通过CPU将主机端内存x拷贝到设备端显存X1中;
根据图像尺寸分配GPU资源,为图像中每个图像块在线程网格中申请一块对应大小的共享内存,并将图像块映射到设备端的线程块,将每个图像块中的每个像素数据映射到线程块中的每个线程;
在每个线程中先对源图像数据并行地进行电平位移。
进一步的,上述图像压缩还包括:
对每个像素数据做全相位离散正弦双正交变换即并行全相位离散正弦双正交变换;
然后对变换后的系数进行并行量化;
对量化后的系数进行并行Zig-zag扫描;
对扫描后的系数采用并行奇偶排序获得非零游程长度,并在GPU端做并行的哈夫曼编码;
将编完码的数据放入显存X2中,并将X2拷贝到CPU的内存中,在CPU端经过处理后输出。
进一步的,基于GPU的并行算法的全相位离散正弦双正交变换的图像解压缩包括:
在解码端的主机端,CPU预先在内存中申请两块内存空间x1和y1,分别用于存放从硬盘中读取的压缩图像,以及解压缩后的重建图像。将压缩图像从硬盘中加载到内存x1,在设备端的显存中申请两块大小一样的内存Y1和Y2;
将内存x1拷贝到显存Y1中,对数据分割,并行地进行预处理;
对并行处理后的哈夫曼编码系数,在GPU中进行并行的哈夫曼解码;
对解码后的系数,再次进行映射,为每个系数块在线程网格中申请一块对应大小的共享内存,并将系数块映射到设备端的线程块,将每个系数块中的每个像素数据映射到线程块中的每个线程。
进一步的,上述基于GPU的并行算法的图像解压缩还包括:
对线程中的每个数据并行地进行反量化;
对反量化后的系数进行并行Zig-zag反扫描;
对反扫描后的系数做并行的逆全相位离散正弦双正交变换(Inverse All PhaseDiscrete Sine Biorthogonal Transform,IAPDSBT)即并行IAPDSBT变换;
将每个线程中逆变换后得到的系数进行电平平移;
将并行解码后的数据放入显存Y2中,并将Y2拷贝到CPU的内存中,即得到重建图像。
基于全相位离散正弦双正交变换的图像压缩系统,包括编码端及解码端:
其中,在编码端包括全相位离散正弦双正交变换模块,用于实现对分块后的图像进行全相位离散正弦双正交变换;
均一量化模块,用于实现对变换后的系数进行均一量化;
Zig-zag扫描模块,用于实现对量化后的系数进行Zig-zag扫描;
哈夫曼编码模块,用于实现对扫描重排后的系数进行哈夫曼编码,得到输出图像;
在解码端包括哈夫曼解码模块,用于实现对压缩后的图像比特序列进行哈夫曼解码;
Zig-zag反扫描模块,用于实现对解码后的数据进行Zig-zag反扫描;
反量化模块,用于实现对扫描后得到的系数反量化;
逆全相位离散正弦双正交变换模块,用于实现对反量化后的变换系数进行逆全相位离散正弦双正交变换,得到重建图像。
进一步的,上述基于全相位离散正弦双正交变换的图像压缩系统采用GPU图形处理器进行并行处理。
基于全相位离散正弦双正交变换(All Phase Discrete Sine BiorthogonalTransform,APDSBT)的类JPEG编码相较于传统的JPEG编码标准,它采用了APDSBT来代替离散余弦变换,减少了块效应对图像质量的影响。并且基于全相位离散正弦双正交变换的JPEG编码由于可采用均一量化,减少了运算复杂度,节省了内存。
对于图形处理器(Graphics Processing Unit,GPU),由于其具有特有的并行架构,可为高强度的密集计算并行化提供便利。英伟达公司推出了运算平台通用并行计算架构(Compute Unified Device Architecture,CUDA),利用CUDA技术在图形处理器上优化基于全相位离散正弦双正交变换的JPEG图像压缩的核心算法,可显著提升计算速度,极大地提高图像的压缩效率的同时可减少块效应。
本发明的有益效果:
(1)本发明基于全相位列率滤波和离散正弦变换提出了一种新型变换即全相位离散正弦双正交变换,并将其应用于图像压缩领域。
(2)使用全相位离散正弦双正交变换算法进行类JPEG编码,有效地提高了图像的压缩性能,减少了低比特率下重建图像中的块效应。
(3)采用均一量化,省去了JPEG标准中复杂的量化表,节省了内存,简化了计算,提升了编码速度。
(4)采用基于GPU的并行计算对基于APDSBT的JPEG编解码进行加速,克服了传统处理器计算能力和存储带宽上的劣势,导致计算效率不高的问题,同时克服了现有技术中图像编解码需要高端硬件支持的缺点,使得本发明具有普适性。
附图说明
图1 CUDA并行结构示意图;
图2 APDSBT-JPEG流程图;
图3基于离散正弦变换的全相位列率滤波示意图;
图4(a)基于APDSBT-JPEG算法Lena图像的率失真曲线;
图4(b)基于APDSBT-JPEG算法Barbara图像的率失真曲线;
图4(c)基于APDSBT-JPEG算法Baboon图像的率失真曲线;
图4(d)基于APDSBT-JPEG算法Bridge图像的率失真曲线;
图5(a)DCT-JPEG在比特率为0.20bpp时Zoneplate图像的主观效果;
图5(b)APDCBT-JPEG在比特率为0.20bpp时Zoneplate图像的主观效果;
图5(c)DST-JPEG在比特率为0.20bpp时Zoneplate图像的主观效果;
图5(d)APDSBT-JPEG在比特率为0.20bpp时Zoneplate图像的主观效果;
图6并行APDSBT-JPEG图像编解码示意图。
具体实施方式:
下面结合附图对本发明进行详细说明:
本发明的思路是,使用全相位离散正弦双正交变换和均一量化分别代替传统JPEG图像编码中的离散余弦变换和传统量化表,并且使用基于GPU的并行计算对APDSBT-JPEG进行加速。
基于全相位离散正弦双正交变换的JPEG编码方法,如图2所示,具体包括以下步骤:
(1)将源图像,读进内存;
(2)把输入图像分为8×8的图像块;
(3)对每个图像块进行全相位离散正弦双正交变换;
(4)对变换后的系数进行均一量化;
(5)对量化后的系数进行Zig-zag扫描;
(6)对扫描重排后的系数进行哈夫曼编码;
(7)得到输出图像。
对JPEG传输和存储的优化方法,其接收端解压缩过程如下:
(1)接收压缩后的图像比特序列;
(2)对序列进行哈夫曼解码;
(3)对解码后的数据进行Zig-zag反扫描;
(4)对扫描后得到的系数反量化;
(5)对反量化后的变换系数进行逆全相位离散正弦双正交变换;
(6)将逆变换处理后的数据写入硬盘;
(7)得到重建图像。
实施例1
如图3所示,在本发明中,区别现有技术的必要技术特征:将全相位列率滤波器用于离散正弦变换,得到了一种新型变换——全相位离散正弦双正交变换。
本发明采用H.265标准中使用的VII型大小为N×N二维离散正弦变换(DiscreteSine Transform,DST)的变换矩阵为:
其中,i,j代表元素所在矩阵的行和列。
由于DST为正交变换,满足:S-1=ST,ei(i=0,1,…,N-1)是第i个元素为1其余元素为0的N维列向量。将N个响应的平均值y(n)作为时域序列x(n)(n=0,1,…,N-1)的全相位列率滤波输出,可得:
其中Xi全相位数据矩阵x(n)的第i列,F是长度为N的列率响应向量,m,k是求和参变量,因此有
将式(3)代入到式(2)中可得:
由此可以得到h=VF,其中转换矩阵V建立了时域的单位脉冲响应和正交变换域的列率响应之间的关系,本发明称这种由全相位列率滤波推演而来的转换矩阵为全相位离散正弦双正交变换(All Phase Discrete Sine Biorthogonal Transform,APDSBT)矩阵,V的元素为:
做变量代换:i→l,τ→i,m→j,得
将式(1)代入到式(7)中,可得变换矩阵V的一般形式为:
当N=8时,得到8×8大小的APIDSBT变换矩阵V为:
全相位离散正弦双正交变换与离散余弦变换的相似之处在于:当N×N的源图像数据矩阵使用它们经过变换后,均可得到相应的变换域系数矩阵,并且图像的低频分量集中在系数矩阵的左上角,并且直流系数位于系数矩阵左上角的第一个位置;右下角为高频分量系数。根据人眼的视觉特性,对低频分量进行细量化、对高频分量进行粗量化即可达到很好的压缩效果,这样做使得大多数高频系数变为零,即量化后的系数呈稀疏分布。两者的不同之处在于:与离散余弦变换相比,全相位离散正弦双正交变换具有更好的能量集中特性和对高频分量进行衰减的特性,即在变换的过程中就已对不同的频率进行了不同加权,将其用于图像压缩中的JPEG编码框架,在量化过程中,对所有的变换系数采用简单的均一量化,即用一个统一的量化步长去量化,即可达到对低频细量化和对高频粗量化的目的。而省去JPEG标准中根据人眼的视觉特性所设计的复杂量化表。这样做可节省内存,简化计算,提升编码速度。而且得到了比传统JPEG算法更好的压缩效果。
实施例2
在本发明中,区别于现有技术的必要技术特征是:提出了一种新型变换即全相位离散正弦双正交变换,并用它代替JPEG标准中的离散余弦变换,并且使用一个统一的量化步长即均一量化代替原有JPEG标准中的复杂量化表,应用于图像压缩。本发明可基于软件实现。如图1所示,输入原始图像,将图像分为8×8的图像块,分块进行全相位离散正弦双正交变换,并根据不同的比特率需求,制定相应的量化步长,对变换系数进行均一量化,接着对直流系数(DC)进行预测编码,对交流系数(AC)进行Zig-zag扫描和游程编码,然后根据标准的哈夫曼码表进行熵编码,输出压缩图像的比特序列。在接收端将接收到的比特序列,依次经过哈夫曼解码、Zig-zag反扫描、反量化以及逆全相位离散正弦双正交变换,即可得到重建图像。
本发明对传统JPEG编码标准的改进之处在于:使用全相位离散正弦双正交变换代替传统的离散余弦变换,并且对所有的变换系数采用均一量化,其余部分与JPEG编码框架相同。
在MATLAB 2012环境下对本发明提出的技术方案进行了计算机仿真实验,实验得到以下结论:
(1)采用基于全相位离散正弦双正交变换的类JPEG压缩算法,可以得到比采用传统变换以及其他相关变换的类JPEG压缩算法更好的主观效果,有效地减少了低比特率时出现的块效应。
(2)在客观评价方面,采用全相位离散正弦双正交变换的类JPEG压缩算法,可以得到比采用传统变换以及其他相关变换的类JPEG压缩算法更好的客观效果。其峰值信噪比要明显优于传统的基于离散余弦变换的JPEG标准。
表1给出了对典型标准测试图像Lena.bmp(大小为512×512、8比特/像素),基于几种常用变换:离散余弦变换(Discrete Cosine Transform,DCT)、全相位离散余弦双正交变换(All Phase Discrete Cosine Biorthogonal Transform,APDCBT)、离散正弦变换(Discrete Sine Biorthogonal Transform,DST)以及本发明提出的全相位离散正弦双正交变换(All Phase Discrete Sine Biorthogonal Transform,APDSBT)用于JPEG编码框架在不同比特率下的峰值信噪比。从表1中数据可以看出:本发明提出的APDSBT在各种比特率下均优于DCT、APDCBT和DST。
图4(a)~图4(d)是对其他标准测试图像使用不同的变换用于JPEG编码框架的率失真曲线,其中图4(a)为Lena图像,图4(b)为Barbara图像,图4(c)为Baboon图像,图4(d)为Bridge图像。bpp为编码比特率单位,表示比特/像素(bit/pixel);PSNR表示峰值信噪比(Peak Signal to Noise Ratio)。由图4(a)~图4(d)可以看出,对这几幅标准测试图像,本发明提出的APDSBT在各种比特率下均优于DCT、APDCBT和DST。
表1 Lena图像采用不同变换基用于JPEG编码框架的峰值信噪比的对比
(3)在主观评价方面,图5(a)~图5(d)给出了比特率为0.20bpp时对大小为512×512的标准测试图像Zoneplate.bmp使用不同算法进行压缩,并对重建图像的左上角64×64个像素对长宽各放大8倍的效果图,其中图5(a)为DCT-JPEG,图5(b)为APDCBT-JPEG,图5(c)为DST-JPEG,图5(d)为APDSBT-JPEG。由图5(a)~图5(d)可以看出:与DCT、APDCBT、DST相比,APDSBT可以有效地减少块效应。
实施例3
基于全相位离散正弦双正交变换的JPEG图像压缩标准的核心编解码系统主要包括8个模块,在编码端,首先对图像进行全相位离散正弦双正交变换,然后进行均一量化,接着进行Zig-zag扫描,然后进行哈夫曼编码。在解码端,首先进行哈夫曼解码,然后进行Zig-zag反扫描,接着进行反量化,最后进行逆APDSBT。
基于全相位列率滤波和离散正弦变换,提出全相位离散正弦双正交变换来提高JPEG的编码性能,并在量化时采用均一量化,简化了量化过程。
针对利用传统处理器对图像进行JPEG编解码效率低的问题,提出了一种利用图形处理器的并行APDSBT-JPEG图像编解码系统。
CUDA是英伟达在2007年针对图形处理器推出的通用并行计算架构,CUDA采用类C语言,极大地节省了开发人员的学习任务,简化了图形处理器编程接口,降低了利用图形处理器进行并行编程的难度,使开发人员可以很容易地进行开发。如图1所示,基于GPU的并行运算的实质在于对任务进行合理的分解,在一个CUDA程序的内核函数中包含两层并行结构,线程间的并行和线程块间的并行,每一个内核函数被映射到一个线程网格中,因此,对于图像数据,也进行相应的映射。
在本发明中,采用基于GPU的并行算法对提出的APDSBT-JPEG算法进行加速,相比于传统的CPU,可以获得百倍的加速。下面结合附图6对该并行算法做进一步描述。
主机Host端:Intel酷睿i3-2100,主频3.1GHz,Host端内存6G;
设备Device端:Nvidia GeForce GTX 480,流处理器单元480个,显存1.5G,显存位宽384bit,核心频率700MHz。
软件环境:CUDA7.0,Windows 10,VS2012。
基于GPU并行的APDSBT-JPEG图像压缩算法的具体实现过程如下:
(1)在主机端(CPU),CPU预先在内存中申请两块内存空间x和y,分别用于存放从硬盘中读取的数据,以及压缩后的数据。将源图像数据从硬盘中加载到内存x。在设备端的显存中申请两块大小一样的内存X1和X2;
(2)通过CPU将主机端内存x拷贝到设备端显存X1中;
(3)根据图像尺寸分配GPU资源,为图像中每个8×8的图像块在线程网格中申请一块对应大小的共享内存,并将图像块映射到设备端的线程块,将每个图像块中的每个像素数据映射到线程块中的每个线程。
(4)在每个线程中先对源图像数据并行地进行电平位移-128;
(5)对每个像素数据做全相位离散正弦双正交变换即并行APDSBT变换。
(6)然后对变换后的系数进行并行量化。
(7)对量化后的系数进行并行Zig-zag扫描。
(8)对扫描后的系数采用并行奇偶排序获得非零游程长度,并在GPU端做并行的哈夫曼编码。
(9)将编完码的数据放入显存X2中,并将X2拷贝到CPU的内存中,在CPU端经过处理后输出。
在解码端,解压缩的步骤如下:
(1)在主机端(CPU),CPU预先在内存中申请两块内存空间x1和y1,分别用于存放从硬盘中读取的压缩图像,以及解压缩后的重建图像。将压缩图像从硬盘中加载到内存x1。在设备端的显存中申请两块大小一样的内存Y1和Y2;
(2)将内存x1拷贝到显存Y1中,对数据分割,并行地进行预处理;
(3)对并行处理后的哈夫曼编码系数,在GPU中进行并行的哈夫曼解码;
(4)对解码后的系数,再次进行映射,为每个8×8的系数块在线程网格中申请一块对应大小的共享内存,并将系数块映射到设备端的线程块,将每个系数块中的每个像素数据映射到线程块中的每个线程;
(5)对线程中的每个数据并行地进行反量化;
(6)对反量化后的系数进行并行Zig-zag反扫描;
(7)对反扫描后的系数做逆全相位离散正弦双正交变换即并行IAPDSBT变换;
(8)将每个线程中逆变换后得到的系数进行电平平移+128;
(9)将并行解码后的数据放入显存Y2中,并将Y2拷贝到CPU的内存中,即得到重建图像。
下面结合基于CPU端和GPU端的APDSBT-JPEG的处理时间的测试结果,对本发明的结果做进一步描述。
本发明的测试图像采用7幅大小分别为128×128、128×256、256×256、256×512、512×512、512×1024、1024×1024,比特深度均为8bit的灰度图像,通过对比APDSBT-JPEG算法在CPU端和GPU端运行20次的平均时间进行分析,实验结果详见表2。
表2APDSBT-JPEG在CPU平台和GPU平台运行时间对比
从表2中的实验数据可以看出,基于GPU并行的APDSBT-JPEG算法相较于传统的基于CPU的串行算法有着近百倍的加速比,极大地节省了压缩和解压缩时间。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.基于全相位离散正弦双正交变换的图像压缩方法,其特征是,包括在编码端对图像进行类JPEG压缩编码的步骤及接收端进行解压缩的步骤;
其中,在编码端对图像进行类JPEG压缩编码时:对输入的源图像进行分块,对每个图像块进行全相位离散正弦双正交变换,对变换后的系数进行均一量化,对量化后的系数进行Zig-zag扫描,对扫描重排后的系数进行哈夫曼编码,得到输出图像;
对应的,在接收端进行解压缩时采用与在编码端对图像进行压缩编码相逆的步骤,得到重建图像。
2.如权利要求1所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,在接收端进行解压缩时的过程为:接收压缩后的图像比特序列;对序列进行哈夫曼解码;对解码后的数据进行Zig-zag反扫描;对扫描后得到的系数反量化;对反量化后的变换系数进行逆全相位离散正弦双正交变换;将逆变换处理后的数据写入硬盘;得到重建图像。
3.如权利要求1或2所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,全相位离散正弦双正交变换为将全相位列率滤波器用于离散正弦变换得到的一种新型变换。
4.如权利要求3所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,全相位离散正弦双正交变换采用H.265标准使用的VII型大小为N×N二维离散正弦变换的变换矩阵,由于离散正弦变换为正交变换,将N个响应的平均值y(n)作为序列x(n)的全相位列率滤波输出,其中转换矩阵V建立了时域的单位脉冲响应和正交变换域的列率响应之间的关系。
5.如权利要求1所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,基于全相位离散正弦双正交变换的图像压缩采用基于GPU的并行算法进行加速,主要包括基于GPU的并行算法的图像压缩的步骤及基于GPU的并行算法的图像解压缩的步骤。
6.如权利要求5所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,基于GPU的并行算法的全相位离散正弦双正交变换的图像压缩包括:
在编码端的主机端,CPU预先在内存中申请两块内存空间x和y,分别用于存放从硬盘中读取的数据,以及压缩后的数据。将源图像数据从硬盘中加载到内存x,在设备端的显存中申请两块大小一样的内存X1和X2;
通过CPU将主机端内存x拷贝到设备端显存X1中;
根据图像尺寸分配GPU资源,为图像中每个图像块在线程网格中申请一块对应大小的共享内存,并将图像块映射到设备端的线程块,将每个图像块中的每个像素数据映射到线程块中的每个线程;
在每个线程中先对源图像数据并行地进行电平位移。
7.如权利要求6所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,图像压缩还包括:
对每个像素数据做全相位离散正弦双正交变换即并行全相位离散正弦双正交变换;
然后对变换后的系数进行并行量化;
对量化后的系数进行并行Zig-zag扫描;
对扫描后的系数采用并行奇偶排序获得非零游程长度,并在GPU端做并行的哈夫曼编码;
将编完码的数据放入显存X2中,并将X2拷贝到CPU的内存中,在CPU端经过处理后输出。
8.如权利要求5所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,基于GPU的并行算法的全相位离散正弦双正交变换的图像解压缩包括:
在解码端的主机端,CPU预先在内存中申请两块内存空间x1和y1,分别用于存放从硬盘中读取的压缩图像,以及解压缩后的重建图像,将压缩图像从硬盘中加载到内存x1,在设备端的显存中申请两块大小一样的内存Y1和Y2;
将内存x1拷贝到显存Y1中,对数据分割,并行地进行预处理;
对并行处理后的哈夫曼编码系数,在GPU中进行并行的哈夫曼解码;
对解码后的系数,再次进行映射,为每个系数块在线程网格中申请一块对应大小的共享内存,并将系数块映射到设备端的线程块,将每个系数块中的每个像素数据映射到线程块中的每个线程。
9.如权利要求8所述的基于全相位离散正弦双正交变换的图像压缩方法,其特征是,基于GPU的并行算法的图像解压缩还包括:
对线程中的每个数据并行地进行反量化;
对反量化后的系数进行并行Zig-zag反扫描;
对反扫描后的系数做逆全相位离散正弦双正交变换即并行IAPDSBT变换;
将每个线程中逆变换后得到的系数进行电平平移;
将并行解码后的数据放入显存Y2中,并将Y2拷贝到CPU的内存中,即得到重建图像。
10.基于全相位离散正弦双正交变换的图像压缩系统,其特征是,包括编码端及解码端;
其中,在编码端包括全相位离散正弦双正交变换模块,用于实现对分块后的图像进行全相位离散正弦双正交变换;
均一量化模块,用于实现对变换后的系数进行均一量化;
Zig-zag扫描模块,用于实现对量化后的系数进行Zig-zag扫描;
哈夫曼编码模块,用于实现对扫描重排后的系数进行哈夫曼编码,得到输出图像;
在解码端包括哈夫曼解码模块,用于实现对压缩后的图像比特序列进行哈夫曼解码;
Zig-zag反扫描模块,用于实现对解码后的数据进行Zig-zag反扫描;
反量化模块,用于实现对扫描后得到的系数反量化;
逆全相位离散正弦双正交变换模块,用于实现对反量化后的变换系数进行逆全相位离散正弦双正交变换,得到重建图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610331215.0A CN105847800B (zh) | 2016-05-18 | 2016-05-18 | 基于全相位离散正弦双正交变换的图像压缩方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610331215.0A CN105847800B (zh) | 2016-05-18 | 2016-05-18 | 基于全相位离散正弦双正交变换的图像压缩方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105847800A true CN105847800A (zh) | 2016-08-10 |
CN105847800B CN105847800B (zh) | 2018-10-09 |
Family
ID=56592944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610331215.0A Active CN105847800B (zh) | 2016-05-18 | 2016-05-18 | 基于全相位离散正弦双正交变换的图像压缩方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105847800B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107483850A (zh) * | 2017-08-11 | 2017-12-15 | 西安电子科技大学 | 一种低延迟的高清数字图像传输方法 |
CN109756735A (zh) * | 2017-11-06 | 2019-05-14 | 北京京东尚科信息技术有限公司 | 用于视频播放的方法及装置 |
CN110298779A (zh) * | 2018-03-23 | 2019-10-01 | 北京京东尚科信息技术有限公司 | 一种信息隐藏的方法和装置 |
WO2020056760A1 (en) * | 2018-09-21 | 2020-03-26 | Alibaba Group Holding Limited | Transform selection for small size block |
CN111327963A (zh) * | 2018-12-17 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 水印嵌入及提取方法、装置和设备 |
WO2021042232A1 (en) * | 2019-09-02 | 2021-03-11 | Beijing Voyager Technology Co., Ltd. | Methods and systems for improved image encoding |
CN112541913A (zh) * | 2020-12-24 | 2021-03-23 | 石家庄铁道大学 | 一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法 |
CN116128737A (zh) * | 2023-04-19 | 2023-05-16 | 南京大学 | 一种基于数据压缩的图像超分网络鲁棒性提升装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050100230A1 (en) * | 2003-11-07 | 2005-05-12 | Moore Darnell J. | Image compression |
CN1825894A (zh) * | 2006-03-22 | 2006-08-30 | 天津大学 | 全相位余弦双正交变换及其对jpeg的改进方法 |
CN103974079A (zh) * | 2014-05-28 | 2014-08-06 | 山东大学(威海) | 基于全相位双正交变换的mpeg-4简单档次编码方法和装置 |
-
2016
- 2016-05-18 CN CN201610331215.0A patent/CN105847800B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050100230A1 (en) * | 2003-11-07 | 2005-05-12 | Moore Darnell J. | Image compression |
CN1825894A (zh) * | 2006-03-22 | 2006-08-30 | 天津大学 | 全相位余弦双正交变换及其对jpeg的改进方法 |
CN103974079A (zh) * | 2014-05-28 | 2014-08-06 | 山东大学(威海) | 基于全相位双正交变换的mpeg-4简单档次编码方法和装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107483850A (zh) * | 2017-08-11 | 2017-12-15 | 西安电子科技大学 | 一种低延迟的高清数字图像传输方法 |
CN109756735A (zh) * | 2017-11-06 | 2019-05-14 | 北京京东尚科信息技术有限公司 | 用于视频播放的方法及装置 |
CN110298779A (zh) * | 2018-03-23 | 2019-10-01 | 北京京东尚科信息技术有限公司 | 一种信息隐藏的方法和装置 |
WO2020056760A1 (en) * | 2018-09-21 | 2020-03-26 | Alibaba Group Holding Limited | Transform selection for small size block |
CN111327963A (zh) * | 2018-12-17 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 水印嵌入及提取方法、装置和设备 |
WO2021042232A1 (en) * | 2019-09-02 | 2021-03-11 | Beijing Voyager Technology Co., Ltd. | Methods and systems for improved image encoding |
CN112541913A (zh) * | 2020-12-24 | 2021-03-23 | 石家庄铁道大学 | 一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法 |
CN112541913B (zh) * | 2020-12-24 | 2022-04-12 | 石家庄铁道大学 | 一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法 |
CN116128737A (zh) * | 2023-04-19 | 2023-05-16 | 南京大学 | 一种基于数据压缩的图像超分网络鲁棒性提升装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105847800B (zh) | 2018-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105847800A (zh) | 基于全相位离散正弦双正交变换的图像压缩方法及系统 | |
US11974069B2 (en) | Image processing method and device using feature map compression | |
Cheng et al. | Energy compaction-based image compression using convolutional autoencoder | |
Kim et al. | A real-time convolutional neural network for super-resolution on FPGA with applications to 4K UHD 60 fps video services | |
US11962937B2 (en) | Method and device of super resolution using feature map compression | |
JP2002335542A (ja) | デジタル画像の圧縮方法 | |
CN103905831B (zh) | 基于图形处理器的条带波变换图像压缩方法 | |
US11956569B2 (en) | Image processing method and device using a line-wise operation | |
CN113079378B (zh) | 图像处理方法、装置和电子设备 | |
AU2019101272A4 (en) | Method and apparatus for super-resolution using line unit operation | |
CN104427349A (zh) | 一种Bayer图像压缩方法 | |
Bao et al. | Taylor series based dual-branch transformation for learned image compression | |
CN104683818A (zh) | 基于双正交不变集多小波的图像压缩方法 | |
CN104869426A (zh) | 在低压缩码率下降低图像方块效应的jpeg编码方法 | |
Shan et al. | All phase discrete sine biorthogonal transform and its application in JPEG-like image coding using GPU | |
CN113141506A (zh) | 基于深度学习的图像压缩神经网络模型、及其方法和设备 | |
Jiang et al. | LLIC: Large Receptive Field Transform Coding with Adaptive Weights for Learned Image Compression | |
Saraf et al. | Design and implementation of novel SPIHT algorithm for image compression | |
CN109451314A (zh) | 一种基于图模型的图像压缩感知方法 | |
Jayanthi et al. | Multi Wavelet Based Image Compression for Tele-Medical Applications | |
Walker et al. | A low-power, low-memory system for wavelet-based image compression | |
Yagnasree et al. | Image compression using neural networks | |
Kaur et al. | Algorithm for fuzzy based compression of gray JPEG images for big data storage | |
Xu et al. | Window-based Channel Attention for Wavelet-enhanced Learned Image Compression | |
Mohanty et al. | A novel speck algorithm for faster image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |