CN117241042B - 一种利用dct进行图像块分类的分形图像压缩方法及系统 - Google Patents
一种利用dct进行图像块分类的分形图像压缩方法及系统 Download PDFInfo
- Publication number
- CN117241042B CN117241042B CN202311111147.3A CN202311111147A CN117241042B CN 117241042 B CN117241042 B CN 117241042B CN 202311111147 A CN202311111147 A CN 202311111147A CN 117241042 B CN117241042 B CN 117241042B
- Authority
- CN
- China
- Prior art keywords
- block
- codebook
- class
- range
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims abstract description 82
- 230000006835 compression Effects 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000009466 transformation Effects 0.000 claims abstract description 34
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 12
- 238000009499 grossing Methods 0.000 claims description 17
- 230000001131 transforming effect Effects 0.000 claims 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000001133 acceleration Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种利用DCT进行图像块分类的分形图像压缩方法及系统,包括:接收到图像后,将图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;对码本块进行DCT变换提取码本块水平和垂直系数,根据码本块水平和垂直系数确定Range块的平滑类阈值和对角/次对角类阈值;在编码时对Range块进行DCT变换提取Range块水平和垂直系数,并根据平滑类阈值和对角/次对角类阈值将Range块分为平滑类、对角/次对角类、垂直/水平类;对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,完成图像的压缩。本发明达到显著降低编码搜索时间的目的。
Description
技术领域
本发明涉及图像压缩技术领域,具体涉及一种利用DCT进行图像块分类的分形图像压缩方法及系统。
背景技术
近年来,有损图像压缩的方法得到较多的改良,但多数都是以深度学习驱动的图像压缩,深度学习驱动的图像压缩与JPEG“Wallace G K.The JPEG still picturecompression standard[J].IEEE transactions on consumer electronics,1992,38(1):xviii-xxxiv.”或者JPEG2000“Rabbani M,Joshi R.An overview ofthe JPEG 2000stillimage compression standard[J].Signal processing:Image communication,2002,17(1):3-48.”等使用离散余弦变换(DCT)的主流图像压缩算法相比较,虽然可以获得不错的压缩率和解码图像质量,但由于神经网络的计算量较大,因此编码的时间也相对较长。
在传统图像压缩算法里,除了使用频域压缩的JPEG和JPEG2000之外,还有使用空域压缩的分形图像编码“Jacquin A E.Image coding based on a fract al theory ofiterated contractive image transformations[J].IEEE Transactions on imageprocessing,1992,1(1):18-30.”,该方法是一种利用图像自相似性的有损图像压缩“TheisL,Shi W,Cunningham A,et al.Lossy image compression with compressiveautoencoders[J].arXiv preprint arXiv:1703.00395,2017.”,且分形图像压缩编码具备极高的压缩率,因此相较于上述深度学习压缩和频域压缩能获得更好的压缩效果。
分形图像压缩算法的最大缺点就是因为其编码时需要大量的全搜索导致编码时间过长。目前也有一些研究工作使用CUDA来对分形图像压缩进行加速,文献“Al SideiriA,Alzeidi N,Al Hammoshi M,et al.CUDA implementation of fractal imagecompression[J].Journal of Real-Time Image Processing,2020,17(5):1375-1387.”中使用了CUDA来对分形图像编码进行加速,但该方案的加速比较低。文献“Hernandez-LopezF J,O.Parallel fractal imag e compression using quadtreepartition with task and dynamic parallelism[J].Jo urnal of Real-Time ImageProcessing,2022,19(2):391-402.”中使用了GPU和多核系统来对四叉树分形图像压缩进行加速,加速比最高也仅为25倍。
上述方案虽然对分形图像压缩算法起到了一定的加速作用,但是依旧没有解决分形图像压缩算法的编码搜索时间过长的技术问题。
发明内容
为了克服现有技术的不足,本发明提供一种利用DCT进行图像块分类的分形图像压缩方法及系统,用于解决现有的分形图像压缩算法的编码搜索时间过长的技术问题,从而达到保持解码图像质量基本不变的前提下,显著降低编码搜索时间的目的。
为解决上述问题,本发明所采用的技术方案如下:
一种利用DCT进行图像块分类的分形图像压缩方法,包括以下步骤:
接收到需进行压缩的图像后,将所述图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;
对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值和对角/次对角类阈值;
在编码时对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据所述平滑类阈值和所述对角/次对角类阈值将所述Range块分为平滑类、对角/次对角类、垂直/水平类;
对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成所述图像的压缩。
作为本发明优选的实施方式,在对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数时,包括:
对所述码本块进行DCT变换,得到所述码本块的DCT系数,如公式1所示:
式中,F(m,n)为所述码本块的DCT系数,m,n=0,1,2...,N-1,
作为本发明优选的实施方式,在对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,还包括:
根据所述码本块的DCT系数进一步得到所述码本块水平系数和所述码本块垂直系数,如公式2和公式3所示:
式中,F(1,0)为所述码本块水平系数,F(0,1)为所述码本块垂直系数,θi=(2i+1)π/16,θj=(2j+1)π/16;
其中,所述码本块水平系数用于反映所述码本块左右部分的强度变化,所述码本块垂直系数用于反映所述码本块上下部分的强度变化。
作为本发明优选的实施方式,在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值,包括:
将平滑类块阈值设置为Fs,并根据所述码本块水平系数和所述码本块垂直系数得到所述平滑类块阈值Fs,如公式4所示:
Fs=Max(F(0,1),F(1,0)) (4);
式中,F(1,0)为所述码本块水平系数,F(0,1)为所述码本块垂直系数;
对所述平滑类块阈值Fs进行排序并分为N个统计直方区间,选取前Ns个区间作为所述码本块平滑类的数量,并记录所述Range块的平滑类阈值Ts;
其中,Ts=Ns+1。
作为本发明优选的实施方式,在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的对角/次对角类阈值,包括:
将对角/次对角类块阈值设置为Fd,并根据所述码本块水平系数和所述码本块垂直系数得到所述对角/次对角类块阈值Fd,如公式5所示:
Fd=||F(0,1)|-|F(1,0)|| (5);
对所述对角/次对角类块阈值Fd进行排序并分为N个统计直方区间,选取前Nd个区间作为所述码本块对角/次对角类的数量,并记录所述Range块的对角/次对角类阈值Td;
其中,Td=Nd+1。
作为本发明优选的实施方式,在对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,包括:
对所述Range块进行DCT变换,得到所述Range块的DCT系数,如公式6所示:
式中,F(m,n)为所述Range块的DCT系数,m,n=0,1,2...,N-1,
作为本发明优选的实施方式,在对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,还包括:
根据所述Range块的DCT系数进一步得到所述Range块水平系数和所述Range块垂直系数,如公式7和公式8所示:
式中,F(1,0)为所述Range块水平系数,F(0,1)为所述Range块垂直系数,θi=(2i+1)π/16,θj=(2j+1)π/16;
其中,所述Range块水平系数用于反映所述Range块左右部分的强度变化,所述Range块垂直系数用于反映所述Range块上下部分的强度变化。
作为本发明优选的实施方式,在将所述Range块分为平滑类、对角/次对角类、垂直/水平类时,包括:
判断所述Range块的Range块水平系数和Range块垂直系数是否均小于所述平滑类阈值Ts,若是,则将所述Range块判定为平滑类;
若否,则执行对角/次对角类判定步骤。
作为本发明优选的实施方式,在执行对角/次对角类判定步骤时,包括:
获取所述Range块的Range块水平系数的绝对值和Range块垂直系数的绝对值间的差值,并判断所述差值的绝对值是否小于所述对角/次对角类阈值Td;
若是,则将所述Range块判定为对角/次对角类;
若否,则将所述Range块判定为垂直/水平类。
一种利用DCT进行图像块分类的分形图像压缩系统,包括:
分割单元:用于接收到需进行压缩的图像后,将所述图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;
阈值确定单元:用于对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值和对角/次对角类阈值;
分类单元:用于在编码时对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据所述平滑类阈值和所述对角/次对角类阈值将所述Range块分为平滑类、对角/次对角类、垂直/水平类;
压缩单元:用于对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成所述图像的压缩。
相比现有技术,本发明的有益效果在于:
(1)本发明提供了一种基于离散余弦变换的分形图像块分类方案,并使用NVIDIA的CUDA架构实现并行编码,并通过具体实施方式中的实验显示,本发明可实现107倍的加速比,编码时间显著降低,同时解码图像PSNR值的下降仅在0.5左右,解码图像质量基本不变,因此本发明具备较大的实用性;
(2)本发明提出了一种动态调整分类阈值的方法,使分类方案能够根据每一个图像的分布特点,自适应调整每个类的数量,以保证图像编码的效果;
(3)本发明改进了传统方案对分类阈值不明确的缺点,做到了编码时间和解码图像的PSNR之间的平衡,并提出了基于DCT分类方案的分形图像并行编码架构,同时利用CUDA架构对其进行实验,实验表明本发明的方案相对传统利用DCT进行图像块分类的分形图像压缩编码有更快的编码时间和更高的解码图像PSNR值。
下面结合附图和具体实施方式对本发明作进一步详细说明。
附图说明
图1-是本发明实施例的利用DCT进行图像块分类的分形图像压缩方法步骤图;
图2-是本发明实施例的图像块的DCT系数划分流程图;
图3-是本发明实施例的图像块的Ts和Td阈值排序图;
图4-是本发明实施例的不同阈值对PSNR和解码时间的影响示意图;
图5-是本发明实施例的基于DCT分类方案的分形图像编码流程图;
图6-是本发明实施例的基于DCT分类方案的分形图像并行编码架构图;
图7-是本发明实施例的不同压缩方法在多幅经典图像以及自相似性比较强的显微图像的压缩效果对比图。
具体实施方式
本发明所提供的利用DCT进行图像块分类的分形图像压缩方法,如图1所示,包括以下步骤:
步骤S1:接收到需进行压缩的图像后,将图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;
步骤S2:对码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据码本块水平系数和码本块垂直系数确定Range块的平滑类阈值和对角/次对角类阈值;
步骤S3:在编码时对Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据平滑类阈值和对角/次对角类阈值将Range块分为平滑类、对角/次对角类、垂直/水平类;
步骤S4:对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成图像的压缩。
在上述步骤S2中,在对码本块进行DCT变换提取码本块水平系数和码本块垂直系数时,包括:
对码本块进行DCT变换,得到码本块的DCT系数,如公式1所示:
式中,F(m,n)为码本块的DCT系数,m,n=0,1,2...,N-1,
在上述步骤S2中,在对码本块进行DCT变换提取码本块水平系数和码本块垂直系数,还包括:
根据码本块的DCT系数进一步得到码本块水平系数和码本块垂直系数,如公式2和公式3所示:
式中,F(1,0)为码本块水平系数,F(0,1)为码本块垂直系数,θi=(2i+1)π/16,θj=(2j+1)π/16;
其中,码本块水平系数用于反映码本块左右部分的强度变化,码本块垂直系数用于反映码本块上下部分的强度变化。
在上述步骤S2中,在根据码本块水平系数和码本块垂直系数确定Range块的平滑类阈值,包括:
将平滑类块阈值设置为Fs,并根据码本块水平系数和码本块垂直系数得到平滑类块阈值Fs,如公式4所示:
Fs=Max(F(0,1),F(1,0)) (4);
式中,F(1,0)为码本块水平系数,F(0,1)为码本块垂直系数;
对平滑类块阈值Fs进行排序并分为N个统计直方区间,选取前Ns个区间作为码本块平滑类的数量,并记录Range块的平滑类阈值Ts;
其中,Ts=Ns+1。
在上述步骤S2中,在根据码本块水平系数和码本块垂直系数确定Range块的对角/次对角类阈值,包括:
将对角/次对角类块阈值设置为Fd,并根据码本块水平系数和码本块垂直系数得到对角/次对角类块阈值Fd,如公式5所示:
Fd=||F(0,1)|-|F(1,0)|| (5);
对对角/次对角类块阈值Fd进行排序并分为N个统计直方区间,选取前Nd个区间作为码本块对角/次对角类的数量,并记录Range块的对角/次对角类阈值Td;
其中,Td=Nd+1。
在上述步骤S3中,在对Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,包括:
对Range块进行DCT变换,得到Range块的DCT系数,如公式6所示:
式中,F(m,n)为Range块的DCT系数,m,n=0,1,2...,N-1,
在上述步骤S3中,在对Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,还包括:
根据Range块的DCT系数进一步得到Range块水平系数和Range块垂直系数,如公式7和公式8所示:
式中,F(1,0)为Range块水平系数,F(0,1)为Range块垂直系数,θi=(2i+1)π/16,θj=(2j+1)π/16;
其中,Range块水平系数用于反映Range块左右部分的强度变化,Range块垂直系数用于反映Range块上下部分的强度变化。
在上述步骤S3中,在将Range块分为平滑类、对角/次对角类、垂直/水平类时,包括:
判断Range块的Range块水平系数和Range块垂直系数是否均小于平滑类阈值Ts,若是,则将Range块判定为平滑类;
若否,则执行对角/次对角类判定步骤。
在上述步骤S3中,在执行对角/次对角类判定步骤时,包括:
获取Range块的Range块水平系数的绝对值和Range块垂直系数的绝对值间的差值,并判断差值的绝对值是否小于对角/次对角类阈值Td;
若是,则将Range块判定为对角/次对角类;
若否,则将Range块判定为垂直/水平类。
具体地,本发明提出了一种动态调整分类阈值的方法,使分类方案能够根据每一个图像的分布特点,自适应调整每个类的数量,以保证图像编码的效果。
为了保证解码图像的质量,本发明将图像块分为三个类,分别是平滑类、对角/次对角类、水平/垂直类。该分类方案主要是依据图像块的DCT垂直和水平系数来实现分类,设f是一个大小为N*N的图像块,其DCT系数用F来表示,则如下公式:
其中,m,n=0,1,2...,N-1,
假设N=8,则该图像块的垂直和水平系数如下:
其中,θi=(2i+1)π/16,i=0,1,2,...,7。从式中可知,当i=0,1,2,3时,cosθi>0,当i=4,5,6,7时,cosθi<0。因为cosθi是独立于j的,则F(1,0)反映了图像块左右部分的强度变化,F(0,1)反映了图像块上下部分的强度变化,在图像块的DCT变换系数中,低频系数占据了大部分的能量,而高频系数一般只包含少部分比较精细的图像信息。由于能量浓度的原因,如果两个图像块的低频系数比较相似,那么这两个图像块的相似度会比较高。从另一个角度来说,如果两个图像块除了部分的细节之外都比较相似,那么这两个图像块通常也具有相似的DCT低频系数。
进一步地,包含图像块的亮度信息的F(0,0)也可以用于分形图像压缩编码的过程中,排除DCT直流分量的低频系数足以满足两个图像块的相似度的度量。
本发明所提供的分形图像压缩方法的划分流程如图2所示。其中F为图像块经过DCT变换后的DCT系数矩阵,当DCT系数矩阵的F(0,1)与F(1,0)都小于阈值Ts,则将该图像块判定为平滑类,记作类型S。当DCT系数矩阵的F(0,1)与F(1,0)的绝对值差小于阈值Td时,将该图像块判定为对角/次对角类,记作类型D。其他的块则判定为水平/垂直类,记作类型H。
对于图像块的DCT分类而言,阈值Ts和Td是划分S类和D类、H类的重要依据,在本发明中阈值Ts和Td不使用固定的值,而是根据图像块自身在不同尺度的自相似划分,本发明对多幅图像分割后的图像块进行DCT变换,并对S类和D类进行排序后发现,较多的数值都集中在相对比较小的区间内,如图3所示。其中深色的代表S类的阈值排序,浅色代表D类的阈值排序,都是相对集中在比较小的区间内,因此本发明选取压缩时间和解码图像质量都相对较优的区间,本发明对S类和D类的阈值区间从1-15逐步递进,然后记录图像的编码时间和解码PSNR,其中X轴为Ts,Y轴为Td,Z轴的取值为PSNR/编码时间,因此Z轴的数值越大越好,结果如图4所示。
由图4中可以发现当Ts=3,Td=4,效果相对最优,因此基于DCT分类的阈值选取为Ts=3,Td=4。
基于上述DCT分类方案的分形图像压缩编码流程如图5所示。在本发明中,将图像进行基本分形图像分割,随后先将码本块进行DCT变换,选取码本块的F(0,1)和F(1,0)系数将码本块分为平滑类、对角/次对角类、垂直/水平类。然后在编码时对Range块进行DCT变换后提取该Range块的F(0,1)和F(1,0)系数进行分类,按照其类别在所属码本块里对码本块基于DCT分类的并行编码架构进行并行搜索,最后输出分形图像编码,其算法步骤如下:
Step1:图像预处理,将图像按设定的大小分为码本块和Range块;
Step2:对码本块进行DCT变换,提取F(1,0)和F(1,0)系数;
Step3:将平滑类的块阈值设置为Fs,则Fs=Max(F(0,1),F(1,0)),对所有Fs进行排序并分为100个统计直方区间,选取前Ns个区间作为类S的数量,并记录阈值Ts,Ts=Ns+1;
Step4:将对角/次对角类的块阈值设置为Fd,则Fd=||F(0,1)|-|F(1,0)||,对所有Fd进行排序并分为100个统计直方区间,选取前Nd个区间作为类D的数量,并记录阈值Td,Td=Nd+1;
Step5:将其他不符合Step3和Step4的码本块分类为垂直/水平类,记为类H;
Step6:对Range块进行DCT变换,提取F(0,1)和F(1,0)系数,若该块的Fs=Max(F(0,1),F(1,0))小于阈值Ts则为S类。否则计算Fd=||F(0,1)|-|F(1,0)||是否小于阈值Td,若小于则为D类,否则为H类;
Step7:对于不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构进行仿射变换搜索,输出分形图形编码;
Step8:重复Step6、Step7,直至完成所有Range块的编码,输出完整的分形图像编码。
具体地,采用本发明的基于DCT分类方案的分形图像压缩编码每次搜索的范围仅有全搜索方案的1/3左右,已经大大缩短了编码搜索时间。但是分类后搜索依然采取全搜索的方式,对所有码本块计算仿射变换依然比较耗时。因此本发明根据分形图像编码的压缩过程中的每个Range块之间的编码互不干扰,并且具备较好的并行加速的加速空间的特点,基于CUDA架构设计了一种基于DCT分类的分形图像的并行编码架构,其架构如图6所示。
在本发明中主要利用了CUDA的并行处理能力,将分形图像编码中比较耗时的串行图像块仿射变换匹配过程在GPU中并行计算,同时将图像块进行分类后可以有效减少不必要的仿射变换匹配过程。
本发明所提供的利用DCT进行图像块分类的分形图像压缩系统,包括:分割单元、阈值确定单元、分类单元以及压缩单元。
分割单元用于接收到需进行压缩的图像后,将图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块。
阈值确定单元用于对码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据码本块水平系数和码本块垂直系数确定Range块的平滑类阈值和对角/次对角类阈值。
分类单元用于在编码时对Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据平滑类阈值和对角/次对角类阈值将Range块分为平滑类、对角/次对角类、垂直/水平类。
压缩单元用于对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成图像的压缩。
以下的实验是对本发明的进一步说明,但本发明的范围并不限制于此。
为了验证本发明所提供的分形图像压缩方法的性能,本实验对本发明所提供的分形图像压缩方法进行综合对比,本实验的系统环境为Windows 11,硬件环境:Intel I7-9700,32G内存,RTX 2070显。图像采用256*256大小的灰度图像,Range块的大小为4*4,Domain块的大小为8*8,实现语言为Python 3.8,CUDA调用采用Numba。在本实验进行了不同压缩方法在多幅经典图像以及自相似性比较强的显微图像的压缩效果对比。不同压缩方法包括:基本分形压缩方法、文献“Duh D J,Jeng J H,Chen S Y.DCT based simpleclassificatio n scheme for fractal image compression[J].Image and visioncomputing,2005,23(13):1115-1121.”的分形压缩方法以及本发明的分形图像压缩方法。其中,文献的分形压缩方法是通过DCT系数对Range块和Domain块分类,但其分类的类别阈值计算方案采用三类等分的方式,存在某些类过度聚类、某些类聚类不足等问题。
实验结果如图7以及表一所示,表一如下:
表一压缩方法性能对比表
从上表中可以发现,文献的分形压缩方法虽然采取了固定块分割的方式,获得了稳定3倍的加速比,但其解码图像质量并不是最优的。本发明分类方法(仅采用了DCT分类,并未使用并行编码架构进行仿射变换搜索)选取各类中阈值比较接近的区间来对图像块进行分类,保证了加速比接近3的同时,也优化了解码图像质量,是一种在编码时间和解码图像质量之间相对平衡的分类方案。本发明分类+并行方法同时还将分类方法使用CUDA进行并行加速,在保持解码图像质量不变的前提下,大大缩短了编码时间,达到了107倍的加速比,具备一定的实用性。
结论:本发明提出了一种利用DCT进行图像块分类的分形图像压缩方法,改进了传统方案对分类阈值不明确的缺点,做到了编码时间和解码图像的PSNR之间的平衡,并提出了基于DCT分类方案的分形图像并行编码架构,同时利用CUDA架构对其进行实验,实验表明本发明的方法相对传统利用DCT进行图像块分类的分形图像压缩编码方法(文献方法)有更快的编码时间和更高的解码图像PSNR值。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (8)
1.一种利用DCT进行图像块分类的分形图像压缩方法,其特征在于,包括以下步骤:
接收到需进行压缩的图像后,将所述图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;
对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值和对角/次对角类阈值;
在编码时对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据所述平滑类阈值和所述对角/次对角类阈值将所述Range块分为平滑类、对角/次对角类、垂直/水平类;
对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成所述图像的压缩;
其中,在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值,包括:
将平滑类块阈值设置为,并根据所述码本块水平系数和所述码本块垂直系数得到所述平滑类块阈值/>,如公式4所示:
(4);
式中,为所述码本块水平系数,/>为所述码本块垂直系数;
对所述平滑类块阈值进行排序并分为/>个统计直方区间,选取前/>个区间作为所述码本块平滑类的数量,并记录所述Range块的平滑类阈值/>;
其中,;
在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的对角/次对角类阈值,包括:
将对角/次对角类块阈值设置为,并根据所述码本块水平系数和所述码本块垂直系数得到所述对角/次对角类块阈值/>,如公式5所示:
(5);
对所述对角/次对角类块阈值进行排序并分为/>个统计直方区间,选取前/>个区间作为所述码本块对角/次对角类的数量,并记录所述Range块的对角/次对角类阈值/>;
其中,;
所述平滑类阈值和所述对角/次对角类阈值/>基于解码PSNR/编码时间的取值决定;
其中,PSNR(Peak Signal-to-Noise Ratio)为峰值信噪比。
2.根据权利要求1所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数时,包括:
对所述码本块进行DCT变换,得到所述码本块的DCT系数,如公式1所示:
(1);
式中,为所述码本块的DCT系数,/>,/>。
3.根据权利要求2所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,还包括:
根据所述码本块的DCT系数进一步得到所述码本块水平系数和所述码本块垂直系数,如公式2和公式3所示:
(2);
(3);
式中,为所述码本块水平系数,/>为所述码本块垂直系数,/>,;
其中,所述码本块水平系数用于反映所述码本块左右部分的强度变化,所述码本块垂直系数用于反映所述码本块上下部分的强度变化。
4.根据权利要求1所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,包括:
对所述Range块进行DCT变换,得到所述Range块的DCT系数,如公式6所示:
(6);
式中,为所述Range块的DCT系数,/>,/>。
5.根据权利要求4所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数时,还包括:
根据所述Range块的DCT系数进一步得到所述Range块水平系数和所述Range块垂直系数,如公式7和公式8所示:
(7);
(8);
式中,为所述Range块水平系数,/>为所述Range块垂直系数,,/>;
其中,所述Range块水平系数用于反映所述Range块左右部分的强度变化,所述Range块垂直系数用于反映所述Range块上下部分的强度变化。
6.根据权利要求1所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在将所述Range块分为平滑类、对角/次对角类、垂直/水平类时,包括:
判断所述Range块的Range块水平系数和Range块垂直系数是否均小于所述平滑类阈值,若是,则将所述Range块判定为平滑类;
若否,则执行对角/次对角类判定步骤。
7.根据权利要求6所述的利用DCT进行图像块分类的分形图像压缩方法,其特征在于,在执行对角/次对角类判定步骤时,包括:
获取所述Range块的Range块水平系数的绝对值和Range块垂直系数的绝对值间的差值,并判断所述差值的绝对值是否小于所述对角/次对角类阈值;
若是,则将所述Range块判定为对角/次对角类;
若否,则将所述Range块判定为垂直/水平类。
8.一种利用DCT进行图像块分类的分形图像压缩系统,其特征在于,包括:
分割单元:用于接收到需进行压缩的图像后,将所述图像进行基本分形图像分割,并按照设定的大小将分割后的图像分为码本块和Range块;
阈值确定单元:用于对所述码本块进行DCT变换提取码本块水平系数和码本块垂直系数,根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值和对角/次对角类阈值;
分类单元:用于在编码时对所述Range块进行DCT变换提取Range块水平系数和Range块垂直系数,并根据所述平滑类阈值和所述对角/次对角类阈值将所述Range块分为平滑类、对角/次对角类、垂直/水平类;
压缩单元:用于对不同类别的Range块,在所属类的码本块基于DCT分类的并行编码架构,进行仿射变换搜索,输出完整的分形图形编码,完成所述图像的压缩;
其中,在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的平滑类阈值,包括:
将平滑类块阈值设置为,并根据所述码本块水平系数和所述码本块垂直系数得到所述平滑类块阈值/>,如公式4所示:
(4);
式中,为所述码本块水平系数,/>为所述码本块垂直系数;
对所述平滑类块阈值进行排序并分为/>个统计直方区间,选取前/>个区间作为所述码本块平滑类的数量,并记录所述Range块的平滑类阈值/>;
其中,;
在根据所述码本块水平系数和所述码本块垂直系数确定所述Range块的对角/次对角类阈值,包括:
将对角/次对角类块阈值设置为,并根据所述码本块水平系数和所述码本块垂直系数得到所述对角/次对角类块阈值/>,如公式5所示:
(5);
对所述对角/次对角类块阈值进行排序并分为/>个统计直方区间,选取前/>个区间作为所述码本块对角/次对角类的数量,并记录所述Range块的对角/次对角类阈值/>;
其中,;
所述平滑类阈值和所述对角/次对角类阈值/>基于解码PSNR/编码时间的取值决定;
其中,PSNR(Peak Signal-to-Noise Ratio)为峰值信噪比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311111147.3A CN117241042B (zh) | 2023-08-31 | 2023-08-31 | 一种利用dct进行图像块分类的分形图像压缩方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311111147.3A CN117241042B (zh) | 2023-08-31 | 2023-08-31 | 一种利用dct进行图像块分类的分形图像压缩方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117241042A CN117241042A (zh) | 2023-12-15 |
CN117241042B true CN117241042B (zh) | 2024-05-14 |
Family
ID=89092128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311111147.3A Active CN117241042B (zh) | 2023-08-31 | 2023-08-31 | 一种利用dct进行图像块分类的分形图像压缩方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117241042B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0986026A1 (en) * | 1998-09-07 | 2000-03-15 | STMicroelectronics S.r.l. | Fractal coding of data in the DCT domain |
KR20020047959A (ko) * | 2000-12-14 | 2002-06-22 | 박종섭 | 적응적인 영상 분류에 의한 프랙탈 영상 압축 방법 |
CN1445981A (zh) * | 2002-03-20 | 2003-10-01 | 富士施乐株式会社 | 图像处理装置,图像处理方法和图像处理程序 |
CN109391818A (zh) * | 2018-11-30 | 2019-02-26 | 昆明理工大学 | 一种基于dct变换的快速搜索分形图像压缩方法 |
CN110730343A (zh) * | 2019-09-20 | 2020-01-24 | 中山大学 | 一种多功能视频编码帧间划分方法、系统及存储介质 |
CN115348453A (zh) * | 2022-10-14 | 2022-11-15 | 广州市绯影信息科技有限公司 | 一种航拍影像的全并行分形编码方法及系统 |
-
2023
- 2023-08-31 CN CN202311111147.3A patent/CN117241042B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0986026A1 (en) * | 1998-09-07 | 2000-03-15 | STMicroelectronics S.r.l. | Fractal coding of data in the DCT domain |
US7233623B1 (en) * | 1998-09-07 | 2007-06-19 | Stmicroelectronics S.R.L. | Method and scalable architecture for parallel calculation of the DCT of blocks of pixels of different sizes and compression through fractal coding |
KR20020047959A (ko) * | 2000-12-14 | 2002-06-22 | 박종섭 | 적응적인 영상 분류에 의한 프랙탈 영상 압축 방법 |
CN1445981A (zh) * | 2002-03-20 | 2003-10-01 | 富士施乐株式会社 | 图像处理装置,图像处理方法和图像处理程序 |
CN109391818A (zh) * | 2018-11-30 | 2019-02-26 | 昆明理工大学 | 一种基于dct变换的快速搜索分形图像压缩方法 |
CN110730343A (zh) * | 2019-09-20 | 2020-01-24 | 中山大学 | 一种多功能视频编码帧间划分方法、系统及存储介质 |
CN115348453A (zh) * | 2022-10-14 | 2022-11-15 | 广州市绯影信息科技有限公司 | 一种航拍影像的全并行分形编码方法及系统 |
Non-Patent Citations (1)
Title |
---|
DCT based simple classification scheme for fractal image compression;D.J. Duh等;Image and Vision computing;20050921;第23 (2005)卷(13);第1115-1121页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117241042A (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325550B (zh) | 基于图像熵的无参考图像质量评价方法 | |
CN115914649B (zh) | 一种用于医疗视频的数据传输方法及系统 | |
US6438268B1 (en) | Vector quantization codebook generation method | |
TWI426774B (zh) | 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法 | |
CN107680077A (zh) | 一种基于多阶梯度特征的无参考图像质量评价方法 | |
CN110428450B (zh) | 应用于矿井巷道移动巡检图像的尺度自适应目标跟踪方法 | |
CN111462261A (zh) | 针对h.266/vvc的快速cu分区和帧内决策方法 | |
CN112200812B (zh) | 多阈值图像的二维分割方法 | |
CN111626178B (zh) | 一种基于新时空特征流的压缩域视频动作识别方法和系统 | |
CN112437310A (zh) | 一种基于随机森林的vvc帧内编码快速cu划分决策方法 | |
CN116665092A (zh) | 基于ia-yolov7的污水悬浮物识别方法及系统 | |
CN111369477A (zh) | 一种针对视频恢复任务的预分析和工具自适应的方法 | |
CN111242891A (zh) | 一种钢轨表面缺陷识别分类方法 | |
He et al. | End-to-end facial image compression with integrated semantic distortion metric | |
CN110728352A (zh) | 一种基于深度卷积神经网络的大规模图像分类方法 | |
CN117241042B (zh) | 一种利用dct进行图像块分类的分形图像压缩方法及系统 | |
CN116935292B (zh) | 一种基于自注意力模型的短视频场景分类方法及系统 | |
CN116896638A (zh) | 一种面向输电运检场景的数据压缩编码技术 | |
Begum et al. | An efficient algorithm for codebook design in transform vector quantization | |
CN114463449A (zh) | 一种基于边缘引导的高光谱图像压缩方法 | |
CN110443755B (zh) | 一种基于高低频信号量的图像超分辨率的方法 | |
Han | Fast fractal image compression using fuzzy classification | |
Bakkouri et al. | Effective CU size decision algorithm based on depth map homogeneity for 3D-HEVC inter-coding | |
Qin et al. | A Complexity-Reducing HEVC Intra-Mode Method Based on VGGNet | |
Ali et al. | Iterative thresholded bi-histogram equalization for medical image enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |