CN117319655B - 一种图像压缩处理方法、系统、装置及介质 - Google Patents
一种图像压缩处理方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN117319655B CN117319655B CN202311597280.4A CN202311597280A CN117319655B CN 117319655 B CN117319655 B CN 117319655B CN 202311597280 A CN202311597280 A CN 202311597280A CN 117319655 B CN117319655 B CN 117319655B
- Authority
- CN
- China
- Prior art keywords
- dimension
- tensor data
- data
- tensor
- decomposition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims abstract description 101
- 230000006835 compression Effects 0.000 title claims abstract description 100
- 238000003672 processing method Methods 0.000 title abstract description 9
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 204
- 238000000034 method Methods 0.000 claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 52
- 239000011159 matrix material Substances 0.000 claims description 95
- 238000005457 optimization Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 24
- 230000006837 decompression Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000008707 rearrangement Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 16
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 230000001419 dependent effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000013144 data compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Abstract
本发明公开了一种图像压缩处理方法、系统、装置及介质,涉及图像处理领域,用于解决指数依赖的问题。该方案对原始图像对应的第一维度张量数据进行量化得到第二维度张量数据;对第二维度张量数据分解得到多个第三维度张量数据,第三维度张量数据的张量参数作为压缩后的压缩图像数据。本发明将第一维度张量数据最终转换为多个第三维度张量数据,第三维度张量数据的维度和规模均小于第一维度张量数据,因此需要用于存储或传输的第三维度张量数据的张量参数的数据量也较小,降低原始图像的数据复杂度,减少了压缩图像数据的存储空间,克服了传统分解方法中的指数依赖张量维数的问题,从而达到更好的图像压缩效果。
Description
技术领域
本发明涉及图像处理领域,特别涉及一种图像压缩处理方法、系统、装置及介质。
背景技术
随着多媒体和网络技术的日益发展,人们对高像素图像的需求不断增加,而在当前的互联网中,视频占据了绝大多数的流量,而视频是由每帧的图像构成的,如何对较大的图像进行尽量小的字节表示,并在图像复原时能够得到较好的质量,显得越来越重要。
传统的图像压缩技术通常采用将图像包含的数据进行向量化处理,然后对向量化的结果进行压缩的方法。然而,这种处理方法会丢失图像在高维空间中的信息。因为一张图片是由像素矩阵和相应的RGB(Red-Green-Blue,红-绿-蓝)颜色通道组成的三维张量,因此我们可以考虑直接采用将图像进行张量表示后进行处理的方式,进而使用张量分解方法来降低数据的复杂度,从而达到图像压缩的目的。
目前存在的基于三维张量的分解方法进行图像压缩时,图像数据压缩后的数据规模仍然是关于维数是指数依赖的,也就是说,没有将复杂度是指数依赖维数的问题彻底解决。
发明内容
本发明的目的是提供一种图像压缩处理方法、系统、装置及介质,将第一维度张量数据最终转换为多个第三维度张量数据,第三维度张量数据的维度和规模均小于第一维度张量数据,因此需要用于存储或传输的第三维度张量数据的张量参数的数据量也较小,降低原始图像的数据复杂度,减少了压缩图像数据的存储空间,克服了传统分解方法中的指数依赖张量维数的问题,从而达到更好的图像压缩效果。
第一方面,本发明提供了一种图像压缩方法,包括:
获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一维度张量数据的第一维度小于所述第二维度张量数据的第二维度;
对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第三维度张量数据的第三维度不大于所述第一维度,且所述第三维度张量数据的张量规模小于所述第一维度张量数据的张量规模;
将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据。
在一种实施例中,所述第一维度张量数据为三维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取所述原始图像;
将所述原始图像的像素矩阵的行设为所述三维张量数据的第一维度数据;
将所述原始图像的像素矩阵的列设为所述三维张量数据的第二维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道设为所述三维张量数据的第三维度数据。
在一种实施例中,所述第一维度张量数据为五维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取所述原始图像;
将所述原始图像的像素矩阵的行设为所述五维张量数据的第一维度数据;
将所述原始图像的像素矩阵的列设为所述五维张量数据的第二维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的红色通道设为所述五维张量数据的第三维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的绿色通道设为所述五维张量数据的第四维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的蓝色通道设为所述五维张量数据的第五维度数据。
在一种实施例中,获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
获取所述原始图像对应的第一维度张量数据;
将所述第一维度张量数据按照每个维度上排列2个元素的方式排列以进行量化处理,得到所述第二维度张量数据。
在一种实施例中,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
对所述第二维度张量数据的每个维度的张量进行矩阵化展开,得到多个第一矩阵;
对每个所述第一矩阵进行分解,得到与各所述第一矩阵对应的第二矩阵,所述第二矩阵与所述第一矩阵的误差不大于预设误差,所述第二矩阵的秩小于所述第一矩阵的秩且不大于预设最大秩;
根据各个所述第二矩阵得到与所述第二矩阵对应的第三维度张量数据。
在一种实施例中,所述第一维度张量数据为五维张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
根据第一预设公式对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一预设公式为:
;
其中,为所述五维张量数据的元素,q为2,L和T为大于1的整数,/>为所述五维张量数据的第一维度指标、/>为所述五维张量数据的第二维度指标、/>为所述五维张量数据的第三维度指标、/>为所述五维张量数据的第四维度指标、/>为所述五维张量数据的第五维度指标,/>为所述第二维度张量数据的元素,/>为所述第二维度张量数据中第k维度对应的第/>个元素指标,/>,/>为1-L中的任意整数,/>为所述第二维度张量数据中第s维度对应的第t个元素指标,/>,/>为1-T中的任意整数。
在一种实施例中,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
根据第二预设公式对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第二预设公式为:
;
其中,和/>为第k维度的第/>个所述第三维度张量数据的秩,/>,/>为1-L中的任意整数,/>和/>为第s维度的第t个所述第三维度张量数据的秩,,/>为1-T中的任意整数,/>,/>为所述预设最大秩,/>为第k维度的第/>个所述第三维度张量数据的秩对应的指标,/>为各第s维度的第t个所述第三维度张量数据的秩对应的指标,/>为第k维度的第/>个所述第三维度张量数据的核,/>为第s维度的第t个所述第三维度张量数据的核,/>为所述第二维度张量数据中第k维度对应的第/>个元素指标,/>为所述第二维度张量数据中第s维度对应的第t个元素指标。
在一种实施例中,将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据之后,还包括:
将各个所述第三维度张量数据的张量参数保存至本地或者传输至解压端。
在一种实施例中,还包括:
在确定对所述压缩图像数据进行解压时,获取各个所述第三维度张量数据的张量参数;
对各个所述第三维度张量数据的张量参数进行解压,得到所述原始图像对应的所述第一维度张量数据。
在一种实施例中,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据。
在一种实施例中,还包括:
构建初始分解模型,使用初始分解模型对所述第二维度张量数据进行分解,得到第四维度张量数据,所述第四维度张量数据的第四维度小于所述第二维度;
根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化;
将满足预设条件的分解模型作为最终分解模型;
通过分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过所述最终分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据。
在一种实施例中,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
获取所述第四维度张量数据的第一张量规模;
获取所述第一维度张量数据的第二张量规模;
根据所述第一张量规模与所述第二张量规模对所述初始分解模型进行优化。
在一种实施例中,根据所述第一张量规模与所述第二张量规模对所述初始分解模型进行优化,包括:
根据所述第一张量规模与所述第二张量规模的第一比值或所述第二张量规模与所述第一张量规模的第二比值对所述初始分解模型进行优化;
优化过程中的优化目标为:所述第一比值最小或所述第二比值最大。
在一种实施例中,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
根据所述第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
根据所述第五维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化。
在一种实施例中,根据所述第五维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
根据所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化,优化过程中的优化目标为:所述误差最小。
在一种实施例中,根据所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化,包括:
计算所述第五维度张量数据和所述第一维度张量数据的范数差;
根据所述范数差对所述初始分解模型进行优化。
在一种实施例中,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
获取所述第四维度张量数据的第一张量规模及所述第一维度张量数据的第二张量规模;
根据所述第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
根据所述第一张量规模与所述第二张量规模的第一比值及所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化;
优化过程中的优化目标为:所述第一比值最小且所述误差最小。
在一种实施例中,将满足预设条件的分解模型作为最终分解模型,包括:
采用多目标优化算法求解所述第一比值最小且所述误差最小的分解模型,并将满足所述第一比值最小且所述误差最小的分解模型作为所述最终分解模型。
在一种实施例中,将满足预设条件的分解模型作为最终分解模型之后,还包括:
对所述最终分解模型进行测试,确定所述最终分解模型是否满足测试要求;
若满足所述测试要求,则进入通过所述最终分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据的步骤。
第二方面,本发明还提供了一种图像压缩系统,包括:
获取单元,用于获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一维度张量数据的第一维度小于所述第二维度张量数据的第二维度;
分解单元,用于对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第三维度张量数据的第三维度不大于所述第一维度,且所述第三维度张量数据的张量规模小于所述第一维度张量数据的张量规模;
压缩图像数据确定单元,用于将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据。
第三方面,本发明还提供了一种图像压缩装置,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现上述所述的图像压缩方法的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的图像压缩方法的步骤。
本发明提供了一种图像压缩处理方法、系统、装置及介质,涉及图像处理领域,用于解决指数依赖的问题。该方案对原始图像对应的第一维度张量数据进行量化得到第二维度张量数据;对第二维度张量数据分解得到多个第三维度张量数据,第三维度张量数据的张量参数作为压缩后的压缩图像数据。本发明将第一维度张量数据最终转换为多个第三维度张量数据,第三维度张量数据的维度和规模均小于第一维度张量数据,因此需要用于存储或传输的第三维度张量数据的张量参数的数据量也较小,降低原始图像的数据复杂度,减少了压缩图像数据的存储空间,克服了传统分解方法中的指数依赖张量维数的问题,从而达到更好的图像压缩效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种图像压缩处理方法的示意图;
图2为本发明提供的一种图像压缩处理系统的示意图;
图3为本发明提供的一种图像压缩处理装置的示意图;
图4为本发明提供的一种计算机可读存储介质的示意图。
具体实施方式
本发明的核心是提供一种图像压缩处理方法、系统、装置及介质,将第一维度张量数据最终转换为多个第三维度张量数据,第三维度张量数据的维度和规模均小于第一维度张量数据,因此需要用于存储或传输的第三维度张量数据的张量参数的数据量也较小,降低原始图像的数据复杂度,减少了压缩图像数据的存储空间,克服了传统分解方法中的指数依赖张量维数的问题,从而达到更好的图像压缩效果。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本发明提供了一种图像压缩方法,如图1所示,包括:
S11:获取原始图像对应的第一维度张量数据,对第一维度张量数据进行量化处理,得到第二维度张量数据,第一维度张量数据的第一维度小于第二维度张量数据的第二维度;
本步骤中,首先获取原始图像对应的第一维度张量数据。这里的第一维度张量数据可以理解为原始图像在某个维度上的切片或表示。对第一维度张量数据进行量化处理,量化是指对张量元素按照某个特殊的方式进行位置重排,以增加张量的维度,方便后续使用分解方法进行数据复杂度的降低。通过对第一维度张量数据进行量化处理得到第二维度张量数据。第二维度张量数据的维度比第一维度张量数据的维度更高,这是因为量化过程可能引入了更多的维度或特征。
S12:对第二维度张量数据进行分解,得到多个第三维度张量数据,第三维度张量数据的第三维度不大于第一维度,且第三维度张量数据的张量规模小于第一维度张量数据的张量规模;
本步骤描述了对第二维度张量数据的分解过程,以得到多个第三维度张量数据。具体地,S11步骤中得到 第二维度张量数据包含了原始图像的部分信息,但仍然可能存在冗余或者不必要的特征。S12步骤的目标就是通过对第二维度张量数据进行分解,得到多个第三维度张量数据,以更加有效地表示原始图像的信息。
在这一步中,分解的过程可以采用各种数学方法,如张量分解或矩阵分解。分解后得到的多个第三维度张量数据将会保留原始图像的关键特征,其中,第三维度张量数据的维度和规模均小于第一维度张量数据,且第三维度张量数据的张量规模小于第一维度张量数据的张量规模,张量规模是指张量数据的大小或维度的数量,具体来说,表示张量数据的张量参数的数量或元素个数。这意味着第三维度张量数据所包含的信息量相对较小,但仍足够表达原始图像的特征。本步骤中通过将第一维度张量数据转换为多个维度较小的第三维度张量数据,并确保第三维度张量数据的张量规模较小,以实现更好的图像压缩效果。
可见,本步骤通过对第二维度张量数据进行分解,得到多个第三维度张量数据,从而实现了对原始图像信息的更高效表示和压缩,同时克服了传统分解方法(如Tucker分解方法)中的指数依赖张量维数的问题,从而达到更好的图像压缩效果。
S13:将各个第三维度张量数据的张量参数作为原始图像压缩后的压缩图像数据。
具体地,本步骤将第三维度张量数据转化为一组参数,以代表原始图像的信息。在S12步骤中,得到多个第三维度张量数据。这些第三维度张量数据具有较低的维度和规模,且第三维度张量数据的第三维度不大于第一维度。每个第三维度张量数据都包含了原始图像的一部分信息。
本步骤中,提取每个第三维度张量数据的张量参数,并将其作为压缩图像数据。张量参数是指描述张量的特定特征、属性或权重的数值。通过仅保留这些参数,可以在减少存储空间和传输数据量的同时,尽可能地保留原始图像的关键信息。
综上,本发明通过降低数据复杂度、减少存储空间和传输数据量,克服了传统分解方法中指数依赖张量维数的问题,从而实现更好的图像压缩效果。
将这种图像压缩方法应用于数据存储或数据传输时存在以下有益效果:将第一维度张量数据转换为多个第三维度张量数据可以显著减少压缩图像数据的存储空间需求,这对于需要大量图像存储的场景(比如云存储、数据中心等)来说,能够节省大量成本;由于需要用于存储或传输的第三维度张量数据的张量参数的数据量较小,将压缩图像数据传输到远程位置或移动设备的速度会更快,可以提高数据传输效率,减少传输延迟;通过降低原始图像的数据复杂度,可以简化数据处理和分析过程,在需要对图像数据进行分析、处理或机器学习训练的情境下,降低数据复杂度可以加快计算速度并降低计算成本;传统的Tucker分解方法存在指数依赖张量维数的问题,而这种压缩方法通过将第一维度张量数据转换为多个第三维度张量数据,成功克服了这一问题,使得图像压缩效果更好,能够更好地保留原始图像的信息。
在一种实施例中,第一维度张量数据为三维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取原始图像;
将原始图像的像素矩阵的行设为三维张量数据的第一维度数据;
将原始图像的像素矩阵的列设为三维张量数据的第二维度数据;
将原始图像的像素矩阵的每个像素位置的颜色通道设为三维张量数据的第三维度数据。
本实施例中,首先需要获取原始图像,这可以是一个数字图像文件,比如JPEG(Joint Photographic Experts Group,联合照片专家组)、PNG(Portable NetworkGraphic Format,可移植网络图形格式)等格式的图像文件。对原始图像的像素矩阵进行处理,将图像的行作为三维张量数据的第一维度数据。这样可以将图像在水平方向上的像素信息组织成三维张量数据的第一维度。同样地,对原始图像的像素矩阵进行处理,将图像的列作为三维张量数据的第二维度数据。这样可以将图像在垂直方向上的像素信息组织成三维张量数据的第二维度。同样将原始图像的像素矩阵中每个像素位置的颜色通道信息(比如红、绿、蓝通道)作为三维张量数据的第三维度数据。这样就将图像的颜色信息组织成了三维张量数据的第三维度。
通过以上处理步骤,可以将原始图像转换为三维张量数据,使得图像的行、列和颜色通道信息被合理地组织起来,为接下来的量化处理和分解操作奠定了基础。这种处理方式有助于将原始图像的信息有效地转换为适合进行图像压缩处理的数据形式。
在一种实施例中,第一维度张量数据为五维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取原始图像;
将原始图像的像素矩阵的行设为五维张量数据的第一维度数据;
将原始图像的像素矩阵的列设为五维张量数据的第二维度数据;
将原始图像的像素矩阵的每个像素位置的颜色通道中的红色通道设为五维张量数据的第三维度数据;
将原始图像的像素矩阵的每个像素位置的颜色通道中的绿色通道设为五维张量数据的第四维度数据;
将原始图像的像素矩阵的每个像素位置的颜色通道中的蓝色通道设为五维张量数据的第五维度数据。
本实施例中,获取原始图像并将其转换为五维张量数据。同样的,首先需要获取原始图像,这可以是一个数字图像文件,比如JPEG、PNG等格式的图像文件。对原始图像的像素矩阵进行处理,将图像的行作为五维张量数据的第一维度数据。这样可以将图像在水平方向上的像素信息组织成五维张量数据的第一维度。同样地,对原始图像的像素矩阵进行处理,将图像的列作为五维张量数据的第二维度数据。这样可以将图像在垂直方向上的像素信息组织成五维张量数据的第二维度。进一步将原始图像的像素矩阵中每个像素位置的颜色通道信息(红、绿、蓝通道)分别作为五维张量数据的第三、第四、第五维度数据。这样就将图像的颜色信息分解成了五维张量数据的多个维度。
相比于上一实施例中将原始图像中转换为三维张量数据,本实施例更加细致地分解了图像的像素信息,并且将颜色通道信息进行了更深层次的划分,使得图像的特征表示更加丰富和多样化。这样的处理方式有助于提高图像压缩后的重构质量,同时也为后续的图像处理和分析提供了更多的信息维度。
在一种实施例中,获取原始图像对应的第一维度张量数据,对第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
获取原始图像对应的第一维度张量数据;
将第一维度张量数据按照每个维度上排列2个元素的方式排列以进行量化处理,得到第二维度张量数据。
本实施例中,首先需要将原始图像转换为一个多维张量数据,其中第一维度张量数据对应于图像的行、列和颜色通道信息。采用特定的量化方法,即将第一维度张量数据按照每个维度上排列2个元素的方式排列,以便后续进行量化处理。本实施例中的方式使得原始图像的信息能够更好地被压缩和重构,可以提高图像压缩后的质量,同时减少压缩后图像的码率,具有很好的实际应用价值。
在一种实施例中,第一维度张量数据为五维张量数据,对第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
根据第一预设公式对第一维度张量数据进行量化处理,得到第二维度张量数据,第一预设公式为:
;
其中,为五维张量数据的元素,q为2,L和T为大于1的整数,/>为五维张量数据的第一维度指标、/>为五维张量数据的第二维度指标、/>为五维张量数据的第三维度指标、/>为五维张量数据的第四维度指标、/>为五维张量数据的第五维度指标,为第二维度张量数据的元素,/>为第二维度张量数据中第k维度对应的第/>个元素指标,/>,/>为1-L中的任意整数,/>为第二维度张量数据中第s维度对应的第t个元素指标,/>,/>为1-T中的任意整数。
具体地,可以通过以上公式实现将第一维度张量数据量化处理为第二维度张量数据。张量可以适用于图像压缩领域的原因为:可以避免向量化处理,直接张量表示,保留了图像的空间信息;每个像素的颜色用RGB表示,其中R、G、B,分别是8位表示,取值0-255,正好对应于本实施例分解方法中对张量规模等于qL=28的假设,此时q=2,L=8,所以天然满足这个条件,减少了补充数据造成的冗余(不满足的时候需要补0,直到满足等于qL的假设,这样就会造成冗余)。因此,使用本实施例的分解方法进行图像压缩具有合理性。
在一种实施例中,对第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
对第二维度张量数据的每个维度的张量进行矩阵化展开,得到多个第一矩阵;
对每个第一矩阵进行分解,得到与各第一矩阵对应的第二矩阵,第二矩阵与第一矩阵的误差不大于预设误差,第二矩阵的秩小于第一矩阵的秩且不大于预设最大秩;
根据各个第二矩阵得到与第二矩阵对应的第三维度张量数据。
本实施例描述了一种图像压缩方法中对第二维度张量数据进行分解的步骤,以得到多个第三维度张量数据的过程。首先,将第二维度张量数据按照每个维度分别展开为多个矩阵,这些矩阵表示了第二维度张量数据在每个维度上的分布情况。对每个第一矩阵进行分解,得到与各第一矩阵对应的第二矩阵。在这个过程中,第二矩阵与第一矩阵的误差不大于预设误差。第二矩阵表示了第一矩阵中的主要信息,而误差则表示第一矩阵与第二矩阵之间的差异。在分解过程中,确保第二矩阵的秩小于第一矩阵的秩,并且限制第二矩阵的秩不超过预设的最大秩。这样可以保证对原始图像数据进行压缩时,能够在一定程度上减少数据的维度,并去除冗余信息,从而实现压缩效果。根据每个第二矩阵,可以重新构建得到与其对应的第三维度张量数据。这些第三维度张量数据是通过对第二维度张量数据进行分解和降维得到的,它们用来表示原始图像的压缩图像数据。
综上,本实施例通过对第二维度张量数据进行分解得到多个低维度的张量数据,从而实现了有效的数据压缩,在保留图像主要信息的同时,降低了数据的维度,达到了有效压缩的目的。
在一种实施例中,对第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
根据第二预设公式对第二维度张量数据进行分解,得到多个第三维度张量数据,第二预设公式为:
;
其中,和/>为第k维度的第/>个第三维度张量数据的秩,/>,/>为1-L中的任意整数,/>和/>为第s维度的第t个第三维度张量数据的秩,/>,/>为1-T中的任意整数,/>,/>为预设最大秩,/>为第k维度的第/>个第三维度张量数据的秩对应的指标,/>为各第s维度的第t个第三维度张量数据的秩对应的指标,/>为第k维度的第/>个第三维度张量数据的核,/>为第s维度的第t个第三维度张量数据的核,/>为第二维度张量数据中第k维度对应的第/>个元素指标,/>为第二维度张量数据中第s维度对应的第t个元素指标。
具体地,可以通过以上公式实现将第二维度张量数据分解为多个第三维度张量数据。使用此分解模型,将第二维度张量数据近似分解为了2L+3T个低维度的第三维度张量:
。
其中,限定,/>为预设最大秩。给定这个限制是保证分解后的张量数据的张量规模满足/>,n为原始图像对应的第一维度张量数据的规模,从而才有压缩后的数据量是关于原始规模n为对数依赖的结果,也即可以将原始图像对应的第一维度张量数据的复杂度由/>减少为/>,分解后的存储复杂度对数依赖于张量的每个维度的原始张量规模n。否则是/>,这样就得不到最优的压缩比。
综上,本实施例中的方法彻底克服了指数依赖于张量维数的问题,同时关于每个维度的原始张量规模n是对数依赖。因此,相比 传统分解方法,本实施例中的方法分解后的数据量更少,因而相应数据的压缩比更高。
在一种实施例中,将各个第三维度张量数据的张量参数作为原始图像压缩后的压缩图像数据之后,还包括:
将各个第三维度张量数据的张量参数保存至本地或者传输至解压端。
本实施例是指在实施图像压缩方法的过程中,除了将各个第三维度张量数据的张量参数作为原始图像压缩后的压缩图像数据之外,还包括将这些张量参数保存至本地或者传输至解压端的步骤。这意味着在压缩图像数据后,系统可以将压缩后的数据保存在本地存储设备上,或者通过网络传输至其他设备,以供解压或其他处理。
本实施例中,保存压缩后的数据至本地可以在需要时快速地进行解压或展示,而传输至解压端则可以使得图像数据在不同设备间方便地传输和共享。这种方法有效地利用了压缩后的图像数据,同时保证了数据的便捷性和可用性。
在一种实施例中,还包括:
在确定对压缩图像数据进行解压时,获取各个第三维度张量数据的张量参数;
对各个第三维度张量数据的张量参数进行解压,得到原始图像对应的第一维度张量数据。
本实施例描述了在解压压缩图像数据时的操作步骤。首先,在确定对压缩图像数据进行解压时,需要获取各个第三维度张量数据的张量参数。这意味着需要找到压缩图像数据中每个第三维度张量数据的压缩表示方式,以便进行解压缩操作。接下来,对各个第三维度张量数据的张量参数进行解压,以得到原始图像对应的第一维度张量数据。这意味着需要根据压缩图像数据中的张量参数,进行解压缩计算,以恢复原始图像的第一维度张量数据。这个解压操作需要根据压缩时使用的压缩方法和算法来进行,以确保解压后得到的数据与原始图像数据一致。
在一种实施例中,对第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据。
具体而言,采用了分解模型对第二维度张量数据进行分解,从而得到多个第三维度张量数据。这个分解模型可以是张量列模型,利用该模型可以有效地将第二维度张量数据分解成多个较小的第三维度张量数据。
在实施例中,这种分解模型可以采用各种的张量分解技术,比如奇异值分解、主成分分析或者张量列分解等。通过应用这些分解模型,可以将原始的高维度图像数据有效地压缩为多个低维度的张量数据,从而实现对图像数据的高效压缩。
本实施例中,通过分解模型对第二维度张量数据进行分解,可以更好地捕获图像数据的主要特征,并且能够有效地减少数据的维度,从而实现对图像数据的高效压缩。同时,在保留图像关键信息的同时,也能够降低压缩后的数据规模,为图像存储和传输节省空间和带宽。
在一种实施例中,还包括:
构建初始分解模型,使用初始分解模型对第二维度张量数据进行分解,得到第四维度张量数据,第四维度张量数据的第四维度小于第二维度;
根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化;
将满足预设条件的分解模型作为最终分解模型;
通过分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过最终分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据。
具体地,本实施例中还会建立一个初始的分解模型。这个初始分解模型用于将第二维度张量数据进行分解,得到第四维度张量数据。在这个过程中,第四维度张量数据的维度要小于第二维度;通过使用第四维度张量数据和第一维度张量数据,对初始分解模型进行优化,通过优化的过程,可以调整初始分解模型的参数,使其更好地适应图像数据的特点;经过多次优化后,选择满足预设条件的最终分解模型,这个最终分解模型将被用于后续的图像压缩过程;基于所确定的最终分解模型,将第二维度张量数据进行分解,得到多个第三维度张量数据。这些第三维度张量数据将作为图像的压缩表示。
通过以上步骤,能够通过构建、优化和选择合适的分解模型,将原始图像的第二维度张量数据压缩为多个低维度的第三维度张量数据,可以实现对图像数据的高效压缩,并且保留了图像的关键信息。
在一种实施例中,根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化,包括:
获取第四维度张量数据的第一张量规模;
获取第一维度张量数据的第二张量规模;
根据第一张量规模与第二张量规模对初始分解模型进行优化。
本实施例中,优化步骤如下:首先获取第四维度张量数据的第一张量规模,这个张量规模指的是第四维度张量数据的维度大小;接下来,获取原始图像对应的第一维度张量数据的第二张量规模,这个张量规模指的是第一维度张量数据的维度大小;利用第一张量规模和第二张量规模,对初始分解模型进行优化,通过调整初始分解模型的参数,使其能够更好地适应第四维度张量数据和第一维度张量数据的特点。
通过以上步骤,能够根据第四维度张量数据的第一张量规模和第一维度张量数据的第二张量规模,对初始分解模型进行优化,可以提高分解模型的性能,使其更好地适应图像数据的特点,从而实现更好的图像压缩效果。
在一种实施例中,根据第一张量规模与第二张量规模对初始分解模型进行优化,包括:
根据第一张量规模与第二张量规模的第一比值或第二张量规模与第一张量规模的第二比值对初始分解模型进行优化;
优化过程中的优化目标为:第一比值最小或第二比值最大。
本实施例旨在限定优化过程中的优化目标为:第一比值最小或第二比值最大。其中,第一比值为第一张量规模除以第二张量规模,第二比值为第二张量规模除以第一张量规模。根据第一比值或第二比值,对初始分解模型进行优化。具体来说,如果优化目标为第一比值最小或第二比值最大,则需要调整分解模型的参数,让分解后的第四维度张量数据的张量规模尽可能地小。
通过以上步骤,可以根据第一张量规模与第二张量规模的比值对分解模型进行优化,从而提高图像压缩的效果,能够尽可能地减小压缩后的图像文件大小,从而提高存储和传输效率。
在一种实施例中,根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化,包括:
根据第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
根据第五维度张量数据和第一维度张量数据对初始分解模型进行优化。
本实施例介绍了另一种优化步骤,即根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化。使用初始分解模型将第二维度张量数据进行分解,得到多个第四维度张量数据。然后,根据这些第四维度张量数据和初始分解模型进行重构,得到重构图像对应的第五维度张量数据。这里的第五维度张量数据可以理解为对原始图像的逼近或重建结果。将第五维度张量数据和第一维度张量数据作为输入,通过优化算法对初始分解模型的参数进行调整。优化的目标是使得通过分解和重构后的第五维度张量数据与原始图像尽可能接近,从而提高图像的重建质量。
通过这个优化步骤,可以使得图像的重建质量更接近于原始图像,从而提高压缩图像的视觉质量。
在一种实施例中,根据第五维度张量数据和第一维度张量数据对初始分解模型进行优化,包括:
根据第五维度张量数据和第一维度张量数据之间的误差对初始分解模型进行优化,优化过程中的优化目标为:误差最小。
具体而言,通过限定优化目标为误差最小,使得优化后通过分解和重构后的第五维度张量数据与原始图像尽可能接近,从而提高图像的重建质量。
通过这个优化步骤,可以根据第四维度张量数据和第一维度张量数据对初始分解模型进行调整,以提高图像压缩的效果。优化的过程中,根据重构图像对应的第五维度张量数据和第一维度张量数据,通过调整分解模型的参数,可以使得图像的重建质量更接近于原始图像,从而提高压缩图像的视觉质量。
在一种实施例中,根据第五维度张量数据和第一维度张量数据之间的误差对初始分解模型进行优化,包括:
计算第五维度张量数据和第一维度张量数据的范数差;
根据范数差对初始分解模型进行优化。
本实施例在优化过程中使用了范数差作为误差指标来对初始分解模型进行优化。具体地,根据原始图像对应的第一维度张量数据和重构图像对应的第五维度张量数据,计算它们之间的范数差。范数是一种衡量向量或矩阵大小的方法,可以用来度量两个向量或矩阵之间的差距。根据范数差对初始分解模型进行优化,优化的目标是使范数差最小化。通过调整分解模型的参数,使得重构图像对应的第五维度张量数据与原始图像对应的第一维度张量数据尽可能接近,从而减小重构图像与原始图像之间的差异。
在优化过程中,可以使用各种优化算法来调整分解模型的参数,例如梯度下降法等。优化算法根据范数差的梯度信息来更新模型参数,逐步接近最优解。通过以上优化步骤,使用范数差作为误差指标来对初始分解模型进行优化,从而提高图像压缩的效果,减小重构图像与原始图像之间的差异。
在一种实施例中,根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化,包括:
获取第四维度张量数据的第一张量规模及第一维度张量数据的第二张量规模;
根据第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
根据第一张量规模与第二张量规模的第一比值及第五维度张量数据和第一维度张量数据之间的误差对初始分解模型进行优化;
优化过程中的优化目标为:第一比值最小且误差最小。
本实施例的优化方式结合了上述两种优化步骤,计算第一张量规模与第二张量规模的比值,同时计算第五维度张量数据和第一维度张量数据之间的误差。然后,根据这两个指标对初始分解模型进行优化,优化的目标是使第一比值最小且误差最小。
具体地,优化目标为:,其中, />表示分解后每个第四维度张量数据的第k维度的第l个核的规模,k为1或2,/>为1-L中的任意整数,/>,其中,/>表示分解后每个第四维度张量数据的第s维度的第t个核的规模,s=3,4,5,t为1-T中的任意整数,/>与/>的和是第一张量规模。/>为第一维度张量数据的规模,也即第二张量规模。
通过以上优化过程,可以使得初始分解模型更好地适应原始图像数据的特点,从而提高图像压缩的效果。
在一种实施例中,将满足预设条件的分解模型作为最终分解模型,包括:
采用多目标优化算法求解第一比值最小且误差最小的分解模型,并将满足第一比值最小且误差最小的分解模型作为最终分解模型。
本实施例中,为了找到第一比值最小且误差最小的分解模型,使用多目标优化算法。多目标优化算法可以同时优化多个目标函数,因此适用于本方法中需要同时优化第一比值和误差的情况。将第一比值和误差作为两个目标函数,第一比值是第一张量规模与第二张量规模的比值,优化目标是使得第一比值最小化。误差是重构图像对应的第五维度张量数据与第一维度张量数据之间的差异,优化目标是使得误差最小化。
多目标优化算法通过搜索最优解来确定最终分解模型,最优解就是同时满足最小化第一比值和最小化误差的分解模型。搜索过程结束后,根据找到的最优解,选择满足第一比值最小且误差最小的分解模型作为最终分解模型。这个分解模型能够在保持较低的第一比值的同时,实现较小的重构误差,从而提供了高效的图像压缩方法。
通过以上步骤,根据多目标优化算法寻找最优解,确定了满足预设条件的最终分解模型,该模型可以用于对原始图像进行压缩处理,并达到较好的压缩效果。
在一种实施例中,将满足预设条件的分解模型作为最终分解模型之后,还包括:
对最终分解模型进行测试,确定最终分解模型是否满足测试要求;
若满足测试要求,则进入通过最终分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据的步骤。
本实施例在确定满足预设条件的最终分解模型后,还需要进行测试以确保其满足测试要求。具体地,对于最终确定的分解模型,需要进行一系列测试来验证其性能和适用性。这些测试可以包括但不限于性能评估、压缩率测试、重构质量测试等。通过对最终分解模型进行性能评估,可以获得关于其计算效率、存储需求等方面的指标。例如,可以评估分解模型的计算复杂度、内存占用情况等。通过将最终分解模型应用于一组测试图像,可以评估其在压缩图像时的压缩率。压缩率是指压缩后图像的大小与原始图像大小之间的比值。较高的压缩率意味着更好的压缩效果。通过将压缩后的图像进行解压缩,并与原始图像进行比较,可以评估重构的质量。重构质量可以使用诸如均方误差、结构相似性指标等指标进行量化评估。根据测试结果,判断最终分解模型是否满足预设的测试要求。如果测试结果符合要求,则可以进入下一步骤,即通过最终分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据。
通过以上测试步骤,可以确保最终分解模型的性能和适用性,并验证其是否满足预设的测试要求。这有助于确定该图像压缩方法的可靠性和有效性,以及为后续应用提供支持。
第二方面,本发明还提供了一种图像压缩系统,如图2所示,包括:
获取单元21,用于获取原始图像对应的第一维度张量数据,对第一维度张量数据进行量化处理,得到第二维度张量数据,第一维度张量数据的第一维度小于第二维度张量数据的第二维度;
分解单元22,用于对第二维度张量数据进行分解,得到多个第三维度张量数据,第三维度张量数据的第三维度不大于第一维度,且第三维度张量数据的张量规模小于第一维度张量数据的张量规模;
压缩图像数据确定单元23,用于将各个第三维度张量数据的张量参数作为原始图像压缩后的压缩图像数据。
在一种实施例中,第一维度张量数据为三维张量数据,获取单元21,具体用于获取原始图像;将原始图像的像素矩阵的行设为三维张量数据的第一维度数据;将原始图像的像素矩阵的列设为三维张量数据的第二维度数据;将原始图像的像素矩阵的每个像素位置的颜色通道设为三维张量数据的第三维度数据,对第一维度张量数据进行量化处理,得到第二维度张量数据。
在一种实施例中,第一维度张量数据为五维张量数据,获取单元21,具体用于获取原始图像;将原始图像的像素矩阵的行设为五维张量数据的第一维度数据;将原始图像的像素矩阵的列设为五维张量数据的第二维度数据;将原始图像的像素矩阵的每个像素位置的颜色通道中的红色通道设为五维张量数据的第三维度数据;将原始图像的像素矩阵的每个像素位置的颜色通道中的绿色通道设为五维张量数据的第四维度数据;将原始图像的像素矩阵的每个像素位置的颜色通道中的蓝色通道设为五维张量数据的第五维度数据,对第一维度张量数据进行量化处理,得到第二维度张量数据。
在一种实施例中,获取单元21,具体用于获取原始图像对应的第一维度张量数据;将第一维度张量数据按照每个维度上排列2个元素的方式排列以进行量化处理,得到第二维度张量数据。
在一种实施例中,分解单元22,包括:
矩阵展开单元,用于对第二维度张量数据的每个维度的张量进行矩阵化展开,得到多个第一矩阵;
矩阵分解单元,用于对每个第一矩阵进行分解,得到与各第一矩阵对应的第二矩阵,第二矩阵与第一矩阵的误差不大于预设误差,第二矩阵的秩小于第一矩阵的秩且不大于预设最大秩;
张量转换单元,用于根据各个第二矩阵得到与第二矩阵对应的第三维度张量数据。
在一种实施例中,第一维度张量数据为五维张量数据,获取单元21,具体用于获取原始图像对应的第一维度张量数据;根据第一预设公式对第一维度张量数据进行量化处理,得到第二维度张量数据,第一预设公式为:
;
其中,为五维张量数据的元素,q为2,L和T为大于1的整数,/>为五维张量数据的第一维度指标、/>为五维张量数据的第二维度指标、/>为五维张量数据的第三维度指标、/>为五维张量数据的第四维度指标、/>为五维张量数据的第五维度指标,为第二维度张量数据的元素,/>为第二维度张量数据中第k维度对应的第/>个元素指标,/>,/>为1-L中的任意整数,/>为第二维度张量数据中第s维度对应的第t个元素指标,/>,/>为1-T中的任意整数。
在一种实施例中,分解单元22,具体用于根据第二预设公式对第二维度张量数据进行分解,得到多个第三维度张量数据,第二预设公式为:
;
其中,和/>为第k维度的第/>个第三维度张量数据的秩,/>,/>为1-L中的任意整数,/>和/>为第s维度的第t个第三维度张量数据的秩,/>,/>为1-T中的任意整数,/>,/>为预设最大秩,/>为第k维度的第/>个第三维度张量数据的秩对应的指标,/>为各第s维度的第t个第三维度张量数据的秩对应的指标,/>为第k维度的第/>个第三维度张量数据的核,/>为第s维度的第t个第三维度张量数据的核,/>为第二维度张量数据中第k维度对应的第/>个元素指标,/>为第二维度张量数据中第s维度对应的第t个元素指标。
在一种实施例中,还包括:
数据处理单元,用于将各个第三维度张量数据的张量参数保存至本地或者传输至解压端。
在一种实施例中,还包括:
压缩数据获取单元,用于在确定对压缩图像数据进行解压时,获取各个第三维度张量数据的张量参数;
解压单元,用于对各个第三维度张量数据的张量参数进行解压,得到原始图像对应的第一维度张量数据。
在一种实施例中,分解单元22,具体用于通过分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据。
在一种实施例中,还包括:
模型构建单元,用于构建初始分解模型,使用初始分解模型对第二维度张量数据进行分解,得到第四维度张量数据,第四维度张量数据的第四维度小于第二维度;
优化单元,用于根据第四维度张量数据和第一维度张量数据对初始分解模型进行优化;
模型输出单元,用于将满足预设条件的分解模型作为最终分解模型;
分解单元22,具体用于通过最终分解模型对第二维度张量数据进行分解,得到多个第三维度张量数据。
在一种实施例中,优化单元,包括:
第一张量规模获取单元,用于获取第四维度张量数据的第一张量规模;
第二张量规模获取单元,用于获取第一维度张量数据的第二张量规模;
张量规模优化单元,用于根据第一张量规模与第二张量规模对初始分解模型进行优化。
在一种实施例中,张量规模优化单元,具体用于根据第一张量规模与第二张量规模的第一比值或第二张量规模与第一张量规模的第二比值对初始分解模型进行优化;优化过程中的优化目标为:第一比值最小或第二比值最大。
在一种实施例中,优化单元,包括:
重构单元,用于根据第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
图像优化单元,用于根据第五维度张量数据和第一维度张量数据对初始分解模型进行优化。
在一种实施例中,图像优化单元,具体用于根据第五维度张量数据和第一维度张量数据之间的误差对初始分解模型进行优化,优化过程中的优化目标为:误差最小。
在一种实施例中,图像优化单元,具体用于计算第五维度张量数据和第一维度张量数据的范数差;根据范数差对初始分解模型进行优化。
在一种实施例中,优化单元,具体用于获取第四维度张量数据的第一张量规模及第一维度张量数据的第二张量规模;根据第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;根据第一张量规模与第二张量规模的第一比值及第五维度张量数据和第一维度张量数据之间的误差对初始分解模型进行优化;优化过程中的优化目标为:第一比值最小且误差最小。
在一种实施例中,模型输出单元,具体用于采用多目标优化算法求解第一比值最小且误差最小的分解模型,并将满足第一比值最小且误差最小的分解模型作为最终分解模型。
在一种实施例中,还包括:
测试单元,用于对最终分解模型进行测试,确定最终分解模型是否满足测试要求;若满足测试要求,则输出信号至模型输出单元。
对于图像压缩系统的介绍请参照上述实施例,本发明在此不再赘述。
第三方面,本发明还提供了一种图像压缩装置,如图3所示,包括:
存储器31,用于存储计算机程序;
处理器32,用于在存储计算机程序时,实现上述的图像压缩方法的步骤。
对于图像压缩装置的介绍请参照上述实施例,本发明在此不再赘述。
第四方面,本发明还提供了一种计算机可读存储介质41,如图4所示,计算机可读存储介质41上存储有计算机程序42,计算机程序42被处理器执行时实现上述的图像压缩方法的步骤。
对于计算机可读存储介质41的介绍请参照上述实施例,本发明在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (22)
1.一种图像压缩方法,其特征在于,包括:
获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一维度张量数据的第一维度小于所述第二维度张量数据的第二维度,其中量化处理是对所述第一维度张量数据中的张量元素进行位置重排;
对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第三维度张量数据的第三维度不大于所述第一维度,且所述第三维度张量数据的张量规模小于所述第一维度张量数据的张量规模;
将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据。
2.如权利要求1所述的图像压缩方法,其特征在于,所述第一维度张量数据为三维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取所述原始图像;
将所述原始图像的像素矩阵的行设为所述三维张量数据的第一维度数据;
将所述原始图像的像素矩阵的列设为所述三维张量数据的第二维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道设为所述三维张量数据的第三维度数据。
3.如权利要求1所述的图像压缩方法,其特征在于,所述第一维度张量数据为五维张量数据,获取原始图像对应的第一维度张量数据,包括:
获取所述原始图像;
将所述原始图像的像素矩阵的行设为所述五维张量数据的第一维度数据;
将所述原始图像的像素矩阵的列设为所述五维张量数据的第二维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的红色通道设为所述五维张量数据的第三维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的绿色通道设为所述五维张量数据的第四维度数据;
将所述原始图像的像素矩阵的每个像素位置的颜色通道中的蓝色通道设为所述五维张量数据的第五维度数据。
4.如权利要求1所述的图像压缩方法,其特征在于,获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
获取所述原始图像对应的第一维度张量数据;
将所述第一维度张量数据按照每个维度上排列2个元素的方式排列以进行量化处理,得到所述第二维度张量数据。
5.如权利要求1所述的图像压缩方法,其特征在于,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
对所述第二维度张量数据的每个维度的张量进行矩阵化展开,得到多个第一矩阵;
对每个所述第一矩阵进行分解,得到与各所述第一矩阵对应的第二矩阵,所述第二矩阵与所述第一矩阵的误差不大于预设误差,所述第二矩阵的秩小于所述第一矩阵的秩且不大于预设最大秩;
根据各个所述第二矩阵得到与所述第二矩阵对应的第三维度张量数据。
6.如权利要求4所述的图像压缩方法,其特征在于,所述第一维度张量数据为五维张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,包括:
根据第一预设公式对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一预设公式为:
;
其中,为所述五维张量数据的元素,q为2,L和T为大于1的整数,/>为所述五维张量数据的第一维度指标、/>为所述五维张量数据的第二维度指标、/>为所述五维张量数据的第三维度指标、/>为所述五维张量数据的第四维度指标、/>为所述五维张量数据的第五维度指标,/>为所述第二维度张量数据的元素,/>为所述第二维度张量数据中第k维度对应的第/>个元素指标,/>,/>为1-L中的任意整数,/>为所述第二维度张量数据中第s维度对应的第t个元素指标,/>,为1-T中的任意整数。
7.如权利要求5所述的图像压缩方法,其特征在于,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
根据第二预设公式对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第二预设公式为:
;
其中,和/>为第k维度的第/>个所述第三维度张量数据的秩,/>,/>为1-L中的任意整数,/>和/>为第s维度的第t个所述第三维度张量数据的秩,,/>为1-T中的任意整数,/>,/>为所述预设最大秩,为第k维度的第/>个所述第三维度张量数据的秩对应的指标,/>为各第s维度的第t个所述第三维度张量数据的秩对应的指标,/>为第k维度的第/>个所述第三维度张量数据的核,/>为第s维度的第t个所述第三维度张量数据的核,/>为所述第二维度张量数据中第k维度对应的第/>个元素指标,/>为所述第二维度张量数据中第s维度对应的第t个元素指标。
8.如权利要求1所述的图像压缩方法,其特征在于,将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据之后,还包括:
将各个所述第三维度张量数据的张量参数保存至本地或者传输至解压端。
9.如权利要求8所述的图像压缩方法,其特征在于,还包括:
在确定对所述压缩图像数据进行解压时,获取各个所述第三维度张量数据的张量参数;
对各个所述第三维度张量数据的张量参数进行解压,得到所述原始图像对应的所述第一维度张量数据。
10.如权利要求1-9任一项所述的图像压缩方法,其特征在于,对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据。
11.如权利要求10所述的图像压缩方法,其特征在于,还包括:
构建初始分解模型,使用初始分解模型对所述第二维度张量数据进行分解,得到第四维度张量数据,所述第四维度张量数据的第四维度小于所述第二维度;
根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化;
将满足预设条件的分解模型作为最终分解模型;
通过分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据,包括:
通过所述最终分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据。
12.如权利要求11所述的图像压缩方法,其特征在于,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
获取所述第四维度张量数据的第一张量规模;
获取所述第一维度张量数据的第二张量规模;
根据所述第一张量规模与所述第二张量规模对所述初始分解模型进行优化。
13.如权利要求12所述的图像压缩方法,其特征在于,根据所述第一张量规模与所述第二张量规模对所述初始分解模型进行优化,包括:
根据所述第一张量规模与所述第二张量规模的第一比值或所述第二张量规模与所述第一张量规模的第二比值对所述初始分解模型进行优化;
优化过程中的优化目标为:所述第一比值最小或所述第二比值最大。
14.如权利要求11所述的图像压缩方法,其特征在于,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
根据所述第四维度张量数据和所述初始分解模型得到重构图像对应的第五维度张量数据;
根据所述第五维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化。
15.如权利要求14所述的图像压缩方法,其特征在于,根据所述第五维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
根据所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化,优化过程中的优化目标为:所述误差最小。
16.如权利要求15所述的图像压缩方法,其特征在于,根据所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化,包括:
计算所述第五维度张量数据和所述第一维度张量数据的范数差;
根据所述范数差对所述初始分解模型进行优化。
17.如权利要求11所述的图像压缩方法,其特征在于,根据所述第四维度张量数据和所述第一维度张量数据对所述初始分解模型进行优化,包括:
获取所述第四维度张量数据的第一张量规模及所述第一维度张量数据的第二张量规模;
根据所述第四维度张量数据和初始分解模型得到重构图像对应的第五维度张量数据;
根据所述第一张量规模与所述第二张量规模的第一比值及所述第五维度张量数据和所述第一维度张量数据之间的误差对所述初始分解模型进行优化;
优化过程中的优化目标为:所述第一比值最小且所述误差最小。
18.如权利要求17所述的图像压缩方法,其特征在于,将满足预设条件的分解模型作为最终分解模型,包括:
采用多目标优化算法求解所述第一比值最小且所述误差最小的分解模型,并将满足所述第一比值最小且所述误差最小的分解模型作为所述最终分解模型。
19.如权利要求11所述的图像压缩方法,其特征在于,将满足预设条件的分解模型作为最终分解模型之后,还包括:
对所述最终分解模型进行测试,确定所述最终分解模型是否满足测试要求;
若满足所述测试要求,则进入通过所述最终分解模型对所述第二维度张量数据进行分解,得到多个第三维度张量数据的步骤。
20.一种图像压缩系统,其特征在于,包括:
获取单元,用于获取原始图像对应的第一维度张量数据,对所述第一维度张量数据进行量化处理,得到第二维度张量数据,所述第一维度张量数据的第一维度小于所述第二维度张量数据的第二维度,其中量化处理是对所述第一维度张量数据中的张量元素进行位置重排;
分解单元,用于对所述第二维度张量数据进行分解,得到多个第三维度张量数据,所述第三维度张量数据的第三维度不大于所述第一维度,且所述第三维度张量数据的张量规模小于所述第一维度张量数据的张量规模;
压缩图像数据确定单元,用于将各个所述第三维度张量数据的张量参数作为所述原始图像压缩后的压缩图像数据。
21.一种图像压缩装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现如权利要求1-19任一项所述的图像压缩方法的步骤。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-19任一项所述的图像压缩方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311597280.4A CN117319655B (zh) | 2023-11-28 | 2023-11-28 | 一种图像压缩处理方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311597280.4A CN117319655B (zh) | 2023-11-28 | 2023-11-28 | 一种图像压缩处理方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117319655A CN117319655A (zh) | 2023-12-29 |
CN117319655B true CN117319655B (zh) | 2024-02-23 |
Family
ID=89250239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311597280.4A Active CN117319655B (zh) | 2023-11-28 | 2023-11-28 | 一种图像压缩处理方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117319655B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107155111A (zh) * | 2017-06-05 | 2017-09-12 | 李益永 | 一种视频压缩方法及装置 |
CN107516129A (zh) * | 2017-08-01 | 2017-12-26 | 北京大学 | 基于维度自适应的Tucker分解的深度网络压缩方法 |
CN110650340A (zh) * | 2019-04-25 | 2020-01-03 | 长沙理工大学 | 一种时空复用的压缩视频成像方法 |
CN113689513A (zh) * | 2021-09-28 | 2021-11-23 | 东南大学 | 一种基于鲁棒张量分解的sar图像压缩方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9681147B2 (en) * | 2014-01-20 | 2017-06-13 | Board Of Trustees Of Michigan State University | Compression of image ensembles using tensor decomposition |
-
2023
- 2023-11-28 CN CN202311597280.4A patent/CN117319655B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107155111A (zh) * | 2017-06-05 | 2017-09-12 | 李益永 | 一种视频压缩方法及装置 |
CN107516129A (zh) * | 2017-08-01 | 2017-12-26 | 北京大学 | 基于维度自适应的Tucker分解的深度网络压缩方法 |
CN110650340A (zh) * | 2019-04-25 | 2020-01-03 | 长沙理工大学 | 一种时空复用的压缩视频成像方法 |
CN113689513A (zh) * | 2021-09-28 | 2021-11-23 | 东南大学 | 一种基于鲁棒张量分解的sar图像压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117319655A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11153566B1 (en) | Variable bit rate generative compression method based on adversarial learning | |
US20210125070A1 (en) | Generating a compressed representation of a neural network with proficient inference speed and power consumption | |
CN110933429B (zh) | 基于深度神经网络的视频压缩感知与重构方法和装置 | |
CN113259665B (zh) | 一种图像处理方法以及相关设备 | |
CN114616832A (zh) | 基于网络的视觉分析 | |
CN110717868B (zh) | 视频高动态范围反色调映射模型构建、映射方法及装置 | |
CN108734653B (zh) | 图像风格转换方法及装置 | |
CN114581544A (zh) | 图像压缩方法、计算机设备及计算机存储介质 | |
CN112203089B (zh) | 基于稀疏编码的码率控制的图像压缩方法、系统及装置 | |
CN113689513B (zh) | 一种基于鲁棒张量分解的sar图像压缩方法 | |
CN111881920B (zh) | 一种大分辨率图像的网络适配方法及神经网络训练装置 | |
CN111754592A (zh) | 一种基于特征通道信息的端到端多光谱遥感图像压缩方法 | |
CN111163314A (zh) | 一种图像压缩方法及系统 | |
CN102595138B (zh) | 图像压缩的方法及装置、终端 | |
CN104581158A (zh) | 量化表、图像压缩处理方法、装置、终端及图像搜索系统 | |
CN117319655B (zh) | 一种图像压缩处理方法、系统、装置及介质 | |
US11544881B1 (en) | Method and data processing system for lossy image or video encoding, transmission and decoding | |
CN116095321A (zh) | 显著性区域图像编解码方法、系统、设备及存储介质 | |
CN113554719B (zh) | 一种图像编码方法、解码方法、存储介质及终端设备 | |
CN111161363A (zh) | 一种图像编码模型训练方法及装置 | |
CN111163320A (zh) | 一种视频压缩方法及系统 | |
CN111510740B (zh) | 转码方法、装置、电子设备和计算机可读存储介质 | |
CN114332481A (zh) | 一种基于非负稀疏自编码器的盲端元提取与光谱解混方法 | |
CN114708343A (zh) | 基于图字典学习的三维点云编解码方法、压缩方法及装置 | |
CN113141506A (zh) | 基于深度学习的图像压缩神经网络模型、及其方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |