CN113038134B - 一种图片处理方法、智能终端及存储介质 - Google Patents

一种图片处理方法、智能终端及存储介质 Download PDF

Info

Publication number
CN113038134B
CN113038134B CN201911357231.7A CN201911357231A CN113038134B CN 113038134 B CN113038134 B CN 113038134B CN 201911357231 A CN201911357231 A CN 201911357231A CN 113038134 B CN113038134 B CN 113038134B
Authority
CN
China
Prior art keywords
feature map
picture
feature
carrying
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911357231.7A
Other languages
English (en)
Other versions
CN113038134A (zh
Inventor
肖云雷
陈巍
刘阳兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan TCL Group Industrial Research Institute Co Ltd
Original Assignee
Wuhan TCL Group Industrial Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan TCL Group Industrial Research Institute Co Ltd filed Critical Wuhan TCL Group Industrial Research Institute Co Ltd
Priority to CN201911357231.7A priority Critical patent/CN113038134B/zh
Publication of CN113038134A publication Critical patent/CN113038134A/zh
Application granted granted Critical
Publication of CN113038134B publication Critical patent/CN113038134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种图片处理方法、智能终端及存储介质,所述方法包括:将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;将所述二进制文件进行无损解码处理得到所述特征图;将所述特征图进行有损解码处理还原出所述图片。本发明减少了图像压缩所产生的中间文件,提高压缩比,使得图像能被压缩得更小。

Description

一种图片处理方法、智能终端及存储介质
技术领域
本发明涉及图片处理技术领域,尤其涉及一种图片处理方法、智能终端及存储介质。
背景技术
视频和图片是日常生活中一种常见信息载体,然而无损图片是非常占据物理存储空间的,并且不利于传输,图片压缩的一项关键技术就是熵编码(熵编码是根据字符被预估的概率来进行编码,预估概率越准确,文件压缩比则越高,比如原本文件为50M,压缩之后为25M,压缩比就为2,这个数越高,文件就能被压缩得更小;编码过程中按熵原理不丢失任何信息的编码),熵编码能将图像压缩所产生的中间文件进行无损压缩。
熵编码可以被分成两部分:概率估计部分和算术编码部分。一般基于深度学习的概率估计网络是不能和图像压缩模块进行联合训练的,如果盲目的将熵编码和图像压缩模块进行联合训练(两个不同功能的网络结合到一起,一般会产生无法预料的结果),解压之后的图片会出现不正常现象(意思是和原始图片差距很大),无法得到想要的图片效果。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种图片处理方法、智能终端及存储介质,旨在解决现有技术中解压后的图片会出现不正常现象,无法得到想要的图片效果的问题。
为实现上述目的,本发明提供一种图片处理方法,包括如下步骤:
将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;
将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;
将所述二进制文件进行无损解码处理得到所述特征图;
将所述特征图进行有损解码处理还原出所述图片。
可选地,所述的图片处理方法,其中,所述将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图,具体为:
输入所述图片,通过编码网络对所述图片进行有损编码处理,提取所述图片的特征,将所述特征量化处理成所述特征图。
可选地,所述的图片处理方法,其中,所述二进制文件由概率估计网络和算数编码进行无损编码得到。
可选地,所述的图片处理方法,其中,所述将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图,具体包括:
输入所述图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理。
可选地,所述的图片处理方法,其中,所述将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
可选地,所述的图片处理方法,其中,所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值的计算为:
其中,py(y)为所述特征图y所以对应的概率图,为一个正态分布的表达,为方差,/>为-0.5到0.5之间的均匀噪声,i表示特征图y中的第i个特征值。
可选地,所述的图片处理方法,其中,所述将所述二进制文件进行无损解码处理得到所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和所述算术编码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
可选地,所述的图片处理方法,其中,所述将所述特征图进行有损解码处理还原出所述图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述图片。
此外,为实现上述目的,本发明还提供一种智能终端,其中,所述智能终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图片处理程序,所述图片处理程序被所述处理器执行时实现如上所述的图片处理方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,其中,所述存储介质存储有图片处理程序,所述图片处理程序被处理器执行时实现如上所述的图片处理方法的步骤。
本发明将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;将所述二进制文件进行无损解码处理得到所述特征图;将所述特征图进行有损解码处理还原出所述图片。本发明减少了图像压缩所产生的中间文件,提高压缩比,使得图像能被压缩得更小。
附图说明
图1是本发明图片处理方法的较佳实施例的流程图;
图2是本发明图片处理方法的较佳实施例中图像压缩算法流程图;
图3是本发明图片处理方法的较佳实施例中概率估计操作手段示意图;
图4是本发明图片处理方法的较佳实施例中概率估计执行过程示意图;
图5是本发明图片处理方法的较佳实施例中算术编码过程的示意图;
图6为本发明智能终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的图片处理方法,如图1所示,所述图片处理方法包括以下步骤:
步骤S10、将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图。
具体地,本发明是通过编码网络对所述图片进行有损编码处理,其中,所述编码网络优选为基于CNN的多尺度编码网络,本发明中的基于CNN(Convolutional NeuralNetworks,卷积神经网络,是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一)的多尺度编码网络(此网络可以是现有网络)对输入的所述图片进行有损编码(即有损压缩,有损压缩是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响缩小,却换来了大得多的压缩比),以提取多个特征图,本发明优选为四个特征图,分别为:第一特征图、第二特征图、第三特征图和第四特征图。
进一步地,如图2所示,输入所述原始图片,经过空间转通道操作进行下采样(比如一张彩色图片为RGB 3个通道,宽高各为50,通过空间转通道的操作,可以将这张彩色图片转换成通道数为12,宽高各为25的图片),并经过卷积操作(conv,卷积操作的目的是提取图像的特征)、批归一化操作(BN,一个深度神经网络训练的技巧,它不仅可以加快了模型的收敛速度,而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题,从而使得训练深层网络模型更加容易和稳定)和ReLU激活函数(激活函数就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端,引入激活函数是为了增加神经网络模型的非线性)进行非线性变换。
将所述原始图片由split(分裂)分离并获取不同尺度的第一特征图C1、第二特征图C2、第三特征图C3和第四特征图C4;将所述第一特征图C1、所述第二特征图C2和所述第三特征图C3下采样到与所述第四特征图C4相同尺度,并进行合并后进行量化处理,量化方式为:对于输入X,截断至[0,m],然后由(N-1)/m*[0,m]变换将X映射至范围N,即完成整型量化。
步骤S20、将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件。
具体地,将多个所述特征图通过概率估计网络(Parallel multi-scale PixelCNN网络,一种可以并行生成多个像素值的多尺度神经网络)和算术编码进行无损编码(即无损压缩,无损压缩是利用数据的统计冗余进行压缩,可完全恢复原始数据而不引起任何失真)得到二进制文件(即中间文件,例如输入一个文件给有损压缩模块,它会压缩出一个文件来,这个文件就是中间文件,可以根据这个中间文件解压出文件来)。
其中,所述无损编码的主要作用是将特征图C进行无损压缩,本发明设计出适合联合训练的Parallel PixcelCNN网络(见图3和图4):特征图C经过slice(切片操作,也就是按照一定规则来选择特征图上的点),生成四个特征图C_1_00、C_1_11、C_1_01和C_1_10,具体过程如下:
第一步:C_1_00经过conv0(它可以被细分成Conv(3,1,1),常用卷积操作,3代表卷积核的大小,1代表步长,另外一个1代表特征图宽高的填充大小)和Relu运算(常用激活函数Relu)和conv1(它可以被细分成Conv(3,1,1)和SoftPlus运算(常用激活函数SoftPlus))运算得到方差Sigma_1_11,将Sigma_1_11进行PDF(它的表达式就是公式1)运算得到概率图P_1_11,但这个概率图P_1_11是对应特征图C_1_11_Pad(由于特征图C_1_11的维度不一定和概率图P_1_11的维度相同,所以特征图C_1_11需要经过一个pad补0运算,将C_1_11填充为C_1_11_Pad)。
第二步:将C_1_00和C_1_11_Pad进行merge(并联合并)运算得到特征图C_1_00_11,C_1_00_11经过conv0和conv1运算得到方差Sigma_1_01_10,将Sigma_1_01_10进行PDF运算得到概率图P_1_01_10,将概率图P_1_01_10进行split(切开分离)运算得到概率图P_1_01和P_1_10,其中P_1_01和P_1_10分别对应着C_1_01和C_1_10。
第三步:将特征图C_1_00往下传,同上一样,可以得到概率图P_2_11和特征图C_2_11_pad、概率图P_2_01和特征图C_2_01、概率图P_2_10和特征图C_2_10以及特征图C_2_00。
第四步:将C_2_00所对应的概率图P_2_00设置为可学习参数(深度学习在训练的时候,这个参数会自动更新,等训练完之后,这个参数就是一个固定的数)。
其中,conv1(在图3和图4中,conv1指代一个组合操作,即先进行一个卷积运算操作,再进行一个激活函数运算操作)所包含的激活函数为Softplus(Softplus是一种常用激活函数,其数学公式表达式为:f(x)=loge(1+ex)),能很平滑的非线性拟合(每个特征值都有自己真实方差,通过非线性变化来拟合它,通过神经网络学习到一个值和它相近)每个特征值的均值和方差,本发明通过公式1(py(y)为特征图y所以对应的概率图,为一个正态分布的表达,方差为/> 为-0.5到0.5之间的均匀噪声,i表示特征图y中的第i个特征值),公式如下:
改进后的基于高斯分布的PixelCNN概率估计网络既具有原始ParallelPixcelCNN简单易懂的特性,又具有联合训练的特性。
在估计完每个特征值的概率之后,将特征值(C_2_00、C_2_11、C_2_01、C_2_10、C_1_11、C_1_01和C_1_10)与概率值(P_2_00、P_2_11、P_2_01、P_2_10、P_1_11、P_1_01和P_1_10)对应合并,然后进行算术编码,形成二进制文件,其具体流程可参见图5。
步骤S30、将所述二进制文件进行无损解码处理得到所述特征图。
具体地,将所述二进制文件解码出所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4;经过所述概率估计网络和所述算术编码处理后得到所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4的特征值。
进一步地,所述步骤S30主要作用是将步骤S20中所得到二进制文件解码出C1、C2、C3和C4(有损编码网络从原图片中提取到四个特征图,步骤S20是无损编码,所以无损解码出的四个特征图也就是原来的C1、C2、C3和C4。
如果四个特征图总大小为50M,无损压缩之后,总体积变成25M,就起到一个压缩效果,而且这个是无损的压缩,在解压之后,可以得到原来的那四个特征图。首先,本发明先获取C4概率估计,算术编码则根据相应概率值,解码出C4,依据步骤S20中的方法,可以依次得到C3、C2和C1的概率值,同理,根据算术编码也可以解码出C3、C2和C1。
步骤S40、将所述特征图进行有损解码处理还原出所述图片。
具体地,基于CNN的多尺度解码网络将所述第四特征图C4进行非线性变换后再进行上采样;所述第一特征图C1、所述第二特征图C2和所述第三特征图C3上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述图片。
其中,所述有损解码主要作用是把无损解码解出来的特征图(C)还原成图片。
在本发明中,有损编解码(有损编码网络和有损解码网络合并起被统称为有损编解码网络)和无损编解码网络(无损编码网络和无损解码网络合并起被统称为无损编解码网络)是联合训练,采用率失真损失函数(见公式2),其中有损编解码网络的损失函数为MS-SSIM损失函数(即为lossmsssim),无损编解码网络则采用熵损失函数(即为lossentropy)(loss代表总的损失函数,损失函数是可以指导深度学习网络学习),率失真损失函数为:
loss=lossmsssim+λ*lossentropy (2);
其中,λ是权衡压缩比和图像质量的参数,λ越大,压缩比越大,但恢复出来的图像质量越差。
进一步地,如图6所示,基于上述图片处理方法,本发明还相应提供了一种智能终端,所述智能终端包括处理器10、存储器20及显示器30。图6仅示出了智能终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述智能终端的内部存储单元,例如智能终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述智能终端的外部存储设备,例如所述智能终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述智能终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述智能终端的应用软件及各类数据,例如所述安装智能终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有图片处理程序40,该图片处理程序40可被处理器10所执行,从而实现本申请中图片处理方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述图片处理方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述智能终端的信息以及用于显示可视化的用户界面。所述智能终端的部件10-30通过系统总线相互通信。
在一实施例中,当处理器10执行所述存储器20中图片处理程序40时实现以下步骤:
将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;
将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;
将所述二进制文件进行无损解码处理得到所述特征图;
将所述特征图进行有损解码处理还原出所述图片。
所述将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图,具体为:
输入所述图片,通过编码网络对所述图片进行有损编码处理,提取所述图片的特征,将所述特征量化处理成所述特征图。
所述二进制文件由概率估计网络和算数编码进行无损编码得到。
所述将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图,具体包括:
输入所述图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理。
所述将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值的计算为:
其中,py(y)为所述特征图y所以对应的概率图,为一个正态分布的表达,为方差,/>为-0.5到0.5之间的均匀噪声,i表示特征图y中的第i个特征值。
所述将所述二进制文件进行无损解码处理得到所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和所述算术编码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
所述将所述特征图进行有损解码处理还原出所述图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述图片。
本发明还提供一种存储介质,其中,所述存储介质存储有图片处理程序,所述图片处理程序被处理器执行时实现如上所述的图片处理方法的步骤。
综上所述,本发明提供一种图片处理方法、智能终端及存储介质,所述方法包括:将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;将所述二进制文件进行无损解码处理得到所述特征图;将所述特征图进行有损解码处理还原出所述图片。本发明减少了图像压缩所产生的中间文件,提高压缩比,使得图像能被压缩得更小。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (7)

1.一种图片处理方法,其特征在于,所述图片处理方法包括如下步骤:
将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图;
将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件;
将所述二进制文件进行无损解码处理得到所述特征图;
将所述特征图进行有损解码处理还原出所述图片;
所述将输入的图片进行有损编码处理,提取所述图片的特征后量化处理成特征图,具体包括:
输入所述图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理;
所述将所述特征图进行无损编码处理,获取所述特征图的特征值和概率值,并将所述特征值和概率值合并后进行算术编码形成二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
2.根据权利要求1所述的图片处理方法,其特征在于,所述二进制文件由概率估计网络和算术编码进行无损编码得到。
3.根据权利要求1所述的图片处理方法,其特征在于,所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值的计算为:
其中,py(y)为所述特征图y所以对应的概率图,为一个正态分布的表达,/>为方差,/>为-0.5到0.5之间的均匀噪声,i表示特征图y中的第i个特征值。
4.根据权利要求2所述的图片处理方法,其特征在于,所述将所述二进制文件进行无损解码处理得到所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和算术解码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
5.根据权利要求4所述的图片处理方法,其特征在于,所述将所述特征图进行有损解码处理还原出所述图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述图片。
6.一种智能终端,其特征在于,所述智能终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图片处理程序,所述图片处理程序被所述处理器执行时实现如权利要求1-5任一项所述的图片处理方法的步骤。
7.一种存储介质,其特征在于,所述存储介质存储有图片处理程序,所述图片处理程序被处理器执行时实现如权利要求1-5任一项所述的图片处理方法的步骤。
CN201911357231.7A 2019-12-25 2019-12-25 一种图片处理方法、智能终端及存储介质 Active CN113038134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911357231.7A CN113038134B (zh) 2019-12-25 2019-12-25 一种图片处理方法、智能终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911357231.7A CN113038134B (zh) 2019-12-25 2019-12-25 一种图片处理方法、智能终端及存储介质

Publications (2)

Publication Number Publication Date
CN113038134A CN113038134A (zh) 2021-06-25
CN113038134B true CN113038134B (zh) 2023-08-01

Family

ID=76458343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911357231.7A Active CN113038134B (zh) 2019-12-25 2019-12-25 一种图片处理方法、智能终端及存储介质

Country Status (1)

Country Link
CN (1) CN113038134B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824512B (zh) * 2023-08-28 2023-11-07 西华大学 一种27.5kV可视化接地刀闸状态识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法
EP1921752A1 (en) * 2006-11-13 2008-05-14 Global IP Solutions (GIPS) AB Adaptive arithmetic encoding and decoding of digital data
US9941900B1 (en) * 2017-10-03 2018-04-10 Dropbox, Inc. Techniques for general-purpose lossless data compression using a recurrent neural network
CN109996071A (zh) * 2019-03-27 2019-07-09 上海交通大学 基于深度学习的可变码率图像编码、解码系统及方法
KR20190089777A (ko) * 2018-01-23 2019-07-31 주식회사 날비컴퍼니 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070233477A1 (en) * 2006-03-30 2007-10-04 Infima Ltd. Lossless Data Compression Using Adaptive Context Modeling
US11184623B2 (en) * 2011-09-26 2021-11-23 Texas Instruments Incorporated Method and system for lossless coding mode in video coding
US11902369B2 (en) * 2018-02-09 2024-02-13 Preferred Networks, Inc. Autoencoder, data processing system, data processing method and non-transitory computer readable medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法
EP1921752A1 (en) * 2006-11-13 2008-05-14 Global IP Solutions (GIPS) AB Adaptive arithmetic encoding and decoding of digital data
US9941900B1 (en) * 2017-10-03 2018-04-10 Dropbox, Inc. Techniques for general-purpose lossless data compression using a recurrent neural network
KR20190089777A (ko) * 2018-01-23 2019-07-31 주식회사 날비컴퍼니 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치
CN109996071A (zh) * 2019-03-27 2019-07-09 上海交通大学 基于深度学习的可变码率图像编码、解码系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孔繁锵等.基于卷积神经网络的端到端多光谱图像压缩方法.《中国激光》.2019,第46卷(第10期),第285-293页. *

Also Published As

Publication number Publication date
CN113038134A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
US11670010B2 (en) Data compression using conditional entropy models
US10909728B1 (en) Learned lossy image compression codec
US11221990B2 (en) Ultra-high compression of images based on deep learning
US11177823B2 (en) Data compression by local entropy encoding
US11538197B2 (en) Channel-wise autoregressive entropy models for image compression
US20240104786A1 (en) Data compression using integer neural networks
CN114581544A (zh) 图像压缩方法、计算机设备及计算机存储介质
US11178430B2 (en) Adaptive DCT sharpener
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
KR20220058628A (ko) 신경망 모델 압축
Otair et al. Improved near-lossless technique using the Huffman coding for enhancing the quality of image compression
CN113038134B (zh) 一种图片处理方法、智能终端及存储介质
Hasnat et al. Luminance approximated vector quantization algorithm to retain better image quality of the decompressed image
CN113034625B (zh) 一种基于图片的无损压缩方法、智能终端及存储介质
CN113949867B (zh) 一种图像处理的方法及装置
Thakker et al. Lossy Image Compression-A Comparison Between Wavelet Transform, Principal Component Analysis, K-Means and Autoencoders
CN113554719B (zh) 一种图像编码方法、解码方法、存储介质及终端设备
CN113315970B (zh) 一种图像压缩方法、图像解码方法、智能终端及存储介质
Suresh Kumar et al. Bilateral anisotropic Gabor wavelet transformation based deep stacked auto encoding for lossesless image compression
CN113949868B (zh) 一种熵编码方法及装置
US20240104785A1 (en) Generating images using sparse representations
Garg et al. Various Image Compression Techniques: A Review.
KR20230158597A (ko) 신경 이미지 압축에서의 온라인 트레이닝 기반 인코더 튜닝
Chen et al. Adaptive VQVAE: a learning-based image compression framework with vector quantization
KR20220065306A (ko) 연속 심층 영상 압축을 위한 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant