CN110517329B - 一种基于语义分析的深度学习图像压缩方法 - Google Patents

一种基于语义分析的深度学习图像压缩方法 Download PDF

Info

Publication number
CN110517329B
CN110517329B CN201910741565.8A CN201910741565A CN110517329B CN 110517329 B CN110517329 B CN 110517329B CN 201910741565 A CN201910741565 A CN 201910741565A CN 110517329 B CN110517329 B CN 110517329B
Authority
CN
China
Prior art keywords
image
compression
semantic
input
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910741565.8A
Other languages
English (en)
Other versions
CN110517329A (zh
Inventor
王程
韩逸飞
赵晓燕
王卫东
胡欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910741565.8A priority Critical patent/CN110517329B/zh
Publication of CN110517329A publication Critical patent/CN110517329A/zh
Application granted granted Critical
Publication of CN110517329B publication Critical patent/CN110517329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks

Abstract

本发明提出一种基于语义分析的深度学习图像压缩方法,属于图像有损压缩技术领域。包括:步骤1,对输入的图像使用卷积神经网络CNN对图像进行特征提取,标识每个像素的语义重要程度;步骤2,将输入图像进行分块,压缩比特分配对每个图像块依据其语义重要程度计算对应的压缩比例;步骤3,使用基于CNN和循环神经网络LSTM的网络结构对图像按照计算好的压缩比例进行压缩和恢复。本发明将深度学习在图像语义分析和图像压缩领域的应用相结合,根据语义重要程度分配图像不同区域的压缩比特,以实现基于语义重要度分析的图像压缩效果,提高图像中人眼关注区域的视觉质量,整张图片占据的空间更小,在物联网图像处理方面有很好的应用价值。

Description

一种基于语义分析的深度学习图像压缩方法
技术领域
本发明涉及图像有损压缩技术领域,具体是一种基于语义分析的深度学习图像压缩方法。
背景技术
物联网的长足发展极大地便利了人们的生活,同时也导致了网络传输数据量的爆炸性提升。网络中的业务种类从原有的文字、语音业务向图像、视频流业务发展,数字图像产品为信息的传递带来了便利,同时也不断提高对数据传输和存储的要求。因此,为了减小图像在传输和存储时的体积以提高网络传输效率,如何通过更小的压缩大小获得更好的恢复质量一直以来都是图像领域研究的重点。
图像压缩的关键在于去除图像中的冗余。图像数据中的冗余有三种,分别为编码冗余、像素冗余和视觉冗余。针对图像冗余的类别,图像压缩可以分为有损压缩和无损压缩,无损压缩技术通过去除图片编码冗余和像素冗余实现压缩的目的,压缩比例一般在2-10之间,被广泛应用在对图像纹理清晰度要求很高的场景,如艺术平电子图像、生物医学图像等,而在对图像质量要求相对较低的物联网中,无损压缩由于其受限的压缩比率并不适用。有损压缩编码技术根据人眼对于某些视觉特征不敏感的原理对图像信息进行压缩,以去除少部分人眼不敏感信息为代价,在不明显降低图像质量的前提下,实现了相对于无损压缩更高的压缩比。常用的有损编码技术有预测编码、矢量编码、位平面编码、JPEG、模型编码、神经网络编码等。
近年来,深度学习理论得益于大规模数据集的产生、强有力模型的发展以及大量可用的计算资源,在图像处理领域取得了优异的进展。在图像压缩领域,深度学习相对于传统方法拥有更多的学习参数,可以通过学习更有效地把握图像地特征和本质,对提高图像压缩比率和图像恢复效果方面具有重要意义。尽管很多深度学习的方法都可以实现很好地图像压缩效果,但是仍然存在一些问题需要解决。一般来说,人眼对于图像每个区域的关注程度是有区别的,例如对于一张人物肖像图片,相对于背景,前景中的人物的清晰度、纹理细节更受人眼关注。在当前的物联网多媒体数据压缩需求中,大多图像明显的存在前景和背景的区分,而现有的压缩方法对于图像的每个像素点都作相同处理,因此在背景重要性低的图像中,并不能使每个压缩比特得到最好的分配。所以,在这种场景下,针对具有明显前景背景区分图像的最优压缩比特分配问题,提出对应的压缩技术具有重要意义。
发明内容
本发明针对物联网中图像数据低尺寸、高质量的压缩需求,以及人眼对于图像中前景的关注度高于背景的特性,提供了一种基于语义分析的深度学习图像压缩方法。本发明方法通过卷积神经网络提取图像的语义重要区域,再根据各区域语义重要程度分级别地对图像进行压缩,为物联网图像有损压缩提供了一种有效解决方案。
本发明的一种基于语义分析的深度学习图像压缩方法,包括如下步骤1~3。
步骤1,对输入的图像使用语义分析网络标识每个像素的语义重要程度。
所述的语义分析网络中在卷积神经网络的最后一个卷积层使用全局平均池化层,将得到的特征图转换为特征向量,将特征向量的加权线性和输入至softmax层得到最终的分类。
其中,设图像经过卷积神经网络得到k个特征图fu,k为类别数量,对每个特征图进行全局平均池化,设权重
Figure BDA0002164131640000021
是每个特征图fu被分类为类别c的概率,将各特征图全局平均池化的结果与对应的类别c的权重
Figure BDA0002164131640000022
相乘求和得到图像属于类别c的概率Pc;将概率Pc输入softmax层,得到分类得分Rc;选取得分最高的类别作为预测分类结果。
通过对网络训练不断优化权重
Figure BDA0002164131640000023
得到最终训练完备的权重
Figure BDA0002164131640000024
后,对输入的图像进行分类,设预测的分类结果为c,将输入图像的各特征图fu
Figure BDA0002164131640000025
相乘求和获得图像Hc,将Hc上采样至原图像的大小,得到输入图像的语义重要性图,语义重要性图为取值为0到255的灰度图,像素的灰度值表示像素属于类别c的概率。
步骤2,将输入图像进行分块,对每个图像块依据其语义重要程度计算对应的压缩比例。
设图像被分为N块,图像的平均压缩等级为
Figure BDA0002164131640000026
则所有图像块的压缩等级之和为
Figure BDA0002164131640000027
对每个图像块,根据块内像素点的灰度值之和得到图像块的语义重要性值,则图像块i的语义重要程度Li的计算方法是:图像块i的语义重要性值/图像的所有图像块的语义重要性值之和;i=1,2,…,N;得到图像块i的压缩等级
Figure BDA0002164131640000028
Figure BDA0002164131640000029
表示向下取整。
步骤3,使用基于CNN和循环神经网络LSTM进行图像压缩。
相对于现有技术,本发明的优点与积极效果在于:
(1)本发明针对人眼对于图像中前景的关注度高于背景的特性,将深度学习在图像语义分析和图像压缩领域的应用相结合,提出了基于语义分析的图像压缩框架,由语义分析网络和图像压缩网路两个神经网络构成。语义分析网络负责使用卷积神经网络提取图像的语义重要区域,并根据每个图像块对应的语义重要程度计算压缩等级。图像压缩网络根据计算好的压缩等级使用循环神经网络对图像进行有区别、分等级的压缩。实验结果有效表明本发明方法可以在同等压缩开销下将更多的压缩比特分配给语义重要区域,提高图像中人眼关注区域的视觉质量,同时也可以在保证前景(语义重要区域)恢复质量相同的情况下,整张图片占据的空间更小,在物联网图像处理方面有很好的应用价值。
(2)本发明基于语义重要程度的压缩比特分配方法,解决了如何根据语义分析网络得到的重要性图计算出图像每个区域对应的压缩等级,该分配方法可以保证在分配空间大小等量的情况下,根据语义重要程度分配图像不同区域的压缩比特,以实现基于语义重要度分析的图像压缩效果。
附图说明
图1是本发明的图像压缩方法实现的总体框架示意图;
图2是语义分析网络结构示意图;
图3是语义分析结果示意图;
图4是单次迭代网络结构;
图5是LSTM单元结构。
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明提出的基于语义分析的深度学习图像压缩方法的一个实现框架如图1所示,主要包含语义分析、压缩比特分配和图像压缩三部分。其中,语义分析使用卷积神经网络CNN对图像进行特征提取,并标识出每个像素的语义重要程度。压缩比特分配根据生成的语义重要性图计算出每个图像块对应的压缩比例。图像压缩使用基于CNN和循环神经网络LSTM(Long Short-Term Memory,长短期记忆网络)的网络结构对图像按照计算好的压缩比例进行压缩和恢复。
本发明方法使用的语义分析网络的结构如图2所示,采用与VGG16类似的基于分类训练的网络架构。前五个卷积层用来提取输入图像的特征,在最后一层卷积层后使用全局平均池化(GAP)层来代替全连接层(FC)将特征图转换为特征向量,相比于FC,GAP减少了大量的网络参数,防止过拟合,同时最重要的是GAP可以保存图像的空间信息。最后将特征向量与其对应权重的加权线性和输入至softmax层得到最终的类激活映射。
(1)首先,说明本发明使用的语义分析网络标识图像中每个像素的语义重要度的过程。
设给定一张输入图像I及类别集合C,I通过卷积神经网络CNN得到g个特征图fu,此处g的个数与集合C中类别数量相同,u=1,2,…g。类别集合C为图像识别的物体类别的集合,本发明实施例中采用的caltech-256数据集,包含256个物体类别。G(·)表示对每个特征图fu进行全局平均池化操作。
Figure BDA0002164131640000031
是每个特征图fu被分类为类别c的概率,即fu与类c关联的权重,c∈C。设Pc为图像I属于类c的概率,是通过每个特征图fu的全局平均池化结果与其关联的特定类别c的权重
Figure BDA0002164131640000032
相乘求和得到,如公式(1)所示。
Figure BDA0002164131640000033
将Pc输入softmax层,得到分类得分Rc
Figure BDA0002164131640000034
选取得分最高的类别作为预测分类结果,将其与图像真实类别标签的交叉熵作为损失函数对网络进行训练,不断优化权重
Figure BDA0002164131640000041
得到最终训练完备的权重
Figure BDA0002164131640000042
后,可以使用fu
Figure BDA0002164131640000043
的加权线性和图Hc来可视化图像I中每个像素属于类别c的概率,如公式(3)所示。
Figure BDA0002164131640000044
将Hc上采样至原图的大小,得到代表语义重要性的灰度图,再将灰度图以热图方式绘制,将绘制好的热图与原图进行叠加,即可利用热力图的方式得到原图I的语义重要性表达。
本步骤中,利用卷积神经网络对一张图片提取到g个特征图,每个特征图提取到的是图片的不同部分或不同属性。因为卷积核数量g与类别集合C的数量相同,所以本发明进行合理估计,认为每个卷积核提取的是图片属于某一特定(或多种)类别的特征。然后采用全局平均池化方法对每个特征图进行处理共得到g个均值,将这些均值与权重
Figure BDA0002164131640000045
相乘后接softmax做分类处理,利用交叉熵损失函数进行反向传播,以此训练过程不断优化参数
Figure BDA0002164131640000046
直到分类结果达到最优。
可视化的方法,是在上述训练过程全部结束后,输入一张测试图片,利用训练好的网络得到其分类类别c并提取出g个特征图,将对应的权重
Figure BDA0002164131640000047
分别与g个特征图进行加权求和,将得到的结果进行上采样到原图大小并与其叠加,即生成表征图像语义重要程度的热力图。如图3所示,对四张图像采用上述语义分析网络进行分析,得到的语义重要程度示意,从图中可以看出,对人眼关注区域的语义重要程度比较高。
(2)其次,说明本发明方法中的压缩比特分配的过程。
为了实现对图像有区分的压缩,需要对其进行分块处理,考虑到较大的块会降低计算速度并且较小的块会影响像素之间的信息熵,效仿JPEG方法,将图像分为8×8的块,对每一个图像块依据其语义重要程度计算对应的压缩比例。在本发明的压缩框架中,使用图像压缩网络的迭代次数来控制压缩比特的分配。
设输入图像大小为H×W,整个图片被分为N块8×8大小的图像块,N=H×W/8×8。设图像的平均压缩等级为
Figure BDA0002164131640000048
图像块i的压缩等级为Ki,为了保证压缩比率的一致,所有图像块的压缩等级之和应为:
Figure BDA0002164131640000049
通过图像语义分析网络可以得到输入图片的语义重要性图,一张取值为0到255的灰度图。每个像素灰度值的高低表征该像素属于人眼关注的某个类别的概率,可以利用此概率计算该像素的语义重要程度。令图像块i的语义重要性值Vi为该图像块中每个像素点对应的灰度值之和,则图像块i的语义重要程度Li表示为:
Figure BDA00021641316400000410
由于各图像块压缩等级之和为
Figure BDA0002164131640000051
图像块i的压缩等级Ti可以表示为:
Figure BDA0002164131640000052
其中,
Figure BDA0002164131640000053
表示向下取整函数,目的是保证平均压缩等级不超过
Figure BDA0002164131640000054
(3)下面说明本发明进行图像压缩的过程。
在得到每个图像块的压缩等级后,可以使用图像压缩网络按对应的迭代次数对每个图像块进行压缩,最后再合并为一张完整的图像。
本发明在图像压缩部分采用了集编码器E、二值化器B、解码器D于一体,可端到端训练的CNN/RNN网络,网络可进行多次迭代,每次迭代过程中,编码器E将图片编码为representation code,二值化器B将representation code变换为二值化编码,解码器D通过二值化编码预测输入的原始图片。该过程将被重复,利用上一次迭代的输出与输入的残差作为下一次迭代的输入,每次迭代过程描述如下:
bk=B(Ek(rk-1)),yk=Dk(bk),rk=|yk-1-yk| (7)
其中,bk是第k次迭代中的二值化编码,B是二值化器,Ek表示第k次迭代的编码器,rk-1是第k-1次迭代输入和输出的残差,Dk表示第k次迭代的解码器,yk是第k次迭代中预测的输出,rk是第k次迭代中输出yk和输入yk-1的残差。单次迭代的网络结构如图4所示。
编码器和解码器中使用了LSTM单元来记忆每次迭代过程中预测输出与输入的残差,LSTM单元结构如图5所示。其中ck-1和hk-1分别是上一次迭代中该LSTM单元的记忆状态和隐层状态,xk是第k次迭代的LSTM单元的输入向量,它等于本次迭代中上一层网络的输出。每个LSTM单元包含两个卷积神经网络,卷积神经网络Conv_in作用于输入向量xk,卷积神经网络Conv_hi作用于上一次迭代中该LSTM单元的隐层状态向量hk-1。对于给定的输入向量xk,上次迭代的记忆状态ck-1和隐层状态hk-1,本次迭代的ck和hk计算方法如下:
Figure BDA0002164131640000055
Figure BDA0002164131640000056
hk=o⊙tanh(ck) (10)
其中,⊙表示元素级乘法。f是本LSTM单元中遗忘门,i是输入门,
Figure BDA0002164131640000057
是细胞状态,o是输出门,σ是sigmod激活函数,tanh是tanh激活函数。
二值化器先使用一个卷积神经网络加tanh激活函数,将编码器得到的representation code映射到(-1,1)的区间内,再使用sign函数将区间内的编码二值化为集合{-1,1}。每一次迭代可以将一个输入为H×W×3的向量压缩为(H/16)×(W/16)×32的二值化编码,即每次迭代的bpp(bit per pixel)为1/8,经过k次迭代后的压缩比例为k/192。常用的图像都是RGB三通道图像,所以输入图像对应的向量为H×W×3,3是图像通道数。压缩的二值化编码大小为(H/16)×(W/16)×32,其中的数值16和32是根据卷积神经网络推算得到的。
解码器包含CNN、LSTM结构及Sub-pixel结构,其中Sub-pixel层对特征向量进行上采样,最后还原为输入图片的尺度。网络训练过程中使用损失函数计算每次迭代的输出和输入的残差,整个网络的损失函数可以表示为
Figure BDA0002164131640000061
显然,所描述的实施例也仅仅是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

Claims (2)

1.一种基于语义分析的深度学习图像压缩方法,其特征在于,包括如下步骤:
步骤1,对输入的图像使用语义分析网络标识每个像素的语义重要程度;
所述的语义分析网络中在卷积神经网络的最后一个卷积层使用全局平均池化层,将得到的特征图转换为特征向量,将特征向量的加权线性和输入至softmax层得到最终的分类;
其中,设图像经过卷积神经网络得到g个特征图fu,g为类别数量,对每个特征图进行全局平均池化,设权重
Figure FDA0003006956090000011
是每个特征图fu被分类为类别c的概率,将各特征图全局平均池化的结果与对应的类别c的权重
Figure FDA0003006956090000012
相乘求和得到图像属于类别c的概率Pc;将概率Pc输入softmax层,得到分类得分Rc;选取得分最高的类别作为预测分类结果;
通过对网络训练不断优化权重
Figure FDA0003006956090000013
得到最终训练完备的权重
Figure FDA0003006956090000014
后,对输入的图像进行分类,设预测的分类结果为c,将输入图像的各特征图fu
Figure FDA0003006956090000015
相乘求和获得图像Hc,使用图Hc来可视化图像中每个像素属于类别c的概率;将Hc上采样至原图像的大小,得到输入图像的语义重要性图,语义重要性图为取值为0到255的灰度图,像素的灰度值表示像素属于类别c的概率;
步骤2,将输入图像进行分块,对每个图像块依据其语义重要程度计算对应的压缩比例;
设图像被分为N块,图像的平均压缩等级为
Figure FDA0003006956090000016
则所有图像块的压缩等级之和为
Figure FDA0003006956090000017
对每个图像块,根据块内像素点的灰度值之和得到图像块的语义重要性值,则图像块i的语义重要程度Li的计算方法是:图像块i的语义重要性值/图像的所有图像块的语义重要性值之和,表示如下:
Figure FDA0003006956090000018
其中,图像块i的语义重要性值Vi为该图像块中每个像素点对应的灰度值之和,i=1,2,…,N;
得到图像块i的压缩等级
Figure FDA0003006956090000019
Figure FDA00030069560900000110
表示向下取整;
步骤3,使用基于卷积神经网络CNN和循环神经网络LSTM进行图像压缩。
2.根据权利要求1所述的基于语义分析的深度学习图像压缩方法,其特征在于,所述的步骤3中,对图像压缩时,采用集编码器、二值化器和解码器于一体,端到端训练的神经网络,网络进行一次或多次迭代;每次迭代过程中,编码器对图片编码,二值化器将编码变换为二值化编码,解码器通过二值化编码预测输入的原始图片,进行多次迭代时,迭代过程被重复,利用上一次迭代的输出与输入的残差作为下一次迭代的输入;编码器和解码器中使用了LSTM单元来记忆每次迭代过程中预测输出与输入的残差。
CN201910741565.8A 2019-08-12 2019-08-12 一种基于语义分析的深度学习图像压缩方法 Active CN110517329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910741565.8A CN110517329B (zh) 2019-08-12 2019-08-12 一种基于语义分析的深度学习图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910741565.8A CN110517329B (zh) 2019-08-12 2019-08-12 一种基于语义分析的深度学习图像压缩方法

Publications (2)

Publication Number Publication Date
CN110517329A CN110517329A (zh) 2019-11-29
CN110517329B true CN110517329B (zh) 2021-05-14

Family

ID=68624556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910741565.8A Active CN110517329B (zh) 2019-08-12 2019-08-12 一种基于语义分析的深度学习图像压缩方法

Country Status (1)

Country Link
CN (1) CN110517329B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145277A (zh) * 2019-12-31 2020-05-12 山东浪潮人工智能研究院有限公司 一种深度语义感知与bpg压缩工具的图像压缩方法
CN111222003B (zh) * 2020-01-09 2022-10-25 山东建筑大学 基于空间重要性的深度加权哈希学习方法
CN113312946A (zh) * 2020-02-27 2021-08-27 敦泰电子(深圳)有限公司 指纹图像的特征提取方法、装置及计算机可读存储介质
CN111723735B (zh) * 2020-06-18 2020-12-08 四川大学 一种基于卷积神经网络的伪高码率hevc视频检测方法
CN111953989A (zh) * 2020-07-21 2020-11-17 重庆邮电大学 基于用户交互与语义分割技术结合的图像压缩方法及装置
US11887277B2 (en) * 2021-02-23 2024-01-30 Adobe Inc. Removing compression artifacts from digital images and videos utilizing generative machine-learning models
CN113379858A (zh) * 2021-05-31 2021-09-10 超级视线科技有限公司 一种基于深度学习的图像压缩方法及装置
CN113407087B (zh) * 2021-08-23 2022-04-01 成都统信软件技术有限公司 一种图片处理的方法、计算设备及可读存储介质
CN113721859B (zh) * 2021-09-08 2023-07-21 欧亚高科数字技术有限公司 一种基于人工智能的图像重复数据删除方法
CN115102982B (zh) * 2021-11-19 2023-06-23 北京邮电大学 一种面向智能任务的语义通信方法
CN114630125B (zh) * 2022-03-23 2023-10-27 徐州百事利电动车业有限公司 基于人工智能与大数据的车辆图像压缩方法与系统
CN116228606B (zh) * 2023-05-09 2023-07-28 南京茂聚智能科技有限公司 一种基于大数据的图像优化处理系统
CN116975137B (zh) * 2023-09-25 2023-12-22 哈尔滨工程大学三亚南海创新发展基地 一种基于应用需求的数据格式转换方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424533B1 (en) * 2011-09-24 2016-08-23 Z Advanced Computing, Inc. Method and system for predicting an outcome of an event
CN106557812A (zh) * 2016-11-21 2017-04-05 北京大学 基于dct变换的深度卷积神经网络压缩与加速方案
CN107016708A (zh) * 2017-03-24 2017-08-04 杭州电子科技大学 一种基于深度学习的图像哈希编码方法
CN107563409A (zh) * 2017-08-04 2018-01-09 汕头大学 一种基于区域图像特征关注网络与最近邻排序的描述方法
CN107578453A (zh) * 2017-10-18 2018-01-12 北京旷视科技有限公司 压缩图像处理方法、装置、电子设备及计算机可读介质
CN107610113A (zh) * 2017-09-13 2018-01-19 北京邮电大学 一种图像中基于深度学习的小目标的检测方法及装置
CN108549841A (zh) * 2018-03-21 2018-09-18 南京邮电大学 一种基于深度学习的老人跌倒行为的识别方法
CN108564103A (zh) * 2018-01-09 2018-09-21 众安信息技术服务有限公司 数据处理方法与装置
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN109190626A (zh) * 2018-07-27 2019-01-11 国家新闻出版广电总局广播科学研究院 一种基于深度学习的多路径特征融合的语义分割方法
CN109711413A (zh) * 2018-12-30 2019-05-03 陕西师范大学 基于深度学习的图像语义分割方法
CN109934285A (zh) * 2019-03-11 2019-06-25 吉林大学 一种基于深度学习的图像分类神经网络压缩模型设计

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6895121B2 (en) * 2001-07-03 2005-05-17 Eastman Kodak Company Method for utilizing subject content analysis for producing a compressed bit stream from a digital image
US20140333640A1 (en) * 2013-05-13 2014-11-13 Qnx Software Systems Limited System and method for forwarding a graphics command stream
US10318881B2 (en) * 2013-06-28 2019-06-11 D-Wave Systems Inc. Systems and methods for quantum processing of data
US10163227B1 (en) * 2016-12-28 2018-12-25 Shutterstock, Inc. Image file compression using dummy data for non-salient portions of images
CN106952220A (zh) * 2017-03-14 2017-07-14 长沙全度影像科技有限公司 一种基于深度学习的全景图像融合方法
EP3635605B1 (en) * 2017-07-24 2022-06-15 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device
CN107801026B (zh) * 2017-11-09 2019-12-03 京东方科技集团股份有限公司 图像压缩方法及装置、图像压缩及解压缩系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424533B1 (en) * 2011-09-24 2016-08-23 Z Advanced Computing, Inc. Method and system for predicting an outcome of an event
CN106557812A (zh) * 2016-11-21 2017-04-05 北京大学 基于dct变换的深度卷积神经网络压缩与加速方案
CN107016708A (zh) * 2017-03-24 2017-08-04 杭州电子科技大学 一种基于深度学习的图像哈希编码方法
CN107563409A (zh) * 2017-08-04 2018-01-09 汕头大学 一种基于区域图像特征关注网络与最近邻排序的描述方法
CN107610113A (zh) * 2017-09-13 2018-01-19 北京邮电大学 一种图像中基于深度学习的小目标的检测方法及装置
CN107578453A (zh) * 2017-10-18 2018-01-12 北京旷视科技有限公司 压缩图像处理方法、装置、电子设备及计算机可读介质
CN108564103A (zh) * 2018-01-09 2018-09-21 众安信息技术服务有限公司 数据处理方法与装置
CN108549841A (zh) * 2018-03-21 2018-09-18 南京邮电大学 一种基于深度学习的老人跌倒行为的识别方法
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN109190626A (zh) * 2018-07-27 2019-01-11 国家新闻出版广电总局广播科学研究院 一种基于深度学习的多路径特征融合的语义分割方法
CN109711413A (zh) * 2018-12-30 2019-05-03 陕西师范大学 基于深度学习的图像语义分割方法
CN109934285A (zh) * 2019-03-11 2019-06-25 吉林大学 一种基于深度学习的图像分类神经网络压缩模型设计

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DeepSIC Deep Semantic Image Compression;Sihui Luo .etal;《Neural Information Processing》;20181117;第11301卷;96-106页 *
Full Resolution Image Compression with Recurrent Neural Networks;George Toderici .etal;《IEEE》;20171109;5435-5443页 *
基于时间演进图的LEO星间切换实时预测及更新方法;胡欣 等;《通信学报》;20181031;第39卷(第10期);1-9页 *
基于深度学习的图像编码方法研究;刘彦慧;《中国优秀硕士学位论文全文数据库-信息科技辑》;20180215(第2期);I136-556页 *

Also Published As

Publication number Publication date
CN110517329A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN110517329B (zh) 一种基于语义分析的深度学习图像压缩方法
CN109889839B (zh) 基于深度学习的感兴趣区域图像编码、解码系统及方法
CN109635662B (zh) 一种基于卷积神经网络的道路场景语义分割方法
CN111147862B (zh) 一种基于目标编码的端到端图像压缩方法
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN113269787A (zh) 一种基于门控融合的遥感图像语义分割方法
CN112991354A (zh) 一种基于深度学习的高分辨率遥感影像语义分割方法
CN113487618B (zh) 人像分割方法、装置、电子设备及存储介质
CN112884758B (zh) 一种基于风格迁移方法的缺陷绝缘子样本生成方法及系统
CN112733693B (zh) 一种全局感知高分辨率遥感影像多尺度残差道路提取方法
CN114723760B (zh) 人像分割模型的训练方法、装置及人像分割方法、装置
Kekre et al. Fast codevector search algorithm for 3-D Vector Quantized codebook
CN115330620A (zh) 一种基于循环生成对抗网络的图像去雾方法
Sadeeq et al. Image compression using neural networks: a review
Kekre et al. Vector quantized codebook optimization using k-means
CN115022637A (zh) 一种图像编码方法、图像解压方法以及装置
CN110378466B (zh) 基于神经网络差分的量化方法及系统
CN111479286B (zh) 一种边缘计算系统减少通信流量的数据处理方法
CN115866265A (zh) 一种应用于混合语境中的多码率深度图像压缩系统及方法
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
CN113949880A (zh) 一种极低码率人机协同图像编码训练方法及编解码方法
CN113344060A (zh) 文本分类模型训练方法、诉讼状分类方法及装置
CN112887722A (zh) 一种图像无损压缩方法
CN112818926B (zh) 一种基于多层残差学习的草图识别方法及系统
US20230154053A1 (en) System and method for scene graph lossless compression by context-based graph convolution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant