CN111147862A - 一种基于目标编码的端到端图像压缩方法 - Google Patents
一种基于目标编码的端到端图像压缩方法 Download PDFInfo
- Publication number
- CN111147862A CN111147862A CN202010003469.6A CN202010003469A CN111147862A CN 111147862 A CN111147862 A CN 111147862A CN 202010003469 A CN202010003469 A CN 202010003469A CN 111147862 A CN111147862 A CN 111147862A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- feature map
- matrix
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title claims abstract description 22
- 238000007906 compression Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000011218 segmentation Effects 0.000 claims abstract description 26
- 238000010586 diagram Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000013139 quantization Methods 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于目标编码的图像压缩方法,步骤如下:(1)获得输入图像的语义分割结果;(2)将语义分割结果转化为几组二值化矩阵,分别对应为图像中各个目标和背景区域的掩膜;(3)将图像输入若干个编码器,得到若干个不同码率的特征图;(4)将各掩膜与相应码率的特征图相乘,得到各特定区域的特征图;(5)将各特征图量化;(6)分别计算各量化特征图的信息熵;(7)将所有量化特征图相加得到整幅图像的完整特征图;(8)对特征图进行熵编码和熵解码;(9)将图像特征图输入解码器,得到重建图像;(10)构建损失函数,利用优化器训练图像压缩网络,得到对应于某一码率的最优模型。利用本方法对图像进行压缩,能够有效提升在极低码率情况下重建图像的主观质量。
Description
技术领域
本发明涉及图像压缩领域,尤其涉及一种基于目标编码的端到端图像压缩方法。
背景技术
图像压缩在现代数字信号处理和多媒体应用中是一项非常基础且重要的研究工作,该技术使得信息的高效传输和存储成为可能。现有的图像压缩算法包括传统方法和基于深度学习的端到端压缩算法。传统算法例如:JPEG(Joint Photographic ExpertsGroup)、JPEG2000、BPG(Better Portable Graphics)等在低码率时表现不佳,重建图像会有很严重的块效应、模糊、振铃效应等缺陷。基于深度学习的图像压缩方法在主观质量和客观指标上相比于传统算法都取得了相当大的提升,有良好的应用前景。然而,目前大多数算法都采取均匀编码的方式,对图像的每个像素点都分配相同的码率。
对于包含目标物体的图像,人眼往往更关注前景目标,而背景区域的质量对人眼视觉的主观感受影响不大。因此,对前景目标分配更高码率、降低背景区域的码率可以在不增加总体码率消耗的情况下,提升在极低码率条件下重建图像的主观质量以及提升后续计算机视觉任务的精度。然而,由于传统算法对目标特征的提取精度不高以及硬件算力有限等限制,基于目标编码的传统研究方法未能得到实际应用。近年来,随着深度学习的发展,深度神经网络对不规则目标的特征提取精度大大提升,硬件算力也不断增强,基于目标编码的图像压缩问题期望可以得到很好地解决。
发明内容
针对以上现有图像压缩方法中存在的缺陷,本发明的目的在于提出一种可行的基于目标编码的端到端图像压缩方法。
为达上述目的,本发明采用的技术方案如下:
一种基于目标编码的图像压缩方法,包括如下步骤:
步骤1,将待压缩图像输入预训练完成的目标分割神经网络,得到输入图像的语义分割结果;
步骤2,将语义分割结果转化为几组二值化矩阵,矩阵元素为1的区域代表某目标位置,矩阵元素为0的区域代表图像中该目标以外的其他区域,得到图像中各目标区域掩膜和背景区域掩膜;
步骤3,将输入图像分别用若干个具有相同网络结构但不同模型参数的编码器进行编码,得到对应于不同码率的图像特征图;
步骤4,将各目标区域掩膜与相应的高码率图像特征图相乘,得到图像各目标区域的特征图;将背景区域掩膜与相应的低码率图像特征图相乘,得到图像背景区域的特征图;
步骤5,对各目标区域的特征图和背景区域的特征图进行量化操作,得到目标量化特征图和背景量化特征图;
步骤6,利用基于神经网络的信息熵计算网络,分别计算出目标量化特征图和背景量化特征图的信息熵;
步骤7,将各目标量化特征图和背景量化特征图相加,得到图像完整的特征图;
步骤8,利用计算出的信息熵对步骤7得到的图像特征图进行熵编码和熵解码;
步骤9,将熵解码得到的重建特征图输入解码器,得到重建图像;
步骤10,构建损失函数,使用优化器对由编码器、解码器和信息熵计算网络组成的图像压缩模型进行端到端训练优化,使得重建图像各目标区域码率更高,图像背景区域码率较低。
本发明利用目标分割网络分离图像中各目标和背景区域,从而能实现对图像各个目标之间、各目标与背景区域之间分别编码的目的。通过增加目标区域的码率,同时降低背景区域的码率,能够在不增加总体码率消耗的情况下提升图像的主观质量。同时本发明采用基于神经网络的编码器和解码器,能够实现端到端的算法优化。相比于传统算法和基于深度学习的均匀编码图像压缩算法,本方法可以有效提升在极低码率下重建图像的主观质量。
附图说明
图1为本发明方法的流程图。
具体实施方式
下面将结合附图及具体实施例对本发明进行详细描述。
参照图1,本实施例的一种基于目标编码的图像压缩方法,具体步骤如下:
步骤1,将待压缩图像输入目标分割神经网络,得到图像的语义分割结果,具体过程如下:
步骤11,首先完成目标分割神经网络的训练,过程为:将所有目标种类用正整数编号,如1、2......;将训练集的图片输入目标分割网络,得到语义分割结果,该语义分割结果为一个二维矩阵,背景区域元素值为0,各目标区域元素值为相应类别对应的正整数;计算输出的语义分割结果与正确分割标签的误差;利用该误差进行反向传播,优化网络模型参数。本实施例中目标分割网络采用的是论文Chen L C,Papandreou G,Kokkinos I,etal.Deeplab:Semantic image segmentation with deep convolutional nets,atrousconvolution,and fully connected crfs[J].IEEE transactions on pattern analysisand machine intelligence,2017,40(4):834-848.中ResNet101的简化版ResNet34网络,该网络由34个残差块组成,引入了空洞卷积、池化和全卷积CRF(Conditional RandomFields)来提升分割精度。
步骤12,将待压缩图像输入预训练完成的目标分割神经网络,得到输入图像的语义分割结果。
步骤2,将语义分割结果处理为几组二值化矩阵,分别对应为图像的各目标和背景区域的掩膜,具体过程如下:
步骤21,将图像的语义分割结果中为1的元素置为True,不为1的元素置为False;再将布尔型矩阵转为浮点型0、1矩阵,得到类别对应于1的目标的掩膜。
步骤22,将图像语义分割结果中为2的元素置为True,不为2的元素置为False,再将布尔型矩阵转为浮点型0、1矩阵,得到类别对应于2的目标的掩膜。
步骤23,重复上述步骤,可得到所有类别目标的掩膜。
步骤24,用一个与目标掩膜矩阵大小相同、元素值全为1的矩阵减去目标掩膜之和,得到图像背景区域掩膜。
步骤3,将输入图像(维度为H*W*3)分别输入若干个相同网络结构不同模型参数的编码器,得到对应于不同码率的图像特征图(维度为H*W*C)。本实施例中采用的编码器为论文Chen T,Liu H,Ma Z,et al.Neural Image Compression via Non-Local AttentionOptimization and Improved Context Modeling[J].arXiv preprint arXiv:1910.06244,2019.(下简称论文NLAIC)中基于神经网络的编码器,由若干个卷积层和残差块组成,特点在于引入了NLAM(Non-Local Attention Module)模块,能对图像不同位置的特征赋予不同的权重。
步骤4,将各目标掩膜(大小为H*W)与相应的高码率的图像特征图(大小为H*W*C)逐元素相乘,图像特征图每个通道的元素乘以相同的掩膜值,得到图像各目标的特征图。将背景区域掩膜(大小为H*W)与对应于低码率的图像特征图(大小为H*W*C)逐元素相乘,图像特征图每个通道的元素乘以相同的掩膜值,得到图像背景区域的特征图。
步骤5,对目标特征图和背景特征图进行量化操作。
步骤6,利用论文NLAIC中基于神经网络的信息熵计算网络分别计算出各目标量化特征图和背景量化特征图的信息熵。
步骤7,将各目标量化特征图和背景量化特征图相加,得到图像完整的特征图。实现了码率在图像不同区域的不均匀分布。
步骤8,利用计算出的信息熵对步骤7得到的图像特征图进行熵编码和熵解码。
步骤9,将熵解码得到的重建特征图输入解码器,得到重建图像。解码器采用的是论文NLAIC中的基于神经网络的解码器结构。
步骤10,构建损失函数为:
Loss_func=λ(1-d)+a1Rbk+a2Robj_1+a3Robj_2
其中,d为利用MS-SSIM(Multi-Scale-Structural Similarity Index)计算的压缩图像与输入图像之间的差距。Rbk、Robj_1、Robj_2分别为图像背景区域和目标区域编码的码率。λ、a1、a2、a3为手动设置的参数。使用Adam优化器对由前述编码器、解码器、信息熵计算网络组成的图像压缩模型进行端到端训练优化。设置a1>a2、a3,使得Rbk<Robj_1、Robj_2,向目标区域分配更高码率。调节λ、a1、a2、a3的数值大小,得到不同的压缩率结果。
Claims (2)
1.一种基于目标编码的图像压缩方法,其特征在于,包括如下步骤:
步骤1,将待压缩图像输入预训练完成的目标分割神经网络,得到输入图像的语义分割结果;
步骤2,将语义分割结果转化为几组二值化矩阵,矩阵元素为1的区域代表某目标位置,矩阵元素为0的区域代表图像中该目标以外的其他区域,得到图像中各目标区域掩膜和背景区域掩膜;
步骤3,将输入图像分别用若干个具有相同网络结构但不同模型参数的编码器进行编码,得到对应于不同码率的图像特征图;
步骤4,将各目标区域掩膜与相应的高码率图像特征图相乘,得到图像各目标区域的特征图;将背景区域掩膜与相应的低码率图像特征图相乘,得到图像背景区域的特征图;
步骤5,对各目标区域的特征图和背景区域的特征图进行量化操作,得到目标量化特征图和背景量化特征图;
步骤6,利用基于神经网络的信息熵计算网络,分别计算出目标量化特征图和背景量化特征图的信息熵;
步骤7,将各目标量化特征图和背景量化特征图相加,得到图像完整的特征图;
步骤8,利用计算出的信息熵对步骤7得到的图像特征图进行熵编码和熵解码;
步骤9,将熵解码得到的重建特征图输入解码器,得到重建图像;
步骤10,构建损失函数,使用优化器对由编码器、解码器和信息熵计算网络组成的图像压缩模型进行端到端训练优化,使得重建图像各目标区域码率更高,图像背景区域码率较低。
2.根据权利要求1所述的一种基于目标编码的图像压缩方法,其特征在于,所述步骤2中,处理的具体过程为:
步骤21,将图像的语义分割结果矩阵中为1的元素置为True,不为1的元素置为False;再将该布尔型矩阵转为浮点型0、1矩阵,得到类别对应于1的目标区域掩膜;
步骤22,将图像语义分割结果矩阵中为2的元素置为True,不为2的元素置为False,再将该布尔型矩阵转为浮点型0、1矩阵,得到类别对应于2的目标区域掩膜;
步骤23,重复上述步骤,可得到所有类别的目标区域掩膜;
步骤24,用一个与目标掩膜矩阵大小相同、元素值全为1的矩阵减去目标区域掩膜之和,得到图像背景区域掩膜。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010003469.6A CN111147862B (zh) | 2020-01-03 | 2020-01-03 | 一种基于目标编码的端到端图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010003469.6A CN111147862B (zh) | 2020-01-03 | 2020-01-03 | 一种基于目标编码的端到端图像压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111147862A true CN111147862A (zh) | 2020-05-12 |
CN111147862B CN111147862B (zh) | 2021-02-23 |
Family
ID=70523319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010003469.6A Active CN111147862B (zh) | 2020-01-03 | 2020-01-03 | 一种基于目标编码的端到端图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111147862B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881981A (zh) * | 2020-07-29 | 2020-11-03 | 苏州科本信息技术有限公司 | 一种基于掩膜编码的单阶段实例分割方法 |
CN113596471A (zh) * | 2021-07-26 | 2021-11-02 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113822147A (zh) * | 2021-08-04 | 2021-12-21 | 北京交通大学 | 一种协同机器语义任务的深度压缩方法 |
CN113965750A (zh) * | 2020-07-20 | 2022-01-21 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码方法、存储介质及终端设备 |
CN114071164A (zh) * | 2020-08-06 | 2022-02-18 | 阿里巴巴集团控股有限公司 | 图像压缩模型的训练方法及装置、图像压缩方法及装置 |
WO2022155974A1 (zh) * | 2021-01-25 | 2022-07-28 | Oppo广东移动通信有限公司 | 视频编解码以及模型训练方法与装置 |
CN114973136A (zh) * | 2022-05-31 | 2022-08-30 | 河南工业大学 | 一种极端条件下场景图像识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100183223A1 (en) * | 2009-01-22 | 2010-07-22 | Sharp Kabushiki Kaisha | Image compressing method, image compressing apparatus and image forming apparatus |
CN107396124A (zh) * | 2017-08-29 | 2017-11-24 | 南京大学 | 基于深度神经网络的视频压缩方法 |
CN109145906A (zh) * | 2018-08-31 | 2019-01-04 | 北京字节跳动网络技术有限公司 | 目标对象的图像确定方法、装置、设备及存储介质 |
WO2019009447A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
WO2019009490A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
CN110189354A (zh) * | 2019-04-18 | 2019-08-30 | 北京迈格威科技有限公司 | 图像处理方法与图像处理器、图像处理设备及介质 |
CN110366048A (zh) * | 2019-07-19 | 2019-10-22 | Oppo广东移动通信有限公司 | 视频传输方法、装置、电子设备和计算机可读存储介质 |
CN110472623A (zh) * | 2019-06-29 | 2019-11-19 | 华为技术有限公司 | 图像检测方法、设备以及系统 |
CN110599448A (zh) * | 2019-07-31 | 2019-12-20 | 浙江工业大学 | 基于MaskScoring R-CNN网络的迁移学习肺部病变组织检测系统 |
-
2020
- 2020-01-03 CN CN202010003469.6A patent/CN111147862B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100183223A1 (en) * | 2009-01-22 | 2010-07-22 | Sharp Kabushiki Kaisha | Image compressing method, image compressing apparatus and image forming apparatus |
WO2019009447A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
WO2019009490A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
CN107396124A (zh) * | 2017-08-29 | 2017-11-24 | 南京大学 | 基于深度神经网络的视频压缩方法 |
CN109145906A (zh) * | 2018-08-31 | 2019-01-04 | 北京字节跳动网络技术有限公司 | 目标对象的图像确定方法、装置、设备及存储介质 |
CN110189354A (zh) * | 2019-04-18 | 2019-08-30 | 北京迈格威科技有限公司 | 图像处理方法与图像处理器、图像处理设备及介质 |
CN110472623A (zh) * | 2019-06-29 | 2019-11-19 | 华为技术有限公司 | 图像检测方法、设备以及系统 |
CN110366048A (zh) * | 2019-07-19 | 2019-10-22 | Oppo广东移动通信有限公司 | 视频传输方法、装置、电子设备和计算机可读存储介质 |
CN110599448A (zh) * | 2019-07-31 | 2019-12-20 | 浙江工业大学 | 基于MaskScoring R-CNN网络的迁移学习肺部病变组织检测系统 |
Non-Patent Citations (4)
Title |
---|
HAOJIE LIU,ET AL.: "Deep Image Compression via End-to-End Learning", 《ARXIV》 * |
LIANG-CHIEH CHEN,ET AL.: "DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
TONG CHEN,ET AL.: "DeepCoder: A deep neural network based video compression", 《2017 IEEE VISUAL COMMUNICATIONS AND IMAGE PROCESSING (VCIP)》 * |
TONG CHEN,ET AL.: "Neural Image Compression via Non-Local Attention Optimization and Improved Context Modeling", 《ARXIV》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113965750A (zh) * | 2020-07-20 | 2022-01-21 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码方法、存储介质及终端设备 |
CN113965750B (zh) * | 2020-07-20 | 2023-08-01 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码方法、存储介质及终端设备 |
CN111881981A (zh) * | 2020-07-29 | 2020-11-03 | 苏州科本信息技术有限公司 | 一种基于掩膜编码的单阶段实例分割方法 |
CN114071164A (zh) * | 2020-08-06 | 2022-02-18 | 阿里巴巴集团控股有限公司 | 图像压缩模型的训练方法及装置、图像压缩方法及装置 |
WO2022155974A1 (zh) * | 2021-01-25 | 2022-07-28 | Oppo广东移动通信有限公司 | 视频编解码以及模型训练方法与装置 |
CN113596471A (zh) * | 2021-07-26 | 2021-11-02 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113596471B (zh) * | 2021-07-26 | 2023-09-12 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113822147A (zh) * | 2021-08-04 | 2021-12-21 | 北京交通大学 | 一种协同机器语义任务的深度压缩方法 |
CN113822147B (zh) * | 2021-08-04 | 2023-12-15 | 北京交通大学 | 一种协同机器语义任务的深度压缩方法 |
CN114973136A (zh) * | 2022-05-31 | 2022-08-30 | 河南工业大学 | 一种极端条件下场景图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111147862B (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111147862B (zh) | 一种基于目标编码的端到端图像压缩方法 | |
Cai et al. | Efficient variable rate image compression with multi-scale decomposition network | |
CN109889839B (zh) | 基于深度学习的感兴趣区域图像编码、解码系统及方法 | |
CN114386595B (zh) | 一种基于超先验架构的sar图像压缩方法 | |
CN111246206B (zh) | 一种基于自编码器的光流信息压缩方法及装置 | |
CN116600119B (zh) | 视频编码、解码方法、装置、计算机设备和存储介质 | |
Hong et al. | Efficient neural image decoding via fixed-point inference | |
Zebang et al. | Densely connected AutoEncoders for image compression | |
CN116318172A (zh) | 一种设计仿真软件数据自适应压缩方法 | |
Sun et al. | Q-lic: Quantizing learned image compression with channel splitting | |
Qi et al. | Learning low resource consumption cnn through pruning and quantization | |
Ranjbar Alvar et al. | Joint image compression and denoising via latent-space scalability | |
CN114792347A (zh) | 一种基于多尺度空间和上下文信息融合的图像压缩方法 | |
CN116828184A (zh) | 视频编码、解码方法、装置、计算机设备和存储介质 | |
Gao et al. | Mixed entropy model enhanced residual attention network for remote sensing image compression | |
CN111107377A (zh) | 深度图像压缩方法及其装置、设备和存储介质 | |
CN112200275B (zh) | 人工神经网络的量化方法及装置 | |
CN110378466A (zh) | 基于神经网络差分的量化方法及系统 | |
Luo et al. | Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization | |
Deshmukh | Image compression using neural networks | |
CN117061751B (zh) | 一种面向机器视觉和人眼视觉的图像压缩系统 | |
Liu et al. | An Image Compression Framework Based on Multi-scale Convolutional Neural Network for Deformation Images | |
KR20230158597A (ko) | 신경 이미지 압축에서의 온라인 트레이닝 기반 인코더 튜닝 | |
Kuo et al. | Hybrid Image Compression Framework based on Single Image Training | |
CN117319652A (zh) | 视频编解码模型处理、视频编码、解码方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |