CN110880193A - 一种利用深度语义分割技术的图像压缩方法 - Google Patents
一种利用深度语义分割技术的图像压缩方法 Download PDFInfo
- Publication number
- CN110880193A CN110880193A CN201911220217.2A CN201911220217A CN110880193A CN 110880193 A CN110880193 A CN 110880193A CN 201911220217 A CN201911220217 A CN 201911220217A CN 110880193 A CN110880193 A CN 110880193A
- Authority
- CN
- China
- Prior art keywords
- semantic segmentation
- image
- network
- compression
- segmentation graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000007906 compression Methods 0.000 title claims abstract description 40
- 230000006835 compression Effects 0.000 title claims abstract description 37
- 238000005516 engineering process Methods 0.000 title claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 24
- 230000006837 decompression Effects 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 10
- 230000008447 perception Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像压缩技术领域,具体提供了一种利用深度语义分割技术的图像压缩方法。与现有技术相比,本发明的利用深度语义分割技术的图像压缩方法,主要分为编码过程和解码过程;在编码过程中利用GAN网络进行训练,输出生成模型和判别模型;在解码过程中语义分割图利用解压工具进行解压,还原成原语义分割图;将原语义分割图作为输入,放入到之前生成的生成模型和判别模型中,产出生成一个仿原输入图像的近似图像。该方法可以大大提升图像压缩的速度、压缩率,并可以使压缩后图像降低失真率,优化压缩流程,具有良好的推广价值。
Description
技术领域
本发明涉及图像压缩技术领域,具体提供一种利用深度语义分割技术的图像压缩方法。
背景技术
语义分割是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别,语义的可解释性即分类类别在真实世界中是有意义的。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。与图像分类或目标检测相比,语义分割使我们对图像有更加细致的了解。这种了解在诸如自动驾驶、机器人以及图像搜索引擎等许多领域都是非常重要的。
语义分割是属于深度学习领域,该技术在几年里促进计算机视觉领域的多方面发展,其中包括基于学习的图像压缩。图像压缩是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。之所以可以对图像进行压缩,是因为图像本身带有很多冗余信息:
空间冗余是指,同一帧临近位置的数据相同或者相似;
时间冗余是指,连续帧图像数据有大量相同的数据;
视觉冗余是指,人眼对图像分辨率的局限性、监视器显示分辨率的限制,容许一定限度的失真。
现有技术中利用语义分割技术的图像压缩存在压缩速度慢,压缩率低,压缩后图像失真明显,压缩流程繁琐的问题,如何有效的解决上述情况,是本领域技术人员亟待解决的技术问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的利用深度语义分割技术的图像压缩方法。
本发明解决其技术问题所采用的技术方案是:
一种利用深度语义分割技术的图像压缩方法,主要分为以下步骤;
(一)、编码过程
S101、输入图像的语义分割图,由深度学习网络提取并进行无损编码的作为比特流的基础层;
S102、经过语义分割网络进行训练后,比特流转换成语义分割图像;
S103、将语义分割图像利用传统图像的压缩工具进行无损压缩,产出压缩中间文件;
S104、把语义分割图作为输入,利用GAN网络进行训练,输出生成模型和判别模型;
(二)、解码过程
S201、语义分割图利用解压工具进行解压,还原成原语义分割图;
将原语义分割图作为输入,放入到之前生成的生成模型和判别模型中,产出生成一个仿原输入图像的近似图像。
进一步的,在所述编码过程中压缩工具和解码过程中的解压工具都使用FLIF工具。
进一步的,在编码过程中使用SegNet语义分割网络作为深度学习网络,SegNet采用训练完成的PSPNet,原输入图像标位X,经过PSPNet进行操作输出后的语义分割图标为S;
进一步的,在解码过程中,在解码器端,语义分割图被解码以供FineNet深度学习网络来获取输入图像的近似估计,所述近似估计图就是原图像压缩后又经历解压过程的最终输出。
作为优选,所述FineNet网络结构的定义为:
c64,d128,d256,d512,9×r512,u256,u128,u64,c3,tanh;
其中,CK:是7×7的卷积层,步幅1,采用实例规范化和ReLU激活函数;dK:卷积层,步幅是1,采用实例规范化和ReLU激活函数;rK:包含反射填充和两个3×3卷积层的残差区块,采用实例规范化;uK:3×3分数阶卷积层,步幅是1/2采用实例规范化和ReLU激活函数。
注:K指滤波器的个数,对应网络结构的下角标。
进一步的,原始图像x∈Rh×w×w,语义分割图s∈Zh×w;
x与x’之间的误差使用多种不同的损失评价标准,包括L1范数损失、LVGG和GAN网络损失;
L1范数损失为:L1=2λ||x-x′|
对于预训练好的VGG网络,具备m层,每个Mj个元素用于构造LVGG网络的感知损失:
为了从中区分出真实的训练图像X和重建图像X,鉴别器D的目标函数是最小化Dd:
对于所有重建和感知的生成损失被定义为:
最终目标函数是最小化混合损失函数:
L=LD+LG
进一步的,对编码过程中提出的模型进行对抗训练,采用鉴别器D1,D1用来运作原始规模,用于指导生成器合成图像中的精细细节,D1的架构为:
C64,C128,C256,C512
Ck表示具有k个滤波器和步幅为2的4×4的卷积层,采用实例规范化和ReLU激活函数,并在最后一层后使用带一个滤波器的鉴别器。
进一步的,使用图像数据集来对所提出的模型进行训练,将所有图片重新缩放至一定的像素;
需测试图像不需要调整大小,模型在测试时可以使用任意大小;设置L1和LVGG的权重λ=10。
本发明的一种利用深度语义分割技术的图像压缩方法和现有技术相比,具有以下突出的有益效果:
1、本发明在提出一个基于深度语义分段的图像压缩方法,以通过对输入图像进行语义分割,然后,利用GAN网络来生成模拟出的新图像,这个模拟出的新图像在GAN网络的训练中的真实程度越来越高,可以达到非常贴近真实图像的标准,使压缩后的图像降低失真率,从而可以作为压缩后又解压的输出图像,达到优化压缩流程的效果。
2、本发明可以通过实验表明,所提出的方法能优于基于H.265/HEVC的BPG和其他标准解码器的PSNR和MS-SSIM指标,大大提升图像压缩的速度、压缩率。另外,本方法还可以帮助完成许多其他的任务,例如图像搜索和基于对象的自适应图像压缩等。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种利用深度语义分割技术的图像压缩方法的流程图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种利用深度语义分割技术的图像压缩方法,包括编码过程和解码过程。
(一)、编码过程
S101、输入图像的语义分割图,由深度学习网络提取并进行无损编码的作为比特流的基础层。
S102、经过语义分割网络进行训练后,比特流转换成语义分割图像。
S103、将语义分割图像利用传统图像的压缩工具FLIF进行无损压缩,产出.flif文件便是压缩中间文件。
S104、把语义分割图作为输入,利用GAN网络进行训练,输出生成模型和判别模型;
(二)、解码过程
S201、语义分割图利用解压工具FLIF进行解压,还原成原语义分割图。
S202、将语义分割图作为输入,放入到之前生成的生成模型和判别模型中,产出生成一个仿原输入图像的近似图像。
在编码过程中使用SegNet语义分割网络作为深度学习网络,SegNet采用训练完成的PSPNet,原输入图像标位X,经过PSPNet进行操作输出后的语义分割图标为S。
在解码过程中,在解码器端,语义分割图被解码以供FineNet深度学习网络来获取输入图像的近似估计,所述近似估计图就是原图像压缩后又经历解压过程的最终输出。
其中,FineNet网络结构的定义为:
c64,d128,d256,d512,9×r512,u256,u128,u64,c3,tanh;
ck:是7×7的卷积层(k个滤镜,步幅是1),采用实例规范化和ReLU激活函数;dk:卷积层(k个滤镜,步幅是1),采用实例规范化和ReLU激活函数;rk:包含反射填充和两个3×3卷积层(k个滤镜)的残差区块,采用实例规范化;uk:3×3分数阶卷积层(k个滤镜,步幅是1/2),采用实例规范化和ReLU激活函数。
对编码过程中提出的生成模型和判别模型进行对抗训练,采用鉴别器D1,D1用来运作原始规模,用于指导生成器合成图像中的精细细节,D1的架构为:
C64,C128,C256,C512
Ck表示具有k个滤镜和步幅为2的4×4的卷积层,采用实例规范化和ReLU激活函数,并在最后一层后使用带一个滤镜的鉴别器。
对于目标函数:原始图像x∈Rh×w×w,语义分割图s∈Zh×w;
原始图x与生成图x’之间的误差使用多种不同的损失评价标准,包括L1范数损失、LVGG和GAN网络损失;
L1范数损失为:L1=2λ||x-x′|
λ可手动设置,此处默认设置为10。
对于预训练好的VGG网络,具备m层,每个Mj个元素用于构造LVGG网络的感知损失:
其中,S=SegNet(x),N是VGG网络中每一层的点的个数,Dd是鉴别器,λ为网络权重,可手动设置,此处默认设置为10。
为了从中区分出真实的训练图像X和重建图像X,鉴别器D的目标函数是最小化Dd:
对于所有重建和感知的生成损失被定义为:
最终目标函数是最小化混合损失函数:
L=LD+LG
对于训练网络的过程,使用Cityscapes和ADE20K两个图像数据集来对所提出的模型进行训练。Cityscapes数据集包含2974个RBG图像,内容都是街道场景。将所有图片重新缩放至512×1024(即高=512像素,长=1024像素,对于RGB通道来说K=3)。对于ADE20K数据集,选取有9272张RGB图片,将所有图片重新缩放为高等于256像素和长等于256像素的固定训练大小。在这里测试图像是不需要调整大小的,因为模型在测试时可以使用任意大小。另外,设置L1和LVGG的权重λ=10。
通过训练,随着混合损失函数L的值不断减少,意味着模型所生成的模拟图像与真实图像之间的差距越来越小,所生成的模拟图片就越来越接近真实的输入图片,也就意味着图片在压缩后的效果更加真实。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种利用深度语义分割技术的图像压缩方法权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (8)
1.一种利用深度语义分割技术的图像压缩方法,其特征在于,主要分为以下步骤;
(一)、编码过程
S101、输入图像的语义分割图,由深度学习网络提取并进行无损编码的作为比特流的基础层;
S102、经过语义分割网络进行训练后,比特流转换成语义分割图像;
S103、将语义分割图像利用传统图像的压缩工具进行无损压缩,产出压缩中间文件;
S104、把语义分割图作为输入,利用GAN网络进行训练,输出生成模型和判别模型;
(二)、解码过程
S201、语义分割图利用解压工具进行解压,还原成原语义分割图;
S202、将原语义分割图作为输入,放入到之前生成的生成模型和判别模型中,产出生成一个仿原输入图像的近似图像。
2.根据权利要求1所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,在所述编码过程中压缩工具和解码过程中的解压工具都使用FLIF工具。
3.根据权利要求2所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,在编码过程中使用SegNet语义分割网络作为深度学习网络,SegNet采用训练完成的PSPNet,原输入图像标位X,经过PSPNet进行操作输出后的语义分割图标为S。
4.根据权利要求3所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,在解码过程中,在解码器端,语义分割图被解码以供FineNet深度学习网络来获取输入图像的近似估计,所述近似估计图就是原图像压缩后又经历解压过程的最终输出。
5.根据权利要求4所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,所述FineNet网络结构的定义为:
c64,d128,d256,d512,9×r512,u256,u128,u64,c3,tanh;
其中,CK:是7×7的卷积层,步幅1,采用实例规范化和ReLU激活函数;dK:卷积层,步幅是1,采用实例规范化和ReLU激活函数;rK:包含反射填充和两个3×3卷积层的残差区块,采用实例规范化;uK:3×3分数阶卷积层,步幅是1/2采用实例规范化和ReLU激活函数。
注:K指滤波器的个数,对应网络结构的下角标。
7.根据权利要求1所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,对编码过程中提出的生成模型和判别进行对抗训练,采用鉴别器D1,D1用来运作原始规模,用于指导生成器合成图像中的精细细节,D1的架构为:
C64,C128,C256,C512
Ck表示具有k个滤波器和步幅为2的4×4的卷积层,采用实例规范化和ReLU激活函数,并在最后一层后使用带一个滤波器的鉴别器。
8.根据权利要求7所述的一种利用深度语义分割技术的图像压缩方法,其特征在于,使用图像数据集来对所提出的模型进行训练,将所有图片重新缩放至一定的像素;
需测试图像不需要调整大小,模型在测试时可以使用任意大小;设置L1和LVGG的权重λ=10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220217.2A CN110880193A (zh) | 2019-12-03 | 2019-12-03 | 一种利用深度语义分割技术的图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911220217.2A CN110880193A (zh) | 2019-12-03 | 2019-12-03 | 一种利用深度语义分割技术的图像压缩方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110880193A true CN110880193A (zh) | 2020-03-13 |
Family
ID=69730683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911220217.2A Pending CN110880193A (zh) | 2019-12-03 | 2019-12-03 | 一种利用深度语义分割技术的图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110880193A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112073732A (zh) * | 2020-08-26 | 2020-12-11 | 博雅工道(北京)机器人科技有限公司 | 一种水下机器人图像隐秘字符嵌入与解码的方法 |
CN112750175A (zh) * | 2021-01-12 | 2021-05-04 | 山东师范大学 | 基于八度卷积和语义分割的图像压缩方法及系统 |
CN112785661A (zh) * | 2021-01-12 | 2021-05-11 | 山东师范大学 | 基于融合感知损失的深度语义分割图像压缩方法及系统 |
CN113362403A (zh) * | 2021-07-20 | 2021-09-07 | 支付宝(杭州)信息技术有限公司 | 图像处理模型的训练方法及装置 |
CN113554719A (zh) * | 2020-04-24 | 2021-10-26 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码方法、解码方法、存储介质及终端设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190164290A1 (en) * | 2016-08-25 | 2019-05-30 | Intel Corporation | Coupled multi-task fully convolutional networks using multi-scale contextual information and hierarchical hyper-features for semantic image segmentation |
CN109996073A (zh) * | 2019-02-26 | 2019-07-09 | 山东师范大学 | 一种图像压缩方法、系统、可读存储介质及计算机设备 |
US10467500B1 (en) * | 2018-12-31 | 2019-11-05 | Didi Research America, Llc | Method and system for semantic segmentation involving multi-task convolutional neural network |
CN110458844A (zh) * | 2019-07-22 | 2019-11-15 | 大连理工大学 | 一种低光照场景的语义分割方法 |
-
2019
- 2019-12-03 CN CN201911220217.2A patent/CN110880193A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190164290A1 (en) * | 2016-08-25 | 2019-05-30 | Intel Corporation | Coupled multi-task fully convolutional networks using multi-scale contextual information and hierarchical hyper-features for semantic image segmentation |
US10467500B1 (en) * | 2018-12-31 | 2019-11-05 | Didi Research America, Llc | Method and system for semantic segmentation involving multi-task convolutional neural network |
CN109996073A (zh) * | 2019-02-26 | 2019-07-09 | 山东师范大学 | 一种图像压缩方法、系统、可读存储介质及计算机设备 |
CN110458844A (zh) * | 2019-07-22 | 2019-11-15 | 大连理工大学 | 一种低光照场景的语义分割方法 |
Non-Patent Citations (1)
Title |
---|
MOHAMMAD AKBARI: "DSSLIC: Deep Semantic Segmentation-based Layered Image Compression" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554719A (zh) * | 2020-04-24 | 2021-10-26 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码方法、解码方法、存储介质及终端设备 |
CN112073732A (zh) * | 2020-08-26 | 2020-12-11 | 博雅工道(北京)机器人科技有限公司 | 一种水下机器人图像隐秘字符嵌入与解码的方法 |
CN112750175A (zh) * | 2021-01-12 | 2021-05-04 | 山东师范大学 | 基于八度卷积和语义分割的图像压缩方法及系统 |
CN112785661A (zh) * | 2021-01-12 | 2021-05-11 | 山东师范大学 | 基于融合感知损失的深度语义分割图像压缩方法及系统 |
CN112750175B (zh) * | 2021-01-12 | 2022-07-08 | 山东师范大学 | 基于八度卷积和语义分割的图像压缩方法及系统 |
CN113362403A (zh) * | 2021-07-20 | 2021-09-07 | 支付宝(杭州)信息技术有限公司 | 图像处理模型的训练方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110880193A (zh) | 一种利用深度语义分割技术的图像压缩方法 | |
US11166048B2 (en) | Method and apparatus for video coding | |
CN110059772B (zh) | 基于多尺度解码网络的遥感图像语义分割方法 | |
Yang et al. | Towards coding for human and machine vision: Scalable face image coding | |
Khodakovsky et al. | Progressive geometry compression | |
CN110517329B (zh) | 一种基于语义分析的深度学习图像压缩方法 | |
CN110225341A (zh) | 一种任务驱动的码流结构化图像编码方法 | |
CN109949222B (zh) | 基于语义图的图像超分辨率重建方法 | |
WO2019226429A1 (en) | Data compression by local entropy encoding | |
US11451790B2 (en) | Method and apparatus in video coding for machines | |
CN115880762B (zh) | 面向人机混合视觉的可伸缩人脸图像编码方法、系统 | |
CN116205962B (zh) | 基于完整上下文信息的单目深度估计方法及系统 | |
Abd-Alzhra et al. | Image compression using deep learning: methods and techniques | |
JPH09502586A (ja) | データ分析方法及び装置 | |
CN104200498A (zh) | 融合Cortex-A7的实时视频超分辨率处理方法 | |
Ruivo et al. | Double-deep learning-based point cloud geometry coding with adaptive super-resolution | |
CN116523985B (zh) | 一种结构和纹理特征引导的双编码器图像修复方法 | |
CN117710295A (zh) | 图像处理方法、装置、设备、介质及程序产品 | |
CN117291803A (zh) | Pamgan轻量化面部超分辨率重建方法 | |
EP4354872A1 (en) | Point cloud attribute information encoding and decoding method and apparatus, and related device | |
CN116468638A (zh) | 一种基于生成和鉴别平衡对抗的人脸图像修复方法及系统 | |
EP4201064A1 (en) | Video compression using optical flow | |
Gray et al. | Image compression and tree-structured vector quantization | |
CN115147317A (zh) | 一种基于卷积神经网络的点云颜色质量增强方法及系统 | |
Li et al. | You Can Mask More For Extremely Low-Bitrate Image Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200313 |
|
RJ01 | Rejection of invention patent application after publication |