CN114125454A - 一种视频图像编码系统及方法 - Google Patents
一种视频图像编码系统及方法 Download PDFInfo
- Publication number
- CN114125454A CN114125454A CN202210088933.5A CN202210088933A CN114125454A CN 114125454 A CN114125454 A CN 114125454A CN 202210088933 A CN202210088933 A CN 202210088933A CN 114125454 A CN114125454 A CN 114125454A
- Authority
- CN
- China
- Prior art keywords
- description vector
- channel
- attention
- video image
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 81
- 239000011159 matrix material Substances 0.000 claims abstract description 59
- 238000011176 pooling Methods 0.000 claims abstract description 42
- 238000013507 mapping Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 22
- 230000004913 activation Effects 0.000 claims abstract description 18
- 238000013135 deep learning Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 9
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 8
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及图像处理技术领域,公开了一种视频图像编码系统及方法,其系统通过提取目标视频图像的特征图,对特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,将两个通道描述向量矩阵进行合并,并经过激活层输出通道注意特征,通过空间注意力模块对通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个空间描述向量矩阵按照通道进行合并,并经过卷积层进行激活,从而得到二维空间注意映射矩阵,通过残差重构模块基于预设的深度残差网络对二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像,从而降低了视频图像失真率,提高了图像分辨率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种视频图像编码系统及方法。
背景技术
随着图像采集与显示技术的快速发展,4K/8K 等高分辨率视频正逐渐进入我们的工作和生活。而新一代视频压缩标准(HEVC)较前一代在高分辨率视频的编码上节50%左右的码流,但由于高清视频图像的分辨率成倍增加, 压缩后的视频数据量仍然很大,而且目前网络带宽资源仍然比较有限,这给视频数据的传输和存储带来很大的压力,也就导致提高了视频图像失真率,降低图像分辨率。
发明内容
本发明提供了一种视频图像编码系统及方法,解决了视频图像失真率增高,从而降低图像分辨率的技术问题。
有鉴于此,本发明第一方面提供了一种视频图像编码系统,包括:特征图提取网络模块和自我关注机制模块;
所述特征图提取网络模块用于基于深度学习算法提取目标视频图像的特征图,还用于将所述特征图发送至所述自我关注机制模块;
所述自我关注机制模块包括通道注意力模块、空间注意力模块和残差重构模块;
所述通道注意力模块用于对所述特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,还用于将两个所述通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个所述通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,还用于将所述新的通道描述向量矩阵发送至激活层输出通道注意特征;还用于将所述通道注意特征发送至所述空间注意力模块;
所述空间注意力模块用于对所述通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,还用于将两个所述空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵;还用于将所述新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;还用于将所述二维空间注意映射矩阵发送至所述残差重构模块;
所述残差重构模块用于基于预设的深度残差网络对所述二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
优选地,本系统还包括压缩模块,用于对原始视频图像进行压缩,从而得到压缩图像以作为所述目标视频图像。
优选地,所述特征图提取网络模块包含两层深度学习卷积层,两层深度学习卷积层的大小分别为3×3×64和3×3×256。
优选地,所述激活层的激活函数为Sigmoid函数。
优选地,所述预设的深度残差网络由堆叠的若干个残差块组成,每个残差块由卷积层、批处理归一化层和非线性激活函数层组成。
第二方面,本发明还提供了一种视频图像编码方法,包括以下步骤:
基于深度学习算法提取目标视频图像的特征图;
对所述特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,将两个所述通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个所述通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,将所述新的通道描述向量矩阵发送至激活层输出通道注意特征;
对所述通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个所述空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵,将所述新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;
基于预设的深度残差网络对所述二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
优选地,本方法还包括:对原始视频图像进行压缩,从而得到压缩图像以作为所述目标视频图像。
第三方面,本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过基于深度学习算法提取目标视频图像的特征图,通道注意力模块对特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,利用逐个元素相加法将两个通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,并经过激活层输出通道注意特征,又通过空间注意力模块对通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵,并经过卷积层进行激活,从而得到二维空间注意映射矩阵,通过残差重构模块基于预设的深度残差网络对二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像,从而降低了视频图像失真率,提高了图像分辨率。
附图说明
图1为本发明实施例提供的一种视频图像编码系统的结构示意图;
图2为本发明实施例提供的一种视频图像编码方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1,本发明提供的一种视频图像编码系统,包括:特征图提取网络模块100和自我关注机制模块200;
特征图提取网络模块100用于基于深度学习算法提取目标视频图像的特征图,还用于将特征图发送至自我关注机制模块200;
需要说明的是,特征图提取网络模块100包含两层深度学习卷积层,两层深度学习卷积层的大小分别为3×3×64和3×3×256,通过深度学习算法提取目标视频图像的浅层特征图。
特征图可以理解为一个H×W×C的二维图片,H表示图片高度,W表示图片宽度,C表示通道数,图像由多个特征图叠加形成。自我关注机制模块200包括通道注意力模块201、空间注意力模块202和残差重构模块203;
通道注意力模块201用于对特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,还用于将两个通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,还用于将新的通道描述向量矩阵发送至激活层输出通道注意特征;还用于将通道注意特征发送至空间注意力模块202;
可以理解的是,通道注意力模块201用来描述信号特征的重要程度,加强特征映射表达能力,提升深度网络对重要特征的关注并减少次要特征,从而降低无关目标与噪声的影响,为了更好地计算通道注意力,通道注意力模块201采用全局平均池化和全局最大池化两种方式来分别利用不同的信息。
平均池化层联结空间信息的同时,全局最大池化层能够提取特定对象特征的重要信息。特征图经过平均池化,得到256个1x1的特征图,并进行全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵C×1×1,是一个C维的向量,C表示特征图的通道数,接着,再将两个通道描述向量矩阵C×1×1分别送入一个两层的卷积层网络FC1和FC2,FC1的神经元个数为 C/r,其中,r是缩减率(根据情况自行定义的参数)。FC2的神经元个数为 C。使用逐个元素相加法(即将两个相同形状矩阵中对应位置元素相加得到该位置元素的值,得到一个新的矩阵)将两个通道描述向量矩阵合并,最后,经过激活层输出通道注意特征,其中,激活层的激活函数为Sigmoid函数。空间注意力模块202用于对通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,还用于将两个空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵;还用于将新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;还用于将二维空间注意映射矩阵发送至残差重构模块203;
需要说明的是,空间注意力模块202通过学习通道注意特征的空间特征,来获取空间位置信息。
其中,空间描述向量矩阵为3x3的矩阵的特征图。卷积层的卷积核大小为7×7,通过对3x3的矩阵的特征图进行放大,得到7x7的特征图,也即二维空间注意映射矩阵(7x7)。
残差重构模块203用于基于预设的深度残差网络对二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
需要说明的是,预设的深度残差网络由堆叠的若干个残差块组成,每个残差块由卷积层、批处理归一化层和非线性激活函数层组成。特征图经过多个残差块进行处理,最终得到256个7x7的特征图,从而重新组合成一幅图像。
二维空间注意映射矩阵通过每个残差块不断提高重构图像的分辨率,最终实现压缩图像的超高分辨率重构,考虑采用特征损失函数来衡量真实图像与重构图像之间的不同。因此,深度残差网络的损失函数定义如下:
在一个具体实施例中,本系统还包括压缩模块,用于对原始视频图像进行压缩,从而得到压缩图像以作为目标视频图像。
可以理解的是,通过对原始视频图像进行压缩,可以提高传输速度。
本实施例提供了一种视频图像编码系统,通过基于深度学习算法提取目标视频图像的特征图,通道注意力模块对特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,利用逐个元素相加法将两个通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,并经过激活层输出通道注意特征,又通过空间注意力模块对通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵,并经过卷积层进行激活,从而得到二维空间注意映射矩阵,通过残差重构模块基于预设的深度残差网络对二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像,从而降低了视频图像失真率,提高了图像分辨率。
以上为本发明提供的一种视频图像编码系统的实施例的详细描述,以下为本发明提供的一种视频图像编码方法的实施例的详细描述。
为了方便理解,请参阅图2,本发明提供的一种视频图像编码方法,包括以下步骤:
S100、基于深度学习算法提取目标视频图像的特征图;
S200、对特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,将两个通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,将新的通道描述向量矩阵发送至激活层输出通道注意特征;
S300、对通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵,将新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;
S400、基于预设的深度残差网络对二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
进一步地,本方法还包括:对原始视频图像进行压缩,从而得到压缩图像以作为目标视频图像。
本发明还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的方法,装置和单元的具体工作过程,可以参考前述系统实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种视频图像编码系统,其特征在于,包括:特征图提取网络模块和自我关注机制模块;
所述特征图提取网络模块用于基于深度学习算法提取目标视频图像的特征图,还用于将所述特征图发送至所述自我关注机制模块;
所述自我关注机制模块包括通道注意力模块、空间注意力模块和残差重构模块;
所述通道注意力模块用于对所述特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,还用于将两个所述通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个所述通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,还用于将所述新的通道描述向量矩阵发送至激活层输出通道注意特征;还用于将所述通道注意特征发送至所述空间注意力模块;
所述空间注意力模块用于对所述通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,还用于将两个所述空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵;还用于将所述新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;还用于将所述二维空间注意映射矩阵发送至所述残差重构模块;
所述残差重构模块用于基于预设的深度残差网络对所述二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
2.根据权利要求1所述的视频图像编码系统,其特征在于,还包括压缩模块,用于对原始视频图像进行压缩,从而得到压缩图像以作为所述目标视频图像。
3.根据权利要求1所述的视频图像编码系统,其特征在于,所述特征图提取网络模块包含两层深度学习卷积层,两层深度学习卷积层的大小分别为3×3×64和3×3×256。
4.根据权利要求1所述的视频图像编码系统,其特征在于,所述激活层的激活函数为Sigmoid函数。
5.根据权利要求1所述的视频图像编码系统,其特征在于,所述预设的深度残差网络由堆叠的若干个残差块组成,每个残差块由卷积层、批处理归一化层和非线性激活函数层组成。
6.一种视频图像编码方法,其特征在于,包括以下步骤:
基于深度学习算法提取目标视频图像的特征图;
对所述特征图进行全局平均池化和全局最大池化并行处理,从而得到对应的两个通道描述向量矩阵,将两个所述通道描述向量矩阵分别发送至两层的卷积层网络,利用逐个元素相加法将两个所述通道描述向量矩阵进行合并,从而得到新的通道描述向量矩阵,将所述新的通道描述向量矩阵发送至激活层输出通道注意特征;
对所述通道注意特征进行一个通道维度的全局平均池化和全局最大池化并行处理,得到相应的两个空间描述向量矩阵,将两个所述空间描述向量矩阵按照通道进行合并,从而得到新的空间描述向量矩阵,将所述新的空间描述向量矩阵发送至 7×7 的卷积层进行激活,从而得到二维空间注意映射矩阵;
基于预设的深度残差网络对所述二维空间注意映射矩阵进行重构,从而得到超分辨率重构图像。
7.根据权利要求6所述的视频图像编码方法,其特征在于,还包括:对原始视频图像进行压缩,从而得到压缩图像以作为所述目标视频图像。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求6至7中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求6至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210088933.5A CN114125454A (zh) | 2022-01-26 | 2022-01-26 | 一种视频图像编码系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210088933.5A CN114125454A (zh) | 2022-01-26 | 2022-01-26 | 一种视频图像编码系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114125454A true CN114125454A (zh) | 2022-03-01 |
Family
ID=80361627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210088933.5A Pending CN114125454A (zh) | 2022-01-26 | 2022-01-26 | 一种视频图像编码系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114125454A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114677412A (zh) * | 2022-03-18 | 2022-06-28 | 苏州大学 | 一种光流估计的方法、装置以及设备 |
CN114841869A (zh) * | 2022-03-31 | 2022-08-02 | 北京迈格威科技有限公司 | 图像处理方法、电子设备及存储介质 |
CN117054891A (zh) * | 2023-10-11 | 2023-11-14 | 中煤科工(上海)新能源有限公司 | 电池寿命的预测方法、预测装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717856A (zh) * | 2019-09-03 | 2020-01-21 | 天津大学 | 一种用于医学成像的超分辨率重建算法 |
CN111429355A (zh) * | 2020-03-30 | 2020-07-17 | 新疆大学 | 一种基于生成对抗网络的图像超分辨率重建方法 |
CN112131943A (zh) * | 2020-08-20 | 2020-12-25 | 深圳大学 | 一种基于双重注意力模型的视频行为识别方法及系统 |
CN113128360A (zh) * | 2021-03-30 | 2021-07-16 | 苏州乐达纳米科技有限公司 | 基于深度学习的司机驾驶行为检测与识别方法 |
-
2022
- 2022-01-26 CN CN202210088933.5A patent/CN114125454A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717856A (zh) * | 2019-09-03 | 2020-01-21 | 天津大学 | 一种用于医学成像的超分辨率重建算法 |
CN111429355A (zh) * | 2020-03-30 | 2020-07-17 | 新疆大学 | 一种基于生成对抗网络的图像超分辨率重建方法 |
CN112131943A (zh) * | 2020-08-20 | 2020-12-25 | 深圳大学 | 一种基于双重注意力模型的视频行为识别方法及系统 |
CN113128360A (zh) * | 2021-03-30 | 2021-07-16 | 苏州乐达纳米科技有限公司 | 基于深度学习的司机驾驶行为检测与识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114677412A (zh) * | 2022-03-18 | 2022-06-28 | 苏州大学 | 一种光流估计的方法、装置以及设备 |
CN114677412B (zh) * | 2022-03-18 | 2023-05-12 | 苏州大学 | 一种光流估计的方法、装置以及设备 |
CN114841869A (zh) * | 2022-03-31 | 2022-08-02 | 北京迈格威科技有限公司 | 图像处理方法、电子设备及存储介质 |
CN117054891A (zh) * | 2023-10-11 | 2023-11-14 | 中煤科工(上海)新能源有限公司 | 电池寿命的预测方法、预测装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114125454A (zh) | 一种视频图像编码系统及方法 | |
CN112750082B (zh) | 基于融合注意力机制的人脸超分辨率方法及系统 | |
CN111683269B (zh) | 视频处理方法、装置、计算机设备和存储介质 | |
CN110222758B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN112070670B (zh) | 全局-局部分离注意力机制的人脸超分辨率方法及系统 | |
WO2020177701A1 (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
TW202111604A (zh) | 圖像隱寫及提取方法、裝置及電子設備 | |
WO2020012187A1 (en) | Method and system for compressing and decompressing digital three-dimensional point cloud data | |
CN115082322B (zh) | 图像处理方法和装置、图像重建模型的训练方法和装置 | |
Zini et al. | Deep residual autoencoder for blind universal jpeg restoration | |
CN111951165A (zh) | 图像处理方法、装置、计算机设备和计算机可读存储介质 | |
CN113674154B (zh) | 一种基于生成对抗网络的单幅图像超分辨率重建方法及系统 | |
CN113096015B (zh) | 基于渐进式感知和超轻量级网络的图像超分辨率重建方法 | |
Wang et al. | A customized deep network based encryption-then-lossy-compression scheme of color images achieving arbitrary compression ratios | |
CN113256744B (zh) | 一种图像编码、解码方法及系统 | |
CN117830102A (zh) | 图像超分辨率复原方法、装置、计算机设备和存储介质 | |
CN116630152A (zh) | 图像分辨率重建方法、装置、存储介质及电子设备 | |
EP4391533A1 (en) | Feature map encoding method and apparatus and feature map decoding method and apparatus | |
Li et al. | Compression artifact removal with stacked multi-context channel-wise attention network | |
CN114299105A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN113422965A (zh) | 一种基于生成对抗网络的图像压缩方法及装置 | |
CN112508187A (zh) | 一种机器学习模型压缩方法、装置及设备 | |
CN114286113B (zh) | 基于多头异构卷积自编码器的图像压缩恢复方法及系统 | |
CN116503260B (zh) | 一种图像超分辨率重建方法、装置和设备 | |
CN112911303B (zh) | 图像编码方法、解码方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220301 |