CN113079377B - 一种深度图像/视频压缩网络的训练方法 - Google Patents

一种深度图像/视频压缩网络的训练方法 Download PDF

Info

Publication number
CN113079377B
CN113079377B CN202110357098.6A CN202110357098A CN113079377B CN 113079377 B CN113079377 B CN 113079377B CN 202110357098 A CN202110357098 A CN 202110357098A CN 113079377 B CN113079377 B CN 113079377B
Authority
CN
China
Prior art keywords
network
quantization
stage
noise
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110357098.6A
Other languages
English (en)
Other versions
CN113079377A (zh
Inventor
陈志波
郭宗昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202110357098.6A priority Critical patent/CN113079377B/zh
Publication of CN113079377A publication Critical patent/CN113079377A/zh
Application granted granted Critical
Publication of CN113079377B publication Critical patent/CN113079377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明公开了一种深度图像/视频压缩网络的训练方法,一方面,能够消除由于加性均值噪声带来的量化误差,通过二阶段的解码器微调来实现训练测试的一致性,能显著提高整体压缩网络的率失真性能。另一方面,通过从边际信息中预先产生数据内容自适应的量化步长,来灵活的控制编码网络的量化粒度,是一种新的空域码率分配策略,使得网络在量化时可以根据图像内容自适应的控制空域上的比特分配。此外,两阶段自适应量化策略能对于所以采用加性均值噪声的编码网络都有效,同时能显著保证编码网络训练的稳定。综上,本发明能够使得基于深度神经网络的视频/图像压缩更加的通用、灵活、高效。

Description

一种深度图像/视频压缩网络的训练方法
技术领域
本发明涉及图像/视频压缩编码,尤其涉及一种深度图像/视频压缩网络的训练方法。
背景技术
图像与视频的压缩编码是电子信息时代的重要技术,有助于减小图像视频的传输带宽与存储消耗。图像/视频压缩本质上通过控制码率(表征图像视频所需要的二进制数据大小)与失真(恢复图像视频与原图像视频的差异)之间的关系,来实现信息的有效表征。
现有的基于变分神经网络的图像/视频压缩由于包含量化层,所以会导致直接训练梯度无法通过量化层的问题。具体来说,以图像压缩算法为例,非线性变换网络会首先将输入图像变换成为隐层变量,然后通过量化传输得到的隐层变量,解码端可以通过离散的隐层变量重建图像。但是由于直接量化隐层变量所用的函数几乎是不可导的,主流的基于变分自编码器的图像编码器(BalléJ,Minnen D,Singh S,et al.Variational imagecompression with a scale hyperprior[J].ICLR,2018.)在训练的时候会使用加性的均值噪声来近似量化误差,这种量化近似可以被解释为变分量化。但是在实际编解码的时候,整个量化层会采用直接四舍五入取整的方法来得到离散的隐层变量,这造成了训练-测试的不一致的问题,进而使得网络的编码性能下降很大。同时,由于加性的均值噪声通常取值范围是-0.5到0.5,所以限制了量化的步长,导致了隐层变量只能进行整型量化,进而限制了压缩网络的灵活性。
发明内容
本发明的目的是提供一种深度图像/视频压缩网络的训练方法,可以保证训练测试一致性,且通过控制量化步长,使得网络在量化时可以根据图像内容自适应的控制空域上的比特分配。
本发明的目的是通过以下技术方案实现的:
一种深度图像/视频压缩网络的训练方法,包括:
第一个阶段中,输入的图像x通过变换编码网络ga产生隐层变量y,隐层变量y经过熵编码网络ha产生边际码流z,加上加性均值噪声U后变为带噪边际码流
Figure GDA0003694789020000021
再经过噪声产生分支hsq恢复出覆盖整个隐层空间的量化步长Δ,通过量化步长Δ上采样均值噪声UΔ生成
Figure GDA0003694789020000022
再通过变换解码网络gs恢复出解码图像
Figure GDA0003694789020000023
同时,采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流
Figure GDA0003694789020000024
来估计隐层变量
Figure GDA0003694789020000025
的分布,进而在训练时计算隐层变量
Figure GDA0003694789020000026
的码率;此阶段将得到训练好的变换编码网络ga、熵编码网络ha与噪声产生分支hsq
第二阶段中,固定变换编码网络ga、熵编码网络ha与噪声产生分支hsq,将加性均值噪声U替换为硬量化的方式,采用硬量化的方式得到带噪边际码流
Figure GDA0003694789020000027
以及采用硬量化的方式得到离散的量化结果
Figure GDA0003694789020000028
再输入至变换解码网络gs,第二阶段中采用与第一阶段相同的流程训练,训练对象为包含上下文模型gcm的熵估计模块和熵解码模块hs、以及变换解码网络gs
由上述本发明提供的技术方案可以看出,1)能够消除由于加性均值噪声带来的量化误差,通过二阶段的解码器微调来实现训练测试的一致性,能显著提高整体压缩网络的率失真性能。2)通过从边际信息中预先产生数据内容自适应的量化步长,来灵活的控制编码网络的量化粒度,是一种新的空域码率分配策略,使得网络在量化时可以根据图像内容自适应的控制空域上的比特分配。3)两阶段自适应量化策略能对于所以采用加性均值噪声的编码网络都有效,同时能显著保证编码网络训练的稳定。综上,本方案能够使得基于深度神经网络的视频/图像压缩更加的通用、灵活、高效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的常用编码网络结构的示意图;
图2为本发明实施例提供的引入硬量化的第二阶段训练的示意图;
图3为本发明实施例提供的引入空域自适应的量化的第一阶段训练的示意图;
图4为本发明实施例提供的引入空域自适应的量化与硬量化的第二阶段训练的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种深度图像/视频压缩网络的训练方法,主要包含了两种量化层的改进,一种是通过实施准确的四舍五入硬量化,来训练微调解码器,以保证训练测试一致性。另一种是通过从边际信息中预先产生数据内容自适应的量化步长,来灵活的控制编码网络的量化粒度;
如图1所示,为常用编码网络结构。编码网络由于常常采用加性均值噪声,所以训练的时候,量化层的输出与测试时候的输出是不一致的。因此,本发明提出先软后硬的量化策略来解决这个问题。
本发明提出先软后硬的量化策略是一个两阶段的量化方法,在第一个阶段,可以直接沿用图1的结构和训练方法,也就是采用加性均值噪声(图1中表示为U)来进行所有结构的训练。第二个阶段,如图2所示,固定了经过第一阶段训练好的编码网络(encoder),也就是灰色方框部分。之后,通过实施准确的四舍五入硬量化(图2中表示为Q),来训练微调解码器(decoder),也就是剩下的白色方框部分,从而消除由于加性均值噪声带来的量化误差,通过二阶段的解码器微调来实现训练测试的一致性。能显著提高整体压缩网络的率失真性能。
另一方面,本发明还涉及了自适应量化分支,通过自适应量化策略,来灵活的控制编码网络的量化粒度。如图3所示,在图1的基础上引入了噪声产生分支hsq。熵编码网络ha的输入y是变换编码网络ga对于输入的图像x产生的隐层变量,输出为边际码流z(粗糙纹理);之后,经过噪声产生分支hsq首先恢复出覆盖整个隐层空间的量化步长Δ,使得网络可以根据图像的纹理自适应的产生量化步长,进而量化编码整个隐层变量y。由于量化步长是从边际码流中首先产生的,所以在算术编解码的时候可以保证量化的一致性。值得注意的是,噪声产生分支hsq在第一个阶段中进行训练,第二个阶段固定。
图2和图3分别介绍了两种量化层的改进,即可以保证训练测试一致性的二阶段硬量化训练示意图,通过边际信息产生自适应的量化步长的框图。图2与图3结合在一起即形成了图4的第二阶段空域自适应量化;同样的,图4中灰色方框部分固定,训练白色方框部分。
基于上述原理,本发明实施例提供的一种深度图像/视频压缩网络的训练方法主要如下:
如图3所示,第一个阶段中,输入的图像x通过变换编码网络ga产生隐层变量y,隐层变量y经过熵编码网络ha产生边际码流z,加上加性均值噪声U后变为带噪边际码流
Figure GDA00036947890200000417
再经过噪声产生分支hsq恢复出覆盖整个隐层空间的量化步长Δ;这里的噪声产生分支由三层卷积层和一个指数激活层依次连接构成,保证网络输出的量化步长数值上是正数。通过得到的量化步长Δ,我们可以在区间[-Δ/2,Δ/2]上采样均值噪声UΔ,加到y上,生成
Figure GDA0003694789020000041
再通过变换解码网络gs恢复出解码图像
Figure GDA0003694789020000042
为了得到对隐层变量
Figure GDA0003694789020000043
的码率估计,我们采用了包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流
Figure GDA0003694789020000044
一起来估计隐层变量
Figure GDA0003694789020000045
的分布,
Figure GDA0003694789020000046
的分布由混合高斯分布的参数μ,σ,π决定,进而在训练的时候计算
Figure GDA0003694789020000047
的码率;此阶段将得到训练好的变换编码网络ga、熵编码网络ha与噪声产生分支hsq。当网络的率失真性能在测试数据集上几乎不再发生变化(也即变化量不超过设定的门限值)时,我们就认为第一阶段训练完毕。
如图4所示,第二阶段中,固定变换编码网络ga、熵编码网络ha与噪声产生分支hsq,将加性均值噪声U替换为硬量化的方式,其余的训练流程与第一阶段相似,具体来说:通过熵编码网络ha输出的边际码流z采用硬量化的方式得到带噪边际码流
Figure GDA0003694789020000048
并由噪声产生分支输出形状与隐层变量y相同的量化步长Δ′用以量化y,再采用硬量化的方式产生离散的量化结果
Figure GDA0003694789020000049
这里round表示四舍五入。(由于此时将加性均值噪声拟合的量化改变为由实际的量化步长决定的量化,所以与第一阶段存在差异);
Figure GDA00036947890200000410
Figure GDA00036947890200000411
将输入至与解码相关的部分,这次是与第一阶段类似的流程,但是解码相关的模块的输入输出都发生了变化,
Figure GDA00036947890200000412
输入至变换解码网络gs恢复出解码图像
Figure GDA00036947890200000413
以及采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流
Figure GDA00036947890200000416
来估计隐层变量
Figure GDA00036947890200000414
的分布,进而在训练的时候计算
Figure GDA00036947890200000415
的码率;本阶段中,通过实际的率失真损失函数来训练解码网络(包含上下文模型gcm的熵估计模块和熵解码模块hs、以及变换解码网络gs)。
本发明实施例中,所述输入的图像x可以是单独的一幅图像,也可以是视频中的单帧图像。
本发明实施例中,图1~图4中,波浪符号“~”与尖符号“^”的主要是为了区分第一阶段与第二阶段的x、y、z;因为第一阶段与第二阶段中,量化方式的不一致导致了解码器的输入输出都发生了变化(第一阶段是采用加性均值噪声拟合量化函数,第二阶段采用硬量化)。同时,图中的
Figure GDA0003694789020000051
Figure GDA0003694789020000052
均表示硬量化的方式。
本发明实施例中,包含上下文模型gcm的熵估计模块和熵解码模块hs工作过程可参照常规方案,本发明不做赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (5)

1.一种深度图像/视频压缩网络的训练方法,其特征在于,包括:
第一个阶段中,输入的图像x通过变换编码网络ga产生隐层变量y,隐层变量y经过熵编码网络ha产生边际码流z,加上加性均值噪声U后变为带噪边际码流
Figure FDA0003742911100000011
再经过噪声产生分支hsq恢复出覆盖整个隐层空间的量化步长Δ,通过量化步长Δ采样获得均值噪声UΔ生成
Figure FDA0003742911100000012
再通过变换解码网络gs恢复出解码图像
Figure FDA0003742911100000013
同时,采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流
Figure FDA0003742911100000014
来估计隐层变量
Figure FDA0003742911100000015
的分布,进而在训练时计算隐层变量
Figure FDA0003742911100000016
的码率;此阶段将得到训练好的变换编码网络ga、熵编码网络ha与噪声产生分支hsq
第二阶段中,固定变换编码网络ga、熵编码网络ha与噪声产生分支hsq,将加性均值噪声U替换为硬量化的方式,采用硬量化的方式得到带噪边际码流
Figure FDA0003742911100000017
以及采用硬量化的方式得到离散的量化结果
Figure FDA0003742911100000018
再输入至变换解码网络gs,第二阶段训练对象为包含上下文模型gcm的熵估计模块和熵解码模块hs、以及变换解码网络gs
第二阶段中,通过熵编码网络ha输出的边际码流z,采用硬量化的方式得到带噪边际码流
Figure FDA0003742911100000019
并由噪声产生分支输出形状与隐层变量y相同的量化步长Δ′用以量化隐层变量y,再采用硬量化的方式产生离散的量化结果
Figure FDA00037429111000000110
Figure FDA00037429111000000111
输入至变换解码网络gs恢复出解码图像
Figure FDA00037429111000000112
同时,采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流
Figure FDA00037429111000000113
来估计隐层变量
Figure FDA00037429111000000114
的分布,进而在训练时计算
Figure FDA00037429111000000115
的码率。
2.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,所述噪声产生分支由三层卷积层和一个指数激活层依次连接构成,用以保证网络输出的量化步长数值上是正数。
3.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,第一个阶段中,通过得到的量化步长Δ,在区间[-Δ/2,Δ/2]采样获得均值噪声UΔ,加到隐层变量y上,生成
Figure FDA00037429111000000116
4.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,第二阶段中,采用硬量化的方式产生离散的量化结果
Figure FDA00037429111000000117
的公式为:
Figure FDA00037429111000000118
其中,round表示四舍五入。
5.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,所述输入的图像x为单独的一幅图像,或者视频中的单帧图像。
CN202110357098.6A 2021-04-01 2021-04-01 一种深度图像/视频压缩网络的训练方法 Active CN113079377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110357098.6A CN113079377B (zh) 2021-04-01 2021-04-01 一种深度图像/视频压缩网络的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110357098.6A CN113079377B (zh) 2021-04-01 2021-04-01 一种深度图像/视频压缩网络的训练方法

Publications (2)

Publication Number Publication Date
CN113079377A CN113079377A (zh) 2021-07-06
CN113079377B true CN113079377B (zh) 2022-09-30

Family

ID=76614635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110357098.6A Active CN113079377B (zh) 2021-04-01 2021-04-01 一种深度图像/视频压缩网络的训练方法

Country Status (1)

Country Link
CN (1) CN113079377B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115278246B (zh) * 2022-08-01 2024-04-16 天津大学 一种深度图端到端智能压缩编码方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251303A (zh) * 2016-07-28 2016-12-21 同济大学 一种使用深度全卷积编码‑解码网络的图像降噪方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RS56512B1 (sr) * 2010-04-13 2018-02-28 Ge Video Compression Llc Kodiranje mapa značaja i blokova koeficijenata transformacije
RS64604B1 (sr) * 2011-06-16 2023-10-31 Ge Video Compression Llc Entropijsko kodiranje razlika vektora kretanja
JP2016208094A (ja) * 2015-04-15 2016-12-08 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
US11412225B2 (en) * 2018-09-27 2022-08-09 Electronics And Telecommunications Research Institute Method and apparatus for image processing using context-adaptive entropy model
EP3700205A1 (en) * 2019-02-19 2020-08-26 Nokia Technologies Oy Quantization parameter derivation for cross-channel residual encoding and decoding
CN110084843A (zh) * 2019-04-23 2019-08-02 南京邮电大学 一种应用于家具三维打印的基于深度学习的图像压缩方法
CN111009018A (zh) * 2019-12-24 2020-04-14 苏州天必佑科技有限公司 基于深度神经网络的图像降维和重建方法
CN111787323B (zh) * 2020-05-23 2021-09-03 清华大学 一种基于对抗学习的可变比特率生成式压缩方法
CN111741302B (zh) * 2020-08-07 2021-05-14 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读介质及电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251303A (zh) * 2016-07-28 2016-12-21 同济大学 一种使用深度全卷积编码‑解码网络的图像降噪方法

Also Published As

Publication number Publication date
CN113079377A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
US20200021865A1 (en) Method and apparatus for applying deep learning techniques in video coding, restoration and video quality analysis (vqa)
US6704718B2 (en) System and method for trainable nonlinear prediction of transform coefficients in data compression
KR100986152B1 (ko) 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
AU711488B2 (en) Hybrid waveform and model-based encoding and decoding of image signals
US20110116542A1 (en) Symbol plane encoding/decoding with dynamic calculation of probability tables
EP1916652A1 (en) Encoder, method of encoding, and computer-readable recording medium
US20130089137A1 (en) Rate distortion optimization in image and video encoding
RU2640722C2 (ru) Усовершенствованный квантователь
RU2530926C2 (ru) Изменение формы шума округления для основанных на целочисленном преобразовании кодирования и декодирования аудио и видеосигнала
KR20190040063A (ko) 인덱스 코딩 및 비트 스케줄링을 갖는 양자화기
KR20210017185A (ko) 심층 신경망을 기반으로 영상의 압축 포아송 잡음을 제거하는 방법 및 장치
CN113079377B (zh) 一种深度图像/视频压缩网络的训练方法
US7778468B2 (en) Decoding apparatus, dequantizing method, and program thereof
JP2021150955A (ja) 訓練方法、画像符号化方法、画像復号化方法及び装置
CN115668777A (zh) 用于改进的机器学习压缩的系统和方法
KR102245682B1 (ko) 영상 압축 장치, 이의 학습 장치 및 방법
JP2006262310A (ja) 復号化装置、逆量子化方法及びこれらのプログラム
Malviya et al. 2D-discrete walsh wavelet transform for image compression with arithmetic coding
KR102471796B1 (ko) 세일리언시 맵을 이용한 인지적 비디오 전처리 방법 및 시스템
JP5351093B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム
JP5351094B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム
Kwak et al. Online mocap data coding with bit allocation, rate control, and motion-adaptive post-processing
JP3833585B2 (ja) 画像符号化装置および画像符号化方法、コンピュータプログラム
US20240121414A1 (en) Hybrid inter-frame coding using an autoregressive model
Seddiki et al. Medical image compression by region of interest based on SPIHT and global thresholding using huffman coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant