CN109644268B - 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置 - Google Patents
包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置 Download PDFInfo
- Publication number
- CN109644268B CN109644268B CN201780051305.7A CN201780051305A CN109644268B CN 109644268 B CN109644268 B CN 109644268B CN 201780051305 A CN201780051305 A CN 201780051305A CN 109644268 B CN109644268 B CN 109644268B
- Authority
- CN
- China
- Prior art keywords
- information
- loop filter
- cnn
- block
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种包括基于CNN的环路滤波器的编码装置及解码装置。根据一实施例的编码装置,包括:滤波部,通过对相当于原始图像与预测图像之间的差异的残差图像执行滤波,从而生成滤波信息;逆滤波部,通过对所述滤波信息执行逆滤波而生成逆滤波信息;预测部,基于所述原始图像与重建信息生成所述预测图像;基于CNN的环路滤波器,输入得到所述逆滤波信息与所述预测图像,从而输出所述重建信息;以及编码部,基于所述滤波信息与所述预测图像信息执行编码。
Description
技术领域
下列的实施例涉及包括基于CNN的环路滤波器的编码方法与装置及解码方法与装置。
背景技术
现有的环路滤波技术,是为缓解由于量化导致的因邻近的编码块间像素值的差异引起的区块边界在视觉上十分刺眼的问题,沿着区块边界,利用区块编码类型、区块边界像素强度、运动信息、量化后残差信号存在信息等,缓解邻近编码块的边界的像素间差异的方法。此时,尽管通过使用固定的滤波器系数而未传送系数,但仅在缓解编码块的边界的画质退化方面具有效果。
近来,在高效率视频编码(HEVC,High Efficiency Video Coding)标准中,不仅对编码块边界适用去区块滤波(de-blocking filtering),进一步地,还适用用于减少由于量化引起的在图像边缘引起垂直方向发生的环状伪影(ringing artefact)及亮度差伪影的取样自适应偏移(Sample Adaptive Offset)滤波作为第二次环路滤波。此时,不仅不能很好地改善高频模糊伪影(blurring artefact),此外,由于需要将样本偏移及边缘方向类型传送至解码器,由此,在提高编码效率方面具有局限。
发明内容
要解决的技术问题
实施例能够提供技术,通过执行环路滤波改善由于量化引起的区块边界伪影、环状伪影、以及高频模糊伪影(blurring artefact)。
并且,实施例能够提供技术,在编码装置及解码装置中使用得到训练的基于CNN的环路滤波器,不传送环路滤波器系数的同时改善画质。
并且,实施例能够提供技术,编码装置及解码装置使用得到训练的基于CNN的环路滤波器,将画质得到改善的帧作为参考帧,很大地提高编码效率或解码效率。
并且,实施例能够提供技术,按照切片类型适用环路滤波。
并且,实施例能够提供技术,按照编码块适用环路滤波。
并且,实施例能够提供技术,按照指定的图像区域适用环路滤波。
解决问题的技术方法
根据一实施例的基于CNN的环路滤波器学习方法,包括以下步骤:通过对相当于原始图像与预测图像之间的差异的残差图像执行滤波,从而生成滤波信息(filteringinformation);通过对所述滤波信息执行逆滤波而生成逆滤波信息(inverse filteringinformation);通过将所述逆滤波信息输入至基于CNN的环路滤波器(CNN based in-loopfilter)而生成重建信息;计算所述重建信息与基于所述原始图像的原始信息的差异;以及基于所述差异调整所述基于CNN的环路滤波器的权重(weight),并且,所述预测图像基于所述原始图像与所述重建信息生成。
生成所述滤波信息的步骤,包括:通过对所述残差图像进行变换及量化,从而生成滤波信息的步骤,生成所述逆滤波信息的步骤,包括:通过对所述滤波信息进行反量化及反变换,从而生成逆滤波信息的步骤。
生成所述滤波信息的步骤包括:基于根据量化参数(quantization parameter)的量化区间,对所述残差图像执行滤波的步骤,所述调整步骤,包括:调整对于所述量化区间的权重的步骤。
生成所述滤波信息的步骤,包括:基于根据畸变值的畸变值区间对所述残差图像进行滤波的步骤,所述调整的步骤,包括:调整对于所述畸变值区间的权重的步骤。
生成所述滤波信息的步骤,包括:基于图像特性的纹理复杂度区间,对所述残差图像进行滤波的步骤,所述调整的步骤,包括:调整对于所述纹理复杂度区间的权重的步骤。
生成所述滤波信息的步骤,包括:基于图像特性的运动复杂度区间对所述残差图像进行滤波的步骤,所述调整的步骤,包括:调整对于所述运动复杂度区间的权重的步骤。
生成所述重建信息的步骤,包括:通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,所述重建信息的形式与所述原始图像的形式相同。
通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,包括:对所述预测信息执行环路滤波的步骤。
生成所述重建信息的步骤,包括:通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,所述重建信息的形式与所述残差图像的形式相同。
通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,包括:对所述预测信息执行环路滤波的步骤。
根据一实施例的编码装置,包括:滤波部,通过对相当于原始图像与预测图像之间的差异的残差图像执行滤波,从而生成滤波信息;逆滤波部,通过对所述滤波信息执行逆滤波而生成逆滤波信息;预测部(estimator),基于所述原始图像与重建信息生成所述预测图像;基于CNN的环路滤波器,输入得到所述逆滤波信息与所述预测图像,从而输出所述重建信息;以及编码部(encoder),基于所述滤波信息与所述预测图像信息执行编码。
所述滤波部,通过对所述残差图像进行变换及量化而生成滤波信息,所述逆滤波部,通过对所述滤波信息进行反量化及反变换而生成逆滤波信息。
所述重建信息的形式与所述原始图像的形式相同,所述基于CNN的环路滤波器,通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息。
所述装置还包括对所述预测信息执行环路滤波的环路滤波器。
所述环路滤波器,包括:去区块滤波器(deblocking filter(DF))、取样自适应偏移滤波器(sample adaptive offset(SAO)filter),以及自适应环路滤波器(adaptiveloop filter(ALF))中的至少一个。
所述重建信息的形式与所述残差图像的形式相同,所述基于CNN的环路滤波器,通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息。
所述装置还包括对所述预测信息执行环路滤波的环路滤波器。
所述装置还包括对所述重建信息执行环路滤波的环路滤波器。
根据一实施例的解码装置,包括:熵解码部(entropy decoder),对编码的比特流信息进行解码从而输出滤波信息与待预测信息;逆滤波部,通过对所述滤波信息执行逆滤波而生成逆滤波信息;预测部,基于所述待预测信息生成预测图像;以及基于CNN的环路滤波器,输入得到所述逆滤波信息与所述预测图像,从而输出重建信息。
所述重建信息的形式与所述原始图像的形式相同,所述基于CNN的环路滤波器,通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息。
所述装置还包括对所述逆滤波信息执行环路滤波的环路滤波器。
所述环路滤波器,包括:去区块滤波器(DF)、取样自适应偏移滤波器(SAOfilter),以及自适应环路滤波器(ALF)中的至少一个。
所述重建信息的形式与所述残差图像的形式相同,所述基于CNN的环路滤波器,通过将所述逆滤波信息及基于所述预测图像的预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息。
所述装置还包括通过对所述重建信息与所述预测图像进行相加而生成最终重建信息的加法器。
所述装置还包括对所述逆滤波信息执行环路滤波的环路滤波器。
所述环路滤波器,包括:去区块滤波器(DF)、取样自适应偏移滤波器(SAOfilter),以及自适应环路滤波器(ALF)中的至少一个。
所述重建信息的形式与所述残差图像的形式相同,所述基于CNN的环路滤波器,通过将所述逆滤波信息输入至所述基于CNN的环路滤波器,从而生成残差重建信息。
所述装置还包括对所述残差重建信息与所述预测图像进行相加而生成最终重建信息的加法器。
所述装置还包括对所述最终重建信息执行环路滤波的环路滤波器。
所述环路滤波器,包括:去区块滤波器(DF)、取样自适应偏移滤波器(SAOfilter),以及自适应环路滤波器(ALF)中的至少任一个。
附图说明
图1为说明利用编码装置和/或解码装置的系统的一例的附图。
图2a为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的一例的附图。
图2b为显示图1所示的预测部的模块图的一例的附图。
图3为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图另一例的附图。
图4为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
图5为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图另一例的附图。
图6为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
图7为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
图8a为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图的一例的附图。
图8b为显示图8a所示的预测部的模块图的一例的附图。
图9为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
图10为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
图11为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
图12为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
图13为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
图14为说明根据一实施例的基于CNN的环路滤波器的结构的附图。
图15为说明根据一实施例的基于CNN的环路滤波器的按照区间的训练方法的附图。
图16为说明根据一实施例的基于CNN的环路滤波器的按照区间的训练方法的附图。
图17为说明根据一实施例的基于CNN的环路滤波器的训练方法的附图的一例。
图18为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
图19为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
图20为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
图21为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
具体实施方式
本发明所公开的根据本发明的概念的实施例,对于特定结构或者功能的说明仅用于对按照本发明的概念的实施例进行说明,由此,根据本发明的概念的实施例能够以多种形态进行实施,并非限定于本发明说明的实施例。
根据本发明的概念的实施例能够进行多种变更,并且,能够具有多种形态,由此,将实施例示例于附图中并在本说明书中进行详细说明。然而,这并非用于将按照本发明的概念的实施例限定于特定的公开形态,还应包括本发明的思想及技术范围内的变更、均等物,或替代物。
第一或第二等术语能够用于说明多种构成要素,然而,所述构成要素并非限定于所述术语。所述术语仅用于将一个构成要素区别于其他构成要素,例如,在不脱离基于本发明的概念的权利要求范围内,第一构成要素能够命名为第二构成要素,类似地,第二构成要素同样能够命名为第一构成要素。
当说明一个构成要素“连接”或者“接触”另一个构成要素时,能够直接连接或接触于其他构成要素,然而,也能够理解为在其中存在其他构成要素。相反,当说明一个构成要素“直接连接”或“直接接触”时,应理解为在其中不存在其他构成要素。说明构成要素间关系的表达,例如“在~之间”与“直接在~之间”或者“直接邻近于~”等也应以相同方式进行解释。
实施利中使用的术语仅用于说明特定实施例,并非用于限定实施例。在内容中没有特别说明的情况下,单数表达包括复数含义。在本说明书中,“包括”或者“具有”等术语用于表达存在说明书中所记载的特征、数字、步骤、操作、构成要素、配件或其组合,并不排除还具有一个或以上的其他特征、数字、步骤、操作、构成要素、配件或其组合,或者附加功能。
在没有其他定义的情况下,包括技术或者科学术语在内的在此使用的全部术语,都具有本领域普通技术人员所理解的通常的含义。通常使用的与词典定义相同的术语,应理解为与相关技术的通常的内容相一致的含义,在本申请中没有明确言及的情况下,不能理想化或解释为过度的形式上的含义。
下面,将参照附图对实施例进行详细说明。然而,专利申请范围并非限定于或受限于上述实施例。各附图中使用的相同的附图标记表示相同的部件。
图1为说明利用编码装置和/或解码装置的系统的一例的附图。
参照图1,利用编码装置和/或解码装置的系统10能够包括用户终端11与服务器终端12。用户终端11能够包括电子装置(electronic device)。电子装置能够体现为个人电脑(personal computer,PC)、数据服务器、电视机(TV),或便携设备。
便携设备能够体现为笔记本电脑(laptop)、移动电话、智能手机(smart phone)、平板(tablet)电脑、移动联网设备(mobile internet device,MID)、个人数码助理(personal digital assistant,PDA)、企业数字助理(enterprise digital assistant,EDA)、静态式数字照相机(digital still camera)、数字摄像机(digital video camera)、便携式多媒体播放器(portable multimedia player,PMP)、便携式游戏机(playstationportable,PSP)、个人/便携式导航设备(personal navigation device或者portablenavigation device,PND)、掌上游戏机(handheld game console)、无线通信终端(wireless communication terminal)、电子书(e-book),或数码设备(smart device)。
服务器终端12能够包括应用服务器或服务服务器等。
用户终端11与服务器终端12能够包括:用于与各种设备或者有线/无线通信网(network)进行通信的通信调制解调器等通信装置、为了对图像进行编码或解码,或者编码及解码,而存储为进行画面间(inter)或者画面内(intra)预测的各种程序与数据的存储器18、执行程序而实现计算及控制的处理器14等的多种设备。
并且,用户终端11与服务器终端12能够将通过编码装置编码为比特流(bitstream)的图像传送至图像解码装置。例如,用户终端11与服务器终端12能够实时或非实时地将编码的图像传送至图像解码装置。
用户终端11与服务器终端12能够通过有线/无线通信网络或者多种通信接口,将编码的图像传送至图像解码装置。例如,有限/无线通信网能够是互联网、近距离无线通信网、无线局域网、无线宽带接入网,或者移动通信网等。通信接口能够包括电缆,或者通用串行总线(Universal Serial Bus,USB)等。
并且,通过编码装置编码为比特流的图像,能够通过可计算机读写的记录媒介从编码装置传送至解码装置。
解码装置能够将编码的图像进行解码,从而再生重建的图像。
编码装置与解码装置能够分别是不同的装置,也能够根据体现为一个编码及解码装置。当使用一个编码及解码装置时,编码装置的预测部、反量化部、反变换部、加法部、滤波器部及DPB按照记载的顺序与解码装置的预测部、反量化部、反变换部、加法部、滤波器部及DPB实质上是相同的技术要素,由此,能够体现为至少包括相同的结构或至少执行相同的功能。并且,熵编码部当执行逆向功能时,能够与熵解码部对应。
由此,在接下来的对于技术要素以及技术要素的作用原理等的详细说明中,省略相应技术要素的重复说明。
并且,解码装置是将编码装置执行的编码方法适用于解码的计算装置,在下面的说明中,以编码装置为主进行说明。编码装置能够称为编码器,解码装置能够称为解码器。
图2a为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的一例的附图,图2b为显示图1所示的预测部的模块图的一例的附图。
参照2a及图2b,编码装置100包括变换及量化部120(transformer andquantizer)、熵编码部130(entropy encoder)、反量化及反变换部140(inverse-quantizerand inverse-transformer)、基于CNN的环路滤波器150a(CNN based in-loop filter)、解码图像缓存160(decoded picture buffer,DPB)、预测部170(estimator),以及多个加法器(adder)。
编码装置100能够对输入图像110(input image)或者输入切片110(input slice)进行编码(encoding)。例如,编码装置100能够对分割输入图像110或输入切片110的多个像素块f进行编码。编码装置100还能够包括分割输入图像110或输入切片110的分割部(未图示)。分割部(未图示)能够将输入图像110或输入切片110分割为指定大小(M×N)的区块。此时,M或N能够是1以上的自然数。
分割部(未图示)能够基于输入图像110或输入切片110的特性或分辨率等决定区块的大小(M×N)。分割部(未图示)能够将区块的大小(M×N)确定为2的乘方。分割部(未图示)能够将区块的大小(M×N)确定为正方形或矩形。例如,当分割部(未图示)确定为正方形时,区块的大小(M×N)能够是256×256、128×128、64×64、32×32、16×16、8×8,或4×4等。
加法器能够基于像素块f及预测块生成残差块e。例如,残差块e能够是相当于像素块f及预测块的差异的区块。预测块能够是预测部170对像素块(f)使用画面内预测(intra prediction)或画面间预测(inter prediction)等生成的区块。变换及量化部120能够对残差块e进行变换及量化。变换及量化部120能够通过向残差块e执行变换及量化而非对像素块f执行变换及量化,从而提高编码效率。
变换及量化部120能够通过向残差块e执行滤波生成滤波信息
变换及量化部120能够将残差块e变换为频域(frequency domain)。残差块e的各像素能够对应变换的残差块的变换系数。
变换及量化部120能够使用变换矩阵变换残差块e。变换矩阵能够是一维、二维,或三维变换矩阵。例如,变换及量化部120能够以离散余弦变换(discrete cosinetransform,DCT)、离散正弦变换(discrete cosine transform,DST)、水平、垂直单位等使用变换矩阵。变换及量化部120能够根据残差块e的大小、形态、类型(亮度/色差)、编码模式、预测模式信息、量化参数、或邻居区块的编码信息等确定是否使用变换矩阵。变换及量化部120能够变换残差块e生成变换区块E。
变换及量化部120能够对变换块E执行量化,从而输出量化的残差变换及量化部120能够对变换块E的变换系数执行量化。变换及量化部120能够根据基于量化参数(quantization parameter,QP)的量化区间、基于图像信号特性的畸变值区间、基于图像信号特性的纹理复杂度区间,以及基于图像信号特性的运动复杂度区间中的至少一个以上对残差图像e执行滤波。图像信号能够包括残差块e。
变换及量化部120能够基于量化参数(QP)执行量化。变换及量化部120能够根据变换块E的区块单位确定量化参数。量化参数能够确定为序列(sequence)、图像(picture)、切片(slice),或者区块(block)等单位。
变换及量化部120能够从变换块E的邻居区块诱导至少一个量化参数。变换及量化部120能够使用至少一个量化参数预测变换块E的量化参数。例如,变换及量化部120能够从变换块E的左、左上、左下、上、右上、右下、下等邻居区块诱导至少一个量化参数。变换及量化部120计算从预测的量化参数与邻居区块诱导的量化参数的差分,并传送至熵编码部130。
当变换及量化部120无法从变换块E的邻居区块诱导量化参数时,变换及量化部120基于以序列、图像、切片,或者区块等单位传送的参数设定量化参数。变换及量化部120能够计算基本参数与量化参数的差分并传送至熵编码部130。
熵编码部130能够对预测块和/或量化的残差变换执行熵编码。例如,熵编码部130能够使用基于上下文自适应变长编码(CAVLC)、基于上下文自适应的二进制算术编码(CABAC)、或基于语法的上下文自适应二进制算术编码(SBAC)等编码方式执行熵编码。
熵编码部130能够执行熵编码,从而将编码数据输出为比特流。编码数据能够包括将量化参数进行编码的比特流与将编码的比特流进行解码所需的多种信息。并且,编码数据能够包括编码的区块形态、量化参数、量化区块编码的比特流,以及预测所需的信息等。
反量化及反变换部140能够对滤波信息进行逆滤波而生成逆滤波信息(inversefiltering information;)。逆滤波信息能够是指重建残差块例如,反量化及反变换部140能够对量化的残差变换执行反量化和/或反变换而生成重建残差块反量化及反变换部140能够逆向执行变换及量化部120的动作。例如,反量化及反变换部140能够对量化的残差变换执行反量化,并执行反变换。反量化及反变换部140能够将变换及量化部120的变换结构及量化结构构成为相反的方式。
在图1中为说明的便利,将变换及量化部120图示为执行变换及量化的方式,然而,并非限定于此,能够分别体现为对残差块e进行变换的变换部,对残差块e进行量化的量化部。
基于CNN的环路滤波器150a对预测信息执行环路滤波而生成重建信息。预测信息能够是初始重建块二次重建块或者重建残差块等。重建信息能够是重建块二次重建残差块或者)最终重建块等。在图2a及图2b中,对基于CNN的环路滤波器150a对初始重建块)行环路滤波而生成重建块的动作进行说明。
基于CNN的环路滤波器150a能够使用深度卷积神经网络(deep convolutionalneural network)。即,基于CNN的环路滤波器150a能够基于多个训练数据得到训练。基于CNN的环路滤波器150a能够训练为对任意的输入图像生成适合的输出图像。
基于CNN的环路滤波器150a能够包括输入层(input layer)、隐藏层(hiddenlayer),以及输出层(output layer)。输入层(input layer)、隐藏层(hidden layer),及输出层(output layer)能够分别包括多个节点。
邻近的层之间的节点能够以具有连接权重的方式相互连接。各节点能够基于活性化模型动作。能够根据活性化模型确定对应输入值的输出值。任意节点的输出值能够输入为与相应节点连接的下一层的节点。下一层的节点能够输入有从多个节点输出的值。在任意节点的输出值输入为下一层的节点的过程中,能够适用连接权重。下一层的节点能够基于活性化模型将对应输入值的输出值输出至与相应节点连接的下一层节点。
输出层能够包括对应环路滤波的节点。输出层的节点能够输出对应执行环路滤波的图像(或区块)的特征值。
基于CNN的环路滤波器150a能够对初始重建块执行滤波而生成重建块即,基于CNN的环路滤波器150a能够学习从而基于初始重建块生成重建块例如,基于CNN的环路滤波器150a能够学习从而基于初始重建块及像素块f生成重建块
下面的内容中将参考附图,对基于CNN的环路滤波器150a的构成、训练方法等进行说明。
当解码图像缓存160存储重建块时,解码图像缓存160在预测部170生成预测块时,传送重建块而实现使用。例如,预测部170在之后的画面内预测(intraprediction)或者画面间预测(inter prediction)动作过程中,使用重建块生成预测块
预测部170能够包括帧内估计部171、运动估计部172、帧内预测部173、运动补偿部174、模式确定部175,以及预测图像生成部176。
模式确定部175基于来自帧内预测部173及运动补偿部174的数据确定编码模式。例如,编码模式能够有帧内模式(intra mode)、帧间模式(inter mode)等。
图3为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图另一例的附图。
参照图3,编码装置100包括变换及量化部120、熵编码部130、反量化及反变换部140、环路滤波器145(in-loop filter)、基于CNN的环路滤波器150b、解码图像缓存160,预测部170,及多个加法器。
图3所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,及多个加法器与图2a所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,及多个加法器的构成及动作实质上相同。对此,下面对环路滤波器145及基于CNN的环路滤波器150b进行说明。
环路滤波器145包括去区块滤波器(deblocking filter,DF)、取样自适应偏移滤波器(sample adaptive offset(SAO)filter),及自适应环路滤波器(adaptive loopfilter,ALF)中的至少一个。
即,当环路滤波器145包括1个滤波器时,环路滤波器145能够体现为去区块滤波器(DF)、取样自适应偏移滤波器(SAO filter),及自适应环路滤波器(ALF)中的一个滤波器。
当环路滤波器145包括2个滤波器时,环路滤波器145能够体现为包括去区块滤波器(DF)及取样自适应偏移滤波器(SAO filter)。或者,环路滤波器145能够体现为包括取样自适应偏移滤波器(SAO filter)及自适应环路滤波器(ALF)。或者,环路滤波器145能够体现为包括去区块滤波器(DF)及自适应环路滤波器(ALF)。
当环路滤波器145包括3个滤波器时,环路滤波器145能够体现为包括去区块滤波器(DF)、取样自适应偏移滤波器(SAO filter),及自适应环路滤波器(ALF)。
取样自适应偏移滤波器(SAO filter)能够按照编码块单位修正环状伪影(ringing artefact)或像素值区间畸变。取样自适应偏移滤波器(SAO filter)能够向对初始重建块执行去区块滤波的结果与像素块f,以偏移重建差异值。
图4为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
参照图4,编码装置100包括变换及量化部120、熵编码部130、反量化及反变换部140、基于CNN的环路滤波器150c、解码图像缓存160、预测部170,及多个加法器。
图4所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,及多个加法器与图2a所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,及多个加法器的构成及动作实质上相同。对此,下面对基于CNN的环路滤波器(150c)进行说明。
图5为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图另一例的附图。
参照图5,编码装置100包括变换及量化部120、熵编码部130、反量化及反变换部140、环路滤波器145、基于CNN的环路滤波器150d、解码图像缓存160、预测部170,及多个加法器。
图5所示的变换及量化部120、熵编码部130、反量化及反变换部140、环路滤波器145、解码图像缓存160、预测部170,及多个加法器能够与图3所示的变换及量化部120、熵编码部130、反量化及反变换部140、环路滤波器145、解码图像缓存160、预测部170,及多个加法器具有实质上相同的构成及动作。对此,下面将对基于CNN的环路滤波器150d进行说明。
基于CNN的环路滤波器150d能够对预测信息执行环路滤波而生成重建信息。基于CNN的环路滤波器150d能够从环路滤波器145接收二次重建块基于CNN的环路滤波器150d能够对二次重建块执行滤波而生成重建残差块重建残差块能够是比图4所示的重建残差块更接近0的值。
图6为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
参照图6,编码装置100包括变换及量化部120、熵编码部130、反量化及反变换部140、基于CNN的环路滤波器150e、解码图像缓存160、预测部170,以及多个加法器。
图6所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,以及多个加法器与图2a所示的变换及量化部120、熵编码部130、反量化及反变换部140、解码图像缓存160、预测部170,及多个加法器具有实质上相同的构成及动作。对此,下面将对基于CNN的环路滤波器150e进行说明。
基于CNN的环路滤波器150e能够对预测信息执行环路滤波而生成重建信息。基于CNN的环路滤波器150e能够从反量化及反变换部140接收反量化及反变换的重建残差块基于CNN的环路滤波器150e能够对重建残差块执行滤波而生成重建信息。重建信息能够包括二次重建残差块
图7为显示根据一实施例的包括基于CNN的环路滤波器的编码装置的模块图的另一例的附图。
参照图7,编码装置100包括变换及量化部120、熵编码部130、反量化及反变换部140、基于CNN的环路滤波器150e、环路滤波器147、解码图像缓存160、预测部170,及多个加法器。
图7所示的变换及量化部120、熵编码部130、反量化及反变换部140、基于CNN的环路滤波器150e、解码图像缓存160、预测部170,及多个加法器与图6所示的变换及量化部120、熵编码部130、反量化及反变换部140、基于CNN的环路滤波器150e、解码图像缓存160、预测部170,及多个加法器具有实质上相同的构成及动作。对此,下面将对环路滤波器147进行说明。
环路滤波器147能够与图3中的说明相同,包括去区块滤波器(DF)、取样自适应偏移滤波器(SAO filter),及自适应环路滤波器(ALF)中的至少一个。
图8a为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图的一例的附图,图8b为显示图8a所示的预测部的模块图的一例的附图。
参照图8a及图8b,解码装置200能够包括熵解码部210、反量化及反变换部220、基于CNN的环路滤波器230a、编码图像缓存240、预测部250,及加法器。
解码装置200是将在图2a至图7中的编码装置100中执行的编码方法对应于适用解码的计算装置。即,熵解码部210、反量化及反变换部220、编码图像缓存240、预测部250,及加法器与图2a所示的熵编码部130、反量化及反变换部140、变换及量化部120、解码图像缓存160、预测部170,及加法器对应。
如图2a所述,基于CNN的环路滤波器230a能够使用深度卷积神经网络。即,基于CNN的环路滤波器230a能够基于多个训练数据实现训练。基于CNN的环路滤波器230a能够得到训练从而对任意输入图像生成适合的输出图像。
即,基于CNN的环路滤波器230a能够包括输入层、隐藏层,及输出层。输入层、隐藏层,及输出层能够分别包括多个节点。
基于CNN的环路滤波器230a能够对初始重建块执行滤波从而生成重建块即,基于CNN的环路滤波器230a能够学习从而基于初始重建块生成重建块例如,基于CNN的环路滤波器230a能够学习从而基于初始重建块及像素块f生成重建块
在下面的内容中,将参照附图对基于CNN的环路滤波器230a的构成、训练方法等进行说明。
图9为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
参照图9,解码装置200包括熵解码部210、反量化及反变换部220、环路滤波器225、基于CNN的环路滤波器230b、编码图像缓存240、预测部250,及加法器。
图9所示的熵解码部210、反量化及反变换部220、编码图像缓存240、预测部250,以及加法器与图8a所示的解码部210、反量化及反变换部220、编码图像缓存240、预测部250,及加法器具有实质上相同的构成及动作。对此,下面将对环路滤波器225及基于CNN的环路滤波器230b进行说明。
如上所述,环路滤波器225能够包括去区块滤波器(DF)、取样自适应偏移滤波器(SAO filter),及自适应环路滤波器(ALF)中的至少一个。
图10为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
参照图10,解码装置200包括熵解码部210、反量化及反变换部220、基于CNN的环路滤波器230c、编码图像缓存240、预测部250,及多个加法器。
图10所示的熵解码部210、反量化及反变换部220、编码图像缓存240、预测部250,以及多个加法器与图8a所示的解码部210、反量化及反变换部220、编码图像缓存240、预测部250,以及加法器具有实质上相同的构成及动作。对此,下面将对CNN的环路滤波器230c进行说明。
基于CNN的环路滤波器230c能够对预测信息执行环路滤波而生成重建信息。预测信息能够包括初始重建块重建信息能够包括重建残差块基于CNN的环路滤波器230c能够从加法器接收初始重建块基于CNN的环路滤波器230c能够对初始重建块执行滤波从而生成重建残差块
图11为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
参照图11,解码装置200包括熵解码部210、反量化及反变换部220、环路滤波器225、基于CNN的环路滤波器230d、编码图像缓存240、预测部250,以及多个加法器。
图11所示的熵解码部210、反量化及反变换部220、环路滤波器225、基于CNN的环路滤波器230d、编码图像缓存240、预测部250,以及多个加法器与图9所示的熵解码部210、反量化及反变换部220、环路滤波器225、编码图像缓存240、预测部250,以及加法器具有实质上相同的构成与动作。对此,将对基于CNN的环路滤波器230d进行说明。
基于CNN的环路滤波器230d能够对预测信息执行环路滤波生成重建信息。预测信息包括二次重建块重建信息能够包括重建残差块基于CNN的环路滤波器230d能够从环路滤波器225接收二次重建块基于CNN的环路滤波器230d能够对二次重建块执行滤波而生成重建残差块重建残差块能够是相比图10所示的重建残差块更接近0的值。
图12为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
参照图12,解码装置200包括熵解码部210、反量化及反变换部220、基于CNN的环路滤波器230e、编码图像缓存240、预测部250,以及加法器。
图12所示的熵解码部210、反量化及反变换部220、编码图像缓存240、预测部250,以及多个加法器与图8a所示的解码部210、反量化及反变换部220、编码图像缓存240、预测部250,以及加法器具有实质上相同的构成及动作。下面,将对基于CNN的环路滤波器230e进行进行说明。
基于CNN的环路滤波器230e能够对预测信息执行环路滤波而生成重建信息。预测信息包括预测残差块重建信息包括二次重建残差块基于CNN的环路滤波器230e能够从反量化及反变换部220接收反量化及反变换的重建残差块基于CNN的环路滤波器230e能够对重建残差块执行滤波而生成二次重建残差块
图13为显示根据一实施例的包括基于CNN的环路滤波器的解码装置的模块图另一例的附图。
参照图13,解码装置200包括熵解码部210、反量化及反变换部220、基于CNN的环路滤波器230e、环路滤波器227、编码图像缓存240、预测部250,及加法器。
图13所示的熵解码部210、反量化及反变换部220、基于CNN的环路滤波器230e、编码图像缓存240、预测部250,及加法器与图12所示的解码部210、反量化及反变换部220、基于CNN的环路滤波器230e、编码图像缓存240、预测部250,以及加法器具有实质上相同的构成与动作。对此,下面将对环路滤波器227进行说明。
环路滤波器227能够如图9所示,包括去区块滤波器(DF)、取样自适应偏移滤波器(SAO filter),以及自适应环路滤波器(ALF)中的至少一个。
图14为说明根据一实施例的基于CNN的环路滤波器的结构的附图。
参照图14,基于CNN的环路滤波器150包括输入层151(input layer)、隐藏层152(hidden layer),及输出层153(output layer)。
输入层151能够接收输入图像。输入图像能够包括退化的重建图像。例如,输入层151能够输入有通过反量化及反变换部140执行反量化及反变换的重建图像。输入图像能够包括区块边界伪影、环状伪影,以及高频模糊伪影。重建图像能够包括退化(degradation)现象。
输入层151能够对输入图像执行图像分块(image patch)而提取至隐藏层153。例如,输入层151能够将输入图像以f1×f1的大小执行图像分块。
隐藏层152能够执行非线性映射(non-linear mapping)。隐藏层152能够包括N个卷积层(convolutional layer)。此时,随着从第一卷积层152-1逐渐进行至第N卷积层152-N,图像画质能够得到提高。
基于CNN的环路滤波器150能够通过隐藏层152、输出层153,及损失函数(lossfunction)执行对基于CNN的环路滤波器的训练。
能够将第一卷积层152-1对应于公式1。
【公式1】
F1(Y)=max(0,W1·Y+B1)
W1:64(9×9)convolution filters(9×9×1×64)
能够将第二卷积层对应于公式2。
【公式2】
F2(Y)=max(0,W2·F1(Y)+B2)
W2:64(9×9)convolution filters(9×9×64×64)
基于相同的原理,能够将第N卷积层(152-N)对应于公式3。
【公式3】
FN(Y)=max(0,WN·FN-1(Y)+BN)
WN:64(9×9)convolution filters(9×9×64×64)
即,隐藏层152能够使用线性整流函数(Rectified Linear Unit,ReLU)函数提高训练的效率与速度。
输出层153能够对应于公式4。
【公式4】
F(Y)=WN+1·FN(Y)+BN+1
WN+1:1(9×9)convolution filters(9×9×64×1)
输出层153能够输出经过滤波画质得到提高的输出图像。
损失函数能够对应于公式5。
【公式5】
基于CNN的环路滤波器150能够得到训练从而通过损失函数最小化滤波错误。
图15为说明根据一实施例的基于CNN的环路滤波器的按照区间的训练方法的附图。
参照图15,基于CNN的环路滤波器150能够按照量化区间执行训练。基于CNN的环路滤波器150能够根据量化参数(quantization parameter,QP)对不同畸变值的重建图像进行处理。由此,基于CNN的环路滤波器150按照量化区间执行训练从而有效地执行滤波。
量化参数(QP)能够是大于0小于51的值。各量化区间能够至少包括一个量化参数(QP),此时,还能够具有多个量化区间共同包括的量化参数(QP)。例如,第一区间与第二区间能够共同包括量化参数(QP)5。
在编码装置100进行编码时使用的量化参数(QP)能够是在解码装置200得到确认的值,编码装置100能够不将编码时使用的量化参数(QP)传送至解码装置200。由此,编码装置100不会发生过度开销(overhead),并提高编码效率。
编码装置100能够使用第N区间的量化参数(QP)生成重建训练图像300。编码装置100能够将重建训练图像300传送至基于CNN的环路滤波器150。
基于CNN的环路滤波器150能够对重建训练图像300执行滤波而生成输出图像,从而传送至加法器。
加法器对输出图像及原输入训练图像400(original input image)进行差分而传送至基于CNN的环路滤波器150。
基于CNN的环路滤波器150基于差分调节隐藏层152的权重(weight)。例如,基于CNN的环路滤波器150能够调节权重(weights)而使得输出图像与输入训练图像400不存在差异。此时,能够通过使用反向传播(back propagation)方法进行为实现基于CNN的环路滤波器150的权重调节的学习。
重建训练图像300及输入训练图像400能够体现为多种实施例。即CNN的环路滤波器150能够具有无数的训练方法。基于CNN的环路滤波器150能够根据训练方法不同地动作。
作为一例,重建训练图像300能够是在环路滤波器140执行滤波之前的重建图像(reconstructed frames prior to in-loop filtering)。基于CNN的环路滤波器150对执行滤波之前的重建图像执行滤波从而生成接近输入训练图像400的输出图像。此时,基于CNN的环路滤波器150能够以图2a所示的基于CNN的环路滤波器150a动作。
作为另一例,重建训练图像300能够是在环路滤波器140执行滤波的图像(reconstructed frames after in-loop filtering)。即,基于CNN的环路滤波器150对执行滤波的图像执行滤波而生成更接近原输入训练图像400的输出图像。此时,基于CNN的环路滤波器150能够以图3所示的基于CNN的环路滤波器150b动作。
作为另一例,重建训练图像300能够是在环路滤波器140执行滤波的图像,输入训练图像400能够是残差图像e。此时,基于CNN的环路滤波器150能够在适用滤波的图像上进行滤波而生成重建残差图像。此时,基于CNN的环路滤波器150能够以图5所示的基于CNN的环路滤波器150d动作。
图16为说明根据一实施例的基于CNN的环路滤波器的按照区间的训练方法的附图。
参照图16,基于CNN的环路滤波器150能够按照畸变值区间执行训练。基于CNN的环路滤波器150能够根据量化参数(QP)具有不同的畸变值。对此,基于CNN的环路滤波器150按照畸变值区间执行训练从而有效地执行滤波。
在编码装置100进行编码时使用的畸变值区间是能够在解码装置200确认的值,编码装置100能够不将进行编码时使用指数(index)传送至解码装置200。由此,编码装置100不发生额外开销,并提高编码效率。
畸变值能够是输入训练图像600及重建训练图像的差异。
编码装置100能够生成属于第N区间的畸变值的重建训练图像500。编码装置100能够将重建训练图像500传送至基于CNN的环路滤波器150。
基于CNN的环路滤波器150能够对重建训练图像500执行滤波从而生成输出图像并传送至加法器。加法器能够对输出图像及原输入训练图像600进行差分传送至基于CNN的环路滤波器150。
基于CNN的环路滤波器150能够基于差分调节隐藏层152的权重。例如,基于CNN的环路滤波器150能够调节权重(weights)使得输出图像与输入训练图像600不存在差异。此时,基于CNN的环路滤波器150的调整权重的学习能够使用反向传播方法。
重建训练图像500能够是重建残差图像。重建残差图像能够是对残差图像执行变换及量化,之后再次执行反量化及反变换的图像。
输入训练图像600能够是残差图像。残差图像能够是将输入图像与重建图像进行差分的图像。重建图像能够是执行环路滤波的图像或者未执行环路滤波的图像。
即,基于CNN的环路滤波器150能够对重建残差图像执行滤波而生成接近残差图像的输出图像。此时,基于CNN的环路滤波器150能够以图6所示的基于CNN的环路滤波器150e动作。
并且,基于CNN的环路滤波器150能够按照图像的切片类型(slice type)执行滤波。下面,对基于CNN的环路滤波器150按照切片类型执行滤波的动作进行说明。
图17为说明根据一实施例的基于CNN的环路滤波器的训练方法的附图的一例。
参照图17,基于CNN的环路滤波器150在低延迟架构(low delay configuration)的编码或解码过程中对多个图像执行滤波。
多个图像的切片类型能够是帧内切片(intra slice(I slice)),以及预测切片(predictive slice(P slice))。
帧内切片的图像700-1及700-N能够执行画面内预测。预测切片的图像700-2~700-4能够执行画面间预测。
例如,预测切片的图像700-2能够参照帧内切片的图像700-1预测图像。预测切片的图像700-3能够参照帧内切片的图像700-1及预测切片的图像700-2预测图像。预测切片的图像700-4能够参照帧内切片的图像700-1及预测切片的图像700-2~700-3预测图像。
基于CNN的环路滤波器150能够对帧内切片的图像700-1及700-N执行滤波从而持续提供畸变小的图像。基于CNN的环路滤波器150能够周期性地提供帧内切片的图像700-1及700-N。
图18为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
参照图18,基于CNN的环路滤波器150能够在低延迟架构(low delayconfiguration)的编码或解码过程中对多个图像800-1~800-3、800-5,及800-5选择性地执行滤波。
多个图像800-1~800-3、800-5,及800-5的切片类型能够是帧内切片(I slice),或者预测切片(P slice)。
帧内切片的图像800-1能够执行画面内预测。预测切片的图像800-2、800-3、800-5,及800-7能够执行画面间预测。
例如,预测切片的图像800-2能够参照帧内切片的图像800-1预测图像。预测切片的图像800-3能够参照帧内切片的图像700-1及预测切片的图像800-2预测图像。基于相同的原理,预测切片的图像800-5及800-7能够参照之前的切片的图像预测图像。
基于CNN的环路滤波器150能够对帧内切片的图像800-1及预测切片的图像800-3、800-5,及800-7执行滤波从而持续提供畸变较小的图像。基于CNN的环路滤波器150按照周期或选择性地执行滤波而提供预测切片的图像800-3、800-5,及800-7。
基于CNN的环路滤波器150不仅在低延迟架构下选择性地执行滤波,并且能够按照一系列的各输入切片,以及在输入切片内按照编码单位(Coding Tree Unit,CTU)或编码块(Coding Unit,CU)或者指定的图像区域选择性地适用。
图19为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
参照图19,基于CNN的环路滤波器150能够在全画面内结构(All intraconfiguration)的编码或解码过程中对多个图像900-1~900-N执行滤波。
多个图像900-1~900-N的切片类型能够是帧内切片(I slice)。
帧内切片的图像900-1~900-N能够执行画面内预测。即,帧内切片的图像900-1~900-N的畸变值不会传达至其他图像,基于CNN的环路滤波器150对全部帧内切片的图像900-1~900-N进行滤波从而提供高画质的图像。
基于CNN的环路滤波器150不仅在低延迟架构下选择性地执行滤波,并且能够按照一系列的各输入切片,以及在输入切片内按照编码单位(Coding Tree Unit,CTU)或编码块(Coding Unit,CU)或者指定的图像区域选择性地适用。
图20为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例,图21为说明根据一实施例的基于CNN的环路滤波器的适用方法的附图的另一例。
参照图20及图21,基于CNN的环路滤波器150能够在分层B图像结构(hierarchicalB-picture configuration)的编码或解码过程中对多个图像1010-1~1010-3、1020-1~1020-2、1030-1~1030-4、1040-1~1040-4执行滤波。
分层B图像结构能够包括第一层至第四层。
第一层图像1010-1~1010-3的切片类型能够是帧内切片(I slice)或者预测切片(P slice)。帧内切片的图像1010-1~1010-3能够执行画面内预测。
第二层至第四层图像1020-1~1020-2、1030-1~1030-4、1040-1~1040-4的切片类型能够是两侧预测切片(bi-predictive slice,B slice))。两侧预测切片(B slice)的图像1020-1~1020-2、1030-1~1030-4、1040-1~1040-4能够参照下列层的图像预测图像。此时,两侧预测切片(B slice)的图像1020-1~1020-2、1030-1~1030-4、1040-1~1040-4,在下列层不论是之前的图像(前)或者之后的图像(后)都能够进行参照。例如,第二层的图像1020-1能够参照第一层的图像1010-1及1010-2。第二层的图像1020-2能够参照第一层的图像1010-2及1010-3。
基于相同的原理,第四层的图像1040-1能够参照第三层的图像1030-1及第一层的图像1010-1,第四层的图像1040-3能够参照第二层的图像1020-1及第三层的图像1030-2。
基于CNN的环路滤波器150能够选择特定层执行滤波。作为一例,基于CNN的环路滤波器150能够对第一层的图像1010-1~1010-3执行滤波。
作为另一例,基于CNN的环路滤波器150能够对第一层的图像1010-1~1010-3及第二层的图像1020-1及1020-2执行滤波。基于CNN的环路滤波器150对第一层的图像1010-1~1010-3及第二层的图像1020-1及1020-2执行滤波的动作能够如图20所示。
作为另一例,基于CNN的环路滤波器150能够对第一层的图像1110-1~1110-3、第二层的图像1120-1及1120-2,及第三层的图像1130-1~1130-4执行滤波。基于CNN的环路滤波器150对第一层的图像1110-1~1110-3、第二层的图像1120-1及1120-2,及第三层的图像1130-1~1130-4执行滤波的动作能够如图21所示。
基于CNN的环路滤波器150不仅在低延迟架构下选择性地执行滤波,并且能够按照一系列的各输入切片,以及在输入切片内按照编码单位(Coding Tree Unit,CTU)或编码块(Coding Unit,CU)或者指定的图像区域选择性地适用。
基于CNN的环路滤波器150能够对图像内的特定区域执行滤波。例如,基于CNN的环路滤波器150能够将图像分割为多个区域,在多个区域中只选择部分区域执行滤波。此时,基于CNN的环路滤波器150能够进行信令而确定是否对部分区域适用滤波。
并且,基于CNN的环路滤波器150能够基于图像内动作的量与纹理复杂度中的至少一个执行滤波。
以上说明的实施例能够通过硬件构成要素、软件构成要素,和/或硬件构成要素及软件构成要素的组合实现。例如,实施例中说明的装置、方法,以及构成要素,能够利用例如处理器、控制器、算术逻辑单元(arithmetic logic unit,ALU)、数字信号处理器(digitalsignal processor)、微型计算机、现场可编程阵列(field programmable gate array,FPGA)、可编程逻辑单元(programmable logic unit,PLU)、微处理器、或能够执行与应答命令(instruction)的任何其他装置,能够利用一个以上的通用计算机或特殊目的计算机进行体现。处理装置能够执行操作系统(OS)及在所述操作系统中执行的一个以上的软件应用。并且,处理装置应答软件的执行,从而访问、保存、操作、处理及生成数据。为方便理解,说明为仅具有一个处理装置的方式,但本领域普通技术人员应理解处理装置能够包括多个处理元件(processing element)和/或多个类型的处理要素。例如,处理装置能够包括多个处理器或一个处理器及一个控制器。并且,也能够包括类似于并行处理器(parallelprocessor)的其他处理配置(processing configuration)。
软件能够包括计算机程序(computer program)、代码(code)、指令(instruction),或其中的一个以上的组合,能够将处理装置构成为实现以所期待的方式操作,或者,单独或共同(collectively)命令处理装置的方式。软件和/或数据为通过处理装置进行解释或者向处理装置提供命令或数据,能够具体体现于(embody)任何类型的设备、构成要素(component)、物理装置、虚拟装置(virtual equipment)、计算机存储媒介或装置,或者永久体现于所传送的信号波(signal wave)。软件分散于通过网络连接的计算机系统上,能够以分散的方式存储或执行。软件及数据能够存储于一个以上的计算机读写记录媒介。
根据实施例的方法以能够通过多种计算机手段执行的程序命令的形态体现,并记录在计算机读写媒介。所述计算机读写媒介能够以单独或者组合的形式包括程序命令、数据文件、数据结构等。记录在所述媒介的程序命令能够是为实现实施例特别设计与构成的,或者是计算机软件负责人公知而能够使用的。计算机读写记录媒介能够包括硬盘、软盘以及磁带等磁性媒介(magnetic media);与CD-ROM、DVD等类似的光学媒介(optical media);与光磁软盘(floptical disk)类似的磁光媒介(magneto-optical media),以及与只读存储器(ROM)、随机存取存储器(RAM)、闪存等类似的为存储并执行程序命令而特别构成的硬件装置。程序命令的例子不仅包括通过编译器生成的机器语言代码,还包括使用解释器等的能够由计算机执行的高级语言代码。为执行实施例的操作,所述硬件装置能够构成为以一个以上的软件模块实现操作的方式。
综上,通过有限的附图对实施例进行了说明,本领域普通技术人员能够基于所述记载进行多种更改与变形。例如,所说明的技术按照与说明的方法不同的顺序执行,和/或所说明的系统、结构、装置、电路等构成要素按照与说明的方法不同的形态进行结合或组合,或者由其他构成要素或者等同物置换或代替,也能得到适当的结果。
由此,其他体现,其他实施例以及权利要求范围的等同物,均属于本发明的权利要求范围。
Claims (26)
1.一种基于CNN的环路滤波器学习方法,包括以下步骤:
通过对相当于原始图像与预测图像之间的差异的残差图像执行变换及量化,从而生成经变换及量化后的信息;
通过对所述经变换及量化后的信息执行反量化及反变换而生成经反量化及反变换后的信息;
通过将所述经反量化及反变换后的信息输入至基于CNN的环路滤波器而生成重建信息;
计算所述重建信息与基于所述原始图像的原始信息的差异;以及
基于所述差异调整所述基于CNN的环路滤波器的权重,
并且,所述预测图像基于所述原始图像与所述重建信息生成,
其中,基于CNN的环路滤波器的权重与基于CNN的环路滤波器的各层之间的多个连接权重有关,所述权重被确定为最小化训练期间的一个或多个预定损失函数,所述权重根据以下至少一个获得:畸变值区间、纹理复杂度区间、运动复杂度区间、切片类型、编码分层水平、编码模式以及邻居编码块。
2.根据权利要求1所述的基于CNN的环路滤波器学习方法,
生成所述经变换及量化后的信息的步骤,包括:
基于根据畸变值的畸变值区间对所述残差图像进行变换及量化的步骤,
所述调整的步骤,包括:
调整对于所述畸变值区间的权重的步骤。
3.根据权利要求1所述的基于CNN的环路滤波器学习方法,
生成所述经变换及量化后的信息的步骤,包括:
基于图像特性的纹理复杂度区间,对所述残差图像进行变换及量化的步骤,
所述调整的步骤,包括:
调整对于所述纹理复杂度区间的权重的步骤。
4.根据权利要求1所述的基于CNN的环路滤波器学习方法,
生成所述经变换及量化后的信息的步骤,包括:
基于图像特性的运动复杂度区间对所述残差图像进行变换及量化的步骤,
所述调整的步骤,包括:
调整对于所述运动复杂度区间的权重的步骤。
5.根据权利要求1所述的基于CNN的环路滤波器学习方法,
生成所述重建信息的步骤,包括:
通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,所述预测信息是初始重建块,所述初始重建块为预测块及重建残差块相加,
所述重建信息体现的是重建图像信息。
6.根据权利要求5所述的基于CNN的环路滤波器学习方法,
通过将所述预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,还包括:
对所述预测信息在输入至所述基于CNN的环路滤波器之前执行另外的环路滤波生成二次重建块的步骤,其中输入至所述基于CNN的环路滤波器的所述预测信息是二次重建块。
7.根据权利要求1所述的基于CNN的环路滤波器学习方法,
生成所述重建信息的步骤,包括:
通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,所述预测信息是重建残差块,
所述重建信息体现的是重建残差信息。
8.根据权利要求7所述的基于CNN的环路滤波器学习方法,
通过将所述预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息的步骤,包括:
对所述预测信息在输入至所述基于CNN的环路滤波器之前执行另外的环路滤波生成二次重建残差块的步骤,其中输入至所述基于CNN的环路滤波器的所述预测信息是二次重建残差块。
9.一种编码装置,包括:
变换及量化部,通过对相当于原始图像与预测图像之间的差异的残差图像执行变换及量化,从而生成经变换及量化后的信息;
反量化及反变换部,通过对所述经变换及量化后的信息执行反量化及反变换而生成经反量化及反变换后的信息;
预测部,基于所述原始图像与重建信息生成所述预测图像;
基于CNN的环路滤波器,输入所述经反量化及反变换后的信息与所述预测图像,从而输出所述重建信息;以及
编码部,基于所述经变换及量化后的信息与所述预测图像信息执行编码,
其中,基于CNN的环路滤波器的权重与基于CNN的环路滤波器的各层之间的多个连接权重有关,所述权重被确定为最小化训练期间的一个或多个预定损失函数,所述权重根据以下至少一个获得:畸变值区间、纹理复杂度区间、运动复杂度区间、切片类型、编码分层水平、编码模式以及邻居编码块。
10.根据权利要求9所述的编码装置,
所述重建信息体现的是重建图像信息,
所述基于CNN的环路滤波器,通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息,所述预测信息是初始重建块,所述初始重建块为预测块及重建残差块相加。
11.根据权利要求10所述的编码装置,还包括:
对所述预测信息在输入至所述基于CNN的环路滤波器之前执行与基于CNN的环路滤波不同的另外环路滤波生成二次重建块的另外环路滤波器,其中输入至所述基于CNN的环路滤波器的所述预测信息是二次重建块。
12.根据权利要求11所述的编码装置,
所述另外环路滤波器,包括:
去区块滤波器、取样自适应偏移滤波器,以及自适应环路滤波器中的至少一个。
13.根据权利要求9所述的编码装置,
所述重建信息体现的是重建残差信息,
所述基于CNN的环路滤波器,通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息,所述预测信息是重建残差块。
14.根据权利要求13所述的编码装置,还包括:
对所述预测信息在输入至所述基于CNN的环路滤波器之前执行与基于CNN的环路滤波不同的另外环路滤波生成二次重建残差块的另外环路滤波器,其中输入至所述基于CNN的环路滤波器的所述预测信息是二次重建残差块。
15.根据权利要求9所述的编码装置,还包括,
对所述重建信息执行与基于CNN的环路滤波不同的另外环路滤波的另外环路滤波器。
16.一种与权利要求9至15中任一项所述的编码装置配合使用的解码装置,包括:
熵解码部,对编码的比特流信息进行解码从而输出经变换及量化后的信息与待预测信息;
反量化及反变换部,通过对所述经变换及量化后的信息执行反量化及反变换而生成经反量化及反变换后的信息;
预测部,基于所述待预测信息生成预测图像;以及
基于CNN的环路滤波器,输入所述经反量化及反变换后的信息与所述预测图像,从而输出重建信息。
17.根据权利要求16所述的解码装置,
所述重建信息体现的是重建图像信息,
所述基于CNN的环路滤波器,通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息,所述预测信息是初始重建块,所述初始重建块为预测块及重建残差块相加。
18.根据权利要求17所述的解码装置,还包括:
对所述经反量化及反变换后的信息执行与基于CNN的环路滤波不同的另外环路滤波的另外环路滤波器。
19.根据权利要求18所述的解码装置,
所述另外环路滤波器,包括:
去区块滤波器、取样自适应偏移滤波器,以及自适应环路滤波器中的至少一个。
20.根据权利要求16所述的解码装置,
所述重建信息体现的是重建残差信息,
所述基于CNN的环路滤波器,通过将预测信息输入至所述基于CNN的环路滤波器,从而生成重建信息,所述预测信息是重建残差块。
21.根据权利要求20所述的解码装置,还包括:
对所述经反量化及反变换后的信息执行与基于CNN的环路滤波不同的另外环路滤波的另外环路滤波器。
22.根据权利要求21所述的解码装置,
所述另外环路滤波器,包括:
去区块滤波器、取样自适应偏移滤波器,以及自适应环路滤波器中的至少一个。
23.根据权利要求16所述的解码装置,
所述重建信息体现的是重建残差信息,
所述基于CNN的环路滤波器,通过将所述经反量化及反变换后的信息输入至所述基于CNN的环路滤波器,从而生成残差重建信息。
24.根据权利要求23所述的解码装置,还包括:
对所述残差重建信息与所述预测图像进行相加而生成最终重建信息的加法器。
25.根据权利要求24所述的解码装置,还包括:
对所述最终重建信息执行与基于CNN的环路滤波不同的另外环路滤波的另外环路滤波器。
26.根据权利要求25所述的解码装置,
所述另外环路滤波器,包括:
去区块滤波器、取样自适应偏移滤波器,以及自适应环路滤波器中的至少一个。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0079240 | 2016-06-24 | ||
KR20160079240 | 2016-06-24 | ||
KR1020170017959A KR101974261B1 (ko) | 2016-06-24 | 2017-02-09 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
KR10-2017-0017959 | 2017-02-09 | ||
PCT/KR2017/001512 WO2017222140A1 (ko) | 2016-06-24 | 2017-02-13 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109644268A CN109644268A (zh) | 2019-04-16 |
CN109644268B true CN109644268B (zh) | 2022-03-08 |
Family
ID=60998313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780051305.7A Active CN109644268B (zh) | 2016-06-24 | 2017-02-13 | 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置 |
Country Status (4)
Country | Link |
---|---|
US (3) | US11095887B2 (zh) |
JP (1) | JP6761490B2 (zh) |
KR (1) | KR101974261B1 (zh) |
CN (1) | CN109644268B (zh) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932697B (zh) * | 2017-05-26 | 2020-01-17 | 杭州海康威视数字技术股份有限公司 | 一种失真图像的去失真方法、装置及电子设备 |
US11190784B2 (en) | 2017-07-06 | 2021-11-30 | Samsung Electronics Co., Ltd. | Method for encoding/decoding image and device therefor |
CA3066204C (en) * | 2017-07-07 | 2022-04-26 | Mitsubishi Electric Corporation | Data processing device, data processing method, and non-transitory computer-readable storage medium |
US10979718B2 (en) | 2017-09-01 | 2021-04-13 | Apple Inc. | Machine learning video processing systems and methods |
WO2019118539A1 (en) * | 2017-12-14 | 2019-06-20 | Interdigital Vc Holdings, Inc. | Deep learning based image partitioning for video compression |
KR102017998B1 (ko) | 2018-01-16 | 2019-09-03 | 한국과학기술원 | 이미지 파이프라인 처리 방법 및 장치 |
AU2018357828A1 (en) * | 2018-01-16 | 2019-08-01 | Korea Advanced Institute Of Science And Technology | Method and apparatus for super-resolution using line unit operation |
WO2019143027A1 (ko) | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 이미지 파이프라인 처리 방법 및 장치 |
WO2019143026A1 (ko) | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 특징맵 압축을 이용한 이미지 처리 방법 및 장치 |
WO2019143025A1 (ko) * | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 라인 입력 및 출력을 이용한 이미지 처리 방법 및 장치 |
US11265540B2 (en) * | 2018-02-23 | 2022-03-01 | Sk Telecom Co., Ltd. | Apparatus and method for applying artificial neural network to image encoding or decoding |
WO2019194425A1 (ko) * | 2018-04-06 | 2019-10-10 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화에 인공 신경망을 적용하는 장치 및 방법 |
US20190289327A1 (en) * | 2018-03-13 | 2019-09-19 | Mediatek Inc. | Method and Apparatus of Loop Filtering for VR360 Videos |
US11393160B2 (en) * | 2018-03-23 | 2022-07-19 | Intel Corporation | Deep geometric model fitting |
WO2019194460A1 (ko) * | 2018-04-01 | 2019-10-10 | 엘지전자 주식회사 | 컨벌루션 뉴럴 네트워크를 이용한 영상 코딩 방법 및 그 장치 |
KR102067340B1 (ko) * | 2018-07-16 | 2020-01-16 | 한국과학기술원 | 유방암 병변 특성에 따른 유방 종괴 생성 방법 및 그 시스템 |
KR102525578B1 (ko) | 2018-10-19 | 2023-04-26 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
WO2020080873A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Method and apparatus for streaming data |
US11720997B2 (en) | 2018-10-19 | 2023-08-08 | Samsung Electronics Co.. Ltd. | Artificial intelligence (AI) encoding device and operating method thereof and AI decoding device and operating method thereof |
WO2020080827A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Ai encoding apparatus and operation method of the same, and ai decoding apparatus and operation method of the same |
WO2020080665A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image |
WO2020080623A1 (ko) | 2018-10-19 | 2020-04-23 | 삼성전자 주식회사 | 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
WO2020080698A1 (ko) | 2018-10-19 | 2020-04-23 | 삼성전자 주식회사 | 영상의 주관적 품질을 평가하는 방법 및 장치 |
WO2020080765A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image |
CN111105357B (zh) * | 2018-10-25 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 一种失真图像的去失真方法、装置及电子设备 |
KR102621118B1 (ko) * | 2018-11-01 | 2024-01-04 | 삼성전자주식회사 | 영상 적응적 양자화 테이블을 이용한 영상의 부호화 장치 및 방법 |
KR102013777B1 (ko) | 2018-12-12 | 2019-10-21 | 한국과학기술정보연구원 | 동영상 왜곡 복원 방법 및 이를 적용한 장치 |
KR102212442B1 (ko) * | 2018-12-13 | 2021-02-04 | 주식회사 픽스트리 | 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 |
KR102192980B1 (ko) * | 2018-12-13 | 2020-12-18 | 주식회사 픽스트리 | 기계 학습 기반으로 파라미터를 학습하는 영상 처리 장치 및 동작 방법 |
CN109982092B (zh) * | 2019-04-28 | 2022-11-01 | 华侨大学 | 基于多分支循环卷积神经网络的hevc帧间快速方法 |
JP7318314B2 (ja) * | 2019-05-30 | 2023-08-01 | 富士通株式会社 | 符号化プログラム、復号プログラム、符号化装置、復号装置、符号化方法及び復号方法 |
WO2020242260A1 (ko) * | 2019-05-31 | 2020-12-03 | 한국전자통신연구원 | 전역적 문맥을 이용하는 기계 학습 기반의 이미지 압축을 위한 방법 및 장치 |
US11521074B2 (en) * | 2019-05-31 | 2022-12-06 | Carnegie Mellon University | Flexible, lightweight quantized deep neural networks |
KR20210004702A (ko) | 2019-07-05 | 2021-01-13 | 삼성전자주식회사 | Ai 프로세서 및 이의 신경망 연산 수행 방법 |
CN112422993B (zh) * | 2019-08-21 | 2021-12-03 | 四川大学 | 一种结合卷积神经网络的hevc视频质量增强方法 |
CN110798690B (zh) * | 2019-08-23 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 视频解码方法、环路滤波模型的训练方法、装置和设备 |
KR102436512B1 (ko) | 2019-10-29 | 2022-08-25 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
KR20210056179A (ko) | 2019-11-08 | 2021-05-18 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
CN114731455A (zh) | 2019-11-20 | 2022-07-08 | 三星电子株式会社 | 使用与图像质量相关的ai元数据的设备和方法 |
US20230008124A1 (en) * | 2019-12-11 | 2023-01-12 | Korea Electronics Technology Institute | Method and device for encoding/decoding deep neural network model |
US20210264239A1 (en) * | 2020-02-20 | 2021-08-26 | Tencent America LLC | Method and apparatus for neural network optimized matrix-matrix multiplication (nnmm) |
US11496775B2 (en) * | 2020-02-20 | 2022-11-08 | Tencent America LLC | Neural network model compression with selective structured weight unification |
KR102287942B1 (ko) | 2020-02-24 | 2021-08-09 | 삼성전자주식회사 | 전처리를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
CN111314698A (zh) * | 2020-02-27 | 2020-06-19 | 浙江大华技术股份有限公司 | 一种图像编码处理方法及装置 |
KR20210127412A (ko) | 2020-04-14 | 2021-10-22 | 삼성전자주식회사 | Ai 다운스케일 장치 및 그 동작방법, 및 ai 업스케일 장치 및 그 동작방법 |
CN111741300B (zh) * | 2020-05-28 | 2023-03-07 | 杭州师范大学 | 一种视频处理方法 |
CN113766249B (zh) * | 2020-06-01 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 视频编解码中的环路滤波方法、装置、设备及存储介质 |
CN115943629A (zh) * | 2020-06-04 | 2023-04-07 | 交互数字Vc控股法国有限公司 | 视频编码中基于神经网络的滤波器 |
US11334967B2 (en) * | 2020-07-30 | 2022-05-17 | Novatek Microelectronics Corp. | Method and image processing device for generating image filter |
CN112422989B (zh) * | 2020-11-17 | 2023-06-09 | 杭州师范大学 | 一种视频编码方法 |
CN114868390A (zh) * | 2020-12-04 | 2022-08-05 | 深圳市大疆创新科技有限公司 | 视频编码方法、解码方法、编码器、解码器以及ai加速器 |
US20220191482A1 (en) * | 2020-12-16 | 2022-06-16 | Tencent America LLC | Method and apparatus for video coding |
US11490085B2 (en) | 2021-01-14 | 2022-11-01 | Tencent America LLC | Model sharing by masked neural network for loop filter with quality inputs |
EP4064133A3 (en) * | 2021-03-24 | 2022-12-28 | Samsung Electronics Co., Ltd. | Method for optimising a machine learning model for image processing |
US20220383554A1 (en) | 2021-05-18 | 2022-12-01 | Tencent America LLC | Substitutional quality factor learning for quality-adaptive neural network-based loop filter |
CN113497941A (zh) * | 2021-06-30 | 2021-10-12 | 浙江大华技术股份有限公司 | 图像滤波方法、编码方法及相关设备 |
WO2023022376A1 (ko) * | 2021-08-17 | 2023-02-23 | 현대자동차주식회사 | 개선된 인루프 필터를 이용하는 비디오 코딩방법 및 장치 |
WO2023080464A1 (ko) * | 2021-11-05 | 2023-05-11 | 삼성전자 주식회사 | Ai 기반 필터링을 위한 영상 처리 방법 및 장치 |
CN115209147B (zh) * | 2022-09-15 | 2022-12-27 | 深圳沛喆微电子有限公司 | 摄像头视频传输带宽优化方法、装置、设备及存储介质 |
CN117834864A (zh) * | 2022-09-27 | 2024-04-05 | 中兴通讯股份有限公司 | 一种视频编解码环路滤波方法、视频解码方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5825646A (en) * | 1993-03-02 | 1998-10-20 | Pavilion Technologies, Inc. | Method and apparatus for determining the sensitivity of inputs to a neural network on output parameters |
CN103460699A (zh) * | 2011-03-30 | 2013-12-18 | Lg电子株式会社 | 环路滤波方法及其设备 |
CN104811276A (zh) * | 2015-05-04 | 2015-07-29 | 东南大学 | 一种超奈奎斯特速率通信的dl-cnn解调器 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2788811B2 (ja) * | 1992-01-10 | 1998-08-20 | シャープ株式会社 | ブロック歪補正器 |
US5461699A (en) * | 1993-10-25 | 1995-10-24 | International Business Machines Corporation | Forecasting using a neural network and a statistical forecast |
CN101779464B (zh) * | 2007-06-08 | 2014-02-12 | 汤姆森特许公司 | 多格点基于稀疏性滤波基础上环内去伪像滤波方法和装置 |
CA2638465A1 (en) * | 2007-08-01 | 2009-02-01 | Jean-Yves Chouinard | Learning filters for enhancing the quality of block coded still and video images |
JP2009111691A (ja) * | 2007-10-30 | 2009-05-21 | Hitachi Ltd | 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 |
CN102090062B (zh) | 2008-04-11 | 2013-12-11 | 汤姆森特许公司 | 用于位移帧内预测和模板匹配的去块滤波 |
US8311111B2 (en) * | 2008-09-11 | 2012-11-13 | Google Inc. | System and method for decoding using parallel processing |
US9479786B2 (en) * | 2008-09-26 | 2016-10-25 | Dolby Laboratories Licensing Corporation | Complexity allocation for video and image coding applications |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
JP5597968B2 (ja) | 2009-07-01 | 2014-10-01 | ソニー株式会社 | 画像処理装置および方法、プログラム、並びに記録媒体 |
CN102792690B (zh) * | 2010-03-09 | 2016-06-15 | 汤姆森特许公司 | 基于分类环路滤波器的方法和装置 |
US9015093B1 (en) * | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
KR101215152B1 (ko) * | 2011-04-21 | 2012-12-24 | 한양대학교 산학협력단 | 인루프 필터링을 적용한 예측 방법을 이용한 영상 부호화/복호화 방법 및 장치 |
AU2013403224B2 (en) | 2013-10-14 | 2018-10-18 | Microsoft Technology Licensing, Llc | Features of intra block copy prediction mode for video and image coding and decoding |
KR101768865B1 (ko) | 2014-06-19 | 2017-08-18 | 에스케이텔레콤 주식회사 | 가중치예측을 이용한 영상 부호화/복호화 방법 및 장치 |
KR102276854B1 (ko) | 2014-07-31 | 2021-07-13 | 삼성전자주식회사 | 인루프 필터 파라미터 예측을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
US9563825B2 (en) * | 2014-11-20 | 2017-02-07 | Adobe Systems Incorporated | Convolutional neural network using a binarized convolution layer |
KR102276339B1 (ko) | 2014-12-09 | 2021-07-12 | 삼성전자주식회사 | Cnn의 근사화를 위한 학습 장치 및 방법 |
CN105611303B (zh) * | 2016-03-07 | 2019-04-09 | 京东方科技集团股份有限公司 | 图像压缩系统、解压缩系统、训练方法和装置、显示装置 |
WO2018053340A1 (en) * | 2016-09-15 | 2018-03-22 | Twitter, Inc. | Super resolution using a generative adversarial network |
-
2017
- 2017-02-09 KR KR1020170017959A patent/KR101974261B1/ko active IP Right Grant
- 2017-02-13 US US16/313,052 patent/US11095887B2/en active Active
- 2017-02-13 CN CN201780051305.7A patent/CN109644268B/zh active Active
- 2017-02-13 JP JP2018567746A patent/JP6761490B2/ja active Active
-
2021
- 2021-07-15 US US17/376,162 patent/US11627316B2/en active Active
-
2022
- 2022-12-26 US US18/088,615 patent/US20230134212A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5825646A (en) * | 1993-03-02 | 1998-10-20 | Pavilion Technologies, Inc. | Method and apparatus for determining the sensitivity of inputs to a neural network on output parameters |
CN103460699A (zh) * | 2011-03-30 | 2013-12-18 | Lg电子株式会社 | 环路滤波方法及其设备 |
CN104811276A (zh) * | 2015-05-04 | 2015-07-29 | 东南大学 | 一种超奈奎斯特速率通信的dl-cnn解调器 |
Non-Patent Citations (1)
Title |
---|
《Compression Artifacts Reduction by a Deep Convolutional Network》;Chao Dong,等;《2015 IEEE International Conference on Computer Vision》;20160218;第2-3部分,第577-580页 * |
Also Published As
Publication number | Publication date |
---|---|
US20230134212A1 (en) | 2023-05-04 |
US11095887B2 (en) | 2021-08-17 |
US11627316B2 (en) | 2023-04-11 |
JP2019525544A (ja) | 2019-09-05 |
CN109644268A (zh) | 2019-04-16 |
KR101974261B1 (ko) | 2019-04-30 |
KR20180001428A (ko) | 2018-01-04 |
US20190230354A1 (en) | 2019-07-25 |
US20210344916A1 (en) | 2021-11-04 |
JP6761490B2 (ja) | 2020-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109644268B (zh) | 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置 | |
CN104041035B (zh) | 用于复合视频的无损编码及相关信号表示方法 | |
EP2774360B1 (en) | Differential pulse code modulation intra prediction for high efficiency video coding | |
TW201813383A (zh) | 視訊編碼方法和設備和相關的視訊解碼方法和設備 | |
CN111819852A (zh) | 用于变换域中残差符号预测的方法及装置 | |
CN104205843A (zh) | Hevc中无损编码中的改进帧内预测 | |
US20150063452A1 (en) | High efficiency video coding (hevc) intra prediction encoding apparatus and method | |
CN103782598A (zh) | 用于无损编码的快速编码方法 | |
CN113508592A (zh) | 编码器、解码器及相应的帧间预测方法 | |
EP3711302B1 (en) | Spatially adaptive quantization-aware deblocking filter | |
KR101587927B1 (ko) | 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치 | |
CN112385227A (zh) | 用于帧内预测的方法和装置 | |
KR20220038710A (ko) | 비디오 코딩 방법 및 장치 | |
KR102138650B1 (ko) | 디지털 이미지의 블록을 처리하는 시스템 및 방법 | |
KR102276914B1 (ko) | 비디오 인코딩 장치 그리고 이의 구동 방법 | |
KR20140124448A (ko) | 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치 | |
JP2024026818A (ja) | ビデオコーディングのための方法および装置 | |
CN116349225A (zh) | 用于逐块图像压缩中的去块的内容自适应在线训练方法和装置 | |
KR20170125154A (ko) | 곡선 화면 내 예측을 사용하는 비디오 복호화 방법 및 장치 | |
JP2023513772A (ja) | ビデオコーディングのための方法、装置およびコンピュータプログラム | |
JP7279084B2 (ja) | イントラ予測のための方法及び装置 | |
KR101911587B1 (ko) | 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법 | |
EP2938074A1 (en) | Methods for encoding and decoding a picture and corresponding devices | |
KR20160014082A (ko) | 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치 | |
KR102492073B1 (ko) | 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |