CN113573053A

CN113573053A - 视频编解码设备、方法和计算机可读记录介质

Info

Publication number: CN113573053A
Application number: CN202110756935.2A
Authority: CN
Inventors: 韩钟基; 李在荣
Original assignee: Intellectual Discovery Co Ltd
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2015-01-13
Filing date: 2016-01-11
Publication date: 2021-10-29
Anticipated expiration: 2036-01-11
Also published as: KR102349788B1; US20180278952A1; CN113573054B; CN113573054A; KR20220155972A; KR20230106577A; CN107211123A; CN113573052A; CN113573051A; CN113573052B; US20240073444A1; KR20220009473A; KR102554364B1; CN107211123B; CN113573053B; CN113573051B; WO2016114539A1; KR20160087208A; KR102468243B1

Abstract

公开了视频编解码设备、方法和计算机可读记录介质。视频编码设备包括：比特流生成单元、运动预测单元、运动矢量编码单元、差分信号生成单元。其中，差分信号被变换、量化和熵编码到比特流中，其中，差分信号是基于DCT进行变换的，其中，运动矢量编码单元被配置为，当要编码的目标块的运动矢量的分辨率是整像素分辨率时，利用要编码的目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将相邻块的运动矢量映射到对应于整像素单元中的值的值，以及其中，运动矢量编码单元通过从相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行相邻块的运动矢量的映射。

Description

视频编解码设备、方法和计算机可读记录介质

本申请是申请日为2016年1月11日、申请号为201680005689.4、发明名称为“用于编码和解码图像的方法和设备”的发明专利申请的分案申请。

技术领域

本发明一般涉及视频编码/解码方法和设备，更具体地，涉及可以更有效地处理诸如屏幕内容的人工创建的图像的视频编码/解码方法和设备。

背景技术

近来，随着无线通信带宽的扩大，以及移动设备性能的提高，提供了各种类型的多媒体服务。特别是，各种类型视频服务得到了增长，并且基于通过计算机图形软件等人工创建的视频内容的服务，以及基于摄像机拍摄的图像的视频服务也逐渐占据了其较大部分。在下文中，将人工创建的视频内容定义为“屏幕内容(screen content)”。与典型的自然图像不同，屏幕内容具有有限的色差信号范围、具有相对低的噪声、并且具有与具有高色彩饱和度的自然图像不同的特征。同时，本发明中定义的“屏幕内容”还指屏幕内容与典型自然图像组合的形式，以及整个视频由屏幕内容组成的情况。

这样的屏幕内容的示例可以包括电子学习内容、游戏广播内容或家庭购物内容。作为电子学习内容的示例，可以考虑其中教育内容仅由文本指示的用户界面的形式，或者将自然图像以帧的形式提供插入到用户界面中的形式，并且这种类型的内容可以是屏幕内容的示例。

这样的屏幕内容特征在于，与自然图像不同，可以为每个像素清楚地识别表示对象边界的部分。也就是说，与典型的自然图像不同，对于每个子像素，将出现对象的运动会的可能性很小。

因此，当在编码/解码处理中考虑到这种屏幕内容特征时，预期编码/解码效率将进一步提高。

关于此，韩国专利申请公开第10-2013-0078569号(题为“基于兴趣区域的屏幕内容质量改进视频编码/解码方法及其设备”)公开了一种确定主要感兴趣区域(Region ofInterest RoI)的方法，考虑到输入屏幕内容视频的特点，将主要ROI反映到视频编码过程中，并将更多信息分配给主要ROI，从而提高主观视频质量。

同时，由运动图像专家组(Moving Picture Experts Group MPEG)和视频编码专家组(Video Coding Experts Group VCEG)组织的视频编码联合协作小组(JointCollaborative Team on Video Coding JCT-VC)最近开发了一种用于屏幕内容编码的高效视频编码(High Efficiency Video Coding HEVC)扩展。在屏幕内容编码(ScreenContent Coding SCC)标准中，正在讨论用于基于HEVC的屏幕内容视频的有效编码的各种方法。

发明内容

技术问题

本发明考虑了现有技术中出现的上述问题，本发明的目的是提供一种视频编码/解码方法和设备，其可以根据是否包括屏幕内容视频而不同地设置运动矢量的分辨率。

然而，本实施例要实现的技术目的不限于上述技术目的，并且可能存在其他技术目的。

技术方案

为了实现上述目的，根据本发明的第一方面的视频编码方法包括：生成报头信息，其包括关于基于单元图像的运动预测确定的各个块的运动矢量的分辨率的信息。这里，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息。

此外，根据本发明的第二方面的视频解码方法包括从包括在要解码的目标比特流中的报头信息中提取关于每个单元图像的运动矢量的分辨率的信息；以及解码单元，用于基于分辨率信息对单元图像进行解码。这里，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素(integer-pixel)分辨率的标志信息。

此外，根据本发明第三方面的视频编码设备包括比特流生成单元，用于在比特流的报头信息中包括基于单元图像的运动预测确定的关于各个块的运动矢量的分辨率的信息。这里，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息。

此外，根据本发明的第四方面的视频解码设备包括解析单元，用于从包括在要解码的目标比特流中的报头信息中，提取关于每个单元图像的运动矢量的分辨率的信息，以及解码单元，用于基于分辨率信息解码单元图像，其中报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息。

此外，根据本发明第五方面公开了一种使用运动矢量分辨率缩放的视频编码设备，其包括：比特流生成单元，用于在比特流的报头信息中包括关于基于单元图像的运动预测确定的各个块的运动矢量的分辨率的信息；运动预测单元，用于基于每个块在单元图像上执行运动预测以生成目标块的预测块；和运动矢量编码单元，用于编码在运动预测过程中针对各个块确定的运动矢量，差分信号生成单元，用于使用目标块和预测块来生成差分信号，其中，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息，其中，差分信号被变换、量化和熵编码到比特流中，其中，差分信号是基于DCT进行变换的，其中，运动矢量编码单元被配置为，当要编码的目标块的运动矢量的分辨率是整像素分辨率时，利用要编码的目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将相邻块的运动矢量映射到对应于整像素单元中的值的值，以及其中，运动矢量编码单元通过从相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行相邻块的运动矢量的映射。

此外，根据本发明第六方面公开了一种使用运动矢量分辨率缩放的视频解码设备，其包括：解析单元，用于从包括在要解码的目标比特流中的报头信息中提取关于每个单元图像的运动矢量的分辨率的信息；和解码单元，用于基于分辨率信息解码单元图像，其中，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息，其中，解码单元基于预测块与原始块之间的差分信号和运动矢量来重构目标块，其中，差分信号是通过对关于包括在比特流中的差分信号的信息执行熵解码、逆量化和逆变换而获得的，其中，逆变换是基于DCT执行的，其中，解码单元被配置为，当标志信息指示要解码的目标块的运动矢量的分辨率是整像素分辨率时，利用要解码的目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将相邻块的运动矢量映射到对应于整像素单元中的值的值，以及其中，解码单元通过从相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行相邻块的运动矢量的映射。

此外，本发明第七方面公开了一种存储由视频编码设备生成的比特流的计算机可读记录介质，该设备包括：比特流生成单元，用于在比特流的报头信息中包括关于基于单元图像的运动预测确定的各个块的运动矢量的分辨率的信息；运动预测单元，用于基于每个块在单元图像上执行运动预测以生成目标块的预测块；和运动矢量编码单元，用于编码在运动预测过程中针对各个块确定的运动矢量，差分信号生成单元，用于使用目标块和预测块来生成差分信号，其中，报头信息包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息，其中，差分信号被变换、量化和熵编码到比特流中，其中，差分信号是基于DCT进行变换的，其中，运动矢量编码单元被配置为，当要编码的目标块的运动矢量的分辨率是整像素分辨率时，利用要编码的目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将相邻块的运动矢量映射到对应于整像素单元中的值的值，以及其中，运动矢量编码单元通过从相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行相邻块的运动矢量的映射。

此外，本发明第八方面公开了一种使用运动矢量分辨率缩放的视频解码方法，其包括：从比特流中解析关于目标块的运动矢量的运动矢量分辨率的信息；基于相邻块的运动矢量和关于运动矢量分辨率的信息导出目标块的运动矢量；基于目标块的运动矢量生成目标块的预测块；和基于预测块以及目标块的差分块来重构目标块，其中，当关于运动矢量分辨率的信息指示要解码的目标块的运动矢量的分辨率是整像素分辨率时，相邻块的运动矢量是通过从子像素单元中的相邻块的运动矢量的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值来更新的，其中，差分块是通过对关于包括在比特流中的差分信号的信息执行熵解码、逆量化和逆变换而获得的，其中，逆变换是基于DCT执行的。

此外，本发明第九方面公开了一种使用运动矢量分辨率缩放的视频编码方法，其包括：识别目标块的运动矢量的运动矢量分辨率，关于运动矢量分辨率的信息被编码到比特流中；基于相邻块的运动矢量和关于运动矢量分辨率的信息对目标块的运动矢量进行编码；基于目标块和目标块的预测块来生成差分块，预测块是基于目标块的运动矢量生成的；和将差分块编码到比特流中，其中，当关于运动矢量分辨率的信息指示要编码的目标块的运动矢量的分辨率是整像素分辨率时，相邻块的运动矢量是通过从子像素单元中的相邻块的运动矢量的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值来更新的，其中，通过对差分块执行变换、量化和熵编码，将差分块编码到比特流中，其中，变换是基于DCT执行的。

此外，本发明第十方面公开了一种存储由使用运动矢量分辨率缩放的视频编码方法生成的比特流的计算机可读记录介质，该方法包括：识别目标块的运动矢量的运动矢量分辨率，关于运动矢量分辨率的信息被编码到比特流中；基于相邻块的运动矢量和关于运动矢量分辨率的信息对目标块的运动矢量进行编码；基于目标块和目标块的预测块来生成差分块，预测块是基于目标块的运动矢量生成的；和将差分块编码到比特流中，其中，当关于运动矢量分辨率的信息指示要编码的目标块的运动矢量的分辨率是整像素分辨率时，相邻块的运动矢量是通过从子像素单元中的相邻块的运动矢量的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值来更新的，其中，通过对差分块执行变换、量化和熵编码，将差分块编码到比特流中，其中，变换是基于DCT执行的。

有益效果

根据本发明的技术方案，可以将运动矢量的分辨率设置为包括屏幕内容的图像的整像素分辨率，从而提高视频编码处理和视频解码处理的效率。

附图说明

图1是示出在本发明中提出的屏幕内容特征的图；

图2是示出根据本发明实施例的视频编码设备的配置的方框图；

图3是示出用于本发明实施例的运动矢量编码的图；

图4是示出根据本发明实施例的视频编码设备中使用的语法结构的图；

图5是示出根据本发明实施例的在视频编码设备中的处理屏幕内容的方法的图；

图6是示出根据本发明实施例的视频编码设备中使用的语法结构的图；

图7是示出根据本发明实施例的在运动矢量编码处理中使用当前块的运动矢量和相邻块的运动矢量的运动矢量预测处理的图；

图8是示出根据本发明实施例的视频编码设备的详细配置的图；

图9是示出根据本发明实施例的视频解码设备的配置的方框图；和

图10是示出根据本发明实施例的视频解码设备的详细配置的图。

具体实施例

参照附图描述本发明的实施例，以便详细描述本发明，使得在本发明所属技术领域具有普遍知识的人可以容易地实施本发明。然而，本发明可以以各种形式实现，并且不受以下实施例的限制。在附图中，为了清楚地描述本发明，将省略与本发明不直接相关的部件的图示，并且在所有附图中使用相同的附图标记来指示相同或相似的部件。

此外，在整个说明书中，应当理解，表示第一组件“连接(connected)”到第二组件的表示可以包括第一组件与第二组件电连接的情况，其间插入一些其它部件，还可以包括第一组件“直接连接(directly connected)”到第二组件的情况。

此外，为了表示不同的且特有的功能，独立地示出了在本发明实施例中描述的部件单元，但这并不意味着每个部件单元由单独的硬件或软件组成。也就是说，为了便于描述，所布置和包括的部件单元是为了便于描述，并且部件单元中的至少两个可以形成一个部件单元，或者一个部件单元可以被分成多个部件单元以执行其自己的功能。部件单元集成的实施例和部件单元分离的实施例包括在本发明的范围内，除非其脱离了本发明的实质。

图1是示出在本发明中提出的屏幕内容特征的图。

如上所述，屏幕内容特征在于，与自然图像不同，可以为每个像素清楚地识别指示对象的边界的部分。也就是说，在图1左侧示出的屏幕内容图像中，对于每个整像素，对象的边界被清楚地识别，然而，在其右侧示出的典型自然图像中，对于每个子像素，存在将发生对象的运动的可能性很大。本发明旨在利用这种屏幕内容特征来进行编码/解码过程。

图2是示出根据本发明实施例的视频编码设备的配置的方框图。

视频编码设备100包括用于执行运动预测的运动预测单元110，运动矢量编码单元120和用于生成包括关于各个块的运动矢量的分辨率的信息的比特流的比特流生成单元130。

在帧间预测过程中，运动预测单元110从参考图像中搜索与当前编码对象块最相似的预测块。这里，在屏幕内容的情况下，根据图像的特性以每个整像素(per-integer-pixel)为基础执行运动预测。因此，在屏幕内容的情况下，基于运动预测选择的指示预测块的运动矢量的分辨率，也以每个整像素为基础确定。在典型的视频压缩过程中，基于每个子像素(per-sub-pixel)执行运动预测，例如半像素(half-pixel)单元或1/4像素(1/4-pixel)单元以及整像素单元。相反，在屏幕内容中，基于每个整像素执行运动预测，因此可以提高编码效率。

同时，对单元图像执行这样的运动预测，并且这样的单元图像可以是基于片(slice-based)的单元图像、基于图片(picture-based)的单元图像或基于序列(sequence-based)的单元图像。

运动矢量编码单元120对由运动预测单元110确定的每个块的运动矢量编码。为此，使用关于相邻块的运动矢量的信息生成要编码的目标块的预测运动矢量(PMV)，并且编码预测运动矢量与当前编码的目标块的运动矢量之间的差值。这里，当应用诸如整数单元的基于单元的低分辨率时，可以减少用于编码运动矢量的比特数。当应用诸如半像素、1/4像素或1/8像素的子像素分辨率时，编码运动矢量所需的比特数增加。这将参照附图更详细地描述。

图3是示出用于本发明实施例的运动矢量编码的图。

运动矢量编码单元120可以使用诸如一阶指数Golomb码(first-orderexponential-Golomb code)的编码方案，以便对差分运动矢量编码。例如，图3中的(a)中示出了对应用1/4像素分辨率的运动矢量编码所需的码本的示例，以及图3中的(b)示出了对应用整像素分辨率的运动矢量编码所需的码本的示例。借助于这些码本，可以看出，用于编码的码字的长度根据分辨率彼此不同。

例如，当应用1/4像素分辨率时，如果差分运动矢量是(3，2)，则将具有代码编号“23”的“000011000”的比特流用于编码“3”，并且将具有代码编号“15”的“000010000”比特流用于编码“2”。相反，当应用整像素分辨率时，如果差分运动矢量是(3,2)，则使用具有代码编号为“5”的比特流和具有代码编号为“3”的比特流，因此大大地提高编码效率。

以这种方式，使用长码字对小幅度的运动矢量编码的原因在于，需要对具有1/2像素分辨率和1/4像素分辨率的运动矢量编码的码字，以及需要对具有整像素分辨率的运动矢量编码的码字，两者要一起使用。在此背景下，在屏幕内容中，以每个整像素为基础确定运动矢量，从而可以提高编码效率。

比特流生成单元130可以从数据生成比特流，该数据是基于根据视频压缩标准设置的语法结构，从通过帧间预测、帧内预测、频率变换、量化和熵编码过程输出的。

此外，比特流生成单元130通过将关于基于运动预测确定的每个块的运动矢量的分辨率的信息包括在比特流的报头信息中来生成比特流。

这里，报头信息包括指示包括在单元图像中的所有5个运动向量的分辨率是否是整像素单元的标志信息。例如，当单元图像是屏幕内容时，图像的所有运动矢量都是整像素单元，因此生成表示该状态的标志。用于接收这样的比特流的视频解码单元响应于相应的标志在每个整像素的基础上执行解码，从而提高解码效率。

此外，比特流生成单元130通过在比特流中包括关于由运动矢量编码单元120编码的运动矢量的信息来生成比特流。

图4是示出根据本发明实施例的视频编码设备中使用的语法结构的图。

图4示出了对片单元(slice-unit)图像执行运动预测的实施例，并且运动矢量的分辨率信息被记录在片报头上，并且这对应于给出的示例以便于描述。

在本发明中，作为运动预测的结果，当单元图像是屏幕内容时，设置指示运动矢量的分辨率是否为整像素单元的标志Integer_MV_Resolution_flag。例如，当标志的值被设置为“1”时，它表示单元图像的运动矢量的分辨率是整像素单元。

同时，可以附加地设置指示单元图像的每个运动矢量的分辨率是否处于可变状态的标志SCC_AMVR_Enable_flag。相应标志的值设置为1的情况表示单元图像的运动矢量的分辨率处于可变状态，而标志的值被设置为0的情况表示单元图像的运动矢量的分辨率处于不是可变状态。

这里，关于单元图像中的块的运动矢量的分辨率的信息可以包括在片报头，序列报头或图片报头中。

同时，本发明不仅提出了当在单元图像中要编码的所有块对应于屏幕内容图像时，编码并发送与所有块的运动矢量的分辨率有关的信息的技术，还提出了一种方法和设备，当将屏幕内容区域和非屏幕内容区域一起包括在单元图像中时，发送具有包括关于这些区域的信息的报头信息的报头信息。

图5是示出根据本发明实施例的在视频编码设备中的处理屏幕内容的方法的图。

如图示出的，可以考虑单元图像由屏幕内容区域以及包括在单元图像中的一个或多个非屏幕内容区域50和52组成的情况。

以这种方式，当存在非屏幕内容区域，即每个由运动矢量的分辨率不是整像素分辨率的块组成的区域时，比特流生成单元130允许将非屏幕内容区域的数量以及非屏幕内容区域的位置的信息包括在报头信息中。

作为示例，参考图5的情况，非屏幕内容区域的数量为2。此外，非屏幕内容区域的位置信息可以由编码树单元(Coding Tree Unit CTU)块的索引来指定。然而，CTU块可以仅仅是为了方便描述而给出的示例，并且可以通过在视频压缩过程中可用的各种类型的块索引来指定对应的区域。此外，除了块索引之外，根据实施例，可以通过开始块的开始像素的坐标和结束块的结束像素的坐标来指定对应的区域。

图6是示出根据本发明实施例的视频编码设备中使用的语法结构的图。

如图示出的，有关非屏幕内容区域NumNonScreenContentsRegion数量的信息可以包含在报头信息中。

此外，可以包括关于非屏幕内容区域的开始块索引(start_nsc_idx[i])和结束块索引(end_nsc_idx[i])的信息。这里，可以基于开始块索引来计算非屏幕内容区域的左上顶点的坐标值，并且可以基于结束块索引来计算非屏幕内容区域的右下顶点的坐标值。

更具体地，可以使用以下等式1来单独计算左上顶点的水平坐标值(start_nsc_point_x[i])和垂直坐标值(start_nsc_point_y[i])：

[等式1]

start_nsc_point_y[i]＝(start_nsc_idx[i]/PicWidthInCtbsY＜＜log2CtbSize

start_nsc_point_x[i]＝(start_nsc_idx[i]％PicWidthInCtbsY＜＜log2CtbSize

在这种情况下，PictWidthInCtbsY表示通过将图像的水平长度除以CTU的一侧的长度并对结果值而入而获得的值。也就是说，通过将开始块索引除以PictWidthInCtbsY并对其余部分执行移位操作获得的值被设置为水平坐标值(start_nsc_point_x[i])，并且通过将开始块索引除以PictWidthInCtbsY并对商执行移位操作而获得的值被设置为垂直坐标值(start_nsc_point_y[i])。

此外，可以使用以下等式2来单独计算右下顶点的水平坐标值(end_nsc_point_x[i])和垂直坐标值(end_nsc_point_y[i])：

[等式2]

end_nsc_point_y[i]＝CtbSize+(end_nsc_idx[i]/PicWidthInCtbsY＜＜log2CtbSize

end_nsc_point_x[i]＝CtbSize+(end_nsc_idx[i]％PicWidthInCtbsY＜＜log2CtbSize

这里，PictWidthInCtbsY表示通过将图像的水平长度除以CTU的一侧的长度并对结果值而入而获得的值。也就是说，通过将结束块索引除以PictWidthInCtbsY并对其余部分执行移位操作获得的值被添加到与CTU的一侧的长度相对应的值，并且将结果值设置为水平坐标值end_nsc_point_x[i]。通过将结束块索引除以PictWidthInCtbsY并对商执行移位操作而获得的值被添加到与CTU的一侧的长度对应的值，并将结果值设置为垂直坐标值end_nsc_point_y[i]。

同时，在图5和图6中，主要基于屏幕内容中包含非屏幕内容区域的情况进行描述，但是即使在相反的情况下也可以充分地应用本发明。也就是说，可以考虑在非屏幕内容区域中包括一个或多个屏幕内容区域的情况。

在这种情况下，比特流生成单元130允许将关于屏幕内容区域的数量和屏幕内容区域的位置信息的信息包括在报头信息中。

同时，在本发明中，在屏幕内容和非屏幕内容区域一起包含在运动矢量的编码处理中时，可以执行根据每个运动矢量的分辨率来缩放从相邻块提取的运动矢量的预测向量的过程。

图7是示出根据本发明的实施例的运动矢量编码处理期间执行的运动矢量缩放过程的图。

图7中的(a)示出了要编码的目标块不是屏幕内容，并且与要编码的目标块相邻的块是屏幕内容的情况。

在这种情况下，由于相邻块的运动矢量具有整像素分辨率，所以基于运动矢量的预测运动矢量也具有整像素分辨率。然而，由于要编码的目标块的运动矢量具有子像素分辨率，因此当获得差分运动矢量时，需要执行与运动矢量的分辨率单元匹配的缩放。

然后，本发明相对于要编码的目标块的运动矢量来缩放相邻块的运动矢量。

也就是说，相邻块的运动矢量被缩放到子像素单元，并且基于缩放的运动矢量来计算差分运动矢量。例如，当要编码的目标块的运动矢量为1/4像素单元时，相邻块的运动矢量被转换为4n/4像素单元的形式。也就是说，当相邻块的运动矢量为1时，其被缩放为4/4，并且当相邻块的运动矢量为2时，其被缩放到8/4，然后指示缩放值。

图7中的(b)示出了要编码的目标块是屏幕内容，并且与要编码的目标块相邻的块不是屏幕内容的情况。

在这种情况下，由于相邻块的运动矢量具有子像素分辨率，所以基于运动矢量的预测运动矢量也具有子像素分辨率。然而，由于要编码的目标块的运动矢量具有整像素分辨率，因此在获得差分运动矢量时，需要执行与运动矢量的分辨率单元匹配的缩放。

因此，本发明基于要编码的目标块的运动矢量的分辨率来缩放相邻块的运动矢量。

也就是说，由子像素单元表示的相邻块的运动矢量，根据运动矢量的值被映射到整像素单元的值。例如，运动矢量可以被映射到对应于子像素单元中的值的商的值。当相邻块的运动矢量是1/4像素单元时，如果子像素单元中的值的商小于1(例如0、1/4、2/4、3/4)，则相应的运动矢量被映射到0，而如果子像素单元中的值的商为1(例如4/4、5/4、6/4、7/4)，则相应的运动矢量被映射到1。

通过这个缩放过程方式，即使是屏幕内容区域和非屏幕内容区域包括在一起的情况下，也可以执行运动矢量编码。

图8是示出根据本发明实施例的视频编码设备的详细配置的图。

如图中示出的，视频编码设备100还可以包括帧内预测单元，用于对当前帧执行帧内预测，运动预测单元，用于在帧间预测过程中从参考帧搜索与当前编码的目标块最相似的预测块，以及运动补偿单元，用于基于通过运动预测找到的最佳预测块的运动矢量来执行运动补偿。此外，从帧内预测单元、运动预测单元和运动补偿单元输出的数据，在通过变换单元、量化单元和熵编码单元之后，以比特流的形式输出。此外，通过频率变换和量化步骤获得的量化变换系数在通过逆量化单元和逆变换单元时被重构为空间域数据，并且重构的空间域数据通过解块单元和偏移调整单元时，作为参考帧输出。这样的视频编码算法对应于常规技术，因此将省略其详细描述。

图9是示出根据本发明实施例的视频解码设备的配置的方框图。

视频解码设备200包括用于接收和解析比特流的解析单元210和用于基于解析数据重构图像的解码单元220。

解析单元210从包括在要解码的目标比特流中的报头信息中，提取关于每个单元图像的运动矢量的分辨率的信息。如上所述，从视频编码设备100输出的比特流包括指示包括在单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息。此外，当输入图像可以包括每个由运动矢量的分辨率不是整像素分辨率的块组成的区域时，比特流可以包括关于区域的数量和位置的信息。此外，当单元图像中包含的编码块具有子像素单元运动矢量时，如果输入图像包括由相应图像中的一些编码块的运动矢量的分辨率是整像素分辨率的块组成的区域，比特流可以包括关于相应区域的数量和位置的信息。解析单元210通过解析比特流来提取这样的信息。

解码单元220可以基于比特流中包括的预测块与原始块之间的差分信号和运动矢量来重构目标块。也就是说，经由基于运动矢量的运动补偿过程来确定预测块，并且可以通过将预测块加到差分信号来重构原始块。此外，解码单元220对包含在比特流中的当前块的运动矢量与预测运动矢量之间的差异矢量解码。

此外，解码单元220基于由解析单元210提取的分辨率信息对单元图像解码。例如，基于指示包含在每个单元图像中的基于整像素分辨率的所有运动矢量的分辨率的标志信息，在每个整像素的基础上对对应的单元图像执行解码。

根据上述运动矢量编码处理，如果确定所有运动矢量的分辨率是整像素分辨率，则仅需要仅考虑整像素单元的索引来搜索码数，而不考虑子像素单元的索引，从而提高了解码效率。

如上参考图4和5所述，当单元图像包括一个或多个非屏幕内容区域时，报头信息可以包括关于区域的数量和位置的信息。

基于这样的报头信息，解码单元220在每个整像素的基础上对屏幕内容区域执行解码，并且即使是子像素单元也考虑对剩余区域执行解码。

同时，在具有不是整像素分辨率的分辨率的块中，这样的报头信息可以包括起始块的索引信息和结束块的索引信息。解码单元220可以基于开始块的索引信息和结束块的索引信息两者，来计算开始块的左上顶点的坐标值和结束块的右下角顶点的坐标值。也就是说，如上所述，可以使用上述等式1和2来计算各个坐标值。

此外，当在单元图像中包括一个或多个屏幕内容区域时，报头信息可以包括关于区域的数量和位置的信息。此外，这种报头信息可以包括在具有整像素分辨率的区域中的块之间的起始块的索引信息和结束块的索引信息。此外，根据实施例，除了块索引之外，关于起始块的起始像素的坐标和结束块的结束像素的坐标的信息可以包括在报头部信息中。

此外，当屏幕内容区域和非屏幕内容区域包括在一起时，解码单元220可以执行用于根据各个运动矢量的分辨率，来缩放从相邻块提取的运动矢量的预测向量的过程。也就是说，如上参考图7所述，当要解码的目标块和其相邻块的运动矢量的分辨率彼此不同时，需要执行与获得差分运动矢量时的分辨率单元相匹配的缩放。

也就是说，如图7中的(a)中示出的，当要解码的目标块不是屏幕内容并且与要解码的目标块相邻的块是屏幕内容时，相对于要解码的目标块的分辨率，相邻块的运动矢量被缩放。也就是说，相邻块的运动矢量被缩放到子像素单元，并且基于缩放的运动矢量来计算差分运动矢量。例如，当要解码的目标块的运动矢量为1/4像素单元时，相邻块的运动矢量被转换为4n/4像素单元的形式。也就是说，当相邻块的运动矢量为1时，其被缩放为4/4，并且当相邻块的运动矢量为2时，其被缩放到8/4，然后指示缩放值。此外，如图7中的(b)中示出的，当要解码的目标块是屏幕内容，并且与要解码的目标块相邻的块不是屏幕内容时，相对于要解码的目标块的分辨率，相邻块的运动矢量被缩放。也就是说，由子像素单元表示的相邻块的运动矢量，根据运动矢量的值被映射到整像素单元的值。例如，运动矢量可以被映射到对应于子像素单元中的值的商的值。当相邻块的运动矢量是1/4像素单元时，如果子像素单元中的值商小于1(例如0、1/4、2/4、3/4)，则相应的运动矢量被映射到0，而如果子像素单元中的值的商为1(例如4/4、5/4、6/4、7/4)，则相应的运动矢量被映射到1。通过这个缩放过程方式，即使是屏幕内容区域和非屏幕内容区域包括在一起的情况下，也可以执行运动矢量编码。

如图示出的，视频解码设备200包括解析单元用于接收和解析比特流，并输出编码图像数据和解码所需的各种类型的信息。此外，编码图像数据在通过熵解码单元和逆量化单元时作为逆量化数据输出，然后在通过逆变换单元时被重构为空间域图像数据。帧内预测单元以帧内模式对每个编码单元的空间域图像数据执行帧内预测，并且运动补偿单元使用参考帧以帧间模式对每个编码单元执行运动补偿。在通过帧内预测单元和运动补偿单元之后获得的空间域数据在通过去块单元和偏移调整单元时进行后处理，然后输出重构帧。此外，可以将通过去块单元和偏移调整单元进行后处理的数据作为参考帧输出。这种视频编码算法对应于常规技术，因此将省略其详细描述。

作为参考，根据本发明实施例的图2或图9可以表示软件组件或诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC)的硬件组件，并且可以执行预定的功能。

包括在本发明的实施例中的组件不限于软件或硬件，并且可以被配置为存储在可寻址存储介质中并且在一个或多个处理器上执行。

因此，作为示例，组件可以包括诸如软件组件，面向对象的软件组件，类组件和任务组件、进程、功能、属性、过程、子例程、程序代码段、驱动程序、固件、微代码、电路、数据、数据库、数据结构、表、数组和变量。

在相应组件中提供的组件和功能可以组合成更少的组件，或者可以进一步分成另外的组件。

根据本发明的实施例的视频编码设备和视频解码设备可以是个人计算机(PC)、笔记本电脑、个人数字助理(PDA)、便携式多媒体播放器(PMP)、PlayStation便携式(PSP)、移动通信终端、智能电话、平板PC等，并且可以表示各种类型的设备，每种设备包括诸如用于与各种类型的设备进行通信的通信设备或有线/无线通信网络，用于存储编码或解码图像所需的各种类型的程序和数据的存储器，用于执行程序和执行操作和控制的微处理器等。

此外，可以通过视频编码设备编码到比特流中的图像可以通过有线/无线通信网络，例如因特网、短距离无线通信网络、无线网络、实时或非实时地发送到视频解码设备局域网(LAN)、Wibro网络或移动通信网络，或通过诸如电缆或通用串行总线(USB)的通信接口，然后可以被重构和再现为图像。

本发明实施例还可以以包括由计算机执行的指令的存储介质的形式来实现，诸如由计算机执行的程序模块。计算机可读介质可以是可由计算机访问的任意可用介质，并且可以包括所有易失性和非易失性介质以及可移除和不可移动介质。此外，计算机可读介质可以包括所有计算机存储介质和通信介质。计算机存储介质包括所有易失性和非易失性介质以及可移动和不可移动介质，其使用用于存储诸如计算机可读指令，数据结构，程序模块或附加数据的信息的任何方法或技术来实现。通信介质通常包括用于计算机可读指令的传输介质，数据结构，程序模块或用于诸如载波或附加传输机制的调制数据信号的附加数据，并且包括任意信息传递介质。

虽然已经关于特定实施例描述了本发明的方法和系统，但是可以使用具有通用硬件架构的计算机系统来实现部分或全部组件或其操作。

本发明的描述旨在说明，本领域的技术人员将理解，本发明可以以其他详细的形式容易地修改而不改变本发明的技术精神或本质特征。因此，上述实施例应理解为示例性的而不是限制性的。例如，描述为单个组件的每个组件可以被分布和实践，并且类似地，描述为分发的组件也可以以集成形式来实施。

本发明的范围应由所附权利要求而不是详细描述定义，并且从权利要求及其等同物的含义和范围导出的所有变化或修改应被解释为包括在本发明的范围内。

工业实用性

本发明在用于提高编码和解码屏幕内容视频的处理效率的技术领域具有工业实用性。

Claims

1.一种使用运动矢量分辨率缩放的视频编码设备，包括：

比特流生成单元，用于在比特流的报头信息中包括关于基于单元图像的运动预测确定的各个块的运动矢量的分辨率的信息；

运动预测单元，用于基于每个块在所述单元图像上执行运动预测以生成目标块的预测块；和

运动矢量编码单元，用于编码在运动预测过程中针对各个块确定的运动矢量，

差分信号生成单元，用于使用所述目标块和所述预测块来生成差分信号，

其中，所述报头信息包括指示包括在所述单元图像中的所有运动矢量的分辨率是否是整像素分辨率的标志信息，

其中，所述差分信号被变换、量化和熵编码到所述比特流中，

其中，所述差分信号是基于DCT进行变换的，

其中，所述运动矢量编码单元被配置为，当要编码的所述目标块的运动矢量的分辨率是整像素分辨率时，利用要编码的所述目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将所述相邻块的运动矢量映射到对应于整像素单元中的值的值，以及

其中，所述运动矢量编码单元通过从所述相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行所述相邻块的运动矢量的映射。

2.如权利要求1所述的视频编码设备，其中，所述运动矢量编码单元被配置为，当要编码的所述目标块的运动矢量的分辨率是子像素分辨率，并且所述相邻块的运动矢量的分辨率是整像素分辨率时，将所述相邻块的运动矢量映射到通过将所述相邻块的运动矢量的整数单元中的值缩放为子像素单元中的值而获得的值。

3.如权利要求1所述的视频编码设备，其中，当所述单元图像包括各自由运动矢量的分辨率不是整像素分辨率的块组成的区域时，所述报头信息被配置为包括关于所述区域的数量和位置的信息。

4.如权利要求3所述的视频编码设备，其中，关于所述区域的位置的信息包括所述块中开始块的索引信息和结束块的索引信息，对于所述块，所述运动矢量的分辨率不是整像素分辨率。

5.如权利要求1所述的视频编码设备，其中，当所述单元图像包括各自由运动矢量的分辨率是整像素分辨率的块组成的区域时，所述报头信息被配置为包括关于所述区域的数量和位置的信息。

6.如权利要求5所述的视频编码设备，其中，关于所述区域的位置的信息包括所述块中开始块的索引信息和结束块的索引信息，对于所述块，所述运动矢量的分辨率是整像素分辨率。

7.一种使用运动矢量分辨率缩放的视频解码设备，包括：

解析单元，用于从包括在要解码的目标比特流中的报头信息中提取关于每个单元图像的运动矢量的分辨率的信息；和

解码单元，用于基于所述分辨率信息解码所述单元图像，

其中，所述解码单元基于预测块与原始块之间的差分信号和运动矢量来重构目标块，

其中，所述差分信号是通过对关于包括在所述比特流中的所述差分信号的信息执行熵解码、逆量化和逆变换而获得的，

其中，所述逆变换是基于DCT执行的，

其中，所述解码单元被配置为，当所述标志信息指示要解码的目标块的运动矢量的分辨率是整像素分辨率时，利用要解码的所述目标块的运动矢量的分辨率，根据要映射的相邻块的运动矢量的子像素单元中的值，将所述相邻块的运动矢量映射到对应于整像素单元中的值的值，以及

其中，所述解码单元通过从所述相邻块的运动矢量的子像素单元中的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值，来执行所述相邻块的运动矢量的映射。

8.如权利要求7所述的视频解码设备，其中，所述解码单元基于指示所述单元图像中包含的所有运动矢量的分辨率是整像素分辨率的标志信息，以每个整像素为基础对对应的单元图像执行解码。

9.如权利要求7所述的视频解码设备，其中，所述解码单元被配置为，当要解码的所述目标块的运动矢量的分辨率是子像素分辨率，并且所述相邻块的运动矢量的分辨率是整像素分辨率时，将所述相邻块的运动矢量映射到通过将所述相邻块的运动矢量的整数单元中的值缩放为子像素单元中的值而获得的值。

10.如权利要求7所述的视频解码设备，其中，当所述单元图像包括各自由运动矢量的分辨率不是整像素分辨率的块组成的区域时，所述报头信息被配置为包括关于所述区域的数量和位置的信息。

11.如权利要求10所述的视频解码设备，其中，关于所述区域的位置的信息包括所述块中开始块的索引信息和结束块的索引信息，对于所述块，所述运动矢量的分辨率不是整像素分辨率。

12.如权利要求10所述的视频解码设备，其中，所述解码单元以每个整像素为基础在对应的输入图像中，对除了由不是整像素单元的块组成的区域以外的区域执行解码，并且根据所述由不是整像素单元的块组成的区域的各个块的运动矢量的分辨率信息，对所述由不是整像素单元的块组成的区域执行解码。

13.如权利要求7所述的视频解码设备，其中，当所述单元图像包括各自由运动矢量的分辨率是整像素分辨率的块组成的区域时，所述报头信息被配置为包括关于所述区域的数量和位置的信息。

14.如权利要求13所述的视频解码设备，其中，关于所述区域的位置的信息包括所述块中开始块的索引信息和结束块的索引信息，对于所述块，所述运动矢量的分辨率是整像素分辨率。

15.如权利要求13所述的视频解码设备，其中，所述解码单元以每个整像素为基础，对由整像素单元的块组成的区域执行解码，并且根据各个块的运动矢量的分辨率信息，对除了由整像素单元的块组成的所述区域外的区域执行解码。

16.如权利要求11所述的视频解码设备，其中，所述解码单元基于所述开始块的索引信息和所述结束块的索引信息，计算所述开始块的左上顶点的坐标值和所述结束块的右下顶点的坐标值。

17.一种存储由视频编码设备生成的比特流的计算机可读记录介质，所述设备包括：

其中，所述差分信号是基于DCT进行变换的，

18.一种使用运动矢量分辨率缩放的视频解码方法，包括：

从比特流中解析关于目标块的运动矢量的运动矢量分辨率的信息；

基于相邻块的运动矢量和关于运动矢量分辨率的所述信息导出所述目标块的运动矢量；

基于所述目标块的运动矢量生成所述目标块的预测块；和

基于所述预测块以及所述目标块的差分块来重构所述目标块，

其中，当关于运动矢量分辨率的所述信息指示要解码的所述目标块的运动矢量的分辨率是整像素分辨率时，所述相邻块的运动矢量是通过从子像素单元中的所述相邻块的运动矢量的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值来更新的，

其中，所述差分块是通过对关于包括在所述比特流中的所述差分信号的信息执行熵解码、逆量化和逆变换而获得的，

其中，所述逆变换是基于DCT执行的。

19.一种使用运动矢量分辨率缩放的视频编码方法，包括：

识别目标块的运动矢量的运动矢量分辨率，关于运动矢量分辨率的信息被编码到比特流中；

基于相邻块的运动矢量和关于运动矢量分辨率的所述信息对所述目标块的运动矢量进行编码；

基于所述目标块和所述目标块的预测块来生成差分块，所述预测块是基于所述目标块的运动矢量生成的；和

将所述差分块编码到所述比特流中，

其中，当关于运动矢量分辨率的所述信息指示要编码的所述目标块的运动矢量的分辨率是整像素分辨率时，所述相邻块的运动矢量是通过从子像素单元中的所述相邻块的运动矢量的值消除可用于以子像素单元表示但是不可用于以整像素单元表示的值来更新的，

其中，通过对所述差分块执行变换、量化和熵编码，将所述差分块编码到所述比特流中，

其中，所述变换是基于DCT执行的。

20.一种存储由使用运动矢量分辨率缩放的视频编码方法生成的比特流的计算机可读记录介质，所述方法包括：

将所述差分块编码到所述比特流中，

其中，所述变换是基于DCT执行的。