CN101529912B

CN101529912B - 用于在多通路编码器中高效地进行第一通路编码的方法和设备

Info

Publication number: CN101529912B
Application number: CN2007800395856A
Authority: CN
Inventors: 格克切·丹尼; 陆晓安; 克里斯蒂娜·戈米拉
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2006-10-25
Filing date: 2007-10-22
Publication date: 2012-05-30
Anticipated expiration: 2027-10-22
Also published as: WO2008051517A2; US20100027622A1; CN101529912A; BRPI0717322A2; WO2008051517A3; JP5264747B2; JP2010507983A; EP2087739A2

Abstract

提供了在多通路编码器中高效地进行第一通路编码的方法和设备。设备包括：多通路视频编码器(300)，用于通过在第一通路编码前对至少一图像的输入图像数据的至少一部分进行二次采样，来对所述输入图像数据执行所述第一通路编码。二次采样是空间二次采样和时间二次采样中的至少一种。

Description

用于在多通路编码器中高效地进行第一通路编码的方法和设备

相关申请的交叉引用

本申请要求于2006年10月25日提交的美国临时申请No.60/862,778的权益，并将其全部内容合并于此处作为参考。

技术领域

本发明原理总体涉及视频编码，更具体地，涉及用于在多通路编码器(multi-pass encoder)中高效地进行第一通路编码的方法和设备。

背景技术

多通路视频编码系统的效率取决于关于输入视频的可用信息的精度。关于视频的信息或者作为元数据是可用的，或者可以在第一通路编码时期间加以采集。利用该信息，有效多通路算法向视频序列的特定部分分配比特，以便能够针对所有图像获得恒定的视频质量。如果关于视频的信息是可靠的，则能够获得比特在图像上的更精确的分布。

为了将比特适当地分布在图像上，通常用第一通路采集与所要进行编码的视频有关的信息。第一通路可以包括预分析或全编码。可以通过仅以帧内模式对图像进行编码，以简单的方式完成全编码。还可以通过以帧间和帧内模式对图像进行编码，以规则的方式来完成全编码。与预分析相比，采用全编码的第一通路采集关于视频复杂度的更可靠的信息，并得到了更好的视频质量。此外，如果第一通路编码器在类似于第二通路编码器的配置设置下进行工作，则从第一通路采集的数据的可靠性提高。然而，这种方式的计算复杂度会更高。

通常，大多数多通路视频编码系统对整个多通路编码系统的计算复杂度有所限制。因此，典型地，这样的系统没有能力包含在非常类似于第二通路编码器的设置下工作的第一通路编码器。尽管这不是必然情况，但对于大多数多通路编码系统而言，这是非常典型的情形。通常，第一通路编码器应当快速运行的同时，向接下来的几个通路提供可靠的统计数据。

第一通路编码的复杂度取决于特定多通路编码系统的设计。例如，在第一个现有技术多通路视频编码系统中，第一通路编码以较高的质量水平运行，并耗费较多时间。尽管该复杂度水平对于某些应用而言是可以接受的，但以具有实时或接近于实时响应为目标的大多数系统需要简单而有效的第一通路编码。

如上所述，多通路系统的第一通路可被实现为预分析步骤/级(以下称“预分析级”)或被实现为全编码。

至于作为多通路视频编码系统第一通路的预分析级，该预分析级可以执行简单的图像求差或差异计算，以采集视频信息。第二通路编码基于从第一通路采集到的信息运行。与一通路全编码相比，预分析的复杂度较低(即，第一通路的运行时间较短)。然而，从预分析采集到的信息不是非常可靠，并且这会在视频质量方面影响总体性能。由于高质量是许多高清视频应用的主要需求，因此诸如全编码等先进方法对于第一通路而言是必需的。

至于作为多通路视频编码系统的第一通路的全编码级，可以采用多种方式实现全编码。

例如，作为第一通路全编码级的一个示例，可以使用仅进行了帧内编码的原始输入视频序列来实现第一通路全编码。在这种情况下，可以使用通过对帧内图像(intra pictures)进行编码获得的比特，来预测在接下来的几个通路中将使用到的帧内或帧间图像的比特。然而，根据帧内图像对帧间图像的比特的预测不是非常可靠，这是由于帧内和帧间图像是使用各自不同的方法进行编码的。

作为第一通路全编码级的另一示例，可以使用进行了帧内和帧间编码的原始输入视频序列来实现第一通路全编码，其中帧内和帧间编码是采用固定的编码器配置设置进行的。与仅进行帧内编码的方法相比，这种类型的编码可以产生更可靠的信息，以预测接下来的几个通路中的图像的比特。然而，第一通路编码中所使用的固定配置设置可能与接下来的几个通路的配置设置不匹配。因此，接下来的几个通路的比特分布精度可能会有损失。

作为第一通路全编码状态的另一示例，还可以使用具有多种编码器配置设置的原始输入视频序列来实现第一通路全编码。改变编码器配置设置意味着：针对这些设置中的每一个设置多次完成第一通路编码。如果将在第一通路编码中提供最佳性能的设置应用于第二通路编码，则可以以这种方式获得更好的总体视频质量。

因此，尽管采用全编码的第一通路改进了视频质量，但它在编码时间方面效率较低。

参见图1，以附图标记100总体指示多通路视频编码系统。

多通路视频编码系统100包括：第一通路编码器110，具有与第二通路编码器130的第一输入相连并进行信号通信的第一输出。第一通路编码器110的第二输出与复杂度分析器120的输入相连并进行信号通信。复杂度分析器120的输出与第二通路编码器130的第三输入相连并进行信号通信。

第一通路编码器110的第一输入和第二通路编码器130的第二输入可用作多通路视频编码系统100的用于接收视频源信号的输入。第一通路编码器110的第二输入和第二通路编码器130的第四输入可用作多通路视频编码系统的用于接收配置数据的输入。第二通路编码器130的输出可用作多通路视频编码系统100的输出，用于输出比特流。

因此，如上所述，多通路视频编码系统100的输入是：要进行编码的原始视频源和每个编码器将使用的配置数据。对于每一通路，确定编码器设置的配置数据可以不同。相同视频源同时馈入第一通路和第二通路编码器作为典型多通路编码器的输入。由复杂度分析器120分析通过第一通路编码器110所执行的第一通路编码而获得的信息。第二通路编码器130可以直接从复杂度分析器120和第一通路编码器110取得信息，作为除输入视频源以外的输入。通过复杂度分析器120传至第二通路编码器130的信息可以是各图像类型比特。从第一通路编码器110传至第二通路编码器130的信息可以是运动向量。多通路视频编码系统100的输出是通常遵循多种视频压缩标准(如，国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)第10部分的高级视频编码(AVC)标准/国际电信联盟电信部门(ITU-T)H.264建议(以下称“MPEG-4AVC标准”)以及ISO/IECMPEG-2标准)之一的压缩比特流。

参见图2，以附图标记200总体指示一种用于实现多通路视频编码的方法。

方法200包括：开始框201，开始框2将控制权交予功能框209(例如，手动操作功能框)。功能框209涉及执行编码器设置，并将控制权交予功能框210。功能框210执行第一通路编码，并将控制权交予功能框220。功能框220执行复杂度分析，并将控制权交予功能框230。功能框230执行第二通路编码，并将控制权交予结束框240。

发明内容

本发明原理解决了现有技术的上述和其他缺点和不足，本发明原理涉及用于在多通路编码器中高效地进行第一通路编码的方法和设备。

根据本发明原理的一个方面，提供了一种设备。该设备包括：多通路视频编码器，用于通过在第一通路编码前对输入图像数据的至少一部分进行二次采样(sub-sampling)，对至少一图像的输入图像数据执行第一通路编码。二次采样是空间二次采样和时间二次采样中的至少一种。

根据本发明原理的另一个方面，提供了一种方法。该方法包括：通过在第一通路编码前对输入图像数据的至少一部分进行二次采样，对至少一图像的输入图像数据执行第一通路编码。二次采样是空间二次采样和时间二次采样中的至少一种。

根据本发明原理的另一个方面，提供了一种设备。该设备包括：多通路视频编码器，用于对至少一图像的输入图像数据执行第一通路编码，且用于对通过第一通路编码得到的信息执行分析，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性。

根据本发明原理的另一个方面，提供了一种方法。该方法包括：对至少一图像的输入图像数据执行第一通路编码，以及对通过第一通路编码得到的信息执行分析，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性。

根据本发明原理的另一个方面，提供了一种用于多通路视频编码器的设备。该编码器用于至少对至少一图像的输入图像数据执行第一通路编码。该设备包括：用于在第一通路编码前对输入图像数据的至少一部分进行二次采样的二次采样器。二次采样是空间二次采样和时间二次采样中的至少一种。

根据本发明原理的另一个方面，提供了一种用于多通路视频编码器的方法。该编码器用于至少对至少一图像的输入图像数据执行第一通路编码。该方法包括：在第一通路编码前，对输入图像数据的至少一部分进行二次采样。二次采样是空间二次采样和时间二次采样中的至少一种。

根据本发明原理的另一个方面，提供了一种用于多通路视频编码器的设备。该编码器用于至少对至少一图像的输入图像数据执行第一通路编码。该设备包括：二次采样分析器，用于对通过第一通路编码得到的信息执行分析，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性。

根据本发明原理的另一个方面，提供了一种用于多通路视频编码器的方法。该编码器用于至少对至少一图像的输入图像数据执行第一通路编码。该方法包括：对通过第一通路编码得到的信息执行分析，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性。

本发明原理的上述和其他方面、特征和优点将在需要结合附图阅读的、以下示例性实施例的详细说明中变得显而易见。

附图说明

依照以下示例性附图，可以更好地理解本发明原理。附图中：

图1是根据现有技术的多通路视频编码系统的框图；

图2是根据现有技术的用于实现多通路视频编码的方法的框图；

图3是根据本发明原理的实施例的、可应用本发明原理的、带有二次采样的示例性多通路视频编码系统的框图；

图4是根据本发明原理的实施例的、可应用本发明原理的、带有二次采样和信息分析的示例性多通路视频编码系统的框图；

图5是根据本发明原理的实施例的、可应用本发明原理的多通路视频编码系统中使用的示例性视频编码器的框图；

图6是根据本发明原理的实施例的、带有二次采样的、用于多通路视频编码的示例性方法的流程图；

图7是根据本发明原理实施例的、带有二次采样和信息分析的、用于多通路视频编码的示例性方法的流程图。

具体实施方式

本发明原理涉及用于在多通路编码器中高效地进行第一通路编码的方法和设备。

本说明书阐释了本发明原理。因此，应当认识到，所属领域的技术人员将能够设计出虽未在此处明确说明或示出、但体现了本发明的原理并涵盖于其精神和范围内的各种配置。

此处叙述的所有示例以及条件式语言均为达到教学目的，以帮助读者理解由发明人提出的改进了现有技术的发明原理以及发明构思，因而应将其理解为不限于那些具体叙述的示例以及条件。

此外，此处叙述的所有本发明原理、方面和实施例的所有说明及其具体示例均意在涵盖其结构以及功能等价物。此外，这些等价物意在包括当前已知等价物以及将于未来开发出来的等价物，即，不管结构如何，开发出来用于执行同一功能的任意元件。

因而，举例而言，所属领域技术人员应认识到此处所示的框图呈现了体现本发明原理的示意电路的概念性视图。类似地，应认识到流程图、状态转移图、伪码等表示各种可以计算机可读介质充分表现的，因而无论是否明确说明了计算机或处理器，均能够用计算机或处理器予以执行的过程。

可以通过采用专用硬件以及同适当软件相关的能够执行软件的硬件来实现附图所示的各种实施例的功能。如果用处理器来提供功能，则可以用单独的专用处理器、单独的共享处理器或者多个其中若干可以是共享处理器的独立处理器来提供功能。此外，不应将术语“处理器”或“控制器”的明确使用看成专指能够执行软件的硬件，反之其可以无限制地隐含包括：数字处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)以及非易失性存储器。

还可以包括常规的和/或定制的其他硬件。类似地，附图中的所有开关也只是概念上的。可以通过程序逻辑操作、专用逻辑、程序控制以及专用逻辑的相互作用，或者甚至手动实现它们的功能，其中具体技术可以根据上下文进行了更加具体的理解后，由实施者加以选择。

在其权利要求中，任意被表示为用于执行指定功能的元件都意在包含执行该功能的任意方式，后者包括：比如，a)执行该功能的电路元件的组合或b)任意形式的软件，因而包括：同用于执行该软件以实现所述功能的适当电路相结合的固件、微码或类似软件。由这种权利要求所限定的发明在于以权项要求的方式结合在一起的各种所述装置所提供的功能。因而，应将能够提供这种功能的任意装置看做此处说明的装置的等价物。

说明书中对本发明原理“一个实施例”或“一实施例”的引用意味着，至少在依照本发明原理的一实施例中包含了结合实施例进行说明的特定的特征、结构、特点等等。因而，在整篇说明书中各处出现的短语“在一个实施例中”或“在一实施例中”未必指同一实施例。

此外，应当认识到短语“图像数据”是指与任意静止图像和运动图像(即，包括运动的图像序列)相对应的数据。

应当认识到，举例而言，“A和/或B”情况下的术语“和/或”的使用意在包括：选择第一个列出的选项(A)、选择第二个列出的选项(B)、或同时选择两个选项(A和B)。再举一例，就“A、B和/或C”而言，该短语意在包括：选择第一个列出的选项(A)、选择第二个列出的选项(B)、选择第三个列出的选项(C)、选择第一个和第二个列出的选项(A和B)、选择第一个和第三个列出的选项(A和C)、选择第二个和第三个列出的选项(B和C)、或选择所有三个选项(A、B和C)。所属和相关领域的普通技术人员容易理解，可以随列出项目的数量对其进行扩展。

参见图3，以附图标记300总体指示带有二次采样的示例性多通路视频编码系统。

多通路视频编码系统300包括：二次采样器305，具有与第一通路编码器310的第一输入相连并进行信号通信的输出。第一通路编码器310具有与复杂度分析器320的输入相连并进行信号通信的第一输出。复杂度分析器320的输出与第二通路编码器330的第一输入相连并进行信号通信。第一通路编码器310的第二输出与第二通路编码器330的第二输入相连并进行信号通信。

二次采样器305的输入和第二通路编码器的第四输入可用作多通路视频编码系统300的、用于接收视频源信号的输入。第一通路编码器310的第二输入和第二通路编码器330的第三输入可用作多通路视频编码系统300的、用于接收配置数据的输入。第二通路编码器330的输出可用作多通路视频编码系统300的、用于输出比特流的输出。

参见图4，以附图标记400总体指示带有二次采样和信息分析的示例性多通路视频编码系统。

多通路视频编码系统400包括二次采样器405，二次采样器405具有与第一通路编码器410的第一输入相连并进行信号通信的输出。第一通路编码器410具有与二次采样分析器415的输入相连并进行信号通信的第一输出。二次采样分析器415的输出与复杂度分析器420的输入相连并进行信号通信。复杂度分析器420的输出与第二通路编码器430的第一输入相连并进行信号通信。第一通路编码器410的第二输出与第二通路编码器430的第二输入相连并进行信号通信。

二次采样器405的输入和第二通路编码器的第四输入可用作多通路视频编码系统400的、用于接收视频源信号的输入。第一通路编码器410的第二输入和第二通路编码器430的第三输入可用作多通路视频编码系统400的、用于接收配置数据的输入。第二通路编码器430的输出可用作多通路视频编码系统400的、用于输出比特流的输出。

参见图5，以附图标记500总体指示可应用本发明原理的多通路视频编码系统中所使用的视频编码器。

视频编码器500包括帧排序缓冲器510，帧排序缓冲器510具有与合并器585的同相输入连接并进行信号通信的输出。合并器585的输出与变换器和量化器525的第一输入相连并进行信号通信。变换器和量化器525的输出与熵编码器545的第一输入以及反变换器和反量化器550的第一输入相连并进行信号通信。熵编码器545的输出与合并器590的第一同相输入相连并进行信号通信。合并器590的输出与输出缓冲器535的第一输入相连并进行信号通信。

编码器控制器505的第一输出与帧排序缓冲器510的第二输入、反变换器和反量化器550的第二输入、图像类型判决模块515的输入、宏块类型(MB类型)判决模块520的输入、帧内预测模块560的第二输入、解块滤波器565的第二输入、运动补偿器570的第一输入、运动估计器575的第一输入、和参考图像缓冲器580的第二输入相连并进行信号通信。

编码器控制器505的第二输出与补充增强信息(SEI)插入器530的第一输入、变换器和量化器525的第二输入、熵编码器545的第二输入、输出缓冲器535的第二输入、和序列参数集(SPS)和图像参数集(PPS)插入器540的输入相连并进行信号通信。

图像类型判决模块515的第一输出与帧排序缓冲器510的第三输入相连并进行信号通信。图像类型判决模块515的第二输出与宏块类型判决模块520的第二输入相连并进行信号通信。

序列参数集(SPS)和图像参数集(PPS)插入器540的输出与合并器590的第三同相输入相连并进行信号通信。

反量化器和反变换器550的输出与合并器525的第一同相输入相连并进行信号通信。合并器525的输出与帧内预测模块560的第一输入和解块滤波器565的第一输入相连并进行信号通信。解块滤波器565的输出与参考图像缓冲器580的第一输入相连并进行信号通信。参考图像缓冲器580的输出与运动估计器875的第二输入相连并进行信号通信。运动估计器575的第一输出与运动补偿器570的第二输入相连并进行信号通信。运动估计器575的第二输出与熵编码器545的第三输入相连并进行信号通信。

运动补偿器570的输出与开关597的第一输入相连并进行信号通信。帧内预测模块560的输出与开关597的第二输入相连并进行信号通信。宏块类型判决模块520的输出与开关597的第三输入相连并进行信号通信。开关597的输出与合并器525的第二同相输入和合并器585的反相输入相连并进行信号通信。

帧排序缓冲器510和编码器控制器505的输入可用作编码器500的、用于接收输入图像501的输入。此外，补充增强信息(SEI)插入器530的输入可用作编码器500的、用于接收元数据的输入。输出缓冲器535的输出可用作编码器500的、用于输出比特流的输出。

如上所述，本发明原理涉及一种用于在多通路编码器中高效地进行第一通路编码的方法和设备。在一实施例中，采用可变比特率多通路视频编码器实现本发明原理。可变比特率多通路编码器的目标是：通过改变不同图像间的比特分配来提供恒定的视频质量。为此，第一通路通常用于采集与要编码的视频的有关信息。第一通路可以是预分析或全编码。与预分析相比，采用全编码的第一通路可以采集更可靠的关于视频复杂度的信息，并得到更好的视频质量。然而，全编码的计算复杂度更高。为了保持较低的复杂度，在一实施例中，此处根据本发明原理说明的一种方法和设备对输入视频序列执行二次采样，以执行快速且高效的第一通路视频编码。在一实施例中，二次采样方法包括空间二次采样技术和/或时间二次采样技术。应当认识到，此处还提出了用于执行空间和时间二次采样的不同实施例。

此外，在一实施例中，还提出了一种二次采样分析器，当使用根据本发明原理提出的二次采样技术或任何其他预分析技术时，该二次采样分析器对通过第一通路编码而获得的信息进行分析，并向复杂度分析器提供更可靠信息。也就是说，此处提供的二次采样分析器不仅限于此处根据本发明原理描述的带有二次采样的第一通路全编码，相反，给定此处提供的本发明原理的教导，所属和相关领域的普通技术人员还可以在保持本发明原理的范围同时，使用其他类型的第一通路全编码方案一起使用。

根据本发明原理的各种实施例，提出了多种示例性方式，用于在加速多通路视频编码器的第一通路编码的同时，仍提供对视频信息的精确测量。在一实施例中，这是通过对输入视频序列进行二次采样来完成的。在图4中，功能框405示出了所提出的视频二次采样框在整个多通路视频编码系统400内的示例性位置。可以通过降低空间分辨率和/或时间分辨率来实现所提出的二次采样。以下根据图6示出和说明了采用二次采样的多通路视频编码的示例性方法。应当认识到，本发明原理不仅限于此处说明的以下方法或其各种变体。也就是说，给定了此处提供的本发明原理的教导，所属和相关领域的普通技术人员将在保持本发明原理的范围的情况下构思出上述和各种其他方法，用于对输入视频执行二次采样，从而在多通路编码器中高效地进行第一通路编码。

方法1：降低空间分辨率

在与根据本发明原理的第一方法(以下称“第一方法”)有关的一实施例中，输入视频序列的空间分辨率在第一通路中被处理之前被降低了。应当认识到，可以将第一方法应用于预分析的一通路以及第一通路全编码。第一方法减少了在第一通路中处理的样本数，且不会以任何方式改变第一通路处理方法。

在与第一方法有关的一实施例中，可以通过对输入图像的像素数进行二次采样，以得到更低的分辨率(如一半或四分之一的分辨率)，来降低空间分辨率。应当认识到，可以通过不同方式(通过最近邻法、或者通过使用包括但不限于双线性或双三次图像插值的基于插值滤波器的方法)来执行二次采样。还应当认识到，执行二次采样的上述方式仅是示例性的；并且，给定了此处提供的本发明原理的教导，所属和相关领域的普通技术人员将在保持本发明原理的范围的情况下构思出上述和各种其他方法，用于执行二次采样，以提供在根据本发明原理的多通路编码器中进行的高效的第一通路编码。

在与第一方法有关的另一实施例中，可以通过将全分辨率输入图像裁剪至更低分辨率(如一半或四分之一的分辨率)来降低空间分辨率。可以通过各种裁剪方法来获得更低的分辨率。举例而言，可以从图像的右部、左部、顶部和底部对称地裁剪掉1/4的宽度和1/4的高度以获得一半的分辨率。再举一例，可以从图像的底部和顶部非对称地裁剪掉不同数量的水平像素，和/或从图像的左侧和右侧非对称地裁剪掉不同数量的垂直像素。

方法2：降低时间分辨率

在与根据本发明原理的第二方法(以下称“第二方法”)有关的一实施例中，输入视频序列的时间分辨率在第一通路中被处理之前被降低了。与第一方法的情况一样，可以将第二方法应用于预分析的一通路以及第一通路全编码。

与第一方法相比，第二方法的不同之处在于：在保持图像大小与原始图像大小相同的同时，减少了在第一通路中处理的样本数。类似于第一方法，第二方法也不以任何方式改变第一通路处理方法。

在与第二方法有关的一实施例中，可以通过每隔一个图像集(SOP)跳过一个SOP来进行规则的二次采样，从而降低时间分辨率。在该实施例中，所跳过的图像的数量可以与一个SOP中的图像的数量相等。SOP长度可以是大于或等于1的任意数字。

在与第二方法有关的另一实施例中，可以通过规则地跳过每个SOP的最后N个图像来降低时间分辨率，其中N小于SOP长度。

在与第二方法有关的另一实施例中，可以通过不规则地跳过每个SOP的前M个图像来降低时间分辨率，其中M小于SOP长度。

方法3：同时降低空间和时间分辨率

在与根据本发明原理的第三方法(以下称“第三方法”)有关的一实施例中，输入视频序列的空间和时间分辨率都在第一通路中被处理之前被降低了。与第一方法和第二方法的情况一样，可以将该方法应用于预分析的一通路以及第一通路全编码。

第三方法包括第一方法和第二方法的每种可能的组合，包括但不限于以下实施例。

在一实施例中，可以将一半分辨率的空间二次采样与通过每隔一个SOP跳过一次实现的规则的时间二次采样加以组合。

在另一实施例中，可以将一半分辨率的空间二次采样与不规则的时间二次采样组合。

可以容易地应用所述的第一、第二和第三方法，以支持具有多于两通路的多通路编码算法。还可以在基于预分析的多通路编码器之前应用所述方法。

用于执行信息分析以为复杂度分析提供可靠信息的所提出的方法

在典型的多通路编码器中，由复杂度分析器来分析通过第一通路编码器获得的信息。复杂度分析器的效率取决于复杂度分析器可得到的信息的可靠性和数量。在一实施例中，还提出了一种方法，用于分析和处理通过第一通路获得的信息，并为复杂度分析器产生更可靠信息。根据图4示出和说明了具有所提出的分析器方框的多通路视频编码器框图。根据图7示出和说明了采用所提出的信息分析的对应方法。当在多通路编码系统中使用所提出的二次采样方法或其他预分析方法时，可以使用所提出的二次采样分析器。

二次采样分析器从与所提出的视频二次采样框一起运行的第一通路编码中获取包括但不限于量化参数、每图像的比特、和图像类型在内的信息，并估计将由复杂度分析器使用的非二次采样的视频的信息。在特定实施例中，通过在采用二次采样的第一通路之后获得的信息来估计不采用二次采样的第一通路的信息，其中可以使用以下估计过程。

假定需要估计一个图像集中的P(预测)图像的平均QP(量化参数)，其中q_{p_passl}表示可变。想要通过使用由采用所提出的二次采样方法的第一通路以及随后的第一通路编码获得的P图像的平均量化参数(即，q_{p_passl_subsampled})、B(双向预测)图像的平均量化参数(即，q_{B_passl_subsampled})和I(帧内)图像的平均量化参数(即，q_{I_passl_subsampled})来估计q_{p_passl}。那么，可以如下估计q_{p_passl}：

q_{p_passl}＝α_I q_{I_passl_subsampled}+α_P q_{P_passl_subsampled}+α_B q_{B_passl_subsampled} (1)

其中，α_I、α_P、α_B是权重系数，q_{I_passl_subsampled}、q_{P_passl_subsampled}、q_{B_passl_subsampled}是已知值(通过采用所提出的二次采样方法的第一通路编码获得的信息)。可以通过使用训练数据来获得权重因子α＝[α_I α_Pα_B]。换言之，可以通过使用各种SOP长度和SOP结构，在线下执行仿真，以找到最佳地估计出未进行二次采样的视频的第一通路信息的系数。

一种用来找到权重系数的方式是求解以下方程：

[\begin{matrix} q_{I_pass 1_subsampled_sop 1} & q_{P_pass 1_subsampled_sop 1} & q_{B_pass 1_subsampled_sop 1} \\ q_{I_pass 1_subsampled_sop 2} & q_{P_pass 1_subsampled_sop 2} & q_{B_pass 1_subsampled_sop 2} \\ \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot \\ \cdot & \cdot & \cdot \\ q_{I_pass 1_subsampled_sopN} & q_{P_pass 1_subsampled_sopN} & q_{B_pass 1_subsampled_sopN} \end{matrix}] \cdot [\begin{matrix} α_{I} \\ α_{P} \\ α_{B} \end{matrix}] = [\begin{matrix} q_{P_pass 1_sop 1} \\ q_{P_pass 1_sop 2} \\ \cdot \\ \cdot \\ \cdot \\ q_{P_pass 1_sopN} \end{matrix}] - - - (2)

其中，q_{I_passl_subsampled_sopl}全q_{I_passl_subsampled_sopN}、q_{P_passl_subsampled_sopl}至q_{P_passl_subsampled_sopN}、q_{B_passl_subsampled_sopl}至q_{B_passl_subsampled_sopN}、q_{P_passl_sopl}至q_{P_passl_sopN}是通过仿真获得的。

在以上示例中，演示了P图像的量化参数估计。可以使用相同的估计过程来估计P、I或B图像的量化参数或比特。此外，使用不同预分析算法的第一通路编码也可以从所提出的二次采样分析器获益。

参见图6，以附图标记600总体指示采用二次采样的多通路视频编码的示例性方法。

方法600包括开始框601，开始框601将控制权交予功能框605。功能框605执行视频二次采样，并将控制权交予功能框609(例如，手动操作功能框)。功能框609涉及执行编码器设置，并将控制权交予功能框610。功能框610执行第一通路编码，并将控制权交予功能框620。功能框620执行复杂度分析，并将控制权交予功能框630。功能框630执行第二通路编码，并将控制权交予结束块640。

参见图7，以附图标记600总体指示采用二次采样和信息分析的多通路视频编码的示例性方法。

方法700包括开始框701，开始框701将控制权交予功能框705。功能框705执行视频二次采样，并将控制权交予功能框709(例如，手动操作功能框)。功能框709涉及执行编码器设置，并将控制权交予功能框710。功能框710执行第一通路编码，并将控制权交予功能框715。功能框715执行二次采样分析，并将控制权交予功能框720。功能框720执行复杂度分析，并将控制权交予功能框730。功能框730执行第二通路编码，并将控制权交予结束块740。

现在对本发明的许多附带的优点/特征中的一些进行说明，以上已说明了其中的一些。例如，一个优点/特征是一种包括多通路视频编码器的设备，该多通路视频编码器用于通过对第一通路编码前的、至少一图像的输入图像数据的至少一部分进行二次采样，来对输入图像数据执行第一通路编码。二次采样是空间二次采样和时间二次采样中的至少一种。

另一优点/特征是如上所述的具有多通路视频编码器的设备，其中，该多通路视频编码器通过降低所述至少一图像中至少一图像的空间分辨率，来对输入图像数据的至少所述部分进行空间二次采样。

另一优点/特征是如上所述的具有多通路视频编码器的设备，该多通路视频编码器降低所述至少一图像中至少一图像的空间分辨率，其中，该多通路视频编码器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

另一优点/特征是如上所述的具有多通路视频编码器的设备，该多通路视频编码器降低所述至少一图像中至少一图像的空间分辨率，其中，该多通路视频编码器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

另一优点/特征是如上所述的具有多通路视频编码器的设备，其中，该多通路视频编码器通过对所述至少一图像中的至少一图像进行裁剪，来对输入图像数据的至少所述部分进行空间二次采样。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，该多通路视频编码器对所述至少一图像中的至少一图像进行裁剪，其中，该多通路视频编码器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，该多通路视频编码器对所述至少一图像中的至少一图像进行裁剪，其中，该多通路视频编码器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，其中，该多通路视频编码器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，其中，该多通路视频编码器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，其中，在对通过第一通路编码得到的信息进行复杂度分析之前，该多通路视频编码器对该信息执行分析，该信息用于后一通路编码。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，在对通过第一通路编码得到的信息进行复杂度分析之前，该多通路视频编码器对该信息执行分析，其中，执行位于复杂度分析前的、对通过所述第一通路编码得到的信息执行的所述分析，以为所述后一通路编码提供对所述输入图像数据的压缩参数的统计估计。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，在对通过第一通路编码得到的信息进行复杂度分析之前，该多通路视频编码器对该信息执行分析，其中，压缩参数的统计估计与未进行二次采样的输入图像数据有关。

此外，另一优点/特征是如上所述的具有多通路视频编码器的设备，在对通过第一通路编码得到的信息进行复杂度分析之前，该多通路视频编码器对该信息执行分析，其中，该信息包括：量化参数、每图像的比特、和图像类型中的至少一个。

此外，另一优点/特征是一种用于多通路视频编码器的设备。该编码器用于至少对至少一图像的输入图像数据执行第一通路编码。该设备包括：二次采样器，用于在第一通路编码之前，对输入图像数据的至少一部分进行二次采样。二次采样是空间二次采样和时间二次采样中的至少一个。

此外，另一优点/特征是如上所述的具有二次采样器的设备，其中，该二次采样器通过降低所述至少一图像中至少一图像的空间分辨率，来对输入图像数据的至少所述部分进行空间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，该二次采样器降低所述至少一图像中的至少一图像的空间分辨率，其中，该二次采样器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，该二次采样器降低所述至少一图像中的至少一图像的空间分辨率，其中，该二次采样器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，其中，该二次采样器通过对所述至少一图像中的至少一图像进行裁剪，来对输入图像数据的至少所述部分进行空间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，该二次采样器对所述至少一图像中的至少一图像进行裁剪，其中，该二次采样器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，该二次采样器对所述至少一图像中的至少一图像进行裁剪，其中，该二次采样器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，其中，该二次采样器通过规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，其中，该二次采样器通过不规则地跳过所述至少一图像中的至少一图像，来对输入图像数据的至少所述部分进行时间二次采样。

此外，另一优点/特征是如上所述的具有二次采样器的设备，该设备还包括：二次采样分析器，用于在对通过第一通路编码得到的信息进行复杂度分析之前，对该信息执行分析。该信息用于后一通路编码。

此外，另一优点/特征是如上所述的具有二次采样器和二次采样分析器的设备，其中，执行位于复杂度分析前的、对通过所述第一通路编码得到的信息执行的所述分析，以为所述后一通路编码提供对所述输入图像数据的压缩参数的统计估计。

此外，另一优点/特征是如上所述的具有二次采样器和二次采样分析器的设备，其中，压缩参数的统计估计与未进行二次采样的输入图像数据有关。

此外，另一优点/特征是如上所述的具有二次采样器和二次采样分析器的设备，其中，该信息包括量化参数、每图像的比特、和图像类型中的至少一个。

根据此处的教导，所属领域的普通技术人员易于弄清本发明原理的上述和其他特征以及优点。应当理解的是，可以硬件、软件、固件、专用处理器或其组合等各种形式实现对本发明原理的教导。

在最优选的情况下，将本发明原理的教导实现为硬件和软件的组合。此外，软件可以被实现为确实包含于程序存储单元中的应用程序。应用程序可装载于具有任意适当架构的机器，并由后者来执行。优选情况下，在具有诸如一个以上的中央处理单元(“CPU”)、随机存取存储器(“RAM”)以及输入/输入(“I/O”)接口等硬件的计算机平台上实现该机器。计算机平台还可以包括操作系统以及微指令代码。此处说明的各种处理和功能可以是可由CPU执行的、微指令代码的一部分或者应用程序的一部分或者其任意组合。此外，可以将诸如附加数据存储单元和打印单元等各种其他外围设备连接至计算机平台。

还应当理解的是，由于附图中所描绘的某些构成系统组件以及方法在优选情况下是用软件来实现的，因而系统组件或处理功能框之间的实际连接根据本发明原理的编程方式可能会有所不同。给定了此处的说明，所属领域的普通技术人员将能够构想出本发明原理的上述以及类似的实现方式或配置。

虽然参考附图对示例性实施例进行了说明，但应当理解的是，本发明不局限于这些具体的实施例，所属领域的普通技术人员可以在不背离本发明原理的范围或精神的前提下进行各种改进和修改。正如附属的权利要求所阐释的那样，意在将所有此类改进和修改包含于本发明原理的范围之内。

Claims

1.一种多通路视频编码器(300)，包括：

二次采样器(305)，用于对输入图像数据的至少一部分进行二次采样；

第一通路编码器(310)，用于对二次采样后的图像数据执行第一通路编码，

其中，所述二次采样是空间二次采样和时间二次采样中的至少一种，

空间二次采样是通过对图像数据进行裁剪来实现的，

并且，对输入图像数据的至少一部分进行时间二次采样是通过跳过至少一图像之一来实现的。

2.根据权利要求1所述的多通路视频编码器，其中，所述二次采样器(305)通过降低所述至少一图像中的至少一图像的空间分辨率，来对所述输入图像数据的所述至少一部分进行空间二次采样。

3.根据权利要求2所述的多通路视频编码器，其中，所述二次采样器(305)通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

4.根据权利要求2所述的多通路视频编码器，其中，所述二次采样器(305)通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

5.根据权利要求1所述的多通路视频编码器，其中，所述二次采样器(305)通过对所述至少一图像中的至少一图像进行裁剪，来对所述输入图像数据的所述至少一部分进行空间二次采样。

6.根据权利要求5所述的多通路视频编码器，其中，所述二次采样器(305)通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

7.根据权利要求5所述的多通路视频编码器，其中，所述二次采样器(305)通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

8.根据权利要求1所述的多通路视频编码器，其中，所述二次采样器(305)通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

9.根据权利要求1所述的多通路视频编码器，其中，所述二次采样器(305)通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

10.根据权利要求1所述的多通路视频编码器，其中，所述多通路视频编码器(300)还包括：二次采样分析器(415)，用于在对通过第一通路编码得到的信息进行复杂度分析之前，对所述信息执行分析，所述信息用于后一通路编码。

11.根据权利要求10所述的多通路视频编码器，其中，执行位于复杂度分析前的、对通过所述第一通路编码得到的信息执行的所述分析，以为所述后一通路编码提供对所述输入图像数据的压缩参数的统计估计。

12.一种多通路视频编码方法，包括：

对输入图像数据的至少一部分进行二次采样；

对二次采样后的图像数据执行第一通路编码，

空间二次采样是通过对图像数据进行裁剪来实现的，

13.根据权利要求12所述的方法，其中，所述二次采样步骤通过降低所述至少一图像中的至少一图像的空间分辨率，来对所述输入图像数据的所述至少一部分进行空间二次采样。

14.根据权利要求13所述的方法，其中，所述二次采样步骤通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

15.根据权利要求13所述的方法，其中，所述二次采样步骤通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

16.根据权利要求12所述的方法，其中，所述二次采样步骤通过对所述至少一图像中的至少一图像进行裁剪，来对所述输入图像数据的所述至少一部分进行空间二次采样。

17.根据权利要求16所述的方法，其中，所述二次采样步骤通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

18.根据权利要求16所述的方法，其中，所述二次采样步骤通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

19.根据权利要求12所述的方法，其中，所述二次采样步骤通过规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

20.根据权利要求12所述的方法，其中，所述二次采样步骤通过不规则地跳过所述至少一图像中的至少一图像，来对所述输入图像数据的所述至少一部分进行时间二次采样。

21.根据权利要求13所述的方法，还包括：在对通过所述第一通路编码得到的信息执行复杂度分析之前，对所述信息执行分析(715)，所述信息用于后一通路编码。

22.根据权利要求21所述的方法，其中，执行位于复杂度分析前的、对通过所述第一通路编码得到的信息执行的所述分析，以为所述后一通路编码提供对所述输入图像数据的压缩参数的统计估计(715)。

23.一种多通路视频编码器(400)，包括：

二次采样器(405)，用于对输入图像数据的至少一部分进行二次采样；

第一通路编码器(410)，用于对二次采样后的图像数据执行第一通路编码，以及

二次采样分析器(415)，用于通过所述第一通路编码得到的信息执行分析，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性，

其中，对信息的分析是通过使用来自P图像、B图像和I图像的参数的加权平均来执行的，所述P图像、B图像和I图像是从第一通路获得的。

24.一种多通路视频编码方法，包括：

对输入图像数据的至少一部分进行二次采样；

对二次采样后的图像数据执行第一通路编码；以及

对通过所述第一通路编码得到的信息执行分析(715)，以提高在后一通路编码前发生的后续复杂度分析中所使用的信息的可靠性，

25.根据权利要求24所述的方法，其中，执行位于复杂度分析前的、对通过所述第一通路编码得到的信息执行的所述分析，以为所述后一通路编码提供对所述输入图像数据的压缩参数的统计估计(715)。