Connect public, paid and private patent data with Google Patents Public Datasets

自适应画面组(gop)结构选择的方法和装置

Info

Publication number
CN101379828A
CN101379828A CN 200780004366 CN200780004366A CN101379828A CN 101379828 A CN101379828 A CN 101379828A CN 200780004366 CN200780004366 CN 200780004366 CN 200780004366 A CN200780004366 A CN 200780004366A CN 101379828 A CN101379828 A CN 101379828A
Authority
CN
Grant status
Application
Patent type
Prior art keywords
selection
group
pictures
apparatus
picture
Prior art date
Application number
CN 200780004366
Other languages
English (en)
Other versions
CN101379828B (zh )
Inventor
亚力山德罗斯·迈克尔·图拉皮斯
吉尔·麦克唐纳·布瓦斯
鹏 尹
Original Assignee
汤姆森许可贸易公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

提出了一种用于自适应画面组结构选择的方法和装置。该装置包括编码器(100),用于通过针对视频序列的每一个画面组,执行画面编码次序选择、画面类型选择以及参考画面选择,使用画面组结构来对视频序列进行编码。该选择基于画面组长度。

Description

自适应画面组(GOP)结构选择的方法和装置

相关申请的交叉参考

本申请要求在2006年2月6日提交的美国临时申请No.60/765,552

的利益,其全部公开一并在此作为参考。

技术领域

本发明总体上涉及视频编码,更具体地,涉及一种用于自适应画 面组(GOP)结构选择的方法和装置。

背景技术

通常,在先前和当前视频编码标准和推荐标准中,画面组(GOP) 结构仅涉及GOP长度(N)和画面类型(即,P画面间隔M)选择。 例如,这种先前的视频编码标准和推荐标准包括:国际标准化组织/ 国际电工委员会(ISO/IEC)运动画面专家组-l(MPEG-l)标准、ISO/IEC MPEG-2标准以及国际电信联盟电信分部(ITU-T) H,263推荐标准。 新的视频压縮标准/推荐标准,ISO/IEC MPEG-4 Part 10 Advanced Video Coding (AVC)标准/ITU-T H.264推荐标准(以下称为"MPEG-4 AVC标准"),提出了几种新的工具来改进编码效率。

类似于先前的视频编码标准和推荐标准,该MPEG-4 AVC标准使 用/支持三种不同的画面(图像片段)类型(1、 P和B画面(图像片 段))。此外,MPEG-4 AVC标准包括新的工具/特征来改进编码效率。

例如,MPEG-4 AVC标准将参考画面的次序与显示次序去耦合。 在现有技术的视频编码标准和推荐标准中,在出于运动补偿目的的画 面的排序和出于显示目的的画面的排序之间存在着严格的相关性。在 MPEG-4 AVC标准中,极大程度地去除了这些限制,使编码器能够更 灵活地选择参考次序和显示次序。

此外,MPEG-4AVC标准将画面表述方法与画面参考能力去耦合。 在现有技术的视频编码标准和推荐标准中,B画面不能用作用于视频 序列中其它画面的预测的参考。在MPEG-4AVC标准中,没有这样的 限制。可以使用任意类型的画面作为参考画面或非参考画面。

此外,该MPEG-4AVC标准允许运动补偿的多参考画面。利用这 些新的特征,当选择GOP结构时,不仅需要考虑GOP长度和画面类 型选择,还需要考虑画面的编码次序和参考画面选择。

大多数与GOP结构相关的之前的工作关注于GOP长度和画面类 型选择。通常,由应用固定GOP长度。当允许动态的GOP长度时, 场景变化之后的第一画面被编码为I画面,并且下一个GOP合并在当 前GOP中。

在第一现有技术方案中,公开了一种方法,其中通过考虑时域分 割来适配GOP结构。也就是,根据输入视频的时域变化来调整画面类型。

在第二现有技术方案中,公幵通过利用拉格朗日乘法方法求解最 小化问题,可以从可能的候选中选择GOP中的最优画面类型。

在第三现有技术方案中,公开了一种系统,其中将宏块动作信息 来判断画面类型。

如上所述,大多数与GOP结构相关的现有技术仅关注GOP长度 和画面类型选择。然而,仅考虑GOP长度和画面类型不利地限制了 MPEG-4 AVC标准的灵活性。

发明内容

本发明解决了现有技术的这些和其他缺陷和缺点,其针对一种自 适应画面组(GOP)结构选择的方法和装置。

根据本发明的一个方面,提出了一种装置。该装置包括编码器, 用于通过针对视频序列的每一个画面组执行画面编码次序选择、画面 类型选择以及参考画面选择,使用画面组结构对视频序列进行编码。 该选择基于画面组长度。

根据本发明的另一方面,提出了一种视频编码方法。该方法包括: 通过针对视频序列的每一个画面组执行画面编码次序选择、画面类型 选择以及参考画面选择,使用画面组结构对视频序列进行编码。该选 择基于画面组的长度。

结合附图阅读下面的示例性实施例的详细描述,本发明的原理的 这些和其它方面、特点和优点将变得显而易见。

附图说明

根据下面示例性的附图,可以更好地理解本发明,其中: 图1示出了根据本发明实施例可以应用本发明的示例视频编码器 的方框图;

图2示出了根据本发明实施例的自适应画面组(GOP)结构选择 的示例方法的流程图;

图3示出了根据本发明实施例的用于执行画面组(GOP)长度判

断的示例方法的流程图;

图4示出了根据本发明实施例的用于确定画面编码次序的示例方

法的流程图;

图5示出了根据本发明实施例的用于选择画面类型的示例方法的 流程图。

具体实施方式

本发明针对自适应画面组(GOP)结构选择的方法和装置。

本说明书描述了本发明的原理。可以理解,尽管这里没有明确描 述或示出,然而本领域的技术人员能够设想出体现本发明的原理并且 包括在本发明的精神和范围内的各种设置。

因此,这里所引述的所有示例和条件性语言均为了教导的目的, 以帮助读者理解本发明的原理以及发明人对现有技术做出贡献的概 念,应被看作不会被限制为具体引述的示例和条件。

此外,这里对本发明的原理、方面、实施例及其特定示例做出引 述的所有声明意在包括本发明的结构和功能上的等同物。另外,该等

同物将包括当前已知的等同物以及将来开发出的等同物,即所幵发出 来的执行相同功能的任何组件,而与结构无关。

因此,本领域的技术人员可以理解,例如这里所表示的框图展示 出体现本发明原理的示意性电路的概念图。类似地,可以理解,任何 流程、流程图、状态转移图、伪代码等表现出实质上可以在计算机可 读介质上表现的、并且由计算机或处理器执行的各个过程,无论是否 明确示出该计算机或处理器。

可以通过使用专用硬件和能够与适合的软件一同执行软件的硬件 而实现图中所示各个组件的功能。当由处理器来提供时,这些功能可 以由单个的专用处理器、单个的共享处理器、或多个单独的处理器来 提供,其中一些可以是共享的。此外,术语"处理器"或"控制器" 的显式使用不应被解释为排他性地指代能够执行软件的硬件,而且可 以隐式地包括(不限为)数字信号处理器("DSP")硬件、用于存储软

件的只读存储器("R0M")、随机存取存储器("RAM")以及非易失性存 储器。

还可以包括常规和/或专用的其它硬件。类似地,图中所示的任何 开关仅是概念上的。其功能可以通过程序逻辑的操作、专用逻辑、程 序控制和专用逻辑的交互、或甚至是手动地而实现,实施者可以选择 的具体技术可以从上下文中得到明确的理解。

在权利要求书中,表示为用于执行特定功能的装置的任何组件意在 包括执行该功能的任何方式,例如包括:a)执行该功能的电路组件的 组合,或b)任意形式的软件,包括固件、微代码等,以及用于执行 该软件以执行该功能的适合的电路。由权利要求所限定的本发明在于

如下事实:将各个引述的装置所提供的功能以权利要求所要求的方式 组合在一起。因此,可以把能够提供这些功能的任意装置看作与这里 所示的装置相等同。

在说明书中涉及本发明原理的"一个实施例"或"实施例"是指: 结合实施例描述的特定特征、结构、特性等包括在本发明原理的至少 一个实施例中。因此,贯穿说明书的不同地方出现的术语"在一个实 施例中"或"在实施例中"不必均指相同的实施例。

转向图1,通常由参考数字100表示应用了本发明的示例性视频

编码器。

求和结点110的非反相输入和运动估计器180的第一输入可以用 作视频解码器100的输入。求和结点100的输出与变换器115的输入 通过信号通信连接。变换器115的输出与量化器120的输入通过信号 通信连接。量化器120的输出与可变长度编码器(VLC) 140的输入 通过信号通信连接。VLC 140的输出可以用作编码器100的输出。

量化器120的输出还通过信号通信与逆量化器150的输入连接。 逆量化器150的输出通过信号通信与逆变换器的输入连接。在信号通 信中,逆变换器的输出与参考画面存储器170的输入连接。参考画面 存储器170的第一输出通过信号通信与运动估计器180的第二输入连 接。运动估计器180的输出通过信号通信与运动补偿器190的第一输 入连接。参考画面存储器170的第二输出通过信号通信与运动补偿器 190的第二输入连接。运动补偿器190的输出通过信号通信与求和结 点110的反相输入连接。

有利地,提供了一种用于画面组(GOP)结构选择的方法和装置, 在实施例中,用于GOP结构选择的方法和装置可以包括在判断过程中 分析GOP长度、画面编码次序、画面类型选择和画面参考判断。艮P, 该方法和装置可以联合地考虑GOP结构选择的GOP长度、画面编码 次序、画面类型选择和参考画面选择。

尽管描述了联合考虑GOP长度、画面编码次序、画面类型选择 和参考画面判断的、具有自适应G0P结构的MPEG-4 AVC标准编码 方案,可以设想,本发明并不局限于前述考虑,也不局限于MPEG-4 AVC标准。即,根据这里提供的本发明的示教,在保持本发明的范围 的同时,本领域的普通技术人员能够设想可以应用本发明的这些或各 种其他考虑以及视频编码标准/推荐标准。

在一个实施例中,首先执行镜头检测(shot detection)。然后,基 于时域分割来判断GOP长度。然后,在每一个GOP中,判断结合了

画面类型和参考画面选择的画面编码次序。

转向图2,通常,通过参考数字200表示自适应画面组(GOP)

结构判断的示例性方法。

方法200包括传递控制到功能块210的初始化块205。功能块210 执行镜头检测,并传递控制到功能块215。该功能块215判断GOP长 度N,并传递控制到功能块220。该功能块220确定画面编码次序, 执行画面类型选择,并传递控制到功能块225。功能块225执行参考 画面选择(例如,基于画面次序计数(POC)禾n/或相关性),并传递 控制到功能块230。该功能块230编码GOP中的画面,并传递控制到 判断块235。判断块235确定序列是否结束。如果是,则传递控制到 结束块240。否则,返回控制到功能块210。

例如,现在,根据本发明的实施例来进一步描述由图2中方法200 的功能块215执行的GOP长度的选择。

基于镜头检测来动态地选择GOP长度。不同于仅检测场景剪辑 (scene cut)的现有方法,还检测诸如淡入和消失之类的慢过渡。通 常,GOP长度N被固定为预定值。如果检测到场景剪辑,则长度为N 的新GOP从场景剪辑后的第一画面重新开始,如果检测到慢过渡,则 新GOP从过渡的起始点重新开始,并以过渡的结束点结束。

转向图3,通常,由参考数字300指示执行画面组(GOP)判断的示 例性方法。方法300涉及图2中方法200的功能块215。

方法300包括传递控制到功能块310的初始化块305。功能块310 执行镜头检测,并传递控制到功能块315。该功能块315确定是否检 测到场景剪辑。如果是,则传递控制到功能块335。否则,传递控制 到判断块320。

功能块335重新开始具有预定长度N的GOP,并传递控制到结束 块330。

判断块320确定是否己经检测到慢过渡。如果是,则传递控制到 功能块325。否则,传递控制到功能块340。

功能块325从过渡的起始点重新开始新GOP,并在过渡的结束点 结束,并传递控制到结束块330。

功能块340将GOP长度设置为N,并传递控制到结束块330。

例如,现在,根据本发明的实施例来进一步描述由图2中方法200的功能块220执行的画面编码次序的确定。

基于内容的特征来判断每一个GOP中的画面编码次序。对于某

些特定特征,像交叉变淡,淡入序列的反转编码(reverse coding)具 有较高的编码效率。在两种情况下考虑从该点可以发生反转编码的切 换点的检测。

在第一情况下,如果该序列是纯淡入,则将切换点设置成在满足 延迟约束、解码的画面的缓存器(DPB)的大小以及淡入序列的结束 画面的同时可以被反转的最大画面个数的最小值。由于将淡入编码为 单个GOP,可以对GOP的开始处和GOP的结束处的画面反转地编码。

在第二情况下,如果序列是消失,则切换点的检测基于画面的简 单绝对差。当然,可以设想还可以使用其他失真度量来检测切换点,

同时保持本发明的范围。如下当前画面与开始画面和结束画面的失真: distortion/start = Z|YFcur[x,y] - YF start [x,y]|

distortion/end = HYFcur[x,y] - YFend[x,y]|

其中,Y表示画面的亮度值,x指定了图像的列索引,y指定了图

像的行索引,YFcur表示当前帧的亮度值,YFstart表示起始帧的亮度值, 以及YFend表示结束帧的亮度值。只要^加r"o" / Wa" > cfotoWo" / 就标

记切换点。

大多开放情形中,应用延迟约束将反转编码限制在MPEG-4AVC

标准所规定的解码器画面缓存器约束中。

转向图4,通常,由参考数字400指示用于确定画面编码次序的

示例性方法。方法400涉及图2中方法200的功能块220。

方法400包括传送控制到功能块410的初始化块405。功能块410

执行镜头检测,并传送控制到判断块415。判断块415确定是否已经

检测到淡入和消失。如果是,则传送控制到功能块420。否则,传送

控制到功能块425。

功能块420找到切换点,并传送控制到功能块425。 功能块425判断画面编码次序,并传送控制到结束块430。 例如,现在,根据本发明的实施例,进一步描述由图2中功能块

220执行的画面类型选择的执行。

例如,按照表1所示确定的编码次序M=l,2,3,4选择画面类型。 可以设想,本发明也可以应用到其它画面类型,包括但不局限于:等 级B结构,同时保持本发明的范围。表1演示了画面类型和编码次序,

其中"BS"表示存储的B画面,"B"表示可任意使用的B画面。将 GOP中两个连续P画面之间的归一化距离用于判断M。将M选择为 具有最小距离的值。可以使用多个距离度量,诸如图像的绝对差、直 方图的差、差的直方图、差的块直方图、块的方差、运动补偿误差等 等。即,本发明并不局限于使用任意特定距离度量,因此,根据本发 明的示教,本领域和相关技术领域的普通技术人员可以很容易的设想 任意距离度量,同时保持本发明的范围。在一个实施例中,使用差的 直方图,即,由hod(i)表示的j;-1的直方图,其中,Ze[i + l,i-1]。

如下定义该距离度量:

<formula>formula see original document page 12</formula>

其中,a是用于确定位置到零的贴近度(closeness)的阈值。

<table>table see original document page 12</column></row> <table>

表1

转向图5,通常,由参考数字500指示选择画面类型的示例性方 法。方法500涉及图2的方法200的功能块220。

方法500包括将变量min一dist初始化为0xFFFF的初始化块505, 并传递控制到有限循环块510。有限循环块510开始一个循环(i二l:4), 对于画面组(GOP)中M个差值中的每一个进行循环,并传递控制到 功能块515。功能块515计算归一化距离norm—dist,并传递控制到判 断块520。判断块520确定是否norm—dist<min—dist。如果是,则传递

控制到功能块525。否则,传递控制到结束循环的有限循环块530。

例如,现在,根据本发明的实施例,进一步描述由图2的功能块 225执行的参考画面的执行。

参考画面选择可以在两个步骤执行。第一步骤包括判断是否存储 当前编码的画面作为可能的参考画面,并判断从参考缓冲器中可以移 除哪个之前存储的画面。第二步骤包括从参考列表中选择L参考画面 (L是由编码器预定的值),以及判断可以用于每一个P/B画面编码的 参考画面的次序。

为了示例性的目的,这里提供两个示例性算法。第一算法基于画 面次序计数(POC),下文中将其称为"POC算法"。第二算法基于相 关性度量,下文中将其称为"CORRELATION算法"。

在POC算法中,参考画面的移除基于POC的次序:首先移除具 有最小POC数的画面。对于参考画面选择,首先重新排序参考列表, 然后选择第一L画面作为参考画面。对于B画面,参考列表与初始化 列表相同。对于P画面,按照与B画面的初始化列表O相同的方式, 根据POC次序重新排序参考列表。

在CORRELATION算法中,步骤l与POC算法相同。在步骤2 中,采用相关性度量用于参考画面选择和重新排序。使用与当前画面 具有最高相关性的L参考画面。

在下文中,提供了一种使用直方图的差的算法。然而,可以设想 本发明并不局限于在提供自适应画面组(GOP)结构选择中仅使用直 方图的差,因此,其它度量包括但不局限于:也可以使用像素的绝对 差,同时保持本发明的范围。

首先,如下计算参考画面j和当前画面i的亮度直方图差:

nb一bins-l

YHistoDiffref (j) = —^>(j) I YHisto咖(i)-YHistoref (j) |

其中,YHistoDiff是亮度直方图的差,nb—bins表示bins的个数, 及《 (j)表示参考画面j的权重,参考画面j与当前画面i的距离为 c/())-l尸OC(/)-POC(y)l,向越接近当前画面的参考画面分配越小的权重。

YHisto表示亮度的直方图,ref表示参考画面,以及cur表示当前画面。

可以采用如下线性权重:

= (1 - (max— re/ — cfo tan ce — c/ (_/)) * 0.1)

其中,max—ref—distance表示参考画面缓存器中的参考画面到当前 画面的最大距离。如之前定义的,d (j)是参考画面j到当前画面I 的距离。

给出本发明的多个附属优点/特征的一些的描述,其中一些已经在 上文中描述过。例如, 一个优点/特征是包括编码器的装置,所述编码 器用于通过针对视频序列的每一个画面组执行画面编码次序选择、画 面类型选择以及参考画面选择,使用画面组结构对视频序列进行编码。 该选择基于画面组长度。

另一优点/特征是一种具有上述编码器的装置,其中编码器执行镜 头检测来确定视频序列的时域分割,基于该时域分割判断画面组长度, 并在视频序列的每一个画面组内,执行画面编码次序选择、画面类型 选择和参考画面选择。另一个优点/特征是具有上述编码器的装置,其 中编码器基于时域分割和视频序列中缺乏任意场景剪辑或慢过渡,将 画面组长度设置为预定值,当检测到场景剪辑时,从场景剪辑后的第 一画面中,重新开始具有画面组长度的视频序列的新画面组,当检测 到慢过渡时,从慢过渡的起始点重新开始新画面组并在慢过渡的结束 点处结束。

此外,另一个优点/特征是具有上述编码器的装置,其中视频序列 包括淡入序列,编码器在淡入序列中针对淡入和消失使用反转编码。 进一步,另一个优点/特征是具有上述使用反转编码的编码器的装置, 其中编码器根据过渡类型判断用于反转编码的切换点。此外,另一个 优点/特征是具有上述判断反转编码的切换点的编码器的装置,其中, 当画面类型是纯淡入时,编码器将切换点设置为在满足延迟约束、解 码的画面缓存器的约束以及淡入序列的结束画面的同时可以反转的最 大画面数量的最小值。另外,另一个优点/特征是具有上述判断反转编 码的切换点的编码器的装置,其中,当过渡类型是消失时,编码器基 于画面的绝对差来检测切换点。

此外,另一个优点/特征是具有上述编码器的装置,其中,编码器

基于归一化的距离,从画面类型的预定义类别中选择画面类型。此外, 另一个优点/特征是具有上述从画面类型的预定类别中选择画面类型 的编码器的装置,其中,用于从画面类型的预定类别中选择画面类型 的选择标准包括:图像的绝对差、直方图的差、差的直方图、差的块 直方图、块的方差或运动补偿误差中的至少一个。

'同样,另一个优点/特征是具有上述的编码器的装置,其中编码器 基于画面次序计数和相关性中的至少一个执行参考画面选择。

基于这里的示教,相关技术领域的一个普通技术人员可以真正的 探知本发明的这些和其他特征和优势。应该理解,本发明的示教可以 实施在各种不同类型的硬件,软件,固件,特殊目的处理器,或其组 合中。

基于这里的教导,相关技术领域中的技术人员可以容易地获知本 发明的这些和其他特征及优点。可以理解的是,本发明的教导可以以 各种形式的硬件、软件、固件、专用处理器或其组合来实现。

最为优选地,本发明的教导以硬件和软件的组合来实现。此外, 软件优选地以有形地体现在程序存储单元上的应用程序来实现。该应 用程序可以上载到包括任意适合架构的机器,并由该机器执行。优选 地,该机器在具有例如一个或更多个中央处理单元("CPU")、随机存 取存储器("RAM")、以及输入/输出("I/O")接口的硬件的计算机平 台上实现。该计算机平台还包括操作系统和微指令代码。这里描述的 各个过程和功能可以是微指令代码的一部分,或是应用程序的一部分,

或是其任何组合,其可以由CPU来执行。另外,可以把各种其他外围单

元与计算机平台相连,例如附加的数据存储单元和打印单元。

还可以理解的是,由于附图中描述的某些构成系统的组件和方法 优选地以软件来实现,所以系统组件或过程功能块之间的实际连接可 能取决于本发明的实践方式而有所不同。在这里给出的教导的前提下, 相关技术领域中的技术人员将能够设想本发明的这些和类似的实现或 配置。

尽管已经参考附图描述了示意性实施例,然而可以理解,本发明 不限于这些特定的实施例,在不背离本发明的范围或精神的前提下,

相关技术领域中的技术人员可以实现各种改变和修改。所有这些改变 和修改都将被看作落入所附权利要求限定的本发明的范围内。

Claims (20)

1. 一种装置,包括:编码器(100),用于通过针对视频序列的画面组执行画面编码次序选择、画面类型选择以及参考画面选择,使用画面组结构来对视频序列进行编码,其中,所述选择基于画面组的长度。
2. 根据权利要求l的装置,其中,所述编码器(100)执行镜头检测来确定视频序列的时域分割,基于时域分割来判断画面组长度, 并在针对视频序列的每一个画面组内,执行画面编码次序选择、画面 类型选择以及参考画面选择。
3. 根据权利要求2的装置,其中,所述编码器(100)基于视频 序列中的时域分割和不存在任意场景剪辑或慢过渡,将画面组长度设 置为预定值,当检测到场景剪辑时,从场景剪辑后的第一画面重新开 始具有画面组长度的视频序列的新画面组,并当检测到慢过渡时,从 慢过渡的起始点重新开始新画面组,并在慢过渡的结束点处结束。
4. 根据权利要求l的装置,其中,所述视频序列包括淡入序列, 所述编码器对淡入序列中的淡入和消失进行反转编码。
5. 根据权利要求4的装置,其中,所述编码器(100)基于过渡类型来确定用于反转编码的切换点。
6. 根据权利要求5的装置,其中,当过渡类型是纯淡入时,所述 编码器(100)将切换点设置为在满足延迟约束、解码的画面缓存器约 束以及淡入序列的结束画面的同时能够被反转的最大画面个数的最小值。
7. 根据权利要求5的装置,其中,当过渡类型是消失时,所述编 码器(100)基于画面的绝对差来检测切换点。
8. 根据权利要求1的装置,其中,基于归一化的距离,所述编码 器(100)从画面类型的预定类别中选择画面类型。
9. 根据权利要求8的装置,其中,用于从画面类型的预定类别中 选择画面类型的选择标准包括:图像的绝对差、直方图的差、差的直 方图、差的块直方图、块方差或运动补偿误差中的至少一个。
10. 根据权利要求l的装置,其中,基于画面次序计数值和相关 性中的至少一个,所述编码器(100)执行参考画面选择。
11. 一种视频编码方法,包括:通过针对视频序列的画面组执行画面编码次序选择、画面类型选 择以及参考画面选择,使用画面组来编码视频序列(200), 其中,所述选择基于画面组长度。
12. 根据权利要求】1的方法,其中,所述编码步骤包括.-执行(210)镜头检测来确定视频序列的时域分割; 基于时域分割来判断(215)画面组长度;以及 在视频序列的每一个画面组内,执行(220, 225)画面编码次序选择、画面类型选择以及参考画面选择。
13. 根据权利要求12的方法,其中,所述编码步骤还包括: 基于视频序列中的时域分割和不存在任意场景剪辑和慢过渡,将画面组长度设置为预定值;当检测到场景剪辑时,从场景剪辑后的第一画面重新开始(335) 具有画面组长度的新画面组;当检测到慢过渡时,从慢过渡的起始点重新开始(325)新画面组, 并在慢过渡的结束点处结束。
14. 根据权利要求U的方法,其中,所述视频序列包括淡入序列, 以及所述编码步骤对淡入序列(400)中的淡入和消失使用反转编码。
15. 根据权利要求14的方法,其中,所述编码步骤包括:基于过 渡类型,判断(420)用于反转编码的切换点。
16. 根据权利要求15的方法,其中,当过渡类型是纯淡入(420) 时,所述编码步骤将所述切换点设置为在满足延迟约束、解码的画面 缓存器约束以及淡入序列中的结束画面的同时能够被反转的最大画面 个数的最小值。
17. 根据权利要求15的方法,其中,当变换类型是消失(420) 时,所述编码步骤基于画面的绝对差来检测切换点。
18. 根据权利要求11的方法,其中,所述编码步骤基于归一化的 距离(515),从画面类型的预定类别中选择画面类型。
19. 根据权利要求18的方法,其中,从画面类型的预定类别中选 择画面类型的选择标准包括:画面的绝对差、直方图的差、差的直方 图、差的块直方图、块的方差或运动补偿误差中的至少一个。
20. 根据权利要求12的方法,其中,所述解码步骤基于画面次序 计数和相关性(225)中的至少一个来执行参考画面选择。
CN 200780004366 2006-02-06 2007-01-30 自适应画面组(gop)结构选择的方法和装置 CN101379828B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US76555206 true 2006-02-06 2006-02-06
US60/765,552 2006-02-06
PCT/US2007/002387 WO2007092193A3 (en) 2006-02-06 2007-01-30 Method and apparatus for adaptive group of pictures (gop) structure selection

Publications (2)

Publication Number Publication Date
CN101379828A true true CN101379828A (zh) 2009-03-04
CN101379828B CN101379828B (zh) 2011-07-06

Family

ID=38283710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200780004366 CN101379828B (zh) 2006-02-06 2007-01-30 自适应画面组(gop)结构选择的方法和装置

Country Status (5)

Country Link
US (1) US9602840B2 (zh)
JP (1) JP5415084B2 (zh)
CN (1) CN101379828B (zh)
EP (1) EP1982528A2 (zh)
WO (1) WO2007092193A3 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223535A (zh) * 2011-06-07 2011-10-19 东莞电子科技大学电子信息工程研究院 一种基于svc的自适应图像组结构选择方法
CN104506870A (zh) * 2014-11-28 2015-04-08 北京奇艺世纪科技有限公司 一种适用于多码流的视频编码处理方法和装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5579730B2 (ja) * 2008-11-12 2014-08-27 トムソン ライセンシングThomson Licensing 明るさ変化コーディング
US9143788B2 (en) 2008-11-13 2015-09-22 Thomson Licensing Multiple thread video encoding using HRD information sharing and bit allocation waiting
US9426477B2 (en) * 2010-02-25 2016-08-23 International Business Machines Corporation Method and apparatus for encoding surveillance video
GB201104034D0 (en) * 2011-03-09 2011-04-20 Canon Kk Video encoding and decoding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3221785B2 (ja) * 1993-10-07 2001-10-22 株式会社日立製作所 撮像装置
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
JP3954656B2 (ja) * 1994-09-29 2007-08-08 ソニー株式会社 画像符号化装置及び方法
JP3384910B2 (ja) * 1995-05-30 2003-03-10 株式会社日立画像情報システム 撮像装置および画像再生装置
FR2764156B1 (fr) 1997-05-27 1999-11-05 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
US6195458B1 (en) * 1997-07-29 2001-02-27 Eastman Kodak Company Method for content-based temporal segmentation of video
JPH1175189A (ja) * 1997-08-27 1999-03-16 Mitsubishi Denki Syst Lsi Design Kk 画像符号化方法
US6307886B1 (en) * 1998-01-20 2001-10-23 International Business Machines Corp. Dynamically determining group of picture size during encoding of video sequence
KR100571307B1 (ko) 1999-02-09 2006-04-17 소니 가부시끼 가이샤 코딩 시스템 및 방법, 부호화 장치 및 방법, 복호화 장치및 방법, 기록 장치 및 방법, 및 재생 장치 및 방법
US6771825B1 (en) * 2000-03-06 2004-08-03 Sarnoff Corporation Coding video dissolves using predictive encoders
JP2002010270A (ja) 2000-06-27 2002-01-11 Mitsubishi Electric Corp 画像符号化装置及び画像符号化方法
JP2002084544A (ja) * 2000-09-06 2002-03-22 Mitsubishi Electric Corp 動画像符号化装置および動画像符号化方法
JP3815665B2 (ja) 2000-12-27 2006-08-30 Kddi株式会社 可変ビットレート動画像符号化装置および記録媒体
US6959044B1 (en) * 2001-08-21 2005-10-25 Cisco Systems Canada Co. Dynamic GOP system and method for digital video encoding
JP3907996B2 (ja) * 2001-10-15 2007-04-18 日本電信電話株式会社 画像符号化装置、画像復号装置並びにその方法及び画像符号化プログラム、画像復号プログラム
JP3888533B2 (ja) 2002-05-20 2007-03-07 Kddi株式会社 画像特徴に応じた画像符号化装置
US20040146108A1 (en) * 2003-01-23 2004-07-29 Shih-Chang Hsia MPEG-II video encoder chip design
KR100597402B1 (ko) * 2003-12-01 2006-07-06 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
WO2005055608A1 (en) 2003-12-01 2005-06-16 Samsung Electronics Co., Ltd. Method and apparatus for scalable video encoding and decoding
KR100596706B1 (ko) * 2003-12-01 2006-07-04 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
RU2329615C2 (ru) 2003-12-01 2008-07-20 Самсунг Электроникс Ко., Лтд. Способ масштабируемого кодирования и декодирования видеосигнала и устройство для его осуществления

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223535A (zh) * 2011-06-07 2011-10-19 东莞电子科技大学电子信息工程研究院 一种基于svc的自适应图像组结构选择方法
CN104506870A (zh) * 2014-11-28 2015-04-08 北京奇艺世纪科技有限公司 一种适用于多码流的视频编码处理方法和装置

Also Published As

Publication number Publication date Type
JP2009526435A (ja) 2009-07-16 application
WO2007092193A2 (en) 2007-08-16 application
WO2007092193A3 (en) 2007-10-04 application
US20090122860A1 (en) 2009-05-14 application
US9602840B2 (en) 2017-03-21 grant
JP5415084B2 (ja) 2014-02-12 grant
EP1982528A2 (en) 2008-10-22 application
CN101379828B (zh) 2011-07-06 grant

Similar Documents

Publication Publication Date Title
US6580829B1 (en) Detecting and coding flash frames in video data
US20090196355A1 (en) 2-bin parallel decoder for advanced video processing
US20110051811A1 (en) Parallel digital picture encoding
US20080192830A1 (en) Method of encoding and decoding motion picture frames
JPH10224800A (ja) 動きベクトル符号化方法および復号化方法
JP2008011204A (ja) 符号化回路、復号回路、エンコーダ回路、デコーダ回路、cabac処理方法
US6748114B1 (en) Moving picture encoding method and moving picture encoding apparatus
CN1525762A (zh) 一种用于视频编码的编码端/解码端双向预测方法
JP2010081465A (ja) 動画像符号化方法および動画像復号化方法
JP2004056823A (ja) 動きベクトル符号化/復号化方法及びその装置
JP2003037844A (ja) 動画像符号化装置
CN1471320A (zh) 双向预测(b)图像的时间空间预测和多图像参照移动补偿的移动向量预测
JP2003304538A (ja) 画像符号化装置、画像復号化装置及びそれらの方法
JP2009201112A (ja) 直接モード符号化及び復号化方法
JP2009105696A (ja) 予測モード情報符号化方法,予測モード情報復号方法,これらの装置,およびこれらのプログラム並びにコンピュータ読み取り可能な記録媒体
JP2004088736A (ja) 動画像の符号化方法、復号化方法、データストリーム、データ記録媒体およびプログラム
JPH10304374A (ja) 動画像符号化装置
JPH0654315A (ja) 動画像符号化方法及び装置
CN101610417A (zh) 一种图像填充方法、装置及设备
US20090034617A1 (en) Image encoding apparatus and image encoding method
US20050089232A1 (en) Method of video compression that accommodates scene changes
CN101605256A (zh) 一种视频编解码的方法及装置
JP2000032474A (ja) 動画像符号化装置
US8319672B2 (en) Decoding device for context-based adaptive binary arithmetic coding (CABAC) technique
JP2008153907A (ja) 画像符号化装置及びそれらを含む情報端末ならびに画像符号化方法

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
C14 Grant of patent or utility model