CN104396239B - 用于编码视频信号的装置和方法 - Google Patents

用于编码视频信号的装置和方法 Download PDF

Info

Publication number
CN104396239B
CN104396239B CN201280074090.8A CN201280074090A CN104396239B CN 104396239 B CN104396239 B CN 104396239B CN 201280074090 A CN201280074090 A CN 201280074090A CN 104396239 B CN104396239 B CN 104396239B
Authority
CN
China
Prior art keywords
frame
reference frame
field
marked
mobile type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280074090.8A
Other languages
English (en)
Other versions
CN104396239A (zh
Inventor
L.利特维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN104396239A publication Critical patent/CN104396239A/zh
Application granted granted Critical
Publication of CN104396239B publication Critical patent/CN104396239B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Abstract

提供用于编码视频信号的装置和方法,其中视频信号的每个图帧包括一个或多个对应的参考帧,每个参考帧R包括第一场(例如顶场或底场)和第二场(例如底场或顶场)。接收要被编码的当前帧,并且选择参考帧的第一场或第二场以用于编码当前帧的第一场。基于参考帧的视频内容来执行选择。使用参考帧的所选择的场来编码当前帧的第一场。

Description

用于编码视频信号的装置和方法
技术领域
本发明涉及用于编码视频信号(例如其中视频信号的每个图帧与一个或多个参考帧关联、每个参考帧包括第一场和第二场(例如顶场和底场,或者反之亦然)的视频信号)的装置和方法。
背景技术
在密集视频编码或转码应用中,与通常在算法的单个信道“尽力而为”配置中所使用的资源相比,可要求视频压缩算法仅使用部分资源。这允许视频压缩算法的若干实例并行运行。
因为视频压缩算法基于编码运动补偿预测的残差,所以大量的算法资源致力于运动估计。通过计算在参考图缓冲器中存储的重建(已编码)图和输入源图之间的差异来生成误差信号。算法的目标一直是最小化误差,使得要求少量数据被传送。
在视频压缩中使用三种类型的图(或帧),称作I-帧、P-帧和B-帧。I-帧是“内编码图”,实际上是完全指定的图,就像常规静态图像文件。P-帧和B-帧仅持有部分图像信息,由此它们与I-帧相比,需要更少的空间来存储,并且因此提高视频压缩率。
P-帧(“预测图”)仅持有与前一帧相比的图像中的变化。例如,在对象跨静态背景移动的场景中,仅对象的移动需要被编码。编码器不需要存储P-帧中的未变化的背景像素,因此节省空间。P-帧还称作delta-帧。
B-帧(“双预测图”)通过使用当前帧和前一帧、后一帧之间的差异以指定其内容来节省甚至更多的空间。
因此,为了在编码之前从源图移除最大冗余度,典型视频压缩算法使用一个或多个所存储的参考图来编码一个输入图。这使得运动估计成为编码算法中的最昂贵的操作之一。因此,减少由运动估计使用的参考图的数量帮助减少总编码算法的计算复杂性。
在如应用到隔行扫描编码的H.264视频编码标准中,将参考图存储为完整的帧。因此,在该情况中的参考图、场的数量是逐行扫描图编码的两倍,但是对于解码器没有任何性能负担。因此,在限制参考场的数量的隔行扫描情况中,可允许编码器仅使用来自所存储的参考帧的一个场。
H.264视频编码标准规定对于参考图列表的默认初始化过程以具有与所编码的场相同奇偶场的场来开始。在隔行扫描编码的所描述的情况中,编码器能够仅使用来自参考帧的一个场。这意味着,对于编码顶场,使用顶参考场。另一方面,如果当前所编码的场是底场,则使用来自参考帧的底场。这对于视频质量能够具有以下含义。
图1a示出一个示例,其中帧X的顶场X1参考过去的帧Q的顶场Q1(每个帧的顶场以阴影线示出,并且底场以没有任何阴影线示出)。但是,在视频信号中的顶场和底场之间强烈运动的情况中,帧Q的底场Q2与帧X的顶场X1更加相关。因而,根据H.264中的协定,没有使用最佳参考场。
图1b示出一个示例,其中尽管帧Q的顶场Q1时间上更靠近,但是参考帧X的底场X2参考过去的帧Q的底场Q2。因而,根据H.264中的协定,没有使用最佳参考场。
图1c示出一个示例,其中甚至在帧Q的顶场Q1具有更好质量并且在帧Q的顶场Q1和底场Q1之间不存在时间差异的情况中,非参考帧Y的底场Y2参考过去的帧Q的底场Q2。因而,根据H.264中的协定,没有使用最佳参考场。
图1d示出一个示例,其中帧X的底场X2参考未来的帧Z的底场Z2,尽管帧Z的顶场Z1具有更好质量并且在时间上更靠近。因而,根据H.264中的协定,没有使用最佳参考场。
图2示出参考图如何用在配置成如上所述操作的现有技术的编码器中。图2示出一系列帧21、22、23、24和25。每个帧示为包括顶场211、221、231、241、251和对应的底场212、222、232、242、252。帧21和25对应于P-图帧,其中短划线对应于其关联的参考图向量。帧22和24对应于B-图帧,其中实线对应于其关联的参考图向量。帧23对应于参考B-图帧,其中点线对应于其参考图向量。
如从图2能够看出,参考B-图帧23的顶场231仅能够参考P-图帧25(对应于未来的帧)的顶场251和P-图帧21(对应于过去的帧)的顶场211。同样地,参考B-图帧23的底场232仅能够参考P-图帧25(对应于未来的帧)的底场252和P-图帧21(对应于过去的帧)的底场212。同样适用于其它帧,由此能够看出,顶场仅能够参考另一个帧的顶场,并且底场仅能够参考另一个帧的底场。
如上所述,这具有如下缺点:对于编码不一定使用了最佳适合的参考场。
发明内容
本发明的一个目标是提供一种方法和装置,其避免或减少上述缺点中的至少一个或多个。
根据本发明的第一方面,提供一种用于编码视频信号的方法,其中视频信号的每个图帧与一个或多个参考帧关联,每个参考帧包括第一场和第二场。方法包括接收要被编码的当前帧以及选择参考帧的第一场或第二场以用于编码当前帧的第一场的步骤。基于视频信号的内容来执行该选择。使用参考帧的所选择的场来编码当前帧的第一场。
这样的实施例的一个优点是,它提供每个帧中所提供的第一参考场和第二参考场之间(例如,取决于哪个场当前被编码,在顶场和底场之间或者反之)的动态选择或抉择,由此,基于视频信号的内容,例如相同帧的顶场和底场之间的时间接近度,来优化抉择。
根据本发明的另一个方面,提供一种用于编码视频信号的视频编码装置,其中视频信号的每个图帧与一个或多个参考帧关联,每个参考帧包括第一场和第二场。装置包括用于接收要被编码的当前帧的接收单元。处理单元适合选择参考帧的第一场或第二场以用于编码当前帧的第一场。基于视频信号的内容来执行该选择。编码单元适合使用参考帧的所选择的场来编码当前帧的第一场。
附图说明
为了更好地理解本发明并且更清晰地示出可如何实现它,将仅通过举例参考下面的附图,其中:
图1a到1d示出根据现有技术如何使用参考帧来编码顶场和底场;
图2示出在现有技术编码器中如何使用参考图;
图3示出由本发明的实施例执行的方法;
图4示出由本发明的另一个实施例执行的方法;
图5示出根据本发明的一个实施例的视频编码装置;
图6示出由本发明的另一个实施例执行的方法;
图7示出根据本发明的实施例能够如何使用参考图;以及
图8示出由本发明的另一个实施例执行的方法。
具体实施方式
下面描述的本发明的实施例提供用于当使用来自参考帧的场来编码图帧的当前场时使得能够做出选择的方法和装置。本发明的实施例关于视频信号自身的内容,例如基于相同帧的顶场和底场之间的时间接近度(其提供帧中的运动的指示),来选择参考帧,使得当前所编码的场和参考场之间的冗余度能够被最大化,并且从当前所编码的场在其编码之前移除。
图3示出由本发明的一个实施例执行的用于编码视频信号的方法,其中,视频信号的每个图帧与一个或多个参考帧关联,每个参考帧R包括第一场和第二场(例如顶场和底场,或者反之亦然)。在步骤301中,接收要被编码的当前帧。方法包括选择参考帧R的第一场或第二场以用于编码当前帧的第一场X。步骤303,基于视频信号的内容来执行该选择。在步骤305中,使用参考帧的所选择的场来编码当前帧的第一场X。
要注意,取决于正在使用的编码类型,参考帧X可来自前一帧、未来的帧或者与当前帧相同的帧。
通过提供参考帧的第一场(例如顶场)或第二场(例如底场)之间的选择,这意味着对于编码能够使用最佳适合的帧,而不是仅使用由现有技术提供的以牙还牙(like-for-like)的缺省。这使最佳适合的帧能够基于视频信号的内容被选择,并且使最大冗余度能够在编码之前从源图中被移除。随着相关参考帧的场正在被用来编码帧的当前场,选择能够被动态执行。
根据一个实施例,该选择步骤包括以下步骤:确定参考帧R是被标记为“静止类型”帧还是“移动类型”帧,并且根据参考帧R被标记为静止类型帧还是移动类型帧来选择参考帧R的第一场或第二场。如下面将更详细地解释,“静止类型”帧是其中顶场和底场之间没有或几乎没有运动的帧,例如,若顶场和底场之间的运动在预定阈值以下。“移动类型”帧是其中顶场和底场之间的运动在阈值以上的帧。
当第一场是顶场时,本发明的实施例包括当参考帧R被标记为静止类型帧时选择参考帧R的第一场(顶场)的步骤。以类似方式,如果第一场是底场,则本实施例包括当参考帧R被标记为静止类型帧时选择参考帧R的第二场(底场)的步骤。
当第一场是顶场并且参考帧被标记为移动类型帧时,本发明的这个实施例包括选择参考帧R的第二场(底场)的步骤。以类似方式,如果第一场是底场并且参考帧被标记为移动类型帧,则本实施例包括选择参考帧R的第一场(顶场)的步骤。
图4示出由这样的方法执行的步骤,其中当前所编码的场等于当前帧的第一场X,并且其中参考场来自参考帧R,401。在步骤403中,确定参考帧是否标记为静止类型帧。如果不是,则在步骤405,提取参考帧R的第二场以用于与当前帧X的第一场进行编码。如果在步骤403中确定参考帧R被标记为静止类型帧,则在步骤407,提取参考帧R的第一场以用于与当前帧X的第一场进行编码。
在上面的实施例中,能够看出,场之间的选择基于参考帧R是被标记为“静止类型”还是“移动类型”,其提供指示视频信号的内容并且由此指示应选择参考帧的哪个场的简单方式。
当视频信号的内容中没有或几乎没有运动时,例如在运动的某阈值水平之下时,选择顶场对顶场或者底场对底场(即在当前所编码的场和参考场之间以牙还牙)具有优势。如下面将更详细地描述,这样的帧在预处理阶段期间被标记为“静止”类型帧。
当在视频信号的内容中存在超过一定量的运动,例如大于运动的阈值水平时(即如在相同帧的第一场和第二场之间所确定的),在该情况中,再次如下面更详细地描述的,在预处理阶段期间帧被标记为“移动类型”帧时,选择第二场(例如顶场参考底场,或者底场参考顶场)具有优势。
为了使选择过程能够如上面的实施例中所述被执行,下面的预处理阶段可在要被编码的视频信号的帧上执行。预处理阶段包括测量相邻两帧(例如当前帧和前一帧)之间的时间接近度的步骤。可在视频信号的相邻两帧的顶场(例如第一场)和相邻两帧的底场(例如第二场)之间测量时间接近度,使得每个帧能够被标记为静止类型帧或移动类型帧。这使相同帧的两个场之间的运动能够从相邻帧之间所检测的运动推断。可在预处理阶段期间以这种方式处理视频信号的每个帧,使得每个帧能够被标记为静止类型帧或移动类型帧,由此指示当前帧和前一帧之间的时间接近度的程度。确定当前帧和前一帧之间的时间接近度(或运动)是否小于预定阈值。如果是,则参考帧R被标记为静止类型帧。如果不是,则参考帧R被标记为移动类型帧。因此,将帧标记为静止类型或移动类型提供能够在编码器内部被用以改进编码过程的信令信息。
因此,执行预处理阶段以确定视频信号的内容的本质,即确定视频信号中的运动量(时间差异),使得参考帧能够取决于运动的程度被标记为或“静止类型”或“移动类型”。
从上面要理解,从参考帧选择场是根据视频信号的内容来选择的,并且能够因此随着视频信号正在被编码而动态改变。
本发明的实施例包括预处理阶段,其中通过将一个帧与相邻帧比较来有效测量相同帧的顶场和底场之间的差异。算法的目标是要当顶场和底场之间没有或几乎没有运动时将帧标记为静止类型帧。如果在场之间检测到运动,则该帧被标记为移动类型帧。
根据一个实施例,预处理步骤可包括以下步骤:对于一组帧执行测量和确定步骤,以及标记该组帧为静止类型或移动类型。这具有以下优势:不是分开地标记每个帧,而是帧被编组到一起,使得从一种模式到另一种模式的切换较不频繁地发生。这使该方法能够响应于一组帧被确定为从静止类型改变到移动类型,从使用第一参考场切换到使用第二参考场,或者反之亦然。
这能够通过改为在检测到一组帧从一种类型到另一种类型的转变时从一种模式切换到另一种模式,来避免与逐帧地过于频繁地切换的方法关联的问题。
在这样的实施例中,标记能够被应用到多个帧,多个帧形成具有其自身模板的组,该模板用于指示它们是被标记为静止类型还是移动类型。
如本领域的技术人员会知道的,根据H.264标准,方法还可包括在比特流中以信号通知重排序消息的步骤。
图5示出根据本发明的另一个实施例的用于编码视频信号的视频编码装置50,其中视频信号的每个图帧与一个或多个参考帧R关联,每个参考帧R包括第一场和第二场。装置包括用于接收要被编码的当前帧的接收单元51。处理单元53适合动态选择参考帧R的第一场或第二场以用于编码当前帧的第一场X。基于视频信号的内容来执行该选择。编码单元55适合使用参考帧R的所选择的场来编码当前帧的第一场X。要注意,帧可被存储在例如参考图存储装置(未示出)中。
如上文所提到的,通过配置视频编码装置以在参考帧的第一场(例如顶场)或第二场(例如底场)之间选择,这意味着,对于编码能够使用最佳适合的场,而不是仅使用由现有技术提供的以牙还牙的缺省。这基于视频信号的内容使最佳的场能够被动态选择,并且使最大冗余度能够在编码之前从源图被移除。
图5的处理单元53还可适合确定参考帧R被标记为静止类型帧还是移动类型帧,并且根据参考帧R被标记为静止还是移动类型帧来选择参考帧R的第一场或第二场。
例如,处理单元53能够适合当参考帧R被标记为静止类型帧时选择参考帧R的第一场。
处理单元53能够适合当参考帧R被标记为移动类型帧时选择参考帧R的第二场。
当第一场为顶场时,视频编码装置配置成当参考帧R被标记为静止类型帧时选择参考帧R的第一场(顶场)。以类似方式,如果第一场是底场,则视频编码装置配置成当参考帧R被标记为静止类型帧时选择参考帧R的第二场(底场)。
当第一场是顶场并且参考帧被标记为移动类型帧时,视频编码装置配置成选择参考帧R的第二场(底场)。以类似方式,如果第一场是底场并且参考帧被标记为移动类型帧,则视频编码装置配置成选择参考帧R的第一场(顶场)。
处理单元53还能够适合在预处理阶段期间,执行以下操作:测量视频信号的相邻两帧、相邻两帧的顶场以及相邻两帧的底场之间的时间接近度(或运动),并且确定当前帧和前一帧之间的时间接近度是否小于预定阈值。如果是,则处理单元53适合将该帧标记为静止类型帧。如果不是,则处理单元53适合将该帧标记为移动类型帧。
根据一个实施例,处理单元53适合对于一组帧执行测量和确定操作,并且标记该组帧为静止类型或移动类型。采用这样的实施例,处理单元适合响应于一组帧被确定为从静止类型改变到移动类型,从使用第一参考场切换到使用第二参考场,或者反之亦然。
根据H.264标准,如本领域的技术人员所熟悉,处理单元还适合在比特流中发信号通知重排序消息。
从上面能够看出,本发明的实施例基于两个假设。第一是对于在一对场之间具有最小时间间隔的场,这一对场之间存在最大冗余度。如果参考帧被标记为静止类型帧,或者在顶场和底场之间没有或者存在非常少的运动,则顶场可以是作为参考场的更好的选择,即使底场产生更小的时间间距,或者反之亦然。这可归因于顶场的更好质量。例如,被编码为I图的顶场可以比被编码为P图的底场具有更好的质量。
还能够从上面看出,本发明的实施例包括将帧标记为静止类型或移动类型的预处理阶段。随后据此选择参考场,并且在比特流中以信号通知重排序消息。
要注意,本发明的实施例假设两个参考场可用于P图,并且每个列表的一个参考场可用于B图。该配置在运动估计和Subpel细化中给予相同数量的操作。在仅一个参考场可用于P图的情况中,本发明的实施例以与用于B图的同样的方式来操作。
图6示出根据本发明的一个实施例所执行的方法,并且特别是对于B图或对于P图若仅一个参考可用时的选择过程。
在601,当前所编码的场示为X,并且参考主帧示为R。在步骤603中,确定参考帧R是与过去的参考帧还是与未来的参考帧有关(例如通过检查参考帧R是否被标记为低(LO),其中被标记为LO的参考帧指示参考帧是过去的参考帧)。
如果在步骤603中确定参考帧R是LO(指示过去的参考帧),则在步骤605中,确定当前所编码的场X是否为顶场。如果是,则处理移动到确定参考帧是否被标记为静止类型帧的步骤609。如果是,则在步骤613,提取参考帧的顶场以用于编码当前所编码的场X,所述当前所编码的场X如先前所确定也为顶场。如果在步骤609中确定参考帧没有被标记为静止类型帧(因此是移动类型帧),则在步骤611,提取参考帧R的底场以用于与当前所编码的场X进行编码,所述当前所编码的场X如先前所确定为顶场。
从上面能够看出,如果当前所编码的场是顶场,则如上所述进行选择过程,而不管当前所编码的场X是否被标记为参考场自身。因此,方法的这部分类似于上述实施例。
但是,图6的方法还能够处理能够取决于当前所编码的场其自身是否被标记为参考场(例如基于当前所编码的场是如下面图7中示为“B”的B-图还是如下面图7中示为“Br”的参考B-图)而做出的不同的选择,在这种情况中,必须不同地对待当前所编码的场的底场。例如,如果在步骤605中,确定当前所编码的场X不是顶场,则处理移动到步骤607,其中确定当前所编码的场X其自身是否被标记为参考场(例如图7中的Br)。如果当前所编码的场X没有被标记为参考场,则与上面相同来执行选择过程。换言之,处理移动到步骤609,其中确定参考帧R是否被标记为静止类型帧。如果是,则在步骤613,提取参考帧的顶场以用于编码当前所编码的场X。如果在步骤609中确定参考帧没有被标记为静止类型帧,则在步骤611,提取参考帧R的底场以用于与当前所编码的场X进行编码。
但是,如果在步骤607中确定当前所编码的场X被标记为参考帧,则处理移动到步骤613,其中提取参考帧R的顶场以用于与当前所编码的场X的底场进行处理。
在图7中反映了该处理,由此能够看出,如果当前所编码的场是底场并且被标记为参考场,例如参考B-图帧23的底场232,则能够看出,这个底场还能够参考参考帧23的顶场,即顶场231(由点线23x所示)。同样相应地适用于帧21的底场212和帧25的底场252。要注意,为了清晰,图7没有示出所有可能的参考。
图6的方法还处理当参考帧是“未来的”参考帧的情形。在这样的情形中,如果在处理步骤603中确定参考帧没有被标记为LO,暗示参考帧是未来的参考帧,则在步骤613从参考帧R提取顶场以用于编码目的,而不管要被编码的当前场是顶场还是底场。
图8描述根据本发明的另一个实施例的方法。
在801,当前所编码的场(或第一场)示为X,并且参考主帧示为R。在步骤803中,确定参考帧R是否被标记为静止类型帧。如果是,则处理移动到步骤805,其中确定当前所编码的场X是否为顶场(即第一场是否为顶场)。如果是,则在步骤811,提取参考帧的顶场以用于编码当前所编码的场X的顶场。如果在步骤805中确定当前所编码的场X不是顶场(即底场),则在步骤809,提取参考帧R的底场以用于与当前所编码的场X的底场进行编码。
如果在步骤803中确定参考帧R没有被标记为静止类型帧(例如或显式或隐式被标记为移动类型帧),则处理移动到步骤813。在步骤813中,确定参考帧是过去的参考帧还是未来的参考帧(例如,通过检查参考帧R是否被标记为低(LO),由此,被标记为LO的参考帧指示该参考帧是过去的参考帧)。
如果在步骤813中确定参考帧R是LO(指示过去的参考帧),则在步骤811中,从参考帧提取顶场,以用于与当前所编码的场X进行处理(而不管当前所编码的场是顶场还是底场)。
因而,能够看出,如果参考帧没有被标记为静止类型帧,则方法的这部分包括以下步骤:确定参考帧是否为未来的参考帧,并且如果是,则(在步骤811)选择参考帧的顶场,而不管当前帧的第一场是顶场还是底场。
如果在步骤813中确定参考帧被标记为指示过去的参考帧的LO,则处理移动到步骤815,其中确定当前所编码的场X(或第一场)是否为顶场。如果是,则处理移动到步骤819,其中提取参考帧R的顶场以用于编码当前所编码的场X的顶场。如果在步骤815中确定当前所编码的场X不是顶场,则处理移动到步骤817,其中确定当前所编码的场X(或第一场)其自身是否被标记为参考。如果是,则在步骤811,提取参考帧R的顶场。如果在步骤817中确定当前所编码的场X(或第一场)没有被标记为参考,则在步骤819,提取参考帧R的底场。
从上面能够看出,如果参考帧被标记为非静止类型(即移动类型),则方法包括以下步骤:在步骤813中确定参考帧是否为过去的参考帧,并且如果是,则在步骤815中确定当前帧的第一场X是否为顶场,并且:
如果是,则在步骤819中选择参考帧的底场;并且
如果不是,则若第一场其自身被标记为参考帧则(在步骤817、811)选择参考帧的顶场,或者若当前帧的第一场没有被标记为参考帧则(在步骤817、819)选择参考帧的底场。
在上述图7中反映了这个处理,由此能够看出不同的帧如何能够互相参考。
要理解,减少用于编码过程的参考场的数量能够帮助实现视频编码器中的增加的密度,而不会给解码器负担。参考场的缺省H.264排序没有给出最佳视频编码效率。采用本发明的所提议的实施例,能够在编码器侧和解码器侧上的资源使用上都没有负担而提高视频压缩效率。
要注意,虽然本发明的实施例描述被标记为静止类型帧或移动类型帧的帧,但是要注意,这些帧其中之一可被隐式标记。例如,确定帧不是静止类型帧能够被当作隐式假设该帧是移动类型帧,或者反之亦然。
应注意,上述实施例说明而非限制本发明,并且本领域的技术人员将能够不偏离所附权利要求的范围来设计许多备选实施例。单词“包括”不排除权利要求中列出的那些以外的元件或步骤的存在,“一”或“一个”不排除多个,并且单个处理器或其它单元可实现权利要求中所记载的若干单元的功能。权利要求中的任何参考标记不应被解释用来限制其范围。

Claims (16)

1.一种编码视频信号的方法,其中,所述视频信号的每个图帧与一个或多个参考帧关联,每个参考帧包括第一场和第二场,所述方法包括:
接收要被编码的当前帧;
选择参考帧的第一场或第二场以用于编码所述当前帧的第一场,其中,基于所述视频信号的内容来执行所述选择;以及
使用所述参考帧的所选择的场来编码所述当前帧的第一场,
其中,所述选择步骤包括以下步骤:
确定所述参考帧被标记为静止类型帧还是移动类型帧;以及
根据所述参考帧被标记为静止类型帧还是移动类型帧来选择参考帧的第一场或第二场。
2.如权利要求1所述的方法,还包括当所述参考帧被标记为静止类型帧时选择所述参考帧的第一场的步骤。
3.如权利要求1所述的方法,还包括当所述参考帧被标记为移动类型帧时选择所述参考帧的第二场的步骤。
4.如权利要求1所述的方法,还包括如果确定所述参考帧被标记为移动类型帧,则执行以下步骤:
确定所述参考帧是否为过去的参考帧,以及如果是;
则确定所述当前帧的第一场是否为顶场,以及:
如果是,则选择所述参考帧的底场;以及
如果不是,则若所述当前帧的第一场其自身被标记为参考场则选择所述参考帧的顶场,或者若所述当前帧的第一场没有被标记为参考场则选择所述参考帧的底场。
5.如权利要求1所述的方法,其中,如果确定所述参考帧被标记为移动类型帧,则还包括以下步骤:确定所述参考帧是否为未来的参考帧,以及如果是,则选择所述参考帧的顶场,而不管所述当前帧的第一场是顶场还是底场。
6.如权利要求1-5中任一项所述的方法,其中,所述方法还包括以下预处理步骤:
测量所述视频信号的帧和相邻帧的第一场和第二场之间的时间接近度;
确定所述帧和相邻帧的第一场和第二场之间的所述时间接近度是否小于预定阈值,以及:
如果是,则标记所述帧为静止类型帧;以及
如果不是,则标记所述帧为移动类型帧。
7.如权利要求6所述的方法,其中,所述预处理步骤包括以下步骤:对于一组帧执行所述测量和确定步骤,以及标记所述一组帧为静止类型或移动类型。
8.如权利要求7所述的方法,还包括以下步骤:响应于确定一组帧从静止类型改变到移动类型,从使用第一参考场切换到使用第二参考场,或者反之亦然。
9.一种用于编码视频信号的视频编码装置,其中,所述视频信号的每个图帧与一个或多个参考帧关联,每个参考帧包括第一场和第二场,所述装置包括:
接收单元,所述接收单元用于接收要被编码的当前帧;
处理单元,所述处理单元适合选择参考帧的第一场或第二场以用于编码所述当前帧的第一场,其中,基于所述视频信号的内容来执行所述选择;以及
编码单元,所述编码单元适合使用所述参考帧的所选择的场来编码所述当前帧的第一场,
其中,所述处理单元还适合:
确定所述参考帧被标记为静止类型帧还是移动类型帧;以及
根据所述参考帧被标记为静止类型帧还是移动类型帧来选择参考帧的第一场或第二场。
10.如权利要求9所述的装置,其中,所述处理单元还适合:当所述参考帧被标记为静止类型帧时,选择所述参考帧的第一场。
11.如权利要求9所述的装置,其中,所述处理单元还适合:当所述参考帧被标记为移动类型帧时,选择所述参考帧的第二场。
12.如权利要求9所述的装置,其中,如果确定所述参考帧被标记为移动类型帧,则所述处理单元还适合执行以下步骤:
确定所述参考帧是否为过去的参考帧,以及如果是;
则确定所述当前帧的第一场是否为顶场,以及:
如果是,则选择所述参考帧的底场;以及
如果不是,则若所述当前帧的第一场其自身被标记为参考场则选择所述参考帧的顶场,或者若所述当前帧的第一场没有被标记为参考场则选择所述参考帧的底场。
13.如权利要求9所述的装置,其中,如果确定所述参考帧被标记为移动类型帧,则所述处理单元还适合确定所述参考帧是否为未来的参考帧,以及如果是,则选择所述参考帧的顶场,而不管所述当前帧的第一场是顶场还是底场。
14.如权利要求9-13中任一项所述的装置,其中,所述处理单元还适合在预处理阶段期间执行以下操作:
测量所述视频信号的帧和相邻帧的第一场和第二场之间的时间接近度;
确定所述帧和相邻帧的第一场和第二场之间的所述时间接近度是否小于预定阈值,以及:
如果是,则标记所述帧为静止类型帧;以及
如果不是,则标记所述帧为移动类型帧。
15.如权利要求14所述的装置,其中,所述处理单元适合对于一组帧执行所述测量和确定操作,并且标记所述一组帧为静止类型或移动类型。
16.如权利要求15所述的装置,其中,所述处理单元还适合响应于确定一组帧从静止类型改变到移动类型,从使用第一参考场切换到使用第二参考场,或者反之亦然。
CN201280074090.8A 2012-06-21 2012-06-21 用于编码视频信号的装置和方法 Expired - Fee Related CN104396239B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2012/061976 WO2013189543A1 (en) 2012-06-21 2012-06-21 Apparatus and method for coding a video signal

Publications (2)

Publication Number Publication Date
CN104396239A CN104396239A (zh) 2015-03-04
CN104396239B true CN104396239B (zh) 2018-07-13

Family

ID=46319151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280074090.8A Expired - Fee Related CN104396239B (zh) 2012-06-21 2012-06-21 用于编码视频信号的装置和方法

Country Status (7)

Country Link
US (1) US20150326874A1 (zh)
EP (1) EP2865181A1 (zh)
JP (1) JP2015524225A (zh)
CN (1) CN104396239B (zh)
BR (1) BR112014031502A2 (zh)
CA (1) CA2877306A1 (zh)
WO (1) WO2013189543A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017158173A (ja) * 2016-02-26 2017-09-07 パナソニックIpマネジメント株式会社 動画像符号化装置および動画像符号化方法
USD1005982S1 (en) * 2023-09-13 2023-11-28 Shenzhen Yinzhuo Technology Co., Ltd Headphone

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010063092A (ja) * 2008-08-05 2010-03-18 Panasonic Corp 画像符号化装置、画像符号化方法、画像符号化集積回路およびカメラ
JP2011015117A (ja) * 2009-07-01 2011-01-20 Panasonic Corp 画像符号化装置、画像符号化方法及び、ビデオカメラ
CN102447902A (zh) * 2011-09-30 2012-05-09 曾志华 选择参考场及获取时域运动矢量的方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904174B1 (en) * 1998-12-11 2005-06-07 Intel Corporation Simplified predictive video encoder
KR100693669B1 (ko) * 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
JP4708680B2 (ja) * 2003-03-28 2011-06-22 Kddi株式会社 圧縮動画像データの画像挿入装置
US7567617B2 (en) * 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
CN100539672C (zh) * 2004-08-17 2009-09-09 松下电器产业株式会社 图像编码装置和方法
EP1933570A4 (en) * 2005-10-05 2010-09-29 Panasonic Corp PROCESS AND DEVICE FOR REFERENCE SELECTION
US7884262B2 (en) * 2006-06-06 2011-02-08 Monsanto Technology Llc Modified DMO enzyme and methods of its use
JP2008011117A (ja) * 2006-06-28 2008-01-17 Matsushita Electric Ind Co Ltd 画像符号化におけるインターレース符号化時の参照ピクチャ決定方法
JP2008219100A (ja) * 2007-02-28 2008-09-18 Oki Electric Ind Co Ltd 予測画像生成装置、方法及びプログラム、並びに、画像符号化装置、方法及びプログラム
US8098732B2 (en) * 2007-10-10 2012-01-17 Sony Corporation System for and method of transcoding video sequences from a first format to a second format
US20120051431A1 (en) * 2010-08-25 2012-03-01 Qualcomm Incorporated Motion direction based adaptive motion vector resolution signaling for video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010063092A (ja) * 2008-08-05 2010-03-18 Panasonic Corp 画像符号化装置、画像符号化方法、画像符号化集積回路およびカメラ
JP2011015117A (ja) * 2009-07-01 2011-01-20 Panasonic Corp 画像符号化装置、画像符号化方法及び、ビデオカメラ
CN102447902A (zh) * 2011-09-30 2012-05-09 曾志华 选择参考场及获取时域运动矢量的方法

Also Published As

Publication number Publication date
BR112014031502A2 (pt) 2017-06-27
JP2015524225A (ja) 2015-08-20
CN104396239A (zh) 2015-03-04
EP2865181A1 (en) 2015-04-29
CA2877306A1 (en) 2013-12-27
US20150326874A1 (en) 2015-11-12
WO2013189543A1 (en) 2013-12-27

Similar Documents

Publication Publication Date Title
US20230131933A1 (en) Method and apparatus for candidate list pruning
CN104935939B (zh) 对图像进行编码/解码的装置和方法
CN106664419B (zh) 用于运动向量预测的时间导出双向运动向量的方法
JP5847844B2 (ja) エラー耐性が改善されたビデオ符号化及びビデオ復号化
CN105284117B (zh) 根据运动信息压缩方案通过层间运动信息预测对图像进行编码或解码的方法和设备
KR100750092B1 (ko) 가변장 코딩방법 및 장치
EP2515538A2 (en) Adaptive image encoding device and method
JP2013523010A5 (ja) ビデオ符号化およびビデオ復号化のための暗示的適応型動きベクトル予測子選択の方法および装置
TW201143458A (en) Dynamic image encoding device and dynamic image decoding device
CN106797472A (zh) 编码数字图像的方法和相关解码方法、装置及计算机程序
KR20130109963A (ko) 신규한 인트라 예측 모드
JP2020537394A5 (zh)
CN107318026A (zh) 视频编码器以及视频编码方法
KR20220119755A (ko) 메모리 액세스가 감소된 fruc 모드에서 비디오 데이터를 인코딩 또는 디코딩하기 위한 방법 및 장치
KR20100046202A (ko) 이미지들을 처리하기 위한 방법 및 그 대응하는 전자 장치
CN104396239B (zh) 用于编码视频信号的装置和方法
CN106534871B (zh) 视频编解码器的编码方法和解码方法
Wang et al. Motion vector reversion-based steganalysis revisited
CN112004114B (zh) 视频处理方法、装置、可读存储介质及电子设备
CN104519368A (zh) 图像编码、解码重构处理方法及装置
CN103828366B (zh) 一种编码和解码方法、编码和解码设备
CN102300088B (zh) 画面内预测模式最佳化方法与图像压缩方法以及装置
US11616950B2 (en) Bitstream decoder
CN112073734B (zh) 一种编解码方法、装置及其设备
CN110691247B (zh) 一种解码、编码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180713

Termination date: 20200621