CN102017635B - 视频编码方法、视频编码装置、视频编码程序及其记录介质 - Google Patents

视频编码方法、视频编码装置、视频编码程序及其记录介质 Download PDF

Info

Publication number
CN102017635B
CN102017635B CN200880128433.8A CN200880128433A CN102017635B CN 102017635 B CN102017635 B CN 102017635B CN 200880128433 A CN200880128433 A CN 200880128433A CN 102017635 B CN102017635 B CN 102017635B
Authority
CN
China
Prior art keywords
motion vector
macro block
frame
cost
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880128433.8A
Other languages
English (en)
Other versions
CN102017635A (zh
Inventor
佐野卓
岩崎裕江
长沼次郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN102017635A publication Critical patent/CN102017635A/zh
Application granted granted Critical
Publication of CN102017635B publication Critical patent/CN102017635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

视频编码装置的运动搜索部分别对帧宏块及场宏块进行运动搜索,算出运动矢量和各自的搜索成本。运动矢量评价值算出部求出运动矢量的大小的评价值。在运动矢量阈值判定部中,通过比较所述运动矢量的大小的评价值和规定的阈值,判定对象区域是动区域还是静止区域。在对象区域为动区域的情况下,通过搜索成本的大小比较,决定帧/场宏块模式的适用。在对象区域为静止区域的情况下,通过帧宏块和场宏块的垂直方向相邻像素间差分绝对值和的大小,决定帧/场宏块模式。

Description

视频编码方法、视频编码装置、视频编码程序及其记录介质
技术领域
本发明涉及视频编码方式,其将由两个场(field)构成一个帧(frame)的视频数据分割并压缩成规定大小的宏块(macro block),并输出位流(bit stream)。
背景技术
以往,在由两个场构成一个帧的视频数据的编码中,通过帧宏块模式、场宏块模式双方进行编码,比较产生位数量来进行模式决定。另外,如专利文献1中记载的“视频编码方法、视频编码装置和记录有视频编码程序的记录介质”那样,也提出有将编码过程二重化,根据第一过程的结果进行模式决定的手法。
在以往的视频编码方式中进行帧/场宏块模式的判定时,会产生以下这样的问题。
在通常的视频编码装置中,通过帧宏块模式、场宏块模式双方的模式进行编码,选择高效的方式。该情况下,需要多次进行编码处理,因此,例如在通过软件进行处理的情况下,CPU负荷增大,而需要庞大的处理时间。另外,在通过硬件进行实现的情况下,芯片面积、功耗增大,难以实现。
本发明的目的在于解决上述问题点。因此,在本发明中,在对矩形区域的视频数据进行编码的情况下,可根据输入图像或进行运动预测后的结果适应性地选择帧宏块模式、场宏块模式。由此,本发明能在不使编码效率降低的情况下,削减计算量或硬件的规模
专利文献1:日本特开平11-298904号公报
发明内容
本发明为了解决上述课题,例如具有以下方面。
在第一方面中,一种视频编码方式,其将由两个场构成一个帧的视频数据分割并压缩成规定大小的宏块,并输出位流,其使用以下单元,
(a)第一单元,将水平M像素、垂直2M像素的矩形分割成水平M像素和垂直M像素的两个矩形,分别对两个矩形进行运动搜索(motion estimation),算出编码成本(以下称为帧搜索成本)及运动矢量(motion vector)。
(b)第二单元,将水平M像素、垂直2M像素的矩形分割成水平M像素且奇数行的垂直M像素的区域、和水平M像素且偶数行的垂直M像素的区域,分别对两个矩形进行运动搜索,算出编码成本(以下称为场搜索成本)及运动矢量。
(c)第三单元,算出通过第一单元及第二单元的运动搜索决定的运动矢量的大小的评价值。
(d)第四单元,在通过第三单元算出的运动矢量的大小的评价值比规定的阈值大的情况下,比较通过第一单元算出的帧搜索成本和通过第二单元算出的场搜索成本,选择值小的一方。
(e)第五单元,在通过第四单元选择了帧搜索成本的情况下,将该宏块作为帧宏块模式进行编码。
(f)第六单元,在通过第四单元选择了场搜索成本的情况下,将该宏块作为场宏块模式进行编码;
(g)第七单元,在通过第三单元算出的运动矢量的大小的评价值为规定的阈值以下的情况下,在帧宏块、场宏块的每一个中算出垂直方向相邻像素间差分绝对值和,选择值小的一方。
(h)第八单元,在通过第七单元选择了帧像素成本的情况下,将该宏块作为帧宏块模式进行编码。
(i)第九单元,在通过第七单元选择了场像素成本的情况下,将该宏块作为场宏块模式进行编码;
作为运动矢量的大小的评价值,可以使用以帧宏块、场宏块或将它们分割后的块为单位算出的运动矢量的水平、垂直成分各自的绝对值中的最大值或最小值或平均值。
另外,作为运动矢量的大小的评价值,也可以使用以帧宏块、场宏块或将它们分割后的块为单位算出的运动矢量的曼哈顿距离中的最大值或最小值或平均值。
另外,作为运动矢量的大小的评价值,也可以使用以帧宏块、场宏块或将它们分割后的块为单位算出的运动矢量的长度中的最大值或小值或平均值。
在上述方面中,能够通过以上单元,选择帧宏块模式/场宏块模式,削减运算量、存储器传输量。
另外,由于上述的方面是,一种视频编码方式,将由两个场构成一个帧的视频数据分割并压缩成规定大小的宏块,并输出位流,其具有根据运动搜索结果及输入图像信息判断是通过帧宏块模式进行编码或还是通过场宏块模式进行编码的单元,通过该判断结果,进行根据帧宏块模式的编码或根据场宏块模式的编码,所以,其会产生如下所示这样的优点。
·在通过软件实现上述的视频编码方式的情况下,能够减轻CPU负荷,削减处理时间。
·在通过硬件实现上述的视频编码方式的情况下,可实现更小的芯片面积、功耗。
附图说明
图1是一个实施方式中的编码对象区域的说明图。
图2是一个实施方式所使用的帧宏块的说明图。
图3是一个实施方式所使用的场宏块的说明图。
图4是表示第一实施方式中的处理的流程图。
图5是表示第二实施方式中的处理的流程图。
图6是表示第三实施方式中的处理的流程图。
图7是表示一个实施方式的视频编码装置的构成例的图。
图8是表示块分割的例子的图。
图9是表示一个实施方式所使用的相邻像素间差分绝对值和的说明图。
附图标记说明
1    输入图像帧
2    编码对象区域
3    帧宏块
4    场宏块
101    运动搜索部
102    运动矢量评价值算出部
103    运动矢量阈值判定部
104    Mcost帧/场判定部
105    相邻像素间差分绝对值和算出部
106    Pcost帧/场判定部
107    帧宏块编码部
108    场宏块编码部
具体实施方式
下面,参照附图的同时对本发明的优选实施方式进行说明。但是,本发明并不限定于以下的各实施方式,例如也可以将这些实施方式的构成要素彼此适当组合。
另外,本实施方式中,对宏块尺寸的尺寸为M×M像素(M=16)的情况的例子进行说明。
图1表示从以下说明的本实施方式中的一个帧切出的编码对象块的例子。图中的1表示输入图像帧。编码对象的视频数据(以下,称为编码对象区域)2将输入图像帧1的一部分如图1所示分割成M×2M的矩形。
图2是本实施方式所使用的帧宏块的说明图。将把图2所示的编码对象区域2的M×2M(M=16)的编码对象块分割成在垂直方向排列的、各自M×M的两个块的宏块称为帧宏块。图2中的附图标记3表示帧宏块。
图3是本发明所使用的场宏块的说明图。将针对图3所示的编码对象区域2的M×2M(M=16)的编码对象块,分割成由编码对象区域2的偶数行构成的M×M的块和由编码对象区域2的奇数行构成的M×M的块的宏块称为场宏块。图中的4表示场宏块。
图4是表示使用了本发明第一实施方式的帧宏块模式/场宏块模式判定手法的视频编码方法的流程图。
图中的11表示第一单元(unit),对从编码对象的输入图像抽取的帧宏块进行运动搜索处理,将算出的运动矢量设为MV_frm,将编码成本设为Mcost_frm。图中的12表示第二单元,对从编码对象的输入图像抽取的场宏块进行运动搜索处理,将算出的运动矢量设为MV_fld,将编码成本设为Mcost_fld。在此进行的运动搜索处理是检测视频的大致运动的处理,因此,可以是整数像素精度程度的粗搜索。
图中的13表示第三单元,从通过第一单元11及第二单元12算出的全部或一部分的运动矢量的水平、垂直成分中算出绝对值的最大值(以下称为MV_max)。另外,也可以不将最大值,而是将最小值或平均值作为运动矢量的大小的评价值使用。
图中的14表示第四单元,比较通过第三单元13算出的MV_max和阈值T的大小。阈值T是判定对象区域是静止区域还是动区域的参数,将每1/30秒1像素设为目标。另外,该阈值设定是目标,可任意进行设定。在MV_max比阈值T大的情况下,判定为对象区域为动区域,比较通过第一单元11及第二单元12算出的编码成本Mcost_frm、Mcost_fld,采用成本小的一方的宏块模式。
图中的15表示第五单元,在通过第四单元14判断为Mcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的16表示第六单元,在通过第四单元14判断出Mcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图中的17表示第七单元,在通过第四单元14判断为MV_max不比阈值T大、为静止区域的情况下,分别在帧宏块、场宏块中算出垂直方向相邻像素间差分绝对值和(以下,分别设为Pcost_frm、Pcost_fld),并比较两个值的大小。
图中的18表示第八单元,在通过第七单元17判断为Pcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的19表示第九单元,在通过第七单元17判断为Pcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图5是使用了本发明第二实施方式的帧宏块模式/场宏块模式判定手法的视频编码方法的流程图。
图中的21表示第一单元,对从编码对象的输入图像抽取的帧宏块进行运动搜索处理,将算出的运动矢量设为MV_frm,将编码成本设为Mcost_frm。图中的22表示第二单元,对从编码对象的输入图像抽取的场宏块进行运动搜索处理,将算出的运动矢量设为MV_fld,将编码成本设为Mcost_fld。在此进行的运动搜索处理是检测视频的大致运动的处理,因此,可以是整数像素精度程度的粗搜索。
图中的23表示第三单元,算出通过第一单元21及第二单元22算出的全部或一部分的运动矢量的曼哈顿距离的最小值(以下称为MV_min)。另外,也可以不将最小值,而是将最大值或平均值作为运动矢量的大小的评价值使用。
图中的24表示第四单元,比较通过第三单元23算出的MV_min和阈值T的大小。阈值T是判定对象区域是静止区域还是动区域的参数,将每1/30秒1像素设为目标。另外,该阈值设定是目标,可任意进行设定。在MV_min比阈值T大的情况下,判断为对象区域为动区域,比较通过第一单元21及第二单元22算出的编码成本Mcost_frm、Mcost_fld,采用成本小的一方的宏块模式。
图中的25表示第五单元,在通过第四单元24判断为Mcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的26表示第六单元,在通过第四单元24判断为Mcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图中的27表示第七单元,在通过第四单元24判断为MV_min不比阈值T大、为静止区域的情况下,分别在帧宏块、场宏块中算出垂直方向相邻像素间差分绝对值和(以下,分别设为Pcost_frm、Pcost_fld),并比较两个值的大小。
图中的28表示第八单元,在通过第七单元27判断为Pcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的29表示第九单元,在通过第七单元27判断为Pcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图6是使用了本发明第三实施方式的帧宏块模式/场宏块模式判定手法的视频编码方法的流程图。
图中的31表示第一单元,对从编码对象的输入图像抽取的帧宏块进行运动搜索处理,将算出的运动矢量设为MV_frm,将编码成本设为Mcost_frm。图中的32表示第二单元,对从编码对象的输入图像抽取的场宏块进行运动搜索处理,将算出的运动矢量设为MV_fld,将编码成本设为Mcost_fld。在此进行的运动搜索处理是检测视频的大致运动的处理,因此,可以是整数像素精度程度的粗搜索。
图中的33表示第三单元,算出通过第一单元31及第二单元32算出的全部或一部分的运动矢量的长度的平均值(以下,称为MV_ave)。另外,也可以不将平均值,而是将最小值或最大值作为运动矢量的大小的评价值使用。
图中的34表示第四单元,比较通过第三单元33算出的MV_ave和阈值T的大小。阈值T是判定对象区域是静止区域还是动区域的参数,将每1/30秒1像素设为目标。另外,该阈值设定是目标,可任意进行设定。在MV_ave比阈值T大的情况下,判断为对象区域为动区域,比较通过第一单元31及第二单元32算出的编码成本Mcost_frm、Mcost_fld,采用成本小的一方的宏块模式。
图中的35表示第五单元,在通过第四单元34判断为Mcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的36表示第六单元,在通过第四单元34判断为Mcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图中的37表示第七单元,在通过第四单元34判断为MV_ave不比阈值T大、为静止区域的情况下,分别在帧宏块、场宏块中算出垂直方向相邻像素间差分绝对值和(以下,分别设为Pcost_frm、Pcost_fld),并比较两个值的大小。
图中的38表示第八单元,在通过第七单元37判断为Pcost_frm小的情况下,通过帧宏块模式对对象区域进行编码。图中的39表示第九单元,在通过第七单元37判断为Pcost_fld小的情况下,通过场宏块模式对对象区域进行编码。
图7是表示本发明的视频编码装置的构成例的图。
在图7中,运动搜索部101相当于图4~图6中的第一单元11、21、31及第二单元12、22、32。运动矢量评价值算出部102相当于第三单元13、23、33。运动矢量阈值判定部103及Mcost帧/场判定部104相当于第四单元14、24、34。相邻像素间差分绝对值和算出部105及Pcost帧/场判定部106相当于第七单元17、27、37。帧宏块编码部107相当于第五单元15、25、35及第八单元18、28、38。场宏块编码部108相当于第六单元16、26、36及第九单元19、29、39。
运动搜索部101分别对帧宏块、场宏块进行运动搜索处理,将算出的运动矢量设为MV_frm、MV_fld,将编码成本设为Mcost_frm、Mcost_fld。在此进行的运动搜索处理是检测视频的大致运动的处理,因此,可以是整数像素精度程度的粗搜索。
运动矢量评价值算出部102算出通过运动搜索部101算出的全部或一部分运动矢量的大小的评价值MV_eva。另外,在第一实施方式中,作为该评价值MV_eva,从运动矢量的水平、垂直成分中算出绝对值的最大值MV_max。在第二实施方式中,作为该评价值MV_eva,从运动矢量的曼哈顿距离中算出最小值MV_min。在第三实施方式中,作为该评价值MV_eva,算出运动矢量的长度的平均值MV_ave。
运动矢量阈值判定部103比较通过运动矢量评价值算出部102算出的MV_eva和用于判定对象区域是静止区域还是动区域的规定的阈值T的大小。运动矢量阈值判定部103将比较结果通知给Mcost帧/场判定部104及Pcost帧/场判定部106。
在判定为MV_eva比阈值T大、对象区域为动区域的情况下,Mcost帧/场判定部104比较通过运动搜索部101算出的编码成本Mcost_frm、Mcost_fld。如果编码成本Mcost_frm小,则Mcost帧/场判定部104决定适用帧宏块模式,并向帧宏块编码部107输出指示使得通过帧宏块模式对对象区域进行编码。帧宏块编码部107通过帧宏块模式对对象区域进行编码,并输出其编码流。
在编码成本Mcost_fld小的情况下,Mcost帧/场判定部104决定适用场宏块模式,并向场宏块编码部108输出指示使得通过场宏块模式对对象区域进行编码。场宏块编码部108通过场宏块模式对对象区域进行编码,并输出其编码流。
另一方面,相邻像素间差分绝对值和算出部105分别算出帧宏块的垂直方向相邻像素间差分绝对值和Pcost_frm及场宏块的垂直方向相邻像素间差分绝对值和Pcost_fld。
在运动矢量阈值判定部103判定为MV_eva比阈值T大、对象区域为静止区域的情况下,Pcost帧/场判定部106比较Pcost_frm和Pcost_fld两个值的大小。如果Pcost_frm小,则Pcost帧/场判定部106决定适用帧宏块模式,并向帧宏块编码部107输出指示使得通过帧宏块模式对对象区域进行编码。帧宏块编码部107通过帧宏块模式对对象区域进行编码,并输出其编码流。另外,在Pcost_fld小的情况下,Pcost帧/场判定部106决定适用场宏块模式,并向场宏块编码部108输出指示使得通过场宏块模式对对象区域进行编码。场宏块编码部108通过场宏块模式对对象区域进行编码,并输出其编码流。
运动搜索部101对帧宏块、场宏块分别进行运动搜索处理,算出运动矢量,并且作为编码成本,算出帧搜索成本Mcost_frm和帧搜索成本Mcost_fld。另外,作为这些搜索成本,例如可以算出以下的两个值的和来进行使用。
·该块和运动矢量所示的参照块的各自的像素值的差分值的绝对值或差分值的平方的值的合计值。
·与该块的运动矢量和根据其周围的完成编码的运动矢量算出的预测矢量的差分相对应的成本值。
图8表示运动搜索部101中进行运动搜索时的块分割的例子。运动搜索部101将16×16像素的宏块分割成例如图8所示这样的块,对各块进行运动搜索。对于图8(A)所示的16×16像素的宏块,有如图8(B)所示在垂直方向上分成两个的8×16块、如图8(C)所示在水平方向上分割成两个的16×8块、如图8(D)所示分割成四个的8×8块,进而,在8×8块的情况下,如图8(E)~(H)所示,能对各个块选择8×8、4×8、8×4、4×4这四种分割。每一宏块的运动矢量的个数为最大,是全部选择4×4块的情况,该情况的运动矢量的个数为16个。
在运动矢量评价值算出部102中,作为运动矢量的大小的评价值的算出方法可使用以下的方法。
(1)从运动矢量的水平、垂直成分各自的绝对值中求出最大值或最小值或平均值,作为评价值。
(2)从运动矢量的曼哈顿距离中求出最大值或最小值或平均值,作为评价值。
曼哈顿距离=(水平成分绝对值)+(垂直成分绝对值)
(3)从运动矢量的长度、或者其平方中求出最大值或最小值或平均值,作为评价值。
运动矢量的长度的平方=(水平成分)2+(垂直成分)2
图9是相邻像素间差分绝对值和算出部105所算出的垂直方向的相邻像素间差分绝对值和的说明图。
相邻像素间差分绝对值和算出部105分别对图2所说明的帧宏块3或图3所说明的场宏块4,如式(1)所示,算出垂直方向的相邻像素间的差分绝对值的和(以下称为S_frm0、S_frm1、S_fld0、S_fld1)。在此,ABS(a)表示a的绝对值,im、n表示宏块内的(m、n)成分(m=1、…、16、n=1、…、16)。
[数学式1]
S _ frm 0 , S _ frm 1 , S _ fld 0 , S _ fld 1 = Σ m = 1 16 Σ n = 1 15 ABS ( i m , n - i m , n + 1 ) - - - ( 1 )
之后,如式(2)、式(3)所示,算出各宏块的每一个的差分绝对值的和(以下,将其分别称为Pcost_frm、Pcost_fld),并向Pcost帧/场判定部106发送。Pcost帧/场判定部106进行两个值的比较,并进行帧宏块模式/场宏块模式的判定。
Pcost_frm=S_frm0+S_frm1    (2)
Pcost_fld=S_fld0+S_fld1    (3)
以上说明的视频编码的处理可通过硬件或固件实现,并且也可通过计算机和软件程序实现,还可将该程序记录于计算机可读取的记录介质而提供,还可通过网络提供。
另外,虽然在上述各实施方式中,将编码对象区域2作为M×2M(M=16)的纵长的矩形区域进行了说明,但是编码对象区域2并不限定于此。例如,也可以是横长的矩形区域。
以上,对本发明的优选实施例进行了说明,但本发明并不限定于这些实施例。在不脱离本发明的主旨的范围内,可进行构成的附加、省略、置换及其他的变更。本发明不被上述说明所限定,而只被附加的权利要求的范围限定。
产业上的可利用性
本发明涉及视频编码处理,可实现软件执行时的负荷的降低、硬件的小型化。

Claims (9)

1.一种视频编码方法,其将由两个场构成一个帧的视频数据分割并压缩成规定大小的宏块,并输出位流,其具有:
第一步骤,将编码对象区域的水平M像素、垂直2M像素的矩形分割成水平M像素和垂直M像素的两个矩形的帧宏块,分别对两个帧宏块进行运动搜索,算出运动矢量和使用了该运动矢量时的编码成本即帧搜索成本,其中,作为该帧搜索成本,算出以下的两个值的和来进行使用:该块和运动矢量所示的参照块的各自的像素值的差分值的绝对值或差分值的平方的值的合计值;以及与该块的运动矢量和根据其周围的完成编码的运动矢量算出的预测矢量的差分相对应的成本值;
第二步骤,将所述水平M像素、垂直2M像素的矩形分割成水平M像素且奇数行的垂直M像素的区域、和水平M像素且偶数行的垂直M像素的区域的两个矩形的场宏块,分别对两个场宏块进行运动搜索,算出运动矢量和使用了该运动矢量时的编码成本即场搜索成本,其中,作为该场搜索成本,算出以下的两个值的和来进行使用:该块和运动矢量所示的参照块的各自的像素值的差分值的绝对值或差分值的平方的值的合计值;以及与该块的运动矢量和根据其周围的完成编码的运动矢量算出的预测矢量的差分相对应的成本值;
第三步骤,算出通过所述第一步骤及所述第二步骤中的运动搜索决定的运动矢量的大小的评价值;
第四步骤,在通过所述第三步骤算出的运动矢量的大小的评价值比规定的阈值大的情况下,比较通过所述第一步骤算出的帧搜索成本和通过所述第二步骤算出的场搜索成本,选择值小的一方的成本;
第五步骤,在通过所述第四步骤选择了帧搜索成本的情况下,将该编码对象区域作为帧宏块模式进行编码;
第六步骤,在通过所述第四步骤选择了场搜索成本的情况下,将该编码对象区域作为场宏块模式进行编码;
第七步骤,在通过所述第三步骤算出的运动矢量的大小的评价值为规定的阈值以下的情况下,算出帧宏块的垂直方向相邻像素间差分绝对值和并作为帧像素成本,算出场宏块的垂直方向相邻像素间差分绝对值和并作为场像素成本,选择值小的一方的成本;
第八步骤,在通过所述第七步骤选择了帧像素成本的情况下,将该编码对象区域作为帧宏块模式进行编码;以及
第九步骤,在通过所述第七步骤选择了场像素成本的情况下,将该编码对象区域作为场宏块模式进行编码。
2.根据权利要求1所述的视频编码方法,其中,所述运动矢量的大小的评价值是以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的水平成分及垂直成分各自的绝对值中的最大值或最小值或平均值。
3.根据权利要求1所述的视频编码方法,其中,所述运动矢量的大小的评价值是以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的曼哈顿距离中的最大值或最小值或平均值。
4.根据权利要求1所述的视频编码方法,其中,所述运动矢量的大小的评价值是以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的长度中的最大值或最小值或平均值。
5.一种视频编码装置,其从多个编码对象区域压缩、输出构成帧的视频数据,其中,具备:
搜索单元,其基于分割所述编码对象区域而得到的帧宏块,算出第一运动矢量和编码成本即帧搜索成本,基于分割所述编码对象区域而得到的场宏块,算出第二运动矢量和编码成本即场搜索成本,其中,作为所述帧搜索成本和所述场搜索成本,分别算出以下的两个值的和来进行使用:该块和运动矢量所示的参照块的各自的像素值的差分值的绝对值或差分值的平方的值的合计值;以及与该块的运动矢量和根据其周围的完成编码的运动矢量算出的预测矢量的差分相对应的成本值;
运动矢量判定单元,其基于所述第一及第二运动矢量,判定所述编码对象区域是动区域还是静止区域;
第一帧/场判定单元,其在所述编码对象区域为动区域的情况下,若所述帧搜索成本比所述场搜索成本小,则通过帧宏块模式对该编码对象区域进行编码、输出,在相反的情况下,通过场宏块模式对该编码对象区域进行编码、输出;
帧/场像素成本算出单元,其在所述编码对象区域为静止区域的情况下,算出作为所述帧宏块的垂直方向相邻像素间差分绝对值和的帧像素成本和作为所述场宏块的垂直方向相邻像素间差分绝对值和的场像素成本;以及
第二帧/场判定单元,其在所述帧像素成本比所述场像素成本小的情况下,通过帧宏块模式对该编码对象区域进行编码、输出,在相反的情况下,通过场宏块模式对该编码对象区域进行编码、输出。
6.根据权利要求5所述的视频编码装置,其中,
所述运动矢量判定单元具备:
运动矢量评价值算出单元,其算出所述第一及第二运动矢量的大小的评价值;以及
运动矢量阈值判定单元,在所述第一及第二运动矢量的大小的评价值比规定的阈值大的情况下,将所述编码对象区域判定为动区域,在为所述规定的阈值以下的情况下,将所述编码对象区域判定为静止区域。
7.根据权利要求5所述的视频编码装置,其中,所述运动矢量评价值算出单元将所述运动矢量的大小的评价值作为以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的水平成分及垂直成分各自的绝对值中的最大值或最小值或平均值进行算出。
8.根据权利要求5所述的视频编码装置,其中,所述运动矢量评价值算出单元将所述运动矢量的大小的评价值作为以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的曼哈顿距离中的最大值或最小值或平均值进行算出。
9.根据权利要求5所述的视频编码装置,其中,所述运动矢量评价值算出单元将所述运动矢量的大小的评价值作为以所述帧宏块、所述场宏块或将它们分割后的块为单位算出的运动矢量的长度中的最大值或最小值或平均值进行算出。
CN200880128433.8A 2008-04-08 2008-04-08 视频编码方法、视频编码装置、视频编码程序及其记录介质 Active CN102017635B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/056944 WO2009125475A1 (ja) 2008-04-08 2008-04-08 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
CN102017635A CN102017635A (zh) 2011-04-13
CN102017635B true CN102017635B (zh) 2013-05-15

Family

ID=41161618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880128433.8A Active CN102017635B (zh) 2008-04-08 2008-04-08 视频编码方法、视频编码装置、视频编码程序及其记录介质

Country Status (5)

Country Link
US (1) US8811486B2 (zh)
EP (1) EP2290988B1 (zh)
CN (1) CN102017635B (zh)
CA (1) CA2720698C (zh)
WO (1) WO2009125475A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135683B2 (en) * 2013-09-05 2015-09-15 Arecont Vision, Llc. System and method for temporal video image enhancement
GB2524249B (en) * 2014-03-17 2021-01-20 Sony Interactive Entertainment Inc Image Processing
US9807416B2 (en) * 2015-09-21 2017-10-31 Google Inc. Low-latency two-pass video coding
EP3648059B1 (en) * 2018-10-29 2021-02-24 Axis AB Video processing device and method for determining motion metadata for an encoded video
JP6835337B2 (ja) * 2019-06-20 2021-02-24 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
US11350103B2 (en) * 2020-03-11 2022-05-31 Videomentum Inc. Methods and systems for automated synchronization and optimization of audio-visual files

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074499A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化プログラム
JP2006165840A (ja) * 2004-12-06 2006-06-22 Renesas Technology Corp 動き補償画像符号化装置及び符号化方法
JP2007027805A (ja) * 2005-07-12 2007-02-01 Nippon Telegr & Teleph Corp <Ntt> 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
WO2007129433A1 (ja) * 2006-04-17 2007-11-15 Toshihiro Minami 動画像符号化装置および動画像符号化方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0846971A (ja) 1994-07-29 1996-02-16 Sharp Corp 動画像符号化装置
JP3793258B2 (ja) 1995-10-03 2006-07-05 日本放送協会 動画像処理装置および方法
JP3242362B2 (ja) 1998-04-13 2001-12-25 日本電信電話株式会社 映像符号化装置、および映像符号化プログラムを記録した記録媒体
DE69942157D1 (de) * 1999-05-13 2010-04-29 St Microelectronics Asia Adaptiver bewegungsschätzer
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US20050259734A1 (en) * 2004-05-21 2005-11-24 Timothy Hellman Motion vector generator for macroblock adaptive field/frame coded video data
US7558428B2 (en) * 2004-09-13 2009-07-07 Microsoft Corporation Accelerated video encoding using a graphics processing unit
US20060222251A1 (en) * 2005-04-01 2006-10-05 Bo Zhang Method and system for frame/field coding
JP4373423B2 (ja) * 2006-10-10 2009-11-25 日本電信電話株式会社 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074499A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化プログラム
JP2006165840A (ja) * 2004-12-06 2006-06-22 Renesas Technology Corp 動き補償画像符号化装置及び符号化方法
JP2007027805A (ja) * 2005-07-12 2007-02-01 Nippon Telegr & Teleph Corp <Ntt> 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
WO2007129433A1 (ja) * 2006-04-17 2007-11-15 Toshihiro Minami 動画像符号化装置および動画像符号化方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
&gt *
&lt *
.2006,768-771. *
APCCAS.IEEE ASIA-PACIFIC CONFERENCE ON CIRCUITS AND SYSTEMS&gt *
Lejun Yu et al.Fast Picture and Macroblock Level Adaptive Frame/Field Coding for H.264.&lt *
Lejun Yu et al.Fast Picture and Macroblock Level Adaptive Frame/Field Coding for H.264.<<APCCAS.IEEE ASIA-PACIFIC CONFERENCE ON CIRCUITS AND SYSTEMS>>.2006,768-771.

Also Published As

Publication number Publication date
EP2290988A1 (en) 2011-03-02
WO2009125475A1 (ja) 2009-10-15
US20110096840A1 (en) 2011-04-28
US8811486B2 (en) 2014-08-19
CN102017635A (zh) 2011-04-13
CA2720698A1 (en) 2009-10-15
CA2720698C (en) 2014-02-11
EP2290988B1 (en) 2013-03-27
EP2290988A4 (en) 2012-02-22

Similar Documents

Publication Publication Date Title
CN102017635B (zh) 视频编码方法、视频编码装置、视频编码程序及其记录介质
US10484691B2 (en) Image coding method and apparatus using spatial predictive coding of chrominance and image decoding method and apparatus
CN101682777B (zh) 图像预测编码装置及方法、图像预测解码装置及方法
US6025879A (en) System for moving object detection in moving picture
US6078618A (en) Motion vector estimation system
EP2094017A2 (en) Method for direct mode encoding and decoding
US20060056515A1 (en) Video evaluation device, frame rate determination device, video process device, video evaluation method, and video evaluation program
CN105120280A (zh) 图像预测编码装置及方法、图像预测解码装置及方法
EP1653745A3 (en) Image encoder and method thereof, computer program of image encoder, and mobile terminal
CN106375762B (zh) 参考帧数据压缩方法及其装置
CN100591136C (zh) 一种基于空域分解的视频帧内编码方法
CN102113327B (zh) 图像编码装置、方法、集成电路
US7953151B2 (en) Motion vector detecting apparatus
US8442335B2 (en) Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefore and storage medium or signal carrying a block encoded by help of a modified reference block
US8804830B2 (en) Method for performing motion estimation
CN108924551A (zh) 视频图像编码模式的预测方法及相关设备
CN104104947B (zh) 一种视频编码方法和装置
JP4373423B2 (ja) 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体
JP4868539B2 (ja) 動画像符号化装置および復号装置
JP4510701B2 (ja) 動画像符号化装置
CN1739297A (zh) 运动矢量预测方法及其系统
CN102547262B (zh) 视频编码运动估计方法
JP6918661B2 (ja) 符号化装置、符号化方法及びプログラム
CN100373949C (zh) 一种硬件加速装置及其实现运动估计的方法
CN114363631B (zh) 一种基于深度学习的音视频处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant