CN101873495B - 场景转换检测装置以及影像记录装置 - Google Patents

场景转换检测装置以及影像记录装置 Download PDF

Info

Publication number
CN101873495B
CN101873495B CN201010169307.6A CN201010169307A CN101873495B CN 101873495 B CN101873495 B CN 101873495B CN 201010169307 A CN201010169307 A CN 201010169307A CN 101873495 B CN101873495 B CN 101873495B
Authority
CN
China
Prior art keywords
unit
histogram
similar degree
predictive
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010169307.6A
Other languages
English (en)
Other versions
CN101873495A (zh
Inventor
守屋芳美
出原优一
关口俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN101873495A publication Critical patent/CN101873495A/zh
Application granted granted Critical
Publication of CN101873495B publication Critical patent/CN101873495B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明得到一种场景转换检测装置,可以使用解码像素从利用如进行预测编码那样的编码方式编码得到的流中,高速地进行场景转换检测。熵解码部(31)从编码流中对预测模式进行熵解码。帧内预测模式直方图差分生成部(32)输入1个图片内的多个块的熵解码出的预测模式而生成直方图,并且对针对每个图片生成的预测模式的直方图进行比较而计算直方图之间的类似度。场景转换判定部(33)根据由帧内预测模式直方图差分生成部(32)求出的类似度,判定在图片之间是否存在场景转换。

Description

场景转换检测装置以及影像记录装置
技术领域
本发明涉及从连续的影像中检测出多个场景(场面)的变化点(场景转换)的场景转换(scene change)检测装置以及使用了该装置的影像记录装置。
背景技术
在数字摄影机或记录数字广播的影像记录装置等中,使用对连续记录的一个影像序列中所包含的场景转换进行检测的场景转换检测装置。
作为以往的场景转换检测的方法,例如有如下那样的专利文献1、2所示的方法。
在专利文献1中,使用直方图差分法,在该直方图差分法中,求出某帧图像的亮度或者色差的像素值的度数分布(直方图:histogram),例如将2帧图像之间的直方图的差异作为评价值计算出,并对评价值进行阈值处理,从而对场景转换进行检测。
在专利文献2中,公开了根据对以MPEG-2编码方式编码的编码流进行解码而得到的解码图像生成直方图的方法,并公开了为了高速进行场景转换,在对包含于编码流中的DCT系数进行解码时,不解码所有系数而是根据削减所使用的分量(次数)而解码的图像生成直方图的方法。
另外,作为不对以MPEG-2编码方式编码的编码流进行解码而抽出用于场景转换的特征量的方法,例如有专利文献3所示的方法。
在专利文献3中,作为不对以像MPEG-2编码方式那样使用了DCT的帧结构的压缩方式编码的编码流进行解码而检测场景转换的方法,公开了将DCT系数的特定位置的频率分量的值用作评价值的方法。例如,在包含于帧内的两个场(field)之间存在场景转换的情况下,奇数场与偶数场的数据值之差变大,成为横条纹(水平方向分量)多的帧。在将横条纹多的图像分割为块进行了DCT变换的情况下,利用左端尤其是左下的分量值的绝对值变大的现象来检测场景转换。
但是,作为数字摄影机或记录数字广播的影像记录装置等中使用的影像编码方式,除了MPEG-2以外还有AVC/H.264编码方式。在AVC/H.264编码方式中,将图像分割为规定尺寸的块(宏块),并进行宏块单位的编码。对于各宏块,选择仅使用编码对象帧内的数据来进行编码的帧内编码模式(帧内模式:intra-mode)、在帧间进行运动补偿预测来进行编码的帧间编码模式(帧间模式:inter-mode)中的某一个模式。以下,说明选择了帧内模式的宏块的编码方法。宏块被分割为规定尺寸的块,按照块单位进行编码。对于编码对象的块内的像素,使用周边的已编码块的像素进行预测(帧内预测),得到与通过帧内预测生成的预测信号的差分信号(预测误差信号)。对预测误差信号进行正交变换,得到变换系数数据。对变换系数数据进行量化而得到量化系数数据。对量化系数数据进行算术编码等熵编码,复用到比特流数据中。在帧内预测中,通过预测信号的生成方法,准备了多个模式(帧内预测模式),可以按照块单位选择一个模式。选择何种模式的信息按照块单位被复用到比特流数据中。
专利文献1:日本特开2008-85540公报
专利文献2:国际公开第2007/017970号小册子
专利文献3:日本特开2002-64823公报
但是,在专利文献1记载的方法中,必须对已编码的流进行解码而临时生成解码图像,存在如下问题:例如在无能为力(powerless)的CPU上进行处理的情况或与记录时的编码处理同时进行的情况等,在场景转换检测处理中可占有的处理时间被限制的情况下,来不及进行场景转换检测处理。
另外,在专利文献2记载的方法中,采用了通过削减DCT系数的处理次数来降低处理负荷的做法,但例如在像AVC/H.264编码方式那样使用已编码的像素来进行预测编码的编码方式的情况下,通过削减DCT系数的次数无法得到正确的预测图像而误差被传播,导致解码图像不成形,所以难以根据削减DCT系数的次数而解码的解码图像进行场景转换检测。
进而,在专利文献3记载的方法中,利用在存在场景转换时成为横条纹(水平方向分量)多的帧的现象,但在像AVC/H.264编码方式那样使用邻接像素来进行预测编码时,DCT系数成为与预测图像的误差信号,例如在跨越块而横条纹连续的情况下,在对作为编码对象的右侧的块的像素值直接进行DCT变换时在左端的系数中存在绝对值大的分量,但在根据已编码的块的右端的像素值生成预测图像时,预测误差成为0,并且对预测误差进行了DCT变换时也不产生DCT系数,所以难以检测关注了特定分量的值的场景转换。
发明内容
本发明是为了解决上述那样的课题而完成的,其目的在于提供一种场景转换检测装置以及影像记录装置,可以使用解码像素从利用如进行预测编码那样的编码方式实施编码而得到的流中,高速地进行场景转换检测。
本发明的场景转换检测装置,具备:熵解码单元,将影像数据分割为规定尺寸的块,从以该块单位编码的编码流中,按照块单位对表示生成预测信号的方法的预测模式进行熵解码;预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的预测模式,生成直方图;预测模式直方图类似度计算单元,对针对每个图片生成的预测模式的直方图进行比较而计算直方图之间的类似度;以及场景转换判定单元,根据类似度,判定在图片之间是否存在场景转换。
本发明的场景转换检测装置生成预测模式的多个块的直方图,对每个图片的直方图进行比较而求出直方图的类似度,并根据该类似度判定在图片之间是否存在场景转换,所以可以使用解码像素从利用如进行预测编码那样的编码方式编码得到的流中,高速地进行场景转换检测。
附图说明
图1是示出本发明的实施方式1的影像记录装置的结构图。
图2是示出本发明的实施方式1的场景转换检测装置的结构图。
图3是示出AVC/H.264编码方式中的亮度的帧内预测模式的说明图。
图4是示出本发明的实施方式1的场景转换检测装置中的某图片的亮度的帧内预测模式的直方图的说明图。
图5是本发明的实施方式2的场景转换检测装置的结构图。
符号说明
1:影像记录装置;2:流控制部;3、3a:场景转换检测部;4:HDD;5:编码部;31、31a:熵解码部;32:帧内预测模式直方图差分生成部;33、33a:场景转换判定部;34:色差信号解码部;35:色差信号直方图差分生成部;36:存储器;341:逆量化部;342:逆正交变换部;343:帧内预测部;344:加法部。
具体实施方式
实施方式1
图1是示出本发明的实施方式1的影像记录装置的结构图。
图1所示的影像记录装置1具备流控制部2、场景转换检测部3、以及硬盘驱动器(HDD)4。流控制部2构成为,输入在设置于外部的编码部5中以AVC/H.264编码方式编码而得到的编码流,将该编码流作为影像记录信号输出给HDD4,并且将帧内图片数据输出给场景转换检测部3。场景转换检测部3是输入帧内图片数据而进行场景转换检测处理的场景转换检测装置,对于其详情在后面叙述。HDD4构成记录单元,记录从流控制部2输出的编码流与由场景转换检测部3检测出的场景转换位置信息。另外,编码部5例如是调谐器这样的装置,以AVC/H.264编码方式对影像信号进行编码,输出编码流。另外,也可以在影像记录装置1内部具备该编码部5。
图2是示出场景转换检测部3的内部的结构图。
场景转换检测部3具备熵解码部31、帧内预测模式直方图差分生成部32、以及场景转换判定部33。熵解码部31是输入从流控制部2输出的帧内图片数据,进行熵解码的功能部。帧内预测模式直方图差分生成部32是如下功能部:根据由熵解码部31熵解码出的编码参数中的预测模式,生成1个图片内的多个块的直方图,对每个图片的直方图进行比较,计算直方图之间的类似度。场景转换判定部33是如下功能部:根据从帧内预测模式直方图差分生成部32输出的直方图之间的类似度,判定在图片之间是否存在场景转换。另外,熵解码部31构成熵编码单元,帧内预测模式直方图差分生成部32构成预测模式直方图生成单元与预测模式直方图类似度计算单元,场景转换判定部33构成场景转换判定单元。
接下来,说明实施方式1的影像记录装置的动作。
在编码部5中以AVC/H.264编码方式编码而得到的编码流被输入到流控制部2。流控制部2将在场景转换检测中使用的编码流输出给场景转换检测部3。如以下说明,在场景转换检测部3仅使用影像数据的尤其是被帧内编码的图片数据(帧内图片数据)来进行场景转换检测的情况下,在流控制部2中,从编码流中仅抽出帧内图片数据并输出给场景转换检测部3。
场景转换检测部3输入帧内图片数据而进行场景转换检测处理。以下,说明该场景转换检测处理。从流控制部2输出的帧内图片数据被输入到熵解码部31,通过算术解码或者可变长解码等熵解码,对以块单位编码的编码参数与预测误差信号的量化系数数据进行解码。在熵解码出的编码参数中,亮度的帧内预测模式被输出到帧内预测模式直方图差分生成部32。
在此,说明AVC/H.264编码方式中的帧内预测模式。对于亮度的帧内预测模式,可以按照块单位从九个模式中选择一个模式。图3示出亮度的帧内预测模式。在图3中,白圆是编码对象的块内的像素。黑圆是在预测中使用的像素,是已编码的邻接块内的像素。例如,模式0是垂直方向预测,通过在垂直方向上重复上面的块的邻接像素来生成预测图像。例如在纵条纹图案时,选择模式0。同样地,模式1是水平方向预测,通过在水平方向上重复左面的块的邻接像素来生成预测图像。例如在横条纹图案时,选择模式1。这样,根据图像所具有的结构性的特征来决定帧内预测模式。因此,通过在图片内观察帧内预测模式的分布的变化,可以检测出结构性的特征大幅变化的场景的变化点。
帧内预测模式直方图差分生成部32输入按照块单位熵解码出的帧内预测模式,按照图片单位生成帧内预测模式的直方图。在亮度的帧内预测模式的情况下,有九个模式且对各模式的个数进行计数。图4示出某图片的亮度的帧内预测模式的直方图。在图4中,横轴表示帧内预测模式,纵轴表示各模式的个数(频度)。生成的直方图被存储到直方图缓冲器(未图示)中。在使用2个图片的直方图来计算图片之间的类似度的情况下,准备2个直方图缓冲器即可。在使用3个图片以上的直方图来计算场景的类似度的情况下,直方图缓冲器也需要3个以上。
帧内预测模式直方图差分生成部32计算存储在直方图缓冲器中的帧内预测模式的直方图之间的类似度。将两个直方图之间的类似度设为:例如,将与直方图的相同要素(帧内预测模式)对应的频度(个数)的绝对差分针对所有要素相加而得到的值(绝对差分和)(式1)。
图片i的帧内预测模式的直方图:Hi={hi(0),hi(1),…,hi(N-1)},N=9
图片i+1的帧内预测模式的直方图:Hi+1={hi+1(0),hi+1(1),…,hi+1(N-1)},N=9
图片i与图片i+1的直方图之间的类似度:d
d = 1 N Σ n = 0 N - 1 | h i ( n ) - h i - 1 ( n ) | (式1)
另外,也可以将对各要素的绝对差分进行不同的加权之后相加而得到的值(加权绝对差分和)作为直方图之间的类似度。特别是,在有针对场景的结构性的变化敏感地变化的帧内预测模式的情况下,可以通过增大对该帧内预测模式的加权来提高场景转换的精度。
由帧内预测模式直方图差分生成部32求出的连续的图片的直方图之间的类似度被输出到场景转换判定部33。
场景转换判定部33对直方图之间的类似度与规定的阈值进行比较,在类似度超过阈值的情况下,将其图片之间判定为场景转换,将判定为场景转换的图片的时刻信息作为场景转换位置信息输出。在场景转换的判定中使用的阈值可以是预先确定的固定值,但也可以根据判定为同一场景内的图片之间的类似度的平均值或方差来动态地决定阈值。即使是相同的场景,在变动大的场景中,类似度的平均值或方差也变大,所以将阈值也设定为较大的值。相对于此,在几乎没有变动的场景中,由于类似度的平均值或方差变小,所以将阈值也设定为较小的值。通过这样决定阈值,可以防止误检测,提高场景转换的精度。
从场景转换判定部33输出的场景转换位置信息被记录到HDD4等记录介质中。
另外,在上述说明中,使用亮度的帧内预测模式的直方图来检测了场景转换,但在AVC/H.264中,与亮度的帧内预测模式不同地准备了针对色差信号的帧内预测模式(4种)。因此,也可以与亮度同样地,使用色差的帧内预测模式的直方图检测场景转换。另外,也可以使用亮度的帧内预测模式与色差的帧内预测模式这两方的直方图来检测场景转换。
另外,在AVC/H.264中,作为亮度的帧内预测的块尺寸,可以从水平16像素×垂直16行、水平8像素×垂直8行、以及水平4像素×垂直4行中选择。因此,也可以使用这些帧内预测的块尺寸的直方图来检测场景转换。在该情况下,帧内预测模式直方图差分生成部32并不是计算帧内预测模式的直方图,而是计算帧内预测的块尺寸的直方图的类似度。
另外,在本实施方式中,以编码流是按照AVC/H.264编码方式进行编码而得到的流的情况为前提进行了说明,但只要是在进行帧内编码时使用多个预测模式来生成预测图像并将预测模式与预测误差信号以块单位进行编码的编码方式,则可以同样地检测出场景转换。
进而,在本实施方式中,按照图片单位将编码流输入给场景转换检测部3,但也可以按照将图片分割为多个区域而得到的单位(切片单位)输入给场景转换检测部3。另外,也可以将图片内的部分区域(例如仅上半部分或者中央等)输入给场景转换检测部3。
如上所述,根据实施方式1的场景转换检测装置,具备:熵解码单元,将影像数据分割为规定尺寸的块,从以块单位编码的编码流中,按照块单位对表示生成预测信号的方法的预测模式进行熵解码;预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的预测模式,生成直方图;预测模式直方图类似度计算单元,对针对每个图片生成的预测模式的直方图进行比较,计算直方图之间的类似度;以及场景转换判定单元,根据类似度判定在图片之间是否存在场景转换,所以可以利用解码像素,从使用如进行预测编码那样的编码方式实施编码而得到的流中,高速地进行场景转换检测。
另外,根据实施方式1的影像记录装置,由于将输入到预测模式直方图生成单元的预测模式设为1个图片量,所以可以高精度地检测图片之间的场景转换。
另外,根据实施方式1的影像记录装置,具备:编码单元,将影像数据分割为规定尺寸的块,输出以块单位编码的编码流;熵解码单元,从由编码单元输出的编码流中,按照块单位对表示生成预测信号的方法的预测模式进行熵解码;预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的预测模式,生成直方图;预测模式直方图类似度计算单元,对针对每个图片生成的预测模式的直方图进行比较,计算类似度;场景转换判定单元,根据类似度,判定在图片之间是否存在场景转换;场景转换位置信息输出单元,在场景转换判定单元中判定为存在场景转换的情况下,输出场景转换的位置信息;以及记录单元,记录场景转换位置信息与编码流,所以能够实现如下的影像记录装置,即可以使用解码像素,从利用如进行预测编码那样的编码方式实施编码而得到的流中,高速地进行场景转换检测的影像记录装置。
实施方式2
在实施方式1中,使用包含在帧内图片数据中的帧内预测模式来检测了场景转换,但在本实施方式中除了帧内预测模式以外还使用色差信号来检测场景转换。
图5是示出实施方式2中的影像记录装置的场景转换检测部的内部的结构图。
实施方式2中的场景转换检测部3a具备熵解码部31a、帧内预测模式直方图差分生成部32、场景转换判定部33a、色差信号解码部34、色差信号直方图差分生成部35、以及存储器36。
熵解码部31a具有实施方式1的熵解码部31的功能,并且根据帧内图片数据,输出色差量化系数数据与色差的帧内预测模式。帧内预测模式直方图差分生成部32具有与实施方式1的帧内预测模式直方图差分生成部32同样的功能。另外,场景转换判定部33a根据从帧内预测模式直方图差分生成部32输出的帧内预测模式的直方图之间的类似度、与从色差信号直方图差分生成部35输出的色差信号的直方图之间的类似度,判定场景转换。
色差信号解码部34具备逆量化部341、逆正交变换部342、帧内预测部343、以及加法部344,它们具有如下那样的功能。逆量化部341进行色差量化系数数据的逆量化。逆正交变换部342进行从逆量化部341输出的变换系数数据的逆正交变换,输出预测误差信号。帧内预测部343根据色差的帧内预测模式与存储在存储器36中的解码色差信号生成预测信号,输出给加法部344。加法部344将从逆正交变换部342输出的预测误差信号与从帧内预测部343输出的预测信号相加,作为解码色差信号输出。
色差信号直方图差分生成部35是如下的功能部:根据从色差信号解码部34输出的解码色差信号,求出色差信号的直方图之间的类似度,并将其输出给场景转换判定部33a。存储器36是用于保持从色差信号解码部34的加法部344输出的解码色差信号的存储部。
另外,由色差信号解码部34的逆量化部341与逆正交变换部342构成预测误差信号解码单元,帧内预测部343构成预测信号生成单元。另外,加法部344构成加法单元,色差信号直方图差分生成部35构成色差信号直方图生成单元与色差信号直方图类似度计算单元。进而,熵解码部31a构成熵解码单元,场景转换判定部33a构成场景转换判定单元。
接下来,说明实施方式2的场景转换检测部3a的动作。
帧内图片数据被输入到熵解码部31a,通过算术解码或者可变长解码等熵解码,对以块单位编码的编码参数、量化系数数据进行解码。在熵解码出的编码参数中,亮度或者色差的帧内预测模式被输出到帧内预测模式直方图差分生成部32。色差的帧内预测模式被输出到色差信号解码部34的帧内预测部343。熵解码出的色差的量化系数数据被输出到逆量化部341。
由于帧内预测模式直方图差分生成部32的动作与实施方式1相同,所以省略在此的说明。
帧内预测部343将色差的帧内预测模式作为输入,按照针对各个模式决定的预测方法,从存储器36中参照邻接块的解码色差信号的像素并生成预测信号。预测信号被输出到加法部344。
逆量化部341对输入的色差的量化系数数据进行逆量化而得到变换系数数据。变换系数数据被输出到逆正交变换部342。逆正交变换部342对输入的变换系数数据进行逆正交变换而得到预测误差信号。预测误差信号被输出到加法部344。
加法部344将输入的预测误差信号与预测信号相加而得到解码色差信号。解码色差信号被输出到色差信号直方图差分生成部35。另外,为了在帧内预测时参照,记录到存储器36中。
色差信号直方图差分生成部35根据1个图片的解码色差信号生成直方图。在色差信号具有8比特的灰度的情况下,将0至255的各像素值作为要素,对各要素的频度进行计数而生成直方图。另外,也可以按照适当地分割8比特的灰度而得到的单位分配要素,由此减少要素数。
色差信号直方图差分生成部35计算连续的图片的解码色差信号的直方图之间的类似度。将直方图之间的类似度设为,针对所有要素求出直方图的相同要素的频度(个数)的绝对差分并相加得到的值(绝对差分和)。另外,也可以将对各要素的绝对差分进行不同的加权之后相加而得到的值(加权绝对差分和)作为直方图之间的类似度。连续的图片的解码色差信号的直方图之间的类似度被输出到场景转换判定部33a。
场景转换判定部33a将输入的连续的图片的解码色差信号的直方图之间的差分以及帧内预测模式的直方图之间的差分作为输入,对解码色差信号的直方图之间的类似度与帧内预测模式的直方图之间的类似度之和、和规定的阈值进行比较,在类似度之和超过阈值的情况下,将其图片之间判定为场景转换,输出场景转换位置信息。另外,也可以在求出类似度之和时,付上权重,由此提高某一个类似度的优先级。
另外,在本实施方式中,求出了帧内预测模式的直方图与解码色差信号的直方图这两者,但也可以例如根据CPU的处理负荷状况等,判断是否生成解码色差信号的直方图,在判断为不生成解码色差信号的直方图的情况下,仅使用帧内预测模式的直方图来进行场景转换的判定。
如上所述,根据实施方式2的场景转换检测装置,熵解码单元从编码流中按照块单位对色差的预测模式与预测误差信号的量化系数数据进行熵解码,并且场景转换检测装置还具备:预测误差信号解码单元,对熵解码出的量化系数数据进行逆量化、逆正交变换而解码预测误差信号;预测信号生成单元,按照用熵解码出的色差的预测模式表示的方法,生成预测信号;加法单元,将预测误差信号与预测信号相加而生成色差的解码信号;色差信号直方图生成单元,输入1个图片内的多个块的按照块单位生成的色差的解码信号,生成直方图;以及色差信号直方图类似度计算单元,对针对每个图片生成的色差信号的直方图进行比较而计算类似度,其中,场景转换判定单元根据从预测模式直方图类似度计算单元输出的类似度、与从色差信号直方图类似度计算单元输出的类似度,判定在图片之间是否存在场景转换,所以可以使用解码像素,从利用如进行预测编码那样的编码方式编码的流中,高速地进行场景转换检测,并且可以可靠地检测场景转换。
另外,根据实施方式2的影像记录装置,具备:编码单元,将影像数据分割为规定尺寸的块,输出以块单位编码的编码流;熵解码单元,从由编码单元输出的编码流中,按照块单位对表示生成预测信号的方法的预测模式进行熵解码;预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的预测模式,生成直方图;预测模式直方图类似度计算单元,对针对每个图片生成的预测模式的直方图进行比较而计算类似度;场景转换判定单元,根据类似度,判定在图片之间是否存在场景转换;场景转换位置信息输出单元,在场景转换判定单元中判定为存在场景转换的情况下,输出场景转换的位置信息;以及记录单元,记录场景转换位置信息与编码流,并且,熵解码单元从编码流中按照块单位对色差的预测模式与预测误差信号的量化系数数据进行熵解码,并且影像记录装置还具备:预测误差信号解码单元,对熵解码出的量化系数数据进行逆量化、逆正交变换而解码预测误差信号;预测信号生成单元,按照用熵解码出的色差的预测模式表示的方法,生成预测信号;加法单元,将预测误差信号与预测信号相加而生成色差的解码信号;色差信号直方图生成单元,输入1个图片内的多个块的按照块单位生成的色差的解码信号,生成直方图;以及色差信号直方图类似度计算单元,对针对每个图片生成的色差信号的直方图进行比较而计算类似度,场景转换判定单元根据从预测模式直方图类似度计算单元输出的类似度与从色差信号直方图类似度计算单元输出的类似度,判定在图片之间是否存在场景转换,所以能够实现可以高速且可靠地检测场景转换的影像记录装置。

Claims (4)

1.一种场景转换检测装置,其特征在于,具备:
熵解码单元,将影像数据分割为规定尺寸的块,从以该块单位编码的编码流中,按照上述块单位对表示生成预测信号的方法的多个预测模式进行熵解码;
预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的多个预测模式,生成表示各预测模式的频度的直方图;
预测模式直方图类似度计算单元,对各预测模式的频度进行比较而计算直方图之间的类似度;以及
场景转换判定单元,根据上述类似度,判定在图片之间是否存在场景转换,
熵解码单元从编码流中,按照块单位对色差的预测模式与预测误差信号的量化系数数据进行熵解码,并且
场景转换检测装置还具备:
预测误差信号解码单元,对上述熵解码出的量化系数数据进行逆量化、逆正交变换而解码预测误差信号;
预测信号生成单元,按照用上述熵解码出的色差的预测模式表示的方法,生成预测信号;
加法单元,将上述预测误差信号与上述预测信号相加而生成色差的解码信号;
色差信号直方图生成单元,输入1个图片内的多个块的按照上述块单位生成的色差的解码信号,生成直方图;以及
色差信号直方图类似度计算单元,对针对每个图片生成的色差信号的直方图进行比较而计算类似度,
场景转换判定单元根据从预测模式直方图类似度计算单元输出的类似度与从上述色差信号直方图类似度计算单元输出的类似度,判定在图片之间是否存在场景转换。
2.根据权利要求1所述的场景转换检测装置,其特征在于,输入到预测模式直方图生成单元中的预测模式是1个图片量。
3.一种影像记录装置,其特征在于,具备:
编码单元,将影像数据分割为规定尺寸的块,输出以该块单位编码的编码流;
熵解码单元,从由上述编码单元输出的编码流中,按照上述块单位对表示生成预测信号的方法的多个预测模式进行熵解码;
预测模式直方图生成单元,输入1个图片内的多个块的熵解码出的多个预测模式,生成表示各预测模式的频度的直方图;
预测模式直方图类似度计算单元,对各预测模式的频度进行比较而计算类似度;
场景转换判定单元,根据上述类似度,判定在图片之间是否存在场景转换;
场景转换位置信息输出单元,在上述场景转换判定单元中判定为存在场景转换的情况下,输出场景转换的位置信息;以及
记录单元,记录上述场景转换位置信息与上述编码流,
熵解码单元从编码流中,按照块单位对色差的预测模式与预测误差信号的量化系数数据进行熵解码,并且
影像记录装置还具备:
预测误差信号解码单元,对上述熵解码出的量化系数数据进行逆量化、逆正交变换而解码预测误差信号;
预测信号生成单元,按照用上述熵解码出的色差的预测模式表示的方法,生成预测信号;
加法单元,将上述预测误差信号与上述预测信号相加而生成色差的解码信号;
色差信号直方图生成单元,输入1个图片内的多个块的按照上述块单位生成的色差的解码信号,生成直方图;以及
色差信号直方图类似度计算单元,对针对每个图片生成的色差信号的直方图进行比较而计算类似度,
场景转换判定单元根据从预测模式直方图类似度计算单元输出的类似度与从上述色差信号直方图类似度计算单元输出的类似度,判定在图片之间是否存在场景转换。
4.根据权利要求3所述的影像记录装置,其特征在于,
输入到上述预测模式直方图生成单元中的预测模式是1个图片量。
CN201010169307.6A 2009-04-22 2010-04-21 场景转换检测装置以及影像记录装置 Expired - Fee Related CN101873495B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009103977A JP5178616B2 (ja) 2009-04-22 2009-04-22 シーンチェンジ検出装置および映像記録装置
JP2009-103977 2009-04-22

Publications (2)

Publication Number Publication Date
CN101873495A CN101873495A (zh) 2010-10-27
CN101873495B true CN101873495B (zh) 2014-03-12

Family

ID=42998114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010169307.6A Expired - Fee Related CN101873495B (zh) 2009-04-22 2010-04-21 场景转换检测装置以及影像记录装置

Country Status (3)

Country Link
JP (1) JP5178616B2 (zh)
CN (1) CN101873495B (zh)
MY (1) MY154523A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6003042B2 (ja) 2011-11-11 2016-10-05 セイコーエプソン株式会社 画像処理装置及び画像処理方法
CN104253928B (zh) * 2013-06-26 2018-02-13 中山市云创知识产权服务有限公司 基于场景侦测的实时影像记录系统及方法
JP6588745B2 (ja) * 2015-06-24 2019-10-09 日本放送協会 シーンチェンジ検出装置、及びそのプログラム
WO2019082268A1 (ja) * 2017-10-24 2019-05-02 三菱電機株式会社 画像処理装置及び画像処理方法
KR102286873B1 (ko) 2019-12-09 2021-08-09 디아이씨 가부시끼가이샤 컬러 필터용 할로겐화아연프탈로시아닌 안료 및 컬러 필터용 할로겐화아연프탈로시아닌 안료의 제조 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1822201A (zh) * 2005-02-14 2006-08-23 松下电器产业株式会社 信息记录/再生装置
CN1976394A (zh) * 2006-12-07 2007-06-06 浙江大学 基于压缩域的场景变化实时检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10224779A (ja) * 1997-02-10 1998-08-21 Hitachi Ltd 動画像のシーン変化検出方法及び装置
JP4021545B2 (ja) * 1998-03-12 2007-12-12 株式会社東芝 デジタル動画像処理装置およびデジタル動画像処理方法
US7177470B2 (en) * 2002-11-13 2007-02-13 Koninklijke Philips Electronics N. V. Method of and system for detecting uniform color segments
JP3827705B1 (ja) * 2005-08-11 2006-09-27 三菱電機株式会社 映像記録装置及びシーンチェンジ抽出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1822201A (zh) * 2005-02-14 2006-08-23 松下电器产业株式会社 信息记录/再生装置
CN1976394A (zh) * 2006-12-07 2007-06-06 浙江大学 基于压缩域的场景变化实时检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
C.F. Lain arid M.C. Lee.Video Segmentation Using Color Difference Histogram.《Multimedia information analysis and retrieval》.1998,第1464/1998卷159-174. *
JP特开2007-49516A 2007.02.22
MINYOUNG EOM and YOONSIK CHOE.Scene Change Detection on H.264/AVC Compressed Video Using Intra Mode Distribution Histogram Based on Intra Prediction Mode.《Proceedings of the 6th WSEAS International Conference on Applications of Electrical Engineering》.2007,第141-144页.
Scene Change Detection on H.264/AVC Compressed Video Using Intra Mode Distribution Histogram Based on Intra Prediction Mode;MINYOUNG EOM and YOONSIK CHOE;《Proceedings of the 6th WSEAS International Conference on Applications of Electrical Engineering》;20070529;第141-144页 *

Also Published As

Publication number Publication date
CN101873495A (zh) 2010-10-27
JP2010258576A (ja) 2010-11-11
MY154523A (en) 2015-06-30
JP5178616B2 (ja) 2013-04-10

Similar Documents

Publication Publication Date Title
US9609322B2 (en) Image encoding apparatus, image encoding method, image decoding apparatus, and image decoding method
CN101663898B (zh) 二维自适应内插滤波器的滤波系数决定方法
JP5266342B2 (ja) 映像イントラ予測方法及び装置
CN102835110B (zh) 运动矢量预测编码方法、运动矢量预测解码方法、运动图像编码装置、运动图像解码装置及其程序
CN101641958B (zh) 图像处理设备和图像处理方法
CN102823250B (zh) 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
KR101375664B1 (ko) 영상의 디퓨전 특성을 이용한 영상 부호화/복호화 방법 및장치
CN102742276B (zh) 运动向量预测编码方法、运动向量预测解码方法、活动图像编码装置、活动图像解码装置及其程序
CN102271257A (zh) 图像处理设备和方法及程序和计算机可读介质
CN100521744C (zh) 图像处理设备和方法
CN101873495B (zh) 场景转换检测装置以及影像记录装置
CN101938649B (zh) 译码设备、译码控制设备、译码方法和程序
US8442335B2 (en) Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefore and storage medium or signal carrying a block encoded by help of a modified reference block
JP2010278519A (ja) 動きベクトル検出装置
AU2021103378A4 (en) A self-adaptive n-depth context tree weighting method
JP4561701B2 (ja) 動画像符号化装置
CN101682782B (zh) 运动图像编码方法
JP4478480B2 (ja) 動画像符号化装置及びその方法
JP2008028882A (ja) 動画像符号化装置
CN115834882A (zh) 一种帧内预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140312

Termination date: 20200421