CN1252982C - 画面切换检测中减少错误认定的方法和装置 - Google Patents

画面切换检测中减少错误认定的方法和装置 Download PDF

Info

Publication number
CN1252982C
CN1252982C CNB008070067A CN00807006A CN1252982C CN 1252982 C CN1252982 C CN 1252982C CN B008070067 A CNB008070067 A CN B008070067A CN 00807006 A CN00807006 A CN 00807006A CN 1252982 C CN1252982 C CN 1252982C
Authority
CN
China
Prior art keywords
frame
brightness
value
scene
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB008070067A
Other languages
English (en)
Other versions
CN1349711A (zh
Inventor
T·麦格
N·蒂米特罗瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1349711A publication Critical patent/CN1349711A/zh
Application granted granted Critical
Publication of CN1252982C publication Critical patent/CN1252982C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/60Solid state media
    • G11B2220/65Solid state media wherein solid state memory is used for storing indexing information or metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

一种视频图像索引方法和装置,用于对视频中每个检测出的场景选择关键帧。本方法和装置可判定,在两个视频帧之间是否发生了场景变化,或者两个视频帧之间的变化仅仅是亮度值的均匀变化。

Description

画面切换检测中 减少错误认定的方法和装置
技术领域
本发明一般地涉及一种装置,它检测出一个信源视频中的各个重要场景,并从中选择出代表性的关键帧。本发明具体涉及作出一种判定,即是否检测到的一个场景变化确实是一个场景变化,或者只是图像亮度的一个均匀变化,诸如在新闻广播节目等场合中发生的照相机之闪光灯闪光造成的亮度均匀变化。
背景技术
用户往往会在磁带上记录家庭视频节目,或者记录电视节目、电影、音乐会、体育比赛、等等,用于以后观看或重复观看。然而,用户可能没有写下已录磁带上的内容,或者没有记住在磁带上录制了什么内容,或是没有记住特定的场景、电影、事件记录在磁带上什么地方。因此,用户可能必须坐下来观看整个的磁带,并记忆磁带上有什么内容。
视频内容分析装置应用自动和半自动方法来提取出可描述已录材料内容的信息。视频内容索引和分析装置从视频内容中的可视提示内提取出图像的结构和含义。通常,通过对反映出视频中不同场景的一些帧作出选择,以从一个电视节目或家庭录像中取出一个视频剪辑。
1995年出版的Multimedia Tools and Applications(多媒体工具与应用)第89-111页中,Hongjiang Zhang、Chien Yong Low和Stephen W. Smoliar在“Video Parsing and Browsing UsingCompressed Data(应用压缩数据的视频解析和浏览)”文章中叙述的一种场景变化检测系统内,对两个视频帧之间相应的像块作出比较,在不分离开像块类型下就全部像块之间的差值在整个视频帧上总加起来。如果在两帧之间有一定数目的像块发生了变化,便检测到一个场景变化。然而,如果两帧的有关像块之间的差值就彩色或亮度而言近似地相同,则Zhang的检测系统可能产生出曲解的结果。此种场合下,检测系统会检测出一个场景变化,而事实上只是在新闻广播期间发生了照相机的闪光灯闪光。
发明内容
需要有一种系统,对于先前记录或正在记录的视频源可创建一个可视的索引,它在选择重要的关键帧中便于应用且更为精确,同时向用户提供出一种可应用的信息量。该系统可检测出场景变化,并从每种场景中选择出一个关键帧,则对于帧内实质上所有像块或宏块亮度方面实际中仅仅的均匀变化,在它所产生出的两帧之间的信息变化里,可弃置其场景变化的检知和关键帧的选取。
本发明的一个目的是比较两个视频帧以检测一个场景变化,但若两帧之间的差别仅仅是亮度方面实质上的均匀变化,则本发明将判定,未检测到一个场景变化。
本发明的另一个目的是比较两帧中对应像块的直流(DC)系数。如果直流系数的变化在帧内实际中的所有像块上近似相同,则将判定,没有发生场景变化,而不选择出另一个关键帧。
根据本发明的第一方面,提供了一种视频索引系统,用于检测场景变化,并对每个场景选择出关键帧,该系统包含有:
a)场景变化检测器(230),检测在两个视频帧之间的场景变化;以及
b)用于在两帧之间检测亮度均匀变化的检测系统,所述检测系统含有:
i)一个接收机(210,202),接收信源视频,而信源视频中具有由亮度值构成的各帧;以及
ii)一个比较器(230,240),将第一帧内的亮度值与第二帧内各自的亮度值进行比较,和检测第一帧中的所有亮度值是否与第二帧中的所有亮度值显著地变化了实际上相同的量值;
一检测到场景变化所述检测系统就能接收两个视频帧,并能判定两帧之间的差别是否实际上只是亮度均匀变化。根据本发明的第二方面,提供了一种用于鉴别场景变化检测的错误认定的方法,包括:接收至少两个视频帧,每帧具有各个亮度值,这两帧已被检知为从第一帧到第二帧发生了场景变化;将第一帧内各个亮度值与第二帧内相应的亮度值进行比较;以及计算第一帧内的所有亮度值是否与第二帧中的所有亮度值显著地变化了实际上相同的量值,如果如此,则判定在这两帧之间发生了错误认定的场景变化。
为了更好地理解本发明、其运行优点,以及应用它能达到的特定目的,须参考附图和其说明,附图中,示例和描述了本发明的诸优选
实施例。
附图说明
为了更好地理解,对下面各图作出解说。
图1示明一种视频归档处理;
图2A和图2B是按照本发明的一种优选实施例在创建一个可视索引中所使用装置的方框图;
图3示明了一个帧、一个宏块和几个像块;
图4示明了一个像块的若干DCT系数;
图5示明了带有DCT系数的一个宏块和几个像块;以及
图6示例出一种视频流图像,这里,亮度方面发生了变化。
具体实施方式
在视频内容索引处理中存在两个阶段:归档和检索。当归档处理期间,在视频解析处理中分析视频的内容,并创建一个可视索引。在视频解析处理时,进行自动的重要场景检测、均匀亮度变化检测和关键帧选择。重要场景检测是一种识别场景变化的处理,也就是,“切换”(视频切换检测或分段检测)和识别静态场景(静态场景检测)。对于每个检测到的场景,提取出称为关键帧的一个特定的代表性帧。所以,正确识别场景变化的发生十分重要,否则,对于单个的场景会选择出过多的关键帧,或者对于多个的场景变化未选择出足够的关键帧。均匀亮度检测是对两帧之间亮度方面识别出变化的一种处理,将在下面进一步详细地叙述。(用一种信源磁带作为参考显然是明晰的,但信源视频也可以来自一个文件、磁盘、DVD、其它存储装置,或者直接来自传输的信号源(例如,在记录一个家庭录像时))。
图1中示明的一种视频归档处理应用于先前记录了信源视频图像的信源磁带上,它可以包括有音频和/或文本,不过,对先前存储了可视信息诸如一个MPEG文件的其它存储部件,也可实施类似的处理。此种处理中,是基于信源视频创建一个可视索引。在信源磁带上用户对于记录所作的第二处理,是想创建一个与记录同时完成的可视索引。
图1示明一个用于视频磁带的第一种处理(用于先前已记录了节目的信源磁带)的一个例子。步骤101中,当需要时可通过一个诸如是VCR(盒式磁带录像机)的重放/记录装置,将信源视频盒带倒带。步骤102中,重放信源视频盒带。自信源视频盒带给出的信号由电视机、VCR或其它处理装置接收。步骤103中,由该处理装置中的一个媒体处理器或者一个外部处理器接收此视频信号,并将视频信号格式化成代表像素数据的各帧(帧采集)。
步骤104中,一个主处理器将每帧分离成各个像块,使像块和它们相关的数据实现变换,产生出DCT(离散余弦变换)系数;实施重要场景检测,亮度均匀变化检测,以及关键帧选择;将关键帧作为一个数据结构建立和存储入存储器、磁盘或其它存储媒体内。步骤105中,将信源磁带倒带至它的始端,并在步骤106中,将信源磁带设置为记录信息。步骤107中,自存储器来的数据结构转换成信源磁带,产生出可视索引。然后,将磁带倒带,观看可视索引。(不采用磁带时,也可以应用任何其它媒体,或是索引可以在服务器上存储和/或产生。)
当用户希望在记录的同时于磁带上创建可视索引时,上面的处理稍为有改变。不用步骤101和102而取代以图1中所示的步骤112,然后象视频(影片等)记录那样实现步骤103中的帧采集。
步骤103和104更具体地示明于图2A和图2B中。视频信号以模拟形式(连续数据)或数字形式(离散数据)存在。本例子运行于数字领域,因而应用数字形式进行处理。信源视频或视频信号是一连串各别的图像或视频帧,以足够高的速率显示(本例子中为每秒30帧),因而显示的图像序列呈现为一个连续的图像流。这些视频帧可以是不压缩的(NTSC或原始视频)数据,或者是诸如MPEG、MPEG2、MPEG4、M-JPEG(运动JPEG)或其它之类格式的压缩数据。
不压缩视频中的信息首先在媒体处理器202中分段成各帧,它应用了诸如出现在Intel Smart Video Recorder III中的一种帧采集技术204。虽然,有其它的帧尺寸可以应用,但图3上所示的本例子中,帧302表示一个电视、视频或其它可视图像,包括有352×240个像素。
帧302其每一个在主处理器210(图2A)中分割成诸像块304,在本例子中为8×8像素的像块304。应用这些像块304和通行的广播标准GCIR-601,由宏块产生器(图2A)产生出各个亮度块,并对彩色信息进行亚取样而产生出各个色度块。由亮度块和色度块组成宏块308。本例子中,采用了4:2:0的格式,尽管如此,本技术领域内的熟练人员可以方便地应用其它格式,诸如是4:1:1或4:2:0。在4:2:0中,一个宏块308包含6个像块,即4个亮度像块Y1、Y2、Y3和Y4,以及两个色度像块Cr和Cb,一个宏块内的每个像块由8×8像素组成。
应用一种压缩标准,诸如M-JPEG(JPEG,联合摄影专家组)标准和MPEG(运动图像专家组)标准,视频信号也可以表示一种压缩的图像。如果视频信号是一个MPEG信号或者其它压缩的信号,则如图2B中所示,该MPEG信号由帧解析器205应用一种帧或比特流解析技术将MPEG信号分割成各帧。然后,将各帧传送至媒体处理器203中的熵解码器214上,并传送至表格说明符216上。熵解码器214应用表格说明符216中的数据,利用例如是霍夫曼解码或者另外的解码技术将MPEG信号解码。
解码的信号随后供给一个去量化器218,它应用表格说明符216来的数据使解码的信号去量化。虽然,图2B中所示的工作发生于媒体处理器203内,但取决于所用的装置,这些步骤(步骤214-218)或是可以发生在媒体处理器203、主处理器211中,或是甚至可以发生在另一个外部装置中。
另一种情况,如果一个系统具有编码能力(例如,在媒体处理器中编码),它容许访问不同的处理级,则DCT系数可以直接传输至主处理器上。在所有这些方法中,处理是能实时地实现的。
图1的步骤104中,由主处理器210实施重要场景检测、关键帧选择,以及建立和存储数据结构至一个索引存储器中,该存储器诸如是一个硬盘、文件、磁带、DVD或其它存储媒体,而主处理器例如可以是一个IntelPentiumTM芯片或者其它处理器或多处理器,可以是一个PhilipsTrimediaTM芯片或者其它多媒体处理器,可以是一台计算机、一台增强型VCR、记录/重放装置,或是电视机或任何其它处理器。
重要场景检测/亮度均匀变化检测:对于自动重要场景检测,当一个视频的场景已变化或者发生了一个静态场景时,本发明将努力予以检测。一个场景可以代表一个或多个有关的图像。在重要场景检测中,将两个接连的帧进行比较,如果判定为两帧间有显著不同,则确定出这两帧之间发生了场景变化;而如果判定为它们明显地相似,则实施处理以确定,是否发生了一种静态场景。在均匀亮度变化检测中,如果检测到一个场景变化,则将两帧的亮度值进行比较,如果亮度的均匀变化即属两帧之间的主要变化,则可以判定,在这两帧之间并没有发生场景变化。
图2A示明一个主处理器210的例子,它带有亮度变化检测器240。DCT像块由宏块产生器206和DCT变换器220提供出。图2B示明一个主处理器211的例子,它带有重要场景检测器230和亮度变化检测器240。DCT像块由去量化器218提供出。重要场景处理器230检测两帧之间的场景变化,然后由亮度变化检测器240判定,事实上是否发生了场景变化,或者两帧之间的差别是否是由于亮度均匀变化的结果。如果选择出一个发生了场景变化的关键帧,并提供给帧存储器234,于是供给至索引存储器260中。如果检测出亮度上有均匀变化,则从这个相同的场景中不选择出另一个关键帧。
本发明要解决的问题在于,将两帧进行比较,检测出两帧之间重大的差别。有着许多原因会使这种重大差别的产生可能不是场景变化造成的。例如,视频信号可以是一种新闻广播节目,视频记录者在录制记者招待会的节目带。这种记者招待会上,许多照相机在闪光,它使得两帧之间的亮度发生变化。本发明检测到亮度的均匀变化后将它作为相同场景的图像来对待,而不是检知为一种场景变化并选择出另一个关键帧。类似地,如果房间中的灯光打开,或是迪斯科舞厅中灯光闪烁,不应检测成一种场景变化,因为两帧之间的差别仅仅是亮度的均匀变化。
本方法和装置应用了DCT(离散余弦变换)系数的比较来检测亮度的均匀变化,但是,其它方法也可以采用。首先,在主处理器210中各别地处理每个接收到的帧302,产生出8×8数值的系数块440。主处理器210应用离散余弦变换器220处理其中包含有空间信息的每个8×8系数块440,提取出DCT系数并建立起宏块308。
当接收的视频信号是MPEG之类压缩的视频格式时,DCT系数可以在去量化之后提取出,不需要由离散余弦变换器进行处理。另外,如前面所述,取决于使用的装置,DCT系数可以自动提取得到。
DCT变换器对每个像块440(图4)也即Y1、Y2、Y3、Y4、Cr和Cb提供出DCT系数值。按照此标准,每个系数块的左上角包含直流信息(DC值),其余的DCT系数包含了交流信息(AC值)。如图4中部分地所示,从DC值右边起的“Z”字形顺序中AC值序号按空间频率而增加,其次到达DC值正下方的DCT系数。图4中的各个Y值是各个亮度值。
在接着的方法中,进行的处理限于对两帧内相应块之间各DC值的变化予以检测,以更快地产生出结果,并且这种有限的处理在效率上并无重大损失;然而,很明显,本技术领域内的熟练人员也可以对相应之宏块间亮度上的差别进行比较,或是采用任何其它方法来检测亮度变化。
按照本发明优选实施例的方法和装置,通过比较两帧的相关像块之DC值来判定,亮度是否发生了实质上均匀的变化。
假定,n是一帧内像块的数目。又假定,F1为第一帧,F2为第二帧,F1[i]是第一帧内的第i像块,F2[i]是第二帧内的第i像块。再假定,diffmin首先设定至某个高值上,诸如1,000,000,diffmax首先设定至某个低值上,诸如-9,000,000,然后,作出如下的比较:
For i=0 to n
               Diff=ABS(F1[i]-F2[i])
               If diff<diffmin then diffmin=diff;
               If diff>diffmax then diffmax=diff;
               i=i+1
end
If(diffmax-diffmin)<阈值,则无场景变化发生。
上面的计算法是计算两个直流系数之间差值的绝对值,一个直流系数是第一帧内每个像块的直流系数,另一个是第二帧内其相关像块的直流系数。然后,将此差值与diffmin和diffmax进行比较,以寻找出两帧之间相应直流系数间的最小差值和最大差值。如果最大差值(diffmax)与最小差值(diffmin)之间的差值小于某一个阈值,则所有DC值已经改变了大约相同的量值,它指明亮度有变化。本发明的一个优选实施例中,阈值在任何地方选择为最后的diffmax值的0至10%之间,但依赖于应用情况而此阈值可变动。
如果判定,在两帧之间发生了亮度均匀变化,则对两个帧序列不选择出一个关键帧。应当指出,可以应用检测亮度变化的其它方法,诸如应用直方图法和小波变换法等,本发明不限制于上面说明的实施例。亮度变化之比率与色度变化之比率间的比较可应用来确定亮度变化,或者任何其它的公式可应用来确定亮度变化。
图6A至图6D示明检测场景变化的两种方案,两帧之间的差别只是亮度有变化。图6A是照相机闪光时的一个图像例子。图6B示明在照相机闪光后的该同一图像。类似地,图6C中示明在灯光关掉时迪斯科舞厅的场景,图6D中示明在灯光打开时的该同一场景。
本发明的说明中应用了DCT系数,但人们可以用其它代表性的值来取代,诸如小波系数、直方图等,或是运算于图像子区域上的一个函数,它对该子区域可给出一个代表性的值。此外,本发明以一种视频索引系统为基准作出了说明,然而,总体上它属于检测两帧之间的亮度均匀变化,所以它也可以用作一种搜索装置来检测各场景哪儿有照相机闪光,或是另一种情况下它用作一种归档方法来采集有代表性的各帧。
虽然,结合优选实施例已经说明了本发明,但应理解到,本技术领域内的熟练人员显然可以在上面勾画出的原理内作出修改,因此,本发明不限制于优选实施例,而预定包罗及此类的修改。

Claims (12)

1.一种视频索引系统,用于检测场景变化,并对每个场景选择出关键帧,该系统包括:
a)场景变化检测器(230),检测在两个视频帧之间的场景变化;以及
b)用于在两帧之间检测亮度均匀变化的检测系统,所述检测系统含有:
i)一个接收机(210,202),接收信源视频,而信源视频中具有由亮度值构成的各帧;以及
ii)一个比较器(230,240),将第一帧内的亮度值与第二帧内各自的亮度值进行比较,和检测第一帧中的所有亮度值是否与第二帧中的所有亮度值显著地变化了实际上相同的量值;
一检测到场景变化所述检测系统就能接收两个视频帧,并能判定两帧之间的差别是否实际上只是亮度均匀变化。
2.权利要求1的系统,其中,亮度值转换成离散余弦变换系数的形式。
3.权利要求1的系统,其中,亮度值转换成小波系数的形式。
4.权利要求1的系统,其中,亮度值转换成直方图值的形式。
5.权利要求1的系统,其中所述比较器(230,240),进一步计算出第一帧和第二帧中所有对应的亮度值之间的一个最大差值,以及第一帧和第二帧中所有对应的亮度值之间的一个最小差值,然后,能将最大差值与最小差值之间的差值的绝对值与一个阈值进行比较,以判定是否已经发生了亮度均匀变化。
6.权利要求5的系统,其中,所述阈值在0至所述最大差值的10%的范围内。
7.一种用于鉴别场景变化检测的错误认定的方法,包括:
接收至少两个视频帧,每帧具有各个亮度值,这两帧已被检知为从第一帧到第二帧发生了场景变化;
将第一帧内各个亮度值与第二帧内相应的亮度值进行比较;以及
计算第一帧内的所有亮度值是否与第二帧中的所有亮度值显著地变化了实际上相同的量值,如果如此,则判定在这两帧之间发生了错误认定的场景变化。
8.权利要求7的方法,其中,亮度值转换成离散余弦变换系数形式。
9.权利要求7的方法,其中,亮度值转换成小波系数形式。
10.权利要求7的方法,其中,亮度值转换成直方图值形式。
11.权利要求7的方法,还包括如下步骤:
计算出第一帧和第二帧中所有对应的亮度值之间的最大差值,以及第一帧和第二帧中所有对应的亮度值之间的最小差值;
然后将最大差值与最小差值之间的差值的绝对值与一个阈值进行比较,以判定是否发生了亮度均匀变化。
12.权利要求11的方法,其中,所述阈值为0至所述最大差值的10%。
CNB008070067A 1999-12-30 2000-12-15 画面切换检测中减少错误认定的方法和装置 Expired - Fee Related CN1252982C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US47708599A 1999-12-30 1999-12-30
US09/477085 1999-12-30

Publications (2)

Publication Number Publication Date
CN1349711A CN1349711A (zh) 2002-05-15
CN1252982C true CN1252982C (zh) 2006-04-19

Family

ID=23894478

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008070067A Expired - Fee Related CN1252982C (zh) 1999-12-30 2000-12-15 画面切换检测中减少错误认定的方法和装置

Country Status (4)

Country Link
EP (1) EP1180307A2 (zh)
JP (1) JP2003519971A (zh)
CN (1) CN1252982C (zh)
WO (1) WO2001050737A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6766098B1 (en) 1999-12-30 2004-07-20 Koninklijke Philip Electronics N.V. Method and apparatus for detecting fast motion scenes
US7333712B2 (en) 2002-02-14 2008-02-19 Koninklijke Philips Electronics N.V. Visual summary for scanning forwards and backwards in video content
EP1668903A4 (en) 2003-09-12 2011-01-05 Nielsen Media Res Inc DEVICES AND METHOD FOR DIGITAL VIDEO SIGNATURES FOR USE WITH VIDEO PROGRAM IDENTIFICATION SYSTEMS
US9316841B2 (en) 2004-03-12 2016-04-19 Koninklijke Philips N.V. Multiview display device
KR100825737B1 (ko) * 2005-10-11 2008-04-29 한국전자통신연구원 스케일러블 비디오 코딩 방법 및 그 코딩 방법을 이용하는코덱
CN100428801C (zh) * 2005-11-18 2008-10-22 清华大学 一种视频场景切换检测方法
CN102724385B (zh) * 2012-06-21 2016-05-11 浙江宇视科技有限公司 一种视频智能分析方法及装置
CN108769458A (zh) * 2018-05-08 2018-11-06 东北师范大学 一种深度视频场景分析方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2231746B (en) * 1989-04-27 1993-07-07 Sony Corp Motion dependent video signal processing
US5969755A (en) * 1996-02-05 1999-10-19 Texas Instruments Incorporated Motion based event detection system and method
US5767922A (en) * 1996-04-05 1998-06-16 Cornell Research Foundation, Inc. Apparatus and process for detecting scene breaks in a sequence of video frames
US5920360A (en) * 1996-06-07 1999-07-06 Electronic Data Systems Corporation Method and system for detecting fade transitions in a video signal
US6137544A (en) * 1997-06-02 2000-10-24 Philips Electronics North America Corporation Significant scene detection and frame filtering for a visual indexing system

Also Published As

Publication number Publication date
CN1349711A (zh) 2002-05-15
EP1180307A2 (en) 2002-02-20
WO2001050737A2 (en) 2001-07-12
JP2003519971A (ja) 2003-06-24
WO2001050737A3 (en) 2001-11-15

Similar Documents

Publication Publication Date Title
JP4749518B2 (ja) 可視索引付けシステム
JP4256940B2 (ja) 可視索引付けシステムのための重要情景検出及びフレームフィルタリング
US6496228B1 (en) Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds
US6697523B1 (en) Method for summarizing a video using motion and color descriptors
JP4667697B2 (ja) 速い動きのシーンを検出する方法及び装置
Kobla et al. Detection of slow-motion replay sequences for identifying sports videos
US20080267290A1 (en) Coding Method Applied to Multimedia Data
AU2007231756B2 (en) A method of segmenting videos into a hierachy of segments
EP1319230A1 (en) An apparatus for reproducing an information signal stored on a storage medium
JP2004520760A (ja) 動き記述子を用いてビデオを要約化する方法
WO1998052356A1 (en) Methods and architecture for indexing and editing compressed video over the world wide web
Faernando et al. Scene change detection algorithms for content-based video indexing and retrieval
CN1237793C (zh) 用于对运动图像数据的进行编码的方法
Nakajima A video browsing using fast scene cut detection for an efficient networked video database access
CN1252982C (zh) 画面切换检测中减少错误认定的方法和装置
Lie et al. News video summarization based on spatial and motion feature analysis
JP2002064823A (ja) 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee