CN1220370C - 在视频信号中检测字幕的方法和装置 - Google Patents

在视频信号中检测字幕的方法和装置 Download PDF

Info

Publication number
CN1220370C
CN1220370C CNB028016521A CN02801652A CN1220370C CN 1220370 C CN1220370 C CN 1220370C CN B028016521 A CNB028016521 A CN B028016521A CN 02801652 A CN02801652 A CN 02801652A CN 1220370 C CN1220370 C CN 1220370C
Authority
CN
China
Prior art keywords
complexity
image region
captions
image
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028016521A
Other languages
English (en)
Other versions
CN1462546A (zh
Inventor
J·A·D·内斯瓦巴
W·H·A·布鲁尔斯
G·J·M·维尔沃特
B·H·彭兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1462546A publication Critical patent/CN1462546A/zh
Application granted granted Critical
Publication of CN1220370C publication Critical patent/CN1220370C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

披露了用于在视频信号中检测字幕存在、出现或消失的方法和装置(300)。使用这些方法和装置能够获得很高的可靠性,由于大多数计算都由MPEG的编码器(101-113)或解码器电路完成,所以使用这些方法和装置对处理能力要求很低。如果存在字幕显示的图象区域的复杂度明显超出至少一个其它图象区域的复杂度,就检测到了字幕。代表复杂度特性的例子是:(i)在MPEG片段中位费用(b)和量化比例(qs)的乘积,(ii)频谱离散余弦变换DCT系数(c)的重心的位置,(iii)字幕图象区域的有小运动向量(mv)的宏块的数目,以及非字幕图象区域的有大运动向量的宏块的数目,或(iv)在不同图形区域中场景改变不是同时检测的。该装置能够用于检测商业广告中断或密钥帧的生成。

Description

在视频信号中检测字幕的方法和装置
发明领域
本发明与在视频信号中检测字幕的方法和装置有关。
发明背景
在国际专利申请WO-A95/01051中公开了一种已知的在视频信号中检测字幕的方法。在这个现有技术方法中,对每电视线中信号电平转换的次数进行计数。检测是基于这样的认识,即:字幕通常是在暗背景上的亮字符。
发明概述
本发明的目的是提供另外一种检测字幕的方法和装置。
为此,根据本发明的方法将每帧分成字幕可能重现的第一图象区和至少一个与该区域不一致的第二图象区,并计算第一和第二两个图象区的复杂度。如果第一个图象区的复杂度与第二图象区的复杂度相比,超出了事先设定的比例,就产生一个输出信号。
本方法和装置的实施例的优点在于可以使用现有运动图象专家组(MPEG)的编码器和/或解码器的电路。实际上由于大部分计算已经由视频信号编码器或解码器完成,检测字幕对处理能力要求不高。
一个实施例是基于将MPEG帧分解为多个帧,每个帧被编码为很多位和一个量化比例。第一图象区域和第二图象区域的复杂度可以通过对组成相应图象区域的帧的位的数目和量化比例的乘积求和来计算。
另一个实施例是基于将图象信号变换成频谱的直流和交流系数。第一和第二图象区域的复杂度通过频谱系数的重心来表示。
另外一个实施例是基于将MPEG帧分解为多个块,每一块都带有运动向量。第一图象区域的复杂度是由运动向量小于预先设定的第一门槛值的块数表示,第二个图象区域的复杂度是由运动向量大于预先设定的第二门槛值的块数表示。
在另一个实施例中,搜索相似预报块的MPEG解码器的运动估计电路被用于检测场景的改变。此处第一和第二图象区域的复杂度由相应图象区域是否出现场景改变来表示,如果在第一图象区域检测到场景的改变,而第二图象区域没有检测到屏幕的改变,就产生一个输出信号。注意,在本实施例中,输出信号表示字幕的出现和消失而不是字幕的存在。
检测字幕在多种视频信号处理中都是有用的。
可以对字幕运用OCR算法,以提供一个电子版的文本。电子文本可以单独存储并随后用于例如索引存在一个数据库中的视频场景。其典型应用是在视频记录器中基于口语关键词检索视频场景。
另一个应用是生成密钥帧,用于视频资料的检索或编辑。密钥帧是屏幕变化后的多个帧中的第一帧。本发明使得可以选择字幕帧作为密钥帧。
字幕检测还有助于在电视节目中检测商业广告插播。因为商业广告很少有字幕,在有字幕影片放映过程中,如果字幕消失了一定的时间,就表示中间插入了商业广告。
附图简述
图1简单示出包括依据本发明的字幕检测器的MPEG编码器。
图2简单示出包括依据本发明的字幕检测器的MPEG解码器。
图3示出将显示屏幕分割为第一和第二区域。
图4是由图1和图2所示字幕检测器的第一实施例执行的操作步骤流程图。
图5是由图1和图2所示字幕检测器的第二实施例执行的操作步骤流程图。
图6示出用于说明图5所示实施例的时序图。
图7是由图1和图2所示字幕检测器的第三实施例执行的操作步骤流程图。
图8A和8B表示了说明图7所示实施例操作的曲线图。
图9是由图1和图2所示字幕检测器的第四实施例执行的操作步骤流程图。
实施例描述
图1简单示出包括依据本发明的字幕检测装置的MPEG编码器。MPEG编码器本身是已知的,包括用于将每个输入图象分解为多个块的电路101,从每个图象块中减去预定块的减法器102,将每块8×8图象象素变换为8×8频谱系数的离散余弦变换电路103,量化器104,可变长度编码器105,缓冲器106,比特率控制电路107,逆向量化器108,逆向离散余弦变换电路109,加法器110,帧存储器111,运动估计电路112,和运动补偿器113。MPEG编码器的操作对于视频压缩领域的技术人员而言是熟知的,所以这里不做详细介绍。在J.L.Mitchel等人的著作《MPEG Video Compression Standard》(MPEG视频压缩标准)中能够找到对MPEG的详尽的描述,该书由KluwerAcademic Publishers出版,书号为ISBN 0-412-08771-5。
图1中参考数字300表示字幕检测器。下面描述其各种实施例。字幕检测器接收由MPEG编码器产生的输入信号。根据该实施例,实际信号(或信号集)被送给字幕探测器。图1中用圆圈内的信号名字示出了5个输入信号:
b表示用于编码不包括附加位的图象片段的位数,
qs表示一个图象片段的量化比例,
c表示一个宏块的变换系数(直流和交流),
mv表示一个宏块的运动向量,
mad表示输入图象块和由运动估计形成的预测块之间的平均绝对差异
图2示出了一个MPEG解码器,包括可变长度解码器201,片段处理器202,宏块处理器203,逆向量化器204,逆向离散余弦变换器205,加法器206,帧存贮器207,和运动补偿器208。与编码器一样,这里对MPEG解码器不做详细的描述。参考数300还是表示字幕检测器,字幕检测器从MPEG解码器的各个部分接收输入信号。图2中信号b、mv、qs和c与图1中的含义相同。
下面对字幕检测器300的操作进行描述。如图3所示,字幕检测器将显示屏幕分割成通常有字幕显示的第一图象区域31,和另一个第二图象区域32。下面分别称第一图象区域31和图象区域32为字幕区域和非字幕区。字幕检测算法是基于无字幕出现的第二图象区域的复杂度和有字幕显示的第一图象区域复杂度之间的显著差异。
图4是字幕检测器300的第一实施例执行的操作步骤流程图。在该实施例中,复杂度是通过用于对相应图象区域进行编码的位的数目b和量化比例qs的乘积来表示。对于字幕区域,复杂度C1为:
式中S1表示形成字幕区域的片段集合。对于无字幕区域,复杂度C2为:
C 2 = Σ s 2 bxqs
式中S2表示形成无字幕区域的片段集合。为了考虑两个区域的差异,通过用区域覆盖的宏块的数目来除复杂度C1和C2来对它们归一化。在41步计算复杂度C1和C2
在42步计算当前帧m的比例Rm=C2/C1。当字幕出现在帧中时,Rm低。如果无字幕出现,两个区域的复杂度是可比较和匹配的。字幕的结构(通常是被细黑线包围的白字),和其在原来帧中是被覆盖的另外的事实,导致了字幕区复杂度数值的显著上升。因此,比率Rm将下降。比率越低,字幕越大越复杂。
通过对已有字幕材料的两个小时的检验,表明一条字幕在影片中存在的最短周期是两秒。检测器将在上述时间内部为每I帧计算比率Rm
在接下来的步骤43中,比率Rm被加在一起求和。在步骤44中,∑Rm与门槛值Thr比较。如果∑Rm低于门槛值Thr,就说明字幕存在,在步骤45中产生合适的输出信号。门槛值Thr是通过检验带字幕的影片而凭经验选定的。
图5是字幕检测器300的第二个实施例执行的操作步骤流程图。在该实施例中,复杂度是由相应图象区域31和32中屏幕改变的发生表示的。为此,字符检测器从MPEG编码器接收当前宏块的绝对失真平均值(mad)。绝对失真平均值MAD是编码器用于在帧存贮器111(见图1)中进行定位与当前输入块最相似的图象块的判据,并选择所述块作为预测编码的预测块。在第一步51中,字幕检测器300计算实际帧字幕区域的绝对失真平均值之和∑MAD1以及非字幕区域的绝对失真平均值之和∑MAD2。在步骤52中,字幕检测器为在第一给定时间窗t1内的所有帧(I,P和B)计算平均值AvMAD1和AvMAD2,不包括较小的时间窗t2内的帧(见图6)。在步骤53中,对实际帧的和∑MAD1与时间窗内帧的平均值AvMAD1相比较。如果∑MAD1比平均值AvMAD1大得多,和∑MAD1就是一个局部峰值。在这种情况下,就检测到字幕区域的场景改变。与此类似,在步骤54中,和∑MAD1与平均值AvMAD2相比较。如果∑MAD2比平均值AvMAD2大得多,和∑MAD2就是一个局部峰值。在这种情况下,就检测到非字幕区域的场景改变。如果在字幕区域而不是在非字幕区域检测到屏幕得改变,实际帧就会作为字幕出现或消失而被索引。然后在步骤55中产生一个输出信号。
图7是字幕检测器300的第三个实施例执行的操作步骤流程图。在该实施例中,复杂度由编码器产生的或解码器接收的离散余弦变换DCT系数c的重心表示。在步骤71中,计算组成字幕区域的各个块的离散余弦变换DCT系数c1(0)...c1(63)的棒状图。由于这种计算只对I帧做,很方便。在步骤72中,计算组成非字幕区域的各个块的离散余弦变换DCT系数c2(0)...c2(63)的同样的棒状图。在步骤73中,计算相应重心n1和n2。重心是离散余弦变换DCT系数的索引n,因此:
Σ i = 0 n C ( i ) = Σ i = n + 1 63 C ( i
这在图8A和8B中说明,其中,图8A是典型的无字幕图象区域的棒图。图8B是典型的有字幕图象区域的棒图。上述情况是由于字幕通常是白色带小黑框,所以包含字幕的块含有大量的高交流系数。
在步骤74中,比较重心n1和n2。如果重心n1比重心n2对应于高得多的空间频率,则实际的I帧就被检测为一个带字幕的帧。在这种情况下,在步骤75中产生输出信号。
图9是字幕检测器300的第三个实施例执行的操作步骤流程图。在该实施例中,复杂度从编码器产生或解码器接收的运动向量mv中获得。在步骤91中,检测形成字幕区域的宏块间运动向量mv1是否小于给定值M1。如果小于,在步骤92中计数器n1增加。在步骤93中,检测形成非字幕区域的宏块间的运动向量mv2是否大于给定值M2。如果大于,在步骤94中计数器n2增加。
在步骤95中,检测器检测字幕区域小运动向量的平均值n1/N1是否超过了非字幕区域的大运动向量的平均值n2/N2。这里N1和N2分别是字幕区域和非字幕区域宏块的总数。如果上述检测肯定,则字幕存在,在步骤96中会产生适当的输出信号。本实施例利用了这样一个观点,即:字幕是静态的所以字幕区域的运动向量一般较小。这一点在图10中说明,图中98和99分别表示带大运动向量的宏块和带小运动向量(近似为0)的宏块。
字幕也可以通过这样来检测,判断图象的每个(8×8)块是否象一个文本块,然后将字幕作为一个包含大量毗邻的文本块的区域来识别出来。一个可能的文本块检测算法包括计算一个给定交流系数的绝对值的和,将所说的绝对值的和与设定值Thr比较判断。
TB ( x , y ) = 1 if Σ i , j ∈ I , J | A C x , y ( i , j ) | > Thr 0 if Σ i , j ∈ I , J | A C x , y ( i , j ) | ≤ Thr
其中,x,y表示块在一个图象中的位置,i,j表示交流系数在块中的位置,I,J表示考虑了文本检测的系数的位置(例如,一个Z字形扫描的前9个交流系数)。
这样获得的文本块检测值TB(x,y)一起形成包含1的矩阵,用于可能的文本块,和包含0的矩阵,用于不是文本块。文本块矩阵一般在字幕区域包括了大量的1。该矩阵也包括由于明显的亮度边缘而在图象中其它位置形成的隔离文本块和由于错误检测或在字幕的单词之间的空格形成的字幕区域隔离非文本块。于是对于文本块检测结果进行滤波。第一滤波器用于去除隔离文本块。第二滤波器用于关闭文本块之间的间隙。去除-关闭-去除-关闭(两个反复操作)序列操作就足够了。更多的反复不会对结果产生明显的改善。滤波器的大小可能根据图象提供者的字体进行调整,也可以根据不同国家或不同的广播电台进行调整。
考虑已知的几何特性如纵横比(字幕通常水平延伸)和位置(屏幕的1/3以下),可以进一步改善使用文本块矩阵定位字幕的效果。使用这种后处理算法,时间特性(在一定时间段内,字幕是静止的)也可以考虑进来。
以上公开了用于在视频信号中检测字幕存在、出现或消失的一种方法和装置(300)。由于大多数计算已经由MPEG编码器或解码器(101-113)中的电路完成,因此可以获得很高的可靠性和需要很少的处理能力。如果字幕显示的图象区域的复杂度大大超过了至少一个其它图象区域的复杂度,字幕就检测到了。表示复杂度的属性的例子是:(i)MPEG片段中位费用(b)与量化器比例的乘积,(ii)频谱离散余弦变换系数的重心位置,(iii)字幕图象区域有小运动向量(mv)的宏块的数目,与之对比,非字幕区域有大运动向量的数目,或(iv)在不同图象区域中,场景改变不是同时检测到的这样一个事实。
该装置能够用于商业广告中断检测或密钥帧的生成。

Claims (6)

1.一种在视频信号中检测字幕的方法,该方法包括如下步骤:
将每帧分解为字幕可能重现的第一图象区域和与第一图象区域不一致的至少一个第二图形区域;
计算第一和第二图象区域的复杂度;
如果第一图象区域的复杂度与第二图象区域的复杂度相比较超出了预先设定的比例,就产生一个输出信号。
2.如权利要求1所描述的方法,其中将第一和第二图象区域分解为片段,每个片段被编码为多个位和一个量化比例,通过对构成相关图象区域的片段的位数和量化比例乘积求和来计算第一和第二图象区域的复杂度。
3.如权利要求1描述的方法,其中每个图象区域中的图象数据被变换为频谱系数,该方法还包括计算相应图象区域的频谱系数重心的步骤,第一和第二图象区域的复杂度由相应的重心光谱位置表示。
4.如权利要求1描述的方法,其中第一和第二图象区域被分解为带运动向量的块,第一图象区域的复杂度可以由具有小于预定第一门槛值的运动向量的数目来表示,第二图象区域的复杂度可以由具有大于预定第二门槛值的运动向量的数目来表示。
5.如权利要求1描述的方法,还包括在第一和第二图像区域检测场景改变的步骤,其中,第一和第二图象区域的复杂度由相应图象区域的场景改变的发生来表示,如果在所述第一图象区域而非第二图象区域检测到场景改变,就产生输出信号。
6.一种用于视频信号的字幕检测器,包括:
将每帧分解为可能重现字幕的第一图象区域以及与所述第一区域不一致的至少一个第二图象区域的装置;
计算第一和第二图象区域的装置;
如果第一图象区域的复杂度与第二图象区域的复杂度相比较,超出了预先设定的比例,就产生输出信号的装置。
CNB028016521A 2001-05-15 2002-05-08 在视频信号中检测字幕的方法和装置 Expired - Fee Related CN1220370C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01201779 2001-05-15
EP01201779.4 2001-05-15

Publications (2)

Publication Number Publication Date
CN1462546A CN1462546A (zh) 2003-12-17
CN1220370C true CN1220370C (zh) 2005-09-21

Family

ID=8180301

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028016521A Expired - Fee Related CN1220370C (zh) 2001-05-15 2002-05-08 在视频信号中检测字幕的方法和装置

Country Status (8)

Country Link
US (1) US7023917B2 (zh)
EP (1) EP1393553B1 (zh)
JP (1) JP4197958B2 (zh)
KR (1) KR100865248B1 (zh)
CN (1) CN1220370C (zh)
AT (1) ATE413063T1 (zh)
DE (1) DE60229632D1 (zh)
WO (1) WO2002093910A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4630869B2 (ja) 2003-08-18 2011-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 映像要約方法
CN100484210C (zh) * 2003-11-17 2009-04-29 皇家飞利浦电子股份有限公司 视频图像处理方法
KR100626376B1 (ko) * 2004-05-27 2006-09-20 삼성전자주식회사 레터박스 검출 장치 및 방법, 그리고 이를 구비한 엠팩디코딩 장치
JP4700002B2 (ja) * 2004-08-19 2011-06-15 パイオニア株式会社 テロップ検出方法、テロップ検出プログラム、およびテロップ検出装置
TWI254879B (en) * 2004-12-17 2006-05-11 Quanta Comp Inc System and method for video encoding
CN100367777C (zh) * 2005-02-24 2008-02-06 威盛电子股份有限公司 实时侦测字幕滚动的装置及其方法
US7545978B2 (en) * 2005-07-01 2009-06-09 International Business Machines Corporation Methods and apparatus for filtering video packets for large-scale video stream monitoring
US7511257B2 (en) * 2005-08-24 2009-03-31 Aptina Imaging Corporation Method and apparatus providing and optical guide in image sensor devices
JP4814849B2 (ja) 2007-08-10 2011-11-16 富士通株式会社 フレームの特定方法
KR20100016741A (ko) * 2008-08-05 2010-02-16 삼성전자주식회사 영상처리장치 및 그 제어 방법
US8773595B2 (en) 2008-12-24 2014-07-08 Entropic Communications, Inc. Image processing
CN101835011B (zh) * 2009-03-11 2013-08-28 华为技术有限公司 字幕检测方法及装置、背景恢复方法及装置
US8260055B2 (en) * 2009-03-27 2012-09-04 The Nielsen Company (Us), Llc Methods and apparatus for identifying primary media content in a post-production media content presentation
CN101527800B (zh) * 2009-03-31 2011-01-05 西安交通大学 一种获取基于h.264/avc压缩视频字幕的方法
CN101867736B (zh) * 2009-04-17 2012-08-29 联咏科技股份有限公司 解交错装置及方法及动态字幕补偿器
JP4620163B2 (ja) * 2009-06-30 2011-01-26 株式会社東芝 静止字幕検出装置、静止字幕を含む画像を表示する映像機器、および静止字幕を含んだ画像の処理方法
JP5525201B2 (ja) * 2009-07-28 2014-06-18 パナソニック株式会社 画像合成装置、画像符号化装置、コンピュータプログラム、記録媒体
JP5377649B2 (ja) * 2009-09-02 2013-12-25 ルネサスエレクトロニクス株式会社 画像処理装置および映像再生装置
US8925024B2 (en) 2009-12-31 2014-12-30 The Nielsen Company (Us), Llc Methods and apparatus to detect commercial advertisements associated with media presentations
WO2011140718A1 (en) * 2010-05-14 2011-11-17 Mediatek Singapore Pte. Ltd. Method for eliminating subtitles of a video program, and associated video display system
KR101372639B1 (ko) 2010-05-25 2014-03-11 한국전자통신연구원 광고 영상 검출 방법 및 장치
JP5627617B2 (ja) * 2012-02-22 2014-11-19 株式会社東芝 画像処理装置及び画像表示システム
CN102595055A (zh) * 2012-02-29 2012-07-18 北京汉邦高科数字技术股份有限公司 一种在yuv图像上叠加文字的方法
US20160092747A1 (en) * 2014-09-29 2016-03-31 Qualcomm Incorporated Devices and methods for facilitating digital imagery encoding based on detection of text and computer generated graphics
CN107027067B (zh) * 2015-06-23 2020-02-07 讯飞智元信息科技有限公司 获取mv视频资源中字幕信息的方法及系统
WO2018051307A1 (en) * 2016-09-19 2018-03-22 Prockopee Holdings Pte Ltd Frameworks and methodologies configured to enable support and delivery of a multimedia messaging interface, including automated content generation and classification, content search and prioritisation, and data analytics
CN110599525A (zh) * 2019-09-30 2019-12-20 腾讯科技(深圳)有限公司 图像补偿方法和装置、存储介质及电子装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9312690D0 (en) 1993-06-18 1993-08-04 Philips Electronics Uk Ltd Television receiver
DE69519980T2 (de) * 1994-12-28 2001-06-07 Siemens Corp. Research, Inc. Verfahren und Gerät zur Detektion und Interpretation von Untertiteln in digitalen Videosignalen
MY119560A (en) * 1996-05-27 2005-06-30 Nippon Telegraph & Telephone Scheme for detecting captions in coded video data without decoding coded video data
KR100227117B1 (ko) * 1997-11-27 1999-10-15 전주범 다화면 텔레비전의 자막신호 표시제어장치
KR19990050606A (ko) * 1997-12-17 1999-07-05 전주범 다화면 텔레비전의 광고방송 검출에 따른 부화면재생방법
US6185329B1 (en) 1998-10-13 2001-02-06 Hewlett-Packard Company Automatic caption text detection and processing for digital images

Also Published As

Publication number Publication date
US7023917B2 (en) 2006-04-04
US20030021342A1 (en) 2003-01-30
WO2002093910A1 (en) 2002-11-21
ATE413063T1 (de) 2008-11-15
DE60229632D1 (de) 2008-12-11
JP4197958B2 (ja) 2008-12-17
EP1393553B1 (en) 2008-10-29
KR100865248B1 (ko) 2008-10-27
CN1462546A (zh) 2003-12-17
JP2004529578A (ja) 2004-09-24
KR20030024781A (ko) 2003-03-26
EP1393553A1 (en) 2004-03-03

Similar Documents

Publication Publication Date Title
CN1220370C (zh) 在视频信号中检测字幕的方法和装置
US6185329B1 (en) Automatic caption text detection and processing for digital images
Zhong et al. Automatic caption localization in compressed video
KR100468967B1 (ko) 썸네일 영상 생성장치 및 방법
US6636565B1 (en) Method for concealing error
US8743966B2 (en) Block error compensating apparatus of image frame and method thereof
US8004607B2 (en) Region-based cadence detector
US8098729B2 (en) Implementing B-picture scene changes
US20060222249A1 (en) Image-comparing apparatus, image-comparing method, image-retrieving apparatus and image-retrieving method
US20100303150A1 (en) System and method for cartoon compression
US9693078B2 (en) Methods and systems for detecting block errors in a video
EP1596335A2 (en) Characterisation of motion of objects in a video
US8421928B2 (en) System and method for detecting scene change
US6990146B2 (en) Method and system for detecting intra-coded pictures and for extracting intra DCT precision and macroblock-level coding parameters from uncompressed digital video
US7072399B2 (en) Motion estimation method and system for MPEG video streams
US8265138B2 (en) Image processing apparatus, method and integrated circuit used in liquid crystal display by processing block velocity of noisy blocks
JP2012244574A (ja) 映像監視装置
US6016365A (en) Decoder having adaptive function of eliminating block effect
Fernando et al. Fade-in and fade-out detection in video sequences using histograms
KR20190021993A (ko) 압축영상에 대한 신택스 기반의 이동객체 영역 추출 방법
US7593592B2 (en) Method of detecting blocking artifacts
US20070160301A1 (en) Method and apparatus for spatial compression scheme
US20070297506A1 (en) Decoder and decoding method
US20100118956A1 (en) Method and device for extracting a mean luminance variance from a sequence of video frames
US20050207670A1 (en) Method of detecting blocking artefacts

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050921

Termination date: 20120508