CN108288060A - 一种视频中的标题检测方法、装置及电子设备 - Google Patents

一种视频中的标题检测方法、装置及电子设备 Download PDF

Info

Publication number
CN108288060A
CN108288060A CN201810155543.9A CN201810155543A CN108288060A CN 108288060 A CN108288060 A CN 108288060A CN 201810155543 A CN201810155543 A CN 201810155543A CN 108288060 A CN108288060 A CN 108288060A
Authority
CN
China
Prior art keywords
video frame
pixel
area
frame
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810155543.9A
Other languages
English (en)
Other versions
CN108288060B (zh
Inventor
李冠楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810155543.9A priority Critical patent/CN108288060B/zh
Publication of CN108288060A publication Critical patent/CN108288060A/zh
Application granted granted Critical
Publication of CN108288060B publication Critical patent/CN108288060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种视频中的标题检测方法、装置及电子设备,方法包括:判断预设数量个连续视频帧的第一区域是否存在同一标题;如果存在,获得第二区域各像素在连续视频帧的每一视频帧中的像素值;利用各个像素值,从第二区域各像素中确定各个候选像素;确定像素总数以及结束视频帧;如果像素总数不小于预设阈值,则从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,第一视频帧为:在起始视频帧至结束视频帧范围内的视频帧。应用本发明实施例提供的技术方案进行标题检测时,实现了检测视频帧中未处于边缘框内的标题。

Description

一种视频中的标题检测方法、装置及电子设备
技术领域
本发明涉及图像识别技术领域,特别是涉及一种视频中的标题检测方法、装置及电子设备。
背景技术
为了便于人们对视频内容的理解,属于同一视频内容的视频帧通常带有同一标题,标题可以用于概括视频的主要内容,并且标题一般位于视频帧中的固定区域,标题的字体颜色通常也是固定的。
现有的视频中标题检测方法主要是:利用边缘检测技术检测视频帧中的预设矩形区域是否存在边缘直线,如果不存在,则判定该视频帧不存在标题;如果存在,则判定该视频帧存在标题,获得边缘直线,并根据边缘直线确定边缘框,从边缘框中提取字符区域;进而利用字符识别技术,识别字符区域中的字符,完成对视频中标题的检测。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:视频中的标题检测方法依赖于边缘检测技术,只能检测出边缘框内的标题,如果标题未处于边缘框内,则无法利用边缘检测技术检测出标题。
发明内容
本发明实施例的目的在于提供一种视频中的标题检测方法,以实现检测视频帧中未处于边缘框内的标题。具体技术方案如下:
第一方面,本发明实施例提供了一种视频中的标题检测方法,所述方法包括:
判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
判断所述像素总数是否小于预设阈值;
如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
可选的,如果判定所述像素总数不小于所述预设阈值,所述方法还包括:
识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
可选的,所述利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,包括:
针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
可选的,所述基于预设的标题跟踪算法,确定像素总数以及结束视频帧,包括:
将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;
判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;
如果不存在,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。
可选的,如果判定所述第二视频帧和所述连续视频帧的第一区域存在同一标题,所述方法还包括:
判断当前候选像素的总数是否为零;
如果当前候选像素的总数为零,则获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,如果当前候选像素的总数不为零,所述方法还包括:
计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;
判断未被删除的当前候选像素的总数是否为零;
如果是,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;
如果否,则将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,在将所述各个候选像素作为各个当前候选像素的之后/之前,所述方法还包括:
将所述预设数量作为当前跟踪成功视频帧总数;
在所述计算每一当前候选像素的邻帧像素差的步骤之前,所述方法还包括:
判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;
如果小于,则执行计算每一当前候选像素的邻帧像素差的步骤,且在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤之前,所述方法还包括:
将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
可选的,如果所述当前跟踪成功视频帧总数不小于预设视频帧总数,所述方法还包括:
获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
第二方面,本发明实施例提供了一种视频中的标题检测装置,所述装置包括:
第一判断模块,用于判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
第一获得模块,用于在所述第一判断模块的判断结果为是时,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
确定模块,用于基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
第二判断模块,用于判断所述像素总数是否小于预设阈值;
第一识别模块,用于在所述第二判断模块的判断结果为否时,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
可选的,所述装置还包括:
第二识别模块,用于在所述第二判断模块的判断结果为否时,识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
可选的,所述第一获得模块利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,具体为:
针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
可选的,所述确定模块,包括:
第一确定子模块,用于将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;
第一判断子模块,用于判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;
第二确定子模块,用于在所述第一判断子模块的判断结果为否时,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。
可选的,所述确定模块还包括:
第二判断子模块,用于在所述第一判断子模块的判断结果为是时,判断当前候选像素的总数是否为零;
返回子模块,用于在所述第二判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,所述确定模块还包括:
计算子模块,用于在所述第二判断子模块的判断结果为否时,计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;
第三判断子模块,用于判断未被删除的当前候选像素的总数是否为零;
第一获得子模块,用于在所述第三判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;
第二获得子模块,用于在所述第三判断子模块的判断结果为否时,将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,所述装置还包括:
第二获得模块,用于在将所述各个候选像素作为各个当前候选像素的之后/之前,将所述预设数量作为当前跟踪成功视频帧总数;
第三判断模块,用于在所述计算每一当前候选像素的邻帧像素差之前,判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;
计算模块,用于在所述第三判断模块的判断结果为是时,执行计算每一当前候选像素的邻帧像素差的步骤,
第三获得模块,用于在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题之前,将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
可选的,所述装置还包括:
第四获得模块,用于在所述第三判断模块的判断结果为否时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的视频中的标题检测方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的视频中的标题检测方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频中的标题检测方法。
应用本发明实施例提供的技术方案进行标题检测时,电子设备判断预设数量个连续视频帧的第一区域是否存在同一标题;如果存在,获得第二区域各像素在连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从第二区域各像素中确定各个候选像素;基于预设的标题跟踪算法,确定像素总数以及结束视频帧;判断像素总数是否小于预设阈值;如果不小于,从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题。
利用本发明实施例提供的技术方案,当所确定的像素总数不小于预设阈值时,可以认为所有第一视频帧中第二区域存在标题,进而,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,实现了检测视频帧中未处于边缘框内的标题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为现有技术中带有标题的一种视频帧示意图;
图2为现有技术中带有标题的另一种视频帧示意图;
图3为本发明实施例提供的视频中的标题检测方法的一种流程示意图;
图4为本发明实施例提供的视频中的标题检测方法的另一种流程示意图;
图5为本发明实施例提供的视频中的标题检测装置的一种结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了解决现有技术中无法检测出视频帧中未处于边缘框内的标题的问题,本发明实施例公开了一种视频中的标题检测方法、装置及电子设备。
具体的,本发明实施例提供的一种视频中的标题检测方法可以应用于电子设备,应用场景可以为:
电子设备判断预设数量个连续视频帧的第一区域是否存在同一标题;如果存在,获得第二区域各像素在连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从第二区域各像素中确定各个候选像素;基于预设的标题跟踪算法,确定像素总数以及结束视频帧;判断像素总数是否小于预设阈值;如果不小于,从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,
利用本发明实施例提供的技术方案,当所确定的像素总数不小于预设阈值时,可以认为所有第一视频帧中第二区域存在标题,进而,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,实现了检测视频帧中未处于边缘框内的标题。
为了便于对本申请的理解,下面对视频帧中可能存在标题的区域进行分析。
当视频帧中的某个预设区域可以用于加入边缘框和标题时,可以称该区域为:视频帧中预设的包含边缘框的矩形区域,也就是第一区域,或者,也可以称该区域为单一背景区域,故,可以认为第一区域的标题是处于边缘框内的标题,边缘框通常为具有单一颜色的矩形框;
当视频帧中的某个预设区域可以用于加入标题,且不用于加入边缘框时,可以称该区域为:视频帧中预设的不包含边缘框的矩形区域,也就是第二区域,或者,也可以称该区域为自然背景区域,故,可以认为第二区域的标题是未处于边缘框内的标题。
通过分析视频帧可知,第一区域的标题可以单独存在,如图1所示的视频帧中只存在第一区域的标题(“戴剑勇:多措并举开展扶贫工作”),而第二区域的标题一般不会单独存在,通常与第一区域的标题同时存在,如图2所示的视频帧中同时存在第一区域的标题(“《网络安全法》6月1日实施加强个人信息保护”)和第二区域的标题(“全省网络安全领导干部培训班开班”)。
在第一区域和第二区域均存在标题时,可以称第二区域的标题为主标题,第一区域的标题为副标题。另外,视频中的第一区域和第二区域的位置通常固定,一般出现在视频帧的下方,且标题的颜色和字体样式也基本固定。
下面对本发明实施例提供的一种视频中的标题检测方法进行介绍。
需要说明的是,本发明实施例所提供的视频中的标题检测方法可以应用于电子设备,其中,在具体应用中,该电子设备可以为服务器、移动终端等等。另外,实现本发明实施例所提供的视频中的标题检测方法的功能软件可以为专门的标题检测软件,也可以为现有标题检测软件或其他具有标题检测功能的软件中的插件。
参见图3,图3为本发明实施例提供的一种视频中的标题检测方法的流程示意图,方法可以包括:
S101、判断预设数量个连续视频帧的第一区域是否存在同一标题;如果存在,则执行S102。
其中,第一区域为:视频帧中预设的包含边缘框的矩形区域。
预设数量可以根据用户需求事先设定,本发明实施例对预设数量的具体数值不做限定,例如,可以为:20、30、40、50等等。
本发明实施例对判断预设数量个连续视频帧的第一区域是否存在同一标题的方式不做限定,在一种实现方式中,可以包括以下步骤:
步骤A1、检测起始视频帧是否存在边缘直线;如果存在,执行步骤A2。
可以采用边缘检测算法,检测起始视频帧是否存在边缘直线,起始视频帧为:连续视频帧中帧号最小的视频帧。
本发明实施例对具体采用的边缘检测算法不做限定,例如边缘检测算法可以为,索贝尔(Sobel)边缘检测算法、拉普拉斯(Laplace)边缘检测算法、Canny边缘检测算法等中的一种或组合。
步骤A2、获得起始视频帧中第一区域各像素的像素值,作为第一区域各像素的第一像素值;针对每一第四视频帧,获得该第四视频帧中第一区域各像素的像素值,作为第一区域各像素的第二像素值,判断第一区域各像素的第一像素值与第二像素值之差的绝对值的平均值是否在预设误差范围内,如果是,判定该第四视频帧与起始视频帧的第一区域存在同一标题,如果否,判定该第四视频帧与起始视频帧的第一区域不存在同一标题;
其中,每一第四视频帧为:连续视频帧中除起始视频帧以外的每一视频帧;
预设误差范围可以根据用户需求事先设定,例如,可以为[0-2]、[0-3]、[0-5]等等。
像素值可以采用不同的表示形式,本发明实施例对像素值所采用的表示形式不做限定。例如,可以采用以下色彩模式中的一种进行表示:RGB色彩模式、YUV色彩模式、HSB色彩模式等。
理论上,一个像素值可以包括多个分量,例如,像素值采用RGB色彩模式,像素值包括R(红)、G(绿)、B(蓝)三个分量,因此,两个像素值的差值也可以包括多个分量,在这种情况下,可以通过以下方式判断各像素的第一像素值与第二像素值之差的绝对值的平均值是否在预设误差范围内:
方式一:预设误差范围可以只包括一个范围,当平均值中每个分量均在预设误差范围内时,可以认为平均值在预设误差范围内,否则,可以认为平均值不在预设误差范围内。
方式二:预设误差范围可以包括多个误差范围分量,一个误差范围分量对应平均值的一个分量,当平均值的每个分量均属于其对应的误差范围分量时,可以认为平均值在预设误差范围内,否则,可以认为平均值超过预设误差范围。
例如,像素值采用RGB色彩模式,预设误差范围为:{[0-2],[0-3],[0-5]},各像素的第一像素值与第二像素值之差的绝对值的平均值为:(0,0,1),由于平均值的每个分量均属于其对应的误差范围分量,故可以认为各像素的第一像素值与第二像素值之差的绝对值的平均值在预设误差范围内。
在具体实现过程中,还可以采用其他合理方式判断各像素的第一像素值与第二像素值之差的绝对值的平均值是否在预设误差范围内,本发明实施例对此不做限定。
针对每一第四视频帧,如果第一区域各像素的第一像素值与第二像素值之差的绝对值的平均值在预设误差范围内,则可以判定该第四视频帧与起始视频帧的第一区域存在同一标题,否则,可以判定该第四视频帧与起始视频帧的第一区域不存在同一标题。
示例性的,像素值采用RGB色彩模式,预设误差范围为:[0-2],起始视频帧为a,第四视频帧包括:b、c,第一区域各像素包括:s1、s2,s1在a、b、c中的像素值分别为:{(1,1,1)、(1,1,2)、(1,1,1)},s2在a、b、c中的像素值分别为:{(10,1,10)、(1,1,2)、(11,1,11)},对于视频帧b而言,第一区域各像素的第一像素值与第二像素值之差的绝对值,分别为:(0,0,1)、(9、0、8),第一区域各像素的第一像素值与第二像素值之差的绝对值的平均值为:(4.5,0,4.5);对于视频帧c而言,第一区域各像素的第一像素值与第二像素值之差的绝对值,分别为:(0,0,0)、(1,0,1),第一区域各像素的第一像素值与第二像素值之差的绝对值的平均值为:(0.5,0,0.5)则可以判定视频帧b与起始视频帧的第一区域不存在同一标题,视频帧c与起始视频帧的第一区域存在同一标题。
步骤A3、获得各个判断结果,当各个判断结果均为是时,判定预设数量个连续视频帧的第一区域存在同一标题,否则,判定预设数量个连续视频帧的第一区域不存在同一标题。
判断结果为是,也就是:判定该第四视频帧与起始视频帧的第一区域存在同一标题,判断结果为否,也就是:判定该第四视频帧与起始视频帧的第一区域不存在同一标题,
示例性的,起始视频帧为a,第四视频帧包括:b、c,如果判断结果分别为:b与a的第一区域存在同一标题、c与a的第一区域存在同一标题,则可以判定预设数量个连续视频帧的第一区域存在同一标题。
另外,在一种实现方式中,也可以当采用以下方式判断连续视频帧的第一区域是否存在同一标题:判断连续视频帧中两个当前相邻视频帧的第一区域是否存在同一标题,如果存在,则获取另两个相邻视频帧作为两个当前相邻视频帧,返回执行判断连续视频帧中两个当前相邻视频帧的第一区域是否存在同一标题,直至判定连续视频帧中每两个相邻视频帧的第一区域均存在同一标题,则判定连续视频帧的第一区域存在同一标题;如果不存在,则判定连续视频帧的第一区域不存在同一标题。
例如,连续视频帧包括:a、b、c、d和e,如果判定两个相邻视频帧b和a的第一区域均存在同一标题,则继续判断c和b的第一区域存在同一标题,若c和b的第一区域不存在同一标题,则判定连续视频帧的第一区域不存在同一标题,若a和b、b和c、c和d以及d和e的第一区域均存在同一标题,则判定连续视频帧的第一区域存在同一标题。
在另一种实现方式中,还可以采用其他合理方式判断连续视频帧的第一区域是否存在同一标题,例如,可以在检测到起始视频帧存在边缘直线后,针对第一区域每一像素,利用该像素在连续视频帧的每一视频帧中的像素值,计算该像素的均方差像素值;当第一区域每一像素的均方差像素值小于预设值时,判定连续视频帧的第一区域存在同一标题;否则,判定连续视频帧的第一区域不存在同一标题。
具体的,可以利用以下公式计算第一区域中每一像素的均方差像素值。
其中,Bm表示第一区域中第m个像素的均方差像素值,N表示像素值的数目,也就是连续视频帧的数目,μm表示第一区域中第m个像素的平均像素值,mi表示第一区域中第m个像素在连续视频帧的第i个视频帧中的像素值。
预设值可以根据用户需求事先设定,对于均方差像素值包括多个分量的情况,预设值可以采用单一数值的形式,也可以采用多分量的形式,本发明实施例对此不做限定。进而,可以通过以下方式判断像素的均方差像素值是否小于预设值:
若预设值采用单一数值的形式,当均方差像素值的每个分量均小于预设值时,可以认为均方差像素值小于预设值,否则,可以认为均方差像素值不小于预设值;也可以计算均方差像素值分量的平均值,当均方差像素值分量的平均值小于预设值时,可以认为均方差像素值小于预设值;否则,可以认为均方差像素值不小于预设值;
若预设值采用多分量的形式,预设值的一个分量对应均方差像素值的一个分量,当均方差像素值的每个分量均小于其对应的预设值分量时,可以认为均方差像素值小于预设值,否则,可以认为均方差像素值不小于预设值。
S102、获得第二区域各像素在连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从第二区域各像素中确定各个候选像素;
其中,第二区域为:视频帧中预设的不包含边缘框的矩形区域,候选像素为:待选的属于第二区域中标题字符区域的像素;
可以理解的是,第二区域的所有像素中有一部分是属于第二区域中标题字符区域的像素,为了便于描述,可以将属于第二区域中标题字符区域的像素简称为标题像素,为了从第二区域的所有像素中选取出标题像素,可以先从第二区域的所有像素中确定候选像素,进而,可以从候选像素中获取标题像素。
为了提高候选像素的可靠性,在一种实现方式中,利用所获得的各个像素值,从第二区域各像素中确定各个候选像素,可以包括以下步骤:
步骤B1、针对第二区域的每一像素,利用所获得的该像素在连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
示例性的,连续视频帧包括a、b、c,第二区域的像素p在视频帧a、b和c中的像素值分别为:p1、p2、p3,则可以利用p1、p2、p3计算出像素p的平均像素值和均方差像素值分别为:
步骤B2、获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
预设像素值范围和第二区域的位置可以根据标题信息事先设定,具体可以为:事先获取一些历史视频帧,检测所获取的历史视频帧中第二区域的标题信息,包括:标题所处的位置、字体颜色,进而,可以统计检测结果,并利用统计结果推导出第二区域中标题的常处位置以及常用字体颜色,并可以将常用字体颜色对应的像素值范围作为预设像素值范围,将包围常处位置的矩形区域,作为第二区域。
判断平均像素值是否属于预设像素值范围的方式与判断各像素的第一像素值与第二像素值之差的绝对值的平均值是否在预设误差范围内的方式可以相同,在此不再赘述。
预设均方差值可以根据用户需求事先设定,本发明实施例对预设均方差值的具体数值、具体表现形式不做限定。另外,判断均方差像素值是否小于预设均方差值的方式与上述判断均方差像素值是否小于预设值的方式可以相同,在此不再赘述。
示例性的,第二区域中像素p的平均像素值和均方差像素值可以分别为:和varp,预设像素值范围和预设均方差值可以分别为和α,当varp<α,且 时,可以将像素p作为候选像素。
应用本发明实施例,由于平均像素值可以反映像素值的一般取值情况,均方差像素值可以反映像素值的稳定性,故将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素作为候选像素,提高了候选像素的可靠性。
S103、基于预设的标题跟踪算法,确定像素总数以及结束视频帧,
其中,像素总数为:从各个候选像素中确定的属于第二区域中标题字符区域的总数,结束视频帧为:满足标题跟踪算法中结束条件的视频帧;
标题跟踪算法可以用于进行标题跟踪,以确定像素总数和结束视频帧,具体的标题跟踪算法可以根据设计人员需求设计。
为了便于简化标题跟踪算法的实现过程,在一种实现方式中,结束条件可以为:自起始视频帧至结束视频帧间的每一视频帧的第一区域均存在同一标题,且结束视频帧的下一视频帧与结束视频帧的第一区域不存在同一标题,基于此,确定像素总数以及结束视频帧,可以包括步骤C1-步骤C3:
步骤C1、将各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,
其中,跟踪成功视频帧为:连续视频帧中帧号最大的视频帧;
步骤C2、判断第二视频帧和连续视频帧的第一区域是否存在同一标题;如果不存在,执行步骤C3;
本发明实施例对判断第二视频帧和连续视频帧的第一区域是否存在同一标题的具体方式不做限定,
例如,该判断方式可以为:从连续视频帧中确定待比对视频帧,判断第二视频帧和待比对视频帧的第一区域是否存在同一标题,如果是,判定第二视频帧和连续视频帧的第一区域存在同一标题,否则,判定第二视频帧和连续视频帧的第一区域不存在同一标题;待比对视频帧可以为:连续视频帧中任一视频帧;
该判断方式还可以为:直接判断第二视频帧和起始视频帧的第一区域是否存在同一标题,如果是,判定第二视频帧和连续视频帧的第一区域存在同一标题,否则,判定第二视频帧和连续视频帧的第一区域不存在同一标题。
步骤C3、将第二视频帧的上一视频帧作为结束视频帧,将当前候选像素的总数作为像素总数。
应用本发明实施例,如果跟踪成功视频帧的下一视频帧和连续视频帧的第一区域不存在同一标题,则可以将第二视频帧的前一视频帧,也就是跟踪成功视频帧作为结束视频帧,将当前候选像素的总数,也就是候选像素的总数作为像素总数,简化了标题跟踪算法的实现过程。
在另一种实现方式中,结束条件还可以为:在起始视频帧至结束视频帧范围内的每一视频帧的第一区域均存在同一标题,且结束视频帧的下一视频帧与结束视频帧的第一区域不存在同一标题,且结束视频帧与起始视频帧的帧号之差小于预设帧差值,基于此结束条件也可以参照前述标题跟踪算法的实现过程,设计相应的标题跟踪算法,在此不再详述。预设帧差值可以根据用户需求事先设定,本发明实施例对此不做限定,例如,可以为:500、600、700等等。
另外,在利用步骤C2判定第二视频帧和连续视频帧的第一区域存在同一标题之后,在跟踪成功视频帧的下一视频帧和连续视频帧的第一区域存在同一标题的情况下,为了能够确定像素总数和结束视频帧,方法还可以包括:
步骤C4、判断当前候选像素的总数是否为零;如果为零,执行步骤C5;
具体的,可以用候选像素列表存储当前候选像素,当候选像素列表为空时,可以判定当前候选像素的总数为零,否则,可以判定当前候选像素的总数不为零。
步骤C5、获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤。
可以理解的是,在判定当前候选像素的总数为零后,则可以确定像素总数为零,并且在判定第二视频帧和连续视频帧的第一区域不存在同一标题后,可以将第二视频帧的前一视频帧作为结束视频帧,故在跟踪成功视频帧的下一视频帧和连续视频帧的第一区域存在同一标题的情况下,实现了确定像素总数和结束视频帧。
在当前候选像素的总数不为零的情况下,为了能够确定像素总数和结束视频帧,在利用步骤C4判定当前候选像素的总数不为零之后,方法还可以包括:
步骤D1、计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;
其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在第二视频帧与第三视频帧的像素值之差的绝对值,第三视频帧为:第二视频帧的上一视频帧;
预设像素差阈值可以根据用户需求事先设计,本发明实施例对此不做限定。
邻帧像素差可以包括多个分量,预设像素差阈值也可以包括多个分量,且邻帧像素差所包含的每个分量可以分别对应一个预设像素差阈值分量,当邻帧像素差的每个分量均小于其对应的预设邻帧像素差分量时,可以认为该均邻帧像素差小于预设像素差阈值,否则,可以认为该均邻帧像素差大于预设像素差阈值。
示例性的,候选像素列表ListN用于存储当前候选像素,ListN中包括当前候选像素p,且p在第f和第f-1视频帧中的像素值分别为:预设像素差阈值为:(δr,δg,δb)则当前候选像素p的邻帧像素差为: 如果则可以认为当前候选像素p为非标题像素,进而,可以将p从ListN中删除,否则,可以认为当前候选像素p为标题像素,进而,可以将p保留在ListN中。
步骤D2、判断未被删除的当前候选像素的总数是否为零;如果是,执行步骤D3;如果否,执行步骤D4;
步骤D3、获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤;
步骤D4、将各个未被删除的当前候选像素作为各个当前候选像素,获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤。
应用本发明实施,在当前候选像素的总数不为零的情况下,实现了确定像素总数和结束视频帧。
为了减少计算邻帧像素差的次数,提高执行效率,在另一种实现方式中,在将各个候选像素作为各个当前候选像素的之后/之前,方法还可以包括:
将预设数量作为当前跟踪成功视频帧总数;
进一步的,在计算每一当前候选像素的邻帧像素差的步骤之前,方法还可以包括:
判断当前跟踪成功视频帧总数是否小于预设视频帧总数;
如果小于,则执行计算每一当前候选像素的邻帧像素差的步骤,且在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤之前,方法还可以包括:
将当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
预设视频帧总数可以事先设定,本发明实施例对预设视频帧总数的具体数值不做限定,例如,可以为200、300、400等等。
应用本发明实施例,可以只在当前跟踪成功视频帧总数小于预设视频帧总数的情况下,执行计算每一当前候选像素的邻帧像素差的步骤,因此,可以减少计算邻帧像素差的次数,提高执行效率。
为了进一步提高执行效率,在另一种实现方式中,如果当前跟踪成功视频帧总数不小于预设视频帧总数,方法还可以包括:
获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤。
应用本发明实施例,在判定当前跟踪成功视频帧总数不小于预设视频帧总数后,可以直接获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行判断第二视频帧和连续视频帧的第一区域是否存在同一标题的步骤,简化了执行过程,提高了执行效率。
S104、判断像素总数是否小于预设阈值;如果不小于,则执行S105。
预设阈值可以根据用户经验事先设定,例如,可以为:10、20、30等等。
S105、从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,
其中,每一第一视频帧为:在起始视频帧至结束视频帧范围内的视频帧;起始视频帧为:连续视频帧中帧号最小的视频帧。
待识别视频帧可以为:在起始视频帧至结束视频帧范围内的一个或多个视频帧。
可以理解的是,像素总数达到预设阈值时,可以认为属于第二区域中标题字符区域的像素能够形成字符,因此,在像素总数不小于预设阈值的情况下,可以认为第二区域存在标题,进而可以识别第二区域的字符,作为所有第一视频帧的主标题。
利用本发明实施例提供的技术方案,实现了检测视频帧中未处于边缘框内的标题。
在判定像素总数不小于预设阈值的情况下,为了识别视频帧中的所有标题,在一种实施方式中,方法还可以包括:
识别待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
由于连续视频帧的第一区域存在同一标题,可以认为所有第一视频帧的第一区域均存在标题,故可以识别待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题,实现了识别视频帧中的所有标题。
另外,应用本发明实施例,在连续视频帧的第一区域存在同一标题且像素总数小于预设阈值时,可以认为属于第二区域中标题字符区域的像素无法形成字符,因此,可以认为第二区域不存在标题,只有第一区域存在标题,故可以识别第一区域的字符,作为所有第一视频帧的标题,以实现检测视频帧中的所有标题。
下面通过一个具体实例来对本发明实施例进行简单介绍。
将本发明实施例提供的图像显示方法应用于某个电子设备,该电子设备执行视频中的标题检测的流程图如图4所示,具体可以如下:
S201,在预设数量个连续视频帧的第一区域存在同一标题的情况下,获得第二区域各像素在连续视频帧的每一视频帧中的像素值;
S202,计算第二区域每一像素的平均像素值和均方差像素值;并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素;
S203,将各个候选像素作为各个当前候选像素;将预设数量作为当前跟踪成功视频帧总数;将跟踪成功视频帧的下一视频帧作为第二视频帧;
S204,判断第二视频帧和连续视频帧的第一区域是否存在同一标题;如果不存在,执行步骤S205;如果存在,执行步骤S206;
S205,将第二视频帧的上一视频帧作为结束视频帧,将当前候选像素的总数作为像素总数;
S206,判断是否当前候选像素的总数不为零且当前跟踪成功视频帧总数小于预设视频帧总数;如果当前候选像素的总数不为零且当前跟踪成功视频帧总数小于预设视频帧总数,执行S207,否则,执行S208;
S207,计算每一当前候选像素的邻帧像素差,删除邻帧像素差大于预设像素差阈值的当前候选像素,当未被删除的当前候选像素的总数为零时,执行S208;当未被删除的当前候选像素的总数不为零时,将各个未被删除的当前候选像素作为各个当前候选像素,将当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数,执行S208;
S208,获得第二视频帧的下一视频帧,并将下一视频帧作为第二视频帧,返回执行S204;
S209,若像素总数不小于预设阈值,则从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第一区域和第二区域的字符,分别作为所有第一视频帧的副标题和主标题。
应用本发明实施例提供的技术方案,当像素总数不小于预设阈值时,可以认为第一视频帧中第二区域存在标题,进而,可以识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,实现了检测视频帧中未处于边缘框内的标题,并且由于连续视频帧的第一区域存在同一标题,可以认为所有第一视频帧的第一区域均存在标题,故可以识别待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题,实现了检测视频帧中的所有标题,进一步的,提高了候选像素的可靠性和执行效率。
与上述的视频中的标题检测方法实施例相对应,本发明实施例还提供一种视频中的标题检测装置。
参见图5,图5为本发明实施例提供的一种视频中的标题检测装置的结构示意图,装置包括:
第一判断模块501,用于判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
第一获得模块502,用于在所述第一判断模块的判断结果为是时,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
确定模块503,用于基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
第二判断模块504,用于判断所述像素总数是否小于预设阈值;
第一识别模块505,用于在所述第二判断模块的判断结果为否时,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
利用本发明实施例提供的技术方案,当所确定的像素总数不小于预设阈值时,可以认为所有第一视频帧中第二区域存在标题,进而,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,实现了检测视频帧中未处于边缘框内的标题。
可选的,所述装置还包括:
第二识别模块,用于在所述第二判断模块的判断结果为否时,识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
可选的,所述第一获得模块502利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,具体为:
针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
可选的,所述确定模块503,包括:
第一确定子模块,用于将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;
第一判断子模块,用于判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;
第二确定子模块,用于在所述第一判断子模块的判断结果为否时,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。
可选的,所述确定模块503还包括:
第二判断子模块,用于在所述第一判断子模块的判断结果为是时,判断当前候选像素的总数是否为零;
返回子模块,用于在所述第二判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,所述确定模块503还包括:
计算子模块,用于在所述第二判断子模块的判断结果为否时,计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;
第三判断子模块,用于判断未被删除的当前候选像素的总数是否为零;
第一获得子模块,用于在所述第三判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;
第二获得子模块,用于在所述第三判断子模块的判断结果为否时,将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
可选的,所述装置还包括:
第二获得模块,用于在将所述各个候选像素作为各个当前候选像素的之后/之前,将所述预设数量作为当前跟踪成功视频帧总数;
第三判断模块,用于在所述计算每一当前候选像素的邻帧像素差之前,判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;
计算模块,用于在所述第三判断模块的判断结果为是时,执行计算每一当前候选像素的邻帧像素差的步骤,
第三获得模块,用于在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题之前,将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
可选的,所述装置还包括:
第四获得模块,用于在所述第三判断模块的判断结果为否时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现本发明实施例所提供的视频中的标题检测方法,具体的,该视频中的标题检测方法包括如下步骤:
判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
判断所述像素总数是否小于预设阈值;
如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
利用本发明实施例提供的技术方案,当所确定的像素总数不小于预设阈值时,可以认为所有第一视频帧中第二区域存在标题,进而,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,实现了检测视频帧中未处于边缘框内的标题。
需要说明的是,处理器执行存储器上存放的程序而实现的视频中的标题检测方法的其他实施例,与前述方法部分提及的视频中的标题检测方法的实施例相同,在此不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral PomponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Ne twork Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Applica tion SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频中的标题检测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频中的标题检测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、包含指令的计算机程序产品实施例实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (17)

1.一种视频中的标题检测方法,其特征在于,所述方法包括:
判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
判断所述像素总数是否小于预设阈值;
如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
2.根据权利要求1所述的方法,其特征在于,如果判定所述像素总数不小于所述预设阈值,所述方法还包括:
识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
3.根据权利要求1所述的方法,其特征在于,所述利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,包括:
针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
4.根据权利要求1所述的方法,其特征在于,所述基于预设的标题跟踪算法,确定像素总数以及结束视频帧,包括:
将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;
判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;
如果不存在,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。
5.根据权利要求4所述的方法,其特征在于,如果判定所述第二视频帧和所述连续视频帧的第一区域存在同一标题,所述方法还包括:
判断当前候选像素的总数是否为零;
如果当前候选像素的总数为零,则获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
6.根据权利要求5所述的方法,其特征在于,如果当前候选像素的总数不为零,所述方法还包括:
计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;
判断未被删除的当前候选像素的总数是否为零;
如果是,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;
如果否,则将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
7.根据权利要求6所述的方法,其特征在于,
在将所述各个候选像素作为各个当前候选像素的之后/之前,所述方法还包括:
将所述预设数量作为当前跟踪成功视频帧总数;
在所述计算每一当前候选像素的邻帧像素差的步骤之前,所述方法还包括:
判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;
如果小于,则执行计算每一当前候选像素的邻帧像素差的步骤,且在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤之前,所述方法还包括:
将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
8.根据权利要求7所述的方法,其特征在于,如果所述当前跟踪成功视频帧总数不小于预设视频帧总数,所述方法还包括:
获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
9.一种视频中的标题检测装置,其特征在于,所述装置包括:
第一判断模块,用于判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;
第一获得模块,用于在所述第一判断模块的判断结果为是时,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;
确定模块,用于基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;
第二判断模块,用于判断所述像素总数是否小于预设阈值;
第一识别模块,用于在所述第二判断模块的判断结果为否时,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二识别模块,用于在所述第二判断模块的判断结果为否时,识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。
11.根据权利要求9所述的装置,其特征在于,所述第一获得模块利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,具体为:
针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;
获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。
12.根据权利要求9所述的装置,其特征在于,所述确定模块,包括:
第一确定子模块,用于将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;
第一判断子模块,用于判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;
第二确定子模块,用于在所述第一判断子模块的判断结果为否时,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。
13.根据权利要求12所述的装置,其特征在于,所述确定模块还包括:
第二判断子模块,用于在所述第一判断子模块的判断结果为是时,判断当前候选像素的总数是否为零;
返回子模块,用于在所述第二判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
14.根据权利要求13所述的装置,其特征在于,所述确定模块还包括:
计算子模块,用于在所述第二判断子模块的判断结果为否时,计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;
第三判断子模块,用于判断未被删除的当前候选像素的总数是否为零;
第一获得子模块,用于在所述第三判断子模块的判断结果为是时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;
第二获得子模块,用于在所述第三判断子模块的判断结果为否时,将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:
第二获得模块,用于在将所述各个候选像素作为各个当前候选像素的之后/之前,将所述预设数量作为当前跟踪成功视频帧总数;
第三判断模块,用于在所述计算每一当前候选像素的邻帧像素差之前,判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;
计算模块,用于在所述第三判断模块的判断结果为是时,执行计算每一当前候选像素的邻帧像素差的步骤,
第三获得模块,用于在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题之前,将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
第四获得模块,用于在所述第三判断模块的判断结果为否时,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题。
17.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
CN201810155543.9A 2018-02-23 2018-02-23 一种视频中的标题检测方法、装置及电子设备 Active CN108288060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810155543.9A CN108288060B (zh) 2018-02-23 2018-02-23 一种视频中的标题检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810155543.9A CN108288060B (zh) 2018-02-23 2018-02-23 一种视频中的标题检测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108288060A true CN108288060A (zh) 2018-07-17
CN108288060B CN108288060B (zh) 2022-06-03

Family

ID=62833099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810155543.9A Active CN108288060B (zh) 2018-02-23 2018-02-23 一种视频中的标题检测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108288060B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818984A (zh) * 2021-01-27 2021-05-18 北京奇艺世纪科技有限公司 标题生成方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100277586A1 (en) * 2009-01-05 2010-11-04 Vimicro Corporation Method and apparatus for updating background
CN105357517A (zh) * 2015-11-16 2016-02-24 华为技术有限公司 屏幕的图像检测方法和装置
CN107222746A (zh) * 2017-04-24 2017-09-29 北京拓尔思信息技术股份有限公司 视频关键位置定位方法及装置
CN107590447A (zh) * 2017-08-29 2018-01-16 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100277586A1 (en) * 2009-01-05 2010-11-04 Vimicro Corporation Method and apparatus for updating background
CN105357517A (zh) * 2015-11-16 2016-02-24 华为技术有限公司 屏幕的图像检测方法和装置
CN107222746A (zh) * 2017-04-24 2017-09-29 北京拓尔思信息技术股份有限公司 视频关键位置定位方法及装置
CN107590447A (zh) * 2017-08-29 2018-01-16 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818984A (zh) * 2021-01-27 2021-05-18 北京奇艺世纪科技有限公司 标题生成方法、装置、电子设备和存储介质
CN112818984B (zh) * 2021-01-27 2023-10-24 北京奇艺世纪科技有限公司 标题生成方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN108288060B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN109308463B (zh) 一种视频目标识别方法、装置及设备
US10223818B2 (en) Detecting and describing visible features on a visualization
WO2020140698A1 (zh) 表格数据的获取方法、装置和服务器
US9311533B2 (en) Device and method for detecting the presence of a logo in a picture
CN111124888B (zh) 录制脚本的生成方法和装置及电子装置
CN112560862B (zh) 文本识别方法、装置及电子设备
CN108769776B (zh) 标题字幕检测方法、装置及电子设备
WO2021082922A1 (zh) 一种检测屏幕显示断线的方法及设备
CN113010896B (zh) 确定异常对象的方法、装置、设备、介质和程序产品
WO2021088422A1 (zh) 应用消息的通知方法及装置
CN102567952B (zh) 一种图像分割方法及系统
CN108615030A (zh) 一种标题一致性检测方法、装置及电子设备
CN111310759B (zh) 双模式协作的目标检测抑制优化方法及设备
CN107809762B (zh) 利用大数据与设备指纹的养卡识别的安全风险控制方法
CN108769634A (zh) 一种图像处理方法、图像处理装置及终端设备
Heng et al. An object-based shot boundary detection using edge tracing and tracking
CN112215271A (zh) 一种基于多头注意力机制的抗遮挡目标检测方法及设备
CN109598723B (zh) 一种图像噪声检测方法及装置
CN109447022A (zh) 一种镜头类型识别方法及装置
CN109657148B (zh) 针对上报poi的异常操作识别方法、装置、服务器和介质
CN108288060A (zh) 一种视频中的标题检测方法、装置及电子设备
US9922263B2 (en) System and method for detection and segmentation of touching characters for OCR
CN107194944B (zh) 林火图像分割方法及装置
CN110796129A (zh) 一种文本行区域检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant