CN115439660A - 一种检测方法、装置、电子设备及介质 - Google Patents

一种检测方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN115439660A
CN115439660A CN202211138849.6A CN202211138849A CN115439660A CN 115439660 A CN115439660 A CN 115439660A CN 202211138849 A CN202211138849 A CN 202211138849A CN 115439660 A CN115439660 A CN 115439660A
Authority
CN
China
Prior art keywords
boundary
value
video
region
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211138849.6A
Other languages
English (en)
Inventor
张亚彬
徐靖雯
赵世杰
廖懿婷
李军林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Lemon Inc Cayman Island
Original Assignee
Douyin Vision Co Ltd
Lemon Inc Cayman Island
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, Lemon Inc Cayman Island filed Critical Douyin Vision Co Ltd
Priority to CN202211138849.6A priority Critical patent/CN115439660A/zh
Publication of CN115439660A publication Critical patent/CN115439660A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例提供了一种检测方法、装置、电子设备和介质,所述方法包括:确定视频帧在目标方向上的边界候选值;基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。该方法基于边界候选值所对应第一区域和第二区域,过滤各边界候选值,能够准确地过滤边界候选值,得到过滤后的边界候选值;同时基于过滤后的边界候选值,实现了在确定视频帧所属视频的视频类型的同时,能够对视频帧的边界目标值进行确定。

Description

一种检测方法、装置、电子设备及介质
技术领域
本公开实施例涉及视频图像技术,尤其涉及一种检测方法、装置、电子设备及介质。
背景技术
现有的短视频应用培养了竖屏视频播放的用户习惯,当源视频为横屏内容时,会通过视频编辑的方式将源视频转换为竖屏内容,与此同时,会通过补齐黑边、加字幕等方式来填充视频内容外围的区域,以使得播放的视频不失真的显示在电子设备上。一般地,上下填充部分均为工具性内容,中间部分为核心的视频内容,这种上中下层结构的视频可称为三明治视频。
为了更好地提升视频的画质和专注于视频内容本身,需要对源视频的视频类型进行检测,同时,在确定播放视频的视频类型为三明治视频后,存在分割视频内容的需求。
现有的检测方法主要通过获得一定规模的标注数据集训练分类识别的算法,区分视频类型是否为普通视频或者三明治视频。然而,上述检测方法只能区分视频类型,无法精确定位视频帧的边界。
发明内容
本公开提供一种检测方法、装置、电子设备及介质,以在确定视频帧所属视频的视频类型的同时,能够对视频帧的边界目标值进行确定。
第一方面,本公开实施例提供了一种检测方法,包括:
确定视频帧在目标方向上的边界候选值;
基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
第二方面,本公开实施例还提供了一种检测装置,包括:
第一确定模块,用于确定视频帧在目标方向上的边界候选值;
过滤模块,用于基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
第二确定模块,用于基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
第三方面,本公开实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例所述的检测方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的检测方法。
本公开实施例提供的一种检测方法、装置、电子设备和介质,所述方法包括:确定视频帧在目标方向上的边界候选值;基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。利用该技术方案,基于边界候选值所对应第一区域和第二区域,过滤各边界候选值,能够准确地过滤边界候选值,得到过滤后的边界候选值;同时基于过滤后的边界候选值,实现了在确定视频帧所属视频的视频类型的同时,能够对视频帧的边界目标值进行确定。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例所提供的一种检测方法的流程示意图;
图2为本公开实施例所提供的一种检测方法的流程示意图;
图3为本公开实施例所提供的一种检测方法的示意图;
图4为本公开实施例所提供的一种检测方法的整体流程示意图;
图5为本公开实施例所提供的一种视频帧的示意图;
图6为本公开实施例所提供的一种像素图的示意图;
图7为本公开实施例所提供的另一种像素图的示意图;
图8为本公开实施例所提供的一种占比信息的示意图;
图9为本公开实施例所提供的另一种占比信息的示意图;
图10为本公开实施例所提供的一种检测装置的结构示意图;
图11为本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
图1为本公开实施例所提供的一种检测方法的流程示意图,本公开实施例适用于对视频帧所属视频进行检测的情形,该方法可以由检测装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、PC端或服务器等。
可以认为的是,为了高清播放、UI交互等目的,现有的短视频应用培养了竖屏视频播放的用户习惯。当源视频为横屏内容时,用户会通过视频编辑的方式将其转换为竖屏内容,与此同时,会通过补齐黑边、加字幕、玻璃蒙版填充以及以图片或动图为背景的方式来填充视频内容外围的区域,以使得播放的视频不失真的显示在电子设备上。
一般地,上下填充部分均为工具性内容,中间部分为核心的视频内容,这种上中下层结构的视频可称为三明治视频。在实际视频处理的流程链路中,为了更好地提升视频的画质和专注于视频内容本身,需要区分三明治视频和普通视频,同时,在确定播放的视频为三明治视频后,存在分割视频内容的需求。目前,三明治视频内容识别分割算法可以服务于视频转码优化、服务端增强处理算法、质量评估算法(抑制非视频内容干扰)和横屏播放(伪横屏视频内容全屏播放)等不同的业务场景。
现有三明治视频的检测方法主要基于深度学习的方法,通过人工标注来区分普通视频和三明治视频,即通过获得一定规模的标注数据集训练分类识别的算法,区分视频是否为普通视频或者三明治视频。然而,上述检测方法只能区分视频类型,无法精确定位三明治视频中心动态内容的边界;并且深度学习算法为数据驱动的黑箱算法,具有不可解释性,无法进一步针对误检的视频类型分析原因以进一步调整优化。
基于此,本公开实施例提供了一种检测方法,所述方法包括:
S110、确定视频帧在目标方向上的边界候选值。
其中,视频帧可以认为是所检测的视频中的帧图像,视频帧的个数可以为一个或多个。确定视频帧的方式不限,如视频帧可通过对所检测的视频进行抽帧来得到,此处不对抽帧处理的具体过程作进一步限定,只要能得到视频帧即可。
目标方向可以为预先设定的方向,用于确定边界候选值,可选的,目标方向可以为水平方向,如屏幕坐标系中x轴所在方向;边界候选值可以表征在目标方向上初步确定的边界的位置。如在与目标方向垂直的方向上边界所处位置。
具体的,本步骤可以先对视频帧在目标方向上的边界候选值进行初步地确定,以便进行后续视频类型和视频帧的边界目标值的确定。其中,确定边界候选值的具体方法不限,如可以根据视频帧中各像素进行确定,也可以根据视频帧中内容的不同对应不同的确定方法,此处不作进一步展开。
S120、基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值。
第一区域和第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与目标方向垂直方向上的两个区域,即第一区域和第二区域可以认为是以边界候选值为边长的区域,此处不对第一区域和第二区域的尺寸和形状进行限定。
在一个实施例中,所述第一区域和所述第二区域的尺寸和形状相同,所述第一区域和所述第二区域沿所述目标方向上的边与所述视频帧沿所述目标方向上的边等长,所述第一区域和所述第二区域高度方向上的边小于所述视频帧高度方向上的边,所述高度方向为与所述目标方向垂直的方向。
其中,第一区域和第二区域的尺寸和形状可以相同,第一区域和第二区域沿目标方向上的边可以与视频帧沿目标方向上的边等长,第一区域和第二区域高度方向上的边可以小于视频帧高度方向上的边,如第一区域可为以边界候选值为下边长的矩形,第二区域可为以边界候选值为上边长的矩形,且第一区域和第二区域的高均小于视频帧的高(即在高度方向上的边)。
可以认为的是,通过上步骤得到多个边界候选值后,还需要对边界候选值进行过滤,以得到过滤后的边界候选值,如可以基于各边界候选值所对应第一区域和第二区域,来对各边界候选值进行过滤,以滤除掉干扰的边界候选值。过滤的手段不限,如可以根据边界候选值对应第一区域和第二区域的像素值的差异信息来确定是否将该边界候选值进行过滤,还可以根据边界候选值对应第一区域和第二区域的像素值的主颜色差异值来确定是否将该边界候选值进行过滤,还可以综合上述两种方法得到过滤后的边界候选值,本实施例对此不作限定。
S130、基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
视频类型可以是指视频帧所属视频的类型,如第一类型(即视频内容的显示比例与显示区域的显示比例相同,视频外围无填充区域的视频),如普通视频或第二类型(即视频内容的显示比例小于显示区域的显示比例,视频外围存在填充区域的视频),如三明治视频;边界目标值可以表征最终确定的视频内容在视频帧中的边界的位置。边界目标值可以是从边界候选值中筛选得到的。
具体的,可以基于过滤后的边界候选值,确定视频帧所属视频的视频类型和视频帧的边界目标值,如可以基于单个视频帧过滤后的边界候选值,来直接确定视频帧所属视频的视频类型和视频帧的边界目标值,单个视频帧的选取可以根据实际情况来确定;也可以综合多帧视频帧所对应的过滤后的边界候选值,对视频帧所属视频的视频类型和视频帧的边界目标值进行确定,此处不作进一步展开,只要能得到视频帧所属视频的视频类型和视频帧的边界目标值即可。
示例性的,本步骤可以基于边界候选值的数量,确定视频帧类型。如在边界候选值的数量小于设定数值(如1)时可以认为是第一类型,在边界候选值的数量大于等于设定数值时,认为是第二类型。或者,在边界候选值的数量大于等于设定数值时,结合多帧视频帧确定的过滤后的边界候选值,确定视频类型和边界目标值。
本公开实施例提供的一种检测方法,确定视频帧在目标方向上的边界候选值;基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。利用该方法,基于边界候选值所对应第一区域和第二区域,过滤各边界候选值,能够准确地过滤边界候选值,得到过滤后的边界候选值;同时基于过滤后的边界候选值,实现了在确定视频帧所属视频的视频类型的同时,能够对视频帧的边界目标值进行确定。
在一个实施例中,所述视频帧为所属视频内的多帧视频帧,所述基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
基于每帧视频帧所对应过滤后的边界候选值,确定平均候选值;
若所述平均候选值小于1,则将所属视频的视频类型确定为第一类型,所述第一类型的视频内容的显示比例与显示区域的显示比例相同;
若所述平均候选值大于或等于1,则基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
平均候选值可以认为是多帧视频帧所对应过滤后的边界候选值的数量的平均值。本实施例中,可以确定每帧视频帧所包括的边界候选值,然后将所有边界候选值的平均值确定为平均候选值。如,第一帧包括两个边界候选值,第二帧包括一个边界候选值,第三帧包括两个边界候选值,将边界候选值的和比上帧数可以得到平均候选值。
第一类型和第二类型可以认为是视频帧所属视频的类型,如第一类型可为普通视频,第二类型可为三明治视频。
在一个实施方式中,当视频帧为所属视频内的多帧视频帧时,首先可以针对每一帧视频帧,对过滤后的边界候选值进行确定,然后基于每帧视频帧所对应过滤后的边界候选值的个数,确定多帧视频帧的平均候选值,判断平均候选值的大小,并根据判断结果对所属视频的视频类型进行确定。
示例性的,当平均候选值小于1时,可以认为视频帧中的边界个数少于1,则可以认为视频帧所属视频的视频类型为第一类型,第一类型的视频内容的显示比例与显示区域的显示比例相同,即第一类型的视频内容全屏显示在电子设备的显示区域;当平均候选值大于或者等于1时,可以认为视频帧中的边界个数多于或者等于1,此时可以基于各边界候选值来对视频帧所属视频的视频类型和所述视频帧的边界目标值进行确定,确定的过程不作进一步阐述。
在一个实施例中,在基于各边界候选值确定视频类型和边界目标值时,可以确定各边界候选值的分布的集中度,以确定视频类型。若集中度大于设定阈值,则可以认为视频类型为第二类型,并基于各边界候选值进行数学运算得到边界目标值;否则确定视频类型为第一类型。
在一个实施例中,所述基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
以第二量化间隔量化各所述边界候选值;
确定第一边界所对应量化后边界候选值;
确定第二边界所对应量化后边界候选值,所述第一边界和所述第二边界间为视频内容,所述第一边界和所述第二边界分别为沿所述目标方向上的边界;
确定所述第一边界所对应量化前的第一边界候选值;
确定所述第二边界所对应量化前的第二边界候选值;
若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值,则确定所述所属视频的类型为第二类型,并将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值,所述第二类型的视频内容的显示比例小于显示区域的显示比例。
其中,第二量化间隔可以认为是预先设定的量化间隔,用于对边界候选值进行粗粒度的量化的间隔,如第二量化间隔可以为10;第一边界和第二边界可以认为是沿目标方向上视频帧的上边界和下边界,第一边界所对应量化后边界候选值即为第一边界所对应的边界候选值被量化后的值,第二边界所对应量化后边界候选值即为第二边界所对应的边界候选值被量化后的值。第一边界候选值可以认为是第一边界所对应量化前的边界候选值,第二边界候选值可以认为是第二边界所对应量化前的边界候选值。
在基于各边界候选值,确定视频帧所属视频的视频类型和视频帧的边界目标值的过程中,首先可以以第二量化间隔对各边界候选值量化;然后根据各量化后的边界候选值,确定第一边界所对应量化后边界候选值和第二边界所对应量化后边界候选值,确定的方式例如可以为从各量化后的边界候选值中依次选取出现频次最高的第一边界所对应量化后的边界候选值,和出现频次最高的第二边界所对应量化后的边界候选值。继而对第一边界所对应量化前的第一边界候选值和第二边界所对应量化前的第二边界候选值进行确定,并根据第一边界候选值的占比和第二边界候选值的占比的具体大小来判断所属视频的类型是否为第二类型,例如当第一边界候选值和第二边界候选值的占比均大于设定阈值时,可以认为第一边界候选值和第二边界候选值可能为有效的边界,所属视频的类型为第二类型,并可以将第一边界候选值的均值和第二边界候选值的均值确定为所属视频的边界目标值,第二类型的视频内容的显示比例小于显示区域的显示比例,即视频内容非全屏显示在电子设备的显示区域。当第一边界候选值和第二边界候选值的占比不存在同时大于设定阈值的情况时,可以认为第一边界候选值和第二边界候选值可能不是有效的边界,此时可以认为视频帧所属视频的类型为第一类型。
示例性的,边界候选值可以包括视频帧中所有被检测得到的边界候选值,以第二量化间隔量化各边界候选值之后,可以从各量化后的边界候选值中选取上边界对应的量化后边界候选值,即第一边界所对应量化后边界候选值,以及下边界对应的量化后边界候选值,即第二边界所对应量化后边界候选值。
例如可以首先将各量化后的边界候选值划分为第一边界可能对应的量化后边界候选值和第二边界可能对应的量化后边界候选值,如基于设定数值划分各量化后的边界候选值,设定数值可以基于显示区域在y方向上的中线确定。如显示区域在屏幕坐标系y方向的长度为600,单位可以基于实际情况确定,设定数值可以为30。各量化后的边界候选值中大于30的可以被划分为第一边界可能对应的量化后边界候选值,小于30的可以被划分为第二边界可能对应的量化后边界候选值。
以第一边界可能对应的量化后边界候选值为例。边界候选值分别为401、400、403、405,420。对各边界候选值进行量化得到的量化后的边界候选值分别为40、40、40、40和42。统计第一边界可能对应的量化后边界候选值中出现频次最高的量化后边界候选值,即40。基于确定的40反向查找量化前的边界候选值,即401、400、403和405。然后确定第一边界所对应第一边界候选值在第一边界可能对应的边界候选值中的占比,即4(对应反向查找到的401、400、403和405)比5(对应401、400、403、405,420)。
同理,第二边界执行与第一边界相同操作,若第一边界候选值的占比和第二边界候选值的占比均大于设定阈值,则可以认为视频类型为第二类型,并分别基于第一边界候选值确定视频上边界的边界目标值(即401、400、403和405的均值),基于第二边界候选值确定视频下边界的边界目标值。如将第一边界候选值的均值所表征的边界作为视频的上边界,第二边界候选值的均值所表征的边界作为视频的下边界。
在一个实施方式中,第一边界候选值的占比可以认为是第一边界候选值在若干个边界候选值中的占比,也可以认为是第一边界候选值在候选值范围内的占比,本实施例对此不作限定,候选值范围可以根据第一边界来确定,如第一边界对应的边界候选值。
在一个实施例中,所述确定视频帧在目标方向上的边界候选值,包括:
确定视频帧的像素图,所述像素图中位于目标边界上的像素和非目标边界上的像素区别显示,所述目标边界为沿目标方向上的边界;
确定所述像素图内在所述目标边界上的边界候选值。
其中,目标边界可以认为是沿目标方向上的边界,如当目标方向为水平方向时,目标边界即为沿水平方向上的边界。
在本实施例中,像素图可以用于显示视频帧中的各像素,例如像素图中位于目标边界上的像素和非目标边界上的像素可以区别显示,如位于目标边界上的像素可以以白色显示,位于非目标边界上的像素以黑色进行显示。
本实施例中,可以先对视频帧的像素图进行确定,示例性的,可以直接对视频帧中各像素进行检测来确定视频帧中位于水平边界的像素和其他位置的像素,并区别显示以得到视频帧的像素图;也可以先确定视频帧中位于水平边界的候选像素,再对候选像素进一步筛选得到视频帧中位于水平边界的像素,以此确定视频帧的像素图,本实施例对此不作限定。
然后对像素图内在目标边界上的边界候选值进行确定,具体确定的手段不作限定,如可以逐行对像素图每行中为目标边界上的像素的占比信息进行确定,然后根据各占比信息确定边界候选值,如根据各占比信息的大小对边界候选值进行确定等。
在一个实施例中,所述确定视频帧的像素图,包括:
确定视频帧的水平梯度和垂直梯度;
基于所述水平梯度和所述垂直梯度,确定目标边界上的候选像素;
过滤所述目标边界上候选像素中的干扰像素,所述干扰像素包括检测得到的像素和距离所述检测得的像素设定像素内的像素,所述干扰像素的检测阈值基于干扰物确定;
将过滤后的像素确定为目标边界上的像素;
基于所述目标边界上的像素确定所述像素图。
水平梯度可以认为是视频帧中的像素在水平方向上的梯度值,垂直梯度可以认为是视频帧中的像素在竖直方向上的梯度值;候选像素可以认为是从视频帧各像素中初步筛选出的在目标边界上的像素。
干扰像素可以是指干扰物所在的像素,即对确定目标边界上的像素具有干扰作用的像素,干扰物例如可以为文字或表情等编辑内容,干扰像素可以包括检测得到的像素和距离检测得到的像素设定像素内的像素,设定像素可以为预先设定的像素值,如设定像素可以为7;干扰像素可以通过检测算法检测得到,如可以通过Canny edge检测算法检测得到一部分像素,继而可以将检测得到的像素和距离检测得的像素设定像素内的像素认为是干扰像素,其中,检测阈值用于检测干扰像素,检测阈值的具体大小可以基于干扰物确定,此处不作限定。
具体的,可以先针对视频帧中的各像素确定像素对应的水平梯度和垂直梯度,然后基于水平梯度和垂直梯度,对目标边界上的候选像素进行确定,确定候选像素的方法可以根据像素对应的水平梯度和垂直梯度来确定,示例性的,当某像素对应的水平梯度和垂直梯度满足确定条件时,则可以将该像素认为是候选像素,相应的,当某像素对应的水平梯度和垂直梯度不满足确定条件时,则该像素不是候选像素,直至遍历完所有的像素为止,确定条件可以由经验值进行确定或者基于视频的使用场景确定,如在短视频应用程序的场景下,在对视频类型进行检测时确定条件可以为垂直梯度与水平梯度比值的arctan值为90。其中,确定像素对应的水平梯度和垂直梯度的方法不作限定,如可以根据索贝尔算子(Sobel operator,Sobel算子)确定对应的梯度矢量和法矢量,进而对像素对应的水平梯度和垂直梯度进行确定。
在确定候选像素后,可以过滤掉候选像素中的干扰像素,并将过滤后的像素确定为目标边界上的像素,最后基于目标边界上的像素确定出视频帧的像素图。
在一个实施例中,确定所述像素图内在所述目标边界上的边界候选值,包括:
沿目标方向,确定所述像素图每行中目标像素的占比信息,所述目标像素为位于目标边界上的像素;
基于所述占比信息,从所述像素图的各行中选取边界候选值。
占比信息可以认为是某行中的目标像素在该行所包含的所有像素中的比例,目标像素可以是指为位于目标边界上的像素,即占比信息可以认为是某行中为目标边界上的像素在该行所包含的所有像素中的比例。
在本步骤中,可以沿目标方向,对每行中目标像素的占比信息进行确定,如可以沿水平方向,逐行对每行的目标像素的占比信息进行确定,也可以隔行对每行的目标像素的占比信息进行确定,本实施例对此不作限定。然后根据确定的各占比信息从像素图的各行中选取边界候选值,选取边界候选值的手段不限,示例性的,可以采用非极大值抑制方法,从像素图的各行中选取边界候选值,具体选取边界候选值的过程例如可以为:依次从由像素图的上下边界向像素图中心的方向,取窗口大小为N的滑动窗口,并依次对滑动窗口中所包含行的占比信息进行判断,并将最终符合预设条件对应的边认为是边界候选值,预设条件可以由相关人员进行确定,如占比信息大于预设阈值,或者基于占比信息提取滑动窗口内的峰值边界,然后判断峰值边界对应的边界候选值是否大于设定阈值等,可选的,预设阈值可为0.2。
图2为本公开实施例所提供的一种检测方法的流程示意图。本实施例中的方案可以与上述实施例中的一个或多个可选方案组合。如图2所示,本公开实施例提供的一种检测方法,包括如下步骤:
S210、确定视频帧在目标方向上的边界候选值。
S220、在所述灰度视频帧内,针对每个边界候选值,确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息。
差异信息可以认为是边界候选值所对应第一区域和第二区域内像素值的差异情况。
可以理解的是,当视频帧为灰度视频帧时,可以对每个边界候选值所对应第一区域和第二区域内像素值的差异信息进行确定,如可以直接根据第一区域和第二区域内的像素值确定差异信息;也可以将第一区域和第二区域对应分区,根据第一区域和第二区域各分区内的像素值来确定差异信息,还可以根据第一区域和第二区域内的像素值进行不同的运算来综合确定差异信息,具体过程可以根据实际情况进行确定,此处不作进一步限定。其中,灰度视频帧可以由视频帧转换得到,例如可以对播放视频抽帧得到红绿蓝视频帧后,则可将视频帧转化为灰度视频帧。
S230、基于所述差异信息确定是否过滤所述边界候选值。
在得到每个边界候选值对应的差异信息后,可以根据差异信息的具体大小来确定是否过滤边界候选值。
在一个实施方式中,可以比较差异信息的大小与设定值得到比较结果,并根据比较结果确定是否过滤边界候选值,如当差异信息的大小小于设定值时,可以认为第一区域和第二区域的像素值差别较小,此时可以将该边界候选值过滤;当差异信息的大小大于或者等于设定值时,可以认为第一区域和第二区域的像素值差别较大,故无需将此边界候选值过滤。设定值由经验值来确定,此处不作限定。
S240、基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
本公开实施例提供的一种检测方法,通过在灰度视频帧内,确定每个边界候选值所对应第一区域和第二区域内像素值的差异信息,能够基于差异信息确定是否过滤边界候选值,为得到过滤后的边界候选值提供了基础。
在一个实施例中,所述确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息,包括:
分别将所述第一区域和所述第二区域划分为多个块状区域,所述第一区域和所述第二区域内的块状区域的尺寸相等;
确定每个块状区域内像素值的目标数值,所述目标数值包括均值和/或方差;
针对所述第一区域内每个块状区域,确定所述块状区域内像素值的目标数值与所述第二区域内相对应块状区域内像素值的目标数值的差值;
将确定的差值的均值确定为差异信息。
可以理解的是,在确定边界候选值所对应第一区域和第二区域内像素值的差异信息时,可以将第一区域和第二区域对应分区,根据第一区域和第二区域各分区内的像素值来确定差异信息,即首先可以分别将第一区域和第二区域划分为多个块状区域,划分后的第一区域和第二区域内的块状区域的尺寸相等,划分的方式和个数不限,如可以在目标方向垂直方向上将第一区域和第二区域划分为相同个数的块状区域,块状区域的个数可以根据视频帧的宽度确定。
然后确定每个块状区域内像素值的目标数值,目标数值可以包括均值和/或方差;继而针对第一区域内每个块状区域,对块状区域内像素值的目标数值与第二区域内相对应块状区域内像素值的目标数值的差值进行确定,以得到各差值;最后将确定的差值的均值确定为差异信息。
第一区域的块状区域中点和第二区域内相对应块状区域可以认为是沿所对应边界候选值所表征边界对称的块状区域。
在一个实施例中,在所述目标数值包括均值时,所述差异信息包括均值差异信息,所述均值差异信息为基于均值所确定差值的均值;
在所述目标数值包括方差时,所述差异信息包括方差差异信息,所述方差差异信息为基于方差所确定差值的均值;
相应的,所述基于所述差异信息确定是否过滤所述边界候选值,包括:
在所述边界候选值所对应均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,过滤所述边界候选值。
均值差异信息可以认为是基于块状区域内像素值的均值所确定差值的均值,方差差异信息可以认为是基于块状区域内像素值的方差所确定差值的均值。如确定每个块状区域内像素的均值,针对每个第一区域内的块状区域,确定该块状区域的均值,与第二区域内与该块状区域所对应块状区域(该块状区域下方的位于第二区域内的块状区域)的均值的差值。
本实施例中,目标数值可以包括均值和/或方差,当目标数值包括均值时,可以确定每个块状区域内像素值的均值,继而针对第一区域内每个块状区域,对块状区域内像素值的均值与第二区域内相对应块状区域内像素值的均值的差值进行确定,以得到各差值;将确定的差值的均值确定为均值差异信息;当目标数值包括方差时,可以确定每个块状区域内像素值的方差,继而针对第一区域内每个块状区域,对块状区域内像素值的方差与第二区域内相对应块状区域内像素值的均值的差值进行确定,以得到各差值;最后将确定的差值的均值确定为方差差异信息。
相应的,可以基于均值差异信息和方差差异信息确定是否过滤边界候选值,如可以根据均值差异信息和方差差异信息所表征数值的大小来进行确定,当均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,可以认为第一区域和第二区域的像素值差别较小,此时可以将该边界候选值过滤;否则可以认为第一区域和第二区域的像素值差别较大,此时无需将此边界候选值过滤。
在一个实施例中,所述基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,包括:
针对每个边界候选值,确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值;
基于所述主颜色差异值,确定是否过滤所述边界候选值。
主颜色差异值可以用于表征边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异情况,如包括在相同色域的差异情况。
需要说明的是,在过滤各边界候选值时,可以根据边界候选值对应第一区域和第二区域的主颜色的差异情况来确定是否将该边界候选值进行过滤,即针对每个边界候选值,可以确定边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,确定主颜色差异值的步骤不限,如可以根据第一区域和第二区域内像素值出现频次来分别确定第一区域和第二区域的主颜色,然后根据主颜色在相同色域取值的差值来确定主颜色差异值。然后基于确定的主颜色差异值,确定是否过滤边界候选值,如可以根据主颜色差异值的大小直接是否过滤边界候选值,也可以将主颜色差异值与差异阈值比较,基于比较结果来确定是否过滤边界候选值,即当主颜色差异值小于差异阈值时,说明边界候选值对应第一区域和第二区域的主颜色的差异较小,即第一区域和第二区域的内容较为相似,那么可以将此边界候选值认为是无效边界,并将其过滤;当主颜色差异值大于或者等于差异阈值时,说明边界候选值对应第一区域和第二区域的主颜色的差异较大,即第一区域和第二区域的内容变化较大,那么可以初步将此边界候选值认为是有效边界,无需将其过滤。
可以认为的是,本实施例在过滤各边界候选值的过程中,可以首先在灰度视频帧内,针对每个边界候选值所对应第一区域和第二区域内像素值的差异信息,初步确定是否过滤边界候选值,然后在初步过滤后的边界候选值的基础上,针对每个边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,进一步确定是否过滤边界候选值,以此得到最终过滤后的边界候选值;也可以先针对每个边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,初步确定是否过滤边界候选值,得到初步过滤后的边界候选值,并在初步过滤后的边界候选值的基础上,针对每个边界候选值所对应第一区域和第二区域内像素值的差异信息,进一步确定是否过滤边界候选值,以此得到最终过滤后的边界候选值;还可以同时对边界候选值启动不同的进程,分别针对边界候选值所对应第一区域和第二区域内像素值的差异信息和边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值确定是否过滤边界候选值,并汇总得到最终过滤后的边界候选值。
在一个实施例中,所述确定所述边界候选值在色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,包括:
以第一量化间隔量化所述第一区域和所述第二区域内像素值;
基于所述第一区域内量化后的像素值,确定所述第一区域内出现频次最高的第一主颜色;
基于所述第二区域内量化后的像素值,确定所述第二区域内出现频次最高的第二主颜色;
确定所述第一主颜色和所述第二主颜色中,相同色域取值的差值;
将各所述差值绝对值之和确定为主颜色差异值。
第一量化间隔可以认为是预先设定的量化间隔,用于量化第一区域和第二区域内的各像素值,第一量化间隔可以由相关人员进行设定,如第一量化间隔可以为4。第一主颜色可以是指第一区域内出现频次最高的像素值对应的颜色,第二主颜色可以是指第二区域内出现频次最高的像素值对应的颜色,第一主颜色和第二主颜色仅用于区分不同的对象,本实施例对此不作限定。
在一个实施方式中,可以以第一量化间隔对第一区域和第二区域内的所有像素值进行量化,得到第一区域内量化后的像素值和第二区域内量化后的像素值,如将各像素值从[0,255]的区间映射到[0,64]区间内;然后基于第一区域内量化后的像素值,确定第一区域内出现频次最高的第一主颜色,基于第二区域内量化后的像素值,确定第二区域内出现频次最高的第二主颜色;继而计算第一主颜色和第二主颜色在相同色域的取值,将各相同色域取值的差值的绝对值相加,并将相加结果确定为主颜色差异值。
图3为本公开实施例所提供的一种检测方法的示意图,如图3所示,首先可以在当前视频的起始T秒时间段内进行视频抽帧,可以得到红绿蓝(rgb)图像(即视频帧),将rgb图像转换为灰度图,灰度图经过水平边界激活像素检测,可以输出经水平边界激活像素处理后的像素图a(即确定视频帧的水平梯度和垂直梯度;基于所述水平梯度和所述垂直梯度,确定目标方向上的候选像素),灰度图经过强边缘抑制,可以输出经过强边缘抑制后的像素图b(即过滤所述目标方向上候选像素中的干扰像素);汇总水平边界激活像素检测和强边缘抑制后的结果,即将水平边界激活像素检测得到的值为1的激活像素中被强边缘抑制确定为0的激活像素过滤掉,可以输出将像素图a和b的像素值进行与操作的像素图c(即将过滤后的像素确定为目标方向上的像素;基于所述目标方向上的像素确定所述像素图);基于像素图c利用非极大值抑制方法输出过滤部分边界后的边界候选值,即在像素图c中候选边界值的高度值;随后基于非极大值抑制输出的候选边界值和灰度图(即沿目标方向,确定所述像素图每行中目标像素的占比信息;基于所述占比信息,从所述像素图的各行中选取边界候选值),利用带斑(Banding)抑制方法,能够在灰度视频帧内,针对每个边界候选值所对应第一区域和第二区域内像素值的差异信息,确定是否过滤边界候选值,得到初步过滤后的边界候选值(即在所述灰度视频帧内,针对每个边界候选值,确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息;基于所述差异信息确定是否过滤所述边界候选值);基于初步过滤后的边界候选值和rgb图像,根据主颜色匹配抑制方法可以得到视频帧最终过滤后的边界候选值(即针对每个边界候选值,确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值;基于所述主颜色差异值,确定是否过滤所述边界候选值)。
每帧图像均执行上面的步骤后得到每帧图像对应的候选边界值,从而进行时域多帧信息融合(即所述视频帧为所属视频内的多帧视频帧,所述基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值),将多帧中候选边界比例大于百分之六十的候选边界的均值确定为对应的边界值(即若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值,则确定所述所属视频的类型为第二类型,并将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值),最终时域融合输出是否为三明治(即视频帧所属视频的视频类型)和边界目标值(即视频帧的边界目标值)。需要说明的是,在进行时域融合时,才针对上下边界单独运算,在进行时域融合之前不区分上下边界。且图像高度中线以上的可以认为是候选的上边界,中线以下的可以认为是候选的下边界。
图4为本公开实施例所提供的一种检测方法的整体流程示意图,如图4所示,首先视频经过抽帧后,将视频帧转换为灰度视频帧,尺寸信息为H*W,对灰度视频帧中的各像素进行水平边界激活像素检测,即使用sobel算子分别检测像素对应的水平梯度Grad_x和垂直梯度Grad_y(即确定视频帧的水平梯度和垂直梯度),当像素点对应的梯度信息满足|Grad_x|-|Grad_y*K|>0,其中K=40(即arctan(Grad_y/Grad_x)=90)时,则可判定该像素为水平边界激活像素(即确定目标方向上的候选像素),并赋值为1,否则判定该像素为非水平边界激活像素,并赋值为0;遍历灰度视频帧中的所有像素,得到多个赋值为1的水平边界激活像素和多个赋值为0的非水平边界激活像素。
图5为本公开实施例所提供的一种视频帧的示意图,如图5所示,为视频经过抽帧后,将视频帧转换为的灰度视频帧;图6为本公开实施例所提供的一种像素图的示意图,如图6所示,为对灰度视频帧中的各像素进行水平边界激活像素检测后得到的像素图,图中白色像素点即为水平边界激活像素,赋值为1,图中黑色像素点即为非水平边界激活像素,赋值为0。
参见图4,经过水平边界激活像素检测后,然后进行强边缘抑制,即将上步骤确定的水平边缘激活像素进行筛选(即过滤目标方向上候选像素中的干扰像素)。可以认为的是,短视频场景中会大量出现文字、表情等编辑内容,会干扰有效的水平边界检测。故可以使用Canny edge检测算法筛选属于强边缘的像素,并将强边缘的像素和与强边缘在M=7像素内的内容判定为非水平边界激活像素,赋值为0,即干扰像素包括检测得到的像素和距离所述检测得的像素设定像素内的像素,其中检测阈值可为175,200。该检测阈值可以基于干扰物的尺寸确定。将过滤后的像素确定为目标方向上的像素。图7为本公开实施例所提供的另一种像素图的示意图,如图7所示,将上步骤确定的水平边缘激活像素进行强边缘抑制,过滤目标方向上候选像素中的干扰像素,并将过滤后的像素形成像素图(即图7)。
继而进行基于非极大值抑制(non maximum suppression,NMS)的水平边界提取,即可基于强边缘抑制后得到的水平激活像素图,沿水平方向对激活像素逐行求平均值,如对于某行包含的各像素来说,值0可认为是非水平边界激活像素,值1可认为是水平边界激活像素,根据值1的个数计算水平边界激活像素在该行所有像素个数的概率值horizon_act(即沿目标方向,确定所述像素图每行中目标像素的占比信息),如果horizon_act越接近于1,说明该边界是视频边界的概率越大。在确定像素图每行中为目标方向上的像素的占比信息后,可以使用非极大值抑制的方法从上下两个边界向中心从一维的概率分布horizon_act中提取峰值边界值(即基于所述占比信息,从所述像素图的各行中选取边界候选值),其中NMS过滤的滑动窗口大小N=10。当峰值边界值大于指定阈值(如border_thres=0.2),该边界线被判定为有效的边界候选值border_candiates(即边界候选值)。
图8为本公开实施例所提供的一种占比信息的示意图,如图8所示,为像素图每行中为目标方向上的像素的占比信息。经过基于NMS的水平边界提取后,图9为本公开实施例所提供的另一种占比信息的示意图,使用非极大值抑制的方法后,可以从像素图的各行中选取到边界候选值。
随后进行带斑干扰抑制和主颜色匹配干扰抑制,首先为了过滤掉候选边界上下均为平滑区域的干扰项,可以对每个边界候选值border_candiate的上下两条带状区域(即第一区域和第二区域)进行像素值差异对比,其中,带状区域大小可为L*W,一般的L=16,将上下带状区域划分为LxL的块状区域,对比上下两组块内容的均值和方差差异,具体的,可以分别将第一区域和第二区域划分为多个块状区域,针对第一区域内每个块状区域,确定块状区域内像素值的目标数值与第二区域内相对应块状区域内像素值的目标数值的差值,将确定的差值的均值确定为差异信息,用于确定是否过滤边界候选值。
示例性的,第一区域和第二区域为16x960的带状区域,可以分别将第一区域和第二区域划分为60个16x16的块状区域,计算每个块状区域内像素值的目标数值(如均值和/或方差),并针对第一区域内每个块状区域,确定块状区域内像素值的目标数值与第二区域内相对应块状区域内像素值的目标数值的差值,将确定的差值的均值确定为差异信息,如均值差异信息block_mean_diff=mean(|block_mean_upper_i-block_mean_lower_i|),iin[1,W//L],方差差异信息block_std_diff=mean(|block_std_upper_i-block_std_lower_i|),i in[1,W//L],block_mean_upper_i可认为是第一区域,即上带状区域的第i个块状区域内像素值的均值,block_mean_lower_i可以认为是第二区域,即下带状区域的第i块状区域内像素值的均值,block_std_upper_i可以认为是第一区域,即上带状区域第i个块状区域内像素值的方差,block_std_lower_i|可以认为是第二区域,即下带状区域的第i块状区域内像素值的方差;当block_mean_diff<5.0(即设定均值阈值)且block_std_diff<5.0(即设定方差阈值),表明该候选边界上下内容较为相似,即可判定为无效的候选边界值,以此得到初步过滤后的边界候选值(即在所述边界候选值所对应均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,过滤所述边界候选值)。
在得到初步过滤后的边界候选值基础上,可以将视频帧转换到RGB色域空间,对候选边界值border_candiate的上下两个带状区域进行色彩相似度匹配,即使用Quantization_bin=4的量化间隔(即第一量化间隔)将带状区域的所有像素值从[0-255]的区间映射到区间为[0-64](即以第一设定量化间隔量化所述第一区域和所述第二区域内像素值)。对量化后的像素值进行频次统计,如上下带状区域出现频次最高的主颜色分别为[r2_upper,g2_upper,b2_upper]和[r2_lower,g2_lower,g2_lower](即确定所述第一区域内出现频次最高的第一主颜色;基于所述第二区域内量化后的像素值,确定所述第二区域内出现频次最高的第二主颜色)。如果上下主颜色差异dominant_color_diff<5.0,表明该候选边界上下内容较为相似,判定为无效的候选边界值;如果上下主颜色差异dominant_color_diff≥5.0,表明该候选边界上下内容差异较大,判定为有效的候选边界值(即基于所述主颜色差异值,确定是否过滤所述边界候选值),其中,上下主颜色差异即主颜色差异值dominant_color_diff=|r2_upper-r2_lower|+|g2_upper-g2_lower|+|b2_upper-b2_lower|(即确定第一主颜色和所述第二主颜色中,相同色域取值的差值;将各所述差值绝对值之和确定为主颜色差异值)。
经过上述步骤(即图4中虚线部分)可以处理每帧视频的边界信息,提供单帧有效水平边界,即可以得到多个单帧视频帧对应的过滤后的边界候选值;将多帧有效水平边界进行视频多帧结果汇总,即通过时域多帧信息融合后可以得到检测结果,包括是否为三明治视频和边界目标值。具体的,可以对视频起始的T秒时间段内的视频帧进行逐帧检测,共得到T帧视频帧(即视频帧为所属视频内的多帧视频帧),计算平均border_candiates的数量(即确定平均候选值),如果时域平均候选窗口border_candiates的数量小于1,则直接判定为普通视频(即将所属视频的视频类型确定为第一类型);否则,需要基于各边界候选值,确定视频帧所属视频的视频类型和视频帧的边界目标值,例如以Quantization_bin=10的量化间隔对时域的检测边界信息序列border_candiates进行粗粒度的量化(即以第二量化间隔量化各所述边界候选值),得到quant_border_candiates,以使得边界检测不受边界较小的边界波动干扰。
之后在时域维度上统计上下边界出现频次最高的量化上下边界quant_border_upper和quant_border_lower(即确定第一边界所对应量化后边界候选值和第二边界所对应量化后边界候选值)。根据quant_border_upper和quant_border_lower反向查找border_candiates(即确定所述第一边界所对应量化前的第一边界候选值;确定所述第二边界所对应量化前的第二边界候选值),如果出现在[quant_border_upper*Quantization_bin,(quant_border_upper+1)*Quantization_bin]和[quant_border_lower*Quantization_bin,(quant_border_lower+1)*Quantization_bin]的候选边界比例均大于60%(即若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值),则对符合条件的border_candiates求均值分别获得valid_boder_upper和valid_boder_lower,作为三明治视频检测出有效边界(即将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值),并判定该视频为三明治视频(即确定所述所属视频的类型为第二类型);如果未检出稳定边界如不存在第一边界候选值和第二边界候选值的占比均大于设定阈值的情况,则判定视频为普通视频。
图10为本公开实施例所提供的一种检测装置的结构示意图,如图10所示,所述装置包括:第一确定模块310、过滤模块320以及第二确定模块330。
第一确定模块310,用于确定视频帧在目标方向上的边界候选值;
过滤模块320,用于基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
第二确定模块330,用于基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
本公开实施例所提供的技术方案,通过第一确定模块310确定视频帧在目标方向上的边界候选值;通过过滤模块320基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;通过第二确定模块330基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。利用该装置,基于边界候选值所对应第一区域和第二区域,过滤各边界候选值,能够准确地过滤边界候选值,得到过滤后的边界候选值;同时基于过滤后的边界候选值,实现了在确定视频帧所属视频的视频类型的同时,能够对视频帧的边界目标值进行确定。
可选的,所述视频帧为灰度视频帧,所述过滤模块320包括:
第一确定单元,用于在所述灰度视频帧内,针对每个边界候选值,确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息;
第二确定单元,用于基于所述差异信息确定是否过滤所述边界候选值。
可选的,所述第一确定单元具体用于:
分别将所述第一区域和所述第二区域划分为多个块状区域,所述第一区域和所述第二区域内的块状区域的尺寸相等;
确定每个块状区域内像素值的目标数值,所述目标数值包括均值和/或方差;
针对所述第一区域内每个块状区域,确定所述块状区域内像素值的目标数值与所述第二区域内相对应块状区域内像素值的目标数值的差值;
将确定的差值的均值确定为差异信息。
可选的,在所述目标数值包括均值时,所述差异信息包括均值差异信息,所述均值差异信息为基于均值所确定差值的均值;
在所述目标数值包括方差时,所述差异信息包括方差差异信息,所述方差差异信息为基于方差所确定差值的均值;
相应的,所述第二确定单元包括:
在所述边界候选值所对应均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,过滤所述边界候选值。
可选的,所述过滤模块320包括:
第三确定单元,用于针对每个边界候选值,确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值;
第四确定单元,用于基于所述主颜色差异值,确定是否过滤所述边界候选值。
可选的,所述第三确定单元具体用于:
以第一量化间隔量化所述第一区域和所述第二区域内像素值;
基于所述第一区域内量化后的像素值,确定所述第一区域内出现频次最高的第一主颜色;
基于所述第二区域内量化后的像素值,确定所述第二区域内出现频次最高的第二主颜色;
确定所述第一主颜色和所述第二主颜色中,相同色域取值的差值;
将各所述差值绝对值之和确定为主颜色差异值。
可选的,所述视频帧为所属视频内的多帧视频帧,所述第二确定模块330包括:
第五确定单元,用于基于每帧视频帧所对应过滤后的边界候选值,确定平均候选值;
第六确定单元,用于若所述平均候选值小于1,则将所属视频的视频类型确定为第一类型,所述第一类型的视频内容的显示比例与显示区域的显示比例相同;
第七确定单元,用于若所述平均候选值大于或等于1,则基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
可选的,所述第七确定单元具体用于:
以第二量化间隔量化各所述边界候选值;
确定第一边界所对应量化后边界候选值;
确定第二边界所对应量化后边界候选值,所述第一边界和所述第二边界间为视频内容,所述第一边界和所述第二边界分别为沿所述目标方向上的边界;
确定所述第一边界所对应量化前的第一边界候选值;
确定所述第二边界所对应量化前的第二边界候选值;
若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值,则确定所述所属视频的类型为第二类型,并将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值,所述第二类型的视频内容的显示比例小于显示区域的显示比例。
可选的,所述第一区域和所述第二区域的尺寸和形状相同,所述第一区域和所述第二区域沿所述目标方向上的边与所述视频帧沿所述目标方向上的边等长,所述第一区域和所述第二区域高度方向上的边小于所述视频帧高度方向上的边,所述高度方向为与所述目标方向垂直的方向。
可选的,所述第一确定模块310包括:
第八确定单元,用于确定视频帧的像素图,所述像素图中位于目标边界上的像素和非目标边界上的像素区别显示,所述目标边界为沿目标方向上的边界;
第九确定单元,用于确定所述像素图内在所述目标边界上的边界候选值。
可选的,所述第八确定单元具体用于:
确定视频帧的水平梯度和垂直梯度;
基于所述水平梯度和所述垂直梯度,确定目标边界上的候选像素;
过滤所述目标边界上候选像素中的干扰像素,所述干扰像素包括检测得到的像素和距离所述检测得的像素设定像素内的像素,所述干扰像素的检测阈值基于干扰物确定;
将过滤后的像素确定为目标边界上的像素;
基于所述目标边界上的像素确定所述像素图。
可选的,所述第九确定单元具体用于:
沿目标方向,确定所述像素图每行中目标像素的占比信息,所述目标像素为位于目标边界上的像素;
基于所述占比信息,从所述像素图的各行中选取边界候选值。
本公开实施例所提供的检测装置可执行本公开任意实施例所提供的检测方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
图11为本公开实施例所提供的一种电子设备的结构示意图。下面参考图11,其示出了适于用来实现本公开实施例的电子设备(例如图11中的终端设备或服务器)500的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,电子设备500可以包括处理器(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理器501、ROM 502以及RAM 503通过总线504彼此相连。编辑/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理器501执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的电子设备与上述实施例提供的检测方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的检测方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:确定视频帧在目标方向上的边界候选值;基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例1提供了一种检测方法,包括:
确定视频帧在目标方向上的边界候选值;
基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
根据本公开的一个或多个实施例,示例2根据示例1所述的方法,所述视频帧为灰度视频帧,所述基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,包括:
在所述灰度视频帧内,针对每个边界候选值,确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息;
基于所述差异信息确定是否过滤所述边界候选值。
根据本公开的一个或多个实施例,示例3根据示例2所述的方法,所述确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息,包括:
分别将所述第一区域和所述第二区域划分为多个块状区域,所述第一区域和所述第二区域内的块状区域的尺寸相等;
确定每个块状区域内像素值的目标数值,所述目标数值包括均值和/或方差;
针对所述第一区域内每个块状区域,确定所述块状区域内像素值的目标数值与所述第二区域内相对应块状区域内像素值的目标数值的差值;
将确定的差值的均值确定为差异信息。
根据本公开的一个或多个实施例,示例4根据示例3所述的方法,
在所述目标数值包括均值时,所述差异信息包括均值差异信息,所述均值差异信息为基于均值所确定差值的均值;
在所述目标数值包括方差时,所述差异信息包括方差差异信息,所述方差差异信息为基于方差所确定差值的均值;
相应的,所述基于所述差异信息确定是否过滤所述边界候选值,包括:
在所述边界候选值所对应均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,过滤所述边界候选值。
根据本公开的一个或多个实施例,示例5根据示例1所述的方法,所述基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,包括:
针对每个边界候选值,确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值;
基于所述主颜色差异值,确定是否过滤所述边界候选值。
根据本公开的一个或多个实施例,示例6根据示例5所述的方法,所述确定所述边界候选值在色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,包括:
以第一量化间隔量化所述第一区域和所述第二区域内像素值;
基于所述第一区域内量化后的像素值,确定所述第一区域内出现频次最高的第一主颜色;
基于所述第二区域内量化后的像素值,确定所述第二区域内出现频次最高的第二主颜色;
确定所述第一主颜色和所述第二主颜色中,相同色域取值的差值;
将各所述差值绝对值之和确定为主颜色差异值。
根据本公开的一个或多个实施例,示例7根据示例1所述的方法,所述视频帧为所属视频内的多帧视频帧,所述基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
基于每帧视频帧所对应过滤后的边界候选值,确定平均候选值;
若所述平均候选值小于1,则将所属视频的视频类型确定为第一类型,所述第一类型的视频内容的显示比例与显示区域的显示比例相同;
若所述平均候选值大于或等于1,则基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
根据本公开的一个或多个实施例,示例8根据示例7所述的方法,所述基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
以第二量化间隔量化各所述边界候选值;
确定第一边界所对应量化后边界候选值;
确定第二边界所对应量化后边界候选值,所述第一边界和所述第二边界间为视频内容,所述第一边界和所述第二边界分别为沿所述目标方向上的边界;
确定所述第一边界所对应量化前的第一边界候选值;
确定所述第二边界所对应量化前的第二边界候选值;
若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值,则确定所述所属视频的类型为第二类型,并将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值,所述第二类型的视频内容的显示比例小于显示区域的显示比例。
根据本公开的一个或多个实施例,示例9根据示例1所述的方法,
所述第一区域和所述第二区域的尺寸和形状相同,所述第一区域和所述第二区域沿所述目标方向上的边与所述视频帧沿所述目标方向上的边等长,所述第一区域和所述第二区域高度方向上的边小于所述视频帧高度方向上的边,所述高度方向为与所述目标方向垂直的方向。
根据本公开的一个或多个实施例,示例10根据示例1所述的方法,所述确定视频帧在目标方向上的边界候选值,包括:
确定视频帧的像素图,所述像素图中位于目标边界上的像素和非目标边界上的像素区别显示,所述目标边界为沿目标方向上的边界;
确定所述像素图内在所述目标边界上的边界候选值。
根据本公开的一个或多个实施例,示例11根据示例10所述的方法,所述确定视频帧的像素图,包括:
确定视频帧的水平梯度和垂直梯度;
基于所述水平梯度和所述垂直梯度,确定目标边界上的候选像素;
过滤所述目标边界上候选像素中的干扰像素,所述干扰像素包括检测得到的像素和距离所述检测得的像素设定像素内的像素,所述干扰像素的检测阈值基于干扰物确定;
将过滤后的像素确定为目标边界上的像素;
基于所述目标边界上的像素确定所述像素图。
根据本公开的一个或多个实施例,示例12根据示例10所述的方法,确定所述像素图内在所述目标方向上的边界候选值,包括:
沿目标方向,确定所述像素图每行中目标像素的占比信息,所述目标像素为位于目标边界上的像素;
基于所述占比信息,从所述像素图的各行中选取边界候选值。
根据本公开的一个或多个实施例,示例13提供了一种检测装置,包括:
第一确定模块,用于确定视频帧在目标方向上的边界候选值;
过滤模块,用于基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
第二确定模块,用于基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
根据本公开的一个或多个实施例,示例14提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如示例1-12中任一所述的检测方法。
根据本公开的一个或多个实施例,示例15提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如示例1-12中任一所述的检测方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (15)

1.一种检测方法,其特征在于,包括:
确定视频帧在目标方向上的边界候选值;
基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
2.根据权利要求1所述的方法,其特征在于,所述视频帧为灰度视频帧,所述基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,包括:
在所述灰度视频帧内,针对每个边界候选值,确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息;
基于所述差异信息确定是否过滤所述边界候选值。
3.根据权利要求2所述的方法,其特征在于,所述确定所述边界候选值所对应第一区域和第二区域内像素值的差异信息,包括:
分别将所述第一区域和所述第二区域划分为多个块状区域,所述第一区域和所述第二区域内的块状区域的尺寸相等;
确定每个块状区域内像素值的目标数值,所述目标数值包括均值和/或方差;
针对所述第一区域内每个块状区域,确定所述块状区域内像素值的目标数值与所述第二区域内相对应块状区域内像素值的目标数值的差值;
将确定的差值的均值确定为差异信息。
4.根据权利要求3所述的方法,其特征在于,
在所述目标数值包括均值时,所述差异信息包括均值差异信息,所述均值差异信息为基于均值所确定差值的均值;
在所述目标数值包括方差时,所述差异信息包括方差差异信息,所述方差差异信息为基于方差所确定差值的均值;
相应的,所述基于所述差异信息确定是否过滤所述边界候选值,包括:
在所述边界候选值所对应均值差异信息表征的数值小于设定均值阈值,且所对应方差差异信息表征的数值小于设定方差阈值时,过滤所述边界候选值。
5.根据权利要求1所述的方法,其特征在于,所述基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,包括:
针对每个边界候选值,确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值;
基于所述主颜色差异值,确定是否过滤所述边界候选值。
6.根据权利要求5所述的方法,其特征在于,所述确定所述边界候选值在红绿蓝色域空间的视频帧内所对应第一区域和第二区域的主颜色差异值,包括:
以第一量化间隔量化所述第一区域和所述第二区域内像素值;
基于所述第一区域内量化后的像素值,确定所述第一区域内出现频次最高的第一主颜色;
基于所述第二区域内量化后的像素值,确定所述第二区域内出现频次最高的第二主颜色;
确定所述第一主颜色和所述第二主颜色中,相同色域取值的差值;
将各所述差值绝对值之和确定为主颜色差异值。
7.根据权利要求1所述的方法,其特征在于,所述视频帧为所属视频内的多帧视频帧,所述基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
基于每帧视频帧所对应过滤后的边界候选值,确定平均候选值;
若所述平均候选值小于1,则将所属视频的视频类型确定为第一类型,所述第一类型的视频内容的显示比例与显示区域的显示比例相同;
若所述平均候选值大于或等于1,则基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
8.根据权利要求7所述的方法,其特征在于,所述基于各边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值,包括:
以第二量化间隔量化各所述边界候选值;
确定第一边界所对应量化后边界候选值;
确定第二边界所对应量化后边界候选值,所述第一边界和所述第二边界间为视频内容,所述第一边界和所述第二边界分别为沿所述目标方向上的边界;
确定所述第一边界所对应量化前的第一边界候选值;
确定所述第二边界所对应量化前的第二边界候选值;
若所述第一边界候选值和所述第二边界候选值的占比大于设定阈值,则确定所述所属视频的类型为第二类型,并将所述第一边界候选值的均值和所述第二边界候选值的均值确定为所属视频的边界目标值,所述第二类型的视频内容的显示比例小于显示区域的显示比例。
9.根据权利要求1所述的方法,其特征在于,
所述第一区域和所述第二区域的尺寸和形状相同,所述第一区域和所述第二区域沿所述目标方向上的边与所述视频帧沿所述目标方向上的边等长,所述第一区域和所述第二区域高度方向上的边小于所述视频帧高度方向上的边,所述高度方向为与所述目标方向垂直的方向。
10.根据权利要求1所述的方法,其特征在于,所述确定视频帧在目标方向上的边界候选值,包括:
确定视频帧的像素图,所述像素图中位于目标边界上的像素和非目标边界上的像素区别显示,所述目标边界为沿目标方向上的边界;
确定所述像素图内在所述目标边界上的边界候选值。
11.根据权利要求10所述的方法,其特征在于,所述确定视频帧的像素图,包括:
确定视频帧的水平梯度和垂直梯度;
基于所述水平梯度和所述垂直梯度,确定目标边界上的候选像素;
过滤所述目标边界上候选像素中的干扰像素,所述干扰像素包括检测得到的像素和距离所述检测得的像素设定像素内的像素,所述干扰像素的检测阈值基于干扰物确定;
将过滤后的像素确定为目标边界上的像素;
基于所述目标边界上的像素确定所述像素图。
12.根据权利要求10所述的方法,其特征在于,确定所述像素图内在所述目标边界上的边界候选值,包括:
沿目标方向,确定所述像素图每行中目标像素的占比信息,所述目标像素为位于目标边界上的像素;
基于所述占比信息,从所述像素图的各行中选取边界候选值。
13.一种检测装置,其特征在于,包括:
第一确定模块,用于确定视频帧在目标方向上的边界候选值;
过滤模块,用于基于所述边界候选值所对应第一区域和第二区域,过滤各所述边界候选值,所述第一区域和所述第二区域为位于对应候选边界两侧,且所述第一区域和所述第二区域为沿与所述目标方向垂直方向上的两个区域;
第二确定模块,用于基于过滤后的边界候选值,确定所述视频帧所属视频的视频类型和所述视频帧的边界目标值。
14.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的检测方法。
15.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-12中任一所述的检测方法。
CN202211138849.6A 2022-09-19 2022-09-19 一种检测方法、装置、电子设备及介质 Pending CN115439660A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211138849.6A CN115439660A (zh) 2022-09-19 2022-09-19 一种检测方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211138849.6A CN115439660A (zh) 2022-09-19 2022-09-19 一种检测方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN115439660A true CN115439660A (zh) 2022-12-06

Family

ID=84249639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211138849.6A Pending CN115439660A (zh) 2022-09-19 2022-09-19 一种检测方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN115439660A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363567A (zh) * 2023-06-02 2023-06-30 苏州鸿安机械股份有限公司 一种基于aoi视觉检测的晶圆缺陷识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363567A (zh) * 2023-06-02 2023-06-30 苏州鸿安机械股份有限公司 一种基于aoi视觉检测的晶圆缺陷识别方法及系统
CN116363567B (zh) * 2023-06-02 2023-08-22 苏州鸿安机械股份有限公司 一种基于aoi视觉检测的晶圆缺陷识别方法及系统

Similar Documents

Publication Publication Date Title
US11425454B2 (en) Dynamic video overlays
CN114584849B (zh) 视频质量评估方法、装置、电子设备及计算机存储介质
US9165203B2 (en) Legibility enhancement for a logo, text or other region of interest in video
US9652829B2 (en) Video super-resolution by fast video segmentation for boundary accuracy control
US20210281718A1 (en) Video Processing Method, Electronic Device and Storage Medium
US8594423B1 (en) Automatic background identification in video images
CN110971931A (zh) 视频水印添加方法、装置、电子设备及存储介质
US10360687B2 (en) Detection and location of active display regions in videos with static borders
CN110796664A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
WO2020108010A1 (zh) 视频处理方法、装置、电子设备以及存储介质
WO2020108060A1 (zh) 视频处理方法、装置、电子设备以及存储介质
CN111080595A (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN112788329A (zh) 视频静帧检测方法、装置、电视及存储介质
CN115439660A (zh) 一种检测方法、装置、电子设备及介质
CN115346278A (zh) 图像检测方法、装置、可读介质及电子设备
US20150172705A1 (en) Window detection device and method on multi-media system
CN109151574B (zh) 视频处理方法、装置、电子设备以及存储介质
CN107292892B (zh) 视频帧图像的分割方法及装置
CN112752110A (zh) 视频呈现方法及装置、计算设备、存储介质
CN117495854B (zh) 视频数据处理方法、设备及存储介质
US11622118B2 (en) Determination of coding modes for video content using order of potential coding modes and block classification
CN112235531A (zh) 视频处理的方法、装置、终端及存储介质
CN104702878B (zh) 基于HDMI协议下区分OSD和Video信号的方法
CN117670985A (zh) 图像内容边界检测方法、装置、电子设备和存储介质
CN114972020A (zh) 一种图像处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination