CN108830198A - 视频格式的识别方法、装置、设备及存储介质 - Google Patents
视频格式的识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN108830198A CN108830198A CN201810551694.6A CN201810551694A CN108830198A CN 108830198 A CN108830198 A CN 108830198A CN 201810551694 A CN201810551694 A CN 201810551694A CN 108830198 A CN108830198 A CN 108830198A
- Authority
- CN
- China
- Prior art keywords
- image
- algorithm
- video
- format
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 164
- 238000003708 edge detection Methods 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims description 100
- 230000008569 process Effects 0.000 claims description 31
- 238000012896 Statistical algorithm Methods 0.000 claims description 25
- 238000001914 filtration Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 abstract description 9
- 239000003086 colorant Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种视频格式的识别方法、装置、设备及存储介质,该方法包括:获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;根据所述处理结果确定所述待播放视频的格式;其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。本发明实施例的技术方案实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
Description
技术领域
本发明实施例涉及视频格式的识别技术领域,尤其涉及一种视频格式的识别方法、装置、设备及存储介质。
背景技术
视频节目源(包括3D及2D节目)在播放显示过程中,需要告知播放系统(包括交织渲染及显示设备)当前节目的格式,以便后续设备可以按不同格式使用不同的处理方式,以达到最优的3D显示效果。
目前3D播放系统在输出3D视频时基本分为两种方法进行视频格式的设置。一种是用户交互方式,由用户通过输入设备(遥控器、键盘等外部设备)操作交互界面选项告知播放系统视频格式,播放系统再做出相应的处理;二是自动识别3D视频格式,根据输入的视频图像,自动进行图像处理及分析,识别输入的视频格式。
然而,用户手动设置视频格式的方式,切换不同视频格式时均需要用户手动参与,灵活性太差,使用极为不方便,体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景。
发明内容
本发明提供了一种视频格式的识别方法、装置、设备及存储介质,以实现快速、准确的判断出待播放视频的格式。
第一方面,本发明实施例提供了一种视频格式的识别方法,该方法包括:
获取待播放视频中的目标图像;
根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;
根据所述处理结果确定所述待播放视频的格式;
其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
第二方面,本发明实施例还提供了一种视频格式的识别装置,该装置包括:
获取当前图像模块,用于获取待播放视频中的目标图像;
图像处理模块,用于根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;
确实视频格式模块,用于根据所述处理结果确定所述待播放视频的格式;
其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的视频格式的识别方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的视频格式的识别方法。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式灵活性、体验感很差以及自动识别视频格式的方法识别格式单一且准确率不高的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种视频格式的识别方法流程示意图;
图2为本发明实施例一所提供的二维图与深度图构成的3D视频格式示意图;
图3为本发明实施例二所提供的采用索贝尔边缘检测算法对目标图像进行处理的流程示意图;
图4为本发明实施例三所提供的采用直方图统计算法对目标图像进行处理的流程示意图;
图5为本发明实施例三所提供的2D图像中红绿蓝三通道色彩的直方图;
图6为本发明实施例三所提供的3D图像中左右格式分割后红绿蓝三通道色彩的直方图;
图7为本发明实施例四所提供的一种视频格式的识别方法流程示意图;
图8为本发明实施例五所提供的一种视频格式的识别方法流程图;
图9为本发明实施例六所提供的一种视频格式的识别装置结构示意图;
图10为本发明实施例七所提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一所提供的一种视频格式的识别方法流程示意图,本实施例可适用于判定当前视频的播放格式,并根据判定的格式对视频进行播放管理的情况,该方法可以由视频格式的识别装置来执行,该装置可以通过软件和/或硬件的形式实现。
如图1所述,本发明实施例的方法包括:
S110、获取待播放视频中的目标图像。
需要说明的是,视频播放时,需要相应的播放设备以及显示设备,也就说需要播放系统以及3D显示设备。其中,视频播放系统可以是计算机或专用视频解码播放设备,可以理解为视频播放系统只要能够播放视频图像即可。由于播放的视频格式可以包括多种,可选的,2D格式、3D格式,3D格式的视频又包括2D+Z格式、左右格式、上下格式、九宫格格式,因此若想判别待播放视频的格式为具体的哪一种,需要在播放系统中增加自动识别2D以及3D视频格式的装置,对待要播放的视频进行自动识别,以便根据不同的视频格式选择与视频格式相对应的播放格式。显示设备可以是2D显示设备也可以是3D显示设备。若是2D显示设备显示出的图像是二维的,若是3D显示设备显示出的图像可以是三维的。其中,3D显示设备可以采用带裸眼3D功能的显示屏。
其中,待播放的视频可以是电视机即将要播放的视频,也可以是计算机设备要播放的视频,本发明实施例的技术方案对视频的播放设备和播放系统不做限定,只需要满足在播放系统中设置有本发明实施例公开的视频格式的识别装置即可。在判断视频的格式时,获取待播放视频的图像,可选的,获取待播放视频的第一帧图像、第二帧图像等。目标图像是指对当前图像进行处理的图像,为了实现快速识别,可选是,选取待播放视频的第一帧图像,并将所述第一帧图像作为目标图像。
S120、根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果。
需要说明的是,在采用图像识别算法对获取到的待播放视频的目标图像进行处理时,为了减小数据的处理量以及提高检测效率,需要对目标图像进行缩放处理,缩放处理就是将较高分辨率的图像转换为较低分辨率的图像,进而通过较低分辨率的图像来判断目标图像的格式,可选的,缩放处理后的图像分辨率可以支持至240*144,当然图像的缩放处理并不影响视频的格式,因此通过对缩放处理后的图像进行格式识别,并根据此结果确定待播放视频的格式时,不会降低视频格式识别装置对视频格式检测的准确度。
获取待播放视频的第一帧图像作为目标图像,若所述第一帧图像为全黑图像,则判定所述第一帧图像为无效图像,并获取所述第一帧图像的下一帧图像,将所述下一帧图像作为目标图像。
可以理解为:待播放视频的图像有至少一帧构成,为了尽快判断出待播放视频的格式,优选的,获取待播放视频的第一帧图像作为目标图像。其中,是否可以根据第一帧图像来判定视频的格式需看第一帧图像是否具有代表性,可选的,若第一帧图像为全黑的图像,则不需要采用任何算法对目标图像进行处理,判定第一帧图像为无效图并获取第一帧图像的下一帧图像,也就是说第一帧图像不具备代表性,并把下一帧图像作为目标图像,可以理解为第一帧图像为无效图,对当前图像的下一帧图像进行处理。
若第一帧图像不是全黑的图像,则对目标图像的像素进行处理,若所述目标图像第一侧为色彩图,第二侧为灰色深度图,则判定所述待播放视频的格式为二维图与深度图构成的三维视频格式。
其中,可以将二维图与深度图记为2D+Z格式的3D视频格式,该视频格式的特点是:第一侧为普通的2D视频图像,第二侧灰色深度图像,具体可参见图2,其中,第一侧可以是图像的右侧,第二侧可以是图像的左侧。判断是否为2D+Z格式的3D视频格式,需要判断图像第一侧是否为正常的彩色图以及第二侧是否为灰度图。若满足上述两个条件,则认为待播放的视频为2D+Z格式的3D视频格式;若不满足上述中的任意一个条件,可选的,第二侧不存在灰度图,则判定目标图像不是2D+Z格式的3D视频格式。
判断待播放视频是否为2D+Z格式的视频方法比较简单,因此在判断视频格式的过程中,可以优先判断视频的格式是否为2D+Z格式。为了确保判定结果的准确性,用户也可以选取当前帧数的下一帧图像进行验证,进而确定待播放视频是否为2D+Z格式的视频。
图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。预设的执行顺序,可以理解为将上述的图像识别算法按照一定的顺序进行排列,排列的依据可以是根据算法处理的复杂程度或者是哪一种算法可以优先的识别出视频的格式,可选的,算法的执行顺序可以是直方图统计算法、索贝尔边缘检测算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法,优选的执行顺序可以是依次采用索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
需要说明的是,图像识别算法可以预先集成在视频播放系统中的,当获取到待播放视频的目标图像后,视频播放系统中的处理器可以对目标图像依次采用上述算法对目标图像进行处理。在采用上述图像识别算法对目标图像进行处理之前,可以根据2D+Z格式的特点判断视频的格式。
S130、根据所述处理结果确定所述待播放视频的格式。
播放系统中的处理器对目标图像采用各种算法进行处理,可以得到目标图像的格式,进而可以得到待播放视频的格式,可选的,左右格式、上下格式、九宫格格式等,根据待播放视频的格式选择与其相对应的显示方式。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
实施例二
在上述实施例的基础上,根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,可以优先采用索贝尔边缘检测算法对目标图像进行处理。图3为本发明实施例二所提供的采用索贝尔边缘检测算法对目标图像进行处理的流程示意图。
如图3所述,本发明实施例的方法包括:
S310、获取待播放视频的目标图像。
其中,目标图像可以是待播放视频的第一帧图像,若第一帧图像为全黑图像,则判定第一帧图像为无效图像,获取第一帧图像的下一帧图像,并将下一帧图像作为目标图像。
S320、采用索贝尔边缘检测算法对目标图像进行处理。
若下一帧图像不是全黑的图像,并且第二侧图像不是灰度图,则判定目标图像不为2D+Z格式,需进一步采用图像识别算法对目标图像进行处理,可选的,采用索贝尔边缘检测算法对目标图像进行处理,优先采用此种算法的原因在于:当目标图像的差异比较大时,采用此种算法只需要判断分割线两侧像素灰度值是否存在跳变,计算方式比较简单,因此可以优先采用索贝尔边缘检测算法对目标图像进行处理。需要说明的是,可以优先选用此种算法进行处理,具体的各种算法采用顺序在此不做限定。
其中,索贝尔边缘检测算法是一离散性的差分算子,用来运算亮度函数的灰度近似值。本发明实施例的技术方案利用该算法的特性对3D视频格式进行判断,可以判断出目标图像是3D视频格式中左右格式、上下格式以及九宫格格式的哪一种。其原理是:采用第一预设分割方式对目标图像进行分割,可选的,第一预设分割方式分别为左右格式分割、上下格式分割以及九宫格格式分割。其中,当采用左右格式分割目标图像时,分割线在目标图像水平方向的中心位置处,采用上下格式分割目标图像时,分割线在目标图像垂直方向上的中心位置处,采用九宫格格式分割目标图像时,分割线分别在目标图像水平方向或者垂直方向的三等分处。此时,分别计算并判断分割线相邻两侧像素的像素是否存在跳变;若存在跳变,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;若不存在跳变,则对分割后的目标图像进行还原,并采用所述直方图统计算法对还原后的所述目标图像进行处理。
示例性的,当采用左右格式分割目标图像后,计算分割线两侧相对位置处的像素灰度值,并判断灰度值是否存在跳变,若存在跳变则说明此分割线是存在的,可以判定待播放视频为左右格式的视频;当采用上下格式分割标目标图像后,计算分割线两侧相对位置处的像素灰度值,并判断灰度值是否存在跳变若分割线两侧相对位置处的像素灰度值存在跳变,则说明此分割线存在,可以判定待播放视频为上下格式视频;当采用九宫格格式分割目标图像后,计算分割线两侧相对位置处的像素灰度值,并判断灰度值是否存在跳变,若存在跳变则说明此分割线是存在的,可以判定待播放视频为九宫格格式的视频。
其中,计算分割线两侧相对位置处的像素灰度值是否存在跳变,可以采用像素灰度值跳变检测模型。示例性的,当采用左右格式分割时,表1中分割线相邻两侧数字分别为当前像素与相邻像素的权值,通过计算两侧像素加权值的和,可以判断像素灰度值是连续的还是跳变的。
表1
其计算的具体公式如下:
x=f(x+1,y-1)+2*f(x+1,y)+f(x+1,y+1)–f(x,y-1)-2*f(x,y)-f(x,y+1)
其中,函数f(x,y)的系数为当前像素与相邻像素的权值。若分割线相邻两侧的像素灰度值存在跳变,则可以理解为分割线是存在的,也就是说左右格式分割是符合目标图像的分割方式的,因此可以确定视频格式为左右格式;若分割线相邻两侧的像素灰度值不存在跳变,则认为分割线是不存在,待播放视频的格式不是左右格式的视频。
若不为左右格式的视频,则采用上下方式分割目标图像,也就是目标图像的分割线位于目标图像垂直方向上的中心位置处,采用分界线两侧像素灰度值跳变检测模型。示例性的,表2为采用上下分割方式分割目标图像时,分割线相邻两侧数字分别为当前像素与相邻像素的权值,通过计算两侧像素加权值的差,可以判断像素灰度值是连续的还是跳变的。
表2
其计算公式如下:
y=f(x-1,y)+2*f(x,y)+f(x+1,y)-f(x-1,y+1)-2*f(x,y+1)-f(x+1,y+1)
其中,函数f(x,y)的系数为当前像素与相邻像素的权值。若分割线相邻两侧的像素灰度值存在跳变,则可以理解为采用上下格式分割时,分割线是存在的进而可以确定视频格式为上下格式;若分割线相邻两侧的像素灰度值不存在跳变,则认为分割线是不存在,进一步采用九宫格格式分割目标图像,按照上述算法对目标图像分割线相对位置处的像素灰度值进行计算,进而判定待播放视频的格式。
S330、确定待播放视频的格式。
通过S320可知,采用索贝尔边缘检测算法,按照预设的分割方式对目标图像进行分割,计算并判断分割线相对位置处的像素灰度值是否存在跳变,若存在跳变,则可以判定待播放视频的格式为与当前分割方式相对应的视频格式,可选的,采用左右格式分割时,分割线相对位置处的像素灰度值存在跳变,则确定待播放视频为左右格式视频。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题,以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
实施例三
获取到待播放视频的目标图像,可能存在目标图像的背景色比较接近或者由于图像本身的原因通过索贝尔边缘检测算法难以判断出目标图是否存在分界线时,可以将分割后的图像还原,当然也可以不还原,直接获取目标图像,采用直方图统计算法对还原后的图像进行处理其具体的处理方法,可参见图4。图4为本发明实施例三所提供的采用直方图统计算法对目标图像进行处理的流程示意图。
如图4所述,本发明实施例的方法包括:
S410、采用索贝尔边缘检测算法计算分割线相邻两侧像素的灰度值不存在跳变。
在上述技术方案的基础之上,若分割线相邻两侧像素灰度值不存在跳变,则可以说明图像的背景比较接近或者图像自身的特性,采用索贝尔边缘检测算法无法判断出分界线是否存在,当然也没有办法判断出待播放视频的格式。为了进一步判断待播放视频的格式,可以采用直方图统计算法对目标图像进行处理。
S420、采用所述直方图统计算法目标图像进行处理。
其具体的处理方式可以是:按照第一预设分割方式对目标图像进行分割;分别统计分割后的每幅图像的像素色彩值,并判断各幅图像的像素色彩值的误差是否处于预设的误差范围之内;若是,则确定待播放视频的格式为与当前分割方式相对应的视频格式。
其中,直方图统计算法主要是根据采集到的目标图像的像素色彩值之间的相似度来判断图像的格式。因此为了通过目标图像的像素色彩值来判断目标图像的格式,需要在获取目标图像的像素色彩值之前,按照预设份分割方式对目标图像进行分割,可选的,采用左右分割方式对目标图像进行分割,分割后得到两幅具有一定视图差的目标图像,分别统计每幅图像的像素色彩值,可选的,统计左右两幅图的红绿蓝三通道色彩的直方图,若每一幅图的像素色彩值误差都在预设的误差范围之内,可选的,每幅图像之间像素色彩值的预设误差范围为千分之五,也就是说,当前的误差范围在千分之五之内,则确定目标图像为左右格式的图像。若每幅图像之间的当前误差范围超出预设的误差范围,则采用上下分割方式对目标图像进行分割,并判断分割处理后的像素色彩值是否满足预设条件,若依然没有满足预设的分割方式,则采用九宫格分割方式对目标图像进行分割,直至判断出目标图像可能存在的格式。
示例性的,若目标图像为普通的2D图像,按照预设的分割方式,可选的左右分割方式对目标图像进行分割,并统计分割后的图像的像素色彩值,得到与其相对应的红绿蓝三通道色彩的直方图,可参见图5,通过图5可知红绿蓝三通道的像素色彩值差异比较大,可以判定该图像所在的视频不为左右格式的图像,以此类推采用不同的分割方式对目标图像进行分割,若是不论采用哪一种分割方式得到的直方图均是差异较大,则判定待播放视频为2D格式。若目标图像为左右格式的3D图像,并且采用左右格式分割目标图像,分别统计分割后的两幅图像像素色彩,得到左右两侧红绿蓝三通道色彩直方图,可参见图6,通过图6可得到,红绿蓝三通道的像素色彩值比较相似,可以理解为各幅图像之间的像素色彩值均在预设的误差范围之内,可以判定待播放视频为左右格式的视频。
分别按照第一预设分割方式对目标图像进行分割,分别统计分割后的每幅图像的像素色彩值,并且判定每一幅图像的像素色彩值的误差是否处于预设份范围之内,进而根据判定结果得到最接近的视频格式,以便后续将其作为参考值对目标图像进行分割。
S430、确定待播放视频的格式。
若采用左右格式分割目标图像,并且统计左右两侧的像素色彩值极为相似,也就是说像素色彩值的误差处于预设误差范围之内,则判定目标图像的格式为与当前分割方式相对应的视频格式,依次类推可以确定待播放视频的格式。
需要说明的是,采用直方图统计算法可以对图像有一个大致的判断,可选的,判断出为左右格式、上下格式、九宫格式或者2D格式中的一种。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题,以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
实施例四
为了进一步验证直方图统计算法处理结果的准确性,对目标图像依次采用图像灰度处理算法、图像高斯滤波算法以及图像轮廓提取算法对目标图像进行处理。图7为本发明实施例四所提供的一种视频格式的识别方法流程示意图。
如图7所述,本发明实施例的方法包括:
S710、采用图像灰度处理算法将目标图像的彩色图逐像素的转换为与目标图像相对应的第一灰度图。
若采用直方图统计算法无法准确的判定待播放视频是哪一种格式的视频时,采用图像灰度处理算法进行处理,可以是将目标图像的彩色图逐像素的转换为与目标图像相对应的第一灰度图,可选的,ARGB色彩图逐像素转换为第一灰度图,转换的过程中可以采用公式:Gray=R*0.114+G*0.587+B*0.299,其中,Gray代表灰度值,R代表红色的像素点,G代表绿色的像素点,B代表蓝色的像素点。将彩色图转换为灰度图的好处在于:可以提高后续采用图形矩算法对目标图像的判断效率以及准确性。
S720、采用图像高斯滤波算法对第一灰度图进行去噪处理,得到与目标图像相对应的第二灰度图像。
其中,图像灰度处理算法可能得到的图像有一定噪点。为了使识别结果更加准确,可以对得到的灰度图进行去噪处理,可选的,采用图像高斯滤波算法对目标图像的灰度图进行去噪处理,得到线条更加平滑的第二灰度图,为提高图像轮廓图计算的准确性奠定了基础。
在通过图像高斯滤波算法进行去噪处理时,可以采用如下公式:
其中,f为输入图像,为输出图像,r为滤波模板半径,σ为输入参数(0,1),σ越大图像越平滑,根据3σ准则,通常使ω=2*[3σ+1]。
S730、采用图像轮廓提取算法对第二灰度图进行处理得到与目标图像相对应的轮廓图。
计算图像的轮廓图是提取第二灰度图的轮廓,也就是采用二值化算法将第二灰度图转换为只有0、255的黑白图像。其中,二值化法是先设定一个预设阈值,预设阈值用户可以根据实际需求进行设置,可选的,127,当低于预设阈值时,将其记为0,也就是将低于预设阈值的颜色全部转换为黑色,高于预设阈值的颜色全部转换为白色,也就是255。采用此值方式可以提取图像的轮廓图,以便计算图形矩使用。
S740、按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,分别获取每幅子图像至少两个Hu不变矩值。
按照第一预设分割方式对上述获取的轮廓图进行处理,得到至少两幅子图像,可选的,左右格式的图像、上下格式的图像或者九宫格格式的图像,要获计算每幅子图像至少两个Hu不变矩值,可选的,2个、3个、4个等,优选的,计算每幅子图像7个Hu不变矩值,需要先获取图像的p+q阶几何矩。示例性的,假设函数为f(x,y),则图像的p+q阶几何矩(标准矩)定义为:
p+q阶中心矩定义为:
其中,p、q为自然数,N和M分别是图像的高度和宽度,可选的,若图像像素为960×1080,则认为图像的高度为1080、宽度为960。
通过上述公式可以得到图像的零阶矩,M00表示图像质量;一阶矩,M01、M10分别表示图像质心;二阶矩,M11、M02、M20表示物体形状方向;三阶矩M03、M30、M12、M21表示灰度偏斜度。
根据归一化中心矩定义:ηpq=μpq/(μ00 ρ);其中ρ=(p+q)/2+1
再利用二阶和三阶归一化中心矩构造了7个Hu不变矩:
M1=η20+η01;
M2=(η20-η01)2+4η11 2;
M3=(η30-3η12)2+(3η21-η03)2;
M4=(η30+η12)2+(η21+η03)2;
M7=(3η21-η03)(η30+η12)((η30+η12)2-3(η21+η03)2)-(η30-3η12)(η21+η03)(3(η30+η12)2-(η21+η03)2)
S750、判断各幅子图像所对应的至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内,若是,则执行S760;若否,则执行S770。
通过S740可以得到每一幅子图像至少两个Hu不变矩值,可选的,计算7个Hu不变矩,进一步判断各幅子图像相对应的Hu不变矩值之间的差值是否处于预设误差范围之内,可选的,预设误差范围是千分之五,若各幅子图像相对应的Hu不变矩值之间的误差在千分之五的范围之内,则判定目标图像为与当前分割方式相对应的视频格式,可选的,左右格式的视频、上下格式的视频或者九宫格格式的视频。
S760、确定待播放视频的格式。
若是每幅子图像相对应的至少两个Hu不变矩值处于预设的误差范围之内,优选的,7个Hu不变矩值处于预设的误差范围之内,则判定待播放视频的格式为与当前分割方式相对应的视频格式。
S770、采用多区域中心算法对还原后的所述轮廓图进行处理。
若每幅子图像相对应的至少两个Hu不变矩值均超出预设的误差范围,则认为根据当前图像识别算法无法确认图像的格式,可以将分割后的目标图像进行还原,并采用多区域中心算法对还原后的轮廓图进行处理。当然,也可以不对图像进行还原,直接获取目标图像的轮廓图进行处理。
其具体的处理方式可以是:按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,并按照第二预设分割方式对所述至少两幅子图像进行分割,得到至少四个第一子图像;可以理解为,采用第一预设分割方式对轮廓图进行处理,可选的,得到两幅子图像,再采用第二预设分割方式将至少两幅子图像进行处理。
其中,第二预设分割方式可以是用户根据实际需求对图像进行分割的方式,也就是对轮廓图进行小区域划分,可选的,根据每幅子图像的像素,将子图像分割为多个像素较低的第一子图像,可选的,子图像像素为960×1080,按第二预设分割方式,将子图像分割成多个像素较低的子图像,可选的,分割后的子图像像素为16*16。
S780、判断各幅第一子图像所对应的至少两个中心矩值是否处于预设的误差范围之内,若是,则执行S760;若否,则执行S790。
采用中心矩比较算法对经过第二预设分割方式分割后的第一轮廓图进行处理,可选的,根据步骤S740分别计算每幅第一子图像的零阶矩、一阶矩、二阶矩等,优选的,计算出每幅子图像的零阶矩、一阶矩,判断每幅第一子图像相应的中心矩值之间的误差是否处于预设的误差范围之内,可选的,判断每幅第一子图像相应的中心矩值之间的误差是否处于千分之五之内,若是,则确定待播放视频为与当前第一预设分割方式相对应的视频格式。
S790、获取目标图像的下一帧图像。
若依然未判断出待播放视频的格式,则获取目标图像的下一帧图像,并根据预设的执行顺序依次采用至少一种图像识别算法对下一帧目标图像进行处理,得到处理结果。本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题,以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
实施例五
作为上述实施例的一优选实施例,图8为本发明实施例五所提供的一种视频格式的识别方法流程图。如图8所述,本发明实施例的方法包括:
S801、获取待播放视频中的目标图像。
其中,目标图像可以是待播放视频的第一帧图像,也可以是第一帧图像的下一帧图像,可选的,获取到的是待播放视频的第一帧图像,并将第一帧图像作为目标图像。
S802、对所述目标图像的像素进行处理,判定所述目标图像第一侧是否为彩色图,右第二侧是否为灰度图,若是,则执行S803;若否,则执行S804。
若第一帧图像不是全黑的图像,则对目标图像的像素进行处理。若所述目标图像第一侧彩色图,第二侧为灰色深度图,则判定所述待播放视频的格式为二维图与深度图构成的三维视频格式,则执行S803,也就是可以确定待播放视频的格式为二维图与深度图的组合;若目标图像不存在灰度图以及彩色图,则执行S804,可以理解为需要采用所述索贝尔边缘检测算法对目标图像进行处理。
S803、确定所述待播放视频的格式。
若所述目标图像第一侧彩色图,第二侧为灰色深度图,则判定所述待播放视频的格式为二维图与深度图构成的三维视频格式,为了进一步验证判断结果的准确性,继续获取待播放视频的目标图像,采用已知视频格式的方式验证当前检测结果的准确性。
S804、采用所述索贝尔边缘检测算法对所述目标图像进行处理。
按照第一预设分割方式对目标图像进行分割,可选的,采用左右格式分割、上下格式分割或者九宫格格式分割。可以是采用左右格式分割目标图像时,在分割线两侧相对位置处对分割后的图像进行处理,可选的,分别计算分割线相邻两侧像素的灰度值。也可以先是采用上下格式分割目标图像,其分割方式的先后顺序用户可以根据实际需求进行设置,其分割方式的先后顺序本发明实施例的技术方案对此不做限定。
S805、分别计算并判断分割线相邻两侧像素的灰度值是否存在跳变,若是,则执行S803;若否,则执行S806。
判断分割线相邻两侧像素的灰度值存在跳变,示例性的,以左右格式分割目标图像为例,计算水平方向上目标图像中心处分割线相邻两侧的像素灰度值。若分割线两侧图像像素灰度值存在跳变,则判定分割线是存在的,可以理解为目标图像为左右格式图像,相应的待播放视频为左右格式视频,即执行S803;若分割线两侧图像像素灰度值不存在跳变,则判定左右分割线不存在,可以理解为目标图像不为左右格式图像,相应的待播放视频也不为左右格式视频。此时继续采用上下格式分割或者九宫格格式分割,若存在跳变,则判定待播放视频为与当前分割方式相对应的视频格式,反之则执行S806。此时视频的格式为3D视频格式中的左右格式、上下格式或者九宫格格式中的一种,示例性的,采用左右格式分割时,分割线相邻两侧像素的灰度值存在跳变,则判定目标图像为左右格式图像,相应的待播放视频为左右格式视频,以此类推来判断待播放视频的格式。
S806、采用直方图统计算法对还原后的目标图像进行处理并分别统计分割后的每幅图像的像素色彩值。
需要说明的是,当目标图像的背景比较相似时,可选的,目标图像为大海的画面,两幅图像的相似度比较高,分割线不明显,此时根据索贝尔边缘检测方法,难以判断出目标图像的格式。可以采用直方图统计算法对目标图像进行处理。其具体的处理方法是:采用第一预设分割方式对目标图像进行分割,可选的,左右格式分割,分割后得到两幅具有一定视图差的目标图像,分别统计每幅图像的像素色彩值,可选的,分别统计左右两幅图的红绿蓝三通道色彩的直方图。
S807、判断各幅图像的像素色彩值的差值是否处于预设的误差范围之内,若是,则执行S803;若否,则执行S808。
若每一幅图的像素色彩值误差都在预设的误差范围之内,可选的,每幅图之间的像素色彩值的差值误差范围为千分之五,则确定目标图像为左右格式的图像,也就是说待播放的视频为左右格式的3D视频。若误差范围超出预设的误差范围,则采用上下分割方式对目标图像进行分割,并判断分割处理后的像素色彩值是否满足预设条件,若依然没有满足预设的分割方式,则采用九宫格分割方式对目标图像进行分割,直至判断出目标图像可能存在的格式。
示例性的,当采用左右格式分割目标图像并分别统计左右两幅图的红绿蓝三通道色彩的直方图,若两幅图的三通道色彩直方图极为相似时,可选的,两幅图的色彩值误差在千分之五的范围之内,则判定该目标图像为左右格式的图像。反之,则继续采用上下格式分割目标图像进行判定;若目标图像也不满足上下分割方式,则继续采用九宫格格式分割目标图像,采用直方图统计算法,可以实现初步判定目标图像的格式。
S808、采用所述图像灰度处理算法、所述图像高斯滤波算法以及所述图像轮廓提取算法对还原后的所述目标图像进行处理。
若采用直方图统计算法无法准确的判定待播放视频是哪一种格式的视频时,采用图像灰度处理算法进行处理,可以是将目标图像的彩色图逐像素的转换为与目标图像相对应的第一灰度图,可选的,ARGB色彩图逐像素转换为第一灰度图,转换的过程中可以采用公式:Gray=R*0.114+G*0.587+B*0.299,其中,Gray代表灰度值,R代表红色的像素点,G代表绿色的像素点,B代表蓝色的像素点。将彩色图转换为灰度图的好处在于:可以提高后续采用图形矩算法对目标图像的判断效率以及准确性。
图像灰度处理算法可能得到的图像有一定噪点。为了使识别据结果更加准确,可以对得到的灰度图进行去噪处理,可选的,采用图像高斯滤波算法对目标图像的灰度图进行去噪处理,得到线条更加平滑的第二灰度图,为提高图像轮廓图计算的准确性奠定了基础。
计算图像的轮廓图是提取第二灰度图的轮廓,也就是采用二值化算法将第二灰度图转换为只有0、255的黑白图像。其中,二值化法是先设定一个预设阈值,这个预设的预设于是用户可以根据实际需求进行设置,可选的,127,当低于预设阈值时,将其记为0,也就是将低于预设阈值的颜色全部转换为黑色,高于预设阈值的颜色全部转换为白色,也就是255。采用此值方式可以提取图像的轮廓图,以便计算图形矩使用。
S809、按照第一预设分割方式对轮廓图进行分割得到至少两幅子图像,分别计算每幅子图像的至少两个Hu不变矩值。。
按照第一预设分割方式对得到的轮廓图进行分割,可以得到至少两幅子图像,可选的,两幅子图像、九幅子图像。分别获取每幅子图像至少两个Hu不变矩值。
S810、判断各幅子图像所对应的至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内,若是,则执行S803;若否,则执行S811。
判定至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内,若相应的至少两个Hu不变矩值的当前误差在预设的误差范围之内,则说明视频的格式与当前采用的分割方式为相一致,反之,依次采用另外两种格式分割处理后的轮廓图,根据计算结果判定至少个两个Hu不变矩值之间的误差是否处于预设的误差范围之内,若是则执行S803,也就是可以确定目标图像的视频格式;若依然无法确定,则执行S811,即采用多区域中心算法对目标图像进行处理。此时待播放视频的格式为与当前分割方式相对应的视频格式。
S811、采用多区域中心矩算法分别计算每幅第一子图像至少两个中心矩值;当各幅第一子图像所对应的至少两个中心矩值之间的误差是否处于预设的误差范围之内时,则确定待播放视频的格式。
采用多区域中心算法主要是先按照第一预设分割方式对轮廓图进行分割达到至少两幅子图像,再采用第二预设分割方式将至少两幅子图像划分为多区域第一子图像,可选的,将子图像划分为16*16像素的子图像,分别获取每幅第一子图像至少两个中心矩值,若每幅图像的至少两个中心矩值之间的误差处于预设误差范围之内,则可以确定待播放视频的格式与当前采用第一预设分割方式相对应的视频格式。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题,以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
实施例六
图9为本发明实施例六提供的一种视频格式的识别装置结构示意图,该装置包括:获取当前图像模块910、图像处理模块920以及确实视频格式模块930。其中,
获取当前图像模块910,用于获取待播放视频中的目标图像;图像处理模块920,用于根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;确实视频格式模块930,用于根据所述处理结果确定所述待播放视频的格式;其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
在上述技术方案的基础上,所述图像处理模块还用于,获取所述待播放视频的第一帧图像作为目标图像;若所述第一帧图像为全黑图像,则判定所述第一帧图像为无效图像,并获取所述第一帧图像的下一帧图像,将所述下一帧图像作为目标图像。在上述各技术方案的基础上,所述图像处理模块还用于,对所述目标图像的像素进行处理,若所述目标图像第一侧为彩色图,第二侧为灰色深度图,则判定所述待播放视频的格式为二维图与深度图构成的三维视频格式。
在上述各技术方案的基础上,在所述图像处理模块对对所述目标图像的像素进行处理之后,第一处理单元用于,若所述目标图像不存在灰色深度图,则采用所述索贝尔边缘检测算法对所述目标图像进行处理。
在上述各技术方案的基础上,所述第一处理单元还用于:按照第一预设分割方式对所述目标图像进行分割;其中,所述第一预设分割方式分别为左右格式分割、上下格式分割以及九宫格格式分割;分别计算并判定分割线相邻两侧像素的灰度值是否存在跳变;若存在跳变,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;若不存在跳变,则对分割后的目标图像进行还原,并采用所述直方图统计算法对还原后的所述目标图像进行处理。
在上述各技术方案的基础上,所述采用所述直方图统计算法对所述目标图像进行处理,包括:按照所述第一预设分割方式对所述目标图像进行分割;分别统计分割后的每幅图像的像素色彩值,并判断各幅图像的像素色彩值的误差是否处于预设的误差范围之内;若是,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;若否,则对分割后的目标图像进行还原,并采用所述图像灰度处理算法、所述图像高斯滤波算法以及所述图像轮廓提取算法对还原后的所述目标图像进行处理。
在上述各技术方案的基础上,所述采用所述图像灰度处理算法、所述图像高斯滤波算法以及所述图像轮廓提取算法对还原后的所述目标图像进行处理,包括:按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,分别计算每幅子图像的至少两个Hu不变矩值;判断各幅子图像所对应的至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内;若是,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;若否,则对所述轮廓图进行还原,并采用所述多区域中心矩算法对还原后的所述轮廓图进行处理。
在上述各技术方案的基础上,在所述采用所述图像轮廓提取算法对所述第二灰度图进行处理得到与所述目标图像相对应的轮廓图之后,还包括:按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,分别计算每幅子图像的至少两个Hu不变矩值;判断各幅子图像所对应的至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内;若是,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;若否,则对所述轮廓图进行还原,并采用所述多区域中心矩算法对还原后的所述轮廓图进行处理。
在上述各技术方案的基础上,所述采用多区域中心算法对还原后的所述轮廓图进行处理,包括:按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,并按照第二预设分割方式对所述至少两幅子图像进行分割,得到至少四个第一子图像;采用所述多区域中心矩算法分别计算每幅第一子图像至少两个中心矩值;判断各幅第一子图像所对应的至少两个中心矩值之间的误差是否处于预设的误差范围之内;若是,则确定所述待播放视频的格式为当前分割方式对应的视频格式。
本发明实施例的技术方案通过获取待播放视频中的目标图像;根据预设的执行顺序依次采用至少一种图像识别算法对目标图像进行处理,确定待播放视频的格式,解决了现有技术中采用手动设置视频格式,当切换不同视频格式时均需要用户手动参与灵活太差的技术问题,以及体验感很差;自动识别视频格式的方法,由于只能识别左右格式视频节目,识别格式太过单一,且准确率不高,不能满足多种视频格式识别的应用场景的技术问题,实现了对多种3D视频格式全部进行自动识别,并且在识别的过程中采用至少一种图像识别方法对图像进行识别,提高了视频格式判定结果准确性、节约劳动成本的技术效果。
本发明实施例所提供的视频格式识别装置可执行本发明任意实施例所提供的视频格式识别方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例七
图10为本发明实施例七提供的一种设备的结构示意图。图10示出了适于用来实现本发明实施例实施方式的示例性设备100的框图。图10显示的设备100仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,设备100以通用计算设备的形式表现。设备100的组件可以包括但不限于:一个或者多个处理器或者处理单元1001,系统存储器1002,连接不同系统组件(包括系统存储器1002和处理单元1001)的总线1003。
总线1003表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备100典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备100访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器1002可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)1004和/或高速缓存存储器1005。设备100可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统1006可以用于读写不可移动的、非易失性磁介质(图10未显示,通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线1003相连。存储器1002可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块1007的程序/实用工具1008,可以存储在例如存储器1002中,这样的程序模块1007包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块1007通常执行本发明所描述的实施例中的功能和/或方法。
设备100也可以与一个或多个外部设备1009(例如键盘、指向设备、显示器1010等)通信,还可与一个或者多个使得用户能与该设备100交互的设备通信,和/或与使得该设备100能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1011进行。并且,设备100还可以通过网络适配器1012与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1012通过总线1003与设备100的其它模块通信。应当明白,尽管图10中未示出,可以结合设备100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元1001通过运行存储在系统存储器1002中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种视频格式的识别方法。
实施例八
本发明实施例八还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视频格式的识别方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (12)
1.一种视频格式的识别方法,其特征在于,包括:
获取待播放视频中的目标图像;
根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;
根据所述处理结果确定所述待播放视频的格式;
其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,包括:
获取所述待播放视频的第一帧图像作为目标图像;
若所述第一帧图像为全黑图像,则判定所述第一帧图像为无效图像,并获取所述第一帧图像的下一帧图像,将所述下一帧图像作为目标图像。
3.根据权利要求1所述的方法,其特征在于,所述根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,包括:
对所述目标图像的像素进行处理,若所述目标图像第一侧为彩色图,第二侧为灰色深度图,则判定所述待播放视频的格式为二维图与深度图构成的三维视频格式。
4.根据权利要求3所述的方法,其特征在于,在所述对所述目标图像的像素进行处理之后,包括:
若所述目标图像不存在灰色深度图,则采用所述索贝尔边缘检测算法对所述目标图像进行处理。
5.根据权利要求4所述的方法,其特征在于,所述采用所述索贝尔边缘检测算法对所述目标图像进行处理,包括:
按照第一预设分割方式对所述目标图像进行分割;
其中,所述第一预设分割方式分别为左右格式分割、上下格式分割以及九宫格格式分割;
分别计算并判断分割线相邻两侧像素的灰度值是否存在跳变;
若存在跳变,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;
若不存在跳变,则对分割后的目标图像进行还原,并采用所述直方图统计算法对还原后的所述目标图像进行处理。
6.根据权利要求5所述的方法,其特征在于,所述采用所述直方图统计算法对还原后的所述目标图像进行处理,包括:
按照所述第一预设分割方式对所述目标图像进行分割;
分别统计分割后的每幅图像的像素色彩值,并判断各幅图像的像素色彩值的误差是否处于预设的误差范围之内;
若是,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;
若否,则对分割后的目标图像进行还原,并采用所述图像灰度处理算法、所述图像高斯滤波算法以及所述图像轮廓提取算法对还原后的所述目标图像进行处理。
7.根据权利要求6所述的方法,其特征在于,所述采用所述图像灰度处理算法、所述图像高斯滤波算法以及所述图像轮廓提取算法对还原后的所述目标图像进行处理,包括:
采用所述图像灰度处理算法将所述目标图像的彩色图逐像素的转换为与所述目标图像相对应的第一灰度图;
采用所述图像高斯滤波算法对所述第一灰度图进行去噪处理,得到与所述目标图像相对应的第二灰度图像;
采用所述图像轮廓提取算法对所述第二灰度图进行处理得到与所述目标图像相对应的轮廓图。
8.根据权利要求7所述的方法,其特征在于,在所述采用所述图像轮廓提取算法对所述第二灰度图进行处理得到与所述目标图像相对应的轮廓图之后,还包括:
按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,分别计算每幅子图像的至少两个Hu不变矩值;
判断各幅子图像所对应的至少两个Hu不变矩值之间的误差是否处于预设的误差范围之内;
若是,则确定所述待播放视频的格式为与当前分割方式相对应的视频格式;
若否,则对所述轮廓图进行还原,并采用所述多区域中心矩算法对还原后的所述轮廓图进行处理。
9.根据权利要求8所述的方法,其特征在于,所述采用多区域中心矩算法对还原后的所述轮廓图进行处理,包括:
按照所述第一预设分割方式对所述轮廓图进行分割得到至少两幅子图像,并按照第二预设分割方式对所述至少两幅子图像进行分割,得到至少四个第一子图像;
采用所述多区域中心矩算法分别计算每幅第一子图像至少两个中心矩值;
判断各幅第一子图像所对应的至少两个中心矩值之间的误差是否处于预设的误差范围之内;
若是,则确定所述待播放视频的格式为当前分割方式对应的视频格式。
10.一种视频格式的识别装置,其特征在于,包括:
获取当前图像模块,用于获取待播放视频中的目标图像;
图像处理模块,用于根据预设的执行顺序依次采用至少一种图像识别算法对所述目标图像进行处理,得到处理结果;
确实视频格式模块,用于根据所述处理结果确定所述待播放视频的格式;
其中,所述图像识别算法包括索贝尔边缘检测算法、直方图统计算法、图像灰度处理算法、图像高斯滤波算法、图像轮廓提取算法、图形Hu不变矩比较算法以及多区域中心矩算法。
11.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述视频格式的识别方法。
12.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-9中任一所述视频格式的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810551694.6A CN108830198A (zh) | 2018-05-31 | 2018-05-31 | 视频格式的识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810551694.6A CN108830198A (zh) | 2018-05-31 | 2018-05-31 | 视频格式的识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108830198A true CN108830198A (zh) | 2018-11-16 |
Family
ID=64147208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810551694.6A Pending CN108830198A (zh) | 2018-05-31 | 2018-05-31 | 视频格式的识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108830198A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109640180A (zh) * | 2018-12-12 | 2019-04-16 | 上海玮舟微电子科技有限公司 | 视频3d显示的方法、装置、设备及存储介质 |
CN110956574A (zh) * | 2019-11-22 | 2020-04-03 | 华为终端有限公司 | Soc芯片、移动终端 |
CN112004162A (zh) * | 2020-09-08 | 2020-11-27 | 宁波视睿迪光电有限公司 | 一种在线3d内容播放系统及方法 |
CN112052713A (zh) * | 2020-04-15 | 2020-12-08 | 上海摩象网络科技有限公司 | 一种视频处理方法、设备及手持相机 |
CN115391601A (zh) * | 2022-10-28 | 2022-11-25 | 摩尔线程智能科技(北京)有限责任公司 | 视频格式的检测方法、索引模型的构建方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102395037A (zh) * | 2011-06-30 | 2012-03-28 | 深圳超多维光电子有限公司 | 一种格式识别方法及识别装置 |
CN102547344A (zh) * | 2011-12-23 | 2012-07-04 | Tcl集团股份有限公司 | 一种视频格式识别方法及装置 |
CN102957930A (zh) * | 2012-09-03 | 2013-03-06 | 雷欧尼斯(北京)信息技术有限公司 | 一种数字内容3d格式自动识别方法和系统 |
CN102957933A (zh) * | 2012-11-13 | 2013-03-06 | Tcl集团股份有限公司 | 一种3d视频格式识别方法、装置 |
CN103198294A (zh) * | 2013-02-22 | 2013-07-10 | 广州市朗辰电子科技有限公司 | 一种视频或图像视点类型的识别方法 |
CN105049824A (zh) * | 2015-07-03 | 2015-11-11 | 无锡易维视显示技术有限公司 | 自动检测三维视频格式的方法 |
CN105635715A (zh) * | 2016-01-14 | 2016-06-01 | 深圳维爱特科技有限公司 | 视频格式识别方法及装置 |
CN106851168A (zh) * | 2017-02-23 | 2017-06-13 | 宁波视睿迪光电有限公司 | 视频格式识别方法、装置及播放器 |
CN107071386A (zh) * | 2017-04-19 | 2017-08-18 | 宁波万维显示科技有限公司 | 识别3d格式视频的方法及装置 |
-
2018
- 2018-05-31 CN CN201810551694.6A patent/CN108830198A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102395037A (zh) * | 2011-06-30 | 2012-03-28 | 深圳超多维光电子有限公司 | 一种格式识别方法及识别装置 |
CN102547344A (zh) * | 2011-12-23 | 2012-07-04 | Tcl集团股份有限公司 | 一种视频格式识别方法及装置 |
CN102957930A (zh) * | 2012-09-03 | 2013-03-06 | 雷欧尼斯(北京)信息技术有限公司 | 一种数字内容3d格式自动识别方法和系统 |
CN102957933A (zh) * | 2012-11-13 | 2013-03-06 | Tcl集团股份有限公司 | 一种3d视频格式识别方法、装置 |
CN103198294A (zh) * | 2013-02-22 | 2013-07-10 | 广州市朗辰电子科技有限公司 | 一种视频或图像视点类型的识别方法 |
CN105049824A (zh) * | 2015-07-03 | 2015-11-11 | 无锡易维视显示技术有限公司 | 自动检测三维视频格式的方法 |
CN105635715A (zh) * | 2016-01-14 | 2016-06-01 | 深圳维爱特科技有限公司 | 视频格式识别方法及装置 |
CN106851168A (zh) * | 2017-02-23 | 2017-06-13 | 宁波视睿迪光电有限公司 | 视频格式识别方法、装置及播放器 |
CN107071386A (zh) * | 2017-04-19 | 2017-08-18 | 宁波万维显示科技有限公司 | 识别3d格式视频的方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109640180A (zh) * | 2018-12-12 | 2019-04-16 | 上海玮舟微电子科技有限公司 | 视频3d显示的方法、装置、设备及存储介质 |
CN110956574A (zh) * | 2019-11-22 | 2020-04-03 | 华为终端有限公司 | Soc芯片、移动终端 |
WO2021098827A1 (zh) * | 2019-11-22 | 2021-05-27 | 华为技术有限公司 | Soc芯片、移动终端 |
CN110956574B (zh) * | 2019-11-22 | 2024-04-09 | 华为终端有限公司 | Soc芯片、移动终端 |
CN112052713A (zh) * | 2020-04-15 | 2020-12-08 | 上海摩象网络科技有限公司 | 一种视频处理方法、设备及手持相机 |
WO2021208256A1 (zh) * | 2020-04-15 | 2021-10-21 | 上海摩象网络科技有限公司 | 一种视频处理方法、设备及手持相机 |
CN112052713B (zh) * | 2020-04-15 | 2022-01-11 | 上海摩象网络科技有限公司 | 一种视频处理方法、设备及手持相机 |
CN112004162A (zh) * | 2020-09-08 | 2020-11-27 | 宁波视睿迪光电有限公司 | 一种在线3d内容播放系统及方法 |
CN112004162B (zh) * | 2020-09-08 | 2022-06-21 | 宁波视睿迪光电有限公司 | 一种在线3d内容播放系统及方法 |
CN115391601A (zh) * | 2022-10-28 | 2022-11-25 | 摩尔线程智能科技(北京)有限责任公司 | 视频格式的检测方法、索引模型的构建方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN108830198A (zh) | 视频格式的识别方法、装置、设备及存储介质 | |
US10373380B2 (en) | 3-dimensional scene analysis for augmented reality operations | |
EP3576017A1 (en) | Method, apparatus, and device for determining pose of object in image, and storage medium | |
EP3101594A1 (en) | Saliency information acquisition device and saliency information acquisition method | |
CN112308095A (zh) | 图片预处理及模型训练方法、装置、服务器及存储介质 | |
CN109033972A (zh) | 一种目标检测方法、装置、设备及存储介质 | |
CN106296681B (zh) | 基于双通道低秩分解的协同学习显著性检测方法 | |
CN104966285B (zh) | 一种显著性区域的检测方法 | |
CN112329851B (zh) | 一种图标检测方法、装置及计算机可读存储介质 | |
KR20120019425A (ko) | 화상 처리 장치 및 방법, 및 프로그램 | |
WO2018032630A1 (zh) | 一种教育玩具套件及利用颜色和轮廓识别编程模块的方法 | |
CN112752158B (zh) | 一种视频展示的方法、装置、电子设备及存储介质 | |
WO2023045183A1 (zh) | 图像处理 | |
Peng et al. | Lggd+: Image retargeting quality assessment by measuring local and global geometric distortions | |
CN112446292B (zh) | 一种2d图像显著目标检测方法及系统 | |
US20050141765A1 (en) | Toboggan-based shape characterization | |
CN106295627A (zh) | 用于识别文字牛皮癣图片的方法及装置 | |
CN112734747A (zh) | 一种目标检测方法、装置、电子设备和存储介质 | |
CN114449362B (zh) | 视频封面的选取方法、装置、设备及存储介质 | |
CN113449639A (zh) | 一种物联网网关对仪表的无接触数据采集方法 | |
CN106529441A (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN113743378B (zh) | 一种基于视频的火情监测方法和装置 | |
CN112686122B (zh) | 人体及影子的检测方法、装置、电子设备、存储介质 | |
JP5201184B2 (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200409 Address after: 215634 north side of Chengang road and west side of Ganghua Road, Jiangsu environmental protection new material industrial park, Zhangjiagang City, Suzhou City, Jiangsu Province Applicant after: ZHANGJIAGANG KANGDE XIN OPTRONICS MATERIAL Co.,Ltd. Address before: 201203, room 5, building 690, No. 202 blue wave road, Zhangjiang hi tech park, Shanghai, Pudong New Area Applicant before: WZ TECHNOLOGY Inc. |
|
TA01 | Transfer of patent application right | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181116 |
|
WD01 | Invention patent application deemed withdrawn after publication |