一种格式识别方法及识别装置
技术领域
本发明涉及多媒体领域,尤其涉及一种格式识别方法及识别装置。
背景技术
随着3D(三维)技术的不断发展,各种各样的3D格式的片源涌现出来;但是,目前的3D片源没有统一的格式,主流的格式包括上下格式和左右格式以及其他的一些格式。
播放设备在对一幅图像或者一个视频进行播放时,首先需要知道该文件是何种格式;但是目前文件片源中,3D格式和2D(二维)格式的图像或者视频均大量存在;当提供方不标识图像或者视频是3D还是2D格式时,播放设备将无法准确得知其文件格式。
发明内容
本发明要解决的技术问题是如何准确判断视频、图像等的文件格式。
为了解决上述问题,本发明首先提供了一种格式识别方法,包括:
将获取的待识别图像沿中线拆分,得到两个拆分图像;
比较所述两个拆分图像的表征图像的特征,获得所述两个拆分图像的图像特征差异;
根据所获得所述两个拆分图像的图像特征差异确定所述获取的待识别图像的显示格式。
优选地,将所述待识别图像沿中线拆分,得到两个拆分图像,包括:
将所述待识别图像沿左右中线拆分,得到左图像和右图像这两个拆分图像;
将所述待识别图像沿上下中线拆分,得到上图像和下图像这两个拆分图像。
优选地,获得所述图像特征差异包括:
分别提取表征所述左图像和右图像的颜色分布的特征值,计算出两个特征值的差值,将该差值的绝对值作为左右图像特征差异;
分别提取表征所述上图像和下图像的颜色分布的特征值,计算出两个特征值的差值,将该差值的绝对值作为上下图像特征差异;
其中,所述图像特征差异包括所述左右图像特征差异和所述上下图像特征差异。
优选地,所述待识别图像为多幅待识别图像时:
对所述多幅待识别图像中的每一幅待识别图像,计算出表征所述左图像和右图像的颜色分布的特征值的差值;将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述左右图像特征差异;
对所述多幅待识别图像中的每一幅待识别图像,计算出表征所述上图像和下图像的颜色分布的特征值的差值;将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述上下图像特征差异。
优选地,根据所获得所述两个拆分图像的图像特征差异确定所述获取的待识别图像的显示格式,包括:
当所述左右图像特征差异和所述上下图像特征差异均大于一预定阈值时,所述待识别图像为二维格式;否则,所述待识别图像为三维格式。
优选地,所述待识别图像为三维格式后:
所述左右图像特征差异小于所述上下图像特征差异时,将所述待识别图像识别为左右格式;
所述上下图像特征差异小于所述左右图像特征差异时,将所述待识别图像识别为上下格式。
优选地,该方法还包括:
假定两个拆分图像的显示次序;
根据所假定的显示次序,提取所述两个拆分图像中的特征点进行匹配获得多个匹配结果,所述待识别图像从中心到四周的特征点的所述多个匹配结果表现出逐渐增大的变化趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
优选地,该方法还包括:
假定两个拆分图像的显示次序;
根据所假定的显示次序,将所述两个拆分图像中的其中一个拆分图像向另一个拆分图像进行移动获得所述两个拆分图像的多个协方差;所述多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
优选地,将所述待识别图像沿中线拆分前还包括:
对所述待识别图像进行如下处理中的至少一种:
图像下采样、空间域图像增强、频域图像增强、图像去噪及图像分割。
本发明还提供了一种格式识别装置,包括:
拆分模块,用于将获取的待识别图像沿中线拆分,得到两个拆分图像;
比较模块,用于比较所述两个拆分图像的表征图像的特征,获得所述两个拆分图像的图像特征差异;
判决模块,用于根据所获得所述两个拆分图像的图像特征差异确定所述获取的待识别图像的显示格式。
优选地,所述拆分模块,用于将所述待识别图像沿左右中线拆分,得到左图像和右图像这两个拆分图像;以及用于将所述待识别图像沿上下中线拆分,得到上图像和下图像这两个拆分图像。
优选地,所述比较模块包括提取单元及计算单元,其中:
所述提取单元用于分别提取表征所述左图像和右图像的颜色分布的特征值,以及用于分别提取表征所述上图像和下图像的颜色分布的特征值;
所述计算单元用于计算出表征所述左图像和右图像的颜色分布的两个特征值的差值,将该差值的绝对值作为左右图像特征差异;以及用于计算出表征所述上图像和下图像的颜色分布的两个特征值的差值,将该差值的绝对值作为上下图像特征差异;
其中,所述图像特征差异包括所述左右图像特征差异和所述上下图像特征差异。
优选地,所述计算单元用于对多幅待识别图像中的每一幅待识别图像,分别计算出表征所述左图像和右图像的颜色分布的特征值的差值,将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述左右图像特征差异;以及,用于对所述多幅待识别图像中的每一幅待识别图像,计算出表征所述上图像和下图像的颜色分布的特征值的差值,将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述上下图像特征差异。
优选地,所述判决模块,用于当所述左右图像特征差异和所述上下图像特征差异均大于一预定阈值时,确定所述待识别图像为二维格式;否则,确定所述待识别图像为三维格式。
优选地,该装置包括:
识别模块,用于所述判决模块判断出所述待识别图像为三维格式后,在所述左右图像特征差异小于所述上下图像特征差异时,将所述待识别图像识别为左右格式;以及所述上下图像特征差异小于所述左右图像特征差异时,将所述待识别图像识别为上下格式。
优选地,该装置包括:
假定模块,用于假定两个拆分图像的显示次序;
获取模块,用于根据所假定的显示次序,提取所述两个拆分图像中的特征点进行匹配获得多个匹配结果;
确定模块,用于所述待识别图像从中心到四周的特征点的所述多个匹配结果表现出逐渐增大的变化趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
优选地,该装置包括:
假定模块,用于假定两个拆分图像的显示次序;
获取模块,用于根据所假定的显示次序,将所述两个拆分图像中的其中一个拆分图像向另一个拆分图像进行移动获得所述两个拆分图像的多个协方差;
确定模块,用于所述多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
优选地,该装置包括:
预处理模块,用于在所述拆分模块将所述待识别图像沿中线拆分前,对所述待识别图像进行如下处理中的至少一种:
图像下采样、空间域图像增强、频域图像增强、图像去噪及图像分割。
本发明的实施例能够准确判断出文件为3D格式还是2D格式,从而在需要播放视频或显示图像时,可以根据文件格式相应进行播放或显示。
附图说明
图1是本发明实施例一的格式识别方法的流程示意图。
图2是本发明实施例一中拆分成的左右图像的示意图。
图3是本发明实施例一中拆分成的上下图像的示意图。
图4是本发明实施例一的第二个例子中获取左右、上下图像特征差异的示意图。
图5是本发明实施例一的格式识别方法在识别为3D格式后的流程示意图。
图6是本发明实施例二的格式识别装置的结构示意图。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一,一种视频格式的识别方法,如图1所示,包括:
200、将获取的待识别图像从中线处拆分成两个拆分图像;比较拆分而成的该两个拆分图像的表征图像的特征,得到两个拆分图像的图像特征差异;
300、根据所获得的两个拆分图像的图像特征差异确定所获取的待识别图像的显示格式,比如当所述图像特征差异满足预设条件时,识别为二维2D格式;当所述图像特征差异不满足预设条件时,识别为三维3D格式。
本实施例中,所述图像特征差异包括左右图像特征差异和上下图像特征差异;所述步骤200具体可以包括:
将获取的待识别图像沿左右中线处拆分成左图像和右图像(左图像和右图像为前述的两个拆分图像),比较所述左图像和右图像的表征图像的特征,得到左右图像特征差异;
或者,将获取的待识别图像沿上下中线处拆分成上图像和下图像(上图像和下图像为前述的两个拆分图像),比较所述上图像和下图像的表征图像的特征,得到上下图像特征差异。
本实施例中,所述表征图像的特征可以是表征图像颜色分布的特征;也可以是将拆分图像通过傅里叶变化转化到频域后的一些信息特征,例如:拆分图像在频域中的位置信息;还可以是其它能够表现出一个图像不同于其它图像的特征。
所述表征图像颜色分布的特征可以但不限于包括:图像的直方图、图像间的协方差、通过边缘提取得到的图像边缘点的颜色值的直方图、图像左右或上下中线两侧对应像素点颜色值的分布等。
本实施例中,所述预设条件根据所采用的表征图像的特征而设置。
比如所述表征图像的特征为表征图像颜色分布的特征值时,所述预设条件可以但不限于为大于一预定阈值。
再比如所述表征图像的特征为直方图时,所述预设条件可以但不限于为表示分布情况的信息。
所述预设条件可以通过对训练样本集进行统计分析得到,该训练样本集是多组已知格式的视频序列或图像序列;也可以通过经验值或仿真实验得到。
本实施例中,所获取的待识别图像可以是从别的设备接收到的图像,也可以是从视频采样得到的图像,还可以是预存好的图像等;如果该待识别图像属于视频,则待识别图像的格式即为该待识别图像所属视频的格式。
下面以两个具体的例子分别说明本实施例。在这两个例子中,表征图像的特征为表征图像颜色分布的特征值,所述图像特征差异包括左右图像特征差异和上下图像特征差异。与此相应地,前述步骤300中,所述图像特征差异满足预设条件是指:所述左右图像特征差异和所述上下图像特征差异均大于一预定阈值,即:当所述左右图像特征差异和上下图像特征差异均大于该预定阈值时,将该待识别图像识别为2D格式;当所述左右图像特征差异及上下图像特征差异中有至少一个不大于该预设阈值时,将该待识别图像识别为3D格式。
第一个例子中,所述步骤200中获取的是一幅待识别图像。
此时,步骤200具体可以包括:
210A、将获取的待识别图像沿左右中线处拆分成如图2所示的左图像21和右图像22,分别提取表征左图像21颜色分布的特征值,和表征右图像22颜色分布的特征值;计算表征所述左图像21、右图像22颜色分布的特征值的差,该差值的绝对值为所述左右图像特征差异;
220A、将获取的待识别图像沿上下中线处拆分成如图3所示的上图像31和下图像32,分别提取表征上图像31颜色分布的特征值,和表征下图像32颜色分布的特征值;计算表征所述上图像31、下图像32颜色分布的特征值的差,该差值的绝对值为上下图像特征差异。
上述步骤中,210A和220A的顺序不分先后。
第二个例子中,所述步骤200中获取的是多幅待识别图像。该多幅待识别图像比如是一段视频中的连续的多幅图像,也可以是对一段视频进行间隔采样获得的多幅图像。
此时,步骤200具体可以包括:
210B、对获取的多幅待识别图像(含n幅待识别图像)进行如图4所示的下述步骤:
对多幅待识别图像中的每一幅待识别图像,沿左右中线处拆分成如图2所示的左图像21和右图像22,分别提取表征所述左图像21颜色分布的特征值,和表征所述右图像22颜色分布的特征值,计算出这两个特征值的差值,该差值的绝对值为该幅待识别图像的左右差值;
对多幅待识别图像中的每一幅待识别图像,沿上下中线处拆分成如图3所示的上图像31和下图像32,分别提取表征所述上图像31颜色分布的特征值,和表征所述下图像32颜色分布的特征值,计算出这两个特征值的差值,该差值的绝对值为该幅待识别图像的上下差值;
上述步骤中,得到左右差值和上下差值的顺序不分先后。
得到每一幅待识别图像的左右差值和上下差值后进行220B;
220B、如图4所示,计算各幅待识别图像的左右差值的平均值,作为所述左右图像特征差异;计算各幅待识别图像的上下差值的平均值,作为所述上下图像特征差异。
本实施例中,当步骤300中识别为3D格式时,所述方法如图5所示,还可以进一步包括:
400、当所述左右图像特征差异小于所述上下图像特征差异时,识别为左右格式;当所述上下图像特征差异小于所述左右图像特征差异时,识别为上下格式。
当识别为左右格式时,虽然拆分而成的左图像和右图像不完全一样,存在一定的偏移,但是整体的特征(比如颜色分布)是一样的。因此,若左图像和右图像的颜色分布一致,则从左图像和右图像提取到的表征图像的特征差异较小。相应的,当为上下格式时,从上图像和下图像提取到的表征图像的特征差异较小。
本实施例中,所述方法的步骤400后还可以进一步包括:
500、确定显示次序。
具体地,根据所假定的显示次序,提取所述两个拆分图像中的特征点进行匹配获得多个匹配结果,所述待识别图像从中心到四周的特征点的匹配结果表现出逐渐增大的变化趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
或者,也可以根据所假定的显示次序,将所述两个拆分图像中的其中一个拆分图像向另一个拆分图像进行移动获得所述两个拆分图像的多个协方差,所述多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
本实施例中,对于将待识别图像拆分成左图像和右图像这两个拆分图像,步骤500可以但不限于包括以下两种实现方案。
第一种实现方案中,步骤500如图5所示,具体可以包括以下步骤:
510A、假定拆分得到的两个拆分图像的显示次序,即:假定拆分得到的两个拆分图像中的一幅为显示次序在左的图像,另一幅为显示次序在右的图像;
520A、分别提取两个拆分图像中的特征点并进行匹配,得到多个匹配结果;
530A、如果从待识别图像的中心到四周的特征点的匹配结果表现出逐渐增大的变化趋势,则确定两个拆分图像的显示次序为步骤510A中假定的显示次序;否则确定两个拆分图像的显示次序与步骤510A中假定的相反,即假定显示次序在左的拆分图像实际应当显示在右,假定显示次序在右的拆分图像实际应当显示在左。
这样可以在已知视频或图像是左右或者上下格式的前提下,判断拆分成的两个拆分图像哪幅显示在左哪幅显示在右(在实际应用中通常称为“左右次序”);比如一般的3D电影中画面的中间是一些比较重要的人物或者物体,它们一般都是负视差,对于处在画面周围的背景,一般都用正视差来表示。因此,分析对两两对应的特征点进行匹配所得到的离散的稀疏匹配结果,如果画面中心点附近的视差为负,画面四周的视差为正,存在一个从负最大到正最大的变化趋势,则认为此时的图像次序是对的。实际应用时,只要匹配结果有这种从小到大的变化趋势,而并不一定严格要求中间为负,附近为正。
第二种实现方案中,步骤500具体可以包括以下步骤:
510B、同步骤510A;
520B、将假定显示次序在右的拆分图像每次向左移动一或多列后计算所述两个拆分图像的协方差;返回步骤520B,直到得到多个协方差;
530B、若所述多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定两个拆分图像的显示次序为步骤510B中假定的显示次序;否则确定两个拆分图像的显示次序与步骤510B中假定的相反,即假定显示次序在左的拆分图像实际应当显示在右,假定显示次序在右的拆分图像实际应当显示在左。
对于将待识别图像拆分成上图像和下图像这两个拆分图像,步骤500也可以借鉴但不限于类似于上述将待识别图像拆分成上图像和下图像这两个拆分图像的实现方案。
具体地,第一种实现方案是,假定上图像和下图像的显示次序后,提取上图像和下图像中的特征点进行匹配获得多个匹配结果,如果待识别图像从中心到四周的特征点的匹配结果表现出逐渐增大的变化趋势,则确定上图像和下图像的显示次序为所假定的显示次序,否则确定上图像和下图像的显示次序与所假定的显示次序相反。
第二种实现方案是,假定上图像和下图像的显示次序后,将上图像和下图像中的其中一个向另一个以一行或者几行的方式进行移动,获得上图像和下图像的多个协方差;该多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定上图像和下图像的显示次序为所假定的显示次序,否则确定上图像和下图像的显示次序与所假定的显示次序相反。
实际应用中,也可以采用其它方案来判断图像的显示次序。
如果步骤200中获取的是多幅待识别图像,在步骤500中可任选一幅待识别图像来判断显示次序,并将所选择的该幅待识别图像的显示次序作为该多幅待识别图像的显示次序。
本实施例中,所述步骤200前还可以包括:
100、对获取的待识别图像进行如下处理中的至少一种:
图像下采样、空间域图像增强、频域图像增强、图像去噪(噪声去除)以及图像分割等。
如此处理可以使得待识别图像中不利于格式判断的信息部分或者全部剔除,并使待识别图像中有利于格式判断的信息得以保留。这样可加快后续的处理速度,节约处理时间,提高处理效率。
其中图像下采样可以但不限于是指将图像尺寸大于预定值的待识别图像缩放到预设的标准尺寸,对于尺寸小于预设的标准尺寸的待识别图像,可以采用原始尺寸进行处理。
空间域图像增强包括但不限于平滑空间滤波或者锐化空间滤波等方法。
频域图像增强包括但不限于傅里叶变换或者同态滤波等方法。
图像去噪的方法包括但不限于均值滤波或者维纳滤波等方法。
图像分割包含但不限于均值漂移或者基于图论的分割等方法。
实施例二、一种格式识别装置
结合图1至图5所示的实施例一,如图6所示,本实施例的格式识别装置主要包括拆分模块610、比较模块620以及判决模块630,其中:
拆分模块610,用于将获取的待识别图像沿中线拆分,得到两个拆分图像;
比较模块620,与拆分模块610相连,用于比较所述两个拆分图像的表征图像的特征,获得所述两个拆分图像的图像特征差异;
判决模块630,与比较模块620相连,用于根据所获得所述两个拆分图像的图像特征差异确定所述获取的待识别图像的显示格式。
上述拆分模块610,用于将所述待识别图像沿左右中线拆分,得到左图像和右图像这两个拆分图像;以及用于将所述待识别图像沿上下中线拆分,得到上图像和下图像这两个拆分图像。
上述比较模块620包括提取单元及计算单元,其中:
所述提取单元用于分别提取表征所述左图像和右图像的颜色分布的特征值,以及用于分别提取表征所述上图像和下图像的颜色分布的特征值;
所述计算单元用于计算出表征所述左图像和右图像的颜色分布的两个特征值的差值,将该差值的绝对值作为左右图像特征差异;以及用于计算出表征所述上图像和下图像的颜色分布的两个特征值的差值,将该差值的绝对值作为上下图像特征差异;
其中,所述图像特征差异包括所述左右图像特征差异和所述上下图像特征差异。
上述计算单元用于对多幅待识别图像中的每一幅待识别图像,分别计算出表征所述左图像和右图像的颜色分布的特征值的差值,将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述左右图像特征差异;以及,用于对所述多幅待识别图像中的每一幅待识别图像,计算出表征所述上图像和下图像的颜色分布的特征值的差值,将所述多幅待识别图像的该差值的绝对值的平均值作为所述多幅待识别图像的所述上下图像特征差异。
上述判决模块630,用于当所述左右图像特征差异和所述上下图像特征差异均大于一预定阈值时,确定所述待识别图像为二维格式;否则,确定所述待识别图像为三维格式。
如图6所示,该装置还可以包括:
识别模块640,与判决模块630相连,用于所述判决模块630判断出所述待识别图像为三维格式后,在所述左右图像特征差异小于所述上下图像特征差异时,将所述待识别图像识别为左右格式;以及所述上下图像特征差异小于所述左右图像特征差异时,将所述待识别图像识别为上下格式。
该装置还可以包括:
假定模块,用于假定两个拆分图像的显示次序;
获取模块,用于根据所假定的显示次序,提取所述两个拆分图像中的特征点进行匹配获得多个匹配结果;
确定模块,用于所述待识别图像从中心到四周的特征点的所述多个匹配结果表现出逐渐增大的变化趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
或者,
该假定模块,用于假定两个拆分图像的显示次序;
该获取模块,用于根据所假定的显示次序,将所述两个拆分图像中的其中一个拆分图像向另一个拆分图像进行移动获得所述两个拆分图像的多个协方差;以及
该确定模块,用于所述多个协方差按照计算的顺序表现出逐渐增大的趋势,则确定所述两个拆分图像的显示次序为所假定的显示次序,否则确定所述两个拆分图像的显示次序与所假定的显示次序相反。
如图6所示,该装置还可以包括:
预处理模块650,与拆分模块610相连,用于在所述拆分模块610将所述待识别图像沿中线拆分前,对所述待识别图像进行如下处理中的至少一种:
图像下采样、空间域图像增强、频域图像增强、图像去噪及图像分割。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明的权利要求的保护范围。