CN102547344A

CN102547344A - 一种视频格式识别方法及装置

Info

Publication number: CN102547344A
Application number: CN2011104420018A
Authority: CN
Inventors: 吴美芬; 邵诗强
Original assignee: TCL Corp
Current assignee: TCL Corp
Priority date: 2011-12-23
Filing date: 2011-12-23
Publication date: 2012-07-04
Anticipated expiration: 2031-12-23
Also published as: CN102547344B

Abstract

本发明适用于图像处理领域，提供了一种视频格式识别方法及装置，所述方法包括：将一幅视频帧转换为灰度图像；根据不同的图像像素排列方式分别对所述灰度图像进行拆分，所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像；计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度；根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。通过本发明播放器可以准确的识别出多种3D视频的视频格式，顺利进行视频解析，播放器的性能得到进一步提高，给用户使用带来方便。

Description

一种视频格式识别方法及装置

技术领域

本发明属于图像处理领域，尤其涉及一种视频格式识别方法及装置。

背景技术

人的视觉之所以能分辨远近，是靠两只眼睛的差距，一只眼睛虽然能看到物体，但对物体远近的距离却不易分辨。人的两眼距离约5公分，两只眼睛除了瞄准正前方以外，看任何一样东西，两眼的角度都不会相同。虽然差距很小，但经视网膜传到大脑后，大脑用这微小的差距，产生远近的深度，从而产生立体感。立体3D就是根据这一原理，把同一景象，用两只眼睛视角的差距制造出两个影像，然后让两只眼睛看到自己一边的影像，透过视网膜使大脑产生景深的立体感。

结合以上原理，目前，常见的3D片源传输格式主要有以下六种：

1帧连续格式(frame sequence)：连续发送图像，比如60Hz的影片，就以120Hz的速度交替发送左右眼图像，并交替显示出来，依次针对左/右眼接收。

2隔行格式：将左、右眼图像在垂直方向上按行交错排列。

3隔列格式：将左、右眼图像在水平方向上按列交错排列。

4棋盘格式(checkerboard)：在棋盘式3D格式中，左眼和右眼的图像被交织，也就是每相隔一个像素存放左眼或右眼图像。和国际象棋棋盘的方格很像，因此叫做棋盘式。

5左右格式(side-by-side)：将左、右眼图像压进一帧图像中，按左右排列。

6上下格式：将左、右眼图像压进一帧图像中，按上下排列。

其中，左右格式还可以包括以下两种：

全宽左右格式(full-side-by-side)：将左、右眼图像分辨率高宽不变，压进一帧图像中，按左右排列。

半宽左右格式(half-side-by-side)：左、右眼图像均在水平方向上压缩一半，压进一帧图像中，按左右排列。

左右格式还可以包括以下两种：

半宽上下格式(top-and-bottom)：在这种格式中，左、右眼图像按上下排列方式压缩到一帧图像中，左、右眼图像均在垂直方向上压缩为一半。

帧封装(frame packing)：为了保证数据完整性，将左、右眼图像按上下方式排列。标准规定为区别左、右眼图像，在左、右眼图像之间包含一个空白区域。

综上可知，3D视频具有格式多样的特点，现有技术中，由于播放器不能够自动识别各种3D视频格式，在对不种格式的3D视频进行解析时难免遇到阻碍。

发明内容

本发明的目的在于提供一种视频格式识别方法及装置，旨在解决现有技术由于播放器不能够自动识别各种3D视频格式，遇到解析阻碍时给用户带来不便的问题。

本发明是这样实现的，一种视频格式识别方法，所述方法包括：

将一幅视频帧转换为灰度图像；

根据不同的图像像素排列方式分别对所述灰度图像进行拆分，所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像；

计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度；

根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。

具体地，所述图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式，所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式。

具体地，所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。

具体地，所述左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5，根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为：

当NCC1-NCC4＞b且NCC1、NCC2、NCC3均大于c时，所述视频帧的视频格式为左右格式；

当NCC4-NCC1＞b且NCC4、NCC5均大于d时，所述视频帧的视频格式为上下格式；

其中，b、c、d为根据实验数据预设的阈值。

具体地，所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤之前，所述方法还包括：

计算灰度图像的宽高比；

所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为：

根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。

具体地，所述灰度图像的宽高比为Q，所述左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4，所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为：

当NCC1、NCC4均小于a时：

如果1≤Q≤2，则所述视频帧的视频格式为帧连续格式；

如果Q＜1，则所述视频帧的视频格式为隔行格式；

如果Q＞2，将所述隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6，将所述棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7，若NCC6＞NCC7，则所述视频帧的视频格式为棋盘格式，否则所述视频帧的视频格式为隔列格式；

其中，a为根据实验数据预设的阈值。

具体地，所述左右格式包括全宽左右格式和半宽左右格式，所述上下格式包括帧封装格式和半高上下格式，所述灰度图像的宽高比为Q，所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤还包括：

当所述视频帧的视频格式为左右格式时，如果Q＞2，则所述视频帧的视频格式为全宽左右格式，否则所述视频帧的视频格式为半宽左右格式；

当所述视频帧的视频格式为上下格式时，如果Q＜1，则所述视频帧的视频格式为帧封装格式，否则所述视频帧的视频格式为半高上下格式。

本发明的另一目的在于提供一种视频格式识别装置，所述装置包括：

灰度转换单元，用于将一幅视频帧转换为灰度图像；

拆分单元，用于根据不同的图像像素排列方式分别对所述灰度转换单元转换的灰度图像进行拆分，所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像；

相似度计算单元，用于计算所述拆分单元拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度；

识别单元，用于根据所述相似度计算单元计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。

具体地，所述图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式；所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式，所述左右格式包括全宽左右格式和半宽左右格式，所述上下格式包括帧封装格式和半高上下格式；所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。

具体地，所述装置还包括：

宽高比计算单元，用于计算所述灰度转换单元转换得到的灰度图像的宽高比。

在本发明中，通过视频帧转换为灰度图像，根据不同的图像像素排列方式分别对所述灰度图像进行拆分，所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像，计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度，并根据相似度判断所述视频帧的视频格式，从而播放器可以准确的识别出多种3D视频的视频格式，顺利进行视频解析，播放器的性能得到进一步提高，也给用户带来方便。

附图说明

图1是本发明实施例一提供的视频格式识别方法的实现流程图；

图2是本发明实施例二提供的视频格式识别方法的实现流程图；

图3(a)、(b)示出了发明实施例二提供的视频格式识别方法中左眼图像和右眼图像示意图；

图4是本发明实施例三提供的视频格式识别方法的实现流程图；

图5是本发明实施例四提供的视频格式识别装置的组成结构图；

图6是本发明实施例五提供的视频格式识别装置的组成结构图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例一：

图1示出了本发明实施例一提供的视频格式识别方法的实现流程，该方法过程详述如下：

在步骤S101中，将一幅视频帧转换为灰度图像；

如果是一段视频，可以抽取其中任意一幅视频帧，将其转换为灰度图像。

在步骤S102中，根据不同的图像像素排列方式分别对灰度图像进行拆分，灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。

根据3D视频帧左、右眼图像内容相近这个特点，对排列格式未知的3D视频帧按照不同图像像素排列方式分离出2幅图像，并将其分别标记为左眼图像和右眼图像。

常用的3D视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式，在本实施例中，为了实现尽可能多3D视频格式的识别，需要对未知排列格式的3D视频帧按照尽可能多的图像像素排列方式分别进行拆分，采用的图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式。

在步骤S103中，计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度。

计算左眼图像和右眼图像的相似度可以有多种方法，例如，直方图匹配，在本实施例中，图像像素排列方式对应的左眼图像和右眼图像的相似度用归一化互相关系数表示ncc表示，归一化互相关系数ncc(r，c)为：

ncc (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} \frac{t (u, v) - m_{t}}{\sqrt{s_{t}^{2}}} \cdot \frac{f (r + u, c + v) - m_{f} (r, c)}{\sqrt{s_{f}^{2} (r, c)}}

式中，

m_{t} = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} t (u, v)

s_{t}^{2} = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} {(t (u, v) - m_{t})}^{2}

m_{f} (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} f (r + u, c + v)

s_{f}^{2} (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} {(f (r + u, c + v) - m_{f} (r, c))}^{2}

其中，u×v表示匹配模板的大小，t(u，v)为模板内像素的灰度值，m_t和

分别是模板内所有点的平均灰度值与方差，f(r+u，c+v)为平移到位置点(r，c)时感兴趣区域(ROI)内像素的灰度值，即m_f(r，c)和分别是ROI中所有点的平均灰度值与方差。

如果一对左眼图像和右眼图像越相似，其ncc值越接近1；而当某一对左眼图像和右眼图像对应的图像像素排列方式与视频帧的视频格式相匹配时，则该图像像素排列方式对应的左眼图像与右眼图像的ncc值也会比较高，因此，便可识别出所输入的视频帧的视频格式。

在步骤104中，根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。

通过计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度，就可以判别视频帧的视频格式是否为左右格式和上下格式的一种，具体如下：

假设计算的左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系系数分别为NCC1、NCC2、NCC3、NCC4、NCC5，则：

当NCC1-NCC4＞b且NCC1、NCC2、NCC3均大于c时，判断视频帧的视频格式为左右格式；

当NCC4-NCC1＞b且NCC4、NCC5均大于d时，判断视频帧的视频格式为上下格式；

其中，b、c、d为根据实验数据预设的阈值。所述b为当视频格式为左右格式时NCC1-NCC4所得实验数据及当视频格式为上下格式时NCC4-NCC1所得实验数据的数据范围内取值；c为根据实验数据NCC1、NCC2、NCC3数值范围内取小值；d为根据实验数据NCC4、NCC5数值范围内取小值。

NCC1与NCC4的差值大于设定的阈值b，说明按左右排列方式拆分得到的一对左眼图像和右眼图像的相似度较高，而按上下排列方式拆分得到的一对左眼图像和右眼图像的相似度很低，相反的，NCC4与NCC1的差值大于设定的阈值b，则说明按左右排列方式拆分得到的一对左眼图像和右眼图像的相似度很低，而按上下排列方式拆分得到的一对左眼图像和右眼图像的相似度较高。

而NCC1、NCC2、NCC3是否均大于阈值c和NCC4、NCC5是否均大于d是为了排除视频帧的视频格式是否为帧连续格式、隔行格式、隔列格式、棋盘格式的一种。

实施例二：

仅凭相似度仅能识别部分3D视频的视频格式，为了能够识别更多的3D视频的视频格式判定出的视频格式，本实施例加入一个辅助判断条件——灰度图像的宽高比，即视频帧的宽高比。

图2示出了本发明实施例二提供的视频格式识别方法的实现流程，该方法过程详述如下：

在步骤S201中，将一幅视频帧转换为灰度图像；

在步骤S202中，根据不同的图像像素排列方式分别对灰度图像进行拆分，灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。

在步骤S203中，计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度。

在步骤204中，计算灰度图像的宽高比。

在步骤205中，根据灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。

在本实施例中，根据左右排列方式、上下排列方式对应的左眼图像和右眼图像的相似度，以及灰度图像的宽高比就可以识别3D视频的视频格式是否为帧连续格式，隔行格式、棋盘格式、隔列格式中的一种。

根据实验数据预设的阈值a，a为根据实验数据NCC1、NCC4数值范围内取大值。当NCC1、NCC4都小于a，说明按左右排列方式、上下排列方式拆分出来的左眼图像和右眼图像的相似度很低，视频帧的视频格式不是左右格式，也不是上下格式，只可能为隔列格式、隔行格式、棋盘格式或者帧连续格式中的一种。

鉴于标准高清格式为720p和1080p，其分辨率分别为1280*720及1920*1080，如果视频帧为隔列格式或棋盘格式，那么其分辨率将在水平方向上增加1倍；如果视频帧为隔行格式，那么其分辨率在垂直方向上增加1倍；如果为帧连续格式，其分辨率不改变。通过判断灰度图像的宽高比(即视频帧的宽高比)来区分出以上几种可能。即如果宽高比大于2，则视频帧为隔列格式、棋盘格格式中的一种；如果宽高比小于1，则将视频帧判定为隔行格式，宽高比小于或等于2且大于或等于1，则将结果视频帧判定为帧连续格式。

图3(a)、(b)示出了发明实施例二提供的视频格式识别方法中左眼图像和右眼图像示意图。

若视频帧为隔列格式，则按隔列排列方式拆分得到的左眼图像如图3(a)所示，而按棋盘排列方式拆分得到的左眼图像1如图3(b)所示；反之，若视频帧为棋盘格式，则按隔列排列方式拆分得到的左眼图像如图3(b)所示，按棋盘排列方式拆分得到的左眼图像如图3(a)所示。其中，白色为实际左眼画面内容，黑色为实际右眼画面内容。为了区分隔列格式和棋盘格格式，还需要对拆分出的左眼图像继续拆分。

综上，可以步骤S205具体为：

假设灰度图像的宽高比为Q，左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4，则：

当NCC1、NCC4均小于a时：

如果1≤Q≤2，判断视频帧的视频格式为帧连续格式；

如果Q＜1，判断视频帧的视频格式为隔行格式；

如果Q＞2，将隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6，将棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7，若NCC6＞NCC7，则判断视频帧的视频格式为棋盘格式，否则判断视频帧的视频格式为隔列格式。

实施例三：

图4示出了本发明实施例三提供的视频格式识别方法的实现流程。

在本实施例中，图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式，视频格式包括帧连续格式(framesequence)、左右格式(side-by-side)、上下格式、隔行格式、隔列格式、棋盘格式(checkerboard)。其中左右格式还进一步包括全宽左右格式(full-side-by-side)和半宽左右格式(half-side-by-side)，上下格式进一步包括帧封装格式(frame packing)和半高上下格式(top-and-bottom)。

当视频帧的视频格式确定为左右格式时，关于左右格式中的全宽左右格式和半宽左右格式，由于两者的分辨率差别较大，两者的宽高比有较大区别，如果宽高比大于2，则将视频帧判定为全宽左右格式；否则将判定半宽左右格式。

当视频帧的视频格式确定为上下格式时，关于上下格式中的帧封装格式和半高上下格式，由于半高上下格式在垂直方向上分辨率压缩了一半，两者的宽高比有较大区别，如果宽高比小于1，则将视频帧判定为帧封装格式；否则将判定为半高上下格式。

假设左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5，隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，得到左眼图像和右眼图像的归一化互相关系数NCC6，棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，得到左眼图像和右眼图像的归一化互相关系数NCC7，根据实验数据预设阈值a、b、c、d，具体取值范围参见实施例一和二，灰度图像的宽高比为Q，该方法过程详述如下：

在步骤S401中，输入视频，将一幅视频帧转换为灰度图像；

在步骤S402中，根据不同的图像像素排列方式分别对灰度图像进行拆分，灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。

在步骤S403中，计算NCC1、NCC2、NCC3、NCC4、NCC5和Q。

在步骤S404中，判断NCC1、NCC4是否均小于a，是则执行步骤S405，否则执行步骤S406；

在步骤S405中，判断Q是否大于2，是则执行步骤S407，否则执行步骤S411；

在步骤S406中，判断NCC1、NCC2、NCC3是否均大于c且NCC1-NCC4＞b，是则执行步骤S414，否则执行步骤S418；

在步骤S407中，计算NCC6、NCC7；

在步骤S408中，判断NCC6是否大于NCC7，是则执行步骤S409，否则执行步骤S410；

在步骤S409中，判定视频格式为隔列格式；

在步骤S410中，判定视频格式为棋盘格式；

在步骤S411中，判断Q是否小于1，是则执行步骤S412，否则执行步骤S413；

在步骤S412中，判定视频格式为隔行格式；

在步骤S413中，判定视频格式为帧连续格式；

在步骤S414中，判定视频格式为左右格式，并执行步骤S415；

在步骤S415中，判断Q是否大于2，是则执行步骤S416，否则执行步骤S417；

在步骤S416中，判定视频格式为全宽左右格式；

在步骤S417中，判定视频格式为半宽左右格式；

在步骤S418中，判断NCC4、NCC5是否均d，且NCC4-NCC1大于b，是则执行步骤S419，否则执行步骤S423；

在步骤S419中，判定视频格式为上下格式，并执行步骤S420；

在步骤S420中，判断Q是否小于1，是则执行步骤S421，否则执行步骤S422；

在步骤S421中，判定视频格式为帧封装格式；

在步骤S422中，判定视频格式为半高上下格式

在步骤S423中，待继续判定，并重新执行步骤S401。

实施例四：

图5示出了本发明实施例四提供的视频格式识别装置的组成结构，为了便于说明，仅示出了与本发明实施例相关的部分。

该视频格式识别装置可以是运行于显示终端内的硬件单元或者软硬件相结合的单元。

该手部运动检测装置包括灰度转换单元11、拆分单元12、相似度计算单元13、识别单元14。其中，各单元的具体功能如下：

灰度转换单元11，用于将一幅视频帧转换为灰度图像；

拆分单元12，用于根据不同的图像像素排列方式分别对灰度转换单元11转换的灰度图像进行拆分，灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像；

相似度计算单元13，用于计算拆分单元12拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度；

识别单元14，用于根据相似度计算单元13计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。

在本实施例中，图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式，该装置可识别的视频格式包括左右格式、上下格式。图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。其中归一化互相关系数ncc(r，c)为：

ncc (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} \frac{t (u, v) - m_{t}}{\sqrt{s_{t}^{2}}} \cdot \frac{f (r + u, c + v) - m_{f} (r, c)}{\sqrt{s_{f}^{2} (r, c)}}

式中，

m_{t} = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} t (u, v)

s_{t}^{2} = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} {(t (u, v) - m_{t})}^{2}

m_{f} (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} f (r + u, c + v)

s_{f}^{2} (r, c) = \frac{1}{n} \underset{(u, v) &Element; T}{Σ} {(f (r + u, c + v) - m_{f} (r, c))}^{2}

分别是模板内所有点的平均灰度值与方差，f(r+u，c+v)为平移到位置点(r，c)时感兴趣区域(ROI)内像素的灰度值，即m_f(r，c)和

分别是ROI中所有点的平均灰度值与方差。

其中，b、c、d为根据实验数据预设的阈值。

本实施例提供的视频格式识别装置可以使用在前述对应的视频格式识别方法，详情参见上述视频格式识别方法实施例一的相关描述，在此不再赘述。

实施例五：

图6示出了本发明实施例五提供的视频格式识别装置的组成结构，为了便于说明，仅示出了与本发明实施例相关的部分。

该手部运动检测装置包括灰度转换单元21、拆分单元22、相似度计算单元23、宽高比计算单元24和识别单元25。其中，各单元的具体功能如下：

灰度转换单元21，用于将一幅视频帧转换为灰度图像；

拆分单元22，用于根据不同的图像像素排列方式分别对灰度转换单元21转换的灰度图像进行拆分，灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像；

相似度计算单元23，用于计算拆分单元22拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度；

宽高比计算单元24，用于计算灰度转换单元21转换得到的灰度图像的宽高比；

识别单元25，用于根据宽高比计算单元24计算得到的图像的宽高比和相似度计算单元23计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。

在本实施例中，图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式，该装置可识别的视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式，其中，左右格式进一步包括全宽左右格式和半宽左右格式，上下格式进一步包括帧封装格式和半高上下格式。

在本实施例中，图像像素排列方式对应的左眼图像和右眼图像的相似度用归一化互相关系数表示，假设相似度计算单元计算的计算的左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系系数分别为NCC1、NCC2、NCC3、NCC4、NCC5，宽高比计算单元计算的灰度图像的宽高比为Q，a、b、c、d为根据实验数据预设的阈值，则识别单元25识别的具体过程如下：

当NCC1-NCC4＞b且NCC1、NCC2、NCC3均大于c时，视频帧的视频格式为左右格式，进一步地，当视频帧的视频格式确定为左右格式时，如果Q＞2，则视频帧的视频格式为全宽左右格式，否则视频帧的视频格式为半宽左右格式；

当NCC4-NCC1＞b且NCC4、NCC5均大于d时，视频帧的视频格式为上下格式，进一步地，当视频帧的视频格式确定为上下格式时，如果Q＜1，则视频帧的视频格式为帧封装格式，否则视频帧的视频格式为半高上下格式；

当NCC1、NCC4均小于a时：

如果1≤Q≤2，则视频帧的视频格式为帧连续格式；

如果Q＜1，则视频帧的视频格式为隔行格式；

如果Q＞2，将隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6，将棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分，计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7，若NCC6＞NCC7，则视频帧的视频格式为棋盘格式，否则视频帧的视频格式为隔列格式。

本实施例提供的视频格式识别装置可以使用在前述对应的视频格式识别方法，详情参见上述视频格式识别方法实施例二、三的相关描述，在此不再赘述。

本领域技术人员可以理解为上述实施例四至五所述装置所包括的各个单元只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

在本发明实施例中，通过视频帧转换为灰度图像，根据不同的图像像素排列方式分别对所述灰度图像进行拆分，所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像，计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度，并根据相似度判断所述视频帧的视频格式，从而播放器可以准确的识别出3D视频的视频格式，顺利进行视频解析，进一步提高播放器的性能，给用户带来方便。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如ROM/RAM、磁盘、光盘等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视频格式识别方法，其特征在于，所述方法包括：

将一幅视频帧转换为灰度图像；

2.如权利要求1所述的方法，其特征在于，所述图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式，所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式。

3.如权利要求1所述的方法，其特征在于，所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。

4.如权利要求2或3所述的方法，其特征在于，所述左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5，根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为：

其中，b、c、d为根据实验数据预设的阈值。

5.如权利要求2或3所述的方法，其特征在于，所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤之前，所述方法还包括：

计算灰度图像的宽高比；

6.如权利要求5所述的方法，其特征在于，所述灰度图像的宽高比为Q，所述左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4，所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为：

当NCC1、NCC4均小于a时：

如果1≤Q≤2，则所述视频帧的视频格式为帧连续格式；

如果Q＜1，则所述视频帧的视频格式为隔行格式；

其中，a为根据实验数据预设的阈值。

7.如权利要求5所述的方法，其特征在于，所述左右格式包括全宽左右格式和半宽左右格式，所述上下格式包括帧封装格式和半高上下格式，所述灰度图像的宽高比为Q，所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤还包括：

8.一种视频格式识别装置，其特征在于，所述方法包括：

灰度转换单元，用于将一幅视频帧转换为灰度图像；

9.如权利要求8所述的装置，其特征在于，所述图像像素排列方式包括：左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式；所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式，所述左右格式包括全宽左右格式和半宽左右格式，所述上下格式包括帧封装格式和半高上下格式；所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。

10.如权利要求8所述的装置，其特征在于，所述装置还包括：