CN102547344B - 一种视频格式识别方法及装置 - Google Patents
一种视频格式识别方法及装置 Download PDFInfo
- Publication number
- CN102547344B CN102547344B CN201110442001.8A CN201110442001A CN102547344B CN 102547344 B CN102547344 B CN 102547344B CN 201110442001 A CN201110442001 A CN 201110442001A CN 102547344 B CN102547344 B CN 102547344B
- Authority
- CN
- China
- Prior art keywords
- video
- eye image
- arrangement mode
- image
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 102100023702 C-C motif chemokine 13 Human genes 0.000 claims description 33
- 102100023700 C-C motif chemokine 16 Human genes 0.000 claims description 33
- 101100382872 Homo sapiens CCL13 gene Proteins 0.000 claims description 33
- 101100382876 Homo sapiens CCL16 gene Proteins 0.000 claims description 33
- 102100023705 C-C motif chemokine 14 Human genes 0.000 claims description 19
- 102100023703 C-C motif chemokine 15 Human genes 0.000 claims description 19
- 101100382874 Homo sapiens CCL14 gene Proteins 0.000 claims description 19
- 101100382875 Homo sapiens CCL15 gene Proteins 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000005538 encapsulation Methods 0.000 claims description 11
- 238000005194 fractionation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2213/00—Details of stereoscopic systems
- H04N2213/007—Aspects relating to detection of stereoscopic image format, e.g. for adaptation to the display format
Landscapes
- Image Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明适用于图像处理领域,提供了一种视频格式识别方法及装置,所述方法包括:将一幅视频帧转换为灰度图像;根据不同的图像像素排列方式分别对所述灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度;根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。通过本发明播放器可以准确的识别出多种3D视频的视频格式,顺利进行视频解析,播放器的性能得到进一步提高,给用户使用带来方便。
Description
技术领域
本发明属于图像处理领域,尤其涉及一种视频格式识别方法及装置。
背景技术
人的视觉之所以能分辨远近,是靠两只眼睛的差距,一只眼睛虽然能看到物体,但对物体远近的距离却不易分辨。人的两眼距离约5公分,两只眼睛除了瞄准正前方以外,看任何一样东西,两眼的角度都不会相同。虽然差距很小,但经视网膜传到大脑后,大脑用这微小的差距,产生远近的深度,从而产生立体感。立体3D就是根据这一原理,把同一景象,用两只眼睛视角的差距制造出两个影像,然后让两只眼睛看到自己一边的影像,透过视网膜使大脑产生景深的立体感。
结合以上原理,目前,常见的3D片源传输格式主要有以下六种:
1帧连续格式(frame sequence):连续发送图像,比如60Hz的影片,就以120Hz的速度交替发送左右眼图像,并交替显示出来,依次针对左/右眼接收。
2隔行格式:将左、右眼图像在垂直方向上按行交错排列。
3隔列格式:将左、右眼图像在水平方向上按列交错排列。
4棋盘格式(checkerboard):在棋盘式3D格式中,左眼和右眼的图像被交织,也就是每相隔一个像素存放左眼或右眼图像。和国际象棋棋盘的方格很像,因此叫做棋盘式。
5左右格式(side-by-side):将左、右眼图像压进一帧图像中,按左右排列。
6上下格式:将左、右眼图像压进一帧图像中,按上下排列。
其中,左右格式还可以包括以下两种:
全宽左右格式(full-side-by-side):将左、右眼图像分辨率高宽不变,压进一帧图像中,按左右排列。
半宽左右格式(half-side-by-side):左、右眼图像均在水平方向上压缩一半,压进一帧图像中,按左右排列。
左右格式还可以包括以下两种:
半宽上下格式(top-and-bottom):在这种格式中,左、右眼图像按上下排列方式压缩到一帧图像中,左、右眼图像均在垂直方向上压缩为一半。
帧封装(frame packing):为了保证数据完整性,将左、右眼图像按上下方式排列。标准规定为区别左、右眼图像,在左、右眼图像之间包含一个空白区域。
综上可知,3D视频具有格式多样的特点,现有技术中,由于播放器不能够自动识别各种3D视频格式,在对不种格式的3D视频进行解析时难免遇到阻碍。
发明内容
本发明的目的在于提供一种视频格式识别方法及装置,旨在解决现有技术由于播放器不能够自动识别各种3D视频格式,遇到解析阻碍时给用户带来不便的问题。
本发明是这样实现的,一种视频格式识别方法,所述方法包括:
将一幅视频帧转换为灰度图像;
根据不同的图像像素排列方式分别对所述灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度,所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数,其中图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,所述图像排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5;根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式,所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,所述视频帧的视频格式为左右格式,当NCC4-NCC1>b且NCC4、NCC5均大于d时,所述视频帧的视频格式为上下格式,其中,b、c、d为根据实验数据预设的阈值。
具体地,所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤之前,所述方法还包括:
计算灰度图像的宽高比;
所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为:
根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式。
具体地,所述灰度图像的宽高比为Q,所述左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4,所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为:
当NCC1、NCC4均小于a时:
如果1≤Q≤2,则所述视频帧的视频格式为帧连续格式;
如果Q<1,则所述视频帧的视频格式为隔行格式;
如果Q>2,将所述隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6,将所述棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7,若NCC6>NCC7,则所述视频帧的视频格式为棋盘格式,否则所述视频帧的视频格式为隔列格式;
其中,a为根据实验数据预设的阈值。
具体地,所述左右格式包括全宽左右格式和半宽左右格式,所述上下格式包括帧封装格式和半高上下格式,所述灰度图像的宽高比为Q,所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤还包括:
当所述视频帧的视频格式为左右格式时,如果Q>2,则所述视频帧的视频格式为全宽左右格式,否则所述视频帧的视频格式为半宽左右格式;
当所述视频帧的视频格式为上下格式时,如果Q<1,则所述视频帧的视频格式为帧封装格式,否则所述视频帧的视频格式为半高上下格式。
本发明的另一目的在于提供一种视频格式识别装置,所述装置包括:
灰度转换单元,用于将一幅视频帧转换为灰度图像;
拆分单元,用于根据不同的图像像素排列方式分别对所述灰度转换单元转换的灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
相似度计算单元,用于计算所述拆分单元拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度,所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数,其中图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,所述图像排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5;
识别单元,用于根据所述相似度计算单元计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式,所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,所述视频帧的视频格式为左右格式,当NCC4-NCC1>b且NCC4、NCC5均大于d时,所述视频帧的视频格式为上下格式,其中,b、c、d为根据实验数据预设的阈值。
具体地,所述装置还包括:
宽高比计算单元,用于计算所述灰度转换单元转换得到的灰度图像的宽高比。
在本发明中,通过视频帧转换为灰度图像,根据不同的图像像素排列方式分别对所述灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像,计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度,并根据相似度判断所述视频帧的视频格式,从而播放器可以准确的识别出多种3D视频的视频格式,顺利进行视频解析,播放器的性能得到进一步提高,也给用户带来方便。
附图说明
图1是本发明实施例一提供的视频格式识别方法的实现流程图;
图2是本发明实施例二提供的视频格式识别方法的实现流程图;
图3(a)、(b)示出了发明实施例二提供的视频格式识别方法中左眼图像和右眼图像示意图;
图4是本发明实施例三提供的视频格式识别方法的实现流程图;
图5是本发明实施例四提供的视频格式识别装置的组成结构图;
图6是本发明实施例五提供的视频格式识别装置的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了本发明实施例一提供的视频格式识别方法的实现流程,该方法过程详述如下:
在步骤S101中,将一幅视频帧转换为灰度图像;
如果是一段视频,可以抽取其中任意一幅视频帧,将其转换为灰度图像。
在步骤S102中,根据不同的图像像素排列方式分别对灰度图像进行拆分,灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。
根据3D视频帧左、右眼图像内容相近这个特点,对排列格式未知的3D视频帧按照不同图像像素排列方式分离出2幅图像,并将其分别标记为左眼图像和右眼图像。
常用的3D视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,在本实施例中,为了实现尽可能多3D视频格式的识别,需要对未知排列格式的3D视频帧按照尽可能多的图像像素排列方式分别进行拆分,采用的图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式。
在步骤S103中,计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度。
计算左眼图像和右眼图像的相似度可以有多种方法,例如,直方图匹配,在本实施例中,图像像素排列方式对应的左眼图像和右眼图像的相似度用归一化互相关系数表示ncc表示,归一化互相关系数ncc(r,c)为:
式中,
其中,u×v表示匹配模板的大小,t(u,v)为模板内像素的灰度值,mt和分别是模板内所有点的平均灰度值与方差,f(r+u,c+v)为平移到位置点(r,c)时感兴趣区域(ROI)内像素的灰度值,即mf(r,c)和分别是ROI中所有点的平均灰度值与方差。
如果一对左眼图像和右眼图像越相似,其ncc值越接近1;而当某一对左眼图像和右眼图像对应的图像像素排列方式与视频帧的视频格式相匹配时,则该图像像素排列方式对应的左眼图像与右眼图像的ncc值也会比较高,因此,便可识别出所输入的视频帧的视频格式。
在步骤104中,根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。
通过计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度,就可以判别视频帧的视频格式是否为左右格式和上下格式的一种,具体如下:
假设计算的左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系系数分别为NCC1、NCC2、NCC3、NCC4、NCC5,则:
当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,判断视频帧的视频格式为左右格式;
当NCC4-NCC1>b且NCC4、NCC5均大于d时,判断视频帧的视频格式为上下格式;
其中,b、c、d为根据实验数据预设的阈值。所述b为当视频格式为左右格式时NCC1-NCC4所得实验数据及当视频格式为上下格式时NCC4-NCC1所得实验数据的数据范围内取值;c为根据实验数据NCC1、NCC2、NCC3数值范围内取小值;d为根据实验数据NCC4、NCC5数值范围内取小值。
NCC1与NCC4的差值大于设定的阈值b,说明按左右排列方式拆分得到的一对左眼图像和右眼图像的相似度较高,而按上下排列方式拆分得到的一对左眼图像和右眼图像的相似度很低,相反的,NCC4与NCC1的差值大于设定的阈值b,则说明按左右排列方式拆分得到的一对左眼图像和右眼图像的相似度很低,而按上下排列方式拆分得到的一对左眼图像和右眼图像的相似度较高。
而NCC1、NCC2、NCC3是否均大于阈值c和NCC4、NCC5是否均大于d是为了排除视频帧的视频格式是否为帧连续格式、隔行格式、隔列格式、棋盘格式的一种。
实施例二:
仅凭相似度仅能识别部分3D视频的视频格式,为了能够识别更多的3D视频的视频格式判定出的视频格式,本实施例加入一个辅助判断条件——灰度图像的宽高比,即视频帧的宽高比。
图2示出了本发明实施例二提供的视频格式识别方法的实现流程,该方法过程详述如下:
在步骤S201中,将一幅视频帧转换为灰度图像;
在步骤S202中,根据不同的图像像素排列方式分别对灰度图像进行拆分,灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。
在步骤S203中,计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度。
在步骤204中,计算灰度图像的宽高比。
在步骤205中,根据灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。
在本实施例中,根据左右排列方式、上下排列方式对应的左眼图像和右眼图像的相似度,以及灰度图像的宽高比就可以识别3D视频的视频格式是否为帧连续格式,隔行格式、棋盘格式、隔列格式中的一种。
根据实验数据预设的阈值a,a为根据实验数据NCC1、NCC4数值范围内取大值。当NCC1、NCC4都小于a,说明按左右排列方式、上下排列方式拆分出来的左眼图像和右眼图像的相似度很低,视频帧的视频格式不是左右格式,也不是上下格式,只可能为隔列格式、隔行格式、棋盘格式或者帧连续格式中的一种。
鉴于标准高清格式为720p和1080p,其分辨率分别为1280*720及1920*1080,如果视频帧为隔列格式或棋盘格式,那么其分辨率将在水平方向上增加1倍;如果视频帧为隔行格式,那么其分辨率在垂直方向上增加1倍;如果为帧连续格式,其分辨率不改变。通过判断灰度图像的宽高比(即视频帧的宽高比)来区分出以上几种可能。即如果宽高比大于2,则视频帧为隔列格式、棋盘格格式中的一种;如果宽高比小于1,则将视频帧判定为隔行格式,宽高比小于或等于2且大于或等于1,则将结果视频帧判定为帧连续格式。
图3(a)、(b)示出了发明实施例二提供的视频格式识别方法中左眼图像和右眼图像示意图。
若视频帧为隔列格式,则按隔列排列方式拆分得到的左眼图像如图3(a)所示,而按棋盘排列方式拆分得到的左眼图像l如图3(b)所示;反之,若视频帧为棋盘格式,则按隔列排列方式拆分得到的左眼图像如图3(b)所示,按棋盘排列方式拆分得到的左眼图像如图3(a)所示。其中,白色为实际左眼画面内容,黑色为实际右眼画面内容。为了区分隔列格式和棋盘格格式,还需要对拆分出的左眼图像继续拆分。
综上,可以步骤S205具体为:
假设灰度图像的宽高比为Q,左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4,则:
当NCC1、NCC4均小于a时:
如果1≤Q≤2,判断视频帧的视频格式为帧连续格式;
如果Q<1,判断视频帧的视频格式为隔行格式;
如果Q>2,将隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6,将棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7,若NCC6>NCC7,则判断视频帧的视频格式为棋盘格式,否则判断视频帧的视频格式为隔列格式。
实施例三:
图4示出了本发明实施例三提供的视频格式识别方法的实现流程。
在本实施例中,图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,视频格式包括帧连续格式(framesequence)、左右格式(side-by-side)、上下格式、隔行格式、隔列格式、棋盘格式(checkerboard)。其中左右格式还进一步包括全宽左右格式(full-side-by-side)和半宽左右格式(half-side-by-side),上下格式进一步包括帧封装格式(frame packing)和半高上下格式(top-and-bottom)。
当视频帧的视频格式确定为左右格式时,关于左右格式中的全宽左右格式和半宽左右格式,由于两者的分辨率差别较大,两者的宽高比有较大区别,如果宽高比大于2,则将视频帧判定为全宽左右格式;否则将判定半宽左右格式。
当视频帧的视频格式确定为上下格式时,关于上下格式中的帧封装格式和半高上下格式,由于半高上下格式在垂直方向上分辨率压缩了一半,两者的宽高比有较大区别,如果宽高比小于1,则将视频帧判定为帧封装格式;否则将判定为半高上下格式。
假设左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5,隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,得到左眼图像和右眼图像的归一化互相关系数NCC6,棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,得到左眼图像和右眼图像的归一化互相关系数NCC7,根据实验数据预设阈值a、b、c、d,具体取值范围参见实施例一和二,灰度图像的宽高比为Q,该方法过程详述如下:
在步骤S401中,输入视频,将一幅视频帧转换为灰度图像;
在步骤S402中,根据不同的图像像素排列方式分别对灰度图像进行拆分,灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像。
在步骤S403中,计算NCC1、NCC2、NCC3、NCC4、NCC5和Q。
在步骤S404中,判断NCC1、NCC4是否均小于a,是则执行步骤S405,否则执行步骤S406;
在步骤S405中,判断Q是否大于2,是则执行步骤S407,否则执行步骤S411;
在步骤S406中,判断NCC1、NCC2、NCC3是否均大于c且NCC1-NCC4>b,是则执行步骤S414,否则执行步骤S418;
在步骤S407中,计算NCC6、NCC7;
在步骤S408中,判断NCC6是否大于NCC7,是则执行步骤S409,否则执行步骤S410;
在步骤S409中,判定视频格式为隔列格式;
在步骤S410中,判定视频格式为棋盘格式;
在步骤S411中,判断Q是否小于1,是则执行步骤S412,否则执行步骤S413;
在步骤S412中,判定视频格式为隔行格式;
在步骤S413中,判定视频格式为帧连续格式;
在步骤S414中,判定视频格式为左右格式,并执行步骤S415;
在步骤S415中,判断Q是否大于2,是则执行步骤S416,否则执行步骤S417;
在步骤S416中,判定视频格式为全宽左右格式;
在步骤S417中,判定视频格式为半宽左右格式;
在步骤S418中,判断NCC4、NCC5是否均d,且NCC4-NCC1大于b,是则执行步骤S419,否则执行步骤S423;
在步骤S419中,判定视频格式为上下格式,并执行步骤S420;
在步骤S420中,判断Q是否小于1,是则执行步骤S421,否则执行步骤S422;
在步骤S421中,判定视频格式为帧封装格式;
在步骤S422中,判定视频格式为半高上下格式
在步骤S423中,待继续判定,并重新执行步骤S401。
实施例四:
图5示出了本发明实施例四提供的视频格式识别装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该视频格式识别装置可以是运行于显示终端内的硬件单元或者软硬件相结合的单元。
该手部运动检测装置包括灰度转换单元11、拆分单元12、相似度计算单元13、识别单元14。其中,各单元的具体功能如下:
灰度转换单元11,用于将一幅视频帧转换为灰度图像;
拆分单元12,用于根据不同的图像像素排列方式分别对灰度转换单元11转换的灰度图像进行拆分,灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
相似度计算单元13,用于计算拆分单元12拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度;
识别单元14,用于根据相似度计算单元13计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。
在本实施例中,图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,该装置可识别的视频格式包括左右格式、上下格式。图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数。其中归一化互相关系数ncc(r,c)为:
式中,
其中,u′v表示匹配模板的大小,t(u,v)为模板内像素的灰度值,mt和分别是模板内所有点的平均灰度值与方差,f(r+u,c+v)为平移到位置点(r,c)时感兴趣区域(ROI)内像素的灰度值,即mf(r,c)和分别是ROI中所有点的平均灰度值与方差。
假设计算的左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系系数分别为NCC1、NCC2、NCC3、NCC4、NCC5,则:
当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,判断视频帧的视频格式为左右格式;
当NCC4-NCC1>b且NCC4、NCC5均大于d时,判断视频帧的视频格式为上下格式;
其中,b、c、d为根据实验数据预设的阈值。
本实施例提供的视频格式识别装置可以使用在前述对应的视频格式识别方法,详情参见上述视频格式识别方法实施例一的相关描述,在此不再赘述。
实施例五:
图6示出了本发明实施例五提供的视频格式识别装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该视频格式识别装置可以是运行于显示终端内的硬件单元或者软硬件相结合的单元。
该手部运动检测装置包括灰度转换单元21、拆分单元22、相似度计算单元23、宽高比计算单元24和识别单元25。其中,各单元的具体功能如下:
灰度转换单元21,用于将一幅视频帧转换为灰度图像;
拆分单元22,用于根据不同的图像像素排列方式分别对灰度转换单元21转换的灰度图像进行拆分,灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
相似度计算单元23,用于计算拆分单元22拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度;
宽高比计算单元24,用于计算灰度转换单元21转换得到的灰度图像的宽高比;
识别单元25,用于根据宽高比计算单元24计算得到的图像的宽高比和相似度计算单元23计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式。
在本实施例中,图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,该装置可识别的视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,其中,左右格式进一步包括全宽左右格式和半宽左右格式,上下格式进一步包括帧封装格式和半高上下格式。
在本实施例中,图像像素排列方式对应的左眼图像和右眼图像的相似度用归一化互相关系数表示,假设相似度计算单元计算的计算的左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式对应的左眼图像和右眼图像的归一化互相关系系数分别为NCC1、NCC2、NCC3、NCC4、NCC5,宽高比计算单元计算的灰度图像的宽高比为Q,a、b、c、d为根据实验数据预设的阈值,则识别单元25识别的具体过程如下:
当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,视频帧的视频格式为左右格式,进一步地,当视频帧的视频格式确定为左右格式时,如果Q>2,则视频帧的视频格式为全宽左右格式,否则视频帧的视频格式为半宽左右格式;
当NCC4-NCC1>b且NCC4、NCC5均大于d时,视频帧的视频格式为上下格式,进一步地,当视频帧的视频格式确定为上下格式时,如果Q<1,则视频帧的视频格式为帧封装格式,否则视频帧的视频格式为半高上下格式;
当NCC1、NCC4均小于a时:
如果1≤Q≤2,则视频帧的视频格式为帧连续格式;
如果Q<1,则视频帧的视频格式为隔行格式;
如果Q>2,将隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6,将棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7,若NCC6>NCC7,则视频帧的视频格式为棋盘格式,否则视频帧的视频格式为隔列格式。
本实施例提供的视频格式识别装置可以使用在前述对应的视频格式识别方法,详情参见上述视频格式识别方法实施例二、三的相关描述,在此不再赘述。
本领域技术人员可以理解为上述实施例四至五所述装置所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
在本发明实施例中,通过视频帧转换为灰度图像,根据不同的图像像素排列方式分别对所述灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像,计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度,并根据相似度判断所述视频帧的视频格式,从而播放器可以准确的识别出3D视频的视频格式,顺利进行视频解析,进一步提高播放器的性能,给用户带来方便。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种视频格式识别方法,其特征在于,所述方法包括:
将一幅视频帧转换为灰度图像;
根据不同的图像像素排列方式分别对所述灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
计算每种图像像素排列方式对应的左眼图像和右眼图像的相似度,所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数,其中图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,所述图像像素排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5;
根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式,具体包括:计算灰度图像的宽高比,所述根据每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为,根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式,所述灰度图像的宽高比为Q,所述左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4,所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为:当NCC1、NCC4均小于a时,如果1≤Q≤2,则所述视频帧的视频格式为帧连续格式,如果Q<1,则所述视频帧的视频格式为隔行格式,如果Q>2,将所述隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6,将所述棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7,若NCC6>NCC7,则所述视频帧的视频格式为棋盘格式,否则所述视频帧的视频格式为隔列格式,其中,a为根据实验数据预设的阈值,所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,所述视频帧的视频格式为左右格式,当NCC4-NCC1>b且NCC4、NCC5均大于d时,所述视频帧的视频格式为上下格式,其中,b、c、d为根据实验数据预设的阈值。
2.如权利要求1所述的方法,其特征在于,所述左右格式包括全宽左右格式和半宽左右格式,所述上下格式包括帧封装格式和半高上下格式,所述灰度图像的宽高比为Q,所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤还包括:
当所述视频帧的视频格式为左右格式时,如果Q>2,则所述视频帧的视频格式为全宽左右格式,否则所述视频帧的视频格式为半宽左右格式;
当所述视频帧的视频格式为上下格式时,如果Q<1,则所述视频帧的视频格式为帧封装格式,否则所述视频帧的视频格式为半高上下格式。
3.一种视频格式识别装置,其特征在于,所述装置包括:
灰度转换单元,用于将一幅视频帧转换为灰度图像;
拆分单元,用于根据不同的图像像素排列方式分别对所述灰度转换单元转换的灰度图像进行拆分,所述灰度图像根据每种图像像素排列方式拆分生成一幅左眼图像和一幅右眼图像;
相似度计算单元,用于计算所述拆分单元拆分的每种图像像素排列方式对应的左眼图像和右眼图像的相似度,所述图像像素排列方式对应的左眼图像和右眼图像的相似度为归一化互相关系数,其中图像像素排列方式包括:左右排列方式、隔列排列方式、棋盘排列方式、上下排列方式、隔行排列方式,所述图像像素排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC2、NCC3、NCC4、NCC5;
识别单元,用于根据所述相似度计算单元计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式,具体包括:宽高比计算单元计算灰度转换单元转换得到的灰度图像的宽高比;根据宽高比计算单元计算得到的图像的宽高比和相似度计算单元计算的每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断视频帧的视频格式,所述视频格式包括帧连续格式、左右格式、上下格式、隔行格式、隔列格式、棋盘格式,所述灰度图像的宽高比为Q,所述左右排列方式、上下排列方式对应的左眼图像和右眼图像的归一化互相关系数分别为NCC1、NCC4,所述根据所述灰度图像的宽高比和每种图像像素排列方式对应的左眼图像和右眼图像的相似度判断所述视频帧的视频格式的步骤具体为:当NCC1、NCC4均小于a时,如果1≤Q≤2,则所述视频帧的视频格式为帧连续格式,如果Q<1,则所述视频帧的视频格式为隔行格式,如果Q>2,将所述隔列排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC6,将所述棋盘排列方式拆分得到的左眼图像按照隔行排列方式再次拆分,计算再次拆分得到的左眼图像和右眼图像的归一化互相关系数NCC7,若NCC6>NCC7,则所述视频帧的视频格式为棋盘格式,否则所述视频帧的视频格式为隔列格式,其中,a为根据实验数据预设的阈值,当NCC1-NCC4>b且NCC1、NCC2、NCC3均大于c时,所述视频帧的视频格式为左右格式,当NCC4-NCC1>b且NCC4、NCC5均大于d时,所述视频帧的视频格式为上下格式,其中,b、c、d为根据实验数据预设的阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110442001.8A CN102547344B (zh) | 2011-12-23 | 2011-12-23 | 一种视频格式识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110442001.8A CN102547344B (zh) | 2011-12-23 | 2011-12-23 | 一种视频格式识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102547344A CN102547344A (zh) | 2012-07-04 |
CN102547344B true CN102547344B (zh) | 2014-07-30 |
Family
ID=46353113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110442001.8A Expired - Fee Related CN102547344B (zh) | 2011-12-23 | 2011-12-23 | 一种视频格式识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102547344B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102769766A (zh) * | 2012-07-16 | 2012-11-07 | 上海大学 | 一种3d左右格式视频自动检测方法 |
CN102802012A (zh) * | 2012-07-19 | 2012-11-28 | 彩虹集团公司 | 一种3d信号自动识别方法 |
CN102821298B (zh) * | 2012-08-27 | 2015-06-17 | 深圳市维尚视界立体显示技术有限公司 | 一种3d播放调节自适应的方法、装置和设备 |
CN103051913A (zh) * | 2013-01-05 | 2013-04-17 | 北京暴风科技股份有限公司 | 一种3d片源格式自动识别的方法 |
CN103152535B (zh) * | 2013-02-05 | 2016-02-03 | 华映视讯(吴江)有限公司 | 自动判断3d影像格式的方法 |
CN104657966A (zh) * | 2013-11-19 | 2015-05-27 | 江苏宜清光电科技有限公司 | 一种3d格式分析方法 |
CN103702106A (zh) * | 2013-11-29 | 2014-04-02 | 上海卓像信息科技有限公司 | 基于内容相似度的3d立体信号检测系统及方法 |
CN104767985A (zh) * | 2014-01-07 | 2015-07-08 | 冠捷投资有限公司 | 使用区域分布分析以自动检测三维图像格式的方法 |
US9613575B2 (en) | 2014-03-17 | 2017-04-04 | Shenzhen China Star Optoelectronics Technology Co., Ltd | Liquid crystal display device and method for driving the liquid crystal display device |
CN103854624B (zh) * | 2014-03-17 | 2016-04-27 | 深圳市华星光电技术有限公司 | 一种液晶显示装置的驱动方法和一种液晶显示装置 |
CN104980796B (zh) * | 2014-04-10 | 2018-05-08 | Tcl集团股份有限公司 | 一种电视系统的视频播放方法和装置 |
CN104469440B (zh) * | 2014-04-16 | 2018-10-30 | 成都理想境界科技有限公司 | 视频播放方法、视频播放器及对应的播放设备 |
CN105657397B (zh) * | 2015-12-30 | 2018-03-30 | 深圳Tcl数字技术有限公司 | 3d视频播放调整方法及系统 |
CN105657398A (zh) * | 2015-12-31 | 2016-06-08 | 北京小鸟看看科技有限公司 | 一种多媒体资源播放方法和装置 |
KR20190069231A (ko) * | 2017-12-11 | 2019-06-19 | 삼성전자주식회사 | 웨어러블 디스플레이 장치 및 그 제어 방법 |
CN110012284A (zh) * | 2017-12-30 | 2019-07-12 | 深圳多哚新技术有限责任公司 | 一种基于头戴设备的视频播放方法及装置 |
CN108830198A (zh) * | 2018-05-31 | 2018-11-16 | 上海玮舟微电子科技有限公司 | 视频格式的识别方法、装置、设备及存储介质 |
CN109862341A (zh) * | 2019-03-29 | 2019-06-07 | 深圳市新致维科技有限公司 | 医学视频图像传输格式的确定方法、装置、介质及设备 |
CN112637182B (zh) * | 2020-12-18 | 2021-11-12 | 上海影创信息科技有限公司 | 左右眼图像互换识别辅助方法和系统及其vr眼镜 |
CN112613389A (zh) * | 2020-12-18 | 2021-04-06 | 上海影创信息科技有限公司 | 眼部手势控制方法和系统及其vr眼镜 |
CN116485722B (zh) * | 2023-03-17 | 2024-05-14 | 南京索图科技有限公司 | 一种三维医学影像的单帧定量识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101668221A (zh) * | 2008-09-02 | 2010-03-10 | 索尼株式会社 | 图像处理设备、图像处理方法和程序 |
CN101980545A (zh) * | 2010-11-29 | 2011-02-23 | 深圳市九洲电器有限公司 | 一种自动检测3dtv视频节目格式的方法 |
CN102231829A (zh) * | 2011-06-27 | 2011-11-02 | 深圳超多维光电子有限公司 | 一种视频文件的显示格式识别方法、装置及视频播放器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100138806A (ko) * | 2009-06-23 | 2010-12-31 | 삼성전자주식회사 | 자동 3차원 영상 포맷 변환 방법 및 그 장치 |
JP2011239172A (ja) * | 2010-05-11 | 2011-11-24 | Panasonic Corp | 映像処理装置 |
-
2011
- 2011-12-23 CN CN201110442001.8A patent/CN102547344B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101668221A (zh) * | 2008-09-02 | 2010-03-10 | 索尼株式会社 | 图像处理设备、图像处理方法和程序 |
CN101980545A (zh) * | 2010-11-29 | 2011-02-23 | 深圳市九洲电器有限公司 | 一种自动检测3dtv视频节目格式的方法 |
CN102231829A (zh) * | 2011-06-27 | 2011-11-02 | 深圳超多维光电子有限公司 | 一种视频文件的显示格式识别方法、装置及视频播放器 |
Also Published As
Publication number | Publication date |
---|---|
CN102547344A (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102547344B (zh) | 一种视频格式识别方法及装置 | |
US20190306485A1 (en) | 3d system including a marker mode | |
Guttmann et al. | Semi-automatic stereo extraction from video footage | |
Cao et al. | Semi-automatic 2D-to-3D conversion using disparity propagation | |
TW521519B (en) | Apparatus and method for converting a two dimensional image to a three dimensional image | |
KR101690297B1 (ko) | 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치 | |
CN103179426A (zh) | 自动检测图像格式的方法与应用其的播放方法 | |
US8773430B2 (en) | Method for distinguishing a 3D image from a 2D image and for identifying the presence of a 3D image format by feature correspondence determination | |
CN101610425B (zh) | 一种评测立体图像质量的方法和装置 | |
CN102547356A (zh) | 图像处理装置、图像处理方法和程序 | |
CN102006425A (zh) | 一种基于多摄像机的视频实时拼接方法 | |
RU2008126927A (ru) | Способ и устройство отображения стереоскопического изображения, способ для создания данных 3d изображения из входных данных 2d изображения, и устройство для создания данных 3d изображения из входных данных 2d изображения | |
CN102972038A (zh) | 图像处理装置、图像处理方法、程序、集成电路 | |
US8406524B2 (en) | Apparatus, method, and medium of generating visual attention map | |
EP2498502A2 (en) | Analysis of stereoscopic images | |
CN106341676A (zh) | 基于超像素的深度图像预处理和深度空洞填充方法 | |
CN105612742A (zh) | 重新映射深度图以用于3d观看 | |
CN103440664A (zh) | 一种生成高分辨率深度图的方法、系统及计算设备 | |
CN102685539B (zh) | 一种立体视频图像格式的识别方法、系统及立体播放器 | |
KR20110113923A (ko) | 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치 | |
CN104144334A (zh) | 用于立体视频内容的字幕检测 | |
CN104243956B (zh) | 一种立体图像视觉显著图提取方法 | |
KR101797035B1 (ko) | 오버레이 영역의 3d 영상 변환 방법 및 그 장치 | |
US11652973B2 (en) | 3D system | |
CN104185023A (zh) | 三维视频格式自动检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140730 |
|
CF01 | Termination of patent right due to non-payment of annual fee |