CN102685539A - 一种立体视频图像格式的识别方法、系统及立体播放器 - Google Patents

一种立体视频图像格式的识别方法、系统及立体播放器 Download PDF

Info

Publication number
CN102685539A
CN102685539A CN2012101232721A CN201210123272A CN102685539A CN 102685539 A CN102685539 A CN 102685539A CN 2012101232721 A CN2012101232721 A CN 2012101232721A CN 201210123272 A CN201210123272 A CN 201210123272A CN 102685539 A CN102685539 A CN 102685539A
Authority
CN
China
Prior art keywords
frequency
identified
field picture
dimensional video
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101232721A
Other languages
English (en)
Other versions
CN102685539B (zh
Inventor
吴美芬
邵诗强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Corp
Original Assignee
TCL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Corp filed Critical TCL Corp
Priority to CN201210123272.1A priority Critical patent/CN102685539B/zh
Publication of CN102685539A publication Critical patent/CN102685539A/zh
Application granted granted Critical
Publication of CN102685539B publication Critical patent/CN102685539B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明于立体视频图像处理技术领域,提供了一种立体视频图像格式的识别方法、系统及立体播放器。其中的方法包括:接收待识别立体视频帧图像,并采用傅里叶变换将所述待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;分析傅里叶幅度谱中高频分量的强弱,并根据分析结果识别待识别立体视频帧图像的格式,实现了对立体图像格式的识别。

Description

一种立体视频图像格式的识别方法、系统及立体播放器
技术领域
本发明属于立体视频图像处理技术领域,尤其涉及一种立体视频图像格式的识别方法、系统及立体播放器。
背景技术
立体显示是指利用人眼视差特性,在人眼裸视条件下呈现出具有空间深度信息的逼真立体影像。目前,立体视频图像的常见格式包括以下几种:
1.帧连续格式(frame sequential):连续交替左眼图像和右眼图像;
2.全宽左右格式(full-side-by-side):将左帧图像、右帧图像压缩到相应原始分辨率的一半,之后合成一帧图像同时,压缩后的帧图像中,左半帧图像为左眼图像,右半帧图像为右眼图像;
3.半宽左右格式(half-side-by-side):与全宽左右格式不同的是,需将左帧图像、右帧图像的分辨率分别在水平方向上压缩一半;
4.上下格式(top-and-bottom):将左帧图像、右帧图像的分辨率分别在垂直方向上压缩一半,并按照上下排列方式压缩到一帧图像;
5.帧封装格式(Frame Packing):将左帧图像、右帧图像按上下方式排列,且左帧图像和右帧图像之间存在一较小的空白区域。
6.隔行格式:将左帧图像、右帧图像在垂直方向上按行交错排列;
7.隔列格式:将左帧图像、右帧图像在水平方向上按列交错排列;
8.棋盘格式(CheckBoard):左帧图像和右帧图像被交织,每相隔一个像素存放左帧图像或右帧图像,与国际象棋棋盘的方格相似。
由于早期的立体播放器能够且仅能够接收棋盘格式的立体视频图像,且该种立体播放器占有市场较大,使得棋盘格式显得尤为重要。而现有技术提供的立体播放器无法实现对立体图像格式的识别,不利于产品的推广及应用。
在本背景技术本部分所公开的上述信息仅仅用于增加对本发明背景技术的理解,因此其可能包括不构成对该国的本领域普通技术人员已知的现有技术。
发明内容
本发明实施例的目的在于提供一种立体视频图像格式的识别方法,旨在解决现有技术提供的立体播放器无法实现对立体图像格式进行识别的问题。
本发明实施例是这样实现的,一种立体视频图像格式的识别方法,所述方法包括以下步骤:
接收待识别立体视频帧图像,并采用傅里叶变换将所述待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;
分析所述傅里叶幅度谱中高频分量的强弱,并根据分析结果识别所述待识别立体视频帧图像的格式。
本发明实施例的另一目的在于提供一种立体视频图像格式的识别系统,所述系统包括:
图像转换模块,用于接收待识别立体视频帧图像,并采用傅里叶变换将接收到的所述待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;
分析识别模块,用于分析所述图像转换模块得到的所述傅里叶幅度谱中高频分量的强弱,并根据分析结果识别所述图像转换模块接收到的所述待识别立体视频帧图像的格式。
本发明实施例的另一目的在于提供一种立体播放器,所述立体播放器包括一如上所述的立体视频图像格式的识别系统。
本发明实施例提供的立体视频图像格式的识别方法和系统是利用图像变换的方式,将待识别立体视频帧图像从空间域转换到频率域,并通过对傅里叶幅度谱中高频分量强弱的分析,识别出待识别立体视频帧图像的格式。
附图说明
图1是本发明实施例提供的立体视频图像格式的识别方法的流程图;
图2是本发明优选实施例提供的立体视频图像格式的识别方法的流程图;
图3是本发明优选实施例中的傅里叶幅度谱示意图;
图4是本发明实施例提供的立体视频图像格式的识别系统的结构图;
图5是图4中分析识别模块的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明实施例提供的立体视频图像格式的识别方法是利用图像傅里叶变换的方式,将待识别立体视频帧图像从空间域转换到频率域,即得到待识别立体视频帧图像的傅里叶幅度谱,并通过对傅里叶幅度谱中相关区域内幅值均值的比较,识别出待识别立体视频帧图像的格式。
图1示出了本发明实施例提供的立体视频图像格式的识别方法的流程。
在步骤S101中,接收待识别立体视频帧图像,并采用傅里叶变换将接收到的待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱,该频谱为一个二维的坐标体系,如图3所示,设其中心点的坐标为(0,0),其范围为以坐标(-π,π),(π,π)(-π,-π)(π,-π)为顶点的矩形区域。
优选地,采用二维离散傅里叶变换将待识别立体视频帧图像从空间域转换到频率域,则将待识别立体视频帧图像从空间域转换到频率域的步骤又包括:将待识别立体视频帧图像转换为灰度图像;利用二维离散傅里叶变换将转换后的灰度图像从空间域转换到频率域。
在步骤S102中,分析该傅里叶幅度谱中高频分量的强弱,并根据分析结果识别待识别立体视频帧图像的格式。
本发明实施例提供的立体视频图像格式的识别方法是利用傅里叶变换的方式,将待识别立体视频帧图像从空间域转换到频率域,并通过对傅里叶幅度谱中高频分量强弱的分析,识别出待识别立体视频帧图像的格式。
进一步地,步骤S102又可包括以下步骤:选取傅里叶幅度谱中包括特征点的特征区域以及与该特征区域相邻的对照域;计算特征区域的幅值均值以及对照域的幅值均值;通过对特征区域的幅值以及对照域的幅值均值的比较,识别出待识别立体视频帧图像的格式。
更进一步地,为了识别出棋盘格式,选取傅里叶幅度谱中包括特征点的特征区域以及与该特征区域相邻的对照域的步骤具体为:选取傅里叶幅度谱中包括第一特征点的第一区域、以及与第一区域相邻的第一对照域,第一特征点可为待识别立体视频帧图像的傅里叶幅度谱中矩形区域的任意一顶点,即坐标为(-π,π),(π,π),(-π,-π),(π,-π)的顶点中任意一点。第一对照域的尺寸与所述第一区域相同;则通过对特征区域的幅值以及对照域的幅值均值的比较,识别出待识别立体视频帧图像的格式的步骤具体为:若第一区域的幅值均值大于第一对照域的幅值均值,则识别待识别立体视频帧图像的格式是棋盘格式;若第一区域的幅值均值不大于第一对照域的幅值均值,则识别待识别立体视频帧图像的格式是除棋盘格式以外的其它格式。
为了区分出隔行格式和隔列格式,选取傅里叶幅度谱中包括特征点的特征区域以及与该特征区域相邻的对照域的步骤具体为:选取傅里叶幅度谱中包括第二特征点的第二区域和与第二区域相邻的第二对照域,以及包括第三特征点的第三区域和与第三区域相邻的第三对照域;该第二特征点是待识别立体视频帧图像的傅里叶幅度谱中坐标为(0,π)或(0,-π)的点中任意一点,该第三特征点是待识别立体视频帧图像的傅里叶幅度谱中坐标为(π,0)或(-π,0)的点中任意一点,该第二区域的中心点在纵坐标轴上,该第二对照域的尺寸与第二区域相同,其中心点也在纵坐标轴上,该第三区域的中心点在横坐标轴上,该第三对照域的尺寸与第三区域相同,其中心点也在横坐标轴上;则通过对特征区域的幅值以及对照域的幅值均值的比较,识别出待识别立体视频帧图像的格式的步骤具体为:若第二区域的幅值均值大于第二对照域的幅值均值,且第三区域的幅值均值不大于第三对照域的幅值均值,则说明待识别立体视频帧图像在垂直方向上高频分量较大,而在水平方向上高频分量较小,从而识别待识别立体视频帧图像的格式是隔行格式,否则识别待识别立体视频帧图像的格式是除了隔行格式以外的其它格式;若第二区域的幅值均值不大于第二对照域的幅值均值,且第三区域的幅值均值大于第三对照域的幅值均值,则说明待识别立体视频帧图像在水平方向上高频分量较大,而在垂直方向上高频分量较小,从而识别待识别立体视频帧图像的格式是隔列格式,否则识别待识别立体视频帧图像的格式是除了隔列格式以外的其它格式。
公知地,帧封装格式的立体视频帧图像在垂直方向上分辨率为标准视频帧图像格式的2倍多,而全宽左右格式的立体视频帧图像在水平方向上分辨率为标准视频帧图像格式的2倍,基于帧封装格式和全宽左右格式的该特点,本发明实施例还可通过对待识别立体视频帧图像宽高比值的判定,识别待识别立体视频帧图像是帧封装格式或全宽左右格式。具体地,本发明实施例在接收待识别立体视频帧图像的步骤之后,还可包括以下步骤:读取待识别立体视频帧图像的宽度属性值和高度属性值;计算宽度属性值和高度属性值的比值;通过对宽度属性值和高度属性值的比值的判断,识别出立体视频图像的格式是帧封装格式或全宽左右格式。
具体地,通过对宽度属性值和高度属性值的比值的判断,识别出立体视频图像的格式是帧封装格式或全宽左右格式的步骤又包括以下步骤:若宽度属性值和高度属性值的比值小于1,则识别待识别立体视频帧图像的格式是帧封装格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式和帧封装格式以外的其它格式;若宽度属性值和高度属性值的比值大于2,则识别待识别立体视频帧图像的格式是全宽左右格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式和全宽左右格式以外的其它格式。
为了区分出上下格式、半宽左右格式或帧连续格式,本发明实施例在接收待识别立体视频帧图像的步骤之后,还可包括以下步骤:将待识别立体视频帧图像拆分为左半部分图像和右半部分图像,并将待识别立体视频帧图像拆分为上半部分图像和下半部分图像;计算拆分后的左半部分图像和右半部分图像之间的相似度第一相似度值,并计算拆分后的上半部分图像和下半部分图像之间的相似度第二相似度值;通过对第一相似度值、第二相似度值与预存的第一阈值和第二阈值的比较,识别待识别立体视频帧图像的格式是上下格式、半宽左右格式或帧连续格式。
具体地,通过对第一相似度值、第二相似度值与预存的第一阈值和第二阈值的比较,识别待识别立体视频帧图像的格式是上下格式、半宽左右格式或帧连续格式的步骤又包括以下步骤:若第一相似度值和第二相似度值均小于预存的第一阈值,则识别待识别立体视频帧图像的格式是帧连续格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和帧连续格式以外的其它格式;若第一相似度值大于预存的第二阈值,而第二相似度值小于第一阈值,则识别待识别立体视频帧图像的格式是半宽左右格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和半宽左右格式以外的其它格式;若第二相似度值大于第二阈值,而第一相似度值小于第一阈值,则识别待识别立体视频帧图像的格式是上下格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和上下格式以外的其它格式。其中的第一阈值小于第二阈值,且第一阈值与第二阈值可根据具体实验得出。
下面以采用二维离散傅里叶变换将待识别立体视频帧图像从空间域转换到频率域,顺次识别棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式、帧连续格式、半宽左右格式、上下格式为例,对上述立体视频图像格式的识别方法进行详细说明,如图2所示:
在步骤S201中,接收待识别立体视频帧图像,并将待识别立体视频帧图像转换为灰度图像。
在步骤S202中,利用二维离散傅里叶变换,将灰度图像从空间域转换到频率域,得到如图3所示的傅里叶幅度谱。
在步骤S203中,对于转换后的傅里叶幅度谱,如图3所示,选取转换后的傅里叶幅度谱中,包括第一特征点(-π,π)的第一区域A及其相邻的第一对照域A’、包括第二特征点(0,π)的第二区域B及其相邻的第二对照域B’、包括第三特征点(-π,0)的第三区域C及其相邻的第三对照域C’,计算第一区域A的幅值均值——PA、第一对照域A’的幅值均值——PA’、第二区域B的幅值均值——PB、第二对照域B’的幅值均值——PB’、第三区域C的幅值均值——PC、第三对照域C’的幅值均值——PC’。第二区域B与第二对照域B’的中心点分别在纵坐标轴上,且第三区域C与第三对照域C’的中心点分别在横坐标轴上。
在步骤S204中,判断第一区域A的幅值均值PA是否大于第一对照域A’的幅值均值PA’,是则执行步骤S205,否则执行步骤S206。
在步骤S205中,识别待识别立体视频帧图像的格式是棋盘格式。
在步骤S206中,判断第二区域B的幅值均值PB是否大于第二对照域B’的幅值均值PB’,且第三区域C的幅值均值PC是否不大于第三对照域C’的幅值均值PC’,是则执行步骤S207,否则执行步骤S208。
在步骤S207中,识别待识别立体视频帧图像的格式是隔行格式。
在步骤S208中,判断第二区域B的幅值均值PB是否不大于第二对照域B’的幅值均值PB’,且第三区域C的幅值均值是否大于第三对照域C的幅值均值PC’,是则执行步骤S209,否则执行步骤S210。
在步骤S209中,识别待识别立体视频帧图像的格式是隔列格式。
在步骤S210中,读取待识别立体视频帧图像的宽度属性值和高度属性值,并计算宽度属性值和高度属性值的比值。
在步骤S211中,判断宽度属性值和高度属性值的比值是否大于2,是则执行步骤S212,否则执行步骤S213。
在步骤S212中,识别待识别立体视频帧图像的格式是全宽左右格式。
在步骤S213中,判断宽度属性值和高度属性值的比值是否小于1,是则执行步骤S214,否则执行步骤S215。
在步骤S214中,识别待识别立体视频帧图像的格式是帧封装格式。
在步骤S215中,将待识别立体视频帧图像拆分为上半部分图像和下半部分图像,以及左半部分图像和右半部分图像。
在步骤S216中,计算左半部分图像和右半部分图像之间的第一相似度值NCC1,以及上半部分图像和下半部分图像之间的第二相似度值NCC2。
在步骤S217中,判断第一相似度值NCC1和第二相似度值NCC2是否均小于第一阈值a,是则执行步骤S218,否则执行步骤S219。
在步骤S218中,识别待识别立体视频帧图像的格式是帧连续格式。
在步骤S219中,判断第一相似度值NCC1是否大于第二阈值b,且第二相似度值NCC2小于第一阈值a,是则执行步骤S220,否则执行步骤S221。
在步骤S220中,识别待识别立体视频帧图像的格式是半宽左右格式。
在步骤S221中,判断第一相似度值NCC1是否小于第一阈值a,且第二相似度值NCC2大于第二阈值b,是则执行步骤S222,否则本次判断结束。接收其他立体视频帧图像,重复以上步骤判断。
在步骤S222中,识别待识别立体视频帧图像的格式是上下格式。
图4示出了本发明实施例提供的立体视频图像格式的识别系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例提供的立体视频图像格式的识别系统包括:图像转换模块11,用于接收待识别立体视频帧图像,并采用傅里叶变换将接收到的待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;分析识别模块12,用于分析图像转换模块11得到的傅里叶幅度谱中高频分量的强弱,并根据分析结果识别图像转换模块11接收到的待识别立体视频帧图像的格式。
图5示出了图4中分析识别模块12的结构。
具体地,分析识别模块12包括:选取模块121,用于选取图像转换模块11得到的傅里叶幅度谱中包括特征点的特征区域以及与该特征区域相邻的对照域;均值计算模块122,用于计算选取模块121选取的特征区域的幅值均值以及对照域的幅值均值;第一识别模块123,用于通过对均值计算模块122计算得到的特征区域的幅值以及对照域的幅值均值的比较,识别出待识别立体视频帧图像的格式。
具体地,为了识别出棋盘格式,选取模块121选取傅里叶幅度谱中包括第一特征点的第一区域,以及与第一区域相邻的第一对照域,该第一特征点是待识别立体视频帧图像在傅里叶幅度谱的四个象限中的任一顶点;当均值计算模块122计算得到的第一区域的幅值均值大于第一对照域的幅值均值时,第一识别模块123识别待识别立体视频帧图像的格式是棋盘格式,否则识别待识别立体视频帧图像的格式是除棋盘格式以外的其它格式。
具体地,为了区分出隔行格式和隔列格式,本发明实施例中,选取模块121选取图像转换模块11得到的傅里叶幅度谱中包括第二特征点的第二区域、包括第三特征点的第三区域,以及与第二区域相邻的第二对照域、与第三区域相邻的第三对照域,该第二特征点是待识别立体视频帧图像的傅里叶幅度谱中坐标为(0,π)或(0,-π)的点中任意一点,该第三特征点是待识别立体视频帧图像的傅里叶幅度谱中坐标为(π,0)或(-π,0)的点中任意一点,该第二区域的中心点在纵坐标轴上,该第二对照域的尺寸与第二区域相同,其中心点也在纵坐标轴上,该第三区域的中心点在横坐标轴上,该第三对照域的尺寸与第三区域相同,其中心点也在横坐标轴上;均值计算模块122计算选取模块121选取的第二区域的幅值均值、第二对照域的幅值均值、第三区域的幅值均值、以及第三对照域的幅值均值;当均值计算模块122计算得到的第二区域的幅值均值大于第二对照域的幅值均值,且第三区域的幅值均值不大于第三对照域的幅值均值时,第一识别模块123识别待识别立体视频帧图像的格式是隔行格式,否则识别待识别立体视频帧图像的格式是除了隔行格式以外的其它格式;当均值计算模块122计算得到的第二区域的幅值均值不大于第二对照域的幅值均值,且第三区域的幅值均值大于第三对照域的幅值均值时,第一识别模块123识别待识别立体视频帧图像的格式是隔列格式,否则识别待识别立体视频帧图像的格式是除了隔列格式以外的其它格式。
为了实现对帧封装格式和全宽左右格式的识别,本发明实施例中,分析识别模块12还可以包括:读取模块124,用于读取图像转换模块11接收到的待识别立体视频帧图像的宽度属性值和高度属性值;比值计算模块125,用于计算读取模块124读取到的宽度属性值和高度属性值的比值;第二识别模块126,用于通过对比值计算模块125计算得到的宽度属性值和高度属性值的比值的判断,识别出立体视频图像的格式是帧封装格式或全宽左右格式。
具体地,当比值计算模块125计算得到的宽度属性值和高度属性值的比值小于1时,第二识别模块126识别待识别立体视频帧图像的格式是帧封装格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式和帧封装格式以外的其它格式;当比值计算模块125计算得到的宽度属性值和高度属性值的比值大于2时,第二识别模块126识别待识别立体视频帧图像的格式是全宽左右格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式和全宽左右格式以外的其它格式。
为了区分出上下格式、半宽左右格式和帧连续格式,本发明实施例中,分析识别模块12还可以包括:拆分模块127,用于将图像转换模块11接收到的待识别立体视频帧图像拆分为左半部分图像和右半部分图像,并将待识别立体视频帧图像拆分为上半部分图像和下半部分图像;相似度值计算模块128,用于计算拆分模块127拆分后的左半部分图像和右半部分图像之间的第一相似度值,并计算拆分模块127拆分后的上半部分图像和下半部分图像之间的第二相似度值;第三识别模块129,用于通过对相似度值计算模块128计算得到的第一相似度值、第二相似度值与预存的第一阈值和第二阈值的比较,识别待识别立体视频帧图像的格式是上下格式、半宽左右格式或帧连续格式。
具体地,当相似度值计算模块128计算得到的第一相似度值和第二相似度值均小于预存的第一阈值时,第三识别模块129识别待识别立体视频帧图像的格式是帧连续格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和帧连续格式以外的其它格式;当相似度值计算模块128计算得到的第一相似度值大于预存的第二阈值,而第二相似度值小于第一阈值时,第三识别模块129识别待识别立体视频帧图像的格式是半宽左右格式,否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和半宽左右格式以外的其它格式;当相似度值计算模块128计算得到的第二相似度值大于第二阈值,而第一相似度值小于第一阈值时,第三识别模块129识别待识别立体视频帧图像的格式是上下格式否则识别待识别立体视频帧图像的格式是除了棋盘格式、隔行格式、隔列格式、全宽左右格式、帧封装格式和上下格式以外的其它格式。其中的第一阈值小于第二阈值。
本发明实施例还提供了一种立体播放器,包括一如上所述的立体视频图像格式的识别系统。
本发明实施例提供的立体视频图像格式的识别方法和系统是利用图像变换的方式,将待识别立体视频帧图像从空间域转换到频率域,并通过对傅里叶幅度谱中高频分量强弱的分析,识别出待识别立体视频帧图像的格式。具体地,本发明实施例提供的立体视频图像格式的识别方法和系统还可以通过对频率域中相关区域幅值均值的比较,识别出棋盘格式、隔行格式或隔列格式;还可以通过进一步对待识别立体视频帧图像的宽度属性值和高度属性值的比值的判断,识别出全宽左右格式或帧封装格式;还可以进一步对待识别立体视频帧图像进行拆分,通过对拆分后的图像之间相似度值的比较,识别出帧连续格式、半宽左右格式或上下格式,从而实现了对现有常见立体视频图像格式的识别。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来控制相关的硬件完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种立体视频图像格式的识别方法,其特征在于,所述方法包括以下步骤:
接收待识别立体视频帧图像,并采用傅里叶变换将所述待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;
分析所述傅里叶幅度谱中高频分量的强弱,并根据分析结果识别所述待识别立体视频帧图像的格式。
2.如权利要求1所述的立体视频图像格式的识别方法,其特征在于,所述采用傅里叶变换将所述待识别立体视频帧图像从空间域转换到频率域的步骤又包括:
将所述待识别立体视频帧图像转换为灰度图像;
利用二维离散傅里叶变换,将转换后的所述灰度图像从空间域转换到频率域。
3.如权利要求1所述的立体视频图像格式的识别方法,其特征在于,所述分析所述傅里叶幅度谱中高频分量的强弱,并根据分析结果识别所述待识别立体视频帧图像的格式的步骤又包括以下步骤:
选取所述傅里叶幅度谱中包括特征点的特征区域以及与所述特征区域相邻的对照域;
计算所述特征区域的幅值均值以及所述对照域的幅值均值;
通过对所述特征区域的幅值以及所述对照域的幅值均值的比较,识别出所述待识别立体视频帧图像的格式。
4.如权利要求3所述的立体视频图像格式的识别方法,其特征在于,所述选取所述傅里叶幅度谱中包括特征点的特征区域以及与所述特征区域相邻的对照域的步骤为:选取所述傅里叶幅度谱中包括第一特征点的第一区域、以及与所述第一区域相邻的第一对照域,所述第一特征点是所述待识别立体视频帧图像在所述傅里叶幅度谱的四个象限中的任一顶点,所述第一对照域的尺寸与所述第一区域相同;
所述通过对所述特征区域的幅值以及所述对照域的幅值均值的比较,识别出所述待识别立体视频帧图像的格式的步骤为:若所述第一区域的幅值均值大于所述第一对照域的幅值均值,则识别所述待识别立体视频帧图像的格式是棋盘格式。
5.如权利要求3所述的立体视频图像格式的识别方法,其特征在于,所述选取所述傅里叶幅度谱中包括特征点的特征区域以及与所述特征区域相邻的对照域的步骤为:选取包括第二特征点的第二区域和与所述第二区域相邻的第二对照域、以及包括第三特征点的第三区域和与所述第三区域相邻的第三对照域,所述第二特征点是所述待识别立体视频帧图像的傅里叶幅度谱中坐标为(0,π)或(0,-π)的点中任意一点,所述第三特征点是所述待识别立体视频帧图像的傅里叶幅度谱中坐标为(π,0)或(-π,0)的点中任意一点,所述第二区域和所述第二对照域的中心点均在所述待识别立体视频帧图像的傅里叶幅度谱中的纵坐标轴上,所述第三区域和所述第三对照域的中心点均在所述待识别立体视频帧图像的傅里叶幅度谱中的横坐标轴上,所述第二对照域的尺寸与所述第二区域相同,所述第三对照域的尺寸与所述第三区域相同;
所述通过对所述特征区域的幅值以及所述对照域的幅值均值的比较,识别出所述待识别立体视频帧图像的格式的步骤为:若所述第二区域的幅值均值大于所述第二对照域的幅值均值,且所述第三区域的幅值均值不大于述第三对照域的幅值均值,则识别所述待识别立体视频帧图像的格式是隔行格式;若所述第二区域的幅值均值不大于所述第二对照域的幅值均值,且所述第三区域的幅值均值大于所述第三对照域的幅值均值,则识别所述待识别立体视频帧图像的格式是隔列格式。
6.如权利要求1至5任一项所述的立体视频图像格式的识别方法,其特征在于,在所述接收待识别立体视频帧图像的步骤之后,所述方法还包括以下步骤:
读取所述待识别立体视频帧图像的宽度属性值和高度属性值;
计算所述宽度属性值和所述高度属性值的比值;
若所述宽度属性值和高度属性值的比值小于1,则识别所述待识别立体视频帧图像的格式是帧封装格式;若所述宽度属性值和高度属性值的比值大于2,则识别所述待识别立体视频帧图像的格式是全宽左右格式。
7.如权利要求1至5任一项所述的立体视频图像格式的识别方法,其特征在于,在所述接收待识别立体视频帧图像的步骤之后,所述方法还包括以下步骤:
将所述待识别立体视频帧图像拆分为左半部分图像和右半部分图像,并将所述待识别立体视频帧图像拆分为上半部分图像和下半部分图像;
计算拆分后的所述左半部分图像和所述右半部分图像之间的第一相似度值,并计算拆分后的所述上半部分图像和所述下半部分图像之间的第二相似度值;
若所述第一相似度值和所述第二相似度值均小于预存的第一阈值,则识别所述待识别立体视频帧图像的格式是帧连续格式;若所述第一相似度值大于预存的第二阈值,而所述第二相似度值小于所述第一阈值,则识别所述待识别立体视频帧图像的格式是半宽左右格式;若所述第二相似度值大于所述第二阈值,而所述第一相似度值小于所述第一阈值,则识别所述待识别立体视频帧图像的格式是上下格式。
8.一种立体视频图像格式的识别系统,其特征在于,所述系统包括:
图像转换模块,用于接收待识别立体视频帧图像,并采用傅里叶变换将接收到的所述待识别立体视频帧图像从空间域转换到频率域,得到傅里叶幅度谱;
分析识别模块,用于分析所述图像转换模块得到的所述傅里叶幅度谱中高频分量的强弱,并根据分析结果识别所述图像转换模块接收到的所述待识别立体视频帧图像的格式。
9.如权利要求8所述的立体视频图像格式的识别系统,其特征在于,所述分析识别模块又包括:
选取模块,用于选取所述图像转换模块得到的所述傅里叶幅度谱中包括特征点的特征区域以及与该特征区域相邻的对照域;
均值计算模块,用于计算所述选取模块选取的所述特征区域的幅值均值以及所述对照域的幅值均值;
第一识别模块,用于通过对所述均值计算模块计算得到的所述特征区域的幅值以及所述对照域的幅值均值的比较,识别出所述图像转换模块接收到的待识别立体视频帧图像的格式。
10.如权利要求9所述的立体视频图像格式的识别系统,其特征在于,所述选取模块选取所述图像转换模块得到的所述傅里叶幅度谱中包括第一特征点的第一区域,以及与所述第一区域相邻的第一对照域,所述第一特征点是所述待识别立体视频帧图像在所述傅里叶幅度谱的四个象限中的任一顶点;
当所述均值计算模块计算得到的所述第一区域的幅值均值大于所述第一对照域的幅值均值时,所述第一识别模块识别所述图像转换模块接收到的待识别立体视频帧图像的格式是棋盘格式。
11.如权利要求9所述的立体视频图像格式的识别系统,其特征在于,所述选取模块选取所述图像转换模块得到的所述傅里叶幅度谱中包括第二特征点的第二区域和与所述第二区域相邻的第二对照域、以及包括第三特征点的第三区域和与所述第三区域相邻的第三对照域,所述第二特征点是所述待识别立体视频帧图像的傅里叶幅度谱中坐标为(0,π)或(0,-π)的点中任意一点,所述第三特征点是待识别立体视频帧图像的傅里叶幅度谱中坐标为(π,0)或(-π,0)的点中任意一点,所述第二区域和所述第二对照域的中心点均在所述待识别立体视频帧图像的傅里叶幅度谱中的纵坐标轴上,所述第三区域和所述第三对照域的中心点均在所述待识别立体视频帧图像的傅里叶幅度谱中的横坐标轴上,所述第二对照域的尺寸与所述第二区域相同,所述第三对照域的尺寸与所述第三区域相同;
当所述均值计算模块计算得到的所述第二区域的幅值均值大于所述第二对照域的幅值均值,且所述第三区域的幅值均值不大于所述第三对照域的幅值均值时,所述第一识别模块识别所述图像转换模块接收到的待识别立体视频帧图像的格式是隔行格式,而当所述均值计算模块计算得到的所述第二区域的幅值均值不大于所述第二对照域的幅值均值,且所述第三区域的幅值均值大于所述第三对照域的幅值均值时,所述第一识别模块识别所述图像转换模块接收到的待识别立体视频帧图像的格式是隔列格式。
12.如权利要求8所述的立体视频图像格式的识别系统,其特征在于,所述分析识别模块又包括:
读取模块,用于读取所述图像转换模块接收到的所述待识别立体视频帧图像的宽度属性值和高度属性值;
比值计算模块,用于计算所述读取模块读取到的所述宽度属性值和所述高度属性值的比值;
第二识别模块,用于当所述比值计算模块计算得到的所述宽度属性值和所述高度属性值的比值小于1时,识别所述待识别立体视频帧图像的格式是帧封装格式,并当所述比值计算模块计算得到的所述宽度属性值和所述高度属性值的比值大于2时,识别所述图像转换模块接收到的待识别立体视频帧图像的格式是全宽左右格式。
13.如权利要求8所述的立体视频图像格式的识别系统,其特征在于,所述分析识别模块又包括:
拆分模块,用于将所述图像转换模块接收到的所述待识别立体视频帧图像拆分为左半部分图像和右半部分图像,并将所述图像转换模块接收到的所述待识别立体视频帧图像拆分为上半部分图像和下半部分图像;
相似度值计算模块,用于计算所述拆分模块拆分后的所述左半部分图像和所述右半部分图像之间的第一相似度值,并所述计算拆分模块拆分后的所述上半部分图像和所述下半部分图像之间的第二相似度值;
第三识别模块,用于当所述相似度值计算模块计算得到的所述第一相似度值和所述第二相似度值均小于预存的第一阈值时,识别所述图像转换模块接收到的待识别立体视频帧图像的格式是帧连续格式,当所述相似度值计算模块计算得到的所述第一相似度值大于预存的第二阈值,而所述第二相似度值小于所述第一阈值时,识别所述图像转换模块接收到的待识别立体视频帧图像的格式是半宽左右格式,并当所述相似度值计算模块计算得到的所述第二相似度值大于所述第二阈值,而所述第一相似度值小于所述第一阈值时,识别所述图像转换模块接收到的待识别立体视频帧图像的格式是上下格式,所述第一阈值小于所述第二阈值。
14.一种立体播放器,其特征在于,所述立体播放器包括一如权利要求8至13任一项所述的立体视频图像格式的识别系统。
CN201210123272.1A 2012-04-24 2012-04-24 一种立体视频图像格式的识别方法、系统及立体播放器 Expired - Fee Related CN102685539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210123272.1A CN102685539B (zh) 2012-04-24 2012-04-24 一种立体视频图像格式的识别方法、系统及立体播放器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210123272.1A CN102685539B (zh) 2012-04-24 2012-04-24 一种立体视频图像格式的识别方法、系统及立体播放器

Publications (2)

Publication Number Publication Date
CN102685539A true CN102685539A (zh) 2012-09-19
CN102685539B CN102685539B (zh) 2015-08-05

Family

ID=46816810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210123272.1A Expired - Fee Related CN102685539B (zh) 2012-04-24 2012-04-24 一种立体视频图像格式的识别方法、系统及立体播放器

Country Status (1)

Country Link
CN (1) CN102685539B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957933A (zh) * 2012-11-13 2013-03-06 Tcl集团股份有限公司 一种3d视频格式识别方法、装置
CN105306141A (zh) * 2015-09-18 2016-02-03 北京理工大学 一种使用摄像头的室内可见光异步定位方法
CN106231294A (zh) * 2015-10-30 2016-12-14 深圳超多维光电子有限公司 一种立体片源格式的检测方法及装置
CN106982389A (zh) * 2017-03-17 2017-07-25 腾讯科技(深圳)有限公司 视频类型识别方法及装置
WO2018187939A1 (zh) * 2017-04-11 2018-10-18 深圳市柔宇科技有限公司 三维图像的识别方法和终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236646A (zh) * 2007-01-30 2008-08-06 宝利微系统控股公司 在频率域检测与估计图像显著的强相关方向的方法和系统
CN101980545A (zh) * 2010-11-29 2011-02-23 深圳市九洲电器有限公司 一种自动检测3dtv视频节目格式的方法
CN102231829A (zh) * 2011-06-27 2011-11-02 深圳超多维光电子有限公司 一种视频文件的显示格式识别方法、装置及视频播放器
CN102340676A (zh) * 2010-07-16 2012-02-01 深圳Tcl新技术有限公司 一种3d视频格式自动识别的方法及装置
CN102395037A (zh) * 2011-06-30 2012-03-28 深圳超多维光电子有限公司 一种格式识别方法及识别装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236646A (zh) * 2007-01-30 2008-08-06 宝利微系统控股公司 在频率域检测与估计图像显著的强相关方向的方法和系统
CN102340676A (zh) * 2010-07-16 2012-02-01 深圳Tcl新技术有限公司 一种3d视频格式自动识别的方法及装置
CN101980545A (zh) * 2010-11-29 2011-02-23 深圳市九洲电器有限公司 一种自动检测3dtv视频节目格式的方法
CN102231829A (zh) * 2011-06-27 2011-11-02 深圳超多维光电子有限公司 一种视频文件的显示格式识别方法、装置及视频播放器
CN102395037A (zh) * 2011-06-30 2012-03-28 深圳超多维光电子有限公司 一种格式识别方法及识别装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957933A (zh) * 2012-11-13 2013-03-06 Tcl集团股份有限公司 一种3d视频格式识别方法、装置
CN105306141A (zh) * 2015-09-18 2016-02-03 北京理工大学 一种使用摄像头的室内可见光异步定位方法
CN106231294A (zh) * 2015-10-30 2016-12-14 深圳超多维光电子有限公司 一种立体片源格式的检测方法及装置
CN106231294B (zh) * 2015-10-30 2017-11-21 深圳超多维光电子有限公司 一种立体片源格式的检测方法及装置
CN106982389A (zh) * 2017-03-17 2017-07-25 腾讯科技(深圳)有限公司 视频类型识别方法及装置
WO2018187939A1 (zh) * 2017-04-11 2018-10-18 深圳市柔宇科技有限公司 三维图像的识别方法和终端

Also Published As

Publication number Publication date
CN102685539B (zh) 2015-08-05

Similar Documents

Publication Publication Date Title
CN102395037B (zh) 一种格式识别方法及识别装置
CN102685539A (zh) 一种立体视频图像格式的识别方法、系统及立体播放器
US10424075B2 (en) Depth/disparity map post-processing method and device
US20110249886A1 (en) Image converting device and three-dimensional image display device including the same
KR101584115B1 (ko) 시각적 관심맵 생성 장치 및 방법
Han et al. Geometric and texture cue based depth-map estimation for 2D to 3D image conversion
US8610735B2 (en) Image converting device and three dimensional image display device including the same
CN104200197A (zh) 三维人体行为识别方法及装置
Hsia Improved depth image-based rendering using an adaptive compensation method on an autostereoscopic 3-D display for a Kinect sensor
KR20160051804A (ko) 물리 평면의 디지털 표현의 확장
US20130071008A1 (en) Image conversion system using edge information
WO2006003577A1 (en) Creating a depth map
CN105139410A (zh) 使用空间截面投影的脑肿瘤mri图像分割算法
CN101739553B (zh) 一种视差图像中目标识别方法
CN103366355A (zh) 增强深度图层次感的方法及系统
Xiao et al. Video based 3D reconstruction using spatio-temporal attention analysis
CN104767985A (zh) 使用区域分布分析以自动检测三维图像格式的方法
Yang et al. Depth map generation from a single image using local depth hypothesis
CN107958226B (zh) 一种道路曲线检测方法、装置和终端
Ramachandran et al. Multiview synthesis from stereo views
CN105141963A (zh) 图像运动估计方法和装置
KR101278636B1 (ko) 2차원 영상을 스테레오스코픽 입체 영상으로 변환하기 위한 객체 검출 방법
CN104867094A (zh) 一种图像处理的方法及电子设备
Kulkarni et al. Generation of depth map based on depth from focus: A survey
CN105893999B (zh) 一种感兴趣区域提取方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150805