CN102427539B - 视频图像2d转3d的方法 - Google Patents

视频图像2d转3d的方法 Download PDF

Info

Publication number
CN102427539B
CN102427539B CN201110247954.9A CN201110247954A CN102427539B CN 102427539 B CN102427539 B CN 102427539B CN 201110247954 A CN201110247954 A CN 201110247954A CN 102427539 B CN102427539 B CN 102427539B
Authority
CN
China
Prior art keywords
video image
pixel
current pixel
surrounding environment
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110247954.9A
Other languages
English (en)
Other versions
CN102427539A (zh
Inventor
庞志勇
陈弟虎
江嘉文
雷东玮
范锡添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
庞志勇
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 庞志勇 filed Critical 庞志勇
Priority to CN201110247954.9A priority Critical patent/CN102427539B/zh
Publication of CN102427539A publication Critical patent/CN102427539A/zh
Application granted granted Critical
Publication of CN102427539B publication Critical patent/CN102427539B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种视频图像2D转3D的方法,它包括:1)对原始视频图像进行小波变换,提取视频图像的高频分量;2)将视频图像分成数个宏块,统计每一宏块中非零系数的数目,作为该宏块的模糊度;3)基于原始视频图像的颜色特征,对原始视频图像进行颜色分割形成三类像素集合;4)比较每一类像素集合的模糊度统计平均值,最大值对应的像素集合看作前景,次大值对应的像素集合看作中景,最小值对应的像素集合看作后景;5)由预设景深系统对前景、中景和后景分别赋以不同的深度值,根据亮度规则渲染出左眼视频图像;6)将原始视频图像作为右眼视频图像,与左眼视频图像合成3D视频图像。

Description

视频图像2D转3D的方法
技术领域
本发明涉及视频处理技术领域和视频图像处理技术领域,具体来说,涉及一种视频图像2D转3D的方法。
背景技术
2010年被称为“3D消费元年”,各种3D消费电子产品层出不穷,并逐渐受到人们的青睐,而3D电视更是陆续走入普通家庭,为观众带来非凡的视觉体验,但是,由于昂贵的制作成本,3D片源非常缺乏,而2D片源仍然占据主流地位,这成为3D电视普及过程中尤其突出的问题。
为了暂时缓解3D片源缺乏的问题,2D转3D技术应运而生,并得到广泛的重视,国内外的厂商纷纷推出具备2D转3D功能的电视,但电视价格昂贵,令一般消费者难以接受,因此,逼切需要一种经济实用的2D转3D技术。
发明内容
针对以上的不足,本发明提供了一种视频图像2D转3D的方法,它包括:1)对原始视频图像进行小波变换,提取视频图像的高频分量;2)将视频图像分成数个宏块,统计每一宏块中非零系数的数目,作为该宏块的模糊度;3)基于原始视频图像的颜色特征,对原始视频图像进行颜色分割形成三类像素集合;4)比较每一类像素集合的模糊度统计平均值,最大值对应的像素集合看作前景,次大值对应的像素集合看作中景,最小值对应的像素集合看作后景;5)由预设景深系统对前景、中景和后景分别赋以不同的深度值,再根据亮度规则渲染出左眼视频图像;6)将原始视频图像作为右眼视频图像,与左眼视频图像合成3D视频图像。
所述步骤3)对原始视频图像进行颜色分割采用K-means的聚类方法,它包括:
31)从N个数据对象中任意选择K个对象作为初始聚类中心,对于剩下的数据对象,根据它们与这些聚类中心的相似度,将它们分配给最相似的聚类,其中N为视频图像的像素数,K为聚类数;
32)计算每种聚类中新的聚类中心,该新的聚类中心为该类中所有数据对象的平均值;
33)不断重复步骤32)的过程,直到每个聚类的聚类中心与初始的聚类中心相同,聚类结束。
所述步骤5)中的亮度规则具体为:
51)首先,判断当前像素是属于前景,中景,还是后景,然后,判断当前像素的周围环境的明暗,
52)如果当前像素属于前景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边,
53)如果当前像素属于中景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边,
54)如果当前像素属于后景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边。
所述步骤51)判断当前像素的周围环境的明暗的方法具体为:计算视频图像中每一个像素邻域的亮度平均值,若亮度平均值大于亮度最大值的一半,则认为当前像素的周围环境较亮,否则认为当前像素的周围环境较暗。
本发明的有益效果:本发明的视频图像2D转3D的方法只需单视频图像就可以产生左右眼视频图像,无需多视频图像输入;可用软件实现,也可以软硬件协同实现,实现方式灵活;适用于视频和视频图像的2D转3D,可用于一般情况;可生成适用于多种输出方式的3D视频图像,既能在普通电视上观看,也能在高清电视上观看。
附图说明
图1为本发明的视频图像2D转3D的方法流程图;
图2为本发明的颜色分割的方法流程图。
具体实施方式
下面结合附图对本发明进行进一步阐述。
如图1所示,本发明的视频图像2D转3D的方法具体包括如下步骤:
首先,估计视频图像的模糊度信息,用如下方法执行:
(1.1)先对视频图像进行小波变换,提取视频图像的高频分量。为简单起见,可采用基于提升算法的5/3小波变换,其公式如下所示:
c ( 2 n + 1 ) = x ( 2 n + 1 ) - [ x ( 2 n ) + x ( 2 n + 2 ) 2 ]
d ( 2 n ) = x ( 2 n ) + [ c ( 2 n + 1 ) + c ( 2 n + 1 ) + 2 4 ]
其中,x(n)表示视频图像灰度值,c(n)表示小波变换后的高频系数,d(n)表示小波变换后的低频系数,n是整数。
只取小波变换后视频图像的高频分量,所以可用一个3*3大小的卷积核 h = 0 , - 1,0 - 1,4 , - 1 0 , - 1,0 与视频图像卷积,遍历视频图像中的每一个像素,其中,对于超出视频图像边界的邻域像素,可用0来处理。
(1.2)把视频图像分成小块,如8*8宏块。统计每一宏块中非零系数的数目,作为该宏块的模糊度,其中,宏块的非零系数越多,其模糊度越低。
然后,基于视频图像的颜色特征,对视频图像进行颜色分割,本发明采用K-means的聚类算法,如图2所示,按以下步骤执行:
(2.1)首先从N个数据对象(其中N为视频图像的像素数)任意选择K个对象作为初始聚类中心(其中K为聚类数)。而对于剩下的数据对象,则根据它们与这些聚类中心的相似度(可用欧氏距离来衡量),将它们分配给最相似的聚类。
(2.2)然后,计算每种聚类中新的聚类中心,该新的聚类中心为该类中所有数据对象的平均值。
(2.3)这样,不断重复(2.2)的过程,直到每个聚类的聚类中心与初始的聚类中心相同,这时聚类结束。在实际中,通常只要每个聚类的聚类中心与初始的聚类中心相差一个很小的值,就可以认为聚类结束。
接着,由颜色分割可以把视频图像分割成三类像素集合,比较每一类像素集合的模糊度统计平均值,最大值对应的像素集合看作前景,次大值对应的像素集合看作中景,最小值对应的像素集合看作后景。
再由预设景深系统对前景、中景和后景分别赋以不同的深度值,根据亮度规则渲染出左眼视频图像,所述的亮度规则具体为:
(4.1)判断当前像素是属于前景,中景,还是后景。然后,判断当前像素的周围环境的明暗。
(4.2)如果当前像素属于前景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边。
(4.3)如果当前像素属于中景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边。
(4.4)如果当前像素属于后景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边。
用下述方法判断当前像素的周围环境的明暗:计算视频图像中每一个像素邻域的亮度平均值,若亮度平均值大于亮度最大值的一半,则认为当前像素的周围环境较亮,否则认为当前像素的周围环境较暗。对于有部分邻域像素超出视频图像边界的问题,可以采用边界扩展的方法解决。
最后,将原始视频图像作为右眼视频图像,与左眼视频图像合成3D视频图像。
在合成3D视频图像的方式中,可根据实际的显示设备而采取不同的合成方式:
(1)对于普通显示设备,可采用色分法,把左右眼视频图像映射到互补的颜色域中。
(2)对于高清显示设备,可采用时分法,利用帧隙分别输出左眼视频图像和右眼视频图像。
以上所述仅为本发明的较佳实施方式,本发明并不局限于上述实施方式,在实施过程中可能存在局部微小的结构改动,如果对本发明的各种改动或变型不脱离本发明的精神和范围,且属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变型。

Claims (3)

1.一种视频图像2D转3D的方法,其特征在于,它包括: 
1)对原始视频图像进行小波变换,提取视频图像的高频分量; 
2)将视频图像分成数个宏块,统计每一宏块中非零系数的数目,作为该宏块的模糊度; 
3)基于原始视频图像的颜色特征,对原始视频图像进行颜色分割形成三类像素集合; 
4)比较每一类像素集合的模糊度统计平均值,最大值对应的像素集合看作前景,次大值对应的像素集合看作中景,最小值对应的像素集合看作后景; 
5)由预设景深系统对前景、中景和后景分别赋以不同的深度值,再根据亮度规则渲染出左眼视频图像; 
6)将原始视频图像作为右眼视频图像,与左眼视频图像合成3D视频图像;其中 
所述步骤5)中的亮度规则具体为: 
51)首先,判断当前像素是属于前景,中景,还是后景,然后,判断当前像素的周围环境的明暗, 
52)如果当前像素属于前景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边, 
53)如果当前像素属于中景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边, 
54)如果当前像素属于后景,当周围环境较亮时,根据预设深度把当前像素移动到右眼视频图像对应像素的右边;当周围环境较暗时,根据预设深度把当前像素移动到右眼视频图像对应像素的左边。
2.根据权利要求1所述的视频图像2D转3D的方法,其特征在于,所述步骤3)对原始视频图像进行颜色分割采用K-means的聚类方法,它包括: 
31)从N个数据对象中任意选择K个对象作为初始聚类中心,对于剩下的数据对象,根据它们与这些聚类中心的相似度,将它们分配给最相似的聚类,其中N为视频图像的像素数,K为聚类数; 
32)计算每种聚类中新的聚类中心,该新的聚类中心为该类中所有数据对象的平均值; 
33)不断重复步骤32)的过程,直到每个聚类的聚类中心与初始的聚类中心相同,聚类结束。 
3.根据权利要求1所述的视频图像2D转3D的方法,其特征在于,所述步骤51)判断当前像素的周围环境的明暗的方法具体为:计算视频图像中每一个像素邻域的亮度平均值,若亮度平均值大于亮度最大值的一半,则认为当前像素的周围环境较亮,否则认为当前像素的周围环境较暗。 
CN201110247954.9A 2011-08-26 2011-08-26 视频图像2d转3d的方法 Expired - Fee Related CN102427539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110247954.9A CN102427539B (zh) 2011-08-26 2011-08-26 视频图像2d转3d的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110247954.9A CN102427539B (zh) 2011-08-26 2011-08-26 视频图像2d转3d的方法

Publications (2)

Publication Number Publication Date
CN102427539A CN102427539A (zh) 2012-04-25
CN102427539B true CN102427539B (zh) 2014-08-27

Family

ID=45961474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110247954.9A Expired - Fee Related CN102427539B (zh) 2011-08-26 2011-08-26 视频图像2d转3d的方法

Country Status (1)

Country Link
CN (1) CN102427539B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI610271B (zh) * 2016-07-11 2018-01-01 龍華科技大學 結合小波轉換及角點偵測建立單張影像深度圖的裝置及其方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HK1224513A (zh) 2016-10-14 2017-08-18 萬維數碼有限公司 通過機器學習技術改進 的自動轉換質量的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271578A (zh) * 2008-04-10 2008-09-24 清华大学 一种平面视频转立体视频技术中的深度序列生成方法
CN101563935A (zh) * 2006-12-19 2009-10-21 皇家飞利浦电子股份有限公司 将二维视频转换为三维视频的方法和系统
CN101621672A (zh) * 2009-03-10 2010-01-06 北京中星微电子有限公司 一种视频清晰度分析方法及装置
CN101945301A (zh) * 2010-09-28 2011-01-12 彩虹集团公司 一种人物场景2d转3d方法
CN102136059A (zh) * 2011-03-03 2011-07-27 苏州市慧视通讯科技有限公司 一种基于视频分析的烟雾检测方法
CN102137267A (zh) * 2011-03-28 2011-07-27 彩虹集团公司 一种人物场景2d转3d算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101563935A (zh) * 2006-12-19 2009-10-21 皇家飞利浦电子股份有限公司 将二维视频转换为三维视频的方法和系统
CN101271578A (zh) * 2008-04-10 2008-09-24 清华大学 一种平面视频转立体视频技术中的深度序列生成方法
CN101621672A (zh) * 2009-03-10 2010-01-06 北京中星微电子有限公司 一种视频清晰度分析方法及装置
CN101945301A (zh) * 2010-09-28 2011-01-12 彩虹集团公司 一种人物场景2d转3d方法
CN102136059A (zh) * 2011-03-03 2011-07-27 苏州市慧视通讯科技有限公司 一种基于视频分析的烟雾检测方法
CN102137267A (zh) * 2011-03-28 2011-07-27 彩虹集团公司 一种人物场景2d转3d算法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
《基于模糊度的图像阈值分割法》;曾国辉等;《微型电脑应用》;20031231;第19卷(第2期);第10-11页 *
前景时空域分析和背景理解相结合的2D/3D视频转换方法;李乐等;《计算机辅助设计与图形学学报》;20110531;第23卷(第5期);第899-906页 *
基于模糊度测度和改进遗传算法的图像分割;郑松峰等;《信号处理》;20030228;第19卷(第1期);第15-18页 *
曾国辉等.《基于模糊度的图像阈值分割法》.《微型电脑应用》.2003,第19卷(第2期),
李乐等.前景时空域分析和背景理解相结合的2D/3D视频转换方法.《计算机辅助设计与图形学学报》.2011,第23卷(第5期),
郑松峰等.基于模糊度测度和改进遗传算法的图像分割.《信号处理》.2003,第19卷(第1期),

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI610271B (zh) * 2016-07-11 2018-01-01 龍華科技大學 結合小波轉換及角點偵測建立單張影像深度圖的裝置及其方法

Also Published As

Publication number Publication date
CN102427539A (zh) 2012-04-25

Similar Documents

Publication Publication Date Title
CN102881026B (zh) 一种具有透明度信息的图像的调色板装置与生成方法
EP3149706B1 (en) Image refocusing for camera arrays
CN101873509B (zh) 消除深度图序列背景和边缘抖动的方法
CN104937927A (zh) 2维图像或视频到3维立体图像或视频的实时自动转换
CN106341676B (zh) 基于超像素的深度图像预处理和深度空洞填充方法
CN102572465A (zh) 用于使用深度图信息的多视图像生成的装置和方法
CN103810681B (zh) 一种低功耗对比度增强方法
CN112866803B (zh) 电子装置及其控制方法
CN103258332A (zh) 一种抗光照变化的运动目标检测方法
CN106296620A (zh) 一种基于直方图平移的色彩还原方法
CN103702116A (zh) 一种图像的宽动态压缩方法和装置
CN103106671B (zh) 一种基于视觉注意机制的图像感兴趣区域检测方法
CN104065944B (zh) 一种超高清三维转换装置及三维显示系统
CN102427539B (zh) 视频图像2d转3d的方法
CN104239883A (zh) 纹理特征提取方法及装置
CN102223545B (zh) 一种快速多视点视频颜色校正方法
CN105488769A (zh) 一种实时视频去雾方法
CN101873506B (zh) 提供深度信息的影像处理方法及其影像处理系统
CN103824250A (zh) 基于gpu的图像色调映射方法
CN103595933A (zh) 一种图像的降噪方法
CN107203979B (zh) 一种低照度图像增强的方法
CN103458307B (zh) 图像处理方法和装置
CN111383289A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质
CN115170921A (zh) 一种基于双边网格学习和边缘损失的双目立体匹配方法
CN104320649B (zh) 一种基于全概率模型的多视点深度图增强方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ZHONGSHAN UNIVERSITY

Free format text: FORMER OWNER: PANG ZHIYONG

Effective date: 20150309

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 510515 GUANGZHOU, GUANGDONG PROVINCE TO: 510275 GUANGZHOU, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20150309

Address after: 510275 Xingang West Road, Guangdong, China, No. 135, No.

Patentee after: Sun Yat-sen University

Address before: 2001, room 510515, building B, 1994 Guangzhou Avenue, Guangzhou, Guangdong

Patentee before: Pang Zhiyong

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140827

Termination date: 20160826