CN101287143A - 基于实时人机对话的平面视频转立体视频的方法 - Google Patents

基于实时人机对话的平面视频转立体视频的方法 Download PDF

Info

Publication number
CN101287143A
CN101287143A CNA2008101117746A CN200810111774A CN101287143A CN 101287143 A CN101287143 A CN 101287143A CN A2008101117746 A CNA2008101117746 A CN A2008101117746A CN 200810111774 A CN200810111774 A CN 200810111774A CN 101287143 A CN101287143 A CN 101287143A
Authority
CN
China
Prior art keywords
key frame
video
foreground object
frame
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101117746A
Other languages
English (en)
Other versions
CN101287143B (zh
Inventor
戴琼海
尤志翔
刘继明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shengyang Information Technology Industry Co., Ltd.
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2008101117746A priority Critical patent/CN101287143B/zh
Publication of CN101287143A publication Critical patent/CN101287143A/zh
Application granted granted Critical
Publication of CN101287143B publication Critical patent/CN101287143B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及基于实时人机对话的平面视频转立体视频的方法,属于计算机多媒体技术领域,该方法包括:计算机将整个视频序列划分成内容相关的子序列;用户指定每个子序列中任意一帧作为关键帧;计算机对所有平面视频帧进行滤波,增强图像边缘信息,锐化视频帧前景物体的边缘;对关键帧和非关键帧的进行前景物体分割,并提取轮廓曲线和深度图,直到生成原平面视频序列所有帧对应的深度图序列;再利用平滑后的深度图序列渲染生成每一时刻所对应的多个视角的视图,并合成立体视频帧;将各个时刻的立体视频帧组成立体视频序列。本发明基于实时人机对话,可以得到每一帧的精确深度图,从而很好地实现平面视频转立体视频,最终得到效果较好的立体视频。

Description

基于实时人机对话的平面视频转立体视频的方法
技术领域
本发明属于计算机多媒体技术领域,特别涉及一种将普通平面视频转为立体视频的技术。
技术背景
通过对人类生理立体视觉要素的研究发现,人类左右眼看同一场景时因存在“视差”而产生立体感,所谓“视差”即三维空间中同一物体在左右眼成像时会有水平方向上的位移。传统的视频序列都是单路的平面视频序列,而立体视频序列则包含了多路(两路或两路以上)平面视频序列,各路平面视频序列同一时刻的视图之间带有“视差”信息,能够为观看者提供对应的左眼视图序列和右眼视图序列,这也是观看立体视频时可以产生如临其境的立体感的原因。
一直以来,真实感立体视频以其场景的真实感,很强的视觉冲击力,受到大众的喜爱,也被电视、电影、广告等行业所重视。早期的立体显示方式,需要一定的辅助工具(如偏振眼镜等),从而限制了立体视频的应用范围。随着立体显示技术的发展,现有裸眼立体显示技术(如裸眼自由式多视点显示技术、裸眼双目立体显示技术)已经逐渐成熟,可以实现无需佩戴特殊的辅助工具的立体视频直接呈现。目前,裸眼立体显示技术的成熟和立体视频应用的逐渐普及,对相应的立体视频内容生成技术提出了很高的要求。
立体视频的内容生成技术是相关计算机多媒体领域内的重要难题之一:一方面,由于直接拍摄多路立体视频的设备成本高、技术难度大,而且单镜头拍摄方式在未来相当长一段时间内仍然会占主流;另一方面,现有的平面视频内容数量庞大,将平面视频转为立体视频具有极大的现实意义和商业价值,而平面视频转立体视频技术也正在得到越来越多的重视。
计算机视觉领域的理论指出,相对于给定的观察位置(如摄像机或者人眼),某点的“视差”与其所在三维空间中的深度(depth value,即该点在三维空间中的位置与观察位置的实际距离)成反比。深度越大(离观察位置距离越远)的物体,产生的视差越小,而无穷远点的视差则对应为0;反之,深度越小的物体(离观察位置距离越近),其产生的视差则越大。如果从某一观察位置获取了三维空间的平面视图,那么该平面视图中每一个像素的深度值便组成了该平面视图对应的深度图(depth map)。基于某一观察位置所获取的平面视图和对应深度图,计算机就可以通过视觉理论中的插值渲染算法,自动得到三维空间在观察位置相邻视角所成像的多路虚拟平面视图。原平面视图与这些多路虚拟视图一同构成了立体视频所需的多路视角图像,最终合成相应的立体视频。
平面视频转换为立体视频的过程,就是一个提取单路平面视频序列每帧视图所对应的深度信息,并通过深度信息插值渲染生成多路视频序列,即立体视频的过程。基于深度信息的渲染(Depth Image Based Rendering,DIBR)算法是计算机多媒体技术领域的一种成熟算法,因而平面视频转换成立体视频的关键,在于如何提取单路平面视频序列所对应的深度信息。目前,现有的平面视频转立体视频技术方案主要分为基于人机交互手动提取和基于计算机算法自动提取两类:
1)用户通过计算机屏幕,利用图像或视频编辑软件,对单路平面视频每一帧手动地进行前景物体分割,并根据视频序列的内容,即序列中前后景物体的位置和运动关系,进行深度赋值,从而得到单路平面视频序列所对应的深度图序列。该技术方案的优势在于前景物体的手动分割结果可以达到较高的精度,同时操作灵活,深度图视觉质量较好;而不足之处则在于,逐帧手动分割和提取深度图的效率不高,进行大规模商业应用的人工成本太高。
2)基于计算机算法自动提取单路平面视频序列的深度图过程则主要利用现有计算机算法自动完成该视频序列中每一帧的前景物体分割,从而大大降低了用户转换的工作量,提高了转换的效率。然而,利用该技术方案所生成的立体视频的效果,依赖于分割算法的精度,而现有计算机自动分割算法对于视频序列内容的依赖性比较高,算法的鲁棒性较低。另外,还没有成熟的前后景物体位置判断和运动关系分析算法,因此用户需要人工进行对应的深度赋值。
本发明中涉及到的成熟算法:
1)视频子序列划分和镜头检测技术:
镜头检测算法是基于内容的视频检索技术的一部分,其特点在于能够方便地利用计算机对视频数据进行处理以产生适当的摘要,从而更加全面地表示、处理、组织和获取视频数据。视频中的一个镜头是指用同一摄像机进行连续不间断拍摄、表示时间和空间上的一个连续动作的帧序列;从内容的上下文语义上讲,镜头是视频序列内容的基本单元,而镜头边缘检测则是对应的功能算法,通过对视频帧特定的图像信息进行分析(如亮度变化、直方图分布、运动估计、边缘图等),利用视频序列镜头边缘若干帧特定信息的突变,来检测视频子序列,完成视频子序列划分和关键帧提取。
2)图像增强技术与图像锐化:
图像锐化是图像增强技术的一种。图像锐化处理的目的,是为了使图像的边缘、轮廓线以及图像的细节变得清晰。从频率域来考虑,图像模糊和不清晰的实质是因为其高频分量被衰减,因此可以用高通滤波器来使图像清晰。在本专利中,我们选择一种简单的高频滤波算法来实现图像增强的目的,即将拉普拉斯算子滤波后的图像与原始图像作差,来得到边缘锐化和增强的图像。
3)图像平滑与高斯滤波:
图像平滑的作用主要在于消除噪声。一般来说,图像的能量主要集中在其低频部分,噪声所在的频段主要在高频段。因此,对图像进行平滑可以采用低通滤波的方法去除高频干扰。一种简单的空域图像平滑方法:在图像上使用一个较小的滑动窗口,每次对窗口内所有像素点的亮度值进行高斯滤波,并将卷积结果作为窗口中心点像素的亮度值;同时,也通过对相邻时刻视频序列对应位置的像素进行平滑,获得相邻帧之间的平滑结果。
4)基于深度图的立体渲染算法(DIBR)和立体视频生成
在不同的观察位置(观察视角)成像的视图中,三维空间中的点与摄像机中心的距离(景深信息),表现为平面视图中成像点坐标的位移(即“视差”);而该“视差”信息和景深(即深度值)成反比关系。DIBR渲染算法基于一个观察位置上所得的平面视图中每个像素所对应的深度信息,计算该像素点的“视差”值,并进行相应的坐标位移;对该视图中每一个像素进行移动后,便生成了该观察视角相邻位置上成像虚拟平面视图;而利用这些带有“视差”信息的多路视图,便能合成多路立体显示设备所需要的立体视图。
发明内容
本发明的目的是为改进现有平面视频转立体视频方法的不足,提出一种基于实时人机对话的平面视频转立体视频方法。该方法基于实时人机对话,可以提取单路平面视频序列每一帧的精确深度图,得到效果较好的立体视频序列,从而实现从平面视频到立体视频的转换过程;该方法能同时满足转换效果和转换效率这两个要求。
本发明提出一种基于实时人机对话的平面视频转立体视频方法,包括以下步骤:
1)基于镜头检测技术,计算机自动对要处理的平面视频序列,按照相邻视频帧内容的上下文关系,将整个视频序列划分成内容相关的子序列;同时,用户通过计算机屏幕指定每个子序列中任意一帧作为关键帧,其余作为非关键帧;
2)基于拉普拉斯算子,计算机自动对所有平面视频帧进行滤波,增强图像边缘信息,锐化视频帧前景物体的边缘,突出对应的前景物体的轮廓;
3)用户基于实时人机对话,对关键帧进行前景物体分割,并提取轮廓曲线和深度图;
4)用户基于实时人机对话,对非关键帧的前景物体进行分割和提取轮廓曲线;
5)用户基于实时人机对话,提取非关键帧的深度图;
6)重复步骤4)~5),直到生成该视频子序列中所有非关键帧的深度图;
7)重复步骤3)~6),直到生成原平面视频序列所有帧对应的深度图序列;
8)计算机自动对深度图序列中每一帧深度图进行高斯平滑处理,消除立体视图渲染时的边缘抖动;
9)基于DIBR算法,计算机自动将原视频序列的每一帧作为参考视图,利用平滑后的深度图序列渲染生成每一时刻所对应的多个视角的视图;然后,根据特定立体显示设备的要求,将每一个时刻多个视角的视图合成为该时刻对应的立体视频帧;
10)计算机自动将每个时刻的立体视频帧组成立体视频序列。
本发明的特点及有益效果:
1)本发明方法的特点和优势在于:首先,通过人机实时对话,得到平面视频序列里关键帧的精确分割结果和深度图;其次,计算机自动利用视频帧之间的内容相关性,将关键帧的分割结果和深度图作为非关键帧处理的初始值;然后,用户通过计算机屏幕手动进行局部调整,得到准确的非关键帧深度图;最后,基于深度信息,生成对应的立体视频序列;
2)该方法结合了计算机算法和实时人机对话,仅需要用户手动转换少量的关键帧和细调非关键帧的计算机自动处理结果,能够高效和精确地得到视频帧前景物体分割结果和对应的深度图;而现有的平面视频转立体视频方法,即用户手动逐帧转换方法和计算机自动转换方法,都难以同时满足转换效果和转换效率这两个要求;
3)本发明方法的特点和优势还在于,利用图像边缘锐化的增强技术,强化视频序列的边缘轮廓,以方便用户进行前景对象分割和轮廓提取的人机交互操作;
4)本发明方法的特点和优势又体现在,利用视频序列相邻帧之间的内容相关性,将参考帧的前景物体轮廓曲线和对应的前景物体深度值,直接作为相邻帧前景物体分割和深度赋值的初始值,从而提高转换的效率;同时,由于在非关键帧中只需要进行前景物体轮廓曲线的局部调整和对应的深度细调,因此可以保证较高的相邻帧前景物体分割精度和相邻帧前景物体轮廓曲线的一致性,减少渲染后立体视频序列中因相邻帧前景物体轮廓的不连续而造成的前景物体边缘抖动,获得更好的立体视频质量;
5)本发明方法的特点和优势最后还体现在,对深度图进行平滑的后处理技术,可以减少因前景物体分割不准和图像噪声等因素所造成的误差,并改善这些误差对立体视频渲染质量的影响。
附图说明
图1为本发明方法总体流程框图。
图2为本发明的实施例中待处理的平面视频序列的关键帧图像。
图3为对关键帧进行图像增强的结果图。
图4为生成的关键帧的深度图。
图5本实施例对深度图进行平滑滤波的过程。
具体实施方式
本发明提出一种基于实时人机对话的平面视频转立体视频的方法,其具体实施方法,结合流程图(如图1所示),说明如下:
1)基于镜头检测技术,计算机自动对要处理的平面视频序列,按照相邻视频帧内容的上下文关系,将整个视频序列划分成内容相关的子序列;同时,用户通过计算机屏幕指定每个子序列中任意一帧作为关键帧,其余作为非关键帧;
2)基于拉普拉斯算子,计算机自动对所有平面视频帧进行滤波,增强图像边缘信息,锐化视频帧前景物体的边缘,突出对应的前景物体的轮廓;
3)对关键帧进行前景物体分割,并提取轮廓曲线和深度图:
31)用户通过计算机屏幕,基于图像编辑软件工具,勾勒出边缘锐化后的关键帧中每一个前景物体的轮廓,得到对应的前景物体轮廓曲线;每一条轮廓曲线包围的区域为前景物体,所有轮廓曲线以外的区域为背景区域,由此完成关键帧的前景物体分割;
32)根据关键帧前景物体的特点,用户通过计算机屏幕以输入数值的方式,指定轮廓曲线所围区域内每个像素的深度值(像素的深度值以一整数表示,取值范围为大于0,小于等于255,表示该像素的空间位置离摄像机的距离;深度值0,表示空间位置在距离摄像机无限远处,而深度值255则表示距离摄像机最近的空间位置);同时,指定背景区域像素的深度值为0,得到关键帧的深度图;
4)对非关键帧的前景物体进行分割和提取轮廓曲线:
41)计算机自动将关键帧每一个前景物体的轮廓曲线复制到相邻非关键帧的对应位置,作为非关键帧前景物体轮廓曲线的初始位置;
42)用户通过计算机屏幕,基于图像编辑软件工具,对轮廓曲线进行局部位置调整,得到精确的非关键帧前景物体轮廓曲线;该非关键帧中每一条轮廓曲线包围的区域为非关键帧的前景物体,所有轮廓曲线以外的区域为非关键帧的背景区域,由此完成非关键帧的前景物体分割;
5)提取非关键帧的深度图:
51)计算机自动将关键帧前景物体的深度值,复制到非关键帧对应的前景物体轮廓曲线所包围的区域,作为非关键帧前景物体的初始深度值;赋予非关键帧背景区域深度值为0;
52)用户通过计算机屏幕根据视频序列中前景物体的运动特点,对非关键帧中前景物体的深度值进行细调,从而得到非关键帧的深度图;
6)重复步骤4)~5),直到生成该视频子序列中所有非关键帧的深度图;
7)重复步骤3)~6),直到生成原平面视频序列所有帧对应的深度图序列;
8)计算机自动对深度图序列中每一帧深度图进行高斯平滑处理,消除立体视图渲染时的边缘抖动;
9)基于DIBR算法,计算机自动将原视频序列的每一帧作为参考视图,利用平滑后的深度图序列渲染生成每一时刻所对应的多个视角的视图;然后,根据特定立体显示设备的要求,将每一个时刻多个视角的视图合成为该时刻对应的立体视频帧;
10)计算机自动将每个时刻的立体视频帧组成立体视频序列。
本发明提出的基于实时人机对话的平面视频转立体视频方法实施例,结合附图,包括以下步骤:
1)基于镜头检测技术,计算机自动对要处理的平面视频序列,按照相邻视频帧内容的上下文关系,将整个视频序列划分成内容相关的子序列;同时,用户通过计算机屏幕指定每个子序列中任意一帧作为关键帧,其余作为非关键帧;本实施例的子序列如图2所示包括5个视频帧,指定其中任意一帧为关键帧,图2中用黑色框标出的第一帧作为关键帧,其余4帧为非关键帧;
2)基于拉普拉斯算子,计算机自动对所有平面视频帧进行滤波,增强图像边缘信息,锐化视频帧前景物体的边缘,突出对应的前景物体的轮廓;以关键帧为例,如图3(a)所示,由于背景复杂,前景人物的某些边缘部分和背景难以区分,造成用户提取轮廓和进行前景物体分割时的困难;而使用拉普拉斯算子对关键帧进行滤波,如图3(b)所示,并将关键帧与滤波后的图像作差后得到增强的关键帧图像,如图3(c)所示;在边缘增强的图像中,关键帧中对象的轮廓更加分明用户更容易分割前景物体和背景区域,从而有效提取前景物体轮廓;
3)对关键帧进行前景物体分割,并提取轮廓曲线和深度图:
31)用户通过计算机屏幕,基于图像编辑软件工具,勾勒出边缘锐化后的关键帧中每一个前景物体的轮廓,得到对应的前景物体轮廓曲线;每一条轮廓曲线包围的区域为前景物体,所有轮廓曲线以外的区域为背景区域,如图4(a)中的黑色区域),由此完成关键帧的前景物体分割;
32)根据关键帧前景物体的特点,用户通过计算机屏幕以输入数值的方式,指定轮廓曲线所围区域内每个像素的深度值(像素的深度值以一整数表示,取值范围为大于0,小于等于255,表示该像素的空间位置离摄像机的距离;深度值0,表示空间位置在距离摄像机无限远处,而深度值255则表示距离摄像机最近的空间位置);同时,指定背景区域像素的深度值为0,得到关键帧的深度图;如图4(a)所示,背景为最大景深,对应深度值为0,前景5个物体:左边1个、中间2个、右边2个分别对应深度值为200、220、240;
4)对非关键帧的前景物体进行分割和提取轮廓曲线:
41)计算机自动将关键帧每一个前景物体的轮廓曲线复制到相邻非关键帧的对应位置,作为非关键帧前景物体轮廓曲线的初始位置;
42)用户通过计算机屏幕,基于图像编辑软件工具,对轮廓曲线进行局部位置调整,得到精确的非关键帧前景物体轮廓曲线;该非关键帧中每一条轮廓曲线包围的区域为非关键帧的前景物体,所有轮廓曲线以外的区域为非关键帧的背景区域,由此完成非关键帧的前景物体分割;
5)提取非关键帧的深度图:
51)计算机自动将关键帧前景物体的深度值,复制到非关键帧对应的前景物体轮廓曲线所包围的区域,作为非关键帧前景物体的初始深度值;赋予非关键帧背景区域深度值为0;
52)用户通过计算机屏幕根据视频序列中前景物体的运动特点,对非关键帧中前景物体的深度值进行细调,从而得到非关键帧的深度图;一非关键帧的深度图如图4(b)。可以看到该实施例中各帧的前景物体分割结果基本一致,局部位置稍有调整,而深度赋值没有变化,大大降低了转换过程中的用户操作;
6)重复步骤4)~5),直到生成该视频子序列中所有非关键帧的深度图;
7)重复步骤3)~6),直到生成原平面视频序列所有帧对应的深度图序列;
8)计算机自动对深度图序列中每一帧深度图进行高斯平滑处理,消除立体视图渲染时的边缘抖动;基于深度信息的立体视频渲染(DIBR算法)效果,对深度信息的精度比较敏感;而在深度图中,当前景物体边缘处深度值突变很快时,前景物体分割时的误差就会在基于深度信息的立体视频渲染过程中造成更严重的边缘抖动问题,影响渲染效果和立体视频质量;通过平滑深度图在边缘处的深度突变,就能改善边缘抖动问题;在本实施例里平滑过程实现为前景物体的深度值保持不变,仅在边缘深度突变处进行了深度值平滑;平滑前的关键帧深度图如图5(a),平滑后的关键帧深度图如图5(b),平滑前的深度图序列如图5(c),平滑后的深度图序列如图5(d);
9)基于DIBR算法,计算机自动将原视频序列的每一帧作为参考视图,利用平滑后的深度图序列渲染生成每一时刻所对应的多个视角的视图;然后,根据特定立体显示设备的要求,将每一个时刻多个视角的视图合成为该时刻对应的立体视频帧;
10)计算机自动将每个时刻的立体视频帧组成立体视频序列。

Claims (4)

1、一种基于实时人机对话的平面视频转立体视频方法,包括以下步骤:
1)基于镜头检测技术,计算机自动对要处理的平面视频序列,按照相邻视频帧内容的上下文关系,将整个视频序列划分成内容相关的子序列;同时,用户通过计算机屏幕指定每个子序列中任意一帧作为关键帧,其余作为非关键帧;
2)基于拉普拉斯算子,计算机自动对所有平面视频帧进行滤波,增强图像边缘信息,锐化视频帧前景物体的边缘,突出对应的前景物体的轮廓;
3)用户基于实时人机对话,对关键帧进行前景物体分割,并提取轮廓曲线和深度图;
4)用户基于实时人机对话,对非关键帧的前景物体进行分割和提取轮廓曲线;
5)用户基于实时人机对话,提取非关键帧的深度图;
6)重复步骤4)~5),直到生成该视频子序列中所有非关键帧的深度图;
7)重复步骤3)~6),直到生成原平面视频序列所有帧对应的深度图序列;
8)计算机自动对深度图序列中每一帧深度图进行高斯平滑处理,消除立体视图渲染时的边缘抖动;
9)基于DIBR算法,计算机自动将原视频序列的每一帧作为参考视图,利用平滑后的深度图序列渲染生成每一时刻所对应的多个视角的视图;然后,根据特定立体显示设备的要求,将每一个时刻多个视角的视图合成为该时刻对应的立体视频帧;
10)计算机自动将每个时刻的立体视频帧组成立体视频序列。
2、如权利要求1所述的方法,其特征在于,所述步骤3)用户基于实时人机对话,对关键帧进行前景物体分割,并提取轮廓曲线和深度图,具体步骤包括:
31)用户通过计算机屏幕,基于图像编辑软件工具,勾勒出边缘锐化后的关键帧中每一个前景物体的轮廓,得到对应的前景物体轮廓曲线;每一条轮廓曲线包围的区域为前景物体,所有轮廓曲线以外的区域为背景区域,由此完成关键帧的前景物体分割;
32)根据关键帧前景物体的特点,用户通过计算机屏幕以输入数值的方式,指定轮廓曲线所围区域内每个像素的深度值,取值范围为大于0,小于等于255的一整数;同时,指定背景区域像素的深度值为0,得到关键帧的深度图。
3、如权利要求1所述的方法,其特征在于,所述步骤4)用户基于实时人机对话,对非关键帧的前景物体进行分割和提取轮廓曲线,具体步骤包括:
41)计算机自动将关键帧每一个前景物体的轮廓曲线复制到相邻非关键帧的对应位置,作为非关键帧前景物体轮廓曲线的初始位置;
42)用户通过计算机屏幕,基于图像编辑软件工具,对轮廓曲线进行局部位置调整,得到精确的非关键帧前景物体轮廓曲线;该非关键帧中每一条轮廓曲线包围的区域为非关键帧的前景物体,所有轮廓曲线以外的区域为非关键帧的背景区域,由此完成非关键帧的前景物体分割。
4、如权利要求1所述的方法,其特征在于,所述步骤5)用户基于实时人机对话,提取非关键帧的深度图,具体步骤包括:
51)计算机自动将关键帧前景物体的深度值,复制到非关键帧对应的前景物体轮廓曲线所包围的区域,作为非关键帧前景物体的初始深度值;赋予非关键帧背景区域深度值为0;
52)用户通过计算机屏幕根据视频序列中前景物体的运动特点,对非关键帧中前景物体的深度值进行细调,从而得到非关键帧的深度图。
CN2008101117746A 2008-05-16 2008-05-16 基于实时人机对话的平面视频转立体视频的方法 Expired - Fee Related CN101287143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101117746A CN101287143B (zh) 2008-05-16 2008-05-16 基于实时人机对话的平面视频转立体视频的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101117746A CN101287143B (zh) 2008-05-16 2008-05-16 基于实时人机对话的平面视频转立体视频的方法

Publications (2)

Publication Number Publication Date
CN101287143A true CN101287143A (zh) 2008-10-15
CN101287143B CN101287143B (zh) 2010-09-15

Family

ID=40059070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101117746A Expired - Fee Related CN101287143B (zh) 2008-05-16 2008-05-16 基于实时人机对话的平面视频转立体视频的方法

Country Status (1)

Country Link
CN (1) CN101287143B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101562755B (zh) * 2009-05-19 2010-09-01 无锡景象数字技术有限公司 一种由平面视频制作3d视频的方法
CN101867810A (zh) * 2010-04-07 2010-10-20 宁波大学 一种深度视频序列的预处理方法
CN101917643A (zh) * 2010-07-09 2010-12-15 清华大学 一种全自动2d转3d技术中的实时镜头检测方法和装置
CN101945295A (zh) * 2009-07-06 2011-01-12 三星电子株式会社 生成深度图的方法和设备
CN102047669A (zh) * 2008-06-02 2011-05-04 皇家飞利浦电子股份有限公司 具有深度信息的视频信号
CN101562754B (zh) * 2009-05-19 2011-06-15 无锡景象数字技术有限公司 一种改善平面图像转3d图像视觉效果的方法
CN102196292A (zh) * 2011-06-24 2011-09-21 清华大学 基于人机交互生成视频深度图序列的方法及系统
CN102306393A (zh) * 2011-08-02 2012-01-04 清华大学 一种基于轮廓匹配的深度扩散方法及装置
CN102427547A (zh) * 2011-11-15 2012-04-25 清华大学 多视角立体渲染装置
CN102469318A (zh) * 2010-11-04 2012-05-23 深圳Tcl新技术有限公司 一种2d图像转3d图像的方法
CN102486788A (zh) * 2010-12-02 2012-06-06 腾讯科技(深圳)有限公司 一种实现产品检索的方法及装置
CN102883174A (zh) * 2012-10-10 2013-01-16 彩虹集团公司 一种2d转3d的方法
CN103369353A (zh) * 2012-04-01 2013-10-23 兔将创意影业股份有限公司 基于互联网的网络的集成立体转换装置
CN103428514A (zh) * 2012-05-24 2013-12-04 矽统科技股份有限公司 深度图产生装置及方法
CN104246822A (zh) * 2012-03-22 2014-12-24 高通股份有限公司 图像增强
CN106060522A (zh) * 2016-06-29 2016-10-26 努比亚技术有限公司 一种视频图像的处理装置及方法
CN106469138A (zh) * 2016-09-29 2017-03-01 东软集团股份有限公司 词云的生成方法及装置
CN106469464A (zh) * 2015-08-19 2017-03-01 富士通株式会社 用于三维建模目标对象的方法和系统
CN107408153A (zh) * 2015-03-06 2017-11-28 皇家飞利浦有限公司 用于使用运动数据确定休息时段的端点的系统、方法和设备
CN108872245A (zh) * 2018-05-28 2018-11-23 李春莲 一种智能化餐桌油污去除方法
CN109089104A (zh) * 2018-10-18 2018-12-25 看见故事(苏州)影视文化发展有限公司 一种裸眼3d动画图像转化方法
CN109685802A (zh) * 2018-12-13 2019-04-26 贵州火星探索科技有限公司 一种低延迟的视频分割实时预览方法
CN110006087A (zh) * 2018-06-07 2019-07-12 葛高丽 红外反射式取暖器
CN111669567A (zh) * 2019-03-07 2020-09-15 阿里巴巴集团控股有限公司 多角度自由视角视频数据生成方法及装置、介质、服务器
CN112700485A (zh) * 2020-12-31 2021-04-23 重庆电子工程职业学院 图像深度信息提取方法
CN114035871A (zh) * 2021-10-28 2022-02-11 深圳市优聚显示技术有限公司 基于人工智能的3d显示屏的显示方法、系统及计算机设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724530B (zh) * 2012-05-29 2014-10-22 清华大学 基于反馈控制的平面视频立体化方法

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102047669A (zh) * 2008-06-02 2011-05-04 皇家飞利浦电子股份有限公司 具有深度信息的视频信号
CN102047669B (zh) * 2008-06-02 2013-12-18 皇家飞利浦电子股份有限公司 具有深度信息的视频信号
CN101562754B (zh) * 2009-05-19 2011-06-15 无锡景象数字技术有限公司 一种改善平面图像转3d图像视觉效果的方法
CN101562755B (zh) * 2009-05-19 2010-09-01 无锡景象数字技术有限公司 一种由平面视频制作3d视频的方法
CN101945295A (zh) * 2009-07-06 2011-01-12 三星电子株式会社 生成深度图的方法和设备
CN101945295B (zh) * 2009-07-06 2014-12-24 三星电子株式会社 生成深度图的方法和设备
CN101867810A (zh) * 2010-04-07 2010-10-20 宁波大学 一种深度视频序列的预处理方法
CN101917643A (zh) * 2010-07-09 2010-12-15 清华大学 一种全自动2d转3d技术中的实时镜头检测方法和装置
CN101917643B (zh) * 2010-07-09 2012-05-30 清华大学 一种全自动2d转3d技术中的实时镜头检测方法和装置
CN102469318A (zh) * 2010-11-04 2012-05-23 深圳Tcl新技术有限公司 一种2d图像转3d图像的方法
CN102486788A (zh) * 2010-12-02 2012-06-06 腾讯科技(深圳)有限公司 一种实现产品检索的方法及装置
CN102196292A (zh) * 2011-06-24 2011-09-21 清华大学 基于人机交互生成视频深度图序列的方法及系统
CN102306393A (zh) * 2011-08-02 2012-01-04 清华大学 一种基于轮廓匹配的深度扩散方法及装置
CN102306393B (zh) * 2011-08-02 2013-07-17 清华大学 一种基于轮廓匹配的深度扩散方法及装置
CN102427547A (zh) * 2011-11-15 2012-04-25 清华大学 多视角立体渲染装置
CN104246822B (zh) * 2012-03-22 2017-06-06 高通股份有限公司 图像增强
CN104246822A (zh) * 2012-03-22 2014-12-24 高通股份有限公司 图像增强
CN103369353A (zh) * 2012-04-01 2013-10-23 兔将创意影业股份有限公司 基于互联网的网络的集成立体转换装置
CN103428514A (zh) * 2012-05-24 2013-12-04 矽统科技股份有限公司 深度图产生装置及方法
CN103428514B (zh) * 2012-05-24 2016-01-20 矽统科技股份有限公司 深度图产生装置及方法
CN102883174A (zh) * 2012-10-10 2013-01-16 彩虹集团公司 一种2d转3d的方法
US10978194B2 (en) 2015-03-06 2021-04-13 Koninklijke Philips N.V. Systems, methods, and devices for determining endpoints of a rest period using motion data
CN107408153A (zh) * 2015-03-06 2017-11-28 皇家飞利浦有限公司 用于使用运动数据确定休息时段的端点的系统、方法和设备
CN106469464B (zh) * 2015-08-19 2019-02-19 富士通株式会社 用于三维建模目标对象的方法和系统
CN106469464A (zh) * 2015-08-19 2017-03-01 富士通株式会社 用于三维建模目标对象的方法和系统
CN106060522A (zh) * 2016-06-29 2016-10-26 努比亚技术有限公司 一种视频图像的处理装置及方法
CN106469138B (zh) * 2016-09-29 2020-07-17 东软集团股份有限公司 词云的生成方法及装置
CN106469138A (zh) * 2016-09-29 2017-03-01 东软集团股份有限公司 词云的生成方法及装置
CN108872245A (zh) * 2018-05-28 2018-11-23 李春莲 一种智能化餐桌油污去除方法
CN108872245B (zh) * 2018-05-28 2020-12-22 嵊州市万智网络科技有限公司 一种智能化餐桌油污去除方法
CN110006087A (zh) * 2018-06-07 2019-07-12 葛高丽 红外反射式取暖器
CN110006087B (zh) * 2018-06-07 2021-04-13 安徽新大陆特种涂料有限责任公司 红外反射式取暖器
CN109089104A (zh) * 2018-10-18 2018-12-25 看见故事(苏州)影视文化发展有限公司 一种裸眼3d动画图像转化方法
CN109685802A (zh) * 2018-12-13 2019-04-26 贵州火星探索科技有限公司 一种低延迟的视频分割实时预览方法
CN109685802B (zh) * 2018-12-13 2023-09-15 泸州禾苗通信科技有限公司 一种低延迟的视频分割实时预览方法
CN111669567A (zh) * 2019-03-07 2020-09-15 阿里巴巴集团控股有限公司 多角度自由视角视频数据生成方法及装置、介质、服务器
CN111669567B (zh) * 2019-03-07 2024-03-29 阿里巴巴集团控股有限公司 多角度自由视角视频数据生成方法及装置、介质、服务器
CN112700485A (zh) * 2020-12-31 2021-04-23 重庆电子工程职业学院 图像深度信息提取方法
CN112700485B (zh) * 2020-12-31 2023-02-07 重庆电子工程职业学院 图像深度信息提取方法
CN114035871A (zh) * 2021-10-28 2022-02-11 深圳市优聚显示技术有限公司 基于人工智能的3d显示屏的显示方法、系统及计算机设备

Also Published As

Publication number Publication date
CN101287143B (zh) 2010-09-15

Similar Documents

Publication Publication Date Title
CN101287143B (zh) 基于实时人机对话的平面视频转立体视频的方法
US9445072B2 (en) Synthesizing views based on image domain warping
US8711204B2 (en) Stereoscopic editing for video production, post-production and display adaptation
Tam et al. 3D-TV content generation: 2D-to-3D conversion
Cao et al. Semi-automatic 2D-to-3D conversion using disparity propagation
CN101287142A (zh) 基于双向跟踪和特征点修正的平面视频转立体视频的方法
Feng et al. Object-based 2D-to-3D video conversion for effective stereoscopic content generation in 3D-TV applications
CN101516040B (zh) 视频匹配方法、装置及系统
US20150379720A1 (en) Methods for converting two-dimensional images into three-dimensional images
TW201432622A (zh) 產生一關於一影像之深度圖
Pearson et al. Plenoptic layer-based modeling for image based rendering
CN102724531B (zh) 一种二维视频转三维视频的方法及系统
CN104506872B (zh) 一种平面视频转立体视频的方法及装置
Didyk et al. Apparent stereo: The cornsweet illusion can enhance perceived depth
US10127714B1 (en) Spherical three-dimensional video rendering for virtual reality
Bleyer et al. Temporally consistent disparity maps from uncalibrated stereo videos
Tam et al. Stereoscopic image rendering based on depth maps created from blur and edge information
Liu et al. An enhanced depth map based rendering method with directional depth filter and image inpainting
CN110751615B (zh) 基于环境感知的立体树木图像融合方法
Wang et al. Block-based depth maps interpolation for efficient multiview content generation
Yang et al. Depth map generation using local depth hypothesis for 2D-to-3D conversion
CN107610070B (zh) 基于三摄像采集的自由立体匹配方法
Sun et al. Seamless view synthesis through texture optimization
CN104052990A (zh) 一种基于融合深度线索的全自动二维转三维方法和装置
Cheng et al. A DIBR method based on inverse mapping and depth-aided image inpainting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: GUANGDONG SHENGYANG INFORMATION TECHNOLOGY INDUSTR

Free format text: FORMER OWNER: TSINGHUA UNIVERSITY

Effective date: 20130228

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100084 HAIDIAN, BEIJING TO: 528300 FOSHAN, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130228

Address after: 528300, first floor, C building, Shunde Creative Industry Park, 41 Fengxiang Road, Daliang District, Foshan, Guangdong, Shunde

Patentee after: Guangdong Shengyang Information Technology Industrial Co., Ltd.

Address before: 100084 Beijing City, Haidian District Tsinghua Yuan

Patentee before: Tsinghua University

C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 528300, building 107, building C, creative Pioneer Park, 41 Fengxiang Road, Shunde District, Foshan, Guangdong, Daliang

Patentee after: Guangdong Shengyang Information Technology Industry Co., Ltd.

Address before: 528300, first floor, C building, Shunde Creative Industry Park, 41 Fengxiang Road, Daliang District, Foshan, Guangdong, Shunde

Patentee before: Guangdong Shengyang Information Technology Industrial Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100915

Termination date: 20180516

CF01 Termination of patent right due to non-payment of annual fee