CN101472190B - 多视角摄像及图像处理装置、系统 - Google Patents

多视角摄像及图像处理装置、系统 Download PDF

Info

Publication number
CN101472190B
CN101472190B CN2007103056901A CN200710305690A CN101472190B CN 101472190 B CN101472190 B CN 101472190B CN 2007103056901 A CN2007103056901 A CN 2007103056901A CN 200710305690 A CN200710305690 A CN 200710305690A CN 101472190 B CN101472190 B CN 101472190B
Authority
CN
China
Prior art keywords
unit
image
video data
view angle
specified view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007103056901A
Other languages
English (en)
Other versions
CN101472190A (zh
Inventor
刘源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Huawei Device Shenzhen Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN2007103056901A priority Critical patent/CN101472190B/zh
Priority to PCT/CN2008/073522 priority patent/WO2009092233A1/zh
Priority to EP08871468A priority patent/EP2227021A4/en
Publication of CN101472190A publication Critical patent/CN101472190A/zh
Priority to US12/823,777 priority patent/US20100260486A1/en
Priority to US13/630,347 priority patent/US20130021437A1/en
Application granted granted Critical
Publication of CN101472190B publication Critical patent/CN101472190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Abstract

本发明公开一种多视角摄像及图像处理装置、系统及方法与解码处理方法。所述多视角摄像及图像处理装置包括依次连接的摄像单元、采集单元、选择单元和编码单元,其中,所述摄像单元用于摄像,包括进行多视角摄像并输出立体视频数据;所述采集单元用于采集所述摄像单元输出的立体视频数据;所述选择单元用于从所述立体视频数据中选择至少一路数据;所述编码单元用于编码,包括对所述选择单元选出的立体视频数据进行编码。本发明可以提高多视角摄像的采集和编码效率,降低系统对处理能力的要求。

Description

多视角摄像及图像处理装置、系统
技术领域
本发明涉及视频处理领域,特别是涉及多视角摄像及图像处理装置、系统及方法与解码处理方法。
背景技术
立体(3D)视频技术可以提供符合立体视觉原理的具有深度信息的画面,从而能够真实地重现客观世界景象,表现出场景的纵深感、层次感和真实性,是当前视频技术发展的重要方向。
目前视频研究领域有两个主要的研究热点:双目立体视频和多视角视频(又称“Multi-View Coding,MVC”)。双目立体视频的基本原理是模拟人眼成像原理,采用双摄像机独立得到左眼图像和右眼图像,并使人的左右眼分别看到左右眼通道图像,最后合成得到具有立体感的图像。多视角视频由多个摄像机同时拍摄得到,具有多个视频通道,不同的摄像机的拍摄角度不同。在播放时这些不同角度的景物图像都会送到用户终端,如电视机显示屏上,用户在观看时可以选择不同的角度观看不同的景物画面图像。
一种现有技术多视角三维运动图像多路复用的方法和设备公开了一种根据用户的需求进行多视角3D运动图像多路复用的设备和方法。该方法对多视角摄像机采集的运动图像进行编码,生成多视角编码数据流。然后接收用户的反向信道的信息,并根据该信息选择合适的编码流按帧或场进行同步复用。该方法包括:
步骤101:从多个摄像机得到运动图像和信息,并生成多个多视角编码流;
步骤102:从反向信道接收视角信息和用户选择的显示模式信息;
步骤103:根据反向信道信息,在所述多视角编码流中选择一组编码流进行复用,每个流具有相同的时间信息,采用逐帧或逐场的方式。
在进行本发明创造过程中,发明人发现上述现有多视角三维运动图像多路复用的技术中至少存在以下问题:
上述现有MVC技术仍然要在同一时刻采用多个摄像机从不同视角对同一场景进行图像数据的获取,然后全部进行编码,再在所述多视角编码流中选择一组编码流进行复用,导致在进行编码处理时耗费大量的编码资源、编码时间过长,对系统的编码处理能力要求过高。
发明内容
本发明实施方式要解决的技术问题是提供一种多视角摄像及图像处理装置、系统及方法与解码处理方法,可以提高多视角图像的采集和编码效率,降低系统对处理能力的要求。
提供一种多视角摄像及图像处理装置,包括依次连接的摄像单元、采集单元、选择单元和编码单元,其中所述摄像单元用于摄像,包括进行多视角摄像并输出立体视频数据;所述采集单元用于采集所述摄像单元输出的立体视频数据;所述选择单元用于从所述立体视频数据中选择至少一路数据;所述编码单元用于编码,包括对所述选择单元选出的立体视频数据进行编码。
提供一种多视角解码和图像处理及显示装置,包括:输入控制单元,用于发送指令,包括发送控制指定视角进行摄像的指令;解码单元,用于解码在所述指定视角摄像得到并经过编码的数据。
提供一种多视角摄像及图像处理系统,包括相互连接的多视角摄像及图像处理装置和多视角解码和图像处理及显示装置,所述多视角摄像及图像处理装置用于进行多视角摄像并输出立体视频数据,从所述立体视频数据中选择至少一路数据,编码后发送给多视角解码和图像处理及显示装置;所述多视角解码和图像处理及显示装置用于向所述多视角摄像及图像处理装置发送控制指定视角进行摄像的指令,并对所述多视角摄像及图像处理装置发送的数据进行解码。
提供一种摄像及图像处理方法,包括:进行多视角摄像并输出立体视频数据;从所述立体视频数据中选择至少一路数据;对所述选出的立体视频数据编码。
提供一种视频解码和图像处理方法,包括:输入用户观看的视角和用户到显示表面的距离信息,对接收到的立体视频数据进行解码;根据所述视角和所述距离信息对所述解码后的立体视频数据进行图像重构,得到适合用户观看的图像并显示。
以上技术方案可以看出,区别于现有技术无选择性地将全部视角拍摄的视频数据进行编码而造成系统承载较重的技术问题,本发明实施方式在多视角摄像中根据需要选择视频数据流或按照输入的视角指令,按需要选择部分的视频流数据进行编码,因而可以有效降低采集和/或编码的复杂度,提高采集和编码效率,降低系统对处理能力的要求。
附图说明
图1是现有技术多视角三维运动图像多路复用方法的流程图;
图2是本发明多视角摄像及图像处理装置第一实施方式的原理框图;
图3是本发明多视角摄像及图像处理装置第二实施方式的原理框图;
图4是本发明多视角解码和图像处理及显示装置第一实施方式的原理框图;
图5是本发明多视角摄像及图像处理系统第一实施方式的原理框图;
图6是本发明多视角摄像及图像处理系统第一实施方式的运作原理图;
图7是平行摄像机系统下图像视差和物体景深以及用户离显示器距离之间的关系图;
图8是本发明多视角摄像及图像处理系统具体实施方式的总体运作图;
图9是图8中进行视频采集以及编码的流程图;
图10是本发明摄像及图像处理装置具体实施方式的运作原理图;
图11是本发明摄像及图像处理方法第一实施方式的流程图;
图12本发明视频解码和图像处理方法第一实施方式的流程图。
具体实施方式
为使本发明的目的、技术方案、及优点更加清楚明白,以下参照附图并举实施方式,对本发明进一步详细说明。
本发明的一个方面是通过控制多视角摄像或图像处理操作,按照视角需求从多视角摄像操作中选择部分视角进行摄像、或者按照视角需求从摄像得到的多路视频数据中选择部分视角的视频数据、或者按照视角需求调整摄像机的拍摄视角、或者按照视角需求选择可重构的两个视角拍摄的视频数据,再将摄像得到的这些视频数据进行编码,以提高采集和编码效率,降低系统对处理能力的要求。
参阅图2,本发明提供多视角摄像及图像处理装置第一实施方式,包括依次连接的摄像单元210、采集单元220、选择单元230和编码单元240,其中:
所述摄像单元210用于摄像,包括进行多视角摄像并输出立体视频数据;
所述采集单元220用于采集所述摄像单元输出的立体视频数据;
所述选择单元230用于从所述立体视频数据中选择至少一路数据;
所述编码单元240用于编码,包括对所述选择单元230选出的立体视频数据进行编码。
以上实施方式可以看出,区别于现有技术无选择性地将全部视角拍摄的视频数据编码而造成系统承载较重的技术问题,由于本发明实施方式在多视角摄像中按照用户发出的视角指令,由选择单元230选择部分的视频流数据进行编码,因而可以有效降低采集和/或编码的复杂度,提高采集和编码效率,降低系统对处理能力的要求。
在其他实施方式中,所述选择单元230具体用于根据接收到的指定视角指令,将所述每路数据的视角信息与所述指定视角指令携带的视角一一匹配,得到与所述指定视角对应的至少一路立体视频数据。
在其他实施方式中,所述选择单元230集成在所述摄像单元210、采集单元220或编码单元240中。
所述编码单元240的编码内容包括下面至少一种:
原始视频数据;
原始视频数据和视差数据/深度数据;
原始视频数据、视差数据/深度数据和残差数据。
其中,所述视差数据/深度数据和残差数据可以由具有立体摄像功能的摄像单元210采集,也可以由不具备这些信息采集功能的摄像单元210先采集视频数据,然后将采集的视频数据以及另外收集的视差数据/深度数据和残差数据一起输入编码单元240。
所述编码单元240可用于根据接收到的用户观看的视角指令和显示所述立体视频数据的显示单元的显示方式指令,采用相应编码方式对所述立体视频数据进行编码,所述显示方式包括二维显示、双目立体视频显示或多视角视频显示。
参阅图3,还提供一种多视角摄像及图像处理装置,本装置与上述多视角摄像及图像处理装置第一实施方式相似,其中的选择单元具体用于根据接收到的指定视角指令控制所述摄像单元进行所述指定视角摄像,得到至少一路数据。在本实施方式中将所述选择单元具体命名为控制单元,以区别于上述多视角摄像及图像处理装置第一实施方式。所述装置具体包括:
摄像单元210,进行摄像,包括进行多视角摄像并输出立体视频数据;
采集单元220,用于采集所述摄像单元210输出的立体视频数据;
控制单元250,用于根据接收到的指定视角指令控制所述摄像单元210进行所述指定视角的摄像;
编码单元240,用于编码,包括对所述采集单元220输出的立体视频数据进行编码。
在其他实施方式中,所述控制单元250还可以集成在所述摄像单元210或采集单元220上。
所述控制单元250还可以具体用于:
根据接收到的指定视角指令控制所述摄像单元210的所述指定视角对应的摄像机进行摄像,并输出所述立体视频数据;或
根据接收到的指定视角指令控制所述摄像单元210的摄像机调整在所述指定视角并进行摄像,并输出所述立体视频数据;或
根据接收到的指定视角指令控制所述指定视角的邻近摄像机进行摄像,并输出所述立体视频数据。
此外,所述采集单元220还可以将所述邻近指定视角的摄像机摄像得到的数据及每个摄像机内参和外参、以及采集时间戳向所述编码单元240发送。
此外,所述采集单元220还可以进一步包括:
图像处理单元,用于将所述邻近指定视角的摄像机摄像得到的数据进行重构,得到虚拟视角数据并向所述编码单元240发送。
参阅图4,还提供一种多视角解码和图像处理及显示装置,包括:
输入控制单元410,用于发送指令,包括发送控制指定视角进行摄像的指令;
解码单元420,用于解码在所述指定视角摄像得到并经过编码的数据。
本实施方式是在显示端向视频采集端发送控制指定视角进行摄像的指令,使视频采集端仅采集制定视角的图像,降低编码量,也降低解码量。
在其他实施方式中,所述解码单元420具体用于根据接收到的用户观看视角指令和显示所述立体视频数据的显示单元的显示方式指令,采用相应解码方式对所述立体视频数据进行解码,所述显示方式包括二维显示、双目立体视频显示或多视角视频显示。
所述输入控制单元410向视频采集端的摄像单元210发送控制指定视角进行摄像的指令,还可以进一步发送用户到显示表面的距离信息。本实施方式是通过立体显示器观看立体图像因为位置移动带来的视差变化技术问题,
上述的输入控制单元410可以位于摄像处理一侧,也可以位于远程的显示图像一侧。当位于远程的显示图像一侧时,可以通过网络将所述控制指定视角进行摄像的指令发送到所述摄像及图像处理装置。
参阅图5,提供一种多视角摄像及图像处理系统,包括多视角摄像及图像处理装置、以及多视角解码和图像处理及显示装置:
所述多视角摄像及图像处理装置包括:
摄像单元210,进行摄像,包括进行多视角摄像并输出立体视频数据;
采集单元220,用于采集所述摄像单元210输出的立体视频数据;
选择单元230,用于从所述摄像单元210输出的多路视频数据中选择至少一路数据;
编码单元240,用于编码,包括对所述选择单元230选出的立体视频数据进行编码。
所述多视角解码和图像处理及显示装置包括:
解码单元420,用于解码所述编码单元240输出的编码数据,得到所述立体视频数据;
输入控制单元410,位于所述立体视频数据的显示图像一侧,用于发送指令,包括向所述摄像单元210或采集单元220发送控制指定视角进行摄像的指令;
在其他实施方式中,还可以进一步包括:
重构单元430,用于根据所述输入控制单元410发送的距离信息对所述解码单元420输出的立体视频数据进行图像重构。
参阅图6,是本发明多视角摄像及图像处理系统具体实施方式。所述系统包括摄像及图像处理装置以及显示装置。
所述显示装置包括:
输入控制单元,用于发送指令,包括:
1)向摄像及图像处理装置发送控制指定视角进行摄像的指令,比如选择一个或多个视角摄像的指令;
2)向下述的重构单元发送用户到所述显示单元显示屏之间的距离信息;
3)向摄像及图像处理装置发送所述显示单元显示模式的信息,比如是否支持二维显示、双目立体显示或全息显示等;
4)是否支持调整摄像机位置的信息。
输入控制单元主要接收终端或用户的输入,并发送所述指令给下述的采集控制单元、编码单元和/或重构单元等,用于控制多视角视频流的编码和重构。输入控制单元发送的上述信息可以由最终用户通过GUI界面或遥控设备进行输入,如观看视角、距离信息和显示方式;也可由终端自己检测,如终端的显示方式、距离检测、是否支持重构等信息。
所述显示装置包括依次连接的接收单元、解复用单元、解码单元、重构单元、渲染单元以及显示单元。
所述接收单元用于接收数据包,包括接收数据包并去除所述数据包的协议头,得到编码数据;
所述解复用单元用于对所述接收单元接收的数据进行解复用;
所述解码单元用于对所述解复用单元输出的编码数据进行解码,得到视频数据;
所述重构单元用于根据所述输入控制单元发送的距离信息对所述解码单元输出的立体视频数据进行图像重构;重构单元主要解决用户通过自动立体显示器观看立体图像因为位置移动带来的视差变化,从而导致所看到的立体图像发生变化的问题。自动立体显示器可以使用户在不带眼镜的条件下也能看到立体图像,但此时用户离自动立体显示器的距离是可以改变的,导致图像的视差发生变化;
图7显示了平行摄像机系统下图像视差p和物体景深zp以及用户离显示器距离D的关系,通过简单的几何关系可以得到:
x L D = x p D - z p x R - x B D = x p - x B D - z p ⇒ x L - x R + x B D = x B D - z p ⇒ | x L - x R | = x B ( 1 - D D - z p ) = x B ( 1 z p D - 1 + 1 ) = p
从上式可以看出,图像的视差p依赖于用户到显示器的距离D。立体视频接收端收到的立体视频图像一般只具有固定的视差,可以作为一个参考视差pref,当D发生改变时,重构单元需要对视差pref做相应的调整,生成新的视差p′,并根据新视差重新生成另一幅图像。这样可以保证用户和显示表面的距离发生改变时能看到合适的图像。用户到显示表面的距离可以通过摄像机算出深度图自动检测,或由用户通过输入控制单元进行手工控制。如用户可以通过遥控器对重构图像的视差进行控制,从而在一定的位置范围内都能得到适合观看的立体图像。
所述渲染单元用于将所述解码单元或重构单元输出的数据渲染到立体显示设备上;
所述显示单元用于输入视频数据并显示视频图像,在本实施方式中,可以是自动立体显示器;
所述摄像及图像处理装置包括依次连接的摄像单元、采集控制单元、预处理单元、匹配/深度提取单元、编码单元、复用单元以及发送单元。另外,还包括分别连接所述采集控制单元的标定单元和同步单元。其中:
所述摄像单元用于摄像,包括进行多视角摄像,即从不同视角对同一场景进行拍摄,并输出立体视频数据;
所述采集控制单元用于控制所述摄像单元的操作,包括根据接收到所述输入控制单元发送的指定视角指令控制所述摄像单元进行所述指定视角的摄像,并输出所述立体视频数据。具体是:
1)根据接收到的指定视角指令控制所述摄像单元的所述指定视角对应的摄像机进行摄像,并输出所述立体视频数据;或
2)根据接收到的指定视角指令控制所述摄像单元的摄像机调整在所述指定视角并进行摄像,并输出所述立体视频数据;或
3)根据接收到的指定视角指令控制所述指定视角的邻近摄像机进行摄像,并输出所述立体视频数据。
所述采集控制单元可以控制一个摄像机组进行视频图像的采集并输出。摄像机组的数目可以根据场景和需求进行配置,当摄像机数为1时,采集控制单元输出二维视频流,当摄像机数为2时,采集控制单元输出双目立体视频流,当摄像机数大于2时,输出为多视角视频流。对于模拟摄像机,采集控制单元需要将模拟图像信号转换为数字视频图像。图像以帧的形式保存在采集控制单元的缓存中。
此外,所述采集控制单元还将采集到的图像提供给下述的标定单元进行摄像机标定,标定单元将得到摄像机内参和外参返回给采集控制单元。采集控制单元根据这些参数建立起视频流和所属采集摄像机属性的一一对应的关系,这些属性包括摄像机唯一的编号、摄像机内参和外参、每帧的采集时间戳等,并将摄像机属性和视频流按照一定格式进行输出。除了上述功能,采集控制单元还提供对摄像机的控制功能和图像采集的同步功能:采集控制单元可以根据摄像机标定的参数,通过摄像机的遥控接口对摄像机进行平移/转动/拉近/拉远等操作。采集控制单元也可以通过摄像机的同步接口向摄像机提供同步时钟信号用以控制同步采集。此外,采集控制单元也可以接受输入控制单元的控制,如根据用户选择的视角信息关闭不需要的摄像机的视频采集,即根据接收到输入控制单元的指定视角指令控制所述摄像单元的所述指定视角对应的摄像机进行摄像;或根据接收到输入控制单元的指定视角指令控制所述摄像单元的摄像机调整在所述指定视角并进行摄像;或根据接收到输入控制单元的指定视角指令控制所述指定视角的邻近摄像机进行摄像。
所述同步单元用于产生同步信号并输入到所述摄像单元,控制其进行同步采集;或将所述同步信号输入到所述采集控制单元,通知其控制所述多摄像单元进行同步采集;
所述标定单元用于获取所述摄像单元中摄像机的内参和外参,并输出摄像机位置信息比如位置校正指令到所述采集控制单元;
所述预处理单元用于接收所述采集控制单元输出的立体视频数据和相应的摄像机参数,并根据预处理算法对所述立体视频数据进行预处理;
所述匹配/深度提取单元用于从所述摄像机采集的图像中、或预处理单元输出的立体视频数据中得到成像物体的三维信息,并和所述立体视频数据一起输出给所述编码单元;
所述编码单元用于编码,包括对上述单元选出的立体视频数据进行编码。所述编码单元还可以根据输入控制单元发送过来的显示方式信息,采用相应编码方式对所述立体视频数据进行编码。
所述编码单元还可以与解码单元集成在一起成为编解码单元,负责对多路视频图像进行编解码。本实施方式中,所述编解码单元包含多种编解码器,如传统的2D图像编解码器(H.263、H.264等),支持2D图像编码加视差/深度编码的编解码器以及支持MVC标准的编码器等。在得到输入控制单元发送过来的显示方式信息时,采用与该显示方式相应的编码方式对所述立体视频数据进行编码,比如发送来的显示方式是适配MVC的显示方式,那么就用MVC标准来编码。
如上所述,在本实施方式中,采集控制单元和视频编解码单元可以接收来自输入控制单元的反向信道的输入,根据用户从输入控制单元发送过来的信息对视频图像的采集和编解码进行控制。基本的控制包括下面几方面:
(1)根据用户选择的视角,采集控制单元可以控制摄像机视频图像的采集,如只采集用户所观看视角的图像,不采集其它摄像机的视频流,这样可以减少后续编解码单元等的处理负担。此外,采集控制单元还可以根据视角信息控制摄像机进行调制,比如移动、旋转摄像机,以便采集不属于原来摄像机位置的视角的视频图像;
(2)根据用户选择的视角,找到相应的视频流进行编码,对于用户没有观看的视角的视频流不进行编码,通过这种方式可以有效地减轻编解码单元处理负担;
(3)根据用户终端的显示方式对相应的视频流进行编解码,如对于只具有二维显示方式的终端,则编码并发送1路二维视频流。通过这种方式可以提高所述多视角立体视频通信系统和普通视频通信系统的兼容性,并减少无用的数据的传输。
所述复用单元用于对所述编码单元输出的编码数据进行复用;
所述发送单元用于将所述复用单元输出的编码数据封装成符合实时传输协议的数据包,并通过分组网络进行实时传输。
参阅图8和图9,工作时,采集控制单元控制摄像单元中摄像机的采集,并输出视频流,经过预处理单元、匹配/深度提取单元的一系列的处理后到达视频编码单元。显示装置一侧的输入控制单元通过反向信道发出指令,来控制所述采集控制单元和/或编码单元,使从所述摄像单元输出的多路视频数据中选择出部分视角的视频数据到编码单元。这里,可以将所述采集控制单元作为进行流选择的功能实体。所述采集控制单元通过反向信道接收到输入控制单元的指定视角指令,然后选择视频流的方式可以包括以下:
1)将所述指定视角指令所携带视角(点)信息与摄像单元控制的每个摄像机的位置信息进行比较,即将所述指定视角指令携带的视角与所述每个摄像机输出的每路数据的视角信息一一匹配,得到与所述指定视角对应的至少一路立体视频数据,如果从所述位置信息得出该摄像机进行摄像的视角符合接收到的指定视角指令所携带的指定视角,则在所述指定视角下进行摄像,即采用该摄像机进行所属视频流的采集;
2)如果所述指定视角指令所携带的视角信息和摄像机位置信息不符,即不能匹配所述每路数据的视角信息与所述指定视角指令携带的视角,则需要进一步判断是否需要调整摄像机的位置,在判断需要调整摄像机位置时,控制所述摄像单元的摄像机调整在所述指定视角并进行摄像,如果调整成功,则继续进行摄像的操作;
3)如果不支持摄像机的调整,或调整不成功,即摄像机不能调整到该指定视角指令携带的视角时,则根据指定视角指令控制所述指定视角的邻近摄像机进行摄像,并输出所述立体视频数据,同时将所述指定视角的邻近摄像机摄像得到的数据及每个摄像机内参和外参、以及采集时间戳向所述编码单元发送,以便在接收端从其它视角的视频图像重构出所要求视角的图像。
如果不输出多路视频数据及摄像机内参、外参、时间戳等信息到编码单元,即不在接收端重构需要视角的图像,可以在摄像机一侧增加图像处理单元,用于将所述指定视角的邻近摄像机摄像得到的数据进行重构,得到虚拟视角数据并向所述编码单元发送。
也就是说,可以首先判断摄像机进行摄像的视角符合接收到的指定视角指令所携带的指定视角,相符的情况下采用该摄像机摄像,否则判断是否支持摄像机调整,如果支持摄像机调整,则可以通过改变摄像机的位置来采集所要求视角的视频图像。当通过调整摄像机位置也不能得到所需视角时,可以通过上述第三种的重构方式采集相应摄像机的视频流。
在选择视频流数据后,编码单元对选择的视频流进行编码。如果选择的视频流有两路以上,则这些码流进入复用单元进行复用,再进入发送单元分组化,形成分组数据流通过网络接口进行传输。此外,如前面所述,所述编码单元还可以根据所述显示装置一侧显示单元的显示方式,采用相应编码方式对所述立体视频数据进行编码。
显示装置一侧的接收单元接收该分组数据流,经处理后发送到解复用单元进行解复用。解复用后的数据流被发送到解码单元进行解码,生成解码。如果需要重构则由重构单元对视频流图像进行重构。输入控制单元位于接收端,其通过反向信道控制发送端的采集控制单元和/或编码单元。在重构和编解码的处理上,由于接收端和发送端的工作要配合,输入控制单元也可以有通道对解码单元和重构单元同时进行控制。
图10显示了通过输入控制单元控制编码单元的流程图。发送端从N个摄像机获取视频图像数据流后,首先要判定所选择视角(点)所属的视频流。由于采集控制单元记录了摄像机和对应的视频流的视角信息,因此它可以根据视角(摄像机位置)信息定位视频流,即将所述每路数据的视角信息与所述指定视角指令携带的视角(以视点标识的形式)一一匹配,得到与所述指定视角对应的视频数据。之后编码单元判定显示装置一侧显示单元的显示模式信息,并根据显示模式信息选择合适的编码方式。例如,当接收端只有二维图像显示方式,则编码单元将视频流按二维方式编码,或根据一定的规则对3D视频数据进行,如只传输左/右图像中的一幅进行二维编码;如果显示单元能够显示双目立体视频,则编码单元可以按照二维图像+深度/视差图的方式进行编码;如果显示单元需要同时显示多个差别很大视角的图像,则编码单元可以按照MVC标准进行编码。编码后的视频流发送到复用单元进行帧/场复用,复用后的数据被进行分组传输。在显示装置一侧,解码单元由于和编码单元一样收到输入控制单元的控制,可以得到同样的编码信息对数据流进行解码。
值得说明的是,前述本发明多视角摄像及图像处理装置各实施方式中的各单元可以集成在一个处理模块中;同理,前述本发明多视角摄像及图像处理系统其他实施方式中的各单元也可以集成在一个处理模块中;或者,前述各实施方式各单元中的任何两个或两个以上都可以集成在一个处理模块中。
还值得说明的是,本发明实施方式中的各单元既可以采用硬件的形式实现,可软件实现的部分也可以采用软件功能模块的形式实现。相应地,本发明实施方式既可以作为独立的产品销售或使用,可软件实现的部分也可以存储在一个计算机可读取存储介质中进行销售或使用。
参阅图11,本发明还提供摄像及图像处理方法第一实施方式,包括以下步骤:
步骤1101:进行多视角摄像并输出立体视频数据;
步骤1102:从所述立体视频数据中选择至少一路数据;
步骤1103:对所述选出的立体视频数据进行编码。
在其他实施方式中,所述步骤1101:进行多视角摄像并输出立体视频数据具体是:根据接收到的指定视角指令进行所述指定视角的摄像,并输出立体视频数据,具体包括:
1)在所述摄像的视角符合接收到的指定视角指令所携带的指定视角时,在所述指定视角下进行摄像;或
2)按照接收到的指定视角指令所携带的指定视角设置摄像机的摄像视角,并进行摄像;或
3)在所述摄像的视角与接收到的指定视角指令所携带的指定视角不相符时,控制所述指定视角的邻近摄像机进行摄像。
所述步骤1101:进行多视角摄像并输出立体视频数据还可以如下:
1)进行多视角摄像并输出所述立体视频数据及其对应每路数据的视角信息;
2)根据接收到的指定视角指令,将所述每路数据的视角信息与所述指定视角指令携带的视角一一匹配,得到与所述指定视角对应的至少一路立体视频数据。
所述步骤1103:对所述选出的立体视频数据进行编码可以是:根据显示所述立体视频数据的显示单元的显示方式,采用相应编码方式对所述立体视频数据进行编码。
在其他实施方式中,还进一步包括:
步骤1104:输入用户到显示表面的距离信息;
步骤1105:根据所述距离信息对所述立体视频数据进行图像重构。
本领域普通技术人员可以理解实现上述摄像及图像处理方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,该程序在执行时,可以包括前述本发明方法各个实施方式的内容。这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
参阅图12,本发明还提供一种视频解码和图像处理方法,包括:
步骤1201:输入用户观看的视角和用户到显示表面的距离信息,对接收到的立体视频数据进行解码;
步骤1202:根据所述视角和距离信息对所述解码后的立体视频数据进行图像重构,得到适合用户观看的图像并进行显示。
所述步骤:输入用户观看的视角和用户到显示表面的距离信息包括:
由用户手工输入或由系统自动检测用户观看视角和用户到显示表面的距离信息。
所述步骤:对接收到的立体视频数据进行解码包括:
根据显示所述立体视频数据的视角信息和显示单元的显示方式,采用相应解码方式对所述立体视频数据进行解码。
综上,本发明实施方式至少可以产生如下技术效果:
(1)控制视频图像采集或编码单元选择部分用户需要的视角的视频数据来进行编码,提高采集和编码效率,降低系统对处理能力的要求;
(2)可以仅对用户所需要观看的视角进行采集、编码和传输,可以最大限度地提高处理效率和传输效率,保证实时传输的质量;
(3)采用用户能够观看是显示模式来控制发送方的编码方式,可进一步减少系统的复杂度,提高系统可用性;
现有技术MVC视频图像需要在多种模式下显示,如二维显示器、立体显示器和全息显示器等,每种显示模式的数据类型不同,编码方式也会不同,但现有处理系统不支持根据显示类型进行MVC视频图像的编码。本发明实施方式可以很好地解决这个技术问题。
(4)可以根据用户到显示表面的距离信息来重构三维图像,实现质量更高的图像显示。
目前用户位置检测方法都不太可靠,而3D图像重构与用户的观察位置(用户离显示表面的距离)有很大关系。
以上对本发明所提供的一种多视角摄像及图像处理装置、系统及方法与解码处理方法通过具体实施例进行了详细介绍,以上实施例的说明只是用于帮助理解本发明的方法及其思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种多视角摄像及图像处理装置,其特征在于,包括依次连接的摄像单元、采集单元、选择单元和编码单元,其中,
所述摄像单元用于摄像,包括进行多视角摄像并输出立体视频数据;
所述采集单元用于采集所述摄像单元输出的立体视频数据;
所述选择单元根据接收到的指定视角指令控制所述摄像单元进行所述指定视角摄像,得到至少一路立体视频数据;所述选择单元具体用于:根据接收到的指定视角指令控制所述摄像单元的所述指定视角对应的摄像机进行摄像,并输出所述立体视频数据;或根据接收到的指定视角指令控制所述摄像单元的摄像机调整在所述指定视角并进行摄像,并输出所述立体视频数据;或根据接收到的指定视角指令控制所述指定视角的邻近摄像机进行摄像,并输出所述立体视频数据;
所述编码单元用于编码,包括对所述选择单元选出的立体视频数据进行编码。
2.根据权利要求1所述的多视角摄像及图像处理装置,其特征在于,所述选择单元集成在所述摄像单元、采集单元或编码单元中。
3.根据权利要求1所述的多视角摄像及图像处理装置,其特征在于:
采集单元还用于将所述指定视角的邻近摄像机摄像得到的数据及每个摄像机内参和外参、以及采集时间戳向所述编码单元发送。
4.根据权利要求1所述的多视角摄像及图像处理装置,其特征在于,采集单元进一步包括:
图像处理单元,用于将所述邻近指定视角的摄像机摄像得到的数据进行重构,得到虚拟视角数据并向所述编码单元发送。
5.根据权利要求1所述的多视角摄像及图像处理装置,其特征在于,所述编码单元的编码内容包括下面至少一种:
原始视频数据;
原始视频数据和视差数据/深度数据;
原始视频数据、视差数据/深度数据和残差数据。
6.根据权利要求1至5任一项所述的多视角摄像及图像处理装置,其特征在于:
所述编码单元具体用于根据接收到的用户观看的视角指令和显示所述立体视频数据的显示单元的显示方式指令,采用相应编码方式对所述立体视频数据进行编码,所述显示方式包括二维显示、双目立体视频显示或多视角视频显示。
7.一种多视角摄像及图像处理系统,其特征在于,包括相互连接的多视角摄像及图像处理装置和多视角解码和图像处理及显示装置:
所述多视角摄像及图像处理装置用于进行多视角摄像并输出立体视频数据,根据接收到的指定视角指令控制所述摄像单元进行所述指定视角摄像,从所述立体视频数据中选择至少一路数据,编码后发送给多视角解码和图像处理及显示装置;
所述根据接收到的指定视角指令控制所述摄像单元进行所述指定视角摄像具体包括:根据接收到的指定视角指令控制所述摄像单元的所述指定视角对应的摄像机进行摄像,并输出所述立体视频数据;或根据接收到的指定视角指令控制所述摄像单元的摄像机调整在所述指定视角并进行摄像,并输出所述立体视频数据;或根据接收到的指定视角指令控制所述指定视角的邻近摄像机进行摄像,并输出所述立体视频数据;
所述多视角解码和图像处理及显示装置用于向所述多视角摄像及图像处理装置发送控制指定视角进行摄像的指令,所述指令还包括是否支持调整摄像机位置的信息,并对所述多视角摄像及图像处理装置发送的数据进行解码。
8.根据权利要求7所述的多视角摄像及图像处理系统,其特征在于,
所述多视角解码和图像处理及显示装置进一步用于发送用户到显示表面的距离信息,以及根据用户到显示表面的距离信息对所述多视角摄像及图像处理装置输出的立体视频数据进行图像重构。
CN2007103056901A 2007-12-28 2007-12-28 多视角摄像及图像处理装置、系统 Active CN101472190B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN2007103056901A CN101472190B (zh) 2007-12-28 2007-12-28 多视角摄像及图像处理装置、系统
PCT/CN2008/073522 WO2009092233A1 (zh) 2007-12-28 2008-12-16 多视角摄像及图像处理装置、系统及方法与解码处理方法
EP08871468A EP2227021A4 (en) 2007-12-28 2008-12-16 APPARATUS, SYSTEM AND METHOD FOR MULTI-VIEW PHOTOGRAPHY AND IMAGE PROCESSING AND DECODING METHOD
US12/823,777 US20100260486A1 (en) 2007-12-28 2010-06-25 Apparatus, System and Method for Recording a Multi-View Video and Processing Pictures, and Decoding Method
US13/630,347 US20130021437A1 (en) 2007-12-28 2012-09-28 Apparatus, System and Method for Recording a Multi-View Video and Processing Pictures, and Decoding Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007103056901A CN101472190B (zh) 2007-12-28 2007-12-28 多视角摄像及图像处理装置、系统

Publications (2)

Publication Number Publication Date
CN101472190A CN101472190A (zh) 2009-07-01
CN101472190B true CN101472190B (zh) 2013-01-23

Family

ID=40829255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007103056901A Active CN101472190B (zh) 2007-12-28 2007-12-28 多视角摄像及图像处理装置、系统

Country Status (4)

Country Link
US (2) US20100260486A1 (zh)
EP (1) EP2227021A4 (zh)
CN (1) CN101472190B (zh)
WO (1) WO2009092233A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109151436A (zh) * 2018-09-30 2019-01-04 Oppo广东移动通信有限公司 数据处理方法及装置、电子设备及存储介质

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011050038A (ja) * 2009-07-27 2011-03-10 Sanyo Electric Co Ltd 画像再生装置及び撮像装置
CN102340681A (zh) * 2010-07-26 2012-02-01 深圳市锐取软件技术有限公司 3d立体视频单文件双视频流录制方法
CN102103459B (zh) * 2010-10-29 2013-01-09 广东威创视讯科技股份有限公司 一种三维图片的浏览方法
CN101977320B (zh) * 2010-10-29 2012-11-14 清华大学 一种符合多视点视频标准的视频编码方法
CN102014280A (zh) * 2010-12-22 2011-04-13 Tcl集团股份有限公司 一种多视点视频节目传输方法及系统
CN102595111A (zh) * 2011-01-11 2012-07-18 中兴通讯股份有限公司 一种多视角编码码流的传输方法、装置和系统
US8643699B2 (en) * 2011-04-26 2014-02-04 Mediatek Inc. Method for processing video input by detecting if picture of one view is correctly paired with another picture of another view for specific presentation time and related processing apparatus thereof
EP2536142A1 (en) * 2011-06-15 2012-12-19 NEC CASIO Mobile Communications, Ltd. Method and a system for encoding multi-view video content
AU2012295044B2 (en) * 2011-08-09 2016-06-16 Samsung Electronics Co., Ltd. Method and device for encoding a depth map of multi viewpoint video data, and method and device for decoding the encoded depth map
US20130050420A1 (en) * 2011-08-22 2013-02-28 Ding-Yun Chen Method and apparatus for performing image processing according to disparity information
CN103037236A (zh) * 2011-08-22 2013-04-10 联发科技股份有限公司 图像处理方法以及装置
CN102946545A (zh) * 2012-11-22 2013-02-27 上海文广互动电视有限公司 3d电视集成播出平台
US9568985B2 (en) 2012-11-23 2017-02-14 Mediatek Inc. Data processing apparatus with adaptive compression algorithm selection based on visibility of compression artifacts for data communication over camera interface and related data processing method
US10116911B2 (en) * 2012-12-18 2018-10-30 Qualcomm Incorporated Realistic point of view video method and apparatus
EP3061809B1 (en) 2015-02-27 2019-01-30 Miltenyi Biotec GmbH Method for generation of a cell composition of mesencephalic dopaminergic progenitor cells
CN105100775B (zh) * 2015-07-29 2017-12-05 努比亚技术有限公司 一种图像处理方法及装置、终端
WO2017082076A1 (ja) * 2015-11-11 2017-05-18 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法
CN105472368A (zh) * 2015-11-25 2016-04-06 深圳凯澳斯科技有限公司 一种面向集群终端的立体视频直播系统
JPWO2017154606A1 (ja) * 2016-03-10 2019-01-10 ソニー株式会社 情報処理装置および情報処理方法
CN106296821A (zh) * 2016-08-19 2017-01-04 刘建国 基于无人机的多视角三维重建方法及系统
US10848741B2 (en) * 2017-06-12 2020-11-24 Adobe Inc. Re-cinematography for spherical video
CN107277486A (zh) * 2017-07-19 2017-10-20 郑州中原显示技术有限公司 四信道图像的编码、传输、解码系统及方法
CN108737844A (zh) * 2018-05-18 2018-11-02 中兴通讯股份有限公司 信息传输方法及装置、存储介质、电子装置
CN108900928A (zh) * 2018-07-26 2018-11-27 宁波视睿迪光电有限公司 裸眼3d直播的方法及装置、3d屏客户端、流媒体云服务器
CN113473156B (zh) * 2020-04-24 2023-02-03 海信集团有限公司 一种自由视点视频传输方法以及相关设备
CN115086635B (zh) * 2021-03-15 2023-04-14 腾讯科技(深圳)有限公司 多视角视频的处理方法、装置、设备及存储介质
CN113873264A (zh) * 2021-10-25 2021-12-31 北京字节跳动网络技术有限公司 显示图像的方法、装置、电子设备及存储介质
CN115633248B (zh) * 2022-12-22 2023-03-31 浙江宇视科技有限公司 多场景协同检测方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1666525A (zh) * 2002-06-28 2005-09-07 夏普株式会社 图像数据分发系统及其图像数据发送装置及图像数据接收装置
CN1973555A (zh) * 2004-06-24 2007-05-30 索尼爱立信移动通讯有限公司 接近辅助3d再现
CN101035261A (zh) * 2007-04-11 2007-09-12 宁波大学 一种交互式多视点视频系统的图像信号处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19528425C1 (de) * 1995-08-02 1996-05-15 Siemens Ag Anordnung und Verfahren zur automatischen Auswahl zweier Kamerasignale aus einer Vielzahl von Kamerasignale durch Bestimmung der Kopfposition eines Betrachters
JP2001008232A (ja) * 1999-06-25 2001-01-12 Matsushita Electric Ind Co Ltd 全方位映像出力方法と装置
EP2357837A3 (en) * 2002-03-27 2012-02-22 Sanyo Electric Co., Ltd. Method and apparatus for processing three-dimensional images
US8369607B2 (en) * 2002-03-27 2013-02-05 Sanyo Electric Co., Ltd. Method and apparatus for processing three-dimensional images
CN2664040Y (zh) * 2003-10-27 2004-12-15 郭增 无人值守热力站控制器
JP2006025281A (ja) * 2004-07-09 2006-01-26 Hitachi Ltd 情報源選択システム、および方法
KR101244911B1 (ko) * 2005-10-11 2013-03-18 삼성전자주식회사 카메라 파라미터를 이용한 다시점 동영상 부호화 및 복호화장치 및 방법과 이를 수행하기 위한 프로그램이 기록된기록매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1666525A (zh) * 2002-06-28 2005-09-07 夏普株式会社 图像数据分发系统及其图像数据发送装置及图像数据接收装置
CN1973555A (zh) * 2004-06-24 2007-05-30 索尼爱立信移动通讯有限公司 接近辅助3d再现
CN101035261A (zh) * 2007-04-11 2007-09-12 宁波大学 一种交互式多视点视频系统的图像信号处理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109151436A (zh) * 2018-09-30 2019-01-04 Oppo广东移动通信有限公司 数据处理方法及装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101472190A (zh) 2009-07-01
EP2227021A4 (en) 2010-12-29
EP2227021A1 (en) 2010-09-08
US20130021437A1 (en) 2013-01-24
US20100260486A1 (en) 2010-10-14
WO2009092233A1 (zh) 2009-07-30

Similar Documents

Publication Publication Date Title
CN101472190B (zh) 多视角摄像及图像处理装置、系统
CN101453662B (zh) 立体视频通信终端、系统及方法
CN101610421B (zh) 视频通讯方法、装置及系统
CN101459857B (zh) 通信终端
CN101416520B (zh) 多视图的高效编码
US8456505B2 (en) Method, apparatus, and system for 3D video communication
CN101651841A (zh) 一种立体视频通讯的实现方法、系统和设备
CN101415114B (zh) 视频编解码方法和装置以及视频编解码器
JP6095067B2 (ja) 立体映像符号化装置、立体映像復号化装置、立体映像符号化方法、立体映像復号化方法、立体映像符号化プログラム及び立体映像復号化プログラム
EP1734766A2 (en) Transport stream structure including image data and apparatus and method for transmitting and receiving image data
CN101668219A (zh) 3d视频通信方法、发送设备和系统
CN103563363A (zh) 立体视觉图像的自动转换以便允许同时进行图像的立体视觉和平面视觉显示
KR101329057B1 (ko) 다시점 입체 동영상 송신 장치 및 방법
CN104604222B (zh) 用于产生、传送和接收立体图像的方法及有关设备
CN111147868A (zh) 一种自由视点视频导播系统
CN103051866A (zh) 网络3d 视频监控系统、方法和视频处理平台
JP4173684B2 (ja) 立体画像作成装置
CN105072434A (zh) 一种全息影像的远程传输系统和方法
CN100486140C (zh) 基于因特网的立体视频监视方法及系统
Edirisinghe et al. Stereo imaging, an emerging technology
CN107547889B (zh) 一种基于即时通信进行立体视频的方法及装置
KR20120004586A (ko) 디지털 방송 수신기 및 디지털 방송 수신기에서 3d 효과 제공 방법
KR101433082B1 (ko) 2차원 영상과 3차원 영상의 중간 정도 느낌을 주는 영상 변환 및 재생 방법
KR102094848B1 (ko) (초)다시점 미디어의 라이브 스트리밍 방법 및 장치
JP2021044659A (ja) 符号化装置、復号装置、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee after: Huawei terminal (Shenzhen) Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: HUAWEI DEVICE Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20181219

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: HUAWEI DEVICE Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: Huawei terminal (Shenzhen) Co.,Ltd.

TR01 Transfer of patent right