CN106162206A - 全景录制、播放方法及装置 - Google Patents

全景录制、播放方法及装置 Download PDF

Info

Publication number
CN106162206A
CN106162206A CN201610630218.4A CN201610630218A CN106162206A CN 106162206 A CN106162206 A CN 106162206A CN 201610630218 A CN201610630218 A CN 201610630218A CN 106162206 A CN106162206 A CN 106162206A
Authority
CN
China
Prior art keywords
sound
audio
panorama
sound field
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610630218.4A
Other languages
English (en)
Inventor
杨忠伟
黄业桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING FENGJING TECHNOLOGY Co.,Ltd.
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Madv Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Madv Technology Co Ltd filed Critical Beijing Madv Technology Co Ltd
Priority to CN201610630218.4A priority Critical patent/CN106162206A/zh
Publication of CN106162206A publication Critical patent/CN106162206A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/684Vibration or motion blur correction performed by controlling the image sensor readout, e.g. by controlling the integration time
    • H04N23/6845Vibration or motion blur correction performed by controlling the image sensor readout, e.g. by controlling the integration time by combination of a plurality of images sequentially taken
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Abstract

本发明公开了一种全景录制、播放方法及装置,所述方法包括通过多个图像采集单元拍摄外界图像得到多路广角视频数据,在拍摄图像的同时,通过多个音频采集单元采集外界声音得到多路音频数据;将多路广角视频数据展开并拼接融合为全景视频;根据每个音频采集单元设置在拍摄装置上的位置和多路音频数据,生成与全景视频对应的全景声场,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;对全景视频和全景声场进行编码。本申请可以使用全景拍摄装置直接输出完整的全景音视频文件,所录制的全景视频与全景声场准确关联,与真实场景保持一致,声音的位置、声强与图像相匹配,用户沉浸感更强,且简单易操作。

Description

全景录制、播放方法及装置
技术领域
本发明涉及音视频录制技术,尤指一种全景录制、播放方法及装置。
背景技术
全景拍摄可以在拍摄位置拍摄左右上下360度的视频,让观看者有一种身临其境的感觉。现有技术中,全景拍摄装置通过两个鱼眼镜头或多个广角镜头采集外界图像,然后通过算法进行拼接,形成全景视频。
全景技术的目的是真实还原、真实写照所拍摄的环境,为了观看者能够达到真正身临其境的感觉,除了视频全景拍摄外,声音亦需要完整记录并在播放时能够还原,在播放时能够根据观看者的视角对应调整声音输出。
现有全景相机等拍摄装置存在以下缺陷:
1)相机装置自带的录音功能,一般是按照传统的单声道或左右声道方案进行录音。所录制的声音信号不能与拼接后的全景视频准确关联,还原后的声音与视频存在较大的相位或位置误差,最终的全景视频中的声音信号与实际场景的声场不能准确吻合,不能再现实际场景,导致观看的用户体验差;
2)全景相机本身不能记录全景声场,如果要记录全景声场,需要专业的外围辅助装置,专业的人员操作并进行后期合成及专业处理(例如时间同步,个别音源特殊处理等等),无法实现个人普通用户简便使用。
发明内容
为了解决上述技术问题,本发明提供了一种全景录制、播放方法及装置,能够通过拍摄装置简单、方便的实现全景声场的录制、播放。
为了达到本发明目的,本发明提供了一种全景录制方法,应用于包含多个图像采集单元的拍摄装置中,所述拍摄装置还包含多个音频采集单元,所述方法包括:
通过所述多个图像采集单元拍摄外界图像得到多路广角视频数据,在拍摄图像的同时,通过所述多个音频采集单元采集外界声音得到多路音频数据;
将所述多路广角视频数据展开并拼接融合为全景视频;
根据每个音频采集单元设置在所述拍摄装置上的位置和所述多路音频数据,生成与所述全景视频对应的全景声场,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
对所述全景视频和所述全景声场进行编码。
本发明还提供了一种全景播放方法,包括:
对全景视频和对应的全景声场进行解码,其中,所述全景声场是根据拍摄装置上的每个音频采集单元设置在所述拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,所述拍摄装置包含多个音频采集单元,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
播放所述全景视频,在播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放所述左耳声场信息和右耳声场信息。
本发明还提供了一种全景录制装置,包括:多个图像采集单元、多个音频采集单元、图像处理单元、音频处理单元和音视频编码处理单元,其中:
所述图像采集单元,用于拍摄外界图像得到多路广角视频数据;
所述音频采集单元,用于在所述图像采集单元拍摄图像的同时,采集外界声音得到多路音频数据;
所述图像处理单元,用于将所述多路广角视频数据展开并拼接融合为全景视频;
所述音频处理单元,用于根据每个音频采集单元设置在所述拍摄装置上的位置和所述多路音频数据,生成与所述全景视频对应的全景声场,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
所述音视频编码处理单元,用于对所述全景视频和所述全景声场进行编码。
本发明还提供了一种全景播放装置,包括:解码单元、视频播放单元、识别单元和音频播放单元,其中:
所述解码单元,用于对全景视频和对应的全景声场进行解码,其中,所述全景声场是根据拍摄装置上的每个音频采集单元设置在所述拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,所述拍摄装置包含多个音频采集单元,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
所述视频播放单元,用于播放所述全景视频;
所述识别单元,用于在所述视频播放单元播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
所述音频播放单元,用于根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放所述左耳声场信息和右耳声场信息。
与现有技术相比,本申请包括通过多个图像采集单元拍摄外界图像得到多路广角视频数据,在拍摄图像的同时,通过多个音频采集单元采集外界声音得到多路音频数据;将多路广角视频数据展开并拼接融合为全景视频;根据每个音频采集单元设置在拍摄装置上的位置和多路音频数据,生成与全景视频对应的全景声场,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;对全景视频和全景声场进行编码。本申请可以使用全景拍摄装置直接输出完整的全景音视频文件,所录制的全景视频与全景声场准确关联,与真实场景保持一致,声音的位置、声强与图像相匹配,用户沉浸感更强,且简单易操作。并且,不需要辅助外围全景音频录音装置;在播放时,也更容易进行全景声场与视频的匹配,所还原的全景声场和全景视频保持完美对应。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本申请的一实施例的全景录制方法的流程图;
图2为本申请的另一实施例的全景录制装置的架构图;
图3为本申请实施例的空间坐标系的示意图;
图4为本申请实施例的镜头和麦克的位置示意图;
图5为本申请实施例的全景视频的示意图;
图6为本申请的又一实施例的全景播放方法的流程图;
图7为本申请的又一实施例的全景播放装置的架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在现有的全景录制方法中,对于音频是采用传统的单声道或左右声道的方式录制。通过单声道或左右声道的方式录制的音频不能与全景视频准确关联,且在播放端,还原后的声音与全景视频与实际场景不能准确吻合,用户体验较差。如果想要获得全景声场,需要专业的辅助设备,并通过专业人员的后期制作,成本很高且操作复杂,对普通用户无法适用。
针对上述问题,本申请实施例提供的一种解决方案的主要原理是:在拍摄装置(或称全景拍摄装置)上设置多个音频采集单元,在拍摄装置拍摄全景视频的同时,通过多个音频采集单元采集外界声音,并根据每个音频采集单元在拍摄装置上的位置和采集的多路音频数据生成全景声场,生成的全景声场与拼接融合后全景视频相对应,包含多个音频采集单元采集到的每个音源的音频信息和音频数据。
由于本申请中是通过多个音频采集单元在拍摄外界图像的同时采集外界声音,并以此为基础,生成全景声场,所获得的全景声场能够与拼接后的全景视频准确关联,并能够真实反映实际录制的场景,用户体验较好。并且,无需投入额外的辅助设备,降低了录制成本,也无需专业人员的后期制作,降低了录制的复杂度,对普通用户同样适用。
以下结合附图详细说明本申请各实施例提供的技术方案。
如图1所示,本申请的一实施例提供的全景录制方法,包括:
步骤101:通过多个图像采集单元拍摄外界图像得到多路广角视频数据,在拍摄图像的同时,通过多个音频采集单元采集外界声音得到多路音频数据;
步骤102:将多路广角视频数据展开并拼接融合为全景视频;
步骤103:根据每个音频采集单元设置在拍摄装置上的位置和多路音频数据,生成与全景视频对应的全景声场,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;
步骤104:对全景视频和全景声场进行编码。
如图2所示,本申请的拍摄装置包含拍摄全景视频所需的n(n≥2)个图像采集单元(每个图像采集单元包含一广角镜头和一图像传感器),图像处理单元,同时包含音频声场采集所需的m(m≥2)个音频采集单元(如麦克风、特制的全景麦克风),音频处理单元和音视频编码处理单元。
本申请的全景录制方法应用于拍摄设置中。在实际应用中,为了获得全景视频,出现了全景拍摄装置,如全景相机、全景摄像机等。这些全景拍摄装置中包括至少两个图像采集单元,图像采集单元包括一个广角镜头(如鱼眼镜头)和一个摄取由该广角镜头形成的图像的图像传感器。至少两个图像采集单元背向设置,保证采集到水平和垂直各360°的全景图像。拍摄装置通过将各图像采集单元摄取的图像结合在一起获得立体角弧度为4π的图像。
为了能够通过拍摄装置直接获得全景声场,需要在拍摄装置上设置多个音频采集单元。音频采集单元可以采用音频麦克。多个音频麦克作为声音采集部件,负责拍摄时拍摄装置所在位置在不同方位的声音的采集记录。麦克分别朝向不同方向,麦克的具体数量不限,以能够准确记录拍摄场景中的声音为好。音频处理单元将采集的音频数据理后生成全景声场。
为了得到全景视频,拍摄装置需要首先通过图像采集单元拍摄外界图像,得到多路广角视频数据。例如,在图像采集单元采用鱼眼镜头的情况下,拍摄后得到两路鱼眼视频数据。两图像采集单元拍摄的图像需保证有部分重叠区域。拍摄装置接下来会对多路(如两路)广角视频数据进行拼接融合处理,得到全景视频。
本申请中为了能够通过拍摄装置获得全景声场而不必借助于外部的辅助装置,在拍摄装置上设置了多个音频采集单元。该多个音频采集单元在图像采集单元拍摄图像的同时,同时采集当前所拍摄场景中拍摄装置所在位置的外界声音,从而得到多路音频数据。每一个音频采集单元对应一路音频数据。拍摄装置接下来会将上述多路音频数据生成全景声场。全景声场是指,在环境中不同角度、位置的音源在不同的时间,发出不同的声音,整个环境中各个音源的音频数据和音频信息共同构成一个声场。音频信息包含音源的坐标、朝向和声音强度等。全景声场与全景视频相对应。
多个图像采集单元进行视频拍摄、捕捉全角度的图像数据,得到多路广角视频数据后,图像处理单元进行对应的图像展开、拼接融合处理,将采集的广角视频数据拼接为全景视频。
为了将采集的广角视频数据拼接为全景视频,需要以拍摄装置所在的空间坐标系建立成像模型。该空间坐标系可以以拍摄装置上的任意一点为圆心。如图3所示,空间坐标系以圆心O为坐标原点;空间坐标系包括X轴、Y轴和Z轴。为便于理解空间概念,在图3中示出了半个单位球。这个空间坐标系作为后续全景视频拼接及全景声场形成的参考基准。
另外,拍摄装置的多个镜头在拍摄装置中的具体位置是固定的,此位置信息记录在拍摄装置中。如图4所示,以图中方体表示拍摄装置(相机),在拍摄装置的正面、背面以及底面各设置一个镜头(图中未示出),拍摄装置中存储有各个镜头的位置信息。拍摄装置中还设置有加速度计及陀螺仪传感器(Accelerometer&gyroscope Sensor),该加速度计及陀螺仪传感器在出厂时可以标定相同的初始值。在拍摄装置使用中,加速度计及陀螺仪传感器能够记录拍摄装置所处的相对位置。
拍摄装置在多个图像采集单元拍摄得到多路广角视频数据后,根据保存的上述每个镜头的位置信息、加速度计及陀螺仪传感器的参数,以上述空间坐标系为参考基准,将多路广角视频数据拼接融合形成全景视频。如图5所示,拼接融合后得到全景视频可以观看到以拍摄装置为中心的360的全景。
融合的方法如采用小波融合、加权平均融合等。例如,对双镜头的拍照设备拍摄的两路广角视频数据,对两个展开后的视频图像进行重叠区域的融合处理,两个视频图像经融合后合二为一,形成拼接好的全景视频图像。
如上所述,要拍摄的场景中包含有多个不同音源,在场景中的不同位置听到的声音也并不相同,构建全景声场的目的是与全景视频相对应,为用户提供与其所观看的视频部分真实匹配的声音,使用户在视频与声音两个维度均有身临其境之感。用于采集外界声音的多个麦克在拍摄装置具体位置是固定的,为了生成全景声场,在拍摄装置中记录每个麦克的位置信息。例如,请再次参考图4,以图中方体表示拍摄装置,在拍摄装置的每个侧面均设置一个麦克,麦克可以朝向不同的角度。
在多个音频采集单元采集得到多路音频数据后,拍摄装置会根据上述每个麦克的位置信息和得到的多路音频数据,生成全景声场。全景声场中包含了麦克能够采集到的每个音源的音频信息和音频数据。音频信息包含音源的坐标、朝向和音源声音强度等信息。
录音时由于不同麦克位置不同,声源距离各个麦克不等距,造成声音传递到不同麦克存在着时间差和相位差;各个麦克朝向亦有不同,同样的声音传递到不同麦克亦有强度差;即同样一个声源传递到不同麦克,存在不同的强度差、时间差和相位差,也就带来了声源相对相机的方位信息。
本申请中,拼接全景视频和生成全景声场实时、同步进行,拍摄的多路广角视频数据实时拼接为全景视频,采集的多路音频数据实时生成全景视频,且两者同步进行,并无逻辑上的先后关系。
在将多路广角视频数据拼接为全景视频,将多路音频数据生成全景声场后,音视频编码处理单元可以将一一对应后的全景视频和全景声场进行编码、存储和传输等。因为全景视频和全景声场基于同一坐标系,故全景视频和全景声场可以做到准确的一一对应,编码后的音视频文件即自带了全景声场,使录制的视频与声音能够更真实的对应,不需要单独进行时间同步,在播放时可以真实还原拍摄场景的音视频信息,提高用户的沉浸感和体验。
如图6所示,本申请的另一实施例的全景播放方法,包括:
步骤601:对全景视频和对应的全景声场进行解码,其中,全景声场是根据拍摄装置上的每个音频采集单元设置在拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,拍摄装置包含多个音频采集单元,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;
步骤602:播放全景视频,在播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
步骤603:根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放左耳声场信息和右耳声场信息。
本申请中为了获得与拍摄的实际场景相一致的音视频体验,在拍摄装置上设置了多个音频采集单元采集外界的声音,并在拼接全景视频的同时,根据麦克在拍摄装置上的位置和采集得到的音频数据生成全景声场,并对全景视频和全景声场进行编码,得到音视频文件。
在用户选择播放全景视频和全景声场时,需要先对全景视频和相应的全景声场进行解码。在屏幕上播放全景视频,用户可以按照个人的喜好选择不同的视角观看。为了达到随着视频播放视角的变化,相应的调整声音效果的目的,在播放全景视频的过程中,首先需要实时识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置,以根据人耳的位置生成全景声场在人耳位置的音频数据。人头模型的中心点与上述全景视频和全景音频基于的空间坐标系的圆心重合。
本申请的全景播放方法可以应用于拍摄装置,也就是直接在拍摄装置中进行播放,也可以通过头显设备进行播放。如果直接在拍摄装置中进行播放,可以根据显示屏上显示的图像的坐标确定人眼观看的视频区域;如果是通过头显设备进行播放,则可由头显设备直接识别出人眼观看的视频区域。
人在观看全景视频时,相当于处于全景视频的球心位置,由球心向外看向球的内壁,球心即拍摄时的相机位置;根据头显设备现有的头部追踪技术(6轴追踪、九轴追踪、眼动追踪等),可以得出人在观看全景视频时人脸的具体朝向,在人头模型的脸部朝向明确后,即可在人头模型上根据人脸的朝向得到左、右两只人耳的坐标和两耳朝向。
然后,根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放所述左耳声场信息和右耳声场信息。左耳声场信息和右耳声场信息是声场中各音源传输到对应两只耳朵所在位置的两个不同声场信息,分别对应在左、右耳机中播放。
根据录制时得到的全景声场信息以及两耳的位置、朝向,可分离出音床(静态环境声音)和多个声音对象(可以准确定位的动态音频内容,即带定位信息的动态音频内容),头显设备分别计算出音床传递到左耳所在位置的声音强度,以及各声音对象传递到左耳所在位置的声音强度,根据计算出的声音强度,采用音床和各声音对象合成左耳声场信息,作为播放设备的左声道输出;同理音床和各声音对象传递到右耳生成右耳声场信息,作为播放设备的右声道输出。
上述形成的左、右声道输出,可以真实还原用户观看时对应场景中的声音发生的位置,使用户沉浸感更强。
请再次参考图2,本申请的全景录制装置,包括:多个图像采集单元、多个音频采集单元、图像处理单元、音频处理单元和音视频编码处理单元,其中:
图像采集单元,用于拍摄外界图像得到多路广角视频数据;
音频采集单元,用于在图像采集单元拍摄图像的同时,采集外界声音得到多路音频数据;
图像处理单元,用于将多路广角视频数据展开并拼接融合为全景视频;
音频处理单元,用于根据每个音频采集单元设置在拍摄装置上的位置和多路音频数据,生成与全景视频对应的全景声场,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;
音视频编码处理单元,用于对全景视频和全景声场进行编码。
进一步,音频信息包含音源的坐标、朝向和声音强度。
如图7所示,本申请的全景播放装置,包括:解码单元、视频播放单元、识别单元和音频播放单元,其中:
解码单元,用于对全景视频和对应的全景声场进行解码,其中,全景声场是根据拍摄装置上的每个音频采集单元设置在拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,拍摄装置包含多个音频采集单元,全景声场中包含多个音频采集单元采集到的每个音源的音频信息和音频数据;
视频播放单元,用于播放全景视频;
识别单元,用于在视频播放单元播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
音频播放单元,用于根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放左耳声场信息和右耳声场信息。
进一步,识别单元根据人眼观看的视频区域和人头模型计算出人耳的位置,包括:
根据人眼观看的视频区域识别出在观看全景视频时人脸的朝向,在人头模型上根据人脸的朝向得到左耳和右耳的坐标和朝向。
进一步,音频播放单元根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,包括:
根据全景声场以及人耳的位置,分离出音床和多个声音对象;
分别计算出音床传递到左、右耳所在位置的声音强度,以及各声音对象传递到左、右耳所在位置的声音强度,根据音床和个声音对象传递到左、右耳所在位置的声音强度,采用音床和各声音对象合成左、右耳声场信息。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种全景录制方法,应用于包含多个图像采集单元的拍摄装置中,其特征在于,所述拍摄装置还包含多个音频采集单元,所述方法包括:
通过所述多个图像采集单元拍摄外界图像得到多路广角视频数据,在拍摄图像的同时,通过所述多个音频采集单元采集外界声音得到多路音频数据;
将所述多路广角视频数据展开并拼接融合为全景视频;
根据每个音频采集单元设置在所述拍摄装置上的位置和所述多路音频数据,生成与所述全景视频对应的全景声场,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
对所述全景视频和所述全景声场进行编码。
2.根据权利要求1所述的方法,其特征在于,所述音频信息包含音源的坐标、朝向和声音强度。
3.一种全景播放方法,其特征在于,包括:
对全景视频和对应的全景声场进行解码,其中,所述全景声场是根据拍摄装置上的每个音频采集单元设置在所述拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,所述拍摄装置包含多个音频采集单元,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
播放所述全景视频,在播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放所述左耳声场信息和右耳声场信息。
4.根据权利要求3所述的方法,其特征在于,所述根据人眼观看的视频区域和人头模型计算出人耳的位置,包括:
根据人眼观看的视频区域识别出在观看全景视频时人脸的朝向,在人头模型上根据人脸的朝向得到左耳和右耳的坐标和朝向。
5.根据权利要求3或4所述的方法,其特征在于,所述根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,包括:
根据所述全景声场以及人耳的位置,分离出音床和多个声音对象;
分别计算出音床传递到左、右耳所在位置的声音强度,以及各声音对象传递到左、右耳所在位置的声音强度,根据音床和个声音对象传递到左、右耳所在位置的声音强度,采用音床和各声音对象合成左、右耳声场信息。
6.一种全景录制装置,其特征在于,包括:多个图像采集单元、多个音频采集单元、图像处理单元、音频处理单元和音视频编码处理单元,其中:
所述图像采集单元,用于拍摄外界图像得到多路广角视频数据;
所述音频采集单元,用于在所述图像采集单元拍摄图像的同时,采集外界声音得到多路音频数据;
所述图像处理单元,用于将所述多路广角视频数据展开并拼接融合为全景视频;
所述音频处理单元,用于根据每个音频采集单元设置在所述拍摄装置上的位置和所述多路音频数据,生成与所述全景视频对应的全景声场,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
所述音视频编码处理单元,用于对所述全景视频和所述全景声场进行编码。
7.根据权利要求6所述的装置,其特征在于,所述音频信息包含音源的坐标、朝向和声音强度。
8.一种全景播放装置,其特征在于,包括:解码单元、视频播放单元、识别单元和音频播放单元,其中:
所述解码单元,用于对全景视频和对应的全景声场进行解码,其中,所述全景声场是根据拍摄装置上的每个音频采集单元设置在所述拍摄装置上的位置和每个音频采集单元采集外界声音得到的多路音频数据所生成,所述拍摄装置包含多个音频采集单元,所述全景声场中包含所述多个音频采集单元采集到的每个音源的音频信息和音频数据;
所述视频播放单元,用于播放所述全景视频;
所述识别单元,用于在所述视频播放单元播放的过程中,识别人眼观看的视频区域,根据人眼观看的视频区域和人头模型计算出人耳的位置;
所述音频播放单元,用于根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,并分别在对应的音频播放器中播放所述左耳声场信息和右耳声场信息。
9.根据权利要求8所述的装置,其特征在于,所述识别单元根据人眼观看的视频区域和人头模型计算出人耳的位置,包括:
根据人眼观看的视频区域识别出在观看全景视频时人脸的朝向,在人头模型上根据人脸的朝向得到左耳和右耳的坐标和朝向。
10.根据权利8或9所述的装置,其特征在于,所述音频播放单元根据全景声场和人耳的位置生成左耳声场信息和右耳声场信息,包括:
根据所述全景声场以及人耳的位置,分离出音床和多个声音对象;
分别计算出音床传递到左、右耳所在位置的声音强度,以及各声音对象传递到左、右耳所在位置的声音强度,根据音床和个声音对象传递到左、右耳所在位置的声音强度,采用音床和各声音对象合成左、右耳声场信息。
CN201610630218.4A 2016-08-03 2016-08-03 全景录制、播放方法及装置 Pending CN106162206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610630218.4A CN106162206A (zh) 2016-08-03 2016-08-03 全景录制、播放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610630218.4A CN106162206A (zh) 2016-08-03 2016-08-03 全景录制、播放方法及装置

Publications (1)

Publication Number Publication Date
CN106162206A true CN106162206A (zh) 2016-11-23

Family

ID=57329072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610630218.4A Pending CN106162206A (zh) 2016-08-03 2016-08-03 全景录制、播放方法及装置

Country Status (1)

Country Link
CN (1) CN106162206A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106774930A (zh) * 2016-12-30 2017-05-31 中兴通讯股份有限公司 一种数据处理方法、装置及采集设备
CN107077318A (zh) * 2016-12-14 2017-08-18 深圳前海达闼云端智能科技有限公司 一种声音处理方法、装置、电子设备及计算机程序产品
CN107087208A (zh) * 2017-05-25 2017-08-22 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
CN107613243A (zh) * 2017-11-02 2018-01-19 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备及录制方法
CN107633241A (zh) * 2017-10-23 2018-01-26 三星电子(中国)研发中心 一种全景视频自动标注和追踪物体的方法和装置
CN107846604A (zh) * 2017-11-09 2018-03-27 北京维境视讯信息技术有限公司 一种全景视频处理制作系统及方法
CN108156499A (zh) * 2017-12-28 2018-06-12 武汉华星光电半导体显示技术有限公司 一种语音图像采集编码方法及装置
CN108632551A (zh) * 2017-03-16 2018-10-09 南昌黑鲨科技有限公司 基于深度学习的视频录摄方法、装置及终端
CN109756683A (zh) * 2017-11-02 2019-05-14 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备
CN109782520A (zh) * 2018-12-30 2019-05-21 深圳市明日实业有限责任公司 一种全景相机的声音采集系统
CN109873933A (zh) * 2017-12-05 2019-06-11 富泰华工业(深圳)有限公司 多媒体数据处理装置及方法
WO2019174442A1 (zh) * 2018-03-13 2019-09-19 中兴通讯股份有限公司 拾音设备、声音输出方法、装置、存储介质及电子装置
CN110430412A (zh) * 2019-08-10 2019-11-08 重庆励境展览展示有限公司 一种大型穹顶5d沉浸式数字化场景演绎装置
CN112612956A (zh) * 2020-12-23 2021-04-06 陇东学院 一种基于全景视图的艺术设计方法和平台
CN113014983A (zh) * 2021-03-08 2021-06-22 Oppo广东移动通信有限公司 视频播放方法、装置、存储介质及电子设备
CN113365012A (zh) * 2020-03-06 2021-09-07 华为技术有限公司 一种音频处理方法及设备
CN113497894A (zh) * 2021-05-28 2021-10-12 影石创新科技股份有限公司 视频拍摄方法、装置、终端及存储介质
CN114513698A (zh) * 2020-11-16 2022-05-17 中国联合网络通信集团有限公司 一种全景声播放系统及方法
CN114827448A (zh) * 2021-01-29 2022-07-29 华为技术有限公司 视频录制方法及电子设备

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1038577A (zh) * 1988-05-24 1990-01-10 黄定山 一种服装裁剪方法
CN1419796A (zh) * 2000-12-25 2003-05-21 索尼株式会社 虚拟音像定位处理装置、虚拟音像定位处理方法以及记录介质
US20050025465A1 (en) * 2003-08-01 2005-02-03 Danieli Damon V. Enhanced functionality for audio/video content playback
CN1658709A (zh) * 2004-02-06 2005-08-24 索尼株式会社 声音再现设备和声音再现方法
CN101534413A (zh) * 2009-04-14 2009-09-16 深圳华为通信技术有限公司 一种远程呈现的系统、装置和方法
CN102082991A (zh) * 2010-11-24 2011-06-01 蔡庸成 一种专为耳机试听设计的模拟现场全息音频的方法
CN102436814A (zh) * 2011-09-09 2012-05-02 南京大学 一种低码率立体声音频传输方案
CN202818484U (zh) * 2012-08-21 2013-03-20 徐丙川 会议通信装置和系统
CN103000179A (zh) * 2011-09-16 2013-03-27 中国科学院声学研究所 一种多通道音频编解码系统及其方法
CN103218198A (zh) * 2011-08-12 2013-07-24 索尼电脑娱乐公司 运动用户的声音定位
CN103297688A (zh) * 2013-04-16 2013-09-11 宁波高新区阶梯科技有限公司 一种多媒体全景录制系统及录制方法
CN103702264A (zh) * 2012-09-27 2014-04-02 英特尔公司 相机驱动的音频空间化
CN103946732A (zh) * 2011-09-26 2014-07-23 微软公司 基于对透视、近眼显示器的传感器输入的视频显示修改
CN104244164A (zh) * 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
CN104902263A (zh) * 2015-05-26 2015-09-09 深圳市圆周率软件科技有限责任公司 一种图像信息展现系统和方法
CN105263093A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种全方位声音采集装置、编辑装置及系统
CN105491353A (zh) * 2016-01-15 2016-04-13 广东小天才科技有限公司 一种远程监控方法和装置
CN105578199A (zh) * 2016-02-22 2016-05-11 北京佰才邦技术有限公司 虚拟现实全景多媒体处理系统、方法及客户端设备
CN105684415A (zh) * 2013-04-04 2016-06-15 大卫·安格莱利虚拟意念公司 球面全景视频拍摄系统
CN105794197A (zh) * 2014-07-28 2016-07-20 联发科技股份有限公司 能够生成全景文件的便携式设备

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1038577A (zh) * 1988-05-24 1990-01-10 黄定山 一种服装裁剪方法
CN1419796A (zh) * 2000-12-25 2003-05-21 索尼株式会社 虚拟音像定位处理装置、虚拟音像定位处理方法以及记录介质
US20050025465A1 (en) * 2003-08-01 2005-02-03 Danieli Damon V. Enhanced functionality for audio/video content playback
CN1658709A (zh) * 2004-02-06 2005-08-24 索尼株式会社 声音再现设备和声音再现方法
CN101534413A (zh) * 2009-04-14 2009-09-16 深圳华为通信技术有限公司 一种远程呈现的系统、装置和方法
CN102082991A (zh) * 2010-11-24 2011-06-01 蔡庸成 一种专为耳机试听设计的模拟现场全息音频的方法
CN103218198A (zh) * 2011-08-12 2013-07-24 索尼电脑娱乐公司 运动用户的声音定位
CN102436814A (zh) * 2011-09-09 2012-05-02 南京大学 一种低码率立体声音频传输方案
CN103000179A (zh) * 2011-09-16 2013-03-27 中国科学院声学研究所 一种多通道音频编解码系统及其方法
CN103946732A (zh) * 2011-09-26 2014-07-23 微软公司 基于对透视、近眼显示器的传感器输入的视频显示修改
CN202818484U (zh) * 2012-08-21 2013-03-20 徐丙川 会议通信装置和系统
CN103702264A (zh) * 2012-09-27 2014-04-02 英特尔公司 相机驱动的音频空间化
CN105684415A (zh) * 2013-04-04 2016-06-15 大卫·安格莱利虚拟意念公司 球面全景视频拍摄系统
CN103297688A (zh) * 2013-04-16 2013-09-11 宁波高新区阶梯科技有限公司 一种多媒体全景录制系统及录制方法
CN104244164A (zh) * 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
CN105794197A (zh) * 2014-07-28 2016-07-20 联发科技股份有限公司 能够生成全景文件的便携式设备
CN104902263A (zh) * 2015-05-26 2015-09-09 深圳市圆周率软件科技有限责任公司 一种图像信息展现系统和方法
CN105263093A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种全方位声音采集装置、编辑装置及系统
CN105491353A (zh) * 2016-01-15 2016-04-13 广东小天才科技有限公司 一种远程监控方法和装置
CN105578199A (zh) * 2016-02-22 2016-05-11 北京佰才邦技术有限公司 虚拟现实全景多媒体处理系统、方法及客户端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨再礼等: "《广播技术基础概论》", 30 November 2014, 电子科技大学出版社 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107077318A (zh) * 2016-12-14 2017-08-18 深圳前海达闼云端智能科技有限公司 一种声音处理方法、装置、电子设备及计算机程序产品
US11223923B2 (en) 2016-12-30 2022-01-11 Zte Corporation Data processing method and apparatus, acquisition device, and storage medium
US10911884B2 (en) 2016-12-30 2021-02-02 Zte Corporation Data processing method and apparatus, acquisition device, and storage medium
CN106774930A (zh) * 2016-12-30 2017-05-31 中兴通讯股份有限公司 一种数据处理方法、装置及采集设备
CN108632551A (zh) * 2017-03-16 2018-10-09 南昌黑鲨科技有限公司 基于深度学习的视频录摄方法、装置及终端
CN107087208B (zh) * 2017-05-25 2020-07-07 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
CN107087208A (zh) * 2017-05-25 2017-08-22 深圳市酷开网络科技有限公司 一种全景视频播放方法、系统及存储装置
CN107633241A (zh) * 2017-10-23 2018-01-26 三星电子(中国)研发中心 一种全景视频自动标注和追踪物体的方法和装置
CN107633241B (zh) * 2017-10-23 2020-11-27 三星电子(中国)研发中心 一种全景视频自动标注和追踪物体的方法和装置
CN109756683A (zh) * 2017-11-02 2019-05-14 深圳市裂石影音科技有限公司 全景音视频录制方法、装置、存储介质和计算机设备
CN107613243A (zh) * 2017-11-02 2018-01-19 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备及录制方法
CN107846604A (zh) * 2017-11-09 2018-03-27 北京维境视讯信息技术有限公司 一种全景视频处理制作系统及方法
CN109873933A (zh) * 2017-12-05 2019-06-11 富泰华工业(深圳)有限公司 多媒体数据处理装置及方法
CN108156499A (zh) * 2017-12-28 2018-06-12 武汉华星光电半导体显示技术有限公司 一种语音图像采集编码方法及装置
WO2019174442A1 (zh) * 2018-03-13 2019-09-19 中兴通讯股份有限公司 拾音设备、声音输出方法、装置、存储介质及电子装置
CN110278512A (zh) * 2018-03-13 2019-09-24 中兴通讯股份有限公司 拾音设备、声音输出方法、装置、存储介质及电子装置
CN109782520A (zh) * 2018-12-30 2019-05-21 深圳市明日实业有限责任公司 一种全景相机的声音采集系统
CN110430412A (zh) * 2019-08-10 2019-11-08 重庆励境展览展示有限公司 一种大型穹顶5d沉浸式数字化场景演绎装置
CN113365012A (zh) * 2020-03-06 2021-09-07 华为技术有限公司 一种音频处理方法及设备
WO2021175165A1 (zh) * 2020-03-06 2021-09-10 华为技术有限公司 一种音频处理方法及设备
CN114513698B (zh) * 2020-11-16 2023-08-22 中国联合网络通信集团有限公司 一种全景声播放系统及方法
CN114513698A (zh) * 2020-11-16 2022-05-17 中国联合网络通信集团有限公司 一种全景声播放系统及方法
CN112612956B (zh) * 2020-12-23 2022-11-25 陇东学院 一种基于全景视图的艺术设计方法和平台
CN112612956A (zh) * 2020-12-23 2021-04-06 陇东学院 一种基于全景视图的艺术设计方法和平台
CN114827448A (zh) * 2021-01-29 2022-07-29 华为技术有限公司 视频录制方法及电子设备
CN113014983A (zh) * 2021-03-08 2021-06-22 Oppo广东移动通信有限公司 视频播放方法、装置、存储介质及电子设备
CN113497894B (zh) * 2021-05-28 2023-08-22 影石创新科技股份有限公司 视频拍摄方法、装置、终端及存储介质
CN113497894A (zh) * 2021-05-28 2021-10-12 影石创新科技股份有限公司 视频拍摄方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
CN106162206A (zh) 全景录制、播放方法及装置
US9838668B2 (en) Systems and methods for transferring a clip of video data to a user facility
CN106210703B (zh) Vr环境中特写镜头的运用及显示方法和系统
JP6565903B2 (ja) 情報再生装置及び情報再生方法
JP5483027B2 (ja) 3次元画像計測方法、及び3次元画像計測装置
US20020075295A1 (en) Telepresence using panoramic imaging and directional sound
US20160344999A1 (en) SYSTEMS AND METHODs FOR PRODUCING PANORAMIC AND STEREOSCOPIC VIDEOS
WO2014162324A1 (en) Spherical omnidirectional video-shooting system
CN106796390A (zh) 用于立体成像的具有大视场的相机设备
EP2457181A1 (en) Improved audio/video methods and systems
EP3080986A1 (en) Systems and methods for producing panoramic and stereoscopic videos
JP6292658B2 (ja) 頭部装着型映像表示システム及び方法、頭部装着型映像表示プログラム
US20140294366A1 (en) Capture, Processing, And Assembly Of Immersive Experience
KR20160021706A (ko) 360도 공간영상 재생방법 및 그 시스템
JP5892797B2 (ja) 送受信システム及び送受信方法、受信装置及び受信方法
CN108614636A (zh) 一种3d实景vr制作方法
EP0592652B1 (en) Integral virtual reality and/or image recording, projection-visualization system
US20190335153A1 (en) Method for multi-camera device
US20160127617A1 (en) System for tracking the position of the shooting camera for shooting video films
WO2017022296A1 (ja) 情報管理装置及び情報管理方法、並びに映像再生装置及び映像再生方法
KR101729073B1 (ko) 디스플레이 장치에 표시되는 영상의 방향 변화에 따라 소리의 위상을 전환시키는 방법 및 시스템
WO2022220306A1 (ja) 映像表示システム、情報処理装置、情報処理方法、及び、プログラム
WO2018094804A1 (zh) 一种图像处理方法及装置
CN116389707A (zh) 一种多模态vr视频播放方法及系统
JP2522787B2 (ja) 立体テレビジヨン収録装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20170310

Address after: 100041 Beijing, Shijingshan District Xing Xing street, building 30, No. 17, building 4, No. 80

Applicant after: BEIJING FENGJING TECHNOLOGY Co.,Ltd.

Applicant after: BEIJING XIAOMI MOBILE SOFTWARE Co.,Ltd.

Address before: 100041 Beijing, Shijingshan District Xing Xing street, building 30, No. 17, building 4, No. 80

Applicant before: BEIJING FENGJING TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161123