CN111448805B - 用于提供通知的装置、方法和计算机可读存储介质 - Google Patents

用于提供通知的装置、方法和计算机可读存储介质 Download PDF

Info

Publication number
CN111448805B
CN111448805B CN201880079858.8A CN201880079858A CN111448805B CN 111448805 B CN111448805 B CN 111448805B CN 201880079858 A CN201880079858 A CN 201880079858A CN 111448805 B CN111448805 B CN 111448805B
Authority
CN
China
Prior art keywords
content
perspective
audio
mediated
rendering device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880079858.8A
Other languages
English (en)
Other versions
CN111448805A (zh
Inventor
S·S·马特
A·勒蒂涅米
A·埃罗南
J·A·利帕南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of CN111448805A publication Critical patent/CN111448805A/zh
Application granted granted Critical
Publication of CN111448805B publication Critical patent/CN111448805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

一种装置、方法和计算机程序,该装置包括:用于确定视角介导内容在被提供给绘制设备的内容内为可用的部件;以及用于向内容添加指示视角介导内容为可用的通知的部件;其中该通知包括被添加到内容的空间音频效果。

Description

用于提供通知的装置、方法和计算机可读存储介质
技术领域
本公开的示例涉及一种用于提供通知的装置、方法和计算机程序。具体地,它们涉及一种用于提供与视角介导内容(perspective mediated content)有关的通知的装置、方法和计算机程序。
背景技术
视角介导内容可以包括音频和/或视觉内容,该音频和/或视觉内容表示具有多个维度的音频空间和/或视觉空间。当视角介导内容被渲染时,所渲染的音频场景和/或视觉场景取决于用户的位置。这支持渲染不同的音频场景和/或不同的视觉场景,其中音频场景和/或视觉场景对应于用户的不同位置。
视角介导内容可以在虚拟现实或增强现实应用或任何其他合适类型的应用中被使用。
发明内容
根据本公开的各种但不一定全部的示例,提供了一种装置,该装置包括:用于确定视角介导内容在被提供给渲染设备的内容内为可用的部件;以及用于向内容添加指示视角介导内容为可用的通知的部件;其中该通知包括被添加到内容的空间音频效果。
通知的空间音频效果可以被暂时地添加到内容。
被添加到内容的空间音频效果可以包括环境噪声、混响中的一个或多个。
通知可以通过将房间脉冲响应应用于内容而被添加到内容。被应用的房间脉冲响应可以独立于视角介导内容在其中被捕获的房间以及内容将被渲染在其中的房间。
视角介导内容可以包括已经在三维空间内捕获的内容,该内容支持不同的音频场景和/或视觉场景经由渲染设备而被渲染,其中被渲染的音频场景和/或视频场景取决于渲染设备的用户的位置。被添加到内容的通知可以对与用户的位置相对应的音频场景产生不同的音频效果。
被添加到内容的通知可以包括将混响添加到内容,以创建一个或多个音频对象正在三维空间内移动的音频效果。
视角介导内容可以包括音频内容。
视角介导内容可以包括由多个设备捕获的内容。
根据本公开的各种但非全部的示例,提供了一种装置,包括:处理电路系统;以及包括计算机程序代码的存储器电路系统,该存储器电路系统和计算机程序代码被配置为与处理电路系统一起使该装置:确定视角介导内容在提供给渲染设备的内容内为可用;以及向内容添加指示视角介导内容为可用的通知;其中,通知包括被添加到内容的空间音频效果。
根据本公开的各种但非全部的示例,提供了一种方法,该方法包括:确定视角介导内容在提供给渲染设备的内容内为可用;以及向内容添加指示视角介导内容为可用的通知;其中通知包括被添加到内容的空间音频效果。
通知的空间音频效果可以被暂时地添加到内容。
添加到内容的空间音频效果可以包括环境噪声、混响中的一个或多个。
通知可以通过将房间脉冲响应应用于内容而被添加到内容。被应用的房间脉冲响应可以与视角介导内容在其中被捕获的房间以及内容将被渲染在其中的房间无关。
视角介导内容可以包括已经在三维空间内捕获的内容,该内容支持不同的音频场景和/或视觉场景经由渲染设备而被渲染,其中被渲染的音频场景和/或视频场景取决于渲染设备的用户的位置。被添加到内容的通知对与用户的位置相对应的音频场景产生不同的音频效果。
添加到内容的通知可以包括将混响添加到内容,以创建一个或多个音频对象正在三维空间内移动的音频效果。
视角介导内容可以包括音频内容。
视角介导内容可以包括由多个设备捕获的内容。
根据本公开的各种但非全部的示例,提供了一种包括计算机程序指令的计算机程序,该计算机程序指令在由处理电路系统执行时使得:确定视角介导内容在提供给渲染设备的内容内为可用;以及向内容添加指示视角介导内容为可用的通知;其中,通知包括被添加到内容的空间音频效果。
根据本公开的各种但不一定全部的示例,提供了一种体现上述计算机程序的物理实体。
根据本公开的各种但不一定全部的示例,提供了一种承载上述计算机程序的电磁载波信号。
根据本公开的各种但不一定全部的示例,提供了所附权利要求所要求保护的示例。
附图说明
为了更好地理解有助于理解简要说明的各种示例,现在将仅以示例方式参照附图,其中:
图1图示了装置;
图2图示了方法;
图3A和3B图示了示例系统;
图4A至4C图示了产生不同类型的视角介导内容的示例系统;
图5A至5B图示了提供第一类型的视角介导内容的系统;
图6A至6B图示了提供第二类型的视角介导内容的系统;
图7A至7B图示了提供第三类型的视角介导内容的系统;
图8A至8B图示了提供第四类型的视角介导内容的系统;以及
图9图示了另一示例系统。
具体实施方式
以下描述描述了装置1、方法和计算机程序9,其控制如何向用户渲染可以包括视角介导内容的内容。具体地,它们控制可以如何通知用户视角介导内容为可用或新型的视角介导内容已经可用。视角介导内容可以包括音频空间和/或视觉空间,其中渲染的音频场景和/或视觉场景取决于用户的位置。
图1示意性地图示了根据本公开的示例的装置1。图1所图示的装置1可以是芯片或芯片组。在一些示例中,装置1可以被提供在诸如内容捕获设备、内容处理设备、内容渲染设备或任何其他合适类型的设备等设备内。
装置1包括控制电路系统3。控制电路系统3可以提供用于控制诸如内容捕获设备、内容处理设备、内容渲染设备或任何其他合适类型的设备的电子设备的部件。控制电路系统3还可以提供用于执行本公开的示例的方法或方法的至少一部分的部件。
装置1包括处理电路系统5和存储器电路系统7。处理电路系统5可以被配置为从存储器电路系统7读取并且写入存储器电路系统7。处理电路系统5可以包括一个或多个处理器。处理电路系统5还可以包括:输出接口,经由该输出接口,处理电路系统5输出数据和/或命令;以及输入接口,经由该输入接口,将数据和/或命令输入到处理电路系统5。
存储器电路系统7可以被配置为存储计算机程序9,该计算机程序9包括计算机程序指令(计算机程序代码11),该计算机程序指令在被加载到处理电路系统5中时控制装置1的操作。计算机程序9的计算机程序指令提供逻辑和例程,其使装置1能执行上述的示例方法。通过读取存储器电路系统7,处理电路系统5能够加载并执行计算机程序9。
计算机程序9可以经由任何合适的递送机制到达装置1。递送机制可以是例如非瞬态计算机可读存储介质、计算机程序产品、存储器设备、诸如光盘只读存储器(CD-ROM)或数字通用光盘(DVD)等记录介质或者有形地体现计算机程序的制品。递送机制可以是被配置为可靠地传输计算机程序9的信号。该装置可以将计算机程序9作为计算机数据信号进行传播或传输。在一些示例中,可以使用诸如蓝牙、低功耗蓝牙、智能蓝牙、6LoWPan(低功率个人局域网上的IPv6)ZigBee、ANT+、近场通信(NFC)、射频标识、无线局域网(无线LAN)或任何其他合适的协议等无线协议将计算机程序代码9传输到装置1。
尽管存储器电路系统7在附图中被图示为单个组件,但是要了解,它可以被实施为一个或多个单独的组件,其中一些或全部可以是集成/可移动的和/或可以提供永久/半永久/动态/缓存的存储装置。
尽管处理电路系统5在附图中被图示为单个组件,但是要了解,它可以被实施为一个或多个单独的组件,其中一些或全部可以是集成/可移动的。
对“计算机可读存储介质”、“计算机程序产品”、“有形体现的计算机程序”等或“控制器”、“计算机”、“处理器”等的引用应该理解为不仅包括具有不同架构(诸如,单/多处理器架构、精简指令集计算(RISC)和顺序(冯诺依曼)/并行架构)的计算机,还包括专用电路,诸如,现场可编程门阵列(FPGA)、专用集成电路(ASIC)、信号处理设备和其他处理电路系统。对计算机程序、指令、代码等的引用应该理解为包含用于可编程处理器或固件的软件,诸如,例如,硬件设备的可编程内容,无论是用于处理器的指令还是用于固定功能设备、门阵列或可编程逻辑设备等的配置设置。
如在本申请中所使用的,术语“电路系统”指代以下中的所有:
(a)仅硬件电路实施方式(诸如,仅在模拟和/或数字电路系统中的实施方式);以及
(b)电路和软件(和/或固件)的组合,诸如(如果适用的话):(i)(多个)处理器的组合;或者(ii)(多个)处理器/软件的部分(包括(多个)数字信号处理器)、软件和(多个)存储器,其一起工作以使诸如移动电话或服务器等装置执行各种功能)以及
(c)需要软件或固件才能操作的电路,诸如,(多个)微处理器或(多个)微处理器的一部分,即使物理上并不存在该软件或固件也是如此。
图2图示了可以在本公开的示例中使用的示例方法。该方法可以使用图1所示的装置1来实现。该方法可以由装置1在内容捕获设备内、内容处理设备内、内容渲染设备内或任何其他合适的设备内实现。在一些示例中,该方法的框可以分布在一个或多个不同设备之间。
该方法包括:在框21,确定视角介导内容在被提供给渲染设备的内容内为可用。
被提供给渲染设备的内容可以包括音频内容。音频内容可以由可以位于空间内的不同位置处的一个或多个音频对象生成。
在一些示例中,被提供给渲染设备的内容可以包括视觉内容。视觉内容可以包括与空间内的对象相对应的图像。在一些示例中,视觉内容可以对应于音频内容,使得视觉内容中的图像对应于音频内容。
在框21,被提供给渲染设备的内容可以是视角介导内容或非视角介导内容。在一些示例中,内容可以是体积内容或非体积内容。
非视角介导内容可以包括音频或视觉内容,其中由渲染设备渲染的音频场景和/或视觉场景与渲染设备的用户的位置无关。即使用户改变他们的定向或位置,也可以提供相同的音频场景和/或视觉场景。
音频视角介导内容可以表示音频空间。音频空间可以是多维空间。在本公开的示例中,音频空间可以是三维空间。音频空间可以包括一个或多个音频对象。音频对象可以位于音频空间内的不同位置处。在一些示例中,音频对象可以在音频空间内移动。
不同的音频场景可能在音频空间内可用。从音频空间内的特定角度收听时,不同的音频场景可以包括音频空间的不同表示。
例如,音频视角介导内容可以包括由可能位于房间周围的不同位置的乐队或多个音乐家生成的音频。当渲染音频视角介导内容时,这使用户能取决于他们旋转头部的方式来收听不同的音频场景。用户收听的音频场景也可能取决于音频对象相对于用户的位置。如果用户在音频空间中移动,那么这可能会改变用户可以收听的音频对象以及音频对象的音量和其他参数。例如,如果用户从位于演奏鼓的音乐家旁边的第一位置开始,那么他们将主要听到由鼓提供的音频,而如果他们向演奏吉他的另一音乐家移动,则吉他的声音将相对于鼓提供的声音而增加。要了解,该示例旨在是说明性的,并且在本公开的示例中可以使用用于渲染音频视角介导内容的其他示例。
视觉视角介导内容可以表示视觉空间。视觉空间可以是多维空间。在本公开的示例中,视觉空间可以是三维空间。由视觉空间表示的空间可以与由音频空间表示的空间相同。
不同的视觉场景可以在视觉空间内可用。从视觉空间内的特定角度观看时,不同的视觉场景可以包括视觉空间的不同表示。与音频视角介导内容一样,用户可以通过改变其在视觉空间内的位置和/或定向来改变渲染的视觉视角介导内容。
在一些示例中,内容可以包括介导现实内容。这可以是使用户能在视觉上体验完全或部分人造环境的内容,诸如,虚拟视觉场景或虚拟音频场景。介导现实内容可以包括诸如视频游戏等交互式内容或者诸如运动视频或音频记录等非交互式内容。介导现实内容可以是增强现实内容、虚拟现实内容或任何其他合适类型的内容。
内容可以是视角介导内容,使得在由内容表示的空间内用户的视点改变了向用户渲染的音频和/或视觉场景。例如,如果渲染设备的用户旋转其头部,则这将改变被渲染给用户的音频场景和/或视觉场景。
在框21,可以使用任何合适的部件来确定视角介导内容为可用的。该装置可以包括可以如上所述的控制电路系统3。在一些示例中,可以通过多个不同的捕获设备来获得视角介导内容。在这种示例中,可以确定在多个捕获设备捕获内容的时间段内视角介导内容可用。该确定可以通过控制设置在捕获设备内的电路系统3或控制设置在包括捕获设备或任何其他合适装置的通信系统内的电路系统3来进行。
在一些示例中,包括视角介导内容的内容文件包括指示该内容是视角介导内容的元数据。元数据可以指示用户在视角介导内容内具有的自由度的数目,例如,它可以指示用户是具有三个自由度还是具有六个自由度。在一些示例中,它可以指示视角介导内容中可用的体积的大小。例如,它可以指示视角介导内容可用的虚拟空间。在这种示例中,元数据可以被用于确定视角介导内容是否可用。
在一些示例中,包括不同类型的内容的不同内容文件可以是可用的。例如,第一文件可能包含非视角介导内容,而第二文件可能包含允许三个自由度的视角介导内容,并且第三文件可能包含允许六个自由度的视角介导内容。在这种示例中,可以确定当附加内容文件变得可用时,视角介导内容可用。
在一些示例中,单个捕获设备可以获得视角介导内容。在这种示例中,捕获设备的控制电路系统3可以被布置为提供已经捕获了视角介导内容的指示,或者处理设备可以提供已经处理了捕获的内容以提供视角介导内容的指示。在这种示例中,指示可以提供触发器,该触发器使装置1能确定视角介导内容为可用的。
内容可以被提供给渲染设备。渲染设备可以包括使内容能针对用户而被渲染的任何部件。内容的渲染可能包括以用户可以感知的形式提供内容。内容的渲染可以包括将内容渲染为视角介导内容。内容可以由任何合适的渲染设备渲染,诸如,一个或多个耳机、一个或多个扬声器、一个或多个显示单元或任何其他合适的渲染设备。可以在更复杂的设备内提供渲染设备。例如,虚拟现实耳机可以包括耳机和一个或多个显示器,并且诸如移动电话或平板计算机等手持设备可以包括显示器和一个或多个扬声器。
在一些示例中,当内容被提供给渲染设备时,它可以被立即渲染。例如,用户可能正在直播流式传输视听内容。在这种示例中,内容的捕获和内容的渲染可以同时发生或具有非常小的延迟。在其他示例中,当将内容被提供给渲染设备时,可以将其存储在渲染设备的一个或多个存储器中。这可以使用户能下载内容并在以后的时间点使用它。在这种示例中,内容的渲染和内容的捕获将不是同时的。
该方法还包括:在框23,向内容添加通知,该通知指示视角介导内容为可用。添加的通知包括被添加到内容的空间音频效果。因此,该通知包括内容的修改,而不是除了内容之外提供的单独通知。
被添加到内容的空间音频效果可以包括可以被用于向用户提供视角介导内容现在可用的指示的任何音频效果。在一些示例中,空间音频效果可以包括环境噪声的添加或混响或使用户能够感知到通知已经添加到内容的任何其他合适的音频效果。
被添加到内容的空间音频效果可以改变音频内容的任何空间化。用户可以感知到该变化,以充当视角介导内容为可用的通知。在正在被渲染的内容是非视角介导内容的情况下,则空间效果向内容的添加可以被用户感知到,并且充当视角介导内容现在可用的指示。在正在被渲染的内容是视角介导内容的情况下,通知的空间效果的添加可以改变正在渲染的空间音频,使得用户可以感知到音频已改变。这可以充当其他类型的视角介导内容现在可用的通知。
在一些示例中,被提供给渲染设备的内容可以不包括音频内容。例如,当视角介导内容变得可用时,内容可以仅仅是视觉内容,或者音频内容可以非常安静。在这种示例中,通知可以包括将人工音频对象应用于内容。然后可以将空间音频效果添加到人工音频对象。
在一些示例中,将诸如混响等空间效果添加到内容可以创建音频空间内的一个或多个音频对象正在移动的音频效果。在一些示例中,空间效果可以创建音频对象正在远离用户移动的音频效果。这可以给出音频空间的大小正在增加的指示,其直观地指示视角介导内容可用。
被添加到内容的空间音频效果可以产生与捕获的空间音频内容不同的音频效果。也就是说,该通知不会尝试针对用户重建现实音频体验,而是提供与所提供的音频内容的偏差,使得用户被警报视角介导内容的可用性已改变的事实。因此,通知所提供的音频效果至少暂时地不同于与用户在音频空间内的位置相对应的音频场景。
在一些示例中,可以通过对内容应用房间脉冲响应来将通知添加到内容。应用的房间脉冲响应独立于视角介导内容在其中被捕获的房间或内容将在其中被渲染给用户的房间。也就是说,房间脉冲响应不被添加以提供现实效果,而是为用户提供音频警报。
当用户听到视角介导内容可用的通知时,然后他们可以选择是否访问视角介导内容。例如,用户可能能够使用户输入以从原始内容切换到新可用的视角介导内容。
在一些示例中,被添加到内容的通知可以被临时地添加。例如,可以在预定时间段内将通知添加到内容。在一些示例中,可以调整通知内包括的效果,使得它们在预定时间段内消失。预定时间段可以是几秒或任何其他合适的时间长度。在其他示例中,通知可以被永久地添加。即,可以添加通知,直到被用户输入删除为止。用户输入可以是用户选择使用视角介导内容还是不使用视角介导内容。
图3A图示了可以被用于实现本公开的示例的示例系统29。示例系统29包括多个捕获设备35A、35B、35C和35D、装置1和渲染设备40。
装置1可以包括如上所述的控制电路系统3,其可以被布置为实现根据本公开的示例的方法。例如,装置1可以被布置为实现图2所示的方法或方法的至少一部分。在一些示例中,装置1可以被提供在捕获设备35A、35B、35C和35D内。在一些示例中,装置1可以被提供在渲染设备40内。在一些示例中,装置1可以由通信网络内的一个或多个设备(诸如,一个或多个远程服务器或一个或多个远程处理设备)提供。
在图3A的示例中,捕获设备35A、35B、35C和35D、装置1和渲染设备40可以被布置为经由可以是无线通信网络的通信网络进行通信。捕获设备35A、35B、35C和35D、装置1和渲染设备40可以位于彼此远离的位置。在图3A的示例中,捕获设备35A、35B、35C和35D、装置1和渲染设备40被示出为不同的实体。如上面所提到的,在其他示例中,装置1可以设置在一个或多个捕获设备35A、35B、35C和35D内或渲染设备40内。
捕获设备35A、35B、35C和35D可以包括可以被布置为捕获音频内容和/或视觉内容的任何设备。捕获设备35A、35B、35C和35D可以包括用于捕获音频内容的一个或多个麦克风、用于捕获视觉内容的一个或多个相机或任何其他合适的组件。在图3A的示例中,捕获设备35A、35B、35C和35D包括诸如蜂窝电话等多个通信设备。在本公开的其他示例中可以使用其他类型的捕获设备35A、35B、35C和35D。
在图3A的示例中,捕获设备35A、35B、35C和35D中的每一个都由不同的用户33A、33B、33C和33D来操作。用户33A、33B、33C和33D位于不同的位置,并且可以从不同的视角捕获相同的音频对象37A、37B。
在图3A的示例系统29中,多个用户33A、33B、33C和33D正在使用捕获设备35A、35B、35C和35D来捕获音频空间31。音频空间31包括两个音频对象37A和37B。第一音频对象37A包括歌手,并且第二音频对象37B包括舞者。在捕获音频内容的同时,音频对象37A和37B中的一个或两个都可以在音频空间31内移动。用户33A、33B、33C和33D以及捕获设备35A、35B、35C和35D在音频空间31周围空间分布,以使得能够生成视角介导内容。
在图3A的示例系统中,四个捕获设备35A、35B、35C和35D用于捕获音频内容。要了解,在本公开的其他示例中,可以使用任何数量的捕获设备35A、35B、35C和35D来捕获内容。捕获设备35A、35B、35C和35D可以彼此独立地捕获音频内容。在任何捕获设备35A、35B、35C和35D之间不需要任何直接连接。
捕获设备35A、35B、35C和35D中的每一个可以将正被捕获的内容提供给装置1。装置1可以如图1所示。装置1可以被提供在捕获设备35A、35B、35C和35D之一内、在通信网络内提供的远程服务器内、或渲染设备40内或任何其他合适类型的设备内。
一旦装置1获得了内容,装置1就可以执行图3A所示的方法。在框30中,装置1处理捕获的内容。捕获内容的处理可以包括:同步由不同的捕获设备35A、35B、35C和35D捕获的内容和/或任何其他合适类型的处理。
在一些示例中,如在框30中执行的对捕获的内容的处理可以包括确定捕获设备35A、35B、35C和35D中的一个或多个的位置。这可以支持由捕获设备35A、35B、35C和35D覆盖的音频空间31的程度被确定。
一旦捕获的内容已被处理,那么在框32,装置1创建视角介导内容,并且在框34,装置1创建非视角介导内容。在图3A的示例中,已经将视角介导内容和非视角介导内容的创建示出为单独的框。要了解,在其他示例中,它们可以被提供为单个框。
如果存在记录音频空间31的足够数目的在空间上分布的捕获设备35A、35B、35C和35D,以支持重建三维空间,则可以创建视角介导内容。取决于已经由捕获设备35A、35B、35C和35D捕获的内容,可以创建不同类型的视角介导内容。
在一些示例中,视角介导内容可以包括其中用户具有三个自由度的空间。在这种示例中,由渲染设备40渲染的音频场景可以取决于用户头部的角度定向。如果用户旋转或改变其头部的角度位置,那么这将导致为用户渲染不同的音频场景。用户可能能够围绕三个不同的垂直轴旋转其头部,以使能够渲染不同的音频场景。
可以使用一个或多个加速度计、一个或多个微机电设备、一个或多个陀螺仪或任何其他合适的装置来检测用户头部的角度位置。用于检测用户头部的角度位置的装置可以位于渲染设备40内。
在一些示例中,视角介导内容可以包括用户具有六个自由度的空间。在这种示例中,由渲染设备40渲染的音频场景可以取决于上述的用户头部的角度定向。渲染设备40所渲染的音频场景还可以取决于用户的位置。如果用户通过沿三个垂直轴中的任何一个轴移动来改变其位置,那么这将导致为用户渲染不同的音频场景。用户可能能够沿三个不同的垂直轴移动,以使能够渲染不同的音频场景。
在一些示例中,视角介导内容可以包括用户具有三个自由度+的空间。在这种示例中,与具有三个自由度的视角介导内容一样,由渲染设备40渲染的音频场景可以取决于用户头部的角度定向。在用户具有三个自由度+的情况下,与具有六个自由度的内容相比,由渲染设备40渲染的音频场景还可以在有限程度上取决于用户的位置。这可以允许用户的小移动引起音频场景的改变,例如,它可以允许就座的用户改变他们在座椅中的位置并引起音频场景的改变。
可以使用诸如GPS(全球定位系统)传感器、HAIP(高精度室内定位)传感器或任何其他合适类型的传感器等定位传感器来检测用户的位置。用于检测用户位置的装置可以位于渲染设备40内。
在一些示例中,可以提供视角介导内容的音频空间的大小可以改变。例如,如果使用更多的捕获设备35A、35B、35C和35D,则这可以使得能够捕获更大的声音空间31。这可以增加用户具有六个自由度的音量。它可能会增加用户可以移动的三个轴上的距离,使得能够渲染不同的音频场景。可以将视角介导内容的类型从用户具有三个自由度+的内容改变为用户具有六个自由度的内容。
可用的视角介导内容的类型可以取决于被用来捕获音频空间31的捕获设备35A、35B、35C和35D的数目以及捕获设备35A、35B、35C和35D的空间分布。
非视角介导内容可以包括独立于渲染设备40的用户38的位置的渲染的音频场景的内容。非视角介导内容可以包括将被单个捕获设备35捕获的内容。无论用于捕获音频空间31的捕获设备35A、35B、35C和35D的数量和相应位置如何,非视角介导内容可以始终可用。非视角介导内容可以包括非体积内容。
如果新型的视角介导内容变得可用,那么在框36,通知被添加到当前被提供给渲染设备40的内容。当前被提供给渲染设备40的内容可以包括第一类型的非视角介导内容或视角介导内容。
该通知提供了新型的视角介导内容可用的指示。添加的通知可以指示已经可用的新型的视角介导内容。例如,它可以指示该内容是否支持三个自由度、三个自由度+、六个自由度或任何其他类型。
添加的通知包括空间音频效果。添加的空间音频效果并不旨在重建捕获的音频空间31,因此不需要提供音频空间31的现实表示。相反,通知可以包括向音频内容添加混响或其他声音效果,这可以创建音频空间31已经改变的感觉。例如,将混响添加到一个或多个音频对象可以创建音频对象已经移开的感觉。
一旦通知被添加到内容,具有通知的内容就被提供给渲染设备40。渲染设备40然后渲染内容和通知,使得渲染设备40的用户38可以感知它们。
图3B图示了可以被用于实现本公开的示例的另一示例系统29。图3B的示例系统29还包括多个捕获设备35A、35B、35C和35D、装置1和渲染设备40,其可以类似于图3A所示的捕获设备35A、35B、35C和35D、装置1和渲染设备40。在图3B的示例中,系统29还包括服务器44。
服务器44可以包括如上所述的控制电路系统3,其可以被布置为实现根据本公开的示例的方法和方法的部分。例如,服务器44可以被布置为实现图2所示的方法或方法的至少一部分。服务器44可以位于捕获设备35A、35B、35C和35D、装置1和渲染设备40的远程。服务器44可以被布置为经由无线通信网络或经由任何其他合适的装置与捕获设备35A、35B、35C和35D、装置1和渲染设备40通信。
在一些示例中,服务器44可以被布置为存储可以是视角介导内容的内容。可以将视角介导内容从服务器44提供给装置1和渲染设备40,以支持视角介导内容将被渲染给用户38。
在图3B的示例中,捕获设备35A、35B、35C和35D中的每个捕获设备由不同的用户33A、33B、33C和33D来操作。用户33A、33B、33C和33D位于不同的位置,并且可以从不同的视角捕获相同的音频对象37A、37B。
在图3B的示例系统29中,多个用户33A、33B、33C和33D正在使用捕获设备35A、35B、35C和35D来捕获音频空间31。音频空间31包括两个音频对象37A和37B。第一音频对象37A包括歌手,并且第二音频对象37B包括舞者。在捕获音频内容的同时,音频对象37A和37B中的一个或两个都可以在音频空间31内移动。用户33A、33B、33C和33D以及捕获设备35A、35B、35C和35D在音频空间31周围空间分布,以支持视角介导内容被生成。
在图3B的示例系统中,四个捕获设备35A、35B、35C和35D被用于捕获音频内容。要了解,在本公开的其他示例中,可以使用任何数目的捕获设备35A、35B、35C和35D来捕获内容。捕获设备35A、35B、35C和35D可以彼此独立地捕获音频内容。在任何捕获设备35A、35B、35C和35D之间不需要任何直接连接。
捕获设备35A、35B、35C和35D中的每个捕获设备可以将正被捕获的内容提供给装置1。装置1可以如图1所示。装置1可以被提供在捕获设备35A、35B、35C和35D中的一个内、或被提供在通信网络内提供的远程服务器44内、或渲染设备40内或任何其他合适类型的设备内。
一旦装置1获得了内容,装置1就可以执行图3B所示的方法。在框45,装置1处理捕获的内容。对捕获内容的处理可以包括:同步由不同的捕获设备35A、35B、35C和35D捕获的内容和/或任何其他合适类型的处理。
一旦捕获的内容已被处理,那么在框47,装置1确定可用内容的类型。在框47,装置1可以确定可用内容是非视角介导内容还是视角介导内容。在一些示例中,装置1可以确定可用的视角介导内容的类型。例如,装置1可以确定在渲染视角介导内容时用户可用的自由度。
确定可用内容的类型可以包括确定已经由捕获设备35A、35B、35C和35D捕获的内容的类型和/或确定在服务器44上可用的内容的类型。例如,捕获设备35A、35B、35C和35D捕获的内容可以是非视角介导内容,然而,可能存在与存储在服务器44上的相同音频空间31相关的视角介导内容。在这种示例中,服务器44可以将元数据添加到存储在那里的视角介导内容。元数据可以指示视角介导内容的类型。服务器44可以将内容和元数据提供给装置1。装置1可以使用元数据来确定可用的视角介导内容的类型。
如果新型的视角介导内容变得可用,那么在框49,将通知添加到当前被提供给渲染设备40的内容。当前提供给渲染设备40的内容可以包括第一类型的非视角介导内容或视角介导内容。
该通知提供了新型的视角介导内容为可用的指示。被添加的通知可以指示已经可用的新型的视角介导内容。例如,它可以指示内容是否支持三个自由度、三个自由度+、六个自由度或任何其他类型的内容。
被添加的通知包括类似于图3A的系统29中提供的效果的空间音频效果。在本公开的其他示例中可以使用其他类型的音频效果。
一旦将通知添加到内容,具有通知的内容就被提供给渲染设备40。渲染设备40然后渲染内容和通知,使得渲染设备40的用户38可以感知它们。
在图3A和3B的示例系统中,渲染设备40包括一组耳机,其被布置为向用户38提供音频输出。要了解,在其他示例中,可以使用其他类型的渲染设备40。例如,渲染设备40可以包括通信设备,诸如,移动电话、包括显示器的耳机或任何其他合适类型的渲染设备40。
一旦渲染设备40的用户38已经接收到新型的视角介导内容可用的通知,他们就可以忽略该通知并继续使用原始内容,或者可以使用户输入切换到新型的视角介导内容。
在一些示例中,可以使用不同类型的视角介导内容。例如,第一类型的视角介导内容可以是可以被提供给一组耳机的立体声音频输出,这可以给最终用户三个自由度,因为他们可以将其头部旋转到不同的定向,并且用户头部的不同定向为他们提供了不同的音频场景。
在一些示例中,视角介导内容可以支持用户的六个自由度。这可以使用户不仅能围绕三个不同的轴旋转其头部,而且还可以使用户能够在空间内移动其位置。即,这可以使用户能够向侧面和/或在垂直方向上向前向后移动,以便改变提供给他们的声音场景。被添加到非视角介导内容的通知可以提供已经可用的视角介导内容的类型的指示。在一些示例中,被添加到非视角介导内容的空间音频效果的量可以提供对已经可用的视角介导内容的类型的指示。例如,与视角介导内容支持三个自由度的情况相比,如果视角介导内容支持六个自由度,则可以添加更多的空间音频效果。这可以使用户不仅能够确定视角介导内容是可用的,而且可能能够区分已经可用的不同类型的视角介导内容。另外,如果渲染设备当前正在渲染第一类型的视角介导内容,那么可以添加通知以提供第二不同类型的视角介导内容已经变得可用的指示。例如,如果用户当前正在渲染实现三个自由度的内容,那么可以在实现六个自由度的视角介导内容变得可用时添加通知。
在图3A和3B的示例中,所创建的视角介导内容包括音频内容。具体地,视角介导内容包括声音空间31。要了解,对于公开内容,在其他示例中可以使用其他类型的内容来。例如,在一些情况下,内容可以包括视觉内容,并且内容的一些示例可以包括音频内容和视觉内容两者。在一些示例中,音频内容可以是视角介导内容,或者视觉内容可以是非视角介导内容。内容可以包括实时内容,在捕获后同时或以很小的延迟渲染这些内容。在其他示例中,内容可以包括可以被存储在渲染设备40中或远程设备处的存储内容。内容可以包括多个不同的内容文件,其可以对应于不同的虚拟空间和/或不同的时间点。内容可以使不同类型的视角介导内容可用于内容的不同部分。
图4A至图4C图示了示例系统29,其中不同类型的视角介导内容为可用的。每个示例系统29包括被布置为捕获音频空间31的一个或多个捕获设备35、装置1和至少一个渲染设备40。当使用不同的捕获设备35时,图4A至图4C所示的系统29可以在不同的时间点表示相同的系统。
在图4A至图4C中被捕获的音频空间31与图3A和3B所示的音频空间31相同。示例音频空间31包括两个声音对象:歌手37A和舞者37B。要了解,在本公开的其他示例中可以使用其他音频空间31和其他音频对象37。
在图4A的示例系统中,仅一个捕获设备35A被用于捕获音频空间31。捕获设备35A可以由第一用户33A操作。由单个捕获设备35A捕获的音频内容被提供给装置1,以使装置1能处理30音频内容。
在图4A的示例系统29中,仅单个视点被用于捕获音频内容,并因此视角介导内容不可用。在该示例中,装置1创建一些非视角介导内容,但是不创建任何视角介导内容。因此,从装置1提供给渲染设备40的内容包括非视角介导内容。非视角介导内容可以是单声道音频内容或立体声音频内容或任何其他合适类型的内容。
渲染设备40包括一组耳机,其使音频内容能被提供给渲染设备的用户38。在本公开的其他示例中可以使用其他类型的渲染设备40。
在图4B的示例系统29中,两个捕获设备35A、35B被用于捕获音频空间31。捕获设备35A、35B可以由两个不同的用户33A、33B操作。例如,第二用户33A可能已经加入了第一用户33A以捕获音频空间31。这现在提供了从中捕获音频空间31的两个不同位置。
由捕获设备35A、35B捕获的音频内容被提供给装置1,以使该装置能处理30音频内容。音频内容的处理可以包括同步两个捕获的音频流,确定捕获设备35A、35B的位置或任何其他合适的处理。装置1还可以使用两个捕获的音频流来创建视角介导内容和非视角介导内容。
装置1可以执行任何合适的处理以创建视角介导内容。例如,提供视角介导内容的处理可以包括添加房间脉冲响应,应用头部关系传递函数或任何其他合适的空间音频效果。对捕获的音频内容执行处理以使将被创建的视角介导内容可以被设计为使渲染设备40所渲染的音频内容尽可能接近地重建已由捕获设备35A和35B捕获的音频空间31。即,对捕获内容进行处理以提供视角介导内容旨在提供现实的空间音频效果。
当视角介导内容变得可用时,装置1将通知添加到正被提供给渲染设备40的内容。在图4B的示例中,通知被添加到非视角介导内容,该非视角介导内容可能对应于如由第一捕获设备35A所记录的内容。
在图4B的示例中,视角介导内容包括双耳内容。双耳内容向渲染设备40的用户38提供了三个移动自由度。当双耳内容被渲染时,用户头部的定向将决定由渲染设备40渲染的音频场景。通过将其头部移动到不同的角度定向,用户38从而可以改变被渲染给他们的音频场景。
在图4C的示例系统29中,五个捕获设备35A、35B、35C、35D和36E被用于捕获音频空间31。捕获设备35A、35B、35C、35D和36E可以由五个不同的用户33A、33B、33C、33D和33E操作。例如,三个更多的用户33C、33D和33E可能已经加入了第一用户33A和第二用户33B以捕获音频空间31。这现在提供了从中捕获音频空间31的五个不同位置。
从所有五个捕获设备35A、35B、35C、35D和36E捕获的音频内容被提供给装置1,以使该装置能处理30音频内容。音频内容的处理可以包括使多个捕获的音频流同步,确定35A、35B、35C、35D和36E的位置或任何其他合适的处理。装置1还可以使用多个捕获的音频流来创建视角介导内容和非视角介导内容。可以使用与图4B的示例中使用的类似过程或任何其他合适的过程来创建视角介导内容。
在图4C的示例中,增加数目的捕获设备35A、35B、35C、35D和36E可以支持不同类型的视角介导内容被创建。例如,其可以使音频对象37A、37B之间的距离以及音频对象37A、37B的角度位置能被考虑在内。这可以支持创建具有六个自由度的视角介导内容。在一些示例中,捕获设备35A、35B、35C、35D和36E的数目的增加可以增大音频空间31的大小,可以针对其创建视角介导内容。
当新型的视角介导内容变得可用时,装置1将通知添加到正被提供给渲染设备40的内容。在图4C的示例中,该通知可以被添加到非视角介导内容或双耳内容,取决于渲染设备40的用户38已经选择消费的内容的类型。
在图4C的示例中被添加到内容的通知可以是与在图4B的示例中被添加的通知不同的通知。这可以支持使用不同的通知来指示不同类型的视角介导内容可用。例如,与将被添加到图4B中的内容相比,可以将更多的空间音频效果添加到图4C中的内容。该大量的空间音频效果提供了以下指示:更多的自由度可用,或者视角介导内容现在可用于更大的音频空间31。
在图4A至4C的示例系统中,随着更多的用户33A、33B、33C、33D和33E及其捕获设备35A、35B、35C、35D和35E变得可用于捕获音频空间31,不同类型的视角介导内容变得可用。要了解,在其他示例中,其他原因可能会导致视角介导内容可用或不可用。例如,在一些情况下,可以通过单个捕获设备35获得视角介导内容。在这种情况下,捕获设备35可能并不总是操作,使得视角介导内容可以被创建。在这种情况下,有时可能会出现视角介导内容可用的情况,而有时可能会出现视角介导内容不可用的情况。本公开的示例可以被用于向渲染设备40的用户38通知视角介导内容的可用性的变化。
图5A和图5B示出了其中视角介导内容不可用的示例。图5A示出了已经由一个或多个捕获设备捕获的真实音频空间31,并且图5B示出了如何将其表示给渲染设备40的用户38。
真实音频空间31包括多个音频对象37A、37B、37C和37D。音频对象37A、37B、37C和37D被定位在与渲染设备40的用户38的收听位置不同的角度位置和不同的距离处。在图5A的示例中,第一音频对象37A被定位在角度θA和距离dA处,第二音频对象37B被定位在角度θB距离dB处,第三音频对象37C被定位角度θC和距离DC处,并且第四音频对象37D被定位在角度θC和距离dD处。
在图5A和5B的示例中,视角介导内容不可用。视角介导内容不可用的原因可能有很多。例如,音频空间31可能已被单个捕获设备35捕获,或者被布置为获得空间音频的捕获设备可能未正确运行或任何其他合适的原因。
图5B表示正被渲染给渲染设备40的用户38的音频内容。这示出了音频对象37A、37B、37C和37D没有以任何角度或距离的差异进行渲染,使得相同的音频场景被提供给用户38,不考虑用户38的位置或其头部的角度定向。
图6A和图6B图示了视角介导内容变得可用的示例。图6A示出了已经由一个或多个捕获设备捕获的真实音频空间31,并且图6B示出了如何将其表示给渲染设备40的用户38。
真实音频空间31包括多个音频对象37A、37B、37C和37D。音频对象37A、37B、37C和37D被定位在与渲染设备40的用户38的收听位置不同的角度位置和不同的距离处。在图6A的示例中,第一音频对象37A被定位角度θA和距离dA处,第二音频对象37B被定位在角度θB距离dB处,第三音频对象37C被定位在角度θC和距离DC处,并且第四音频对象37D被定为在角度θC和距离dD处。在图6A的示例中,所有音频对象37A、37B、37C和37D位于距用户38的收听位置相等的距离处。要了解,在其他示例中,音频对象37A、37B、37C和37D可以位于与收听位置不同的距离处。
在图6A和6B的示例中,捕获了音频场景31,使得装置1可以确定每个音频对象37A、37B、37C和37D的角度θ。当装置1在创建视角介导内容时,这可以支持针对每个音频对象37A、37B、37C和37D确定到达方向。这可以支持创建视角介导内容,其中可以重建音频对象37A、37B、37C和37D中的每个音频对象的角度位置。
图6B表示被渲染给渲染设备40的用户38的音频内容。这示出了渲染音频对象37A、37B、37C和37D,使得用户38可以感知每个音频对象37A、37B、37C和37D的不同角度位置。
用户38可能能够围绕三个不同的垂直轴x、y和z旋转其头部。渲染设备40可以检测用户的头部围绕这三个轴的角度位置,并使用该信息来控制渲染设备40渲染的音频场景。可以针对用户头部的不同角度定向来渲染不同的音频场景。
当图6A和6B所示的视角介导内容变得可用时,通知可以被添加到被提供给渲染设备40的内容,以指示视角介导内容已经变为可用。
图7A和图7B图示了新型的视角介导内容变得可用的示例。图7A示出了已经由一个或多个捕获设备捕获的真实音频空间31,并且图7B示出了如何将其表示给渲染设备40的用户38。
在图7A和图7B的示例中,捕获音频场景31,使得装置1可以确定每个音频对象37A、37B、37C和37D的角度θ以及音频对象37A、37B、37C和37D与用户38的收听位置之间的距离。当装置1正在创建视角介导内容时,这可以支持针对每个音频对象37A、37B、37C和37D确定到达方向以及用户38与音频对象37A、37B、37C和37D之间的距离。这可以支持创建视角介导内容,其中可以重建音频对象37A、37B、37C和37D中的每个音频对象的角度位置和相对距离。
图7B表示被渲染给渲染设备40的用户38的音频内容。这示出了渲染音频对象37A、37B、37C和37D,使得用户38可以感知每个音频对象37A、37B、37C和37D的不同角度位置,并且还可以在虚拟视觉空间71内移动。
虚拟音频空间71在图7B中由灰色区域指示。在图7B的示例中,虚拟音频空间71包括椭圆形区域。可以在本公开的其他示例中使用用于虚拟音频空间71的其他形状。
用户38可能能够通过沿着三个垂直轴x、y和z移动而在虚拟音频空间71内移动。例如,用户38可以左右移动,前后移动或上下移动或这些方向的任何组合。渲染设备40可以检测用户38在虚拟音频空间71内的位置,并且可以使用该信息来控制由渲染设备40渲染的音频场景。可以针对虚拟视觉空间71内的不同位置渲染不同的音频场景。
当具有图7A和7B所示的六个自由度的视角介导内容变得可用时,通知可以被添加到被提供给渲染设备40的内容,以指示新型的视角介导内容已经可用。
图8A和图8B图示了视角介导内容对于较大的音频空间31变得可用的示例。图8A示出了已经由一个或多个捕获设备捕获的真实音频空间31,并且图8B示出了如何将其表示给渲染设备40的用户38。
在图8A和图8B的示例中,捕获音频场景31,使得装置1可以确定每个音频对象37A、37B、37C和37D的角度θ以及音频对象37A、37B、37C和37D与用户38的收听位置之间的距离。当装置1正在创建视角介导内容时,这可以支持针对每个音频对象37A、37B、37C和37D确定到达方向以及用户38与音频对象37A、37B、37C和37D之间的距离。这可以支持创建视角介导内容,其中可以重建音频对象37A、37B、37C和37D中的每个音频对象的角度位置和相对距离。图8A中的音频场景31可以类似于图7A所示的音频场景。在图8A的示例中,捕获设备35捕获音频内容以覆盖较大的音频空间31。
图8B表示被渲染给渲染设备40的用户38的音频内容。这示出了音频对象37A、37B、37C和37D被渲染使得用户38可以感知每个音频对象37A、37B、37C和37D的不同角度位置,并且还可以在虚拟视觉空间81内移动。
虚拟音频空间81在图8B中由灰色区域指示。在图8B的示例中,虚拟音频空间81包括类似于图7B所示的虚拟音频空间的椭圆形区域。然而,在图8B的示例中,虚拟音频空间81覆盖较大的音量。这可以使用户38能移动更大的距离,同时支持视角介导内容被渲染。
当具有图8A和图8B所示的更大的虚拟音频空间81的视角介导内容变得可用时,通知可以被添加到被提供给渲染设备40的内容,以指示视角介导内容可用的音量已经增加。
图9图示了另一示例系统29,其中不同类型的视角介导内容为可用的。图9的示例系统29包括多个捕获设备35F、35G、35H、35I、35J、服务器44和至少一个渲染设备40。用于添加指示可用的视角介导内容的类型的通知的装置1可以被提供在渲染设备40内。在其他示例中,可以在服务器44内或在系统29内的任何其他合适的设备内提供装置1。
在图9的示例系统29中,捕获设备35F、35G、35H、35I、35J可以包括图像捕获设备。图像捕获设备可以被布置为捕获视频图像或任何其他合适类型的图像。图像捕获设备还可以被布置为捕获与所捕获的图像相对应的音频。
图9的系统29包括多个捕获设备35F、35G、35H、35I、35J。多个捕获设备35F、35G、35H、35I、35J内的不同捕获设备35F、35G、35H、35I、35J被布置为捕获不同类型的视角介导内容。第一捕获设备35F被布置为捕获具有三个自由度+的视角介导内容,第二捕获设备35G被布置为捕获具有三个自由度的视角介导内容,第三捕获设备35H被布置为捕获具有三个自由度的视角介导内容,第四捕获设备35I被布置为捕获具有三个自由度的视角介导内容,并且第五捕获设备35J被布置为捕获具有三个自由度+的视角介导内容。可以在本公开的其他示例中使用其他数量和布置的捕获设备35F、35G、35H、35I、35J。
由多个捕获设备35F、35G、35H、35I、35J捕获的内容被提供给服务器44。一旦服务器44从多个捕获设备35F、35G、35H、35I、35J接收到内容,则服务器可以执行图9所示的方法。在框90,服务器44处理内容。对捕获内容的处理可以包括:使由不同的捕获设备35F、35G、35H、35I和35J捕获的内容和/或任何其他合适类型的处理同步。
一旦捕获的内容已经被处理,那么在框93,服务器创建包括视角介导内容的内容文件。在一些示例中,服务器44可以创建多个不同的内容文件,其中不同的内容文件包括不同类型的视角介导内容。在一些示例中,内容文件可以包括指示该内容是视角介导内容的元数据。元数据可以指示用户在视角介导内容内具有的自由度的数目,例如,它可以指示用户是具有三个自由度还是具有六个自由度。在一些示例中,它可以指示其中视角介导内容可用的体积的大小。例如,它可以指示其中视角介导内容可用的虚拟空间。在这种示例中,元数据可以被用于确定视角介导内容是否可用。在一些示例中,元数据可以指示已经捕获了视角介导内容的时间段。
内容文件可以与内容捕获同时创建。这可以实现视角介导内容的实时流传输。在其他示例中,可以在稍后的时间点创建内容文件。这可以使视角介导内容能够被存储以用于在稍后的时间点渲染。
在框95,服务器44接收选择内容文件的输入。响应于用户38经由渲染设备40做出的输入,输入可以被接收。输入可以是选择特定内容文件、选择由特定捕获设备35捕获的内容或任何其他合适类型的选择。
在图9的示例中,用户可以选择渲染由特定捕获设备35捕获的内容。例如,用户38可以选择在由第一捕获设备35F捕获的内容和由第二捕获设备35G捕获的内容之间切换。
响应于输入95,在框97中,从服务器到渲染设备40提供所选内容。在框99中,渲染设备40内的装置1确定可用内容的类型。如果可用的视角介导内容的类型已经改变,那么装置1将添加指示可用的视角介导内容的类型已经改变的音频通知。
例如,在图9的示例中,当用户38在由第一捕获设备35F捕获的内容与由第二捕获设备35G捕获的内容之间切换时,这会将可用于三个自由度+的类型视角介导内容改变为三个自由度。装置1可以使用相应内容文件内的元数据来检测该改变。被添加到内容的音频通知可以提供以下指示:可用的自由度已通过切换到新的内容文件而降低。响应于音频通知,用户38可以决定继续渲染由第二捕获设备35G捕获的内容,或者可以选择不同的内容文件。
因此,本公开的示例提供了一种有效的方法,该方法向渲染设备40的用户38提供视角介导内容已经变得可用的通知。该通知可以以听觉方式被提供,因此不需要提供任何视觉用户界面。这意味着,在用户38正在查看视觉内容的示例中,视觉内容将不会被用户38可能会感到烦恼的任何图标或其他通知所遮盖。
添加到内容的通知还可以提供对可用的视角介导内容的类型和/或可用的视角介导内容的大小的指示。这可以向用户提供附加信息,并且可以帮助渲染设备40的用户38确定他们是否希望开始使用视角介导内容。
将通知添加到提供给渲染设备的内容也提供了以下优点:不需要在装置1和渲染设备40之间提供任何附加消息。这意味着一旦视角介导内容变得可用,就可以将视角介导内容可用的通知提供给用户38。这减少了提供给用户38的通知的任何延迟。
“电路系统”的这种定义适用于本申请中该术语的所有使用,包括在任何权利要求中。作为又一示例,如在本申请中所使用的,术语“电路系统”也将覆盖仅处理器(或多个处理器)或处理器的一部分及其(或它们的)伴随的软件和/或固件的实施方式。例如并且如果适用于特定权利要求元件的话,则术语“电路系统”还将覆盖用于服务器、蜂窝网络设备或另一网络设备中的移动电话或类似的集成电路的基带集成电路或应用处理器集成电路。
在本文中以包含性而非排他性的含义使用术语“包括”。即,对包括Y的X的任何引用都表示X可能仅包括一个Y或可能包括一个以上的Y。如果要使用具有排他性含义的“包括”,那么在上下文中将通过引用“仅包括一个…”或通过使用“由...组成”而显而易见。
在该简要描述中,已经参照了各种示例。关于示例的特征或功能的描述指示那些特征或功能存在于该示例中。不管是否明确规定,在文本中使用术语“示例”或“例如”或“可以”表示至少在所描述的示例中存在这种特征或功能,无论是否作为示例进行描述,并且它们可以但不一定存在于一些或所有其他示例中。因此,“示例”、“例如”或“可以”是指一类示例中的特定实例。实例的属性可以是仅该实例的属性或者这类属性或者该类的子类的属性,其包括该类中的一些但非全部实例。因此,隐式地公开了参照一个示例而不是参照另一示例描述的特征在可能的情况下可以在该另一示例中使用,而不必在该另一示例中使用。
尽管在前述段落中已经参照各种示例描述了本发明的实施例,但是应该了解的是,可以在不脱离所要求保护的本发明的范围的情况下对给出的示例进行修改。
除了明确描述的组合之外,可以以组合方式使用在前述描述中描述的特征。
尽管已经参照某些特征描述了功能,但是那些功能可以由其他特征执行,无论是否描述。
尽管已经参照某些实施例描述了特征,但是那些特征也可以存在于其他实施例中,无论是否描述。
尽管尽力在前述说明书中引起对被认为特别重要的本发明的那些特征的注意,但是应该理解的是,本申请人要求保护在此之前参照和/或在附图中示出的任何可获专利的特征或特征组合,无论是否已特别强调了这一点。

Claims (19)

1.一种用于处理内容的装置,包括:
用于确定视角介导内容在被提供给渲染设备的内容内为可用的部件,其中所述视角介导内容包括已经在三维空间内被捕获的内容,所述三维空间支持不同的音频场景和/或视觉场景经由所述渲染设备而被渲染,其中被渲染的所述音频场景和/或视频场景取决于所述渲染设备的用户的位置;以及
用于向被提供给所述渲染设备的所述内容添加指示视角介导内容为可用的通知的部件;
其中所述通知包括被添加到所述内容的空间音频效果。
2.根据权利要求1所述的装置,其中所述通知的所述空间音频效果被暂时地添加到被提供给所述渲染设备的所述内容。
3.根据权利要求1所述的装置,其中所述通知包括改变所述视角介导内容的空间化的空间音频效果。
4.根据权利要求1所述的装置,其中所述通知包括人工音频对象向所述视角介导内容的应用。
5.根据权利要求1所述的装置,其中添加到被提供给所述渲染设备的所述内容的所述空间音频效果包括环境噪声、混响中的一个或多个。
6.根据权利要求1所述的装置,其中所述通知通过将房间脉冲响应应用于所述内容而被添加到被提供给所述渲染设备的所述内容。
7.根据权利要求6所述的装置,其中被应用的所述房间脉冲响应独立于所述视角介导内容在其中被捕获的房间以及被提供给所述渲染设备的所述内容将被渲染在其中的房间。
8.根据权利要求1所述的装置,其中被添加到被提供给所述渲染设备的所述内容的所述通知对与所述用户的位置相对应的所述音频场景产生不同的音频效果。
9.根据权利要求1所述的装置,其中被添加到被提供给所述渲染设备的所述内容的所述通知包括将混响添加到被提供给所述渲染设备的所述内容,以创建一个或多个音频对象正在所述三维空间内移动的所述音频效果。
10.根据权利要求1所述的装置,其中所述视角介导内容包括音频内容。
11.根据任何前述权利要求所述的装置,其中所述视角介导内容包括由多个设备捕获的内容。
12.一种内容渲染设备,所述内容渲染设备包括根据前述权利要求中任一项所述的装置以及用于渲染视角介导内容的部件。
13.一种内容捕获设备,所述内容捕获设备包括根据权利要求1-11中任一项所述的装置以及用于捕获视角介导内容的部件。
14.一种处理内容的方法,包括:
确定视角介导内容在被提供给渲染设备的内容内为可用;以及
向被提供给所述渲染设备的所述内容添加指示视角介导内容为可用的通知,其中所述视角介导内容包括已经在三维空间内被捕获的内容,所述三维空间支持不同的音频场景和/或视觉场景经由所述渲染设备而被渲染,其中被渲染的所述音频场景和/或视频场景取决于所述渲染设备的用户的位置;
其中所述通知包括被添加到被提供给所述渲染设备的所述内容的空间音频效果。
15.根据权利要求14所述的方法,其中所述通知的所述空间音频效果被暂时地添加到被提供给所述渲染设备的所述内容。
16.根据权利要求14所述的方法,其中被添加到被提供给所述渲染设备的所述内容的所述空间音频效果包括环境噪声、混响中的一个或多个。
17.根据权利要求14至16中任一项所述的方法,其中所述通知通过将房间脉冲响应应用于被提供给所述渲染设备的所述内容而被添加到所述内容。
18.一种计算机可读存储介质,其上存储有程序代码,所述程序代码被配置为在执行时使装置:
确定视角介导内容在被提供给渲染设备的内容内为可用,其中所述视角介导内容包括已经在三维空间内被捕获的内容,所述三维空间支持不同的音频场景和/或视觉场景经由所述渲染设备而被渲染,其中被渲染的所述音频场景和/或视频场景取决于所述渲染设备的用户的位置;以及
向被提供给所述渲染设备的所述内容添加指示视角介导内容为可用的通知;
其中所述通知包括被添加到所述内容的空间音频效果。
19.根据权利要求18所述的计算机可读存储介质,其中所述通知的所述空间音频效果被暂时地添加到被提供给所述渲染设备的所述内容。
CN201880079858.8A 2017-12-29 2018-12-14 用于提供通知的装置、方法和计算机可读存储介质 Active CN111448805B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17211014.0A EP3506661A1 (en) 2017-12-29 2017-12-29 An apparatus, method and computer program for providing notifications
EP17211014.0 2017-12-29
PCT/IB2018/060137 WO2019130151A1 (en) 2017-12-29 2018-12-14 An apparatus, method and computer program for providing notifications

Publications (2)

Publication Number Publication Date
CN111448805A CN111448805A (zh) 2020-07-24
CN111448805B true CN111448805B (zh) 2022-03-29

Family

ID=61005662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880079858.8A Active CN111448805B (zh) 2017-12-29 2018-12-14 用于提供通知的装置、方法和计算机可读存储介质

Country Status (4)

Country Link
US (1) US11696085B2 (zh)
EP (1) EP3506661A1 (zh)
CN (1) CN111448805B (zh)
WO (1) WO2019130151A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3599544A1 (en) 2018-07-25 2020-01-29 Nokia Technologies Oy An apparatus, method, computer program for enabling access to mediated reality content by a remote user

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012023864A1 (en) * 2010-08-20 2012-02-23 Industrial Research Limited Surround sound system
CN105191354A (zh) * 2013-05-16 2015-12-23 皇家飞利浦有限公司 音频处理装置及其方法
CN105284129A (zh) * 2013-04-10 2016-01-27 诺基亚技术有限公司 音频记录和回放装置
CN106471823A (zh) * 2014-06-27 2017-03-01 微软技术许可有限责任公司 定向音频通知
CN106576156A (zh) * 2014-09-23 2017-04-19 英特尔公司 穿戴式介导现实系统和方法
CN106796799A (zh) * 2014-10-01 2017-05-31 杜比国际公司 高效drc配置文件传输
WO2017178705A1 (en) * 2016-04-13 2017-10-19 Nokia Technologies Oy Control of audio rendering
EP3264228A1 (en) * 2016-06-30 2018-01-03 Nokia Technologies Oy Mediated reality

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030044002A1 (en) * 2001-08-28 2003-03-06 Yeager David M. Three dimensional audio telephony
US6845338B1 (en) * 2003-02-25 2005-01-18 Symbol Technologies, Inc. Telemetric contextually based spatial audio system integrated into a mobile terminal wireless system
JP2006074572A (ja) * 2004-09-03 2006-03-16 Matsushita Electric Ind Co Ltd 情報端末
US8559646B2 (en) * 2006-12-14 2013-10-15 William G. Gardner Spatial audio teleconferencing
US9258346B2 (en) * 2007-03-26 2016-02-09 International Business Machines Corporation System, method and program for controlling MP3 player
EP2214425A1 (en) * 2009-01-28 2010-08-04 Auralia Emotive Media Systems S.L. Binaural audio guide
US9491560B2 (en) * 2010-07-20 2016-11-08 Analog Devices, Inc. System and method for improving headphone spatial impression
EP2829048B1 (en) * 2012-03-23 2017-12-27 Dolby Laboratories Licensing Corporation Placement of sound signals in a 2d or 3d audio conference
US9628630B2 (en) * 2012-09-27 2017-04-18 Dolby Laboratories Licensing Corporation Method for improving perceptual continuity in a spatial teleconferencing system
US10219093B2 (en) * 2013-03-14 2019-02-26 Michael Luna Mono-spatial audio processing to provide spatial messaging
WO2014184706A1 (en) * 2013-05-16 2014-11-20 Koninklijke Philips N.V. An audio apparatus and method therefor
EP2925024A1 (en) * 2014-03-26 2015-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio rendering employing a geometric distance definition
WO2016014233A1 (en) * 2014-07-25 2016-01-28 mindHIVE Inc. Real-time immersive mediated reality experiences
CN106537942A (zh) * 2014-11-11 2017-03-22 谷歌公司 3d沉浸式空间音频系统和方法
US9749766B2 (en) * 2015-12-27 2017-08-29 Philip Scott Lyren Switching binaural sound
US9774979B1 (en) * 2016-03-03 2017-09-26 Google Inc. Systems and methods for spatial audio adjustment
EP3443762B1 (en) 2016-04-12 2020-06-10 Koninklijke Philips N.V. Spatial audio processing emphasizing sound sources close to a focal distance
EP3255904A1 (en) * 2016-06-07 2017-12-13 Nokia Technologies Oy Distributed audio mixing
US10045120B2 (en) * 2016-06-20 2018-08-07 Gopro, Inc. Associating audio with three-dimensional objects in videos
EP3264368A1 (en) * 2016-06-28 2018-01-03 Nokia Technologies Oy Display of polyhedral virtual objects
US10080088B1 (en) * 2016-11-10 2018-09-18 Amazon Technologies, Inc. Sound zone reproduction system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012023864A1 (en) * 2010-08-20 2012-02-23 Industrial Research Limited Surround sound system
CN105284129A (zh) * 2013-04-10 2016-01-27 诺基亚技术有限公司 音频记录和回放装置
CN105191354A (zh) * 2013-05-16 2015-12-23 皇家飞利浦有限公司 音频处理装置及其方法
CN106471823A (zh) * 2014-06-27 2017-03-01 微软技术许可有限责任公司 定向音频通知
CN106576156A (zh) * 2014-09-23 2017-04-19 英特尔公司 穿戴式介导现实系统和方法
CN106796799A (zh) * 2014-10-01 2017-05-31 杜比国际公司 高效drc配置文件传输
WO2017178705A1 (en) * 2016-04-13 2017-10-19 Nokia Technologies Oy Control of audio rendering
EP3264228A1 (en) * 2016-06-30 2018-01-03 Nokia Technologies Oy Mediated reality

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
虚拟现实及触觉交互技术:趋势与瓶颈;帅立国;《人民论坛·学术前沿》;20161231;全文 *

Also Published As

Publication number Publication date
CN111448805A (zh) 2020-07-24
WO2019130151A1 (en) 2019-07-04
US11696085B2 (en) 2023-07-04
US20210067895A1 (en) 2021-03-04
EP3506661A1 (en) 2019-07-03

Similar Documents

Publication Publication Date Title
US11055057B2 (en) Apparatus and associated methods in the field of virtual reality
CN107636534B (zh) 用于图像处理的方法和系统
US8644467B2 (en) Video conferencing system, method, and computer program storage device
US20190180509A1 (en) Apparatus and associated methods for presentation of first and second virtual-or-augmented reality content
CN110999328B (zh) 装置以及相关联的方法
US20170193704A1 (en) Causing provision of virtual reality content
JP2022116221A (ja) 空間オーディオに関する方法、装置およびコンピュータプログラム
CN111492342B (zh) 音频场景处理
WO2019057530A1 (en) APPARATUS AND ASSOCIATED METHODS FOR PRESENTING AUDIO IN THE FORM OF SPACE AUDIO
CN111448805B (zh) 用于提供通知的装置、方法和计算机可读存储介质
CN113676720A (zh) 多媒体资源的播放方法、装置、计算机设备及存储介质
US20220036075A1 (en) A system for controlling audio-capable connected devices in mixed reality environments
CN113632060A (zh) 用于指示在虚拟空间中呈现的音频内容的可听性的设备、方法、计算机程序或系统
CN113614710A (zh) 用于呈现数据的呈现的设备和相关联的方法
WO2019002676A1 (en) RECORDING AND RENDERING SOUND SPACES
US11140508B2 (en) Apparatus and associated methods for audio presented as spatial audio
CN111344744A (zh) 用于展示三维物体的方法以及相关计算机程序产品、数字存储介质和计算机系统
EP4037340A1 (en) Processing of audio data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant