CN114816316A

CN114816316A - 音频回放的责任的指示

Info

Publication number: CN114816316A
Application number: CN202210053963.2A
Authority: CN
Inventors: L·J·拉克索南
Original assignee: Nokia Technologies Oy
Current assignee: Nokia Technologies Oy
Priority date: 2021-01-19
Filing date: 2022-01-18
Publication date: 2022-07-29
Also published as: EP4030783A1; US20220232340A1

Abstract

根据各种但不一定是所有的实施例，提供了一种装置，包括用于通过利用由连接到用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时呈现音频内容，引起音频回放设备负责回放从该用户设备接收的该音频内容的用户可感知的指示的部件。

Description

音频回放的责任的指示

技术领域

本公开的实施例涉及引起音频回放的责任的指示。一些实施例涉及当多个音频回放设备被连接到从其接收到音频内容的用户设备时引起音频回放的责任的指示。

背景技术

当在音频回放设备之间切换音频内容回放的责任时，新负责的音频回放设备可以播放与其负责回放的音频内容无关的引导声音，例如蜂鸣声或语音提示。

一些音频回放设备能够进行空间音频再现。空间音频再现将声源放置在三维空间中，意图使收听者能够听到来自特定方向的特定声音。

可以针对被格式化为例如以下的音频内容执行空间音频再现：元数据辅助空间音频(MASA)、基于对象的音频、基于声道的音频(例如 5.1或7.1+4)、基于非参数场景的音频(例如一阶混音、高阶混音)或这些格式的组合。可以使用诸如沉浸式语音和音频服务(IVAS)的空间音频编解码器和合适的呈现器(例如，IVAS内部呈现器)来为用户空间化这些格式的音频内容。对于耳机收听，空间化包括双耳化 (binauralisation)。

发明内容

根据各种但不一定是所有的实施例，提供了一种装置，包括用于通过利用由连接到用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时呈现音频内容，引起音频回放设备负责回放从该用户设备接收到的该音频内容的用户可感知的指示。

根据各种但不一定是所有的实施例，提供了一种方法，该方法包括：通过利用由连接到用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时呈现音频内容，引起音频回放设备负责回放从该用户设备接收的该音频内容的用户可感知的指示。

根据各种但不一定是所有的实施例，提供了一种计算机程序，该计算机程序当在计算机上运行时执行：通过利用由连接到用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时呈现音频内容，引起表明音频回放设备负责回放从该用户设备接收的该音频内容的用户可感知的指示。

该“发明内容”部分的以下部分描述了各种特征，其可以是在“发明内容”部分的前述部分中描述的任何实施例的特征。另外，功能的描述应当被认为还公开了适于执行该功能的任何部件。

利用至少一个空间特性来临时呈现音频内容可以包括：临时调整音频内容的呈现，使得音频内容利用至少一个空间特性而被呈现。

利用至少一个空间特性来临时呈现音频内容可以包括临时修改音频内容，使得音频内容具有至少一个空间特性。

利用至少一个空间特性来临时呈现音频内容可以被配置为：相对于用户将感知到源自与至少一个其他音频回放设备的一个或多个位置相对应的一个或多个方向的能量，增加用户将感知到源自远离至少一个其他音频回放设备的至少一个方向的能量。

远离至少一个其他音频回放设备的至少一个方向可以是其中不存在与至少一个其他音频回放设备相关联的真实声源、并且不存在与至少一个其他音频回放设备相关联的可能虚拟声源的方向。

利用至少一个空间特性来临时呈现音频内容可以包括：引起音频内容的总能量的高于阈值的量被引导到远离至少一个其他音频回放设备的至少一个方向上。

在将音频内容的总能量的高于阈值的量引导到两个或多个连续方向之后，用户可感知的指示可以被中止，该两个或多个连续方向中的至少一个方向是远离至少一个其他音频回放设备的至少一个方向。

利用至少一个空间特性来临时呈现音频内容可以包括：将一个或多个音频对象重新定位到远离至少一个其他音频回放设备的至少一个方向上。

利用至少一个空间特性来临时呈现音频内容可以包括：将音频内容的至少一个漫射分量转换为在远离至少一个其他音频回放设备的至少一个方向上的有向音频。

利用至少一个空间特性来临时呈现音频内容可以包括：将音频内容的在与另一音频回放设备的位置相对应的方向上的至少一个有向分量转换成漫射音频。

利用至少一个空间特性来临时呈现音频内容可以包括：在与至少一个其他音频回放设备的位置相对应的方向上减少音频内容的至少一个有向分量的能量，和/或在远离至少一个其他音频回放设备的至少一个方向上增加音频内容的至少一个有向分量的能量。

利用至少一个空间特性来临时呈现音频内容可以包括以单声道或立体声格式呈现空间音频分量。

响应于在连接到用户设备的音频回放设备之中回放音频内容的责任的改变，可以利用至少一个空间特性来临时呈现音频内容。

响应于针对确认音频回放设备负责回放音频内容的用户请求，可以利用至少一个空间特性来临时呈现音频内容。

在相关联的元数据中被标记为不应被修改的分量的音频内容的分量可以不被修改。

根据各种但不一定是所有的实施例，提供了如所附权利要求中所要求的示例。本发明的各种实施例所寻求的保护范围由独立权利要求给出。在本说明书中描述的不落入独立权利要求的范围内的示例和特征(如果有的话)将被解释为对理解本发明的各种实施例有用的示例。

附图说明

现在将参考附图描述一些示例，其中：

图1A、图1B示出了本文所述主题的示例；

图2示出了本文所述主题的另一示例；

图3示出了本文所述的示例方法；

图4示出了本文所述主题的示例；

图5示出了本文所述的另一示例方法；

图6示出了本文所述主题的示例；

图7示出了本文所述主题的示例；

图8示出了本文所述主题的示例；

图9示出了本文所述主题的示例；

图10示出了本文所述主题的示例；

图11示出了本文所述主题的示例；

图12示出了本文所述主题的示例；

图13示出了本文所述主题的示例；

图14示出了本文所述主题的示例；

图15A、图15B示出了本文所述主题的示例；以及

图16示出了本文所述的示例装置。

具体实施方式

以下描述记载了向用户1指示音频回放设备3负责回放他们听到的音频内容的装置、方法和计算机程序。具体地，这通过利用至少一个空间特性来临时呈现音频内容来实现，该至少一个空间特性可以通过用户 1而与音频回放设备3相关联。

音频回放设备3是能够将表示声音的音频—电信号(audio—an electricalsignal)(数字或模拟)变换成通过介质传播的声音—压力波 (sound—a pressure wave)的任何设备。音频内容是这样的信息：一旦被变换成声音，用户1就可以听到。音频内容的回放包括将音频内容变换成声音，使得用户1可以听到该信息。

图1A和图1B图示了在用户1附近存在两个音频回放设备3、7的情形的示例。在该示例中，用户佩戴耳机3并持有具有集成扬声器7的用户设备5。用户设备可以是电子通信设备。

如果音频由非空间(头部锁定)音频组成，那么用户1能够通过相对于用户设备5移动他们的头部来确定哪个音频回放设备——耳机3或集成扬声器7——负责回放。如果耳机3负责回放，则音频内容的视在声源(apparent sound source)9将显得像与用户的头部一起移动，而如果集成扬声器7负责回放，则音频内容的视在声源9将不会与用户的头部一起移动。

当然可以存在音频内容的多个视在声源，分别对应于音频内容的不同分量。在这种情况下，当经由耳机3回放时，多个视在声源中的每一个将显得像与用户的头部一致地移动，而当经由集成扬声器7回放时，这将不会被观察到。

另一方面，如果音频包括至少一些空间音频分量，则用户1无法通过相对于用户设备5移动他们的头部来确定哪个音频回放设备——耳机 3或集成扬声器7负责回放。无论耳机3还是集成扬声器7负责回放用户1听到的音频内容，音频内容的视在声源9或者至少一些分量将不会移动。因此，用户1可能困惑哪个音频回放设备3、7负责回放他们听到的音频内容。

在音频内容伴随可视内容的一些示例中，可以从显示可视内容的方向再现大部分音频内容(例如，主对话)。这可以在用户设备5处并且因此大致在与集成扬声器7相同的方向上。这可以导致用户1相信集成扬声器7负责回放他们听到的音频内容，即使事实上是耳机3负责回放时。

当在用户1附近存在更多音频回放设备时，用户1可能更难确定在其附近的哪个音频回放设备负责回放他们听到的音频内容。图2图示了存在两个以上音频回放设备的情形的示例。在图2中，用户不仅佩戴耳机3并且持有具有集成扬声器7(如图1A和图1B中)的用户设备5，而且在与用户1相同的房间中还有扬声器系统11，其可以被用来回放音频内容。扬声器系统11可以比集成扬声器7更能够再现空间音频效果或者能够再现更多种类的空间音频效果。因此，即使没有从用户设备5(例如，其中可以显示伴随的可视内容)的方向再现大量的音频内容，用户 1仍然难以确定扬声器系统11和耳机3中的哪一个负责音频内容的回放。例如，视在声源13靠近扬声器系统11的位置可以是由耳机3或扬声器系统11回放的结果。

应当了解，如果大部分音频内容是从用户设备5的方向再现的——如在音频内容包括在用户设备5上显示的伴随可视内容的对话的情况下，则即使在扬声器系统11的回放和用户设备5的集成扬声器7的回放之间用户1也难以进行区分。例如，视在声源15靠近用户设备5的位置可以是由耳机3、集成扬声器7或扬声器系统11回放的结果。因此，该问题不限于确定耳机3是否负责回放；相反，该问题与所有音频回放设备3、7、11相关。

如果用户1不能容易地确定在其附近的哪个音频回放设备3、7、11 负责回放他们听到的音频内容，则对用户1而言存在多个缺点。例如：用户1可能变得困惑；用户1可能会以公开的方式无意地允许回放私密 (例如机密的、尴尬的等等)音频内容，诸如私密通信呼叫；用户1可能用音频内容的公共回放无意地打扰附近的其他人；用户1可能没有意识到用户设备5与诸如音频回放设备3之类的其他设备之间的无线连接已经掉线，因为在一些情况下，回放将经由用户设备5的集成扬声器7 不间断地恢复；用户1可能由于感知到的音频回放设备3对调整(例如，音量等)的不响应而受挫或分散注意力，而没有意识到感知到的不响应是由于音频回放设备3不负责回放他们听到的音频内容所引起的。

图3图示了用于使用户1能确定音频回放设备3负责回放他们听到的音频内容的方法100的示例。

在框110中引起音频回放设备3对音频内容的回放。音频回放设备 3从用户设备5接收音频内容，在用户设备5处，用户1可以控制要被回放的音频内容。这可以涉及：选择存储在用户设备5处的或远程地并且经由用户设备5访问的媒体文件。用户设备5还可以被配置为使得用户1能够控制连接到用户设备5的哪个音频回放设备3、7、11应回放音频内容。在这种情形中，连接意味着设备之间的数据交换被启用。这种数据交换可以通过有线或无线链路来进行。

方法100包括通过利用由连接到用户设备5的至少一个其他音频回放设备7、11无法再现的至少一个空间特性来临时呈现音频内容，引起音频回放设备3负责回放从用户设备5接收到的音频内容的用户可感知的指示，如框120中所示。

因此，所引起的用户可感知的指示，尽管形式上是可听的，但是不一定是与用户1期望的声音偏离(diverge)的声音，而是可以是所期望声音的不期望的空间化。至少一个空间特性可以被应用于记录在音频内容中的现有信息，使得在用户1感知的声音场景内，该信息显得像被错放。用户可感知的指示并不试图针对用户1重新如音频内容的原始作曲者所意图的、创建真实的声音体验，而是提供与此不同的偏差。以这种方式，用户1可以感知到声音已经以除了实际上负责回放的音频回放设备3之外的连接到用户设备5的另一音频回放设备7、11不会或不能再现的方式改变。

用户可感知的指示可以是音频回放设备3新近负责回放音频内容的指示，例如基于传送到用户设备5的用户选择，回放的责任刚刚从另一音频回放设备7、11改变到音频回放设备3。因此，在一些示例中，方法100包括响应于在连接到用户设备5的音频回放设备3、7、11之中回放音频内容的责任的改变，利用至少一个空间特性来临时地呈现音频内容。

备选地，用户可感知的指示可以是音频回放设备3已经负责并且保持负责回放音频内容的指示。因此，在一些示例中，方法100包括：响应于针对确认音频回放设备3负责回放音频内容的用户请求，利用至少一个空间特性来临时地呈现音频内容。针对确认的用户请求可以包括如图4中所图示的预定手势17。如所图示，预定手势17可以包括用一只或两只手成杯状窝住他的一只或两只耳朵及其佩戴的任何耳机扬声器。这样的手势17可以是直观的，反映了由用户1采取的动作阻挡不想要的声音。如果用户1佩戴耳机3，则他们可以适于检测该手势17。例如，耳机3可以包括用于检测该阻挡手势17的传感器。用户可感知的指示可以持续用户1执行该手势17的时间。

返回到图3的讨论，在一些示例中，连接到用户设备5的具有不同空间音频能力的一个或多个其他音频回放设备7、11不能再现临时呈现音频内容的至少一个空间特性。例如，在音频回放设备3具有产生全球面环绕声的能力并且一个或多个其他音频回放设备7、11被限制为至多平面环绕声的情况下，至少一个空间特性可以是在诸如用户头部上方的平面之外的位置处具有视在声源9的音频内容。在另一示例中，在一个或多个其他音频回放设备7、11能够实现全球面环绕声的情况下，至少一个空间特性可以是通过以单声道格式或立体声格式呈现音频内容而感知到的音频内容的视在声源9的头部内在化(head-internalisation)。

至少一个空间特性的区别性可以不限于仅考虑连接到用户设备5的一个或多个其他音频回放设备7、11。在一些示例中，至少一个空间特性可以是另外由附近的其他音频回放设备或至少是先前连接到用户设备 5的附近的那些音频回放设备无法再现的空间特性。在附近可以被理解为在相同房间或在另一公共声学环境中。

由于用户可感知的指示是临时的，因此音频内容的回放此后按照框 130继续。

借助于利用至少一个空间特性来临时呈现音频内容，用户可感知的指示具有有限的持续时间。可以预先确定持续时间。持续时间可以是数秒或任何其他合适的长度，使得用户1能够意识到与真实声音体验或预期空间化的偏离是有意的而不仅仅是差错。备选地，持续时间可以基于音频内容。例如，持续时间可以被确定为音频内容的持续时间的某个百分比。该百分比可以随着音频内容的持续时间的增加而减小。对于持续时间小于一分钟的音频内容，该百分比可以是例如10％，而对于持续时间接近一小时的音频内容，该百分比可以是例如接近1％。在任一情况下，借助于具有至少一个空间特性的音频内容的临时呈现，用户可感知的指示的持续时间短于音频内容的持续时间。

在一些示例中，用户可感知的指示可以响应于确认用户可感知的指示的用户输入(诸如手势)而被中止。在没有这种确认用户可感知的指示的用户输入的情况下，用户可感知的指示可以持续更长的时间，或者临时呈现可以被配置为进一步强调也无法由连接到用户设备5的至少一个其他音频回放设备7、11再现的至少一个空间特性或其他空间特性。例如，如果最初只有音频内容的分量的子集(例如，一个或多个音频对象或一个或多个频率)被呈现为具有至少一个空间特性，则在没有这种确认用户可感知的指示的用户输入的情况下，音频内容的更多分量(在一些示例中甚至是所有分量)可以被呈现为具有至少一个空间特性。

当回放继续时，按照框130，音频内容利用其预期空间化而被呈现。音频内容的预期空间化可以被记录在例如相关联的元数据中。还可以以用于基于声道的音频的声道顺序来记录预期空间化。

应当理解，在用户可感知的指示停止之后，音频内容的预期空间化可以具有由连接到用户设备5的至少一个其他音频回放设备7、11无法实现的空间特性，然而，这些空间特性将鉴于音频内容而对于用户1来说不是意外的，并且不是由于考虑到至少一个其他音频回放设备7、11 的回放能力212、214(参见图5)并且特别地考虑到它们不具有负责在该时间期间回放音频内容的音频回放设备3所具有的回放能力212、214 而产生的。

备选地，如果没有提供确认用户可感知的指示的用户输入，则音频呈现可以被切换到常规的立体声呈现。

通过引起该用户可感知的指示：用户1可以解决关于哪个音频回放设备3、7、11负责回放他们听到的音频内容的困惑；用户1可以确定私密(例如机密的、尴尬的等等)音频内容的回放保持私密；可以使用户 1意识到用户设备5和诸如音频回放设备3的其他设备之间的无线连接没有掉线；用户1能够确认音频回放设备3使用了正确的空间化模式；为了向用户1指示哪个音频回放设备3、7、11负责回放，用户1不会因添加诸如响亮嘟嘟声或语音提示之类的新声音而从音频内容分心，也不会因视觉覆盖(如果有的话)而从伴随视觉内容分心；用户1不需要使用消除过程来去激活或断开音频回放设备3、7、11以检查哪个设备负责回放，该过程将在用户1所感知的音频内容中产生不必要的不连续性。

图5图示了一个示例，其中为了确定至少一个空间特性而获得连接到用户设备5的至少一个其他音频回放设备7、11的回放能力212、214 的知识，其中利用该至少一个空间特性来临时呈现音频内容以便向用户 1指示音频回放设备3负责回放音频内容。

在框210，获得关于连接到用户设备5的至少一个其他音频回放设备7、11的回放能力的信息。这可以涉及：获得关于至少一个其他音频回放设备7、11的一个或多个位置212的信息。至少一个其他音频回放设备7、11的一个或多个位置212可以通过任何合适的手段来获得，诸如例如：使用超宽带定位的无线电定位；使用用户设备5的相机的计算机视觉；或者声学测量，诸如由一些音频回放设备使用以考虑室内声学来优化性能的那些声学测量。这种声学测量可以使用容纳在至少一个其他音频回放设备7、11内的一个或多个麦克风或专用麦克风来进行。在至少一个其他音频回放设备7、11具有一个或多个可预测位置212的示例中，诸如环绕声系统中的扬声器单元，这些可以被保存以供将来使用。

获得至少一个其他音频回放设备7、11的回放能力212、214的信息可以附加地涉及：获得关于可以由至少一个其他音频回放设备7、11产生的空间音频效果214(如果有的话)的信息。该信息214可以由至少一个其他音频回放设备7、11传送。

按照框220，基于至少一个其他音频回放设备7、11的一个或多个位置212，可以获得从用户1的角度的一个或多个真实声源222的一个或多个方向。

还按照框220，基于至少一个其他音频回放设备7、11的一个或多个位置212以及可以由至少一个其他音频回放设备7、11产生的空间音频效果214，可以获得从用户1的角度的一个或多个可能虚拟声源224 的一个或多个方向。

用户1的角度可以基于用户1相对于用户设备5的位置来确定，该位置可以通过诸如例如飞行时间无线电波测量或计算机视觉之类的任何合适的手段来获得。

在框230处，在至少一个方向232上获得信息，其中不存在与至少一个其他音频回放设备7、11相关联的真实声源并且不存在与至少一个其他音频回放设备7、11相关联的可能虚拟声源。因此，从用户1的角度，基于一个或多个真实声源222和一个或多个可能虚拟声源224(如果有的话)的一个或多个方向来确定至少一个方向232。

应当了解，在一些示例中，获得回放能力212、214可以涉及：获得关于至少一个其他音频回放设备7、11的一个或多个位置212的信息，并相应地获得关于一个或多个真实声源222的一个或多个方向的信息，而不获得关于可以由至少一个其他音频回放设备产生的空间音频效果 214(如果有的话)的信息，也不相应地获得关于可能虚拟声源224的方向的信息。因此，在一些示例中，在框230处，在不存在真实声源的至少一个方向232上获得信息。在该示例中，所获得的至少一个方向232 是远离至少一个其他音频回放设备7、11的至少一个方向。

图6至图14图示了至少一个空间特性的示例，利用该至少一个空间特性来临时地呈现音频内容以向用户1指示音频回放设备3负责回放音频内容。

在这些示例的每个示例中，利用至少一个空间特性来临时呈现音频内容可以包括：临时调整音频内容的呈现，使得利用至少一个空间特性来呈现音频内容；或者临时修改音频内容，使得音频内容具有至少一个空间特性。

对于音频内容的不同分量，可以利用来呈现不同分量的空间特性可以不同。因此，在一些示例中，空间特性是内容相关的。

在图6至图13的示例中，利用至少一个空间特性来临时呈现音频内容被配置为：相对于用户1将感知到源自与至少一个其他音频回放设备 7、11的一个或多个位置212相对应的一个或多个方向的能量，增加用户1将感知到源自远离至少一个其他音频回放设备7、11的至少一个方向232的能量。

在一些示例中，在用户可感知的指示期间，被感知为源自远离至少一个其他音频回放设备的至少一个方向232和源自与至少一个其他音频回放设备7、11的一个或多个位置212相对应的一个或多个方向的相对能量关于一个或多个频率或频带而变化，并且不必跨整个频谱。

在一些示例中，远离其他音频回放设备7、11的至少一个方向232 是其中不存在与至少一个其他音频回放设备7、11相关联的真实声源的方向。其也可以是在不存在与至少一个其他音频回放设备7、11相关联的可能虚拟声源的方向上。

图6图示了一个示例，其中音频内容的总能量的高于阈值的量被感知为源自远离至少一个其他音频回放设备7、11的至少一个方向232。音频内容的总能量的高于阈值的量的视在声源19位于远离至少一个其他音频回放设备7、11的至少一个方向232上。

具有位于远离至少一个其他音频回放设备7、11的至少一个方向232 上的视在声源19的音频内容的总能量的高于阈值的量是由至少一个其他音频回放设备7、11无法再现的空间特性的示例。

在图6中所图示的示例中，用户1佩戴耳机3，并且用户设备5位于用户1前面。负责回放音频内容的音频回放设备是耳机3。连接到用户设备5的其他音频回放设备是用户设备5的集成扬声器7。针对音频内容的总能量的高于阈值的量的视在声源19位于用户1后面。因此，与集成扬声器7关于用户1的相对位置相比，音频内容的总能量的高于阈值的量被感知为源自用户头部的相对侧。

在该示例中，针对音频内容的总能量的高于阈值的量的视在声源19 位于不存在与集成扬声器7相关联的真实或可能虚拟声源的地方。一般来说，利用至少一个空间特性来临时地呈现音频内容可以包括：使音频内容的总能量的高于阈值的量被感知为源自至少一个方向232，在该方向232中不存在与连接到用户设备5的至少一个其他音频回放设备7、 11相关联的真实声源，并且不存在与连接到用户设备5的至少一个其他音频回放设备7、11相关联的可能虚拟声源。

高于阈值的量可以指的是大多数。在一些示例中，阈值可以更高。阈值可以是70％。利用至少一个空间特性来临时呈现音频内容可以包括使音频内容的总能量的70％或更多被感知为源自远离至少一个其他音频回放设备7、11(诸如集成扬声器7)的至少一个方向232。

在一些示例中，音频内容的总能量的高于阈值的量可以被集中在音频内容的预期空间化中的一个方向上，或者被集中在音频内容的有向分量上。例如，音频内容可以包括一个或多个音频对象。因此，利用至少一个空间特性来临时地呈现音频内容可以包括：将一个或多个音频对象重新定位到远离至少一个其他音频回放设备7、11的至少一个方向232 上。

对于被重新定位到远离至少一个其他音频回放设备7、11的至少一个方向上的音频内容(诸如音频对象)的一个或多个有向分量，可以使这些分量的全部或基本上全部能量具有来自远离至少一个其他音频回放设备7、11的至少一个方向232的感知起源。音频内容的总能量的高于阈值的量可以包括音频内容的一个或多个有向分量的全部或基本上全部能量。在一个或多个有向分量表示直达声音的情况下，其全部或基本上全部能量可以被集中在远离至少一个其他音频回放设备7、11的至少一个方向232上。例如，在一个或多个有向分量表示反射声音或延迟混响的情况下，其能量可以围绕远离至少一个其他音频回放设备7、11的至少一个方向232传播。

备选地，利用至少一个空间特性来临时呈现音频内容可以包括：在与至少一个其他音频回放设备7、11的位置相对应的方向上减少音频内容的至少一个有向分量的能量和/或在远离至少一个其他音频回放设备 7、11的至少一个方向232上增加音频内容的至少一个有向分量的能量，如图7中所示。

在图7的示例中，在用户可感知的指示期间针对用户1后面的音频内容的分量的视在声源21具有比在预期空间化中针对用户1后面的音频内容的分量的视在声源23更多的能量(由更大的圆圈来指示)。另一方面，在用户可感知的指示期间针对用户1前面的音频内容的分量的视在声源25比在预期空间化中针对用户1前面的音频内容的分量的视在声源27具有更少的能量(由较小的圆圈来指示)。

在其他示例中，如图8中所图示，可以增加音频内容的漫射分量29 的定向属性，并将其引导到远离至少一个其他音频回放设备7、11的至少一个方向232中。例如，在IVASMASA含量的情况下，漫射分量29 的直接与总(direct-to-total)能量之比可以增加。

也就是说，利用至少一个空间特性来临时呈现音频内容可以包括：将音频内容的至少一个漫射分量29从远离至少一个其他音频回放设备 7、11的至少一个方向232转换成有向音频。

如图8中所示，这可以结合将音频内容(例如，一个或多个音频对象)的一个或多个现有有向分量31重新定位到远离至少一个其他音频回放设备的至少一个方向232中来执行。图8示出了音频内容的视在声源 9或者至少音频内容的总能量的高于阈值的量的视在声源19在用户1后面。

备选地，可以切换有向分量31和漫射分量29。也就是说，记录在有向分量31中的信息可以以漫射的方式来分布，而记录在漫射分量29 中的信息被集中在一个方向上。音频内容的预期空间化的这种反转常常是不真实的，并且因此用户将不会对于预期空间化产生困惑。因此，用户1将更清楚他们正被提供用户可感知的指示。

因此，利用至少一个空间特性来临时呈现音频内容可以包括：附加地或备选地，将在与至少一个其他音频回放设备7、11的一个或多个位置212相对应的方向上的音频内容的至少一个有向分量31转换成漫射音频。

利用至少一个空间特性来临时呈现音频内容可以包括：在提供用户可感知的指示期间，使音频内容的总能量的高于阈值的量被感知为源自多于一个方向。图9图示了示例。

可以使音频内容的总能量的高于阈值的量的视在声源19被感知为源自两个或多个连续方向，该两个或多个连续方向中的至少一个方向是远离至少一个其他音频回放设备7、11的方向232。两个或多个连续方向中的至少一个可以是这样的方向，在该方向中不存在与连接到用户设备5的至少一个其他音频回放设备7、11相关联的真实声源，并且不存在与连接到用户设备5的至少一个其他音频回放设备7、11相关联的可能虚拟声源。

在将音频内容的总能量的高于阈值的量引导到两个或多个连续方向之后，用户可感知的指示可以被中断，该两个或多个连续方向中的至少一个方向是远离至少一个其他音频回放设备7、11的至少一个方向232。

在图9的示例中，音频内容的总能量的高于阈值的量的视在声源19 首先如图6中那样位于用户1后面。随后，使视在声源19改变位置，并且视在声源19将被感知为源自用户1右手侧。位于用户1右手侧的视在声源被标记为19’。在这之后的时间，用户可感知的指示可以被中止，并且音频内容的呈现利用其作曲者的预期空间化继续。例如，并且如图 9中所图示，这可以导致音频内容的总能量的高于阈值的量被感知为源自用户1前面，来自其中伴随可视内容(如果有的话)可以被显示的用户设备5的方向。位于用户1前面的视在声源被标记为19”。

在一些示例中，用户可感知的指示可以是针对音频内容的总能量的高于阈值的量的视在声源19围绕用户连续移动的形式。连续移动可以遵循图9中标记为33的轨迹。

这在负责回放音频内容的音频回放设备是耳机3的情况下是有利的。与由耳机3产生的声音对照而言，由扬声器7、11产生的声音将被房间反射而非白化(coloured)，并且视在声源的被感知轨迹将通常不如由耳机3产生的清晰或一致。这可以是对用户1的表明耳机3负责回放他们听到的音频内容的另一个用户可感知的指示。

在其他示例中，用户可感知的指示可以是针对音频内容的总能量的高于阈值的量的视在声源19的位置中的一个或多个离散变化的形式。

利用至少一个空间特性来临时呈现音频内容可以从远离至少一个其他音频回放设备7、11的至少一个方向232开始，或者可以包括从音频内容的预期空间化中的预期方向向该方向232的快速平移。

图10图示了其中存在连接到用户设备5的多个其他音频回放设备 7、11的示例。在该示例中，用户设备5连接到其自己的集成扬声器7、用户1所佩戴的耳机3、以及可以是环绕声扬声器系统的扬声器系统11。负责回放音频内容的音频回放设备是耳机3。扬声器系统11位于用户1 左手侧，而用户设备5位于用户1前面。因此，远离连接到用户设备5 的其他音频回放设备7、11的方向包括用户1后面和用户1右手侧。如果扬声器系统11未被配置用于环绕声或者被配置用于平面环绕声而不是全球面环绕声，则远离连接到用户设备5的其他音频回放设备7、11 的方向也可以包括用户头部的上方和/或下方。

如在图6-图9的示例中那样，在图10的示例中，由用户1佩戴的耳机3是负责回放用户听到的音频内容的音频回放设备。音频内容的总能量的高于阈值的量的视在声源19首先位于用户头部的右后侧，远离用户设备5的集成扬声器7和环绕声扬声器系统11。在一些示例中，这可以是在用户可感知的指示期间视在声源19所处的唯一方向。在其他示例 (诸如所图示的示例)中，视在声源19被移动到也可以远离其他音频回放设备7、11的至少一个其他方向中。如所图示，视在声源随后位于远离环绕声扬声器系统11的用户头部的右前侧。位于用户1右前侧的视在声源被标记为19’。在该位置中，视在声源19’也不在集成扬声器7的方向上，但是用户1可能不太清楚该位置中的视在声源19’不能由用户1 前面的集成扬声器7再现。

在这之后的时间，用户可感知的指示可以被中止，并且音频内容的呈现利用其作曲者的预期空间化继续。例如，并且如图10中所图示，这可以导致音频内容的总能量的高于阈值的量被感知为源自用户1前面，来自其中伴随可视内容(如果有的话)可以被显示的用户设备5的方向。位于用户1前面的视在声源被标记为19”。

在一些示例中，视在声源19所遵循的轨迹33可以比图9和图10 所图示的轨迹更复杂。

图11示出了一个示例，其中提供音频内容的总能量的高于阈值的量的音频内容的有向分量(或方向性已被增加的漫射分量)在具有可差分控制的相关联方向的两个或多个组之间进行划分。被包括在第一组中的音频内容的分量可以具有沿着第一轨迹33₁移动的第一视在声源19₁，并且被包括在第二组中的音频内容的分量可以具有沿着不同于第一轨迹 33₁的第二轨迹33₂移动的第二视在声源19₂。

在图11中所图示的示例中，第一视在声源和第二视在声源19₁、19₂首先位于用户1后面。然后，第一视在声源19₁四处移动到用户的右手侧(在这里将其标记为19₁’)，而第二视在声源19₂四处移动到用户的左手侧(在这里将其标记为19₂’)。

随后，用户可感知的指示可以被中止，并且视在声源19₁，19₂都位于用户1前面(在这里它们分别被标记为19₁”和19₂”)，在伴随可视内容(如果有的话)可以被显示的用户设备5的方向上。

备选地，在断开用户可感知的指示之前，对于更复杂的轨迹，第一轨迹33₁可以包括将第一视在声源19₁从用户的右手侧移动到他们的左手侧(在这里将其标记为19₁)，而第二轨迹33₂可以包括将第二视在声源19₂从用户的左手侧移动到他们的右手侧(在这里将其标记为19₂)，如图12中所图示的示例。这可以被反转和重复。对于音频内容的预期空间化，用户将不会对于这种不真实的移动模式1产生困惑，并且因此，他们将更清楚他们正被提供用户可感知的指示。

图13图示了在不同维度上的音频内容的总能量的高于阈值的量的视在声源19的轨迹33的示例。不同于视在声源在用户1周围的水平面中的轨迹，如图9-图12中所示，图13的示例中的视在声源19的轨迹 33将其从该平面中取出。视在声源19首先位于用户头部的后面。然后调整视在声源19的高度，以使得其稍后位于用户头部的上方(在这里将其标记为19’)。在其他示例中，视在声源19可以从用户可感知的指示的开头时位于用户头部的上方。在这之后的时间，用户可感知的指示可以被中断，并且音频内容的呈现利用其作曲者的预期空间化继续。例如，并且如图13中所图示，这可以导致音频内容的总能量的高于阈值的量被感知为源自用户1前面(在这里将其标记为19”)，来自其中伴随可视内容(如果有的话)可以被显示的用户设备5的方向。

尽管在图13中没有描绘诸如图2和图10中所示的环绕声扬声器系统11，其中这种扬声器系统11适于提供平面环绕声呈现，但是图13中所图示的轨迹33或简单地将视在声源19定位在用户头部周围的水平面之外的位置(诸如在其头部的上方)处，可以提供清楚的用户可感知的指示：具有例如全球面环绕声能力的音频回放设备是负责回放音频内容的设备。

另一方面，在这种扬声器系统11适于提供全球面环绕声呈现的情况下，将视在声源19定位在用户头部周围的水平面之外的位置可能不能使用户1标识能够进行全球面环绕声呈现的另一音频回放设备(诸如他们所佩戴的耳机3)负责音频内容的回放。然而，如前面所提及，由耳机3 提供的视在声源19的感知轨迹的清晰度可以使得用户1能够在由耳机3产生的声音和由扬声器系统11产生的声音之间进行区分。因此，图13 中所图示的视在声源19的轨迹33在这些情形中可以被用作用户可感知的指示。

备选的或附加的是以单声道或立体声格式临时再现(下混频)空间音频分量。以单声道或立体声格式呈现空间音频分量提供了音频内容的视在声源9或至少音频内容的总能量的高于阈值的量的视在声源19的头部内在化效果，这是不能由至少一个其他音频回放设备7、11再现的空间特性的示例，其中至少一个其他音频回放设备7、11不是耳机3。头部内在化效果是音频内容的视在声源或至少部分音频内容将不会被感知为源自远离其头部的位置的地方。视在声源的头部内在化在图14中被标记为9’/19’。在图14的示例中，视在声源9或19首先位于用户头部的后面。然后通过以单声道或立体声格式呈现音频内容的空间音频分量来去除空间音频效果。这可以被反转和重复。对于音频内容的预期空间化，用户1将不会对于这种不真实的移动模式产生困惑，并且因此，他们将更清楚他们正被提供用户可感知的指示。

还应当了解，视在声源9/19不需要被移动，而是改为可以从用户可感知的指示的开始时以单声道或立体声格式临时回放音频内容，直到用户可感知的指示停止为止。

用于利用不能由其他音频回放设备7、11(其基于房间特性将声音投射到真实房间中，以使得用户1听到以诸如混响效果和反射之类的色彩所产生的任何声音)再现的空间特性来临时呈现音频内容的另一替代或附加方案是在用户可感知的指示的持续时间内向音频内容施加与房间特性不匹配的房间脉冲响应(RIR)或者以可察觉的方式调整施加到音频内容的RIR。在一些示例中，例如为了向用户1指示音频内容的回放是经由耳机3进行的，临时移除在音频内容的双声道化期间另外添加的RIR，以使得在用户可感知的指示期间用户听到的音频内容不显得好像它已经被投射到房间中。这将排除在远离用户1的位置处的音频回放设备7、11可能已经负责回放音频内容的感知。

在一些示例中，不是音频内容的所有分量都可用于向用户1指示音频回放设备3负责音频内容的回放。音频内容的预期空间化可以被记录在相关联的元数据中。在用户可感知的指示期间，在相关联的元数据中被标记为不应被修改的分量或再现不应被调整的分量的音频内容的分量不被修改或调整。它们在用户可感知的指示的整个持续时间内保持其预期空间化。图15A、图15B示出了示例。

图15A图示了音频内容的两个分量的预期空间化的示例。在该示例中，两个分量的视在声源35、37在用户设备5的方向上位于用户1前面。这些中的第一个是用于在伴随的元数据中被标记并且因此对于用户可感知的指示是不可用的分量的视在声源35。这些中的第二个是未如此标记的分量的视在声源37。

图15B图示了通过利用不能由连接到用户设备的至少一个其他音频回放设备(在这种情况下是用户设备5的集成扬声器7)再现的至少一个空间特性来临时呈现包括这两个分量的音频内容而引起的用户可感知的指示的示例。在伴随的元数据中标记的分量的视在声源35保持其预期空间化。与集成扬声器7相对于用户1的相对位置相比，未如此标记的分量的视在声源位于用户1后面，在用户头部的相对侧上，并且其中不存在与集成扬声器7相关联的真实声源或可能虚拟声源。用户1后面的该位置中的未标记分量的视在声源被标记为37’。

在一些示例中，并且如图15B中所示，与被感知为源自远离至少一个其他音频回放设备7、11的该至少一个方向232的音频内容的分量相关联的能量被增加。因为空间化现在分布在预期方向和非预期方向之间，以强调远离集成扬声器7的方向232，并且因此强调不能由集成扬声器7 再现的空间特性，所以位于远离集成扬声器7的方向232上的视在声源37’的能量增加。它可以被增加以使音频内容的总能量的高于阈值的量位于远离集成扬声器7的方向232上。应当了解，这不是必需的，并且在其他示例中，与在没有用户可感知的指示的情况下另外预期的相比，位于远离集成扬声器7的方向232上的视在声源37’的能量不被修改。

在一些示例中，在元数据将音频内容的分量标记为不可用于用户可感知的指示的情况下，该元数据可以代替被标记分量而标识要被修改的音频内容的另一分量。

可用于该指示的音频内容的分量可以由原始内容作曲者或由用户1 标记。用户1可以选择他们不希望成为指示的一部分的个体组件(例如，音频对象)，或者如果元数据将分量归类为例如“语音”或“环绕效果”，则用户1可以选择他们不希望成为指示的一部分的类别。用户1的选择可以针对当前音频内容的当前回放来进行，或者可以作为被应用于未来音频内容回放的设置来进行。

图16示意性地图示了根据本公开的示例的装置40。图16中所图示的装置40可以是芯片或芯片组。在一些示例中，可以在用户设备或音频回放设备内提供装置40。

装置40包括控制器42。控制器42的实现可以作为控制器电路。控制器42可以单独以硬件实现，具有单独包括固件的软件中的某些方面，或者可以是硬件和软件(包括固件)的组合。

如图16中所图示，控制器42可以使用实现硬件功能性的指令来实现，例如通过使用通用或专用处理器44中的计算机程序48的可执行指令来实现，该可执行指令可以被存储在计算机可读存储介质(磁盘、存储器等)上以由这样的处理器44执行。

处理器44被配置为从存储器46读取和向存储器46写入。处理器 44还可以包括输出接口和输入接口，数据和/或命令经由该输出接口由处理器44输出，数据和/或命令经由该输入接口输入到处理器44。

存储器46存储包括计算机程序指令(计算机程序代码)的计算机程序48，该计算机程序指令在被加载到处理器44中时控制装置40的操作。计算机程序48的计算机程序指令提供逻辑和例程，该逻辑和例程使得该装置能够执行关于前面附图所图示和描述的方法。通过读取存储器46，处理器44能够加载和执行计算机程序48。

因此，装置40包括：至少一个处理器44；以及包括计算机程序代码的至少一个存储器46，至少一个存储器46和计算机程序代码被配置为与至少一个处理器44一起使得装置40至少执行：通过利用不能由连接到用户设备的至少一个其他音频回放设备再现的至少一个空间特性来临时呈现音频内容而引起表明音频回放设备负责回放从该用户设备接收的该音频内容的用户可感知的指示。

计算机程序48可以经由任何合适的递送机构50到达装置40。递送机构50可以是例如机器可读介质、计算机可读介质、非瞬态计算机可读存储介质、计算机程序产品、存储器设备、诸如压缩盘只读存储器 (CD-ROM)或数字多功能盘(DVD)或固态存储器之类的记录介质、包括或有形地体现计算机程序48的制品。递送机构可以是被配置为可靠地传送计算机程序48的信号。装置40可以将计算机程序48作为计算机数据信号进行传播或传输。

用于使装置执行至少以下各项或用于执行至少以下各项的计算机程序指令：通过利用不能由连接到用户设备的至少一个其他音频回放设备再现的至少一个空间特性来临时呈现音频内容而引起表明音频回放设备负责回放从该用户设备接收的该音频内容的用户可感知的指示。

计算机程序指令可以被包括在计算机程序、非瞬态计算机可读介质、计算机程序产品、机器可读介质中。在一些但不一定是所有的示例中，计算机程序指令可以被分布在多于一个计算机程序上。

虽然存储器46被图示为单个组件/电路系统，但是它可以被实现为一个或多个分离的组件/电路系统，其中的一些或全部可以是集成的/可移除的和/或可以提供永久的/半永久的/动态的/高速缓存的存储。

虽然处理器44被图示为单个组件/电路系统，但是它可以被实现为一个或多个分离的组件/电路系统，其中的一些或全部可以是集成的/可移除的。处理器44可以是单核或多核处理器。

对“计算机可读存储介质”、“计算机程序产品”、“有形体现的计算机程序”等或“控制器”、“计算机”、“处理器”等的引用应被理解为不仅涵盖具有诸如单/多处理器架构和串行(von Neumann)/并行架构之类的不同架构的计算机，而且还涵盖诸如现场可编程门阵列(FPGA)、专用电路(ASIC)、信号处理设备和其他处理电路系统之类的专用电路。对计算机程序、指令、代码等的引用应被理解为涵盖用于可编程处理器的软件或固件，诸如例如硬件设备的可编程内容，无论是用于处理器的指令，还是用于固定功能设备、门阵列或可编程逻辑器件等的配置设置。

如本申请中所使用的，术语“电路系统”可以指的是以下中的一个或多个或全部：

(a)纯硬件电路实现(诸如仅在模拟和/或数字电路系统中的实现) 和

(b)硬件电路和软件的组合，诸如(如果适用的话)：

(i)(多个)模拟和/或数字硬件电路与软件/固件的组合，以及

(ii)具有软件的(多个)硬件处理器的任何部分((多个)包括数字信号处理器)、软件和(多个)存储器，它们一起工作以使诸如移动电话或服务器之类的装置执行各种功能，和

(c)需要软件(例如，固件)来运行的(多个)硬件电路和/或(多个)处理器，诸如(多个)微处理器或(多个)微处理器的一部分，但在不需要它时该软件可以不存在。

电路系统的这种定义适用于该术语在本申请中的所有使用，包括在任何权利要求中的所有使用。作为进一步的示例，如本申请中所使用的，术语电路系统还涵盖仅硬件电路或处理器及它(或它们)伴随软件和/ 或固件的实现。举例而言并且在适用于特定权利要求元素的情况下，术语电路系统还涵盖用于移动设备的基带集成电路或者服务器、蜂窝网络设备或其他计算或网络设备中的类似集成电路。

关于前述附图所图示和描述的框可以表示方法中的步骤和/或计算机程序48中的代码部分。对块的特定顺序的图示不一定暗示对于各块存在所需或优选的顺序，并且块的顺序和布置可以变化。此外，可以省略一些块。

在已经描述了结构特征的情况下，可以利用用于执行结构特征的一个或多个功能的部件来替换该结构特征，而无论该功能或这些功能是被明确地描述还是隐含地描述。

因此，在一些示例中，这种40包括部件，用于：通过利用不能由连接到用户设备的至少一个其他音频回放设备再现的至少一个空间特性来临时呈现音频内容而引起表明音频回放设备负责回放从用户设备接收的音频内容的用户可感知的指示。

在本文档中以包含性而非排他性的含义使用术语“包括”。也就是说，对包括Y的X的任何引用指示X可以仅包括一个Y或可以包括多于一个Y。如果旨在使用具有排他性含义的“包括”，则在上下文中通过提及“仅包括一个”或通过使用“组成”而将变得清楚。

在本说明书中，对各种实施例进行了参考。关于示例的特征或功能的描述指示那些特征或功能存在于该示例中。无论是否明确陈述，术语“示例”或“例如”或“能够”或“可以”在文中的使用标示这样的特征或功能存在于至少所描述的示例中，无论是否被描述为示例，并且它们可以但不一定存在于一些或所有其他示例中。因此，“示例”、“例如”、“能够”或“可以”是指一类示例中的特定实例。实例的属性可以是仅该实例的属性，或类的属性，或包括类中的一些但不是所有实例的类的子类的属性。因此，隐含公开了参考一个示例而非参考另一示例描述的特征可以在可能的情况下作为工作组合的一部分而被用于该另一示例中，但不一定必须被用于该另一示例中。

虽然在前面的段落中已经参考各种示例描述了示例，但是应当了解，在不脱离权利要求的范围的情况下，可以对给出的示例进行修改。

在前面的描述中描述的特征可以在除了上面明确描述的组合之外的组合中使用。

尽管已经参考某些特征描述了功能，但是无论是否描述，这些功能都可以由其他特征来执行。

尽管已经参考某些示例描述了特征，但是无论是否描述，这些特征也可以存在于其他示例中。

在本文中以包含性而非排他性的含义使用术语“一个”或“该”。也就是说，除非上下文明确指出相反情况，否则对包括一个Y的X的任何引用指示X可以仅包括一个Y或者可以包括多于一个Y。如果旨在使用具有排他性含义的“一个”或“该”，则将在上下文中使其变得清楚。在一些情况下，使用“至少一个”或“一个或多个”可以被用来强调包含性含义，但这些术语的缺失不应被理解为暗指任何排他性含义。

权利要求中的特征(或特征组合)的存在是对该特征或(特征组合) 本身以及实现基本相同技术效果的特征(等同特征)的引用。等效特征包括例如作为变型并且以基本上相同的方式实现基本上相同结果的特征。等同特征例如包括以基本上相同的方式执行基本上相同的功能以实现基本上相同的结果的特征。

在本说明书中，已经使用对示例的特性进行描述的形容词或形容词短语对各种示例进行参考。与示例相关的特性的这种描述指示该特性在一些示例中完全如所描述的那样存在，而在其他示例中基本上如所描述的那样存在。

尽管在前述说明书中努力引起对那些被认为是重要的特征的注意，但是应当理解，无论是否对其进行了强调，申请人都可以通过权利要求书来寻求对在上文中提及和/或在附图中示出的任何可专利特征或特征组合的保护。

Claims

1.一种装置，包括：

至少一个处理器；以及

至少一个存储器，所述至少一个存储器包括计算机程序代码，

所述至少一个存储器存储指令，所述指令在由所述至少一个处理器执行时使所述装置至少：

引起用户可感知的指示，所述指示用于指示音频回放设备负责回放从用户设备接收到的音频内容，所述指示包括利用由连接到所述用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时地呈现所述音频内容。

2.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括以下至少一项：

临时地调整所述音频内容的呈现，使得所述音频内容利用所述至少一个空间特性而被呈现，或

临时地修改所述音频内容，使得所述音频内容具有所述至少一个空间特性。

3.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容引起：相对于所述用户感知到源自与所述至少一个其他音频回放设备的一个或多个位置相对应的一个或多个方向的能量，增加用户感知到源自远离所述至少一个其他音频回放设备的至少一个方向的能量。

4.根据权利要求3所述的装置，其中远离所述至少一个其他音频回放设备的所述至少一个方向包括：不存在与所述至少一个其他音频回放设备相关联的真实声源、并且不存在与所述至少一个其他音频回放设备相关联的可能虚拟声源的方向。

5.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：引起所述音频内容的总能量的高于阈值的量被引导到远离所述至少一个其他音频回放设备的至少一个方向上。

6.根据权利要求5所述的装置，被配置为响应于将所述音频内容的总能量的高于阈值的量引导到两个或更多个连续方向，中止所述用户可感知的指示，所述两个或更多个连续方向中的至少一个方向是远离所述至少一个其他音频回放设备的至少一个方向。

7.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：将一个或多个音频对象重新定位到远离所述至少一个其他音频回放设备的至少一个方向上。

8.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：将所述音频内容的至少一个漫射分量转换为在远离所述至少一个其他音频回放设备的至少一个方向上的有向音频。

9.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：将在与另一音频回放设备的位置相对应的方向上的所述音频内容的至少一个有向分量转换成漫射音频。

10.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括以下至少一项：在与所述至少一个其他音频回放设备的位置相对应的方向上减少所述音频内容的至少一个有向分量的能量，或在远离所述至少一个其他音频回放设备的至少一个方向上增加所述音频内容的至少一个有向分量的所述能量。

11.根据权利要求1所述的装置，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：以单声道格式或立体声格式呈现空间音频分量。

12.根据权利要求1所述的装置，其中所述至少一个存储器和被存储在所述至少一个存储器中的所述指令被配置为与所述至少一个处理器一起使所述装置：

响应于以下至少一项而利用所述至少一个空间特性来临时地呈现所述音频内容：

-在连接到所述用户设备的音频回放设备之中改变负责所述音频内容的回放，或

-针对所述音频回放设备负责所述音频内容的回放的确认的请求。

13.根据权利要求1所述的装置，其中在相关联的元数据中被标记为不应被修改的分量的、所述音频内容的分量不被修改。

14.根据权利要求1所述的装置，其中用于指示音频回放设备负责回放从用户设备接收到的音频内容的、所述用户可感知的指示是在所述装置中被引起的。

15.根据权利要求1所述的装置，其中用于指示音频回放设备负责回放从用户设备接收到的音频内容的、所述用户可感知的指示是在另一装置中被引起的。

16.一种方法，包括：引起用户可感知的指示，所述指示用于指示音频回放设备负责回放从用户设备接收到的音频内容，所述指示包括利用由连接到所述用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时地呈现所述音频内容。

17.根据权利要求16所述的方法，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：引起所述音频内容的总能量的高于阈值的量被引导到远离所述至少一个其他音频回放设备的至少一个方向上；以及

其中所述方法还包括：响应于将所述音频内容的总能量的高于阈值的量引导到两个或更多个连续方向，中止所述用户可感知的指示，所述两个或更多个连续方向中的至少一个方向是远离所述至少一个其他音频回放设备的至少一个方向。

18.根据权利要求16所述的方法，还包括响应于以下至少一项而利用所述至少一个空间特性来临时地呈现所述音频内容：

19.根据权利要求16所述的方法，其中在相关联的元数据中被标记为不应被修改的分量的、所述音频内容的分量不被修改。

20.一种非瞬态计算机可读介质，包括存储在其上的程序指令，所述程序指令用于至少执行以下操作：引起用户可感知的指示，所述指示用于指示音频回放设备负责回放从用户设备接收到的音频内容，所述指示包括利用由连接到所述用户设备的至少一个其他音频回放设备无法再现的至少一个空间特性来临时地呈现所述音频内容。

21.根据权利要求20所述的非瞬态计算机可读介质，其中利用所述至少一个空间特性来临时地呈现所述音频内容包括：引起所述音频内容的总能量的高于阈值的量被引导到远离所述至少一个其他音频回放设备的至少一个方向上；以及

其中所述程序指令还被配置为：响应于将所述音频内容的总能量的高于阈值的量引导到两个或更多个连续方向，中止所述用户可感知的指示，所述两个或更多个连续方向中的至少一个方向是远离所述至少一个其他音频回放设备的至少一个方向。

22.根据权利要求20所述的非瞬态计算机可读介质，其中所述程序指令还被配置为使得响应于以下至少一项而利用所述至少一个空间特性来临时地呈现所述音频内容：