CN105850154A

CN105850154A - 基于检测到的环境声音来调整音频

Info

Publication number: CN105850154A
Application number: CN201480069916.0A
Authority: CN
Inventors: D·莫里斯; A·D·威尔逊; D·S·谭; Y·芮; N·拉古万施; J·M·温
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2013-12-20
Filing date: 2014-11-24
Publication date: 2016-08-10
Also published as: EP3085115A2; WO2015094590A3; US20150179181A1; EP3085115B1; WO2015094590A2

Abstract

描述了关于改善收听者的听觉体验的技术。基于由环境中的噪声源所生成的噪声来对音频进行修改。麦克风生成代表环境中的噪声的信号，并且对该信号进行处理以标识其中的峰值频率。当音频的音调频率接近于噪声中的峰值频率时，对音频进行修改以改善收听者的音频感知。

Description

基于检测到的环境声音来调整音频

背景技术

自从留声机问世以来，“奢侈消费”的消费者中花费在家用音频设备的这部分消费者已经极大地增加了。通常而言，消费者对沉浸在媒体中，特别是沉浸在音乐(包括在电影和游戏中出现的音乐)中的期望已经激励了致力于将更好的音频质量带到家中的技术方面的爆发。目前，一些零售商店致力于销售包括高带宽数字媒体播放器、经仔细校准的放大器、以及高端扬声器等的音频设备。

然而通常而言，传统的音频设备的设计者无法将环境对通过使用这样的设备而发出的音频信号的影响考虑在内。一些传统音频系统在初始的校准阶段期间将房间的大小和房间中物体的位置考虑在内。例如关于支持校准的音频系统，在校准阶段期间，麦克风被放置在收听者通常将会收听音频系统的输出的位置处。音频系统的扬声器接着发出包括在已知的频率设置上具有已知幅度的音频信号的校准信号，并且麦克风检测由扬声器所发出的信号(例如，在信号已经关于房间而发生了反射之后)。接着，基于所发出的校准信号中的已知的频率的已知的幅度与所检测到的校准信号(例如，由麦克风所捕获的校准信号)的已知频率的已知幅度的比较，音频系统的音频接收机设备对滤波器进行更新。例如，根据房间的布局，音频接收机设备可以基于音频系统所处的环境以及收听者在环境中通常的位置来标识待放大或待降低的频率。

然而应当确定的是，校准阶段的执行得出静态的过滤值；例如，不随着环境状态的变化而变化的值。此外，校准阶段是基于环境的回声特性的，但是没有将环境中的声源考虑在内。

发明内容

以下是在本文中更加详细地进行了描述的主题的简要概要。该发明内容不旨在关于权利要求的范围进行限制。

在本文中所描述的是关于改善经由音频设备而被呈现有音频的用户的主动收听体验的各种技术。在示例性实施例中，可以通过对发送至扬声器的音频信号执行非线性变换来改善用户的收听体验，其中，扬声器基于音频信号而发出音频。例如，这样的非线性变换可以是音频的频率从其音调中心(key center)转移相对小的量。更加具体地，可以接收待处理的音频描述符，并且可以针对与由音频文件所表示的音频的音高有关的元数据来分析音频描述符。音频描述符可以是音频文件、流音频的至少一部分、视频游戏音频的至少一部分、广播音频的至少一部分等。在示例中，歌曲的创造者和出版商可以使元数据被包括在音频描述符中，其中，音频描述符是歌曲的代表，并且元数据标识该歌曲的音调中心。在另一示例性实施例中，可以对音频描述符施加计算机可执行的算法，该算法可以基于由音频描述符表示的音频的第一多个帧中的频率来估计该音音频的音调中心。

麦克风捕获环境中的背景噪声，收听者在该环境中收听经由音频系统发出的音频。在收听者经常收听音频的房间、汽车、或其它环境中，背景噪声常常包括周期性分量。例如，诸如加热和制冷电器、洗碗机、烤箱等之类的许多家用电器都输出具有主导(dominant)频率的声学振动。同样地，当汽车移动时收听者可以辨别的道路噪声可以具有与其相关联的主导频率。可以针对这样的主导频率来分析由麦克风所捕获的背景噪声。例如，可以标识由麦克风所捕获的背景噪声的频谱中的至少一个(峰值)频率。当对应于待由音频系统输出的音频的音调的频率与背景噪声中经标识的峰值频率有一点相近时，背景噪声可能会负面地(从收听者的角度而言)影响由收听者所听到的音频(例如，歌曲)。

从而，当在所捕获的背景噪声中所标识的峰值频率与对应于歌曲的音调的频率之间的差的绝对值低于阈值数时，则可以对音频信号进行非线性变换(在被发送至音频系统的扬声器之前)。例如，非线性变换可以是音高的转移，例如，对音频信号进行处理以使得从扬声器中发出的结果音频已经被稍稍转移得偏调(off-key)，其中音频的音高与背景噪声中的峰值频率相一致。这样的一致改善了用户的主观收听体验。

在另一示例性实施例中，背景噪声源(例如，装置)可以利用通信技术来配置，以使得上述噪声源可以与对音频描述符进行处理的计算装置进行通信。额外地，这样的源的运行可以变化而不影响其预期的功能。根据示例，可以稍微改变加热或制冷系统的风扇的速度而不影响该加热或制冷系统的整体功能。类似于已经在上文中所描述的，当检测到由噪声源所发出的噪声中的峰值相对接近于与待由扬声器输出的音频的主音相对应的频率时，则可以改变噪声源的运行以使得由噪声源所生成的噪声的峰值频率大约等于与由扬声器所输出的音频的音调相关联的频率。此外，在示例性实施例中，可以改变噪声源的运行和将由扬声器播放的音频的音高两者，以改善收听者的主观收听体验。

在又一示例性实施例中，可以利用计算“智能”来配置背景噪声源，以使得噪声源可以彼此进行通信，并且基于关于它们所处的环境中的参数来修改它们自身的行为。例如，第一背景噪声源可以具有风扇，该风扇创造具有第一峰值频率的声学振动，而第二背景噪声源可以具有风扇，该风扇创造具有与第一峰值频率比较接近的第二峰值频率的声学振动。第一背景噪声源和第二背景噪声源可以彼此进行通信，并且标识第一峰值频率与第二峰值频率之间的差的绝对值低于阈值。响应于背景噪声源对这样的峰值频率方面的接近进行标识，噪声源中的一个或多个可以改变它们各自的行为，以使得声学振动中的峰值频率近似相等。使由这些背景噪声源所生成的声音中的峰值频率相一致可以当用户坐在房间中时给用户提供更加悦耳的音景。此外，噪声源可以包括足够的智能来监视时刻(例如，噪声源何时开始和何时停止)。此外，可以采用中央计算装置来控制这样的噪声源的时刻和运行。

以上的发明内容呈现了简化的概要以便提供对在本文中所讨论的系统和/或方法的一些方面的基本理解。该发明内容不是在本文中所讨论的系统和/或方法的详尽的概述。其不旨在标识系统和/或方法的关键/重要元素或者描绘这样的系统和/或方法的范围。其唯一的目的是以简化的形式呈现一些概念，以作为之后所呈现的更加详细的说明的前序。

附图说明

图1和图2示出了环境，其包括被配置为从收听者的角度来改善由音频系统的扬声器所输出的音频的质量的示例性信号处理装置。

图3示出了包括示例性背景噪声源的环境，其中，多个背景噪声源中的至少一个背景噪声源可以控制其运行以改善环境中的声音。

图4是流程图，其示出了用于对音频信号执行非线性变换以使得与结果音频的主音相对应的频率与背景噪声中的峰值频率相一致的示例性方法。

图5是流程图，其示出了用于基于关于待由扬声器系统播放的音频的音高相关的数据来对噪声发出设备进行控制的示例性方法。

图6是流程图，其示出了用于基于来自背景音源的、指示这样的音源的谱频率峰值的数据来改变装置的运行的示例性方法。

图7是示例性计算系统。

具体实施方式

现在参考附图来描述关于改善在包含背景噪声源的环境中的主观的收听者体验的各种技术，其中，通篇中相同的附图标记用于指代相同的元素。在以下的说明中，出于解释说明的目的，阐述了多种具体细节以便提供对一个或多个方面的透彻的理解。然而显然，可以在没有这些具体的细节的情况下而实践这样的方面。在其它实例中，以框图形式示出了公知的结构和设备以便于描述一个或多个方面。此外，应当理解的是，被描述为由单个系统组件所实行的功能可以由多个组件执行。类似地，例如，单个组件可以被配置为执行被描述为由多个组件实行的功能。

此外，术语“或”旨在表示包含性的“或”，而不是排除性的“或”。即，除非另外指定或者从上下文中清楚，否则短语“X采用A或B”旨在表示自然的包含性排列中的任何一个。即，以下实例中的任何一个都满足短语“X采用A或B”：X采用A；X采用B；或者X采用A和B两者。此外，除非另外指定或者从上下文中清楚以指向单数形式，否则如在该申请和所附权利要求书中所使用的冠词“一个”和“一”应该通常被解释为表示“一个或多个”。此外，如在本文中所使用的，术语“示例性的”旨在表示充当某事物的说明或示例，并且不旨在指示偏好。

此外，如在本文中所使用的，术语“组件”和“系统”旨在包含计算机可读数据存储，其被配置有当由处理器执行时使得某功能被执行的计算机可执行的指令。计算机可执行指令可以包括例程、函数等。术语“组件”和“系统”还旨在包含专用集成电路(ASIC)，其被配置为执行被描述为由组件或系统所执行的功能。还应当理解的是，组件或系统可以位于单个设备上或者跨多个设备分布。

现在参考图1，示出了在其中音频将被呈现给收听者102的环境100。环境100可以是建筑物、建筑物中的楼层、建筑物中的房间、汽车的内部、飞机的内部等。环境100包括背景噪声源104，该背景噪声源104可以输出从收听者102的角度而言可能会负面地影响收听者102希望听到的音频(音乐)的质量的声学振动(噪声)。例如，背景噪声源104可以是发出具有周期性分量的声学振动的噪声源。从而，背景噪声源104可以是包括风扇、电机等的装置，从而背景噪声源104在其运行期间发出频谱上的声学振动，并且这样的声学振动包括具有大于频谱中的其它频率的幅度的至少一个频率(例如，所述至少一个频率是峰值频率)。已知的用于发出这样的类型的声学振动的示例性装置包括：加热和制冷系统(其中，风扇以某频率旋转)、冰箱(其中，冰箱电机具有旋转件)、洗碗机、洗衣机、吊扇、落地扇、烘干机、垃圾处理器等。如果环境100是汽车或飞机，则背景噪声源104可以包括引擎、道路噪声、风噪声等。

环境100包括被配置为使得音频(包括音乐)被呈现给收听者102的信号处理装置106。在示例性实施例中，信号处理装置106可以是计算装置或者被包括在计算装置中，其中所述计算装置可以是(但不限于是)移动电话、媒体流设备、电视、台式计算设备、平板(平板电脑)计算设备、音频/视频接收机、机顶盒、视频游戏控制器等。在另一示例性实施例中，信号处理装置106可以是音频/视频接收机或者被包括在音频/视频接收机中。

扬声器108与信号处理装置106进行通信，并且信号处理装置106可以将信号(在本文中是指音频信号)发送至扬声器108。扬声器108基于音频信号而输出音频(例如，音频信号使得扬声器108输出被编码在音频信号中的音频)。扬声器108可以通过合适的有线连接而耦合至信号处理装置106，而音频信号可以从信号处理装置106中通过该有线连接被发送至扬声器108。在另一示例中，信号处理装置106和扬声器108可以通过无线连接进行通信，并且信号处理装置106可以通过无线连接将音频信号发送至扬声器108。无线连接可以符合任何合适的无线协议，包括蓝牙、Wi-Fi等。此外，尽管扬声器108被示出为在信号处理装置106外部，但应当理解的是，扬声器108可以与外壳中的信号处理装置106位于同一位置，使得单个处理装置106和扬声器108被包括在单个设备中。

在运行中，信号处理装置接收待由信号处理装置106处理的音频描述符110。音频描述符110可以是或者包括可以由信号处理装置106处理的任何合适的格式的音频文件，例如，WAV、MP3等。额外地，音频描述符110可以是流音频数据的至少一部分、广播音频信号的数字化表示、游戏音频数据的至少一部分等。在示例性实施例中，音频描述符110是音乐(例如，歌曲或其部分)的代表，其中，音乐具有包括一组频率的主音(例如，中心音调)。

如上文所述，由背景噪声源104发出的噪声(声学振动)可以与周期性相关联，以使得噪声的频谱具有与其相关联的一个或多个主导(峰值)频率。如果由背景噪声源104所发出的噪声的峰值频率相对接近于与由音频描述符110所表示的音乐的主音相对应的一组频率(音调频率)中的频率，则当扬声器108输出这样的音乐时，收听者102可能(不正确地)感知到该音乐中的不和谐。也就是说，由于环境100包括背景噪声源104，因此由扬声器108所输出的音频对环境100而言不是最佳的。

为了改善收听者102对关于由扬声器108所发出的音乐的质量的感知，信号处理装置106可以被配置为当来自背景噪声源104中的噪声的峰值频率与上文中所提及的与音乐的音调相对应的一组频率中的频率之间的差的绝对值低于阈值时，对待由扬声器108输出的音频执行非线性变换。

为了该目的，计算装置106可以包括接收机组件112，接收机组件112接收由音频描述符110所表示的音乐的有关音高的元数据。在示例性实施例中，音频描述符110可以包括这样的有关音高的元数据，并且接收机组件112可以从音频描述符110中提取有关音高的元数据。例如，有关音高的元数据可以标识由音频描述符110所表示的音乐的主音。

在另一示例中，音频描述符110可以包括或具有与其相关联的数据，该数据指示由其表示的音乐已经通过标准A440调音器进行了调音。当音频描述符110无法包括这样的元数据时，接收机组件112可以处理音频描述符110以对与由音频描述符110所表示的音乐相关的有关音高的数据进行标识。例如，信号处理装置106可以接收音频描述符110将被处理、并且由其表示的音乐最好由扬声器108输出的指示(例如，收听者102可以选择由用户观看的歌曲、电影、或者电视节目、指示歌曲即将到来等)。接收机组件112可以接收音频描述符110的多个顺序的数据分组(例如，开始的40个数据分组或帧)，并且可以在扬声器108输出音乐之前处理数据分组以对与其相关联的主音进行标识。

麦克风114与信号处理装置106进行通信，并且捕获环境100中的背景声音，包括从背景噪声源104所发出的噪声)。尽管麦克风114被示出为在信号处理装置106和扬声器108的外部，但应当理解的是，可以将麦克风114、信号处理装置106、和/或扬声器108封装在单个设备中。将由麦克风114所捕获的声音发送至处理装置106(例如，在被数字化并且可选地被过滤之后)。

数字处理装置106包括特性标识符组件116，其对由麦克风114所捕获的声音进行分析，并且特性标识符组件116对这样的声音中的至少一个特性进行标识。所述至少一个特性可以是由麦克风114所捕获的声音的频谱中的一个或多个峰值频率、由麦克风114所捕获的声音的频谱的边界、由麦克风114所捕获的声音的频率幅度的分布、频谱中的频率的均值或中值、或者声音的其它合适的特性。例如，特性标识符组件116可以结合对这样的峰值频率进行标识，而对由麦克风所捕获的声音执行快速傅里叶变换(FFT)。在示例性实施例中，麦克风114可以被配置为在阈值量的时间内捕获声音，并且这样的声音可以保留在缓冲器中。特性标识符组件116可以结合对由背景噪声源104所发出的噪声中的一个或多个峰值频率进行标识，而对缓冲器中的声音执行FFT。

信号处理装置106还包括音频调节器组件118，其可以在将音频信号发送至扬声器108之前对音频信号执行非线性变换，其中，这样的变换基于由接收机组件112所标识的有关音高的元数据以及由特性标识符组件116所标识的峰值频率。根据示例，音频调节器组件118可以将由音频描述符110所表示的音乐中的音调频率(音乐的音调的频率)与由特性标识符组件116所标识的峰值频率进行比较。当音乐的音调频率(其由接收机组件112所标识)与背景噪声的峰值频率(其由特性标识符组件118所标识)之间的差的绝对值低于阈值时，音频调节器组件118可以计算分数，该分数指示如果被稍微转移(shift)得偏调(例如，使得被标识为接近于峰值频率的音乐的音调频率被转移成大约等于峰值频率)，音乐将听起来多好(或多差)。这样的分数可以基于谐和音与不谐和音的标准测量，其中，同音(unison)(频谱一致)是完美的和谐，音乐上的第五音和第三音是“和谐地动听”的，音乐上的降第五音较不动听，而将完全不同的调式(tonality)混合在一起是最差的情况。音频调节器组件118可以包括基于这样的原理的任何合适的评分功能。

当音频调节器组件118(基于由其所计算的分数)确认音乐的音高的转移将使得音乐对在环境100中的收听者102而言听起来更好时，音频调节器组件118针对音乐片段的整体而转移音乐的音高。因此，在将音频信号发送至扬声器108之前，音频调节器组件118对音频信号执行非线性变换，从而转移了音乐的音高。接着，由扬声器108所输出的音乐是稍微偏调的；然而例如，由于音乐的主音被转移为等于环境100中的背景噪声的峰值频率，因此相比于音乐以其原来的、期望的音调被输出，从收听者102的角度而言音乐可以听起来更好地“偏调”。在由于音乐的音高转移而产生的人工迹象(artifacts)方面，由扬声器108所输出的音乐的转移可能是有代价的。然而应当理解的是，由收听者102感受到的人工迹象(artifacts)已经以由背景噪声源104所生成的背景噪声的形式而在环境100中存在。从而，如果在环境交互方面的主观的改善超过在音频复制等级的边缘人工迹象，则获得积极的净效应。

此外，已经在本文中描述了音频调节器118可以转移由音频描述符110所表示的音乐片段的整体。当呈现非音乐音频或者甚至当音轨包括大量的非周期性声音(例如打击乐器)时，这可能会增加人工迹象(其可以被感受为容许的范围的缩小或者改变惩罚曲线(penalty curve)以进一步赞成较小的转移)。信号处理装置106还可以被配置为与分离的音频流(例如，在电影或电视中，能够进行音高转移的一个声音流(例如，背景音乐)、以及没不能够进行音高转移的另一声音流(例如，说出的话))进行交互。这可以例如关于视频游戏音频而容易地进行，在视频游戏音频中，声音效果是与背景音乐是独立地生成的。

如上文所述，可以针对特定的音乐片段而对音频调节器组件118进行单次执行，以使得整个音乐片段的音高被转移。从而，在已经由信号处理装置处理并且由扬声器108输出了一个音乐片段之后，音频调节器118可以针对待由扬声器108输出的下一个音乐片段来确定是否要调节这样的音乐片段的音高，以使得歌曲的主音更好地与由背景噪声源104所生成的声学噪声的相对大幅度的周期性分量一致。在另一实施例中，当音频描述符110对应于视频游戏时，紧接在扬声器108输出噪声之前，音频调节组件118可以确定是否要转移视频游戏中的特定的噪声或效果的音高。此外，麦克风114可以被配置为在由扬声器108对音乐片段进行输出之间对环境100中的声音进行采样。因此，麦克风114可以被配置为当在环境100中存在相对小的噪声时(例如，当扬声器108不输出声音时)，自动地捕获背景环境100中的声音。在另一示例中，麦克风114可以被配置为持续地对音频进行采样，并且特性标识符组件116可以采用滤波器来标识背景声音中的峰值频率。

在另一示例性实施例中，信号处理装置106可以被配置为基于由特性标识符组件116所检测到的背景噪声的至少一个特性来构建通常对收听者102而言悦耳的音频。在示例性实施例中，麦克风114捕获从背景噪声源104中所发出的噪声，并且特性标识符组件116对其中的至少一个峰值频率进行标识。在这样的示例性实施例中，音频调节器组件118可以被配置为构建音频信号，以使得由扬声器108基于该音频信号所输出的音频对收听者102而言是主观上悦耳的。在示例中，音频调节器组件118可以构建声调(tone)或和弦的序列，其中序列中的每个声调或和弦都与背景噪声中的至少一个峰值频率相和谐。

在另一示例性实施例中，音频调节器组件可以基于由特性标识符组件116所检测到的背景噪声的至少一个特性而从音乐库中选择音乐。在示例中，所述噪声的至少一个特性可以是峰值频率，音频调节器组件118可以基于背景噪声中的峰值频率而从音乐片段库中选择音乐片段。所选择的音乐片段可以在与背景噪声中的峰值频率相和谐的音调中。在另一示例中，所选择的音乐片段可以在这样的音调中：其合适地足够远离背景噪声中的峰值频率以能够避免收听者106感受到音乐片段中的不和谐。

此外，这些示例还很好地适用于基于背景噪声的节奏来构建或选择音频。例如，背景噪声的至少一个特性可以是足够大声以能够由收听者102感受到的风扇、电机等的周期性的“咔嗒声”或“噼啪声”。音频调节器组件118可以接收风扇的“咔嗒声”或“噼啪声”(或者其它有节奏的声音)的时刻信息，并且根据至少一个特性来构建或选择音频。例如，音频调节器组件118可以选择具有与由背景噪声源104所生成的背景噪声中的节奏相对应的节奏的音乐片段。同样，音频调节器组件118可以构建音频以创作例如打击乐类型的音乐片段，其中，背景噪声源104生成音乐片段的一部分。

现在参考图2，示出了另一示例性环境200。示例性环境200包括多个“智能”背景噪声源202-204，其中任何一个都可以发出可能负面地影响收听者102所听到的音乐的噪声(从收听者102的角度而言)。因此，如关于背景噪声源104(图1)所描述的，背景噪声源202-204可以包括装置、加热和制冷系统等。背景噪声源202-204中的每个背景噪声源都可以包括例如相应的无线收发机，其可以从信号处理装置106中接收通信并且向信号处理装置106发送通信。从而，作为内置功能或者二级市场附加功能，背景噪声源202-204中的每个背景噪声源都可以包括相应的电路，该电路可以响应于从信号处理装置106中接收到信号而对相应的背景噪声源的运行进行控制。此外，背景噪声源202-204可以被配置为向信号处理装置106输出指示背景噪声源202-204的相应的运行参数的相应的信号。例如，操作参数可以是旋转件的角速度、旋转件关于轴旋转的频率等。

信号处理装置106可以包括通信组件206，其被配置为执行通信协议以使得计算装置106可以与背景噪声源202-204进行通信。例如，通信组件206可以有助于信号处理装置106与背景噪声源202-204之间通过蓝牙、Wi-Fi等的无线通信。

在示例性实施例中，当背景噪声源的机械元件运行时，背景噪声源202-204中的至少一个背景噪声源可以发布指示该机械元件的运行的机械频率的数据。从而例如，第一背景噪声源202可以是加热和制冷系统，并且可以发布(例如，输出包括数据的信号)当风扇由电机驱动时，风扇以第一频率旋转。接收机组件112可以从第一背景噪声源202中接收这样的所发布的数据。额外地，接收机组件112可以从环境100中的其它背景噪声源中接收类似的数据。此外，如在上文中所描述的，接收机组件112可以接收指示由音频描述符110所表示的音乐的主音的数据，其中，所述音乐待由扬声器108输出以供收听者102欣赏。

音频调节器组件118可以接着例如，通过调节音乐的音高以使音乐的音调频率与第一噪声源202的机械元件的频率相一致(或者，通过基于由噪声源202-204所阐述的信息来构建或选择将对收听者102而言悦耳的音频)，来如在上文中所描述的那样工作。因此，音频调节器组件118可以将由背景噪声源202-204所发布并且由接收机组件112所接收的数据与由音频描述符110所表示的音乐的音调频率进行比较，并且可以基于这样的比较来转移音乐的音高。此外，当不是环境100中的所有的背景噪声源都能够监视并且发布它们的运行数据或者补充所发布的数据时，麦克风114可以被配置为捕获环境200中的声音。如在上文中所描述的，音频调节器组件118可以标识所捕获的声音中的峰值频率，并且这样的峰值频率可以结合对音频信号的非线性变换而使用以作为对所发布的信号和/或在缺少所发布的信号时的补充。

在另一示例性实施例中，背景噪声源202-204中的一个或多个可以被配置为输出指示噪声发出机械元件中的相应的开和关的时间的信号。例如，第N背景噪声源204可以是包括压缩机的冰箱，其中，当运行时，该压缩机使得发出具有特定的峰值频率的噪声。冰箱可以向信号处理装置106发送指示压缩机何时打开或关闭的信号，并且音频调节器组件118可以基于这样的信息来确定是否要转移由音频描述符110所表示的音频的音高。例如，当冰箱的压缩机当前正在运行，但输出压缩机将在相对短的时间段内被关闭的指示时，由于冰箱将在在相对短的时间段内停止发出噪声，因此音频调节器组件118阻止对由音频描述符110所表示的音频的音高的转移。相反，当冰箱输出指示压缩机最近被激活并且在相对长的时间段内(例如，直到音乐片段中的大部分已经被播放了为止)没有计划要关闭的信号时，音频调节器组件118可以当在确定是否要对音频信号执行非线性变换(例如，转移音乐的音高)时，考虑这样的信息。

此外，可以确定，对于许多机械系统而言，以非常精确的机械频率运行对机械系统的运行不重要。例如，假如加热和制冷系统具有以61Hz旋转的风扇，如果改变风扇的运行以使得风扇以60Hz旋转，则加热和制冷系统的运行被最低程度地影响。为了该目的，可替代地或另外地对音频信号执行非线性变换，信号处理装置106可以被配置为将控制信号发送至背景噪声源202-204中的至少一个背景噪声源以改变其运行，由此改善了当收听由扬声器108所输出的音乐时的收听者102的主观体验。

在示例中，信号处理装置106可以包括设备控制器组件208，其可以将控制信号发送至背景噪声源202-204中的至少一个背景噪声源，以使得这样的背景噪声源改变其运行，从而机械频率更好地与由音频描述符110所表示的音乐的音调频率(例如，主音)一致。在另一示例中，设备控制器组件208可以将控制信号发送至至少一个噪声源以使得该至少一个背景噪声源以一定节奏发出声音。因此再一次，另外地或可替代地对音频信号执行非线性变换，信号处理装置106可以改变由至少一个背景噪声源所发出的噪声的峰值频率和/或由至少一个背景噪声源所输出的一定的声音的频率。这样的背景噪声源可以包括允许其基于从信号处理装置106中所接收到的控制信号而改变机械频率的机械元件。因此，例如，第N背景噪声源204可以包括断路器(break)或者可以用于减慢或加快背景噪声源204中的机械元件的旋转的其它合适的致动器。

此外，设备控制器组件208可以根据背景噪声源将要打开或关闭的时间而发送控制信号。在示例性实施例中，设备控制器组件208可以接收歌曲何时将要结束的指示，并且可以将控制信号发送至背景噪声源以引导背景噪声源避免打开或关闭直到歌曲结束为止(或者收听者102引导信号处理装置106停止播放该歌曲)。

根据示例，第一背景噪声源202可以是加热和制冷系统，并且其中的收发机可以将指示加热和制冷系统的风扇被安排以在一分钟之后启动的信号发送至信号处理装置106。然而，通过音频描述符110的分析可以确定，关于这样的音频描述符110的音频(不一定是音乐)将在两分钟后结束。从而，响应于从加热和制冷系统中接收到信号，设备控制器组件208可以生成被配置为使得第一背景噪声源202延迟打开其风扇的控制信号，并且通信组件206可以将控制信号发送至第一背景噪声源202。当已经完成从扬声器108中输出音频时，设备控制器组件208可以使得通信组件206向加热和制冷系统发送控制信号，以使得加热和制冷系统启动风扇。

当由音频描述符110所表示的音频的音量低时，对如在上文中所描述的背景噪声源202-204的运行的控制也可以是有益的(例如，在音频的创造者的指导下)。例如，在电影中或者电视节目的场景中，第一角色可以正在对第二角色耳语。在这样的场景期间，第一角色的说话的音量(有意的)将相对于其他场景中的音量较低。接收机组件112可以分析音频描述符110中的音频签名或者元数据，以当音量将相对低时对由音频描述符110所表示的音频中的时间进行标识。设备控制器组件208可以基于这样的所标识的时间来控制背景噪声源，以使得当音频描述符110中的低音量时段由扬声器输出时，噪声源202-204被安排为空闲。

因此，在示例中，设备控制器组件208可以使得运行中的背景噪声源紧接在“低音量”时段之前停止其运行，或者紧接在这样的“低音量”时段开始之后停止其运行。在另一示例中，设备控制器组件208可以阻止背景噪声源在“低音量”音频部分期间开始运行(例如，阻止制冰机打开)。因此，收听者102能够听到第一角色的耳语的话语。可替代地，当信号处理装置106被通知或检测到背景噪声源的运行时，信号处理装置106可以使得说话的音量自动增加。再一次，这可以改善当在环境100中收听由音频描述符110所表示的音频时的收听者102的体验。

现在参考图3，示出了另一示例性环境300。环境300包括背景噪声源202-204。在示例性实施例中，背景噪声源202-204被配置为彼此进行通信，并且可以基于这样的通信来控制它们各自的运行。例如，背景噪声源202-204中的这样的背景噪声源可以被配置为执行通信协议并通过相应的收发机来发送和接收数据，并且背景噪声源202-204可以使用收发机和协议而彼此进行通信。背景噪声源202-204中的背景噪声源可以被配置为发布待由背景噪声源202-204中的所有其它背景噪声源接收的数据。此外，背景噪声源202-204中的背景噪声源可以将通信引导至背景噪声源202-204中的特定的其它背景噪声源。

为了该目的，第一背景噪声源202可以包括第一通信器组件302而第N背景噪声源204可以包括第N通信器组件304。在示例中，第一通信器组件302可以发布标识第一噪声源202的机械元件306的运行频率的信号。第N通信器组件可以接收这样的信号，并且可以可选地发布标识第N噪声源204的机械元件308的频率的数据。

额外地，第一背景噪声源202可以包括第一控制组件310，其可以基于从第N背景噪声源204中所接收到的信号来控制第一机械元件306的运行。例如，第一控制组件310可以减慢或加快第一机械元件306的运行，以使得环境100中的收听者102具有主观上更好的(更加悦耳的)音频体验。关于示例，控制组件310可以控制第一机械元件306以基于由第N背景噪声源204所发布的信号来改变第一机械元件306的机械频率。例如，控制组件310可以使得第一机械元件306的机械频率大体上等于第N背景噪声源204的第N机械元件308的机械频率(或者以其它方式与第N机械元件308的机械频率相一致)。类似地，第N背景噪声源204可以包括第N控制组件312，其基于由第一背景噪声源202所发布的信号来控制第N背景噪声源204的第N机械元件308的运行。再一次，第N控制组件312可以使得第N机械元件308的机械频率进行改变，以使得该频率更好地与第一背景噪声源202中的第一机械元件306的机械频率相一致。这可以向收听者102提供声音上更加悦耳的环境。

另外，背景噪声源202-204中的背景噪声源可以被配置为基于由背景噪声源202-204中的其它背景噪声源所输出的信号来控制其操作的时序。在示例性实施例中，第一背景噪声源202可以是加热和制冷系统，而第N背景噪声源204可以是冰箱。第一背景噪声源202的第一通信器组件302可以对指示加热和制冷系统的风扇在特定的时间被打开的信号进行输出。第N背景噪声源204的第N通信器组件304可以接收这样的信号，并且可以控制第N机械元件308(例如，压缩机风扇)的运行，以使得加热和制冷风扇和压缩机风扇同时(并且可选地，以经控制的频率)运行。由于收听者102可以体验其中不生成来自背景噪声源的噪声的更长的时间段，因此该类型的同步可以为收听者102提供更加悦耳的声学环境。

额外地，尽管没有被示出，但是第一背景噪声源202或者第N背景噪声源204中的一个或多个可以包括或者关联于对环境300中的背景噪声进行捕获的麦克风。第一控制组件310和/或第N控制组件312可以基于环境300中的声学振动的频率来控制相应的背景噪声源202和204的运行，从而向收听者102提供更加和谐的环境。

图4-6示出了关于改善音频的收听者的收听体验的示例性方法。尽管所述方法被示出并被描述为按顺序执行的一系列的动作，但应当理解的是，所述方法不由顺序的次序来限制。例如，一些动作可以以不同于在本文中所描述的次序而发生。另外，动作可以与另一动作同时发生。此外，在一些实例中，不要求所有的动作都实现在本文中所描述的方法。

此外，在本文中所描述的方法可以是计算机可执行的指令，所述计算机可执行指令可以由一个或多个处理器来实现和/或被存储在计算机可读介质或多个介质上。计算机可执行指令可以包括例程、子例程、程序、执行的线程等。此外，可以将方法中的动作的结果存储在计算机可读存储介质中、显示在显示器设备上等。

现在参考图4，示出了有助于改善音频的收听者的主观收听体验的示例性方法400。方法400在402处开始，并且在404处接收到音频描述符。音频描述符是待由扬声器输出的音乐(例如，歌曲)的代表。从而，例如，信号处理装置可以对音频描述符进行处理以生成音频信号。当被发送至扬声器时，音频信号可以使得扬声器输出由音频信号(和音频描述符)所编码的音频。

在406处，确定了指示由音频描述符所表示的音乐的特性的数据。例如，数据可以指示音乐的主音、音乐中的一组音调频率、音乐的频谱的边界等。数据可以作为元数据被包括在音频描述符中。在另一示例中，可以处理音频描述符的多个数据分组以确定指示由音频描述符所表示的音乐的特性的数据。

在408处，接收到指示背景噪声的特性的数据，其中，已经在上文中阐述了这样的特性的示例。麦克风可以被配置为捕获环境中的噪声，并且可以对由麦克风所生成的结果噪声信号进行分析以标识例如其中的至少一个峰值频率。

在410处，在将声学信号发送至扬声器之前对音频信号执行非线性变换，其中非线性变换基于指示音乐的特性的数据(在406处所接收的)以及指示背景噪声的特性的数据。这样的非线性变换可以在音乐的音高方面进行转移，以使得经转移的音频的主音大体上等于所标识的峰值频率。将经修改的声学信号发送至扬声器，并且扬声器基于经修改的声学信号来输出音频。方法400在412处完成。

现在参考图5，示出了有助于控制环境中的背景噪声源的运行的示例性方法500。方法500在502处开始，并且在504处接收到音频描述符，其中，音频描述符表示待由扬声器输出的音频。例如，音频可以是音乐片段、电影的音频(音乐)部分、在玩游戏期间由视频游戏控制器所发出的可听到的声音等。在506处，确定关于音频的有关音高的数据。在508处，接收到指示由背景噪声源所输出的背景噪声中的峰值频率的数据。例如，可以通过麦克风来接收这样的数据或者从背景噪声源本身中发送这样的数据。在508处所接收到的数据还可以指示背景噪声源中的机械元件(例如，风扇、电机等)的频率(当运行时)。

在510处，基于在506处所确定的有关音高的数据以及在508处所接收到的指示背景噪声中的峰值频率的数据，将控制信号发送至背景噪声源。例如，控制信号可以使得背景噪声源中的机械元件增加或降低角速度或线速度，例如，增加或降低风扇的角速度。这可以进行以使得机械元件的运行的频率对应于音频的音调的频率。方法500在512处结束。

现在参考图6，示出了有助于改善如由收听者感知到的环境的声音的示例性方法600。方法600可以例如在诸如冰箱、加热和制冷系统、洗碗机、洗衣机等之类的装置中执行。方法600在602处开始，并且在604处，从背景噪声源中接收到数据，其中，这样的数据指示从背景噪声源中所发出的声学振动的周期性分量。在606处，基于在604处所接收到的数据来修改执行方法600的背景噪声源的运行。例如，可以修改风扇速度、电机速度等以使得执行方法600的背景噪声源的机械元件的运动的频率大体上等于(或者和谐地对应于)由从中接收到数据的背景噪声源所发出的声学振动的频率。方法600在608处完成。

现在参考图7，示出了可以根据在本文中所公开的系统和方法而使用的示例性计算设备700的高级说明。例如，可以在可以基于环境中的背景噪声来修改音乐的音高的系统中使用计算设备700。作为另一示例，可以在支持基于待由音频系统输出的音频来修改装置的运行的系统中使用计算设备700。计算设备700包括执行被存储在存储器704中的指令的至少一个处理器702。指令可以是例如用于实现被描述为由在上文中所讨论的一个或多个组件所实行的功能的指令，或者是用于实现在上文中所描述的方法中的一个或多个的指令。处理器702可以通过系统总线706访问存储器704。除了存储可执行指令之外，存储器704还可以存储音乐、装置的操作参数等。

计算设备700额外包括可以由处理器702通过系统总线706进行访问的数据存储708。数据存储708可以包括可执行指令、有关音高的元数据、音乐等。计算设备700还包括允许外部设备与计算设备700进行通信的输入接口710。例如，输入接口710可以用于从外部计算机设备中、从用户处等接收指令。计算设备700还包括将计算设备700与一个或多个外部设备接合的输出接口712。例如，计算设备700可以通过输出接口712来显示文本、图像等。

可以构想的是，环境中可以包括经由输入接口710和输出接口712与计算设备700进行通信的外部设备，该环境提供了用户可以与其进行交互的大体上任何类型的用户界面。用户界面类型的示例包括图形用户界面自然用户界面等。例如，图形用户界面可以从采用输入设备(例如，键盘、鼠标、遥控器灯)的用户处接受输入，并且在输出设备(例如，显示器)上提供输出。此外，自然用户界面可以使用户能够与计算设备700以免于由输入设备(例如，键盘、鼠标、遥控器等)所施加的限制的方式进行交互。相反，自然用户界面可以依赖于话音识别、触摸和触摸笔识别、屏幕上的和邻近屏幕的手势识别、空中手势、头部和眼部追踪、语音和话音、视觉、触摸、手势、机器智能等。

额外地，尽管被示出为单个系统，但应当理解的是计算设备700可以是分布式系统。因此，例如，几个设备可以通过网络连接进行通信，并且可以共同地执行被描述为由计算设备700所执行的任务。

在本文中所描述的各种功能可以以硬件、软件、或任何其组合实现。如果以软件实现，则功能可以作为一个或多个指令或者代码被存储在计算机可读介质上或者通过计算机可读介质传输。计算机可读介质包括计算机可读存储介质。计算机可读存储介质可以是可以由计算机访问的任何可用的存储介质。作为示例而非限制，这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM、或者其它光盘存储、磁盘存储或其它磁存储设备、或者可以用于携带或存储以指令或数据结构的形式的并且可以由计算机访问的期望的程序代码的任何其它介质。如在本文中所使用的，盘和碟包括压缩碟(CD)、激光碟、光碟、数字通用碟(DVD)、软盘、以及蓝光碟(BD)，其中盘通常磁性地再现数据，而碟通常利用激光来光学地再现数据。此外，经传播的信号不被包括在计算机可读存储介质的范围内。计算机可读介质还包括通信介质，其包括有助于将计算机程序从一个地方传输到另一个地方的任何介质。连接可以例如是通信介质。例如，如果使用同轴电缆、光纤电缆、双绞线、数字订阅者线(DSL)、或者诸如红外、无线电、以及微波之类的无线技术将软件从网站、服务器、或者其它远程源中进行发送，则同轴电缆、光纤电缆、双绞线、数字订阅者线(DSL)、或者诸如红外、无线电、以及微波之类的无线技术被包括在通信介质的定义中。以上的组合也应该被包括在计算机可读介质的范围内。

可替代地或者另外，在本文中所描述的功能可以至少部分地由一个或多个硬件逻辑组件执行。例如而没有限制，可以被使用的硬件逻辑组件的说明性类型包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SoC)系统、复杂可编程逻辑设备(CPLD)等。

上文已经描述的内容包括一个或多个实施例的示例。当然，为了描述上文提到的方面的目的，不可能描述以上的设备或方法的每个能想到的修改和替代物，但是本领域技术人员可以想到，对各种方面的许多进一步的修改和排列是可能的。从而，所描述的方面旨在包含落在所附权利要求的精神和范围内的所有这样的替代物、修改、和变型。此外，就在具体实施方式或权利要求中所使用的术语“包括”的方面而言，这样的术语旨在以类似于术语“包含”的方式而是包含性的，如当作为权利要求中的转换词而被采用时所解释的“包含”那样。

Claims

1.一种方法，包括：

接收音频描述符，所述音频描述符代表在收听环境中的待从扬声器中发出的音频；

接收标识所述音频的特性的数据；

接收标识由所述环境中的噪声源所生成的噪声的特性的数据，所述噪声源不是所述扬声器；

处理所述音频描述符以生成对所述音频进行编码的音频信号，所述扬声器被配置为响应于接收到所述音频信号而输出所述音频；

基于标识所述音频的所述特性的数据以及标识由所述噪声源所生成的所述噪声中的所述特性的所述数据来对所述音频信号进行修改；以及

响应于对所述音频信号进行修改，将所述音频信号发送至所述扬声器。

2.根据权利要求1所述的方法，其中，对所述音频信号进行修改包括对所述音频信号执行非线性变换。

3.根据权利要求1所述的方法，其中，所述音频是待由所述扬声器输出的音乐。

4.根据权利要求3所述的方法，其中，所述音乐的所述特性是所述音乐的主音。

5.根据权利要求4所述的方法，其中，对所述音频信号进行修改包括改变所述音乐的所述主音。

6.根据权利要求3所述的方法，其中，所述噪声的所述特性包括由所述噪声源所发出的所述噪声的频谱中的峰值频率。

7.根据权利要求1所述的方法，还包括：

从所述音频文件中提取元数据，所述元数据标识所述音频的所述特性。

8.根据权利要求1所述的方法，还包括：

接收由被放置在所述环境中的麦克风所输出的信号，所述信号对由所述噪声源所生成的所述噪声进行编码；以及

处理由所述麦克风输出的所述信号以标识所述噪声的所述特性。

9.根据权利要求1所述的方法，其中，所述音频的所述特性是所述音频的音调，所述音频的所述音调对应于多个频率，所述噪声的所述特性是所述噪声中的峰值频率，所述方法还包括：

计算所述噪声中的所述峰值频率与所述多个频率中的频率之间的差；

将所述差的绝对值与预先定义的阈值进行比较；以及

仅仅当所述差的所述绝对值低于所述预先定义的阈值时，修改所述音频信号。

10.一种被配置为使得扬声器在收听环境中发出音频的信号处理装置，所述信号处理装置包括：

接收机组件，其接收待由所述扬声器所发出的所述音频的特性；

特性标识符组件，其标识由噪声源所生成的噪声中的频率，所述噪声在所述收听环境中是可听见的；以及

音频调节器组件，其在所述音频由所述扬声器发出之前基于由所述接收机组件所接收到的所述音频的所述特性和由所述特性标识符组件所标识的所述噪声中的所述频率而修改所述音频。

11.根据权利要求10所述的信号处理装置，所述音频是音乐片段，并且所述音频的所述特性是所述音乐片段的音调。

12.根据权利要求11所述的信号处理装置，所述音频调节器组件基于所述音乐片段的所述音调与由所述特性标识符组件所标识的所述噪声中的所述频率而修改所述音乐片段的所述音调。

13.根据权利要求10所述的信号处理装置，其中，所述接收机组件接收代表所述音频的音频文件，所述音频文件包括标识所述音频的所述特性的元数据。

14.根据权利要求10所述的信号处理装置，其中所述音频调节器组件基于由所述接收机组件所接收到的所述音频的所述特性以及由所述特性标识符组件所标识的所述噪声中的所述频率而对所述音频执行非线性变换。

15.一种音频系统，包括：

信号处理装置，其对代表待通过音频系统输出的音频的音频文件进行接收，所述信号处理装置被配置为基于所述音频文件而生成音频信号；

扬声器，其与所述信号处理装置进行通信，所述扬声器被配置为响应于接收到所述音频信号而输出所述音频；

麦克风，其与所述信号处理装置进行通信，所述麦克风被配置为对指示由噪声源所生成的噪声的噪声信号进行输出，其中，

所述信号处理装置被配置为标识所述音频的主音、标识由所述噪声源所生成的所述噪声的频谱中的峰值频率、并且基于所述音频的所述主音以及所述频谱中的所述峰值频率而生成所述音频信号。