CN111415673A

CN111415673A - 基于用户特定和硬件特定音频信息的定制的音频处理

Info

Publication number: CN111415673A
Application number: CN202010004297.4A
Authority: CN
Inventors: D.T.派伊; S.E.奥利芙; T.S.韦尔蒂; O.康萨里鲍尔; K.G.斯里尼迪; C.路德维格; M.克纳普
Original assignee: Harman International Industries Inc
Current assignee: Harman International Industries Inc
Priority date: 2019-01-04
Filing date: 2020-01-03
Publication date: 2020-07-14
Also published as: EP3678388A1; JP7481116B2; US20200221240A1; US11134353B2; JP2020109968A; KR20200085226A

Abstract

一种音频信号处理的方法，所述方法包括：访问特定用户的用户特定音频处理信息；确定用于从音频信号产生声音输出的音频装置的身份信息；基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

Description

基于用户特定和硬件特定音频信息的定制的音频处理

相关申请的交叉引用

本申请要求2019年1月4日提交的美国临时申请号62/788,677 的优先权权益。该相关申请的主题在此以引用的方式全文并入。

技术领域

本公开的实施方案总体上涉及音频装置，并且更具体地，涉及基于用户特定和软件特定音频信息的定制的音频处理。

背景技术

相关技术的描述在音频娱乐领域中，听众的音频体验可以受到当前音频环境(例如，房间、车辆、一副耳机等等)的各种方面影响。例如，低音和高音水平的设置、扬声器之间的音量平衡以及音频环境的其他特征可以降低或增强听众的音频体验，具体取决于此类特征是否符合听众的个人音频偏好。因此，当音频环境与听众的个人音频偏好冲突(例如，低音太多)时，听众可能具有较差的音频体验，即使在播放喜爱的音频选择也是如此。

诸如汽车音频系统、无线耳机、家庭娱乐系统等等的离散音频产品的定制使得音频环境能够符合听众对该音频环境的个人音频偏好。例如，特定房间中的声音系统的性能可以经由房间均衡进行优化，房间均衡可以校正由在房间本身内产生的音频的相互作用引起的问题和/或另外考虑到听众的音频偏好。在另一个示例中，听众可以设置车辆中的音频系统中的均衡、音量和其他设置，使得最终的音频环境针对该车辆中的听众优化。因此，该特定的听众具有适合该听众的个人音频偏好和音频环境的声学特性的最佳车舱内收听体验。

音频环境定制的一个缺点在于，此定制通常不适合当前的听众，而是与上一个听众定制的特定音频环境相关联。因此，当新的听众进入房间或使用具有已经被前一听众定制的音频环境的车辆时，默认实现前一听众设置的定制。因此，每当不同的听众进入优化的音频环境时，必须重复定制过程，这对新听众来说可能是耗时且令人沮丧的。此外，每次用户进入优化的音频环境时，要获得某些个人音频偏好可能是不切实际或不可能的。例如，在音频环境中可以采用增益调整以补偿特定听众的听力缺陷简档，但每次听众重新定制音频环境时执行听力测试至多是不切实际的。因此，这样的增益调整通常无法在与其他听众共享的音频环境中实现，也无法方便地应用于另一个音频环境。

鉴于上述情况，用于在音频环境中实现定制的音频处理的更有效技术将是有用的。

发明内容

各种实施方案阐述了一种用于音频信号处理的方法，所述方法包括：访问特定用户的用户特定音频处理信息；确定用于从音频信号产生声音输出的音频装置的身份信息；基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

所公开的技术相对于现有技术的至少一个技术优点在于，所公开的技术为听众实现个性化音频体验，而不管当前音频环境如何。具体地，听众的个人偏好和/或听力缺陷简档可以自动地应用于任何音频环境，同时还考虑到音频环境的音频特性，而听众无需在每个音频环境中重新定制音频系统。另一个优点在于，可以在音频环境中实现个性化音频体验，该音频环境包括执行一些或全部的音频信号处理以产生个性化音频体验的智能音频装置或者不执行音频信号处理的“哑” 音频装置。这些技术优点呈现优于现有技术方法的一个或多个技术改进。

附图说明

为了可以详细地理解一个或多个实施方案的上述特征，可以参考某些特定实施方案来获得以上简要概述的一个或多个实施方案的更具体描述，其中一些特定实施方案在附图中示出。然而，应注意，附图仅示出典型实施方案，并且因此不应被视为以任何方式限制其范围，因为各种实施方案的范围也包括其他实施方案。

图1是示出被配置为实现本公开的一个或多个方面的个性化音频系统的示意图。

图2是根据本公开的各种实施方案的用于生成使音频体验个性化的用户特定信息的方法步骤的流程图。

图3是根据本公开的各种实施方案的用于生成定制的音频信号的方法步骤的流程图。

图4是示出根据本公开的各种实施方案的个性化音频系统的示意图。

图5是被配置为实现各种实施方案的一个或多个方面的计算系统的概念框图。

为了清楚起见，在适用的情况下，已经使用相同的附图标记来指示附图之间共同的相同元件。设想一个实施方案的特征可以合并在其他实施方案中而无需进一步详述。

具体实施方式

本文中描述的实施方案向各种音频环境中、诸如家中、车辆中和 /或在忙碌(例如，经由耳机)的用户提供基于装置和/或基于云的个性化音频体验。个性化音频体验针对特定用户的收听偏好和听力缺陷经由个人声音和音频体验调整进行优化。当用户从在一个音频环境中 (例如，经由耳机)转变到在另一个音频环境中(例如，经由车载音频系统)收听音频内容时，在每个音频环境中实现与该用户相关联的个人收听偏好和/或听力损伤设置。因此，实施方案在不同的音频环境中产生按特定用户定制并且无缝地遵循该用户的音频体验。因此，用户的音频体验保持基本上相同，即使不同音频环境中包括的不同音频装置在向用户提供音频内容也是如此。在各种实施方案中，移动计算装置、软件应用程序(或“应用”)和/或云服务的组合向各种装置和环境递送个性化音频体验。下面结合图1描述一个这样的实施方案。

图1是示出被配置为实现本公开的一个或多个方面的个性化音频系统100的示意图。个性化音频系统100包括但不限于一个或多个音频环境110、用户简档数据库120、装置简档数据库130，以及移动计算装置140。个性化音频系统100被配置为向特定用户提供个性化音频体验，而不管哪个特定音频环境110当前在向用户提供音频体验。在一些实施方案中，音频体验的音频内容本地地存储在移动计算装置140中，并且在其他实施方案中，此音频内容由在云基础设施 105中实现的流服务104提供。云基础设施105可以是任何技术上可行的基于互联网的计算系统，诸如分布式计算系统和/或基于云的存储系统。

一个或多个音频环境110中的每一个被配置为向特定用户播放音频内容。例如，音频环境110可以包括但不限于汽车(或其他车辆) 音频环境101、耳机102和智能扬声器103中的一个或多个。在图1 所示的实施方案中，音频环境110例如经由无线连接(例如，

和/或

)和/或有线连接播放从移动计算装置140接收到的音频内容。因此，音频环境110可以包括能够直接从移动计算装置140接收音频内容的任何音频装置，诸如家中的“哑”扬声器、车辆中的立体声系统或者常规的一对耳机。此外，在图1所示的实施方案中，音频环境110不依赖于在内部执行音频信号处理或从在基于云的基础设施105中实现的实体接收音频内容或其他信息的能力。

一个或多个音频环境110中的每一个包括一个或多个扬声器 107，并且在一些实施方案中，包括一个或多个传感器108。扬声器 107是被配置为基于从移动计算装置140接收到的定制的音频信号而产生声音输出的音频输出装置。传感器108被配置为从用户获取生物特征数据(例如，心率、皮肤电传导等等)并且将与生物特征数据相关联的信号传输到移动计算装置140。由传感器108获取的生物特征数据然后可以由在移动计算装置140上运行的控制算法145处理，以确定特定用户的一个或多个个人音频偏好。在各种实施方案中，传感器 108可以包括能够获取生物特征数据的任何类型的图像传感器、电传感器、生物特征传感器等，例如但不限于，相机、电极、麦克风等。

用户简档数据库120存储使得能够在任何音频环境110中为特定用户产生个性化音频体验的用户特定和装置特定信息。如图所示，用户简档数据库120在基于云的基础设施105中实现，并且因此每当移动计算装置140具有互联网连接时就可由移动计算装置140访问。从互联网连接可以是经由蜂窝连接、

连接和/或有线连接。存储在用户简档数据库120中的用户特定和装置特定信息可以包括用户偏好均衡(EQ)简档121、环境均衡(EQ)简档122和听力缺陷补偿简档123 中的一个或多个。在一些实施方案中，与特定用户相关联并存储在用户简档数据库120中的信息也本地存储在与该特定用户相关联的移动计算装置140中。在此类实施方案中，用户偏好简档121、环境EQ 简档122和/或听力缺陷补偿简档123存储在移动计算装置140的本地用户简档数据库143中。

用户偏好简档121包括用来在任何音频环境110中为特定用户产生个性化音频体验的用户特定信息。在一些实施方案中，用户偏好简档121包括与特定用户相关联的声学过滤器和/或EQ曲线。通常，当用作移动计算装置140的音频处理应用程序146对音频信号进行的定制的音频处理过程的一部分时，声学过滤器或EQ曲线以特定频率调整音频信号的幅值。因此，被特定用户选择并且在音频环境110中的一个中回放的音频内容被修改成适合该用户的个人收听偏好。替代地或另外地，在一些实施方案中，用户偏好简档121包括其他用户优选的信号处理，诸如对音频信号的动态范围压缩、动态扩展、音频限制和/或空间处理。在此类实施方案中，当被用户选择时，此用户优选的信号处理也可以由音频处理应用程序146用来当在音频环境110中的一个中回放时修改音频内容。

在一些实施方案中，用户偏好简档121包括反映与用户简档数据库120相关联的特定用户优选的音频均衡的一个或多个基于用户偏好的EQ曲线。在此类实施方案中，基于用户偏好的EQ曲线可以是在用户对优选的收听设置的设置期间选择的预设EQ曲线。替代地或另外地，在此类实施方案中，基于用户偏好的EQ曲线可以是与不同的用户相关联的预设EQ曲线，诸如与公知的音乐家或知名人士相关联的基于偏好的EQ曲线。替代地或另外地，在此类实施方案中，基于用户偏好的EQ曲线可以是包括在用户对优选的收听设置的设置期间由用户执行的一个或多个离散幅值调整的EQ曲线。替代地或另外地，在此类实施方案中，基于用户偏好的EQ曲线可以包括特定用户所特有的头部相关传递函数(HRTF)信息。这样的基于用户偏好的EQ 曲线可以在被音频处理应用程序146用作定制的音频处理过程的一部分时针对与该用户偏好EQ曲线相关联的特定用户实现沉浸式和/ 或三维音频体验。

在一些实施方案中，每个用户偏好曲线121可以与一个或多个特定类别的音乐的回放、一天的一个或多个特定时间、经由一个或多个传感器108从用户接收到的生物特征反馈(可以指示情绪)的特定集合等等相关联。因此，对于同一用户，可以采用不同的用户偏好曲线 121来产生不同的个性化音频环境。例如，基于经由移动计算装置140 的用户界面进行的用户选择，可以采用不同的用户偏好EQ曲线来为用户产生个性化音频环境。

环境EQ简档122包括用来在任何音频环境110中为特定用户产生个性化音频体验的位置特定信息。在一些实施方案中，环境EQ简档122包括各自被配置为用于特定音频环境110和/或特定音频环境 110内的特定位置的声学过滤器和/或EQ曲线。

在一些实施方案中，环境EQ简档122中的一个被配置为向由在特定音频环境110内产生的声音和/或音频环境110中的表面的相互作用而引起的问题提供EQ补偿。例如，当这样的环境EQ简档122 被用作音频处理应用程序146的定制的音频处理过程的一部分时，用户的音频体验可以在车辆中的特定座椅位置或房间内的位置得到改进。对于固定的环境，诸如具有已知的扬声器类型和位置的特定车辆内部，这样的环境EQ简档122可以在没有用户交互的情况下确定并且作为预设座椅校正EQ的选项提供给用户。替代地或另外地，这样的预设环境EQ简档122还可以由用户在个性化音频系统100的用户声音偏好测试或设置操作期间修改。对于其他环境，诸如特定房间内的特定位置，可以基于用户交互经由测试来确定环境EQ简档122，诸如在该特定房间内的特定位置经由扬声器107(例如，智能扬声器 103)、传感器108和移动计算装置140执行的用户声音偏好测试。在一些实施方案中，用户声音偏好测试可以经由控制应用程序145、音频处理应用程序146或在移动计算装置140上运行的任何其他合适的软件应用程序来执行。

听力缺陷补偿简档123包括可以用来补偿与特定用户相关联的听力缺陷的用户特定信息。根据各种实施方案，此类听力缺陷补偿可以是与用户简档数据库120相关联的用户的个性化音频体验的组成。通常，听力缺陷补偿简档123包括被选择来补偿在与用户简档数据库 120相关联的用户中检测到或以其他方式与其相关联的听力缺陷的一个或多个增益压缩曲线。在一些实施方案中，此类增益压缩曲线可以实现多频段压缩，其中音频信号的频谱的不同部分精力不同水平的增益压缩。增益压缩可以增加低于阈值水平的低水平声音，而不会使较高水平的声音变得令人不快地大。因此，增益压缩用来补偿特定用户的听力缺陷，并且此增益压缩经由包括在听力缺陷补偿简档123中的一个或多个增益压缩曲线来实现。

在一些实施方案中，基于例如通过经由在移动计算装置140上运行的合适软件应用程序向用户递送的问卷而从用户收集的人口统计信息来确定特定用户的听力缺陷。在此类实施方案中，可以在个性化音频系统100的设置操作期间向用户递送问卷。在其他实施方案中，可以基于经由一个或多个扬声器107、一个或多个传感器108和移动计算装置140执行的一个或多个听力测试来确定此类听力缺陷。在任一种情况下，确定在某些频段的听力缺陷，并且基于此类听力缺陷而选择合适的听力缺陷补偿简档123。例如，可以基于从用户收集的人口统计信息和/或听力测试信息而为用户选择或构建特定增益压缩曲线。该特定增益压缩曲线然后被包括在该用户的听力缺陷补偿简档 123中，并且可以由音频处理应用程序146用作定制的音频处理过程的一部分以便为该用户产生个性化音频体验。因此，可以在任何音频环境110中向用户提供包括听力补偿的个性化音频体验。

图2是根据本公开的各种实施方案的用于生成使音频体验个性化的用户特定信息的方法步骤的流程图。由所述方法步骤生成的用户特定信息可以包括一个或多个用户偏好简档121、环境EQ简档122 和/或听力缺陷补偿简档123。尽管关于图1的系统描述了方法步骤，但是本领域技术人员将理解，被配置为以任何次序执行方法步骤的任何系统都落在各种实施方案的范围内。

如图所示，方法200在步骤201处开始，其中在移动计算装置 140上运行的合适的软件应用程序(诸如控制应用程序145)接收用户输入以发起对当前用户的听力缺陷测试。

在步骤202中，软件应用程序选择特定听力缺陷测试以执行。每个此类听力缺陷测试可以确定与用户相关联的听力缺陷补偿信息。例如，在一些实施方案中，某些听力缺陷测试可以特定于不同的音频环境110和/或特定于特定用户。因此，在此类实施方案中，可以根据当前音频环境110而为用户选择不同的听力缺陷测试。此外，在一些实施方案中，可以选择不同类型的听力缺陷测试，诸如基于人口统计信息的听力缺陷测试和基于量化多个频段的听力损失的听力缺陷测试。

在步骤203中，软件应用程序执行在步骤202中选择的听力缺陷测试。例如，在一些情况下，可以收集人口统计用户信息以确定哪种听力缺陷补偿可能有益于该用户。替代地或另外地，在一些实施方案中，经由软件应用程序、设置在当前音频环境110中的一个或多个扬声器107以及设置在当前音频环境110中的一个或多个传感器108来执行听力缺陷测试。在此类实施方案中，可以针对多个频段中的每一个将用户的听力缺陷量化，并且将此类测试的结果包括在用户的听力缺陷补偿简档123中。

在步骤204中，软件应用程序确定是否要针对当前音频环境110 中的用户执行任何剩余的听力缺陷测试。例如，在一些实施方案中，软件应用程序用尚未被用户执行的听力缺陷测试的列表来提示用户。如果是的话，那么方法200返回到步骤202并且选择要执行的另一个听力缺陷测试；如果否的话，那么方法200进行到步骤205。

在步骤205中，软件应用程序接收用户输入以发起对当前用户和 /或音频环境110的个性化测试。

在步骤206中，软件应用程序选择特定个性化测试以执行。例如，在一些实施方案中，可能的个性化测试包括但不限于用于确定用户的特定用户偏好简档121的个人EQ偏好测试、用于确定由用户指定的特定音频环境110的特定环境EQ简档122的环境EQ测试，以及用于确定用户的特定HRTF的HRTF测试。

在步骤207中，软件应用程序执行在步骤206中选择的个性化测试。例如，在执行个人EQ偏好测试的情况下，可以经由当前音频环境110向用户展示预设声学过滤器或其他声学简档，使得用户可以选择提供最佳音频体验的预设声学简档。在此类个性化测试期间，软件应用程序可以显示包括一个或多个预设声学过滤器响应的声学预设排名屏幕。用户然后可以收听由预设声学过滤器响应中的每一个按次序处理的测试声音，并且基于个人偏好对预设声学过滤器响应进行排名。在一些实施方案中，这样采用的预设声学过滤器是基于与用户相关的数据。例如，软件应用程序可以检索与用户相关联或由用户输入的人口统计数据相关的历史数据，以选择在人口统计范围内的用户先前排名较高的一个或多个预设声学过滤器。替代地或另外地，在一些实施方案中，此类个性化测试包括依赖于由用户做出的A/B选择的 “验光测试”型测试。此类验光测试型测试可以迅速地缩小到基于A/B 比较收听测试的选择。替代地或另外地，在一些实施方案中，此类个性化测试提供对选定的预设声学过滤器响应的特定频段水平的离散编辑。

在执行环境EQ测试的情况下，可以经由当前音频环境110向用户展示预设声学过滤器，使得用户可以选择过去排名较高的预设声学过滤器，以提供由用户指示的特定音频环境110的最佳音频体验。在此类个性化测试期间，软件应用程序可以显示包括一个或多个预设声学过滤器响应的声学预设排名屏幕，并且还对不同的预设声学过滤器执行次序或A/B测试。替代地或另外地，在一些实施方案中，此类环境EQ测试使得用户能够对选定的预设声学过滤器响应的特定频段水平执行离散编辑。例如，在一些实施方案中，显示不同的滑动条以用于选择每个频段的期望增益。

在执行HRTF测试的情况下，基于影响音频环境110中的声音的定位的用户的特性(诸如用户的人体测量特征)来确定用户的特定 HRTF值。然后将用户的特定HRTF值包括在用户偏好数据库120中作为可以用于处理音频信号的用户偏好简档121。当在音频环境110中播放基于HRTF处理的音频信号的音频输出时，用户的听力通常将音频输出解释为来自所有方向，而不是来自设置在音频环境110内的离散音频装置。

在步骤208中，软件应用程序确定是否要针对当前音频环境110 中的用户执行任何剩余的个性化测试。例如，在一些实施方案中，软件应用程序用尚未被用户执行的个性化测试的列表来提示用户。如果是的话，那么方法200返回到步骤206并且选择要执行的另一个个性化测试；如果否的话，那么方法200进行到步骤209。

在步骤209中，软件应用程序将经由上述个性化测试确定的用户特定和/或环境特定信息包括在用户简档数据库120中。

返回到图1，装置简档数据库130包括各自与特定音频装置相关联的多个装置特定EQ曲线131，诸如耳机、车载音频系统的特定品牌和型号、智能扬声器的品牌和型号等。此外，每个装置特定EQ曲线131被配置为在音频信号被相关联的音频装置回放之前修改音频信号，其中音频信号被修改为补偿该音频装置的非理想频率响应。在一些实施方案中，理想的音频系统生成音频输出，其中音频输出所基于的输入信号很少失真或不失真。也就是说，理想的音频系统在系统的操作频率(例如，20Hz至20kHz)上以频率响应的均匀平坦幅值表现。另外，在理想的音频系统中，音频输出在系统的所有操作频率下都延迟确切地相同时间量。在实践中，任何给定的音频系统具有与理想的音频系统的上述频率响应不同的不同频率响应。此外，很多扬声器具有包括在某些频率处的峰和谷和/或过分强调某些频率处的响应的粗糙非平坦频率响应。通常，具有非平坦频率响应的扬声器生成增加了大多数用户可听见且普遍不喜欢的谐振或音调变化的音频输出。因此，尽管大量的努力和资源被用于捕获具有高质量录音的特定音乐表演，但回放装置的频率响应可以大大降低在收听录音时的用户体验。

在一些实施方案中，经由对特定音频装置(诸如一副耳机、智能扬声器、车载音频系统的扬声器、常规扬声器等)的标准测试或其他性能量化测试来构建每个装置特定EQ曲线131。然后将装置特定EQ 曲线131存储在装置简档数据库130中并且使得其可供移动计算装置 140的音频处理应用程序146使用。因此，根据各种实施方案，当音频处理应用程序146检测到特定音频装置时，可以将适当的装置特定 EQ曲线131合并到由音频处理应用程序146对音频信号进行的定制的音频处理过程中。因此，经由定制的音频处理过程从特定用户的音频信号中生成的个性化音频体验可以包括补偿音频装置的非理想频率响应，从而提供个性化音频体验。

移动计算装置140可以是能够被配置为实现本文描述的本公开的至少一个方面的任何移动计算装置，包括智能电话、电子平板、膝上型计算机等。通常，移动计算装置140可以是能够执行应用程序(包括但不限于，与控制应用程序145和/或音频处理应用程序146相关联的指令)的任何类型的装置。在一些实施方案中，移动计算装置140 还被配置为存储本地用户简档数据库143，该本地用户简档数据库可以包括用户偏好简档121、环境EQ简档122和/或听力缺陷补偿简档 123中的一个或多个。替代地或另外地，在一些实施方案中，移动计算装置140还被配置为存储音频内容144，诸如音频内容的数字录音。

控制应用程序145被配置为执行移动计算装置140与用户简档数据库120、装置简档数据库130和音频环境110之间的通信。在一些实施方案中，控制应用程序145还被配置为向用户呈现用户界面(未示出)，以实现个性化音频系统100的用户声音偏好测试、听力测试和/或设置操作。在一些实施方案中，控制应用程序145还被配置为基于用户特定音频处理信息和装置特定音频处理信息而生成对音频信号的定制的音频处理过程。例如，用户特定音频处理信息可以包括一个或多个用户偏好简档121和/或听力缺陷补偿简档123，而装置特定音频处理信息可以包括一个或多个环境EQ简档122和/或装置特定 EQ曲线131。

在一些实施方案中，针对一个或多个特定收听场景，控制应用程序145通过生成复合EQ曲线141和/或复合增益曲线142来生成定制的音频处理过程。通常，每个特定收听场景是用户和收听环境110的唯一组合。因此，对于特定用户，控制应用程序145被配置为针对其中预期用户具有个性化音频体验的每个收听环境110生成不同的复合EQ曲线141和/或复合非线性处理142。例如，当用户在特定汽车音频环境101(诸如特定品牌和型号的车辆中的特定座椅)中时，控制应用程序145基于一些或所有适用EQ曲线而生成复合EQ曲线141。在这种情况下，适用EQ曲线的示例包括但不限于与用户相关联的一个或多个适用用户偏好简档121、适用于用户所在的特定汽车音频环境101的环境EQ简档122、适用于特定汽车音频环境101的装置特定EQ曲线131、听力缺陷补偿简档123。

在一些实施方案中，控制应用程序145通过将所有适用EQ简档的操作合计到单个声音均衡曲线中来生成特定收听场景的复合EQ曲线141。因此，在由音频处理应用程序146执行的定制的音频处理过程中，可以通过复合EQ曲线141来修改音频信号，而不是通过多个 EQ简档顺序地处理。在一些实施方案中，控制应用程序145还通过将用户偏好简档121和/或听力缺陷补偿简档123的所有适用的非线性处理部分的操作合计到单个复合非线性处理142中来生成特定收听场景的非线性处理142。例如，此类非线性处理可以包括但不限于听力缺陷补偿简档123中包括的一个或多个增益压缩操作、用户偏好简档121中包括的一个或多个动态范围压缩操作、用户偏好简档121 中包括的一个或多个音频限制操作等等。

在一些实施方案中，当控制应用程序145生成特定收听场景的复合EQ曲线141时，将复合EQ曲线存储在本地用户简档数据库143 中和/或在用户简档数据库120中以供未来使用。类似地，在此类实施方案中，当控制应用程序145生成特定收听场景的复合分线性处理 142时，也将复合非线性处理142存储在本地用户简档数据库143中和/或在用户简档数据库120中以供未来使用。

在一些实施方案中，每个特定收听场景是用户、收听环境110和来自用户简档数据库120的用户选定的用户偏好简档121的唯一组合。在此类实施方案中，用户选定的用户偏好简档121可以是与公知的音乐家或知名人士相关联的EQ曲线、与特定活动(例如，玩视频游戏、锻炼、驾驶等)相关联的用户的EQ曲线、与特定类别的音乐或播放列表相关联的用户的EQ曲线等等。因此，在这样的实施方案中，控制应用程序145被配置为针对用户、收听环境110和用户选定的用户偏好简档121的特定组合生成不同的复合EQ曲线141。因此，通过选择合适的用户偏好简档121，用户可以使个性化音频体验适合于特定音频环境110和用户偏好简档121两者。

音频处理应用程序146被配置为通过利用由控制应用程序146生成的定制的音频处理过程处理初始音频信号来生成定制的音频信号。更具体地，音频处理应用程序146通过利用复合EQ曲线141并且在一些实施方案中利用复合非线性处理142修改初始音频信号来生成定制的音频信号。下面结合图3描述一个这样的实施方案。

图3是根据本公开的各种实施方案的用于生成定制的音频信号的方法步骤的流程图。尽管关于图1和图2的系统描述了方法步骤，但是本领域技术人员将理解，被配置为以任何次序执行方法步骤的任何系统都落在各种实施方案的范围内。

如图所示，方法300在步骤301处开始，其中音频处理应用程序 146识别当前用户。例如，音频处理应用程序146可以基于用户登录、由用户输入的用户信息等而确定用户的身份信息。

在步骤302中，音频处理应用程序146访问用户特定音频信息，诸如一个或多个用户偏好EQ曲线151、听力缺陷补偿简档123，和/ 或使得定制的音频处理过程能够产生用户的个性化音频体验的其他用户特定收听处理信息。在一些实施方案中，音频处理应用程序146 访问用户简档数据库120中的一些或全部用户特定音频信息。替代地或另外地，在一些实施方案中，音频处理应用程序146访问本地用户简档数据库143中的一些或全部用户特定音频信息。

在步骤303中，音频处理应用程序146识别当前音频环境中包括的一个或多个音频装置。例如，在一些实施方案中，控制应用程序 145基于由用户输入的信息而确定当前音频环境110的音频装置的识别信息，并且将识别信息传送到音频处理应用程序146。在其他实施方案中，控制应用程序145通过直接查询每个音频装置来确定或接收音频装置的识别信息。例如，在一个这样的实施方案中，控制应用程序145经由与音频装置的无线连接来接收媒体访问控制(MAC)地址、型号等。

在步骤304中，音频处理应用程序146访问使得定制的音频处理过程能够产生用户的个性化音频体验的装置特定音频信息(诸如一个或多个装置特定EQ曲线131)。在一些实施方案中，音频处理应用程序146访问用户简档数据库120中的一些或全部装置特定音频信息，并且在一些实施方案中，音频处理应用程序146访问本地用户简档数据库143中的一些或全部装置特定音频信息。

在步骤305中，音频处理应用程序146确定音频环境特定的音频处理信息是否可用。例如，基于在步骤303中确定的音频装置的识别信息，控制应用程序145可以确定当前音频环境110包括与特定车辆内部相关联的音频系统或者已经与特定房间或用于已经执行环境EQ 测试的其他位置相关联的智能扬声器。如果否的话，那么方法300进行到步骤307；如果是的话，那么方法300进行到步骤306。

在步骤306中，音频处理应用程序146访问使得定制的音频处理过程能够产生用户的个性化音频体验的环境特定音频信息(例如，诸如一个或多个环境特定EQ简档122)。在一些实施方案中，音频处理应用程序146访问用户简档数据库120中的一些或全部环境特定音频信息，并且在一些实施方案中，音频处理应用程序146访问本地用户简档数据库143中的一些或全部环境特定音频信息。

在步骤307中，音频处理应用程序146基于在步骤302、304和 306中访问的音频信息而生成定制的音频处理过程。具体地，针对当前收听场景，音频处理应用程序146通过生成复合EQ曲线141和/ 或复合非线性处理142来生成定制的音频处理过程。如上所述，当前收听场景可以基于当前用户、当前收听环境110，以及在一些实施方案中，由用户选择的用户偏好简档121和/或听力缺陷补偿简档123 的组合。

在步骤308中，音频处理应用程序146经由在步骤307中生成的定制的音频处理过程来修改音频信号。在一些实施方案中，从本地存储在移动计算装置140中的音频内容144来生成音频信号。在其他实施方案中，从接收自流服务104的音频内容生成音频信号。

根据各种实施方案，经由定制的音频处理过程来修改音频信号是以两个阶段进行。首先，使用复合EQ曲线141来处理音频信号以生成修改的音频信号。然后对修改的音频信号执行增益修改操作以生成定制的音频信号，该定制的音频信号当在适当的音频环境110中播放时产生用户的个性化音频体验。应当注意，结合来形成复合EQ曲线 141的多个均衡或过滤操作并不是在音频信号上连续地执行，而是在单个操作中执行。因此，音频信号中的噪声水平没有增加，当一个 EQ操作在特定频段中降低该水平并且随后的EQ操作在该频段中放大该水平时可能出现噪声水平增加。类似地，还可以防止或减少限幅，因为当一个EQ操作在超出阈值极限的特定频段中放大音频信号的水平并且随后的EQ操作降低该频段的水平时可能出现限幅。

在图1所示的实施方案中，移动计算装置140、在移动计算装置 140上运行的一个或多个软件应用程序以及基于云的服务的组合将个性化音频体验递送到各种音频环境110。在其他实施方案中，各种音频环境中的一个或多个音频装置与基于云的服务直接通信以在各种音频环境的每一个中实现个性化音频体验。在此类实施方案中，移动计算装置可以提供用户界面和/或音频系统控制界面，但不作为用于生成和/或实现音频信号的定制的音频处理过程的处理引擎操作。相反，在基于云的服务中执行一些或全部定制的音频处理过程，并且在音频环境中所包括的智能装置中本地地执行使用定制的音频处理过程的一些或全部音频处理。下面结合图4描述一个这样的实施方案。

图4是示出被配置为实现本公开的一个或多个方面的个性化音频系统400的示意图。个性化音频系统400包括但不限于包括至少一个可编程音频装置440的一个或多个音频环境410、用户简档数据库 120、装置简档数据库130，以及移动计算装置440。个性化音频系统 400被配置为向特定用户提供个性化音频体验，而不管哪个特定音频环境410当前在向用户提供音频体验。个性化音频系统400的操作类似于个性化音频系统100，除了在云基础设施105中运行的控制应用程序445生成定制的音频处理过程以用于修改音频信号来在特定音频环境中回放。此外，在与特定音频环境相关联的一个或多个可编程音频装置440中执行使用定制的音频处理过程的音频信号处理。因此，控制应用程序445生成类似于图1的复合EQ曲线141的复合 EQ曲线和/或类似于图1的复合非线性处理142的复合增益曲线。

在一些实施方案中，定制的音频处理过程通过编程到可编程音频装置440的内部音频处理器446中而在个性化音频系统400中实现。在此类实施方案中，与定制的音频处理过程相关联的音频处理由内部音频处理器446执行，该内部音频处理器可以是可编程的数字信号处理器(DSP)或其他处理器。音频信号(例如来自流服务104或基于音频内容144)由内部音频处理器446使用定制的音频处理过程来修改，以生成定制的音频信号444。当包括在可编程音频装置440中或以其他方式与其相关联的扬声器408产生基于定制的音频信号444的声音输出449时，为音频环境410中的用户产生个性化音频体验。因此，在图4所示的实施方案中，音频信号(例如来自流服务104或基于音频内容144)由内部音频处理器445利用定制的音频处理过程进行处理，而不是由在音频环境410中所包括的音频装置外部的处理器处理。

图5是被配置为实现各种实施方案的一个或多个方面的计算系统500的概念框图。计算系统500可以是能够执行应用程序(包括但不限于，与控制应用程序145、音频处理应用程序146和/或控制应用程序445相关联的指令)的任何类型的装置。例如但不限于，计算系统500可以是电子平板、智能电话、膝上型计算机、结合到车辆中的信息娱乐系统、家庭娱乐系统等。替代地，计算系统500可以被实现为独立芯片，诸如微处理器，或者作为被实现为专用集成电路(ASIC)、片上系统(SoC)等的更全面解决方案的一部分。应当注意，本文所述的计算系统是说明性的，并且任何其他技术上可行的配置落在本发明的范围内。

如图所示，计算系统500包括但不限于互连(总线)540，其将处理器550、耦合到输入/输出(I/O)装置580的I/O装置接口560、存储器 510、存储设备530以及网络接口570相连接。处理器550可以是被实现为以下项的任何合适的处理器：中央处理单元(CPU)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、任何其他类型的处理单元，或者不同处理单元的组合，诸如被配置为与数字信号处理器(DSP)结合操作的CPU。例如，在一些实施方案中，处理器550包括CPU和 DSP。一般来说，处理器550可以是能够处理数据和/或执行指令以促进图5的计算系统500的操作的任何技术上可行的硬件单元，如本文所述。此外，在本公开的上下文中，计算装置500中示出的计算元件可以对应于物理计算系统(例如，数据中心中的系统)，或者可以是在计算云内执行的虚拟计算实例。

I/O装置580可以包括能够提供输入的装置，诸如键盘、鼠标、触敏屏麦克风581等等，以及能够提供输出的装置，诸如扬声器582 和显示屏。显示屏可以是计算机显示器、视频显示屏、结合到手持式装置中的显示设备，或者任何其他技术上可行的显示屏。扬声器582 的特定实例可以包括作为诸如图1中的个性化音频系统100或图4中的个性化音频系统400的音频系统的元件的一个或多个扬声器。

I/O装置580可以包括能够接收输入和提供输出的附加装置，诸如触摸屏、通用串行总线(USB)端口等等。此类I/O装置580可以被配置为从计算装置500的终端用户接收各种类型的输入，并且还将各种类型的输出提供到计算装置500的终端用户，诸如所显示的数字图像或数字视频。在一些实施方案中，I/O装置580中的一个或多个被配置为将计算装置500耦合到通信网络505。

I/O接口560实现I/O装置580与处理器550的通信。I/O接口通常包括用于解释由处理器550生成的对应于I/O装置580的地址。I/O 接口560还可以被配置为实现处理器550与I/O装置580之间的信号交换，和/或生成与I/O装置580相关联的中断。I/O接口560可以被实现为任何技术上可行的CPU、ASIC、FPGA、任何其他类型的处理单元或装置。

网络接口570是将处理器550连接到通信网络505的计算机硬件部件。网络接口570可以在计算装置500中实现为独立卡、处理器或其他硬件装置。在通信网络505包括

网络或WPAN的实施方案中，网络接口570包括合适的无线收发器。替代地或另外地，网络接口570可以被配置为具有蜂窝通信能力、卫星电话通信能力、无线 WAN通信能力，或者允许与通信网络505和在计算系统500外部的其他计算装置500通信的其他类型的通信能力。

存储器510可以包括随机存取存储器(RAM)模块、快闪存储器单元，或者任何其他类型的存储器单元或其组合。处理器550、I/O装置接口560和网络接口570被配置为从存储器510读取数据和将数据写入该存储器。存储器510包括可以由处理器550执行的各种软件程序以及与所述软件程序相关联的应用程序数据，包括控制应用程序 145、音频处理应用程序146和/或控制应用程序445。

存储设备530可以包括非暂时性计算机可读介质，诸如非易失性存储装置。在一些实施方案中，存储设备530包括用户简档数据库 120、装置简档数据库130和/或本地用户简档数据库143。

总之，各种实施方案阐述了用于向各种音频环境中的用户提供基于装置和/或基于云的个性化音频体验的系统和技术，其中个性化音频体验针对特定用户的收听偏好和听力缺陷经由个人声音和音频体验调整进行优化。在实施方案中，生成基于用户特定、音频装置特定和环境特定的信息的定制的音频处理过程。当定制的音频处理过程用来在回放之前修改音频信号时，用户可以具有适合于用户的收听偏好的个性化音频体验。

1.在一些实施方案中，一种音频信号处理的方法包括：访问特定用户的用户特定音频处理信息；确定用于从音频信号产生声音输出的音频装置的身份信息；基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

2.如条款1的方法，所述方法还包括使所述音频装置从所述定制的音频信号产生声音输出。

3.如条款1或2的方法，其中使所述音频装置从所述定制的音频信号产生声音输出包括经由无线连接将所述定制的音频信号传输到所述音频装置。

4.如条款1至3中任一项的方法，其中经由在所述音频装置外部的处理器来执行所述利用所述定制的音频处理过程处理所述音频信号。

5.如条款1至4中任一项的方法，其中经由在所述音频装置中包括的处理器来执行所述利用所述定制的音频处理过程处理所述音频信号。

6.如条款1至5中任一项的方法，其中访问所述特定用户的用户特定音频处理信息包括：确定所述特定用户的身份信息；以及基于所述特定用户的所述身份信息，从基于云的储库检索所述用户特定音频处理信息。

7.如条款1至6中任一项的方法，其中访问所述特定用户的用户特定音频处理信息包括：确定所述特定用户的身份信息；以及基于所述特定用户的所述身份信息，从被配置为生成所述定制的音频处理过程的计算装置检索所述用户特定音频处理信息。

8.如条款1至7中任一项的方法，其中生成所述定制的音频处理过程包括从所述用户特定音频处理信息或所述装置特定音频处理信息中的至少一个中包括的信息生成复合声音均衡曲线。

9.如条款1至8中任一项的方法，其中生成所述复合声音均衡曲线包括将所述用户特定音频处理信息或所述装置特定音频处理信息中包括的所有声音均衡曲线组合。

10.如条款1至9中任一项的方法，其中利用所述定制的音频处理过程生成所述定制的音频信号包括：通过利用所述复合声音均衡曲线修改所述音频信号来生成修改的音频信号；以及对所述修改的音频信号执行所述用户特定音频信息或所述装置特定音频信息中的至少一个中指示的增益修改操作。

11.在一些实施方案中，一种非暂时性计算机可读介质存储指令，所述指令在被处理器执行时使所述处理器执行以下步骤：访问特定用户的用户特定音频处理信息；确定用于从音频信号产生声音输出的音频装置的身份信息；基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

12.如条款11的非暂时性计算机可读介质，其中基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的所述定制的音频处理过程包括基于环境特定信息而生成所述音频信号的所述定制的音频处理过程。

13.如条款11或12的非暂时性计算机可读介质，所述方法还包括基于所述音频装置的所述身份信息和所述特定用户的身份信息中的至少一个而确定所述环境特定信息。

14.如条款11至13中任一项的非暂时性计算机可读介质，其中访问所述特定用户的用户特定音频处理信息包括：接收指示特定均衡简档的用户输入；以及访问所述特定均衡简档。

15.如条款11至14中任一项的非暂时性计算机可读介质，其中生成所述定制的音频处理过程包括基于所述特定均衡简档而生成所述定制的音频处理过程。

16.如条款11至15中任一项的非暂时性计算机可读介质，所述方法还包括基于由所述特定用户执行的个性化测试而生成所述特定均衡简档。

17.如条款11至16中任一项的非暂时性计算机可读介质，其中访问所述特定用户的用户特定音频处理信息包括：确定所述特定用户的身份信息；以及基于所述特定用户的所述身份信息，从基于云的储库检索所述用户特定音频处理信息。

18.如条款11至17中任一项的非暂时性计算机可读介质，其中访问所述特定用户的用户特定音频处理信息包括：确定所述特定用户的身份信息；以及基于所述特定用户的所述身份信息，从被配置为生成所述定制的音频处理过程的计算装置检索所述用户特定音频处理信息。

19.如条款11至18中任一项的非暂时性计算机可读介质，其中生成所述定制的音频处理过程包括从所述用户特定音频处理信息或所述装置特定音频处理信息中的至少一个中包括的信息生成复合声音均衡曲线。

20.在一些实施方案中，一种系统包括：存储器，所述存储器存储指令；以及处理器，所述处理器耦合到所述存储器，并且被配置为在执行所述指令时执行以下步骤：访问特定用户的用户特定音频处理信息；确定用于从音频信号产生声音输出的音频装置的身份信息；基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

权利要求中的任一项所述的权利要求要素中的任一个和/或本申请中所述的任何要素的任何和所有组合都落入本发明的预期的保护范围内。

已经出于说明目的呈现了对各种实施方案的描述，但是这些描述并非意图是详尽的或限制于所公开的实施方案。在不脱离所描述的实施方案的范围和精神的情况下，许多修改和变化对本领域的普通技术人员将是显而易见的。

本发明实施方案的各方面可以体现为系统、方法或计算机程序产品。因此，本公开的各方面可以采取完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或结合软件和硬件方面的实施方案的形式，所述软件和硬件方面在本文中可以全部概括地称为 “模块”或“系统”。另外，本公开中描述的任何硬件和/或软件技术、过程、功能、部件、引擎、模块或系统都可以被实现为电路或电路组。此外，本公开的各方面可以采取体现在至少一个计算机可读介质中的计算机程序产品的形式，所述一个或多个计算机可读介质具有在其上体现的计算机可读程序代码。

可以利用至少一个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是例如但不限于电子、磁性、光学、电磁、红外或半导体系统、设备或装置，或者前述的任何合适的组合。计算机可读存储介质的更具体示例(非详尽列表)将包括以下项：具有至少一条接线的电气连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光学存储装置、磁性存储装置，或者前述的任何合适的组合。在本文档的背景中，计算机可读存储介质可以是可包含或存储由或结合指令执行系统、设备或装置使用的程序的任何有形介质。

以上参考根据本公开的实施方案的方法、设备(系统)和计算机程序产品的流程图和/或框图来描述本公开的各方面。应理解，可以通过计算机程序指令来实现流程图和/或框图中的每个框以及流程图和/ 或框图中的框组合。这些计算机程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以产生一种机器，使得经由计算机或其他可编程数据处理设备的处理器执行的指令实现流程图和/或框图的一个或多个框中指定的功能/动作的实现方式。这样的处理器可以是，但不限于，通用处理器、专用处理器、应用特定的处理器或现场可编程处理器或门阵列。

附图中的流程图和框图示出了根据本公开的各种实施方案的系统、方法和计算机程序产品的可能的实现方式的架构、功能和操作。就这一点而言，流程图或框图中的每个框都可以表示代码的模块、片段或部分，所述代码包括用于实现指定的逻辑功能的至少一个可执行指令。还应注意，在一些替代性实现方式中，框中指出的功能可以按附图中指出的次序以外的次序发生。例如，连续示出的两个框实际上可以基本上同时执行，或者所述框有时可以按相反的次序执行，这取决于所涉及的功能。还应注意，框图和/或流程图中的每个框以及框图和/或流程图中的框组合可以由执行指定功能或动作的基于专用硬件的系统、或专用硬件和计算机指令的组合来实现。

虽然前述内容针对的是本公开的实施方案，但是在不脱离本公开的基本范围的情况下可以设想本公开的其他和另外的实施方案，并且本公开的范围由所附权利要求书确定。

Claims

1.一种音频信号处理的方法，所述方法包括：

访问特定用户的用户特定音频处理信息；

确定用于从音频信号产生声音输出的音频装置的身份信息；

基于所述音频装置的所述身份信息，访问所述音频装置的装置特定音频处理信息；

基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程；以及

通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。

2.如权利要求1所述的方法，所述方法还包括使所述音频装置从所述定制的音频信号产生声音输出。

3.如权利要求2所述的方法，其中使所述音频装置从所述定制的音频信号产生声音输出包括经由无线连接将所述定制的音频信号传输到所述音频装置。

4.如权利要求3所述的方法，其中经由在所述音频装置外部的处理器来执行利用所述定制的音频处理过程处理所述音频信号。

5.如权利要求2所述的方法，其中经由在所述音频装置中包括的处理器来执行利用所述定制的音频处理过程处理所述音频信号。

6.如权利要求1所述的方法，其中访问所述特定用户的用户特定音频处理信息包括：

确定所述特定用户的身份信息；以及

基于所述特定用户的所述身份信息，从基于云的储库检索所述用户特定音频处理信息。

7.如权利要求1所述的方法，其中访问所述特定用户的用户特定音频处理信息包括：

确定所述特定用户的身份信息；以及

基于所述特定用户的所述身份信息，从被配置为生成所述定制的音频处理过程的计算装置检索所述用户特定音频处理信息。

8.如权利要求1所述的方法，其中生成所述定制的音频处理过程包括从所述用户特定音频处理信息或所述装置特定音频处理信息中的至少一个中包括的信息生成复合声音均衡曲线。

9.如权利要求8所述的方法，其中生成所述复合声音均衡曲线包括将所述用户特定音频处理信息或所述装置特定音频处理信息中包括的所有声音均衡曲线组合。

10.如权利要求8所述的方法，其中利用所述定制的音频处理过程生成所述定制的音频信号包括：

通过利用所述复合声音均衡曲线修改所述音频信号来生成修改的音频信号；以及

对所述修改的音频信号执行所述用户特定音频信息或所述装置特定音频信息中的至少一个中指示的增益修改操作。

11.一种非暂时性计算机可读介质，所述非暂时性计算机可读介质存储指令，所述指令在被处理器执行时使所述处理器执行以下步骤：

访问特定用户的用户特定音频处理信息；

确定用于从音频信号产生声音输出的音频装置的身份信息；

12.如权利要求11所述的非暂时性计算机可读介质，其中基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的所述定制的音频处理过程包括基于环境特定信息而生成所述音频信号的所述定制的音频处理过程。

13.如权利要求12所述的非暂时性计算机可读介质，所述方法还包括基于所述音频装置的所述身份信息和所述特定用户的身份信息中的至少一个而确定所述环境特定信息。

14.如权利要求11所述的非暂时性计算机可读介质，其中访问所述特定用户的用户特定音频处理信息包括：

接收指示特定均衡简档的用户输入；以及

访问所述特定均衡简档。

15.一种系统，所述系统包括：

存储器，所述存储器存储指令；以及

处理器，所述处理器耦合到所述存储器，并且被配置为在执行所述指令时执行以下步骤：

访问特定用户的用户特定音频处理信息；

确定用于从音频信号产生声音输出的音频装置的身份信息；