WO2019141102A1

WO2019141102A1 - 一种基于场景识别的自适应音频控制装置和方法

Info

Publication number: WO2019141102A1
Application number: PCT/CN2019/070657
Authority: WO
Inventors: 赵剑; 刘建丹
Original assignee: 北京小鸟听听科技有限公司
Priority date: 2018-01-17
Filing date: 2019-01-07
Publication date: 2019-07-25
Also published as: CN110049403A; EP3672274A4; EP3672274A1

Abstract

本申请公开了一种基于场景识别的自适应音频控制方法和系统。该方法包括：获取用户的加速度数据，根据加速度数据分析用户的使用场景；获取用户所处环境的环境声音信号，计算环境声音信号的声级强度，并分析环境声音信号的能量和频谱分布；根据使用场景、环境声音信号的声级强度、以及环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节。该方法还能够获取用户的地理位置数据，并与加速度数据一起用于分析用户的使用场景。基于以上方案，能够实现更为灵活和方便的音频播放控制。

Description

一种基于场景识别的自适应音频控制装置和方法

技术领域

本申请涉及电声转换技术，更具体的，涉及一种基于场景识别的自适应音频控制装置和方法。

背景技术

现有技术中，用户有时会在噪声环境下使用音频播放设备，为解决噪声问题，出现了具有被动/主动降噪功能的音频播放设备，例如降噪耳机，目的是消除噪声对用户的影响。发明人发现，只消除噪声已经不能够满足用户对播放效果的需求，用户希望音频播放设备更加智能，能够自动调节播放效果以适应当前的播放环境。

在声学领域中，为能够很好的反映人耳对外界噪声响度的主观听觉感受，通常会使用等效连续A声级对环境噪声进行评价，当环境噪声低于50dBA时，人们觉得环境相对安静，当噪声大于80dBA，人们会就觉得周围环境比较吵闹，当噪声达到120dBA，则人们会觉得难以忍受，长期处在90dBA以上的噪声环境中，听力受损伤的可能性明显增大。

因此，有必要提供一种能够自适应的音频播放控制方案。

发明内容

本申请的目的在于提供一种基于场景识别的自适应音频控制方案，以根据用户的使用场景自动调节播放效果。

根据本申请的第一方面，提供了一种基于场景识别的自适应音频控制装置，包括环境声音采集麦克风、加速度传感器、定位模块、控制模块、音频信号音量调节模块、主动降噪模块、以及环境声音调节模块；其中，所述音频信号音量调节模块、主动降噪模块、以及环境声音调节模块的输出端分别与喇叭连接；

所述控制模块包括存储器和处理器，其中所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现以下步骤：

根据所述加速度传感器输出的加速度数据和所述定位模块输出的地理位置数据分析用户的使用场景；

计算所述环境声音采集麦克风采集的环境声音信号的声级强度，并分析所述环境声音信号的能量和频谱分布；

根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作。

在一种实施方式中，所述环境声音调节模块包括下列子模块的任一或组合：风噪抑制子模块、语音增强子模块、动态范围控制子模块、EQ均衡处理子模块。

在一种实施方式中，所述根据所述加速度传感器输出的加速度数据和所述定位模块输出的地理位置数据分析用户的使用场景，包括：

根据所述地理位置数据确定用户所处的环境类型；

根据所述地理位置数据计算用户的移动速度；

根据所述加速度数据计算用户的步频值；

根据所述移动速度和步频值确定用户的运动模式。

在一种实施方式中，所述环境类型包括室内环境和道路环境；所述运动模式包括下列任一：静止模式、道路行走模式和搭乘交通工具模式。

在一种实施方式中，如果所述移动速度小于第一速度阈值并且所述步频值小于第一步频值阈值，则用户处于静止模式；

如果所述移动速度在行走速度区间内并且所述步频值在行走步频值区间内，则用户处于行走模式；

如果所述移动速度大于第二速度阈值，则用户处于搭乘交通工具模式。

在一种实施方式中，所述装置还包括骨传导麦克风或红外接近传感器，用户的使用场景还包括用户的说话状态；

所述计算机程序被所述处理器执行时实现以下步骤：

根据所述骨传导麦克风或红外接近传感器输出的信号确定用户是否处于讲话模式。

在一种实施方式中，所述环境声音采集麦克风为多个，包括用于采集用户实时位置外界环境声音的麦克风和用于采集用户耳廓附近所听到的环境声音的麦克风。

在一种实施方式中，如果所述使用场景为用户处于道路环境并且处于行走模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作，包括：

控制风噪抑制子模块对环境声音信号中的风噪信号进行抑制性滤波；

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块对环境声音信号中的语音信号进行增强处理；

控制动态范围控制子模块根据所述环境声音信号的声级强度对环境声音信号进行动态范围调整；

控制EQ均衡处理子模块对环境声音信号进行EQ补偿处理；根据到达喇叭处的环境声音信号的声级强度控制所述音频信号音量调节模块的工作参数，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例。

在一种实施方式中，如果所述使用场景为用户处于道路环境并且处于行走模式，则所述控制动态范围控制子模块根据所述环境声音信号的声级强度对环境声音信号进行动态范围调整，包括：

当40dBA＜所述环境声音信号的声级强度≤50dBA时，对环境声音信号进行放大处理；

当所述环境声音信号的声级强度＞60dBA时，对环境声音信号进行衰减处理。

在一种实施方式中，所述对环境声音信号进行EQ补偿处理，包括对环境声音信号中的语音信号频带和鸣笛信号频段进行EQ补偿处理。

在一种实施方式中，如果所述使用场景为用户处于道路环境并且处于行走模式，则根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作，还包括：

根据所述环境声音信号的声级强度确定是否开启所述主动降噪模块，以及如果开启所述主动降噪模块，根据所述环境声音信号的声级强度调整所述主动降噪模块的降噪等级。

在一种实施方式中，如果所述使用场景为用户处于道路环境并且处于搭乘交通工具模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作，包括：

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块对环境声音信号中的语音信号进行增强处理以及触发EQ均衡处理子模块对环境声音信号中的语音信号频带进行EQ补偿处理；

控制主动降噪模块按照最强降噪等级进行主动降噪处理；或者，根据所述环境声音信号的声级强度确定是否开启所述主动降噪模块，以及如果开启所述主动降噪模块，根据所述环境声音信号的声级强度调整所述主动降噪模块的降噪等级；

根据到达喇叭处的环境声音信号的声级强度控制所述音频信号音量调节模块的工作参数，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例。

控制风噪抑制子模块关闭；和/或，

监测环境声音信号的声级强度是否大于预设的声级强度上限或者小于预设的声级强度下限，如果环境声音信号的声级强度大于预设的声级强度上限，则触发动态范围控制子模块对环境声音信号进行衰减处理，如果环境声音信号的声级强度小于预设的声级强度下限，则触发动态范围控制子模块对环境声音信号进行放大处理。

在一种实施方式中，如果所述使用场景为用户处于室内环境并且处于静止模式和讲话模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作，包括：

控制语音增强子模块对环境声音信号中的语音信号进行增强处理；

控制EQ均衡处理子模块对环境声音信号中的语音信号频带进行EQ补偿处理；

控制主动降噪模块关闭或者对环境声音信号进行主动降噪处理；

控制音频信号音量调节模块调低音量或者暂停播放音频信号。

在一种实施方式中，如果所述使用场景为用户处于室内环境并且处于静止模式和讲话模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作，还包括：

控制风噪抑制子模块和动态范围控制子模块关闭。

在一种实施方式中，所述装置为耳机。

根据本申请的第二方面，提供了一种基于场景识别的自适应音频控制方法，包括以下步骤：

采集用户的加速度数据和地理位置数据，根据所述加速度数据和地理位置数据分析用户的使用场景；

采集用户所处环境的环境声音信号，计算所述环境声音信号的声级强度，并分析所述环境声音信号的能量和频谱分布；

根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频播放装置的音频信号音量调节模块、主动降噪模块、环境声音调节模块的工作。

在一种实施方式中，所述根据所述加速度数据和地理位置数据分析用户的使用场景，包括：

根据所述地理位置数据确定用户所处的环境类型；

根据所述地理位置数据计算用户的移动速度；

根据所述加速度数据计算用户的步频值；

根据所述移动速度和步频值确定用户的运动模式。

在一种实施方式中，所述音频播放装置还包括骨传导麦克风或红外接近传感器，用户的使用场景还包括用户的说话状态，所述方法还包括以下步骤：

在一种实施方式中，所述采集用户所处环境的环境声音信号包括采集用户实时位置外界环境声音信号和采集用户耳廓附近所听到的环境声音信号。

控制EQ均衡处理子模块对环境声音信号进行EQ补偿处理；根据到达音频播放装置的喇叭处的环境声音信号的声级强度控制所述音频信号音量调节模块的工作参数，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例。

根据到达音频播放装置的喇叭处的环境声音信号的声级强度控制所述音频信号音量调节模块的工作参数，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例。

控制风噪抑制子模块关闭；和/或，

控制风噪抑制子模块和动态范围控制子模块关闭。

在一种实施方式中，所述音频播放装置为耳机。

根据本申请的第三方面，提出了一种控制音频播放装置的方法，包括以下步骤：获取用户的加速度数据，根据加速度数据分析用户的使用场景；获取用户所处环境的环境声音信号，计算环境声音信号的声级强度，并分析环境声音信号的能量和频谱分布；根据使用场景、环境声音信号的声级强度、以及环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节。

在一种实施方式中，还包括以下步骤：获取用户的地理位置数据；其中根据所述加速度数据和所述地理位置数据来分析用户的使用场景。

根据本申请的第四方面，提出了一种控制音频播放装置的系统，包括：一个或者多个处理器；耦合至一个或者多个处理器中的至少一个处理器的存储器；存储器中存储有计算机程序指令，当由至少一个处理器执行计算机程序指令时，使得系统执行控制音频播放装置的方法，所述方法包括：获取用户的加速度数据，根据加速度数据分析用户的使用场景；获取用户所处环境的环境声音信号，计算环境声音信号的声级强度，并分析环境声音信号的能量和频谱分布；根据使用场景、环境声音信号的声级强度、以及环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节。

根据本申请的第五方面，提出了一种计算机程序产品，当计算机程序产品由处理器执行时，能够实现如本申请的第三方面所述的控制音频播放装置的方法。

本申请提供的以上基于场景识别的自适应音频控制装置和方法，能够分析用户的使用场景，根据使用场景自动调节播放效果。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定。对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的基于场景识别的自适应音频控制装置的框图。

图2示出了本申请又一实施例提供的基于场景识别的自适应音频控制装置的框图。

图3示出了本申请再一实施例提供的基于场景识别的自适应音频控制装置的框图。

图4示出了本申请实施例提供的基于场景识别的自适应音频控制方法的流程图。

具体实施方式

现在将参照附图来详细描述本申请的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本申请及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本申请提出了一种基于场景识别的自适应音频控制装置。该装置可以是耳机、音箱、或其它能够播放音频信号的电子设备。该装置可以和手机、电脑等终端设备进行有线通信或无线通信，以播放终端设备的音频信号。该装置中也可以存储有音频信号，例如音乐，该装置可以播放自身存储的音频信号。该装置也可以设置终端设备的内部，作为终端设备的一部分。

参见图1所示，本申请第一实施例提供的基于场景识别的自适应音频控制装置，包括环境声音采集麦克风13、加速度传感器11、定位模块12、控制模块21、音频信号音量调节模块22、主动降噪模块23、以及环境声音调节模块24。

加速度传感器11，用于采集用户的加速度数据，输出加速度数据至控制模块21。

定位模块12，用于采集用户的地理位置数据，输出地理位置数据至控制模块21。

音频信号经音频信号音量调节模块22进行音量调节后输入至喇叭30进行播放。

环境声音采集麦克风13，用于拾取环境声音信号，将拾取到的环境声音信号分别馈给控制模块21、主动降噪模块23和环境声音调节模块24。主动降噪模块23和环境声音调节模块24的输出端分别与喇叭30连接。

控制模块21分别与音频信号音量调节模块22、主动降噪模块23和环境声音调节模块24连接，以控制三者的工作，例如，控制模块21开启/关闭某个模块或子模块，或调整某个模块或子模块的参数等。

主动降噪模块23，用于针对环境声音信号生成相应的降噪信号，并将降噪信号输出至喇叭30。降噪信号和环境声音信号在用户耳道内互相抵消，以降低外界环境声音对用户聆听音频信号的影响。主动降噪模块24可以有反馈降噪方式、前馈降噪方式、前馈结合反馈的降噪方式。在一个具体的例子中，主动降噪模块23只有在环境声音的声级强度达到60dBA时，才会被开启；主动降噪模块23可以设置有各种降噪等级，例如当环境声音的声级强度分别达到60dBA、70dBA、80dBA、90dBA时，各自对应一个降噪等级，环境声音的声级强度越强，则降噪等级越高。

环境声音调节模块24，用于对环境声音信号进行调节，将调节后的环境声音信号输出至喇叭30。其中，环境声音调节模块24包括下列子模块：风噪抑制子模块241、语音增强子模块242、动态范围控制子模块243、EQ均衡处理子模块244。

风噪抑制子模块241主要用于滤除环境声音信号中的风噪。风噪主要集中在非常低的频率段，一旦检测到比较大的风噪可以设置不同的滤波器来应对，以降低风噪对用户聆听音频信号的影响。在一个具体的例子中，当用户处于室外环境时，可以根据风噪的能量和频谱分布情况，确定是否需要开启风噪抑制子模块241；当用户处于室内环境时，可以关闭风噪抑制子模块241。

语音增强子模块242主要用于对环境声音信号中的语音部分进行增强，抑制、降低噪声干扰，提升语音部分的信噪比，使得用户能够更清晰的听到外界的语音。在一个具体的例子中，当用户处于讲话状态时，语音增强子模块241会被开启。在一个具体的例子中，当用户处于有必要听到外界提示语音的状态，语音增强子模块241会被开启。语音增强子模块242可以对环境声音信号中的语音信号进行增强处理并且对环境噪声进行抑制处理，从而实现语音增强功能。

动态范围控制子模块243主要用于对环境声音信号进行动态范围调整，例如可以对一些脉冲声进行压缩后再馈给耳机，避免在耳机端造成很大的破音。在一个具体的例子中，动态范围控制子模块243在各种情况下均处于开启的状态，以避免猝发声音对用户的惊吓损伤。在另一个具体的例子中，当用户处于室外环境时，动态范围控制子模块243必须开启，当用户处于室内环境中时，由于室内环境中猝发声音相对比较少，动态范围控制子模块243可以关闭。

EQ均衡处理子模块244主要用于对环境声音进行针对不同频带的增强和衰减，以优化环境声音的听感。在一个具体的例子中，如果需要听到部分环境声音，则EQ均衡处理子模块244会被开启以对部分频段的环境声音进行补偿增强。

参见图2所示，为本申请又一实施例提供的基于场景识别的自适应音频控制装置。图2实施例具有图1实施例提供的全部结构和功能，主要区别在于，图2实施例的装置还包括骨传导麦克风14，骨传导麦克风14的输出端与控制模块21连接。

参见图3所示，为本申请再一实施例提供的基于场景识别的自适应音频控制装置。图3实施例具有图1实施例提供的全部结构和功能，主要区别在于，图3实施例的装置还包括朝向用户前方的红外接近传感器15，红外接近传感器15的输出端与控制模块21连接。

图1-3的实施例中，环境声音调节模块24包括下列子模块：风噪抑制子模块241、语音增强子模块242、动态范围控制子模块243、EQ均衡处理子模块244。在其它实施例中，环境声音调节模块24也可以包括上述子模块的任意或组合，或者含有其它子模块。

在一个实施例中，该装置还可能设有由隔声材料构成的被动降噪结构，被动降噪为物理降噪，通过外壳及耳套等对外界噪声传入到耳道内的噪声进行隔离，这种被动的降噪方法对中高频1kHz以上的噪声有比较好的作用。

在一个实施例中，该装置可能还设有手动音量调节装置、手动降噪模式切换装置、手动环境声音调节装置等结构，以提供给用户更多选择方式。

图1-3中的实施例中，环境声音采集麦克风13可以为一个或多个。例如左右耳机分别设置有环境声音采集麦克风。例如只有左耳耳机设置有环境声音采集麦克风。例如只有右耳耳机设置有环境声音采集麦克风。例如设置在耳机外壳的用于采集用户所处的外界环境声音的麦克风。例如设置在耳机内部的、用于采集用户耳廓处所听到环境声音的麦克风。在一个实施例中，环境声音采集麦克风13为多个，包括用于采集用户实时位置外界环境声音的麦克风和用于采集用户耳廓附近所听到的环境声音的麦克风。

在本申请实施例提供的基于场景识别的自适应音频控制装置中，控制模块21包括存储器和处理器，其中所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现以下步骤：

101、分析用户的使用场景。

根据本公开的一些实施例，可以根据加速度传感器输出的加速度数据来分析用户的使用场景。

根据本公开的另一些实施例，在该步骤还可以获取由定位模块12采集的地理位置数据，并利用加速度数据和用户的地理位置数据来共同分析用户的使用场景。

102、计算环境声音采集麦克风13采集的环境声音信号的声级强度，并分析环境声音信号的能量和频谱分布。通过分析环境声音信号的能量和频谱分布可以获得环境声音的组成成分，例如环境声音中是否含有语音成分、警笛等警示音成分、风噪成分等，以及这些成分的能量。

103、根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作。

其中，控制模块21可以根据使用场景自动调整主动降噪模块24的降噪参数以达到不同的降噪等级或效果；或者主动降噪模块23预先设定有多种降噪模式，每种降噪模式对应于不同的降噪参数，控制模块21根据使用场景自动调整主动降噪模块23的降噪模式以达到不同的降噪等级或效果。

控制模块21根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，也就是说，控制模块21综合考虑环境声音信号的声级强度，环境声音的组成成分和各成分的能量，控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，使得音频控制与用户的使用场景相适配，实现根据用户的使用场景、环境声音信号的声级强度、以及环境声音的能量和频谱分布自适应地进行音频控制。

根据本公开的一些实施例，在步骤101中分析用户的使用场景，包括：

1011、根据所述地理位置数据确定用户所处的环境类型。所述环境类型包括室内环境和道路环境。

1012、根据所述地理位置数据计算用户的移动速度，根据所述加速度数据计算用户的步频值。根据所述移动速度和步频值确定用户的运动模式。所述运动模式可以包括下列任一：静止模式、道路行走模式和搭乘交通工具模式。在另一个实施例中，所述运动模式可以包括健身模式，健身模式涵盖跑步、骑行等健身方式。

根据本公开的另一些实施例，可以不获取地理位置数据而仅根据所获取的用户加速度数据来分析用户的使用场景。例如，可以仅根据用户的步频值来确定用户的运动模式。

根据本公开的另一些实施例，可以仅利用地理位置数据计算用户的移动速度，而不利用地理位置数据来获取环境类型。

在上述图2的实施例和图3的实施例中，用户的使用场景还可以包括用户的说话状态，具体来说，控制模块21根据骨传导麦克风14或红外接近传感器15输出的信号确定用户是否处于讲话模式。

<关于使用场景>

本申请实施例中所指的使用场景至少包括用户当前的运动模式，进一步地，还可以包括用户当前所处的环境类型和/或用户的说话状态，即用户是否处于讲话模式。

<环境类型>

1011、控制模块21可以根据所述地理位置数据确定用户所处的环境类型。所述环境类型包括室内环境和道路环境。

定位模块12例如可以包括GPS模块或北斗模块，当用户开启并使用该装置的场景自适应调节播放功能时，定位模块会首先获取用户所处的具体实时位置信息，然后根据具体实时位置信息实时确定用户所处的环境类型。

在其它实施例中，环境类型还可以划分的更为细致，以达到更灵活智能的音频控制效果。例如将室外环境类型划分成道路环境类型和非道路的室外环境类型，非道路的室外环境类型又可以划分为露天贸易餐饮集市区类型、户外公园绿地类型等等。

在一个具体的例子中，环境类型可以划分为以下类型：

环境类型P ₁：市主、次干路交通干线，城际、城市高速公路交通干线，内河航道及两侧区域；

环境类型P ₂：铁路交通干线；

环境类型P ₃：工业生产，仓储物流区；

环境类型P ₄：工商集市餐饮贸易混杂区；

环境类型P ₅：住宅教育医疗科研行政办公区；

环境类型P ₆：户外公园绿地；

环境类型P ₇：康复疗养等区域。

本申请实施例中的环境类型可以划分为“室内”和“室外”，针对“室外”环境类型还可以做进一步细分，例如细分为“室外运动场”、“室外公园绿地”、“室外集市”等环境类型。在本申请实施例中，可以根据用户的选择确定用户当前所处的环境类型。在本申请实施例中，也可以根据上述地理位置数据，结合环境声音信号的能量和频谱分布确定用户的具体运动模式，例如，根据环境声音信号的能量和频谱分布判断出环境声音信号中含有很强的风噪信号，再结合地理位置数据，就可以准确判断出用户处于室外环境。

<运动模式>

1012、控制模块21可以根据所述地理位置数据计算用户的移动速度，根据所述加速度数据计算用户的步频值。根据所述移动速度和步频值确定用户的运动模式。

(a)、如果所述移动速度小于第一速度阈值并且所述步频值小于第一步频值阈值，则用户处于静止模式。

在一个实施例中，可以将第一步频值阈值设置为0.5步/秒，可以将第一速度阈值设置为0.2米/秒，也就是说，如果用户的移动速度小于0.2米/秒并且步频值小于为0.5步/秒，则该用户处于静止模式。

(b)、如果所述移动速度在行走速度区间内并且所述步频值在行走步频值区间内，则用户处于行走模式。

人正常行走的速度区间为1米/秒-1.7米/秒，正常行走的步频值的区间为1.0步/秒-2.5步/秒。在一个实施例中，可以将行走步频值区间设置为1.0步/秒-2.5步/秒。

(c)、如果所述移动速度大于第二速度阈值，则用户处于搭乘交通工具模式。

通常汽车、轮船、铁路等交通工具的运行速度大于30km/h。在一个实施例中，可以将第二速度阈值设置为30km/h。例如，如果监测到用户的移动速度约为60km/h，则可以判断用户处于搭乘交通工具中。

在其它实施例中，还可以将移动速度和步频值的区间做更详细的划分，以详细判断用户的运动状态。

在其它实施例中，用户的运动模式还可以划分的更为细致，例如还可以划分为静止模式、散步模式、快速行走模式、跑步模式、骑行模式等等。

在一个实施例中，如果用户的步频值在2.5步/秒-5步/秒的区间内，则判断用户处于跑步模式。

本申请实施例中的运动模式可以划分为“运动”和“非运动”，针对“运功”模式还可以做进一步细分，例如细分为“跑步”、“游泳”、“骑行”等运动模式。在本申请实施例中，可以根据用户的选择或者相关传感器的输出来确定用户的具体运动模式。

容易理解，在一些实施例中，可以不获取地理位置数据而仅根据所获取的用户加速度数据来分析用户的运动模式。例如，可以仅根据用户的步频值来确定用户的运动模式。

<说话状态>

在一个实施例中，控制模块21可以根据前述骨传导麦克风14对语音信号的拾取情况来判断用户是否处于讲话状态。

在另一个实施例中，控制模块21可以根据前述红外接近传感器15输出的信号判断用户前方一定距离范围内是否有其他人，如果有人，则判定用户处于讲话状态。或者，如果有人，可以进一步结合前述环境类型和运动模式的判断情况，综合判定用户是否处于讲话状态，例如，用户处于露天餐饮。

根据本公开的一个实施例，本申请实施例中所指的“使用场景”指的是复合场景，“使用场景”至少包括用户所处的环境类型和用户当前的运动模式，进一步还可以包括用户的说话状态。例如，用户所处的环境类型为“室外”，运动模式为“运动”，则用户的“使用场景”为“室外运动”。例如，用户所处的环境类型为“室内”，运动模式为“运动”，则用户的“使用场景”为“室内运动”。例如，用户所处的环境类型为“室内”，运动模式为“静止”，说话状态为“处于讲话模式”，则用户的“使用场景”为“室内静止交谈”。

根据本公开的另一个实施例，容易理解的是，可以仅根据加速度数据来估计用户的使用场景。例如，如果用户的步频值在2.5步/秒-5步/秒的区间内，则判断用户处于跑步模式，且处于道路环境。

<基于场景识别的自适应音频控制>

控制模块21确定用户的使用场景后，根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作。其中，这里的环境声音信号的声级强度例如可以使用等效连续A声级。

在一个实施例中，使用场景包括用户当前所处的环境类型和用户当前的运动模式，可通过定义一个函数Action(t)来描述某时刻用户可能所处的使用场景，以及环境声音信号的声级强度、以及所述环境声音的能量和频谱分布：

Action(t)＝(P(t),M(t),L(t),F(t))------函数1

其中，t为时间，P(t)表示当前时刻用户所处的环境类型，M(t)表示当前时刻用户的运动模式，L(t)表示环境声音信号的声级强度或者环境声音的声级强度所属的区间，F(t)表示环境声音信号的能量频谱分布情况。

通过定义函数F(t)来描述用户某时所在位置的20～20kHz环境声音的能量和频谱分布情况。

F(t)又包含F ₀(t)和Q(t)，其中，F ₀(t)用于表示当前时刻的最大噪声峰值对应的频点，Q(t)用于表示当前时刻环境声音的品质因数。

一般来说，Q值越大，说明环境声音能量分布越集中且频率较为单一，此时对应为噪声环境中的非稳态噪声或突发的脉冲噪音，即响度较大的鸣笛声、敲击、碰撞等猝发声。Q值越小，环境声音在各频段分布相对较宽泛，且该频段内噪声能量分布较均匀，此时对应的噪声环境为相对稳定的稳态噪音，例如某一用餐时段的餐厅环境，多为交谈或餐具轻碰的背景噪声，且F ₀多在200Hz～300Hz之间。

在另一个实施例中，上述函数1也可以调整为

Action(t)＝(P(t),V(t),f(t),L(t),F(t))------函数2

其中，V(t)表示当前时刻用户的移动速度或者移动速度所属的区间，f(t)表示当前时刻用户的步频值或者步频值所属的区间。

在另一实施例中，使用场景包括用户的说话状态，因此函数Action(t)为：

Action(t)＝(P(t),M(t),L(t),F(t),S(t))------函数3

其中，S(t)用于表示用户当前是否处于讲话模式。

控制模块21根据查询或接收到的各传感器模块(不限于环境声音采集麦克风13、加速度传感器11、定位模块12、骨传导麦克风14/红外接近传感器15等)的实时数值，依据阈值进行判定用户的使用场景和环境声级，获取环境声的能量频谱分布情况，也就是得到P(t)，M(t)，L(t)，F(t)和S(t)。

控制模块21会对Action(t)函数进行实时查询，根据Action(t)的各项变量自动生成控制指令，将对应指令分别发送到音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24，使得各模块做出与当下场景和环境声音信号相匹配的响应，即实现自动调节播放效果以适应当前的播放环境。

同理，在另一个实施例中，上述函数3也可以调整为

Action(t)＝(P(t),V(t),f(t),L(t),F(t),S(t))------函数4。

环境声音信号的声级强度所属的区间可以包括以下区间：

(1)0dBA～40dBA为第一声级强度区间，表示非常安静环境。

(2)40dBA～60dBA为第二声级强度区间，表示相对安静环境。

(3)60dBA～80dBA为第三声级强度区间，表示相对聒噪的环境。

(4)80dBA～120dBA为第四声级强度区间，表示难以忍受的噪声环境。

环境声音信号的声级强度所属的区间也可以根据实际应用加以细分，并不完全局限于此定义。

用户移动速度所属的区间，例如可以包括：

(1)0～0.2米/秒为第一移动速度区间，表示静止。

(2)0.2米/秒～1.7米/秒为第二移动速度区间，表示步行。

(3)500km/h以上为第三移动速度区间，表示飞行。

用户移动速度的区间可以划分的更为细致，辅助步频值、用户所处的环境类型帮助控制模块21精确判断用户的使用场景。

通常情况下人的步频最快不超过5步/秒，而最慢不低于0.5步/秒，因此用户步频值的区间可以包括以下区间：

(1)0步/秒～0.5步/秒为第一步频值区间，表示静止。

(2)0.5步/秒～2.5步/秒为第二步频值区间，表示行走。

(3)2.5步/秒～5步/秒为第三步频值区间，表示跑步。

步频值所属的区间也可以根据实际应用加以细分，不完全局限于此定义。

需要说明的是，虽然上述区间划分的时候考虑了“静止”、“步行”、“跑步”、“飞行”等情况，但是用户的运动模式(包括所使用的交通工具)可以根据用户所处的具体环境类型、用户的移动速度的区间和步频值的区间来综合确定，如果进一步结合环境声音的能量和频谱分布情况，还可以确定的更为精确。

另外，上述函数也说明，本申请实施例可以对用户的地理位置数据、移动速度、步频值、环境声音信号的声级强度、以及环境声音的能量和频谱分布进行综合分析，从而实现根据使用场景自动调节播放效果。

下面用几个具体的例子说明本申请实施例的自适应音频装置在几种场景下的工作过程：

<第一使用场景>

第一使用场景为用户处于道路环境并且处于行走模式。容易理解，在该使用场景中，可以仅通过所获取的加速度数据来估计用户的运动模式，并进而估计用户的使用场景。例如，如果加速度数据显示当前用户的步频值位于0.5步/秒～2.5步/秒的区间之内，则判断用户处于道路环境下的行走模式。在第一使用场景下，环境声音多为道路的交通噪声和不同强度的风噪等环境低频噪声，环境声音信号的F ₀常会在100Hz附近，且Q值相对较小，即低频段噪声相对分布较为宽泛。而声级强度会因不同时段的交通状况不同而不同。

在第一使用场景下，控制模块21根据该使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制所述音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

控制风噪抑制子模块241对环境声音信号中的风噪信号进行抑制性滤波。风噪抑制子模块241可以例如为截止频率f ₀＝300Hz的二阶高通滤波器。

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块242对环境声音信号中的语音信号进行增强处理。也就是说，在第一使用场景下，语音增强子模块242处于待机状态，可被控制模块21实时检测到的语音信号唤醒。

控制动态范围控制子模块243根据所述环境声音信号的声级强度对环境声音信号进行动态范围调整。在一个实施例中：当所述环境声音信号的声级强度≤40dBA时，判断外界环境为安静环境，环境声音基本不包含有用信息，对环境声音信号进行轻微放大处理；当40dBA＜所述环境声音信号的声级强度≤50dBA时，对环境声音信号进行选择性放大处理；当 50dBA＜所述环境声音信号的声级强度≤60dBA时，对环境声音信号做放大、缩小处理；当所述环境声音信号的声级强度＞60dBA时，判断为比较嘈杂的环境，对环境声音信号进行衰减处理。通过动态范围控制，使用户行进过程中既能保证可以随意欣赏音乐又能对外界环境保持一定的监控和感知能力。需要说明的是，这里对环境声音信号的声级强度的区间的划分(≤40dBA、40dBA～50dBA、50dBA～60dBA，＞60dBA)，只是一个示例；可以根据实际情况，调整区间的划分情况。

控制EQ均衡处理子模块244对环境声音信号进行EQ补偿处理，输出到喇叭30进行播放。例如，对环境声音信号中的语音信号频带和鸣笛信号频段进行EQ补偿处理。

根据所述环境声音信号的声级强度确定是否开启主动降噪模块23，以及如果开启主动降噪模块23，根据所述环境声音信号的声级强度自动调整主动降噪模块23的降噪等级。所述环境声音信号的声级强度越强，则主动降噪模块23的降噪等级越高，主动降噪的程度越大。此外，在风噪强度比较大的情况下，可以增加反馈降噪的作用而适当降低前馈降噪在低频段的作用。主动降噪模块23生成的降噪信号输出到喇叭30。

在一个实施例中，控制模块21可以根据环境声音的能量和频谱分布分析出环境声音信号中是否存在某种警音提示声。例如，环境声音采集麦克风(13)在t到t ₁时刻拾取到的环境噪声，经频域分析，在此段时间内间断或连续出现了频率在500Hz-1500Hz之间、品质因数Q远大于1的脉冲信号，且能量平均高于前一时段10dB，则判断环境声音信号中存在需要用户注意的某种警示音。如果环境声音信号中存在某种警音提示声，则控制模块21控制主动降噪模块23对环境声音信号中除警音提示声以外的部分进行主动降噪，并且控制动态范围控制子模块243对环境声音信号的警音提示声进行放大处理，以保证用户的安全性和警觉性。

根据到达喇叭30处的环境声音信号的声级强度控制音频信号音量调节模块22的工作参数，使得到达喇叭30处的音频信号和到达喇叭30处的环境声音信号的声级强度保持预设的比例。当环境声音的声级强度变大时可以自动控制音频信号音量变大，即当外界比较嘈杂时，加大音频信号的音量。反之，当环境声音的声级强度变小时可以自动控制音频信号音量变小，即当外界环境比较安静时，降低音频信号的音量以保护用户的听力。

<第二使用场景>

第二使用场景为用户处于道路环境并且处于搭乘交通工具模式，则控制模块21根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块242对环境声音信号中的语音信号进行增强处理以及触发EQ均衡处理子模块244对环境声音信号中的语音信号频带进行EQ补偿处理。也就是说，在第二使用场景下，语音增强子模块242和EQ均衡处理子模块244处于待机状态，可被控制模块21实时检测到的语音信号唤醒。

控制主动降噪模块23按照最强降噪等级对环境声音信号进行主动降噪处理。或者，控制主动降噪模块23根据所述环境声音信号的声级强度确定是否开启主动降噪模块23，以及如果开启主动降噪模块23，根据环境声音信号的声级强度调整主动降噪模块23的降噪等级。

在一个例子中，当用户处于道路环境并且处于搭乘交通工具模式时，控制风噪抑制子模块(241)关闭。

在一个例子中，当用户处于道路环境并且处于搭乘交通工具模式时，监测环境声音信号的声级强度是否大于预设的声级强度上限或者小于预设的声级强度下限，如果环境声音信号的声级强度大于预设的声级强度上限，则触发动态范围控制子模块(243)对环境声音信号进行衰减处理，如果环境声音信号的声级强度小于预设的声级强度下限，则触发动态范围控制子模块(243)对环境声音信号进行放大处理。所述声级强度上限例如为60dBA，所述声级强度下限例如为40dBA。

在一个例子中，当确定用户处于搭乘交通工具模式时，可以进一步确定用户搭乘何种交通工具。例如根据环境类型、地理位置数据中的高度数据、移动速度、步频值，可以确定用户处于骑行自行车、搭乘飞机、搭乘铁路、或是搭乘汽车等模式。例如，用户的移动速度达到250km/h并且用户处于铁路干线上，则可确定用户处于搭乘高铁模式。

控制模块21可以根据细分的交通工具对应的环境声音的特点，比如搭乘汽车时喇叭鸣笛声会比较多，高铁车厢中相对比较安静等特点，设置主动降噪模块23、环境声音调节模块24的具体调控方式，例如设置主动降噪模块23在用户搭乘高铁时的降噪等级为较低等级。

在一个例子中，当确定用户处于搭乘交通工具模式时，也可以根据环境声音信号的声级强度和环境声音的能量和频谱分布特点确定用户搭乘何种交通工具。使得控制模块21可以根据细分的交通工具对应的环境声音的特点，设置主动降噪模块23、环境声音调节模块24的具体调控方式。

在第一使用场景和第二使用场景下，用户可能与同伴交谈，也可能会有外界语音提醒，例如危险语音提醒或者第二使用场景下的车辆到站提醒，因此，在这两种使用场景下，语音增强子模块242可以被实时检测到的环境声音信号中的语音信号触发工作。

<第三使用场景>

第三使用场景为用户处于室内环境(例如，住宅教育医疗科研行政办公或餐饮贸易商业等室内区域)并且处于静止模式和讲话模式，则控制模块21根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

控制语音增强子模块242对环境声音信号中的语音信号进行增强处理。

控制EQ均衡处理子模块244对环境声音信号中的语音信号频带进行EQ补偿处理，输出到喇叭30进行播放。

控制风噪抑制子模块241和动态范围控制子模块243关闭。

控制主动降噪模块23关闭或者对环境声音信号进行主动降噪处理。

控制音频信号音量调节模块22调低音量或者暂停播放音频信号。

本申请实施例的自适应音频控制装置，可以具有多个环境声音采集麦克风13，包括设置在耳机外壳的用于采集用户所处的外界环境声音的麦克风和设置在耳机内部的用于采集用户耳廓处所听到环境声音的麦克风。多麦克风设置方式，能够更加准确地采集环境声音，并且能够体现用户耳廓处所听到环境声音的情况，可以用于主动降噪功能，有利于对环境声源的定位和调节语音与环境声音的比例，对降噪量进行更好的优化，有利于更智能的自适应音频控制。

在其它实施例中，控制模块21还可以分析环境声音采集麦克风13采集的环境声音信号，得到环境声音信号的声级强度、能量和频谱分布情况，结合加速度传感器、定位模块、其他传感器获取的数据，实现更加丰富的场景分析，以便于对音量调节模块22、主动降噪模块23、环境声音调节模块24进行更细腻的控制，提供给用户更好的体验效果。

对于本领域技术人员来说，可以通过硬件方式、软件方式或软硬件结合的方式实现前述基于场景识别的自适应音频控制装置。基于同一发明构思，参见图4所示，说明本申请实施例提供的基于场景识别的自适应音频控制方法，包括以下步骤：

401、分析用户的使用场景；

具体而言，步骤401中，可以获取用户的加速度数据，根据所述加速度数据分析用户的使用场景。容易理解，还可以获取用户的地理位置数据，并根据加速度数据和地理位置数据来分析用户的使用场景。

402、采集用户所处环境的环境声音信号，计算所述环境声音信号的声级强度，并分析所述环境声音信号的能量和频谱分布；

403、根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频播放装置的音频信号音量调节模块、主动降噪模块、和环境声音调节模块的工作。

在一种实施方式中，所述音频播放装置为耳机。

在另一种实施方式中，环境声音调节模块24包括下列子模块的任一或组合：风噪抑制子模块241、语音增强子模块242、动态范围控制子模块243、EQ均衡处理子模块244。

在另一种实施方式中，步骤401、分析用户的使用场景，包括：根据所述地理位置数据确定用户所处的环境类型；根据所述地理位置数据计算用户的移动速度；根据所述加速度数据计算用户的步频值；根据所述移动速度和步频值确定用户的运动模式。

在另一种实施方式中，所述环境类型包括室内环境和道路环境；所述运动模式包括下列任一：静止模式、道路行走模式和搭乘交通工具模式。

在另一种实施方式中，如果所述移动速度小于第一速度阈值并且所述步频值小于第一步频值阈值，则用户处于静止模式；如果所述移动速度在行走速度区间内并且所述步频值在行走步频值区间内，则用户处于行走模式；如果所述移动速度大于第二速度阈值，则用户处于搭乘交通工具模式。

在另一种实施方式中，所述音频播放装置还包括骨传导麦克风或红外接近传感器，用户的使用场景还包括用户的说话状态，所述方法包括以下步骤：根据所述骨传导麦克风或红外接近传感器输出的信号确定用户是否处于讲话模式。

在另一种实施方式中，所述采集用户所处环境的环境声音信号包括采集用户实时位置外界环境声音信号和采集用户耳廓附近所听到的环境声音信号。

<第一使用场景>

如果所述使用场景为用户处于道路环境并且处于行走模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

控制风噪抑制子模块241对环境声音信号中的风噪信号进行抑制性滤波；

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块242对环境声音信号中的语音信号进行增强处理；

控制动态范围控制子模块243根据所述环境声音信号的声级强度对环境声音信号进行动态范围调整；

控制EQ均衡处理子模块244对环境声音信号进行EQ补偿处理；

根据到达音频播放装置的喇叭处的环境声音信号的声级强度控制音频信号音量调节模块22的工作参数，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例。

在一种实施方式中，所述控制动态范围控制子模块243根据所述环境声音信号的声级强度对环境声音信号进行动态范围调整，包括：当40dBA＜所述环境声音信号的声级强度≤50dBA时，对环境声音信号进行放大处理；当所述环境声音信号的声级强度＞60dBA时，对环境声音信号进行衰减处理。

在另一种实施方式中，所述对环境声音信号进行EQ补偿处理，包括对环境声音信号中的语音信号频带和鸣笛信号频段进行EQ补偿处理。

在另一种实施方式中，根据所述环境声音信号的声级强度确定是否开启所述主动降噪模块23，以及如果开启主动降噪模块23，根据所述环境声音信号的声级强度调整主动降噪模块23的降噪等级。

<第二使用场景>

如果所述使用场景为用户处于道路环境并且处于搭乘交通工具模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

监测环境声音信号中是否含有语音信号，如果含有语音信号，则触发语音增强子模块242对环境声音信号中的语音信号进行增强处理以及触发EQ均衡处理子模块244对环境声音信号中的语音信号频带进行EQ补偿处理；

控制主动降噪模块23按照最强降噪等级进行主动降噪处理；或者，根据所述环境声音信号的声级强度确定是否开启主动降噪模块23，以及如果开启主动降噪模块23，根据所述环境声音信号的声级强度调整主动降噪模块23的降噪等级；

在一种实施方式中，当用户处于道路环境并且处于搭乘交通工具模式时，控制风噪抑制子模块241关闭。

在另一种实施方式中，当用户处于道路环境并且处于搭乘交通工具模式时，监测环境声音信号的声级强度是否大于预设的声级强度上限或者小于预设的声级强度下限，如果环境声音信号的声级强度大于预设的声级强度上限，则触发动态范围控制子模块(243)对环境声音信号进行衰减处理，如果环境声音信号的声级强度小于预设的声级强度下限，则触发动态范围控制子模块(243)对环境声音信号进行放大处理。

<第三使用场景>

如果所述使用场景为用户处于室内环境并且处于静止模式和讲话模式，则所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音的能量和频谱分布控制音频信号音量调节模块22、主动降噪模块23、环境声音调节模块24的工作，包括：

控制语音增强子模块242对环境声音信号中的语音信号进行增强处理；

控制EQ均衡处理子模块244对环境声音信号中的语音信号频带进行EQ补偿处理；

控制主动降噪模块23关闭或者对环境声音信号进行主动降噪处理；

在一种实施方式中，控制风噪抑制子模块241和动态范围控制子模块243关闭。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。但本领域技术人员应当清楚的是，上述各实施例可以根据需要单独使用或者相互结合使用。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的模块可以是或者也可是不是物理上分开的。

另外，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的装置来实现，或者可以用专用硬件与计算机指令的组合来实现。

本申请实施例所提供的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

虽然已经通过例子对本申请的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上例子仅是为了进行说明，而不是为了限制本申请的范围。本领域的技术人员应该理解，可在不脱离本申请的范围的情况下，对以上实施例进行修改。本申请的范围由所附权利要求来限定。

Claims

一种控制音频播放装置的方法，其特征在于，包括以下步骤：

获取用户的加速度数据，根据所述加速度数据分析用户的使用场景；

获取用户所处环境的环境声音信号，计算所述环境声音信号的声级强度，并分析所述环境声音信号的能量和频谱分布；

根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节。
根据权利要求1所述的方法，还包括：

获取用户的地理位置数据；其中

根据所述加速度数据和所述地理位置数据来分析用户的使用场景。
根据权利要求2所述的方法，其特征在于，所述对所述环境声音信号的调节包括下列任一操作或其组合：风噪抑制、语音增强、动态范围调整、EQ均衡处理。
根据权利要求3所述的方法，其特征在于，所述根据所述加速度数据和地理位置数据分析用户的使用场景，包括：

根据所述地理位置数据确定用户所处的环境类型；

根据所述地理位置数据计算用户的移动速度；

根据所述加速度数据计算用户的步频值；

根据所述移动速度和步频值确定用户的运动模式。
根据权利要求4所述的方法，其特征在于，所述环境类型包括室内环境和道路环境；所述运动模式包括下列任一：静止模式、行走模式和搭乘交通工具模式。
根据权利要求5所述的方法，其特征在于，所述方法还包括：确定用户是否处于讲话模式。
根据权利要求1所述的方法，其特征在于，所述获取用户所处环境的环境声音信号包括获取用户实时位置外界环境声音信号和获取用户耳廓附近所听到的环境声音信号。
根据权利要求5所述的方法，其特征在于，如果所述使用场景为用户处于道路环境并且处于行走模式，所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节，包括以下一项或多项：

对所述环境声音信号中的风噪信号进行抑制性滤波；

监测所述环境声音信号中是否含有语音信号，如果含有语音信号，则对所述环境声音信号中的语音信号进行增强处理；

根据所述环境声音信号的声级强度对所述环境声音信号进行动态范围调整；

对所述环境声音信号进行EQ补偿处理；

根据到达所述音频播放装置的喇叭处的环境声音信号的声级强度来控制音频播放装置的音频信号音量，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例；以及

根据所述环境声音信号的声级强度确定是否执行主动降噪，以及如果执行主动降噪，根据所述环境声音信号的声级强度调整主动降噪的降噪等级。
根据权利要求5所述的方法，其特征在于，如果所述使用场景为用户处于道路环境并且处于搭乘交通工具模式，则根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节，包括以下一项或多项：

监测所述环境声音信号中是否含有语音信号，如果含有语音信号，则对所述环境声音信号中的语音信号进行增强处理，以及对所述环境声音信号中的语音信号频带进行EQ补偿处理；

设置主动降噪等级为最强降噪等级或者根据所述环境声音信号的声级强度确定是否执行主动降噪，以及如果执行主动降噪，根据所述环境声音信号的声级强度调整主动降噪的降噪等级；

根据到达所述音频播放装置的喇叭处的环境声音信号的声级强度来控制音频播放装置的音频信号音量，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例；

不执行风噪抑制；以及

监测所述环境声音信号的声级强度是否大于预设的声级强度上限或者小于预设的声级强度下限，如果所述环境声音信号的声级强度大于预设的声级强度上限，则对所述环境声音信号进行衰减处理，如果所述环境声音信号的声级强度小于预设的声级强度下限，则对所述环境声音信号进行放大处理。
根据权利要求5所述的方法，其特征在于，如果所述使用场景为用户处于室内环境并且处于静止模式和讲话模式，则根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节，包括以下一项或多项：

对所述环境声音信号中的语音信号进行增强处理；

对所述环境声音信号中的语音信号频带进行EQ补偿处理；

不执行主动降噪或者对所述环境声音信号进行主动降噪处理；

调低音频信号音量或者暂停播放音频信号；以及

不执行风噪抑制和动态范围调整。
一种控制音频播放装置的系统，其特征在于，包括：

一个或者多个处理器；

耦合至所述一个或者多个处理器中的至少一个处理器的存储器；

所述存储器中存储有计算机程序指令，当由所述至少一个处理器执行所述计算机程序指令时，使得所述系统执行控制音频播放装置的方法，所述方法包括：

获取用户的加速度数据，根据所述加速度数据分析用户的使用场景；

获取用户所处环境的环境声音信号，计算所述环境声音信号的声级强度，并分析所述环境声音信号的能量和频谱分布；

根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节。
根据权利要求11所述的系统，其特征在于，所述当由所述至少一个处理器执行所述计算机程序指令时，使得所述系统执行控制音频播放装置的方法，还包括：

获取用户的地理位置数据；其中

根据所述加速度数据和所述地理位置数据来分析用户的使用场景。
根据权利要求12所述的系统，其特征在于，所述对所述环境声音信号的调节包括下列任一操作或其组合：风噪抑制、语音增强、动态范围调整、EQ均衡处理。
根据权利要求13所述的系统，其特征在于，所述至少一个处理器在执行所述根据所述加速度数据和地理位置数据分析用户的使用场景的指令时，执行以下操作：

根据所述地理位置数据确定用户所处的环境类型；

根据所述地理位置数据计算用户的移动速度；

根据所述加速度数据计算用户的步频值；

根据所述移动速度和步频值确定用户的运动模式。
根据权利要求14所述的系统，其特征在于，所述环境类型包括室内环境和道路环境；所述运动模式包括下列任一：静止模式、行走模式和搭乘交通工具模式。
根据权利要求15所述的系统，其特征在于，所述当由所述至少一个处理器执行所述计算机程序指令时，使得所述系统执行控制音频播放装置的方法，还包括：确定用户是否处于讲话模式。
根据权利要求11所述的系统，其特征在于，所述至少一个处理器在执行所述获取用户所处环境的环境声音信号的指令时，执行以下操作：

获取用户实时位置外界环境声音信号和获取用户耳廓附近所听到的环境声音信号。
根据权利要求15所述的系统，其特征在于，如果所述使用场景为用户处于道路环境并且处于行走模式，所述至少一个处理器在执行所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节的指令时，执行以下一项或多项：

对所述环境声音信号中的风噪信号进行抑制性滤波；

监测所述环境声音信号中是否含有语音信号，如果含有语音信号，则对所述环境声音信号中的语音信号进行增强处理；

根据所述环境声音信号的声级强度对所述环境声音信号进行动态范围调整；

对所述环境声音信号进行EQ补偿处理；

根据到达所述音频播放装置的喇叭处的环境声音信号的声级强度来控制音频播放装置的音频信号音量，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例；以及

根据所述环境声音信号的声级强度确定是否执行主动降噪，以及如果执行主动降噪，根据所述环境声音信号的声级强度调整主动降噪的降噪等级。
根据权利要求15所述的系统，其特征在于，如果所述使用场景为用户处于道路环境并且处于搭乘交通工具模式，则所述至少一个处理器在执行所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节的指令时，执行以下一项或多项：

监测所述环境声音信号中是否含有语音信号，如果含有语音信号，则对所述环境声音信号中的语音信号进行增强处理，以及对所述环境声音信号中的语音信号频带进行EQ补偿处理；

设置主动降噪等级为最强降噪等级或者根据所述环境声音信号的声级强度确定是否执行主动降噪，以及如果执行主动降噪，根据所述环境声音信号的声级强度调整主动降噪的降噪等级；

根据到达所述音频播放装置的喇叭处的环境声音信号的声级强度来控制音频播放装置的音频信号音量，使得到达喇叭处的音频信号和到达喇叭处的环境声音信号的声级强度保持预设的比例；

不执行风噪抑制；以及

监测所述环境声音信号的声级强度是否大于预设的声级强度上限或者小于预设的声级强度下限，如果所述环境声音信号的声级强度大于预设的声级强度上限，则对所述环境声音信号进行衰减处理，如果所述环境声音信号的声级强度小于预设的声级强度下限，则对所述环境声音信号进行放大处理。
根据权利要求15所述的系统，其特征在于，如果所述使用场景为用户处于室内环境并且处于静止模式和讲话模式，则所述至少一个处理器在执行所述根据所述使用场景、所述环境声音信号的声级强度、以及所述环境声音信号的能量和频谱分布来控制音频播放装置的音频信号音量、主动降噪等级和对所述环境声音信号的调节的指令时，执行以下一项或多项：

对所述环境声音信号中的语音信号进行增强处理；

对所述环境声音信号中的语音信号频带进行EQ补偿处理；

不执行主动降噪或者对所述环境声音信号进行主动降噪处理；

调低音频信号音量或者暂停播放音频信号；以及

不执行风噪抑制和动态范围调整。
一种计算机程序产品，当所述计算机程序产品由处理器执行时，能够实现如权利要求1-10中任一项所述的控制音频播放装置的方法。