CN109819375A

CN109819375A - 调节音量的方法与装置、存储介质、电子设备

Info

Publication number: CN109819375A
Application number: CN201910025579.XA
Authority: CN
Inventors: 谢柳
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-01-11
Filing date: 2019-01-11
Publication date: 2019-05-28

Abstract

本公开属于信号处理技术领域，涉及一种调节音量的方法及装置、计算机可读存储介质、电子设备。该方法包括：通过智能音频设备中的声音采集装置获取智能音频设备所处环境的背景音；对背景音进行傅里叶变换处理以得到背景音的强度信息；将强度信息输入至预先训练的机器学习模型中，以得到目标音量；根据目标音量调节智能音频设备的音量。本公开根据背景音对目标音量进行确定，能够及时根据外界环境的变化计算合理的音量大小，无需用户频繁的手动操作，进一步地，设置一预设音量，控制不会出现音量过大的情况，保证双耳健康；并且，通过机器学习模型对环境种类进行确定，确保了目标音量的准确性和针对性，给用户带来更为极致的听觉享受。

Description

调节音量的方法与装置、存储介质、电子设备

技术领域

本公开涉及信号处理技术领域，尤其涉及一种调节音量的方法、调节音量的装置、计算机可读存储介质及电子设备。

背景技术

近年来，随着电子技术的快速发展，智能音频设备已经在日常生活中广泛应用。使用智能音频设备可以随时随地播放音乐等，已经成为人们长时间佩戴的可穿戴设备。并且，由于电脑和手机等电子设备的不断普及，作为重要配件的耳机的使用时间越来越长。因为耳机放出的声音直接传入人耳，若播放音量不合适，不仅会影响用户的使用效果，甚至还会造成用户产生耳鸣及听力下降等症状。

目前市面上的耳机，若是要对音量进行调整，通常需要调节耳机连接线上的按钮，或者是在电子设备上直接进行调节。比如，当用户从一个安静的环境进入到嘈杂的环境时，原本的耳机音量会受到周围环境的影响，无法听清楚播放的内容，则需要手动调整到合适的音量。不仅调节过程极其费时，不易掌控，而且还增加了用户操作，影响了用户体验。

鉴于此，本领域亟需开发一种新的调节音量的方法及装置。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供调节音量的方法、调节音量的装置、计算机可读存储介质及电子设备，进而至少在一定程度上克服由于相关技术的限制而导致的耳机音量受环境影响带来的收听障碍及手动调节音量的操作繁复等问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，提供一种调节音量的方法，其特征在于，包括：通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音；对所述背景音进行傅里叶变换处理以得到所述背景音的强度信息；将所述强度信息输入至预先训练的机器学习模型中，以得到目标音量；根据所述目标音量调节所述智能音频设备的音量。

在本公开的一种示例性实施例中，所述通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音，包括：通过所述智能音频设备中的声音采集装置采集所述智能音频设备所处环境的环境音，所述环境音包括用户声音和背景音；从所述环境音中分离所述用户声音，以得到所述背景音。

在本公开的一种示例性实施例中，所述将强度信息输入至预先训练的机器学习模型中，以得到目标音量，包括：将所述强度信息输入至预先训练的机器学习模型中，以输出备选音量；将备选音量与预设音量进行比较；若所述备选音量小于所述预设音量，则将所述备选音量作为所述目标音量；若所述备选音量大于或等于所述预设音量，则将所述预设音量作为所述目标音量。

在本公开的一种示例性实施例中，所述将强度信息输入至预先训练的机器学习模型中，以输出备选音量，包括：将所述背景音输入至机器学习模型中，以使所述机器学习模型输出与所述背景音对应的环境种类，其中，所述机器学习模型是基于背景音样本和环境种类样本训练形成的；根据预设的环境种类与音量调节系数的映射关系，确定出与所述环境种类对应的音量调节系数；根据所述音量调节系数和所述强度信息确定所述备选音量。

在本公开的一种示例性实施例中，所述将强度信息输入至预先训练的机器学习模型中，以输出备选音量，包括：将所述背景音输入至机器学习模型中，以使所述机器学习模型输出与所述背景音对应的环境种类，其中，所述机器学习模型是基于背景音样本和环境种类样本训练形成的；根据预设的环境种类与音量调节系数的映射关系，确定出与所述环境种类对应的音量调节系数；根据所述音量调节系数、所述强度信息和一预设常数确定所述备选音量。

在本公开的一种示例性实施例中，在将所述背景音输入至一机器学习模型中之前，所述方法还包括：获取所述背景音样本和与背景音样本对应的所述环境种类样本；将所述背景音样本输入至一待训练机器学习模型，以获取所述待训练机器学习模型输出的与所述背景音样本对应的目标环境种类；将所述目标环境种类和与所述背景音样本对应的环境种类样本进行匹配；若所述目标环境种类与所述环境种类样本不匹配，则对所述机器学习模型的参数进行调整，以使所述目标环境种类与所述环境种类样本相同。

在本公开的一种示例性实施例中，所述从所述环境音中分离所述用户声音，以得到所述背景音，包括：通过小波变换算法对所述环境音进行预消噪处理以得到第一声音；对所述第一声音进行去均值处理以得到第二声音；对所述第二声音进行预白化处理以得到第三声音；通过对所述第三声音进行独立分量分析处理，以得到所述背景音。

根据本公开的第二方面，提供一种调节音量的装置，其特征在于，包括：获取模块，被配置为通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音；处理模块，被配置为对所述背景音进行傅里叶变换处理以得到所述背景音的强度信息；确定模块，被配置将强度信息输入至预先训练的机器学习模型中，以得到目标音量；调节模块，被配置为根据所述目标音量调节所述智能音频设备的音量。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述任意示例性实施例中的调节音量的方法。

根据本公开的第四方面，提供一种电子设备，其特征在于，包括：处理器和存储器；其中，存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现上述任意示例性实施例的调节音量的方法。

由上述技术方案可知，本公开示例性实施例中的调节音量的方法、调节音量的装置、计算机存储介质及电子设备至少具备以下优点和积极效果：

本公开的示例性实施例提供的方法，一方面通过智能音频设备中的声音采集装置获取所处环境的背景音，并根据背景音的强度信息确定智能音频设备的目标音量，能够及时根据外界环境的变化计算合理的音量大小，无需用户频繁的手动操作，提升了用户体验；另一方面，根据预设音量，调整目标音量，控制目标音量不会出现音量过大的情况，以保证双耳健康；再一方面，通过机器学习模型对背景音对应的环境种类进行确定，确保了不同环境中确定目标音量的准确性和针对性，给用户带来更为极致的听觉享受。

本公开应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性示出本公开示例性实施例中一种调节音量的方法的流程图；

图2示意性示出本公开实施例中获取智能音频设备所处环境的背景音的流程示意图；

图3示意性示出本公开实施例中通过对环境音与用户声音的分离得到背景音的流程示意图；

图4示意性示出本公开实施例中根据强度信息获取目标音量的流程示意图；

图5示意性示出本公开实施例中根据强度信息确定备选音量的流程示意图；

图6示意性示出本公开实施例中根据背景音样本和环境种类样本训练机器学习模型的流程示意图；

图7示意性示出本公开实施例中根据强度信息确定备选音量的流程示意图；

图8示意性示出本公开实施例中一种调节音量的装置的结构示意图；

图9示意性示出本公开示例性实施例中一种用于调节音量的方法的计算机可读存储介质；

图10示意性示出本公开示例性实施例中一种调节音量的方法的电子设备。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等；用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等；用语“第一”和“第二”等仅作为标记使用，不是对其对象的数量限制。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。

针对相关技术中存在的问题，本公开提出了一种调节音量的方法，图1示出了调节音量的方法的流程图，如图1所示，调节音量的方法主要可以包括以下步骤：

步骤S101.通过智能音频设备中的声音采集装置获取智能音频设备所处环境的背景音；

步骤S102.对背景音进行傅里叶变化处理以得到背景音的强度信息；

步骤S103.将强度信息输入至预先训练的机器学习模型中，以得到目标音量；

步骤S104.根据目标音量调节智能音频设备的音量。

在本公开的示例性实施例中，通过采集智能音频设备所述环境的背景音，并获取其强度信息，可以获取智能音频设备的目标音量并根据该目标音量对智能音频设备进行音量调节，不但实现了智能音频设备随所处环境的改变而改变自身音量的效果，而且智能音频设备的音量是根据所处环境的背景音的强度信息计算得到的，保证了智能音频设备的音量与所处环境的适用性，以及目标音量的准确性。

下面对调节音量的方法的各个步骤进行详细说明。

在步骤S101中，通过智能音频设备中的声音采集装置获取智能音频设备所处环境的背景音。

在本公开的示例性实施例中，当智能音频设备处于某一环境时，智能音频设备的播放音量会受到所处环境的背景音的影响。例如，若是所处环境为较为安静的环境，如咖啡厅、图书馆、公园等场所，其背景音较小，那么智能音频设备的播放音量可以适应性减小；若是所处环境为较为嘈杂的环境，如马路边、菜市场、闹市等场所，其背景音较大，那么智能音频设备的播放音量可以适应性增大。所以，为了采集所处环境的背景音，可以采用声音采集装置进行采集，进一步的，可以通过包含声音采集装置的智能音频设备进行背景音的采集。其中，该声音采集装置可以是微型录音机、麦克风等，用于接收环境中的背景音，并将背景音转换为数字信号。

在本公开的示例性实施例中，图2示出了获取智能音频设备所处环境的背景音的流程示意图，如图2所示，通过智能音频设备中的声音采集装置获取智能音频设备所处环境的背景音，至少包括以下步骤：

在步骤S201中，通过智能音频设备中的声音采集装置采集智能音频设备所处环境的环境音，环境音包括用户声音和背景音。

在本公开的示例性实施例中，智能音频设备的音量需要根据所处环境的背景音进行调整，而通常使用智能音频设备时，环境中可能会存在用户讲话、唱歌等声音，所以通过声音采集装置采集背景音是比较困难的。为了得到背景音，可以通过声音采集装置采集智能音频设备所处环境的环境音，该环境音包括用户声音，然后将用户声音从环境音中分离掉，即可获取背景音。

在步骤S202中，从环境音中分离用户声音，以得到背景音。

在本公开的示例性实施例中，在步骤S201中通过智能音频设备的声音采集装置采集到的环境音包括背景音和用户声音，为了获取所处环境的背景音，可以对环境音中的用户声音进行分离操作，以得到背景音。图3示出了通过对环境音与用户声音的分离得到背景音的流程示意图，如图3所示，该方法至少包括以下四个步骤：在步骤S301中，通过小波变换算法对环境音进行预消噪处理以得到第一声音。首先对被噪声污染的环境音进行离散序列小波变换，得到带有噪声的小波系数；然后用预设的阈值作为门限对小波系数进行处理，对低于阈值的小波系数作为由噪声引起的，仅让超过阈值的显著的小波系数作为重构背景音的第一声音。在步骤S302中，对第一声音进行去均值处理以得到第二声音。去均值处理也被称为数据的中心化，即从第一声音的数据中去除均值，使第一声音成为零均值变量的第二声音。举例而言，可以通过求期望得到。在步骤S303中，对第二声音进行预白化处理以得到第三声音。对第二声音进行预白化处理，即进行线性变换，得到第三声音。白化过程可以去除观测分量间的二阶相关性，使接下来的独立分量分析处理过程简化，并且可以压缩声音数据的维数。在步骤S304中，通过对第三声音进行独立分量分析处理，以得到所述背景音。对用户声音分离处理的原则是度量信号的独立性，可以用损失函数来表示，具体而言，可以求出使损失函数存在极值的相应的混合矩阵的逆矩阵，即分离矩阵，就可以得到对应的相对独立的输出信号。独立分量分析处理的关键步骤是对分离矩阵的迭代更新。独立分量分析技术是一个串行输出各个声音信号的过程，要估计两个独立分量，即用户声音和背景音，需要运行一次独立分量分析算法。在分离过程中，每分离出一个独立分量，就可以从第三声音中减去用户声音这一分量，直接分离出背景音。独立分量分析技术用定点迭代的方法替代了传统的基于梯度的方法来分离矩阵，计算简单，迭代稳定性好，收敛速度快，极其适用于分离声音信号的方面。因此，选择合适的技术从对混杂有用户声音的环境音中分离出用户声音，便可以得到所处环境的背景音，更有针对性的解决了用户进行交谈时带来的智能音频设备的音量调节问题。

在步骤S102中，对背景音进行傅里叶变化处理以得到背景音的强度信息。

在本公开的示例性实施例中，可以根据获取的背景音确定智能音频设备的目标音量。由于每种声音都具有相应的强度信息，因此可以根据获取到的背景音，对该背景音进行傅里叶变换，变换的结果就可以反映背景音的强度，并使用进度条组件(Prodress Bar)实时显示背景音的强度信息。

在步骤S103中，将强度信息输入至预先训练的机器学习模型中，以得到目标音量。

在本公开的示例性实施例中，进一步的，根据背景音的强度信息确定智能音频设备的目标音量，该目标音量是适应于智能音频设备所处环境的音量。图4示出了根据强度信息获取目标音量的流程示意图，如图4所示，该方法至少包括以下步骤：

在步骤S401中，将强度信息输入至预先训练的机器学习模型中，以输出备选音量。

在本公开的示例性实施例中，在获取背景音的强度信息后，可以根据背景音的强度信息确定智能音频设备的备选音量，具体地，可以通过机器学习模型根据输入的背景音的强度信息输出相应的备选音量。

在步骤S402中，将备选音量与预设音量进行比较。

在本公开的示例性实施例中，设置一预设音量，通过将该预设音量和备选音量进行比较，判断备选音量是否可以作为智能音频设备的目标音量，或者该预设音量是否可以作为智能音频设备的目标音量。

在步骤S403中，若备选音量小于预设音量，则将备选音量作为目标音量。

在步骤S404中，若备选音量大于或等于预设音量，则将预设音量作为目标音量。

在本公开的示例性实施例中，为使智能音频设备的音量和所处环境的背景音相匹配，且为保护用户听力，可以根据实际情况确定目标音量。举例而言，在安静的咖啡厅的预设音量为30分贝，而根据音量调节系数、强度信息和一预设常数确定备选音量为29分贝，根据比较，可以将备选音量作为目标音量，即目标音量为29分贝；在嘈杂的马路边的预设音量为50分贝，而根据音量调节系数、强度信息和一预设常数确定备选音量为58分贝，根据比较，可以将预设音量作为目标音量，即目标音量为50分贝；在嘈杂的KTV的预设音量为80分贝，而根据音量调节系数、强度信息和一预设常数确定备选音量为75分贝，根据比较，可以将备选音量作为目标音量，即目标音量为75分贝。通过本示例性实施例，根据背景音的强度信息确定了一备选音量后，将备选音量与一预设音量进行比较，选择音量较小的一个作为目标音量，可以保证智能音频设备的目标音量是一较低音量，对用户的听力有重要的保护作用，也使得目标音量的选择更具人性化。

在步骤S104中，根据目标音量调节智能音频设备的音量。

在本公开的示例性实施例中，获取目标音量后，可以根据目标音量对智能音频设备的音量进行调节，以得到和所处环境匹配的音量。值得注意的是，这一调节过程是由智能音频设备自身完成的，无需手动操作。

在本公开的示例性实施例中，图5示出了根据强度信息确定备选音量的流程示意图，如图5所示，该方法至少包括以下步骤：

在步骤S501中，将背景音输入至机器学习模型中，以使机器学习模型输出与背景音对应的环境种类，其中，机器学习模型是基于背景音样本和环境种类样本训练形成的。

在本公开的示例性实施例中，将采集到的背景音输入至训练好的机器学习模型中，则机器学习模型可以输出与背景音对应的环境种类。其中，训练好的机器学习模型可以通过已知种类的背景音样本和对应的环境种类样本训练得到。

在步骤S502中，根据预设的环境种类与音量调节系数的映射关系，确定出与环境种类对应的音量调节系数。

在本公开的示例性实施例中，通过机器学习模型输出与背景音对应的环境种类，可以获取一对应的音量调节系数。可以根据环境种类和音量调节系数对应表获取与不同环境种类对应的音量调节系数，例如，当背景音对应的环境种类为安静的环境时，那么该类型的环境音对应的音量调节系数范围可以为0.6-1.5；当背景音对应的环境种类为嘈杂的环境时，那么该类型对应的音量调节系数可以为1.6-3.0，当然与环境种类对应的音量调节系数还可以是具体的数值。值得注意的是，本公开的音量调节系数的设置还可以是其他的数值范围，在此不再赘述。

在步骤S503中，根据音量调节系数和强度信息确定备选音量。

在本公开的示例性实施例中，可以根据音量调节系数和强度信息确定备选音量，具体可以是将音量调节系数和强度信息相乘，以确定备选音量。该音量调节系数针对一类型的环境种类，可以是一音量调节系数范围；进一步的，根据该类型的环境种类的具体场所，对应于该音量调节系数范围内的一音量调节系数。举例而言，当背景音的强度信息为40分贝，所处的环境种类为安静的环境，且具体场所为咖啡厅时，对应的音量调节系数为0.6，那么利用音量调节系数0.6对强度信息40分贝进行调节，得到与安静的咖啡厅的环境音相匹配的智能音频设备的备选音量为24分贝；当背景音的强度信息为30分贝，所处的环境种类为嘈杂的环境，且具体场所为马路边时，对应的音量调节系数为1.6，那么利用音量调节系数1.6对强度信息30分贝进行调节，得到与嘈杂的马路边的环境音相匹配的智能音频设备的备选音量为48分贝；当背景音的强度信息为20分贝，所处的环境种类为嘈杂的环境，且具体场所为KTV时，对应的音量调节系数为3.0，那么利用音量调节系数3.0对强度信息20分贝进行调节，得到与嘈杂的马路边的环境音相匹配的智能音频设备的备选音量为60分贝。

图6示出了另一种确定备选音量的流程示意图，如图6所示，该方法至少包括以下步骤：

在步骤S601中，将背景音输入至机器学习模型中，以使机器学习模型输出与背景音对应的环境种类，其中，机器学习模型是基于背景音样本和环境种类样本训练形成的；

在步骤S602中，根据环境种类获得与环境种类对应的音量调节系数。步骤S601-S602与步骤S501-S502的具体实施方式相同，在此不再赘述。

在步骤S603中，根据音量调节系数、强度信息和预设常数确定备选音量。

在本公开的示例性实施例中，由于声音在传播过程中要推动空气，那么声音采集装置采集到的背景音会产生损失，进而导致根据背景音确定的备选音量较低，并且该备选音量与智能音频设备所处的环境不匹配，使得用户无法在智能音频设备调整到备选音量时，听清智能音频设备中的声音，因此可以设置一预设常数，以对这一部分的音量进行补偿。举例而言，当预设常数为5，背景音的强度信息为40分贝，所处的环境种类为安静的环境，且具体场所为咖啡厅时，对应的音量调节系数为0.6，那么利用音量调节系数0.6和预设常数5对强度信息40分贝进行调节，得到与安静的咖啡厅的环境音相匹配的智能音频设备的备选音量为29分贝；当预设常数为10，背景音的强度信息为30分贝，所处的环境种类为嘈杂的环境，且具体场所为马路边时，对应的音量调节系数为1.6，那么利用音量调节系数1.6和预设常数10对强度信息30分贝进行调节，得到与嘈杂的马路边的环境音相匹配的智能音频设备的备选音量为58分贝；当预设常数为15，背景音的强度信息为20分贝，所处的环境种类为嘈杂的环境，且具体场所为KTV时，对应的音量调节系数为3.0，那么利用音量调节系数3.0和预设常数15对强度信息20分贝进行调节，得到与嘈杂的KTV的环境音相匹配的智能音频设备的备选音量为75分贝。

进一步的，可以保证该预设常数为正值，对损失音量进行补偿，以此保证备选音量无损失且准确。除此之外，设置一为正值的预设常数，还可以对备选音量的确定留有一弹性调整的余地，在只根据音量调节系数和强度信息进行确定后，可能还是无法听清楚智能音频设备的声音，可以根据该预设常数进行调整，以得到更适合用户实时需求的备选音量，保证用户体验。根据不同的所处环境，提供了不同的备选音量的确定方式，更具针对性，也保证了备选音量与所处环境的关联性，保证了备选音量的适用性。

在本公开的示例性实施例中，可以利用音量调节系数对背景音的强度信息进行调节，保证调节后的备选音量为强度信息的一增函数，因此可以设置音量调节系数为一正值，以适应从一安静类型的环境进入到嘈杂类型的环境时，智能音频设备的音量可以高于原有的音量，适应环境的变化进行调节。

在本公开的示例性实施例中，图7示出了训练一待训练机器学习模型的流程示意图，如图7所示，在步骤S701中，获取背景音样本和与背景音样本对应的环境种类样本；其中，背景音样本和与背景音样本对应的环境种类样本可以是在已知种类的背景音和对应的环境种类的集合中选取的；在步骤S702中，将背景音样本输入至一待训练机器学习模型，以获取待训练机器学习模型输出的与背景音样本对应的目标环境种类；在步骤S703中，将目标环境种类和与背景音样本对应的环境种类样本进行匹配；待训练机器学习模型输出目标环境种类之后，可以将背景音样本对应的环境种类样本进行匹配，判断输出的目标环境种类和环境种类样本是否相同，进而根据匹配结果判定待训练机器学习模型是否已经完成训练；在步骤S704中，若目标环境种类与环境种类不匹配，则对机器学习模型的参数进行调整，以使目标环境种类与环境种类样本相同；若目标环境种类和环境种类不匹配，则表明待训练机器学习模型未训练好，因此需要对待训练机器学习模型的参数进行调整，以使目标环境种类和环境种类样本相同，完成对待训练机器学习模型的训练。对于机器学习模型的完整训练保证了环境种类输出的准确性，进一步的，对备选音量的确定的正确性提供了保证，对用户可以在所处环境中接收到合适的音量提供了有力保障。

需要说明的是，虽然以上示例性实施例的实施方式以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或者必须执行全部的步骤才能实现期望的结果。附加地或者备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

此外，在本公开的示例实施例中，还提供了一种调节音量的装置。图8示出了调节音量的装置的结构示意图，如图8所示，调节音量的装置800可以包括：获取模块801、处理模块802、确定模块803、调节模块804。其中：

获取模块801，被配置为通过智能音频设备中的声音采集装置获取智能音频设备所处环境的背景音；处理模块802，被配置为对背景音进行傅里叶变换处理以得到背景音的强度信息；确定模块803，被配置将强度信息输入至预先训练的机器学习模型中，以得到目标音量；调节模块804，被配置为根据目标音量调节智能音频设备的音量。

上述调节音量的装置的具体细节已经在对应的调节音量的方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了调节音量的装置800的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

下面参照图9来描述根据本发明的这种实施例的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)921和/或高速缓存存储单元922，还可以进一步包括只读存储单元(ROM)923。

存储单元920还可以包括具有一组(至少一个)程序模块925的程序/实用工具924，这样的程序模块925包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线930可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备900也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备900交互的设备通信，和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器940通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

参考图10所示，描述了根据本发明的实施例的用于实现上述方法的程序产品1000，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种调节音量的方法，所述方法应用于智能音频设备，其特征在于，所述方法包括：

通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音；

对所述背景音进行傅里叶变换处理以得到所述背景音的强度信息；

将所述强度信息输入至预先训练的机器学习模型中，以得到目标音量；

根据所述目标音量调节所述智能音频设备的音量。

2.根据权利要求1所述的调节音量的方法，其特征在于，所述通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音，包括：

通过所述智能音频设备中的声音采集装置采集所述智能音频设备所处环境的环境音，所述环境音包括用户声音和所述背景音；

从所述环境音中分离所述用户声音，以得到所述背景音。

3.根据权利要求1所述的调节音量的方法，其特征在于，所述将所述强度信息输入至预先训练的机器学习模型中，以得到目标音量，包括：

将所述强度信息输入至预先训练的机器学习模型中，以输出备选音量；

将所述备选音量与预设音量进行比较；

若所述备选音量小于所述预设音量，则将所述备选音量作为所述目标音量；

若所述备选音量大于或等于所述预设音量，则将所述预设音量作为所述目标音量。

4.根据权利要求3所述的调节音量的方法，其特征在于，所述将强度信息输入至预先训练的机器学习模型中，以输出备选音量，包括：

将所述背景音输入至机器学习模型中，以使所述机器学习模型输出与所述背景音对应的环境种类，其中，所述机器学习模型是基于背景音样本和环境种类样本训练形成的；

根据预设的环境种类与音量调节系数的映射关系，确定出与所述环境种类对应的音量调节系数；

根据所述音量调节系数和所述强度信息确定所述备选音量。

5.根据权利要求3所述的调节音量的方法，其特征在于，所述将强度信息输入至预先训练的机器学习模型中，以输出备选音量，包括：

根据所述音量调节系数、所述强度信息和预设常数确定所述备选音量。

6.根据权利要求4或5所述的调节音量的方法，其特征在于，在将所述背景音输入至机器学习模型中之前，所述方法还包括：

获取所述背景音样本和与所述背景音样本对应的环境种类样本；

将所述背景音样本输入至一待训练机器学习模型，以获取所述待训练机器学习模型输出的与所述背景音样本对应的目标环境种类；

将所述目标环境种类和与所述背景音样本对应的环境种类样本进行匹配；

若所述目标环境种类与所述环境种类样本不匹配，则对所述机器学习模型的参数进行调整，以使所述目标环境种类与所述环境种类样本相同。

7.根据权利要求2所述的调节音量的方法，其特征在于，所述从所述环境音中分离所述用户声音，以得到所述背景音，包括：

通过小波变换算法对所述环境音进行预消噪处理以得到第一声音；

对所述第一声音进行去均值处理以得到第二声音；

对所述第二声音进行预白化处理以得到第三声音；

通过对所述第三声音进行独立分量分析处理，以得到所述背景音。

8.一种调节音量的装置，其特征在于，包括：

获取模块，被配置为通过所述智能音频设备中的声音采集装置获取所述智能音频设备所处环境的背景音；

处理模块，被配置为对所述背景音进行傅里叶变换处理以得到所述背景音的强度信息；

确定模块，被配置将所述强度信息输入至预先训练的机器学习模型中，以得到目标音量；

调节模块，被配置为根据所述目标音量调节所述智能音频设备的音量。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7中任意一项所述的调节音量的方法。

10.一种电子设备，其特征在于，包括：

处理器；

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器被配置为经由执行所述可执行指令来执行权利要求1-7中任意一项所述的调节音量的方法。