CN115862657B

CN115862657B - 随噪增益方法和装置、车载系统、电子设备及存储介质

Info

Publication number: CN115862657B
Application number: CN202310151888.8A
Authority: CN
Inventors: 郑凯桐; 夏立勋; 胡明清; 马峰; 朱东辉; 朱志鹏; 赵力; 支洪平
Original assignee: Iflytek Suzhou Technology Co Ltd
Current assignee: Iflytek Suzhou Technology Co Ltd
Priority date: 2023-02-22
Filing date: 2023-02-22
Publication date: 2023-07-28
Anticipated expiration: 2043-02-22
Also published as: CN115862657A

Abstract

本申请公开了一种随噪增益方法和装置、车载系统、电子设备及存储介质。该方法包括获取在目标场所内采集到的音频信号；从音频信号中分离得到目标噪声信号；其中，目标噪声信号影响目标场所内的音频播放效果；提取目标噪声信号的噪声能量功率谱；基于噪声能量功率谱中频点的第一能量值，确定目标场所内的待播放音频在对应频点上是否需执行增益处理；响应于频点上需执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值，确定待播放音频在对应频点上的增益值；基于各个频点上的增益值，对待播放音频进行增益处理。上述方案，有助于提高用户的听觉体验。

Description

随噪增益方法和装置、车载系统、电子设备及存储介质

技术领域

本申请涉及音频处理技术领域，特别是涉及一种随噪增益方法和装置、车载系统、电子设备及存储介质。

背景技术

为提升音频播放效果，通常采用智能补偿算法对待播放音频进行补偿。但是，在某些特定场景，如户外等噪声嘈杂的场景中，现有的智能补偿算法通常无法达到预期效果。

以汽车场景为例，目前的智能补偿算法一般基于车速以及空调开关状态进行音量补偿。然而，由于存在窗外风噪、发动机引擎噪声、轮胎在不同路面行驶产生的噪声、其他机动车产生的噪声等噪声，导致在听感上低频信号的能量依然较低，音频质量不够理想。有鉴于此，如何跟随噪声信号自适应地提升待播放音频质量，以提高用户的听觉体验，成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种随噪增益方法和装置、车载系统、电子设备及存储介质，能够提高用户的听觉体验。

为了解决上述技术问题，本申请第一方面提供了一种随噪增益方法，包括：获取在目标场所内采集到的音频信号；从音频信号中分离得到目标噪声信号；其中，目标噪声信号影响目标场所内的音频播放效果；提取目标噪声信号的噪声能量功率谱；基于噪声能量功率谱中频点的第一能量值，确定目标场所内的待播放音频在对应频点上是否需执行增益处理；响应于频点上需执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值，确定待播放音频在对应频点上的增益值；基于各个频点上的增益值，对待播放音频进行增益处理。

为了解决上述技术问题，本申请第二方面提供了一种随噪增益装置，包括获取模块，用于获取在目标场所内采集到的音频信号；分离模块，用于从音频信号中分离得到目标噪声信号；其中，目标噪声信号影响目标场所内的音频播放效果；提取模块，用于提取目标噪声信号的噪声能量功率谱；判断模块，用于基于噪声能量功率谱中频点的第一能量值，确定目标场所内的待播放音频在对应频点上是否需执行增益处理；确定模块，用于响应于频点上需执行增益处理，基于目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值，确定待播放音频在对应频点上的增益值；增益模块，用于基于各个频点上的增益值，对待播放音频进行增益处理。

为了解决上述技术问题，本申请第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的随噪增益方法。

为了解决上述技术问题，本申请第四方面提供了一种车载系统，至少包括麦克风、扬声器和车机，麦克风和扬声器分别与车机通信连接，扬声器用于播放音频，麦克风用于采集音频，且车机为上述第三方面中的电子设备。

为了解决上述技术问题，本申请第五方面提供了一种计算机可读存储介质，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面的随噪增益方法。

上述方案，将在目标场所采集得到的包含多种音频类型的音频信号进行分离处理，得到影响目标场所内的音频播放效果的目标噪声信号，并提取目标噪声信号的噪声能量功率谱，基于噪声能量功率谱中对应各个频点的第一能量值可以得到当前噪声信号对待播放音频信号的影响程度，由此确定目标声场内的待播放音频在对应频点上是否需要执行增益处理，响应于频点上需要执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值可以确定待播放音频在对应频点上的增益值，将得到的增益值对应于各个频点应用于待播放音频，由此对待播放音频进行增益处理，根据当前目标场所内目标噪声信号的频率特性及对应能量值，调整待播放音频信号各个频点的音频增益，并将对应频点的音频增益应用于待播放音频信号，能够跟随噪声信号自适应地提升待播放音频质量，有助于提高用户的听觉体验。

附图说明

图1是本申请随噪增益方法一实施例的流程示意图；

图2是本申请随噪增益装置一实施例的框架示意图；

图3是本申请电子设备一实施例的框架示意图；

图4是本申请车载系统一实施例的框架示意图；

图5是本申请车载系统一实施例的结构示意图；

图6是本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

请参阅图1，图1是本申请随噪增益方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S10：获取在目标场所内采集到的音频信号。

本公开实施例中，目标场所为可播放用户所需音频信息的空间，具体可以为播放音乐的机动车内部、可观看电影的电影院、可观看演出的剧场和可播放广播的商场大厅等。

在一个实施场景中，采集到的音频信息包括扬声器所播放的音频信息和环境噪声，环境噪声具体可以为机动车行驶过程中的风噪声、发动机的引擎噪声、车内用户的说话噪声、轮胎在不同路面形式产生的噪声等，或者剧场内人员移动的噪声、音频在空间内多次折射所形成的噪声、周围建筑的装修噪声等。

在一个实施场景中，当目标场所具有一定的空间体积时，由于麦克风拾音能力有限，可以设置多个麦克风分别用于拾取对应位置的音频信息，此时各个麦克风所采集到的原始音频因为麦克风位置的不同而有所不同，获取同一时间点分别在各个目标位置处所采集得到的原始音频，并将各个原始音频进行融合处理，得到音频信号，此时的音频信号可以更为准确地反映当前目标场所内的声学情况，故能提高音频增益的准确度。

在一个实施场景中，目标场所内的部分麦克风所对应的拾音空间并没有目标对象，此时可以仅选取存在目标对象的目标位置所对应的麦克风获得的原始音频进行融合，具体地，可以为四座机动车内仅乘坐两位用户时，或者并未坐满观众的剧场内时，可根据目标对象的位置获取对应的原始音频，并对原始音频进行融合处理。通过上述方法，基于目标对象的位置选择对应原始音频，并通过原始音频得到音频信息，在空间条件对各个位置的音频质量有所影响的场景下，提高音频补偿的准确度，以使目标对象具有更好的听觉效果。

在一个具体的实施场景中，可通过图像检测的方法，确定目标空间中目标对象的目标位置，例如，在机动车内部设置有可拍摄车舱内所有乘坐位的摄像装置，对摄像装置采集到的图片进行预处理，包括缩放、灰度化等操作，使用深度学习算法进行目标检测，检测得到目标对象以及目标对象在车舱内的目标位置，并根据目标位置选取对应的麦克风所拾取的原始音频。通过上述方法，在空间条件对各个位置的音频质量有所影响的场景下，基于识别的目标对象的目标位置拾取对应的原始音频，以此提高音频补偿的准确度，以使目标对象具有更好的听觉效果。

在另一个具体的实施场景中，在目标对象有对应座位时，可在座位合适位置处设置传感器，传感器的类型具体可以为压力传感器、红外线传感器等，基于各座位传感器的感测信号，可得到目标对象在目标空间内的目标位置。通过上述方法，在空间条件对各个位置的音频质量有所影响的场景下，基于识别的目标对象的目标位置拾取对应的原始音频，以此提高音频补偿的准确度，以使目标对象具有更好的听觉效果。

需要说明的是，检测目标空间中目标对象的方法以及确定目标对象对应的目标位置的方法，在本申请中不做限定。

步骤S20：从音频信号中分离得到目标噪声信号；其中，目标噪声信号影响目标场所内的音频播放效果。

本公开实施例中，获取的音频信号中包括多种类型的噪声信号，噪声信号中包括当前目标场所内对待播放音频播放效果有影响的稳态噪声和对待播放音频播放效果没有影响的非稳态噪声，稳态噪声的噪声声压级的变化较小，一般不大于3dB，且不随时间有大幅度的变化，非稳态噪声的噪声强度随时间而有起伏波动，且声压变化大于3dB。例如，机动车行驶过程中所产生的发动机噪声、路面和轮胎之间的摩擦噪声、风噪声、车内空调风机噪声等为稳态噪声，扬声器所播放的音乐声、用户说话声、车辆鸣笛声等为非稳态噪声。将稳态噪声从采集得到的所有噪声信号中分离出来，可以提升音频随噪增益系统的稳定性。

在一个实施场景中，目标噪声信号由噪声分离网络对音频信号进行分离得到，经过训练可以得到用于分离目标噪声信号和非目标噪声信号的噪声分离网络，首先获取大量不同类型的样本音频信号，并且样本音频信号中包含与目标噪声信号特征相同的样本目标噪声信号，保证这些样本音频信号有足够的多样性，可以让噪声分离网络学习到不同类型的噪声的各种特征，噪声分离网络可以使用深度卷积网络或者其他类型的网络，例如残差网络等，将样本音频信号输入至噪声分离网络中对样本数据信号按照噪声类型进行分离，噪声分离网络输出预测结果，得到预测噪声目标，并基于样本噪声信号与预测目标噪声信号之间的差异，调整噪声分离网络的网络参数，或者使用常见优化算法，例如随机梯度下降以此来优化噪声分离网络的网络参数。通过上述方法，结合深度网络学习构建并训练得到可以用于按照噪声类型进行噪声分离的噪声分离网络，通过噪声分离网络从采集得到的音频信号中分离得到目标噪声信号，可以提升音频随噪增益系统的稳定性。

步骤S30：提取目标噪声信号的噪声能量功率谱。

在一个实施场景中，使用傅里叶变换将分离得到的目标噪声信号进行频域变换，并求取每个频率分量的幅度平方，将频率分量的幅度平方积分到对应的频率上，由此得到每个频率的能量值，将每个频率的能量值归一化到相对能量，可以得到目标噪声信号的噪声能量功率谱。

在一个实施场景中，得到噪声能量功率谱后，由于人耳对不同频率的噪声敏感程度不同，因此可结合心理声学特性对噪声能量功率谱进行加权修正，心理声学是对人听感的统计性质的数学表述，它解释人各种听感的生理原理。由于人耳听觉系统复杂，人类迄今为止对它的机理和听觉特性的某些问题总是还不能从生理解剖角度完全解释清楚。所以，对人耳听觉特性的研究仅限于在心理声学和语言声学内进行。人耳对不同强度和不同波长声音的一定听觉范围称为声域。在人耳的声域范围内，声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽效应、短波定位等特性。其中响度、音度、音色可以在主观上用来描述具有振幅、波长和相位三个物理量的任何复杂的声音，故又称为声音“三要素”；而对于多种音源场合的人的耳掩蔽效应等特性尤为重要，它是心理声学的基础，掩蔽效应（Masking Effects），指由于出现多个同一类别（如声音、图像）的刺激，导致被试不能完整接收全部刺激的信息，听觉掩蔽效应则主要包括噪声、人耳、频域、时域和时间掩蔽效应。

在一个具体的实施场景中，计算标准的心理声学对应噪声能量功率谱的加权函数，得到加权函数对应于不同频点上的权重值，基于与各个频点对应的权重值分别对噪声能量功率谱中对应频点的第一能量值进行加权，得到加权后的噪声能量功率谱，再基于由掩蔽效应确定掩蔽阈值，掩蔽阈值可根据实验进行设定，基于掩蔽阈值以及频点上的第一能量值与第二能量值之间的比值，修正加权后的噪声能量功率谱。通过上述方法，结合心理声学效应，加权修正噪声能量功率谱，以此提高增益值计算的准确度，在目标场所位于噪声环境的场景下提高音频质量，故能提高用户的听觉体验。

步骤S40：基于噪声能量功率谱中频点的第一能量值，确定目标场所内的待播放音频在对应频点上是否需执行增益处理。

在一个实施场景中，基于对目标场所的声学特性测试调整对应的预设能量阈值，检测噪声能量功率谱各个频点的第一能量值是否大于预设能量阈值，响应于频点的第一能量值大于预设能量阈值，确定目标场所内的待播放音频在对应频点上需执行增益处理，响应于频点的第一能量值不大于预设能量阈值，确定目标场所内的待播放音频在对应频点上无需执行增益处理。通过上述方法，基于目标噪声信号各个频点对应的第一能量值和预设能量阈值之间的大小关系，判断待播放音频对应频点是否需要进行增益处理，可以提升音频随噪增益系统的稳定性。

在一个具体的实施场景中，频点对应的预设能量阈值与频点的第二能量值正相关，第二能量值越大表征当前扬声器播放的音乐信号能量较大，说明音乐信号较强，不易被噪声所掩盖，因此可以提高预设能量阈值，第二能量值越小表征当前扬声器播放的音乐信号能量较小，说明音乐信号较弱，容易被噪声所掩盖，因此可以降低预设能量阈值。通过上述方法，基于第二能量值动态调整预设噪声阈值的大小，判断待播放音频对应频点是否需要进行增益处理，可以提升音频随噪增益系统的稳定性。

步骤S50：响应于频点上需执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值，确定待播放音频在对应频点上的增益值。

在一个实施场景中，基于对应频点上的第一能量值和第二能量值之间的比值，可以确定增益系数，并获取第一能量值和预设能量阈值之间的差值，基于差值和增益系数，共同确定增益值。通过上述方法，根据当前目标场所内目标噪声信号的频率特性及对应能量值，动态调整待播放音频信号各个频点的音频增益，故能提高用户的听觉体验。

在一个具体的实施场景中，基于对应频点的差值和增益系数之间的乘积，可以确定对应的增益值，例如，某一频点上的第一能量值为1.5分贝，第二能量值为1分贝，因此可以得到增益系数为1.5，此时预设能量阈值为0.8分贝，计算所得到第一能量和预设能量阈值之间的差值为0.7分贝，此时确定对应频点的增益值为1.05分贝。

在另一个实施场景中，如果某频点不需要执行增益处理，则该频点上的默认增益值为0。

步骤S60：基于各个所述频点上的增益值，对所述待播放音频进行增益处理。

在一个实施场景中，将待播放音频的音频信号分成固定大小的窗口，每个窗口的大小由快速傅里叶变换的点数决定对每个窗口进行离散傅里叶变换，将每个窗口的离散傅里叶变换结果幅度谱和相位谱相结合，得到复数数组用于表示频域信号，将对应频点的增益值与频域信号相乘来应用增益，再通过逆离散傅里叶变换或逆快速傅里叶变换将频域信号转回时域信号，以此对待播放音频进行增益处理。通过上述方法，将对应频点的音频增益应用于待播放音频信号，在目标场所位于噪声环境的场景下提高音频质量，故能提高用户的听觉体验。

在一个实施场景中，对待播放音频进行增益处理之后，基于平滑滤波器对待播放音频各个频点分别对应的音频信号进行平滑处理，得到平滑后的待播放音频，并基于扬声器的频响曲线对平滑后的待播放音频进行均衡处理，得到均衡后的待播放音频，以使扬声器播放均衡后的待播放音频。通过上述方式，将随噪增益后的待播放音频进行平滑和均衡处理，故能使目标对象具有更好的听觉效果，提高用户的听觉体验。

在一个具体的实施场景中，选择一种合适的平滑滤波器类型，常见的平滑滤波器包括平均滤波器、中值滤波器和卷积滤波器等，定义滤波器窗口大小，即滤波器所考虑的数据点个数，再将音乐信号逐点与滤波器窗口进行卷积，并在窗口内将所有数据进行线性组合，然后作为输出。对于待播放音频中的每一频点数据都重复上述步骤进行平滑处理，并根据需求进行参数调整和优化，例如可以调整滤波器类型、窗口大小等参数，以达到最优效果。

在一个具体的实施场景中，扬声器本身存在一些频率响应的问题，例如在低频或高频上响应过强或过弱，导致音频系统音质不均衡，听音效果不佳。通过对频响曲线进行均衡处理，使得音箱在不同频率下的响应更加平均，改善音频系统的音质和听音效果。例如，在安静的环境下进行扬声器频响曲线的采集，使用频响分析软件后硬件对采集的数据进行处理，得到扬声器在不同频率下的响应特性，将频响曲线取相反数或求其倒数，得到逆频响曲线，使用均衡器将逆频响曲线应用到扬声器上，并对扬声器进行试听比较，确定最优的均衡方案。根据不同的目标场所的声学特性对均衡方案进行调整并进行实际测试确保音质和听音效果都达到最佳，并将均衡数据保存下来在播放音频时使用。

上述方案，将在目标场所采集得到的包含多种音频类型的音频信号进行分离处理，得到影响目标场所内的音频播放效果的目标噪声信号，并提取目标噪声信号的噪声能量功率谱，基于噪声能量功率谱中对应各个频点的第一能量值可以得到当前噪声信号对待播放音频信号的影响程度，由此确定目标声场内的待播放音频在对应频点上是否需要执行增益处理，响应于频点上需要执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值可以确定待播放音频在对应频点上的增益值，将得到的增益值对应于各个频点应用于待播放音频，由此对待播放音频进行增益处理，根据当前目标场所内目标噪声信号的频率特性及对应能量值，动态调整待播放音频信号各个频点的音频增益，并将对应频点的音频增益应用于待播放音频信号，能够跟随噪声信号自适应地提升待播放音频质量，有助于提高用户的听觉体验。

请参阅图2，图2是本申请随噪增益装置20一实施例的框架示意图。如图2所示，随噪增益装置20包括：获取模块21、分离模块22、提取模块23、判断模块24、确定模块25和增益模块26，获取模块21，用于获取在目标场所内采集到的音频信号；分离模块22，用于从音频信号中分离得到目标噪声信号；其中，目标噪声信号影响目标场所内的音频播放效果；提取模块23，用于提取目标噪声信号的噪声能量功率谱；判断模块24，用于基于噪声能量功率谱中频点的第一能量值，确定目标场所内的待播放音频在对应频点上是否需执行增益处理；确定模块25，用于响应于频点上需执行增益处理，基于目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值，确定待播放音频在对应频点上的增益值；增益模块26，用于基于各个频点上的增益值，对待播放音频进行增益处理。

上述方案，由于随噪增益装置20将在目标场所采集得到的包含多种音频类型的音频信号进行分离处理，得到影响目标场所内的音频播放效果的目标噪声信号，并提取目标噪声信号的噪声能量功率谱，基于噪声能量功率谱中对应各个频点的第一能量值可以得到当前噪声信号对待播放音频信号的影响程度，由此确定目标声场内的待播放音频在对应频点上是否需要执行增益处理，响应于频点上需要执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值可以确定待播放音频在对应频点上的增益值，将得到的增益值对应于各个频点应用于待播放音频，由此对待播放音频进行增益处理，根据当前目标场所内目标噪声信号的频率特性及对应能量值，动态调整待播放音频信号各个频点的音频增益，并将对应频点的音频增益应用于待播放音频信号，能够跟随噪声信号自适应地提升待播放音频质量，有助于提高用户的听觉体验。

在一些公开实施例中，确定模块25包括能量检测子模块，用于检测频点的第一能量值是否大于预设能量阈值；确定模块25包括第一响应子模块，用于响应于频点的第一能量值大于预设能量阈值，确定目标场所内的待播放音频在对应频点上需执行增益处理；确定模块25包括第二响应子模块，用于响应于频点的第一能量值不大于预设能量阈值，确定目标场所内的待播放音频在对应频点上无需执行增益处理。

因此，基于目标噪声信号各个频点对应的第一能量值和预设能量阈值之间的大小关系，判断待播放音频对应频点是否需要进行增益处理，可以提升音频随噪增益系统的稳定性。

在一些公开实施例中，确定模块25还包括增益值确定子模块，用于基于对应频点上的第一能量值和第二能量值之间的比值，确定增益系数，并获取第一能量值和预设能量阈值之间的差值；基于差值和增益系数，确定增益值。

因此，根据当前目标场所内目标噪声信号的频率特性及对应能量值，动态调整待播放音频信号各个频点的音频增益，故能提高用户的听觉体验。

在一些公开实施例中，随噪增益装置20还包括平滑均衡模块，用于基于平滑滤波器对待播放音频各个频点分别对应的音频信号进行平滑处理，得到平滑后的待播放音频；基于扬声器的频响曲线对平滑后的待播放音频进行均衡处理，得到均衡后的待播放音频，以使扬声器播放均衡后的待播放音频。

因此，将随噪增益后的待播放音频进行平滑和均衡处理，故能使目标对象具有更好的听觉效果，提高用户的听觉体验。

在一些公开实施例中，随噪增益装置20还包括加权修正模块，用于基于与各个频点对应的权重值分别对噪声能量功率谱中对应频点的第一能量值进行加权，得到加权后的噪声能量功率谱；其中，频点的权重值与人耳对频点的敏感度正相关；基于由掩蔽效应确定的掩蔽阈值以及频点上的第一能量值与第二能量值之间的比值，修正加权后的噪声能量功率谱。

因此，结合心理声学效应，加权修正噪声能量功率谱，以此提高增益值计算的准确度，在目标场所位于噪声环境的场景下提高音频质量，故能提高用户的听觉体验。

在一些公开实施例中，分离模块22还包括网络训练子模块，用于获取样本音频信号；其中，样本音频信号包含与目标噪声信号特征相同的样本目标噪声信号；基于噪声分离网络对样本音频信号进行分离，得到预测目标噪声信号；基于样本目标噪声信号与预测目标噪声信号之间的差异，调整噪声分离网络的网络参数。

因此，结合深度网络学习构建并训练得到可以用于按照噪声类型进行噪声分离的噪声分离网络，通过噪声分离网络从采集得到的音频信号中分离得到目标噪声信号，可以提升音频随噪增益系统的稳定性。

在一些公开实施例中，获取模块21还包括音频融合子模块，用于检测目标场所内目标对象的目标位置；获取在目标位置处采集到的原始音频；融合各个目标位置处分别采集到的原始音频，得到音频信号。

因此，获取同一时间点分别在各个目标位置处所采集得到的原始音频，并将各个原始音频进行融合处理，得到音频信号，此时的音频信号可以更为准确地反映当前目标场所内的声学情况，故能提高音频增益的准确度。

在一些公开实施例中，音频融合子模块还包括目标识别子模块，目标识别子模块包括图像识别子模块、传感器识别子模块中的至少一种，图像识别子模块用于对车舱的拍摄图像进行目标检测，得到目标对象在车舱内的目标位置；传感器识别子模块用于基于车舱内各座位传感器的感测信号，得到目标对象在车舱内的目标位置。

因此，基于目标对象的位置选择对应原始音频，并通过原始音频得到音频信息，在空间条件对各个位置的音频质量有所影响的场景下，提高音频补偿的准确度，以使目标对象具有更好的听觉效果。

请参阅图3，图3是本申请电子设备30一实施例的框架示意图。电子设备30包括相互耦接的存储器31和处理器32，存储器31中存储有程序指令，处理器32用于执行程序指令以实现上述任一随噪增益方法实施例中的步骤。具体而言，电子设备30可以包括但不限于：服务器、台式计算机、笔记本电脑、平板电脑、智能手机等，在此不作限定。

具体而言，处理器32用于控制其自身以及存储器31以实现上述任一随噪增益方法实施例中的步骤。处理器32还可以称为CPU（Central Processing Unit，中央处理单元）。处理器32可能是一种集成电路芯片，具有信号的处理能力。处理器32还可以是通用处理器、数字信号处理器（Digital Signal Processor,DSP）、专用集成电路（ApplicationSpecificIntegrated Circuit, ASIC）、现场可编程门阵列（Field-Programmable GateArray, FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器32可以由集成电路芯片共同实现。

上述方案，由于电子设备30将在目标场所采集得到的包含多种音频类型的音频信号进行分离处理，得到影响目标场所内的音频播放效果的目标噪声信号，并提取目标噪声信号的噪声能量功率谱，基于噪声能量功率谱中对应各个频点的第一能量值可以得到当前噪声信号对待播放音频信号的影响程度，由此确定目标声场内的待播放音频在对应频点上是否需要执行增益处理，响应于频点上需要执行增益处理，基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值可以确定待播放音频在对应频点上的增益值，将得到的增益值对应于各个频点应用于待播放音频，由此对待播放音频进行增益处理，根据当前目标场所内目标噪声信号的频率特性及对应能量值，动态调整待播放音频信号各个频点的音频增益，并将对应频点的音频增益应用于待播放音频信号，能够跟随噪声信号自适应地提升待播放音频质量，有助于提高用户的听觉体验。

请参阅图4，图4是本申请车载系统40一实施例的框架示意图。车载系统40至少包括麦克风41、扬声器42和车机43，麦克风41和扬声器42分别与车机43通信连接，扬声器42用于播放音频，麦克风41用于采集音频，且车机43为上述电子设备30。

请参阅图5，图5是本申请车载系统40一实施例的结构示意图，在一些公开实施例中，车内可以安装多个麦克风41和多个扬声器42，例如，多个扬声器42可分别安装在车辆顶棚、把手、中控台等，对应机动车座椅位置分别安装多个麦克风41，以获取车内扬声器42所播放的立体声音频以及车内环境音等声音元素。

请参阅图6，图6是本申请计算机可读存储介质60一实施例的框架示意图。计算机可读存储介质60存储有能够被处理器运行的程序指令61，程序指令61用于实现上述任一随噪增益方法实施例中的步骤。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其他的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其他的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器（processor）执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种随噪增益方法，其特征在于，包括：

获取在目标场所内采集到的音频信号；

从所述音频信号中分离得到目标噪声信号；其中，所述目标噪声信号影响所述目标场所内的音频播放效果；

提取所述目标噪声信号的噪声能量功率谱；

基于所述噪声能量功率谱中频点的第一能量值，确定所述目标场所内的待播放音频在对应所述频点上是否需执行增益处理；

响应于所述频点上需执行增益处理，基于对应所述频点的第一能量值和所述目标场所内当前播放音频的音频能量功率谱在对应所述频点上的第二能量值，确定所述待播放音频在对应所述频点上的增益值；

基于各个所述频点上的增益值，对所述待播放音频进行增益处理；

其中，所述基于对应所述频点的第一能量值和所述目标场所内当前播放音频的音频能量功率谱在对应所述频点上的第二能量值，确定所述待播放音频在对应所述频点上的增益值，包括：

基于对应频点上的所述第一能量值和所述第二能量值之间的比值，确定增益系数，并获取所述第一能量值和预设能量阈值之间的差值；

基于所述差值和所述增益系数，确定所述增益值；

其中，所述频点对应的预设能量阈值与所述频点的第二能量值正相关。

2.根据权利要求1所述的方法，其特征在于，所述基于所述噪声能量功率谱中频点的第一能量值，确定所述目标场所内的待播放音频在对应所述频点上是否需执行增益处理，包括：

检测所述频点的第一能量值是否大于预设能量阈值；

响应于所述频点的第一能量值大于所述预设能量阈值，确定所述目标场所内的待播放音频在对应所述频点上需执行增益处理；

响应于所述频点的第一能量值不大于所述预设能量阈值，确定所述目标场所内的待播放音频在对应所述频点上无需执行增益处理。

3.根据权利要求1所述的方法，其特征在于，在所述基于各个所述频点上的增益值，对所述待播放音频进行增益处理之后，所述方法还包括：

基于平滑滤波器对所述待播放音频各个频点分别对应的音频信号进行平滑处理，得到平滑后的待播放音频；

基于扬声器的频响曲线对平滑后的待播放音频进行均衡处理，得到均衡后的待播放音频，以使所述扬声器播放均衡后的待播放音频。

4.根据权利要求1所述的方法，其特征在于，在所述提取所述目标噪声信号的噪声能量功率谱之后，以及在所述基于所述噪声能量功率谱中频点的第一能量值，确定所述目标场所内的待播放音频在对应所述频点上是否需执行增益处理之前，所述方法还包括：

基于与各个所述频点对应的权重值分别对所述噪声能量功率谱中对应所述频点的第一能量值进行加权，得到加权后的噪声能量功率谱；其中，所述频点的权重值与人耳对所述频点的敏感度正相关；

基于由掩蔽效应确定的掩蔽阈值以及所述频点上的第一能量值与第二能量值之间的比值，修正加权后的噪声能量功率谱。

5.根据权利要求1所述的方法，其特征在于，所述目标噪声信号由噪声分离网络对所述音频信号进行分离得到。

6.根据权利要求5所述的方法，其特征在于，所述噪声分离网络的训练步骤包括：

获取样本音频信号；其中，所述样本音频信号包含与所述目标噪声信号特征相同的样本目标噪声信号；

基于所述噪声分离网络对所述样本音频信号进行分离，得到预测目标噪声信号；

基于所述样本目标噪声信号与所述预测目标噪声信号之间的差异，调整所述噪声分离网络的网络参数。

7.根据权利要求1所述的方法，其特征在于，所述获取在目标场所内采集到的音频信号，包括：

检测所述目标场所内目标对象的目标位置；

获取在所述目标位置处采集到的原始音频；

融合各个所述目标位置处分别采集到的原始音频，得到所述音频信号。

8.根据权利要求7所述的方法，其特征在于，所述目标场所为车舱，所述检测所述目标场所内目标对象的目标位置，包括以下任一者：

对所述车舱的拍摄图像进行目标检测，得到所述目标对象在所述车舱内的目标位置；

基于所述车舱内各座位传感器的感测信号，得到所述目标对象在所述车舱内的目标位置。

9.一种随噪增益装置，其特征在于，包括：

获取模块，用于获取在目标场所内采集到的音频信号；

分离模块，用于从所述音频信号中分离得到目标噪声信号；其中，所述目标噪声信号影响所述目标场所内的音频播放效果；

提取模块，用于提取所述目标噪声信号的噪声能量功率谱；

判断模块，用于基于所述噪声能量功率谱中频点的第一能量值，确定所述目标场所内的待播放音频在对应所述频点上是否需执行增益处理；

确定模块，用于响应于所述频点上需执行增益处理，基于所述目标场所内当前播放音频的音频能量功率谱在对应所述频点上的第二能量值，确定所述待播放音频在对应所述频点上的增益值；

增益模块，用于基于各个所述频点上的增益值，对所述待播放音频进行增益处理；

增益值确定子模块，用于基于对应频点上的所述第一能量值和所述第二能量值之间的比值，确定增益系数，并获取所述第一能量值和预设能量阈值之间的差值；基于所述差值和所述增益系数，确定所述增益值。

10.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器用于存储计算机程序，所述处理器用于执行所述计算机程序以实现权利要求1至8任一项所述的随噪增益方法。

11.一种车载系统，其特征在于，至少包括麦克风、扬声器和车机，所述麦克风和所述扬声器分别与所述车机通信连接，所述扬声器用于播放音频，所述麦克风用于采集音频，且所述车机为权利要求10所述的电子设备。

12.一种计算机可读存储介质，其特征在于，存储有计算机程序，所述计算机程序能够被处理器执行以实现权利要求1至8任一项所述的随噪增益方法。