CN116486828B

CN116486828B - 一种音频数据处理方法、装置及系统

Info

Publication number: CN116486828B
Application number: CN202310699895.1A
Authority: CN
Inventors: 陈潞潞
Original assignee: Beijing Maitu Technology Co ltd
Current assignee: Beijing Maitu Technology Co ltd
Priority date: 2023-06-14
Filing date: 2023-06-14
Publication date: 2023-09-08
Anticipated expiration: 2043-06-14
Also published as: CN116486828A

Abstract

本发明提供一种音频数据处理方法、装置及系统。所述方法包括以下步骤：接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据；根据第二音频数据的幅频特性确定优化处理方案；采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器。本发明通过基于接收、解析出的第二音频数据的幅频特性确定优化处理，并采用确定的优化处理方案对第二音频数据进行优化处理，能够消除盲目优化引起的音频失真。

Description

一种音频数据处理方法、装置及系统

技术领域

本发明属于音频数据处理技术领域，具体涉及一种音频数据处理方法、装置及系统。

背景技术

音响系统包括音频数据采集设备和音频播放设备。音频数据采集设备主要用于将声音信号转换成音频模拟信号，并将音频模拟信号转换成音频数字信号（即音频数据。有时还要进行降噪、压缩和加密等处理）后发送至音频播放设备；也可以是将保存在硬盘或U盘中的音频文件发送至音频播放设备。音频播放设备主要由依次相连的数据接收处理模块、D/A变换器、功率放大模块和扬声器等组成。数据接收处理模块用于接收音频数据采集设备发送的音频数据并进行解析、优化处理，D/A变换器用于将优化处理后的数字音频信号转换成模拟信号，并将所述模拟信号送至功率放大模块进行放大，输出一定幅度的音频信号至扬声器，最后由扬声器将音频（电）信号转换成声音信号在空气中传播。为了提高音响效果，常常在数据接收处理模块与D/A变换器之间设置一级音质增强模块，如图2所示。

实践中发现，音响系统在进行音频播放时，扬声器中有时混有爆破音或出现变调、失真等现象。经反复实验找到了发生这种现象的原因：数据处理模块的优化处理方法按照设定的固定模式进行，即对接收到的所有音频数据不加区分地采取相同的优化措施，导致有些音频数据优化后的播放效果反而更差。

发明内容

为了解决现有技术中存在的上述问题，本发明提供一种音频数据处理方法、装置及系统。

为了实现上述目的，本发明采用以下技术方案。

第一方面，本发明提供一种音频数据处理方法，包括以下步骤：

接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据；

根据第二音频数据的幅频特性确定优化处理方案；

采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器。

进一步地，所述根据第二音频数据的幅频特性确定优化处理方案，包括：

对第二音频数据进行FFT变换，得到第二音频数据的幅频数据；

将所述幅频数据按照频率从小到大的顺序划分为低音区、中音区和高音区；

分别计算低音区、中音区和高音区各频点最大幅度与最小幅度的比值；

通过将3个音区的所述比值与设定阈值进行比较确定优化处理方案：对所述比值超过设定阈值的音区进行对应频率的音频补偿处理，并根据对应的所述比值的大小调整补偿参数。

更进一步地，对第二音频数据进行FFT变换的公式为：

；

式中，x(n)为第n个第二音频数据点，X(k)为第二音频数据的FFT变换值，k为离散频点，k=0,1,…,N-1，N为2的整数次幂。

更进一步地，3个音区的频率范围为：

低音区：40Hz~500Hz；

中音区：500Hz~2kHz；

高音区：2kHz~8kHz。

进一步地，所述第一音频数据包括音频采集数据和一段校准音频数据，所述第一音频数据进行降噪处理后发送到音频播放设备；音频播放设备从第二音频数据中提取校准音频数据Y，并基于Y确定优化处理方案。

更进一步地，基于Y确定优化处理方案的方法包括：

根据Y的标识从存储设备提取与Y对应的原始校准音频数据Y0；

分别对Y和Y0进行FFT变换，得到Y和Y0的幅频数据YF和YF0；

根据YF与YF0的差确定优化处理方案。

进一步地，所述方法还包括：通过对输入音质增强模块的第二音频数据进行幅度缩放处理，同时对音质增强模块的输出数据进行相反的幅度缩放处理，消除因设置音质增强模块引起的削波失真。

更进一步地，消除削波失真的数据处理方法包括：

将输入音质增强模块的第二音频数据的第n个数据点的幅度x(n)缩小为x(n)/k(n)；

将音质增强模块输出的音频数据y(n)放大到；

其中，k(n)的表达式为：；

式中，n=0,1,…，，/>为音质增强单元的最大输出电压，K为音质增强模块的最大增益，K按下式计算：

；

式中，分别为音质增强单元进行高音补偿处理、中音补偿处理、低音补偿处理、响度补偿处理的最大增益。

第二方面，本发明提供一种音频数据处理装置，包括：

数据接收解析模块，用于接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据；

优化方案确定模块，用于根据第二音频数据的幅频特性确定优化处理方案；

音频优化处理模块，用于采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器。

第三方面，本发明提供一种音响系统，包括音频数据采集设备和音频播放设备；音频数据采集设备用于采集音频数据，并将采集的音频数据发送到音频播放设备；音频播放设备用于执行前述任一实施例所述的方法。

与现有技术相比，本发明具有以下有益效果。

本发明通过接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据，根据第二音频数据的幅频特性确定优化处理方案，采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器，实现了音频数据的自动处理。本发明通过基于接收、解析出的第二音频数据的幅频特性确定优化处理，并采用确定的优化处理方案对第二音频数据进行优化处理，能够消除盲目优化引起的音频失真。

附图说明

图1为本发明实施例一种音频数据处理方法的流程图。

图2为音响系统播放设备的组成示意图。

图3为本发明实施例一种音频数据处理装置的方框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明白，以下结合附图及具体实施方式对本发明作进一步说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例一种音频数据处理方法的流程图，包括以下步骤：

步骤101，接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据；

步骤102，根据第二音频数据的幅频特性确定优化处理方案；

步骤103，采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器。

本实施例提供的音频数据处理方法应用于音响系统。音响系统包括音频数据采集设备和音频播放设备。音频数据采集设备主要用于将声音信号转换成音频模拟信号，并将音频模拟信号转换成音频数字信号（即音频数据），有时还要对所述音频数字信号进行降噪、压缩和加密等处理，然后发送至音频播放设备。音频播放设备接收音频数据采集设备发送的音频数据，并进行解析、优化处理后送到D/A变换器，将优化处理后的数字音频信号转换成模拟信号，再将所述模拟信号送至功率放大模块进行放大，输出一定幅度的音频信号至扬声器，最后由扬声器将音频信号转换成声音信号在空气中传播。本实施例提出的音频数据处理方法在音响系统的音频播放设备中执行。音频播放设备的结构示意图如图2所示。

本实施例中，步骤101主要用于接收音频数据采集设备发送的第一音频数据，并通过解析得到第二音频数据。第二音频数据是第一音频数据经网络传输后的数据，第二音频数据相对第一音频数据混入了一些干扰和噪声信号，产生了一定的损耗和失真，因此在播放前还需要对第二音频数据进行优化处理，比如滤除干扰和噪声信号，针对不同的音频频率进行补偿处理等，以提高音频播放效果。

本实施例中，步骤102主要用于确定对第二音频数据的优化处理方法。现有技术一般直接应用默认的音频优化方法或人工交互选择音频优化方法，对第二音频数据进行优化处理。如前述，第一音频数据在发送前可能已经进行了一些优化处理，在播放时如果再进行优化处理可能会因过处理而导致失真；而且不同的音频信号采集传输途径得到的第二音频数据也有所不同，因此采取固定的优化处理方案很难获得理想的播放效果。为此，本实施例通过获得第二音频数据的幅频特性数据（信号幅度与频率之间的关系，即每个频点对应的幅度值），根据具体的幅频分布特性自适应地选择优化方案。

本实施例中，步骤103主要用于利用确定的优化方案对第二音频数据进行优化处理。所述确定的优化方案可以是从已有的优化方案中选取合适的一种方案，也可以是放弃优化，还可以是对默认的优化方案的参数进行修改，以改善优化效果。优化处理后的第二音频数据送到D/A变换器，输出音频模拟信号，然后再将所述音频模拟信号送至功率放大模块进行放大，驱动扬声器发声。

作为一可选实施例，所述根据第二音频数据的幅频特性确定优化处理方案，包括：

本实施例给出了根据第二音频数据的幅频特性确定优化处理方案的一种技术方案。本实施例首先利用快速傅里叶变换FFT获得第二音频数据的幅频数据。傅里叶变换是将一个函数分解成正、余弦基波函数及各次谐波函数的和。通过傅里叶变换可将信号的时域信息转换为信号的频域信息，即得到信号的幅频特性。根据目标函数的各类可将傅里叶变换分为连续函数傅里叶变换和离散函数傅里叶变换。快速傅里叶变换是利用计算机计算离散傅里叶变换DFT的高效、快速计算方法的统称，简称FFT。FFT能使计算机计算离散傅里叶变换所需要的乘法次数大为减少，特别是被变换的抽样点数N越多，FFT算法计算量的节省就越显著。本实施例在得到第二音频数据的幅频数据后，将所述幅频数据按照频率从小到大的顺序划分为低、中、高3个音区。划分3个音区的目的是针对3个音区对应的频率范围分别进行音频补偿即优化处理，如低音补偿、中音补偿和高音补偿。然后针对每个音区分别计算各频点最大幅度与最小幅度的比值；如果频点幅度的单位是分贝，比值计算则变成最大、最小幅度的分贝值的差值计算。最后将得到的3个音区的所述比值与设定阈值进行比较，如果某个或某几个音区的所述比值超过了设定阈值，则需要对这些音区进行优化处理；否则不需要进行优化处理。另外，还可根据所述比值的大小调整优化算法中的补偿参数的大小，一般所述比值越大，补偿参数的调整程度也越大。具体调整方法这里不做详细介绍。

作为一可选实施例，对第二音频数据进行FFT变换的公式为：

；

本实施例给出了FFT变换的计算公式。上面的公式实际上是DFT的计算公式，FFT变换是实现DFT的快速算法。FFT变换的数据点数N要求为2的整数次幂，如N=2¹⁰=1024。

作为一可选实施例，3个音区的频率范围为：

低音区：40Hz~500Hz；

中音区：500Hz~2kHz；

高音区：2kHz~8kHz。

本实施例给出了3个音区的频率范围。值得说明的是，上面列出的频率范围只是针对某种具体应用而言的。不同的应用划分的具体频率范围也不同，如不同乐器的音区划分不同，男声、女声的音区划分也不同。

作为一可选实施例，所述第一音频数据包括音频采集数据和一段校准音频数据，所述第一音频数据进行降噪处理后发送到音频播放设备；音频播放设备从第二音频数据中提取校准音频数据Y，并基于Y确定优化处理方案。

本实施例给出了确定优化处理方案另一种方案。前面实施例是利用第二音频数据的幅频特性数据判断是否需要进行优化处理，第二音频数据是经传输或处理后的第一音频数据，实质上还是待播放的第一音频数据。与前面实施例不同的是，本实施例在数据发送端发送待播放的音频数据的同时，还发送一段专门用于判断是否需要优化处理的音频数据，即校准音频数据。所述校准音频数据与待播放的音频数据一起构成第一音频数据，校准音频数据同待播放的音频数据一起进行优化处理后再一起传输到接收端的音频播放设备。因此，音频播放设备获得的第二音频数据中包含了校准音频数据Y，当然Y已不同于发送端的原始校准音频数据。本实施例就是基于Y确定优化处理方案。Y可以是一段标准的音频数据，如大家熟悉的流行歌曲音乐。值得说明的是，Y可以包含多种不同类型，如乐器声音、男声、女声、歌曲等，应尽量选取与待播放的音频类型相同或相似的原始校准音频数据，比如待播放的音频如果是男高音独唱，原始校准音频数据可选男歌唱家的一段歌曲。

作为一可选实施例，基于Y确定优化处理方案的方法包括：

根据Y的标识从存储设备提取与Y对应的原始校准音频数据Y0；

分别对Y和Y0进行FFT变换，得到Y和Y0的幅频数据YF和YF0；

根据YF与YF0的差确定优化处理方案。

本实施例给出了基于Y确定优化处理方案的一种技术方案。本实施例是基于从第二音频数据中提取的校准音频数据Y与原始校准音频数据Y0的比较确定优化处理方案。发送端在发送原始校准音频数据时同时发送其标识，如“1”、“2”等；提取Y时同时得到其标识，根据所述标识可从存储器中获取与Y对应的原始校准音频数据Y0。本实施例在频域比较Y和Y0的幅频特性，先分别对Y和Y0进行FFT变换，得到Y和Y0的幅频数据YF和YF0，然后计算YF和YF0的差值，根据所述差值确定优化处理方案。还可像前面实施例那样针对划分的不同音区分别进行判断，具体方法这里不作限定。

作为一可选实施例，所述方法还包括：通过对输入音质增强模块的第二音频数据进行幅度缩放处理，同时对音质增强模块的输出数据进行相反的幅度缩放处理，消除因设置音质增强模块引起的削波失真。

本实施例是针对音频播放设备中设置了音质增强模块应用场景的一种优化方案。实践中发现，音频播放设备在进行音频播放时，扬声器中有时出现混有爆破音或出现变调等现象。为了搞清这种现象发生的原因，发明人进行了如下实验：对第二音频数据进行衰减，衰减幅度越大，扬声器中的爆破音出现的频率越小；当衰减到一定幅度时，爆破音完全消失。由此推测，不能正常播放音频信号的原因，可能是第二音频数据中有些幅值较大的数据点经音质增强模块处理后，超过了音质增强模块的输出最大值，超过最大值的部分自动进行削峰处理，从而使输出的音频信号产生削波失真，经功率放大后使扬声器发出爆破音或变调。为此，本实施例先对第二音频数据进行幅度缩放处理（一般是缩小），使音质增强模块输出的最大幅值不超过其动态范围上限（即最大值），这样就可以避免产生削波失真。值得说明的是，这种缩放处理只是针对个别时刻幅值较大的音频数据进行的，而不是对所有时刻的音频数据都进行缩放处理。因此，为了避免产生新的失真，还要对音质增强模块的输出信号进行相反的缩放处理（即逆变换）——将缩小的音频数据再放大相同的倍数。

作为一可选实施例，消除削波失真的数据处理方法包括：

将音质增强模块输出的音频数据y(n)放大到；

其中，k(n)的表达式为：

；

本实施例给出了消除削波失真的一种具体的技术方案。本实施例的处理方法是：先将第二音频数据x(n)缩小为x(n)/k(n)；然后再将音质增强模块的输出y(n)放大到k(n)*y(n)。k(n)的表达式见上面的分段函数。所述分段函数实际上是将x(n)分为两类：一类是幅值较小的数据点，此类数据即使不进行衰减也不会产生音频失真；另一类是幅值较大的数据点，此类数据需要衰减K倍后才能消除音频失真。分段函数中的M是所述两类数据的分界点，当x(n)≤M时，不需要衰减，因此分段函数值为1；当x(n)>M时，需要衰减，分段函数值为K>1。K、M的值可根据经验或通过反复实验获得。M也可取，/>为音质增强单元的最大输出电压（如3.3V）。K可取音质增强模块的最大增益。音质增强模块一般包括高音补偿处理、中音补偿处理、低音补偿处理和响度补偿处理，因此K可取这4种处理的最大增益的积。

图3为本发明实施例一种音频数据处理装置的组成示意图，所述装置包括：

数据接收解析模块11，用于接收音频数据采集设备发送的第一音频数据，对接收的第一音频数据进行解析得到第二音频数据；

优化方案确定模块12，用于根据第二音频数据的幅频特性确定优化处理方案；

音频优化处理模块13，用于采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器。

本实施例的装置，可以用于执行图1所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本发明实施例还提供一种音响系统，所述系统包括音频数据采集设备和音频播放设备。音频数据采集设备用于采集音频数据，并将采集的音频数据发送到音频播放设备；音频播放设备用于执行前述任一实施例所述的方法。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种音频数据处理方法，其特征在于，包括以下步骤：

根据第二音频数据的幅频特性确定优化处理方案；

采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器；

所述根据第二音频数据的幅频特性确定优化处理方案，包括：

通过将3个音区的所述比值与设定阈值进行比较确定优化处理方案：对所述比值超过设定阈值的音区进行对应频率的音频补偿处理，并根据对应的所述比值的大小调整补偿参数，所述比值越大，补偿参数的调整程度越大。

2.根据权利要求1所述的音频数据处理方法，其特征在于，对第二音频数据进行FFT变换的公式为：

式中，x(n)为第n个第二音频数据点，X(k)为第二音频数据的FFT变换值，k为离散频点，k＝0,1,…,N-1，N为2的整数次幂。

3.根据权利要求1所述的音频数据处理方法，其特征在于，3个音区的频率范围为：

低音区：40Hz～500Hz；

中音区：500Hz～2kHz；

高音区：2kHz～8kHz。

4.根据权利要求1所述的音频数据处理方法，其特征在于，所述第一音频数据包括音频采集数据和一段校准音频数据，所述第一音频数据进行降噪处理后发送到音频播放设备；音频播放设备从第二音频数据中提取校准音频数据Y，并基于Y确定优化处理方案。

5.根据权利要求4所述的音频数据处理方法，其特征在于，基于Y确定优化处理方案的方法包括：

根据Y的标识从存储设备提取与Y对应的原始校准音频数据Y0；

分别对Y和Y0进行FFT变换，得到Y和Y0的幅频数据YF和YF0；

根据YF与YF0的差确定优化处理方案。

6.根据权利要求1所述的音频数据处理方法，其特征在于，所述方法还包括：通过对输入音质增强模块的第二音频数据进行幅度缩放处理，同时对音质增强模块的输出数据进行相反的幅度缩放处理，消除因设置音质增强模块引起的削波失真。

7.根据权利要求6所述的音频数据处理方法，其特征在于，消除削波失真的数据处理方法包括：

将音质增强模块输出的音频数据y(n)放大到k(n)*y(n)；

其中，k(n)的表达式为：

式中，n＝0,1,…，M<V_max/K，V_max为音质增强单元的最大输出电压，K为音质增强模块的最大增益，K按下式计算：

K＝K_a×K_b×K_c×K_d

式中，K_a、K_b、K_c、K_d分别为音质增强单元进行高音补偿处理、中音补偿处理、低音补偿处理、响度补偿处理的最大增益。

8.一种音频数据处理装置，其特征在于，包括：

音频优化处理模块，用于采用确定的优化处理方案对第二音频数据进行优化处理，将优化处理后的音频数据发送至D/A转换器；

9.一种音响系统，其特征在于，包括音频数据采集设备和音频播放设备；音频数据采集设备用于采集音频数据，并将采集的音频数据发送到音频播放设备；音频播放设备用于执行权利要求1～7任一项所述的方法。