CN111312289B

CN111312289B - 一种音频测试的预处理方法及系统

Info

Publication number: CN111312289B
Application number: CN202010148237.XA
Authority: CN
Inventors: 戎玲; 胡融
Original assignee: Shanghai Jinghui Electronic Equipment Minhang Co ltd; Third Research Institute of the Ministry of Public Security
Current assignee: Shanghai Jinghui Electronic Equipment Minhang Co ltd; Third Research Institute of the Ministry of Public Security
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2023-03-10
Anticipated expiration: 2040-03-05
Also published as: CN111312289A

Abstract

本发明涉及一种音频测试的预处理方法及系统，应用于对讲机领域，通过在频域信号领域将实时获取的人工嘴频响扣除，人工嘴播出的声音完全和原始信号一样，让后续测试做的更精准。

Description

一种音频测试的预处理方法及系统

技术领域

本发明涉及一种声音处理技术领域，尤其涉及一种音频测试的预处理方法及系统。

背景技术

在通讯行业里电声，声声测试中常用到人工嘴模拟人声和各种环境噪声。随着技术的进步，特别是AI的提出，对测试设备要求也提高了。希望能用真人语音和真实环境噪声来对被测物进行测试。

传统的测试是将录音信号通过人工嘴来还原人声和环境噪声，这样距存在一个问题，就是人工嘴送出的声音含有人工嘴的频响，也就是人工嘴送出的声音不是严格意义上原始信号，为了让测试做的更精准就需要把原始录音信号提前把人工嘴频响预先扣除，使得人工嘴播出的声音完全和原始信号一样。

发明内容

本发明利用反FFT技术在原始信号里预先扣除人工嘴频响从而解决现有技术中的问题，使得人工嘴播出的声音完全和原始信号一样。具体技术方案如下。

一种音频测试的预处理方法，执行如下步骤：

步骤S1，采集由人工嘴输出的原始语音信号，获取采样语音信号；

步骤S2，对所述采样语音信号进行同步处理，使得所述采样语音信号与所述原始语音信号在时间上同步；

步骤S3，将所述采样语音信号按照预设的时间间隔进行切片，以形成多个信号片段；

步骤S4，将每个所述信号片段分别从时域转换至频域；

步骤S5，对每个所述信号片段扣除预先获取的所述人工嘴的频响值，以分别形成处理信号片；

步骤S6，分别将每个所述处理信号片从频域恢复至时域；

步骤S7，将恢复时域后的所有所述处理信号片按照原始时间顺序进行拼接，以形成处理语音信号；

步骤S8，将所述处理语音信号用于后续的音频测试中。

进一步的，所述步骤S4中，采用傅里叶变换的方式将所述信号片段从时域转换至频域。

进一步的，所述步骤S4中，针对每个所述信号片段中的每一帧所述语音信号，采用傅里叶变换的方式从时域转换至频域。

进一步的，所述步骤S6中，采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。

进一步的，所述步骤S6中，针对每个所述处理信号片中的每一帧所述语音信号，采用反傅里叶变换的方式从频域恢复至时域。

进一步的，在执行所述音频测试的预处理之前，还执行如下步骤S0：预先向所述人工嘴中输入一白噪音信号，采集所述人工嘴播放的白噪音信号，根据所述人工嘴播放的白噪音信号获取所述人工嘴的频响值并进行存储。

一种音频测试的预处理系统，应用于前述的一种音频测试的预处理方法中，包括：

采集单元，用于采集由人工嘴输出的原始语音信号，获取采样语音信号；

同步单元，与所述采集单元连接，对所述采样语音信号进行同步处理，使得所述采样语音信号与所述原始语音信号在时间上同步；

切片单元，与所述同步单元连接，用于采样语音信号按照预设的时间间隔进行切片，以形成多个信号片段；

频域转换单元，与所述切片单元连接，用于将每个所述信号片段分别从时域转换至频域；

预扣除单元，与所述频域转换单元连接，用于对每个所述信号片段的扣除预先获取的所述人工嘴的频响值，以分别形成处理信号片；

时域转换单元，与所述预扣除单元连接，用于分别将每个所述处理信号片从频域恢复至时域；

拼接单元，与时域转换单元连接，用于将所有恢复至时域后的所有所述处理信号片按照原始时间顺序进行拼接，以形成处理语音信号；

将所述处理语音信号用于后续的音频测试中。

进一步的，所述频域转换单元还用于采用傅立叶变换将每个所述信号片段分别从时域转换至频域。

进一步的，所述时域转换单元还用于采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。

进一步的，包括输入单元，用于预先向所述人工嘴中输入一白噪音信号，经由所述人工嘴播放；

所述采集单元采集用于所述人工嘴播放的白噪音信号；

包括一获取单元，与所述采集单元连接，所述获取单元根据所述采集单元采集的所述人工嘴播放的白噪音信号获取所述人工嘴的频响值；

包括一存储单元，分别与获取单元和预扣除单元连接，所述存储单元存储所述人工嘴的频响值，所述预扣除单元从所述存储单元中获取所述人工嘴的频响值。

本发明的有益技术效果是：将采样录音信号提前把人工嘴频响预先扣除，使得人工嘴播出的声音完全和原始信号一样，让后续测试做的更精准。

附图说明

图1-2为本发明的方法步骤示意图。

图3为本发明的预处理系统的结构框图。

1、采集单元，2、切片单元，3、频域转换单元，4、预扣除单元，5、时域转换单元，6、拼接单元，7、获取单元，8、存储单元，9、输入单元，10、人工嘴,11、同步单元。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

请参阅图1-3，本发明设计一种音频测试的预处理方法及系统

一种音频测试的预处理方法，适用于对对讲机产品的音频测试；其特征在于，音频测试的预处理方法用于采用人工嘴10模拟真人语音和真实环境噪声对所述对讲机产品进行音频测试中，采集原始语音信号，得到采样语音信号并对所述采集采样语音信号采样语音信号执行如下步骤：

步骤S1，采集由人工嘴输出的原始语音信号，获取采样语音信号。

步骤S3，将采样语音信号按照预设的时间间隔进行切片，以形成多个信号片段。

例如，所述预设的时间间隔为20ms。

步骤S4，将每个信号片段分别从时域转换至频域。

步骤S5，对每个信号片段扣除预先获取的人工嘴10的频响值，以分别形成处理信号片。

将每一信号片段扣除人工嘴10的频响得到去除频响的频域信号，对每一信号片段都做如此处理。例如当一段原始语音信息切片切成N片后，每一信号片段扣除频响处理，共需要做N次处理。

输入白噪音来获取人工嘴的频响。由于人工嘴10的产生的频响会随着温度等周围的环境变化而变化，因此，在本发明的一个实施例中，直接获取当前时刻人工嘴10的频响，而不是存储很久的人工嘴10的频响。具体方法是输入白噪音来获取人工嘴10的频响。

只要不与在进行语音信号扣除频响的操作时刻的环境相差过大，其它相近时刻也可以获取频响。

进一步的，人工嘴10的频响的获取是在步骤S1之前获取。

步骤S6，分别将每个处理信号片从频域恢复至时域。

步骤S7，将恢复至时域后的所有处理信号片按照原始时间顺序进行拼接，以形成处理语音信号。

步骤S8，将处理语音信号用于后续的音频测试中。

进一步的，步骤S4中，采用傅里叶变换的方式将信号片段从时域转换至频域。

进一步的，步骤S4中，针对每个信号片段中的每一帧语音信号，采用傅里叶变换的方式从时域转换至频域，以分别获得每一帧语音信号的所述声音特征值。

进一步的，步骤S6中，采用反傅里叶变换的方式将信号片段从频域恢复至时域。

进一步的，步骤S6中，针对每个处理信号片中的每一帧语音信号，采用反傅里叶变换的方式从频域恢复至时域。

进一步的，在执行所述音频测试的预处理之前，还包括如下步骤S0：预先向人工嘴10中输入一白噪音信号，采集人工嘴10播放的白噪音信号，根据人工嘴10播放的白噪音信号获取人工嘴10的频响值；存储人工嘴10的频响值。

通过预先扣除人工嘴10的频响，使得人工嘴10播出的声音完全和原始信号一样，让测试做的更精准。

参阅图2-3，一种音频测试的预处理系统，包括：

采集单元1，用于采集由人工嘴播放的原始语音信号，获得采样语音信号；

同步单元11，与采集单元1连接，用于对采样语音信号进行同步处理，使得采样语音信号与原始语音信号在时间上同步；

切片单元2，与同步单元11连接，用于将所人工嘴10输出的采样语音信号按照预设的时间间隔进行切片，以形成多个信号片段；

频域转换单元3，与切片单元2连接，用于将每个信号片段分别从时域转换至频域；

预扣除单元4，与频域转换单元3连接，用于对每个信号片段扣除预先获取的人工嘴10的频响值，以分别形成处理信号片；

时域转换单元5，与预扣除单元4连接，用于分别将每个处理信号片从频域恢复至时域；

拼接单元6，与时域转换单元5连接，用于将恢复至时域后的处理信号片按照原始时间顺序进行拼接，以形成处理语音信号；

将处理语音信号用于后续的音频测试中。

进一步的，频域转换单元3采用傅立叶变换将每个信号片段分别从时域转换至频域。

进一步的，时域转换单元5采用反傅里叶变换的方式将信号片段从频域恢复至时域。

进一步的，具有一输入单元9，预先向人工嘴10中输入一白噪音信号，经由人工嘴10播放，采集单元1采集人工嘴播10放的白噪音信号；

包括一获取单元7，与采集单元1连接，获取单元7根据采集单元1采集的人工嘴10播放的白噪音信号获取人工嘴10的频响值；

包括一存储单元8，分别与获取单元7和预扣除单元4连接，存储单元8存储人工嘴10的频响值，预扣除单元4从存储单元8中获取人工嘴10的频响值。

所述预设的时间间隔为20ms。

通过傅立叶变换将音频信号由时域信号转变成频域信号减去实时获取人工嘴的频响，使得人工嘴10播出的声音完全和原始信号一样，让测试做的更精准。

以上所述仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

Claims

1.一种音频测试的预处理方法，其特征在于，执行如下步骤：

步骤S4，将每个所述信号片段分别从时域转换至频域；

步骤S6，分别将每个所述处理信号片从频域恢复至时域；

步骤S7，将恢复至时域后的所有所述处理信号片按照原始时间顺序进行拼接，以形成处理语音信号；

步骤S8，将所述处理语音信号用于后续的音频测试中。

2.如权利要求1所述的一种音频测试的预处理方法，其特征在于，所述步骤S4中，采用傅里叶变换的方式将所述信号片段从时域转换至频域。

3.如权利要求2所述的一种音频测试的预处理方法，其特征在于，所述步骤S4中，针对每个所述信号片段中的每一帧所述语音信号，采用傅里叶变换的方式从时域转换至频域。

4.如权利要求2所述的一种音频测试的预处理方法，其特征在于，所述步骤S6中，采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。

5.如权利要求4所述的一种音频测试的预处理方法，其特征在于，所述步骤S6中，针对每个所述处理信号片中的每一帧所述语音信号，采用反傅里叶变换的方式从频域恢复至时域。

6.如权利要求1所述的一种音频测试的预处理方法，其特征在于：在执行所述音频测试的预处理之前，还执行如下步骤S0：预先向所述人工嘴中输入一白噪音信号，采集所述人工嘴播放的白噪音信号，根据所述人工嘴播放的白噪音信号获取所述人工嘴的频响值并进行存储。

7.一种音频测试的预处理系统，其特征在于：应用于如权利要求1所述的一种音频测试的预处理方法中，包括：

预扣除单元，与所述频域转换单元连接，用于对每个所述信号片段扣除预先获取的所述人工嘴的频响值，以分别形成处理信号片；

将所述处理语音信号用于后续的音频测试中。

8.如权利要求7所述的一种音频测试的预处理系统，其特征在于：所述频域转换单元还用于采用傅立叶变换将每个所述信号片段分别从时域转换至频域。

9.如权利要求7所述的一种音频测试的预处理系统，其特征在于：所述时域转换单元还用于采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。

10.如权利要求7所述的一种音频测试的预处理系统，其特征在于：

输入单元，用于预先向所述人工嘴中输入一白噪音信号，经由所述人工嘴播放；

所述采集单元采集用于所述人工嘴播放的白噪音信号；