CN111312289B - 一种音频测试的预处理方法及系统 - Google Patents

一种音频测试的预处理方法及系统 Download PDF

Info

Publication number
CN111312289B
CN111312289B CN202010148237.XA CN202010148237A CN111312289B CN 111312289 B CN111312289 B CN 111312289B CN 202010148237 A CN202010148237 A CN 202010148237A CN 111312289 B CN111312289 B CN 111312289B
Authority
CN
China
Prior art keywords
signal
unit
artificial mouth
time domain
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010148237.XA
Other languages
English (en)
Other versions
CN111312289A (zh
Inventor
戎玲
胡融
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinghui Electronic Equipment Minhang Co ltd
Third Research Institute of the Ministry of Public Security
Original Assignee
Shanghai Jinghui Electronic Equipment Minhang Co ltd
Third Research Institute of the Ministry of Public Security
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinghui Electronic Equipment Minhang Co ltd, Third Research Institute of the Ministry of Public Security filed Critical Shanghai Jinghui Electronic Equipment Minhang Co ltd
Priority to CN202010148237.XA priority Critical patent/CN111312289B/zh
Publication of CN111312289A publication Critical patent/CN111312289A/zh
Application granted granted Critical
Publication of CN111312289B publication Critical patent/CN111312289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明涉及一种音频测试的预处理方法及系统,应用于对讲机领域,通过在频域信号领域将实时获取的人工嘴频响扣除,人工嘴播出的声音完全和原始信号一样,让后续测试做的更精准。

Description

一种音频测试的预处理方法及系统
技术领域
本发明涉及一种声音处理技术领域,尤其涉及一种音频测试的预处理方法及系统。
背景技术
在通讯行业里电声,声声测试中常用到人工嘴模拟人声和各种环境噪声。随着技术的进步,特别是AI的提出,对测试设备要求也提高了。希望能用真人语音和真实环境噪声来对被测物进行测试。
传统的测试是将录音信号通过人工嘴来还原人声和环境噪声,这样距存在一个问题,就是人工嘴送出的声音含有人工嘴的频响,也就是人工嘴送出的声音不是严格意义上原始信号,为了让测试做的更精准就需要把原始录音信号提前把人工嘴频响预先扣除,使得人工嘴播出的声音完全和原始信号一样。
发明内容
本发明利用反FFT技术在原始信号里预先扣除人工嘴频响从而解决现有技术中的问题,使得人工嘴播出的声音完全和原始信号一样。具体技术方案如下。
一种音频测试的预处理方法,执行如下步骤:
步骤S1,采集由人工嘴输出的原始语音信号,获取采样语音信号;
步骤S2,对所述采样语音信号进行同步处理,使得所述采样语音信号与所述原始语音信号在时间上同步;
步骤S3,将所述采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段;
步骤S4,将每个所述信号片段分别从时域转换至频域;
步骤S5,对每个所述信号片段扣除预先获取的所述人工嘴的频响值,以分别形成处理信号片;
步骤S6,分别将每个所述处理信号片从频域恢复至时域;
步骤S7,将恢复时域后的所有所述处理信号片按照原始时间顺序进行拼接,以形成处理语音信号;
步骤S8,将所述处理语音信号用于后续的音频测试中。
进一步的,所述步骤S4中,采用傅里叶变换的方式将所述信号片段从时域转换至频域。
进一步的,所述步骤S4中,针对每个所述信号片段中的每一帧所述语音信号,采用傅里叶变换的方式从时域转换至频域。
进一步的,所述步骤S6中,采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。
进一步的,所述步骤S6中,针对每个所述处理信号片中的每一帧所述语音信号,采用反傅里叶变换的方式从频域恢复至时域。
进一步的,在执行所述音频测试的预处理之前,还执行如下步骤S0:预先向所述人工嘴中输入一白噪音信号,采集所述人工嘴播放的白噪音信号,根据所述人工嘴播放的白噪音信号获取所述人工嘴的频响值并进行存储。
一种音频测试的预处理系统,应用于前述的一种音频测试的预处理方法中,包括:
采集单元,用于采集由人工嘴输出的原始语音信号,获取采样语音信号;
同步单元,与所述采集单元连接,对所述采样语音信号进行同步处理,使得所述采样语音信号与所述原始语音信号在时间上同步;
切片单元,与所述同步单元连接,用于采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段;
频域转换单元,与所述切片单元连接,用于将每个所述信号片段分别从时域转换至频域;
预扣除单元,与所述频域转换单元连接,用于对每个所述信号片段的扣除预先获取的所述人工嘴的频响值,以分别形成处理信号片;
时域转换单元,与所述预扣除单元连接,用于分别将每个所述处理信号片从频域恢复至时域;
拼接单元,与时域转换单元连接,用于将所有恢复至时域后的所有所述处理信号片按照原始时间顺序进行拼接,以形成处理语音信号;
将所述处理语音信号用于后续的音频测试中。
进一步的,所述频域转换单元还用于采用傅立叶变换将每个所述信号片段分别从时域转换至频域。
进一步的,所述时域转换单元还用于采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。
进一步的,包括输入单元,用于预先向所述人工嘴中输入一白噪音信号,经由所述人工嘴播放;
所述采集单元采集用于所述人工嘴播放的白噪音信号;
包括一获取单元,与所述采集单元连接,所述获取单元根据所述采集单元采集的所述人工嘴播放的白噪音信号获取所述人工嘴的频响值;
包括一存储单元,分别与获取单元和预扣除单元连接,所述存储单元存储所述人工嘴的频响值,所述预扣除单元从所述存储单元中获取所述人工嘴的频响值。
本发明的有益技术效果是:将采样录音信号提前把人工嘴频响预先扣除,使得人工嘴播出的声音完全和原始信号一样,让后续测试做的更精准。
附图说明
图1-2为本发明的方法步骤示意图。
图3为本发明的预处理系统的结构框图。
1、采集单元,2、切片单元,3、频域转换单元,4、预扣除单元,5、时域转换单元,6、拼接单元,7、获取单元,8、存储单元,9、输入单元,10、人工嘴,11、同步单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
请参阅图1-3,本发明设计一种音频测试的预处理方法及系统
一种音频测试的预处理方法,适用于对对讲机产品的音频测试;其特征在于,音频测试的预处理方法用于采用人工嘴10模拟真人语音和真实环境噪声对所述对讲机产品进行音频测试中,采集原始语音信号,得到采样语音信号并对所述采集采样语音信号采样语音信号执行如下步骤:
步骤S1,采集由人工嘴输出的原始语音信号,获取采样语音信号。
步骤S2,对所述采样语音信号进行同步处理,使得所述采样语音信号与所述原始语音信号在时间上同步;
步骤S3,将采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段。
例如,所述预设的时间间隔为20ms。
步骤S4,将每个信号片段分别从时域转换至频域。
步骤S5,对每个信号片段扣除预先获取的人工嘴10的频响值,以分别形成处理信号片。
将每一信号片段扣除人工嘴10的频响得到去除频响的频域信号,对每一信号片段都做如此处理。例如当一段原始语音信息切片切成N片后,每一信号片段扣除频响处理,共需要做N次处理。
输入白噪音来获取人工嘴的频响。由于人工嘴10的产生的频响会随着温度等周围的环境变化而变化,因此,在本发明的一个实施例中,直接获取当前时刻人工嘴10的频响,而不是存储很久的人工嘴10的频响。具体方法是输入白噪音来获取人工嘴10的频响。
只要不与在进行语音信号扣除频响的操作时刻的环境相差过大,其它相近时刻也可以获取频响。
进一步的,人工嘴10的频响的获取是在步骤S1之前获取。
步骤S6,分别将每个处理信号片从频域恢复至时域。
步骤S7,将恢复至时域后的所有处理信号片按照原始时间顺序进行拼接,以形成处理语音信号。
步骤S8,将处理语音信号用于后续的音频测试中。
进一步的,步骤S4中,采用傅里叶变换的方式将信号片段从时域转换至频域。
进一步的,步骤S4中,针对每个信号片段中的每一帧语音信号,采用傅里叶变换的方式从时域转换至频域,以分别获得每一帧语音信号的所述声音特征值。
进一步的,步骤S6中,采用反傅里叶变换的方式将信号片段从频域恢复至时域。
进一步的,步骤S6中,针对每个处理信号片中的每一帧语音信号,采用反傅里叶变换的方式从频域恢复至时域。
进一步的,在执行所述音频测试的预处理之前,还包括如下步骤S0:预先向人工嘴10中输入一白噪音信号,采集人工嘴10播放的白噪音信号,根据人工嘴10播放的白噪音信号获取人工嘴10的频响值;存储人工嘴10的频响值。
通过预先扣除人工嘴10的频响,使得人工嘴10播出的声音完全和原始信号一样,让测试做的更精准。
参阅图2-3,一种音频测试的预处理系统,包括:
采集单元1,用于采集由人工嘴播放的原始语音信号,获得采样语音信号;
同步单元11,与采集单元1连接,用于对采样语音信号进行同步处理,使得采样语音信号与原始语音信号在时间上同步;
切片单元2,与同步单元11连接,用于将所人工嘴10输出的采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段;
频域转换单元3,与切片单元2连接,用于将每个信号片段分别从时域转换至频域;
预扣除单元4,与频域转换单元3连接,用于对每个信号片段扣除预先获取的人工嘴10的频响值,以分别形成处理信号片;
时域转换单元5,与预扣除单元4连接,用于分别将每个处理信号片从频域恢复至时域;
拼接单元6,与时域转换单元5连接,用于将恢复至时域后的处理信号片按照原始时间顺序进行拼接,以形成处理语音信号;
将处理语音信号用于后续的音频测试中。
进一步的,频域转换单元3采用傅立叶变换将每个信号片段分别从时域转换至频域。
进一步的,时域转换单元5采用反傅里叶变换的方式将信号片段从频域恢复至时域。
进一步的,具有一输入单元9,预先向人工嘴10中输入一白噪音信号,经由人工嘴10播放,采集单元1采集人工嘴播10放的白噪音信号;
包括一获取单元7,与采集单元1连接,获取单元7根据采集单元1采集的人工嘴10播放的白噪音信号获取人工嘴10的频响值;
包括一存储单元8,分别与获取单元7和预扣除单元4连接,存储单元8存储人工嘴10的频响值,预扣除单元4从存储单元8中获取人工嘴10的频响值。
所述预设的时间间隔为20ms。
通过傅立叶变换将音频信号由时域信号转变成频域信号减去实时获取人工嘴的频响,使得人工嘴10播出的声音完全和原始信号一样,让测试做的更精准。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (10)

1.一种音频测试的预处理方法,其特征在于,执行如下步骤:
步骤S1,采集由人工嘴输出的原始语音信号,获取采样语音信号;
步骤S2,对所述采样语音信号进行同步处理,使得所述采样语音信号与所述原始语音信号在时间上同步;
步骤S3,将所述采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段;
步骤S4,将每个所述信号片段分别从时域转换至频域;
步骤S5,对每个所述信号片段扣除预先获取的所述人工嘴的频响值,以分别形成处理信号片;
步骤S6,分别将每个所述处理信号片从频域恢复至时域;
步骤S7,将恢复至时域后的所有所述处理信号片按照原始时间顺序进行拼接,以形成处理语音信号;
步骤S8,将所述处理语音信号用于后续的音频测试中。
2.如权利要求1所述的一种音频测试的预处理方法,其特征在于,所述步骤S4中,采用傅里叶变换的方式将所述信号片段从时域转换至频域。
3.如权利要求2所述的一种音频测试的预处理方法,其特征在于,所述步骤S4中,针对每个所述信号片段中的每一帧所述语音信号,采用傅里叶变换的方式从时域转换至频域。
4.如权利要求2所述的一种音频测试的预处理方法,其特征在于,所述步骤S6中,采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。
5.如权利要求4所述的一种音频测试的预处理方法,其特征在于,所述步骤S6中,针对每个所述处理信号片中的每一帧所述语音信号,采用反傅里叶变换的方式从频域恢复至时域。
6.如权利要求1所述的一种音频测试的预处理方法,其特征在于:在执行所述音频测试的预处理之前,还执行如下步骤S0:预先向所述人工嘴中输入一白噪音信号,采集所述人工嘴播放的白噪音信号,根据所述人工嘴播放的白噪音信号获取所述人工嘴的频响值并进行存储。
7.一种音频测试的预处理系统,其特征在于:应用于如权利要求1所述的一种音频测试的预处理方法中,包括:
采集单元,用于采集由人工嘴输出的原始语音信号,获取采样语音信号;
同步单元,与所述采集单元连接,对所述采样语音信号进行同步处理,使得所述采样语音信号与所述原始语音信号在时间上同步;
切片单元,与所述同步单元连接,用于采样语音信号按照预设的时间间隔进行切片,以形成多个信号片段;
频域转换单元,与所述切片单元连接,用于将每个所述信号片段分别从时域转换至频域;
预扣除单元,与所述频域转换单元连接,用于对每个所述信号片段扣除预先获取的所述人工嘴的频响值,以分别形成处理信号片;
时域转换单元,与所述预扣除单元连接,用于分别将每个所述处理信号片从频域恢复至时域;
拼接单元,与时域转换单元连接,用于将所有恢复至时域后的所有所述处理信号片按照原始时间顺序进行拼接,以形成处理语音信号;
将所述处理语音信号用于后续的音频测试中。
8.如权利要求7所述的一种音频测试的预处理系统,其特征在于:所述频域转换单元还用于采用傅立叶变换将每个所述信号片段分别从时域转换至频域。
9.如权利要求7所述的一种音频测试的预处理系统,其特征在于:所述时域转换单元还用于采用反傅里叶变换的方式将所述信号片段从频域恢复至时域。
10.如权利要求7所述的一种音频测试的预处理系统,其特征在于:
输入单元,用于预先向所述人工嘴中输入一白噪音信号,经由所述人工嘴播放;
所述采集单元采集用于所述人工嘴播放的白噪音信号;
包括一获取单元,与所述采集单元连接,所述获取单元根据所述采集单元采集的所述人工嘴播放的白噪音信号获取所述人工嘴的频响值;
包括一存储单元,分别与获取单元和预扣除单元连接,所述存储单元存储所述人工嘴的频响值,所述预扣除单元从所述存储单元中获取所述人工嘴的频响值。
CN202010148237.XA 2020-03-05 2020-03-05 一种音频测试的预处理方法及系统 Active CN111312289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148237.XA CN111312289B (zh) 2020-03-05 2020-03-05 一种音频测试的预处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148237.XA CN111312289B (zh) 2020-03-05 2020-03-05 一种音频测试的预处理方法及系统

Publications (2)

Publication Number Publication Date
CN111312289A CN111312289A (zh) 2020-06-19
CN111312289B true CN111312289B (zh) 2023-03-10

Family

ID=71160423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148237.XA Active CN111312289B (zh) 2020-03-05 2020-03-05 一种音频测试的预处理方法及系统

Country Status (1)

Country Link
CN (1) CN111312289B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355829A (zh) * 2007-07-25 2009-01-28 鹏智科技(深圳)有限公司 减小噪音影响的发声设备测试装置及测试方法
CN104050964A (zh) * 2014-06-17 2014-09-17 公安部第三研究所 音频信号还原度检测方法及系统
CN109803208A (zh) * 2019-01-31 2019-05-24 大陆汽车车身电子系统(芜湖)有限公司 一种音频文件处理方法及电子装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106328151B (zh) * 2015-06-30 2020-01-31 芋头科技(杭州)有限公司 一种环噪消除系统及其应用方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355829A (zh) * 2007-07-25 2009-01-28 鹏智科技(深圳)有限公司 减小噪音影响的发声设备测试装置及测试方法
CN104050964A (zh) * 2014-06-17 2014-09-17 公安部第三研究所 音频信号还原度检测方法及系统
CN109803208A (zh) * 2019-01-31 2019-05-24 大陆汽车车身电子系统(芜湖)有限公司 一种音频文件处理方法及电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周建芳 ; 陈新 ; .基于声卡的虚拟音频分析处理系统.2013,第46卷(第02期),全文. *

Also Published As

Publication number Publication date
CN111312289A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN108597498B (zh) 一种多麦克风语音采集方法及装置
CN110782920B (zh) 音频识别方法、装置及数据处理设备
CN110782872A (zh) 基于深度卷积循环神经网络的语种识别方法及装置
EP3166239B1 (en) Method and system for scoring human sound voice quality
CN105788603A (zh) 一种基于经验模态分解的音频识别方法及系统
CN109409308A (zh) 一种基于鸟类鸣声的鸟类物种识别的方法
US9058384B2 (en) System and method for identification of highly-variable vocalizations
CN109326160A (zh) 一种英语口语发音校对系统
CN112820315A (zh) 音频信号处理方法、装置、计算机设备及存储介质
CN112382313A (zh) 一种音频通讯质量评价系统及方法
CN111312289B (zh) 一种音频测试的预处理方法及系统
CN111276161B (zh) 一种语音质量评分系统及方法
CN112992190A (zh) 音频信号的处理方法、装置、电子设备和存储介质
CN111755025B (zh) 一种基于音频特征的状态检测方法、装置及设备
CN111103568A (zh) 一种声源定位方法、装置、介质和设备
JP4500458B2 (ja) 音声及びオーディオ信号用リアルタイム品質アナライザ
CN110324657A (zh) 模型生成、视频处理方法、装置、电子设备及存储介质
CN109213466B (zh) 庭审信息的显示方法及装置
CN110992966B (zh) 一种人声分离方法及系统
JP2003078423A (ja) ブラインド信号分離処理装置
JP7294422B2 (ja) 音モデル生成装置、音信号処理システム、音モデル生成方法、およびプログラム
CN111782860A (zh) 一种音频检测方法及装置、存储介质
CN111885474A (zh) 麦克风测试方法及装置
EP3014622A1 (en) Programme control
CN111028857A (zh) 基于深度学习的多通道音视频会议降噪的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant