CN115691556A - 一种设备端多通道语音质量的检测方法 - Google Patents

一种设备端多通道语音质量的检测方法 Download PDF

Info

Publication number
CN115691556A
CN115691556A CN202310000685.9A CN202310000685A CN115691556A CN 115691556 A CN115691556 A CN 115691556A CN 202310000685 A CN202310000685 A CN 202310000685A CN 115691556 A CN115691556 A CN 115691556A
Authority
CN
China
Prior art keywords
channel
microphone
mic
num
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310000685.9A
Other languages
English (en)
Other versions
CN115691556B (zh
Inventor
许乾坤
赵建平
张宇韬
陈麒聪
徐远江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruikelun Intelligent Technology Co ltd
Original Assignee
Beijing Ruikelun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruikelun Intelligent Technology Co ltd filed Critical Beijing Ruikelun Intelligent Technology Co ltd
Priority to CN202310000685.9A priority Critical patent/CN115691556B/zh
Publication of CN115691556A publication Critical patent/CN115691556A/zh
Application granted granted Critical
Publication of CN115691556B publication Critical patent/CN115691556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及语音质量评估技术领域,具体涉及一种设备端多通道语音质量的检测方法,其通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果。本发明仅需要数秒的录音数据,就可以进行检测多通道数据,并根据对录音的各类特征值进行分析,判断无效录音,从而准确有效探明具体是哪个通道出现问题。

Description

一种设备端多通道语音质量的检测方法
技术领域
本发明涉及语音质量评估技术领域,具体涉及一种设备端多通道语音质量的检测方法。
背景技术
目前,麦克风阵列技术广泛用于会话场景中,商用的阵列通常使用多通道麦克风进行录音并通过声卡等录音设备将模拟信号转换为数字信号,通用的多通道录音设备在智能设备中的应用通常被用来进行角度定位、语音增强和语音分离。进行这些操作可以增强目标方向的语音,提高录音信噪比和语音转写准确率。
语音信号可以通过多通道阵列设备进行增强,但需要保证每个麦克风通道信号的准确,检测方法通常有两种:一种是单独检测每个麦克风单元的收音效果,但检测效率低,且无法检测除麦克风单元之外的通道错误,如由电路和网络传输引起的信号错误;另一种是通过软件直接检测传输完成的数字信号,这种方法的好处是直接检测数字信号无论通道错误是由哪个环节引起的。
市场场景下没有检测多通道录音质量的方法,但所采用的阵列算法需要依靠信号,会产生无法准确得到结果的现象。本方法着眼检测设备端的麦克风信号,并判断出具体哪个通道出现问题,该方法可以有效应用于各种智能拾音产品,并不限于实时场景。
发明内容
本发明提供一种设备端多通道语音质量的检测方法,仅需要数秒的录音数据,就可以进行检测多通道数据,并根据对录音的各类特征值进行分析,判断无效录音,从而准确有效探明具体是哪个通道出现问题。
为了达到上述目的,本发明提供如下技术方案:一种设备端多通道语音质量的检测方法,其通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果。
优选的,用于获取所述多路麦克风数字信号的设备为多通道麦克风拾音器,所述多通道麦克风拾音器包含电路硬件拾音模组,所述硬件拾音模组包含2个或多个麦克风。
优选的,所述单通道特征提取额包含RMSE均方根能量、MFCC梅尔频率倒谱系数和F0基频;
所述RMSE均方根能量,通过分帧对一段多路麦克风数字信号的均方根RMS计算,其声压定义为声波在某一点产生的逾量瞬时压强的均方根值;
所述MFCC梅尔频率倒谱系数用于对提取的频谱进行平滑化,并消除谐波;
所述F0基频为声音分解的很多正弦波中频率最低的波。
优选的,所述差异提取为通道间的差异提取:通过单通道的特征提取保证录取到正确的信号;通过单通道的平滑频谱来计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。
优选的,将设备的麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号;所述多通道判决器对MIC_NUM路数字信号进行统计,RMSE均方根能量与F0基频的计算用于判断MIC_NUM路麦克风是否录制到正确录音,用于排查非正常能量和无人声的录音;Flux用于判断MIC_NUM路麦克风阵列抖动差异度,是否作为正常录音。
本发明有益效果为:本发明将软件算法作为检测手段,比直接检测麦克风、电路和传输路径等方式简单易行,而且不需要对所有的录音进行检测,只需提取数秒音频取样,即可有效地发掘单通道无效信号和若干通道间的抖动量,因此可判断具体通道的无效音频,并明确详细问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明整体步骤示意图;
图2为本发明通道间差异提取方式示意图;
图3为实施例中MIC_NUM为5的多通道录音。
具体实施方式
下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1、图2所示,一种设备端多通道语音质量的检测方法,该方法不局限硬件采集模块,通过获取数秒的多路麦克风数字信号,经由单通道特征提取,不同通道之间的差异提取,然后接入判决器得到检测结果。
其中优选的硬件采集模块,可为多通道麦克风拾音器,包含电路硬件拾音模组,麦克风数量可为2个或多个,本发明将麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号,其中检测时间描述可为MIC_TIME。
在单通道特征提取中,本发明中的提取的特征包含RMSE均方根能量(Root-Mean-Square Energy),MFCC梅尔频率倒谱系数(Mel-scale Frequency CepstralCoefficients)和F0基频(Fundamental Frequency)。
RMSE均方根能量,指的是声压有效值,通过分帧对一段声音信号的均方根(RMS)。声压定义为声波在某一点产生的逾量瞬时压强的均方根值。由于声压容易被人耳感知,也易于测量,因此,通常使用声压作为描述声波大小的物理量。
MFCC,梅尔频率倒谱系数,MFCC特征是对提取的频谱进行平滑化,并消除谐波的作用。此外还可以减少运算量,是一种在自动语音识别和说话人识别中广泛使用的特征。
F0,基本频率或简称基频,声音分解为很多正弦波,其中频率最低的波就是基音,其他频率高的为泛音。
单通道的特征提取能够保证录取到正确的信号,然而对于智能产品而言,需要使用阵列麦克风之间的一致性,如果存在麦克风单元差异过大则会影响到后置的阵列算法。因此检测必须对麦克风通道的相似性进行计算,即通过单通道的平滑频谱,计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。
多通道判决器将前述获取的MIC_TIME时长录音的特征进行统计,RMSE均方根能量与F0基频的计算可以判断每个麦克风是否录制到正确录音,可以用来排查非正常能量和无人声的录音;Flux则可以判断该阵列抖动差异度,是否作为正常录音。
实施例:
图3为MIC_NUM为5的多通道录音,即3个通道有录音质量问题,通过下表可以得出结论:从RMSE和F0指标可以得出通道3和4可能存在漏声或者静音的问题,再通过F0和Flux检验得出通道5存在录音抖动,结论与展示的录音结果一致。
Figure 850652DEST_PATH_IMAGE001
综上,本发明将软件算法作为检测手段,比直接检测麦克风、电路和传输路径等方式简单易行,不需要对所有的录音进行检测,只需提取数秒音频取样即可有效地发掘单通道无效信号和若干通道间的抖动量,同时还可判断具体通道的无效音频,并明确详细问题。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (5)

1.一种设备端多通道语音质量的检测方法,其特征在于:通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果。
2.根据权利要求1所述的一种设备端多通道语音质量的检测方法,其特征在于:用于获取所述多路麦克风数字信号的设备为多通道麦克风拾音器,所述多通道麦克风拾音器包含电路硬件拾音模组,所述硬件拾音模组包含2个或多个麦克风。
3.根据权利要求2所述的一种设备端多通道语音质量的检测方法,其特征在于:所述单通道特征提取额包含RMSE均方根能量、MFCC梅尔频率倒谱系数和F0基频;
所述RMSE均方根能量,通过分帧对一段多路麦克风数字信号的均方根RMS计算,其声压定义为声波在某一点产生的逾量瞬时压强的均方根值;
所述MFCC梅尔频率倒谱系数用于对提取的频谱进行平滑化,并消除谐波;
所述F0基频为声音分解的多个正弦波中频率最低的波。
4.根据权利要求3所述的一种设备端多通道语音质量的检测方法,其特征在于:所述差异提取为通道间的差异提取:通过单通道的特征提取保证录取到正确的信号;通过单通道的平滑频谱来计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。
5.根据权利要求4所述的一种设备端多通道语音质量的检测方法,其特征在于:将设备的麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号;所述多通道判决器对MIC_NUM路数字信号进行统计,RMSE均方根能量与F0基频的计算用于判断MIC_NUM路麦克风是否录制到正确录音,用于排查非正常能量和无人声的录音;Flux用于判断MIC_NUM路麦克风阵列抖动差异度,是否作为正常录音。
CN202310000685.9A 2023-01-03 2023-01-03 一种设备端多通道语音质量的检测方法 Active CN115691556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310000685.9A CN115691556B (zh) 2023-01-03 2023-01-03 一种设备端多通道语音质量的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310000685.9A CN115691556B (zh) 2023-01-03 2023-01-03 一种设备端多通道语音质量的检测方法

Publications (2)

Publication Number Publication Date
CN115691556A true CN115691556A (zh) 2023-02-03
CN115691556B CN115691556B (zh) 2023-03-14

Family

ID=85057580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310000685.9A Active CN115691556B (zh) 2023-01-03 2023-01-03 一种设备端多通道语音质量的检测方法

Country Status (1)

Country Link
CN (1) CN115691556B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117014A1 (en) * 2011-11-07 2013-05-09 Broadcom Corporation Multiple microphone based low complexity pitch detector
CN109215677A (zh) * 2018-08-16 2019-01-15 北京声加科技有限公司 一种适用于语音和音频的风噪检测和抑制方法和装置
CN109275084A (zh) * 2018-09-12 2019-01-25 北京小米智能科技有限公司 麦克风阵列的测试方法、装置、系统、设备和存储介质
CN109451415A (zh) * 2018-12-17 2019-03-08 深圳Tcl新技术有限公司 麦克风阵列自动校对方法、装置、设备及存储介质
CN112560913A (zh) * 2020-12-04 2021-03-26 东北大学 一种基于麦克风阵列的工业设备故障信号定位与识别方法
CN112969134A (zh) * 2021-02-07 2021-06-15 深圳市微纳感知计算技术有限公司 麦克风异常检测方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117014A1 (en) * 2011-11-07 2013-05-09 Broadcom Corporation Multiple microphone based low complexity pitch detector
CN109215677A (zh) * 2018-08-16 2019-01-15 北京声加科技有限公司 一种适用于语音和音频的风噪检测和抑制方法和装置
CN109275084A (zh) * 2018-09-12 2019-01-25 北京小米智能科技有限公司 麦克风阵列的测试方法、装置、系统、设备和存储介质
CN109451415A (zh) * 2018-12-17 2019-03-08 深圳Tcl新技术有限公司 麦克风阵列自动校对方法、装置、设备及存储介质
CN112560913A (zh) * 2020-12-04 2021-03-26 东北大学 一种基于麦克风阵列的工业设备故障信号定位与识别方法
CN112969134A (zh) * 2021-02-07 2021-06-15 深圳市微纳感知计算技术有限公司 麦克风异常检测方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘祥楼;王晓东;刘昭廷;刘瑞男;: "基于半球型麦克风阵列的点声源定位系统智能检测前端设计与实现" *
邓昌建;蒋世奇;蔚泽峰;明祥林;: "球形麦克风阵列时频故障信号定位算法研究" *

Also Published As

Publication number Publication date
CN115691556B (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
WO2020037555A1 (zh) 评估麦克风阵列一致性的方法、设备、装置和系统
CN110648678B (zh) 一种用于具有多麦克风会议的场景识别方法和系统
CN107170465B (zh) 一种音频质量检测方法及音频质量检测系统
KR100911679B1 (ko) 오디오 신호를 오디토리 이벤트로 세그먼트하는 방법
US20210256971A1 (en) Detection of replay attack
CN101023469B (zh) 数字滤波方法和装置
EP3166239B1 (en) Method and system for scoring human sound voice quality
EP2881948A1 (en) Spectral comb voice activity detection
CN112017693B (zh) 一种音频质量评估方法及装置
CN113259832B (zh) 麦克风阵列的检测方法、装置、电子设备及存储介质
CN110299141A (zh) 一种声纹识别中录音回放攻击检测的声学特征提取方法
CN108615536B (zh) 基于麦克风阵列的时频联合特征乐器音质评价系统及方法
CN112542174A (zh) 基于vad的多维特征参数声纹识别方法
CN110808068A (zh) 一种声音检测方法、装置、设备和存储介质
CN114487733A (zh) 一种基于声纹的局部放电检测方法
CN115691556B (zh) 一种设备端多通道语音质量的检测方法
CN111261194A (zh) 一种基于pcm技术的音量分析方法
CN111885474A (zh) 麦克风测试方法及装置
CN110634473A (zh) 一种基于mfcc的语音数字识别方法
CN110610724A (zh) 基于非均匀子带分离方差的语音端点检测方法及装置
EP3879184A1 (en) Noise reduction method and apparatus for household appliance, household appliance, and cooker hood
Zhou et al. Replay attack anaysis based on acoustic parameters of overall voice quality
CN109994121A (zh) 消除音频串扰的系统、方法和计算机存储介质
CN111314536B (zh) 一种用于检测终端设备的收听模块的方法及设备
CN117789764A (zh) 车机输出音频检测方法、系统、控制装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant