CN107170465A - 一种音频质量检测方法及音频质量检测系统 - Google Patents

一种音频质量检测方法及音频质量检测系统 Download PDF

Info

Publication number
CN107170465A
CN107170465A CN201710517195.0A CN201710517195A CN107170465A CN 107170465 A CN107170465 A CN 107170465A CN 201710517195 A CN201710517195 A CN 201710517195A CN 107170465 A CN107170465 A CN 107170465A
Authority
CN
China
Prior art keywords
equipment
passage
checked
audio
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710517195.0A
Other languages
English (en)
Other versions
CN107170465B (zh
Inventor
宋扬
程兰颖
赵涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Data Hall (beijing) Polytron Technologies Inc
Original Assignee
Data Hall (beijing) Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Data Hall (beijing) Polytron Technologies Inc filed Critical Data Hall (beijing) Polytron Technologies Inc
Priority to CN201710517195.0A priority Critical patent/CN107170465B/zh
Publication of CN107170465A publication Critical patent/CN107170465A/zh
Application granted granted Critical
Publication of CN107170465B publication Critical patent/CN107170465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

本申请公开了一种音频质量检测方法及音频质量检测系统,其中,所述音频质量检测方法通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果;并且为了避免所述待检测设备所有通道出现同样的问题以及各种噪音导致的检测异常,所述音频质量检测方法通过获取参考设备的参考通道的音频数据,并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果,并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告,从而在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上,增加了所述音频质量检测方法的鲁棒性。

Description

一种音频质量检测方法及音频质量检测系统
技术领域
本申请涉及音频检测技术领域,更具体地说,涉及一种音频质量检测方法及音频质量检测系统。
背景技术
多通道同步音频采集设备,广泛应用于智能家居或会议室系统等各种智能设备中,主要用来实现远场音频逝去、语音增强和噪声消除等功能。
麦克风阵列作为多通道同步音频采集设备中的一种,包括多个麦克风,每个麦克风作为一个通道用于采集音频数据,为了结合应用麦克风阵列的智能设备的算法,获取麦克风阵列的训练数据成为一个常见的工作。在现实数据收集过程中,各通道采集的音频数据由于可能会受到突发电路噪声或环境噪声或硬件的影响,造成采集的音频数据在单一通道或多通道存在质量问题,如何检测出麦克风阵列各个通道存在的音频质量问题成为相关技术人员努力的方向。
现有技术中对于多通道同步音频采集设备各个通道采集音频质量检测通常通过人工监测的方式实现,这种音频质量检测方法需要投入大量的人力成本,并且检测精确度不高。
发明内容
为解决上述技术问题,本发明提供了一种音频质量检测方法及音频质量检测系统,以实现降低多通道同步音频采集设备音频质量检测过程中投入的人力成本,并提高音频质量检测精确度的目的。
为实现上述技术目的,本发明实施例提供了如下技术方案:
一种音频质量检测方法,用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测方法包括:
获取待检测设备每个通道的音频数据,构成待测音频组;
获取参考设备参考通道的音频数据;
对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
可选的,所述获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决之前还包括:
根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移;
根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
可选的,所述获取待检测设备每个通道的音频数据,构成待测音频组,及获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,及对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理之前还包括:
利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
可选的,所述利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果包括:
利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
可选的,所述根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果包括:
统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
可选的,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果包括:
利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
可选的,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d- (m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
可选的,所述根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果包括:
当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
可选的,所述根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告包括:
当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
一种音频质量检测系统,用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测系统包括:
音频获取模块,用于获取待检测设备每个通道的音频数据,构成待测音频组,并获取参考设备参考通道的音频数据;
帧特征提取模块,用于对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
同设备帧相关判决模块,用于利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
设备间帧相关判决模块,用于利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
同设备帧异常判决模块,用于根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
设备间帧异常判决模块,用于根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
结果统计模块,用于根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
可选的,还包括:
同步校准模块,用于根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移,和用于根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
可选的,还包括:
语音段处理模块,用于利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
可选的,所述同设备帧相关判决模块利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果具体用于,利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
可选的,所述同设备帧异常判决模块根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果具体用于,统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
可选的,所述设备间帧相关判决模块利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果具体用于,利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
可选的,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d- (m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
可选的,所述设备间帧异常判决模块根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果具体用于,当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
可选的,所述结果统计模块根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告具体用于,当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
从上述技术方案可以看出,本发明实施例提供了一种音频质量检测方法及音频质量检测系统,其中,所述音频质量检测方法通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果;并且为了避免所述待检测设备所有通道出现同样的问题以及各种噪音导致的检测异常,所述音频质量检测方法通过获取参考设备的参考通道的音频数据,并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果,并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告,从而在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上,增加了所述音频质量检测方法的鲁棒性。
利用所述音频质量检测方法对多通道同步音频采集设备的音频质量进行检测不仅可以大幅压缩人工检查工作,节省人力成本,提高效率,而且大大提高了对多通道同步音频采集设备的音频质量进行检测的精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请的一个实施例提供的一种音频质量检测方法的流程示意图;
图2为本申请的另一个实施例提供的一种音频质量检测方法的流程示意图;
图3为本申请的又一个实施例提供的一种音频质量检测方法的流程示意图;
图4为本申请的一个实施例提供的一种音频质量检测系统的结构示意图;
图5为本申请的另一个实施例提供的一种音频质量检测系统的结构示意图;
图6为本申请的又一个实施例提供的一种音频质量检测系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供了一种音频质量检测方法,如图1所示,用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测方法包括:
S101:获取待检测设备每个通道的音频数据,构成待测音频组;
S102:获取参考设备参考通道的音频数据;
S103:对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
S104:利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
S105:利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
S106:根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
S107:根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
S108:根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
需要说明的是,所述待检测设备是指需要进行音频质量检测的多通道同步音频采集设备,所述参考设备是指为待检测设备提供参考量的多通道同步音频采集设备。
还需要说明的是,本申请实施例提供的音频质量检测方法基于信号相关性实现,相互关系数是研究变量之间相关性的量。在信号处理领域中,它用来度量两个信号之间的相似程度,多通道同步音频采集设备中每个通道所录制的信号(音频数据)来自于同一个声源,具有一定的相似性,如果某一通道和其他通道表现出较差的相关性,则可判断该通道的语音信号可能出现了问题。因此,在所述音频质量检测方法中,我们首先通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果;
但是单一的设备内通道相关性检测会存在一些问题,主要有:
1、当设备(多通道同步音频采集设备)的所有通道都出现同样的问题时,无法检测出出现的问题;
2、由于各种噪音而导致的检测错误。
因此,在所述音频质量检测方法中,还通过获取参考设备的参考通道的音频数据,并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果,并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告的方式来解决上述问题。因此,所述音频质量检测方法在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上,增加了所述音频质量检测方法的鲁棒性。
利用所述音频质量检测方法对多通道同步音频采集设备的音频质量进行检测不仅可以大幅压缩人工检查工作,节省人力成本,提高效率,而且大大提高了对多通道同步音频采集设备的音频质量进行检测的精确度。
本申请的一个具体实施例提供了一种对音频数据进行时域分帧和特征提取处理的具体步骤,包括:
1、时域分帧:将音频信号拆分成帧信号,帧长选取考虑信号的短时稳态特性,选取定长帧移,并做加窗平滑处理。在本实施例中,帧长可以选择25ms,帧移可以选择12.5ms,用alpha值为0.46的Hamming窗做平滑处理。
2、特征提取:对于语音段信号,提取每帧音频数据的声学特性,表示为固定维度的特征向量,特征参量使用13维梅尔倒谱系数MFCC和帧能量。
语音段信号是指音频数据中有含义的信号段,例如记录人声或乐器声音等在频谱分布上有一定规律的信号段。
但在本申请的其他实施例中,所述帧长及帧移还可以选择其他数值,选取的窗种类还可以是其他的余弦窗。本申请对此并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的一个实施例中,如图2所示,所述获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决之前还包括:
S109:根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移;
根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
需要说明的是,本申请的一个实施例提供了一种对待检测设备和参考设备的音频数据进行校准的具体实现方式:
1、从所述待检测设备和参考设备中各选择一个通道的音频数据作为同步参考信号,从语音段中随机抽取20帧不间隔的帧,并记录帧号。任意两设备之间的同步偏差帧数满足:
其中,表示J设备中帧号为ki的帧的MRCC特征向量,ρ(x,y)为向量x和y之间的相关系数,ki为随机抽取的不间隔20帧的帧号。该公式计算J设备和R设备之间各一通道(可以默认为通道0)指定帧的相关系数之和,求出同步偏差帧移n,使得该相关系数之和最大化。
在上述实施例的基础上,在本申请的另一个实施例中,如图3所示,所述获取待检测设备每个通道的音频数据,构成待测音频组,及获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,及对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理之前还包括:
S110:利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
语音活动检测(Voice Activity Detection,VAD)算法,又称语音端点检测算法或语音边界检测算法,在本实施例中,主要用来标注所述音频数据中的语音段和非语音段,并利用标注结果去除音频数据中的非语音段。这是因为在音频质量检测过程中,我们更加关注语音段的检测结果,非语音段的相关性计算结果并不能很好的代表同步音频采集设备的音频质量。因此在本实施例中,我们通过VAD算法来去除音频数据中的非语音段,来实现降低数据处理量,进一步增加音频质量检测准确性的目的。
在上述实施例的基础上,在本申请的又一个实施例中,所述利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果包括:
S1041:利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
S1042:判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
若将所述待检测设备的一个帧相关系数矩阵表示为则对其进行帧相关判决的过程可以用以下公式表示:
其中,表示设备ID为SN的待检测设备第i通道与第j通道的相关系数的帧相关判决结果,表示设备ID为SN的待检测设备第i通道与第j通道的相关系数,T(m)表示所述第一预设阈值,所述第一预设阈值可以通过经验值设定,也可以通过训练样本训练获得,本申请对此并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的再一个实施例中,所述根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果包括:
S1061:统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
S1062:当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
在本申请的一个具体实施例中,所述预设数值为设备通道数-2,即用公式表示上述过程可以表示如下:
其中,设备内音频异常检测结果em为一个n维的向量,其中n即是所述待检测设备的通道数目。
在本申请的一个具体实施例中,所述N的取值为3。但在本申请的其他实施例中,N的取值还可以为2或4或5。本申请对此并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的一个实施例中,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果包括:
S1051:利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
S1052:判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
具体过程与步骤S1041及步骤S1042类似,只是判决门限更换为了第二预设阈值;
同样的,所述第二预设阈值可以通过经验值设定,也可以通过训练样本训练获得。
在本申请的一个具体实施例中,提供了一种通过训练样本获得所述第一预设阈值和第二预设阈值的方法,在本实施例中,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d- (m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
在上述实施例的基础上,在本申请的一个优选实施例中,所述根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果包括:
当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
其具体过程与步骤S1061及步骤S1062类似,在此不做赘述。
在上述实施例的基础上,在本申请的一个具体实施例中,所述根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告包括:
当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
下面对本申请实施例提供的音频质量检测系统进行描述,下文描述的音频质量检测系统与上文描述的音频质量检测方法可相互对应参照,如图4所示,所述音频质量检测系统用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测系统包括:
音频获取模块100,用于获取待检测设备每个通道的音频数据,构成待测音频组,并获取参考设备参考通道的音频数据;
帧特征提取模块200,用于对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
同设备帧相关判决模块300,用于利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
设备间帧相关判决模块400,用于利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
同设备帧异常判决模块500,用于根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
设备间帧异常判决模块600,用于根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
结果统计模块700,用于根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
可选的,如图5所示,所述音频质量检测系统还包括:
同步校准模块800,用于根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移,和用于根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
可选的,如图6所示,所述音频质量检测系统还包括:
语音段处理模块900,用于利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
可选的,所述同设备帧相关判决模块300利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果具体用于,利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
可选的,所述同设备帧异常判决模块500根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果具体用于,统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
可选的,所述设备间帧相关判决模块400利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果具体用于,利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
可选的,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d- (m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
可选的,所述设备间帧异常判决模块600根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果具体用于,当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
可选的,所述结果统计模块700根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告具体用于,当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
综上所述,本申请实施例提供了一种音频质量检测方法及音频质量检测系统,其中,所述音频质量检测方法通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果;并且为了避免所述待检测设备所有通道出现同样的问题以及各种噪音导致的检测异常,所述音频质量检测方法通过获取参考设备的参考通道的音频数据,并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果,并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告,从而在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上,增加了所述音频质量检测方法的鲁棒性。
利用所述音频质量检测方法对多通道同步音频采集设备的音频质量进行检测不仅可以大幅压缩人工检查工作,节省人力成本,提高效率,而且大大提高了对多通道同步音频采集设备的音频质量进行检测的精确度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (18)

1.一种音频质量检测方法,其特征在于,用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测方法包括:
获取待检测设备每个通道的音频数据,构成待测音频组;
获取参考设备参考通道的音频数据;
对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
2.根据权利要求1所述的方法,其特征在于,所述获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决之前还包括:
根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移;
根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
3.根据权利要求2所述的方法,其特征在于,所述获取待检测设备每个通道的音频数据,构成待测音频组,及获取参考设备参考通道的音频数据之后,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,及对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理之前还包括:
利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
4.根据权利要求3所述的方法,其特征在于,所述利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果包括:
利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果包括:
统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
6.根据权利要求5所述的方法,其特征在于,所述利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果包括:
利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
7.根据权利要求6所述的方法,其特征在于,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d-(m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
8.根据权利要求6所述的方法,其特征在于,所述根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果包括:
当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
9.根据权利要求8所述的方法,其特征在于,所述根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告包括:
当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
10.一种音频质量检测系统,其特征在于,用于检测多通道同步音频采集设备的音频质量,所述多通道同步音频采集设备具有多个通道,每个所述通道用于采集音频数据;所述音频质量检测系统包括:
音频获取模块,用于获取待检测设备每个通道的音频数据,构成待测音频组,并获取参考设备参考通道的音频数据;
帧特征提取模块,用于对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理,获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量;
同设备帧相关判决模块,用于利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果;
设备间帧相关判决模块,用于利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果,所述目标通道为所述待检测设备多个通道中的任意一个;
同设备帧异常判决模块,用于根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果;
设备间帧异常判决模块,用于根据所述目标通道的多个设备间判决结果,判断所述待检测设备目标通道是否异常,获得所述目标通道的设备间音频异常检测结果;
结果统计模块,用于根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告。
11.根据权利要求10所述的系统,其特征在于,还包括:
同步校准模块,用于根据所述待检测设备任一通道的音频数据与所述参考通道的音频数据,计算所述待检测设备与所述参考设备的同步偏差帧移,和用于根据所述同步偏差帧移对所述参考设备参考通道的音频数据进行同步校准,使所述参考通道的音频数据与所述待检测设备每个通道的音频数据在时域上对齐。
12.根据权利要求11所述的系统,其特征在于,还包括:
语音段处理模块,用于利用语音活动检测算法去除所述参考通道的音频数据中的非语音段以及所述待检测设备每个通道的音频数据中的非语音段。
13.根据权利要求12所述的系统,其特征在于,所述同设备帧相关判决模块利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决,获得所述待检测设备各个通道的多个判决结果具体用于,利用所述待检测设备每两个通道的帧特征向量,计算所述待检测设备每两个通道的帧相关系数,所述待检测设备每两个通道的帧相关系数构成所述待检测设备的帧相关系数矩阵;
判断所述待检测设备的帧相关系数矩阵中的帧相关系数是否大于第一预设阈值,如果是,则将1作为与所述帧相关系数对应的通道的判决结果;如果否,则将0作为与所述帧相关系数对应的通道的判决结果。
14.根据权利要求13所述的系统,其特征在于,所述同设备帧异常判决模块根据所述待检测设备各个通道的多个判决结果,判断所述待检测设备各个通道是否异常,获得所述待检测设备各个通道的设备内音频异常检测结果具体用于,统计所述待检测设备各个通道与其他通道的判决结果之和,判断所述待检测设备各个通道与其他通道的判决结果之和是否大于预设数值,如果是,则将1作为所述待检测设备通道的设备内检测结果,如果否,则将0作为所述待检测设备通道的设备内检测结果;
当所述检测设备通道的设备内检测结果连续为1的个数超过N时,将该通道判定为异常,并将该通道的设备内音频异常检测结果设为1,否则将该通道的设备内音频异常检测结果设为0。
15.根据权利要求14所述的系统,其特征在于,所述设备间帧相关判决模块利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决,获得所述目标通道的多个设备间判决结果具体用于,利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量,计算所述参考通道与所述待检测设备目标通道的帧相关系数;
判断所述参考通道与所述待检测设备目标通道的帧相关系数是否大于第二预设阈值,如果是,则将1作为所述目标通道的设备间判决结果;如果否,则将0作为所述目标通道的设备间判决结果。
16.根据权利要求15所述的系统,其特征在于,所述第一预设阈值通过第一样本库训练获得,所述第二预设阈值通过第二样本库训练获得,所述第一样本库为同设备音频数据样本库,所述第二样本库为设备间音频数据样本库;
所述第一预设阈值的具体训练获得过程包括:
根据所述第一样本库统计第一正样本出现概率和第一负样本出现概率,其中,正样本表示所述第一样本库中正常音频数据样本,负样本表示所述第一样本库中异常音频数据样本;
将所述第一正样本出现概率和第一负样本出现概率代入第一预设公式中,获得所述第一预设阈值;
所述第一预设公式为:其中,d+ (m)和d- (m)分别表示设备m第一正样本概率密度分布函数和第一负样本概率密度分布函数;p+ (m)和p- (m)分别表示第一正样本出现概率和第一负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(m)表示所述第一预设阈值;
所述第二预设阈值的具体训练获得过程包括:
根据所述第二样本库统计第二正样本出现概率和第二负样本出现概率,其中,正样本表示所述第二样本库中正常音频数据样本,负样本表示所述第二样本库中异常音频数据样本;
将所述第二正样本出现概率和第二负样本出现概率代入第二预设公式中,获得所述第二预设阈值;
所述第二预设公式为:其中,d+ (0,m)和d- (0,m)分别表示第二正样本概率密度分布函数和第二负样本概率密度分布函数;p+ (0,m)和p- (0,m)分别表示第二正样本出现概率和第二负样本出现概率;ω+和ω-分别为正样本和负样本的权重系数;T(0,m)表示所述第二预设阈值。
17.根据权利要求15所述的系统,其特征在于,所述设备间帧异常判决模块根据所述目标通道的多个设备间判决结果,获得所述目标通道的设备间检测结果具体用于,当所述目标通道的设备间检测结果连续为1的个数超过N时,将所述目标通道判定为异常,并将所述目标通道的设备间音频异常检测结果设为1,否则将所述目标通道的设备间音频异常检测结果设为0。
18.根据权利要求17所述的系统,其特征在于,所述结果统计模块根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果,生成音频检测报告具体用于,当Sl (p)=1,S(p)=1时,判定p设备l通道异常,需检查p设备l通道,且p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=1,S(p)=0时,判定p设备与参考通道不一致,需检查p设备硬件设置;
当Sl (p)=0,S(p)=1时,判定p设备l通道异常,需检查p设备l通道;
当Sl (p)=0,S(p)=0时,判定p设备l通道正常;
其中,p设备表示所述待检测设备,Sl (p)=1表示所述待检测设备l通道的设备内检测结果为1,Sl (p)=0表示所述待检测设备l通道的设备内检测结果为0;S(p)=1表示所述待检测设备参考通道的设备间检测结果为1,S(p)=0表示所述待检测设备参考通道设备内检测结果为0。
CN201710517195.0A 2017-06-29 2017-06-29 一种音频质量检测方法及音频质量检测系统 Active CN107170465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710517195.0A CN107170465B (zh) 2017-06-29 2017-06-29 一种音频质量检测方法及音频质量检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710517195.0A CN107170465B (zh) 2017-06-29 2017-06-29 一种音频质量检测方法及音频质量检测系统

Publications (2)

Publication Number Publication Date
CN107170465A true CN107170465A (zh) 2017-09-15
CN107170465B CN107170465B (zh) 2020-07-14

Family

ID=59826623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710517195.0A Active CN107170465B (zh) 2017-06-29 2017-06-29 一种音频质量检测方法及音频质量检测系统

Country Status (1)

Country Link
CN (1) CN107170465B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572640A (zh) * 2018-05-10 2018-09-25 北京中能博泰科技有限公司 一种工业系统智能诊断方法
CN108877837A (zh) * 2018-06-12 2018-11-23 北京小米移动软件有限公司 音频信号异常识别方法、装置和存储介质
CN109246570A (zh) * 2018-08-29 2019-01-18 北京声智科技有限公司 麦克风质检的装置及方法
CN110798790A (zh) * 2018-08-01 2020-02-14 杭州海康威视数字技术股份有限公司 麦克风异常检测方法、装置存储介质
CN112037825A (zh) * 2020-08-10 2020-12-04 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
CN112542179A (zh) * 2020-12-09 2021-03-23 世邦通信股份有限公司 一种音频检测方法及系统
CN112786070A (zh) * 2020-12-28 2021-05-11 Oppo广东移动通信有限公司 音频数据处理方法、装置、存储介质与电子设备
CN113380274A (zh) * 2021-06-11 2021-09-10 深圳风角智能科技有限公司 一种智慧广播音频质量评估噪音检测方法
CN118155654A (zh) * 2024-05-10 2024-06-07 腾讯科技(深圳)有限公司 模型训练方法、音频成分缺失识别方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115515A1 (en) * 2001-12-13 2003-06-19 Curtis Chris B. Method and apparatus for testing digital channels in a wireless communication system
EP1979900A1 (en) * 2006-02-03 2008-10-15 Electronics and Telecommunications Research Institute Apparatus for estimating sound quality of audio codec in multi-channel and method therefor
CN102056053A (zh) * 2010-12-17 2011-05-11 中兴通讯股份有限公司 一种多话筒混音方法及装置
CN102549657A (zh) * 2009-08-14 2012-07-04 皇家Kpn公司 用于确定音频系统的感知质量的方法和系统
CN103781092A (zh) * 2012-10-19 2014-05-07 北京三星通信技术研究有限公司 测量信道参考信号的方法及设备
CN103929707A (zh) * 2014-04-08 2014-07-16 深圳市中兴移动通信有限公司 一种检测麦克风音频通道状况的方法和移动终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115515A1 (en) * 2001-12-13 2003-06-19 Curtis Chris B. Method and apparatus for testing digital channels in a wireless communication system
EP1979900A1 (en) * 2006-02-03 2008-10-15 Electronics and Telecommunications Research Institute Apparatus for estimating sound quality of audio codec in multi-channel and method therefor
CN102549657A (zh) * 2009-08-14 2012-07-04 皇家Kpn公司 用于确定音频系统的感知质量的方法和系统
CN102056053A (zh) * 2010-12-17 2011-05-11 中兴通讯股份有限公司 一种多话筒混音方法及装置
CN103781092A (zh) * 2012-10-19 2014-05-07 北京三星通信技术研究有限公司 测量信道参考信号的方法及设备
CN103929707A (zh) * 2014-04-08 2014-07-16 深圳市中兴移动通信有限公司 一种检测麦克风音频通道状况的方法和移动终端

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572640A (zh) * 2018-05-10 2018-09-25 北京中能博泰科技有限公司 一种工业系统智能诊断方法
CN108877837A (zh) * 2018-06-12 2018-11-23 北京小米移动软件有限公司 音频信号异常识别方法、装置和存储介质
CN108877837B (zh) * 2018-06-12 2021-01-15 北京小米移动软件有限公司 音频信号异常识别方法、装置和存储介质
CN110798790A (zh) * 2018-08-01 2020-02-14 杭州海康威视数字技术股份有限公司 麦克风异常检测方法、装置存储介质
CN110798790B (zh) * 2018-08-01 2021-04-27 杭州海康威视数字技术股份有限公司 麦克风异常检测方法、装置及存储介质
CN109246570A (zh) * 2018-08-29 2019-01-18 北京声智科技有限公司 麦克风质检的装置及方法
CN112037825A (zh) * 2020-08-10 2020-12-04 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
CN112542179A (zh) * 2020-12-09 2021-03-23 世邦通信股份有限公司 一种音频检测方法及系统
CN112786070A (zh) * 2020-12-28 2021-05-11 Oppo广东移动通信有限公司 音频数据处理方法、装置、存储介质与电子设备
CN112786070B (zh) * 2020-12-28 2024-03-15 Oppo广东移动通信有限公司 音频数据处理方法、装置、存储介质与电子设备
CN113380274A (zh) * 2021-06-11 2021-09-10 深圳风角智能科技有限公司 一种智慧广播音频质量评估噪音检测方法
CN118155654A (zh) * 2024-05-10 2024-06-07 腾讯科技(深圳)有限公司 模型训练方法、音频成分缺失识别方法、装置及电子设备

Also Published As

Publication number Publication date
CN107170465B (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN107170465A (zh) 一种音频质量检测方法及音频质量检测系统
CN104739412B (zh) 一种对睡眠呼吸暂停进行监测的方法和设备
Chatrzarrin et al. Feature extraction for the differentiation of dry and wet cough sounds
US11304624B2 (en) Method and apparatus for performing dynamic respiratory classification and analysis for detecting wheeze particles and sources
EP2677927B1 (en) Respiration monitoring method and system
CN103903633B (zh) 检测语音信号的方法和装置
CN110570880B (zh) 一种鼾声信号识别方法
CN108670200A (zh) 一种基于深度学习的睡眠鼾声分类检测方法及系统
CN118141344A (zh) 用于估计扣除用户引起的伪影的用户耳内的噪声暴露量的方法和系统
US20130060100A1 (en) Contactless non-invasive analyzer of breathing sounds
Liu et al. Cough signal recognition with gammatone cepstral coefficients
KR20160039677A (ko) 보이스 활성화 탐지 방법 및 장치
WO2011123071A1 (en) An air conduction sensor and a system and a method for monitoring a health condition
CN105989853A (zh) 一种音频质量评测方法及系统
CN107280674A (zh) 基于音频录取设备的呼吸模式判决方法
CN111916104B (zh) 一种人工智能物联网宿舍管理系统及方法
CN105662454B (zh) 一种罗音检测的方法和装置
CN104992707A (zh) 一种腭裂语音喉塞音自动识别算法及装置
CN110942784A (zh) 基于支持向量机的鼾声分类系统
CN208520476U (zh) 一种高速插秧机噪声品质评价系统
CN103735267B (zh) 一种基于鼾声筛查osahs的装置
Nemati et al. Estimation of the lung function using acoustic features of the voluntary cough
CN104622432B (zh) 基于低音比的睡眠鼾声监测方法及系统
CN103519785B (zh) 基于实时语音多维建模的语音障碍多维测量系统及其方法
CN111613210A (zh) 一种各类呼吸暂停综合征的分类检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant