CN105374367A - 异常帧检测方法和装置 - Google Patents
异常帧检测方法和装置 Download PDFInfo
- Publication number
- CN105374367A CN105374367A CN201410366454.0A CN201410366454A CN105374367A CN 105374367 A CN105374367 A CN 105374367A CN 201410366454 A CN201410366454 A CN 201410366454A CN 105374367 A CN105374367 A CN 105374367A
- Authority
- CN
- China
- Prior art keywords
- frame
- signal
- value
- local energy
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 188
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000001514 detection method Methods 0.000 claims abstract description 74
- 238000004458 analytical method Methods 0.000 claims abstract description 46
- 238000001303 quality assessment method Methods 0.000 claims description 125
- 238000012360 testing method Methods 0.000 claims description 38
- 230000001427 coherent effect Effects 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 18
- 230000005856 abnormality Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000009499 grossing Methods 0.000 description 6
- 238000013441 quality evaluation Methods 0.000 description 6
- 101100152692 Nicotiana attenuata TD gene Proteins 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 210000005036 nerve Anatomy 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种异常帧检测方法和装置,其中方法包括:获取语音信号中的一个信号帧;将所述一个信号帧划分成至少两个子帧;获取所述一个信号帧的一个子帧的局部能量值;根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;若所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值,则确定所述一个信号帧是异常帧。本发明实现了对语音信号是否发生崎变的检测。
Description
技术领域
本发明涉及语音处理技术,尤其涉及一种异常帧检测方法和装置。
背景技术
在音频技术研究领域,对音频质量进行测试是其中一项重要内容。例如,某无线通信场景,声音从主叫方传输到被叫方,要经过模拟数字(Analog-to-Digital,简称:A/D)转换、编码、传输、解码和数模D/A转换等多种处理,在此过程中可能会出现由于编码或者传输中的丢包等因素,引起接收到的语音信号的质量下降,我们将语音质量下降的现象称为语音崎变。业界也研究了很多用于测试语音质量的方法,例如人工主观测试法,通过组织测试人员对待测试音频进行试听来给出测试评估结果,但是这种方法周期长且成本高;业界需要获得一种能够及时自动的检测语音是否发生崎变的方法,以对语音质量自动进行测试和评估。
发明内容
本发明实施例提供一种异常帧检测方法和装置,以检测语音信号是否发生崎变。
第一方面,提供一种异常帧检测方法,所述方法包括:
获取语音信号中的一个信号帧;
将所述一个信号帧划分成至少两个子帧;
获取所述一个信号帧的一个子帧的局部能量值;
根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;
对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;
若所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值,则确定所述一个信号帧是异常帧。
结合第一方面,在第一种可能的实现方式中,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;将所述在对数域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值为所述第一特征值。
结合第一方面,在第二种可能的实现方式中,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;获取所述一个信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值;将所述在对数域上的局部能量最大值与所述在对数域上的局部能量值最小值作差得到第二差值,所述第二差值为所述第一特征值。
结合第一方面,在第三种可能的实现方式中,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值作差得到第一差值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值与所述所述目标相关子帧的局部能量值中在对数域上的局部能量值最小值作差得到第二差值;选择所述第一差值和第二差值中的较小者作为第一特征值。
结合第一方面至第一方面的第三种可能的实现方式中的任一种,在第四种可能的实现方式中,所述对所述一个信号帧进行奇异性分析,得到用于表示奇异性特征的第二特征值,包括:对所述一个信号帧进行小波分解得到小波系数,并根据所述小波系数进行信号重构得到重构信号帧;根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到第二特征值,包括:将所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值作差,得到的差值为所述第二特征值。
结合第一方面至第一方面的第五种可能的实现方式中的任一种,在第六种可能的实现方式中,若所述一个信号帧与所述语音信号中前一个异常帧之间的间隔距离小于第三阈值,在确定所述一个信号帧为异常帧之后,还包括:将位于所述一个信号帧与所述前一个异常帧之间的正常帧调整为异常帧。
结合第一方面至第一方面的第五种可能的实现方式中的任一种,在第七种可能的实现方式中,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:统计所述语音信号中的异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。
结合第一方面至第一方面的第五种可能的实现方式中的任一种,在第八种可能的实现方式中,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:统计所述语音信号中异常帧所占的百分比;若所述异常帧所占的百分比大于第五阈值,则输出语音崎变告警信息。
结合第一方面至第一方面的第八种可能的实现方式中的任一种,在第九种可能的实现方式中,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,所述检测结果包括所述需要进行异常帧检测的信号帧中的任一帧是正常帧或者异常帧。
结合第一方面的第九种可能的实现方式中,在第十种可能的实现方式中,所述根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,包括:获取所述语音信号中的异常帧所占的百分比;根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值。
结合第一方面的第九种或第十种可能的实现方式中,在第十一种可能的实现方式中,在计算所述语音信号的第一语音质量评价值之后,还包括:获取使用语音质量评估方法得到的所述语音信号的第二语音质量评价值;根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值。
结合第一方面的第十一种可能的实现方式,在第十二种可能的实现方式中,所述根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值,包括:将所述第二语音质量评价值减去所述第一语音质量评价值,得到所述第三语音质量评价值。
结合第一方面至第一方面的第八种可能的实现方式,在第十三种可能的实现方式中,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:根据所述需要进行异常帧检测的信号帧的检测结果,获取所述语音信号的异常检测特征值;获取使用语音质量评估方法得到的所述语音信号的的评估特征值;利用评估系统,根据所述异常检测特征值和所述评估特征值得到第四语音质量评价值。
第二方面,提供一种异常帧检测装置,所述装置包括:
信号划分单元,用于获取语音信号中的一个信号帧,并将所述一个信号帧划分成至少两个子帧;
信号分析单元,用于获取所述一个信号帧的一个子帧的局部能量值;根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;
判断单元,用于在所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值时,确定所述一个信号帧是异常帧。
结合第二方面,在第一种可能的实现方式中,所述信号分析单元,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;将所述在对数域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值为所述第一特征值。
结合第二方面,在第二种可能的实现方式中,所述信号分析单元,在计算所述第一特征值时,具体是用于:确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;获取所述一个信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值;将所述在对数域上的局部能量最大值与所述在对数域上的局部能量值最小值作差得到第二差值,所述第二差值为所述第一特征值。
结合第二方面,在第三种可能的实现方式中,所述信号分析单元,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值作差得到第一差值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值与所述所述目标相关子帧的局部能量值中在对数域上的局部能量值最小值作差得到第二差值;选择所述第一差值和第二差值中的较小者作为第一特征值。
结合第二方面至第二方面的第三种可能的实现方式中的任一种,在第四种可能的实现方式中,所述信号分析单元,在计算所述第二特征值时,具体是用于:对所述一个信号帧进行小波分解得到小波系数,并根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,所述信号分析单元,在根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到第二特征值时,具体是用于:将所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值作差,得到的差值为所述第二特征值。
结合第二方面至第二方面的第五种可能的实现方式中的任一种,在第六种可能的实现方式中,还包括:信号处理单元,用于在一个信号帧与所述语音信号中前一个异常帧之间的间隔距离小于第三阈值时,如果所述信号帧是异常帧,将位于所述一个信号帧与所述前一个异常帧之间的正常帧调整为异常帧。
结合第二方面至第二方面的第五种可能的实现方式中的任一种,在第七种可能的实现方式中,还包括:信号处理单元,用于统计所述语音信号中的异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。
结合第二方面至第二方面的第五种可能的实现方式中的任一种,在第八种可能的实现方式中,还包括:信号处理单元,用于统计所述语音信号中异常帧所占的百分比;若所述异常帧所占的百分比大于第五阈值,则输出语音崎变告警信息。
结合第二方面至第二方面的第六种可能的实现方式中的任一种,在第九种可能的实现方式中,还包括:第一信号评价单元,用于根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,所述检测结果包括所述需要进行异常帧检测的信号帧中的任一帧是正常帧或者异常帧。
结合第二方面的第九种可能的实现方式中,在第十种可能的实现方式中,所述第一信号评价单元,在计算所述语音信号的第一语音质量评价值时,具体是用于:获取所述语音信号中的异常帧所占的百分比;根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值。
结合第二方面的第九种或第十种可能的实现方式中,在第十一种可能的实现方式中,所述第一信号评价单元,还用于获取使用语音质量评估方法得到的所述语音信号的第二语音质量评价值;根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值。
结合第二方面的第十一种可能的实现方式,在第十二种可能的实现方式中,所述第一信号评价单元,在根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值时,具体是用于将所述第二语音质量评价值减去所述第一语音质量评价值,得到所述第三语音质量评价值。
结合第二方面至第二方面的第八种可能的实现方式,在第十三种可能的实现方式中,还包括:第二信号评价单元,在在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还用于根据所述需要进行异常帧检测的信号帧的检测结果,获取所述语音信号的异常检测特征值;获取使用语音质量评估方法得到的所述语音信号的的评估特征值;利用评估系统,根据所述异常检测特征值和所述评估特征值得到第四语音质量评价值。
本发明实施例提供的异常帧检测方法和装置,通过对每个信号帧进行处理,比较信号帧中的局部信号能量差异,实现了对语音信号是否发生崎变的检测,能够确定某信号帧是否是异常帧。
附图说明
图1为本发明实施例提供的异常帧检测方法的应用场景示意图;
图2为本发明实施例提供的异常帧检测方法中的语音差异示意图;
图3为本发明实施例提供的一种异常帧检测方法的流程示意图;
图4为本发明实施例提供的一种异常帧检测方法中的语音信号示意图;
图5为本发明实施例提供的一种异常帧检测装置的结构示意图;
图6为本发明实施例提供的另一种异常帧检测装置的结构示意图;
图7为本发明实施例提供的异常帧检测装置的实体结构示意图。
具体实施方式
本发明实施例提供了一种异常帧检测方法,该方法可以用于检测语音信号中的每一个帧是正常帧或者异常帧,从时域上来定位语音崎变发生的位置,即语音信号的哪个帧发生异常。该方法的一种可选的应用场景可以参见图1,图1为本发明实施例提供的异常帧检测方法的应用场景示意图。
这是一个语音通信流程,声音从主叫方传输到被叫方,在主叫方,我们将A/D转换、以及编码前的信号定义为参考信号S1,考虑到编码以及传输对语音质量的负面影响,S1一般是整个流程中的最优质量;对应的,我们将经过解码、D/A转换后的信号定义为接收信号S2,一般的,S2的质量次于S1。那么,本实施例的异常帧检测方法可以用于在接收端对接收信号S2进行检测,具体可以用于检测接收信号S2中的每个帧是否发生异常。
下面将详细描述本发明实施例的异常帧检测方法如何进行语音检测,为了使得对该方法的思想理解更加容易和清楚,首先对本发明实施例中异常帧检测方法所依据的主要思路进行简单说明。参见图2,图2为本发明实施例提供的异常帧检测方法中的语音差异示意图。该图2中示出了正常语音和异常语音,该异常语音即发生语音崎变的语音,可以看到,正常语音和异常语音具有明显的差异性,例如,从局部能量来看,异常语音的局部能量波动比较大,局部能量的幅度落差较大;从小波系数来看,异常语音的小波系数的抖动幅度有所增加。本发明实施例就是要根据语音信号提取出能够反映上述差异性的特征值,通过该特征值的判断体现上述的差异性,例如是否发生了局部能量较大变化,从而确定语言信号是否发生崎变。
需要说明的是,在本发明的各个实施例中,均是以对待检测的语音信号中的每一个信号帧都进行所述的语音畸变检测方法的处理,并且是对当前正在处理的信号帧中的每一个子帧都进行该方法所述的处理;但是这只是一种可选的方式,在具体实施中,并不一定是语音信号中的每一个信号帧都要处理,可能只是选取了其中一部分信号帧进行处理;另外,在处理一个信号帧时,也不一定是处理每个子帧,也可能是选取了该信号帧中的一部分子帧进行处理。具体参见下面的实施例:
实施例一
图3为本发明实施例提供的一种异常帧检测方法的流程示意图,本实施例的方法可以用于检测待测试的语音信号,该语音信号例如是图1中的接收端的S2,在本实施例中,将S2称为“语音信号”;如图3所示,该方法可以包括:
301、获取语音信号中的一个信号帧,并将该信号帧划分成至少两个子帧;
其中,本实施例将语音信号的每一帧称为一个“信号帧”;并且,假设本实施例中信号帧的帧长是L_shift,即每一信号帧包括的语音采样的样本数是L_shift。为描述方便,假设本实施例的待测试的语音信号的总样本数能够被L_shift整除,且整个语音信号共有N帧,即语音信号s(n),n=1、2、3……N。并且,将每一信号帧划分成至少两个子帧,本实施例假设分成4个子帧(当然该数目在具体实施中可变),即将每一信号帧中的L_shift个样本数平均分成4份。
举例如下:参见图4,图4为本发明实施例提供的一种异常帧检测方法中的语音信号示意图。该语音信号共有6个信号帧,即“第1帧、第2帧……第6帧”,即s(n)中的n的最大取值N等于6;每一个信号帧的结构以第5帧为例,该第5帧被划分成4个子帧,分别是“第一子帧、第二字帧……第四子帧”;每个子帧中包括Ns个样本点,该样本点是语音测试中的语音采样的样本点,例如间隔1ms进行一次语音采样。整个信号帧(即共四个子帧)中包括的样本点的数目是4*Ns个,那么也就是L_shift的取值是4*Ns。当然,实际的样本点在时域上是间隔均匀的,图4仅是示例。
本实施例的异常帧检测方法是逐个信号帧进行判断是否异常,例如,先判断第1帧是正常帧还是异常帧,得到判断结果后,接着判断第2帧是正常帧还是异常帧,再接着判断第3帧,依次类推。那么,下面的302-307就是说明如何对其中的每一信号帧进行判断的,每一信号帧都进行如下的判断过程。需要说明的是,在302-307中,本实施例并不严格限制各步骤之间的顺序性,而只是为了描述方便对其进行了排序,但具体实施中302-307的序号并不对其执行顺序构成限制,例如303可以在302之前进行。
302、获取所述一个信号帧的一个子帧的局部能量值,根据所述一个子帧的局部能量值,得到用于表示一个信号帧的局部能量变化趋势的第一特征值;
本步骤是通过计算局部能量值,查看能量是否发生了较大的变化,例如前面所述的,与正常语音相比,异常语音的局部能量波动比较大,局部能量的幅度落差较大;而本步骤所计算的第一特征值能够用于表示所述信号帧的局部能量变化趋势,是根据每一子帧的局部能量值来计算的。
可选的,可以按照如下方法来计算第一特征值:
首先,对语音信号中的其中一个信号帧,分别获取所述信号帧中的每一子帧对应的局部能量值,并计算所有子帧对应的所有局部能量值的最大值和最小值;
本实施例以第5帧作为要执行异常判断的信号帧。本步骤中,要获取该第5帧中的每一子帧对应的局部能量值,其中一个子帧的局部能量值可以按照如下的公式(1)计算,其他子帧对应的局部能量值也按照该公式进行计算:
在公式(1)中,P是信号帧的局部能量值,M是该信号帧的子帧的数量,st和ed是当前子帧的起始样本点和末尾样本点,s(n)2是该信号帧的语音信号能量,L_shift是信号帧的样本点的数量。例如,在本发明的一个实施例中,M=4,即每一信号帧共有4个子帧,L_shift=4*Ns,即每一信号帧中共有4*Ns个样本点,Ns表示的是一个子帧的样本点的数量。以第5帧中的第四子帧为例,根据公式(1)的表述,那就是将第四子帧中的Ns个样本点的信号能量求和,然后该子帧的能量和乘以总的子帧数(即第5帧共有4个子帧),再除以该第5帧总的样本数,即得到的是第5帧中的第四子帧对应的局部能量值。以同样的方法,计算得到该第5帧中的第一子帧至第三子帧分别对应的局部能量值。如果将这四个子帧的局部能量值放入数组,可以定义P(i)(j),j=1,2……..M数组来存储这些局部能量值,表示第i帧的M个子帧的局部能量值,可以称为P数组。
本实施例中,还要计算所有子帧对应的所有局部能量值的最大值和最小值;以第5帧为例,可以计算第5帧对应的上述P数组在对数域的最大值PMax和最小值PMin。
接着,确定在时域上位于所述信号帧之前的相关信号帧中的目标相关子帧,并分别计算所述每一目标相关子帧对应的局部能量值、以及所有局部能量值的最小值;本实施例的相关信号帧和目标相关子帧指的是,与当前的信号帧具有影响关系的,能够综合得到能量变化趋势的信号帧或子帧。例如,要查看某个语音信号的局部能量的变化趋势,单看其中的某一个信号帧是不能看到这个变化趋势,需要综合在时域上位于该信号帧前面的一个信号帧、或者该信号帧前面的两个信号帧才能得到能量变化趋势,那么该信号帧前面的一个或两个信号帧就可以称为相关信号帧;更具体的,综合该信号帧的前面一个信号帧中的后两个子帧来得到能量变化趋势,那么这后两个子帧就是目标相关子帧。具体的例子可以参见下述:
本实施例中,还要考虑信号之间的相关性,即语音信号的各信号帧之间的相关性,所以还要确定在时域上位于信号帧之前的相关信号帧中的目标相关子帧。以本实施例要判断的第5帧为例,在302中已经计算了第5帧中的各个子帧对应的局部能量值,并采用P数组存储,且已经计算了这些局部能量值在对数域的最大值和最小值;那么在本步骤中,可以考虑第4帧,第4帧在时域上是位于第5帧之前,那么将第4帧称为“相关信号帧”;本实施例可以将第4帧的后两个子帧称为“目标相关子帧”,即要考虑这第4帧的后两个子帧对第5帧的影响。
可以定义Q数组,Q(i-1)(j),j=1,2……M,表示第i-1个信号帧的从第(M/2+1)子帧至第M子帧,即本实施例举例的后半子帧。该Q数组用于存储所述的第4帧的后两个子帧分别对应的局部能量值;当然,这两个子帧的局部能量值可以是在对第4帧进行判断时进行存储的,计算方法同公式(1),不再赘述,即局部能量值和局部能量值的计算方法相同,只是为了对不同帧中的子帧加以区分,使用了“第一”或者“第二”;本发明实施例中后续出现的“第三”或者“第四”等道理同样,只是用于区分,不具有严格的限制意义。特别的,当i=1时,Q数组默认为全零数组。本实施例还要计算所有局部能量值的最小值,例如计算第4帧的后两个子帧对应的Q数组在对数域的最小值Qmin(i-1)。
需要说明的是,本实施例对于相关信号帧中的目标相关子帧,是以第4帧的后两个子帧为例,具体实施中是可变的,例如可以将第4帧中的所有子帧都作为目标相关子帧,或者将第4帧中的后三个子帧作为目标相关子帧;更进一步的,还可以将第3帧和第4帧都作为相关信号帧,并且将第3帧的后两个子帧以及第4帧中的所有子帧均作为目标相关子帧。即具体实施中并不局限于本实施例列举的一种情况。
最后,根据所述当前信号帧对应的局部能量值的最大值和最小值、以及相关信号帧中的所述局部能量值的最小值,得到用于表示局部能量差异的第一特征值;
本实施例要根据前面获得的局部能量值的最大值和最小值、以及局部能量值的最小值,得到用于表示局部能量差异的第一特征值。
可选的,第一特征值可以定义为E1,按照如下公式(2)得到:
E1=min{PMax(i)-PMin(i),PMax(i)-QMin(i-1)}…………..(2)
在公式(2)中,PMax(i)表示当前信号帧的所有子帧对应的局部能量值的最大值,PMin(i)表示当前信号帧的所有子帧对应的局部能量值的最小值,QMin(i-1)表示相关信号帧中的目标相关子帧对应的局部能量值的最小值。
如上得到的E1可以反映子帧能量的变化趋势,也就是可以反映出图2中所示出的局部能量的变化,相当于能够反映类似图2中所示的局部能量的变化幅度。并且,根据公式(2)得到,如果将局部能量值在对数域上的最大值和最小值之差称为第一差值,将局部能量值的最大值与所述局部能量值在对数域上的最小值之差称为第二差值,就可以选择第一差值和第二差值中的较小者作为第一特征值E1。
可选的,本实施例中求取第一特征值,还可以采用如下方式:计算第一特征值时,只需使用局部能量值的最大值和最小值,将最大值和最小值之差的第一差值赋值给第一特征值;这相当于丢掉前一子帧的相关信息,只用当前帧信息。在另一个实施例中,还可以将第二差值直接作为第一特征值。
303、对信号帧进行奇异性分析,得到第二特征值;
本步骤是对信号帧进行奇异性分析(Singularityanalysis),该奇异性分析可以是局部的奇异性分析,也可以是全局的奇异性分析;所述的奇异性指的是例如图像纹理和信号尖点等,通过这些信号的重要特征的变化来反映正常帧和异常帧之间的差异性,并且将奇异性分析得到的特征值称为第二特征值,该第二特征值用于表示奇异性特征即上述奇异性的一些特征量。
具体实施中,奇异性分析包括多种方式,例如,傅立叶变换、小波分析、多分形等等;在本实施例中,选取了小波系数作为奇异性分析的特征,参见图2中所示,正常语音和异常语音的小波系数的抖动幅度具有较为明显的差异,因此可选的,本实施例以小波分析方法为例来对信号帧进行奇异性分析,但是本领域技术人员可以理解,实际实施中并不局限于小波分析方法,当然也可以采用其他多种奇异性分析的方式,并可以选择其他参数作为奇异性分析的特征,不再赘述,如下仅对小波分析方法的奇异性分析进行描述:
首先,对所述信号帧进行小波分解得到小波系数,并根据所述小波系数进行信号重构得到重构信号帧;
具体的,可以选择一个小波函数(相当于选择一组镜像滤波器组(QuadratureMirrorFilter,简称:QMF)),并选择合适的分解级数(例如级数是1),对信号帧例如第5帧进行小波分解。需要指明的是,本实施例只需要使用小波分解中的估计部分的小波系数CAL。按照小波的重构理论,根据小波系数进行信号重构,使用重构滤波器即可恢复对应的小波信号,称为重构信号帧W(n)。
接着,根据所述重构信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到用于表示所述局部能量最大值和局部能量平均值差异的第二特征值;
本实施例中,在计算了重构信号帧之后,即得到小波重构信号W(n)后,计算重构信号帧中的每一样本点的局部能量值,即对该W(n)中的每一样本点取平方W2(n),并计算W2(n)数组的最大值和平均值;该最大值可以称为局部能量最大值,该平均值可以称为局部能量平均值。根据局部能量最大值和局部能量平均值,可以得到反映两者差异的第二特征值;从图2来看,该局部能量最大值和局部能量平均值的差异相当于表示的是图2中的小波系数的抖动幅度。
可选的,可以将重构信号帧中的在对数域上的局部能量最大值和局部能量平均值之差,作为所述第二特征值,如果将该第二特征值定义为E2,其计算公式如下面的公式(3):
E2=max(log(W2(n)))–average(log(W2(n)))…………………….(3)
其中,max(log(W2(n)))和average(log(W2(n)))分别为W2(n)在对数域上的最大值和平均值。
此外,可选的,本实施例采用公式(1)来表示局部能量差异的第一特征值,但实际实施中并不局限于该公式,只要能反映出局部能量的变化即可;同理,本实施例采用公式(3)来表示第二特征值,具体实施中也并不局限于该公式,只要能表示出小波信号的变化即可。
304、若所述第一特征值满足第一阈值,并且所述第二特征值满足第二阈值,则确定所述信号帧是异常帧。
本实施例中,如果第一特征值E1满足预先设定的第一阈值THD1,例如是满足E1大于或等于THD1;并且,第二特征值E2满足预先设定的第二阈值THD2,例如是满足E2大于或等于THD2,即这两个条件同时满足,则认为信号帧是异常帧,在本实施例中即第5帧是异常帧。
其中,第一阈值THD1、第二阈值THD2的取值,本实施例不做限定,可以根据具体实施情况进行设置。例如,第一特征值E1能够反映的是类似图2中的局部能量的幅度变化,那么具体该幅度变化的变化值达到何种程度才认为是异常信号,这个可以自主设定,对应的就是设定第一阈值THD1的取值。同理,第二特征值E2能够反映的是类似图2中的小波系数的抖动幅度,那么具体该幅度变化的变化值达到何种程度才认为是异常信号,这个可以自主设定,对应的就是设定第二阈值THD2的取值。
此外,如果第一特征值E1不满足预先设定的第一阈值THD1,则可以认为是正常帧;或者,如果第二特征值E2不满足预先设定的第二阈值THD2,也可以认为是正常帧。
需要说明的是,本实施例中只要所述第一特征值满足第一阈值,并且所述第二特征值满足第二阈值,这两个条件均满足即可确定信号帧是异常帧;而至于先执行哪个条件的判断,本实施例不做限制。可选的,可以先计算第一特征值并判断是否满足第一阈值,如果满足,再进一步计算第二特征值并判断是否满足第二阈值。
执行完304,假设可以确定第5帧是异常帧,那么接着将进行下一帧即第6帧的判断,判断第6帧是正常帧或者异常帧,该第6帧的判断过程与第5帧相同,参照302至304所述。
本实施例提供的异常帧检测方法,通过对每个信号帧进行处理,比较信号帧中的局部信号能量的变化以及在小波域的变化,能够快速准确的定位发生语音崎变的位置,即哪个信号帧发生了语音崎变,实现了对语音信号是否发生崎变的检测;并且,采用本实施例的方法进行语音崎变检测,实现更为简单和快速,由于是根据正常语音和异常语音之间的差异来进行检测,准确度也更高。
为进一步更加清楚的理解本实施例的异常帧检测方法,做更进一步的说明如下:如上所述的,该方法是通过检测语音信号是否具有特定的差异特征来判断是否发生崎变,该特定的差异特征即是图2中所示的局部能量的变化以及小波系数的变化。对于如何判断语音信号是否发生局部能量变化和小波系数变化,本实施例的方法是逐个信号帧判断,并且是计算每个信号帧中的每个子帧的样本点平均能量值,查看该平均能量值的变化幅度来确定信号是否发生短时间内的巨大能量变化的;而对于小波系数,本实施例是对信号帧进行小波分解得到小波系数后,根据小波系数重构信号帧并判断该重构信号帧中的样本点能量的抖动幅度是否达到设定的阈值。本实施例的方法能够表示出图2所示的特征差异,能够迅速准确的定位语音崎变发生的时间。
需要说明的是,正是由于我们要定位语音崎变在时域上的发生位置,所以需要较高的时间分辨率,也就是图2所示的两方面的差异性都是发生在时域上的,崎变在时域上有比较明显的特征,所以本实施例的方法采用了小波变换的信号处理工具,小波变换可以通过设定尺度确定与该尺度对应的合适的时间-频率分辨率,通过选择合适的小波系数确定合适的尺度,能够得到易于显示出上述差异性的时间分辨率,在该合适的尺度上获取对应的特征值,通过特征值来判断是否具有差异性,进而实现语音崎变的检测。由上述说明可以看到,本实施例的方法切合了语音崎变的特点,并且采用合适的信号分析工具能够准确的明显的得到反映崎变差异的特征值,因此能够更加快速和准确的得到语音崎变的检测结果。
实施例二
在上述的实施例一中,主要说明了如何提取能够反映崎变差异的特征值,以及如何根据特征值进行崎变的检测。本实施例中,是在对语音信号中的每一帧都得到检测结果后,对检测结果进行平滑处理。例如,对于图4中的6个信号帧,已经得到了检测结果,第1帧是正常帧,第2帧是异常帧……第6帧是异常帧,等,此时可以采用本实施例的方法对检测结果进行平滑处理。
可选的,若两个相邻的异常帧之间的间隔距离小于第三阈值,则将位于所述两个相邻的异常帧之间的正常帧调整为异常帧。举例如下:假设图4中所示的,第2帧是异常帧,第5帧是异常帧,而第3帧和第4帧是正常帧,那么第2帧和第5帧就是两个相邻的异常帧,这两个相邻的异常帧之间的间隔距离是“2个帧”;假设第三阈值THD3是1个帧,那么“2个帧”>第三阈值,则表明这两个相邻异常帧之间的距离足够大,可以不做平滑处理。而假设第三阈值是3个帧,则“2个帧”<第三阈值,则表明这两个相邻异常帧之间的距离即时间间隔过短,根据信号的短时相关性,可以将这两个相邻异常帧之间的正常帧调整为异常帧,即将第3帧和第4帧均调整为异常帧。
可选的,在得到语音崎变的检测结果后,可以统计所述语音信号中的所述异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。因为,如果一段语音信号中发生崎变的帧数小于预先定义的第四阈值THD4,表明整段语音信号发生异常事件的次数非常少,从听觉感知角度分析,这种异常一般是不可闻的,所以可以将所有帧的检测结果均调整为正常帧,即该语音信号没有发生崎变。举例如下:仍以图4为例,假设这6个信号帧中只有一个异常帧,例如是第5帧是异常帧,其他均为正常帧;而第四阈值是2个帧,那么异常帧的数量“1”小于第四阈值,此时就可以认为该语音信号没有发生崎变,即将第5帧的检测结果调整为正常帧。
本实施例的对语音崎变的检测结果进行平滑处理,可以更加符合实际的听觉感知,更加准确模拟人工测试的听觉感受。
实施例三
在判断某段语音信号中的每一信号帧是否崎变之后,在实际应用中,可以将其用于语音质量评估,例如在日常的语音质量测试方面,可以采用本发明实施例提供的方法来进行判断,可以定位到每一帧是否发生异常。如果要输出语音质量的评估结果,可以按照本实施例提供的方法,根据每一信号帧的处理结果(例如处理结果是:该信号帧是正常帧或者异常帧),确定与异常帧的多少对应的语音质量评分,计算量化的语音信号的语音质量,可以用第一语音质量评价值表示。
可选的,上述的根据信号帧的处理结果计算语音信号的第一语音质量评价值,其方式可以有多种,例如,可以基于语音信号中的异常帧在所有信号帧中所占的百分比,来计算语音信号的MOS分或者失真系数。当然具体实施中,也可以采用其他方式,又例如,ANIQUE+使用了基于RecencyEffect(近因效应原理):对每一个独立的异常事件,基于其发生的长度计算失真系数;然后,根据近因效应规则,获得整个语音文件的失真系数。
具体的,可以统计语音信号中的异常帧在所有信号帧中所占的百分比,按照如下的公式(4)计算:
在公式中,nframe是语音信号中的所有信号帧的数量,而nframe_artifact表示的是该语音信号中发生崎变的异常帧,Rloss是异常帧在所有信号帧中所占的百分比。
然后,根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值,参见公式(5):
在公式(5)中,Y表示第一语音质量评价值,可以是MOS分;其中“5”的定义是因为国际通行的MOS范围是1至5分。公式中的a和m是质量评价参数,可以通过数据训练得到。
本实施例的语音质量评估,是直接根据异常帧的百分比映射为对应的第一语音质量评价值例如MOS分,这种情况较为适用于由编码或者信道传输引起的语音崎变。当语音崎变的影响因素还包括例如噪声等其他影响时,可以将本实施例的方法与其他语音质量评估方法进行结合,来更好的评估语音质量。例如下面的实施例四就是一种可选的质量评估方式。
实施例四
本实施例在获得上述实施例三得到的第一语音质量评价值,还获取使用语音质量评估方法得到的第二语音质量评价值,这里所述的语音质量评估方法指的是实施例三所述的方法之外的其他方法,例如非侵入式评估感知模型(AuditoryNon-IntrusiveQualityEstimationPlus,简称:ANIQUE+),并且将ANIQUE+与实施例三所述的方法进行融合,以及根据所述第一语音质量评价值与第二语音质量评价值,得到第三语音质量评价值。
具体的,首先,在系统训练过程中,训练第一语音质量评价系统即求取第一语音质量评价值的系统,是需要使用第二语音质量评价值的。具体的,使用ANIQUE+对语音信号进行质量评估,得到第二语音质量评价值,本实施例可以假设语音质量评价值都是MOS分,那么第二语音质量评价值就是第二MOS分。考虑到MOS分的动态范围,需要根据第二语音质量评价值选择对应的质量评价参数,即根据ANIQUE+的评分结果,适当调整公式(5)中的a和m值的取值。从数据分析的角度,我们可以通过选择一定的语音主观数据库(该数据库包括语音文件和主观MOS分),先使用ANIQUE+进行打分;然后,基于数据库中的主观MOS分与第二MOS分的差,重新进行数据拟合,刷新a和m值。这种情况下,a和m值将与ANIQUE+的评估结果进行了适配。
然后,采用刷新后的a和m值、以及异常帧的百分比,利用公式(5)得到第一语音质量评价值例如第一MOS分。接着,在第二MOS分的基础上,由第二MOS分减去第一MOS分,得到第三语音质量评价值即最终MOS分。
需要说明的是,对于使用其他语音质量评估方法得到第二语音质量评价值的过程,本实施例是以ANIQUE+为例进行说明,在实际应用中可以使用其他的质量评估方法,本实施例不做限制。
实施例五
在实施例三和实施例四中,都使用了根据异常帧在语音信号的所有信号帧中占用的百分比来得到语音质量评价值的方式;本实施例与上述两个实施例的区别是,可以不再根据百分比映射MOS分,而是将本发明实施例的异常帧检测方法中使用到的异常检测特征值直接用于其他语音质量评估方法,得到第三语音质量评价值。所述的异常检测特征值例如包括如下至少一个:局部能量值、第一特征值和第二特征值,这些特征值都是在实施例一的方法中所使用的特征参数。
本实施例中,可以综合根据当前第二语音质量评价值计算过程中使用的语音质量评估方法中提取的评估特征值、以及本发明上述实施例第一语音质量评价值计算过程中对应的异常检测特征值,并利用机器学习系统(如:神经网络系统)得到第三语音质量评价值。其中,在获取第一语音质量评价值的过程中会获取到上述的异常检测特征值,在获取第二语音质量评价值的过程中会获取到该评估特征值。
具体的,可以按照如下方法:ANIQUE+方法是通过人耳听觉建模,获得反映听觉感受的特征向量(定义为ε{i},i=1,2........D),该特征向量可以称为评估特征值;其中,D为特征向量的维度。经过大样本训练,获得由ε映射为MOS分的神经网络系统。因此,我们可以将本发明实施例所提取的异常检测特征值(例如上述的第一特征值、第二特征值等)作为补集,补充到上述特征向量中,即ε{i},i=1,2........D+1,特征向量的维度增加为D+1。类似地,我们通过大样本训练,可以获得新的神经网络模型,用于语音质量评估,即根据特征向量以及ANIQUE+训练得到的神经网络系统,得到与特征向量对应的第三语音质量评价值。所增加的一个维度的特征,是由实施例一中说明的方法获得的特征值,可以是异常帧的百分比,也可以是类似ANIQUE+中基于RecencyEffect(近因效应原理)的方法,在此不做限制。
实施例六
在实施例三至实施例五,描述了将语音崎变的检测结果用于语音质量评估的应用,此外,还可以将语音崎变的检测结果用于语音质量告警。
例如,在得到语音崎变的检测结果后,可以统计语音信号中的单位时间内的异常帧的数量;若异常帧的数量大于第五阈值,则输出语音崎变告警信息,该告警信息例如是某些表示语音质量较低的文字信息或者符号标识等,也可以是其他形式的告警信息例如声音告警等。举例如下:假设在图4中的6个信号帧中,异常帧的数量是4,并假设第五阈值是3(帧的数目),则异常帧的数量大于第五阈值,此时就可以输出语音崎变告警信息,提示该语音测试不达标,需要对语音质量进行改善。
上面列举了语音崎变检测结果的两种应用,例如语音质量评价以及语音告警,在实际实施中,还可以有其他方面的应用,本发明实施例不再列举。
此外,在统计异常帧在所有信号帧的百分比之前,可以先对该信号帧进行平滑处理,比如上面描述的在两个异常帧之间的间距小于第三阈值时,将两者之间的正常帧均调整为异常帧;然后再统计平滑处理后的所有异常帧在信号帧中的百分比。
实施例七
图5为本发明实施例提供的一种异常帧检测装置的结构示意图,该装置可以执行本发明任意实施例的方法,本实施例仅对该装置的结构做简单说明,其具体的工作原理可以结合参见方法实施例部分。如图5所示,该装置可以包括:信号划分单元51、信号分析单元52和判断单元53;其中,
信号划分单元51,用于获取语音信号中的一个信号帧,并将所述一个信号帧划分成至少两个子帧;
信号分析单元52,用于获取所述一个信号帧的一个子帧的局部能量值;根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;
判断单元53,用于在所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值时,则确定所述一个信号帧是异常帧。
进一步的,信号分析单元52,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;将所述在对数域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值为所述第一特征值。
进一步的,信号分析单元52,在计算所述第一特征值时,具体是用于:确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;获取所述一个信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值;将所述在对数域上的局部能量最大值与所述在对数域上的局部能量值最小值作差得到第二差值,所述第二差值为所述第一特征值。
进一步的,所述信号分析单元52,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值作差得到第一差值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值与所述所述目标相关子帧的局部能量值中在对数域上的局部能量值最小值作差得到第二差值;选择所述第一差值和第二差值中的较小者作为第一特征值。
进一步的,所述信号分析单元52,在计算所述第二特征值时,具体是用于:对所述一个信号帧进行小波分解得到小波系数,并根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
进一步的,所述信号分析单元52,对所述一个信号帧进行小波分解得到小波系数,并根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
图6为本发明实施例提供的另一种异常帧检测装置的结构示意图,如图6所示,在图5所示结构的基础上,该装置还可以包括:信号处理单元54,用于在一个信号帧与所述语音信号中前一个异常帧之间的间隔距离小于第三阈值时,如果所述信号帧是异常帧,将位于所述一个信号帧与所述前一个异常帧之间的正常帧调整为异常帧。
在另一个实施例中,信号处理单元54,用于统计所述语音信号中的异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。
在又一个实施例中,信号处理单元54,用于统计所述语音信号中异常帧所占的百分比;若所述异常帧所占的百分比大于第五阈值,则输出语音崎变告警信息。
参见图6,还可以包括第一信号评价单元55和第二信号评价单元56;
第一信号评价单元55,用于根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,所述检测结果包括所述需要进行异常帧检测的信号帧中的任一帧是正常帧或者异常帧。
进一步的,所述第一信号评价单元55,在计算所述语音信号的第一语音质量评价值时,具体是用于:获取所述语音信号中的异常帧所占的百分比;根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值。
进一步的,所述第一信号评价单元55,还用于获取使用语音质量评估方法得到的所述语音信号的第二语音质量评价值;根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值。
进一步的,所述第一信号评价单元55,在根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值时,具体是用于将所述第二语音质量评价值减去所述第一语音质量评价值,得到所述第三语音质量评价值。
第二信号评价单元56,在在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还用于根据所述需要进行异常帧检测的信号帧的检测结果,获取所述语音信号的异常检测特征值;获取使用语音质量评估方法得到的所述语音信号的的评估特征值;利用评估系统,根据所述异常检测特征值和所述评估特征值得到第四语音质量评价值。
实施例八
图7为本发明实施例提供的异常帧检测装置的实体结构示意图,用于实现如本发明实施例所述的异常帧检测方法,其工作原理可以参见前述方法实施例。如图7所示,该装置可以包括:存储器701、处理器702、总线703和通信接口704。处理器702和存储器701和通信接口704之间通过总线703连接并完成相互间的通信。
其中,处理器702用于获取语音信号中的一个信号帧;将所述一个信号帧划分成至少两个子帧;获取所述一个信号帧的一个子帧的局部能量值;根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;若所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值,则确定所述一个信号帧是异常帧。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(ROM:ReadOnlyMemory)、随机存储器(RAM:RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (28)
1.一种异常帧检测方法,其特征在于,包括:
获取语音信号中的一个信号帧;
将所述一个信号帧划分成至少两个子帧;
获取所述一个信号帧的一个子帧的局部能量值;
根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;
对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;
若所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值,则确定所述一个信号帧是异常帧。
2.根据权利要求1所述的方法,其特征在于,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:
获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;
将所述在对数域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值为所述第一特征值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:
确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;
获取所述一个信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值;
将所述在对数域上的局部能量最大值与所述在对数域上的局部能量值最小值作差得到第二差值,所述第二差值为所述第一特征值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值,包括:
获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;
确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;
将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值作差得到第一差值;
将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值与所述所述目标相关子帧的局部能量值中在对数域上的局部能量值最小值作差得到第二差值;
选择所述第一差值和第二差值中的较小者作为第一特征值。
5.根据权利要求1至4任一所述的方法,其特征在于,所述对所述一个信号帧进行奇异性分析,得到用于表示奇异性特征的第二特征值,包括:
对所述一个信号帧进行小波分解得到小波系数,并根据所述小波系数进行信号重构得到重构信号帧;
根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到第二特征值,包括:
将所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值作差,得到的差值为所述第二特征值。
7.根据权利要求1至6任一所述的方法,其特征在于,若所述一个信号帧与所述语音信号中前一个异常帧之间的间隔距离小于第三阈值,在确定所述一个信号帧为异常帧之后,还包括:
将位于所述一个信号帧与所述前一个异常帧之间的正常帧调整为异常帧。
8.根据权利要求1至6任一所述的方法,其特征在于,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:
统计所述语音信号中的异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。
9.根据权利要求1至6任一所述的方法,其特征在于,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:
统计所述语音信号中异常帧所占的百分比;
若所述异常帧所占的百分比大于第五阈值,则输出语音崎变告警信息。
10.根据权利要求1至9任一所述的方法,其特征在于,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:
根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,所述检测结果包括所述需要进行异常帧检测的信号帧中的任一帧是正常帧或者异常帧。
11.根据权利要求10所述的方法,其特征在于,所述根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,包括:
获取所述语音信号中的异常帧所占的百分比;
根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值。
12.根据权利要求10或11所述的方法,其特征在于,在计算所述语音信号的第一语音质量评价值之后,还包括:
获取使用语音质量评估方法得到的所述语音信号的第二语音质量评价值;
根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值,包括:
将所述第二语音质量评价值减去所述第一语音质量评价值,得到所述第三语音质量评价值。
14.根据权利要求1至9任一所述的方法,其特征在于,在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还包括:
根据所述需要进行异常帧检测的信号帧的检测结果,获取所述语音信号的异常检测特征值;
获取使用语音质量评估方法得到的所述语音信号的的评估特征值;
利用评估系统,根据所述异常检测特征值和所述评估特征值得到第四语音质量评价值。
15.一种异常帧检测装置,其特征在于,所述装置包括:
信号划分单元,用于获取语音信号中的一个信号帧,并将所述一个信号帧划分成至少两个子帧;
信号分析单元,用于获取所述一个信号帧的一个子帧的局部能量值;根据所述一个子帧的局部能量值,得到用于表示所述一个信号帧的局部能量变化趋势的第一特征值;对所述一个信号帧进行奇异性分析,得到用于表示所述一个信号帧的奇异性特征的第二特征值;
判断单元,用于在所述一个信号帧的第一特征值满足第一阈值,并且所述一个信号帧的第二特征值满足第二阈值时,确定所述一个信号帧是异常帧。
16.根据权利要求15所述的装置,其特征在于,
所述信号分析单元,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;将所述在对数域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值为所述第一特征值。
17.根据权利要求15所述的装置,其特征在于,
所述信号分析单元,在计算所述第一特征值时,具体是用于:确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;获取所述一个信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值;将所述在对数域上的局部能量最大值与所述在对数域上的局部能量值最小值作差得到第二差值,所述第二差值为所述第一特征值。
18.根据权利要求15所述的装置,其特征在于,
所述信号分析单元,在计算所述第一特征值时,具体是用于:获取所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值;确定在时域上位于所述一个信号帧之前的相关信号帧中的目标相关子帧,并计算所述目标相关子帧的局部能量值,获取所述目标相关子帧的局部能量值中在对数域上的局部能量最小值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量最小值作差得到第一差值;将所述一个信号帧中的所有子帧的局部能量值中在对数域上的局部能量最大值与所述所述目标相关子帧的局部能量值中在对数域上的局部能量值最小值作差得到第二差值;选择所述第一差值和第二差值中的较小者作为第一特征值。
19.根据权利要求15~18任一所述的装置,其特征在于,
所述信号分析单元,在计算所述第二特征值时,具体是用于:对所述一个信号帧进行小波分解得到小波系数,并根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
20.根据权利要求19所述的装置,其特征在于,
所述信号分析单元,在根据所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值,得到第二特征值时,具体是用于:将所述重构信号帧的所有子帧的局部能量值中在对数域上的局部能量最大值和局部能量平均值作差,得到的差值为所述第二特征值。
21.根据权利要求15~20任一所述的装置,其特征在于,还包括:
信号处理单元,用于在一个信号帧与所述语音信号中前一个异常帧之间的间隔距离小于第三阈值时,如果所述信号帧是异常帧,将位于所述一个信号帧与所述前一个异常帧之间的正常帧调整为异常帧。
22.根据权利要求15~20任一所述的装置,其特征在于,还包括:
信号处理单元,用于统计所述语音信号中的异常帧的数量,若所述异常帧的数量小于第四阈值,则将所述语音信号中的所有异常帧均调整为正常帧。
23.根据权利要求15~20任一所述的装置,其特征在于,还包括:
信号处理单元,用于统计所述语音信号中异常帧所占的百分比;若所述异常帧所占的百分比大于第五阈值,则输出语音崎变告警信息。
24.根据权利要求15~21任一所述的装置,其特征在于,还包括:
第一信号评价单元,用于根据所述需要进行异常帧检测的信号帧的检测结果,计算所述语音信号的第一语音质量评价值,所述检测结果包括所述需要进行异常帧检测的信号帧中的任一帧是正常帧或者异常帧。
25.根据权利要求24所述的装置,其特征在于,
所述第一信号评价单元,在计算所述语音信号的第一语音质量评价值时,具体是用于:获取所述语音信号中的异常帧所占的百分比;根据所述百分比以及质量评价参数,得到与所述百分比对应的第一语音质量评价值。
26.根据权利要求24或25所述的装置,其特征在于,
所述第一信号评价单元,还用于获取使用语音质量评估方法得到的所述语音信号的第二语音质量评价值;根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值。
27.根据权利要求26所述的装置,其特征在于,
所述第一信号评价单元,在根据所述第一语音质量评价值与所述第二语音质量评价值,得到第三语音质量评价值时,具体是用于将所述第二语音质量评价值减去所述第一语音质量评价值,得到所述第三语音质量评价值。
28.根据权利要求15~23任一所述的装置,其特征在于,还包括:
第二信号评价单元,在在对所述语音信号中需要进行异常帧检测的信号帧进行检测之后,还用于根据所述需要进行异常帧检测的信号帧的检测结果,获取所述语音信号的异常检测特征值;获取使用语音质量评估方法得到的所述语音信号的的评估特征值;利用评估系统,根据所述异常检测特征值和所述评估特征值得到第四语音质量评价值。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410366454.0A CN105374367B (zh) | 2014-07-29 | 2014-07-29 | 异常帧检测方法和装置 |
PCT/CN2015/071640 WO2016015461A1 (zh) | 2014-07-29 | 2015-01-27 | 异常帧检测方法和装置 |
EP15827871.3A EP3163574B1 (en) | 2014-07-29 | 2015-01-27 | Method and apparatus for detecting abnormal frame |
US15/415,335 US10026418B2 (en) | 2014-07-29 | 2017-01-25 | Abnormal frame detection method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410366454.0A CN105374367B (zh) | 2014-07-29 | 2014-07-29 | 异常帧检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105374367A true CN105374367A (zh) | 2016-03-02 |
CN105374367B CN105374367B (zh) | 2019-04-05 |
Family
ID=55216723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410366454.0A Active CN105374367B (zh) | 2014-07-29 | 2014-07-29 | 异常帧检测方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10026418B2 (zh) |
EP (1) | EP3163574B1 (zh) |
CN (1) | CN105374367B (zh) |
WO (1) | WO2016015461A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107393559A (zh) * | 2017-07-14 | 2017-11-24 | 深圳永顺智信息科技有限公司 | 检校语音检测结果的方法及装置 |
CN107767860A (zh) * | 2016-08-15 | 2018-03-06 | 中兴通讯股份有限公司 | 一种语音信息处理方法和装置 |
CN108074586A (zh) * | 2016-11-15 | 2018-05-25 | 电信科学技术研究院 | 一种语音问题的定位方法和装置 |
CN108648765A (zh) * | 2018-04-27 | 2018-10-12 | 海信集团有限公司 | 一种语音异常检测的方法、装置及终端 |
CN109859156A (zh) * | 2018-10-31 | 2019-06-07 | 歌尔股份有限公司 | 异常帧数据的处理方法及装置 |
CN111343344A (zh) * | 2020-03-13 | 2020-06-26 | Oppo(重庆)智能科技有限公司 | 语音异常检测方法、装置、存储介质及电子设备 |
WO2021093808A1 (zh) * | 2019-11-13 | 2021-05-20 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种有效语音信号的检测方法、装置及设备 |
CN113542863A (zh) * | 2020-04-14 | 2021-10-22 | 深圳Tcl数字技术有限公司 | 一种声音处理方法、存储介质以及智能电视 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110838299B (zh) * | 2019-11-13 | 2022-03-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种瞬态噪声的检测方法、装置及设备 |
CN111429927B (zh) * | 2020-03-11 | 2023-03-21 | 云知声智能科技股份有限公司 | 提升个性化合成语音质量的方法 |
CN112634934A (zh) * | 2020-12-21 | 2021-04-09 | 北京声智科技有限公司 | 语音检测方法及装置 |
CN117636909B (zh) * | 2024-01-26 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备以及计算机可读存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
US5586126A (en) * | 1993-12-30 | 1996-12-17 | Yoder; John | Sample amplitude error detection and correction apparatus and method for use with a low information content signal |
CN1249872A (zh) * | 1997-02-27 | 2000-04-05 | 西门子公司 | 尤其在gsm传输中的用于错误掩蔽的帧错误检测的方法和设备 |
US6775521B1 (en) * | 1999-08-09 | 2004-08-10 | Broadcom Corporation | Bad frame indicator for radio telephone receivers |
CN1787071A (zh) * | 2004-12-07 | 2006-06-14 | 腾讯科技(深圳)有限公司 | 一种检测静音帧的方法 |
CN1787079A (zh) * | 2005-12-19 | 2006-06-14 | 北京中星微电子有限公司 | 一种噪声检测装置和方法 |
CN102034476A (zh) * | 2009-09-30 | 2011-04-27 | 华为技术有限公司 | 语音帧错误检测及修复的方法及装置 |
CN102057424A (zh) * | 2008-06-13 | 2011-05-11 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
CN102572501A (zh) * | 2010-12-23 | 2012-07-11 | 华东师范大学 | 考虑网络性能及视频本身特征的视频质量评估方法及装置 |
CN102694561A (zh) * | 2011-03-22 | 2012-09-26 | 株式会社田村制作所 | 无线接收机 |
CN103345927A (zh) * | 2013-07-11 | 2013-10-09 | 暨南大学 | 一种检测与定位音频时域篡改的处理方法 |
CN103943114A (zh) * | 2013-01-22 | 2014-07-23 | 中国移动通信集团广东有限公司 | 一种语音业务通话质量的评估方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
CN1988708B (zh) * | 2006-12-29 | 2010-04-14 | 华为技术有限公司 | 测试语音质量的方法及装置 |
JP5157852B2 (ja) * | 2008-11-28 | 2013-03-06 | 富士通株式会社 | 音声信号処理評価プログラム、音声信号処理評価装置 |
US8472616B1 (en) * | 2009-04-02 | 2013-06-25 | Audience, Inc. | Self calibration of envelope-based acoustic echo cancellation |
CN102881289B (zh) * | 2012-09-11 | 2014-04-02 | 重庆大学 | 一种基于听觉感知特性的语音质量客观评价方法 |
CN103730131B (zh) * | 2012-10-12 | 2016-12-07 | 华为技术有限公司 | 语音质量评估的方法和装置 |
CN103903633B (zh) | 2012-12-27 | 2017-04-12 | 华为技术有限公司 | 检测语音信号的方法和装置 |
CN103632682B (zh) * | 2013-11-20 | 2019-11-15 | 科大讯飞股份有限公司 | 一种音频特征检测的方法 |
-
2014
- 2014-07-29 CN CN201410366454.0A patent/CN105374367B/zh active Active
-
2015
- 2015-01-27 WO PCT/CN2015/071640 patent/WO2016015461A1/zh active Application Filing
- 2015-01-27 EP EP15827871.3A patent/EP3163574B1/en active Active
-
2017
- 2017-01-25 US US15/415,335 patent/US10026418B2/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
US5586126A (en) * | 1993-12-30 | 1996-12-17 | Yoder; John | Sample amplitude error detection and correction apparatus and method for use with a low information content signal |
CN1249872A (zh) * | 1997-02-27 | 2000-04-05 | 西门子公司 | 尤其在gsm传输中的用于错误掩蔽的帧错误检测的方法和设备 |
US6775521B1 (en) * | 1999-08-09 | 2004-08-10 | Broadcom Corporation | Bad frame indicator for radio telephone receivers |
CN1787071A (zh) * | 2004-12-07 | 2006-06-14 | 腾讯科技(深圳)有限公司 | 一种检测静音帧的方法 |
CN1787079A (zh) * | 2005-12-19 | 2006-06-14 | 北京中星微电子有限公司 | 一种噪声检测装置和方法 |
CN102057424A (zh) * | 2008-06-13 | 2011-05-11 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
CN102034476A (zh) * | 2009-09-30 | 2011-04-27 | 华为技术有限公司 | 语音帧错误检测及修复的方法及装置 |
CN102572501A (zh) * | 2010-12-23 | 2012-07-11 | 华东师范大学 | 考虑网络性能及视频本身特征的视频质量评估方法及装置 |
CN102694561A (zh) * | 2011-03-22 | 2012-09-26 | 株式会社田村制作所 | 无线接收机 |
CN103943114A (zh) * | 2013-01-22 | 2014-07-23 | 中国移动通信集团广东有限公司 | 一种语音业务通话质量的评估方法及装置 |
CN103345927A (zh) * | 2013-07-11 | 2013-10-09 | 暨南大学 | 一种检测与定位音频时域篡改的处理方法 |
Non-Patent Citations (1)
Title |
---|
张梅军: "《机械状态检测与故障诊断》", 31 March 2008, 科学出版社 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767860A (zh) * | 2016-08-15 | 2018-03-06 | 中兴通讯股份有限公司 | 一种语音信息处理方法和装置 |
CN108074586A (zh) * | 2016-11-15 | 2018-05-25 | 电信科学技术研究院 | 一种语音问题的定位方法和装置 |
CN108074586B (zh) * | 2016-11-15 | 2021-02-12 | 电信科学技术研究院 | 一种语音问题的定位方法和装置 |
CN107393559A (zh) * | 2017-07-14 | 2017-11-24 | 深圳永顺智信息科技有限公司 | 检校语音检测结果的方法及装置 |
CN107393559B (zh) * | 2017-07-14 | 2021-05-18 | 深圳永顺智信息科技有限公司 | 检校语音检测结果的方法及装置 |
CN108648765A (zh) * | 2018-04-27 | 2018-10-12 | 海信集团有限公司 | 一种语音异常检测的方法、装置及终端 |
CN108648765B (zh) * | 2018-04-27 | 2020-09-25 | 海信集团有限公司 | 一种语音异常检测的方法、装置及终端 |
CN109859156A (zh) * | 2018-10-31 | 2019-06-07 | 歌尔股份有限公司 | 异常帧数据的处理方法及装置 |
CN109859156B (zh) * | 2018-10-31 | 2023-06-30 | 歌尔股份有限公司 | 异常帧数据的处理方法及装置 |
WO2021093808A1 (zh) * | 2019-11-13 | 2021-05-20 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种有效语音信号的检测方法、装置及设备 |
CN111343344A (zh) * | 2020-03-13 | 2020-06-26 | Oppo(重庆)智能科技有限公司 | 语音异常检测方法、装置、存储介质及电子设备 |
CN113542863A (zh) * | 2020-04-14 | 2021-10-22 | 深圳Tcl数字技术有限公司 | 一种声音处理方法、存储介质以及智能电视 |
Also Published As
Publication number | Publication date |
---|---|
EP3163574A4 (en) | 2017-07-12 |
US20170133040A1 (en) | 2017-05-11 |
EP3163574B1 (en) | 2019-09-25 |
CN105374367B (zh) | 2019-04-05 |
WO2016015461A1 (zh) | 2016-02-04 |
US10026418B2 (en) | 2018-07-17 |
EP3163574A1 (en) | 2017-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105374367A (zh) | 异常帧检测方法和装置 | |
RU2685391C1 (ru) | Способ, устройство и система для подавления шума | |
Eaton et al. | Noise-robust reverberation time estimation using spectral decay distributions with reduced computational cost | |
CN109084186B (zh) | 基于改进的elmd多尺度熵的管道泄漏信号识别方法 | |
Gaubitch et al. | Performance comparison of algorithms for blind reverberation time estimation from speech | |
CN101329697B (zh) | 一种基于混杂算法的模拟电路状态预测方法 | |
CN103546853A (zh) | 一种基于短时傅里叶变换的扬声器异常音检测方法 | |
CN109979486B (zh) | 一种语音质量评估方法及装置 | |
CN111312273A (zh) | 混响消除方法、装置、计算机设备和存储介质 | |
CN101964050A (zh) | 一种基于模型定阶和信号消噪的模态参数识别方法 | |
CN111031463B (zh) | 麦克风阵列性能评测方法、装置、设备和介质 | |
CN110717472B (zh) | 基于改进的小波阈值去噪的故障诊断方法及系统 | |
CN109340586B (zh) | 一种供水管道泄露的检测方法及系统 | |
CN105205461A (zh) | 一种用于模态参数识别的信号降噪方法 | |
CN103903633A (zh) | 检测语音信号的方法和装置 | |
CN105637331A (zh) | 异常检测装置、异常检测方法及计算机可读取的存储介质 | |
CN114152825A (zh) | 变压器的故障诊断方法、装置和变压器的故障诊断系统 | |
CN1449136A (zh) | 用于信号畸变测量和评估的系统与方法 | |
CN115410589A (zh) | 一种基于联合感知损失的注意力生成对抗语音增强方法 | |
CN105761725A (zh) | 一种基于时域稀疏性的fri信号重构方法 | |
Belenky et al. | Statistical uncertainty of ship motion data | |
US9668075B2 (en) | Estimating parameter values for a lumped parameter model of a loudspeaker | |
CN104363554A (zh) | 一种扬声器异常音检测方法 | |
CN103064821A (zh) | 一种动态信号分析方法及装置 | |
CN110320227A (zh) | 一种二维核磁共振d-t2谱反演方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |