CN1538667A - 一种宽频带语音质量客观评价方法 - Google Patents

一种宽频带语音质量客观评价方法 Download PDF

Info

Publication number
CN1538667A
CN1538667A CNA2003101112735A CN200310111273A CN1538667A CN 1538667 A CN1538667 A CN 1538667A CN A2003101112735 A CNA2003101112735 A CN A2003101112735A CN 200310111273 A CN200310111273 A CN 200310111273A CN 1538667 A CN1538667 A CN 1538667A
Authority
CN
China
Prior art keywords
frame
speech
voice
loudness
quiet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101112735A
Other languages
English (en)
Other versions
CN100347988C (zh
Inventor
胡瑞敏
艾浩军
涂卫平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CNB2003101112735A priority Critical patent/CN100347988C/zh
Publication of CN1538667A publication Critical patent/CN1538667A/zh
Application granted granted Critical
Publication of CN100347988C publication Critical patent/CN100347988C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

一种宽频带语音质量客观评价方法,被测语音和参考语音幅度归一化为均值为0,标准差为1的序列;记算50~7000Hz频带内临界带听阈;根据加窗语音帧的能量,计算安静帧阈值;对归一化后信号计算功率谱;在临界带内求和得到Bark谱;根据Bark谱,计算该语音帧的响度;归一化响度矢量;根据原语音的响度L0,编码语音的响度L1和噪声掩蔽阈值Thn确定可感知失真标志M(i);给出每帧失真;重复以上步骤,计算整个语音段的失真WBSD,在安静段是否有语音失真不影响听觉质量,将每个非静音段的累加求和,按非静音帧的帧数取平均值,即得整个语音段的WBSD。本发明能与主观质量测度保持较好的相关性,提高了精度。

Description

一种宽频带语音质量客观评价方法
技术领域
本发明属于语音通信质量评价领域,尤其是涉及数据网上宽带语音通信的客观质量评价方法。
背景技术
数据网络传送话音业务,必须考虑服务质量的问题,为有效的利用带宽,使用了语音编码技术和话音活动检测技术实现间断传输(DTX),听者接收的信号与发言者发出的信号时域上并未严格同步。同时由于人们对通话质量需求的提高,宽频带(50~7000Hz)的语音通信因能有更高的可懂度、自然度、清晰度得到了更广泛的应用。原有的电话带宽(300~3400Hz)语音的客观质量评价方法有以下几方面的不足:a、不能满足宽频带语音的客观质量评价要求;b、不能满足分组网上采用间断传输后的客观质量评价要求。
发明内容
本发明的目的在于克服现有的电路交换网客观语音质量评价方法的不足而提供一种评价分组网络上的宽频带语音传输质量的方法。
为实现上述目的,本发明提出了一种宽频带语音质量客观评价方法,其特征是包括下列步骤:
(1)测试语音和参考语音幅度归一化为均值为0,标准差为1的序列;
(2)计算50~7000Hz频带内临界带听阈;
(3)根据加窗语音帧的能量,计算安静帧阈值,如果一帧语音的能量小于安静帧阈值,这一帧信号不参加质量评价。安静帧语音能量阈值EnSilenceTh为相比最大能量帧的能量EnMax,其能量低于15dB;
(4)归一化后信号计算功率谱;
(5)在临界带内求和得到Bark谱;
(6)根据Bark谱,计算该语音帧的响度;
(7)归一化响度矢量Li(i),归一化因子等于参考语音帧的响度Lo(j)与测试语音帧的响度Li(j)之比,其中,K为临界带个数;
L t ( i ) ‾ = Σ j = 1 K L o ( j ) Σ j = 1 K L t ( j ) L t ( i )
(8)根据参考语音的响度 Lo,测试语音的响度 Lt和噪声掩蔽阈值Thn确定可感知失真标志M(i):
Figure A20031011127300052
(9)每帧失真D(i)由式给出:
D ( i ) = a ( i ) M ( i ) | L ‾ o - L ‾ t |
(10)重复步骤(1)~(9),计算整个语音段的失真WBSD,在安静段是否有语音失真不影响听觉质量,将每个非静音段的累加求和,按非静音帧的帧数取平均值,即得整个语音段的WBSD。
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
其中,
                          N:处理总帧数
                          K:临界带数
                   Lo (j)(i):参考语音第j帧Bark谱
                   Lt (j)(i):测试语音第j帧Bark谱
而且,在上述(10)步骤中,根据功率谱计算线性预测系数LPC,对每个临界带的Bark谱距离按LPC谱包络加权,加权系数W(i)为每个临界带内的LPC滤波器频率响应值求和,再取平均值;
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K W ( i ) M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
本发明提供了一种加权谱距离的计算方法,对于谱距离大于掩蔽值的临界带,按LPC谱的幅度加权后,计算每帧的谱距离。在计算FFT后,直接在频域计算自相关系数,通过Durbin算法计算LPC谱。
而且,在上述(1)步骤中,加入基于话音活动检测的时间分级对齐,此后的分析在活动语音段时间对齐后进行。
本发明具有以下优点和积极效果:
(1)计算宽频带内的语音Bark谱距离作为测度基础,与人耳的听觉特性吻合,能与主观质量测度保持较好的相关性;
(2)通过采用响度线性插值算法,精度高于一般计算响度时用查表插值计算方法;
(3)LPC的谱的峰值与语音信号的共振峰对应,共振峰对应的频带与语音的可懂度有直接的关系。通过加大权值可以提高本方法与主观质量的相关性;
(4)由于话音活动检测器的作用,能克服分组网络语音通信中使用间断传输导致的参考语音与被测语音不同步的问题。
附图说明
图1是本发明实施例流程图;
图2是本发明实施例从LPC滤波器频率响应得到加权系数图;
图3是本发明实施例中非间断传输示意图。
具体实施方式
下面结合附图1~3对本发明作进一步说明。
本发明提出了一种宽频带语音质量客观评价方法,其步骤为:
(1)测试语音和参考语音幅度归一化为均值为0,标准差为1的序列;
(2)计算50~7000Hz频带内临界带听阈;
(3)根据加窗语音帧的能量,计算安静帧阈值,如果一帧语音的能量小于安静帧阈值,这一帧信号不参加质量评价。安静帧语音能量阈值EnSilenceTh为相比最大能量帧的能量EnMax,其能量低于15dB;
(4)归一化后信号计算功率谱;
(5)在临界带内求和得到Bark谱;
(6)根据Bark谱,计算该语音帧的响度;
(7)归一化响度矢量Li(i),归一化因子等于参考语音帧的响度Lo(j)与测试语音帧的响度Li(j)之比,其中,K为临界带个数;
L t ( i ) ‾ = Σ j = 1 K L o ( j ) Σ j = 1 K L t ( j ) L t ( i )
(8)根据参考语音的响度 Lo,测试语音的响度 Lt和噪声掩蔽阈值Thn确定可感知失真标志M(i):
(9)每帧失真D(i)由式给出:
                    D(i)=a(i)M(i)| Lo- Lt|
(10)重复步骤(1)~(9),计算整个语音段的失真WBSD,在安静段是否有语音失真不影响听觉质量,将每个非静音段的累加求和,按非静音帧的帧数取平均值,即得整个语音段的WBSD。
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
其中,
                       N:处理总帧数
                       K:临界带数
                       Lo (j)(i):参考语音第j帧Bark谱
                       Lt (j)(i):测试语音第j帧Bark谱
图1给出了上述方法在使用时的一个具体实例的流程图,测试语音y(n)和参考语音x(n)分别输入到BSD预处理器中,计算一帧测试语音内每个临界带的响度Ly(j)和一帧参考语音内每个临界带的响度Lx(j)。语音的带宽限制为50~7000Hz,涵盖Bark号从1到21的临界带,对应频率为20~7700Hz,因此在整个计算过程中,响度模型为21维特征矢量。噪声阈值计算部分得出每个临界带的噪声掩蔽阈值M(j)。BSD预处理器和噪声阈值计算模块的结果就可得出每帧的失真度WBSD。输入语音信号为16位有符号整数,采样频率为16KHz。BSD预处理器中首先要将语音信号从时域变换到频域,用FFT计算,FFT的窗长为1024点,每帧语音的帧长为20ms,对应640个语音样点,帧移为10ms。
如图2所示,对加窗后的语音信号求线性预测系数LPC,再求出该滤波器的频率响应,虚线即是该滤波器的频率响应。滤波器的波峰即对应该帧语音的共振峰。将每个临界带内的频率响应值求和,再取平均值,作为加权系数W(i),按下式计算语音失真度WBSD。
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K W ( i ) M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
如图3所示,在数据网络中,因为使用了非间断传输,接收者的语音与讲话者的语音并未依时间对齐,可以使用话音活动检测方法,将活动的语音段按时间对齐,再逐帧分析,然后计算WBSD。
以G.722.1编码为例,计算在不同丢包率下的语音质量,测试结果同主观测试结果相关性不低于0.8。

Claims (3)

1.本发明提出了一种宽频带语音质量客观评价方法,其特征是包括下列步骤:
(1)测试语音和参考语音幅度归一化为均值为0,标准差为1的序列;
(2)计算50~7000Hz频带内临界带听阈;
(3)根据加窗语音帧的能量,计算安静帧阈值,如果一帧语音的能量小于安静帧阈值,这一帧信号不参加质量评价。安静帧语音能量阈值EnSilenceTh为相比最大能量帧的能量EnMax,其能量低于15dB;
(4)归一化后信号计算功率谱;
(5)在临界带内求和得到Bark谱;
(6)根据Bark谱,计算该语音帧的响度;
(7)归一化响度矢量Li(i),归一化因子等于参考语音帧的响度L0(j)与测试语音帧的响度Li(j)之比,其中,K为临界带个数;
L t ( i ) ‾ = Σ j = 1 K L o ( j ) Σ j = 1 K L t ( j ) L t ( j )
(8)根据参考语音的响度 Lo,测试语音的响度 Lt和噪声掩蔽阈值Thn确定可感知失真标志M(i):
(9)每帧失真D(i)由式给出:
                      D(i)=a(i)M(i)| Lo- Lt
(10)重复步骤(1)~(9),计算整个语音段的失真WBSD,在安静段是否有语音失真不影响听觉质量,将每个非静音段的累加求和,按非静音帧的帧数取平均值,即得整个语音段的WBSD。
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
其中,
                        N:处理总帧数
                        K:临界带数
                        Lo (j)(i):参考语音第j帧Bark谱
                        Lt (j)(i):测试语音第j帧Bark谱
2.如权利要求1所述的宽频带语音质量客观评价方法,其特征是:在上述(10)步骤中,根据功率谱计算线性预测系数LPC,对每个临界带的Bark谱距离按LPC谱包络加权,加权系数W(i)为每个临界带内的LPC滤波器频率响应值求和,再取平均值;
WBSD = 1 N Σ j = 1 N [ Σ i = 1 K W ( i ) M ( i ) | L o ( j ) ( i ) - L t ( j ) ( i ) | ]
3.如权利要求1或2所述的宽频带语音质量客观评价方法,其特征是:在上述(1)步骤中,加入基于话音活动检测的时间分级对齐,此后的分析在活动语音段时间对齐后进行。
CNB2003101112735A 2003-10-24 2003-10-24 一种宽频带语音质量客观评价方法 Expired - Fee Related CN100347988C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2003101112735A CN100347988C (zh) 2003-10-24 2003-10-24 一种宽频带语音质量客观评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2003101112735A CN100347988C (zh) 2003-10-24 2003-10-24 一种宽频带语音质量客观评价方法

Publications (2)

Publication Number Publication Date
CN1538667A true CN1538667A (zh) 2004-10-20
CN100347988C CN100347988C (zh) 2007-11-07

Family

ID=34335996

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101112735A Expired - Fee Related CN100347988C (zh) 2003-10-24 2003-10-24 一种宽频带语音质量客观评价方法

Country Status (1)

Country Link
CN (1) CN100347988C (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321400C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
CN1321390C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价归一化主客观统计相关模型的建立方法
CN100382514C (zh) * 2005-01-13 2008-04-16 康全电讯股份有限公司 网络语音装置语音品质测试方法
CN101609686B (zh) * 2009-07-28 2011-09-14 南京大学 基于语音增强算法主观评估的客观评估方法
CN102231279A (zh) * 2011-05-11 2011-11-02 武汉大学 基于听觉关注度的音频质量客观评价系统及方法
WO2014029275A1 (zh) * 2012-08-21 2014-02-27 华为技术有限公司 音频流质量评估方法及装置
WO2014048127A1 (zh) * 2012-09-29 2014-04-03 华为技术有限公司 语音质量监控的方法和装置
CN105551496A (zh) * 2015-12-30 2016-05-04 哈尔滨海能达科技有限公司 一种对语音编解码技术的评判方法、装置及终端
CN105656931A (zh) * 2016-03-01 2016-06-08 邦彦技术股份有限公司 网络电话语音质量客观评估处理的方法和装置
US9396740B1 (en) * 2014-09-30 2016-07-19 Knuedge Incorporated Systems and methods for estimating pitch in audio signals based on symmetry characteristics independent of harmonic amplitudes
CN105989853A (zh) * 2015-02-28 2016-10-05 科大讯飞股份有限公司 一种音频质量评测方法及系统
US9548067B2 (en) 2014-09-30 2017-01-17 Knuedge Incorporated Estimating pitch using symmetry characteristics
CN106663450A (zh) * 2014-03-20 2017-05-10 荷兰应用自然科学研究组织Tno 用于评估劣化语音信号的质量的方法及装置
CN109788922A (zh) * 2016-10-14 2019-05-21 公立大学法人大阪府立大学 咽下诊断装置以及程序

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106851713B (zh) * 2015-12-07 2021-11-12 中兴通讯股份有限公司 终端语音业务质量评估方法和装置、切换管理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100382514C (zh) * 2005-01-13 2008-04-16 康全电讯股份有限公司 网络语音装置语音品质测试方法
CN1321400C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
CN1321390C (zh) * 2005-01-18 2007-06-13 中国电子科技集团公司第三十研究所 客观音质评价归一化主客观统计相关模型的建立方法
CN101609686B (zh) * 2009-07-28 2011-09-14 南京大学 基于语音增强算法主观评估的客观评估方法
CN102231279A (zh) * 2011-05-11 2011-11-02 武汉大学 基于听觉关注度的音频质量客观评价系统及方法
CN102231279B (zh) * 2011-05-11 2012-09-26 武汉大学 基于听觉关注度的音频质量客观评价系统及方法
WO2014029275A1 (zh) * 2012-08-21 2014-02-27 华为技术有限公司 音频流质量评估方法及装置
WO2014048127A1 (zh) * 2012-09-29 2014-04-03 华为技术有限公司 语音质量监控的方法和装置
CN106663450A (zh) * 2014-03-20 2017-05-10 荷兰应用自然科学研究组织Tno 用于评估劣化语音信号的质量的方法及装置
US9548067B2 (en) 2014-09-30 2017-01-17 Knuedge Incorporated Estimating pitch using symmetry characteristics
US9396740B1 (en) * 2014-09-30 2016-07-19 Knuedge Incorporated Systems and methods for estimating pitch in audio signals based on symmetry characteristics independent of harmonic amplitudes
CN105989853A (zh) * 2015-02-28 2016-10-05 科大讯飞股份有限公司 一种音频质量评测方法及系统
CN105551496A (zh) * 2015-12-30 2016-05-04 哈尔滨海能达科技有限公司 一种对语音编解码技术的评判方法、装置及终端
CN105551496B (zh) * 2015-12-30 2020-01-31 哈尔滨海能达科技有限公司 一种对语音编解码技术的评判方法、装置及终端
CN105656931A (zh) * 2016-03-01 2016-06-08 邦彦技术股份有限公司 网络电话语音质量客观评估处理的方法和装置
CN105656931B (zh) * 2016-03-01 2018-10-30 邦彦技术股份有限公司 网络电话语音质量客观评估处理的方法和装置
CN109788922A (zh) * 2016-10-14 2019-05-21 公立大学法人大阪府立大学 咽下诊断装置以及程序

Also Published As

Publication number Publication date
CN100347988C (zh) 2007-11-07

Similar Documents

Publication Publication Date Title
CN100347988C (zh) 一种宽频带语音质量客观评价方法
US10796712B2 (en) Method and apparatus for detecting a voice activity in an input audio signal
CN1188835C (zh) 噪声抑制系统和方法
CN1320521C (zh) 在速率可变的声码器中选择编码速率的方法和装置
CN1122970C (zh) 由时域频谱减法减少信号噪声的降噪处理器、方法和电话
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
US7146315B2 (en) Multichannel voice detection in adverse environments
CN111048119B (zh) 通话音频混音处理方法、装置、存储介质和计算机设备
US20020120440A1 (en) Method and apparatus for improved voice activity detection in a packet voice network
CN101010722A (zh) 音频信号中话音活动的检测
CN1248339A (zh) 在通信系统中确定速率的装置和方法
JP4551215B2 (ja) 音声の聴覚明瞭度分析を実施する方法
CN104981870B (zh) 声音增强装置
Sakhnov et al. Approach for Energy-Based Voice Detector with Adaptive Scaling Factor.
CN1771533A (zh) 音频编码
JP4113481B2 (ja) 音声品質客観評価装置および音声品質客観評価方法
JP4194749B2 (ja) チャネル利得修正システムと、音声通信における雑音低減方法
Górriz et al. An efficient bispectrum phase entropy-based algorithm for VAD.
Parsa et al. Objective and subjective evaluation of noise reduction algorithms for hearing aids

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071107

Termination date: 20131024