CN1655230A - 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 - Google Patents
客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 Download PDFInfo
- Publication number
- CN1655230A CN1655230A CNA2005100202023A CN200510020202A CN1655230A CN 1655230 A CN1655230 A CN 1655230A CN A2005100202023 A CNA2005100202023 A CN A2005100202023A CN 200510020202 A CN200510020202 A CN 200510020202A CN 1655230 A CN1655230 A CN 1655230A
- Authority
- CN
- China
- Prior art keywords
- bark
- prime
- nmt
- masking
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法,提供了一种基于听觉同时性掩蔽效应的原理的扩展巴克谱失真(EBSD)测度方法,包括听觉响度计算,噪声掩蔽门限(NMT)计算和扩展巴克谱失真(EBSD)计算,在失真距离的计算中排除被噪声掩蔽门限(NMT)掩蔽的临界频带,使用EBSD测度后客观评价与主观评价结果之间具有相对其他测度更好的一致性。
Description
技术领域
本发明涉及客观音质评价中的失真测度方法,具体涉及基于噪声掩蔽门限算法的巴克谱失真测度方法
背景技术
目前国内外对客观音质评价方法的研究主要集中在各种测度的研究上,最终目的是研究和寻求到与主观评价特性曲线最为一致的计算测度,即主客观相关度最高的评价测度。目前较为成熟的有巴克谱失真BSD测度、对数谱距离测度LSD、MEL倒谱距离测度MEL-CD、LPC倒谱系数距离测度LPC-CD和基于瞬时掩蔽效应的改进的巴克谱测度MBSD等等。
发明内容
本发明的目的是提出了一种基于噪声掩蔽门限(NMT)算法的扩展的巴克谱失真(EBSD)测度方法,该测度依据人耳听觉系统的同时性掩蔽特性,在听觉响度域内动态地确定原始语音信号和失真语音信号的响度差掩蔽阈,对不同的语音失真条件,选取不同的掩蔽阈,以此来提高和改善测度的一致性和相关性。
本发明的测度方法分以下三步实现:
(1)计算输入信号和输出信号的响度差;
1)将输入信号和输出信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),再求得各个临界频带内的巴克谱功率能量,然后对每个巴克带抽一次样,得到临界带能量Bij
2)应用扩展函数,扩展函数矩阵为
对步骤1)中得到的临界带能量Bij用扩展函数进行滤波卷积 得到第j个Bark带的扩展巴克谱C(j);
3)然后将扩展巴克谱C(j)在话音频带内应用等响度曲线预加重得到信号的响度级,最后将响度级转换为输入信号和输出信号的响度,最后得到输入信号与输出信号的响度差dxy(i);
(2)确定输入信号的噪声掩蔽门限值(NMT);
1)将输入信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),再求得各个临界频带内的巴克谱功率能量,然后对每个巴克带抽一次样,得到临界带能量Bij
2)应用扩展函数:扩展函数矩阵为
对步骤1)中得到的临界带能量Bij用扩展函数进行滤波卷积 得到第j个Bark带的扩展巴克谱C(j);
3)计算NMT:谱平坦度量度(SFM)定义为信号功率谱的几何平均Gm与算术平均Am的比值
定义一个音调因子α作为信号音调特性的判断:
根据音调因子α的值可以确定一个对扩展巴克谱C(j)的修正值:
Qj=α(14.5+j)+5.5(1-α)
然后得到巴克带噪声掩蔽门限:
4)听阈比较,最后把得到的每个临界频带NMT与听阈比较,如果某临界频带的NMT小于听阈,则实际的掩蔽门限以听阈代替,听阈的计算公式为
(3)巴克谱失真(EBSD)计算:定义一个掩蔽矩阵符号M(i,j)(其中j表示第i帧的第j个Bark带),M(i,j)的取值由输入信号与输出信号的响度差dxy(i)与NMT比较得来
M(i,j)=1 dxy(i,j)>NMT(i,j)
M(i,j)=0 dxy(i,j)≤NMT(i,j)
计算出第i帧的巴克谱失真距离:
最后计算出整个信号总的失真距离为
在BSD测度用于语音SSB调制经过不同干扰失真都已达到主客观评价高度相关的情况下,对同样的实验条件EBSD得到的结果还是进一步提高了主客观评价的相关系数百分之一到百分之三左右,标准偏差得到减小,表明这种测度是一种与主观音质评价一致性更好的语音测度。同时,基于扩展函数的EBSD测度相对于MBSD具有更好的普适性。
附图说明
图1是基于噪声掩蔽门限算法的巴克谱失真(EBSD)测度方法工作框图
图2是18个扩展函数临界带滤波器组
图3是SSB调制失真条件BSD测度归一化主客观评价二次拟合曲线
图4是SSB调制失真条件EBSD测度归一化主客观评价二次拟合曲线
具体实施方式
下面结合附图详细说明本发明的实现方法
EBSD测度主要分为三步,即听觉响度计算、噪声掩蔽门限NMT估计和EBSD计算,其工作原理框图见图1。
本发明的独创性在于将NMT算法引入广泛使用的BSD失真测度,采用SFM方法来度量噪声对纯音的掩蔽和纯音对噪声的掩蔽,比较语音信号的响度差与NMT的值作为失真距离计算的判决准则,即在失真距离的计算中考虑NMT是否掩蔽信号的响度差。其中确定输入语音的噪声掩蔽门限值NMT是计算EBSD测度的关键步骤,符合人耳听觉掩蔽特性的NMT由信号临界频带分析、对巴克谱应用谱扩展函数、计算NMT和听阈比较四步来完成。
如图1所示,要对输入语音信号和输出语音信号分别进行预处理,预处理包括将输入语音信号和输出语音信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),接着按照下面表1中的临界频带划分,
频带数(Bark) | 中心频率(Hz) | 带宽(Hz) | 下限频率(Hz) | 上限频率(Hz) | 频带数(Bark) | 中心频率(Hz) | 带宽(Hz) | 下限频率(Hz) | 上限频率(Hz) | |
1 | 50 | 80 | 20 | 100 | 13 | 1850 | 280 | 1720 | 2000 | |
2 | 150 | 100 | 100 | 200 | 14 | 2150 | 320 | 2000 | 2320 | |
3 | 250 | 100 | 200 | 300 | 15 | 2500 | 380 | 2320 | 2700 | |
4 | 350 | 100 | 300 | 400 | 16 | 2900 | 450 | 2700 | 3150 | |
5 | 450 | 110 | 400 | 510 | 17 | 3400 | 550 | 3150 | 3700 | |
6 | 570 | 120 | 510 | 630 | 18 | 4000 | 700 | 3700 | 4400 | |
7 | 700 | 140 | 630 | 770 | 19 | 4800 | 900 | 4400 | 5300 | |
8 | 840 | 150 | 770 | 920 | 20 | 5800 | 1100 | 5300 | 6400 | |
9 | 1000 | 160 | 920 | 1080 | 21 | 7000 | 1300 | 6400 | 7700 | |
10 | 1170 | 190 | 1080 | 1270 | 22 | 8500 | 1800 | 7700 | 9500 | |
11 | 1370 | 210 | 1270 | 1480 | 23 | 10500 | 2500 | 9500 | 12000 | |
12 | 1600 | 240 | 1480 | 1720 | 24 | 13500 | 3500 | 12000 | 15500 |
表1(临界频带的划分)
求得各个临界频带(只取前面17个)内的巴克谱功率能量,然后对每个Bark带抽一次样,即求得每个Bark带在一帧信号中的能量分布,得到临界带能量:
得到Bij后再应用扩展函数,扩展函数矩阵为
图2为扩展函数滤波器组。
对Bij用扩展函数进行滤波卷积:
这样得到的C(j)值就是第j个Bark带的扩展巴克谱,意味着其它各临界带对这一频带的综合影响作用。然后将扩展巴克谱C(j)在话音频带内应用等响度曲线预加重得到信号的响度级,将响度级转换为语音信号的响度,分别得到输入语音信号和输出语音信号第i帧的响度Lx(i)与Ly(i)。
然后根据Lx(i)和Ly(i)计算出输入语音信号和输出语音信号之间的响度差dxy(i)。
同时要确定输入语音信号的噪声掩蔽门限,将输入语音信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),接着按照上面表1中的临界频带划分,求得各个临界频带(只取前面17个)内的巴克谱功率能量,然后对每个Bark带抽一次样,即求得每个Bark带在一帧信号中的能量分布,得到临界带能量:
得到Bij后再应用扩展函数,估计临界频带之间的相互影响。扩展函数用来描述各个临界带的信号对其它临界带信号的掩蔽特性。实际应用中,可以用两条线段来保守地逼近实验中得出的掩蔽曲线。扩展函数矩阵为
对Bij用扩展函数进行滤波卷积:
这样得到的C(j)值就是第j个Bark带的扩展巴克谱,意味着其它各临界带对这一频带的综合影响作用。语音信号的音调特性决定了掩蔽程度的大小。同时性掩蔽效应包括纯音掩蔽噪声和噪声掩蔽纯音两种情况,因此各部分的贡献大小与信号的音调特性(似噪性)有关。谱平坦度量度SFM(Spectral FlatnessMeasure)定义为信号功率谱的几何平均Gm与算术平均Am的比值
接着定义一个音调因子α作为信号音调特性的判断:
其中SFMmax=-60dB时设定信号是完全纯音特性,如果SFM=0dB,则信号几乎为完全噪声特性。
当纯音掩蔽噪声时,掩蔽值为扩展谱C(j)减去(14.5+j),即低于C(j)-(14.5+j)dB的噪声是听不见的;反之,噪声掩蔽纯音时,C(j)-5.5dB以下的语音也是听不见的。根据音调因子α的值可以确定一个对C(j)的修正值:
Oj=α(14.5+j)+5.5(1-α)
然后得到Bark带噪声掩蔽门限:
最后把得到的每个临界频带NMT与听阈比较,如果某临界频带的NMT小于听阈,则实际的掩蔽门限以听阈代替,听阈的计算公式为
最后得到输入语音信号的噪声掩蔽门限(NMT)。
最后根据求得语音信号响度差和输入语音信号的噪声掩蔽门限(NMT)来进行EBSD计算。为了确定某一临界带是否可以感知,定义一个掩蔽矩阵符号M(i,j),j表示第i帧的第j个Bark带。当失真可以被感知,M(i,j)为1,反之M(i,j)为0,它也是一个只包含0和1元素的矩阵。而M(i,j)的取值由dxy(i)与NMT比较得来
M(i,j)=1 dxy(i,j)>NMT(i,j)
M(i,j)=0 dxy(i,j)≤NMT(i,j)
下面把所有听觉能感知的响度差求和得到一帧信号的失真距离,即计算巴克谱失真时不考虑被掩蔽的距离:
这里EBSD(i)为第i帧的失真距离,在300-3400Hz的话音频带取15Bark。最后整个测试信号总的失真距离为
通过比较语音信号的响度差与NMT的值,在失真距离的计算中排除被NMT掩蔽的临界频带,得出语音信号的失真曲线。
本发明依据人耳听觉系统的同时性掩蔽特性,在听觉响度域内动态地确定原始语音信号和失真语音信号的响度差掩蔽阈,该掩蔽阈主要由信号的音调性修正得来,对不同的语音失真条件,选取不同的掩蔽阈能够得到各自最好的相关性,从客观评价与主观评价的统计相关性上表明,使用本发明EBSD测度后客观评价与主观评价结果之间具有相对其他测度更好的一致性。
在BSD测度用于语音SSB调制经过不同干扰失真都已达到主客观评价高度相关的情况下,对同样的实验条件EBSD得到的结果还是进一步提高了主客观评价的相关系数百分之一到百分之三左右,标准偏差得到减小(见表2、图3和图4),表明这种测度是一种与主观音质评价一致性更好的语音测度。同时,基于扩展函数的EBSD测度相对于MBSD具有更好的普适性。三种BSD测度的相关系数比较见下表(表2):
SSB | |
BSDMBSDEBSD | 0.9180.9180.923 |
表2三种BSD测度的相关系数
Claims (4)
1、一种客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法,包括以下三步:
(1)计算输入信号和输出信号的响度差;
(2)确定输入信号的噪声掩蔽门限值(NMT);
(3)通过比较信号的响度差与噪声掩蔽门限(NMT)的值进行巴克谱失真(EBSD)计算。
2、根据权利要求1所述的基于噪声掩蔽门限算法的巴克谱失真测度方法,其步骤(1)中的计算信号的响度差由以下三步完成:
1)将输入信号和输出信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),再求得各个临界频带内的巴克谱功率能量,然后对每个巴克带抽一次样,得到临界带能量Bij
2)应用扩展函数,扩展函数矩阵为
对步骤1)中得到的临界带能量Bij用扩展函数进行滤波卷积
3)然后将扩展巴克谱C(j)在话音频带内应用等响度曲线预加重得到信号的响度级,最后将响度级转换为输入信号和输出信号的响度,最后得到输入信号与输出信号的响度差dxy(i);
3、根据权利要求1所述的基于噪声掩蔽门限算法的巴克谱失真测度方法,其步骤(2)中的确定输入信号的噪声掩蔽门限值(NMT)由以下四步完成:
1)将输入信号作FFT变换后得到功率谱P(k)(P(k)=Re2(k)+Im2(k)),再求得各个临界频带内的巴克谱功率能量,然后对每个巴克带抽一次样,得到临界带能量Bij
2)应用扩展函数:扩展函数矩阵为
对步骤1)中得到的临界带能量Bij用扩展函数进行滤波卷积
3)计算NMT:谱平坦度量度(SFM)定义为信号功率谱的几何平均Gm与算术平均Am的比值
定义一个音调因子α作为信号音调特性的判断:
根据音调因子α的值可以确定一个对扩展巴克谱C(j)的修正值:
Oj=α(14.5+j)+5.5(1-α)
然后得到巴克带噪声掩蔽门限:
4)听阈比较,最后把得到的每个临界频带NMT与听阈比较,如果某临界频带的NMT小于听阈,则实际的掩蔽门限以听阈代替,听阈的计算公式为
4、根据权利要求1所述的基于噪声掩蔽门限算法的巴克谱失真测度方法,其步骤(3)中的巴克谱失真(EBSD)计算方法如下:定义一个掩蔽矩阵符号M(i,j)(其中j表示第i帧的第j个Bark带),M(i,j)的取值由输入信号与输出信号的响度差dxy(i)与NMT比较得来
M(i,j)=1 dxy(i,j)>NMT(i,j)
M(i,j)=0 dxy(i,j)≤ NMT(i,j)
计算出第i帧的巴克谱失真距离:
最后计算出整个信号总的失真距离为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100202023A CN1321400C (zh) | 2005-01-18 | 2005-01-18 | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100202023A CN1321400C (zh) | 2005-01-18 | 2005-01-18 | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1655230A true CN1655230A (zh) | 2005-08-17 |
CN1321400C CN1321400C (zh) | 2007-06-13 |
Family
ID=34894268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100202023A Expired - Fee Related CN1321400C (zh) | 2005-01-18 | 2005-01-18 | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1321400C (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101682768A (zh) * | 2007-04-09 | 2010-03-24 | 特克特朗尼克公司 | 用于空间隔离的伪影剖析、分类和测量的系统和方法 |
CN101115051B (zh) * | 2006-07-25 | 2011-08-10 | 华为技术有限公司 | 音频信号处理方法、系统以及音频信号收发装置 |
CN103578479A (zh) * | 2013-09-18 | 2014-02-12 | 中国人民解放军电子工程学院 | 基于听觉掩蔽效应的语音可懂度测量方法 |
CN104703093A (zh) * | 2013-12-09 | 2015-06-10 | 中国移动通信集团公司 | 一种音频输出方法及装置 |
CN105280195A (zh) * | 2015-11-04 | 2016-01-27 | 腾讯科技(深圳)有限公司 | 语音信号的处理方法及装置 |
CN105989853A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 一种音频质量评测方法及系统 |
CN107342074A (zh) * | 2016-04-29 | 2017-11-10 | 王荣 | 语音和声音的识别方法发明 |
CN109781245A (zh) * | 2019-01-15 | 2019-05-21 | 江铃汽车股份有限公司 | 一种柴油发动机脉冲噪声的客观评价方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
CN2137057Y (zh) * | 1992-06-29 | 1993-06-23 | 邮电部第一研究所 | 精确测定响度评定值的扫频当量仪 |
KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
US6438373B1 (en) * | 1999-02-22 | 2002-08-20 | Agilent Technologies, Inc. | Time synchronization of human speech samples in quality assessment system for communications system |
JP3868278B2 (ja) * | 2001-11-30 | 2007-01-17 | 沖電気工業株式会社 | 音声信号品質評価装置及びその方法 |
US6794567B2 (en) * | 2002-08-09 | 2004-09-21 | Sony Corporation | Audio quality based culling in a peer-to-peer distribution model |
CN100347988C (zh) * | 2003-10-24 | 2007-11-07 | 武汉大学 | 一种宽频带语音质量客观评价方法 |
-
2005
- 2005-01-18 CN CNB2005100202023A patent/CN1321400C/zh not_active Expired - Fee Related
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101115051B (zh) * | 2006-07-25 | 2011-08-10 | 华为技术有限公司 | 音频信号处理方法、系统以及音频信号收发装置 |
CN101682768A (zh) * | 2007-04-09 | 2010-03-24 | 特克特朗尼克公司 | 用于空间隔离的伪影剖析、分类和测量的系统和方法 |
CN101682768B (zh) * | 2007-04-09 | 2013-07-10 | 特克特朗尼克公司 | 用于空间隔离的伪影剖析、分类和测量的系统和方法 |
CN103578479B (zh) * | 2013-09-18 | 2016-05-25 | 中国人民解放军电子工程学院 | 基于听觉掩蔽效应的语音可懂度测量方法 |
CN103578479A (zh) * | 2013-09-18 | 2014-02-12 | 中国人民解放军电子工程学院 | 基于听觉掩蔽效应的语音可懂度测量方法 |
CN104703093A (zh) * | 2013-12-09 | 2015-06-10 | 中国移动通信集团公司 | 一种音频输出方法及装置 |
CN105989853A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 一种音频质量评测方法及系统 |
CN105280195A (zh) * | 2015-11-04 | 2016-01-27 | 腾讯科技(深圳)有限公司 | 语音信号的处理方法及装置 |
CN105280195B (zh) * | 2015-11-04 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 语音信号的处理方法及装置 |
US10586551B2 (en) | 2015-11-04 | 2020-03-10 | Tencent Technology (Shenzhen) Company Limited | Speech signal processing method and apparatus |
US10924614B2 (en) | 2015-11-04 | 2021-02-16 | Tencent Technology (Shenzhen) Company Limited | Speech signal processing method and apparatus |
CN107342074A (zh) * | 2016-04-29 | 2017-11-10 | 王荣 | 语音和声音的识别方法发明 |
CN107342074B (zh) * | 2016-04-29 | 2024-03-15 | 王荣 | 语音和声音的识别方法 |
CN109781245A (zh) * | 2019-01-15 | 2019-05-21 | 江铃汽车股份有限公司 | 一种柴油发动机脉冲噪声的客观评价方法 |
CN109781245B (zh) * | 2019-01-15 | 2021-03-23 | 江铃汽车股份有限公司 | 一种柴油发动机脉冲噪声的客观评价方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1321400C (zh) | 2007-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1655230A (zh) | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 | |
CN108831499B (zh) | 利用语音存在概率的语音增强方法 | |
US10796712B2 (en) | Method and apparatus for detecting a voice activity in an input audio signal | |
CN101976566B (zh) | 语音增强方法及应用该方法的装置 | |
CN1083183C (zh) | 用来降低语音信号中噪声的方法和装置 | |
JP5164970B2 (ja) | 音声復号装置および音声復号方法 | |
US6687669B1 (en) | Method of reducing voice signal interference | |
CN105989853B (zh) | 一种音频质量评测方法及系统 | |
CN1140869A (zh) | 用于降低噪声的方法 | |
CN1969320A (zh) | 噪声抑制装置及噪声抑制方法 | |
CN1326584A (zh) | 低比特率语音编码器的噪声抑制 | |
CN1945696A (zh) | 在速率可变的声码器中选择编码速率的方法和装置 | |
CN1727860A (zh) | 增益受限的噪音抑制 | |
CN1870135A (zh) | 基于掩蔽曲线的数字助听器频响补偿方法 | |
CN1430778A (zh) | 噪声抑制装置 | |
CN1967659A (zh) | 用于助听器的语音增强方法 | |
CN105679330B (zh) | 基于改进子带信噪比估计的数字助听器降噪方法 | |
CN1805008A (zh) | 语音检测装置、自动图像拾取装置和语音检测方法 | |
CN1496558A (zh) | 用于确定语音信号的质量的方法和设备 | |
CN101930746A (zh) | 一种mp3压缩域音频自适应降噪方法 | |
CN106782586B (zh) | 一种音频信号处理方法及装置 | |
CN100347988C (zh) | 一种宽频带语音质量客观评价方法 | |
CN101034878A (zh) | 增益调整方法和增益调整装置 | |
CN105869652B (zh) | 心理声学模型计算方法和装置 | |
Cao et al. | Multi-band spectral subtraction method combined with auditory masking properties for speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070613 Termination date: 20120118 |