CN1523856A - 总话音质量估算方法和装置、实现该方法的程序和记录介质 - Google Patents
总话音质量估算方法和装置、实现该方法的程序和记录介质 Download PDFInfo
- Publication number
- CN1523856A CN1523856A CNA200310114765XA CN200310114765A CN1523856A CN 1523856 A CN1523856 A CN 1523856A CN A200310114765X A CNA200310114765X A CN A200310114765XA CN 200310114765 A CN200310114765 A CN 200310114765A CN 1523856 A CN1523856 A CN 1523856A
- Authority
- CN
- China
- Prior art keywords
- quality
- degradation
- delay
- interaction
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 61
- 238000006731 degradation reaction Methods 0.000 claims abstract description 185
- 230000015556 catabolic process Effects 0.000 claims abstract description 184
- 238000011156 evaluation Methods 0.000 claims abstract description 71
- 230000003993 interaction Effects 0.000 claims abstract description 58
- 238000012360 testing method Methods 0.000 claims abstract description 39
- 238000013441 quality evaluation Methods 0.000 claims description 30
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 238000005259 measurement Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 20
- 230000006866 deterioration Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000012887 quadratic function Methods 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 208000027382 Mental deterioration Diseases 0.000 claims description 2
- 206010027374 Mental impairment Diseases 0.000 claims description 2
- 208000010877 cognitive disease Diseases 0.000 claims description 2
- 230000003340 mental effect Effects 0.000 claims description 2
- 238000007796 conventional method Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000001107 psychogenic effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000006727 cell loss Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
公开了一种总话音质量估算方法和装置、实现该方法的程序和记录介质。根据从其中接收的信号,测量测试系统的延迟时间和收听质量,接着在相同质量尺度上,将测量的延迟时间和收听质量转换为与延迟有关的降质和收听质量下降,然后计算与延迟有关的降质和收听质量下降之间的相互作用的量值,将与延迟有关的降质、收听质量下降和相互作用的量值加在一起以获得一总降质。将该总降质转换为一主观评价值以估算总话音质量。
Description
技术领域
本发明涉及估算电话业务中的话音质量的方法,特别是,涉及一种在IP电话中,根据被测量的系统的物理特征的测量值,估算主观会话话音质量,而不进行用于评价实际会话话音质量的主观评价测试的总会话话音质量估算方法和装置;进一步地,本发明同样关于用于实现该方法的程序以及具有存储于其上的程序的记录介质。
背景技术
近年来,产业注意力聚焦在利用IP技术而实现的“IP电话业务”(VoIP:基于IP(网际协议)的话音)。由于IP电话业务是通过不需要保证会话话音质量的系统的实时电信业务,IP电话业务开始之前的质量设计和业务开始之后的质量管理对于稳定操作都是必不可少的。为此,发展一个能够适当描述使用户满意的话音质量的简单而有效的质量评价方案是重要的。
在IP电话业务中,话音质量的基本评价是主观评价,该主观评价是通过心理体验,定量地评价用户在IP电话应用期间所经历的实际主观质量。对于该主观评价,广泛地采用在ITU-T建议P.800中定义的评价测试。在这种方法中,给定1比5比例的实际主观质量作为一个被称为MOS(平均意见评分)的平均值。在这种MOS值中有,例如,包括会话质量因素的总话音质量估算的会话MOS,和仅基于收听质量的收听MOS。
由于评价测试实际上是由人来评价话音质量,MOS值被当作当用户接收所关心的业务时所感觉的话音质量的最合适的评分。然而,因为主观评价,评价测试要求更多劳动和时间以及专用的评价设备,因此该方案未必能容易地实现,并且在它操作开始之后尤其难于用于IP电话的质量管理。考虑到这个,研究了一种利用电信特征的物理量值来估算通过主观评价获得的MOS值的方案。这个方案被称为“客观评价方法”,与主观评价方法相反,并且对于该客观评价方法,根据其目的和方法提议了几种变化。
在ITU-T建议P.862中定义的PESQ(话音质量的感觉评价)方法是一种基于实际话音信号的物理测量的客观评价方法;在某种条件下,这种方法能够估算主观话音质量,关于该主观话音质量的估算误差作为主观评价的统计置信间隔。PESQ方法在估算收听MOS是有效的,但是它在原理上,不能估算会话质量因素,如延迟和回音。
另一方面,ITU-T建议G.107中定义的E模型是一种包括会话质量因素的总通信话音质量估算技术。E模型是在心理尺度上通过如收听质量、延迟以及回音等个别质量因素来表示降质,并将这些降质加在一起,该模式由下列等式表示。
R=Ro-Is-Id-Ie,eff+A (1)
基本信噪比Ro代表由电路噪声、发送机/接收机室内噪声和用户线路噪声引起的主观质量下降。同时降质因素评价值Is代表由于音量、侧音以及量化失真引起的主观质量下降。与延迟有关的降质因素估算值Id代表由于发话人回音、受话人回音以及纯延迟引起的主观质量下降。设备降质因素评价值Ie,eff代表由于低比特速率CODEC和分组/信元丢失造成的主观质量下降。有利因素评价值A补充移动通信在主观质量(满意水平)上的有利影响。
E模型是基于这些质量下降可以在心理尺度上简单地相加在一起的假设。在利用E模型所假设的简单相加模式来估算包括产生难以解释的效果的降质因素的总话音质量的情况下,该E模型估算有时可能偏离用户所体验的实际主观质量。
发明内容
因此本发明的一个目在于,提供一种用于消除由现有E模型的假设的缺陷所造成的估算正确性降低的问题,和允许实现高精度估算总通话质量的方法和装置。
根据本发明,用于估算具有多个质量下降因素的测试系统的话音质量的方法,包括下列步骤:
(a)基于从所述系统接收的信号,测量所述系统的所述质量下降因素的初始评价值;
(b)将所述质量下降因素的初始评价值转换为心理降质(心理尺度上的值);
(c)通过所述多个质量下降因素的至少两个,计算心理降质之间的相互作用的量值;
(d)计算所述心理降质和所述相互作用的量值之和,作为一个总降质;以及
(e)将所述总降质转换为一主观质量评价值。
根据本发明,一种用于估算具有多个质量下降因素的测试系统的话音质量的总话音质量估算装置,包括:
质量测量部件,用于基于从所述系统接收的信号,测量所述系统的所述质量下降因素的初始评价值;
转换部件,用于将所述质量下降因素的所述初始评价值转换为心理降质(心理尺度的值);
相互作用量计算部件,用于根据从所述转换部件输出的值,计算所述多个质量下降因素之间的相互作用的量;
相加部件,用于将所述初始评价值和所述相互作用量值相加,以获得总降质;以及
总话音质量估算部件,用于将所述总降质转换为主观质量评价值。
通过如上所述考虑至少两个质量下降因素之间的相互作用,可以提供增强的总话音质量的估算精度。
附图说明
图1是示出根据本发明的总话音质量估算装置的第一实施例的配置的方框图;
图2是示出根据本发明,考虑到与延迟有关的降质和收听质量下降之间的相互作用的总降质的测量值的图;
图3是基于表示包括相互作用的总降质的等式的概念图;
图4是示出本发明的实施例效果的图表;
图5是示出根据本发明的总话音质量估算方法的基本程序的流程图;以及
图6是示出本发明的第二实施例的方框图。
具体实施方式
实施例1
图1是示出用于实施根据本发明的总话音质量估算方法的设备配置的方框图。本发明可应用于测试系统100中的话音质量的估算,例如在固定或IP电话业务中。这个实施例处理严重影响系统100的质量设计的延迟和收听质量,作为用于估算话音质量的质量因素,该评价输出是在这些因素被混合的情况下的总话音质量的估算。
在图1中,标号10通常代表根据本发明的总话音质量评价装置的实施例。该评价装置10包括:测量接口部分101,经过将被评价的系统100发送和接收测试信号;延迟时间测量部分102和收听质量测量部分103,基于从系统100接收的信号,测量质量因素的初始评价值,即,分别测量系统100的传输延迟时间和收听质量下降或者降质因素作为初始评价值;与延迟有关的降质评价值转换部分104和收听质量评价值转换部分105,将从测量部分102和103输出的测量值转换为与延迟有关的降质Idd和收听质量下降Ie,eff,它们是代表能够被加在一起的心理距离的尺度或者指标;相互作用值计算部分106,用于计算与延迟有关的降质Idd和收听质量下降Ie,eff之间的相互作用值Iint;相加部分107,通过把延迟降质Idd、收听质量下降Ie,eff和相互作用值Iint相加在一起而计算总话音质量指标LQd;以及总话音质量估算部分108,用于将从相加部分输出的指标LQd转换为主观话音质量评价值(例如,通过主观评价测试而获得的平均意见评分)。
根据实际用于测量延迟时间和收听质量的该方法,由所述总话音质量估算装置10中的测试信号产生部分,或者由一连接至质量估算装置10外部的系统100的测试信号发生器210产生用于测量的测试信号。
第一种延迟时间测量方法:延迟时间测量部分102通过比较包含在测量接口部分101从测试信号发生器210接收的话音信号的控制信息(如,VoIP中的RTP信头)内的时间标记和实际信号接收时间,来计算由系统100引起的单向延迟时间Ta。这种方法要求在发送和接收方之间的时间同步。
第二种延迟时间测量方法:当没有实现时间同步时,该延迟时间测量部分102采用RTCP(RTP控制协议:一种用于控制RTP传输的协议)来计算它和连接至系统100的任意接收终端(未示出)之间的往返延迟时间Td,并获得单向延迟时间Ta=Td/2。
第三种延迟时间测量方法:可选择地,延迟时间测量部分102通过从接收方向发送方发送Ping(分组因特网探索协议),来计算接收方至发送方之间的往返延迟时间Td,并获得单向延迟时间Ta=Td/2。
与延迟有关的降质评价转换部分104遵循预定的规则,以根据由延迟时间测量部分102测量的单向延迟时间Ta,获得由延迟引起的降质,即,与延迟有关的降质Idd。更特别地,在ITU-T建议G.107中定义的E模型中,通过下列方程式,基于通过试验获得的话音延迟和相应主观话音评价值(UTU-T建议P.800中定义的平均意见评分MOS)之间的关系,定义与延迟有关的降质。
Idd=0 Ta≤100ms时 (2)
其中
可选择地,下列等式可以被用于代替等式(2)和等式(3)。
Idd=b1Ta2+b2Ta (4)
其中,b1和b2是常数。
下面将给出一个描述,通过收听质量测量部分103测量质量下降因素,并根据测量的收听质量下降因素,由收听质量评价转换部分105获得收听质量下降Ie,eff的方法的三种变化(收听质量评价方法)。
第一种收听质量评价方法
在ITU-T建议G.107中定义的E模型中,质量下降Ie,eff用公式表示如下:
其中,Ie表示由话音编码引起的质量下降,Pp1表示分组丢失概率,以及Bp1表示编码系统的分组丢失强度。作为话音编码系统,可用例如PCM、ADPCM、A-CELP(代码激励线性预测)、MP-MLQ(多脉冲最大似然量化)、CS-ACELP(共轭结构代码激励线性预测)编码系统。关于这些编码系统,ITU-T建议的G.113附录I示出了由编码系统的编码和分组丢失强度值Bp1引起的质量下降Ie。在第一收听质量评价方法中,收听质量测量部分103测量接收信号的分组丢失概率Pp1作为收听质量下降因素,并通过参考上述IUT-T建议G.113附录I,根据预先获得的编码系统的类型确定值Ie和Bp1,以及收听质量评价值转换部分105通过等式(5)计算收听质量下降Ie,eff。
第二种收听质量评价方法
在ITU-T建议P.862中,示出如何获得PESQ(话音质量的感觉评价)值。该基础过程开始于测量已经通过测量系统的受损话音信号和还没有通过该系统的原始话音信号的频谱,接着,获得测量的频谱之间的差值,然后,根据差分频谱获得相应于失真量的值,如PESQ值。在通过上述建议P.862获得PESQ的实际过程中,数据经过各种其他处理,但是在本说明书中没有给与它们的描述,并且在下文中整个过程将被称作PESQ算法。
由测量接口部分101经过系统100从测试信号发生器210接收的话音信号被作为降质的话音信号,应用到收听质量测量部分103,同时,原始话音信号被直接地应用到收听质量测量部分103,如虚线所示。收听质量测量部分103根据该两种话音信号,通过PESQ算法计算话音质量评价值PESQ,作为收听质量下降因素。在实际测量中,例如由至少两个男人和两个女人发出的短句对(4)从测试信号发生部分210经过系统100被多次发出,并且直接发送至收听质量测试部分103,该收听质量测试部分103从多个接收的话音信号多次获得PESQ值,并输出它们的平均值作为最终的话音质量评价值PESQ。收听质量评价值转换部分105通过下列在ITU-T建议G.107附录I中定义的方程式,将所述PESQ值转换为在R值轴上的值。
其中,
方程式(6)获得的R值被从参考值减去以获得收听质量下降因素值Ie,eff。更明确地,使用通过将通过ITU-T建议G.711编码的信号的平均PESQ值代入方程式(6)而获得的值作为参考值来计算下列方程式,该平均PESQ值是由ITU-TP系列建议附录23给出的一种话音抽样。
Ie,eff=87.8-R(目标) (7)
第三种收听质量评价方法
在上述第二种收听质量评价方法中,原始话音信号需要从测试信号发生部分210直接应用到收听质量测量部分103,但是第三种收听质量评价方法通过以与例如,在Tetsuro YAMAZAKI和Hiroshi IRII的“Proposal of ObjectiveAssessment Method for Telecommunication Speech Quality Using PatternRecognition Technique”,IEICE SP92-94的技术报告,1992年11月第17-34页中所公开的相同的方式,通过仅从经过系统100接收的信号获得评价值来评价话音信号的收听质量。在这种情况下,预先进行失真话音的主观评价,以获得意见评价的频率分布。进一步,也产生代表失真的话音特征的声学参数的参考图案,例如,LPC对数倒频谱。通过利用该参考图案和将被评价的话音的图案之间的相似程度以及在其上产生参考图案的话音的意见评价点的分布,来估算话音质量。
以这种方法,通过测量接口部分101接收的将被评价的话音信号,在收听质量测量部分103中经过LPC分析以获得LPC对数倒频谱的声学图案,作为收听质量下降因素。计算这样获得的声学图案和参考图案之间的匹配,以决定最高相似程度的参考图案。接着,获得相应于所述参考图案的意见评价点的MOS值。
接下来,收听质量评价转换部分105使用该MOS值作为PESQ值来计算方程式(6)和(7),以获得收听质量下降Ie,eff,如上述第二收听质量评价方法的情况。
然后,本发明所特有的相互作用计算部分106遵循预定的规则,来计算与延迟有关的降质Idd和收听质量下降Ie,eff之间的相互作用值Iint。该相互作用将在以后进行详细描述。相加部分106将与延迟有关的Idd、收听质量下降Ie,eff和相互作用值Iint相加在一起,并输出相加结果作为总降质LQd。总话音质量估算部分108从相加部分107接收总降质LQd,然后从参考值中减去它以获得心理测量值(R-value),然后通过下面ITU-T建议G.107附件B中示出的该R-value和MOS值之间的关系,计算MOS值,并输出计算的MOS值作为主观评价值。
MOS=1 R≤0时
MOS=1+0.035R+R(R-60)(100-R)7×10-6 0<R<100时
MOS=4.5 R>100时
下面将给出被引入本发明的相互作用的具体描述。
在现有技术中,与延迟有关的降质和收听质量下降的总降质被表示为这两种降质之和,如由方程式(1)给出的,但是主观评价测试揭示了,在其中与延迟有关的降质和收听质量的降质都很大的区域中,总降质有时可以比这两种降质的简单相加之和要小。这种倾向可以归结于在其中一种质量下降严重的区域中,其它质量下降被在心理上掩饰的效果,结果总降质变得比这两种降质之和还小。
图2示出基于主观评价测试的上述效果的量化测量值。收听质量下降X和延迟降质Y是从仅仅使用收听质量和延迟作为参数的主观评价结果获得的心理降质。总降质Z是在同时降低收听质量和与延迟有关的质量的条件下,从主观评价结果获得的心理降质。由从一个参考值减去心理测量值(R-值)而获得的值来定义该“心理降质”,对该心理测量值,由ITU-T建议G.107附录I中定义的上述转换方程式(6)来转换ITU-T建议P.800中的平均意见评分(MOS)。该参考值是R-值,该R-值是当用没有与延迟有关的降质和收听质量下降条件下的MOS值代替方程式(6)中的变量PESQ而获得的。每个降质由这两个主观评价测试获得的降质的最大值进行归一化。为了比较,示出了根据传统方法作为总降质的Z=X+Y平面。
在X和Y都足够小的区域中,在根据传统方法的总降质Z和根据考虑到相互作用的本发明的方法的总降质Z之间基本上没有差别。在X和Y都很大的区域中,根据本发明方法的总降质小于根据传统方法的总降质。这意味着以简单相加形式的与延迟有关的降质和收听质量下降没有对总降质作出贡献,而相互掩盖。
将给出用于明确表达所述相互作用的过程的描述。
第一步骤是,设置具有不同的收听质量下降和不同的与延迟有关的质量下降的多个实验条件,之后,对于每个不同的条件,进行ITU-T建议P.800中定义的会话评价测试。例如,通过改变ITU-U建议P.810中定义的MNRU(调制噪声参考单元)中的Q-值的方法,控制收听质量下降。通过在实验系统中插入延迟生成设备并改变它的延迟,可以控制与延迟有关的质量下降。假设对于每个Q-值条件加入零延迟。
接着,确定MNRU条件的收听质量下降。特别地,在没有与延迟有关的降质的一个Q-值条件(那就是,降质是0的条件)下,由上述会话评价测试获得的MOS值,通过ITU-T建议G.107附录I中定义的上述转换方程式(6)被转换为R-值。通过从该R-值中减去除了收听质量下降的降质(例如,回音降质和侧音降质),确定对于MNRU中的每个Q-值条件的收听质量下降。
进一步,下列程序接着量化与延迟有关的降质和收听质量下降之间的相互作用。
(a)对于所有实验条件,通过上述方法,将MOS值变换为R-值。
(b)基于E模型计算已计算的“收听质量下降和与延迟有关的降质的总降质”(即,相应于每个Q-值条件的收听质量下降和相应于每个延迟时间条件的与延迟有关的降质的总和)。
(c)使用相应于延迟为0和Q-值为无穷大的条件(即,没有收听质量下降的条件)的R-值作为参考,并从该R-值中减去在(a)中获得的值,以获得包括相互作用的“收听质量下降和与延迟有关的降质的总降质”。
(d)从(b)中的值减去(c)中的值以获得相应于每个实验条件的相互作用的量值。
(e)使用“收听质量下降(X)”和“与延迟有关的降质(Y)”作为解释变量和(d)中的总降质(Z)作为目标变量,进行回归分析。在这个实施例中,通过具有两个未知数的二次函数近似Z,以获得下列方程式。
Z=X+Y+XY(C1-C2X-C3Y+C4XY) (8)
其中,C1、C2、C3、C4是常数。通过在方程式(8)中设置总降质Z=LQd,与延迟有关的降质Idd=X和收听质量下降Y=Ie,eff,总降质LQd被公式化。由下列方程式给出相互作用Iint。
Iint=XY(C1-C2X-C3Y+C4XY) (9)
如将要从方程式(8)中所见,当基本上不存在收听质量下降X时,总降质Z被给定为收听质量下降A和与延迟有关的降质X之和,但是随着收听质量下降X的增加,相互作用的影响急剧增加。对于与延迟有关的降质具有相同的情况。为了参考图2更好地理解上述相互作用的影响,图3中示出了考虑了相互作用由方程式(8)计算的总降质值Z和根据传统方法的总降质Z=X+Y。在使用根据测量结果计算的方程式(8)中的常数C1、C2、C3和C4时,在其中X和Y值都很大的区域中,由于方程式(9)中的相互作用值Iint是一个负数,根据本发明的总降质Z变得比根据传统方法的总降质Z=X+Y要小。
图4是示出本发明增加质量估算精确性的效果的图表。横坐标代表通过主观评价测试而获得的测量的评价值,以及纵坐标代表估算的评价值。指示测量点的正方形是通过不考虑相互作用的E模型获得的结果,圆形是由本发明获得的结果。从图4中可以看出,在质量下降大的区域中,在精确性方面,由本发明获得的评价值比通过传统方法获得的评价值要高。
虽然图1实施例已经被描述以获得延迟和收听质量的总质量评价,考虑到其间相似的相互作用,也可以评价其它质量因素,例如回音和音量的总话音质量。
图5示出根据上述本发明的总话音质量评价方法的过程。
步骤S1:通过质量测量部件(延迟时间测量部分102和收听质量测量部分103),测量多个质量下降因素例如,延迟时间和收听质量的初始评价值。
步骤S2:通过转换部件(与延迟有关的降质评价值转换部分104和收听质量评价值转换部分105),将测量的初始评价值转换为心理降质,例如,与延迟有关的降质和收听质量下降。
步骤S3:通过相互作用计算部件(相互作用计算部分106),计算两种心理降质(与延迟有关的降质和收听质量下降)之间的相互作用的量值。
步骤S4:通过相加部件(加法器107)将心理降质和相互作用的量值相加,以获得总降质。
步骤S5:通过总话音质量估算部件(总话音质量估算部分108),将总降质转换为主观质量评价值。
如上所述,通过考虑不同的质量下降因素的心理降质之间的相互作用,可以高精确性地估算话音质量。
实施例2
图6是用于实施根据本发明的总话音质量估算方法的第二实施例的设备配置的方框图。该实施例与实施例1的不同之处在于,基于从实际话音信号观测的特征,适应性改变相互作用计算部分106中的计算方程式。相应于图1中的部分被用以相同标号标识。
假设,延迟时间测量部分102使用从连接到测试系统100的任意通信终端(没有示出)发出的信号,而不是采用从测试信号发生器210发出的信号,作为先前在实施例1中描述的第一延迟时间测量方法中接收的信号。也可以采用相对于图1实施例的上述第二或者第三延迟时间测量方法。收听质量测量部分103和收听质量评价值转换部分105使用先前参照图1实施例描述的第一和第三收听质量评价方法的一种执行处理。
会话特征测量部分120比较各个信道(上行链路和下行链路话音信道)中会话话音信号的时间结构,从而确定代表所关心的通信中的相互作用的程度的客观尺度。作为一具体方案可以使用,例如,在Kenzou ITOH和NobuhikoKITAWAKI的“Delay-Related Quality EValuation Method Using TemporalFeatures of Conversational Speech”,日本声学工程师协会的会刊,1987年4月,第851-857页,第11号,第43栏中提出的客观评价尺度Od。在上述文章中,因为与延迟有关的降质评价值和收听质量评价值受到会话的谈话、停顿、响应速度和响应频率的影响,它们被量化分析,并且客观评价尺度Od根据谈话时间长度平均值Tp、它的标准偏差Tps和会话交换频率Rn,由下列方程式定义。
Od=Tp+TpsW1+(1/Rn)W2 (10)
其中,W1和W2是加权系数。
会话特征测量部分120根据经由测试系统100接收的会话话音,测量Tp、Tps和Rn,并通过方程式(10)计算客观尺度Od。预先根据客观尺度Od的大小而优化的相互作用计算方程式和与延迟有关的降质评价转换方程式是预定的,如下所示:
Od≤T1 :Int1=XY(C11-C12X-C13Y+C14XY)和Idd1=f1(Ta)
T1<Od≤T:Int2=XY(C21-C22X-C23Y+C24XY)和Idd2=f2(Ta)
. . .
. . .
Tn-1<Od≤Tn:Intn=XY(Cn1-Cn2X-Cn3Y+Cn4XY)和Iddn=fn(Ta)
相应于客观尺度Od,预先最优化常数组(C11,...,C14),(C21,...,C24),...,(Cn1,...,Cn4)。同样地,多个与延迟有关的降质评价值转换方程式f1(Ta),...,fn(Ta)是预定的,例如,通过相应于客观尺度Od最优化方程式(4)的常数组(b1,b2)。在计算方程式数据库部分122中的表123中,预先存储客观尺度Od和相互作用计算以及与延迟有关的降质评价值转换方程式之间的关系。基于从对话特征测量部分120提供的客观尺度Od,计算方程式确定部分121参考计算方程式数据库部分122内的表123,然后选择相应于客观尺度Od的相互作用计算方程式Iint和与延迟有关的降质评价值转换方程式Idd,并且在相互作用计算部分106和与延迟有关的降质评价值转换部分104中设置它们。相互作用计算部分106、相加部分107和总话音质量估算部分109以与图1实施例中相同的方式进行操作。在图6实施例中,也可以是相互作用计算部分和与延迟有关的降质评价转换部分中的一个总是使用一预定的方程式,而另一个根据所述客观尺度Od有选择地使用方程式。
通过参考本发明的实施例1和2描述的总话音质量估算方法的过程能够被描述为可由计算机执行的程序,以允许它实现本发明。另外,该程序可以预先记录在计算机可读介质上,并在需要时被读出执行。
如上面描述,根据本发明的总话音质量估算方法,可以进行现有技术没有考虑到的反映“质量因素之间的相互作用”的总话音质量估算,结果,本发明提高了话音质量估算中的精确性。
Claims (19)
1.一种用于估算测试系统的话音质量的方法,该系统具有多个质量下降因素,所述方法包括下列步骤:
(a) 基于从所述系统接收的信号,测量所述系统的所述质量下降因素的初始评价值;
(b) 将所述质量下降因素的初始评价值转换为心理降质;
(c) 通过所述多个质量下降因素的至少两个,计算所述心理降质之间的相互作用的量值;
(d) 计算所述心理降质和所述相互作用的量值之和作为总降质;和
(e) 将所述总降质转换为一主观质量评价值。
2.如权利要求1所述的方法,其中,所述质量下降因素是延迟、收听质量、回音和音量中的至少两个。
3.如权利要求1所述的方法,其中,所述步骤(c)包括步骤:通过使用具有收听质量下降和与延迟有关的降质的两个未知数的二次函数,进行回归分析以获得所述相互作用的量值。
4.如权利要求1所述的方法,其中,所述步骤(a)包括步骤:经由所述测试系统发送和接收测试信号,并测量质量下降因素。
5.如权利要求1所述的方法,其中,所述测试系统是一IP电话通信路径。
6.如权利要求1所述的方法,其中,所述步骤(a)包括步骤:根据经由所述测试系统接收的实际话音信号,测量所述质量下降因素。
7.如权利要求6所述的方法,其中,所述步骤(a)包括步骤:测量为所述质量下降因素之一的延迟,作为所述初始评价值之一;所述步骤(c)包括步骤:根据所述实际话音信号测量会话话音特征;所述步骤(b)包括步骤:从相应于会话话音特征的多个预定转换方程式中,选择相应于所述测量的会话话音特征的转换方程式,并计算与延迟有关的降质作为所述心理降质之一。
8.如权利要求6或7所述的方法,其中,所述步骤(c)包括步骤:基于根据所述实际话音信号测量的所述会话话音特征,适应性改变所述相互作用的量值。
9.一种用于估算测试系统的话音质量的总话音质量估算装置,该系统具有多个质量下降因素,所述装置包括:
质量测量部件,用于基于从所述系统接收的信号,测量所述系统的所述质量下降因素的初始评价值;
转换部件,用于将所述质量下降因素的所述初始评价值转换为心理降质;
相互作用量计算部件,用于根据来自于所述转换部件的输出值,计算所述多个质量下降因素之间的相互作用的量值;
相加部件,用于相加所述初始评价值和所述相互作用的量值,以获得一总降质;以及
总话音质量估算部件,用于将所述总降质转换为一主观质量评价值。
10.如权利要求9所述的装置,其中,所述质量测量部件包括:延迟时间测量部分,用于基于从所述测试系统接收的信号,测量所述系统的传输延迟时间;以及收听质量测量部分,用于测量所述测试系统的收听质量。
11.如权利要求10所述的装置,其中,所述转换部件包括与延迟有关的降质评价转换部分和音质评价值转换部分,用于在相同质量尺度上,分别将由所述延迟时间测量部分和所述收听质量测量部分测量的结果转换为与延迟有关的降质和收听质量下降。
12.如权利要求9所述的装置,所述多个质量下降因素是延迟、收听质量、回音和音量中的至少两个。
13.如权利要求11所述的装置,其中,所述相互作用计算部件包括用于通过使用具有所述收听质量下降和所述与延迟有关的降质的两个未知数的二次函数,进行回归分析以获得所述相互作用的量值的部件。
14.如权利要求9所述的装置,其中,所述测试系统是一IP电话通信路径。
15.如权利要求9所述的装置,还包括:会话话音特征测量部分,用于基于经由所述测试系统发送和接收的会话话音信号,测量会话话音特征;数据库,用于预先存储相应于会话话音特征的预定的多个与延迟有关的降质评价值转换方程式;以及计算方程式确定部分,用于选择相应于所述测量的会话话音特征的所述数据中,所述多个与延迟有关的降质评价转换方程式中的一个,并且其中,所述质量测量部件包括延迟测量部分,用于测量一延迟量作为所述质量下降因素之一,以及所述转换部件通过所述选择的与延迟有关的降质评价转换方程式,计算所述测量的与延迟有关的降质作为所述心理降质之一。
16.如权利要求15所述的装置,其中,所述数据库具有多个相应于所述会话话音特征的预定的相互作用量值计算方程式,以及所述计算方程式确定部分选择相应于所述测量的会话话音特征的所述多个相互作用量值计算方程式中的一个,并在所述相互作用计算部件中设置所述已选择的计算方程式。
17.如权利要求9所述的装置,还包括:会话话音特征测量部分,用于基于经由所述测试系统发送和接收的会话话音信号,测量一会话话音特征;数据库,用于存储相应于会话话音特征的预定的多个相互作用计算方程式;以及计算方程式确定部分,用于在存储于所述数据库中的所述相互作用计算方程式中,选择相应于所述测量的会话话音特征的一个,并用于在所述相互作用计算部件中设置所述已选择的计算方程式。
18.一种将由计算机执行的程序,具有权利要求1到8中的任何一个所述的方法。
19.一种计算机可读记录介质,在其上记录有用于实现权利要求1到8中的任何一个方法的程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002373930 | 2002-12-25 | ||
JP373930/2002 | 2002-12-25 | ||
JP373930/02 | 2002-12-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1523856A true CN1523856A (zh) | 2004-08-25 |
CN100463465C CN100463465C (zh) | 2009-02-18 |
Family
ID=32463531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB200310114765XA Expired - Fee Related CN100463465C (zh) | 2002-12-25 | 2003-12-25 | 总话音质量估算方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7499856B2 (zh) |
EP (1) | EP1434197B1 (zh) |
CN (1) | CN100463465C (zh) |
DE (1) | DE60311754T2 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006050655A1 (fr) * | 2004-11-10 | 2006-05-18 | Huawei Technologies Co., Ltd. | Procede d'essai de la qualite vocale et appareil d'essai d'un telephone ip |
CN100353796C (zh) * | 2004-08-27 | 2007-12-05 | 华为技术有限公司 | 语音质量的测试系统及方法 |
CN100364354C (zh) * | 2005-01-05 | 2008-01-23 | 华为技术有限公司 | 一种网络延时测试方法 |
CN101459934B (zh) * | 2007-12-14 | 2010-12-08 | 上海华为技术有限公司 | 语音质量损耗估算方法及相关装置 |
CN103077727A (zh) * | 2013-01-04 | 2013-05-01 | 华为技术有限公司 | 一种用于语音质量监测和提示的方法和装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7308517B1 (en) * | 2003-12-29 | 2007-12-11 | Apple Inc. | Gap count analysis for a high speed serialized bus |
US8005675B2 (en) * | 2005-03-17 | 2011-08-23 | Nice Systems, Ltd. | Apparatus and method for audio analysis |
US8054946B1 (en) * | 2005-12-12 | 2011-11-08 | Spirent Communications, Inc. | Method and system for one-way delay measurement in communication network |
EP2194525A1 (en) * | 2008-12-05 | 2010-06-09 | Alcatel, Lucent | Conversational subjective quality test tool |
US8296131B2 (en) * | 2008-12-30 | 2012-10-23 | Audiocodes Ltd. | Method and apparatus of providing a quality measure for an output voice signal generated to reproduce an input voice signal |
WO2011010962A1 (en) * | 2009-07-24 | 2011-01-27 | Telefonaktiebolaget L M Ericsson (Publ) | Method, computer, computer program and computer program product for speech quality estimation |
US8983845B1 (en) | 2010-03-26 | 2015-03-17 | Google Inc. | Third-party audio subsystem enhancement |
DE102010044727B4 (de) * | 2010-09-08 | 2014-05-15 | Fachhochschule Flensburg | EIP-Modell für den VoIP-Dienst |
US11343301B2 (en) | 2017-11-30 | 2022-05-24 | Goto Group, Inc. | Managing jitter buffer length for improved audio quality |
US10504536B2 (en) * | 2017-11-30 | 2019-12-10 | Logmein, Inc. | Audio quality in real-time communications over a network |
CN110530653B (zh) * | 2019-08-29 | 2021-04-06 | 重庆长安汽车股份有限公司 | 一种汽车声品质的主观评价方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06195039A (ja) | 1992-12-24 | 1994-07-15 | Nippon Mechatronics:Kk | 表示装置 |
JP2953238B2 (ja) | 1993-02-09 | 1999-09-27 | 日本電気株式会社 | 音質主観評価予測方式 |
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US6370120B1 (en) * | 1998-12-24 | 2002-04-09 | Mci Worldcom, Inc. | Method and system for evaluating the quality of packet-switched voice signals |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP3579334B2 (ja) | 2000-08-17 | 2004-10-20 | 日本電信電話株式会社 | 主観品質推定方法、主観品質推定装置、揺らぎ吸収許容時間推定方法、および揺らぎ吸収許容時間推定装置 |
EP1187100A1 (en) | 2000-09-06 | 2002-03-13 | Koninklijke KPN N.V. | A method and a device for objective speech quality assessment without reference signal |
US7076316B2 (en) * | 2001-02-02 | 2006-07-11 | Nortel Networks Limited | Method and apparatus for controlling an operative setting of a communications link |
JP2004535710A (ja) | 2001-05-30 | 2004-11-25 | ワールドコム・インコーポレイテッド | 知覚された音声サービスの質に対する劣化の新しいタイプの影響の決定 |
US6965597B1 (en) * | 2001-10-05 | 2005-11-15 | Verizon Laboratories Inc. | Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters |
CN1123864C (zh) * | 2001-11-02 | 2003-10-08 | 北京阜国数字技术有限公司 | 音频数据小波包编码器中子带滤波延迟估计和修正的方法 |
-
2003
- 2003-12-22 US US10/740,642 patent/US7499856B2/en not_active Expired - Fee Related
- 2003-12-23 EP EP03029657A patent/EP1434197B1/en not_active Expired - Lifetime
- 2003-12-23 DE DE60311754T patent/DE60311754T2/de not_active Expired - Lifetime
- 2003-12-25 CN CNB200310114765XA patent/CN100463465C/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100353796C (zh) * | 2004-08-27 | 2007-12-05 | 华为技术有限公司 | 语音质量的测试系统及方法 |
WO2006050655A1 (fr) * | 2004-11-10 | 2006-05-18 | Huawei Technologies Co., Ltd. | Procede d'essai de la qualite vocale et appareil d'essai d'un telephone ip |
CN100364354C (zh) * | 2005-01-05 | 2008-01-23 | 华为技术有限公司 | 一种网络延时测试方法 |
CN101459934B (zh) * | 2007-12-14 | 2010-12-08 | 上海华为技术有限公司 | 语音质量损耗估算方法及相关装置 |
CN103077727A (zh) * | 2013-01-04 | 2013-05-01 | 华为技术有限公司 | 一种用于语音质量监测和提示的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
DE60311754D1 (de) | 2007-03-29 |
US7499856B2 (en) | 2009-03-03 |
EP1434197A1 (en) | 2004-06-30 |
EP1434197B1 (en) | 2007-02-14 |
US20040186731A1 (en) | 2004-09-23 |
DE60311754T2 (de) | 2007-11-22 |
CN100463465C (zh) | 2009-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1523856A (zh) | 总话音质量估算方法和装置、实现该方法的程序和记录介质 | |
Takahashi et al. | Perceptual QoS assessment technologies for VoIP | |
EP4020469B1 (en) | Call audio mixing processing method and storage medium | |
US8284922B2 (en) | Methods and systems for changing a communication quality of a communication session based on a meaning of speech data | |
JP2009050013A (ja) | エコー検出および監視 | |
CN1111973C (zh) | 改进了的数字蜂窝应用的回波消除器 | |
US8184537B1 (en) | Method and apparatus for quantifying, predicting and monitoring the conversational quality | |
CN1409930A (zh) | Ip网上话音传输中双音多频信号的早期检测方法和装置 | |
CN1084977C (zh) | 回波消除器及其所使用的学习方法 | |
CN1596528A (zh) | 比特率控制方法及装置 | |
Takahashi et al. | Objective assessment methodology for estimating conversational quality in VoIP | |
CN1266671C (zh) | 估算声音编码器的谐波的装置和方法 | |
Mittag et al. | Quantifying quality degradation of the EVS super-wideband speech codec | |
JP2007013674A (ja) | 総合通話品質評価装置および総合通話品質評価方法 | |
CN1592236A (zh) | 一种测试语音质量的方法及装置 | |
JP3809164B2 (ja) | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 | |
US20120163214A1 (en) | APPARATUS AND METHOD FOR MEASURING VOICE QUALITY OF VoIP TERMINAL USING WIDEBAND VOICE CODEC | |
Jiang et al. | Speech recognition performance as an effective perceived quality predictor | |
Hoene | Internet telephony over wireless links | |
Uemura et al. | QoS/QoE measurement system implemented on cellular phone for NGN | |
KR101199448B1 (ko) | 확장된 E-모델을 이용한 VoIP 기반 음성품질 예측 장치, 방법 및 기록매체 | |
JP5952252B2 (ja) | 通話品質推定方法、通話品質推定装置、及びプログラム | |
Sun et al. | New methods for voice quality evaluation for IP networks | |
JP3970746B2 (ja) | エコーキャンセラ性能評価試験装置 | |
Voran et al. | When should a speech coding quality increase be allowed within a talk-spurt? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090218 Termination date: 20151225 |
|
EXPY | Termination of patent right or utility model |