CN1617222A - 客观语音质量评估中反映时间/语言失真的方法 - Google Patents
客观语音质量评估中反映时间/语言失真的方法 Download PDFInfo
- Publication number
- CN1617222A CN1617222A CN200410061685.7A CN200410061685A CN1617222A CN 1617222 A CN1617222 A CN 1617222A CN 200410061685 A CN200410061685 A CN 200410061685A CN 1617222 A CN1617222 A CN 1617222A
- Authority
- CN
- China
- Prior art keywords
- quality assessment
- speech
- frame
- distortion
- objective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001303 quality assessment method Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000000694 effects Effects 0.000 claims abstract description 65
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 11
- 238000013441 quality evaluation Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical class [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 210000003477 cochlea Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑了在客观语音质量评估中语言的影响。
Description
技术领域
本发明通常涉及通信系统,尤其涉及语音质量评估。
背景技术
无线通信系统的性能从语音质量方面来说是可以度量的。在现有技术中,语音质量评估的技术有两种。第一种是主观技术(以下指“主观语音质量评估”)。在主观语音质量评估中,典型的方法是利用听众对经过处理的语音进行质量评估,该语音是经接收器端处理的传输语音信号。该评估技术之所以是主观的,是因为它是建立在个人感知基础上的,而且由本地听众对语音质量的评价通常考虑到语言的影响,本地听众的母语就是提供的或倾听的语料的语言。研究表明主观听音测试的得分受到听众语言知识的影响。当语音中缺少语言信息即静音时,在主观听音测试中本地听众的打分低于非本地听众。在正常的电话交谈中,受话人通常是本地听众。这样,为了仿真典型的条件,在主观语音质量评估中使用本地听众更好一些。主观语音质量评估技术提供了语音质量的良好评价,但可能比较昂贵和费时。
第二种技术是一种客观技术(以下指“客观语音质量评估”)。客观语音质量评估不是基于个人的感知。一些客观语音质量评估技术基于已知的源语音或从处理过的语音中估计重建的源语音。另一些客观语音质量评估技术则不是基于源语音而是仅仅基于处理过的语音。后一种技术在这里是指“单端客观语音质量评估技术”,通常应用于难以获得源语音或重建的源语音的场合。
但是与主观语音质量评估技术相比,当前的单端客观语音质量评估技术不能提供同样良好的评价。当前的单端客观语音质量评估技术不如主观语音质量评估技术好的一个原因是前者没有考虑语言的影响。当前的单端客观语音质量评估技术在其语音评估过程中无法考虑语言的影响。
因此,需要一种单端客观语音质量评估技术,能够在语音质量评估过程中考虑到语言的影响。
发明内容
本发明是一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑在客观语音质量评估中语言的影响。在本发明的一种实施方式中,该客观语音质量评估技术包含以下几个步骤:用包络信息检测语音活动区间中的失真;以及修改与该语音活动关联的客观语音质量评估值,以反映这些失真对主观语音质量评估的影响。在本发明的一种实施方式中,该客观语音质量评估技术还区分出失真的类型,如短脉冲串、突然停顿和突然开始等,然后修改客观语音质量评估值,以反映每种失真对主观语音质量评估的不同影响。
附图说明
通过下面的描述、所附权利要求以及附图,本发明的特征、方式以及优越性都可以得到更好的理解,在附图中:
图1描述了根据本发明的一个实施例的一种考虑到语言影响的客观语音质量评估技术的流程图;
图2描述了根据本发明的一个实施例的一个语音活动检测器的操作流程图,该检测器通过检查与语音信号关联的包络信息检测语音活动;
图3是一个语音活动检测器活动的实例图解,该图分别示出了语音和非语音活动的间隔T和G;
图4描述了一个实施例的流程图,该实施例确定语音活动是否是一个短脉冲串或脉冲噪声,而且当确定是短脉冲串或脉冲噪声时,修正语音帧的客观质量评估νs(m);
图5描述了一个实施例的流程图,该实施例确定语音活动是否含有一个突然停顿或静音,而且当确定含有一个突然停顿或静音时,修正语音帧的客观质量评估νs(m);以及
图6描述了一个实施例的流程图,该实施例确定语音活动是否含有一个突然开始,而且当确定含有一个突然开始时,修正语音帧的客观质量评估νs(m)。
具体实施方式
本发明是一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑了在客观语音质量评估中语言的影响。
图1描述了流程图100,说明按照本发明的一个实施例的考虑语言影响的客观语音质量评估技术。在步骤102中,处理语音信号s(n),以确定语音帧的客观质量评估νs(m),即语音在帧m的客观质量。在一个实施例中,每一帧m对应时间间隔64ms。处理语音信号S(n)以获得语音帧的客观质量评估νs(m)(不考虑语言的影响)的方法在本技术领域是众所周知的。在下述共同待审申请中描述了这种处理方法的一个实例:该申请的序列号是10/186,862,题目是“Compensation OfUtterance-Dependent Articulation For Speech Quality Assessment”,申请日为2002年7月1日,申请人是Doh-Suk Kim。
在步骤105中,分析语音信号S(n)的语音活动,例如用语音活动检测器(VAD)。语音活动检测器在本技术领域是众所周知的。图2描述了一个语音活动检测器的操作流程图200,该检测器通过检查与语音信号关联的包络信息检测语音活动。在步骤205中,将所有耳蜗通道k的包络信号γk(n)累加起来得到总的包络信号γ(n),见公式(1)所示:
其中,
n代表时间标号,Ncb代表临界带的总数,sk(n)代表语音信号s(n)通过第k个耳蜗通道的输出,也就是说,sk(n)=s(n)*hk(n),
是sk(n)的希尔伯特变换。
在步骤210中,按照公式(2)将总包络信号γ(n)和4ms的汉明窗w(n)相乘,每2ms计算一个帧包络e(l),
其中,γ(l)(n)是总包络信号γ(n)第l个2ms帧信号。应该知道这里帧包络e(l)和汉明窗w(n)的持续时间仅仅用来举个例子,其他的持续时间是可能的。在步骤215中,按照公式(3)对帧包络e(l)进行向下取整(flooring)运算:
在步骤220中按照公式(4)得到向下取整的帧包络e(i)的时间导数△e(l):
其中-3≤j≤3。
在步骤225中,按照公式(5)进行语音活动检测。
在步骤230中,公式(5)的结果即vad(l)可基于输出中0和1的持续时间进行改进。例如,如果在vad(l)中0的持续时间少于8ms,则vad(l)在该段时间内应改为1。与此类似,如果在vad(l)中1的持续时间少于8ms,则vad(l)在该段时间内应改为0。图3描述了一个语音活动检测器活动的实例图解,该图分别示出了语音和非语音活动的间隔T和G。应该知道间隔T相关的语音活动可以包含,比如说,真实语音、数据或噪音。
回到图1的流程图100,在对语音信号s(n)的语音活动分析后,在步骤110中检查间隔T以确定相关的语音活动是否对应于短脉冲串或脉冲噪声。如果确定间隔T中的语音活动是短脉冲串或脉冲噪声,则在步骤115中修正语音帧的客观质量评估νs(m),得到修正的语音帧客观质量评估χs(m)。修正的语音帧客观质量评估χs(m)通过模拟或仿真短脉冲串或脉冲噪声对主观语音质量评估的影响,考虑了短脉冲串或脉冲噪声的影响。
从步骤115或者如果在步骤110中确定间隔T中的语音活动不是短脉冲串或脉冲噪声,流程图100进到步骤120,该步骤检查以确定间隔T中的语音活动是否包含突然停顿或静音。如果确定间隔T中的语音活动包含突然停顿或静音,则在步骤125中修正语音帧的客观质量评估νs(m),得到修正的语音帧客观质量评估χs(m)。修正的语音帧客观质量评估χs(m)通过模拟或仿真突然停顿或静音及随后的释放对主观语音质量评估的影响,考虑了突然停顿或静音的影响。
从步骤125或者如果在步骤120中确定间隔T中的语音活动不包含突然停顿或静音,流程图100进到步骤130,该步骤检查以确定间隔T中的语音活动是否包含突然开始。如果确定间隔T中的语音活动包含突然开始,则在步骤135中修正语音帧的客观质量评估νs(m),得到修正的语音帧客观质量评估χs(m)。修正的语音帧客观质量评估χs(m)通过模拟或仿真突然开始对主观语音质量评估的影响,考虑了突然开始的影响。
从步骤135或者如果在步骤130中确定间隔T中的语音活动不包含突然开始,流程图100进到步骤140,在该步骤中,如果对语音帧客观质量评估νs(m)进行了修正,则将修正的结果和步骤102中原始的语音帧客观质量评估νs(m)进行合并。
下面将描述根据本发明一个实施例的确定语音活动是否为短脉冲串或脉冲噪声、是否包含突然停顿(或静音)或者突然开始的技术,也就是步骤110、120和130,以及修正语音帧客观质量评估νs(m)的技术,也就是步骤115、125和135。图4描述了流程图400,其中按照一个实施例确定语音活动是否是一个短脉冲串或脉冲噪声,而且当确定是短脉冲串或脉冲噪声时,修正语音帧的客观质量评估νs(m)。在步骤405中,通过在间隔Ti中寻找帧包络e(l)是最大值的帧l来确定脉冲噪声帧lI,例如见公式(6):
其中,ui和di分别表示在间隔Ti中位于开始和末端的帧l的序号。在步骤410中,将帧包络e(lI)与听者的听阈值相比较,该听阈值指示一个听者是否会将相应的帧lI听为令人烦躁的短脉冲串。在一个实施例中,听者的听阈值是8,也就是说,在步骤410,检查以确定e(lI)是否大于8。如果帧包络e(lI)没有超过听者的听阈值,则在步骤415中确定语音活动不是短脉冲串或脉冲噪声。
如果帧包络e(lI)超过听者的听阈值,则在步骤420中检查以确定间隔Ti的持续时间是否既满足一短脉冲串阈值又满足一感知阈值。也就是说,检查以确定间隔Ti是否太短以致于不能被人听见,以及是否太长以致于不能分类为短脉冲串。在一个实施例中,如果间隔Ti的持续时间大于等于28ms且小于等于60ms,即28≤Ti≤60,则步骤420的两个阈值都得到了满足。否则就不满足。如果步骤420的阈值没有得到满足,那么在步骤425中确定语音活动不是短脉冲串或脉冲噪声。
如果步骤420的两个阈值都得到了满足,则在步骤430中,从间隔Ti的开始处前面的一帧或几帧到间隔Ti的第一帧或前几个帧中的包络e(l)确定差分帧包络Δe(l)的最大值,然后与一个突变阈值如0.25比较。突变阈值表征了一个识别帧包络中突变的标准。在一个实施例中,从帧包络e(ui-1)即间隔Ti之前一帧的帧包络到帧包络e(ui+5)即间隔Ti中的第5个帧包络,确定差分帧包络Δe(l)的最大值,然后与一个突变阈值0.25相比较,也就是在步骤430中检查以确定是否满足公式(7):
如果差分帧包络Δe(l)的最大值没有超过阈值,那么在步骤435中确定语音活动不是短脉冲串或脉冲噪声。
如果差分帧包络Δe(l)的最大值超过阈值,那么在步骤440中确定帧mI是否足够引起听者烦恼,其中mI对应于帧m,该帧受到脉冲噪声帧lI的影响最大。在一个实施例中,通过判断语音帧的客观质量评估νs(mI)与调制噪声参考单位νq(mI)的比值是否超过一噪声阈值,完成步骤440的处理过程。例如,采用噪声阈值1.1,步骤440可以表示为公式(8):
在这里如果满足公式(8),就可以确定帧mI足够引起听者的烦恼。如果确定语音帧的客观质量评估νs(mI)足够引起听者的烦恼,那么在步骤445中确定语音活动不是短脉冲串或脉冲噪声。
如果确定语音帧的客观质量评估νs(mI)不足以引起听者的烦恼,那么在步骤450中检查与间隔Gi-1,i,Gi,i+1,Ti-1和/或Ti+1的持续时间相关的条件是否满足某种最大或最小持续时间的阈值,以验证其是否属于人的语音。在一个实施例中,步骤450中的条件表示为公式(9)和(10)。
Gi-1,i<180ms,Gi,i+1>40ms和Ti-1>50ms 公式(9)
Gi-1,i>40ms,Gi,i+1<100ms和Ti+1>60ms 公式(10)如果这些公式或条件中任一个得到了满足,那么在步骤455中确定语音活动不是短脉冲串或脉冲噪声。而确定该语音活动为自然语音。应该理解,在公式(9)和(10)中使用的最大和最小持续时间的阈值仅仅是用来举例说明,是可以取其它值的。
如果在步骤450中没有条件得到满足,那么在步骤460中将语音帧的客观质量评估νs(m)按公式(11)进行修正:
图5描述了一个实施例的流程图500,该实施例确定语音活动是否含有一个突然停顿或静音,以及当确定含有突然停顿或静音时,修正语音帧的客观质量评估νs(m)。在步骤505确定突然停顿帧lM。确定突然停顿帧lM时,首先利用间隔Ti中的所有帧l寻找语音活动中差分帧包络Δe(l)的负峰值。如果当-3≤j≤3时满足Δe(l)<Δe(l+j),则说明差分帧包络Δe(l)拥有一个负峰值。找到负峰值以后,将差分帧包络Δe(l)的负峰值的最小值所在帧确定为突然停顿帧lM。在步骤510中检查以确定差分帧包络Δe(lM)是否满足突然停顿阈值。突然停顿阈值代表一个标准,该标准确定从帧l到帧l+1的帧包络中是否含有足够的负变化以被认为是突然停顿。在一个实施例中,突然停顿阈值是-0.56,步骤510可以用公式(12)来表示:
Δe(lM)<-0.56 公式(12)如果差分帧包络Δe(lM)不满足突然停顿阈值,那么在步骤515确定语音活动没有突然停顿或静音。
如果差分帧包络Δe(lM)满足突然停顿阈值,那么在步骤520中检查以确定间隔Ti的语音活动是否具有足够的持续时间,例如长于一个短脉冲串。在一个实施例中,检查以确定间隔Ti的持续时间是否超过持续时间阈值,例如60ms。也就是说,如果Ti<60ms,则间隔Ti关联的语音活动没有足够的持续时间。如果认为语音活动没有足够的持续时间,那么在步骤525确定语音活动没有突然停顿或静音。
如果认为语音活动具有足够的持续时间,那么在步骤530中,对帧lM前一帧或几帧到帧lM或更往后确定帧包络e(l)的最大值,然后与停顿能量阈值相比较。停顿能量阈值表示确定帧包络在静音之前是否具有足够能量的一个标准。在一个实施例中,对帧lM-7到帧lM确定帧包络e(l)的最大值,然后与停顿能量阈值9.5相比较,即
如果最大帧包络e(l)不满足停顿能量阈值,那么步骤535确定语音活动没有突然停顿或静音。
如果最大帧包络e(l)满足停顿能量阈值,那么在步骤540按照公式(13)对若干语音帧如mM,...,mM+6的客观质量评估νs(m)进行修正:
其中mM对应于受突然停顿帧lM影响最大的帧m。
图6描述了一个实施例的流程图600,该实施例确定语音活动是否含有一个突然开始,以及当确定含有一个突然开始时,修正语音帧的客观质量评估νs(m)。在步骤605确定突然开始帧lS。确定突然开始帧lS时,首先利用间隔Ti中的所有帧l寻找语音活动中差分帧包络Δe(l)的正峰值。如果当-3≤j≤3时满足Δe(l)>Δe(l+j),则说明差分帧包络Δe(l)拥有一个正峰值。找到正峰值以后,将差分帧包络Δe(l)的正峰值的最大值所在帧确定为突然开始帧lS。在步骤610中检查以确定差分帧包络Δe(lS)是否满足突然开始阈值。突然开始阈值代表一个标准,该标准确定从帧l到帧l+1的帧包络中是否含有足够的正变化以被认为是突然开始。在一个实施例中,突然开始阈值是0.9,步骤610可以用公式(14)来表示:
Δe(lS)>0.9 公式(14)
如果差分帧包络Δe(lS)不满足突然开始阈值,那么在步骤615确定语音活动没有突然开始。
如果差分帧包络Δe(lS)满足突然开始阈值,那么在步骤620中检查以确定间隔Ti的语音活动是否具有足够的持续时间,例如长于一个短脉冲串。在一个实施例中,检查以确定间隔Ti的持续时间是否超过持续时间阈值,例如60ms。也就是说,如果Ti<60ms,则间隔Ti关联的语音活动没有足够的持续时间。如果语音活动没有足够的持续时间,那么在步骤625确定语音活动没有突然开始。
如果语音活动具有足够的持续时间,那么在步骤630中,对帧lS或更往前到帧lS后面一帧或几帧确定帧包络e(l)的最大值,然后与开始能量阈值相比较。开始能量阈值表示确定帧包络是否具有足够能量的一个标准。在一个实施例中,对帧lS到帧lS+7确定帧包络e(l)的最大值,然后与开始能量阈值12相比较,即
如果最大帧包络e(l)不满足开始能量阈值,那么在步骤635确定语音活动不含有突然开始。
如果最大帧包络e(l)满足开始能量阈值,那么在步骤640按照公式(16)对若干语音帧如mM,...,mM+6的客观质量评估vs(m)进行修正:
其中mS对应于受突然开始帧lS影响最大的帧m。应当理解,公式(11)、(13)和(16)中使用的值都是通过经验推导出来的,取其它值也是可能的。因此,本发明不局限于这些特定的值。
注意在确定了修正的语音帧客观质量评估χs(m)之后,在步骤140可按照公式(17)进行合并处理:
νs(m)=min(νs,I(m),νs,M(m),νs,S(m)) 公式(17)
其中νs,I(m),νs,M(m),νs,S(m)分别对应于公式(11)、(13)和(16)中修正的语音帧客观质量评估χs(m)。
虽然本发明的一定实施例的描述已经相当地详尽,但是其它的方式也是可能的。例如,流程图中步骤次序可以重新安排,其中一些步骤(或标准)可以从流程图中删除或向其中增加。因此,本发明的实质和范围不应局限于这里的实施例的描述。还应当理解,对于那些熟练的技术人员来说,本发明既可以用硬件实现,也可以在某些类型的处理器上用软件实现。
Claims (10)
1.一种客观评估语音质量的方法,包括以下步骤:
使用包络信息检测语音活动区间中的失真;以及
修正与该语音活动相联系的客观语音质量评估值,以反映所述失真对主观语音质量评估的影响。
2.根据权利要求1的方法,其中修正的步骤包括确定对语音活动的客观语音质量评估值的步骤。
3.根据权利要求1的方法,其中所检测的失真是脉冲噪声、突然停顿或突然开始。
4.根据权利要求1的方法,其中检测的步骤包括检测失真类型的步骤。
5.根据权利要求4的方法,其中,如果包络信息指示出语音活动能够由听者感知为噪声,而且如果所述区间的持续时间足够长,能够让听者感知到,但又没有长到成为一个短脉冲串,那么失真的类型可以确定为脉冲噪声。
6.根据权利要求4的方法,其中,如果包络信息指示出从一帧到另一帧帧能量中有足够大的负变化,以致于可以认为是一个突然停顿,而且如果所述区间的持续时间长于短脉冲串,那么失真的类型可以确定为突然停顿。
7.根据权利要求4的方法,其中,如果包络信息指示出从一帧到另一帧帧能量中有足够大的正变化,以致于可以认为是一个突然开始,而且如果所述区间的持续时间长于短脉冲串,那么失真的类型可以确定为突然开始。
8.一种客观语音质量评估系统,包括:
用于使用包络信息检测语音活动区间中的失真的装置;以及
用于修正与该语音活动相联系的客观语音质量评估值以反映所述失真对主观语音质量评估的影响的装置。
9.根据权利要求8的客观语音质量评估系统,其中用于修正的装置包括在不考虑失真的情况下确定对语音活动的客观语音质量评估值的装置。
10.根据权利要求8的客观语音质量评估系统,其中用于检测的装置包括用于确定失真类型的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/603,212 | 2003-06-25 | ||
US10/603,212 US7305341B2 (en) | 2003-06-25 | 2003-06-25 | Method of reflecting time/language distortion in objective speech quality assessment |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1617222A true CN1617222A (zh) | 2005-05-18 |
CN100573662C CN100573662C (zh) | 2009-12-23 |
Family
ID=33418650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100616857A Expired - Fee Related CN100573662C (zh) | 2003-06-25 | 2004-06-24 | 客观语音质量评估中反映时间和语言失真的方法和系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7305341B2 (zh) |
EP (1) | EP1492085A3 (zh) |
JP (1) | JP4989021B2 (zh) |
KR (1) | KR101099325B1 (zh) |
CN (1) | CN100573662C (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014048127A1 (zh) * | 2012-09-29 | 2014-04-03 | 华为技术有限公司 | 语音质量监控的方法和装置 |
CN105378839A (zh) * | 2013-06-26 | 2016-03-02 | 高通股份有限公司 | 用于测量话语信号质量的系统和方法 |
CN105721217A (zh) * | 2016-03-01 | 2016-06-29 | 中山大学 | 基于Web的音频通信质量改进方法 |
CN108010539A (zh) * | 2017-12-05 | 2018-05-08 | 广州势必可赢网络科技有限公司 | 一种基于语音激活检测的语音质量评估方法及装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7165025B2 (en) * | 2002-07-01 | 2007-01-16 | Lucent Technologies Inc. | Auditory-articulatory analysis for speech quality assessment |
US7308403B2 (en) * | 2002-07-01 | 2007-12-11 | Lucent Technologies Inc. | Compensation for utterance dependent articulation for speech quality assessment |
US7305341B2 (en) * | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
EP1665792A4 (en) * | 2003-08-26 | 2007-11-28 | Clearplay Inc | METHOD AND DEVICE FOR CONTROLLING THE PLAYING OF AN AUDIOSIGNAL |
US7386451B2 (en) * | 2003-09-11 | 2008-06-10 | Microsoft Corporation | Optimization of an objective measure for estimating mean opinion score of synthesized speech |
US7856355B2 (en) * | 2005-07-05 | 2010-12-21 | Alcatel-Lucent Usa Inc. | Speech quality assessment method and system |
JP2007049462A (ja) * | 2005-08-10 | 2007-02-22 | Ntt Docomo Inc | 音声品質評価装置、音声品質評価プログラム及び音声品質評価方法 |
KR100729555B1 (ko) * | 2005-10-31 | 2007-06-19 | 연세대학교 산학협력단 | 음성 품질의 객관적인 평가방법 |
JP2007233264A (ja) * | 2006-03-03 | 2007-09-13 | Nippon Telegr & Teleph Corp <Ntt> | 音声品質客観評価装置および音声品質客観評価方法 |
EP2148327A1 (en) * | 2008-07-23 | 2010-01-27 | Telefonaktiebolaget L M Ericsson (publ) | A method and a device and a system for determining the location of distortion in an audio signal |
US8655651B2 (en) * | 2009-07-24 | 2014-02-18 | Telefonaktiebolaget L M Ericsson (Publ) | Method, computer, computer program and computer program product for speech quality estimation |
FR2973923A1 (fr) * | 2011-04-11 | 2012-10-12 | France Telecom | Evaluation de la qualite vocale d'un signal de parole code |
US9349386B2 (en) * | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
DE102013005844B3 (de) * | 2013-03-28 | 2014-08-28 | Technische Universität Braunschweig | Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals |
CN112017694B (zh) * | 2020-08-25 | 2021-08-20 | 天津洪恩完美未来教育科技有限公司 | 语音数据的评测方法和装置、存储介质和电子装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3971034A (en) * | 1971-02-09 | 1976-07-20 | Dektor Counterintelligence And Security, Inc. | Physiological response analysis method and apparatus |
CA2104393A1 (en) * | 1991-02-22 | 1992-09-03 | Jorge M. Parra | Acoustic method and apparatus for identifying human sonic sources |
JPH04345327A (ja) * | 1991-05-23 | 1992-12-01 | Nippon Telegr & Teleph Corp <Ntt> | 通話品質客観測定方法 |
JPH05313695A (ja) * | 1992-05-07 | 1993-11-26 | Sony Corp | 音声分析装置 |
JP2953238B2 (ja) * | 1993-02-09 | 1999-09-27 | 日本電気株式会社 | 音質主観評価予測方式 |
JPH0784596A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | 符号化音声の品質評価方法 |
US5454375A (en) * | 1993-10-21 | 1995-10-03 | Glottal Enterprises | Pneumotachograph mask or mouthpiece coupling element for airflow measurement during speech or singing |
US5794188A (en) * | 1993-11-25 | 1998-08-11 | British Telecommunications Public Limited Company | Speech signal distortion measurement which varies as a function of the distribution of measured distortion over time and frequency |
WO1996006496A1 (en) * | 1994-08-18 | 1996-02-29 | British Telecommunications Public Limited Company | Analysis of audio quality |
JPH08101700A (ja) * | 1994-09-30 | 1996-04-16 | Toshiba Corp | ベクトル量子化装置 |
US5715372A (en) * | 1995-01-10 | 1998-02-03 | Lucent Technologies Inc. | Method and apparatus for characterizing an input signal |
WO1997005730A1 (en) * | 1995-07-27 | 1997-02-13 | British Telecommunications Public Limited Company | Assessment of signal quality |
GB9604315D0 (en) * | 1996-02-29 | 1996-05-01 | British Telecomm | Training process |
US6119083A (en) * | 1996-02-29 | 2000-09-12 | British Telecommunications Public Limited Company | Training process for the classification of a perceptual signal |
US6052662A (en) * | 1997-01-30 | 2000-04-18 | Regents Of The University Of California | Speech processing using maximum likelihood continuity mapping |
JPH113097A (ja) * | 1997-06-13 | 1999-01-06 | Nippon Telegr & Teleph Corp <Ntt> | 符号化音声信号品質評価方法及びこれに用いるデータベース |
DE19840548C2 (de) | 1998-08-27 | 2001-02-15 | Deutsche Telekom Ag | Verfahren zur instrumentellen Sprachqualitätsbestimmung |
JP2000250568A (ja) * | 1999-02-26 | 2000-09-14 | Kobe Steel Ltd | 音声区間検出装置 |
US6246978B1 (en) * | 1999-05-18 | 2001-06-12 | Mci Worldcom, Inc. | Method and system for measurement of speech distortion from samples of telephonic voice signals |
US6609092B1 (en) * | 1999-12-16 | 2003-08-19 | Lucent Technologies Inc. | Method and apparatus for estimating subjective audio signal quality from objective distortion measures |
JP4080153B2 (ja) * | 2000-10-31 | 2008-04-23 | 京セラコミュニケーションシステム株式会社 | 音声品質評価方法及び評価装置 |
FR2817096B1 (fr) | 2000-11-23 | 2003-02-28 | France Telecom | Procede et systeme de detection non intrusive des defauts d'un signal de parole transmis en telephonie sur reseau de transmission par paquets |
JP3868278B2 (ja) * | 2001-11-30 | 2007-01-17 | 沖電気工業株式会社 | 音声信号品質評価装置及びその方法 |
US7308403B2 (en) * | 2002-07-01 | 2007-12-11 | Lucent Technologies Inc. | Compensation for utterance dependent articulation for speech quality assessment |
US7165025B2 (en) * | 2002-07-01 | 2007-01-16 | Lucent Technologies Inc. | Auditory-articulatory analysis for speech quality assessment |
US7305341B2 (en) * | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
-
2003
- 2003-06-25 US US10/603,212 patent/US7305341B2/en not_active Expired - Fee Related
-
2004
- 2004-06-14 EP EP04253532A patent/EP1492085A3/en not_active Withdrawn
- 2004-06-24 KR KR1020040047555A patent/KR101099325B1/ko not_active IP Right Cessation
- 2004-06-24 CN CNB2004100616857A patent/CN100573662C/zh not_active Expired - Fee Related
- 2004-06-25 JP JP2004187432A patent/JP4989021B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014048127A1 (zh) * | 2012-09-29 | 2014-04-03 | 华为技术有限公司 | 语音质量监控的方法和装置 |
CN103716470A (zh) * | 2012-09-29 | 2014-04-09 | 华为技术有限公司 | 语音质量监控的方法和装置 |
CN103716470B (zh) * | 2012-09-29 | 2016-12-07 | 华为技术有限公司 | 语音质量监控的方法和装置 |
CN105378839A (zh) * | 2013-06-26 | 2016-03-02 | 高通股份有限公司 | 用于测量话语信号质量的系统和方法 |
CN105378839B (zh) * | 2013-06-26 | 2019-03-19 | 高通股份有限公司 | 用于测量话语信号质量的系统和方法 |
CN105721217A (zh) * | 2016-03-01 | 2016-06-29 | 中山大学 | 基于Web的音频通信质量改进方法 |
CN108010539A (zh) * | 2017-12-05 | 2018-05-08 | 广州势必可赢网络科技有限公司 | 一种基于语音激活检测的语音质量评估方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1492085A3 (en) | 2005-02-16 |
JP4989021B2 (ja) | 2012-08-01 |
JP2005018076A (ja) | 2005-01-20 |
US7305341B2 (en) | 2007-12-04 |
KR101099325B1 (ko) | 2011-12-26 |
CN100573662C (zh) | 2009-12-23 |
US20040267523A1 (en) | 2004-12-30 |
KR20050001409A (ko) | 2005-01-06 |
EP1492085A2 (en) | 2004-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1617222A (zh) | 客观语音质量评估中反映时间/语言失真的方法 | |
EP2936489B1 (en) | Audio processing apparatus and audio processing method | |
CN107910014B (zh) | 回声消除的测试方法、装置及测试设备 | |
US7680056B2 (en) | Apparatus and method for extracting a test signal section from an audio signal | |
CN1306472C (zh) | 分布式语音识别系统中用于发送语音活动的系统和方法 | |
US7729275B2 (en) | Method and apparatus for non-intrusive single-ended voice quality assessment in VoIP | |
CN1132467C (zh) | 基于无线电链路参数的移动电信网络中的语音质量测量 | |
CN110557451B (zh) | 对话交互处理方法、装置、电子设备和存储介质 | |
US8284922B2 (en) | Methods and systems for changing a communication quality of a communication session based on a meaning of speech data | |
CN1589550A (zh) | 错误隐蔽装置和方法 | |
CN1783214A (zh) | 混响估计和抑制系统 | |
CN1225736A (zh) | 语音活动检测器 | |
MX2008016354A (es) | Deteccion de una maquina contestadora utilizando reconocimiento de dialogo. | |
JP2002237785A (ja) | 人間の聴覚補償によりsidフレームを検出する方法 | |
JP2004502985A (ja) | 以後のオフライン音声認識のための音声情報を記録する記録装置 | |
CN103262158A (zh) | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 | |
CN107846520B (zh) | 单通检测方法及装置 | |
CN1592236A (zh) | 一种测试语音质量的方法及装置 | |
CN1780332A (zh) | 测试语音质量的方法及装置 | |
CN102347785A (zh) | 一种回声消除方法及装置 | |
US6917916B2 (en) | Method and apparatus for testing digital channels in a wireless communication system | |
WO2021143095A1 (zh) | 拨测方法、装置、计算机设备及存储介质 | |
EP1650746A1 (fr) | Procédé et programme d'ordinateur pour la gestion d'une activité de production sonore d'un système d'interaction personne-machine | |
US20120239386A1 (en) | Method and device for determining a decoding mode of in-band signaling | |
Pieper et al. | Mission critical voice quality of experience access time measurement methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091223 Termination date: 20150624 |
|
EXPY | Termination of patent right or utility model |