CN101268624B - 用于测量语音可懂度的方法和测试信号 - Google Patents
用于测量语音可懂度的方法和测试信号 Download PDFInfo
- Publication number
- CN101268624B CN101268624B CN200580051611.8A CN200580051611A CN101268624B CN 101268624 B CN101268624 B CN 101268624B CN 200580051611 A CN200580051611 A CN 200580051611A CN 101268624 B CN101268624 B CN 101268624B
- Authority
- CN
- China
- Prior art keywords
- speech
- intelligibility
- signal
- voice
- test signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims description 42
- 238000005259 measurement Methods 0.000 claims abstract description 46
- 238000004891 communication Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000010295 mobile communication Methods 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 14
- 230000006855 networking Effects 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000009022 nonlinear effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 14
- 230000011664 signaling Effects 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000009467 reduction Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000012074 hearing test Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/0082—Monitoring; Testing using service channels; using auxiliary channels
- H04B17/0085—Monitoring; Testing using service channels; using auxiliary channels using test signal generators
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/0082—Monitoring; Testing using service channels; using auxiliary channels
- H04B17/0087—Monitoring; Testing using service channels; using auxiliary channels using auxiliary channels or channel simulators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/391—Modelling the propagation channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
- H04B3/234—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using double talk detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Mobile Radio Communication Systems (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Telephonic Communication Services (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
本发明一般涉及处理通常为近端和远端的两端之间双向通信的移动通信网络组件中的语音可懂度的测量。基本思想是根据适合于语音可懂度测量的测试信号来模拟(S1)双向语音通信,通过使用双方通话检测器在模拟语音通信期间检测双方通话(S2),并且仅在双方通话时期才执行(S3)语音可懂度测量。这样,例如有可能在语音可懂度测量过程中将回声影响考虑进去,同时避免来自测量语音可懂度的信号通道中的非线性处理(以及可能的所添加舒适噪声)的不希望的影响。可选地,可响应估计的语音可懂度而调整(S4)话音增强装置的操作。
Description
技术领域
本发明一般涉及移动通信网络中语音可懂度的客观测量,更具体来说,涉及用于测量和/或改进这类网络中语音可懂度的新颖方法。
背景技术
语音的可懂度简称作语音可懂度,一般涉及语音理解的程度,并且是语音通信有效性的度量。讲话很快或者讲话含糊不清的人可能很难被理解。但是,如果消息不是完全听得到的,和/或如果消息在送往听者途中已经失真,则即使用听者的母语流利说出的消息也可能被听者误解。另一方面,例如,合成的话音可能是听者充分理解的,但被认为是刺耳、异常并且一般是低质量的,意味着质量欠缺的消息仍然可能是可懂的。因此,语音可懂度一般不限于语音质量,而是往往看作是对于语音理解的有效性的更一般的度量。
存在用于根据大量人类说话者和听者所执行的听力测试来主观地测量语音可懂度的标准化方法。在称作“Methodes for subjectivedetermination of transmission quality”的ITU-T标准P.800中,提出了范围从0至5的所谓平均意见评分(MOS)方法,通过听力测试来评估电信系统的语音质量。但是,这种类型测试要求具有大量仔细选择的讲话者和听者组,使得测量费用极高且费时。
另外,将语音质量结果实时反馈到所考虑的系统显然是不可能的。
因此,在定义用于客观测量语音可懂度的方法、由此消除费时和主观评估方面存在普遍兴趣。
在ITU-T G.168“Digital network echo canceller”中,附图I.6-15/G.168演示了主观语音质量与客观测量之间的某些关系,这些关系有助于说明通过客观方法来测量语音质量/语音可懂度的可能性。
IEC 60268-16“Objective rating of speech intelligibility by speechtransmission index”在音响系统设备中是标准化工作,它涉及用于相对于可懂度来确定语音传输质量的客观方法。这些方法可用于比较各个位置上以及相同收听空间的各种条件下的语音传输质量,以便评估语音通信信道,具体来说评估声音属性的变化影响、例如来自回声、回响和噪声的影响。
IEC 60268-16中提出的语音可懂度测量系统的一种实际配置通常包括声源/喇叭和麦克风。所谓语音传输指数(STI)根据在例如剧院或音乐厅之类的房间中或者通过通信信道发出声音时的一组测试信号的调制的降低来测量。对于诸如剧院之类的房间中的测量,每个测试信号通常将由声源向接收所发送声音的麦克风系统发送。更准确地说,语音传输指数(STI)是基于语音频率范围中多个倍频带的加权份额的客观测量。每个倍频带信号由一组不同的调制频率来调制,以便定义不同倍频带中不同调制的测试信号的全矩阵。定义调制的降低的所谓调制传递函数对于每个倍频带中的各调制频率单独确定,最后将所有调制频率和所有倍频带的调制传递函数值组合形成语音可懂度的总度量。
电信系统的语音传输指数STITEL是STI的简化形式,并且在单个电信信道的典型条件下可用来代替STI。
虽然STI方法的引入代表了对于语音可懂度客观测量的显著进步,但是,这些方法由于需要大量的测试信号而仍然相当费时,并且它们还专用于比较简单的设定、诸如受限制的收听空间或孤立的通信信道的测量。
在现代移动通信网络中,通常存在更复杂的技术设定,包括具有回声、回响和噪声影响的相关信号通道。例如,在公共陆地移动网络(PLMN)的数字核心网络中,一般存在所谓的话音增强装置,例如用于改进语音质量和语音可懂度的回声消除器(EC)、噪声降低(NR)、移动串扰控制(MCC)和电平控制(LC)装置。在网络侧,回声消除器(EC)是负责处理作为干扰回声反射到近端信号通道中的部分远端信号的特别重要的话音增强装置。在这类更复杂的技术设定中,需要用于客观测量语音可懂度的有效方法。测量结果则可用作优化和协调诸如数字移动核心网络之类的网络中的话音增强装置的操作的基础。
国际专利公布WO 2004/002127 A1涉及具有专用不固定回声消除属性的回声消除器。提出了不固定回声消除器,以便防止回声估计中、特别是残余回声中的固定分量不断地使近端语音失真。这在语音质量和语音可懂度方面改进了回声消除器性能,这在与双方通话相反的单方通话近端语音的情况中特别重要。
美国专利5,636,272涉及用于提高喇叭输出的可懂度以及用于电话中回声消除的方法和装置。电话包括用于处理语音输入信号以便产生可懂度增强信号的可懂度增强器。
发明内容
本发明的一般目的是提供测量移动通信网络中的语音可懂度的有效方式。
一个具体目的是提供用于测量处理诸如远端和近端的两端之间双向通信的网络组件中语音可懂度的方法和设备。
具体来说,希望提供一种客观测量具有至少一个非线性话音增强装置、如近端信号通道中回声消除器的网络组件中语音可懂度的有效方式。
本发明的另一个具体目的是减少客观测量语音可懂度所需的时间。
本发明的又一个一般目的是,响应语音可懂度的客观测量而优化移动通信网络中话音增强装置的操作,由此改进语音可懂度。
本发明的一个目的是提供用于改进移动通信网络中语音可懂度的方法和系统。
这些及其它目的由所附专利权利要求书所定义的本发明来满足。
本发明一般涉及处理通常为近端和远端的两端之间双向通信的移动通信网络组件中语音可懂度的测量。基本思想是,根据适合于语音可懂度测量的测试信号来模拟双向语音通信,在模拟语音通信期间检测双方通话,并且仅在双方通话时期才执行语音可懂度测量。这样,例如有可能在语音可懂度测量过程中考虑回声影响,同时避免来自测量语音可懂度的信号通道中可能的非线性处理的不希望的影响。
在许多应用中,近端信号通道通常包括具有语音活动控制的非线性信号处理的一个或多个话音增强装置,例如具有选择性活动非线性处理器和相关联舒适噪声发生器的回声消除器。非线性处理一般改变近端信号通道的输入输出关系,并且(与可能的舒适噪声共同)使语音可懂度的客观测量非常困难,简直可以说实际上不可能。通过使用双方通话检测并且仅在双方通话时期才测量可懂度,一般将在语音可懂度测量过程中避免来自近端信号通道中非线性处理的不希望的影响。
本发明人已经认识到,非线性信号处理(NLP)通常在近端信号高于给定阈值时是关的。同时,通常重要的是,还考虑作为例如混合回声源的远端信号,以便获得表示网络通信中实际条件的测量结果。双方通话检测使得能够确保在NLP关时进行测量(使得NLP不改变输入输出关系),并且没有添加舒适噪声,并且在测量中根据需要考虑来自远端信号通道的回声。
优选地,测量结果然后用作反馈来分析和/或控制诸如回声消除器、噪声降低、移动串扰控制和电平控制装置之类的相关话音增强装置操作和协调。例如,移动网络中的话音增强装置可能不时地需要更新或者由新装置替换,以便满足新的要求和/或标准。在这个过程中,可能有用的是,相对于语音可懂度来测试新的或者经过更新的话音增强装置的效果,并且可能在网络中实现这些装置之前调整它们的配置。
语音可懂度的度量优选地根据一般包括任何非线性操作的话音增强装置的至少一部分近端信号通道上信号特性变化的测量来估计。
语音可懂度的度量优选表示相对于可懂度的语音传输质量(又称作语音传输指数),并且根据调制的降低的测量来估计,与用于音乐厅和剧院的标准化方法相似。
本发明的另一个方面涉及新的且极有效的测试信号的使用。新的测试信号优选地包括噪声载波,其具有语音形频谱,并且通过扫频信号来调制。与在IEC 60268-16标准中提出的使用不同倍频带中不同调制的测试信号的全矩阵并且对于每个倍频带中的各调制频率单独确定调制传递函数相比,这更为有效。通过模拟测试信号中的整个相关频率范围上的正常语音,并且通过扫频来调制语音形测试信号,使测量过程变得更为有效。使用单个测试信号基本上足够了,这使测量过程变得节省时间并且可管理。本发明的这个方面一般适用于处理双向通信的移动网络组件中语音可懂度的任何测量。
本发明提供以下优点:
通过阅读以下对本发明实施例的描述,将会理解本发明提供的其它优点。
附图说明
通过以下参照附图进行的说明,将会更好地理解本发明以及其它目的和优点,附图包括:
图1是根据本发明的一个优选示范实施例用于测量/改进语音可懂度的方法的示意流程图;
图2是处理远端与近端之间通信的网络组件的相关部分的示意图,其中包括按照本发明的一个优选示范实施例用于有效地测量语音可懂度的(内部/外部)布置;
图3是说明具有连接例如无线电接入网等不同网络和公共交换电话网的核心网络的常规移动网络概观的示意图;
图4是说明常规数字移动网络的网络侧上话音增强装置的一种示范布置的示意图;
图5是根据本发明的一个示范实施例用于测量数字移动网络的网络侧上语音可懂度的一种布置的示意图;
图6A说明根据本发明的扫频信号的一个实例;
图6B说明具有语音形频谱的扫频调制噪声载波的一个实例;及
图7A-D说明来自示范模拟和语音可懂度测量过程的一组相关信号。
具体实施方式
在所有附图中,相同的参考标号将用于对应或相似的要素。
现在将参照示范移动网络应用中的示范实施例来描述本发明,但是应当理解,本发明不限于这些实例。
如前面所述,本发明一般涉及处理通常为近端和远端的两端之间双向通信的移动通信网络组件中语音可懂度的测量。
参照图1的流程图,语音可懂度测量的基础是通过使用适合于语音可懂度测量的适当测试信号来模拟(S1)经由所考虑网络组件的双向语音通信。然后建议,通过使用双方通话检测器,在模拟语音通信期间检测(S2)双方通话,并且仅在双方通话时期才执行(S3)语音可懂度测量。测量语音可懂度的这种方式一般意味着,在语音可懂度测量过程中可考虑回声影响,同时避免来自测量语音可懂度的信号通道中可能非线性处理的不希望的影响。可选地,测量结果然后用作分析和/或控制(S4)所考虑移动通信网络中的话音增强装置的操作和协调。
在许多应用中,如图2的示范图所示,网络侧上的近端信号通道通常包括具有语音活动控制的非线性信号处理的一个或多个话音增强装置10,例如具有选择性活动的非线性处理器和相关联舒适噪声发生器的回声消除器。非线性处理一般改变近端信号通道的输入输出关系,并且(与可能的舒适噪声共同)使语音可懂度的客观测量非常困难,简直可以说实际上不可能。
本发明人进行的认真分析表明,非线性信号处理在近端信号高于给定阈值时通常是关的。同时认识到,重要的是也考虑作为混合回声源的远端信号。总之,语音可懂度测量因此应当仅在同时存在近端信号能量和远端信号能量时、即双方通话条件下才执行,以便考虑可能的混合回声,并且避免非线性处理的不利影响。
因此,根据本发明的思想是采用双方通话检测器20,它检测模拟语音通信中的双方通话,即检测来自近端和远端的较高信号能量。将双方通话检测器的输出转送到语音可懂度估计器30,该语音可懂度估计器30然后仅在双方通话时期才执行语音可懂度测量。
为了模拟双向语音通信,该布置优选包括用于产生适当测试信号TEST_1、TEST_2的测试信号发生器40。将这些测试信号插入网络组件,优选地分别插入远端信号通道和近端信号通道。
优选地,测量结果然后用作反馈(如由虚线从可懂度估计器到话音增强装置所指示的)来分析和/或优化话音增强装置的操作。例如,网络中的话音增强装置可能不时地需要更新或者由新装置替换,以便满足新的要求和/或标准。在这个过程中,可能有用的是,相对于语音可懂度来测试新的或者经过更新的话音增强装置的效果,并且可能在网络中实现这些装置之前调整它们的配置。这例如可作为网络的一部分正常维护/测试/更新来执行。
语音可懂度的度量优选地根据一般包括任何非线性操作的话音增强装置的至少一部分近端信号通道上信号特性的变化的测量来估计。
在处理诸如近端和远端的两端之间双向通信的移动网络组件中,一般存在两个输入和两个输出。参照图2的示范图,RIN表示来自远端的输入信号,而ROUT表示到近端的输出信号。SIN表示来自近端的总输入信号(包括来自远端信号的可能回声),而SOUT表示到远端的输出信号。优选地,在远端输入插入测试信号TEST_1,而在近端输入插入测试信号TEST_2。如上所述,对于混合回声,SIN信号将表示插入的测试信号TEST_2以及来自远端信号通道的回声份额ECHO。
语音可懂度的度量优选地表示相对于可懂度的语音传输质量(又称作语音传输指数),并且根据调制的降低的测量来估计。例如,假定近端的测试信号TEST_2具有标称100%调制,而包括混合回声的SIN信号具有比如40%的调制,并且SOUT信号具有比如15%的调制。语音传输指数STI然后可根据调制率的降低来计算,在上述实例中为40%-15%=25%。如果STI指数与调制率的降低成正比,则STI改进为0.25。实际上,语音传输指数STI的估计则可简单地作为在双方通话时以及在信号谷值时所测量的SIN与SOUT之间的功率差异(dB)来估计。
为了更好地理解本发明,针对移动核心网络的通信网关中的具体应用来描述本发明可能是有用的。参照图3,其说明整个公共陆地移动网络(PLMN),数字核心网络100互连了不同的网络,例如无线电接入网200和公共交换电话网(PSTN)、综合业务数字网络(ISDN)或等效网络。移动核心网络通常具有用于控制和管理的节点以及用于话音和数据交换与路由选择的节点,包括用于在不同传输技术之间桥接并向终端用户连接添加服务的所谓网关(GW)。
图4是说明常规数字移动网络的网络侧上话音增强装置的一种示范布置的示意图。向/从PSTN网络进行桥接的网关一般包括混合器5,它是将具有独立传输通道的4线电路转换为2线用户线路的装置。布线的成本排除了将4线电路从本地交换局引到用户住宅的想法。为此,需要找到备选解决方案。因此,许多年前引入了4线-2线混合器。然而,该混合器本来就是有漏洞的装置。根据用户线路阻抗,送往近端(PSTN)侧的一部分信号被反射回远端侧,从而引起干扰回声、即所谓的混合回声。由于无线电网络中语音信号的无线电传输引起的传输延迟,这种回声需要经过控制,以避免干扰远端通话方。因此,回声消除器(EC)10-A在网络侧用来控制回声。
在正常回声消除器中,应用线性滤波器12来消除回声的线性部分,而非线性处理器(NLP)14用来消除残余回声,并且舒适噪声估计器和发生器16注入舒适噪声。线性滤波器12通常是适应性地尝试估计经过混合器的回声信号的自适应滤波器。该滤波器通常在1秒钟内收敛于良好估计。如果估计是良好的,则会消除线性回声。但是,当两个人同时讲话时,自适应滤波器往往发散,并且估计不会表示回声。为此,在回声消除器中可能存在内部双方通话检测器,用于在双方通话期间停止滤波器自适应,以便避免滤波器发散。线性自适应滤波器不会独自消除整个回声,可能仍然存在剩余的所谓残余回声。为了消除残余回声,在回声消除器中通常设置非线性处理器14。非线性处理器(NLP)通常在近端信号低于给定阈值时消除残余回声。但是,当近端语音信号高于给定阈值时,非线性处理器(NLP)通常是关的。当NLP消除残余回声时,它还可从近端信号中消除背景噪声。背景噪声的这种开/关影响可能造成相当程度的干扰。因此,当NLP有效地消除了残余回声时,所谓的舒适噪声被估计并添加到信号中。舒适噪声在频谱特性及幅度特性方面应当尽可能与原始背景噪声相似。回声消除器的不同设计可能具有不同的非线性处理。这从外部不可知。
其它可能的话音增强装置包括移动串扰控制(MCC)装置、噪声降低(NR)装置10-C和固定电平控制装置(FLC)10-D。移动串扰控制(MCC)装置通常用来控制远端声回声。MCC装置可能与回声消除器相当相似,但通常没有线性滤波器,而只有非线性处理器以及可能的相关联舒适噪声发生器。噪声降低(NR)装置可用于两个信号方向,而电平控制(LC)装置一般用于改进下行链路通道的语音质量。
虽然话音增强装置如回声消除器中的非线性处理将改进语音质量和可懂度,但是这也会使语音可懂度的任何客观测量变得困难或不可能,因为它改变了所考虑的信号通道的输入输出关系。如果相关联舒适噪声发生器添加了舒适噪声,这将使客观测量变得更为困难。
图5是根据本发明的一个示范实施例用于测量数字移动网络的网络侧上语音可懂度的一种布置的示意图。该布置在网络侧在例如网关等网络组件中提供,基本上包括双方通话检测器20、用于语音可懂度测量的模块30和用于模拟网关中双向语音通信的测试信号发生器40。双方通话检测器(DTD)20在模拟语音通信中检测来自近端和远端的较高信号能量。将双方通话检测器20的输出信号转送到可懂度测量模块30,该可懂度测量模块30仅在双方通话时期才执行语音可懂度测量,然后估计语音可懂度的客观度量。本质上,这意味着,双方通话检测器用于交替中止和激活可懂度测量模块30,从而避免语音可懂度测量中的非线性处理(以及可能的所添加舒适噪声)的负面影响。语音可懂度的估计度量然后优选地经过分析,并用作优化各种话音增强装置性能的基础。通常在网络维护/更新期间、例如根据反复实验、通过调整配置/改变算法以及相对于语音可懂度评估该调整,来执行话音增强装置的这种优化。
本发明的另一个方面涉及专用测试信号的使用。不是如在IEC60268-16标准中提出的使用不同倍频带中不同调制的测试信号的全矩阵并对于每个倍频带中的各调制频率单独确定调制传递函数,而是提出一种新的测试信号,它使测量过程更为有效。
新的测试信号优选包括噪声载波,其具有语音形频谱,并且通过扫频信号来调制。通过模拟测试信号中整个相关频率范围上的正常语音,并且通过扫频来调制语音形测试信号,测量过程更为节省时间并且便于管理。图6A说明扫频信号的一个实例,而图6B说明具有语音形频谱的扫频调制噪声载波的一个实例。扫频信号例如可能是低频线性调频信号,如图6A所示。
噪声载波可具有对应于男声、女声和/或童声的语音频谱。例如,噪声载波可具有对应于多个不同年龄的不同男性和女性的平均语音的频谱。或者,噪声载波由多个不同的连接起来的部分组成,其中一部分具有对应于男声的频谱,另一部分具有对应于女声的频谱,而又一部分具有对应于童声的频谱。在其它变形中,噪声载波可具有对应于特定语言或者不同语言的组合的语音频谱。例如,可能存在取决于语言的不同形式的测试信号,一种测试信号用于英语语音,另一种用于瑞典语音,而又一种测试信号用于汉语语音。
一旦通过扫频对噪声载波进行了调制,所得的测试信号就可重复可选择的次数。
优选地将专用测试信号插入希望估计语音可懂度的度量的信号通道。在图2和图5所示的示范配置中,例如,优选地将新的扫频调制测试信号插入网络组件的近端信号通道,因为希望估计近端信号通道的语音可懂度。插入到远端信号通道的另一个测试信号或多或少可能是适合于语音可懂度测量的任何(常规)测试信号,例如按照G.168标准的模拟有声和无声信号的复合源信号(CSS)。
最后,为了更好地传递本发明的理念,现在参照图7A-D描述来自示范模拟和语音可懂度测量过程的一组信号。在这里,在对应于图5的配置的设定中执行该测量过程。
图7A说明来自远端的输入信号功率(RIN)。在这个实例中,这个信号是由按照G.168标准的有声和无声信号组成的CSS(复合源信号)。
图7B说明来自近端的输入信号功率(SIN)。这个信号包括来自远端的回声信号加上近端测试信号。注意,回声级为20dB ERL(回声损耗),并且在模拟过程中在近端没有噪声。
图7C说明到远端的输出信号功率(SOUT)。在这个实例中,回声消除直接收敛,使得回声被近端通道中的回声消除器的NLP削减。
图7D表示所谓的双方通话切换,其中dthangt=0表示没有双方通话,而dthangt>0则表示检测到了双方通话。
当测试信号处于谷值时期并且在双方通话时,语音可懂度的度量、诸如STI例如可从SIN与SOUT信号之间的差异中得出。
上述实施例只作为实例给出,并且应该理解,本发明不限于此。保持了本文所公开并要求权利的基本原理的其它修改、变更和改进均在本发明的范围之内。
Claims (19)
1.一种用于测量处理两端之间双向通信的移动通信网络组件中的语音可懂度的方法,其特征在于:
-根据适合于语音可懂度测量的测试信号来模拟双向语音通信;
-在所述模拟语音通信期间检测双方通话;以及
-仅在双方通话时期才响应所述测试信号而执行所述网络组件中至少一部分近端信号通道上信号谷值时来自近端的总输入信号与到远端的输出信号之间的功率差异的测量,交替地中止和激活所述测量,以便估计相对于可懂度的语音质量的度量。
2.如权利要求1所述的方法,其中所述近端信号通道包括具有语音活动控制的非线性信号处理的至少一个话音增强装置。
3.如权利要求2所述的方法,其中所述至少一个话音增强装置包括具有非线性信号处理和相关联舒适噪声发生器的回声消除器。
4.如权利要求1所述的方法,其中所述测试信号之一是包含噪声载波的专用测试信号,所述噪声载波具有语音形频谱并由扫频信号调制,且所述专用测试信号被插入所述网络组件的所述近端信号通道。
5.如权利要求4所述的方法,其中所述扫频信号是低频线性调频信号。
6.如权利要求4所述的方法,其中所述噪声载波具有正常电信语音频率范围上的语音形频谱。
7.如权利要求1所述的方法,其中语音可懂度的所述度量表示相对于可懂度的语音传输质量,又称作语音传输指数。
8.一种用于改进移动通信网络中的语音可懂度的方法,所述方法包括以下步骤:
-按照如权利要求1-7中任一项所述的方法来测量语音可懂度;以及
-响应所测量的语音可懂度而调整所述通信网络中至少一个话音增强装置的配置。
9.一种用于测量处理两端之间双向通信的移动通信网络组件中的语音可懂度的设备,其特征在于:
-用于根据适合于语音可懂度测量的测试信号来模拟双向语音通信的部件;
-用于在所述模拟语音通信期间检测双方通话的部件;以及
-用于仅在双方通话时期才响应所述测试信号而执行所述网络组件中至少一部分近端信号通道上信号谷值时来自近端的总输入信号与到远端的输出信号之间的功率差异的测量、交替地中止和激活所述测量以便估计相对于可懂度的语音质量的度量的部件。
10.如权利要求9所述的设备,其中所述近端信号通道包括具有语音活动控制的非线性信号处理的至少一个话音增强装置。
11.如权利要求10所述的设备,其中所述至少一个话音增强装置包括回声消除器。
12.如权利要求9所述的设备,其中所述测试信号之一是包含噪声载波的专用测试信号,所述噪声载波具有语音形频谱并由扫频信号调制,并且用于模拟语音通信的所述部件包括用于将所述专用测试信号插入所述网络组件的所述近端信号通道的部件。
13.如权利要求12所述的设备,其中所述扫频信号是低频线性调频信号。
14.如权利要求12所述的设备,其中所述噪声载波具有正常电信语音频率范围上的语音形频谱。
15.如权利要求9所述的设备,其中语音可懂度的所述度量表示相对于可懂度的语音传输质量,又称作语音传输指数。
16.如权利要求9所述的设备,其中所述网络组件是通信网关。
17.如权利要求9所述的设备,其中所述设备在所述网络组件中实现。
18.一种用于改进移动通信网络中的语音可懂度的系统,所述系统包括:
-如权利要求9-17中任一项所述的用于测量语音可懂度的设备;以及
-用于响应所测量的语音可懂度而调整所述网络组件中至少一个话音增强装置的配置的部件。
19.一种用于测量处理两端之间双向通信的移动通信网络组件中的语音可懂度的方法,其特征在于:响应包含具有语音形频谱并由扫频信号调制的噪声载波的测试信号而执行所述网络组件中至少一部分近端信号通道上信号谷值时来自近端的总输入信号与到远端的输出信号之间的功率差异的测量,交替地中止和激活所述测量,以便估计相对于可懂度的语音质量的度量。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/SE2005/001382 WO2007035140A1 (en) | 2005-09-20 | 2005-09-20 | Method and test signal for measuring speech intelligibility |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101268624A CN101268624A (zh) | 2008-09-17 |
CN101268624B true CN101268624B (zh) | 2011-07-06 |
Family
ID=37889102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200580051611.8A Expired - Fee Related CN101268624B (zh) | 2005-09-20 | 2005-09-20 | 用于测量语音可懂度的方法和测试信号 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8731907B2 (zh) |
EP (1) | EP1927192B1 (zh) |
JP (1) | JP4875090B2 (zh) |
CN (1) | CN101268624B (zh) |
AT (1) | ATE492979T1 (zh) |
DE (1) | DE602005025545D1 (zh) |
WO (1) | WO2007035140A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102510418A (zh) * | 2011-10-28 | 2012-06-20 | 声科科技(南京)有限公司 | 噪声环境下的语音可懂度测量方法及装置 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070112563A1 (en) * | 2005-11-17 | 2007-05-17 | Microsoft Corporation | Determination of audio device quality |
US8599704B2 (en) * | 2007-01-23 | 2013-12-03 | Microsoft Corporation | Assessing gateway quality using audio systems |
US20080312916A1 (en) * | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
US8244538B2 (en) | 2008-04-30 | 2012-08-14 | Qnx Software Systems Limited | Measuring double talk performance |
US8331552B2 (en) * | 2008-05-09 | 2012-12-11 | Agere Systems Llc | Detection of double talk in telecommunications networks |
DE102008052176B4 (de) * | 2008-10-17 | 2013-11-14 | Siemens Medical Instruments Pte. Ltd. | Verfahren und Hörgerät zur Parameteradaption durch Ermittlung einer Sprachverständlichkeitsschwelle |
CA2701439C (en) * | 2009-04-29 | 2013-12-24 | Qnx Software Systems (Wavemakers), Inc. | Measuring double talk performance |
DE102009038599B4 (de) | 2009-08-26 | 2015-02-26 | Db Netz Ag | Verfahren zur Messung der Sprachverständlichkeit in einem digitalen Übertragungssystem |
CN101853667B (zh) * | 2010-05-25 | 2012-08-29 | 无锡中星微电子有限公司 | 一种语音降噪装置 |
TWI459753B (zh) * | 2012-07-31 | 2014-11-01 | Pegatron Corp | 網路音訊測試系統及其網路音訊測試之方法 |
US9299333B2 (en) * | 2012-09-02 | 2016-03-29 | Qosound, Inc | System for adaptive audio signal shaping for improved playback in a noisy environment |
CN103796135B (zh) * | 2012-10-31 | 2018-06-19 | 马克西姆综合产品公司 | 具有回声消除的动态扬声器管理 |
US9697847B2 (en) * | 2013-03-14 | 2017-07-04 | Semiconductor Components Industries, Llc | Acoustic signal processing system capable of detecting double-talk and method |
US20150012265A1 (en) * | 2013-07-02 | 2015-01-08 | Sander Jeroen van Wijngaarden | Enhanced Speech Transmission Index measurements through combination of indirect and direct MTF estimation |
EP3040984B1 (en) | 2015-01-02 | 2022-07-13 | Harman Becker Automotive Systems GmbH | Sound zone arrangment with zonewise speech suppresion |
GB201501791D0 (en) * | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
CN105280195B (zh) * | 2015-11-04 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 语音信号的处理方法及装置 |
US9924404B1 (en) | 2016-03-17 | 2018-03-20 | 8X8, Inc. | Privacy protection for evaluating call quality |
CN106531183A (zh) * | 2016-11-17 | 2017-03-22 | 中国传媒大学 | 一种基于传输系统声学参量的汉语语音清晰度评测算法 |
US11138989B2 (en) * | 2019-03-07 | 2021-10-05 | Adobe Inc. | Sound quality prediction and interface to facilitate high-quality voice recordings |
CN110264261A (zh) * | 2019-06-17 | 2019-09-20 | 浙江华坤道威数据科技有限公司 | 一种通过语音分析确定广告需求的系统和方法 |
KR20210072384A (ko) * | 2019-12-09 | 2021-06-17 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CN111091846B (zh) * | 2019-12-26 | 2022-07-26 | 江亨湖 | 一种降噪方法及应用该方法的回声消除系统 |
CN113824843B (zh) * | 2020-06-19 | 2023-11-21 | 大众问问(北京)信息科技有限公司 | 语音通话质量检测方法、装置、设备及存储介质 |
RU2748934C1 (ru) * | 2020-10-16 | 2021-06-01 | Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Московский институт электронной техники" | Способ измерения разборчивости речи |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1191650A (zh) * | 1995-05-30 | 1998-08-26 | 艾利森公司 | 增加扬声器输出的可懂度和电话机的回声消除的设备和方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6184103A (ja) * | 1984-10-01 | 1986-04-28 | Sony Corp | 周波数掃引信号発生装置 |
JP2644070B2 (ja) * | 1990-07-25 | 1997-08-25 | 日本電気株式会社 | エコーキャンセラのリモート・ループバック試験方式 |
US5602913A (en) * | 1994-09-22 | 1997-02-11 | Hughes Electronics | Robust double-talk detection |
FR2764469B1 (fr) * | 1997-06-09 | 2002-07-12 | France Telecom | Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son |
JP4102699B2 (ja) * | 2003-04-24 | 2008-06-18 | 日本電気株式会社 | メディアゲートウェイにおけるシステム運用中の音声品質監視方法および方式 |
JP2005176071A (ja) | 2003-12-12 | 2005-06-30 | Fujitsu I-Network Systems Ltd | 音声品質管理機能付きハイブリッド電話システムおよびそれに用いるハイブリッドpbx |
-
2005
- 2005-09-20 EP EP05786558A patent/EP1927192B1/en not_active Not-in-force
- 2005-09-20 JP JP2008531046A patent/JP4875090B2/ja not_active Expired - Fee Related
- 2005-09-20 WO PCT/SE2005/001382 patent/WO2007035140A1/en active Application Filing
- 2005-09-20 AT AT05786558T patent/ATE492979T1/de not_active IP Right Cessation
- 2005-09-20 DE DE602005025545T patent/DE602005025545D1/de active Active
- 2005-09-20 US US12/067,088 patent/US8731907B2/en not_active Expired - Fee Related
- 2005-09-20 CN CN200580051611.8A patent/CN101268624B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1191650A (zh) * | 1995-05-30 | 1998-08-26 | 艾利森公司 | 增加扬声器输出的可懂度和电话机的回声消除的设备和方法 |
Non-Patent Citations (1)
Title |
---|
ITU-T Recommendation G.168.Digital network echo cancellers.《INTERNATIONLA TELECOMMUNICATION UNION》.2004,summary、第9页第33行-第10页第66行,第25页第1行-第28页第9行. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102510418A (zh) * | 2011-10-28 | 2012-06-20 | 声科科技(南京)有限公司 | 噪声环境下的语音可懂度测量方法及装置 |
CN102510418B (zh) * | 2011-10-28 | 2015-11-25 | 声科科技(南京)有限公司 | 噪声环境下的语音可懂度测量方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1927192A4 (en) | 2009-12-16 |
US8731907B2 (en) | 2014-05-20 |
US20080255829A1 (en) | 2008-10-16 |
CN101268624A (zh) | 2008-09-17 |
EP1927192B1 (en) | 2010-12-22 |
ATE492979T1 (de) | 2011-01-15 |
WO2007035140A1 (en) | 2007-03-29 |
JP2009509396A (ja) | 2009-03-05 |
DE602005025545D1 (de) | 2011-02-03 |
JP4875090B2 (ja) | 2012-02-15 |
EP1927192A1 (en) | 2008-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101268624B (zh) | 用于测量语音可懂度的方法和测试信号 | |
US6389111B1 (en) | Measurement of signal quality | |
US7366663B2 (en) | Measuring a talking quality of a telephone link in a telecommunications network | |
US8130940B2 (en) | Echo detection | |
CN103391381A (zh) | 回声消除方法及装置 | |
CN100579156C (zh) | 移动站内的网络回波抑制 | |
US20010006511A1 (en) | Process for coordinated echo- and/or noise reduction | |
US7787597B1 (en) | Automated tools for testing echo cancellers using natural speech excitations | |
US7353002B2 (en) | Measuring a talking quality of a communication link in a network | |
Raghavendran | Implementation of an acoustic echo canceller using matlab | |
Gierlich et al. | Advanced speech quality testing of modern telecommunication equipment: An overview | |
Goldstein et al. | Perceptual speech quality assessment in acoustic and binaural applications | |
Möller et al. | Extending the e-model for capturing noise reduction and echo canceller impairments | |
Estepa et al. | On the suitability of the E-model to VoIP networks | |
US7693266B1 (en) | Method and system for measuring acoustic quality of wireless customer premises equipment | |
Kettler et al. | Evaluation of aurally-adequate analyses for echo assessment | |
EP1216519B1 (en) | Measuring the perceptual quality of speech signals including echo disturbances | |
Kishimoto et al. | Transmission quality of hand-free audio teleconference services | |
Hong et al. | DESIGN OF DESIRABLE LOUDNESS RATINGS FOR ISDN TELEPHONE | |
Eriksson et al. | Mobile crosstalk control—Enhancing speech quality in digital cellular networks | |
Wilkinson | Speech transmission standards in the New Zealand telephone network | |
EP1341365A1 (en) | Method and arrangement for processing a speech signal | |
Möller et al. | Factors Influencing the Quality of Service | |
Möller et al. | Quality of Prediction Models | |
Gierlich | Speech Communication and Telephone Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110706 Termination date: 20190920 |
|
CF01 | Termination of patent right due to non-payment of annual fee |