CN102655005B - 一种语音增强处理方法和装置 - Google Patents

一种语音增强处理方法和装置 Download PDF

Info

Publication number
CN102655005B
CN102655005B CN201110048922.6A CN201110048922A CN102655005B CN 102655005 B CN102655005 B CN 102655005B CN 201110048922 A CN201110048922 A CN 201110048922A CN 102655005 B CN102655005 B CN 102655005B
Authority
CN
China
Prior art keywords
vqe
module
voice quality
voice
quality problem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110048922.6A
Other languages
English (en)
Other versions
CN102655005A (zh
Inventor
艾雅·苏谟特
刘长娥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201110048922.6A priority Critical patent/CN102655005B/zh
Priority to PCT/CN2012/071819 priority patent/WO2012116646A1/zh
Publication of CN102655005A publication Critical patent/CN102655005A/zh
Application granted granted Critical
Publication of CN102655005B publication Critical patent/CN102655005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例公开了一种语音增强处理方法和装置,其中语音增强处理方法包括:第一VQE模块测量接收到的语音信号的至少一个语音质量参数;第一VQE模块利用至少一个语音质量参数检测语音质量问题;如果检测到语音质量问题,第一VQE模块通知第二VQE模块改变其VQE操作模式。

Description

一种语音增强处理方法和装置
技术领域
本发明涉及数字信号处理技术领域,尤其是一种语音增强处理方法和装置。
背景技术
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。语音被数字化处理,通过语音通信网络从一个终端传递到另一个终端,这里的终端可以是手机、数字电话终端或其他任何类型的语音终端,数字电话终端例如VOIP电话或ISDN电话、计算机、电缆通信电话。语音质量增强(VQE,Voice Quality Enhancement)功能被广泛地应用到语音通信网络中的不同地方,用于解决网络中的语音问题,如声学回声(acoustic echo)、线回声(line echo)、环境噪声、电平等问题。常见的VQE功能(VQE functionality)包括回声消除(EC,Echo Cancellation,Echo Canceller)、噪声消除(NR,Noise Reduction)(也可以叫做噪声抑制(NoiseCancellation,Noise Canceller))、自动电平控制(ALC,Automatic LevelControl)、自动听力增强(ALE,Automatic Listener Enhancement)等。
语音通信网络由多个终端及互相连接的网络节点构成,其中每个终端和每个网络节点都可能使用VQE模块(模块上可能具有一个或多个VQE功能)。多个网络节点和终端上的VQE模块可以提供相同或者不同的VQE功能,如果在通信链路上的VQE模块的功能没有进行很好的调度和协调,则会损伤所传输的语音质量。例如,两个回声消除前后串联(in tandem),带回声的语音信号经过第一个EC的处理后传递给第二个EC模块,此时第二个EC将不能正确观察到回声的特性,因此无法充分训练其内部的自适应滤波器以及控制其内部的非线性处理(NLP,Non-linear Processing)模块,可能造成语音的误损伤。再例如,两个噪声消除(NR,Noise Reduction)前后串联,带噪声的语音信号先经第一个NR处理,然后第二个NR处理,此时可能产生过度抑制,从而导致信号中的语音部分受损。
发明内容
本发明实施例的目的在于提供一种语音增强处理方法和装置,提高语音质量。
根据本发明的一实施例,一种语音增强处理方法,包括:
第一VQE模块测量接收到的语音信号的至少一个语音质量参数;
第一VQE模块利用至少一个语音质量参数检测语音质量问题;
如果检测到语音质量问题,第一VQE模块通知第二VQE模块改变其VQE操作模式。
根据本发明的另一实施例,一种语音增强处理装置,包括:
测量模块,用于测量接收到的语音信号的至少一个语音质量参数;
检测模块,用于利用至少一个语音质量参数检测语音质量问题;
通知模块,如果检测到语音质量问题,则通知另一VQE模块改变其VQE操作模式。
本发明实施例,网络中的每个VQE模块能和其他VQE模块进行动态协商,能有效地解决或改善网络中语音质量问题,提升整网的语音质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所涉及的网络环境示意图;
图2为本发明提供的语音增强处理方法一个实施例的流程示意图;
图3为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图4为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图5为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图6为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图7为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图8为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图9为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图10为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图11为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图12为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图13为本发明提供的语音增强处理方法另一个实施例的流程示意图;
图14为本发明提供的信号处理装置一个实施例的结构示意图;
图15为本发明提供的信号处理装置另一个实施例的结构示意图;。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
国际电信联盟(ITU-T)的一个标准G.799.2,定义了一种动态协商机制,通过交换语音通信网络中VQE模块的所处位置信息来协商各VQE功能的开关。G.799.2提供了各种VQE功能的最优位置,并且推荐不在最优位置的VQE功能进行关闭。例如,对于EC,最优位置为终端,如手机,对于不在终端的EC,推荐关闭。G.799.2通过这种协商方式,在网络中只留下最优位置的VQE功能,而关闭其他位置的VQE功能,虽然可以避免VQE模块前后串联带来的可能的质量下降问题,但是它也完全排除了在非最优位置的VQE功能对语音质量的改善,使得整体语音质量无法得到优化。例如,语音通信网路里的一个EC不能去除所有残留回声,在它之后串连的另一个EC虽然有能力去除这些残留回声,但是因为它不在最优位置上而被关闭,从而无法继续优化整体的语音质量。
参考图1,本发明实施例的一个应用环境框架图,语音通信网络中包括多个终端(如终端A、终端D)和多个网络节点(如网络节点B、网络节点C),任意终端或网络节点均可以叫做网元。每个终端和网络节点(例如,基站、网关等)分别包括VQE模块,如VQE A、VQE B、VQE C和VQE D。语音通话可以从终端A发起,传递到终端D,也可以反方向发起和传递,这里以A到D方向进行以下叙述。每个VQE模块可能是一个VQE功能,也可能是多个VQE功能的组合。
每个网元上的每个VQE功能测量语音信号,然后根据这些测量的语音质量参数来处理语音以提升语音质量。语音质量参数可以是语音电平、语音频谱、噪声电平、噪声频谱、信噪比(SNR)、残留回声或者其他任何可以从语音信号里提取出来的参数。例如,EC通过测量残留回声来调整训练它的自适应滤波器,也可以通过测量语音行为(Voice Activity)来决定NLP的动作,以更好地去除回声;NR可以通过测量带噪语音的频谱,以更好地去除噪声;ALC可以通过测量语音电平以将其调整到一个预定电平上。这些测量提供了语音信号的相关信息,图1中的A、B、C、D每个点上都可以进行这些测量。例如,终端A上的VQE A,基于终端A得到的语音信号测量,可以处理网络语音问题(如回声、噪声等),网络节点B上也有VQE B,可以基于节点B得到的语音信号测量,处理该节点的网络语音问题。
然而,两个VQE模块的操作不仅取决于各自的测量,还取决于各自的设计特性。例如,终端A上的VQE A里有EC,其设计特性是只能处理一定延时的回声,如,延时小于400ms的回声可以去除,大于400的回声无法去除,另外,由于算法处理能力有限或设计缺陷,终端A上的EC的自适应滤波器或NLP处理不能完全去除所有回声,从而导致回声残留。此时,节点B上的EC便可以检测回声残留并和A上的EC进行协商。
本发明的一个实施例,一个VQE模块可以通过测量语音信号的语音质量参数检测语音信号的质量问题,当发现语音信号出现语音质量问题时,将该语音质量问题发送给另一个VQE模块请求另一个VQE模块解决该语音质量问题。收到语音质量问题报告,另一个VQE模块可以改变其操作模式以解决该质量问题。进一步的,在发送语音质量问题的同时,该VQE模块可以尝试自身解决该语音质量问题,当其检测到另一个VQE模块已经解决了该语音质量问题则停止其自身解决语音质量问题的操作,并继续检测语音信号。
另一个实施例中,第一VQE模块可以通过测量语音质量参数来检测语音质量问题并先解决该语音质量问题,如果第一VQE模块不能解决该语音质量问题,且断定第二VQE模块影响自己解决语音质量问题,于是要求第二VQE模块临时或永久关闭其部分或部分操作模式,目的是去除第二VQE模块的影响,使第一VQE模块可以解决语音质量问题,如果第一VQE不能解决语音质量问题,则取消发给第一VQE模块的要求。
不同的VQE模块具备不同的VQE操作模式种类。例如,一个EC可以通过以下方式来改变操作模式:改变所支持的回声延时的长度、改变其NLP算法在回声抑制数量上和减少近端说话人剪切上的比例等,任何可能解决语音质量问题的算法上或参数上的改变。例如,一个NR可以通过改变噪声抑制电平等来改变操作模式。例如,一个ALC可以通过放大或缩小的电平、改变控制语音电平的任何感知方法等来改变操作模式。
参考图2,本发明语音增强处理方法一个实施例的流程示意图,包括:
S201:第一VQE模块测量接收到的语音信号的至少一个语音质量参数;
语音质量参数为任何可以从语音信号里提取的参数,例如可以是语音电平、语音频谱、噪声电平、噪声频谱、信噪比(SNR)、残留回声。
S202:第一VQE模块利用至少一个语音质量参数检测语音质量问题;
第一VQE模块通过测量的语音质量参数检测对应的语音信号的质量问题,语音质量指主观或客观上的任何语音失真和任何听觉上的不舒适,语音质量问题可以包括以下几种类型:噪声、回声、含糊语音(语音模糊导致主观上听不清或语义听不懂)、音量失真(如音量或电平过大、过小等)。不同的VQE模块可能存在不同的语音质量问题,例如,EC对应的语音质量问题可以是残留回声或语音被当作回声处理掉等;NR对应的语音质量问题可以是噪声抑制过小或噪声抑制后SNR未达到指定数量级等;ALC对应的语音质量问题可以是电平为未达到指定数量级。一个实施例中,可以将测量的语音信号质量参数与语音信号正常时的语音信号质量参数相比较,如果出现预定范围的偏差则认为出现语音质量问题。例如,将提取的语音电平与预设的语音电平相比较,如果超过预设语音电平,则认为出现语音质量问题;再例如,噪声抑制后的信噪比未达到预设信噪比,则认为出现语音质量问题;再例如,残留回声比例未达到预设比例,则认为出现语音质量问题。
S203:第一VQE模块通知第二VQE模块改变其VQE操作模式以解决该语音质量问题。
改变VQE操作模式为VQE模块所作的任何足以解决语音质量问题的算法或参数上的改变。不同的VQE模块具有不同的操作模式,例如EC对应的VQE操作模式可以为改变自适应滤波器、NLP的参数配置;NR对应的VQE操作模式可以为改变噪声更新模块、增益调整模块的参数配置;ALC对应的VQE操作模式可以为更改电平控制因子。第一VQE模块可以通过多种方式通知第二VQE模块,一个实施例中,第一VQE模块可以向第二VQE模块发送语音质量问题报告,该语音质量问题报告表示第一VQE模块涉及的语音信号出现哪种类型的语音质量问题。第二VQE模块收到该语音质量问题报告后,相应的改变其VQE操作模式以解决该语音质量问题。例如,第一VQE模块向第二VQE模块反馈的语音质量问题为信噪比未达到预设信噪比,则第二VQE模块可以采用加大噪声抑制因子来提高信噪比。另一个实施例中,第一VQE模块可以直接向第二VQE模块发送VQE操作模式改变请求,该VQE操作模式改变请求指出操作方式。例如,第一VQE模块向第二VQE模块发送一个提高信噪比的请求。
另一个实施例中,当第一VQE模块检测到语音质量问题,第一VQE模块改变其VQE操作模式。其中该步骤可以在步骤S203之前之后或者同步进行,对顺序不做限定。
另一个实施例中,第一VQE模块根据第二VQE模块对语音质量问题的解决结果改变其VQE操作模式,进一步的,当第一VQE模块的VQE操作模式改变后未能解决该语音质量问题,则通知第二VQE模块关闭部分或全部VQE操作模式。
该实施例中,第一VQE模块在检测到语音质量问题时,通知第二VQE模块改变操作模式以解决该语音质量问题。可以根据语音增强的处理效果对语音传输通道中的不同VQE模块之间实现动态协商,对一次语音传输提供有效的VQE功能,能有效地解决或改善网络中语音质量问题,大大提升整网的语音质量。
参考图3,本发明语音增强处理方法另一个实施例的流程示意图,包括:
S301:第一VQE模块测量至少一个语音质量参数;
S302:第一VQE模块利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S301;
S303:如果检测到语音质量问题,则第一VQE模块将该语音质量问题通知给第二VQE模块;
S304:应用语音质量解决方案解决该语音质量问题;
S305:测量语音质量参数,判断该语音质量问题是否解决;
S306:如果该语音质量问题已解决,则停止应用语音质量方案;
S307:如果该语音质量问题未解决,则继续应用语音质量方案。
以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题并应用语音质量解决方案为例。参考图4,该方法一个实施例包括:
S401:VQE B测量至少一个语音质量参数;
S402:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S401;
S403:如果检测到语音质量问题,则VQE B将该语音质量问题通知给VQE A;
S404:VQE A改变操作模式,处理语音并解决语音质量问题;
S405:如果VQE B检测到语音质量问题已经被VQE A解决或有所改善,则保持监测。
上述实施例中,当VQE B发现语音质量问题时,反馈给VQE A,由VQE A解决该语音质量问题。
仍以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题为例。参考图5,该方法另一个实施例包括:
S501:VQE B测量至少一个语音质量参数;
S502:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S501;
S503:如果检测到语音质量问题,则VQE B将该语音质量问题通知给VQE A;
S504:VQE A改变操作模式,处理语音并解决语音质量问题;
S505:VQE B处理语音并解决语音质量问题,即改变其VQE操作模式;
S506:如果VQE B检测到语音质量问题已经被VQE A解决,则停止解决语音质量问题,并保持监测;
S507:如果VQE B检测到语音质量问题未被VQE A解决,则继续处理语音并解决语音质量问题,同时保持监测。
上述实施例中,当VQE B发现语音质量问题时,反馈给VQE A,由VQE A解决该语音质量问题,同时VQE B也尝试解决该语音质量问题,当VQE B发现VQEA能解决该语音质量问题时停止解决该语音质量问题。
仍以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题并应用语音质量解决方案为例。参考图6,该方法另一个实施例包括:
S601:VQE B测量至少一个语音质量参数;
S602:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S601;
S603:如果检测到语音质量问题,则VQE B将该语音质量问题通知给VQE A;
S604:VQE A改变操作模式,处理语音并解决语音质量问题;
S605:如果VQE B检测到语音质量问题已经被VQE A解决,则保持监测;
S606:如果VQE B检测到语音质量问题未被VQE A解决但有所改善,则VQE B处理语音并解决语音质量问题;
S607:如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A恢复原先的操作模式,同时VQE B处理语音并解决语音质量问题;
S608:如果VQE B检测到语音质量问题已经解决或改善,则保持监测;
S609:如果VQE B检测到语音质量问题相对于之前没有改善,则VQE B撤销改变的操作模式,但保持监测。
上述实施例中,当VQE B发现语音质量问题时,将语音质量问题反馈给VQEA,由VQE A解决该语音质量问题,当VQE A不能解决该语音质量问题时VQE B解决该语音质量问题。
仍以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题并应用语音质量解决方案为例。参考图7,该方法另一个实施例包括:
S701:VQE B测量至少一个语音质量参数;
S702:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S701;
S703:如果检测到语音质量问题,则VQE B将该语音质量问题通知给VQE A;
S704:VQE A改变操作模式,处理语音并解决语音质量问题;
S705:如果VQE B检测到语音质量问题已经被VQE A解决,则保持监测;
S706:如果VQE B检测到语音质量问题未被A解决但有所改善,则VQE B处理语音并解决语音质量问题;
S707:如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A恢复原先的操作模式,同时VQE B处理语音并解决语音质量问题;
S708:VQE B处理语音并解决语音质量问题时,如果检测到语音质量问题已经解决或改善,则保持监测;
S709:如果VQE B检测到语音质量问题相对于之前没有改善,且断定它不能改善语音质量问题原因在于VQE A的干扰(由于语音已经被其处理过,从而改变了语音特性,例如,引起失真),则通知VQE A关闭其部分或全部模式;
S710:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题已经解决或改善,则通知VQE A保持现状;
S711:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A重新启用其部分或全部模式。
该实施例中,VQE B在检测到语音质量问题时,向其在前的VQE A通知该语音质量问题,VQE A改变VQE操作模式以解决该技术问题,在VQE A未能解决时VQE B改变其VQE操作模式以解决该质量问题。
参考图8,本发明语音增强处理方法另一个实施例的流程示意图,包括:
S801:第一VQE模块测量至少一个语音质量参数;
S802:第一VQE模块利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S801;
S803:如果检测到语音质量问题,则第一VQE模块改变其VQE操作模式以解决该语音质量问题;
S804:测量语音质量参数,判断该语音质量问题是否解决;
S805:如果该语音质量问题已解决,则停止应用语音质量方案;
S806:如果该语音质量问题未解决,则通知第二VQE模块改变其VQE操作模式以解决该语音质量问题。
上述实施例中,第一VQE模块发现语音质量问题时先自行解决该语音质量问题,当第一VQE模块不能解决该问题时通知第二VQE模块改变其VQE操作模式以解决该语音质量问题。
以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题并应用语音质量解决方案为例。参考图9,该方法另一个实施例包括:
S901:VQE B测量至少一个语音质量参数;
S902:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S901;
S903:如果检测到语音质量问题,VQE B改变VQE操作模式以解决该语音质量问题;
S904:如果VQE B检测到语音质量问题已经被解决,则保持监测;
S905:如果VQE B检测到语音质量问题相对于之前没有改善,则VQE B恢复原先的VQE操作模式,保持监测;
S906:如果VQE B检测到语音质量问题之前有所改善但未完全解决,则通知VQE A改变操作模式;
S907:VQE A改变操作模式后,如果VQE B检测到语音质量问题已解决或有改善,则保持监测;
S908:VQE A改变操作模式后,如果VQE B检测到语音质量问题未改善或有所恶化,则通知VQE A恢复原先的VQE操作模式,并保持监测。
上述实施例中,VQE B发现语音质量问题时先自行解决该语音质量问题,当VQE B不能解决该问题时通知VQE A改变其VQE操作模式以解决该语音质量问题。
以终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B;节点B上的VQE B监测语音质量参数语音质量,检测网络语音质量问题并应用语音质量解决方案为例。参考图10,该方法另一个实施例包括:
S1001:VQE B测量至少一个语音质量参数;
S1002:VQE B利用至少一个语音质量参数检测语音质量问题,如果没有检测到语音质量问题,则返回S1001;
S1003:如果检测到语音质量问题,VQE B改变VQE操作模式以解决该语音质量问题;
S1004:如果VQE B检测到语音质量问题已经被解决,则保持监测;
S1005:如果VQE B检测到语音质量问题相对于之前没有改善,同时断定不能改善语音质量问题原因在于VQE A的干扰(由于语音已经被其处理过,从而改变了语音特性,例如,引起失真),则通知VQE A关闭部分或全部操作模式;
S1006:VQE A关闭部分或全部操作模式后,如果VQE B检测到语音质量问题已经解决或改善,则通知VQE A保持现状;
S1007:VQE A关闭部分或全部操作模式后,如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A重新启动部分或全部操作模式;
S1008:如果VQE B检测到语音质量问题相对于之前有改善但未完全解决,则通知VQE A改变其VQE操作模式;
S1009:VQE A改变操作模式后,如果VQE B检测到语音质量问题已解决或有改善,则保持监测;
S1010:VQE A改变操作模式后,如果VQE B检测到语音质量问题未改善或有所恶化,则通知VQE A恢复原先的VQE操作模式,并保持监测。
上述实施例中,VQE B发现语音质量问题时先自行解决该语音质量问题,当VQE B不能解决该语音质量问题并断定该语音质量问题由VQE A干扰引起,则通知VQE A关闭其部分或全部VQE操作模式以解决该语音质量问题。
以终端A上包含VQE A,网络节点B上包含VQE B,VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B B为例,参考图11,本发明语音增强处理方法另一个实施例的流程示意图,包括:
S1101:终端A上的VQE A测量语音质量参数,根据这些语音质量参数来处理语音;
S1102:终端A上的VQE A监测语音质量参数,检测网络语音质量问题;如果没有检测到语音质量问题,则回到S1102;
S1103:如果VQE A检测到任何语音质量问题,VQE A改变操作模式,处理语音并解决语音质量问题;
S1104:如果VQE A检测到语音质量问题已经被VQE A解决或改善,则保持监测;
S1105:如果VQE A检测到语音质量问题未被VQE A解决,则报告该问题给VQE B,VQE B处理语音并解决语音质量问题;
S1106:如果VQE B检测到语音质量问题已经解决或改善,则通知VQE A语音质量问题已经解决或改善;
S1107:如果VQE B检测到语音质量问题未解决或改善,且断定它不能改善语音质量问题原因在于VQE A的干扰(由于语音已经被其处理过,从而改变了语音特性,例如,引起失真),则通知VQE A关闭其部分或全部模式;
S1108:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题已经解决或改善,则通知VQE A保持现状;
S1109:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A重新启用其部分或全部模式。
上述实施例中,VQE A在检测到语音质量问题时,先自行解决该语音质量问题,当VQE A不能解决该语音质量问题时,通知VQE B改变VQE操作模式以解决该语音质量问题,当VQE B无法解决该语音质量问题则断定原因在于VQE A的干扰,则通知VQE A关闭其部分或全部模式。
以终端A上包含VQE A,网络节点B上包含VQE B,VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B为例,参考图12,本发明语音增强处理方法另一个实施例的流程示意图,包括:
S1201:终端A上的VQE A测量语音质量参数,根据这些语音质量参数来处理语音;
S1202:终端A上的VQE A监测语音质量参数,检测网络语音质量问题;如果没有检测到语音质量问题,则返回S1202;
S1203:如果VQE A检测到任何语音质量问题,VQE A报告该问题给VQE B;
S1204:VQE B处理语音并解决语音质量问题;
S1205:如果VQE B检测到语音质量问题已解决或改善,则通知VQE A保持监测;
S1206:如果VQE B检测到语音质量问题未改善,且断定它不能改善语音质量问题原因在于VQE A的干扰(由于语音已经被其处理过,从而改变了语音特性,例如,引起失真),则通知VQE A关闭其部分或全部模式;
S1207:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题已经解决或改善,则通知VQE A保持现状;
S1208:VQE A关闭部分或全部模式后,如果VQE B检测到语音质量问题相对于之前没有改善,则通知VQE A重新启用其部分或全部模式。
上述实施例中,VQE A在检测到语音质量问题时,将语音质量问题反馈给VQE B,由VQE B解决该语音质量问题,当VQE B无法解决该语音质量问题则断定原因在于VQE A的干扰,则通知VQE A关闭其部分或全部模式。
上述几个实施例均以终端A和节点B为例,实际上,两个VQE模块可以在任何网元上,对两个VQE模块的相对位置并无限制,并且图1中两个终端间可以有任意个网元。
实际网络中,可以选用上述任一实施例,或则上述实施例可以组合使用,而上述实施例的具体步骤顺序并不做限制。
下面终端A上的VQE A测量语音信号质量参数,根据这些语音质量参数测量来处理语音信号,并将处理后的语音信号传输给节点B,两个VQE模块为EC为例,参考图13,本发明语音增强处理方法另一个实施例的流程示意图,包括:
S1301:终端A上的EC测量语音中的残留回声,调整训练它的自适应滤波器,也可以通过测量语音行为(Voice Activity)来决定它的NLP模块的动作;
S1302:节点B上的EC监测语音质量,检测残留回声;
S1303:如果没有检测到残留回声,则回到S1302;
S1304:如果节点B的EC检测到残留回声,则上报报告该问题给终端A的EC;
S1305:终端A的EC改变操作模式,处理语音并去除残留回声;
S1306:如果B检测到残留回声已经被A的EC去除,或则保持监测;
S1307:如果B检测到残留回声未被A完全去除但有所减少,则节点B的EC开启,处理语音并去除残留回声;
S1308:如果B检测到去除残留回声相对于之前没有改善,则通知终端A恢复原先的操作模式,同时节点B的EC开启,处理语音并去除残留回声;
S1309:B开启后,如果B检测到去除残留回声已经去除或改善,则保持监测;
S1310:B开启后,如果B检测到残留回声相对于之前没有改善,则断定它不能改善语音质量问题原因在于终端A的EC的干扰(由于语音已经被其处理过,从而改变了语音特性,例如,引起失真),则通知A关闭EC的部分或全部模式;
S1311:A关闭EC的部分或全部模式后,如果B检测到语音质量问题已经解决或改善,则通知A保持现状;
S1312:A关闭EC的部分或全部模式后,如果B检测到语音质量问题相对于之前没有改善,则通知A重新启用部分或全部模式。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
与上述方法实施例相关联,本发明实施例提供一种语音增强处理装置,该装置可以位于终端或者网络节点中的任何一个网元,其中网络节点可以为基站、网关等。所述语音信号处理装置可以由硬件电路来实现,或者由软件配合硬件来实现。例如,参考图14,由一个处理器调用语音增强处理装置来实现对网元VQE配置,以提高语音质量。
参考图15,本发明语音增强处理装置的一个实施例包括:
测量模块,用于测量接收到的语音信号的至少一个语音质量参数;
检测模块,用于利用至少一个语音质量参数检测语音质量问题;
通知模块,如果检测到语音质量问题,则通知另一VQE模块改变其VQE操作模式。
另一个实施例中,语音增强处理装置还包括:
配置模块,用于在检测到语音质量问题时改变其VQE操作模式。
一个实施例中,通知模块用于向所述另一VQE模块发送语音质量问题报告,所述另一VQE模块根据语音质量问题报告改变VQE操作模式。
另一个实施例中,通知模块用于向所述另一VQE模块发送VQE操作模式改变请求,该VQE操作模式改变请求包含改变的操作模式。
另一个实施例中,配置模块,用于根据所述另一个VQE模块对语音质量问题的解决结果改变VQE操作模式。
另一个实施例中,如果VQE操作模式改变后未能解决该语音质量问题,所述通知模块还用于通知所述另一个VQE模块关闭部分或全部VQE操作模式。
上述语音增强处理装置可以包括:回声抑制,噪声抑制或自动电平控制。
与本文所揭示实施例关联描述的中例示性逻辑块、模块及电路均可由下列装置构建或实施:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件、或其设计用于实施上文所述功能的任何组合。通用处理器可为微处理器,但另一选择为,处理器也可为任何常规处理器、控制器、微控制器或状态机。处理器也可构建为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、一个或一个以上微处理器与DSP核心的联合,或任一其它此类配置。
以上所述仅为本发明的几个实施例,本领域的技术人员依据申请文件公开的可以对本发明进行各种改动或变型而不脱离本发明的精神和范围。

Claims (11)

1.一种语音增强处理方法,其特征在于,包括:
第一VQE模块测量接收到的语音信号的至少一个语音质量参数;
第一VQE模块利用至少一个语音质量参数检测语音质量问题;
如果检测到语音质量问题,第一VQE模块通知第二VQE模块改变所述第二VQE模块的VQE操作模式;
根据第二VQE模块对语音质量问题的解决结果改变第一VQE模块的VQE操作模式。
2.根据权利要求1所述的方法,其特征在于,第一VQE模块通知第二VQE模块改变所述第二VQE模块自身的VQE操作模式包括:
第一VQE模块向第二VQE模块发送语音质量问题报告,所述第二VQE模块根据语音质量问题报告改变VQE操作模式。
3.根据权利要求1所述的方法,其特征在于,第一VQE模块通知第二VQE模块改变所述第二VQE模块自身的VQE操作模式包括:
向第二VQE模块发送VQE操作模式改变请求,该VQE操作模式改变请求包含改变的操作模式。
4.根据权利要求1所述的方法,其特征在于,还包括:
如果第一VQE模块的VQE操作模式改变后未能解决该语音质量问题,则通知第二VQE模块关闭部分或全部VQE操作模式。
5.根据权利要求4所述的方法,其特征在于,还包括:
如果第一VQE模块未能解决语音质量问题,则撤销第二VQE模块的操作模式的变更。
6.根据权利要求1所述的方法,其特征在于,所述VQE模块包括下列VQE功能中至少一个:回声抑制,噪声抑制和自动电平控制。
7.一种语音增强处理装置,其特征在于,包括:
测量模块,用于测量接收到的语音信号的至少一个语音质量参数;
检测模块,用于利用至少一个语音质量参数检测语音质量问题;
通知模块,如果检测到语音质量问题,则通知另一VQE模块改变所述另一VQE模块自身的VQE操作模式;
配置模块,用于根据所述另一个VQE模块对语音质量问题的解决结果改变VQE操作模式。
8.根据权利要求7所述的装置,其特征在于,所述通知模块用于向所述另一VQE模块发送语音质量问题报告,所述另一VQE模块根据语音质量问题报告改变VQE操作模式。
9.根据权利要求7所述的装置,其特征在于,所述通知模块用于向所述另一VQE模块发送VQE操作模式改变请求,该VQE操作模式改变请求包含改变的操作模式。
10.根据权利要求7所述的装置,其特征在于,
如果VQE操作模式改变后未能解决该语音质量问题,所述通知模块还用于通知所述另一个VQE模块关闭部分或全部VQE操作模式。
11.根据权利要求7所述的装置,其特征在于,包括中至少一个:回声抑制,噪声抑制和自动电平控制。
CN201110048922.6A 2011-03-01 2011-03-01 一种语音增强处理方法和装置 Active CN102655005B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110048922.6A CN102655005B (zh) 2011-03-01 2011-03-01 一种语音增强处理方法和装置
PCT/CN2012/071819 WO2012116646A1 (zh) 2011-03-01 2012-03-01 一种语音增强处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110048922.6A CN102655005B (zh) 2011-03-01 2011-03-01 一种语音增强处理方法和装置

Publications (2)

Publication Number Publication Date
CN102655005A CN102655005A (zh) 2012-09-05
CN102655005B true CN102655005B (zh) 2014-05-07

Family

ID=46730624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110048922.6A Active CN102655005B (zh) 2011-03-01 2011-03-01 一种语音增强处理方法和装置

Country Status (2)

Country Link
CN (1) CN102655005B (zh)
WO (1) WO2012116646A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104835502B (zh) * 2015-05-20 2018-04-10 北京捷思锐科技股份有限公司 音频信号处理方法、装置及电子设备
CN109686347B (zh) * 2018-11-30 2021-04-23 北京达佳互联信息技术有限公司 音效处理方法、音效处理装置、电子设备和可读介质
TWI832698B (zh) * 2023-02-10 2024-02-11 宏碁股份有限公司 視訊會議評估方法及系統

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1504042A (zh) * 2000-12-29 2004-06-09 ��˹��ŵ�� 数字网络中的音频信号质量增强
CN1798181A (zh) * 2004-12-29 2006-07-05 乐金电子(中国)研究开发中心有限公司 语音通信用终端的杂音去除装置
CN101170827A (zh) * 2007-11-23 2008-04-30 中兴通讯股份有限公司 语音增强功能的配置方法
CN101415045A (zh) * 2007-10-17 2009-04-22 北京三星通信技术研究有限公司 通信网中实现智能自动电平控制的方法与装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7254607B2 (en) * 2000-03-30 2007-08-07 United Devices, Inc. Dynamic coordination and control of network connected devices for large-scale network site testing and associated architectures
KR20040044217A (ko) * 2002-11-19 2004-05-28 주식회사 인티스 디지털 통신의 음성 품질 향상 장치 및 방법
US20040243404A1 (en) * 2003-05-30 2004-12-02 Juergen Cezanne Method and apparatus for improving voice quality of encoded speech signals in a network
CN100492494C (zh) * 2005-12-08 2009-05-27 华为技术有限公司 一种对分组语音进行回声抑制的系统和方法
CN101175122B (zh) * 2006-11-01 2010-06-16 中兴通讯股份有限公司 通信网语音增强通道的选配方法
US8032366B2 (en) * 2008-05-16 2011-10-04 Tellabs Operations, Inc. Method and apparatus for low bit rate speech coding detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1504042A (zh) * 2000-12-29 2004-06-09 ��˹��ŵ�� 数字网络中的音频信号质量增强
CN1798181A (zh) * 2004-12-29 2006-07-05 乐金电子(中国)研究开发中心有限公司 语音通信用终端的杂音去除装置
CN101415045A (zh) * 2007-10-17 2009-04-22 北京三星通信技术研究有限公司 通信网中实现智能自动电平控制的方法与装置
CN101170827A (zh) * 2007-11-23 2008-04-30 中兴通讯股份有限公司 语音增强功能的配置方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ITU-T.Mechanism for dynamic coordination of signal processing functions.《ITU-T G.799.2》.2009,
Mechanism for dynamic coordination of signal processing functions;ITU-T;《ITU-T G.799.2》;20091231;全文 *

Also Published As

Publication number Publication date
WO2012116646A1 (zh) 2012-09-07
CN102655005A (zh) 2012-09-05

Similar Documents

Publication Publication Date Title
US10574804B2 (en) Automatic volume control of a voice signal provided to a captioning communication service
EP2845189B1 (en) A universal reconfigurable echo cancellation system
EP3348047B1 (en) Audio signal processing
US10685663B2 (en) Enabling in-ear voice capture using deep learning
EP2348645B1 (en) Method and apparatus for detecting double talk
US10115411B1 (en) Methods for suppressing residual echo
US9191493B2 (en) Methods and devices for updating an adaptive filter for echo cancellation
DE112016006126T5 (de) Okklusionsreduzierung und Rauschunterdrückung auf der Grundlage einer Dichtqualität
CN105915738A (zh) 回声消除方法、回声消除装置和终端
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
EP3353781B1 (en) Comfort noise generation apparatus and method
EP3605529A1 (en) Method and apparatus for processing speech signal adaptive to noise environment
US20110228946A1 (en) Comfort noise generation method and system
CN110769352B (zh) 一种信号处理方法、装置以及计算机存储介质
US10540983B2 (en) Detecting and reducing feedback
CN107979790A (zh) 一种通话降噪方法、装置、设备及介质
WO2019239977A1 (ja) エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム
CN102655005B (zh) 一种语音增强处理方法和装置
CN116367066A (zh) 具有音频质量检测的音频设备及相关方法
CN103402038B (zh) 手机免提状态下消除对方听筒回音的方法及装置
US9503815B2 (en) Perceptual echo gate approach and design for improved echo control to support higher audio and conversational quality
EP1062487B1 (de) Mikrophonanordnung für die spracherkennung unter variablen räumlichen bedingungen
JP2000151474A (ja) エコーキャンセラ
CN112929506A (zh) 音频信号的处理方法及装置,计算机存储介质及电子设备
CN207070111U (zh) 降噪终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211227

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: xFusion Digital Technologies Co., Ltd.

Address before: 518129 headquarters building of Bantian HUAWEI base, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right