CN103839550A

CN103839550A - 一种用于对会话中的语音进行处理的方法、装置和系统

Info

Publication number: CN103839550A
Application number: CN201210489128.XA
Authority: CN
Inventors: 卜文飞
Original assignee: Alcatel Optical Networks Israel Ltd
Current assignee: Alcatel Optical Networks Israel Ltd
Priority date: 2012-11-26
Filing date: 2012-11-26
Publication date: 2014-06-04
Also published as: WO2014080277A2; WO2014080277A3

Abstract

本发明的目的是提供一种用于对会话中的语音进行处理的方法、装置和系统。根据本发明的方法，当媒体网关接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。本发明具有以下优点：通过的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号；并能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。

Description

一种用于对会话中的语音进行处理的方法、装置和系统

技术领域

本发明涉及通信技术领域，尤其涉及一种用于对会话中的语音进行处理的方法、装置和系统。

背景技术

在现有技术中，在通过通信系统进行语音通话时，用户仅能听到对方的语音，而不能获得其他的音效，这对于用户来说显得较为单调。

发明内容

本发明的目的是提供一种用于对会话中的语音进行处理的方法、装置和系统。

根据本发明的一个方面，提供一种在媒体网关中用于对会话中的语音进行处理的方法，其中，所述方法包括以下步骤：

a当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。

根据本发明的一个方面，还提供一种在用户设备中确定对会话中的语音进行处理的方法，其中，所述方法包括以下步骤：

-确定与一会话相对应的至少一个音频效果；

-将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。

根据本发明的一个方面，还提供一种在媒体网关控制装置中辅助对会话的语音进行处理的方法，其中，所述方法包括以下步骤：

-接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；

-将所述音效选择信息发送至媒体网关。

根据本发明的一个方面，还提供一种对会话中的语音进行处理的媒体网关，其中，所述媒体网关包括：

音频处理装置，用于当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。

根据本发明的一个方面，还提供一种用于确定对会话中的语音进行处理的用户设备，其中，所述用户设备包括：

第二确定装置，用于确定与一会话相对应的至少一个音频效果；

第一发送装置，用于将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。

根据本发明的一个方面，还提供一种用于辅助对会话的语音进行处理的媒体网关控制装置，其中，所述媒体网关控制设备包括：

第二接收装置，用于接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；

第二发送装置，用于将所述音效选择信息发送至媒体网关。

根据本发明的一个方面，还提供一种通信系统，其中，所述通信系统包括所述媒体网关、至少一个所述用户设备、以及所述媒体网关控制装置。

与现有技术相比，本发明具有以下优点：通过的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号；并能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图；

图2示意出了根据本发明的一种用于对会话中的语音进行处理方法；

图3示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理方法；

图4示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图；

图5示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理的系统的结构示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图。

所述系统包括至少一个用户设备、媒体网关控制装置以及媒体网关。优选地，所述用户设备包括呼叫用户设备以及被叫用户设备。更优选地，所述被叫用户设备可以有多个。

其中，所述媒体网关(MG，Media Gateway)用于连接不同类型网络，例如分组电缆网络与公共交换电话网络(PSTN，Public SwitchedTelephone Network)等，并对承载于网络之上的媒体流执行处理操作。

所述媒体网关控制装置(MGC，Media Gateway Controller)用于接收和调停分组电缆网络与公共交换电话网络之间的呼叫信令信息，维护和控制需要与PSTN进行交互的呼叫的全局呼叫状态。并且，所述MGC用于控制媒体网关对承载于网络之上的媒体流执行处理操作。

优选地，所述处理操作包括但不限于创建、修改以及删除等。

优选地，根据本发明的系统的MGC还与应用服务器(ApplicationServer)相连，由所述应用服务器来提供与呼叫相关的应用服务。其中，本领域技术人员应可根据实际情况与需求来确定所述应用服务器与MGC之间的传输与通信的方式，因此，为简明清楚起见，根据本发明的实施例及附图中不再在对应用服务器的处理过程进行赘述。

根据本发明的系统中的各个设备可基于以下任一种协议来执行各自的操作：

1)会话发起协议(SIP，Session Initiation Protocol)；

2)H.323协议；

3)H.248协议；

4)综合业务数字网(ISDN，Integrated Services Digital Network)协议。

在该系统中，会话呼叫方的呼叫用户设备向MGC发送会话发起请求，例如，当会话采用SIP协议时，用户设备向MGC发送SIP INVIT信息。MGC接收到该信息后，向相应的被叫用户设备发送与接收到的请求相应的会话发起请求，例如，当MGC接收到SIP INVIT信息时，向被叫方用户设备同样发送SIP INVIT信息，并且向媒体网关发送相应的信息，以使媒体网关对相应会话的音频信号进行处理。

接着，结合图2说明媒体网关对所接收到的原始音频信号的处理。

在步骤S11中，当媒体网关接收到一会话的原始音频信号时，媒体网关对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。

其中，所述音频效果包括但不限于以下至少任一项：

1)背景音乐；

2)人声音效；例如，对人声的音调、音强和音色等进行处理后的效果等，又例如，将人声处理为特定的，如耳语等效果。

3)场景音效，例如，用于模拟咖啡馆、公园、海边、KTV等场景的音效等。

其中，媒体网关确定与原始音频信号相应的音频效果的方式包括但不限于以下任一种：

1)媒体网关根据预定的对应关系来确定与所述原始音频信号相对应的音频效果。

例如，媒体网关中预定对于来自会话的呼叫方的原始音频信号采用背景音乐Aud_mu1，对于来自会话的被叫方的原始音频信号采用背景音乐Aud_mu2。

2)媒体网关获取与所述原始音频信号相应的至少一个音频效果。

具体地，媒体网关根据来自媒体网关控制装置的音效选择信息，来获取与所述原始音频信号相应的至少一个音频效果。

该实现方式将在后续参照图3所示的实施例中予以详述，此处不再赘述。

优选地，媒体网关可多次接收部分音频信号，并对其进行相应的音效处理，并将处理后的音频信号作为整体，发送至相应的用户设备；或者，媒体网关每获得音频信号，即对其进行相应的音效处理，并将处理后的音频信号发送至相应的用户设备。

根据本发明的方法，可以对会话中的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号。

图3示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理的系统。

根据图3的方法包括由用户设备执行的步骤S21、步骤S22，由媒体网关控制装置执行的步骤S31、步骤S32以及由媒体网关执行的步骤S11′、步骤S12。

在步骤S21中，用户设备确定与一会话相对应的至少一个音频效果。

具体地，所述用户设备确定与一会话相对应的至少一个音频效果的方式包括但不限于以下任一种：

1)根据用户设备中的预定确定规则来确定与会话相对应的至少一个音频效果。其中，所述预定确定规则用于确定与用户设备发起的会话相对应的至少一个音频效果。

优选地，所述预定确定规则基于以下至少任一项信息来确定与所述会话对应的音频效果：

a)会话被呼叫方的相关信息；优选地，所述被呼叫方的相关信息包括以下至少任一项：

i)被呼叫方的姓名；例如，预定确定规则包括与用户“user1”、“user2”对应的咖啡馆场景的场景音效，以及与其他用户对应的演讲效果的人声音效。

ii)被呼叫方所处的地域相关信息；例如，预定确定规则包括与位于A市的被呼叫方对应的公园场景的场景音效，位于B市的被呼叫方对应的背景音乐Aud_mu1以及海边的场景音效等。

iii)被呼叫方所用的设备信息，例如，预定确定规则包括与使用iPhone设备的被呼叫方对应的背景音乐Aud_mu3。

b)时间信息，例如，预定确定规则包括在不同的时间段分别使用的一个或多个的音频效果等。

根据本发明的第一示例，预定确定规则包括在每天18:01～22:00使用模拟咖啡馆场景的场景音效Aud_sc1，以及对人声进行“耳语”效果处理的人声音效Aud_vo1，以及在每天9:01～18:00使用模拟咖啡馆场景的场景音效Aud_sc2，则当发起会话呼叫时，用户设备根据当前时间信息19:30，确定与当前的会话相对应的音频效果包括场景音效Aud_sc1以及人声音效Aud_vo1。

2)用户设备获取用户所选择的至少一个音频效果。

具体地，所述用户设备获取用户所选择的至少一个音频效果的方式包括但不限于以下任一种：

a)用户设备通过已有的应用程序向用户提供一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。

例如，用户设备在用户拨号之前，提示用户“采用以下哪一种音频效果”，并在界面中显示用户可选择的一个或多个音频效果。

b)用户设备获取来自其他设备的一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。

例如，用户拨打声讯电话，则用户设备接收来自相应的服务设备的声讯反馈信息，其中通过语音来提示用户可选择的多个音频效果及其对应的数字编号，则用户设备获取用户所选择相应的数字。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据确定与一会话相对应的至少一个音频效果的实现方式，均应包含在本发明的范围内。

接着，在步骤S22中，用户设备将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。

其中，所述音效选择信息包括至少一个音频效果的音效标识信息。所述音效标识信息包括但不限于任何可用于标识音频效果的信息。例如，各个音频效果的ID，又例如，音频效果的名称信息等。

具体地，所述用户设备可将所述音效选择信息包含于用于发起会话的请求信息中发送至媒体网关控制装置，例如，通过SIP INVIT信息等，或者，用户设备可将所述音效选择信息嵌入于其他符合预定协议的消息中发送至媒体网关控制装置。

接着，在步骤S31中，媒体网关控制装置接收来自用户设备的与一会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。

接着，在步骤S32中，媒体网关控制装置将所述音效选择信息发送至媒体网关。

具体地，所述媒体网关控制装置将所述音效选择信息包含于会话所采用的协议可支持的信息中发送至媒体网关。

例如，当会话采用SIP协议或者H.248协议时，将所述音效选择信息包含于会话描述信息(SDP，Session Description Protocol)中发送至媒体网关。

接着，在步骤S12中，媒体网关获取与所述会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。

具体地，所述媒体网关从来自媒体网关控制装置的信息中提取与所述会话相对应的音效选择信息。

接着，在步骤S11′中，媒体网关采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。

具体地，媒体网关根据所接收到的音效选择信息中所包含的一个或多个音频标识信息，分别获取与所述一个或多个音频标识信息对应的音频效果，并基于所获得的音频效果对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。

继续说明前述第一示例，媒体网关所接收到的音效选择信息包括模拟咖啡馆场景的场景音效Aud_sc1以及对人声进行“耳语”效果处理的人声音效Aud_vo1，则当媒体网关接收到来自呼叫方的原始音频信号时，对该原始音频信号先执行人声音效Aud_vo1以获得耳语效果的音频信号，并在所获得的音频信号上叠加场景音效Aud_sc1的音频信号，以获得最终的音效处理后的音频信号，并将该将音效处理后的音频信号发送至与该原始音频信号所属的会话相对应的被呼叫方的用户设备，相似地，当媒体网关接收到来自会话的被呼叫方的原始音频信号后，对该音频信号同样采用前述场景音效Aud_sc1以及人声音效Aud_vo1进行音效处理，并将处理后的音频信号发送至该会话的呼叫方。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何采用与所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备的实现方式，均应包含在本发明的范围内。

优选地，媒体网关根据预定的音频效果与音频信号的对应关系，来确定用于对原始音频信号进行音效处理的音频效果。例如，预定场景音效对应所有原始音频信号，人声音效对应会话的呼叫方的原始音频信号等。

更优选地，根据本发明的音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，根据本实施例的方法，所述步骤S11′中对所述原始音频信号进行音效处理的步骤进一步包括步骤S1101(图未示)，以及步骤S1102(图未示)。

其中，所述音频标识信息包括可用于标识音频信号的各类信息，优选地，所述音频标识信息包括但不限于以下任一种信息：

1)音频信号ID；

2)音频信号的来源相关信息；其中，所述来源相关信息包括但不限于以下任一项：

a)发送该音频信号的用户设备的标识信息；

b)发送该音频信号的用户的标识信息，例如，该音频信号所对应的来源用户的用户名称，用户号码等。

本领域技术人员应可根据实际情况和需求确定获取所接收到的原始音频信号的音频标识信息的方式，此处不再赘述。

在步骤S1101中，媒体网关根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果。

具体地，媒体网关根据所获得的原始音频信号的音频标识信息，在接收到的音效选择信息中进行匹配查询，以获得与该音频标识信息对应的一个或多个音频效果。

根据本发明的第二示例，媒体网关所获得的音效选择信息如下表1所示：

表1

且媒体网关所获得的原始音频信号的音频标识信息包括“12312345”，则媒体网关在表1中匹配查询并确定与该原始音频信号对应的音效标识信息包括“Aud_sc3，Aud_mu3”。

在步骤S1102中，媒体网关采用所确定的音频效果，对所述原始音频信号进行音效处理。

继续对前述第二示例进行说明，媒体网关采用与所获得的音效标识信息“Aud_sc3，Aud_mu3”对应的音频效果对所述原始音频信号进行音效处理。

根据本优选方案的方法，其中，用户设备在步骤S21中确定与一会话相对应的至少一个音频效果以及与各个音频效果相对应的音频标识信息。

例如，用户设备在获取用户输入的音频效果的音效标识信息时，同时获取与该音效标识信息相对应的音频标识信息如用户号码等。又例如，用户设备中预设与音效标识信息对应的各个用户名称等。

接着，根据本实施例的方法还包括步骤S23(图未示)。

在步骤S23中，用户设备接收由媒体网关处理后的音频信号。

根据本实施例的方法，能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。

图4示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图。根据本发明的系统包括至少一个用户设备2、媒体网关控制装置3以及媒体网关1。优选地，所述用户设备2包括呼叫用户设备以及被叫用户设备。更优选地，所述被叫用户设备可以有多个。

优选地，根据图4所示实施例的用户设备以及媒体网关控制设备可以为现有技术中的用户设备以及媒体网关控制设备。

1)会话发起协议(SIP，Session Initiation Protocol)；

2)H.323协议；

3)H.248协议；

4)综合业务数字网(ISDN，Integrated Services Digital Network)协议。

在该系统中，会话呼叫方的呼叫用户设备2向媒体网关控制装置3发送会话发起请求，例如，当会话采用SIP协议时，用户设备2向媒体网关控制装置3发送SIP INVIT信息。媒体网关控制装置3接收到该信息后，向相应的被叫用户设备2发送与接收到的请求相应的会话发起请求，例如，当媒体网关控制装置3接收到SIP INVIT信息时，向被叫方用户设备2同样发送SIP INVIT信息，并且向媒体网关1发送相应的信息，以使媒体网关1对相应会话的音频信号进行处理。

接着，结合图4说明媒体网关1对所接收到的原始音频信号的处理。

其中，根据本发明的媒体网关1包括音频处理装置11，当媒体网关接收到一会话的原始音频信号时，音频处理装置11对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备2。

其中，所述音频效果包括但不限于以下至少任一项：

1)背景音乐；

其中，音频处理装置11确定与原始音频信号相应的音频效果的方式包括但不限于以下任一种：

1)音频处理装置11根据预定的对应关系来确定与所述原始音频信号相对应的音频效果。

例如，音频处理装置11中预定对于来自会话的呼叫方的原始音频信号采用背景音乐Aud_mu1，对于来自会话的被叫方的原始音频信号采用背景音乐Aud_mu2。

2)音频处理装置11获取与所述原始音频信号相应的至少一个音频效果。

具体地，音频处理装置11根据来自媒体网关控制装置的音效选择信息，来获取与所述原始音频信号相应的至少一个音频效果。

该实现方式将在后续参照图5所示的实施例中予以详述，此处不再赘述。

优选地，音频处理装置11可多次接收部分音频信号，并对其进行相应的音效处理，并将处理后的音频信号作为整体，发送至相应的用户设备；或者，音频处理装置11每获得音频信号，即对其进行相应的音效处理，并将处理后的音频信号发送至相应的用户设备。

根据本发明的方案，可以对会话中的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号。

图5示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理的系统的结构示意图。根据本实施例的系统中，媒体网关1包括获取装置12、音频处理装置11′，用户设备2包括第二确定装置21和第一发送装置22，媒体网关控制装置3包括第二接收装置31以及第二发送装置32。

优选地，根据图5所示实施例的系统中，与呼叫用户设备对应的一个或多个被叫用户设备可以为现有技术中的用户设备。

用户设备2中的第二确定装置21确定与一会话相对应的至少一个音频效果。

具体地，所述第二确定装置21确定与一会话相对应的至少一个音频效果的方式包括但不限于以下任一种：

1)第二确定装置21根据用户设备中的预定确定规则来确定与会话相对应的至少一个音频效果。其中，所述预定确定规则用于确定与用户设备发起的会话相对应的至少一个音频效果。

根据本发明的第一示例，预定确定规则包括在每天18:01～22:00使用模拟咖啡馆场景的场景音效Aud_sc1，以及对人声进行“耳语”效果处理的人声音效Aud_vo1，以及在每天9:01～18:00使用模拟咖啡馆场景的场景音效Aud_sc2，则当发起会话呼叫时，第二确定装置21根据当前时间信息19:30，确定与当前的会话相对应的音频效果包括场景音效Aud_sc1以及人声音效Aud_vo1。

2)第二确定装置21获取用户所选择的至少一个音频效果。

具体地，所述第二确定装置21获取用户所选择的至少一个音频效果的方式包括但不限于以下任一种：

a)第二确定装置21通过已有的应用程序向用户提供一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。

b)第二确定装置21获取来自其他设备的一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。

例如，用户通过用户设备2拨打声讯电话，用户设备2接收来自相应的服务设备的声讯反馈信息，该信息中通过语音来提示用户可选择的多个音频效果及其对应的数字编号，则第二确定装置21获取用户所选择相应的数字。

接着，第一发送装置22将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。

具体地，所述第一发送装置22可将所述音效选择信息包含于用于发起会话的请求信息中发送至媒体网关控制装置，例如，通过SIP INVIT信息等，或者，第一发送装置22可将所述音效选择信息嵌入于其他符合预定协议的消息中发送至媒体网关控制装置。

接着，媒体网关控制装置3中的第二接收装置31接收来自用户设备的与一会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。

接着，媒体网关控制装置3中的第二发送装置32将所述音效选择信息发送至媒体网关。

具体地，所述第二发送装置32将所述音效选择信息包含于会话所采用的协议可支持的信息中发送至媒体网关。

例如，当会话采用SIP协议或者H.248协议时，第二发送装置32将所述音效选择信息包含于会话描述信息(SDP，Session DescriptionProtocol)中发送至媒体网关。

接着，媒体网关1中的获取装置12获取与所述会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。

具体地，获取装置12从来自媒体网关控制装置的信息中提取与所述会话相对应的音效选择信息。

接着，根据本实施例的音频处理装置11′采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。

具体地，音频处理装置11′根据所接收到的音效选择信息中所包含的一个或多个音频标识信息，分别获取与所述一个或多个音频标识信息对应的音频效果，并基于所获得的音频效果对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。

继续说明前述第一示例，获取装置12所接收到的音效选择信息包括模拟咖啡馆场景的场景音效Aud_sc1以及对人声进行“耳语”效果处理的人声音效Aud_vo1，则当媒体网关接收到来自呼叫方的原始音频信号时，音频处理装置11′对该原始音频信号先执行人声音效Aud_vo1以获得耳语效果的音频信号，并在所获得的音频信号上叠加场景音效Aud_sc1的音频信号，以获得最终的音效处理后的音频信号，并将该将音效处理后的音频信号发送至与该原始音频信号所属的会话相对应的被呼叫方的用户设备，相似地，当媒体网关接收到来自会话的被呼叫方的原始音频信号后，音频处理装置11对该音频信号同样采用前述场景音效Aud_sc1以及人声音效Aud_vo1进行音效处理，并将处理后的音频信号发送至该会话的呼叫方。

优选地，音频处理装置11′根据预定的音频效果与音频信号的对应关系，来确定用于对原始音频信号进行音效处理的音频效果。例如，预定场景音效对应所有原始音频信号，人声音效对应会话的呼叫方的原始音频信号等。

更优选地，根据本发明的音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，根据本实施例的音频处理装置11′通过第一确定装置(图未示)以及子处理装置(图未示)对所述原始音频信号进行音效处理。

1)音频信号ID；

a)发送该音频信号的用户设备的标识信息；

第一确定装置根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果。

具体地，第一确定装置根据所获得的原始音频信号的音频标识信息，在接收到的音效选择信息中进行匹配查询，以获得与该音频标识信息对应的一个或多个音频效果。

根据本发明的第二示例，获取装置12所获得的音效选择信息如下表2所示：

表2

且媒体网关1所获得的原始音频信号的音频标识信息包括“12312345”，则第一确定装置在表2中匹配查询并确定与该原始音频信号对应的音效标识信息包括“Aud_sc3，Aud_mu3”。

子处理装置采用所确定的音频效果，对所述原始音频信号进行音效处理。

根据本优选方案的用户设备2中的第二确定装置确定与一会话相对应的至少一个音频效果以及与各个音频效果相对应的音频标识信息。

例如，第二确定装置在获取用户输入的音频效果的音效标识信息时，同时获取与该音效标识信息相对应的音频标识信息如用户号码等。又例如，第二确定装置中预设与音效标识信息对应的各个用户名称等。

接着，根据本实施例的方案用户设备2还包括第一接收装置(图未示)。

第一接收装置接收由媒体网关处理后的音频信号。

根据本实施例的方案，能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种在媒体网关中用于对会话中的语音进行处理的方法，其中，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其中，所述方法还包括以下步骤：

-获取与所述会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；

其中，所述步骤a包括：

-采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将处理后的音频信号发送至所述会话相关的用户设备。

3.根据权利要求2所述的方法，其中，所述音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，所述对所述原始音频信号进行音效处理的步骤包括：

-根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果；

-采用所确定的音频效果，对所述原始音频信号进行音效处理。

4.根据权利要求1至3中任一项所述的方法，其中，所述音频效果包括以下至少任一种：

-背景音乐；

-人声音效；

-场景音效。

5.一种在用户设备中确定对会话中的语音进行处理的方法，其中，所述方法包括以下步骤：

-确定与一会话相对应的至少一个音频效果；

6.根据权利要求5所述的方法，其中，所述方法包括以下步骤：

-接收由媒体网关处理后的音频信号。

7.一种在媒体网关控制装置中辅助对会话的语音进行处理的方法，其中，所述方法包括以下步骤：

-将所述音效选择信息发送至媒体网关。

8.一种对会话中的语音进行处理的媒体网关，其中，所述媒体网关包括：

9.根据权利要求8所述的媒体网关，其中，所述媒体网关还包括：

获取装置，用于获取与所述会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；

其中，所述音频处理装置还用于：

-采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将处理后的音频信号发送所述用户设备。

10.根据权利要求9所述的媒体网关，其中，所述音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，所述音频处理装置通过以下装置对所述原始音频信号进行音效处理：

第一确定装置，用于根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果；

子处理装置，用于采用所确定的音频效果，对所述原始音频信号进行音效处理。

11.根据权利要求8至10中任一项所述的媒体网关，其中，所述音频效果包括以下至少任一种：

-背景音乐；

-人声音效；

-场景音效。

12.一种用于确定对会话中的语音进行处理的用户设备，其中，所述用户设备包括：

13.根据权利要求12所述的用户设备，其中，所述用户设备还包括：

第一接收装置，用于接收由媒体网关处理后的音频信号。

14.一种用于辅助对会话的语音进行处理的媒体网关控制装置，其中，所述媒体网关控制设备包括：

第二发送装置，用于将所述音效选择信息发送至媒体网关。

15.一种通信系统，其中，所述通信系统包括根据权利要求8至10中任一项所述的媒体网关、至少一个根据权利要求10至13中任一项所述的用户设备、以及根据权利要求14所述的媒体网关控制装置。