CN112822183A

CN112822183A - 语音处理的方法、装置、计算机可读存储介质和处理器

Info

Publication number: CN112822183A
Application number: CN202011631199.XA
Authority: CN
Inventors: 李健; 常乐; 陈明; 武卫东
Original assignee: Beijing Sinovoice Technology Co Ltd
Current assignee: Beijing Sinovoice Technology Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-05-18
Anticipated expiration: 2040-12-30
Also published as: CN112822183B

Abstract

本申请提供了一种语音处理的方法、装置、计算机可读存储介质和处理器。该方法包括：接收信息；在信息为第一信息的情况下，将第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，第一信息为移动终端发出的基于mrcp协议的信息；在信息为第二信息的情况下，将第二信息转换为基于mrcp协议的信息，并发送至移动终端，第二信息为智能语音交互系统发出的基于websocket协议的信息。该方法中，使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

Description

语音处理的方法、装置、计算机可读存储介质和处理器

技术领域

本申请涉及智能语音处理领域，具体而言，涉及一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统。

背景技术

目前，在语音识别的应用中，大多数智能外呼或导航产品都采用freeswitch来进行电话系统和智能语音交互系统的连接，以及相关场景功能的传输控制。

但传统的Freeswitch单元在功能上很难扩展，导致语音系统难以满足不同客户和项目的个性化需求。

在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解，因此，背景技术中可能包含某些信息，这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。

发明内容

本申请的主要目的在于提供一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统，以解决现有技术中的语音系统的功能难以扩展的问题。

根据本发明实施例的一个方面，提供了一种语音处理的方法，包括：接收信息；在所述信息为第一信息的情况下，将所述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，所述第一信息为移动终端发出的基于mrcp协议的信息；在所述信息为第二信息的情况下，将所述第二信息转换为基于mrcp协议的信息，并发送至所述移动终端，所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。

可选地，所述方法还包括：在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令，所述预定信息为表征暂停接收语音的信息，所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。

可选地，在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令之后，所述方法还包括：在持续预定时间段未接收到所述第一信息的情况下，向所述智能语音交互系统发出暂停结束指令；接收回复所述第一信息的所述第二信息，所述第二信息为所述智能语音交互系统对所述预定时间段之前接收到所述第一信息的回复信息。

可选地，所述方法还包括：在接收到的所述第二信息为呼叫信息的情况下，获取所述移动终端的当前状态信息并发送至所述智能语音交互系统，所述当前状态信息包括以下至少之一：所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。

根据本发明实施例的另一方面，还提供了一种语音处理的装置，包括：第一接收单元，用于接收信息；第一转换发送单元，用于在所述信息为第一信息的情况下，将所述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，所述第一信息为移动终端发出的基于mrcp协议的信息；第二转换发送单元，用于在所述信息为第二信息的情况下，将所述第二信息转换为基于mrcp协议的信息，并发送至所述移动终端，所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。

可选地，所述装置还包括：第一暂停发送单元，用于在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令，所述预定信息为表征暂停接收语音的信息，所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。

可选地，所述装置还包括：获取发送单元，用于在接收到的所述第二信息为呼叫信息的情况下，获取所述移动终端的当前状态信息并发送至所述智能语音交互系统，所述当前状态信息包括以下至少之一：所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。

根据本发明实施例的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，所述程序执行任意一种所述的方法。

根据本发明实施例的再一方面，还提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行任意一种所述的方法。

根据本发明实施例的另一方面，还提供了一种语音系统，包括移动终端、freeswitch单元、语音处理的装置以及智能语音交互系统，所述语音处理的装置用于执行任意一种所述的方法。

在本发明实施例中，接收的信息共有两种，分别是第一信息和第二信息，第一信息是移动终端发出的基于mrcp协议的信息，将第一信息进行转换，转换为基于websocket协议的信息，转换后的信息发送至智能语音交互系统，智能语音交互系统发出基于websocket协议的信息，即第二信息，将第二信息进行转换，转换为基于mrcp协议的信息，转换后的信息发送至移动终端，该方法中，通过将接收到的不同信息进行转换，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出了根据本申请的实施例的一种语音处理的方法的流程示意图；

图2示出了根据本申请的实施例的一种语音处理的装置的结构示意图；

图3示出了根据本申请的实施例的一种语音系统的结构示意图。

其中，上述附图包括以下附图标记：

11、移动终端；12、freeswitch单元；13、语音处理的装置；14、智能语音交互系统。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应该理解的是，当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时，该元件可直接在该另一元件上，或者也可存在中间元件。而且，在说明书以及权利要求书中，当描述有元件“连接”至另一元件时，该元件可“直接连接”至该另一元件，或者通过第三元件“连接”至该另一元件。

正如背景技术中所说的，现有技术中的语音系统的功能难以扩展，为了解决上述问题，本申请的一种典型的实施方式中，提供了一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统。

根据本申请的实施例，提供了一种语音处理的方法。

图1是根据本申请实施例的语音处理的方法的流程图。如图1所示，该方法包括以下步骤：

步骤S101，接收信息；

步骤S102，在上述信息为第一信息的情况下，将上述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，上述第一信息为移动终端发出的基于mrcp协议的信息；

步骤S103，在上述信息为第二信息的情况下，将上述第二信息转换为基于mrcp协议的信息，并发送至上述移动终端，上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。

上述的方法中，接收的信息共有两种，分别是第一信息和第二信息，第一信息是移动终端发出的基于mrcp协议的信息，将第一信息进行转换，转换为基于websocket协议的信息，转换后的信息发送至智能语音交互系统，智能语音交互系统发出基于websocket协议的信息，即第二信息，将第二信息进行转换，转换为基于mrcp协议的信息，转换后的信息发送至移动终端，该方法中，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

需要说明的是，Freeswitch单元为开源的电话交换平台，可以支持自定义插件的编写。需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请的一种实施例中，上述方法还包括：在接收到的上述第一信息包括预定信息的情况下，向上述智能语音交互系统发出暂停指令，上述预定信息为表征暂停接收语音的信息，上述暂停指令用于控制上述智能语音交互系统暂停发出上述第二信息。该实施例中，通过发出的暂停指令，可以控制智能语音交互系统暂停发出第二信息，例如，可以暂停机器人根据之前用户的语音进行回复，使得用户在想要打断机器人说话时，机器人可以暂停说话，使得用户的体验性较好。

需要说明的是，预定信息可以为“停止说话”、“暂停播报”或者“请不要讲话”等等，当然，还可以为其他的预定信息，本领域技术人员可以根据实际情况选择合适的预定信息。

本申请的再一种实施例中，在接收到的上述第一信息包括预定信息的情况下，向上述智能语音交互系统发出暂停指令之后，上述方法还包括：在持续预定时间段未接收到上述第一信息的情况下，向上述智能语音交互系统发出暂停结束指令；接收回复上述第一信息的上述第二信息，上述第二信息为上述智能语音交互系统对上述预定时间段之前接收到上述第一信息的回复信息。该实施例中，可以在智能语音交互系统暂停之后进行恢复，例如，用户在打断机器人说话之后，用户在预定时间段内未说话，机器人可以根据之前用户的语音进行回复，进一步提高了用户的体验效果。

需要说明的是，预定时间段可以为10s，还可以为20S，还可以为30S，当然，还可以为其他的预定时间段，本领域技术人员可以根据实际情况选择合适的预定时间段。

本申请的又一种实施例中，上述方法还包括：在接收到的上述第二信息为呼叫信息的情况下，获取上述移动终端的当前状态信息并发送至上述智能语音交互系统，上述当前状态信息包括以下至少之一：上述移动终端是否开机的状态信息、上述移动终端是否占线的状态信息、上述移动终端当前的彩铃信息。该实施例中，将移动终端的当前状态信息发送至智能语音交互系统，智能语音交互系统根据这些信息进行进行下一步的决策，比如，当前移动终端处于关机状态，那么控制语音交互系统在第一预定时长之后，再呼叫该移动终端，如果当前移动终端处于占线状态，那么控制语音交互系统在第二预定时长之后，再呼叫该移动终端，其中第一预定时长大于第二预定时长。

并且，上述的方案的服务配置如表1所示，其具体实现的功能如表2所示，

表1

表2

本申请实施例还提供了一种语音处理的装置，需要说明的是，本申请实施例的语音处理的装置可以用于执行本申请实施例所提供的用于语音处理的方法。以下对本申请实施例提供的语音处理的装置进行介绍。

图2是根据本申请实施例的语音处理的装置的示意图。如图2所示，该装置包括：

第一接收单元10，用于接收信息；

第一转换发送单元20，用于在上述信息为第一信息的情况下，将上述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，上述第一信息为移动终端发出的基于mrcp协议的信息；

第二转换发送单元30，用于在上述信息为第二信息的情况下，将上述第二信息转换为基于mrcp协议的信息，并发送至上述移动终端，上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。

上述的装置中，接收单元接收的信息共有两种，分别是第一信息和第二信息，第一信息是移动终端发出的基于mrcp协议的信息，第一转换发送单元将第一信息进行转换，转换为基于websocket协议的信息，转换后的信息发送至智能语音交互系统，智能语音交互系统发出基于websocket协议的信息，即第二信息，第二转换发送单元将第二信息进行转换，转换为基于mrcp协议的信息，转换后的信息发送至移动终端，该装置中，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

本申请的一种实施例中，上述装置还包括第一暂停发送单元，第一暂停发送单元用于在接收到的上述第一信息包括预定信息的情况下，向上述智能语音交互系统发出暂停指令，上述预定信息为表征暂停接收语音的信息，上述暂停指令用于控制上述智能语音交互系统暂停发出上述第二信息。该实施例中，通过发出的暂停指令，可以控制智能语音交互系统暂停发出第二信息，例如，可以暂停机器人根据之前用户的语音进行回复，使得用户在想要打断机器人说话时，机器人可以暂停说话，使得用户的体验性较好。

本申请的再一种实施例中，上述装置还包括第二暂停发送单元和第二接收单元，第二暂停发送单元用于在接收到的上述第一信息包括预定信息的情况下，向上述智能语音交互系统发出暂停指令之后，在持续预定时间段未接收到上述第一信息的情况下，向上述智能语音交互系统发出暂停结束指令；第二接收单元用于接收回复上述第一信息的上述第二信息，上述第二信息为上述智能语音交互系统对上述预定时间段之前接收到上述第一信息的回复信息。该实施例中，可以在智能语音交互系统暂停之后进行恢复，例如，用户在打断机器人说话之后，用户在预定时间段内未说话，机器人可以根据之前用户的语音进行回复，进一步提高了用户的体验效果。

本申请的又一种实施例中，上述装置还包括获取发送单元，获取发送单元用于在接收到的上述第二信息为呼叫信息的情况下，获取上述移动终端的当前状态信息并发送至上述智能语音交互系统，上述当前状态信息包括以下至少之一：上述移动终端是否开机的状态信息、上述移动终端是否占线的状态信息、上述移动终端当前的彩铃信息。该实施例中，将移动终端的当前状态信息发送至智能语音交互系统，智能语音交互系统根据这些信息进行进行下一步的决策，比如，当前移动终端处于关机状态，那么控制语音交互系统在第一预定时长之后，再呼叫该移动终端，如果当前移动终端处于占线状态，那么控制语音交互系统在第二预定时长之后，再呼叫该移动终端，其中第一预定时长大于第二预定时长。

并且，上述的装置的服务配置如上表1所示，其具体实现的功能如上表2所示，

具体地，上述的装置提供实现上述功能的相关接口参数说明如下：

1、呼叫应答

1.1描述

语音处理的装置监听或接受到Freeswitch单元的接通通话事件，由语音处理的装置将通话接通事件回传到智能语音交互系统。

1.2调用方式

由语音处理的装置主动向智能语音交互系统回写接通通话事件消息。

1.3消息定义，如表3所示，

表3

2、语音传输

2.1描述

语音处理的装置监听或接受到Freeswitch单元的通话语音流，再由语音处理的装置回传到智能语音交互系统；或是智能语音交互系统回复用户语音，通过语音处理的装置调用Freeswitch单元转发语音流到用户。

2.2调用方式

由语音处理的装置主动向智能语音交互系统回写通话语音数据，由智能语音交互系统主动向语音处理的装置写通话语音数据。

2.3消息定义

二进制响铃语音流。

3、挂机时间回存

3.1描述

语音处理的装置监听或接受到Freeswitch单元的用户挂机事件，由语音处理的装置将用户挂机事件回传到智能语音交互系统，或智能语音交互系统向语音处理的装置请求挂机，Freeswitch单元执行挂机操作。

3.2调用方式

语音处理的装置和智能语音交互系统双方皆可发送结束通话。

3.3消息定义，如表4所示，

表4

参数名称	类型	是否必须	描述
				action	String	是	通话控制标识(CALL_HANGUP:挂机)
callId	String	是	通话唯一ID
				type	String	是	挂机方User/ROBOT
timestamps	long	是	挂机时间(时间戳，毫秒)

4、转发DTMF

4.1描述

机器人向用户发送DTMF数据，由智能语音交互系统(实时呼叫服务)发送给语音处理的装置，Freeswitch单元转发给用户。

4.2调用方式

由智能语音交互系统主动向语音处理的装置发起。

4.3消息定义，如表5所示，

表5

参数名称	类型	是否必须	描述
				action	String	是	通话控制标识(CALL_ACCEPT:来电)
callId	String	是	通话唯一ID
				dtmf	String	是	DTMF数据内容
timestamps	long	是	时间戳，毫秒

5、通话回调

5.1描述

语音处理的装置向智能语音交互系统请求异常/通话结束回调，请求方式为HTTP。

5.2调用方式

由语音处理的装置向智能语音交互系统发起回调(HTTP接口)。

5.3消息定义，如表6所示，

表6

参数名称	类型	是否必须	描述
				action	String	是	通话控制标识(CALL_CALLBACK:通话回调)
callId	String	是	通话唯一ID
				code	String	是	返回码
message	String	是	返回消息
				timestamps	long	是	时间戳，毫秒

6、按键消息传输

6.1描述

语音处理的装置向智能语音交互系统发送，转发用户的按键事件。

6.2调用方式

由语音处理的装置向智能语音交互系统发起。

6.3消息定义，如表7所示，

表7

参数名称	类型	是否必须	描述
				action	String	是	通话控制标识(CALL_DTMF:按键)
callId	String	是	通话唯一ID
				content	String	是	按键内容
timestamps	long	是	时间戳，毫秒

本申请还提供了一种语音系统，如图3所示，该系统包括移动终端11、freeswitch单元12、语音处理的装置13以及智能语音交互系统14，上述语音处理的装置13用于执行任意一种上述的方法。

上述的系统中，由于包括了任意一种上述的语音处理的方法，通过将接收到的不同信息进行转换，可以将一个协议的信息转换为另一个协议的信息，进而使得Freeswitch单元的功能可以扩展，从而解决了Freeswitch单元难以扩展的问题。

上述语音处理的装置包括处理器和存储器，上述第一接收单元、第一转换发送单元和第二转换发送单元等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来使得Freeswitch单元可以扩展。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现上述语音处理的方法。

本发明实施例提供了一种处理器，上述处理器用于运行程序，其中，上述程序运行时执行上述语音处理的方法。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现至少以下步骤：

步骤S101，接收信息；

本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有至少如下方法步骤的程序：

步骤S101，接收信息；

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

从以上的描述中，可以看出，本申请上述的实施例实现了如下技术效果：

1)、本申请的语音处理的方法，接收的信息共有两种，分别是第一信息和第二信息，第一信息是移动终端发出的基于mrcp协议的信息，将第一信息进行转换，转换为基于websocket协议的信息，转换后的信息发送至智能语音交互系统，智能语音交互系统发出基于websocket协议的信息，即第二信息，将第二信息进行转换，转换为基于mrcp协议的信息，转换后的信息发送至移动终端，该方法中，通过将接收到的不同信息进行转换，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

2)、本申请的语音处理的装置，接收单元接收的信息共有两种，分别是第一信息和第二信息，第一信息是移动终端发出的基于mrcp协议的信息，第一转换发送单元将第一信息进行转换，转换为基于websocket协议的信息，转换后的信息发送至智能语音交互系统，智能语音交互系统发出基于websocket协议的信息，即第二信息，第二转换发送单元将第二信息进行转换，转换为基于mrcp协议的信息，转换后的信息发送至移动终端，该装置中，通过将接收到的不同信息进行转换，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

3)、本申请的语音系统，由于包括了任意一种上述的语音处理的方法，通过将接收到的不同信息进行转换，可以将基于mrcp协议的信息基于websocket协议的信息相互转换，这样就使得基于websocket协议的信息可以进行其他方式的处理，即可以实现功能的扩展，解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种语音处理的方法，其特征在于，包括：

接收信息；

在所述信息为第一信息的情况下，将所述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，所述第一信息为移动终端发出的基于mrcp协议的信息；

在所述信息为第二信息的情况下，将所述第二信息转换为基于mrcp协议的信息，并发送至所述移动终端，所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令，所述预定信息为表征暂停接收语音的信息，所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。

3.根据权利要求2所述的方法，其特征在于，在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令之后，所述方法还包括：

在持续预定时间段未接收到所述第一信息的情况下，向所述智能语音交互系统发出暂停结束指令；

接收回复所述第一信息的所述第二信息，所述第二信息为所述智能语音交互系统对所述预定时间段之前接收到所述第一信息的回复信息。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

在接收到的所述第二信息为呼叫信息的情况下，获取所述移动终端的当前状态信息并发送至所述智能语音交互系统，所述当前状态信息包括以下至少之一：所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。

5.一种语音处理的装置，其特征在于，包括：

第一接收单元，用于接收信息；

第一转换发送单元，用于在所述信息为第一信息的情况下，将所述第一信息转换为基于websocket协议的信息，并发送至智能语音交互系统，所述第一信息为移动终端发出的基于mrcp协议的信息；

第二转换发送单元，用于在所述信息为第二信息的情况下，将所述第二信息转换为基于mrcp协议的信息，并发送至所述移动终端，所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

第一暂停发送单元，用于在接收到的所述第一信息包括预定信息的情况下，向所述智能语音交互系统发出暂停指令，所述预定信息为表征暂停接收语音的信息，所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。

7.根据权利要求5所述的装置，其特征在于，所述装置还包括：

获取发送单元，用于在接收到的所述第二信息为呼叫信息的情况下，获取所述移动终端的当前状态信息并发送至所述智能语音交互系统，所述当前状态信息包括以下至少之一：所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，所述程序执行权利要求1至4中任意一项所述的方法。

9.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至4中任意一项所述的方法。

10.一种语音系统，其特征在于，包括移动终端、freeswitch单元、语音处理的装置以及智能语音交互系统，所述语音处理的装置用于执行权利要求1至4中任意一项所述的方法。