CN112822183A - 语音处理的方法、装置、计算机可读存储介质和处理器 - Google Patents

语音处理的方法、装置、计算机可读存储介质和处理器 Download PDF

Info

Publication number
CN112822183A
CN112822183A CN202011631199.XA CN202011631199A CN112822183A CN 112822183 A CN112822183 A CN 112822183A CN 202011631199 A CN202011631199 A CN 202011631199A CN 112822183 A CN112822183 A CN 112822183A
Authority
CN
China
Prior art keywords
information
voice interaction
interaction system
mobile terminal
intelligent voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011631199.XA
Other languages
English (en)
Other versions
CN112822183B (zh
Inventor
李健
常乐
陈明
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinovoice Technology Co Ltd
Original Assignee
Beijing Sinovoice Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinovoice Technology Co Ltd filed Critical Beijing Sinovoice Technology Co Ltd
Priority to CN202011631199.XA priority Critical patent/CN112822183B/zh
Publication of CN112822183A publication Critical patent/CN112822183A/zh
Application granted granted Critical
Publication of CN112822183B publication Critical patent/CN112822183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/08Protocols for interworking; Protocol conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/161Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields
    • H04L69/162Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields involving adaptations of sockets based mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/26Special purpose or proprietary protocols or architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供了一种语音处理的方法、装置、计算机可读存储介质和处理器。该方法包括:接收信息;在信息为第一信息的情况下,将第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,第一信息为移动终端发出的基于mrcp协议的信息;在信息为第二信息的情况下,将第二信息转换为基于mrcp协议的信息,并发送至移动终端,第二信息为智能语音交互系统发出的基于websocket协议的信息。该方法中,使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。

Description

语音处理的方法、装置、计算机可读存储介质和处理器
技术领域
本申请涉及智能语音处理领域,具体而言,涉及一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统。
背景技术
目前,在语音识别的应用中,大多数智能外呼或导航产品都采用freeswitch来进行电话系统和智能语音交互系统的连接,以及相关场景功能的传输控制。
但传统的Freeswitch单元在功能上很难扩展,导致语音系统难以满足不同客户和项目的个性化需求。
在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解,因此,背景技术中可能包含某些信息,这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。
发明内容
本申请的主要目的在于提供一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统,以解决现有技术中的语音系统的功能难以扩展的问题。
根据本发明实施例的一个方面,提供了一种语音处理的方法,包括:接收信息;在所述信息为第一信息的情况下,将所述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,所述第一信息为移动终端发出的基于mrcp协议的信息;在所述信息为第二信息的情况下,将所述第二信息转换为基于mrcp协议的信息,并发送至所述移动终端,所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。
可选地,所述方法还包括:在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令,所述预定信息为表征暂停接收语音的信息,所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。
可选地,在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令之后,所述方法还包括:在持续预定时间段未接收到所述第一信息的情况下,向所述智能语音交互系统发出暂停结束指令;接收回复所述第一信息的所述第二信息,所述第二信息为所述智能语音交互系统对所述预定时间段之前接收到所述第一信息的回复信息。
可选地,所述方法还包括:在接收到的所述第二信息为呼叫信息的情况下,获取所述移动终端的当前状态信息并发送至所述智能语音交互系统,所述当前状态信息包括以下至少之一:所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。
根据本发明实施例的另一方面,还提供了一种语音处理的装置,包括:第一接收单元,用于接收信息;第一转换发送单元,用于在所述信息为第一信息的情况下,将所述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,所述第一信息为移动终端发出的基于mrcp协议的信息;第二转换发送单元,用于在所述信息为第二信息的情况下,将所述第二信息转换为基于mrcp协议的信息,并发送至所述移动终端,所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。
可选地,所述装置还包括:第一暂停发送单元,用于在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令,所述预定信息为表征暂停接收语音的信息,所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。
可选地,所述装置还包括:获取发送单元,用于在接收到的所述第二信息为呼叫信息的情况下,获取所述移动终端的当前状态信息并发送至所述智能语音交互系统,所述当前状态信息包括以下至少之一:所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。
根据本发明实施例的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行任意一种所述的方法。
根据本发明实施例的再一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的方法。
根据本发明实施例的另一方面,还提供了一种语音系统,包括移动终端、freeswitch单元、语音处理的装置以及智能语音交互系统,所述语音处理的装置用于执行任意一种所述的方法。
在本发明实施例中,接收的信息共有两种,分别是第一信息和第二信息,第一信息是移动终端发出的基于mrcp协议的信息,将第一信息进行转换,转换为基于websocket协议的信息,转换后的信息发送至智能语音交互系统,智能语音交互系统发出基于websocket协议的信息,即第二信息,将第二信息进行转换,转换为基于mrcp协议的信息,转换后的信息发送至移动终端,该方法中,通过将接收到的不同信息进行转换,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请的实施例的一种语音处理的方法的流程示意图;
图2示出了根据本申请的实施例的一种语音处理的装置的结构示意图;
图3示出了根据本申请的实施例的一种语音系统的结构示意图。
其中,上述附图包括以下附图标记:
11、移动终端;12、freeswitch单元;13、语音处理的装置;14、智能语音交互系统。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
正如背景技术中所说的,现有技术中的语音系统的功能难以扩展,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种语音处理的方法、装置、计算机可读存储介质、处理器和语音系统。
根据本申请的实施例,提供了一种语音处理的方法。
图1是根据本申请实施例的语音处理的方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,接收信息;
步骤S102,在上述信息为第一信息的情况下,将上述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,上述第一信息为移动终端发出的基于mrcp协议的信息;
步骤S103,在上述信息为第二信息的情况下,将上述第二信息转换为基于mrcp协议的信息,并发送至上述移动终端,上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。
上述的方法中,接收的信息共有两种,分别是第一信息和第二信息,第一信息是移动终端发出的基于mrcp协议的信息,将第一信息进行转换,转换为基于websocket协议的信息,转换后的信息发送至智能语音交互系统,智能语音交互系统发出基于websocket协议的信息,即第二信息,将第二信息进行转换,转换为基于mrcp协议的信息,转换后的信息发送至移动终端,该方法中,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
需要说明的是,Freeswitch单元为开源的电话交换平台,可以支持自定义插件的编写。需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请的一种实施例中,上述方法还包括:在接收到的上述第一信息包括预定信息的情况下,向上述智能语音交互系统发出暂停指令,上述预定信息为表征暂停接收语音的信息,上述暂停指令用于控制上述智能语音交互系统暂停发出上述第二信息。该实施例中,通过发出的暂停指令,可以控制智能语音交互系统暂停发出第二信息,例如,可以暂停机器人根据之前用户的语音进行回复,使得用户在想要打断机器人说话时,机器人可以暂停说话,使得用户的体验性较好。
需要说明的是,预定信息可以为“停止说话”、“暂停播报”或者“请不要讲话”等等,当然,还可以为其他的预定信息,本领域技术人员可以根据实际情况选择合适的预定信息。
本申请的再一种实施例中,在接收到的上述第一信息包括预定信息的情况下,向上述智能语音交互系统发出暂停指令之后,上述方法还包括:在持续预定时间段未接收到上述第一信息的情况下,向上述智能语音交互系统发出暂停结束指令;接收回复上述第一信息的上述第二信息,上述第二信息为上述智能语音交互系统对上述预定时间段之前接收到上述第一信息的回复信息。该实施例中,可以在智能语音交互系统暂停之后进行恢复,例如,用户在打断机器人说话之后,用户在预定时间段内未说话,机器人可以根据之前用户的语音进行回复,进一步提高了用户的体验效果。
需要说明的是,预定时间段可以为10s,还可以为20S,还可以为30S,当然,还可以为其他的预定时间段,本领域技术人员可以根据实际情况选择合适的预定时间段。
本申请的又一种实施例中,上述方法还包括:在接收到的上述第二信息为呼叫信息的情况下,获取上述移动终端的当前状态信息并发送至上述智能语音交互系统,上述当前状态信息包括以下至少之一:上述移动终端是否开机的状态信息、上述移动终端是否占线的状态信息、上述移动终端当前的彩铃信息。该实施例中,将移动终端的当前状态信息发送至智能语音交互系统,智能语音交互系统根据这些信息进行进行下一步的决策,比如,当前移动终端处于关机状态,那么控制语音交互系统在第一预定时长之后,再呼叫该移动终端,如果当前移动终端处于占线状态,那么控制语音交互系统在第二预定时长之后,再呼叫该移动终端,其中第一预定时长大于第二预定时长。
并且,上述的方案的服务配置如表1所示,其具体实现的功能如表2所示,
表1
Figure BDA0002876563410000051
表2
Figure BDA0002876563410000052
Figure BDA0002876563410000061
本申请实施例还提供了一种语音处理的装置,需要说明的是,本申请实施例的语音处理的装置可以用于执行本申请实施例所提供的用于语音处理的方法。以下对本申请实施例提供的语音处理的装置进行介绍。
图2是根据本申请实施例的语音处理的装置的示意图。如图2所示,该装置包括:
第一接收单元10,用于接收信息;
第一转换发送单元20,用于在上述信息为第一信息的情况下,将上述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,上述第一信息为移动终端发出的基于mrcp协议的信息;
第二转换发送单元30,用于在上述信息为第二信息的情况下,将上述第二信息转换为基于mrcp协议的信息,并发送至上述移动终端,上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。
上述的装置中,接收单元接收的信息共有两种,分别是第一信息和第二信息,第一信息是移动终端发出的基于mrcp协议的信息,第一转换发送单元将第一信息进行转换,转换为基于websocket协议的信息,转换后的信息发送至智能语音交互系统,智能语音交互系统发出基于websocket协议的信息,即第二信息,第二转换发送单元将第二信息进行转换,转换为基于mrcp协议的信息,转换后的信息发送至移动终端,该装置中,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
本申请的一种实施例中,上述装置还包括第一暂停发送单元,第一暂停发送单元用于在接收到的上述第一信息包括预定信息的情况下,向上述智能语音交互系统发出暂停指令,上述预定信息为表征暂停接收语音的信息,上述暂停指令用于控制上述智能语音交互系统暂停发出上述第二信息。该实施例中,通过发出的暂停指令,可以控制智能语音交互系统暂停发出第二信息,例如,可以暂停机器人根据之前用户的语音进行回复,使得用户在想要打断机器人说话时,机器人可以暂停说话,使得用户的体验性较好。
需要说明的是,预定信息可以为“停止说话”、“暂停播报”或者“请不要讲话”等等,当然,还可以为其他的预定信息,本领域技术人员可以根据实际情况选择合适的预定信息。
本申请的再一种实施例中,上述装置还包括第二暂停发送单元和第二接收单元,第二暂停发送单元用于在接收到的上述第一信息包括预定信息的情况下,向上述智能语音交互系统发出暂停指令之后,在持续预定时间段未接收到上述第一信息的情况下,向上述智能语音交互系统发出暂停结束指令;第二接收单元用于接收回复上述第一信息的上述第二信息,上述第二信息为上述智能语音交互系统对上述预定时间段之前接收到上述第一信息的回复信息。该实施例中,可以在智能语音交互系统暂停之后进行恢复,例如,用户在打断机器人说话之后,用户在预定时间段内未说话,机器人可以根据之前用户的语音进行回复,进一步提高了用户的体验效果。
需要说明的是,预定时间段可以为10s,还可以为20S,还可以为30S,当然,还可以为其他的预定时间段,本领域技术人员可以根据实际情况选择合适的预定时间段。
本申请的又一种实施例中,上述装置还包括获取发送单元,获取发送单元用于在接收到的上述第二信息为呼叫信息的情况下,获取上述移动终端的当前状态信息并发送至上述智能语音交互系统,上述当前状态信息包括以下至少之一:上述移动终端是否开机的状态信息、上述移动终端是否占线的状态信息、上述移动终端当前的彩铃信息。该实施例中,将移动终端的当前状态信息发送至智能语音交互系统,智能语音交互系统根据这些信息进行进行下一步的决策,比如,当前移动终端处于关机状态,那么控制语音交互系统在第一预定时长之后,再呼叫该移动终端,如果当前移动终端处于占线状态,那么控制语音交互系统在第二预定时长之后,再呼叫该移动终端,其中第一预定时长大于第二预定时长。
并且,上述的装置的服务配置如上表1所示,其具体实现的功能如上表2所示,
具体地,上述的装置提供实现上述功能的相关接口参数说明如下:
1、呼叫应答
1.1描述
语音处理的装置监听或接受到Freeswitch单元的接通通话事件,由语音处理的装置将通话接通事件回传到智能语音交互系统。
1.2调用方式
由语音处理的装置主动向智能语音交互系统回写接通通话事件消息。
1.3消息定义,如表3所示,
表3
Figure BDA0002876563410000071
Figure BDA0002876563410000081
2、语音传输
2.1描述
语音处理的装置监听或接受到Freeswitch单元的通话语音流,再由语音处理的装置回传到智能语音交互系统;或是智能语音交互系统回复用户语音,通过语音处理的装置调用Freeswitch单元转发语音流到用户。
2.2调用方式
由语音处理的装置主动向智能语音交互系统回写通话语音数据,由智能语音交互系统主动向语音处理的装置写通话语音数据。
2.3消息定义
二进制响铃语音流。
3、挂机时间回存
3.1描述
语音处理的装置监听或接受到Freeswitch单元的用户挂机事件,由语音处理的装置将用户挂机事件回传到智能语音交互系统,或智能语音交互系统向语音处理的装置请求挂机,Freeswitch单元执行挂机操作。
3.2调用方式
语音处理的装置和智能语音交互系统双方皆可发送结束通话。
3.3消息定义,如表4所示,
表4
参数名称 类型 是否必须 描述
action String 通话控制标识(CALL_HANGUP:挂机)
callId String 通话唯一ID
type String 挂机方User/ROBOT
timestamps long 挂机时间(时间戳,毫秒)
4、转发DTMF
4.1描述
机器人向用户发送DTMF数据,由智能语音交互系统(实时呼叫服务)发送给语音处理的装置,Freeswitch单元转发给用户。
4.2调用方式
由智能语音交互系统主动向语音处理的装置发起。
4.3消息定义,如表5所示,
表5
参数名称 类型 是否必须 描述
action String 通话控制标识(CALL_ACCEPT:来电)
callId String 通话唯一ID
dtmf String DTMF数据内容
timestamps long 时间戳,毫秒
5、通话回调
5.1描述
语音处理的装置向智能语音交互系统请求异常/通话结束回调,请求方式为HTTP。
5.2调用方式
由语音处理的装置向智能语音交互系统发起回调(HTTP接口)。
5.3消息定义,如表6所示,
表6
参数名称 类型 是否必须 描述
action String 通话控制标识(CALL_CALLBACK:通话回调)
callId String 通话唯一ID
code String 返回码
message String 返回消息
timestamps long 时间戳,毫秒
6、按键消息传输
6.1描述
语音处理的装置向智能语音交互系统发送,转发用户的按键事件。
6.2调用方式
由语音处理的装置向智能语音交互系统发起。
6.3消息定义,如表7所示,
表7
参数名称 类型 是否必须 描述
action String 通话控制标识(CALL_DTMF:按键)
callId String 通话唯一ID
content String 按键内容
timestamps long 时间戳,毫秒
本申请还提供了一种语音系统,如图3所示,该系统包括移动终端11、freeswitch单元12、语音处理的装置13以及智能语音交互系统14,上述语音处理的装置13用于执行任意一种上述的方法。
上述的系统中,由于包括了任意一种上述的语音处理的方法,通过将接收到的不同信息进行转换,可以将一个协议的信息转换为另一个协议的信息,进而使得Freeswitch单元的功能可以扩展,从而解决了Freeswitch单元难以扩展的问题。
上述语音处理的装置包括处理器和存储器,上述第一接收单元、第一转换发送单元和第二转换发送单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来使得Freeswitch单元可以扩展。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述语音处理的方法。
本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述语音处理的方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤S101,接收信息;
步骤S102,在上述信息为第一信息的情况下,将上述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,上述第一信息为移动终端发出的基于mrcp协议的信息;
步骤S103,在上述信息为第二信息的情况下,将上述第二信息转换为基于mrcp协议的信息,并发送至上述移动终端,上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤S101,接收信息;
步骤S102,在上述信息为第一信息的情况下,将上述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,上述第一信息为移动终端发出的基于mrcp协议的信息;
步骤S103,在上述信息为第二信息的情况下,将上述第二信息转换为基于mrcp协议的信息,并发送至上述移动终端,上述第二信息为上述智能语音交互系统发出的基于websocket协议的信息。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的语音处理的方法,接收的信息共有两种,分别是第一信息和第二信息,第一信息是移动终端发出的基于mrcp协议的信息,将第一信息进行转换,转换为基于websocket协议的信息,转换后的信息发送至智能语音交互系统,智能语音交互系统发出基于websocket协议的信息,即第二信息,将第二信息进行转换,转换为基于mrcp协议的信息,转换后的信息发送至移动终端,该方法中,通过将接收到的不同信息进行转换,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
2)、本申请的语音处理的装置,接收单元接收的信息共有两种,分别是第一信息和第二信息,第一信息是移动终端发出的基于mrcp协议的信息,第一转换发送单元将第一信息进行转换,转换为基于websocket协议的信息,转换后的信息发送至智能语音交互系统,智能语音交互系统发出基于websocket协议的信息,即第二信息,第二转换发送单元将第二信息进行转换,转换为基于mrcp协议的信息,转换后的信息发送至移动终端,该装置中,通过将接收到的不同信息进行转换,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
3)、本申请的语音系统,由于包括了任意一种上述的语音处理的方法,通过将接收到的不同信息进行转换,可以将基于mrcp协议的信息基于websocket协议的信息相互转换,这样就使得基于websocket协议的信息可以进行其他方式的处理,即可以实现功能的扩展,解决了现有技术中的Freeswitch单元无法随意更改而导致语音交互过程中的功能难以扩展的问题。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种语音处理的方法,其特征在于,包括:
接收信息;
在所述信息为第一信息的情况下,将所述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,所述第一信息为移动终端发出的基于mrcp协议的信息;
在所述信息为第二信息的情况下,将所述第二信息转换为基于mrcp协议的信息,并发送至所述移动终端,所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令,所述预定信息为表征暂停接收语音的信息,所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。
3.根据权利要求2所述的方法,其特征在于,在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令之后,所述方法还包括:
在持续预定时间段未接收到所述第一信息的情况下,向所述智能语音交互系统发出暂停结束指令;
接收回复所述第一信息的所述第二信息,所述第二信息为所述智能语音交互系统对所述预定时间段之前接收到所述第一信息的回复信息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
在接收到的所述第二信息为呼叫信息的情况下,获取所述移动终端的当前状态信息并发送至所述智能语音交互系统,所述当前状态信息包括以下至少之一:所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。
5.一种语音处理的装置,其特征在于,包括:
第一接收单元,用于接收信息;
第一转换发送单元,用于在所述信息为第一信息的情况下,将所述第一信息转换为基于websocket协议的信息,并发送至智能语音交互系统,所述第一信息为移动终端发出的基于mrcp协议的信息;
第二转换发送单元,用于在所述信息为第二信息的情况下,将所述第二信息转换为基于mrcp协议的信息,并发送至所述移动终端,所述第二信息为所述智能语音交互系统发出的基于websocket协议的信息。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一暂停发送单元,用于在接收到的所述第一信息包括预定信息的情况下,向所述智能语音交互系统发出暂停指令,所述预定信息为表征暂停接收语音的信息,所述暂停指令用于控制所述智能语音交互系统暂停发出所述第二信息。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
获取发送单元,用于在接收到的所述第二信息为呼叫信息的情况下,获取所述移动终端的当前状态信息并发送至所述智能语音交互系统,所述当前状态信息包括以下至少之一:所述移动终端是否开机的状态信息、所述移动终端是否占线的状态信息、所述移动终端当前的彩铃信息。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,所述程序执行权利要求1至4中任意一项所述的方法。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的方法。
10.一种语音系统,其特征在于,包括移动终端、freeswitch单元、语音处理的装置以及智能语音交互系统,所述语音处理的装置用于执行权利要求1至4中任意一项所述的方法。
CN202011631199.XA 2020-12-30 2020-12-30 语音处理的方法、装置、计算机可读存储介质和处理器 Active CN112822183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011631199.XA CN112822183B (zh) 2020-12-30 2020-12-30 语音处理的方法、装置、计算机可读存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011631199.XA CN112822183B (zh) 2020-12-30 2020-12-30 语音处理的方法、装置、计算机可读存储介质和处理器

Publications (2)

Publication Number Publication Date
CN112822183A true CN112822183A (zh) 2021-05-18
CN112822183B CN112822183B (zh) 2023-08-22

Family

ID=75855201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011631199.XA Active CN112822183B (zh) 2020-12-30 2020-12-30 语音处理的方法、装置、计算机可读存储介质和处理器

Country Status (1)

Country Link
CN (1) CN112822183B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114285830A (zh) * 2021-12-21 2022-04-05 北京百度网讯科技有限公司 语音信号处理方法、装置、电子设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101322385A (zh) * 2005-12-12 2008-12-10 国际商业机器公司 对媒体服务器中的分布式媒体资源进行负载平衡和切换
US20080309750A1 (en) * 2005-06-10 2008-12-18 Lingjun Feng Method for Processing the Video Telephone Calling Based on the Mobile Communication Network
CN104010058A (zh) * 2014-06-05 2014-08-27 北京百纳威尔科技有限公司 自动呼叫方法及装置
CN105357408A (zh) * 2015-10-16 2016-02-24 国家电网公司 电网语音系统的通信检测方法和装置
CN108011961A (zh) * 2017-12-07 2018-05-08 携程旅游信息技术(上海)有限公司 基于混合云服务的语音交互系统
CN110557451A (zh) * 2019-08-30 2019-12-10 北京百度网讯科技有限公司 对话交互处理方法、装置、电子设备和存储介质
CN111402906A (zh) * 2020-03-06 2020-07-10 深圳前海微众银行股份有限公司 语音解码方法、装置、引擎及存储介质
CN112085266A (zh) * 2020-08-28 2020-12-15 云粒智慧科技有限公司 一种政务数据处理方法、装置、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080309750A1 (en) * 2005-06-10 2008-12-18 Lingjun Feng Method for Processing the Video Telephone Calling Based on the Mobile Communication Network
CN101322385A (zh) * 2005-12-12 2008-12-10 国际商业机器公司 对媒体服务器中的分布式媒体资源进行负载平衡和切换
CN104010058A (zh) * 2014-06-05 2014-08-27 北京百纳威尔科技有限公司 自动呼叫方法及装置
CN105357408A (zh) * 2015-10-16 2016-02-24 国家电网公司 电网语音系统的通信检测方法和装置
CN108011961A (zh) * 2017-12-07 2018-05-08 携程旅游信息技术(上海)有限公司 基于混合云服务的语音交互系统
CN110557451A (zh) * 2019-08-30 2019-12-10 北京百度网讯科技有限公司 对话交互处理方法、装置、电子设备和存储介质
CN111402906A (zh) * 2020-03-06 2020-07-10 深圳前海微众银行股份有限公司 语音解码方法、装置、引擎及存储介质
CN112085266A (zh) * 2020-08-28 2020-12-15 云粒智慧科技有限公司 一种政务数据处理方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114285830A (zh) * 2021-12-21 2022-04-05 北京百度网讯科技有限公司 语音信号处理方法、装置、电子设备及可读存储介质
CN114285830B (zh) * 2021-12-21 2024-05-24 北京百度网讯科技有限公司 语音信号处理方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN112822183B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN110891124B (zh) 一种人工智能代接来电的系统
US8351595B2 (en) Restoration of a caller to a previous place in an on-hold queue
JP4944415B2 (ja) コミュニケーションシステム、プレゼンスサーバ及びそれらに用いるコミュニケーション方法
JPH10229417A (ja) データ網通信通話の処理方法およびデータ網通信通話処理用ネットワークノード
CN109005107B (zh) 通讯方法、智能终端以及具有存储功能的装置
CN102469219A (zh) 基于呼叫中心的排队处理方法及系统
CN103379229A (zh) 一种用于专家座席的数据传送方法及系统
US20170111513A1 (en) Communication service processing method and device in circuit switch domain and storage medium
CN112822183B (zh) 语音处理的方法、装置、计算机可读存储介质和处理器
CN109151231B (zh) 客服系统、呼入业务的处理方法以及业务的处理方法
CN105119937A (zh) 用户终端的通话方法与装置
JP7467549B2 (ja) コールセンター業務システム
CN103813031A (zh) 呼叫处理方法及装置
CN101442738B (zh) 一种实现一号通业务的方法、装置及系统
CN101060566B (zh) 一种呼叫方法和设备
CN113489850B (zh) 一种电话号码保护方法、装置、系统及存储介质
CN110266895A (zh) 一种通话回拨方法、装置及设备
CN108259433B (zh) 一种呼叫排队分发方法、系统及服务器
CN101127967B (zh) 一种数字集群通讯系统中终端实现快速起呼的方法
CN105100520A (zh) 终端呼叫转接方法及其装置
CN101282384A (zh) 一种呼叫转移的方法、系统和装置
CN108712580B (zh) 一种定向回拨在线咨询免费通话系统
CN104144399A (zh) 控制数据和语音传输的方法、系统与第三方业务平台
CN107888482B (zh) 一种即时通信方法及装置
US20150365533A1 (en) Methods and systems for providing a mobile office phone

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant