CN111147582B - 一种语音交互方法、装置、计算机设备和存储介质 - Google Patents
一种语音交互方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111147582B CN111147582B CN201911369326.0A CN201911369326A CN111147582B CN 111147582 B CN111147582 B CN 111147582B CN 201911369326 A CN201911369326 A CN 201911369326A CN 111147582 B CN111147582 B CN 111147582B
- Authority
- CN
- China
- Prior art keywords
- quic
- connection
- websocket
- voice interaction
- service cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000004044 response Effects 0.000 claims abstract description 55
- 230000002452 interceptive effect Effects 0.000 claims abstract description 46
- 230000006978 adaptation Effects 0.000 claims description 62
- 238000013507 mapping Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 18
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/141—Setup of application sessions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/08—Protocols for interworking; Protocol conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音交互方法、装置、计算机设备和存储介质。该方法包括:获取设备端发送的QUIC连接请求;通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;将所述交互响应报文反馈给所述设备端。使用本发明实施例的技术方案,可以实现弱网环境下设备端与服务器端之间的正常通信。
Description
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种语音交互方法、装置、计算机设备和存储介质。
背景技术
智能语音服务在人们的生活中得到了越来越广泛的应用,智能语音服务系统可以接收用户发送的语音请求,并向用户返回语音处理结果。
现有的智能语音服务系统设备端与服务器端之间的通信多采用基于TCP(Transmission Control Protocol,传输控制协议)连接的协议,需要在设备端与服务器端事先建立TCP连接,而TCP连接需要进行三次握手过程,需要经过三个RTT(TransmissionControl Protocol,往返时延)。
发明人在实现本发明的过程中,发现现有技术存在以下缺陷:在弱网环境下,TCP连接可能会断开,需要重新进行连接,而TCP连接需消耗三个RTT,耗时较高。并且,重新连接后对语音报文重新传输,增加了用户的等待时间,降低了用户体验。
发明内容
本发明实施例提供一种语音交互方法、装置、计算机设备和存储介质,以实现弱网环境下设备端和服务器端之间的正常通信。
第一方面,本发明实施例提供了一种语音交互方法,该方法包括:
获取设备端发送的QUIC连接请求;
通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;
将所述交互响应报文反馈给所述设备端。
第二方面,本发明实施例还提供了一种语音交互装置,该装置包括:
QUIC连接请求获取模块,用于获取设备端发送的QUIC连接请求;
交互响应报文生成模块,用于通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;
交互响应报文反馈模块,用于将所述交互响应报文反馈给所述设备端。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的语音交互方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的语音交互方法。
本发明实施例通过在设备端和服务器端建立QUIC连接,设备端通过QUIC连接向服务器端发送语音交互报文,服务器端通过QUIC连接向设备端反馈交互响应报文。解决了现有技术中设备端与服务器端之间通过TCP连接传输请求或响应时,弱网环境下重连耗时较长的问题。实现了弱网环境下设备端和服务器端之间的正常通信,减少了用户等待时间,提高了用户体验。
附图说明
图1是本发明实施例一中的一种语音交互方法的流程图;
图2是本发明实施例二中的一种语音交互方法的流程图;
图3是适用于本发明实施例中的一种语音交互方法的流程图;
图4是本发明实施例三中的一种语音交互装置的结构示意图;
图5是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种语音交互方法的流程图,本实施例可适用于弱网环境下设备端发起语音交互请求的情况,该方法可以由语音交互装置来执行,该装置可以由软件和/或硬件来实现,并一般可以集成在服务器中。
如图1所示,本发明实施例的技术方案,具体包括如下步骤:
S110、获取设备端发送的QUIC连接请求。
其中,QUIC(Quick UDP Internet Connection,基于UDP的快速互联网连接)连接请求的作用可以为请求进行QUIC连接,QUIC是一种基于UDP的低时延的互联网传输层协议,QUIC的一个主要目标就是减少连接延迟,当设备端第一次连接服务器时,QUIC只需要1RTT的延迟就可以建立可靠安全的连接,相对于TCP的三次RTT要更加快捷。
在本发明实施例中,设备端向服务器端发送QUIC连接请求,与服务器之间建立QUIC连接。
在本发明一个可选的实施例中,所述QUIC连接请求可以为所述设备端在确定当前处于弱网环境时所发送的连接请求;其中,当所述设备端向所述服务总线发送数据包之后,接收到所述服务总线发送的回复的时间大于平均延迟时间时,确定当前处于弱网环境。
其中,弱网环境可以为网络信号较差的环境。在一个具体的示例中,低于2G速率的可以属于弱网,弱信号的wifi也可以属于弱网。数据包可以用于确定设备端与服务器之间能否成功交换数据包,从而根据返回的信息,推断网络是否通畅。在一个具体的示例中,数据包可以为Ping(Packet Internet Groper,因特网包探索器)包,本实施例对数据包的类型不进行限制。平均延迟时间可以为过去预设时间内的延迟时间的均值,延迟时间可以为设备端发送出数据包到数据包回到设备端的时间。
在本发明实施例中,设备端向服务总线发送数据包到接收到服务总线的回复的时间如果大于平均延迟时间,说明此时网络信号较差,处于弱网环境下。当确定当前为弱网环境时,将设备端发送的连接请求变更为QUIC连接请求。这样设置的好处在于,QUIC协议底层使用UDP(User Datagram Protocol,用户数据报协议)连接,提高了数据传输的速度,同时也能保证可靠传输。相应的,QUIC连接速度较快,同时可以保证报文传输的顺序。
S120、通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文。
其中,语音交互报文可以包括设备端接收到的用户发送的语音交互请求相关数据。交互响应报文可以包括服务器端对接收到的语音交互报文进行处理得到的处理结果。
在本发明实施例中,服务器端接收到设备端通过QUIC连接发送的语音交互报文后,对语音交互报文进行处理,并生成对应的交互响应报文。
S130、将所述交互响应报文反馈给所述设备端。
在本发明实施例中,服务器端生成交互响应报文后,将交互响应报文反馈给设备端。
本实施例的技术方案,通过在设备端和服务器端建立QUIC连接,设备端通过QUIC连接向服务器端发送语音交互报文,服务器端通过QUIC连接向设备端反馈交互响应报文。解决了现有技术中设备端与服务器端之间通过TCP连接传输请求或响应时,弱网环境下重连耗时较长的问题。实现了弱网环境下设备端和服务器端之间的正常通信,减少了用户等待时间,提高了用户体验。
实施例二
图2是本发明实施例二提供的一种语音交互方法的流程图,本发明实施例在上述实施例的基础上,对接收语音交互报文并生成交互响应报文的过程进行了进一步的具体化。
相应的,如图2所示,本发明实施例的技术方案,具体包括如下步骤:
S210、获取设备端发送的QUIC连接请求。
S220、通过QUIC协议适配服务集群对所述QUIC连接请求进行解析,得到QUIC连接标识。
其中,QUIC协议适配服务集群可以为设置在服务器端,用于建立QUIC连接与websocket连接的映射,以及对报文进行通信协议的转换。QUIC连接标识可以为设置在QUIC连接请求中,用以唯一的指示QUIC连接。在一个具体的示例中,QUIC连接标识可以设置在QUIC连接请求的URL(uniform resource locator,统一资源定位系统)上,本发明实施例对QUIC连接标识的形式和内容不进行限制。
在本发明实施例中,QUIC协议适配服务集群接收到设备端发送的QUIC连接请求后,查看QUIC连接请求上携带的QUIC连接标识。
S230、通过QUIC协议适配服务集群根据所述QUIC连接标识,获取所述QUIC连接。
在本发明实施例中,QUIC连接标识可以与QUIC连接一一对应,QUIC协议适配服务集群获取QUIC连接标识后,即可获取与QUIC连接标识对应的QUIC连接。
S240、通过QUIC协议适配服务集群查询预存的连接间映射关系集合。
其中,连接间映射关系集合可以为QUIC连接与websocket连接之间映射关系的集合。websocket连接可以为QUIC协议适配服务集群与服务总线之间进行通信所建立的连接,属于服务器内部之间的通信连接。websocket连接建立在TCP连接的基础之上,在建立TCP连接之后,再完成websocket握手形成websocket连接,QUIC协议适配服务集群与服务总线就可以在websocket连接进行通信。
在本发明实施例中,QUIC协议适配服务集群根据连接间映射关系集合,查询是否存在与QUIC连接对应的websocket连接。
S250、通过QUIC协议适配服务集群判断所述连接间映射关系集合中是否存在所述QUIC连接与目标websocket连接之间的映射关系。如果是,则执行S260,否则执行S270。
S260、将所述目标websocket连接作为与所述QUIC连接匹配的websocket连接。
在本发明实施例中,如果连接间映射关系集合中存在所述QUIC连接与目标websocket连接之间的映射关系,就把目标websocket连接作为与所述QUIC连接对应的websocket连接。
S270、与所述服务总线建立新的websocket连接作为与所述QUIC连接匹配的websocket连接。
其中,服务总线可以是计算机各种功能部件之间传送信息的公共通信干线。
在本发明实施例中,如果连接间映射关系集合中不存在所述QUIC连接与目标websocket连接之间的映射关系,就建立一条新的websocket连接,并在该新的websocket连接与QUIC连接之间建立映射关系。
S280、将所述QUIC连接与所述新的websocket连接之间的映射关系,存储于所述连接间映射关系集合中。
在本发明实施例中,建立新的websocket连接,以及新的websocket连接与QUIC连接之间的映射关系之后,将新的websocket连接与QUIC连接之间的映射关系保存到连接间映射关系集合中。
S290、通过所述QUIC协议适配服务集群接收所述设备端通过所述QUIC连接发送的语音交互报文,并对所述语音交互报文进行正解析,得到解析结果,将所述解析结果通过所述websocket连接发送至服务总线。
其中,通过所述QUIC协议适配服务集群对所述语音交互报文进行正解析,得到解析结果,可以包括:通过所述QUIC协议适配服务集群将所述语音交互报文从QUIC协议格式转换为websocket协议格式,并将websocket协议格式的语音交互报文作为所述解析结果。
在本发明实施例中,由于QUIC协议适配服务集群与设备端之间、QUIC协议适配服务集群与服务总线之间的通信连接适用的通信协议不同,因此语音交互报文在设备端到QUIC协议适配服务集群和QUIC协议适配服务集群到服务总线之间进行传输适用的通信协议也不同,需要QUIC协议适配服务集群对语音交互报文进行通信协议的转换。
S2100、通过所述服务总线对所述解析结果进行处理并得到语音处理结果,并将所述语音处理结果通过所述websocket连接反馈给所述QUIC协议适配服务集群。
在本发明实施例中,服务总线对接收到的解析结果进行处理,得到语音处理结果,通过websocket连接将语音处理结果发送至QUIC协议适配服务集群。
S2110、通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文。
其中,通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文,包括:通过所述QUIC协议适配服务集群将所述语音处理结果从websocket协议格式转换为QUIC协议格式,并将QUIC协议格式的语音处理结果作为所述交互响应报文。
在本发明实施例中,QUIC协议适配服务集群对语音处理结果进行通信协议的转换,得到转换后的交互响应报文。
S2120、将所述交互响应报文反馈给所述设备端。
在本发明一个具体的实施例中,图3是适用于本发明实施例中的一种语音交互方法的流程图,如图3所示,设备端在检测到当前处于弱网环境时,向QUIC协议适配服务集群发起QUIC连接请求,在QUIC连接请求中携带QUIC-id作为连接的唯一标识。QUIC协议适配服务集群接收到这条连接请求后,查询是否存在与QUIC-id对应的与后端BUS服务对应的websocket连接,如果不存在,就新建一条与后端BUS服务之间的websocket连接,并在websocket连接上加入websocket-id,将QUIC-id和websocket-id之间的映射关系进行存储。QUIC协议适配服务集群完成对语音交互报文的接收和解析,将语音交互报文通过websocket连接传输到后端BUS服务。
后端BUS服务采用总线加节点的分布式架构,各节点的通信通过BUS转发。其中,auth node是鉴权节点,对语音交互报文进行鉴权,拒绝鉴权不通过的语音交互报文。asrnode是识别节点,进行语音识别,实现语音转文本。Skill dispatch node是实现技能分派的节点,对语音识别结果进行语义识别,根据语义识别结果进行置信度排序,选择置信度最高的语义识别结果。dm节点是实现对话管理和决策的节点,对语义识别结果进行对话决策,如果对话决策需要依赖webhook node的查询结果,则发起对webhook node的RPC(RemoteProcedure Call,远程过程调用),获取查询结果后发布语音交互结果。webhook node是内容服务查询节点,实现应用数据查询,得到查询结果。qa node是开放阈问答节点,对当前请求做开放阈问答解析。filter node是敏感词过滤节点,对语音交互结果进行敏感词过滤。processor node是中控节点,实现保证语音交互报文在各节点之间的正确流转。后端BUS服务得到语音交互结果后,通过websocket连接向QUIC协议适配服务集群发送语音交互结果,QUIC协议适配服务集群将语音交互结果转换成QUIC协议发送至设备端。
本发明实施例的技术方案,通过设备端向QUIC协议适配服务集群发送QUIC连接请求,QUIC协议适配服务集群获取QUIC连接后,查询是否有与QUIC连接对应的websocket连接,如果没有就新建一条websocket连接,并将websocket连接与QUIC连接之间的映射关系存储。QUIC协议适配服务集群将语音交互报文解析后,通过websocket连接发送至服务总线,并对服务总线反馈的语音处理结果进行反解析,得到交互响应报文发送至设备端。解决了现有技术中设备端与服务器端之间通过TCP连接通信时,弱网环境下重连耗时高、数据传输较慢的问题,实现了弱网环境下设备端和服务器端之间的正常通信,减少了用户等待时间,提高了用户体验。
实施例三
图4是本发明实施例三提供的一种语音交互装置的结构示意图,该装置包括:QUIC连接请求获取模块310、交互响应报文生成模块320以及交互响应报文反馈模块330。
QUIC连接请求获取模块310,用于获取设备端发送的QUIC连接请求;
交互响应报文生成模块320,用于通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;
交互响应报文反馈模块330,用于将所述交互响应报文反馈给所述设备端。
本实施例的技术方案,通过在设备端和服务器端建立QUIC连接,设备端通过QUIC连接向服务器端发送语音交互报文,服务器端通过QUIC连接向设备端反馈交互响应报文。解决了现有技术中设备端与服务器端之间通过TCP连接传输请求或响应时,弱网环境下重连耗时较长的问题。实现了弱网环境下设备端和服务器端之间的正常通信,减少了用户等待时间,提高了用户体验。
在上述实施例的基础上,所述交互响应报文生成模块320,包括:
连接获取单元,用于通过QUIC协议适配服务集群获取与所述QUIC连接请求匹配的QUIC连接,以及与所述QUIC连接匹配的websocket连接;
语音交互报文解析单元,用于通过所述QUIC协议适配服务集群接收所述设备端通过所述QUIC连接发送的语音交互报文,并对所述语音交互报文进行正解析,得到解析结果,将所述解析结果通过所述websocket连接发送至服务总线;
解析结果处理单元,用于通过所述服务总线对所述解析结果进行处理并得到语音处理结果,并将所述语音处理结果通过所述websocket连接反馈给所述QUIC协议适配服务集群;
语音处理结果反解析单元,用于通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文。
在上述实施例的基础上,所述连接获取单元,包括:
QUIC连接标识获取子单元,用于通过QUIC协议适配服务集群对所述QUIC连接请求进行解析,得到QUIC连接标识;
QUIC连接获取子单元,用于通过QUIC协议适配服务集群根据所述QUIC连接标识,获取所述QUIC连接。
在上述实施例的基础上,所述连接获取单元,包括:
连接间映射关系集合查询子单元,用于通过QUIC协议适配服务集群查询预存的连接间映射关系集合;
websocket连接获取子单元,用于通过QUIC协议适配服务集群如果确定所述连接间映射关系集合中存在所述QUIC连接与目标websocket连接之间的映射关系,则将所述目标websocket连接作为与所述QUIC连接匹配的websocket连接;
websocket连接新建子单元,用于通过QUIC协议适配服务集群如果确定所述连接间映射关系集合中不存在所述QUIC连接与目标websocket连接之间的映射关系,则与所述服务总线建立新的websocket连接作为与所述QUIC连接匹配的websocket连接。
在上述实施例的基础上,所述装置,还包括:
映射关系存储模块,用于将所述QUIC连接与所述新的websocket连接之间的映射关系,存储于所述连接间映射关系集合中。
在上述实施例的基础上,所述语音交互报文解析单元,包括:
解析结果获取子单元,用于通过所述QUIC协议适配服务集群将所述语音交互报文从QUIC协议格式转换为websocket协议格式,并将websocket协议格式的语音交互报文作为所述解析结果;
在上述实施例的基础上,所述语音处理结果反解析单元,包括:
交互响应报文获取子单元,用于通过所述QUIC协议适配服务集群将所述语音处理结果从websocket协议格式转换为QUIC协议格式,并将QUIC协议格式的语音处理结果作为所述交互响应报文。
在上述实施例的基础上,所述QUIC连接请求为所述设备端在确定当前处于弱网环境时所发送的连接请求;
其中,当所述设备端向所述服务总线发送数据包之后,接收到所述服务总线发送的回复的时间大于平均延迟时间时,确定当前处于弱网环境。
本发明实施例所提供的语音交互装置可执行本发明任意实施例所提供的语音交互方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器70、存储器71、输入装置72和输出装置73;计算机设备中处理器70的数量可以是一个或多个,图5中以一个处理器70为例;计算机设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的语音交互方法对应的模块(例如,语音交互装置中的QUIC连接请求获取模块310、交互响应报文生成模块320以及交互响应报文反馈模块330)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的语音交互方法。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种语音交互方法,该方法包括:
获取设备端发送的QUIC连接请求;
通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;
将所述交互响应报文反馈给所述设备端。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的语音交互方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述语音交互装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (9)
1.一种语音交互方法,其特征在于,包括:
获取设备端发送的QUIC连接请求;
通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文,包括:
通过QUIC协议适配服务集群获取与所述QUIC连接请求匹配的QUIC连接,以及与所述QUIC连接匹配的websocket连接;
通过所述QUIC协议适配服务集群接收所述设备端通过所述QUIC连接发送的语音交互报文,并对所述语音交互报文进行正解析,得到解析结果,将所述解析结果通过所述websocket连接发送至服务总线;
通过所述服务总线对所述解析结果进行处理并得到语音处理结果,并将所述语音处理结果通过所述websocket连接反馈给所述QUIC协议适配服务集群;
通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文;
将所述交互响应报文反馈给所述设备端。
2.根据权利要求1所述的方法,其特征在于,通过QUIC协议适配服务集群获取与所述QUIC连接请求匹配的QUIC连接,包括:
通过QUIC协议适配服务集群对所述QUIC连接请求进行解析,得到QUIC连接标识;
通过QUIC协议适配服务集群根据所述QUIC连接标识,获取所述QUIC连接。
3.根据权利要求2所述的方法,其特征在于,通过QUIC协议适配服务集群获取与所述QUIC连接匹配的websocket连接,包括:
通过QUIC协议适配服务集群查询预存的连接间映射关系集合;
通过QUIC协议适配服务集群如果确定所述连接间映射关系集合中存在所述QUIC连接与目标websocket连接之间的映射关系,则将所述目标websocket连接作为与所述QUIC连接匹配的websocket连接;
通过QUIC协议适配服务集群如果确定所述连接间映射关系集合中不存在所述QUIC连接与目标websocket连接之间的映射关系,则与所述服务总线建立新的websocket连接作为与所述QUIC连接匹配的websocket连接。
4.根据权利要求3所述的方法,其特征在于,在通过QUIC协议适配服务集群与所述服务总线建立新的websocket连接作为与所述QUIC连接匹配的websocket连接之后,还包括:
将所述QUIC连接与所述新的websocket连接之间的映射关系,存储于所述连接间映射关系集合中。
5.根据权利要求1-4任一项所述的方法,其特征在于,通过所述QUIC协议适配服务集群对所述语音交互报文进行正解析,得到解析结果,包括:
通过所述QUIC协议适配服务集群将所述语音交互报文从QUIC协议格式转换为websocket协议格式,并将websocket协议格式的语音交互报文作为所述解析结果;
通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文,包括:
通过所述QUIC协议适配服务集群将所述语音处理结果从websocket协议格式转换为QUIC协议格式,并将QUIC协议格式的语音处理结果作为所述交互响应报文。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述QUIC连接请求为所述设备端在确定当前处于弱网环境时所发送的连接请求;
其中,当所述设备端向所述服务总线发送数据包之后,接收到所述服务总线发送的回复的时间大于平均延迟时间时,确定当前处于弱网环境。
7.一种语音交互装置,其特征在于,包括:
QUIC连接请求获取模块,用于获取设备端发送的QUIC连接请求;
交互响应报文生成模块,用于通过与所述QUIC连接请求匹配的QUIC连接,接收所述设备端发送的语音交互报文,并生成与所述语音交互报文匹配的交互响应报文;
所述交互响应报文生成模块,包括:
连接获取单元,用于通过QUIC协议适配服务集群获取与所述QUIC连接请求匹配的QUIC连接,以及与所述QUIC连接匹配的websocket连接;
语音交互报文解析单元,用于通过所述QUIC协议适配服务集群接收所述设备端通过所述QUIC连接发送的语音交互报文,并对所述语音交互报文进行正解析,得到解析结果,将所述解析结果通过所述websocket连接发送至服务总线;
解析结果处理单元,用于通过所述服务总线对所述解析结果进行处理并得到语音处理结果,并将所述语音处理结果通过所述websocket连接反馈给所述QUIC协议适配服务集群;
语音处理结果反解析单元,用于通过所述QUIC协议适配服务集群对接收的所述语音处理结果进行反解析,得到所述交互响应报文;
交互响应报文反馈模块,用于将所述交互响应报文反馈给所述设备端。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的语音交互方法。
9.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一所述的语音交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911369326.0A CN111147582B (zh) | 2019-12-26 | 2019-12-26 | 一种语音交互方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911369326.0A CN111147582B (zh) | 2019-12-26 | 2019-12-26 | 一种语音交互方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111147582A CN111147582A (zh) | 2020-05-12 |
CN111147582B true CN111147582B (zh) | 2022-07-01 |
Family
ID=70520568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911369326.0A Active CN111147582B (zh) | 2019-12-26 | 2019-12-26 | 一种语音交互方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111147582B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112118311B (zh) * | 2020-09-17 | 2023-10-27 | 阿波罗智联(北京)科技有限公司 | 信息车载交互方法、装置、设备以及存储介质 |
CN113782028A (zh) * | 2021-09-14 | 2021-12-10 | 咪咕数字传媒有限公司 | 语音流数据的处理方法、装置及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110430551A (zh) * | 2019-08-09 | 2019-11-08 | 西藏宁算科技集团有限公司 | 一种基于quic技术的汽车数据传输方法及系统 |
-
2019
- 2019-12-26 CN CN201911369326.0A patent/CN111147582B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110430551A (zh) * | 2019-08-09 | 2019-11-08 | 西藏宁算科技集团有限公司 | 一种基于quic技术的汽车数据传输方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111147582A (zh) | 2020-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11395213B2 (en) | Systems and methods for implementing multiple band service discovery | |
JP2020511083A (ja) | サービス品質制御方法およびその装置、smf、upf、ue、pcfおよびan | |
CN110740460A (zh) | 一种设备的入网方法、装置、网络设备及存储介质 | |
CN111147582B (zh) | 一种语音交互方法、装置、计算机设备和存储介质 | |
CN106961426B (zh) | 智能设备的通讯方法及装置 | |
CN112448873B (zh) | 设备的绑定方法、装置及计算机可读存储介质 | |
WO2017063153A1 (zh) | 协议格式转换方法、装置及接口平台 | |
CN106572132B (zh) | 分发建链方法、装置和系统 | |
CN110601980B (zh) | 一种车载终端的通信方法、系统及存储介质 | |
CN106714329B (zh) | 一种建立数据链路的方法及装置 | |
CN107610696B (zh) | 基于用户输入的对话消息的路由器控制方法及路由器 | |
US20160316395A1 (en) | Service query method, apparatus and system, and station | |
CN104852835B (zh) | 智能设备wifi通信系统及其控制方法 | |
CN111654895B (zh) | 一种物联网智慧家居ZigBee快速组网的方法 | |
CN111818170B (zh) | 网络通信方法和系统、及智能音箱 | |
CN112559472A (zh) | 一种文件传输方法、装置、计算机设备及存储介质 | |
CN108924773B (zh) | 消息处理方法及装置 | |
WO2022228438A1 (zh) | 信息处理方法、装置及通信设备 | |
CN111092952A (zh) | 一种数据交互方法及相关产品 | |
EP2938031A1 (en) | Service offload method and device for accessing internet | |
KR102042243B1 (ko) | Ptt 단말기 | |
CN114125883A (zh) | 智能设备的入网方法、装置、电子设备及存储介质 | |
CN113329359B (zh) | 一种通信方法、装置、电子设备及可读存储介质 | |
KR20040094139A (ko) | 이동통신 패킷망에서 단문메시지를 이용한 인스턴트메시징 서비스 방법 | |
US20160344573A1 (en) | Method and apparatus for processing interactions between devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 215021 building 14, Tengfei Science Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: Sipic Technology Co.,Ltd. Address before: 215021 building 14, Tengfei Science Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant before: AI SPEECH Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |