CN113593576A - 一种语音交互设备、系统、方法、云端服务器和存储介质 - Google Patents

一种语音交互设备、系统、方法、云端服务器和存储介质 Download PDF

Info

Publication number
CN113593576A
CN113593576A CN202111007402.0A CN202111007402A CN113593576A CN 113593576 A CN113593576 A CN 113593576A CN 202111007402 A CN202111007402 A CN 202111007402A CN 113593576 A CN113593576 A CN 113593576A
Authority
CN
China
Prior art keywords
voice
data
module
cloud server
data transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111007402.0A
Other languages
English (en)
Inventor
黎志勇
张含波
陈孝良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202111007402.0A priority Critical patent/CN113593576A/zh
Publication of CN113593576A publication Critical patent/CN113593576A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例公开了一种语音交互设备、系统、方法、云端服务器和存储介质,该语音交互设备在低配置设备上增设有语音采集模块、数据传输模块和控制模块,其中语音采集模块用于采集语音数据;数据传输模块用于发送语音数据,使云端服务器对语音数据识别得到语音指令,以及用于接收语音指令;控制模块用于响应语音指令。该方法用以降低实现语音交互功能对于设备配置的要求。

Description

一种语音交互设备、系统、方法、云端服务器和存储介质
技术领域
本发明涉及智能设备领域,特别是指一种语音交互设备、系统、方法、云端服务器和存储介质。
背景技术
随着计算机技术的普及,人们迎来了智能时代,设备的智能化程度越来越高。语音交互设备作为智能设备之一,进入了人们的生活。通常在使用语音交互设备时,用户通过话说便能够得到反馈结果,具有较好的用户体验。具有语音交互功能逐渐成为设备智能化的标志之一,因此,如何使得设备具有语音交互功能受到人们的关注。
在现有技术中,为了实现语音交互功能,语音交互设备通常搭载有特定的系统,具有较高的硬件配置,即实现语音交互功能对于设备的配置要求较高。例如,常见的语音交互设备是安卓设备,或较高配置的Linux设备。然而对于大多数微小设备来说,由于具有较低的设备配置,不足以支持语音交互逻辑,较难实现语音交互功能。因此,目前需要一种语音交互设备,用以降低实现语音交互功能对于设备配置的要求。
发明内容
有鉴于此,本申请实施例提供一种语音交互设备、系统、方法、云端服务器和存储介质,用以降低实现语音交互功能对于设备配置的要求。
第一方面,本申请提供一种语音交互设备,在低配置设备上增设有语音采集模块、数据传输模块和控制模块,其中:
所述语音采集模块,用于采集语音数据;
所述数据传输模块,用于发送所述语音数据,使云端服务器对所述语音数据识别得到语音指令,以及用于接收所述语音指令;
所述控制模块,用于响应所述语音指令。
在一种可能的实施方式中,在所述低配置设备上还增设有语音交互软件开发工具包模块,其中,所述语音交互软件开发工具包模块用于基于所述语音数据发送认证请求,以使所述云端服务器基于所述认证请求对所述低配置设备进行身份认证,以及用于在云端服务器对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道;所述数据传输模块,用于通过所述数据传输通道发送所述语音数据和接收所述语音指令。
在一种可能的实施方式中,在所述低配置设备上还增设有数字证书预置模块,其中,所述数字证书预置模块用于在所述低配置设备上预置ssl证书;所述语音交互软件开发工具包模块,用于在所述云端服务器根据所述ssl证书对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道。
在一种可能的实施方式中,所述数据传输模块用于通过所述数据传输通道以mqtt通讯协议发送所述语音数据至所述云端服务器,以及用于通过所述数据传输通道接收所述云端服务器以mqtt通讯协议发送的所述语音指令。
在一种可能的实施方式中,所述认证请求包括所述低配置设备的配置标签,使所述云端服务器基于所述配置标签确定对应的语音模型。
第二方面,本申请提供一种云端服务器,所述云端服务器包括:
数据传输模块,用于接收语音数据,以及发送所述语音数据对应的语音指令,其中所述语音数据是如第一方面中任一语音交互设备发送的;
语音处理模块,用于对所述语音数据识别得到所述语音指令。
在一种可能的实施方式中,所述语音处理模块包括:语音识别模块,用于对所述语音数据进行语音识别处理,得到文字数据;语义识别模块,用于对所述文字数据进行语义识别,得到语义和槽位;其中,所述槽位为所述语义的属性;技能子模块,用于基于所述语义和所述槽位,生成所述语音指令。
在一种可能的实施方式中,所述云端服务器还包括认证模块;所述数据传输模块,用于接收认证请求,所述认证请求是所述语音交互设备基于采集的语音数据发送的;所述认证模块,用于基于所述认证请求对所述语音交互设备进行身份认证得到认证结果;所述语音处理模块,用于基于认证结果为认证成功对所述语音数据识别得到所述语音指令。
第三方面,本申请提供一种语音交互系统,所述系统包括语音交互设备和云端服务器,在低配置设备上增设有语音采集模块、数据传输模块和控制模块,其中:所述语音交互设备,用于通过所述语音采集模块采集语音数据,通过所述数据传输模块发送所述语音数据至所述云端服务器,通过所述数据传输模块接收由所述云端服务器发送的语音指令,通过所述控制模块响应所述语音指令;所述云端服务器,用于接收由所述语音交互设备发送的语音数据,对所述语音数据识别得到语音指令,发送所述语音指令至所述语音交互设备。
第四方面,本申请提供一种语音交互方法,所述方法应用于如第一方面任一所述的语音交互设备,所述方法包括:
语音采集模块采集语音数据;
数据传输模块发送语音数据,使云端服务器对所述语音数据识别得到语音指令;
数据传输模块接收所述语音指令;
控制模块响应所述语音指令。
第五方面,本申请提供另一种语音交互方法,所述方法应用于如第二方面任一所述的云端服务器,所述方法包括:
接收的语音数据;其中,所述语音数据是如第一方面任一所述的语音交互设备发送的;
对所述语音数据识别得到语音指令;
发送所述语音数据对应的语音指令,以使所述语音交互设备响应所述语音指令。
第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行任一上述的方法。
由此可见,本申请实施例具有降低实现语音交互功能对于设备配置要求的有益效果。
在本申请实施例中,在低配置设备上增设有语音采集模块、数据传输模块和控制模块。语音采集模块用于采集语音数据;数据传输模块用于发送语音数据,使云端服务器对语音数据识别得到语音指令,以及用于接收语音指令;控制模块用于响应语音指令。相比于现有技术,为了实现语音交互功能,设备需要具有完成语音处理过程所需的较高配置,在本申请实施例中,由语音数据得到语音指令这个语音处理过程,是由云端服务器而不是由低配置设备来完成,通过在低配置设备上增设有语音采集模块、数据传输模块和控制模块,结合低配置设备和云端服务器,实现低配置设备的语音交互功能,从而降低实现语音交互功能对于设备配置的要求。
附图说明
图1为本申请实施例语音交互设备的结构示意图;
图2为本申请另一实施例语音交互设备的结构示意图;
图3为本申请实施例云端服务器的结构示意图;
图4为本申请实施例语音交互系统的结构示意图;
图5为本申请实施例语音交互方法的流程图;
图6为本申请另一实施例语音交互方法的流程图。
具体实施方式
为了便于理解本申请实施例提供的技术方案,下面结合附图对本申请实施例提供的一种语音交互设备、系统及方法进行说明。
虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。基于本申请中的实施例,本领域技术人员在没有作出创造性贡献前提下所获得的其他实施例,都属于本申请的保护范围。
在本申请的权利要求书和说明书以及说明书附图中,术语“包括”和“具有”以及它们的任何变形,目的在于覆盖不排他的包含。
在本申请实施例中,在低配置设备上增设有语音采集模块、数据传输模块和控制模块。语音采集模块用于采集语音数据;数据传输模块用于发送语音数据,使云端服务器对语音数据识别得到语音指令,以及用于接收语音指令;控制模块用于响应语音指令。相比于现有技术,为了实现语音交互功能,设备需要具有完成语音处理过程所需的较高配置,在本申请实施例中,由语音数据得到语音指令这个语音处理过程,是由云端服务器而不是由低配置设备来完成,通过在低配置设备上增设有语音采集模块、数据传输模块和控制模块,结合低配置设备和云端服务器,实现低配置设备的语音交互功能,从而降低实现语音交互功能对于设备配置的要求。
请参阅图1,图1为本申请实施例语音交互设备的结构示意图。如图1所示,本申请实施例中语音交互设备100,在低配置设备上增设有语音采集模块101、数据传输模块102和控制模块103,其中:所述语音采集模块101用于采集语音数据;所述数据传输模块102,用于发送所述语音数据,使云端服务器对所述语音数据识别得到语音指令,以及用于接收所述语音指令;所述控制模块103用于响应所述语音指令。
在本申请实施例中,所述低配置设备例如为非智能设备,非智能设备可以理解为没有智能芯片的设备,具体的可以为开关、热水器、风扇或加热器等设备。可以理解地是,所述低配置设备具体是哪一种设备不影响本申请实施例的实现。
所述语音采集模块101用于采集语音数据。通过所述语音采集模块101采集所述语音数据,使得所述低配置设备获得所述语音数据,为所述语音指令的产生、响应所述语音指令提供依据。所述语音数据的来源可以是用户,也可以是智能设备,也可以是其他能够产生所述语音数据的发出方,本申请实施例不对所述语音数据的发出方进行限定。
所述数据传输模块102用于发送所述语音数据,使云端服务器对所述语音数据识别得到语音指令;所述数据传输模块102还用于接收所述语音指令。由于所述语音数据是由所述语音交互设备100采集得到的,而对所述语音数据进行的处理是由所述云端服务器完成的,最终实现所述低配置设备的语音交互功能。因此所述数据传输模块102将所述语音数据发送至所述云端服务器,在所述云端服务器完成对所述语音数据的处理,并对所述语音数据识别得到语音指令后,所述云端服务器再将所述语音指令发送至所述语音交互设备100,再由所述语音交互设备100响应所述语音指令,实现设备的语音交互功能。
所述控制模块103用于响应所述语音指令。为了实现设备的语音交互功能,根据所述语音数据得到的语音交互结果通常需要通过设备来实现,或者是通过设备控制其他设备来实现,即通过所述控制模块103响应所述语音指令。
在一些具体的实施例中,所述控制模块分别与语音采集模块和数据传输模块电性连接,当语音采集模块采集到语音数据时,将语音数据发送给控制模块,控制模块基于语音数据向数据传输模块发送指令,指示数据传输模块将所述语音数据发送给云端服务器。当语音交互设备通过数据传输模块接收到语音指令后,将语音指令发送给控制模块,控制模块响应语音指令。
可选的,控制模块还与语音交互设备的开关电性连接,控制模块响应语音指令例如是控制语音交互设备的开关打开或关闭。
请参阅图2,图2为本申请另一实施例语音交互设备的结构示意图。如图2所示,本申请实施例中语音交互设备200,在低配置设备上增设有语音采集模块201、数据传输模块202和控制模块203
其中:所述语音采集模块201,用于采集语音数据;所述数据传输模块202,用于发送所述语音数据,使云端服务器对所述语音数据识别得到语音指令,以及用于接收所述语音指令;所述控制模块203,用于响应所述语音指令。对于本申请实施例语音采集模块201、数据传输模块202和控制模块203的结构、模块之间的连接关系以及各模块的功能,均已在上文中所描述,为避免重复,这里不再赘述。其中,控制模块203可以分别与所述语音采集模块201和数据传输模块202电连接。
在低配置设备上还可以增设有语音交互软件开发工具包模块204。所述语音交互软件开发工具包模块204用于基于所述语音数据发送认证请求,以使所述云端服务器基于所述认证请求对所述低配置设备进行身份认证,以及用于在云端服务器对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道;所述数据传输模块202,用于通过所述数据传输通道发送所述语音数据和接收所述语音指令。
对于所述语音交互软件开发工具包模块204,为了使得所述低配置设备接收与所述低配置设备对应的语音指令,减少与所述低配置设备不对应的语音指令的情况,同时增加数据传输的安全性,所述语音交互软件开发工具包模块204基于所述语音数据向所述云端服务器发送认证请求,以使所述云端服务器基于所述认证请求对所述低配置设备进行身份认证;在认证成功后,所述语音交互软件开发工具包模块204建立所述低配置设备和所述云端服务器之间的数据传输通道,所述数据传输通道用于传输数据,传输的数据至少包括所述语音数据和所述语音指令。
本实施例中,在低配置设备中增设语音交互软件开发工具包模块,所述语音交互软件开发工具包模块204是为了使得不具有语音交互功能的设备具有语音交互功能而设置的,也可以是为了提高设备的语音交互功能而设置的,还可以是在其他条件下设置的,可以理解地是,所述语音交互软件开发工具包模块204是在何种具体条件下增设在所述低配置设备上的,不影响本实施例的实现。
对于所述数据传输模块202,通过所述数据传输通道发送所述语音数据和接收所述语音指令,能够提高数据传输的安全性。由于所述数据传输通道是在所述云端服务器对所述低配置设备完成身份认证后建立的,未认证成功的设备难以得到所述数据传输通道中的数据,从而在所述低配置设备实现语音交互功能的过程中,提高数据传输的安全性。
在一些优选的实施例中,在所述低配置设备上还可以增设有数字证书预置模块,其中,所述数字证书预置模块用于在所述低配置设备上预置ssl证书;所述语音交互软件开发工具包模块204用于在所述云端服务器根据所述ssl证书对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道。
需要说明的是,ssl证书是一种数字证书,具有身份验证功能和数据传输加密功能,通过在所述低配置设备和所述云端服务器之间建立安全通道,对传输的数据进行加密和隐藏,降低数据在传输过程中被改变的情况,保持数据的完整性和安全性。ssl证书和设备具有绑定关系,一个ssl证书唯一标识一个设备。由于所述低配置设备的语音交互功能是由设所述低配置设备和所述云端服务器共同完成的,而不是由所述低配置设备独立完成,所述云端服务器利用数字证书对于所述低配置设备的标识作用,将对应于所述低配置设备的响应指令发送至该设备,提高语音指令准确传达的情况。
进一步地,所述数据传输模块202还可以用于通过所述数据传输通道以mqtt通讯协议发送所述语音数据至所述云端服务器,以及用于通过所述数据传输通道接收所述云端服务器以mqtt通讯协议发送的所述语音指令。
mqtt是轻量级基于代理的发出/订阅的数据传输协议,具有简单和轻量的特点。由于mqtt协议具有小型传输、开销小、协议交换最小化的特点,多用于性能低下的设备。因此,所述低配置设备和所述云端服务器以mqtt通讯协议进行数据传输,有利于进一步降低实现语音交互功能对于所述低配置设备配置的要求。当然所述低配置设备和所述云端服务器还可以采用其他的通讯协议进行数据传输,但优选采用mqtt通讯协议进行数据传输。
进一步地,所述认证请求可以包括所述低配置设备的配置标签,使所述云端服务器基于所述配置标签确定对应的语音模型。所述配置标签可以作为所述设备的一种标识,例如所述配置标签可以用于便于所述云端服务器对多种不同配置情况的设备进行管理。所述云端服务器可以基于所述配置标签确定设备对应的语音识别模型。例如所述配置标签还可以是设备编号,认证请求包括发送端设备的编号,所述云端服务器根据所述编号确定对应的语音识别模型。所述云端服务器通过对应的语音模型对接收到的语音数据进行处理,得到所述语音指令,例如语音模型的设置可以包含设备的特点,使得设备接收到的语音指令具有个性化,也能够降低设备收到语音指令却不能进行响应的情况。
进一步地,所述语音采集模块201可以用于在所述设备和所述云端服务器之间的通讯通道建立之后进行所述语音数据的采集。换句话说,所述设备和所述云端服务器之间的通讯通道的建立,可以作为所述语音采集模块进行语音采集的触发条件。设置上述条件的作用,是为了减少无效采集的情况出现。由于所述通讯通道建立的条件,是在所述云端服务器对所述设备认证成功,当在所述通讯通道建立之前,所述语音采集模块进行语音采集,而上述认证过程不成功时,得到的所述语音数据不能传输至所述云端服务器进行语音处理,此时的采集过程可以视为无效采集。
请参阅图3,图3为本申请实施例云端服务器的结构示意图。如图3所示,本申请实施例云端服务器300包括数据传输模块301和语音处理模块302。所述数据传输模块301用于接收语音数据,以及发送所述语音数据对应的语音指令,其中,所述语音数据是上述本申请实施例中任一语音交互设备所发送的;所述语音处理模块302用于对所述语音数据识别得到所述语音指令。
由于所述语音数据是在语音交互设备采集得到的(通过在低配置设备上增设的语音采集模块采集得到的),为了降低实现语音交互功能对于设备配置的需求,对所述语音数据识别得到所述语音指令由所述云端服务器完成。
进一步地,语音处理模块302可以包括语音识别模块、语义识别模块和技能子模块,其中:所述语音识别模块,用于对所述语音数据进行语音识别处理得到文字数据;所述语义识别模块,用于对所述文字数据进行语义识别,得到语义和槽位,所述槽位为所述语义的属性;所述技能子模块,用于基于所述语义和所述槽位,生成所述语音指令。
所述语音识别的作用是将所述语音数据转换为对应的文字数据,所述语义识别的作用是得到所述语音数据的语义。为了实现语音交互的过程,所述语音交互设备需要得到语音发出方的意图。上述语音发出方的意图,指的是语音发出方“想要”设备完成的响应,而语音发出方的意图通常是通过识别所述语音数据的语义实现的。
由于设备常见的处理对象是文字数据,而所述云端服务器接收到的是语音数据,因此在语义识别之前先进行语音识别,将所述语音数据转换为文字数据,以使所述语音服务器对所述文字数据进行语义识别,得到对应的语义。在对所述文字数据进行语义识别的过程中,可以得到所述文字数据的语义和槽位。语义结合槽位的目的是使得得到的语音数据发出方的意图,转化为明确的指令。槽位指的是所述语义的属性。例如,所述语义为“打开灯”,所述槽位可以是“开启”,此时所述设备可以控制开启所述设备的灯。在得到语义和槽位后,所述技能子模块基于所述语义和所述槽位生成所述语音指令。
进一步地,所述云端服务器300还可以包括认证模块;所述数据传输模块,用于接收认证请求,所述认证请求是所述语音交互设备基于采集的语音数据发送的;所述认证模块,用于基于所述认证请求对所述语音交互设备进行身份认证得到认证结果;所述语音处理模块302,用于基于认证结果为认证成功对所述语音数据识别得到所述语音指令。为了使得所述语音交互设备接收与对应的语音指令,减少与所述语音交互设备不对应的语音指令的情况,同时增加数据传输的安全性,所述云端服务器300还可以包括认证模块,使得在所述云端服务器300对所述语音交互设备认证成功后得到语音指令。
图4为本申请实施例语音交互系统的结构示意图。如图4所示,所述系统400包括语音交互设备401和云端服务器402,在低配置设备上增设有语音采集模块403、数据传输模块404和控制模块405,其中:
所述语音交互设备401,用于通过所述语音采集模块403采集语音数据,通过所述数据404传输模块发送所述语音数据至所述云端服务器,通过所述数据传输模块接收由所述云端服务器发送的语音指令,通过所述控制模块405响应所述语音指令;所述云端服务器402,用于接收由所述语音交互设备发送的语音数据,对所述语音数据识别得到语音指令,发送所述语音指令至所述语音交互设备。
对于所述语音交互系统400,所述语音交互设备401和所述云端服务器402所能实现的功能、所述语音交互设备401和所述云端服务器402之间的交互过程,以及相关内容已在上文中所描述,为避免重复,这里不再赘述。
请参阅图5,图5为本申请实施例语音交互方法的流程图。本申请实施例语音交互方法应用于上述本申请实施例中任一语音交互设备。如图5所示,本申请实施例语音交互方法包括以下步骤:
S501、语音采集模块采集语音数据;
S502、数据传输模块发送语音数据,使云端服务器对所述语音数据识别得到语音指令;
S503、数据传输模块接收所述语音指令;
S504、控制模块响应所述语音指令。
在一些实施例中,语音交互方法还包括:语音交互软件开发工具包模块,基于所述语音数据发送认证请求,以使所述云端服务器基于所述认证请求对所述低配置设备进行身份认证,以及在云端服务器对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道;数据传输模块,通过所述数据传输通道发送所述语音数据和接收所述语音指令。
在一些实施例中,语音交互软件开发工具包模块在云端服务器对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道,包括:所述语音交互软件开发工具包模块在所述云端服务器根据所述ssl证书对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道。
在一些实施例中,数据传输模块,通过所述数据传输通道发送所述语音数据和接收所述语音指令,包括:数据传输模块通过所述数据传输通道以mqtt通讯协议发送所述语音数据至所述云端服务器,以及通过所述数据传输通道接收所述云端服务器以mqtt通讯协议发送的所述语音指令。
在一些实施例中,所述认证请求包括所述低配置设备的配置标签,使所述云端服务器基于所述配置标签确定对应的语音模型。
对于本申请实施例语音交互方法中各步骤,以及各步骤所能达到的效果已在上文中所描述,为避免重复,这里不再赘述。
请参阅图6,图6为本申请另一实施例语音交互方法的流程图。本申请实施例语音交互方法应用于上述本申请实施例中任一云端服务器,本申请实施例中的语音交互设备为上述本申请实施例中任一语音交互设备。如图6所示,本申请实施例语音交互方法包括以下步骤:
S601、接收语音交互设备发送的语音数据;
S602、对所述语音数据识别得到语音指令;
S603、发送所述语音数据对应的语音指令,以使所述语音交互设备响应所述语音指令。
在一些实施例中,对所述语音数据识别得到语音指令,包括:对所述语音数据进行语音识别处理,得到文字数据;对所述文字数据进行语义识别,得到语义和槽位;其中,所述槽位为所述语义的属性;基于所述语义和所述槽位,生成所述语音指令。
在一些实施例中,接收语音数据,包括:接收认证请求,所述认证请求是所述语音交互设备基于采集的语音数据发送的;基于所述认证请求对所述语音交互设备进行身份认证得到认证结果;基于认证结果为认证成功接收语音数据;对所述语音数据识别得到所述语音指令。
对于本申请实施例语音交互方法中各步骤,以及各步骤所能达到的效果已在上文中所描述,为避免重复,这里不再赘述。
在本申请的实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述任一语音交互方法,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种语音交互设备,其特征在于,在低配置设备上增设有语音采集模块、数据传输模块和控制模块,其中:
所述语音采集模块,用于采集语音数据;
所述数据传输模块,用于发送所述语音数据,使云端服务器对所述语音数据识别得到语音指令,以及用于接收所述语音指令;
所述控制模块,用于响应所述语音指令。
2.根据权利要求1所述的语音交互设备,其特征在于,在所述低配置设备上还增设有语音交互软件开发工具包模块,其中:
语音交互软件开发工具包模块,用于基于所述语音数据发送认证请求,以使所述云端服务器基于所述认证请求对所述低配置设备进行身份认证,以及用于在云端服务器对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道;
所述数据传输模块,用于通过所述数据传输通道发送所述语音数据和接收所述语音指令。
3.根据权利要求2所述的设备,其特征在于,在所述低配置设备上还增设有数字证书预置模块,其中,所述数字证书预置模块用于在所述低配置设备上预置ssl证书;
所述语音交互软件开发工具包模块,用于在所述云端服务器根据所述ssl证书对所述低配置设备认证成功后,建立所述低配置设备和所述云端服务器之间的数据传输通道。
4.根据权利要求2或3所述的设备,其特征在于,所述数据传输模块用于通过所述数据传输通道以mqtt通讯协议发送所述语音数据至所述云端服务器,以及用于通过所述数据传输通道接收所述云端服务器以mqtt通讯协议发送的所述语音指令。
5.根据权利要求2或3所述的设备,其特征在于,所述认证请求包括所述低配置设备的配置标签,使所述云端服务器基于所述配置标签确定对应的语音模型。
6.一种云端服务器,其特征在于,所述云端服务器包括:
数据传输模块,用于接收语音数据,以及发送所述语音数据对应的语音指令,其中所述语音数据是如权利要求1-5任一项所述的语音交互设备发送的;
语音处理模块,用于对所述语音数据识别得到所述语音指令。
7.根据权利要求6所述的云端服务器,其特征在于,所述语音处理模块包括:
语音识别模块,用于对所述语音数据进行语音识别处理,得到文字数据;
语义识别模块,用于对所述文字数据进行语义识别,得到语义和槽位;其中,所述槽位为所述语义的属性;
技能子模块,用于基于所述语义和所述槽位,生成所述语音指令。
8.根据权利要求6或7所述的云端服务器,其特征在于,所述云端服务器还包括认证模块:
所述数据传输模块,用于接收认证请求,所述认证请求是所述语音交互设备基于采集的语音数据发送的;
所述认证模块,用于基于所述认证请求对所述语音交互设备进行身份认证得到认证结果;
所述语音处理模块,用于基于认证结果为认证成功对所述语音数据识别得到所述语音指令。
9.一种语音交互系统,其特征在于,所述系统包括语音交互设备和云端服务器,在低配置设备上增设有语音采集模块、数据传输模块和控制模块,其中:
所述语音交互设备,用于通过所述语音采集模块采集语音数据,通过所述数据传输模块发送所述语音数据至所述云端服务器,通过所述数据传输模块接收由所述云端服务器发送的语音指令,通过所述控制模块响应所述语音指令;
所述云端服务器,用于接收由所述语音交互设备发送的语音数据,对所述语音数据识别得到语音指令,发送所述语音指令至所述语音交互设备。
10.一种语音交互方法,其特征在于,应用于如权利要求1-5任一项所述的语音交互设备,所述方法包括:
语音采集模块采集语音数据;
数据传输模块发送语音数据,使云端服务器对所述语音数据识别得到语音指令;
数据传输模块接收所述语音指令;
控制模块响应所述语音指令。
11.一种语音交互方法,其特征在于,应用于如权利要求6-8任一项所述的云端服务器,所述方法包括:
接收的语音数据;其中,所述语音数据是如权利要求1-5任一项所述的语音交互设备发送的;
对所述语音数据识别得到语音指令;
发送所述语音数据对应的语音指令,以使所述语音交互设备响应所述语音指令。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求10-11任一项所述的方法。
CN202111007402.0A 2021-08-30 2021-08-30 一种语音交互设备、系统、方法、云端服务器和存储介质 Pending CN113593576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111007402.0A CN113593576A (zh) 2021-08-30 2021-08-30 一种语音交互设备、系统、方法、云端服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111007402.0A CN113593576A (zh) 2021-08-30 2021-08-30 一种语音交互设备、系统、方法、云端服务器和存储介质

Publications (1)

Publication Number Publication Date
CN113593576A true CN113593576A (zh) 2021-11-02

Family

ID=78240450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111007402.0A Pending CN113593576A (zh) 2021-08-30 2021-08-30 一种语音交互设备、系统、方法、云端服务器和存储介质

Country Status (1)

Country Link
CN (1) CN113593576A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
WO2018102980A1 (zh) * 2016-12-06 2018-06-14 吉蒂机器人私人有限公司 语音交互方法、装置及系统
CN108377186A (zh) * 2018-03-19 2018-08-07 北京工业大学 一种基于tcm的ssl协议
WO2018226606A1 (en) * 2017-06-04 2018-12-13 Instreamatic, Inc. Server for enabling voice-responsive content as part of a media stream to an end user on a remote device
CN208332647U (zh) * 2018-05-04 2019-01-04 中山市崇德电器实业有限公司 一种具有语音交互功能的热水器
CN110767225A (zh) * 2019-10-24 2020-02-07 北京声智科技有限公司 一种语音交互方法、装置及系统
CN111552928A (zh) * 2020-04-26 2020-08-18 北京学之途网络科技有限公司 一种认证方法及装置
CN112242024A (zh) * 2020-10-16 2021-01-19 上海电机学院 一种基于语音识别的加油机交互系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
WO2018102980A1 (zh) * 2016-12-06 2018-06-14 吉蒂机器人私人有限公司 语音交互方法、装置及系统
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
WO2018226606A1 (en) * 2017-06-04 2018-12-13 Instreamatic, Inc. Server for enabling voice-responsive content as part of a media stream to an end user on a remote device
CN108377186A (zh) * 2018-03-19 2018-08-07 北京工业大学 一种基于tcm的ssl协议
CN208332647U (zh) * 2018-05-04 2019-01-04 中山市崇德电器实业有限公司 一种具有语音交互功能的热水器
CN110767225A (zh) * 2019-10-24 2020-02-07 北京声智科技有限公司 一种语音交互方法、装置及系统
CN111552928A (zh) * 2020-04-26 2020-08-18 北京学之途网络科技有限公司 一种认证方法及装置
CN112242024A (zh) * 2020-10-16 2021-01-19 上海电机学院 一种基于语音识别的加油机交互系统

Similar Documents

Publication Publication Date Title
US20190306688A1 (en) Network Access Method, Device, and System
US11095599B2 (en) Method and system of operating a social networking application via an external device
WO2014183404A1 (zh) 数据传输方法、装置及系统、终端
EP2941058B1 (en) Near field communication method and device
CN107770761A (zh) 蓝牙设备分享请求和控制方法及电子设备
WO2019134595A1 (zh) 配置系统、客户端设备、嵌入式设备配置方法及存储介质
EP2899956A1 (en) Terminal pairing method, terminal and system
US20170257767A1 (en) Method and device for joining network processing of sensor, network platform equipment and Internet of things gateway
CN107567009A (zh) 蓝牙设备分享请求和控制方法及电子设备
CN111356117A (zh) 一种语音交互的方法及蓝牙设备
CN111404695B (zh) 令牌请求验证方法和装置
US10575175B2 (en) Access control method and access control apparatus
WO2022242324A1 (zh) 配网方法、装置、设备及计算机可读存储介质
JP2016524880A (ja) Nfc無線周波数通信制御方法、装置、およびシステム
CN110932947A (zh) 基于电视端的设备控制方法及装置
US20200213844A1 (en) Communication method, communication apparatus and electronic device
CN114553957B (zh) 兼容国密和国际https传输的业务系统和方法
WO2018196463A1 (zh) 网络接入方法、装置、存储介质及处理器
CN109874034A (zh) 电视语音遥控方法、装置及终端设备
CN113593576A (zh) 一种语音交互设备、系统、方法、云端服务器和存储介质
CN111147582B (zh) 一种语音交互方法、装置、计算机设备和存储介质
CN113613279A (zh) 路由策略生成方法及相关设备
CN108924773B (zh) 消息处理方法及装置
JP2023101029A (ja) 通信装置、制御方法、およびプログラム
CN107257586B (zh) 智能终端连接WiFi时的移动网络连接方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination