CN111404998A

CN111404998A - 语音交互方法、第一电子设备及可读存储介质

Info

Publication number: CN111404998A
Application number: CN202010125838.9A
Authority: CN
Inventors: 肖志飞; 姜訢
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2020-02-27
Filing date: 2020-02-27
Publication date: 2020-07-10

Abstract

本公开的实施例提供了一种语音交互方法、第一电子设备及可读存储介质，所述方法包括：接收语音输入数据；在第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，将语音输入数据通过第一连接发送至第二电子设备进行处理，以及通过第一连接，接收从第二电子设备返回的语音回复数据；在第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，第一电子设备通过第二通讯模块与云端服务器建立第二连接，并将语音输入数据通过第二连接发送至云端服务器进行处理，以及通过第二连接，接收从云端服务器返回的语音回复数据。本公开实施例可以在体积较小的第一电子设备中实现语音交互功能。

Description

语音交互方法、第一电子设备及可读存储介质

技术领域

本公开的实施例涉及计算机领域，尤其涉及一种语音交互方法、第一电子设备及可读存储介质。

背景技术

可穿戴设备多以具备部分计算功能、可连接手机及各类终端的便携式配件形式存在，主流的产品形态包括以手腕为支撑的手环等产品。

通过智能手环，用户可以记录日常生活中的锻炼、睡眠、部分还有饮食等实时数据，并将这些数据与手机、平板等同步，起到通过数据指导健康生活的作用。

然而，为了便于携带，智能手环通常具有体积小、成本低、计算能力有限等特点，导致智能手环仅能够实现较为简单的功能，无法实现语音交互功能。

发明内容

本公开的实施例提供一种语音交互方法、第一电子设备及可读存储介质，用以在第一设备上实现语音交互功能，为用户带来更多便利。

根据本公开的实施例的第一方面，提供了一种语音交互方法，所述方法包括：

接收语音输入数据；

在所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；

在所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，所述第一电子设备通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。

根据本公开的实施例的第二方面，提供了一种第一电子设备，所述第一电子设备包括：

语音处理模块，用于接收语音输入数据；

第一通讯模块，用于在所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；

第二通讯模块，用于在所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，所述第一电子设备通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。

根据本公开的实施例的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现前述语音交互方法。

根据本公开的实施例的第四方面，提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述语音交互方法。

本公开的实施例提供了一种语音交互方法、装置、电子设备及可读存储介质，所述方法包括：

接收语音输入数据；

本公开实施例在第一电子设备中集成第一通讯模块(BT with MCU)、第二通讯模块(eMTC)、以及语音处理模块(CODEC)，通过MCU可以控制蓝牙、eMTC、CODEC实现不同情形下的语音交互功能，并且仍然可以保持第一电子设备体积小，便于携带的优势。

附图说明

为了更清楚地说明本公开的实施例的技术方案，下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1示出了本公开的一个实施例中的语音交互方法的步骤流程图；

图2示出了本公开的一个实施例中的语音交互系统的结构示意图；

图3示出了图2的语音交互系统一个应用示例流程图；

图4示出了本公开的一个实施例中的第一电子设备的结构图；

图5示出了本公开的一个实施例中的语音交互系统的结构图；

图6示出了本公开的另一个实施例中的语音交互系统的结构图

图7示出了本公开的一个实施例提供的电子设备的结构图。

具体实施方式

下面将结合本公开的实施例中的附图，对本公开的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开的实施例一部分实施例，而不是全部的实施例。基于本公开的实施例中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开的实施例保护的范围。

实施例一

参照图1，示出了本公开的一个实施例中的语音交互方法的步骤流程图，所述方法应用于第一电子设备，所述方法包括：

步骤101、接收语音输入数据；

步骤102、在所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；

步骤103、在所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，所述第一电子设备通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。

本公开的语音交互方法可应用于第一电子设备，所述第一电子设备可以包括可穿戴设备、车载设备等任意电子设备。本公开实施例主要以可穿戴设备为例进行说明，例如，所述可穿戴设备可以包括智能手环、智能手表等，其他第一电子设备的应用场景相互参照即可。

由于第一电子设备通常具有体积小、成本低、计算能力有限等特点，无法实现语音交互功能。为了使得第一电子设备可以实现语音交互功能，并且仍然保持第一电子设备体积小，便于携带的优势，本公开实施例在第一电子设备中集成第一通讯模块、第二通讯模块、以及语音处理模块。

其中，语音处理模块可用于接收用户的语音输入数据，以及输出语音回复数据。在一个示例中，所述语音处理模块可以为CODEC(编译码器)。CODEC为支持视频和音频压缩与解压缩的编解码器或软件。CODEC技术能有效减少数字存储占用的空间，在计算机系统中，使用硬件完成CODEC可以节省CPU的资源，提高系统的运行效率。CODEC可以将MIC(麦克风)拾取的语音输入数据进行数字化、编码处理，以及将数字语音信号解码为模拟信号输出到SPEAKER(扬声器)。

第一电子设备可以通过第一通讯模块与第二电子设备建立第一连接，所述第二电子设备可以为具有语音处理功能的电子设备，例如，所述第二电子设备可以为移动终端如手机等。相对于功能简单的可穿戴设备，手机具有更高的计算能力，并且手机中通常设置有语音助手，可以实现语音交互功能。因此，在第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，第一电子设备可以将接收到的语音输入数据通过第一连接发送至第二电子设备进行处理，以及通过第一连接，接收从第二电子设备返回的语音回复数据。最后通过语音处理模块输出语音回复数据。

可以理解，本公开实施例对所述第二电子设备的类型不加以限制。所述第二电子设备具体包括但不限于：智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3，Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4，Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。

在本公开的一种可选实施例中，所述第一连接可以包括短距离通信连接，例如蓝牙连接、红外连接、Mesh(无线网格网络)、ZigBee(紫蜂)、NFC(近场通信)等，优选地，所述第一连接为蓝牙连接。

所述第一通讯模块可以为蓝牙模块。在一个示例中，所述第一通讯模块可以为BTwith MCU，BT with MCU将现有的应用处理器缩减为MCU(Microcontroller Unit，微控制单元)，并将其与低功耗蓝牙技术集成在一起，可以大大缩小体积、降低成本和功耗。

在第一连接中断或者第一电子设备无法与第二电子设备建立第一连接的情况下，第一电子设备可以通过第二通讯模块与云端服务器建立第二连接，并将接收到的语音输入数据通过第二连接发送至云端服务器进行处理，以及通过第二连接，接收从云端服务器返回的语音回复数据。最后通过语音处理模块输出语音回复数据。

在本公开的一种可选实施例中，所述第二连接可以包括无线连接。在一个示例中，所述第二通讯模块可以为eMTC，eMTC是对LTE(Long Term Evolution，长期演进)技术进行简化所得到，不仅具有语音和数据传输能力，而且在成本和体积上比LTE通信模块有较大优势。

本公开实施例在第一电子设备中集成第一通讯模块(BT with MCU)、第二通讯模块(eMTC)、以及语音处理模块(CODEC)，通过MCU可以控制蓝牙、eMTC、CODEC实现不同情形下的语音交互功能。

例如，在第一电子设备为可穿戴设备如智能手环的场景下，智能手环可以接收用户的语音输入数据，如语音“闪购大米”。智能手环可以通过第一连接将该语音输入数据发送至第二电子设备(如手机)进行处理，或者通过第二连接将该语音输入数据发送至云端服务器进行处理。智能手环可以接收手机或者云端服务器返回的语音回复数据，例如，该语音回复数据可以包括正在推出闪购大米活动的商家信息等。由此，可以实现智能手环的语音交互功能。

又如，在第一电子设备为车载设备的场景下，车载设备可以接收用户的语音输入数据，该语音输入数据可以包含导航指令，例如输入的语音为“从上海美术馆到迪士尼乐园的驾车路线”。车载设备可以通过第一连接将该语音输入数据发送至第二电子设备(如手机)进行处理，或者通过第二连接将该语音输入数据发送至云端服务器进行处理。车载设备可以接收手机或者云端服务器返回的语音回复数据，该语音回复数据可以包括导航结果，例如从上海美术馆到迪士尼乐园驾车的导航路线。由此，可以实现车载设备的导航功能。

在本公开的一种可选实施例中，步骤102所述将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，包括：

步骤S11、通过所述第一连接，将所述语音输入数据发送至所述第二电子设备，以使所述第二电子设备对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据；

步骤S12、所述第二电子设备将所述文本数据发送至云端服务器；

步骤S13、所述云端服务器对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据，以及向所述第二电子设备返回所述关联文本数据；

步骤S14、所述第二电子设备将所述关联文本数据转换为语音回复数据，以及通过所述第一连接，向所述第一电子设备返回所述语音回复数据。

在实际应用中，为了减小第一电子设备的功耗，第一电子设备在一段时间不使用时通常会自动进入待机状态。因此，在需要使用第一电子设备进行语音交互之前，需要唤醒第一电子设备，唤醒方式包括但不限于语音唤醒、抬腕唤醒、按键唤醒。

唤醒第一电子设备之后，第一电子设备可以通过麦克风接收用户的语音输入数据，在接收到语音输入数据之后，第一电子设备可以判断是否已通过第一通讯模块与第二电子设备建立第一连接。

可选地，所述接收语音输入数据之后，所述方法还可以包括：

步骤S21、检测所述第一电子设备与第二电子设备的第一连接状态以及第一连接的信号强度；

步骤S22、若所述第一连接状态为已连接，且所述信号强度大于预设强度，则确定所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接；

步骤S23、若所述第一连接状态为已断开，或者所述信号强度小于预设强度，则确定所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接。

本公开实施例可以通过第一电子设备与第二电子设备的第一连接状态以及第一连接的信号强度，判断第一电子设备是否与第二电子设备已建立第一连接。

以第一连接为蓝牙连接为例，首先检测第一电子设备是否处于蓝牙连接状态，如果蓝牙连接状态为断开，则确定第一电子设备未通过第一通讯模块与第二电子设备建立蓝牙连接。

如果检测到第一电子设备处于蓝牙连接状态，则进一步根据RSSI(ReceivedSignal Strength Indication，接收的信号强度指示)检测蓝牙连接的信号强度是否大于预设强度，如果大于预设强度，则确定第一电子设备已通过第一通讯模块与第二电子设备建立蓝牙连接，否则，确定第一电子设备未通过第一通讯模块与第二电子设备建立蓝牙连接。

如果检测到第一电子设备已通过第一通讯模块与第二电子设备建立第一连接，第一电子设备通过语音处理模块对接收到的语音输入数据进行处理，转换为数字语音信号，通过第一连接发送至第二电子设备。

第二电子设备接收到该数字语音信号之后，利用自身的语音助手对该数字语音信号进行初步的处理，例如对该数字语音信号进行语音识别，得到对应的文本数据；然后将所述文本数据发送至云端服务器进行进一步的处理。第二电子设备对该数字语音信号进行语音识别处理转换成文本数据之后，不仅可以降低第二电子设备与云端服务器之间数据传输的压力，而且可以减少云端服务器的计算量。

所述云端服务器接收到所述文本数据之后，可以对所述文本数据进行语义解析、关键词提取等处理操作，然后推荐模型检索得到与所述文本数据的语义以及关键词相匹配的关联文本数据，再向所述第二电子设备返回所述关联文本数据。

例如，用户的语音输入数据为语音“闪购大米”，第二电子设备将该语音转换为文本“闪购大米”发送至云端服务器，云端服务器对该文本进行语义解析、关键词提取等处理，通过推荐系统搜索到与该文本的关键词以及语义相匹配的关联文本数据。例如，所述关联文本数据可以包括正在推出闪购大米活动的商家信息等。最后通过第二连接向所述第二电子设备返回所述关联文本数据。

所述第二电子设备接收到云端服务器返回的所述关联文本数据之后，可以通过语音助手对所述关联文本数据进行语音合成，转换为语音回复数据，以及通过所述第一连接，向所述第一电子设备返回所述语音回复数据。

第一电子设备接收到第二电子设备返回的语音回复数据之后，可以通过语音处理模块进行语音解码，通过DAC(数模转换器)转换后输出到SPEAKER播放出语音，由此完成一次语音交互服务。

在本公开的一种可选实施例中，所述向所述第二电子设备返回所述关联文本数据之后，所述方法还包括：所述第二电子设备通过所述第一连接，将所述关联文本数据发送至所述第一电子设备进行输出。

第二电子设备接收到云端服务器返回的所述关联文本数据之后，还可以通过所述第一连接，将所述关联文本数据发送至所述第一电子设备，第一电子设备可以通过显示屏显示该关联文本数据。这样，在用户不方便播放语音的情况下，可以通过显示的文本信息获取语音交互结果。

在本公开的一种可选实施例中，步骤103所述将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，包括：

步骤S21、通过所述第二连接，将所述语音输入数据发送至所述云端服务器；

步骤S22、所述云端服务器对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据，以及对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据；

步骤S23、所述云端服务器将所述关联文本数据转换为语音回复数据，以及通过所述第二连接，向所述第一电子设备返回所述语音回复数据。

第一电子设备可以通过麦克风接收用户的语音输入数据，在接收到语音输入数据之后，判断第一电子设备是否通过第一通讯模块与第二电子设备建立第一连接。

如果未建立第一连接，第一电子设备可以通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据打包后通过所述第二连接发送至所述云端服务器进行处理。其中，第二连接可以是通过无线基站建立连接，所述第一设备中可以有SIM(SubscriberIdentity Module，用户身份识别卡)。

所述云端服务器接收到所述语音输入数据之后，对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据；然后对所述文本数据进行语义解析、提取关键词等处理；再根据推荐模型检索得到与所述文本数据的语义以及关键词相匹配的关联文本数据；接下来对所述关联文本数据进行语音合成，转换为语音回复数据；最后通过第二连接向所述第一电子设备返回所述语音回复数据。

第一电子设备接收到云端服务器返回的语音回复数据之后，可以通过语音处理模块进行语音解码，通过DAC转换后输出到SPEAKER播放出语音，由此完成一次语音交互服务。

可选地，云端服务器也可以将所述关联文本数据返回给第二电子设备，第二电子设备将所述关联文本数据通过第二连接发送至所述第一电子设备进行输出。

在本公开的一种可选实施例中，所述方法还可以包括：

步骤S31、所述第一电子设备将所述语音输入数据转换为第一语音信号，发送至基站设备；

步骤S32、所述基站设备将所述第一语音信号转发至目标通信设备；

步骤S33、所述基站设备接收所述目标通信设备返回的第二语音信号，并转发至所述第一电子设备；

步骤S34、所述第一电子设备将所述第二语音信号转换为模拟信号进行播放。

通过本公开实施例，可以实现第一电子设备的语音交互功能，此外，通过本公开实施例，还可以实现第一电子设备与目标通信设备之间的实时通话功能。所述目标通信设备可以包括移动终端如手机等具有通信功能的任意设备。

具体地，第一电子设备可以通过语音处理模块的MIC接收第一用户的语音输入数据，语音处理模块将接收的语音输入数据从模拟信号转换为第一语音信号。

语音处理模块将所述第一语音信息以射频形式发出，经基站设备抓取后转发至目标通信设备。目标通信设备接收到第一语音信号进行处理后，第二用户即可听到语音。

接下来，目标通信设备可以接收第二用户输入的第二语音信号，通过同样的路径返回至第一电子设备。第一电子设备接收到第二语音信号后，通过语音处理模块将所述第二语音信号转换为模拟信号进行播放，由此完成了整个实时通话过程。

综上，本公开实施例在第一电子设备中集成第一通讯模块、第二通讯模块、以及语音处理模块。通过语音处理模块可以接收语音输入数据，在所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，可以将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；在所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，所述第一电子设备可以通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。第一电子设备通过语音处理模块可以输出语音回复数据，由此完成一次语音交互服务。

为了降低硬件成本以及减小第一设备的体积，所第一通讯模块可以使用BT withMCU，所述第二通讯模块可以使用eMTC，所述语音处理模块可以使用CODEC，通过上述硬件模块，使得所述第一电子设备既可以支持基于云的语音交互服务，也可以通过短距离无线通信技术(如低功耗蓝牙等)与第二电子设备(如智能手机、平板电脑等)相连接实现语音交互服务。此外，上述硬件模块均具有体积小、成本低的特点，因此，本公开实施例使得第一设备可以实现语音交互功能的基础上，仍然可以保持第一电子设备体积小，便于携带的优势。

实施例二

参照图2，示出了本公开的一个实施例中的语音交互系统的结构示意图，所述语音交互系统包括：第一电子设备201、第二电子设备202、云端服务器203，所述第一电子设备包括第一通讯模块2011、第二通讯模块2012、以及语音处理模块2013。需要说明的是，第一电子设备还包括图中未示出的MCU、MIC、SPEAKER等硬件单元。

参照图3，示出了图2的语音交互系统一个应用示例流程图，具体可以包括：

步骤301、唤醒第一电子设备。

在实际应用中，为了节省第一电子设备的功耗，第一电子设备在不使用时通常会自动进入待机状态。因此，在需要使用第一电子设备进行语音交互之前，需要唤醒第一电子设备，唤醒方式包括但不限于语音唤醒、抬腕唤醒、按键唤醒。

步骤302、第一电子设备接收语音输入数据。

第一电子设备可以包括可穿戴设备或者车载设备等便携式设备。所述语音输入数据可以包括语音指令如“闪购大米”、“今天的天气”等，或者，所述语音输入数据可以包括导航指令如“最近的饭店”。

步骤303、确定数据传输通道。

在本实施例中，以第二电子设备为手机，第一连接为蓝牙连接为例进行说明。

第一电子设备在接收到语音输入数据之后，通过蓝牙连接状态以及RSSI来判断第一电子设备是否与手机连接；若第一电子设备与手机已建立蓝牙连接并且RSSI超过预设强度，则执行步骤304；若第一电子设备与手机断开蓝牙连接或蓝牙连接的RSSI小于预设强度，则执行步骤307。

步骤304、通过第一连接发送语音输入数据。

当第一电子设备的MCU确定第一电子设备与手机已经建立蓝牙连接时，MCU通过I2C总线对Codec进行语音参数及通道配置，MIC拾取语音输入数据，经CODEC采样、数字化、编码(数字MIC直接编码)，转换为数字语音信号，通过PCM/I2S接口把数字语音信号传送到MCU，MCU控制第一通讯模块将数字语音信号通过蓝牙连接发送至手机。

步骤305、手机处理语音输入数据。

手机接收到数字语音信号后，交与语音助手进行处理。

语音助手对手机接收到的数字语音信号进行语音识别处理，转换为机器可识别的文本数据(如语音“闪购大米”转化为文字“闪购大米”)，然后将文本数据上传到云端服务器，云端服务器对该文本数据进一步处理，搜索得到关联文本数据；云端服务器将搜索到的关联文本数据返回给手机，手机通过语音助手对该关联文本数据进行语音合成，转换为语音回复数据。

步骤306、通过第一连接回传语音回复数据。

手机将云端服务器返回的关联文本数据转换为语音回复数据之后，可以通过与第一电子设备之间的第一连接，将该语音回复数据发送至第一电子设备。

第一电子设备的BT with MCU模块接收到语音回复数据后，将语音回复数据传输到MCU完成解包，通过I2C总线配置CODEC语音通道，并将语音回复数据通过PCM/I2S接口发送到CODEC进行语音解码，通过DAC转换后输出到SPEAKER播放出语音，完成一次语音交互服务。

步骤307、对语音输入数据进行语音编码。

当第一电子设备的MCU确定第一电子设备未与手机建立蓝牙连接时，MCU接收从MIC经CODEC采样、模数转换后的数字语音信号，并且打包成第二连接可传输的数据格式。

步骤308、通过第二连接发送语音输入数据。

MCU通过UART(Universal Asynchronous Receiver/Transmitter，通用异步收发传输器)接口发送AT命令，控制eMTC将打包后的数字语音信号通过第二连接发送至云端服务器。

步骤309、云端服务器处理语音输入数据。

云端服务器接收到第一电子设备发送的数字语音信号之后，完成语音到文本、文本转语义、语义处理，决策回复、文本到语音，也即经过ASR(Automatic SpeechRecognition,语音识别)→NLU(Natural Language Processing，自然语言处理)→DM(Dialog Management，对话管理)→NLG(Natural Language Generation自然语言生成)→TTS(Text To Speech，从文本到语音)等处理转换，得到语音回复数据。

步骤310、通过第二连接回传语音回复数据。

云端服务器通过第二连接向第一电子设备发送语音回复数据，第一电子设备通过eMTC接收该语音回复数据，eMTC对该语音回复数据进行解析后，通过UART接口传到MCU，MCU解包后通过I2C总线配置CODEC参数及语音通道，并将解包后的数字语音信号通过PCM/I2S接口发送到CODEC，CODEC进行语音解码、数模转换后输出到SPEAKER播放出语音，完成一次语音交互服务。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开实施例并不受所描述的动作顺序的限制，因为依据本公开实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本公开实施例所必须的。

实施例三

参照图4，示出了本公开的一个实施例中的第一电子设备的结构图，具体如下。

语音处理模块401，用于接收语音输入数据；

第一通讯模块402，用于在所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接的情况下，将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；

第二通讯模块403，用于在所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接的情况下，所述第一电子设备通过第二通讯模块与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。

可选地，第一通讯模块402，具体用于通过所述第一连接，将所述语音输入数据发送至所述第二电子设备，以使所述第二电子设备对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据；

所述第二电子设备，用于将所述文本数据发送至云端服务器；

所述云端服务器，用于对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据，以及向所述第二电子设备返回所述关联文本数据；

所述第二电子设备，还用于将所述关联文本数据转换为语音回复数据，以及通过所述第一连接，向所述第一电子设备返回所述语音回复数据。

可选地，所述第二电子设备，还用于通过所述第一连接，将所述关联文本数据发送至所述第一电子设备进行输出。

可选地，第二通讯模块403，具体用于通过所述第二连接，将所述语音输入数据发送至所述云端服务器；

所述云端服务器，用于对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据，以及对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据；

所述云端服务器，还用于将所述关联文本数据转换为语音回复数据，以及通过所述第二连接，向所述第一电子设备返回所述语音回复数据。

可选地，所述第一电子设备，还用于将所述语音输入数据转换为第一语音信号，发送至基站设备；

所述基站设备，用于将所述第一语音信号转发至目标通信设备，以及接收所述目标通信设备返回的第二语音信号，并转发至所述第一电子设备；

所述第一电子设备，还用于将所述第二语音信号转换为模拟信号进行播放。

可选地，所述第一连接包括短距离通信连接，所述第二连接包括无线连接。

可选地，第一电子设备还包括：

状态检测模块，用于检测所述第一电子设备与第二电子设备的第一连接状态以及第一连接的信号强度；

第一确定模块，用于若所述第一连接状态为已连接，且所述信号强度大于预设强度，则确定所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接；

第二确定模块，用于若所述第一连接状态为已断开，或者所述信号强度小于预设强度，则确定所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接。

参照图5，示出了本公开的一个实施例中的语音交互系统的结构图，该语音交互系统中的第一电子设备具体可以为可穿戴设备，通过该语音交互系统可以实现可穿戴设备的语音交互功能，该系统具体包括：

可穿戴设备501、第二电子设备502、云端服务器503；其中，所述可穿戴设备501包括：第一通讯模块5011、第二通讯模块5012、以及第一语音处理模块5013；所述第二电子设备502包括：语音助手5021；所述云端服务器503包括：第二语音处理模块5031；

所述可穿戴设备501，用于通过所述第一通讯模块，与所述第二电子设备建立第一连接，或者，通过所述第二通讯模块，与所述云端服务器建立第二连接；

所述可穿戴设备501，还用于通过所述第一语音处理模块接收语音交互指令，以及通过所述第一连接，将所述语音交互指令发送至所述第二电子设备进行处理，或者，通过所述第二连接，将所述语音交互指令发送至所述云端服务器进行处理；

所述第二电子设备502，用于通过所述第一连接，接收来自所述可穿戴设备的语音交互指令，并将所述语音交互指令交由所述语音助手进行处理，得到所述语音交互指令对应的语音交互结果，以及通过所述第一连接，向所述可穿戴设备返回所述语音交互结果；

所述云端服务器503，用于通过所述第二连接，接收来自所述可穿戴设备的语音交互指令，并将所述语音交互指令交由所述第二语音处理模块进行处理，得到所述语音交互指令对应的语音交互结果，以及通过所述第二连接，向所述可穿戴设备返回所述语音交互结果；

所述可穿戴设备501，还用于通过所述第一连接，从所述第二电子设备接收语音交互结果，或者，通过所述第二连接，从所述云端服务器接收语音交互结果。

为了降低硬件成本以及减小第一设备的体积，所第一通讯模块可以使用BT withMCU，所述第二通讯模块可以使用eMTC，所述语音处理模块可以使用CODEC，通过上述硬件模块，使得所述可穿戴设备既可以支持基于云的语音交互服务，也可以通过短距离无线通信技术(如低功耗蓝牙等)与第二电子设备(如智能手机、平板电脑等)相连接实现语音交互服务。此外，上述硬件模块均具有体积小、成本低的特点，因此，本公开实施例使得可穿戴设备可以实现语音交互功能的基础上，仍然可以保持可穿戴设备体积小，便于携带的优势。

参照图6，示出了本公开的另一个实施例中的语音交互系统的结构图，该语音交互系统中的第一电子设备具体可以为车载设备，通过该语音交互系统可以实现车载设备的导航功能，该系统具体包括：

车载设备601、第二电子设备602、云端服务器603；其中，所述车载设备601包括：第一通讯模块6011、第二通讯模块6012、以及语音处理模块6013；所述第二电子设备602包括：导航模块6021；所述云端服务器503包括：路线规划模块6031；

所述车载设备601，用于通过所述第一通讯模块，与所述第二电子设备建立第一连接，或者，通过所述第二通讯模块，与所述云端服务器建立第二连接；

所述车载设备601，还用于通过所述语音处理模块接收导航指令，以及通过所述第一连接，将所述导航指令发送至所述第二电子设备进行处理，或者，通过所述第二连接，将所述导航指令发送至所述云端服务器进行处理；

所述第二电子设备602，用于通过所述第一连接，接收来自所述车载设备的导航指令，并将所述导航指令交由所述导航模块进行处理，得到所述导航指令对应的导航结果，以及通过所述第一连接，向所述车载设备返回所述导航结果；

所述云端服务器603，用于通过所述第二连接，接收来自所述车载设备的导航指令，并将所述导航指令交由所述路线规划模块进行处理，得到所述导航指令对应的导航结果，以及通过所述第二连接，向所述车载设备返回所述导航结果；

所述车载设备601，还用于通过所述第一连接，从所述第二电子设备接收导航结果，或者，通过所述第二连接，从所述云端服务器接收导航结果。

在本公开实施例中，第二电子设备可以为具有导航功能的电子设备，如智能手机等。本公开实施例在车载设备中集成第一通讯模块(如BT with MCU)、第二通讯模块(如eMTC)、以及语音处理模块(如CODEC)。

由此，车载设备可以通过语音处理模块接收用户的导航指令，例如语音“从上海美术馆到迪士尼乐园的驾车路线”。如果车载设备已经通过第一通讯模块与第二电子设备建立第一连接，则车载设备可以通过第一连接将该导航指令发送至第二电子设备。

第二电子设备可以对该导航指令进行解析，提取关键词，得到起始地点和目的地点。如提取得到起始地点为“上海美术馆”，目的地点为“迪士尼乐园”，将该起始地点和目的地点输入自身的导航模块，以得到路径规划结果，进而可以将该路径规划结果合成为对应的语音导航结果。

如果车载设备未经通过第一通讯模块与第二电子设备建立第一连接，则车载设备可以通过第二通讯模块与云端服务器建立第二连接，并通过第二连接将该导航指令发送至云端服务器。

云端服务器可以对该导航指令进行解析，提取关键词，得到起始地点和目的地点，将该起始地点和目的地点输入自身的路线规划模块，以得到路径规划结果，进而可以将该路径规划结果合成为对应的语音导航结果。

车载设备可以通过所述第一连接，从所述第二电子设备接收导航结果，或者，通过所述第二连接，从所述云端服务器接收导航结果，并且通过语音处理模块输出该导航结果。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开的实施例还提供了一种电子设备，参见图7，包括：处理器701、存储器702以及存储在所述存储器上并可在所述处理器上运行的计算机程序7021，所述处理器执行所述程序时实现前述实施例的语音交互方法。

本公开的实施例还提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的语音交互方法。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的实施例的内容，并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的实施例的示例性实施例的描述中，本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的排序设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本公开的实施例的较佳实施例而已，并不用以限制本公开的实施例，凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开的实施例的保护范围之内。

以上所述，仅为本公开的实施例的具体实施方式，但本公开的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的实施例的保护范围之内。因此，本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音交互方法，应用于第一电子设备，其特征在于，所述方法包括：

接收语音输入数据；

2.根据权利要求1所述的方法，其特征在于，所述将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，包括：

通过所述第一连接，将所述语音输入数据发送至所述第二电子设备，以使所述第二电子设备对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据；

所述第二电子设备将所述文本数据发送至云端服务器；

所述云端服务器对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据，以及向所述第二电子设备返回所述关联文本数据；

所述第二电子设备将所述关联文本数据转换为语音回复数据，以及通过所述第一连接，向所述第一电子设备返回所述语音回复数据。

3.根据权利要求2所述的方法，其特征在于，所述向所述第二电子设备返回所述关联文本数据之后，所述方法还包括：

所述第二电子设备通过所述第一连接，将所述关联文本数据发送至所述第一电子设备进行输出。

4.根据权利要求1所述的方法，其特征在于，所述将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，包括：

通过所述第二连接，将所述语音输入数据发送至所述云端服务器；

所述云端服务器对所述语音输入数据进行语音识别，得到所述语音输入数据对应的文本数据，以及对所述文本数据进行语义解析，以获取符合所述文本数据的关联文本数据；

所述云端服务器将所述关联文本数据转换为语音回复数据，以及通过所述第二连接，向所述第一电子设备返回所述语音回复数据。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述第一电子设备将所述语音输入数据转换为第一语音信号，发送至基站设备；

所述基站设备将所述第一语音信号转发至目标通信设备；

所述基站设备接收所述目标通信设备返回的第二语音信号，并转发至所述第一电子设备；

所述第一电子设备将所述第二语音信号转换为模拟信号进行播放。

6.根据权利要求1至5任一所述的方法，其特征在于，所述第一连接包括短距离通信连接，所述第二连接包括无线连接。

7.根据权利要求1至5任一所述的方法，其特征在于，所述接收语音输入数据之后，所述方法还包括：

检测所述第一电子设备与第二电子设备的第一连接状态以及第一连接的信号强度；

若所述第一连接状态为已连接，且所述信号强度大于预设强度，则确定所述第一电子设备已通过第一通讯模块与第二电子设备建立第一连接；

若所述第一连接状态为已断开，或者所述信号强度小于预设强度，则确定所述第一电子设备未通过第一通讯模块与第二电子设备建立第一连接。

8.一种第一电子设备，其特征在于，所述第一电子设备包括：

语音处理模块，用于接收语音输入数据；

第一通讯模块，用于与第二电子设备建立第一连接，并将所述语音输入数据通过所述第一连接发送至所述第二电子设备进行处理，以及通过所述第一连接，接收从所述第二电子设备返回的语音回复数据；

第二通讯模块，用于与云端服务器建立第二连接，并将所述语音输入数据通过所述第二连接发送至所述云端服务器进行处理，以及通过所述第二连接，接收从所述云端服务器返回的语音回复数据。

9.一种语音交互系统，其特征在于，所述系统包括：可穿戴设备、第二电子设备、云端服务器；其中，所述可穿戴设备包括：第一语音处理模块、第一通讯模块以及第二通讯模块；所述第二电子设备包括：语音助手；所述云端服务器包括：第二语音处理模块；

所述可穿戴设备，用于通过所述第一通讯模块，与所述第二电子设备建立第一连接，或者，通过所述第二通讯模块，与所述云端服务器建立第二连接；

所述可穿戴设备，还用于通过所述第一语音处理模块接收语音交互指令，以及通过所述第一连接，将所述语音交互指令发送至所述第二电子设备进行处理，或者，通过所述第二连接，将所述语音交互指令发送至所述云端服务器进行处理；

所述第二电子设备，用于通过所述第一连接，接收来自所述可穿戴设备的语音交互指令，并将所述语音交互指令交由所述语音助手进行处理，得到所述语音交互指令对应的语音交互结果，以及通过所述第一连接，向所述可穿戴设备返回所述语音交互结果；

所述云端服务器，用于通过所述第二连接，接收来自所述可穿戴设备的语音交互指令，并将所述语音交互指令交由所述第二语音处理模块进行处理，得到所述语音交互指令对应的语音交互结果，以及通过所述第二连接，向所述可穿戴设备返回所述语音交互结果；

所述可穿戴设备，还用于通过所述第一连接，从所述第二电子设备接收语音交互结果，或者，通过所述第二连接，从所述云端服务器接收语音交互结果。

10.一种语音交互系统，其特征在于，所述系统包括：车载设备、第二电子设备、云端服务器；其中，所述车载设备包括：语音处理模块、第一通讯模块、第二通讯模块；所述第二电子设备包括：导航模块；所述云端服务器包括：路线规划模块；

所述车载设备，用于通过所述第一通讯模块，与所述第二电子设备建立第一连接，或者，通过所述第二通讯模块，与所述云端服务器建立第二连接；

所述车载设备，还用于通过所述语音处理模块接收导航指令，以及通过所述第一连接，将所述导航指令发送至所述第二电子设备进行处理，或者，通过所述第二连接，将所述导航指令发送至所述云端服务器进行处理；

所述第二电子设备，用于通过所述第一连接，接收来自所述车载设备的导航指令，并将所述导航指令交由所述导航模块进行处理，得到所述导航指令对应的导航结果，以及通过所述第一连接，向所述车载设备返回所述导航结果；

所述云端服务器，用于通过所述第二连接，接收来自所述车载设备的导航指令，并将所述导航指令交由所述路线规划模块进行处理，得到所述导航指令对应的导航结果，以及通过所述第二连接，向所述车载设备返回所述导航结果；

所述车载设备，还用于通过所述第一连接，从所述第二电子设备接收导航结果，或者，通过所述第二连接，从所述云端服务器接收导航结果。

11.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中一个或多个所述的语音交互方法。

12.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如方法权利要求1-7中一个或多个所述的语音交互方法。