CN110750158A

CN110750158A - 智能机器人的语音录制方法、装置及智能机器人

Info

Publication number: CN110750158A
Application number: CN201911001929.5A
Authority: CN
Inventors: 王鄂申
Original assignee: Shanghai Mxchip Information Technology Co Ltd
Current assignee: Shanghai Mxchip Information Technology Co Ltd
Priority date: 2019-10-21
Filing date: 2019-10-21
Publication date: 2020-02-04

Abstract

本发明公开了一种智能机器人的语音录制方法、装置及智能机器人。该方法包括：在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测；当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。本发明解决了相关技术中在应用AI对话功能的过程中，从语音录制开始至语音录制结束需要用户保持按下AI对话功能按键才能实现语音录制，由此导致语音录制过程的可操作性较差，影响用户体验的技术问题。

Description

智能机器人的语音录制方法、装置及智能机器人

技术领域

本发明涉及智能机器人领域，具体而言，涉及一种智能机器人的语音录制方法、装置及智能机器人。

背景技术

目前，相关技术中提供的诸如儿童早教机的智能机器人依托于强大的人工智能技术，集成有自然语言处理、对话系统、语音视觉等技术，从而能够自然流畅地与用户进行信息交流。该智能机器人能够融合英语教学、拼音识字、数学逻辑、潜能开发、自然常识、亲子互动、休闲娱乐等多个领域主题。而且，该智能机器人不仅能够提供本地和远程音频资源来播放丰富的学习内容，还可以提供简单的操作方式，即每个功能模块分别具有独立的操作按键。表1是相关技术中提供的智能机器人的按键功能说明，如表1所示：

表1

按键	操作	功能
			左键	按下按钮后，在1秒内松开	播放上一曲
左键	按下按钮，保持1秒	暂停/续播
			右键	按下按钮后，在1秒内松开	播放下一曲
右键	按下按钮，保持1秒	灯光总控开启/关闭
			左键+右键	按下按钮，保持3秒	进入/退出网络设置
菜单	按下按钮后，在1秒内松开	切换播放频道
			微信留言	按下按钮后，在1秒内松开	播放微信留言
微信留言	按下按钮，保持1秒	录制微信留言
			微信留言	触发长按1秒后，松开按钮	发送微信留言
人工智能(AI)对话	按下按钮后，在1秒内松开	播放语音提示
			AI对话	按下按钮，保持1秒	录制提问
AI对话	触发长按1秒后，松开按钮	将提问发送到AI服务器
			菜单	按下状态开启电源	(仅在初始化模式下检测)产品测试模式
电源旋钮	旋转	设置音量

此外，上述智能机器人还采用安全的设计理念以此来确保用户使用的安全性，同时还提供全面的数码功能(例如：录音、复读、暂停、定时关机等)、多种供电方式(例如：电池供电、数据线供电)、超大存储容量、数据线的高速传输与自由下载以及无线遥控操作。

相关技术中所提供的智能机器人通常具备AI对话功能，在利用AI对话功能录制语音的过程中，需要用户手动按下AI对话功能按键，然后用户开始说话(例如：可以播放睡前音乐吗？)，此时需要一直等到用户说话完毕之后，才能松开AI对话功能按键。由此可见，此种录音方式需要用户保持按下AI对话功能按键才能实现语音录制，如果用户中途松开AI对话功能按键将会导致语音录制失败或者造成语音缺失，从而影响用户体验。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明至少部分实施例提供了一种智能机器人的语音录制方法、装置及智能机器人，以至少解决相关技术中在应用AI对话功能的过程中，从语音录制开始至语音录制结束需要用户保持按下AI对话功能按键才能实现语音录制，由此导致语音录制过程的可操作性较差，影响用户体验的技术问题。

根据本发明其中一实施例，提供了一种智能机器人的语音录制方法，包括：

在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测；当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

可选地，对检测到的语音进行录制包括：在启动语音活动检测之前，播放第一提示音，其中，第一提示音用于表示即将开始进行语音活动检测；在启动语音活动检测之后，从语音起始时刻至语音停止时刻对检测到的语音进行录制，或者，在第一预设时长内对检测到的语音进行录制；在录制完毕之后，播放第二提示音，其中，第二提示音用于表示语音活动检测结束。

可选地，在控制智能机器人从播放模式切换至语音活动检测模式之后，还包括：如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制智能机器人从语音活动检测模式切换回播放模式。

可选地，在对检测到的语音进行录制之后，还包括：将录制的语音发送至服务器；如果确定智能机器人与服务器出现通讯异常，则播放第三提示音，其中，第三提示音用于表示录制的语音由于通讯异常而发送失败。

可选地，在对检测到的语音进行录制之后，还包括：接收服务器返回的响应消息，其中，响应消息中携带的信息包括：待播放音频资源的地址信息；控制智能机器人从语音活动检测模式切换回播放模式，并根据地址信息获取并播放待播放音频资源。

可选地，在对检测到的语音进行录制之后，还包括：如果在第三预设时长内未接收到服务器返回的响应消息，则控制智能机器人从语音活动检测模式切换回播放模式。

根据本发明其中一实施例，还提供了一种智能机器人的语音录制装置，包括：

监听模块，用于在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测；录制模块，用于当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

可选地，录制模块包括：第一播放单元，用于在启动语音活动检测之前，播放第一提示音，其中，第一提示音用于表示即将开始进行语音活动检测；录制单元，用于在启动语音活动检测之后，从语音起始时刻至语音停止时刻对检测到的语音进行录制，或者，在第一预设时长内对检测到的语音进行录制；第二播放单元，用于在录制完毕之后，播放第二提示音，其中，第二提示音用于表示语音活动检测结束。

可选地，上述装置还包括：第一处理模块，用于如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制智能机器人从语音活动检测模式切换回播放模式。

可选地，上述装置还包括：发送模块，用于将录制的语音发送至服务器；第二处理模块，用于如果确定智能机器人与服务器出现通讯异常，则播放第三提示音，其中，第三提示音用于表示录制的语音由于通讯异常而发送失败。

可选地，上述装置还包括：接收模块，用于接收服务器返回的响应消息，其中，响应消息中携带的信息包括：待播放音频资源的地址信息；第三处理模块，用于控制智能机器人从语音活动检测模式切换回播放模式，并根据地址信息获取并播放待播放音频资源。

可选地，上述装置还包括：第四处理模块，用于如果在第三预设时长内未接收到服务器返回的响应消息，则控制智能机器人从语音活动检测模式切换回播放模式。

根据本发明其中一实施例，还提供了一种存储介质，存储介质中存储有计算机程序，其中，计算机程序被设置为运行时执行上述任一项中的智能机器人的语音录制方法。

根据本发明其中一实施例，还提供了一种处理器，处理器用于运行程序，其中，程序被设置为运行时执行上述任一项中的智能机器人的语音录制方法。

根据本发明其中一实施例，还提供了一种智能机器人，包括存储器和处理器，存储器中存储有计算机程序，处理器被设置为运行计算机程序以执行上述任一项中的智能机器人的语音录制方法。

在本发明至少部分实施例中，采用在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，该唤醒指令用于触发智能机器人进行语音活动检测的方式，通过当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式并对检测到的语音进行录制，达到了采用语音活动检测进行语音录制的方式来取代从语音录制开始至语音录制结束需要人工保持按下AI对话功能按键才能实现语音录制的手动录制方式的目的，从而实现了提高AI对话功能中语音录制的灵活性与便捷性、提升用户体验的技术效果，进而解决了相关技术中在应用AI对话功能的过程中，从语音录制开始至语音录制结束需要用户保持按下AI对话功能按键才能实现语音录制，由此导致语音录制过程的可操作性较差，影响用户体验的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明其中一实施例的智能机器人的语音录制方法的流程图；

图2是根据本发明其中一实施例的智能机器人的语音录制装置的结构框图；

图3是根据本发明其中一可选实施例的智能机器人的语音录制装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明其中一实施例，提供了一种智能机器人的语音录制方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

该方法实施例可以在智能早教机、智能音箱或者类似的智能机器人中执行。智能机器人可以包括一个或多个处理器(处理器可以包括但不限于中央处理器(CPU)、图形处理器(GPU)、数字信号处理(DSP)芯片、微处理器(MCU)或可编程逻辑器件(FPGA)等的处理装置)和用于存储数据的存储器(例如：内存卡)。可选地，上述智能机器人还可以包括用于通信功能的传输设备以及输入输出设备。本领域普通技术人员可以理解，上述结构描述仅为示意，其并不对上述智能机器人的结构造成限定。例如，智能机器人还可包括比上述结构描述更多或者更少的组件，或者具有与上述结构描述不同的配置。

存储器可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的智能机器人的语音录制方法对应的计算机程序，处理器通过运行存储在存储器内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的智能机器人的语音录制方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至智能机器人。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备用于经由一个网络接收或者发送数据。上述的网络具体实例可包括智能机器人的通信供应商提供的无线网络。在一个实例中，传输设备包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

输入输出设备用于通过智能机器人感应触发事件，向智能机器人发送控制指令，以便智能机器人执行与控制指令对应的控制操作。在一个实例中，输入输出设备可以包括：发光器件、物理按键、通用串行总线(USB)接口、电源音量旋钮。

在本实施例中提供了一种运行于上述智能机器人的语音录制方法，图1是根据本发明其中一实施例的智能机器人的语音录制方法的流程图，如图1所示，该方法包括如下步骤：

步骤S10，在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测(Voice Activity Detection，简称为VAD，其为智能机器人的处理器上固件的组成部分)；

步骤S12，当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

通过上述步骤，可以采用在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，该唤醒指令用于触发智能机器人进行语音活动检测的方式，通过当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式并对检测到的语音进行录制，达到了采用语音活动检测进行语音录制的方式来取代从语音录制开始至语音录制结束需要人工保持按下AI对话功能按键才能实现语音录制的手动录制方式的目的，从而实现了提高AI对话功能中语音录制的灵活性与便捷性、提升用户体验的技术效果，进而解决了相关技术中在应用AI对话功能的过程中，从语音录制开始至语音录制结束需要用户保持按下AI对话功能按键才能实现语音录制，由此导致语音录制过程的可操作性较差，影响用户体验的技术问题。

在播放模式下，可以启动无线保真(Wi-Fi)无线网络管理模块查找附近当前可供接入的Wi-Fi网络。如果网络名称与本地保存的多组Wi-Fi网络名称相匹配，则可以尝试连接该Wi-Fi网络。如果网络名称与本地保存的多组Wi-Fi网络名称不匹配，则每隔预设时长(例如：5秒)周期性地进行扫描，直至扫描到匹配的Wi-Fi网络后再进行连接。出厂设置的默认配置网络配置信息如下：服务集标识(SSID)为wifi，密码为88888888。在该模式下，智能机器人播放当前频道中的音频资源，并且可以在不同的频道之间进行切换。另外，智能机器人还可以接收云端服务器推送的音频资源地址并且加以播放。智能机器人在播放停止后立刻进入语音唤醒模式，以等待语音唤醒指令，并在音频播放功能处于暂停或者停止状态一段时间(例如：10分钟后)后，进入待机模式。

为了从服务器获取音频资源，智能机器人需要进入配网模式。在通过AirKiss或者声波获取道Wi-Fi网络的名称和密码之后，播放提示音“我收到网络匹配信息啦”，设置耳灯模式和表情模式，并且尝试连接该Wi-Fi网络。如果成功连接到Wi-Fi网络，则保存Wi-Fi网络的名称和密码，播报提示音“我连上网了，好棒啊，谢谢啦”并切换到播放模式，置于播放停止状态。如果在60秒内未获取到Wi-Fi配网信息或者无法以获取到的配网信息成功接入Wi-Fi网络，则丢弃收到的网络信息，然后播报提示音“网络匹配不成功，再试一次吧”(即配网超时)并切换到播放模式，置于播放停止状态。

可选地，在步骤S12中，对检测到的语音进行录制可以包括以下执行步骤：

步骤S121，在启动语音活动检测之前，播放第一提示音，其中，第一提示音用于表示即将开始进行语音活动检测；

步骤S122，在启动语音活动检测之后，从语音起始时刻至语音停止时刻对检测到的语音进行录制，或者，在第一预设时长内对检测到的语音进行录制；

步骤S123，在录制完毕之后，播放第二提示音，其中，第二提示音用于表示语音活动检测结束。

在控制智能机器人从播放模式切换至语音活动检测模式之后，可以在智能机器人的表情灯上设置第一表情模式，以表示当前已经进入语音活动检测模式。并且，在控制智能机器人启动语音活动检测之前，可以播放第一提示音(例如：“滴！”)。该第一提示音用于表示即将开始进行语音活动检测。在启动语音活动检测之后，如果检测到待录制音频，则开始录制语音并在智能机器人的表情灯上设置第二表情模式，以表示当前处于录音状态。其次，根据智能机器人内设置的第一预设时长(例如：15秒)，如果确定检测到的语音时长小于第一预设时长，则控制智能机器人从语音起始时刻至语音停止时刻对检测到的语音进行录制。如果确定检测到的语音时长大于或等于第一预设时长，则在第一预设时长内对检测到的语音进行录制。然后，在控制智能机器人录制完毕之后，可以播放第二提示音(例如：“咻！”)。该第二提示音用于表示语音活动检测结束。并且将智能机器人的表情灯由第二表情模式切换回第一表情模式。

可选地，在步骤S12，控制智能机器人从播放模式切换至语音活动检测模式之后，还可以包括以下执行步骤：

步骤S13，如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制智能机器人从语音活动检测模式切换回播放模式。

在控制智能机器人从播放模式切换至语音活动检测模式之后，可以在智能机器人的表情灯上设置第一表情模式，以表示当前已经进入语音活动检测模式。并且，在控制智能机器人启动语音活动检测之前，可以播放第一提示音(例如：“滴！”)。该第一提示音用于表示即将开始进行语音活动检测。在启动语音活动检测之后，如果在第二预设时长(例如：3秒)内通过语音活动检测未检测到任何语音，则控制智能机器人从语音活动检测模式切换回播放模式。

可选地，在步骤S12，对检测到的语音进行录制之后，还可以包括以下执行步骤：

步骤S14，将录制的语音发送至服务器；

步骤S15，如果确定智能机器人与服务器出现通讯异常，则播放第三提示音，其中，第三提示音用于表示录制的语音由于通讯异常而发送失败。

在控制智能机器人录制完毕之后，可以将录制的语音发送至服务器，以便服务器能够根据检测到的语音返回对应的响应消息，从而为智能机器人提供待播放的音频资源。然而，如果确定智能机器人与服务器出现通讯异常，则无法将录制的语音发送至服务器。此时，可以播放第三提示音(例如：“网络异常，我答不上来了！”)。该第三提示音用于表示录制的语音由于通讯异常而发送失败。

步骤S16，接收服务器返回的响应消息，其中，响应消息中携带的信息包括：待播放音频资源的地址信息；

步骤S17，控制智能机器人从语音活动检测模式切换回播放模式，并根据地址信息获取并播放待播放音频资源。

在控制智能机器人录制完毕之后，如果确定智能机器人与服务器之间通讯正常，则可以将录制的语音成功发送至服务器，以便服务器能够根据检测到的语音返回对应的响应消息，从而为智能机器人提供待播放的音频资源。在一个可选实施例中，智能机器人既可以从响应消息中获取到服务器远程推送的用户在客户端上点播的音频资源(PushUIMusic)的统一资源定位符(URL)地址，也可以从响应消息中获取到服务器远程推送的微信语音留言和AI问答中点播的音频资源(PushAIMusic)的URL地址。此时，可以控制智能机器人从语音活动检测模式切换回播放模式，并根据URL地址获取并播放待播放音频资源。

步骤S18，如果在第三预设时长内未接收到服务器返回的响应消息，则控制智能机器人从语音活动检测模式切换回播放模式。

在控制智能机器人录制完毕之后，如果确定智能机器人与服务器之间通讯正常，则可以将录制的语音成功发送至服务器，以便服务器能够根据检测到的语音返回对应的响应消息，从而为智能机器人提供待播放的音频资源。然而，如果在第三预设时长(例如：5秒)内未接收到服务器返回的响应消息，则控制智能机器人从语音活动检测模式切换回播放模式。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种智能机器人的语音录制装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本发明其中一实施例的智能机器人的语音录制装置的结构框图，如图2所示，该装置包括：监听模块10，用于在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测；录制模块20，用于当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

可选地，录制模块20包括：第一播放单元(图中未示出)，用于在启动语音活动检测之前，播放第一提示音，其中，第一提示音用于表示即将开始进行语音活动检测；录制单元(图中未示出)，用于在启动语音活动检测之后，从语音起始时刻至语音停止时刻对检测到的语音进行录制，或者，在第一预设时长内对检测到的语音进行录制；第二播放单元(图中未示出)，用于在录制完毕之后，播放第二提示音，其中，第二提示音用于表示语音活动检测结束。

可选地，图3是根据本发明其中一可选实施例的智能机器人的语音录制装置的结构框图，如图3所示，上述装置还包括：第一处理模块30，用于如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制智能机器人从语音活动检测模式切换回播放模式。

可选地，如图3所示，上述装置还包括：发送模块40，用于将录制的语音发送至服务器；第二处理模块50，用于如果确定智能机器人与服务器出现通讯异常，则播放第三提示音，其中，第三提示音用于表示录制的语音由于通讯异常而发送失败。

可选地，如图3所示，上述装置还包括：接收模块60，用于接收服务器返回的响应消息，其中，响应消息中携带的信息包括：待播放音频资源的地址信息；第三处理模块70，用于控制智能机器人从语音活动检测模式切换回播放模式，并根据地址信息获取并播放待播放音频资源。

可选地，如图3所示，上述装置还包括：第四处理模块80，用于如果在第三预设时长内未接收到服务器返回的响应消息，则控制智能机器人从语音活动检测模式切换回播放模式。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，唤醒指令用于触发智能机器人进行语音活动检测；

S2，当监听到唤醒指令时，控制智能机器人从播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种智能机器人，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种智能机器人的语音录制方法，其特征在于，包括：

在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，所述唤醒指令用于触发智能机器人进行语音活动检测；

当监听到所述唤醒指令时，控制所述智能机器人从所述播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

2.根据权利要求1所述的方法，其特征在于，对所述检测到的语音进行录制包括：

在启动语音活动检测之前，播放第一提示音，其中，所述第一提示音用于表示即将开始进行语音活动检测；

在启动语音活动检测之后，从语音起始时刻至语音停止时刻对所述检测到的语音进行录制，或者，在第一预设时长内对所述检测到的语音进行录制；

在录制完毕之后，播放第二提示音，其中，所述第二提示音用于表示语音活动检测结束。

3.根据权利要求1所述的方法，其特征在于，在控制所述智能机器人从所述播放模式切换至所述语音活动检测模式之后，还包括：

如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制所述智能机器人从所述语音活动检测模式切换回所述播放模式。

4.根据权利要求1所述的方法，其特征在于，在对所述检测到的语音进行录制之后，还包括：

将录制的语音发送至服务器；

如果确定所述智能机器人与所述服务器出现通讯异常，则播放第三提示音，其中，所述第三提示音用于表示所述录制的语音由于通讯异常而发送失败。

5.根据权利要求4所述的方法，其特征在于，在对所述检测到的语音进行录制之后，还包括：

接收所述服务器返回的响应消息，其中，所述响应消息中携带的信息包括：待播放音频资源的地址信息；

控制所述智能机器人从所述语音活动检测模式切换回所述播放模式，并根据所述地址信息获取并播放所述待播放音频资源。

6.根据权利要求4所述的方法，其特征在于，在对所述检测到的语音进行录制之后，还包括：

如果在第三预设时长内未接收到所述服务器返回的响应消息，则控制所述智能机器人从所述语音活动检测模式切换回所述播放模式。

7.一种智能机器人的语音录制装置，其特征在于，包括：

监听模块，用于在播放模式下，如果当前未播放音频资源，则保持对唤醒指令的监听状态，其中，所述唤醒指令用于触发智能机器人进行语音活动检测；

录制模块，用于当监听到所述唤醒指令时，控制所述智能机器人从所述播放模式切换至语音活动检测模式，并对检测到的语音进行录制。

8.根据权利要求7所述的装置，其特征在于，所述录制模块包括：

第一播放单元，用于在启动语音活动检测之前，播放第一提示音，其中，所述第一提示音用于表示即将开始进行语音活动检测；

录制单元，用于在启动语音活动检测之后，从语音起始时刻至语音停止时刻对所述检测到的语音进行录制，或者，在第一预设时长内对所述检测到的语音进行录制；

第二播放单元，用于在录制完毕之后，播放第二提示音，其中，所述第二提示音用于表示语音活动检测结束。

9.根据权利要求7所述的装置，其特征在于，所述装置还包括：

第一处理模块，用于如果在第二预设时长内通过语音活动检测未检测到任何语音，则控制所述智能机器人从所述语音活动检测模式切换回所述播放模式。

10.根据权利要求7所述的装置，其特征在于，所述装置还包括：

发送模块，用于将录制的语音发送至服务器；

第二处理模块，用于如果确定所述智能机器人与所述服务器出现通讯异常，则播放第三提示音，其中，所述第三提示音用于表示所述录制的语音由于通讯异常而发送失败。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

接收模块，用于接收所述服务器返回的响应消息，其中，所述响应消息中携带的信息包括：待播放音频资源的地址信息；

第三处理模块，用于控制所述智能机器人从所述语音活动检测模式切换回所述播放模式，并根据所述地址信息获取并播放所述待播放音频资源。

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第四处理模块，用于如果在第三预设时长内未接收到所述服务器返回的响应消息，则控制所述智能机器人从所述语音活动检测模式切换回所述播放模式。

13.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的智能机器人的语音录制方法。

14.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序被设置为运行时执行所述权利要求1至6任一项中所述的智能机器人的语音录制方法。

15.一种智能机器人，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的智能机器人的语音录制方法。