WO2019119771A1

WO2019119771A1 - 语音交互方法、装置及计算机可读存储介质

Info

Publication number: WO2019119771A1
Application number: PCT/CN2018/093750
Authority: WO
Inventors: 马小莉
Original assignee: 深圳Tcl新技术有限公司
Priority date: 2017-12-20
Filing date: 2018-06-29
Publication date: 2019-06-27
Also published as: CN108132805A; CN108132805B

Abstract

本申请公开了一种语音交互方法。该语音交互方法包括：当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；监测第一预设时间内是否接收到用户的语音指令；若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。本申请还公开了一种语音交互装置及计算机可读存储介质。本申请通过用户的个人操作行为数据生成对应的语音引导文件来引导用户，可给用户提供更人性化的语音帮助，从而提升语音交互过程中的用户体验感。

Description

语音交互方法、装置及计算机可读存储介质

本申请要求于2017年12月20日提交中国专利局、申请号为201711382608.5、申请名称为“语音交互方法、装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及通讯领域，尤其涉及一种语音交互方法、装置及计算机可读存储介质。

背景技术

随着语音技术的进步及互联网大数据的不断成熟，智能语音已经成为人工智能进入日常生活的第一条通路，各大商家纷纷推出智能语音产品，例如智能语音电视、智能语音音响、智能语音导航仪和语音空气检测机等。智能语音产品通过模拟人与人的语音方式，使用语音替代传统的操作方式，给消费者带来了极大的方便。

但用户在使用智能语音产品进行交流时，并不能像人与人之间的交流反馈一样正常、及时、可用，例如，用户唤醒智能语音产品后，产品不会像人一样主动交流，只有等到用户发出指令时，产品才有反馈，该反馈不及时且较为被动，无法对用户起到指引作用；当产品一直未收到用户指令时，会直接结束，或直接反馈产品功能帮助菜单，该反馈可用性不强，无法真正帮助到用户，因此，在现有智能语音产品的语音交互过程中，未给用户提供人性化的语音帮助，用户体验感较差。

申请内容

本申请的主要目的在于提供一种语音交互方法、装置及计算机可读存储介质，旨在提供更人性化的语音帮助，提升语音交互过程中的用户体验感。

为实现上述目的，本申请提供一种语音交互方法，所述语音交互方法包括以下步骤：

当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；

监测第一预设时间内是否接收到用户的语音指令；

若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。

可选地，所述语音交互方法还包括：

监测第二预设时间内是否接收到用户的语音指令；

若第二预设时间内未接收到用户的语音指令，则获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户；

若第二预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。

可选地，所述获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户的步骤，包括：

获取线上各用户的操作行为数据，并对所述操作行为数据进行统计分析；

根据统计结果生成对应的语音帮助文件并播放，以帮助用户。

可选地，所述获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户的步骤，包括：

获取用户的个人操作行为数据，并对所述个人操作行为数据进行统计分析；

根据统计结果生成对应的语音引导文件并播放，以引导用户。

可选地，所述监测第一预设时间内是否接收到用户的语音指令的步骤之后，包括：

若第一预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。

此外，为实现上述目的，本申请还提供一种语音交互装置，所述语音交互装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互程序，所述语音交互程序被所述处理器执行时实现以下步骤：

监测第一预设时间内是否接收到用户的语音指令；

可选地，所述语音交互程序被所述处理器执行时还实现以下步骤：

监测第二预设时间内是否接收到用户的语音指令；

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音交互程序，所述语音交互程序被处理器执行时实现以下步骤：

监测第一预设时间内是否接收到用户的语音指令；

本申请提供一种语音交互方法、装置及计算机可读存储介质，通过当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；监测第一预设时间内是否接收到用户的语音指令；若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。通过上述方式，本申请终端在接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应，本申请在启动语音交互功能时，可模拟人与人的互动方式及时主动地进行回应，可提高用户体验效果；然后监测第一预设时间内是否接收到用户的语音指令，若第一预设时间内未接收到用户的语音指令，即用户犹豫进行什么操作时，此时可获取用户的个人操作行为数据，并根据个人操作行为数据生成对应的语音引导文件并播放，以引导用户，相比于现有技术中，终端只有在接收到语音指令时才给予反馈回应，本申请可根据用户的个人操作行为数据进行统计分析，进而提供更人性化的语音帮助，主动对用户进行引导，因此，本申请可提高语音交互的频率，提升语音交互过程中的用户体验感。

附图说明

图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本申请语音交互方法第一实施例的流程示意图；

图3为本申请实施例中获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户的细化流程示意图；

图4为本申请语音交互方法第二实施例的流程示意图；

图5为本申请实施例中获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户的细化流程示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在现有技术中，用户在使用智能语音产品进行交流时，并不能像人与人之间的交流反馈一样正常、及时、可用，例如，用户唤醒智能语音产品后，产品不会像人一样主动交流，只有等到用户发出指令时，产品才有反馈，该反馈不及时且较为被动，无法对用户起到指引作用；当产品一直未收到用户指令时，会直接结束，或直接反馈产品功能帮助菜单，该反馈可用性不强，无法真正帮助到用户，因此，在现有智能语音产品的语音交互过程中，未给用户提供人性化的语音帮助，用户体验感较差。

为了解决上述技术问题，本申请提供一种语音交互方法、装置及计算机可读存储介质，通过当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；监测第一预设时间内是否接收到用户的语音指令；若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。通过上述方式，本申请终端在接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应，本申请在启动语音交互功能时，可模拟人与人的互动方式及时主动地进行回应，可提高用户体验效果；然后监测第一预设时间内是否接收到用户的语音指令，若第一预设时间内未接收到用户的语音指令，即用户犹豫进行什么操作时，此时可获取用户的个人操作行为数据，并根据个人操作行为数据生成对应的语音引导文件并播放，以引导用户，相比于现有技术中，终端只有在接收到语音指令时才给予反馈回应，本申请可根据用户的个人操作行为数据进行统计分析，进而提供更人性化的语音帮助，主动对用户进行引导，因此，本申请可提高语音交互的频率，提升语音交互过程中的用户体验感。

请参阅图1，图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图。

本申请实施例终端可以是智能语音电视，也可以是智能语音音响、智能机器人、智能手机、智能语音闹钟、智能语音导航仪和语音空气检测机等智能语音产品。

如图1所示，该终端可以包括：处理器1001，例如CPU，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如Wi-Fi接口）。存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF（Radio Frequency，射频）电路，传感器、音频电路、Wi-Fi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上（一般为三轴）加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用（比如横竖屏切换、相关游戏、磁力计姿态校准）、振动识别相关功能（比如计步器、敲击）等；当然，终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音交互程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的语音交互程序，并执行以下操作：

监测第一预设时间内是否接收到用户的语音指令；

进一步地，处理器1001可以调用存储器1005中存储的语音交互程序，还执行以下操作：

监测第二预设时间内是否接收到用户的语音指令；

基于上述硬件结构，提出本申请语音交互方法各实施例。

本申请提供一种语音交互方法。

请参阅图2，图2为本申请语音交互方法第一实施例的流程示意图。

在本申请实施例中，该语音交互方法包括：

步骤S10，当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；

在本申请实施例中，该语音交互方法可用于智能语音产品的语音交互过程中，模拟人与人的互动方式及时主动地进行回应，并且可根据用户的个人操作行为进行统计分析，进而提供更人性化的语音帮助，主动对用户进行引导帮助，提高语音交互的频率，提升语音交互过程中的用户体验感。本申请实施例终端可以是智能语音电视，也可以是智能语音音响、智能机器人、智能手机、智能语音闹钟、智能语音导航仪和语音空气检测机等智能语音产品。为方便说明，本申请实施例中以智能语音电视为例进行说明。

在本申请实施例中，当智能语音电视接收到用户触发的语音交互功能唤醒指令时，根据该语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应。其中，用户触发语音交互功能唤醒指令的方式可以包括但不限于以下2种：1）用户按压智能语音电视的开机按钮，即开启智能语音电视时即触发语音交互功能唤醒指令；2）用户在智能语音电视显示界面中选择启动语音交互功能的选项。

需要说明的是，预设语音回应文件可以系统预先设定的，也可以是用户自己设定的。当预设语音回应文件为系统预先设定的时，可以在语音回应包中存储一个或多个语音回应文件，例如，该语音回应包可以只包括一个“已启动语音交互功能，请吩咐”的语音回应文件，当启动语音交互功能，主动播放该条语音回应文件；再例如，该语音回应包中存储有多个语音回应文件，可以随机调用其中一个进行播放，还可以根据当前时间信息或其他信息选取对应的语音回应信息进行播放，例如，该语音回应文件包括“主人，周末愉快，请问您有什么吩咐呢”，“晚上好，主人，您有什么吩咐呢”，“主人，早上好，请吩咐”等语音回应文件，智能语音电视可以根据当前时间进行选择播放。本申请在启动语音交互功能时，可模拟人与人的互动方式及时主动地进行回应，可提高用户体验效果。

步骤S20，监测第一预设时间内是否接收到用户的语音指令；

若第一预设时间内未接收到用户的语音指令，则执行步骤S30：获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。

当启动语音交互功能之后，智能语音电视会监测第一预设时间内是否接收到用户的语音指令，若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。其中，第一预设时间是基于心理学并通过实验获得的，可以设为0.7s-1s，个人操作行为数据可以包括历史浏览记录和浏览时间，然后对用户的个人操作行为数据进行统计分析，进而基于用户个人操作行为数据的统计结果提供更人性化的语音引导，主动对用户进行引导，因此，本申请可提高语音交互的频率，提升语音交互过程中的用户体验感。

具体的，请参阅图3，图3为本申请实施例中获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户的细化流程示意图。步骤S30包括：

步骤S31，获取用户的个人操作行为数据，并对所述个人操作行为数据进行统计分析；

步骤S32，根据统计结果生成对应的语音引导文件并播放，以引导用户。

若第一预设时间内未接收到用户的语音指令，智能语音电视终端会先获取用户的个人操作行为数据，个人操作行为数据可以包括历史浏览记录和浏览时间，其中历史浏览记录可以包括浏览类型，例如电视节目、电视剧、电影、综艺等，还可以包括节目类型，例如电视节目包括新闻类、财经类、体育类等，电视剧包括美剧、韩剧，或者爱情剧、古装剧、悬疑剧等，还可以包括对应的主持或者主演名单，浏览时间可以包括工作日、非工作日，早、中、晚等分类，然后对这些个人操作行为数据进行统计分析，并根据统计结果生成对应的语音引导文件并播放，以引导用户。例如，对个人操作行为数据进行统计分析发现用户最近连续在看某电视剧A和B，此时可以根据该统计结果生成语音引导文件“主人，您今天想继续观看A或B吗”，或者，经统计分析发现用户最近连续看某人C主演的电影，此时可以根据该统计结果生成语音引导文件“主人，C主演的电影有很多不错的，例如D、E和F，您想观看吗”，此外，在具体实施例中，还可以将统计结果与当前时间相结合生成对应的语音引导文件，例如，对个人操作行为数据进行统计分析发现用户每天晚上7点至7点半都会观看新闻联播，如果获取到当前时间在7点至7点半之间或者接近7点，此时，可以根据该统计结果和当前时间生成语音引导文件“新闻联播正在/即将播出，您需要观看吗”，这种引导式的语音是基于用户的个人操作行为数据形成的，能给用户更贴心、人性化的帮助和服务，而且这种引导式的帮助语音是主动发生的，可以提高用户的语音交互频率，让用户轻松而自然的获得帮助，提升用户体验。

此外，在本申请实施例中，在上述步骤S20之后，该语音交互方法还可以包括：

当智能语音电视在第一预设时间内接收到用户的语音指令，则对该语音指令进行识别，并根据识别结果执行对应的操作。其中，具体的识别技术可参照现有技术，此处不做赘述。例如，在第一预设时间内接收到用户的语音指令“播放电视剧A”，则可以对采集到的用户语音进行识别，然后根据识别结果控制电视界面跳转到电视剧A的剧集选择界面；再例如，在第一预设时间内接收到用户的语音指令“播放电影D”，则在识别后直接控制电视界面开始播放电影D。

本申请提供一种语音交互方法，通过当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；监测第一预设时间内是否接收到用户的语音指令；若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。通过上述方式，本申请终端在接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应，本申请在启动语音交互功能时，可模拟人与人的互动方式及时主动地进行回应，可提高用户体验效果；然后监测第一预设时间内是否接收到用户的语音指令，若第一预设时间内未接收到用户的语音指令，即用户犹豫进行什么操作时，此时可获取用户的个人操作行为数据，并根据个人操作行为数据生成对应的语音引导文件并播放，以引导用户，相比于现有技术中，终端只有在接收到语音指令时才给予反馈回应，本申请可根据用户的个人操作行为数据进行统计分析，进而提供更人性化的语音帮助，主动对用户进行引导，因此，本申请可提高语音交互的频率，提升语音交互过程中的用户体验感。

请参阅图4，图4为本申请语音交互方法第二实施例的流程示意图。

基于图2所示的第一实施例，在步骤S30之后，该语音交互方法还包括：

步骤S40，监测第二预设时间内是否接收到用户的语音指令；

步骤S51，若第二预设时间内未接收到用户的语音指令，则获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户；

在本申请实施例中，终端在对用户进行引导之后，继续监测第二预设时间内是否接收到用户的语音指令，若第二预设时间内未接收到用户的语音指令，则该引导语音可能未带给用户真正的帮助，或用户可能没有目的性，此时，则获取线上各用户的操作行为数据，并根据该操作行为数据生成对应的语音帮助文件并播放，以帮助用户。其中，第二预设时间是基于心理学并通过实验获得的，可以设为2s-3s，操作行为数据可以包括一定时间范围内（如近一个月内）的视频观看记录、网络搜索记录和网页浏览记录等，然后对线上各用户的操作行为数据进行统计分析，进而基于线上各用户操作行为数据的统计结果提供语音帮助，从而给用户提供参考意见，提升用户体验。

具体的，请参阅图5，图5为本申请实施例中获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户的细化流程示意图。步骤S51可以包括：

步骤S511，获取线上各用户的操作行为数据，并对所述操作行为数据进行统计分析；

步骤S512，根据统计结果生成对应的语音帮助文件并播放，以帮助用户。

若第二预设时间内未接收到用户的语音指令，则说明用户可能没有目的性，此时，智能语音电视终端会先获取线上各用户的操作行为数据，线上各用户的操作行为数据可以包括一定时间范围内（如近一个月内）的视频观看记录、网络搜索记录和网页浏览记录等，然后对这些操作行为数据进行统计分析，根据统计结果生成对应的语音帮助文件并播放，从而给用户提供参考意见，以帮助用户进行选择。例如，对线上各用户的操作行为数据进行统计分析发现大多数用户最近都在观看某一电影X或搜索该电影X的相关信息，此时，可以根据该统计结果生成语音帮助文件“最近很热门的电影X，您想观看吗”，或者，可以根据统计结果生成一个选择性的语音帮助文件“最近的新片有a、b、c，有没有您感兴趣的呢”，这种帮助提供参考、选择的语音服务，可以给没有目的性的用户提供更人性化的帮助，而且这种帮助式的语音是主动发生的，同样也可以提高用户的语音交互频率，给用户提供参考选择，可提升用户体验。

步骤S52，若第二预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。

当智能语音电视在第二预设时间内接收到用户的语音指令，则对该语音指令进行识别，并根据识别结果执行对应的操作。其中，具体的识别技术可参照现有技术，此处不做赘述。

本申请还提供一种语音交互装置，该语音交互装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互程序，所述语音交互程序被所述处理器执行时实现如以上任一项实施例所述的语音交互方法的步骤。

本申请语音交互装置的具体实施例与上述语音交互方法各实施例基本相同，在此不作赘述。

本申请还提供一种计算机可读存储介质，该计算机可读存储介质上存储有语音交互程序，所述语音交互程序被处理器执行时实现如以上任一项实施例所述的语音交互方法的步骤。

本申请计算机可读存储介质的具体实施例与上述语音交互方法各实施例基本相同，在此不作赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种语音交互方法，其中，所述语音交互方法包括以下步骤：

当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；

监测第一预设时间内是否接收到用户的语音指令；

若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。
如权利要求1所述的语音交互方法，其中，所述语音交互方法还包括：

监测第二预设时间内是否接收到用户的语音指令；

若第二预设时间内未接收到用户的语音指令，则获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户；

若第二预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。
如权利要求2所述的语音交互方法，其中，所述获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户的步骤，包括：

获取线上各用户的操作行为数据，并对所述操作行为数据进行统计分析；

根据统计结果生成对应的语音帮助文件并播放，以帮助用户。
如权利要求1所述的语音交互方法，其中，所述获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户的步骤，包括：

获取用户的个人操作行为数据，并对所述个人操作行为数据进行统计分析；

根据统计结果生成对应的语音引导文件并播放，以引导用户。
如权利要求1所述的语音交互方法，其中，所述监测第一预设时间内是否接收到用户的语音指令的步骤之后，包括：

若第一预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。
一种语音交互装置，其中，所述语音交互装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互程序，所述语音交互程序被所述处理器执行时实现以下步骤：

当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；

监测第一预设时间内是否接收到用户的语音指令；

若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。
如权利要求6所述的语音交互装置，其中，所述语音交互程序被所述处理器执行时还实现以下步骤：

监测第二预设时间内是否接收到用户的语音指令；

若第二预设时间内未接收到用户的语音指令，则获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户；

若第二预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。
如权利要求7所述的语音交互装置，其中，所述语音交互程序被所述处理器执行时还实现以下步骤：

获取线上各用户的操作行为数据，并对所述操作行为数据进行统计分析；

根据统计结果生成对应的语音帮助文件并播放，以帮助用户。
如权利要求6所述的语音交互装置，其中，所述语音交互程序被所述处理器执行时还实现以下步骤：

获取用户的个人操作行为数据，并对所述个人操作行为数据进行统计分析；

根据统计结果生成对应的语音引导文件并播放，以引导用户。
如权利要求6所述的语音交互装置，其中，所述语音交互程序被所述处理器执行时还实现以下步骤：

若第一预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有语音交互程序，所述语音交互程序被处理器执行时实现以下步骤：

当接收到用户触发的语音交互功能唤醒指令时，根据所述语音交互功能唤醒指令启动语音交互功能，并播放预设语音回应文件进行回应；

监测第一预设时间内是否接收到用户的语音指令；

若第一预设时间内未接收到用户的语音指令，则获取用户的个人操作行为数据，并根据所述个人操作行为数据生成对应的语音引导文件并播放，以引导用户。
如权利要求11所述的计算机可读存储介质，其中，所述语音交互程序被处理器执行时还实现以下步骤：

监测第二预设时间内是否接收到用户的语音指令；

若第二预设时间内未接收到用户的语音指令，则获取线上各用户的操作行为数据，并根据所述操作行为数据生成对应的语音帮助文件并播放，以帮助用户；

若第二预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。
如权利要求12所述的计算机可读存储介质，其中，所述语音交互程序被处理器执行时还实现以下步骤：

获取线上各用户的操作行为数据，并对所述操作行为数据进行统计分析；

根据统计结果生成对应的语音帮助文件并播放，以帮助用户。
如权利要求11所述的计算机可读存储介质，其中，所述语音交互程序被处理器执行时还实现以下步骤：

获取用户的个人操作行为数据，并对所述个人操作行为数据进行统计分析；

根据统计结果生成对应的语音引导文件并播放，以引导用户。
如权利要求11所述的计算机可读存储介质，其中，所述语音交互程序被处理器执行时还实现以下步骤：

若第一预设时间内接收到用户的语音指令，则对所述语音指令进行识别，并根据识别结果执行对应的操作。