CN105227656B

CN105227656B - 基于语音识别的信息推送方法和装置

Info

Publication number: CN105227656B
Application number: CN201510627549.8A
Authority: CN
Inventors: 李丰; 张秀华
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-09-28
Filing date: 2015-09-28
Publication date: 2018-09-07
Anticipated expiration: 2035-09-28
Also published as: CN105227656A

Abstract

本发明提出一种基于语音识别的信息推送方法和装置，上述基于语音识别的信息推送方法包括：接收用户输入的语音；对所述语音进行语音识别，根据语音识别的结果确定所述用户的意图；执行所述语音所指示的操作，获得满足所述用户的意图的结果；将本次语音识别的关联信息发送给服务器；接收所述服务器根据所述高频关键词推送的信息，并展示所述推送的信息。本发明通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

Description

基于语音识别的信息推送方法和装置

技术领域

本发明涉及语音处理技术领域，尤其涉及一种基于语音识别的信息推送方法和装置。

背景技术

相对于传统的文字、点击等输入方式，当前语音输入越来越多的被应用。基于语音输入，产生了很多新的应用，如各种语音助手、语音搜索查询等。但是目前的语音输入应用有如下不足的地方：

语音识别应用基本是指令式应用，机械单一，不能更深层次的理解使用者的需求并进行满足。

发明内容

本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的第一个目的在于提出一种基于语音识别的信息推送方法。该方法通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

本发明的第二个目的在于提出一种基于语音识别的信息推送装置。

为了实现上述目的，本发明第一方面实施例的基于语音识别的信息推送方法，包括：接收用户输入的语音；对所述语音进行语音识别，根据语音识别的结果确定所述用户的意图；执行所述语音所指示的操作，获得满足所述用户的意图的结果；将本次语音识别的关联信息发送给服务器，以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合；接收所述服务器根据所述高频关键词推送的信息，并展示所述推送的信息。

本发明实施例的基于语音识别的信息推送方法中，接收用户输入的语音之后，对上述语音进行语音识别，然后根据语音识别的结果确定上述用户的意图，执行上述语音所指示的操作，获得满足上述用户的意图的结果；将本次语音识别的关联信息发送给服务器，接收上述服务器根据上述高频关键词推送的信息，并展示上述推送的信息，从而通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

为了实现上述目的，本发明第二方面实施例的基于语音识别的信息推送方法，包括：接收客户端发送的语音识别的关联信息，所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合；根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；根据所述高频关键词向所述客户端推送信息，以供所述客户端展示推送的信息。

本发明实施例的基于语音识别的信息推送方法，接收客户端发送的语音识别的关联信息之后，根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词，根据上述高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息，从而通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

为了实现上述目的，本发明第三方面实施例的基于语音识别的信息推送装置，包括：接收模块，用于接收用户输入的语音；语音识别模块，用于对所述接收模块接收的语音进行语音识别，根据语音识别的结果确定所述用户的意图；执行模块，用于执行所述语音所指示的操作，获得满足所述用户的意图的结果；发送模块，用于将本次语音识别的关联信息发送给服务器，以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合；所述接收模块，还用于接收所述服务器根据所述高频关键词推送的信息；展示模块，用于展示所述推送的信息。

本发明实施例的基于语音识别的信息推送装置中，接收模块接收用户输入的语音之后，语音识别模块对上述语音进行语音识别，然后执行模块根据语音识别的结果确定上述用户的意图，执行上述语音所指示的操作，获得满足上述用户的意图的结果；发送模块将本次语音识别的关联信息发送给服务器，接收模块接收上述服务器根据上述高频关键词推送的信息，并由展示模块展示上述推送的信息，从而通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

为了实现上述目的，本发明第四方面实施例的基于语音识别的信息推送装置，包括：接收模块，用于接收客户端发送的语音识别的关联信息，所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合；统计模块，用于根据预定时间段内所述接收模块接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；推送模块，用于根据所述统计模块获得的高频关键词向所述客户端推送信息，以供所述客户端展示推送的信息。

本发明实施例的基于语音识别的信息推送装置，接收模块接收客户端发送的语音识别的关联信息之后，统计模块根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词，然后推送模块根据上述高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息，从而通过深层次理解用户输入语音的内容，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明基于语音识别的信息推送方法一个实施例的流程图；

图2为本发明基于语音识别的信息推送方法另一个实施例的流程图；

图3为本发明基于语音识别的信息推送方法再一个实施例的流程图；

图4为本发明基于语音识别的信息推送方法再一个实施例的流程图；

图5为本发明基于语音识别的信息推送方法再一个实施例的流程图；

图6为本发明基于语音识别的信息推送装置一个实施例的结构示意图；

图7为本发明基于语音识别的信息推送装置另一个实施例的结构示意图；

图8为本发明基于语音识别的信息推送装置再一个实施例的结构示意图；

图9为本发明基于语音识别的信息推送装置再一个实施例的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1为本发明基于语音识别的信息推送方法一个实施例的流程图，如图1所示，上述基于语音识别的信息推送方法可以包括：

步骤101，接收用户输入的语音。

步骤102，对上述语音进行语音识别，根据语音识别的结果确定上述用户的意图。

步骤103，执行上述语音所指示的操作，获得满足上述用户的意图的结果。

举例来说，用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等，然后客户端执行上述语音所指示的操作，获得满足上述用户的意图的结果。

其中，上述客户端可以为终端设备中安装的应用程序，上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备；或者，上述客户端也可以为独立的具有语音输入功能的智能终端设备，例如智能机器人等。

步骤104，将本次语音识别的关联信息发送给服务器，以供上述服务器根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词。

其中，上述语音识别的关联信息包括上述用户输入的语音、上述用户输入语音时接收到的背景声音、上述语音识别的结果、执行的操作和获得的结果之一或组合。

步骤105，接收上述服务器根据上述高频关键词推送的信息。

其中，上述高频关键词为出现频率高于预定数值的关键词，该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述预定数值的大小不作限定，举例来说，上述预定数值可以为10。

步骤106，展示上述推送的信息。

具体地，展示上述推送的信息可以包括：以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。

其中，上述推送的信息可以包括：广告和/或其他对用户有用的信息等，上述其他对用户有用的信息可以包括某地的促销、新闻和/或最新信息更新等，本实施例对上述推送的信息所包括的具体内容不作限定。

图2为本发明基于语音识别的信息推送方法另一个实施例的流程图，如图2所示，步骤105可以为：

步骤201，接收上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后，根据上述高频关键词推送的信息。

进一步地，步骤106之前，还可以包括：

步骤202，接收上述服务器在确定上述高频关键词的频率小于预定阈值之后，根据上述用户当前所处的场景推送的信息。

也就是说，根据上述高频关键词推送的信息是上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后，根据上述高频关键词向上述客户端推送的。

而在服务器确定上述高频关键词的频率小于预定阈值之后，服务器根据上述用户当前所处的场景向客户端推送信息。

其中，上述预定阈值大于上述预定数值，上述预定阈值的大小可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述预定阈值的大小不作限定，只要上述预定阈值大于上述预定数值即可，举例来说，上述预定阈值可以为15。

图2中以步骤202在步骤201之后执行为例示出，但本实施例并不仅限于此，步骤201与步骤202可以并行执行，也可以先后执行，本实施例对步骤201与步骤202的执行顺序不作限定。

进一步地，上述基于语音识别的信息推送方法还可以包括：接收上述服务器在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时，根据统计的上述用户语音输入的高频关键词和高频场景的历史记录推送的信息，并展示上述推送的信息。

其中，上述第一预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述第一预定时间长度不作限定，举例来说，上述第一预定时间长度可以为7天。

也就是说，当用户在第一预定时间长度(例如：7天)未进行语音识别时，服务器可以根据统计的上述用户在最近一段时间(例如：1个月)语音输入的高频关键词和高频场景的历史记录，向客户端推送信息。

图3为本发明基于语音识别的信息推送方法再一个实施例的流程图，如图3所示，步骤101之前，还可以包括：

步骤301，通过智能化方式按需打开或关闭语音识别功能。

本实施例的一种实现方式中，通过智能化方式按需打开或关闭语音识别功能可以为：

根据上述用户设置的时间，定时或周期性地打开或关闭语音识别功能，举例来说，用户可以设置在某时或某时间段定时打开或关闭语音识别功能，或者用户可以设置每周、每天或每月周期性地打开或关闭语音识别功能；或者，

在上述用户设置的地点或者在上述用户设置的特定类型的地点，打开或关闭语音识别功能，也就是说，用户可以设置在某些特定地点，或特定类型的地方自动开启或关闭语音识别功能，例如：用户可以设置在公司自动关闭语音识别功能，在XXX美食广场自动开启语音识别功能等；或者，

当上述用户设置的与上述语音识别关联的应用打开时，打开语音识别功能，当上述用户设置的与上述语音识别关联的应用关闭时，关闭语音识别功能；例如：可以设置“打开QQ时同时开启语音识别，关闭QQ时同时关闭语音识别”。

本实施例的另一种实现方式中，通过智能化方式按需打开或关闭语音识别功能可以为：在上述用户使用上述语音识别功能的过程中，记录上述用户使用上述语音识别功能的使用行为信息；上述使用行为信息可以包括上述语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签，以及上述语音识别功能的结束使用时间；将上述使用行为信息发送给上述服务器，以供上述服务器统计获得第二预定时间长度内上述用户的高频语音识别使用模式；接收上述服务器发送的上述高频语音识别使用模式；根据上述高频语音识别使用模式打开或关闭上述语音识别功能。

其中，上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述第二预定时间长度不作限定，举例来说，上述第二预定时间长度可以为1周或1个月。

具体地，每当用户开启和关闭语音识别时，客户端都记录如下使用行为信息：{开始时间，结束时间，位置信息，关联应用，使用特征标签}并发送到服务器，然后服务器持续统计用户的这些使用行为信息，并采用数据挖掘算法，筛选预定时间长度(例如：1周或1个月等)内上述用户的高频语音识别使用模式。然后服务器定期将上述高频语音识别使用模式发送到客户端，接收到上述高频语音识别使用模式之后，客户端可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。

举例来说，客户端接收到如下语音识别使用模式{开始时间:晚上8点，结束时间：晚上9点，位置信息：家，关联应用：QQ，使用特征标签：聊天，视频}之后，那么语音识别功能将自动在满足如上条件时自动开启和关闭，不要用户进行任何主动操作和设置。

相对于人工设置，上述打开或关闭语音识别功能的方式几乎不需要人工参与，且能不断进化适应用户最新的偏好，能够带来更好的用户体验。

上述基于语音识别的信息推送方法中，接收用户输入的语音之后，对上述语音进行语音识别，然后根据语音识别的结果确定上述用户的意图，执行上述语音所指示的操作，获得满足上述用户的意图的结果；将本次语音识别的关联信息发送给服务器，接收上述服务器根据上述高频关键词推送的信息，并展示上述推送的信息，从而通过深层次理解用户输入语音的内容，以及上述用户输入语音时的场景，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度，也带来了新的商业变现机会。

图4为本发明基于语音识别的信息推送方法再一个实施例的流程图，如图4所示，上述基于语音识别的信息推送方法可以包括：

步骤401，接收客户端发送的语音识别的关联信息。

具体地，用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等，然后客户端执行上述语音所指示的操作，获得满足上述用户的意图的结果。接下来，客户端可以将本次语音识别的关联信息发送给服务器，其中，上述语音识别的关联信息可以包括用户输入的语音、上述用户输入语音时上述客户端接收到的背景声音、上述语音的识别结果、上述客户端针对上述语音执行的操作和获得的满足上述用户的意图的结果之一或组合。

步骤402，根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词。

其中，上述预定时间段可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述预定时间段的长短不作限定，举例来说，上述预定时间段可以为1天。

步骤403，根据上述高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息。

图5为本发明基于语音识别的信息推送方法再一个实施例的流程图，如图5所示，步骤403之前，还可以包括：

步骤501，判断上述高频关键词的频率是否大于或等于预定阈值；如果是，则执行步骤403；如果上述高频关键词的频率小于预定阈值，则执行步骤502。

步骤502，确定上述用户当前所处的场景。

具体地，确定上述用户当前所处的场景可以为：根据上述用户输入的语音和上述用户输入语音时上述客户端接收到的背景声音，根据音频频率模式以及特征语音词，确定上述用户当前所处的场景；举例来说，上述用户输入语音时上述客户端接收到的背景声音为喧闹喝彩的声音，特征语音词有足球，射门等，则可以确定上述用户当前所处的场景可能是体育馆、家的客厅或体育主题酒吧等；或者，

根据上述用户输入语音的时间和基于位置的服务(Location Based Service；以下简称：LBS)，确定上述用户当前所处的场景。

步骤503，根据上述用户当前所处的场景向上述客户端推送信息。

进一步地，步骤403之后，还可以包括：如果在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息，则根据统计的上述用户语音输入的高频关键词和高频场景的历史记录，向上述客户端推送信息。

另外，在本次语音识别结束之后，服务器亦会有选择持续性地向客户端推送信息。

本实施例中，上述基于语音识别的信息推送方法还可以包括：接收上述客户端发送的使用行为信息，上述使用行为信息包括语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签，以及上述语音识别功能的结束使用时间；根据上述使用行为信息统计获得第二预定时间长度内上述用户的高频语音识别使用模式；将上述高频语音识别使用模式发送给上述客户端，以供上述客户端根据上述高频语音识别使用模式打开或关闭上述语音识别功能。

上述基于语音识别的信息推送方法中，接收客户端发送的语音识别的关联信息之后，根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词，根据上述高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息，从而通过深层次理解用户输入语音的内容，以及上述用户输入语音时的场景，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度，也带来了新的商业变现机会。

图6为本发明基于语音识别的信息推送装置一个实施例的结构示意图，本实施例中的基于语音识别的信息推送装置可以为客户端实现本发明图1～图3所示实施例的流程。

如图6所示，上述基于语音识别的信息推送装置可以包括：接收模块61、语音识别模块62、执行模块63、发送模块64和展示模块65；

其中，接收模块61，用于接收用户输入的语音；

语音识别模块62，用于对接收模块61接收的语音进行语音识别，根据语音识别的结果确定上述用户的意图；

执行模块63，用于执行上述语音所指示的操作，获得满足上述用户的意图的结果；

举例来说，用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等，然后执行模块63执行上述语音所指示的操作，获得满足上述用户的意图的结果。

发送模块64，用于将本次语音识别的关联信息发送给服务器，以供上述服务器根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词；其中，上述语音识别的关联信息包括上述用户输入的语音、上述用户输入语音时接收到的背景声音、上述语音识别的结果、执行的操作和获得的结果之一或组合；

接收模块61，还用于接收上述服务器根据上述高频关键词推送的信息；其中，上述高频关键词为出现频率高于预定数值的关键词，该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述预定数值的大小不作限定，举例来说，上述预定数值可以为10。

展示模块65，用于展示上述推送的信息，本实施例中，展示模块65，具体用于以信息推送、弹窗或关联区域展示的方式展示上述推送的信息。

本实施例中，接收模块61，具体用于接收上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后，根据上述高频关键词推送的信息。

进一步地，接收模块61，还用于在展示模块65展示上述推送的信息之前，接收上述服务器在确定上述高频关键词的频率小于预定阈值之后，根据上述用户当前所处的场景推送的信息。

进一步地，接收模块61，还用于接收上述服务器在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时，根据统计的上述用户语音输入的高频关键词和高频场景的历史记录推送的信息。然后，由展示模块65展示上述推送的信息。

图7为本发明基于语音识别的信息推送装置另一个实施例的结构示意图，与图6所示的基于语音识别的信息推送装置相比，不同之处在于，图7所示的基于语音识别的信息推送装置还可以包括：

控制模块66，用于在接收模块61接收用户输入的语音之前，通过智能化方式按需打开或关闭语音识别功能。

本实施例的一种实现方式中，控制模块66，具体用于根据上述用户设置的时间，定时或周期性地打开或关闭语音识别功能，举例来说，用户可以设置在某时或某时间段定时打开或关闭语音识别功能，或者用户可以设置每周、每天或每月周期性地打开或关闭语音识别功能；或者，

本实施例的另一种实现方式中，上述基于语音识别的信息推送装置还可以包括：记录模块67；

记录模块67，用于在上述用户使用上述语音识别功能的过程中，记录上述用户使用上述语音识别功能的使用行为信息；上述使用行为信息可以包括上述语音识别功能的开始使用时间、上述用户使用所述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签，以及上述语音识别功能的结束使用时间；

发送模块64，还用于将记录模块67记录的使用行为信息发送给上述服务器，以供上述服务器统计获得第二预定时间长度内上述用户的高频语音识别使用模式；

接收模块61，还用于接收上述服务器发送的上述高频语音识别使用模式；

控制模块66，具体用于根据接收模块61接收的高频语音识别使用模式打开或关闭上述语音识别功能。

具体地，每当用户开启和关闭语音识别时，记录模块67都记录如下使用行为信息：{开始时间，结束时间，位置信息，关联应用，使用特征标签}，并由发送模块64发送到服务器，然后服务器持续统计用户的这些使用行为信息，并采用数据挖掘算法，筛选预定时间长度(例如：1周或1个月等)内上述用户的高频语音识别使用模式。然后服务器定期将上述高频语音识别使用模式发送到客户端，接收模块61接收到上述高频语音识别使用模式之后，控制模块66可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。

举例来说，接收模块61接收到如下语音识别使用模式{开始时间:晚上8点，结束时间：晚上9点，位置信息：家，关联应用：QQ，使用特征标签：聊天，视频}之后，那么语音识别功能将自动在满足如上条件时自动开启和关闭，不要用户进行任何主动操作和设置。

上述基于语音识别的信息推送装置中，接收模块61接收用户输入的语音之后，语音识别模块62对上述语音进行语音识别，然后根据语音识别的结果确定上述用户的意图，执行模块63执行上述语音所指示的操作，获得满足上述用户的意图的结果；发送模块64将本次语音识别的关联信息发送给服务器，接收模块61接收上述服务器根据上述高频关键词推送的信息，并由展示模块65展示上述推送的信息，从而通过深层次理解用户输入语音的内容，以及上述用户输入语音时的场景，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度，也带来了新的商业变现机会。

图8为本发明基于语音识别的信息推送装置再一个实施例的结构示意图，本实施例中的基于语音识别的信息推送装置可以作为服务器实现本发明图4和图5所示实施例的流程。如图8所示，上述基于语音识别的信息推送装置可以包括：接收模块81、统计模块82和推送模块83；

其中，接收模块81，用于接收客户端发送的语音识别的关联信息。

其中，上述语音识别的关联信息可以包括用户输入的语音、上述用户输入语音时上述客户端接收到的背景声音、上述语音的识别结果、上述客户端针对上述语音执行的操作和获得的满足上述用户的意图的结果之一或组合；

具体地，用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等，然后客户端执行上述语音所指示的操作，获得满足上述用户的意图的结果。接下来，客户端可以将本次语音识别的关联信息发送给服务器。其中，上述客户端可以为终端设备中安装的应用程序，上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备；或者，上述客户端也可以为独立的具有语音输入功能的智能终端设备，例如智能机器人等。

统计模块82，用于根据预定时间段内接收模块81接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词；其中，上述预定时间段可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述预定时间段的长短不作限定，举例来说，上述预定时间段可以为1天。

推送模块83，用于根据统计模块82获得的高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息。

图9为本发明基于语音识别的信息推送装置再一个实施例的结构示意图，与图8所示的基于语音识别的信息推送装置相比，不同之处在于，图9所示的基于语音识别的信息推送装置还可以包括：判断模块84；

判断模块84，用于在推送模块83根据上述高频关键词向上述客户端推送信息之前，判断上述高频关键词的频率是否大于或等于预定阈值；

推送模块83，具体用于当判断模块84确定上述高频关键词的频率大于或等于预定阈值时，根据上述高频关键词向上述客户端推送信息。

进一步地，上述基于语音识别的信息推送装置还可以包括：确定模块85；

确定模块85，用于当判断模块84确定上述高频关键词的频率小于预定阈值时，确定上述用户当前所处的场景；

推送模块83，还用于根据上述用户当前所处的场景向上述客户端推送信息。

本实施例中，确定模块85，具体用于根据上述用户输入的语音和上述用户输入语音时上述客户端接收到的背景声音，根据音频频率模式以及特征语音词，确定上述用户当前所处的场景；举例来说，上述用户输入语音时上述客户端接收到的背景声音为喧闹喝彩的声音，特征语音词有足球，射门等，则可以确定上述用户当前所处的场景可能是体育馆、家的客厅或体育主题酒吧等；

或者，根据上述用户输入语音的时间和LBS，确定上述用户当前所处的场景。

本实施例中，推送模块83，还用于在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时，根据统计的上述用户语音输入的高频关键词和高频场景的历史记录，向上述客户端推送信息。

也就是说，当用户在第一预定时间长度(例如：7天)未进行语音识别时，推送模块83可以根据统计的上述用户在最近一段时间(例如：1个月)语音输入的高频关键词和高频场景的历史记录，向客户端推送信息。

另外，在本次语音识别结束之后，推送模块83亦会有选择持续性地向客户端推送信息。

进一步地，本实施例中，接收模块81，还用于接收上述客户端发送的使用行为信息，上述使用行为信息包括语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签，以及上述语音识别功能的结束使用时间；

统计模块82，还用于根据上述使用行为信息统计获得第二预定时间长度内上述用户的高频语音识别使用模式；其中，上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定，本实施例对上述第二预定时间长度不作限定，举例来说，上述第二预定时间长度可以为1周或1个月。

推送模块83，还用于将上述高频语音识别使用模式发送给上述客户端，以供上述客户端根据上述高频语音识别使用模式打开或关闭上述语音识别功能。

具体地，每当用户开启和关闭语音识别时，客户端都记录如下使用行为信息：{开始时间，结束时间，位置信息，关联应用，使用特征标签}并发送到服务器，然后统计模块82持续统计用户的这些使用行为信息，并采用数据挖掘算法，筛选预定时间长度(例如：1周或1个月等)内上述用户的高频语音识别使用模式。然后推送模块83定期将上述高频语音识别使用模式发送到客户端，接收到上述高频语音识别使用模式之后，客户端可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。

需要说明的是，本实施例中的服务器可以为一个服务器，也可以为至少两个服务器，本实施例对此不作限定。举例来说，当上述服务器为两个服务器时，上述两个服务器可以分别为挖掘服务器和信息推送服务器，在具体实现时，接收模块81、统计模块82和确定模块85可以位于挖掘服务器，推送模块83和判断模块84可以位于信息推送服务器，这时，挖掘服务器需要将上述用户的高频关键词和当前所处的场景等信息发送给信息推送服务器，由信息推送服务器根据上述用户的高频关键词和当前所处的场景等信息向客户端推送信息。

上述基于语音识别的信息推送装置中，接收模块81接收客户端发送的语音识别的关联信息之后，统计模块82根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词，推送模块83根据上述高频关键词向上述客户端推送信息，以供上述客户端展示推送的信息，从而通过深层次理解用户输入语音的内容，以及上述用户输入语音时的场景，在当前以及持续一段时间内向用户推送信息，可以使用户便捷地获取信息，提高了用户体验度，也带来了新的商业变现机会。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(Programmable Gate Array；以下简称：PGA)，现场可编程门阵列(Field ProgrammableGate Array；以下简称：FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于语音识别的信息推送方法，其特征在于，包括：

接收用户输入的语音；

对所述语音进行语音识别，根据语音识别的结果确定所述用户的意图；

执行所述语音所指示的操作，获得满足所述用户的意图的结果；

将本次语音识别的关联信息发送给服务器，以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合；

接收所述服务器根据所述高频关键词推送的信息，并展示所述推送的信息。

2.根据权利要求1所述的方法，其特征在于，所述接收所述服务器根据所述高频关键词推送的信息包括：

接收所述服务器在确定所述高频关键词的频率大于或等于预定阈值之后，根据所述高频关键词推送的信息。

3.根据权利要求2所述的方法，其特征在于，所述展示所述推送的信息之前，还包括：

接收所述服务器在确定所述高频关键词的频率小于预定阈值之后，根据所述用户当前所处的场景推送的信息。

4.根据权利要求1所述的方法，其特征在于，还包括：

接收所述服务器在第一预定时间长度内未接收到客户端发送的语音识别的关联信息时，根据统计的所述用户语音输入的高频关键词和高频场景的历史记录推送的信息，并展示所述推送的信息。

5.根据权利要求1-4任意一项所述的方法，其特征在于，所述展示所述推送的信息包括：

以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。

6.根据权利要求1所述的方法，其特征在于，所述接收用户输入的语音之前，还包括：

通过智能化方式按需打开或关闭语音识别功能。

7.根据权利要求6所述的方法，其特征在于，所述通过智能化方式按需打开或关闭语音识别功能包括：

根据所述用户设置的时间，定时或周期性地打开或关闭语音识别功能；或者，

在所述用户设置的地点或者在所述用户设置的特定类型的地点，打开或关闭语音识别功能；或者，

当所述用户设置的与所述语音识别关联的应用打开时，打开语音识别功能，当所述用户设置的与所述语音识别关联的应用关闭时，关闭语音识别功能。

8.根据权利要求6所述的方法，其特征在于，所述通过智能化方式按需打开或关闭语音识别功能包括：

在所述用户使用所述语音识别功能的过程中，记录所述用户使用所述语音识别功能的使用行为信息；所述使用行为信息包括所述语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签，以及所述语音识别功能的结束使用时间；

将所述使用行为信息发送给所述服务器，以供所述服务器统计获得第二预定时间长度内所述用户的高频语音识别使用模式；

接收所述服务器发送的所述高频语音识别使用模式；

根据所述高频语音识别使用模式打开或关闭所述语音识别功能。

9.一种基于语音识别的信息推送方法，其特征在于，包括：

接收客户端发送的语音识别的关联信息，所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合；

根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；

根据所述高频关键词向所述客户端推送信息，以供所述客户端展示推送的信息。

10.根据权利要求9所述的方法，其特征在于，所述根据所述高频关键词向所述客户端推送信息之前，还包括：

判断所述高频关键词的频率是否大于或等于预定阈值；

如果是，则执行所述根据所述高频关键词向所述客户端推送信息的步骤。

11.根据权利要求10所述的方法，其特征在于，所述判断所述高频关键词的频率是否大于或等于预定阈值之后，还包括：

如果所述高频关键词的频率小于预定阈值，则确定所述用户当前所处的场景；

根据所述用户当前所处的场景向所述客户端推送信息。

12.根据权利要求11所述的方法，其特征在于，所述确定所述用户当前所处的场景包括：

根据所述用户输入的语音和所述用户输入语音时所述客户端接收到的背景声音，根据音频频率模式以及特征语音词，确定所述用户当前所处的场景；或者，

根据所述用户输入语音的时间和基于位置的服务，确定所述用户当前所处的场景。

13.根据权利要求9-12任意一项所述的方法，其特征在于，所述根据所述高频关键词向所述客户端推送信息之后，还包括：

如果在第一预定时间长度内未接收到所述客户端发送的语音识别的关联信息，则根据统计的所述用户语音输入的高频关键词和高频场景的历史记录，向所述客户端推送信息。

14.根据权利要求9所述的方法，其特征在于，还包括：

接收所述客户端发送的使用行为信息，所述使用行为信息包括语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签，以及所述语音识别功能的结束使用时间；

根据所述使用行为信息统计获得第二预定时间长度内所述用户的高频语音识别使用模式；

将所述高频语音识别使用模式发送给所述客户端，以供所述客户端根据所述高频语音识别使用模式打开或关闭所述语音识别功能。

15.一种基于语音识别的信息推送装置，其特征在于，包括：

接收模块，用于接收用户输入的语音；

语音识别模块，用于对所述接收模块接收的语音进行语音识别，根据语音识别的结果确定所述用户的意图；

执行模块，用于执行所述语音所指示的操作，获得满足所述用户的意图的结果；

发送模块，用于将本次语音识别的关联信息发送给服务器，以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合；

所述接收模块，还用于接收所述服务器根据所述高频关键词推送的信息；

展示模块，用于展示所述推送的信息。

16.根据权利要求15所述的装置，其特征在于，

所述接收模块，具体用于接收所述服务器在确定所述高频关键词的频率大于或等于预定阈值之后，根据所述高频关键词推送的信息。

17.根据权利要求16所述的装置，其特征在于，

所述接收模块，还用于在所述展示模块展示所述推送的信息之前，接收所述服务器在确定所述高频关键词的频率小于预定阈值之后，根据所述用户当前所处的场景推送的信息。

18.根据权利要求15所述的装置，其特征在于，

所述接收模块，还用于接收所述服务器在第一预定时间长度内未接收到客户端发送的语音识别的关联信息时，根据统计的所述用户语音输入的高频关键词和高频场景的历史记录推送的信息。

19.根据权利要求15-18任意一项所述的装置，其特征在于，

所述展示模块，具体用于以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。

20.根据权利要求15所述的装置，其特征在于，还包括：

控制模块，用于在所述接收模块接收用户输入的语音之前，通过智能化方式按需打开或关闭语音识别功能。

21.根据权利要求20所述的装置，其特征在于，

所述控制模块，具体用于根据所述用户设置的时间，定时或周期性地打开或关闭语音识别功能；或者，在所述用户设置的地点或者在所述用户设置的特定类型的地点，打开或关闭语音识别功能；或者，当所述用户设置的与所述语音识别关联的应用打开时，打开语音识别功能，当所述用户设置的与所述语音识别关联的应用关闭时，关闭语音识别功能。

22.根据权利要求20所述的装置，其特征在于，还包括：记录模块；

所述记录模块，用于在所述用户使用所述语音识别功能的过程中，记录所述用户使用所述语音识别功能的使用行为信息；所述使用行为信息包括所述语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签，以及所述语音识别功能的结束使用时间；

所述发送模块，还用于将所述记录模块记录的使用行为信息发送给所述服务器，以供所述服务器统计获得第二预定时间长度内所述用户的高频语音识别使用模式；

所述接收模块，还用于接收所述服务器发送的所述高频语音识别使用模式；

所述控制模块，具体用于根据所述接收模块接收的高频语音识别使用模式打开或关闭所述语音识别功能。

23.一种基于语音识别的信息推送装置，其特征在于，包括：

接收模块，用于接收客户端发送的语音识别的关联信息，所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合；

统计模块，用于根据预定时间段内所述接收模块接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词；

推送模块，用于根据所述统计模块获得的高频关键词向所述客户端推送信息，以供所述客户端展示推送的信息。

24.根据权利要求23所述的装置，其特征在于，还包括：判断模块；

所述判断模块，用于在所述推送模块根据所述高频关键词向所述客户端推送信息之前，判断所述高频关键词的频率是否大于或等于预定阈值；

所述推送模块，具体用于当所述判断模块确定所述高频关键词的频率大于或等于预定阈值时，根据所述高频关键词向所述客户端推送信息。

25.根据权利要求24所述的装置，其特征在于，还包括：确定模块；

所述确定模块，用于当所述判断模块确定所述高频关键词的频率小于预定阈值时，确定所述用户当前所处的场景；

所述推送模块，还用于根据所述用户当前所处的场景向所述客户端推送信息。

26.根据权利要求25所述的装置，其特征在于，

所述确定模块，具体用于根据所述用户输入的语音和所述用户输入语音时所述客户端接收到的背景声音，根据音频频率模式以及特征语音词，确定所述用户当前所处的场景；或者，根据所述用户输入语音的时间和基于位置的服务，确定所述用户当前所处的场景。

27.根据权利要求23-26任意一项所述的装置，其特征在于，

所述推送模块，还用于在第一预定时间长度内未接收到所述客户端发送的语音识别的关联信息时，根据统计的所述用户语音输入的高频关键词和高频场景的历史记录，向所述客户端推送信息。

28.根据权利要求23所述的装置，其特征在于，

所述接收模块，还用于接收所述客户端发送的使用行为信息，所述使用行为信息包括语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签，以及所述语音识别功能的结束使用时间；

所述统计模块，还用于根据所述使用行为信息统计获得第二预定时间长度内所述用户的高频语音识别使用模式；

所述推送模块，还用于将所述高频语音识别使用模式发送给所述客户端，以供所述客户端根据所述高频语音识别使用模式打开或关闭所述语音识别功能。