CN105227656B - 基于语音识别的信息推送方法和装置 - Google Patents

基于语音识别的信息推送方法和装置 Download PDF

Info

Publication number
CN105227656B
CN105227656B CN201510627549.8A CN201510627549A CN105227656B CN 105227656 B CN105227656 B CN 105227656B CN 201510627549 A CN201510627549 A CN 201510627549A CN 105227656 B CN105227656 B CN 105227656B
Authority
CN
China
Prior art keywords
user
information
speech
mentioned
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510627549.8A
Other languages
English (en)
Other versions
CN105227656A (zh
Inventor
李丰
张秀华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510627549.8A priority Critical patent/CN105227656B/zh
Publication of CN105227656A publication Critical patent/CN105227656A/zh
Application granted granted Critical
Publication of CN105227656B publication Critical patent/CN105227656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出一种基于语音识别的信息推送方法和装置,上述基于语音识别的信息推送方法包括:接收用户输入的语音;对所述语音进行语音识别,根据语音识别的结果确定所述用户的意图;执行所述语音所指示的操作,获得满足所述用户的意图的结果;将本次语音识别的关联信息发送给服务器;接收所述服务器根据所述高频关键词推送的信息,并展示所述推送的信息。本发明通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。

Description

基于语音识别的信息推送方法和装置
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于语音识别的信息推送方法和装置。
背景技术
相对于传统的文字、点击等输入方式,当前语音输入越来越多的被应用。基于语音输入,产生了很多新的应用,如各种语音助手、语音搜索查询等。但是目前的语音输入应用有如下不足的地方:
语音识别应用基本是指令式应用,机械单一,不能更深层次的理解使用者的需求并进行满足。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于语音识别的信息推送方法。该方法通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。
本发明的第二个目的在于提出一种基于语音识别的信息推送装置。
为了实现上述目的,本发明第一方面实施例的基于语音识别的信息推送方法,包括:接收用户输入的语音;对所述语音进行语音识别,根据语音识别的结果确定所述用户的意图;执行所述语音所指示的操作,获得满足所述用户的意图的结果;将本次语音识别的关联信息发送给服务器,以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合;接收所述服务器根据所述高频关键词推送的信息,并展示所述推送的信息。
本发明实施例的基于语音识别的信息推送方法中,接收用户输入的语音之后,对上述语音进行语音识别,然后根据语音识别的结果确定上述用户的意图,执行上述语音所指示的操作,获得满足上述用户的意图的结果;将本次语音识别的关联信息发送给服务器,接收上述服务器根据上述高频关键词推送的信息,并展示上述推送的信息,从而通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。
为了实现上述目的,本发明第二方面实施例的基于语音识别的信息推送方法,包括:接收客户端发送的语音识别的关联信息,所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合;根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;根据所述高频关键词向所述客户端推送信息,以供所述客户端展示推送的信息。
本发明实施例的基于语音识别的信息推送方法,接收客户端发送的语音识别的关联信息之后,根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词,根据上述高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息,从而通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。
为了实现上述目的,本发明第三方面实施例的基于语音识别的信息推送装置,包括:接收模块,用于接收用户输入的语音;语音识别模块,用于对所述接收模块接收的语音进行语音识别,根据语音识别的结果确定所述用户的意图;执行模块,用于执行所述语音所指示的操作,获得满足所述用户的意图的结果;发送模块,用于将本次语音识别的关联信息发送给服务器,以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合;所述接收模块,还用于接收所述服务器根据所述高频关键词推送的信息;展示模块,用于展示所述推送的信息。
本发明实施例的基于语音识别的信息推送装置中,接收模块接收用户输入的语音之后,语音识别模块对上述语音进行语音识别,然后执行模块根据语音识别的结果确定上述用户的意图,执行上述语音所指示的操作,获得满足上述用户的意图的结果;发送模块将本次语音识别的关联信息发送给服务器,接收模块接收上述服务器根据上述高频关键词推送的信息,并由展示模块展示上述推送的信息,从而通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。
为了实现上述目的,本发明第四方面实施例的基于语音识别的信息推送装置,包括:接收模块,用于接收客户端发送的语音识别的关联信息,所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合;统计模块,用于根据预定时间段内所述接收模块接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;推送模块,用于根据所述统计模块获得的高频关键词向所述客户端推送信息,以供所述客户端展示推送的信息。
本发明实施例的基于语音识别的信息推送装置,接收模块接收客户端发送的语音识别的关联信息之后,统计模块根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词,然后推送模块根据上述高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息,从而通过深层次理解用户输入语音的内容,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明基于语音识别的信息推送方法一个实施例的流程图;
图2为本发明基于语音识别的信息推送方法另一个实施例的流程图;
图3为本发明基于语音识别的信息推送方法再一个实施例的流程图;
图4为本发明基于语音识别的信息推送方法再一个实施例的流程图;
图5为本发明基于语音识别的信息推送方法再一个实施例的流程图;
图6为本发明基于语音识别的信息推送装置一个实施例的结构示意图;
图7为本发明基于语音识别的信息推送装置另一个实施例的结构示意图;
图8为本发明基于语音识别的信息推送装置再一个实施例的结构示意图;
图9为本发明基于语音识别的信息推送装置再一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明基于语音识别的信息推送方法一个实施例的流程图,如图1所示,上述基于语音识别的信息推送方法可以包括:
步骤101,接收用户输入的语音。
步骤102,对上述语音进行语音识别,根据语音识别的结果确定上述用户的意图。
步骤103,执行上述语音所指示的操作,获得满足上述用户的意图的结果。
举例来说,用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等,然后客户端执行上述语音所指示的操作,获得满足上述用户的意图的结果。
其中,上述客户端可以为终端设备中安装的应用程序,上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备;或者,上述客户端也可以为独立的具有语音输入功能的智能终端设备,例如智能机器人等。
步骤104,将本次语音识别的关联信息发送给服务器,以供上述服务器根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词。
其中,上述语音识别的关联信息包括上述用户输入的语音、上述用户输入语音时接收到的背景声音、上述语音识别的结果、执行的操作和获得的结果之一或组合。
步骤105,接收上述服务器根据上述高频关键词推送的信息。
其中,上述高频关键词为出现频率高于预定数值的关键词,该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定数值的大小不作限定,举例来说,上述预定数值可以为10。
步骤106,展示上述推送的信息。
具体地,展示上述推送的信息可以包括:以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。
其中,上述推送的信息可以包括:广告和/或其他对用户有用的信息等,上述其他对用户有用的信息可以包括某地的促销、新闻和/或最新信息更新等,本实施例对上述推送的信息所包括的具体内容不作限定。
图2为本发明基于语音识别的信息推送方法另一个实施例的流程图,如图2所示,步骤105可以为:
步骤201,接收上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后,根据上述高频关键词推送的信息。
进一步地,步骤106之前,还可以包括:
步骤202,接收上述服务器在确定上述高频关键词的频率小于预定阈值之后,根据上述用户当前所处的场景推送的信息。
也就是说,根据上述高频关键词推送的信息是上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后,根据上述高频关键词向上述客户端推送的。
而在服务器确定上述高频关键词的频率小于预定阈值之后,服务器根据上述用户当前所处的场景向客户端推送信息。
其中,上述预定阈值大于上述预定数值,上述预定阈值的大小可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定阈值的大小不作限定,只要上述预定阈值大于上述预定数值即可,举例来说,上述预定阈值可以为15。
图2中以步骤202在步骤201之后执行为例示出,但本实施例并不仅限于此,步骤201与步骤202可以并行执行,也可以先后执行,本实施例对步骤201与步骤202的执行顺序不作限定。
进一步地,上述基于语音识别的信息推送方法还可以包括:接收上述服务器在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时,根据统计的上述用户语音输入的高频关键词和高频场景的历史记录推送的信息,并展示上述推送的信息。
其中,上述第一预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第一预定时间长度不作限定,举例来说,上述第一预定时间长度可以为7天。
也就是说,当用户在第一预定时间长度(例如:7天)未进行语音识别时,服务器可以根据统计的上述用户在最近一段时间(例如:1个月)语音输入的高频关键词和高频场景的历史记录,向客户端推送信息。
图3为本发明基于语音识别的信息推送方法再一个实施例的流程图,如图3所示,步骤101之前,还可以包括:
步骤301,通过智能化方式按需打开或关闭语音识别功能。
本实施例的一种实现方式中,通过智能化方式按需打开或关闭语音识别功能可以为:
根据上述用户设置的时间,定时或周期性地打开或关闭语音识别功能,举例来说,用户可以设置在某时或某时间段定时打开或关闭语音识别功能,或者用户可以设置每周、每天或每月周期性地打开或关闭语音识别功能;或者,
在上述用户设置的地点或者在上述用户设置的特定类型的地点,打开或关闭语音识别功能,也就是说,用户可以设置在某些特定地点,或特定类型的地方自动开启或关闭语音识别功能,例如:用户可以设置在公司自动关闭语音识别功能,在XXX美食广场自动开启语音识别功能等;或者,
当上述用户设置的与上述语音识别关联的应用打开时,打开语音识别功能,当上述用户设置的与上述语音识别关联的应用关闭时,关闭语音识别功能;例如:可以设置“打开QQ时同时开启语音识别,关闭QQ时同时关闭语音识别”。
本实施例的另一种实现方式中,通过智能化方式按需打开或关闭语音识别功能可以为:在上述用户使用上述语音识别功能的过程中,记录上述用户使用上述语音识别功能的使用行为信息;上述使用行为信息可以包括上述语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签,以及上述语音识别功能的结束使用时间;将上述使用行为信息发送给上述服务器,以供上述服务器统计获得第二预定时间长度内上述用户的高频语音识别使用模式;接收上述服务器发送的上述高频语音识别使用模式;根据上述高频语音识别使用模式打开或关闭上述语音识别功能。
其中,上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第二预定时间长度不作限定,举例来说,上述第二预定时间长度可以为1周或1个月。
具体地,每当用户开启和关闭语音识别时,客户端都记录如下使用行为信息:{开始时间,结束时间,位置信息,关联应用,使用特征标签}并发送到服务器,然后服务器持续统计用户的这些使用行为信息,并采用数据挖掘算法,筛选预定时间长度(例如:1周或1个月等)内上述用户的高频语音识别使用模式。然后服务器定期将上述高频语音识别使用模式发送到客户端,接收到上述高频语音识别使用模式之后,客户端可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。
举例来说,客户端接收到如下语音识别使用模式{开始时间:晚上8点,结束时间:晚上9点,位置信息:家,关联应用:QQ,使用特征标签:聊天,视频}之后,那么语音识别功能将自动在满足如上条件时自动开启和关闭,不要用户进行任何主动操作和设置。
相对于人工设置,上述打开或关闭语音识别功能的方式几乎不需要人工参与,且能不断进化适应用户最新的偏好,能够带来更好的用户体验。
上述基于语音识别的信息推送方法中,接收用户输入的语音之后,对上述语音进行语音识别,然后根据语音识别的结果确定上述用户的意图,执行上述语音所指示的操作,获得满足上述用户的意图的结果;将本次语音识别的关联信息发送给服务器,接收上述服务器根据上述高频关键词推送的信息,并展示上述推送的信息,从而通过深层次理解用户输入语音的内容,以及上述用户输入语音时的场景,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度,也带来了新的商业变现机会。
图4为本发明基于语音识别的信息推送方法再一个实施例的流程图,如图4所示,上述基于语音识别的信息推送方法可以包括:
步骤401,接收客户端发送的语音识别的关联信息。
具体地,用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等,然后客户端执行上述语音所指示的操作,获得满足上述用户的意图的结果。接下来,客户端可以将本次语音识别的关联信息发送给服务器,其中,上述语音识别的关联信息可以包括用户输入的语音、上述用户输入语音时上述客户端接收到的背景声音、上述语音的识别结果、上述客户端针对上述语音执行的操作和获得的满足上述用户的意图的结果之一或组合。
其中,上述客户端可以为终端设备中安装的应用程序,上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备;或者,上述客户端也可以为独立的具有语音输入功能的智能终端设备,例如智能机器人等。
步骤402,根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词。
其中,上述预定时间段可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定时间段的长短不作限定,举例来说,上述预定时间段可以为1天。
其中,上述高频关键词为出现频率高于预定数值的关键词,该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定数值的大小不作限定,举例来说,上述预定数值可以为10。
步骤403,根据上述高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息。
其中,上述推送的信息可以包括:广告和/或其他对用户有用的信息等,上述其他对用户有用的信息可以包括某地的促销、新闻和/或最新信息更新等,本实施例对上述推送的信息所包括的具体内容不作限定。
图5为本发明基于语音识别的信息推送方法再一个实施例的流程图,如图5所示,步骤403之前,还可以包括:
步骤501,判断上述高频关键词的频率是否大于或等于预定阈值;如果是,则执行步骤403;如果上述高频关键词的频率小于预定阈值,则执行步骤502。
其中,上述预定阈值大于上述预定数值,上述预定阈值的大小可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定阈值的大小不作限定,只要上述预定阈值大于上述预定数值即可,举例来说,上述预定阈值可以为15。
步骤502,确定上述用户当前所处的场景。
具体地,确定上述用户当前所处的场景可以为:根据上述用户输入的语音和上述用户输入语音时上述客户端接收到的背景声音,根据音频频率模式以及特征语音词,确定上述用户当前所处的场景;举例来说,上述用户输入语音时上述客户端接收到的背景声音为喧闹喝彩的声音,特征语音词有足球,射门等,则可以确定上述用户当前所处的场景可能是体育馆、家的客厅或体育主题酒吧等;或者,
根据上述用户输入语音的时间和基于位置的服务(Location Based Service;以下简称:LBS),确定上述用户当前所处的场景。
步骤503,根据上述用户当前所处的场景向上述客户端推送信息。
进一步地,步骤403之后,还可以包括:如果在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息,则根据统计的上述用户语音输入的高频关键词和高频场景的历史记录,向上述客户端推送信息。
其中,上述第一预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第一预定时间长度不作限定,举例来说,上述第一预定时间长度可以为7天。
也就是说,当用户在第一预定时间长度(例如:7天)未进行语音识别时,服务器可以根据统计的上述用户在最近一段时间(例如:1个月)语音输入的高频关键词和高频场景的历史记录,向客户端推送信息。
另外,在本次语音识别结束之后,服务器亦会有选择持续性地向客户端推送信息。
本实施例中,上述基于语音识别的信息推送方法还可以包括:接收上述客户端发送的使用行为信息,上述使用行为信息包括语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签,以及上述语音识别功能的结束使用时间;根据上述使用行为信息统计获得第二预定时间长度内上述用户的高频语音识别使用模式;将上述高频语音识别使用模式发送给上述客户端,以供上述客户端根据上述高频语音识别使用模式打开或关闭上述语音识别功能。
其中,上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第二预定时间长度不作限定,举例来说,上述第二预定时间长度可以为1周或1个月。
具体地,每当用户开启和关闭语音识别时,客户端都记录如下使用行为信息:{开始时间,结束时间,位置信息,关联应用,使用特征标签}并发送到服务器,然后服务器持续统计用户的这些使用行为信息,并采用数据挖掘算法,筛选预定时间长度(例如:1周或1个月等)内上述用户的高频语音识别使用模式。然后服务器定期将上述高频语音识别使用模式发送到客户端,接收到上述高频语音识别使用模式之后,客户端可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。
举例来说,客户端接收到如下语音识别使用模式{开始时间:晚上8点,结束时间:晚上9点,位置信息:家,关联应用:QQ,使用特征标签:聊天,视频}之后,那么语音识别功能将自动在满足如上条件时自动开启和关闭,不要用户进行任何主动操作和设置。
相对于人工设置,上述打开或关闭语音识别功能的方式几乎不需要人工参与,且能不断进化适应用户最新的偏好,能够带来更好的用户体验。
上述基于语音识别的信息推送方法中,接收客户端发送的语音识别的关联信息之后,根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词,根据上述高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息,从而通过深层次理解用户输入语音的内容,以及上述用户输入语音时的场景,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度,也带来了新的商业变现机会。
图6为本发明基于语音识别的信息推送装置一个实施例的结构示意图,本实施例中的基于语音识别的信息推送装置可以为客户端实现本发明图1~图3所示实施例的流程。
其中,上述客户端可以为终端设备中安装的应用程序,上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备;或者,上述客户端也可以为独立的具有语音输入功能的智能终端设备,例如智能机器人等。
如图6所示,上述基于语音识别的信息推送装置可以包括:接收模块61、语音识别模块62、执行模块63、发送模块64和展示模块65;
其中,接收模块61,用于接收用户输入的语音;
语音识别模块62,用于对接收模块61接收的语音进行语音识别,根据语音识别的结果确定上述用户的意图;
执行模块63,用于执行上述语音所指示的操作,获得满足上述用户的意图的结果;
举例来说,用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等,然后执行模块63执行上述语音所指示的操作,获得满足上述用户的意图的结果。
发送模块64,用于将本次语音识别的关联信息发送给服务器,以供上述服务器根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词;其中,上述语音识别的关联信息包括上述用户输入的语音、上述用户输入语音时接收到的背景声音、上述语音识别的结果、执行的操作和获得的结果之一或组合;
接收模块61,还用于接收上述服务器根据上述高频关键词推送的信息;其中,上述高频关键词为出现频率高于预定数值的关键词,该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定数值的大小不作限定,举例来说,上述预定数值可以为10。
展示模块65,用于展示上述推送的信息,本实施例中,展示模块65,具体用于以信息推送、弹窗或关联区域展示的方式展示上述推送的信息。
其中,上述推送的信息可以包括:广告和/或其他对用户有用的信息等,上述其他对用户有用的信息可以包括某地的促销、新闻和/或最新信息更新等,本实施例对上述推送的信息所包括的具体内容不作限定。
本实施例中,接收模块61,具体用于接收上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后,根据上述高频关键词推送的信息。
进一步地,接收模块61,还用于在展示模块65展示上述推送的信息之前,接收上述服务器在确定上述高频关键词的频率小于预定阈值之后,根据上述用户当前所处的场景推送的信息。
也就是说,根据上述高频关键词推送的信息是上述服务器在确定上述高频关键词的频率大于或等于预定阈值之后,根据上述高频关键词向上述客户端推送的。
而在服务器确定上述高频关键词的频率小于预定阈值之后,服务器根据上述用户当前所处的场景向客户端推送信息。
其中,上述预定阈值大于上述预定数值,上述预定阈值的大小可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定阈值的大小不作限定,只要上述预定阈值大于上述预定数值即可,举例来说,上述预定阈值可以为15。
进一步地,接收模块61,还用于接收上述服务器在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时,根据统计的上述用户语音输入的高频关键词和高频场景的历史记录推送的信息。然后,由展示模块65展示上述推送的信息。
其中,上述第一预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第一预定时间长度不作限定,举例来说,上述第一预定时间长度可以为7天。
也就是说,当用户在第一预定时间长度(例如:7天)未进行语音识别时,服务器可以根据统计的上述用户在最近一段时间(例如:1个月)语音输入的高频关键词和高频场景的历史记录,向客户端推送信息。
图7为本发明基于语音识别的信息推送装置另一个实施例的结构示意图,与图6所示的基于语音识别的信息推送装置相比,不同之处在于,图7所示的基于语音识别的信息推送装置还可以包括:
控制模块66,用于在接收模块61接收用户输入的语音之前,通过智能化方式按需打开或关闭语音识别功能。
本实施例的一种实现方式中,控制模块66,具体用于根据上述用户设置的时间,定时或周期性地打开或关闭语音识别功能,举例来说,用户可以设置在某时或某时间段定时打开或关闭语音识别功能,或者用户可以设置每周、每天或每月周期性地打开或关闭语音识别功能;或者,
在上述用户设置的地点或者在上述用户设置的特定类型的地点,打开或关闭语音识别功能,也就是说,用户可以设置在某些特定地点,或特定类型的地方自动开启或关闭语音识别功能,例如:用户可以设置在公司自动关闭语音识别功能,在XXX美食广场自动开启语音识别功能等;或者,
当上述用户设置的与上述语音识别关联的应用打开时,打开语音识别功能,当上述用户设置的与上述语音识别关联的应用关闭时,关闭语音识别功能;例如:可以设置“打开QQ时同时开启语音识别,关闭QQ时同时关闭语音识别”。
本实施例的另一种实现方式中,上述基于语音识别的信息推送装置还可以包括:记录模块67;
记录模块67,用于在上述用户使用上述语音识别功能的过程中,记录上述用户使用上述语音识别功能的使用行为信息;上述使用行为信息可以包括上述语音识别功能的开始使用时间、上述用户使用所述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签,以及上述语音识别功能的结束使用时间;
发送模块64,还用于将记录模块67记录的使用行为信息发送给上述服务器,以供上述服务器统计获得第二预定时间长度内上述用户的高频语音识别使用模式;
接收模块61,还用于接收上述服务器发送的上述高频语音识别使用模式;
控制模块66,具体用于根据接收模块61接收的高频语音识别使用模式打开或关闭上述语音识别功能。
其中,上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第二预定时间长度不作限定,举例来说,上述第二预定时间长度可以为1周或1个月。
具体地,每当用户开启和关闭语音识别时,记录模块67都记录如下使用行为信息:{开始时间,结束时间,位置信息,关联应用,使用特征标签},并由发送模块64发送到服务器,然后服务器持续统计用户的这些使用行为信息,并采用数据挖掘算法,筛选预定时间长度(例如:1周或1个月等)内上述用户的高频语音识别使用模式。然后服务器定期将上述高频语音识别使用模式发送到客户端,接收模块61接收到上述高频语音识别使用模式之后,控制模块66可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。
举例来说,接收模块61接收到如下语音识别使用模式{开始时间:晚上8点,结束时间:晚上9点,位置信息:家,关联应用:QQ,使用特征标签:聊天,视频}之后,那么语音识别功能将自动在满足如上条件时自动开启和关闭,不要用户进行任何主动操作和设置。
相对于人工设置,上述打开或关闭语音识别功能的方式几乎不需要人工参与,且能不断进化适应用户最新的偏好,能够带来更好的用户体验。
上述基于语音识别的信息推送装置中,接收模块61接收用户输入的语音之后,语音识别模块62对上述语音进行语音识别,然后根据语音识别的结果确定上述用户的意图,执行模块63执行上述语音所指示的操作,获得满足上述用户的意图的结果;发送模块64将本次语音识别的关联信息发送给服务器,接收模块61接收上述服务器根据上述高频关键词推送的信息,并由展示模块65展示上述推送的信息,从而通过深层次理解用户输入语音的内容,以及上述用户输入语音时的场景,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度,也带来了新的商业变现机会。
图8为本发明基于语音识别的信息推送装置再一个实施例的结构示意图,本实施例中的基于语音识别的信息推送装置可以作为服务器实现本发明图4和图5所示实施例的流程。如图8所示,上述基于语音识别的信息推送装置可以包括:接收模块81、统计模块82和推送模块83;
其中,接收模块81,用于接收客户端发送的语音识别的关联信息。
其中,上述语音识别的关联信息可以包括用户输入的语音、上述用户输入语音时上述客户端接收到的背景声音、上述语音的识别结果、上述客户端针对上述语音执行的操作和获得的满足上述用户的意图的结果之一或组合;
具体地,用户可以打开语音识别功能查询该用户附近的粤菜馆、设置用户提醒或宾馆预订等,然后客户端执行上述语音所指示的操作,获得满足上述用户的意图的结果。接下来,客户端可以将本次语音识别的关联信息发送给服务器。其中,上述客户端可以为终端设备中安装的应用程序,上述终端设备可以为智能手机或电脑等具有语音输入功能的智能终端设备;或者,上述客户端也可以为独立的具有语音输入功能的智能终端设备,例如智能机器人等。
统计模块82,用于根据预定时间段内接收模块81接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词;其中,上述预定时间段可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定时间段的长短不作限定,举例来说,上述预定时间段可以为1天。
其中,上述高频关键词为出现频率高于预定数值的关键词,该预定数值可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定数值的大小不作限定,举例来说,上述预定数值可以为10。
推送模块83,用于根据统计模块82获得的高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息。
其中,上述推送的信息可以包括:广告和/或其他对用户有用的信息等,上述其他对用户有用的信息可以包括某地的促销、新闻和/或最新信息更新等,本实施例对上述推送的信息所包括的具体内容不作限定。
图9为本发明基于语音识别的信息推送装置再一个实施例的结构示意图,与图8所示的基于语音识别的信息推送装置相比,不同之处在于,图9所示的基于语音识别的信息推送装置还可以包括:判断模块84;
判断模块84,用于在推送模块83根据上述高频关键词向上述客户端推送信息之前,判断上述高频关键词的频率是否大于或等于预定阈值;
推送模块83,具体用于当判断模块84确定上述高频关键词的频率大于或等于预定阈值时,根据上述高频关键词向上述客户端推送信息。
其中,上述预定阈值大于上述预定数值,上述预定阈值的大小可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述预定阈值的大小不作限定,只要上述预定阈值大于上述预定数值即可,举例来说,上述预定阈值可以为15。
进一步地,上述基于语音识别的信息推送装置还可以包括:确定模块85;
确定模块85,用于当判断模块84确定上述高频关键词的频率小于预定阈值时,确定上述用户当前所处的场景;
推送模块83,还用于根据上述用户当前所处的场景向上述客户端推送信息。
本实施例中,确定模块85,具体用于根据上述用户输入的语音和上述用户输入语音时上述客户端接收到的背景声音,根据音频频率模式以及特征语音词,确定上述用户当前所处的场景;举例来说,上述用户输入语音时上述客户端接收到的背景声音为喧闹喝彩的声音,特征语音词有足球,射门等,则可以确定上述用户当前所处的场景可能是体育馆、家的客厅或体育主题酒吧等;
或者,根据上述用户输入语音的时间和LBS,确定上述用户当前所处的场景。
本实施例中,推送模块83,还用于在第一预定时间长度内未接收到上述客户端发送的语音识别的关联信息时,根据统计的上述用户语音输入的高频关键词和高频场景的历史记录,向上述客户端推送信息。
其中,上述第一预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第一预定时间长度不作限定,举例来说,上述第一预定时间长度可以为7天。
也就是说,当用户在第一预定时间长度(例如:7天)未进行语音识别时,推送模块83可以根据统计的上述用户在最近一段时间(例如:1个月)语音输入的高频关键词和高频场景的历史记录,向客户端推送信息。
另外,在本次语音识别结束之后,推送模块83亦会有选择持续性地向客户端推送信息。
进一步地,本实施例中,接收模块81,还用于接收上述客户端发送的使用行为信息,上述使用行为信息包括语音识别功能的开始使用时间、上述用户使用上述语音识别功能的位置信息、与上述语音识别功能关联的应用和使用特征标签,以及上述语音识别功能的结束使用时间;
统计模块82,还用于根据上述使用行为信息统计获得第二预定时间长度内上述用户的高频语音识别使用模式;其中,上述第二预定时间长度可以在具体实现时根据实现需求和/或系统性能等自行设定,本实施例对上述第二预定时间长度不作限定,举例来说,上述第二预定时间长度可以为1周或1个月。
推送模块83,还用于将上述高频语音识别使用模式发送给上述客户端,以供上述客户端根据上述高频语音识别使用模式打开或关闭上述语音识别功能。
具体地,每当用户开启和关闭语音识别时,客户端都记录如下使用行为信息:{开始时间,结束时间,位置信息,关联应用,使用特征标签}并发送到服务器,然后统计模块82持续统计用户的这些使用行为信息,并采用数据挖掘算法,筛选预定时间长度(例如:1周或1个月等)内上述用户的高频语音识别使用模式。然后推送模块83定期将上述高频语音识别使用模式发送到客户端,接收到上述高频语音识别使用模式之后,客户端可以自动根据上述高频语音识别使用模式打开或关闭语音识别功能。
举例来说,客户端接收到如下语音识别使用模式{开始时间:晚上8点,结束时间:晚上9点,位置信息:家,关联应用:QQ,使用特征标签:聊天,视频}之后,那么语音识别功能将自动在满足如上条件时自动开启和关闭,不要用户进行任何主动操作和设置。
相对于人工设置,上述打开或关闭语音识别功能的方式几乎不需要人工参与,且能不断进化适应用户最新的偏好,能够带来更好的用户体验。
需要说明的是,本实施例中的服务器可以为一个服务器,也可以为至少两个服务器,本实施例对此不作限定。举例来说,当上述服务器为两个服务器时,上述两个服务器可以分别为挖掘服务器和信息推送服务器,在具体实现时,接收模块81、统计模块82和确定模块85可以位于挖掘服务器,推送模块83和判断模块84可以位于信息推送服务器,这时,挖掘服务器需要将上述用户的高频关键词和当前所处的场景等信息发送给信息推送服务器,由信息推送服务器根据上述用户的高频关键词和当前所处的场景等信息向客户端推送信息。
上述基于语音识别的信息推送装置中,接收模块81接收客户端发送的语音识别的关联信息之后,统计模块82根据预定时间段内接收到的语音识别的关联信息统计获得上述用户在上述预定时间段内的高频关键词,推送模块83根据上述高频关键词向上述客户端推送信息,以供上述客户端展示推送的信息,从而通过深层次理解用户输入语音的内容,以及上述用户输入语音时的场景,在当前以及持续一段时间内向用户推送信息,可以使用户便捷地获取信息,提高了用户体验度,也带来了新的商业变现机会。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(Programmable Gate Array;以下简称:PGA),现场可编程门阵列(Field ProgrammableGate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (28)

1.一种基于语音识别的信息推送方法,其特征在于,包括:
接收用户输入的语音;
对所述语音进行语音识别,根据语音识别的结果确定所述用户的意图;
执行所述语音所指示的操作,获得满足所述用户的意图的结果;
将本次语音识别的关联信息发送给服务器,以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合;
接收所述服务器根据所述高频关键词推送的信息,并展示所述推送的信息。
2.根据权利要求1所述的方法,其特征在于,所述接收所述服务器根据所述高频关键词推送的信息包括:
接收所述服务器在确定所述高频关键词的频率大于或等于预定阈值之后,根据所述高频关键词推送的信息。
3.根据权利要求2所述的方法,其特征在于,所述展示所述推送的信息之前,还包括:
接收所述服务器在确定所述高频关键词的频率小于预定阈值之后,根据所述用户当前所处的场景推送的信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
接收所述服务器在第一预定时间长度内未接收到客户端发送的语音识别的关联信息时,根据统计的所述用户语音输入的高频关键词和高频场景的历史记录推送的信息,并展示所述推送的信息。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述展示所述推送的信息包括:
以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。
6.根据权利要求1所述的方法,其特征在于,所述接收用户输入的语音之前,还包括:
通过智能化方式按需打开或关闭语音识别功能。
7.根据权利要求6所述的方法,其特征在于,所述通过智能化方式按需打开或关闭语音识别功能包括:
根据所述用户设置的时间,定时或周期性地打开或关闭语音识别功能;或者,
在所述用户设置的地点或者在所述用户设置的特定类型的地点,打开或关闭语音识别功能;或者,
当所述用户设置的与所述语音识别关联的应用打开时,打开语音识别功能,当所述用户设置的与所述语音识别关联的应用关闭时,关闭语音识别功能。
8.根据权利要求6所述的方法,其特征在于,所述通过智能化方式按需打开或关闭语音识别功能包括:
在所述用户使用所述语音识别功能的过程中,记录所述用户使用所述语音识别功能的使用行为信息;所述使用行为信息包括所述语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签,以及所述语音识别功能的结束使用时间;
将所述使用行为信息发送给所述服务器,以供所述服务器统计获得第二预定时间长度内所述用户的高频语音识别使用模式;
接收所述服务器发送的所述高频语音识别使用模式;
根据所述高频语音识别使用模式打开或关闭所述语音识别功能。
9.一种基于语音识别的信息推送方法,其特征在于,包括:
接收客户端发送的语音识别的关联信息,所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合;
根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;
根据所述高频关键词向所述客户端推送信息,以供所述客户端展示推送的信息。
10.根据权利要求9所述的方法,其特征在于,所述根据所述高频关键词向所述客户端推送信息之前,还包括:
判断所述高频关键词的频率是否大于或等于预定阈值;
如果是,则执行所述根据所述高频关键词向所述客户端推送信息的步骤。
11.根据权利要求10所述的方法,其特征在于,所述判断所述高频关键词的频率是否大于或等于预定阈值之后,还包括:
如果所述高频关键词的频率小于预定阈值,则确定所述用户当前所处的场景;
根据所述用户当前所处的场景向所述客户端推送信息。
12.根据权利要求11所述的方法,其特征在于,所述确定所述用户当前所处的场景包括:
根据所述用户输入的语音和所述用户输入语音时所述客户端接收到的背景声音,根据音频频率模式以及特征语音词,确定所述用户当前所处的场景;或者,
根据所述用户输入语音的时间和基于位置的服务,确定所述用户当前所处的场景。
13.根据权利要求9-12任意一项所述的方法,其特征在于,所述根据所述高频关键词向所述客户端推送信息之后,还包括:
如果在第一预定时间长度内未接收到所述客户端发送的语音识别的关联信息,则根据统计的所述用户语音输入的高频关键词和高频场景的历史记录,向所述客户端推送信息。
14.根据权利要求9所述的方法,其特征在于,还包括:
接收所述客户端发送的使用行为信息,所述使用行为信息包括语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签,以及所述语音识别功能的结束使用时间;
根据所述使用行为信息统计获得第二预定时间长度内所述用户的高频语音识别使用模式;
将所述高频语音识别使用模式发送给所述客户端,以供所述客户端根据所述高频语音识别使用模式打开或关闭所述语音识别功能。
15.一种基于语音识别的信息推送装置,其特征在于,包括:
接收模块,用于接收用户输入的语音;
语音识别模块,用于对所述接收模块接收的语音进行语音识别,根据语音识别的结果确定所述用户的意图;
执行模块,用于执行所述语音所指示的操作,获得满足所述用户的意图的结果;
发送模块,用于将本次语音识别的关联信息发送给服务器,以供所述服务器根据预定时间段内接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;所述语音识别的关联信息包括所述用户输入的语音、所述用户输入语音时接收到的背景声音、所述语音识别的结果、执行的操作和获得的结果之一或组合;
所述接收模块,还用于接收所述服务器根据所述高频关键词推送的信息;
展示模块,用于展示所述推送的信息。
16.根据权利要求15所述的装置,其特征在于,
所述接收模块,具体用于接收所述服务器在确定所述高频关键词的频率大于或等于预定阈值之后,根据所述高频关键词推送的信息。
17.根据权利要求16所述的装置,其特征在于,
所述接收模块,还用于在所述展示模块展示所述推送的信息之前,接收所述服务器在确定所述高频关键词的频率小于预定阈值之后,根据所述用户当前所处的场景推送的信息。
18.根据权利要求15所述的装置,其特征在于,
所述接收模块,还用于接收所述服务器在第一预定时间长度内未接收到客户端发送的语音识别的关联信息时,根据统计的所述用户语音输入的高频关键词和高频场景的历史记录推送的信息。
19.根据权利要求15-18任意一项所述的装置,其特征在于,
所述展示模块,具体用于以信息推送、弹窗或关联区域展示的方式展示所述推送的信息。
20.根据权利要求15所述的装置,其特征在于,还包括:
控制模块,用于在所述接收模块接收用户输入的语音之前,通过智能化方式按需打开或关闭语音识别功能。
21.根据权利要求20所述的装置,其特征在于,
所述控制模块,具体用于根据所述用户设置的时间,定时或周期性地打开或关闭语音识别功能;或者,在所述用户设置的地点或者在所述用户设置的特定类型的地点,打开或关闭语音识别功能;或者,当所述用户设置的与所述语音识别关联的应用打开时,打开语音识别功能,当所述用户设置的与所述语音识别关联的应用关闭时,关闭语音识别功能。
22.根据权利要求20所述的装置,其特征在于,还包括:记录模块;
所述记录模块,用于在所述用户使用所述语音识别功能的过程中,记录所述用户使用所述语音识别功能的使用行为信息;所述使用行为信息包括所述语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签,以及所述语音识别功能的结束使用时间;
所述发送模块,还用于将所述记录模块记录的使用行为信息发送给所述服务器,以供所述服务器统计获得第二预定时间长度内所述用户的高频语音识别使用模式;
所述接收模块,还用于接收所述服务器发送的所述高频语音识别使用模式;
所述控制模块,具体用于根据所述接收模块接收的高频语音识别使用模式打开或关闭所述语音识别功能。
23.一种基于语音识别的信息推送装置,其特征在于,包括:
接收模块,用于接收客户端发送的语音识别的关联信息,所述语音识别的关联信息包括用户输入的语音、所述用户输入语音时所述客户端接收到的背景声音、所述语音的识别结果、所述客户端针对所述语音执行的操作和获得的满足所述用户的意图的结果之一或组合;
统计模块,用于根据预定时间段内所述接收模块接收到的语音识别的关联信息统计获得所述用户在所述预定时间段内的高频关键词;
推送模块,用于根据所述统计模块获得的高频关键词向所述客户端推送信息,以供所述客户端展示推送的信息。
24.根据权利要求23所述的装置,其特征在于,还包括:判断模块;
所述判断模块,用于在所述推送模块根据所述高频关键词向所述客户端推送信息之前,判断所述高频关键词的频率是否大于或等于预定阈值;
所述推送模块,具体用于当所述判断模块确定所述高频关键词的频率大于或等于预定阈值时,根据所述高频关键词向所述客户端推送信息。
25.根据权利要求24所述的装置,其特征在于,还包括:确定模块;
所述确定模块,用于当所述判断模块确定所述高频关键词的频率小于预定阈值时,确定所述用户当前所处的场景;
所述推送模块,还用于根据所述用户当前所处的场景向所述客户端推送信息。
26.根据权利要求25所述的装置,其特征在于,
所述确定模块,具体用于根据所述用户输入的语音和所述用户输入语音时所述客户端接收到的背景声音,根据音频频率模式以及特征语音词,确定所述用户当前所处的场景;或者,根据所述用户输入语音的时间和基于位置的服务,确定所述用户当前所处的场景。
27.根据权利要求23-26任意一项所述的装置,其特征在于,
所述推送模块,还用于在第一预定时间长度内未接收到所述客户端发送的语音识别的关联信息时,根据统计的所述用户语音输入的高频关键词和高频场景的历史记录,向所述客户端推送信息。
28.根据权利要求23所述的装置,其特征在于,
所述接收模块,还用于接收所述客户端发送的使用行为信息,所述使用行为信息包括语音识别功能的开始使用时间、所述用户使用所述语音识别功能的位置信息、与所述语音识别功能关联的应用和使用特征标签,以及所述语音识别功能的结束使用时间;
所述统计模块,还用于根据所述使用行为信息统计获得第二预定时间长度内所述用户的高频语音识别使用模式;
所述推送模块,还用于将所述高频语音识别使用模式发送给所述客户端,以供所述客户端根据所述高频语音识别使用模式打开或关闭所述语音识别功能。
CN201510627549.8A 2015-09-28 2015-09-28 基于语音识别的信息推送方法和装置 Active CN105227656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510627549.8A CN105227656B (zh) 2015-09-28 2015-09-28 基于语音识别的信息推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510627549.8A CN105227656B (zh) 2015-09-28 2015-09-28 基于语音识别的信息推送方法和装置

Publications (2)

Publication Number Publication Date
CN105227656A CN105227656A (zh) 2016-01-06
CN105227656B true CN105227656B (zh) 2018-09-07

Family

ID=54996326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510627549.8A Active CN105227656B (zh) 2015-09-28 2015-09-28 基于语音识别的信息推送方法和装置

Country Status (1)

Country Link
CN (1) CN105227656B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017128361A1 (zh) * 2016-01-30 2017-08-03 深圳市博信诺达经贸咨询有限公司 基于大数据的数据推送方法及系统
CN107451131A (zh) * 2016-05-30 2017-12-08 贵阳朗玛信息技术股份有限公司 一种语音识别方法及装置
CN106128478B (zh) * 2016-06-28 2019-11-08 北京小米移动软件有限公司 语音播报方法及装置
CN106331781A (zh) * 2016-09-09 2017-01-11 深圳市九洲电器有限公司 一种基于家庭语音的分析推送方法及系统
CN106881721A (zh) * 2016-09-21 2017-06-23 摩瑞尔电器(昆山)有限公司 服务机器人的购物方法及系统
CN107133857A (zh) * 2017-05-31 2017-09-05 上海思依暄机器人科技股份有限公司 一种基于家用机器人的购物辅助方法和装置
CN109309751B (zh) * 2017-07-28 2021-08-06 腾讯科技(深圳)有限公司 语音记录方法、电子设备及存储介质
CN108111696A (zh) * 2017-12-29 2018-06-01 深圳市酷达通讯有限公司 一种无线座机
CN108710485A (zh) * 2018-04-19 2018-10-26 珠海格力电器股份有限公司 一种信息输出方法、终端设备及可读存储介质
CN108848011B (zh) * 2018-06-19 2021-08-20 广东美的制冷设备有限公司 家电设备及其语音交互方法和装置
CN109243444B (zh) 2018-09-30 2021-06-01 百度在线网络技术(北京)有限公司 语音交互方法、设备及计算机可读存储介质
CN109408024A (zh) * 2018-10-18 2019-03-01 珠海格力电器股份有限公司 信息交互方法及装置、存储介质、处理器
CN109618204B (zh) * 2018-12-12 2021-04-23 百度在线网络技术(北京)有限公司 多媒体资源播放方法和装置
CN110718219B (zh) * 2019-09-12 2022-07-22 百度在线网络技术(北京)有限公司 一种语音处理方法、装置、设备和计算机存储介质
CN110784384B (zh) * 2019-10-16 2021-11-02 杭州九阳小家电有限公司 一种家电语音技能的生成方法及智能家电
CN110827792B (zh) * 2019-11-15 2022-06-03 广州视源电子科技股份有限公司 语音播报方法及装置
CN111326149A (zh) * 2020-02-25 2020-06-23 青岛海尔空调器有限总公司 一种提高语音辨识率的优化方法及系统
CN113452463A (zh) * 2021-06-09 2021-09-28 东风柳州汽车有限公司 车载电台节目智能推送方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1404093B1 (fr) * 2002-09-26 2007-01-10 Bouygues Telecom Procédé d'accès à un service via un réseau de téléphonie mobile prenant en compte la qualité de la liaison "données"
CN103002051A (zh) * 2012-12-24 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的信息推送方法、系统及云端服务器
CN103347070A (zh) * 2013-06-28 2013-10-09 北京小米科技有限责任公司 推送语音数据的方法、终端、服务器及系统
CN103685520A (zh) * 2013-12-13 2014-03-26 深圳Tcl新技术有限公司 基于语音识别的歌曲推送的方法和装置
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259951A1 (en) * 2009-08-14 2012-10-11 Thomas Barton Schalk Systems and Methods for Delivering Content to Vehicles

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1404093B1 (fr) * 2002-09-26 2007-01-10 Bouygues Telecom Procédé d'accès à un service via un réseau de téléphonie mobile prenant en compte la qualité de la liaison "données"
CN103002051A (zh) * 2012-12-24 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的信息推送方法、系统及云端服务器
CN103347070A (zh) * 2013-06-28 2013-10-09 北京小米科技有限责任公司 推送语音数据的方法、终端、服务器及系统
CN103685520A (zh) * 2013-12-13 2014-03-26 深圳Tcl新技术有限公司 基于语音识别的歌曲推送的方法和装置
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《互联网时代语音识别基本问题》;柯登峰等;《中国科学:信息科学》;20131220;第43卷(第12期);第1578页-第1593页 *

Also Published As

Publication number Publication date
CN105227656A (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
CN105227656B (zh) 基于语音识别的信息推送方法和装置
US11714876B1 (en) Real-time event transcription system and method
KR101959368B1 (ko) 사용자 디바이스의 활성 페르소나 결정
US11151460B2 (en) Adaptive population optimization for amplifying the intelligence of crowds and swarms
CN107613400A (zh) 一种语音弹幕的实现方法和装置
CN103945240B (zh) 一种基于视频聚合的视频播放方法及装置
US20240178894A1 (en) Self-learning based on wi-fi based monitoring and augmentation
CN106296289A (zh) 一种控制广告投放的方法以及广告投放装置
CN106679321A (zh) 一种智能冰箱食物管理方法及智能冰箱
CN106524664A (zh) 一种提示物品最佳存储位置的方法、系统及智能冰箱
WO2019001075A1 (zh) 一种垃圾弹幕的识别方法、装置及计算机设备
US7417943B2 (en) Dynamic compression training method and apparatus
CN109982128A (zh) 视频的弹幕生成方法、装置、存储介质和电子装置
CN104038473A (zh) 用于插播音频广告的方法、装置、设备和系统
CN106992008A (zh) 处理方法及电子设备
CN104717302B (zh) 一种信息推送方法及装置
CN105989196A (zh) 基于采集运动信息进行社交的方法及系统
CN109584887A (zh) 一种声纹信息提取模型生成、声纹信息提取的方法和装置
CN110262264A (zh) 简化用户操作的家居设备控制方法、装置及家居设备
CN110246501A (zh) 用于会议记录的语音识别方法及系统
CN111816170B (zh) 一种音频分类模型的训练和垃圾音频识别方法和装置
CN109448710A (zh) 语音处理方法及装置、家电设备、存储介质电子装置
CN110929141A (zh) 团伙挖掘方法、装置、设备及存储介质
US20150038215A1 (en) Method for providing game replay, server for providing game replay, and recording medium storing the same
CN109068178A (zh) 一种视频播放方法及播放器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant