CN109493863A - 一种智能唤醒方法和装置 - Google Patents

一种智能唤醒方法和装置 Download PDF

Info

Publication number
CN109493863A
CN109493863A CN201811602257.9A CN201811602257A CN109493863A CN 109493863 A CN109493863 A CN 109493863A CN 201811602257 A CN201811602257 A CN 201811602257A CN 109493863 A CN109493863 A CN 109493863A
Authority
CN
China
Prior art keywords
wake
analysis
voice messaging
signal
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811602257.9A
Other languages
English (en)
Inventor
张胜
鲁斌
孔东泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Poly Mdt Infotech Ltd
Original Assignee
Guangzhou Poly Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Poly Mdt Infotech Ltd filed Critical Guangzhou Poly Mdt Infotech Ltd
Priority to CN201811602257.9A priority Critical patent/CN109493863A/zh
Publication of CN109493863A publication Critical patent/CN109493863A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种智能唤醒方法和装置,其中,所述方法包括获取用户的语音信息;判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;如果语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;判断分析结果是否符合预设唤醒规则;如果分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。本发明公开的方案能够降低语音唤醒的误唤醒几率。

Description

一种智能唤醒方法和装置
技术领域
本发明属于语音技术领域,具体涉及一种智能唤醒方法和装置。
背景技术
随着互联网科技的快速发展,目前大多数移动终端上都配置了语音助手,用户可以与语音助手进行互动,向语音助手发出命令使语音助手帮助用户播放音乐、点餐、查找新闻等。但是由于移动终端所使用的电池容量有限,处于降低电量消耗的目的,语音助手在不使用时都处于低能耗的状态,进入休眠模式。当用户需要使用语音助手时,可以通过触碰的方式唤醒语音助手。
而随着语音唤醒技术的兴起,用户也可以通过语音来唤醒语音助手,当用户需要对设备进行唤醒时,仅需发出对应的语音,由语音唤醒装置或模块接收该语音信息,并根据语音信息对设备进行唤醒操作。然而,在实际应用过程中,在用户之间的聊天过程中,可能会不经意间通过语音唤醒语音助手,打断用户的交谈,影响用户的使用。
因此,如何降低语音唤醒的误唤醒几率成为亟待解决的技术问题。
发明内容
本发明要解决的技术问题在于如何降低语音唤醒的误唤醒几率。
为此,根据第一方面,本发明实施例公开了一种智能唤醒方法,包括:
获取用户的语音信息;判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;如果语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;判断分析结果是否符合预设唤醒规则;如果分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。
可选地,保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号包括:将语音信息转换为文本信息;输出对文本信息进行语义分析和场景分析的分析信号。
可选地,在输出用于表征唤醒目标程序的唤醒信号之后,还包括:判断在预设时段内用户是否发出的唤醒指令;如果用户在预设时段内没有发出唤醒指令,则输出用于表征目标程序进入休眠模式的休眠信号。
可选地,预设方法包括云端处理和/或本地边缘计算。
根据第二方面,本发明实施例提供了一种智能唤醒装置,包括:
信息获取模块,用于获取用户的语音信息;指令判断模块,用于判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;分析信号模块,用于如果指令判断模块判断语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;分析结果模块,用于根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;结果判断模块,用于判断分析结果是否符合预设唤醒规则;唤醒信号模块,用于如果结果判断模块判断分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。
可选地,分析信号模块包括:文本转换单元,用于将语音信息转换为文本信息;信号输出单元,用于输出对文本信息进行语义分析和场景分析的分析信号。
可选地,还包括:时段指令模块,用于判断在预设时段内用户是否发出的唤醒指令;休眠信号模块,用于如果时段指令模块判断用户在预设时段内没有发出唤醒指令,则输出用于表征目标程序进入休眠模式的休眠信号。
可选地,预设方法包括云端处理和/或本地边缘计算。
根据第三方面,本发明提供了一种计算机装置,包括处理器,处理器用于执行存储器中存储的计算机程序实现上述第一方面任意一项的智能唤醒方法。
根据第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,处理器用于执行存储介质中存储的计算机程序实现上述第一方面任意一项的智能唤醒方法。
本发明的有益效果在于:
本发明实施例公开的一种智能唤醒方法和装置,首先获取用户的语音信息,判断语音信息中是否存在唤醒指令,如果存在唤醒指令,则对语音信息进行语义分析和场景分析,并生成分析结果,根据分析结果判断前述分析结果是否符合预设的唤醒规则,如果符合,则输出唤醒信号唤醒目标程序。相对于现有技术中仅判断唤醒词的方案而言,本发明实施例公开的方案在获取到唤醒词后对用户的语音信息进行语义分析和场景分析,只有在分析结果符合预设的唤醒规则时,才唤醒目标程序,降低了误触概率,改善用户体验。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例智能唤醒方法的流程图;
图2为本发明实施例智能唤醒装置的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,为本实施例公开的一种智能唤醒方法的流程图,该智能唤醒方法包括:
步骤S101,获取用户的语音信息。在本实施例中,可以通过麦克风等声音采集设备采集用户的声波信息作为语音信息。
步骤S102,判断语音信息中是否存在唤醒指令。在本实施例中,唤醒指令是用于唤醒目标程序的指令。唤醒指令可以是一个两字词语,也可以是一个四字词语。通过对用户所发出的声波来判断声波中是否存在唤醒指令,如果用户所发出声波中存在唤醒指令,则执行步骤S103。
步骤S103,保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号。在本实施例中,步骤S103具体的包括:按预设方法将语音信息转换为文本信息;输出对文本信息进行语义分析和场景分析的分析信号。在获取到唤醒指令后,即对用户所发出的语音信息进行保存,并将用户的语音信息按照预设的方案转换为文本信息,输出对转换后的文本信息进行语义分析和场景分析的分析信号。
步骤S104,根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果。本实施例中,根据分析信号分析语音信息的真实语义是指分析该文本信息中需要由该目标程序所执行的操作,例如可以是询问百科、也可以是点餐等。在进行语义分析和场景分析时,既可以是云端处理,也可以是本地边缘计算。
步骤S105,判断分析结果是否符合预设唤醒规则。本实施例中,对于唤醒目标程序设置有预设唤醒规则,预设唤醒规则可以是限制该目标程序在百科或其他细分的场景下才能够被唤醒,也可以是限制该目标程序在任何场景下都能够被唤醒。如果分析结果符合预设唤醒规则,则指定步骤S106,如果分析结果不符合预设唤醒规则,则不唤醒目标程序。
步骤S106,输出用于表征唤醒目标程序的唤醒信号。本实施例中,在分析结果符合预设唤醒规则时,输出唤醒信号,目标程序根据该唤醒信号被唤醒,并且目标程序在被唤醒后执行与用户所发出的语音信息相对应的动作,例如可以是回答问题等。
本实施例首先获取用户的语音信息,判断语音信息中是否存在唤醒指令,如果存在唤醒指令,则对语音信息进行语义分析和场景分析,并生成分析结果,根据分析结果判断前述分析结果是否符合预设的唤醒规则,如果符合,则输出唤醒信号唤醒目标程序。相对于现有技术中仅判断唤醒词的方案而言,本发明实施例公开的方案在获取到唤醒词后对用户的语音信息进行语义分析和场景分析,只有在分析结果符合预设的唤醒规则时,才唤醒目标程序,降低了误触概率,改善用户体验。
在可选地实施例中,步骤S106之后,还可以包括如下步骤:判断在预设时段内用户是否发出的唤醒指令;如果用户在预设时段内没有发出唤醒指令,则输出用于表征目标程序进入休眠模式的休眠信号。在目标程序被唤醒后并且针对用户的语音信息进行了相应的动作后,判断在预设时段内用户是否再次发出唤醒指令,如果没有的话,则输出休眠信号控制该目标程序进行休眠模式,以降低能耗。预设时段可以由用户自己主动自定义设定,也可以由用户依照选项进行被动选择。
本实施例还公开了一种智能唤醒装置,请参考图2,为该智能唤醒装置结构示意图,该智能唤醒装置包括:
信息获取模块201,用于获取用户的语音信息;指令判断模块202,用于判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;分析信号模块203,用于如果指令判断模块判断语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;分析结果模块204,用于根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;结果判断模块205,用于判断分析结果是否符合预设唤醒规则;唤醒信号模块206,用于如果结果判断模块判断分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。
作为可选地实施例,分析信号模块204包括:文本转换单元,用于将语音信息转换为文本信息;信号输出单元,用于输出对文本信息进行语义分析和场景分析的分析信号。
作为可选地实施例,该智能唤醒装置还包括:时段指令模块,用于判断在预设时段内用户是否发出的唤醒指令;休眠信号模块,用于如果时段指令模块判断用户在预设时段内没有发出唤醒指令,则输出用于表征目标程序进入休眠模式的休眠信号。
作为可选地实施例,预设方法包括云端处理和/或本地边缘计算。
此外,本发明实施例中还提供一种计算机装置,处理器通过执行所述计算机指令,从而实现以下方法:
获取用户的语音信息;判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;如果语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;判断分析结果是否符合预设唤醒规则;如果分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。计算机处理器用于执行存储介质中存储的计算机程序实现以下方法:
获取用户的语音信息;判断语音信息中是否存在唤醒指令,唤醒指令用于唤醒目标程序;如果语音信息中存在唤醒指令,则保存用户的语音信息并输出对语音信息进行语义分析和场景分析的分析信号;根据分析信号按预设方法分析语音信息的真实语义,并生成分析结果;判断分析结果是否符合预设唤醒规则;如果分析结果符合预设唤醒规则,则输出用于表征唤醒目标程序的唤醒信号。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进。这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (10)

1.一种智能唤醒方法,其特征在于,包括:
获取用户的语音信息;
判断所述语音信息中是否存在唤醒指令,所述唤醒指令用于唤醒目标程序;
如果所述语音信息中存在所述唤醒指令,则保存所述用户的语音信息并输出对所述语音信息进行语义分析和场景分析的分析信号;
根据所述分析信号按预设方法分析所述语音信息的真实语义,并生成分析结果;
判断所述分析结果是否符合预设唤醒规则;
如果所述分析结果符合预设唤醒规则,则输出用于表征唤醒所述所述目标程序的唤醒信号。
2.如权利要求1所述的智能唤醒方法,其特征在于,所述保存所述用户的语音信息并输出对所述语音信息进行语义分析和场景分析的分析信号包括:
将所述语音信息转换为文本信息;
输出对所述文本信息进行语义分析和场景分析的分析信号。
3.如权利要求2所述的智能唤醒方法,其特征在于,在所述输出用于表征唤醒所述所述目标程序的唤醒信号之后,还包括:
判断在预设时段内用户是否发出的唤醒指令;
如果用户在预设时段内没有发出唤醒指令,则输出用于表征所述目标程序进入休眠模式的休眠信号。
4.如权利要求2所述的智能唤醒方法,其特征在于,所述预设方法包括云端处理和/或本地边缘计算。
5.一种智能唤醒装置,其特征在于,包括:
信息获取模块,用于获取用户的语音信息;
指令判断模块,用于判断所述语音信息中是否存在唤醒指令,所述唤醒指令用于唤醒目标程序;
分析信号模块,用于如果所述指令判断模块判断所述语音信息中存在所述唤醒指令,则保存所述用户的语音信息并输出对所述语音信息进行语义分析和场景分析的分析信号;
分析结果模块,用于根据所述分析信号按预设方法分析所述语音信息的真实语义,并生成分析结果;
结果判断模块,用于判断所述分析结果是否符合预设唤醒规则;
唤醒信号模块,用于如果所述结果判断模块判断所述分析结果符合预设唤醒规则,则输出用于表征唤醒所述所述目标程序的唤醒信号。
6.如权利要求5所述的智能唤醒装置,其特征在于,所述分析信号模块包括:
文本转换单元,用于将所述语音信息转换为文本信息;
信号输出单元,用于输出对所述文本信息进行语义分析和场景分析的分析信号。
7.如权利要求6所述的智能唤醒装置,其特征在于,还包括:
时段指令模块,用于判断在预设时段内用户是否发出的唤醒指令;
休眠信号模块,用于如果所述时段指令模块判断用户在预设时段内没有发出唤醒指令,则输出用于表征所述目标程序进入休眠模式的休眠信号。
8.如权利要求6所述的智能唤醒装置,其特征在于,所述预设方法包括云端处理和/或本地边缘计算。
9.一种计算机装置,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序实现如权利要求1-4任意一项的所述的智能唤醒方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,处理器用于执行存储介质中存储的计算机程序实现如权利要求1-4任意一项所述的智能唤醒方法。
CN201811602257.9A 2018-12-26 2018-12-26 一种智能唤醒方法和装置 Pending CN109493863A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811602257.9A CN109493863A (zh) 2018-12-26 2018-12-26 一种智能唤醒方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811602257.9A CN109493863A (zh) 2018-12-26 2018-12-26 一种智能唤醒方法和装置

Publications (1)

Publication Number Publication Date
CN109493863A true CN109493863A (zh) 2019-03-19

Family

ID=65712352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811602257.9A Pending CN109493863A (zh) 2018-12-26 2018-12-26 一种智能唤醒方法和装置

Country Status (1)

Country Link
CN (1) CN109493863A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081225A (zh) * 2019-12-31 2020-04-28 苏州思必驰信息科技有限公司 技能语音唤醒方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104076916A (zh) * 2013-03-29 2014-10-01 联想(北京)有限公司 一种信息处理方法以及电子设备
CN107564518A (zh) * 2017-08-21 2018-01-09 百度在线网络技术(北京)有限公司 智能设备控制方法、装置及计算机设备
CN107644642A (zh) * 2017-09-20 2018-01-30 广东欧珀移动通信有限公司 语义识别方法、装置、存储介质及电子设备
CN107665708A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 智能语音交互方法及系统
CN108062212A (zh) * 2016-11-08 2018-05-22 沈阳美行科技有限公司 一种基于场景的语音操作方法及装置
CN108122556A (zh) * 2017-08-08 2018-06-05 问众智能信息科技(北京)有限公司 减少驾驶人语音唤醒指令词误触发的方法及装置
US20180204569A1 (en) * 2017-01-17 2018-07-19 Ford Global Technologies, Llc Voice Assistant Tracking And Activation
CN108492827A (zh) * 2018-04-02 2018-09-04 百度在线网络技术(北京)有限公司 应用程序的唤醒处理方法、装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104076916A (zh) * 2013-03-29 2014-10-01 联想(北京)有限公司 一种信息处理方法以及电子设备
CN107665708A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 智能语音交互方法及系统
CN108062212A (zh) * 2016-11-08 2018-05-22 沈阳美行科技有限公司 一种基于场景的语音操作方法及装置
US20180204569A1 (en) * 2017-01-17 2018-07-19 Ford Global Technologies, Llc Voice Assistant Tracking And Activation
CN108122556A (zh) * 2017-08-08 2018-06-05 问众智能信息科技(北京)有限公司 减少驾驶人语音唤醒指令词误触发的方法及装置
CN107564518A (zh) * 2017-08-21 2018-01-09 百度在线网络技术(北京)有限公司 智能设备控制方法、装置及计算机设备
CN107644642A (zh) * 2017-09-20 2018-01-30 广东欧珀移动通信有限公司 语义识别方法、装置、存储介质及电子设备
CN108492827A (zh) * 2018-04-02 2018-09-04 百度在线网络技术(北京)有限公司 应用程序的唤醒处理方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081225A (zh) * 2019-12-31 2020-04-28 苏州思必驰信息科技有限公司 技能语音唤醒方法及装置
US11721328B2 (en) 2019-12-31 2023-08-08 Ai Speech Co., Ltd. Method and apparatus for awakening skills by speech

Similar Documents

Publication Publication Date Title
CN107704275B (zh) 智能设备唤醒方法、装置、服务器及智能设备
CN107360327B (zh) 语音识别方法、装置和存储介质
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN111083678B (zh) 蓝牙音箱的播放控制方法、系统及智能设备
US11194378B2 (en) Information processing method and electronic device
CN110060678B (zh) 一种基于智能设备的虚拟角色控制方法及智能设备
CN106502649A (zh) 一种机器人服务唤醒方法及装置
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN103971681A (zh) 一种语音识别方法及系统
CN105244042B (zh) 一种基于有限状态自动机的语音情感交互装置与方法
CN105469789A (zh) 一种语音信息的处理方法及终端
CN111161714A (zh) 一种语音信息处理方法、电子设备及存储介质
CN112735418A (zh) 一种语音交互的处理方法、装置、终端及存储介质
CN111312222A (zh) 一种唤醒、语音识别模型训练方法及装置
CN110246502A (zh) 语音降噪方法、装置及终端设备
CN111683317B (zh) 一种应用于耳机的提示方法、装置、终端及存储介质
CN109389977B (zh) 一种语音交互方法及装置
CN110956968A (zh) 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备
CN109493863A (zh) 一种智能唤醒方法和装置
CN111312243B (zh) 设备交互方法和装置
CN112015879A (zh) 基于文本结构化管理的人机交互引擎实现方法及装置
US20200409745A1 (en) Do-Not-Disturb Processing Method and Apparatus, and Storage Medium
CN106486111B (zh) 基于智能机器人的多tts引擎输出语速调节方法及系统
CN109788128A (zh) 一种来电提示方法、来电提示装置及终端设备
US11475069B2 (en) Corpus processing method, apparatus and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190319