CN108182943A - 一种智能设备控制方法、装置及智能设备 - Google Patents
一种智能设备控制方法、装置及智能设备 Download PDFInfo
- Publication number
- CN108182943A CN108182943A CN201711482957.4A CN201711482957A CN108182943A CN 108182943 A CN108182943 A CN 108182943A CN 201711482957 A CN201711482957 A CN 201711482957A CN 108182943 A CN108182943 A CN 108182943A
- Authority
- CN
- China
- Prior art keywords
- user
- smart machine
- voice messaging
- interactive instruction
- speech information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例提供了一种智能设备控制方法、装置及智能设备,所述智能设备控制方法包括:响应完第一用户语音信息对应的交互指令后,保持工作状态;在接收到第二用户语音信息后,获得所述第二用户语音信息对应的语音识别结果;根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度是否大于等于预设相关度;若所述相关度大于等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备,用户与智能设备的交互过程简单,用户体验较好。
Description
技术领域
本发明涉及设备控制技术领域,特别是涉及一种智能设备控制方法、一种智能设备控制装置及一种智能设备。
背景技术
随着科学技术的快速发展,智能设备逐渐应用到各行各业,用户可以与智能设备进行语音交互。当用户需要与智能设备进行语音交互时,用户首先通过预设的唤醒词将智能设备由休眠状态切换至工作状态;然后向智能设备发送用户语音信息,智能设备接收到用户语音信息后,响应用户语音信息对应的交互指令。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
智能设备被用户唤醒后,用户可能就相同话题的内容与智能设备进行多次交互。为了避免周围环境中的噪音或者不同话题的内容对用户与智能设备的多次交互造成影响。在用户与智能设备进行完一次交互后,智能设备由工作状态切换至休眠状态,当用户需要与智能设备进行下一次交互时,用户需要再次将智能设备由休眠状态切换至工作状态。可见,用户与智能设备交互过程繁琐,用户体验较差。
发明内容
本发明实施例的目的在于提供一种智能设备控制方法、装置及智能设备,以使得用户与智能设备的交互过程简单。具体技术方案如下:
第一方面,本发明实施例提供了一种智能设备控制方法,应用于智能设备,所述方法包括:
响应完第一用户语音信息对应的交互指令后,保持工作状态;
在接收到第二用户语音信息后,获得所述第二用户语音信息对应的语音识别结果;
根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度;
若所述相关度大于等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
可选的,所述方法还包括:
根据所述语音识别结果,识别所述第二用户语音信息的意图;
判断识别出的意图是否为所述智能设备可处理的意图;
若判断出识别出的意图为所述智能设备可处理的意图,响应所述目标交互指令。
可选的,在判断出识别出的意图为所述智能设备可处理的意图之后,所述方法还包括:
判断所述智能设备是否处于预设状态,其中,所述预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,所述响应操作为:用于响应用户语音信息对应的交互指令的操作;
若所述智能设备处于预设状态,判断所述语音识别结果中是否包含所述响应触发词;
若所述语音识别结果中包括所述响应触发词,执行所述响应所述目标交互指令的步骤。
可选的,所述判断所述智能设备是否处于预设状态,包括:
判断所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数是否大于第一预设次数,其中,所述目标用户语音信息为:所述智能设备不能识别出能够处理的意图的用户语音信息;
若接收到目标用户语音信息的次数大于第一预设次数,则判断出所述智能设备处于预设状态。
可选的,所述方法还包括:
满足预设条件的情况下,所述智能设备由工作状态切换至休眠状态;
其中,预设条件为以下条件中的至少一种:
所述智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长;
所述目标交互指令为音频和/或视频播放指令的情况下,成功响应所述目标交互指令;
所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
可选的,在所述对所述第二用户语音信息进行语音识别,得到语音识别结果之前,所述方法还包括:
通过麦克风阵列,确定所述第二用户语音信息的声源方位;
根据所述声源方位判断所述第二用户语音信息是否为与所述智能设备交互的语音信息;
若所述第二用户语音信息为与所述智能设备交互的语音信息,执行所述对所述第二用户语音信息进行语音识别,得到语音识别结果的步骤。
第二方面,本发明实施例还提供了一种设备控制装置,应用于智能设备,所述装置包括:
工作状态保持模块,用于响应完第一用户语音信息对应的交互指令后,保持工作状态;
语音识别模块,用于在接收到第二用户语音信息后,对所述第二用户语音信息进行语音识别,得到语音识别结果;
相关度判断模块,用于根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度是否大于等于预设相关度;
交互指令响应模块,用于若所述相关度大于等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
可选的,所述装置还包括:
意图识别模块,用于若所述相关度小于预设相关度,根据所述语音识别结果,识别所述第二用户语音信息的意图;
意图判断模块,用于判断识别出的意图是否为所述智能设备可处理的意图,若判断出识别出的意图为所述智能设备可处理的意图,触发所述交互指令响应模块执行响应所述目标交互指令的步骤。
可选的,所述装置还包括:
状态判断模块,用于在判断出识别出的意图为所述智能设备可处理的意图之后,判断所述智能设备是否处于预设状态,其中,所述预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,所述响应操作为:用于响应用户语音信息对应的交互指令的操作;
触发词判断模块,用于若所述智能设备处于预设状态,判断所述语音识别结果中是否包含所述响应触发词,若所述语音识别结果中包括所述响应触发词,触发所述交互指令响应模块执行所述响应所述目标交互指令的步骤。
可选的,所述状态判断模块,具体用于:
判断所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数是否大于第一预设次数,其中,所述目标用户语音信息为:所述智能设备不能识别出能够处理的意图的用户语音信息;
若接收到目标用户语音信息的次数大于第一预设次数,则判断出所述智能设备处于预设状态。
可选的,所述装置还包括:
状态切换模块,用于满足预设条件的情况下,所述智能设备由工作状态切换至休眠状态;
其中,预设条件为以下条件中的至少一种:
所述智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长;
所述目标交互指令为音频和/或视频播放指令的情况下,成功响应所述目标交互指令;
所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
可选的,所述装置还包括:
声源方位确定模块,用于在所述对所述第二用户语音信息进行语音识别,得到语音识别结果之前,通过麦克风阵列,确定所述第二用户语音信息的声源方位;
语音信息判断模块,用于根据所述声源方位判断所述第二用户语音信息是否为与所述智能设备交互的语音信息,若所述第二用户语音信息为与所述智能设备交互的语音信息,触发所述语音识别模块执行所述对所述第二用户语音信息进行语音识别,得到语音识别结果的步骤。
第三方面,本发明实施例还提供了一种智能设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述任一智能设备控制方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行第一方面所述的任一智能设备控制方法。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面所述的任一智能设备控制方法。
与现有技术相比,本发明实施例提供的技术方案,智能设备在响应完第一用户语音信息对应的交互指令后,保持工作状态;在接收到第二用户语音信息后,对第二语音信息进行语音识别,得到语音识别结果;根据第二用户语音信息的语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度,即判断出第二用户语音信息与第一用户语音信息是否为相同话题的用户语音信息;如果第二用户语音信息与第一用户语音信息的相关度大于预设相关度,说明第二用户语音信息与第一用户语音信息为相同话题的用户语音信息,即说明用户就相同话题的内容与智能设备进行连续交互,因此,智能设备响应第二用户语音信息对应的交互指令。
可见,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互时,均需要唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种智能设备控制方法的流程图;
图2为本发明实施例所提供的一种智能设备控制方法的另一流程图;
图3为本发明实施例所提供的一种智能设备控制方法的另一流程图;
图4为本发明实施例所提供的一种智能设备控制装置的结构示意图;
图5为本发明实施例所提供的一种智能设备控制装置的另一结构示意图;
图6为本发明实施例所提供的一种智能设备控制装置的另一结构示意图;
图7为本发明实施例所提供的一种智能设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了解决现有技术问题,本发明实施例提供了一种智能设备控制方法、装置及智能设备,以在保证智能设备被用户唤醒后,用户不需要再次唤醒智能设备就可以就相同话题的内容与智能设备进行多次交互,从而保证用户与智能设备的交互过程简单,提高用户体验。
下面将对本发明实施例所提供的一种设备智能控制方法进行介绍。
需要强调的是,上述智能设备可以为:智能手机、智能家居产品(如:智能音箱)、智能车载设备、智能穿戴设备、智能机器人等,这都是合理的;而且上述智能设备可以采用与服务器通信连接的方式工作,也可以单独工作,本发明实施例并不对此进行限定。
如图1所示,本发明实施例所提供的一种智能设备控制方法,包括如下步骤:
S110,响应完第一用户语音信息对应的交互指令后,保持工作状态;
S120,在接收到第二用户语音信息后,获得第二用户语音信息对应的语音识别结果;
S130,根据该语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度是否大于等于预设相关度;
S140,若相关度大于等于预设相关度,响应目标交互指令,其中,该目标交互指令为:第二用户语音信息对应的交互指令。
采用上述图1所示的智能设备控制方法,智能设备在响应完第一用户语音信息对应的交互指令后,保持工作状态;在接收到第二用户语音信息后,对第二语音信息进行语音识别,得到语音识别结果;根据第二用户语音信息的语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度,即判断出第二用户语音信息与第一用户语音信息是否为相同话题的用户语音信息;如果第二用户语音信息与第一用户语音信息的相关度大于预设相关度,说明第二用户语音信息与第一用户语音信息为相同话题的用户语音信息,即说明用户就相同话题的内容与智能设备进行连续交互,因此,智能设备响应第二用户语音信息对应的交互指令。
可见,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互时,均需要唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
下面将对如图1所示的实施例提供的智能设备控制方法进行详细描述。
S110,响应完第一用户语音信息对应的交互指令后,保持工作状态;
智能设备响应完第一用户语音信息对应的交互指令后,用户可能就相同话题的内容还与智能设备进行一次或者多次交互。
为了保证用户不需要再次通过唤醒词唤醒智能设备,就能够就相同话题的内容与智能设备进行再次交互,智能设备在响应完第一用户语音信息对应的交互指令后,保持工作状态。
举例而言,智能手机的唤醒词为“小明”,用户向智能手机发送用户语音信息“小明”,将智能手机唤醒,即使得智能手机由休眠状态切换至工作状态;然后用户又向智能手机发送第一用户语音信息“查找周杰伦的歌曲”,智能手机接收到该第一用户语音信息后,对该第一用户语音信息进行语音识别,并查找周杰伦的歌曲,在查找到周杰伦的歌曲时,智能手机响应完第一用户语音信息,并保持工作状态,而不像现有技术那样,智能手机由工作状态切换至休眠状态。
可以理解的是,智能设备在响应完第一用户语音信息后,并不是一直处于工作状态,而是可以在预设时间内处于工作状态,举例而言,预设时间为20s,则智能设备在响应完第一用户语音信息后的20s内,智能设备处于工作状态,若在响应完第一用户语音信息后的20s内,智能设备未接收到第二用户语音信息,则智能设备由工作状态切换至休眠状态。
S120,在接收到第二用户语音信息后,获得第二用户语音信息对应的语音识别结果;
智能设备在响应完第一用户语音信息后,且保持工作状态的情况下,若接收到第二用户语音信息,智能设备可以对第二用户语音信息进行语音识别,得到语音识别结果;或者,智能设备在接收到第二用户语音信息后,将第二用户语音信息发送至与其通信连接的服务器,由该服务器对第二用户语音信息进行语音识别,服务器得到语音识别结果之后,将语音识别结果发送至智能设备。这都是合理的。
举例而言,仍然以步骤S101中的例子为例,在智能手机查找到周杰伦的歌曲后,若用户想要智能手机播放所查找到的歌曲中的七里香,则用户发出第二用户语音信息“请播放七里香”,智能设备在接收该第二用户语音信息后,对该第二用户语音信息进行语音识别,得到的语音识别结果为“请播放七里香”。或者,智能设备将第二用户语音信息“请播放七里香”发送至与其通信连接的服务器,由服务器对第二用户语音信息进行语音识别,得到语音识别结果;然后服务器将语音识别结果发送至智能手机。
需要说明的是,发出第二用户语音信息的用户与发出第一用户语音信息的用户可能为同一用户,也可能为不同的用户,这都是合理的。
例如,有两个用户,分别为用户A和用户B,智能设备为智能电视,用户A发出第一用户语音信息“查找周杰伦的歌曲”,智能电视查找到周杰伦的歌曲后,若用户A想听七里香,则用户A可以发出第二用户语音信息“请播放七里香”;或者,用户A发出第一用户语音信息“查找周杰伦的歌曲”,智能电视查找到周杰伦的歌曲后,若用户B想听双截棍,则用户B可以发出第二用户语音信息“请播放双截棍”。
S130,根据该语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度,若相关度大于等于预设相关度,执行S140;
在得到第二用户语音信息对应的语音识别结果后,可以根据第二用户语音信息对应的语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度。其中,判断第二用户语音信息与第一用户语音信息的相关度的方式可以有多种,例如,可以通过第二用户语音信息的语音识别结果及第一用户语音信息的语音识别结果的语义来判断第二用户语音信息与第一用户语音信息的相关度;或者,智能设备可以预先通过机器学习的方式训练出判断用户语音信息相关度的模型,该模型根据第二用户语音信息的语音识别结果来判断第二用户语音信息与第一用户语音信息的相关度,这都是合理的。本发明实施例对判断第二用户语音信息与第一用户语音信息的相关度的方式不做具体限定。
可以理解的是,该相关度可以用来衡量第二用户语音信息与第一用户语音信息为相同话题的用户语音信息的概率。具体的,若第二用户语音信息与第一用户语音信息的相关度较高,则说明第二用户语音信息与第一用户语音信息为相同话题的用户语音信息的概率较高;若第二用户语音信息与第一用户语音信息的相关度较低,则说明第二用户语音信息与第一用户语音信息为相同话题的用户语音信息的概率较低。
举例而言,第一用户语音信息为“查找周杰伦的歌曲”,第二用户语音信息为“请播放七里香”,由于七里香是周杰伦演唱的歌曲之一,因此,可以判断出第一用户语音信息与第二用户语音信息的相关度较高,即可以判断出第一用户语音信息与第二用户语音信息为相同话题的用户语音信息。
再例如,第一用户语音信息为“查找周杰伦的歌曲”,第二用户语音信息为“今天天气怎么样”,由于天气与歌曲并没有必然的联系,因此,可以判断出第一用户语音信息与第二用户语音信息的相关度较低,即可以判断出第一用户语音信息与第二用户语音信息为不同话题的用户语音信息。
S140,响应目标交互指令,其中,该目标交互指令为:第二用户语音信息对应的交互指令。
如果第二用户语音信息与第一用户语音信息的相关度大于预设相关度,说明第二用户语音信息与第一用户语音信息的相关度较高,第二用户语音信息与第一用户语音信息为相同话题的用户语音信息,也就是说,用户就相同话题的内容再次与智能设备进行交互,此时,智能设备响应第二用户语音信息对应的交互指令,以使得用户不需要再次唤醒智能设备,就可以就相同话题的内容与智能设备进行两次交互。
当然,本发明实施例只是示例性地说明用户就相同话题的内容与智能设备进行两次交互,在实际应用中,用户可以就相同话题的内容与智能设备进行多次交互。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在实际应用中,用户既可能就相同话题的内容与智能设备进行多次交互,也可能就不同话题的内容与智能设备进行多次交互。
举例而言,用户向智能设备发出第一用户语音信息为“查找周杰伦的歌曲”,在智能设备查找到周杰伦的歌曲后,智能设备即响应完第一用户语音信息;然后,用户想查询今天的天气,那么用户会发出第二用户语音信息“今天天气怎么样”。很明显,第二用户语音信息与第一用户语音信息是不同话题的用户语音信息。
为了使得用户在不需要再次唤醒智能设备的情况下,既能就相同话题的内容与智能设备进行多次交互,又能就不同话题的内容与智能设备进行多次交互。本发明实施例还提供了一种智能设备控制方法,如图2所示,所述方法包括:
S210,响应完第一用户语音信息对应的交互指令后,保持工作状态;
S220,在接收到第二用户语音信息后,获得第二用户语音信息对应的语音识别结果;
S230,根据该语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度是否大于等于预设相关度,若相关度大于等于预设相关度,执行步骤S260,若相关度小于预设相关度,执行S240。
S240,根据第二用户语音信息对应的语音识别结果,识别第二用户语音信息的意图;
S250,判断识别出的意图是否为智能设备可处理的意图,若判断出识别出的意图为智能设备可处理的意图,执行步骤S260;
S260,响应目标交互指令,其中,该目标交互指令为:第二用户语音信息对应的交互指令。
在该实施例中,步骤S210至S230与步骤S110至S140的内容相同,由于在如图1所述的实施例中,已经对步骤S110至S140进行了详细的描述,在该实施例中不再赘述。
下面将对步骤S240至S260进行详细的阐述。
S240,根据第二用户语音信息对应的语音识别结果,识别第二用户语音信息的意图;
如果第二用户语音信息与第一用户语音信息的相关度小于预设相关度,则说明第二用户语音信息与第一用户语音信息的相关度较低,即第二用户语音信息与第一用户语音信息为不同话题的用户语音信息,即用户语音信息发生了话题转换。
此时,对于智能设备而言,接收到的第二用户语音信息可能有两大类,第一大类用户语音信息为:有意图的用户语音信息,例如,用户发出的切换交互话题的用户语音信息为有意图的用户语音信息;第二类用户语音信息为:没有意图的用户语音信息,具体的,没有意图的用户语音信息可以为本身没有意图的用户语音信息,例如,用户唱歌时的歌声为没有意图的用户语音信息为本身没有意图的用户语音信息;没有意图的用户语音信息还可以为其本身是有意图的用户语音信息,但是,智能设备无法识别出其意图,例如,两个用户交流时产生的用户语音信息“你明天几点起床”,该用户语音信息本身是有意图的用户语音信息,但是智能设备无法知道用户明天几点起床,因此,该用户语音信息为智能设备无法识别意图的用户语音信息。
由上述描述可知,当第二用户语音信息为第一大类用户语音信息时,即第二用户语音信息为有意图的用户语音信息时,为了满足用户需求,智能设备需要响应第二用户语音信息对应的交互指令;当第二用户语音信息为第二大类用户语音信息时,即第二用户语音信息为没有意图的用户语音信息时,为了避免没有意图的用户语音信息对用户与智能设备的正常交互产生干扰,智能设备不应该响应第二用户语音信息对应的交互指令。
因此,为了保证在第二用户语音信息为有意图的用户语音信息时,智能设备能够成功响应第二用户语音信息对应的交互指令,智能设备需要识别第二用户语音信息的意图。
其中,智能设备需要识别第二用户语音信息的意图的方式有多种,例如,可以根据第二用户语音信息的语音识别结果的语义来判断出第二用户语音信息的意图;还可以通过预先训练的意图识别模型来识别出第二用户语音信息的意图,可以理解的是,本领域技术人员能够得知意图识别模型的训练过程,在此不再赘述。
S250,判断识别出的意图是否为智能设备可处理的意图;
智能设备可以处理的意图通常是有限的,可以预先存储其可处理的意图,在智能设备识别出第二用户语音信息的意图后,判断第二用户语音信息的意图是否为智能设备可处理的意图。
举例而言,智能设备预先存储的可处理意图包括“天气”,当第二用户语音信息为“今天天气怎么样”时,对智能设备而言,该第二用户语音信息为智能设备可处理的意图,即智能设备能够识别出第二用户语音信息的意图为“想要知道今天的天气怎么样”,并能够为用户提供今天的天气信息;
再例如,智能设备预先存储的可处理意图中未包括“用户几点起床”,若第二用户语音信息为“你明天几点起床”时,虽然第二用户语音信息本身是有意图的用户语音信息,但是该第二用户语音信息显然是两个用户交流时的用户语音信息,因此,对于智能设备而言,该第二用户语音信息为智能设备不可处理的意图,即智能设备无法知道用户明天几点起床,也就是说,智能设备无法识别出第二用户语音信息的意图是什么。
S260,响应目标交互指令,其中,该目标交互指令为第二用户语音信息对应的交互指令。
在智能设备判断出第二用户语音信息的意图为智能设备能够处理的意图后,为了使得用户能够成功地与智能设备进行交互,提高用户的体验,智能设备响应第二用户语音信息对应的交互指令。
举例而言,第二用户语音信息为“今天天气怎么样”,智能设备接收到该第二用户语音信息后,获得该第二用户语音信息对应的语音识别结果为“今天天气怎么样”,然后根据该语音识别结果获取到今天的天气信息,并播放今天的天气信息。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而且用户就不同话题的内容与智能设备进行交互时,用户也不需要再次唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在图2所示实施例的基础上,本发明实施例还提供了一种智能设备控制方法,如图3所示,所述方法包括如下步骤:
S310,响应完第一用户语音信息对应的交互指令后,保持工作状态;
S320,在接收到第二用户语音信息后,获得第二用户语音信息对应的语音识别结果;
S330,根据该语音识别结果,判断第二用户语音信息与第一用户语音信息的相关度是否大于等于预设相关度,若相关度大于等于预设相关度,执行步骤S380,若相关度小于预设相关度,执行步骤S340;
S340,根据第二用户语音信息对应的语音识别结果,识别第二用户语音信息的意图;
S350,判断识别出的意图是否为智能设备可处理的意图,若判断出识别出的意图为智能设备可处理的意图,执行步骤S360;
S360,判断所述智能设备是否处于预设状态,若智能设备处于预设状态,执行步骤S370,其中,该预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,该响应操作为:用于响应用户语音信息对应的交互指令的操作;
S370,判断语音识别结果中是否包含响应触发词,若语音识别结果中包括响应触发词,执行步骤S380;
S380,响应目标交互指令,其中,目标交互指令为第二用户语音信息对应的交互指令。
在该实施例中,步骤S310至S330与步骤S110至S140的内容相同,步骤S340至S350与步骤S240至S250相同,由于在如图1所述的实施例中,已经对步骤S110至S140进行了详细的描述;在图2所示的实施例中,已经对步骤S240至S250进行了详细的描述,在该实施例中不再对S310至S350进行赘述。
下面将对步骤S360至S380进行详细的阐述。
S360,判断智能设备是否处于预设状态,其中,该预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,该响应操作为:用于响应用户语音信息对应的交互指令的操作;
在实际应用中,有时会出现这样的情况:智能设备响应完第一用户语音信息之后,用户间隔一段时间才会与智能设备进行下一次交互。例如,在智能设备响应完第一用户语音信息后,用户没有向智能设备发出第二用户语音信息,而是与另一个用户进行交流。
由上述描述可知,在实际应用中,智能设备在响应完第一用户语音信息的到接收到第二用户语音信息这段时间内,智能设备可能接收到一类目标用户语音信息,该类目标用户语音信息的意图是智能设备不可处理的意图,例如,该类目标用户语音信息可以为两个用户交流的用户语音信息。
由于智能设备接收到的目标用户语音信息的意图是其自身不可处理的意图,智能设备会认为用户在短时间内与其交互的可能性减小,因此,智能设备会进入一个预设状态。智能设备处于该预设状态时,当智能设备接收到的第二用户语音信息与第一用户语音信息的相关度大于预设相关度时,智能设备会响应第二用户语音信息;当智能设备接收到的用户语音信息与第一用户语音信息的相关度小于预设相关度时,即用户语音信息发生话题转换时,需要用户语音信息对应的语音识别结果中包含响应触发词才可以响应用户语音信息对应的交互指令。其中,该预设响应触发词可以是唤醒词、退出上一次交互、切换到下一次交互等等,本发明实施例对预设响应触发词不做具体限定,任何可以触发智能设备响应用户语音信息对应的交互指令的触发词均可以是本发明实施例所述的预设响应触发词。
在一种实施方式中,可以通过如下方式来判断智能设备是否处于预设状态:
具体的,在智能设备持续处于工作状态的情况下,判断智能设备接收到的上述目标用户语音信息的次数是否大于第一预设次数。如果智能设备接收到上述目标用户语音信息的次数大于第一预设次数,说明用户在短时间内与智能设备交互的可能性较低,此时智能设备进入预设状态;如果智能设备接收到目标用户语音信息的次数小于等于第一预设次数,说明用户在短时间内与智能设备交互的可能性较高,此时智能设备不会进入预设状态。
需要说明的是,可以通过如下方式来判断智能设备接收到的目标用户语音信息的次数是否大于第一预设次数:
第一种方式为:智能设备每接受到一次目标用户语音信息,则将接收到的目标用户语音信息的次数加1,在接收到的目标用户语音信息的次数的累加值达到预设最大值时,则智能设备接收到的目标用户语音信息的次数是否大于第一预设次数。
举例而言,预设最大值为10,计数值的初始值为0,该预设最大值用于表示智能设备接收目标用户语音信息的第一预设次数,该计数值用于表示智能设备接收到目标用户语音信息的次数。具体的,智能设备第一次接收到目标用户语音信息时,计数值更新为1;第二次接收到目标用户语音信息时,计数值更新为2;……当第十次接收到目标用户语音信息时,计数值更新为10,在当第十一次接收到目标用户语音信息时,计数值更新为11,由于当前计数值大于预设最大值10,因此,判断出智能设备接收到的目标用户语音信息的次数是否大于第一预设次数。
第二种方式为:智能设备中预先设置一个计数值,可以为该计数值设置一个初始最大值,可以用初始最大值与当前计数值的差来表示智能设备当前接收到目标用户语音信息的次数,具体的,智能设备每接收到一次目标用户语音信息时,该计数值更新一次,即计数值减1,当计数值减小到预设阈值时,则智能设备接收到的目标用户语音信息的次数大于第一预设次数。举例而言,计数值的初始最大值为20,预设阈值为10,智能设备第一次接收到目标用户语音信息,则计数值减1,当接收到10次目标用户语音信息时,计数值减为10,在接收到第11次目标用户语音信息时,计数值减为9,当前计数值小于预设阈值,因此,判断出智能设备接收到的目标用户语音信息的次数是否大于第一预设次数。
S370,判断第二用户语音信息对应的语音识别结果中是否包含响应触发词;
如果智能设备处于预设状态,说明智能设备需要响应触发词的触发才能响应用户语音信息对应的交互指令,因此,智能设备判断第二用户语音信息对应的语音识别结果中是否包含响应触发词。
S380,响应目标交互指令,其中,目标交互指令为第二用户语音信息对应的交互指令。
如果第二用户语音信息对应的语音识别结果包括响应触发词,说明用户要与智能设备进行语音交互,因此,智能设备响应第二用户语音信息对应的交互指令。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而且用户就不同话题的内容与智能设备进行交互时,用户也不需要再次唤醒智能设备;同时,在智能设备处于预设状态时,用户可以通过响应触发词即可触发智能设备响应用户语音信息。因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
需要强调的是,在上述如图1至图3所述的任一实施例中,如果智能设备满足以下至少一种预设条件,则智能设备可以由工作状态切换至休眠状态;
第一种预设条件为:智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长。
具体的,智能设备处于工作状态的情况下,如果智能设备持续未接收到用户语音信息的时长大于预设时长,则说明用户当前不会再与智能设备进行语音交互,因此,为了节省电能,智能设备由工作状态切换至休眠状态。
第二种预设条件为:目标交互指令为音频和/或视频播放指令的情况下,成功响应该目标交互指令;
具体的,如果第二用户语音信息对应的音频和/或视频播放指令,那么为了避免因智能设备响应噪音或者其他无关用户语音信息的交互指令而影响音频和/或视频的正常播放,因此,智能设备由工作状态切换至休眠状态。
第三种预设条件为:智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
由于目标用户语音信息为智能设备不可处理的意图的用户语音信息。若智能设备接收到的用户语音信息的次数大于第二预设次数,则说明用户当前不会再与智能设备进行语音交互,因此,为了节省电能,智能设备由工作状态切换至休眠状态。
需要说明的是,可以通过如下方式来判断智能设备接收到的目标用户语音信息的次数是否大于第二预设次数:
第一种方式为:智能设备每接受到一次目标用户语音信息,则将接收到的目标用户语音信息的次数加1,在接收到的目标用户语音信息的次数的累加值达到预设值时,则智能设备接收到的目标用户语音信息的次数是否大于第二预设次数。其中,预设值的大小可以较大,也可以较小,本发明实施例对预设值的大小不做具体限定。
第二种方式为:智能设备中预先设置一个计数值,可以为该计数值设置一个初始最大值,智能设备每接收到一次目标用户语音信息时,计数值减1,当计数值减小到预设阈值时,则智能设备判断出接收到的目标用户语音信息的次数大于第二预设次数。本发明实施例对初始最大值及预设阈值的大小不做具体限定。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好;而且,智能设备在满足预设条件时,能够由工作状态切换到休眠状态,能够起到节省电能且避免噪音等干扰的作用。
另外,在上述如图1到3的任一实施例中,在获得第二用户语音信息对应的语音识别结果之前,所述智能设备控制方法还可以包括:
通过麦克风阵列,确定第二用户语音信息的声源方位;
根据声源方位判断第二用户语音信息是否为与智能设备交互的语音信息;
若第二用户语音信息为与智能设备交互的语音信息,执行获得第二用户语音信息对应的语音识别结果的步骤。
为了能够精确地判断出第二用户语音信息是否为与智能设备交互的语音信息,因此,可以在智能设备中设置麦克风阵列,由于麦克风阵列包含多个麦克风,多个麦克风接收到同一用户语音信息的时刻是不同的,因此,可以通过麦克风阵列中的多个麦克风接收到第二用户语音信息的时间差来确定出第二用户语音信息的声源方位。
然后根据所确定的第二用户语音信息的声源方位来确定第二用户语音信息是否为与智能设备交互的用户语音信息。例如,如果第二用户语音信息的声源方位为与智能设备所在的位置的距离较近且处于麦克风的正前方,则可以认为该第二用户语音信息是与智能设备交互的用户语音信息。
如果第二用户语音信息为与智能设备交互的语音信息,那么智能设备获得第二用户语音信息对应的语音识别结果。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。而且,智能设备能够通过麦克风阵列判断出第二用户语音信息的声源方位,在判断出第二用户语音信息为与智能设备交互的语音信息时,才响应第二用户语音信息,从而可以避免噪音的干扰,并且可以起到节省能耗的作用。
第二方面,本发明实施例还提供了一种设备控制装置,应用于智能设备,如图4所示,所述装置包括:
工作状态保持模块410,用于响应完第一用户语音信息对应的交互指令后,保持工作状态;
语音识别模块420,用于在接收到第二用户语音信息后,对所述第二用户语音信息进行语音识别,得到语音识别结果;
相关度判断模块430,用于根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度;
交互指令响应模块440,用于若所述相关度大于等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
本发明实施例还提供了一种设备控制装置,应用于智能设备,如图5所示,所述装置包括:
工作状态保持模块510,用于响应完第一用户语音信息对应的交互指令后,保持工作状态;
语音识别模块520,用于在接收到第二用户语音信息后,对所述第二用户语音信息进行语音识别,得到语音识别结果;
相关度判断模块530,用于根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度是否大于等于预设相关度,若所述相关度大于等于预设相关度,触发所述交互指令响应模块560执行响应目标交互指令的步骤;
意图识别模块540,用于若所述相关度小于预设相关度,根据所述语音识别结果,识别所述第二用户语音信息的意图;
意图判断模块550,用于判断识别出的意图是否为所述智能设备可处理的意图,若判断出识别出的意图为所述智能设备可处理的意图,触发所述交互指令响应模块560执行响应所述目标交互指令的步骤。
交互指令响应模块560,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而且用户就不同话题的内容与智能设备进行交互时,用户也不需要再次唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
本发明实施例还提供了一种设备控制装置,应用于智能设备,如图6所示,所述装置包括:
工作状态保持模块610,用于响应完第一用户语音信息对应的交互指令后,保持工作状态;
语音识别模块620,用于在接收到第二用户语音信息后,对所述第二用户语音信息进行语音识别,得到语音识别结果;
相关度判断模块630,用于根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度是否大于等于预设相关度,若所述相关度大于等于预设相关度,触发所述交互指令响应模块680执行响应目标交互指令的步骤;
意图识别模块640,用于若所述相关度小于预设相关度,根据所述语音识别结果,识别所述第二用户语音信息的意图;
意图判断模块650,用于判断识别出的意图是否为所述智能设备可处理的意图;
状态判断模块660,用于在判断出识别出的意图为所述智能设备可处理的意图之后,判断所述智能设备是否处于预设状态,其中,所述预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,所述响应操作为:用于响应用户语音信息对应的交互指令的操作;
触发词判断模块670,用于若所述智能设备处于预设状态,判断所述语音识别结果中是否包含所述响应触发词,若所述语音识别结果中包括所述响应触发词,触发所述交互指令响应模块执行所述响应所述目标交互指令的步骤。
交互指令响应模块680,用于响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
其中,所述状态判断模块,具体用于:
判断所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数是否大于第一预设次数,其中,所述目标用户语音信息为:所述智能设备不能识别出能够处理的意图的用户语音信息;
若接收到目标用户语音信息的次数大于第一预设次数,则判断出所述智能设备处于预设状态。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次唤醒智能设备;而且用户就不同话题的内容与智能设备进行交互时,用户也不需要再次唤醒智能设备;同时,在智能设备处于预设状态时,用户可以通过响应触发词即可触发智能设备响应用户语音信息。因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在上述如图4至如图6所示的任一实施例中,所述智能设备装置还可以包括:
状态切换模块,用于满足预设条件的情况下,所述智能设备由工作状态切换至休眠状态;
其中,预设条件为以下条件中的至少一种:
所述智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长;
所述目标交互指令为音频和/或视频播放指令的情况下,成功响应所述目标交互指令;
所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好;而且,智能设备在满足预设条件时,能够由工作状态切换到休眠状态,能够起到节省电能且避免噪音等干扰的作用。
在上述如图4至如图6所示的任一实施例中,所述智能设备控制装置还可以包括:
声源方位确定模块,用于在所述对所述第二用户语音信息进行语音识别,得到语音识别结果之前,通过麦克风阵列,确定所述第二用户语音信息的声源方位;
语音信息判断模块,用于根据所述声源方位判断所述第二用户语音信息是否为与所述智能设备交互的语音信息,若所述第二用户语音信息为与所述智能设备交互的语音信息,触发所述语音识别模块执行所述对所述第二用户语音信息进行语音识别,得到语音识别结果的步骤。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。而且,智能设备能够通过麦克风阵列判断出第二用户语音信息的声源方位,在判断出第二用户语音信息为与智能设备交互的语音信息时,才响应第二用户语音信息,从而可以避免噪音的干扰,并且可以起到节省能耗的作用。
本发明实施例还提供了一种智能设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现第一方面方法实施例所示的任一智能设备控制方法。
上述智能设备提到的通信总线可以是外设部件互连标准(Peripheral PomponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述智能设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Ne twork Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Applica tion SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能设备控制方法。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能设备控制方法。
与现有技术相比,通过本发明实施例提供的技术方案,智能设备被用户唤醒后,用户就相同话题的内容与智能设备进行多次交互时,不需要再次通过唤醒词来唤醒智能设备;而不像现有技术那样,用户每次与智能设备交互,均需要通过唤醒词来唤醒智能设备,因此,通过本发明实施例提供的技术方案,用户与智能设备的交互过程简单,用户体验较好。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、智能设备、可读取存储介质等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (13)
1.一种智能设备控制方法,其特征在于,应用于智能设备,所述方法包括:
响应完第一用户语音信息对应的交互指令后,保持工作状态;
在接收到第二用户语音信息后,获得所述第二用户语音信息对应的语音识别结果;
根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度;
若所述相关度大于或者等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
2.根据权利要求1所述的方法,其特征在于,若所述相关度小于预设相关度,所述方法还包括:
根据所述语音识别结果,识别所述第二用户语音信息的意图;
判断识别出的意图是否为所述智能设备可处理的意图;
若判断出识别出的意图为所述智能设备可处理的意图,响应所述目标交互指令。
3.根据权利要求2所述的方法,其特征在于,在判断出识别出的意图为所述智能设备可处理的意图之后,所述方法还包括:
判断所述智能设备是否处于预设状态,其中,所述预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,所述响应操作为:用于响应用户语音信息对应的交互指令的操作;
若所述智能设备处于预设状态,判断所述语音识别结果中是否包含所述响应触发词;
若所述语音识别结果中包括所述响应触发词,执行所述响应所述目标交互指令的步骤。
4.根据权利要求3所述的方法,其特征在于,所述判断所述智能设备是否处于预设状态,包括:
在所述智能设备持续处于工作状态的情况下,判断所述智能设备接收到目标用户语音信息的次数是否大于第一预设次数,其中,所述目标用户语音信息为:所述智能设备不能识别出能够处理的意图的用户语音信息;
若所述智能设备接收到目标用户语音信息的次数大于第一预设次数,则确定所述智能设备处于预设状态。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
满足预设条件的情况下,所述智能设备由工作状态切换至休眠状态;
其中,预设条件为以下条件中的至少一种:
所述智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长;
所述目标交互指令为音频和/或视频播放指令的情况下,成功响应所述目标交互指令;
所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
6.根据权利要求1至4任一项所述的方法,其特征在于,在所述对所述第二用户语音信息进行语音识别,得到语音识别结果之前,所述方法还包括:
通过麦克风阵列,确定所述第二用户语音信息的声源方位;
根据所述声源方位判断所述第二用户语音信息是否为与所述智能设备交互的语音信息;
若所述第二用户语音信息为与所述智能设备交互的语音信息,执行所述对所述第二用户语音信息进行语音识别,得到语音识别结果的步骤。
7.一种设备控制装置,其特征在于,应用于智能设备,所述装置包括:
工作状态保持模块,用于响应完第一用户语音信息对应的交互指令后,保持工作状态;
语音识别模块,用于在接收到第二用户语音信息后,对所述第二用户语音信息进行语音识别,得到语音识别结果;
相关度判断模块,用于根据所述语音识别结果,判断所述第二用户语音信息与所述第一用户语音信息的相关度是否大于等于预设相关度;
交互指令响应模块,用于若所述相关度大于等于预设相关度,响应目标交互指令,其中,所述目标交互指令为:所述第二用户语音信息对应的交互指令。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
意图识别模块,用于若所述相关度小于预设相关度,根据所述语音识别结果,识别所述第二用户语音信息的意图;
意图判断模块,用于判断识别出的意图是否为所述智能设备可处理的意图,若判断出识别出的意图为所述智能设备可处理的意图,触发所述交互指令响应模块执行响应所述目标交互指令的步骤。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
状态判断模块,用于在判断出识别出的意图为所述智能设备可处理的意图之后,判断所述智能设备是否处于预设状态,其中,所述预设状态为:在用户语音信息发生话题转换的情况下,由预设的响应触发词触发响应操作的状态,所述响应操作为:用于响应用户语音信息对应的交互指令的操作;
触发词判断模块,用于若所述智能设备处于预设状态,判断所述语音识别结果中是否包含所述响应触发词,若所述语音识别结果中包括所述响应触发词,触发所述交互指令响应模块执行所述响应所述目标交互指令的步骤。
10.根据权利要求9所述的装置,其特征在于,所述状态判断模块,具体用于:
判断所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数是否大于第一预设次数,其中,所述目标用户语音信息为:所述智能设备不能识别出能够处理的意图的用户语音信息;
若接收到目标用户语音信息的次数大于第一预设次数,则判断出所述智能设备处于预设状态。
11.根据权利要求7至10任一项所述的装置,其特征在于,所述装置还包括:
状态切换模块,用于满足预设条件的情况下,所述智能设备由工作状态切换至休眠状态;
其中,预设条件为以下条件中的至少一种:
所述智能设备处于工作状态的情况下,持续未接收到用户语音信息的时长大于预设时长;
所述目标交互指令为音频和/或视频播放指令的情况下,成功响应所述目标交互指令;
所述智能设备持续处于工作状态的情况下,接收到目标用户语音信息的次数大于第二预设次数。
12.根据权利要求7至10任一项所述的装置,其特征在于,所述装置还包括:
声源方位确定模块,用于在所述对所述第二用户语音信息进行语音识别,得到语音识别结果之前,通过麦克风阵列,确定所述第二用户语音信息的声源方位;
语音信息判断模块,用于根据所述声源方位判断所述第二用户语音信息是否为与所述智能设备交互的语音信息,若所述第二用户语音信息为与所述智能设备交互的语音信息,触发所述语音识别模块执行所述对所述第二用户语音信息进行语音识别,得到语音识别结果的步骤。
13.一种智能设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711482957.4A CN108182943B (zh) | 2017-12-29 | 2017-12-29 | 一种智能设备控制方法、装置及智能设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711482957.4A CN108182943B (zh) | 2017-12-29 | 2017-12-29 | 一种智能设备控制方法、装置及智能设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108182943A true CN108182943A (zh) | 2018-06-19 |
CN108182943B CN108182943B (zh) | 2021-03-26 |
Family
ID=62549206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711482957.4A Active CN108182943B (zh) | 2017-12-29 | 2017-12-29 | 一种智能设备控制方法、装置及智能设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182943B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932942A (zh) * | 2018-06-26 | 2018-12-04 | 四川斐讯信息技术有限公司 | 一种实现智能音箱人机对话的系统及其方法 |
CN108986805A (zh) * | 2018-06-29 | 2018-12-11 | 百度在线网络技术(北京)有限公司 | 用于发送信息的方法和装置 |
CN109166575A (zh) * | 2018-07-27 | 2019-01-08 | 百度在线网络技术(北京)有限公司 | 智能设备的交互方法、装置、智能设备和存储介质 |
CN109524001A (zh) * | 2018-12-28 | 2019-03-26 | 北京金山安全软件有限公司 | 一种信息处理方法、装置及儿童穿戴设备 |
CN109545206A (zh) * | 2018-10-29 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 智能设备的语音交互处理方法、装置和智能设备 |
CN109599103A (zh) * | 2018-11-16 | 2019-04-09 | 广州小鹏汽车科技有限公司 | 车辆控制方法、装置、系统、计算机可读存储介质和汽车 |
CN109637535A (zh) * | 2018-12-26 | 2019-04-16 | 珠海格力电器股份有限公司 | 语音指令的处理方法、装置和智能终端 |
CN109637531A (zh) * | 2018-12-06 | 2019-04-16 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109658925A (zh) * | 2018-11-28 | 2019-04-19 | 上海蔚来汽车有限公司 | 一种基于上下文的免唤醒车载语音对话方法及系统 |
CN110838292A (zh) * | 2019-09-29 | 2020-02-25 | 广东美的白色家电技术创新中心有限公司 | 一种语音交互方法及电子设备、计算机存储介质 |
CN110992972A (zh) * | 2019-11-20 | 2020-04-10 | 佳禾智能科技股份有限公司 | 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质 |
WO2020135811A1 (zh) | 2018-12-29 | 2020-07-02 | 华为技术有限公司 | 一种语音交互方法,设备和系统 |
CN111370004A (zh) * | 2018-12-25 | 2020-07-03 | 阿里巴巴集团控股有限公司 | 人机交互方法、语音处理方法及设备 |
CN111599360A (zh) * | 2020-05-12 | 2020-08-28 | Oppo广东移动通信有限公司 | 唤醒控制方法、装置、存储介质及电子设备 |
CN112882394A (zh) * | 2021-01-12 | 2021-06-01 | 北京小米松果电子有限公司 | 设备控制方法、控制装置及可读存储介质 |
CN113470634A (zh) * | 2020-04-28 | 2021-10-01 | 海信集团有限公司 | 语音交互设备的控制方法、服务器及语音交互设备 |
CN113655938A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 一种用于智能座舱的交互方法、装置、设备和介质 |
CN113470634B (zh) * | 2020-04-28 | 2024-05-17 | 海信集团有限公司 | 语音交互设备的控制方法、服务器及语音交互设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2605993A1 (en) * | 2005-04-25 | 2006-11-02 | Ellen Eatough | Mind-body learning system and methods of use |
CN101923857A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 一种人机交互的可扩展语音识别方法 |
US20130226579A1 (en) * | 2009-02-03 | 2013-08-29 | Eugeniusz Wlasiuk | Systems and methods for interactively accessing hosted services using voice communications |
US20150141079A1 (en) * | 2013-11-15 | 2015-05-21 | Huawei Device Co., Ltd. | Terminal voice control method and apparatus, and terminal |
CN105430509A (zh) * | 2015-11-27 | 2016-03-23 | 北京奇艺世纪科技有限公司 | 一种多媒体文件播放方法及装置 |
CN106648530A (zh) * | 2016-11-21 | 2017-05-10 | 海信集团有限公司 | 语音控制方法及终端 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106796787A (zh) * | 2014-05-20 | 2017-05-31 | 亚马逊技术有限公司 | 在自然语言处理中使用先前对话行为进行的语境解释 |
CN107039040A (zh) * | 2016-01-06 | 2017-08-11 | 谷歌公司 | 语音识别系统 |
CN107145329A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 设备控制方法、装置及智能设备 |
-
2017
- 2017-12-29 CN CN201711482957.4A patent/CN108182943B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2605993A1 (en) * | 2005-04-25 | 2006-11-02 | Ellen Eatough | Mind-body learning system and methods of use |
US20130226579A1 (en) * | 2009-02-03 | 2013-08-29 | Eugeniusz Wlasiuk | Systems and methods for interactively accessing hosted services using voice communications |
CN101923857A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 一种人机交互的可扩展语音识别方法 |
US20150141079A1 (en) * | 2013-11-15 | 2015-05-21 | Huawei Device Co., Ltd. | Terminal voice control method and apparatus, and terminal |
CN106796787A (zh) * | 2014-05-20 | 2017-05-31 | 亚马逊技术有限公司 | 在自然语言处理中使用先前对话行为进行的语境解释 |
CN105430509A (zh) * | 2015-11-27 | 2016-03-23 | 北京奇艺世纪科技有限公司 | 一种多媒体文件播放方法及装置 |
CN107039040A (zh) * | 2016-01-06 | 2017-08-11 | 谷歌公司 | 语音识别系统 |
CN106648530A (zh) * | 2016-11-21 | 2017-05-10 | 海信集团有限公司 | 语音控制方法及终端 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN107145329A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 设备控制方法、装置及智能设备 |
Non-Patent Citations (2)
Title |
---|
M.A.VIRAJ J.MUTHUGALA; A.G.BUDDHIKA P.JAYASEKARA: "Interpreting uncertain information related to relative references for improved navigational command understanding of service robots", 《2017 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS)》 * |
张伟: "面向智能家居的嵌入式语音控制系统的研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932942A (zh) * | 2018-06-26 | 2018-12-04 | 四川斐讯信息技术有限公司 | 一种实现智能音箱人机对话的系统及其方法 |
CN108986805A (zh) * | 2018-06-29 | 2018-12-11 | 百度在线网络技术(北京)有限公司 | 用于发送信息的方法和装置 |
CN109166575A (zh) * | 2018-07-27 | 2019-01-08 | 百度在线网络技术(北京)有限公司 | 智能设备的交互方法、装置、智能设备和存储介质 |
CN109545206B (zh) * | 2018-10-29 | 2024-01-30 | 百度在线网络技术(北京)有限公司 | 智能设备的语音交互处理方法、装置和智能设备 |
CN109545206A (zh) * | 2018-10-29 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 智能设备的语音交互处理方法、装置和智能设备 |
CN109599103B (zh) * | 2018-11-16 | 2021-02-19 | 广州小鹏汽车科技有限公司 | 车辆控制方法、装置、系统、计算机可读存储介质和汽车 |
CN109599103A (zh) * | 2018-11-16 | 2019-04-09 | 广州小鹏汽车科技有限公司 | 车辆控制方法、装置、系统、计算机可读存储介质和汽车 |
CN109658925A (zh) * | 2018-11-28 | 2019-04-19 | 上海蔚来汽车有限公司 | 一种基于上下文的免唤醒车载语音对话方法及系统 |
CN109637531A (zh) * | 2018-12-06 | 2019-04-16 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109637531B (zh) * | 2018-12-06 | 2020-09-15 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN111370004A (zh) * | 2018-12-25 | 2020-07-03 | 阿里巴巴集团控股有限公司 | 人机交互方法、语音处理方法及设备 |
CN109637535B (zh) * | 2018-12-26 | 2021-05-25 | 珠海格力电器股份有限公司 | 语音指令的处理方法、装置和智能终端 |
CN109637535A (zh) * | 2018-12-26 | 2019-04-16 | 珠海格力电器股份有限公司 | 语音指令的处理方法、装置和智能终端 |
CN109524001A (zh) * | 2018-12-28 | 2019-03-26 | 北京金山安全软件有限公司 | 一种信息处理方法、装置及儿童穿戴设备 |
WO2020135811A1 (zh) | 2018-12-29 | 2020-07-02 | 华为技术有限公司 | 一种语音交互方法,设备和系统 |
CN110838292A (zh) * | 2019-09-29 | 2020-02-25 | 广东美的白色家电技术创新中心有限公司 | 一种语音交互方法及电子设备、计算机存储介质 |
CN110992972A (zh) * | 2019-11-20 | 2020-04-10 | 佳禾智能科技股份有限公司 | 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质 |
CN110992972B (zh) * | 2019-11-20 | 2023-11-14 | 佳禾智能科技股份有限公司 | 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质 |
CN113470634A (zh) * | 2020-04-28 | 2021-10-01 | 海信集团有限公司 | 语音交互设备的控制方法、服务器及语音交互设备 |
CN113470634B (zh) * | 2020-04-28 | 2024-05-17 | 海信集团有限公司 | 语音交互设备的控制方法、服务器及语音交互设备 |
CN111599360A (zh) * | 2020-05-12 | 2020-08-28 | Oppo广东移动通信有限公司 | 唤醒控制方法、装置、存储介质及电子设备 |
CN112882394A (zh) * | 2021-01-12 | 2021-06-01 | 北京小米松果电子有限公司 | 设备控制方法、控制装置及可读存储介质 |
CN113655938A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 一种用于智能座舱的交互方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108182943B (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182943A (zh) | 一种智能设备控制方法、装置及智能设备 | |
CN107133094B (zh) | 应用管理方法、移动终端及计算机可读存储介质 | |
KR101956226B1 (ko) | 무선 오디오 출력 디바이스 | |
KR102094505B1 (ko) | 디바이스 및 디바이스에 의한 BLE(Bluetooth Low Energy) 패킷 브로드캐스트 방법, 디바이스에 의한 AP(application processor)의 동작 모드 조절 방법 | |
KR101247055B1 (ko) | 환경 인식을 통한 컴퓨팅 장치와의 아이-프리 인터랙션을위한 시스템 및 방법 | |
CN109378000A (zh) | 语音唤醒方法、装置、系统、设备、服务器及存储介质 | |
US10986573B2 (en) | Bluetooth mesh network gateway and device data communication | |
CN108763494A (zh) | 对话系统间的知识分享方法、对话方法及装置 | |
CN105528055B (zh) | 运行对象的处理方法及装置 | |
WO2021052413A1 (zh) | 节能信号监听时刻的确定方法、配置方法及相关设备 | |
EP4137932A1 (en) | Voice collaborative awakening method and apparatus, electronic device and storage medium | |
CN106776036A (zh) | 一种资源分配方法及装置 | |
WO2015081664A1 (zh) | 控制无线网络开关方法、装置、设备及系统 | |
CN110570857B (zh) | 语音唤醒方法、装置、电子设备及存储介质 | |
CN105895126A (zh) | 指示和控制播放音频/音视频数据的方法及装置 | |
CN114510140B (zh) | 一种调频方法、装置及电子设备 | |
CN107731231A (zh) | 一种支持多云端语音服务的方法及一种存储设备 | |
CN106254192A (zh) | 提示方法、提示装置及提示系统 | |
CN109741740A (zh) | 基于外部触发的语音交互方法及装置 | |
WO2016150189A1 (zh) | 一种音量控制方法、播放设备、移动终端及系统 | |
US20160349722A1 (en) | Systems and methods for dynamic operation of electronic devices based on detection of one or more events | |
CN105959466B (zh) | 音频数据的处理方法和装置 | |
CN112233676A (zh) | 智能设备唤醒方法、装置、电子设备及存储介质 | |
CN111966412A (zh) | 唤醒终端的方法、装置及存储介质 | |
CN111158830B (zh) | 一种显示应用任务窗口的方法和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |