CN114120996A - 语音交互方法及装置 - Google Patents
语音交互方法及装置 Download PDFInfo
- Publication number
- CN114120996A CN114120996A CN202111228872.XA CN202111228872A CN114120996A CN 114120996 A CN114120996 A CN 114120996A CN 202111228872 A CN202111228872 A CN 202111228872A CN 114120996 A CN114120996 A CN 114120996A
- Authority
- CN
- China
- Prior art keywords
- target
- control instruction
- voice
- equipment
- outputting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 description 21
- 238000000746 purification Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 238000004851 dishwashing Methods 0.000 description 7
- 238000010438 heat treatment Methods 0.000 description 5
- 238000001816 cooling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000009423 ventilation Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 239000011324 bead Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000007664 blowing Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及物联网技术领域,本发明提供一种语音交互方法及装置,该语音交互方法包括:获取语音控制指令以及用户位置信息;基于所述用户位置信息,确定目标区域;基于所述语音控制指令,确定设备属性;在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。本发明提供的语音交互方法及装置,能够在用户未给出明确的待控制对象的情况下,通过语音控制指令和用户位置信息,推导出目标设备,并对目标设备进行准确控制,这样能够提升语音交互的智能化程度,降低对用户语音输入的格式限制,能够提高语音交互的效率。
Description
技术领域
本发明涉及物联网技术领域,尤其涉及一种语音交互方法及装置。
背景技术
随着科技的发展,手机、平板电脑和笔记本电脑等移动终端,以及空调、冰箱以及饮水机等家用电器,都接入到互联网,物联网技术在不断发展完善,用户可以通过网络实现对设备的远程控制和无线控制,在某些场景下,用户可以直接通过语音来对设备进行控制。
目前,用户在通过语音控制设备时,需要指明待控制的目标设备,如果用户未给出待控制的目标设备,则无法实现语音控制,这样对用户的语言表达习惯限制较大,语音识别时容易出错,语音交互效率较低。
发明内容
本发明提供一种语音交互方法,用以解决现有技术中对用户的语言表达习惯限制较大,语音识别时容易出错,语音交互效率较低的缺陷,实现提升语音交互的智能化程度,降低对用户语音输入的格式限制,能够提高语音交互的效率。
本发明提供一种语音交互方法,该语音交互方法包括:获取语音控制指令以及用户位置信息;基于所述用户位置信息,确定目标区域;基于所述语音控制指令,确定设备属性;在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
根据本发明提供的一种语音交互方法,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:输出选择询问信息;接收用户对于所述选择询问信息的第一输入;响应于第一输入,从多个目标设备中确定选定设备;基于所述语音控制指令,向所述选定设备输出所述目标控制指令。
根据本发明提供的一种语音交互方法,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:从多个所述目标设备中,确定已开机设备;基于所述语音控制指令,向所述已开机设备输出所述目标控制指令。
根据本发明提供的一种语音交互方法,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:从多个所述目标设备中,确定最近运行时刻与当前时刻最靠近的待控设备;基于所述语音控制指令,向所述待控设备输出所述目标控制指令。
根据本发明提供的一种语音交互方法,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:从多个所述目标设备中,确定历史使用频率最高的常用设备;基于所述语音控制指令,向所述常用设备输出所述目标控制指令。
根据本发明提供的一种语音交互方法,该语音交互方法还包括:在所述目标区域内不存在与所述设备属性匹配的目标设备,且备选区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述备选区域内的目标设备输出目标控制指令。
根据本发明提供的一种语音交互方法,该语音交互方法还包括:在所述目标区域内以及备选区域内均不存在与所述设备属性匹配的目标设备的情况下,输出指令无法执行提示信息。
本发明还提供一种语音交互装置,该语音交互装置包括:获取模块,用于获取语音控制指令以及用户位置信息;第一确定模块,用于基于所述用户位置信息,确定目标区域;第二确定模块,用于基于所述语音控制指令,确定设备属性;第一输出模块,用于在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音交互方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音交互方法的步骤。
本发明提供的语音交互方法及装置,能够在用户未给出明确的待控制对象的情况下,通过语音控制指令和用户位置信息,推导出目标设备,并对目标设备进行准确控制,这样能够提升语音交互的智能化程度,降低对用户语音输入的格式限制,能够提高语音交互的效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的语音交互方法的流程示意图;
图2是本发明提供的语音交互方法的程序框图;
图3是本发明提供的语音交互装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图4描述本发明的语音交互方法及装置。
如图1所示,本发明提供一种语音交互方法,该语音交互方法包括如下步骤110至步骤140。
步骤110、获取语音控制指令以及用户位置信息。
可以理解的是,随着物联网技术的发展,各种各样的设备都可以联网,用户可以通过语音控制设备的工作状态,此处可以构建语音交互系统,该语音交互系统可以包括语音交互装置以及至少一个设备,语音交互装置和至少一个设备通信连接,比如可以无线通信连接,语音交互装置可以包括麦克风、扬声器和处理器,麦克风可以采集到用户的声音信号,麦克风可以将该声音信号发送给处理器,从而得到语音控制指令,语音控制指令为用户通过语音对设备给出的控制指令。
语音交互装置可以为智能音箱、智能机器人、手机、平板电脑、路由器或者其他具有逻辑运算功能和语音采集功能的电子设备,此处不具体限定语音交互装置的类型。
至少一个设备指的是该语音交互装置控制的对象,可以为一个设备,也可以为多个设备,设备可以为各种智能终端,比如手机、平板电脑、笔记本电脑、智能手表、智能手环和智能眼镜等移动终端,也可以为空调、冰箱、电视、饮水机、灯具和电动窗帘等家用电器,不同的设备可以处于房间的不同区域,多个设备均可以联网,多个设备可以处于同一局域网内,也可以不处于同一局域网内,而都连接互联网。
用户位置信息为用户所处的位置,可以由语音交互装置从接收到的用户的声音信息的方位判断得到,当然语音交互装置还可以包括人体移动监测传感器,在监测到人体移动后,可以判断得到用户位置信息,当然语音交互装置还可以包括摄像头,摄像头能够实时采集图像信息,可以根据图像信息判断用户所处的位置,此处不限制用户位置信息的具体采集方式,本领域技术人员可以根据需要自行选择。
步骤120、基于用户位置信息,确定目标区域。
可以理解的是,多个设备可以分别处于多个区域,可以按照区域来划分设备的归属,比如,房间可以被划分为客厅、卧室和厨房,电视可以位于客厅,空调可以位于卧室,冰箱可以位于厨房,可以根据用户位置信息,判断用户所处的区域。
步骤130、基于语音控制指令,确定设备属性。
可以理解的是,设备属性指的是设备自身具有的特征,每个设备都具有特定的功能和控制方式,比如,空调就具有制冷功能和制热功能,那么当用户给出的语音控制指令中出现了“将温度调到28度”或者“温度降低一点”等内容时,可以推测出该语音控制指令对应的设备属性是和室内温度调节相关的设备,此时该设备就可以是空调。
设备属性可以为温度、湿度、时间、亮度、开关程度和设置模式,还可以为其他与设备自身特征和功能相关的参数和其他概念,根据设备属性能够推导出具体的设备对象,此处不限定设备属性的具体形式,本领域技术人员可以根据具体场景来选定。
步骤140、在目标区域内存在与设备属性匹配的目标设备的情况下,基于语音控制指令,向目标区域内的目标设备输出目标控制指令。
可以理解的是,目标区域内可以具有多个设备,此处可以从多个设备中寻找与设备属性匹配的作为目标设备,比如,当设备属性为调整光照颜色,这样就能够确定目标设备为可调光灯具,也就是确定了待控制对象,这样就可以根据语音控制指令,来确定对可调光灯具的具体控制指令,也就是目标控制指令。
比如,当目标设备为可调光灯具,语音控制指令对应的用户语音输入可以为“调成黄色光线”,这样就可以向可调光灯具发送控制可调光灯具切换成黄色灯光模式的控制指令。
还比如,当目标设备为空调,语音控制指令对应的用户语音输入可以为“调到25度”,这样就可以向空调发送控制空调将输出气流的温度调整为25度,当然,此处可以根据监测到的外界环境温度来确定空调采用制冷模式还是制热模式,当环境温度为30度时,采用制冷模式,制冷目标温度为25度,当环境温度为10度时,采用制热模式,制热目标温度为25度。
值得一提的是,语音交互装置可以从语音控制指令中提取人声特征数据,可以向云端服务器发送人声特征数据,以供云端服务器根据人声特征数据生成针对目标设备的目标控制指令,云端服务器生成目标控制指令的过程可以为:对人声特征数据进行语音识别,转换为对应的文字,使用预设的语义分析模型对转换得到的文字进行语义分析,以判断文字是否与指令库中预设的控制指令相对应,如果是,则提取与文字对应的控制指令,在文字和指令库中预设的控制指令不对应的情况下,以文字为关键词向预设的知识搜索引擎发起搜索,接收知识搜索引擎返回的搜索结果,得到目标控制指令,并向语音交互装置反馈该目标控制指令。
采用本实施例的方法,就可以在用户没有给出明确的待控制对象的情况下,根据语音控制指令和用户位置信息,来快速推测出待控制对象,这样就可以快速合理地推测出用户的意图,通过这种设计,能够让设备的控制更加智能,不需要对用户的语音控制进行冗余的限定,用户不需要每次都提供具体清晰的指令,能够对相对模糊的指令进行处理和推测,能够极大地提升用户的体验感。
本发明提供的语音交互方法,能够在用户未给出明确的待控制对象的情况下,通过语音控制指令和用户位置信息,推导出目标设备,并对目标设备进行准确控制,这样能够提升语音交互的智能化程度,降低对用户语音输入的格式限制,能够提高语音交互的效率。
如图2所示,在一些实施例中,目标设备为多个,基于语音控制指令,向目标区域内的目标设备输出目标控制指令,包括:输出选择询问信息;接收用户对于选择询问信息的第一输入;响应于第一输入,从多个目标设备中确定选定设备;基于语音控制指令,向选定设备输出目标控制指令。
可以理解的是,目标区域内可能存在多个目标设备,比如卧室内可能存在多个可调光灯具,此时就需要从多个目标设备中确定一个待控制设备,本实施例采用向用户询问的方式,当发现目标区域内存在多个目标设备时,此时输出选择询问信息。
可以采用扬声器播放语音的方式向用户输出选择询问信息,用户在听到选择询问信息所对应的语音时,就可以语音交互装置给出第一输入,第一输入是针对选择询问信息给出的确定选择。
比如,语音交互装置可以通过扬声器向用户播放语音“请从可调光灯具1、可调光灯具2和可调光灯具3中选择一个控制对象”,此时用户可以说出想要控制的对象,比如用户可以说“可调光灯具2”,此时语音交互装置就接收到了用户的第一输入。
当语音交互装置接收到用户的第一输入之后,可以对第一输入进行响应,从多个目标设备中确定一个选定设备,也就是根据用户的选择确定用户想要控制的对象,此时就可以根据语音控制指令,结合选定设备,来生成目标控制指令,目标控制指令是针对选定设备给出的操控命令。
比如,在根据用户的第一输入,确定了目标设备为“可调光灯具2”的情况下,此时就可以根据用户给出的语音控制指令,比如为“调整为黄色光线”,给可调光灯具2发送控制其点亮黄色灯珠,关闭其他颜色的灯珠,这样就控制可调光灯具2发射出黄色光线。
如图2所示,在一些实施例中,目标设备为多个,基于语音控制指令,向目标区域内的目标设备输出目标控制指令,包括:从多个目标设备中,确定已开机设备;基于语音控制指令,向已开机设备输出目标控制指令。
可以理解的是,目标区域内可能存在多个目标设备,需要从多个目标设备中确定一个待控制设备,此时,可以对多个目标设备进行检测,查找到多个目标设备中的已开机设备,也就是已经通电开启的设备,已开机设备可以为正在工作的设备,也可以为处于待机状态的设备。
比如,客厅里有多个风扇,当比如为风扇1、风扇2和风扇3,当用户给出的语音控制指令为“调整为自然风模式”,此时就从多个风扇中查找已开机的风扇,比如风扇1和风扇2为关机状态,风扇3为开机状态,且风扇3当前为以直吹风模式运行,此时就可以给风扇3发送控制其切换为自然风模式的指令,这样就可以控制风扇3的电机切换工作模式,以预设的自然风模式工作。
如图2所示,在一些实施例中,目标设备为多个,基于语音控制指令,向目标区域内的目标设备输出目标控制指令,包括:从多个目标设备中,确定最近运行时刻与当前时刻最靠近的待控设备;基于语音控制指令,向待控设备输出目标控制指令。
可以理解的是,目标区域内可能存在多个目标设备,需要从多个目标设备中确定一个待控制设备,此时可以从本地存储或者云端调取目标设备的历史运行记录,查找到目标设备的最近运行时刻,最近运行时刻为目标设备距离当前时间点最近的一次运行时间点,比如当前时间点为2021年10月1日13:00,目标设备的最近运行时刻可以为2021年9月25日18:00,多个目标设备对应的最近运行时刻有所不同,此时就从多个目标设备中查找到最近运行时刻与当前时刻最靠近的那一个,作为待控设备。
比如,根据用户位置信息确定的目标区域为客厅,语音控制指令为“把温度调到30度”,客厅内存在的目标设备可能为空调或者电暖器,当前时间点为2021年10月1日13:00,从云端查找到的客厅内的空调的最近运行时刻为2021年8月12日19:00,从云端查找到的电暖器的最近运行时刻为2021年10月1日9:00,那么电暖器的最近运行时刻相对于空调的最近运行时刻距离当前时刻更靠近,因此可以将电暖器作为待控设备。
当确定了待控设备之后,就可以根据语音控制指令,来向待控设备输出目标控制指令,比如,可以向电暖器发送将温度调整为30度的操控命令,这样就可以控制电暖器将加热温度调整到30。
如图2所示,在一些实施例中,目标设备为多个,基于语音控制指令,向目标区域内的目标设备输出目标控制指令,包括:从多个目标设备中,确定历史使用频率最高的常用设备;基于语音控制指令,向常用设备输出目标控制指令。
可以理解的是,目标区域内可能存在多个目标设备,需要从多个目标设备中确定一个待控制设备,此时可以从本地存储或者云端调取目标设备的历史使用记录,从而确定目标设备的历史使用频率,也就是目标设备单位时间使用的次数,从多个目标设备中筛选出历史使用频率最高的那个目标设备,作为常用设备。
比如,根据用户位置信息确定的目标区域为厨房,语音控制指令为“开始通风模式”,厨房内的抽油烟机和新风机均支持通风模式,也就是说,目标区域内存在多个目标设备,此时就从本地存储或者云端调取抽油烟机和新风机的历史使用频率,如果抽油烟机比新风机的历史使用频率更高,此时就将抽油烟机作为常用设备,
在确定了常用设备之后,就可以根据语音控制指令,向常用设备输出目标控制指令,比如,可以向抽油烟机发送开启通风模式的操控指令,这样就可以控制抽油烟机进入通风模式。
如图2所示,在一些实施例中,语音交互方法还包括:在目标区域内不存在与设备属性匹配的目标设备,且备选区域内存在与设备属性匹配的目标设备的情况下,基于语音控制指令,向备选区域内的目标设备输出目标控制指令。
可以理解的是,备选区域是和目标设备并列的其他区域,如果根据用户位置信息和语音控制指令,判断用户所处的目标区域内不存在与设备属性匹配的目标设备,则可以备选区域中查找是否存在与设备属性匹配的目标设备。
比如,当用户在卧室里,给出的语音控制指令为“开始洗碗”,此时在卧室里并没有具有洗碗功能的设备,也就是说没有和洗碗功能这一设备属性相匹配的设备,此时就在其他区域中查找是否具有洗碗功能的设备,如果在厨房内存在洗碗机,那么就确定了在厨房内具有目标设备,就将厨房内的洗碗机作为目标设备。
当备选区域内存在与设备属性匹配的目标设备时,则根据语音控制指令,来向备选区域的目标设备发送目标控制指令,比如当备选区域内的目标设备为洗碗机,此时就可以控制洗碗机启动洗碗工作。
如图2所示,在一些实施例中,语音交互方法还包括:在目标区域内以及备选区域内均不存在与设备属性匹配的目标设备的情况下,输出指令无法执行提示信息。
可以理解的是,当在目标区域和备选区域内均没有查找到和设备属性相匹配的目标设备时,说明目标区域和备选区域均没有可以执行该语音控制指令的目标设备,此时可以通过扬声器或者其他设备向用户输出指令无法执行提示信息,比如可以通过扬声器播放语音“设备列表没有支持此功能的设备”。
在实际场景的应用时,语音交互装置可以接收语音控制指令和用户位置信息,也就是用户发出的缺少具体指向设备的指令,语音交互装置在接收到语音控制指令和用户位置信息时,可以进行参数分析和位置分析。
语音交互装置可以根据位置解析结果和指令,判断用户所在位置是否有支持该功能的设备,判断依据为:(1)若用户所在位置有支持该功能的设备,则继续判断是否有多个支持该功能的设备。(2)若用户所在位置没有支持该功能的设备,则查询云端,是否有其他位置的设备支持该功能。如果有,则回答用户,某某位置有支持该功能的设备,已为您打开。如果没有,则回答用户,设备列表没有支持此功能的设备。
例如:用户的位置处于房间的卧室,卧室内的空调和净化器不支持净化模式,而客厅的空调支持净化模式,用户发出语音控制指令开启净化模式,语音交互装置可以回复:卧室的设备不支持净化模式,先帮你打开客厅空调2的净化模式了。
语音交互装置可以判断用户所处的位置是否有多个支持该功能的设备,若该位置只有一个支持该功能的设备,则执行语音控制指令,若该位置有多个支持该功能的设备,可以有如下方式决定具体执行语音控制指令的设备:其一,可以询问用户,让哪一个设备执行命令。其二,已经开机的设备优先执行语音控制指令,其三,从云端获取设备的历史使用记录,开启最近一次启动的设备,其四,从云端获取设备的历史使用记录,查询用户对哪个设备净化模式使用频率高,优先开启该设备。
例如,用户的位置处于卧室,卧室的空调和净化器均支持净化模式,用户发出语音控制指令开启净化模式,语音交互装置可以采用如下方式回复:其一,你要调节什么设备,净化器还是空调;其二,空调正在运行,为您打开空调净化模式;其三,您最近一次使用净化模式是空调,已为您打开空调净化模式;其四,您使用净化器的净化模式多,已为您打开净化器净化模式。
下面对本发明提供的语音交互装置进行描述,下文描述的语音交互装置与上文描述的语音交互方法可相互对应参照。
如图3所示,本发明还提供一种语音交互装置,该语音交互装置包括:获取模块310、第一确定模块320、第二确定模块330和输出模块340。
获取模块310,用于获取语音控制指令以及用户位置信息。
第一确定模块320,用于基于所述用户位置信息,确定目标区域。
第二确定模块330,用于基于所述语音控制指令,确定设备属性。
第一输出模块340,用于在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
可以理解的是,随着物联网技术的发展,各种各样的设备都可以联网,用户可以通过语音控制设备的工作状态,此处可以构建语音交互系统,该语音交互系统可以包括语音交互装置以及至少一个设备,语音交互装置和至少一个设备通信连接,比如可以无线通信连接,语音交互装置可以包括麦克风、扬声器和处理器,处理器可以内置有以上所述的获取模块310、第一确定模块320、第二确定模块330和输出模块340。,麦克风可以采集到用户的声音信号,麦克风可以将该声音信号发送给处理器,从而得到语音控制指令,语音控制指令为用户通过语音对设备给出的控制指令。
语音交互装置可以为智能音箱、智能机器人、手机、平板电脑、路由器或者其他具有逻辑运算功能和语音采集功能的电子设备,此处不具体限定语音交互装置的类型。
至少一个设备指的是该语音交互装置控制的对象,可以为一个设备,也可以为多个设备,设备可以为各种智能终端,比如手机、平板电脑、笔记本电脑、智能手表、智能手环和智能眼镜等移动终端,也可以为空调、冰箱、电视、饮水机、灯具和电动窗帘等家用电器,不同的设备可以处于房间的不同区域,多个设备均可以联网,多个设备可以处于同一局域网内,也可以不处于同一局域网内,而都连接互联网。
用户位置信息为用户所处的位置,可以由语音交互装置从接收到的用户的声音信息的方位判断得到,当然语音交互装置还可以包括人体移动监测传感器,在监测到人体移动后,可以判断得到用户位置信息,当然语音交互装置还可以包括摄像头,摄像头能够实时采集图像信息,可以根据图像信息判断用户所处的位置,此处不限制用户位置信息的具体采集方式,本领域技术人员可以根据需要自行选择。
本发明提供的语音交互装置,通过设置获取模块310、第一确定模块320、第二确定模块330和输出模块340,能够在用户未给出明确的待控制对象的情况下,通过语音控制指令和用户位置信息,推导出目标设备,并对目标设备进行准确控制,这样能够提升语音交互的智能化程度,降低对用户语音输入的格式限制,能够提高语音交互的效率。
在一些实施例中,目标设备为多个,上述输出模块还用于输出选择询问信息;接收用户对于选择询问信息的第一输入;响应于第一输入,从多个目标设备中确定选定设备;基于语音控制指令,向选定设备输出目标控制指令。
在一些实施例中,目标设备为多个,上述输出模块还用于:从多个目标设备中,确定已开机设备;基于语音控制指令,向已开机设备输出目标控制指令。
在一些实施例中,目标设备为多个,上述输出模块还用于:从多个目标设备中,确定最近运行时刻与当前时刻最靠近的待控设备;基于语音控制指令,向待控设备输出目标控制指令。
在一些实施例中,目标设备为多个,上述输出模块还用于:从多个目标设备中,确定历史使用频率最高的常用设备;基于语音控制指令,向常用设备输出目标控制指令。
在一些实施例中,语音交互装置还包括:第二输出模块。
第二输出模块用于在目标区域内不存在与设备属性匹配的目标设备,且备选区域内存在与设备属性匹配的目标设备的情况下,基于语音控制指令,向备选区域内的目标设备输出目标控制指令。
在一些实施例中,语音交互装置还包括:第三输出模块。
第三输出模块用于在目标区域内以及备选区域内均不存在与设备属性匹配的目标设备的情况下,输出指令无法执行提示信息。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行语音交互方法,该方法包括:获取语音控制指令以及用户位置信息;基于所述用户位置信息,确定目标区域;基于所述语音控制指令,确定设备属性;在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的语音交互方法,该方法包括:获取语音控制指令以及用户位置信息;基于所述用户位置信息,确定目标区域;基于所述语音控制指令,确定设备属性;在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的语音交互方法,该方法包括:获取语音控制指令以及用户位置信息;基于所述用户位置信息,确定目标区域;基于所述语音控制指令,确定设备属性;在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音交互方法,其特征在于,包括:
获取语音控制指令以及用户位置信息;
基于所述用户位置信息,确定目标区域;
基于所述语音控制指令,确定设备属性;
在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
2.根据权利要求1所述的语音交互方法,其特征在于,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:
输出选择询问信息;
接收用户对于所述选择询问信息的第一输入;
响应于第一输入,从多个目标设备中确定选定设备;
基于所述语音控制指令,向所述选定设备输出所述目标控制指令。
3.根据权利要求1所述的语音交互方法,其特征在于,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:
从多个所述目标设备中,确定已开机设备;
基于所述语音控制指令,向所述已开机设备输出所述目标控制指令。
4.根据权利要求1所述的语音交互方法,其特征在于,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:
从多个所述目标设备中,确定最近运行时刻与当前时刻最靠近的待控设备;
基于所述语音控制指令,向所述待控设备输出所述目标控制指令。
5.根据权利要求1所述的语音交互方法,其特征在于,所述目标设备为多个,所述基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令,包括:
从多个所述目标设备中,确定历史使用频率最高的常用设备;
基于所述语音控制指令,向所述常用设备输出所述目标控制指令。
6.根据权利要求1至5中所述的语音交互方法,其特征在于,还包括:在所述目标区域内不存在与所述设备属性匹配的目标设备,且备选区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述备选区域内的目标设备输出目标控制指令。
7.根据权利要求1至5中所述的语音交互方法,其特征在于,还包括:在所述目标区域内以及备选区域内均不存在与所述设备属性匹配的目标设备的情况下,输出指令无法执行提示信息。
8.一种语音交互装置,其特征在于,包括:
获取模块,用于获取语音控制指令以及用户位置信息;
第一确定模块,用于基于所述用户位置信息,确定目标区域;
第二确定模块,用于基于所述语音控制指令,确定设备属性;
第一输出模块,用于在所述目标区域内存在与所述设备属性匹配的目标设备的情况下,基于所述语音控制指令,向所述目标区域内的目标设备输出目标控制指令。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音交互方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音交互方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228872.XA CN114120996A (zh) | 2021-10-21 | 2021-10-21 | 语音交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228872.XA CN114120996A (zh) | 2021-10-21 | 2021-10-21 | 语音交互方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114120996A true CN114120996A (zh) | 2022-03-01 |
Family
ID=80376380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111228872.XA Pending CN114120996A (zh) | 2021-10-21 | 2021-10-21 | 语音交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114120996A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115373283A (zh) * | 2022-07-29 | 2022-11-22 | 青岛海尔科技有限公司 | 控制指令的确定方法及装置、存储介质及电子装置 |
WO2024016756A1 (zh) * | 2022-07-20 | 2024-01-25 | 青岛海尔空调器有限总公司 | 用于空调的控制方法与装置、智能空调 |
WO2024108905A1 (zh) * | 2022-11-23 | 2024-05-30 | 海信视像科技股份有限公司 | 服务器、智能设备和智能设备控制方法 |
-
2021
- 2021-10-21 CN CN202111228872.XA patent/CN114120996A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024016756A1 (zh) * | 2022-07-20 | 2024-01-25 | 青岛海尔空调器有限总公司 | 用于空调的控制方法与装置、智能空调 |
CN115373283A (zh) * | 2022-07-29 | 2022-11-22 | 青岛海尔科技有限公司 | 控制指令的确定方法及装置、存储介质及电子装置 |
WO2024108905A1 (zh) * | 2022-11-23 | 2024-05-30 | 海信视像科技股份有限公司 | 服务器、智能设备和智能设备控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11307546B2 (en) | Appliance, method and system for controlling the same, server and appliance controlling apparatus | |
CN114120996A (zh) | 语音交互方法及装置 | |
CN110308660B (zh) | 智能设备控制方法及装置 | |
CN113516979B (zh) | 在语音接口设备处的服务器提供的视觉输出 | |
CN105700389B (zh) | 一种智能家庭自然语言控制方法 | |
WO2019205134A1 (zh) | 智能家居语音控制方法、装置、设备和系统 | |
WO2020199673A1 (zh) | 控制家电设备的方法、装置和家电设备 | |
CN106647311B (zh) | 智能中控系统、设备、服务器及智能设备控制方法 | |
CN111367188B (zh) | 智能家居的控制方法、装置、电子设备和计算机存储介质 | |
CN106452987B (zh) | 一种语音控制方法及装置、设备 | |
CN111754997B (zh) | 控制装置及其操作方法,和语音交互装置及其操作方法 | |
CN108694827B (zh) | 一种家用电器语音控制的方法、装置及中控设备 | |
CN113341754A (zh) | 场景配置方法、场景引擎、用户终端和智能家居系统 | |
CN115327932A (zh) | 场景创建方法、装置、电子设备及存储介质 | |
CN110632854A (zh) | 语音控制方法及装置、语音控制节点及系统及存储介质 | |
CN117882130A (zh) | 一种进行语音控制的终端设备及服务器 | |
CN110794773A (zh) | 一种点击式场景创建的方法及装置 | |
CN112180753B (zh) | 一种智能家居控制方法,系统及服务器 | |
CN110361978B (zh) | 基于物联网操作系统的智能设备控制方法和装置及系统 | |
CN114637216A (zh) | 场景配置方法及装置、控制方法及装置、智能设备及介质 | |
CN113039812A (zh) | 信息处理设备和信息处理方法 | |
CN105159356A (zh) | 一种智能设备的控制方法及装置 | |
CN115019793A (zh) | 基于协同纠错的唤醒方法、装置及系统、介质、设备 | |
CN211828111U (zh) | 语音交互系统 | |
CN113357754A (zh) | 运行状态的显示方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |