CN109903762B - 一种语音控制方法、装置、存储介质及语音设备 - Google Patents

一种语音控制方法、装置、存储介质及语音设备 Download PDF

Info

Publication number
CN109903762B
CN109903762B CN201910012617.8A CN201910012617A CN109903762B CN 109903762 B CN109903762 B CN 109903762B CN 201910012617 A CN201910012617 A CN 201910012617A CN 109903762 B CN109903762 B CN 109903762B
Authority
CN
China
Prior art keywords
voice
preset
voice command
video
video file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910012617.8A
Other languages
English (en)
Other versions
CN109903762A (zh
Inventor
廖海霖
陶梦春
毛跃辉
郑文成
张新
李保水
韩雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201910012617.8A priority Critical patent/CN109903762B/zh
Publication of CN109903762A publication Critical patent/CN109903762A/zh
Application granted granted Critical
Publication of CN109903762B publication Critical patent/CN109903762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供一种语音控制方法、装置、存储介质及语音设备,所述方法包括:在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;若判断接收到N条以上满足预设连续条件的预设语音命令,则接收第一语音命令,所述第一语音命令用于播放指定的影音文件;根据接收到的所述第一语音命令搜索所述指定的影音文件,并对所述指定的影音文件进行播放。本发明提供的方案能够能够减少影音播放场景下使用预设语音命令的频率。

Description

一种语音控制方法、装置、存储介质及语音设备
技术领域
本发明涉及控制领域,尤其涉及一种语音控制方法、装置、存储介质及语音设备。
背景技术
语音技术已经由一门很年轻的计算机技术发展成了一门非常流行,也越来成熟的技术。未来的计算机的发展趋势是人工智能,让计算机能听、能说,是未来人机交互的重要发展方向,其中,语音成为未来最被看好的人机交互方式之一,而且语音比其他的交互方式有更多的优势。音乐播放是智能设备非常重要的一个功能,一个好的智能设备音乐播放功能是其必备功能。
众所周知,语音设备是采用语音输入的设备,语音信息分为语音唤醒、语音命令、语音输入等类型。要允许语音输入首先得唤醒设备,唤醒语音输入设备允许用户输入语音并解释语音。为了防止语音设备被无意唤醒,语音唤醒需设定特定的唤醒命令词。语音唤醒在音乐播放方面是比较方便的,大部分语音设备在播放音乐时允许用户不需要说出唤醒命令,直接使用“上一首”、“下一首”的语音命令,就可以直接进行音乐切换,使用非常方便;但由于智能设备一般是看不了播放列表,播放列表只存在相关的app里,如现在用户在听的是【粤语经典歌曲】,听了第一首不喜欢,使用语音命令“下一首”切换到下一首歌曲,然而,下一首也是不喜欢听的……,如此下去,有可能用户连续输入多次“下一首”的语音命令后切换到的都不是用户喜欢的歌曲,此时,用户可能需要通过语音输入歌曲名称以快速切换到想听的歌曲,然而此时就需要唤醒语音设备,即说出唤醒命令词,等待语音设备响应之后才能语音输入想切换的歌曲,过程较为不便。
发明内容
本发明的主要目的在于克服上述现有技术的缺陷,提供一种语音控制方法、装置、存储介质及语音设备,以解决现有技术中用户需要先语音输入语音设备的唤醒命令词才能通过语音输入想听的歌曲名称的问题。
本发明一方面提供了一种语音控制方法,包括:在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;若判断接收到N条以上满足预设连续条件的预设语音命令,则接收第一语音命令,所述第一语音命令用于播放指定的影音文件;根据接收到的所述第一语音命令搜索所述指定的影音文件,并对所述指定的影音文件进行播放。
可选地,所述影音文件,包括:音频和/或视频文件;和/或,所述预设语音命令,包括:切换命令。
可选地,所述预设连续条件,包括:所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;和/或,所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
可选地,接收第一语音命令,包括:通过语音提示用户输入所述第一语音命令,以接收用户输入的所述第一语音命令;和/或,在判断接收到N条以上满足预设连续条件的预设语音命令后,在预设时间内接收所述第一语音命令。
可选地,根据接收到的所述第一语音命令搜索所述指定的影音文件,包括:对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
可选地,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
本发明另一方面提供了一种语音控制装置,包括:判断单元,用于在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;接收单元,用于若判断接收到N条以上满足预设连续条件的预设语音命令,则接收第一语音命令,所述第一语音命令用于播放指定的影音文件;搜索单元,用于根据接收到的所述第一语音命令搜索所述指定的影音文件;播放单元,用于对所述指定的影音文件进行播放。
可选地,所述影音文件,包括:音频和/或视频文件;和/或,所述预设语音命令,包括:切换命令。
可选地,所述预设连续条件,包括:所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;和/或,所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
可选地,接收第一语音命令,包括:通过语音提示用户输入所述第一语音命令,以接收用户输入的所述第一语音命令;和/或,在判断接收到N条以上满足预设连续条件的预设语音命令后,在预设时间内接收所述第一语音命令。
可选地,所述搜索单元,所述搜索单元,包括:识别子单元,用于对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;搜索子单元,用于根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
可选地,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
本发明又一方面提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括前述任一所述的语音控制方法装置。
根据本发明的技术方案,在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令,若是,则接收用于播放指定的影音文件的第一语音命令,根据接收到的第一语音命令搜索指定的影音文件并播放,能够减少影音播放场景下使用预设语音命令的频率,并且用户不用说出特定唤醒词唤醒语音设备,设备可以自动唤醒进入接收用户搜索语音的状态,并提示用户直接输入搜索语音,方便快捷。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明提供的语音控制方法的一实施例的方法示意图;
图2是根据本发明实施例的根据接收到的所述第一语音命令搜索所述指定的影音文件的步骤的一种具体实施方式的流程示意图;
图3是本发明提供的语音控制方法的一具体实施例的方法示意图;
图4是本发明提供的语音控制装置的一实施例的结构示意图;
图5是根据本发明实施例的搜索单元的一具体实施方式的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明提供还一种语音控制方法。所述语音控制方法可以用于语音设备,具体可以用于语音设备在播放影音文件时进行影音文件的播放控制。所述语音设备包括能够通过语音进行控制和/或交互的设备。例如,能够实现语音交互的移动终端(例如手机、平板电脑)、家用电器(例如,智能电视)等。
图1是本发明提供的语音控制方法的一实施例的方法示意图。如图1所示,根据本发明的一个实施例,所述语音控制方法至少包括步骤S110、步骤S120和步骤S130。
步骤S110,在播放影音文件时,判断是否接收到满足预设条件的连续N条以上预设语音命令。
所述影音文件包括音频文件和/或视频文件;所述音频文件例如歌曲音频、故事音频和/或诗词音频;所述视频文件,例如包括电视剧集和/或电影等。所述预设语音命令具体可以包括:不需要语音唤醒语音设备即可被语音设备执行的命令。在一种具体实施方式中,所述预设语音命令包括切换命令,例如,音乐播放的切换命令“上一首”、“下一首”。判断是否接收到N条以上满足预设连续条件的预设语音命令,即判断是否接连接收到N条以上预设语音命令,且N条以上预设语音命令满足预设连续条件。
在一种具体实施方式中所述预设连续条件包括:所述连续N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件。
例如,定义一可变变量n,该变量n用来存储连续接收到预设语音命令的次数,定义一可判断预设语音命令是否连续的条件(即预设连续条件),例如,预设连续条件可以为两条命令之间是否未完整播放一首音乐或者一段故事的情况,如果两条预设语音命令之间完整播放了至少一个影音文件(一首音乐或者一段故事),则将n置为1;如果未完整播放一个影音文件,则将n置为n=n+1;设定一个触发语音输入的条件,即,判断n的值是否大于N,N例如设为3,如果n的值大于3,则判定满足接收到N条以上满足预设连续条件的预设语音命令。
在另一种具体实施方式中,所述预设连续条件包括:所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔小于预设时间阈值。
例如,定义一可变变量n,该变量n用来存储连续接收到预设语音命令的次数,定义一可判断预设语音命令是否连续的条件(即预设连续条件),例如,预设连续条件可以为两条预设语音命令的接收时间间隔小于预设时间阈值(例如20秒),如果两条预设语音命令接收时间间隔大于或等于预设时间阈值,则将n置为0;如果两条预设语音命令接收时间间隔小于预设时间阈值,则将n置为n=n+1;设定一个触发语音输入的条件,即,判断n的值是否大于N,N例如设为3,如果n的值大于3,则判定满足接收到N条以上满足预设连续条件的预设语音命令。
步骤S120,若判断接收到满足预设条件的连续N条以上预设语音命令,则接收第一语音命令。
其中,所述第一语音命令用于播放指定的影音文件。具体地,若判断接收到满足预设条件的连续N条以上预设语音命令,则不需要用户唤醒设备,设备自动唤醒并接收用户的第一语音命令。
在一种具体实施方式中,在判断接收到满足预设条件的连续N条以上预设语音命令后,可以通过语音提示用户输入所述第一语音命令,以接收用户输入的所述第一语音命令。
例如,在判断接收到N条以上满足预设连续条件的预设语音命令后,语音提示用户“您可以直接说出歌名进入播放”,进一步地,还可以语音提示用户当前播放列表的名称,以便用户根据当前播放列表的名称,确定是否继续播放当前播放列表中的影音文件,或者切换到其他播放列表中。例如,语音提示用户“当前播放列表是【粤语经典歌曲】,您可以直接说出歌名进入播放”。
可选地,在判断接收到N条以上满足预设连续条件的预设语音命令后,在预设时间内接收所述第一语音命令。
例如,在判断接收到满足预设条件的连续N条以上预设语音命令后,即唤醒语音设备,进入接收第一语音命令状态,或者可以提示用户直接说出影音文件名称,同时进入接收第一语音命令状态,若在预设时间内接收到第一语音命令,则进行后续步骤,若在预设时间内未接收到第一语音命令,则退出接收第一语音命令的状态。
步骤S130,根据接收到的所述第一语音命令搜索所述指定的影音文件,并对所述影音文件进行播放。
图2是根据本发明实施例的根据接收到的所述第一语音命令搜索所述指定的影音文件的步骤的一种具体实施方式的流程示意图。如图2所示,在一种具体实施方式中,步骤S130包括步骤S131和步骤S132。
步骤S131,对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称。
所述第一语音命令具体用于播放指定的影音文件,即播放用户指定的影音文件,也就是说,用户通过发出所述第一语音命令指定设备播放自己想要播放的影音文件。接收到用户发出的该第一语音命令后,则通过对所述第一语音命令进行语音识别,得到用户指定的影音文件的名称。例如,用户想要听歌曲“红豆”,则语音输入“红豆”(即说出“红豆”),接收到用户语音输入的“红豆”之后,进行语音识别,识别出用户想听的歌曲的名称“红豆”。
步骤S132,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
具体地,可以根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。即,优先在当前的播放列表中搜索用户指定的影音文件,若当前的播放列表中搜索不到再切换到其他列表搜索或者从云端服务器进行搜索。例如,当前的播放列表是王菲的歌曲,当前播放的是红豆,用户连续使用了三次“下一首”语音命令(每次使用“下一首”切换之后都不是用户想要的才会再次使用“下一首”切换),唤醒了语音输入,则语音提示用户可通过语音输入直接搜索,此时用户输入:“播放暧昧”,则在当前列表里搜索“暧昧”这首歌,如果没有,再去其他列表里搜索,或者从云端搜索。
为清楚说明本发明技术方案,下面再以一个具体实施例对本发明提供的语音控制方法的执行流程进行描述。
图3是本发明提供的语音控制方法的一具体实施例的方法示意图。
用户使用预设语音命令进行切换音乐或故事或诗词等,使用的预设语音命令例如为“下一首”、“上一首”等词语;定义一可变变量n,该变量n用来存储连续接收到预设语音命令的次数(简称连续次数),定义一可判断预设语音命令是否连续的条件(即预设连续条件),例如,预设连续条件可以为两条命令之间是否未完整播放一首音乐或者一段故事的情况,如果两条预设语音命令之间完整播放了至少一个影音文件(一首音乐或者一段故事),则将n置为0;如果未完整播放一个影音文件,则将n置为n=n+1;设定一个触发语音输入的条件,即,判断n的值是否大于N,N例如设为3,如果n的值大于3,则播放语音提醒用户不用唤醒语音设备直接语音输入搜索内容,同时将连续接收到预设语音命令的次数n置0,自动唤醒语音设备,允许用户输入语音,用户可在预设时间内直接通过语音输入搜索内容,跳转到想要播放的影音文件,无须用户使用语音唤醒词唤醒语音设备,设备自动唤醒,直接输入语音命令,即可完成语音输入。
本发明提供还一种语音控制装置。所述语音控制装置可以用于语音设备,具体可以用于语音设备在播放影音文件时进行影音文件的播放控制。所述语音设备包括能够通过语音进行控制和/或交互的设备。例如,能够实现语音交互的移动终端(例如手机、平板电脑)、家用电器(例如,智能电视)等。
图4是本发明提供的语音控制装置的一实施例的结构示意图。所述语音控制方法具体可以用于在语音设备播放影音文件时进行影音文件的播放控制。
如图4所示,所述语音控制装置100包括判断单元110、接收单元120、搜索单元130和播放单元140。
判断单元110用于在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;接收单元120用于若判断接收到N条以上满足预设连续条件的预设语音命令,则接收第一语音命令,所述第一语音命令用于播放指定的影音文件;搜索单元130用于根据接收到的所述第一语音命令搜索所述指定的影音文件;播放单元140用于对所述指定的影音文件进行播放。
在所述语音设备播放影音文件时,判断单元110判断是否接收到满足预设条件的连续N条以上预设语音命令。
所述影音文件包括音频文件和/或视频文件;所述音频文件例如歌曲音频、故事音频和/或诗词音频;所述视频文件,例如包括电视剧集和/或电影等。所述预设语音命令具体可以包括:不需要语音唤醒语音设备即可被语音设备执行的命令。在一种具体实施方式中,所述预设语音命令包括切换命令,例如,音乐播放的切换命令“上一首”、“下一首”。判断单元110判断是否接收到N条以上满足预设连续条件的预设语音命令,即判断是否接连接收到N条以上预设语音命令,且N条以上预设语音命令满足预设连续条件。
在一种具体实施方式中所述预设连续条件包括:所述连续N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件。
例如,定义一可变变量n,该变量n用来存储连续接收到预设语音命令的次数,定义一可判断预设语音命令是否连续的条件(即预设连续条件),例如,预设连续条件可以为两条命令之间是否未完整播放一首音乐或者一段故事的情况,如果两条预设语音命令之间完整播放了至少一个影音文件(一首音乐或者一段故事),则将n置为0;如果未完整播放一个影音文件,则将n置为n=n+1;设定一个触发语音输入的条件,即,判断n的值是否大于N,N例如设为3,如果n的值大于3,则判定满足接收到N条以上满足预设连续条件的预设语音命令。
在另一种具体实施方式中,所述预设连续条件包括:所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔小于预设时间阈值。
例如,定义一可变变量n,该变量n用来存储连续接收到预设语音命令的次数,定义一可判断预设语音命令是否连续的条件(即预设连续条件),例如,预设连续条件可以为两条预设语音命令的接收时间间隔小于预设时间阈值(例如20秒),如果两条预设语音命令接收时间间隔大于或等于预设时间阈值,则将N置为0;如果两条预设语音命令接收时间间隔小于预设时间阈值,则将n置为n=n+1;设定一个触发语音输入的条件,即,判断n的值是否大于N,N例如设为3,如果n的值大于3,则判定满足接收到N条以上满足预设连续条件的预设语音命令。
若判断单元110判断接收到满足预设条件的连续N条以上预设语音命令,则接收单元120接收第一语音命令。其中,所述第一语音命令用于播放指定的影音文件。具体地,若判断单元110判断接收到满足预设条件的连续N条以上预设语音命令,则不需要用户唤醒设备,设备自动唤醒,接收单元120接收用户的第一语音命令。
在一种具体实施方式中,在判断单元110判断接收到满足预设条件的连续N条以上预设语音命令后,可以通过语音提示用户输入所述第一语音命令,接收单元120接收用户输入的所述第一语音命令。
例如,在判断接收到N条以上满足预设连续条件的预设语音命令后,语音提示用户“您可以直接说出歌名进入播放”,进一步地,还可以语音提示用户当前播放列表的名称,以便用户根据当前播放列表的名称,确定是否继续播放当前播放列表中的影音文件,或者切换到其他播放列表中。例如,语音提示用户“当前播放列表是【粤语经典歌曲】,您可以直接说出歌名进入播放”。
可选地,在判断单元110判断接收到N条以上满足预设连续条件的预设语音命令后,接收单元120在预设时间内接收所述第一语音命令。
例如,在判断单元110判断接收到满足预设条件的连续N条以上预设语音命令后,即唤醒语音设备,进入接收第一语音命令状态,或者可以提示用户直接说出影音文件名称,同时进入接收第一语音命令状态,若接收单元120在预设时间内接收到第一语音命令,则进行后续步骤,若接收单元120在预设时间内未接收到第一语音命令,则退出接收第一语音命令的状态。
搜索单元130根据接收到的所述第一语音命令搜索所述指定的影音文件。
图5是根据本发明实施例的搜索单元的一具体实施方式的结构示意图。如图5所示,所述搜索单元130包括识别子单元131和搜索子单元132。
识别子单元131用于对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;搜索子单元132用于根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
所述第一语音命令具体用于播放指定的影音文件,即播放用户指定的影音文件,也就是说,用户通过发出所述第一语音命令指定设备播放自己想要播放的影音文件。接收单元120接收到用户发出的该第一语音命令后,识别子单元131通过对所述第一语音命令进行语音识别,得到用户指定的影音文件的名称。例如,用户想要听歌曲“红豆”,则语音输入“红豆”(即说出“红豆”),接收到用户语音输入的“红豆”之后,进行语音识别,识别出用户想听的歌曲的名称“红豆”。搜索子单元132可以根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。即,优先在当前的播放列表中搜索用户指定的影音文件,若当前的播放列表中搜索不到再切换到其他列表搜索或者从云端服务器进行搜索。例如,当前的播放列表是王菲的歌曲,当前播放的是红豆,用户连续使用了三次“下一首”语音命令(每次使用“下一首”切换之后都不是用户想要的才会再次使用“下一首”切换),唤醒了语音输入,则语音提示用户可通过语音输入直接搜索,此时用户输入:“播放暧昧”,则在当前列表里搜索“暧昧”这首歌,如果没有,再去其他列表里搜索,或者从云端搜索。
本发明还提供对应于所述语音控制方法的一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明还提供对应于所述语音控制方法的一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明还提供对应于所述语音控制装置的一种语音设备,包括前述任一所述的语音控制装置。
据此,本发明提供的方案,在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令,若是,则接收用于播放指定的影音文件的第一语音命令,根据接收到的第一语音命令搜索指定的影音文件并播放,能够减少影音播放场景下使用预设语音命令的频率,并且用户不用说出特定唤醒词唤醒语音设备,设备可以自动唤醒进入接收用户搜索语音的状态,并提示用户直接输入搜索语音,方便快捷。
本文中所描述的功能可在硬件、由处理器执行的软件、固件或其任何组合中实施。如果在由处理器执行的软件中实施,那么可将功能作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体予以传输。其它实例及实施方案在本发明及所附权利要求书的范围及精神内。举例来说,归因于软件的性质,上文所描述的功能可使用由处理器、硬件、固件、硬连线或这些中的任何者的组合执行的软件实施。此外,各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为控制装置的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (21)

1.一种语音控制方法,其特征在于,包括:
在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;所述预设语音命令,包括:切换命令;
若判断接收到N条以上满足预设连续条件的预设语音命令,则唤醒语音设备,进入接收第一语音命令状态,接收第一语音命令,所述第一语音命令用于播放指定的影音文件;
根据接收到的所述第一语音命令搜索所述指定的影音文件,并对所述指定的影音文件进行播放。
2.根据权利要求1所述的方法,其特征在于,
所述影音文件,包括:音频和/或视频文件。
3.根据权利要求1所述的方法,其特征在于,
所述预设连续条件,包括:
所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;
和/或,
所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
4.根据权利要求2所述的方法,其特征在于,
所述预设连续条件,包括:
所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;
和/或,
所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
5.根据权利要求1-4任一项所述的方法,其特征在于,接收第一语音命令,包括:
通过语音提示用户输入所述第一语音命令,以接收用户输入的所述第一语音命令;
和/或,
在判断接收到N条以上满足预设连续条件的预设语音命令后,在预设时间内接收所述第一语音命令。
6.根据权利要求1-4任一项所述的方法,其特征在于,根据接收到的所述第一语音命令搜索所述指定的影音文件,包括:
对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;
根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
7.根据权利要求5所述的方法,其特征在于,根据接收到的所述第一语音命令搜索所述指定的影音文件,包括:
对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;
根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
8.根据权利要求6所述的方法,其特征在于,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:
根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
9.根据权利要求7所述的方法,其特征在于,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:
根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
10.一种语音控制装置,其特征在于,包括:
判断单元,用于在播放影音文件时,判断是否接收到N条以上满足预设连续条件的预设语音命令;所述预设语音命令,包括:不需要唤醒语音设备即可被语音设备执行的语音命令;所述预设语音命令,包括:切换命令;
接收单元,用于若判断接收到N条以上满足预设连续条件的预设语音命令,则唤醒语音设备,进入接收第一语音命令状态,接收第一语音命令,所述第一语音命令用于播放指定的影音文件;
搜索单元,用于根据接收到的所述第一语音命令搜索所述指定的影音文件;
播放单元,用于对所述指定的影音文件进行播放。
11.根据权利要求10所述的装置,其特征在于,
所述影音文件,包括:音频和/或视频文件。
12.根据权利要求10所述的装置,其特征在于,
所述预设连续条件,包括:
所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;
和/或,
所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
13.根据权利要求11所述的装置,其特征在于,
所述预设连续条件,包括:
所述N条以上预设语音命令中每两条相邻的命令之间未完整播放一个影音文件;
和/或,
所述N条以上预设语音命令中每两条相邻的命令的接收时间间隔均小于预设时间阈值。
14.根据权利要求10-13任一项所述的装置,其特征在于,接收第一语音命令,包括:
通过语音提示用户输入所述第一语音命令,以接收用户输入的所述第一语音命令;
和/或,
在判断接收到N条以上满足预设连续条件的预设语音命令后,在预设时间内接收所述第一语音命令。
15.根据权利要求10-13任一项所述的装置,其特征在于,所述搜索单元,包括:
识别子单元,用于对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;
搜索子单元,用于根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
16.根据权利要求14所述的装置,其特征在于,所述搜索单元,包括:
识别子单元,用于对所述第一语音命令进行语音识别,以得到所述指定的影音文件的名称;
搜索子单元,用于根据得到的所述指定的影音文件的名称搜索所述指定的影音文件。
17.根据权利要求15所述的装置,其特征在于,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:
根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
18.根据权利要求16所述的装置,其特征在于,根据得到的所述指定的影音文件的名称搜索所述指定的影音文件,包括:
根据所述指定的影音文件的名称在当前的播放列表中搜索所述指定的影音文件。
19.一种存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1-9任一所述方法的步骤。
20.一种语音设备,其特征在于,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-9任一所述方法的步骤。
21.一种语音设备,其特征在于,包括如权利要求10-18任一所述的语音控制装置。
CN201910012617.8A 2019-01-07 2019-01-07 一种语音控制方法、装置、存储介质及语音设备 Active CN109903762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910012617.8A CN109903762B (zh) 2019-01-07 2019-01-07 一种语音控制方法、装置、存储介质及语音设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910012617.8A CN109903762B (zh) 2019-01-07 2019-01-07 一种语音控制方法、装置、存储介质及语音设备

Publications (2)

Publication Number Publication Date
CN109903762A CN109903762A (zh) 2019-06-18
CN109903762B true CN109903762B (zh) 2021-01-29

Family

ID=66943709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910012617.8A Active CN109903762B (zh) 2019-01-07 2019-01-07 一种语音控制方法、装置、存储介质及语音设备

Country Status (1)

Country Link
CN (1) CN109903762B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349579B (zh) * 2019-07-15 2021-10-15 北京梧桐车联科技有限责任公司 语音唤醒处理方法及装置、电子设备及存储介质
CN113160814B (zh) * 2021-04-09 2022-09-09 深圳市腾远智拓电子有限公司 一种基于fpga的无线组网传输系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106775232A (zh) * 2016-12-12 2017-05-31 杭州网易云音乐科技有限公司 一种通过目标应用设置按键功能的方法和装置
CN107105087A (zh) * 2017-03-27 2017-08-29 广东欧珀移动通信有限公司 消息播放方法、装置及计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106775232A (zh) * 2016-12-12 2017-05-31 杭州网易云音乐科技有限公司 一种通过目标应用设置按键功能的方法和装置
CN107105087A (zh) * 2017-03-27 2017-08-29 广东欧珀移动通信有限公司 消息播放方法、装置及计算机设备

Also Published As

Publication number Publication date
CN109903762A (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
KR102429436B1 (ko) 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법
CN109545206B (zh) 智能设备的语音交互处理方法、装置和智能设备
CN104599669A (zh) 一种语音控制方法和装置
CN109360567B (zh) 可定制唤醒的方法和装置
CN103593230B (zh) 移动终端的后台任务控制方法及移动终端
WO2019007245A1 (zh) 一种处理方法、控制方法、识别方法及其装置和电子设备
CN103517119A (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
CN103137128A (zh) 用于设备控制的手势和语音识别
CN108470034A (zh) 一种智能设备服务提供方法及系统
KR20140093303A (ko) 디스플레이 장치 및 그의 제어 방법
CN102763159A (zh) 话音输入的处理
US20130339032A1 (en) Server and method of controlling the same
CN110751948A (zh) 一种语音识别方法、装置、存储介质及语音设备
CN111263204B (zh) 用于多媒体播放设备的控制方法、装置及计算机存储介质
WO2019137114A1 (zh) 语音控制处理方法及装置
WO2021196617A1 (zh) 一种语音交互方法、装置、电子设备及存储介质
CN103903613A (zh) 一种信息处理方法及电子设备
CN109903762B (zh) 一种语音控制方法、装置、存储介质及语音设备
CN106792048B (zh) 一种识别智能电视用户语音命令的方法和装置
CN110333840A (zh) 推荐方法、装置、电子设备和存储介质
CN106601242A (zh) 操作事件的执行方法及装置、终端
CN109686372B (zh) 资源播放控制方法和装置
CN102723087B (zh) 多媒体播放方法和装置
CN112102826A (zh) 一种控制语音设备多端唤醒的系统和方法
CN109658924B (zh) 会话消息处理方法、装置及智能设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant