CN106992008B - 处理方法及电子设备 - Google Patents
处理方法及电子设备 Download PDFInfo
- Publication number
- CN106992008B CN106992008B CN201710203503.2A CN201710203503A CN106992008B CN 106992008 B CN106992008 B CN 106992008B CN 201710203503 A CN201710203503 A CN 201710203503A CN 106992008 B CN106992008 B CN 106992008B
- Authority
- CN
- China
- Prior art keywords
- sound
- processing result
- condition
- control
- electronic equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/02—Non-electrical signal transmission systems, e.g. optical systems using infrasonic, sonic or ultrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Abstract
本发明实施例提供了一种处理方法及电子设备,当监测到满足预定条件的第一声音输入时,启动电子设备的语音控制功能,采集第一声音输入后的第二声音输入;获得第二声音的处理结果,如果处理结果表明第二声音是用户针对电子设备发出的控制语音时,响应第二声音;如果处理结果表明第二声音不是用户针对电子设备发出的控制语音时,忽略第二声音。从而避免了用户误触发电子设备后,电子设备对后续接收到的第二声音进行响应导致的误操作的情况。
Description
技术领域
本发明涉及语音控制技术领域,更具体涉及处理方法及电子设备。
背景技术
随着智能终端的不断地发展,作为智能终端的重要组成部分——智能终端的语音识别技术也迅速发展,各种语音识别软件纷纷亮相,使得人与智能终端的交流变得简单、有趣。
为了避免人与智能终端进行交互时产生误操作,可以为智能终端设置唤醒词,当智能终端接收到与自身匹配的唤醒词时,会采集后续的语音输入,并依据后续语音执行相应的控制操作。但是智能终端可能误接收与自身匹配的唤醒词,假设智能终端的唤醒词为“小乐”,若智能电视播放出“小乐”这一词汇,智能终端接收到“小乐”后,会等待后续的语音输入,并将后续的语音输入作为用户发出的控制指令,导致出现误操作的现象。
发明内容
有鉴于此,本发明提供了一种处理方法及电子设备,以克服现有技术中智能终端将不是针对自身发出的控制语音,误认为是针对自身发出的控制语音,导致出现误操作的现象的问题。
为实现上述目的,本发明提供如下技术方案:
一种处理方法,应用于电子设备,所述处理方法包括:
监测声音输入;
如果检测到满足预定条件的第一声音输入,启动语音控制功能;
采集所述第一声音输入后的第二声音输入;
获得所述第二声音的处理结果;
如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音,所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音;
如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音,所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音。
其中,所述获得所述第二声音的处理结果包括:
获取所述第二声音的第一处理结果,所述第一处理结果用于指示所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令;
当所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,获得所述第二声音的第二处理结果,所述第二处理结果用于表明所述第二声音满足所述第一条件或所述第二条件。
其中,所述如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音包括:
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,输出用于指示所述第一处理结果的提示;
和/或,
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,响应所述第二声音对应的至少一个所述控制指令。
其中,所述获得所述第二声音的第二处理结果包括:
获得包含所述第二声音的声音特征是否属于人发声的特征范围的第二处理结果;
其中,当所述第二声音的声音特征属于人发声的特征范围时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征不属于人发声的特征范围时,确定所述处理结果表明所述第二声音满足所述第二条件;
或,
获得包含所述第二声音的声音特征是否与所述电子设备中预先存储的至少一个用户的声音特征相匹配的第二处理结果;
其中,当所述第二声音的声音特征与所述电子设备中预先存储的至少一个用户的声音特征相匹配时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征与所述电子设备中预先存储的任一个用户的声音特征均不匹配时,确定所述处理结果表明所述第二声音满足所述第二条件。
其中,所述获得所述第二声音的处理结果包括:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件。
其中,所述获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果包括:
确定所述第二声音包含的目标控制词;
将所述目标控制词与预先存储的各控制词进行匹配,每一控制词对应用于执行所述电子设备所支持的一个或多个控制操作的控制指令;
当预先存储的各控制词中不包括所述目标控制词时,确定所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令;
当预先存储的各控制词中包括所述目标控制词时,确定所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令。
其中,在如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音之后,还包括:
关闭所述语音控制功能。
一种电子设备,包括:
麦克风,用于监测声音输入;
处理器,用于:
如果检测到满足预定条件的第一声音输入,启动语音控制功能;
控制所述麦克风采集所述第一声音输入后的第二声音输入;
获得所述第二声音的处理结果;
如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音,所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音;
如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音,所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音。
其中,所述处理器在获得所述第二声音的处理结果时,具体用于:
获取所述第二声音的第一处理结果,所述第一处理结果用于指示所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令;
当所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,获得所述第二声音的第二处理结果,所述第二处理结果用于表明所述第二声音满足所述第一条件或所述第二条件。
其中,所述处理器在获得所述第二声音的处理结果时,具体用于:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件。
经由上述的技术方案可知,与现有技术相比,本发明实施例提供了一种处理方法,当监测到满足预定条件的第一声音输入时,启动电子设备的语音控制功能,采集第一声音输入后的第二声音输入;获得第二声音的处理结果,如果处理结果表明第二声音是用户针对电子设备发出的控制语音时,响应第二声音;如果处理结果表明第二声音不是用户针对电子设备发出的控制语音时,忽略第二声音。从而避免了用户误触发电子设备后,电子设备对后续接收到的第二声音进行响应导致的误操作的情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种处理方法的流程图;
图2为本发明实施例提供的处理方法中获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果的一种实现方法的流程图;
图3为本发明实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种处理方法,该方法可以应用于电子设备,电子设备可以为手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point ofSales,销售终端)、车载电脑、计算机、智能家居终端等终端设备。
该处理方法的流程图如图1所示,该方法包括:
步骤S101:监测声音输入。
电子设备的语音监测功能可以一直处于开启状态。即电子设备可以实时监测外界的声音。
步骤S102:如果检测到满足预定条件的第一声音输入,启动语音控制功能。
预定条件可以为:第一声音包括电子设备的唤醒词,或,第一声音为控制启动语音控制功能的控制指令。
如果第一声音满足预定条件,则电子设备的语音控制功能就被启动。本发明实施例中,电子设备在监测到满足预定条件的第一声音输入后,就进入了等待后续声音输入的状态,当接收到后续声音输入后,可以将后续声音发送至云端服务器,以使云端服务器对后续声音进行语音识别;或,当接收到后续声音输入后,自己将后续声音进行语音识别,以确定是否需要依据该后续声音对自身进行控制操作。本发明实施例中将电子设备监测到满足预定条件的第一声音输入之后能够实现的功能称为语音控制功能。
电子设备在监测到满足预定条件的第一声音输入之前,可能会监测到多个不满足预定条件的声音,假设满足预定条件的第一声音输入为“小乐”,电子设备在监测到“小乐”这一声音之前可能还监测到了“我吃完了”、“真好吃”等声音,这些声音均不能启动电子设备的语音控制功能。若电子设备的语音控制功能不被启动,则电子设备会一直处于监测当前的声音输入是否满足预定条件的状态。即一直处于寻找“满足预定条件的第一声音输入”的状态。
步骤S103:采集所述第一声音输入后的第二声音输入。
步骤S104:获得所述第二声音的处理结果。
电子设备可以将第二声音发送至云端服务器,云端服务器对第二声音进行分析处理,并将处理结果反馈至电子设备。
云端服务器可以一直处于语音识别状态,当接收到电子设备发送的第二声音时,就对该第二声音进行分析处理,当接收不到电子设备发送的第二声音时,就处于等待接收声音状态。
电子设备也可以自己对第二声音进行分析处理,获得处理结果。
步骤S105:如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音。
所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音。
步骤S106:如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音。
所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音。
对于同一第二声音要么执行步骤S105要么执行步骤S106,不会有同时执行步骤S105和步骤S106的情况;因此,本发明实施例中步骤S105和步骤S106没有先后顺序,只是在不同的情景下是执行步骤S105这一分支,还是执行步骤S106这一分支的问题。
可以理解的是,有时用户会误触发电子设备,使得电子设备启动语音控制功能。假设预定条件为包括“小乐”的语音,假设用户正在向其他用户讲解电子设备的功能,例如“当你说到“小乐”这一词汇后,该电子设备就会被唤醒,然后就可以正常控制该电子设备了”;电子设备在监测到“小乐”这一词汇后就启动了语音控制功能,但显然后续的第二声音输入“该电子设备就会被唤醒,然后就可以正常控制该电子设备了”并不是给电子设备发送的控制语音,若电子设备响应了该后续声音输入,用户会感到奇怪,即用户体验较差,因此,当处理结果表明第二声音不是用户针对所述电子设备发出的控制语音,则忽略该第二声音。
较优的,在如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音之后,还包括:关闭所述语音控制功能。
这样电子设备就处于语音控制功能未被启动的状态。电子设备就又返回步骤S101的监测声音输入的状态。若再次检测到满足预定条件的第一声音输入,则会再次启动语音控制功能。
这样可以避免更多的误操作,因为第二声音不是针对电子设备发出的控制语音,第二声音输入后的第三声音输入很大概率也不是针对电子设备发出的控制语音,为了避免电子设备重复执行步骤S103至步骤S106,关闭电子设备的语音控制功能,这样电子设备避免了重复的无意义的操作,提高了电子设备的数据处理效率。
本发明实施例提供了一种处理方法,当监测到满足预定条件的第一声音输入时,启动电子设备的语音控制功能,采集第一声音输入后的第二声音输入;获得第二声音的处理结果,如果处理结果表明第二声音是用户针对电子设备发出的控制语音时,响应第二声音;如果处理结果表明第二声音不是用户针对电子设备发出的控制语音时,忽略第二声音。从而避免了用户误触发电子设备后,电子设备对后续接收到的第二声音进行响应导致的误操作的情况。
本发明实施例提供的处理方法中“获得第二声音的处理结果”的实现方式有多种,本发明实施例提供但不限于以下两种。
第一种,获得第二声音的处理结果的方法如下:
获取第二声音的第一处理结果,第一处理结果用于指示第二声音是否对应至少一个用于对电子设备进行控制操作的控制指令;
当第一处理结果表明第二声音未对应至少一个用于对电子设备进行控制操作的控制指令时,获得第二声音的第二处理结果,第二处理结果用于表明第二声音满足第一条件或第二条件。
本发明实施例中提及的“用于对电子设备进行控制操作的控制指令”,是指电子设备所支持的功能对应的控制指令,电子设备的种类不同,其所支持的功能不同,各功能对应的控制指令也不尽相同。假设电子设备为音箱,则音箱所支持的功能对应的控制指令包括:开机、关机、播放上一曲、播放下一曲、暂停播放、提高音量、降低音量、播放XX歌曲等;假设电子设备为智能空调,则智能空调所支持的功能对应的控制指令包括:开机、关机、设置温度为XX度、制冷、制热等等。本发明实施例中提及的“用于对电子设备进行控制操作的控制指令”不包括“电子设备未识别出第二声音时所对应的用于表征提醒用户再次输入的指令”。
在实际应用过程中,第一处理结果表明第二声音未对应至少一个用于对电子设备进行控制操作的控制指令包括两种情况:一种是,电子设备未识别出第二声音,即电子设备没有“听清楚”第二声音,显然不能确定第二声音对应哪一用于对电子设备进行控制操作的控制指令;另一种是,电子设备已经识别出第二声音,即电子设备已经“听清楚”第二声音,但未识别出第二声音对应哪一用于对电子设备进行控制操作的控制指令。
在第一处理结果表明第二声音未对应至少一个用于对电子设备进行控制操作的控制指令的情况下,对应两种分支情况,一种是,第二声音并不是针对电子设备发出的控制语音;另一种是,第二声音是针对电子设备发出的控制语音。
若在第二声音并不是针对电子设备发出的控制语音的情况下,电子设备提醒用户重新输入,就会带来不好的用户体验。因此电子设备还需要获得第二声音的第二处理结果。第二处理结果用于表明第二声音满足第一条件或第二条件。
当第二声音是针对电子设备发出的控制语音,则可以输出用于指示所述第一处理结果的提示,即提醒用户再次输入声音。当第二声音不是针对电子设备发出的控制语音,则电子设备忽略第二声音,从而提高了用户体验。
第一种获得第二声音的处理结果的方法是首先获取第二声音的第一处理结果;当第一处理结果表明第二声音未对应至少一个用于对电子设备进行控制操作的控制指令时,获得第二声音的第二处理结果。
可以理解的是,第一处理结果还可以表明第二声音对应至少一个用于对电子设备进行控制操作的控制指令;在这种情况下仍对应两种分支情况,一种是,第二声音并不是针对电子设备发出的控制语音;另一种是,第二声音是针对电子设备发出的控制语音。
若第一处理结果表明第二声音对应至少一个用于对电子设备进行控制操作的控制指令,且,第二声音是针对电子设备发出的控制语音,则电子设备可以响应第二声音对应的至少一个所述控制指令。
仍以电子设备为音箱为例,假设用户发出“播放下一曲”的第二声音,第一处理结果表明第二声音对应“播放下一曲”的控制指令,则电子设备可以响应“播放下一曲”这一控制指令,并播放下一曲歌曲。
综上,如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音可以包括两种情况:
一种是:如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,输出用于指示所述第一处理结果的提示;
另一种是:如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,响应所述第二声音对应的至少一个所述控制指令。
在另一实施例中,可以首先获得第二声音的第二处理结果;当第二处理结果表明第二声音满足第一条件,则获取第二声音的第一处理结果。
此时,当第二处理结果表明第二声音满足第二条件,则直接忽略第二声音;若第二处理结果表明第二声音满足第一条件,则获取第二声音的第一处理结果;当第一处理结果表明第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,输出用于指示所述第一处理结果的提示。当第一处理结果表明第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,响应所述第二声音对应的至少一个所述控制指令。
在另一实施例中,可以同时获取第二声音的第一处理结果和第二处理结果。本发明实施例对此不做具体限定。
在上述描述中提及“获得所述第二声音的第二处理结果”,下面对该方法进行说明。
第一应用场景,只要第二声音是人发出的声音,则确定第二声音满足第一条件,否则确定第二声音满足第二条件。
可以利用人发声的特征范围(例如分贝、频率等等),判断第二声音是否是人发出的。
以分贝为例,1分贝是人类耳朵刚刚能听到的声音,20分贝以下的声音,对人而言是非常安静的环境。20-40分贝大约是情侣耳边的喃喃细语。40-60分贝属于人正常的交谈声音。60分贝以上就属于吵闹范围了,70分贝以上开始损害人的听力神经,90分贝以上就会使听力受损,而呆在100-120分贝的空间内,一分钟人类就得暂时性失聪(致聋)。因此人发声的特征范围可以包括:分贝范围为40分贝至60分贝。
人发声的频率范围在100Hz(男低音)到10000Hz(女高音)内,因此,人发声的特征范围可以包括:频率范围为100Hz至10000Hz。
综上,获得所述第二声音的第二处理结果包括:
获得包含所述第二声音的声音特征是否属于人发声的特征范围的第二处理结果。其中,当所述第二声音的声音特征属于人发声的特征范围时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征不属于人发声的特征范围时,确定所述处理结果表明所述第二声音满足所述第二条件。
第二应用场景,电子设备只能由预设一个或多个用户进行语音控制。
例如电子设备可以仅由家人、同一公司职员或好友等进行控制,为了使得电子设备仅能由预设的一个或多个用户进行控制,可以预先将这些用户的声音特征存储在电子设备中。若第二声音的声音特征与预先存储的至少一个用户的声音特征相匹配时,确定第二声音属于预设的一个或多个用户中的一个用户发出的,此时电子设备认为第二声音是针对自身的控制语音。
若第二声音的声音特征与预先存储的任一个用户的声音特征均不匹配时,确定第二声音不属于预设的一个或多个用户中的一个用户发出的,此时电子设备认为第二声音不是针对自身的控制语音。
当电子设备的安全级别比较高时,可以采用上述这种方法,例如智能密码箱、智能防盗门。
综上,获得所述第二声音的第二处理结果的方法包括:
获得包含所述第二声音的声音特征是否与所述电子设备中预先存储的至少一个用户的声音特征相匹配的第二处理结果;
其中,当所述第二声音的声音特征与所述电子设备中预先存储的至少一个用户的声音特征相匹配时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征与所述电子设备中预先存储的任一个用户的声音特征均不匹配时,确定所述处理结果表明所述第二声音满足所述第二条件。
声音特征可以包括:声纹、分贝、频率、音色、音调、音强中的一个或多个。
声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。不同用户的声纹是不同的;每个人说话的习惯不同,其说话的频率、分贝都不相同。
第二种,获得第二声音的处理结果的方法如下:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件。
可以理解的是,若第二声音不是针对电子设备发出的控制语音,一般情况下,电子设备获得第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令的概率很小,因此,在一实施例中,若第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令,则认为第二声音是针对所述电子设备发出的控制语音;若第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令,则认为第二声音不是针对所述电子设备发出的控制语音。
如图2所示,为本发明实施例提供的处理方法中获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果的一种实现方法的流程图,该方法包括:
步骤S201:确定所述第二声音包含的目标控制词。
假设电子设备为音箱,第二声音为“播放下一曲”,电子设备可以首先将第二声音识别出来,然后将第二声音对应的文本进行切分。例如将第二声音切分成:播、播放、播放下、播放下一、播放下一曲;放、放下、放下一、放下一曲;下、下一、下一曲;一、一曲;曲。
这些可以都为第二声音包含的目标控制词。第二声音对应的目标控制词的个数可以为一个或多个。
步骤S202:将所述目标控制词与预先存储的各控制词进行匹配,每一控制词对应用于执行所述电子设备所支持的一个或多个控制操作的控制指令。
步骤S203:当预先存储的各控制词中不包括所述目标控制词时,确定所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令。
步骤S204:当预先存储的各控制词中包括所述目标控制词时,确定所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令。
假设电子设备为音箱,音箱预先存储的各控制词包括:上一曲、暂停、关机、开机、下一曲;仍以上述“播放下一曲”为例,显然预先存储的各控制词中包括一目标控制词——下一曲。因此确定第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令,且该控制指令为“下一曲”相应的控制指令。假设下一曲为歌曲《凉凉》,则音箱会播放《凉凉》。
若第二声音中根本不包括任何预先存储任一控制词,很明显该第二声音不是针对电子设备发出的控制语音。
本发明实施例还提供了与处理方法相应的电子设备,下面对电子设备进行说明,电子设备实施例和处理方法实施例可以互相参见,相同之处不再赘述。
如图3所示,为本发明实施例提供的一种电子设备的结构图,该电子设备包括:
麦克风31,用于监测声音输入;
处理器32,用于:
如果检测到满足预定条件的第一声音输入,启动语音控制功能;
控制所述麦克风采集所述第一声音输入后的第二声音输入;
获得所述第二声音的处理结果;
如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音,所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音;
如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音,所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音。
处理器32可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
电子设备还可以包括通信总线33,其中麦克风31、处理器32通过通信总线33完成相互间的通信。
可选的,处理器在获得所述第二声音的处理结果时,具体用于:
获取所述第二声音的第一处理结果,所述第一处理结果用于指示所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令;
当所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,获得所述第二声音的第二处理结果,所述第二处理结果用于表明所述第二声音满足所述第一条件或所述第二条件。
可选的,处理器在如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音时,具体用于:
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,输出用于指示所述第一处理结果的提示;
和/或,
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,响应所述第二声音对应的至少一个所述控制指令。
可选的,处理器在获得所述第二声音的第二处理结果时,具体用于:
获得包含所述第二声音的声音特征是否属于人发声的特征范围的第二处理结果;
其中,当所述第二声音的声音特征属于人发声的特征范围时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征不属于人发声的特征范围时,确定所述处理结果表明所述第二声音满足所述第二条件;
或,
获得包含所述第二声音的声音特征是否与所述电子设备中预先存储的至少一个用户的声音特征相匹配的第二处理结果;
其中,当所述第二声音的声音特征与所述电子设备中预先存储的至少一个用户的声音特征相匹配时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征与所述电子设备中预先存储的任一个用户的声音特征均不匹配时,确定所述处理结果表明所述第二声音满足所述第二条件。
可选的,处理器在获得所述第二声音的处理结果时,具体用于:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件。
可选的,处理器在获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果时,具体用于:
确定所述第二声音包含的目标控制词;
将所述目标控制词与预先存储的各控制词进行匹配,每一控制词对应用于执行所述电子设备所支持的一个或多个控制操作的控制指令;
当预先存储的各控制词中不包括所述目标控制词时,确定所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令;
当预先存储的各控制词中包括所述目标控制词时,确定所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令。
可选的,处理器在如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音之后,还用于:
关闭所述语音控制功能。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种处理方法,其特征在于,应用于电子设备,所述处理方法包括:
监测声音输入;
如果检测到满足预定条件的第一声音输入,启动语音控制功能;
采集所述第一声音输入后的第二声音输入;
获得所述第二声音的处理结果;
如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音,所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音;
如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音,所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音;
其中,所述获得所述第二声音的处理结果包括:
获取所述第二声音的第一处理结果,所述第一处理结果用于指示所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令;
当所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,获得所述第二声音的第二处理结果,所述第二处理结果用于表明所述第二声音满足所述第一条件或所述第二条件;
其中,所述第二声音满足所述第一条件,表征所述电子设备识别出所述第二声音是用户针对所述电子设备发出的控制语音,且所述电子设备未能识别出所述第二声音对应的控制指令;所述第二声音满足第二条件,表征所述电子设备识别出所述第二声音并不是用户针对所述电子设备发出的控制语音。
2.根据权利要求1所述处理方法,其特征在于,所述如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音包括:
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,输出用于指示所述第一处理结果的提示;所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令包括:电子设备未识别出第二声音或者未识别出第二声音对应哪一用于对电子设备进行控制操作的控制指令;
如果所述第二处理结果表明所述第二声音满足第一条件,且,所述第一处理结果表明所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,响应所述第二声音对应的至少一个所述控制指令。
3.根据权利要求1或2所述处理方法,其特征在于,所述获得所述第二声音的第二处理结果包括:
获得包含所述第二声音的声音特征是否属于人发声的特征范围的第二处理结果;
其中,当所述第二声音的声音特征属于人发声的特征范围时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征不属于人发声的特征范围时,确定所述处理结果表明所述第二声音满足所述第二条件;
或,
获得包含所述第二声音的声音特征是否与所述电子设备中预先存储的至少一个用户的声音特征相匹配的第二处理结果;
其中,当所述第二声音的声音特征与所述电子设备中预先存储的至少一个用户的声音特征相匹配时,确定所述第二处理结果表明所述第二声音满足所述第一条件;当所述第二声音的声音特征与所述电子设备中预先存储的任一个用户的声音特征均不匹配时,确定所述处理结果表明所述第二声音满足所述第二条件。
4.根据权利要求1所述处理方法,其特征在于,所述获得所述第二声音的处理结果包括:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件,所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令包括:电子设备未识别出第二声音或者未识别出第二声音对应哪一用于对电子设备进行控制操作的控制指令。
5.根据权利要求4所述处理方法,其特征在于,所述获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果包括:
确定所述第二声音包含的目标控制词;
将所述目标控制词与预先存储的各控制词进行匹配,每一控制词对应用于执行所述电子设备所支持的一个或多个控制操作的控制指令;
当预先存储的各控制词中不包括所述目标控制词时,确定所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令;
当预先存储的各控制词中包括所述目标控制词时,确定所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令。
6.根据权利要求1所述处理方法,其特征在于,在如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音之后,还包括:
关闭所述语音控制功能。
7.一种电子设备,其特征在于,包括:
麦克风,用于监测声音输入;
处理器,用于:
如果检测到满足预定条件的第一声音输入,启动语音控制功能;
控制所述麦克风采集所述第一声音输入后的第二声音输入;
获得所述第二声音的处理结果;
如果所述处理结果表明所述第二声音满足第一条件时,响应所述第二声音,所述第一条件用于表征所述第二声音是用户针对所述电子设备发出的控制语音;
如果所述处理结果表明所述第二声音满足第二条件时,忽略所述第二声音,所述第二条件用于表征所述第二声音不是用户针对所述电子设备发出的控制语音;
其中,所述处理器在获得所述第二声音的处理结果时,具体用于:
获取所述第二声音的第一处理结果,所述第一处理结果用于指示所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令;
当所述第一处理结果表明所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,获得所述第二声音的第二处理结果,所述第二处理结果用于表明所述第二声音满足所述第一条件或所述第二条件;
其中,所述第二声音满足所述第一条件,表征所述电子设备识别出所述第二声音是用户针对所述电子设备发出的控制语音,且所述电子设备未能识别出所述第二声音对应的控制指令;所述第二声音满足第二条件,表征所述电子设备识别出所述第二声音并不是用户针对所述电子设备发出的控制语音。
8.根据权利要求7所述电子设备,其特征在于,所述处理器在获得所述第二声音的处理结果时,具体用于:
获取包括所述第二声音是否对应至少一个用于对所述电子设备进行控制操作的控制指令的所述处理结果;
其中,当所述第二声音对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第一条件;
当所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令时,确定所述处理结果表明所述第二声音满足所述第二条件,所述第二声音未对应至少一个用于对所述电子设备进行控制操作的控制指令包括:电子设备未识别出第二声音或者未识别出第二声音对应哪一用于对电子设备进行控制操作的控制指令。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710203503.2A CN106992008B (zh) | 2017-03-30 | 2017-03-30 | 处理方法及电子设备 |
US15/920,965 US20180285068A1 (en) | 2017-03-30 | 2018-03-14 | Processing method of audio control and electronic device thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710203503.2A CN106992008B (zh) | 2017-03-30 | 2017-03-30 | 处理方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106992008A CN106992008A (zh) | 2017-07-28 |
CN106992008B true CN106992008B (zh) | 2021-04-13 |
Family
ID=59412047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710203503.2A Active CN106992008B (zh) | 2017-03-30 | 2017-03-30 | 处理方法及电子设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180285068A1 (zh) |
CN (1) | CN106992008B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201720418D0 (en) * | 2017-11-13 | 2018-01-24 | Cirrus Logic Int Semiconductor Ltd | Audio peripheral device |
CN108962260A (zh) * | 2018-06-25 | 2018-12-07 | 福来宝电子(深圳)有限公司 | 一种多人命令语音识别方法、系统及存储介质 |
CN108932942A (zh) * | 2018-06-26 | 2018-12-04 | 四川斐讯信息技术有限公司 | 一种实现智能音箱人机对话的系统及其方法 |
CN110858483A (zh) * | 2018-08-23 | 2020-03-03 | 深圳市冠旭电子股份有限公司 | 智能设备、语音唤醒方法、语音唤醒装置及存储介质 |
CN109065036A (zh) * | 2018-08-30 | 2018-12-21 | 出门问问信息科技有限公司 | 语音识别的方法、装置、电子设备及计算机可读存储介质 |
CN109410933B (zh) * | 2018-10-18 | 2021-02-19 | 珠海格力电器股份有限公司 | 设备的控制方法及装置、存储介质和电子装置 |
JP7358407B2 (ja) * | 2019-02-27 | 2023-10-10 | グーグル エルエルシー | コンピューティングデバイスとの継続的な会話の検出 |
US11676582B2 (en) * | 2019-02-27 | 2023-06-13 | Google Llc | Detecting conversations with computing devices |
CN112542168A (zh) * | 2020-12-08 | 2021-03-23 | 维沃移动通信有限公司 | 语音控制方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103841248A (zh) * | 2012-11-20 | 2014-06-04 | 联想(北京)有限公司 | 一种信息处理的方法及电子设备 |
CN105427863A (zh) * | 2015-12-18 | 2016-03-23 | 合肥寰景信息技术有限公司 | 一种语音即时识别方法 |
CN105723448A (zh) * | 2014-01-21 | 2016-06-29 | 三星电子株式会社 | 电子设备及其语音识别方法 |
CN105931644A (zh) * | 2016-04-15 | 2016-09-07 | 广东欧珀移动通信有限公司 | 一种语音识别方法及移动终端 |
CN105957527A (zh) * | 2016-05-16 | 2016-09-21 | 珠海格力电器股份有限公司 | 一种语音控制电器的方法、装置及语音控制空调 |
CN106128456A (zh) * | 2016-06-16 | 2016-11-16 | 美的集团股份有限公司 | 智能家电的语音控制方法、终端及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101663113B1 (ko) * | 2015-01-13 | 2016-10-14 | 현대자동차주식회사 | 웨어러블 디바이스와의 통신이 가능한 차량용 장치 및 그 제어 방법 |
-
2017
- 2017-03-30 CN CN201710203503.2A patent/CN106992008B/zh active Active
-
2018
- 2018-03-14 US US15/920,965 patent/US20180285068A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103841248A (zh) * | 2012-11-20 | 2014-06-04 | 联想(北京)有限公司 | 一种信息处理的方法及电子设备 |
CN105723448A (zh) * | 2014-01-21 | 2016-06-29 | 三星电子株式会社 | 电子设备及其语音识别方法 |
CN105427863A (zh) * | 2015-12-18 | 2016-03-23 | 合肥寰景信息技术有限公司 | 一种语音即时识别方法 |
CN105931644A (zh) * | 2016-04-15 | 2016-09-07 | 广东欧珀移动通信有限公司 | 一种语音识别方法及移动终端 |
CN105957527A (zh) * | 2016-05-16 | 2016-09-21 | 珠海格力电器股份有限公司 | 一种语音控制电器的方法、装置及语音控制空调 |
CN106128456A (zh) * | 2016-06-16 | 2016-11-16 | 美的集团股份有限公司 | 智能家电的语音控制方法、终端及系统 |
Also Published As
Publication number | Publication date |
---|---|
US20180285068A1 (en) | 2018-10-04 |
CN106992008A (zh) | 2017-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106992008B (zh) | 处理方法及电子设备 | |
US10516776B2 (en) | Volume adjusting method, system, apparatus and computer storage medium | |
US11600265B2 (en) | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence | |
US10832686B2 (en) | Method and apparatus for pushing information | |
KR101726945B1 (ko) | 수동 시작/종료 포인팅 및 트리거 구문들에 대한 필요성의 저감 | |
CN102117614B (zh) | 个性化文本语音合成和个性化语音特征提取 | |
US10733970B2 (en) | Noise control method and device | |
US20060085183A1 (en) | System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech | |
CN111343028A (zh) | 配网控制方法及装置 | |
CN111223490A (zh) | 声纹唤醒方法及装置、设备、存储介质 | |
CN111429917B (zh) | 一种设备唤醒方法及终端设备 | |
JP6662962B2 (ja) | 話者検証方法及び音声認識システム | |
TW202005420A (zh) | 個人聽力裝置 | |
CN111199730B (zh) | 语音识别方法、装置、终端及存储介质 | |
CN104851423B (zh) | 一种声音信息处理方法及装置 | |
KR102483833B1 (ko) | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 | |
CN107948854B (zh) | 一种操作音频生成方法、装置、终端及计算机可读介质 | |
CN110197663B (zh) | 一种控制方法、装置及电子设备 | |
CN111010482A (zh) | 语音寻回方法、无线设备及计算机可读存储介质 | |
CN112866480B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN111800700B (zh) | 环境中对象提示方法、装置、耳机设备及存储介质 | |
CN113314115A (zh) | 终端设备的语音处理方法、终端设备及可读存储介质 | |
CN110992951B (zh) | 一种基于对抗样本保护个人隐私的方法 | |
CN112885341A (zh) | 一种语音唤醒方法、装置、电子设备和存储介质 | |
CN111294475B (zh) | 电子装置及电子装置的模式切换方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |