CN115440212A - 语音控制方法、装置、电子设备、车辆和存储介质 - Google Patents
语音控制方法、装置、电子设备、车辆和存储介质 Download PDFInfo
- Publication number
- CN115440212A CN115440212A CN202210773076.2A CN202210773076A CN115440212A CN 115440212 A CN115440212 A CN 115440212A CN 202210773076 A CN202210773076 A CN 202210773076A CN 115440212 A CN115440212 A CN 115440212A
- Authority
- CN
- China
- Prior art keywords
- application
- voice
- display screen
- target
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000004590 computer program Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 14
- 230000003287 optical effect Effects 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开涉及一种语音控制方法、装置、电子设备、车辆和存储介质。该方法包括:接收指示控制需求的语音指令;根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;控制所述目标应用执行所述语音指令。该方法能够避免至少两个应用执行语音指令导致的响应异常,使得语音指令可以正常执行,从而能够提升用户体验度。
Description
技术领域
本公开涉及语音控制技术领域,尤其涉及一种语音控制方法、装置、电子设备、车辆和存储介质。
背景技术
随着车辆的发展,用户对于车辆的驾驶体验和娱乐体验的需求越来越高,出现了多显示屏幕的车辆,使得车辆内的乘客可以通过不同的显示屏幕进行娱乐体验。每个显示屏幕中可以包括至少两个应用,例如,音频类应用、视频类应用、K歌应用等,基于不同的应用,用户可以体验不同的娱乐项目。
然而,针对用户的发出的语音指令命中一个用户意图时,该用户意图对应至少两个显示屏幕中的至少两个应用,导致存在至少两个应用对语音指令进行响应,使得语音指令响应异常,影响用户体验度。
发明内容
本公开提供了一种语音控制方法、装置、电子设备、车辆和存储介质,能够避免至少两个应用对语音指令进行响应,使得语音指令可以正常执行,从而提升用户体验度。
第一方面,本公开提供了一种语音控制方法,包括:
接收指示控制需求的语音指令;
根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;
控制所述目标应用执行所述语音指令。
可选的,所述根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用,包括:
根据所述语音指令,选择对应的目标显示屏幕;
若所述候选应用为至少两个,根据所述目标显示屏幕中至少两个所述候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用;
若所述候选应用为一个,确定所述候选应用为所述目标应用。
可选的,所述根据所述语音指令,选择对应的所述目标显示屏幕,包括:
若所述语音指令对应的显示屏幕中包括指定显示屏幕,确定所述指定显示屏幕为所述目标显示屏幕;
若所述语音指令对应的显示屏幕中不包括指定显示屏幕,确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕。
可选的,所述确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕,包括:
若所述语音指令的类型为第一类型,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第一类型包括点播类、界面打开类和界面关闭类;
若所述语音指令的类型为第二类型且所述语音虚拟形象所在的显示屏幕处于为耳机播放中,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第二类型包括续播类和控制类。
可选的,所述方法还包括:
当未选取到所述目标显示屏幕时,根据所述语音指令的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
可选的,所述根据所述语音指令的类型对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用,包括:
若所述语音指令的类型为控制类,确定处于功放播放中的所述候选应用为所述目标应用;
若所述语音指令的类型为续播类,根据语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
可选的,所述根据语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用,包括:
若所述连接状态为未连接,确定处于有功放最近播放记录的所述候选应用为所述目标应用;
若所述连接状态为已连接且存在处于所述功放播放中的所述候选应用,确定处于所述功放播放中的所述候选应用为所述目标应用;
若所述连接状态为已连接且不存在处于所述功放播放中的所述候选应用,将所述语音虚拟形象所在的显示屏幕中有最近播放记录的所述候选应用,确定为所述目标应用。
可选的,所述根据各候选应用的优先级,确定匹配所述控制需求的目标应用,包括:
获取所述各候选应用的状态信息;
根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用,所述优先级信息中包括至少两个预设状态信息及其各自对应的优先级。
可选的,所述根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用之前,还包括:
根据所述语音指令和指令对应规则,查询确定所述语音指令对应的指令类型,所述指令对应规则中包括至少两个预设语音指令及其各自对应的预设指令类型;
根据所述指令类型和预设的优先级对应关系,查询确定所述指令类型对应的所述优先级信息,所述预设的优先级对应关系包括至少两个所述预设指令类型及其各自对应的预设优先级信息。
可选的,所述根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用,包括:
按照优先级从高到低的顺序,从所述优先级信息中依次选取目标状态信息,针对每个所述目标状态信息,查询所述状态信息中是否存在所述目标状态信息;
将所述状态信息中首个查询到的所述目标状态信息对应的所述候选应用,确定为所述目标应用。
可选的,其特征在于,所述方法还包括:
当所述优先级信息中不存在与所述状态信息匹配的所述预设状态信息时,确定所述各候选应用中的预先设置的默认应用为所述目标应用。
第二方面,本公开提供了一种语音控制装置,包括:
接收模块,用于接收指示控制需求的语音指令;
确定模块,用于根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;
控制模块,用于控制所述目标应用执行所述语音指令。
第三方面,本公开提供了一种电子设备,包括:处理器,所述处理器用于执行存储于存储器的计算机程序,所述计算机程序被处理器执行时实现第一方面提供的任一方法的步骤。
第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的任一方法的步骤。
第五方面,本公开提供了一种车辆,包括:第二方面提供的语音控制装置;或者,第三方面提供的电子设备;或者,第四方面提供的计算机可读存储介质。
本公开提供的技术方案中,通过接收指示控制需求的语音指令;根据语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配控制需求的目标应用;控制目标应用执行语音指令,可以从可执行语音指令的至少两个应用中确定一个目标应用,以使目标应用执行语音指令,避免了至少两个应用执行语音指令导致的响应异常,使得语音指令可以正常执行,从而能够提升用户体验度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开提供的一种应用场景的示意图;
图2为本公开提供的一种语音控制方法的流程示意图;
图3为本公开提供的另一种语音控制方法的流程示意图;
图4为本公开提供的又一种语音控制方法的流程示意图;
图5为本公开提供的又一种语音控制方法的流程示意图;
图6为本公开提供的又一种语音控制方法的流程示意图;
图7为本公开提供的又一种语音控制方法的流程示意图;
图8为本公开提供的又一种语音控制方法的流程示意图;
图9为本公开提供的又一种语音控制方法的流程示意图;
图10为本公开提供的又一种语音控制方法的流程示意图
图11为本公开提供的一种语音控制装置的结构示意图;
图12为本公开提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
图1为本公开提供的一种应用场景的示意图,如图1所示,应用场景中包括至少两个显示屏幕,例如,显示屏幕可以是中控显示屏幕111、第一车载显示屏幕112、第二车载显示屏幕113和第三车载显示屏幕114,其中,中控显示屏幕111可以向驾驶员提供娱乐体验,第一车载显示屏幕112位于副驾驶座位附近,可以向副驾驶座位上的用户提供娱乐体验,第二车载显示屏幕113位于后排左侧座位附近,可以向后排左侧座位上的用户提供娱乐体验,第三车载显示屏幕114位于后排右侧座位附近,可以向后排右侧座位上的用户提供娱乐体验。此外,本公开中的显示屏幕还可以是智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。
需要说明的是,图1仅以四个显示屏幕为例对应用场景进行示例性说明,在实际应用中,显示屏幕可以是两个或三个,还可以是四个以上,本实施例对应用场景中的显示屏幕的数量不做具体限制。还需要说明的是,图1仅以两排五座的车辆为例对应用场景进行示例性说明,但并不作为对以车辆内座位数量和排布的限制。
本公开的应用场景中还包括声音采集装置,例如,麦克风,如图1所示,应用场景中声音采集装置可以包括四个麦克风,分别为位于驾驶员座位附近的第一麦克风121、位于副驾驶座位附近的第二麦克风122、位于后排左侧座位附近的第三麦克风123和位于后排右侧座位附近的第四麦克风124。其中,第一麦克风121可以采集驾驶员的声音信号,第二麦克风122可以采集副驾驶座位上的用户的声音信号,第三麦克风123可以采集后排左侧座位上的用户的声音信号,第四麦克风124可以采集后排右侧座位上的用户的声音信号。基于麦克风采集到的声音信号,可以获取到用户触发的语音指令,例如,语音指令可以是“副驾驶暂停播放”、“继续播放”、“播放XXX”等。
解析用户触发的语音指令,可以得到该语音指令命中的一个用户意图,例如,用户触发的语音指令为“播放歌曲XXX”,解析语音指令“播放歌曲XXX”,得到的用户意图为“播放音频”。针对语音指令的用户意图,可执行语音指令的应用为同一类型的应用,例如,基于上述实施例,针对用户意图“播放音频”,可执行语音指令的应用为音频类应用。
一些实施例中,可执行语音指令的应用为同一应用名的应用,且此应用名的应用设置于至少两个显示屏幕中,则可以执行语音指令的应用至少是两个。例如,语音指令为“播放歌曲XXX”,应用名为A1的应用可执行语音指令,其中,应用名为A1的应用设置于显示屏幕P1和显示屏幕P2中,则可执行语音指令的至少两个应用为显示屏幕P1和显示屏幕P2中各自的应用名为A1的应用。一些实施例中,可执行语音指令的应用为至少两个应用名的应用,且至少两个应用名的应用可以设置于至少一个显示屏幕中,则可以执行语音指令的应用至少是两个。例如,语音指令为“播放歌曲XXX”,应用名为A1的应用和应用名为A2的应用可执行语音指令,其中,应用名为A1的应用设置于显示屏幕P1中,应用名为A2的应用设置于显示屏幕P1和显示屏幕P2,则可执行语音指令的至少两个应用为显示屏幕P1中应用名为A1的应用和应用名为A2的应用,以及显示屏幕P2中应用名为A1的应用。如此,本公开提供的应用场景中存在至少两个应用可以执行语音指令,容易导致显示屏幕内部数据处理异常,即显示屏幕对语音指令响应异常。
为了解决上述问题,本公开中,通过接收指示控制需求的语音指令;根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;控制所述目标应用执行所述语音指令,可以从可执行语音指令的至少两个应用中确定一个目标应用,以使目标应用执行语音指令,避免了至少两个应用执行语音指令导致的响应异常,使得语音指令能够正常执行,从而能够提升用户体验度。
下面以几个具体的实施例详细描述本公开的技术方案。
图2为本公开提供的一种语音控制方法的流程示意图,如图2所示,包括:
S101,接收指示控制需求的语音指令。
示例性的,用户基于自身的控制需求发出相应的语音指令,基于声音采集装置可以获取到用户触发的语音指令,如此可以接收到用户触发的语音指令。可以将语音指令划分为五个指令类型,分别为续播类、控制类、点播类、界面打开类和界面关闭类,相应的,语音指令基于类型可以分为续播类语音指令、控制类语音指令、点播类语音指令、界面打开类语音指令和界面关闭类语音指令。其中,续播类语音指令可以包括“播放”、“继续播放”、“上一个”和“下一个”等,控制类语音指令可以包括“暂停播放”、“收藏”、“取消收藏”、“快进”和“快退”等,点播类语音指令可以包括“搜索XXX”和“播放XXX”等,界面打开类语音指令可以为“打开XXX”,界面关闭类语音指令可以为“关闭XXX”。
S102,根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用。
示例性的,语音指令对应的显示屏幕可以是用户指定的显示屏幕和/或语音虚拟形象所在的显示屏幕,还可以是应用场景中的所有显示屏幕。基于语音指令的类型,可以得到语音指令对应的状态的优先级,状态包括播放中、前台运行中和有最近播放记录中的至少一个。获取可执行语音指令的各候选应用的状态,根据语音指令的各候选应用的状态和语音指令对应的状态的优先级,可以得到语音指令的各候选应用的优先级。
一些实施例中,可以根据语音指令对应的显示屏幕及各候选应用的优先级,确定匹配控制需求的目标应用。若从语音指令对应的显示屏幕中可以选取出执行语音指令的目标显示屏幕,可以根据目标显示屏幕中语音指令的各候选应用的优先级,确定优先级最高的候选应用为执行语音指令的目标应用。若从语音指令对应的显示屏幕中无法选取出执行语音指令的目标显示屏幕,则可以基于语音指令的各候选应用的优先级,确定优先级最高的候选应用为执行语音指令的目标应用,目标应用所在的显示屏幕即为执行语音指令的目标显示屏幕。
一些实施例中,可以根据语音指令对应的显示屏幕,确定匹配控制需求的目标应用。若从语音指令对应的显示屏幕中可以选取出执行语音指令的目标显示屏幕,基于语音指令的类型,可以得到语音指令对应的一个候选应用,并确定候选应用为执行语音指令的目标应用。例如,选取目标显示屏幕为指定显示屏幕,若语音指令为续播类,续播类语音指令对应的候选应用为有最近播放记录的应用,则确定指定显示屏幕中有最近播放记录的应用为目标应用;若语音指令为控制类,控制类语音指令对应的候选应用为播放中的应用,确定指定显示屏幕中处于播放中的应用为目标应用。
一些实施例中,还可以根据各候选应用的优先级,从候选应用中确定匹配控制需求的目标应用,即优先级最高的候选应用为执行语音指令的目标应用。
S103,控制所述目标应用执行所述语音指令。
基于上述实施例,可以确定出执行语音指令的一个目标应用,如此,可以调用目标应用的应用接口,将语音指令通过目标应用的应用接口传输至目标应用。目标应用在支持该语音指令时,可以执行该语音指令,在不支持该语音指令时,返回不支持该语音指令的提示信息。
本实施例中,通过接收指示控制需求的语音指令;根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;控制所述目标应用执行所述语音指令,可以从可执行语音指令的至少两个应用中确定一个目标应用,以使目标应用执行语音指令,避免了至少两个应用执行语音指令导致的响应异常,使得语音指令能够正常执行,从而能够提升用户体验度。
图3为本公开提供的另一种语音控制方法的流程示意图,图3为图2所示实施例的基础上执行S102时的一种可能的实现方式的具体描述,如下:
S1021,根据所述语音指令,选择对应的目标显示屏幕。
示例性的,根据语音指令,从语音指令对应的显示屏幕中选择执行语音指令的目标显示屏幕,目标显示屏幕可以是指定显示屏幕,或者可以是语音虚拟形象所在的显示屏幕。
作为执行S1021时的一种可能的实现方式的具体描述,如图4所示:
S201,确定所述语音指令对应的显示屏幕中是否包括指定显示屏幕。
若是,执行S202;若否,执行S203。
示例性的,指定显示屏幕的优先级高于语音虚拟形象所在的显示屏幕,如此,基于语音指令对应的显示屏幕中是否包括指定显示屏幕,来确定目标显示屏幕为指定显示屏幕或语音虚拟形象所在的显示屏幕。
S202,确定所述指定显示屏幕为所述目标显示屏幕。
若语音指令中包括用户指定的显示屏幕,即语音指令对应的显示屏幕中包括指定显示屏幕,则可以确定指定显示屏幕为目标显示屏幕,例如,语音指令为“副驾驶播放歌曲XXX”,其中,指定显示屏幕为“副驾驶”附近的显示屏幕,则可以确定“副驾驶”附近的显示屏幕为执行语音指令的目标显示屏幕。
若指定显示屏幕处于关闭状态,此时,指定显示屏幕会向用户显示提示显示屏幕关闭的消息,例如,提示消息可以是“屏幕还没有打开,不能这么控制哦”。若指定显示屏幕处于开启状态,则可以进一步在指定显示屏幕的各候选应用中确定一个执行语音指令的目标应用。
S203,确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕。
若语音指令中不包括用户指定的显示屏幕,即语音指令对应的显示屏幕中不包括指定显示屏幕,可以确定语音虚拟形象所在的显示屏幕为目标显示屏幕。示例性的,若语音指令的类型为第一类型,第一类型为点播类、界面打开类和界面关闭类,则可以确定语音虚拟形象所在的显示屏幕为目标显示屏幕。若语音指令的类型为第二类型,第二类型为续播类和控制类,则可以当语音虚拟形象所在的显示屏幕当前处于耳机播放中时,确定语音虚拟形象所在的显示屏幕为目标显示屏幕。
S1022,确定所述候选应用是否为一个。
若是,执行S1023;若否,执行S1024。
示例性的,在确定了目标显示屏幕的情况下,可以在目标显示屏幕中,确定可执行语音指令的至少一个候选应用。当语音指令为第二类型时,语音指令对应的候选应用为一个,例如,若目标显示屏幕为指定显示屏,续播类语音指令对应的候选应用为有最近播放记录的应用,控制类语音指令对应的候选应用为播放中的应用;若目标显示屏幕为语音虚拟形象所在的显示屏幕,则第二类型语音指令的候选应用为耳机播放中的应用。当语音指令为第一类型时,语音指令的候选应用可能为一个也可能为至少两个,例如,若语音指令中包括指定应用,指定应用即为候选应用,如此,语音指令的候选应用为一个;若语音指令中不包括指定应用,语音指令的候选应用为至少两个,每个候选应用对应一个优先级。如此,可以确定出可执行语音指令的候选应用是否为一个。
S1023,确定所述候选应用为所述目标应用。
一些实施例中,语音指令为第二类型,可以确定可执行语音指令的候选应用为一个,候选应用即为执行语音指令的目标语音指令。例如,基于上述实施例,在目标显示屏幕为指定显示屏幕的情况下,若语音指令为续播类,目标应用为指定显示屏幕中有最近播放记录的应用,若语音指令为控制类,目标应用为指定显示屏幕中处于播放中的应用。在目标显示屏幕为语音虚拟形象所在的显示屏幕的情况下,第二类型语音指令的目标应用为语音虚拟形象所在的显示屏幕中处于耳机播放中的应用。
一些实施例中,语音指令为第一类型且语音指令中包括指定应用,可以确定可执行语音指令的候选应用为一个,候选应用即为执行语音指令的目标语音指令。例如,基于上述实施例,第二类型语音指令中的指定应用为应用名为A1的应用,也就是说,第二类型语音指令的候选应用为应用名为A1的应用,则第二类型语音指令的目标应用为目标显示屏幕中应用名为A1的应用。
S1024,根据所述目标显示屏幕中至少两个所述候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
若语音指令为第一类型且语音指令中不包括指定应用,可以确定可执行语音指令的候选应用为至少两个,根据目标显示屏幕中语音指令的至少两个候选应用的优先级,确定出目标显示屏幕中优先级最高的候选应用,则目标显示屏幕中优先级最高的候选应用为目标应用。例如,点播类语音指令和界面打开类语音指令对应的三个候选应用分别为处于前台运行中的应用、处于播放中的应用和有最近播放记录的应用,其中,处于前台运行中的应用的优先级最高,则目标显示屏幕中处于前台运行中的应用为目标应用。界面关闭类语音指令对应的三个候选应用分别为处于前台运行中的应用、处于播放中的应用和有最近播放记录的应用,其中,处于播放中的应用的优先级最高,则目标显示屏幕中处于播放中的应用为目标应用。
图5为本公开提供的又一种语音控制方法的流程示意图,图5为图3所示实施例的基础上,还包括:
S301,确定是否选取到所述目标显示屏幕。
若否,执行S302。
S302,根据所述语音指令的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
示例性的,若根据语音指令,从语音指令对应的显示屏幕中未选择出执行语音指令的目标显示屏幕,则获取语音指令的类型对应的状态的优先级,状态包括播放中、前台运行中和有最近播放记录中的至少一个。基于语音指令得到可执行语音指令的各候选应用,获取各候选应用的状态,根据语音指令的各候选应用的状态和语音指令的类型对应的状态的优先级,可以得到语音指令的各候选应用的优先级。如此,基于语音指令的各候选应用的优先级,确定优先级最高的候选应用为执行语音指令的目标应用,目标应用所在的显示屏幕即为执行语音指令的目标显示屏幕。
图6为本公开提供的又一种语音控制方法的流程示意图,图6为图5所示实施例的基础上,执行S302时的一种可能的实现方式的具体描述,如下:
S3021,若所述语音指令的类型为控制类,确定处于功放播放中的所述候选应用为所述目标应用。
示例性的,语音指令为控制类语音指令,若控制类语音指令的候选应用中包括处于功放播放中的应用,则确定处于功放播放中的候选应用为目标应用。若控制类语音指令的候选应用中不包括处于功放播放中的应用,则通过显示屏幕向用户展示提示信息,例如,提示信息为“您还没有播放内容,先手动操作下吧”。
S3022,若所述语音指令的类型为续播类,根据所述语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
示例性的,语音指令为续播类语音指令,根据语音虚拟形象所在的显示屏幕与耳机的连接状态,确定相应的状态的优先级。例如,若语音虚拟形象所在的显示屏幕与耳机的连接状态为未连接,则相应的状态为有功放最近播放记录,即语音虚拟形象所在的显示屏幕与耳机未连接对应的候选应用为有功放最近播放记录的应用。若语音虚拟形象所在的显示屏幕与耳机的连接状态为已连接,则相应的状态为功放播放中和语音虚拟形象所在的显示屏幕中有最近播放记录,且功放播放中的优先级高于语音虚拟形象所在的显示屏幕中有最近播放记录的优先级,即语音虚拟形象所在的显示屏幕与耳机已连接对应的候选应用为处于功放播放中的应用以及语音虚拟形象所在的显示屏幕中有最近播放记录的应用。
基于语音虚拟形象所在的显示屏幕与耳机的连接状态对应的各候选应用的优先级,确定优先级最高的候选应用为目标应用。示例性的,基于上述实施例,当语音虚拟形象所在的显示屏幕与耳机的连接状态为未连接时,若语音指令的候选应用中包括有功放最近播放记录的应用,则确定有功放最近播放记录的候选应用为目标应用,若语音指令的候选应用中不包括有功放最近播放记录的应用,则通过显示屏幕向用户展示提示信息,例如,提示信息为“您还没有播放内容,先手动操作下吧”。
当语音虚拟形象所在的显示屏幕与耳机的连接状态为已连接,若语音指令的候选应用中包括功放播放中的应用,则确定功放播放中的候选应用为目标应用;若语音指令的候选应用中不包括功放播放中的应用,确定语音指令的候选应用是否包括语音虚拟形象所在的显示屏幕中有最近播放记录的应用。若语音指令的候选应用包括语音虚拟形象所在的显示屏幕中有最近播放记录的应用,则确定语音虚拟形象所在的显示屏幕中有最近播放记录的候选应用为目标应用;若语音指令的候选应用不包括语音虚拟形象所在的显示屏幕中有最近播放记录的应用,则通过显示屏幕向用户展示提示信息,例如,提示信息为“您还没有播放内容,先手动操作下吧”。
图7为本公开提供的又一种语音控制方法的流程示意图,图7为图2所示实施例的基础上,执行S102时的另一种可能的实现方式的具体描述,如下:
S401,获取所述各候选应用的状态信息。
示例性的,遍历预先设置的语音指令对应关系,预先设置的语音指令对应关系中包括至少两个预设语音指令以及每个预设语音指令对应的预设应用,确定语音指令对应关系中是否存在与语音指令匹配的预设语音指令,这里的匹配可以理解为相同或相似。若所有预设语音指令中存在与语音指令相同的预设语音指,和/或若所有预设语音指令中存在与语音指令相似的预设语音指令,可以确定语音指令对应关系中存在与语音指令匹配的预设语音指令。作为一种确定语音指令对应关系中存在与语音指令相似的预设语音指令的可能的实现方式:基于语音指令的动词和所有预设语音指令中各预设语音指令的动词是否相同,确定语音指令对应关系中是否存在与语音指令相似的预设语音指令,例如,语音指令为“播放歌曲XXX”,语音指令对应关系中存在预设语音指令“播放”,语音指令“播放歌曲XXX”和预设语音指令“播放”为相同的动词,则确定语音指令对应关系中存在与语音指令匹配的预设语音指令。在得到语音指令对应关系中与语音指令匹配的预设语音指令之后,可以确定与语音指令匹配的预设语音指令对应的预设应用为可执行语音指令的各候选应用。
状态信息可以包括运行状态、播放状态、最近播放记录状态中的至少一个,其中,运行状态可以为前台运行中、运行中、后台运行中或未运行中,播放状态可以为耳机播放中、功放播放中、播放中或未播放,最近播放记录状态信息可以为有最近播放记录、有耳机最近播放记录、有功放最近播放记录或无最近播放记录。在得到可执行语音指令的各候选应用之后,获取各候选应用当前的状态信息。
S403,根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用。
所述优先级信息中包括至少两个预设状态信息及其各自对应的优先级。
示例性的,可以将所有预设语音指令划分为至少两个类型,每个类型对应一个预设优先级信息,语音指令的类型为至少两个类型中的一个,如此,可以确定语音指令的类型对应的优先级信息。优先级信息中包括至少两个预设状态信息,例如,优先级信息中包括三个预设状态信息,分别为前台运行中、播放中和有最近播放记录中。优先级信息中每个预设状态信息对应一个优先级,例如,基于上述实施例,播放中的优先级高于前台运行中的优先级,前台运行中的优先级高于有最近播放记录的优先级。
在其他实施方式中,优先级信息中包括两个预设状态信息,两个预设状态信息分别是耳机播放中和功放播放中,其中,耳机播放中的优先级高于功放播放中的优先级;或者,两个预设状态信息分别是有耳机最近播放记录和有功放最近播放记录,其中,有耳机最近播放记录的优先级高于有功放最近播放记录的优先级。
需要说明的是,本实施例仅以优先级信息中包括三个或两个预设状态信息为例,对优先级信息中的预设状态信息的数量进行示例性说明,并不作为对优先级信息中的预设状态信息的数量的限制。本实施例仅以播放中、前台运行中和有最近播放记录对预设状态信息进行示例性说明,并不作为对预设状态信息的限制。本实施例仅以播放中的优先级高于前台运行中的优先级,前台运行中的优先级高于有最近播放记录的优先级对预设状态信息的优先级进行示例性说明,在实际应用中,前台运行中、播放中和有最近播放记录的优先级顺序可以灵活设置。
图8为本公开提供的又一种语音控制方法的流程示意图,图8为图7所示实施例的基础上,执行S403之前,还包括:
S4021,根据所述语音指令和指令对应规则,查询确定所述语音指令对应的指令类型。
所述指令对应规则中包括至少两个预设语音指令及其各自对应的预设指令类型。
示例性的,指令对应规则为预先设置好的,指令对应规则中包括至少两个预设语音指令,指令对应规则中的预设语音指令与语音指令对应关系中的预设语音指令相同。指令对应规则中还包括至少两个预设指令类型,每个预设指令类型对应至少一个预设语音指令,例如,指令对应规则中包括五个预设指令类型,分别为续播类、控制类、点播类、界面打开类和界面关闭类,其中,续播类对应的预设语音指令可以为“播放”、“继续播放”、“上一个”和“下一个”等,控制类对应的预设语音指令可以为“暂停播放”、“收藏”、“取消收藏”、“快进”和“快退”等,点播类对应的预设语音指令可以为“搜索XXX”和“播放XXX”等,界面打开类对应的预设语音指令可以为“打开XXX”,界面关闭类对应的预设语音指令可以为“关闭XXX”。
遍历指令对应规则,查询指令对应规则中是否包括与语音指令匹配的预设语音指令,在指令对应规则中包括与语音指令匹配的预设语音指令的情况下,确定指令对应规则中与语音指令匹配的预设语音指令对应的预设指令类型为语音指令对应的指令类型。例如,基于上述实施例,若语音指令为“上一个”,遍历指令对应规则,查询到的语音指令的类型为续播类;若语音指令为“快进”,遍历指令对应规则,查询到的语音指令的类型为控制类;若语音指令为“播放AAA”,遍历指令对应规则,查询到的语音指令的类型为点播类。
S4022,根据所述指令类型和预设的优先级对应关系,查询确定所述指令类型对应的所述优先级信息。
所述预设的优先级对应关系包括至少两个所述预设指令类型及其各自对应的预设优先级信息。
示例性的,预设的优先级对应关系包括至少两个预设指令类型,预设优先级对应关系中的预设指令类型与指令对应规则中的预设指令类型相同。预设优先级对应关系还包括至少两个预设优先级信息,预设指令类型可以与预设优先级信息一一对应,例如,续播类对应预设优先级信息M1,控制类对应预设优先级信息M2,点播类对应预设优先级信息M3,界面打开类对应预设优先级信息M4,界面关闭类预设优先级信息M5。其他实施方式中,还可能是至少两个预设指令类型对应一个预设优先级信息。
获取的语音指令的指令类型之后,遍历预设的优先级对应关系,查询预设的优先级对应关系中与指令类型对应的预设优先级信息,并确定与指令类型对应的预设优先级信息为优先级信息。
一些实施例中,可以将指令对应规则和预设的优先级对应关系合二为一,只需要查询一次即可得到语音指令对应的优先级信息,能够提升语音指令控制的效率。
本实施例中,通过根据语音指令和指令对应规则,查询确定语音指令对应的指令类型,指令对应规则中包括至少两个预设语音指令及其各自对应的预设指令类型;根据指令类型和预设的优先级对应关系,查询确定指令类型对应的优先级信息,预设的优先级对应关系包括至少两个预设指令类型及其各自对应的预设优先级信息,如此,对不同类型的语音指令设置不同的优先级信息,能够提升语音控制的多样性。
图9为本公开提供的又一种语音控制方法的流程示意图,图9为图7所示实施例的基础上,执行S403时的一种可能的实现方式的具体描述,如下:
S4031,按照优先级从高到低的顺序,从所述优先级信息中依次选取目标状态信息,针对每个所述目标状态信息,查询所述状态信息中是否存在所述目标状态信息;
示例性的,基于优先级信息中的至少两个预设状态信息的优先级从高到低的顺序,依次选取目标状态信息,例如,语音指令为点播类语音指令或界面打开类指令,优先级信息包括前台运行中、播放中和有最近播放记录,其中,前台运行中的优先级高于播放中的优先级,播放中的优先级高于有最近播放记录的优先级,按照优先级从高到低的顺序,依次选取到的目标状态信息为:前台运行中-播放中-有最近播放记录。
一些实施例中,语音指令为界面关闭类语音指令,相应的,优先级信息可以包括两个预设状态信息,分别为播放中和前台运行中,其中,播放中的优先级高于前台运行中的优先级。一些实施例中,语音指令为续播类语音指令,相应的,优先级信息可以包括四个预设状态信息,分别为耳机播放中、功放播放中、有耳机最近播放记录和有功放最近播放记录,其中,耳机播放中的优先级高于功放播放中的优先级,功放播放中的优先级高于有耳机最近播放记录的优先级,有耳机最近播放记录的优先级高于有功放最近播放记录的优先级。一些实施例中,语音指令为控制类语音指令,相应的,优先级信息可以包括两个预设状态信息,分别为耳机播放中和功放播放中,其中,耳机播放中的优先级高于功放播放中的优先级。
基于首个目标状态信息遍历各候选应用的状态信息,确定各候选应用的状态信息中是否可以查询到首个目标状态信息,若各候选应用的状态信息中可以查询到首个目标状态信息,则首个目标状态信息为各候选应用的状态信息中首次查询到的状态信息。若各候选应用的状态信息中未查询到首个目标状态信息,选取第二个目标状态信息,基于第二个目标状态信息遍历各候选应用的状态信息,确定各候选应用的状态信息中是否可以查询到第二个目标状态信息,若各候选应用的状态信息中可以查询到第二个目标状态信息,则第二个目标状态信息为各候选应用的状态信息中首次查询到的状态信息。据此,依次选取目标状态信息直至最后一个目标状态信息,可确定出各候选应用的状态信息中首次查询到的状态信息。
例如,语音指令为点播类语音指令或界面打开类指令,基于上述实施例,首个目标状态信息为前台运行中,基于播放中遍历各候选应用的状态信息,查询各候选应用的状态信息中是否包括前台运行中,若各候选应用的状态信息中包括前台运行中,则首次查询到的目标状态信息为前台运行中;若各候选应用的状态信息中不包括前台运行中,选取的第二个目标状态信息为播放中。基于前台运行中遍历各候选应用的状态信息,查询各候选应用的状态信息中是否包括播放中,若各候选应用的状态信息中包括播放中,则首次查询到的目标状态信息为播放中;若各候选应用的状态信息中不包括播放中,选取的最后一个目标状态信息为有最近播放记录。基于有最近播放记录遍历各候选应用的状态信息,查询各候选应用的状态信息中是否包括有最近播放记录,若各候选应用的状态信息中包括有最近播放记录,则首次查询到的目标状态信息为有最近播放记录。
S4032,将所述状态信息中首个查询到的所述目标状态信息对应的所述候选应用,确定为所述目标应用。
示例性的,将各候选应用中与首个查询到的目标状态信息对应的应用,确定为目标应用,例如,基于上述实施例,若首个查询到的目标状态信息为前台运行中,确定各候选应用中处于前台运行中的候选应用为目标应用;若首个查询到的目标状态信息为播放中,确定各候选应用中处于播放中的候选应用为目标应用;若首个查询到的目标状态信息为有最近播放记录,确定各候选应用中有最近播放记录的候选应用为目标应用。
图10为本公开提供的又一种语音控制方法的流程示意图,图10为图7所示实施例的基础上,还包括:
S403’,当所述优先级信息中不存在与所述状态信息匹配的所述预设状态信息时,确定所述各候选应用中的预先设置的默认应用为所述目标应用。
示例性的,在上述实施例的基础上,各候选应用的状态信息与优先级信息中的所有预设状态信息均不匹配,则可已经各候选应用中预先设置的默认应用确定为目标应用,避免出现无目标应用对语音指令进行响应的情况。
一些实施例中,第一类型语音指令中包括指定应用,例如,语音指令“应用A1播放XXX”,其中,“应用A1”为指定应用的应用名。若执行语音指令的目标显示屏幕中的系统应用包括指定应用,则确定指定应用为执行语音指令的目标应用;若执行语音指令的目标显示屏幕中的系统应用不包括指定应用,确定执行语音指令的目标显示屏幕的应用商店中是否包括指定应用。若执行语音指令的目标显示屏幕的应用商店中不包括指定应用,则向执行语音指令的目标显示屏幕返回提示信息,此提示信息用于提示用户未找到指定应用,例如,基于上述实施例,提示信息为“没找到应用A”;若执行语音指令的目标显示屏幕的应用商店中包括指定应用,则确定指定应用是否已经下载至执行语音指令的目标显示屏幕。若指定应用已经下载至执行语音指令的目标显示屏幕,则确定指定应用为执行语音指令的目标应用;若指定应用未下载至执行语音指令的目标显示屏幕,则确定指定应用是否正在安装至执行语音指令的目标显示屏幕。若指定应用正在安装至执行语音指令的目标显示屏幕,则向执行语音指令的目标显示屏幕返回提示信息,此提示信息用于提示用户指定应用正在下载中,例如,基于上述实施例,提示信息为“应用A正在下载中,请稍后”;若指定应用不是正在安装至执行语音指令的目标显示屏幕,向执行语音指令的目标显示屏幕返回指定应用的应用信息卡片,并基于执行语音指令的目标显示屏幕,发起多轮询问用户是否下载指定应用,例如,基于上述实施例,应用信息卡片的提示信息可以是“您还未安装应用A,需要为您安装吗”。
一些实施例中,第一类型语音指令中不包括指定应用,例如,语音指令“播放XXX”。
若执行语音指令的目标显示屏幕中不存在与语音指令匹配的应用,则确定执行语音指令的目标显示屏幕的应用商店中是否存在与语音指令匹配的且正在下载的应用。若执行语音指令的目标显示屏幕的应用商店中存在与语音指令匹配的且正在下载的应用,则向执行语音指令的目标显示屏幕返回提示信息,此提示信息用于提示用户指定应用正在下载中,例如,与语音指令匹配的且正在下载的应用为B,提示信息为“应用B正在下载中,请稍后”。
若执行语音指令的目标显示屏幕的应用商店中不存在与语音指令匹配的且正在下载的应用,向执行语音指令的目标显示屏幕返回指定应用的应用信息卡片,并基于执行语音指令的目标显示屏幕,发起多轮询问用户是否下载指定应用,例如,基于上述实施例,应用信息卡片的提示信息可以是“您还未安装应用A,需要为您安装吗”。
一些实施例中,指定显示屏幕处于关闭状态时,不支持语音控制,并向指定显示屏幕返回提示用户屏幕处于关闭状态的提示信息,例如,指定显示屏幕C处于关闭状态,则提示信息为“显示屏幕C还没有打开,不能这么控制哦”。一些实施例中,指定显示屏幕处于小憩模式时,视频类应用和唱歌类应用不支持语音控制,并向指定显示屏幕返回提示用户不支持语音控制的信息,例如,提示信息为“当前状态下,不支持这样控制哦”。而视频类应用和唱歌类应用之外的应用支持语音控制。一些实施例中,指定显示屏幕处于息屏状态,响应于语音指令,指定显示屏幕退出息屏模式,然后执行语音指令。
本公开还提供一种语音控制装置,图11为本公开提供的一种语音控制装置的结构示意图,如图11所示,语音控制装置包括:
接收模块210,用于接收指示控制需求的语音指令。
确定模块220,用于根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用。
控制模块230,用于控制所述目标应用执行所述语音指令。
可选的,确定模块220,进一步用于根据所述语音指令,选择对应的目标显示屏幕;
若所述候选应用为至少两个,根据所述目标显示屏幕中至少两个所述候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用;若所述候选应用为一个,确定所述候选应用为所述目标应用。
可选的,确定模块220,进一步用于若所述语音指令对应的显示屏幕中包括指定显示屏幕,确定所述指定显示屏幕为所述目标显示屏幕;若所述语音指令对应的显示屏幕中不包括指定显示屏幕,确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕。
可选的,确定模块220,进一步用于若所述语音指令的类型为第一类型,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第一类型包括点播类、界面打开类和界面关闭类;若所述语音指令的类型为第二类型且所述语音虚拟形象所在的显示屏幕处于为耳机播放中,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第二类型包括续播类和控制类。
可选的,确定模块220,还用于当未选取到所述目标显示屏幕时,根据所述语音指令的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
可选的,确定模块220,进一步用于若所述语音指令的类型为控制类,确定处于功放播放中的所述候选应用为所述目标应用;若所述语音指令的类型为续播类,根据语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
可选的,确定模块220,进一步用于若所述连接状态为未连接,确定处于有功放最近播放记录的所述候选应用为所述目标应用;若所述连接状态为已连接且存在处于所述功放播放中的所述候选应用,确定处于所述功放播放中的所述候选应用为所述目标应用;若所述连接状态为已连接且不存在处于所述功放播放中的所述候选应用,将所述语音虚拟形象所在的显示屏幕中有最近播放记录的所述候选应用,确定为所述目标应用。
可选的,确定模块220,进一步用于获取所述各候选应用的状态信息;根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用,所述优先级信息中包括至少两个预设状态信息及其各自对应的优先级。
可选的,确定模块220,还用于根据所述语音指令和指令对应规则,查询确定所述语音指令对应的指令类型,所述指令对应规则中包括至少两个预设语音指令及其各自对应的预设指令类型;根据所述指令类型和预设的优先级对应关系,查询确定所述指令类型对应的所述优先级信息,所述预设的优先级对应关系包括至少两个所述预设指令类型及其各自对应的预设优先级信息。
可选的,确定模块220,进一步用于按照优先级从高到低的顺序,从所述优先级信息中依次选取目标状态信息,针对每个所述目标状态信息,查询所述状态信息中是否存在所述目标状态信息;将所述状态信息中首个查询到的所述目标状态信息对应的所述候选应用,确定为所述目标应用。
可选的,确定模块220,还用于当所述优先级信息中不存在与所述状态信息匹配的所述预设状态信息时,确定所述各候选应用中的预先设置的默认应用为所述目标应用。
本实施例所提供的装置可执行本公开任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果,这里不再赘述。
本公开还提供一种电子设备,包括:处理器,所述处理器用于执行存储于存储器的计算机程序,所述计算机程序被处理器执行时实现上述方法实施例的步骤。
图12为本公开提供的一种电子设备的结构示意图,图12示出了适于用来实现本发明实施例实施方式的示例性电子设备的框图。图12显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图12所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者至少两个处理器16,系统存储器28,连接不同系统组件(包括系统存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM、DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者至少两个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者至少两个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明实施例所描述的实施例中的功能和/或方法。
处理器16通过运行存储在系统存储器28中的至少两个程序中的至少一个程序,从而执行各种功能应用以及信息处理,例如实现本发明实施例所提供的方法实施例。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例的步骤。
可以采用一个或至少两个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或至少两个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)域连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本公开还提供一种车辆,包括:上述实施例提供的语音控制装置、电子设备或者计算机可读存储介质。
本公开还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行实现上述方法实施例的步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (15)
1.一种语音控制方法,其特征在于,包括:
接收指示控制需求的语音指令;
根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;
控制所述目标应用执行所述语音指令。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用,包括:
根据所述语音指令,选择对应的目标显示屏幕;
若所述候选应用为至少两个,根据所述目标显示屏幕中至少两个所述候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用;
若所述候选应用为一个,确定所述候选应用为所述目标应用。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音指令,选择对应的所述目标显示屏幕,包括:
若所述语音指令对应的显示屏幕中包括指定显示屏幕,确定所述指定显示屏幕为所述目标显示屏幕;
若所述语音指令对应的显示屏幕中不包括指定显示屏幕,确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕。
4.根据权利要求3所述的方法,其特征在于,所述确定语音虚拟形象所在的显示屏幕为所述目标显示屏幕,包括:
若所述语音指令的类型为第一类型,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第一类型包括点播类、界面打开类和界面关闭类;
若所述语音指令的类型为第二类型且所述语音虚拟形象所在的显示屏幕处于为耳机播放中,确定所述语音虚拟形象所在的显示屏幕为所述目标显示屏幕,所述第二类型包括续播类和控制类。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述方法还包括:
当未选取到所述目标显示屏幕时,根据所述语音指令的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
6.根据权利要求5所述的方法,其特征在于,所述根据所述语音指令的类型对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用,包括:
若所述语音指令的类型为控制类,确定处于功放播放中的所述候选应用为所述目标应用;
若所述语音指令的类型为续播类,根据语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用。
7.根据权利要求6所述的方法,其特征在于,所述根据语音虚拟形象所在的显示屏幕与耳机的连接状态对应的所述各候选应用的优先级,确定优先级最高的所述候选应用为所述目标应用,包括:
若所述连接状态为未连接,确定处于有功放最近播放记录的所述候选应用为所述目标应用;
若所述连接状态为已连接且存在处于所述功放播放中的所述候选应用,确定处于所述功放播放中的所述候选应用为所述目标应用;
若所述连接状态为已连接且不存在处于所述功放播放中的所述候选应用,将所述语音虚拟形象所在的显示屏幕中有最近播放记录的所述候选应用,确定为所述目标应用。
8.根据权利要求1所述的方法,其特征在于,所述根据各候选应用的优先级,确定匹配所述控制需求的目标应用,包括:
获取所述各候选应用的状态信息;
根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用,所述优先级信息中包括至少两个预设状态信息及其各自对应的优先级。
9.根据权利要求8所述的方法,其特征在于,所述根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用之前,还包括:
根据所述语音指令和指令对应规则,查询确定所述语音指令对应的指令类型,所述指令对应规则中包括至少两个预设语音指令及其各自对应的预设指令类型;
根据所述指令类型和预设的优先级对应关系,查询确定所述指令类型对应的所述优先级信息,所述预设的优先级对应关系包括至少两个所述预设指令类型及其各自对应的预设优先级信息。
10.根据权利要求8所述的方法,其特征在于,所述根据所述状态信息和优先级信息,确定所述状态信息优先级最高的所述目标应用,包括:
按照优先级从高到低的顺序,从所述优先级信息中依次选取目标状态信息,针对每个所述目标状态信息,查询所述状态信息中是否存在所述目标状态信息;
将所述状态信息中首个查询到的所述目标状态信息对应的所述候选应用,确定为所述目标应用。
11.根据权利要求8-10任一项所述的方法,其特征在于,所述方法还包括:
当所述优先级信息中不存在与所述状态信息匹配的所述预设状态信息时,确定所述各候选应用中的预先设置的默认应用为所述目标应用。
12.一种语音控制装置,其特征在于,包括:
接收模块,用于接收指示控制需求的语音指令;
确定模块,用于根据所述语音指令对应的显示屏幕、及各候选应用的优先级中的至少一者,确定匹配所述控制需求的目标应用;
控制模块,用于控制所述目标应用执行所述语音指令。
13.一种电子设备,其特征在于,包括:处理器,所述处理器用于执行存储于存储器的计算机程序,所述计算机程序被处理器执行时实现权利要求1-11中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11中任一项所述的方法的步骤。
15.一种车辆,其特征在于,包括:
如权利要求12所述的语音控制装置;
或者,如权利要求13所述的电子设备;
或者,如权利要求14所述的计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210773076.2A CN115440212A (zh) | 2022-06-30 | 2022-06-30 | 语音控制方法、装置、电子设备、车辆和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210773076.2A CN115440212A (zh) | 2022-06-30 | 2022-06-30 | 语音控制方法、装置、电子设备、车辆和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115440212A true CN115440212A (zh) | 2022-12-06 |
Family
ID=84241413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210773076.2A Pending CN115440212A (zh) | 2022-06-30 | 2022-06-30 | 语音控制方法、装置、电子设备、车辆和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115440212A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130325469A1 (en) * | 2012-05-31 | 2013-12-05 | Samsung Electronics Co., Ltd. | Method for providing voice recognition function and electronic device thereof |
WO2015128960A1 (ja) * | 2014-02-26 | 2015-09-03 | 三菱電機株式会社 | 車載制御装置および車載制御方法 |
CN104916287A (zh) * | 2015-06-10 | 2015-09-16 | 青岛海信移动通信技术股份有限公司 | 一种语音控制的方法、装置和移动设备 |
US20180308477A1 (en) * | 2016-01-07 | 2018-10-25 | Sony Corporation | Control device, display device, method, and program |
DE102020003102A1 (de) * | 2020-05-22 | 2020-07-09 | Daimler Ag | Verfahren zum Verifizieren eines Gestenbefehles und/oder eines Sprachbefehles eines Fahrzeugnutzers |
US20200341729A1 (en) * | 2019-04-24 | 2020-10-29 | Honda Motor Co., Ltd. | Voice operation system, voice operation device, voice operation control method, and recording medium having voice operation control program recorded therein |
CN111933135A (zh) * | 2020-07-31 | 2020-11-13 | 深圳Tcl新技术有限公司 | 终端控制方法、装置、智能终端及计算机可读存储介质 |
CN112786032A (zh) * | 2019-11-01 | 2021-05-11 | 富泰华工业(深圳)有限公司 | 显示内容控制方法、装置、计算机装置及可读存储介质 |
CN113879235A (zh) * | 2020-07-01 | 2022-01-04 | 北京安云世纪科技有限公司 | 汽车多屏控制的方法、系统、设备及存储介质 |
-
2022
- 2022-06-30 CN CN202210773076.2A patent/CN115440212A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130325469A1 (en) * | 2012-05-31 | 2013-12-05 | Samsung Electronics Co., Ltd. | Method for providing voice recognition function and electronic device thereof |
WO2015128960A1 (ja) * | 2014-02-26 | 2015-09-03 | 三菱電機株式会社 | 車載制御装置および車載制御方法 |
CN104916287A (zh) * | 2015-06-10 | 2015-09-16 | 青岛海信移动通信技术股份有限公司 | 一种语音控制的方法、装置和移动设备 |
US20180308477A1 (en) * | 2016-01-07 | 2018-10-25 | Sony Corporation | Control device, display device, method, and program |
US20200341729A1 (en) * | 2019-04-24 | 2020-10-29 | Honda Motor Co., Ltd. | Voice operation system, voice operation device, voice operation control method, and recording medium having voice operation control program recorded therein |
CN112786032A (zh) * | 2019-11-01 | 2021-05-11 | 富泰华工业(深圳)有限公司 | 显示内容控制方法、装置、计算机装置及可读存储介质 |
DE102020003102A1 (de) * | 2020-05-22 | 2020-07-09 | Daimler Ag | Verfahren zum Verifizieren eines Gestenbefehles und/oder eines Sprachbefehles eines Fahrzeugnutzers |
CN113879235A (zh) * | 2020-07-01 | 2022-01-04 | 北京安云世纪科技有限公司 | 汽车多屏控制的方法、系统、设备及存储介质 |
CN111933135A (zh) * | 2020-07-31 | 2020-11-13 | 深圳Tcl新技术有限公司 | 终端控制方法、装置、智能终端及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
王琼;王欢;孙保群;: "嵌入式非特定人车载电器声控终端系统的研制", 合肥工业大学学报(自然科学版), no. 09, 28 September 2015 (2015-09-28) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7351937B2 (ja) | コマンドキーワード調整を伴うネットワークマイクロフォンデバイス | |
JP6952184B2 (ja) | ビューに基づく音声インタラクション方法、装置、サーバ、端末及び媒体 | |
JP7029613B2 (ja) | インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム | |
KR102247642B1 (ko) | 사용자 특유의 그래머를 사용하는 미디어 아이템 선택 | |
JP5546865B2 (ja) | メディアシステムのソースコンテンツプレビュー | |
JP6585154B2 (ja) | 単一音響モデルと自動アクセント検出を用いたテキスト規則ベースの複数アクセントの音声認識 | |
JP7227866B2 (ja) | 音声インタラクション方法、端末機器、サーバ及びコンピュータ読み取り可能な記憶媒体 | |
US20200151212A1 (en) | Music recommending method, device, terminal, and storage medium | |
JP6969051B2 (ja) | 音声スキル作成方法及びシステム | |
US8177643B2 (en) | Out-of-band voice communication with interactive voice response services during gameplay | |
US20210056963A1 (en) | Distinguishing voice commands | |
CN109036396A (zh) | 一种第三方应用的交互方法及系统 | |
US20090177965A1 (en) | Automatic manipulation of conflicting media presentations | |
CN108012173A (zh) | 一种内容识别方法、装置、设备和计算机存储介质 | |
CN109165052B (zh) | 应用场景的交互处理方法、装置及终端、系统、存储介质 | |
CN108475260A (zh) | 基于评论的媒体内容项的语言识别的方法、系统和介质 | |
US8768494B1 (en) | System and method for generating policy-based audio | |
CN112687286A (zh) | 音频设备的降噪模型的调整方法和装置 | |
JPWO2019155717A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
CN109948057B (zh) | 感兴趣内容推送方法、装置及电子设备和介质 | |
CN115440212A (zh) | 语音控制方法、装置、电子设备、车辆和存储介质 | |
CN108495160A (zh) | 智能控制方法、系统、设备及存储介质 | |
US20200380975A1 (en) | Voice control method and apparatus of electronic device, and storage medium | |
US20230077478A1 (en) | Method and apparatus for testing full-duplex speech interaction system | |
US11114079B2 (en) | Interactive music audition method, apparatus and terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |