CN115303218B - 语音指令处理方法、设备及存储介质 - Google Patents

语音指令处理方法、设备及存储介质 Download PDF

Info

Publication number
CN115303218B
CN115303218B CN202211178538.2A CN202211178538A CN115303218B CN 115303218 B CN115303218 B CN 115303218B CN 202211178538 A CN202211178538 A CN 202211178538A CN 115303218 B CN115303218 B CN 115303218B
Authority
CN
China
Prior art keywords
application
candidate
target
score
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211178538.2A
Other languages
English (en)
Other versions
CN115303218A (zh
Inventor
沈航
贝学意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yikatong Shanghai Technology Co ltd
Yikatong Beijing Technology Co ltd
Ecarx Hubei Tech Co Ltd
Original Assignee
Yikatong Shanghai Technology Co ltd
Yikatong Beijing Technology Co ltd
Ecarx Hubei Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yikatong Shanghai Technology Co ltd, Yikatong Beijing Technology Co ltd, Ecarx Hubei Tech Co Ltd filed Critical Yikatong Shanghai Technology Co ltd
Priority to CN202211178538.2A priority Critical patent/CN115303218B/zh
Publication of CN115303218A publication Critical patent/CN115303218A/zh
Application granted granted Critical
Publication of CN115303218B publication Critical patent/CN115303218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请实施例提供一种语音指令处理方法、设备及存储介质,涉及车载设备技术领域,该方法包括获取语音指令,对所述语音指令进行解析,获得所述语音指令对应的目标功能项,根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。本实施例提供的语音指令处理方法通过综合考虑语音指令需求的功能以及各候选应用的状态,从多个候选应用中确定匹配度最高的应用,来执行语音指令,提高了对语音指令处理的准确性,且实现了不同候选应用之间的相互配合,合理高效的处理语音指令,丰富功能的多样性。

Description

语音指令处理方法、设备及存储介质
技术领域
本申请实施例涉及车载设备技术领域,尤其涉及一种语音指令处理方法、设备及存储介质。
背景技术
随着智能车辆应用生态链逐步完善,车载娱乐系统中各类第三方的媒体应用接入的越来越多。
然而,不同应用所支持的媒体能力各不相同,部分应用只支持在线音乐,部分应用只支持蓝牙音乐、收音机等。为了确保不同媒体应用之间可以相互合作,最大程度的接收并处理车内媒体相关语音指令,如何选择与语音指令最适配的应用来执行语音指令是当前需要解决的问题。
发明内容
本申请实施例提供一种语音指令处理方法、设备及存储介质,以保证不同应用之间的相互配合,合理高效准确的处理语音指令,丰富车载设备语音处理功能的多样性。
第一方面,本申请实施例提供一种语音指令处理方法,包括:
获取语音指令;
对所述语音指令进行解析,获得所述语音指令对应的目标功能项;
根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
在一种可能的设计中,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,包括:
针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则为所述候选应用分配第一分值;
根据所述候选应用的状态数据,确定所述候选应用的第二分值;
将所述第一分值和所述第二分值的总和,确定为所述候选应用的适配分值;
将多个所述候选应用中适配分值最高的候选应用确定为所述目标应用。
在一种可能的设计中,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,包括:
根据所述候选应用是否持有焦点,确定所述候选应用的第三分值;
根据所述候选应用是否为前台应用,确定所述候选应用的第四分值;
根据所述候选应用是否为默认应用,确定所述候选应用的第五分值;
根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值。
在一种可能的设计中,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,还包括:
根据所述候选应用的使用情况,确定所述候选应用的第六分值;
所述根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值,包括:
根据所述第三分值、所述第四分值、所述第五分值和所述第六分值,确定所述第二分值。
在一种可能的设计中,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,包括:
针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则将所述候选应用确定为目标候选应用,并根据所述目标候选应用的状态数据,确定所述目标候选应用的适配分值;
将多个所述目标候选应用中适配分值最高的目标候选应用确定为所述目标应用。
在一种可能的设计中,所述方法还包括:
针对每个候选应用,确定所述候选应用所支持的功能类型,以及所述功能类型对应的子功能;
根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项;
所述对所述语音指令进行解析,获得所述语音指令对应的目标功能项,包括:
对所述语音指令进行解析,获得所述语音指令对应的目标功能类型以及所述目标功能类型对应的目标子功能;
根据所述目标功能类型以及所述目标功能类型对应的目标子功能,确定所述目标功能项。
在一种可能的设计中,所述根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项,包括:
为所述候选应用所支持的每个功能类型下的每个子功能分配对应的操作数;所述操作数的高位数据用于指示对应的功能类型,低位数据用于指示对应的子功能;
根据多个所述操作数,确定所述候选应用所具备的支持功能项。
在一种可能的设计中,所述根据多个所述操作数,确定所述候选应用所具备的支持功能项,包括:
根据所述操作数的高位数据,将多个所述操作数进行合并处理,获得各所述功能类型分别对应的操作数集合;
根据多个所述操作数集合,确定所述候选应用所具备的支持功能项。
第二方面,本申请实施例提供一种语音指令处理设备,包括:
获取模块,用于获取语音指令;
解析模块,用于对所述语音指令进行解析,获得所述语音指令对应的目标功能项;
处理模块,用于根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的方法。
本实施例提供的语音指令处理方法、设备及存储介质,该方法包括获取语音指令,对所述语音指令进行解析,获得所述语音指令对应的目标功能项,根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。本实施例提供的语音指令处理方法通过综合考虑语音指令需求的功能以及各候选应用的状态,从多个候选应用中确定匹配度最高的应用,来执行语音指令,提高了对语音指令处理的准确性,且实现了不同候选应用之间的相互配合,合理高效的处理语音指令,丰富功能的多样性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的语音指令处理方法的应用场景示意图;
图2为本申请实施例提供的语音指令处理方法的流程示意图一;
图3为本申请实施例提供的语音指令处理方法的流程示意图二;
图4为本申请实施例提供的语音指令处理设备的结构示意图;
图5为本申请实施例提供的电子设备的硬件结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
车载娱乐系统的语音处理程序,可以采用系统自带应用,例如,在接收到语音指令(播放歌曲A)后,通过自带应用对语音指令进行解析,在歌曲库(存储有已购买版权的歌曲的文件数据)中搜索歌曲A的文件数据,并发送文件数据至自带的播放器并播放。自带应用能够提供的服务有限,无法满足用户日益增多的需求。于是车载娱乐系统中通过接入第三方应用来提供多样性的服务。
随着智能车辆应用生态链逐步完善,车载娱乐系统中各类第三方的媒体应用接入的越来越多。然而,不同应用所支持的媒体能力各不相同,部分应用只支持在线音乐,部分应用只支持蓝牙音乐、收音机等。为了确保不同媒体应用之间可以相互合作,最大程度的接收并处理车内媒体相关语音指令,如何选择与语音指令最适配的应用来执行语音指令是当前需要解决的问题。
图1为本申请实施例提供的语音指令处理方法的应用场景示意图。如图1所示,车载设备101包括输入模块1011、仲裁模块1012和多个媒体应用(例如媒体应用A、媒体应用B、媒体应用C),其中,输入模块1011用于接收语音指令,并将语音指令发送给仲裁模块1012,仲裁模块1012,用于对所述语音指令进行解析,获得所述语音指令对应的目标功能项,根据多个候选应用(例如媒体应用A、媒体应用B、媒体应用C)的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
在具体实现过程中,用户发出语音指令,车载设备101,例如车机,的输入模块1011接收该语音指令,并将语音指令发送给仲裁模块1012,仲裁模块1012对所述语音指令进行解析,获得所述语音指令对应的目标功能项,根据多个候选应用(例如媒体应用A、媒体应用B、媒体应用C)的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,调用该目标应用执行所述语音指令。本申请实施例提供的语音指令处理方法,通过综合考虑语音指令需求的功能以及各候选应用的状态,从多个候选应用中确定匹配度最高的应用,来执行语音指令,提高了对语音指令处理的准确性,且实现了不同候选应用之间的相互配合,合理高效的处理语音指令,丰富功能的多样性。
需要说明的是,图1所示的场景示意图仅仅是一个示例,本申请实施例描述的语音指令处理方法以及场景是为了更加清楚地说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的语音指令处理方法的流程示意图一。如图2所示,该方法包括:
201、获取语音指令。
本实施例的执行主体可以为具备语音交互处理能力的电子设备,如图1中的车载设备。
具体的,在用户发出语音指令后,车载设备通过麦克风等接收语音指令。
本实施例中,语音指令可以为与媒体信息相关的语音指令,例如“请播放歌曲A”。
202、对所述语音指令进行解析,获得所述语音指令对应的目标功能项。
具体的,在接收到语音指令后,可以通过语音识别模型对语音指令进行解析,获得语音指令中包括的功能项。
示例性的,在对语音指令“请播放歌曲A”进行解析后,可以获知对应的目标功能项包括播放功能,且具体的为歌曲播放功能。
203、根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
具体的,在解析获得执行语音指令所需要的目标功能项后,可以基于目标功能项,从多个候选应用中查找到能够实现目标功能项的应用,且可以再综合考虑候选应用的当前的状态,例如是否持有焦点,来确定匹配度最高的应用作为目标应用,来执行语音指令。
本实施例中,根据状态数据和目标功能项,选定目标应用的方式有多种。
在一种可实现方式中,可以将是否能够支持目标功能项的功能作为初步筛选因子,只有确定能够支持功能后,才会基于状态数据计算适配分值,进而基于适配分值进行目标应用的确定。具体的,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,可以包括:针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则将所述候选应用确定为目标候选应用,并根据所述目标候选应用的状态数据,确定所述目标候选应用的适配分值;将多个所述目标候选应用中适配分值最高的目标候选应用确定为所述目标应用。
通过采用是否支持目标功能项的功能进行初筛,能够节省适配分值的计算量,进而提高语音指令处理方法的处理效率。
在另一种可实现方式中,可以将是否支持目标功能项的功能,以及状态数据均进行分值的分配,进而基于总分值进行目标应用的选定。具体的,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,可以包括:针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则为所述候选应用分配第一分值;根据所述候选应用的状态数据,确定所述候选应用的第二分值;将所述第一分值和所述第二分值的总和,确定为所述候选应用的适配分值;将多个所述候选应用中适配分值最高的候选应用确定为所述目标应用。
通过对目标功能项以及对候选应用的状态数据均采用分配分值的方式,能够简化运算,便于调试和维护程序。
在一些实施例中,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,可以包括:根据所述候选应用是否持有焦点,确定所述候选应用的第三分值;根据所述候选应用是否为前台应用,确定所述候选应用的第四分值;根据所述候选应用是否为默认应用,确定所述候选应用的第五分值;根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值。
在一些实施例中,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,还可以包括:根据所述候选应用的使用情况,确定所述候选应用的第六分值;所述根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值,可以包括:根据所述第三分值、所述第四分值、所述第五分值和所述第六分值,确定所述第二分值。
具体的,在获得语音指令对应的目标功能项后,可以遍历每个候选应用,针对当前应用,可以判断当前应用是否支持目标功能项的功能,若支持可以获得对应的分值。分值的设计可以根据实际需要进行确定。实际需要中是否支持目标功能项的功能这一因子的重要程度较高,则可以将分值设计为较高的分值,例如可以大于其他因子对应分值的总和。
还可以判断当前应用是否为持有焦点,焦点具有唯一性,至多只能有一个媒体应用可以获取当前时刻的焦点,若媒体应用持有焦点,则可以获得焦点这一因子对应的分值。
还可以判断当前应用是否为前台应用,通过系统辅助服务监听前台应用,若前台应用包名与当前媒体应用包名相同,则可以获得对应的分值。
还可以通过记录各个媒体应用使用的频次与时间,可得到媒体应用的使用栈,根据栈内排名,依次赋予对应得分。
还可以判断是否为默认播放应用,可根据系统偏好设置获取当前媒体应用是否为用户设置的默认,若为默认播放应用,则可以获得对应的分值。
需要说明的是,上述对不同因子的判断与加分的运算,可以并行进行还可以串行进行,在串行进行时,顺序可以根据实际需要进行确定。本实施例对此不做限定。
在获得各个因子分别对应的分值后,可以对计算出得分的媒体应用进行排序,将适配分值最高的候选应用确定为目标应用,并将语音指令发送给目标应用,通过目标应用执行语音指令。
本实施例提供的语音指令处理方法,通过综合考虑语音指令需求的功能以及各候选应用的状态,从多个候选应用中确定匹配度最高的应用,来执行语音指令,提高了对语音指令处理的准确性,且实现了不同候选应用之间的相互配合,合理高效的处理语音指令,丰富功能的多样性。
图3为本申请实施例提供的语音指令处理方法的流程示意图二。在上述实施例的基础上,例如在图2所示实施例的基础上,本实施例中增加了预先对候选应用申明能力集的过程,如图3所示,该方法包括:
301、针对每个候选应用,确定所述候选应用所支持的功能类型,以及所述功能类型对应的子功能,并根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项。
在一些实施例中,所述根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项,可以包括:为所述候选应用所支持的每个功能类型下的每个子功能分配对应的操作数;所述操作数的高位数据用于指示对应的功能类型,低位数据用于指示对应的子功能;根据多个所述操作数,确定所述候选应用所具备的支持功能项。
在一些实施例中,所述根据多个所述操作数,确定所述候选应用所具备的支持功能项,可以包括:根据所述操作数的高位数据,将多个所述操作数进行合并处理,获得各所述功能类型分别对应的操作数集合;
根据多个所述操作数集合,确定所述候选应用所具备的支持功能项。
具体的,候选应用根据定义好的语义能力(即功能),申明本应用所支持的语义能力集合(功能集合)。
示例性的,以高位为6位,低位为25位为例,语义能力定义规则如下:
语义功能常量定义:
一级语义 A0=1<<25
二级语义 a1=1<<0; a2=1<<1; a3=1<<2;…; a24=1<<24
语义 A1=A0|a1
高6位作为一级语义A0 低25为作二级语义a1,a2,a3,…
一级语义 B0=1<<25
二级语义 b1=1<<0; b2=1<<1; b3=1<<2;…; b24=1<<24
语义 B1=B0|b1
高6位作为一级语义B0 低25为作二级语义b1,b2,b3,…
A、B代表不同的功能类型,a、b代表不同功能类型下的子功能。
具体的,语义的定义值采用二进制计数,将语义值划分为一级语义和二级语义。二进制数中的高6位作为一级语义,低25位作为二级语义。如A可以代表功能类型为控制类,即控制类语义作为一级语义,定义值为1<<25;在控制类下,包括多个子功能(例如播放、暂停等),子功能为二级语义,例如若播放的定义值为1<<0;则播放语义对应的值为A1=1<<25|1<<0。若暂停的定义值为1<<1;则暂停语义对应的值为A2=1<<25|1<<1。
按如上规则,则候选应用可以申明自身的能力集合,例如支持功能项,即能力集合capabilitys=[A1,A2,A3,A5,B1,B4,B7]。
在对不同候选应用申明支持功能项,即能力集合后,为了简化运算可以对能力集合进行合并处理,具体的,可以根据一级语义,即功能类型进行能力集划分,合并处理规则如下。
示例性的,以候选应用的能力集合capabilitys=[A1,A2,A3,A5,B1,B4,B7]为例,针对功能类型为A0的各子功能A1、A2、A3、A5进行合并,合并为SA,具体的,A0=capabilitys[n]>>25,SA=SA|capabilitys[n] map.put(A0,SA),判断是否存在下一个功能类型,若存在,则令n=n+1,针对下一个功能类型,即功能类型为B0的各子功能B1、B4、B7进行合并,合并为SB,具体的,B0=capabilitys[n]>>25,SB=SB|capabilitys[n] map.put(B0,SB)。最后,获得整合后的能力集map=[(A0,SA),(B0,SB)]。
302、获取语音指令。
本实施例中步骤302与上述实施例中步骤201相类似,此处不再赘述。
303、对所述语音指令进行解析,获得所述语音指令对应的目标功能类型以及所述目标功能类型对应的目标子功能,并根据所述目标功能类型以及所述目标功能类型对应的目标子功能,确定所述目标功能项。
具体的,判断当前应用是否支持目标功能项Ax,首先Ax>>25可得到对应的一级语义A0,通过A0从能力集map中取得对应的A类能力集合SA,若SA&Ax==Ax,则证明此应用支持该目标功能项,可以获得是否支持目标功能项对应的分值,或者被确定为目标候选应用。后续步骤可参考上述实施例中的步骤203的表述,此处不再赘述。
306、根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
本实施例中步骤306与上述实施例中步骤203相类似,此处不再赘述。
本实施例提供的语音指令处理方法,通过将各候选应用的支持功能,进行分级表示,一级为功能类型,二级为对应的子功能,可以简化算法,节省计算资源。
图4为本申请实施例提供的语音指令处理设备的结构示意图。如图4所示,该语音指令处理设备40包括:获取模块401、解析模块402以及处理模块403。
获取模块401,用于获取语音指令;
解析模块402,用于对所述语音指令进行解析,获得所述语音指令对应的目标功能项;
处理模块403,用于根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
本申请实施例提供的语音指令处理设备,通过综合考虑语音指令需求的功能以及各候选应用的状态,从多个候选应用中确定匹配度最高的应用,来执行语音指令,提高了对语音指令处理的准确性,且实现了不同候选应用之间的相互配合,合理高效的处理语音指令,丰富功能的多样性。
本申请实施例提供的语音指令处理设备,可用于执行上述的方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
图5为本申请实施例提供的电子设备的硬件结构框图,该设备可以是计算机,消息收发设备,平板设备,医疗设备,车机等具备语音交互能力的电子设备。
设备50可以包括以下一个或多个组件:处理组件501,存储器502,电源组件503,多媒体组件504,音频组件505,输入/输出(I/ O)接口506,传感器组件507,以及通信组件508。
处理组件501通常控制设备50的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件501可以包括一个或多个处理器509来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件501可以包括一个或多个模块,便于处理组件501和其他组件之间的交互。例如,处理组件501可以包括多媒体模块,以方便多媒体组件504和处理组件501之间的交互。
存储器502被配置为存储各种类型的数据以支持在设备50的操作。这些数据的示例包括用于在设备50上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器502可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件503为设备50的各种组件提供电力。电源组件503可以包括电源管理系统,一个或多个电源,及其他与为设备50生成、管理和分配电力相关联的组件。
多媒体组件504包括在所述设备50和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件504包括一个前置摄像头和/或后置摄像头。当设备50处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件505被配置为输出和/或输入音频信号。例如,音频组件505包括一个麦克风(MIC),当设备50处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器502或经由通信组件508发送。在一些实施例中,音频组件505还包括一个扬声器,用于输出音频信号。
I/ O接口506为处理组件501和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件507包括一个或多个传感器,用于为设备50提供各个方面的状态评估。例如,传感器组件507可以检测到设备50的打开/关闭状态,组件的相对定位,例如所述组件为设备50的显示器和小键盘,传感器组件507还可以检测设备50或设备50一个组件的位置改变,用户与设备50接触的存在或不存在,设备50方位或加速/减速和设备50的温度变化。传感器组件507可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件507还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件507还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件508被配置为便于设备50和其他设备之间有线或无线方式的通信。设备50可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件508经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件508还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备50可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器502,上述指令可由设备50的处理器509执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现上述任一实施例中的语音指令处理方法的技术方案,其实现原理以及有益效果与语音指令处理方法的实现原理及有益效果类似,可参见语音指令处理方法的实现原理及有益效果,此处不再进行赘述。
本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上语音指令处理设备执行的语音指令处理方法。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种语音指令处理方法,其特征在于,包括:
针对每个候选应用,确定所述候选应用所支持的功能类型,以及所述功能类型对应的子功能;
根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项;
获取语音指令;
对所述语音指令进行解析,获得所述语音指令对应的目标功能类型以及所述目标功能类型对应的目标子功能;
根据所述目标功能类型以及所述目标功能类型对应的目标子功能,确定所述目标功能项;
根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,
并通过所述目标应用执行所述语音指令。
2.根据权利要求1所述的方法,其特征在于,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,包括:
针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则为所述候选应用分配第一分值;
根据所述候选应用的状态数据,确定所述候选应用的第二分值;
将所述第一分值和所述第二分值的总和,确定为所述候选应用的适配分值;
将多个所述候选应用中适配分值最高的候选应用确定为所述目标应用。
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,包括:
根据所述候选应用是否持有焦点,确定所述候选应用的第三分值;
根据所述候选应用是否为前台应用,确定所述候选应用的第四分值;
根据所述候选应用是否为默认应用,确定所述候选应用的第五分值;
根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述候选应用的状态数据,确定所述候选应用的第二分值,还包括:
根据所述候选应用的使用情况,确定所述候选应用的第六分值;
所述根据所述第三分值、所述第四分值和所述第五分值,确定所述第二分值,包括:
根据所述第三分值、所述第四分值、所述第五分值和所述第六分值,确定所述第二分值。
5.根据权利要求1所述的方法,其特征在于,所述根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,包括:
针对每个候选应用,将所述目标功能项与所述候选应用所具备的支持功能项进行匹配,若匹配结果指示所述候选应用支持所述目标功能项,则将所述候选应用确定为目标候选应用,并根据所述目标候选应用的状态数据,确定所述目标候选应用的适配分值;
将多个所述目标候选应用中适配分值最高的目标候选应用确定为所述目标应用。
6.根据权利要求1所述的方法,其特征在于,所述根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项,包括:
为所述候选应用所支持的每个功能类型下的每个子功能分配对应的操作数;所述操作数的高位数据用于指示对应的功能类型,低位数据用于指示对应的子功能;
根据多个所述操作数,确定所述候选应用所具备的支持功能项。
7.根据权利要求6所述的方法,其特征在于,所述根据多个所述操作数,确定所述候选应用所具备的支持功能项,包括:
根据所述操作数的高位数据,将多个所述操作数进行合并处理,获得各所述功能类型分别对应的操作数集合;
根据多个所述操作数集合,确定所述候选应用所具备的支持功能项。
8.一种语音指令处理设备,其特征在于,包括:
确定模块:用于针对每个候选应用,确定所述候选应用所支持的功能类型,以及所述功能类型对应的子功能;
分析模块,用于根据所述候选应用所支持的功能类型以及对应的所述子功能,确定所述候选应用所具备的支持功能项;
获取模块,用于获取语音指令;
解析模块,用于对所述语音指令进行解析,获得所述语音指令对应的目标功能类型以及所述目标功能类型对应的目标子功能;根据所述目标功能类型以及所述目标功能类型对应的目标子功能,确定所述目标功能项;
处理模块,用于根据多个候选应用的状态数据和所述目标功能项,从多个所述候选应用中选定目标应用,并通过所述目标应用执行所述语音指令。
9.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的语音指令处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的语音指令处理方法。
CN202211178538.2A 2022-09-27 2022-09-27 语音指令处理方法、设备及存储介质 Active CN115303218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211178538.2A CN115303218B (zh) 2022-09-27 2022-09-27 语音指令处理方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211178538.2A CN115303218B (zh) 2022-09-27 2022-09-27 语音指令处理方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115303218A CN115303218A (zh) 2022-11-08
CN115303218B true CN115303218B (zh) 2022-12-23

Family

ID=83867213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211178538.2A Active CN115303218B (zh) 2022-09-27 2022-09-27 语音指令处理方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115303218B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918040A (zh) * 2019-03-15 2019-06-21 百度在线网络技术(北京)有限公司 语音指令分发方法和装置、电子设备及计算机可读介质
CN112509580A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品
CN114579187A (zh) * 2022-04-28 2022-06-03 飞腾信息技术有限公司 一种指令分配方法、装置、电子设备及可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101295711B1 (ko) * 2011-02-15 2013-08-16 주식회사 팬택 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법
US20220108694A1 (en) * 2019-01-28 2022-04-07 Samsung Electronics Co., Ltd. Method and appartaus for supporting voice instructions
CN112309380B (zh) * 2019-07-26 2024-02-06 北京新能源汽车股份有限公司 一种语音控制方法、系统、设备及汽车
CN113282264A (zh) * 2020-02-20 2021-08-20 阿里巴巴集团控股有限公司 数据处理方法、装置、智能设备及计算机存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918040A (zh) * 2019-03-15 2019-06-21 百度在线网络技术(北京)有限公司 语音指令分发方法和装置、电子设备及计算机可读介质
CN112509580A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品
CN114579187A (zh) * 2022-04-28 2022-06-03 飞腾信息技术有限公司 一种指令分配方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN115303218A (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
US9942690B2 (en) Method and device for information push
CN104951335B (zh) 应用程序安装包的处理方法及装置
US20220051668A1 (en) Speech control method, terminal device, and storage medium
US11222223B2 (en) Collecting fingerprints
EP3767488A1 (en) Method and device for processing untagged data, and storage medium
CN107132949B (zh) 抗干扰方法、装置、终端及存储介质
CN111061452A (zh) 用户界面的语音控制方法和装置
CN108573697B (zh) 一种语言模型更新方法、装置及设备
CN115303218B (zh) 语音指令处理方法、设备及存储介质
CN109960444B (zh) 一种呈现应用程序快捷方式的方法、装置和设备
CN116048757A (zh) 任务处理方法、装置、电子设备和存储介质
CN112333233B (zh) 事件信息的上报方法、装置、电子设备及存储介质
CN111667827B (zh) 应用程序的语音控制方法、装置及存储介质
CN111259675B (zh) 基于神经网络计算的方法和装置
CN113268325A (zh) 一种调度任务的方法、装置及存储介质
CN110019657B (zh) 处理方法、装置和机器可读介质
CN111538486B (zh) 布局文件嵌套层数筛查方法、装置及电子设备
CN112346968B (zh) 一种多媒体文件清晰度的自动化检测方法及装置
CN111401048B (zh) 一种意图识别方法及装置
CN116303101B (zh) 测试案例生成方法、装置和设备
CN107544969B (zh) 一种优化静态词库尺寸的方法及电子设备
CN110084065B (zh) 数据脱敏方法及装置
CN111949139B (zh) 一种输入方法及装置
CN111381685B (zh) 一种句联想方法和装置
CN107544965B (zh) 一种优化静态词库尺寸的方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant