CN106328129B - 指令处理方法及装置 - Google Patents

指令处理方法及装置 Download PDF

Info

Publication number
CN106328129B
CN106328129B CN201510342609.1A CN201510342609A CN106328129B CN 106328129 B CN106328129 B CN 106328129B CN 201510342609 A CN201510342609 A CN 201510342609A CN 106328129 B CN106328129 B CN 106328129B
Authority
CN
China
Prior art keywords
object information
execution object
execution
information
executed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510342609.1A
Other languages
English (en)
Other versions
CN106328129A (zh
Inventor
王正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510342609.1A priority Critical patent/CN106328129B/zh
Priority to PCT/CN2016/078987 priority patent/WO2016202064A1/zh
Publication of CN106328129A publication Critical patent/CN106328129A/zh
Application granted granted Critical
Publication of CN106328129B publication Critical patent/CN106328129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种指令处理方法,所述指令处理方法包括:在接收到语音指令时,获取所述语音指令携带的待执行对象信息;获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。本发明还公开了一种指令处理装置。本发明能够提高终端执行语音指令的效率。

Description

指令处理方法及装置
技术领域
本发明涉及语音控制技术领域,尤其涉及指令处理方法及装置。
背景技术
目前,基于终端的语音功能,用户通过说出语音指令,即可控制终端进行相应操作。终端的语音功能采用单一的接受-执行的方式,即用户说出一条指令,终端识别指令然后执行。常用的语音指令的类型主要包括:拨打电话、播放音乐、打开应用等。当用户说出具体的指令执行对象时,现有技术采取遍历查找的方式来找到对应的执行对象,例如,当用户说出打电话给某某时,终端需要遍历当前名片夹所有的信息进行查找;当用户说出播放某某歌曲时,终端需要遍历音乐播放器里所有的歌曲;当用户说出打开某某应用时,终端需要遍历当前手机里所有的应用名等等。前述遍历操作需要消耗大量处理时间,导致终端执行语音指令的效率较低。
发明内容
本发明的主要目的在于提供一种指令处理方法及装置,旨在提高终端执行语音指令的效率。
为实现上述目的,本发明提供一种指令处理方法,所述指令处理方法包括:
在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
优选地,所述将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配的步骤之后,所述指令处理方法,还包括:
在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
优选地,所述在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配的步骤之后,所述指令处理方法,还包括:
在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
优选地,所述获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息包括:
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息;
或者,在所述语音指令对应的执行对象信息中,提取预设数量的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
优选地,所述执行匹配的执行对象信息对应的执行对象的步骤之后,所述指令处理方法还包括:
更新匹配的执行对象信息对应的执行对象的执行频率值。
此外,为实现上述目的,本发明还提供一种指令处理装置,所述指令处理装置包括:
第一获取模块,用于在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
第二获取模块,用于获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
匹配模块,用于将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
执行模块,用于在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
优选地,所述匹配模块还用于在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
所述执行模块还用于在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
优选地,所述指令处理装置,还包括提示模块,用于在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
优选地,所述第二获取模块还用于,
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息;
或者,在所述语音指令对应的执行对象信息中,提取预设数量的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
优选地,所述指令处理装置还包括更新模块,用于更新匹配的执行对象信息对应的执行对象的执行频率值。
本发明提出的指令处理方法及装置,在接收到语音指令,并获取到所述语音指令携带的待执行对象信息后,从满足预设条件的执行对象信息中查找与所述待执行对象信息匹配的执行对象信息,在查找到匹配的执行对象信息时,执行匹配的执行对象信息对应的执行对象,而无需如同现有技术一样去遍历所有执行对象信息,从而本发明能够提高终端执行语音指令的效率。
附图说明
图1为本发明指令处理方法第一实施例的流程示意图;
图2为本发明指令处理方法第二实施例的一种UI显示示意图;
图3为本发明指令处理方法第二实施例的另一种UI显示示意图;
图4为本发明指令处理方法第二实施例的又一种UI显示示意图;
图5为本发明指令处理装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种指令处理方法,参照图1,在本发明指令处理方法的第一实施例中,所述指令处理方法包括:
S10,在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
S20,获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
本实施例提供的指令处理方法可以应用于终端的语音控制中,例如,当用户说出语音指令时,终端能够快速响应用户说出的语音指令,以进行相应的操作。其中,所述终端可以是手机、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、数字TV以及台式计算机等智能终端。本领域技术人员可以理解的是,所述语音指令可由用户直接说出,也可由语音输出设备播放。
具体地,本实施例将一条完整的语音指令拆分成两部分,第一部分是指令类型,例如,“打电话”、“播放音乐”、“打开应用”对应的指令类型分别为:打电话、播放、打开三大类;第二部分是指令的执行对象信息,对于打电话来说,其相关的执行对象信息可以包括电话号码,联系人名称,电话号码类型等,对于播放音乐来说,其相关的执行对象信息可以包括歌曲名,专辑名,歌手名等,对于打开应用来说,其相关的执行对象信息可以包括终端已安装应用的应用名称。
本实施例中,在终端接收到语音指令时,调用终端的语音识别模块获取所述语音指令的指令类型,以及所述语音指令携带的待执行对象信息。例如,在终端接收到语音指令时,调用终端的语音识别模块获取到所述语音指令的指令类型为“打电话”,待执行对象信息为“母亲”,即用户预期的终端操作是“打电话给母亲”。
获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息,其中,所述语音指令对应的执行对象信息即所述语音指令的指令类型相关的执行对象信息。
S30,将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
S40,在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
在获取到所述待执行对象信息,以及所述满足预设条件的执行对象信息后,将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;若有所述满足预设条件的执行对象信息与所述待执行对象信息相同,则匹配,否则不匹配;其中,所述满足预设条件的执行对象信息中与所述待执行对象信息相同的执行对象信息即匹配的执行对象信息。
例如,前述获取到语音指令的指令类型为“打电话”,待执行对象信息为“母亲”,将“母亲”与指令类型“打电话”相关的执行对象中满足预设条件的执行对象信息进行匹配,若所述满足预设条件的执行对象信息中存在“母亲”,则匹配。此时,执行匹配的执行对象信息(“母亲”)对应的执行对象,即打电话给“母亲”:调用终端拨号程序加载“母亲”的号码并拨打,以供用户基于终端与“母亲”进行通话。
本实施例提出的指令处理方法,在接收到语音指令,并获取到所述语音指令携带的待执行对象信息后,从满足预设条件的执行对象信息中查找与所述待执行对象信息匹配的执行对象信息,在查找到匹配的执行对象信息时,执行匹配的执行对象信息对应的执行对象,而无需如同现有技术一样去遍历所有执行对象信息,从而本发明能够提高终端执行语音指令的效率。
进一步地,本实施例设置有指令索引表,所述指令索引表存储有所述满足预设条件的执行对象信息。具体地,在终端每次接收语音指令并执行时,获取所述语音指令的指令类型,以及携带的执行对象信息;并动态计算所述执行对象信息匹配的执行对象信息所对应的执行对象的执行频率值;按照执行对象信息与指令类型的关联关系,将执行频率值大于或等于预设阈值的执行对象对应的执行对象信息添加至所述指令索引表中;或者,按照执行对象信息与指令类型的关联关系,提取预设数量的执行对象信息添加至所述指令索引表中,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于除提取的所述执行对象信息之外的其它执行对象对应的执行对象的执行频率值。需要说明的是,所述指令索引表中的执行对象信息的优先级取决于其对应的执行对象的执行频率值,执行对象的执行频率值越高,其对应的执行对象信息的优先级越高。例如,所述指令索引表的打电话部分如表1所示:
Figure BDA0000741566660000061
表1
表1中,“妻子”、“父亲”、“母亲”的优先级顺序从上至下依次减小。
优选地,所述将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配包括:
按照所述指令索引表中执行对象信息的优先级从高到低的顺序,依次将所述待执行对象信息与所述指令索引表中与所述语音指令的指令类型相关的执行对象信息进行匹配。
进一步地,基于上述技术方案,所述获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息包括:
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息(即所述预设条件包括:执行对象信息对应执行对象的执行频率值大于或等于预设阈值,其中,本实施例不限定所述预设阈值的取值,具体根据实际需要设置);
或者,在所述语音指令对应的执行对象信息中,提取预设数量(本实施例不限定所述预设数量的取值,具体根据实际需要设置)的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
进一步地,基于第一实施例,提出本发明指令处理方法的第二实施例,在本实施例中,所述将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配的步骤之后,所述指令处理方法,还包括:
在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
容易理解的是,由于所述指令索引表中存储的执行对象信息对应的执行对象是执行频率值较高的执行对象,若用户说出的语音指令携带的执行对象信息对应的执行对象是之前未执行过,或者是执行频率值较低的执行对象时,所述指令索引表将不存在相应的执行对象信息,即所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配;此时将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息(所述指令索引表之外的执行对象信息,且所述执行对象信息相关的指令类型与所述待执行对象信息相关的指令类型相同)进行匹配;在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
例如,用户的语音指令为“打电话给同事A”,其中,指令类型为“打电话”,执行对象信息为“同事A”,如表1所示的指令索引表,不存在执行对象信息“同事A”,此时遍历名片夹信息(除表1所示的妻子、父亲、母亲之外),查找到匹配的执行对象信息“同事A”,调用拨号程序加载“同事A”的号码并拨打,以供用户基于终端与“同事A”进行通话,
进一步地,在本实施例中,所述在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配的步骤之后,还包括:
在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
需要说明的是,在实际使用过程中,有多种原因导致终端不存在匹配的执行对象信息(所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配,且所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配),例如,用户拨打电话时,只说出“打电话”指令类型,未说出执行对象信息(打电话给谁),或者终端的语音识别模块未正确的识别用户的语音指令携带的执行对象信息。本实施例中,在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息,同时,显示所述满足预设条件的执行对象信息相关的指令类型。
例如,用户拨打电话时,只说出“打电话”指令类型,未说出执行对象信息(打电话给谁),优选地,本实施例将所述满足预设条件的执行对象信息以及所述满足预设条件的执行对象信息相关的指令类型,以UI的方式显示出来,具体UI显示方式可参照图2所示;同时,调用终端语音输出模块输出“你希望打电话给如下号码吗”;容易理解的是,用户如果查看到有目标执行对象信息时,可以以触屏方式选择执行,也可以语音方式选择执行。
本实施例通过在终端不存在匹配的执行对象信息时,以UI的方式显示所述满足预设条件的执行对象信息以及所述满足预设条件的执行对象信息相关的指令类型,供用户选择,能够提升用户体验,以及能够最大程度的规避终端语音识别失败的情况。
进一步地,在本实施例中,所述在接收到语音指令时,获取所述语音指令携带的待执行对象信息之后,所述指令处理方法,还包括:
在未获取到所述语音指令携带的待执行对象信息时,显示所述满足预设条件的执行对象信息。显示所述满足预设条件的执行对象信息可参照前述技术方案施行,此处不再赘述。
此外,在实际使用过程中,用户的语音指令可能包括多个执行对象信息,以下音乐播放为例进行详细说明:
终端运行音乐播放程序,当用户只说出“播放”指令类型时,若终端当前默认已选中某歌曲,则播放当前选中的歌曲;否则按照前述实施例,以UI的方式显示“播放”指令类型,以及“播放”指令类型相关的执行对象信息,如图3所示。
当用户说出“播放某某的歌”、“播放某某歌”或“播放某某的某首歌”时,解析终端接收到的语音指令,若只获取到一个执行对象信息,说明用户说的是某个歌手名或者是某个歌曲名,也可能是专辑名;若获取到两个执行对象信息,第一执行对象信息和第二执行对象信息,说明用户说的是某个歌手唱的某首歌。
针对获取到两个执行对象信息的情况,首先从所述指令索引表中查找是否有匹配的执行对象信息(第一执行对象信息和第二执行对象信息同时匹配,即存在歌手“某某”的某首歌),匹配成功则直接播放,否则遍历终端的音乐库,若仍未查找到则重新在所述指令索引表中查找是否有匹配第一执行对象信息的执行对象信息(是否存在歌手“某某”的任意歌曲),如果有,则以UI方式将歌手“某某”的所有歌曲显示出来,如图4所示;同时语音提示:“该歌手还有其他歌曲,是否播放?”,提供用户一次额外选择机会。
针对获取到一个执行对象信息的情况,从所述指令索引表中查找是否有匹配的执行对象信息,如果查找到是歌手名和获取的执行对象信息匹配,播放所述指令索引表中该歌手优先级最高的歌曲,同时查找出指令索引表中该歌手的其它歌曲以UI方式显示,供用户选择;如果查找到是专辑名和获取的执行对象信息匹配,播放所述指令索引表中该专辑中优先级最高的歌曲,同时查找出指令索引表中该专辑中的其他歌曲以UI方式显示,供用户选择;如果查找到匹配的执行对象信息就是歌曲名,则直接播放歌曲。
进一步地,基于第一或第二实施例,提出本发明指令处理方法的第三实施例,在本实施例中,所述执行匹配的执行对象信息对应的执行对象的步骤之后,所述指令处理方法还包括:
更新匹配的执行对象信息对应的执行对象的执行频率值。
本实施例中,记录终端成功执行的每一语音指令,包括语音指令的指令类型,以及与所述语音指令携带的执行对象信息匹配的执行对象信息,以更新所述匹配的执行对象信息对应的执行对象的执行频率值。
由于所述指令索引表存储有所述满足预设条件的执行对象信息,在更新匹配的执行对象信息对应的执行对象的执行频率值之后,动态更新所述指令索引表,即根据执行对象执行频率值的变化,调整所述指令索引表中相应执行对象信息的优先级顺序。此外,本领域技术人员可以理解的是,若匹配的执行对象信息之前不存在于所述指令索引表中,且所述匹配的执行对象信息对应的执行对象的执行频率值更新之后,使得所述匹配的执行对象信息满足所述预设条件,将所述匹配的执行对象信息添加至所述指令索引表中。本实施例通过实时更新所述指令索引表,能够进一步提升终端执行语音指令的效率。
本发明还提供一种指令处理装置,参照图5,在本发明指令处理装置的较佳实施例中,所述指令处理装置包括:
第一获取模块10,用于在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
第二获取模块20,用于获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
本实施例提供的指令处理装置可以应用于终端的语音控制中,例如,指令处理装置内置于终端运行,当用户说出语音指令时,终端能够快速响应用户说出的语音指令,以进行相应的操作。其中,所述终端可以是手机、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、数字TV以及台式计算机等智能终端。本领域技术人员可以理解的是,所述语音指令可由用户直接说出,也可由语音输出设备播放。
具体地,本实施例将一条完整的语音指令拆分成两部分,第一部分是指令类型,例如,“打电话”、“播放音乐”、“打开应用”对应的指令类型分别为:打电话、播放、打开三大类;第二部分是指令的执行对象信息,对于打电话来说,其相关的执行对象信息可以包括电话号码,联系人名称,电话号码类型等,对于播放音乐来说,其相关的执行对象信息可以包括歌曲名,专辑名,歌手名等,对于打开应用来说,其相关的执行对象信息可以包括终端已安装应用的应用名称。
本实施例中,在终端接收到语音指令时,第一获取模块10调用终端的语音识别模块获取所述语音指令的指令类型,以及所述语音指令携带的待执行对象信息。例如,在终端接收到语音指令时,第一获取模块10调用终端的语音识别模块获取到所述语音指令的指令类型为“打电话”,待执行对象信息为“母亲”,即用户预期的终端操作是“打电话给母亲”。
第二获取模块20获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息,其中,所述语音指令对应的执行对象信息即所述语音指令的指令类型相关的执行对象信息。
匹配模块30,用于将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
执行模块40,用于在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
在获取到所述待执行对象信息,以及所述满足预设条件的执行对象信息后,匹配模块30将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;若有所述满足预设条件的执行对象信息与所述待执行对象信息相同,则匹配,否则不匹配;其中,所述满足预设条件的执行对象信息中与所述待执行对象信息相同的执行对象信息即匹配的执行对象信息。
例如,前述第一获取模块10获取到语音指令的指令类型为“打电话”,待执行对象信息为“母亲”,匹配模块30将“母亲”与指令类型“打电话”相关的执行对象中满足预设条件的执行对象信息进行匹配,若所述满足预设条件的执行对象信息中存在“母亲”,则匹配。此时,执行模块40执行匹配的执行对象信息(“母亲”)对应的执行对象,即打电话给“母亲”:执行模块40调用终端拨号程序加载“母亲”的号码并拨打,以供用户基于终端与“母亲”进行通话。
本实施例提出的指令处理装置,在接收到语音指令,并获取到所述语音指令携带的待执行对象信息后,从满足预设条件的执行对象信息中查找与所述待执行对象信息匹配的执行对象信息,在查找到匹配的执行对象信息时,执行匹配的执行对象信息对应的执行对象,而无需如同现有技术一样去遍历所有执行对象信息,从而本发明能够提高终端执行语音指令的效率。
进一步地,本实施例设置有指令索引表,所述指令索引表存储有所述满足预设条件的执行对象信息。具体地,指令处理装置还包括表创建模块,用于在终端每次接收语音指令并执行时,获取所述语音指令的指令类型,以及携带的执行对象信息;并动态计算所述执行对象信息匹配的执行对象信息所对应的执行对象的执行频率值;按照执行对象信息与指令类型的关联关系,创建所述指令索引表,以将执行频率值大于或等于预设阈值的执行对象对应的执行对象信息添加至所述指令索引表中;或者,按照执行对象信息与指令类型的关联关系,创建所述指令索引表,以提取预设数量的执行对象信息添加至所述指令索引表中,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于除提取的所述执行对象信息之外的其它执行对象对应的执行对象的执行频率值。需要说明的是,所述指令索引表中的执行对象信息的优先级取决于其对应的执行对象的执行频率值,执行对象的执行频率值越高,其对应的执行对象信息的优先级越高。例如,所述指令索引表的打电话部分如表1所示。
优选地,所述匹配模块30还用于按照所述指令索引表中执行对象信息的优先级从高到低的顺序,依次将所述待执行对象信息与所述指令索引表中与所述语音指令的指令类型相关的执行对象信息进行匹配。
进一步地,基于上述技术方案,所述第二获取模块20还用于,
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息(即所述预设条件包括:执行对象信息对应执行对象的执行频率值大于或等于预设阈值,其中,本实施例不限定所述预设阈值的取值,具体根据实际需要设置);
或者,在所述语音指令对应的执行对象信息中,提取预设数量(本实施例不限定所述预设数量的取值,具体根据实际需要设置)的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
进一步地,基于第一实施例,提出本发明指令处理装置的第二实施例,在本实施例中,所述匹配模块30还用于在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
所述执行模块40还用于在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象。
容易理解的是,由于所述指令索引表中存储的执行对象信息对应的执行对象是执行频率值较高的执行对象,若用户说出的语音指令携带的执行对象信息对应的执行对象是之前未执行过,或者是执行频率值较低的执行对象时,所述指令索引表将不存在相应的执行对象信息,即所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配;此时匹配模块30将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息(所述指令索引表之外的执行对象信息,且所述执行对象信息相关的指令类型与所述待执行对象信息相关的指令类型相同)进行匹配;在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行模块40执行匹配的执行对象信息对应的执行对象。
例如,用户的语音指令为“打电话给同事A”,其中,指令类型为“打电话”,执行对象信息为“同事A”,如表1所示的指令索引表,不存在执行对象信息“同事A”,此时匹配模块30遍历名片夹信息(除表1所示的妻子、父亲、母亲之外),查找到匹配的执行对象信息“同事A”,执行模块40调用拨号程序加载“同事A”的号码并拨打,以供用户基于终端与“同事A”进行通话,
进一步地,在本实施例中,所述指令处理装置,还包括提示模块,用于在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
需要说明的是,在实际使用过程中,有多种原因导致终端不存在匹配的执行对象信息(所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配,且所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配),例如,用户拨打电话时,只说出“打电话”指令类型,未说出执行对象信息(打电话给谁),或者终端的语音识别模块未正确的识别用户的语音指令携带的执行对象信息。本实施例中,提示模块在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息,同时,显示所述满足预设条件的执行对象信息相关的指令类型。
例如,用户拨打电话时,只说出“打电话”指令类型,未说出执行对象信息(打电话给谁),优选地,提示模块调用终端的显示模块将所述满足预设条件的执行对象信息以及所述满足预设条件的执行对象信息相关的指令类型,以UI的方式显示出来,具体UI显示方式可参照图2所示;同时,调用终端语音输出模块输出“你希望打电话给如下号码吗”;容易理解的是,用户如果查看到有目标执行对象信息时,可以以触屏方式选择执行,也可以语音方式选择执行。
本实施例通过在终端不存在匹配的执行对象信息时,以UI的方式显示所述满足预设条件的执行对象信息以及所述满足预设条件的执行对象信息相关的指令类型,供用户选择,能够提升用户体验,以及能够最大程度的规避终端语音识别失败的情况。
进一步地,在本实施例中,所述提示模块还用于在第一获取模块10未获取到所述语音指令携带的待执行对象信息时,显示所述满足预设条件的执行对象信息。显示所述满足预设条件的执行对象信息可参照前述技术方案施行,此处不再赘述。
此外,在实际使用过程中,用户的语音指令可能包括多个执行对象信息,以下以内置指令处理装置的终端进行音乐播放为例进行详细说明:
终端运行音乐播放程序,当用户只说出“播放”指令类型时,若终端当前默认已选中某歌曲,则播放当前选中的歌曲;否则按照前述实施例,以UI的方式显示“播放”指令类型,以及“播放”指令类型相关的执行对象信息,如图3所示。
当用户说出“播放某某的歌”、“播放某某歌”或“播放某某的某首歌”时,解析终端接收到的语音指令,若只获取到一个执行对象信息,说明用户说的是某个歌手名或者是某个歌曲名,也可能是专辑名;若获取到两个执行对象信息,第一执行对象信息和第二执行对象信息,说明用户说的是某个歌手唱的某首歌。
针对获取到两个执行对象信息的情况,首先从所述指令索引表中查找是否有匹配的执行对象信息(第一执行对象信息和第二执行对象信息同时匹配,即存在歌手“某某”的某首歌),匹配成功则直接播放,否则遍历终端的音乐库,若仍未查找到则重新在所述指令索引表中查找是否有匹配第一执行对象信息的执行对象信息(是否存在歌手“某某”的任意歌曲),如果有,则以UI方式将歌手“某某”的所有歌曲显示出来,如图4所示;同时语音提示:“该歌手还有其他歌曲,是否播放?”,提供用户一次额外选择机会。
针对获取到一个执行对象信息的情况,从所述指令索引表中查找是否有匹配的执行对象信息,如果查找到是歌手名和获取的执行对象信息匹配,播放所述指令索引表中该歌手优先级最高的歌曲,同时查找出指令索引表中该歌手的其它歌曲以UI方式显示,供用户选择;如果查找到是专辑名和获取的执行对象信息匹配,播放所述指令索引表中该专辑中优先级最高的歌曲,同时查找出指令索引表中该专辑中的其他歌曲以UI方式显示,供用户选择;如果查找到匹配的执行对象信息就是歌曲名,则直接播放歌曲。
进一步地,基于第一或第二实施例,提出本发明指令处理装置的第三实施例,在本实施例中,所述指令处理装置还包括更新模块,用于更新匹配的执行对象信息对应的执行对象的执行频率值。
本实施例中,更新模块记录终端成功执行的每一语音指令,包括语音指令的指令类型,以及与所述语音指令携带的执行对象信息匹配的执行对象信息,以更新所述匹配的执行对象信息对应的执行对象的执行频率值。
由于所述指令索引表存储有所述满足预设条件的执行对象信息,更新模块在更新匹配的执行对象信息对应的执行对象的执行频率值之后,动态更新所述指令索引表,即更新模块根据执行对象执行频率值的变化,调整所述指令索引表中相应执行对象信息的优先级顺序。此外,本领域技术人员可以理解的是,若匹配的执行对象信息之前不存在于所述指令索引表中,且所述匹配的执行对象信息对应的执行对象的执行频率值更新之后,使得所述匹配的执行对象信息满足所述预设条件,将所述匹配的执行对象信息添加至所述指令索引表中。本实施例通过实时更新所述指令索引表,能够进一步提升终端执行语音指令的效率。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种指令处理方法,其特征在于,所述指令处理方法包括:
在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象,
所述将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配的步骤之后,所述指令处理方法,还包括:
在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象,
所述在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配的步骤之后,所述指令处理方法,还包括:
在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
2.如权利要求1所述的指令处理方法,其特征在于,所述获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息包括:
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息;
或者,在所述语音指令对应的执行对象信息中,提取预设数量的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
3.如权利要求2所述的指令处理方法,其特征在于,所述执行匹配的执行对象信息对应的执行对象的步骤之后,所述指令处理方法还包括:
更新匹配的执行对象信息对应的执行对象的执行频率值。
4.一种指令处理装置,其特征在于,所述指令处理装置包括:
第一获取模块,用于在接收到语音指令时,获取所述语音指令携带的待执行对象信息;
第二获取模块,用于获取所述语音指令对应的执行对象信息中满足预设条件的执行对象信息;
匹配模块,用于将所述待执行对象信息与所述满足预设条件的执行对象信息进行匹配;
执行模块,用于在有所述满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象,
所述匹配模块还用于在所述满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,将所述待执行对象信息与所述语音指令对应的执行对象信息中不满足预设条件的执行对象信息进行匹配;
所述执行模块还用于在有所述不满足预设条件的执行对象信息与所述待执行对象信息匹配时,执行匹配的执行对象信息对应的执行对象,
所述指令处理装置,还包括提示模块,用于在所述不满足预设条件的执行对象信息与所述待执行对象信息均不匹配时,显示所述满足预设条件的执行对象信息。
5.如权利要求4所述的指令处理装置,其特征在于,所述第二获取模块还用于,
获取所述语音指令对应的执行对象信息中,执行频率值大于或等于预设阈值的执行对象对应的执行对象信息;
或者,在所述语音指令对应的执行对象信息中,提取预设数量的执行对象信息,其中提取的所述执行对象信息对应的执行对象的执行频率值,大于所述语音指令对应的执行对象信息中除提取的所述执行对象信息之外的其它执行对象信息对应的执行对象的执行频率值。
6.如权利要求5所述的指令处理装置,其特征在于,所述指令处理装置还包括更新模块,用于更新匹配的执行对象信息对应的执行对象的执行频率值。
CN201510342609.1A 2015-06-18 2015-06-18 指令处理方法及装置 Active CN106328129B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510342609.1A CN106328129B (zh) 2015-06-18 2015-06-18 指令处理方法及装置
PCT/CN2016/078987 WO2016202064A1 (zh) 2015-06-18 2016-04-11 指令处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510342609.1A CN106328129B (zh) 2015-06-18 2015-06-18 指令处理方法及装置

Publications (2)

Publication Number Publication Date
CN106328129A CN106328129A (zh) 2017-01-11
CN106328129B true CN106328129B (zh) 2020-11-27

Family

ID=57545068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510342609.1A Active CN106328129B (zh) 2015-06-18 2015-06-18 指令处理方法及装置

Country Status (2)

Country Link
CN (1) CN106328129B (zh)
WO (1) WO2016202064A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316641B (zh) * 2017-06-30 2021-06-15 联想(北京)有限公司 一种语音控制方法及电子设备
CN112397060B (zh) * 2019-07-31 2024-02-23 北京声智科技有限公司 一种语音指令处理方法、系统、设备及介质
CN111951798A (zh) * 2020-07-16 2020-11-17 东风汽车集团有限公司 基于语音的车窗升降控制方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810285A (zh) * 2014-02-24 2014-05-21 联想(北京)有限公司 一种获取信息的方法及装置
CN104575494A (zh) * 2013-10-16 2015-04-29 中兴通讯股份有限公司 一种语音处理的方法和终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580363B2 (en) * 2004-08-16 2009-08-25 Nokia Corporation Apparatus and method for facilitating contact selection in communication devices
US8577004B2 (en) * 2010-02-11 2013-11-05 Infineon Technologies Ag Predictive contact information representation
CN102543071B (zh) * 2011-12-16 2013-12-11 安徽科大讯飞信息科技股份有限公司 用于移动设备的语音识别系统和方法
CN102739869A (zh) * 2012-06-26 2012-10-17 华为终端有限公司 语音查找目标联系人的信息的方法及终端
US9070120B2 (en) * 2012-12-14 2015-06-30 Vonage Network Llc Identifying and displaying a set of high priority contacts on a display device
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
CN104282301A (zh) * 2013-07-09 2015-01-14 安徽科大讯飞信息科技股份有限公司 一种语音命令处理方法以及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575494A (zh) * 2013-10-16 2015-04-29 中兴通讯股份有限公司 一种语音处理的方法和终端
CN103810285A (zh) * 2014-02-24 2014-05-21 联想(北京)有限公司 一种获取信息的方法及装置

Also Published As

Publication number Publication date
WO2016202064A1 (zh) 2016-12-22
CN106328129A (zh) 2017-01-11

Similar Documents

Publication Publication Date Title
CN106250474B (zh) 一种语音控制的处理方法及系统
US10043520B2 (en) Multilevel speech recognition for candidate application group using first and second speech commands
TWI511124B (zh) 基於語音辨識的選擇方法及其行動終端裝置及資訊系統
US9218052B2 (en) Framework for voice controlling applications
US8799254B2 (en) Method and apparatus for improved searching of database content
CN108509107A (zh) 应用功能信息显示方法、装置及终端设备
EP2940683A1 (en) Information processing device, information processing method and program
CN106328129B (zh) 指令处理方法及装置
WO2016165346A1 (zh) 存储和播放音频文件的方法和装置
CN103246520A (zh) 一种更换程序使用的语言的方法及装置
CN109144285A (zh) 一种输入方法和装置
CN109710796A (zh) 基于语音的图片搜索方法、装置、存储介质及终端
US9451423B2 (en) Method and apparatus for recording information during a call
CN111142993A (zh) 一种信息获取方法、终端及计算机存储介质
CN105260080A (zh) 一种在移动终端显示屏实现声控操作的方法及装置
CN110827824B (zh) 语音处理方法、装置、存储介质及电子设备
CN106409286A (zh) 一种实现音频处理的方法及装置
US20070136065A1 (en) Method and apparatus for accessing a digital file from a collection of digital files
CN113470649B (zh) 语音交互方法及装置
CN102880655A (zh) 一种查询信息的方法、装置及触摸屏终端
CN112286421A (zh) 播放列表处理方法、装置及电子设备
CN108628461A (zh) 一种输入方法和装置、一种更新词库的方法和装置
CN109388249A (zh) 输入信息的处理方法、装置、终端及可读存储介质
CN106776631B (zh) 信息处理方法及装置
CN106599274A (zh) 识别播放音源的装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant