CN108428450A - 一种操作指令处理方法及装置 - Google Patents

一种操作指令处理方法及装置 Download PDF

Info

Publication number
CN108428450A
CN108428450A CN201710082715.XA CN201710082715A CN108428450A CN 108428450 A CN108428450 A CN 108428450A CN 201710082715 A CN201710082715 A CN 201710082715A CN 108428450 A CN108428450 A CN 108428450A
Authority
CN
China
Prior art keywords
operational order
type
scene
application program
residing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710082715.XA
Other languages
English (en)
Other versions
CN108428450B (zh
Inventor
郭云云
汤曌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Banma Zhixing Network Hongkong Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710082715.XA priority Critical patent/CN108428450B/zh
Publication of CN108428450A publication Critical patent/CN108428450A/zh
Application granted granted Critical
Publication of CN108428450B publication Critical patent/CN108428450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种操作指令处理方法及装置。本申请中,对输入的语音进行识别,得到所请求执行的操作指令;根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。采用本申请可使得语音提示信息能够对用户进行有效引导。

Description

一种操作指令处理方法及装置
技术领域
本申请涉及通信领域,尤其涉及一种操作指令处理方法及装置。
背景技术
随着语音识别技术的发展,越来越多的应用与语音识别技术相结合,可识别出用户通过语音方式输入的操作指令,并执行识别出的操作指令。
以具有语音识别功能的车载终端为例,该车载终端中设置有支持语音识别的导航应用程序。该终端还可与智能手机连接,并可根据输入的语音识别出打电话的操作指令后,将该操作指令传输给智能手机中的打电话应用程序,实现打电话的操作。比如,当用户输入语音“导航”后,车载终端可启动导航应用程序进入导航流程。当用户输入语音“打电话”后,车载终端可启动智能手机中的打电话应用程序。
对于语音识别异常的情况,通常给出“没有听清,请再说一遍”或类似的语音提示。这种方式的语音提示无法结合当前的场景对用户进行有效的引导。
发明内容
本申请实施例提供了一种操作指令处理方法及装置。
第一方面,提供一种操作指令处理方法,包括:
对输入的语音进行识别,得到所请求执行的操作指令;
根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。
可选地,所述匹配的语音提示信息,用于引导从所述所处的场景切换到与所述操作指令相匹配的场景,和/或用于引导输入与所述所处的场景匹配的操作指令。
可选地,操作指令的类型包括以下之一或多种组合:第一类型、第二类型和第三类型;针对每种类型,对应有执行相应类型操作指令相匹配的场景。
可选地,与执行任一第一类型操作指令相匹配的场景包括:处于以及未处于与所述任一第一类型操作指令对应的应用程序所执行的流程;或者,未处于处理优先级高于所述任一第一类型操作指令的处理优先级的应用程序所执行的流程。
可选地,若所述操作指令为第一类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:若所述所处的场景为:处于与所述第一类型操作指令对应的应用程序所执行的流程,或者未处于与所述第一类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景;或者,若所述所处的场景为:未处于处理优先级高于所述所请求的第一类型操作指令的处理优先级的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景。
可选地,根据所述操作指令和所述所处的场景输出匹配的提示信息,包括:若所处的场景处于与所述第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所述第一类型操作指令对应的应用程序的处理优先级,则输出用于引导从所述所处的场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。
可选地,与执行任一第二类型操作指令相匹配的场景包括:处于与所述任一第二类型操作指令对应的应用程序中所述任一第二类型操作指令对应的业务流程,或者,处于与所述任一第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于所述任一第二类型操作指令对应的业务流程的处理优先级;其中,一个应用程序中包括一个或多个业务流程,一个业务流程对应一个或多个第二类型指令。
可选地,若所述操作指令为第二类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景;或者,若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,且在该应用程序所执行的流程中,所处的业务流程的处理优先级低于所述第二类型操作指令对应的业务流程的处理优先级,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景。
可选地,根据所述操作指令和所述所处的场景输出匹配的提示信息,包括:若所处的场景处于与所述第二类型操作指令对应的应用程序所执行的流程中,但所处的业务流程的处理优先级高于所述第一类型操作指令对应的业务流程的处理优先级,则输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述第二类型操作指令对应的业务流程。
可选地,与执行任一第三类型操作指令相匹配的场景包括:处于应用程序的指定用户界面,所述指定用户界面能够响应所述任一第一类型操作指令。
可选地,若所述操作指令为第三类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:若所处的场景是应用程序中能够响应所述第三类型操作指令的应用程序中的用户界面,则判定所述所处的场景是与执行所述第三类型操作指令相匹配的场景。
可选地,一个操作指令对应一个或多个类型;根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型下的所述操作指令相匹配的场景,若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息,包括:
所述操作指令对应多个类型时,按照处理优先级顺序选取所述操作指令对应的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所述操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则执行所述操作指令;
若判定为不是且当前类型不是所述操作指令所对应的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述操作指令所对应的多个类型中的下一个类型作为当前类型;
若判定为不是且当前类型为所述操作指令所对应的多个类型中的最后一个类型,则根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
可选地,若所述操作指令中包括数据,则所述方法还包括:若判定所述操作指令中包括的数据为非法数据,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。
可选地,还包括:若对输入的语音进行识别后,得到的所请求执行的操作指令的置信度低于设定阈值,则输出用于引导重新输入操作指令的语音提示信息。
可选地,若所述操作指令为在联网状态下执行的操作指令,则在判定所述所处的场景是否是与执行所述操作指令相匹配的场景的情况下,还判断网络是否可用,若可用,则执行所述操作指令。
可选地,还包括:若对输入的语音进行识别所得到的识别结果为空或者未得到有效的数据或有效的操作指令,则根据所处的场景输出用于引导输入合法数据或合法操作指令的语音提示信息。
可选地,若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则还包括:若所处的场景为处于第一应用程序所执行的流程,则判断所述数据是否为所述第一应用程序对应的数据;若所述数据是第一应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述第一应用程序中的操作指令;否则,确定所述数据为第二应用程序对应的数据,判断所述第二应用程序的处理优先级是否高于所述第一应用程序的处理优先级,若高于,则在所处的场景允许的情况下执行所述数据对应的在所述第二应用中的操作指令,若不高于,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则还包括:若所处的场景为未处于任何应用程序所执行的流程,则判断所述数据是一个应用程序对应的合法数据还是多个应用程序对应的数据;若所述数据是一个应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述一个应用程序中的操作指令;若所述数据所多个应用程序对应的数据,则输出用于引导在所述数据所对应的多个应用程序中进行选择的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,得到所请求执行的操作指令之后,还包括:获取所述操作指令对应的标签,根据所述操作指令的标签确定所述操作指令的类型;其中,所述标签用于指示所述操作指令对应的类型;或者,确定所述操作指令所在的指令列表,根据所述指令列表对应的操作指令类型,确定所述操作指令对应的类型;其中,一个指令列表对应一个操作类型,一个指令列表用于存储同一类型的操作指令。
第二方面,提供一种操作指令处理装置,包括:
识别模块,用于对输入的语音进行识别,得到所请求执行的操作指令;
判断模块,用于根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
处理模块,用于在所述判断模块判定为是时,执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。
可选地,所述匹配的语音提示信息,用于引导从所述所处的场景切换到与所述操作指令相匹配的场景,和/或用于引导输入与所述所处的场景匹配的操作指令。
可选地,操作指令的类型包括以下之一或多种组合:第一类型、第二类型和第三类型;针对每种类型,对应有执行相应类型操作指令相匹配的场景。
可选地,与执行任一第一类型操作指令相匹配的场景包括:处于以及未处于与所述任一第一类型操作指令对应的应用程序所执行的流程;或者,未处于处理优先级高于所述任一第一类型操作指令的处理优先级的应用程序所执行的流程。
可选地,所述判断模块具体用于:若所述所处的场景为:处于与所述第一类型操作指令对应的应用程序所执行的流程,或者未处于与所述第一类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景;或者,若所述所处的场景为:未处于处理优先级高于所述所请求的第一类型操作指令的处理优先级的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景。
可选地,所述处理模块具体用于:若所处的场景处于与所述第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所述第一类型操作指令对应的应用程序的处理优先级,则输出用于引导从所述所处的场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。
可选地,与执行任一第二类型操作指令相匹配的场景包括:处于与所述任一第二类型操作指令对应的应用程序中所述任一第二类型操作指令对应的业务流程,或者,处于与所述任一第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于所述任一第二类型操作指令对应的业务流程的处理优先级;其中,一个应用程序中包括一个或多个业务流程,一个业务流程对应一个或多个第二类型指令。
可选地,所述判断模块具体用于:若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景;或者,若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,且在该应用程序所执行的流程中,所处的业务流程的处理优先级低于所述第二类型操作指令对应的业务流程的处理优先级,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景。
可选地,所述处理模块具体用于:若所处的场景处于与所述第二类型操作指令对应的应用程序所执行的流程中,但所处的业务流程的处理优先级高于所述第一类型操作指令对应的业务流程的处理优先级,则输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述第二类型操作指令对应的业务流程。
可选地,与执行任一第三类型操作指令相匹配的场景包括:处于应用程序的指定用户界面,所述指定用户界面能够响应所述任一第一类型操作指令。
可选地,所述判断模块具体用于:若所处的场景是应用程序中能够响应所述第三类型操作指令的应用程序中的用户界面,则判定所述所处的场景是与执行所述第三类型操作指令相匹配的场景。
可选地,一个操作指令对应一个或多个类型;所述判断模块具体用于:所述操作指令对应多个类型时,按照处理优先级顺序选取所述操作指令对应的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所述操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则指示所述处理模块执行所述操作指令;
若判定为不是且当前类型不是所述操作指令对应的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述操作指令所对应的多个类型中的下一个类型作为当前类型;
若判定为不是且当前类型为所述操作指令所对应的多个类型中的最后一个类型,则指示所述处理模块根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
可选地,所述处理模块还用于:若所述操作指令中包括数据,则在判定所述操作指令中包括的数据为非法数据的情况下,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。
可选地,所述处理模块还用于:若所述识别模块对输入的语音进行识别后,得到的所请求执行的操作指令的置信度低于设定阈值,则输出用于引导重新输入操作指令的语音提示信息。
可选地,所述处理模块还用于:若所述操作指令为在联网状态下执行的操作指令,则在所述判断模块判定所述所处的场景是否是与执行所述操作指令相匹配的场景的情况下,还判断网络是否可用,若可用,则执行所述操作指令。
可选地,所述处理模块还用于:若所述识别模块对输入的语音进行识别所得到的识别结果为空或者未得到有效的数据或有效的操作指令,则根据所处的场景输出用于引导输入合法数据或合法操作指令的语音提示信息。
可选地,所述处理模块还用于:若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为处于第一应用程序所执行的流程,则判断所述数据是否为所述第一应用程序对应的数据;若所述数据是第一应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述第一应用程序中的操作指令;否则,确定所述数据为第二应用程序对应的数据,判断所述第二应用程序的处理优先级是否高于所述第一应用程序的处理优先级,若高于,则在所处的场景允许的情况下执行所述数据对应的在所述第二应用中的操作指令,若不高于,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,所述处理模块还用于:若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为未处于任何应用程序所执行的流程,则判断所述数据是一个应用程序对应的合法数据还是多个应用程序对应的数据;若所述数据是一个应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述一个应用程序中的操作指令;若所述数据所多个应用程序对应的数据,则输出用于引导在所述数据所对应的多个应用程序中进行选择的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,所述判断模块还用于:在所述识别模块得到所请求执行的操作指令之后,获取所述操作指令对应的标签,根据所述操作指令的标签确定所述操作指令的类型;其中,所述标签用于指示所述操作指令对应的类型;或者,所述判断模块还用于:在所述识别模块得到所请求执行的操作指令之后,确定所述操作指令所在的指令列表,根据所述指令列表对应的操作指令类型,确定所述操作指令对应的类型;其中,一个指令列表对应一个操作类型,一个指令列表用于存储同一类型的操作指令。
第三方面,提供一种通信设备,包括:一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行上述第一方面中任一项所述的方法。
第四方面,提供一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被一个或多个处理器执行时,使得通信设备执行上述第一方面中任一项所述的方法。
本申请的上述实施例中,对输入的语音进行识别,得到所请求执行的操作指令,根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型下的所述操作指令相匹配的场景,若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。由于在进行语音提示信息输出时,可根据所识别出的操作指令和/或所处的场景输出匹配的语音提示信息,因此使得语音提示信息能够对用户进行有效引导。
附图说明
本申请的实施例通过示例而非限制的方式示出在所附附图中,类似的附图标记表示类似的元素。
图1示例性地示出了一种以车载终端为例的应用场景的示意图;
图2示例性地示出了本申请实施例提供的操作指令处理流程示意图;
图3示例性地示出了本申请实施例中基于语音识别的处理流程示意图;
图4示例性地示出了本申请实施例中第三类型操作指令处理流程示意图;
图5示例性地示出了本申请实施例中第二类型操作指令处理流程示意图;
图6示例性地示出了本申请实施例中第一类型操作指令处理流程示意图;
图7示例性地示出了本申请实施例中对识别到的数据进行处理的流程图;
图8示例性地示出了本申请实施例提供的操作指令处理装置结构示意图;
图9示例性地示出了本申请实施例提供的通信装置的结构示意图。
具体实施方式
虽然本申请的概念易于进行各种修改和替代形式,但是其具体实施例已经通过附图中的示例示出并且将在本文中详细描述。然而,应当理解,没有意图将本申请的概念限制为所公开的特定形式,而是相反,意图是覆盖与本申请以及所附权利要求一致的所有修改、等同物和替代物。
说明书中对“一个实施例”、“实施例”、“说明性实施例”等的引用,指示所描述的实施例可包括特定特征、结构或特性,但是每个实施例可以或可以不必包括特定特征、结构或特性。此外,这样的短语不一定指的是相同的实施例。进一步地,认为在本领域技术人员的知识范围内,当结合实施例描述特定特征、结构或特性时,结合无论是否明确描述的其它实施例影响这样的特征,结构或特性。另外,应当理解,以“A,B和C中的至少一个”的形式包括在列表中的项目可以表示(A);(B);(C);(A和B);(A和C);(B和C);或(A,B和C)。类似地,以“A,B或C中的至少一个”的形式列出的项目可以表示(A);(B);(C);(A和B);(A和C);(B和C)或(A,B和C)。
在一些情况下,所公开的实施例可以在硬件、固件、软件或其任何组合中实现。所公开的实施例还可以被实现为由一个或多个暂时性或非暂时性机器可读(例如,计算机可读)存储介质携带或存储的指令,其可以由一个或多个处理器读取和执行。机器可读存储介质可以体现为用于以机器可读形式(例如,易失性或非易失性存储器、介质盘或其他介质)存储或传输信息的任何存储设备,机制或其他物理结构的设备)。
在附图中,一些结构或方法特征可以以特定布置和/或顺序示出。然而,应当理解,可能不需要这样的具体布置和/或排序。相反,在一些实施例中,这些特征可以以与说明性附图中所示不同的方式和/或顺序来布置。另外,在特定图中包括结构或方法特征并不意味着暗示这种特征在所有实施例中都是需要的,并且在一些实施例中可以不包括或可以与其他特征组合。
本申请实施例可应用于电子设备。该电子设备可以是任何适当的计算或移动设备,比如可包括:智能手机、平板电脑、笔记本电脑、个人数字助理(Personal DigitalAssistant,PDA)、智能穿戴设备或车载终端等类似设备。该电子设备可具有语音识别功能。
图1示例性地示出了以该电子设备为车载终端为例的应用场景示意图。车载终端101可提供以下功能中的一种或多种:导航功能、播放音乐(包括链接智能手机后的蓝牙音乐)、收音机播放功能、有声读物播放功能、联系车队功能、请求救援功能等。该车载终端还可以与智能手机102连接。车载终端101与智能手机102的连接方式可包括有线连接方式或无线连接方式,所述无线连接方式可包括但不限于蓝牙方式。车载终端101可通过网络103与第一服务器104连接,以通过与第一服务器104通信从而实现导航功能。智能手机102可通过网络103与第二服务器105连接,以通过与第二服务器105通信从而实现打电话等功能。图1中仅示例性地示出了第一服务器104和第二服务器105,在实际应用中,根据车载终端101和智能手机102所实现的功能种类,可以有更多的服务器。
车载终端101可与智能手机102中的某些应用程序进行交互,通过语音识别出的操作指令对智能手机102中的这些应用程序进行操作。比如,车载终端101可对智能手机102中的打电话应用程序进行操作,比如查询联系人、拨打联系人的电话号码等。再例如,车载终端101可与智能手机102的短消息应用程序交互,可对智能手机中的短消息应用程序进行操作,比如输入短消息内容、将短消息发送给联系人等。
本申请实施例中涉及到的应用程序,在不特别声明的情况下,指的是可以实现特定业务功能的应用程序,比如上述的导航应用程序、打电话应用程序、短消息应用程序,再比如,音乐播放音乐程序等,通常不包括提供基本服务功能的应用程序,比如各类系统服务(比如网络连接服务、用户界面管理服务等)。该应用程序支持语音引导功能。
一个应用程序所执行的流程中可包括一个或多个业务流程,一个业务流程可对应一个或多个操作指令。比如,以导航应用程序为例,导航应用程序中可包括以下业务流程:导航流程和地图查询流程。导航流程对应的操作指令可包括“导航开始”、“导航结束”等,地图查询流程对应的操作指令可包括“地图放大”、“地图缩小”等。再例如,以打电话应用程序为例,打电话应用程序中可包括以下业务流程:打电话流程、联系人查询流程。打电话流程对应的操作指令可包括:“打电话”、“挂断电话”;联系人查询流程对应的操作指令可包括:“打开通讯录”、“查询通讯录”等。
本申请实施例中,为了有效地对语音输入的操作指令进行处理,将操作指令划分为第一操作类型、第二操作类型、第三操作类型中的一种或多种。每种操作类型的指令有其匹配的可执行该操作指令的场景,对于输入的操作指令,只有在当前场景是与执行该操作指令匹配的场景的情况下,才可执行该输入的操作指令,否则输出语音提示信息,该语音提示信息可引导用户输入正确的操作指令。
下面对本申请实施例中的操作指令类型进行说明。
(1)第一类型操作指令
第一类型操作也可称为全局类型操作指令。
在一些例子中,与执行某一个第一类型操作指令相匹配的场景包括:处于与该第一类型操作指令对应的应用程序所执行的流程,或者未处于与该第一类型操作指令对应的应用程序所执行的流程。即,第一类型操作指令可在任何场景下执行。例如,“导航”指令用于启动导航流程,为全局指令,若根据用户输入的语音识别出“导航”指令时,当前正在执行音乐播放应用程序的流程,则可根据该操作指令启动导航应用程序,开启导航流程。再例如,“地图查询”指令用于对导航应用程序中的电子地图进行查询,为全局指令,在根据用户输入的语音识别出“地图查询”指令的情况下,若当前正在执行导航应用程序中的导航流程,则可根据该“地图查询”指令启动查询电子地图流程并显示查询结果。再例如,“地图放大”指令用于对导航应用程序中的电子地图进行放大显示,为全局指令,在根据用户输入的语音识别出“地图放大”指令的情况下,若当前正在执行导航应用程序中的地图查询流程,则可根据该“地图放大”指令放大当前用户界面中的电子地图。
在另外一些例子中,与执行某一个第一类型操作指令相匹配的场景包括:未处于处理优先级高于该第一类型操作指令的处理优先级的应用程序所执行的流程。即,第一类型的操作指令可根据应用程序的处理优先级有条件地执行,以提高系统灵活性。其中,应用程序的处理优先级可预先设置。具体实施时,对于任意两个具有语音服务功能的应用程序,可设置其处理优先级的高与低。
其中,“未处于处理优先级高于该第一类型操作指令的处理优先级的应用程序所执行的流程”可包括两种情况:一是当前正在执行有应用程序,但当前正在执行的应用程序的处理优先级低于用户所请求执行的应用程序的处理优先级;二是当前没有应用程序正在执行。
比如,“音乐播放”指令为全局指令,用于开启“音乐播放”应用程序,且“导航”应用程序的处理优先级高于“音乐播放”应用程序的处理优先级,“短消息”应用程序的处理优先级低于“音乐播放”应用程序的处理优先级。此种情况下,作为一个例子,在根据用户输入的语音识别出“音乐播放”指令时,若当前正在执行导航流程,则由于当前正在执行的导航应用程序的处理优先级高于用户请求的音乐播放应用程序的处理优先级,因此仍然保持执行当前的导航应用程序,而拒绝执行“音乐播放”指令,并可进一步提示用户输入正确的指令;作为另一个例子,在根据用户输入的语音识别出“音乐播放”指令时,若当前正在执行“短消息”应用程序,则由于当前正在执行的“短消息”应用程序的处理优先级低于“音乐播放”音乐程序的处理优先级,因此执行用户输入的“音乐播放”指令,即启动“音乐播放”应用程序。
可选地,若当前场景处于与所请求执行的第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所请求执行的第一类型操作指令对应的应用程序的处理优先级,则可输出用于引导从当前场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。比如,仍以上述例子为例,在根据用户输入的语音识别出“音乐播放”指令时,若当前正在执行导航流程,则由于当前正在执行的导航应用程序的处理优先级高于用户请求的音乐播放应用程序的处理优先级,因此仍然保持执行当前的导航应用程序,而拒绝执行“音乐播放”指令,并可进一步输出如下内容的语音提示“请先说退出导航后,再说音乐播放”,从而引导用户退出当前正在执行的导航流程,再开启音乐播放流程。或者,在上述情况下,也可输出如下内容的语音提示“现在正在导航,无法播放音乐”。
(2)第二类型操作指令
第二类型操作也可称为场景类型操作指令。
在一些例子中,与执行某个第二类型操作指令相匹配的场景包括:处于与该第二类型操作指令对应的应用程序中该第二类型操作指令对应的业务流程。即,只要当前运行的应用程序为该第二类型操作指令对应的应用程序,则可无条件地执行该第二类型操作指令。
其中,一个应用程序中可包括一个或多个业务流程,一个业务流程可对应一个或多个第二类型操作指令。比如,导航应用程序中可包括导航业务流程和地图查询业务流程,导航业务流程对应的第二类型操作指令可包括:用于开启“导航”流程的指令;地图查询业务流程对应的第二类型操作指令可包括:地图放大、地图缩小。作为一个例子,当根据用户输入的语音识别得到“地图放大”指令时,若当前处于导航应用程序的流程中,则无论是否处于“地图查询”流程,均可执行“地图放大”指令。
在另一些例子中,与执行某个第二类型操作指令相匹配的场景包括:处于与该第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于该第二类型操作指令对应的业务流程的处理优先级。即,在当前运行的应用程序为该第二类型操作指令对应的应用程序的情况下,可有条件地执行该第二类型操作指令,以提高系统灵活性。
其中,“处于与该第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于该第二类型操作指令对应的业务流程的处理优先级”可包括两种情况:一是当前正在执行与该第二类型操作指令对应的应用程序中的某个业务流程,但当前正在执行的业务流程的处理优先级低于用户所请求的业务流程的处理优先级;二是当前正在执行与该第二类型操作指令对应的应用程序,且未进入该应用程序中的任何业务流程。其中,对于一个应用程序中的多个业务流程,其处理优先级可预先设置。具体实施时,对于一个应用程序中的任意两个业务流程,可设置其处理优先级的高与低。
作为一个例子,在根据用户输入的语音识别得到“地图放大”指令的情况下,该指令为第二类型操作指令,若当前处于导航应用程序的导航流程,由于当前正在执行的导航流程的处理优先级高于用户请求的地图放大指令对应的地图查询流程的处理优先级,因此仍然保持当前的导航流程的执行,而拒绝执行“地图放大”指令,并提示用户输入正确的指令。
可选地,若当前处于与所请求执行的第二类型操作指令对应的应用程序所执行的流程中,但当前所处的业务流程的处理优先级高于所请求执行的第一类型操作指令对应的业务流程的处理优先级,则可输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述所请求执行的第二类型操作指令对应的业务流程。比如,仍以上述例子为例,由于当前正在执行的导航流程的处理优先级高于用户请求的地图放大指令对应的地图查询流程的处理优先级,因此仍然保持当前的导航流程的执行,而拒绝执行“地图放大”指令,并可进一步输出如下内容的语音提示“请先说退出导航后,再说地图放大”,从而引导用户退出当前正在执行的导航流程,再开启地图查询流程执行地图放大指令。或者,在上述情况下,也可输出如下内容的语音提示“现在正在导航,无法放大地图”。
(3)第三类型操作指令
第三类型操作也可称为流程类型操作指令。
该类型的操作指令在应用程序展示特定用户界面时才可执行,该特定用户界面可响应该类型的操作指令。该类型的操作指令可以是通用操作的指令,与具体业务无关,比如可以是翻页操作的指令,如返回上一页或进入下一页的操作指令。举例来说,打电话应用程序中的联系人列表采用多个用户界面进行显示,并提供上一页和下一页的翻页功能。相应地,当在打电话应用程序中联系人列表的用户界面被展示时,若用户输入语音“上一页”则可执行联系人列表的翻页操作。
可选地,第三类型操作指令所适用的应用程序也可以是多个应用程序中的特定用户界面,这些应用程序中的特定用户界面均可响应该类型的操作指令。例如,打电话应用程序中的联系人列表采用多个用户界面进行显示,并提供上一页和下一页的翻页功能;音乐播放应用程序中的音乐列表也可采用多个用户界面进行显示,并提供上一页和下一页的翻页功能。相应地,当在打电话应用程序中联系人列表的用户界面被展示时,若用户输入语音“上一页”则可执行联系人列表的翻页操作;在音乐播放应用程序中应用列表的用户界面被展示时,若用户输入语音“上一页”则可执行音乐列表的翻页操作。
图2示例性地示出了本申请实施例提供的操作指令处理流程。该流程可由操作指令处理装置执行,比如上述的车载终端。如图所示,该流程可包括:
S201中,对输入的语音进行识别,得到所请求执行的操作指令。具体实施时,可预先建立操作指令与对应的语音特征值之间的映射关系,这样在进行语音识别时,可根据识别到的语音特征值查询该对应关系,从而得到所请求执行的操作指令。具体地,可将识别得到的语音特征值与该映射关系中的语音特征值进行匹配,匹配程度可用置信度来表征,匹配程度越高则置信度越高。如果识别得到的语音特征值与该映射关系中的某些语音特征值的置信度高于设定阈值,则可从其中选取置信度最高的语音特征值,将选取出的置信度最高的语音特征值所对应的操作指令确定为识别到的操作指令。
S202中,根据所请求执行的操作指令的类型以及所处的场景,判断所处的场景是否是与执行该类型的该操作指令相匹配的场景,若判定为是,则转入S203,否则转入S204。其中,判断所处的场景是否是与执行该类型的该操作指令相匹配的场景的方法,可参见前述实施例的描述。
其中,“场景”用于描述当前的应用程序执行情况。举例来说,场景可以描述为:处于导航应用程序所执行的流程,或者处于导航应用程序中的地图查询业务流程,或者未处于任何应用程序所执行的流程。其中,“所处的场景”是指当前的场景,更具体地,可包括语音输入时的场景、语音识别时的场景或者根据识别出的语音得到所请求执行的操作指令时的场景。
一个操作指令可以对应一个或多个类型。在一些例子中,一个操作指令所对应的类型,可通过标签的方式进行设置,即,一个操作指令如果对应第一类型,则可为该操作指令设置一个标签,该标签用于指示该操作指令对应第一类型。如果一个操作指令对应多个操作类型,则可为该操作指令设置多个标签,其中每个标签对应一个类型。这样,可通过操作指令的标签确定操作指令的类型。在另外的例子中,也可设置第一类型操作指令列表(该列表与第一类型对应)、第二类型操作指令列表(该列表与第二类型对应)、第三类型操作指令列表(该列表与第三类型对应),每个列表中包括相应类型的操作指令,一个列表中的操作指令的类型均相同。这样,在识别出操作指令后,可查询各个列表,如果某个列表中包括该操作指令,则该列表所对应的类型即为该操作指令的类型。
S203中,执行所请求的操作指令。
S204中,根据所请求的操作指令和/或所处的场景输出匹配的语音提示信息。可选地,所述匹配的语音提示信息,可用于引导从当前所处的场景切换到与所请求的操作指令相匹配的场景,这样可在切换到的目标场景下执行所请求的操作指令。所述匹配的语音提示信息还可用于引导输入与当前所处的场景匹配的操作指令,这样可以在用户重新输入正确的操作指令后在当前场景下执行该操作指令。所述匹配的语音提示信息也可以将输出上述两种语音提示信息,供用户进行选择。
可选地,S201中,在对输入的语音进行识别时,若得到的所请求执行的操作指令的识别置信度低于设定阈值,则可输出用于引导重新输入操作指令的语音提示信息。比如,对输入的语音进行识别,得到语音特征值后,将该语音特征值与“操作指令与语音特征值的映射关系”中的语音特征值进行匹配,其中置信度最高的语音特征值,其置信度低于设定阈值,则为了保证操作指令执行的准确性,可不执行该置信度最高的语音特征值所对应的操作指令,而是通过语音提示用户重新输入操作指令,或者引导用户输入正确的操作指令。
可选地,有些操作指令中可包括数据,比如用户输入语音“打电话给Jack”,通过语音识别以及语义解析,可以得到“打电话”对应的操作指令,而联系人名称“Jack”则为该操作指令对应的数据。在这种情况下,若判定所请求执行的操作指令中包括的数据为非法数据,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。仍以用户输入语音“打电话给Jack”为例,若根据该联系人姓名“Jack”未从通讯录中查找到对应的联系人相关信息,则可认为联系人姓名“Jack”为非法数据,此种情况下,可输出“在通讯录中没有找到Jack,请说出联系人姓名”,还可进一步输出“请说出被叫电话号码”的语音提示,从而引导用户输入正确的联系人或输入被叫电话号码。
可选地,在有些应用程序的业务流程中,为执行某个操作指令,需要用户输入该操作指令对应的数据。比如,在短消息应用程序中,若用户输入语音“发送短消息给Tom”,则开启短消息发送流程,此时可输出“请说短消息内容”以提示用户输入短消息内容,并对用户在该提示信息之后输入的语音进行识别,并将识别结果作为“发送短消息”指令所对应的数据(即短消息内容),从而将该数据通过短消息发送给联系人“Tom”。
可选地,在一些实施例中,用户输入语音可能是操作指令对应的数据(如语音中未包含指令关键字),比如用户输入的语音为某个联系人的姓名或某首歌的歌名,在这种情况下,可包括以下处理方式:
处理方式1:如果当前正在执行某个应用程序(该应用程序支持语音引导并开启了该功能),则终端设备可判断识别得到的数据是否是该应用程序所对应的合法数据,若是当前应用程序对应的合法数据,则确定该数据所对应的在当前应用程序中的操作指令,并采用前述方式判断当前的场景下是否可执行该操作指令,并根据判断结果进行处理;若是非法数据,则可输出语音提示。其中,针对某个应用程序所对应的数据,其所对应的操作指令可预先设定。比如,针对导航应用程序,将输入的数据视为地名,并且地名所对应的操作指令包括“导航”指令,用于执行以该地名为目的地名称的导航流程)。再比如,针对音乐播放流程,将输入的数据视为歌名,并且歌名所对应的操作指令包括“播放”指令,用于播放该歌名对应的歌曲。
处理方式2:如果当前未执行任何支持语音引导功能的应用程序,则终端设备可根据支持语音引导功能的应用程序,判断识别得到的数据是否是这些应用程序所对应的合法数据;若该数据是这些应用程序中唯一一个应用程序所对应的合法数据,则参照上述处理方式1的描述进行处理;若该数据是这些应用程序中多个应用程序所对应的合法数据,则可输出语音提示,以请求用户确认想要执行这些应用程序中的哪个应用程序中的操作指令,并根据对用户输入的用于确认上述询问内容的语音识别结果确定出用户请求执行哪个应用程序所对应的操作指令后,采用前述方式判断当前的场景下是否可执行该操作指令,并根据判断结果进行处理;若针对这些支持语音引导功能的应用程序来说,用户输入的数据是非法数据,则可输出引导用户输入正确的操作指令或正确的数据的语音提示信息。
在针对上述处理方式1或处理方式2的一个例子中,支持语音引导的应用程序包括:导航应用程序、音乐播放应用程序,并且电子地图中存在名为“东方明珠”的地方,音乐列表中包括名为“东方明珠”的歌曲。用户输入“东方明珠”的语音,终端设备在识别出“东方明珠”后,未匹配到对应的操作指令,因此将其作为数据进行如下处理过程:
情况1:如果当前场景中,导航应用程序和音乐播放应用程序均未开启,则终端设备一方面将该数据作为导航应用程序对应的地名,查询电子地图,并查询到该地名,另一方面,终端设备将该数据作为音乐播放音乐程序对应的歌名查询音乐列表,并查询到该歌名;这种情况下,该终端设备输出语音“请说导航到东方明珠或者播放歌曲东方明珠”,或者输出语音“请说导航或听音乐”;如果用户输入语音“导航到东方明珠”或“导航”,则在基于该操作指令的类型判断允许执行该操作指令的情况下,开启导航流程并以“东方明珠”为目的地进行导航,如果用户输入语音“播放歌曲东方明珠”或“听音乐”,则在基于该操作指令的类型判断允许执行该操作指令的情况下,开启音乐播放流程并播放名称为“东方明珠”的歌曲。
情况2:如果当前场景中,导航应用程序开启而音乐播放应用程序未开启,则终端设备将该数据作为导航应用程序对应的地名,查询电子地图,并查询到该地名,然后以“东方明珠”为目的地进行导航。
情况3:如果当前场景中,音乐播放应用程序开启而导航应用程序未开启,则终端设备作为音乐播放音乐程序对应的歌名查询音乐列表,并查询到该歌名,然后播放名称为“东方明珠”的歌曲。
可以看出,本申请实施例中,一方面将操作指令进行了分类,并针对各类型定义了允许操作指令执行的场景,从而可以根据操作指令对应的类型以及当前所处的场景,智能化地确定是否执行语音识别出的操作指令,提供了更精细和更有效的操作指令处理方法;另一方面,在判断为异常时(如无法执行操作指令),可根据操作指令的类型和/或当前所处的场景,输出相匹配的语音提示信息,从而有效引导用户更准确或更快捷地输入正确的操作指令。
可选地,考虑到语音识别的过程中可能存在各种识别结果,比如可能识别为空或者识别为杂音等,针对这些情况,本申请实施例还提供了相应的解决方案,以根据不同的情况有效引导用户进行语音输入。
为了更清楚地理解本申请实施例,下面结合图3至图7进一步进行详细说明。
图3示例性地示出了本申请实施例提供的基于语音识别的处理流程,该流程可由操作指令处理装置执行,比如上述的车载终端。如图所示,该流程可包括:根据对输入的语音的识别结果,判断输入的语音是否为空(S301),若为空,则输出用于引导用户说话的语音提示信息(S302),否则判断语音识别结果的置信度是否大于设定阈值(S303)。若置信度小于设定阈值则输出用于引导用户说出正确操作信令的语音提示信息(S304),否则判断识别结果是否为操作指令(S305),若判断识别结果为操作指令,则确定操作指令的类型(S306)。若操作指令的类型为第三类型,则执行流程400,若操作指令的类型为第二类型,则执行流程500,若操作指令的类型为第一类型,则执行流程600。若在S305中判定识别结果为数据,则执行流程700。
图4示例性地示出了本申请实施例中第三类型操作指令处理流程示意图,该流程可包括:
判断所处的场景是否是应用程序中能够响应所请求执行的第三类型操作指令的应用程序中的用户界面(S401),则判定为是,则执行该第三类型操作指令(S402),否则输出用于引导用户输入与当前场景匹配的操作指令的语音提示信息,和/或输出用于提示用户在哪种场景下才能执行该操作指令的语音提示信息(S403)。其中,S401中的具体判断方法可参见前述实施例,在此不再重复。
图5示例性地示出了本申请实施例中第二类型操作指令处理流程示意图,该流程可包括:
判断当前是否处于所请求执行的第二类型操作指令对应的应用程序所执行的流程中(S501),若判定为是,则进一步判断是否处于所请求执行的第二类型操作指令对应的业务流程中(S502),否则输出用于提示输入的指令为无效指令的语音提示信息,并可进一步输出用于引导用户输入正确的指令的语音提示信息(S503)。
若在S502中判定为是,则执行所请求执行的第二类型操作指令(S504),否则判断所请求执行的操作指令对应的业务流程的处理优先级是否高于当前业务流程的处理优先级(S505),若是,则执行所请求执行的第二类型操作指令(S506),否则输出用于引导输入正确操作指令的语音提示信息(S507)。
图6示例性地示出了本申请实施例中第一类型操作指令处理流程示意图,该流程可包括:
判断当前是否处于某一应用程序所执行的流程中(S601),若判定为是,则进一步判断该应用程序是否是所请求执行的第一类型操作指令对应的应用程序(S602),若是,则执行所请求执行的第一类型操作指令(S603),否则判断所请求执行的操作指令对应的应用程序的处理优先级是否高于当前应用程序所执行的流程的处理优先级(S604),若是,则执行所请求执行的第二类型操作指令(S605),否则输出用于引导输入正确操作指令的语音提示信息(S606)。若在S601中判定为否,则执行所请求执行的第一类型操作指令(S607)。
图7示例性地示出了本申请实施例中针对输入的数据的处理流程示意图,该流程可包括:
判断语音识别结果是否是支持语音引导的应用程序所对应的合法数据(S701),若是合法数据,则判断当前场景是否是处于某个支持语音应用程序所执行的流程(S702),若在某个应用程序执行的流程中(为描述方便此处称为第一应用程序),则识别得到的数据是否是该第一应用程序对应的数据(S703),若是该第一应用程序对应的数据,则确定该数据对应的在该第一应用程序中的操作指令,并在判断当前所处的场景下允许执行该操作指令的情况下(具体判断方法可参见前述实施例),执行该操作指令(S704)。
若在S702中,判定当前未处于任何支持语音引导应用程序所执行的流程,则判断识别得到的数据是支持语音引导的应用程序中的一个应用程序的数据(为描述方便此处将该“一个应用程序”称为第一应用程序),还是多个应用程序的合法数据(S705),若是第一应用程序的合法数据,则确定该数据对应的在该第一应用程序中的操作指令,并在判断当前所处的场景下允许执行该操作指令的情况下(具体判断方法可参见前述实施例),执行该操作指令(S704)。若是多个应用程序的合法数据,则输出用于引导用户在该多个应用程序中进行选择的语音提示信息(S706)。
若在S703中,判定识别出的数据不是当前应用程序对应的数据,即为当前未执行的应用程序对应的数据(为描述方便,此处将当前应用程序称为第一应用程序,将所述数据对应的“当前未执行的应用程序”称为第二应用程序),则判断第二应用程序的处理优先级是否高于第一应用程序的处理优先级(S708),若判定为是,则确定该数据在该第二应用程序中对应的操作指令,并在判断当前所处的场景下允许执行该操作指令的情况下(具体判断方法可参见前述实施例),执行该操作指令(S709);否则,输出用于引导输入正确操作指令的语音提示信息(S710)。
若在S701中,判定识别出的数据不是支持语音引导的应用程序所对应的合法数据,则输出用于引导输入合法数据或正确的操作指令的语音提示信息(S711)。
可选地,在一些实施例中,在判断在所处的场景下可执行所请求执行的操作指令后,可进一步判断所请求执行的操作指令是否需要在联网状态下执行,若是,则还判断当前网络是否可用,若可用,则执行所请求执行的操作指令。其中,“网络可用”是指当前处于联网状态,或者当前处于联网状态且满足设定要求,比如当前的网络连接类型为无线局域网连接,和/或当前网络信号强度大于设定阈值等。
可选地,本申请实施例中,一个操作指令对应一个或多个类型。当所请求执行的操作指令属于多个类型时,可按照处理优先级顺序选取所属的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所请求执行的操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述所请求执行的操作指令相匹配的场景;若判定为是,则执行所述所请求执行的操作指令;若判定为不是且当前类型不是所述所请求执行的操作指令所属的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述所请求执行的操作指令所属的多个类型中的下一个类型作为当前类型;若判定为不是且当前类型为所述所请求执行的操作指令所属的多个类型中的最后一个类型,则根据所述所请求执行的操作指令和/或所述所处的场景输出匹配的语音提示信息。其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
基于相同的技术构思,本申请实施例还提供了一种操作指令处理装置。
参见图8,为本申请实施例提供的操作指令处理装置的结构示意图。该装置可以是前述的电子设备,也可以是该电子设备中的功能模块。该装置可包括:识别模块801、判断模块802、处理模块803,其中:
识别模块801,用于对输入的语音进行识别,得到所请求执行的操作指令;
判断模块802,用于根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
处理模块803,用于在所述判断模块判定为是时,执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。
可选地,所述匹配的语音提示信息,用于引导从所述所处的场景切换到与所述操作指令相匹配的场景,和/或用于引导输入与所述所处的场景匹配的操作指令。
可选地,操作指令的类型包括以下之一或多种组合:第一类型、第二类型和第三类型;针对每种类型,对应有执行相应类型操作指令相匹配的场景。
可选地,与执行任一第一类型操作指令相匹配的场景包括:处于以及未处于与所述任一第一类型操作指令对应的应用程序所执行的流程;或者,未处于处理优先级高于所述任一第一类型操作指令的处理优先级的应用程序所执行的流程。
可选地,判断模块802具体用于:若所述所处的场景为:处于与所述第一类型操作指令对应的应用程序所执行的流程,或者未处于与所述第一类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景;或者,若所述所处的场景为:未处于处理优先级高于所述所请求的第一类型操作指令的处理优先级的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景。
可选地,处理模块803具体用于:若所处的场景处于与所述第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所述第一类型操作指令对应的应用程序的处理优先级,则输出用于引导从所述所处的场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。
可选地,与执行任一第二类型操作指令相匹配的场景包括:处于与所述任一第二类型操作指令对应的应用程序中所述任一第二类型操作指令对应的业务流程,或者,处于与所述任一第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于所述任一第二类型操作指令对应的业务流程的处理优先级;其中,一个应用程序中包括一个或多个业务流程,一个业务流程对应一个或多个第二类型指令。
可选地,判断模块802具体用于:若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景;或者,若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,且在该应用程序所执行的流程中,所处的业务流程的处理优先级低于所述第二类型操作指令对应的业务流程的处理优先级,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景。
可选地,处理模块803具体用于:若所处的场景处于与所述第二类型操作指令对应的应用程序所执行的流程中,但所处的业务流程的处理优先级高于所述第一类型操作指令对应的业务流程的处理优先级,则输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述第二类型操作指令对应的业务流程。
可选地,与执行任一第三类型操作指令相匹配的场景包括:处于应用程序的指定用户界面,所述指定用户界面能够响应所述任一第一类型操作指令。
可选地,判断模块802具体用于:若所处的场景是应用程序中能够响应所述第三类型操作指令的应用程序中的用户界面,则判定所述所处的场景是与执行所述第三类型操作指令相匹配的场景。
可选地,一个操作指令对应一个或多个类型;判断模块802具体用于:所述操作指令对应多个类型时,按照处理优先级顺序选取所述操作指令对应的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所述操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则指示处理模块803执行所述操作指令;
若判定为不是且当前类型不是所述操作指令对应的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述操作指令所对应的多个类型中的下一个类型作为当前类型;
若判定为不是且当前类型为所述操作指令所对应的多个类型中的最后一个类型,则指示处理模块803根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
可选地,处理模块803还用于:若所述操作指令中包括数据,则在判定所述操作指令中包括的数据为非法数据的情况下,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。
可选地,处理模块803还用于:若识别模块801对输入的语音进行识别后,得到的所请求执行的操作指令的置信度低于设定阈值,则输出用于引导重新输入操作指令的语音提示信息。
可选地,处理模块803还用于:若所述操作指令为在联网状态下执行的操作指令,则在判断模块802判定所述所处的场景是否是与执行所述操作指令相匹配的场景的情况下,还判断网络是否可用,若可用,则执行所述操作指令。
可选地,处理模块803还用于:若识别模块801对输入的语音进行识别所得到的识别结果为空或者未得到有效的数据或有效的操作指令,则根据所处的场景输出用于引导输入合法数据或合法操作指令的语音提示信息。
可选地,处理模块803还用于:若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为处于第一应用程序所执行的流程,则判断所述数据是否为所述第一应用程序对应的数据;若所述数据是第一应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述第一应用程序中的操作指令;否则,确定所述数据为第二应用程序对应的数据,判断所述第二应用程序的处理优先级是否高于所述第一应用程序的处理优先级,若高于,则在所处的场景允许的情况下执行所述数据对应的在所述第二应用中的操作指令,若不高于,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,处理模块803还用于:若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为未处于任何应用程序所执行的流程,则判断所述数据是一个应用程序对应的合法数据还是多个应用程序对应的数据;若所述数据是一个应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述一个应用程序中的操作指令;若所述数据所多个应用程序对应的数据,则输出用于引导在所述数据所对应的多个应用程序中进行选择的语音提示信息;其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
可选地,判断模块802还用于:在识别模块801得到所请求执行的操作指令之后,获取所述操作指令对应的标签,根据所述操作指令的标签确定所述操作指令的类型;其中,所述标签用于指示所述操作指令对应的类型;或者,判断模块802还用于:在识别模块801得到所请求执行的操作指令之后,确定所述操作指令所在的指令列表,根据所述指令列表对应的操作指令类型,确定所述操作指令对应的类型;其中,一个指令列表对应一个操作类型,一个指令列表用于存储同一类型的操作指令。
基于相同的技术构思,本申请实施例还提供了一种装置900,该装置900可实现前述实施例描述的流程。
图9示例性地示出了根据各种实施例的示例装置900。装置900可包括一个或多个处理器902,系统控制逻辑901耦合于至少一个处理器902,非易失性存储器(non-volatilememory,NMV)/存储器904耦合于系统控制逻辑901,网络接口906耦合于系统控制逻辑901。
处理器902可包括一个或多个单核处理器或多核处理器。处理器902可包括任何一般用途处理器或专用处理器(如图像处理器、应用处理器基带处理器等)的组合。
一个实施例中的系统控制逻辑901,可包括任何适当的接口控制器,以提供到处理器902中的至少一个的任何合适的接口,和/或提供到与系统控制逻辑901通信的任何合适的设备或组件的任何合适的接口。
一个实施例中的系统控制逻辑901,可包括一个或多个内存控制器,以提供到系统内存的接口。系统内存903用来加载以及存储数据和/或指令。例如,对应装置900,在一个实施例中,系统内存903可包括任何合适的易失性存储器。
NVM/存储器904可包括一个或多个有形的非暂时的计算机可读介质,用于存储数据和/或指令。例如,NVM/存储器904可包括任何合适的非易失性存储装置,如一个或多个硬盘(hard disk device,HDD),一个或多个光盘(compact disk,CD),和/或一个或多个数字通用盘(digital versatile disk,DVD)。
NVM/存储器904可包括存储资源,该存储资源物理上是该系统所安装的或者可以被访问的设备的一部分,但不一定是设备的一部分。例如,NVM/存储器904可经由网络接口906被网络访问。
系统内存903以及NVM/存储器904可分别包括临时的或持久的指令910的副本。指令910可包括当由处理器902中的至少一个执行时导致装置900实现图2至图7所描述的方法之一或组合的指令。各实施例中,指令910或硬件、固件,和/或软件组件可另外地/可替换地被置于系统控制逻辑901,网络接口906和/或处理器902。
网络接口906可包括一个接收器来为装置900提供无线接口来与一个或多个网络和/或任何合适的设备进行通信。网络接口906可包括任何合适的硬件和/或固件。网络接口906可包括多个天线来提供多输入多输出无线接口。在一个实施例中,网络接口906可包括一个网络适配器、一个无线网络适配器、一个电话调制解调器,和/或无线调制解调器。
在一个实施例中,处理器902中的至少一个可以与用于系统控制逻辑的一个或多个控制器的逻辑一起封装。在一个实施例中,处理器中的至少一个可以与用于系统控制逻辑的一个或多个控制器的逻辑一起封装以形成系统级封装。在一个实施例中,处理器中的至少一个可以与用于系统控制逻辑的一个或多个控制器的逻辑集成在相同的管芯上。在一个实施例中,处理器中的至少一个可以与用于系统控制逻辑的一个或多个控制器的逻辑集成在相同的管芯上以形成系统芯片。
装置900可进一步包括输入/输出装置905。输入/输出装置905可包括用户接口旨在使用户与装置900进行交互,可包括外围组件接口,其被设计为使得外围组件能够与系统交互,和/或,可包括传感器,旨在确定环境条件和/或有关装置900的位置信息。

Claims (40)

1.一种操作指令处理方法,其特征在于,包括:
对输入的语音进行识别,得到所请求执行的操作指令;
根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。
2.如权利要求1所述的方法,其特征在于,所述匹配的语音提示信息,用于引导从所述所处的场景切换到与所述操作指令相匹配的场景,和/或用于引导输入与所述所处的场景匹配的操作指令。
3.如权利要求1或2所述的方法,其特征在于,操作指令的类型包括以下之一或多种组合:第一类型、第二类型和第三类型;针对每种类型,对应有执行相应类型操作指令相匹配的场景。
4.如权利要求3所述的方法,其特征在于,与执行任一第一类型操作指令相匹配的场景包括:处于以及未处于与所述任一第一类型操作指令对应的应用程序所执行的流程;或者,未处于处理优先级高于所述任一第一类型操作指令的处理优先级的应用程序所执行的流程。
5.如权利要求4所述的方法,其特征在于,若所述操作指令为第一类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:
若所述所处的场景为:处于与所述第一类型操作指令对应的应用程序所执行的流程,或者未处于与所述第一类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景;或者,
若所述所处的场景为:未处于处理优先级高于所述所请求的第一类型操作指令的处理优先级的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景。
6.如权利要求5所述的方法,其特征在于,根据所述操作指令和所述所处的场景输出匹配的提示信息,包括:
若所处的场景处于与所述第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所述第一类型操作指令对应的应用程序的处理优先级,则输出用于引导从所述所处的场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。
7.如权利要求3所述的方法,其特征在于,与执行任一第二类型操作指令相匹配的场景包括:处于与所述任一第二类型操作指令对应的应用程序中所述任一第二类型操作指令对应的业务流程,或者,处于与所述任一第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于所述任一第二类型操作指令对应的业务流程的处理优先级;其中,一个应用程序中包括一个或多个业务流程,一个业务流程对应一个或多个第二类型指令。
8.如权利要求7所述的方法,其特征在于,若所述操作指令为第二类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:
若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景;或者,
若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,且在该应用程序所执行的流程中,所处的业务流程的处理优先级低于所述第二类型操作指令对应的业务流程的处理优先级,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景。
9.如权利要求8所述的方法,其特征在于,根据所述操作指令和所述所处的场景输出匹配的提示信息,包括:
若所处的场景处于与所述第二类型操作指令对应的应用程序所执行的流程中,但所处的业务流程的处理优先级高于所述第一类型操作指令对应的业务流程的处理优先级,则输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述第二类型操作指令对应的业务流程。
10.如权利要求3所述的方法,其特征在于,与执行任一第三类型操作指令相匹配的场景包括:处于应用程序的指定用户界面,所述指定用户界面能够响应所述任一第一类型操作指令。
11.如权利要求10所述的方法,其特征在于,若所述操作指令为第三类型操作指令,则根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景,包括:
若所处的场景是应用程序中能够响应所述第三类型操作指令的应用程序中的用户界面,则判定所述所处的场景是与执行所述第三类型操作指令相匹配的场景。
12.如权利要求3所述的方法,其特征在于,一个操作指令对应一个或多个类型;
根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型下的所述操作指令相匹配的场景,若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息,包括:
所述操作指令对应多个类型时,按照处理优先级顺序选取所述操作指令对应的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所述操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则执行所述操作指令;
若判定为不是且当前类型不是所述操作指令所对应的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述操作指令所对应的多个类型中的下一个类型作为当前类型;
若判定为不是且当前类型为所述操作指令所对应的多个类型中的最后一个类型,则根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
13.如权利要求1所述的方法,其特征在于,若所述操作指令中包括数据,则所述方法还包括:
若判定所述操作指令中包括的数据为非法数据,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。
14.如权利要求1所述的方法,其特征在于,还包括:
若对输入的语音进行识别后,得到的所请求执行的操作指令的置信度低于设定阈值,则输出用于引导重新输入操作指令的语音提示信息。
15.如权利要求1所述的方法,其特征在于,若所述操作指令为在联网状态下执行的操作指令,则在判定所述所处的场景是否是与执行所述操作指令相匹配的场景的情况下,还判断网络是否可用,若可用,则执行所述操作指令。
16.如权利要求1所述的方法,其特征在于,还包括:
若对输入的语音进行识别所得到的识别结果为空或者未得到有效的数据或有效的操作指令,则根据所处的场景输出用于引导输入合法数据或合法操作指令的语音提示信息。
17.如权利要求1所述的方法,其特征在于,若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则还包括:
若所处的场景为处于第一应用程序所执行的流程,则判断所述数据是否为所述第一应用程序对应的数据;若所述数据是第一应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述第一应用程序中的操作指令;否则,确定所述数据为第二应用程序对应的数据,判断所述第二应用程序的处理优先级是否高于所述第一应用程序的处理优先级,若高于,则在所处的场景允许的情况下执行所述数据对应的在所述第二应用中的操作指令,若不高于,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
18.如权利要求1所述的方法,其特征在于,若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则还包括:
若所处的场景为未处于任何应用程序所执行的流程,则判断所述数据是一个应用程序对应的合法数据还是多个应用程序对应的数据;若所述数据是一个应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述一个应用程序中的操作指令;若所述数据所多个应用程序对应的数据,则输出用于引导在所述数据所对应的多个应用程序中进行选择的语音提示信息;
其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
19.如权利要求1所述的方法,其特征在于,得到所请求执行的操作指令之后,还包括:
获取所述操作指令对应的标签,根据所述操作指令的标签确定所述操作指令的类型;其中,所述标签用于指示所述操作指令对应的类型;或者,
确定所述操作指令所在的指令列表,根据所述指令列表对应的操作指令类型,确定所述操作指令对应的类型;其中,一个指令列表对应一个操作类型,一个指令列表用于存储同一类型的操作指令。
20.一种操作指令处理装置,其特征在于,包括:
识别模块,用于对输入的语音进行识别,得到所请求执行的操作指令;
判断模块,用于根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
处理模块,用于在所述判断模块判定为是时,执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。
21.如权利要求20所述的装置,其特征在于,所述匹配的语音提示信息,用于引导从所述所处的场景切换到与所述操作指令相匹配的场景,和/或用于引导输入与所述所处的场景匹配的操作指令。
22.如权利要求20或21所述的装置,其特征在于,操作指令的类型包括以下之一或多种组合:第一类型、第二类型和第三类型;针对每种类型,对应有执行相应类型操作指令相匹配的场景。
23.如权利要求22所述的装置,其特征在于,与执行任一第一类型操作指令相匹配的场景包括:处于以及未处于与所述任一第一类型操作指令对应的应用程序所执行的流程;或者,未处于处理优先级高于所述任一第一类型操作指令的处理优先级的应用程序所执行的流程。
24.如权利要求23所述的装置,其特征在于,所述判断模块具体用于:
若所述所处的场景为:处于与所述第一类型操作指令对应的应用程序所执行的流程,或者未处于与所述第一类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景;或者,
若所述所处的场景为:未处于处理优先级高于所述所请求的第一类型操作指令的处理优先级的应用程序所执行的流程,则判定所述所处的场景是与执行所述第一类型操作指令相匹配的场景。
25.如权利要求24所述的装置,其特征在于,所述处理模块具体用于:
若所处的场景处于与所述第一类型操作指令对应的应用程序所执行的流程中,但该流程的处理优先级高于所述第一类型操作指令对应的应用程序的处理优先级,则输出用于引导从所述所处的场景切换到与所请求执行的第一类型操作指令匹配的场景的语音提示信息。
26.如权利要求23所述的装置,其特征在于,与执行任一第二类型操作指令相匹配的场景包括:处于与所述任一第二类型操作指令对应的应用程序中所述任一第二类型操作指令对应的业务流程,或者,处于与所述任一第二类型操作指令对应的应用程序所执行的流程中,且所处的业务流程的处理优先级低于所述任一第二类型操作指令对应的业务流程的处理优先级;其中,一个应用程序中包括一个或多个业务流程,一个业务流程对应一个或多个第二类型指令。
27.如权利要求26所述的装置,其特征在于,所述判断模块具体用于:
若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景;或者,
若所处的场景为:处于所述第二类型操作指令对应的应用程序所执行的流程,且在该应用程序所执行的流程中,所处的业务流程的处理优先级低于所述第二类型操作指令对应的业务流程的处理优先级,则判定所述所处的场景是与执行所述第二类型操作指令相匹配的场景。
28.如权利要求27所述的装置,其特征在于,所述处理模块具体用于:
若所处的场景处于与所述第二类型操作指令对应的应用程序所执行的流程中,但所处的业务流程的处理优先级高于所述第一类型操作指令对应的业务流程的处理优先级,则输出用于引导从所处的场景切换到同一应用程序所执行的流程中的相应业务流程的语音提示信息;其中,所述相应业务流程为与所述第二类型操作指令对应的业务流程。
29.如权利要求22所述的装置,其特征在于,与执行任一第三类型操作指令相匹配的场景包括:处于应用程序的指定用户界面,所述指定用户界面能够响应所述任一第一类型操作指令。
30.如权利要求29所述的装置,其特征在于,所述判断模块具体用于:
若所处的场景是应用程序中能够响应所述第三类型操作指令的应用程序中的用户界面,则判定所述所处的场景是与执行所述第三类型操作指令相匹配的场景。
31.如权利要求22所述的装置,其特征在于,一个操作指令对应一个或多个类型;
所述判断模块具体用于:所述操作指令对应多个类型时,按照处理优先级顺序选取所述操作指令对应的多个类型中的一个类型作为当前类型后针对当前类型执行以下步骤:
根据所述操作指令所属的当前类型以及所处的场景确定所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;
若判定为是,则指示所述处理模块执行所述操作指令;
若判定为不是且当前类型不是所述操作指令对应的多个类型中的最后一个类型,则按照所述处理优先级顺序选取所述操作指令所对应的多个类型中的下一个类型作为当前类型;
若判定为不是且当前类型为所述操作指令所对应的多个类型中的最后一个类型,则指示所述处理模块根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所述处理优先级顺序从高到低为:第三类型、第二类型、第一类型。
32.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若所述操作指令中包括数据,则在判定所述操作指令中包括的数据为非法数据的情况下,则输出所述数据为非法数据的语音提示信息,和/或输出用于引导输入适应于所请求执行的操作指令的合法数据的语音提示信息。
33.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若所述识别模块对输入的语音进行识别后,得到的所请求执行的操作指令的置信度低于设定阈值,则输出用于引导重新输入操作指令的语音提示信息。
34.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若所述操作指令为在联网状态下执行的操作指令,则在所述判断模块判定所述所处的场景是否是与执行所述操作指令相匹配的场景的情况下,还判断网络是否可用,若可用,则执行所述操作指令。
35.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若所述识别模块对输入的语音进行识别所得到的识别结果为空或者未得到有效的数据或有效的操作指令,则根据所处的场景输出用于引导输入合法数据或合法操作指令的语音提示信息。
36.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为处于第一应用程序所执行的流程,则判断所述数据是否为所述第一应用程序对应的数据;若所述数据是第一应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述第一应用程序中的操作指令;否则,确定所述数据为第二应用程序对应的数据,判断所述第二应用程序的处理优先级是否高于所述第一应用程序的处理优先级,若高于,则在所处的场景允许的情况下执行所述数据对应的在所述第二应用中的操作指令,若不高于,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息;
其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
37.如权利要求20所述的装置,其特征在于,所述处理模块还用于:
若对输入的语音进行识别得到的结果为应用程序对应的合法数据,则若所处的场景为未处于任何应用程序所执行的流程,则判断所述数据是一个应用程序对应的合法数据还是多个应用程序对应的数据;若所述数据是一个应用程序对应的数据,则在所处的场景允许的情况下执行所述数据对应的在所述一个应用程序中的操作指令;若所述数据所多个应用程序对应的数据,则输出用于引导在所述数据所对应的多个应用程序中进行选择的语音提示信息;
其中,所处的场景允许的情况包括:根据操作指令的类型以及所处的场景,判断所述所处的场景是与执行所述类型的所述操作指令相匹配的场景。
38.如权利要求20所述的装置,其特征在于,所述判断模块还用于:在所述识别模块得到所请求执行的操作指令之后,获取所述操作指令对应的标签,根据所述操作指令的标签确定所述操作指令的类型;其中,所述标签用于指示所述操作指令对应的类型;或者,
所述判断模块还用于:在所述识别模块得到所请求执行的操作指令之后,确定所述操作指令所在的指令列表,根据所述指令列表对应的操作指令类型,确定所述操作指令对应的类型;其中,一个指令列表对应一个操作类型,一个指令列表用于存储同一类型的操作指令。
39.一种通信装置,其特征在于,包括:一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行如权利要求1至19中任一项所述的方法。
40.一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被一个或多个处理器执行时,使得通信设备执行如权利要求1至19中任一项所述的方法。
CN201710082715.XA 2017-02-15 2017-02-15 一种操作指令处理方法及装置 Active CN108428450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710082715.XA CN108428450B (zh) 2017-02-15 2017-02-15 一种操作指令处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710082715.XA CN108428450B (zh) 2017-02-15 2017-02-15 一种操作指令处理方法及装置

Publications (2)

Publication Number Publication Date
CN108428450A true CN108428450A (zh) 2018-08-21
CN108428450B CN108428450B (zh) 2021-10-22

Family

ID=63155651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710082715.XA Active CN108428450B (zh) 2017-02-15 2017-02-15 一种操作指令处理方法及装置

Country Status (1)

Country Link
CN (1) CN108428450B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493865A (zh) * 2018-10-17 2019-03-19 北京车和家信息技术有限公司 信号处理方法、终端及车辆
CN109524010A (zh) * 2018-12-24 2019-03-26 出门问问信息科技有限公司 一种语音控制方法、装置、设备及存储介质
CN109726000A (zh) * 2018-12-29 2019-05-07 苏州思必驰信息科技有限公司 多应用视图的管理方法、用于多应用视图的管理的装置及操作方法
CN110475069A (zh) * 2019-09-03 2019-11-19 腾讯科技(深圳)有限公司 图像的拍摄方法及装置
CN110517690A (zh) * 2019-08-30 2019-11-29 四川长虹电器股份有限公司 语音控制功能的引导方法及系统
CN111161734A (zh) * 2019-12-31 2020-05-15 苏州思必驰信息科技有限公司 基于指定场景的语音交互方法及装置
CN111552794A (zh) * 2020-05-13 2020-08-18 海信电子科技(武汉)有限公司 提示语生成方法、装置、设备和存储介质
CN111798842A (zh) * 2019-04-03 2020-10-20 现代自动车株式会社 对话系统和对话处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512483A (zh) * 2002-12-27 2004-07-14 联想(北京)有限公司 一种状态转换的实现方法
CN103187055A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 基于车载应用的数据处理系统
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
CN104240700A (zh) * 2014-08-26 2014-12-24 智歌科技(北京)有限公司 一种面向车载终端设备的全局语音交互方法及系统
KR20150078500A (ko) * 2013-12-30 2015-07-08 정관선 음성을 이용한 스마트단말 어플 실행 방법, 그리고 음성을 이용한 어플 실행 기능을 구비한 스마트단말
CN105551488A (zh) * 2015-12-15 2016-05-04 深圳Tcl数字技术有限公司 语音控制方法及系统
CN106373570A (zh) * 2016-09-12 2017-02-01 深圳市金立通信设备有限公司 一种语音控制方法及终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512483A (zh) * 2002-12-27 2004-07-14 联想(北京)有限公司 一种状态转换的实现方法
CN103187055A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 基于车载应用的数据处理系统
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
KR20150078500A (ko) * 2013-12-30 2015-07-08 정관선 음성을 이용한 스마트단말 어플 실행 방법, 그리고 음성을 이용한 어플 실행 기능을 구비한 스마트단말
CN104240700A (zh) * 2014-08-26 2014-12-24 智歌科技(北京)有限公司 一种面向车载终端设备的全局语音交互方法及系统
CN105551488A (zh) * 2015-12-15 2016-05-04 深圳Tcl数字技术有限公司 语音控制方法及系统
CN106373570A (zh) * 2016-09-12 2017-02-01 深圳市金立通信设备有限公司 一种语音控制方法及终端

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493865A (zh) * 2018-10-17 2019-03-19 北京车和家信息技术有限公司 信号处理方法、终端及车辆
CN109524010A (zh) * 2018-12-24 2019-03-26 出门问问信息科技有限公司 一种语音控制方法、装置、设备及存储介质
CN109726000A (zh) * 2018-12-29 2019-05-07 苏州思必驰信息科技有限公司 多应用视图的管理方法、用于多应用视图的管理的装置及操作方法
CN111798842A (zh) * 2019-04-03 2020-10-20 现代自动车株式会社 对话系统和对话处理方法
CN111798842B (zh) * 2019-04-03 2024-03-26 现代自动车株式会社 对话系统和对话处理方法
CN110517690A (zh) * 2019-08-30 2019-11-29 四川长虹电器股份有限公司 语音控制功能的引导方法及系统
CN110475069A (zh) * 2019-09-03 2019-11-19 腾讯科技(深圳)有限公司 图像的拍摄方法及装置
CN111161734A (zh) * 2019-12-31 2020-05-15 苏州思必驰信息科技有限公司 基于指定场景的语音交互方法及装置
CN111552794A (zh) * 2020-05-13 2020-08-18 海信电子科技(武汉)有限公司 提示语生成方法、装置、设备和存储介质
CN111552794B (zh) * 2020-05-13 2023-09-19 海信电子科技(武汉)有限公司 提示语生成方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN108428450B (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN108428450A (zh) 一种操作指令处理方法及装置
US11721320B2 (en) Method and user device for providing context awareness service using speech recognition
US9111538B2 (en) Genius button secondary commands
US6892067B1 (en) Script based interfaces for mobile phones
CN102842306B (zh) 语音控制方法及装置、语音响应方法及装置
CN108133707A (zh) 一种内容分享方法及系统
CN1617559B (zh) 顺序多模输入
CN102209143B (zh) 电话服务交互管理
US11762629B2 (en) System and method for providing a response to a user query using a visual assistant
CN106976434B (zh) 用于车辆中的语音识别设备的装置及方法
CN103716454A (zh) 利用语音识别执行预设操作模式的方法和设备
CN110459222A (zh) 语音控制方法、语音控制装置及终端设备
CN102184254A (zh) 移动联系人备注
CN107370772A (zh) 账号登录方法、装置及计算机可读存储介质
CN105100449B (zh) 一种图片分享方法及移动终端
CN110265013A (zh) 语音的识别方法及装置、计算机设备、存储介质
CN108199942A (zh) 汽车诊断方法、装置、设备、系统和诊断连接设备
CN110708430A (zh) 一种通话管理方法、通信终端及存储介质
CN108682421A (zh) 一种语音识别方法、终端设备及计算机可读存储介质
CN112529585A (zh) 风险交易的交互唤醒方法、装置、设备及系统
CN109933199A (zh) 基于手势的控制方法、装置、电子设备及存储介质
CN103825633A (zh) 在基于车辆的计算系统和远程应用之间通信的方法和设备
CN107016991A (zh) 处理语音命令
EP2923448B1 (en) Contact prioritized communication for voice commands
CN107862035A (zh) 会议记录的网络读取方法、装置、智能平板和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201214

Address after: Room 603, 6 / F, Roche Plaza, 788 Cheung Sha Wan Road, Kowloon, China

Applicant after: Zebra smart travel network (Hong Kong) Limited

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant