CN110223682B - 一种语音指令仲裁方法和装置 - Google Patents

一种语音指令仲裁方法和装置 Download PDF

Info

Publication number
CN110223682B
CN110223682B CN201910355774.9A CN201910355774A CN110223682B CN 110223682 B CN110223682 B CN 110223682B CN 201910355774 A CN201910355774 A CN 201910355774A CN 110223682 B CN110223682 B CN 110223682B
Authority
CN
China
Prior art keywords
voice
voice command
application program
operating system
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910355774.9A
Other languages
English (en)
Other versions
CN110223682A (zh
Inventor
罗序斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Original Assignee
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apollo Intelligent Connectivity Beijing Technology Co Ltd filed Critical Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority to CN201910355774.9A priority Critical patent/CN110223682B/zh
Publication of CN110223682A publication Critical patent/CN110223682A/zh
Application granted granted Critical
Publication of CN110223682B publication Critical patent/CN110223682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种语音指令仲裁方法和装置,属于计算机技术领域。所述语音指令仲裁方法包括获取语音数据;识别所述获取到的语音数据,得到与所述语音数据对应的语音指令;以及询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令,如果需要,则将所述语音指令对应的回调函数发送给所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个。本申请的一种语音指令仲裁方法和装置,通过统一执行语音数据的录音、识别和解析,以及分级执行语音指令的仲裁和分发,即提高了代码的复用性,又降低了代码的复杂程度,提高语音指令的处理效率。

Description

一种语音指令仲裁方法和装置
技术领域
本发明涉及计算机技术领域,具体地涉及一种语音指令仲裁方法和装置。
背景技术
现有技术处理语音指令的方法主要分为两大类,一类是每个用到语音识别功能的App自己执行录音、消噪、识别、解析和响应等一整套语音服务流程,虽然App也可以通过集成第三方的语音SDK(Software Development Kit,软件开发工具包)来实现上述流程,但这样大部分逻辑仍然是封装在SDK里面来实现的,本质和App自己执行整个流程是一样的,相同功能的代码不能复用,造成代码的浪费。
另外一类是在系统层有统一的语音服务模块,能够在系统级底层来统一处理录音、消噪、识别和解析等流程,然后把语音指令通过一个指令分发中心分发到对应的APP去执行,但是,这样语音指令的解析和分发全部集中在语音服务模块处理,导致模块代码臃肿,业务复杂,且需要经常对代码进行维护。
发明内容
本发明实施例的目的是提供了一种语音指令仲裁方法和装置,该方法能够统一执行语音数据的获取、识别和解析,并且能够分级的执行语音指令的仲裁和分发,实现了代码的复用,提高了语音指令分发的速度和效率。
为了实现上述目的,本发明实施例提供一种语音指令仲裁方法,包括:获取语音数据;识别所述获取到的语音数据,得到与所述语音数据对应的语音指令;以及询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令,如果需要,则将所述语音指令对应的回调函数发送给所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个。
可选的,在接收所述语音指令之后,还包括:
判断输出的所述语音指令是否注册过;
如果注册过,则询问所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个是否需要处理所述语音指令。
可选的,语音指令的注册包括:
接收所述语音指令的注册请求;以及
增加与所述语音指令对应的映射关系。
可选的,所述映射关系包括:所述语音指令和所述语音指令对应的回调函数。
可选的,所述询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令包括:
在所述当前界面已经处理完所述语音指令后,询问所述当前界面是否需要将所述语音指令传递给所述当前应用程序;
在所述当前应用程序已经处理完所述语音指令后,询问所述当前应用程序是否需要将所述语音指令传递给所述操作系统。
可选的,还包括:
当所述操作系统不需要处理所述语音指令时,将所述语音指令丢弃。
另一方面,本发明提供了一种语音指令仲裁装置,包括:
获取模块,用于获取语音数据;
识别模块,用于在识别所述获取到的语音数据后,输出与所述语音数据对应的语音指令;
仲裁模块,用于在接收到所述语音指令后,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令,如果需要,则将所述语音指令对应的回调函数发送给所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个。
可选的,所述仲裁模块还用于,
在接收到所述语音指令之后,判断输出的所述语音指令是否注册过;
如果注册过,则询问所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个是否需要处理所述语音指令。
可选的,所述仲裁模块还用于,
接收所述语音指令的注册请求;以及
增加与所述语音指令对应的映射关系。
可选的,所述映射关系包括:所述语音指令和所述语音指令对应的回调函数。
可选的,所述仲裁模块包括:
询问界面子模块,用于在所述当前界面已经处理完所述语音指令后,询问所述当前界面是否需要将所述语音指令传递给所述当前应用程序;
询问应用子模块,用于在所述当前应用程序已经处理完所述语音指令后,询问所述当前应用程序是否需要将所述语音指令传递给所述操作系统。
可选的,所述仲裁模块还用于当所述操作系统不需要处理所述语音指令时,将所述语音指令丢弃。
另一方面,本发明提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行本申请上述权利要求任一项所述的一种语音指令仲裁方法。
另一方面,本发明提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如上任意一项所述的一种语音指令仲裁方法。
本申请的一种语音指令仲裁方法,通过统一执行语音数据的录音、识别和解析,以及分级执行语音指令的仲裁和分发,即提高了代码的复用性,又降低了代码的复杂程度,提高语音指令的处理效率。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1根据本申请的一个实施例的一种语音指令仲裁方法的流程图;
图2是本申请一些实施例的一种语音指令仲裁方法的方法流程图;
图3是根据本申请一些实施例的一种语音指令仲裁装置的结构框图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
在现有技术的第一种方案中,每个App自己完成语音服务的录音、消噪、识别、解析和响应等一整套复杂的流程,App之间用于实现相同功能的代码不能复用,对代码进行维护的成本高;另外,由于没有统一的仲裁模块,不同应用程序之间容易产生录音资源冲突或者语音指令竞争的问题。
在现有技术的第二种方案中,系统层有统一的语音服务模块,但是语音指令的解析和分发逻辑全部在这个模块处理,导致模块代码臃肿,维护起来复杂,容易出问题。另外,语音服务模块处理语音指令的效率低,每当识别到一个语音指令时,都需要经过一个庞大的语音指令分发中心网络找到语音指令对应的出口之后,才能够使得语音指令获得响应,需要响应时间很长。同时,每次增加或者修改语音指令时,都需要修改模块代码,降低了代码运行的灵活性。
本申请的一种语音指令仲裁方法,通过统一执行语音数据的录音、识别和解析,以及分级执行语音指令的仲裁和分发,即提高了代码的复用性,又降低了统一进行处理的代码的复杂程度,提高语音指令的处理效率。
图1是根据本申请的一个实施例的一种语音指令仲裁方法的流程图,如图1所示,上述方法包括:
S100,获取语音数据;
S200,识别获取到的语音数据后,得到与语音数据对应的语音指令;
S300,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理语音指令,如果需要,则将语音指令对应的回调函数发送给当前界面、当前应用程序和操作系统中的至少一个。
其中,回调函数是一个通过函数指针调用的函数。如果把第一函数的指针或称为地址作为参数传递给第二函数,当这个指针被用来调用其所指向的第一函数时,第二函数就是回调函数。回调函数不是由第一函数的实现方直接调用,而是在特定的事件或条件发生时由第二函数所在方调用的,用于对该事件或条件进行响应。
根据本申请一些实施例,上述操作系统指的是移动操作系统,上述步骤通过三个全局性的模块例如获取模块、识别模块和仲裁模块来实现,对语音数据统一进行获取、识别和解析,以及分级的进行语音指令仲裁和分发,能够降低语音指令分发的复杂度,提高语音指令的处理效率。
根据本申请的一些实施例,当前界面是指当前正在执行的当前应用程序中正在显示的界面,如果询问的当前界面需要处理语音指令,则将语音指令对应的回调函数发送给当前界面。如果询问的当前应用程序需要处理语音指令,则将语音指令对应的回调函数发送给当前应用程序。如果询问的操作系统需要处理语音指令,则将语音指令对应的回调函数发送给操作系统。
根据本申请的一些实施例,在接收语音指令之后,还包括步骤210,判断输出的语音指令是否注册过。其中,语音指令的注册方式包括:接收语音指令的注册请求,增加与语音指令对应的映射关系。其中,映射关系包括语音指令和语音指令对应的回调函数。
在现有技术的第二个方案中,如果应用A要新增、删除或者修改语音指令,则需要修改操作系统语音服务模块的代码逻辑。而本申请中的语音指令的注册可以增加仲裁模块的可扩展性,比如应用A要新增一个语音指令,只需要应用A调用仲裁模块的指令注册接口进行注册就可以了,不需要去修改仲裁模块的代码。
根据本申请的一些实施例,S300包括步骤310和步骤320,其中,
步骤310,在当前界面已经处理完语音指令后,询问当前界面是否需要将语音指令传递给当前应用程序。
步骤320,在当前应用程序已经处理完语音指令后,询问当前应用程序是否需要将语音指令传递给操作系统。
图2是本申请一些实施例的一种语音指令仲裁方法的方法流程图,如图2所示,在上述方法开始运行后,其所执行的步骤如下:
S410,获取模块录制语音数据,并通过软件和/或硬件对语音数据进行降噪处理。
S420,识别模块进行语音识别,输出语音指令。
S430,仲裁模块接收语音指令,进行语音指令的传递和仲裁处理。
其中,S430包括如下步骤:
S431,仲裁模块询问当前应用程序的当前界面是否需要处理该指令。
如果得到的反馈是是,则发送语音指令对应的回调函数给当前界面,当前界面执行步骤S432,当前界面进行语音指令处理。
仲裁模块继续询问当前界面执行步骤S433,是否允许指令继续传递。如果得到的结果是是,则继续执行步骤S434,仲裁模块询问当前应用程序是否需要处理该指令。
如果得到的反馈是是,则发送语音指令对应的回调函数给当前应用程序,当前应用程序执行步骤S435,当前应用程序进行语音指令处理。
仲裁模块继续询问当前应用程序执行步骤S436,是否允许指令继续传递。如果得到的结果是是,则继续执行步骤S437,仲裁模块询问操作系统是否需要处理该语音指令。
如果得到的反馈是是,则发送语音指令对应的回调函数给操作系统,当前应用程序执行步骤S438,操作系统进行语音指令处理。
如果在步骤S431之后,得到的反馈是否,则继续执行步骤S434。
如果在步骤S434之后,得到的反馈是否,则继续执行步骤S437。
如果在步骤S437之后,得到的反馈是否,则执行步骤S439,丢弃该语音指令,一次语音指令仲裁和传递过程结束。
在步骤S433或S436执行完成后,如果不允许指令传递,则一次语音指令仲裁和传递过程结束。
在本申请中询问语音指令是否传递发生在一个语音指令对应多个回调函数的情况,如果出现上述情况,且其中一个回调函数已经发送给了执行对象去处理,且已经由执行对象执行完毕,则由执行对象决定语音指令是否传递,这样一旦语音指令执行的代码需要修改,也只对执行对象的代码进行修改,不需要修改仲裁模块,其中,执行对象指的是当前界面,当前应用程序和操作系统中的至少一个,以及在后台运行的界面,应用程序和操作系统中的至少一个。
图3是根据本申请一些实施例的一种语音指令仲裁装置的结构框图,如图3所示,该语音指令仲裁装置包括获取模块510,识别模块520和仲裁模块530。其中,获取模块510,用于获取语音数据。识别模块520,用于识别获取到的语音数据后,输出与语音数据对应的语音指令。仲裁模块530,在接收到语音指令后,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理语音指令,如果需要,则将语音指令对应的回调函数发送给当前界面、当前应用程序和操作系统中的至少一个。
其中,获取模块510、识别模块520和仲裁模块530均是全局性模块。仲裁模块530还用于在接收语音指令之后,判断输出的语音指令是否注册过。
如果注册过,则询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理语音指令。
仲裁模块530包括询问界面子模块531和询问应用子模块532,其中,询问界面子模块531用于在当前界面已经处理完语音指令后,询问当前界面是否需要将语音指令传递给当前应用程序。询问应用子模块532用于在当前应用程序已经处理完语音指令后,询问当前应用程序是否需要将语音指令传递给操作系统。
根据本申请的一些实施例,仲裁模块接收到语音指令之后,先判断当前应用程序的当前界面是否需要处理该语音指令;如果需要处理则交给当前界面进行处理;当前界面处理完该语音指令之后,当前界面可以决定是否让该语音指令继续沿着传递链传递。
根据本申请的一些实施例,仲裁模块还用于当操作系统不需要处理语音指令时,将语音指令丢弃。
本申请的仲裁模块支持语音指令的注册,并且维护了一条语音指令的传递链条进行指令的传递转发。指令的传递链条增加了语音指令响应的灵活性,让语音指令沿着链条进行传递,也降低了语音分发中心的复杂度,提高了语音指令的处理效率。
根据本申请一个具体的实施例,识别到的语音指令是“放大地图”,如果当前应用程序是百度地图,而且当前界面是百度地图首页,页面中正在展示地图,那当前界面就需要处理“放大地图”的指令;如果当前应用程序是百度地图,但是当前界面停留在搜索页面,界面中没有地图,那当前界面是不需要处理“放大地图”的语音指令的。
根据本申请的一些实施例,如果当前界面不需要处理该语音指令或者当前界面处理完之后允许语音指令继续传递,则语音仲裁模块询问当前应用程序是否需要处理该指令;如果需要处理则交给当前应用程序处理;当前应用程序处理完该语音指令之后,当前应用程序可以决定是否让该指令继续沿着传递链传递。
根据本申请一个具体的实施例,识别到语音指令是“下一首”,如果当前应用程序是百度地图,那当前应用程序是不需要处理“下一首”这个指令的,但是如果当前应用程序是百度音乐,那当前应用程序百度音乐就需要响应“下一首”这个语音指令,切换到下一首歌曲进行播放。
根据本申请的一些实施例,如果当前应用程序不需要处理该语音指令,或者当前应用程序处理完该指令后允许该语音指令继续传递,则语音指令仲裁模块判断操作系统当前是否需要处理该指令;如果需要,则交给操作系统对应模块进行处理;
根据本申请一个具体的实施例,识别到语音指令是“增大音量”,当前应用程序是百度地图,它不需要处理这个指令;然后指令就会传到操作系统层,因为操作系统拥有音量调节控制功能,所以操作系统就会响应“增大音量”的功能。
如果操作系统当前状态也不需要处理该语音指令,在把该语音指令丢弃。
语音指令仲裁装置包括处理器和存储器,上述获取模块、识别模块和仲裁模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来执行对语音数据的处理,以及语音指令的仲裁和分发。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现如上所述的音指令仲裁方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行如上所述的音指令仲裁方法。
本发明实施例提供了一种计算设备,包括存储器和处理器,其中,存储器用于存储程序指令;处理器用于调用所述存储器中存储的程序指令,按照获得的程序执行如上所述的一种语音指令仲裁方法。处理器执行上述方法时实现以下步骤:S100,获取语音数据;S200,识别获取到的语音数据后,输出与语音数据对应的语音指令;以及S300,接收语音指令后,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理语音指令,如果需要,则将语音指令对应的回调函数发送给当前界面、当前应用程序和操作系统中的至少一个。在接收语音指令之后,还包括步骤210,判断输出的语音指令是否注册过。
根据本申请的一些实施例,S300包括,在当前界面已经处理完语音指令后,询问当前界面是否需要将语音指令传递给当前应用程序。在当前应用程序已经处理完语音指令后,询问当前应用程序是否需要将语音指令传递给操作系统。以及当操作系统是不需要处理语音指令时,将语音指令丢弃。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:S100,获取语音数据;S200,识别获取到的语音数据后,输出与语音数据对应的语音指令;S300,接收语音指令后,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理语音指令,如果需要,则将语音指令对应的回调函数发送给当前界面、当前应用程序和操作系统中的至少一个。在接收语音指令之后,还包括步骤210,判断输出的语音指令是否注册过。根据本申请的一些实施例,S300包括,在当前界面已经处理完语音指令后,询问当前界面是否需要将语音指令传递给当前应用程序。在当前应用程序已经处理完语音指令后,询问当前应用程序是否需要将语音指令传递给操作系统。以及当操作系统是不需要处理语音指令时,将语音指令丢弃。
本领域内的技术人员应明白,本申请的实施例可提供为方法、设备(系统)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (12)

1.一种语音指令仲裁方法,其特征在于,包括:
获取语音数据;
识别所述获取到的语音数据,得到与所述语音数据对应的语音指令;以及
询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令,如果需要,则将所述语音指令对应的回调函数发送给所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个;
所述询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令包括:
在所述当前界面已经处理完所述语音指令后,询问所述当前界面是否需要将所述语音指令传递给所述当前应用程序;
在所述当前应用程序已经处理完所述语音指令后,询问所述当前应用程序是否需要将所述语音指令传递给所述操作系统。
2.根据权利要求1所述的一种语音指令仲裁方法,其特征在于,在接收所述语音指令之后,还包括:
判断输出的所述语音指令是否注册过;
如果注册过,则询问所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个是否需要处理所述语音指令。
3.根据权利要求2所述的一种语音指令仲裁方法,其特征在于,语音指令的注册包括:
接收所述语音指令的注册请求;以及
增加与所述语音指令对应的映射关系。
4.根据权利要求3所述的一种语音指令仲裁方法,其特征在于,所述映射关系包括:所述语音指令和所述语音指令对应的回调函数。
5.根据权利要求1所述的一种语音指令仲裁方法,其特征在于,还包括:
当所述操作系统不需要处理所述语音指令时,将所述语音指令丢弃。
6.一种语音指令仲裁装置,其特征在于,包括:
获取模块,用于获取语音数据;
识别模块,用于识别所述获取到的语音数据后,输出与所述语音数据对应的语音指令;
仲裁模块,用于在接收到所述语音指令后,询问当前界面、当前应用程序和操作系统中的至少一个是否需要处理所述语音指令,如果需要,则将所述语音指令对应的回调函数发送给所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个;
所述仲裁模块包括:
询问界面子模块,用于在所述当前界面已经处理完所述语音指令后,询问所述当前界面是否需要将所述语音指令传递给所述当前应用程序;
询问应用子模块,用于在所述当前应用程序已经处理完所述语音指令后,询问所述当前应用程序是否需要将所述语音指令传递给所述操作系统。
7.根据权利要求6所述的一种语音指令仲裁装置,其特征在于,所述仲裁模块还用于
在接收所述语音指令之后,判断输出的所述语音指令是否注册过;
如果注册过,则询问所述当前界面、所述当前应用程序和所述操作系统中的所述至少一个是否需要处理所述语音指令。
8.根据权利要求7所述的一种语音指令仲裁装置,其特征在于,所述仲裁模块还用于
接收所述语音指令的注册请求;以及
增加与所述语音指令对应的映射关系。
9.根据权利要求8所述的一种语音指令仲裁装置,其特征在于,所述映射关系包括:所述语音指令和所述语音指令对应的回调函数。
10.根据权利要求6所述的一种语音指令仲裁装置,其特征在于,所述仲裁模块还用于当所述操作系统不需要处理所述语音指令时,将所述语音指令丢弃。
11.一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行本申请上述权利要求1-5任一项所述的一种语音指令仲裁方法。
12.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1-5任意一项所述的一种语音指令仲裁方法。
CN201910355774.9A 2019-04-29 2019-04-29 一种语音指令仲裁方法和装置 Active CN110223682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910355774.9A CN110223682B (zh) 2019-04-29 2019-04-29 一种语音指令仲裁方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910355774.9A CN110223682B (zh) 2019-04-29 2019-04-29 一种语音指令仲裁方法和装置

Publications (2)

Publication Number Publication Date
CN110223682A CN110223682A (zh) 2019-09-10
CN110223682B true CN110223682B (zh) 2022-01-11

Family

ID=67820339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910355774.9A Active CN110223682B (zh) 2019-04-29 2019-04-29 一种语音指令仲裁方法和装置

Country Status (1)

Country Link
CN (1) CN110223682B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647305B (zh) * 2019-09-29 2023-10-31 阿波罗智联(北京)科技有限公司 应用程序的语音交互方法、装置、设备和介质
CN113132805B (zh) * 2019-12-31 2022-08-23 Tcl科技集团股份有限公司 一种播放控制方法、系统、智能终端及存储介质
CN111667827B (zh) * 2020-05-28 2023-10-17 北京小米松果电子有限公司 应用程序的语音控制方法、装置及存储介质
CN111741354B (zh) * 2020-06-01 2022-10-04 深圳康佳电子科技有限公司 一种基于界面元素辅助语音交互的方法、系统及存储介质
CN113641328B (zh) * 2021-07-16 2024-06-25 深圳市华粤世通软件科技有限公司 基于语音识别的电脑控制方法、装置、设备及存储介质
CN113496703A (zh) * 2021-07-23 2021-10-12 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品
CN113794968A (zh) * 2021-09-14 2021-12-14 合众新能源汽车有限公司 车载音频焦点的仲裁方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7433690B2 (en) * 2003-12-15 2008-10-07 International Business Machines Corporation Conversion of voice-over-IP media control messaging into mobile control channel signaling using a voice-over IP gateway
US9384732B2 (en) * 2013-03-14 2016-07-05 Microsoft Technology Licensing, Llc Voice command definitions used in launching application with a command
US9443520B2 (en) * 2014-10-02 2016-09-13 International Business Machines Corporation Management of voice commands for devices in a cloud computing environment
CN106157955A (zh) * 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 一种语音控制方法及装置
CN104916287A (zh) * 2015-06-10 2015-09-16 青岛海信移动通信技术股份有限公司 一种语音控制的方法、装置和移动设备
CN108401066B (zh) * 2017-02-08 2022-01-25 北京奇虎科技有限公司 在智能终端中进行语音控制的方法、装置和智能终端
CN107329843B (zh) * 2017-06-30 2021-06-01 百度在线网络技术(北京)有限公司 应用程序语音控制方法、装置、设备以及存储介质
CN109213991A (zh) * 2017-07-05 2019-01-15 中兴通讯股份有限公司 消息处理方法、系统、云平台及存储介质
CN107657031A (zh) * 2017-09-28 2018-02-02 四川长虹电器股份有限公司 基于Android系统管理智能音箱语音技能的方法
CN108984259B (zh) * 2018-07-11 2020-09-18 腾讯科技(深圳)有限公司 界面显示方法、装置及终端
CN109445879A (zh) * 2018-10-19 2019-03-08 四川长虹电器股份有限公司 以悬浮窗显示监控视频的方法、存储介质和设备
CN109360561A (zh) * 2018-11-13 2019-02-19 东软集团股份有限公司 语音控制方法及系统、存储介质、语音模块、主控系统

Also Published As

Publication number Publication date
CN110223682A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN110223682B (zh) 一种语音指令仲裁方法和装置
CN110704037B (zh) 一种规则引擎实现方法及装置
CN107622091B (zh) 一种数据库查询方法和装置
CN111400681B (zh) 数据权限处理方法、装置及设备
CN110895544B (zh) 一种接口数据处理方法、装置、系统及存储介质
CN114168111A (zh) 组件化路由实现方法、设备、产品及存储介质
CN112346761B (zh) 前端资源上线方法、设备、系统及存储介质
CN110837446A (zh) 应用于嵌入式系统的设备管理方法及装置、介质以及嵌入式设备
CN110928941B (zh) 一种数据分片抽取方法及装置
CN112527792A (zh) 一种数据存储方法、装置、设备和存储介质
CN107301097B (zh) 一种调用java对象、java对象的引用地址信息的存储方法及装置
CN112541001A (zh) 数据查询方法、装置、存储介质及设备
CN110019544B (zh) 数据查询方法及系统
CN112579308A (zh) 任务处理方法及系统
CN109299125B (zh) 数据库更新方法及装置
CN113296777B (zh) 依赖分析和程序编译方法、设备及存储介质
CN114330732A (zh) 一种基于量子计算的多任务异步调度方法、设备及介质
CN112583733A (zh) 一种接口的流量整形方法、装置、存储介质及电子设备
CN112749189A (zh) 数据查询方法及装置
CN113761400A (zh) 一种访问请求转发方法、装置及设备
CN113687973B (zh) 一种日志动态化输出的控制方法、设备及介质
CN111158873A (zh) 系统状态机实现方法、装置、存储介质及处理器
CN112540835B (zh) 一种混合机器学习模型的运行方法、装置及相关设备
CN112559444A (zh) Sql文件迁移方法、装置、存储介质及设备
CN110968401A (zh) 基于Quartz的任务调度方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211019

Address after: 100176 Room 101, 1st floor, building 1, yard 7, Ruihe West 2nd Road, economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant