CN112863512B - 一种语音交互调用处理方法、装置、终端设备及存储介质 - Google Patents

一种语音交互调用处理方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN112863512B
CN112863512B CN202110063792.7A CN202110063792A CN112863512B CN 112863512 B CN112863512 B CN 112863512B CN 202110063792 A CN202110063792 A CN 202110063792A CN 112863512 B CN112863512 B CN 112863512B
Authority
CN
China
Prior art keywords
voice
module
instruction
party application
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110063792.7A
Other languages
English (en)
Other versions
CN112863512A (zh
Inventor
张学明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Skyworth RGB Electronics Co Ltd
Original Assignee
Shenzhen Skyworth RGB Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Skyworth RGB Electronics Co Ltd filed Critical Shenzhen Skyworth RGB Electronics Co Ltd
Priority to CN202110063792.7A priority Critical patent/CN112863512B/zh
Publication of CN112863512A publication Critical patent/CN112863512A/zh
Application granted granted Critical
Publication of CN112863512B publication Critical patent/CN112863512B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种语音交互调用处理方法、装置、终端设备及存储介质,方法包括:当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;并控制第三方应用执行对应语音指令操作。本发明能极快的解决第三方应用语音的适配,有效地快速地提高产品开发效率,加快了处理效率,给用户的使用带来方便。

Description

一种语音交互调用处理方法、装置、终端设备及存储介质
技术领域
本发明涉及语音识别技术领域,尤其涉及语音交互调用处理方法、装置、终端设备及存储介质。
背景技术
在科技助力生活的今天,人们和各种终端设备如影随形,生活中早已被诸如手机,平板,电脑,电视所围绕,终端设备已经慢慢渗入到人们生活的各个角落。现在各种终端设备基本都具有语音识别功能,方便用户使用。
现有技术中,一个智能设备出厂默认自带语音应用A(厂家语音例应用),A语音适配了设备出厂的所有功能,另一个语音B适配了指定的应用B(统称第三方应用),而且语音B和应用B直接的交互很复杂。现有技术中,如果需要在这个智能设备上集成第三方应用,如果使用语音应用A对第三方应用进行适配的话工作量非常大,占用资源多,不方便加快处理效率,有时给用户的使用带来了不便。
因此,现有技术还有待改进和提高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音交互调用处理方法、装置、终端设备及存储介质,本发明能极快的解决第三方应用语音的适配,避免了原语音要对接第三方应用各种复杂繁多的使用场景,有效地快速地提高产品开发效率,加快了处理效率,给用户的使用带来方便。
为了解决上述技术问题,本发明所采用的技术方案如下:
一种语音交互调用处理方法,其中,包括:
检测语音A模块是否接收到语音A指令;
当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。
所述的语音交互调用处理方法,其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置智能设备中的语音A模块可识别并执行智能设备中默认的应用;
预先设置语音B模块已适配过第三方应用,并能控制第三方应用执行语音识别操作。
所述的语音交互调用处理方法,其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置语音A模块执行指令识别转化为文本信息的ASR命令和文本转换为机器语义的NLU命令后,再把文本转换为机器语义的NLU命令的结果通过接口调用给到语音B模块,语音B模块将识别后直接执行指令。
所述的语音交互调用处理方法,其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
智能设备系统运行,控制语音A模块和语音B模块的服务均在后台运行,并控制语音A模块和语音B模块正常通讯,待语音A模块接到指令并进行判断之后,确定是否将指令传给语音B模块;
约定发送和接收端的协议,语音A和语音B通过广播方式进行通讯。
所述的语音交互调用处理方法,其特征在于,所述当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义的步骤包括:
当语音A模块收到语音A指令、语音A模块识别所述语音A指令并转化为文本信息;
语音A模块控制转换的文本信息转换成机器语义。
所述的语音交互调用处理方法,其中,所述语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用的步骤还包括:
当当前语音指令对应需要启动运行的不是第三方应用,则直接由语音A模块控制执行对应语音指令操作,执行状态反馈由语音A模块自行处理。
所述的语音交互调用处理方法,其中,所述语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作的步骤包括:
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作;
指令执行后,执行状态反馈由语音B模块自行处理,语音A模块不做处理。
一种语音交互调用处理装置,其中,所述装置包括:
第一接收控制模块,用于检测语音A模块是否接收到语音A指令;
识别转换模块,当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
判断模块,用于语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
调用模块,用于当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;
第二接收控制模块,用于控制语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。
一种终端设备,其中,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互调用处理程序,所述处理器执行所述语音交互调用处理程序时,实现任一项所述的语音交互调用处理方法的步骤。
一种计算机可读存储介质,其中,其上存储有语音交互调用处理程序,所述语音交互调用处理程序被处理器执行时,实现任一项所述的语音交互调用处理方法的步骤。
有益效果:与现有技术相比,本发明提供了一种语音交互调用处理方法,本发明涉及在智能设备上共存两个语音应用,这两个语音应用指定操作的权限,执行指定的操作,从而来实现不同的应用场景,比如:A语音适配的A设备上的A场景,B语音适配了B设备上的B场景,如果要A语音来适配B场景或者B语音来适配A场景的话工作量大或者可行性低,但是A语音能调用B语音或者反过来B语音调用A语音的话,则可更好更快的解决问题。
附图说明
图1为本发明实施例1提供的语音交互调用处理方法的具体实施方式的流程图。
图2为本发明实施例1提供的语音交互调用处理方法中语音转换过程的流程图。
图3为本发明实施例提供的语音交互调用处理方法中语音A模块调用语音B模块的流程图。
图4为本发明实施例4提供的语音交互调用处理方法的具体实施方式的流程图。
图5是本发明实施例提供的语音交互调用处理装置的原理框图。
图6是本发明实施例提供的终端设备的内部结构原理框图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
在科技助力生活的今天,人们和各种终端设备如影随形,生活中早已被诸如手机,平板,电脑,电视所围绕。终端设备已经慢慢渗入到人们生活的各个角落。现在各种终端设备基本都具有语音识别功能,方便用户使用。
现有技术中,一个智能设备出厂默认自带语音应用A(厂家语音例应用),A语音适配了设备出厂的所有功能,另一个语音B适配了指定的应用B(统称第三方应用),而且语音B和应用B直接的交互很复杂。现有技术中,如果需要在这个智能设备上集成第三方应用,如果使用语音应用A对第三方应用进行适配的话工作量非常大,占用资源多,不方便加快处理效率,有时给用户的使用带来了不便。
例如现有技术中用户使用某品牌的智能电视,启动自己的应用是需要说例如“小维,小维请打开某视频应用”,则智能电视默认系统界面会根据唤醒语音自动启动打开某视频应用;如果此时要打开安装在该智能电视的第三方应用的某直播APP时,按现有技术,需要先通过例如“小维,小维退出某视频应用”的语音操作,控制退出在智能电视默认系统界面打开的打开某视频应用,然后语音控制操作打开第三方应用界面,在第三方应用界面通过例如“小度,小度打开某直播APP”的语音,再操作打开某直播APP,这样操作给用户使用不方便,操作效率慢。
为了解决现有技术中的问题,本实施例提供一种语音交互调用处理方法,通过本实施例的方法,使用语音A调用语音B来执行第三方应用的功能,无需对待配网设备进行手动输入密码信息等操作,能极快的解决第三方应用语音的适配,避免了原语音要对接第三方应用各种复杂繁多的使用场景,有效地快速地提高产品开发效率。具体实施时,本实施例公开了一种语音交互的方法,涉及在智能设备上共存两个语音应用,这两个语音应用指定操作的权限,执行指定的操作,从而来实现不同的应用场景,比如:A语音适配的A设备上的A场景,B语音适配了B设备上的B场景,如果要A语音来适配B场景或者B语音来适配A场景的话工作量大或者可行性低,但是A语音能调用B语音或者反过来B语音调用A语音的话,则可更好更快的解决问题,给用户的使用提供了方便。
比如,若在家庭生活中,用户在自己家的某品牌的电视上用户使用某品牌的智能电视,启动自己的应用是需要说语音A例如“小维,小维请打开某视频应用”,则智能电视语音A模块接收语音信号会在默认系统界面会根据唤醒语音自动启动打开某视频应用;如果此时要打开安装在该智能电视的第三方应用的某直播APP时,则本发明用户直接语音说例如“打开某直播APP”的语音,则本发明的语音A模块接收到该“打开某直播APP”的语音信号,自动对接第三方应用界面的语音B模块,调用语音B模块打开某直播APP,实现将语音A模块能调用第三方应用转化为语音A模块调用语音B模块,由语音B模块保持原来的调用第三方应用的逻辑,这样可以减少使用语音应用A对第三方应用进行语音适配的工作量非常大,不会占用过多资源,方便加快处理效率,给用户的使用带来了方便。
示例性方法
本实施例的语音交互调用处理方法可应用于终端设备中,具体如图1中所示,所述语音交互调用处理方法包括如下步骤:
步骤S100、检测语音A模块是否接收到语音A指令;
本发明实施例中,以某品牌的智能电视为例进行说明,本发明在具体实施前,智能电视设置有语音A模块和语音B模块,基于智能电视中的语音A模块可识别并执行智能设备中默认的应用例如语音A模块通过“小说维,小维”唤醒;而语音B模块已适配过第三方应用,并能控制第三方应用执行语音识别操作。
本发明在具体实施时,会预先设置语音A模块执行指令识别转化为文本信息的ASR命令和文本转换为机器语义的NLU命令后,再把文本转换为机器语义的NLU命令的结果通过接口调用给到语音B模块,语音B模块将识别后直接执行指令。即本发明实施例中约定好语音A模块执行ASR(指令识别转化为文本信息)和NLU(转换为机器语义)后再把NLU(转换为机器语义)的结果通过接口调用给到语音B模块,语音B模块将识别后直接执行指令。
本发明实施例中,具体实施时,语音A模块和语音B模块实现的前置条件:智能设备系统运行,控制语音A模块和语音B模块的服务均已经在后台运行,并控制语音A模块和语音B模块正常通讯,待语音A模块接到指令并进行判断之后,确定是否将指令传给语音B模块;具体地,例如可以约定好发送和接收端的协议,他们都是两个apk,约定发个广播实现。例如约定发送和接收端的协议,语音A和语音B通过广播方式进行通讯。
具体实施时,本发明的智能电视会实时检测语音A模块是否接收到语音A指令,例如某品牌的智能电视默认的语音A模块是否接收到启动本智能设备默认语音A模块的唤醒语音。
步骤S200、当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
本发明实施例中,当智能电视的语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义。例如,本发明实施例中,当某品牌的智能电视默认的语音A模块接收到启动本智能设备默认语音A模块的唤醒语音,例如“小维,小维请打开直播应用”,则会识别所述语音A指令并转化为文本信息,并将文本信息转换成设备能识别的机器语义。
在一种实施方式中,如图2所示,所述步骤S200具体包括:
步骤S201、当语音A模块收到语音A指令、语音A模块识别所述语音A指令并转化为文本信息;
步骤S202、语音A模块控制转换的文本信息转换成机器语义。
用户在自己家的某品牌的电视上用户使用某品牌的智能电视,启动自己的应用是需要说语音A例如“小维,小维请打开某直播APP”的语音。本发明会将“小维,小维请打开某直播APP”转化为文本信息,并将转换的文本信息再转换成设备可识别的机器语义。
步骤S300、语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
本发明实施例中,所述语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用。即判断通过当前打开的应用是否是第三方应用。本发明中,所述第三方应用为不是当前智能电视系统默认的应用,而是通过另外安装的第三方应用。
本发明实施例中,当判断当前语音指令对应需要启动运行的不是第三方应用(即当前界面运行的不是该智能电视厂家默认的应用),则直接由语音A模块控制执行对应语音指令操作,执行状态反馈由语音A模块自行处理。比如,若在家庭生活中,用户在自己家的某品牌的电视上用户使用某品牌的智能电视,启动自己的应用是需要说语音A例如“小维,小维请打开A视频应用”,因为A视频应用为智能电视自己默认的应用,则智能电视语音A模块接收语音信号会在默认系统界面会根据唤醒语音自动启动打开某视频应用。
而当前语音指令对应需要启动运行是第三方应用,则控制进入步骤S400。
步骤S400、当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;
本发明实施例中,当收到语音指令转化为转换成机器语义时,检测到当前界面运行的是第三方应用,则会将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令。
例如,当接收到“打开某直播APP”的语音,则本发明的语音A模块接收到该“打开某直播APP”的语音信号,当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令。自动对接第三方应用界面的语音B模块,调用语音B模块打开某直播APP,实现将语音A模块能调用第三方应用转化为语音A模块调用语音B模块,由语音B模块保持原来的调用第三方应用的逻辑,具体如步骤S400。
步骤S500、语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。
本发明实施例中,语音B模块接收语音A模块发送的所述机器语义,并控制第三方应用执行对应语音指令操作,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令。自动对接第三方应用界面的语音B模块,调用语音B模块打开某直播APP,实现将语音A模块能调用第三方应用转化为语音A模块调用语音B模块,由语音B模块保持原来的调用第三方应用的逻辑。
在一种实施方式中,如图3所示,所述步骤S500的语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作的步骤包括:
步骤S501、语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作;
步骤S502、指令执行后,执行状态反馈由语音B模块自行处理,语音A模块不做处理。
即本发明实施例中,例如,智能电视默认的语音A模块是通过语音例如“小维,小维启动。。。应用”来启动,当在智能电视默认应用中没有直播应用,而安装了第三方的直播应用需要用语音B模块控制打开的,例如按现有技术的方式要通过“小度,小度打开直播A应用”。
而本发明实施例中,直接通过语音说“小维,小维请打开直播A应用”,则语音A模块接收到该语音指令后,会识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作,从而根据所述语音指令“小维,小维请打开直播A应用”可以直接打开第三方应用,为用户的使用大大提供了方便。
以下通过一具体应用实施例对本发明做更进一步详细说明:
实施例2
如图4所示,本具体应用实施例所述的一种语音交互调用处理方法,包括以下步骤:
步骤S10、开始
步骤S11、语音A模块接收到语音A,发起语音指令;
步骤S12、语音A模块执行ASR(指令识别转化为文本信息),即语音A接收指令,并识别,转换为文本信息。
步骤S13、将识别的文本信息转换为NLU(机器语义),即语音A模块将文本信息转换为机器语义。
智能设备语音A模块收到语音指令后识别并转化为文本,并将文本信息转换成机器语义。
步骤S14、判断当前语音指令对应需要启动的是否第三方应用,当是进入步骤S16、当否进入步骤S15;
例如语音A通过堆栈信息判断,当当前语音指令对应需要启动运行的是否是第三方应用。
步骤S15、执行语音A的操作,即当前语音指令对应需要启动的不是第三方应用,则控制执行语音A的操作,执行完成进入步骤S18;
步骤S16、语音B模块;本发明中当判断当前语音指令对应需要启动的是第三方应用,则将转换好的机器语义通过接口传给语音B。
步骤S17、执行语音B模块的控制指令。即6、语音B收到指令并对第三方应用进行对应语音指令的操作,指令执行后,执行状态反馈由语音B模块自行处理,语音A模块不做处理。
步骤S18、结束。
本发明能极快的解决第三方应用语音的适配,避免了原语音要对接第三方应用各种复杂繁多的使用场景,有效地快速地提高产品开发效率。
示例性设备
如图5中所示,本发明实施例提供一种语音交互调用处理装置,该装置包括:
第一接收控制模块10,用于检测语音A模块是否接收到语音A指令;
识别转换模块20,当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
判断模块30,用于语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
调用模块40,用于当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;
第二接收控制模块50,用于控制语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作,具体如上所述。
基于上述实施例,本发明还提供了一种终端设备,其原理框图可以如图6所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、语音模块。其中,该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音交互调用处理方法。该终端设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该终端设备的语音模块是预先在终端设备内部设置,本发明实施例中的语音模块包括语音A模块和语音B模块。
本领域技术人员可以理解,图6中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端设备的限定,具体的终端设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种终端设备,终端设备包括存储器、处理器及存储在存储器上并可在处理器上运行的语音交互调用处理程序,处理器执行语音交互调用处理程序时,实现如下操作指令:
检测语音A模块是否接收到语音A指令;
当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作,具体如上所述。
其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置智能设备中的语音A模块可识别并执行智能设备中默认的应用;
预先设置语音B模块已适配过第三方应用,并能控制第三方应用执行语音识别操作。
其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置语音A模块执行指令识别转化为文本信息的ASR命令和文本转换为机器语义的NLU命令后,再把文本转换为机器语义的NLU命令的结果通过接口调用给到语音B模块,语音B模块将识别后直接执行指令。
其中,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
智能设备系统运行,控制语音A模块和语音B模块的服务均在后台运行,并控制语音A模块和语音B模块正常通讯,待语音A模块接到指令并进行判断之后,确定是否将指令传给语音B模块;
约定发送和接收端的协议,语音A和语音B通过广播方式进行通讯。
所述的语音交互调用处理方法,其特征在于,所述当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义的步骤包括:
当语音A模块收到语音A指令、语音A模块识别所述语音A指令并转化为文本信息;
语音A模块控制转换的文本信息转换成机器语义。
其中,所述语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用的步骤还包括:
当当前语音指令对应需要启动运行的不是第三方应用,则直接由语音A模块控制执行对应语音指令操作,执行状态反馈由语音A模块自行处理。
其中,所述语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作的步骤包括:
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作;
指令执行后,执行状态反馈由语音B模块自行处理,语音A模块不做处理。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上,本发明公开了一种语音交互调用处理方法、装置、终端设备及存储介质,方法包括:检测语音A模块是否接收到语音A指令;当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令;语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。本发明涉及在智能设备上共存两个语音应用,这两个语音应用指定操作的权限,执行指定的操作,从而来实现不同的应用场景,比如:A语音适配的A设备上的A场景,B语音适配了B设备上的B场景,如果要A语音来适配B场景或者B语音来适配A场景的话工作量大或者可行性低,但是A语音能调用B语音或者反过来B语音调用A语音的话,则可更好更快的解决问题。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种语音交互调用处理方法,其特征在于,包括:
检测语音A模块是否接收到语音A指令;
所述检测语音A模块是否接收到语音A指令的步骤之前包括:
智能设备系统运行,控制语音A模块和语音B模块的服务均在后台运行,并控制语音A模块和语音B模块正常通讯,待语音A模块接到指令并进行判断之后,确定是否将指令传给语音B模块;
约定发送和接收端的协议,语音A和语音B通过广播方式进行通讯;
当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
所述语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用的步骤还包括:
当当前语音指令对应需要启动运行的不是第三方应用,则直接由语音A模块控制执行对应语音指令操作,执行状态反馈由语音A模块自行处理,其中,所述第三方应用是通过另外安装的第三方应用;
当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令,自动对接第三方应用界面的语音B模块,调用语音B模块打开第三方应用,实现将语音A模块调用第三方应用转化为语音A模块调用语音B模块,由语音B模块保持原来的调用第三方应用的逻辑;
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。
2.根据权利要求1所述的语音交互调用处理方法,其特征在于,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置智能设备中的语音A模块可识别并执行智能设备中默认的应用;
预先设置语音B模块已适配过第三方应用,并能控制第三方应用执行语音识别操作。
3.根据权利要求1所述的语音交互调用处理方法,其特征在于,所述检测语音A模块是否接收到语音A指令的步骤之前包括:
预先设置语音A模块执行指令识别转化为文本信息的ASR命令和文本转换为机器语义的NLU命令后,再把文本转换为机器语义的NLU命令的结果通过接口调用给到语音B模块,语音B模块将识别后直接执行指令。
4.根据权利要求1所述的语音交互调用处理方法,其特征在于,所述当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义的步骤包括:
当语音A模块收到语音A指令、语音A模块识别所述语音A指令并转化为文本信息;
语音A模块控制转换的文本信息转换成机器语义。
5.根据权利要求1所述的语音交互调用处理方法,其特征在于,所述语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作的步骤包括:
语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作;
指令执行后,执行状态反馈由语音B模块自行处理,语音A模块不做处理。
6.一种语音交互调用处理装置,其特征在于,所述装置包括:
第一接收控制模块,用于检测语音A模块是否接收到语音A指令;
所述检测语音A模块是否接收到语音A指令的步骤之前,包括:
智能设备系统运行,控制语音A模块和语音B模块的服务均在后台运行,并控制语音A模块和语音B模块正常通讯,待语音A模块接到指令并进行判断之后,确定是否将指令传给语音B模块;
约定发送和接收端的协议,语音A和语音B通过广播方式进行通讯;
识别转换模块,当语音A模块收到语音A指令、识别所述语音A指令并转化为文本信息,并将文本信息转换成机器语义;
判断模块,用于语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用;
所述语音A模块通过堆栈信息判断,当前语音指令对应需要启动运行是否是第三方应用的步骤,还包括:
当当前语音指令对应需要启动运行的不是第三方应用,则直接由语音A模块控制执行对应语音指令操作,执行状态反馈由语音A模块自行处理,其中,所述第三方应用是通过另外安装的第三方应用;
调用模块,用于当当前语音指令对应需要启动运行的是第三方应用,将已转换好的机器语义通过接口传给语音B模块,以将语音A模块接收的调用第三方应用的语音指令转化为语音A指令调用语音B指令,自动对接第三方应用界面的语音B模块,调用语音B模块打开第三方应用,实现将语音A模块调用第三方应用转化为语音A模块调用语音B模块,由语音B模块保持原来的调用第三方应用的逻辑;
第二接收控制模块,用于控制语音B模块接收所述机器语义,并控制第三方应用执行对应语音指令操作。
7.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互调用处理程序,所述处理器执行所述语音交互调用处理程序时,实现如权利要求1-5任一项所述的语音交互调用处理方法的步骤。
8.一种计算机可读存储介质,其特征在于,其上存储有语音交互调用处理程序,所述语音交互调用处理程序被处理器执行时,实现如权利要求1-5任一项所述的语音交互调用处理方法的步骤。
CN202110063792.7A 2021-01-18 2021-01-18 一种语音交互调用处理方法、装置、终端设备及存储介质 Active CN112863512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110063792.7A CN112863512B (zh) 2021-01-18 2021-01-18 一种语音交互调用处理方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110063792.7A CN112863512B (zh) 2021-01-18 2021-01-18 一种语音交互调用处理方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN112863512A CN112863512A (zh) 2021-05-28
CN112863512B true CN112863512B (zh) 2024-04-30

Family

ID=76006632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110063792.7A Active CN112863512B (zh) 2021-01-18 2021-01-18 一种语音交互调用处理方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN112863512B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593555A (zh) * 2021-07-23 2021-11-02 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品
CN113496703A (zh) * 2021-07-23 2021-10-12 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品
CN113593562A (zh) * 2021-07-30 2021-11-02 东风汽车有限公司东风日产乘用车公司 语音控制方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020023197A (ko) * 2001-12-27 2002-03-28 김연수 자연음 처리를 이용한 데이터 제공 방법과 이를 위한 시스템
CN107004410A (zh) * 2014-10-01 2017-08-01 西布雷恩公司 语音和连接平台
CN109036396A (zh) * 2018-06-29 2018-12-18 百度在线网络技术(北京)有限公司 一种第三方应用的交互方法及系统
US10438582B1 (en) * 2014-12-17 2019-10-08 Amazon Technologies, Inc. Associating identifiers with audio signals
CN112073777A (zh) * 2019-06-10 2020-12-11 海信视像科技股份有限公司 一种语音交互方法及显示设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020023197A (ko) * 2001-12-27 2002-03-28 김연수 자연음 처리를 이용한 데이터 제공 방법과 이를 위한 시스템
CN107004410A (zh) * 2014-10-01 2017-08-01 西布雷恩公司 语音和连接平台
US10438582B1 (en) * 2014-12-17 2019-10-08 Amazon Technologies, Inc. Associating identifiers with audio signals
CN109036396A (zh) * 2018-06-29 2018-12-18 百度在线网络技术(北京)有限公司 一种第三方应用的交互方法及系统
CN112073777A (zh) * 2019-06-10 2020-12-11 海信视像科技股份有限公司 一种语音交互方法及显示设备

Also Published As

Publication number Publication date
CN112863512A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112863512B (zh) 一种语音交互调用处理方法、装置、终端设备及存储介质
US10491679B2 (en) Using voice commands from a mobile device to remotely access and control a computer
US20200075018A1 (en) Control method of multi voice assistants
CN103760969A (zh) 移动终端及语音控制应用程序的方法
CN107102891B (zh) 一种基于双系统的应用的管理方法及移动终端
JP2002534716A (ja) 注目期間を有する音声入力装置
KR20200015267A (ko) 음성 인식을 수행할 전자 장치를 결정하는 전자 장치 및 전자 장치의 동작 방법
US20070061147A1 (en) Distributed speech recognition method
CN110277095B (zh) 语音服务控制装置及其方法
CN112040442B (zh) 交互方法、移动终端、车载终端及计算机可读存储介质
CN103971683A (zh) 语音控制方法、系统及手持设备
CN110718225A (zh) 一种语音控制方法、终端以及存储介质
EP1748354B1 (en) A method for managing and displaying messages and device for managing and displaying messages
EP4213010A1 (en) Guidance control method for driver installation, device regarding the same, and terminal
JP2007041089A (ja) 情報端末および音声認識プログラム
CN109491655B (zh) 一种输入事件处理方法及装置
CN109995475B (zh) 一种智能终端的控制方法、装置、存储介质及电子设备
CN110400568B (zh) 智能语音系统的唤醒方法、智能语音系统及车辆
KR101450188B1 (ko) 휴대용 단말기의 음성 제어 장치 및 방법
KR20200092756A (ko) 음성인식 서비스 제공 장치
CN112581957B (zh) 一种计算机语音控制方法、系统及相关装置
JP2006178534A (ja) 情報処理装置及びドライバソフトのインストール制御方法
CN112908330A (zh) 终端设备的语音唤醒方法、装置及计算机可读存储介质
CN112449223A (zh) 一种电视机外接设备的控制方法、电视机及存储介质
CN111274828A (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant