CN114446292A - 语音指令执行方法、装置、云端服务器及存储介质 - Google Patents
语音指令执行方法、装置、云端服务器及存储介质 Download PDFInfo
- Publication number
- CN114446292A CN114446292A CN202011223513.0A CN202011223513A CN114446292A CN 114446292 A CN114446292 A CN 114446292A CN 202011223513 A CN202011223513 A CN 202011223513A CN 114446292 A CN114446292 A CN 114446292A
- Authority
- CN
- China
- Prior art keywords
- information
- voice
- field
- instruction
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音指令执行方法、装置、云端服务器及存储介质,方法包括:获取智能终端基于语音指令生成的语音操作请求信息;根据语音操作请求信息,确定语音指令所对应的业务领域;确定与业务领域对应的操作指令,并将操作指令发送给智能终端。本发明实施例通过在云端执行语音信息的操作指令,从而实现语音助手免升级的功能,又能保证语音助手存在的问题能够第一时间解决提高研发效率。
Description
技术领域
本发明涉及通信技术领域,尤其涉及的是语音指令执行方法、装置、云端服务器及存储介质。
背景技术
在自然语言处理技术日益蓬勃的今天,语音交互的技术也越来越成熟。语音助手的应用升级方式是需要先下载最新版本更新,但是随着终端的发展和用户需求的提高,语音助手需要频繁更新才能满足用户的需求,有时更新和修复不及时会影响用户的使用体验。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供语音助手云端更新和实时干预方法,旨在解决现有技术中当有新的APK时,终端需要提醒用户下载和升级,用户频繁的升级会消耗用户的时间和网络流量,严重影响产品的体验,此外,对应开发人员而言,希望快速修复语音助手的bug的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种语音指令执行方法,包括:
获取智能终端基于语音指令生成的语音操作请求信息;
根据语音操作请求信息,确定语音指令所对应的业务领域;
确定与业务领域对应的操作指令,并将操作指令发送给智能终端。
第二方面,本发明实施例还提供一种语音指令执行装置,包括:
获取单元,用于获取智能终端基于语音指令生成的语音操作请求信息。
确定单元,用于根据语音操作请求信息,确定语音指令所对应的业务领域。
发送单元,用于确定与业务领域对应的操作指令,并将操作指令发送给智能终端。
第三方面,本发明实施例还提供一种云端服务器,云端服务器包括有存储器、处理器,以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述任意一项的语音指令执行的方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现如上述中任意一项的语音指令执行的方法。
本发明的有益效果:本发明实施例首先获取语音操作请求信息,语音操作请求信息由智能终端根据语音指令生成;然后根据语音操作请求信息确定业务领域,业务领域与语音指令相对应,接着确定最终要执行的操作指令,操作指令与业务领域对应,最后将操作指令发送给智能终端,实现在云端执行语音指令,从而避免了在智能终端中的繁琐操作;可见,本发明实施例中通过在云端生成语音指令的操作指令,避免智能终端中的语音助手的频繁升级,提高了研发效率,用户体验佳。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1本发明实施例提供语音指令执行的方法流程示意图
图2本发明实施例提供语音指令执行的装置的原理框图。
图3本发明实施例提供的云端服务器的内部结构原理框图。
具体实施方式
本发明公开了语音指令执行的方法、云端服务器、存储介质,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
由于现有技术中由于研发人员会随着智能终端的发展和用户需求的提高而不断去修复功能缺陷,因此,会每隔一段时间出现新的语音助手版本,用户如果要使用最新版本,就要先下载最新版本然后安装,导致智能终端需要频繁更新语音助手,给用户带来了极大的不便。
为了解决现有技术的问题,本实施例提供了语音指令执行的方法,通过本实施例中的语音指令执行的方法,可以在执行语音指令时,获取智能终端根据语音指令生成的语音操作请求信息,根据接受到的语音操作请求信息,对语音操作请求信息进行分析和处理,确定出语音指令所对应的业务领域,并根据业务领域得出其对应的操作指令,最后将操作指令发送给智能终端,从而避免在智能终端的繁琐操作,并且随着用户的需求提高或者智能终端的不断发展,当出现新的需求或者功能缺陷时,只需在云端服务器修复操作指令和实时更新即可,避免智能终端中语音助手的频繁升级,提高研发效率,用户体验佳。具体地,本实施例中当云端服务器执行语音指令时,智能终端会将用户的语音指令生成语音操作请求信息,智能终端将语音操作请求信息发送给云端服务器,云端服务器获取智能终端发送过来的语音操作请求信息,通过语音操作请求信息,确定用户的语音指令对应的业务领域,再通过业务领域确定其对应的操作指令,云端服务器将操作指令发送给智能终端。由于操作指令都在云端服务器生成,智能终端获得用户的语音指令后,只需将语音指令转化为语音操作请求信息,然后将语音操作请求信息发送给云端服务器,云端服务器根据语音指令生成操作指令,再将操作指令发送给智能终端,因此,当智能终端接收到用户的语音指令后,通过在云端服务器生成语音指令相对应的操作指令,便可执行语音指令,避免了智能终端的繁琐操作,提高研发效率,用户体验佳。
举例说明,云端服务器在执行语音指令时,获取到一个语音操作请求信息,这个语音操作请求信息是智能终端根据用户的语音指令生成的,由于智能终端是多个广范的分布在不同地域的设备,各个智能终端可能同时生成不同的语音操作请求信息,这些语音操作请求信息都需要被及时处理,为了处理这些智能终端中的语音操作请求信息,接着需要根据这些语音操作请求信息,得到语音指令对应的业务领域,该业务领域可以是影视,天气查询,设备控制,购物,消费等各个领域,例如,根据语音操作请求信息“我想看《披荆斩棘的哥哥》”,就可以确定出其对应的领域是影视领域。然后,根据业务领域,确定与业务领域对应的操作指令,也即,确定出是影视领域之后,根据影视领域可以得到与影视领域相关的系列操作指令,操作指令指的是与影视领域相关的操作代码指令,也即研发人员实现相应操作的程序段中与影视领域相关的代码段。最后云端服务器将操作指令发送给智能终端,智能终端直接接收与影视领域对应的操作指令。也即,本发明实施例将智能终端中与语音指令相关的操作指令放在云端服务器执行,相当于所有智能终端在云端服务器共享语音指令相关的操作指令,使得研发人员只需实时更新云端服务器的操作指令并发布最新的版本即可,避免在智能终端更新升级相应操作指令版本,从而给用户使用智能终端的语音指令带来方便。
示例性方法
本实施例提供一种语音指令执行方法,该方法可以应用于智能语音识别的云端服务器。具体如图1所示,方法包括:
步骤S100、获取智能终端基于语音指令生成的语音操作请求信息。
本实施例中,智能终端(智能电视)通过将基于语音指令生成的语音操作请求信息发送给云端服务器,将语音助手的更新,迭代放到云端服务器,从而避免智能终端中的语音助手实时升级,节省用户的使用时间。智能终端可以是任何大屏系统,智能电视等实际中可能出现的设备。
具体地,用户使用语音助手的录音功能,并按下录音键后,语音助手就会录制用户所说的话,语音助手中的语音模块调用语音助手识别模块,将用户所说的话转换成语音操作请求信息,语音操作请求信息会显示在智能终端设备上,语音操作请求信息指的是用户执行某项操作的意图信息。语音助手是一款智能型的应用,通过智能对话与即时问答的智能交互,实现解决用户问题,其主要是帮助用户解决生活类问题。语音助手识别模块用于将用户所说的话转换成文字,并将文字(用户QUERY后)显示在终端设备上。用户QUERY指的是用户查询,用于在数据库中寻找某一特定文件、网站、记录或一系列记录,由搜索引擎或数据库送出的消息。例如,当用户用语音助手录制:“我要打开爱奇艺。”智能终端通过调用语音助手识别模块,在智能终端显示语音操作请求信息,如果智能终端显示语音操作请求信息不是用户表述的内容,则用户点下返回键,智能终端重新执行上述操作,录制语音指令并将其转化为语音操作请求信息。当用户确认语音操作请求信息是用户表达正确的语音指令时,智能终端就将用户查询后的语音操作请求信息发送给云端服务器,云端服务器接收语音操作请求信息。
在一种实施方式中,本实施例提供一种语音指令执行方法,该方法可以应用于智能语音识别的云端服务器。具体如图1所示,方法包括:
S200:根据语音操作请求信息,确定语音指令所对应的业务领域。
本实施例中,云端服务器是不能直接得到用户语音指令的,因此,需要通过与智能终端的互联通讯得到。用户通过语音助手的录音功能将语音指令发送给智能终端,智能终端再将语音指令转化为语音操作请求信息,也即用户执行某项操作的意图信息,由于智能终端分布在不同的区域,每个智能终端接收的用户的语音操作请求信息不同,因此,同一时间段会有大量的语音操作请求信息生成,每个智能终端需要将语音操作请求信息发送给云端服务器,云端服务器获取到智能终端发送的语音操作请求信息,由于每一条操作请求信息来自不同的智能终端和不同的用户,因此,每一条操作请求信息代表的含义不同,其对应的业务领域也不相同,故需要根据语音操作请求信息匹配业务领域,业务领域也就对应于用户发送的语音指令。例如,用户利用语音助手录音:“我要打开爱奇艺”,智能终端将其转化为语音操作请求信息,并将其发送到云端服务器,云端服务器就可以确定出智能终端中的语音操作请求信息对应的是影视领域。
为了更加精确的匹配语音指令和业务领域,根据语音操作请求信息,确定语音指令所对应的业务领域包括如下步骤:
S201:对语音操作请求信息进行解析,得到与语音指令对应的文本信息;
S202:根据文本信息,确定语音指令所对应的业务领域。
具体地,由于语音操作请求信息指的是用户执行某项操作的意图信息,因此,语音操作请求信息包含多方面内容,各个智能终端发送过来的语音操作请求信息代表着不同意图,故需要对语音操作请求信息进行解析,从而得到文本信息,文本信息来自于被解析的语音操作请求信息,其内容与语音指令相对应。例如,用户利用语音助手录音,也即语音指令:“我要打开爱奇艺”,智能终端将语音指令转化为语音操作请求信息,并将其发送给云端服务器,云端服务器接收到语音操作请求信息,对其进行解析,得到云端服务器可识别的文本信息:“我要打开爱奇艺”。
云端服务器根据接收到的文本信息,确定出相对应的业务领域。文本信息指的是云端服务器识别到语音操作请求信息中的文字表达信息,实际中,同一时段,会从不同的智能终端接收到不同用户的文本信息,每个文本信息都代表着不同的意图,云端服务器会根据每一条文本信息得到对应的业务领域,业务领域也即对应着智能终端发送的语音指令。例如,云端服务器识别到文本信息:“我要打开爱奇艺”后,确定出其业务领域是影视领域,由上可知,影视领域也是与用户发送的语音指令:“我要打开爱奇艺”相对应的。
在一种实施方式中,文本信息包含也包含着不同的部分,而将文本信息对应到业务领域时,只需要根据文本信息中的部分信息就可以得到其对应的业务领域。因此,需要先对文本信息进行分解,得到字段信息;然后根据字段信息,确定与字段信息匹配的业务领域。
具体地,云端服务器通过对文本信息进行分解,得到字段信息,字段信息也即是关键词,字段信息指的是语音指令执行操作的对象。例如:文本信息“我要打开爱奇艺”,云端服务器对其进行分解,得到两部分,一部分为“我要打开”,另一部分为“爱奇艺”,此时,对文本信息进行分解,得到字段信息“爱奇艺”。
在本实施例中,云端服务器通过分解文本信息得到的字段信息,实际中,不同的用户通过操作不同的设备,会产生多种不同的文本信息,同样的云端服务器分解得到字段信息也是分布在不同的业务领域的,因此,云端服务器根据不同的字段信息匹配出其相应的业务领域。实际中,云端服务器将这些字段信息输入到云端服务器,并根据人工智能技术计算出置信度,然后进行话术匹配,将字段信息匹配到对应的业务领域。人工智能是以机器为载体所展示出来的人类智能,因此人工智能也被称为机器智能。置信度也称为可靠度,或置信水平、置信系数,即在抽样中对总体参数作出估计时,根据样本的随机性,采用数理统计中的区间估计法,在满足估计值与总体参数在一定允许的误差范围以内时产生的相应概率值。话术匹配则是根据输入信息产生相对应的应答内容。例如,云端服务器分解得到字段信息“爱奇艺”,将字段信息“爱奇艺”输入到人工智能算法模型中,人工智能技术会将数据库中与“爱奇艺”相关的业务领域调出来,然后将这些业务领域与“爱奇艺”进行匹配估计,当业务领域与“爱奇艺”的匹配概率值满足预设值时,则可以确定出“爱奇艺”的对应的业务领域是影视领域。
在另一种实施方式中,存在如下特殊情况,比如需要实时干预的情况,因此,将字段信息改写为指定字段信息,并设置与指定字段信息相对应的指定领域,指定领域为业务领域。
具体地,当实际中出现特殊应用场景时,此时,需要将文本信息分解后得到的字段信息进行改写,改写成指定字段信息。例如:两会期间时,需要屏蔽掉涉及外网的APP调用和新闻推送,云端服务器可以远程操作用户设备,调用各种内置功能。例如:根据用户的身份信息,远程为用户配置设置,将“我要打开爱奇艺”进行修改,改为两会主题内容,将“两会主题内容”发送至人工智能进行匹配,得到国家政治领域。除此之外,当出现一些紧急情况,比如检测到有地震时,则需要将“我要打开爱奇艺”进行修改,改为地震预报,将指定字段信息“地震”发送至人工智能进行匹配,根据匹配结果得到气候领域。此外,当检测到智能终端的身份信息为嫌疑人的IP地址时,结合经纬度信息,云端服务器远程调用语音助手对智能终端进行录音,将指定字段信息“犯罪嫌疑人”发送至人工智能进行匹配,根据匹配结果得到公安领域。
当字段信息被改写成指定字段信息之后,指定字段信息与指定领域就形成了一一对应关系,为了更快捷的处理后续类似的干预情况,需要保存对应关系,因此,需要创建指定字段信息与指定领域之间的映射关系,并将映射关系存储。
具体地,当出现特殊情况时,将文本信息分解后得到的字段信息进行改写,改写成指定字段信息,字段信息会对应指定领域,比如:将“两会主题内容”映射到干预模板中国家政治领域,指定字段信息“地震预报”映射到干预模板中的地震领域,指定字段信息“犯罪嫌疑人”映射到干预模板中公安领域,并将映射关系存储在云端服务器的内存空间中。这样,当下一次再出现类似情况时,指定字段信息就可以快速被映射到其对应的业务领域中,云端服务器能快速根据指定字段信息确定其对应映射关系的业务领域,提高对语音指令操作执行的速度,用户体验佳。
在一种实施方式中,本实施例提供一种语音指令执行方法,该方法可以应用于智能语音识别的云端服务器。具体如图1所示,方法包括:
S300:确定与业务领域对应的操作指令,并将操作指令发送给智能终端。
具体地,云端服务器确定出每个用户发送智能终端的语音指令相应的业务领域之后,便会确定与业务领域相关的操作指令。操作指令为用户执行语音指令的命令集,也即研发人员为了执行语音指令的相关操作所写的代码段。实际中,为了使得语音助手的开发和优化工作都集中到云端服务器,减少用户实时升级带来的不便,云端服务器根据业务领域,匹配相对应的操作指令。当云端服务器得到业务领域对应的操作指令后,云端服务器将相应的操作指令发送给智能终端,智能终端从而可以执行用户语音指令。例如:根据实际需求,智能终端应用通过一系列通用的操作接口,与云端服务器联通,根据业务领域,确定与业务领域对应的操作指令。云端服务器和智能终端可以采用互联网通信,云端服务器将操作指令以json数据的形式发送给智能终端,json数据是指是一种轻量级的数据交换格式。它基于欧洲计算机协会制定的规范的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。json数据结构如下:
{
"directives":{
"action":"App.Open",
"appName":"腾讯视频"
},
"data":{
"extend":"会员免费",
"category":"电影",
"thumb":
"http://puui.qpic.cn/vcover_vt_pic/0/00jxecd5him5kmn1585271336/770",
"token":"tenvideo2://?action=7&video_id=&video_name=加勒比海盗5:死无对证
&cover_id=00jxecd5him5kmn",
"publishDate":20170526,
"tags":[
"幽默",
"灾难",
"探险",
"冒险"
],
"resource_name":"加勒比海盗5:死无对证"
},
}
本实施例中,云端服务器获得业务领域的名称信息,还需要进行一些处理才能确定出操作指令,因此,根据业务领域,确定与业务领域对应的操作指令包括如下步骤:
S301:获取业务领域的名称信息;
S302:根据名称信息,确定与业务领域对应的操作指令。
具体地,每一个应用都会被映射到一个业务领域,而应用的名称也会在业务领域对应有名称信息,也即,业务领域的名称信息指的是各个业务领域中应用名称在业务领域中对应的名称信息。因此,需要根据字段信息得到业务领域的名称信息,然后根据业务领域的名称信息得到其相应的操作指令。例如:字段信息“爱奇艺”,其分解到的业务领域是影视领域,其在云端服务器中的影视领域名称是“爱奇艺”,然后根据“爱奇艺”这个名称信息就可以确定与影视领域对应的操作指令。
在本实施例中,根据领域名称获得字段信息对应的操作指令,还需要进行一些处理,因此,需要根据名称信息,得到名称信息相对应的指令模板;并获取字段信息对应的应用包名称,将应用包名称填入指令模板中,生成与业务领域对应的操作指令。
具体地,云端服务器得到业务领域的名称信息,就可以得到其对应的指令模板。实际中,由于用户的语音指令包含很多内容,其对应的业务领域也分很多种,因此,为了提高对语音指令相对应的操作指令的处理效率,会将操作指令按照一定的类别进行分类处理。因此,在本实施例中,云端服务器会建立业务领域的名称信息与指令模板的对应关系,当云端服务器获取到用户在智能终端发送的不同的语音指令时,将语音指令转换成文本信息后得到字段信息,便根据语音指令对应的字段信息的业务领域,然后根据业务领域找到业务领域的名称信息,再根据业务领域的名称信息查找到与之对应的指令模板。例如,云端服务器便可根据人工智能技术计算出置信度,然后进行话术匹配,将字段信息匹配到对应的业务领域并确定出其对应的指令模板为视频控制模板。
在本实施例中,云端服务器先获取到字段信息中的应用包名称,应用包名称为操作指令所对应的操作对象。实际中,智能终端会发送大量的文本信息,这些文本信息中包含着多个不同业务领域的字段信息,云端服务器会根据字段信息得到其对应的应用包名称,将应用包名称填入到其对应业务领域的指令模板中,从而生成与业务领域相对应的操作指令。具体地,研发人员实际上已经根据业务领域与操作指令的关系生成了代码段,并会留出接口,以便云端服务器根据不同的业务领域执行相对应的操作指令。当云端服务器获得字段信息中的应用包名称:“银河奇异果”之后,就会将应用包名称:“银河奇异果”填入到指令模板(视频控制模板)中,基于研发人员之前已经开发的代码段,生成与业务领域相对应的操作指令。
在本实施例中,执行操作指令是一个整体,仅通过字段信息中的字段信息对应的应用包名称,无法得到完整的操作指令,因此,需要先获取字段信息对应的行为信息,行为信息用于反映操作指令所对应的操作行为;然后将行为信息和应用包名称填入指令模板中;最后根据指令模板,调用指令生成程序,生成与业务领域对应操作指令。
具体地,字段信息中除了包含业务领域相对应的字段信息,还包括行为信息,行为信息为文本信息中对对象(字段信息)执行的动作,也即用于反映操作指令所对应的操作行为。因此,云端服务器还要获取文本信息中的行为信息。
实际应用时,每个用户通过智能终端发送过来的字段信息不同,其所属的业务领域也不同,云端服务器需要将每个用户对应字段信息中的行为信息和应用包名称同时填入到业务领域对应的指令模板中。例如,云端服务器获取文本信息“我要打开爱奇艺”,得到文本信息中的行为信息“我要打开”,并得到文本信息中的字段信息“爱奇艺”,云端服务器查找字段信息“爱奇艺”对应的应用包名称“银河奇异果”,故将行为信息“我要打开”和应用包名称“银河奇异果”都填入到指令模板,最后生成的操作指令如下:
{
"domain":"app_control",
"actions":[{
"property":{
"action":"App.Open",
"appName":"银河奇异果"
},
"startType":"app",
"component":{
"pkg":""
}
}]
在本实施例中,将行为信息和应用包名称填入指令模板之后,调用相应的指令模板,生成与业务领域对应的操作指令,例如:根据识别的业务领域,将服务分配给不同的执行模块,当识别到业务领域为alarm setting时,则调用alarm指令模块,当识别到业务领域为weather report时,则调用weather指令模块,当识别到业务领域为music play时,则调用music指令模块,当识别到业务领域为any thing时,则调用any指令模块,最后由执行模块给出相应的操作指令。
示例性设备
如图2中所示,本发明实施例提供一种语音指令执行装置,该装置包括获取单元401、确定单元402和发送单元403,其中:
获取单元401,用于获取智能终端基于语音指令生成的语音操作请求信息;
确定单元402,用于根据语音操作请求信息,确定语音指令所对应的业务领域;
发送单元403,用于确定与业务领域对应的操作指令,并将操作指令发送给智能终端。
基于上述实施例,本发明还提供了一种云端服务器,其原理框图可以如图3所示。该智能终端包括通过系统总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中,该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音指令执行的方法。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏,该智能终端的温度传感器是预先在智能终端内部设置,用于检测内部设备的运行温度。
本领域技术人员可以理解,图3中的原理图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体的智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种云端服务器,云端服务器包括有存储器、处理器,以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下操作的指令:
获取智能终端基于语音指令生成的语音操作请求信息;
根据语音操作请求信息,确定语音指令所对应的业务领域;
确定与业务领域对应的操作指令,并将操作指令发送给智能终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上,本发明公开了语音指令执行的方法、智能终端、存储介质,方法包括:获取智能终端基于语音指令生成的语音操作请求信息;根据语音操作请求信息,确定语音指令所对应的业务领域;确定与业务领域对应的操作指令,并将操作指令发送给智能终端。本发明实施例通过在云端执行语音信息的操作指令,从而实现语音助手免升级的功能,又能保证语音助手存在的问题能够第一时间解决提高研发效率应当理解的是,本发明公开了一种语音指令执行的方法。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (11)
1.一种语音指令执行方法,其特征在于,包括:
获取智能终端基于语音指令生成的语音操作请求信息;
根据所述语音操作请求信息,确定所述语音指令所对应的业务领域;
确定与所述业务领域对应的操作指令,并将所述操作指令发送给所述智能终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音操作请求信息,确定所述语音指令所对应的业务领域,包括:
对所述语音操作请求信息进行解析,得到与所述语音指令对应的文本信息;
根据所述文本信息,确定所述语音指令所对应的业务领域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本信息,确定所述语音指令所对应的业务领域,包括:
对所述文本信息进行分解,得到字段信息;
根据所述字段信息,确定与所述字段信息匹配的业务领域。
4.根据权利要求3所述的方法,其特征在于,所述根据所述字段信息,确定与所述字段信息匹配的业务领域,包括:
将所述字段信息改写为指定字段信息,并设置与所述指定字段信息相对应的指定领域,所述指定领域为业务领域。
5.根据权利要求4所述的方法,其特征在于,所述设置与所述指定字段信息相对应的指定领域,包括:
创建所述指定字段信息与所述指定领域之间的映射关系,并将所述映射关系存储。
6.根据权利要求5所述的方法,其特征在于,所述确定与所述业务领域对应的操作指令,包括:
获取所述业务领域的名称信息;
根据所述名称信息,确定与所述业务领域对应的操作指令。
7.根据权利要求6所述的方法,其特征在于,所述根据所述名称信息,确定与所述业务领域对应的操作指令,包括:
根据所述名称信息,得到所述名称信息相对应的指令模板;
获取所述字段信息对应的应用包名称,将所述应用包名称填入指令模板中,生成与所述业务领域对应的操作指令。
8.根据权利要求7所述的方法,其特征在于,所述获取所述字段信息对应的应用包名称,将所述应用包名称填入指令模板中,生成与所述业务领域对应操作指令,包括:
获取所述字段信息中的行为信息,所述行为信息用于反映所述操作指令所对应的操作行为;
将所述行为信息和所述应用包名称填入至所述指令模板中;
根据所述指令模板,调用指令生成程序,生成与所述业务领域对应操作指令。
9.一种语音指令执行装置,其特征在于,包括:
获取单元,用于获取智能终端基于语音指令生成的语音操作请求信息;
确定单元,用于根据所述语音操作请求信息,确定所述语音指令所对应的业务领域;
发送单元,用于确定与所述业务领域对应的操作指令,并将所述操作指令发送给所述智能终端。
10.一种云端服务器,其特征在于,所述云端服务器包括有存储器、处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-8中任意一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任意一项所述的方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011223513.0A CN114446292B (zh) | 2020-11-05 | 2020-11-05 | 语音指令执行方法、装置、云端服务器及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202011223513.0A CN114446292B (zh) | 2020-11-05 | 2020-11-05 | 语音指令执行方法、装置、云端服务器及存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN114446292A true CN114446292A (zh) | 2022-05-06 |
| CN114446292B CN114446292B (zh) | 2025-07-08 |
Family
ID=81360890
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202011223513.0A Active CN114446292B (zh) | 2020-11-05 | 2020-11-05 | 语音指令执行方法、装置、云端服务器及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN114446292B (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114664296A (zh) * | 2020-12-08 | 2022-06-24 | 深圳Tcl新技术有限公司 | 语音指令执行方法、装置、智能终端及存储介质 |
| CN115440214A (zh) * | 2022-07-26 | 2022-12-06 | 北京罗克维尔斯科技有限公司 | 语音控制方法、装置、电子设备、车辆和存储介质 |
| CN118314891A (zh) * | 2024-04-23 | 2024-07-09 | 杭州美宿在途网络科技有限公司 | 一种ai对讲机的实现方法及系统 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105551488A (zh) * | 2015-12-15 | 2016-05-04 | 深圳Tcl数字技术有限公司 | 语音控制方法及系统 |
| CN106098063A (zh) * | 2016-07-01 | 2016-11-09 | 海信集团有限公司 | 一种语音控制方法、终端设备和服务器 |
| CN106157955A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种语音控制方法及装置 |
| CN109918040A (zh) * | 2019-03-15 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 语音指令分发方法和装置、电子设备及计算机可读介质 |
| CN110021299A (zh) * | 2018-01-08 | 2019-07-16 | 佛山市顺德区美的电热电器制造有限公司 | 语音交互方法、装置、系统及存储介质 |
| CN110162780A (zh) * | 2019-04-08 | 2019-08-23 | 深圳市金微蓝技术有限公司 | 用户意图的识别方法和装置 |
| US20190318736A1 (en) * | 2018-04-11 | 2019-10-17 | Baidu Online Network Technology (Beijing) Co., Ltd | Method for voice controlling, terminal device, cloud server and system |
| US10504520B1 (en) * | 2016-06-27 | 2019-12-10 | Amazon Technologies, Inc. | Voice-controlled communication requests and responses |
-
2020
- 2020-11-05 CN CN202011223513.0A patent/CN114446292B/zh active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106157955A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种语音控制方法及装置 |
| CN105551488A (zh) * | 2015-12-15 | 2016-05-04 | 深圳Tcl数字技术有限公司 | 语音控制方法及系统 |
| US10504520B1 (en) * | 2016-06-27 | 2019-12-10 | Amazon Technologies, Inc. | Voice-controlled communication requests and responses |
| CN106098063A (zh) * | 2016-07-01 | 2016-11-09 | 海信集团有限公司 | 一种语音控制方法、终端设备和服务器 |
| CN110021299A (zh) * | 2018-01-08 | 2019-07-16 | 佛山市顺德区美的电热电器制造有限公司 | 语音交互方法、装置、系统及存储介质 |
| US20190318736A1 (en) * | 2018-04-11 | 2019-10-17 | Baidu Online Network Technology (Beijing) Co., Ltd | Method for voice controlling, terminal device, cloud server and system |
| CN109918040A (zh) * | 2019-03-15 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 语音指令分发方法和装置、电子设备及计算机可读介质 |
| CN110162780A (zh) * | 2019-04-08 | 2019-08-23 | 深圳市金微蓝技术有限公司 | 用户意图的识别方法和装置 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114664296A (zh) * | 2020-12-08 | 2022-06-24 | 深圳Tcl新技术有限公司 | 语音指令执行方法、装置、智能终端及存储介质 |
| CN114664296B (zh) * | 2020-12-08 | 2025-08-05 | 深圳Tcl新技术有限公司 | 语音指令执行方法、装置、智能终端及存储介质 |
| CN115440214A (zh) * | 2022-07-26 | 2022-12-06 | 北京罗克维尔斯科技有限公司 | 语音控制方法、装置、电子设备、车辆和存储介质 |
| CN118314891A (zh) * | 2024-04-23 | 2024-07-09 | 杭州美宿在途网络科技有限公司 | 一种ai对讲机的实现方法及系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN114446292B (zh) | 2025-07-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111881401B (zh) | 基于WebAssembly的浏览器深度学习方法及系统 | |
| CN110489101B (zh) | 接口模拟方法、系统、介质和电子设备 | |
| US11521137B2 (en) | Deployment of self-contained decision logic | |
| US10956179B1 (en) | Third party integration of plugins and widgets | |
| CN114446292A (zh) | 语音指令执行方法、装置、云端服务器及存储介质 | |
| US11226801B2 (en) | System and methods for voice controlled automated computer code deployment | |
| CN109284106A (zh) | 业务规则的发布管理方法、电子装置及可读存储介质 | |
| CN109684364A (zh) | 基于用户画像的问题处理方法、装置、设备和存储介质 | |
| WO2023065746A1 (zh) | 算法应用元生成方法、装置、电子设备、计算机程序产品及计算机可读存储介质 | |
| CN112783494A (zh) | 一种骨架屏自动生成方法、应用程序页面更新方法及装置 | |
| CN112445499A (zh) | 衍生变量确定方法、装置、设备和存储介质 | |
| CN120631781A (zh) | 基于智能体的测试用例生成方法、装置、设备及介质 | |
| CN115237459A (zh) | 软件开发工具包生成方法、装置、设备、存储介质及产品 | |
| CN112416455B (zh) | 数据处理方法、装置、终端和存储介质 | |
| US9971611B2 (en) | Monitoring a mobile device application | |
| CN110866105B (zh) | 一种语义决策方法、移动终端及存储介质 | |
| US7784022B2 (en) | Mapping a new user interface onto an existing integrated interface | |
| US11195102B2 (en) | Navigation and cognitive dialog assistance | |
| CN108491448B (zh) | 一种数据推送的方法和装置 | |
| US20250165238A1 (en) | System and method for ai-supported deployment of computing environments | |
| CN107179916B (zh) | 一种应用程序开发方法、装置、设备以及开发架构系统 | |
| CN112181437A (zh) | 基于Devops的灰度发布方法、装置、计算机设备及存储介质 | |
| CN109240673B (zh) | 一种基于react-native的视图动态加载更新方法及系统 | |
| CN119476485A (zh) | 大语言模型的推理反思方法、设备及存储介质 | |
| CN113760317A (zh) | 一种页面显示方法、装置、设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |