CN116189673A - 语音控制方法、终端设备、服务器及存储介质 - Google Patents
语音控制方法、终端设备、服务器及存储介质 Download PDFInfo
- Publication number
- CN116189673A CN116189673A CN202111438501.4A CN202111438501A CN116189673A CN 116189673 A CN116189673 A CN 116189673A CN 202111438501 A CN202111438501 A CN 202111438501A CN 116189673 A CN116189673 A CN 116189673A
- Authority
- CN
- China
- Prior art keywords
- voice control
- application
- description
- application program
- control instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000014509 gene expression Effects 0.000 claims abstract description 68
- 230000006870 function Effects 0.000 claims description 156
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001754 anti-pyretic effect Effects 0.000 description 1
- 239000002221 antipyretic Substances 0.000 description 1
- 229940124579 cold medicine Drugs 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/543—User-generated data transfer, e.g. clipboards, dynamic data exchange [DDE], object linking and embedding [OLE]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Telephonic Communication Services (AREA)
- Stored Programmes (AREA)
Abstract
本发明实施例提供一种语音控制方法、设备及存储介质,属于终端控制技术领域。该方法包括:获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句;当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。本发明实施例的技术方案能够提高通过语音控制指令调用应用程序的便利性。
Description
技术领域
本发明涉及终端控制技术领域,尤其涉及一种语音控制方法、终端设备、服务器及存储介质。
背景技术
随着科学技术的不断发展,电子技术和语音识别技术也得到了飞速的发展,目前,在终端设备上都装有语音助手,语音助手可以通过接收用户的语音,生成对应的控制指令对终端设备进行控制,从而实现终端设备上的语音控制功能,但在通过语音确定所要执行的功能,没有办法快速了解终端设备上的应用有哪些可被语音助手执行的功能,也就没有办法让语音助手快速执行这些应用的功能。
发明内容
本发明实施例提供一种语音控制方法、终端设备及存储介质,旨在提高通过语音控制终端快速运行应用程序相关功能的效率。
第一方面,本发明实施例提供一种语音控制方法,包括:
获取所述应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句;
当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。
第二方面,本发明实施例还提供一种终端设备,所述终端设备包括处理器、存储器、存储在所述存储器上并可被所述处理器执行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,其中所述计算机程序被所述处理器执行时,实现如本发明说明书提供的任一项用于终端设备的语音控制方法的步骤。
第三方面,本发明实施例还提供一种服务器,所述服务器包括处理器、存储器、存储在所述存储器上并可被所述处理器执行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,其中所述计算机程序被所述处理器执行时,实现如本发明说明书提供的任一项用于服务器的语音控制方法的步骤。
第四方面,本发明实施例还提供一种存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明说明书提供的任一项用于终端设备的语音控制的方法的步骤,和/或任一项用于服务器的语音控制的方法的步骤。
本发明实施例提供一种语音控制方法、终端设备、服务器及存储介质,本发明实施例通过获取所述应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句;当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。提供一种让应用程序向其他模块或程序,例如语音助手模块,注册其功能描述与调用关系的方式,让其他模块或程序能够获取应用程序功能信息及调用方式,从而提高了语音控制终端应用程序的效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种语音控制方法的流程示意图;
图2a是本发明一实施例提供的一种语音助手模块封装好的配置文件的场景示意图;
图2b是本发明另一实施例提供的一种语音助手模块封装好的配置文件的场景示意图;
图3为本发明另一实施例提供的一种语音控制方法的流程示意图;
图4为本发明实施例提供的一种终端设备的结构示意框图;
图5为本发明实施例提供的一种终端设备的结构示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
下面结合附图,对本发明的一些实施例作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
本发明一实施例提供一种语音控制方法、终端设备及存储介质。其中,该语音控制方法可应用于移动终端中,该移动终端可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
请参照图1,图1为本发明实施例提供的一种语音控制方法的流程示意图。
如图1所示,该语音控制方法包括步骤S101至步骤S104。
步骤S101、获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句。
示例性的,应用程序可以是终端设备上已安装的应用程序,也可以是待安装的应用程序,获取应用程序的功能信息,以在需要执行对应的功能时,根据应用程序的功能信息调用对应的应用程序,并基于调用的应用程序实现对应的功能。
示例性的,应用程序可以是通过一定的格式配置的配置文件安装在终端设备上,其他模块,例如语音助手模块可以在应用程序对应的配置文件中获取功能信息,可以理解的,在配置文件中获取到的功能信息包括预设功能对应的调用方式和应用描述典型说法。
示例性的,预设功能可以是查询、搜索等功能,也可以是播放、购买等功能,可以理解的,通过不同的应用程序来实现不同的功能。可以理解的,应用描述典型说法用于描述预设功能,例如“播放音乐”这一应用描述典型说法用于描述播放功能,“购买护肤品”应用描述典型说法用于描述购买功能。可以理解的,通过音乐播放应用程序实现播放音乐,通过电商平台应用程序实现购买护肤品。
示例性的,调用方式用于指示运行应用程式的方式,可以理解的,若在终端设备的系统内的模块不同,在当前模块接收到指令需要运行另一模块时,在当前模块需要进行调用的操作,以运行另一模块。模块可以例如是各应用程序对应的模块,也可以是语音助手模块,其中,语音助手模块通过接收到的语音控制指令对应用程序进行调用。例如,语音助手模块接收到购买的语音控制指令,调用电商平台应用程序进行购买的操作。
可以理解的,将应用程序的功能信息读取并存储在在至少一个模块中,例如语音助手模块,从而可以通过语音控制指令来调用应用程序运行预设功能。
例如通过键值对的格式对应用程序的功能信息进行封装,具体的,键值对的键可以是预设功能,键值对的值可以是预设功能对应的一个或多个应用描述典型说法。
示例性的,应用程序的功能信息封装在至少一个模块中可以有效提升调用应用程序实现预设功能的效率,以及能够通过特定的方式调用应用程序,例如语音控制。
在一些实施例中,所述获取所述应用程序的功能信息,包括:通过meta-data接口,从所述应用程序的配置文件中获取meta-data数据;解析所述meta-data数据,得到所述应用程序的功能信息。
示例性的,meta-data接口是在模块中用于获取并解析meta-data数据的接口,通过meta-data接口能够获取其他应用程序的配置文件中的meta-data数据,以确定应用程序的功能信息。
示例性的,配置文件中包括组件,组件包括构成应用程序的动作Activity、服务Service、广播接收器Broadcast和内容提供程序Content provider。其中,每个组件中有不同的命名,例如“activity,BuyActivity”应用程序可以通过不同命名的组件实现不同的功能。其中,一些组件还能够向其他模块告知有关组件以及可以启动这些组件的条件的信息。可以理解的,语音助手模块可以通过这些信息获取调取方式以及应用描述典型说法,从而对应用程序的组件进行调用。
示例性的,meta-data数据可以是在组件中支撑应用程序运行并实现相应功能的数据,例如在“activity,BuyActivity”组件下的“Action”的meta-data数据,解析该“Action”的meta-data数据,可以得到“buy”,可以理解的,可以通过调用该应用程序实现购买功能。
示例性的,meta-data数据可以以键值对的格式进行存储,在获取应用程序的配置文件的meta-data数据后,通过对meta-data数据对应的键值对进行解析,例如获取meta-data数据对应键值对中的键以及值。可以理解的,键用于指示应用程序的预设功能,值用于指示应用描述典型说法,通过在meta-data数据的键值对中提取关键字以确定功能信息,从而完成对meta-data数据的解析。
示例性的,在一个应用程序的meta-data数据中,可能会包括不同功能的meta-data数据,通过不同功能的meta-data数据确定该应用程序不同预设功能对应的应用描述典型说法。
在一些实施例中,可以通过预设的功能信息获取接口,获取应用程序的功能信息,可以理解的,功能信息获取接口用于从应用程序的meta-data数据中获取对应的应用描述典型说法、调用方式等。
示例性的,在Android平台中,预设的功能信息获取接口可以是meta-data接口,基于meta-data接口,可以通过package manager获取应用程序的功能信息。
在一些实施例中,所述获取所述应用程序的功能信息,包括:将所述应用程序的应用描述典型说法上传至服务器,以使所述服务器对所述应用描述典型说法进行扩展,以匹配到更多的用户说法。
示例性的,在获取到功能信息中的应用描述典型说法后,当将应用描述典型说法上传至服务器时,服务器可以对应用描述典型说法进行扩展,以得到扩展后的应用描述典型说法。可以理解的,对应用描述典型说法进行扩展可以是基于应用描述典型说法的语义进行同义词的扩展,例如对“购买”进行扩展可以得到“买”、“购入”等等;在另一些实施方式中,对应用描述典型说法进行扩展还可以是基于应用描述典型说法的语义进行不同语种或方言的同义词扩展,例如对“购买”进行扩展可以得到“buy”、“purchase”等。以上对应用描述典型说法的扩展只是举例说明,并不对应用描述典型说法的扩展具体内容及步骤予以限定。
所述当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能,包括:
当获取到的语音控制指令与扩展后的应用描述典型说法匹配时,获取与扩展后的应用描述典型说法对应的调用方式,并根据所述调用方式调用所述应用程序实现所述预设功能。
示例性的,当语音控制指令与扩展后的应用描述典型说法匹配时,服务器将与扩展后的应用描述典型说法对应的调用方式下发给客户端,客户端根据调用方式调用所述应用程序实现所述应用描述典型说法所描述的预设功能。
示例性的,通过服务器对应用描述典型说法进行扩展,可以提升语音助手模块的泛化能力,从而提高语音控制的通用性。
步骤S102、当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。
示例性的,当确定语音控制指令与所述应用描述典型说法匹配时,根据匹配应用描述典型说法对应的调用方式调用所述应用程序实现所述预设功能。
在一些实施例中,所述方法还包括:获取语音控制指令;确定所述获取到的语音控制指令对应的文本信息;若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定所述获取到的语音控制指令与所述应用描述典型说法匹配。
示例性的,可以对语音控制指令进行语音识别,得到语音控制指令对应的文本信息,以对文本信息和应用描述典型说法进行比对,从而判断语音控制指令是否与所述应用描述典型说法匹配。可以理解的,若语音控制指令对应的文本信息对应的文本信息中包括应用描述典型说法对应的关键词,判定获取到的语音控制指令与应用描述典型说法匹配。
若语音控制指令对应的文本信息对应的文本信息中不包括应用描述典型说法对应的关键词,判定获取到的语音控制指令与应用描述典型说法不匹配,并输出提示信息。
示例性的,可以在终端设备中进行语音识别,并对语音控制指令对应的文本信息和应用描述典型说法进行匹配。
示例性的,应用描述典型说法对应的关键词与应用描述典型说法的意图相同,例如,若应用描述典型说法为我不购买牙刷,对应的关键词包括“不购买”,以指示用户不想购买牙刷的意图,可以理解的,若关键词为“购买”,则与用户的意图不同。上述为示例性说明,并不对应用描述典型说法以及应用描述典型说法对应的关键词予以限定。
当在终端设备进行语音识别得到的文本信息与应用描述典型说法匹配时,根据应用描述典型说法对应的调用方式调用应用程式,并实现应用描述典型说法对应的预设功能。
在另一些实施方式中,当在终端设备中进行语音识别得到的文本信息无法与应用描述典型说法进行匹配时,可以将文本信息上传到服务器中,以使服务器对文本信息进行关键词提取处理,从而通过提取到的关键词与应用描述典型说法进行匹配。可以理解的,服务器对文本信息进行关键词提取处理后,可以对关键词进行扩展处理,确定与关键词相同语义的若干描述词,以使若干描述词与应用描述典型说法进行匹配。
示例性的,还可以将语音控制指令发送至服务器中,以使服务器进行语音识别,并获取服务器发送的文本信息,以对文本信息和应用描述典型说法的进行匹配。
示例性的,当终端设备将应用描述典型说法上传至服务器时,以及服务器获取语音控制指令后,可以在服务器中对语音控制指令进行语音识别,得到对应的文本信息,对文本信息以及扩展后的应用描述典型说法进行匹配,从而确定语音控制指令与应用描述典型说法是否匹配。
示例性的,在服务器上确定语音控制指令与应用描述典型说法匹配时,服务器向终端设备发送应用应用程序的调用方式,以使终端设备能够通过服务器发送的调用方式调用应用程序以及实现预设功能。
示例性的,对语音控制指令完成识别并与应用描述典型说法匹配时,通过与应用描述典型说法对应的功能信息中的调用方式,调用应用程序实现应用描述典型说法所描述的预设功能。例如,在语音助手模块中,“查找”应用描述典型说法对应搜索应用程序,调用搜索应用程序实现“查找”的功能。
可以理解的,在终端设备中,可以有多个搜索应用程序,当通过应用描述典型说法无法确定调用的应用程序时,在终端设备的显示装置上弹出消息框,以使用户选择调用的应用程序。
当终端设备只安装有一个对应应用描述典型说法的应用程序时,调用对应的应用程序并实现应用描述典型说法对应的预设功能。
示例性的,通过语音控制指令匹配应用描述典型说法,以及通过应用描述典型说法对应的功能信息中包括的调用方式调用应用程序,以及实现应用描述典型说法对应的预设功能,可以有效提高运行应用程序实现预设功能的效率。
在一些实施例中,所述功能信息还包括用于指示槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值;所述根据所述调用方式调用所述应用程序实现所述预设功能,包括:根据所述槽值描述,将所述语音控制指令中的槽值传递给所述应用程序,以使所述应用程序根据所述语音控制指令中的槽值运行所述预设功能。
示例性的,语音控制指令包括与应用描述典型说法对应的关键词,以及与槽值描述对应的槽值,例如,语音控制指令包括“购买感冒药”,其中,“购买”为应用描述典型说法对应的关键词,“感冒药”为槽值。当语音控制指令包括关键词以及槽值时,根据槽值描述,将语音控制指令中的槽值传递给所述应用程序,以使应用程序根据槽值实现预设功能,例如在电商平台应用程序中实现购买感冒药的功能。
示例性的,槽值描述和应用描述典型说法可以以键值对的格式进行存储。
示例性的,槽值描述可以包括槽值属性,槽值属性列出了槽值的若干种说法,例如槽值为药品,槽值属性可以是药品名、感冒药、退烧药等等,以上只是对槽值属性进行举例说明,并不对槽值属性予以限定。
示例性的,槽值描述还可以包括槽值的传递方式,例如extra的传递方式,在extra的传递方式,key用于指示槽值,其中,key可以从应用程序的配置文件中获取,获取方式如上述应用描述典型说法的获取方式,在此不再撰述。在另一些实施方式中,key也可以是单独配置的。Value可以用于指示提取到的槽值内容,将语音控制指令中的槽值传递给应用程序。可以理解的,若没有槽值描述,可能会无法从语音控制指令中将槽值传递给应用程序,以使应用程序无法实现对应的功能。
示例性的,通过槽值描述,可以传递不同的参数,以提升语音控制的应用程序的适用性。
示例性的,如图2a、图2b所示,图2a是本发明一实施例提供的一种语音助手模块封装好的配置文件的场景示意图;图2b是本发明另一实施例提供的一种语音助手模块封装好的配置文件的场景示意图。
示例性的,在语音助手模块获取应用程序的功能信息时,通过应用程序以一定格式设置的功能信息,进行获取,该格式可以是键值对的格式,语音助手模块获取应用描述典型说法时,能够获取到应用描述典型说法所对应的槽值描述,及应用程序对应的调用方式,从而提高语音助手模块获取应用程序的功能并且调用的便捷性。
如图2a、图2b所示,action和category是Android标准规范AndroidManifest中属于Activity调用的部分,如图2a,定义第一个meta_data表明有哪些Action是需要让语音助手调用的,若存在多个Action,可以以竖线隔开。第二个meta_data是应用描述典型说法,为了方便提取对应的值,我们这里采用action:statement的规范作为key,对应的value中竖线隔开了多种说法,冒号后面的英文为槽值,这个Activity可以实现购买medicines的功能。且图2a中存在槽值描述,第三个meta_data的定义的是槽值描述中的槽值属性,其中key为了读取方便定义的规范是“action:key_槽值关键字_attribute”,图中的槽值属性列出了槽值的几种描述。第四个meta_data定义的是槽值的调用方式,其中key为了读取方便定义的规范是“action:key_槽值_call”,对应的值表明通过Extra传递,extra的类型是String,key是medicines,默认使用extra传递,key是槽值关键字的。如果是通过data传递的参数,同时,可以要求参数的key和槽值的表示相同。
可以理解的,由于应用程序中的功能信息是通过一定的格式设置的,例如图2a中的参数为name,因而语音助手模块可以通过“name=“com.origin.app.main.buy:statement”所对应的值进行应用描述典型说法的获取,以及通过name=“com.origin.app.main.buy:key_medicines_attribute”所对应的值进行槽值描述的获取,从而提升语音助手模块获取应用程序的功能信息的便利性。可以理解的,若应用程序中的功能信息没有按照一定格式配置,和/或语音助手模块没有确定获取的参数为name,获取应用程序对应的功能信息速率会较慢,且容易出现不对应或遗漏的情况。上述应用程序配置的功能信息为示例性说明,并不对具体的应用程序配置的功能信息,以及获取应用程序的功能信息的方式予以限定。
其中,图2b是另一种实施方式,具体实施步骤与图2a类似,在此不再重复撰述,且图2a中的应用典型说法、槽值描述、调用方式均为示例性举例,不对本申请的具体实施方式予以限定。
上述实施例提供的用于终端设备的语音控制方法,通过获取应用程序中按照一定格式配置的功能信息,功能信息包括应用程序的预设功能对应的调用方式和应用描述典型说法,以及当获取到的语音控制指令与应用描述典型说法匹配时,根据调用方式调用应用程序实现预设功能,方便了对于应用程序的预设功能的调用。
请参照图3,图3为本发明另一实施例提供的一种语音控制方法的流程示意图。该语音控制用于服务器,服务器与终端设备通信连接。
步骤S201、获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法用于描述所述预设功能。
示例性的,当终端设备与服务器通信连接,且终端设备安装好的应用程序功能信息发送至服务器,以使服务器能够获取到在终端设备安装好的应用程序的功能信息。
示例性的,应用程序的功能信息可以如步骤S101中所撰述,在此不再撰述。
步骤S202、获取所述终端设备发送的语音控制指令。
示例性的,获取终端设备发送的语音控制指令,可以理解的,终端设备可以通过录音装置或与终端设备通信连接的录音设备进行语音控制指令的获取,因而服务器能够获取终端设备发送的语音控制指令。
步骤S203、当所述语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式向所述终端设备发送应用程序运行指令,所述程序运行指令用于指示所述终端设备调用所述应用程序实现所述预设功能。
示例性的,将语音控制指令与应用描述典型说法进行匹配,当语音控制指令与应用描述典型说法匹配时,生成应用程序运行指令,并将应用程序运行指令发送至终端设备,其中,应用程序运行指令包括应用程序的调用方式,因而终端设备能够通过获取到的应用程序运行指令调用应用程序。
示例性的,应用程序运行指令还可以包括匹配的应用描述典型说法,以指示终端设备调用应用程序实现匹配的应用描述典型说法所描述的预设功能。在另一些实施方式中,应用程序运行指令还可以包括匹配的应用描述典型说法和槽值。
示例性的,通过服务器发送应用程序运行指令给终端设备,可以不需在终端设备中进行应用描述典型说法的匹配,提升应用描述典型说法匹配的泛化性。
在一些实施例中,所述语音控制指令与所述应用描述典型说法匹配,包括:确定所述语音控制指令对应的文本信息;若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定所述语音控制指令与所述应用描述典型说法匹配。
示例性的,可以对语音控制指令进行语音识别,得到语音控制指令对应的文本信息,以对文本信息和应用描述典型说法进行比对,从而判断语音控制指令是否与所述应用描述典型说法匹配。可以理解的,若语音控制指令对应的文本信息对应的文本信息中包括应用描述典型说法对应的关键词,判定获取到的语音控制指令与应用描述典型说法匹配。
在一些实施例中,所述方法还包括:对从所述终端设备获取到的功能信息中的应用描述典型说法进行扩展,其中,所述扩展包括同义词扩展。
示例性的,可以将获取到的功能信息中的应用描述典型说法进行扩展,以增加应用程序对应的功能的描述说法,从而提升语音控制应用程序的适用性。
示例性的,扩展可以是确定功能信息中的应用描述典型说法的语义,以及基于应用描述典型说法的语义进行同义词的扩展。
示例性的,当语音控制指令与扩展后的应用描述典型说法匹配,发送应用程序运行指令给终端设备,可以理解的,语音控制指令对应的文本信息若包括扩展后的应用描述典型说法,确定语音控制指令与扩展后的应用描述典型说法匹配。
在一些实施方式中,所述对所述应用描述典型说法进行扩展包括:确定所述应用描述典型说法的语义;根据所述应用描述典型说法的语义对所述应用描述典型说法进行扩展。
示例性的,对应用描述典型说法进行扩展可以例如是对应用描述典型说法进行语义分析,确定应用描述典型说法对应的语义,以及基于应用描述典型说法对应的语义对应用描述典型说法进行扩展,可以理解的,可以是同语种不同说法的扩展,或是不同语种的扩展。如步骤S101中所述,在此不再撰述。
在一些实施例中,所述功能信息还包括用于槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值;所述将包含所述调用方式的应用程序运行指令发送给所述终端设备,包括:将包含所述调用方式和所述槽值的应用程序运行指令发送给所述终端设备,以使所述应用程序根据所述语音控制指令中的槽值运行所述预设功能。
示例性的,当语音控制指令与应用描述典型说法匹配时,确定语音控制指令是否包括槽值,若语音控制指令不包括槽值,根据应用描述典型说法生成应用程序运行指令,以指示终端设备调用应用程序;若语音控制指令包括槽值,判定槽值是否与功能信息中的槽值描述匹配,当槽值与功能信息中的槽值描述匹配,根据槽值描述将语音控制指令中的槽值进行传递,以根据调用方式和槽值生成应用程序运行指令,从而使终端设备调用所述应用程序并根据所述语音控制指令中的槽值实现所述预设功能。其余步骤如步骤102中所述,在此不再撰述。
上述实施例提供的用于服务器的语音控制方法,通过获取所述终端设备安装的应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法用于描述所述预设功能;获取所述终端设备发送的语音控制指令;当所述语音控制指令与所述应用描述典型说法匹配时,将包含所述调用方式的应用程序运行指令发送给所述终端设备,所述程序运行指令用于指示所述终端设备根据所述调用方式调用所述应用程序实现所述预设功能。方便了对终端设备中的应用程序的调用以及应用程序预设功能的实现。
请参阅图4,图4为本发明实施例提供的一种终端设备的结构示意性框图。
如图4所示,终端设备300包括处理器301和存储器302,处理器301和存储器302通过总线303连接,该总线比如为I2C(Inter-integrated Circuit)总线。
具体地,处理器301用于提供计算和控制能力,支撑整个终端设备的运行。处理器301可以是中央处理单元(Central Processing Unit,CPU),该处理器301还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
具体地,存储器302可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本发明实施例方案相关的部分结构的框图,并不构成对本发明实施例方案所应用于其上的终端设备的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现本发明实施例提供的任意一种所述的语音控制方法。
在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现如下步骤:
获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法用于描述所述预设功能;
当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。
在一实施例中,所述处理器在实现获取所述语音控制方法时,用于实现:
获取语音控制指令;
确定所述语音控制指令对应的文本信息;
若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定所述获取到的语音控制指令与所述应用描述典型说法匹配。
在一实施例中,所述功能信息还包括用于指示槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值,所述处理器在实现根据所述调用方式调用所述应用程序实现所述预设功能时,用于实现:
根据所述槽值描述,将所述语音控制指令中的槽值传递给所述应用程序,以使所述应用程序根据所述语音控制指令中的槽值实现所述预设功能。
在一实施例中,所述处理器在实现获取所述应用程序的功能信息时,用于实现:
通过meta-data接口,从所述应用程序的配置文件中获取meta-data数据;
解析所述meta-data数据,得到所述应用程序的功能信息。
在一实施例中,所述处理器在实现获取所述应用程序的功能信息时,用于实现:
将所述应用程序的应用标识发送给服务器;
获取所述服务器根据所述应用标识确定的所述应用程序的功能信息。
在一实施例中,所述处理器在实现获取所述应用程序的功能信息时,用于实现:
将所述应用程序的应用描述典型说法上传至服务器,以使所述服务器对所述应用描述典型说法进行扩展;
获取所述服务器扩展后的应用描述典型说法。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端设备的具体工作过程,可以参考前述用于终端设备的语音控制方法实施例中的对应过程,在此不再赘述。
请参阅图5,图5为本发明实施例提供的一种服务器的结构示意性框图。
如图5所示,服务器400包括处理器401和存储器402,处理器401和存储器402通过总线403连接,该总线比如为I2C(Inter-integrated Circuit)总线。
具体地,处理器401用于提供计算和控制能力,支撑整个终端设备的运行。处理器401可以是中央处理单元(Central Processing Unit,CPU),该处理器401还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
具体地,存储器402可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本发明实施例方案相关的部分结构的框图,并不构成对本发明实施例方案所应用于其上的终端设备的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现本发明实施例提供的任意一种所述的语音控制方法。
在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现如下步骤:
获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法用于描述所述预设功能;
获取所述终端设备发送的语音控制指令;
当所述语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式向所述终端设备发送应用程序运行指令,所述程序运行指令用于指示所述终端设备调用所述应用程序实现所述预设功能。
在一实施例中,所述处理器在实现语音控制方法时,用于实现:
确定所述语音控制指令对应的文本信息;
若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定所述语音控制指令与所述应用描述典型说法匹配。
在一实施例中,所述处理器在实现语音控制方法时,用于实现:
对从所述终端设备获取到的功能信息中的应用描述典型说法进行扩展,其中,所述扩展包括同义词扩展。
在一实施例中,所述功能信息还包括用于槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值;所述处理器在实现将包含所述调用方式的应用程序运行指令发送给所述终端设备时,用于实现:
根据所述调用方式和所述槽值描述向所述终端设备发送应用程序运行指令,以使所述终端设备调用所述应用程序并根据所述语音控制指令中的槽值实现所述预设功能。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端设备的具体工作过程,可以参考前述用于服务器的语音控制方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供一种存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明实施例说明书提供的任一项用于终端设备的语音控制方法的步骤,和/或任一项用于服务器的语音控制方法的步骤。
其中,所述存储介质可以是前述实施例所述的终端设备和/或服务器的内部存储单元,例如所述终端设备和/或服务器的硬盘或内存。所述存储介质也可以是所述终端设备和/或服务器的外部存储设备,例如所述终端设备和/或服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施例中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本发明的具体实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种语音控制方法,其特征在于,用于终端设备,所述方法包括:
获取所述终端设备上应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句;
当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能。
2.根据权利要求1所述的语音控制方法,其特征在于,所述获取到的语音控制指令与所述应用描述典型说法匹配,包括:
获取语音控制指令;
确定所述语音控制指令对应的文本信息;
若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定获取到的语音控制指令与所述应用描述典型说法匹配。
3.根据权利要求1所述的语音控制方法,其特征在于,所述应用描述典型说法还包括用于指示槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值;
所述根据所述调用方式调用所述应用程序实现所述预设功能,包括:
根据所述槽值描述,将所述语音控制指令中的槽值传递给所述应用程序,以使所述应用程序根据所述语音控制指令中的槽值实现所述预设功能。
4.根据权利要求1-3任一项所述的语音控制方法,其特征在于,所述获取所述应用程序的功能信息,包括:
通过预设的功能信息获取接口,从所述应用程序的配置文件中获取meta-data数据;
解析所述meta-data数据,得到所述应用程序的功能信息。
5.根据权利要求1-3任一项所述的语音控制方法,其特征在于,所述获取所述应用程序的功能信息,包括:
将所述应用程序的应用描述典型说法上传至服务器,以使所述服务器对所述应用描述典型说法进行扩展;
所述当获取到的语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式调用所述应用程序实现所述预设功能,包括:
当获取到的语音控制指令与扩展后的应用描述典型说法匹配时,获取与所述扩展后的应用描述典型说法对应的调用方式,并根据所述调用方式调用所述应用程序实现所述预设功能。
6.一种语音控制方法,其特征在于,用于服务器,所述服务器与终端设备通信连接,所述方法包括:
获取所述终端设备上的应用程序的功能信息,所述功能信息包括所述应用程序的预设功能对应的调用方式和应用描述典型说法,所述应用描述典型说法为描述所述预设功能的语句;
获取所述终端设备发送的语音控制指令;
当所述语音控制指令与所述应用描述典型说法匹配时,根据所述调用方式向所述终端设备发送应用程序运行指令,所述程序运行指令用于指示所述终端设备调用所述应用程序实现所述预设功能。
7.根据权利要求6所述的语音控制方法,其特征在于,所述方法还包括:
确定所述语音控制指令对应的文本信息;
若所述文本信息中包括与所述应用描述典型说法对应的关键词,判定所述语音控制指令与所述应用描述典型说法匹配。
8.根据权利要求6所述的语音控制方法,其特征在于,所述方法还包括:
对从所述终端设备获取到的功能信息中的应用描述典型说法进行扩展,其中,所述扩展包括同义词扩展。
9.根据权利要求6-8任一项所述的语音控制方法,其特征在于,所述功能信息还包括用于槽值传递的槽值描述,所述语音控制指令与所述应用描述典型说法匹配,包括:所述语音控制指令包括与所述应用描述典型说法对应的关键词,以及包括与所述槽值描述对应的槽值;
所述将包含所述调用方式的应用程序运行指令发送给所述终端设备,包括:
根据所述调用方式和所述槽值描述向所述终端设备发送应用程序运行指令,以使所述终端设备调用所述应用程序并根据所述语音控制指令中的槽值实现所述预设功能。
10.一种终端设备,其特征在于,所述终端设备包括处理器、存储器、存储在所述存储器上并可被所述处理器执行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,其中所述计算机程序被所述处理器执行时,实现如权利要求1至5中任一项所述的语音控制方法的步骤。
11.一种服务器,其特征在于,所述服务器包括处理器、存储器、存储在所述存储器上并可被所述处理器执行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,其中所述计算机程序被所述处理器执行时,实现如权利要求6至9中任一项所述的语音控制方法的步骤。
12.一种存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至5中任一项用于终端设备的所述的语音控制的方法的步骤,和/或
实现权利要求6至9中任一项用于服务器的所述的语音控制的方法的步骤。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111438501.4A CN116189673A (zh) | 2021-11-29 | 2021-11-29 | 语音控制方法、终端设备、服务器及存储介质 |
PCT/CN2022/110032 WO2023093121A1 (zh) | 2021-11-29 | 2022-08-03 | 语音控制方法、终端设备、服务器及存储介质 |
US18/576,560 US20240304188A1 (en) | 2021-11-29 | 2022-08-03 | Voice control method, terminal device, server, and storage medium |
EP22897216.2A EP4354427A4 (en) | 2021-11-29 | 2022-08-03 | VOICE CONTROL METHOD, TERMINAL DEVICE, SERVER AND STORAGE MEDIUM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111438501.4A CN116189673A (zh) | 2021-11-29 | 2021-11-29 | 语音控制方法、终端设备、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116189673A true CN116189673A (zh) | 2023-05-30 |
Family
ID=86438944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111438501.4A Pending CN116189673A (zh) | 2021-11-29 | 2021-11-29 | 语音控制方法、终端设备、服务器及存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240304188A1 (zh) |
EP (1) | EP4354427A4 (zh) |
CN (1) | CN116189673A (zh) |
WO (1) | WO2023093121A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375734B (zh) * | 2010-08-23 | 2014-05-07 | 中国移动通信集团公司 | 应用产品开发系统、方法、装置和运行系统、方法、装置 |
CN104503779A (zh) * | 2014-12-09 | 2015-04-08 | 北京奇虎科技有限公司 | 一种运行应用程序的方法和装置 |
CN107122179A (zh) * | 2017-03-31 | 2017-09-01 | 阿里巴巴集团控股有限公司 | 语音的功能控制方法和装置 |
CN107609047A (zh) * | 2017-08-18 | 2018-01-19 | 广东小天才科技有限公司 | 应用推荐方法、装置、移动设备及存储介质 |
CN109584865B (zh) * | 2018-10-17 | 2024-05-31 | 平安科技(深圳)有限公司 | 一种应用程序控制方法、装置、可读存储介质及终端设备 |
US11138374B1 (en) * | 2018-11-08 | 2021-10-05 | Amazon Technologies, Inc. | Slot type authoring |
CN111402888B (zh) * | 2020-02-19 | 2023-12-08 | 北京声智科技有限公司 | 语音处理方法、装置、设备及存储介质 |
-
2021
- 2021-11-29 CN CN202111438501.4A patent/CN116189673A/zh active Pending
-
2022
- 2022-08-03 EP EP22897216.2A patent/EP4354427A4/en active Pending
- 2022-08-03 US US18/576,560 patent/US20240304188A1/en active Pending
- 2022-08-03 WO PCT/CN2022/110032 patent/WO2023093121A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP4354427A1 (en) | 2024-04-17 |
WO2023093121A1 (zh) | 2023-06-01 |
US20240304188A1 (en) | 2024-09-12 |
EP4354427A4 (en) | 2024-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7996754B2 (en) | Consolidated content management | |
US7505978B2 (en) | Aggregating content of disparate data types from disparate data sources for single point access | |
US9558275B2 (en) | Action broker | |
US20230147742A1 (en) | Search-based natural language intent determination | |
US9456229B2 (en) | Parsing single source content for multi-channel publishing | |
WO2018149115A1 (zh) | 用于提供搜索结果的方法和装置 | |
US9135339B2 (en) | Invoking an audio hyperlink | |
US11934394B2 (en) | Data query method supporting natural language, open platform, and user terminal | |
WO2022143105A1 (zh) | 文本生成模型生成方法、文本生成方法、装置及设备 | |
US20150040098A1 (en) | Systems and methods for developing and delivering platform adaptive web and native application content | |
CN108280200B (zh) | 用于推送信息的方法和装置 | |
WO2007093483A1 (en) | Synthesizing the content of disparate data types | |
CN108829467B (zh) | 第三方平台对接实现方法、装置、设备及存储介质 | |
KR102140391B1 (ko) | 검색 방법 및 이 방법을 적용하는 전자 장치 | |
CN111309857A (zh) | 一种处理方法及处理装置 | |
US20210004406A1 (en) | Method and apparatus for storing media files and for retrieving media files | |
WO2023122444A1 (en) | Language model prediction of api call invocations and verbal responses | |
JP2015200860A (ja) | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム | |
CN117059096A (zh) | 车载语义结果的处理方法及装置 | |
CN116189673A (zh) | 语音控制方法、终端设备、服务器及存储介质 | |
CN112100364A (zh) | 文本语义理解方法和模型训练方法、装置、设备和介质 | |
CN113360127B (zh) | 音频播放方法以及电子设备 | |
CN113760274A (zh) | 一种前端组件逻辑注入方法和装置 | |
US20150324333A1 (en) | Systems and methods for automatically generating hyperlinks | |
US20180232343A1 (en) | Method and system for augmenting text in a document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |