一种用于智能设备的信息处理方法及装置
技术领域
本发明涉及智能控制领域,尤其涉及一种用于智能设备的信息处理方法及装置。
背景技术
在传统的智能交互中,智能设备一般采用模板方式来应对复杂的对话,即智能设备的存储模块中存储一些固定的问答对,设备识别用户的语音提问后,根据用户的输入来匹配固定的答案进行输出,从而回答用户的语音提问;这种智能设备的本地存储有限,往往缺乏足够的数据资料储备,用户得到答案的准确度较低。
随着用户信息获取需求的不断增加,内置操作系统的智能设备应运而生,此类智能设备接收用户的语音提问后,依托安装于操作系统的应用服务处理用户的语音数据,生成相应的答案并语音输出,从而回答用户的提问;但现有的移动应用程序(Application,APP)仅面向于手机、平板电脑等移动设备,均基于用户的文字或者点击进行触发,应用开发商则往往因此需求而花费大量精力开发基于语音操控的专用APP,加大了信息维护的难度,影响了信息传播的效率。
发明内容
有鉴于此,本发明提出一种用于智能设备的信息处理方法及装置,直接对智能设备进行语音触发,减小了信息维护的难度。
第一方面,本发明实施例提供了一种用于智能设备的信息处理方法,所述处理方法包括:获取用户输入的语音信息;解析所述语音信息,确定对应的目标文本和目标事件;根据所述目标事件确定所述智能设备中的目标应用程序;根据所述目标文本分别调用所述目标应用程序中的活动元素,使所述目标应用程序对所述目标文本进行响应。
进一步的,所述用于智能设备的信息处理方法还包括:抓取各应用程序中的应用界面;分别解析所述应用界面,根据所述应用界面中的页面元素分别确定每项应用程序各自对应的活动元素。
进一步的,在根据所述应用界面中的页面元素确定对应的活动元素之后,还包括:根据所述应用界面中活动元素的所属类型进行筛选。
进一步的,所述根据所述目标文本调用所述目标应用程序中的活动元素包括:将所述目标文本分别与所述目标应用程序中的至少一个待选活动元素相匹配;如果所述目标文本满足至少一个所述待选活动元素的触发条件,则调用满足触发条件的活动元素;如果所述目标文本不满足至少一个所述待选活动元素的触发条件,则调用所述目标应用程序中的默认活动元素。
进一步的,所述待选活动元素包括搜索入口,所述目标文本满足至少一个所述待选活动元素的触发条件包括:所述目标文本与所述搜索入口相关联。
进一步的,所述调用满足触发条件的活动元素包括:将所述目标文本对应的特征词填入所述搜索入口进行垂直搜索;触发搜索结果中相应的实例条目。
进一步的,所述默认活动元素包括所述目标应用程序中,应用界面对应的推荐区域中的实例条目。
第二方面,本发明实施例提供了一种用于智能设备的信息处理装置,所述装置包括:获取单元,用于获取用户输入的语音信息;解析单元,与所述获取单元相连,用于解析所述语音信息,确定对应的目标文本和目标事件;目标应用程序确定单元,与所述解析单元相连,用于根据所述目标事件确定所述智能设备中的目标应用程序;操作单元,与目标应用程序确定单元相连,用于根据所述目标文本分别调用所述目标应用程序中的活动元素,使所述目标应用程序对所述目标文本进行响应。
进一步的,所述用于智能设备的信息处理装置,还包括:抓取单元,与所述目标应用程序确定单元相连,用于抓取各应用程序中的应用界面;活动元素确定单元,与所述抓取单元相连,用于分别解析所述应用界面,根据所述应用界面中的页面元素分别确定每项应用程序各自对应的活动元素。
进一步的,在根据所述应用界面中的页面元素确定对应的活动元素之后,根据所述应用界面中活动元素的所属类型进行筛选。
进一步的,所述操作单元包括:匹配子单元,与所述目标应用程序确定单元相连,用于将所述目标文本分别与所述目标应用程序中的至少一个待选活动元素相匹配;调用子单元,与所述匹配子单元相连,用于如果所述目标文本满足至少一个所述待选活动元素的触发条件,则调用满足触发条件的活动元素;如果所述目标文本不满足至少一个所述待选活动元素的触发条件,则调用所述目标应用程序中的默认活动元素。
进一步的,所述待选活动元素包括搜索入口,所述目标文本满足至少一个所述待选活动元素的触发条件包括:所述目标文本与所述搜索入口相关联。
进一步的,所述调用满足触发条件的活动元素包括:将所述目标文本对应的特征词填入所述搜索入口进行垂直搜索;触发搜索结果中相应的实例条目。
进一步的,所述默认活动元素包括所述目标应用程序中,应用界面对应的推荐区域中的实例条目。
本发明实施例中,智能设备直接根据用户输入的语音信息,解析出对应的目标文本和目标事件,从而调用智能设备中的目标应用程序中的活动元素对目标文本进行响应,使得适用于手机、平板电脑等基于触控来使用的移动APP也可以直接通过用户语音进行触发,从而智能设备可以通过普通的移动APP进行各项应用服务的扩展,不但减小了智能设备开发者的开发工作量,提高了信息传播的效率,而且开发者对这些移动APP进行常规的应用维护即可,减小了信息维护的难度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例一中的一种用于智能设备的信息处理方法的流程图;
图2是本发明实施例二中的一种用于智能设备的信息处理方法的流程图;
图3是本发明实施例三中的一种用于智能设备的信息处理方法的流程图;
图4是本发明实施例四中的一种用于智能设备的信息处理装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。另外还需要说明的是,为了便于说明,以下实施例中示出了与本发明相关的示例,这些示例仅作为说明本发明实施例的原理所用,并不作为对本发明实施例的限定,同时,这些示例的具体数值会根据不同的应用环境和装置或者组件的参数不同而不同。
本发明实施例的智能设备的控制方法及装置可以运行于安装有Windows(微软公司开发的操作系统平台)、Android(谷歌公司开发的用于便携式可移动智能设备的操作系统平台)、iOS(苹果公司开发的用于便携式可移动智能设备的操作系统平台)、WindowsPhone(微软公司开发的用于便携式可移动智能设备的操作系统平台)等操作系统的终端中,该终端可以是台式机、笔记本电脑、移动电话、掌上电脑、平板电脑、数码相机、数码摄像机等等中的任意一种。
实施例一
图1是本发明实施例一中的一种用于智能设备的信息处理方法的流程图,该方法用于实现通过调用目标应用程序中的活动元素对目标文本进行响应,根据多特征词输入信息的识别并针对目标应用程序执行相应的操作,该方法可以由具有智能设备信息处理功能的装置来执行,该装置可以由软件和/或硬件方式实现,例如典型的是用户终端设备,例如手机、电脑等。本实施例中的智能设备的控制方法包括:步骤S110、步骤S120、步骤S130和步骤S140。
步骤S110,获取用户输入的语音信息。
可以在智能设备的主界面上获取用户的输入信息,或者在智能设备的信息输入界面上获取用户的输入信息,输入信息包括接收用户输入的语音;例如,在智能设备的主界面上,用户长按菜单键,则智能设备通过麦克风等装置获取用户长按菜单键之后的语音信息,直至用户停止长按菜单键。
步骤S120,解析所述语音信息,确定对应的目标文本和目标事件。
解析用户输入的语音信息,将语音信息对应的脉冲编码调制(Pulse-codemodulation,PCM)数据识别为目标文本,进而得到该语音信息对应的文本信息。其中,PCM数据是指数字信号是对连续变化的模拟信号进行抽样、量化和编码产生的数据,PCM数据在音频技术中广泛应用。对目标文本信息进行语义分析,在此之前,首先对目标文本进行分词,去掉其中无意义的虚词,提取其中动词、名词类的实词作为关键词,并分别将所述关键词在既定的语义模型中进行分析,其中,语义模型是在关系模型基础上增加全新的数据构造器和数据处理原语,用来表达复杂的结构和丰富的语义的一类新的数据模型;通过分析结果确定目标文本信息对应类别的目标事件,类别包括但不限于音乐、视频、商品和/或地名等。其中,语义模型可以预先对若干文本进行训练得到,例如根据全网中采集的页面数据训练后建立语义模型,首先从网址导航站点中,特别是如360手机助手,等移动APP类型的导航页中按各APP的类别分布获取各既定类别,并按各既定类别分别抓取各应用页面上的文字内容,对这些文字内容进行文本分析,按各特征词对应出现的频率和位置权重分别进行统计,各自统计每个特征词与对应既定类别的关联关系,通过支持向量机SVM算法将各特征词和每个既定类别进行训练和分类,得到语义模型。当将目标文本中的关键词输入到语义模型后,分别得到该关键词属于每个既定类别的分值,从而得到特征词属于某个既定类别的概率。
例如,根据用户输入“播个两只老虎吧”,识别出目标文本后,对其进行解析,得到“播”、“两只”、“老虎”、“吧”,去掉虚词“吧”,则特征词为“播”、“两只”、“老虎”,经语义模型进行语义分析后,得到目标事件为“儿歌”。
步骤S130,根据所述目标事件确定所述智能设备中的目标应用程序。
具体的,在通过解析所述语音信息得到目标事件后,进一步根据所述目标事件匹配所述目标应用。
例如,在步骤S120基础上,特征词进行分类得到动词为“播”,量词为“两只”,名词为“老虎”之后,得到目标事件为“儿歌”,则在智能设备本地匹配安装的各系统服务,得到其中的儿歌类的A应用程序分值最高,则将A应用程序作为目标应用。
步骤S140,根据所述目标文本分别调用所述目标应用程序中的活动元素,使所述目标应用程序对所述目标文本进行响应。
调用步骤S120中语义分析的结果,提取所述语义分析的结果中的特征词以及所述特征词对应的相关词与各活动元素分别进行匹配。具体为:提取名词类型的特征词作为第一特征词,分别获取第一特征词对应的相关词,所述相关词为第一特征词所属的类别名称、同义词和近义词等,即在语义分析时将第一特征词发送至服务器,服务器端根据存储的知识库进行查询,在知识库中进行查询,获取第一特征词的相关词,将第一特征词和第一相关词对应的相关词与搜索入口关联。如第一特征词所属的类别名称为多个,则根据排序选取首位的类别名称。优选的,也可以根据用户的目标文本或者目标文本对应的上下文进行文本分析,根据这些文本的语义选取第一特征词的对应类别名称。同时,提取动词类型的第二特征词,根据第二特征词分析对应的触发事件,确定搜索入口被调用的条件。
例如,以第一特征词为“两只老虎”为例,将第一特征词上传到服务器端的知识库中进行查询,得到“儿童安全座椅”、“儿歌”、“理财平台”等类别名称作为相关词,根据上下文中“播放”进行文本分析,则类别名称“儿歌”对应的分值最高,且“两只老虎”没有近义词或同义词,则将类别名称“儿歌”作为第一特征词“两只老虎”对应的相关词,将“儿歌”、“两只老虎”与输入框“textbox”关联,“播放”作为第二特征词进行分析,即获取“两只老虎”的实例后,进行“播放”的事件触发。
本实施例中,将第一特征词“两只老虎”和第一特征词的相关词“儿歌”填入目标应用的搜索框中,获取搜索结果中排序在首位的视频文件,根据第二关键词播放该视频文件作为事件响应,其中,搜索结果的排序方式包括但不限于:按照各搜索结果的更新时间或者按照各搜索结果的搜索热度等等。智能设备即通过目标应用加载“两只老虎”的视频进行播放,调用音频组件播放该视频文件的声音,同时调用视频组件加载该视频文件的图像。
本发明实施例中,通过解析用户输入的语音信息确定目标应用程序,进而调用目标应用程序中的活动元素,对语音信息解析出来的目标文本进行响应。实现了按元素类别调用对应的活动元素,对多特征词输入时分别触发目标应用并响应,极大的方便了用户。
实施例二
图2是本发明实施例二中的一种用于智能设备的信息输入方法的流程图,本实施例在实施例一的基础上,步骤S130之后还包括:抓取各应用程序中的应用界面;分别解析所述应用界面,根据所述应用界面中的页面元素分别确定每项应用程序各自对应的活动元素;在根据所述应用界面中的页面元素确定对应的活动元素之后,还包括:根据所述应用界面中活动元素的所属类型进行筛选。
具体的,本实施例中的智能设备的控制方法包括:步骤S210、步骤S220、步骤S230、步骤S240、步骤S250、步骤S260、步骤S270。
步骤S210,获取用户输入的语音信息。
步骤S220,解析所述语音信息,确定对应的目标文本和目标事件。
步骤S230,根据所述目标事件确定所述智能设备中的目标应用程序。
步骤S240,抓取各应用程序中的应用界面;
具体的,在实际运行过程中,各应用程序中的应用界面是不断变化的,实时加载目标应用中的各应用界面,其中,各应用界面的信息包括应用界面的类别,应用界面首页的文字信息等。
步骤S250,分别解析所述应用界面,根据所述应用界面中的页面元素分别确定每项应用程序各自对应的活动元素。
具体的,实时加载目标应用中的各应用界面,并对应用页面分别进行解析,提取各应用页面分别各自对应的页面元素。本实施例中,活动元素包括但不限于目标应用对应的搜索入口,通常搜索入口由一个文本框和一个按钮组成,对应了目标应用的垂直搜索功能,用于搜索该目标应用对应的资源。垂直搜索是相对通用搜索而言的,通用搜索以综合搜索、横向搜索为主要特点,在满足搜索信息量大的同时却难以兼顾搜索的准确度与相关度的质量,很难满足追求精准的个性化、专业化搜索需求。
优选的,也可以从既定数据库中查找目标应用对应的活动元素,从数据库中读取活动元素和目标应用的对应关系。既定数据库中存储着常见APP和每项活动元素的对应关系,由人工整理而成后进行结构化存储。常见的活动元素为输入框、按钮、下拉式列表框等,智能设备确定目标应用后,即可在既定数据库中进行结构化查询,得到目标应用对应的活动元素进行调用。
步骤S260,根据所述应用界面中活动元素的所属类型进行筛选。
应用界面中活动元素的类型包括:文本框、按钮、广告、详情或者简介等。具体的,根据所述应用界面中的活动元素的类型确定待选活动元素,筛选去掉非互动类的,例如广告等,留下互动类的,例如文本框中根据目标文本搜索,或者如果输入“播放儿歌吧”,则不进行搜索,而是直接在首页推荐中按照排序,播放置于最前面的活动元素对应的儿歌。
步骤S270,根据所述目标文本分别调用所述目标应用程序中的活动元素,使所述目标应用程序对所述目标文本进行响应。
具体的,根据步骤S220中的语义分析的结果,提取所述语音分析的结果中的特征词连同所述特征词的相关词与各活动元素分别进行匹配。根据所述匹配结果触发所述目标应用,使所述目标应用对所述目标文本进行响应,并输出响应结果。
本发明实施例中,通过解析应用界面确定应用程序对应的活动元素,并根据活动元素的所属类型进行筛选,实现对应目标应用程序的确定,进而实现了对目标应用程序的触发。
实施例三
图3是本发明实施例三中的一种智能设备的信息处理方法的流程图,本实施例在实施例一和实施例二的基础上,步骤S130中,根据所述目标文本调用所述目标应用程序中的活动元素包括:将所述目标文本分别与所述目标应用程序中的至少一个待选活动元素相匹配;如果所述目标文本满足至少一个所述待选活动元素的触发条件,则调用满足触发条件的活动元素;如果所述目标文本不满足至少一个所述待选活动元素的触发条件,则调用所述目标应用程序中的默认活动元素。具体的,本实施例中的智能设备的控制方法包括:步骤S310、步骤S320、步骤S330、步骤S340、步骤S350和步骤S360。
步骤S310,获取用户输入的语音信息。
步骤S320,解析所述语音信息,确定对应的目标文本和目标事件。
步骤S330,根据所述目标事件确定所述智能设备中的目标应用程序。
步骤S340,将所述目标文本分别与所述目标应用程序中的至少一个待选活动元素相匹配;
优选的,所述待选活动元素包括搜索入口,活动元素还可以是指文本框、按钮、广告、详情或者简介等;
具体的,目标应用在进行内容资源发布时,内容资源本身往往被定义了相关的关键字作为索引,相关的查询词输入至该搜索入口后,查询词与各内容资源的索引分别进行匹配,即可检索到与查询词对应匹配的内容资源作为目标资源进行输出。
步骤S350,如果所述目标文本满足至少一个所述待选活动元素的触发条件,则调用满足触发条件的活动元素;如果所述目标文本不满足至少一个所述待选活动元素的触发条件,则调用所述目标应用程序中的默认活动元素。
具体的,所述目标文本满足至少一个所述待选活动元素的触发条件包括:所述目标文本与所述搜索入口相关联。当所述目标文本与所述搜索入口相关联时,则调用搜索入口作为活动元素,如果不满足所述目标文本与所述搜索入口相关联,则调用所述目标应用程序中的默认活动元素。
优选的,所述调用满足触发条件的活动元素包括:将所述目标文本对应的特征词填入所述搜索入口进行垂直搜索;触发搜索结果中相应的实例条目。
本实施例中,实时在目标应用的各页面中进行解析,如果哪个页面中含有“textbox”和与其关联的“button”控件,则进行提取,实时提取搜索入口后,即可根据目标文本进行搜索触发,通过目标应用内部的垂直搜索引擎进行搜索,获取目标应用中与目标文本相匹配的内容资源进行输出响应。
具体的,触发所述目标应用时,将所述第一特征词填入所述第一特征词对应关联的活动元素,即将第一特征词填入搜索入口,并在所述第二特征词对应的触发事件下,调用所述第二特征词对应的活动元素对应的触发事件,启动搜索命令,将所述第一特征词传入所述目标应用,得到目标应用的输出后,根据第二特征词进行事件触发。
优选的,所述默认活动元素包括所述目标应用程序中,应用界面对应的推荐区域中的实例条目。
具体的,实例条目可以包括今日推荐、按点击率排名进入和快速搜索等。
步骤S360,使目标应用程序对所述目标文本进行响应。
本发明实施例中,通过对目标文本是否满足至少一个待选活动元素的触发条件的判断,分别调用满足触发条件的活动元素和目标应用程序中的默认元素,实现了利用活动元素对相应目标应用程序进行触发。
实施例四
图4是本发明实施例四中的一种用于智能设备的信息处理装置的结构图。该装置适用于执行本发明实施例一至三中提供的用于智能设备的控制方法,该装置具体包括:获取单元410,解析单元420,目标应用程序确定单元430,操作单元440。
获取单元410,用于获取用户输入的语音信息。
解析单元420,与获取单元410相连,用于解析所述语音信息,确定对应的目标文本和目标事件。
目标应用程序确定单元430,与解析单元420相连,用于根据所述目标事件确定所述智能设备中的目标应用程序。
操作单元440,与目标应用程序确定单元430相连,用于根据所述目标文本分别调用所述目标应用程序中的活动元素,使所述目标应用程序对所述目标文本进行响应。
进一步的,所述装置还包括抓取单元450和活动元素确定单元460。
抓取单元450,与目标应用程序确定单元430相连,用于抓取各应用程序中的应用界面。
活动元素确定单元460,与抓取单元450相连,用于分别解析所述应用界面,根据所述应用界面中的页面元素分别确定每项应用程序各自对应的活动元素。
进一步的,在根据所述应用界面中的页面元素确定对应的活动元素之后,根据所述应用界面中活动元素的所属类型进行筛选。
进一步的,操作单元440包括匹配子单元441和调用子单元442。
匹配子单元441,与目标应用程序确定单元430相连,用于将所述目标文本分别与所述目标应用程序中的至少一个待选活动元素相匹配。
调用子单元442,与匹配子单元441相连,用于如果所述目标文本满足至少一个所述待选活动元素的触发条件,则调用满足触发条件的活动元素;如果所述目标文本不满足至少一个所述待选活动元素的触发条件,则调用所述目标应用程序中的默认活动元素。
进一步的,所述待选活动元素包括搜索入口,所述目标文本满足至少一个所述待选活动元素的触发条件包括:所述目标文本与所述搜索入口相关联。
进一步的,所述调用满足触发条件的活动元素包括:将所述目标文本对应的特征词填入所述搜索入口进行垂直搜索;触发搜索结果中相应的实例条目。
进一步的,所述默认活动元素包括所述目标应用程序中,应用界面对应的推荐区域中的实例条目。
本发明实施例中,通过解析用户输入的语音信息确定目标应用程序,进而调用目标应用程序中的活动元素,对语音信息解析出来的目标文本进行响应。实现了按元素类别调用对应的活动元素,对多特征词输入时分别触发目标应用并响应,极大的方便了用户。
显然,本领域技术人员应该明白,上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。