CN105138357B - 一种移动应用操作助手的实现方法及其装置 - Google Patents
一种移动应用操作助手的实现方法及其装置 Download PDFInfo
- Publication number
- CN105138357B CN105138357B CN201510491002.XA CN201510491002A CN105138357B CN 105138357 B CN105138357 B CN 105138357B CN 201510491002 A CN201510491002 A CN 201510491002A CN 105138357 B CN105138357 B CN 105138357B
- Authority
- CN
- China
- Prior art keywords
- app
- page
- keyword
- information
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明实施例公开了一种移动应用操作助手的实现方法及其装置,其中,该方法包括:爬取APP,记录APP各个页面的操作序列信息;根据存储的APP信息构建倒排索引;根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片;根据APP的操作序列信息构建APP的操作序列树,根据用户点击的关键词和图片计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。实施本发明实施例,实现了APP操作流程的可视化与动态化,解决了文字式阅读APP操作说明的繁琐与不便、以及APP操作流程说明的固定与单一的问题。
Description
技术领域
本发明涉及移动应用(APP)技术领域,尤其涉及一种移动应用操作助手的实现方法及其装置。
背景技术
近几年来,随着手机、平板等移动终端的应用(app)越来越多,人们每天面对的app信息量成爆炸性增长。很多app的使用方法仅仅是基于文字式的说明,只能说明app大体的操作流程,缺少针对用户感兴趣的app内容的操作使用说明,而且这种文字式的操作流程是一种静态的操作流程,操作流程是事先固定的,人们面对这种app操作流程使用帮助往往没有兴趣,并且也缺少与用户的交互性。如何以一种可视化图像动态的操作说明来告诉用户app的使用,并针对用户感兴趣的操作内容检索app中包含用户关注的操作流程是一个在生活中普遍存在且未得到很好解决的问题。
一种终端及其帮助用户操作的方法,预先设定了各种指令集合,然后判断用户当前的指令是否与符合指令集合中的操作,如果符合,则执行预先设定的下一个命令,否则提示用户该指令不正确。这种方法虽然也能帮助用户来学习终端的应用,但是指令集合是事先设定好的,用户如果想要查看其他不在预先设定的其他操作流程,则无法获知某个操作是如何执行的。
又有一种机电产品说明书的具象化处理方法,它主要是通过音像、摄像等技术将产品说明书中的内容拍摄成图像并赋以一定的解说。该方法虽然增加了产品说明的趣味性,但操作过程复杂,依赖人工方式,所形成的图像并不一定是用户感兴趣的操作流程。而且并没有针对用户感兴趣的操作流程进行交互、实时地操作。
在现有技术中,文字式的APP使用说明不仅内容繁杂,用户往往淹没在信息说明中,找不到自己真正想了解的APP中基于某种内容的操作使用说明。具象化的产品说明书需要依赖人工拍摄等操作来建立一套使用说明,操作复杂,且不方便。按照操作指令集来一步一步演示APP使用的方式,需要依赖事先设定好的若干指令,一旦用户选择查看的操作流程不在其事先设定好的操作流程中,用户就不能学习该APP的某种操作,且用户不能去检索感兴趣的APP内容,并基于感兴趣的内容学习APP的操作流程。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种移动应用操作助手的实现方法及其装置,通过图片的APP操作流程实现了APP操作流程的可视化与动态化,解决了文字式阅读APP操作说明的繁琐与不便,及APP操作流程说明的固定与单一的问题。
为了解决上述问题,本发明提出了一种移动应用操作助手的实现方法,所述方法包括:
爬取APP,记录APP各个页面的操作序列信息;
根据数据库中存储的APP信息构建倒排索引;
根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片;
根据APP的操作序列信息构建APP的操作序列树,根据用户点击的关键词和图片计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
优选地,所述爬取APP,记录APP各个页面的操作序列信息的步骤包括:
根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;
对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;
对于获取的APK文件,在虚拟机设备中安装该APK文件,得到安装后的APP;
截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存,获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;
若候选事件集合为空,将所有页面对应的四元组信息{currentPictureId,parentPictureId,text,picturePath}、APP的描述信息、APP名称储存到数据库中。
优选地,所述根据数据库中存储的APP信息构建倒排索引的步骤,包括:
从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息;
提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;
获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;
对每个APP的大文件构建正排索引;
读取每个APP对应的正排索引文件,构建倒排索引。
优选地,所述根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序的步骤,包括:
对用户输入的检索关键词集合进行分词,并去噪处理;
读取倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;
若用户输入的关键词集合在词典映射表中,则筛选出同时包含用户输入的去噪后的所有关键词的APP集合;
对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;
将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
优选地,所述展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片的步骤,包括:
按照先后顺序依次展示该APP的关键词信息及该APP所有页面的图片信息;
记录用户在界面上点击的APP中的关键词、页面的图片id和APP名称;
若点击的关键词和点击的页面的图片均属于同一个APP,并且所点击的图片对应的文本信息是包含该关键字时,则将记录信息:APP名称、关键词、图片id,组织成三元组{APPName,keyword,picId}信息并保存。
优选地,所述根据APP的操作序列信息,构建APP的操作序列树,根据用户点击的关键词和图片,计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程的步骤,包括:
根据获得的三元组信息中的APP名称获取该APP的操作序列;
根据操作序列将操作序列树中的节点数据形式设定为:页面图片id、父页面、子页面集合、子页面个数;
切分操作序列,经切分后得到若干个{当前页面图片编号,当前页面的父页面图片编号}的二元组;
每读取一个二元组,获取当前页面图片编号,找到页面节点数组中对应下标的节点,记为currentNode节点;获取当前页面的父页面的图片编号,找到页面节点数组中对应下标的节点,记为parentNode节点;
设置currentNode的父页面节点为parentNode节点,设置parentNode节点的子页面节点为currentNode节点;若currentNode节点的页面编号与用户点击的页面的图片编号picId相同,则保存该currentNode节点,记为点击的页面节点clickNode;
若所有二元组全部处理结束,则根据此时已经建立好的操作序列树和点击的页面节点clickNode,采用自底向上的遍历方式,保存当前正在遍历的页面节点的id编号并加入到操作路径中,递归该页面节点的父节点;
若当前正在遍历的节点不为空,则返回上一步骤;
结束遍历,得到一个从点击页面id编号到初始页面id编号的完整路径;
逆向遍历该路径,得到从初始页面到点击页面的完整APP操作流程路径;
根据得到的从初始页面到点击页面的完整APP操作流程路径,按顺序遍历该路径,获取路径上每一个页面id,读取该页面id对应的页面路径,根据页面路径展示在界面上,得到一个基于APP操作内容的从初始页面出发到用户点击的想要查看的页面图片的完整APP操作流程图。
相应地,本发明还提供一种移动应用操作助手的实现装置,所述实现装置包括:
爬取模块,用于爬取APP,记录APP各个页面的操作序列信息;
倒排索引构建模块,用于根据数据库中存储的APP信息构建倒排索引;
检索处理模块,用于根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
操作序列树构建模块,用于根据APP的操作序列信息,构建APP的操作序列树,根据用户点击的关键词和图片,计算操作路径;
展示模块,用于根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
优选地,所述爬取模块还用于根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;对于获取的APK文件,在虚拟机设备中安装该APK文件,得到安装后的APP;截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存,获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;若候选事件集合为空,将所有页面对应的四元组信息{currentPictureId,parentPictureId,text,picturePath}、APP的描述信息、APP名称储存到数据库中。
优选地,所述倒排索引构建模块还用于从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息;提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;对每个APP的大文件构建正排索引;读取每个APP对应的正排索引文件,构建倒排索引。
优选地,所述检索处理模块还用于对用户输入的检索关键词集合进行分词,并去噪处理;读取倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;若用户输入的关键词集合在词典映射表中,则筛选出同时包含用户输入的去噪后的所有关键词的APP集合;对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
在本发明实施例中,通过图片的APP操作流程实现了APP操作流程的可视化与动态化,解决了文字式阅读APP操作说明的繁琐与不便、及APP操作流程说明的固定与单一的问题,并且基于用户感兴趣内容的操作,实现了针对特定用户的APP操作流程的动态展示;另外,解决了文字式APP操作流程说明和静态APP操作流程中不能完全覆盖所有操作的缺点,达到APP所有操作流程可动态查找、全部覆盖的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的移动应用操作助手的实现方法的流程示意图;
图2是本发明实施例的移动应用操作助手的实现装置的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例的移动应用操作助手的实现方法的流程示意图,如图1所示,该方法包括:
S1,爬取APP,记录APP各个页面的操作序列信息;
S2,根据数据库中存储的APP信息构建倒排索引;
S3,根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
S4,展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片;
S5,根据APP的操作序列信息构建APP的操作序列树,根据用户点击的关键词和图片计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
其中,S1进一步包括:
根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;本发明实施例中,APP为Android APP;
对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;
对于获取的APK文件,在虚拟机设备(安卓虚拟机设备,AVD)中安装该APK文件,得到安装后的APP;
截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存;通过ViewServer获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;
对于选择的事件,通过安卓命令执行工具Monkey执行该事件,如果当前页面中没有任何事件可以执行,则执行返回事件,返回截取当前页面的图片步骤;
若候选事件集合为空,将所有页面对应的四元组信息、APP的描述信息、APP名称储存到数据库中,所述数据库为非关系型数据库,可以动态扩展。
若所有APP全部处理完毕,则结束。
进一步地,S2包括:
从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息{currentPictureId,parentPictureId,text,picturePath,keyWords},该四元组信息是S1中得到的四元组信息;
提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;
获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;
对每个APP的大文件构建正排索引,该正排索引结构如下:<关键字,{关键字出现次数,[关键字在大文件中的位置1,位置2,….,位置n]},保存每个关键字对应的正排索引信息,将所有关键字的正排索引信息写入到该APP对应的正排索引文件中;
读取每个APP对应的正排索引文件,采用哈希映射和拉链表的方法构建倒排索引。倒排索引结构如下:
关键词、总出现次数、包含该关键词的APP个数#APP1名称、出现次数、出现位置集合、该APP中所有单词个数#…#APPn名称、出现次数、出现位置集合、该APP中所有单词个数。
进一步地,S3包括:
对用户输入的检索关键词集合进行分词,并去噪处理;
读取S2中已经构建好的倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;
若用户输入的关键词集合在词典映射表中,则进行布尔过滤,筛选出同时包含用户输入的去噪后的所有关键词的APP集合;
对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;其中,按照公式(1)、(2)、(3)计算包含关键词的APP的tf-idf权重值;
上述公式中,k1,k2,…kn表示用户输入的第一个关键词,第二个关键词,…,第n个关键词。j表示APP文档编号。tfi,j表示APP文档dj中关键词ki出现的次数,idfi表示关键词ki的逆文档频率;
ni,j表示关键词ki在文档dj出现的次数,∑knk,j表示文档dj中所有关键词的个数。|D|表示所有APP文档个数,|j:ki∈dj|表示包含关键词ki的APP文档个数。
将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
进一步地,S4包括:
按照先后顺序依次展示该APP的关键词信息及该APP所有页面的图片信息;
记录用户在界面上点击的APP中的关键词、页面的图片id和APP名称;
若点击的关键词和点击的页面的图片均属于同一个APP,并且所点击的图片对应的文本信息是包含该关键字时,则将记录信息:APP名称、关键词、图片id,组织成三元组{APPName,keyword,picId}信息并保存。
进一步地,S5包括:
根据S4中获得的三元组信息中的APP名称获取该APP的操作序列,该操作序列信息是S2中获取的操作序列,即(当前APP页面图片编号,当前APP页面的父页面图片编号)的多个二元组所组成的该APP的完整操作序列信息;
根据操作序列将操作序列树中的节点数据形式设定为:页面图片id、父页面、子页面集合、子页面个数;组织上述信息形成如下节点结构信息:
PageNode{
PageId;
PageNode*parent;
PageNode*childs[MAXSIZE];
ChildNum;
};
切分操作序列,经切分后得到若干个{当前页面图片编号,当前页面的父页面图片编号}的二元组。根据操作序列中二元组的长度,建立一个该长度的页面节点数组;
每读取一个二元组,获取当前页面图片编号,找到页面节点数组中对应下标的节点,记为currentNode节点;获取当前页面的父页面的图片编号,找到页面节点数组中对应下标的节点,记为parentNode节点;
设置currentNode的父页面节点为parentNode节点,设置parentNode节点的子页面节点为currentNode节点;若currentNode节点的页面编号与S4中记录三元组信息{APPName,keyword,picId}中的用户点击的页面的图片编号picId相同,则保存该currentNode节点,记为点击的页面节点clickNode;
若所有二元组全部处理结束,则根据此时已经建立好的操作序列树和点击的页面节点clickNode,采用自底向上的遍历方式,保存当前正在遍历的页面节点的id编号并加入到操作路径中,递归该页面节点的父节点;
若当前正在遍历的节点不为空,则返回上一步骤;
结束遍历,得到一个从点击页面id编号到初始页面id编号的完整路径;
逆向遍历该路径,得到从初始页面到点击页面的完整APP操作流程路径;
根据得到的从初始页面到点击页面的完整APP操作流程路径,按顺序遍历该路径,获取路径上每一个页面id,读取该页面id对应的页面路径,根据页面路径展示在界面上,得到一个基于APP操作内容的从初始页面出发到用户点击的想要查看的页面图片的完整APP操作流程图。
相应地,本发明实施例还提供一种移动应用操作助手的实现装置,如图2所示,该实现装置包括:
爬取模块1,用于爬取APP,记录APP各个页面的操作序列信息;
倒排索引构建模块2,用于根据数据库中存储的APP信息构建倒排索引;
检索处理模块3,用于根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
操作序列树构建模块4,用于根据APP的操作序列信息,构建APP的操作序列树,根据用户点击的关键词和图片,计算操作路径;
展示模块5,用于根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
其中,爬取模块1还用于根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;对于获取的APK文件,在虚拟机设备中安装该APK文件,得到安装后的APP;截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存,获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;若候选事件集合为空,将所有页面对应的四元组信息、APP的描述信息、APP名称储存到数据库中。
倒排索引构建模块2还用于从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息;提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;对每个APP的大文件构建正排索引;读取每个APP对应的正排索引文件,构建倒排索引。
检索处理模块3还用于对用户输入的检索关键词集合进行分词,并去噪处理;读取倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;若用户输入的关键词集合在词典映射表中,则筛选出同时包含用户输入的去噪后的所有关键词的APP集合;对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
本发明的装置实施例中各功能模块的功能可参见本发明方法实施例中的流程处理,这里不再赘述。
在本发明实施例中,通过图片的APP操作流程实现了APP操作流程的可视化与动态化,解决了文字式阅读APP操作说明的繁琐与不便,解决了APP操作流程说明的固定与单一的问题,并且基于用户感兴趣内容的操作,实现了针对特定用户的APP操作流程的动态展示;另外,解决了文字式APP操作流程说明和静态APP操作流程中不能完全覆盖所有操作的缺点,达到APP所有操作流程可动态查找、全部覆盖的目的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的移动应用操作助手的实现方法及其装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种移动应用操作助手的实现方法,其特征在于,所述方法包括:
爬取APP,记录APP各个页面的操作序列信息;
根据数据库中存储的APP信息构建倒排索引;
根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片;
根据APP的操作序列信息构建APP的操作序列树,根据用户点击的关键词和图片计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
2.如权利要求1所述的移动应用操作助手的实现方法,其特征在于,所述爬取APP,记录APP各个页面的操作序列信息的步骤包括:
根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;
对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;
对于获取的APK文件,在虚拟机设备中安装该APK文件,得到安装后的APP;
截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存,获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;
若候选事件集合为空,将所有页面对应的四元组信息{currentPictureId,parentPictureId,text,picturePath}、APP的描述信息、APP名称储存到数据库中。
3.如权利要求2所述的移动应用操作助手的实现方法,其特征在于,所述根据数据库中存储的APP信息构建倒排索引的步骤,包括:
从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息;
提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;
获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;
对每个APP的大文件构建正排索引;
读取每个APP对应的正排索引文件,构建倒排索引。
4.如权利要求1所述的移动应用操作助手的实现方法,其特征在于,所述根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序的步骤,包括:
对用户输入的检索关键词集合进行分词,并去噪处理;
读取倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;
若用户输入的关键词集合在词典映射表中,则筛选出同时包含用户输入的去噪后的所有关键词的APP集合;
对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;
将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
5.如权利要求1所述的移动应用操作助手的实现方法,其特征在于,所述展示符合要求的APP的相关信息,记录用户点击的APP的关键词和图片的步骤,包括:
按照先后顺序依次展示该APP的关键词信息及该APP所有页面的图片信息;
记录用户在界面上点击的APP中的关键词、页面的图片id和APP名称;
若点击的关键词和点击的页面的图片均属于同一个APP,并且所点击的图片对应的文本信息是包含该关键字时,则将记录信息:APP名称、关键词、图片id,组织成三元组{APPName,keyword,picId}信息并保存。
6.如权利要求5所述的移动应用操作助手的实现方法,其特征在于,所述根据APP的操作序列信息构建APP的操作序列树,根据用户点击的关键词和图片计算操作路径,并根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程的步骤,包括:
根据获得的三元组信息中的APP名称获取该APP的操作序列;
根据操作序列将操作序列树中的节点数据形式设定为:页面图片id、父页面、子页面集合、子页面个数;
切分操作序列,经切分后得到若干个{当前页面图片编号,当前页面的父页面图片编号}的二元组;
每读取一个二元组,获取当前页面图片编号,找到页面节点数组中对应下标的节点,记为currentNode节点;获取当前页面的父页面的图片编号,找到页面节点数组中对应下标的节点,记为parentNode节点;
设置currentNode的父页面节点为parentNode节点,设置parentNode节点的子页面节点为currentNode节点;若currentNode节点的页面编号与用户点击的页面的图片编号picId相同,则保存该currentNode节点,记为点击的页面节点clickNode;
若所有二元组全部处理结束,则根据此时已经建立好的操作序列树和点击的页面节点clickNode,采用自底向上的遍历方式,保存当前正在遍历的页面节点的id编号并加入到操作路径中,递归该页面节点的父节点;
若当前正在遍历的节点不为空,则返回上一步骤;
结束遍历,得到一个从点击页面id编号到初始页面id编号的完整路径;
逆向遍历该路径,得到从初始页面到点击页面的完整APP操作流程路径;
根据得到的从初始页面到点击页面的完整APP操作流程路径,按顺序遍历该路径,获取路径上每一个页面id,读取该页面id对应的页面路径,根据页面路径展示在界面上,得到一个基于APP操作内容的从初始页面出发到用户点击的想要查看的页面图片的完整APP操作流程图。
7.一种移动应用操作助手的实现装置,其特征在于,所述实现装置包括:
爬取模块,用于爬取APP,记录APP各个页面的操作序列信息;
倒排索引构建模块,用于根据数据库中存储的APP信息构建倒排索引;
检索处理模块,用于根据用户的检索关键字在倒排索引中查询符合要求的APP,对符合要求的APP计算权重,将符合要求的APP按照权重从高到低排序;
操作序列树构建模块,用于根据APP的操作序列信息,构建APP的操作序列树,根据用户点击的关键词和图片,计算操作路径;
展示模块,用于根据操作路径展示从初始图片到当前点击图片的完整操作路径的APP操作流程。
8.如权利要求7所述的移动应用操作助手的实现装置,其特征在于,所述爬取模块还用于根据设定的APP下载地址,通过爬虫方式下载APP对应的APK文件;对每个APK文件的Androidmanifest.xml文件,通过反编译获取该APP中的控件列表、start class信息;对于获取的APK文件,在虚拟机设备中安装该APK文件,得到安装后的APP;截取当前页面的图片,并赋予当前图片一个编号,该编号从初始为0逐次累加,并获取当前页面对应的文本描述信息,记录当前页面编号和当前页面的父页面编号,将数据形式设定为:当前图片编号、当前图片的父图片编号、当前图片对应的文本描述信息、当前图片路径,并将四者组成四元组{currentPictureId,parentPictureId,text,picturePath}并保存,获取该页面中可执行的控件,形成候选事件集合,从候选事件集合中选择某个事件,执行选择的事件;若候选事件集合为空,将所有页面对应的四元组信息{currentPictureId,parentPictureId,text,picturePath}、APP的描述信息、APP名称储存到数据库中。
9.如权利要求8所述的移动应用操作助手的实现装置,其特征在于,所述倒排索引构建模块还用于从数据库中提取出每个APP的每个页面对应的文本信息,对文本信息进行分词,提取该页面的文本信息中的关键字,将该页面的关键字存储至数据库中该APP的页面的四元组信息{currentPictureId,parentPictureId,text,picturePath}中,构造成五元组信息;提取每个APP每个页面的四元组信息中的{currentPictureId,parentPictureId}部分,组成该APP的操作序列,并存入数据库对应的APP中;获取该APP中每个页面对应的文本信息,读取这些文本信息写入到大文件中,将该大文件进行分词处理,统计每个关键词的词频,将关键字和词频信息存至数据库对应的APP中;对每个APP的大文件构建正排索引;读取每个APP对应的正排索引文件,构建倒排索引。
10.如权利要求7所述的移动应用操作助手的实现装置,其特征在于,所述检索处理模块还用于对用户输入的检索关键词集合进行分词,并去噪处理;读取倒排索引文件中的每一个关键词,构成{关键词,(倒排索引文件名,该关键词在倒排索引文件名中的行号)}的映射,组合所有关键词的映射得到词典映射表;若用户输入的关键词集合在词典映射表中,则筛选出同时包含用户输入的去噪后的所有关键词的APP集合;对筛选出的APP集合计算包含关键词的APP的tf-idf权重值;将计算后的权重值按照从大到小排序,按照该排序将符合要求的APP集合进行返回。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510491002.XA CN105138357B (zh) | 2015-08-11 | 2015-08-11 | 一种移动应用操作助手的实现方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510491002.XA CN105138357B (zh) | 2015-08-11 | 2015-08-11 | 一种移动应用操作助手的实现方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105138357A CN105138357A (zh) | 2015-12-09 |
CN105138357B true CN105138357B (zh) | 2018-05-01 |
Family
ID=54723714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510491002.XA Active CN105138357B (zh) | 2015-08-11 | 2015-08-11 | 一种移动应用操作助手的实现方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105138357B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930536B (zh) * | 2016-06-21 | 2019-12-27 | 北京小米移动软件有限公司 | 索引建立方法、页面跳转方法及装置 |
FR3055992A1 (fr) * | 2016-09-09 | 2018-03-16 | Proton World International N.V. | Gestion d'index dans une memoire flash |
CN108009078B (zh) | 2016-11-01 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种应用界面遍历方法、系统和测试设备 |
CN110908567B (zh) * | 2018-09-18 | 2022-11-01 | 深圳市鸿合创新信息技术有限责任公司 | 一种终端助手装置及方法、电子设备 |
CN111243580B (zh) * | 2018-11-28 | 2023-06-09 | Tcl科技集团股份有限公司 | 语音控制方法、装置及计算机可读存储介质 |
CN110032597B (zh) * | 2018-11-30 | 2023-04-11 | 创新先进技术有限公司 | 应用程序操作行为的可视化处理方法及装置 |
CN111382211A (zh) * | 2020-02-10 | 2020-07-07 | 北京物资学院 | 一种对数据的概述方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7340450B2 (en) * | 2003-03-14 | 2008-03-04 | Hewlett-Packard Development Company, L.P. | Data search system and data search method using a global unique identifier |
CN101344889A (zh) * | 2008-07-31 | 2009-01-14 | 中国农业大学 | 一种网络信息抽取的方法和系统 |
CN102087648A (zh) * | 2009-12-03 | 2011-06-08 | 北京大学 | 一种新闻评论页面的爬取方法及系统 |
CN103402137A (zh) * | 2013-08-28 | 2013-11-20 | 深圳市比维视创科技有限公司 | 一种应用推送方法、移动终端以及数字电视接收端 |
CN103886020A (zh) * | 2014-02-21 | 2014-06-25 | 杭州电子科技大学 | 一种房地产信息快速搜索方法 |
CN104239340A (zh) * | 2013-06-19 | 2014-12-24 | 北京搜狗信息服务有限公司 | 搜索结果筛选方法与装置 |
CN104407778A (zh) * | 2014-12-10 | 2015-03-11 | 上海斐讯数据通信技术有限公司 | 移动终端及所适用的界面返回方法 |
-
2015
- 2015-08-11 CN CN201510491002.XA patent/CN105138357B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7340450B2 (en) * | 2003-03-14 | 2008-03-04 | Hewlett-Packard Development Company, L.P. | Data search system and data search method using a global unique identifier |
CN101344889A (zh) * | 2008-07-31 | 2009-01-14 | 中国农业大学 | 一种网络信息抽取的方法和系统 |
CN102087648A (zh) * | 2009-12-03 | 2011-06-08 | 北京大学 | 一种新闻评论页面的爬取方法及系统 |
CN104239340A (zh) * | 2013-06-19 | 2014-12-24 | 北京搜狗信息服务有限公司 | 搜索结果筛选方法与装置 |
CN103402137A (zh) * | 2013-08-28 | 2013-11-20 | 深圳市比维视创科技有限公司 | 一种应用推送方法、移动终端以及数字电视接收端 |
CN103886020A (zh) * | 2014-02-21 | 2014-06-25 | 杭州电子科技大学 | 一种房地产信息快速搜索方法 |
CN104407778A (zh) * | 2014-12-10 | 2015-03-11 | 上海斐讯数据通信技术有限公司 | 移动终端及所适用的界面返回方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105138357A (zh) | 2015-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105138357B (zh) | 一种移动应用操作助手的实现方法及其装置 | |
JP6286104B2 (ja) | ソーシャルネットワーク情報ストリームの表示方法、装置、サーバ、プログラム及び記録媒体 | |
US9659278B2 (en) | Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content | |
US9710526B2 (en) | Data set preview technology | |
WO2022166579A1 (zh) | 信息展示的方法、装置以及计算机存储介质 | |
CN103544176B (zh) | 用于生成多个页面所对应的页面结构模板的方法和设备 | |
WO2012116287A1 (en) | Methods for electronic document searching and graphically representing electronic document searches | |
Weiler et al. | Event identification and tracking in social media streaming data | |
US9407589B2 (en) | System and method for following topics in an electronic textual conversation | |
CN104281648B (zh) | 基于维度标签的搜索结果多维度导航方法 | |
KR101556743B1 (ko) | 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법 | |
DE112013001829T5 (de) | Verfahren, Gerät und Computerprogrammprodukt zur visuellen Gruppierung von Beziehungen von Datenbanken | |
CN115618075A (zh) | 一种搜索结果展示方法及装置 | |
CN110515618B (zh) | 页面信息录入优化方法、设备、存储介质及装置 | |
Nowak | Images of nuclear war in US government films from the early Cold War | |
CN113407678A (zh) | 知识图谱构建方法、装置和设备 | |
Banu et al. | A novel ensemble vision based deep web data extraction technique for web mining applications | |
CN106599076B (zh) | 论坛导图的生成方法及装置 | |
CN105138548A (zh) | 汉泰双语平行语料自动采集的系统及实现方法 | |
Nizamee et al. | Visualizing the web search results with web search visualization using scatter plot | |
KR20200125409A (ko) | 여행 속성 언어 관리 방법 및 장치 | |
Ismail et al. | 2D visualization of terms and documents in Malay language | |
van Oosterom et al. | Results of the public usability testing of a web-based 3D cadastral visualization system | |
Lui et al. | KANDINSKY: abstract art-inspired visualization of social discussions | |
JP2005122683A (ja) | 情報提供方法及びシステム及び情報提供プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |