CN110750561A - 一种关联应用程序挖掘的方法及装置 - Google Patents
一种关联应用程序挖掘的方法及装置 Download PDFInfo
- Publication number
- CN110750561A CN110750561A CN201810801266.4A CN201810801266A CN110750561A CN 110750561 A CN110750561 A CN 110750561A CN 201810801266 A CN201810801266 A CN 201810801266A CN 110750561 A CN110750561 A CN 110750561A
- Authority
- CN
- China
- Prior art keywords
- behavior data
- application program
- mining
- frequent
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于移动终端领域,提供了一种关联应用程序挖掘的方法及装置,包括:首先获取用户操作移动终端的原始行为数据;然后对原始行为数据进行预处理以获取目标行为数据;再将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式;最后根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序;由于对用户操作移动终端的原始行为数据处理得到的特征点行为数据进行频繁项挖掘,并获取到与预设应用程序对应的关联应用程序,故可以在用户操作预设应用程序后提示关联应用程序,有效避免了在移动终端上寻找关联应用程序时便捷性差的缺陷,提高了移动终端的操作效率。
Description
技术领域
本发明属于移动终端领域,尤其涉及一种关联应用程序挖掘的方法及装置。
背景技术
人们在日常生活中会有表现出很多生活习惯,比如用户A刚回到家就经常打开电视之后接着就开始烧开水,用户B总是在某个时间点开始打开洗衣机的同时接着使用热水冲凉。再以移动终端的用户使用习惯为例,比如有的用户使用手机连接蓝牙耳机设备之后就开始蓝牙听音乐,打电话或者微信语音聊天等动作;又比如有的用户到家连接到家里WIFI无线热点之后,往往会打开移动终端上的视频应用程序来看视频或者播放音乐;再比如有的用户到达公司办公室之后就开始打开移动终端上的各种办公软件来辅助办公。
也就是说,经过观察用户使用终端的行为习惯,可以发现用户在某些动作之后存在后续动作关联性,也就是用户使用移动终端如果发生了某个事件J,则接下来往往会看到终端发生事件P(比如打开某个应用程序),并且这种概率是大部分情况都会出现的,比如上面说到的蓝牙耳机连接到手机终端之后,接下来我们往往可以看到用户打开音乐应用程序或者微信电话等使用蓝牙耳机来听歌或通话。
但是现在用户在移动终端上往往安装了很多应用软件程序,因为很多之前不能在手机上完成的事情况现在都可以在手机实现,并且各个应用功能不同。一般情况下,用户手机终端上都会安装有几十个桌面应用程序,那么问题来了,根据如上的介绍,用户操作移动终端在发生了某个事件之后接下来往往可以看到发生与之关联的另一个事件,并且这个事件一般是由用户打开移动终端上的某一个或者多个应用来实现的,然而现在终端上安装的应用程序已经很多,这样就会存在一个问题,就是用户为了打开关联应用程序,得花上一点时间在桌面去寻找到想要打开的应用程序,虽然按照一般行为习惯,用户会去打开关联应用程序,但是这个寻找关联应用程序的过程在现在移动终端上还是不可避免的。虽然微信上现在出现小程序可集中应用,但是于改善当前这种应用程序过多的状况所带来的寻找效率问题还是会依然存在。
综上所述,传统技术存在用户操作移动终端的某个应用程序之后需要花费大量时间在桌面上寻找关联应用程序,从而导致在移动终端上寻找关联应用程序的便捷性差的问题。
发明内容
有鉴于此,本发明实施例提供了一种关联应用程序挖掘的方法及装置,旨在解决传统技术在移动终端上寻找关联应用程序的便捷性差的问题。
本发明实施例的第一方面提供了一种关联应用程序挖掘的方法,包括:
获取用户操作移动终端的原始行为数据;
对所述原始行为数据进行预处理以获取目标行为数据;
将所述目标行为数据转换为特征点行为数据;所述特征点行为数据符合频繁项挖掘算法的数据格式;
根据所述频繁项挖掘算法和所述特征点行为数据确定与预设应用程序对应的关联应用程序。
本发明实施例的第二方面提供了一种关联应用程序挖掘的装置,包括:
原始行为数据获取模块,用于获取用户操作移动终端的原始行为数据;
目标行为数据获取模块,对所述原始行为数据进行预处理以获取目标行为数据;
特征点行为数据转换模块,用于将所述目标行为数据转换为特征点行为数据;所述特征点行为数据符合频繁项挖掘算法的数据格式;
关联应用程序确定模块,用于根据所述频繁项挖掘算法和所述特征点行为数据确定与预设应用程序对应的关联应用程序。
本发明实施例的第三方面提供了一种关联应用程序挖掘的装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述关联应用程序挖掘的方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述关联应用程序挖掘的方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:首先获取用户操作移动终端的原始行为数据;然后对原始行为数据进行预处理以获取目标行为数据;再将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式;最后根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序;由于对用户操作移动终端的原始行为数据处理得到的特征点行为数据进行频繁项挖掘,并获取到与预设应用程序对应的关联应用程序,故可以在用户操作预设应用程序后提示关联应用程序,有效避免了在移动终端上寻找关联应用程序时便捷性差的缺陷,提高了移动终端的操作效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的关联应用程序挖掘的方法的一种实现流程示意图;
图2是本发明实施例提供的特征点行为数据和频繁项数据的示意图;
图3是本发明实施例提供的频繁项数据和频繁模式树的示意图;
图4是本发明实施例提供的频繁模式树和条件模式基的示意图;
图5是本发明实施例提供的条件模式基和条件频繁模式树的示意图;
图6是本发明实施例提供的关联应用程序挖掘的方法的另一种实现流程示意图;
图7是本发明实施例提供的关联应用程序挖掘的装置的一种示意图;
图8是本发明实施例提供的关联应用程序挖掘的装置的另一种示意图;
图9是本发明实施例提供的关联应用程序挖掘的装置目标行为数据获取模块的一种示意图;
图10是本发明实施例提供的关联应用程序挖掘的装置特征点行为数据转换模块的一种示意图;
图11是本发明实施例提供的关联应用程序挖掘的装置关联应用程序确定模块的一种示意图;
图12是本发明实施例提供的关联应用程序挖掘的装置的另一种示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的关联应用程序挖掘的方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤101中,获取用户操作移动终端的原始行为数据。
步骤101可以具体为:根据控制事件监听用户对终端的操作以获取日志信息。以蓝牙连接关联应用为例,当蓝牙连接状态处于从关闭状态到连接状态时(手机蓝牙与某个外设进行连接),则开始记录用户操作手机的日志信息;相反,如果蓝牙连接状态处于关闭状态时,则可以停止记录日志信息。
原始行为数据指包含有控制事件的历史行为数据,将历史行为数据作为日志信息保存到移动终端的文件中。经过一段时间收集之后,即可得到用户操作终端的原始行为数据。原始行为数据可以包括应用程序名称、应用程序打开时间、经度、纬度和蓝牙状态中的至少一个。
在步骤102中,对原始行为数据进行预处理以获取目标行为数据。
具体实施中,步骤102可以包括步骤102-1和步骤102-2。
在步骤102-1中,根据日志信息和系统时间生成多维行为数据。
步骤102-1可以具体为:根据日志信息提取第二多维行为数据,将系统时间转换为格式化时间,并合并第二多维行为数据、系统时间和格式化时间以获取多维行为数据,最后按照系统时间对多维行为数据进行排序。
在步骤102-2中,删除多维行为数据中的系统时间相同的重复数据以生成目标行为数据。系统时间相同的重复数据会干扰后续的特征点提取,故需要删除。
在步骤103中,将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式。
从处理后的目标行为数据中提取有效特征,并且将目标行为数据转换成频繁项挖掘算法所需要的数据格式,以方便进行频繁项挖掘算法处理。
具体实施中,步骤103可以包括步骤103至步骤103-3。
在步骤103-1中,删除目标行为数据中的异常数据以获取有效行为数据;
其中,异常数据的类型、原因、数据特点、处理方式和处理依据如下表:
在步骤103-2中,将有效行为数据中的应用程序名称变更为整数型字符。
因为频繁项挖掘算法的输入数据类型就是整数型,所以需要把不同的应用程序名称按照从预设数字开始增1赋值以将应用程序名称变更为整数型字符。
在步骤103-3中,提取每次控制事件对应的整数型字符以获取特征点行为数据。步骤103-3可以具体为:提取出每次控制事件触发后,开启的每个应用程序对应的整数型字符,以形成应用列表项。
在步骤104中,根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序。
具体实施中,步骤104可以包括步骤104-1至步骤104-5。
在步骤104-1中,删除特征点行为数据中的出现次数少于预设次数的应用程序以获取频繁项数据。
步骤104-1可以具体为:扫描特征点行为数据,删除特征点行为数据中的出现次数少于预设次数的应用程序,得到频繁项数据。
例如,如图2所示,对特征点行为数据进行如上处理,删除少于预设次数的应用程序(d、g、i、f、l、o、j、h、k、s、e以及n)后,获取到频繁项数据。
在步骤104-2中,根据频繁项数据建立频繁模式树。频繁模式树可以为FP-tree。
步骤104-2可以具体包括:
A.扫描频繁项数据,获得频繁项数据中所包含的全部频繁项集,及频繁项各自的支持度。对全部频繁项集中的频繁项按其支持度降序排序得到频繁项列表L。例如,有频繁项列表:L=<(f:4),(c:4),(a:3),(b:3),(m:3),(p:3)>;其中f、c、a等字符代表控制事件或者与控制事件关联的应用。
B.创建频繁模式树的根结点T,以“null”标记。再次扫描频繁项数据。对于频繁项数据中每个事项,将其中的频繁项选出并按频繁项列表中的次序排序。设排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的频繁项。调用insert_tree([p|P],T)。
其中,insert_tree([p|P],T)过程执行情况如下:如果T有子女N使N.item_name=p.item_name,则N的计数增加1;否则创建一个新结点N,将其计数设置为1,链接到它的父结点T,并且通过node_link将其链接到具有相同item_name的结点。如果P非空,递归地调用insert_tree(P,N)。
例如,根据如图2所示的频繁项数据建立如图3所示的频繁模式树。
频繁模式树是一个高度压缩的结构,它存储了用于挖掘频繁项集的全部信息。频繁模式树所占用的内存空间与树的深度和宽度成比例,树的深度一般是单个事务中所含项目数量的最大值;树的宽度是平均每层所含项目的数量。由于在事务处理中通常会存在着大量的共享频繁项,所以树的大小通常比原数据库小很多。频繁项集中的项以支持度降序排列,支持度越高的项与频繁模式树的根距离越近,因此有更多的机会共享结点,这进一步保证了频繁模式树的高度压缩。
在步骤104-3中,获取频繁模式树中的预设应用程序的条件模式基;条件模式基为预设应用程序在频繁模式树中的所有前缀节点链。
步骤104-3可以具体为:获取所有包含该预设应用程序的前缀路径,这些前缀路径就是该预设应用程序的条件模式基。所有这些条件模式基的支持度为该路径上预设应用程序的支持度。
比如,如图4所示,包含p的其中一条路径是fcamp,该路径中p的支持度为2,则该条件模式基fcam的支持度为2。在频繁模式树中以p结尾的节点链共有两条,分别是<(f:4),(c:3),(a:3),(m:2),(p:2)>和<(c:1),(b:1),(p:1)>。其中,第一条节点链表表示用户打开的应用程序清单<f,c,a,m,p>在数据库中共出现了两次。需要注意到是,尽管<f,c,a>在第一条节点链中出现了3次,单个应用程序<f>出现了4次,但是它们与p一起出现只有2次,所以在条件FP-tree中将<(f:4),(c:3),(a:3),(m:2),(p:2)>记为<(f:2),(c:2),(a:2),(m:2),(p:2)>。同理,第二条节点链表示蓝牙另一次连接用户打开的应用清单<c,b,p>,在数据库中只出现了一次。故将p的前缀节点链<(f:2),(c:2),(a:2),(m:2)>和<(c:1),(b:1)>称为p的条件模式基。
在步骤104-4中,根据条件模式基和预设应用程序的支持度建立预设应用程序的条件频繁模式树。
步骤104-4可以具体为:累加每个条件模式基上的应用程序的支持度(计数),过滤低于最小支持度的应用程序,以构建条件FP-tree;例如,如图5所示,m的条件模式基为{<fca:2>,<fcab:1>},其中,f的支持度为3,c的支持度为3,a的支持度为3,b的支持度为1,最小支持度假设为3,则过滤掉b并获取到m的条件频繁模式树。
在步骤104-5中,根据条件频繁模式树获取与预设应用程序对应的关联应用程序。
获取条件频繁模式树中每个应用程序的支持度,将支持度大于预设支持度的应用程序作为与预设应用程序对应的关联应用程序。
可以递归挖掘每个应用程序的条件频繁模式树,并根据每个应用程序的条件频繁模式树获取每个应用程序的关联应用程序。
其中,如图6所示,在步骤105之前还包括步骤106和步骤107。
在步骤106中,判断是否接收到预设应用程序开启指令。
在步骤107中,若接收到预设应用程序开启指令,则提示关联应用程序。
为了实现上述关联应用程序挖掘的方法,本发明实施例还提供了一种关联应用程序挖掘的装置,如图7所示,该关联应用程序挖掘的装置70包括原始行为数据获取模块710、目标行为数据获取模块720、特征点行为数据转换模块730和关联应用程序确定模块740。
原始行为数据获取模块710,用于获取用户操作移动终端的原始行为数据;
目标行为数据获取模块720,对原始行为数据进行预处理以获取目标行为数据;
特征点行为数据转换模块730,用于将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式;
关联应用程序确定模块740,用于根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序。
其中,如图8所示,该关联应用程序挖掘的装置70还可以包括判断模块750和提示模块760。
判断模块750,用于判断是否接收到预设应用程序开启指令。
提示模块760,用于若判断模块750判断接收到预设应用程序开启指令,则提示关联应用程序。
具体实施中,原始行为数据获取模块710具体用于:根据控制事件监听用户对终端的操作以获取日志信息。
如图9所示,目标行为数据获取模块720包括多维行为数据生成模块721和目标行为数据生成模块722。
多维行为数据生成模块721,用于根据日志信息和系统时间生成多维行为数据。
目标行为数据生成模块722,用于删除多维行为数据中的系统时间相同的重复数据以生成目标行为数据。
如图10所示,特征点行为数据转换模块730包括有效行为数据获取模块731、整数型字符变更模块732和特征点行为数据获取模块733。
有效行为数据获取模块731,用于删除目标行为数据中的异常数据以获取有效行为数据。
整数型字符变更模块732,用于将有效行为数据中的应用程序名称变更为整数型字符。
特征点行为数据获取模块733,用于提取每次控制事件对应的整数型字符以获取特征点行为数据。
如图11所示,关联应用程序确定模块740包括频繁项数据获取模块741、频繁模式树建立模块742、条件模式基获取模块743、条件频繁模式树建立模块744和关联应用程序获取模块745。
频繁项数据获取模块741,用于删除特征点行为数据中的出现次数少于预设次数的应用程序以获取频繁项数据;
频繁模式树建立模块742,用于根据频繁项数据建立频繁模式树;
条件模式基获取模块743,用于获取频繁模式树中的预设应用程序的条件模式基;条件模式基为预设应用程序在频繁模式树中的所有前缀节点链;
条件频繁模式树建立模块744,用于根据条件模式基和预设应用程序的支持度建立预设应用程序的条件频繁模式树;
关联应用程序获取模块745,用于根据条件频繁模式树获取与预设应用程序对应的关联应用程序。
综上所述,本发明实施例首先获取用户操作移动终端的原始行为数据;然后对原始行为数据进行预处理以获取目标行为数据;再将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式;最后根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序;由于对用户操作移动终端的原始行为数据处理得到的特征点行为数据进行频繁项挖掘,并获取到与预设应用程序对应的关联应用程序,故可以在用户操作预设应用程序后提示关联应用程序,有效避免了在移动终端上寻找关联应用程序时便捷性差的缺陷,提高了移动终端的操作效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图12是本发明一实施例提供的一种关联应用程序挖掘的装置的示意图。如图12所示,该实施例的一种关联应用程序挖掘的装置12包括:处理器120、存储器121以及存储在存储器121中并可在处理器120上运行的计算机程序122,例如关联应用程序挖掘的程序。处理器120执行计算机程序122时实现上述各个关联应用程序挖掘的方法实施例中的步骤,例如图1所示的步骤101至104。或者,处理器120执行计算机程序122时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块710至740的功能。
示例性的,计算机程序122可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器121中,并由处理器120执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序122在关联应用程序挖掘的装置12中的执行过程。例如,计算机程序122可以被分割成原始行为数据获取模块710、目标行为数据获取模块720、特征点行为数据转换模块730和关联应用程序确定模块740(虚拟装置中的模块),各模块具体功能如下:
原始行为数据获取模块710,用于获取用户操作移动终端的原始行为数据;
目标行为数据获取模块720,对原始行为数据进行预处理以获取目标行为数据;
特征点行为数据转换模块730,用于将目标行为数据转换为特征点行为数据;特征点行为数据符合频繁项挖掘算法的数据格式;
关联应用程序确定模块740,用于根据频繁项挖掘算法和特征点行为数据确定与预设应用程序对应的关联应用程序
所述关联应用程序挖掘的装置12可以是移动终端或其它设备。所述关联应用程序挖掘的装置可包括,但不仅限于,处理器120、存储器121。本领域技术人员可以理解,图12仅仅是关联应用程序挖掘的装置12的示例,并不构成对关联应用程序挖掘的装置12的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述关联应用程序挖掘的装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器120可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器121可以是所述关联应用程序挖掘的装置12的内部存储单元,例如关联应用程序挖掘的装置12的硬盘或内存。所述存储器121也可以是所述关联应用程序挖掘的装置12的外部存储设备,例如所述关联应用程序挖掘的装置12上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器121还可以既包括所述关联应用程序挖掘的装置12的内部存储单元也包括外部存储设备。所述存储器121用于存储所述计算机程序以及所述关联应用程序挖掘的装置所需的其他程序和数据。所述存储器121还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (12)
1.一种关联应用程序挖掘的方法,其特征在于,所述方法包括:
获取用户操作移动终端的原始行为数据;
对所述原始行为数据进行预处理以获取目标行为数据;
将所述目标行为数据转换为特征点行为数据;所述特征点行为数据符合频繁项挖掘算法的数据格式;
根据所述频繁项挖掘算法和所述特征点行为数据确定与预设应用程序对应的关联应用程序。
2.如权利要求1所述的关联应用程序挖掘的方法,其特征在于,所述获取用户操作移动终端的原始行为数据具体为:
根据控制事件监听用户对终端的操作以获取日志信息。
3.如权利要求2所述的关联应用程序挖掘的方法,其特征在于,所述对所述原始行为数据进行预处理以获取目标行为数据包括:
根据所述日志信息和系统时间生成多维行为数据;
删除所述多维行为数据中的所述系统时间相同的重复数据以生成目标行为数据。
4.如权利要求1所述的关联应用程序挖掘的方法,其特征在于,所述将所述目标行为数据转换为特征点行为数据包括:
删除所述目标行为数据中的异常数据以获取有效行为数据;
将所述有效行为数据中的应用程序名称变更为整数型字符;
提取每次控制事件对应的整数型字符以获取特征点行为数据。
5.如权利要求1所述的关联应用程序挖掘的方法,其特征在于,所述根据所述频繁项挖掘算法和所述特征点行为数据确定与预设应用程序对应的关联应用程序包括:
删除所述特征点行为数据中的出现次数少于预设次数的应用程序以获取频繁项数据;
根据所述频繁项数据建立频繁模式树;
获取所述频繁模式树中的预设应用程序的条件模式基;所述条件模式基为预设应用程序在所述频繁模式树中的所有前缀节点链;
根据所述条件模式基和所述预设应用程序的支持度建立所述预设应用程序的条件频繁模式树;
根据所述条件频繁模式树获取与所述预设应用程序对应的关联应用程序。
6.一种关联应用程序挖掘的装置,其特征在于,包括:
原始行为数据获取模块,用于获取用户操作移动终端的原始行为数据;
目标行为数据获取模块,对所述原始行为数据进行预处理以获取目标行为数据;
特征点行为数据转换模块,用于将所述目标行为数据转换为特征点行为数据;所述特征点行为数据符合频繁项挖掘算法的数据格式;
关联应用程序确定模块,用于根据所述频繁项挖掘算法和所述特征点行为数据确定与预设应用程序对应的关联应用程序。
7.根据权利要求6所述的关联应用程序挖掘的装置,其特征在于,所述原始行为数据获取模块具体用于:
根据控制事件监听用户对终端的操作以获取日志信息。
8.根据权利要求7所述的关联应用程序挖掘的装置,其特征在于,所述目标行为数据获取模块包括:
多维行为数据生成模块,用于根据所述日志信息和系统时间生成多维行为数据;
目标行为数据生成模块,用于删除所述多维行为数据中的所述系统时间相同的重复数据以生成目标行为数据。
9.根据权利要求6所述的关联应用程序挖掘的装置,其特征在于,所述特征点行为数据转换模块包括:
有效行为数据获取模块,用于删除所述目标行为数据中的异常数据以获取有效行为数据;
整数型字符变更模块,用于将所述有效行为数据中的应用程序名称变更为整数型字符;
特征点行为数据获取模块,用于提取每次控制事件对应的整数型字符以获取特征点行为数据。
10.根据权利要求6所述的关联应用程序挖掘的装置,其特征在于,所述关联应用程序确定模块包括:
频繁项数据获取模块,用于删除所述特征点行为数据中的出现次数少于预设次数的应用程序以获取频繁项数据;
频繁模式树建立模块,用于根据所述频繁项数据建立频繁模式树;
条件模式基获取模块,用于获取所述频繁模式树中的预设应用程序的条件模式基;所述条件模式基为预设应用程序在所述频繁模式树中的所有前缀节点链;
条件频繁模式树建立模块,用于根据所述条件模式基和所述预设应用程序的支持度建立所述预设应用程序的条件频繁模式树;
关联应用程序获取模块,用于根据所述条件频繁模式树获取与所述预设应用程序对应的关联应用程序。
11.一种关联应用程序挖掘的装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述关联应用程序挖掘的方法的步骤。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述关联应用程序挖掘的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810801266.4A CN110750561A (zh) | 2018-07-20 | 2018-07-20 | 一种关联应用程序挖掘的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810801266.4A CN110750561A (zh) | 2018-07-20 | 2018-07-20 | 一种关联应用程序挖掘的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110750561A true CN110750561A (zh) | 2020-02-04 |
Family
ID=69274744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810801266.4A Pending CN110750561A (zh) | 2018-07-20 | 2018-07-20 | 一种关联应用程序挖掘的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110750561A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667827A (zh) * | 2020-12-23 | 2021-04-16 | 北京奇艺世纪科技有限公司 | 一种数据异常分析方法、装置、电子设备及存储介质 |
CN113157766A (zh) * | 2021-03-12 | 2021-07-23 | Oppo广东移动通信有限公司 | 应用分析方法及装置、电子设备、计算机可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6324533B1 (en) * | 1998-05-29 | 2001-11-27 | International Business Machines Corporation | Integrated database and data-mining system |
US20030028531A1 (en) * | 2000-01-03 | 2003-02-06 | Jiawei Han | Methods and system for mining frequent patterns |
CN101427248A (zh) * | 2006-04-27 | 2009-05-06 | 英特尔公司 | 用于基于内容的分割与挖掘的基于系统的方法 |
CN101667197A (zh) * | 2009-09-18 | 2010-03-10 | 浙江大学 | 基于滑动窗口的数据流关联规则挖掘方法 |
CN102760163A (zh) * | 2012-06-12 | 2012-10-31 | 奇智软件(北京)有限公司 | 一种特征信息的个性化推荐方法及装置 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN104715073A (zh) * | 2015-04-03 | 2015-06-17 | 江苏物联网研究发展中心 | 基于改进Apriori算法的关联规则挖掘系统 |
CN106202430A (zh) * | 2016-07-13 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 基于关联规则的直播平台用户兴趣度挖掘系统及挖掘方法 |
CN107315952A (zh) * | 2016-04-26 | 2017-11-03 | 华为技术有限公司 | 用于确定应用程序可疑行为的方法和装置 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN108052366A (zh) * | 2017-12-27 | 2018-05-18 | 努比亚技术有限公司 | 应用图标显示方法、终端及存储介质 |
-
2018
- 2018-07-20 CN CN201810801266.4A patent/CN110750561A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6324533B1 (en) * | 1998-05-29 | 2001-11-27 | International Business Machines Corporation | Integrated database and data-mining system |
US20030028531A1 (en) * | 2000-01-03 | 2003-02-06 | Jiawei Han | Methods and system for mining frequent patterns |
CN101427248A (zh) * | 2006-04-27 | 2009-05-06 | 英特尔公司 | 用于基于内容的分割与挖掘的基于系统的方法 |
CN101667197A (zh) * | 2009-09-18 | 2010-03-10 | 浙江大学 | 基于滑动窗口的数据流关联规则挖掘方法 |
CN102760163A (zh) * | 2012-06-12 | 2012-10-31 | 奇智软件(北京)有限公司 | 一种特征信息的个性化推荐方法及装置 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN104715073A (zh) * | 2015-04-03 | 2015-06-17 | 江苏物联网研究发展中心 | 基于改进Apriori算法的关联规则挖掘系统 |
CN107315952A (zh) * | 2016-04-26 | 2017-11-03 | 华为技术有限公司 | 用于确定应用程序可疑行为的方法和装置 |
CN106202430A (zh) * | 2016-07-13 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 基于关联规则的直播平台用户兴趣度挖掘系统及挖掘方法 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
CN108052366A (zh) * | 2017-12-27 | 2018-05-18 | 努比亚技术有限公司 | 应用图标显示方法、终端及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667827A (zh) * | 2020-12-23 | 2021-04-16 | 北京奇艺世纪科技有限公司 | 一种数据异常分析方法、装置、电子设备及存储介质 |
CN113157766A (zh) * | 2021-03-12 | 2021-07-23 | Oppo广东移动通信有限公司 | 应用分析方法及装置、电子设备、计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102906751B (zh) | 一种数据存储、数据查询的方法及装置 | |
CN103501374B (zh) | 电话簿排序方法及装置、终端 | |
CN109492073B (zh) | 日志搜索方法、日志搜索装置和计算机可读存储介质 | |
CN105701122A (zh) | 一种日志收集方法、装置及系统 | |
CN104615585A (zh) | 处理文本信息的方法及装置 | |
CN110750561A (zh) | 一种关联应用程序挖掘的方法及装置 | |
CN113297269A (zh) | 数据查询方法及装置 | |
CN109547393B (zh) | 恶意号码识别方法、装置、设备和存储介质 | |
CN114461705A (zh) | 数据可视化生成方法、装置、电子设备及存储介质 | |
CN105550361A (zh) | 日志处理方法及装置和问答信息处理方法及装置 | |
CN110929173A (zh) | 同人识别方法、装置、设备及介质 | |
CN110442844A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN104346151B (zh) | 一种信息处理方法及电子设备 | |
CN112463527A (zh) | 一种数据处理方法、装置、设备、系统及存储介质 | |
CN110597765A (zh) | 一种大零售呼叫中心异构数据源数据处理方法及装置 | |
CN109815413A (zh) | 一种智能推荐系统及其智能推荐方法 | |
CN111475492B (zh) | 数据处理方法以及装置 | |
CN115033646A (zh) | 一种基于Flink&Doris构建实时数仓系统的方法 | |
CN109587353B (zh) | 短信号码归属信息的识别方法、装置及存储介质 | |
CN109785099B (zh) | 一种自动对业务数据信息进行处理的方法及系统 | |
CN102368235A (zh) | 输入法中对文字与数字信息建立关联的方法及系统 | |
CN107770734B (zh) | 移动用户常驻地识别方法及装置 | |
CN112347355A (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN111050311A (zh) | 数据管理方法、装置、存储介质以及终端 | |
CN110781370B (zh) | 一种移动终端信息查询方法和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200204 |
|
WD01 | Invention patent application deemed withdrawn after publication |