CN112559302A - App使用行为的统计方法、装置、设备及存储介质 - Google Patents
App使用行为的统计方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112559302A CN112559302A CN201910913200.9A CN201910913200A CN112559302A CN 112559302 A CN112559302 A CN 112559302A CN 201910913200 A CN201910913200 A CN 201910913200A CN 112559302 A CN112559302 A CN 112559302A
- Authority
- CN
- China
- Prior art keywords
- time
- app
- determining
- usage
- duration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 26
- 238000007619 statistical method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 65
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 31
- 238000004422 calculation algorithm Methods 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 239000003638 chemical reducing agent Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例提供了一种APP使用行为的统计方法、装置、设备及存储介质。该方法包括获取用户使用至少一个APP的用户上网数据;基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;根据所述用户上网数据、每个APP的所述使用间隔时间阈值和所述使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。本发明实施例能够更加精准的统计用户APP的使用情况。
Description
技术领域
本发明涉及网络通信技术领域,尤其涉及一种APP使用行为的统计方法、装置、设备及存储介质。
背景技术
随着互联网与通信业的飞速发展,手机中多种多样的应用程序(Application,APP)出现在人群的视线中。APP能否给予客户良好的感知成为了用户评价通信网络质量的标准之一。
目前,通信行业网络维护模式逐步从被动向主动转变,从面向网络设备、网络运行质量向面向网络、面向业务、面向客户转变,因此,需要从用户上网数据中对用户的APP使用情况进行统计。
而简单的累加上网记录是不能够真是的反应出用户的APP真是使用情况的,例如,用户会存在误触APP的情况,因此,简单的累加上网记录来统计用户的APP使用情况存在评估准确定低的问题。
发明内容
本发明实施例提供了一种APP使用行为的统计方法、装置、设备及存储介质,能够解决简单的累加上网记录来统计用户的APP使用情况存在评估准确定低的问题。
第一方面,本发明实施例提供了APP使用行为的统计方法,该方法包括:
获取用户使用至少一个APP的用户上网数据;
基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;
根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
在一种可能的实现中,在基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值之前,方法还包括:
获取多个APP的样本上网数据;
基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,多组时间参数中的每一组时间参数包括使用间隔时间参数和使用持续时间参数;
根据样本上网数据和多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
根据APP使用时间、样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定时间阈值确定模型。
在一种可能的实现中,基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,包括:
将预设使用间隔时间参数的取值范围中的多个使用间隔时间参数与预设使用持续时间参数的取值范围中多个使用持续时间参数一一组合,得到多组时间参数。
在一种可能的实现中,根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定时间阈值确定模型,包括:
确定APP使用时间中使用APP的开始时间与样本上网数据中使用APP的开始时间之间误差小于开始时间误差值,且APP使用时间中使用APP的结束时间与样本上网数据中使用APP的结束时间之间的误差小于结束时间误差值的APP使用次数;
根据APP使用次数、APP使用时间对应的APP使用次数和样本上网数据中的APP使用次数,计算评估值;
在评估值与预设的最优评估值相等的情况下,确定时间阈值确定模型。
在一种可能的实现中,在基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值之前,该方法还包括:
获取多个APP的样本上网数据;样本上网数据包括每个APP多条上网记录的开始时间和结束时间;
根据每个APP多条上网记录中每一条上网记录的结束时间以及下一条上网记录的开始时间,确定用户使用APP的使用间隔时间;
根据每一条上网记录的开始时间和结束时间,确定使用APP的使用持续时间;
对多个APP的使用间隔时间和APP的使用持续时间分别进行聚类,确定时间阈值确定模型。
在一种可能的实现中,对多个APP的使用间隔时间和APP的使用持续时间分别进行聚类,确定时间阈值确定模型,包括:
在多个APP的使用间隔时间中确定间隔时间的聚类中心点;以及,在多个APP的使用持续时间中确定持续时间的聚类中心点;
计算使用间隔时间的聚类中心点对应的使用间隔时间的平均值和使用持续时间的聚类中心点对应的使用持续时间的平均值;
根据使用间隔时间的平均值和使用持续时间的平均值,确定时间阈值确定模型。
第二方面,本发明实施例提供了一种APP使用行为的统计装置,该装置包括:
获取模块,用于获取用户使用至少一个APP的用户上网数据;
阈值确定模块,用于基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;
结果确定模块,用于根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
在一种可能的实现中,该装置还包括:
获取模块,还用于获取多个APP的样本上网数据;
参数确定模块,用于基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,所述多组时间参数中的每一组时间参数包括使用间隔时间参数和使用持续时间参数;
时间确定模块,用于根据所述样本上网数据和所述多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
模型确定模块,用于根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定所述时间阈值确定模型。
在一种可能的实现中,模型确定模块,具体用于:
将预设使用间隔时间参数的取值范围中的多个使用间隔时间参数与预设使用持续时间参数的取值范围中多个使用持续时间参数一一组合,得到多组时间参数。
在一种可能的实现中,模型确定模块,具体用于:
确定APP使用时间中使用APP的开始时间与样本上网数据中使用APP的开始时间之间误差小于开始时间误差值,且APP使用时间中使用APP的结束时间与样本上网数据中使用APP的结束时间之间的误差小于结束时间误差值的APP使用次数;
根据APP使用次数、APP使用时间对应的APP使用次数和样本上网数据中的APP使用次数,计算评估值;
在评估值与预设的最优评估值相等的情况下,确定时间阈值确定模型。
在一种可能的实现中,该装置还包括:
获取模块,还用于获取多个APP的样本上网数据;样本上网数据包括每个APP多条上网记录的开始时间和结束时间;
时间确定模块,还用于根据每个APP多条上网记录中每一条上网记录的结束时间以及下一条上网记录的开始时间,确定用户使用APP的使用间隔时间;
时间确定模块,还用于根据每一条上网记录的开始时间和结束时间,确定使用APP的使用持续时间;
模型确定模块,还用于对多个APP的使用间隔时间和APP的使用持续时间分别进行聚类,确定时间阈值确定模型。
在一种可能的实现中,模型确定模块,具体用于:
在多个APP的使用间隔时间中确定间隔时间的聚类中心点;以及,在多个APP的使用持续时间中确定持续时间的聚类中心点;
计算使用间隔时间的聚类中心点对应的使用间隔时间的平均值和使用持续时间的聚类中心点对应的使用持续时间的平均值;
根据使用间隔时间的平均值和使用持续时间的平均值,确定时间阈值确定模型。
第三方面,本发明实施例提供了一种计算设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面或者第一方面任一可能实现方式的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现第一方面或者第一方面任一可能实现方式的方法。
本发明实施例提供的APP使用行为的统计方法、装置、设备及存储介质,通过获取用户使用至少一个APP的用户上网数据;基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。本发明是合理能够更加精准的统计用户APP的使用情况。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一些实施例提供的APP使用行为的统计系统的结构示意图;
图2示出了根据本发明一些实施例提供的APP使用行为的统计方法的流程图;
图3示出了根据本发明一些实施例提供的确定时间阈值确定模型的方法流程图;
图4示出了根据本发明一些实施例提供的一种计算APP使用次数的方法的流程图;
图5示出了根据本发明一些实施例提供的一种计算每个APP的使用次数以及每个APP的使用时间方法的流程图;
图6示出了根据本发明一些实施例提供的一种APP使用行为的统计装置的结构示意图;
图7示出了根据本发明一些实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着互联网与通信业的飞速发展,手机中多种多样的APP出现在人群的视线中。APP能否给予客户良好的感知成为了用户评价通信网络质量的又一标准,因此,需要从用户上网数据中对用户的APP使用情况进行统计。
目前,通常采用累加上网记录来作为用户的APP使用情况。但是,通过对数据的深度挖掘发现,当一个用户点击APP的时候,同时可能会触发许多其他的链接,如:广告,推送等。然而,数据获取平台并不会对这种情况进行筛选,去除干扰的链接数据,而是直接把干扰的链接直接记录成另一条APP的使用记录,这就会造成统计用户的APP浏览次数偏多。除此之外,不同的APP用户使用习惯是不相同的,如即时通信类APP,当用户收到消息的时候,看消息也许就在1分钟之内,故而其真实的阈值较短。然而针对视频类APP而言,用户看一个最短的视频也许也要花费五分钟左右,故而其真实阈值较长。
因此,简单的累加上网记录作为用户APP使用情况,已经不能满足有现有的需求,不能够真实的反映出用户的APP真实使用情况。
因此,本发明提供的一种APP使用行为的统计方法、装置、设备及存储介质,能够准确的统计用户APP的使用情况。
在介绍本发明的APP使用行为的统计方法之前,参见图1所示,本发明提供了APP使用行为的统计系统的结构图,其中,APP使用行为的统计系统包括:系统配置模块101、模型训练模块102、APP使用分析模块103。
首先,系统配置模块101用于读取配置文件,配置文件包括模型参数文件路径信息、用户过滤文件路径信息、输入输出相关配置信息、编程模型MapReduce相关配置信息和程序控制相关配置信息等。
其中,模型参数文件路径信息指出待查询的模型参数文件的路径。模型参数文件中的每一行参数表示某一特定APP的模型参数。
用户过滤文件路径信息:如果需要筛选出特定用户或过滤掉特定用户(如测试账号)可以配置此文件。用户过滤文件中,每一行表示过滤或筛选出某一个特定的用户。
输入输出相关配置信息:包括输入输出路径,输入输出格式等。
编程模型MapReduce相关配置信息:包括Reducer数量,数据类型等。
程序控制相关配置信息:包括记录数限制,字段串分隔符等。
通过上述配置信息,用户可以根据不同的应用场景对APP使用分析模块102进行灵活配置,应对不同的输入数据源,处理多样化的分析需求。
其次,模型训练模块102用于获取不同APP的使用间隔时间阈值T1值和使用持续时间阈值T2值。其中,模型训练模块采用了两种参数学习场景,包括有监督学习和无监督学习,进而能够使得训练得到的模型能够适用于不同的场景。
最后,APP使用分析模块103是核心算法的实现模块,根据其接收到的用户使用至少一个APP的用户上网数据,并对应每个APP的使用间隔时间阈值和使用持续时间阈值,能够更精确的得到用户使用APP的次数以及每次使用APP的开始时间和结束时间,。
参见图2所示,基于上述APP使用行为的统计系统,本发明实施例提供了一种APP使用行为的统计方法,包括:
S201:获取用户使用至少一个APP的用户上网数据。
在本发明的一个实施例中,用户上网数据是指用户使用APP的每条上网记录对应的上网数据,包括每条上网记录的起始时间和结束时间,例如,可以用一个时间序列来表示用户使用APP的起始时间和结束时间,如[(start[1],end[1]),(start[2],end[2]),(start[3],end[3])]。
S202:基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值。
在本发明的一个实施例中,使用间隔时间阈值表示用户两次使用APP之间最小间隔时间的阈值,单位为秒,使用持续时间阈值表示用户一次使用APP持续的最短时间的阈值,单位为秒。时间阈值确定模型是预先训练好的模型,能够确定不同APP的使用间隔时间阈值和使用持续时间阈值,进而使得APP使用分析模块103针对不同的输入数据源,处理多样化的分析需求。
具体的,本发明实施例还提供了获取时间阈值确定模块的方法,采用两种不同的参数学习场景训练得到时间阈值确定模型,包括有监督学习场景和无监督学习场景。
其一,针对有监督学习场景,时间阈值确定模型的获取过程具体如下:
获取多个APP的样本上网数据;
基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,时间参数包括使用间隔时间参数和使用持续时间参数;
根据样本上网数据和多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
根据APP使用时间、样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定时间阈值确定模型。
在本发明的一个实施例中,为了能够更好的确定使用间隔时间阈值和使用持续时间阈值,需要预先设置使用间隔时间参数的取值范围和使用持续时间参数的取值范围,根据使用间隔时间参数的取值范围中的使用间隔时间参数、使用持续时间参数的取值范围中的使用持续时间参数进一步确定一组最优时间参数,这组最优时间参数就是使用间隔时间阈值和使用持续时间阈值。
在有监督学习训练时间阈值确定模型的过程中需要使用APP使用分析模块103中的算法,得到多个APP的APP使用时间,并根据APP使用结果和样本上网数据进行匹配,并对匹配后的结果进行评估。其中,在使用APP使用分析模块103确定APP使用时间时,需要确定多组时间参数。
具体的,将预设使用间隔时间参数的取值范围中的多个使用间隔时间参数与预设使用持续时间参数的取值范围中多个使用持续时间参数一一组合,得到多组时间参数,时间参数中包括使用间隔时间参数和使用持续时间参数,将每组时间参数作为APP使用分析模块103中的算法的输入,进而确定APP使用时间。在这里,时间参数有多组,每一组时间参数都能够确定出一个APP使用时间,因此,APP使用时间有多个。
确定APP使用时间后,根据APP使用时间、样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,能够确定时间阈值确定模型。
具体的,参见图3所示,为本发明实施例确定时间阈值确定模型的方法流程图,TI表示使用间隔时间参数、T2表示使用持续时间参数,其中,TI的取值范围为[L1 U1],T2的取值范围为[L2 U2],step1表示T1的取值步长,step2表示T2的取值步长,BestT1表示最优的T1阈值,bestT2表示最优的T2阈值,maxF表示最优的F评估值。
S3001:指定超参数U1、L1、step1、U2、L2、step2。进入S3002。
S3002:读取训练样本,进入S3003。
S3003:初始化,令bestT1=L1,bestT2=L2,maxF=0。BestT1表示最优的T1阈值,bestT2表示最优的T2阈值,maxF表示最优的F评估值。在后面,我们会尝试不同的T1和T2的组合,其中必有一组T1、T2的组合使maxF达到最大,这一组T1和T2就是要找的bestT1和bestT2,进入S3004。
S3004:令T1=L1,进入S3005。
S3005:令T2=L2,进入S3006。
S3006:以训练样本和T1、T2作为输入数据,调用APP使用分析算法,得到用户APP使用序列,进入S3007。
S3007:以用户APP使用序列以及训练样本作为输入,调用匹配算法,得到一个F值。进入S3008。
S3008:如果这个F值比maxF要大,则进入S3009;否则不作更新,进入S3010。
S3009:更新bestT1=T1,bestT2=T2,maxF=F。
S3010:令T2=T2+step2,进入S3011。
S3011:如果T2<=U2,则回到S3006,否则进入S3012。
S3012:令T1=T1+step1。
S3013:如果T1<=U1则回到S3005,否则进入S3013。
S3014:返回bestT1和bestT2,算法结束。
另外,本发明实施例提供的APP使用行为的统计方法中,需要调用匹配算法计算评估值F,具体的,
根据APP使用时间和样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定时间阈值确定模型,包括:
确定APP使用时间中使用APP的开始时间与样本上网数据中使用APP的开始时间之间误差小于开始时间误差值,且APP使用时间中使用APP的结束时间与样本上网数据中使用APP的结束时间之间的误差小于结束时间误差值的APP使用次数;
根据APP使用次数、APP使用时间对应的APP使用次数和样本上网数据中的APP使用次数,计算评估值;
在评估值与预设的最优评估值相等的情况下,确定时间阈值确定模型。
在本发明的实施例中,针对每一个APP使用时间,需要从样本上网数据中找到其对应的记录,其判定条件为APP使用时间中的使用APP的开始时间与样本上网数据中的使用APP的开始时间之间的误差小于开始时间误差值,且APP使用时间中使用APP的结束时间与样本上网数据中使用APP的结束时间之间的误差小于结束时间误差值,当满足该判定条件,则认为样本上网数据与APP使用时间匹配成功,得到匹配成功的数量,作为APP使用次数。
APP使用次数的具体算法可参照图4所示,算法的输入数据为APP使用时间R、样本上网数据D、开始时间误差值ΔT1和结束时间误差值ΔT2。另外,d表示样本上网数据D中的某一个上网数据,st表示开始时间,et表示结束时间,match表示APP使用次数。
S4001:读取数据,记APP使用时间为R,第i次APP使用为R[i],R[i].st表示该次使用的开始时间,R[i].et表示该次使用的结束时间。样本上网数据记为D,第i次真实使用为D[i],D[i].st表示该次使用的开始时间,D[i].et表示该次使用的结束时间。之后进入S4002。
S4002:初始化,设置变量i=0,匹配次数match=0,进入S4003。
S4003:如果i小于R的长度,说明仍有数据待匹配,进入S4004。否则,进入S4008。
S4004:设置变量r=R[i],进入S4005。
S4005:设置变量j,令j=0,进入S4006。
S4006:如果j小于D的长度,说明仍有数据待匹配,进入S4007。否则令i=i+1,回到S4003。
S4007:设置变量d=D[j],进入S4008。
S4008:若满足|r.st-d.st|<ΔT1且|r.et-d.et|<ΔT2,说明匹配成功,进入S4009。否则令j=j+1,回到S4006。
S4009:匹配成功,match=match+1,i=i+1,回到S4003。
S4010:返回match,算法结束。
得到APP使用次数后,根据APP使用次数、APP使用时间对应的APP使用次数和样本上网数据中的APP使用次数,计算评估值。
作为一个示例,为了能够确定一个唯一的评估指标,本发明示例中采用F评估法,其中,评估值F满足下述公式(1):
其中,precision表示准确率,recall表示召回率,β表示一个整数。
其中,准确率=APP使用次数/APP使用时间中的APP使用次数。
召回率=APP使用次数/样本上网数据中的APP使用次数。
例如,取β等于1,则评估值F满足下述公式(2)
其中,precision表示准确率,recall表示召回率。
为了验证时间阈值确定模型的泛化性能,本发明实施例还可以采用10-折交叉验证。首先将样本上网数据分成十份,然后进行十轮训练,每次取其中一份为测试集,其余九份为训练集,每轮按照图4中的步骤进行训练。最后将十次结果取平均值作为最终结果。交叉验证能够有效防止过拟合情况的发生。
其一,针对无监督学习场景,时间阈值确定模型的获取过程具体如下:
获取多个APP的样本上网数据;样本上网数据包括每个APP多条上网记录的开始时间和结束时间;
根据每个APP多条上网记录中每一条上网记录的结束时间以及下一条上网记录的开始时间,确定用户使用APP的使用间隔时间;
根据每一条上网记录的开始时间和结束时间,确定使用APP的使用持续时间;
对多个APP的使用间隔时间和APP的使用持续时间分别进行聚类,确定时间阈值确定模型。
在本发明的一个实施例中,无监督学习的场景是通过挖掘数据自身的规律来发现合理的使用间隔时间阈值T1、使用持续时间阈值T2。由于APP后台上网记录通常只会传输一些状态信号,使用间隔时间和使用持续时间较短。用户使用则会产生网页资源的传输,传输时间和持续时间较长,因此,可能存在APP后台上网记录产生的间隔与用户使用的间隔有明显的差异以及后台上网记录在使用持续时间上与用户使用的持续时间有明显的差异两种情况。而且,为了能够发现样本上网数据自身的规律,可以采用聚类的方法来确定使用间隔时间阈值T1、使用持续时间阈值T2。
具体的,在多个APP的使用间隔时间中确定间隔时间的聚类中心点;以及,在多个APP的使用持续时间中确定持续时间的聚类中心点;
计算使用间隔时间的聚类中心点对应的使用间隔时间的平均值和使用持续时间的聚类中心点对应的使用持续时间的平均值;
根据使用间隔时间的平均值和使用持续时间的平均值,确定时间阈值确定模型。
在本发明的一个实施例中,采用Kmeans聚类算法来确定阈值T1和T2。
例如,设start[i]表示第i条上网记录的开始时间,end[i]表示第i条上网记录的结束时间。
第一步,提取某一用户使用某一APP的上网记录,按照开始时间进行排序,记为data=[(start[1],end[1]),(start[2],end[2]),(start[3],end[3]),…]。
第二步:对第i条记录(i=0,1,…,n-2),计算每一条上网记录的开始时间以及上一条条上网记录的结束时间的差值,得到使用间隔时间dt[i]=start[i+1]-end[i],若dt[i]小于0则将其记为0。
第三步:针对不同用户进行上述第二步的步骤。
第四步:将所有用户的dt[i]中的值汇总,得到聚类数据集。
第五步:利用Kmeans算法进行聚类,令K取2,得到两个中心点。
第六步:计算两个中心点的平均值,将这个值作为使用间隔时间阈值T1。
确定使用持续时间阈值T2时,计算样本上网数据中每一上网记录中使用APP的持续时间,将这一持续时间作为聚类数据集,利用Kmeans算法进行聚类,令K取2,得到两个中心点,计算两个中心点的平均值,将这个值作为使用持续时间阈值T2。
S103:根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
在本发明的一个实施例中,用户上网数据包括用户所使用的APP,使用APP的开始时间和结束时间。每个APP都有自己的使用间隔时间阈值和使用持续时间阈值。
参见图5所示,假设用户针对某一APP产生的上网记录,用一个时间序列表示[(start[1],end[1]),(start[2],end[2]),(start[3],end[3]),…],start[i]和end[i]为时间戳,则用户上网数据为[(start[1],end[1]),(start[2],end[2]),(start[3],end[3]),…],用户使用该APP的使用间隔时间阈值为T1,使用持续间隔时间阈值为T2,根据T1和T2,相邻时间记录的间隔小于T1,则合并成一次使用。若一次使用的持续时间小于T2,则本次使用无效,不进行记录。具体计算过程如下:
data[i]表示第i条上网记录(已经排好序),starttime表示开始时间,endtime表示结束时间,datasize表示上网记录总数。
S5001:加载配置文件。配置文件中的配置项包括阈值T1、T2的取值、输入数据路径等。加载完成后,进入S5002。
S5002:读取用户上网数据。从输入数据中读取每条上网记录的开始时间和结束时间。第i条数据记为data[i],其开始时间记为data[i].starttime,结束时间记为data[i].endtime。注意i是从0开始的,所以如果一共有10条数据,应当表示为data[0]、data[1]、……、data[9]。之后进入S5003。
S5003:按照开始时间对上网记录数据进行排序,之后进入S5004。
S5004:初始化,设置变量i=0,设置变量datasize表示上网记录数。进入S5005。
S5005:如果i<datasize,说明上网记录扫描完毕,进入S5015,否则进入S5006。
S5006:设置变量k=0,设置变量starti=data[i].starttime,设置变量endi=data[i].endtime,设置变量curend=endi。curend表示当前的一次APP使用的结束时间。进入S5007。
S5007:令k=k+1,进入S5008。
S5009:设置变量startk=data[i+k].starttime,设置变量endk=data[i+k].endtime,进入S5010。
S5010:如果startk-curend>=T1表示第i+k条数据与当前APP使用的间隔时间过长、无法合并为一次使用进入S5013,否则进入S5011。
S5011:判断endk是否大于curend,若是,则进入S5012;若否,则回到S5007.
S5012:令curend=endk,回到S5007。
S5013:此时已经确定当前一次APP使用结束。如果curend-starti<T2,表示此次使用持续时间过短,进入S5015。否则进入S5014。
S5014:生成一次用户使用,此次使用APP的开始时间为starti,结束时间为curend。将本次用户使用APP加入结果集,进入S5015。
S5015:令i=i+k,回到S5005。
S5016:返回结果集,算法结束。
作为一个示例,取T1=10s,T2=5s假设输入序列如下:
[1]1500000001,1500000005;
[2]1500000004,1500000009;
[3]1500000006,1500000007;
[4]1500000021,1500000023;
[5]1500000035,1500000055;
[6]1500000074,1500000076;
[7]1500000080,1500000098;
[8]1500000097,1500000099;
首先读取第1条记录,记录开始时间1500000001,结束时间1500000005。
接着读取第2条记录,由于1500000004–1500000005小于T1,因此本条和第1条视为一次使用,并将结束时间更新为1500000009。
接着读取第3条记录,由于1500000006–1500000009小于T1,因此本条和第1条视为一次使用,结束时间不更新。
接着读取第4条记录,由于1500000021–1500000009大于T1,一次使用结束,由于持续时间超过T2,本次使用有效,记为第一次使用。
当前记录变为第4条记录,记录开始时间1500000021,结束时间1500000023。
接着读取第5条记录,由于1500000035-1500000023大于T1,一次使用结束,由于1500000023-1500000021小于T2,本次使用无效。
当前记录变为第5条记录,记录开始时间1500000035,结束时间1500000055。
读取第6条记录,根据上述判定条件,一次使用结束,该次使用有效,记为第二次使用。
当前记录变为第6条记录,之后可以判定第6、7、8为一次使用,记为第三次使用。
根据上述计算可知,输出结果为3次使用,第一次使用从1500000001开始到1500000009结束;第二次使用从1500000035开始到1500000055结束;第三次使用从1500000074开始到1500000099结束。
此外,为使本发明实施例中的算法能够在Hadoop大数据平台上运行,在MapReduce框架下对算法进行了改写,其中Mapper负责提取某一用户在某一APP上产生的上网记录,核心分析算法工作在Reducer中。
1.准备阶段
准备阶段主要是任务是加载配置文件,并根据配置文件信息生成Job。
2.Mapper阶段
Mapper阶段根据配置文件中的输入路径读取用户上网数据,一条数据记录信息包括:用户身份标识号(Identitydocument、ID),APP的ID,使用APP的开始时间,使用APP的结束时间。Mapper程序会将每条数据改为关键字-数值(key-value)的形式,并调用context.write方法传递给Reducer程序,其中关键字的字段包括用户ID和APP的ID,数值字段包括开始时间和结束时间。
3.Reducer阶段
Reducer阶段收集关键字段对应的上网数据并进行排序,之后调用APP使用分析算法,得到指定用户对指定APP的使用序列,输出结果保存在配置文件中的输出路径中。需要注意到,原始上网数据可能存在数据倾斜问题,也就是说某一个用户使用某一个APP的频率极高(可能是数据异常导致的)。为避免这一问题导致处理瓶颈,针对每一个输入关键字,Reducer阶段只接收20000条数据,这一值可根据需求的不同而改变。
通过Hadoop大数据平台和MapReduce计算框架,该算法能够在2小时左右的时间内完成一天中上千万用户及上百类APP的使用分析,所得结果能够支撑各类应用场景。
本发明实施例提供的APP使用行为的统计方法,通过获取用户使用至少一个APP的用户上网数据;基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。本发明是合理能够更加精准的统计用户APP的使用情况。
参见图6所示,本发明实施例提供了一种APP使用行为的统计装置,该装置包括:
获取模块601,用于获取用户使用至少一个APP的用户上网数据;
阈值确定模块602,用于基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;
结果确定模块603,用于根据用户上网数据、每个APP的使用间隔时间阈值和使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
可选的,该装置还包括
获取模块601,还用于获取多个APP的样本上网数据;
参数确定模块604,用于基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,所述多组时间参数中的每一组时间参数包括使用间隔时间参数和使用持续时间参数;
时间确定模块605,用于根据所述样本上网数据和所述多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
模型确定模块606,用于根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定所述时间阈值确定模型。
可选的,模型确定模块606,具体用于:
将预设使用间隔时间参数的取值范围中的多个使用间隔时间参数与预设使用持续时间参数的取值范围中多个使用持续时间参数一一组合,得到多组时间参数。
可选的,模型确定模块606,具体用于:
确定APP使用时间中使用APP的开始时间与样本上网数据中使用APP的开始时间之间误差小于开始时间误差值,且APP使用时间中使用APP的结束时间与样本上网数据中使用APP的结束时间之间的误差小于结束时间误差值的APP使用次数;
根据APP使用次数、APP使用时间对应的APP使用次数和样本上网数据中的APP使用次数,计算评估值;
在评估值与预设的最优评估值相等的情况下,确定时间阈值确定模型。
可选的,该装置还包括:
获取模块601,还用于获取多个APP的样本上网数据;样本上网数据包括每个APP多条上网记录的开始时间和结束时间;
时间确定模块605,还用于根据每个APP多条上网记录中每一条上网记录的结束时间以及下一条上网记录的开始时间,确定用户使用APP的使用间隔时间;
时间确定模块605,还用于根据每一条上网记录的开始时间和结束时间,确定使用APP的使用持续时间;
模型确定模块606,还用于对多个APP的使用间隔时间和APP的使用持续时间分别进行聚类,确定时间阈值确定模型。
可选的,模型确定模块606,具体用于:
在多个APP的使用间隔时间中确定间隔时间的聚类中心点;以及,在多个APP的使用持续时间中确定持续时间的聚类中心点;
计算使用间隔时间的聚类中心点对应的使用间隔时间的平均值和使用持续时间的聚类中心点对应的使用持续时间的平均值;
根据使用间隔时间的平均值和使用持续时间的平均值,确定时间阈值确定模型。
本发明实施例提供装置中的各个模块可以实现图1所示的方法,并达到其技术效果,为简洁描述,再此不在赘述。
另外,结合图1描述的本发明实施例的APP使用行为的统计方法可以由计算设备来实现。图7示出了本发明实施例提供的计算设备的硬件结构示意图。
计算设备可以包括处理器701以及存储有计算机程序指令的存储器702。
具体地,上述处理器701可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器702可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器702可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器702可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器702可在数据处理装置的内部或外部。在特定实施例中,存储器702是非易失性固态存储器。在特定实施例中,存储器702包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器701通过读取并执行存储器702中存储的计算机程序指令,以实现上述实施例中的任意一种APP使用行为的统计方法。
在一个示例中,计算设备还可包括通信接口703和总线710。其中,如图7所示,处理器701、存储器702、通信接口703通过总线710连接并完成相互间的通信。
通信接口703,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线710包括硬件、软件或两者,将计算设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的APP使用行为的统计方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种APP使用行为的统计方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种APP使用行为的统计方法,其特征在于,所述方法包括:
获取用户使用至少一个APP的用户上网数据;
基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;
根据所述用户上网数据、每个APP的所述使用间隔时间阈值和所述使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
2.根据权利要求1所述的方法,其特征在于,在基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值之前,所述方法还包括:
获取多个APP的样本上网数据;
基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,所述多组时间参数中的每一组时间参数包括使用间隔时间参数和使用持续时间参数;
根据所述样本上网数据和所述多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定所述时间阈值确定模型。
3.根据权利要求2所述的方法,其特征在于,所述基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,包括:
将所述预设使用间隔时间参数的取值范围中的多个使用间隔时间参数与所述预设使用持续时间参数的取值范围中多个使用持续时间参数一一组合,得到所述多组时间参数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定所述时间阈值确定模型,包括:
确定所述APP使用时间中使用APP的开始时间与所述样本上网数据中使用APP的开始时间之间误差小于所述开始时间误差值,且所述APP使用时间中使用APP的结束时间与所述样本上网数据中使用APP的结束时间之间的误差小于所述结束时间误差值的APP使用次数;
根据所述APP使用次数、所述APP使用时间对应的APP使用次数和所述样本上网数据中的APP使用次数,计算评估值;
在所述评估值与预设的最优评估值相等的情况下,确定所述时间阈值确定模型。
5.据权利要求1所述的方法,其特征在于,在基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值之前,所述方法还包括:
获取多个APP的样本上网数据;所述样本上网数据包括每个APP多条上网记录的开始时间和结束时间;
根据每个APP多条上网记录中每一条上网记录的结束时间以及下一条上网记录的开始时间,确定用户使用所述APP的使用间隔时间;
根据每一条上网记录的开始时间和结束时间,确定使用所述APP的使用持续时间;
对所述多个APP的使用间隔时间和所述APP的使用持续时间分别进行聚类,确定所述时间阈值确定模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述多个APP的使用间隔时间和所述APP的使用持续时间分别进行聚类,确定所述时间阈值确定模型,包括:
在所述多个APP的使用间隔时间中确定所述间隔时间的聚类中心点;以及,在所述多个APP的使用持续时间中确定所述持续时间的聚类中心点;
计算所述使用间隔时间的聚类中心点对应的使用间隔时间的平均值和所述使用持续时间的聚类中心点对应的使用持续时间的平均值;
根据所述使用间隔时间的平均值和所述使用持续时间的平均值,确定所述时间阈值确定模型。
7.一种应用程序APP使用行为的统计装置,其特征在于,所述装置包括:
获取模块,用于获取用户使用至少一个APP的用户上网数据;
阈值确定模块,用于基于时间阈值确定模型确定每个APP的使用间隔时间阈值和使用持续时间阈值;
结果确定模块,用于根据所述用户上网数据、每个APP的所述使用间隔时间阈值和所述使用持续时间阈值,确定每个APP的使用次数以及每个APP的使用时间。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
所述获取模块,还用于获取多个APP的样本上网数据;
参数确定模块,用于基于预设使用间隔时间参数的取值范围和预设使用持续时间参数的取值范围确定的多组时间参数,其中,所述多组时间参数中的每一组时间参数包括使用间隔时间参数和使用持续时间参数;
时间确定模块,用于根据所述样本上网数据和所述多组时间参数,确定每组时间参数对应的至少一个APP的APP使用时间;
模型确定模块,用于根据所述APP使用时间、所述样本上网数据,以及预设的开始时间误差值和预设的结束时间误差值,确定所述时间阈值确定模型。
9.一种计算设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913200.9A CN112559302B (zh) | 2019-09-25 | 2019-09-25 | App使用行为的统计方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913200.9A CN112559302B (zh) | 2019-09-25 | 2019-09-25 | App使用行为的统计方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112559302A true CN112559302A (zh) | 2021-03-26 |
CN112559302B CN112559302B (zh) | 2024-03-19 |
Family
ID=75029429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910913200.9A Active CN112559302B (zh) | 2019-09-25 | 2019-09-25 | App使用行为的统计方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559302B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1496450A1 (en) * | 2003-07-08 | 2005-01-12 | SAP Aktiengesellschaft | Method and computer system for software tuning |
US20140321448A1 (en) * | 2013-04-30 | 2014-10-30 | Seven Networks, Inc. | Detection and reporting of keepalive messages for optimization of keepalive traffic in a mobile network |
CN107153548A (zh) * | 2017-05-15 | 2017-09-12 | 深圳市伊特利网络科技有限公司 | 终端app的分组方法及系统 |
US9799131B1 (en) * | 2016-04-25 | 2017-10-24 | Google Inc. | Rendering interaction statistics data for content elements of an information resource by identifying client device segments |
CN108053080A (zh) * | 2017-12-30 | 2018-05-18 | 中国移动通信集团江苏有限公司 | 区域用户数量统计值预测方法、装置、设备及介质 |
CN109002387A (zh) * | 2018-07-13 | 2018-12-14 | 北京微播视界科技有限公司 | 应用程序的用户提醒方法、装置、终端设备和存储介质 |
-
2019
- 2019-09-25 CN CN201910913200.9A patent/CN112559302B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1496450A1 (en) * | 2003-07-08 | 2005-01-12 | SAP Aktiengesellschaft | Method and computer system for software tuning |
US20140321448A1 (en) * | 2013-04-30 | 2014-10-30 | Seven Networks, Inc. | Detection and reporting of keepalive messages for optimization of keepalive traffic in a mobile network |
US9799131B1 (en) * | 2016-04-25 | 2017-10-24 | Google Inc. | Rendering interaction statistics data for content elements of an information resource by identifying client device segments |
CN107153548A (zh) * | 2017-05-15 | 2017-09-12 | 深圳市伊特利网络科技有限公司 | 终端app的分组方法及系统 |
CN108053080A (zh) * | 2017-12-30 | 2018-05-18 | 中国移动通信集团江苏有限公司 | 区域用户数量统计值预测方法、装置、设备及介质 |
CN109002387A (zh) * | 2018-07-13 | 2018-12-14 | 北京微播视界科技有限公司 | 应用程序的用户提醒方法、装置、终端设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
刘新帅等: "基于智能手机使用数据的用户行为提取与分析", 《西北民族大学学报》, vol. 40, no. 03, pages 26 - 33 * |
Also Published As
Publication number | Publication date |
---|---|
CN112559302B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11222285B2 (en) | Feature selection method, device and apparatus for constructing machine learning model | |
US20150074106A1 (en) | Providing application program and user recommendation information | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理系统 | |
CN111858242A (zh) | 一种系统日志异常检测方法、装置及电子设备和存储介质 | |
KR101925950B1 (ko) | 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치 | |
US11132435B2 (en) | Payment password reset method and apparatus, and electronic device | |
CN109685545B (zh) | 待发放虚拟网络资源预估方法、装置及电子设备 | |
CN109982367A (zh) | 移动终端上网用户投诉预测方法、装置、设备及存储介质 | |
CN110069545B (zh) | 一种行为数据评估方法及装置 | |
CN110362999A (zh) | 用于检测账户使用异常的方法及装置 | |
CN111988278B (zh) | 一种基于用户地理位置日志的异常用户确定方法及装置 | |
CN112559302A (zh) | App使用行为的统计方法、装置、设备及存储介质 | |
CN112015870B (zh) | 数据上传方法及装置 | |
Uribe | Abstraction-based deductive-algorithmic verification of reactive systems | |
CN108711073B (zh) | 用户分析方法、装置及终端 | |
CN113014529B (zh) | 网络攻击的识别方法、装置、介质及设备 | |
CN105141664A (zh) | 一种为网络阅读用户推荐朋友的方法及设备 | |
CN107608979B (zh) | 识别用户潜在求助的知识点的方法及装置 | |
CN112116397A (zh) | 用户行为特征实时处理方法、装置、存储介质及电子设备 | |
CN104378402B (zh) | 用户联系信息更新方法及装置 | |
Rakin et al. | Robust sparse regularization: Defending adversarial attacks via regularized sparse network | |
CN115496501A (zh) | 交易金额核验方法及装置 | |
CN112149036A (zh) | 一种批量非正常互动行为的识别方法及系统 | |
Jang et al. | Automatic commercial monitoring for TV broadcasting using audio fingerprinting | |
CN114944950B (zh) | 实名认证方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |