CN107391548B - 一种移动应用市场刷榜用户组检测方法及其系统 - Google Patents

一种移动应用市场刷榜用户组检测方法及其系统 Download PDF

Info

Publication number
CN107391548B
CN107391548B CN201710413775.5A CN201710413775A CN107391548B CN 107391548 B CN107391548 B CN 107391548B CN 201710413775 A CN201710413775 A CN 201710413775A CN 107391548 B CN107391548 B CN 107391548B
Authority
CN
China
Prior art keywords
application
comment
ranking
group
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710413775.5A
Other languages
English (en)
Other versions
CN107391548A (zh
Inventor
何道敬
陈浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Publication of CN107391548A publication Critical patent/CN107391548A/zh
Application granted granted Critical
Publication of CN107391548B publication Critical patent/CN107391548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明涉及一种移动应用市场刷榜用户组检测方法及其系统,该系统包括:应用数据采集模块,用于收集移动应用市场排行榜中排名靠前的热门应用,构成候选应用集合,并对所述候选应用集合内各应用的评论量,评分,以及排名数据进行定期跟踪记录;可疑刷榜应用识别模块,用于计算所述候选应用集合内各应用的排名骤升骤降频率,获得可疑刷榜应用集合;目标团构建模块,包括评论数骤增相似度模型,评分提升相似度模型,排名骤变相似度模型,用于挖掘一组刷榜用户共同针对的目标应用集合;以及潜在刷榜用户组发现模块,利用频繁项集挖掘算法,从目标团的评论记录中得到最终潜在刷榜用户集合。该系统检测速度快,准确度高,通用性强。

Description

一种移动应用市场刷榜用户组检测方法及其系统
技术领域
本发明涉及刷榜用户检测技术领域,特别涉及一种针对移动应用市场中刷榜用户组的检测方法及其系统。
背景技术
随着智能手机的普及,诸如苹果的App Store,谷歌的Google Play这类的移动应用市场通过为用户提供种类丰富的手机应用随之流行开来。在这些移动应用市场中,均提供了反映应用热门程度的排行榜功能。然而,当前许多开发商寻找刷榜公司,通过恶意手段在短时间内快速提高自家应用的排名。刷榜公司通常会聚集大量用户为一组,同时针对几个目标应用,即目标团,采取刷榜行动。每次刷榜行动期间,一组刷榜用户同时下载这些应用,并为它们撰写评价,打高分。通过提升目标团中应用的评分,评论数,下载量这样的影响应用排名的重要指标,以提升目标应用在特定时间段内的排名。类似刷榜行为会严重危害移动应用市场中的良好生态环境。所以如何有效的从移动应用市场数以千万的用户中检测并发现此类刷榜用户组,已成为一个新颖而重要的课题。目前已有的工作主要针对垃圾评论者的检测,此类用户通过为应用撰写垃圾评论以误导用户下载应用。
然而,新式的刷榜用户组有其自身的特点。与传统垃圾评论者有所不同,新式的刷榜用户组通过打高分,写评论,下载应用等一系列行为,以期望直接提升目标应用的排名。同时,刷榜用户往往以组为单位行动,同时针对多个目标应用,即目标团,集中采取刷榜行动。这与传统垃圾评论用户的行为有很大的不同。垃圾评论者只撰写评论,且通常独自采取行动。
随着近年来智能手机的飞速普及,在利益驱使下,移动应用市场内出现了大量这样的刷榜用户组。本发明的目的在于克服现有技术的缺点与不足,构建一个统一有效的移动应用市场刷榜用户组检测系统,通过发现潜在刷榜用户组,为移动市场管理者的后续监管提供便利。
发明内容
本发明提出了一种移动应用市场刷榜用户组的检测方法及其系统,包括如下步骤:
应用数据采集阶段:获取移动应用市场的数据,收集移动应用市场排行榜中排名靠前的热门应用,将热门应用构成候选应用集合,并跟踪收集所述候选应用集合内各热门应用的信息;
可疑刷榜应用识别阶段:通过计算所述热门应用的排名骤升骤降频率,筛选得到由具有刷榜嫌疑的可疑刷榜应用构成的可疑刷榜应用集合;
目标团构建阶段:利用评论数骤增相似度模型、评分提升相似度模型和排名骤变相似度模型针对所述可疑刷榜应用集合挖掘刷榜用户组共同针对的目标应用集合,即目标团;
潜在刷榜用户组发现阶段:利用频繁项集挖掘算法,结合所述目标团内各应用的评论记录,得到潜在刷榜用户集合。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,在应用数据采集阶段中,跟踪收集所述热门应用的评论量,评分,以及排名数;并按固定时间间隔进行跟踪收集,得到各热门应用的排名变化集合,评论量变化集合,以及评分变化集合。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,所述热门应用的排名骤升骤降频率以如下公式(1)表示:
Figure BDA0001313114490000021
式(1)中,fa表示应用a的排名骤升骤降频率,
Figure BDA0001313114490000022
为应用a在所述排名变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的排名变化量,
Figure BDA0001313114490000023
用于量化
Figure BDA0001313114490000024
的排名变化类型;Tt为设定的排名骤变阈值。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,所述评论数骤增相似度模型中以如下公式(2)表示评论数骤增相似度:
Figure BDA0001313114490000025
式(2)中,V(a,b)表示应用a与应用b的评论数骤增相似度,
Figure BDA0001313114490000026
为应用a在所述评论量变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的评论数增量,
Figure BDA0001313114490000027
为评论数增量类型的量化;
Figure BDA0001313114490000028
为应用a所述评论量变化集合中所包含记录的平均值;Tsurge为设定的评论数骤增阈值。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,所述评分提升相似度模型中以如下公式(3)表示评分提升相似度:
Figure BDA0001313114490000029
式(3)中,R(a,b)为应用a与应用b的评分提升相似度,
Figure BDA00013131144900000210
为应用a在所述评分变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的评分变化值,
Figure BDA00013131144900000211
为评分变化类型的量化,根据
Figure BDA00013131144900000212
的变化值取0或1,以标记应用的评分提升。
本发明提出的所述移动应用市场刷榜用户的检测方法中,所述排名骤变相似度模型中以如下公式(4)表示排名骤变相似度:
Figure BDA00013131144900000213
式(4)中,F(a,b)为应用a与应用b的排名骤变相似度;
Figure BDA0001313114490000031
为应用a在所述排名变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的排名变化量,
Figure BDA0001313114490000032
用于量化
Figure BDA0001313114490000033
的排名变化类型。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,所述目标团构建阶段中,根据输入的可疑刷榜应用集合,以及集合内各应用的排名变化集合、评论量变化集合以及评分变化集合按如下步骤构造目标团:
步骤a1:列出所述可疑刷榜应用集合中所有可能的两两应用间的组合,构建应用对集合;
步骤a2:根据所述应用对集合,计算各应用对在评论数骤增相似度模型、评分提升相似度模型与排名骤变相似度模型下对应的相似度,根据各模型设定的相似度阈值标记可疑目标对,构建可疑目标对集合;
步骤a3:根据所述可疑目标对集合构建目标团,构建的每个目标团中任意两个应用间均为已被标记的可疑目标对。
本发明提出的所述移动应用市场刷榜用户组的检测方法中,所述潜在刷榜用户组发现阶段按如下步骤挖掘潜在刷榜用户组:
步骤b1:获取目标团内各应用的用户评论记录,构建各应用的评论用户集,每个评论用户集为目标团中一个应用评论记录所包含的评论用户集合;
步骤b2:设定最小支持度,最小支持度的取值不大于所述目标团所包含的应用总数;
步骤b3:根据所述最小支持度与所述评论用户集合,利用频繁项集挖掘算法获得多个频繁评论用户集,每个频繁评论用户集均为一组共同评论了应用团内多个应用,且共同评论的应用数不小于设定的最小支持度的频繁评论用户集合,每个集合即为一组对应的潜在刷榜用户;
步骤b4:输出步骤b3挖掘出的所有频繁评论用户集,得到潜在刷榜用户组。
本发明还提出了一种移动应用市场刷榜用户组检测系统,包括如下模块:
应用数据采集模块,其获取移动应用市场的数据,收集移动应用市场排行榜中排名靠前的热门应用,将热门应用构成候选应用集合,并跟踪收集所述候选应用集合内各热门应用的信息;
可疑刷榜应用识别模块,通过计算所述热门应用的排名骤升骤降频率,筛选得到由具有刷榜嫌疑的可疑刷榜应用构成的可疑刷榜应用集合;
目标团构建模块,其包括评论数骤增相似度模型、评分提升相似度模型和排名骤变相似度模型,针对所述可疑刷榜应用集合挖掘目标团,即刷榜用户组共同针对的目标应用集合;
潜在刷榜用户组发现模块,利用频繁项集挖掘算法,结合所述目标团内各应用的评论记录,得到潜在刷榜用户集合。
本发明的有益效果是能够高效准确检测出移动应用市场中的刷榜用户组,该系统通用性强,能够运用到不同的移动应用市场,具有很强的实用性和广阔的应用前景。
附图说明
图1是本发明实施例的结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步说明。
本发明产品刷榜用户组检测系统,如图1所示,包括:应用数据采集模块,可疑刷榜应用识别模块、目标团构建模块,潜在刷榜用户组发现模块。
应用数据采集模块,用于收集移动应用市场(本实施例中为苹果公司的AppStore)排行榜中排名靠前的热门应用,构成候选应用集合,并对所述候选应用集合内各应用的评论量,评分,以及排名数据每隔固定时间间隔进行跟踪收集,得到各应用的排名变化集合,评论量变化集合,以及评分变化集合,输入可疑刷榜应用识别模块与目标团构建模块,本实施例中时间间隔为24小时。所述应用排名变化集合是指一个应用所有相邻时间收集的排名数据的差值集合。所述应用评论量变化集合是指一个应用所有相邻时间收集的应用评论数的差值集合。所述评分变化集合是指一个应用的所有相邻时间收集的评分的差值集合。
可疑刷榜应用识别模块,通过计算所述候选应用集合内各应用的排名骤升骤降频率,得到可疑刷榜应用集合,输入目标团构建模块。
所述可疑刷榜应用识别模块中判别应用刷榜嫌疑的主要思想是:受到刷榜用户组刷榜行为影响,目标应用在刷榜期间会频繁的表现出排名上的骤升与骤降。而相比之下普通应用在排行榜中的排名变化则普遍趋于稳定。一个应用出现排名骤升骤降的频率越高,它的刷榜嫌疑也就越大。可疑刷榜应用识别模块中所述应用排名骤升骤降频率计算方式如下:
Figure BDA0001313114490000041
其中,fa为应用a的排名骤升骤降频率,通过设置排名骤升骤降阈值Tf,若fa>Tf,则判定应用a为可疑刷榜应用,n为应用a所述排名变化集合的记录总数,
Figure BDA0001313114490000042
为应用a在所述排名变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的排名变化差值,
Figure BDA0001313114490000043
用于量化
Figure BDA0001313114490000044
的排名变化类型,根据具体的排名变化量取对应的值,具体取值方式如下:
Figure BDA0001313114490000045
其中,Tt为设定的排名骤变阈值,
Figure BDA0001313114490000046
表示应用a在时段i上排名异常骤升,
Figure BDA0001313114490000047
表示应用a在时段i上异常骤降,
Figure BDA0001313114490000051
表示应用a在时段i上的排名正常变化。
目标团构建模块,包括评论数骤增相似度模型,评分提升相似度模型,排名骤变相似度模型,用于挖掘一组刷榜用户共同针对的目标应用的集合,即目标团,输入潜在刷榜用户组发现模块。
目标团构建模块的主要思想是,为了维持目标应用较高的排名,刷榜公司会组织多组刷榜用户在不同时段对同一个目标团采取刷榜行动,使得相同目标团内的应用在评论数,评分,排名上表现出相似的数据变化模式。目标团构建模块利用这种数据变化模式的相似性,来挖掘现实中刷榜用户组所针对的目标团。
评论数骤增相似度模型的主要思想是,每次刷榜行动期间,来自一个刷榜用户组的大量用户会为目标团内各应用撰写评论,使得目标团中各应用在相同时段表现出评论数的骤增。对于所述可疑刷榜应用集中的任意两个应用,若它们在评论数上表现同时段骤增的次数越多,它们来自相同目标团的可能性也就越大。所述评论数骤增相似度模型,即评论数骤增相似度的计算方法为:
Figure BDA0001313114490000052
其中,V(a,b)为应用a与应用b的评论数骤增相似度,
Figure BDA0001313114490000053
为应用a的所述评论量变化集合中的记录,表示应用a在两次相邻数据收集间隔时段i上的评论数增量,
Figure BDA0001313114490000054
为评论数增量类型的量化,根据
Figure BDA0001313114490000055
的大小取对应的值,以标记
Figure BDA0001313114490000056
的评论数骤增与否,具体取值方式如下:
Figure BDA0001313114490000057
其中,
Figure BDA0001313114490000058
为应用a所述评论量变化集合内所有记录的平均值,Tsurge为设置的评论数骤增阈值;V(a,b)的值越大,应用a与应用b在评论量骤增上相似度越高,它们来自相同目标团的可能性也就越大,通过设置评论数骤增相似度阈值Tv,若V(a,b)>Tv,则标记应用a与应用b为可疑目标对,即应用a与b有极大嫌疑来自相同目标团;
评分提升相似度模型的主要思想是,每次刷榜行动期间,来自一个刷榜用户组的大量用户会共同给予目标团内各应用高分评价,使得目标团中各应用在相同时段表现出评分的提高。对于所述可疑刷榜应用集中的任意两个应用,若它们在评分上表现出同时段提升的次数越多,则它们来自相同目标团的可能性也就越大。所述评分提升相似度模型,即评分提升相似度的计算方法为:
Figure BDA0001313114490000059
其中,R(a,b)为应用a与应用b的评分提升相似度,
Figure BDA0001313114490000061
为应用a在所述评分变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的评分变化值,
Figure BDA0001313114490000062
为评分变化类型的量化,根据
Figure BDA0001313114490000063
的变化值取0或1,以标记应用的评分提升,若
Figure BDA0001313114490000064
表示应用a在时段i上评分升高,否则
Figure BDA0001313114490000065
R(a,b)的值越大,应用a与应用b在评分提升上相似度越高,它们来自相同目标团的可能性也就越大,通过设置评分提升相似度阈值TR,若R(a,b)>TR,则标记应用a与应用b为可疑目标对,即应用a与b有极大嫌疑来自相同目标团;
排名骤变相似度模型的主要思想是,除了撰写评论与打高分,刷榜公司还可能组织刷榜用户组通过其它不为人知的手段提升目标团内各应用的排名,虽然这些手段难以察觉,但统一的刷榜行动会使来自同一目标团中的应用在排名上表现出相似的骤增骤降模式。对于所述可疑刷榜应用集中的任意两个应用,若它们在排名上表现出同时段骤增或骤降的次数越多,则它们来自相同目标团的可能性也就越大。所述排名骤变相似度模型,即排名骤变相似度的计算方法为:
Figure BDA0001313114490000066
其中,F(a,b)为应用a与应用b的排名骤变相似度,F(a,b)的值越大,应用a与应用b在排名骤变上相似度越高,它们来自相同目标团的可能性也就越大;通过设置排名骤变相似度阈值Tf,若F(a,b)>Tf,则标记应用a与应用b为可疑目标对,即应用a与b有极大嫌疑来自相同目标团。
所述目标团构建模块根据输入的可疑刷榜应用集合,以及集合内应用的排名变化集合,评论量变化集合,以及评分变化集合,按如下步骤构造目标团:
步骤a1:列出所述可疑刷榜应用集合中所有可能的两两应用对组合,构建应用对集合;
步骤a2:根据步骤a1得到的应用对集合,计算各应用对在评论数骤增相似度模型,评分提升相似度模型,与排名骤变相似度模型下对应的相似度,根据各模型设定的相似度阈值标记可疑目标对,构建可疑目标对集合;
步骤a3:根据步骤a2得到的可疑目标对集合,构建目标团,确保构建的每个目标团中任意两个应用均标记为可疑目标对。之后将步骤a3获得的目标团输入潜在刷榜用户组发现模块。
潜在刷榜用户组发现模块,利用频繁项集挖掘算法,结合获得的目标团内各应用的评论记录,得到最终潜在刷榜用户集合。
潜在刷榜用户组发现模块的主要思路是,每次刷榜行动期间,一组刷榜用户共同对目标团内各应用给予评论,通过逆向寻找共同参与目标团内应用评论的用户集合,即可发现潜在刷榜用户组,具体步骤如下:
步骤b1:获取目标团内各应用的用户评论记录,构建各应用的评论用户集,每个评论用户集为目标团中一个应用评论记录所包含的评论用户id集合;
步骤b2:设定最小支持度Smin,Smin的取值不大于待挖掘目标团所包含的应用总数;
步骤b3:利用步骤b2设定的最小支持度Smin与步骤b1获得的各应用的评论用户集,利用频繁项集挖掘算法,获得一系列频繁评论用户集,每个频繁评论用户集均为一组共同评论了应用团内多个应用,且共同评论的应用数不小于Smin的频繁评论用户集合,即为一组潜在刷榜用户;
步骤b4:输出步骤b3挖掘出的所有频繁评论用户集,得到最终的潜在刷榜用户组。
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

Claims (9)

1.一种移动应用市场刷榜用户组的检测方法,其特征在于,包括如下步骤:
应用数据采集阶段:获取移动应用市场的数据,收集移动应用市场排行榜中排名靠前的热门应用,将热门应用构成候选应用集合,并跟踪收集所述候选应用集合内各热门应用的信息;
可疑刷榜应用识别阶段:通过计算所述热门应用的排名骤升骤降频率,筛选得到由具有刷榜嫌疑的可疑刷榜应用构成的可疑刷榜应用集合;
目标团构建阶段:利用评论数骤增相似度模型、评分提升相似度模型和排名骤变相似度模型针对所述可疑刷榜应用集合挖掘刷榜用户组共同针对的目标应用集合,记为目标团;
潜在刷榜用户组发现阶段:利用频繁项集挖掘算法,结合所述目标团内各应用的评论记录,得到潜在刷榜用户集合。
2.如权利要求1所述的移动应用市场刷榜用户组的检测方法,其特征在于,在应用数据采集阶段中,跟踪收集所述热门应用的评论量,评分,以及排名数;并按固定时间间隔进行跟踪收集,得到各热门应用的排名变化集合,评论量变化集合,以及评分变化集合。
3.如权利要求2所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述热门应用的排名骤升骤降频率以如下公式(1)表示:
Figure FDA0002399666840000011
式(1)中,fa表示应用a的排名骤升骤降频率,
Figure FDA0002399666840000012
为应用a在所述排名变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的排名变化量,
Figure FDA0002399666840000013
用于量化
Figure FDA0002399666840000014
的排名变化类型;Tt为设定的排名骤变阈值。
4.如权利要求2所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述评论数骤增相似度模型中以如下公式(2)表示评论数骤增相似度:
Figure FDA0002399666840000015
式(2)中,V(a,b)表示应用a与应用b的评论数骤增相似度,
Figure FDA0002399666840000016
为应用a在所述评论量变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的评论数增量,
Figure FDA0002399666840000017
为评论数增量类型的量化;
Figure FDA0002399666840000018
为应用a所述评论量变化集合中所包含记录的平均值;Tsurge为设定的评论数骤增阈值。
5.如权利要求2所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述评分提升相似度模型中以如下公式(3)表示评分提升相似度:
Figure FDA0002399666840000021
式(3)中,R(a,b)为应用a与应用b的评分提升相似度,
Figure FDA0002399666840000022
为应用a在所述评分变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的评分变化值,
Figure FDA0002399666840000023
为评分变化类型的量化,根据
Figure FDA0002399666840000024
的变化值取0或1,以标记应用的评分提升。
6.如权利要求2所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述排名骤变相似度模型中以如下公式(4)表示排名骤变相似度:
Figure FDA0002399666840000025
式(4)中,F(a,b)为应用a与应用b的排名骤变相似度;
Figure FDA0002399666840000026
为应用a在所述排名变化集合中的一条记录,表示应用a在两次相邻数据收集间隔时段i上的排名变化量,
Figure FDA0002399666840000027
用于量化
Figure FDA0002399666840000028
的排名变化类型。
7.如权利要求1所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述目标团构建阶段中,根据输入的可疑刷榜应用集合,以及集合内各应用的排名变化集合、评论量变化集合以及评分变化集合按如下步骤构造目标团:
步骤a1:列出所述可疑刷榜应用集合中所有可能的两两应用间的组合,构建应用对集合;
步骤a2:根据所述应用对集合,计算各应用对在评论数骤增相似度模型、评分提升相似度模型与排名骤变相似度模型下对应的相似度,根据各模型设定的相似度阈值标记可疑目标对,构建可疑目标对集合;
步骤a3:根据所述可疑目标对集合构建目标团,构建的每个目标团中任意两个应用间均为已被标记的可疑目标对。
8.如权利要求1所述的移动应用市场刷榜用户组的检测方法,其特征在于,所述潜在刷榜用户组发现阶段按如下步骤挖掘潜在刷榜用户组:
步骤b1:获取目标团内各应用的用户评论记录,构建各应用的评论用户集,每个评论用户集为目标团中一个应用评论记录所包含的评论用户集合;
步骤b2:设定最小支持度,最小支持度的取值不大于所述目标团所包含的应用总数;
步骤b3:根据所述最小支持度与所述评论用户集合,利用频繁项集挖掘算法获得多个频繁评论用户集,每个频繁评论用户集均为一组共同评论了应用团内多个应用,且共同评论的应用数不小于设定的最小支持度的频繁评论用户集合,每个集合即为一组对应的潜在刷榜用户;
步骤b4:输出步骤b3挖掘出的所有频繁评论用户集,得到潜在刷榜用户组。
9.一种移动应用市场刷榜用户组检测系统,其特征在于,包括如下模块:
应用数据采集模块,其获取移动应用市场的数据,收集移动应用市场排行榜中排名靠前的热门应用,将热门应用构成候选应用集合,并跟踪收集所述候选应用集合内各热门应用的信息;
可疑刷榜应用识别模块,通过计算所述热门应用的排名骤升骤降频率,筛选得到由具有刷榜嫌疑的可疑刷榜应用构成的可疑刷榜应用集合;
目标团构建模块,其包括评论数骤增相似度模型、评分提升相似度模型和排名骤变相似度模型,针对所述可疑刷榜应用集合挖掘刷榜用户组共同针对的目标应用集合,记为目标团;
潜在刷榜用户组发现模块,利用频繁项集挖掘算法,结合所述目标团内各应用的评论记录,得到潜在刷榜用户组集合。
CN201710413775.5A 2017-04-06 2017-06-05 一种移动应用市场刷榜用户组检测方法及其系统 Active CN107391548B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017102207382 2017-04-06
CN201710220738 2017-04-06

Publications (2)

Publication Number Publication Date
CN107391548A CN107391548A (zh) 2017-11-24
CN107391548B true CN107391548B (zh) 2020-08-04

Family

ID=60331897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710413775.5A Active CN107391548B (zh) 2017-04-06 2017-06-05 一种移动应用市场刷榜用户组检测方法及其系统

Country Status (1)

Country Link
CN (1) CN107391548B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228450A (zh) * 2017-12-05 2018-06-29 华东师范大学 一种基于机器学习的应用商店刷榜应用检测方法
CN110163460B (zh) * 2018-03-30 2023-09-19 腾讯科技(深圳)有限公司 一种确定应用分值的方法及设备
CN108764935A (zh) * 2018-04-19 2018-11-06 华东师范大学 一种应用程序的排名欺诈检测方法
CN109408634A (zh) * 2018-09-17 2019-03-01 重庆邮电大学 一种基于派系过滤的意见垃圾用户群检测方法
CN109948641B (zh) * 2019-01-17 2020-08-04 阿里巴巴集团控股有限公司 异常群体识别方法及装置
CN109919191B (zh) * 2019-01-30 2023-05-02 华东师范大学 一种基于聚类的应用市场刷榜共谋组检测方法
CN113595860B (zh) * 2020-04-30 2023-06-13 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN116578942B (zh) * 2023-07-12 2023-12-22 国家计算机网络与信息安全管理中心 榜单异常的处理方法及装置
CN117076812B (zh) * 2023-10-13 2023-12-12 西安康奈网络科技有限公司 一种网络信息发布传播平台智能监测管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559210A (zh) * 2013-10-10 2014-02-05 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577541A (zh) * 2013-10-10 2014-02-12 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577542A (zh) * 2013-10-10 2014-02-12 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN105912599A (zh) * 2016-03-31 2016-08-31 维沃移动通信有限公司 终端应用程序的排名方法及终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102483753A (zh) * 2009-05-27 2012-05-30 谷歌公司 搜索结果中的计算机应用数据

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559210A (zh) * 2013-10-10 2014-02-05 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577541A (zh) * 2013-10-10 2014-02-12 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577542A (zh) * 2013-10-10 2014-02-12 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN105912599A (zh) * 2016-03-31 2016-08-31 维沃移动通信有限公司 终端应用程序的排名方法及终端

Also Published As

Publication number Publication date
CN107391548A (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN107391548B (zh) 一种移动应用市场刷榜用户组检测方法及其系统
Kling et al. Facets of phylodiversity: evolutionary diversification, divergence and survival as conservation targets
US20210150415A1 (en) Feature selection method, device and apparatus for constructing machine learning model
Liao et al. On mining mobile apps usage behavior for predicting apps usage in smartphones
Spanbauer et al. Prolonged instability prior to a regime shift
WO2018018610A1 (zh) 一种匹配度计算方法、装置以及用户设备
CN103514304B (zh) 一种项目推荐方法和装置
US20100030648A1 (en) Social media driven advertisement targeting
CN106126582A (zh) 推荐方法及装置
US20200068035A1 (en) System and method for bot detection
KR101892157B1 (ko) 게임 친구 추천 장치 및 게임 친구 추천 방법
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
KR102108683B1 (ko) 비관심사 컨텐츠를 포함하는 추천 컨텐츠를 제공하는 방법
WO2017045532A1 (zh) 应用程序分类的展示方法和装置
KR20180094833A (ko) 게임 친구 추천 장치 및 게임 친구 추천 방법
KR102085593B1 (ko) 기계학습 기법 기반 블록체인 sns 포스팅 봇 검출 방법 및 장치
CN105389590A (zh) 一种视频聚类推荐方法和装置
CN110322281B (zh) 相似用户的挖掘方法及装置
Samanta et al. LMPP: A Large Margin Point Process Combining Reinforcement and Competition for Modeling Hashtag Popularity.
CN103761228A (zh) 应用程序的排名阈值确定方法和排名阈值确定系统
JP5787717B2 (ja) 情報処理装置、プログラム及び情報検索システム
Wu et al. Detecting Crowdturfing in Social Media.
KR20170022230A (ko) 온라인 상의 사용자들에 의하여 작성된 비정형데이터로부터 범죄탐지를 수행하는 시스템 및 이를 이용한 범죄탐지 방법
CN103678709B (zh) 一种基于时序数据的推荐系统攻击检测方法
CN105574183A (zh) 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 200241 No. 500, Dongchuan Road, Shanghai, Minhang District

Patentee after: EAST CHINA NORMAL University

Address before: 200062 No. 3663, Putuo District, Shanghai, Zhongshan North Road

Patentee before: EAST CHINA NORMAL University

CP02 Change in the address of a patent holder