CN103559208A - 应用程序的排名欺诈检测方法和排名欺诈检测系统 - Google Patents

应用程序的排名欺诈检测方法和排名欺诈检测系统 Download PDF

Info

Publication number
CN103559208A
CN103559208A CN201310469985.8A CN201310469985A CN103559208A CN 103559208 A CN103559208 A CN 103559208A CN 201310469985 A CN201310469985 A CN 201310469985A CN 103559208 A CN103559208 A CN 103559208A
Authority
CN
China
Prior art keywords
application program
rank
active period
evidence
swindle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310469985.8A
Other languages
English (en)
Other versions
CN103559208B (zh
Inventor
祝恒书
于魁飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhigu Ruituo Technology Services Co Ltd
Original Assignee
Beijing Zhigu Ruituo Technology Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhigu Ruituo Technology Services Co Ltd filed Critical Beijing Zhigu Ruituo Technology Services Co Ltd
Priority to CN201310469985.8A priority Critical patent/CN103559208B/zh
Publication of CN103559208A publication Critical patent/CN103559208A/zh
Priority to US15/028,015 priority patent/US20160253484A1/en
Priority to PCT/CN2014/088245 priority patent/WO2015051752A1/en
Application granted granted Critical
Publication of CN103559208B publication Critical patent/CN103559208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2127Bluffing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2135Metering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种应用程序的排名欺诈检测方法和排名欺诈检测系统。所述方法包括:活跃期检测步骤,基于历史排名信息检测所述应用程序的活跃期;排名欺诈检测步骤,基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。本发明的方法及系统能够自动地识别出与应用程序有关的排名欺诈行为,从而使应用程序用户获得真实的应用程序排名信息。

Description

应用程序的排名欺诈检测方法和排名欺诈检测系统
技术领域
本发明涉及网络领域,尤其涉及一种应用程序的排名欺诈检测方法和排名欺诈检测系统。
背景技术
用户应用程序,尤其是安装并运行于移动终端的移动应用程序近年来发展迅速。为了方便用户选择并安装应用程序,很多应用程序网站或应用程序商店会集中地提供应用程序的查询、下载、用户评价或评论等服务,同时还会定期地,例如每日,发布应用程序排行榜(Application Leaderboard)以体现一些当前受用户欢迎的应用程序。事实上,该排行榜是促销应用程序的最重要手段之一,应用程序在排行榜上很高的排名通常会刺激用户大量下载该应用程序,并为应用程序开发者带来巨大的经济收益。因此,应用程序开发者非常希望其应用程序在排行榜上占据更高的排名。
应用程序的排名欺诈(Ranking Fraud)是指目的在于提高应用程序在应用程序排行榜上的排名而进行的欺骗行为。事实上,不同于依赖传统的市场手段来提高应用程序排名,应用程序开发者通过夸大其产品销量或发布虚假的产品评价来实施排名欺诈的行为已经越来越普遍,例如雇佣“水军(human water armies)”来在短时间内提升应用程序的下载量和评价次数等。
业界已经意识到防止排名欺诈以使应用程序用户获得真实的应用程序排名信息的重要性。为了防止应用程序的排名欺诈,现有的办法是根据一天内应用程序排名上升的程度来推断排名欺诈行为的存在,并在判断出现排名欺诈的时候直接锁定整个应用程序的排名,这种方式过于简单粗暴,难以准确判断排名欺诈行为而且伤害了正常应用程序的排名上升。可见,本领域对于应用程序的排名欺诈检测问题的理解和研究还非常有限,至今还不存在有效检测应用程序的排名欺诈的相关技术。
发明内容
本发明的目的在于提供一种应用程序的排名欺诈的检测技术,从而自动地有效识别出与应用程序有关的排名欺诈行为,以使应用程序用户获得真实的应用程序排名信息。
为解决上述技术问题,根据本发明的一个方面,提供一种应用程序的排名欺诈检测方法,所述方法包括:
活跃期检测步骤,基于历史排名信息检测所述应用程序的活跃期;
排名欺诈检测步骤,基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
根据本发明的另一个方面,还提供一种应用程序的排名欺诈检测系统,所述系统包括:
活跃期检测单元,用于基于历史排名信息检测所述应用程序的活跃期;
排名欺诈检测单元,用于基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
根据本发明的另一个方面,还提供一种应用程序的排名欺诈检测方法,所述方法包括:
基于至少一个证据对应用程序的活跃期进行检测,得到排名欺诈检测结果。
根据本发明的另一个方面,还提供一种应用程序的排名欺诈检测系统,所述系统包括:
排名欺诈检测单元,用于基于至少一个证据对应用程序的活跃期进行检测,得到排名欺诈检测结果。
本发明的方法及系统能够自动地有效识别出与应用程序有关的排名欺诈行为,从而使应用程序用户获得真实的应用程序排名信息。
附图说明
图1是本发明具体实施方式中应用程序的活跃期检测方法的流程图;
图2a是在应用程序排行榜中活跃事件的一个示例;
图2b是在应用程序排行榜中活跃期的一个示例;
图3是应用程序的一个活跃事件中不同排名阶段的示意图;
图4a是一个疑似存在排名欺诈的应用程序的排名记录示意图;
图4b是一个正常应用程序的排名记录示意图;
图5是本发明具体实施方式中应用程序的排名欺诈检测系统的系统结构图;
图6是本发明另一实施例中应用程序的排名欺诈检测系统的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明针对与应用程序排名相关的技术问题进行研究,因此本领域技术人员对本发明中的“应用程序”应做广义理解,其包括可发布于互联网并可供用户下载、评价、执行的各种程序或文件,即包括运行于个人电脑中的传统应用程序、运行于移动终端的移动应用程序,也包括可下载并播放的图片、音频、视频等多媒体文件等。
在检测应用程序的排名欺诈时,有几个需要解决的重要问题。首先,在应用程序的整个生命周期中并不会总出现排名欺诈,因此首先需要检测可能出现排名欺诈的时间;第二,由于应用程序数量巨大,很难手工地为每个出现排名欺诈的应用程序进行标定,因此需要提供一种自动检测排名欺诈的技术;第三,现有技术中并不确定可基于何种依据来检测排名欺诈的存在。
本发明的一个具体实施方式对应用程序的排名欺诈行为进行了整体性的分析和研究,提供了一种可检测应用程序的排名欺诈的技术,其可通过对应用程序的历史排名信息的分析来检测应用程序的“活跃期”,针对活跃期中应用程序的特定特征(包括排名特征、用户评价特征、用户评论特征、活跃用户信誉度特征等),基于至少一个证据来进行排名欺诈的检测。
根据发明人的分析发现,存在排名欺诈的应用程序并不会长期在排名榜上占据很高的排名,排名较高的情况仅是作为一些独立事件集中发生在一段相对较短的时期内,这表明排名欺诈行为正是发生在这段时期内。在本发明中,可将应用程序持续排名较高的时期称为应用程序的“活跃事件(Leading Event)”,可将频繁发生活跃事件的时期称为应用程序的“活跃期(Leading Session)”。因此,对于排名欺诈的检测首先需要检测每个应用程序有可能存在排名欺诈的该活跃事件和该活跃期。
应用程序商店运营商处拥有应用程序的历史排名信息,从应用程序商店运营商处直接获取,或通过对应用程序商店运营商在一段较长历史时期内持续发布的应用程序排行榜信息进行分析和处理,也可以获得应用程序的历史排名信息。由于应用程序的该历史排名信息记载了有关应用程序排名的历史信息、有关应用程序的用户评价的历史信息、有关应用程序的用户评论的历史信息和有关应用程序的用户信誉度的历史信息等多种信息,因此在本发明具体实施方式中,可以基于该历史排名信息来进行每个应用程序的活跃事件和活跃期的检测,并进而实现对排名欺诈的检测。通过分析应用程序的排名行为发现,相比于正常的应用程序而言,存在排名欺诈的应用程序在活跃事件和活跃期内会呈现成不同的特定特征。因此,有可能从应用程序的历史排名信息中抽取出一些用于判定排名欺诈的证据,并获取这些证据,从而实现对排名欺诈的检测。
如图1所示,本发明的一个具体实施方式中提供了一种应用程序的排名欺诈检测方法,所述方法包括:
活跃期检测步骤S10,基于历史排名信息检测所述应用程序的活跃期;排名欺诈检测步骤S20,基于至少一个证据来对所述活跃期进行检测,得到排名欺诈检测结果。
下面,结合附图来说明本发明具体实施方式中上述排名欺诈检测方法的各步骤流程和功能。
由于历史排名信息是本发明中检测应用程序的排名欺诈的数据基础,因此作为本发明的一个优选实施方式,该排名欺诈检测方法还可包括一历史排名信息获取步骤,获取所述应用程序在应用程序排行榜上的历史排名信息。
应用程序排行榜通常可显示受欢迎的排名前K位的应用程序,例如前1000位等。而且,应用程序排行榜通常会定期更新,例如每日进行更新。因此,对于每个应用程序a而言都有其历史排名信息,该历史排名信息可以包括表示为一个与离散时间序列对应的排名序列Ra={r1 a,...,ri a,...,rn a},该离散时间序列中的时间点之间的间隔固定,即应用程序排行榜的更新周期。其中,ri a是该应用程序a在时间ti时的排名,ri a∈{1,...,K...,+∞},+∞表示应用程序a不在排行榜排名前K位之列;n表示所有历史排名信息所对应的时间点总数。例如,在排行榜每天更新的情况下,ti就表示该段历史中的第i天,n就是历史排名信息所对应的总天数。可以看出,ri a的值越小,说明应用程序a第i天在排行榜上的排名越高。
在一个应用程序被发布后,任何用户都可以对其进行评价。实际上,用户评价对于应用程序推广而言是最重要的特征之一。具有越高评价的应用程序就会吸引越多的用户来购买或下载它,并导致该应用程序在排行榜上的更高排名。因而在历史排名信息中,可以包括历史评价信息,即历史各时间段中应用程序的用户对该应用程序做出的评价信息。
同样,在一个应用程序被发布后,任何用户都可以对其进行文字性的评论。实际上,用户评论对于应用程序推广而言是最重要的特征之一。具有越积极评论的应用程序就会吸引越多的用户来购买或下载它,并导致该应用程序在排行榜上的更高排名。因而在历史排名信息中,可以包括历史评论信息,即历史各时间段中应用程序的用户对该应用程序做出的评论信息。
同样,在一个应用程序被发布后,任何用户都可以购买、下载并使用该应用程序或对该应用程序进行等级评价或进行文字性的评论。通过对上述这些用户行为的采集和分析(例如通过移动终端统计用户使用所下载或购买的应用程序的次数、频度等),并结合用户的其他网络行为(例如用户在社交网络中的行为、用户在其它应用程序商店的行为、用户曾经的排名欺诈行为历史等),可对每个应用程序用户的信誉进行评级(例如包括从1~5这五个等级,5代表用户信誉最高,1代表用户信誉最差),以作为该用户的信誉度。因而,在该历史排名信息中,可以包括历史用户信誉度信息,即历史各时间段中某应用程序或应用程序排行榜中所有应用程序的用户信誉度信息。相应地在本发明中,将在一应用程序的活跃期内出现用户行为(包括购买、下载并使用该应用程序或对该应用程序进行等级评价或进行文字性的评论)的相应用户称为该应用程序的“活跃用户”,将在活跃期内的活跃用户的相应信誉度信息称为“活跃用户信誉度”。
在该历史排名信息获取步骤中,可以多种方式来获取该历史排名信息。例如,可从应用程序商店运营商处直接获取该历史排名信息,也可以从应用程序商店在一段较长历史时期内持续发布的数据中抽取该历史排名信息等。
S10:活跃期检测步骤,基于历史排名信息检测所述应用程序的活跃期。
活跃期表示一应用程序在应用程序排行榜上排名较高,也就是用户关注度比较高的一段时期,因此对应用程序市场会造成较大影响的排名欺诈行为只会出现在这些活跃期内。所以在本发明具体实施方式中,对于排名欺诈的检测首先要从应用程序的历史排名信息中检测出应用程序的活跃期。
在本发明一个优选实施方式中,在该活跃期检测步骤中可进一步包括一活跃事件检测步骤,基于该历史排名信息检测所述应用程序的活跃事件。
由于应用程序开发者均希望其应用程序在排行榜上占据较高的排名,因此应用程序开发者有可能利用排名欺诈的手段使其应用程序跻身排行榜前列。通过分析发现,应用程序并不会总是在排名榜上占据很高的排名,发生持续排名较高的时期即为“活跃事件”,图2a中示出了应用程序的活跃事件的例子,图中横轴表示历史排名信息对应的时间序列(Date Index),纵轴表示应用程序的排名(Ranking),图中的事件1(Event1)和事件2(Event2)表示该应用程序排名历史中所出现的两个活跃事件,其轮廓分别由活跃事件期间的排名点连接而成。
在本发明具体实施方式中,应用程序在应用程序排行榜上排名较高的标准是该应用程序的排名不大于一排名阈值K*。由于应用程序的排名在排行榜前K*位之列被认为是排名较高,因而应用程序的排名持续在前K*位之列的时间段即可被认为是一个活跃事件,该活跃事件应从该应用程序开始进入排行榜前K*位之列开始,持续到该应用程序跌出排行榜前K*位之列结束。
优选地,本发明实施方式中的方法还可包括一设置该排名阈值K*的步骤,从而确定应用程序在应用程序排行榜上排名较高的标准。由于排行榜上的应用程序总数量K通常很大,例如为1000等,因此上述排名阈值K*通常小于K值。根据应用程序排行榜中应用程序的总数量K和本领域技术人员的分析需求等因素,该排名阈值K*可在例如1~500之间的整数间取值。本领域技术人员可以理解,K*的取值越小,应用程序被认为排名较高的标准就越高。在图2a中,该K*的取值为300。
根据上述对于活跃事件的文字表述,应用程序a的活跃事件e可以如下公式化表述:
给定一排名阈值K*作为排名较高的标准,其中K*∈[1,K];应用程序a的活跃事件e包括从一开始时间到一结束时间的一时间范围
Figure BDA0000393343460000081
对应的应用程序a的排名满足
Figure BDA0000393343460000082
Figure BDA0000393343460000083
而且
Figure BDA0000393343460000084
均满足rk a≤K*。
根据上述表述可以看出,对于活跃事件的检测重要的在于检测应用程序的排名持续在前K*位之列的一段时间的开始时间和结束时间,并将一对开始时间和结束时间之间的时期确定为活跃事件。因此,在本发明具体实施方式中,该活跃事件检测步骤可进一步包括如下步骤:
开始时间识别步骤S101:在该步骤中,从历史排名信息中识别出活跃事件的开始时间。具体地,在该开始时间识别步骤中,可顺序搜索历史排名信息中每个时间点上的应用程序排名,当当前时间点的排名不大于排名阈值K*且上一时间点的排名大于排名阈值K*时,识别当前时间点为活跃事件的开始时间。本领域技术人员可以理解,由于在应用程序排名历史中可能包括多个活跃事件,因此在该开始时间识别步骤中可能识别出多个开始时间点。
结束时间识别步骤S102:在该步骤中,从历史排名信息中识别出活跃时间的结束时间。具体地,在该结束时间识别步骤中,可顺序搜索历史排名信息中每个时间点上的应用程序排名,当当前时间点的排名大于排名阈值K*且上一时间点的排名不大于排名阈值K*时,识别上一时间点为活跃事件的结束时间。本领域技术人员可以理解,由于在应用程序排名历史中可能包括多个活跃事件,因此在该结束时间识别步骤中可能识别出多个结束时间点。
活跃事件识别步骤S103:在该步骤中将每个开始时间与其之后相邻的结束时间之间的时间段识别为活跃事件,这样就检测出了应用程序在排名历史中的所有活跃事件。
值得说明的是,作为一种特殊情况,如果在所分析和处理的历史时期的第一个时间点上,例如在历史记录中的第一天,应用程序的排名就在排行榜前K*位之列,此时在所述开始时间识别步骤S101中,将该第一个时间点定义为一个开始时间。类似地,如果在所分析和处理的历史时期的最后一个时间点上,例如今天,应用程序的排名仍在排行榜前K*位之列,此时在所述结束时间识别步骤S102中将该最后一个时间点定义为一个结束时间。
上面介绍了检测应用程序中活跃事件的方式,在此基础上,在本发明一个优选实施方式中,可在该活跃期检测步骤中合并相邻近的活跃事件以构成所述活跃期。
通过进一步研究发现,一些应用程序会在一段时期内连续出现多次彼此相邻近的活跃事件,这段时期就是本发明中应用程序的“活跃期”。可见,将相邻近的活跃事件合并起来就构成了活跃期。具体地,可将相邻两个活跃事件的时间间隔小于一间隔阈值φ作为将两个活跃事件合并在同一活跃期内的标准,而相邻两个活跃事件的时间间隔则是指相邻两个活跃事件中前一活跃事件的结束时间和后一活跃事件的开始时间之间的间隔。
优选地,本发明实施方式中的方法还可包括一设置该间隔阈值φ的步骤,从而确定将两个活跃事件合并在同一活跃期内的标准。根据本领域技术人员的分析需求等因素,该间隔阈值φ的取值可以是应用程序排行榜的更新周期的2~10倍中的整数值。本领域技术人员可以理解,间隔阈值φ的取值越小,将两个活跃事件合并在同一活跃期内的标准就越高。
图2b中示出了应用程序的活跃期的例子,图中横轴表示历史排名信息对应的时间序列(Date Index),纵轴表示应用程序的排名(Ranking),图中的期间1(Session1)和期间2(Session2)代表该应用程序排名历史中所出现的两个活跃期,每个活跃期由多个活跃事件构成。
根据上述对于活跃期的文字表述,应用程序a的活跃期s可以如下公式化表述:
应用程序a的活跃期s包括一时间范围
Figure BDA0000393343460000101
和n个相邻的活跃事件{e1,...,en},其满足
Figure BDA0000393343460000102
且不存在其它活跃期s*使得
Figure BDA0000393343460000104
。此外,
Figure BDA0000393343460000105
都有其中φ是预设的活跃事件间隔阈值,是用于判断活跃事件之间相邻程度以将它们纳入同一活跃期的判断标准。
根据上述表述可以看出,对于活跃期的检测重要的在于基于间隔阈值φ将应用程序排名历史中相邻近的活跃事件合并以形成活跃期。具体地,在本发明具体实施方式的活跃期检测步骤中,从历史排名信息中的初始时间点开始顺序搜索每个检测出的活跃事件,当当前活跃事件与上一活跃事件的时间间隔小于该间隔阈值φ时,将这两个活跃事件合并在同一活跃期内,直至搜索完所有检测出的活跃事件以检测出该应用程序在排名历史中的所有活跃期。
值得说明的是,作为一种特殊情况,如果一个活跃事件并不与任何其他活跃事件相邻近,该活跃事件自身也可被认为构成一活跃期。在这种情况下,在该活跃期检测步骤中,当一活跃事件与上一活跃事件的时间间隔不小于所述间隔阈值φ,且该活跃事件与下一活跃事件的时间间隔不小于所述间隔阈值φ时,检测该活跃事件自身为一活跃期。
正如前文所述,所检测出的上述活跃期表示一应用程序在应用程序排行榜上排名较高,也就是受到用户欢迎的一段时期,所检测出的该活跃期可作为包括检测排名欺诈在内的各种应用程序服务的数据基础。因此,在检测出应用程序的活跃期之后,作为本发明一个优选实施方式,还可以将所检测出的应用程序的活跃期信息发送给应用程序开发者、应用程序商店运营商或应用程序的终端用户。
对于应用程序开发者而言,其可以根据该活跃期信息分析相关技术领域的发展趋势或应用程序用户的需求,从而指导应用程序的开发和运营;对于应用程序商店运营商而言,其可以根据该活跃期信息进一步分析出利用欺诈手段获取排行榜上虚假高排名的排名欺诈行为等,从而改进应用程序商店的运营;而对于应用程序终端用户而言,他们可以根据该活跃期信息来自行判断应用程序存在排名欺诈的可能性或者选择符合自身需求的应用程序等。
此外,作为检测应用程序的活跃事件和活跃期的一种具体实现方式,如下的算法1示出了在给定应用程序a的历史排名信息中检测活跃期的一个程序代码的实例。
Figure BDA0000393343460000121
在上述算法1中,将每个活跃事件e定义为
Figure BDA0000393343460000122
将活跃期s定义为
Figure BDA0000393343460000123
其中Es是在活跃期s内活跃事件的集合。特别地,首先从历史排名信息的开始时间起抽取应用程序a的各个活跃事件e(算法1中的步骤2-5)。对于每个抽取出的活跃事件e,检测e与前一个活跃事件e*之间的时间间隔以判断它们是否属于同一个活跃期。具体地,如果
Figure BDA0000393343460000124
活跃事件e则被认为属于一个新的活跃期(算法1中的步骤7-13)。这样,上述算法1可以通过对应用程序a的历史排名信息的一次扫描来识别活跃事件和活跃期。
排名欺诈检测步骤S20,基于至少一个证据来对所述活跃期进行检测,得到排名欺诈检测结果。
作为本发明的一个优选实施方式,该排名欺诈检测步骤可进一步包括一证据验证步骤,基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。这样,在抽取出特定证据之后,可计算与该证据对应的欺诈参数,该欺诈参数本身可作为本实施方式中的排名欺诈检测方法的排名欺诈检测结果。由于影响应用程序的特定特征的因素较为复杂,仅依靠一个或一类证据可能无法准确判断一个应用程序是否存在排名欺诈而是仅得到一个供参考的检测值(欺诈参数),但是本领域技术人员可以根据该欺诈参数来判断应用程序存在排名欺诈的可能性。
在本发明具体实施方式中,可分别抽取出四类用于对排名欺诈进行检测的证据,分别是:与排名相关的证据、与用户评价相关的证据、与用户评论相关的证据和与活跃用户信誉度相关的证据。下面就来分别介绍这四类证据以及利用它们在本发明具体实施方式中进行排名欺诈检测的具体步骤。
(1)与排名相关的证据
正如上文中对历史排名信息的介绍,其包括表示为一个与离散时间序列对应的排名序列,该排名序列中的每个元素对应于时间序列中的一个离散时间点,表示该应用程序在该离散时间点时的排名。同时,活跃期是应用程序有可能发生排名欺诈的时期。因此,可对应用程序活跃期中历史排名信息的排名特征进行分析,抽取出一些与排名相关的信息作为用于检测排名欺诈的证据。
由于一个活跃期可能包括一个或多个活跃事件,因此为了抽取活跃期内用于检测排名欺诈的证据,作为本发明的一个优选实施方式,该排名欺诈检测步骤可进一步包括一活跃事件分析步骤,来分析活跃期内各活跃事件的一些基本排名特征,例如识别活跃事件的上升阶段、保持阶段和下降阶段。
具体地,通过分析应用程序的历史排名信息可知,应用程序在活跃事件中的排名行为通常满足特定的排名特征,即均包括三个不同的排名阶段:上升阶段、保持阶段和下降阶段。在每个活跃事件中,应用程序的排名首先上升到排行榜的一峰值范围内(即上升阶段,Raising Phase),然后在该峰值范围内保持一段时期(即保持阶段,Maintaining Phase),最后排名下降直至活跃事件的结束(即下降阶段,Recession Phase)。图3示出了一个活跃事件中不同排名阶段的例子,图中横轴表示历史排名信息对应的时间序列(Date Index),纵轴表示应用程序的排名(Ranking)。
基于上述文字表述,下面对活跃事件的上述三个阶段进行公式化的描述:
对于给定的应用程序a,在其活跃事件e的时间范围中,应用程序a的最高排名位置是
Figure BDA0000393343460000142
其属于ΔR范围内。活跃事件e的上升阶段是指时间范围
Figure BDA0000393343460000143
其中
Figure BDA0000393343460000144
rb a∈ΔR且
Figure BDA0000393343460000145
满足。活跃事件e的保持阶段是指时间范围,其中rc a∈ΔR且
Figure BDA0000393343460000146
满足
Figure BDA00003933434600001410
。活跃事件的下降阶段是指事件范围其中 t d e = t end e .
值得注意的是,在上述描述中,ΔR是确定保持阶段的开始时间和结束时间的排名范围,
Figure BDA00003933434600001411
Figure BDA00003933434600001412
分别是应用程序a的排名在排名范围ΔR内的第一个时间和最后一个时间。本领域技术人员可以根据分析需求设置ΔR的范围从而对活跃事件进行阶段划分,例如在图3中ΔR的范围是应用程序排名在排行榜前70位。在本发明一个优选实施方式中,在该活跃事件分析步骤中识别上述三阶段的方式为:确定活跃事件中应用程序的排名在峰值范围ΔR内的第一个时间和最后一个时间,将该第一个时间和该最后一个时间之间的时间段识别为保持阶段,将活跃事件中在保持阶段之前的时间段识别为上升阶段,将活跃事件中在保持阶段之后的时间段识别为下降阶段。
对于一个应用程序,即使存在排名欺诈也不可能总是保持在一个相同的峰值位置,例如总是在排行榜上排名第一,而是保持在一个峰值范围内,例如在排行榜前25名等。如果应用程序a的一个活跃期s存在排名欺诈,其活跃事件的这三个阶段中的排名行为会和那些正常的应用程序的活跃期不同。实际上,每个存在排名欺诈的应用程序总具有一个期望的排名目标,例如在排行榜前25名之内保持一周等,同时也会根据该排名目标来给所雇用来实施排名欺诈行为的人付钱(例如保持在前25名的时间内每天1000美元等)。因此,无论对于应用程序开发者还是对于被雇佣的人,越快达到该排名目标他们就可以越快获利。此外,在达到并保持该排名目标一段所需时间后,排名欺诈行为会停止,该应用程序的排名将会出现骤降。由此可见,存在排名欺诈的活跃事件将会呈现出非常短的上升阶段和非常短的下降阶段。同时,由于通过排名欺诈使应用程序占据排行榜高位的费用是非常高的,因此存在排名欺诈的应用程序通常在每个活跃事件中仅有一个较短的保持阶段使得该应用程序处于排行榜高位。
图4a示出了一个疑似存在排名欺诈的应用程序的排名记录。在图中,可以看出该应用程序存在多个脉冲式的活跃事件。相反,对于正常的应用程序而言,其活跃事件中的排名行为是截然不同的。例如,图4b示出了一个非常受用户欢迎的正常应用程序的排名记录,其包括一个具有很长时间范围的活跃事件(长于1年),尤其在下降阶段。实际上,一旦一个正常应用程序攀升到排行榜较高的排名,它通常具有一大群忠实粉丝并可能吸引越来越多的用户去下载,因此这个应用程序将会长时间地在排行榜上占据较高的排名。基于上述分析,本发明可在应用程序的活跃期内抽取一些与排名有关的识别标志来构建证据(与排名相关的证据),并利用这些证据来检测排名欺诈的存在。
根据上述对活跃事件三个阶段的分析可知,存在排名欺诈的活跃事件将会呈现出非常短的上升阶段和非常短的下降阶段,因此在一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件中的上升阶段和/或下降阶段所体现出的一些排名特征来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,由于在活跃事件分析步骤中已经识别出活跃期内各活跃事件的上升阶段和下降阶段,因此可计算活跃期内所有活跃事件的上升阶段的时间范围的平均值(如活跃期内包括3个活跃事件,该平均值即为3个活跃事件的3个上升阶段的时间范围和再除以3),或所有活跃事件的下降阶段的时间范围的平均值,或所有活跃事件的上升阶段的时间范围和下降阶段的时间范围的和的平均值,作为该欺诈参数。
再例如,还可以计算活跃期内所有活跃事件的上升阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的下降阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的上升阶段的曲线和下降阶段的曲线与时间轴相交所形成的锐角的角度和的平均值,作为该欺诈参数。如图3所示,两个锐角参数θ1和θ2分别示出了应用程序a的一个活跃事件e中上升阶段曲线(上升阶段中各相邻排名数值点相连构成的曲线)和下降阶段曲线(下降阶段中各相邻排名数值点相连构成的曲线)与时间轴相交所形成的锐角。根据之前活跃事件分析步骤中对于活跃事件中三个阶段的公式化描述,本领域技术人员可以可通过如下公式来计算上述参数θ1和θ2
θ 1 e = arctan ( K * - r b a t b e - t a e ) , θ 2 e = arctan ( K * - r c a t d e - t c e ) - - - ( 1 )
其中K*是代表较高排名的排名阈值。
可以看出,θ1值较大,就代表应用程序a在较短时间内排名骤升到较高排名;θ2值较大,则代表应用程序a在很短时间内从较高排名骤降到排名底部。因此,对于一个活跃期,如果其包含越多具有较大θ1值或较大θ2值的活跃事件,就表明其存在排名欺诈的可能性越大。例如,当将活跃期内所有活跃事件的上升阶段的曲线和下降阶段的曲线与时间轴相交所形成的锐角的角度和的平均值作为该欺诈参数时,这里可以进一步描述该欺诈参数
Figure BDA0000393343460000162
如下:
θ s ‾ = 1 | E s | Σ e ∈ s ( θ 1 e + θ 2 e ) - - - ( 2 )
其中|Es|是在活跃期s内所包含的活跃事件的总数目。可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的
Figure BDA0000393343460000172
值,该应用程序就有很大可能性存在排名欺诈。
根据上述对活跃事件三个阶段的分析可知,存在排名欺诈的应用程序通常在每个活跃事件中仅有一个较短的保持阶段使得该应用程序处于排行榜高位,因此在本发明一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件中的保持阶段所体现出的一些排名特征来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,由于在活跃事件分析步骤中已经识别出活跃期内各活跃事件的保持阶段,因此可计算活跃期内所有活跃事件的保持阶段的时间范围的平均值作为该欺诈参数。
再例如,可基于活跃期内所有活跃事件的保持阶段中该应用程序的平均排名和所述活跃事件的时间范围来计算该欺诈参数。具体地,如上面讨论过的,存在排名欺诈的应用程序通常在活跃事件中具有较短的保持阶段。因此,如果用
Figure BDA0000393343460000173
来表示活跃事件e的保持阶段的时间范围,并将该保持阶段中应用程序a的平均排名表示为
Figure BDA0000393343460000174
e,可以例如定义一个活跃期的欺诈参数Χs如下:
X s = 1 | E s | Σ e ∈ s K * - r m - e Δ t m e - - - ( 3 )
其中K*是代表较高排名的排名阈值。可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的Χs值,该应用程序就有很大可能性存在排名欺诈。
此外,本领域技术人员可以理解,在应用程序的活跃期s内所包含的活跃事件的数目|Es|也是存在排名欺诈的重要标志。对于正常的应用程序而言,下降阶段表明欢迎度的降低,因此在活跃事件的结束之后不太可能在短期内再次出现另一个活跃事件,除非该应用程序推出了更新的版本或者采取了其他商业促销手段。因此,相比于排行榜上其他应用程序的活跃期,如果应用程序的一个活跃期包含了比排行榜上其他应用程序的活跃期多的多的活跃事件,该应用程序就有很大可能性存在排名欺诈。
根据上述对活跃期中活跃事件数目的分析,在一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件的数量构成,并基于所构成的该证据确定出活跃期内的活跃事件的数量Es,作为用于判断排名欺诈的欺诈参数。
(2)与用户评价相关的证据
与排名有关的证据对于检测排名欺诈非常重要,但是有的时候,采用与排名有关的证据并不总是有效。例如,有些应用程序是由著名的开发者出来的,受到开发者信誉和口碑的影响,这些应用程序的活跃事件的上升阶段具有很大的θ1值。此外,受一些例如“限时折扣”等合法的市场服务的影响,也会导致一些与排名有关的证据的出现。为了解决这些问题,本发明具体实施方式中同时研究如何从历史排名信息中抽取其他特征来作为检测排名欺诈的证据。
正如上文中对历史排名信息的介绍,其包括历史评价信息,即历史各时间段中应用程序的用户对该应用程序做出的用户评价。同时,活跃期是应用程序有可能发生排名欺诈的时期。因此,可对应用程序活跃期中历史排名信息的评价特征进行分析,抽取出一些与用户评价相关的信息作为用于检测排名欺诈的证据。
具体地,在一个应用程序被发布后,任何下载用户都可以对其进行评价,例如对该应用程序给出1~5分的评分,通常5分代表用户对该应用程序非常满意(最高评价),而1分代表非常不满意(最低评价)。实际上,用户评价对于应用程序推广而言是最重要的特征之一。具有越高评价的应用程序就会吸引越多的用户来购买或下载它,并导致该应用程序在排行榜上的更高排名。因此,虚假评价也是排名欺诈中的重要表现形式。如果应用程序的活跃期s中存在排名欺诈,在活跃期s的时间段内的评价将具有与其他历史阶段的评价不同的异常特征,该特征可用于构建用于检测排名欺诈的与用户评价相关的证据。
对于正常的应用程序而言,在特定活跃期内的平均用户评价应当与其所有历史评价记录中的平均评价是一致的。相反,对于存在排名欺诈的应用程序,在其活跃期内相比于其历史评价会具有惊人的高评价。作为本发明的一个优选实施方式,与用户评价相关的证据可基于活跃期内的平均用户评价
Figure BDA0000393343460000193
和历史平均评价来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如直观地,可计算活跃期内所有用户评价的平均值和历史平均评价
Figure BDA0000393343460000196
之间的差值,或所有用户评价的平均值和历史平均评价
Figure BDA0000393343460000198
之间的比值,作为该欺诈参数。
再例如,还可以计算活跃期内所有用户评价的平均值和历史平均评价
Figure BDA00003933434600001910
之间的差值与历史平均评价
Figure BDA00003933434600001911
的比值,作为该欺诈参数。通过公式化描述,该欺诈参数ΔRs如下:
Δ R s = R ‾ s - R ‾ a R ‾ a , ( s ∈ a ) - - - ( 1 )
其中是活跃期内的平均用户评价值,
Figure BDA00003933434600001912
是应用程序a的历史评价平均值。因此,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的ΔRs值,该应用程序就有很大可能性存在排名欺诈。
在应用程序的评价信息中,每个评价都可以被归为一个离散的评价等级体系|L|中,例如包括从1~5这五个等级,其代表了用户对于该应用程序的喜好程度。对于一个正常的应用程序a而言,其在活跃期s内的评价等级li的分布p(li|Rs,a)应当与其历史评价记录中的分布p(li|Ra)是一致的。作为本发明的一个优选实施方式,与用户评价相关的证据可基于应用程序在活跃期内的评价等级分布和历史评价信息中的评价等级分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,可计算应用程序在活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的差值,作为该欺诈参数。具体地,首先可以通过
Figure BDA0000393343460000201
来计算p(li|Rs,a)的值,其中
Figure BDA0000393343460000203
是在活跃期内评价等级为li的用户评价数目,
Figure BDA0000393343460000204
是在活跃期s内总的评价数目;同时可以使用类似的方式来计算p(li|Ra);然后计算应用程序在活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的差值。作为一种具体实现方式,可以使用p(li|Rs,a)与p(li|Ra)之间的余弦距离D(s)来估计它们之间的差值。通过公式化描述,该欺诈参数D(s)如下:
D ( s ) = Σ i = 1 | L | p ( l i | R s , a ) × p ( l i | R a ) Σ i = 1 | L | P ( l i | R s , a ) 2 × Σ i = 1 | L | p ( l i | R a ) 2 - - - ( 2 )
可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的D(s)值,该应用程序就有很大可能性存在排名欺诈。
(3)与用户评论有关的证据
正如上文中对历史排名信息的介绍,其包括历史评论信息,即历史各时间段中应用程序的用户对该应用程序做出的用户评论。同时,活跃期是应用程序有可能发生排名欺诈的时期。因此,可对应用程序活跃期中历史排名信息的用户评论特征进行分析,抽取出一些与用户评论相关的信息作为用于检测排名欺诈的证据。
具体地,在一个应用程序被发布后,绝大多数的应用程序网站或者应用程序商店允许用户针对应用程序写出文本格式的用户评论。这些用户评论可以反映出用户对特定应用程序的个人观点或者使用体验。实际上,用户评论对于应用程序推广而言是最重要的特征之一,同时伪造的用户评论也是排名欺诈最重要的方面之一。在下载或购买新的应用程序之前,用户通常会先浏览一下历史评论信息中的用户评论来帮助他们做决定,具有越多积极评论的应用程序就会吸引越多的用户来购买或下载它,并导致该应用程序在排行榜上的更高排名。因此,排名造假者通常会针对特定应用程序发布虚假的用户评论以刺激该应用程序的购买量或下载量,从而迅速提升该应用程序在排行榜上的排名。如果应用程序的活跃期s中存在排名欺诈,在活跃期s的时间段内的用户评论将具有与其他历史阶段的用户评论不同的异常特征,该特征可用于构建用于检测排名欺诈的与用户评论相关的证据。
事实上,由于人力成本太高,绝大多数的虚假用户评论都是由预先设定的机器实施的。因此,用户评论造假者通常频繁发布大量相同或者相似的用户评论以提升该应用程序的排名。相反,由于不同用户具有不同的个人观点和使用体验,正常的应用程序通常会具有多样性的用户评论。作为本发明的一个优选实施方式,与用户评论相关的证据可基于活跃期内用户评论间的相似程度来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,可计算在活跃期s内用户评论间的平均相似度Sim(s)作为该欺诈参数。具体地,可以如下步骤来计算该欺诈参数Sim(s):
首先,对在活跃期s内的每一条用户评论c进行标准化处理。例如,对于中文用户评论而言,可将“的”、“这个”等虚词删除,对于英文用户评论而言,可将“of”、“the”等词删除,并将动词、形容词的变形去除等(例如将plays变为play,将better变为good等)。
然后,为每一条用户评论c构建标准化词汇向量
Figure BDA0000393343460000214
其中n是活跃期s内所有用户评论中所有不同的标准化词汇的总数量。具体地,可以有
Figure BDA0000393343460000211
其中freqi,c是第i个词汇在用户评论c中的出现频率。
最后,可通过余弦相似度
Figure BDA0000393343460000212
来计算用户评论ci与用户评论cj之间的相似度。因此,可以通过例如如下公式来计算欺诈参数Sim(s):
m ( s ) = 2 × Σ 1 ≤ i ≤ j ≤ N s Cos ( ω c i → , ω c j → ) N s × ( N s - 1 ) - - - ( 3 )
其中Ns是活跃期s内用户评论的总数目。
可见,Sim(s)值越大就说明活跃期s内包含更多相同或相似的用户评论。因此,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的Sim(s)值,该应用程序就有很大可能性存在排名欺诈。
通过对应用程序的用户评论进行分析发现,每一条用户评论c都会与一个特定的潜在主题z相关。例如,有的用户评论与潜在主题“值得下载”相关,有的用户评论与签在主题“非常无聊”相关。同时,由于不同用户会对应用程序有不同的个人偏好,每个应用程序a在其用户评论历史记录中应具有不同的主题分布。对于一个正常的应用程序a而言,其活跃期s内的用户评论的主题分布p(z|s)应当和该应用程序a在整个历史记录中用户评论的主题分布p(z|a)相一致。相反,如果一个应用程序在其活跃期s内存在虚假用户评论,上述两种主题分布将会出现明显差异,例如在活跃期内会出现更多的积极用户评论,如“值得下载”、“受欢迎”等。作为本发明的一个优选实施方式,与用户评论相关的证据可基于应用程序在活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,可计算应用程序在活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的差值,作为该欺诈参数。
在现有技术中存在各种用于抽取潜在主题的主题建模技术。在本发明具体实施方式中,可采用现有技术中广泛采用的潜在狄利柯雷分配模型(Latent Dirichlet Allocation Model)来抽取用户评论中的所有潜在主题(D.M.Blei,A.Y.Ng,and M.I.Jordan.Latent dirichletallocation.Journal of Machine Learning Research,Pages993-1022,2003)。之后,可基于所抽取出的用户评论中的所有潜在主题来计算应用程序在活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的差值。
具体地,首先可以通过
Figure BDA0000393343460000231
来计算p(zi|s)的值,其中
Figure BDA0000393343460000233
是在活跃期s内用户评论的主题为zi的用户评论数目,
Figure BDA0000393343460000234
是在活跃期s内总的用户评论数目;同时可以使用类似的方式来计算p(zi|a);然后计算应用程序在活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的差值。作为一种具体实现方式,可以使用p(zi|s)与p(zi|a)之间的余弦距离D(s)来估计它们之间的差值。通过公式化描述,该欺诈参数D(s)如下:
D ( s ) = Σ i = 1 M p ( z i | s ) × p ( z i | a ) Σ i = 1 M p ( z i | s ) 2 × Σ i = 1 M p ( z i | a ) 2 - - - ( 4 )
其中,M是所抽取出的用户评论的主题的总数量。可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的D(s)值,该应用程序就有很大可能性存在排名欺诈。
(4)与活跃用户信誉度相关的证据
正如上文中对历史排名信息的介绍,其包括历史用户信誉度信息,即历史各时间段中某应用程序或应用程序排行榜中所有应用程序的用户信誉度信息。同时,活跃期是应用程序有可能发生排名欺诈的时期。因此,可对应用程序活跃期中历史排名信息的用户信誉特征进行分析,抽取出一些与活跃用户信誉度相关的信息作为用于检测排名欺诈的证据。
具体地,应用程序的用户信誉度可被归为一个离散的信誉度等级体系中,例如包括从1~5这五个等级,5代表用户信誉最高,1代表用户信誉最差。如果应用程序的活跃期s中存在排名欺诈,就必然有一些用户信誉度较差的用户参与到例如虚假下载、虚假评价或评论等欺诈行为中,因此在活跃期s的时间段内的用户信誉度将具有与其他历史阶段的用户信誉度不同的异常特征,该特征可用于构建用于检测排名欺诈的与活跃用户信誉度相关的证据。
对于正常的应用程序而言,在特定活跃期内活跃用户的平均信誉度应当与其历史所有用户的平均信誉度是一致的。相反,对于存在排名欺诈的应用程序,在其活跃期内活跃用户的平均信誉度相比于其历史所有用户的平均信誉度会具有明显的下降。作为本发明的一个优选实施方式,与活跃用户信誉度相关的证据可基于应用程序的活跃用户平均信誉度
Figure BDA0000393343460000242
和该应用程序的历史用户平均信誉度
Figure BDA0000393343460000241
来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如直观地,可计算应用程序的历史用户平均信誉度
Figure BDA0000393343460000244
和该应用程序的活跃用户平均信誉度
Figure BDA0000393343460000243
之间的差值,或应用程序的历史用户平均信誉度
Figure BDA0000393343460000245
和该应用程序的活跃用户平均信誉度
Figure BDA0000393343460000246
之间的比值,作为该欺诈参数。
因此,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的上述差值或比值,该应用程序就有很大可能性存在排名欺诈。
对于正常的应用程序而言,在特定活跃期内活跃用户的平均信誉度应当与应用程序排行榜中所有应用程序的历史用户平均信誉度是一致的。相反,对于存在排名欺诈的应用程序,在其活跃期内活跃用户的平均信誉度相比于应用程序排行榜中所有应用程序的历史用户平均信誉度会具有明显的下降。作为本发明的一个优选实施方式,与活跃用户信誉度相关的证据可基于应用程序的活跃用户平均信誉度
Figure BDA0000393343460000248
和应用程序排行榜中所有应用程序的历史用户平均信誉度
Figure BDA0000393343460000247
来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如直观地,可计算应用程序排行榜中所有应用程序的历史用户平均信誉度
Figure BDA00003933434600002410
和应用程序的活跃用户平均信誉度之间的差值,或应用程序排行榜中所有应用程序的历史用户平均信誉度
Figure BDA00003933434600002411
和应用程序的活跃用户平均信誉度
Figure BDA0000393343460000252
之间的比值,作为该欺诈参数。
因此,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的上述差值或比值,该应用程序就有很大可能性存在排名欺诈。
在应用程序的用户信誉度信息中,每个用户的信誉都可以被归为一个离散的用户信誉等级体系|L|中,例如包括从1~5这五个等级,其代表了用户信誉的高低。对于一个正常的应用程序a而言,其在活跃期s内的活跃用户的信誉度等级li的分布p(li|Qs,a)应当与其历史用户信誉度等级分布p(li|Qa)是一致的。作为本发明的一个优选实施方式,与活跃用户信誉度相关的证据可基于应用程序的活跃用户信誉度分布和该应用程序的历史用户信誉度分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,可计算应用程序的历史用户信誉度分布和应用程序的活跃用户信誉度分布之间的差值,作为该欺诈参数。具体地,首先可以通过
Figure BDA0000393343460000253
来计算p(li|Qs,a)的值,其中
Figure BDA0000393343460000254
是在活跃期内用户信誉度等级为li的活跃用户数目,是在活跃期s内总的活跃用户数目;同时可以使用类似的方式来计算p(li|Qa);然后计算应用程序的历史用户信誉度分布和应用程序的活跃用户信誉度分布之间的差值。作为一种具体实现方式,可以使用p(li|Qs,a)与p(li|Qa)之间的余弦距离D(s)来估计它们之间的差值。通过公式化描述,该欺诈参数D(s)如下:
D ( s ) = Σ i = 1 | L | p ( l i | Q s , a ) × p ( l i | Q a ) Σ i = 1 | L | P ( l i | Q s , a ) 2 × Σ i = 1 | L | p ( l i | Q a ) 2 - - - ( 5 )
可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的D(s)值,该应用程序就有很大可能性存在排名欺诈。
同时,对于一个正常的应用程序a而言,其在活跃期s内的活跃用户的信誉度等级li的分布p(li|Qs,a)应当与应用程序排行榜中所有应用程序的历史用户信誉度的等级分布p(li|Q)是一致的。作为本发明的一个优选实施方式,与活跃用户信誉度相关的证据可基于应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
例如,可计算应用程序排行榜中所有应用程序的历史用户信誉度分布和应用程序的活跃用户信誉度分布之间的差值,作为该欺诈参数。具体地,首先可以通过来计算p(li|Qs,a)的值,其中
Figure BDA0000393343460000264
是在活跃期内用户信誉度等级为li的活跃用户数目,
Figure BDA0000393343460000265
是在活跃期s内总的活跃用户数目;同时可以使用类似的方式来计算p(li|Q);然后计算应用程序的历史用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布之间的差值。作为一种具体实现方式,可以使用p(li|Qs,a)与p(li|Q)之间的余弦距离D(s)来估计它们之间的差值。通过公式化描述,该欺诈参数D(s)如下:
D ( s ) = Σ i = 1 | L | p ( l i | Q s , a ) × p ( l i | Q ) Σ i = 1 | L | P ( l i | Q s , a ) 2 × Σ i = 1 | L | p ( l i | Q ) 2 - - - ( 6 )
可见,相比于排行榜上其他应用程序的活跃期,如果一个应用程序的活跃期s包含明显较大的D(s)值,该应用程序就有很大可能性存在排名欺诈。
上面介绍了多类以及每类中的多种证据,除了在上述各优选实施方式中单独使用它们中的一个来进行排名欺诈检测之外,在证据验证步骤的一个优选实施方式中,还可以综合考虑上述证据中的多个,将基于这些证据验证得到的对应欺诈参数进行加权计算,从而得到一个最终欺诈参数。考虑到上述多种证据有可能具有不同量纲,本领域技术人员可以根据实际分析需求中对于各证据的重视程度,基于现有技术中公知的归一化方法和权重确定方法来确定各欺诈参数的权重值,在此不再赘述。
以上介绍了在排名欺诈检测步骤中的证据验证步骤,其可基于至少一个证据对所述活跃期进行验证并得到一欺诈参数,该欺诈参数本身就可以作为排名欺诈检测方法的排名欺诈检测结果。但是为了使本领域技术人员更加方便地进行排名欺诈检测,在一个优选实施方式中,排名欺诈检测步骤还可以进一步包括一欺诈参数判断步骤,将根据证据所计算得到的欺诈参数与一阈值进行比较,从而直观地判断出判断应用程序是否存在排名欺诈。
本领域技术人员可以理解,基于上文中所介绍的多类以及每类中的多种证据,本领域技术人员可以根据证据的不同性质和检测需求分别设置相应的阈值,根据所设置的阈值来进行应用程序是否存在排名欺诈的判断,并将判断的最终结果作为本发明具体实施方式中排名欺诈检测方法的排名欺诈检测结果。例如,对于上文中所介绍的多种与排名相关的证据而言,如果欺诈参数是活跃事件的上升阶段和/或下降阶段的时间范围的平均值,或是保持阶段的时间范围的平均值,当计算出的欺诈参数小于所设置的阈值时,判断出该应用程序存在排名欺诈现象;而如果欺诈参数是其他所介绍的情况,当计算出的欺诈参数超过所设置的阈值时,判断出该应用程序存在排名欺诈现象。再例如,对于上文中所介绍的多种与用户评价相关的证据而言,当计算出的欺诈参数超过所设置的阈值时,判断出该应用程序存在排名欺诈现象。再例如,对于上文中所介绍的多种与用户评论相关的证据而言,当计算出的欺诈参数超过所设置的阈值时,判断出该应用程序存在排名欺诈现象。再例如,对于上文中所介绍的多种与活跃用户信誉度相关的证据而言,当计算出的欺诈参数超过所设置的阈值时,判断出该应用程序存在排名欺诈现象。
在排名欺诈检测步骤中得到排名欺诈检测结果后,在本发明一个优选实施方式中,还可以将所得到的排名欺诈检测结果发送给应用程序商店运营商或应用程序的终端用户。对于应用程序商店运营商而言,其可以根据该排名欺诈检测结果改进应用程序商店的运营;而对于应用程序终端用户而言,他们可以根据该排名欺诈检测结果来选择符合自身需求的应用程序等。
如图5所示,本发明一个具体实施方式中还提供了一种应用程序的排名欺诈检测系统100,所述系统100包括:
活跃期检测单元110,用于基于历史排名信息检测所述应用程序的活跃期;排名欺诈检测单元120,用于基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
下面,结合附图来说明上述检测系统的各单元功能。
由于历史排名信息是本发明中检测应用程序的排名欺诈的数据基础,因此作为本发明的一个优选实施方式,该排名欺诈检测系统100还可包括一历史排名信息获取单元,用于获取所述应用程序在应用程序排行榜上的历史排名信息。
该历史排名信息获取单元可以多种方式来获取该历史排名信息。例如,可从应用程序商店运营商处直接获取该历史排名信息,也可以从应用程序商店在一段较长历史时期内持续发布的数据中抽取该历史排名信息等。
活跃期检测单元110,用于基于历史排名信息检测所述应用程序的活跃期。
在本发明一个优选实施方式中,该活跃期检测单元110可进一步包括一活跃事件检测模块,用于基于该历史排名信息检测所述应用程序的活跃事件。
优选地,本发明实施方式中的系统还可包括一排名阈值设置单元,用于设置排名阈值K*的值,从而确定应用程序在应用程序排行榜上排名较高的标准。该排名阈值K*的取值可以是1~500之间的整数。
在本发明具体实施方式中,该活跃事件检测模块进一步包括:
开始时间识别模块111,用于从历史排名信息中识别出活跃事件的开始时间。具体地,该开始时间识别模块可顺序搜索历史排名信息中每个时间点上的应用程序排名,当当前时间点的排名不大于排名阈值K*且上一时间点的排名大于排名阈值K*时,识别当前时间点为活跃事件的开始时间。
结束时间识别模块112,用于从历史排名信息中识别出活跃时间的结束时间。具体地,该结束时间识别模块可顺序搜索历史排名信息中每个时间点上的应用程序排名,当当前时间点的排名大于排名阈值K*且上一时间点的排名不大于排名阈值K*时,识别上一时间点为活跃事件的结束时间。
活跃事件识别模块113,用于将每个开始时间与其之后相邻的结束时间之间的时间段识别为活跃事件,这样就检测出了应用程序在排名历史中的所有活跃事件。
值得说明的是,作为一种特殊情况,如果在所分析和处理的历史时期的第一个时间点上,例如在历史记录中的第一天,应用程序的排名就在排行榜前K*位之列,此时该开始时间识别模块111将该第一个时间点定义为一个开始时间。类似地,如果在所分析和处理的历史时期的最后一个时间点上,例如今天,应用程序的排名仍在排行榜前K*位之列,此时该结束时间识别模块112将该最后一个时间点定义为一个结束时间。
在本发明一个优选实施方式中,该活跃期检测单元110用于合并相邻近的活跃事件以构成所述应用程序的所述活跃期。
优选地,本发明实施方式中的排名欺诈检测系统100还可包括一间隔阈值设置单元,用于设置该间隔阈值φ的值,从而确定将两个活跃事件合并在同一活跃期内的标准。该间隔阈值φ的取值可以是应用程序排行榜的更新周期的2~10倍中的一整数值。
在本发明具体实施方式中,活跃期检测单元110从历史排名信息中的初始时间点开始顺序搜索每个检测出的活跃事件,当当前活跃事件与上一活跃事件的时间间隔小于该间隔阈值φ时,将这两个活跃事件合并在同一活跃期内,直至搜索完所有检测出的活跃事件以检测出该应用程序在排名历史中的所有活跃期。
值得说明的是,作为一种特殊情况,如果一个活跃事件并不与任何其他活跃事件相邻近,该活跃事件自身也可被认为构成一活跃期。在这种情况下,该活跃期检测单元110用于当一活跃事件与上一活跃事件的时间间隔不小于所述间隔阈值φ,且该活跃事件与下一活跃事件的时间间隔不小于所述间隔阈值φ时,检测该活跃事件自身为一活跃期。
作为本发明一个优选实施方式,排名欺诈检测系统100还可以包括一活跃期发送单元,将所检测出的应用程序的活跃期信息发送给应用程序开发者、应用程序商店运营商或应用程序用户。
排名欺诈检测单元120,用于基于至少一个证据来对所述活跃期进行检测,得到排名欺诈检测结果。
作为本发明的一个优选实施方式,该排名欺诈检测单元120可进一步包括一证据验证模块,用于基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。
在本发明具体实施方式中,可分别抽取出与排名相关的证据、与用户评价相关的证据、与用户评论相关的证据和与活跃用户信誉度相关的证据。下面就来分别介绍该排名欺诈检测单元120在本发明中基于这四类证据进行排名欺诈检测的具体实施方式。
(1)与排名相关的证据
由于一个活跃期可能包括一个或多个活跃事件,因此为了抽取活跃期内用于检测排名欺诈的证据,作为本发明的一个优选实施方式,该排名欺诈检测单元120可进一步包括一活跃事件分析模块,用于分析活跃期内各活跃事件的一些基本排名特征,例如识别活跃事件的上升阶段、保持阶段和下降阶段。在本发明一个优选实施方式中,在该活跃事件分析模块识别上述三阶段的方式为:确定活跃事件中应用程序的排名在峰值范围ΔR内的第一个时间和最后一个时间,将该第一个时间和该最后一个时间之间的时间段识别为保持阶段,将活跃事件中在保持阶段之前的时间段识别为上升阶段,将活跃事件中在保持阶段之后的时间段识别为下降阶段。
在一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件中的上升阶段和/或下降阶段所体现出的一些排名特征来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件中的保持阶段所体现出的一些排名特征来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与排名相关的证据可基于活跃期内的活跃事件的数量构成,并基于所构成的该证据确定出活跃期内的活跃事件的数量|Es|,作为用于判断排名欺诈的欺诈参数。
(2)与用户评价相关的证据
在一个优选实施方式中,与用户评价相关的证据可基于活跃期内的平均用户评价
Figure BDA0000393343460000311
和历史平均评价来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与用户评价相关的证据可基于应用程序在活跃期内的评价等级分布和历史评价信息中的评价等级分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
(3)与用户评论相关的证据
在一个优选实施方式中,与用户评论相关的证据可基于活跃期内用户评论间的相似程度来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与用户评论相关的证据可基于应用程序在活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
(4)与活跃用户信誉度相关的证据
在一个优选实施方式中,与活跃用户信誉度相关的证据可基于应用程序的活跃用户平均信誉度
Figure BDA0000393343460000321
和应用程序的历史用户平均信誉度
Figure BDA0000393343460000322
来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与活跃用户信誉度相关的证据可基于应用程序的活跃用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度
Figure BDA0000393343460000324
构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与活跃用户信誉度相关的证据可基于应用程序的活跃用户信誉度分布和该应用程序的历史用户信誉度分布来构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。在另一个优选实施方式中,与活跃用户信誉度相关的证据可基于应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成,并基于所构成的该证据计算出一证据值作为用于判断排名欺诈的欺诈参数。
除了在上述各优选实施方式中单独使用上述各类以及各类中各种证据中的一个来进行排名欺诈检测之外,证据验证模块还可以综合考虑上述证据中的多个,将基于这些证据验证得到的对应欺诈参数进行加权计算,从而得到一个最终欺诈参数。
为了使本领域技术人员更加方便地进行排名欺诈检测,在一个优选实施方式中,排名欺诈检测单元120还可以进一步包括一欺诈参数判断模块,将根据证据所计算得到的欺诈参数与一阈值进行比较,从而直观地判断出判断应用程序是否存在排名欺诈。
在排名欺诈检测步骤中得到排名欺诈检测结果后,在本发明一个优选实施方式中,排名欺诈检测系统100还包括一排名欺诈检测结果发送单元,将所得到的排名欺诈检测结果发送给应用程序商店运营商或应用程序的终端用户。
本领域技术人员可以理解,当应用程序的活跃事件和活跃期信息已知的情况下,本领域技术人员可以直接根据上述活跃事件和活跃期信息来实施上述排名欺诈检测步骤,从而实现应用程序排名欺诈的检测。因此,在本发明的另一个具体实施方式中还提供了一种应用程序的排名欺诈检测方法,所述方法包括:基于至少一个证据来对所述活跃期进行检测,得到排名欺诈检测结果。在该具体实施方式的应用程序排名欺诈检测方法中,所实施的技术内容与之前具体实施方式中排名欺诈检测步骤相同,此处不再赘述。
同时对应地,本发明另一个具体实施方式中还提供了一种应用程序的排名欺诈检测系统,所述系统包括:排名欺诈检测单元,用于基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。在该具体实施方式的应用程序排名欺诈检测系统中,所实施的技术内容与之前具体实施方式中排名欺诈检测单元相同,此处不再赘述。
图6为本发明实施例提供的一种应用程序的排名欺诈检测系统600的结构示意图,本发明具体实施例并不对排名欺诈检测系统600的具体实现做限定。如图6所示,该排名欺诈检测系统600可以包括:
处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630、以及通信总线640。其中:
处理器610、通信接口620、以及存储器630通过通信总线640完成相互间的通信。
通信接口620,用于与比如客户端等的网元通信。
处理器610,用于执行程序632,具体可以实现上述图5所述实施例中排名欺诈检测系统的相关功能。
具体地,程序632可以包括程序代码,所述程序代码包括计算机操作指令。
处理器610可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器630,用于存放程序632。存储器630可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。程序632具体可以包括:
活跃期检测单元,用于基于历史排名信息检测所述应用程序的活跃期;
排名欺诈检测单元,用于基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
程序632具体也可以包括:
排名欺诈检测单元,用于基于至少一个证据对应用程序的活跃期进行检测,得到排名欺诈检测结果。
程序632中各单元的具体实现可以参见上文各实施例中的相应单元,在此不赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述装置实施例中的对应描述,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (120)

1.一种应用程序的排名欺诈检测方法,其特征在于,所述方法包括:
活跃期检测步骤,基于历史排名信息检测所述应用程序的活跃期;
排名欺诈检测步骤,基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
2.根据权利要求1所述的方法,其特征在于,所述排名欺诈检测步骤进一步包括:
证据验证步骤,基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。
3.根据权利要求2所述的方法,其特征在于,所述排名欺诈检测步骤进一步包括:
活跃事件分析步骤,识别所述活跃期中至少一个活跃事件的上升阶段、保持阶段和下降阶段。
4.根据权利要求3所述的方法,其特征在于,在所述活跃事件分析步骤中,确定所述活跃事件中所述应用程序的排名在一峰值范围ΔR内的第一个时间和最后一个时间,将所述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段,将所述活跃事件中在保持阶段之前的时间段识别为所述上升阶段,将所述活跃事件中在保持阶段之后的时间段识别为所述下降阶段。
5.根据权利要求3所述的方法,其特征在于,所述证据基于所述活跃期内的活跃事件中的上升阶段和/或下降阶段构成。
6.根据权利要求5所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的时间范围的平均值,或所述活跃期内所有活跃事件的所述下降阶段的时间范围的平均值,或所述活跃期内所有活跃事件的所述上升阶段的时间范围和下降阶段的时间范围的和的平均值。
7.根据权利要求5所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的所述下降阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的所述上升阶段的曲线和所述下降阶段的曲线与时间轴相交所形成的锐角的角度和的平均值。
8.根据权利要求3所述的方法,其特征在于,
所述证据基于所述活跃期内的活跃事件中的保持阶段构成。
9.根据权利要求8所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述保持阶段的时间范围的平均值。
10.根据权利要求8所述的方法,其特征在于,基于所有活跃事件的所述保持阶段中所述应用程序的平均排名和所述保持阶段的时间范围来计算所述欺诈参数。
11.根据权利要求2所述的方法,其特征在于,
所述证据基于所述活跃期内活跃事件的数量构成。
12.根据权利要求11所述的方法,其特征在于,
所述欺诈参数是所述活跃期内活跃事件的数量。
13.根据权利要求2所述的方法,其特征在于,所述证据基于所述活跃期内的平均评价和历史平均评价构成。
14.根据权利要求13所述的方法,其特征在于,
所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值或比值。
15.根据权利要求13所述的方法,其特征在于,
所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值与历史平均评价的比值。
16.根据权利要求2所述的方法,其特征在于,
所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布构成。
17.根据权利要求16所述的方法,其特征在于,
所述欺诈参数是应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的差值。
18.根据权利要求17所述的方法,其特征在于,通过计算应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的余弦距离来计算它们之间的差值。
19.根据权利要求2所述的方法,其特征在于,所述证据基于所述活跃期内用户评论间的相似程度构成。
20.根据权利要求19所述的方法,其特征在于,
所述欺诈参数是所述活跃期内用户评论间的平均相似度。
21.根据权利要求20所述的方法,其特征在于,
所述证据验证步骤进一步包括:
对所述活跃期内的所有用户评论进行标准化处理;
为所述活跃期内的每一条用户评论构建标准化词汇向量;
基于所述标准化词汇向量计算所述活跃期内用户评论间的平均相似度。
22.根据权利要求2所述的方法,其特征在于,
所述证据基于应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。
23.根据权利要求22所述的方法,其特征在于,
所述欺诈参数是应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的差值。
24.根据权利要求23所述的方法,其特征在于,通过计算应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的余弦距离来计算它们之间的差值。
25.根据权利要求2所述的方法,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和所述应用程序的历史用户平均信誉度构成。
26.根据权利要求25所述的方法,其特征在于,
所述欺诈参数是所述应用程序的历史用户平均信誉度和所述应用程序的活跃用户平均信誉度的差值或比值。
27.根据权利要求2所述的方法,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。
28.根据权利要求27所述的方法,其特征在于,
所述欺诈参数是应用程序排行榜中所有应用程序的历史用户平均信誉度和所述应用程序的活跃用户平均信誉度的差值或比值。
29.根据权利要求2所述的方法,其特征在于,
所述证据基于所述应用程序的活跃用户信誉度分布和所述应用程序的历史用户信誉度分布构成。
30.根据权利要求29所述的方法,其特征在于,
所述欺诈参数是所述应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的差值。
31.根据权利要求30所述的方法,其特征在于,通过计算所述应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。
32.根据权利要求2所述的方法,其特征在于,
所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。
33.根据权利要求32所述的方法,其特征在于,
所述欺诈参数是应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的差值。
34.根据权利要求33所述的方法,其特征在于,通过计算应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。
35.根据权利要求2所述的方法,其特征在于,在所述证据验证步骤中,综合考虑所述至少一个证据,将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算,从而得到所述欺诈参数。
36.根据权利要求2-35中任一项所述的方法,其特征在于,所述排名欺诈检测步骤进一步包括:
欺诈参数判断步骤,将所述欺诈参数与一阈值进行比较,从而判断所述应用程序是否存在排名欺诈。
37.根据权利要求1所述的方法,其特征在于,所述方法还包括:
历史排名信息获取步骤,获取所述应用程序在应用程序排行榜上的所述历史排名信息。
38.根据权利要求37所述的方法,其特征在于,在所述历史排名信息获取步骤中,从应用程序商店运营商获取所述历史排名信息,或从应用程序商店发布的数据中抽取所述历史排名信息。
39.根据权利要求1所述的方法,其特征在于,所述历史排名信息包括表示为一个与离散时间序列对应的排名序列,所述排名序列中的每个元素对应于所述时间序列中的一个离散时间点,表示所述应用程序在所述离散时间点时的排名。
40.根据权利要求1所述的方法,其特征在于,所述历史排名信息包括历史各时间段中所述应用程序的用户对该应用程序做出的评价信息。
41.根据权利要求1所述的方法,其特征在于,所述历史排名信息包括历史各时间段中所述应用程序的用户对所述应用程序做出的用户评论。
42.根据权利要求1所述的方法,其特征在于,所述历史排名信息包括历史各时间段中所述应用程序的用户信誉度或历史各时间段中应用程序排行榜中所有应用程序的用户信誉度。
43.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所检测出的所述应用程序的所述活跃期发送给应用程序开发者、应用程序商店运营商、应用程序用户中的至少一个。
44.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、应用程序用户中的至少一个。
45.一种应用程序的排名欺诈检测系统,其特征在于,所述系统包括:
活跃期检测单元,用于基于历史排名信息检测所述应用程序的活跃期;
排名欺诈检测单元,用于基于至少一个证据对所述活跃期进行检测,得到排名欺诈检测结果。
46.根据权利要求45所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
证据验证模块,用于基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。
47.根据权利要求46所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
活跃事件分析模块,用于识别所述活跃期中至少一个活跃事件的上升阶段、保持阶段和下降阶段。
48.根据权利要求47所述的系统,其特征在于,所述活跃事件分析模块,用于确定所述活跃事件中所述应用程序的排名在一峰值范围ΔR内的第一个时间和最后一个时间,将所述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段,将所述活跃事件中在保持阶段之前的时间段识别为所述上升阶段,将所述活跃事件中在保持阶段之后的时间段识别为所述下降阶段。
49.根据权利要求47所述的系统,其特征在于,所述证据基于所述活跃期内的活跃事件中的上升阶段和/或下降阶段构成。
50.根据权利要求47所述的系统,其特征在于,所述证据基于所述活跃期内的活跃事件中的保持阶段构成。
51.根据权利要求46所述的系统,其特征在于,
所述证据基于所述活跃期内活跃事件的数量构成。
52.根据权利要求46所述的系统,其特征在于,所述证据基于所述活跃期内的平均评价和历史平均评价构成。
53.根据权利要求46所述的系统,其特征在于,所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布构成。
54.根据权利要求46所述的系统,其特征在于,所述证据基于所述活跃期内用户评论间的相似程度构成。
55.根据权利要求46所述的系统,其特征在于,所述证据基于应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。
56.根据权利要求46所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和所述应用程序的历史用户平均信誉度构成。
57.根据权利要求46所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。
58.根据权利要求46所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户信誉度分布和所述应用程序的历史用户信誉度分布构成。
59.根据权利要求46所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。
60.根据权利要求46所述的系统,其特征在于,所述证据验证模块,用于综合考虑所述至少一个证据,将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算,从而得到所述欺诈参数。
61.根据权利要求46-60中任一项所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
欺诈参数判断模块,用于将所述欺诈参数与一阈值进行比较,从而判断所述应用程序是否存在排名欺诈。
62.根据权利要求45所述的系统,其特征在于,所述系统还包括:
历史排名信息获取单元,用于获取所述应用程序在应用程序排行榜上的所述历史排名信息。
63.根据权利要求62所述的系统,其特征在于,所述历史排名信息获取单元,用于从应用程序商店运营商获取所述历史排名信息,或从应用程序商店发布的数据中抽取所述历史排名信息。
64.根据权利要求45所述的系统,其特征在于,所述系统还包括一活跃期发送单元,用于将所检测出的所述应用程序的所述活跃期发送给应用程序开发者、应用程序商店运营商、应用程序用户中的至少一个。
65.根据权利要求45所述的系统,其特征在于,所述系统还包括一排名欺诈检测结果发送单元,用于将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、应用程序用户中的至少一个。
66.一种应用程序的排名欺诈检测方法,其特征在于,所述方法包括:
基于至少一个证据对应用程序的活跃期进行检测,得到排名欺诈检测结果。
67.根据权利要求66所述的方法,其特征在于,所述方法进一步包括:
证据验证步骤,基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。
68.根据权利要求67所述的方法,其特征在于,所述方法进一步包括:
活跃事件分析步骤,识别所述活跃期中至少一个活跃事件的上升阶段、保持阶段和下降阶段。
69.根据权利要求68所述的方法,其特征在于,在所述活跃事件分析步骤中,确定所述活跃事件中所述应用程序的排名在一峰值范围ΔR内的第一个时间和最后一个时间,将所述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段,将所述活跃事件中在保持阶段之前的时间段识别为所述上升阶段,将所述活跃事件中在保持阶段之后的时间段识别为所述下降阶段。
70.根据权利要求68所述的方法,其特征在于,所述证据基于所述活跃期内的活跃事件中的上升阶段和/或下降阶段构成。
71.根据权利要求70所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的时间范围的平均值,或所述活跃期内所有活跃事件的所述下降阶段的时间范围的平均值,或所述活跃期内所有活跃事件的所述上升阶段的时间范围和下降阶段的时间范围的和的平均值。
72.根据权利要求70所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的所述下降阶段的曲线与时间轴相交所形成的锐角的角度的平均值,或所有活跃事件的所述上升阶段的曲线和所述下降阶段的曲线与时间轴相交所形成的锐角的角度和的平均值。
73.根据权利要求68所述的方法,其特征在于,
所述证据基于所述活跃期内的活跃事件中的保持阶段构成。
74.根据权利要求73所述的方法,其特征在于,
所述欺诈参数是所述活跃期内所有活跃事件的所述保持阶段的时间范围的平均值。
75.根据权利要求73所述的方法,其特征在于,基于所有活跃事件的所述保持阶段中所述应用程序的平均排名和所述保持阶段的时间范围来计算所述欺诈参数。
76.根据权利要求67所述的方法,其特征在于,
所述证据基于所述活跃期内活跃事件的数量构成。
77.根据权利要求76所述的方法,其特征在于,
所述欺诈参数是所述活跃期内活跃事件的数量。
78.根据权利要求67所述的方法,其特征在于,所述证据基于所述活跃期内的平均评价和历史平均评价构成。
79.根据权利要求78所述的方法,其特征在于,
所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值或比值。
80.根据权利要求78所述的方法,其特征在于,
所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值与历史平均评价的比值。
81.根据权利要求67所述的方法,其特征在于,
所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布构成。
82.根据权利要求81所述的方法,其特征在于,
所述欺诈参数是应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的差值。
83.根据权利要求82所述的方法,其特征在于,通过计算应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布之间的余弦距离来计算它们之间的差值。
84.根据权利要求67所述的方法,其特征在于,所述证据基于所述活跃期内用户评论间的相似程度构成。
85.根据权利要求84所述的方法,其特征在于,
所述欺诈参数是所述活跃期内用户评论间的平均相似度。
86.根据权利要求85所述的方法,其特征在于,
所述证据验证步骤进一步包括:
对所述活跃期内的所有用户评论进行标准化处理;
为所述活跃期内的每一条用户评论构建标准化词汇向量;
基于所述标准化词汇向量计算所述活跃期内用户评论间的平均相似度。
87.根据权利要求67所述的方法,其特征在于,
所述证据基于应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。
88.根据权利要求87所述的方法,其特征在于,
所述欺诈参数是应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的差值。
89.根据权利要求88所述的方法,其特征在于,通过计算应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布之间的余弦距离来计算它们之间的差值。
90.根据权利要求67所述的方法,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和所述应用程序的历史用户平均信誉度构成。
91.根据权利要求90所述的方法,其特征在于,
所述欺诈参数是所述应用程序的历史用户平均信誉度和所述应用程序的活跃用户平均信誉度的差值或比值。
92.根据权利要求67所述的方法,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。
93.根据权利要求92所述的方法,其特征在于,
所述欺诈参数是应用程序排行榜中所有应用程序的历史用户平均信誉度和所述应用程序的活跃用户平均信誉度的差值或比值。
94.根据权利要求67所述的方法,其特征在于,
所述证据基于所述应用程序的活跃用户信誉度分布和所述应用程序的历史用户信誉度分布构成。
95.根据权利要求94所述的方法,其特征在于,
所述欺诈参数是所述应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的差值。
96.根据权利要求95所述的方法,其特征在于,通过计算所述应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。
97.根据权利要求67所述的方法,其特征在于,
所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。
98.根据权利要求97所述的方法,其特征在于,
所述欺诈参数是应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的差值。
99.根据权利要求98所述的方法,其特征在于,通过计算应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。
100.根据权利要求67所述的方法,其特征在于,在所述证据验证步骤中,综合考虑所述至少一个证据,将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算,从而得到所述欺诈参数。
101.根据权利要求67-100中任一项所述的方法,其特征在于,所述方法进一步包括:
欺诈参数判断步骤,将所述欺诈参数与一阈值进行比较,从而判断所述应用程序是否存在排名欺诈。
102.根据权利要求66所述的方法,其特征在于,所述方法还包括:将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、应用程序用户中的至少一个。
103.一种应用程序的排名欺诈检测系统,其特征在于,所述系统包括:
排名欺诈检测单元,用于基于至少一个证据对应用程序的活跃期进行检测,得到排名欺诈检测结果。
104.根据权利要求104所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
证据验证模块,用于基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。
105.根据权利要求104所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
活跃事件分析模块,用于识别所述活跃期中至少一个活跃事件的上升阶段、保持阶段和下降阶段。
106.根据权利要求105所述的系统,其特征在于,所述活跃事件分析模块,用于确定所述活跃事件中所述应用程序的排名在一峰值范围ΔR内的第一个时间和最后一个时间,将所述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段,将所述活跃事件中在保持阶段之前的时间段识别为所述上升阶段,将所述活跃事件中在保持阶段之后的时间段识别为所述下降阶段。
107.根据权利要求105所述的系统,其特征在于,所述证据基于所述活跃期内的活跃事件中的上升阶段和/或下降阶段构成。
108.根据权利要求105所述的系统,其特征在于,所述证据基于所述活跃期内的活跃事件中的保持阶段构成。
109.根据权利要求104所述的系统,其特征在于,
所述证据基于所述活跃期内活跃事件的数量构成。
110.根据权利要求104所述的系统,其特征在于,所述证据基于所述活跃期内的平均评价和历史平均评价构成。
111.根据权利要求104所述的系统,其特征在于,所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等级的分布构成。
112.根据权利要求104所述的系统,其特征在于,所述证据基于所述活跃期内用户评论间的相似程度构成。
113.根据权利要求104所述的系统,其特征在于,所述证据基于应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。
114.根据权利要求104所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和所述应用程序的历史用户平均信誉度构成。
115.根据权利要求104所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。
116.根据权利要求104所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户信誉度分布和所述应用程序的历史用户信誉度分布构成。
117.根据权利要求104所述的系统,其特征在于,所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。
118.根据权利要求104所述的系统,其特征在于,所述证据验证模块,用于综合考虑所述至少一个证据,将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算,从而得到所述欺诈参数。
119.根据权利要求104-118中任一项所述的系统,其特征在于,所述排名欺诈检测单元进一步包括:
欺诈参数判断模块,用于将所述欺诈参数与一阈值进行比较,从而判断所述应用程序是否存在排名欺诈。
120.根据权利要求103所述的系统,其特征在于,所述系统还包括一排名欺诈检测结果发送单元,用于将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、应用程序用户中的至少一个。
CN201310469985.8A 2013-10-10 2013-10-10 应用程序的排名欺诈检测方法和排名欺诈检测系统 Active CN103559208B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310469985.8A CN103559208B (zh) 2013-10-10 2013-10-10 应用程序的排名欺诈检测方法和排名欺诈检测系统
US15/028,015 US20160253484A1 (en) 2013-10-10 2014-10-09 Ranking fraud detection for application
PCT/CN2014/088245 WO2015051752A1 (en) 2013-10-10 2014-10-09 Ranking fraud detection for application

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310469985.8A CN103559208B (zh) 2013-10-10 2013-10-10 应用程序的排名欺诈检测方法和排名欺诈检测系统

Publications (2)

Publication Number Publication Date
CN103559208A true CN103559208A (zh) 2014-02-05
CN103559208B CN103559208B (zh) 2017-03-01

Family

ID=50013455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310469985.8A Active CN103559208B (zh) 2013-10-10 2013-10-10 应用程序的排名欺诈检测方法和排名欺诈检测系统

Country Status (3)

Country Link
US (1) US20160253484A1 (zh)
CN (1) CN103559208B (zh)
WO (1) WO2015051752A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015051752A1 (en) * 2013-10-10 2015-04-16 Beijing Zhigu Rui Tuo Tech Co., Ltd Ranking fraud detection for application
CN105869022A (zh) * 2016-04-07 2016-08-17 腾讯科技(深圳)有限公司 一种应用流行度预测方法和装置
CN105868275A (zh) * 2016-03-22 2016-08-17 深圳市艾酷通信软件有限公司 一种数据统计方法及电子设备
CN105912599A (zh) * 2016-03-31 2016-08-31 维沃移动通信有限公司 终端应用程序的排名方法及终端
CN106528525A (zh) * 2016-09-30 2017-03-22 广州酷狗计算机科技有限公司 一种识别排行榜作弊的方法和装置
CN107707642A (zh) * 2017-09-22 2018-02-16 广东欧珀移动通信有限公司 刷量终端确定方法及装置
CN110390549A (zh) * 2018-04-20 2019-10-29 腾讯科技(深圳)有限公司 一种注册小号识别方法、装置、服务器及存储介质
US10606845B2 (en) 2013-10-10 2020-03-31 Beijing Zhigu Rui Tuo Tech Co., Ltd Detecting leading session of application
CN112753023A (zh) * 2018-10-26 2021-05-04 深圳市欢太科技有限公司 数据处理方法、装置、电子设备及计算机可读取存储介质
CN116578942A (zh) * 2023-07-12 2023-08-11 国家计算机网络与信息安全管理中心 榜单异常的处理方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160117626A1 (en) * 2014-10-24 2016-04-28 EftMega, Inc. System and Method for Determining a Ranking Schema to Calculate Effort Related to an Entity
CN106485507B (zh) * 2015-09-01 2019-10-18 阿里巴巴集团控股有限公司 一种软件推广作弊的检测方法、装置及系统
US10633648B2 (en) 2016-02-12 2020-04-28 University Of Washington Combinatorial photo-controlled spatial sequencing and labeling
CN107784596A (zh) * 2017-08-08 2018-03-09 平安科技(深圳)有限公司 保单的险种状态信息统计方法、终端设备及存储介质
CN107679887A (zh) * 2017-08-31 2018-02-09 北京三快在线科技有限公司 一种商户评分的处理方法和装置
CN111784492B (zh) * 2020-07-10 2024-08-02 讯飞智元信息科技有限公司 舆情分析和财务预警方法、装置、电子设备和存储介质
CN112381548B (zh) * 2020-09-10 2024-03-12 咪咕文化科技有限公司 稽核异常话单的方法、电子设备及存储介质
CN115511584A (zh) * 2022-11-08 2022-12-23 深圳市必凡娱乐科技有限公司 一种电商平台虚假交易订单监控方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249798A1 (en) * 2007-04-04 2008-10-09 Atul Tulshibagwale Method and System of Ranking Web Content
CN103177109A (zh) * 2013-03-27 2013-06-26 四川长虹电器股份有限公司 应用排名优化方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819226A (en) * 1992-09-08 1998-10-06 Hnc Software Inc. Fraud detection using predictive modeling
US8082349B1 (en) * 2005-10-21 2011-12-20 Entrust, Inc. Fraud protection using business process-based customer intent analysis
US8825578B2 (en) * 2009-11-17 2014-09-02 Infozen, Inc. System and method for determining an entity's identity and assessing risks related thereto
CN102880603A (zh) * 2011-07-11 2013-01-16 阿里巴巴集团控股有限公司 一种排行榜数据过滤的方法和设备
US9479516B2 (en) * 2013-02-11 2016-10-25 Google Inc. Automatic detection of fraudulent ratings/comments related to an application store
CN103577543B (zh) * 2013-10-10 2017-06-16 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577542B (zh) * 2013-10-10 2018-09-25 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103577541B (zh) * 2013-10-10 2017-10-10 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103559210B (zh) * 2013-10-10 2017-08-15 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103559208B (zh) * 2013-10-10 2017-03-01 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249798A1 (en) * 2007-04-04 2008-10-09 Atul Tulshibagwale Method and System of Ranking Web Content
CN103177109A (zh) * 2013-03-27 2013-06-26 四川长虹电器股份有限公司 应用排名优化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SIHONG XIE等: "Review Spam Detection via Temporal Pattern Discovery", 《IN PROCEEDINGS OF THE 18TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING,KDD’12》 *
TMT青年沙龙笔记: "刷榜那些事儿", 《HTTP://WWW.HUXIU.COM/ARTICLE/5382/1.HTML》 *
宋海霞等: "基于自适应聚类的虚假评论检测", 《南京大学学报(自然科学)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015051752A1 (en) * 2013-10-10 2015-04-16 Beijing Zhigu Rui Tuo Tech Co., Ltd Ranking fraud detection for application
US10606845B2 (en) 2013-10-10 2020-03-31 Beijing Zhigu Rui Tuo Tech Co., Ltd Detecting leading session of application
CN105868275A (zh) * 2016-03-22 2016-08-17 深圳市艾酷通信软件有限公司 一种数据统计方法及电子设备
CN105912599A (zh) * 2016-03-31 2016-08-31 维沃移动通信有限公司 终端应用程序的排名方法及终端
CN105869022A (zh) * 2016-04-07 2016-08-17 腾讯科技(深圳)有限公司 一种应用流行度预测方法和装置
CN105869022B (zh) * 2016-04-07 2020-10-23 腾讯科技(深圳)有限公司 一种应用流行度预测方法和装置
CN106528525A (zh) * 2016-09-30 2017-03-22 广州酷狗计算机科技有限公司 一种识别排行榜作弊的方法和装置
CN107707642A (zh) * 2017-09-22 2018-02-16 广东欧珀移动通信有限公司 刷量终端确定方法及装置
CN110390549A (zh) * 2018-04-20 2019-10-29 腾讯科技(深圳)有限公司 一种注册小号识别方法、装置、服务器及存储介质
CN112753023A (zh) * 2018-10-26 2021-05-04 深圳市欢太科技有限公司 数据处理方法、装置、电子设备及计算机可读取存储介质
CN116578942A (zh) * 2023-07-12 2023-08-11 国家计算机网络与信息安全管理中心 榜单异常的处理方法及装置
CN116578942B (zh) * 2023-07-12 2023-12-22 国家计算机网络与信息安全管理中心 榜单异常的处理方法及装置

Also Published As

Publication number Publication date
WO2015051752A1 (en) 2015-04-16
CN103559208B (zh) 2017-03-01
US20160253484A1 (en) 2016-09-01

Similar Documents

Publication Publication Date Title
CN103559208A (zh) 应用程序的排名欺诈检测方法和排名欺诈检测系统
Sifa et al. Predicting purchase decisions in mobile free-to-play games
CN106022834B (zh) 广告反作弊方法及装置
CN108734565B (zh) 一种征信分实时调整处理方法、装置及处理服务器
CN104090888B (zh) 一种用户行为数据的分析方法和装置
CN107657500B (zh) 股票推荐方法及服务器
Zhu et al. Ranking fraud detection for mobile apps: A holistic view
Sifa et al. Customer lifetime value prediction in non-contractual freemium settings: Chasing high-value users using deep neural networks and SMOTE
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN104836781A (zh) 区分访问用户身份的方法及装置
CN102325062A (zh) 异常登录检测方法及装置
CN103577542A (zh) 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN108066987B (zh) 应用场景关卡组合的分配方法、装置及服务器
CN105302911A (zh) 一种数据筛选引擎建立方法及数据筛选引擎
CN107835154A (zh) 一种批量注册账号识别方法及系统
CN105187242A (zh) 一种基于变长序列模式挖掘的用户异常行为检测方法
CN103530796B (zh) 应用程序的活跃期检测方法和活跃期检测系统
CN110929525A (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
CN103559210A (zh) 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN117291649B (zh) 一种集约化的营销数据处理方法及系统
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN103577541A (zh) 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN102118382A (zh) 一种基于兴趣组合的协作推荐攻击检测系统及方法
CN103577543B (zh) 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN111784360B (zh) 一种基于网络链接回溯的反欺诈预测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant