CN113205129A - 一种作弊团伙识别方法、装置、电子设备及存储介质 - Google Patents

一种作弊团伙识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113205129A
CN113205129A CN202110467271.8A CN202110467271A CN113205129A CN 113205129 A CN113205129 A CN 113205129A CN 202110467271 A CN202110467271 A CN 202110467271A CN 113205129 A CN113205129 A CN 113205129A
Authority
CN
China
Prior art keywords
determining
user
users
weight
association relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110467271.8A
Other languages
English (en)
Other versions
CN113205129B (zh
Inventor
胡远明
史忠伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuba Co Ltd
Original Assignee
Wuba Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuba Co Ltd filed Critical Wuba Co Ltd
Priority to CN202110467271.8A priority Critical patent/CN113205129B/zh
Publication of CN113205129A publication Critical patent/CN113205129A/zh
Application granted granted Critical
Publication of CN113205129B publication Critical patent/CN113205129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种作弊团伙识别方法、装置、电子设备及存储介质,该方法包括:获取预设时间段内访问用户的设备信息和用户邀请关系;根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;根据多个所述三元组,将用户聚合为多个社区;确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。本发明由于不需要使用有监督模型进行识别,不需要人工标注,在活动初期根据设备信息和用户邀请关系可以很好的识别作弊团伙,减少了人力标注成本,提高了新活动中作弊团伙识别效率。

Description

一种作弊团伙识别方法、装置、电子设备及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种作弊团伙识别方法、装置、电子设备及存储介质。
背景技术
在产品推广的过程中,一般是通过设置推广活动,激励用户邀请新用户,在活动过程中有些用户会用一个硬件设备模拟多个设备及用户,以获取活动激励,这些用户为作弊用户,作弊用户一般呈现作弊用户团伙的特点。为了避免作弊团伙对产品推广方造成损失,需要识别作弊团伙。
现有技术中,为了有效识别作弊团伙,首先需要人工识别大量的作弊用户,对确定的作弊用户以及正常用户进行打标签,然后获取作弊用户以及正常用户的设备标识,将设备标识的特征输入有监督模型进行训练,利用训练完成的模型对新的用户进行预测。
通过有监督模型进行识别,需要大量的人力进行打标签,而且这种方案无法应对新推广活动的冷启动,在新推广活动初期无法快速识别作弊团伙。
发明内容
本发明实施例提供一种作弊团伙识别方法、装置、电子设备及存储介质,可以减少人力成本,提高新活动中作弊团伙识别效率。
依据本发明的第一方面,提供了一种作弊团伙识别方法,包括:
获取预设时间段内访问用户的设备信息和用户邀请关系;
根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;
根据多个所述三元组,将用户聚合为多个社区;
确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
依据本发明的第二方面,提供了一种作弊团伙识别装置,包括:
数据获取模块,用于获取预设时间段内访问用户的设备信息和用户邀请关系;
三元组确定模块,用于根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;
社区聚合模块,用于根据多个所述三元组,将用户聚合为多个社区;
识别结果确定模块,用于确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
依据本发明的第三方面,还提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的作弊团伙识别方法的步骤。
依据本发明的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的作弊团伙识别方法的步骤。
本发明实施例提供的作弊团伙识别方法、装置、电子设备及存储介质,通过获取预设时间段内访问用户的设备信息和用户邀请关系,根据设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组,根据多个三元组将用户聚合为多个社区,确定多个社区中邀请者数量和用户总数量满足预设条件的社区,并将该社区内的用户确定为作弊团伙,由于不需要使用有监督模型进行识别,不需要人工标注,在活动初期根据设备信息和用户邀请关系可以很好的识别作弊团伙,减少了人力标注成本,提高了新活动中作弊团伙识别效率。
附图说明
图1是本发明实施例提供的一种作弊团伙识别方法的步骤流程图;
图2是本发明实施例中的以IP地址为主节点确定的关联关系的示意图;
图3是本发明实施例中的以邀请者为主节点确定的关联关系的示意图;
图4是本发明实施例提供的一种作弊团伙识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种作弊团伙识别方法的步骤流程图,如图1所示,该方法可以包括:
步骤101,获取预设时间段内访问用户的设备信息和用户邀请关系。
其中,所述预设时间段可以是过去的一天、过去的一周等。所述设备信息包括IP地址、设备标识、安装应用程序列表以及其他设备信息,所述其他设备信息可以包括:屏幕尺寸、SD卡总容量、通知铃音位置、随机存取存储器、传感器列表、输入法和手机铃音位置中的至少一种。所述设备标识例如可以是手机序列号,所述通知铃音位置中的通知铃音是应用程序所使用的铃音,所述手机铃音位置中的铃音是设备本身的铃音,如电话铃音、短信铃音等。
对于一个特定的推广活动,可以从存储访问用户信息的数据库中获取预设时间段内访问用户的设备信息和用户邀请关系。其中,用户邀请关系记录了用户之间的邀请关系,例如用户A邀请用户B参与了某个活动时,用户邀请关系可以是用户A邀请了用户B,或者是邀请者为用户A、被邀请者为用户B等。
步骤102,根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组。
若两个用户的设备信息相同或者存在邀请关系,则确定这两个用户之间存在关联关系,并基于设备信息相同和邀请关系各自对应的权重值,确定两个用户之间关联关系的权重,将具有关联关系的两个用户和关联关系的权重确定为一个三元组,对于预设时间段内的用户,可以得到多个三元组。
在本发明的一个实施例中,根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组,包括:若根据所述设备信息和用户邀请关系确定两个用户存在至少一种预设关联关系,则确定所述两个用户存在关联关系;根据所述两个用户存在的预设关联关系和预设关联关系对应的权重值,确定所述两个用户之间关联关系的权重;将具有关联关系的两个用户和关联关系的权重确定为三元组,得到多个三元组。
其中,所述预设关联关系包括:IP地址相同、存在邀请关系、设备标识相同、安装应用程序列表相同或设备信息中除所述IP地址、设备标识和安装应用程序列表外其他设备信息相同。设备标识可以是手机序列号。每个预设关联关系可以预先设置一个权重值,每个预设关联关系的权重值可以相同,也可以不同,具体可以根据需求设置,例如,每个预设关联关系的权重值可以都是1,或者也可以是其他值,或者,若设备标识相同或安装应用程序列表相同则很大可能两个设备是相同设备,则可以将设备标识相同和安装应用程序列表相同的权重值设置的比其他设备信息相同的权重值大。所述其他设备信息包括:屏幕尺寸、SD卡总容量、通知铃音位置、随机存取存储器、传感器列表、输入法和手机铃音位置,两个设备的其他设备信息若相同,则这两个设备非常相似。
对于预设时间段内的所有用户,分别对每两个用户进行判断,判断两个用户是否存在至少一种预设关联关系,在两个用户存在至少一种关联关系时,确定这两个用户存在关联关系,基于预设关联关系的权重值以及两个用户存在的预设关联关系,可以得到两个用户之间关联关系的权重,将具有关联关系的两个用户和关联关系的权重确定为三元组,得到多个三元组。例如,IP地址相同、存在邀请关系、设备标识相同、安装应用程序列表相同、设备信息中除所述IP地址外其他设备信息相同这几个预设关联关系的权重值均为1,用户A和用户B的IP地址相同,且用户A邀请的用户B,设备标识不同、安装应用程序列表不同、其他设备信息不同,则用户A和用户B存在关联关系,该关联关系的权重为2,从而得到一个三元组为(用户A,用户B,2)。
其他设备信息若包括多个设备信息,在使用时可以将多个设备信息拼接为一个字符串,判断两个用户的其他设备信息是否相同时,可以匹配两个用户的其他设备信息的字符串,若匹配成功,则两个用户的其他设备信息相同,若匹配失败,则两个用户的其他设备信息不同。将多个设备信息作为其他设备信息进行判断时,可以提高两个设备信息相似判断的准确性,避免误伤正常用户。
通过分别确定每两个用户是否存在至少一种预设关联关系,并基于存在的预设关联关系,得到两个用户之间关联关系的权重,从而得到多个三元组,这样每两个用户分别进行确定,可以避免遗漏三元组,提高作弊团伙识别的准确性。
需要说明的是,在确定两个用户之间是否存在预设关联关系时,还可以先基于设备信息和用户邀请关系确定两个用户之间是否存在IP地址相同、邀请关系这样的预设关联关系,再依次判断两个用户的设备标识是否相同、安装应用程序列表是否相同以及其他设备信息是否相同,从而基于判断结果确定两个用户之间的预设关联关系,并根据预设关联关系的权重值,将两个用户之间的预设关联关系进行加权求和,得到两个用户之间关联关系的权重。
在本发明的另一个实施例中,根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组,包括:
以所述设备信息中的IP地址和/或所述用户邀请关系中的邀请者为主节点,分别确定与所述主节点具有关联关系的用户节点;
根据所述用户节点中用户的设备信息和用户邀请关系,确定所述用户节点中每两个用户节点之间所存在的预设关联关系,并根据预设关联关系和预设关联关系对应的权重值,确定每两个用户节点之间关联关系的权重,在所述主节点为邀请者时确定所述主节点与每个所述用户节点之间关联关系的权重,得到多个由两个用户节点和权重所组成的三元组以及由主节点、用户节点和权重所组成的三元组。
其中,所述预设关联关系包括:IP地址相同、存在邀请关系、设备标识相同、安装应用程序列表相同或设备信息中除所述IP地址、设备标识和安装应用程序列表外其他设备信息相同。
以设备信息中的IP地址为主节点,分别确定具有相同IP地址的用户节点,这些用户节点是与主节点具有关联关系的用户节点,用户节点与作为主节点的IP地址的关联关系如图2所示,每个用户节点分别与主节点存在关联关系,即存在一条边。确定用户邀请关系中的邀请者,以邀请者为主节点,分别确定该邀请者所邀请的用户,作为用户节点,得到与作为邀请者的主节点具有关联关系的用户节点,主节点与用户节点的关联关系如图3所示,每个用户节点分别与主节点存在关联关系,即存在一条边。通过IP地址和邀请者首先对用户进行聚合,有助于提高处理速度。
在以IP地址为主节点确定的用户节点中每两个用户节点都具有相同的IP地址,因此每两个用户节点都存在至少一种预设关联关系,并将IP地址对应的权重值确定为每两个用户节点之间关联关系的初始权重,再分别基于两个用户节点除IP地址外的其他设备信息和用户邀请关系,确定每两个用户节点之间的其他预设关联关系,并基于每种预设关联关系对应的权重值和初始权重确定每两个用户之间关联关系的权重,将具有关联关系的两个用户节点和关联关系的权重确定为一个三元组,得到多个三元组。
在以邀请者为主节点确定用户节点时,主节点与每个用户节点分别存在一种预设关联关系,并将邀请关系对应的权重值确定为主节点与每个用户节点之间关联关系的初始权重值,再基于主节点和用户节点的设备信息确定主节点和用户节点之间的其他预设关联关系,并基于其他预设关联关系的权重值和初始权重值,确定主节点与每个用户节点之间关联关系的权重,并分别基于每两个用户节点的设备信息确定每两个用户节点是否存在预设关联关系,并在存在预设关联关系时基于所述存在的预设关联关系和预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将存在关联关系的主节点和用户节点以及之间关联关系的权重确定为一个三元组,并将存在关联关系的两个用户节点以及之间关联关系的权重确定为一个三元组,得到多个三元组。
在一种可选的实施方式中,根据所述用户节点中用户的设备信息和用户邀请关系,确定所述用户节点中每两个用户节点之间所存在的预设关联关系,并根据预设关联关系和预设关联关系对应的权重值,确定每两个用户节点之间关联关系的权重,在所述主节点为邀请者时确定所述主节点与每个所述用户节点之间关联关系的权重,得到多个由两个用户节点和权重所组成的三元组以及由主节点、用户节点和权重所组成的三元组,包括:
在所述主节点为IP地址时,确定每两个用户节点均存在IP地址相同的预设关联关系,分别根据每两个用户节点的设备信息和用户邀请关系,确定每两个用户节点所存在的其他预设关联关系,根据每两个用户节点之间的预设关联关系和预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将具有关联关系的两个用户节点和关联关系的权重确定为三元组,得到多个三元组;
在所述主节点为邀请者时,确定主节点分别与每个用户节点存在邀请关系的预设关联关系,根据用户的设备信息,确定主节点与每个用户节点所存在的其他预设关联关系,并根据预设关联关系对应的权重值确定主节点与每个用户节点之间关联关系的权重,并确定每两个用户节点之间所存在的预设关联关系,并根据预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将主节点、用户节点以及主节点与用户节点之间关联关系的权重确定为三元组,并将具有关联关系的两个用户节点和之间关联关系的权重确定为三元组,得到多个三元组。
在以IP地址为主节点时,得到的多个用户节点都具有该相同的IP地址,因此每两个用户节点均存在IP地址相同的预设关联关系,将相同IP地址对应的权重值作为每两个用户节点之间关联关系的初始权重,再分别确定每两个用户节点的设备标识是否相同、安装应用程序列表是否相同、其他设备信息是否相同,并确定每两个用户节点是否存在邀请关系,基于这四个判断条件对应的权重值与所述初始权重值,分别确定每两个用户节点之间关联关系的权重。例如,IP地址相同对应的权重值为1,设备标识相同对应的权重值为1,安装应用程序列表相同对应的权重值为1,其他设备信息相同对应的权重值为1,存在邀请关系对应的权重值为1,若两个用户节点在IP地址相同的前提下,其他设备信息也相同而且存在邀请关系,则可以确定这两个用户节点之间关联关系的权重为5。
在以邀请者为主节点时,则主节点也是一个用户节点,这时主节点与每个该主节点所邀请的用户对应的用户节点均分别存在邀请关系的预设关联关系,将邀请关系的权重值确定为主节点与用户节点之间关联关系的初始权重值,再分别判断主节点与每个用户节点的IP地址是否相同、设备标识是否相同、安装应用程序列表是否相同,并判断主节点与每个用户节点除IP地址、设备标识和安装应用程序列表外的其他设备信息是否相同,基于判断结果、每个判断条件对应的权重值以及初始权重值,确定主节点与每个用户节点之间关联关系的权重,将主节点、用户节点和之间关联关系的权重作为一个三元组。在以邀请者为主节点时,还需要根据用户的设备信息确定每两个用户节点之间是否存在除邀请关系外的其他预设关联关系,并根据预设关联关系的权重值确定每两个用户节点之间关联关系的权重,由于每个用户只能被一个用户邀请,所以,主节点邀请到多个用户节点时,这些用户节点不会再存在邀请关系,这时只需要再依据设备信息确定这些用户节点是否存在其他预设关联关系,即判断每两个用户节点的IP地址是否相同、设备标识是否相同、安装应用程序列表是否相同,每两个用户节点的IP地址、设备标识和安装应用程序列表外的其他设备信息是否相同,若一个判断条件的判断结果为是,则确定两个用户节点存在关联关系,再基于判断结果和每个判断条件对应的权重值,确定两个用户节点之间关联关系的权重,将具有关联关系的两个用户节点和之间关联关系的权重确定为一个三元组。一个邀请者邀请多个用户时,可以得到多个三元组。
通过使用主节点首先进行聚合之后,再确定三元组,可以提高数据处理的速度。
步骤103,根据多个所述三元组,将用户聚合为多个社区。
每个三元组记录了两个用户之间关联关系的权重,从而基于得到的多个三元组,可以得到预设时间段内所有用户之间关系,并基于每两个用户之间关联关系的权重,可以将这些用户聚合为多个社区。
在本发明的一个实施例中,根据多个所述三元组,将用户聚合为多个社区,包括:合并多个所述三元组,得到用户关系图;通过社区发现算法将所述用户关系图拆分为多个社区。
其中,社区发现算法用来发现网络中的社区结构,是一种聚类算法。社区发现算法例如可以采用Louvain算法,Louvain算法是基于模块度(Modularity)的社区发现算法,能够发现层次性的社区结构,其优化的目标是最大化整个图属性结构(社区网络)的模块度。模块度用于描述社区内的紧密程度。
对得到的多个三元组进行合并,可以得到各个用户之间的关系,即得到用户关系图,之后采用社区发现算法来将用户关系图拆分为多个社区,每个社区中会包括至少一个用户。通过社区发现算法将用户关系图拆分为多个社区时,将用户关系图中每个用户作为一个用户节点,将一个用户节点作为一个初始社区,将该初始社区的邻居节点(与初始社区中的用户节点具有关联关系的用户节点)合并到该社区时确定模块度增益,即根据用户关系图中每两个用户节点之间的关联关系的权重确定初始社区的模块度和该初始社区的邻居节点的模块度,并确定将每个邻居节点合并到初始社区后得到社区的模块度,将得到的社区的模块度减去初始社区的模块度和要合并的邻居节点的模块度,得到模块度增益,将模块度增益最大的邻居节点合并至初始社区,得到中间社区,迭代执行合并邻居节点到中间社区的过程,得到最终的社区,从而对于用户关系图可以得到多个社区。通过社区发现算法可以快速准确的将用户关系图拆分为多个社区,提高作弊团伙识别结果的准确性。
步骤104,确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
在得到多个社区时,统计每个社区中的邀请者数量以及用户总数量,并判断邀请者数量和用户总数量是否满足预设条件,如果一个社区的邀请者数量和用户总数量满足预设条件,则确定该社区内的用户为作弊团伙。
在本发明的一个实施例中,所述确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙,包括:根据每个社区中的邀请者数量和用户总数量,确定每个社区中邀请者的平均邀请人数;若所述平均邀请人数大于或等于预设阈值,则确定该平均邀请人数对应的社区为满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
将每个社区的用户总数量除以相应社区的邀请者数量,得到每个社区中邀请者的平均邀请人数,将平均邀请人数与预设阈值进行比较,如果一个社区中邀请者的平均邀请人数大于或等于预设阈值,则可以确定该社区为满足预设条件的社区,并将该满足预设条件的社区内的用户确定为作弊团伙。平均邀请人数越多,相应的社区越有可能是作弊团伙,为了更好的识别作弊团伙而避免误伤正常用户可以设置合适的阈值,经过应用发现在预设阈值设置为2时,召回的准确率可以达95%以上。
本实施例提供的作弊团伙识别方法,通过获取预设时间段内访问用户的设备信息和用户邀请关系,根据设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定关联关系的权重,得到多个由具有关联关系的两个用户和权重所组成的三元组,根据多个三元组将用户聚合为多个社区,确定多个社区中邀请者数量和用户总数量满足预设条件的社区,将该社区内的用户确定为作弊团伙,由于不需要使用有监督模型进行识别,不需要人工标注,在活动初期根据设备信息和用户邀请关系可以很好的识别作弊团伙,减少了人力标注成本,提高了新活动中作弊团伙识别效率,由于考虑了用户邀请关系可以提高识别的准确性。
图4是本发明实施例提供的一种作弊团伙识别装置的结构示意图,如图4所示,该装置可以包括:
数据获取模块401,用于获取预设时间段内访问用户的设备信息和用户邀请关系;
三元组确定模块402,用于根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;
社区聚合模块403,用于根据多个所述三元组,将用户聚合为多个社区;
识别结果确定模块404,用于确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
可选的,所述三元组确定模块包括:
关联关系确定单元,用于若根据所述设备信息和用户邀请关系确定两个用户存在至少一种预设关联关系,则确定所述两个用户存在关联关系;
权重确定单元,用于根据所述两个用户存在的预设关联关系和预设关联关系对应的权重值,确定所述两个用户之间关联关系的权重;
第一三元组确定单元,用于将具有关联关系的两个用户和关联关系的权重确定为三元组,得到多个三元组。
可选的,所述预设关联关系包括:IP地址相同、存在邀请关系、设备标识相同、安装应用程序列表相同或设备信息中除所述IP地址外其他设备信息相同。
可选的,所述其他设备信息包括:屏幕尺寸、SD卡总容量、通知铃音位置、随机存取存储器、传感器列表、输入法和手机铃音位置。
可选的,所述三元组确定模块包括:
主节点聚合单元,用于以所述设备信息中的IP地址和/或所述用户邀请关系中的邀请者为主节点,分别确定与所述主节点具有关联关系的用户节点;
第二三元组确定单元,用于根据所述用户节点中用户的设备信息和用户邀请关系,确定所述用户节点中每两个用户节点之间所存在的预设关联关系,并根据预设关联关系和预设关联关系对应的权重值,确定每两个用户节点之间关联关系的权重,在所述主节点为邀请者时确定所述主节点与每个所述用户节点之间关联关系的权重,得到多个由两个用户节点和权重所组成的三元组以及由主节点、用户节点和权重所组成的三元组。
可选的,所述第二三元组确定单元具体用于:
在所述主节点为IP地址时,确定每两个用户节点均存在IP地址相同的预设关联关系,分别根据每两个用户节点的设备信息和用户邀请关系,确定每两个用户节点所存在的其他预设关联关系,根据每两个用户节点之间的预设关联关系和预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将具有关联关系的两个用户节点和关联关系的权重确定为三元组,得到多个三元组;
在所述主节点为邀请者时,确定主节点分别与每个用户节点存在邀请关系的预设关联关系,根据用户的设备信息,确定主节点与每个用户节点所存在的其他预设关联关系,并根据预设关联关系对应的权重值确定主节点与每个用户节点之间关联关系的权重,并确定每两个用户节点之间所存在的预设关联关系,并根据预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将主节点、用户节点以及主节点与用户节点之间关联关系的权重确定为三元组,并将具有关联关系的两个用户节点和之间关联关系的权重确定为三元组,得到多个三元组。
可选的,所述社区聚合模块包括:
三元组合并单元,用于合并多个所述三元组,得到用户关系图;
社区聚合单元,用于通过社区发现算法将所述用户关系图拆分为多个社区。
可选的,所述识别结果确定模块具体用于:
根据每个社区中的邀请者数量和用户总数量,确定每个社区中邀请者的平均邀请人数;
若所述平均邀请人数大于或等于预设阈值,则确定该平均邀请人数对应的社区为满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
本实施例提供的作弊团伙识别装置,通过获取预设时间段内访问用户的设备信息和用户邀请关系,根据设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定关联关系的权重,得到多个由具有关联关系的两个用户和权重所组成的三元组,根据多个三元组将用户聚合为多个社区,确定多个社区中邀请者数量和用户总数量满足预设条件的社区,将该社区内的用户确定为作弊团伙,由于不需要使用有监督模型进行识别,不需要人工标注,在活动初期根据设备信息和用户邀请关系可以很好的识别作弊团伙,减少了人力标注成本,提高了新活动中作弊团伙识别效率,由于考虑了用户邀请关系可以提高识别的准确性。
优选的,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述作弊团伙识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述作弊团伙识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种作弊团伙识别方法,其特征在于,包括:
获取预设时间段内访问用户的设备信息和用户邀请关系;
根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;
根据多个所述三元组,将用户聚合为多个社区;
确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
2.根据权利要求1所述的方法,其特征在于,根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组,包括:
若根据所述设备信息和用户邀请关系确定两个用户存在至少一种预设关联关系,则确定所述两个用户存在关联关系;
根据所述两个用户存在的预设关联关系和预设关联关系对应的权重值,确定所述两个用户之间关联关系的权重;
将具有关联关系的两个用户和关联关系的权重确定为三元组,得到多个三元组。
3.根据权利要求2所述的方法,其特征在于,所述预设关联关系包括:IP地址相同、存在邀请关系、设备标识相同、安装应用程序列表相同或设备信息中除所述IP地址、设备标识和安装应用程序列表外其他设备信息相同。
4.根据权利要求3所述的方法,其特征在于,所述其他设备信息包括:屏幕尺寸、SD卡总容量、通知铃音位置、随机存取存储器、传感器列表、输入法和手机铃音位置。
5.根据权利要求1所述的方法,其特征在于,根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组,包括:
以所述设备信息中的IP地址和/或所述用户邀请关系中的邀请者为主节点,分别确定与所述主节点具有关联关系的用户节点;
根据所述用户节点中用户的设备信息和用户邀请关系,确定所述用户节点中每两个用户节点之间所存在的预设关联关系,并根据预设关联关系和预设关联关系对应的权重值,确定每两个用户节点之间关联关系的权重,并在所述主节点为邀请者时确定所述主节点与每个所述用户节点之间关联关系的权重,得到多个由两个用户节点和权重所组成的三元组以及由主节点、用户节点和权重所组成的三元组。
6.根据权利要求5所述的方法,其特征在于,根据所述用户节点中用户的设备信息和用户邀请关系,确定所述用户节点中每两个用户节点之间所存在的预设的关联关系,并根据预设关联关系和预设关联关系对应的权重值,确定每两个用户节点之间关联关系的和权重,并在所述主节点为邀请者时确定所述主节点与每个所述用户节点的之间关联关系和的权重,得到多个由两个用户节点和权重所组成的三元组以及由主节点、用户节点和权重所组成的三元组,包括:
在所述主节点为IP地址时,确定每两个用户节点均存在IP地址相同的预设关联关系,分别根据每两个用户节点的设备信息和用户邀请关系,确定每两个用户节点所存在的其他预设关联关系,根据每两个用户节点之间的预设关联关系和预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将具有关联关系的两个用户节点和关联关系的权重确定为三元组,得到多个三元组;
在所述主节点为邀请者时,确定主节点分别与每个用户节点存在邀请关系的预设关联关系,根据用户的设备信息,确定主节点与每个用户节点所存在的其他预设关联关系,并根据预设关联关系对应的权重值确定主节点与每个用户节点之间关联关系的权重,并确定每两个用户节点之间所存在的预设关联关系,并根据预设关联关系对应的权重值确定每两个用户节点之间关联关系的权重,将主节点、用户节点以及主节点与用户节点之间关联关系的权重确定为三元组,并将具有关联关系的两个用户节点和之间关联关系的权重确定为三元组,得到多个三元组。
7.根据权利要求1-6任一项所述的方法,其特征在于,根据多个所述三元组,将用户聚合为多个社区,包括:
合并多个所述三元组,得到用户关系图;
通过社区发现算法将所述用户关系图拆分为多个社区。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙,包括:
根据每个社区中的邀请者数量和用户总数量,确定每个社区中邀请者的平均邀请人数;
若所述平均邀请人数大于或等于预设阈值,则确定该平均邀请人数对应的社区为满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
9.一种作弊团伙识别装置,其特征在于,包括:
数据获取模块,用于获取预设时间段内访问用户的设备信息和用户邀请关系;
三元组确定模块,用于根据所述设备信息和用户邀请关系,确定每两个用户之间的关联关系,并确定所述关联关系的权重,得到多个由具有关联关系的两个用户和所述权重所组成的三元组;
社区聚合模块,用于根据多个所述三元组,将用户聚合为多个社区;
识别结果确定模块,用于确定所述多个社区中邀请者数量和用户总数量满足预设条件的社区,并将所述满足预设条件的社区内的用户确定为作弊团伙。
10.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的作弊团伙识别方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的作弊团伙识别方法的步骤。
CN202110467271.8A 2021-04-28 2021-04-28 一种作弊团伙识别方法、装置、电子设备及存储介质 Active CN113205129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110467271.8A CN113205129B (zh) 2021-04-28 2021-04-28 一种作弊团伙识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110467271.8A CN113205129B (zh) 2021-04-28 2021-04-28 一种作弊团伙识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113205129A true CN113205129A (zh) 2021-08-03
CN113205129B CN113205129B (zh) 2023-04-07

Family

ID=77029233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110467271.8A Active CN113205129B (zh) 2021-04-28 2021-04-28 一种作弊团伙识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113205129B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846767A (zh) * 2017-04-27 2018-11-20 清华大学 社交群组的特征获取方法及装置
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN110929141A (zh) * 2018-09-20 2020-03-27 百度在线网络技术(北京)有限公司 团伙挖掘方法、装置、设备及存储介质
CN111091287A (zh) * 2019-12-13 2020-05-01 南京三百云信息科技有限公司 风险对象识别方法、装置以及计算机设备
CN111489190A (zh) * 2020-03-16 2020-08-04 上海趣蕴网络科技有限公司 一种基于用户关系的反作弊方法及系统
CN111666501A (zh) * 2020-06-30 2020-09-15 腾讯科技(深圳)有限公司 异常社团识别方法、装置、计算机设备和存储介质
CN111709756A (zh) * 2020-06-16 2020-09-25 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846767A (zh) * 2017-04-27 2018-11-20 清华大学 社交群组的特征获取方法及装置
CN110929141A (zh) * 2018-09-20 2020-03-27 百度在线网络技术(北京)有限公司 团伙挖掘方法、装置、设备及存储介质
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备
CN110135853A (zh) * 2019-04-25 2019-08-16 阿里巴巴集团控股有限公司 团伙用户识别方法、装置和设备
CN110177094A (zh) * 2019-05-22 2019-08-27 武汉斗鱼网络科技有限公司 一种用户团体识别方法、装置、电子设备及存储介质
CN111091287A (zh) * 2019-12-13 2020-05-01 南京三百云信息科技有限公司 风险对象识别方法、装置以及计算机设备
CN111489190A (zh) * 2020-03-16 2020-08-04 上海趣蕴网络科技有限公司 一种基于用户关系的反作弊方法及系统
CN111709756A (zh) * 2020-06-16 2020-09-25 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN111666501A (zh) * 2020-06-30 2020-09-15 腾讯科技(深圳)有限公司 异常社团识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN113205129B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109450771B (zh) 添加好友的方法、装置、计算机设备及存储介质
CN110401779B (zh) 一种识别电话号码的方法、装置和计算机可读存储介质
CN106993048B (zh) 确定推荐信息的方法及装置、信息推荐方法及装置
CN110377804A (zh) 培训课程数据的推送方法、装置、系统及存储介质
CN105824813B (zh) 一种挖掘核心用户的方法及装置
CN110166344B (zh) 一种身份标识识别方法、装置以及相关设备
CN109600344B (zh) 识别风险群体的方法、装置及电子设备
CN104796434A (zh) 一种消息推送方法及服务器
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN112770129A (zh) 基于直播的群聊建立方法、相关装置、设备及介质
CN112291272A (zh) 网络威胁检测方法、装置、设备及计算机可读存储介质
US8700756B2 (en) Systems, methods and devices for extracting and visualizing user-centric communities from emails
CN113420230B (zh) 基于群聊的匹配咨询推送方法、相关装置、设备及介质
CN113205129B (zh) 一种作弊团伙识别方法、装置、电子设备及存储介质
CN111182018B (zh) 一种用户识别方法、装置、设备及介质
CN112307297A (zh) 一种基于优先级规则的用户标识统一方法及系统
CN109587248B (zh) 用户识别方法、装置、服务器及存储介质
KR101928822B1 (ko) 사물 인터넷 환경에서 낯선 기기에 대한 사용자 신뢰도 계산 시스템 및 방법
CN115935231A (zh) 一种数据分类方法、装置、设备及存储介质
CN113010797B (zh) 一种基于云平台的智慧城市数据分享方法及其系统
CN112307075B (zh) 用户关系识别方法及装置
CN109831417A (zh) 防骚扰处理帐号的方法、装置、服务器及存储介质
CN111246366B (zh) 一种目标人群的定位方法、系统及相关设备
CN112288528A (zh) 恶意社群发现方法、装置、计算机设备和可读存储介质
CN111708811A (zh) 访客数据管理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant