CN113313505A - 异常定位方法、装置及计算设备 - Google Patents
异常定位方法、装置及计算设备 Download PDFInfo
- Publication number
- CN113313505A CN113313505A CN202010115172.9A CN202010115172A CN113313505A CN 113313505 A CN113313505 A CN 113313505A CN 202010115172 A CN202010115172 A CN 202010115172A CN 113313505 A CN113313505 A CN 113313505A
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- target
- user
- coupon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000002159 abnormal effect Effects 0.000 claims abstract description 66
- 230000000694 effects Effects 0.000 claims abstract description 65
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000002547 anomalous effect Effects 0.000 claims abstract description 6
- 230000006399 behavior Effects 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 42
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0225—Avoiding frauds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及信息安全技术领域,公开了一种异常定位方法、装置及计算设备,该方法包括:获取营销活动数据;根据营销活动数据构建活动关系图,活动关系图包括多个号码节点;从活动关系图中抽取第一号码节点的行为特征;对第一号码节点的行为特征进行识别,得到第一号码节点对应的用户类别;根据各号码节点对应的用户类别确定活动关系图中优惠券领取异常的用户所在的目标连通子图;对目标连通子图进行处理,得到目标连通子图中各号码节点之间的目标关系图;对目标关系图进行划分,得到多个社区;从多个社区中确定异常团伙。通过上述方式,本发明实施例实现了对优惠券领取异常团伙的定位。
Description
技术领域
本发明实施例涉及信息安全技术领域,具体涉及一种异常定位方法、装置及计算设备。
背景技术
在或联网业务的营销活动中,企业为了促销、宣传等商业目标,会面向消费者赠送优惠券。在领取优惠券的用户中,存在一群专门抢券,并将优惠券高价卖出的团伙。这种行为极大的降低了正常用户的优惠活动体验感,也让企业的业务活动无法产生应有的效果。
目前,对互联网优惠券领取异常的用户进行识别的方法是基于机器学习的建模方法。该方法可以通过机器学习模型识别异常用户。
上述方法仅能够识别异常用户个体。但是当抢券用户为一个团伙时,团伙中的个别用户无法识别。上述方法无法对异常团伙进行定位。
发明内容
鉴于上述问题,本发明实施例提供了一种异常定位方法、装置及计算设备,用于解决现有技术中存在的无法定位异常团伙的问题。
根据本发明实施例的一个方面,提供了一种异常定位方法,所述方法包括:
获取营销活动数据;
根据所述营销活动数据构建活动关系图,所述活动关系图包括多个号码节点,一个号码节点对应于一个参与营销活动的用户;
从所述活动关系图中抽取第一号码节点的行为特征,所述第一号码节点为所述多个号码节点中的任意一个号码节点;
对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,所述用户类别包括优惠券领取正常的用户和优惠券领取异常的用户;
根据各号码节点对应的用户类别确定所述活动关系图中优惠券领取异常的用户所在的目标连通子图;
对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图;
对所述目标关系图进行划分,得到多个社区;
从所述多个社区中确定异常团伙。
可选的,所述根据所述营销活动数据构建活动关系图,包括:
确定用于构建活动关系图的节点类型和边类型;
将所述营销活动数据与所述节点类型匹配,得到多个节点;
将所述营销活动数据与所述边类型匹配,得到各节点之间的关系;
所述多个节点和各节点之间的关系构成所述活动关系图。
可选的,所述行为特征包括所述第一号码节点的深度特征,所述深度特征与所述活动关系图中的边类型对应,所述从所述活动关系图中抽取第一号码节点的行为特征,包括:
以所述第一号码节点作为原点,计算按照目标边类型对应的边所能到达的最远距离;
将所述距离确定为所述号码节点对应于所述目标边类型的深度特征。
可选的,所述节点类型包括设备节点,所述边类型包括设备使用关系,所述第一号码节点的设备共用数量,所述从所述活动关系图中抽取第一号码节点的行为特征,包括:
确定与所述第一号码节点之间存在设备使用关系的目标设备节点;
统计与所述目标设备节点存在设备使用关系的号码节点的个数;
将所述号码节点的个数作为所述第一号码节点的设备共用数量。
可选的,所述营销活动数据包括优惠券领取异常的用户对应的用户标识,所述对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,包括:
将所述优惠券领取异常的用户对应的用户标识和所述优惠券领取异常的用户对应的行为特征作为一组训练数据,以得到多组训练数据;
根据所述多组训练数据训练提升树模型,得到识别模型;
将所述第一号码节点的行为特征输入所述识别模型,得到所述第一号码节点对应的用户类别。
可选的,所述对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图,包括:
将所述目标连通子图中的非号码节点转换为各号码节点之间的关系,以得到所述目标连通子图中各号码节点之间的目标关系图。
可选的,所述对所述目标关系图进行划分,得到多个社区,包括:
将所述目标关系图中的每一个号码节点作为一个社区,以得到多个社区;
遍历目标社区中的号码节点的所有邻居号码节点,计算将所述目标社区中的号码节点加入每一个邻居号码节点所在的社区后,各社区的模块度收益;
将所述目标社区合并至所述模块度收益最大的社区;
更新所述目标社区,并重复执行遍历目标社区中的号码节点的所有邻居号码节点,直至各社区不再发生变化。
可选的,所述从所述多个网络社区中确定异常团伙,包括:
计算第一社区内的优惠券领取异常的用户对应的号码节点的个数与所述第一社区内节点总数的平方的比值,得到预测概率;
将预测概率最大值对应的社区确定为异常团伙。
根据本发明实施例的另一方面,提供了一种异常定位装置,包括:
获取模块,用于获取营销活动数据;
构建模块,用于根据所述营销活动数据构建活动关系图,所述活动关系图包括多个号码节点,一个号码节点对应于一个参与营销活动的用户;
抽取模块,用于从所述活动关系图中抽取第一号码节点的行为特征,所述第一号码节点为所述多个号码节点中的任意一个号码节点;
识别模块,用于对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,所述用户类别包括优惠券领取正常的用户和优惠券领取异常的用户;
第一确定模块,用于根据各号码节点对应的用户类别确定所述活动关系图中优惠券领取异常的用户所在的目标连通子图;
处理模块,用于对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图;
划分模块,用于对所述目标关系图进行划分,得到多个社区,每一个社区包含多个号码节点;
第二确定模块,用于从所述多个社区中确定异常团伙。
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使计算设备执行上述的异常定位方法。
本发明实施例通过获取的营销活动数据建立各用户领取和使用优惠券的活动关系图,根据从活动关系图中抽取的行为特征识别出异常用户,对于异常用户所在的连通图进行社区划分,得到多个社区,从各社区中识别异常团伙。通过上述方式,本发明实施例可以建立各用户之间的联系,根据各用户之间的联系识别出异常团伙,相较于现有技术中仅能识别异常用户个体,本发明实施例不仅能够识别出异常用户个体,而且通过社区中各用户个体间的联系,还可以确定出和异常用户关联的其他个体,识别效果更佳可靠。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种异常定位方法的流程示意图;
图2示出了本发明实施例提供的一种异常定位装置的功能框图;
图3示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
图1示出了本发明实施例的一种异常定位方法的流程图,如图1所示,该方法包括以下步骤:
步骤110:获取营销活动数据。
本发明实施例的执行主体是计算设备或计算装置。该计算设备或计算装置可以实现为计算机。其中,营销活动数据存储在互联网营销活动服务器中的特定目录下。营销活动数据包括营销活动参与记录、用户基本信息、优惠券领取与使用信息和部分已知的优惠券领取异常用户的标识等数据。其中,营销活动参与记录包括用户登录号码、登录时间、登录IP、操作类型、操作时间、操作结果。用户登录号码与用户一一对应。操作类型包括领取优惠券、使用优惠券。操作结果包括领取优惠券成功、使用优惠券成功。用户基本信息包括用户号码、用户年龄、用户使用的终端、用户地址、用户入网时间和用户套餐类型。其中,用户号码与用户登录号码一致。在一些实施例中,为了保护用户隐私,对于用户号码使用用户号码标识表示,每一个用户号码对应一个用户号码表示。用户使用的终端由国际移动设备识别码(International Mobile Equipment Identity,IMEI)进行唯一标识。优惠券领取与使用信息包括:优惠券领取号码、优惠券领取订单号、优惠券使用订单号、优惠券领取时间、优惠券标识、优惠券类型、优惠券使用号码和优惠券使用时间。
步骤120:根据营销活动数据构建活动关系图。
其中,活动关系图是根据营销活动数据构建的知识图谱。在构建活动关系图时,首先需要确定活动关系图中的节点类型和边类型。在本发明实施例中,构建活动关系图的节点类型包括:号码节点、订单节点、设备节点、地址节点、套餐节点、优惠券节点等。其中,号码节点对应于营销活动数据中的登录号码、优惠券领取号码和优惠券使用号码等号码数据。订单节点对应优惠券领取订单号或优惠券使用订单号。优惠券节点对应优惠券标识,本发明实施例并不限定优惠券标识的具体类型。例如,各优惠券节点对应的优惠券标识可以使用阿拉伯数字表示,同一种优惠券的优惠券标识相同,不同优惠券的优惠券标识不同。设备节点对应用户使用的终端,即IMEI。地址节点对应用户地址。套餐节点对应用户使用的套餐。
边类型表示各节点类型之间的关系。在本发明实施例中,各节点类型之间的关系包括优惠券领取关系、优惠券使用关系和设备使用关系等。例如,号码节点和优惠券节点之间存在优惠券领取关系和优惠券使用关系,用于表示用户领取或使用了某优惠券。号码节点和设备节点之间存在设备使用关系,用于表示用户使用某设备领取或使用了优惠券。
按照各节点类型和边类型将营销活动数据导入到各个节点中,得到各节点类型对应的多个节点。各节点类型之间对应的边类型构成各节点之间的关系。例如,将营销活动中的电话号码导入号码节点中,每一个电话号码对应一个号码节点,得到多个号码节点。将营销活动中的设备标识导入到设备节点中,每一个设备标识对应一个设备节点。在营销活动数据中存在设备使用关系的号码节点和设备节点存在一条边,用于表示该号码节点对应的用户使用该设备节点对应的设备领取或使用了优惠券。根据营销活动数据构建各个节点并建立各节点之间的边关系,从而得到活动关系图。
步骤130:从活动关系图中抽取第一号码节点的行为特征。
在本步骤中,第一号码节点是号码节点中的任意一个号码节点。行为特征是用于识别用户是否是优惠券领取异常的用户。各号码节点包含的行为特征的类别相同。在本发明实施例中,第一号码节点的行为特征包括第一号码节点的深度特征。该深度特征与活动关系图中的边类型对应。深度特征的个数与所选取的边类型的数量相同。例如,边类型为优惠券使用关系,则深度特征为优惠券使用深度。在确定深度特征时,以第一号码节点作为起始节点,沿着目标边类型对应的边计算到达关系图中最远距离的节点的距离,该距离为从第一号码节点到最远距离节点经过的边的条数。目标边类型为具体的深度特征所对应的边类型。在本发明实施例中,目标边类型包括优惠券使用关系和设备登录关系。则对应的深度特征包括优惠券使用深度和设备登录深度。
在本发明实施例中,第一号码节点的行为特征还包括节点的设备共用数量。在活动关系图中确定与第一号码节点存在设备使用关系的目标设备节点。统计与目标设备节点存在设备使用关系的号码节点的个数,该个数即为第一号码节点的设备共用数量。
在本发明实施例中,第一号码节点的行为特征还包括:优惠券领取关系的出度和优惠券使用关系的出度。优惠券领取关系的出度为与第一号码节点存在优惠券领取关系的优惠券节点的个数。优惠券使用关系的出度为与第一号码节点存在优惠券使用关系的优惠券节点的个数。
在一些实施例中,将优惠券领取关系的出度和优惠券使用关系的出度之和作为一个行为特征。将优惠券领取关系的出度和优惠券使用关系的出度的比对结果作为第一号码节点的另一个行为特征。如果优惠券领取关系的出度和优惠券使用关系的出度的比对结果相同,则第一号码节点对应的比对结果为第一标识;如果优惠券领取关系的出度和优惠券使用关系的出度的对比结果不同,则第一号码节点对应的对比结果为第二标识。第二标识区别于第一标识。
在一些实施例中,将第一号码节点领取的优惠券个数和使用的优惠券个数的对比结果作为一个行为特征。如果第一号码节点领取的优惠券个数与第一号码节点使用的优惠券个数进行对比,如果对比结果相同,则该行为特征为第三标识,如果对比结果不同,则该特征为第四标识。
在一些实施例中,以第一号码节点为起点,在活动关系图中找到第一号码节点的所有父节点,将所有父节点的平均出度作为第一号码节点的一个行为特征。平均出度的计算公式为:其中,V表示所有父节点的平均出度,n表示父节点的数量,Oi表示第i个父节点的出度。
步骤140:对第一号码节点的行为特征进行识别,得到第一号码节点对应的用户类别。
其中,用户类别包括优惠券领取正常的用户和优惠券领取异常的用户。对第一号码节点的行为特征通过识别模型进行识别。识别模型是训练数据训练提升树模型得到的。训练数据是营销活动数据中优惠券领取异常的用户对应的用户标识和行为特征。一个优惠券领取异常的用户的用户标识和行为特征为一组训练数据。营销活动中优惠券领取异常的用户是已知的,多个优惠券领取异常的用户得到多组训练数据。将该训练数据输入提升树模型中进行训练,得到识别模型。将第一号码节点的行为特征输入识别模型,得到第一号码节点对应的用户类别。
步骤150:根据各号码节点对应的用户类别确定活动关系图中优惠券领取异常的用户所在的目标连通子图。
相互之间存在连通路径节点构成连通子图。根据关系图中各节点之间的连通关系,可以得到多个连通子图。同一个连通子图中的任意两个节点之间存在连通路径,不同连通子图的节点之间不存在连通路径。将仅包含优惠券领取正常的用户对应的连通子图删除,得到优惠券领取异常的用户所在的目标连通子图。目标连通子图中存在至少一个优惠券领取异常的用户。
步骤160:对目标连通子图进行处理,得到目标连通子图中各号码节点之间的目标关系图。
目标连通子图中包含号码节点和非号码节点。将目标连通子图中的非号码节点转换为各号码节点之间的关系,得到目标连通子图中各号码节点之间的目标关系图。例如,在目标连通子图中,号码节点1和号码节点2均与设备节点a存在设备使用关系,则将设备节点转换为号码节点1和号码节点2之间的同设备登录关系。同理,将目标连通子图中的非号码节点均转换为号码节点间的关系,得到目标关系图。目标关系图中仅包含号码节点及各号码节点之间的关系。
步骤170:对目标关系图进行划分,得到多个社区。
在本步骤中,社区用于表示多个号码节点的集合。将目标关系图中的每一个号码节点作为一个社区,以得到多个社区。遍历目标社区中的号码节点的所有邻居号码节点,计算将目标社区中的号码节点加入每一个邻居号码节点所在的社区后,各社区的模块度收益;将目标社区合并至模块度收益最大的社区。更新目标社区,即将其他包含一个号码节点的社区作为目标社区,并重复执行遍历目标社区中的号码节点的所有邻居节点的步骤,直至各社区不再发生变化,即,各社区中的号码节点不再发生变化。
其中,社区的模块度收益是将目标社区中的号码节点加入社区后模块度收益的差值。其中,模块度收益的计算公式为:其中,n表示社区中号码节点的个数,m表示社区中各号码节点之间边的个数,kv表示节点v的出度,A表示社区的邻接矩阵,Avw=0表示节点v和w之间没有边,Avw=1表示节点v和w之间没有边。S用于表示社区合并之前社区中的节点是否属于同一社区,Svw=0表示节点v和w属于同一社区,Svw=-1表示节点v和w属于不同社区。将社区合并后的模块度和社区合并前的模块度作差,得到模块度增益。
步骤180:从多个社区中确定异常团伙。
在本步骤中,计算第一社区内的优惠券领取异常的用户对应的号码节点的个数与第一社区内节点总数的平方的比值,得到预测概率。将预测概率最大值对应的社区确定为异常团伙。其中,第一社区为多个社区中的任意一个社区。用S表示预测概率,p表示节点集内优惠券领取异常的用户对应的号码节点的个数,q表示节点集内的号码节点的总数,则S=n/m2。
本发明实施例通过获取的营销活动数据建立各用户领取和使用优惠券的活动关系图,根据从活动关系图中抽取的行为特征识别出异常用户,对于异常用户所在的连通图进行社区划分,得到多个社区,从各社区中识别异常团伙。通过上述方式,本发明实施例可以建立各用户之间的联系,根据各用户之间的联系识别出异常团伙,相较于现有技术中仅能识别异常用户个体,本发明实施例不仅能够识别出异常用户个体,而且通过社区中各用户个体间的联系,还可以确定出和异常用户关联的其他个体,识别效果更佳可靠。
图2示出了本发明实施例的一种异常定位装置的功能框图。如图2所示,该装置包括:获取模块210,用于获取营销活动数据。构建模块220,用于根据所述营销活动数据构建活动关系图,所述活动关系图包括多个号码节点,一个号码节点对应于一个参与营销活动的用户。抽取模块230,用于从所述活动关系图中抽取第一号码节点的行为特征,所述第一号码节点为所述多个号码节点中的任意一个号码节点。识别模块240,用于对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,所述用户类别包括优惠券领取正常的用户和优惠券领取异常的用户。第一确定模块250,用于根据各号码节点对应的用户类别确定所述活动关系图中优惠券领取异常的用户所在的目标连通子图。处理模块260,用于对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图,划分模块270,用于对所述目标关系图进行划分,得到多个社区,每一个社区包含多个号码节点。第二确定模块280,用于从所述多个社区中确定异常团伙。
可选的,构建模块220进一步用于:
确定用于构建活动关系图的节点类型和边类型;
将所述营销活动数据与所述节点类型匹配,得到多个节点;
将所述营销活动数据与所述边类型匹配,得到各节点之间的关系;
所述多个节点和各节点之间的关系构成所述活动关系图。
可选的,所述行为特征包括所述第一号码节点的深度特征,所述深度特征与所述活动关系图中的边类型对应,所述从所述活动关系图中抽取第一号码节点的行为特征,包括:
以所述第一号码节点作为原点,计算按照目标边类型对应的边所能到达的最远距离;
将所述距离确定为所述号码节点对应于所述目标边类型的深度特征。
可选的,所述节点类型包括设备节点,所述边类型包括设备使用关系,所述第一号码节点的设备共用数量,所述抽取230进一步用于:
确定与所述第一号码节点之间存在设备使用关系的目标设备节点;
统计与所述目标设备节点存在设备使用关系的号码节点的个数;
将所述号码节点的个数作为所述第一号码节点的设备共用数量。
可选的,所述营销活动数据包括优惠券领取异常的用户对应的用户标识,所述识别模块240进一步用于:
将所述优惠券领取异常的用户对应的用户标识和所述优惠券领取异常的用户对应的行为特征作为一组训练数据,以得到多组训练数据;
根据所述多组训练数据训练提升树模型,得到识别模型;
将所述第一号码节点的行为特征输入所述识别模型,得到所述第一号码节点对应的用户类别。
可选的,所述处理模块260进一步用于:
将所述目标连通子图中的非号码节点转换为各号码节点之间的关系,以得到所述目标连通子图中各号码节点之间的目标关系图。
可选的,所述划分模块270进一步用于:
将所述目标关系图中的每一个号码节点作为一个社区,以得到多个社区;
遍历目标社区中的号码节点的所有邻居号码节点,计算将所述目标社区中的号码节点加入每一个邻居号码节点所在的社区后,各社区的模块度收益;
将所述目标社区合并至所述模块度收益最大的社区;
更新所述目标社区,并重复执行遍历目标社区中的号码节点的所有邻居号码节点,直至各社区不再发生变化。
可选的,所述第二确定模块280进一步用于:
计算第一社区内的优惠券领取异常的用户对应的号码节点的个数与所述第一社区内节点总数的平方的比值,得到预测概率;
将预测概率最大值对应的社区确定为异常团伙。
本发明实施例通过获取的营销活动数据建立各用户领取和使用优惠券的活动关系图,根据从活动关系图中抽取的行为特征识别出异常用户,对于异常用户所在的连通图进行社区划分,得到多个社区,从各社区中识别异常团伙。通过上述方式,本发明实施例可以建立各用户之间的联系,根据各用户之间的联系识别出异常团伙,相较于现有技术中仅能识别异常用户个体,本发明实施例不仅能够识别出异常用户个体,而且通过社区中各用户个体间的联系,还可以确定出和异常用户关联的其他个体,识别效果更佳可靠。
图3示出了本发明实施例的一种计算设备结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图3所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于定位异常团伙的方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机可执行指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以被处理器402调用使处理器执行图1中的步骤110~步骤180以及实现图2中的模块110~模块180的功能。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在计算设备/装置上运行时,使得所述计算设备/装置执行上述任意方法实施例中的异常定位方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使上述计算设备执行上述任意方法实施例中的异常定位方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的异常定位方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种异常定位方法,其特征在于,所述方法包括:
获取营销活动数据;
根据所述营销活动数据构建活动关系图,所述活动关系图包括多个号码节点,一个号码节点对应于一个参与营销活动的用户;
从所述活动关系图中抽取第一号码节点的行为特征,所述第一号码节点为所述多个号码节点中的任意一个号码节点;
对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,所述用户类别包括优惠券领取正常的用户和优惠券领取异常的用户;
根据各号码节点对应的用户类别确定所述活动关系图中优惠券领取异常的用户所在的目标连通子图;
对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图;
对所述目标关系图进行划分,得到多个社区;
从所述多个社区中确定异常团伙。
2.根据权利要求1所述的方法,其特征在于,所述根据所述营销活动数据构建活动关系图,包括:
确定用于构建活动关系图的节点类型和边类型;
将所述营销活动数据与所述节点类型匹配,得到多个节点;
将所述营销活动数据与所述边类型匹配,得到各节点之间的关系;
所述多个节点和各节点之间的关系构成所述活动关系图。
3.根据权利要求2所述的方法,其特征在于,所述行为特征包括所述第一号码节点的深度特征,所述深度特征与所述活动关系图中的边类型对应,所述从所述活动关系图中抽取第一号码节点的行为特征,包括:
以所述第一号码节点作为原点,计算按照目标边类型对应的边所能到达的最远距离;
将所述距离确定为所述号码节点对应于所述目标边类型的深度特征。
4.根据权利要求2所述的方法,其特征在于,所述节点类型包括设备节点,所述边类型包括设备使用关系,所述第一号码节点的设备共用数量,所述从所述活动关系图中抽取第一号码节点的行为特征,包括:
确定与所述第一号码节点之间存在设备使用关系的目标设备节点;
统计与所述目标设备节点存在设备使用关系的号码节点的个数;
将所述号码节点的个数作为所述第一号码节点的设备共用数量。
5.根据权利要求1所述的方法,其特征在于,所述营销活动数据包括优惠券领取异常的用户对应的用户标识,所述对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,包括:
将所述优惠券领取异常的用户对应的用户标识和所述优惠券领取异常的用户对应的行为特征作为一组训练数据,以得到多组训练数据;
根据所述多组训练数据训练提升树模型,得到识别模型;
将所述第一号码节点的行为特征输入所述识别模型,得到所述第一号码节点对应的用户类别。
6.根据权利要求1所述的方法,其特征在于,所述对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图,包括:
将所述目标连通子图中的非号码节点转换为各号码节点之间的关系,以得到所述目标连通子图中各号码节点之间的目标关系图。
7.根据权利要求1所述的方法,其特征在于,所述对所述目标关系图进行划分,得到多个社区,包括:
将所述目标关系图中的每一个号码节点作为一个社区,以得到多个社区;
遍历目标社区中的号码节点的所有邻居号码节点,计算将所述目标社区中的号码节点加入每一个邻居号码节点所在的社区后,各社区的模块度收益;
将所述目标社区合并至所述模块度收益最大的社区;
更新所述目标社区,并重复执行遍历目标社区中的号码节点的所有邻居号码节点,直至各社区不再发生变化。
8.根据权利要求1所述的方法,其特征在于,所述从所述多个网络社区中确定异常团伙,包括:
计算第一社区内的优惠券领取异常的用户对应的号码节点的个数与所述第一社区内节点总数的平方的比值,得到预测概率;
将预测概率最大值对应的社区确定为异常团伙。
9.一种异常定位装置,其特征在于,所述装置包括:
获取模块,用于获取营销活动数据;
构建模块,用于根据所述营销活动数据构建活动关系图,所述活动关系图包括多个号码节点,一个号码节点对应于一个参与营销活动的用户;
抽取模块,用于从所述活动关系图中抽取第一号码节点的行为特征,所述第一号码节点为所述多个号码节点中的任意一个号码节点;
识别模块,用于对所述第一号码节点的行为特征进行识别,得到所述第一号码节点对应的用户类别,所述用户类别包括优惠券领取正常的用户和优惠券领取异常的用户;
第一确定模块,用于根据各号码节点对应的用户类别确定所述活动关系图中优惠券领取异常的用户所在的目标连通子图;
处理模块,用于对所述目标连通子图进行处理,得到所述目标连通子图中各号码节点之间的目标关系图;
划分模块,用于对所述目标关系图进行划分,得到多个社区,每一个社区包含多个号码节点;
第二确定模块,用于从所述多个社区中确定异常团伙。
10.一种计算设备,其特征在于,所述计算设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-8任意一项所述的一种异常定位方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010115172.9A CN113313505B (zh) | 2020-02-25 | 2020-02-25 | 异常定位方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010115172.9A CN113313505B (zh) | 2020-02-25 | 2020-02-25 | 异常定位方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113313505A true CN113313505A (zh) | 2021-08-27 |
CN113313505B CN113313505B (zh) | 2023-07-25 |
Family
ID=77369833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010115172.9A Active CN113313505B (zh) | 2020-02-25 | 2020-02-25 | 异常定位方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113313505B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029761A (zh) * | 2022-07-20 | 2023-04-28 | 鑫洋互联网科技(广州)有限公司 | 一种优惠券效验方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110276373A1 (en) * | 2010-05-06 | 2011-11-10 | Nicholas Juszczak | Online coupon distribution system and method |
CN106301978A (zh) * | 2015-05-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 团伙成员账号的识别方法、装置及设备 |
CN108228706A (zh) * | 2017-11-23 | 2018-06-29 | 中国银联股份有限公司 | 用于识别异常交易社团的方法和装置 |
CN108898505A (zh) * | 2018-05-28 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊团伙的识别方法、相关存储介质和电子设备 |
CN109598509A (zh) * | 2018-10-17 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 风险团伙的识别方法和装置 |
CN110032583A (zh) * | 2019-03-12 | 2019-07-19 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN110046929A (zh) * | 2019-03-12 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN110135853A (zh) * | 2019-04-25 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 团伙用户识别方法、装置和设备 |
CN110224859A (zh) * | 2019-05-16 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 用于识别团伙的方法和系统 |
CN110602101A (zh) * | 2019-09-16 | 2019-12-20 | 北京三快在线科技有限公司 | 网络异常群组的确定方法、装置、设备及存储介质 |
CN110647590A (zh) * | 2019-09-23 | 2020-01-03 | 税友软件集团股份有限公司 | 一种目标社群数据的识别方法及相关装置 |
-
2020
- 2020-02-25 CN CN202010115172.9A patent/CN113313505B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110276373A1 (en) * | 2010-05-06 | 2011-11-10 | Nicholas Juszczak | Online coupon distribution system and method |
CN106301978A (zh) * | 2015-05-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 团伙成员账号的识别方法、装置及设备 |
CN108228706A (zh) * | 2017-11-23 | 2018-06-29 | 中国银联股份有限公司 | 用于识别异常交易社团的方法和装置 |
CN108898505A (zh) * | 2018-05-28 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊团伙的识别方法、相关存储介质和电子设备 |
CN109598509A (zh) * | 2018-10-17 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 风险团伙的识别方法和装置 |
CN110032583A (zh) * | 2019-03-12 | 2019-07-19 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN110046929A (zh) * | 2019-03-12 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN110135853A (zh) * | 2019-04-25 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 团伙用户识别方法、装置和设备 |
CN110224859A (zh) * | 2019-05-16 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 用于识别团伙的方法和系统 |
CN110602101A (zh) * | 2019-09-16 | 2019-12-20 | 北京三快在线科技有限公司 | 网络异常群组的确定方法、装置、设备及存储介质 |
CN110647590A (zh) * | 2019-09-23 | 2020-01-03 | 税友软件集团股份有限公司 | 一种目标社群数据的识别方法及相关装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029761A (zh) * | 2022-07-20 | 2023-04-28 | 鑫洋互联网科技(广州)有限公司 | 一种优惠券效验方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113313505B (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107194623B (zh) | 一种团伙欺诈的发现方法及装置 | |
CN109598509B (zh) | 风险团伙的识别方法和装置 | |
CN107423613B (zh) | 依据相似度确定设备指纹的方法、装置及服务器 | |
CN110224859B (zh) | 用于识别团伙的方法和系统 | |
JP2017501514A (ja) | 顔表現のためのシステムおよび方法 | |
CN111090807B (zh) | 一种基于知识图谱的用户识别方法及装置 | |
Zhou et al. | Analyzing and detecting money-laundering accounts in online social networks | |
CN105721629A (zh) | 用户标识匹配方法和装置 | |
CN110782333A (zh) | 一种设备风险控制方法、装置、设备及介质 | |
CN113205129B (zh) | 一种作弊团伙识别方法、装置、电子设备及存储介质 | |
CN114419363A (zh) | 基于无标注样本数据的目标分类模型训练方法及装置 | |
CN108648017B (zh) | 易于扩展的用户需求匹配方法、装置、设备及存储介质 | |
US8700756B2 (en) | Systems, methods and devices for extracting and visualizing user-centric communities from emails | |
CN112347457A (zh) | 异常账户检测方法、装置、计算机设备和存储介质 | |
CN112437034A (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
JP5350319B2 (ja) | 友人推薦装置及び方法及びプログラム | |
CN113313505A (zh) | 异常定位方法、装置及计算设备 | |
CN108076032A (zh) | 一种异常行为用户识别方法及装置 | |
CN113065748A (zh) | 业务风险评估方法、装置、设备及存储介质 | |
CN112053151A (zh) | 行为的确定方法及装置、存储介质、电子设备 | |
CN111666501A (zh) | 异常社团识别方法、装置、计算机设备和存储介质 | |
Sharma et al. | Comparative analysis of different algorithms in link prediction on social networks | |
CN109992960A (zh) | 一种伪造参数检测方法、装置、电子设备及存储介质 | |
CN114781517A (zh) | 风险识别的方法、装置及终端设备 | |
CN106549914B (zh) | 一种独立访问者的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |