CN112116377A - 刷单检测方法、装置、电子设备及可读存储介质 - Google Patents

刷单检测方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112116377A
CN112116377A CN202010814500.4A CN202010814500A CN112116377A CN 112116377 A CN112116377 A CN 112116377A CN 202010814500 A CN202010814500 A CN 202010814500A CN 112116377 A CN112116377 A CN 112116377A
Authority
CN
China
Prior art keywords
subgraph
network community
modularity
node
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010814500.4A
Other languages
English (en)
Inventor
潘航
张庆
宋佳
宾义
罗恒亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202010814500.4A priority Critical patent/CN112116377A/zh
Publication of CN112116377A publication Critical patent/CN112116377A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0239Online discounts or incentives

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种刷单检测方法、装置及电子设备。所述方法包括:根据用户和业务方之间的交互行为数据,生成多个网络社区子图;根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;获取所述初始网络社区子图对应的可疑度;根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例可以提升检测刷单行为的检测效率,能够有效检测出刷单行为。

Description

刷单检测方法、装置、电子设备及可读存储介质
技术领域
本公开的实施例涉及互联网技术领域,尤其涉及一种刷单检测方法、装置、电子设备及可读存储介质。
背景技术
随着线上消费平台的日益普及,线上消费平台上的非法刷单行为也越来越猖獗。刷单行为包括商家工作人员或商家委托他人进行的对线上消费平台上的商品或服务进行大量购买和验证消费等不以正常消费为目的的行为。通过刷单行为,商家可以获取虚假的信息,进而通过虚假的交易信息套取线上消费平台提供的优惠补贴等不当利益。因此,如何对非法刷单行为进行检测是目前关注的话题。
发明内容
本公开的实施例提供一种刷单检测方法、装置、电子设备及可读存储介质,用以有效准确的检测非法刷单行为。
根据本公开的实施例的第一方面,提供了一种刷单检测方法,包括:
根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
获取所述初始网络社区子图对应的可疑度;
根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
可选地,所述根据用户和业务方之间的交互行为数据,生成多个网络社区子图,包括:
根据所述交互行为数据建立关联网络,所述关联网络包括多个节点以及连接所述多个节点的多条边,所述边附带用于描述所述用户和所述业务方之间的交互行为的紧密程度的权重;
通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
可选地,所述根据所述交互行为数据建立关联网络,包括:
将所述用户的用户标识作为用户节点,将所述业务方的业务方标识作为业务方节点,以获取所述多个节点;
根据所述交互行为数据,在存在交互行为的用户节点和业务方节点之间建立附带权重的边,以建立所述关联网络。
可选地,所述通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图,包括:
为所述关联网络中的每个节点添加不同的节点标签;
根据所述每个节点与所述每个节点的多个邻接节点之间的边的权重,通过所述标签传播算法对所述每个节点的节点标签进行更新操作;
在完成对所述每个节点的节点标签的更新操作后,将具备相同节点标签的节点划分为同一网络社区子图,以获取所述多个网络社区子图。
可选地,所述根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,包括:
根据所述模块度和预设的模块度阈值,获取所述模块度大于所述模块度阈值的网络社区子图,并将所述模块度大于所述模块度阈值的网络社区子图作为所述初始网络社区子图。
可选地,所述根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图,包括:
获取所述可疑度大于所述可疑度阈值的初始网络社区子图,并将所述可疑度大于所述可疑度阈值的初始网络社区子图作为所述目标网络社区子图。
根据本公开的实施例的第二方面,提供了一种刷单检测装置,包括:
社区子图生成模块,用于根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
初始社区确定模块,用于根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
可疑度获取模块,用于获取所述初始网络社区子图对应的可疑度;
目标子图确定模块,用于根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
可选地,所述社区子图生成模块包括:
关联网络建立单元,用于根据所述交互行为数据建立关联网络,所述关联网络包括多个节点以及连接所述多个节点的多条边,所述边附带用于描述所述用户和所述业务方之间的交互行为的紧密程度的权重;
社区子图划分单元,用于通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
可选地,所述关联网络建立单元包括:
多个节点获取子单元,用于将所述用户的用户标识作为用户节点,将所述业务方的业务方标识作为业务方节点,以获取所述多个节点;
关联网络建立子单元,用于根据所述交互行为数据,在存在交互行为的用户节点和业务方节点之间建立附带权重的边,以建立所述关联网络。
可选地,所述社区子图划分单元包括:
节点标签添加子单元,用于为所述关联网络中的每个节点添加不同的节点标签;
更新操作执行子单元,用于根据所述每个节点与所述每个节点的多个邻接节点之间的边的权重,通过所述标签传播算法对所述每个节点的节点标签进行更新操作;
社区子图获取子单元,用于在完成对所述每个节点的节点标签的更新操作后,将具备相同节点标签的节点划分为同一网络社区子图,以获取所述多个网络社区子图。
可选地,所述初始社区确定模块包括:
初始社区获取单元,用于根据所述模块度和预设的模块度阈值,获取所述模块度大于所述模块度阈值的网络社区子图,并将所述模块度大于所述模块度阈值的网络社区子图作为所述初始网络社区子图。
可选地,所述可疑度获取模块包括:
可选地,所述目标子图确定模块包括:
目标子图获取单元,用于获取所述可疑度大于所述可疑度阈值的初始网络社区子图,并将所述可疑度大于所述可疑度阈值的初始网络社区子图作为所述目标网络社区子图。
本公开的实施例提供刷单检测方案,通过根据用户和业务方之间的交互行为数据,生成多个网络社区子图,根据网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,获取初始网络社区子图对应的可疑度,根据可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例通过将社区发现算法和稠密子图挖掘算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了检测刷单行为的检测效率,能够有效检测出刷单行为。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开的实施例提供的一种刷单检测方法的步骤流程图;
图2为本公开的实施例提供的另一种刷单检测方法的步骤流程图;
图3为本公开的实施例提供的一种刷单检测装置的结构示意图;
图4为本公开的实施例提供的另一种刷单检测装置的结构示意图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
参照图1,示出了本公开的实施例提供的一种刷单检测方法的步骤流程图,如图1所述,该刷单检测方法具体可以包括如下步骤:
步骤101:根据用户和业务方之间的交互行为数据,生成多个网络社区子图。
本公开的实施例可以应用于结合社区发现算法和稠密子图算法对非法刷单行为进行检测的场景中。
业务方是指提供产品和/或服务的一方,例如,业务方为注册于业务平台上的商家等。
交互行为数据是指用户购买业务方提供的产品或服务的行为数据,例如,业务方提供的产品包括产品A和产品B,用户购买产品A和/或产品B的行为数据即为交互行为数据。
网络社区子图是指结合用户和业务方之间的交互行为数据,构建二部图,具体地,首先,可以结合用户与业务方之间的交互行为数据构建用户—业务方对应的二部图,然后将二部图进行分解,可以得到多个网络社区子图。具体地,将在下述实施例中进行详细描述,本实施例在此不再加以赘述。
在根据用户和业务方之间的交互行为数据生成多个网络社区子图之后,执行步骤102。
步骤102:根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图。
模块度是指用于表示网络社区子图上各个节点之间的紧密程度的指标。
模块度阈值是指由业务人员预先设置的用于判定网络社区子图是否为可疑子图的阈值。对于模块度阈值的具体数值可以根据业务需求而定,本实施例对此不加以限制。
初始网络社区子图是指从多个网络社区子图中筛选出的模块度大于模块度阈值的网络社区子图。例如,多个网络社区子图包括子图1、子图2和子图3,模块度阈值为0.8,子图1对应的模块度为0.6,子图2对应的模块度为0.9,子图3对应的模块度为0.85,则将子图2和子图3作为初始网络社区子图。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在根据用户与业务方之间的交互行为数据生成多个网络社区子图之后,可以计算每个网络社区子图对应的模块度,然后,根据网络社区子图的模块度和预设的模块度阈值,从多个网络社区子图中筛选出初始网络社区子图。
在根据网络社区子图的模块度和预设的模块度阈值确定出初始网络社区子图之后,执行步骤103。
步骤103:获取所述初始网络社区子图对应的可疑度。
可以理解地是,初始网络社区子图的可疑度反应了对应的交互行为数据是否为非法刷单行为。
在获取初始网络社区子图之后,可以采用稠密子图挖掘算法计算每个初始网络社区子图对应的可疑度,具体地,将在下述实施例中进行详细描述,本实施例在此不再加以赘述。
在根据网络社区子图的模块度和预设的模块度阈值确定出初始网络社区子图之后,可以计算初始网络社区子图对应的可疑度,进而,可以执行步骤104。
步骤104:根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
可疑度阈值是指预先设置的用于判定初始网络社区子图是否为刷单行为的子图的阈值,在本示例中,可疑度阈值的具体数值可以根据业务需求而定,本实施例对此不加以限制。
目标网络社区子图是指判定的具有刷单行为的网络社区子图。
在计算得到初始网络社区子图对应的可疑度之后,可以将可疑度与可疑度阈值进行比较,以获取存在刷单行为的目标网络社区子图。
在现有技术方案中,通常是采用社区发现算法和稠密子图挖掘算法单独进行刷单行为的检测,而社区发现算法存在检测刷单行为的置信度不高,且稠密子图挖掘算法存在不可并行计算的问题,而提出了将两种算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了刷单行为检测的效率。
本公开实施例提供的刷单检测方法,通过根据用户和业务方之间的交互行为数据,生成多个网络社区子图,根据网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,获取初始网络社区子图对应的可疑度,根据可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例通过将社区发现算法和稠密子图挖掘算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了检测刷单行为的检测效率,能够有效检测出刷单行为。
参照图2,示出了本公开的实施例提供的另一种刷单检测方法的步骤流程图,如图2所述,该刷单检测方法具体可以包括如下步骤:
步骤201:根据所述交互行为数据建立关联网络。
本公开的实施例可以应用于结合社区发现算法和稠密子图算法进行刷单行为检测的场景中。
交互行为数据是指用户购买业务方提供的产品或服务的行为数据,例如,业务方提供的产品包括产品A和产品B,用户购买产品A和/或产品B的行为数据即为交互行为数据。
业务方是指提供产品和/或服务的一方,例如,业务方为注册于业务平台上的商家等。
在获取用户与业务方之间的交互行为数据之后,可以根据交互行为数据建立关联网络,在关联网络中包括多个节点以及连接多个节点的多条边,每条边附带用于描述用户和业务方之间的交互行为的紧密程度的权重,对于构建关联网络的过程可以结合下述具体实现方式进行详细描述。
在本公开的一种具体实现方式中,上述步骤201可以包括:
子步骤S1:将所述用户的用户标识作为用户节点,将所述业务方的业务方标识作为业务方节点,以获取所述多个节点。
在本公开实施例中,用户标识是指用户的标识,如用户ID等。
业务方标识是指业务方的标识,如业务方ID等。
在获取用户和业务方之间的交互行为数据之后,可以获取用户的用户标识和业务方对应的业务方标识,并将用户的用户标识作为用户节点,业务方标识作为业务方节点,从而获取多个节点。
在获取多个节点之后,执行子步骤S2。
子步骤S2:根据所述交互行为数据,在存在交互行为的用户节点和业务方节点之间建立附带权重的边,以建立所述关联网络
在获取多个节点之后,可以根据交互行为数据在存在交互行为的用户节点和业务方节点之间建立附带权重的边,从而可以建立关联网络。
在根据用户与业务方之间的交互行为数据建立关联网络之后,执行步骤202。
步骤202:通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
示例地,现有的标签传播算法包括两个阶段:在初始化阶段为该关联网络中的每个节点添加一个唯一的节点标签,此后,再在标签更新阶段更新每个节点的标签,即令一个节点标签与该节点的大多数邻居的节点标签相同,直至每个节点的节点标签都不再变化。具体地,可以结合下述具体实现方式进行详细描述。
在本公开的实施例的另一种具体实现方式中,上述步骤202可以包括:
子步骤M1:为所述关联网络中的每个节点添加不同的节点标签。
在本实施例中,在建立关联网络之后,可以为关联网络中的每个节点分别添加一个节点标签,在关联网络中红每个节点的节点标签均是不相同的,例如,在关联网络中包含节点1、节点2、节点3和节点4,此时,可以为节点1添加节点标签1,为节点2添加节点标签2,为节点3添加节点标签3,为节点4添加节点标签4。或者,为节点1添加节点标签a,为节点2添加节点标签b,为节点3添加节点标签c,为节点4添加节点标签d等。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在为关联网络中的每个节点添加不同的节点标签之后,执行子步骤M2。
子步骤M2:根据所述每个节点与所述每个节点的多个邻接节点之间的边的权重,通过所述标签传播算法对所述每个节点的节点标签进行更新操作。
在本实施例中,可以将用户与业务方对应的订单数量作为边的权重,通过标签传播算法对每个节点的节点标签执行更新操作。
子步骤M3:在完成对所述每个节点的节点标签的更新操作后,将具备相同节点标签的节点划分为同一网络社区子图,以获取所述多个网络社区子图。
在完成对每个节点的节点标签的更新操作之后,可以将具备相同节点标签的节点划分为同一网络社区子图,以获取到多个网络社区子图。
步骤203:根据所述模块度和预设的模块度阈值,获取所述模块度大于所述模块度阈值的网络社区子图,并将所述模块度大于所述模块度阈值的网络社区子图作为所述初始网络社区子图。
模块度是指用于表示网络社区子图上各个节点之间的紧密程度的指标。
模块度阈值是指由业务人员预先设置的用于判定网络社区子图是否为可疑子图的阈值。对于模块度阈值的具体数值可以根据业务需求而定,本实施例对此不加以限制。
初始网络社区子图是指从多个网络社区子图中筛选出的模块度大于模块度阈值的网络社区子图。例如,多个网络社区子图包括子图1、子图2和子图3,模块度阈值为0.8,子图1对应的模块度为0.6,子图2对应的模块度为0.9,子图3对应的模块度为0.85,则将子图2和子图3作为初始网络社区子图。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
初始网络社区子图是指从多个网络社区子图中筛选出的模块度大于模块度阈值的网络社区子图。例如,多个网络社区子图包括子图1、子图2和子图3,模块度阈值为0.8,子图1对应的模块度为0.6,子图2对应的模块度为0.9,子图3对应的模块度为0.85,则将子图2和子图3作为初始网络社区子图。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在根据用户与业务方之间的交互行为数据生成多个网络社区子图之后,可以计算每个网络社区子图对应的模块度,然后,根据网络社区子图的模块度和预设的模块度阈值,从多个网络社区子图中筛选出初始网络社区子图。
在根据网络社区子图的模块度和预设的模块度阈值确定出初始网络社区子图之后,执行步骤204。
步骤204:获取所述初始网络社区子图对应的可疑度。
可以理解地是,初始网络社区子图的可疑度反应了对应的交互行为数据是否为非法刷单行为。
在获取初始网络社区子图之后,可以采用稠密子图挖掘算法计算每个初始网络社区子图对应的可疑度,具体地,可以通过可疑度评估算法确定初始网络社区子图初始网络社区子图的可疑度,在本实施例中,可疑度评估算法可以为算术平均算法、结合平均算法、对数平均算法等。在获取初始网络社区子图之后,可以将初始网络社区子图输入至可疑度评估算法,以输出初始网络社区子图的可疑度。
当然,在具体实现中,还可以采用其它方式获取初始网络社区子图对应的可疑度,例如,初始网络社区子图的可疑度反应了对应的交互行为数据是否为非法刷单行为,这是因为正常用户产生的交互行为数据与非法刷单用户所呈现的特征是不一样,通过挖掘这些特征即可分析出初始网络社区子图的可疑度等,对于获取初始网络社区子图的可疑度的具体方式可以根据业务需求而定,本实施例对此不加以限制。
在根据网络社区子图的模块度和预设的模块度阈值确定出初始网络社区子图之后,可以计算初始网络社区子图对应的可疑度,进而,可以执行步骤205。
步骤205:获取所述可疑度大于所述可疑度阈值的初始网络社区子图,并将所述可疑度大于所述可疑度阈值的初始网络社区子图作为所述目标网络社区子图。
可疑度阈值是指预先设置的用于判定初始网络社区子图是否为刷单行为的子图的阈值,在本示例中,可疑度阈值的具体数值可以根据业务需求而定,本实施例对此不加以限制。
目标网络社区子图是指判定的具有刷单行为的网络社区子图。
在计算得到初始网络社区子图对应的可疑度之后,可以将可疑度与可疑度阈值进行比较,以获取初始网络社区子图中可疑度大于可疑度阈值的初始网络社区子图,以将可疑度大于可疑度阈值的初始网络社区子图作为存在刷单行为的目标网络社区子图。
在现有技术方案中,通常是采用社区发现算法和稠密子图挖掘算法单独进行刷单行为的检测,而社区发现算法存在检测刷单行为的置信度不高,且稠密子图挖掘算法存在不可并行计算的问题,而提出了将两种算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了刷单行为检测的效率。
本公开实施例提供的刷单检测方法,通过根据用户和业务方之间的交互行为数据,生成多个网络社区子图,根据网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,获取初始网络社区子图对应的可疑度,根据可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例通过将社区发现算法和稠密子图挖掘算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了检测刷单行为的检测效率,能够有效检测出刷单行为。
参照图3,示出了本公开的实施例提供的一种刷单检测装置的结构示意图,如图3所述,该刷单检测装置具体可以包括如下模块:
社区子图生成模块310,用于根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
初始社区确定模块320,用于根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
可疑度获取模块330,用于获取所述初始网络社区子图对应的可疑度;
目标子图确定模块340,用于根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
本公开实施例提供的刷单检测装置,通过根据用户和业务方之间的交互行为数据,生成多个网络社区子图,根据网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,获取初始网络社区子图对应的可疑度,根据可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例通过将社区发现算法和稠密子图挖掘算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了检测刷单行为的检测效率,能够有效检测出刷单行为。
参照图4,示出了本公开的实施例提供的另一种刷单检测装置的结构示意图,如图4所述,该刷单检测装置具体可以包括如下模块:
社区子图生成模块410,用于根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
初始社区确定模块420,用于根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
可疑度获取模块430,用于获取所述初始网络社区子图对应的可疑度;
目标子图确定模块440,用于根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
可选地,所述社区子图生成模块410包括:
关联网络建立单元411,用于根据所述交互行为数据建立关联网络,所述关联网络包括多个节点以及连接所述多个节点的多条边,所述边附带用于描述所述用户和所述业务方之间的交互行为的紧密程度的权重;
社区子图划分单元412,用于通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
可选地,所述关联网络建立单元411包括:
多个节点获取子单元,用于将所述用户的用户标识作为用户节点,将所述业务方的业务方标识作为业务方节点,以获取所述多个节点;
关联网络建立子单元,用于根据所述交互行为数据,在存在交互行为的用户节点和业务方节点之间建立附带权重的边,以建立所述关联网络。
可选地,所述社区子图划分单元412包括:
节点标签添加子单元,用于为所述关联网络中的每个节点添加不同的节点标签;
更新操作执行子单元,用于根据所述每个节点与所述每个节点的多个邻接节点之间的边的权重,通过所述标签传播算法对所述每个节点的节点标签进行更新操作;
社区子图获取子单元,用于在完成对所述每个节点的节点标签的更新操作后,将具备相同节点标签的节点划分为同一网络社区子图,以获取所述多个网络社区子图。
可选地,所述初始社区确定模块420包括:
初始社区获取单元421,用于根据所述模块度和预设的模块度阈值,获取所述模块度大于所述模块度阈值的网络社区子图,并将所述模块度大于所述模块度阈值的网络社区子图作为所述初始网络社区子图。
可选地,所述目标子图确定模块440包括:
目标子图获取单元441,用于获取所述可疑度大于所述可疑度阈值的初始网络社区子图,并将所述可疑度大于所述可疑度阈值的初始网络社区子图作为所述目标网络社区子图。
本公开实施例提供的刷单检测装置,通过根据用户和业务方之间的交互行为数据,生成多个网络社区子图,根据网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,获取初始网络社区子图对应的可疑度,根据可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。本公开的实施例通过将社区发现算法和稠密子图挖掘算法进行结合,既解决了社区发现算法所发现社区置信度不高的问题,又解决了稠密子图算法不可并行计算的问题,提升了检测刷单行为的检测效率,能够有效检测出刷单行为。
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的刷单检测方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的刷单检测方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种刷单检测方法,其特征在于,包括:
根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
获取所述初始网络社区子图对应的可疑度;
根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图。
2.根据权利要求1所述的方法,其特征在于,所述根据用户和业务方之间的交互行为数据,生成多个网络社区子图,包括:
根据所述交互行为数据建立关联网络,所述关联网络包括多个节点以及连接所述多个节点的多条边,所述边附带用于描述所述用户和所述业务方之间的交互行为的紧密程度的权重;
通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述交互行为数据建立关联网络,包括:
将所述用户的用户标识作为用户节点,将所述业务方的业务方标识作为业务方节点,以获取所述多个节点;
根据所述交互行为数据,在存在交互行为的用户节点和业务方节点之间建立附带权重的边,以建立所述关联网络。
4.根据权利要求3所述的方法,其特征在于,所述通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图,包括:
为所述关联网络中的每个节点添加不同的节点标签;
根据所述每个节点与所述每个节点的多个邻接节点之间的边的权重,通过所述标签传播算法对所述每个节点的节点标签进行更新操作;
在完成对所述每个节点的节点标签的更新操作后,将具备相同节点标签的节点划分为同一网络社区子图,以获取所述多个网络社区子图。
5.根据权利要求1所述的方法,其特征在于,所述根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图,包括:
根据所述模块度和预设的模块度阈值,获取所述模块度大于所述模块度阈值的网络社区子图,并将所述模块度大于所述模块度阈值的网络社区子图作为所述初始网络社区子图。
6.根据权利要求1所述的方法,其特征在于,所述根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网络社区子图,包括:
获取所述可疑度大于所述可疑度阈值的初始网络社区子图,并将所述可疑度大于所述可疑度阈值的初始网络社区子图作为所述目标网络社区子图。
7.一种刷单检测装置,其特征在于,包括:
社区子图生成模块,用于根据用户和业务方之间的交互行为数据,生成多个网络社区子图;
初始社区确定模块,用于根据所述网络社区子图的模块度和预设的模块度阈值,确定初始网络社区子图;
可疑度获取模块,用于获取所述初始网络社区子图对应的可疑度;
目标子图确定模块,用于根据所述可疑度和预设的可疑度阈值,确定存在刷单行为的目标网路社区子图。
8.根据权利要求7所述的装置,其特征在于,所述社区子图生成模块包括:
关联网络建立单元,用于根据所述交互行为数据建立关联网络,所述关联网络包括多个节点以及连接所述多个节点的多条边,所述边附带用于描述所述用户和所述业务方之间的交互行为的紧密程度的权重;
社区子图划分单元,用于通过预设的标签传播算法根据所述多条边的权重将所述关联网络划分为多个网络社区子图。
9.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的刷单检测方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1至6中任一项所述的刷单检测方法。
CN202010814500.4A 2020-08-13 2020-08-13 刷单检测方法、装置、电子设备及可读存储介质 Pending CN112116377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010814500.4A CN112116377A (zh) 2020-08-13 2020-08-13 刷单检测方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010814500.4A CN112116377A (zh) 2020-08-13 2020-08-13 刷单检测方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112116377A true CN112116377A (zh) 2020-12-22

Family

ID=73804130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010814500.4A Pending CN112116377A (zh) 2020-08-13 2020-08-13 刷单检测方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112116377A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112700261A (zh) * 2020-12-30 2021-04-23 平安科技(深圳)有限公司 基于可疑社团的刷单行为检测方法、装置、设备及介质
CN113988718A (zh) * 2021-12-23 2022-01-28 支付宝(杭州)信息技术有限公司 一种风险识别方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112700261A (zh) * 2020-12-30 2021-04-23 平安科技(深圳)有限公司 基于可疑社团的刷单行为检测方法、装置、设备及介质
CN112700261B (zh) * 2020-12-30 2023-06-06 平安科技(深圳)有限公司 基于可疑社团的刷单行为检测方法、装置、设备及介质
CN113988718A (zh) * 2021-12-23 2022-01-28 支付宝(杭州)信息技术有限公司 一种风险识别方法、装置及设备

Similar Documents

Publication Publication Date Title
CN109271418B (zh) 可疑团伙识别方法、装置、设备及计算机可读存储介质
US10872298B2 (en) Machine learning and prediction using graph communities
US9563921B2 (en) System and method for detecting merchant points of compromise using network analysis and modeling
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN112231570B (zh) 推荐系统托攻击检测方法、装置、设备及存储介质
US20090177508A1 (en) Validation framework for service oriented architecture (soa) application adoption
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN110009365B (zh) 非正常转移电子资产的用户群体检测方法、装置和设备
Sadiq et al. Fraud detection model based on multi-verse features extraction approach for smart city applications
CN112116377A (zh) 刷单检测方法、装置、电子设备及可读存储介质
CN113139654A (zh) 图神经网络模型的训练方法及装置
CN109102324B (zh) 模型训练方法、基于模型的红包物料铺设预测方法及装置
CN108182587A (zh) 一种电商平台刷单行为检测方法及系统
CN111198967A (zh) 基于关系图谱的用户分组方法、装置及电子设备
CN111612085A (zh) 一种对等组中异常点的检测方法及装置
CN107798558A (zh) 用户行为数据分析方法及服务器
CN112700261B (zh) 基于可疑社团的刷单行为检测方法、装置、设备及介质
US20230281696A1 (en) Method and apparatus for detecting false transaction order
CN107784507A (zh) 疑似侵权商品预警方法及装置、计算机存储介质及设备
CN107577943A (zh) 基于机器学习的样本预测方法、装置及服务器
Das et al. Order fulfillment under pick failure in omnichannel ship-from-store programs
CN111259242B (zh) 数据处理方法、装置、存储介质及设备
CN111026973B (zh) 一种商品兴趣度预测方法、装置及电子设备
CN112085554A (zh) 推荐理由生成方法、装置、电子设备及可读存储介质
CN110619564B (zh) 一种反欺诈特征生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201222