CN114003648B - 风险交易团伙的识别方法、装置、电子设备与存储介质 - Google Patents
风险交易团伙的识别方法、装置、电子设备与存储介质 Download PDFInfo
- Publication number
- CN114003648B CN114003648B CN202111223443.3A CN202111223443A CN114003648B CN 114003648 B CN114003648 B CN 114003648B CN 202111223443 A CN202111223443 A CN 202111223443A CN 114003648 B CN114003648 B CN 114003648B
- Authority
- CN
- China
- Prior art keywords
- user
- graph
- role
- partner
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000010586 diagram Methods 0.000 claims abstract description 101
- 230000006399 behavior Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 22
- 238000001514 detection method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000005096 rolling process Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 208000001613 Gambling Diseases 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 101000830933 Homo sapiens TNF receptor-associated factor 4 Proteins 0.000 description 4
- 102100024809 TNF receptor-associated factor 4 Human genes 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种风险交易团伙的识别方法、装置、电子设备与存储介质。所述方法可以包括:获取团伙模板图;构建与待识别的多个用户对象对应的用户角色关系图;所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
Description
技术领域
本申请一个或多个实施例涉及网络业务风险识别领域,尤其涉及一种风险交易团伙的识别方法、装置、电子设备与存储介质。
背景技术
金融交易业务场景中,常见的风险交易有赌博、套现、传销、非法集资等。执行所述风险交易需要明确的组织分工。风险交易团伙(执行风险交易的团伙,以下简称团伙)中不同团伙角色的成员协作进行风险交易活动,影响范围大、危害程度高。可见,需要识别风险交易团伙(以下简称团伙),以打击风险交易。
当前的团伙的识别主要采取关系扩展的方法:即针对某个成员扩展出与之有关的所有成员,并根据成员的交易行为逐个判断并删减,然后针对扩展的成员再次扩展;以此类推,直至扩展得到的团伙。该方法主观性较强,得到的团伙精准率较低,需要耗费较多人力成本进行删减和扩展客户,不具备自动化团伙识别的能力。
发明内容
有鉴于此,本申请一个或多个实施例提供了一种风险交易团伙的识别方法。所述方法可以包括:获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边;构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
在一些实施例中,所述构建与待识别的多个用户对象对应的用户角色关系图,包括:基于待识别的多个用户对象对应的交易数据,确定所述多个用户对象之间的关联关系,并对所述多个用户对象分别进行角色识别;根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合;根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系;将所述多个用户对象集合分别作为超点,并将所述多个用户对象集合之间的关联关系作为各超点之间边,得到所述用户角色关系图。
在一些实施例中,所述基于待识别的多个用户对象对应的交易数据,对所述多个用户对象分别进行角色识别,包括:基于多个用户对象对应的交易数据,生成与所述多个用户对象分别对应的行为特征;根据所述多个用户对象之间的关联关系,生成表征所述多个用户对象之间的关联关系的用户网络图;基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色。
在一些实施例中,所述基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色,包括:基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的角色概率;所述角色概率指示对应用户对象被预测为各种用户角色时的概率;分别检测所述多个用户对象是否满足预设约束规则,并基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率;基于调整后的所述多个用户对象分别对应的角色概率,确定所述多个用户对象分别对应的用户角色。
在一些实施例中,所述预设约束规则包括与已知用户角色的用户对象具有至少部分相同的用户信息;所述基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率,包括:响应于所述多个用户中的目标用户满足所述预设约束规则,增加所述目标用户被预测为所述已知用户角色的概率;响应于所述多个用户中的目标用户不满足所述预设约束规则,降低所述目标用户被预测为所述已知用户角色的概率。
在一些实施例中,所述用户信息包括以下至少一项:设备MAC,设备IP,设备ID。
在一些实施例中,所述根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合,包括:根据所述角色识别的识别结果,获取所述多个用户对象中具有所述团伙模板图中的团伙角色的疑似团伙成员对象,并将具有相同的团伙角色的疑似团伙成员对象进行分组,得到分别对应不同的团伙角色的多个成员分组;基于社区发现算法,分别对所述多个成员分组进行社区划分,以将所述多个成员分组中的各成员分组进一步划分成对应的团伙角色相同的多个用户对象集合。
在一些实施例中,所述根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系,包括:响应于所述多个用户对象集合中的任意两个用户对象集合之间存在具有关联关系的用户对象,确定所述两个用户对象集合之间具有关联关系。
在一些实施例中,所述将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图,包括:将所述用户角色关系图包括的多个超点依次作为第一超点,并执行:A,在所述团伙模板图中查找与所述第一超点对应的第一用户角色相邻的第二用户角色,并确定所述用户角色关系图中与所述第一超点通过边连接的关联超点中,对应的用户角色为所述第二用户角色的第二超点;B,在所述团伙模板图中查找与所述第二用户角色相邻的第三用户角色,并确定所述用户角色关系图中与所述第二超点通过边连接的关联超点中,对应的用户角色为所述第三用户角色的第三超点,以此类推,直至查找到了包含所述第一超点在内的,与所述团伙模板图中的各个团伙角色分别对应的多个超点的情形下,基于该多个超点得到用户角色关系子图。
在一些实施例中,所述将所述用户角色关系子图中的各超点包括的各用户对象集合内的用户对象识别为同一团伙,包括:如果查找到了多个用户角色关系子图,确定多个所述用户角色关系子图中是否包括,具有相同超点的用户角色关系子图;如果是,将所述具有至少一个相同超点的用户角色关系子图进行合并,并将合并后的用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
在一些实施例中,所述团伙模板图包括基于针对团伙的历史审理结果生成的团伙角色关系图;所述多种团伙角色之间的关联关系指示所述多种团伙角色之间的分工关系。
本申请还提出一种风险交易团伙的识别装置,所述装置包括:获取模块,获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边;构建模块,构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;子图匹配模块,将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;识别模块,如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
本申请还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现如前述任一实施例示出的风险交易团伙的识别方法。
本申请还提出一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于使处理器执行如前述任一实施例示出的风险交易团伙的识别方法。
在前述任一实施例示出的技术方案中,可以通过构建用户角色关系图,并在所述用户角色关系图中找到与团伙模板图结构相同的用户角色关系子图,以及将所述用户角色关系子图内的超点包括的用户对象集合内的用户对象即为同一团伙,从而可以基于团伙模板图匹配的方式自动化地,客观精准地,快速高效地识别出团伙,高效防控犯罪行为。
附图说明
图1为本申请示出的一种团伙模板图结构示意图。
图2为本申请示出的一种风险交易团伙的识别方法的方法流程图。
图3为本申请示出的一种用户角色关系图生成方法流程示意图。
图4为本申请示出的一种角色识别方法流程示意图。
图5为本申请示出的一种角色识别方法流程示意图。
图6为本申请示出的一种第三网络的结构示意图。
图7为本申请示出的一种用户对象分组方法的方法流程示意图。
图8为本申请示出的一种团伙识别方法应用场景示意图。
图9为本申请示出的一种团伙识别方法流程示意图。
图10为本申请示出的一种风险交易团伙的识别装置的结果示意图。
图11为本申请示出的一种电子设备的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施例并不代表与本申请一个或多个实施例相一致的所有实施例。相反,它们仅是与如所附权利要求书中所详述的、本申请一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本申请示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本申请所描述的更多或更少。此外,本申请中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本申请中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
本申请的提供了一种风险交易团伙的识别方法。该方法通过构建用户角色关系图,并在所述用户角色关系图中找到与团伙模板图结构相同的用户角色关系子图,以及将所述用户角色关系子图内的超点包括的用户对象集合内的用户对象即为同一团伙,从而可以基于团伙模板图匹配的方式自动化地,客观精准地,快速高效地识别出团伙,高效防控犯罪行为。
所述识别方法可以应用于电子设备中。其中,所述电子设备可以通过搭载与识别方法对应的软件装置执行所述方法。所述电子设备的类型可以是笔记本电脑,计算机,服务器,手机,PAD终端等。本申请不对所述电子设备的具体类型进行特别限定。可以理解的是,所述电子设备可以是客户端或服务端一侧的设备。所述服务端可以是由服务器、服务器集群或分布式服务器集群提供的服务端或云端。以下以执行主体为交易服务设备(以下简称设备)为例进行说明。
所述团伙中可以包括多种团伙角色的成员。这些团伙角色可以构成团伙模板图。所述团伙模板图表征所述多种团伙角色之间的关联关系。在一些实施例中,所述多种团伙角色之间的关联关系指示所述多种团伙角色之间的分工关系。
在不同风险交易类型的团伙中,具有不同的团伙模板。请参见图1,图1为本申请示出的一种团伙模板图结构示意图。
在团伙赌博业务中,团伙角色可以包括赌徒(以下称为角色O)、资金汇集方(以下称为角色P)、资金流转方(以下称为角色Q)、资金抽离方(以下称为角色R)、资金提取方(角色S)等五种角色。其中角色P负责从角色O中归集资金,角色Q负责将资金在赌博团伙内部流转,角色R将资金提取到角色S进行变现。如图1所示,角色O与角色P之间有关联关系(可以理解为分工关系),角色P分别与角色Q和角色R有关联关系(可以理解为分工关系),角色Q和角色R分别与角色S有关联关系(可以理解为分工关系)。通过团伙模板匹配,可以从参与交易的用户中,获取具有清晰的团伙结构的团伙组织。
请参见图2,图2为本申请示出的一种风险交易团伙的识别方法的方法流程图。
如图2所示,所述方法包括S202-S208。除特别说明外,本申请不特别限定这些步骤的执行顺序。
其中,S202,获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边。
所示团伙模板图,用于指示团伙模板结构。在一些实施例中,所述团伙模板图包括基于针对团伙的历史审理结果生成的团伙角色关系图。所述多种团伙角色之间的关联关系指示所述多种团伙角色之间的分工关系。例如,在针对团伙的历史审理结果中,可以筛选出具有分工关系的多个团伙成员,将这些团伙成员对应的团伙角色作为节点,团伙角色之间的分工关系作为边,生成团伙模板图。
S204,构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合。
所述用户对象可以指示参与交易的用户。例如,所述用户对象可以是用户账户,用户钱包,用户ID等。
在S204中,可以根据多个用户对象的用户角色,以及多个用户对象之间的关联关系,生成所述用户角色关系图。
所述用户角色关系图可以包括多种用户角色,所述多种用户角色之间具有关联关系。其中,每一中用户角色内可能包括至少一个用户对象。所述用户对象可以指示参与交易的用户。例如,所述用户对象可以是用户账户,用户钱包,用户ID等。在一些实施例中,为了缩小运算量,所述用户角色关系图中可以只包括具有所述团伙模板图中的团伙角色的疑似团伙成员对象。
可以理解为所述用户角色关系图中的若干种用户角色之间可能具有团伙模板图示出的团伙模板结构。即所述若干种用户角色与所述团伙模板图中的团伙角色相同,且所述若干中用户角色之间的关联关系与对应的团伙角色之间的关联关系相同。
S206,将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图。
所述结构相同是指所述用户角色关系子图中的各超点对应的用户角色与所述团伙模板中对应节点的团伙角色相同,以及所述各超点之间的关联关系与所述团伙模板图中对应节点之间的关联关系相同。
S206中可以采用子图匹配算法,完成所述子图匹配。本申请不限定子图匹配算法的具体类型。例如,所述子图匹配算法可以是暴力匹配,递归匹配等方式。
S208,如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,可以说明确实存在团伙。所述用户角色关系子图的结构与所述团伙模板图结构相同,则可以说明所述用户角色子图内包含的用户对象即为团伙,即可将所述用户角色子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
在S202-S208示出的方案中,可以通过构建用户角色关系图,并在所述用户角色关系图中找到与团伙模板图结构相同的用户角色关系子图,以及将所述用户角色关系子图内的超点包括的用户对象集合内的用户对象即为同一团伙,从而可以基于团伙模板图匹配的方式自动化地,客观精准地,快速高效地识别出团伙,高效防控犯罪行为。
在一些实施例中,可以根据S202-S208的步骤进行团伙识别。以下不对S202-S208的步骤进行重复说明。
其中,在S204中,可以根据多个用户对象的用户角色,以及多个用户对象之间的关联关系,生成所述用户角色关系图。
请参见图3,图3为本申请示出的一种用户角色关系图生成方法流程示意图。图3示出的方法为对S204的相关说明。如图3所述,所述方法可以包括S302-S308。除特别说明外,本申请不特别限定这些步骤的执行顺序。
S302,基于待识别的多个用户对象对应的交易数据,确定所述多个用户对象之间的关联关系,并对所述多个用户对象分别进行角色识别。
所述交易数据,可以是在交易业务中,由用户对象发起的交易数据。所述用户对象可以是参与交易的用户。所述用户对象通常可以使用终端(例如手机或电脑)完成交易业务,从而产生交易数据。从所述交易数据中,可以挖掘出与表征各用户交易行为的行为特征,以及用户与用户之间的关联关系。
可以根据业务需求进行定义所述多个用户对象之间的关联关系。在一些实施例中,可以将具有资金往来关系的用户、使用网络地址相同或相近的网络设备进行交易的用户,使用硬件地址相同的计算设备的用户之间确定为具有关联关系。在本申请中,可以通过预设的方式量化关联关系强度。
在一些实施例中,可以利用基于神经网络生成的角色识别网络,对所述多个用户对象分别进行角色识别。可以采用标注了用户角色信息的用户样本,对所述角色识别网络进行训练。完成训练后,即可部署该角色识别网络进行角色识别。
S304,根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合。
在一些实施例中,所述用户角色关系图中可以只包括具有所述团伙模板图中的团伙角色的疑似团伙成员对象。在304中,可以根据所述角色识别的识别结果,获取所述多个用户对象中具有所述团伙模板图中的团伙角色的疑似团伙成员对象。然后针对每一团伙角色设置分组阈值。然后将每一团伙角色中关联关系强度达到该分组阈值的疑似团伙成员对象可以组合为一个用户对象集合。由此,可以得到分别对应一种团伙角色的多个用户对象集合,以将同一团伙角色中,关联性比较强的疑似团伙成员对象划分至一个用户对象分组。
S306,根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系。
由于用户对象之间具有关联关系,分组之后的用户对象集合之间也会存在某种关联关系。在一些实施例中,可以响应于所述多个用户对象集合中的任意两个用户对象集合之间存在具有关联关系的用户对象,确定所述两个用户对象集合之间具有关联关系。由此可以确定多个用户对象集合之间的关联关系。
S308,将所述多个用户对象集合分别作为超点,并将所述多个用户对象集合之间的关联关系作为各超点之间边,得到所述用户角色关系图。
根据S302-S308记载的步骤即可根据多个用户对象的用户角色,以及多个用户对象之间的关联关系,生成所述用户角色关系图。
在一些实施例中,在S302中,可以利用用户对象之间的关联关系,采用图卷积的方式进行角色识别,提升用户角色识别的准确性。
请参见图4,图4为本申请示出的一种角色识别方法流程示意图。图4示出的步骤为对S302的补充说明。如图4所示,所述方法可以包括S402-S406。除特别说明外,本申请不特别限定这些步骤的执行顺序。
S402,基于多个用户对象对应的交易数据,生成与所述多个用户对象分别对应的行为特征。
所述行为特征可以基于交易数据得到的向量或矩阵形式的表达。该行为特征可以作为角色识别网络的输入。
S404,根据所述多个用户对象之间的关联关系,生成表征所述多个用户对象之间的关联关系的用户网络图。
所述用户网络图是一种数据结构图。该图中的节点可以是用户对象,节点之间的边可以是用户对象之间的关联关系。通过该用户网络图可以得到与各用户对象对应的邻接矩阵。所述连接矩阵可以作为角色识别网络的输入。
S406,基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色。
在一些实施例中,可以所述角色识别网络可以基于图卷积网络(GraphConvolutional Network,GCN)构建。以下将基于GCN生成的角色识别网络称为第二网络。在训练所述第二网络时,可以通过多个标注了用户角色的用户对象样本进行有监督训练;所述用户对象样本包括用户行为特征和表征用户之间关联关系的邻接矩阵。
完成训练后,可以基于所述用户网络图得到与各用户对象对应的邻接矩阵,并将所述连接矩阵与所述行为特征输入所述第二网络进行图卷积处理,得到所述多个用户对象分别对应的用户角色。
由此,可以结合用户之间的关联关系进行用户角色识别,更加符合实际情形,从而提升用户角色识别准确性,进而提升团伙识别准确性。
在一些实施例中,在S406利用图卷积得到用户角色的过程中,还可以结合约束规则,进行用户角色识别,提升角色设备准确性,进而提升团伙识别准确性。
请参见图5,图5为本申请示出的一种角色识别方法流程示意图。图5示出的方法为对S406的补充说明。如图5所示,所述方法可以包括S502-S506。除特别说明外,本申请不特别限定这些步骤的执行顺序。
S502,基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的角色概率;所述角色概率指示对应用户对象被预测为各种用户角色时的概率。
S504,分别检测所述多个用户对象是否满足预设约束规则,并基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率。
所述预设约束规则,可以是与实际情形相符的一些规则。这类规则可以用于辅助角色识别。
在一些实施例中,所述预设约束规则包括与已知用户角色的用户对象具有至少部分相同的用户信息。例如,所述用户信息包括以下至少一项:设备MAC,设备IP,设备ID。
响应于所述多个用户中的目标用户满足所述预设约束规则,增加所述目标用户被预测为所述已知用户角色的概率;响应于所述多个用户中的目标用户不满足所述预设约束规则,降低所述目标用户被预测为所述已知用户角色的概率。
例如,所述约束规则可以是,将待识别用户具有的特性与已知角色的用户的特性进行比较,如果二者相同,则说明该待识别用户可能与已知角色的用户的角色相同。因此,可以提高将待识别用户预测为该已知角色的概率。如果二者不同,则说明该待识别用户可能与已知角色的用户的角色不相同。因此,可以阶段将待识别用户预测为该已知角色的概率。
S506,基于调整后的所述多个用户对象分别对应的角色概率,确定所述多个用户对象分别对应的用户角色。
S506中,可以将最大角色概率对应的用户角色识别为用户对象的用户角色。
通过S502-S506示出的步骤,可以在利用图卷积确定用户角色的过程中结合约束规则,提升角色设备准确性,进而提升团伙识别准确性。
以下结合例子进行S502-S506的说明。本例中,角色识别网络(以下称为第三识别网络)为基于GCN与马尔科夫逻辑网络(Markov logic network,MLN)生成的网络。以下将基于GCN与MLN生成的角色识别网络称为第三网络。当然也可以采用其他类型的逻辑判断网络生成角色识别网络。
请参见图6,图6为本申请示出的一种第三网络的结构示意图。
如图6示出的第三网络60可以GCN61与MLN62。其中GCN61的输出为MLN62的输入。GCN61用于对用户的行为特征进行图卷积,得到各用户对应的角色概率。所述角色概率指示对应用户被预测为各种角色时的概率。
所述MLN62包括若干预设约束规则,这些约束规则可以通过数学算式进行表达。所述MLN62可以根据针对各用户的约束规则检测结果,调整各用户对应的角色概率,从而可以结合多种规则,得到更准确的角色识别结果。
由此,一方面可以结合约束规则,进行用户角色识别,提升角色设备准确性,进而提升团伙识别准确性;另一方面,可以利用MLN网络训练需要标注样本较少,容易训练的特点,辅助GCN网络的训练,从而提升网络训练效率。
在一些实施例中,在S304对用户对象进行分组的过程中,可以通过社区算法进行分组,使得分组内的用户对象连接紧密,组与组之间的连接比较弱,从而提升分组准确性,进而提升团伙识别准确性。
请参见图7,图7为本申请示出的一种用户对象分组方法的方法流程示意图。图7示出的方法为对S304的相关说明。如图7所述,所述方法可以包括S702-S704。除特别说明外,本申请不特别限定这些步骤的执行顺序。
S702,根据所述角色识别的识别结果,获取所述多个用户对象中具有所述团伙模板图中的团伙角色的疑似团伙成员对象,并将具有相同的团伙角色的疑似团伙成员对象进行分组,得到分别对应不同的团伙角色的多个成员分组。
例如,团伙角色包括赌徒,资金汇集方,资金流转方,资金抽离方,自己提取方五种角色。可以先从多个用户对象中,识别出用户角色为该五种角色的疑似团伙成员对象。
然后根据5种角色进行对象分组,得到分别对应5种团伙角色的成员分组。
S704,基于社区发现算法,分别对所述多个成员分组进行社区划分,以将所述多个成员分组中的各成员分组进一步划分成对应的团伙角色相同的多个用户对象集合。
在S704中,在社区发现算法中,可以分别针对每一所述成员分组,得到模块度最大时对应的社区划分结果。所述社区划分结果包括针对每一所述成员分组进行社区划分得到的多个用户对象集合。
所述模块度可以表征分组内部各成员之间的关联强度,和不同分组之间的关联强度。模块度越大,说明组内连接越紧密,组与组时间联系越弱。
由此通过S702-S704示出的社区划分算法,可以进行精准分组划分,得到多个组内成员关联紧密的用户对象分组。
在一些实施例中,可以根据S202-S208的步骤进行团伙识别。以下不对S202-S208的步骤进行重复说明。
其中,在S206中,可以采用递归匹配(Recursive Maching)算法,从具有关联关系的多个团伙成员分组中,匹配到具有团伙模板图结构的用户角色关系子图。
在一些实施例中,可以将所述用户角色关系图包括的多个超点依次作为第一超点,并执行:
A,在所述团伙模板图中查找与所述第一超点对应的第一用户角色相邻的第二用户角色,并确定所述用户角色关系图中与所述第一超点通过边连接的关联超点中,对应的用户角色为所述第二用户角色的第二超点;
B,在所述团伙模板图中查找与所述第二用户角色相邻的第三用户角色,并确定所述用户角色关系图中与所述第二超点通过边连接的关联超点中,对应的用户角色为所述第三用户角色的第三超点,以此类推,直至查找到了包含所述第一超点在内的,与所述团伙模板图中的各个团伙角色分别对应的多个超点的情形下,基于该多个超点得到用户角色关系子图。
所述用户角色关系子图的结构与所述团伙模板图的结构相同。所述用户角色关系子图包含的多个超点对应的用户角色与与所述团伙模板中对应节点的团伙角色相同,所述多个超点之间的关联关系与所述团伙模板图中对应节点之间的关联关系相同。
以团伙模板图具有图1示出的结构为例。可以一次将所述用户角色关系图包括的多个超点依次作为第一超点,并执行步骤A和步骤B。
在步骤A中,可以先确定第一点通过边连接的关联超点中,找到用户角色分别为赌徒O、抽离方R和流转方Q的超点对应的第一用户角色。假设该第一用户角色为汇集方P。然后根据图1可以得到第二用户角色为赌徒O、抽离方R和流转方Q。之后可以从用户角色关系图中与所述第一超作为第二超点。
在步骤B中,可以根据图1,分别确定与赌徒O、抽离方R和流转方Q相邻的第三用户角色。所述第三用户角色不可以是所述第一用户角色。根据图1,赌徒O没有相邻角色,抽离方R和流转方Q的向量角色为提取方S。然后可以从所述用户角色关系图中与所述第二超点通过边连接的关联超点中,找到用户角色为提取方S的超点作为第三超点。此时根据步骤A与步骤B已经找到包含所述第一超点在内,且与所述团伙模板图中的各个团伙角色分别对应的多个超点,可以将找到对的多个超点以及该多个超点之间的边确定为一个用户角色关系子图。
在前述子图匹配方法中,可以采用递归匹配算法,从具有关联关系的多个团伙成员分组中,精准匹配到具有团伙模板图结构的用户角色关系子图。
由于采用递归匹配方式可能得到重复的用户角色关系子图,因此如果查找到了多个用户角色关系子图,确定多个所述用户角色关系子图中是否包括,具有相同超点的用户角色关系子图;如果是,将所述具有至少一个相同超点的用户角色关系子图进行合并,并将合并后的用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。由此可以将相同的用户角色关系子图进行合并,避免重复针对相同的用户对象子图进行团伙识别。
以下结合赌博团伙识别场景进行实施例说明。
请参见图8,图8为本申请示出的一种团伙识别方法应用场景示意图。终端81位于用户侧,与网络侧的交易服务设备82通信。终端81中的业务处理客户端可以是基于互联网实现赌博业务的APP或网站,为用户提供赌博交易的界面并将交易数据提供给网络侧进行处理;服务设备82中的团伙识别系统用于对多个用户的角色进行识别以及进行团伙模板匹配,得到团伙。本例中执行主体为服务设备(简称设备)。
示例性的,所述赌博团伙具有如图1所示的团伙模板与。赌博团伙包括赌徒(以下称为角色O)、资金汇集方(以下称为角色P)、资金流转方(以下称为角色Q)、资金抽离方(以下称为角色R),资金提取方(角色S)等四种角色。如图1所示,角色O与角色P之间有相邻关系,角色P分别与角色Q和角色R有相邻关系,角色Q和角色R分别与角色S有相邻关系。
客户端一侧可以将用户交易数据发送至所述设备,以使所述设备进行团伙识别。
请参见图9,图9为本申请示出的一种团伙识别方法流程示意图。
所述设备可以执行S91,根据用户交易数据,构建用户网络图。图9示出的用户网络图包括若干用户节点。
然后可以执行S92,通过搭载的第三网络,对各用户进行角色识别,得到各用户对应的角色,筛选出具有所述团伙角色的疑似团伙成员(简称成员)。
所述第三网络基于GCN与马尔科夫逻辑网络(Markov logic network,MLN)生成。该网络预先经过标注了用户角色信息的用户样本进行有监督训练得到。图9示出的成员已经按照团伙角色进行分组。可以理解的是图9仅为更好的理解实施例,在实际情形中可以不进行所述分组操作。在本步骤中,采用第三网络进行角色识别,可以结合规则约束,以及用户之间的关联关系,使预测结果更贴近真实情形,从而提升角色识别准确性。
之后可以执行S93,可以利用社区发现算法,将同一同伙角色中的成员进行分组,得到多个成员分组(简称分组),并确定分组之间的关联关系。本步骤的相关说明可以参照前述S702-S704,在此不做详述。
图9示出的团伙划分结果中,采用封闭实线圈中的成员则为一个成员分组。在本步骤中,通过社区发现算法,可以得到分组内部联系紧密,分组之间联系较弱的多个团伙成员分组,符合实际情形中,团伙之间关联紧密的特性,从而提升团伙划分准确性。
通过S91-S93可以得到用户角色关系图。用户角色关系图中的超点即为所述成员分组,超点对应的用户角色即为对应成员分组的用户角色。超点之间的边标识对应成员分组之间基于关联关系。
最后可以执行S94,可以利用递归匹配算法,在用户角色关系图进行子图匹配,得到与所述团伙模板图结构相同的用户角色关系子图;
如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙得到的多个分组中进行团伙模板匹配,得到多个团伙。
由此可以基于团伙模板图匹配的方式自动化地,客观精准地,快速高效地识别出团伙,高效防控犯罪行为。
与所述实施例相应的,本申请提出一种风险交易团伙的识别装置。请参见图10,图10为本申请示出的一种风险交易团伙的识别装置的结果示意图。
如图10所示,所述装置1000可以包括:
获取模块1010,获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边;
构建模块1020,构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;
子图匹配模块1030,将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;
识别模块1040,如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
在一些实施例中,所述构建模块1020,具体用于:
基于待识别的多个用户对象对应的交易数据,确定所述多个用户对象之间的关联关系,并对所述多个用户对象分别进行角色识别;
根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合;
根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系;
将所述多个用户对象集合分别作为超点,并将所述多个用户对象集合之间的关联关系作为各超点之间边,得到所述用户角色关系图。
在一些实施例中,所述构建模块1020,具体用于:
基于多个用户对象对应的交易数据,生成与所述多个用户对象分别对应的行为特征;
根据所述多个用户对象之间的关联关系,生成表征所述多个用户对象之间的关联关系的用户网络图;
基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色。
在一些实施例中,所述构建模块1020,具体用于:
基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的角色概率;所述角色概率指示对应用户对象被预测为各种用户角色时的概率;
分别检测所述多个用户对象是否满足预设约束规则,并基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率;
基于调整后的所述多个用户对象分别对应的角色概率,确定所述多个用户对象分别对应的用户角色。
在一些实施例中,所述预设约束规则包括与已知用户角色的用户对象具有至少部分相同的用户信息;所述构建模块1020,具体用于:
响应于所述多个用户中的目标用户满足所述预设约束规则,增加所述目标用户被预测为所述已知用户角色的概率;
响应于所述多个用户中的目标用户不满足所述预设约束规则,降低所述目标用户被预测为所述已知用户角色的概率。
在一些实施例中,所述用户信息包括以下至少一项:设备MAC,设备IP,设备ID。
在一些实施例中,所述构建模块1020,具体用于:
根据所述角色识别的识别结果,获取所述多个用户对象中具有所述团伙模板图中的团伙角色的疑似团伙成员对象,并将具有相同的团伙角色的疑似团伙成员对象进行分组,得到分别对应不同的团伙角色的多个成员分组;
基于社区发现算法,分别对所述多个成员分组进行社区划分,以将所述多个成员分组中的各成员分组进一步划分成对应的团伙角色相同的多个用户对象集合。
在一些实施例中,所述构建模块1020,具体用于:
响应于所述多个用户对象集合中的任意两个用户对象集合之间存在具有关联关系的用户对象,确定所述两个用户对象集合之间具有关联关系。
在一些实施例中,所述子图匹配模块1030具体用于:
将所述用户角色关系图包括的多个超点依次作为第一超点,并执行:
A,在所述团伙模板图中查找与所述第一超点对应的第一用户角色相邻的第二用户角色,并确定所述用户角色关系图中与所述第一超点通过边连接的关联超点中,对应的用户角色为所述第二用户角色的第二超点;
B,在所述团伙模板图中查找与所述第二用户角色相邻的第三用户角色,并确定所述用户角色关系图中与所述第二超点通过边连接的关联超点中,对应的用户角色为所述第三用户角色的第三超点,以此类推,直至查找到了包含所述第一超点在内的,与所述团伙模板图中的各个团伙角色分别对应的多个超点的情形下,基于该多个超点得到用户角色关系子图。
在一些实施例中,所述识别模块1040具体用于:
如果查找到了多个用户角色关系子图,确定多个所述用户角色关系子图中是否包括,具有相同超点的用户角色关系子图;
如果是,将所述具有至少一个相同超点的用户角色关系子图进行合并,并将合并后的用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
在一些实施例中,所述团伙模板图包括基于针对团伙的历史审理结果生成的团伙角色关系图;所述多种团伙角色之间的关联关系指示所述多种团伙角色之间的分工关系。
本申请示出的风险交易团伙的识别装置的实施例可以应用于电子设备上。相应地,本申请公开了一种电子设备,该设备可以包括:处理器。
用于存储处理器可执行指令的存储器。
其中,所述处理器被配置为调用所述存储器中存储的可执行指令,实现前述任一实施例示出的风险交易团伙的识别方法。
请参见图11,图11为本申请示出的一种电子设备的硬件结构示意图。
如图11所示,该电子设备可以包括用于执行指令的处理器,用于进行网络连接的网络接口,用于为处理器存储运行数据的内存,以及用于存储风险交易团伙的识别装置对应指令的非易失性存储器。
其中,所述装置的实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了图11所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
可以理解的是,为了提升处理速度,风险交易团伙的识别装置对应指令也可以直接存储于内存中,在此不作限定。
本申请提出一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可以用于使处理器执行如前述任一实施例示出的风险交易团伙的识别方法。
本领域技术人员应明白,本申请一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本申请一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(可以包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请中记载的“和/或”表示至少具有两者中的其中一个,例如,“A和/或B”包括三种方案:A、B、以及“A和B”。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
所述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本申请中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本申请中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本申请中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理系统。通常,中央处理系统将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理系统以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及0xCD_00ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本申请包含许多具体实施细节,但是这些不应被解释为限制任何公开的范围或所要求保护的范围,而是主要用于描述特定公开的具体实施例的特征。本申请内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,所述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上仅为本申请一个或多个实施例的较佳实施例而已,并不用以限制本申请一个或多个实施例,凡在本申请一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请一个或多个实施例保护的范围之内。
Claims (14)
1.一种风险交易团伙的识别方法;所述方法包括:
获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边;
构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;
将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;
如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
2.根据权利要求1所述的方法,所述构建与待识别的多个用户对象对应的用户角色关系图,包括:
基于待识别的多个用户对象对应的交易数据,确定所述多个用户对象之间的关联关系,并对所述多个用户对象分别进行角色识别;
根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合;
根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系;
将所述多个用户对象集合分别作为超点,并将所述多个用户对象集合之间的关联关系作为各超点之间边,得到所述用户角色关系图。
3.根据权利要求2所述的方法,所述基于待识别的多个用户对象对应的交易数据,对所述多个用户对象分别进行角色识别,包括:
基于多个用户对象对应的交易数据,生成与所述多个用户对象分别对应的行为特征;
根据所述多个用户对象之间的关联关系,生成表征所述多个用户对象之间的关联关系的用户网络图;
基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色。
4.根据权利要求3所述的方法,所述基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的用户角色,包括:
基于所述用户网络图以及与所述行为特征进行图卷积处理,得到所述多个用户对象分别对应的角色概率;所述角色概率指示对应用户对象被预测为各种用户角色时的概率;
分别检测所述多个用户对象是否满足预设约束规则,并基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率;
基于调整后的所述多个用户对象分别对应的角色概率,确定所述多个用户对象分别对应的用户角色。
5.根据权利要求4所述的方法,所述预设约束规则包括与已知用户角色的用户对象具有至少部分相同的用户信息;
所述基于所述检测的检测结果,调整所述多个用户对象分别对应的角色概率,包括:
响应于所述多个用户中的目标用户满足所述预设约束规则,增加所述目标用户被预测为所述已知用户角色的概率;
响应于所述多个用户中的目标用户不满足所述预设约束规则,降低所述目标用户被预测为所述已知用户角色的概率。
6.根据权利要求5所述的方法,所述用户信息包括以下至少一项:设备MAC,设备IP,设备ID。
7.根据权利要求2所述的方法,所述根据所述角色识别的识别结果,对所述多个用户对象进行分组,得到分别对应一种用户角色的多个用户对象集合,包括:
根据所述角色识别的识别结果,获取所述多个用户对象中具有所述团伙模板图中的团伙角色的疑似团伙成员对象,并将具有相同的团伙角色的疑似团伙成员对象进行分组,得到分别对应不同的团伙角色的多个成员分组;
基于社区发现算法,分别对所述多个成员分组进行社区划分,以将所述多个成员分组中的各成员分组进一步划分成对应的团伙角色相同的多个用户对象集合。
8.根据权利要求2所述的方法,所述根据所述多个用户对象之间的关联关系,进一步确定多个用户对象集合之间的关联关系,包括:
响应于所述多个用户对象集合中的任意两个用户对象集合之间存在具有关联关系的用户对象,确定所述两个用户对象集合之间具有关联关系。
9.根据权利要求1所述的方法,所述将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图,包括:
将所述用户角色关系图包括的多个超点依次作为第一超点,并执行:
A,在所述团伙模板图中查找与所述第一超点对应的第一用户角色相邻的第二用户角色,并确定所述用户角色关系图中与所述第一超点通过边连接的关联超点中,对应的用户角色为所述第二用户角色的第二超点;
B,在所述团伙模板图中查找与所述第二用户角色相邻的第三用户角色,并确定所述用户角色关系图中与所述第二超点通过边连接的关联超点中,对应的用户角色为所述第三用户角色的第三超点,以此类推,直至查找到了包含所述第一超点在内的,与所述团伙模板图中的各个团伙角色分别对应的多个超点的情形下,基于该多个超点得到用户角色关系子图。
10.根据权利要求1所述的方法,所述将所述用户角色关系子图中的各超点包括的各用户对象集合内的用户对象识别为同一团伙,包括:
如果查找到了多个用户角色关系子图,确定多个所述用户角色关系子图中是否包括,具有相同超点的用户角色关系子图;
如果是,将所述具有至少一个相同超点的用户角色关系子图进行合并,并将合并后的用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
11.根据权利要求1所述的方法,所述团伙模板图包括基于针对团伙的历史审理结果生成的团伙角色关系图;所述多种团伙角色之间的关联关系指示所述多种团伙角色之间的分工关系。
12.一种风险交易团伙的识别装置,所述装置包括:
获取模块,获取团伙模板图;所述团伙模板图包括与多种团伙角色分别对应的多个节点,以及指示所述多种团伙角色之间的关联关系的边;
构建模块,构建与待识别的多个用户对象对应的用户角色关系图;其中,所述用户角色关系图包括分别与一种用户角色对应的多个超点,以及指示所述多个超点之间的关联关系的边;所述超点包括由具有与该超点对应的用户角色的多个用户对象构成的用户对象集合;
子图匹配模块,将所述团伙模板图与所述用户角色关系图进行子图匹配,在所述用户角色关系图中查找与所述团伙模板图结构相同的用户角色关系子图;
识别模块,如果在所述用户角色关系图中查找到了与所述团伙模板图结构相同的用户角色关系子图,将所述用户角色关系子图中的各超点包括的用户对象集合内的用户对象识别为同一团伙。
13.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-11任一所述的风险交易团伙的识别方法。
14.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于使处理器执行如权利要求1-11任一所述的风险交易团伙的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111223443.3A CN114003648B (zh) | 2021-10-20 | 2021-10-20 | 风险交易团伙的识别方法、装置、电子设备与存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111223443.3A CN114003648B (zh) | 2021-10-20 | 2021-10-20 | 风险交易团伙的识别方法、装置、电子设备与存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114003648A CN114003648A (zh) | 2022-02-01 |
CN114003648B true CN114003648B (zh) | 2024-04-26 |
Family
ID=79923526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111223443.3A Active CN114003648B (zh) | 2021-10-20 | 2021-10-20 | 风险交易团伙的识别方法、装置、电子设备与存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114003648B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115018280A (zh) * | 2022-05-24 | 2022-09-06 | 支付宝(杭州)信息技术有限公司 | 风险图模式的挖掘方法、风险识别方法及对应装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874422A (zh) * | 2017-01-25 | 2017-06-20 | 东南大学 | 一种面向关系型数据库的图查询方法 |
CN109670937A (zh) * | 2018-09-26 | 2019-04-23 | 平安科技(深圳)有限公司 | 风险用户识别方法、用户设备、存储介质及装置 |
CN110046929A (zh) * | 2019-03-12 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN111339437A (zh) * | 2020-02-14 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 一种团伙成员角色的确定方法、装置及电子设备 |
CN112287039A (zh) * | 2020-10-30 | 2021-01-29 | 税友软件集团股份有限公司 | 一种团伙识别方法及相关装置 |
CN112667860A (zh) * | 2020-12-30 | 2021-04-16 | 海南普适智能科技有限公司 | 一种子图匹配方法、装置、设备及存储介质 |
CN112950290A (zh) * | 2021-03-31 | 2021-06-11 | 中国建设银行股份有限公司 | 经济依存客户的挖掘方法、装置、存储介质及电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120197809A1 (en) * | 2011-01-29 | 2012-08-02 | Charles Calvin Earl | Method and System for Automated Construction of Project Teams |
US8874617B2 (en) * | 2012-11-14 | 2014-10-28 | International Business Machines Corporation | Determining potential enterprise partnerships |
CN113255709A (zh) * | 2020-02-11 | 2021-08-13 | 阿里巴巴集团控股有限公司 | 图像元素搭配方法及装置和模型训练方法及装置和数据处理方法 |
-
2021
- 2021-10-20 CN CN202111223443.3A patent/CN114003648B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874422A (zh) * | 2017-01-25 | 2017-06-20 | 东南大学 | 一种面向关系型数据库的图查询方法 |
CN109670937A (zh) * | 2018-09-26 | 2019-04-23 | 平安科技(深圳)有限公司 | 风险用户识别方法、用户设备、存储介质及装置 |
CN110046929A (zh) * | 2019-03-12 | 2019-07-23 | 平安科技(深圳)有限公司 | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 |
CN111339437A (zh) * | 2020-02-14 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 一种团伙成员角色的确定方法、装置及电子设备 |
CN112287039A (zh) * | 2020-10-30 | 2021-01-29 | 税友软件集团股份有限公司 | 一种团伙识别方法及相关装置 |
CN112667860A (zh) * | 2020-12-30 | 2021-04-16 | 海南普适智能科技有限公司 | 一种子图匹配方法、装置、设备及存储介质 |
CN112950290A (zh) * | 2021-03-31 | 2021-06-11 | 中国建设银行股份有限公司 | 经济依存客户的挖掘方法、装置、存储介质及电子设备 |
Non-Patent Citations (2)
Title |
---|
关联关系图谱技术在团伙欺诈识别中的应用;陈俊;《现代管理》;20201028;841-846 * |
面向内容和结构的关键字图查询方法;张志强;夏得萍;谢晓芹;潘海为;;计算机辅助设计与图形学学报;20151115(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114003648A (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122369B (zh) | 一种业务数据处理方法、装置和系统 | |
US20210073669A1 (en) | Generating training data for machine-learning models | |
CN112148767A (zh) | 团伙挖掘方法、异常团伙的识别方法、装置及电子设备 | |
CN111612037A (zh) | 异常用户检测方法、装置、介质及电子设备 | |
CN114003648B (zh) | 风险交易团伙的识别方法、装置、电子设备与存储介质 | |
CN110442623B (zh) | 大数据挖掘方法、装置及数据挖掘服务器 | |
CN110135428B (zh) | 图像分割处理方法和装置 | |
CN112116018B (zh) | 样本分类方法、装置、计算机设备、介质和程序产品 | |
CN111783088B (zh) | 一种恶意代码家族聚类方法、装置和计算机设备 | |
CN113468017A (zh) | 应用于区块链的在线业务状态检测方法及业务服务器 | |
CN111444364A (zh) | 一种图像检测方法和装置 | |
CN111738290A (zh) | 图像检测方法、模型构建和训练方法、装置、设备和介质 | |
CN116205488A (zh) | 风险商户识别方法、装置、设备、介质及产品 | |
CN116739795A (zh) | 基于知识图谱的保险风险评估方法、装置和电子设备 | |
CN113157582B (zh) | 测试脚本执行序列确定方法及装置 | |
CN115659232A (zh) | 一种挖掘异常规则的方法及装置 | |
CN112784015B (zh) | 信息识别方法和装置、设备、介质和程序 | |
CN111582502B (zh) | 一种样本迁移学习方法和装置 | |
CN111310176B (zh) | 一种基于特征选择的入侵检测方法和装置 | |
CN114661998A (zh) | 基于互联网热点话题的大数据处理方法及系统 | |
CN117058432B (zh) | 图像查重方法、装置、电子设备及可读存储介质 | |
CN115115843B (zh) | 数据处理方法及装置 | |
CN116186549B (zh) | 模型的训练方法、装置、设备和介质 | |
CN117081727B (zh) | 一种弱口令检测方法以及装置 | |
US20220405613A1 (en) | Feature selection using testing data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |