CN116308805B - 一种交易账号的识别方法、装置和电子设备 - Google Patents
一种交易账号的识别方法、装置和电子设备 Download PDFInfo
- Publication number
- CN116308805B CN116308805B CN202310601884.5A CN202310601884A CN116308805B CN 116308805 B CN116308805 B CN 116308805B CN 202310601884 A CN202310601884 A CN 202310601884A CN 116308805 B CN116308805 B CN 116308805B
- Authority
- CN
- China
- Prior art keywords
- node
- transaction
- directed
- matrix
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000011159 matrix material Substances 0.000 claims abstract description 252
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000012546 transfer Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 26
- 230000009471 action Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 28
- 230000002159 abnormal effect Effects 0.000 abstract description 15
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000003999 initiator Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 1
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本公开提供了一种交易账号的识别方法、装置和电子设备,涉及数据分析领域,包括:获取多组指定时间范围的交易数据集;构建交易数据集的有向交易网络;确定有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;将转入嵌入特征矩阵和转出嵌入特征矩阵合并得到第一嵌入特征矩阵;对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;对第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;确定第三嵌入特征矩阵中每个节点的特征值以确定节点类型。应用本方法,可以对有方向的交易记录进行分析,发现具有异常交易行为的账号,提升了对异常交易行为分析的准确率。
Description
技术领域
本公开涉及数据分析领域,尤其涉及一种交易账号的识别方法、装置和电子设备。
背景技术
随着互联网技术的不断发展,金融领域的交易行为越来越多的依赖于互联网进行,电子银行已经成为了银行业务渠道和市场营销的主要竞争手段之一,网络电子银行为我们带来便利的同时,也为非法交易行为提供了新的渠道。目前非法交易手段逐渐向专业化方向发展,因此增大了非法交易行为的分析难度。
现有的图卷积神经网络模型可用于对交易记录分析以发现异常的交易行为,但是图卷积神经网络模型只能对无方向的数据进行处理,而银行的交易数据是有方向的,例如A账号向B账号转账、B账号向A账号转账是不同的交易数据,且交易方向不同对交易账号的影响也不同,因此通过现有的图卷积神经网络模型对异常交易行为分析的准确率不高。
发明内容
本公开提供了一种交易账号的识别方法、装置和电子设备,以至少解决现有技术中存在的以上技术问题。
根据本公开的第一方面,提供了一种交易账号的识别方法,所述方法包括:获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,所述交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同;构建所述交易数据集的有向交易网络,所述有向交易网络的节点为所述账号,所述有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,所述交易行为的方向表示交易金额的转入或转出;确定所述有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;将所述转入嵌入特征矩阵和所述转出嵌入特征矩阵合并得到第一嵌入特征矩阵;对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;对所述第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;根据所述第三嵌入特征矩阵确定所述指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据所述特征值确定节点类型。
在一可实施方式中,所述确定所述有向交易网络的转入嵌入特征矩阵,包括:确定每个节点的转入邻接特征;根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,所述有向交易网络包含N个节点;相应的,所述确定每个节点的转入邻接特征包括:通过如下公式确定每个节点的N个转入邻接特征值:;/>、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转入邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征。
在一可实施方式中,所述根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵,包括:根据如下公式确定所述有向交易网络的转入嵌入特征矩阵:;所述/>为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,所述确定所述有向交易网络的转出嵌入特征矩阵,包括:确定每个节点的转出邻接特征;根据所有节点的转出邻接特征和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,所述有向交易网络包含N个节点;相应的,所述确定每个节点的转出邻接特征包括:通过如下公式确定每个节点的N个转出邻接特征值:;/>、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转出邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征。
在一可实施方式中,所述根据所有节点的转出邻接特征和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵,包括:根据如下公式确定所述有向交易网络的转出嵌入特征矩阵;;所述/>为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,所述方法还包括:获取节点的初始属性;对所述初始属性进行线性回归分析,确定每个初始属性对节点类型的影响值;根据所述影响值的大小选取预设数量的初始属性作为所述节点属性。
根据本公开的第二方面,提供了一种交易账号的识别装置,所述装置包括:获取模块,用于获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,所述交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同;构建模块,用于构建所述交易数据集的有向交易网络,所述有向交易网络的节点为所述账号,所述有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,所述交易行为的方向表示交易金额的转入或转出;确定模块,用于确定所述有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;合并模块,用于将所述转入嵌入特征矩阵和所述转出嵌入特征矩阵合并得到第一嵌入特征矩阵;第一处理模块,用于对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;所述第一处理模块,还用于对所述第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;分析模块,用于根据所述第三嵌入特征矩阵确定所述指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据所述特征值确定节点类型。
在一可实施方式中,所述确定模块包括:第一确定子模块,用于确定每个节点的转入邻接特征;第二确定子模块,用于根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,所述有向交易网络包含N个节点;所述第一确定子模块,具体用于通过如下公式确定每个节点的N个转入邻接特征值:;/>、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转入邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征。
在一可实施方式中,所述第二确定子模块,具体用于根据如下公式确定所述有向交易网络的转入嵌入特征矩阵:;所述/>为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,所述第一确定子模块,还用于确定每个节点的转出邻接特征;所述第二确定子模块,还用于根据所有节点的转出邻接特征和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,所述有向交易网络包含N个节点;所述第一确定子模块,具体用于通过如下公式确定每个节点的N个转出邻接特征值:;/>、/>、/>和表示节点,所述/>表示第/>个节点的第/>个转出邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征。
在一可实施方式中,所述第二确定子模块,具体用于根据如下公式确定所述有向交易网络的转出嵌入特征矩阵:;所述/>为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,所述装置还包括:第二处理模块,用于获取节点的初始属性;对所述初始属性进行线性回归分析,确定每个初始属性对节点类型的影响值;根据所述影响值的大小选取预设数量的初始属性作为所述节点属性。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
本公开的一种交易账号的识别方法、装置和电子设备,通过获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,交易记录包括交易双方的账号,根据每组交易数据集构建对应的有向交易网络,根据有向交易网络中的节点以及节点间的连接关系确定有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵,进一步得到有向交易网络的第一嵌入特征矩阵,对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵,再对第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵,由第三嵌入特征矩阵确定节点类型。应用本方法,可以基于有方向的交易记录进行分析,发现具有异常交易行为的账号,相比现有图卷积神经网络模型只能对无方向的数据进行处理,本公开的方案有效利用了交易行为的方向(即交易金额的转出或转入)这一重要特征,提升了对异常交易行为分析的准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本公开实施例一种交易账号的识别方法的实现流程示意图;
图2示出了本公开实施例确定有向交易网络的转入嵌入特征矩阵的实现流程示意图;
图3示出了本公开实施例确定有向交易网络的转出嵌入特征矩阵的实现流程示意图;
图4示出了本公开实施例一种交易账号的识别装置的模块示意图;
图5示出了本公开实施例一种电子设备的组成结构示意图。
具体实施方式
为使本公开的目的、特征、优点能够更加的明显和易懂,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而非全部实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
图1示出了本公开实施例一种交易账号的识别方法的实现流程示意图,包括:
步骤101,获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同。
首先,获取多组指定时间范围的交易数据集,每组交易数据集包含多条交易记录,每组交易数据集的指定起始时间相同,指定结束时间不相同,因此多组交易数据集之间存在包含关系。相邻两组交易数据集的指定时间范围之差尽量保持一致。例如,获取7组指定时间范围的交易数据集,第一组为1月1日的交易记录构成的交易数据集,第二组为1月1日-1月2日的交易记录构成的交易数据集,以此类推,第七组为1月1日至1月7日的交易记录构成的交易数据集,即第一组的指定时间范围的长度为1天,第二组的指定时间范围的长度为2天,以此类推,第七组指定时间范围的长度为7天。这7组交易数据集的指定起始时间相同,均为1月1日,指定结束时间均不相同,后一组交易数据集包含了前一组交易数据集中的所有交易记录,且相邻两组交易数据集的指定时间范围的长度之差均为1天。
交易记录用于记录交易账号的交易行为,包括交易双方的账号,交易时间,交易金额等,由于交易行为是一种有方向的行为,因此交易双方的账号中一方为发起方的账号,另一方为接收方的账号。例如有一条交易记录为A账号向B账号转账,那么A账号和B账号即为交易记录对应的交易双方的账号,针对该交易记录来说A账号为发起方账号,B账号为接收方账号。账号具有唯一性,交易记录中可以优选银行卡号作为账号。
步骤102,构建交易数据集的有向交易网络,有向交易网络的节点为账号,有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,交易行为的方向表示交易金额的转入或转出。
获取到多个交易数据集后,针对每个交易数据集构建与之对应的有向交易网络,在每个有向交易网络中,节点为该交易数据集包含的多条交易记录中的账号,用于连接两个节点的有向边既表明了两个账号之间存在交易行为,也指出了账号之间交易行为的方向。具体的,有向边可以用带箭头的线段表示,箭头由发起方账号指向接收方账号。交易行为的方向表示交易金额的转入或转出,对于发起方账号为交易金额的转出,对于接收方账号为交易金额的转入。
步骤103,确定有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵。
由于交易行为具有方向,对于一个节点来说与它相关的有向边既有由该节点指向其他节点的,也有由其他节点指向该节点的。由其他节点指向该节点的有向边对该节点而言交易方向为交易金额的转入,由该节点指向其他节点的有向边对该节点而言交易方向为交易金额的转出。
针对有向交易网络中的每一个节点,根据指向该节点的有向边确定该节点的转入嵌入特征,根据由该节点指出的有向边确定该节点的转出嵌入特征,根据所有节点的转入嵌入特征确定有向交易网络的转入嵌入特征矩阵,根据所有节点的转出嵌入特征确定有向交易网络的转出嵌入特征矩阵。转入嵌入特征矩阵的行数表示节点数量,每一行表征一个节点的转入嵌入特征;转出嵌入特征矩阵的行数表示节点数量,每一行表征一个节点的转出嵌入特征。
步骤104,将转入嵌入特征矩阵和转出嵌入特征矩阵合并得到第一嵌入特征矩阵。
根据每个有向交易网络可以确定出一个转入嵌入特征矩阵和一个转出嵌入特征矩阵,将有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵合并得到该有向交易网络的第一嵌入特征矩阵。具体的,若转入嵌入特征矩阵为一个n×f的矩阵,转出嵌入特征矩阵也为一个n×f的矩阵,形成的第一嵌入特征矩阵为n×2f的矩阵,其中,n为有向交易网络的节点数量,第一嵌入特征矩阵的前f列与转入嵌入特征矩阵相同,后f列与转出嵌入特征矩阵相同。
步骤105,对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵。
每组交易数据集构建一个有向交易网络,获取的多组交易数据集构建多个有向交易网络,每个有向交易网络通过确定转入嵌入特征矩阵和转出嵌入特征矩阵得到第一嵌入特征矩阵,即每个交易数据集对应一个第一嵌入特征矩阵。将所有交易数据集的第一嵌入特征矩阵输入到循环神经网络以对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵,第二嵌入特征矩阵的行表示节点,列表示属性,矩阵中的值表示更新后的节点的属性值。
由于交易数据集的指定起始时间相同,指定结束时间不同,因此指定时间范围最长的交易数据集可看作最新的交易数据集,其他几组指定时间范围的交易数据集可看作历史的交易数据集,将历史的交易数据集的第一嵌入特征矩阵和最新的交易数据集的第一嵌入特征矩阵输入循环神经网络中,实现通过历史的交易数据集的第一嵌入特征对最新的交易数据集的第一嵌入特征进行更新。其中采用的循环神经网络可以为长短期记忆(LongShort Term Memory,LSTM)神经网络,优选的,可以采用门控循环单元(Gated RecurrentUnit,GRU)循环神经网络,GRU循环神经网络参数较少,能够降低过拟合的风险。
交易数据集的数量可根据实际情况进行选择,假设,在对银行的交易数据进行分析时,前期进行机器学习得到的结果表明将七组交易数据集对应的七个第一嵌入特征矩阵输入到循环神经网络模型中得到的第二嵌入特征矩阵的效果最好,则当本方法应用于对银行的交易数据进行分析时,可选择七组交易数据集。
步骤106,对第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵。
通过指定时间范围最长的交易数据集的有向交易网络中所有节点的节点属性对第二嵌入特征矩阵进行去噪处理。具体根据所有节点的节点属性确定属性矩阵,属性矩阵的行表示节点,列表示节点属性,有向交易网络中有多少个节点,属性矩阵就有多少行,列的数量可根据实际情况确定,属性矩阵中第a行第b列的值表示节点a的第b个节点属性对应的属性值。将属性矩阵和第三嵌入特征矩阵输入图注意力模型中,实现对第三嵌入特征矩阵的去噪处理,即借助属性矩阵利用图注意力模型对第三嵌入特征矩阵中属性的权重进行重新分配,增大重要属性的权重比例,减小非重要属性的权重比例。
节点属性为与节点对应的账号相关的交易属性,例如账号的开户时长、单日最大交易金额、敏感时间段交易次数、快进快出次数、累计交易金额等。
属性值的确定方法也可根据实际情况选择,例如,假如节点属性为账号的开户时长,可以先确定每个节点的实际开户时长,进行归一化处理后得到每个节点开户时长这一节点属性的属性值。或者还可以设置开户时长级别阈值,不同的开户时长对应不同的级别,用不同的代表值表示,如开户时长小于1年的设代表值为0,开户时长为1年至5年的设代表值为1等等,即可根据开户时长确定对应的代表值,作为开户时长这一节点属性的属性值。
步骤107,根据第三嵌入特征矩阵确定指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据特征值确定节点类型。
对第三嵌入特征矩阵进行反编码确定指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,具体为将第三嵌入特征矩阵中每一行数据进行线性变换处理,再通过激活函数sigmoid对线性变换的结果进行计算得到每个节点的特征值,将该特征值与预设的特征阈值进行比较,确定节点类型。
节点类型包括正常节点和异常节点,正常节点表示不具有异常交易行为的账号,异常节点表示具有异常交易行为的账号。当节点的特征值大于特征阈值时,表明节点为异常节点,当节点的特征值小于等于特征阈值时,表明节点为正常节点,节点阈值的设定可根据应用场景确定。
本公开实施例提供的一种交易账号的识别方法,获取多个指定时间范围的交易数据集,根据每组交易数据集包含的交易记录构建对应的有向交易网络,确定有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵,进一步得到有向交易网络的第一嵌入特征矩阵,对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新得到第二嵌入特征矩阵,对第二嵌入特征矩阵进行去噪处理,以确定指定时间范围最长的交易数据集对应的有向交易网络中每个节点的节点类型。应用本方法,可以基于有方向的交易记录进行分析,发现具有异常交易行为的账号,相比现有图卷积神经网络模型只能对无方向的数据进行处理,本公开的方案有效利用了交易行为的方向(即交易金额的转出或转入)这一重要特征,提升了对异常交易行为分析的准确率。
在一可实施方式中,如图2所示,上述确定有向交易网络的转入嵌入特征矩阵,包括如下步骤:
步骤201,确定每个节点的转入邻接特征;
步骤202,根据所有节点的转入邻接特征和所有节点的节点属性,确定有向交易网络的转入嵌入特征矩阵。
针对有向交易网络中的每个节点,从与节点相关的有向边中确定指向节点的有向边,指向节点的有向边表示交易行为为交易金额的转入,转入邻接特征表示该节点与其他节点之间交易行为为交易金额的转入的相连关系,根据指向节点的有向边确定节点的转入邻接特征。确定每个节点的节点属性,根据有向交易网络中所有节点的转入邻接特征对所有节点的节点属性进行传播,确定有向交易网络的转入嵌入特征矩阵,转入嵌入特征矩阵就是对节点的节点属性进行转入方向的传播后形成的矩阵,转入嵌入特征矩阵中一行表示一个节点的转入嵌入特征。
在一可实施方式中,有向交易网络包含N个节点,相应的,可通过如下公式确定每个节点的N个转入邻接特征值:
;
、/>、/>和/>表示节点,/>表示第/>个节点的第/>个转入邻接特征值;/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征。
具体的,针对节点,/>表示节点/>的第/>个转入邻接特征值,分别计算/>=1至/>=N时对应的/>的值,即可得到节点/>的N个转入邻接特征值。节点/>的N个转入邻接特征值的集合作为节点/>的转入邻接特征。
若有向交易网络中具有节点指向节点/>的有向边时,/>的值为1,若不存在节点指向节点/>的有向边时,/>的值为0,/>的原理与/>相同。/>为/>和/>的乘积,只有/>和/>同时为1,即当同时有节点/>指向节点/>的有向边和节点/>指向节点/>的有向边的情况下时,/>才为1,表明节点/>和节点/>通过节点/>有转入关联关系。/>表示节点/>指向节点/>的有向边,/>为所有由节点/>指出的有向边之和,即有多少条由节点/>指出去的有向边,/>的值就为多少。
例如,在一具体实施场景中,交易数据集中包含10条交易记录,具体为:
账号1向账号2转账;账号1向账号3转账;账号1向账号5转账;
账号2向账号3转账;账号2向账号4转账;账号2向账号5转账;
账号3向账号1转账;账号3向账号2转账;账号5向账号2转账;
账号5向账号4转账。
那么根据该交易数据集形成的有向交易网络包含5个节点分别为节点1-5,对应账号1-5,通过公式分别确定5个节点的转入邻接特征,下面以节点1(即/>=1)为例,说明转入邻接特征的确定过程:
(1)令=1:
计算节点1的第1个转入邻接特征值:。
当=1时,没有节点1到节点1的有向边,那么/>为0,/>为0;
当=2时,没有节点2到节点1的有向边,那么/>为0,/>为0;
当=3时,有节点3到节点1的有向边,那么/>为1,此/>中分子不为0,对分母的值进行计算:因为存在节点3到节点1、节点2的有向边,因此,/>为1、/>为1,而没有节点3到节点3、节点3到节点4、节点3到节点5的有向边,那么/>,/>,/>均为0,因此针对/>=3的情况下,/>的值为2,则/>的值为/>;
当=4时,没有节点4到节点1的有向边,那么/>为0,/>为0;
当=5时,没有节点5到节点1的有向边,那么/>为0,/>为0。
=1的情况下,对/>=1至/>=5得到的/>求和,得到/>的值为/>,因此的值为/>。
(2)令=2,计算/>的值为/>;计算过程与上述/>=1时同理,此处不再赘述;
(3)令=3,计算/>的值为0;
(4)令=4,计算/>的值为0;
(5)令=5,计算/>的值为0。
最终得到的节点1(即=1)的转入邻接特征为(/>,/>,0,0,0)。
同理,经计算得到的节点2(即=2)的转入邻接特征为(/>,/>,/>,/>,/>),节点3(即/>=3)的转入邻接特征为(/>,/>,/>,/>,/>),节点4(即/>=4)的转入邻接特征为(/>,/>,/>,/>,/>),节点5(即=5)的转入邻接特征为(/>,/>,/>,/>,/>)。
得到每个节点的转入邻接特征之后,根据所有节点的转入邻接特征和所有节点的节点属性,确定有向交易网络的转入嵌入特征矩阵。可根据如下公式确定有向交易网络的转入嵌入特征矩阵:
;
为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为有向交易网络的转入嵌入特征矩阵。
具体的,为有向交易网络的转入嵌入特征矩阵,/>为所有节点的转入邻接特征形成的转入邻接矩阵,转入邻接矩阵是一个方阵,行数与列数相同,一行表示一个节点的转入邻接特征,转入邻接矩阵中第/>行第/>列对应的值即为节点/>的第/>个转入邻接特征值,例如,上述具体实施场景中的转入邻接矩阵/>为/>。
为转入邻接矩阵/>的度矩阵。
为该交易网络中所有节点的节点属性形成的属性矩阵,在上述示例中为节点1-5的属性矩阵。属性矩阵是n×m的矩阵,n为节点的数量,m的数量不定,可以等于n,属性矩阵的行表示节点,列表示属性,矩阵第/>行第/>列表示节点/>的第/>个属性。
为学习参数矩阵,该学习参数矩阵的行数根据/>确定,学习参数矩阵/>的行数与/>的列数相同,学习参数矩阵/>的列数为超参数,并且学习参数矩阵/>的列数小于行数。学习参数矩阵通过机器学习确定,在每次得到第三嵌入特征矩阵后,还可以通过二分交叉熵损失函数、求导以及反向传播等操作对第三嵌入特征矩阵处理以得到更新后的学习参数/>,用于下一次计算,通过多次更新学习参数/>,可以提升确定节点类型的准确度。
在一可实施方式中,如图3所示,上述确定有向交易网络的转出嵌入特征矩阵,包括如下步骤:
步骤301,确定每个节点的转出邻接特征;
步骤302,根据所有节点的转出邻接特征和所有节点的节点属性,确定有向交易网络的转出嵌入特征矩阵。
针对有向交易网络中的每个节点,从与节点相关的有向边中确定由节点指出的有向边,由节点指出的有向边表示交易行为为交易金额的转出,转出邻接特征表示该节点与其他节点之间交易行为为交易金额的转出的相连关系,根据由节点指出的有向边确定节点的转出邻接特征。确定每个节点的节点属性,根据有向交易网络中所有节点的转出邻接特征对所有节点的节点属性进行传播,确定有向交易网络的转出嵌入特征矩阵,转出嵌入特征矩阵是对节点的节点属性进行转出方向的传播后形成的矩阵,转出嵌入特征矩阵中一行表示一个节点的转出嵌入特征。
在一可实施方式中,有向交易网络包含N个节点,相应的,可通过如下公式确定每个节点的N个转出邻接特征值:
;
、/>、/>和/>表示节点,/>表示第/>个节点的第/>个转出邻接特征值;/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征。
具体的,针对节点i,表示节点/>的第/>个转出邻接特征值,分别计算/>=1至/>=N时对应的/>的值,即可得到节点/>的N个转出邻接特征值。节点/>的N个转出邻接特征值的集合作为节点/>的转出邻接特征。
若有向交易网络中具有节点指向节点/>的有向边时,/>的值为1,若不存在节点/>指向节点/>的有向边时,/>的值为0,/>的原理与/>相同。/>为/>和/>的乘积,只有/>和/>同时为1,即当同时有节点/>指向节点/>的有向边和节点/>指向节点/>的有向边的情况下时,/>才为1,表明节点i和节点j通过节点k有转出关联关系。/>表示节点/>指向节点/>的有向边,/>为所有指向节点/>的有向边之和,即有多少条指向节点/>的有向边,/>的值就为多少。计算过程与转入邻接特征类似,此处不再赘述。
得到每个节点的转出邻接特征之后,根据所有节点的转出邻接特征和所有节点的节点属性,确定有向交易网络的转出嵌入特征矩阵。可根据如下公式确定有向交易网络的转出嵌入特征矩阵:
;
为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为有向交易网络的转出嵌入特征矩阵。
具体的,为有向交易网络的转出嵌入特征矩阵,/>为所有节点的转出邻接特征形成的转出邻接矩阵,转出邻接矩阵是一个方阵,行数与列数相同,一行表示一个节点的转出邻接特征,转出邻接矩阵中第/>行第/>列对应的值即为节点/>的第/>个转出邻接特征值。为转出邻接矩阵/>的度矩阵。/>为该交易网络中所有节点的节点属性形成的属性矩阵,属性矩阵是n×m的矩阵,n为节点的数量,m的数量不定,可以等于n,属性矩阵的行表示节点,列表示属性,矩阵第/>行第/>列表示节点/>的第/>个属性。
为学习参数矩阵,该学习参数矩阵的行数根据/>确定,学习参数矩阵/>的行数与/>的列数相同,学习参数矩阵/>的列数为超参数,并且学习参数矩阵/>的列数小于行数。
上述在计算有向交易网络时需要利用该有向交易网络中所有节点的节点属性构建属性矩阵,在一可实施方式中,属性矩阵/>的构建过程包括:
获取节点的初始属性;
对初始属性进行线性回归分析,确定每个初始属性对节点类型的影响值;
根据影响值的大小选取预设数量的初始属性作为节点属性。
具体的,节点的初始属性为与节点对应的账号相关的交易属性,包括:开户时长、预设时间范围内的交易天数、预设时间范围内交易天数占预设时间范围的比例、预设时间范围内累计入账次数、预设时间范围内累计出账次数、预设时间范围内累计入账次数与预设时间范围内累计出账次数的比值、预设时间范围内敏感时段的交易次数、预设时间范围内敏感时段的交易金额、预设时间范围内累计入账金额、预设时间范围内累计出账金额、预设时间范围内交易对手数量、预设时间范围内入账对手数量、预设时间范围内出账对手数量、预设时间范围内快进快出的次数等等。其中预设时间范围的长度大于等于最大的指定时间范围的长度。
因为可以根据账号的交易时间,交易金额等对账号是否为异常账号进行判断,因此获取的初始属性大多都与账号的交易行为有关。节点类型包括异常节点和正常节点,不同初始属性对节点类型的影响不同,通过对初始属性进行线性回归分析,确定每个初始属性对节点分类的影响值,影响值越大表明初始属性对节点分类影响越大。将初始属性对节点分类的影响值按从大到小的顺序进行排序,选取前m个影响值对应的初始属性作为节点属性,m的取值可根据实际情况确定。
图4示出了本公开实施例一种交易账号的识别装置的模块示意图。
参见图4,根据本公开实施例的第二方面,提供一种交易账号的识别装置,装置包括:获取模块401,用于获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同;构建模块402,用于构建交易数据集的有向交易网络,有向交易网络的节点为账号,有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,交易行为的方向表示交易金额的转入或转出;确定模块403,用于确定有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;合并模块404,用于将转入嵌入特征矩阵和转出嵌入特征矩阵合并得到第一嵌入特征矩阵;第一处理模块405,用于对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;第一处理模块405,还用于对第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;分析模块406,用于根据第三嵌入特征矩阵确定指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据特征值确定节点类型。
在一可实施方式中,确定模块403包括:第一确定子模块4031,用于确定每个节点的转入邻接特征;第二确定子模块4032,用于根据所有节点的转入邻接特征和所有节点的节点属性,确定有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,有向交易网络包含N个节点;第一确定子模块4031,具体用于通过如下公式确定每个节点的N个转入邻接特征值:;/>、/>、/>和/>表示节点,/>表示第/>个节点的第/>个转入邻接特征值;/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征。
在一可实施方式中,第二确定子模块4032,具体用于根据如下公式确定有向交易网络的转入嵌入特征矩阵:;/>为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转入嵌入特征矩阵。
在一可实施方式中,第一确定子模块4031,还用于确定每个节点的转出邻接特征;第二确定子模块4032,还用于根据所有节点的转出邻接特征和所有节点的节点属性,确定有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,有向交易网络包含N个节点;第一确定子模块4031,具体用于通过如下公式确定每个节点的N个转出邻接特征值:;/>、/>、/>和/>表示节点,/>表示第/>个节点的第/>个转出邻接特征值;/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>的取值范围为1至N,/>表示节点/>指向节点/>的有向边,表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征。
在一可实施方式中,第二确定子模块4032,具体用于根据如下公式确定有向交易网络的转出嵌入特征矩阵:;/>为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转出嵌入特征矩阵。
在一可实施方式中,装置还包括:第二处理模块407,用于获取节点的初始属性;对初始属性进行线性回归分析,确定每个初始属性对节点类型的影响值;根据影响值的大小选取预设数量的初始属性作为节点属性。
根据本公开的实施例,本公开还提供了一种电子设备。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息或数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如一种交易账号的识别方法。例如,在一些实施例中,一种交易账号的识别方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的一种交易账号的识别方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一种交易账号的识别方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。
Claims (4)
1.一种交易账号的识别方法,其特征在于,所述方法包括:
获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,所述交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同;
构建所述交易数据集的有向交易网络,所述有向交易网络的节点为所述账号,所述有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,所述交易行为的方向表示交易金额的转入或转出;
确定所述有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;
将所述转入嵌入特征矩阵和所述转出嵌入特征矩阵合并得到第一嵌入特征矩阵;
通过循环神经网络对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;
对所述第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;
根据所述第三嵌入特征矩阵确定所述指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据所述特征值确定节点类型;
所述确定所述有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵,包括:确定每个节点的转入邻接特征和转出邻接特征;根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵;根据所有节点的转出邻接特征和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵;
所述确定每个节点的转入邻接特征包括:通过如下公式确定每个节点的N个转入邻接特征值:
;
N为所述有向交易网络包含的节点个数,、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转入邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征;
所述根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵,包括:根据如下公式确定所述有向交易网络的转入嵌入特征矩阵:
;
所述为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转入嵌入特征矩阵;
所述确定每个节点的转出邻接特征包括:通过如下公式确定每个节点的N个转出邻接特征值:
;
N为所述有向交易网络包含的节点个数,、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转出邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征;
所述根据所有节点的转出邻接特征和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵,包括:根据如下公式确定所述有向交易网络的转出嵌入特征矩阵:
;
所述为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转出嵌入特征矩阵;
所述根据所述第三嵌入特征矩阵确定所述指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,包括:对所述第三嵌入特征矩阵中每一行数据进行线性变换处理;通过激活函数对线性变换处理的结果进行计算得到每个节点的特征值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取节点的初始属性;
对所述初始属性进行线性回归分析,确定每个初始属性对节点类型的影响值;
根据所述影响值的大小选取预设数量的初始属性作为所述节点属性。
3.一种交易账号的识别装置,其特征在于,所述装置包括:
获取模块,用于获取多组指定时间范围的交易数据集,每组交易数据集包括多条交易记录,所述交易记录包括交易双方的账号,每组交易数据集的指定起始时间相同,指定结束时间不同;
构建模块,用于构建所述交易数据集的有向交易网络,所述有向交易网络的节点为所述账号,所述有向交易网络中用于连接两个节点的有向边表示账号之间交易行为的方向,所述交易行为的方向表示交易金额的转入或转出;
确定模块,用于确定所述有向交易网络的转入嵌入特征矩阵和转出嵌入特征矩阵;
合并模块,用于将所述转入嵌入特征矩阵和所述转出嵌入特征矩阵合并得到第一嵌入特征矩阵;
第一处理模块,用于通过循环神经网络对指定时间范围最长的交易数据集的第一嵌入特征矩阵进行更新,得到第二嵌入特征矩阵;
所述第一处理模块,还用于对所述第二嵌入特征矩阵进行去噪处理,得到第三嵌入特征矩阵;
分析模块,用于根据所述第三嵌入特征矩阵确定所述指定时间范围最长的交易数据集对应的有向交易网络中每个节点的特征值,根据所述特征值确定节点类型;
所述确定模块包括:第一确定子模块,用于确定每个节点的转入邻接特征和转出邻接特征;第二确定子模块,用于根据所有节点的转入邻接特征和所有节点的节点属性,确定所述有向交易网络的转入嵌入特征矩阵;所述第二确定子模块,还用于根据所有节点的转出邻接矩阵和所有节点的节点属性,确定所述有向交易网络的转出嵌入特征矩阵;
所述第一确定子模块,具体用于通过如下公式确定每个节点的N个转入邻接特征值:
;
N为所述有向交易网络包含的节点个数,、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转入邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转入邻接特征值组成的集合确定为节点的转入邻接特征;
所述第二确定子模块,具体用于根据如下公式确定所述有向交易网络的转入嵌入特征矩阵:
;
所述为所有节点的转入邻接特征形成的转入邻接矩阵,/>为/>的度矩阵,/>为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转入嵌入特征矩阵;
所述第一确定子模块,具体用于通过如下公式确定每个节点的N个转出邻接特征值:
;
N为所述有向交易网络包含的节点个数,、/>、/>和/>表示节点,所述/>表示第/>个节点的第/>个转出邻接特征值;所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>的取值范围为1至N,所述/>表示节点/>指向节点/>的有向边,所述表示节点/>指向节点/>的有向边,/>表示节点/>指向节点/>的有向边;针对每个节点,将N个转出邻接特征值组成的集合确定为节点的转出邻接特征;
所述第二确定子模块,具体用于根据如下公式确定所述有向交易网络的转出嵌入特征矩阵:
;
所述为所有节点的转出邻接特征形成的转出邻接矩阵,/>为/>的度矩阵,为所有节点的节点属性形成的属性矩阵,/>为学习参数矩阵,/>为所述有向交易网络的转出嵌入特征矩阵;
所述分析模块,具体用于对所述第三嵌入特征矩阵中每一行数据进行线性变换处理;通过激活函数对线性变换处理的结果进行计算得到每个节点的特征值。
4.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310601884.5A CN116308805B (zh) | 2023-05-25 | 2023-05-25 | 一种交易账号的识别方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310601884.5A CN116308805B (zh) | 2023-05-25 | 2023-05-25 | 一种交易账号的识别方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116308805A CN116308805A (zh) | 2023-06-23 |
CN116308805B true CN116308805B (zh) | 2023-08-08 |
Family
ID=86824388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310601884.5A Active CN116308805B (zh) | 2023-05-25 | 2023-05-25 | 一种交易账号的识别方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116308805B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105122282A (zh) * | 2012-12-14 | 2015-12-02 | 墨子多股份有限公司 | 使用qr码执行交易 |
CN105391594A (zh) * | 2014-09-03 | 2016-03-09 | 阿里巴巴集团控股有限公司 | 识别特征账号的方法及装置 |
CN107067221A (zh) * | 2016-11-22 | 2017-08-18 | 克里斯彭基昆瓦德 | 一种通过计算机进行交易的方法 |
CN108764943A (zh) * | 2018-05-30 | 2018-11-06 | 公安部第三研究所 | 基于资金交易网络的可疑用户监测分析方法 |
CN114202418A (zh) * | 2021-12-09 | 2022-03-18 | 航天信息股份有限公司 | 信息处理方法、装置、设备及介质 |
-
2023
- 2023-05-25 CN CN202310601884.5A patent/CN116308805B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105122282A (zh) * | 2012-12-14 | 2015-12-02 | 墨子多股份有限公司 | 使用qr码执行交易 |
CN105391594A (zh) * | 2014-09-03 | 2016-03-09 | 阿里巴巴集团控股有限公司 | 识别特征账号的方法及装置 |
CN107067221A (zh) * | 2016-11-22 | 2017-08-18 | 克里斯彭基昆瓦德 | 一种通过计算机进行交易的方法 |
CN108764943A (zh) * | 2018-05-30 | 2018-11-06 | 公安部第三研究所 | 基于资金交易网络的可疑用户监测分析方法 |
CN114202418A (zh) * | 2021-12-09 | 2022-03-18 | 航天信息股份有限公司 | 信息处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116308805A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116383708B (zh) | 一种交易账号的识别方法及装置 | |
CN109754078A (zh) | 用于优化神经网络的方法 | |
CN112580733B (zh) | 分类模型的训练方法、装置、设备以及存储介质 | |
CN115809569B (zh) | 基于耦合竞争失效模型的可靠性评价方法和装置 | |
CN112214775A (zh) | 对图数据的注入式攻击方法、装置、介质及电子设备 | |
CN115545216B (zh) | 一种业务指标预测方法、装置、设备和存储介质 | |
CN112183326A (zh) | 人脸年龄识别模型训练方法及相关装置 | |
CN114693934A (zh) | 语义分割模型的训练方法、视频语义分割方法及装置 | |
US11569278B1 (en) | Systems and methods for callable options values determination using deep machine learning | |
CN113240177B (zh) | 训练预测模型的方法、预测方法、装置、电子设备及介质 | |
CN113098624B (zh) | 量子态测量方法、装置、设备、存储介质及系统 | |
CN114494814A (zh) | 基于注意力的模型训练方法、装置及电子设备 | |
CN112085103B (zh) | 基于历史行为的数据增强方法、装置、设备以及存储介质 | |
CN115982654B (zh) | 一种基于自监督图神经网络的节点分类方法及装置 | |
CN116308805B (zh) | 一种交易账号的识别方法、装置和电子设备 | |
CN116204843A (zh) | 一种异常账户的检测方法、装置、电子设备及存储介质 | |
CN117495571B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN113779103B (zh) | 用于检测异常数据的方法和装置 | |
US11475324B2 (en) | Dynamic recommendation system for correlated metrics and key performance indicators | |
CN114021642A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
US20230169327A1 (en) | Designing ladder and laguerre orthogonal recurrent neural network architectures inspired by discrete-time dynamical systems | |
CN116958149B (zh) | 医疗模型训练方法、医疗数据分析方法、装置及相关设备 | |
CN113111254B (zh) | 推荐模型的训练方法、拟合方法、装置和电子设备 | |
CN118133214A (zh) | 账号分类方法、装置、设备及程序产品 | |
CN114511920A (zh) | 一种小样本行为识别分类增量学习方法、装置及可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |