CN112738034A - 一种基于垂直联邦学习的区块链钓鱼节点检测方法 - Google Patents

一种基于垂直联邦学习的区块链钓鱼节点检测方法 Download PDF

Info

Publication number
CN112738034A
CN112738034A CN202011494397.6A CN202011494397A CN112738034A CN 112738034 A CN112738034 A CN 112738034A CN 202011494397 A CN202011494397 A CN 202011494397A CN 112738034 A CN112738034 A CN 112738034A
Authority
CN
China
Prior art keywords
blockchain
transaction
block chain
node
phishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011494397.6A
Other languages
English (en)
Other versions
CN112738034B (zh
Inventor
张珂杰
谢杨洁
吴琛
胡麦芳
詹士潇
匡立中
黄方蕾
汪小益
邱炜伟
蔡亮
李伟
张帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qulian Technology Co Ltd
Original Assignee
Hangzhou Qulian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qulian Technology Co Ltd filed Critical Hangzhou Qulian Technology Co Ltd
Priority to CN202011494397.6A priority Critical patent/CN112738034B/zh
Publication of CN112738034A publication Critical patent/CN112738034A/zh
Application granted granted Critical
Publication of CN112738034B publication Critical patent/CN112738034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于垂直联邦学习的区块链钓鱼节点检测方法,主要应用于区块链交易网络中的钓鱼节点检测。通过查询与目标用户相关的交易记录,构建时间序列型与网络序列型两种小规模的子网络进行训练。采用垂直联邦学习策略,将各个边缘端钓鱼检测模型计算得到的网络嵌入与原始节点类标上传至服务器端,由服务器端经注意力机制组合来自边缘端检测模型的网络嵌入。服务器端利用组合得到的网络嵌入训练自身的检测模型,并下发边缘端检测模型,对各边缘端的区块链钓鱼检测模型实现性能提升。

Description

一种基于垂直联邦学习的区块链钓鱼节点检测方法
技术领域
本发明属于区块链网络安全领域,具体涉及一种基于垂直联邦学习的区块链钓鱼节点检测方法。
背景技术
区块链技术起源于比特币,比特币作为一种加密安全的电子支付系统,其最初目的在于解决电子支付中过度依赖可信第三方的问题。在过去的十年中,金融领域的加密货币作为区块链技术最成功的应用之一,成为新型网络犯罪滋生的温床。区块链技术虽然能保证存储数据的安全性和转账行为的可靠性,将加密货币存放于用户自身的账户中,然而由于缺少了第三方权威机构的监管,一旦向诈骗者的转账行为被区块链确认,用户失去的电子货币几乎不可能再被寻回。在众多的区块链金融诈骗中,有50%以上的可以归类为以加密货币作为钓鱼目标进行的钓鱼诈骗。(参照文献1:M.Conti,E.S.Kumar,C.Lal,andS.Ruj,“A survey on security and privacy issues of bitcoin,”IEEECommun.Surv.Tut.,vol.20,no.4,pp.3416–3452,2018.)
为了在诈骗发生前识别钓鱼节点,或者通过预测潜在的诈骗交易,向未来可能的被诈骗者提供预警。Wu等人(参照文献2:Wu J,Yuan Q,Lin D,et al.Who Are thePhishers?Phishing Scam Detection on Ethereum via Network Embedding[J].2019.)第一次研究了区块链生态系统中的反网络钓鱼问题,将以太坊网络钓鱼地址的识别建模为二分类问题,提出一种基于交易量和时间戳偏差的算法学习区块链交易数据的网络嵌入,实现最终的区块链网络钓鱼检测。
联邦学习是为了解决数据孤岛以及模型训练和应用过程中的隐私泄露问题而出现的一种有效的技术手段。在联邦学习中,边缘端对本地数据进行训练后将模型上传至服务器端,再由服务器端对模型进行聚合得到总体参数,通过边缘端的本地训练与参数传递,训练出一个深度学习模型。联邦学习按照数据分布的不同情况,大致分为三类:水平联邦学习、垂直联邦学习与联邦迁移学习。水平联邦学习按照用户维度对数据集进行切分,并取出双方数据特征相同而用户不完全相同的那部分数据进行训练。垂直联邦学习按照数据特征维度对数据集进行切分,并取出双方针对相同用户而数据特征不完全相同的那部分数据进行训练。联邦迁移学习不对数据进行切分,而是利用迁移学习来克服数据或标签不足的情况。
联邦学习旨在实现在“数据不可见”或“模型不可见”的情况下提高模型的训练效率,并解决数据孤岛以及模型训练和应用过程中的隐私泄露问题。区块链技术中采用分布式账本记录所有的交易数据,这些交易记录都是可公开访问的,因此在区块链网络钓鱼检测中,区块链交易数据是“可见”的。不同的是,在不同的区块链钓鱼检测模型中,相同的交易数据可能被处理成不同格式的网络数据,导致网络特征出现差异。不同的区块链网络钓鱼检测方法所关注的数据特征(例如交易时间,交易金额)存在差异,单一的检测方法可能会过多地关注交易数据中的某一类特征,以至于难以全面地学习潜在钓鱼诈骗者的特征。在钓鱼检测模型不可见的情况下,如何联合多种钓鱼检测模型,提升自身模型的训练效率有着重要的实践意义。
发明内容
本发明的目的是设计一种基于垂直联邦学习的区块链钓鱼节点检测方法,采用垂直联邦学习策略,在边缘端区块链交易网络特征不同、钓鱼检测模型结构不可知的情况下,联合边缘端模型各自学习到的区块链交易网络特征嵌入,提高区块链钓鱼节点检测模型的有效性。
为实现上述发明目的,本发明提供的技术方案为:
一种基于垂直联邦学习的区块链钓鱼节点检测方法,包括以下步骤:
根据区块链交易信息构建时间序列型区块链交易网络图和网络序列型区块链交易网络图,并将这两个区块链交易网络图分发到两个边缘端;
各边缘端分别利用分发的区块链交易网络图进行边缘端区块链钓鱼检测模型的训练,并将获得区块链交易网络图的节点嵌入向量和节点类标上传至服务器端;
服务器端将传入的多个节点嵌入向量的注意力加权求和结果作为服务端的区块链钓鱼检测模型的输入数据,结合节点类标对服务端的区块链钓鱼检测模型进行训练,并下发训练的损失函数的梯度信息至两个边缘端,以更新边缘端区块链钓鱼检测模型的网络参数;
利用经过垂直联邦学习结束获得的服务端的区块链钓鱼检测模型实现区块链钓鱼节点的检测。
优选地,根据区块链交易信息构建时间序列型区块链交易网络图的过程为:
以至少一个账户地址为中心地址,根据交易记录提取另一方账户地址作为一阶账户地址,接着以一阶账户地址为中心地址,根据交易记录提取另一方账户地址作为二阶账户地址,如此迭代,直到提取完指定阶段的交易记录,得到有账户地址作为节点的交易网络图;
依据预设的度阈值,将交易网络图中超过度阈值的节点删除,并将与超过度阈值的节点连接的更大阶数的节点同时删除,得到时间序列型区块链交易网络图,表示为
Figure BDA0002841681300000041
其中,V表示节点集合,E表示链路集合,X表示每条链路对应的交易额与交易时间信息。
优选地,根据区块链交易信息构建网格序列型区块链交易网络图的过程为:
将时间序列型区块链交易网络图中的交易时间信息去除,同时依据交易时间段对时间序列型区块链交易网络图进行分片,每个交易时间段的交易信息形成一个网格分片图,每个网格分片图中的节点数与时间序列型区块链交易网络图的节点数相同,且将网格分片图中同一节点对之间的多条交易金额合并,将求和后的交易额作为新链路交易额,最终获得T网格分片图组成的网格序列型区块链交易网络图,表示为
Figure BDA0002841681300000042
其中,At∈RN×N表示第t个网格分片图的邻接矩阵,
Figure BDA0002841681300000043
表示At中第i个节点与第j个节点间的交易额。
优选地,边缘端采用门控循环单元作为边缘端区块链钓鱼检测模型,利用时间序列型区块链交易网络图对门控循环单元进行训练,同时提取时间序列型区块链交易网络图的节点嵌入向量。
优选地,边缘端采用随机游走采样算法和Skip-Gram模型作为边缘端区块链钓鱼检测模型,随机游走采样算法提取网络序列型区块链交易网络图中的序列信息,利用序列信息训练Skip-Gram模型,同时提取网格序列型区块链交易网络图的节点嵌入向量。
优选地,服务器端采用以下公式对两个节点嵌入向量的注意力加权求和,得到组合向量作为服务端的区块链钓鱼检测模型的输入数据,
Figure BDA0002841681300000044
其中,
Figure BDA0002841681300000051
表示采用模型参数为ΘA的边缘端区块链钓鱼检测模型对网格序列型区块链交易网络图
Figure BDA0002841681300000052
提取的节点嵌入向量,
Figure BDA0002841681300000053
表示采用模型参数为ΘB的边缘端区块链钓鱼检测模型对时间序列型区块链交易网络图
Figure BDA0002841681300000054
提取的节点嵌入向量,α=[αAB]为注意力系数矩阵,
Figure BDA0002841681300000055
表示组合向量。
优选地,服务端的区块链钓鱼检测模型采用全连接神经网络作为分类器,实现对钓鱼节点的二分类预测。
优选地,对服务端的区块链钓鱼检测模型进行训练,以区块链钓鱼检测模型的预测置信度与节点类标的交叉熵为损失函数。
与现有技术相比,本发明具有的有益效果至少包括:
本发明提供的基于垂直联邦学习的区块链钓鱼节点检测方法,在不泄露各边缘端钓鱼检测模型结构的情况下,通过垂直联邦学习策略,联合边缘端模型各自学习到的区块链交易网络特征嵌入,多方协同完成损失函数的计算与优化,提高区块链钓鱼节点检测模型的有效性,实现对区块链钓鱼节点的检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1为本发明提供的基于垂直联邦学习的区块链钓鱼节点检测方法的流程图;
图2为本发明提供的以太坊交易网络构建过程示意图;
图3为本发明提供的节点最大度值的网络规模控制方法示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1为本发明提供的基于垂直联邦学习的区块链钓鱼节点检测方法的流程图。如图1所示,实施例提供的区块链钓鱼节点检测方法包括以下步骤:
步骤1,根据区块链交易信息构建时间序列型区块链交易网络图和网络序列型区块链交易网络图。
步骤1具体包括获取区块链交易数据信息、构建时间序列型区块链交易网络图,构建网络序列型区块链交易网络图以及区块链交易网络图分发4个过程。
针对获取区块链交易数据信息,实施例使用公开的以太坊数据查询网站etherscan进行模型训练。在初始数据中,每笔交易包含了数十种属性,保留其中的交易双方(from和to),交易时间(timeStamp)和交易额(value)信息,将其余信息作为冗余信息舍去。
针对构建时间序列型区块链交易网络图,原始以太坊的数据过于庞大,且钓鱼节点与其相关交易仅占所有数据的极小部分,本发明通过查询与目标用户相关的交易记录,构建小规模的子网络进行训练。数据查询从一个或一些以太坊账户地址开始,以这些账户地址作为将要构成的网络中心(0阶地址)。从网络中心地址的交易记录中提取出交易的另外一方作为1阶账户地址,接着再使用同样的方式,以1阶账户地址为中心地址,根据交易记录提取另一方账户地址作为2阶账户地址,如此迭代下去,获取指定阶数以内的交易记录。在本发明中,选取一定数量的被标记为诈骗者的地址和等量随机选取的非诈骗者地址,以它们为中心,获取一个二阶网络。图2为示例性的给出的一个二阶网络的构建过程。
为了进一步控制网络规模,在交易数据转换为网络的过程中,通过设定单节点的最大度值,将超过最大度值的部分交易按照交易额由低到高的顺序修剪掉。修剪过程中,被剪去的部分可能还有下一阶的地址账户与之相连接,若不将这些连接地址账户也一并去处,网络中可能会存在许多小的连通片。修剪也是一个迭代的过程,除了当前被剪去的地址,与之相连的更大阶数的地址账户也需要一并去除。
图3展示了通过设置节点最大度值的网络规模控制方法。其中,图3(a)中节点v1为中心节点,节点v2与v3为超出度值限制需要删除的节点(此处最大度值设为3),若不迭代地进行修剪,仅删除深色的超出度值部分的节点,就会产生图3(b)中的深色的孤立连通片。在实验中,本发明设定节点最大度值为100,通过最大阶数和最大度值两种控制手段,最终获得时间序列型区块链交易网络
Figure BDA0002841681300000071
其中V表示节点集合,E表示链路集合,X表示每条链路对应的交易额与时间信息。
针对构建网络序列型区块链交易网络。相比于时间序列型数据,网络序列型在深度学习模型中有着更广的应用。在构建时间序列型区块链交易网络后,删除网络链路中的交易时间信息,并将时间信息压缩到网络序列中的每个分片之上,即根据交易时间段将时间序列型区块链交易网络分片成多个网格分片图,每个网格分片图中的节点数与时间序列型区块链交易网络图的节点数相同,网格序列中的每个网络分片图是非多连边网络,若同一网络分片中的同一节点对之间存在多条链路,需要将这多条链路合并为一条链路,将求和后的交易额作为新的链路交易额信息。最终获得T个网格分片图组成的网络序列型区块链交易网络
Figure BDA0002841681300000081
其中At∈RN×N表示第t个网格分片图的邻接矩阵,
Figure BDA0002841681300000082
表示第t个网格分片图中第i个节点与第j个节点间的交易额。
针对区块链交易网络图分发,实施例将时间序列型区块链交易网络图和网络序列型区块链交易网络图分发到过个边缘端,用于对边缘端区块链钓鱼检测模型的训练。
步骤2,各边缘端分别利用分发的区块链交易网络图进行边缘端区块链钓鱼检测模型的训练。
在对边缘端区块链钓鱼检测模型进行训练时,各边缘端可以使用不同类型的区块链交易数据
Figure BDA0002841681300000085
对不同的模型结构进行训练。本发明以两种不同的边缘端区块链钓鱼检测模型fA(·)与fB(·)为例进行训练。
实施例中,边缘端区块链钓鱼检测模型fA(·)利用参数为ΘA的门控循环单元GRU学习节点嵌入,GRU结构如公式(1)所示;
Figure BDA0002841681300000083
其中,Wz、Uz、Wr、Ur、W和U是可训练的权重,
Figure BDA0002841681300000084
表示计算中的中间量,σ是sigmoid激活函数。GRU以前一时刻的细胞状态ht-1和当前时刻的输入xt作为输入,输出当前的细胞状态ht,并作为当前时刻的输出。将GRU的每次细胞状态计算过程简化表示为公式(2):
ht=GRU(ht-1,xt) (2)
利用GRU进行节点i嵌入的过程表示为:
Figure BDA0002841681300000091
其中,
Figure BDA0002841681300000092
是节点i在第t时刻的GRU细胞状态,
Figure BDA0002841681300000093
表示第0个网格分片图的邻接矩阵的第i行。边缘端区块链钓鱼检测模型fA(·)中的参数记为ΘA
Figure BDA0002841681300000094
是所有时刻的细胞状态的拼接向量,表示节点i的嵌入向量。
实施例中,边缘端区块链钓鱼检测模型fB(·)利用随机游走采样,通过公式(4)计算游走转移概率P,得到节点序列集合{v1,v2,…,vl},vi∈V:
Figure BDA0002841681300000095
其中,e为链路,W(·)为链路到交易额的映射函数,T(·)为链路到时间戳的映射函数。Lt(vi)代表从vi出发,下一链路时间大于当前已有链路时间的链路集合,e表示候选链路集合Lt(vi)中的链路。η-(+)(·)表示该游走转移概率的计算可以关注不同的链路时间特征,其中,η-(·):
Figure BDA0002841681300000096
为降序排序函数,表示该游走概率更关注账户间较新的交易,η+(·):
Figure BDA0002841681300000097
为升序排序函数,表示该游走更关注账户在较长时间间隔内的交易。λ参数用于调节交易额与时间信息所构成的游走转移概率的比重。
对于随机游走采样得到的节点序列,采用参数为ΘB的Skip-Gram模型实现对网络节点的嵌入。以公式(5)为优化目标,最大程度地提高观察到节点邻域(取决于其嵌入向量)的对数概率pr,最终得到节点的嵌入向量
Figure BDA0002841681300000098
Figure BDA0002841681300000099
其中,k是限制随机游走上下文大小的窗口大小,φ(·)表示将节点嵌入到R1×d维空间的嵌入函数,φ(vi)表示
Figure BDA0002841681300000101
的第i行。
步骤3,服务器端将传入的多个节点嵌入向量的注意力加权求和结果作为服务端的区块链钓鱼检测模型的输入数据,结合节点类标对服务端的区块链钓鱼检测模型进行训练。
实施例中,边缘端区块链钓鱼检测模型学习得到的节点嵌入向量和节点类标上传至服务器端,服务器端通过注意力机制组合各边缘模型学习到的网络嵌入,训练服务器端的区块链钓鱼节点检测模型。
每一轮边缘端的区块链钓鱼节点检测模型训练完毕后,将边缘端模型fA(·)和fB(·)将学习得到的区块链网络的节点嵌入向量
Figure BDA0002841681300000102
Figure BDA0002841681300000103
和节点类标F=[τ1,…,τN]上传至服务器端,利用公式(6)为来自不同边缘端模型的网络嵌入分配注意力系数进行加权组合;
Figure BDA0002841681300000104
其中,α=[αAB]为注意力系数矩阵,
Figure BDA0002841681300000105
表示组合向量。
实施例中,服务器端的区块链钓鱼检测模型视为二分类模型,使用神经网络中的全连接神经网络作为分类器,实现对钓鱼节点的检测。对于节点嵌入向量
Figure BDA0002841681300000106
神经网络分类器中的隐藏层与输出层分别为:
Figure BDA0002841681300000107
Figure BDA0002841681300000108
Figure BDA0002841681300000109
其中,M是神经网络隐藏层数量,W(m)和b(m)分别是第m层的权重和偏置,
Figure BDA00028416813000001010
是节点i的第m层的隐藏层输出。神经网络的输出层只有一个神经元,
Figure BDA00028416813000001011
为最终的分类结果。
分类器的参数记为ΘNN,在每轮训练中,以公式(10)作为目标函数,通过随机梯度下降法优化ΘNN,训练所述的区块链钓鱼检测模型;
Figure BDA0002841681300000111
其中,Ts为带类标的区块链交易网络节点集合;F=[τ1,…,τN]表示网络节点类标集合,节点i的类标τi∈[0,1],τi=1表示节点i为钓鱼节点;若网络节点vl属于类τk,则Ylk=1,否则Ylk=0;
Figure BDA0002841681300000112
是由公式(9)计算出的分类置信度输出。
步骤4,服务器端下发训练的损失函数的梯度信息至两个边缘端,以更新边缘端区块链钓鱼检测模型的网络参数。
实施例中,服务器端将由神经网络分类器计算得到的分类置信度输出与节点真实类标的交叉熵损失函数发回至各边缘端,边缘端根据此时返回的损失函数的梯度信息对本地模型进行更新,具体来说,在同一轮训练中,以公式(11)作为目标函数,通过随机梯度下降法分别优化边缘端模型参数ΘA与ΘB,训练所述边缘端钓鱼检测模型;
Figure BDA0002841681300000113
采用上述区块链钓鱼节点检测方法中步骤1~4中的垂直联邦学习策略对来自多个边缘端的“不可知”的钓鱼检测模型进行联邦学习,提升了钓鱼检测模型的有效性,即提升区块链钓鱼节点检测能力。
步骤5,利用经过垂直联邦学习结束获得的边缘端与服务器端的区块链钓鱼检测模型共同实现区块链钓鱼节点的检测。
当联邦学习结束后,即可以利用边缘端与服务端的区块链钓鱼检测模型进行区块链钓鱼节点的检测,即将区块链的交易信息按照步骤1构建时间序列型区块链交易网络图或网络序列型区块链交易网络图,将区块链交易网络图输入对应输入格式需求的边缘端区块链钓鱼检测模型,得到目标交易网络图的嵌入表示,将其输入至服务端的区块链钓鱼检测模型中,经计算输出预测置信度,依据预测置信度结果来实现区块链节点是否为钓鱼节点。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,包括以下步骤:
根据区块链交易信息构建时间序列型区块链交易网络图和网络序列型区块链交易网络图,并将这两个区块链交易网络图分发到各边缘端;
各边缘端分别利用分发的区块链交易网络图进行边缘端区块链钓鱼检测模型的训练,并将获得区块链交易网络图的节点嵌入向量和节点类标上传至服务器端;
服务器端将传入的多个节点嵌入向量的注意力加权求和结果作为服务端的区块链钓鱼检测模型的输入数据,结合节点类标对服务端的区块链钓鱼检测模型进行训练,并下发训练的损失函数的梯度信息至两个边缘端,以更新边缘端区块链钓鱼检测模型的网络参数;
利用经过垂直联邦学习结束获得的边缘端与服务器端的区块链钓鱼检测模型共同实现区块链钓鱼节点的检测。
2.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,根据区块链交易信息构建时间序列型区块链交易网络图的过程为:
以至少一个账户地址为中心地址,根据交易记录提取另一方账户地址作为一阶账户地址,接着以一阶账户地址为中心地址,根据交易记录提取另一方账户地址作为二阶账户地址,如此迭代,直到提取完指定阶段的交易记录,得到有账户地址作为节点的交易网络图;
依据预设的度阈值,将交易网络图中超过度阈值的节点删除,并将与超过度阈值的节点连接的更大阶数的节点同时删除,得到时间序列型区块链交易网络图,表示为
Figure FDA0002841681290000021
其中,V表示节点集合,E表示链路集合,X表示每条链路对应的交易额与交易时间信息。
3.如权利要求2所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,根据区块链交易信息构建网格序列型区块链交易网络图的过程为:
将时间序列型区块链交易网络图中的交易时间信息去除,同时依据交易时间段对时间序列型区块链交易网络图进行分片,每个交易时间段的交易信息形成一个网格分片图,每个网格分片图中的节点数与时间序列型区块链交易网络图的节点数相同,且将网格分片图中同一节点对之间的多条交易金额合并,将求和后的交易额作为新链路交易额,最终获得T网格分片图组成的网格序列型区块链交易网络图,表示为
Figure FDA0002841681290000022
其中,At∈RN×N表示第t个网格分片图的邻接矩阵,
Figure FDA0002841681290000023
表示At中第i个节点与第j个节点间的交易额。
4.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,边缘端采用门控循环单元作为边缘端区块链钓鱼检测模型,利用网格序列型区块链交易网络图对门控循环单元进行训练,同时提取网格序列型区块链交易网络图的节点嵌入向量。
5.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,边缘端采用随机游走采样算法和Skip-Gram模型作为边缘端区块链钓鱼检测模型,随机游走采样算法提取时间序列型区块链交易网络图中的序列信息,利用序列信息训练Skip-Gram模型,同时提取时间序列型区块链交易网络图的节点嵌入向量。
6.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,服务器端采用以下公式对两个节点嵌入向量的注意力加权求和,得到组合向量作为服务端的区块链钓鱼检测模型的输入数据,
Figure FDA0002841681290000031
其中,
Figure FDA0002841681290000032
表示采用模型参数为ΘA的边缘端区块链钓鱼检测模型对网格序列型区块链交易网络图
Figure FDA0002841681290000033
提取的节点嵌入向量,
Figure FDA0002841681290000034
表示采用模型参数为ΘB的边缘端区块链钓鱼检测模型对时间序列型区块链交易网络图
Figure FDA0002841681290000035
提取的节点嵌入向量,α=[αAB]为注意力系数矩阵,
Figure FDA0002841681290000036
表示组合向量。
7.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,服务端的区块链钓鱼检测模型采用全连接神经网络作为分类器,实现对钓鱼节点的二分类预测。
8.如权利要求1或7所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,对服务端的区块链钓鱼检测模型进行训练,以区块链钓鱼检测模型的预测置信度与节点类标的交叉熵为损失函数。
9.如权利要求1所述的基于垂直联邦学习的区块链钓鱼节点检测方法,其特征在于,利用边缘端与服务器端的区块链钓鱼检测模型共同实现区块链钓鱼节点的检测时,将区块链的交易信息构建成时间序列型区块链交易网络图或网络序列型区块链交易网络图,将区块链交易网络图输入对应输入格式需求的边缘端区块链钓鱼检测模型,得到目标交易网络图的嵌入表示并输入至服务端的区块链钓鱼检测模型中,经计算输出预测置信度,依据预测置信度结果来实现区块链节点是否为钓鱼节点。
CN202011494397.6A 2020-12-17 2020-12-17 一种基于垂直联邦学习的区块链钓鱼节点检测方法 Active CN112738034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011494397.6A CN112738034B (zh) 2020-12-17 2020-12-17 一种基于垂直联邦学习的区块链钓鱼节点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011494397.6A CN112738034B (zh) 2020-12-17 2020-12-17 一种基于垂直联邦学习的区块链钓鱼节点检测方法

Publications (2)

Publication Number Publication Date
CN112738034A true CN112738034A (zh) 2021-04-30
CN112738034B CN112738034B (zh) 2022-04-29

Family

ID=75603898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011494397.6A Active CN112738034B (zh) 2020-12-17 2020-12-17 一种基于垂直联邦学习的区块链钓鱼节点检测方法

Country Status (1)

Country Link
CN (1) CN112738034B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283902A (zh) * 2021-06-11 2021-08-20 浙江工业大学 一种基于图神经网络的多通道区块链钓鱼节点检测方法
CN113283909A (zh) * 2021-06-09 2021-08-20 广东工业大学 一种基于深度学习的以太坊钓鱼账户检测方法
CN113660270A (zh) * 2021-08-17 2021-11-16 区块动力(广州)科技有限公司 一种区块链交易处理及其权限管理方法
GB2595954A (en) * 2020-06-12 2021-12-15 Fujitsu Ltd Detection program, detection method, and detection device
CN115577858A (zh) * 2022-11-21 2023-01-06 山东能源数智云科技有限公司 基于区块链的碳排放量预测方法、装置及电子设备
CN116361719A (zh) * 2023-03-27 2023-06-30 烟台大学 一种以太坊网络钓鱼用户的检测方法和系统
CN116527313A (zh) * 2023-03-23 2023-08-01 中国科学院信息工程研究所 一种区块链钓鱼行为检测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360200A (zh) * 2017-09-20 2017-11-17 广东工业大学 一种基于分类信心和网站特征的钓鱼检测方法
CN109101552A (zh) * 2018-07-10 2018-12-28 东南大学 一种基于深度学习的钓鱼网站url检测方法
CN109658245A (zh) * 2018-12-14 2019-04-19 杭州云象网络技术有限公司 基于多模混合深度学习的ico项目欺诈自动判别方法
US20200014528A1 (en) * 2018-07-03 2020-01-09 International Business Machines Corporation Strengthening non-repudiation of blockchain transactions
CN111325619A (zh) * 2018-12-15 2020-06-23 深圳先进技术研究院 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
CN111461855A (zh) * 2019-01-18 2020-07-28 同济大学 基于欠采样的信用卡欺诈检测方法及系统、介质、设备
CN111552986A (zh) * 2020-07-10 2020-08-18 鹏城实验室 基于区块链的联邦建模方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360200A (zh) * 2017-09-20 2017-11-17 广东工业大学 一种基于分类信心和网站特征的钓鱼检测方法
US20200014528A1 (en) * 2018-07-03 2020-01-09 International Business Machines Corporation Strengthening non-repudiation of blockchain transactions
CN109101552A (zh) * 2018-07-10 2018-12-28 东南大学 一种基于深度学习的钓鱼网站url检测方法
CN109658245A (zh) * 2018-12-14 2019-04-19 杭州云象网络技术有限公司 基于多模混合深度学习的ico项目欺诈自动判别方法
CN111325619A (zh) * 2018-12-15 2020-06-23 深圳先进技术研究院 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
CN111461855A (zh) * 2019-01-18 2020-07-28 同济大学 基于欠采样的信用卡欺诈检测方法及系统、介质、设备
CN111552986A (zh) * 2020-07-10 2020-08-18 鹏城实验室 基于区块链的联邦建模方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A. R. SHORT等: "Using Blockchain Technologies to Improve Security in Federated Learning Systems", 《2020 IEEE 44TH ANNUAL COMPUTERS, SOFTWARE, AND APPLICATIONS CONFERENCE (COMPSAC)》 *
吴超 等: "面向公共管理的数据所有权保护、定价和分布式应用机制探讨", 《电子政务》 *
阳文斯: "基于联邦学习的信用卡欺诈检测系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2595954A (en) * 2020-06-12 2021-12-15 Fujitsu Ltd Detection program, detection method, and detection device
CN113283909A (zh) * 2021-06-09 2021-08-20 广东工业大学 一种基于深度学习的以太坊钓鱼账户检测方法
CN113283902A (zh) * 2021-06-11 2021-08-20 浙江工业大学 一种基于图神经网络的多通道区块链钓鱼节点检测方法
CN113660270A (zh) * 2021-08-17 2021-11-16 区块动力(广州)科技有限公司 一种区块链交易处理及其权限管理方法
CN113660270B (zh) * 2021-08-17 2024-02-06 区块动力(广州)科技有限公司 一种区块链交易处理及其权限管理方法
CN115577858A (zh) * 2022-11-21 2023-01-06 山东能源数智云科技有限公司 基于区块链的碳排放量预测方法、装置及电子设备
CN116527313A (zh) * 2023-03-23 2023-08-01 中国科学院信息工程研究所 一种区块链钓鱼行为检测方法及装置
CN116527313B (zh) * 2023-03-23 2024-04-19 中国科学院信息工程研究所 一种区块链钓鱼行为检测方法及装置
CN116361719A (zh) * 2023-03-27 2023-06-30 烟台大学 一种以太坊网络钓鱼用户的检测方法和系统
CN116361719B (zh) * 2023-03-27 2024-02-02 烟台大学 一种以太坊网络钓鱼用户的检测方法和系统

Also Published As

Publication number Publication date
CN112738034B (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN112738034B (zh) 一种基于垂直联邦学习的区块链钓鱼节点检测方法
CN110473083B (zh) 树状风险账户识别方法、装置、服务器及存储介质
CN112861967B (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
CN112418520B (zh) 一种基于联邦学习的信用卡交易风险预测方法
CN112949837A (zh) 一种基于可信网络的目标识别联邦深度学习方法
Liu et al. Keep your data locally: Federated-learning-based data privacy preservation in edge computing
CN112446310B (zh) 基于区块链的年龄识别系统、方法及装置
CN112910711B (zh) 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质
CN113283902B (zh) 一种基于图神经网络的多通道区块链钓鱼节点检测方法
Yang et al. Using highly compressed gradients in federated learning for data reconstruction attacks
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN112258250A (zh) 基于网络热点的目标用户识别方法、装置和计算机设备
CN115859187A (zh) 对象识别方法、装置、电子设备及存储介质
CN117669834A (zh) 一种交通流预测方法、装置及存储介质
CN112435034A (zh) 一种基于多网络图聚合的营销套利黑产的识别方法
CN117132129A (zh) 考虑天气因素的园区碳排放图神经网络预测方法及系统
CN116050828A (zh) 基于复杂关系网络的风险团伙识别方法和系统
CN114265954B (zh) 基于位置与结构信息的图表示学习方法
CN111935259B (zh) 目标帐号集合的确定方法和装置、存储介质及电子设备
CN113554510A (zh) 一种贷款用户违约实时监控系统
CN114912927A (zh) 一种区块链反诈骗分析方法及系统
CN112581177B (zh) 结合自动特征工程及残差神经网络的营销预测方法
CN112950222A (zh) 资源处理异常检测方法、装置、电子设备及存储介质
CN116226501A (zh) 信息推送方法、装置、计算机设备及存储介质
CN113244629A (zh) 流失帐号的召回方法和装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant