CN114998005A - 一种基于联邦图神经网络技术的比特币异常交易识别方法 - Google Patents
一种基于联邦图神经网络技术的比特币异常交易识别方法 Download PDFInfo
- Publication number
- CN114998005A CN114998005A CN202210449217.5A CN202210449217A CN114998005A CN 114998005 A CN114998005 A CN 114998005A CN 202210449217 A CN202210449217 A CN 202210449217A CN 114998005 A CN114998005 A CN 114998005A
- Authority
- CN
- China
- Prior art keywords
- model
- neural network
- node
- training
- participant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 20
- 238000005516 engineering process Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 34
- 230000006870 function Effects 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 14
- 230000006399 behavior Effects 0.000 claims description 13
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 230000004931 aggregating effect Effects 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000000586 desensitisation Methods 0.000 description 2
- 210000002364 input neuron Anatomy 0.000 description 2
- 238000004900 laundering Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/382—Payment protocols; Details thereof insuring higher security of transaction
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Computer Security & Cryptography (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明涉及一种基于联邦图神经网络技术的比特币异常交易识别方法,属于区块链应用安全技术领域。本方法包括联邦学习训练和图神经网络训练。各个参与者在本地利用图神经网络对交易数据进行建模,并充分利用交易数据之间的邻居特征。在训练各自的本地模型之后,参与者将本地模型的梯度通过隐私保护的方式聚合到服务器,共同更新全局模型的参数,并将输出结果反馈给参与者进行迭代更新,从而实现在数据保护场景下进行比特币恶意交易联合识别分析。
Description
技术领域
本发明涉及一种比特币异常交易识别方法,具体涉及一种基于联邦图神经网络技术的比特币异常交易识别方法,属于区块链应用安全技术领域。
背景技术
比特币是一种去中心化的数字货币,它不依赖于一个可信的实体,是一个基于密码学和点对点网络的支付系统,一经提出就受到了各方研究者的关注,并吸引了全球范围内的大量用户和投资者。
比特币交易的基本构建单元和价值单元是未花费的交易输出(UnspentTransaction Output,简称UTXO),且不能再次分割。比特币的UTXO集合包含所有的UTXO,用户钱包的余额就是可以使用的UTXO的总额,每一个UTXO作为整体参与比特币交易。一笔交易产生的新UTXO将会被另一笔交易使用,意味着资金从一笔交易流向另一笔交易。此外,匿名性是比特币的重要属性之一,旨在保护用户的身份信息,隐藏用户与交易之间的关联关系。在比特币的交易中,交易参与方并不直接使用姓名、证件号码等真实的身份信息来发起/接收交易,而是将系统生成的假名地址作为交易时的身份标识,这保证了用户在交易过程中的匿名性。
然而,匿名性在保护用户身份及交易隐私的同时,也为不法分子的犯罪行为提供了天然的屏障,使得以比特币为代表的数字货币市场存在异常交易的风险。
当前,数字货币的生态中存在各种各样的异常交易行为,包括庞氏骗局、勒索病毒、洗钱等,这些非法行为给人们的财产造成了极大的损失,严重破坏了网络空间的金融秩序。因此,有必要研究如何的识别比特币异常交易行为。
为了能够更好地利用比特币交易数据之间的特征,同时满足特征数据的隐私保护需求,必须采用合适的技术手段,在保护特征数据隐私的同时训练出具有高性能的异常交易识别模型,维护网络空间的金融秩序,为用户提供更加安全的服务和更加健康的投资环境。
发明内容
本发明的目的是为了解决现有的比特币异常交易识别方法无法有效利用交易的邻居特征,且存在数据泄露隐患的技术问题,根据比特币UTXO交易模型的特点,创造性地提出了一种基于联邦图神经网络技术的比特币异常交易识别方法,旨在对参与者本地数据保护的场景下,利用比特币资金流动的特性构建交易特征,实现对比特币异常交易行为的识别。
本发明的创新点在于:首次提出了一种新的比特币异常交易识别方法,各个参与者在本地利用图神经网络对交易数据进行建模,充分利用交易数据之间的邻居特征。在训练各自的本地模型之后,参与者将本地模型的梯度通过隐私保护的方式聚合到服务器,共同更新全局模型的参数,并将输出结果反馈给参与者进行迭代更新,从而实现在数据保护场景下进行比特币异常交易联合识别分析的需求。
本发明采用以下技术方式实现。
一种基于联邦图神经网络技术的比特币异常交易识别方法,主要包括联邦学习训练和图神经网络训练。每轮训练包括四个过程。
首先,服务器将初始模型参数传递给每个参与者。
然后,每个参与者根据其本地数据,使用图神经网络训练本地机器学习模型,充分利用交易数据之间的邻居特征。
每个参与者拥有一个本地比特币交易图数据集是图的节点集合,每个节点代表一笔交易,Ei是图的边集合,每条边代表交易双方之间存在的资金流动,每个图节点关联一个特征向量和一个标签,通过对节点的邻居进行随机采样,控制参与计算的邻居节点的数量。将采样后的邻居嵌入矩阵传递给该节点,并利用聚合函数对这些邻居信息进行聚合,更新节点的嵌入矩阵。
在本地训练结束后,参与者将各自模型训练的梯度发送到服务器。服务器聚合这些参数以更新全局模型,传递给参与者继续进行下一轮次的训练。
当达到设置的指定训练轮次后,完成可识别比特币异常交易行为的联邦图神经网络模型训练。利用该联邦图神经网络模型,实现对比特币异常交易行为进行识别。
具体地,本方法包括以下步骤:
通过对节点的邻居进行随机采样(可以利用GraphSAGE等),聚合多跳邻居信息,生成局部节点嵌入矩阵。
进一步地,步骤2采用以下方法实现:
步骤2.1:利用随机采样函数对节点的邻居进行采样,根据式1将每个节点其邻域内节点的嵌入矩阵聚合成单个向量:
步骤2.2:在对邻居节点的嵌入矩阵进行聚合之后,根据式2利用一个非线性激活函数,将聚合的邻域嵌入信息与当前节点的嵌入信息连接起来,更新当前节点的表示:
步骤4:服务器将全局模型参数发送给所有参与者,使参与者更新本地模型。
至此,完成联邦学习模型训练的一个轮次。
重复步骤1至步骤4,直到达到设置的指定训练轮次,从而完成可识别比特币异常交易行为的联邦图神经网络模型训练。
步骤5:利用上述联邦图神经网络模型,实现对比特币异常交易行为进行识别。
有益效果
本方法,基于比特币的UTXO模型特点,根据交易之间的资金流动,通过图神经网络挖掘交易之间的邻居特征。每个参与者使用本地的特征数据训练模型,并利用联邦学习技术传递模型梯度以更新全局模型,能够在保护用户本地数据隐私的同时,实现比特币异常交易行为的联合识别分析。
对比现有技术,本方法具有以下优点:
1.本发明利用了比特币交易之间的资金流动特性,利用图神经网络学习交易之间的邻居特征;
2.本发明考虑了集中式机器学习依赖于一个中心化的数据集,使得交易特征数据存在隐私泄露的风险,且加重了计算负荷。于是引入联邦学习技术,对存储在不同站点的比特币交易数据进行本地计算,通过传递梯度参数更新全局模型,保护特征数据的安全性;
3.实验证明,本方法比特币交易图数据集上的性能相较于现有技术得到明显提升,能够实现超过99%的异常交易识别准确率。
附图说明
图1是本发明方法的联邦图学习过程示意图。
具体实施方式
下面结合附图和实施例,对本发明方法做进一步详细说明。应当指出,本发明的实施不限于以下实施例,对本发明所做任何形式上的变通或改变将落入本发明保护范围。
实施例1
一种基于联邦图神经网络技术的比特币异常交易识别方法。
图1描述了一种基于联邦学习框架下利用图神经网络识别比特币异常交易的场景。设该场景中共有40个参与者,1个服务器。
参与者训练本地模型并上传梯度,服务器对梯度进行聚合并更新全局模型为联邦学习训练过程的一个轮次,该场景下共进行200个联邦学习轮次;每个参与者每次训练本地模型时迭代5个轮次;设置联邦学习的参数batch size=128,learning rate=0.001,其中batchsize为批处理大小即参与者训练本地模型时一次训练时的数据数量,learning rate为学习率;目标模型为带有一个GraphSAGE图卷积层以及三个隐藏层的神经网络,使用ReLU激活函数和Adam优化器。
依托于上述图1中的模型,具体实施本发明所述方法时,包括以下步骤:
具体到本实施例,模型数据集是经过脱敏和拆分处理后的Elliptic Data Set数据集(https://www.elliptic.co/blog/elliptic-dataset-cryptocurrency-financial-crime),它包含40个子数据集,每个子数据集代表一个分布式节点,其数据构成单独一张图,40个节点共同完成联邦学习;整个数据集共有203,769个节点和234,355笔交易流,将交易标记为三种类型(0为非法,1为合法,2为未知),每个图节点关联165个交易特征(93个原生特征和72个聚合特征);40个参与者每轮都参与模型训练,模型数据中的训练数据集和测试数据集被平均分成份并分别被个参与者所拥有;每个参与者使用自己拥有的数据训练本地模型并得到模型参数。
步骤2.1:利用随机采样函数对节点的邻居进行采样,再根据式1将每个节点其邻域内节点的嵌入矩阵聚合成单个向量。
步骤2.2:在对邻居节点的嵌入矩阵进行聚合之后,根据式2利用一个非线性激活函数将聚合的邻域嵌入信息与当前节点的嵌入信息连接起来,从而更新当前节点的表示。
步骤3:服务器接收所有参与者发送的本地模型梯度,根据式3对这些模型梯度求平均值,将平均后的模型参数作为新的全局模型参数。
步骤4:服务器将全局模型参数发送给所有参与者,使参与者更新本地模型,至此,至此完成了联邦学习模型训练的一个轮次。
重复步骤1至4直到达到200个轮次,完成识别比特币异常交易行为的联邦图神经网络模型训练。
步骤5:利用上述联邦图神经网络模型,实现对比特币异常交易行为进行识别。
结果表明,使用经过脱敏和拆分处理后的Elliptic Data Set数据集、图神经网络中采用三层GraphSAGE作为图的卷积层、采用ReLU作为激活函数的目标模型,得到的目标模型的识别正确率为99.4%、识别精度为89.4%、识别召回率为75.1%;在训练80个轮次左右时,目标模型收敛至最佳识别正确率;这些结果表明目标模型对于比特币异常交易的识别具有较强的性能,能够满足在保护交易特征数据安全性和模型隐私性的前提下实现对比特币异常交易的联合识别分析的需求。
实施例2
本实施例是将本发明所述方法与多种在联邦学习框架下的监督机器学习方法进行对比,验证本发明的异常交易识别方法与其他方法相比具有更好的比特币异常交易识别效果。
使用经过脱敏和拆分处理后Elliptic Data Set作为数据集和LogisticRegression以及Multilayer Perceptron模型作为对比模型;相同数据集在不同模型下对于比特币异常交易识别结果如表1所示。
对比的第一种识别方法是一种基于特征的机器学习逻辑回归方法,可以实现分类问题;因具有高度可解释性的优点,是反洗钱场景中的首选方法;设置LogisticRegression中的参数为scikit-learn Python包中的默认参数,使用Logistic Regression的识别方法具有89.2%的识别正确率、67.7%的识别精度以及56.4%的识别召回率;结果显示本发明的识别方法与Logistic Regression相比具有更高的正确率、精度以及召回率。
对比的第二种识别方法是一种基于特征的机器学习多层感知机方法;MultilayerPerceptron中每个输入神经元接收一个数据特征,在正向传播过程中使用激活函数对隐含层进行处理,输出是对应于每个类别的概率向量;输入神经元的个数为165(对应165个交易特征),设置了一个有96个神经元的隐藏层,并选择ReLU函数进行激活处理;为了防止模型过拟合,提升泛化能力,添加了dropout层以降低神经元之间的耦合(drop rate=0.5),学习率为0.001;为了加快运算速度,提高数据稳定性,使用log_softmax函数处理得到对应类别的概率向量;使用Multilayer Perceptron的识别方法具有97.2%的识别正确率、91.2%的识别精度以及67.5%的识别召回率;结果显示本发明的识别方法与MultilayerPerceptron相比具有更高的正确率以及召回率。
以上结果表明,本发明的比特币异常交易识别方法与其他识别方法相比能够在保护交易特征数据隐私安全的前提下实现更好的异常交易识别效果。
表1相同数据集在不同模型下对于比特币异常交易识别结果
以上所述结合附图和实施例描述了本发明的实施方式,但是对于本领域技术人员来说,在不脱离本专利原理的前提下,还能够做出若干改进,这些也是为属于本专利的保护范围。
Claims (2)
1.一种基于联邦图神经网络技术的比特币异常交易识别方法,其特征在于,包括以下步骤:
首先,服务器将初始模型参数传递给每个参与者;
然后,每个参与者根据其本地数据,使用图神经网络训练本地机器学习模型,充分利用交易数据之间的邻居特征;
每个参与者拥有一个本地比特币交易图数据集Ni是图的节点集合,每个节点代表一笔交易,Ei是图的边集合,每条边代表交易双方之间存在的资金流动,每个图节点关联一个特征向量和一个标签,通过对节点的邻居进行随机采样,控制参与计算的邻居节点的数量;将采样后的邻居嵌入矩阵传递给该节点,并利用聚合函数对这些邻居信息进行聚合,更新节点的嵌入矩阵;
在本地训练结束后,参与者将各自模型训练的梯度发送到服务器;服务器聚合这些参数以更新全局模型,传递给参与者继续进行下一轮次的训练;
当达到设置的指定训练轮次后,完成可识别比特币异常交易行为的联邦图神经网络模型训练;利用该联邦图神经网络模型,实现对比特币异常交易行为进行识别。
利用随机采样函数对节点的邻居进行采样,根据式1将每个节点其邻域内节点的嵌入矩阵聚合成单个向量:
在对邻居节点的嵌入矩阵进行聚合之后,根据式2利用一个非线性激活函数,将聚合的邻域嵌入信息与当前节点的嵌入信息连接起来,更新当前节点的表示:
服务器接收所有参与者发送的本地模型梯度,根据式3对这些模型梯度求平均值,将平均后的模型参数作为新的全局模型参数:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210449217.5A CN114998005A (zh) | 2022-04-24 | 2022-04-24 | 一种基于联邦图神经网络技术的比特币异常交易识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210449217.5A CN114998005A (zh) | 2022-04-24 | 2022-04-24 | 一种基于联邦图神经网络技术的比特币异常交易识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114998005A true CN114998005A (zh) | 2022-09-02 |
Family
ID=83025035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210449217.5A Pending CN114998005A (zh) | 2022-04-24 | 2022-04-24 | 一种基于联邦图神经网络技术的比特币异常交易识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114998005A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545467A (zh) * | 2022-09-30 | 2022-12-30 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
CN116738201A (zh) * | 2023-02-17 | 2023-09-12 | 云南大学 | 基于图对比学习的非法账户识别方法 |
CN117395164A (zh) * | 2023-12-12 | 2024-01-12 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
-
2022
- 2022-04-24 CN CN202210449217.5A patent/CN114998005A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545467A (zh) * | 2022-09-30 | 2022-12-30 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
CN115545467B (zh) * | 2022-09-30 | 2024-01-23 | 广东工业大学 | 一种基于图神经网络的风险商品识别模型 |
CN116738201A (zh) * | 2023-02-17 | 2023-09-12 | 云南大学 | 基于图对比学习的非法账户识别方法 |
CN116738201B (zh) * | 2023-02-17 | 2024-01-16 | 云南大学 | 基于图对比学习的非法账户识别方法 |
CN117395164A (zh) * | 2023-12-12 | 2024-01-12 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
CN117395164B (zh) * | 2023-12-12 | 2024-03-26 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114998005A (zh) | 一种基于联邦图神经网络技术的比特币异常交易识别方法 | |
CN112534453B (zh) | 区块链交易安全 | |
CN112418520B (zh) | 一种基于联邦学习的信用卡交易风险预测方法 | |
Miraz et al. | Application of blockchain in booking and registration systems of securities exchanges | |
CN112740252A (zh) | 使用智能合约的区块链交易安全性 | |
CN108710808A (zh) | 一种基于区块链的调研支付平台 | |
CN110300985A (zh) | 基于智能合约白名单在区块链网络中并行执行交易 | |
WO2023185485A1 (zh) | 基于自适应分割联邦学习的模型训练方法和人脸识别方法 | |
CN110717758B (zh) | 异常交易识别方法和装置 | |
CN113240524A (zh) | 联邦学习系统中账户的异常检测方法、装置及电子设备 | |
Liang et al. | Co-maintained database based on blockchain for idss: A lifetime learning framework | |
EP3696766A1 (en) | Program, system and method for determining credit worthiness of a user | |
CN112039702A (zh) | 基于联邦学习和相互学习的模型参数训练方法及装置 | |
CN114386043A (zh) | 一种面向群智感知的去中心隐私保持信誉评估方法 | |
CN108596586A (zh) | 区块链运行方法及记账权节点 | |
KR102274654B1 (ko) | 블록체인 네트워크에 기반한 게임 데이터 저장 및 활용 방법 | |
Cai et al. | 2cp: Decentralized protocols to transparently evaluate contributivity in blockchain federated learning environments | |
CN113034145A (zh) | 用户异常加密数字资产交易类别判断方法、装置 | |
CN112801780A (zh) | 基于联邦学习的境内外风险客户识别方法、装置及系统 | |
CN116627970A (zh) | 一种基于区块链和联邦学习的数据共享方法及装置 | |
US12067559B2 (en) | Methods and systems for forensic investigations in contract networks | |
Mazorra et al. | Do not rug on me: Zero-dimensional Scam Detection | |
Tian et al. | Synergetic focal loss for imbalanced classification in federated xgboost | |
CN116680633B (zh) | 基于多任务学习的异常用户检测方法、系统及存储介质 | |
Masteika et al. | Bitcoin double-spending risk and countermeasures at physical retail locations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |