CN112465641A - 一种基于gcn的区块链交易风险分析方法 - Google Patents
一种基于gcn的区块链交易风险分析方法 Download PDFInfo
- Publication number
- CN112465641A CN112465641A CN202011447232.3A CN202011447232A CN112465641A CN 112465641 A CN112465641 A CN 112465641A CN 202011447232 A CN202011447232 A CN 202011447232A CN 112465641 A CN112465641 A CN 112465641A
- Authority
- CN
- China
- Prior art keywords
- transaction
- address
- risk value
- risk
- gcn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于GCN的区块链交易风险分析方法,包括:步骤S1:对目标交易进行溯源,获得其资金来源的交易;步骤S2:对比资金来源交易中的地址和地址库,计算已知地址的风险值,按照资金比例汇总得到已知风险值;步骤S3:将未知地址涉及的交易输入GCN得到风险值,按照资金比例汇总计算估计风险值;步骤S4:合并S2中的已知风险值和S3中的估计风险值。本发明通过比对地址库对已知地址分析风险值,并对未知地址结合GCN估计其所属交易的风险,对比传统机器学习的估计方法,加强了对交易图的点和关系的利用,提高了区块链交易风险分析的准确率。
Description
技术领域
本发明涉及深度学习、图卷积网络和区块链领域,具体涉及一种基于GCN的区块链交易风险分析方法。
背景技术
区块链技术是一种新型的分布式账本技术,它可以在互不信任的环境下实现去信任 中介的可信交易。与传统数据库技术相比,区块链技术具有防伪造,不可篡改以及能方便实 现智能合约等特点。区块链已成为社会的关注焦点。
随着区块链技术的发展,由于缺乏有效监管,缺乏通用规范,代码漏洞等原因, 区块链上的攻击屡见不鲜,并且安全事件的爆发逐年递增,在2019年已经造成了全球超过 60亿美元的损失。因此,如何有效检测和防范区块链上的攻击成为了重中之重。
随着人工智能技术的飞速发展,对于图数据的研究也逐渐加深,图数据是由点(目标)和边(关系)构成的数据结构,这类数据常出现在金融交易,社交网络,知识图谱等领域。随着2007年,GNN正式进入人们的视野,之后许多图神经网络的变种陆陆续续被提出,由 于这些方法能很好的处理图数据输入(CNN不容易处理不具有平移不变性的数据),能够捕捉点之间的依赖关系,并且具有良好的可解释性,GNN相关方法被广泛应用在社交网络,知 识图谱等领域。其中GCN作为GNN的一个变种,将CNN上的卷积引入到了图中,通过拉 普拉斯矩阵提取点之间的关系,从而提高了模型的识别能力,并简化了运算的复杂度。
发明内容
为了检测区块链上的风险交易,进而防范攻击事件,本发明提出了一种基于GCN的区块链交易风险分析方法。该方法包括如下步骤:步骤S1:对目标交易进行溯源,获取 一定数量的资金来源交易;步骤S2:对比这些交易中的地址与地址库,对已知地址按照资 金比例,计算已知风险值(风险值为0-1之间的值,越接近1代表其风险越高,已知风险值, 即代表已知地址计算得到的风险值);步骤S3:将未知地址涉及的交易输入GCN得到风险 值,汇总资金,按比例计算估计风险值;步骤S4:合并S2中的已知风险值和S3中的估计 风险值。
进一步地,步骤S1中,区块链上的交易必定是可溯源的,一笔交易分为输入和输出两部分,溯源表示已知一笔交易,递归找他的输入资金来源的交易。
进一步地,步骤S2中,已知地址库中包含地址和地址风险值构成的键值对,在 S1中,溯源得到的交易中如果有已经存在于地址库中的地址,则可以直接得到其风险值, 再根据这个地址占据的目标交易的资金比重,两者相乘即可计算这个地址对目标交易的风险值,累加这些风险值,即可得到已知风险值。
进一步地,步骤S3中进行估计风险值的计算可以使用GCN模型,输入为交易, 输出为风险值,同样和资金占目标交易的比重相乘,汇总即可得到估计风险值。
进一步地,步骤S3中,GCN使用二阶切比雪夫多项式的近似作为卷积核,使得 卷积部分可以简化为H=LXW,这里L为加上单位矩阵后的对称归一化拉普拉斯矩阵,X的 输入,W为权重矩阵,H为卷积输出。GCN模型构建包括如下步骤,步骤S31:计算加上 单位矩阵后的对称归一化拉普拉斯矩阵L;步骤S32:计算第一层卷积,连接Relu激活函数; 步骤S33:计算第二层卷积,连接Relu激活函数,权重和第一层卷积不共享,再连接 Softmax函数归一化输出;步骤S34:计算交叉熵损失,使用Adam优化器优化权重。
进一步地,所述步骤31中,对称归一化拉普拉斯矩阵的计算需要用到邻接矩阵,即区块链中的交易图,这里以交易做点,两笔交易共同的资金作为边(例如交易a的输出是交易b的输入,则交易a和交易b相连),由交易图的点和边关系,可以构建邻接矩阵,进 而计算L。
进一步地,在步骤S32中,权重W,大小为输入向量X的维度*16,激活函数使 用Relu,dropout参数设为0.5。
进一步地,在步骤S33中,输入为第一层卷积的输出,权重W’(与S32中的W 不同)大小为16*2,激活函数为Relu,dropout参数为0.5,再连接Softmax归一化输出,得 到二分类结果,这里对应于两个类别(风险交易,安全交易)。
进一步地,在步骤S34中,损失函数为交叉熵,优化器使用Adam。
进一步地,在步骤S4中,将步骤S2中得到的已知风险值加上步骤S3中得到的估 计风险值即为最终该交易的风险值(即两部分带权风险值的和)。
根据本发明的基于GCN的区块链交易风险分析方法,可以有效利用区块链交易中的图结构信息,并且结合已有地址库,提高交易风险评估的准确率。
附图说明
图1为本发明的具体流程图。
图2为本发明使用的GCN模型。
图3为区块链上交易的示例图。
具体实施方案
现结合具体实例并参照附图对本发明做进一步详细说明。
图1为本发明的一种基于GCN的区块链交易风险分析方法流程图。如图1所示, 该方法包括如下步骤。
步骤S1:已知目标交易,溯源得到其资金来源的交易列表,并得到这些交易以及交易中的地址对应的资金比例,如图3,为区块链上的交易示意图,每个框代表一笔交易,交易的左边代表输入,右边代表输出,每个圆代表交易中涉及的一个地址,地址旁边标记了该地址参与这笔交易的金额。可以看到,如果目标交易为transaction1(下面将transaction简 写为TX),则这笔交易的资金输入为地址A和地址B,他们分别对应TX2和TX3的输出, 所以目标交易溯源可以理解为TX1的资金来自TX2和和TX3,TX3的资金又部分来自TX4, 以此类推,所以溯源可以得到资金来源的所有交易,又由于每个地址知道其参与一笔交易的 金额,所以可以计算溯源得到的每一笔交易占目标交易的资金比例,例如TX4占TX1的资 金比例就是0.1。
步骤S2:已知地址库,库中存在地址和风险值的键值对,例如T:0.3,T代表地 址,0.3代表风险值。在步骤S1中,已经溯源得到了资金来源的交易,使用这些交易的输入 地址在地址库中查找其对应的风险值,如果存在,则可以通过资金比例与风险值相乘,求和 得到已知风险值,即存在于地址库中地址的带权(资金比例)风险值之和。
步骤S3:步骤S2中使用已知地址库来匹配溯源得到的交易中的地址,由于地址 库不可能覆盖所有地址,所以必然存在未知风险值的地址,这时候可以将包含未知风险值地址的交易输入GCN来估计该交易的风险值。同样通过资金比例和风险值相乘,求和得到估计风险值,即未在地址库中地址所属交易的带权(资金比例)风险值之和。
步骤S31:使用交易图的邻接矩阵计算对称归一化拉普拉斯矩阵,交易图为由交易作为点,两笔交易共同的资金作为边构成的图。这里考虑到区块链上的交易很多,由此计算的邻接矩阵会非常大,可以考虑按照一定时间区间,例如一周,构建局部的交易图来计算。
步骤S32:前向传播过程中,首先计算第一层卷积,该层的权重W的尺寸为输入 向量X的维度*16,这里使用dropout避免过拟合,参数为0.5,激活函数使用Relu。
步骤S33:第二层卷积的权重为W’,尺寸为16*2,同样使用dropout避免过拟合, 参数为0.5,激活函数为Relu,后接Softmax归一化输出。
步骤S34:计算交叉熵损失,使用Adam优化器优化权重。
步骤S4:由于步骤S2中对存在于地址库中的地址计算了已知风险值,步骤S3对 未存在于地址库中的地址所属的交易计算了估计风险值,两者相加即为目标交易的风险值。
以上对本发明进行了详细介绍,本文中使用了具体实例对本发明的原理和实施方法进行了阐述,以上实例的使用只是用于帮助理解本发明的方法和核心思想,同时,本领域技术人员应当理解,依据设计要求和其他因素可出现各种修改、组合、子组合和替换,只要他们落在所附权利要求及其等同物的范围内即可。
Claims (3)
1.一种基于GCN的区块链交易风险分析方法,其特征在于,该方法包括:
步骤S1:对目标交易进行溯源,获得其资金来源的交易;
步骤S2:对比资金来源交易中的地址和地址库,计算已知地址的风险值,按照资金比例汇总得到已知风险值;
步骤S3:将未知地址涉及的交易输入GCN得到风险值,按照资金比例汇总计算估计风险值;
步骤S4:合并S2中的已知风险值和S3中的估计风险值得到目标交易的风险值。
2.根据权利要求1所述的方法,其特征在于:
步骤S1:对交易进行溯源,一笔交易包括输入和输出两部分地址,输入部分的地址又代表另一笔交易的输出,所以按照输入部分的地址向前溯源可以得到资金来源的交易。
3.根据权利要求1所述的方法,其特征在于:
步骤S3:使用GCN网络,输入为交易,经过拉普拉斯矩阵提取图特征,再经过两层卷积获得其分类结果,作为风险值,具体为:
步骤S31:计算加上单位矩阵后的对称归一化拉普拉斯矩阵;
步骤S32:计算第一层卷积,权重W为输入向量X的维度*16,激活函数为Relu;
步骤S33:计算第二层卷积,输入为第一层卷积的输出,权重W’为16*2,激活函数为Relu,后接Softmax归一化输出,输出为安全交易和风险交易的二分类概率;
步骤S34:计算损失函数,优化权重,损失函数为交叉熵,优化器使用Adam。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011447232.3A CN112465641A (zh) | 2020-12-09 | 2020-12-09 | 一种基于gcn的区块链交易风险分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011447232.3A CN112465641A (zh) | 2020-12-09 | 2020-12-09 | 一种基于gcn的区块链交易风险分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112465641A true CN112465641A (zh) | 2021-03-09 |
Family
ID=74801484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011447232.3A Pending CN112465641A (zh) | 2020-12-09 | 2020-12-09 | 一种基于gcn的区块链交易风险分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465641A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107085812A (zh) * | 2016-12-06 | 2017-08-22 | 雷盈企业管理(上海)有限公司 | 区块链数字资产的反洗钱系统及方法 |
CN110400220A (zh) * | 2019-07-23 | 2019-11-01 | 上海氪信信息技术有限公司 | 一种基于半监督图神经网络的智能可疑交易监测方法 |
CN111160919A (zh) * | 2019-12-31 | 2020-05-15 | 众安信息技术服务有限公司 | 一种区块链地址风险评估方法及装置 |
CN111461711A (zh) * | 2020-03-12 | 2020-07-28 | 上海宓猿信息技术有限公司 | 一种区块链交易的追踪系统 |
CN111476662A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 反洗钱识别方法及装置 |
-
2020
- 2020-12-09 CN CN202011447232.3A patent/CN112465641A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107085812A (zh) * | 2016-12-06 | 2017-08-22 | 雷盈企业管理(上海)有限公司 | 区块链数字资产的反洗钱系统及方法 |
CN110400220A (zh) * | 2019-07-23 | 2019-11-01 | 上海氪信信息技术有限公司 | 一种基于半监督图神经网络的智能可疑交易监测方法 |
CN111160919A (zh) * | 2019-12-31 | 2020-05-15 | 众安信息技术服务有限公司 | 一种区块链地址风险评估方法及装置 |
CN111461711A (zh) * | 2020-03-12 | 2020-07-28 | 上海宓猿信息技术有限公司 | 一种区块链交易的追踪系统 |
CN111476662A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 反洗钱识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Karim et al. | Decision tree and naive bayes algorithm for classification and generation of actionable knowledge for direct marketing | |
Li et al. | Resolving conflicts in heterogeneous data by truth discovery and source reliability estimation | |
JP2018538587A (ja) | リスク評価方法およびシステム | |
CN106548350B (zh) | 一种数据处理方法及服务器 | |
Qian et al. | Running time analysis of the (1+ 1)-EA for OneMax and LeadingOnes under bit-wise noise | |
CN104484616A (zh) | 一种MapReduce数据处理框架下的隐私保护方法 | |
Zhu et al. | Binarizedattack: Structural poisoning attacks to graph-based anomaly detection | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
CN115344863A (zh) | 一种基于图神经网络的恶意软件快速检测方法 | |
Zhang et al. | Adaptive infinite impulse response system identification using an enhanced golden jackal optimization | |
CN111475838A (zh) | 基于深度神经网络的图数据匿名方法、装置、存储介质 | |
Hao et al. | An unsupervised detection method for shilling attacks based on deep learning and community detection | |
CN114187112A (zh) | 账户风险模型的训练方法和风险用户群体的确定方法 | |
Han et al. | Data valuation for vertical federated learning: An information-theoretic approach | |
Wang et al. | Detecting shilling groups in online recommender systems based on graph convolutional network | |
CN112465641A (zh) | 一种基于gcn的区块链交易风险分析方法 | |
CN116545679A (zh) | 一种工业情境安全基础框架及网络攻击行为特征分析方法 | |
Ruijuan et al. | User abnormal behavior analysis based on neural network clustering | |
CN115982570A (zh) | 联邦学习建模的多环节自定义优化方法、装置、设备和存储介质 | |
Agarwal et al. | A Comparative Study and enhancement of classification techniques using Principal Component Analysis for credit card dataset | |
CN114519605A (zh) | 广告点击欺诈检测方法、系统、服务器和存储介质 | |
Vaishnaw et al. | Development of anti-phishing model for classification of phishing e-mail | |
CN114240659A (zh) | 一种基于动态图卷积神经网络的区块链异常节点识别方法 | |
Kapoor et al. | An obfuscated attack detection approach for collaborative recommender systems | |
CN114581086A (zh) | 基于动态时序网络的钓鱼账户检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210309 |