CN112465641A - 一种基于gcn的区块链交易风险分析方法 - Google Patents

一种基于gcn的区块链交易风险分析方法 Download PDF

Info

Publication number
CN112465641A
CN112465641A CN202011447232.3A CN202011447232A CN112465641A CN 112465641 A CN112465641 A CN 112465641A CN 202011447232 A CN202011447232 A CN 202011447232A CN 112465641 A CN112465641 A CN 112465641A
Authority
CN
China
Prior art keywords
transaction
address
risk value
risk
gcn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011447232.3A
Other languages
English (en)
Inventor
郭文生
钱智成
杨霞
瞿元
李南铮
黄一
潘文睿
高扬
张冯博
卢秀台
熊宇
万俊
林珍珍
闫哲
任超
郑旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202011447232.3A priority Critical patent/CN112465641A/zh
Publication of CN112465641A publication Critical patent/CN112465641A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于GCN的区块链交易风险分析方法,包括:步骤S1:对目标交易进行溯源,获得其资金来源的交易;步骤S2:对比资金来源交易中的地址和地址库,计算已知地址的风险值,按照资金比例汇总得到已知风险值;步骤S3:将未知地址涉及的交易输入GCN得到风险值,按照资金比例汇总计算估计风险值;步骤S4:合并S2中的已知风险值和S3中的估计风险值。本发明通过比对地址库对已知地址分析风险值,并对未知地址结合GCN估计其所属交易的风险,对比传统机器学习的估计方法,加强了对交易图的点和关系的利用,提高了区块链交易风险分析的准确率。

Description

一种基于GCN的区块链交易风险分析方法
技术领域
本发明涉及深度学习、图卷积网络和区块链领域,具体涉及一种基于GCN的区块链交易风险分析方法。
背景技术
区块链技术是一种新型的分布式账本技术,它可以在互不信任的环境下实现去信任 中介的可信交易。与传统数据库技术相比,区块链技术具有防伪造,不可篡改以及能方便实 现智能合约等特点。区块链已成为社会的关注焦点。
随着区块链技术的发展,由于缺乏有效监管,缺乏通用规范,代码漏洞等原因, 区块链上的攻击屡见不鲜,并且安全事件的爆发逐年递增,在2019年已经造成了全球超过 60亿美元的损失。因此,如何有效检测和防范区块链上的攻击成为了重中之重。
随着人工智能技术的飞速发展,对于图数据的研究也逐渐加深,图数据是由点(目标)和边(关系)构成的数据结构,这类数据常出现在金融交易,社交网络,知识图谱等领域。随着2007年,GNN正式进入人们的视野,之后许多图神经网络的变种陆陆续续被提出,由 于这些方法能很好的处理图数据输入(CNN不容易处理不具有平移不变性的数据),能够捕捉点之间的依赖关系,并且具有良好的可解释性,GNN相关方法被广泛应用在社交网络,知 识图谱等领域。其中GCN作为GNN的一个变种,将CNN上的卷积引入到了图中,通过拉 普拉斯矩阵提取点之间的关系,从而提高了模型的识别能力,并简化了运算的复杂度。
发明内容
为了检测区块链上的风险交易,进而防范攻击事件,本发明提出了一种基于GCN的区块链交易风险分析方法。该方法包括如下步骤:步骤S1:对目标交易进行溯源,获取 一定数量的资金来源交易;步骤S2:对比这些交易中的地址与地址库,对已知地址按照资 金比例,计算已知风险值(风险值为0-1之间的值,越接近1代表其风险越高,已知风险值, 即代表已知地址计算得到的风险值);步骤S3:将未知地址涉及的交易输入GCN得到风险 值,汇总资金,按比例计算估计风险值;步骤S4:合并S2中的已知风险值和S3中的估计 风险值。
进一步地,步骤S1中,区块链上的交易必定是可溯源的,一笔交易分为输入和输出两部分,溯源表示已知一笔交易,递归找他的输入资金来源的交易。
进一步地,步骤S2中,已知地址库中包含地址和地址风险值构成的键值对,在 S1中,溯源得到的交易中如果有已经存在于地址库中的地址,则可以直接得到其风险值, 再根据这个地址占据的目标交易的资金比重,两者相乘即可计算这个地址对目标交易的风险值,累加这些风险值,即可得到已知风险值。
进一步地,步骤S3中进行估计风险值的计算可以使用GCN模型,输入为交易, 输出为风险值,同样和资金占目标交易的比重相乘,汇总即可得到估计风险值。
进一步地,步骤S3中,GCN使用二阶切比雪夫多项式的近似作为卷积核,使得 卷积部分可以简化为H=LXW,这里L为加上单位矩阵后的对称归一化拉普拉斯矩阵,X的 输入,W为权重矩阵,H为卷积输出。GCN模型构建包括如下步骤,步骤S31:计算加上 单位矩阵后的对称归一化拉普拉斯矩阵L;步骤S32:计算第一层卷积,连接Relu激活函数; 步骤S33:计算第二层卷积,连接Relu激活函数,权重和第一层卷积不共享,再连接 Softmax函数归一化输出;步骤S34:计算交叉熵损失,使用Adam优化器优化权重。
进一步地,所述步骤31中,对称归一化拉普拉斯矩阵的计算需要用到邻接矩阵,即区块链中的交易图,这里以交易做点,两笔交易共同的资金作为边(例如交易a的输出是交易b的输入,则交易a和交易b相连),由交易图的点和边关系,可以构建邻接矩阵,进 而计算L。
进一步地,在步骤S32中,权重W,大小为输入向量X的维度*16,激活函数使 用Relu,dropout参数设为0.5。
进一步地,在步骤S33中,输入为第一层卷积的输出,权重W’(与S32中的W 不同)大小为16*2,激活函数为Relu,dropout参数为0.5,再连接Softmax归一化输出,得 到二分类结果,这里对应于两个类别(风险交易,安全交易)。
进一步地,在步骤S34中,损失函数为交叉熵,优化器使用Adam。
进一步地,在步骤S4中,将步骤S2中得到的已知风险值加上步骤S3中得到的估 计风险值即为最终该交易的风险值(即两部分带权风险值的和)。
根据本发明的基于GCN的区块链交易风险分析方法,可以有效利用区块链交易中的图结构信息,并且结合已有地址库,提高交易风险评估的准确率。
附图说明
图1为本发明的具体流程图。
图2为本发明使用的GCN模型。
图3为区块链上交易的示例图。
具体实施方案
现结合具体实例并参照附图对本发明做进一步详细说明。
图1为本发明的一种基于GCN的区块链交易风险分析方法流程图。如图1所示, 该方法包括如下步骤。
步骤S1:已知目标交易,溯源得到其资金来源的交易列表,并得到这些交易以及交易中的地址对应的资金比例,如图3,为区块链上的交易示意图,每个框代表一笔交易,交易的左边代表输入,右边代表输出,每个圆代表交易中涉及的一个地址,地址旁边标记了该地址参与这笔交易的金额。可以看到,如果目标交易为transaction1(下面将transaction简 写为TX),则这笔交易的资金输入为地址A和地址B,他们分别对应TX2和TX3的输出, 所以目标交易溯源可以理解为TX1的资金来自TX2和和TX3,TX3的资金又部分来自TX4, 以此类推,所以溯源可以得到资金来源的所有交易,又由于每个地址知道其参与一笔交易的 金额,所以可以计算溯源得到的每一笔交易占目标交易的资金比例,例如TX4占TX1的资 金比例就是0.1。
步骤S2:已知地址库,库中存在地址和风险值的键值对,例如T:0.3,T代表地 址,0.3代表风险值。在步骤S1中,已经溯源得到了资金来源的交易,使用这些交易的输入 地址在地址库中查找其对应的风险值,如果存在,则可以通过资金比例与风险值相乘,求和 得到已知风险值,即存在于地址库中地址的带权(资金比例)风险值之和。
步骤S3:步骤S2中使用已知地址库来匹配溯源得到的交易中的地址,由于地址 库不可能覆盖所有地址,所以必然存在未知风险值的地址,这时候可以将包含未知风险值地址的交易输入GCN来估计该交易的风险值。同样通过资金比例和风险值相乘,求和得到估计风险值,即未在地址库中地址所属交易的带权(资金比例)风险值之和。
步骤S31:使用交易图的邻接矩阵计算对称归一化拉普拉斯矩阵,交易图为由交易作为点,两笔交易共同的资金作为边构成的图。这里考虑到区块链上的交易很多,由此计算的邻接矩阵会非常大,可以考虑按照一定时间区间,例如一周,构建局部的交易图来计算。
步骤S32:前向传播过程中,首先计算第一层卷积,该层的权重W的尺寸为输入 向量X的维度*16,这里使用dropout避免过拟合,参数为0.5,激活函数使用Relu。
步骤S33:第二层卷积的权重为W’,尺寸为16*2,同样使用dropout避免过拟合, 参数为0.5,激活函数为Relu,后接Softmax归一化输出。
步骤S34:计算交叉熵损失,使用Adam优化器优化权重。
步骤S4:由于步骤S2中对存在于地址库中的地址计算了已知风险值,步骤S3对 未存在于地址库中的地址所属的交易计算了估计风险值,两者相加即为目标交易的风险值。
以上对本发明进行了详细介绍,本文中使用了具体实例对本发明的原理和实施方法进行了阐述,以上实例的使用只是用于帮助理解本发明的方法和核心思想,同时,本领域技术人员应当理解,依据设计要求和其他因素可出现各种修改、组合、子组合和替换,只要他们落在所附权利要求及其等同物的范围内即可。

Claims (3)

1.一种基于GCN的区块链交易风险分析方法,其特征在于,该方法包括:
步骤S1:对目标交易进行溯源,获得其资金来源的交易;
步骤S2:对比资金来源交易中的地址和地址库,计算已知地址的风险值,按照资金比例汇总得到已知风险值;
步骤S3:将未知地址涉及的交易输入GCN得到风险值,按照资金比例汇总计算估计风险值;
步骤S4:合并S2中的已知风险值和S3中的估计风险值得到目标交易的风险值。
2.根据权利要求1所述的方法,其特征在于:
步骤S1:对交易进行溯源,一笔交易包括输入和输出两部分地址,输入部分的地址又代表另一笔交易的输出,所以按照输入部分的地址向前溯源可以得到资金来源的交易。
3.根据权利要求1所述的方法,其特征在于:
步骤S3:使用GCN网络,输入为交易,经过拉普拉斯矩阵提取图特征,再经过两层卷积获得其分类结果,作为风险值,具体为:
步骤S31:计算加上单位矩阵后的对称归一化拉普拉斯矩阵;
步骤S32:计算第一层卷积,权重W为输入向量X的维度*16,激活函数为Relu;
步骤S33:计算第二层卷积,输入为第一层卷积的输出,权重W’为16*2,激活函数为Relu,后接Softmax归一化输出,输出为安全交易和风险交易的二分类概率;
步骤S34:计算损失函数,优化权重,损失函数为交叉熵,优化器使用Adam。
CN202011447232.3A 2020-12-09 2020-12-09 一种基于gcn的区块链交易风险分析方法 Pending CN112465641A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011447232.3A CN112465641A (zh) 2020-12-09 2020-12-09 一种基于gcn的区块链交易风险分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011447232.3A CN112465641A (zh) 2020-12-09 2020-12-09 一种基于gcn的区块链交易风险分析方法

Publications (1)

Publication Number Publication Date
CN112465641A true CN112465641A (zh) 2021-03-09

Family

ID=74801484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011447232.3A Pending CN112465641A (zh) 2020-12-09 2020-12-09 一种基于gcn的区块链交易风险分析方法

Country Status (1)

Country Link
CN (1) CN112465641A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱系统及方法
CN110400220A (zh) * 2019-07-23 2019-11-01 上海氪信信息技术有限公司 一种基于半监督图神经网络的智能可疑交易监测方法
CN111160919A (zh) * 2019-12-31 2020-05-15 众安信息技术服务有限公司 一种区块链地址风险评估方法及装置
CN111461711A (zh) * 2020-03-12 2020-07-28 上海宓猿信息技术有限公司 一种区块链交易的追踪系统
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱系统及方法
CN110400220A (zh) * 2019-07-23 2019-11-01 上海氪信信息技术有限公司 一种基于半监督图神经网络的智能可疑交易监测方法
CN111160919A (zh) * 2019-12-31 2020-05-15 众安信息技术服务有限公司 一种区块链地址风险评估方法及装置
CN111461711A (zh) * 2020-03-12 2020-07-28 上海宓猿信息技术有限公司 一种区块链交易的追踪系统
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置

Similar Documents

Publication Publication Date Title
Karim et al. Decision tree and naive bayes algorithm for classification and generation of actionable knowledge for direct marketing
Li et al. Resolving conflicts in heterogeneous data by truth discovery and source reliability estimation
JP2018538587A (ja) リスク評価方法およびシステム
CN106548350B (zh) 一种数据处理方法及服务器
Qian et al. Running time analysis of the (1+ 1)-EA for OneMax and LeadingOnes under bit-wise noise
CN104484616A (zh) 一种MapReduce数据处理框架下的隐私保护方法
Zhu et al. Binarizedattack: Structural poisoning attacks to graph-based anomaly detection
CN111639690A (zh) 基于关系图谱学习的欺诈分析方法、系统、介质及设备
CN115344863A (zh) 一种基于图神经网络的恶意软件快速检测方法
Zhang et al. Adaptive infinite impulse response system identification using an enhanced golden jackal optimization
CN111475838A (zh) 基于深度神经网络的图数据匿名方法、装置、存储介质
Hao et al. An unsupervised detection method for shilling attacks based on deep learning and community detection
CN114187112A (zh) 账户风险模型的训练方法和风险用户群体的确定方法
Han et al. Data valuation for vertical federated learning: An information-theoretic approach
Wang et al. Detecting shilling groups in online recommender systems based on graph convolutional network
CN112465641A (zh) 一种基于gcn的区块链交易风险分析方法
CN116545679A (zh) 一种工业情境安全基础框架及网络攻击行为特征分析方法
Ruijuan et al. User abnormal behavior analysis based on neural network clustering
CN115982570A (zh) 联邦学习建模的多环节自定义优化方法、装置、设备和存储介质
Agarwal et al. A Comparative Study and enhancement of classification techniques using Principal Component Analysis for credit card dataset
CN114519605A (zh) 广告点击欺诈检测方法、系统、服务器和存储介质
Vaishnaw et al. Development of anti-phishing model for classification of phishing e-mail
CN114240659A (zh) 一种基于动态图卷积神经网络的区块链异常节点识别方法
Kapoor et al. An obfuscated attack detection approach for collaborative recommender systems
CN114581086A (zh) 基于动态时序网络的钓鱼账户检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210309