CN112465641A

CN112465641A - 一种基于gcn的区块链交易风险分析方法

Info

Publication number: CN112465641A
Application number: CN202011447232.3A
Authority: CN
Inventors: 郭文生; 钱智成; 杨霞; 瞿元; 李南铮; 黄一; 潘文睿; 高扬; 张冯博; 卢秀台; 熊宇; 万俊; 林珍珍; 闫哲; 任超; 郑旭东
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2021-03-09

Abstract

本发明公开了一种基于GCN的区块链交易风险分析方法，包括：步骤S1：对目标交易进行溯源，获得其资金来源的交易；步骤S2：对比资金来源交易中的地址和地址库，计算已知地址的风险值，按照资金比例汇总得到已知风险值；步骤S3：将未知地址涉及的交易输入GCN得到风险值，按照资金比例汇总计算估计风险值；步骤S4：合并S2中的已知风险值和S3中的估计风险值。本发明通过比对地址库对已知地址分析风险值，并对未知地址结合GCN估计其所属交易的风险，对比传统机器学习的估计方法，加强了对交易图的点和关系的利用，提高了区块链交易风险分析的准确率。

Description

一种基于GCN的区块链交易风险分析方法

技术领域

本发明涉及深度学习、图卷积网络和区块链领域，具体涉及一种基于GCN的区块链交易风险分析方法。

背景技术

区块链技术是一种新型的分布式账本技术，它可以在互不信任的环境下实现去信任中介的可信交易。与传统数据库技术相比，区块链技术具有防伪造，不可篡改以及能方便实现智能合约等特点。区块链已成为社会的关注焦点。

随着区块链技术的发展，由于缺乏有效监管，缺乏通用规范，代码漏洞等原因，区块链上的攻击屡见不鲜，并且安全事件的爆发逐年递增，在2019年已经造成了全球超过 60亿美元的损失。因此，如何有效检测和防范区块链上的攻击成为了重中之重。

随着人工智能技术的飞速发展，对于图数据的研究也逐渐加深，图数据是由点(目标)和边(关系)构成的数据结构，这类数据常出现在金融交易，社交网络，知识图谱等领域。随着2007年，GNN正式进入人们的视野，之后许多图神经网络的变种陆陆续续被提出，由于这些方法能很好的处理图数据输入(CNN不容易处理不具有平移不变性的数据)，能够捕捉点之间的依赖关系，并且具有良好的可解释性，GNN相关方法被广泛应用在社交网络，知识图谱等领域。其中GCN作为GNN的一个变种，将CNN上的卷积引入到了图中，通过拉普拉斯矩阵提取点之间的关系，从而提高了模型的识别能力，并简化了运算的复杂度。

发明内容

为了检测区块链上的风险交易，进而防范攻击事件，本发明提出了一种基于GCN的区块链交易风险分析方法。该方法包括如下步骤：步骤S1：对目标交易进行溯源，获取一定数量的资金来源交易；步骤S2：对比这些交易中的地址与地址库，对已知地址按照资金比例，计算已知风险值(风险值为0-1之间的值，越接近1代表其风险越高，已知风险值，即代表已知地址计算得到的风险值)；步骤S3：将未知地址涉及的交易输入GCN得到风险值，汇总资金，按比例计算估计风险值；步骤S4：合并S2中的已知风险值和S3中的估计风险值。

进一步地，步骤S1中，区块链上的交易必定是可溯源的，一笔交易分为输入和输出两部分，溯源表示已知一笔交易，递归找他的输入资金来源的交易。

进一步地，步骤S2中，已知地址库中包含地址和地址风险值构成的键值对，在 S1中，溯源得到的交易中如果有已经存在于地址库中的地址，则可以直接得到其风险值，再根据这个地址占据的目标交易的资金比重，两者相乘即可计算这个地址对目标交易的风险值，累加这些风险值，即可得到已知风险值。

进一步地，步骤S3中进行估计风险值的计算可以使用GCN模型，输入为交易，输出为风险值，同样和资金占目标交易的比重相乘，汇总即可得到估计风险值。

进一步地，步骤S3中，GCN使用二阶切比雪夫多项式的近似作为卷积核，使得卷积部分可以简化为H＝LXW，这里L为加上单位矩阵后的对称归一化拉普拉斯矩阵，X的输入，W为权重矩阵，H为卷积输出。GCN模型构建包括如下步骤，步骤S31：计算加上单位矩阵后的对称归一化拉普拉斯矩阵L；步骤S32：计算第一层卷积，连接Relu激活函数；步骤S33：计算第二层卷积，连接Relu激活函数，权重和第一层卷积不共享，再连接 Softmax函数归一化输出；步骤S34：计算交叉熵损失，使用Adam优化器优化权重。

进一步地，所述步骤31中，对称归一化拉普拉斯矩阵的计算需要用到邻接矩阵，即区块链中的交易图，这里以交易做点，两笔交易共同的资金作为边(例如交易a的输出是交易b的输入，则交易a和交易b相连)，由交易图的点和边关系，可以构建邻接矩阵，进而计算L。

进一步地，在步骤S32中，权重W，大小为输入向量X的维度*16，激活函数使用Relu，dropout参数设为0.5。

进一步地，在步骤S33中，输入为第一层卷积的输出，权重W’(与S32中的W 不同)大小为16*2，激活函数为Relu，dropout参数为0.5，再连接Softmax归一化输出，得到二分类结果，这里对应于两个类别(风险交易，安全交易)。

进一步地，在步骤S34中，损失函数为交叉熵，优化器使用Adam。

进一步地，在步骤S4中，将步骤S2中得到的已知风险值加上步骤S3中得到的估计风险值即为最终该交易的风险值(即两部分带权风险值的和)。

根据本发明的基于GCN的区块链交易风险分析方法，可以有效利用区块链交易中的图结构信息，并且结合已有地址库，提高交易风险评估的准确率。

附图说明

图1为本发明的具体流程图。

图2为本发明使用的GCN模型。

图3为区块链上交易的示例图。

具体实施方案

现结合具体实例并参照附图对本发明做进一步详细说明。

图1为本发明的一种基于GCN的区块链交易风险分析方法流程图。如图1所示，该方法包括如下步骤。

步骤S1：已知目标交易，溯源得到其资金来源的交易列表，并得到这些交易以及交易中的地址对应的资金比例，如图3，为区块链上的交易示意图，每个框代表一笔交易，交易的左边代表输入，右边代表输出，每个圆代表交易中涉及的一个地址，地址旁边标记了该地址参与这笔交易的金额。可以看到，如果目标交易为transaction1(下面将transaction简写为TX)，则这笔交易的资金输入为地址A和地址B，他们分别对应TX2和TX3的输出，所以目标交易溯源可以理解为TX1的资金来自TX2和和TX3，TX3的资金又部分来自TX4，以此类推，所以溯源可以得到资金来源的所有交易，又由于每个地址知道其参与一笔交易的金额，所以可以计算溯源得到的每一笔交易占目标交易的资金比例，例如TX4占TX1的资金比例就是0.1。

步骤S2：已知地址库，库中存在地址和风险值的键值对，例如T：0.3，T代表地址，0.3代表风险值。在步骤S1中，已经溯源得到了资金来源的交易，使用这些交易的输入地址在地址库中查找其对应的风险值，如果存在，则可以通过资金比例与风险值相乘，求和得到已知风险值，即存在于地址库中地址的带权(资金比例)风险值之和。

步骤S3：步骤S2中使用已知地址库来匹配溯源得到的交易中的地址，由于地址库不可能覆盖所有地址，所以必然存在未知风险值的地址，这时候可以将包含未知风险值地址的交易输入GCN来估计该交易的风险值。同样通过资金比例和风险值相乘，求和得到估计风险值，即未在地址库中地址所属交易的带权(资金比例)风险值之和。

步骤S31：使用交易图的邻接矩阵计算对称归一化拉普拉斯矩阵，交易图为由交易作为点，两笔交易共同的资金作为边构成的图。这里考虑到区块链上的交易很多，由此计算的邻接矩阵会非常大，可以考虑按照一定时间区间，例如一周，构建局部的交易图来计算。

步骤S32：前向传播过程中，首先计算第一层卷积，该层的权重W的尺寸为输入向量X的维度*16，这里使用dropout避免过拟合，参数为0.5，激活函数使用Relu。

步骤S33：第二层卷积的权重为W’，尺寸为16*2，同样使用dropout避免过拟合，参数为0.5，激活函数为Relu，后接Softmax归一化输出。

步骤S34：计算交叉熵损失，使用Adam优化器优化权重。

步骤S4：由于步骤S2中对存在于地址库中的地址计算了已知风险值，步骤S3对未存在于地址库中的地址所属的交易计算了估计风险值，两者相加即为目标交易的风险值。

以上对本发明进行了详细介绍，本文中使用了具体实例对本发明的原理和实施方法进行了阐述，以上实例的使用只是用于帮助理解本发明的方法和核心思想，同时，本领域技术人员应当理解，依据设计要求和其他因素可出现各种修改、组合、子组合和替换，只要他们落在所附权利要求及其等同物的范围内即可。

Claims

1.一种基于GCN的区块链交易风险分析方法，其特征在于，该方法包括：

步骤S1：对目标交易进行溯源，获得其资金来源的交易；

步骤S2：对比资金来源交易中的地址和地址库，计算已知地址的风险值，按照资金比例汇总得到已知风险值；

步骤S3：将未知地址涉及的交易输入GCN得到风险值，按照资金比例汇总计算估计风险值；

步骤S4：合并S2中的已知风险值和S3中的估计风险值得到目标交易的风险值。

2.根据权利要求1所述的方法，其特征在于：

步骤S1：对交易进行溯源，一笔交易包括输入和输出两部分地址，输入部分的地址又代表另一笔交易的输出，所以按照输入部分的地址向前溯源可以得到资金来源的交易。

3.根据权利要求1所述的方法，其特征在于：

步骤S3：使用GCN网络，输入为交易，经过拉普拉斯矩阵提取图特征，再经过两层卷积获得其分类结果，作为风险值，具体为：

步骤S31：计算加上单位矩阵后的对称归一化拉普拉斯矩阵；

步骤S32：计算第一层卷积，权重W为输入向量X的维度*16，激活函数为Relu；

步骤S33：计算第二层卷积，输入为第一层卷积的输出，权重W’为16*2，激活函数为Relu，后接Softmax归一化输出，输出为安全交易和风险交易的二分类概率；

步骤S34：计算损失函数，优化权重，损失函数为交叉熵，优化器使用Adam。