CN113283901B

CN113283901B - 一种面向区块链平台的基于字节码的诈骗合约检测方法

Info

Publication number: CN113283901B
Application number: CN202110627401.XA
Authority: CN
Inventors: 沈夏炯; 姜帅民; 张磊; 韩道军; 陈会平; 李星辰; 马夏青; 欧阳文蕾
Original assignee: Henan University
Current assignee: Henan University
Priority date: 2021-04-19
Filing date: 2021-06-04
Publication date: 2022-11-01
Anticipated expiration: 2041-06-04
Also published as: CN113283901A

Abstract

本发明公开了一种面向区块链平台的基于字节码的诈骗合约检测方法,依次包括以下步骤：A：获取区块链平台中智能合约的字节码，将获取到的字节码转化为标准化后的特征矩阵并消除特征矩阵中的噪声；B：获取诈骗合约的数据集并划分为训练集和测试集；然后将训练集和测试集中的测试数据分别转化为标准化后的特征矩阵；C：使用特征矩阵训练并测试异常检测模型，最终得到最佳异常检测模型；D：利用步骤C中得到的最佳异常检测模型，对待判定的智能合约进行是否为诈骗合约的判定。本发明能够有效的检测区块链平台中的诈骗类型的智能合约，维护区块链的健康发展。

Description

一种面向区块链平台的基于字节码的诈骗合约检测方法

技术领域

本发明涉及区块链领域，尤其涉及一种面向区块链平台的基于字节码的诈骗合约检测方法。

背景技术

区块链是一种具备时间戳、分布式共识和加密的技术，它可以在不依赖任何第三方中心化机构的情况下，实现点对点交易。而智能合约的出现赋予了区块链更多的可能性，使工业界和学术界对区块链技术给予了极大的关注，智能合约同样具有去中心化、自治化等特点，并且可以使分散的应用程序能够在不可信环境中运行。但是它的这些特点也容易被不法分子利用，当某人运行了诈骗合约(即诈骗类型的智能合约)之后，因为区块链去中心化、不可被篡改等特点，所以他将无法阻止诈骗合约的运行。诈骗合约的类型非常多，例如网络钓鱼合约、旁氏骗局合约等。虚拟货币调查和风险管理软件提供商Chainnalysis曾指出，仅在2017年上半年就有30287名受害者因为诈骗合约损失了2.25亿美元，这表明金融安全已经成为区块链生态系统中一个关键问题。

所以，在区块链中检测诈骗合约是维护区块链健康发展的一项重要任务。但是根据Dune Analytics的数据显示，截止2020年3月，仅以太坊区块链网络上发布的智能合约总量已经超过了200万份，显然使用人工检查区块链中的智能合约是不可取的。而目前又没有一种有效的检测手段检测区块链平台中的诈骗合约。

发明内容

本发明的目的是提供一种面向区块链平台的基于字节码的诈骗合约检测方法，能够有效的检测区块链平台中的诈骗类型的智能合约，维护区块链的健康发展。

本发明采用下述技术方案：

一种面向区块链平台的基于字节码的诈骗合约检测方法，依次包括以下步骤：

A：获取区块链平台中智能合约的字节码，将获取到的字节码转化为标准化后的特征矩阵并消除特征矩阵中的噪声；

B：获取诈骗合约的数据集D_all，并将诈骗合约的数据集D_all划分为训练集D_train和测试集D_test；然后将训练集D_train和测试集D_test中的测试数据分别转化为标准化后的特征矩阵B_train和特征矩阵B_test；

C：使用特征矩阵B_train训练异常检测模型，并使用特征矩阵B_test测试异常检测模型的性能；最终得到最佳异常检测模型；

异常检测模型采用单类支持向量机模型、孤立森林模型或者单类支持向量机和孤立森林的融合模型；

D：利用步骤C中得到的最佳异常检测模型，对待判定的智能合约进行是否为诈骗合约的判定。

所述的步骤A包括以下具体步骤：

A1：通过区块链平台获取智能合约的字节码；

A2：将获取到的字节码转化为特征矩阵A；

A3：对特征矩阵A进行标准化，设特征矩阵A＝{a₁,a₂,…,a_n},a₁,a₂,…,a_n为列向量，表示标准化之前的特征值。设特征矩阵B为标准化后的特征值，B＝{b₁,b₂,…,b_n}；

列向量a_n的标准化公式为：

其中，μ_n和σ_n分别表示列向量a_n的均值和方差；

A4：使用PCA算法消除标准化后特征矩阵的噪声，得到消除噪声后的标准化特征矩阵x，x＝{x₁,x₂,…,x_k}。

所述的步骤A4中，PCA算法采用特征分解或奇异值分解。

所述的步骤B包括以下具体步骤：

B1:获取诈骗合约的数据集D_all，并将诈骗合约的数据集D_all划分为训练集D_train和测试集D_test；

B2:利用步骤A3中的方法，将诈骗合约的训练集D_train中的训练数据和测试集D_test中的测试数据，分别转化为标准化后的特征矩阵B_train和特征矩阵B_test。

采用单类支持向量机模型作为异常检测模型的训练和测试的具体步骤如下：

C11:将特征矩阵B_train中的数据输入到单类支持向量机模型中；

C12：单类支持向量机模型通过非线性变化函数将特征矩阵B_train映射到新的特征空间

映射关系为

C13：首先，在新的特征空间

中构造一个体积最小的超球体；

s.t.‖φ(B_train)-a‖²≤R²+ξ_i,ξ_i≥0,i＝1,2,…,n；

其中，a表示超球体的球心，R表示超球体的半径，ξ表示松弛因子，ξ_i表示特征矩阵B_train中第i个列向量的松弛因子，C表示权衡超球体体积和误分类率的惩罚参数，n表示特征矩阵B_train中共有n个列向量；

然后，计算特征矩阵B_train中的测试样本到超球体球心的距离d；

设从特征矩阵B_train中挑选的测试样本为x_t，则x_t到超球体球心的距离d为：

K(x_t,x_t)、K(x_t,x_i)和K(x_i,x_j)均表示核函数，a_i和a_j分别表示样本x_i和x_j对应的拉格朗日系数；x_i和x_j分别表示从特征矩阵B_train中选择的两个列向量；

最后，利用特征矩阵B_train中的测试样本到超球体球心的距离d，判断特征矩阵B_train中对应的测试样本是否属于诈骗合约；

若d≤R，说明测试样本在超球体的内部，属于正常样本；

若d>R则说明测试样本在超球体的外部，属于异常样本，即属于诈骗合约；

C14：通过步骤C13中的方法，利用特征矩阵B_train中的数据对单类支持向量机模型进行训练；最终确定单类支持向量机模型中参数R,d,a_i的数值；

C15：将特征矩阵B_tesi中的数据输入到训练后的单类支持向量机模型中，并根据单类支持向量机模型输出的结果对训练后的单类支持向量机模型性能进行测试。

采用孤立森林模型作为异常检测模型的训练和测试的具体步骤如下：

C21：将特征矩阵B_train中的数据输入到孤立森林模型中；

C22：首先，从特征矩阵B_train中挑选训练样本为x_f，则h(x_f)表示训练样本x_f从根节点到外部节点的过程中x_f经过的二叉树的边数，即路径长度；

h(x_f)的计算公式如下：h(x_f)＝e+C_tree(m)；

e表示训练样本x_f从子树iTree的根节点到叶子节点的过程中经过的二叉树的边数，即训练样本x_f经过iTree的边数；c_tree(m)表示使用m条样本数据构建的二叉树的平均路径长度；γ表示欧拉常数；

根据得到的h(x_f)的值计算x_f异常值，设

表示x_f的异常值：

其中，E(h(x_f))表示x_f在所有孤立树中的路径长度的平均值；设阈值为q，若

表示x_f为诈骗合约，

表示x_f为正常合约；

然后按照上述方法，再对特征矩阵B_rrain使用不放回抽样的方式随机选取m条数据，重复上述孤立树的训练过程，直至特征矩阵B_train中的数据都选取一遍，完成训练；

C23：训练完成后，孤立森林模型根据特征矩阵B_train中的数据确定孤立树中样本的平均路径长度E(h(x_f))的值，然后使用特征矩阵B_test对孤立森林模型的性能进行测试。

采用单类支持向量机和孤立森林的融合模型作为异常检测模型的训练和测试的具体步骤如下：

C31：假设特征矩阵B_train和特征矩阵B_test中每个列向量均为q维的列向量，则使用PCA降维算法，分别将特征矩阵B_train和特征矩阵B_test生成降维后的特征矩阵并表示为

和

其中，特征矩阵

表示在特征矩阵B_train的基础上使用PCA降维算法所生成的i维特征矩阵，特征矩阵

表示在特征矩阵B_test的基础上使用PCA降维算法所生成的i维特征矩阵；i＝2,3,…,q-1；

C32：利用降维后的特征矩阵

对单类支持向量机模型进行训练，训练完成后，使用训练后的单类支持向量机模型检测特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用单类支持向量机检测

得到的检测结果；

l表示

中共有l个检测结果，即

中共有l个列向量；

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

则表示

中的第j个智能合约为诈骗合约；j＝1,2,…,l；

C33：利用降维后的特征矩阵

对孤立森林模型进行训练，训练完成后，使用训练后的孤立森林模型检测特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用孤立森林检测

得到的检测结果，

l表示

中共有l个检测结果，即

中共有l个列向量；

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

表示

中的第j个智能合约为诈骗合约；j＝1,2,…,l；

C34:使用皮尔森相关系数对检测结果数组

和

进行相关性计算，得到皮尔森相关系数r；

皮尔森相关系数r的计算公式如下：

C35：根据步骤B34得到差异性最大的两组检测结果，即r值最大时所对应的单类支持向量机模型的检测结果和孤立森林模型的检测结果；然后再将所得到的r值最大时所对应的单类支持向量机模型的检测结果和孤立森林模型的检测结果作为输入对随机森林模型进行训练；最终得到确定的单类支持向量机和孤立森林的融合模型，作为最佳异常检测模型。

在使用特征矩阵B_test对训练后的异常检测模型的性能进行测试后，根据异常检测模型输出的结果对训练后的异常检测模型性能进行评估；

评估时，选用F值(F1-score)对训练后的单类支持向量机模型性能进行评估。

其中，Positive_true表示检测模型将原本是正常合约类别的智能合约预测为正常合约；Positive_false表示检测模型将原本是诈骗合约类别的智能合约判断为正常合约；Negative_false表示检测模型将原本是正常合约类别的智能合约预测为诈骗合约，Recall表示查全率，Precision表示查准率；

若F1-score≥0.9,则表示异常检测模型训练完成；若F1-score<0.9，则改变松弛因子ξ和惩罚参数C重新对异常检测模型进行训练；最终将得到F1-score≥0.9的异常检测模型作为最佳异常检测模型。

所述的步骤D中，设利用最佳异常检测模型判定后的结果为Y＝{y₁,y₂,…,y_l},y_j取值为0或1，j＝1,2,…,l，若y_j＝0则表示

中的第j个智能合约为正常合约，y_j＝1表示

中的第j个智能合约为诈骗合约。

所述的q＝0.7。

本发明将智能合约字节码文件中的字节转化为特征矩阵，可以保留智能合约中的全部特征。然后再通过PCA降维算法消除一些无用的、重复的特征，可以保留下重要的特征，能很大程度上提高异常检测模型的性能。最后采用单类支持向量机、孤立森林或支持向量机与孤立森林的融合模型检测区块链平台的中诈骗合约，可以全面的分析智能合约的特征，尤其是支持向量机和孤立森林的融合模型，能综合考虑单类支持向量机和孤立森林的预测结果，从而提高检测诈骗合约的准确率。

附图说明

图1为本发明的流程示意图。

具体实施方式

以下结合附图和实施例对本发明作以详细的描述：

如图1所示，本发明所述的面向区块链平台的基于字节码的诈骗合约检测方法，包括以下步骤：

A：获取区块链平台中智能合约的字节码，将获取到的字节码转化为标准化后的特征矩阵并消除特征矩阵中的噪声。

由于区块链平台不同，智能合约的字节码也不同。例如以太坊中的字节码一般由Solidity语言编译生成，运行在Ethereum Virtual Machine(EVM)中；EOS区块链平台中的字节码文件运行在Web Assembly(WASM)中。但是，上述各种区块链平台中智能合约的字节码文件最后都是以16进制存储到计算机中。因此，本发明中，首先对智能合约的字节码的特征进行提取，特征提取完成后将字节码转化为特征矩阵；随后再对特征矩阵进行标准化，标准化完成后使用主成分分析(PCA)算法对特征矩阵进行降维，以消除特征矩阵中的噪声。

本发明中，在对诈骗合约进行检测时，可以每次只处理相同区块链平台中的字节码，也只检测相同区块链平台中的诈骗合约，以保证较高的检测结果准确率。

所述的步骤A包含以下具体步骤：

A1：通过区块链平台获取智能合约的字节码；

本发明中，字节码的具体形式为一串16进制的字符串，根据智能合约的不同，字符串的长度也不同。字节码可通过现有区块链平台中开放的对外公共数据下载接口获取。

A2：将获取到的字节码转化为特征矩阵A；

在将获取到的字节码转化为特征矩阵A时，首先根据字符排列顺序，将相邻两个字符作为一组特征，从前向后对未分割的字符进行分割。每组字符的初始数量设为零，在分割时，若遇到先后两组特征内的两个字符均相同，则将先划分的特征进行加1操作，并舍弃掉后划分的特征。分割完成后，每组特征的数量就是字节码的特征矩阵，设此步骤中得到的特征矩阵为n维；

A3：对特征矩阵A进行标准化，设特征矩阵A＝{a₁,a₂,…,a_n},a₁,a₂,…,a_n为列向量，表示标准化之前的特征值。设特征矩阵B为标准化后的特征值，B＝{b₁,b₂,…,b_n}。

则列向量a_n的标准化公式为：

其中，μ_n和a_n分别表示列向量a_n的均值和方差；

A4：使用PCA算法消除标准化后特征矩阵的噪声，得到消除噪声后的标准化特征矩阵X。

实现PCA算法可采用特征分解或奇异值分解,本发明中使用奇异值分解实现PCA算法。设消除噪声后的标准化特征矩阵为X,且X是k维的，则X＝{x₁,x₂,…,x_k}；

本发明中，步骤B包括以下具体步骤：

以诈骗合约中的庞氏合约为例阐述用于检测诈骗合约时的测试集和训练集的分割步骤。

庞氏合约数据集可通过XBlock网站(http://xblock.pro/home-cn/)获取，数据集名称为庞氏骗局标签数据集。庞氏骗局标签数据集中共有3780条数据，其中有200条数据被标记为旁氏骗局。为了保证实验结果的准确性和有效性。首先，将庞氏骗局标签数据集D_all中的全部数据80％作为训练集D_train中的训练数据，剩下的20％作为测试集D_test中的测试数据进行实验。

B2:利用步骤A3中的方法(标准化公式)，将诈骗合约的训练集D_train中的训练数据和测试集D_test中的测试数据，分别转化为标准化后的特征矩阵B_train和特征矩阵B_test。

本发明中，异常检测模型可采用单类支持向量机模型、孤立森林模型或者单类支持向量机和孤立森林的融合模型。即，可利用特征矩阵B_train训练单类支持向量机模型、孤立森林模型或者单类支持向量机和孤立森林的融合模型，使异常检测模型具有检测诈骗合约的能力。并用特征矩阵B_test测试异常检测模型的性能。特征矩阵B_train与特征矩阵B_test中的每行数据都有一个标签，标志着此行数据是否是诈骗合约数据。

以下以诈骗合约中的庞氏合约为例，分别阐述单类支持向量机模型、孤立森林模型以及单类支持向量机和孤立森林的融合模型的训练和测试方法。

实施例1：

使用特征矩阵B_train训练单类支持向量机模型，并使用特征矩阵B_test评估训练后的单类支持向量机模型的性能。

单类支持向量机(One Class Support Vector Machine,OC-SVM)是一种由支持向量机发展而来的机器学习模型，所以在使用单类支持向量机检测骗局合约前，需要对其进行训练。

映射关系为

C13：首先，在新的特征空间

中构造一个体积最小的超球体；

s.t.‖φ(B_train)-a‖²≤R²+ξ_i,ξ_i≥0,i＝1,2,…，n；

其中，a表示超球体的球心，R表示超球体的半径，ξ表示松弛因子，ξ_i表示特征矩阵B_train中第i个列向量的松弛因子，C表示权衡超球体体积和误分类率的惩罚参数，C值增大时对误分类的惩罚增大，C值减小时对误分类的惩罚减小，n表示特征矩阵B_train中共有n个列向量。

在计算时，根据拉格朗日乘子法，原始问题的对偶问题为：

其中，α_i和α_j分别表示样本x_i和x_j对应的拉格朗日系数；x_i和x_j分别表示从特征矩阵B_train中选择的两个列向量；K(x_i，x_j)表示核函数，它等同于特征空间中样本的内积操作，即：

K(x_i，x_j)＝<φ(x_i),φ(x_j)>；

将原始问题转化为对偶问题后，则计算超球体的球心a和半径R,计算公式如下：

在训练过程中，把拉格朗日系数满足0≤α_i≤C的样本称为支持向量，设SV表示从特征矩阵B_train中划分出来的训练样本中所有的支持向量；则在计算超球体的半径R的公式中，x_v表示SV中的列向量，x_v∈SV，K(x_v,x_v)和K(x_v,x_i)均表示核函数，x_i表示从特征矩阵B_train选择的列向量；

因此，设从特征矩阵B_train中挑选的测试样本为x_t，则x_t到超球体球心的距离d为：

若d≤R，说明测试样本在超球体的内部，属于正常样本；

C14：通过步骤C13中的方法，利用特征矩阵B_train中的数据对单类支持向量机模型进行训练；最终确定单类支持向量机模型中参数R,d,α_i的数值；

C15：将特征矩阵B_test中的数据输入到训练后的单类支持向量机模型中，并根据单类支持向量机模型输出的结果对训练后的单类支持向量机模型性能进行测试及评估；

其中，Positive_true表示检测模型将原本是正常合约类别的智能合约预测为正常合约；Positive_false表示检测模型将原本是诈骗合约类别的智能合约判断为正常合约；Negative_false表示检测模型将原本是正常合约类别的智能合约预测为诈骗合约，Recall表示查全率，Precision表示查准率。

若F1-score≥0.9,则表示模型训练完成；若F1-score<0.9，则改变松弛因子ξ和惩罚参数C重新训练。最终，得到F1-score≥0.9的单类支持向量机模型作为最佳异常检测模型；

实施例2：

使用特征矩阵B_train训练孤立森林模型，并使用特征矩阵B_test评估训练后的孤立森林模型的性能。

孤立森林模型(Isolation Forest,IForest)是一种无监督的方法，首先，它通过从训练数据集中随机选取一个特征，然后，在该特征的最大值最小值之间随机选取一个分裂点，小于分裂点的点进入左侧分支，大于或等于分裂点的点进入右侧分支。接着，不断重复上述过程直到只剩一个样本或只剩下相似的样本。如果在重复上述分裂过程中达到了树深的限制，则会跳出上述过程。最后，孤立森林通过路径长度来表示一个样本点被“孤立”的程度。

本发明中，采用孤立森林模型作为异常检测模型的训练和测试的具体步骤如下：

C21：将特征矩阵B_train中的数据输入到孤立森林模型中；

C22：首先：从特征矩阵B_train中挑选训练样本为x_f，则h(x_f)表示训练样本x_f从根节点到外部节点的过程中x_f经过的二叉树的边数，即路径长度。一般来说，样本路径长度越小，则此样本被“孤立”的程度就越高，样本被“孤立”的程度越高就表示此样本越有可能为诈骗合约。

h(x_f)公式如下：

h(x_f)＝e+C_tree(m)；

e表示训练样本x_f从子树iTree的根节点到叶子节点的过程中经过的二叉树的边数，即训练样本x_f经过iTree的边数。C_tree(m)表示使用m条样本数据构建的二叉树的平均路径长度。γ表示欧拉常数。

当得到h(x_f)的值以后，则计算x_f孤立值(或称为异常值)，设

表示x_f的异常值，

公式如下：

E(h(x_f))表示x_f在所有孤立树中的路径长度的平均值。假设阈值q＝0.7，则若

表示x_f为诈骗合约，

表示x_f为正常合约。

上述过程为一颗孤立树的训练过程，然后再对特征矩阵B_train使用不放回抽样的方式随机选取m条数据，重复上述孤立树的训练过程，直至特征矩阵B_train中的数据都选取一遍。选取完成后表示此训练完成。

C23：训练完成后，孤立森林模型根据特征矩阵B_train中的数据确定孤立树中样本的平均路径长度E(h(x_f))的值，然后使用特征矩阵B_test对孤立森林模型的性能进行测试及评估。评估过程与训练过程相似，只是训练过程中确定的E(h(x_f))值，在评估过程中不再改变。

C24：评估时，选用F值(F1-score)对训练后的单类支持向量机模型性能进行评估。

若F1-score≥0.9,则表示训练完成；若F1-score<0.9，则改变m的值重新训练。最终，得到F1-score≥0.9的孤立森林模型作为最佳异常检测模型；

由于单类支持向量机模型和孤立森林模型对诈骗合约检测的原理不同，所以检测时，分析诈骗合约特征的侧重点也不同，所以使用单个检测模型无法全面分析诈骗合约中的侧重点。所以本发明中还提出了单类支持向量机和孤立森林的融合模型，以准确检测诈骗合约。

实施例3：

使用特征矩阵B_train训练单类支持向量机和孤立森林的融合模型，并使用特征矩阵B_test测试训练后的单类支持向量机和孤立森林的融合模型。

C31：假设特征矩阵B_train和特征矩阵B_test中每个列向量均为q维的列向量。则使用PCA降维算法，分别将特征矩阵B_train和特征矩阵B_test生成降维后的特征矩阵并表示为

和

其中，特征矩阵

i＝2,3,…,q-1表示在特征矩阵B_train的基础上使用PCA降维算法所生成的i维特征矩阵，特征矩阵

i＝2,3,…,q-1表示在特征矩阵B_test的基础上使用PCA降维算法所生成的i维特征矩阵。

C32：按照步骤C11至步骤C15的方法，利用降维后的特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用单类支持向量机检测

得到的检测结果，i＝2,3,…,q-1。

l表示

中共有l个检测结果，即

中共有l个列向量。

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

则表示

中的第j个智能合约为诈骗合约。

C33：按照步骤C21至步骤C24的方法，利用降维后的特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用孤立森林检测

得到的检测结果，i＝2,3,…,q-1。

l表示

中共有l个检测结果，即

中共有l个列向量。

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

表示

中的第j个智能合约为诈骗合约；

C34:使用皮尔森相关系数对检测结果数组

和

进行相关性计算，最终得到皮尔森相关系数r；

皮尔森相关系数r的计算公式如下：

C35：根据步骤B34得到差异性最大的两组结果，即r值最大时所对应的单类支持向量机模型的评估结果和孤立森林模型的评估结果；然后再将所得到的r值最大时所对应的单类支持向量机模型的评估结果和孤立森林模型的评估结果作为输入对随机森林模型进行训练；最终得到确定的单类支持向量机和孤立森林的融合模型，作为最佳异常检测模型。

本发明使用随机森林模型对单类支持向量机和孤立森林模型进行融合。使用随机深林时使用分类与回归树(Classification and regression tree,CART)作为随机森林算法的基分类器。随机森林模型输出的结果即为单类支持向量机与孤立森林进行模型融合后得到的最终的检测结果。

因为单类支持向量机和孤立森林的算法逻辑不同，所以它们分类的依据即对相同数据的不同的特征的敏感程度也不同。使用模型融合的方式同时使用这两个算法检测诈骗合约，可以综合考虑诈骗合约的特征，从而提高检测诈骗合约的精度。

D：利用步骤C中得到的最佳异常检测模型，对待判定的智能合约进行是否为诈骗合约的判定，设利用最佳异常检测模型判定后的结果为Y＝{y₁,y₂,…,y_l},y_j取值为0或1，j＝1,2,…,l，若y_j＝0则表示

中的第j个智能合约为正常合约，y_j＝1表示

中的第j个智能合约为诈骗合约。

Claims

1.一种面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于，依次包括以下步骤：

D：利用步骤C中得到的最佳异常检测模型，对待判定的智能合约进行是否为诈骗合约的判定；

其中，采用单类支持向量机模型作为异常检测模型的训练和测试的具体步骤如下：

映射关系为

C13：首先，在新的特征空间

中构造一个体积最小的超球体；

s.t.‖φ(B_train)-a‖²≤R²+ξ_i,ξ_i≥0,i＝1,2,…,n；

K(x_t,x_t)、K(x_t,x_i)和K(x_i,x_j)均表示核函数，α_i和α_j分别表示样本x_i和x_j对应的拉格朗日系数；x_i和x_j分别表示从特征矩阵B_train中选择的两个列向量；

若d≤R，说明测试样本在超球体的内部，属于正常样本；

C15：将特征矩阵B_test中的数据输入到训练后的单类支持向量机模型中，并根据单类支持向量机模型输出的结果对训练后的单类支持向量机模型性能进行测试；

C21：将特征矩阵B_train中的数据输入到孤立森林模型中；

h(x_f)的计算公式如下：h(x_f)＝e+C_tree(m)；

根据得到的h(x_f)的值计算x_f异常值，设

表示x_f的异常值：

表示x_f为诈骗合约，

表示x_f为正常合约；

然后按照上述方法，再对特征矩阵B_train使用不放回抽样的方式随机选取m条数据，重复上述孤立树的训练过程，直至特征矩阵B_train中的数据都选取一遍，完成训练；

C23：训练完成后，孤立森林模型根据特征矩阵B_train中的数据确定孤立树中样本的平均路径长度E(h(x_f))的值，然后使用特征矩阵B_test对孤立森林模型的性能进行测试；

和

其中，特征矩阵

C32：利用降维后的特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用单类支持向量机检测

得到的检测结果；

l表示

中共有l个检测结果，即

中共有l个列向量；

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

则表示

中的第j个智能合约为诈骗合约；j＝1,2,…,l；

C33：利用降维后的特征矩阵

中的诈骗合约，得到检测结果数组

其中，

表示使用孤立森林检测

得到的检测结果，

l表示

中共有l个检测结果，即

中共有l个列向量；

取值为0或1，若

表示

中的第j个智能合约为正常合约，若

表示

中的第j个智能合约为诈骗合约；j＝1,2,…,l；

C34:使用皮尔森相关系数对检测结果数组

和

进行相关性计算，得到皮尔森相关系数r；

皮尔森相关系数r的计算公式如下：

C35：根据步骤C34得到差异性最大的两组检测结果，即r值最大时所对应的单类支持向量机模型的检测结果和孤立森林模型的检测结果；然后再将所得到的r值最大时所对应的单类支持向量机模型的检测结果和孤立森林模型的检测结果作为输入对随机森林模型进行训练；最终得到确定的单类支持向量机和孤立森林的融合模型，作为最佳异常检测模型。

2.根据权利要求1所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于，所述的步骤A包括以下具体步骤：

A1：通过区块链平台获取智能合约的字节码；

A2：将获取到的字节码转化为特征矩阵A；

A3：对特征矩阵A进行标准化，设特征矩阵A＝{a₁,a₂,…,a_n},a₁,a₂,…,a_n为列向量，表示标准化之前的特征值；设特征矩阵B为标准化后的特征值，B＝{b₁,b₂,…,b_n}；

列向量a_n的标准化公式为：

其中，μ_n和σ_n分别表示列向量a_n的均值和方差；

3.根据权利要求2所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于：所述的步骤A4中，PCA算法采用特征分解或奇异值分解。

4.根据权利要求2所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于：所述的步骤B包括以下具体步骤：

5.根据权利要求1所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于：在使用特征矩阵B_test对训练后的异常检测模型的性能进行测试后，根据异常检测模型输出的结果对训练后的异常检测模型性能进行评估；

评估时，选用F值(F1-score)对训练后的单类支持向量机模型性能进行评估；

若F1-score≥0.9，则表示异常检测模型训练完成；若F1-score<0.9，则改变松弛因子ξ和惩罚参数C重新对异常检测模型进行训练；最终将得到F1-score≥0.9的异常检测模型作为最佳异常检测模型。

6.根据权利要求1所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于：所述的步骤D中，设利用最佳异常检测模型判定后的结果为Y＝{y₁,y₂,…,y_l},y_j取值为0或1，j＝1,2,…,l，若y_j＝0则表示

中的第j个智能合约为正常合约，y_j＝1表示

中的第j个智能合约为诈骗合约。

7.根据权利要求1所述的面向区块链平台的基于字节码的诈骗合约检测方法，其特征在于：所述的q＝0.7。