CN114065307A

CN114065307A - 一种基于双向图卷积神经网络的硬件木马检测方法与系统

Info

Publication number: CN114065307A
Application number: CN202111367369.2A
Authority: CN
Inventors: 董晨; 程栋; 林璇威; 贺文武
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2021-11-18
Filing date: 2021-11-18
Publication date: 2022-02-18
Anticipated expiration: 2041-11-18
Also published as: CN114065307B

Abstract

本发明涉及一种基于双向图卷积神经网络的硬件木马检测方法与系统。该方法首先对网表文件进行预处理，创建对应的有向图表示

，并对门器件信息进行编码作为特征表示X，构建电路有向图数据；然后分别创建描述电路信号传播结构的正向电路图

和描述电路信号分散结构的反向电路图

，并分别构造对应的图神经网络特征提取器提取结构特征，组合为最终的门器件特征

；构造多层感知机分类模型，与图神经网络特征提取器构成硬件木马门分类模型，并使用加权交叉熵损失函数来学习模型参数，得到训练好的硬件木马门分类模型；将待检测的网表转换为有向图，输入到训练好的硬件木马门分类模型中进行检测，输出可疑的门器件列表。本发明可以有效地检测出门级硬件木马。

Description

一种基于双向图卷积神经网络的硬件木马检测方法与系统

技术领域

本发明涉及硬件木马检测领域，具体涉及一种基于双向图卷积神经网络的硬件木马检测方法与系统。

背景技术

芯片是物理网络系统的基础，随着网络的快速发展，电子设备的普及程度越来越高，芯片被广泛的用于不同的领域中。然而由于高昂的成本与激烈竞争压力，芯片的生产过程通常需要由多个制造商共同参与，导致大规模集成电路设计中很容易被攻击者植入硬件木马，以执行特定的恶意操作，造成重大的安全隐患和破坏。硬件木马主要在芯片的设计阶段被植入，同时芯片制造后的检测代价往往是非常昂贵的，所以在芯片设计阶段检测到硬件木马是十分重要的。

传统的硬件木马检测技术主要包括侧信道分析、逻辑测试和逆向工程。其中，侧信道分析通过测量电路的物理特性，如电压、电流和温度等特征，并与无木马的“黄金芯片”进行比较来判断硬件木马；逻辑测试通过产生不同的测试输入向量以尽可能的激活触发条件罕见的硬件木马达到检测目的。侧信道分析和逻辑测试通常需要运行或模拟电路，需要较多的人力物力开销。逆向工程对芯片进行解构，逐层扫描以获得布局图像，通过分析图像并与“黄金芯片”进行比较来检测木马，但其需要破坏芯片，对待测芯片造成不可逆的伤害。总的来说，传统的硬件木马检测技术通常需要高精度的检测设备，耗费过多的时间触发硬件木马和测量特性。近年来，基于机器学习的静态检测方法受到了许多研究者的关注，其通常由人工定义并提取相关特征，通过机器学习方法对特征进行学习以获得对硬件木马的分类模型。相比传统的检测方法，基于机器学习的静态检测不需要运行或模拟电路，无需额外的开销，容易扩展到大规模集成电路上同时保持高效的检测，但是目前的静态检测方法依旧过度依赖人工特征的定义，针对不同类型的硬件木马找到有效的特征是困难的。

此外，根据设计阶段的不同，按抽象级别由高到低，硬件木马的检测级别又可以分为系统级、寄存器传输级、门级和物理布局级。由于每一级的跨越都有可能被植入硬件木马，越靠近制造阶段的检测越具有防御效果，但是抽象级别越低，设计细节就越多，伴随着复杂度的增长。目前的检测工作大多集中在寄存器传输级上，并且难以在大规模集成电路中检测并定位相关木马结构。总的来说，对于门级还没一套高效、自动且易于拓展的硬件木马检测方法与系统。

发明内容

本发明的目的在于提供一种基于双向图卷积神经网络的硬件木马检测方法与系统，该方法及系统可以有效地检测出门级硬件木马，给出相关的可疑结构，为专业人员提供审查便利，并且具有较高的检测效率和准确度，摆脱了人工定义和提取相关特征的负担。

为实现上述目的，本发明的技术方案是：一种基于双向图卷积神经网络的硬件木马检测方法，包括以下步骤：

步骤A、对收集的网表文件进行预处理，收集网表中的门器件集合V，并生成器件间连接边集合E，创建对应的有向图表示G＝(V,E)，并对门器件信息进行编码作为特征表示X，同时对每个门器件标注硬件木马标签Y，构建电路有向图数据；

步骤B、基于步骤A构建的电路有向图G，分别创建用于描述电路信号传播结构的正向电路图G^FW和用于描述电路信号分散结构的反向电路图G^BW，并分别构造对应的图神经网络特征提取器提取正向图G^FW和反向图G^BW的特征，组合为最终的门器件特征H^C；

步骤C、构造多层感知机分类模型，与步骤B中构造的图神经网络特征提取器构成硬件木马门分类模型，将图神经网络特征提取器的输出特征H^C作为多层感知机模型的输入进行训练，计算每个门器件属于正常门器件和木马门器件的概率，并使用加权交叉熵损失函数来学习硬件木马门分类模型的参数，当达到最大迭代次数，则终止模型的训练，得到训练好的硬件木马门分类模型；

步骤D、将待检测的网表转换为有向图，输入到训练好的硬件木马门分类模型中进行检测，输出可疑的门器件列表。

在本发明一实施例中，所述步骤A具体包括以下步骤：

步骤A1、收集所有网表中的门器件类型，形成门器件类型库；

步骤A2、从网表中获取门器件集合V＝{v₀,v₁,...,v_n-1}和线网集合W＝{w₀,w₁,...,w_h}，并定义任意一个门器件v_i的输入输出线网信息R_i＝(w_ij,w_ik)；

步骤A3、以门器件集合V作为顶点集，根据每个门器件的输入输出线网信息R_i，使用深度优先搜索算法收集与主输入和主输出线网连接的门器件，保存为对应集合S_MI,S_MO，收集具有SI、SE、SN和RN类型的端口的门器件，分别保存为对应集合S_SI,S_SE,S_SN,S_RN，同时构建边集E＝{e_st|s,t＝0,1,...,n-1}来表示逻辑门间的连接关系，如果逻辑门v_s的输出端口连接到逻辑门v_t的输入端口，则存在边e_st∈E；

步骤A4、用有向图G＝(V,E)表示网表的电路拓扑结构，进一步将图表示转换为邻接矩阵A，如果边e_st存在于边集E中，则邻接矩阵中的对应元素a_st＝1，否则为0；

步骤A5、根据门器件类型库，对门器件的类型进行One-Hot编码，作为门器件节点的初始特征；根据门器件集合S_SI,S_SE,S_SN,S_RN对门器件的端口信息进行编码，若门器件包含SI、SE、SN和RN类型的端口，则在对应特征位上编码为1，否则为0；若门器件连接主输入或主输出，即门器件在对应集合S_MI,S_MO中，则在对应特征位上编码为1，否则为0；最终以65位的One-Hot编码、4位特殊端口信息编码和2位主输入输出编码组合为71位的表示向量作为门器件的特征表示X＝{x₀,x₁,...,x_n-1}；

步骤A6、解析网表中的木马网表段，对相应的木马逻辑门标注木马标签，正常门器件标注为正常标签，形成标签信息Y；由有向图结构表示G＝(V,E)，门器件特征表示X和标签信息Y构成电路有向图数据。

在本发明一实施例中，所述步骤B具体包括以下步骤：

步骤B1、将步骤A构建的电路有向图G＝(V,E)当作是描述电路信号传播结构的正向图G^FW，通过翻转所有边的方向得到反向边集E^BW＝{e_st|e_ts∈E}，构建描述电路信号发散结构的反向图G^BW＝(V,E^BW)，同时获得描述反向图的邻接矩阵A^BW＝A^T，正向图G^FW和反向图G^BW使用相同的门器件节点特征X；

步骤B2、构建两个独立的两层图卷积层分别作为正向图G^FW和反向图G^BW的特征提取器，对正向图G^FW的特征提取器的两层的图卷积运算如下：

其中，M(·)表示图卷积运算，

和

分别表示正向图G^FW经过第一层和第二层图卷积运算的输出，

分别表示两层图卷积运算的学习权重，第一层图卷积的输入是门器件特征矩阵X，第二层图卷积的输入是第一层图卷积的输出

同样的，反向图G^BW经过其两层图卷积运算得到相应的输出特征

和

两个特征提取器的最终输出

和

分别作为电路信号传播结构和分散结构的特征表示；

步骤B3、组合电路信号传播结构特征

和分散结构特征

作为门器件的最终特征H^C，组合的方式为特征向量的拼接。

在本发明一实施例中，所述的图卷积运算M具体计算公式如下：

其中，H_k表示通过第k个图卷积层运算得到的隐藏层特征矩阵，A表示图结构的邻接矩阵，W_k-1为对应层的可学习参数；图卷积运算M使用了谱域卷积的一阶切比雪夫近似形式，其中A＝A+I_N表示添加自连接的邻接矩阵，I_N表示N阶单位矩阵，

是由邻接矩阵

计算出的度矩阵，σ(·)为激活函数，图卷积运算使用ReLU函数作为激活函数。

在本发明一实施例中，所述步骤C具体包括以下步骤：

步骤C1、构造多层感知机MLP分类模型，与步骤B中构造的图神经网络特征提取器构成硬件木马门分类模型，将组合的门器件特征H^C输入到多层感知机模型中，计算逻辑门所属类别的概率，并用一个softmax层对概率进行归一化，来学习预测标签

运算公式如下：

p＝MLP(H^C)

其中，p为门器件特征向量H^C经过多层感知机非线性变换得到的概率向量，

是预测为类别i的概率，

类别总数为2，分别指示为正常门器件和木马门器件的概率；

步骤C2、用加权的交叉熵作为损失函数，利用反向传播迭代更新硬件木马门分类模型的参数，以最小化损失函数来训练模型，当达到最大迭代次数，则终止模型的训练，得到训练好的硬件木马门分类模型。

在本发明一实施例中，所述多层感知机模型的具体计算流程如下：

使用的多层感知机模型由两层神经网络全连接层组成，每一层的计算公式如下：

y＝f(W_FC*x+b_FC)

其中，W_FC为全连接层权重矩阵，b_FC为偏置项，f为激活函数，使用ReLU函数作为多层感知机的激活函数，y为逻辑门特征向量x经过全连接层非线性变换得到的向量；最后一个全连接层输出单元数规定为2，用于对硬件木马二分类的预测。

在本发明一实施例中，所述加权交叉熵损失函数计算公式如下：

其中，N为逻辑门的总个数，w_p为正常门数量所占的比例，w_n为木马门数量所占的比例，

是门器件特征通过硬件木马门分类模型输出的预测标签概率，y_i为逻辑门的实际标签，当损失值迭代轮次达到预设值时终止模型的训练。

本发明还提供了一种基于双向图卷积神经网络的硬件木马检测系统，所述检测系统应用权利要求1至7任一项所述的基于双向图卷积神经网络的硬件木马检测方法，包括图数据建模模块、门特征提取模块、硬件木马检测模块：

所述图数据建模模块：用于创建网表的图表示数据样本，包括图结构建模子模块和门特征编码子模块；图结构建模子模块将网表中的电路拓扑结构建模为有向图表示，门特征编码子模块将门器件的类型信息、特殊端口信息和主输入输出信息编码为门器件的三类特征信息；

所述门特征提取模块：针对创建的网表图表示数据提取出门器件的三种不同图结构特征，包括正向图特征提取子模块、反向图特征提取子模块和双向图特征提取子模块；首先，创建用于描述电路信号传播结构的正向电路图G^FW和用于描述电路信号分散结构的反向电路图G^BW，正向图特征提取子模块只创建一个两层的图卷积网络来提取正向图G^FW的结构特征；反向图特征提取子模块只创建一个两层的图卷积网络来提取反向图G^BW的结构特征；双向图特征提取子模块对正向图G^FW和反向图G^BW分别应用两个独立的图神经网络特征提取器进行特征提取，并进行组合作为最终的门器件特征；

所述硬件木马检测模块：用于检测网表中的木马门器件，包括模型训练子模块和木马门分类子模块；模型训练子模块用于训练硬件木马门分类模型，得到性能优秀的模型参数并保存；木马门分类子模块自动执行网表的图建模与门器件的分类，列出分类为硬件木马的门器件为可疑结构，为后续的审查和设计修改提供便利。

相较于现有技术，本发明具有以下有益效果：

(1)首先本发明对网表进行有向图建模，并提出了一种结合门器件的类型信息、特殊端口信息和主输入输出信息进行门器件特征信息编码的方法，为使用图方法解决木马检测问题扩展了图数据建模方法，图数据极大的保留了网表电路的结构信息。

(2)本发明提出一种基于双向图神经网络模型的门器件特征提取框架，可以自动的同时提取了门器件的电路信号传播结构和分散结构的特征，摆脱了人工定义和提取特征的负担，同时避免了手工提取特征不易拓展的风险。

(3)本发明使用了多层感知机作为硬件木马门分类模型，并使用加权交叉熵损失函数来训练模型，缓解了硬件木马门与正常门样本之间的不平衡问题，与传统硬件木马检测方法相比检测效率和准确率更高，同时对门器件进行分类，可以有效的根据木马门器件输出可疑结构，实现木马结构的定位。

(4)本发明系统可用于网表电路图数据的生成、门器件结构特征的自动提取和木马门器件检测。

附图说明

图1为本发明实施例的方法流程图。

图2是本发明实施例的步骤A的实现流程图。

图3是本发明实施例的系统结构示意图。

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

如图1-2所示，本发明提供一种基于双向图卷积神经网络的硬件木马检测方法，包括以下步骤：

步骤A2、从网表中获取门器件集合V＝{v₀,v₁,...,v_n-1}和线网集合W＝{w₀,w₁,...,w_h}，并定义任意一个门器件v_i的输入输出线网信息R_i＝(w_ij,w_ik)。

步骤A3、以门器件集合V作为顶点集，根据每个门器件的输入输出线网信息R_i，使用深度优先搜索算法收集与主输入和主输出线网连接的门器件，保存为对应集合S_MI,S_MO，收集具有SI、SE、SN和RN类型的端口的门器件，分别保存为对应集合S_SI,S_SE,S_SN,S_RN，同时构建边集E＝{e_st|s,t＝0,1,...,n-1}来表示逻辑门间的连接关系，如果逻辑门v_s的输出端口连接到逻辑门v_t的输入端口，则存在边e_st∈E。

步骤A4、用有向图G＝(V,E)表示网表的电路拓扑结构，进一步将图表示转换为邻接矩阵A，如果边e_st存在于边集E中，则邻接矩阵中的对应元素a_st＝1，否则为0。

步骤A5、根据门器件类型库，对门器件的类型进行One-Hot编码，作为门器件节点的初始特征；根据门器件集合S_SI,S_SE,S_SN,S_RN对门器件的端口信息进行编码，若门器件包含SI、SE、SN和RN类型的端口，则在对应特征位上编码为1，否则为0；若门器件连接主输入或主输出，即门器件在对应集合S_MI,S_MO中，则在对应特征位上编码为1，否则为0。最终以65位的One-Hot编码、4位特殊端口信息编码和2位主输入输出编码组合为71位的表示向量作为门器件的特征表示X＝{x₀,x₁,...,x_n-1}。

步骤A6、解析网表中的木马网表段，对相应的木马逻辑门标注木马标签，正常门器件标注为正常标签，形成标签信息Y。由有向图结构表示G＝(V,E)，门器件特征表示X和标签信息Y构成电路有向图数据。

其中，M(·)表示图卷积运算，

和

分别表示正向图G^FW经过第一层和第二层图卷积运算的输出，

和

两个特征提取器的最终输出

和

分别作为电路信号传播结构和分散结构的特征表示。

步骤B3、组合电路信号传播结构特征

和分散结构特征

作为门器件的最终特征H^C，组合的方式为特征向量的拼接。

进一步的，所述的图卷积运算M具体计算公式如下：

其中，H_k表示通过第k个图卷积层运算得到的隐藏层特征矩阵，A表示图结构的邻接矩阵，W_k-1为对应层的可学习参数；图卷积运算M使用了谱域卷积的一阶切比雪夫近似形式，其中A＝A+I_N表示添加了自连接的邻接矩阵，I_N表示N阶单位矩阵，

是由邻接矩阵

计算出的度矩阵，σ(·)为激活函数，本专利中图卷积运算使用ReLU函数作为激活函数。

步骤C1、构造多层感知机分类模型，与步骤B中构造的图神经网络特征提取器构成硬件木马门分类模型，将组合的门器件特征H^C输入到多层感知机模型中，计算逻辑门所属类别的概率，并用一个softmax层对概率进行归一化，来学习预测标签

运算公式如下：

p＝MLP(H^C)

是预测为类别i的概率，

类别总数为2，分别指示为正常门器件和木马门器件的概率；

步骤C2、用加权的交叉熵作为损失函数，利用反向传播迭代更新硬件木马门分类模型的参数，以最小化损失函数来训练模型，当达到最大迭代次数，则终止模型的训练，得到训练好的硬件木马门分类模型；多层感知机模型由两层神经网络全连接层组成，每一层的计算公式如下：

y＝f(W_FC*x+b_FC)

其中，W_FC为全连接层权重矩阵，b_FC为偏置项，f为激活函数，本专利中使用ReLU函数作为多层感知机的激活函数，y为逻辑门特征向量x经过全连接层非线性变换得到的向量；最后一个全连接层输出单元数规定为2，用于对硬件木马二分类的预测。

所述加权交叉熵损失函数计算公式如下：

本发明还提供了一种基于双向图卷积神经网络的硬件木马检测系统，如图3所示，包括：

图数据建模模块，用于创建网表的图表示数据样本，包括图结构建模子模块和门特征编码子模块；图结构建模子模块将网表中的电路拓扑结构建模为有向图表示，门特征编码子模块将门器件的类型信息、特殊端口信息和主输入输出信息编码为门器件的三类特征信息；

门特征提取模块，针对创建的网表图表示数据提取出门器件的三种不同图结构特征，包括正向图特征提取子模块、反向图特征提取子模块和双向图特征提取子模块；首先，创建用于描述电路信号传播结构的正向电路图G^FW和用于描述电路信号分散结构的反向电路图G^BW，正向图特征提取子模块只创建一个两层的图卷积网络来提取正向图G^FW的结构特征；反向图特征提取子模块只创建一个两层的图卷积网络来提取反向图G^BW的结构特征；双向图特征提取子模块对正向图G^FW和反向图G^BW分别应用两个独立的图神经网络特征提取器进行特征提取，并进行组合作为最终的门器件特征；

硬件木马检测模块，用于检测网表中的木马门器件，包括模型训练子模块和木马门分类子模块；模型训练子模块用于训练硬件木马门分类模型，得到性能优秀的模型参数并保存；木马门分类子模块自动执行网表的图建模与门器件的分类，列出分类为硬件木马的门器件为可疑结构，为后续的审查和设计修改提供便利。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。