CN116032604A

CN116032604A - 一种基于长短期记忆网络的物联网僵尸设备检测方法

Info

Publication number: CN116032604A
Application number: CN202211694738.3A
Authority: CN
Inventors: 殷丽华; 罗熙; 张芫菲; 方滨兴; 朱木易洁; 李如玉
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2022-12-28
Filing date: 2022-12-28
Publication date: 2023-04-28

Abstract

本发明公开了一种基于长短期记忆网络的物联网僵尸设备检测方法，基于长短期记忆网络和阈值随机漫步的物联网僵尸设备检测方法，实时监控主机DNS请求，关注其中的不存在域名(NxDomain)请求，具体为首先使用长短期记忆网络模型计算域名的恶意分数，然后根据域名的恶意分数实时更新主机的恶意分数，当主机的恶意分数达到某一阈值时，即发出告警认定该主机受到僵尸程序感染。

Description

一种基于长短期记忆网络的物联网僵尸设备检测方法

技术领域

本发明涉及计算机网络空间安全的技术领域，具体涉及一种基于长短期记忆网络的物联网僵尸设备检测方法。

背景技术

僵尸网络是网络安全领域的重大威胁，攻击者可以利用僵尸网络实时多种类型的网络攻击，如发送垃圾邮件，传播恶意软件和分布式拒绝服务攻击(DDoS)。近年来，海量安全薄弱的物联网设备给僵尸网络带来更大的流量，物联网僵尸网络愈发猖獗。2016年，物联网僵尸网络Mirai针对域名服务商Dyn发起攻击，峰值高达1Tbps的拒绝服务攻击导致大半个美国的网络瘫痪数小时。

受感染的僵尸设备是攻击者实施恶意活动的基础，目前有不少研究致力于检测僵尸设备。许多研究通过分析主机行为来发现受感染的僵尸主机。一些工作通过关联多个分析主机行为来发现僵尸网络，这些工作认为被同一僵尸程序感染的主机会呈现出相似的行为，通过分析不同主机行为的相似性和周期性来挖掘僵尸网络。典型工作包括BotGAD，PsyBoG，DBod，Dfbotkiller、Beewolf。一些工作专注于单一主机的行为分析。这些工作认为僵尸设备的行为特点与正常主机有区别，通过分析单一主机的DNS请求来发现僵尸设备，如Grill通过分析主机一段时间内请求的域名和获得的解析IP的比例来检测僵尸设备，Mowbray通过分析一段时间内主机请求域名的字符长度分布来判断主机是否被感染。除了分析主机行为外，还有一些工作通过分析域名的特征来检测DGA恶意域名，然后将访问恶意域名的设备认定为僵尸设备。

然而，大多数现有工作需要长期的活动信息或者较长的分析时间，这使得他们很难及时在恶意行为发生初期(僵尸设备连接到C&C服务器前)阻止恶意活动。此外，许多工作很难平衡资源耗费和检测效果，无法部署在资源受限的物联网上。

发明内容

本发明克服现有技术的不足，提供了一种基于长短期记忆网络的物联网僵尸设备检测方法。本发明的目的通过以下的技术方案实现：

一种基于长短期记忆网络的物联网僵尸设备检测方法，包括：

S1：实时监控设备的DNS请求数据，初始化原始数据，提取后续处理需要的有效字段；

S2：使用训练好的长短期记忆网络处理域名字符串，计算域名对应的恶意分数；

S3：使用阈值随机游走算法迭代设备的恶意分数，当设备的恶意分数超过预设阈值时，则判定该设备为受感染的僵尸设备，产生告警。

优选的，所述S1中，原始数据包括不存在域名访问序列Seq、设备恶意分数S_device、最后访问的不存在域名LastNxD和最后访问不存在域名的时间LastTime。

优选的，所述S1中，提取后续处理需要的有效字段的步骤包括实时监控主机的DNS请求，如果请求的响应是不存在域名NXDOMAIN,则提取被请求域名的二级域名和相应的访问时间两个字段。

更优的，通过以下规则对原始数据进行参数更新：

a)更新最后访问的不存在域名LastNxD为当前域名；

b)若当前访问时间和最后访问不存在域名之间的时间间隔大于预设阈值τ，则重置设备恶意分数S_device为0，重置不存在域名访问序列Seq为空；

c)更新最后访问不存在域名的时间LastTime为当前域名的访问时间；

d)更新不存在域名访问序列Seq，将当前访问域名加入序列末尾。

优选的，所述S2中，计算域名对应的恶意分数包括以下步骤：

①.构建计算域名恶意概率的长短期记忆网络模型；

②.域名恶意分数计算。

更优的，所述构建计算域名恶意概率的长短期记忆网络模型包括：

输入层：输入层用于将S1中提取的域名字段作为输入；

编码层：编码层用于根据预先制定的编码规则将域名字符转换为长度为m的编码，对于一个长度为k的域名，经过编码层，会转换为k*m的矩阵；

LSTM层：LSTM层用于通过单层经典长短期记忆模型处理域名字符串，将编码后的域名字段，即编码层得到的矩阵，作为输入，分析计算域名的恶意分数；

具体公式如下：

f_n＝σ(W_f·[h_n-1,x_n]+b_f)

i_n＝σ(W_i·[h_n-1,x_n]+b_i)

o_n＝σ(W_o·[h_n-1,]+b_o)

h_n＝o_n·tanh(C_n)

其中n代表域名字符串的第n个字符，x_n是第n个字符的编码向量，W_f,b_f,W_i,b_i,W_o,b_o,W_c,b_c是训练参数，σ是非线性激活函数，tanh是双曲正切函数，f_n是遗忘门,i_n是输入门,o_n是输出门,

是当前单元状态,C_n是短期记忆，h_n是输出；对于一个域名，经过LSTM层的处理，会分析这一域名的字符并生成该域名的隐藏特征向量；输出层：输出层用于通过全连接层将域名的隐藏向量映射到标签空间，预测域名的良性概率P_b和恶意概率P_m：

(P_m,P_b)＝softmax(h_nW_output)

其中，W_output是训练参数。

更优的，域名恶意分数计算根据如下公式计算域名S的恶意分数：

其中，域名S的恶意分数越高，域名S的恶意概率越高。

优选的，所述S3中，设备的恶意分数S_device表示为：

其中，[nd₁,nd₂,…nd_N]表示设备访问的不存在域名序列，Pr(nd_i|H₁)表示设备在感染状态(H₁)时访问域名nd_i的概率，Pr(nd_i|H₀)表示设备在良性状态(H₀)时访问域名nd_i的概率；

使用域名的良性概率P_b和恶意概率P_m表示Pr(nd_i|H₀)和Pr(nd_i|H₁)，则

当有一个新的不存在域名请求，计算出了该域名的恶意分数S,则根据如下公式更新设备的恶意分数：

S_device＝S_device+lnS

通过设置μ和ν分别表示误报率和漏报率，如果S_device游走超过上界

则认定该设备是恶意的，产生告警，输出存储的异常访问序列Seq。

本发明具有的有益效果包括以下：

1)本方法仅关注域名请求中的不存在域名，这种类型的域名在请求中占比极少，可以在大量缩减待分析域名的数目，降低计算资源消耗，可有效部署在物联网设备中。

2)本方法使用长短期记忆网络计算域名恶意分数，仅需要域名名称就可以进行计算，所需数据收集容易，实现简单，同时还具有较高的准确率。

3)本方法使用阈值随机游走方法更新主机的恶意分数，大大缩短判断主机恶意所需的异常域名请求数目，缩短所需时间，从而在僵尸主机连接到C&C服务器之前实现检测。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明基于长短期记忆网络的物联网僵尸设备检测方法的步骤流程示意图。

具体实施方式

以下结合具体实施例对一种基于长短期记忆网络的物联网僵尸设备检测方法作进一步的详细描述，这些实施例只用于比较和解释的目的，本发明不限定于这些实施例中。

请参阅图1，一种基于长短期记忆网络的物联网僵尸设备检测方法，包括：

更优的，通过以下规则对原始数据进行参数更新：

a)更新最后访问的不存在域名LastNxD为当前域名；

①.构建计算域名恶意概率的长短期记忆网络模型；

②.域名恶意分数计算。

输入层：输入层用于将S1中提取的域名字段作为输入；

具体公式如下：

f_n＝σ(W_f·[h_n-1,x_n]+b_f)

i_n＝σ(W_i·[h_n-1,x_n]+b_i)

o_n＝σ(W_o·[h_n-1,n]+b_o)

h_n＝o_n·tanh(C_n)

是当前单元状态,C_n是短期记忆，h_n是输出；对于一个域名，经过LSTM层的处理，会分析这一域名的字符并生成该域名的隐藏特征向量；

输出层：输出层用于通过全连接层将域名的隐藏向量映射到标签空间，预测域名的良性概率P_b和恶意概率P_m：

(P_m,P_b)＝softmax(h_nW_output)

其中，W_output是训练参数。

其中，域名S的恶意分数越高，域名S的恶意概率越高。

优选的，所述S3中，设备的恶意分数S_device表示为：

S_device＝S_device+lnS

该方法实时监控主机请求的不存在域名，对每一个新的被请求域名，使用长短期记忆网络分析计算被请求域名的恶意分数，而后使用阈值随机游走算法根据新请求域名的恶意分数更新主机的恶意分数，从而达到在僵尸主机发出少量异常查询，连接C&C服务器之前快速发现该设备被感染目的。

在一实施例中，在预处理阶段，初始化四个相关参数Seq＝[NULL],S_device＝0,LastNxD＝NULL,LastTime＝NULL，设置时间间隔阈值τ为10分钟。监控设备的DNS请求，当出现一个新的不存在域名www.example.com的访问请求时，提取对应的二级域名example.com和访问时间t。更新Seq＝[example.com],S_device＝0,LastNxD＝example.com,LastTime＝t。

在域名恶意分数计算阶段，使用长为39的one-hot向量编码字符，具体编码规则为，字符‘a-z’对应编码序号1-26，字符，‘0-9’对应编码序号27-36，‘-’对应编码序号37，‘.’对应编码序号38,所有其他字符对应编码序号39，设置隐藏向量维度为100，使用交叉熵函数作为损失函数训练模型，使用训练好的模型计算example.com的恶意概率和良性概率，并进一步得出其恶意分数S。

在受感染设备检测阶段，根据example.com对应的恶意分数S更新设备的恶意分数S_device＝S_device+ln S,设置误报率和漏报率μ和ν均为0.01，当S_device>ln99时判定该设备为恶意的，发出告警，并输出当前存储域名访问序列Seq＝[example.com]作为告警依据。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。