CN114168938B

CN114168938B - 一种基于少量异常标签的半监督sql注入攻击检测方法

Info

Publication number: CN114168938B
Application number: CN202111269323.7A
Authority: CN
Inventors: 周颖杰; 赵伟; 杨松; 吕建成
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2023-04-07
Anticipated expiration: 2041-10-29
Also published as: CN114168938A

Abstract

本发明公开了一种基于少量异常标签的半监督SQL注入攻击检测方法，目的是解决现有SQL注入检测方法在数据标签不平衡时，检测性能下降的问题，满足实际场景需求；提出一种基于比特编码的SQL注入攻击检测框架，该框架无需预训练词嵌入模型和语法规则解析；并基于该框架提出一种基于注意力机制的半监督SQL注入攻击检测模型，该模型具有优异的特征关注能力和泛化能力；对新型SQL注入攻击也具有一定的检测性能。

Description

一种基于少量异常标签的半监督SQL注入攻击检测方法

技术领域

本发明属于信息安全技术领域，具体涉及一种基于少量异常标签的半监督SQL注入攻击检测方法。

背景技术

SQL(Structured Query Language)是一种通用的、功能极强的关系数据库语言，是对关系数据存取的标准接口，也是不同数据库系统之间互操作的基础。它集数据查询、数据操作、数据定义、和数据控制功能于一体，被用来进行网页应用数据和后台数据库数据的交互。

SQL注入(SQL inject)是指通过把恶意的SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，欺骗服务器执行恶意的SQL命令，达到窃取、破坏数据的目的。SQL注入攻击具有隐蔽性强、变种多、易突变等特点，是一种简单但很有效的攻击手段。

目前关于SQL注入攻击检测的研究，主要分为三类：传统检测算法、机器学习检测算法和深度学习检测算法。以下分别对这三类方法简单介绍如下：

1、传统的SQL注入攻击检测算法包括静态检测、动态检测、动静态结合检测。静态检测通过对源码的分析推测可能存在的攻击；动态检测是指通过在运行时执行动态渗透测试或生成模型来检测错误和正确性。而动静态结合检测则是融合了前两种方式共同检测。Gould等人提出一种基于静态分析的JDBC源码分析器，该分析器只能检测出不符合输入类型的SQL注入攻击；王溢等人提出一种基于动态分析的方法，通过SQL语法解析构建语法树，进而对语法树进行检测，然而这种方式会隐藏一些SQL注入攻击的关键特征，致使检测性能下降。

2、基于机器学习算法主要通过人工提取属性特征，训练模型进行检测，检测结果依赖于人工选取的特征，容易产生误检和误报。Kim等人首先提出从SQL注入攻击样本中提取n维特征训练SVM模型的方法，然而这种方法的检测率不高；Komiya等人通过空白分割和令牌验证的方式提取特征，并使用集成算法进行检测，增强了模型的泛化能力，但空白分割的特征提取方式难以应对SQL注入攻击的复杂情况。

3、深度学习因其强大的特征学习能力受到关注，越来越多的研究者尝试使用深度学习方法解决SQL注入攻击问题。罗等人直接使用Payload负载的编码特征作为卷积神经网络模型的输入，解决了浅层机器学习维度灾难的问题。谢鑫等人提出能够处理变长序列的弹性池化卷积神经网络，解决了传统卷积神经网络难以处理不定长序列的问题。但是这些方法无法应对数据标签不平衡的环境。李淇等人提出一类数据增强的方法，通过扩充SQL注入攻击样本，达到缓解模型过拟合的目的。然而该方法无法应对新的SQL注入攻击类型，且依赖先验知识和生成样本的质量。

以上现有技术的研究内容弊端较为明显，在实际场景中，由于SQL注入攻击易突变，先验知识匮乏，标注困难，因此迫切的需要一种攻击样本仅需少量攻击样本标签的算法，即可实现对已知、未知SQL注入攻击的检测。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于少量异常标签的半监督SQL注入攻击检测方法，解决了现有SQL注入检测方法在数据标签不平衡时检测性能下降的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于少量异常标签的半监督SQL注入攻击检测方法，包括以下步骤：

S1、根据采集的正常SQL样本和异常SQL样本，构建原始数据集；

S2、对原始数据集进行预处理，得到原始数据集中每个SQL样本对应的被编码后的SQL样本；

S3、根据被编码后的SQL样本，构建并训练得到基于注意力机制的半监督检测模型；

S4、通过基于注意力机制的半监督检测模型对未知的SQL样本进行检测，完成SQL注入攻击的检测。

进一步地：所述步骤S1中，采集的正常SQL样本和异常SQL样本的方法具体为：

通过筛选的方式从公开数据集中获取正常SQL样本；通过自动注入工具攻击WEB应用的方式生成异常SQL样本。

上述进一步方案的有益效果为：在生成异常SQL样本的过程中，通过修改Sqlmap脚本tamper的方式可以丰富SQL注入攻击类型。

进一步地：所述步骤S2中，对原始数据集进行预处理的方法具体为：

SA1、在原始数据集中筛除高度相似或重复的SQL样本，并甄别和去除异常SQL样本中包含的正常SQL样本；

SA2、对原始数据集进行关键词大小写统一，对表名和查询内容的特定字段进行修正，并删除异常SQL样本中包含的网站账号信息；

SA3、通过比特编码策略对原始数据集中的SQL样本进行编码。

进一步地：所述步骤SA3中，比特编码策略的编码方式具体为：

将原始数据集中的每个SQL样本进行定长编码，将其按字符转为ASCII-256十进制数向量，进而将其转为二进制流；其中，对SQL样本进行定长编码时，若SQL样本长度不足256位，则通过空格填充的方式补齐，否则截断保留256位。

上述进一步方案的有益效果为：比特编码解决了预训练词嵌入模型带来的弊端，编码后的SQL样本可以作为基于注意力机制的半监督检测模型的输入。

进一步地：所述步骤S3具体为：

根据被编码后的SQL样本，通过模型优化和参数调节的方式，得到最优模型参数的基于注意力机制的半监督检测模型。

上述进一步方案的有益效果为：通过模型优化和参数调节等方式更新，得到的基于注意力机制的半监督检测模型可以作为最优的未知SQL样本检测模型。

进一步地：所述步骤S3中，基于注意力机制的半监督检测模型包括相互连接的数据分布学习模块和检测器模块。

上述进一步方案的有益效果为：本发明的数据分布学习模块使用基于数据分布学习的模型，为检测器模块提供样本特征中心趋势和离散程度等高层次特征；且检测器模块融合数据分布学习模块提供的高层次特征和SQL样本比特编码特征作为输入，通过特征提取子模块和注意力子模块实现对特征的有效提炼和关注，进而判断SQL样本是否包含SQL注入攻击。

进一步地：数据分布学习模块包括相互连接的推理器和生成器；

其中，推理器的表达式具体为：

I(y_i)＝cat(y|π)

I(z_i|a_i,y_i,x_i)＝N(z_i|u_i(a_i,x_i,y_i),

式中，a_i为第i个编码后的SQL样本的辅助向量，u_i(·)为第i个编码后的SQL样本的期望向量通式，x_i为第i个编码后的SQL样本的样本编码特征，y_i为第i个被编码后的SQL样本的样本标签，z_i为第i个被编码后的SQL样本的样本后验分布通式，σ_i(·)为第i个被编码后的SQL样本的标准差向量通式，cat(·)为多维的数据分布通式，N(·)为高斯采样通式，I(·)为推理器通式，i为被编码后的SQL样本的序数；

生成器的表达式具体为：

G(y_i)＝cat(y|π)

G(a_i|z_i,y_i,x_i)＝f(a_i；z_i,y_i,x_i,w)

G(x_i|z_i,y_i)＝f(x_i；z_i,y_i,w)

式中，f(·)为多层非线性变换通式，w为权重，G(·)为生成器通式。

上述进一步方案的有益效果为：数据分布学习模块通过引入辅助变量增强了传统变分自编码器表征数据分布的能力。

进一步地：检测器模块包括相互连接的特征提取子模块和注意力子模块；

其中，特征提取子模块的表达式具体为：

f₁＝relu(W₁X+b₁)

f_j＝relu(W_jf_j-1+b_j)

式中，X为SQL样本原始编码特征及样本特征中心趋势和离散程度等高维特征的融合特征，W₁为第1层非线性变换的权重，W_j为第j层非线性变换的权重，b₁为第1层非线性变换的偏置，b_j为第j层非线性变换的偏置，f₁为第1层线性变换，f_j-1为第j-1层线性变换，f_j为第j层非线性变换，j为非线性变换层的序数，relu(·)为激活函数；

注意力子模块的表达式具体为：

g_j＝SoftMax(Wg_j+b)

g_k＝g_j·g_w

F＝Concat(g_j,g_k)

式中，g_j为隐层特征，g_w为特征权重，g_k为加权特征，F为融合特征，W为线性变换层的权重，Concat(·)为特征拼接通式，SoftMax(·)为激活函数。

上述进一步方案的有益效果为：检测器模块在传统多层感知机构建的检测器基础上引入了注意力机制和残差机制，实现了特征的有效果关注和泛化能力的增强。

进一步地：所述步骤S4中，对未知的SQL样本进行检测的方法具体为：

根据比较基于注意力机制的半监督检测模型输出的两维概率分布，判断未知的SQL样本是否包含SQL注入攻击。

本发明的有益效果为：

(1)本发明的SQL注入攻击检测方法可以实现在数据标签不平衡时，检测性能稳定，满足实际场景需求。

(2)本发明基于该框架提出一种基于注意力机制的半监督SQL注入攻击检测模型，该模型具有优异的特征关注能力和泛化能力。

(3)本发明的特征提取子模块引入样本特征中心趋势和离散程度等高层次特征，增加了异常与正常样本之间的差异，且注意力子模块中引入注意力机制和残差机制，增强了模型检测能力和泛化能力，对新型的SQL注入攻击也具有一定的检测性能。

附图说明

图1为一种基于少量异常标签的半监督SQL注入攻击检测方法的流程图；

图2为本发明基于注意力机制的半监督检测模型的框图；

图3为本发明的消融实验一结果图；

图4为本发明的消融实验二结果图；

图5为本发明的不同类型异常含标签训练样本数量对模型性能影响实验结果图；

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例1：

如图1所示，一种基于少量异常标签的半监督SQL注入攻击检测方法，包括以下步骤：

本实施例中，为了解决传统SQL注入攻击检测框架采用语法解析、词嵌入编码可能隐藏SQL注入关键特征并引入噪声等问题，本发明提出一种基于比特编码的检测框架。该框架采用基于位的比特编码策略降低了需编码字符的数量，同时无需预训练词编码模型，包括数据采集模块、数据预处理模块、模型训练模块和SQL注入检测模块；该框架首先通过数据采集模块和数据预处理模块构建用于模型训练和测试的高质量数据集；然后通过模型训练模块获取性能最优的模型；最后使用该模型对测试样本检测。

所述步骤S1中，采集的正常SQL样本和异常SQL样本的方法具体为：

本实施例中，公开数据集采用耶鲁大学公布的Spider数据集，自动注入工具为Sqlmap，WEB应用为DVWA；在生成异常SQL样本的过程中，通过修改Sqlmap脚本tamper的方式丰富SQL注入攻击类型。

所述步骤S2中，对原始数据集进行预处理的方法具体为：

SA3、通过比特编码策略对原始数据集中的SQL样本进行编码；

所述步骤SA3中，比特编码策略的编码方式具体为：

本发明考虑到词嵌入编码存在的弊端，采用比特编码策略。该编码策略以位为单位，降低了需编码字符的数量；且无需扫描已知样本构建词库用于预训练编码模型，能够客观的描述样本属性特征。

所述步骤S3具体为：

在模型训练模块中进行模型优化和参数调节等方式更新，得到的基于注意力机制的半监督检测模型可以作为最优的未知SQL样本检测模型。

实施例2：

针对实施例1的步骤S3生成的基于注意力机制的半监督检测模型，包括相互连接的数据分布学习模块和检测器模块。

在本实施例中，如图2所示，数据分布学习模块使用基于数据分布学习的模型为检测器模块提供样本特征中心趋势和离散程度等的高层次特征；且检测器模块融合数据分布学习模块提供的高层次特征和样本编码特征作为输入，通过特征提取子模块和注意力子模块实现对特征的有效提炼和关注，进而判断SQL样本是否包含SQL注入攻击。

在本实施例中，数据分布学习模块使用“Auxiliary deep generative models”中提出的辅助深度生成模型实现，所述模型通过引入辅助变量增强了传统变分自编码器表征数据分布的能力。

数据分布学习模块包括相互连接的推理器和生成器；推理器可以产生高层次特征；生成器可以产生重构样本比特编码特征，根据重构样本比特编码特征可以使高层次特征更能反应该SQL样本的真实分布信息。

其中，推理器的表达式具体为：

I(y_i)＝cat(y|π)

I(z_i|a_i,y_i,x_i)＝N(z_i|u_i(a_i,x_i,y_i),

生成器的表达式具体为：

G(y_i)＝cat(y|π)

G(a_i|z_i,y_i,x_i)＝f(a_i；z_i,y_i,x_i,w)

G(x_i|z_i,y_i)＝f(x_i；z_i,y_i,w)

本实施例的有益效果为：数据分布学习模块通过引入辅助变量增强了传统变分自编码器表征数据分布的能力。

在本实施例中，检测器模块通过关注重点特征和特征细节弥补提升效果。检测器模块在传统多层感知机构建的检测器基础上引入了注意力机制和残差机制，既能对特征实施有效的关注，又保证了检测器的泛化能力。由于注意力机制强大的特征关注能力会使得极少量特征获得较大的权重，造成整体特征细节的丢失，使得检测性能下降，因此引入残差机制可以对丢失的特征细节进行补充。

检测器模块包括相互连接的特征提取子模块和注意力子模块；

特征提取子模块被设计为梯形结构，实现样本特征的降维打击及简单去噪，尽可能保留相对重要的特征。

其中，特征提取子模块的表达式具体为：

f₁＝relu(W₁X+b₁)

f_j＝relu(W_jf_j-1+b_j)

为了提升检测器模块对与任务目标联系密切特征的关注力度并保持模型泛化能力，在注意力子模块引入注意力机制的同时引入残差机制，这是因为注意力机制强大的特征关注能力会使得极少量特征获得较大的权重，造成整体特征细节的丢失，使得检测性能下降，而残差机制可以对丢失的特征细节进行补充。

注意力子模块的表达式具体为：

g_j＝SoftMax(Wg_j+b)

g_k＝g_j·g_w

F＝Concat(g_j,g_k)

所述步骤S4中，对未知的SQL样本进行检测的方法具体为：

根据比较基于注意力机制的半监督检测模型输出的两维概率分布，判断未知的SQL样本是否包含SQL注入攻击；所述两维概率分布具体为第一维概率和第二概率；可以设置第一维概率或第二维概率为异常SQL样本的概率；

若设置的异常SQL样本的概率大于另一个概率时，则未知的SQL样本包含SQL注入攻击；

否则未知的SQL样本为正常样本。

实施例3：

针对实施例2的基于注意力机制的半监督检测模型，采用消融实验的实验结果。

通过引入样本特征中心趋势、离散程度等高层次信息以及注意力子模块两方面提升模型的检测效果，为验证两方面因素对模型性能的影响，分别进行了消融实验研究。

为评估引入样本特征中心趋势、离散程度信息对模型性能的影响，将本发明方法与引入样本特征后验分布信息对模型性能的影响进行了比较。实验结果如图3所示，其中ASDM为本发明的方法，ASDM-Z为引入样本特征的后验分布的方法；使用样本特征中心趋势和离散程度等高层次特征能够使得模型性能提升。ADSM模型相较于ASDM-Z最高性能差(HD)、准确率分别提升1.02％、0.62％，误检率降低了1.34％，而检测率降低0.32％。

为评估注意力子模块对模型性能影响，将本发明方法与不使用注意力子模块对比。实验结果如图4所示，其中ASDM为本发明的方法，ASDM No AM表示不含注意力子模块；注意力子模块能够明显提升模型的性能。ADSM模型相较于ASDM-No AM最高性能差(HD)、准确率分别提升0.98％、0.35％，误检率降低0.92％，检测率几乎相同。

通过以上消融研究，证明了本发明方法的有效性。这是因为样本特征中心趋势、离散程度信息不但能够表达特征的后验分布，还能表达特征偏离程度等信息，而注意力子模块加强了模型对于特征的关注能力。因此本发明提出的方法能够有效的检测SQL注入攻击。

实施例4：

针对实施例2的基于注意力机制的半监督检测模型，采用新型SQL注入攻击检测的实验结果。

由于新型SQL注入攻击难以标记，因此数据效率是评估半监督方法的重要因素。本发明按照SQL注入攻击类型采样标注样本，取3、5、10、15条不等，对本发明方法的数据效率进行实验验证。

本发明方法性能的总体趋势随着异常样本标记数量的增加而增加，但并未发生剧变，性能稳定。实验结果如图5所示。随着可标注的异常样本的增加，本发明方法整体性能(HD、ACC)由94.05％、96.96％提升至95.72％、97.8，误检率由4.7％降至2.5％。检测率的结果与总体趋势相反，这是因为不同的异常之间分布不同，还可能存在相互冲突的信息，随着标记异常样本数量的增加，这种趋势会被增大，因此检测性能降低。

为了验证本发明方法对新型SQL注入攻击的检测能力，并保障验证结果并非因偶然原因造成的，进行了三组新型SQL注入攻击检测实验。本实验使用的数据设置与对比试验中的数据设置不同之处在于：本实验训练集中的有标签异常样本由对比实验训练集的有标签异常样本随机选择取七至八种攻击类型的样本组成(大约45至80条)。

实验结果如表1所示，可以看出当有未曾被标注出的新类型SQL注入样本出现时，本发明方法依然具有良好的检测能力：检测率达到93％以上，误检率在5％以下。本发明方法之所以能够对新型SQL注入攻击依然有较优的检测效果，原因有两点：一方面时因为引入样本特征中心趋势和离散程度等高层次特征，增加了异常与正常样本之间的差异，另一方面是因为注意力子模块中引入残差机制，增强了模型的泛化能力。

表1

本发明方法的实施过程为：采用不同的方式和途径采集正常SQL样本和异常SQL样本，构建用于模型训练的原始数据集；对原始数据集中的SQL样本进行预处理，得到原始数据集中的SQL样本对应的被编码后的SQL样本；根据被编码后的SQL样本在模型训练模块构建和优化，得到最优模型参数的基于注意力机制的半监督检测模型；使用基于注意力机制的半监督检测模型对输入的未知的SQL样本检测，根据基于注意力机制的半监督检测模型输出两维概率分布，判断未知的SQL样本是否包含SQL注入攻击，完成SQL注入攻击的检测。

本发明的有益效果为：本发明的SQL注入攻击检测方法在数据标签不平衡时，检测性能稳定，满足实际场景需求；本发明提出一种基于比特编码的SQL注入攻击检测框架，该框架无需预训练词嵌入模型和语法规则解析。

本发明并基于该框架提出一种基于注意力机制的半监督SQL注入攻击检测模型，该模型具有优异的特征关注能力和泛化能力。

本发明的特征提取子模块引入样本特征中心趋势和离散程度等高层次特征，增加了异常与正常样本之间的差异，且注意力子模块中引入残差机制，增强了模型的泛化能力，对新型的SQL注入攻击也具有一定的检测性能。

在本发明的描述中，需要理解的是，术语“中心”、“厚度”、“上”、“下”、“水平”、“顶”、“底”、“内”、“外”、“径向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或隐含指明的技术特征的数量。因此，限定由“第一”、“第二”、“第三”的特征可以明示或隐含地包括一个或者更多个该特征。

Claims

1.一种基于少量异常标签的半监督SQL注入攻击检测方法，其特征在于，包括以下步骤：

S4、通过基于注意力机制的半监督检测模型对未知的SQL样本进行检测，完成SQL注入攻击的检测；

所述步骤S3具体为：

根据被编码后的SQL样本，通过模型优化和参数调节的方式，得到最优模型参数的基于注意力机制的半监督检测模型；

所述步骤S3中，基于注意力机制的半监督检测模型包括相互连接的数据分布学习模块和检测器模块；

数据分布学习模块包括相互连接的推理器和生成器；

其中，推理器的表达式具体为：

I(y_i)＝cat(y|π)

I(z_i|a_i,y_i,x_i)＝N(z_i|u_i(a_i,x_i,y_i),

生成器的表达式具体为：

G(y_i)＝cat(y|π)

G(a_i|z_i,y_i,x_i)＝f(a_i；z_i,y_i,x_i,w)

G(x_i|z_i,y_i)＝f(x_i；z_i,y_i,w)

式中，f(·)为多层非线性变换通式，w为权重，G(·)为生成器通式；

其中，特征提取子模块的表达式具体为：

f₁＝relu(W₁X+b₁)

f_j＝relu(W_jf_j-1+b_j)

注意力子模块的表达式具体为：

g_j＝SoftMax(Wg_j+b)

g_k＝g_j·g_w

F＝Concat(g_j,g_k)

2.根据权利要求1所述的基于少量异常标签的半监督SQL注入攻击检测方法，其特征在于，所述步骤S1中，采集的正常SQL样本和异常SQL样本的方法具体为：

3.根据权利要求1所述的基于少量异常标签的半监督SQL注入攻击检测方法，其特征在于，所述步骤S2中，对原始数据集进行预处理的方法具体为：

SA3、通过比特编码策略对原始数据集中的SQL样本进行编码。

4.根据权利要求3所述的基于少量异常标签的半监督SQL注入攻击检测方法，其特征在于，所述步骤SA3中，比特编码策略的编码方式具体为：

5.根据权利要求1所述的基于少量异常标签的半监督SQL注入攻击检测方法，其特征在于，所述步骤S4中，对未知的SQL样本进行检测的方法具体为：