CN107392016A

CN107392016A - 一种基于代理的Web数据库攻击行为检测系统

Info

Publication number: CN107392016A
Application number: CN201710551870.1A
Authority: CN
Inventors: 方勇; 黄诚; 刘亮; 刘小凯; 龙啸
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2017-07-07
Filing date: 2017-07-07
Publication date: 2017-11-24

Abstract

本发明涉及一种基于代理的能够准确检测SQL注入攻击、恶意频率请求的系统，其特征在于通过分析网站产生的SQL请求实现对上述两种攻击行为的检测。

Description

一种基于代理的Web数据库攻击行为检测系统

技术领域

背景技术

随着互联网通信技术和网站技术的迅猛发展，Web应用已经越来越多样化。Web已经不再只由静态网页提供信息服务，而变成了可与数据库进行交互的一项技术。正是由于Web技术与数据库技术的完美融合，如今的Web应用才分布的愈发广泛。除了云计算、O2O、电子商务等新兴领域，Web数据库技术在传统教育、政府、医疗等方面发挥了重要作用。

网站技术的发展日新月异，但是网站安全问题也随之越发突出，近几年数据库泄露事件更是频繁发生。攻击者针对数据库的攻击，主要有两种方式：一. 攻击者利用数据库漏洞或者弱口令等，直接连接数据库盗取、损害数据；二. 攻击者利用Web程序等漏洞，间接获取数据库中数据。传统数据库安全讨论的重点是访问控制、身份认证等安全机制，同时要为可信用户提供及时、可靠、安全的数据库服务，即主要防范第一种攻击方式。然而，通过对国内网站安全现状数据以及信息泄露事件评估后，攻击者借助Web程序作为跳板进而攻击数据库的情形更加普遍；其中，常见且危害严重的漏洞有SQL注入，攻击者利用Web程序过滤参数不严插入恶意的SQL语句，造成数据库数据库泄露；另外，暴力破解、撞库、恶意注册、接口泄露等都是针对数据库的攻击行为。

综上所述，可以将常见的Web数据库攻击行为分为两类，分别为SQL注入攻击行为、恶意频率请求行为，并提出一个基于代理的Web数据库攻击行为检测模型用于及时检测和告警威胁。本发明除了在检测SQL注入攻击技术上的改进外，更创新地提出利用机器学习算法检测恶意频率请求行为，这样可以更好地保护广大用户信息，同时也能保护公司、机构的网络资产不受侵害，因此具有很大的研究价值和应用意义。

Web数据攻击行为检测对保护数据库资产具有十分重要的意义。

Web数据库攻击行为主要分为SQL注入攻击行为以及恶意频率请求行为。

对于Web数据攻击行为的检测，主要需要解决的难题在于：

（1）如何对未知SQL注入攻击进行检测；

（2）如何区分恶意频率请求行为和普通的爬虫行为。

（3）如何判定检测出的攻击行为是否对数据库造成了损害。

本系统重点对于以上三个问题进行解决，实现一个基于代理的Web数据库攻击行为检测系统。

检测系统。

发明内容

该发明是采用数据库代理、隐马尔可夫模型、C4.5决策树等技术而开发的先进检测系统，通过数据库代理对网站产生的SQL语句进行训练和检测，实现对攻击行为的预警。

该发明旨在实现如下目标：

（1）透明性。在网站与数据库之间做透明代理，在获取网站产生的SQL语句的同时，不影响网站用户的正常访问。

（2）通用性。系统适用于常见的关系型数据库如MySQL、Oracle、SQL Server等，关系型数据库的SQL语法大同小异，针对不同的关系型数据库设定不同的规则进行关键参数的提取。

（3）针对性。针对不同的网站，需要先采集网站产生的SQL请求进行训练，通过机器学习的方式训练得到特定的参数值和阈值，从而实现对该网站的检测和预警。对于不同的网站，训练的模型参数会不同。

为实现上述目的，该发明采用了如下技术方案：该Web数据库攻击行为检测系统主要部署在代理服务器上。系统主要包括数据库代理模块、SQL注入检测模块、恶意频率请求检测模块以及攻击行为验证和告警模块。

所述的数据库代理模块利用Golang以及Python编写，主要实现了数据包捕获、SQL请求以及SQL请求预处理等功能。

所述的SQL注入检测模块由人工标记、词法分析、SQL参数、模型训练、模型检测等部分组成，先将模块设置为训练模式收集SQL请求进行分析和模型构建，训练好的模型可用于SQL注入攻击的检测。

所述的恶意频率请求检测模块由人工标记、特征提取、特征训练、攻击检测等部分组成，同样先进行决策树的参数训练，待决策树构建好后可用于恶意频率请求行为的检测。

所述的攻击行为验证和告警模块由备份数据库、攻击验证、攻击行为告警部分组成，通过将检测出有攻击倾向的SQL请求送往备份数据库，通过设定的规则从SQL响应中判断该条SQL请求是否是一次成功的攻击行为，最后对所验证的攻击行为进行告警。

附图说明

图1是本发明的主要系统架构图

图2是本发明的模型系统部署图

图3是本发明的SQL注入检测模块整体运行流程图

图4是本发明的恶意频率请求检测模块流程图

具体实施方式：

该基于代理的Web数据库攻击行为检测模型系统包含四个模块：数据库代理模块、SQL注入检测模块、恶意频率请求检测模块以及攻击行为验证和告警模块。

如图1所示为系统的主要架构图，详细的介绍了上述四个模块的相关设计，并说明了相关模块的工作流程以及主要功能。数据库代理模块主要是捕获MySQL流量包，并进行协议分析还原出SQL请求，并对SQL请求进行预处理；SQL注入攻击检测模块主要是对还原出的SQL语句进行词法分析后，提取关键的参数进行SQL注入攻击的检测；恶意频率请求的检测主要是利用三个特征构建决策树，并用于恶意频率请求的分类；攻击验证及告警模块主要是利用数据库的返回包来判断攻击者是否完成一次成功的攻击行为。

图2所示模型系统的部署图，从系统部署图上来看包含客户端、Web服务器、代理服务器、备份数据库以及主数据库等；其中检测模型主要部署在代理服务器上。备份数据库的数据结构以及数据内容都需要与主数据库保持同步，为了降低系统资源消耗，本文采用了定时同步的方案，每隔一定时间会将主数据库中的数据同步到备份数据库中，以保证攻击行为验证的准确性。最后分别对攻击请求和成功的攻击行为进行不同程度的告警。

图3是SQL注入攻击检测模块的详细流程图，在基于HMM的检测模型构建完成之前，先要将模块配置为训练模式。进行人工标记之后，对捕获的SQL请求进行词法分析，提取出关键的SQL参数，以保证进行训练的都是正常的SQL参数。待HMM模型训练好后，通过计算样本数据与模型的符合程度，设定相应的阈值，便可以达到检测SQL注入攻击的目的。同时，经基于HMM的检测模型检测为正常的SQL请求，可以将其导入训练部分进行再训练，以保持模型参数的最新以及最优。

图4是恶意频率请求检测模块流程图，对于训练数据，对其进行人工标记后提取时间窗口w内的特征值。利用C4.5算法及相应的改进措施，在每个节点处选择最优的属性以及最佳的连续属性分裂点，最终形成决策树分类器。再对测试数据进行处理和特征值计算，利用训练好的决策树分类器进行判决，最终得到检测结果。

本发明的工作过程是：

用户操作访问网站所产生的所有SQL请求都将通过代理服务器进行转发，与此同时SQL请求会被检测，一旦被检测出为SQL注入攻击行为，代理服务器会阻碍这些请求；而检测恶意频率请求行为是基于时间段的特征，因此无法对恶意频率请求行为做到实时阻碍。最后，检测出的攻击请求会被送往备份数据库执行，通过备份数据库的返回判定这些攻击行为是否是成功的攻击，若为一次成功的攻击行为，则说明Web程序存在漏洞，这些SQL请求将会辅助网站管理员定位Web程序的漏洞源。

其中，对于C4.5构建决策树的连续属性选取步骤如下：

1）将训练数据集D以属性Z按升序排列，假定排序后的属性Z的取值

列为，从中可以选取边界点序列（选取中间值）为，其中。同时引进参数和，定义，，分别对应着最大分裂点序号和最大信息增益比。

2）分别按照边界点序列的值ai将训练数据集D进行划分，计算其信息增益比，若，则有，。边界点序列中即为最佳分裂点。

3）改进的求连续属性最佳分裂点的方法，相对于传统的N-1次遍历所有属性值的计算过程，计算效率更高。并且，引入了和虽然在内存中多占用了两个存储空间，但是也省略了多次顺序查找。

本发明在现有的诸多检测方法基础上，研究了基于代理的Web数据库攻击行为检测技术，针对两种特征迥异的攻击行为，分别提出了基于HMM和C4.5决策树的检测技术，并对两种检测技术提出了改进和优化。根据之前提出了理论算法基础，构建一套融合两种检测技术的检测模型。

Claims

1.本发明公开了一种基于代理的Web数据库攻击行为检测模型，其特征在于以下步骤：

步骤一：将SQL流量还原所得的请求进行人工标注处理后分别进行隐马尔可夫模型训练和C4.5决策树构建；

步骤二：待两个分类器被训练好后，分别对样本检测SQL注入攻击和恶意频率请求攻击；

步骤三：将经检测为攻击的SQL请求送往备份数据库进行攻击验证，通过备份数据库的返回信息确定该攻击行为是否是一次成功的攻击行为；

步骤四：将成功的攻击行为和未成功的攻击行为分别进行程度不同的告警，网站管理员可根据标记为成功攻击行为的SQL请求来定位网站程序的漏洞点。

2.根据权利要求1所述的基于代理的Web数据库攻击行为检测模型，其特征在于：对还原的SQL语句进行词法分析，提取关键SQL参数，并以表名为单位进行聚合；提出泛化规则将SQL参数进行泛化后，再通过改进的HMM对样本进行训练，以3sigma原则确定攻击行为的阈值，从而实现对SQL注入攻击的检测。

3.根据权利要求1所述的基于代理的Web数据库攻击行为检测模型，其特征在于：通过对事件窗口w内的SQL语句进行分析，提出三个特征SQL请求频率、SQL请求敏感表比例、SQL请求相似度用于区分正常和攻击行为，并以改进的C4.5算法构建决策树，通过排序以最快的速度寻找到连续属性的最佳分裂点。

4.根据权利要求1所述的基于代理的Web数据库攻击行为检测模型，其特征在于：提出利用备份数据库对攻击行为进行验证，备份数据库需要与主数据库定时同步更新；对SQL注入攻击的验证提出数据泄露、SQL报错、响应延时三个响应特征用于检测；对恶意频率请求攻击验证提出利用返回值是否是空来判断。