CN112118259B

CN112118259B - 一种基于提升树的分类模型的越权漏洞检测方法

Info

Publication number: CN112118259B
Application number: CN202010982414.4A
Authority: CN
Inventors: 李逸萧; 张攀
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2020-09-17
Filing date: 2020-09-17
Publication date: 2022-04-15
Anticipated expiration: 2040-09-17
Also published as: CN112118259A

Abstract

本发明公开了一种基于提升树的分类模型的越权漏洞检测方法，属于网络安全技术领域。该基于提升树的分类模型的越权漏洞检测方法，包括以下步骤：通过被动扫描获取目标系统流量；对目标网站进行收集特征,根据提升树的分类模型计算得出模型函数FM(x)；遍历获取的请求,把样本特征值值代入模型函数FM(x)中,查看返回结果是否为1来判断该请求是否合规。按照上述实现步骤得到的越权漏洞检测结果会比传统的流量未经清洗直接进行越权判断的结果更加精准。

Description

一种基于提升树的分类模型的越权漏洞检测方法

技术领域

本发明涉及网络安全技术领域，更具体的说是涉及一种基于提升树的分类模型的越权漏洞检测方法。

背景技术

在网络安全领域，越权漏洞是web应用常见的业务逻辑漏洞之一。它的形成原因是由于服务器端对客户端提出的数据访问请求过分信任，忽略了对该用户访问权限的判定。传统的人工越权漏洞检测方法耗费时间较长，检测人员需要进行大量的重复性工作，导致了检测效率极为低下。一些web应用漏洞检测商业工具如IBM的AppScan、Acunetix WebVulnerability Scanner、HP的WebInspect等针对一些常规漏洞如XSS，SQL注入等有很完备的漏洞发现以及解决办法。

又比如公开的专利申请文件“201510728727.6”，名为“web访问的越权漏洞检测方法及装置”中，给出了类似解决方案，但是它们对于某些由于Web应用业务逻辑上处理不当而产生的安全问题如越权问题欠缺发现能力或者是产生大量误报信息。

发明内容

本发明的目的在于提供一种基于提升树的分类模型的越权漏洞检测方法，以期解决越权漏洞检测的问题，该问题缺陷的技术实质是进行越权漏洞扫描的流量没有进行清洗，因此导致漏测或者误报。

为了实现上述目的，本发明采用以下技术方案：

一种基于提升树的分类模型的越权漏洞检测方法，包括以下步骤：

通过被动扫描获取目标系统流量；

对目标网站进行收集特征,根据提升树的分类模型计算得出模型函数FM(x)；

遍历获取的请求,把样本特征值值代入模型函数FM(x)中,查看返回结果是否为1来判断该请求是否合规。

进一步的，所述通过被动扫描获取目标系统流量，包括：通过被动扫描的方式，搜集访问目标系统的所有http请求，将获取的所有请求存储在数据库中。

进一步的，所述特征包括：访问量，访问行为，参数类型，返回类型，敏感信息占比，特定信息占比，请求成功率。

进一步的，所述FM(x)的计算方法如下:

根据请求特征构建决策树Tree1；

根据构建的Tree1预测结果计算残差；

根据计算得到的残差构建决策树Tree2；

以此类推，最后对所有决策树Tree进行线性加法运算，得到最终的模型：

其中，x为被动扫描获取的请求根据权重计算方式得到的值；

θm为决策树的参数；

T(x；θm)表示决策树。

进一步的，所述残差的计算方式如下：

r_mi＝y_i-r_m-1(i) 式2

其中，r_mi表示残差；

Yi表示被动扫描获取的请求根据权重计算方式得到的值；

r_m-1(i)表示上一轮残差。

本发明与现有技术相比具有的有益效果是：

本发明是一种基于提升树的分类模型的越权漏洞检测方法，该专利申请解决问题的方法技术本质是采用一种提升树的分类(GBDT)模型对流量进行清洗，与现在技术相比,所独有的技术特征是通过被动扫描获取到流量后,按照提升树的分类(GBDT)模型对流量请求进行清洗再进行是否越权判断。按照本发明提供的技术方案得到的越权漏洞检测结果会比传统的流量未经清洗直接进行越权判断的结果更加精准。

附图说明

图1是本发明的Tree1的一个示例。

具体实施方式

下面结合实施例对本发明作进一步的描述，所描述的实施例仅仅是本发明一部分实施例，并不是全部的实施例。基于本发明中的实施例，本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例，都属于本发明的保护范围。

实施例1:

根据图1所示，一种基于提升树的分类模型的越权漏洞检测方法，包括以下步骤：

S1:通过被动扫描获取目标系统流量；通过被动扫描的方式，搜集访问目标系统的所有http请求，将获取的所有请求存储在数据库中。

S2:对目标网站进行收集特征,根据提升树的分类模型计算得出模型函数FM(x)；根据需求从http请求业务中提取特征，大致可以分为{访问量，访问行为，参数类型，返回类型，敏感信息(手机号、身份证号等，通过正则表达式比对)占比，特定信息占比，请求成功率}用于分类器的学习。

训练过程先构建一个回归决策树，然后用提升的思想拟合上一个模型的残差，结果由训练出来的多棵决策树的结果累加起来产生。

所述FM(x)的计算方法如下:

首先根据http请求特征构建决策树Tree1

根据构建的Tree1预测结果计算残差，这里，只有决策树Tree1的残差是＝真实值-预测值，

(残差＝真实值-预测值，此模型是通过不断拟合实际值消除残差计算出的最终模型，所以初始值在0到1之间任意选择即可)。

所述残差的计算方式如下：

r_mi＝y_i-r_m-1(i)

其中，r_mi表示残差；i＝1,2,…,M

Yi表示被动扫描获取的请求根据权重计算方式得到的值,即真实值；权重的分配主要根据业务进行业务权重设置。

r_m-1(i)表示上一轮残差。

后面的决策树Tree2一直到决策树TreeN的残差是＝真实值-上一轮决策树Tree(M-1)的残差。

根据决策树Tree1预测结果计算残差生成下一个残差表，然后根据此残差表构建决策树Tree2。以此类推，最后对所有决策树进行线性加法运算：

f(x)＝T1(x)+T2(x)+T3(x)+…T3(M)

即可得到最终的模型，再将所有请求基于此模型进行匹配；匹配成功即返回label为1；匹配失败即返回label为0；

将上述f(x)求和即得最终的模型：

其中，x为被动扫描获取的请求根据权重计算方式得到的值；

θm为决策树的参数；决策树的参数即为设特征值(如访问量，访问行为等)根据权重系数计算出的值减去残差的值。举个例子，比如访问量为5，他的权重为0.1，计算出的残差＝0.2；就根据5*0.1-0.2得到最新的树参数。

T(x；θm)表示决策树；T函数就是把所有树参数组合成决策树的一个过程函数；M表示树的个数。

S3:遍历获取的http请求,把样本特征值代入模型函数FM(x)中,查看返回结果是否为1来判断该请求是否合规。将清洗后的请求，通过替换、删除之前预设的用户权限校验值(比如cookie、token等业务系统使用的权限判断头)，通过比对response与改变之前是否有变化进行越权漏洞的检测。

下面结合具体的实施例进一步阐述本发明的技术方案：

1)假设有个目标网站http://test.com，首先根据被动扫描进行业务系统的访问，将获取到的请求流量包保存在数据库中；同时设定目标网站的用户权限校验头为token头。

2)根据需求从业务中提取多个特征，大致分为{访问量，访问行为，参数类型，返回类型，敏感信息占比，特定信息占比，请求成功率}共用于分类器的学习。

通过特征我们建立第一个Tree：

Tree1如图1所示，再根据第一个tree预测结果计算残差：初始化Tree1

的预测值取0.6，通过残差计算公式：

r_mi＝y_i-r_m-1(i),i＝1,2,…,M(yi为通过访问量以及信息占比进行权重加法计算出来的值)

可得最新残差为0.45，然后根据残差构建下一个tree；

以此类推，最后将得到的所有tree进行线性加法计算：最后得到的fM(x)函数即为特征模型。

3)将所有被动扫描获取的请求与fM(x)函数模型进行匹配，匹配成功即将请求标记label为1；将匹配成功的请求的通过替换预设的用户权限校验头token值发起请求，比对返回response的值与改变token返回之前返回response是否相同，如果相似率达到95％以上，就将该条请求标记为具有越权漏洞的请求，等待人工进行复查。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于提升树的分类模型的越权漏洞检测方法，其特征在于，包括以下步骤：

通过被动扫描获取目标系统流量；通过被动扫描的方式，搜集访问目标系统的所有http请求，将获取的所有请求存储在数据库中；

收集目标网站特征,根据需求从http请求业务中提取特征，用于分类器的学习，根据提升树的分类模型计算得出模型函数FM(x)；

遍历获取的http请求,把样本特征值代入模型函数FM(x)中,查看返回结果是否为1来判断该请求是否合规；将清洗后的请求，通过替换、删除之前预设的用户权限校验值，通过比对response与改变之前是否有变化进行越权漏洞的检测；

所述FM(x)的计算方法如下:

根据http请求特征构建决策树Tree1；

根据构建的Tree1预测结果计算残差，决策树Tree1的残差＝真实值-预测值；

根据上述计算得到的残差构建决策树Tree2；

决策树Tree2一直到决策树Tree m的残差＝真实值-上一轮决策树Tree(m-1)的残差；m表示树的个数；

所述残差的计算方式如下：

r_mi＝y_i-r_(m-1)i

其中，r_mi表示残差；i＝1,2,…,m；

Yi表示被动扫描获取的请求根据权重计算方式得到的值,即真实值；权重的分配根据业务进行业务权重设置；

r_m-1(i)表示上一轮残差；

其中，x为被动扫描获取的请求根据权重计算方式得到的值；

θm为决策树的参数；决策树的参数即为特征值根据权重系数计算出的值减去残差的值；

T(x；θm)表示决策树，T函数就是把所有树参数组合成决策树的一个过程函数。

2.根据权利要求1所述的一种基于提升树的分类模型的越权漏洞检测方法，其特征在于，从http请求业务中提取的特征包括：访问量，访问行为，参数类型，返回类型，敏感信息占比，特定信息占比，请求成功率。