CN117688540B

CN117688540B - 接口敏感数据泄露检测防御方法、装置及计算机设备

Info

Publication number: CN117688540B
Application number: CN202410137819.6A
Authority: CN
Inventors: 柳遵梁; 刘聪; 王月兵; 周杰; 闻建霞; 覃锦端
Original assignee: Hangzhou Meichuang Technology Co ltd
Current assignee: Hangzhou Meichuang Technology Co ltd
Priority date: 2024-02-01
Filing date: 2024-02-01
Publication date: 2024-04-19
Anticipated expiration: 2044-02-01
Also published as: CN117688540A

Abstract

本发明实施例公开了接口敏感数据泄露检测防御方法、装置及计算机设备。所述方法包括：采集接口流量数据；提取请求数据以及响应数据，以得到提取结果；统计同一接口的相关信息；确定统计结果中属于业务接口的接口，以得到业务接口数据集；进行敏感字段的识别，以得到敏感字段集；获取敏感接口集；获取敏感接口身份集；获取身份敏感接口指纹集；实时收集请求对应的通信数据包并提取相关信息；判断请求是否存在敏感数据泄露行为；若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。通过实施本发明实施例的方法可实现有效识别与防御多变的接口敏感数据泄露检测行为。

Description

接口敏感数据泄露检测防御方法、装置及计算机设备

技术领域

本发明涉及数据检测方法，更具体地说是指接口敏感数据泄露检测防御方法、装置及计算机设备。

背景技术

传统的接口敏感数据泄露检测防御方法是基于检测接口响应数据包中是否存在不属于对应身份的敏感数据，例如身份证信息、手机号信息等进行检测的。由于对敏感数据的定义过于片面，无法识别多变的敏感数据，所以无法对多变的接口敏感数据泄露行为进行检测，导致在接口敏感数据泄露问题上往往出现大量漏报。因此，当前的接口敏感数据泄露检测防御方法无法有效识别与防御多变的接口敏感数据泄露检测行为。

因此，有必要设计一种新的方法，实现有效识别与防御多变的接口敏感数据泄露检测行为。

发明内容

本发明的目的在于克服现有技术的缺陷，提供接口敏感数据泄露检测防御方法、装置及计算机设备。

为实现上述目的，本发明采用以下技术方案：接口敏感数据泄露检测防御方法，包括：

采集接口流量数据；

对所述接口流量数据提取请求数据以及响应数据，以得到提取结果；

根据所述提取结果统计同一接口的相关信息，以得到统计结果；

确定所述统计结果中属于业务接口的接口，以得到业务接口数据集；

对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集；

通过所述敏感字段集以及所述统计结果获取敏感接口集；

根据所述敏感接口集以及所述提取结果获取所述敏感接口集的敏感接口身份集；

根据所述统计结果、所述敏感接口集以及所述敏感接口身份集获取身份敏感接口指纹集；

实时收集请求对应的通信数据包并提取相关信息；

根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为；

若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。

其进一步技术方案为：所述接口流量数据包括HTTP请求数据包、对应的响应数据包以及请求数据包对应的时间点；所述提取结果包括各个请求数据包中的请求接口、认证信息、各个响应数据包内的响应字段，所述响应字段包括响应参数及其值。

其进一步技术方案为：所述根据所述提取结果统计同一接口的相关信息，以得到统计结果，包括：

对所述提取结果提取认证信息，并去重整合为认证信息集；

移除所述提取结果中每个数据的认证信息，以得到三元组；

整合同一接口的三元组，以得到整合结果；

从整合结果中分别从各个同一接口的三元组中任意选择一个三元组中的接口数据组成接口数据集；

统计访问时段；

统计被访问次数；

统计被访问频率；

统计不同响应数据次数；

整合所述接口数据集、认证信息集、访问时段、被访问次数、被访问频率以及不同响应数据次数，以得到统计结果。

其进一步技术方案为：所述确定所述统计结果中属于业务接口的接口，以得到业务接口数据集，包括：

定义业务时段集；

计算业务时段集与所述统计结果内的访问时段数据集中的访问时段的交集，以得到交集结果；

对满足要求的所述交集结果中的访问时段对应的被访问频率对应的值进行求和，以得到求和结果；

根据所述求和结果与满足要求的所述交集结果中的访问时段对应的被访问频率对应的值求商，当商大于设定比值，则确定对应接口为业务接口，并将对应的被访问次数、访问时段、被访问频率以及各个响应字段的不同响应数据次数构成业务接口对应的数据集，统计所有业务接口对应的数据集，以得到业务接口数据集。

其进一步技术方案为：所述对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集，包括：

遍历所述业务接口数据集中业务接口对应的各个响应字段的不同响应数据次数；

将响应字段的不同响应数据次数对应的值不小于认证信息集长度所对应的响应字段整合为第一数据集；

当第一数据集内的元素是一个时，将所述第一数据集内键整合为敏感字段集；若第一数据集内的元素有多个时，计算第一数据集内的元素的交集，以将所有交集中对应的键组成敏感字段集。

其进一步技术方案为：所述通过所述敏感字段集以及所述统计结果获取敏感接口集，包括：

将所述统计结果中的响应字段存在于敏感字段集所对应的接口确定为敏感接口，整合所有敏感接口，以形成敏感接口集。

其进一步技术方案为：所述实时收集请求对应的通信数据包并提取相关信息，包括：

实时收集请求对应的通信数据包，从所述通信数据包内提取被检测请求数据包的请求接口以及认证身份，拦截并提取被检测请求数据包对应的响应数据包中的响应参数及其值，提取请求时间点的请求时段，收集请求时段至一分钟之前认证身份请求接口的请求频率，以形成相关信息。

其进一步技术方案为：所述根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为，包括：

判断所述相关信息内的请求接口是否存在于身份敏感指纹集内；

若所述相关信息内的请求接口不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

若所述相关信息内的请求接口存在于身份敏感指纹集内，则判断所述相关信息内的请求时段是否存在于身份敏感指纹集内；

若所述相关信息内的请求时段不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

若所述相关信息内的请求时段存在于身份敏感指纹集内，则判断所述请求频率是否异常；

若所述请求频率异常，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

若所述请求频率不异常，则提取所述被检测请求数据包对应的响应数据包中的响应参数及其值中的敏感参数字段及值，以得到敏感参数数据；

整合所述敏感参数数据、所述请求接口以及认证身份，并对认证身份进行md5计算，以得到第一计算结果；

判断所述第一计算结果是否存在于身份敏感接口指纹集中；

若所述第一计算结果存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求不存在敏感数据泄露行为；

若所述第一计算结果不存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求存在敏感数据泄露行为。

本发明还提供了接口敏感数据泄露检测防御装置，包括：

采集单元，用于采集接口流量数据；

提取单元，用于对所述接口流量数据提取请求数据以及响应数据，以得到提取结果；

统计单元，用于根据所述提取结果统计同一接口的相关信息，以得到统计结果；

业务接口确定单元，用于确定所述统计结果中属于业务接口的接口，以得到业务接口数据集；

敏感字段识别单元，用于对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集；

敏感接口集获取单元，用于通过所述敏感字段集以及所述统计结果获取敏感接口集；

身份集获取单元，用于根据所述敏感接口集以及所述提取结果获取所述敏感接口集的敏感接口身份集；

指纹集获取单元，用于根据所述统计结果、所述敏感接口集以及所述敏感接口身份集获取身份敏感接口指纹集；

数据包收集单元，用于实时收集请求对应的通信数据包并提取相关信息；

判断单元，用于根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为；

防御单元，用于若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。

本发明还提供了一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法。

本发明与现有技术相比的有益效果是：本发明通过对接口进行业务接口判断，对业务接口进行敏感字段识别，通过敏感字段判断敏感接口，最后获取身份敏感接口指纹，通过敏感接口指纹判断接口请求是否存在敏感数据泄露行为，当接口请求存在敏感数据泄露行为时，防御敏感数据泄露行为，实现有效识别与防御多变的接口敏感数据泄露检测行为。

下面结合附图和具体实施例对本发明作进一步描述。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的接口敏感数据泄露检测防御方法的应用场景示意图；

图2为本发明实施例提供的接口敏感数据泄露检测防御方法的流程示意图；

图3为本发明实施例提供的接口敏感数据泄露检测防御装置的示意性框图；

图4为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1为本发明实施例提供的接口敏感数据泄露检测防御方法的应用场景示意图。图2为本发明实施例提供的接口敏感数据泄露检测防御方法的示意性流程图。该接口敏感数据泄露检测防御方法应用于服务器中。该服务器与终端进行数据交互，利用接口被的各种访问信息判断当前接口是否为业务接口，通过敏感字段识别算法提取业务接口中的敏感字段，再通过敏感字段判断接口是否属于敏感接口，之后获取身份敏感接口指纹，通过身份敏感接口指纹检测接口请求是否存在敏感数据泄露，如存在，通过敏感数据泄露防御算法进行防御，实现有效识别与防御多变的接口敏感数据泄露检测行为。

图2是本发明实施例提供的接口敏感数据泄露检测防御方法的流程示意图。如图2所示，该方法包括以下步骤S110至S220。

S110、采集接口流量数据。

在本实施例中，所述接口流量数据包括HTTP请求数据包、对应的响应数据包以及请求数据包对应的时间点。

具体地，通过在网络端部署接口流量采集装置采集接口流量数据，所述的接口流量采集包括以下内容：

针对某主机H_n，收集所有与H_n通信的HTTP请求数据包G₁,G₂,G₃,G₄,……,G_n、该请求包对应的响应数据包R₁,R₂,R₃,R₄,……,R_n以及该请求/响应数据包对应的时间点T₁,T₂,T₃,T₄,……,T_n，T_n为时:分:秒结构。将请求数据包G₁,G₂,G₃,G₄,……,G_n整合为请求包数据集G{G₁,G₂,G₃,G₄,……,G_n}，响应包R₁,R₂,R₃,R₄,……,R_n整合为响应包数据集R{R₁,R₂,R₃,R₄,……,R_n}，时间点T₁,T₂,T₃,T₄,……,T_n整合为时间点数据集T{T₁,T₂,T₃,T₄,……,T_n}。

S120、对所述接口流量数据提取请求数据以及响应数据，以得到提取结果。

在本实施例中，所述提取结果包括各个请求数据包中的请求接口、认证信息、各个响应数据包内的响应字段，所述响应字段包括响应参数及其值。

具体地，存在算法A1，该算法针对请求包数据集G{G₁,G₂,G₃,G₄,……,G_n}提取各个请求数据包中的请求接口、认证信息，针对响应包数据集R{R₁,R₂,R₃,R₄,……,R_n}提取各个响应数据包中响应参数及其值，Rn结构为{响应参数:响应参数值}；

算法A1具体如下，针对请求包数据集G{G₁,G₂,G₃,G₄,……,G_n}，响应包数据集R{R₁,R₂,R₃,R₄,……,R_n}，时间点数据集T{T₁,T₂,T₃,T₄,……,T_n}，计算A1(G,R,T)得到数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}}，其中，I₁,I₂,I₃,……,I_n为请求数据包G₁,G₂,G₃,G₄,……,G_n中的请求接口，C₁,C₂,C₃,……,C_n为请求数据包G₁,G₂,G₃,G₄,……,G_n中的认证信息，数据集RZ₁,RZ₂,RZ₃,……,RZ_n为响应数据包R₁,R₂,R₃,R₄,……,R_n中的响应参数及其值{RK_1:RV₁,RK₂:RV₂,RK₃:RV₃,……,RK_n:RV_n}，T_n为请求数据包G_n对应的时间点T_n。

S130、根据所述提取结果统计同一接口的相关信息，以得到统计结果。

在本实施例中，统计结果是指同一接口的相关信息，具体包括提取的接口信息、认证信息、访问时段、被访问次数、被访问频率以及不同响应数据次数。

在一实施例中，上述的步骤S130可包括步骤S131~ S139。

S131、对所述提取结果提取认证信息，并去重整合为认证信息集。

在本实施例中，从数据集Ti中的每个数据中提取认证信息C₁,C₂,C₃,……,C_n，并将其去重整合为认证信息集TC。

S132、移除所述提取结果中每个数据的认证信息，以得到三元组。

在本实施例中，将数据集Ti中的每个数据的认证信息C₁,C₂,C₃,……,C_n移除，得到三元组{I₁, RZ₁, T₁}, {I₂, RZ₂, T₂}, ..., {I_n, RZ_n, T_n}。

S133、整合同一接口的三元组，以得到整合结果。

在本实施例中，将具有相同I值的三元组整合为同一个数据集TZ₁, TZ₂, ...,TZ_n。该数据集作为整合结果。

S134、从整合结果中分别从各个同一接口的三元组中任意选择一个三元组中的接口数据组成接口数据集。

在本实施例中，从每个数据集TZ中任意选择一个三元组中的接口数据组成接口数据集LI。

S135、统计访问时段。

在本实施例中，统计每个数据集TZ中的Tn，去重得到访问时段数据集F。

S136、统计被访问次数。

在本实施例中，计算每个数据集TZ的长度，得到被访问次数数据集LZ。

S137、统计被访问频率。

在本实施例中，统计每个数据集TZ中相同接口在不同时段的被访问次数，得到被访问频率数据集PL。

S138、统计不同响应数据次数。

S139、整合所述接口数据集、认证信息集、访问时段、被访问次数、被访问频率以及不同响应数据次数，以得到统计结果。

在本实施例中，将LI, TC, F, LZ, PL, RC整合为数据集WZ，具体地，存在算法A2，该算法针对数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}}收集统计该数据集Ti中同一接口的相关信息；

算法A2具体如下，针对数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}}，即计算A2(Ti)，算法A2首先会将数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}}中的各个数据中的认证信息C₁,C₂,C₃,……,C_n提取出并将C₁,C₂,C₃,……,C_n去重整合为认证信息集TC{TC₁,TC₂,TC₃,TC₄,……,TC_n}。将认证信息C₁,C₂,C₃,……,C_n从Ti₁,Ti₂,Ti₃,Ti₄,……,Ti_n取出后，Ti₁,Ti₂,Ti₃,Ti₄,……,Ti_n变为三元组{I₁,RZ₁, T₁}, {I₂, RZ₂, T₂}, ..., {I_n, RZ_n, T_n}，针对三元组{I₁, RZ₁, T₁}, {I₂, RZ₂,T₂}, ..., {I_n, RZ_n, T_n}，算法A2会将三元组{I₁, RZ₁, T₁}, {I₂, RZ₂, T₂}, ..., {I_n,RZ_n, T_n}中I₁,I₂,I₃,……,I_n值相同的三元组整合为同一个数据集TZ₁,TZ₂,……,TZ_n{{I₁,RZ₁,T₁},……,{I_n,RZ_n,T_n}}，算法A2会提取出TZ₁,TZ₂,……,TZ_n中各个数据集中的任意一接口组成一个接口数据集，TZ₁,TZ₂,……,TZ_n经提取后得到LI₁,LI₂,LI₃,……,LI_n；LI₁,LI₂,LI₃,……,LI_n，整合为数据集LI{ LI₁,LI₂,LI₃,……,LI_n，}。之后，算法A2会根据TZ₁,TZ₂,……,TZ_n各个数据集中的T_n整理同个接口被访问的时段即统计并去重T_n中的时，TZ₁,TZ₂,……,TZ_n经统计后，得到F₁,F₂,F₃,……,F_n；F₁,F₂,F₃,……,F_n整合为数据集F{F₁,F₂,F₃,……,F_n}。之后，算法A2会统计各个相同接口的总被访问次数即分别计算数据集TZ₁,TZ₂,……,TZ_n的长度len(TZ₁),len(TZ₂),……,len(TZ_n)，TZ₁,TZ₂,……,TZ_nn经计算后得到LZ₁,LZ₂,LZ_3,……,LZ_n；LZ₁,LZ₂,LZ_3,……,LZ_n整合为数据集LZ{LZ₁,LZ₂,LZ_3,……,LZ_n}。之后，算法A2会统计各个相同接口在各个时段的被访问频率即统计数据集TZ₁,TZ₂,……,TZ_n中相同接口在相同时段的被访问次数，TZ₁,TZ₂,……,TZ_n经计算后得到PL₁,PL₂,PL₃,……,PL_n{1:n₁,2:n₂,……,24:n_n}，PL₁,PL₂,PL₃,……,PL_n整合为PL{PL₁,PL₂,PL₃,……,PL_n}。之后，算法A2会统计各个相同接口不同响应数据的次数，算法A2首先会对TZ₁,TZ₂,……,TZ_n中各个数据集中的RZ₁,……,RZ_n值为布尔值true或fasle、时间戳值的数据进行删除，然后算法A2会统计各个数据集中的RZ₁,……,RZ_n相同响应参数的不同响应参数值次数，TZ₁,TZ₂,……,TZ_n经计算后得到RC₁,RC₂,……,RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}，RC₁,RC₂,……,RC_n整合为RC{RC₁,RC₂,……,RC_n}。A2(Ti)计算后得到LI,TC,F,LZ,PL,RC，LI,TC,F,LZ,PL,RC整合为数据集WZ{LI,TC,F,LZ,PL,RC}，形成统计结果。

S140、确定所述统计结果中属于业务接口的接口，以得到业务接口数据集。

在本实施例中，业务接口数据集包括属于业务接口的数据集合，这个集合内的元素包括业务接口的标识，表示该接口是业务接口；接口对应的请求时段集合，即在哪些时段内有请求发生；接口在接口对应的请求时段集合中各时段的请求频率值的集合，用于计算业务指标。接口在接口对应的请求时段集合中各时段的请求次数的集合，用于计算业务指标。

在一实施例中，上述的步骤S140可包括步骤S141~ S144。

S141、定义业务时段集。

在本实施例中，设置一个业务时段集Y，默认为{8, 9, 10, 11, 14, 15, 16, 17,18, 19, 20, 21}，这些时段代表了业务活动发生的时间段。

S142、计算业务时段集与所述统计结果内的访问时段数据集中的访问时段的交集，以得到交集结果。

在本实施例中，计算业务时段集Y与访问时段数据集F中每个F_n的交集，得到Y与F_n的交集数据集。

S143、对满足要求的所述交集结果中的访问时段对应的被访问频率对应的值进行求和，以得到求和结果。

在本实施例中，于每个F_n，判断Y与F_n的交集长度是否大于等于Y的长度的三分之一，即判断len(Y∩F_n) en(Y)/3。对于满足条件的F_n，将其对应的PL_n中键为Y∩F_n中的时段的值进行求和，得到求和的值NZ。

S144、根据所述求和结果与满足要求的所述交集结果中的访问时段对应的被访问频率对应的值求商，当商大于设定比值，则确定对应接口为业务接口，并将对应的被访问次数、访问时段、被访问频率以及各个响应字段的不同响应数据次数构成业务接口对应的数据集，统计所有业务接口对应的数据集，以得到业务接口数据集。

在本实施例中，计算NZ除以F_n对应的被访问次数LZ_n，即计算NZ/LZ_n，若NZ/LZ_n不小于3/4，则认为F_n对应的接口LI_n为业务接口。将符合业务接口判断算法A3的接口LI_n、F_n、PL_n、RC_n整合为YI_n{LI_n、F_n、PL_n、RC_n}。将所有符合业务接口判断算法A3的YI_n整合为数据集YI{YI₁, YI₂, YI₃, ..., YI_n}。即A3(WZ) = YI{YI₁, YI₂, YI₃, ..., YI_n}。

具体地，存在算法A3，通过该算法对数据集WZ中接口集LI中的接口进行业务接口判断；

业务接口判断算法A3具体实现如下，针对数据集WZ{LI,TC,F,LZ,PL,RC}，即计算A3(WZ)，存在业务时段集Y，可自主设置，默认为{8,9,10,11,14,15,16,17,18,19,20,21}，计算Y与F中F_n的交集，若Y与F_n的交集长度大于等于Y的长度的三分之一，即len(Y∩F_n)>=len(Y)/3，则对F_n对应的PL_n中键为Y∩F_n中的时段的值进行求和，求和的值为NZ，之后计算NZ除Fn对应的LZ_n，即计算NZ/LZ_n，若NZ/LZ_n 3/4，则认为F_n对应的接口LI_n为业务接口，将F_n对应的LI_n、F_n、PL_n、F_n对应的RC_n整合为YI_n{LI_n、F_n、PL_n、RC_n}，所有符合业务接口判断算法A3的YI_n整合为数据集YI{YI₁, YI₂, YI₃, ..., YI_n}。即A3(WZ)= YI{YI₁, YI₂, YI₃, ...,YI_n}。

S150、对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集。

在本实施例中，敏感字段集包括了在所述业务接口数据集YI{YI₁,YI₂,YI₃,……,YI_n}中被识别为敏感字段的键值对。敏感字段集的每个元素RYR_n表示一个敏感字段，包含以下字段：

RCK_n：敏感字段的键，即响应参数的名称。

RCV_n：敏感字段的值，即响应参数的具体数值。

算法A4通过检查数据集YI中每个业务接口的各个响应字段的不同响应数据次数，判断各个响应参数的不同响应数据次数是否大于等于认证信息集长度YBT。如果存在一个或一个以上的响应参数满足该条件，则将这些数据整合为一个新的数据集RCZ_n。然后，对所有满足条件的RCZ_n进行进一步判断，如果存在交集不为空集的情况，将交集中的键视为敏感字段

在一实施例中，上述的步骤S150可包括步骤S151~ S153。

S151、遍历所述业务接口数据集中业务接口对应的各个响应字段的不同响应数据次数。

在本实施例中，设置一个阈值YBT，表示认证信息集的长度，即YBT=len(TC)。遍历数据集YI{YI₁, YI₂, YI₃, ..., YI_n}：对于每个YI_n{LI_n、F_n、PL_n、RC_n}，其中RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}表示响应字段。

S152、将响应字段的不同响应数据次数对应的值不小于认证信息集长度所对应的响应字段整合为第一数据集。

在本实施例中，对于每个RC_n中的键值对RK_n:N_n，判断N_n是否不小于YBT，若大于等于YBT，记录该键值对。

S153、当第一数据集内的元素是一个时，将所述第一数据集内键整合为敏感字段集；若第一数据集内的元素有多个时，计算第一数据集内的元素的交集，以将所有交集中对应的键组成敏感字段集。

在本实施例中，将所有符合条件的键值对RK_n:N_n，整合为一个新的数据集RCZ_n{RCK₁:RCV₁,RCK₂:RCV₂,……,RCK_n:RCV_n}。判断敏感字段集RYR是否为空：如果只存在RCZ_n这一个数据集，则认为RCZ_n中的键为敏感字段，将RCZ_n中的键整合为敏感字段集RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}。判断RCZ_n与其他数据集RCZexcept(n)的交集是否为空：如果存在一个以上的RCZn数据集，判断RCZ_n与其他数据集RCZexcept(n)的交集是否为空集，即计算RCZ_n∩RCZexcept(n)。整合符合条件的敏感字段集RCJ_n：将所有符合条件的交集RCJ_n中的键整合为敏感字段集RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}。

具体地，存在算法A4，通过该算法对数据集YI{YI1,YI2,YI3,……,YIn}中业务接口的响应字段进行敏感字段识别；

敏感字段识别算法A4具体实现如下，存在阈值YBT为认证信息集长度，即YBT=len(TC)，判断数据集YI{YI₁, YI₂, YI₃, ..., YI_n}中数据YI{YI₁, YI₂, YI₃, ..., YI_n}中RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}中的各个响应参数不同响应数据次数N_n是否大于等于YBT，若RC_n中存在一个或一个以上的响应参数不同响应数据次数N_n大于等于YBT，则将RC_n中所有符合该条件的数据RK_n:N_n整合为一个新的数据集RCZ_n{RCK₁:RCV₁,RCK₂:RCV₂,……,RCK_n:RCV_n}，对YI₁, YI₂, YI₃, ..., YI_n进行计算后若只存在RCZ_n，则认为RCZ_n中各个数据的键为敏感字段，将RCZ_n中各个数据的键整合为RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}，若存在一个以上RCZ_n，则判断RCZ_n与其他数据RCZexcept(n)的交集是否不为空集，即计算RCZ_n∩RCZexcept(n)，若存在一个或一个以上的交集不为空集，则认为RCZ_n∩RCZexcept(n)=RCJ_n中各个数据的键为敏感字段，将所有符合条件的RCJ_n中的各个数据的键整合为敏感字段集RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}。即A4(YI{YI1,YI2,YI3,……,YIn})= RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}。

S160、通过所述敏感字段集以及所述统计结果获取敏感接口集。

在本实施例中，将所述统计结果中的响应字段存在于敏感字段集所对应的接口确定为敏感接口，整合所有敏感接口，以形成敏感接口集。

在本实施例中，定义一个空的敏感接口集MI{MI₁,MI₂,MI₃,……,MI_n}，用于存储所有符合条件的敏感接口。遍历数据集WZ{LI,TC,F,LZ,PL,RC}：对于每个WZ中的数据LIn、RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}，其中RC_n表示响应字段。判断RC_n中的键是否存在于敏感字段集RYR中：对于每个键值对RK_n:N_n，判断RK_n是否存在于敏感字段集RYR中，若存在，则认为该RC_n对应的LI_n为敏感接口。将符合条件的敏感接口整合到敏感接口集MI中：将符合条件的LI_n添加到敏感接口集MI中。返回敏感接口集MI：返回所有符合条件的敏感接口集MI{MI₁,MI₂,MI₃,……,MI_n}。通过以上步骤，算法A5对数据集WZ{LI,TC,F,LZ,PL,RC}中RC中的各个数据RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}进行检查，将符合条件的敏感接口整合为敏感接口集MI{MI₁,MI₂,MI₃,……,MI_n}。最终输出MI集合。

具体地，存在算法A5，该算法通过敏感字段集RYR获取敏感接口集；算法A5具体实现如下，算法A5会对数据集WZ{LI,TC,F,LZ,PL,RC}中RC中的各个数据RC_n{RK₁:N₁,RK₂:N₂,RK₃:N₃,……,RK_n:N_n}进行检查，若RCn中一个或一个以上的键存在于敏感字段集RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}，则认为该RC_n对应的LI_n为敏感接口，将所有符合的LIn整合为敏感接口集MI{MI₁,MI₂,MI₃,……,MI_n}。即A5(WZ{LI,TC,F,LZ,PL,RC}, RYR{RYR₁,RVR₂,RVR₃,……,RVR_n})= MI{MI₁,MI₂,MI₃,……,MI_n}。

S170、根据所述敏感接口集以及所述提取结果获取所述敏感接口集的敏感接口身份集。

在本实施例中，存在算法A6，该算法用于获取敏感接口身份集；

算法A6具体实现如下，算法A6首先会对数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}}中的各个数据中的I_n进行检查，若I_n∩MI≠，则将I_n对应的RZ_n中的键与敏感字段集RYR{RYR₁,RVR₂,RVR₃,……,RVR_n}进行匹配，将RZ_n中键为敏感字段集中的数据以及其键值整合为新的数据集RMZ_n{RMK₁:RMV₁,RMK₂:RMV₂,……,RMK_n:RMV_n}，将符合条件的I_n、I_n对应的C_n、RMZ_n整合为敏感接口身份集CIR{CIR₁,CIR₂,CIR₃,……,CIR_n{I_n,C_n,RMZ_n}}。即A6(Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti_n{I_n,C_n,RZ_n,T_n}},MI{MI₁,MI₂,MI₃,……,MI_n})= CIR{CIR₁,CIR₂,CIR₃,……,CIR_n{I_n,C_n,RMZ_n}。

S180、根据所述统计结果、所述敏感接口集以及所述敏感接口身份集获取身份敏感接口指纹集。

在本实施例中，存在算法A7，该算法用于获取身份敏感接口指纹集；

算法A7具体实现如下，算法A7会将数据集WZ{LI,TC,F,LZ,PL,RC}中的数据集LI{LI₁,LI₂,LI₃,……,LI_n}与敏感接口集MI{MI₁,MI₂,MI₃,……,MI_n}进行匹配，若LI_n位于MI中，则将LI_n,LI_n对应的F_n,LI_n对应的PL_n整合为ZJY_n{LI_n,F_n,PL_n}，将所有符合该条件的ZJY_n整合为数据集ZJY{ZJY₁,ZJY₂,……,ZJY_n{LI_n,F_n,PL_n}}，之后，算法A7会再将ZJY{ZJY₁,ZJY₂,……,ZJY_n{LI_n,F_n,PL_n}}}与CIR{CIR₁,CIR₂,CIR₃,……,CIR_n{I_n,C_n,RMZ_n}}进行匹配，若LI_n=I_n，则将CIR_n{I_n,C_n,RMZ_n}并入ZJY_n{LI_n,F_n,PL_n}中得到ZJZ_n{LI_n,F_n,PL_n,CIR_n{I_n,C_n,RMZ_n}}，将所有符合条件的ZJZn整合为数据集ZJZ{ZJZ₁,ZJZ₂,……, ZJZ_n{LI_n,F_n,PL_n,CIR_n{I_n,C_n,RMZ_n}}}，之后，算法A7会对数据集ZJZ中数据ZJZ_n的数据CIR_n{I_n,C_n,RMZ_n}进行md5计算得到CIR(md5)n，在对数据集ZJZ中数据ZJZ_n的所有数据CIR_n进行md5计算后得到身份敏感接口指纹集ZJF{ZJF₁,ZJF₂,……,ZJF_n{LI_n,F_n,PL_n,CIR(md5)n}}。即A7(WZ{LI,TC,F,LZ,PL,RC},MI{MI₁,MI₂,MI₃,……,MI_n})= ZJF{ZJF₁,ZJF₂,……,ZJF_n{LI_n,F_n,PL_n,CIR(md5)n}}。

S190、实时收集请求对应的通信数据包并提取相关信息。

在本实施例中，实时收集请求对应的通信数据包，从所述通信数据包内提取被检测请求数据包的请求接口以及认证身份，拦截并提取被检测请求数据包对应的响应数据包中的响应参数及其值，提取请求时间点的请求时段，收集请求时段至一分钟之前认证身份请求接口的请求频率，以形成相关信息。

具体地，实时收集某HOST H_n通信的请求数据包G_detection以及该请求数据包的请求时间点TG(detectio_n){h_detection:m_detection}，提取被检测请求数据包G_detection的请求接口I_detection，认证身份C_detection，拦截并提取G_detection对应的响应数据包R_detection中的响应参数及其值RKV_detection{RKdetection1:RVdetection1,RKdetection2:RVdetection2,……,RK_detectionn:RV_detectionn}，提取请求时间点TG_(detection){h_detection:m_detection}的请求时段F_detection，收集h_detection:m_detection至一分钟之前认证身份C_detection请求接口I_detection的次数count_detection。

S200、根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为。

在一实施例中，上述的步骤S200可包括步骤S201~ S209。

S201、判断所述相关信息内的请求接口是否存在于身份敏感指纹集内；

S202、若所述相关信息内的请求接口不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

S203、若所述相关信息内的请求接口存在于身份敏感指纹集内，则判断所述相关信息内的请求时段是否存在于身份敏感指纹集内；

S204、若所述相关信息内的请求时段不存在于身份敏感指纹集内，则执行步骤S204；

S205、若所述相关信息内的请求时段存在于身份敏感指纹集内，则判断所述请求频率是否异常；

若所述请求频率异常，则执行步骤S204；

S206、若所述请求频率不异常，则提取所述被检测请求数据包对应的响应数据包中的响应参数及其值中的敏感参数字段及值，以得到敏感参数数据；

S207、整合所述敏感参数数据、所述请求接口以及认证身份，并对认证身份进行md5计算，以得到第一计算结果；

S208、判断所述第一计算结果是否存在于身份敏感接口指纹集中；

S209、若所述第一计算结果存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求不存在敏感数据泄露行为；

若所述第一计算结果不存在于身份敏感接口指纹集中，则执行步骤S204。

在本实施例中，存在算法A8，通过该算法对接口是否存在敏感数据泄露进行检测；算法A8具体实现如下，判断I_detection是否位于身份敏感接口指纹ZJF中的某一指纹ZJF_n中，若I_detection不在身份敏感接口指纹ZJF中的某一指纹ZJF_n中，则A8(G_detection,ZJF)=1；若I_detection位于身份敏感接口指纹集ZJF的指纹ZJF_n，但F_detection不位于指纹ZJF_n中的F_n中，则代表该次请求存在接口敏感数据泄露，A8(G_detection,ZJF)=0；若I_detection位于身份敏感接口指纹集ZJF的指纹ZJF_n，F_detection位于指纹ZJF_n中的F_n中，查看F_detection在PL_n中对应请求时段的请求频率nn，如count_detection nn/60，则代表该次请求存在接口敏感数据泄露，A8(G_detection,ZJF)=0；若I_detection位于身份敏感接口指纹集ZJF的指纹ZJF_n，F_detection位于指纹ZJF_n中的F_n中，查看F_detection在PL_n中对应请求时段的请求频率n_n，如count_detection<n_n/60，提取RKV_detection中的敏感参数字段及其值整合为MKV_detection{MK_detection1:MV_detection1,MK_detection2:MV_detection2,……,MK_detectionn:MV_detectionn}，将I_detection、C_detection、MKV_detection整合为CIR_detection{I_detection,C_detection,MKV_detection}并将CIR_detection进行md5计算得到CIR(md5)_detection，如CIR(md5)_detection≠CIR(md5)n，则代表该次请求存在接口敏感数据泄露，A8(G_detection,ZJF)=0，如CIR(md5)_detection=CIR(md5)n，则代表该次请求不存在接口敏感数据泄露，A8(G_detection,ZJF)=1；若算法A8结果为1即A8(G_detection,ZJF)=1，则代表该次请求不存在接口敏感数据泄露，将该次请求数据包G_detection对应的响应数据包R_detection响应该请求包；若算法A8结果为0即A8(G_detection,ZJF)=0，则代表该次请求存在接口敏感数据泄露。

S210、若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。

具体地，将该次请求数据包G_detection对应的响应数据包R_detection的响应正文修改为{msg:”存在敏感数据泄露行为，请稍后再试!”}

S220、若所述通信数据包所对应的请求不存在敏感数据泄露行为，则响应所述通信数据包所对应的请求。

举个例子：通过外部网络与H1之间的流量采集设备采集所有与H1通信的HTTP请求数据包，这些请求数据包对应的应答响应数据包以及这些请求数据包的请求时间点，假设收集到2000个HTTP请求数据包、2000个应答响应数据包、2000个请求时间点，即采集的数据为：

请求数据包集G：{G₁,G₂,G₃,G₄,……,G₂₀₀₀}；

应答响应数据包集R：{R₁,R₂,R₃,R₄,……,R₂₀₀₀}；

请求时间点集T：{T₁,T₂,T₃,T₄,……,T₂₀₀₀}；

通过算法A1对请求数据包集G{G₁,G₂,G₃,G₄,……,G₂₀₀₀}、应答响应数据包集R{R₁,R₂,R₃,R₄,……,R₂₀₀₀}、请求时间点集T{T₁,T₂,T₃,T₄,……,T₂₀₀₀}进行计算得到数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti₂₀₀₀{I₂₀₀₀,C₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}，其中，I₁,I₂,I₃,……,I₂₀₀₀为请求数据包G₁,G₂,G₃,……,G₂₀₀₀中提取的请求接口，C₁,C₂,C₃,……,C₂₀₀₀为请求数据包G₁,G₂,G₃,……,G₂₀₀₀中提取的认证信息，数据集RZ₁,RZ₂,RZ₃,……,RZ₂₀₀₀为响应数据包R₁,R₂,R₃,R₄,……,R₂₀₀₀中提取的响应参数及其值。

使用算法A2收集统计数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti₂₀₀₀{I₂₀₀₀,C₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}中同一接口的相关信息。在本实施例中，将数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti₂₀₀₀{I₂₀₀₀,C₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}中的各个数据中的认证信息C₁,C₂,C₃,……,C₂₀₀₀提取并去重整合为认证数据集TC{TC₁,TC₂,TC₃,TC₄,……,TC₁₄₀}，将认证信息提取出后，数据集Ti中的四元组数据变为三元组数据Ti{Ti₁{I₁,RZ₁,T₁},Ti₂{I₂,RZ₂,T₂},……,Ti₂₀₀₀{I₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}，算法A2会将三元组{I₁,RZ₁,T₁},{I₂,RZ₂,T₂},……, {I₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}中I₁,I₂,I₃,I_4,……,I₂₀₀₀值相同的三元组整合为同一个数据集，经整合后，得到TZ₁,TZ₂,……,TZ₁₀₀{{I₁₉₁₅,RZ₁₉₁₅,T₁₉₁₅},……,{I₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}，之后，算法A2会提取出TZ₁,TZ₂,……,TZ₁₀₀中各个数据集中的任意一接口组成一个接口数据集，TZ₁,TZ₂,……,TZ₁₀₀经提取整合后得到数据集LI{LI₁,LI₂,LI₃,……,LI₁₀₀}。之后，算法A2会根据TZ₁,TZ₂,……,TZ₁₀₀各个数据集中的Tn整理同个接口被访问的时段即统计并去重Tn中的时，TZ₁,TZ₂,……,TZ₁₀₀经统计并整合后，得到数据集F{F₁,F₂,F₃,……,F₁₀₀}。之后，算法A2会统计数据集TZ₁,TZ₂,……,TZ₁₀₀的长度len(TZ₁),len(TZ₂),……,len(TZ₁₀₀)，经统计整合得到数据集LZ{LZ₁,LZ₂,LZ₃,……,LZ₁₀₀}。之后，算法A2会统计数据集TZ₁,TZ₂,……,TZ₁₀₀中相同接口在相同时段的被访问次数，TZ₁,TZ₂,……,TZ₁₀₀经统计整合后得到PL{PL₁,PL₂,PL₃,……,PL₁₀₀}。之后，算法A2会统计各个相同接口不同响应数据的次数，经统计后得到数据集RC{RC₁,RC₂,……,RC₁₀₀}。最后，算法A2会将数据集LI,TC,F,LZ,PL,RC整合为数据集WZ{LI,TC,F,LZ,PL,RC}。

业务时段集Y为默认值{8,9,10,11,14,15,16,17,18,19,20,21}，len(Y)/3=4。在本实施例中，len(Y∩F₁)4、len(Y∩F₅)/>4、len(Y∩F₉)/>4、len(Y∩F₁₁)/>4、len(Y∩F₁₇)4、len(Y∩F₂₂)/>4、len(Y∩F₃₁)/>4、len(Y∩F₄₂)/>4、len(Y∩F₄₇)/>4、len(Y∩F₅₂)/>4、len(Y∩F₅₉)/>4、len(Y∩F₆₁)/>4、len(Y∩F₆₄)/>4、len(Y∩F₇₅)/>4、len(Y∩F₈₁)/>4、len(Y∩F₈₄)/>4、len(Y∩F₈₉)/>4、len(Y∩F₉₁)/>4、len(Y∩F₉₅)/>4、len(Y∩F₉₈)/>4，对PL₁、PL₅、PL₉、PL₁₁、PL₁₇、PL₂₂、PL₃₁、PL₄₂、PL₄₇、PL₅₂、PL₅₉、PL₆₁、PL₆₄、PL₇₅、PL₈₁、PL₈₄、PL₈₉、PL₉₁、PL₉₅、PL₉₈中键为Y∩F₁、Y∩F₅、Y∩F₉、Y∩F₁₁、Y∩F₁₇、Y∩F₂₂、Y∩F₃₁、Y∩F₄₂、Y∩F₄₇、Y∩F₅₂、Y∩F₅₉、Y∩F₆₁、Y∩F₆₄、Y∩F₇₅、Y∩F₈₁、Y∩F₈₄、Y∩F₈₉、Y∩F₉₁、Y∩F₉₅、Y∩F₉₈中的时段的值进行求和，求和值NZ分别为253、255、255、19、37、147、167、155、29、155、18、18、31、33、18、25、6、7、12、17，LZ₁、LZ₅、LZ₉、LZ₁₁、LZ₁₇、LZ₂₂、LZ₃₁、LZ₄₂、LZ₄₇、LZ₅₂、LZ₅₉、LZ₆₁、LZ₆₄、LZ₇₅、LZ₈₁、LZ₈₄、LZ₈₉、LZ₉₁、LZ₉₅、LZ₉₈值分别为254、256、256、22、40、150、172、168、31、157、20、18、37、36、21、27、7、8、13、20，在本实施例中，253/LZ₁，255/LZ₅、255/LZ₉、19/LZ₁₁、37/LZ₁₇、147/LZ₂₂、167/LZ₃₁、155/LZ₄₂、29/LZ₄₇、155/LZ₅₂、18/LZ₅₉、18/LZ₆₁、31/LZ₆₄、33/LZ₇₅、18/LZ₈₁、25/LZ₈₄、6/LZ₈₉、7/LZ₉₁、12/LZ₉₅、17/LZ₉₈的值大于等于3/4，故其对应的{LI₁,F₁,PL₁,RC₁}、{LI₅,F₅,PL₅,RC₅}、{LI₉,F₉,PL₉,RC₉}、{LI₁₁,F₁₁,PL₁₁,RC₁₁}、{LI₁₇,F₁₇,PL₁₇,RC₁₇}、{LI₂₂,F₂₂,PL₂₂,RC₂₂}、{LI₃₁,F₃₁,PL₃₁,RC₃₁}、{LI₄₂,F₄₂,PL₄₂,RC₄₂}、{LI₄₇,F₄₇,PL₄₇,RC₄₇}、{LI₅₂,F₅₂,PL₅₂,RC₅₂}、{LI₅₉,F₅₉,PL₅₉,RC₅₉}、{LI₆₁,F₆₁,PL₆₁,RC₆₁}、{LI₆₄,F₆₄,PL₆₄,RC₆₄}、{LI₇₅,F₇₅,PL₇₅,RC₇₅}、{LI₈₁,F₈₁,PL₈₁,RC₈₁}、{LI₈₄,F₈₄,PL₈₄,RC₈₄}、{LI₈₉,F₈₉,PL₈₉,RC₈₉}、{LI₉₁,F₉₁,PL₉₁,RC₉₁}、{LI₉₅,F₉₅,PL₉₅,RC₉₅}、{LI₉₈,F₉₈,PL₉₈,RC₉₈}，将以上数据整合为YI{YI₁{LI₁,F₁,PL₁,RC₁},YI₂{LI₅,F₅,PL₅,RC₅},……,YI₂₀{LI₉₈,F₉₈,PL₉₈,RC₉₈}}。

阈值YBT=len(TC)=140，RC₁为{“username”:253,”idcard”:253,”phone”:253,”size”:5,”page”:1}、RC₅为{“username”:255,”address”:255,”size”:3,”page”:1}、RC₉为{”idcard”:255,“phone”:255,”address”:”255”,”email:”255”,”size”:1,”page”:1}、RC₁₁为{“content”:21,”size”:1,”page”:1}、RC₁₇为{“api”:35,”size”:1,”page”:1}、RC₂₂为{“username”:147,”signature”:147,”size”:1,”page”:1}、RC₃₁为{“username”:167,”BH”:52}、RC₄₂为{“username”:155,”email”:155,”phone”:155,”size”:1,”page”:1}、RC₄₇为{“info”:30}、RC₅₂为{“username”:155,”example”:155,”size”:3,”page”:2}、RC₅₉为{“sl”:19}、RC₆₁为{“code”:18}、RC₆₄为{“s”:15,”qa”:10}、RC₇₅为{“key”:36}、RC₈₁为{“res”:13,”msg”:13}、RC₈₄为{“st”:27,”size”:1,”page”:2}、RC₈₉为{“sys”:7,”msg”:7}、RC₉₁为{“new”:8}、RC95为{“tst”:3,”info”:6}、RC₉₈为{“nid”:20,”now”:20}，将键值大于YBT=len(TC)=140的键与键值提取出得到RCZ₁{“username”:253,”idcard”:253,”phone”:253,”size”:5,”page”:1}、RCZ₂{“username”:255,”address”:255,”size”:3,”page”:1}、RCZ3{”idcard”:255,“phone”:255,”address”:”255”,”email:”255”,”size”:1,”page”:1}、RCZ₄{“username”:147,”signature”:147,”size”:1,”page”:1}、RCZ₅{“username”:167,”BH”:52}、RCZ₆{“username”:155,”email”:155,”phone”:155,”size”:1,”page”:1}、RCZ₇{{“username”:155,”example”:155,”size”:3,”page”:2}，计算以上各个数据集与其他非本数据集的交集，并将交集整合为RYR，在本实施例中，经计算后，得到敏感字段集RVR{“username”,”idcard”,”phone”,”address”,”email”}。

步骤S6中，算法A5根据步骤S5获得的敏感字段集RVR{“username”,”idcard”,”phone”,”address”,”email”}对WZ{LI,TC,F,LZ,PL,RC}中RC中的RC1,RC2,……,RC100进行匹配，经匹配RC₁、RC₅、RC₉、RC₁₅、RC₂₂、RC₂₇、RC₃₁、RC₃₃、RC₄₂、RC₄₅、RC₅₂、RC₆₉、RC₇₈、RC₈₆中存在敏感字段，其对应的LI₁、LI₅、LI₉、LI₁₅、LI₂₂、LI₂₇、LI₃₁、LI₃₃、LI₄₂、LI₄₅、LI₅₂、LI₆₉、LI₇₈、LI₈₆整合为敏感接口集MI{ LI₁、LI₅、LI₉、LI₁₅、LI₂₂、LI₂₇、LI₃₁、LI₃₃、LI₄₂、LI₄₅、LI₅₂、LI₆₉、LI₇₈、LI₈₆}。

算法A6根据获得的敏感接口集MI{ LI₁、LI₅、LI₉、LI₁₅、LI₂₂、LI₂₇、LI₃₁、LI₃₃、LI₄₂、LI₄₅、LI₅₂、LI₆₉、LI₇₈、LI₈₆}中的数据对数据集Ti{Ti₁{I₁,C₁,RZ₁,T₁},Ti₂{I₂,C₂,RZ₂,T₂},……,Ti₂₀₀₀{I₂₀₀₀,C₂₀₀₀,RZ₂₀₀₀,T₂₀₀₀}}中Ti₁,……,Ti₂₀₀0中的I₁,……,I₂₀₀₀进行匹配，在本实施例中，存在1800个I₁,……,I₂₀₀₀中的数据I₃，I₁₁，I₃₂，……,I₁₉₈₇存在于敏感接口集MI{ LI₁、LI₅、LI₉、LI₁₅、LI₂₂、LI₂₇、LI₃₁、LI₃₃、LI₄₂、LI₄₅、LI₅₂、LI₆₉、LI₇₈、LI₈₆}中，之后，算法A6会对符合条件的接口数据I₃，I₁₁，I₃₂，……,I₁₉₈₇对应的响应参数及其值RZ₃，RZ₁₁,RZ₃₂，……,RZ₁₉₈₇中的响应参数与敏感字段集RVR{“username”,”idcard”,”phone”,”address”,”email”}进行匹配，将存在于敏感字段集RVR中的响应参数及其值重新整合为RMZ₃,RMZ₁₁,RMZ₃₂,……,RMZ₁₉₈₇，最后，算法A6将I₃，I₁₁，I₃₂，……,I₁₉₈₇、C₃，C₁₁，C₃₂，……,C₁₉₈₇、RZ₃，RZ₁₁,RZ₃₂，……,RZ₁₉₈₇整合为敏感接口身份集CIR{CIR₁{I₃,C₃,RMZ₃},CIR₂{I₁₁,C₁₁,RMZ₁₁},CIR₃{I₃₂,C₃₂,RMZ₃₂},……,CIR₁₈₀₀{I₁₉₈₇,C₁₉₈₇,RMZ₁₉₈₇}}。

步骤S8中，通过算法A7将WZ{LI,TC,F,LZ,PL,RC}中的接口数据集LI{LI₁,LI₂,LI₃,……,LI₁₀₀}与敏感接口集MI{ LI₁、LI₅、LI₉、LI₁₅、LI₂₂、LI₂₇、LI₃₁、LI₃₃、LI₄₂、LI₄₅、LI₅₂、LI₆₉、LI₇₈、LI₈₆}中的数据进行匹配，将敏感接口集MI中敏感接口对应的请求时段，请求频率进行整合，在本实施例中，经匹配整合后得到数据集ZJY{ZJY₁{LI₁,F₁,PL₁},ZJY₂{LI₅,F₅,PL₅},……,ZJY₁₄{LI₈₆,F₈₆,PL₈₆}}，之后，算法将ZJY{ZJY₁{LI₁,F₁,PL₁},ZJY₂{LI₅,F₅,PL₅},……,ZJY₁₄{LI₈₆,F₈₆,PL₈₆}}与CIR{CIR₁{I₃,C₃,RMZ₃},CIR₂{I₁₁,C₁₁,RMZ₁₁},CIR₃{I₃₂,C₃₂,RMZ₃₂},……,CIR₁₈₀₀{I₁₉₈₇,C₁₉₈₇,RMZ₁₉₈₇}}进行匹配，将ZJY中的数据中的接口集与其CIR中的数据中的接口集相同的数据进行整合，经整合后得到ZJZ{ZJZ₁{LI₁,F₁,PL₁,CIR₁{I₃,C₃,RMZ₃}},ZJZ₂{LI₁,F₁,PL₁,CIR₂{I₁₁,C₁₁,RMZ₁₁}},……,ZJZ₁₈₀₀{LI₈₆,F₈₆,PL₈₆,CIR₁₈₀₀{I₁₉₈₇,C₁₉₈₇,RMZ₁₉₈₇}}}，之后，算法A7对ZJZ中的数据中的敏感接口身份进行md5计算，经计算后得到身份敏感接口指纹集ZJF{ZJF₁{LI₁,F₁,PL₁,CIR(md5)₁},ZJF₂{LI₁,F₁,PL₁,CIR(md5)₂},……,ZJF₁₈₀₀{LI₈₆,F₈₆,PL₈₆,CIR(md5)₁₈₀₀}}。

通过算法A8对接口是否存在敏感数据泄露进行检测。在本实施例中，在15:04收集到与H1通信的请求数据包G_detection，G_detection对应的请求时间点T_G(detection)为T_G(detection){15:04}，提取被检测请求数据包G_detection的请求接口I_detection，认证身份C_detection，拦截并提取G_detection对应的响应数据包R_detection中的响应参数及其值RKV_detection{“username”:”test”,”idcard”:”xxxxxx19951122xxxx”,”phone”:”xxxx7182xxxx”,”size”:10,”page”:1}，收集请求时间点T_{G(detection){}15:04}的请求时段F_detection{15}，15:04至15:03认证身份C_detection请求接口I_detection的次数count_detection经收集后得到count_detection=1，在本实施例中，Idetection位于身份敏感接口指纹集ZJF中的254个身份敏感接口指纹中ZJF1{LI₁,F₁,PL₁,CIR(md5)₁},ZJF₂{LI₁,F₁,PL₁,CIR(md5)₂},……,ZJF₇₉₈{LI₁,F₁,PL₁,CIR(md5)₇₉₈}中，F_{detection{15}}位于F1中，PL1中15时段的访问频率为200，故15时段每分钟的访问平均频率为200/60≈3.33，count_detection<3.33，提取RKVdetection中的敏感参数字段及其值整合为MKV_detection{username”:”test”,”idcard”:”430721199511227329”,”phone”:”18271829101”}，将I_detection、C_detection、MKV_detection整合为CIRdetection{Idetection,Cdetection,MKVdetection}，并将CIR_detection进行md5计算得到CIR(md5)detection，在本实施例中CIR(md5)_detection=CIR(md5)₇₉₈，故该次请求不存在接口敏感数据泄露，令A8(G_detection,ZJF)=1；

将通过算法A9对接口敏感数据泄露行为进行防御。在本实施例中，A8(G_detection,ZJF)=1，该次请求不存在接口敏感数据泄露，将该次请求数据包G_detection对应的响应数据包R_detection响应G_detection请求包。

上述的接口敏感数据泄露检测防御方法，通过对接口进行业务接口判断，对业务接口进行敏感字段识别，通过敏感字段判断敏感接口，最后获取身份敏感接口指纹，通过敏感接口指纹判断接口请求是否存在敏感数据泄露行为，当接口请求存在敏感数据泄露行为时，防御敏感数据泄露行为，实现有效识别与防御多变的接口敏感数据泄露检测行为。

图3是本发明实施例提供的一种接口敏感数据泄露检测防御装置300的示意性框图。如图3所示，对应于以上接口敏感数据泄露检测防御方法，本发明还提供一种接口敏感数据泄露检测防御装置300。该接口敏感数据泄露检测防御装置300包括用于执行上述接口敏感数据泄露检测防御方法的单元，该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地，请参阅图3，该接口敏感数据泄露检测防御装置300包括采集单元301、提取单元302、统计单元303、业务接口确定单元304、敏感字段识别单元305、敏感接口集获取单元306、身份集获取单元307、指纹集获取单元308、数据包收集单元309、判断单元310及防御单元311。

采集单元301，用于采集接口流量数据；提取单元302，用于对所述接口流量数据提取请求数据以及响应数据，以得到提取结果；统计单元303，用于根据所述提取结果统计同一接口的相关信息，以得到统计结果；业务接口确定单元304，用于确定所述统计结果中属于业务接口的接口，以得到业务接口数据集；敏感字段识别单元305，用于对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集；敏感接口集获取单元306，用于通过所述敏感字段集以及所述统计结果获取敏感接口集；身份集获取单元307，用于根据所述敏感接口集以及所述提取结果获取所述敏感接口集的敏感接口身份集；指纹集获取单元308，用于根据所述统计结果、所述敏感接口集以及所述敏感接口身份集获取身份敏感接口指纹集；数据包收集单元309，用于实时收集请求对应的通信数据包并提取相关信息；判断单元310，用于根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为；防御单元311，用于若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。

在一实施例中，所述统计单元303包括：

信息集整合子单元，用于对所述提取结果提取认证信息，并去重整合为认证信息集；移除子单元，用于移除所述提取结果中每个数据的认证信息，以得到三元组；三元组整合子单元，用于整合同一接口的三元组，以得到整合结果；选择子单元，用于从整合结果中分别从各个同一接口的三元组中任意选择一个三元组中的接口数据组成接口数据集；第一统计子单元，用于统计访问时段；第二统计子单元，用于统计被访问次数；第三统计子单元，用于统计被访问频率；第四统计子单元，用于统计不同响应数据次数；内容整合子单元，用于整合所述接口数据集、认证信息集、访问时段、被访问次数、被访问频率以及不同响应数据次数，以得到统计结果。

在一实施例中，所述业务接口确定单元304包括：

定义子单元，用于定义业务时段集；交集计算子单元，用于计算业务时段集与所述统计结果内的访问时段数据集中的访问时段的交集，以得到交集结果；求和子单元，用于对满足要求的所述交集结果中的访问时段对应的被访问频率对应的值进行求和，以得到求和结果；统计整合子单元，用于根据所述求和结果与满足要求的所述交集结果中的访问时段对应的被访问频率对应的值求商，当商大于设定比值，则确定对应接口为业务接口，并将对应的被访问次数、访问时段、被访问频率以及各个响应字段的不同响应数据次数构成业务接口对应的数据集，统计所有业务接口对应的数据集，以得到业务接口数据集。

在一实施例中，所述敏感字段识别单元305包括：

遍历子单元，用于遍历所述业务接口数据集中业务接口对应的各个响应字段的不同响应数据次数；数据整合子单元，用于将响应字段的不同响应数据次数对应的值不小于认证信息集长度所对应的响应字段整合为第一数据集；字段集确定子单元，用于当第一数据集内的元素是一个时，将所述第一数据集内键整合为敏感字段集；若第一数据集内的元素有多个时，计算第一数据集内的元素的交集，以将所有交集中对应的键组成敏感字段集。

在一实施例中，所述敏感接口集获取单元306，用于将所述统计结果中的响应字段存在于敏感字段集所对应的接口确定为敏感接口，整合所有敏感接口，以形成敏感接口集。

在一实施例中，所述数据包收集单元309，用于实时收集请求对应的通信数据包，从所述通信数据包内提取被检测请求数据包的请求接口以及认证身份，拦截并提取被检测请求数据包对应的响应数据包中的响应参数及其值，提取请求时间点的请求时段，收集请求时段至一分钟之前认证身份请求接口的请求频率，以形成相关信息。

在一实施例中，所述判断单元310包括：

第一判断子单元，用于判断所述相关信息内的请求接口是否存在于身份敏感指纹集内；

确定子单元，用于若所述相关信息内的请求接口不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

第二判断子单元，用于若所述相关信息内的请求接口存在于身份敏感指纹集内，则判断所述相关信息内的请求时段是否存在于身份敏感指纹集内；若所述相关信息内的请求时段不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；

第三判断子单元，用于若所述相关信息内的请求时段存在于身份敏感指纹集内，则判断所述请求频率是否异常；若所述请求频率异常，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；数据提取子单元，用于若所述请求频率不异常，则提取所述被检测请求数据包对应的响应数据包中的响应参数及其值中的敏感参数字段及值，以得到敏感参数数据；第一计算子单元，用于整合所述敏感参数数据、所述请求接口以及认证身份，并对认证身份进行md5计算，以得到第一计算结果；第四判断子单元，用于判断所述第一计算结果是否存在于身份敏感接口指纹集中；若所述第一计算结果存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求不存在敏感数据泄露行为；若所述第一计算结果不存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求存在敏感数据泄露行为。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述接口敏感数据泄露检测防御装置300和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述接口敏感数据泄露检测防御装置300可以实现为一种计算机程序的形式，该计算机程序可以在如图4所示的计算机设备上运行。

请参阅图4，图4是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器，其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图4，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令，该程序指令被执行时，可使得处理器502执行一种接口敏感数据泄露检测防御方法。

该处理器502用于提供计算和控制能力，以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种接口敏感数据泄露检测防御方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下步骤：

采集接口流量数据；对所述接口流量数据提取请求数据以及响应数据，以得到提取结果；根据所述提取结果统计同一接口的相关信息，以得到统计结果；确定所述统计结果中属于业务接口的接口，以得到业务接口数据集；对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集；通过所述敏感字段集以及所述统计结果获取敏感接口集；根据所述敏感接口集以及所述提取结果获取所述敏感接口集的敏感接口身份集；根据所述统计结果、所述敏感接口集以及所述敏感接口身份集获取身份敏感接口指纹集；实时收集请求对应的通信数据包并提取相关信息；根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为；若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理。

其中，所述接口流量数据包括HTTP请求数据包、对应的响应数据包以及请求数据包对应的时间点；所述提取结果包括各个请求数据包中的请求接口、认证信息、各个响应数据包内的响应字段，所述响应字段包括响应参数及其值。

在一实施例中，处理器502在实现所述根据所述提取结果统计同一接口的相关信息，以得到统计结果步骤时，具体实现如下步骤：

对所述提取结果提取认证信息，并去重整合为认证信息集；移除所述提取结果中每个数据的认证信息，以得到三元组；整合同一接口的三元组，以得到整合结果；从整合结果中分别从各个同一接口的三元组中任意选择一个三元组中的接口数据组成接口数据集；统计访问时段；统计被访问次数；统计被访问频率；统计不同响应数据次数；整合所述接口数据集、认证信息集、访问时段、被访问次数、被访问频率以及不同响应数据次数，以得到统计结果。

在一实施例中，处理器502在实现所述确定所述统计结果中属于业务接口的接口，以得到业务接口数据集步骤时，具体实现如下步骤：

定义业务时段集；计算业务时段集与所述统计结果内的访问时段数据集中的访问时段的交集，以得到交集结果；对满足要求的所述交集结果中的访问时段对应的被访问频率对应的值进行求和，以得到求和结果；根据所述求和结果与满足要求的所述交集结果中的访问时段对应的被访问频率对应的值求商，当商大于设定比值，则确定对应接口为业务接口，并将对应的被访问次数、访问时段、被访问频率以及各个响应字段的不同响应数据次数构成业务接口对应的数据集，统计所有业务接口对应的数据集，以得到业务接口数据集。

在一实施例中，处理器502在实现所述对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集步骤时，具体实现如下步骤：

遍历所述业务接口数据集中业务接口对应的各个响应字段的不同响应数据次数；将响应字段的不同响应数据次数对应的值不小于认证信息集长度所对应的响应字段整合为第一数据集；当第一数据集内的元素是一个时，将所述第一数据集内键整合为敏感字段集；若第一数据集内的元素有多个时，计算第一数据集内的元素的交集，以将所有交集中对应的键组成敏感字段集。

在一实施例中，处理器502在实现所述通过所述敏感字段集以及所述统计结果获取敏感接口集步骤时，具体实现如下步骤：

在一实施例中，处理器502在实现所述实时收集请求对应的通信数据包并提取相关信息步骤时，具体实现如下步骤：

在一实施例中，处理器502在实现所述根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为步骤时，具体实现如下步骤：

判断所述相关信息内的请求接口是否存在于身份敏感指纹集内；若所述相关信息内的请求接口不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；若所述相关信息内的请求接口存在于身份敏感指纹集内，则判断所述相关信息内的请求时段是否存在于身份敏感指纹集内；若所述相关信息内的请求时段不存在于身份敏感指纹集内，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；若所述相关信息内的请求时段存在于身份敏感指纹集内，则判断所述请求频率是否异常；若所述请求频率异常，则确定所述通信数据包所对应的请求存在敏感数据泄露行为；若所述请求频率不异常，则提取所述被检测请求数据包对应的响应数据包中的响应参数及其值中的敏感参数字段及值，以得到敏感参数数据；整合所述敏感参数数据、所述请求接口以及认证身份，并对认证身份进行md5计算，以得到第一计算结果；判断所述第一计算结果是否存在于身份敏感接口指纹集中；若所述第一计算结果存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求不存在敏感数据泄露行为；若所述第一计算结果不存在于身份敏感接口指纹集中，则确定所述通信数据包所对应的请求存在敏感数据泄露行为。

应当理解，在本申请实施例中，处理器502可以是中央处理单元 (CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路 (Application Specific IntegratedCircuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中该计算机程序被处理器执行时使处理器执行如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述根据所述提取结果统计同一接口的相关信息，以得到统计结果步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述确定所述统计结果中属于业务接口的接口，以得到业务接口数据集步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集步骤时，具体实现如下步骤：

遍历所述业务接口数据集中业务接口对应的各个响应字段的不同响应数据次数；将响应字段的不同响应数据次数响应字段对应的值不小于认证信息集长度所对应的响应字段整合为第一数据集；当第一数据集内的元素是一个时，将所述第一数据集内键整合为敏感字段集；若第一数据集内的元素有多个时，计算第一数据集内的元素的交集，以将所有交集中对应的键组成敏感字段集。

在一实施例中，所述处理器在执行所述计算机程序而实现所述通过所述敏感字段集以及所述统计结果获取敏感接口集步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述实时收集请求对应的通信数据包并提取相关信息步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为步骤时，具体实现如下步骤：

所述存储介质可以是U盘、移动硬盘、只读存储器（Read-Only Memory，ROM）、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.接口敏感数据泄露检测防御方法，其特征在于，包括：

采集接口流量数据；

通过所述敏感字段集以及所述统计结果获取敏感接口集；

实时收集请求对应的通信数据包并提取相关信息；

若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理；

其中，所述根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为，包括：

若所述相关信息内的请求时段存在于身份敏感指纹集内，则判断请求频率是否异常；

若所述请求频率不异常，则提取被检测请求数据包对应的响应数据包中的响应参数及其值中的敏感参数字段及值，以得到敏感参数数据；

判断所述第一计算结果是否存在于身份敏感接口指纹集中；

2.根据权利要求1所述的接口敏感数据泄露检测防御方法，其特征在于，所述接口流量数据包括HTTP请求数据包、对应的响应数据包以及请求数据包对应的时间点；所述提取结果包括各个请求数据包中的请求接口、认证信息、各个响应数据包内的响应字段，所述响应字段包括响应参数及其值。

3.根据权利要求2所述的接口敏感数据泄露检测防御方法，其特征在于，所述根据所述提取结果统计同一接口的相关信息，以得到统计结果，包括：

对所述提取结果提取认证信息，并去重整合为认证信息集；

移除所述提取结果中每个数据的认证信息，以得到三元组；

整合同一接口的三元组，以得到整合结果；

统计访问时段；

统计被访问次数；

统计被访问频率；

统计不同响应数据次数；

4.根据权利要求3所述的接口敏感数据泄露检测防御方法，其特征在于，所述确定所述统计结果中属于业务接口的接口，以得到业务接口数据集，包括：

定义业务时段集；

5.根据权利要求4所述的接口敏感数据泄露检测防御方法，其特征在于，所述对所述业务接口数据集中业务接口对应的响应字段进行敏感字段的识别，以得到敏感字段集，包括：

6.根据权利要求5所述的接口敏感数据泄露检测防御方法，其特征在于，所述通过所述敏感字段集以及所述统计结果获取敏感接口集，包括：

7.根据权利要求6所述的接口敏感数据泄露检测防御方法，其特征在于，所述实时收集请求对应的通信数据包并提取相关信息，包括：

8.接口敏感数据泄露检测防御装置，其特征在于，包括：

采集单元，用于采集接口流量数据；

防御单元，用于若所述通信数据包所对应的请求存在敏感数据泄露行为，则对存在敏感数据泄露的请求进行防御处理；

其中，其中，所述根据所述相关信息、敏感接口身份集以及身份敏感接口指纹集以判断所述通信数据包所对应的请求是否存在敏感数据泄露行为，包括：

判断所述第一计算结果是否存在于身份敏感接口指纹集中；

9.一种计算机设备，其特征在于，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。