CN116248413A

CN116248413A - 一种webshell文件的流量检测方法、设备及介质

Info

Publication number: CN116248413A
Application number: CN202310511415.4A
Authority: CN
Inventors: 李峰; 杨家林; 顾丽旺; 刘鹏
Original assignee: Shandong Yuntian Safety Technology Co ltd
Current assignee: Shandong Yuntian Safety Technology Co ltd
Priority date: 2023-05-09
Filing date: 2023-05-09
Publication date: 2023-06-09
Anticipated expiration: 2043-05-09
Also published as: CN116248413B

Abstract

本发明提供了一种webshell文件的流量检测方法、设备及介质，涉及文件检测技术领域，该方法包括：获取待检测访问流量数据，得到待检测访问流量数据集Q；获取历史访问流量数据的来源IP地址的数量G；若G≤G₀，则获取Q_j的来源IP地址M_j在U的来源IP地址中所占的比例P_1j；确定目标来源IP地址集R；获取R_z在U的来源IP地址中所占的比例P_2z；将P_1j与P_2z进行匹配度比较，得到匹配度值H_jz；若H_jz≥H₀，则将Q_j确定为正常访问流量数据。本发明通过对待检测访问流量数据的来源IP地址的数据信息进行处理，确定待检测访问流量数据是否为异常访问流量数据，简化了数据处理的过程，进一步降低了算力要求。

Description

一种webshell文件的流量检测方法、设备及介质

技术领域

本发明涉及文件检测领域，特别是涉及一种webshell文件的流量检测方法、设备及介质。

背景技术

webshell就是以asp、php、jsp或者cgi等网页文件形式存在的一种命令执行环境，也可以将其称做为一种网页后门。攻击者在入侵了一个网站后，通常会将asp或php后门文件与网站服务器WEB目录下正常的网页文件混在一起，然后就可以使用浏览器来访问asp或者php后门，得到一个命令执行环境，以达到控制网站服务器的目的。所以，就需要时常对webshell文件进行木马检测，来保证webshell文件的健康运行。

目前的webshell文件的木马检测方法是通过构建检测模型来实现的，通过静态特征检测和动态特征检测对其进行木马检测，但目前的静态特征检测和动态特征检测都是基于检测模型的搭建而实现的，需要用到的工具较为复杂，且如果webshell文件中包含有加密数据，在进行木马检测时，需要先对其进行解密，再进行木马检测验证其是否存在异常，此种特征检测的方式较为繁琐，且需要的算力较大。

发明内容

针对上述技术问题，本发明采用的技术方案为：

根据本申请的一个方面，提供一种webshell文件的流量检测方法，所述方法包括如下步骤：

S100、响应于待检测webshell文件发生了数据更新，获取待检测webshell文件在发生数据更新后的m个待检测访问流量数据，得到待检测访问流量数据集Q=(Q₁,Q₂……Q_j……Q_m)；其中，j=1,2……m；Q_j为待检测webshell文件在发生数据更新后的第j个待检测访问流量数据；待检测webshell文件为存储有可访问网址的webshell文件；

S200、若Q_j中包含加密数据，且待检测webshell文件在发生数据更新前存在包含有加密数据的历史访问流量数据，则执行步骤S300；

S300、获取待检测webshell文件在发生数据更新前包含有加密数据的n个历史访问流量数据，得到历史加密流量数据集U=(U₁,U₂……U_i……U_n)；其中，i=1,2……n；U_i为待检测webshell文件在发生数据更新前第i个包含有加密数据的历史访问流量数据；

S400、获取待检测webshell文件在距离当前时间t₁内的所有历史访问流量数据对应的来源IP地址的数量G；其中，t₁为预设的IP获取时间；

S500、若G≤G₀，则执行步骤S600；其中，G₀为预设的来源IP地址的数量阈值；

S600、获取Q_j对应的来源IP地址M_j在U的来源IP地址中所占的比例P_1j；

S700、在U对应的所有来源IP地址中，确定出k个目标来源IP地址，得到目标来源IP地址集R=(R₁,R₂……R_z……R_k)；其中，z=1,2……k；R_z为第z个目标来源IP地址；且任意两个目标来源IP地址相互不同；

S800、获取R_z在U的来源IP地址中所占的比例P_2z；

S900、将P_1j与P_2z进行匹配度比较，得到对应的匹配度值H_jz；若H_jz≥H₀，则将Q_j确定为正常访问流量数据；其中，H₀为预设的匹配度阈值。

在本申请的一种示例性实施例中，步骤S500还包括：

S501、若G＞G₀，则将P_1j确定为1，并执行步骤S700。

在本申请的一种示例性实施例中，所述webshell文件的流量检测方法应用于流量检测系统，流量检测系统连接有来源IP地址存储库，来源IP地址存储库用于存储待检测webshell文件的访问流量数据对应的来源IP地址；

所述来源IP地址存储库的数据存储方法为：

S110、获取距离当前时间最近的访问待检测webshell文件的G₁个历史来源IP地址，并将其存储在来源IP地址存储库中；且任意两个历史来源IP地址相互不同；

S120、当待检测webshell文件被访问时，获取对应的访问来源IP地址；

S130、若访问来源IP地址存在于来源IP地址存储库中，则执行步骤S140；否则，执行步骤S150；

S140、将存在于来源IP地址存储库中与访问来源IP地址相同的历史来源IP地址的访问次数加一；

S150、将来源IP地址存储库中访问待检测webshell文件的次数最少的历史来源IP地址删除，并将访问来源IP地址存储至来源IP地址存储库中。

在本申请的一种示例性实施例中，将步骤S600替换为：

S610、获取Q_j对应的来源IP地址M_j对应的数据信息Y_j=(P_1j,L_1j)；L_1j=(L_11j,L_12j……L_1wj……L_1sj)；其中，w=1,2……s；s为M_j在t₀内接收的上行数据包的数量；P_1j为M_j在U的来源IP地址中所占的比例；L_1j为M_j在t₀内接收的上行加密数据列表；L_1wj为M_j在t₀内接收的第w个上行数据包中的加密数据长度；t₀为预设的时间阈值；

将步骤S800替换为：

S810、获取R_z对应的数据信息T_z=(P_2z,F_1z)；F_1z=(F_11z,F_12z……F_1dz……F_1gz)；其中，d=1,2……g；g为R_z在t₀内接收的上行数据包的数量；P_2z为R_z在U的来源IP地址中所占的比例；F_1z为R_z在t₀内接收的上行加密数据列表；F_1dz为R_z在t₀内接收的第d个上行数据包中的加密数据长度；

将步骤S900替换为：

S910、将Y_j与T_z进行匹配度比较，得到对应的匹配度值H_jz；若H_jz≥H₀，则将Q_j确定为正常访问流量数据。

在本申请的一种示例性实施例中，将步骤S600替换为：

S620、获取Q_j对应的来源IP地址M_j对应的数据信息Y_j=(P_1j,L_1j,L_2j)；L_1j=(L_11j,L_12j……L_1wj……L_1sj)；L_2j=(L_21j,L_22j……L_2xj……L_2vj)；其中，x=1,2……v；v为M_j在t₀内发送的下行数据包的数量；L_2j为M_j在t₀内发送的下行加密数据列表；L_2xj为M_j在t₀内发送的第x个下行数据包中的加密数据长度；

将步骤S800替换为：

S820、获取R_z对应的数据信息T_z=(P_2z,F_1z,F_2z)；F_1z=(F_11z,F_12z……F_1dz……F_1gz)；F_2z=(F_21z,F_22z……F_2cz……F_2hz)；其中，c=1,2……h；h为R_z在t₀内发送的下行数据包的数量；F_2z为R_z在t₀内发送的下行加密数据列表；F_2cz为R_z在t₀内发送的第c个下行数据包中的加密数据长度；

将步骤S900替换为：

S920、将Y_j与T_z进行匹配度比较，得到对应的匹配度值H_jz；若H_jz≥H₀，则将Q_j确定为正常访问流量数据。

在本申请的一种示例性实施例中，步骤S920还包括：

S921、将Y_j与T₁,T₂……T_z……T_k依次进行匹配度比较，若H_jz≥H₀，则将Q_j确定为正常访问流量数据；否则，则继续比较H_j(z+1)与H₀，直至H_jk与H₀的比较完成，若H_jk＜H₀，则将Q_j确定为异常访问流量数据。

在本申请的一种示例性实施例中，步骤S200还包括：

S210、若Q_j中包含加密数据，且待检测webshell文件在发生数据更新前不存在包含有加密数据的历史访问流量数据，则将Q_j确定为异常访问流量数据。

在本申请的一种示例性实施例中，待检测webshell文件存储在目标webshell文件夹中，若目标webshell文件夹中存在新增的webshell文件，则将其确定为待检测webshell文件。

根据本申请的一个方面，提供一种非瞬时性计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现所述webshell文件的流量检测方法。

根据本申请的一个方面，提供一种电子设备，包括处理器和所述的非瞬时性计算机可读存储介质。

本发明至少具有以下有益效果：

本发明以待检测webshell文件的数据更新的时间为数据处理节点，获取待检测webshell文件在发生数据更新后的待检测访问流量数据，若其中包含加密数据，且待检测webshell文件在发生数据更新前存在包含有加密数据的历史访问流量数据，则获取包含有加密数据的历史访问流量数据，通过来源IP地址阈值来确定待检测webshell文件的来源IP地址所占的比例，并将待检测访问流量数据的来源IP地址的所占比例和包含有加密数据的历史访问流量数据的来源IP地址所占比例进行匹配度比较，得到相应的匹配度值，若其小于预设的匹配度阈值，则将待检测访问流量数据确定为异常访问流量数据。通过对待检测访问流量数据的来源IP地址的数据信息进行处理，确定待检测访问流量数据是否为异常访问流量数据，继而实现对待检测webshell文件的检测，与现有的静态特征检测和动态特征检测相比，简化了数据处理的过程，进一步降低了算力要求。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的webshell文件的流量检测方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

webshell文件为一种用于网络和服务器管理的可访问的文件，在网络安全中，攻击者会通过在webshell文件中植入木马代码，来实现对其访问网站的数据窃取的目的，如在webshell文件中植入一句话木马，所以，就需要时常对webshell文件进行木马检测，来保证webshell文件的健康运行，目前的webshell文件的木马检测方法是通过构建检测模型而实现的，攻击者通过浏览器以HTTP协议访问Web Server上的一个CGI文件。但由于webshell就是一个合法的TCP连接，在TCP/IP的应用层之下几乎没有任何特征，只有在应用层进行检测。攻击者入侵服务器，使用webshell时，无论是传文件还是改文件，必然有一个文件会包含webshell代码，所以这时采用静态特征检测；另外，在webshell运行后，B/S数据通过HTTP交互，HTTP请求/响应中可以找到相应的动作记录，所以也可以采用动态特征检测。

但目前的静态特征检测和动态特征检测都是基于检测模型的搭建而实现的，需要用到的工具较为复杂，且如果webshell文件中包含有加密数据，在进行木马检测时，需要先对其进行解密，再进行木马检测验证其是否存在异常，此种特征检测的方式较为繁琐，且需要的算力较大，所以，为了弥补现有的webshell文件木马检测方法中存在的问题，就需提出一种检测流程更为简便且所需算力较小的webshell文件检测方法。

一种webshell文件的流量检测方法，如图1所示，包括如下步骤：

S100、响应于待检测webshell文件发生了数据更新，获取待检测webshell文件在发生数据更新后的m个待检测访问流量数据，得到待检测访问流量数据集Q=(Q₁,Q₂……Q_j……Q_m)；其中，j=1,2……m；Q_j为待检测webshell文件在发生数据更新后的第j个待检测访问流量数据；

待检测webshell文件为存储有可访问网址的webshell文件，待检测webshell文件存储在目标webshell文件夹中，目标webshell文件夹为存储有目标webshell文件的文件夹，目标webshell文件为正常的webshell文件，由于攻击者在对webshell文件植入木马时，需要对webshell文件进行数据更改，所以，当目标webshell文件发生了数据更新，即数据更改时，就认为其有被植入木马的可能，则将其确定为待检测webshell文件，此外，若目标webshell文件夹中存在新增的webshell文件，由于其为新增的文件，不能确定其安全性，所以也将其确定为待检测webshell文件，即实时监控目标webshell文件夹中的所有目标webshell文件，只要其发生了数据更新，或在目标webshell文件夹中新增了一个webshell文件，就将发生了数据更新的目标webshell文件和新增的webshell文件确定为待检测webshell文件。

在确定了待检测webshell文件后，通过待检测webshell文件的访问流量数据对其进行木马检测，所以，以待检测webshell文件的数据更新为时间节点，认为发生数据更新前的待检测webshell文件为正常的不带有木马的文件，就只需要对发生了数据更新后的访问流量进行验证，但由于无法确定待检测webshell文件在发生数据更新后的哪个访问流量为正常流量数据，所以获取待检测webshell文件发生数据更新后的所有访问流量数据，并将其全部确定为待检测访问流量数据。

S210、若Q_j中包含加密数据，且待检测webshell文件在发生数据更新前不存在包含有加密数据的历史访问流量数据，则将Q_j确定为异常访问流量数据；

先判断Q_j中是否包含加密数据，若其不包含加密数据，则认为其携带木马的可能性较小，可以通过现有的检测模型或检测方法对待检测webshell文件进行木马检测，若Q_j中包含加密数据，则认为其携带木马的可能性较大，再对待检测webshell文件在发生数据更新前的历史访问流量数据进行检测，看历史访问流量数据中是否包含有加密数据，若其中有包含加密数据的历史访问流量数据，则继续执行步骤S300，若所有的历史访问流量数据中都不包含加密数据，而Q_j中却包含有加密数据，则认为其携带木马的可能性非常大，此时，直接将Q_j确定为异常访问流量数据，无需执行以下步骤，确定异常访问流量数据后，可以将其进行记录，也可进行警告，以通知网络维护人员，网络维护人员再对异常访问流量数据进行木马检测，若其属于误报，则将其从异常访问流量数据的列表中移出，转入正常访问流量数据列表中，若其确实为携带木马的流量数据，则对其进行溯源，找到对应的来源IP，并将此来源IP拉进黑名单，并对待检测webshell文件进行查杀。

在确定Q_j和历史访问流量数据中都包含有加密数据时，为了验证Q_j和历史访问流量的相似性，提高检测精度，就需要将Q_j与包含了加密数据的历史访问流量数据进行比较，所以，获取待检测webshell文件在发生数据更新前包含有加密数据的所有历史访问流量数据。

S501、若G＞G₀，则将P_1j确定为1，并执行步骤S700；

Q_j为待检测访问流量数据，其对应的来源IP地址为M_j，获取M_j对应的数据信息P_1j，P_1j为M_j在所有包含加密数据的历史访问流量数据的来源IP地址中所占的比例，如M_j为111.33.205.178，从所有包含加密数据的历史访问流量数据的来源IP地址中找出与此来源IP地址相同的数量，再与所有包含加密数据的历史访问流量数据的来源IP地址的数量做比值，将其确定为P_1j。

步骤S400-步骤S600为P_1j的确定方法，P_1j由两种判断方法进行确定，设置一个来源IP地址的数量阈值，获取待检测webshell文件在一段时间内的所有历史访问流量数据对应的来源IP地址的数量，将其与预设的来源IP地址的数量阈值进行比较，若小于或等于预设的数量阈值，则表示待检测webshell文件中的可访问网址为内网或设置有访问权限的网站，此时，可以通过计算M_j在U的来源IP地址中所占的比例来确定为P_1j，并通过来源IP地址作为匹配度比较的一个比较因素，若待检测webshell文件在一段时间内的所有历史访问流量数据对应的来源IP地址的数量大于预设的数量阈值，则表示待检测webshell文件中的可访问网址为外网或没有访问权限的公共网，由于公共都可以进行访问，所以，在一段时间内的待检测webshell文件的访问流量会很多，且访问的来源IP也会很多，此时，再用M_j在U的来源IP地址中所占的比例作为P_1j已经没有意义，就直接将其确定为1,或固定字符，表示在后续的匹配度比较中不考虑来源IP地址这一比较因素，可以只比较其他因素，如上行数据包和下行数据包中的加密数据长度，通过此确定方法，也缩短了数据处理的流程，精简了算法。

由于要通过对来源IP的数据信息对待检测webshell文件进行检测，所以，就需要对所有包含加密数据的历史访问流量数据的来源IP地址做统计，得到每个来源IP地址的重复次数，将属于同一个来源IP地址的确定为目标来源IP地址。

S800、获取R_z在U的来源IP地址中所占的比例P_2z；

与M_j相同，获取R_z对应的数据信息P_2z，P_2z为R_z在所有包含加密数据的历史访问流量数据的来源IP地址中所占的比例。

得到P_1j、P_2z后，将P_1j与P_2z进行匹配度比较，得到对应的匹配度值，再将得到的匹配度值与预设的匹配度阈值进行比较，若小于匹配度阈值，则表示M_j在历史访问流量数据中出现的次数较少，认为其存在侵入的风险，则将Q_j确定为异常访问流量数据，若大于或等于匹配度阈值，则表示M_j在历史访问流量数据中出现的次数较多，认为其为安全的IP地址，则将Q_j确定为正常访问流量数据，通过验证所有待检测访问流量数据的是否异常，来实现对待检测webshell文件的检测目的，即若其中一个待检测访问流量数据存在异常，则认为待检测webshell文件中存在木马，其数据更新为木马植入，则进行警告，通知网络维护人员对其进行木马检测，若所有的待检测访问流量数据都为正常，则认为待检测webshell文件也为正常文件，其数据更新为正常更新。

此外，webshell文件的流量检测方法应用于流量检测系统，流量检测系统连接有来源IP地址存储库，来源IP地址存储库用于存储待检测webshell文件的访问流量数据对应的来源IP地址；其中，来源IP地址存储库的数据存储方法为：

此为来源IP地址存储库的数据存储方法，可以有效保证了来源IP地址存储库中的存储的来源IP地址的数量，当有新的来源IP地址存储至来源IP地址存储库中时，会在来源IP地址存储库中进行查询，若在来源IP地址存储库中有对应的来源IP地址，则在对应的来源IP地址的访问次数记录加一，若在来源IP地址存储库中不存在对应的来源IP地址，则将来源IP地址存储库中访问次数最少的来源IP地址删除，将新的来源IP地址存储至来源IP地址存储库中，通过访问次数对来源IP地址存储库中的来源IP地址进行数据更新，保证来源IP地址存储库中的来源IP地址为最新数据或访问次数较多的数据，便于后续的匹配度比较。

进一步，步骤S900中只通过P_1j与P_2z进行匹配度比较，得到对应的匹配度值，只根据一个比较因素来进行匹配度比较，会存在结果误差，所以，就要在匹配度比较时增加新的比较因素，因此提出本申请的第二实施例，如下：

将步骤S600替换为：

将步骤S800替换为：

将步骤S900替换为：

本申请的第二实施例中，增加了L_1j、F_1z的比较因素，L_1j、F_1z分别为M_j在t₀内接收的上行加密数据列表和R_z在t₀内接收的上行加密数据列表，其中包含了对应的每个上行数据包中的加密数据的长度，进一步提高了匹配度比较的精确度。

进一步，在第二实施例的基础上，再增加新的比较因素，构成本申请的第三实施例，具体如下：

将步骤S600替换为：

将步骤S800替换为：

将步骤S900替换为：

本申请的第三实施例中，进一步增加了L_2j、F_2z的比较因素，L_2j、F_2z分别为M_j在t₀内发送的下行加密数据列表和R_z在t₀内发送的下行加密数据列表，其中包含了对应的每个下行数据包中的加密数据的长度，在第二实施例的基础上，又进一步提高了匹配度比较的精确度。

此外，步骤S920中，是将Y_j与每个目标来源IP地址的数据信息进行匹配度比较，得到所有的匹配度值后，再去对每一个匹配度值与匹配度阈值进行比较，继而确定出所有的待检测访问流量数据的安全性，此种比较方式过于繁杂，需要计算的步骤和数据较多，当待检测访问流量数据的数量过多时，需要计算的匹配度值和阈值比较的步骤也会随之增多，也加大了服务器的算力，所以，为了进一步简化数据处理步骤，提出步骤S920的又一实施例：

进一步，步骤S920还包括：

步骤S921为步骤S920的另一实施例，只需要将Y_j依次与每一目标来源IP地址的数据信息进行匹配度比较，得到一个匹配度值后，就与匹配度阈值进行比较，若其小于匹配度阈值，则将其确定为异常访问流量数据，无需再对其后的目标来源IP地址进行匹配度比较，直接退出检测方法，若其大于或等于匹配度阈值，则将其确定为正常访问流量数据，继续与下一个目标来源IP地址的数据信息进行匹配度比较，得到对应的匹配度值后，进行阈值比较，直至比较完所有的目标来源IP地址，即依次做匹配度比较和阈值比较，若发现其中一个为异常访问流量数据，则退出，否则，就继续做数据处理，此种方法简化了数据处理的过程，进一步降低了算力要求。

步骤S920和步骤S921中的匹配度比较方法采用现有的匹配度比较方法即可，匹配度比较即相似度比较，是看两者的相似程度，即先对两者的IP地址占比进行比较，得到一个匹配度，再对两者的上行数据包的加密数据长度进行匹配度比较，得到相应的匹配度，对两者的下行数据包的加密数据长度进行匹配度比较，得到相应的匹配度，再将得到的所有匹配度进行相加，得到最终的待检测访问流量数据的匹配度。

但在步骤S920和步骤S921中，对Y_j与T_z进行匹配度比较时，若Y_j的上行数据包的数量和T_z的上行数据包的数量不等时，对其两者进行匹配度比较时，会由于数量不等，而造成比较误差，如Y_j的上行数据包的数量为100个，T_z的上行数据包的数量为200个，在进行匹配度比较时，会存在100个数据包的差值，影响匹配度比较的结果，所以，为了解决在匹配度比较时存在的数据包不等的问题，提出进一步实施例：

在步骤S820之后，webshell文件的流量检测方法还包括：

S830、若s=g，则执行步骤S920；否则，执行步骤S831；

S831、若s＜E₀，则执行步骤S837；若s=E₀，则执行步骤S838；其中，E₀为预设的上行数据包的数量阈值；

S832、若s＞E₀，则将t₀均分为D个时间窗口；

S833、获取M_j在第一个时间窗口内接收的上行数据包的数量A_j；若A_j＜E₀，则执行步骤S834；否则，执行步骤S836；

S834、对M_j在第二个时间窗口至第D个时间窗口内接收的上行数据包进行线性差值处理，得到E₀-1个上行数据包；

S835、将L_11j,L_12j……L_1wj……L_1sj替换为A_j对应的上行数据包中的加密数据长度与E₀-1个上行数据包中的加密数据长度；并执行步骤S838；

S836、将L_11j,L_12j……L_1wj……L_1sj替换为M_j距离当前时间最近的E₀个上行数据包对应的加密数据长度；并执行步骤S838；

S837、在L_1sj之后增加E₀-s个空字符，以使L_1j中存在E₀个数据，并执行步骤S838；

S838、将F_11z,F_12z……F_1dz……F_1gz替换为R_z距离当前时间最近的E₀个上行数据包对应的加密数据长度；并执行步骤S920。

若Y_j的上行数据包的数量和T_z的上行数据包的数量不等，则设置一个上行数据包的数量阈值，将Y_j的上行数据包的数量与此阈值进行比较，若比阈值小，则在Y_j中补空字符或固定字符，表示填充的字符无数据，用以进行匹配度比较，若比阈值大，则将t₀均分为若干个时间窗口，再比较第一个时间窗口中的上行数据包的数量与阈值的大小，若小于阈值，则对第一个时间窗口之后的所有时间窗口中的上行数据包进行线性差值处理，即平均从此部分时间窗口中取出对应的上行数据包，使其与第一个时间窗口中的上行数据包之和等于预设的上行数据包的数量阈值，若第一个时间窗口中的上行数据包的数量大于阈值，则直接取距离当前时间最近的上行数据包，此种方法可以保证Y_j的上行数据包的获取精确度，减小后续的匹配度比较造成的误差。

相应的，Y_j与T_z进行匹配度比较时，Y_j的下行数据包的数量和T_z的下行数据包的数量不等时也会造成匹配度比较的误差，所以，就需要对Y_j与T_z的下行数据包进行数量对齐操作，具体如下：

步骤S820之后，webshell文件的流量检测方法还包括：

S840、若v=h，则执行步骤S920；否则，执行步骤S841；

S841、若v＜E₁，则执行步骤S847；若v=E₁，则执行步骤S848；其中，E₁为预设的下行数据包的数量阈值；

S842、若v＞E₁，则将t₀均分为D个时间窗口；

S843、获取M_j在第一个时间窗口内发送的下行数据包的数量B_j；若B_j＜E₁，则执行步骤S844；否则，执行步骤S846；

S844、对M_j在第二个时间窗口至第D个时间窗口内发送的下行数据包进行线性差值处理，得到E₁-1个下行数据包；

S845、将L_21j,L_22j……L_2xj……L_2vj替换为B_j对应的下行数据包中的加密数据长度与E₁-1个下行数据包中的加密数据长度；并执行步骤S848；

S846、将L_21j,L_22j……L_2xj……L_2vj替换为M_j距离当前时间最近的E₁个下行数据包对应的加密数据长度；并执行步骤S848；

S847、在L_2vj之后增加E₁-v个空字符，以使L_2vj中存在E₁个数据，并执行步骤S848；

S848、将F_21z,F_22z……F_2cz……F_2hz替换为R_z距离当前时间最近的E₁个下行数据包对应的加密数据长度；并执行步骤S920。

Y_j与T_z的下行数据包的数量对齐操作与上行数据包的原理和方法相同，故在此不再赘述。

本发明的实施例还提供了一种非瞬时性计算机可读存储介质，该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。

本发明的实施例还提供了一种电子设备，包括处理器和前述的非瞬时性计算机可读存储介质。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员还应理解，可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims

1.一种webshell文件的流量检测方法，其特征在于，所述方法包括如下步骤：

S100、响应于待检测webshell文件发生了数据更新，获取待检测webshell文件在发生数据更新后的m个待检测访问流量数据，得到待检测访问流量数据集Q=(Q₁,Q₂……Q_j……Q_m)；其中，j=1,2……m；Q_j为待检测webshell文件在发生数据更新后的第j个待检测访问流量数据；所述待检测webshell文件为存储有可访问网址的webshell文件；

S800、获取R_z在U的来源IP地址中所占的比例P_2z；

2.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，所述步骤S500还包括：

S501、若G＞G₀，则将P_1j确定为1，并执行步骤S700。

3.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，所述webshell文件的流量检测方法应用于流量检测系统，所述流量检测系统连接有来源IP地址存储库，所述来源IP地址存储库用于存储所述待检测webshell文件的访问流量数据对应的来源IP地址；

所述来源IP地址存储库的数据存储方法为：

S110、获取距离当前时间最近的访问所述待检测webshell文件的G₁个历史来源IP地址，并将其存储在所述来源IP地址存储库中；且任意两个历史来源IP地址相互不同；

S120、当所述待检测webshell文件被访问时，获取对应的访问来源IP地址；

S130、若所述访问来源IP地址存在于所述来源IP地址存储库中，则执行步骤S140；否则，执行步骤S150；

S140、将存在于所述来源IP地址存储库中与所述访问来源IP地址相同的历史来源IP地址的访问次数加一；

S150、将所述来源IP地址存储库中访问待检测webshell文件的次数最少的历史来源IP地址删除，并将所述访问来源IP地址存储至所述来源IP地址存储库中。

4.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，将所述步骤S600替换为：

将所述步骤S800替换为：

将所述步骤S900替换为：

5.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，将所述步骤S600替换为：

将所述步骤S800替换为：

将所述步骤S900替换为：

6.根据权利要求5所述的webshell文件的流量检测方法，其特征在于，所述步骤S920还包括：

7.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，所述步骤S200还包括：

8.根据权利要求1所述的webshell文件的流量检测方法，其特征在于，所述待检测webshell文件存储在目标webshell文件夹中，若目标webshell文件夹中存在新增的webshell文件，则将其确定为待检测webshell文件。

9.一种非瞬时性计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，其特征在于，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项的所述webshell文件的流量检测方法。

10.一种电子设备，其特征在于，包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。