CN116488938B

CN116488938B - 一种基于大数据行为分析的数据检测方法及系统

Info

Publication number: CN116488938B
Application number: CN202310687212.0A
Authority: CN
Inventors: 陈丽辉; 张德文; 周可彬; 文博; 张迪
Original assignee: Hunan Sanxiang Bank Co Ltd
Current assignee: Hunan Sanxiang Bank Co Ltd
Priority date: 2023-06-12
Filing date: 2023-06-12
Publication date: 2024-01-30
Anticipated expiration: 2043-06-12
Also published as: CN116488938A

Abstract

本发明涉及一种基于大数据行为分析的数据检测方法及系统，涉及数据安全技术领域，该方法包括数据获取模块获取终端的待接收数据；数据检测模块对所述待接收数据进行源检测和数据量检测；数据分析模块对经所述源检测和数据量检测的所述待接收数据确定分析方式；并根据复杂度差值确定对所述分析方式的优化方式；通过对终端待接收数据进行源检测和数据量检测，并根据上述检测结果确定对数据分析时的分析方式，保证了数据来源的安全可靠性，并通过对待接收数据进行编码复杂度分析，在对应编码复杂度处于不同水平对确定的分析方式进行优化以保证对待接收数据分析时的精确性，降低了用户数据被破坏的风险。

Description

一种基于大数据行为分析的数据检测方法及系统

技术领域

本发明涉及数据安全技术领域，尤其涉及一种基于大数据行为分析的数据检测方法及系统。

背景技术

自进入网络时代以来，计算机入侵事件就从未被完全杜绝，黑客恶意攻击是各个行业信息数据安全的关键威胁，而恶意攻击的表现形式非常之多，对于大型企业来说，由于其网络安全架构的建设较为完善，能够规避大多数网络入侵，但对于中小型企业，缺少这方面的资金和人员投入，很难及时感知入侵事件的发生，因此容易给企业造成不可挽回的损失。

现有的网络入侵检测系统已基本能够针对大多数常见的网络病毒进行处理和规避，但依然不能对渗透在数据中的网络入侵进行识别和处理。

中国专利公开号：CN114338221A公开了一种基于大数据分析的网络检测系统，包括网络接口、网络管理模块、检测模块、安防模块、分析模块、处理模块、预警模块和处理器，检测模块对网络接口和网络管理模块的状态进行检测，以获取网络通信信道的状态数据；安防模块用于对网络接口的传输数据进行过滤，以对网络通信的数据进行主动防护；分析模块基于用户访问端接收的数据，并对所述数据进行分析；处理模块用于对网络的异常进行处理，并将异常的数据向用户访问端进行提示；预警模块用于对网络传输信道的通断状态进行预警，以实现对网络状态的交互反馈提示。该发明通过分析单元对各个网络接口数据进行过滤，以实现对风险的主动防护；由此可见，所述基于大数据分析的网络检测系统存在以下问题：

对数据进行分析时，通过分析模块对网络管理模块所接收的安全状态数据和操作状态数据进行分析，并在安全状态数据和操作状态数据存在漏洞时触发安防模块对漏洞的处理；由于现如今网络入侵隐秘性较强，因此上述方法已不能满足对网络入侵的精准检测和分析，易给用户造成数据丢失和数据破坏的风险。

发明内容

为此，本发明提供一种基于大数据行为分析的数据检测方法及系统，用以克服现有技术中不能满足对网络入侵的精准检测和分析，易给用户造成数据丢失和数据破坏的风险的问题。

为实现上述目的，本发明一方面提供一种基于大数据行为分析的数据检测方法，包括：

步骤S1、数据获取模块获取终端的待接收数据；

步骤S2、数据检测模块对所述待接收数据进行源检测和数据量检测；

步骤S3、数据分析模块的分析方式确定单元对经所述源检测和数据量检测的所述待接收数据进行分析以确定对所述待接收数据分析时的分析方式；

步骤S4、所述数据分析模块的编码分析单元对所述待接收数据的编码复杂度进行分析，以确定编码复杂度所处复杂度水平；

步骤S5、所述编码分析单元在编码复杂度处于第二复杂度水平时，所述数据分析模块的分析方式优化单元根据复杂度差值确定对所述分析方式的优化方式。

进一步地，当所述数据检测模块对所述待接收数据进行源检测时，数据检测模块的源检测单元对所述待接收数据的源IP的若干数据发送特征进行统计，以根据统计结果确定所述待接收数据的发送合格率，所述数据检测模块根据所述发送合格率确定所述待接收数据是否通过所述源检测。

进一步地，当所述数据检测模块对所述待接收数据进行数据量检测时，所述数据检测模块在所述待接收数据的数据量与发送端的发送数据量不相等时确定所述待接收数据未通过所述数据量检测。

进一步地，当所述数据分析模块对经所述源检测和数据量检测的所述待接收数据进行分析时，所述数据分析模块根据所述源检测和数据量检测结果确定对所述待接收数据进行分析时的分析方式；

当所述检测模块确定所述待接收数据通过所述源检测且通过所述数据量检测时，所述数据分析模块确定以第一分析方式对所述待接收数据进行分析；

当所述检测模块确定所述待接收数据未通过所述源检测或所述数据量检测时，所述数据分析模块确定以第二分析方式对所述待接收数据进行分析；

当所述检测模块确定所述待接收数据均未通过所述源检测和所述数据量检测时，所述数据分析模块确定以第三分析方式对所述待接收数据进行分析。

进一步地，当所述数据分析模块确定以第一分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述终端的历史数据异常率Y,以根据历史数据异常率Y确定分析所述待接收数据时的数据粒度，设定其中，Rn为所述终端的历史数据中第i个异常指标的异常值，R0为所述终端的历史数据中发送总数据量，n为异常指标的个数。

进一步地，当所述数据分析模块确定以第二分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述发送合格率和发送合格率标准的合格率差值，以根据该合格率差值确定从待接收数据中截取数据时的字节数间隔；

或，所述数据分析模块计算所述待接收数据的数据量与发送端的发送数据量的数据量差值，以根据该数据量差值确定从待接收数据中截取数据时的字节数间隔。

进一步地，当所述数据分析模块确定所述分析方式完成时，所述数据分析模块在所述待接收数据的编码复杂度处于第二复杂度水平时确定对所述分析方式进行优化；

当所述数据分析模块确定对所述分析方式进行优化时，根据所述编码复杂度和复杂度阈值的复杂度差值确定对所述分析方式的优化方式，优化方式包括对相应分析方式下的分析参数进行调节的第一优化方式和在对应分析方式下增加对所述待接收数据的聚类分析，并在聚类分析时根据各类数据的数量确定是否对相应分析方式下的分析参数进行调节的第二优化方式。

进一步地，当所述数据分析模块确定所述优化方式为第一优化方式时，根据所述复杂度差值和预设复杂度差值确定对所述参数进行调节时的调节系数K，设定

其中，C为所述编码复杂度差值，C0为预设复杂度差值。

进一步地，当所述数据分析模块确定所述优化方式为第二优化方式时，将聚类分析后的所述各类数据与入侵规则库进行比对，确定所述各类数据与入侵规则库中若干入侵规则的相似度并统计相似度大于预设相似度的入侵规则的数量，并根据该数量计算对相应分析方式下的分析参数进行调节的调节系数Z，设定Z＝1+(Uz-U)/Uz，其中，U为所述相似度大于预设相似度的入侵规则的数量，Uz为入侵规则库中入侵规则的总数量。

本发明另一方面提供一种应用上述基于大数据行为分析的数据检测方法的系统，包括：

数据获取模块，其用以获取终端的待接收数据；

数据检测模块，其与所述数据获取模块连接，该数据检测模块包括用以对所述待接收数据进行源检测的源检测单元和用以对所述待接收数据进行数据量检测的数据量检测单元；

数据分析模块，其与所述数据检测模块连接，该数据分析模块包括用以对经所述源检测和数据量检测的所述待接收数据进行分析以确定所述待接收数据的分析方式的分析方式确定单元，对所述待接收数据的编码复杂度进行分析，以确定编码复杂度所处复杂度水平的编码分析单元，以及用以根据复杂度差值确定对所述分析方式进行优化的分析方式优化单元。

与现有技术相比，本发明的有益效果在于，本发明通过对终端待接收数据进行源检测和数据量检测，并根据上述检测结果确定对数据分析时的分析方式，保证了数据来源的安全可靠性，并通过对待接收数据进行编码复杂度分析，在对应编码复杂度处于不同水平对确定的分析方式进行优化以保证对待接收数据分析时的精确性，降低了用户数据被破坏的风险。

进一步地，本发明源检测单元通过统计所述待接收数据的源IP的若干数据发送特征并计算所述待接收数据的发送合格率，以根据发送合格率与发送合格率标准的比对结果确定待接收数据是否通过源检测，保证待接收数据在源IP中被发送时就应当不被篡改或源IP本身不存在入侵，进一步提高了对待接收数据分析时的精确性，保证了数据传输的安全。

进一步地，本发明数据量检测单元对通过对待接收数据的数据量和发送端的发送数据量进行比对，以确定发送和待接收的数据量的一致性，在数据分析前提高对数据进行提前检测，保证精准对待接收数据进行分析。

进一步地，本发明通过对待接收数据根据源检测和数据量的结果设置多个不同的分析方式以进行分析，具有一定的灵活性，并且通过确定不同的分析方式，可以进一步提高对数据分析的准确性。

进一步地，本发明通过在第一分析方式下计算终端的历史数据异常率，以确定终端在过去一定时期内发送数据时，是否存在被入侵，并根据异常率表征该被入侵情况，并在异常率处于不同状态时以不同的数据粒度分析待接收数据，提高了对数据分析过程的分析精度。

进一步地，本发明通过在第二分析方式下对未通过源检测或数据量检测的待接收数据分别设置不同运算方式以确定对待接收数据进行分析时截取数据的字节数间隔，以使数据分析方式更加灵活，进一步提高了对数据分析过程的精准程度，降低用户数据被篡改和破坏的风险。

附图说明

图1为本发明实施例基于大数据行为分析的数据检测方法的流程图；

图2为本发明实施例应用基于大数据行为分析的数据检测方法的系统的结构示意图；

图3为本发明实施例应用基于大数据行为分析的数据检测方法的系统中数据检测模块的结构示意图；

图4为本发明实施例应用基于大数据行为分析的数据检测方法的系统中数据分析模块的结构示意图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1所示，其为本发明实施例基于大数据行为分析的数据检测方法的流程图。

本发明实施例基于大数据行为分析的数据检测方法，包括：

步骤S1、数据获取模块获取终端的待接收数据；

具体而言，本发明通过对终端待接收数据进行源检测和数据量检测，并根据上述检测结果确定对数据分析时的分析方式，保证了数据来源的安全可靠性，并通过对待接收数据进行编码复杂度分析，在对应编码复杂度处于不同水平对确定的分析方式进行优化以保证对待接收数据分析时的精确性，降低了用户数据被破坏的风险。

具体而言，当所述数据检测模块对所述待接收数据进行源检测时，数据检测模块的源检测单元对所述待接收数据的源IP的若干数据发送特征进行统计，以根据统计结果确定所述待接收数据的发送合格率F，设定

F＝U/Uz

其中，U为所述源IP的若干数据发送特征中与源IP一致的数据发送特征的数量，Uz为若干所述数据发送特征的总数量。

本发明实施例中，若干数据发送特征包括发送数据时的通道、通道容量、发送方式、数据传输协议、通道带宽和数据发送速率。

具体而言，当所述数据检测模块确定所述发送合格率完成时，将所述发送合格率F与发送合格率标准F0进行比对，以根据比对结果确定所述待接收数据是否通过所述源检测；

当F≥F0时，所述源检测单元确定所述待接收数据通过所述源检测；

当F＜F0时，所述源检测单元确定所述待接收数据未通过所述源检测。

本发明实施例中，发送合格率标准的取值为0.96，该发送合格率标准为待接收数据在被发送时，仅可容许通道带宽或数据发送速率不一致，其与数据发送特征均应当一致，对于上述发送合格率标准的取值，本领域技术人员也可根据实际分析的数据所需安全性进行自行设置，本申请对此不作限定。

具体而言，当所述数据检测模块对所述待接收数据进行数据量检测时，所述数据检测模块的数据量检测单元将所述待接收数据的数据量G与发送端的发送数据量G1进行比对，以根据比对结果确定所述待接收数据是否通过所述数据量检测；

当G＝G1时，所述数据量检测单元确定所述待接收数据通过所述数据量检测；

当G≠G1时，所述数据量检测单元确定所述待接收数据未通过所述数据量检测。

具体而言，本发明源检测单元通过统计所述待接收数据的源IP的若干数据发送特征并计算所述待接收数据的发送合格率，以根据发送合格率与发送合格率标准的比对结果确定待接收数据是否通过源检测，保证待接收数据在源IP中被发送时就应当不被篡改或源IP本身不存在入侵，进一步提高了对待接收数据分析时的精确性，保证了数据传输的安全。

具体而言，本发明数据量检测单元对通过对待接收数据的数据量和发送端的发送数据量进行比对，以确定发送和待接收的数据量的一致性，在数据分析前提高对数据进行提前检测，保证精准对待接收数据进行分析。

具体而言，当所述数据分析模块对经所述源检测和数据量检测的所述待接收数据进行分析时，所述数据分析模块根据所述源检测和数据量检测结果确定对所述待接收数据进行分析时的分析方式；

具体而言，本发明通过对待接收数据根据源检测和数据量的结果设置多个不同的分析方式以进行分析，具有一定的灵活性，并且通过确定不同的分析方式，可以进一步提高对数据分析的准确性。

具体而言，当所述数据分析模块确定以第一分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述终端的历史数据异常率Y,以根据历史数据异常率Y与预设异常率阈值Y0的比对结果确定分析所述待接收数据时的数据粒度，设定其中，Rn为所述终端的历史数据中第i个异常指标的异常值，R0为所述终端的历史数据中发送总数据量，n为异常指标的个数；

当Y≤Y0，所述数据分析模块确定以第一数据粒度E1分析所述待接收数据；

当Y＞Y0，所述数据分析模块确定以第二数据粒度E2分析所述待接收数据；

其中，E1＞E2。

本发明实施例中，对于根据异常率与预设异常率阈值确定分析所述待接收数据是的数据粒度中，数据粒度为多维粒度，包括以时间线、数据量、空间线及数据类型，其中，第一数据粒度E1对应的时间线中以0.8秒为间隔标准截取数据，数据量中以相对数据总量的1％的数据量获取数据，空间线中以相对总行数的5％的行数获取数据，数据类型中若单个数据类型的数据量大于55％的数据总量，则获取该单个数据类型的数据；第二数据粒度E2对应的时间线中以0.5秒为间隔标准截取数据，数据量中以相对数据总量的2％的数据量获取数据，空间线中以相对总行数的10％的行数获取数据，数据类型中若单个数据类型的数据量大于30％的数据总量，则获取该单个数据类型的数据。

具体而言，本发明通过在第一分析方式下计算终端的历史数据异常率，以确定终端在过去一定时期内发送数据时，是否存在被入侵，并根据异常率表征该被入侵情况，并在异常率处于不同状态时以不同的数据粒度分析待接收数据，提高了对数据分析过程的分析精度。

本发明实施例中，预设异常率阈值的取值为0.15，该预设异常率阈值为所述终端可接受的数据误差率；其中，第i个异常指标的异常值为该异常指标对应的数据中异常数据量与该数据的数据量的比值。

具体而言，当所述数据分析模块确定以第二分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述发送合格率F和发送合格率标准F0的合格率差值δ，设定δ＝F0-F，以根据该合格率差值δ与预设合格率差值阈值δ0的比对结果确定从待接收数据中截取数据时的字节数间隔W，设定

W＝(δ/δ0)×B1

其中，B1为第一字节数间隔标准；或，

所述数据分析模块计算所述待接收数据的数据量G与发送端的发送数据量G1的数据量差值α，设定α＝|G-G1|，以根据该数据量差值α和预设数据量差值α0的比对结果确定从待接收数据中截取数据时的字节数间隔W，设定

W＝(α/α0)×B2

其中，B2为第二字节数间隔标准。

本发明实施例中，预设合格率差值阈值δ0的取值为0.15，B1的取值为100Byte，B2的取值为200Byte。

具体而言，本发明通过在第二分析方式下对未通过源检测或数据量检测的待接收数据分别设置不同运算方式以确定对待接收数据进行分析时截取数据的字节数间隔，以使数据分析方式更加灵活，进一步提高了对数据分析过程的精准程度，降低用户数据被篡改和破坏的风险。

具体而言，当所述数据分析模块确定以第三分析方式对所述待接收数据进行分析时，所述分析模块遍历所述待接收数据。

具体而言，当所述数据分析模块确定所述分析方式完成时，所述数据分析模块根据所述待接收数据的编码复杂度所处复杂度水平确定是否对所述分析方式进行调整；

当所述编码复杂度处于第一复杂度水平，所述数据分析模块确定不对所述分析方式进行优化；

当所述编码复杂度处于第二复杂度水平，所述数据分析模块确定对所述分析方式进行优化；

其中，第一复杂度水平满足所述编码复杂度≤复杂度阈值，第二复杂度水平满足所述编码复杂度＞复杂度阈值。

本发明实施例中，复杂度阈值的取值根据待接收数据的重要性确定，本实施例中，数据分析模块中设有若干数据重要性指数对应的复杂度阈值，本实施方式中设置有若干重要性指数对应的复杂度阈值，复杂度阈值为对应重要性指数的二分之一，数据重要性指数设置为Z，设定Z＝Gn/Gz，其中，Gn为与所述待接收数据关联的节点数量，Gz为与所述终端关联的节点数量。

具体而言，当所述数据分析模块确定对所述分析方式进行优化时，根据所述编码复杂度和复杂度阈值的复杂度差值C确定对所述分析方式的优化方式，

若C≤C0，所述数据分析模块确定所述优化方式为第一优化方式；

若C＞C0，所述数据分析模块确定所述优化方式为第二优化方式；

其中，C0为预设复杂度差值，所述第一优化方式为对相应分析方式下的分析参数进行调节，第二优化方式在对应分析方式下增加对所述待接收数据的聚类分析，并在聚类时根据各类数据的数量确定是否对相应分析方式下的分析参数进行调节。

本发明实施例中，预设复杂度差值的取值为1.5。

具体而言，本发明通过设置预设复杂度差值，并在根据编码复杂度确定需对分析方式进行优化时，通过计算复杂度差值并与预设复杂度差值进行比对以选取对分析方式的优化方式，进一步提高了对数据分析过程的控制的精确性。

具体而言，当所述数据分析模块确定所述优化方式为第一优化方式时，根据所述复杂度差值和预设复杂度差值确定对所述参数进行调节时的调节系数K，设定

其中，C为所述编码复杂度差值，C0为预设复杂度差值。

具体而言，当所述数据分析模块确定所述优化方式为第二优化方式时，将聚类分析后的各类数据与入侵规则库进行比对，确定各类数据与入侵规则库中若干入侵规则的相似度并统计相似度大于预设相似度的入侵规则的数量，并根据该数量计算对相应分析方式下的分析参数进行调节的调节系数Z，设定Z＝1+(Uz-U)/Uz，其中，U为所述相似度大于预设相似度的入侵规则的数量，Uz为入侵规则库中入侵规则的总数量。

具体而言，本发明通过在对应优化方式下，通过不同的计算方式计算对相应分析方式下的调节系数以分别对相应分析方式的分析参数进行调节，加大在数据分析过程中对渗透在数据中的网络入侵的检测和分析力度，且通过上述调节系数对相应分析方式下的分析参数进行调节，提高了对分析过程的控制精度，从而进一步保障了用户数据的安全性。

具体而言，当所述数据分析模块计算各调节系数完成时，将相应分析方式下的分析参数与调节系数相乘得到优化后的分析参数，并以优化后的分析参数对所述待接收数据进行分析。

请参阅图2-图4所示，图2为本发明实施例应用基于大数据行为分析的数据检测方法的系统的结构示意图；图3为本发明实施例应用基于大数据行为分析的数据检测方法的系统中数据检测模块的结构示意图；图4为本发明实施例应用基于大数据行为分析的数据检测方法的系统中数据分析模块的结构示意图。

本发明实施例应用基于大数据行为分析的数据检测方法的系统，包括：

数据获取模块，其用以获取终端的待接收数据；

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于大数据行为分析的数据检测方法，其特征在于，包括：

步骤S1、数据获取模块获取终端的待接收数据；

步骤S5、所述编码分析单元在编码复杂度处于第二复杂度水平时，所述数据分析模块的分析方式优化单元根据复杂度差值确定对所述分析方式的优化方式，

其中，所述分析方式包括在所述源检测和所述数据量检测均通过时根据所述终端历史数据异常率确定分析所述待接收数据时的数据粒度的第一分析方式，在所述源检测或所述数据量检测未通过时确定分析所述待接收数据时截取数据的字节数间隔的第二分析方式，以及在所述源检测和所述数据量检测均未通过时对所述待接收数据进行遍历分析的第三分析方式；

当所述数据检测模块对所述待接收数据进行源检测时，所述数据检测模块的源检测单元对所述待接收数据的源IP的若干数据发送特征进行统计，以根据统计结果确定所述待接收数据的发送合格率，所述源检测单元根据所述发送合格率确定所述待接收数据是否通过所述源检测；

当所述数据检测模块对所述待接收数据进行数据量检测时，所述数据检测模块的数据量检测单元在所述待接收数据的数据量与发送端的发送数据量不相等时确定所述待接收数据未通过所述数据量检测；

当所述数据分析模块确定以第一分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述终端的历史数据异常率Y,以根据历史数据异常率Y确定分析所述待接收数据时的数据粒度，设定其中，Rn为所述终端的历史数据中第i个异常指标的异常值，R0为所述终端的历史数据中发送总数据量，n为异常指标的个数；

当所述数据分析模块确定以第二分析方式对所述待接收数据进行分析时，所述数据分析模块计算所述发送合格率和发送合格率标准的合格率差值，以根据该合格率差值确定从待接收数据中截取数据时的字节数间隔；

或，所述数据分析模块计算所述待接收数据的数据量与发送端的发送数据量的数据量差值，以根据该数据量差值确定从待接收数据中截取数据时的字节数间隔；

当所述数据分析模块确定所述分析方式完成时，所述数据分析模块在所述待接收数据的编码复杂度处于第二复杂度水平时确定对所述分析方式进行优化；

当所述数据分析模块确定对所述分析方式进行优化时，根据所述编码复杂度和复杂度阈值的复杂度差值确定对所述分析方式的优化方式，优化方式包括对相应分析方式下的分析参数进行调节的第一优化方式和在对应分析方式下增加对所述待接收数据的聚类分析，并在聚类分析时根据各类数据的数量确定是否对相应分析方式下的分析参数进行调节的第二优化方式；

当所述数据分析模块确定所述优化方式为第一优化方式时，根据所述复杂度差值和预设复杂度差值确定对所述参数进行调节时的调节系数K，设定

其中，C为所述编码复杂度差值，C0为预设复杂度差值。

2.根据权利要求1所述的基于大数据行为分析的数据检测方法，其特征在于，当所述数据分析模块对经所述源检测和数据量检测的所述待接收数据进行分析时，所述数据分析模块根据所述源检测和数据量检测结果确定对所述待接收数据进行分析时的分析方式；

3.根据权利要求2所述的基于大数据行为分析的数据检测方法，其特征在于，当所述数据分析模块确定所述优化方式为第二优化方式时，将聚类分析后的所述各类数据与入侵规则库进行比对，确定所述各类数据与入侵规则库中若干入侵规则的相似度并统计相似度大于预设相似度的入侵规则的数量，并根据该数量计算对相应分析方式下的分析参数进行调节的调节系数Z，设定Z＝1+(Uz-U)/Uz，其中，U为所述相似度大于预设相似度的入侵规则的数量，Uz为入侵规则库中入侵规则的总数量。

4.一种应用权利要求1-3任一项所述的基于大数据行为分析的数据检测方法的系统，其特征在于，包括：

数据获取模块，其用以获取终端的待接收数据；