CN105306475A - 一种基于关联规则分类的网络入侵检测方法 - Google Patents

一种基于关联规则分类的网络入侵检测方法 Download PDF

Info

Publication number
CN105306475A
CN105306475A CN201510753693.6A CN201510753693A CN105306475A CN 105306475 A CN105306475 A CN 105306475A CN 201510753693 A CN201510753693 A CN 201510753693A CN 105306475 A CN105306475 A CN 105306475A
Authority
CN
China
Prior art keywords
data
network connection
item
correlation rule
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510753693.6A
Other languages
English (en)
Other versions
CN105306475B (zh
Inventor
王劲松
莫敬涛
黄玮
杨传印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Technology
Original Assignee
Tianjin University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Technology filed Critical Tianjin University of Technology
Priority to CN201510753693.6A priority Critical patent/CN105306475B/zh
Publication of CN105306475A publication Critical patent/CN105306475A/zh
Application granted granted Critical
Publication of CN105306475B publication Critical patent/CN105306475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于关联规则分类的网络入侵检测方法,包括网络数据预处理,关联规则提取,网络连接数据分类和分类结果展示。本发明以改进的Apriori算法(Apriori-index)为基础,以国际标准数据集KDDCup99网络连接数据集为例,首先对选自其中的网络连接数据提取关联规则,然后根据关联规则实现对测试网络连接数据的分类,从而判断出当前网络连接是否为攻击连接以及具体攻击类型,并将相关统计数据展示出来。Apriori-index算法更适用于KDDCup99数据集,大大提高了关联规则提取和网络连接分类的速度,检测结果的准确度也有提升,一定程度上改善了传统入侵检测系统分类慢,误报率高的缺陷。

Description

一种基于关联规则分类的网络入侵检测方法
技术领域
本方法涉及网络入侵检测系统领域,尤其涉及到一种基于关联规则分类的网络入侵检测方法。
背景技术
入侵检测通过收集和分析网络行为、安全日志、审计数据、其它网络上可以获得的信息以及计算机系统中若干关键点的信息,检查网络或系统中是否存在违反安全策略的行为和被攻击的迹象。它对于网络系统安全发挥着非常重要的作用,是防火墙的重要补充,入侵检测能够在不影响网络系统性能指标的情况下完成对网络系统的保护。
将数据挖掘技术应用于网络入侵检测已成为一个研究的热点,国内外已出现不少这方面的研究成果,但仍存在如下一些不足和难点:多数数据挖掘的入侵检测系统集中于异常检测或误用检测,而异常检测具有较高的误报率,误用检测具有较高的漏报率;目前,多数系统属于准实时系统,不能及时对入侵做出检测并响应;面对不同的网络环境,以及不断改变的入侵类型,当前的网络入侵检测系统缺乏自适应性。
将数据挖掘技术中的Apriori算法应用到入侵检测领域具有很强的理论基础,在技术上具有可行性。Apriori算法提取的关联规则由频繁项集生成,规则具有很强的置信度,分类结果精确度较高,很好地避免了异常检测高误报率和误用检测高漏报率的缺陷。
发明内容
本发明针对传统入侵检测系统的缺陷,提出了一种基于关联规则分类的网络入侵检测方法,通过采用Apriori-index算法来处理大量网络连接数据,提高入侵检测的及时性和准确性。通过在10%KDDCup99实验数据集上测试,对比其他入侵检测算法,该算法的整体检测效果较优。
本发明技术方案:
一种基于关联规则分类的网络入侵检测方法,该方法包括以下步骤:
第1步、对国际标准数据集10%KDDCup99预处理,将预处理后的数据集分成训练集和测试集两部分数据。
第2步、采用改进的Apriori算法(Apriori-index)对选取的训练集中的网络连接数据进行训练,提取到关联规则,将关联规则存放到关联规则库中,同时将关联规则库中的关联规则展示出来。
第3步、测试集中的每条网络连接数据逐条匹配关联规则库中关联规则,根据不同关联规则的条件长度和网络连接类型分别计算权值,找出最大权值所对应的网络连接类型即为最终分类得到的结果。
第4步、保存第3步中分类结果,将上述分类过程和分类得到的结果展示出来;同时为保证该方法良好的自学习特性,测试集的数据在根据关联规则分类得到具体的网络连接类型后,训练集数据连同对应的网络连接类型重新加入到训练集数据中,为后续关联规则提取提供新的训练集数据源,保证关联规则的动态更新。
第1步中所述的数据集预处理包括以下步骤:
将关联规则算法应用到入侵检测方法中,主要是一种以数据为中心的观点,对于网络连接数据的采集处理不在本发明的考虑范围之内。本发明中以国际标准网络连接数据集10%KDDCup99为例,以数据挖掘的思想为理论依据对入侵网络连接进行分类。
第1.1步、为每列数据添加位置参数。因为10%KDDCup99数据集中有大量相同的数据,比如,“0”和“1”,数据集中处于不同列的数据有不同的含义,而原始的Apriori算法在处理数据集中不同列的相同数据项时将他们视为同样的数据,因此直接使用原始的Apriori算法处理数据集会影响提取规则速度和分类结果的准确度。为避免出现以上问题,需要在数据预处理阶段为每条网络连接数据的每个数据项添加位置参数。
第1.2步、采用交叉验证的方法选取经过第1.1步预处理后的10%KDDCup99数据集中60%的连接数据作为训练集,剩余的40%的连接数据作为测试集。由于改进后的Apriori算法能够处理字符类型数据,同时数值类型的数据也能够视为字符类型数据,所以无需对网络连接数据中的字符类型数据进行数值化和归一化处理。
第2步所述采用Apriori-index算法提取关联规则需要经过以下步骤:
第2.1步、初始化最小支持度阈值Min_Support,最小置信度阈值Min_Confidence。通过查阅文献资料和实验验证,最小支持度阈值和最小置信度阈值分别设定为25%和78.5%可以获得较高的分类准确度。初始化最小支持度阈值Min_Support=25%,最小置信度阈值Min_Confidence=78.5%。
第2.2步、找出所有的频繁项集。遍历训练集中的所有的网络连接数据,统计每个属性值对应的连接类型及其出现的频度,形成候选项集合C1。在此基础上,根据支持度公式
S u p p o r t ( X ) = O c c u r ( X ) C o u n t ( D ) ;
计算支持度。其中Occur(X)表示训练集中所有网络连接数据中包含频繁项{X}的数量,Count(D)表示训练集{D}中所有网络连接的数量。在候选项集合C1中删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁1-项集L1;然后对于每种网络连接类型,连接L1中的不同元素构成候选项集合C2,再次遍历训练集数据,根据支持度公式计算C2中的每个候选项的支持度,删除候选项集合C2中支持度低于最小支持度阈值Min_Support的候选项,剩余候选项形成频繁2-项集L2;按照网络连接类型,再连接L2中的不同元素构成候选项集合C3,再次遍历训练集数据,计算C3中的每个候选项的支持度,删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁3-项集L3;重复进行以上的遍历、删除和连接的步骤,直到没有新的候选项产生,所有的频繁项集(L1,L2,...,Ln)都已搜寻得到。其中,连接步骤和删除步骤分别严格满足连接定理和频繁子集定理,即:若两个(k-1)-项集的前(k-2)个项相同,而最后一个项不同,则证明它们可连接得到k-项集;若k-项集任意一个子集不是频繁项集,则该k-项集也不是频繁项集。
第2.3步、由频繁项集产生关联规则。对于第2.2步中得到的频繁项集(L1,L2,...,Ln),频繁项集Li中每个频繁项li中的连接类型用tj表示。如果(li-tj)→tj的置信度大于最小置信度阈值Min_Confidence,则输出(li-tj)→tj。置信度的计算根据置信度计算公式:
C o n f i d e n c e ( A → B ) = P ( B | A ) = S u p p o r t ( A ∪ B ) S u p p o r t ( A ) ;
其中Support(A∪B)和Support(A)分别表示频繁项{A∪B}和{A}的支持度;即置信度公式可化为:
C o n f i d e n c e { ( l i - t j ) → t j } = S u p p o r t ( l i ) S u p p o r t ( l i - t j ) ;
找到的所有满足要求的(li-tj)→tj,即为关联规则。
第2.4步、将第2.3步中得到的关联规则添加到关联规则库中,作为对测试集中未知类型的网络连接数据测试分类的判断依据。
第2.5步、将关联规则库中的关联规则展示出来。10%KDDCup99数据集的数据量较大,经过Apriori-index算法训练得到的关联规则非常多,关联规则在页面内显示会比较混乱,所以关联规则展示页面进行适当的缩放,使关联规则清晰展示。
第3步所述的分类过程需经过以下步骤:
第3.1步、读取测试集数据,对测试集中的每条网络连接数据按照关联规则分类,统计分类结果。10%KDDCup99数据集中每条网络连接数据有41个属性数据项和1个连接类型数据项,第2步中提取到的关联规则的条件部分包含有多个属性数据项,测试集中的每条未知类型的网络连接数据按照提取的规则分类时,会有多条关联规则与之对应,所以按关联规则分类需经过以下过程:
第3.1.1步、对读取到的测试集中的一条连接数据,遍历整个关联规则库,统计并记录匹配的关联规则Ri(例如:(li-tj)→tj)中条件部分(li-tj)的长度,即统计关联规则Ri条件部分(li-tj)包含的属性数据项的数量Lengthi
第3.1.2步、分别计算匹配的n条规则中对应的结果部分tj的权值。按照Apriori-index算法权值计算公式:
W e i g h t ( t j ) = Σ i = 1 n ( Length i * log 2 Length i + Length i ) ;
计算该条未知结果类型的测试数据在经过关联规则库中所有规则比对后匹配的第j种网络连接类型tj的权值。这主要是由于关联规则条件部分(li-tj)的长度Lengthi越大,分类准确度越高,这样做能够同其他关联规则加以区分,提高分类结果的准确度。
第3.2步、输出分类结果:网络连接类型t。比较所有的权值,从中找出权值最高的Weight(t),将分类结果(即网络连接类型t)输出。
第4步所述的展示分类过程和分类得到的结果以及向训练集中添加分类后的测试数据方法是:
第4.1步、测试数据展示。为将每条测试数据从读取直至分类完成过程展示出来,将每条测试数据用运动的图形代表,图形的运动轨迹和颜色变化代表测试数据的分类过程和分类得到的连接类型;
第4.2步、将测试过的网络连接数据与对应的网络连接类型添加到训练集中,保证该方法能够自学习。考虑到实际网络状况的动态特性,一次训练所得的关联规则不能始终代表网络的当前状况,在本方法中将每条分类后的测试数据连同其网络连接类型加入到训练集中并再次训练,实时训练产生新规则并更新到关联规则库中。
本发明具有以下优点:
本发明首先为10%KDDCup99的41个属性数据项添加位置参数,按照交叉检验的方法将其分成训练集和测试集。然后通过Apriori-index算法对训练集中的网络连接数据训练提取关联规则。最后通过Apriori-index算法中的测试方法对测试集中未知类型的网络连接数据分类,获得分类结果,并展示分类过程和分类结果,同时将测试集中的数据和对应的分类结果导入到训练集中以实时更新训练集数据,产生新的关联规则,使本方法具有良好的自适应性和自学习特性。该发明采用Apriori-index算法,有效避免了经典Apriori算法处理10%KDDCup99数据集时的大量重复计算,大大加快了分类的效率,提高了网络连接数据分类检测结果的准确度,降低了算法的时间复杂度,使本方法具有较强的稳定性。
附图说明
图1是本发明基于关联规则分类的网络入侵检测方法的流程
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
将关联规则算法应用到入侵检测中,主要是一种以数据为中心的观点,对于网络连接数据的采集处理不在本发明的考虑范围之内。本发明中以国际标准网络连接数据集10%KDDCup99为例,以数据挖掘的思想为理论依据对入侵网络连接进行分类。
图1对一种基于关联规则分类的网络入侵检测方法进行了详细的步骤说明。本发明提供的方法包括以下步骤:
第1步、对国际标准数据集10%KDDCup99预处理,将预处理后的数据集分成训练集和测试集两部分数据。
第1.1步、为每列数据添加位置参数。因为10%KDDCup99数据集中的数据中有大量相同的数据,比如:“0”和“1”。10%KDDCup99数据集中处于不同列的数据有不同的含义,而原始的Apriori算法在处理数据集中不同列的相同数据项时将他们视为同样的数据,因此直接使用原始的Apriori算法处理数据集会影响提取规则速度和分类结果的准确度。为避免出现以上问题,需要在数据预处理阶段为每个数据项添加位置参数position,即数据项所在的列。这样数据集中的每个数据项可用结构体Item{intpositon,stringdata}表示,例如位于第2列的tcp表示为(2,tcp)。
第1.2步、采用交叉验证的方法选取经过第1.1步预处理后的10%KDDCup99数据集中60%的连接数据作为训练集,40%的连接数据作为测试集。将10%KDDCup99数据集中每10条网络连接数据归为一组,然后从每组中任意选取其中6条加入到训练集,剩余的4条数据加入到测试集。由于改进后的Apriori算法能够处理字符类型数据,同时数值类型的数据也可视为字符类型数据,所以无需对网络连接数据中的字符类型数据进行数值化和归一化处理。
第2步、采用Apriori-index算法对选取的训练集中的网络连接数据进行训练,提取到关联规则,并将关联规则存放到关联规则库中。将关联规则库中的关联规则展示出来。
首先进行以下定义和定理的说明:
·项:设I={i1,i2,i3,...,im}是m个不同项的集合,每个ik(k=1,2,3,...,m)称为一个项(Item)。
·项集:项目的集合I称为项目集合(Itemset),简称为项集。
·k-项集:项集中的每个项中包含有k个元素,k也称为项集的长度。
·候选项集Ci:通过项集中各项的连接,用来获取频繁项集Li的候选项目集合,下标i表示候选项集中每个候选项长度为i。候选项集中满足支持度大于最小支持度阈值条件的候选项保留成为频繁项,不满足条件的将被删除。
·频繁项集Li:候选项集Ci中支持度大于最小支持度Min_Support的候选项组成的集合称为频繁项集。
·支持度Support(Item):指的是在训练集的所有网络连接数据中,包含项Item比例。例如:在10条训练集的网络连接数据中有5条包含项(2,tcp),则Support((2,tcp))=0.5
·置信度Confidence(R):对于规则R:A→B,其置信度指的是在训练集中包含属性项A的网络连接数据中网络连接类型为B的比例。例如:在之前的5条包含项(2,tcp)的网络连接数据中连接类型为Normal的有4条,则Confidence((2,tcp)→Normal)=0.8。
两个定理:
·连接定理:若有两个k-1-项集,如果两个k-1-项集的前k-2个项相同,而最后一个项不同,则证明它们是可连接的,即这个k-1-项集可以连接生成k-项集。例如有两个3-项集:{a,b,c}{a,b,d},这两个3-项集就是可连接的,它们可以连接生成4-项集{a,b,c,d}。又如两个3-项集{a,b,c},{a,d,e},这两个3-项集显示不能连接生成4-项集。
·频繁子集定理:若一个项集的子集不是频繁项集,则该项集也不是频繁项集。例如,存在4-项集{a,b,c,d},如果它的3-项子集{a,b,c}的支持度小于最小支持度Min_Support,则4-项集{a,b,c,d}的支持度也小于最小支持度Min_Support。因此,若存在一个项集的子集不是频繁项集,该项集就不能被连接生成。
第2.1步、初始化最小支持度阈值Min_Support,最小置信度阈值Min_Confidence。通过查阅文献资料和实验验证,最小支持度阈值和最小置信度阈值分别设定为25%和78.5%可以获得较高的分类准确度,初始化指定最小支持度阈值Min_Support=25%,最小置信度阈值Min_Confidence=78.5%。
第2.2步、找出所有的频繁项集。遍历训练集中的所有的网络连接数据,统计每个属性值对应的连接类型及其出现的频度,形成候选项集合C1。在此基础上,根据支持度公式
S u p p o r t ( X ) = O c c u r ( X ) C o u n t ( D ) ;
计算支持度。其中Occur(X)表示训练集中所有网络连接数据中包含频繁项{X}的数量,Count(D)表示训练集{D}中所有网络连接的数量。在候选选项集合C1中删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁1-项目序列集合L1;然后对于每种网络连接类型,连接L1中的不同元素构成候选项集合C2,再次遍历训练集数据,根据支持度公式计算C2中的每个候选项的支持度,删除候选项集合C2中支持度低于最小支持度阈值Min_Support的候选项,剩余候选项的形成频繁2-项目序列集合L2;按照网络连接类型,再连接L2中的不同元素构成候选项集合C3,再次遍历训练集数据,计算C3中的每个候选项的支持度,删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁3-项目序列集合L3;重复进行以上的遍历和删除和连接的步骤,直到没有新的候选项产生,所有的频繁项集(L1,L2,...,Ln)都已搜寻得到。其中,连接步骤和删除步骤分别严格满足连接定理和频繁子集定理,即:若两个(k-1)-项集的前(k-2)个项相同,而最后一个项不同,则证明它们可连接得到k-项集;若k-项集任意一个子集不是频繁项集,则该k-项集也不是频繁项集。
下面举一个例子对上述过程进行说明。从10%KDDCup99随机选取如下数据:
表110%KDDCup99数据集中随机选取的5条数据
0 tcp http SF 54540 8314 …… 0.01 0.01 back
0 tcp http SF 54540 8314 …… 0.04 0.04 back
2 tcp time SF 0 4 …… 0.89 0 ipsweep
1 tcp smtp SF 1307 367 …… 0 0 normal
3 tcp smtp SF 1187 329 …… 0 0 normal
最后一列代表网络连接类型,前面的数据列代表属性数据。通过添加列的位置参数,计算每个数据项的支持度,删除支持度小于最小支持度阈值Min_Support的候选项,得到频繁1-项目序列集合L1:{(1,0)},{(2,tcp)},{(3,http)},{(3,smtp)},{(4,SF)},{(5,54540)},{(6,8314)},{(40,0)},{(41,0)};将频繁1-项目序列集合L1中各项连接,遍历,删除得到频繁2-项目序列集合L2:{(1,0),(2,tcp)},{(1,0),(3,http)},{(1,0),(4,SF)},{(1,0),(5,54540)},{(1,0),(6,8314)},{(2,tcp),(3,http)},{(2,tcp),(3,smtp)},{(2,tcp),(4,SF)},{(2,tcp),(5,54540)},{(2,tcp),(6,8314)},{(2,tcp),(40,0)},{(2,tcp),(41,0)},{(3,http),(4,SF)},{(3,http),(5,54540)},{(3,http),(6,8314)},{(3,smtp),(4,SF)},{(3,smtp),(40,0)},{(3,smtp),(41,0)},{(4,SF),(5,54540)},{(4,SF),(6,8314)},{(4,SF),(40,0)},{(4,SF),(41,0)},{(5,54540),(6,8314)},{(40,0),(41,0)};将频繁2-项目序列集合L2中各项连接,遍历,删除得到频繁3-项目序列集合L3:{(1,0),(2,tcp),(3,http)},{(1,0),(2,tcp),(4,SF)},{(1,0),(2,tcp),(5,54540)},{(1,0),(2,tcp),(6,8314)},{(2,tcp),(3,http),(4,SF)},{(2,tcp),(3,http),(5,54540)},{(2,tcp),(3,http),(6,8314)},{(2,tcp),(3,smtp),(4,SF)},{(2,tcp),(3,smtp),(40,0)},{(2,tcp),(3,smtp),(41,0)},{(2,tcp),(4,SF),(5,54540)},{(2,tcp),(4,SF),(6,8314)},{(2,tcp),(5,54540),(6,8314)},{(2,tcp),(4,SF),(40,0)},{(2,tcp),(4,SF),(41,0)},{(2,tcp),(40,0),(41,0)}{(3,http),(4,SF),(5,54540)},{(3,http),(4,SF),(6,8314)},{(3,http),(5,54540),(6,8314)},{(3,smtp),(4,SF),(40,0)},{(3,smtp),(4,SF),(41,0)},{(3,smtp),(40,0),(41,0)},{(4,SF),(5,54540),(6,8314)},{(4,SF),(40,0),(41,0)};将频繁3-项目序列集合L3中各项连接,遍历,删除得到频繁4-项目序列集L4:{(1,0),(2,tcp),(3,http),(4,SF)},{(1,0),(2,tcp),(3,http),(5,54540)},{(1,0),(2,tcp),(3,http),(6,8314)},{(2,tcp),(3,http),(4,SF),(5,54540)},{(2,tcp),(3,smtp),(4,SF),(6,8314)},{(3,http),(4,SF),(5,54540),(6,8314)},{(2,tcp),(3,smtp),(4,SF),(40,0)},{(2,tcp),(3,smtp),(4,SF),(41,0)},{(2,tcp)(3,smtp)(40,0)(41,0)}{(2,tcp)(4,SF)(40,0)(41,0)},{(3,smtp),(4,SF),(40,0)(41,0)};将频繁4-项目序列集合L4中各项连接,遍历,删除得到频繁5-项目序列集L5:{(1,0),(2,tcp),(3,http),(4,SF),(5,54540)},{(1,0),(2,tcp),(3,http),(4,SF),(6,8314)},{(2,tcp),(3,http),(4,SF),(5,54540),(6,8314)},{(2,tcp),(3,smtp),(4,SF),(40,0),(41,0)};将频繁5-项目序列集合L5中各项连接,遍历,删除得到频繁6-项目序列集L6:{(1,0),(2,tcp),(3,http),(4,SF),(5,54540),(6,8314)},至此所有的频繁项都已找到。
第2.3步、由频繁项集产生关联规则。对于第2.2步中得到的频繁项集(L1,L2,...,Ln),假设频繁项集Li中每个频繁项li的网络连接类型用tj表示;如果(li-tj)→tj的置信度大于最小置信度阈值Min_Confidence,则输出(li-tj)→tj。置信度的计算根据置信度计算公式:
C o n f i d e n c e ( A → B ) = P ( B | A ) = S u p p o r t ( A ∪ B ) S u p p o r t ( A ) ;
其中Support(A∪B)和Support(A)分别表示频繁项{A∪B}和{A}的支持度;即置信度公式可化为:
C o n f i d e n c e { ( l i - t j ) → t j } = S u p p o r t ( l i ) S u p p o r t ( l i - t j ) ;
找到的所有满足要求的(li-tj)→tj,即为关联规则;接着第2.2步中的例子对第2.3步由频繁项集产生关联规则进行说明:将第2.2步中得到的频繁项集中的每一项同其连接类型相接,组成Itemi→type这种形式的项-连接类型对,分别计算每个项-连接类型对的置信度,删除置信度小于最小置信度阈值的项-连接类型对,得到如下规则:{(1,0)}→back;{(2,tcp)}→back;{(2,tcp)}→ipsweep;{(2,tcp)}→normal;{(3,http)}→back;{(3,smtp)}→normal;{(4,SF)}→back;{(4,SF)}→ipsweep;{(4,SF)}→normal;{(5,54540)}→back;{(6,8314)}→back;{(40,0)}→normal;{(41,0)}→normal;{(41,0)}→ipsweep;{(1,0),(2,tcp)}→back;{(1,0),(3,http)}→back;{(1,0),(4,SF)}→back;{(1,0),(5,54540)}→back;{(1,0),(6,8314)}→back;{(2,tcp),(3,http)}→back;{(2,tcp),(3,smtp)}→normal;{(2,tcp),(4,SF)}→back;{(2,tcp),(4,SF)}→normal;{(2,tcp),(4,SF)}→ipsweep;{(2,tcp),(5,54540)}→back;{(2,tcp),(6,8314)}→back;{(2,tcp),(40,0)}→normal;{(2,tcp),(41,0)}→normal;{(2,tcp),(41,0)}→ipsweep;{(3,http),(4,SF)}→back;{(3,http),(5,54540)}→back;{(3,http),(6,8314)}→back;{(3,smtp),(4,SF)}→normal;{(3,smtp),(40,0)}→normal;{(3,smtp),(41,0)}→normal;{(4,SF),(5,54540)}→back;{(4,SF),(6,8314)}→back;{(4,SF),(40,0)}→normal;{(4,SF),(41,0)}→normal;{(4,SF),(41,0)}→ipsweep;{(5,54540),(6,8314)}→back;{(40,0),(41,0)}→normal;{(1,0),(2,tcp),(3,http)}→back;{(1,0),(2,tcp),(4,SF)}→back;{(1,0),(2,tcp),(5,54540)}→back;{(1,0),(2,tcp),(6,8314)}→back;{(2,tcp),(3,http),(4,SF)}→back;{(2,tcp),(3,http),(5,54540)}→back;{(2,tcp),(3,http),(6,8314)}→back;{(2,tcp),(3,smtp),(4,SF)}→normal;{(2,tcp),(3,smtp),(40,0)}→normal;{(2,tcp),(4,SF),(6,8314)}→back;{(2,tcp),(3,smtp),(41,0)}→normal;{(2,tcp),(4,SF),(5,54540)}→back;{(2,tcp),(5,54540),(6,8314)}→back;{(2,tcp),(4,SF),(40,0)}→normal;{(2,tcp),(4,SF),(41,0)}→normal;{(2,tcp),(4,SF),(41,0)}→ipsweep;{(2,tcp),(40,0),(41,0)}→normal;{(3,http),(4,SF),(5,54540)}→back;{(3,http),(4,SF),(6,8314)}→back;{(3,http),(5,54540),(6,8314)}→back;{(3,smtp),(4,SF),(40,0)}→normal;{(3,smtp),(4,SF),(41,0)}→normal;{(3,smtp),(40,0),(41,0)}→normal;{(4,SF),(5,54540),(6,8314)}→normal;{(4,SF),(40,0),(41,0)}→normal;{(1,0),(2,tcp),(3,http),(4,SF)}→back;{(1,0),(2,tcp),(3,http),(5,54540)}→back;{(1,0),(2,tcp),(3,http),(6,8314)}→back;{(2,tcp),(3,http),(4,SF),(5,54540)}→back;{(2,tcp),(3,smtp),(4,SF),(6,8314)}→back;{(3,http),(4,SF),(5,54540),(6,8314)}→back;{(2,tcp),(3,smtp),(4,SF),(40,0)}→normal;{(2,tcp),(3,smtp),(4,SF),(41,0)}→normal;{(2,tcp)(3,smtp)(40,0)(41,0)}→normal;{(2,tcp)(4,SF)(40,0)(41,0)}→normal;{(2,tcp)(3,smtp)(40,0)(41,0)}→normal{(3,smtp),(4,SF),(40,0)(41,0)}→normal;{(1,0),(2,tcp),(3,http),(4,SF),(5,54540)}→back;{(1,0),(2,tcp),(3,http),(4,SF),(6,8314)}→back;{(2,tcp),(3,http),(4,SF),(5,54540),(6,8314)}→back;{(2,tcp),(3,smtp),(4,SF),(40,0),(41,0)}→normal;{(1,0),(2,tcp),(3,http),(4,SF),(5,54540),(6,8314)}→back
第2.4步、将第2.3步中得到的关联规则添加到关联规则库中,作为对测试集中未知类型的网络连接数据测试分类的判断依据。
第2.5步、将关联规则库中的规则展示出来。10%KDDCup99数据量较大,经过Apriori-index算法训练得到的关联规则非常多,关联规则在页面内显示会比较混乱,所以关联规则展示页面进行适当的缩放,使关联规则清晰展示。
第3步、测试集中的每条网络连接数据逐条匹配关联规则库中规则,根据不同规则的形式计算分类结果的权值并找出最大权值所对应的结果即为最终分类结果。
第3.1步、读取测试集数据,对测试集中的每条网络连接数据按照关联规则分类,统计分类结果。10%KDDCup99数据集中每条网络连接数据有41个属性数据项和1个连接类型数据项,第2步中提取到的关联规则的条件部分包含有多个属性数据项,测试集中的每条未知类型的网络连接数据按照提取的规则分类时,会有多条关联规则与之对应,所以按关联规则分类需经过以下过程:
第3.1.1步、对读取到的测试集中的一条连接数据,遍历整个关联规则库,统计并记录匹配的关联规则Ri(例如:(li-tj)→tj)中条件部分(li-tj)的长度,即统计关联规则Ri条件部分(li-tj)包含的属性数据项的数量Lengthi
第3.1.2步、分别计算匹配的n条规则中对应的网络连接类型部分tj的权值。按照Apriori-index算法权值计算公式:
W e i g h t ( t j ) = Σ i = 1 n ( Length i * log 2 Length i + Length i ) ;
计算该条未知网络连接类型的测试数据在经过关联规则库中所有关联规则比对后匹配的第j种网络连接类型tj的权值。这主要是由于关联规则条件部分(li-tj)的长度Lengthi越大,分类准确度越高,这样做能够同其他关联规则加以区分,提高分类结果的准确度。
第3.2步、输出分类结果:网络连接类型t。比较所有的权值,从中找出权值最高的Weight(t),将分类结果(即网络连接类型t)输出。
为了展示第3步过程,从10%KDDCup99数据集中连接类型为back,ipsweep,normal的网络连接数据中随机选取一条如下:
表210%KDDCup99数据集中连接类型为以上三种的数据中随机挑选的一条数据
1 tcp smtp SF 835 377 …… 0 0 normal
将这条数据与得到的关联规则进行匹配,关联规则库中匹配这条连接的规则有:{(2,tcp)}→back;{(4,SF)}→back;{(2,tcp),(4,SF)}→back;{(2,tcp)}→ipsweep;{(4,SF)}→ipsweep;{(41,0)}→ipsweep;{(2,tcp),(4,SF)}→ipsweep;{(2,tcp),(41,0)}→ipsweep;{(4,SF),(41,0)}→ipsweep;{(2,tcp),(4,SF),(41,0)}→ipsweep;{(2,tcp)}→normal;{(3,smtp)}→normal;{(4,SF)}→normal;{(40,0)}→normal;{(41,0)}→normal;{(2,tcp),(3,smtp)}→normal;{(2,tcp),(4,SF)}→normal;{(2,tcp),(40,0)}→normal;{(2,tcp),(41,0)}→normal;{(3,smtp),(4,SF)}→normal;{(3,smtp),(40,0)}→normal;{(3,smtp),(41,0)}→normal;{(4,SF),(40,0)}→normal;{(4,SF),(41,0)}→normal;{(40,0),(41,0)}→normal;{(2,tcp),(3,smtp),(4,SF)}→normal;{(2,tcp),(3,smtp),(40,0)}→normal;{(2,tcp),(3,smtp),(41,0)}→normal;{(2,tcp),(4,SF),(40,0)}→normal;{(2,tcp),(4,SF),(41,0)}→normal;{(2,tcp),(40,0),(41,0)}→normal;{(3,smtp),(4,SF),(40,0)}→normal;{(3,smtp),(4,SF),(41,0)}→normal;{(3,smtp),(40,0),(41,0)}→normal;{(4,SF),(40,0),(41,0)}→normal;{(2,tcp),(3,smtp),(4,SF),(40,0)}→normal;{(2,tcp),(3,smtp),(4,SF),(41,0)}→normal;{(2,tcp)(3,smtp)(40,0)(41,0)}→normal;{(2,tcp)(4,SF)(40,0)(41,0)}→normal;{(3,smtp),(4,SF),(40,0)(41,0)}→normal;{(2,tcp),(3,smtp),(4,SF),(40,0),(41,0)}→normal;
分别计算这些规则对应的三种连接类型的权值:
Weight(back)=2*(1*log21+1)+(2*log22+2)=6;
Weight(ipsweep)=3*(1*log21+1)+3*(2*log22+2)+(3*log23+3)=22.7549;
Weight(normal)=5*(1*log21+1)+10*(2*log22+2)+10*(3*log23+3)
+5*(4*log24+4)+(log25+5)=199.1585
权值最高的是Weight(normal),则这条网络连接数据根据关联规则分类得到的结果是normal,这条数据的最后一列也证明了分类的正确性。
第4步、保存第3步中分类结果,将分类过程和分类结果展示出来,同时为保证该方法良好的自适应性和自学习特性,测试集的数据根据关联规则得到分类结果后,训练集数据连同对应的分类结果重新加入到训练集数据中,为后续关联规则提取提供训练数据源,保证关联规则的实时更新。
第4.1步、测试数据展示。为将每条测试数据从读取直至分类完成过程展示出来,将每条测试数据用运动的图形代表,图形运动的轨迹和颜色变化代表测试数据的分类过程。每条网络连接对应一个动态Ellipse模型,而每个Ellipse动画模型对应一个测试线程。每读取一条测试数据,该方法通过规则匹配获取对该连接的分类结果。展示界面中的每个动态Ellipse模型,该方法利用其颜色、位置和运动轨迹的变化直观地显示具体分类过程和分类结果。
第4.2步、将测试过的网络连接数据与对应的分类结果添加到训练集中,保证方法良好的自适应性和字学习特性。考虑到实际网络状况的动态的属性,一次训练所得规则不能一直代表网络当前的网络状况,该方法将每条分类后的测试数据连同其分类结果添加到训练集中并再次训练,实时训练产生的新规则并更新到关联规则库中。
为了验证Apriori-index算法相比原始的Apriori算法应用于网络入侵检测系统的优越性,我们进行以下对比验证实验。实验环境:一台PC机。CPU型号为InterCorei7-47703.4GHz,内存8G,1T硬盘,具备VisualStudio2013的软件环境。实验数据:按照10%KDDCup99数据集中网络连接类型的不同比例,从中随机选取,保证每种连接类型的所取数据量最多不超过4000条,共选取36854条,然后使用交叉检验的方法,选取其中的60%作为训练集数据,另外40%作为测试集数据。利用改进前后的Apriroi算法进行5次实验。实验结果如表3所示:
表3利用国际标准数据集10%KDDCup99对改进前后Apriori算法验证结果对比
实验结果表明:本发明的入侵检测方法相比原始的Apriori算法在执行结果的准确度上有了很大的提升,在执行时间方面有了极大的改善。

Claims (5)

1.一种基于关联规则分类的网络入侵检测方法包括以下步骤:
第1步、对国际标准数据集10%KDDCup99预处理,并将预处理后的数据集分成训练集和测试集两部分数据;
第2步、采用改进的Apriori算法(Apriori-index)对选取的训练集中的网络连接数据进行训练,提取到关联规则,将关联规则存放到关联规则库中,同时将关联规则库中的关联规则展示出来;
第3步、测试集中的每条网络连接数据逐条匹配关联规则库中关联规则,根据不同关联规则的条件长度和网络连接类型分别计算权值,找出最大权值所对应的网络连接类型即为最终分类得到的结果;
第4步、保存第3步中分类结果,将上述分类过程和分类得到的结果展示出来;同时为保证该方法良好的自学习特性,测试集的数据在根据关联规则分类得到具体的网络连接类型后,训练集数据连同对应的网络连接类型重新加入到训练集数据中,为后续关联规则提取提供新的训练集数据源,保证关联规则的动态更新。
2.根据权利要求1所述的基于关联规则分类的网络入侵检测方法,其特征在于:第1步中数据集预处理的方法是:
第1.1步、为每列数据添加位置参数;因为10%KDDCup99数据集中有大量相同的数据,数据集中处于不同列的数据有不同的含义,而原始的Apriori算法在处理数据集中不同列的相同数据项时将他们视为同样的数据,因此直接使用原始的Apriori算法处理数据集会影响提取规则速度和分类结果的准确度;为避免出现以上问题,需要在数据预处理阶段为每条网络连接数据的每个数据项添加位置参数;
第1.2步、采用交叉验证的方法选取经过第1.1步预处理后的10%KDDCup99数据集中60%的连接数据作为训练集,剩余的40%的连接数据作为测试集;由于改进的Apriori算法能够处理字符类型数据,同时数值类型的数据也能够视为字符类型数据,所以无需对网络连接数据中的字符类型数据进行数值化和归一化处理。
3.根据权利要求1所述的基于关联规则分类的网络入侵检测方法,其特征在于:第2步所述采用Apriori-index算法提取关联规则的方法是:
第2.1步、初始化最小支持度阈值Min_Support,最小置信度阈值Min_Confidence;通过查阅文献资料和实验验证,最小支持度阈值和最小置信度阈值分别设定为25%和78.5%能够获得较高的分类准确度;初始化最小支持度阈值Min_Support=25%,最小置信度阈值Min_Confidence=78.5%;
第2.2步、找出所有的频繁项集;遍历训练集中的所有的网络连接数据,统计每个属性值对应的连接类型及其出现的频度,形成候选项集合C1;在此基础上,根据支持度公式
计算支持度;其中Occur(X)表示训练集中所有网络连接数据中包含频繁项{X}的数量,Count(D)表示训练集{D}中所有网络连接的数量;在候选项集合C1中删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁1-项集L1;然后对于每种网络连接类型,连接L1中的不同元素构成候选项集合C2,再次遍历训练集数据,根据支持度公式计算C2中的每个候选项的支持度,删除候选项集合C2中支持度低于最小支持度阈值Min_Support的候选项,剩余候选项形成频繁2-项集L2;按照网络连接类型,再连接L2中的不同元素构成候选项集合C3,再次遍历训练集数据,计算C3中的每个候选项的支持度,删除支持度低于最小支持度阈值Min_Support的候选项,剩余的候选项形成频繁3-项集L3;重复进行以上的遍历、删除和连接的步骤,直到没有新的候选项产生,所有的频繁项集(L1,L2,...,Ln)都已搜寻得到;其中,连接步骤和删除步骤分别严格满足连接定理和频繁子集定理,即:若两个(k-1)-项集的前(k-2)个项相同,而最后一个项不同,则证明它们可连接得到k-项集;若k-项集任意一个子集不是频繁项集,则该k-项集也不是频繁项集;
第2.3步、由频繁项集产生关联规则;对于第2.2步中得到的频繁项集(L1,L2,...,Ln),假设频繁项集Li中每个频繁项li的网络连接类型用tj表示;如果(li-tj)→tj的置信度大于最小置信度阈值Min_Confidence,则输出(li-tj)→tj;置信度的计算根据置信度计算公式:
其中Support(A∪B)和Support(A)分别表示频繁项{A∪B}和{A}的支持度;即置信度公式可化为:
找到的所有满足要求的(li-tj)→tj,即为关联规则;
第2.4步、将第2.3步中得到的关联规则添加到关联规则库中,作为对测试集中未知类型的网络连接数据测试分类的判断依据;
第2.5步、将关联规则库中的关联规则展示出来;10%KDDCup99数据集的数据量较大,经过Apriori-index算法训练得到的关联规则非常多,关联规则在页面内显示会比较混乱,所以关联规则展示页面进行适当的缩放,使关联规则清晰展示。
4.根据权利要求1所述的基于关联规则分类的网络入侵检测方法,其特征在于:第3步所述的确定最终网络连接类型的方法是:
第3.1步、读取测试集数据,对测试集中的每条网络连接数据按照关联规则分类,统计分类结果;10%KDDCup99数据集中每条网络连接数据有41个属性数据项和1个连接类型数据项,第2步中提取到的关联规则的条件部分包含有多个属性数据项,测试集中的每条未知类型的网络连接数据按照提取的关联规则分类时,会有多条关联规则与之对应,所以按关联规则分类需经过以下过程:
第3.1.1步、对读取到的测试集中的一条连接数据,遍历整个关联规则库,统计并记录匹配的关联规则Ri(例如:(li-tj)→tj)中条件部分(li-tj)的长度,即统计关联规则Ri条件部分(li-tj)包含的属性数据项的数量Lengthi
第3.1.2步、分别计算匹配的n条规则中对应的网络连接类型部分tj的权值;按照Apriori-index算法权值计算公式:
计算该条未知网络连接类型的测试数据在经过关联规则库中所有关联规则比对后匹配的第j种网络连接类型tj的权值;这主要是由于关联规则条件部分(li-tj)的长度Lengthi越大,分类准确度越高,这样做能够同其他关联规则加以区分,提高分类结果的准确度;
第3.2步、输出分类结果:网络连接类型t;比较所有的权值,从中找出权值最高的Weight(t),将分类结果即网络连接类型t输出。
5.根据权利要求1所述的基于关联规则分类的网络入侵检测方法,其特征在于:第4步所述的展示分类过程和分类后的网络连接类型以及向训练集中添加分类后的测试数据方法是:
第4.1步、测试数据展示;为将每条测试数据从读取直至分类完成过程展示出来,将每条测试数据用运动的图形代表,图形的运动轨迹和颜色变化代表测试数据的分类过程和分类得到的连接类型;
第4.2步、将测试过的网络连接数据与对应的网络连接类型添加到训练集中,保证该方法能够自学习;考虑到实际网络状况的动态特性,一次训练所得的关联规则不能始终代表网络的当前状况,在本方法中将每条分类后的测试数据连同其网络连接类型加入到训练集中并再次训练,实时训练产生新规则并更新到关联规则库中。
CN201510753693.6A 2015-11-05 2015-11-05 一种基于关联规则分类的网络入侵检测方法 Active CN105306475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510753693.6A CN105306475B (zh) 2015-11-05 2015-11-05 一种基于关联规则分类的网络入侵检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510753693.6A CN105306475B (zh) 2015-11-05 2015-11-05 一种基于关联规则分类的网络入侵检测方法

Publications (2)

Publication Number Publication Date
CN105306475A true CN105306475A (zh) 2016-02-03
CN105306475B CN105306475B (zh) 2018-06-29

Family

ID=55203226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510753693.6A Active CN105306475B (zh) 2015-11-05 2015-11-05 一种基于关联规则分类的网络入侵检测方法

Country Status (1)

Country Link
CN (1) CN105306475B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302450A (zh) * 2016-08-15 2017-01-04 广州华多网络科技有限公司 一种基于ddos攻击中恶意地址的检测方法及装置
CN107291716A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 一种链路数据校验方法及装置
CN107291733A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种规则匹配方法及装置
CN107302474A (zh) * 2017-07-04 2017-10-27 四川无声信息技术有限公司 网络数据应用的特征提取方法及装置
CN107704764A (zh) * 2017-10-18 2018-02-16 广州华多网络科技有限公司 构建训练集的方法、装置、设备及人机识别的方法
CN107730037A (zh) * 2017-09-30 2018-02-23 贵州电网有限责任公司 一种基于关联规则算法的avc影响因子分析方法
CN107948147A (zh) * 2017-08-31 2018-04-20 上海财经大学 网络连接数据分类方法
CN107944591A (zh) * 2017-05-22 2018-04-20 国家电网公司西南分部 基于电力调度通用数据对象的重复对象模糊检验优化算法
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN109286622A (zh) * 2018-09-26 2019-01-29 天津理工大学 一种基于学习规则集的网络入侵检测方法
CN110856178A (zh) * 2019-11-05 2020-02-28 天津大学 一种基于无线网络物理层iq信号的行为识别方法
CN111563647A (zh) * 2020-03-26 2020-08-21 国网福建省电力有限公司信息通信分公司 基于关联规则和dea的电力信息系统检测方法及系统
CN112487021A (zh) * 2020-11-26 2021-03-12 中国人寿保险股份有限公司 业务数据的关联分析方法、装置及设备
CN112567370A (zh) * 2018-08-09 2021-03-26 微软技术许可有限责任公司 针对计算机资源的自动访问控制策略生成
CN112714462A (zh) * 2020-12-25 2021-04-27 南京邮电大学 基于改进Apriori算法的电力无线专网特定网络攻击监测方法
CN113282686A (zh) * 2021-06-03 2021-08-20 光大科技有限公司 一种不平衡样本的关联规则确定方法及装置
CN113342855A (zh) * 2021-06-24 2021-09-03 汇付天下有限公司 一种基于大数据的数据匹配方法及装置
CN113839916A (zh) * 2020-06-23 2021-12-24 天津科技大学 一种信息分类模糊模型的网络入侵检测分类方法
CN113949530A (zh) * 2021-09-10 2022-01-18 上海电力大学 基于dfs和关联规则算法的入侵检测方法及系统
CN117093951A (zh) * 2023-10-16 2023-11-21 北京安天网络安全技术有限公司 一种威胁情报合并方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612135A (zh) * 2003-10-30 2005-05-04 中联绿盟信息技术(北京)有限公司 入侵检测(保护)产品与防火墙产品中的协议识别技术
CN102360408A (zh) * 2011-09-28 2012-02-22 国家计算机网络与信息安全管理中心 恶意代码的检测方法及其系统
CN103870751A (zh) * 2012-12-18 2014-06-18 中国移动通信集团山东有限公司 入侵检测方法及系统
CN104539484A (zh) * 2014-12-31 2015-04-22 深圳先进技术研究院 一种动态评估网络连接可信度的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612135A (zh) * 2003-10-30 2005-05-04 中联绿盟信息技术(北京)有限公司 入侵检测(保护)产品与防火墙产品中的协议识别技术
CN102360408A (zh) * 2011-09-28 2012-02-22 国家计算机网络与信息安全管理中心 恶意代码的检测方法及其系统
CN103870751A (zh) * 2012-12-18 2014-06-18 中国移动通信集团山东有限公司 入侵检测方法及系统
CN104539484A (zh) * 2014-12-31 2015-04-22 深圳先进技术研究院 一种动态评估网络连接可信度的方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SURENDRA KUMAR CHADOKAR: "《Optimizing network traffic by generating association rules using hybrid apriori-genetic algorithm》", 《IEEE》 *
肖桂艳,周满元: "《Apriori算法在基于网络入侵检测系统中的应用》", 《信息安全》 *
蔡伟贤: "《关联分析在入侵检测中的研究与应用》", 《中国优秀硕士论文全文库》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291716A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 一种链路数据校验方法及装置
CN107291716B (zh) * 2016-03-30 2020-07-21 阿里巴巴集团控股有限公司 一种链路数据校验方法及装置
CN107291733A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种规则匹配方法及装置
CN107291733B (zh) * 2016-03-31 2020-09-11 阿里巴巴集团控股有限公司 一种规则匹配方法及装置
CN106302450B (zh) * 2016-08-15 2019-08-30 广州华多网络科技有限公司 一种基于ddos攻击中恶意地址的检测方法及装置
CN106302450A (zh) * 2016-08-15 2017-01-04 广州华多网络科技有限公司 一种基于ddos攻击中恶意地址的检测方法及装置
CN107944591A (zh) * 2017-05-22 2018-04-20 国家电网公司西南分部 基于电力调度通用数据对象的重复对象模糊检验优化算法
CN107302474A (zh) * 2017-07-04 2017-10-27 四川无声信息技术有限公司 网络数据应用的特征提取方法及装置
CN107302474B (zh) * 2017-07-04 2020-02-04 四川无声信息技术有限公司 网络数据应用的特征提取方法及装置
CN107948147A (zh) * 2017-08-31 2018-04-20 上海财经大学 网络连接数据分类方法
CN107948147B (zh) * 2017-08-31 2020-01-17 上海财经大学 网络连接数据分类方法
CN107730037B (zh) * 2017-09-30 2021-08-03 贵州电网有限责任公司 一种基于关联规则算法的avc影响因子分析方法
CN107730037A (zh) * 2017-09-30 2018-02-23 贵州电网有限责任公司 一种基于关联规则算法的avc影响因子分析方法
CN107704764A (zh) * 2017-10-18 2018-02-16 广州华多网络科技有限公司 构建训练集的方法、装置、设备及人机识别的方法
US11184359B2 (en) 2018-08-09 2021-11-23 Microsoft Technology Licensing, Llc Automated access control policy generation for computer resources
CN112567370A (zh) * 2018-08-09 2021-03-26 微软技术许可有限责任公司 针对计算机资源的自动访问控制策略生成
CN112567370B (zh) * 2018-08-09 2024-06-28 微软技术许可有限责任公司 针对计算机资源的自动访问控制策略生成的方法和系统
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN109286622B (zh) * 2018-09-26 2021-04-20 天津理工大学 一种基于学习规则集的网络入侵检测方法
CN109286622A (zh) * 2018-09-26 2019-01-29 天津理工大学 一种基于学习规则集的网络入侵检测方法
CN110856178A (zh) * 2019-11-05 2020-02-28 天津大学 一种基于无线网络物理层iq信号的行为识别方法
CN111563647A (zh) * 2020-03-26 2020-08-21 国网福建省电力有限公司信息通信分公司 基于关联规则和dea的电力信息系统检测方法及系统
CN113839916A (zh) * 2020-06-23 2021-12-24 天津科技大学 一种信息分类模糊模型的网络入侵检测分类方法
CN113839916B (zh) * 2020-06-23 2024-03-01 天津科技大学 一种信息分类模糊模型的网络入侵检测分类方法
CN112487021A (zh) * 2020-11-26 2021-03-12 中国人寿保险股份有限公司 业务数据的关联分析方法、装置及设备
CN112487021B (zh) * 2020-11-26 2024-04-30 中国人寿保险股份有限公司 业务数据的关联分析方法、装置及设备
CN112714462A (zh) * 2020-12-25 2021-04-27 南京邮电大学 基于改进Apriori算法的电力无线专网特定网络攻击监测方法
CN113282686B (zh) * 2021-06-03 2023-11-07 光大科技有限公司 一种不平衡样本的关联规则确定方法及装置
CN113282686A (zh) * 2021-06-03 2021-08-20 光大科技有限公司 一种不平衡样本的关联规则确定方法及装置
CN113342855A (zh) * 2021-06-24 2021-09-03 汇付天下有限公司 一种基于大数据的数据匹配方法及装置
CN113949530A (zh) * 2021-09-10 2022-01-18 上海电力大学 基于dfs和关联规则算法的入侵检测方法及系统
CN117093951A (zh) * 2023-10-16 2023-11-21 北京安天网络安全技术有限公司 一种威胁情报合并方法、装置、电子设备及存储介质
CN117093951B (zh) * 2023-10-16 2024-01-26 北京安天网络安全技术有限公司 一种威胁情报合并方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN105306475B (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN105306475A (zh) 一种基于关联规则分类的网络入侵检测方法
Mitrović et al. Networks and emotion-driven user communities at popular blogs
CN104281674B (zh) 一种基于集聚系数的自适应聚类方法及系统
Lee Unsupervised and supervised learning to evaluate event relatedness based on content mining from social-media streams
CN105868773A (zh) 一种基于层次随机森林的多标签分类方法
CN103902988A (zh) 一种基于Modular积图与最大团的草图形状匹配方法
CN102291392A (zh) 一种基于Bagging算法的复合式入侵检测方法
CN109493246A (zh) 一种动态社交网络社区演化分析方法及其系统
CN109522416A (zh) 一种金融风险控制知识图谱的构建方法
CN105320764A (zh) 一种基于增量慢特征的3d模型检索方法及其检索装置
Sun et al. Opinion spam detection based on heterogeneous information network
CN105117771A (zh) 一种基于关联规则有向无环图的农机故障识别方法
Guo et al. A vertical format algorithm for mining frequent item sets
CN103136540A (zh) 一种基于隐结构推理的行为识别方法
CN105447026A (zh) 基于多视角图中最小权重连通决定集的Web信息提取方法
CN109286622A (zh) 一种基于学习规则集的网络入侵检测方法
CN105631462A (zh) 结合置信度和贡献度的基于时空上下文的行为识别方法
CN112001424A (zh) 基于对抗训练的恶意软件开放集家族分类方法和装置
CN108921213B (zh) 一种实体分类模型训练方法及装置
Adedoyin-Olowe et al. Extraction of unexpected rules from twitter hashtags and its application to sport events
CN109492677A (zh) 基于贝叶斯理论的时变网络链路预测方法
Lee et al. Mining qualitative patterns in spatial cluster analysis
Hsieh et al. Who’s the best charades player? mining iconic movement of semantic concepts
Rozario et al. Community detection in social network using temporal data
Zhang et al. Artificial Intelligence‐Based Joint Movement Estimation Method for Football Players in Sports Training

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant