CN113591915B - 基于半监督学习和单分类支持向量机的异常流量识别方法 - Google Patents

基于半监督学习和单分类支持向量机的异常流量识别方法 Download PDF

Info

Publication number
CN113591915B
CN113591915B CN202110725480.8A CN202110725480A CN113591915B CN 113591915 B CN113591915 B CN 113591915B CN 202110725480 A CN202110725480 A CN 202110725480A CN 113591915 B CN113591915 B CN 113591915B
Authority
CN
China
Prior art keywords
data
model
sample
abnormal
semi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110725480.8A
Other languages
English (en)
Other versions
CN113591915A (zh
Inventor
石凯
张锋军
牛作元
李庆华
许杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 30 Research Institute
Original Assignee
CETC 30 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 30 Research Institute filed Critical CETC 30 Research Institute
Priority to CN202110725480.8A priority Critical patent/CN113591915B/zh
Publication of CN113591915A publication Critical patent/CN113591915A/zh
Application granted granted Critical
Publication of CN113591915B publication Critical patent/CN113591915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于半监督学习和单分类支持向量机的异常流量识别方法,包括以下步骤:1.采集网络流量数据并提取数据描述特征;2.利用采集的网络流量数据经过单分类支持向量机算法,生成异常流量识别的初始化模型;3.将网络流量数据输入样本筛选策略,样本筛选策略选用最近边界策略及其变形;4.根据样本筛选策略选择典型网络流量并进行标注,得到典型的已标注样本;5.将典型的已标注样本输入异常流量识别的初始化模型中,结合半监督学习思想进行模型的迭代优化以得到异常流量识别模型;6.将网络流量数据输入异常流量识别模型中,进行异常流量的识别。本发明能够为大量不平衡流量数据提供准确、快速建模的方法以识别已知和未知攻击。

Description

基于半监督学习和单分类支持向量机的异常流量识别方法
技术领域
本发明涉及电数字数据处理技术领域,尤其涉及一种基于半监督学习和单分类支持向量机的异常流量识别方法。
背景技术
随着互联网的飞速发展和计算机应用、手机软件的迅速扩张以及云计算、大数据、人工智能、5G等新技术的诞生,异常流量识别传统方法的准确性和有效性已经无法满足现今大数据时代的需求,而结合机器学习算法的异常流量识别技术日趋成为主流。目前基于机器学习的异常流量识别的主流技术有以下5种:基于贝叶斯网络的异常流量识别技术、基于决策树的异常流量识别技术、基于KNN的异常流量识别技术、基于AdaBoost的异常流量识别技术、基于支持向量机的异常流量识别技术。异常流量识别技术依托于机器学习模型的特性而产生不同的分类效果,这些机器学习模型具有以下技术特点和优缺点。
(1)方法一:基于贝叶斯网络的异常流量识别技术
贝叶斯网络又名信念网络(Belif Network),其核心是条件概率,本质上是利用先验知识,确立随机变量(特征和类别)之间的关联约束关系,最终达成方便求取条件概率的目的。其优点在于,训练大规模或超大规模流量数据时,由于其针对特征概率进行数学运算,所以该方法计算并生成模型的速度最快。但是,它无法处理多个特征组合所产生的变化结果。
(2)方法二:基于决策树的异常流量识别技术
该方法采用树型结构,使用层层推理来实现网络流量的最终分类。其优点在于,易于实现、可解释性强,并且完全符合人类的直观思维,应用广泛,也能在相对短时间内对大规模网络流量数据做出可行且效果良好的结果。但是,其容易发生过拟合,并且会忽略流量数据集属性间的相互关联,而且计算的信息增益会不可逆转的偏向数值比较多的特征。
(3)方法三:基于KNN的异常流量识别技术
该方法的思路是,根据最邻近的K个已标识过的网络流量数据,通过多数表决等方式预测新样本的类别。其优点在于,无需参数估计和训练,十分适合多分类问题。但是,当样本不平衡时,如一个类的样本容量很大,而其它类的样本容量很小,加入的新样本可能导致流量分类结果偏向于大容量的分类。并且网络流量的数据量较大时,内存开销大,模型构建的速度较慢,而且对高维网络流量数据的分类表现不佳。
(4)方法四:基于AdaBoost的异常流量识别技术
该方法是一种由原始网络流量数据集生成不同弱学习器的迭代算法,然后根据结合策略,如投票策略,将这些弱生成器结合为强学习器。其优点在于,作为分类器其精度很高,不容易发生过拟合,并且可以灵活的使用各种回归分类模型来构建弱学习器。但是,其对噪声数据敏感,噪声数据在迭代过程中会获得较高的权重,从而对强学习器的预测准确性造成很大的影响。
(5)方法五:基于支持向量机的异常流量识别技术
该方法将网络流量数据样本作为向量映射到高维空间中,在这个空间中建立一个间隔超平面分隔建立的数据空间,超平面与分隔开的数据空间的距离最大化,而分隔开的数据空间为不同的流量类别,因此也被称为最大边缘区分类器。其优点在于,可以通过核函数向高维空间映射,所以可以用作高维流量分类,并且可以解决非线性分类和多特征组合分类的问题,分类思想简单而有效。但是,该方法对缺失数据敏感,数据不平衡或者存在异常样本时,模型预测的准确性将受到影响,并且这种监督学习的方式依赖大量已有标记的纯净数据。
发明内容
为了解决上述问题,本发明提出一种基于半监督学习和单分类支持向量机的异常流量识别方法,旨在解决如下技术问题:
(1)若采用基于传统机器学习方法,当正常流量远大于异常流量或者没有异常流量时,导致无法生成分类模型或者使用生成的模型产生的预测结果不准确;
(2)以异常流量为载体的未知攻击手段难以识别;
(3)已有标记的网络数据的数据量较少、分布不均匀时,导致生成的分类模型不准确。
本发明采用的技术方案如下:
一种基于半监督学习和单分类支持向量机的异常流量识别方法,包括以下步骤:
S1.采集网络流量数据并提取数据描述特征;
S2.利用采集的网络流量数据经过单分类支持向量机算法,生成异常流量识别的初始化模型:通过非线性变换将目标样本映射到一个高维特征空间,并在该空间建立一个封闭而紧凑的包含所有正常数据的最优超球体,通过该超球体将网络数据流量数据划分为正常流量和异常流量;
S3.将网络流量数据输入样本筛选策略,样本筛选策略选用最近边界策略及其变形;
S4.根据样本筛选策略选择典型网络流量,并进行标注,得到典型的已标注样本;
S5.将典型的已标注样本输入异常流量识别的初始化模型中,结合半监督学习思想进行模型的迭代优化以得到异常流量识别模型;
S6.将网络流量数据输入异常流量识别模型中,进行异常流量的识别以区分开异常流量和正常流量。
进一步的,步骤S2包括:
通过非线映射
Figure BDA0003137510640000041
将目标样本xi映射到一个高维特征空间
Figure BDA0003137510640000042
并在该空间建立一个封闭而紧凑的超球体,原始数据经过非线性变换后,在高维特征空间
Figure BDA0003137510640000043
计算得到一个以c为中心、R为半径的包含所有正常数据的超球面,数据样本的异常程度通过计算其与球心c的距离来获取,给定数据集
Figure BDA0003137510640000044
xi∈RN,单分类支持向量机模型的初始化为:
Figure BDA0003137510640000045
若实例落入超球面内即对应的评价函数值f(x)<0,则被判定为常规正常流量;若实例落在超球面外则评价函数值f(x)>0,被判别为异常流量。
进一步的,步骤S3包括:
选用距离分类边界最近的样本进行标注,其核心公式如下:
Figure BDA0003137510640000051
此样本筛选策略结合初始化模型的参数,筛选出低置信度的样本,确定其类型,以提高数据集的纯净程度和模型的检测精确度;并筛选出有代表性样本,使样本尽可能覆盖所有数据区域,以提高模型的完整性,从而筛选出需要标注的典型样本。
进一步的,步骤S5中:
训练样本集包括有标签样本和无标签样本,给定m个有标签样本
Figure BDA0003137510640000052
其中xi∈RN,yi∈{-1,1},其中1代表正常数据,表示标签为-1代表异常数据表示标签为;并给定n-m个无标签样本
Figure BDA0003137510640000053
且m<<n;半监督单分类支持向量机通过优化参数R,C和ε使下面函数结果最小化:
Figure BDA0003137510640000054
Figure BDA0003137510640000055
Figure BDA0003137510640000056
Figure BDA0003137510640000057
其中,γ≥0为两类标记数据边缘之间的距离,m1表示标签为1的样本,m2表示标签为-1的样本,C1、C2、C3分别为无标记数据、正例数据和负例数据的权衡参数,εi、εj、εk分别均为在优化问题的约束中引入的松弛变量,其取值与样本和球体中心在特征空间的距离成反比,即距离球心较近的样本被错误分类的代价较大。
进一步的,权衡参数C1反映无标记数据的约束作用,若C1取值过大,则模型中标记数据的作用会减弱,直至退化为无监督模型;反之若C1取值过小,则模型中无标记数据作用会减弱,直至退化为只包含少量标记数据的有监督模型。
进一步的,权衡参数C2、C3反映标记数据的类型引导作用,对于C2、C3,根据具体情况下对误报率和漏报率的要求进行选择。
进一步的,由于在异常检测中,将异常数据误判的代价高于正常数据,因此选择C2<C3;将标记数据误判的代价高于无标记数据,因此选择C1<C2<C3
进一步的,步骤S5中,使用的半监督学习思想包括自训练法、期望最大法、多视图法和/或基于图的方法。
本发明的有益效果在于:
(1)本发明利用单分类支持向量机的分类特点,以无监督方式完成模型的初始化过程,经过非线性变换将目标样本映射到一个高维特征空间,并在该空间建立一个封闭而紧凑的包含大多数正常数据的最优超球体,通过该超球体可以将网络数据流量划分为正常流量和异常流量,异常流量可以包含已知的攻击和未知的攻击,在区分异常流量和正常流量的同时,解决了无法识别以异常流量为载体的未知攻击的问题。
(2)本发明提供了一种采用单分类支持向量机的方法对正常流量进行,该方法不仅具备传统支持向量机建模速度快的特点,还同样适用于大量数据的准确建模。此外,在正常流量的数据量较大,而异常流量的数据量较小这种数据不平衡的情况下,也能准确建立模型,从而达到识别网络异常数据的目的。
(3)本发明引入了半监督学习的思想,以较低的标记代价提升单分类支持向量机模型的识别准确性。传统方法依赖高质量的纯净数据集完成正常流量轮廓的建立,然而在实际应用中,纯净数据集难以获取,从原始数据集中挑选和标记数据费时费力,因此该方法实现了以较小标记代价、较低的人工标记成本,提高了异常流量识别模型的性能。
综上所述,本发明能够为大量不平衡流量数据提供准确、快速建模的方法,以识别已知和未知攻击。利用网络空间中任意采集的真实数据,通过单分类支持向量机算法快速高效的建立适用性强可扩展更新的异常识别“超球体”;融合半监督学习的思想,在减轻人工标注数据的工作量的同时,有效提高了模型的检测准确度。此外,本发明采用了易于实现的、相对成熟的技术和算法。本发明可以适用于网络空间中从流量数据的主动选择标注、到建立识别模型,达到识别所有异常流量的目的,是现今防范种类繁多的网络攻击的关键一步。
附图说明
图1是本发明实施例1中异常流量识别方法的流程图;
图2是本发明实施例1中模型的迭代优化流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现说明本发明的具体实施方式。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,一种基于半监督学习和单分类支持向量机的异常流量识别方法,包括以下步骤:
S1.采集网络流量数据并提取数据描述特征;
S2.利用采集的网络流量数据经过单分类支持向量机算法,生成异常流量识别的初始化模型:通过非线性变换将目标样本映射到一个高维特征空间,并在该空间建立一个封闭而紧凑的包含所有正常数据的最优超球体,通过该超球体将网络数据流量数据划分为正常流量和异常流量;
S3.将网络流量数据输入样本筛选策略,样本筛选策略选用最近边界策略及其变形;
S4.根据样本筛选策略选择典型网络流量,并进行标注,得到典型的已标注样本;
S5.如图2所示,将典型的已标注样本输入异常流量识别的初始化模型中,结合半监督学习思想进行模型的迭代优化以得到异常流量识别模型;优选的,使用的半监督学习思想包括自训练法、期望最大法、多视图法和/或基于图的方法。
S6.将网络流量数据输入异常流量识别模型中,进行异常流量的识别以区分开异常流量和正常流量。
优选的,步骤S2中,通过非线映射
Figure BDA0003137510640000091
将目标样本xi映射到一个高维特征空间
Figure BDA0003137510640000092
并在该空间建立一个封闭而紧凑的超球体,原始数据经过非线性变换后,在高维特征空间
Figure BDA0003137510640000093
计算得到一个以c为中心、R为半径的包含所有正常数据的超球面,数据样本的异常程度通过计算其与球心c的距离来获取,给定数据集
Figure BDA0003137510640000094
xi∈RN,单分类支持向量机模型的初始化为:
Figure BDA0003137510640000095
若实例落入超球面内即对应的评价函数值f(x)<0,则被判定为常规正常流量;若实例落在超球面外则评价函数值f(x)>0,被判别为异常流量。
优选的,步骤S3中,选用距离分类边界最近的样本进行标注,其核心公式如下:
Figure BDA0003137510640000096
此样本筛选策略结合初始化模型的参数,筛选出低置信度的样本,确定其类型,以提高数据集的纯净程度和模型的检测精确度;并筛选出有代表性样本,使样本尽可能覆盖所有数据区域,以提高模型的完整性,从而筛选出需要标注的典型样本。
优选的,涉及到的半监督支持向量机的基本思想和构成形式中,训练样本集包括有标签样本和无标签样本,给定m个有标签样本
Figure BDA0003137510640000097
其中xi∈RN,yi∈{-1,1},其中1代表正常数据,表示标签为-1代表异常数据表示标签为;并给定n-m个无标签样本
Figure BDA0003137510640000101
且m<<n;半监督单分类支持向量机通过优化参数R,C和ε使下面函数结果最小化:
Figure BDA0003137510640000102
Figure BDA0003137510640000103
Figure BDA0003137510640000104
Figure BDA0003137510640000105
其中,γ≥0为两类标记数据边缘之间的距离,m1表示标签为1的样本,m2表示标签为-1的样本,C1、C2、C3分别为无标记数据、正例数据和负例数据的权衡参数,εi、εj、εk分别均为在优化问题的约束中引入的松弛变量,其取值与样本和球体中心在特征空间的距离成反比,即距离球心较近的样本被错误分类的代价较大。
具体的,权衡参数C1反映无标记数据的约束作用,若C1取值过大,则模型中标记数据的作用会减弱,直至退化为无监督模型;反之若C1取值过小,则模型中无标记数据作用会减弱,直至退化为只包含少量标记数据的有监督模型。权衡参数C2、C3反映标记数据的类型引导作用,对于C2、C3,根据具体情况下对误报率和漏报率的要求进行选择。
优选的,由于在异常检测中,将异常数据误判的代价高于正常数据,因此选择C2<C3;将标记数据误判的代价高于无标记数据,因此选择C1<C2<C3
本实施例的异常流量识别方法能够为大量不平衡流量数据提供准确、快速建模的方法,以识别已知和未知攻击。利用网络空间中任意采集的真实数据,通过单分类支持向量机算法快速高效的建立适用性强可扩展更新的异常识别“超球体”。融合了半监督学习的思想,在减轻人工标注数据的工作量的同时,有效提高了模型的检测准确度。此外,本异常流量识别方法采用了易于实现的、相对成熟的技术和算法。本异常流量识别方法可以适用于网络空间中从流量数据的主动选择标注、到建立识别模型,达到识别所有异常流量的目的,是现今防范种类繁多的网络攻击的关键一步。
实施例2
本实施例在实施例1的基础上:
本实施例提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现实施例1的基于半监督学习和单分类支持向量机的异常流量识别方法的步骤。
其中,计算机程序可以为源代码形式、对象代码形式、可执行文件或者某些中间形式等。
实施例3
本实施例在实施例1的基础上:
本实施例提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现实施例1的基于半监督学习和单分类支持向量机的异常流量识别方法的步骤。
其中,计算机程序可以为源代码形式、对象代码形式、可执行文件或者某些中间形式等。存储介质包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM)、随机存取存储器(RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,存储介质不包括电载波信号和电信信号。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
需要说明的是,对于前述的方法实施例,为了简便描述,故将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

Claims (5)

1.一种基于半监督学习和单分类支持向量机的异常流量识别方法,其特征在于,包括以下步骤:
S1. 采集网络流量数据并提取数据描述特征;
S2. 利用采集的网络流量数据经过单分类支持向量机算法,生成异常流量识别的初始化模型:通过非线性变换将目标样本映射到一个高维特征空间,并在该空间建立一个封闭而紧凑的包含所有正常数据的最优超球体,通过该超球体将网络数据流量数据划分为正常流量和异常流量;
S3. 将网络流量数据输入样本筛选策略,样本筛选策略选用最近边界策略及其变形;
S4. 根据样本筛选策略选择典型网络流量,并进行标注,得到典型的已标注样本;
S5. 将典型的已标注样本输入异常流量识别的初始化模型中,结合半监督学习思想进行模型的迭代优化以得到异常流量识别模型;
S6. 将网络流量数据输入异常流量识别模型中,进行异常流量的识别以区分开异常流量和正常流量;
步骤S2包括:
通过非线映射
Figure QLYQS_1
将目标样本
Figure QLYQS_2
映射到一个高维特征空间
Figure QLYQS_3
,并在该空间建立一个封闭而紧凑的超球体,原始数据经过非线性变换后,在高维特征空间
Figure QLYQS_4
计算得到一个以c为中心、R为半径的包含所有正常数据的超球面,数据样本的异常程度通过计算其与球心c的距离来获取,给定数据集
Figure QLYQS_5
,单分类支持向量机模型的初始化为:
Figure QLYQS_6
若实例落入超球面内即对应的评价函数值
Figure QLYQS_7
,则被判定为常规正常流量;若实例落在超球面外则评价函数值
Figure QLYQS_8
,被判别为异常流量;
步骤S3包括:
选用距离分类边界最近的样本进行标注,其核心公式如下:
Figure QLYQS_9
此样本筛选策略结合初始化模型的参数,筛选出低置信度的样本,确定其类型,以提高数据集的纯净程度和模型的检测精确度;并筛选出有代表性样本,使样本尽可能覆盖所有数据区域,以提高模型的完整性,从而筛选出需要标注的典型样本;
步骤S5中:
训练样本集包括有标签样本和无标签样本,给定
Figure QLYQS_10
个有标签样本
Figure QLYQS_11
,其中
Figure QLYQS_12
,其中1代表正常数据,-1代表异常数据;并给定
Figure QLYQS_14
个无标签样本
Figure QLYQS_15
;半监督单分类支持向量机通过优化参数
Figure QLYQS_16
使下面函数结果最小化:
Figure QLYQS_17
Figure QLYQS_18
Figure QLYQS_19
Figure QLYQS_20
其中,
Figure QLYQS_21
为两类标记数据边缘之间的距离,
Figure QLYQS_22
表示标签为1的样本,
Figure QLYQS_23
表示标签为-1的样本,
Figure QLYQS_24
分别为无标记数据、正例数据和负例数据的权衡参数,
Figure QLYQS_25
分别均为在优化问题的约束中引入的松弛变量,其取值与样本和球体中心在特征空间的距离成反比,即距离球心较近的样本被错误分类的代价较大。
2.根据权利要求1所述的基于半监督学习和单分类支持向量机的异常流量识别方法,其特征在于,权衡参数
Figure QLYQS_26
反映无标记数据的约束作用,若
Figure QLYQS_27
取值过大,则模型中标记数据的作用会减弱,直至退化为无监督模型;反之若
Figure QLYQS_28
取值过小,则模型中无标记数据作用会减弱,直至退化为只包含少量标记数据的有监督模型。
3.根据权利要求1所述的基于半监督学习和单分类支持向量机的异常流量识别方法,其特征在于,权衡参数
Figure QLYQS_29
反映标记数据的类型引导作用,对于
Figure QLYQS_30
,根据具体情况下对误报率和漏报率的要求进行选择。
4.根据权利要求3所述的基于半监督学习和单分类支持向量机的异常流量识别方法,其特征在于,由于在异常检测中,将异常数据误判的代价高于正常数据,因此选择
Figure QLYQS_31
;将标记数据误判的代价高于无标记数据,因此选择
Figure QLYQS_32
5.根据权利要求1-4任一项所述的基于半监督学习和单分类支持向量机的异常流量识别方法,其特征在于,步骤S5中,使用的半监督学习思想包括自训练法、期望最大法、多视图法和/或基于图的方法。
CN202110725480.8A 2021-06-29 2021-06-29 基于半监督学习和单分类支持向量机的异常流量识别方法 Active CN113591915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110725480.8A CN113591915B (zh) 2021-06-29 2021-06-29 基于半监督学习和单分类支持向量机的异常流量识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110725480.8A CN113591915B (zh) 2021-06-29 2021-06-29 基于半监督学习和单分类支持向量机的异常流量识别方法

Publications (2)

Publication Number Publication Date
CN113591915A CN113591915A (zh) 2021-11-02
CN113591915B true CN113591915B (zh) 2023-05-19

Family

ID=78244918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110725480.8A Active CN113591915B (zh) 2021-06-29 2021-06-29 基于半监督学习和单分类支持向量机的异常流量识别方法

Country Status (1)

Country Link
CN (1) CN113591915B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114338077B (zh) * 2021-11-22 2024-10-01 山东师范大学 基于单分类神经网络的匿名流量识别方法及系统
CN114900835A (zh) * 2022-04-20 2022-08-12 广州爱浦路网络技术有限公司 恶意流量智能检测方法、装置及存储介质
CN117061256A (zh) * 2023-10-13 2023-11-14 北京中超伟业信息安全技术股份有限公司 基于动态蜜罐的网络安全系统及方法
CN117557843B (zh) * 2023-11-13 2024-07-05 江苏君立华域信息安全技术股份有限公司 一种基于半监督学习的流量识别方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611706A (zh) * 2012-03-21 2012-07-25 清华大学 一种基于半监督学习的网络协议识别方法及系统
CN108833409A (zh) * 2018-06-15 2018-11-16 北京网思科平科技有限公司 基于深度学习和半监督学习的webshell检测方法及装置
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN109981672A (zh) * 2019-04-03 2019-07-05 电子科技大学 一种基于半监督聚类的多层入侵检测方法
CN110225055A (zh) * 2019-06-22 2019-09-10 福州大学 一种基于knn半监督学习模型的网络流量异常检测方法与系统
CN111832647A (zh) * 2020-07-10 2020-10-27 上海交通大学 异常流量检测系统及方法
CN111835707A (zh) * 2020-05-27 2020-10-27 江苏大学 一种基于改进后的支持向量机的恶意程序识别方法
CN111898129A (zh) * 2020-08-07 2020-11-06 北京理工大学 基于Two-Head异常检测模型的恶意代码样本筛选器及方法
US10873533B1 (en) * 2019-09-04 2020-12-22 Cisco Technology, Inc. Traffic class-specific congestion signatures for improving traffic shaping and other network operations

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9369476B2 (en) * 2012-10-18 2016-06-14 Deutsche Telekom Ag System for detection of mobile applications network behavior-netwise
US10749894B2 (en) * 2017-02-15 2020-08-18 Cisco Technology, Inc. Prefetch intrusion detection system
US11075820B2 (en) * 2017-12-20 2021-07-27 Cisco Technology, Inc. Automatically detecting authorized remote administration sessions in a network monitoring system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611706A (zh) * 2012-03-21 2012-07-25 清华大学 一种基于半监督学习的网络协议识别方法及系统
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN108833409A (zh) * 2018-06-15 2018-11-16 北京网思科平科技有限公司 基于深度学习和半监督学习的webshell检测方法及装置
CN109981672A (zh) * 2019-04-03 2019-07-05 电子科技大学 一种基于半监督聚类的多层入侵检测方法
CN110225055A (zh) * 2019-06-22 2019-09-10 福州大学 一种基于knn半监督学习模型的网络流量异常检测方法与系统
US10873533B1 (en) * 2019-09-04 2020-12-22 Cisco Technology, Inc. Traffic class-specific congestion signatures for improving traffic shaping and other network operations
CN111835707A (zh) * 2020-05-27 2020-10-27 江苏大学 一种基于改进后的支持向量机的恶意程序识别方法
CN111832647A (zh) * 2020-07-10 2020-10-27 上海交通大学 异常流量检测系统及方法
CN111898129A (zh) * 2020-08-07 2020-11-06 北京理工大学 基于Two-Head异常检测模型的恶意代码样本筛选器及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于半监督学习的工控网络入侵检测方法;张松清;刘智国;;信息技术与网络安全(第01期);50-53 *
基于SVM的恶意流量检测及其改进方法分析;张远;徐逸卿;;信息与电脑(理论版)(第12期);34-36 *

Also Published As

Publication number Publication date
CN113591915A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN113591915B (zh) 基于半监督学习和单分类支持向量机的异常流量识别方法
Wang et al. Remote sensing image classification based on the optimal support vector machine and modified binary coded ant colony optimization algorithm
US11816183B2 (en) Methods and systems for mining minority-class data samples for training a neural network
CN112966691B (zh) 基于语义分割的多尺度文本检测方法、装置及电子设备
CN113177132B (zh) 基于联合语义矩阵的深度跨模态哈希的图像检索方法
CN111368920B (zh) 基于量子孪生神经网络的二分类方法及其人脸识别方法
WO2021138082A1 (en) Training artificial neural networks based on synaptic connectivity graphs
WO2021138085A1 (en) Predicting neuron types based on synaptic connectivity graphs
Li et al. On the learning property of logistic and softmax losses for deep neural networks
Igoe et al. How useful are gradients for ood detection really?
CN116886398A (zh) 一种基于特征选择和集成学习的物联网入侵检测方法
Cho et al. Genetic evolution processing of data structures for image classification
Mao et al. An XGBoost-assisted evolutionary algorithm for expensive multiobjective optimization problems
CN117938477A (zh) 网络入侵检测方法、装置、终端设备以及存储介质
Sivananthan Manifold regularization based on nyström type subsampling
Zhang et al. Evolutionary extreme learning machine based weighted nearest-neighbor equality classification
Mei et al. An improved brain emotional learning algorithm for accurate and efficient data analysis
Constantinopoulos et al. Semi-supervised and active learning with the probabilistic RBF classifier
Lin et al. A hybrid optimization strategy for simplifying the solutions of support vector machines
Sethi et al. Exploring adaptive learning methods for convex optimization
CN111914915A (zh) 基于支持向量机的数据分类器集成方法、装置及存储介质
Haug et al. CIRAL: a hybrid active learning framework for plankon taxa labeling
Dewi et al. IMPLEMENTATION OF DECISION TREE AND SUPPORT VECTOR MACHINE ON RAISIN SEED CLASSIFICATION
Thapliyal et al. A new multilevel image thresholding algorithm based on image partitioning approach with metaheuristic parameter for segmentation
JP4662702B2 (ja) 外れ値度計算装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant