CN111026917B - 一种基于卷积神经网络的数据包分类方法及系统 - Google Patents

一种基于卷积神经网络的数据包分类方法及系统 Download PDF

Info

Publication number
CN111026917B
CN111026917B CN201911081715.3A CN201911081715A CN111026917B CN 111026917 B CN111026917 B CN 111026917B CN 201911081715 A CN201911081715 A CN 201911081715A CN 111026917 B CN111026917 B CN 111026917B
Authority
CN
China
Prior art keywords
rule set
rule
neural network
convolutional neural
data packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911081715.3A
Other languages
English (en)
Other versions
CN111026917A (zh
Inventor
谢高岗
张昕怡
张鹏豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201911081715.3A priority Critical patent/CN111026917B/zh
Priority to US17/761,220 priority patent/US20220374733A1/en
Priority to PCT/CN2019/128935 priority patent/WO2021088234A1/zh
Publication of CN111026917A publication Critical patent/CN111026917A/zh
Application granted granted Critical
Publication of CN111026917B publication Critical patent/CN111026917B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种基于卷积神经网络的数据包分类方法及系统。所述方法包括对于训练规则集中的每个规则集进行归并,形成多种归并方案,基于性能评估确定训练规则集中各个规则集的最优归并方案;将训练规则集的各个规则集以及目标规则集的前缀组合分布转换成图像,以的图像和对应最优归并方案为特征训练卷积神经网络模型;基于图像相似性对目标规则集分类,构建相应哈希表,用于数据包分类。本发明的方法可以显著提升数据包查找性能,提升数据包查找速度,并提升规则的更新速度。本发明的系统通过在线系统与离线系统的相互协作,能够保证在线系统实现数据包的高效查找以及规则集快速更新,并且可以监测规则集的更新,始终反映网络的最新状态。

Description

一种基于卷积神经网络的数据包分类方法及系统
技术领域
本发明涉及计算机网络中数据包查找分类技术领域,具体涉及一种基 于卷积神经网络的数据包分类方法。
背景技术
数据包查找分类通过预先定义或者动态生成的规则集合,实现数据包 分类处理,是交换机、路由器、防火墙、负载平衡器、云平台软件交换机 和其他网络设备中的基础关键功能。软件定义网络、网络功能虚拟化、云 计算等场景需要频繁更新规则。规则存储成决策树等数据结构可以实现数 据包高速匹配转发,但规则更新速度慢,在规则更新时,数据包匹配转发 速度将极大降低。基于哈希的数据包分类方法可以支持快速规则更新,但 匹配转发速度慢。软件定义网络、网络功能虚拟化和云计算等设备迫切需 要一种既可以支高速的数据包匹配转发,又满足规则的快速在线更新的数 据包分类方法。
目前现有的数据包分类技术主要分为三类:基于硬件的数据包分类技 术,基于降维的数据包分类技术和基于空间划分的数据包分类技术。
在基于硬件的数据包分类技术中,T-CAM通过实现并行搜索从而降低 查找时间。但是,T-CAM存在存储空间有限、耗电量大和规则更新速度慢 等缺点。除T-CAM外,数据包分类也可以在其他硬件平台上运行,例如 GPU和FPGA。但是,在这些平台运行需要特定的芯片、硬件指令和编程 语言进行设计,实现与应用较为不便。
在基于降维的数据包分类技术中,Cross-producting和RFC首先将多 维规则分成若干个单维规则以单独匹配,最终将所有单维匹配的结果进行 合并。这种方法的缺点是,当规则集很大时,合并过程变得非常复杂。此 外,当一条规则更新时,每个维度相对应的规则表都需要进行更新,规则 更新速度缓慢。
在基于空间划分的数据包分类技术中,分类过程不是将传入数据包与 整个规则集匹配,而是分为两个步骤:第一步确定要搜索的规则集子空间, 第二步并将数据包与相应子空间中的规则进行匹配。这种方法进一步分为 两类:决策树方法和基于哈希的方法。
决策树方法(如HiCuts和HyperCuts)的关键思想是将搜索空间递归 地划分为多个子空间,直到每个区域中的规则数目低于某个阈值。决策树 的高效性保证了数据包的高速分类,但是基于树的数据结构存在更新缓慢 的问题。此外,某些规则可能需要复制到多个子空间,从而导致内存开销 变大。EffiCut和SmartSplit提出了一些规则空间分区策略来减少规则复制, 但这类方法仍然无法支持快速规则更新。
基于哈希的方法(比如Tuple Space Search)则可以实现规则的快速更 新,但是其缺点在于数据包的查找和匹配速度较慢。Tuple Space Search方 法中,当进行数据包分类时,需要一次性搜索所有哈希表以找到匹配的规 则,因此分类速度会随着哈希表数量的增加而降低。当规则更新时,仅需 要找到对应的哈希表,插入或删除规则,因此TSS能够支持快速更新。虽 然现有方法如Pruned Tuple Space Search,TupleMerge和PartitionSort通过 牺牲更新的性能,来提高TSS的查找速度,但是仍然无法同时支持数据包 的高效分类和高速的在线规则更新。
发明内容
因此,现有的各种数据包分类方法都无法兼顾搜索速度、更新的速度 和准确性,无法实现高效的数据包分类和高速的在线规则更新。
针对上述问题的难点以及目前技术的不足,本发明希望提出一种搜索 查找速度快、规则更新速度快、查找准确性高的数据包分类方法。进而, 提出了一种基于卷积神经网络的数据包分类方法。本发明提出了基于规则 地址前缀分布范围组合的方式进行规则分类形成多种归并方案、通过性能 模块进行规则归并方案的确定,并且将规则模型转化为图像模型,基于卷 积神经网络对规则集进行快速划分构建哈希表,同时实现数据包的高效分类、查找和规则的高速在线更新。
为实现上述目的,一方面,本发明提供一种基于卷积神经网络的数据 包分类方法,其特征在于,所述方法包括下述步骤:
步骤(1)、对于训练规则集中的每个规则集,按照规则集中的规则的 源地址和目标地址的不同前缀范围组合对其中规则进行归并,形成多种归 并方案,基于性能评估确定训练规则集中各个规则集的最优归并方案;
步骤(2)、将训练规则集的各个规则集以及目标规则集的前缀组合分 布转换成图像,利用图像的参数表征相应前缀组合分布的参数,以所述训 练规则集的图像和对应最优归并方案为特征训练卷积神经网络模型;
步骤(3)、将目标规则集所转换成的目标图像输入到所述卷积神经网 络模型,基于所述目标图像与所述卷积神经网络模型中图像的匹配度确定 目标规则集的归并方案,构建相应哈希表,用于数据包分类。
在一种优选实现方式中,所转换的图像的像素坐标表示相应规则集中 规则的源地址和目标地址前缀长度或长度范围组合,像素值表示相应规则 集中对应于该前缀长度或长度范围组合的规则的数量。
在另一种优选实现方式中,所述步骤(2)中对卷积神经网络模型进 行训练包括基于图像之间的相似性对规则集的前缀组合分布进行分类,并 且为每种类别的前缀组合分布确定相应的归并方案。
在另一种优选实现方式中,包括计算每种前缀组合分布所对应的图像 的像素点之间的差值信息,作为相应图像的指纹,计算各个图像的指纹与 参照图像的指纹的差异值,并基于所述差异值与预定阈值之间的比较,确 定相应图像所对应规则集的类别。
在另一种优选实现方式中,还包括对目标规则集进行规则更新,所述 规则更新包括基于所更新规则的前缀组合长度确定对应的哈希表,将在对 应哈希桶中对所更新规则进行更新,并且更新该目标规则集对应的前缀组 合分布的图像中所更新规则对应像素点的值。
在另一种优选实现方式中,还包括监测目标规则集的前缀组合分布更 新前后的汉明距离,并基于该汉明距离确定是否进行哈希表的重构。
在另一种优选实现方式中,所述方法还包括为每个哈希表设置优先级, 其优先级为该哈希表包含规则的最高优先级,对所有哈希表进行排序,进 行数据包匹配时,当命中规则的优先级不小于下一个哈希表的优先级时停 止查找。
在另一种优选实现方式中,性能评估采用公式
Figure BDA0002264184360000031
Figure BDA0002264184360000032
进行,其中,h表示平均哈希时间,c表示平均验证时间,m为哈希表的 数目,ni表示第i个哈希表中的规则数,si表示第i个哈希表的大小,
Figure BDA0002264184360000033
为优先级比较的时间。
另一方面,本发明提供一种基于卷积神经网络的数据包分类系统,其 特征在于,所述系统包括离线系统和在线系统,
所述离线系统包括计算模块和卷积神经网络离线训练模块,所述在线 系统包括数据包分类和转发模块和卷积神经网络在线模块,
所述计算模块用于对训练规则集中的各个规则集按照规则的源地址 和目标地址的不同前缀范围组合对其中规则进行归并,对不同归并方案的 性能进行评估确定每个规则集的最优归并方案,并且将训练规则集的各个 规则集的每种前缀组合分布转换成图像,利用图像的参数表征相应前缀组 合分布的参数;
所述卷积神经网络离线训练模块利用所述训练规则集以所述训练规 则集的图像和对应最优归并方案为特征进行卷积神经网络模型训练;
所述卷积神经网络在线模块用于将目标规则集的前缀组合分布转换 成图像、利用图像的参数表征相应前缀组合分布的参数,并且利用训练好 的卷积神经网络模型确定所述目标规则集的归并方案;
所述数据包分类和转发模块用于基于所述归并方案构建相应哈希表, 以基于所述哈希表进行数据包分类。
在另一种优选实现方式中,所述卷积神经网络离线训练模块基于图像 之间的相似性对规则集的前缀组合分布进行分类,并且为每种类别的前缀 组合分布确定相应的归并方案。
在另一种优选实现方式中,还包括监测模块,其读取目标规则集的前 缀组合分布并判定其类别,基于类别的变化情况判定是否进行哈希表重构。
在另一种优选实现方式中,规则更新时,所述数据包分类和转发模块 基于所更新规则的前缀组合确定对应的哈希表,在对应哈希桶中对所更新 规则进行更新,并且所述卷积神经网络在线模块更新该目标规则集对应的 前缀组合分布的图像中所更新规则对应像素点的值。
另一方面,本发明提供一种计算机可读存储介质,其上存储有计算机 程序,其中,该程序被处理器执行时实现上述方法。
一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够 在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时 实现上述方法。
技术效果
本发明的方法可以显著提升数据包查找性能,提升数据包查找速度, 并提升规则的更新速度。
本发明的系统通过在线系统与离线系统的相互协作,能够保证在线系 统实现数据包的高效查找以及规则集快速更新,并且优选地,可以监测规 则集的更新,始终反映网络的最新状态。
如在优选实施例中所验证的,本发明方法(CRP)的数据包查找性能 明显是PartitionSort(PS)方法的4.1倍,是Tuple Space Search(TSS)方法 的8.3倍,是PrunedTuple Space Search(PR_TSS)方法的3.5倍,是 TupleMerge(TM)方法的4.3倍。
本发明方法更新速度是PS方法的9.6倍,是TSS方法的1.8倍,是 PR-TSS方法的2.3倍,是TM方法的5.2倍。
本发明方法通过对哈希表进行归并,也进一步减少了规则存储开销, 与其他算法相比,本发明的内存开销是PS方法的36%,是TSS方法的70%, 是PR-TSS方法的63%。
附图说明
以下图仅对本发明作示意性的说明和解释,并不用于限定本发明的范 围,其中:
图1为本发明实施例中基于卷积神经网络的数据包分类方法的示意流 程图。
图2为本发明实施例中基于卷积神经网络的数据包分类系统的结构示 意图。
图3为采用发明方法进行规则集的标准化和转化过程示意图。
图4为实际测试中在规则集无更新情况下本发明方法与现有方法的查 找性能比较示意图。
图5为实际测试中本发明方法与现有方法规则更新时间比较示意图。
图6为实际测试中本发明方法与现有方法规则集内存开销比较示意图。
图7为实际测试中在不同的规则集更新速率下,本发明方法与现有方 法数据包的查找速率比较示意图。
图8为实际测试中带监测模块与不带监测模块系统性能比较示意图。
图9为原生Open vSwitch(OVS)和将本发明方法引入OVS后的性 能比较示意图。
图10为采用本发明方法进行图像指纹获取及相似性比较示意图。
图11为在发明系统中进行哈希表重建判断的流程示意图。
图12为规则集间汉明距离计算的箱线图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以 下结合图通过具体实施例对本发明进一步详细说明。应当理解,此处所描 述的具体实施例仅用以解释本发明,并不用于限定本发明。
数据包分类技术是网络设备中最关键的操作之一,其数据包分类速度 和规则更新速度对系统整体性能起着至关重要的作用。但现有的技术无法 同时支持快速的数据包分类和高效的规则在线更新,为解决此问题,本发 明提出了基于卷积网络(CNN)的数据包分类系统和分类方法,用来支持快 速在线更新和高效数据包查找。
下面结合图1详细介绍本发明进行哈希表构建以及数据包分类的具体 过程
步骤(1)、对训练规则集中各规则集进行归并,构建性能模型对各种 归并方案进行性能估算,确定训练规则集中各规则集的最优归并方案。
步骤(1.1)、首先进行数据包分类的哈希归并,形成不同的归并方案。
本申请的发明人通过对数据分类的深入研究了解到,可以通过减少规 则集对应的哈希表的数目提升数据包分类速度,但与此同时,需要避免由 于规则落入哈希表同一个桶中带来的匹配开销。故本发明提出的哈希归并 方法,在减少哈希表数目的同时,保证较低的规则冲突率,从而提高数据 包的查找速度。
本发明基于规则前缀组合分布,通过使用“前缀范围组合”进行分类, 即,使用规则集源地址和目标地址的前缀范围的组合进行分类,将规则集 划分为多个不相交的子集来减少哈希表的数目。
例如表1中的规则集,可以归并为四个哈希表,见表2,其前缀范围 组合分别为([0,3),[0,4))、([0,3),[4,6))、([3,6),[0,4))和([3, 6),[4,6)),如表2所示。其中,表1中的规则0映射到表2中的([3,6), [4,6)),表示其源地址和目标地址的前缀分别落在[3,6)和[4,6)范围内。
Figure BDA0002264184360000061
Figure BDA0002264184360000071
表1:原始规则集
归并后哈希表编号 前缀范围组合 对应规则编号
0 ([3,6),[4,6)) 0,1,2,3,4,5
1 ([3,6),[0,4)) 7,8
2 ([0,3),[4,6)) 6
3 ([0.3),[0,4)) 9
表2:归并后的规则集
步骤(1.2)利用性能模型进行数据包分类过程中的性能评估。
根据本发明的实施例,提出一种性能模型,通过分析基于哈希的数据 包分类方法中,各个步骤需要的时间开销,估算数据包分类的性能。
基于哈希的数据包分类方法通常包括三个步骤:1)搜索目标系统中 的所有哈希表,以确定哈希表中是否有规则与数据包匹配;2)验证规则 是否真正匹配到数据包中的数据(包头对应的域),以避免由哈希冲突或 规则重叠引起的假阳性;3)如果匹配多个规则,则选择具有最高优先级 的规则做为数据包最终分类结果。因此,基于哈希的数据包分类时间包括 上述三部分。其中,哈希时间与哈希表表的数量有关。匹配验证的时间取 决于哈希冲突的数量或规则重叠的数目。给定哈希函数,匹配到哈希表中 的条目的概率与每个哈希表的利用率成比例,该比例可以被定义为该哈希 表中条目数除以哈希表的解空间大小,如下:
Figure BDA0002264184360000081
其中ri表示第i个哈希表的命中率,ei表示第i个哈希表的条目数,si表 示第i个哈希表的大小。当命中哈希表中的某条规则后,必须进一步验证 从而避免由于哈希冲突或规则重叠的假阳性。在哈希表中找到匹配的条目 后,验证的时间是由平均重叠率加权所花费的时间,而平均重叠率定义为 哈希表中的规则数除以条目数,如下:
Figure BDA0002264184360000082
其中oi表示第i个哈希表的平均重叠率,ni表示第i个哈希表中的规则 数。因此,对一个数据包进行分类的时间T为:
Figure BDA0002264184360000083
其中,m为哈希表的数目,hi是第i个哈希表的哈希计算时间,ci是命 中第i个哈希表后的验证时间,而
Figure BDA0002264184360000084
为进行规则优先级比较的时间。公式(1) 和(2)代入公式(3),可以转化为:
Figure BDA0002264184360000085
从而进一步简化为:
Figure BDA0002264184360000086
其中
Figure BDA0002264184360000087
表示平均哈希时间,
Figure BDA0002264184360000088
表示平均验证时间。
利用该性能模型,可以了解影响数据包分类性能的因素,以及如何提 升基于哈希的数据包分类的匹配速度。该性能模型保证了本发明方法中每 一类规则集归并方案的合理性及高效性。
步骤(1.3)利用性能模型,基于不同哈希表归并方案的平均查找性能, 确定哈希表归并方案,并构建哈希表。
通过减小前缀长度归并哈希表,大量的规则可能落入哈希表同一个桶 中引起哈希冲突,哈希冲突验证会进一步带来匹配开销,因此发明人利用 上述性能模型,通过对比不同哈希表归并方案的平均查找性能,找到最优 哈希表归并方案,将冲突概率降至最低。
利用这种方式,对训练规则集中的每个规则集进行最优归并方案的确 定,为相应规则集添加标签,形成添加标签的训练规则集。
步骤(2)将训练规则集中各个规则集前缀分布组合转换为标准化的 图像(后续对于目标规则集也采用类似方式进行图像化),代入卷积神经 网络模型进行模型训练。训练模型时,训练集分为两部分:特征和标签。 本发明方法中,特征就是该规则集所对应的前缀组合分布,是一张该分布 转换成的图,标签就是对应的最优归并方案。
步骤(2.1)将训练规则集各个规则集前缀分布组合转换为标准化的图 像。
在哈希归并方法中,需要遍历所有归并情况,根据查找性能最优的方 案来对的哈希表进行构建。本发明提出的基于卷积网络的数据包分类方法 的一个创新点在于将遍历所有的归并方案找到最优解的过程转换为图像 识别问题,因此需要首先建立一个模型将不同的规则集前缀分布组合转换 为图像。
在不同的五元组规则集中,源IP地址和目的IP地址前缀的长度的组 合也不尽相同。为了获取规则集的特征,本发明将各个规则集的IP地址 前缀组合分布转换为二维图像,使用一个维度(比如x坐标)表示源IP 地址前缀的长度,另一个维度(比如,y坐标)表示目标IP地址前缀的长 度。当需要将规则前缀组合分布用细粒度的图像表示时,即每个像素点表 示一种“前缀长度组合”,则二维图像中每个像素值设置为该规则集中对 应的“前缀长度组合”规则的数量;若需要对图像进行粗粒度化,可以在 每个维度上,对规则前缀按照一定的步长划分范围,每个像素点表示一种 “前缀范围组合”,则二维图像中每个像素值设置为该规则集中对应的“前 缀范围组合”规则的数量。无论是细粒度还是粗粒度图像,图像的像素值 范围均取决于像素点使用的比特数,如像素点使用的比特数为n,则该图 像中像素值的范围为[0,2n-1]。而在规则集中,不论是前缀长度组合还 是前缀范围组合,每种组合的规则数目没有范围限制,因此我们需要根据 图像像素值的范围,对规则集中每种前缀组合的规则数进行标准化,以使 其落入和像素值相同的范围。该过程如图3所示,图3中规则前缀长度为IPV4地址前缀范围内的任意值。当然,在使用过程中,本领域技术人员在 图像转换时,可以考虑使用其他的图像参数来表征规则集的参数。
在卷积神经网络模型训练(对于后续的离线系统)以及应用时的规则 集更新监测(对应于后续的在线系统)过程中,都需要基于图像的识别来 进行规则集的分类,下面两个步骤(2.2)和(2.3)是对图像的处理过程, 既可用于离线训练,又可用于在线分类,又可用于在线规则集更新监测。
具体而言,在卷积神经网络模型训练(对应于后续的离线系统),需 要下述步骤(2.2)和(2.3)确定训练集中图像共有多少类别,保证相同 类别中图像相近。
应用时,在对数据包分类(对应于后续的在线系统)时,需要将规则 集转化为图像,然后输入神经网络进行识别,找到对应的归并方案。这一 过程不需要步骤(2.2)和(2.3)。即利用神经网络可以直接判断类别,而 步骤(2.2)和(2.3)是针对两个图像的比较。在进行规则监测时,需要 判断是否对哈希表进行重构,判断图像变化,此时需要执行步骤(2.2)和 (2.3)。
步骤(2.2)提取图像的表征信息。
如果为每个规则集都提供相应的哈希表构建方案,在实际中规则集种 类数量巨大,这种想法并不可行。由于哈希表构建方案的性能主要取决于 规则集分布,因此发明人提出对规则集前缀组合分布进行分类,相同的种 类使用相同的方案。基于上述原因,本发明使用以下的步骤获取每个图像 的指纹,从而度量图像分布相似性:1)通过最近邻插值将规则集前缀组 合分布图像按比例缩小(取决于用户选择的精度。比例越大,得到的图像 像素点越少,缩小后的图像包含的信息越少。比例越小,得到的图像像素 点越多,缩小后包含的信息也就越多);2)比较两个相邻像素,将每行像 素转换成差值;3)依次对差值进行编码,在同一行中,如果第x列的像 素值P[x]小于第x+1列的像素值P[x+1],即P[x]<P[x+1],则该差值 设置为“1”,否则设置为“0”,将得到的字符串作为图像的指纹(或称为 该图像的表征信息)。
步骤(2.3)基于图像的表征信息对图像进行分类。
优选地,本发明使用汉明(Hamming)距离,即两个等长字符串在对 应位置上不同字符的数目,来计算两个指纹之间不同的位数,从而度量不 同分布之间的相似性。如果汉明距离小于阈值K,则认为两个图像属于同 一类型,反之,两个图像属于不同类型。阈值K的选择取决于实际场景下 规则的变化及用户的需求,当阈值K越小,意味着图像相似度的度量越精 确,系统对图像变化的敏感度越高,系统的复杂性也越高。反之,K值越 大,图像相似度的度量越粗略,系统对图像变化的敏感度越低,系统的复 杂性随之降低
如图10中所示,获取两个图像的指纹后,其汉明距离为25。如果定 义K值为20,由于25大于20,则两个图像属于不同的类型。如果定义K 值为30,由于25小于30,则两个图像属于相同的类型。对于阈值K的选 择,可以通过下面的例子进行说明。假设实际场景中有六类规则,分别是 ACL1,ACL2,FW1,FW2,IPC1,IPC2,每类规则分别包括了200个不同的 规则集。在每一类规则中,分别计算两两规则集对应的图像间的汉明距离, 得到图12中从左至右的六个箱线图。对每个规则集,分别计算其与在不 同类规则中的规则集两两间的汉明距离,得到图12中的最后一个箱线图。 通过观察图12,可以发现,从左至右的六个箱线图中,汉明距离的最大值 小于15,而最后一个箱线图中,汉明距离的最小值大于10。为了保证相同的类别规则集的汉明距离尽可能小,不同类别的规则集的汉明距离尽可 能大,可以选择15作为阈值K来区分不同种类的规则集。
步骤(3)对当前规则集的前缀组合分布进行图像化,代入训练好的 卷积神经网络模型,基于图像相似性确定当前规则集所属类别,并根据当 前规则集所属类别确定哈希表归并方案,构建哈希表。在应用时,需要将 待处理的规则集转化为图像,方法和训练集中的一致,即在一个系统中, 粒度的选择是确定的。一旦粒度确定,一个规则集只会对应于一张图像。
采用本发明的方法将规则集转化为图像后,能够快速通过CNN网络 识别其类别。不同于传统的图像分类中图像的标签,本发明中选择当前分 布下最优的哈希表归并方案作为标签。因此,当规则集转化为相应的图像 并输入CNN网络中,能够快速得到其对应的哈希表归并方案,迅速构建 哈希表。
步骤(4)基于哈希表的优先级进行数据匹配。
构建哈希表后,当需要进行数据包匹配时,可以正常匹配,也可以采 用本发明的下述方法进行匹配。
具体而言,上面通过对哈希表进行归并,可以提升哈希表的查找速度, 但是仍然需要对当前所有的哈希表依次进行搜索。为加速数据包匹配与查 找速度,本发明提出了两种优化方案。首先为每个哈希表设置优先级,其 优先级为该哈希表包含规则的最高优先级,之后对哈希表按照优先级的降 序进行排序。通过对哈希表进行排序,一旦命中规则的优先级不小于下一 个哈希表的优先级,则停止查找,从而加快查找速度。第二种优化方案对 哈希表同一个桶中的规则按照优先级降序进行排序,一旦匹配到某条规则, 即为该桶中的优先级最高的规则,结束该桶中规则的比较,从而加快查找 速度。
步骤(5)对于待更新的规则,采用下述方式进行规则更新。
当哈希表归并方案确定后,规则的更新包括规则的插入和删除。在本 发明中,当需要插入新的规则时,首先需要根据其规则前缀组合长度找到 对应的哈希表(哈希表中每个哈希值对应一个哈希桶,哈希桶中容纳与该 哈希值对应的规则),将规则插入到该哈希表中对应的哈希桶之后,对该 桶中的规则根据优先级降序重新排序。与此同时,需要更新该规则集对应 的前缀分布组合图像,增加该规则对应像素点的值。当需要对规则进行删除时,同样需要先定位到对应的哈希表,之后将该规则进行删除,同时更 新该规则集对应的前缀分布组合图像,减小该规则对应像素点的值。如果 删除规则后,其所在的哈希表也为空,那么同时将该哈希表也删除。
当哈希表更新使得当前哈希表对应的前缀组合分布的类别不同于前 次更新时对应的前缀组合分布类别时,即类别变化时,进行哈希表重构。
步骤(6)、基于当前规则集前缀组合分布变化确定是否进行哈希表重 构。
具体而言,首先测量当前规则前缀组合分布DC与前一次哈希表构建时 对应的前缀组合分布DP之间的汉明距离,如果该汉明距离大于阈值K,说 明分布DC和DP不属于同一种分布类型,因此,将分布DC发送到CNN模型 中寻找对应的标签,即新的哈希表归并方案。除新标签之外,CNN模型还 将输出该标签对应的规则集前缀组合分布R。如果DC和R之间的汉明距离 仍然大于该阈值,将DC视为新的分布类型并将其传递给离线系统。并且通 过性能模型比较当前归并方案和TSS的性能,选择性能较好的方案作为其 归并方案;否则,它已经变为另一个已知的分布,只需要根据标签对哈希 表进行重构。
本发明的方法可以通过图2所示分类系统实现,也可以采用其他系统 实现。
概括来讲,本发明的分类系统采用在线更新高效数据包查找分类架构。 如附图2所示,该分类系统包括在线系统和离线系统两部分。
离线系统包括计算模块和CNN离线模块,在离线系统中,对训练集 和/或测试集(可以统称训练规则集)中的各个规则集按照不同方式进行归 并,计算模块利用性能模型对不同归并方案的性能进行评估,得到训练集 和/或测试集中每个规则集所对应的最优哈希表归并方案,CNN离线模块 将每个哈希表归并方案和对应的规则集中规则的分布特征作为训练集,训 练CNN模型,并将训练好的模型传送给CNN在线模块。
优选地,归并方案这样形成:基于规则的源地址和目标地址的前缀组 合分布,将目标系统的规则集中具有预定前缀值或前缀范围的规则进行组 合,将规则集划分成多个不相交的子集,每种组合方式形成一种归并方案, 并且利用性能模型,基于不同哈希表归并方案的平均查找性能,确定哈希 表最优归并方案。
在线系统包含三个模块:CNN在线模块、数据分类和转发模块以及监 测模块。
CNN在线模块利用训练好的CNN模型来识别待分类规则集中的规则 分布并确定其哈希表归并方案。具体而言,将当前规则集中规则的源地址 和目标地址的前缀组合分布转换成相应图像,基于图像识别确定当前规则 集的类别,确定哈希表归并方案。
数据分类和转发模块用于进行数据包的匹配和转发。本发明的分类系 统在进行规则更新时需要对两部分进行更新:数据包分类与转发模块中对 应的哈希表和规则集前缀组合分布,监测模块用于监测规则集前缀组合分 布变化,在变化导致前缀组合分布所属的类别发生变化时,重新构建哈希 表。通过在线系统与离线系统的相互协作,本发明的分类系统能够保证在 线系统实现数据包的高效查找以及规则集快速更新的同时,监测规则集的 更新,始终反映网络的最新状态。
下面,简单描述本发明中分类系统的工作过程。
在初始化阶段,离线系统中的CNN离线模块使用规则集前缀组合分 布映射的图像以及通过计算模块得到的当前分布下最优的哈希表归并方 案作为标签来训练CNN模型。当模型训练好后,将其传送到在线系统中, 作为CNN在线模块中的模型。之后在线和离线系统通过以下列方式协同 工作。
当分类系统收到下发的待处理规则集后,在线系统首先通过图像模型 将原始规则集的前缀组合分布转换为图像,并将其传递给CNN在线模块, 以获取哈希表的归并方案。基于该归并方案,数据包分类和转发模块构建 哈希表。
数据包分类和转发模块构造完成哈希表后,对于系统收到的数据包, 直接在该模块中进行规则的查找与匹配,匹配到相应规则后,根据该规则 对数据包执行相应的动作。
当规则集更新时,数据包分类与转发模块中对应哈希表和规则集前缀 组合分布会同时更新。监测模块按照一定的时间间隔读取规则集前缀组合 分布,当发现规则分布已更改为另一种类型时,更新哈希表归并方案并重 新构造哈希表。如果该分布是新类型,监测模块还会将其传递给离线的计 算模块来得到其对应的标签。新的规则前缀组合分布图像和其对应的标签 也将全部传递到离线系统中的CNN离线模块进行模型的训练。最终,用最新训练的CNN模型替换旧的在线CNN模型。
通过在线系统与离线系统的相互协作,本发明提出的架构能够保证在 线系统实现数据包的高效查找以及规则集快速更新的同时,监测规则集的 更新,始终反映网络的最新状态。实现了高速的数据包匹配与转发,以及 快速的规则在线更新。
分类测试实例
为了验证本发明方法的性能,申请人采用6个由ClassBench生成的规 则集(acl1,acl2,fw1,fw2,ipc1,ipc2)和2个真实的规则集(cloud1,cloud2) 组成的测试数据集对本发明的数据包分类方法以及现有技术中的各种分 类方法进行了测试。经测试,本发明的方法可以显著提升数据包查找性能, 提升数据包查找速度,并提升规则的更新速度。
本发明方法(CRP)的数据包查找性能明显优于其他算法,如附图4 所示,本发明的CRP方法是PartitionSort(PS)的4.1倍,是Tuple Space Search(TSS)的8.3倍,是PrunedTuple Space Search(PR_TSS)的3.5倍,是 TupleMerge(TM)的4.3倍。
更新速度比较如附图5所示,本发明规则更新的速度是PS的9.6倍, 是TSS的1.8倍,是PR-TSS的2.3倍,是TM的5.2倍。
本发明通过对哈希表进行归并,也进一步减少了规则存储开销,与其 他算法对比如附图6所示。本发明的内存开销是PS的36%,是TSS的70%, 是PR-TSS的63%。
此外,在有规则更新的情况下,随着更新速度的提升,各个方法的查 找速率有所下降,但本发明提出的基于卷积神经网络的数据包分类方法的 性能始终大于其他方法,如附图7所示。
同时,当规则集更新导致前缀分布发生变化时时,本发明通过对哈希 表进行重构,保证系统始终维持较高的数据包查找速率,系统性能如附图 8所示。
进一步地,申请人将本发明方法代入Open vSwitch中、替换 MegaflowCache的结构(其采用Tuple Space Search方法),替换后的Open vSwitch的吞吐量是原Open vSwitch的10倍,如附图9所示。
本发明提出通过监测模块监测由于规则更新导致的规则集前缀组合 分布变化,并及时更新哈希表归并方案。监测模块首先测量当前规则前缀 组合分布DC与前一次哈希表构建时对应的前缀组合分布DP之间的汉明距 离,如果该汉明距离大于阈值K,说明分布DC和DP不属于同一种分布类型, 因此,将分布DC发送到CNN模型中寻找对应的标签,即新的哈希表归并 方案。除新标签之外,CNN模型还将输出该标签对应的规则集前缀组合分 布R。如果DC和R之间的汉明距离仍然大于该阈值,我们将DC视为新的分 布类型并将其传递给离线系统。并且通过性能模型比较当前归并方案和 TSS的性能,选择性能较好的方案作为其归并方案;否则,它已经变为另 一个已知的分布,只需要根据标签对哈希表进行重构。上述过程如图11 所示。
采用这种方法,当规则集由于更新导致前缀组合分布变化后,原有的 哈希表归并方案不再适用于新的规则集,因此该模块能够快速对新规则分 布进行分类,并找到当前最优的哈希表归并方案,对哈希表进行重建,使 系统性能始终保持在较高的水平。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽 性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范 围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更 都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原 理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术 人员能理解本文披露的各实施例。

Claims (13)

1.一种基于卷积神经网络的数据包分类方法,其特征在于,所述方法包括下述步骤:
步骤(1)、对于训练规则集中的每个规则集,按照规则集中的规则的源地址和目标地址的不同前缀范围组合对其中规则进行归并,形成多种归并方案,基于性能评估确定训练规则集中各个规则集的最优归并方案;
步骤(2)、将训练规则集的各个规则集以及目标规则集的前缀组合分布转换成图像,利用图像的参数表征相应前缀组合分布的参数,以所述训练规则集的图像和对应最优归并方案为特征训练卷积神经网络模型;
步骤(3)、将目标规则集所转换成的目标图像输入到所述卷积神经网络模型,基于所述目标图像与所述卷积神经网络模型中图像的匹配度确定目标规则集的归并方案,构建相应哈希表,用于数据包分类,其中,所转换的图像的像素坐标表示相应规则集中规则的源地址和目标地址前缀长度或长度范围组合,像素值表示相应规则集中对应于该前缀长度或长度范围组合的规则的数量。
2.根据权利要求1所述的基于卷积神经网络的数据包分类方法,其特征在于,所述步骤(2)中对卷积神经网络模型进行训练包括基于图像之间的相似性对规则集的前缀组合分布进行分类,并且为每种类别的前缀组合分布确定相应的归并方案。
3.根据权利要求2所述的基于卷积神经网络的数据包分类方法,其特征在于,包括计算每种前缀组合分布所对应的图像的像素点之间的差值信息,作为相应图像的指纹,计算各个图像的指纹与参照图像的指纹的差异值,并基于所述差异值与预定阈值之间的比较,确定相应图像所对应规则集的类别。
4.根据权利要求1所述的基于卷积神经网络的数据包分类方法,其特征在于,还包括对目标规则集进行规则更新,所述规则更新包括基于所更新规则的前缀组合长度确定对应的哈希表,将在对应哈希桶中对所更新规则进行更新,并且更新该目标规则集对应的前缀组合分布的图像中所更新规则对应像素点的值。
5.根据权利要求1所述的基于卷积神经网络的数据包分类方法,其特征在于,还包括监测目标规则集的前缀组合分布更新前后的汉明距离,并基于该汉明距离确定是否进行哈希表的重构。
6.根据权利要求1所述的基于卷积神经网络的数据包分类方法,其特征在于,所述方法还包括为每个哈希表设置优先级,其优先级为该哈希表包含规则的最高优先级,对所有哈希表进行排序,进行数据包匹配时,当命中规则的优先级不小于下一个哈希表的优先级时停止查找。
7.根据权利要求1所述的基于卷积神经网络的数据包分类方法,其特征在于,性能评估采用公式
Figure FDA0002983991280000021
进行,其中,
Figure FDA0002983991280000022
表示平均哈希时间,
Figure FDA0002983991280000023
表示平均验证时间,m为哈希表的数目,ni表示第i个哈希表中的规则数,si表示第i个哈希表的大小,
Figure FDA0002983991280000024
为优先级比较的时间。
8.一种基于卷积神经网络的数据包分类系统,其特征在于,所述系统包括离线系统和在线系统,
所述离线系统包括计算模块和卷积神经网络离线训练模块,所述在线系统包括数据包分类和转发模块和卷积神经网络在线模块,
所述计算模块用于对训练规则集中的各个规则集按照规则的源地址和目标地址的不同前缀范围组合对其中规则进行归并,对不同归并方案的性能进行评估确定每个规则集的最优归并方案,并且将训练规则集的各个规则集的每种前缀组合分布转换成图像,利用图像的参数表征相应前缀组合分布的参数,其中,所转换的图像的像素坐标表示相应规则集中规则的源地址和目标地址前缀长度或长度范围组合,像素值表示相应规则集中对应于该前缀长度或长度范围组合的规则的数量;
所述卷积神经网络离线训练模块利用所述训练规则集以所述训练规则集的图像和对应最优归并方案为特征进行卷积神经网络模型训练;
所述卷积神经网络在线模块用于将目标规则集的前缀组合分布转换成图像、利用图像的参数表征相应前缀组合分布的参数,并且利用训练好的卷积神经网络模型确定所述目标规则集的归并方案;
所述数据包分类和转发模块用于基于所述归并方案构建相应哈希表,以基于所述哈希表进行数据包分类。
9.根据权利要求8所述的基于卷积神经网络的数据包分类系统,其特征在于,所述卷积神经网络离线训练模块基于图像之间的相似性对规则集的前缀组合分布进行分类,并且为每种类别的前缀组合分布确定相应的归并方案。
10.根据权利要求9所述的基于卷积神经网络的数据包分类系统,其特征在于,还包括监测模块,其读取目标规则集的前缀组合分布并判定其类别,基于类别的变化情况判定是否进行哈希表重构。
11.根据权利要求8所述的基于卷积神经网络的数据包分类系统,其特征在于,规则更新时,所述数据包分类和转发模块基于所更新规则的前缀组合确定对应的哈希表,在对应哈希桶中对所更新规则进行更新,并且所述卷积神经网络在线模块更新该目标规则集对应的前缀组合分布的图像中所更新规则对应像素点的值。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至7中任一项所述的方法。
13.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的方法。
CN201911081715.3A 2019-11-07 2019-11-07 一种基于卷积神经网络的数据包分类方法及系统 Active CN111026917B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911081715.3A CN111026917B (zh) 2019-11-07 2019-11-07 一种基于卷积神经网络的数据包分类方法及系统
US17/761,220 US20220374733A1 (en) 2019-11-07 2019-12-27 Data packet classification method and system based on convolutional neural network
PCT/CN2019/128935 WO2021088234A1 (zh) 2019-11-07 2019-12-27 一种基于卷积神经网络的数据包分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911081715.3A CN111026917B (zh) 2019-11-07 2019-11-07 一种基于卷积神经网络的数据包分类方法及系统

Publications (2)

Publication Number Publication Date
CN111026917A CN111026917A (zh) 2020-04-17
CN111026917B true CN111026917B (zh) 2021-07-20

Family

ID=70201161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911081715.3A Active CN111026917B (zh) 2019-11-07 2019-11-07 一种基于卷积神经网络的数据包分类方法及系统

Country Status (3)

Country Link
US (1) US20220374733A1 (zh)
CN (1) CN111026917B (zh)
WO (1) WO2021088234A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887300B (zh) * 2021-01-22 2022-02-01 北京交通大学 一种数据包分类方法
CN112948646B (zh) * 2021-04-01 2022-12-13 支付宝(杭州)信息技术有限公司 数据识别方法和装置
CN113542750A (zh) * 2021-05-27 2021-10-22 绍兴市北大信息技术科创中心 采用两套及两套以上哈希表进行搜索的数据编码方法
US11757642B1 (en) * 2022-07-18 2023-09-12 Spideroak, Inc. Systems and methods for decentralized synchronization and braided conflict resolution

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777644A (zh) * 2016-12-08 2017-05-31 华能国际电力股份有限公司 电厂标识系统编码的自动生成方法及装置
KR20180116934A (ko) * 2017-04-18 2018-10-26 한국기술교육대학교 산학협력단 Cnn을 활용한 패킷 페이로드 기반의 네트워크 트래픽 분류시스템
CN109754021A (zh) * 2019-01-11 2019-05-14 湖南大学 基于范围元组搜索的在线包分类方法
CN110297888A (zh) * 2019-06-27 2019-10-01 四川长虹电器股份有限公司 一种基于前缀树与循环神经网络的领域分类方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017200524A1 (en) * 2016-05-16 2017-11-23 United Technologies Corporation Deep convolutional neural networks for crack detection from image data
CN106534224B (zh) * 2017-01-23 2018-04-20 余洋 智能网络攻击检测方法及装置
CN109361617B (zh) * 2018-09-26 2022-09-27 中国科学院计算机网络信息中心 一种基于网络包载荷的卷积神经网络流量分类方法及系统
CN109886114A (zh) * 2019-01-18 2019-06-14 杭州电子科技大学 一种基于聚合变换特征提取策略的舰船目标检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777644A (zh) * 2016-12-08 2017-05-31 华能国际电力股份有限公司 电厂标识系统编码的自动生成方法及装置
KR20180116934A (ko) * 2017-04-18 2018-10-26 한국기술교육대학교 산학협력단 Cnn을 활용한 패킷 페이로드 기반의 네트워크 트래픽 분류시스템
CN109754021A (zh) * 2019-01-11 2019-05-14 湖南大学 基于范围元组搜索的在线包分类方法
CN110297888A (zh) * 2019-06-27 2019-10-01 四川长虹电器股份有限公司 一种基于前缀树与循环神经网络的领域分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
High-performance IPv6 Lookup with Real-time Updates using Hierarchical-balanced Search Tree;TONG, Shen 等;《IEEE Global Communications Conference》;20181231;全文 *
快速的包分类算法的研究;佘锋;《中国优秀硕士学位论文全文数据库 信息科技辑》;20100415;全文 *

Also Published As

Publication number Publication date
CN111026917A (zh) 2020-04-17
US20220374733A1 (en) 2022-11-24
WO2021088234A1 (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN111026917B (zh) 一种基于卷积神经网络的数据包分类方法及系统
CN112953924B (zh) 网络异常流量检测方法、系统、存储介质、终端及应用
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
JP2020501238A (ja) 顔検出トレーニング方法、装置及び電子機器
CN110796186A (zh) 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN106919957B (zh) 处理数据的方法及装置
CN109656798B (zh) 基于顶点重排序的超级计算机大数据处理能力测试方法
CN113326377B (zh) 一种基于企业关联关系的人名消歧方法及系统
CN112311780A (zh) 一种基于多维度攻击路径与攻击图的生成方法
CN107832456B (zh) 一种基于临界值数据划分的并行knn文本分类方法
CN112948608B (zh) 图片查找方法、装置、电子设备及计算机可读存储介质
CN111460234A (zh) 图查询方法、装置、电子设备及计算机可读存储介质
CN113452802A (zh) 设备型号的识别方法、装置及系统
Zhang et al. Fast online packet classification with convolutional neural network
WO2016112618A1 (zh) 一种基于距离的求解二维空间中代表性节点集的算法
CN112037173B (zh) 染色体检测方法、装置及电子设备
CN112862730A (zh) 点云特征增强方法、装置、计算机设备和存储介质
US20200279148A1 (en) Material structure analysis method and material structure analyzer
CN114556364A (zh) 基于相似度运算符排序的神经架构搜索
CN115225310B (zh) 基于优化元学习的轻量恶意软件流量检测方法及装置
CN107423319B (zh) 一种垃圾网页检测方法
Zhang et al. Post-hoc models for performance estimation of machine learning inference
CN112529112B (zh) 一种矿物识别的方法和装置
CN116975742A (zh) 局部放电模式识别方法、装置、设备和存储介质
CN112765414A (zh) 一种图嵌入向量的生成方法及基于图嵌入的社区发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant