CN111585809A - 一种利用大数据统计分析进行网络设备配置稽核的方法 - Google Patents
一种利用大数据统计分析进行网络设备配置稽核的方法 Download PDFInfo
- Publication number
- CN111585809A CN111585809A CN202010370623.3A CN202010370623A CN111585809A CN 111585809 A CN111585809 A CN 111585809A CN 202010370623 A CN202010370623 A CN 202010370623A CN 111585809 A CN111585809 A CN 111585809A
- Authority
- CN
- China
- Prior art keywords
- configuration
- script
- different
- statistical analysis
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000007619 statistical method Methods 0.000 title claims abstract description 41
- 238000013515 script Methods 0.000 claims abstract description 67
- 238000004458 analytical method Methods 0.000 claims abstract description 32
- 230000006870 function Effects 0.000 claims abstract description 15
- 238000012163 sequencing technique Methods 0.000 claims abstract description 3
- 238000000605 extraction Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000007689 inspection Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000013024 troubleshooting Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000005065 mining Methods 0.000 claims description 4
- 238000009412 basement excavation Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000013468 resource allocation Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0859—Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种利用大数据统计分析进行网络设备配置稽核的方法,包括下列步骤:步骤1)将大量历史配置脚本中的文本信息按照不同的维度划分成不同的主体,并通过统计分析将不同维度的主体进行频次统计,按照统计频次排序构建不同维度的主体集合,即配置基线;步骤2)对配置脚本的频次统计,按照层级分为关键字、命令行、配置功能段、角色四个维度,并按照四个维度进行统计和扫描;步骤3)通过自然语言分析中的知识图谱方法,将配置脚本中的不同主体之间的关联关系通过图数据库的形式存储起来,图数据库可以提供配置知识的查询等。
Description
技术领域
本发明属于一种利用大数据统计分析进行网络设备配置稽核的方法,属于互联网领域。
背景技术
网络运营随着科技的进步,也迎来了新一轮挑战,运营商网络设备的规模变得非常巨大,通常一个省的设备量达几万级别。传统的网络运维工作是在设备发生异常时才会查看相应的配置脚本,并且面对上万行的脚本文件,运维人员只能对异常部分脚本进行检查和修改。最糟糕的是,脚本中存在着很多的冗余配置,由不同的运维人员进行维护,没有人会主动删除这些冗余配置。但恰恰是这些冗余配置在网络变更时非常容易引起较大的问题,排障难度系数非常高。本方法提出了一种利用大数据统计分析进行网络设备配置稽核的方法,首先通过大数据统计分析学习到配置基线;然后对待检测配置脚本进行扫描发现异常;最后,对异常进行分析,查询主体之间关联关系给出修改建议。本方法不仅可以在较短的时间内给出配置问题列表,还能对问题的修改给出比较好的建议。
(1)传统的配置检查工具强依赖规则、依赖专业、依赖设备厂家,对于现网设备版本的更替,对应工具更新升级困难;
解决:本方法是从大数据统计的处理方法,学习到配置脚本中的统计特征,从而用于配置检查。对于网络的变更,统计分析可以通过不断的模型训练来实现对网络变更的及时响应。
(2)传统工具的稽核效率低,需要人为确认稽核结果,并且查找解决办法,强依赖专业维护人员,人力成本高;
发明内容
本发明所要解决的技术问题是提供一种利用大数据统计分析进行网络设备配置稽核的方法。
本发明解决上述技术问题所采取的技术方案如下:
一种利用大数据统计分析进行网络设备配置稽核的方法,包括:
步骤1)将大量历史配置脚本中的文本信息按照不同的维度划分成不同的主体,并通过统计分析将不同维度的主体进行频次统计,按照统计频次排序构建不同维度的主体集合,即配置基线;
步骤2)对配置脚本的频次统计,按照层级分为关键字、命令行、配置功能段、角色四个维度,并按照四个维度进行统计和扫描;
步骤3)通过自然语言分析中的知识图谱方法,将配置脚本中的不同主体之间的关联关系通过图数据库的形式存储起来,图数据库可以提供配置知识的查询;
步骤4)对于大数据统计分析中扫描出的异常点,通过查询关联关系知识图谱追溯异常点主体的真实关联情况,从而可以分析出异常点的真正原因和修改的最佳建议。
优选的是,步骤2)中,具体包括:
当所述维度是关键字时,对关键字维度进行统计和扫描包括:
子步骤21)关键字模型,分析对象提取:
设备配置文件中与设备本身相关的关键字包括设备型号、版本号、设备名称相关信息;与规格相关的关键字包括各个模块资源分配值、参数;与业务相关的关键字包括运行的协议名、创建的用户名称;
这部分主要通过专家经验标注,由系统自动读取,利用自然语言分析方法对关键字进行编码,形成关键字字典。
优选的是,步骤2)中,具体包括:
当所述维度是命令行时,对命令行拼写规范分析,包括:
第一步:命令行关键字提取:
利用自然语言分析算法提取每一条配置命令行中的关键字,对关键字进行编码,将命令行文本数字化,形成配置命令数字向量;
第二步:命令行模板提取:
对配置命令中的数字变量进行通配符替换,形成命令格式模板,这些样式通过统计统一编码,构成命令行模板集合;
第三步:命令行拼写检查:
通过提取的命令模板,依据对历史数据的统计,频次较高的模板被认为是配置基线的模板。
优选的是,在对配置文件扫描时,通过统计分析得到的正确基线模板对脚本中的每一条命令进行拼写检查,检查过程中结合关键字字典中的关键字属性,对命令行进行智能识别和匹配。
优选的是,步骤2),具体包括:
当所述维度是配置功能段时,其业务逻辑分析包括:
第一步:功能段特征提取
对脚本段落进行数据序列特征提取,对于不同段落通过算法总结配置规律,例如不同的接口下的配置规则、不同网络协议的配置规则;
第二步:功能段模板挖掘
对不同的逻辑脚本块进行模板提取之后,形成不同配置功能块的模板,每一个模板是一个命令行序列;
对大量的相同配置逻辑脚本块进行统计学习,对逻辑脚本段落提取的模板进行聚类分析可以总结出配置逻辑脚本块的类别划分;
第三步:功能段逻辑检查
同样通过对历史数据的统计分析,得到出现频次最高的功能段命令行组合,认为是功能段的配置基线。
优选的是,利用频繁项集算法对每条命令前后的关联关系提取,专家经验有监督的矫正,训练的脚本块基线模型可以对脚本文件中的逻辑单元块进行隐患和故障排查,如错配、漏配、冗余。
优选的是,步骤2中,具体包括:
当所述维度是角色时,对设备个性化分析,包括:
第一步:设备角色基线挖掘
对相同角色设备的配置历史数据进行统计分析,同样认为出现频次越大的配置特征更贴近正确的配置基线,对网络中相同角色设备的脚本文件进行特征向量提取、聚类,形成这一类设备角色的脚本指纹基线;
第二步:角色相关隐患排查
训练的设备角色脚本基线模型可以对脚本文件进行个性化隐患和故障排查。不同型号或角色的设备配置是不一样的,检查关注点会有区别,主要体现在配置脚本中的功能块模板的不同组合;
根据配置文件相似度,对配置文件进行类别打标签,通过类别属性对配置文件进行个性化扫描检查。
本发明采取了上述方案以后,通过对历史配置的大量统计分析,学习到的基线代替了专业知识,不仅可以快速发现配置中存在的问题,还可以将解决方法推送给运维人员。不仅节省了人力,更大大提高了配置稽核的效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,
图1是本发明利用大数据统计分析进行网络设备配置稽核的方法的流程示意图;
图2是本发明利用大数据统计分析进行网络设备配置稽核的方法的配置样式的结构示意图;
图3是本发明利用大数据统计分析进行网络设备配置稽核的方法的命令行模板集合示意图;
图4是本发明利用大数据统计分析进行网络设备配置稽核的方法的配置规则示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
具体来说,网络设备的配置都是依据设备厂商提供的配置规范手册进行设置的,所以设备中的配置绝大多数是标准的。
因此本方法认为,配置脚本中出现的配置命令频次越大,配置越接近标准,是配置异常的可能性越小;出现频次越低的配置是异常的几率越大。即绝对出现次数的占比作为配置正确的支持度参数。如图1所示,其中左侧配置样式中的L11出现次数是1次,右侧配置样式中的L10和L11出现次数是1731次,则认为左侧配置样式中的L11是错误的,并且可以根据右侧的配置样式进行修改调整。
所以在本方法中利用大数据统计分析进行配置脚本的基线学习,通过扫描策略将配置文件中的各项错误配置和隐患配置进行提前发现,并通过推送告警以及提供修改建议指引运维一线人员,辅助及时修改现网中存在的配置隐患。
如图2所示是本方法的大数据分析主要技术方案,本方法将大量历史配置脚本中的文本信息按照不同的维度划分成不同的主体,并通过统计分析将不同维度的主体进行频次统计,按照统计频次排序构建不同维度的主体集合——配置基线。
配置基线就是大数据统计分析获得的一份配置脚本答案,它虽然不是标准答案,但却会随着样本量的增加无限逼近标准答案,是一份可以作为参考的优秀答案。在扫描流程中对照这份参考答案,对其他网络设备的配置文件进行扫描,找到配置异常点,再经过关联关系分析将异常点修改的参考答案一并推送给运维人员。
对配置脚本的频次统计,按照层级分为关键字、命令行、配置功能段、角色四个维度。如下是按照四个维度的统计和扫描策略:
(1)关键字模型——分析对象提取
设备配置文件中与设备本身相关的关键字包括设备型号、版本号、设备名称等相关信息;与规格相关的关键字包括各个模块资源分配值、参数等;与业务相关的关键字包括运行的协议名、创建的用户名称等。这部分主要通过专家经验标注,由系统自动读取。利用自然语言分析方法对关键字进行编码,形成关键字字典。
(2)命令行模型——命令行拼写规范分析
第一步:命令行关键字提取:
利用自然语言分析算法提取每一条配置命令行中的关键字,对关键字进行编码,将命令行文本数字化,形成配置命令数字向量。
第二步:命令行模板提取
对配置命令中的数字变量进行通配符替换,形成命令格式模板。如图3中左侧为配置文件中的原始样式,右侧为将数字变量替换成通配符的样式,这些样式通过统计统一编码,构成命令行模板集合,其中Template表示命令行模板,a、b、c、d、……∈{1、2、3、……、S},S表示命令行模板集合的大小。
第三步:命令行拼写检查
通过提取的命令模板,依据对历史数据的统计,频次较高的模板被认为是配置基线的模板。在对配置文件扫描时,可以通过统计分析得到的正确基线模板对脚本中的每一条命令进行拼写检查,检查过程中结合关键字字典中的关键字属性,对命令行进行智能识别和匹配。
(3)功能段落模型——业务逻辑分析
第一步:功能段特征提取
对脚本段落进行数据序列特征提取,对于不同段落通过算法总结配置规律,例如不同的接口下的配置规则、不同网络协议的配置规则,如图4。
第二步:功能段模板挖掘
对不同的逻辑脚本块进行模板提取之后,形成不同配置功能块的模板,每一个模板是一个命令行序列,形式如下:
Feature-intface:{Template_a,Template_b,Template_c,......,Template_N}
Feature-ospf:{Template_i,Template_j,Template_k,......,Template_M}
其中Feature-*表示一个功能块的模板名称,a、b、c、N、i、j、k、M∈{1、2、3、……、S},S表示命令行模板集合的大小。
对大量的相同配置逻辑脚本块进行统计学习,对逻辑脚本段落提取的模板进行聚类分析可以总结出配置逻辑脚本块的类别划分。
第三步:功能段逻辑检查
同样通过对历史数据的统计分析,得到出现频次最高的功能段命令行组合,认为是功能段的配置基线。利用频繁项集算法对每条命令前后的关联关系提取,专家经验有监督的矫正。训练的脚本块基线模型可以对脚本文件中的逻辑单元块进行隐患和故障排查,如错配、漏配、冗余等。
(4)角色模型——设备个性化分析
第一步:设备角色基线挖掘
对相同角色设备的配置历史数据进行统计分析,同样认为出现频次越大的配置特征更贴近正确的配置基线。对网络中相同角色设备(有监督标记正确)的脚本文件进行特征向量(配置逻辑功能块)提取、聚类,形成这一类设备角色的脚本指纹基线。如下方所示,其中Device-*表示角色名称,Feature-*表示脚本中的功能块模板。
Device-*:{Feature-*,Feature-*,Feature-*,......,Feature-*}
第二步:角色相关隐患排查
训练的设备角色脚本基线模型可以对脚本文件进行个性化隐患和故障排查。不同型号或角色的设备配置是不一样的,检查关注点会有区别,主要体现在配置脚本中的功能块模板的不同组合。根据配置文件相似度,对配置文件进行类别打标签,通过类别属性对配置文件进行个性化扫描检查。
(5)关联模型——异常点分析
第一步:关联关系知识提取
通过自然语言分析中的知识图谱方法,可以将配置脚本中的不同主体之间的关联关系通过图数据库的形式存储起来,图数据库可以提供配置知识的查询。
第二步:异常点分析精准定位
对于大数据统计分析中扫描出的异常点,通过查询关联关系知识图谱可以追溯异常点主体的真实关联情况,从而可以分析出异常点的真正原因和修改的最佳建议。
本方法,不仅提供了大数据统计分析模型的构建过程,还提供了大数据统计的分析逻辑;同时通过搜索关联关系对扫描出的配置隐患进行精准定因。作为网络设备配置脚本文件的一种稽核方法,即支持离线批量文本扫描,还支持在线定点分析。对于智慧运维领域,提供了一种配置稽核的能力,既可以最为一套独立的巡检系统,又可以提供给其他系统作为一个验证稽核原子模块。
本方法,通过对网络设备的配置脚本进行大数据挖掘,得到配置脚本的统计特征;通过”配置脚本中出现的配置命令频次越大,配置越接近标准,是配置异常的可能性越小;出现频次较低的配置是异常的几率较大。”原则,得到统计分析的配置基线;与基线对比进行配置脚本稽核;通过关联关系分析对配置异常进行根因定位。
本方法的优点:
(1)本方法采用自然语言分析方法将网络设备的配置脚本文本进行了数值化,数值化之后的信息处理方便又高效,同时可以方便的与网络中的其他指标进行组合分析,对于智慧运维具备非常好的意义;
(2)本方法采用了大数据统计分析技术,这套统计分析逻辑具有很好的学习能力,可以轻松的应对现网中的结构复杂、快速更新等情况,具有非常好的推广性;
(3)是一种非常高效的配置稽核方法,稽核时间缩短90%以上。
需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,包括下列步骤:
步骤1)将大量历史配置脚本中的文本信息按照不同的维度划分成不同的主体,并通过统计分析将不同维度的主体进行频次统计,按照统计频次排序构建不同维度的主体集合,即配置基线;
步骤2)对配置脚本的频次统计,按照层级分为关键字、命令行、配置功能段、角色四个维度,并按照四个维度进行统计和扫描;
步骤3)通过自然语言分析中的知识图谱方法,将配置脚本中的不同主体之间的关联关系通过图数据库的形式存储起来,图数据库可以提供配置知识的查询;
步骤4)对于大数据统计分析中扫描出的异常点,通过查询关联关系知识图谱追溯异常点主体的真实关联情况,从而可以分析出异常点的真正原因和修改的最佳建议。
2.根据权利要求1所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,步骤2)中,具体包括:
当所述维度是关键字时,对关键字维度进行统计和扫描包括:
子步骤21)关键字模型,分析对象提取:
设备配置文件中与设备本身相关的关键字包括设备型号、版本号、设备名称相关信息;与规格相关的关键字包括各个模块资源分配值、参数;与业务相关的关键字包括运行的协议名、创建的用户名称;
这部分主要通过专家经验标注,由系统自动读取,利用自然语言分析方法对关键字进行编码,形成关键字字典。
3.根据权利要求1所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,步骤2)中,具体包括:
当所述维度是命令行时,对命令行拼写规范分析,包括:
第一步:命令行关键字提取:
利用自然语言分析算法提取每一条配置命令行中的关键字,对关键字进行编码,将命令行文本数字化,形成配置命令数字向量;
第二步:命令行模板提取:
对配置命令中的数字变量进行通配符替换,形成命令格式模板,这些样式通过统计统一编码,构成命令行模板集合;
第三步:命令行拼写检查:
通过提取的命令模板,依据对历史数据的统计,频次较高的模板被认为是配置基线的模板。
4.根据权利要求3所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,在对配置文件扫描时,通过统计分析得到的正确基线模板对脚本中的每一条命令进行拼写检查,检查过程中结合关键字字典中的关键字属性,对命令行进行智能识别和匹配。
5.根据权利要求1所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,步骤2),具体包括:
当所述维度是配置功能段时,其业务逻辑分析包括:
第一步:功能段特征提取
对脚本段落进行数据序列特征提取,对于不同段落通过算法总结配置规律,例如不同的接口下的配置规则、不同网络协议的配置规则;
第二步:功能段模板挖掘
对不同的逻辑脚本块进行模板提取之后,形成不同配置功能块的模板,每一个模板是一个命令行序列;
对大量的相同配置逻辑脚本块进行统计学习,对逻辑脚本段落提取的模板进行聚类分析可以总结出配置逻辑脚本块的类别划分;
第三步:功能段逻辑检查
同样通过对历史数据的统计分析,得到出现频次最高的功能段命令行组合,认为是功能段的配置基线。
6.根据权利要求5所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,利用频繁项集算法对每条命令前后的关联关系提取,专家经验有监督的矫正,训练的脚本块基线模型可以对脚本文件中的逻辑单元块进行隐患和故障排查,如错配、漏配、冗余。
7.根据权利要求1所述的利用大数据统计分析进行网络设备配置稽核的方法,其特征在于,步骤2中,具体包括:
当所述维度是角色时,对设备个性化分析,包括:
第一步:设备角色基线挖掘
对相同角色设备的配置历史数据进行统计分析,同样认为出现频次越大的配置特征更贴近正确的配置基线,对网络中相同角色设备的脚本文件进行特征向量提取、聚类,形成这一类设备角色的脚本指纹基线;
第二步:角色相关隐患排查
训练的设备角色脚本基线模型可以对脚本文件进行个性化隐患和故障排查。不同型号或角色的设备配置是不一样的,检查关注点会有区别,主要体现在配置脚本中的功能块模板的不同组合;
根据配置文件相似度,对配置文件进行类别打标签,通过类别属性对配置文件进行个性化扫描检查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010370623.3A CN111585809A (zh) | 2020-04-29 | 2020-04-29 | 一种利用大数据统计分析进行网络设备配置稽核的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010370623.3A CN111585809A (zh) | 2020-04-29 | 2020-04-29 | 一种利用大数据统计分析进行网络设备配置稽核的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111585809A true CN111585809A (zh) | 2020-08-25 |
Family
ID=72117128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010370623.3A Pending CN111585809A (zh) | 2020-04-29 | 2020-04-29 | 一种利用大数据统计分析进行网络设备配置稽核的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111585809A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704241A (zh) * | 2021-10-27 | 2021-11-26 | 国网浙江省电力有限公司信息通信分公司 | 一种低业务依赖的能源数据智能稽核方法 |
WO2022042152A1 (zh) * | 2020-08-31 | 2022-03-03 | 中兴通讯股份有限公司 | 多维网络指标的关联规则分析方法、设备和存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104811959A (zh) * | 2015-05-25 | 2015-07-29 | 中国联合网络通信有限公司成都市分公司 | 基于大数据的移动网络用户感知分析系统和方法 |
WO2016202098A1 (zh) * | 2015-06-16 | 2016-12-22 | 中兴通讯股份有限公司 | 一种以太网业务配置方法、装置及网管 |
US20170039554A1 (en) * | 2015-08-04 | 2017-02-09 | Dynatrace Llc | Method And System For Real-Time, Load-Driven Multidimensional And Hierarchical Classification Of Monitored Transaction Executions For Visualization And Analysis Tasks Like Statistical Anomaly Detection |
CN106406858A (zh) * | 2016-08-30 | 2017-02-15 | 国电南瑞科技股份有限公司 | 一种基于配置文件的流式统计定义及运行方法 |
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN108876636A (zh) * | 2018-06-19 | 2018-11-23 | 平安健康保险股份有限公司 | 理赔智能风控方法、系统、计算机设备及存储介质 |
CN109818763A (zh) * | 2017-11-20 | 2019-05-28 | 北京绪水互联科技有限公司 | 设备故障的分析统计方法和系统及设备实时质控方法和系统 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110264336A (zh) * | 2019-05-28 | 2019-09-20 | 浙江邦盛科技有限公司 | 一种基于大数据的智能案防系统 |
CN110347894A (zh) * | 2019-05-31 | 2019-10-18 | 平安科技(深圳)有限公司 | 基于爬虫的知识图谱处理方法、装置、计算机设备及存储介质 |
CN110717050A (zh) * | 2019-09-17 | 2020-01-21 | 金色熊猫有限公司 | 一种知识图谱数据库的访问方法及装置 |
CN110807085A (zh) * | 2019-09-12 | 2020-02-18 | 口碑(上海)信息技术有限公司 | 故障信息的查询方法及装置、存储介质、电子装置 |
CN110855503A (zh) * | 2019-11-22 | 2020-02-28 | 叶晓斌 | 一种基于网络协议层级依赖关系的故障定因方法和系统 |
CN110855502A (zh) * | 2019-11-22 | 2020-02-28 | 叶晓斌 | 一种基于时空分析日志的故障定因方法和系统 |
-
2020
- 2020-04-29 CN CN202010370623.3A patent/CN111585809A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104811959A (zh) * | 2015-05-25 | 2015-07-29 | 中国联合网络通信有限公司成都市分公司 | 基于大数据的移动网络用户感知分析系统和方法 |
WO2016202098A1 (zh) * | 2015-06-16 | 2016-12-22 | 中兴通讯股份有限公司 | 一种以太网业务配置方法、装置及网管 |
US20170039554A1 (en) * | 2015-08-04 | 2017-02-09 | Dynatrace Llc | Method And System For Real-Time, Load-Driven Multidimensional And Hierarchical Classification Of Monitored Transaction Executions For Visualization And Analysis Tasks Like Statistical Anomaly Detection |
CN106406858A (zh) * | 2016-08-30 | 2017-02-15 | 国电南瑞科技股份有限公司 | 一种基于配置文件的流式统计定义及运行方法 |
WO2018072563A1 (zh) * | 2016-10-18 | 2018-04-26 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN109818763A (zh) * | 2017-11-20 | 2019-05-28 | 北京绪水互联科技有限公司 | 设备故障的分析统计方法和系统及设备实时质控方法和系统 |
CN108876636A (zh) * | 2018-06-19 | 2018-11-23 | 平安健康保险股份有限公司 | 理赔智能风控方法、系统、计算机设备及存储介质 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110264336A (zh) * | 2019-05-28 | 2019-09-20 | 浙江邦盛科技有限公司 | 一种基于大数据的智能案防系统 |
CN110347894A (zh) * | 2019-05-31 | 2019-10-18 | 平安科技(深圳)有限公司 | 基于爬虫的知识图谱处理方法、装置、计算机设备及存储介质 |
CN110807085A (zh) * | 2019-09-12 | 2020-02-18 | 口碑(上海)信息技术有限公司 | 故障信息的查询方法及装置、存储介质、电子装置 |
CN110717050A (zh) * | 2019-09-17 | 2020-01-21 | 金色熊猫有限公司 | 一种知识图谱数据库的访问方法及装置 |
CN110855503A (zh) * | 2019-11-22 | 2020-02-28 | 叶晓斌 | 一种基于网络协议层级依赖关系的故障定因方法和系统 |
CN110855502A (zh) * | 2019-11-22 | 2020-02-28 | 叶晓斌 | 一种基于时空分析日志的故障定因方法和系统 |
Non-Patent Citations (1)
Title |
---|
马铮等: "网络设备安全基线配置核查分析系统设计与实现", 《邮电设计技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022042152A1 (zh) * | 2020-08-31 | 2022-03-03 | 中兴通讯股份有限公司 | 多维网络指标的关联规则分析方法、设备和存储介质 |
CN113704241A (zh) * | 2021-10-27 | 2021-11-26 | 国网浙江省电力有限公司信息通信分公司 | 一种低业务依赖的能源数据智能稽核方法 |
CN113704241B (zh) * | 2021-10-27 | 2022-03-08 | 国网浙江省电力有限公司信息通信分公司 | 一种低业务依赖的能源数据智能稽核方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256074B (zh) | 校验处理的方法、装置、电子设备和存储介质 | |
CN110175158B (zh) | 一种基于向量化的日志模板提取方法和系统 | |
WO2022110637A1 (zh) | 问答对话评测方法、装置、设备及存储介质 | |
CN109446221B (zh) | 一种基于语义分析的交互式数据探查方法 | |
CN106649557B (zh) | 一种缺陷报告与邮件列表语义关联挖掘方法 | |
CN111585809A (zh) | 一种利用大数据统计分析进行网络设备配置稽核的方法 | |
CN114218402B (zh) | 一种计算机硬件故障更换件推荐的方法 | |
CN113468317B (zh) | 一种简历筛选方法、系统、设备和存储介质 | |
CN113221960A (zh) | 一种高质量漏洞数据收集模型的构建方法及收集方法 | |
CN109918100B (zh) | 一种面向版本缺陷的基于修复模式的修复推荐方法 | |
CN112416732B (zh) | 一种基于隐马尔可夫模型的数据采集运行异常检测方法 | |
CN116932499B (zh) | 一种dwg格式文件批量修改标注的方法 | |
CN110956030B (zh) | 变电站远动机组态配置信息比对方法及系统 | |
CN117290404A (zh) | 一种主配网故障处理方法快速检索实用方法及系统 | |
US10956672B1 (en) | High volume message classification and distribution | |
CN116578700A (zh) | 日志分类方法、日志分类装置、设备及介质 | |
CN111026743A (zh) | 轨道交通工程项目结构数据标准化方法 | |
CN114969074A (zh) | 一种基于互联网ai外呼的数据库更新方法、系统及装置 | |
CN115713970A (zh) | 基于Transformer-Encoder和多尺度卷积神经网络的转录因子识别方法 | |
CN114239553A (zh) | 基于人工智能的日志审核方法、装置、设备及介质 | |
CN112100373A (zh) | 一种基于深度神经网络的合同文本分析方法及系统 | |
CN117112791B (zh) | 一种未知日志分类决策系统、方法、装置及可读存储介质 | |
CN113313184B (zh) | 一种异质集成的自承认技术债务自动检测方法 | |
CN112667666A (zh) | 一种基于N-gram的SQL运行时间预测方法及系统 | |
CN118193716A (zh) | 一种基于大模型和规则推理的自更新法律类案推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |
|
RJ01 | Rejection of invention patent application after publication |