CN111143312A - 一种电力日志的格式解析方法、装置、设备和存储介质 - Google Patents

一种电力日志的格式解析方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111143312A
CN111143312A CN201911349594.6A CN201911349594A CN111143312A CN 111143312 A CN111143312 A CN 111143312A CN 201911349594 A CN201911349594 A CN 201911349594A CN 111143312 A CN111143312 A CN 111143312A
Authority
CN
China
Prior art keywords
power
log
preset field
logs
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911349594.6A
Other languages
English (en)
Inventor
伍晓泉
胡春潮
曾智勇
林丹生
孙毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Electric Power Science Research Institute Energy Technology Co Ltd
Original Assignee
Guangdong Electric Power Science Research Institute Energy Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Electric Power Science Research Institute Energy Technology Co Ltd filed Critical Guangdong Electric Power Science Research Institute Energy Technology Co Ltd
Priority to CN201911349594.6A priority Critical patent/CN111143312A/zh
Publication of CN111143312A publication Critical patent/CN111143312A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种电力日志的格式解析方法、装置、设备和存储介质,其中方法包括:获取若干待解析电力日志;根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析,解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。

Description

一种电力日志的格式解析方法、装置、设备和存储介质
技术领域
本申请网络完全技术领域,尤其涉及一种电力日志的格式解析方法、装置、设备和存储介质。
背景技术
网络安全态势感知系统能够基于环境,动态地、整体地洞悉网络中存在的风险。它以系统日志等大数据为基础,从全局视角提升对风险的发现识别、理解分析、响应处置能力。电力监控系统中,网络安全态势感知系统需要感知的网络终端设备类型和设备型号多种多样,导致各设备产生的电力日志格式千差万别,为了能够在态势感知系统中展示电力日志信息,需要对电力日志进行格式解析。
现有对电力日志进行格式解析时,通常是人基于设备的说明文件,或观察设备发出的电力日志的格式,手工的写出能够匹配其发出的syslog日志的正则表达式,然后利用正则表达式进行格式解析。然而人工编写效率低、工作量大,且错漏多,使得解析过程中常常出错。
发明内容
本申请提供了一种电力日志的格式解析方法、装置、设备和存储介质,解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
有鉴于此,本申请第一方面提供了一种电力日志的格式解析方法,包括:
获取若干待解析电力日志;
根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;
对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;
在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;
用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析。
可选地,
所述第一预置字段具体包括:$TIME$、$IP$和$NUM$。
可选地,
所述对若干所述第一电力日志进行相似度聚类,得到第一聚类日志具体包括:
对比若干所述第一电力日志中的文本,将文本相似度超过预置阈值的第一电力日志进行聚类,得到第一聚类日志。
可选地,
在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志具体包括:
在第一聚类日志中,对比各第一电力日志的文本,并标记对比出的差异文本;
用第二预置字段替换所述差异文本,得到第二聚类日志。
可选地,
所述在第一聚类日志中,对比各第一电力日志的文本,并标记差异文本具体包括:
在第一聚类日志中,对比各第一电力日志的文本,并将对比出的差异文本标记为红色。
可选地,
所述用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段具体包括:
获取各所述第一预置字段对应的正则表达式和所述第二预置字段对应的正则表达式;
用各所述第一预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段,用所述第二预置字段对应的正则表达式替换所述第二聚类日志中的第二预置字段。
本申请第二方面提供了一种电力日志的格式解析装置,包括:
获取单元,用于获取若干待解析电力日志;
第一替换单元,用于根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;
聚类单元,用于对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;
第二替换单元,用于在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;
第三替换单元,用于用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析。
可选地,
所述第一预置字段具体包括:$TIME$、$IP$和$NUM$。
本申请第三方面提供了一种电力日志的格式解析设备,包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的电力日志的格式解析方法。
本申请第四方面提供了一种存储介质,所述存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的电力日志的格式解析方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种电力日志的格式解析方法,包括:获取若干待解析电力日志;根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析。
本申请中,获取待解析电力日志后,首先用第一预置字段替换对应的待解析电力日志中的变量,得到第一电力日志,然后对第一电力日志进行聚类,得到第一聚类日志,然后在第一聚类日志中进行第二预置字段的替换,最后在用第一预置字段对应的正则表达式替换所述第一预置字段,即完成了对待解析电力日志的解析,通过该方法可以自动地对待解析电力日志进行格式解析,无需人工进行,从而解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
附图说明
图1为本申请实施例一提供的一种电力日志的格式解析方法的流程示意图;
图2为本申请实施例二提供的一种电力日志的格式解析方法的流程示意图;
图3为本申请应用例中的若干待解析电力日志的示意图;
图4为本申请应用例中的第一电力日志的示意图;
图5为本申请应用例中的第一聚类日志的示意图;
图6为本申请应用例中的第二聚类日志的第一示意图;
图7为本申请应用例中的第二聚类日志的第二示意图;
图8为本申请实施例提供的一种电力日志的格式解析装置的结构示意图。
具体实施方式
本申请实施例提供了一种电力日志的格式解析方法、装置、设备和存储介质,解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为此,可以参见图1,图1为本申请实施例一提供的电力日志的格式解析方法的流程图,该方法包括:
步骤101、获取若干待解析电力日志。
需要说明的是,待解析电力日志的获取可以是电力设备直接发送的,也可以是通过数据采集器或者其他方式获取到的。
步骤102、根据第一预置字段和变量的对应关系,用第一预置字段替换各待解析电力日志中的变量,得到对应的第一电力日志。
需要说明的是,在得到若干待解析电力日志,根据第一预置字段和变量的对应关系,用第一预置字段替换各待解析电力日志中的变量,得到对应的第一电力日志。
可以理解的是,第一电力日志中的变量为除固有字符外的一些数字或者其他因设备不同而不同的字符。
步骤103、对若干第一电力日志进行相似度聚类,得到第一聚类日志。
需要说明的是,在得到第一电力日志后,对第一电力日志进行相似度聚类,得到第一聚类日志。
步骤104、在第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志。
需要说明的是,在得到第一聚类日志后,在第一聚类日志中,将各第一电力日志用第二预置字段进行替换,得到第二聚类日志。
步骤105、用各第一预置字段、第二预置字段对应的正则表达式替换第二聚类日志中的第一预置字段和第二预置字段,以完成对待解析电力日志的格式解析。
需要说明的是,在得到第二聚类日志后,用个第一预置字段对应的正则表达式替换第二聚类日志中的第一预置字段,即可完成对待解析电力日志的格式解析。
本实施例中,获取待解析电力日志后,首先用第一预置字段替换对应的待解析电力日志中的变量,得到第一电力日志,然后对第一电力日志进行聚类,得到第一聚类日志,然后在第一聚类日志中进行第二预置字段的替换,最后在用第一预置字段对应的正则表达式替换第一预置字段,即完成了对待解析电力日志的解析,通过该方法可以自动地对待解析电力日志进行格式解析,无需人工进行,从而解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
以上为本申请实施例一提供的一种电力日志的格式解析方法。下面请参见图2,图2为本申请实施例二提供的一种电力日志的格式解析方法的流程图,该方法包括:
步骤201、获取若干待解析电力日志。
需要说明的是,步骤201的描述和实施例一中步骤101的描述相同,具体可以参见上述描述,在此不再赘述。
步骤202、根据第一预置字段和变量的对应关系,用第一预置字段替换各待解析电力日志中的变量,得到对应的第一电力日志。
需要说明的是,本实施例中的第一预置字段具体包括:$TIME$、$IP$和$NUM$。
步骤203、对比若干第一电力日志中的文本,将文本相似度超过预置阈值的第一电力日志进行聚类,得到第一聚类日志。
需要说明的是,文本相似度的对比可以采用DSSM等文本相似度匹配算法进行,本领域技术人员可以根据需要进行选择,在此不再赘述。
对于预置阈值是可以根据需要进行配置的,在此不做具体限定。
步骤204、在第一聚类日志中,对比各第一电力日志的文本,并标记对比出的差异文本。
需要说明的是,在第一聚类日志中,对比各第一电力日志的文本,并标记差异文本具体包括:
在第一聚类日志中,对比各第一电力日志的文本,并将对比出的差异文本标记为红色。
步骤205、用第二预置字段替换差异文本,得到第二聚类日志。
步骤206、获取各第一预置字段对应的正则表达式和第二预置字段对应的正则表达式。
步骤207、用各第一预置字段对应的正则表达式替换第二聚类日志中的第一预置字段,用第二预置字段对应的正则表达式替换第二聚类日志中的第二预置字段,以完成对待解析电力日志的格式解析。
本实施例中,获取待解析电力日志后,首先用第一预置字段替换对应的待解析电力日志中的变量,得到第一电力日志,然后对第一电力日志进行聚类,得到第一聚类日志,然后在第一聚类日志中进行第二预置字段的替换,最后在用第一预置字段对应的正则表达式替换第一预置字段,即完成了对待解析电力日志的解析,通过该方法可以自动地对待解析电力日志进行格式解析,无需人工进行,从而解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
以上为本申请实施例二提供的一种电力日志的格式解析方法,以下为本申请实施例提供的一种电力日志的格式解析方法的应用例,包括:
步骤1:以交换机设备为例,得到的若干待解析电力日志如图3所示,其中段1-段5各为一条日志。
步骤2:将待解析电力日志中的时间、IP、数字变量替换为字段“$TIME$”“$IP$”,“$NUM$”从而减少变量对后续步骤效果的影响,得到第一电力日志如图4所示。
其中“$TIME$”、“$IP$”和“$NUM$”各自对应的正则表达式为:
$TIME$=(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\d{2}\d{4}\d{2}:\d{2}:\d{2}。
$IP$=(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)
$NUM$=[0-9]\d*。
步骤3:对第一电力进行聚类,将相似的日志归为同一类,得到第一聚类日志如图5所示。可以理解的是,图5中仅仅对图4中的部分第一电力日志进行了相似度聚类。
步骤4:对步骤3得到的第一聚类日志中的各第一电力日志进行文本差异对比后,将对比出的差异文本部分用红色标计,标记后如图6所示。
步骤5:将对应红色字体部分替换为变量$x$,则$x$=(UP|DOWN)是一个由两个值组成的字符串集合,替换后的第二聚类日志如图7所示。此时,第二聚类日志中的三条日志完全一样。
步骤6:对于第二聚类日志中的任意一条日志,将其自动转换为对应的正则表达式(将括号、书名号、冒号等特殊字符前面增加转义字符“\”)。
对应的正则表达式为:
$TIME$Huawei-S$NUM$%%$NUM$IFPDT\/$NUM$\/IF_STATE\(l\)\[$NUM$\]:Interface GigabitEthernet$NUM$\/$NUM$\/$NUM$has turned into$x$state.
步骤7:将$TIME$、$NUM$、$IP$、$x$对应的正则表达式与步骤6中的正则表达式进行融合,完成对待解析电力日志的解析。
即,将$TIME$=((Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\d{2}\d{4}\d{2}:\d{2}:\d{2})。
$NUM$=([0-9]\d*)。
$x$=(UP|DOWN)。
替换进入相应的位置,生成的正则表达式为:
f2=((Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\d{2}\d{4}\d{2}:\d{2}:\d{2})Huawei-S([0-9]\d*)%%([0-9]\d*)IFPDT\/([0-9]\d*)\/IF_STATE\(l\)\[([0-9]\d*)\]\:Interface GigabitEthernet([0-9]\d*)/([0-9]\d*)/([0-9]\d*)has turned into(UP|DOWN)state。
步骤9:在得到对待解析电力日志进行解析后,可以利用正则表达式验证工具,将日志1,2,3与正则表达式f2相匹配,3条日志全部匹配成功,证明正则表达式生成正确。
以上是本申请实施例二提供的电力日志的格式解析方法。下面请参见图8,图8为本申请第三个实施例提供的电力日志的格式解析装置的结构示意图,该装置包括:
获取单元801,用于获取若干待解析电力日志;
第一替换单元802,用于根据第一预置字段和变量的对应关系,用第一预置字段替换各待解析电力日志中的变量,得到对应的第一电力日志;
聚类单元803,用于对若干第一电力日志进行相似度聚类,得到第一聚类日志;
第二替换单元804,用于在第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;
第三替换单元805,用于用各第一预置字段、第二预置字段对应的正则表达式替换第二聚类日志中的第一预置字段和第二预置字段,以完成对待解析电力日志的格式解析。
第一预置字段具体包括:$TIME$、$IP$和$NUM$。
本实施例中,获取待解析电力日志后,首先用第一预置字段替换对应的待解析电力日志中的变量,得到第一电力日志,然后对第一电力日志进行聚类,得到第一聚类日志,然后在第一聚类日志中进行第二预置字段的替换,最后在用第一预置字段对应的正则表达式替换第一预置字段,即完成了对待解析电力日志的解析,通过该方法可以自动地对待解析电力日志进行格式解析,无需人工进行,从而解决了现有人工进行解析电力日志的格式解析时,效率低、工作量大且常常出错的技术问题。
本申请实施还提供了一种电力日志的格式解析设备,包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行第一实施例或第二实施例的电力日志的格式解析方法。
本申请实施例还提供了一种存储介质,存储介质用于存储程序代码,程序代码用于执行执行第一实施例或第二实施例的电力日志的格式解析方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种电力日志的格式解析方法,其特征在于,包括:
获取若干待解析电力日志;
根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;
对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;
在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;
用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析。
2.根据权利要求1所述的电力日志的格式解析方法,其特征在于,所述第一预置字段具体包括:$TIME$、$IP$和$NUM$。
3.根据权利要求1所述的电力日志的格式解析方法,其特征在于,所述对若干所述第一电力日志进行相似度聚类,得到第一聚类日志具体包括:
对比若干所述第一电力日志中的文本,将文本相似度超过预置阈值的所述第一电力日志进行聚类,得到第一聚类日志。
4.根据权利要求1所述的电力日志的格式解析方法,其特征在于,所述在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志具体包括:
在所述第一聚类日志中,对比各所述第一电力日志的文本,并标记对比出的差异文本;
用第二预置字段替换所述差异文本,得到第二聚类日志。
5.根据权利要求4所述的电力日志的格式解析方法,其特征在于,所述在第一聚类日志中,对比各第一电力日志的文本,并标记差异文本具体包括:
在第一聚类日志中,对比各第一电力日志的文本,并将对比出的差异文本标记为红色。
6.根据权利要求1所述的电力日志的格式解析方法,其特征在于,所述用用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段具体包括:
获取各所述第一预置字段对应的正则表达式和所述第二预置字段对应的正则表达式;
用各所述第一预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段,用所述第二预置字段对应的正则表达式替换所述第二聚类日志中的第二预置字段。
7.一种电力日志的格式解析装置,其特征在于,包括:
获取单元,用于获取若干待解析电力日志;
第一替换单元,用于根据第一预置字段和变量的对应关系,用所述第一预置字段替换各所述待解析电力日志中的变量,得到对应的第一电力日志;
聚类单元,用于对若干所述第一电力日志进行相似度聚类,得到第一聚类日志;
第二替换单元,用于在所述第一聚类日志中,将各第一电力日志的差异文本用第二预置字段进行替换,得到第二聚类日志;
第三替换单元,用于用各第一预置字段、第二预置字段对应的正则表达式替换所述第二聚类日志中的第一预置字段和第二预置字段,以完成对所述待解析电力日志的格式解析。
8.根据权利要求7所述的电力日志的格式解析装置,其特征在于,所述第一预置字段具体包括:$TIME$、$IP$和$NUM$。
9.一种电力日志的格式解析设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1至6中任一项所述的电力日志的格式解析方法。
10.一种存储介质,其特征在于,所述存储介质用于存储程序代码,所述程序代码用于执行权利要求1至6中任一项所述的电力日志的格式解析方法。
CN201911349594.6A 2019-12-24 2019-12-24 一种电力日志的格式解析方法、装置、设备和存储介质 Pending CN111143312A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911349594.6A CN111143312A (zh) 2019-12-24 2019-12-24 一种电力日志的格式解析方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911349594.6A CN111143312A (zh) 2019-12-24 2019-12-24 一种电力日志的格式解析方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN111143312A true CN111143312A (zh) 2020-05-12

Family

ID=70519777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911349594.6A Pending CN111143312A (zh) 2019-12-24 2019-12-24 一种电力日志的格式解析方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111143312A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742192A (zh) * 2021-09-13 2021-12-03 杭州安恒信息技术股份有限公司 日志规则质量分析方法、系统、电子装置和存储介质
CN115686853A (zh) * 2022-11-03 2023-02-03 北京优特捷信息技术有限公司 一种日志要素提取方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049247A (zh) * 2015-07-06 2015-11-11 中国科学院信息工程研究所 一种网络安全日志模板抽取方法及装置
CN105574156A (zh) * 2015-12-16 2016-05-11 华为技术有限公司 文本聚类方法、装置及计算设备
CN107544949A (zh) * 2016-06-29 2018-01-05 腾讯科技(深圳)有限公司 模板合并方法及装置
US20180165147A1 (en) * 2016-12-08 2018-06-14 Nec Laboratories America, Inc. Structure-level anomaly detection for unstructured logs
CN108241658A (zh) * 2016-12-24 2018-07-03 北京亿阳信通科技有限公司 一种日志模式发现方法及系统
US20180307576A1 (en) * 2017-04-21 2018-10-25 Nec Laboratories America, Inc. Field content based pattern generation for heterogeneous logs
US20180357214A1 (en) * 2015-11-13 2018-12-13 Nec Corporation Log analysis system, log analysis method, and storage medium
CN109885456A (zh) * 2019-02-20 2019-06-14 武汉大学 一种基于系统日志聚类的多类型故障事件预测方法及装置
CN110175158A (zh) * 2019-05-23 2019-08-27 湖南大学 一种基于向量化的日志模板提取方法和系统
CN110347827A (zh) * 2019-06-26 2019-10-18 南京理工大学 面向异构文本运维数据的事件提取方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049247A (zh) * 2015-07-06 2015-11-11 中国科学院信息工程研究所 一种网络安全日志模板抽取方法及装置
US20180357214A1 (en) * 2015-11-13 2018-12-13 Nec Corporation Log analysis system, log analysis method, and storage medium
CN105574156A (zh) * 2015-12-16 2016-05-11 华为技术有限公司 文本聚类方法、装置及计算设备
CN107544949A (zh) * 2016-06-29 2018-01-05 腾讯科技(深圳)有限公司 模板合并方法及装置
US20180165147A1 (en) * 2016-12-08 2018-06-14 Nec Laboratories America, Inc. Structure-level anomaly detection for unstructured logs
CN108241658A (zh) * 2016-12-24 2018-07-03 北京亿阳信通科技有限公司 一种日志模式发现方法及系统
US20180307576A1 (en) * 2017-04-21 2018-10-25 Nec Laboratories America, Inc. Field content based pattern generation for heterogeneous logs
CN109885456A (zh) * 2019-02-20 2019-06-14 武汉大学 一种基于系统日志聚类的多类型故障事件预测方法及装置
CN110175158A (zh) * 2019-05-23 2019-08-27 湖南大学 一种基于向量化的日志模板提取方法和系统
CN110347827A (zh) * 2019-06-26 2019-10-18 南京理工大学 面向异构文本运维数据的事件提取方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742192A (zh) * 2021-09-13 2021-12-03 杭州安恒信息技术股份有限公司 日志规则质量分析方法、系统、电子装置和存储介质
CN115686853A (zh) * 2022-11-03 2023-02-03 北京优特捷信息技术有限公司 一种日志要素提取方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
CN107992490B (zh) 一种数据处理方法以及数据处理设备
CN108334533B (zh) 关键词提取方法和装置、存储介质及电子装置
CN108319888B (zh) 视频类型的识别方法及装置、计算机终端
CN101299857A (zh) 一种输出通讯信息的方法及装置
WO2017104119A1 (ja) ログ分析システム、方法およびプログラム
CN110909168B (zh) 知识图谱的更新方法和装置、存储介质及电子装置
CN103365970A (zh) 自动获取学习资料信息的方法和装置
CN111143312A (zh) 一种电力日志的格式解析方法、装置、设备和存储介质
CN104750791A (zh) 一种图像检索方法及装置
CN111797594A (zh) 基于人工智能的字符串处理方法及相关设备
CN112783825B (zh) 数据归档方法、装置、计算机装置及存储介质
CN110532449B (zh) 一种业务文档的处理方法、装置、设备和存储介质
CN111259207A (zh) 短信的识别方法、装置及设备
CN111931491B (zh) 领域词典构建方法及装置
CN110134920A (zh) 绘文字兼容显示方法、装置、终端及计算机可读存储介质
CN108170838B (zh) 话题演变的可视化展现方法、应用服务器及计算机可读存储介质
CN107329946B (zh) 相似度的计算方法和装置
CN109787887A (zh) 告警信息管理方法、装置、计算机装置及可读存储介质
CN107798004B (zh) 关键词查找方法、装置及终端
CN115062132A (zh) 识别模型训练方法及装置、意图类别识别方法及装置
CN113688240A (zh) 威胁要素提取方法、装置、设备及存储介质
CN113420549A (zh) 异常字符串识别方法及装置
CN110875959B (zh) 识别数据的方法、识别垃圾邮箱的方法及文件识别的方法
CN113283232A (zh) 自动解析文本中隐私信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 501-503, annex building, Huaye building, No.1-3 Chuimao new street, Xihua Road, Yuexiu District, Guangzhou City, Guangdong Province 510000

Applicant after: China Southern Power Grid Power Technology Co.,Ltd.

Address before: Room 501-503, annex building, Huaye building, No.1-3 Chuimao new street, Xihua Road, Yuexiu District, Guangzhou City, Guangdong Province 510000

Applicant before: GUANGDONG DIANKEYUAN ENERGY TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200512