CN109325009A - 日志解析的方法及装置 - Google Patents

日志解析的方法及装置 Download PDF

Info

Publication number
CN109325009A
CN109325009A CN201811094331.0A CN201811094331A CN109325009A CN 109325009 A CN109325009 A CN 109325009A CN 201811094331 A CN201811094331 A CN 201811094331A CN 109325009 A CN109325009 A CN 109325009A
Authority
CN
China
Prior art keywords
field
data field
matching rule
target
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811094331.0A
Other languages
English (en)
Other versions
CN109325009B (zh
Inventor
张春飞
朱仕阳
许峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaxin Technology (chengdu) Co Ltd
Original Assignee
Yaxin Technology (chengdu) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaxin Technology (chengdu) Co Ltd filed Critical Yaxin Technology (chengdu) Co Ltd
Priority to CN201811094331.0A priority Critical patent/CN109325009B/zh
Publication of CN109325009A publication Critical patent/CN109325009A/zh
Application granted granted Critical
Publication of CN109325009B publication Critical patent/CN109325009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种日志解析的方法及装置,涉及计算机技术领域,能够对非结构化数据进行数据解析,从而使非结构化数据转换为结构化数据,以便后续的统计分析。其中,方法包括:获取原始日志;根据原始日志的格式,在预设配置文件中找到与原始日志的格式对应的目标第一匹配规则;根据目标第一匹配规则,从第一数量的数据字段中确定第二数量的目标数据字段,以及与每个目标数据字段对应的字段名称、索引号、字段属性;将第二数量的目标数据字段以及每个目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。

Description

日志解析的方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种日志解析的方法及装置。
背景技术
现有的实现方案中,不同格式的日志需要使用对应的解析方法进行解析。在大数据急速发展的今天,日志格式五花八门,每遇到一种新格式的日志,都需要人工编写相应的解析代码去解析日志。而且,日志在使用的过程中,其格式经常因为业务需求有变化而改变,导致日志的解析代码也需要随之人为更新维护,从而需要花费大量的时间成本和人力成本。
发明内容
本发明实施例提供一种日志解析的方法及装置,对不同格式的日志都使用一种通用的方法进行解析,从而便于后续的统计分析,能够节省时间成本和人力成本。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种日志解析的方法,该方法可以包括:获取原始日志,所述原始日志包括第一数量的数据字段;根据原始日志的格式,在预设配置文件中找到与原始日志的格式对应的目标第一匹配规则;其中,预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志;根据目标第一匹配规则,从第一数量的数据字段中确定第二数量的目标数据字段,以及与每个目标数据字段对应的字段名称、索引号、字段属性;将第二数量的目标数据字段以及每个目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
第二方面,本申请提供一种日志解析的装置,该装置包括:获取模块和处理模块。其中,获取模块用于获取原始日志,所述原始日志包括第一数量的数据字段。处理模块,用于根据所述原始日志的格式,在预设配置文件中找到与所述原始日志的格式对应的目标第一匹配规则;其中,所述预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及所述数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志;所述处理模块,还用于根据目标第一匹配规则,从第一数量的数据字段中确定第二数量的目标数据字段,以及与每个目标数据字段对应的字段名称、索引号、字段属性;所述处理模块,还用于将第二数量的目标数据字段以及每个目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
第三方面,本申请提供一种日志解析的装置,该装置包括:处理器、收发器和存储器。其中,存储器用于存储一个或多个程序。该一个或多个程序包括计算机执行指令,当该装置运行时,处理器执行该存储器存储的该计算机执行指令,以使该装置执行第一方面及其各种可选的实现方式中任意之一所述的日志解析的方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当装置执行该指令时,该装置执行上述第一方面及其各种可选的实现方式中任意之一所述的日志解析的方法。
本申请提供的日志解析的方法和装置,采用配置文件的方式针对原始日志进行解析;抽取指定的数据字段后,形成结构化存储的数据格式进行存储;并且我们利用配置文件即可完成非结构化数据至结构化数据的转换;提供一种支持多种格式日志的通用解析方法,这些格式的解析都无需开发人员进行代码开发,而是直接配置完成,从而便于后续的统计分析,能够节省时间成本和人力成本。
附图说明
图1为本申请实施例提供的日志解析的方法的流程示意图;
图2为本申请实施例提供的装置的结构示意图一;
图3为本申请实施例提供的装置的结构示意图二。
具体实施方式
下面结合附图对本申请实施例提供的日志解析的方法及装置进行详细地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
本申请实施例提供的日志解析的方法,可以对不同格式的日志进行解析。
本申请实施例提供一种日志解析的方法,可以应用于任意计算机设备,如图1所示,该方法可以包括S101-S104:
S101、获取原始日志,所述原始日志包括第一数量的数据字段。
具体的,原始日志为设备发送来的日志,比如设备的运行日志、防火墙的防护日志等。原始日志包括若干数据字段,其中包含待解析的信息。本申请实施例中,原始日志中的数据字段为非结构化数据。非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。
S102、根据所述原始日志的格式,在预设配置文件中找到与所述原始日志的格式对应的目标第一匹配规则。
其中,所述预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及所述数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志。所述格式既可以指日志的文件格式,比如js文件格式、html文件格式、txt文件格式,也可以指日志内部的文本描述格式,比如JSON格式、XML格式。
具体的,本申请实施例中,预设配置文件为一个可扩展标记语言(eXtensibleMarkup Language,XML)文件。一个预设配置文件的实例为:
其中,标签<parsefile>中包括的内容即为一个第一匹配规则。本实施例中,预设配置文件仅包含一个第一匹配规则,但是本申请不限制预设配置文件中第一匹配规则的数量。在实际场景中,预设配置文件中可以设置多个第一匹配规则,以适用不同格式的日志。
本实施例中,标签<parsefile>中包括字段的名称,索引号,字段属性等内容。比如,<parsefile Name="sanfor"Text="sanfor"Type="Char"Encode="">中,Name表示日志的名称,Text表示日志的描述,Type表示日志的类型。
标签<parse>中包括正则表达式,正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。比如,Match='<\d+>(\d+).*日志类型:(.*),\s+源IP:(.*),\s+源端口:(.*),\s+目的IP:(.*),\s+目的端口:(.*),\s+协议:(.*),\s+攻击类型:(.*),\s+漏洞名称:(.*),\s+严重等级:(.*),\s+动作:(.*)'>中,Match='<\d+>(\d+).*日志类型:(.*),\s+源IP:(.*),\s+源端口:(.*),\s+目的IP:(.*),\s+目的端口:(.*),\s+协议:(.*),\s+攻击类型:(.*),\s+漏洞名称:(.*),\s+严重等级:(.*),\s+动作:(.*)'就是正则表达式。
标签<field>中设置有字段名称(Name)、索引号(Index)、和字段属性,其中,字段属性包括:日志描述(Text)、日志类型(Type)、时间格式(TimeFormat)、默认赋值(Default)等。其中,TimeFormat是只有时间字段才需要填写此属性。如果日志中的时间可以用SimpleDateFormat来格式化,则该字段填写表达式(比如yyyy-MM-dd HH:mm:ss);如果时间格式是时间戳,则填写timestamp。Default是该字段默认的赋值,如果没有匹配到相应的字段,都会使用默认赋值。
本实施例中,根据日志文件的格式,确定所对应的第一匹配规则。比如,日志文件为sanfor日志格式,即日志名称为“sanfor”,日志描述为“sanfor”,表示该日志来自sanfor防火墙设备,日志类型为“Char”,表示该日志内容为字符类型。该日志格式就与上述预设配置文件中的<parsefile Name="sanfor"Text="sanfor"Type="Char"Encode="">对应。因此适用这一标签<parsefile>所对应的第一匹配规则对该日志进行解析。
S103、根据所述目标第一匹配规则,从所述第一数量的数据字段中确定第二数量的目标数据字段,以及与每个所述目标数据字段对应的字段名称、索引号、字段属性。
根据正则表达式,将原始字段中的部分字段提取出来,得到目标数据字段,并将它们储存在一个数组中。同时,按照目标数据字段在数组中的顺序给目标数据字段编号(即数组第0位编号为1,第1位编号为2)。根据每个目标数据字段的编号,找到与该字段具有相同索引号的标签<field>,将该标签内定义的索引号、字段名称、和字段属性与该字段对应起来,构成一组数据。
例如,一个原始日志内容如下:
<1>1536550596,日志类型:EventLog,源IP:192.168.0.0,源端口:800,目的IP:C0A80001,目的端口:880,协议:HTTP,攻击类型:CSRF攻击,漏洞名称:CSRF漏洞,严重等级:中,动作:启动防护。
则,经过上述正则表达式匹配后,提取的数组为{1536550596,EventLog,192.168.0.0,800,192.168.0.1,880,HTTP,CSRF攻击,CSRF漏洞,中,添加验证}。数组中每一字符串的顺序即为其索引号。如,字符串“1536550596”的索引号为1,字符串“EventLog”的索引号为2。
数组中字段的顺序与标签中的索引号对应,即EventLog对应索引号为2,根据索引号2找到对应的<field>标签为<field Name="logType"Text="日志类型"Index="2"Default=""/>,字段名称为logType,字段属性:日志类型,默认赋值为“”。得到的字段为“logType日志类型2”。
同理,可以得到索引号1、3-11对应的字段。
可选的,在预设配置文件中可以设置标签<map>。标签<map>中包括第二匹配规则,第二匹配规则用于在第一匹配规则匹配后,再对目标字段进行字段映射、字段匹配、字段转换等处理时所采用的规则。
字段映射是指将目标数据字段的值根据映射规则,映射成另一个值。其中,映射规则用来表示若干组值与值的映射关系。字段匹配是指根据第三匹配规则,提取所述目标数据字段中与第三匹配规则中数据字段相匹配的字段,本实施例中,第三匹配规则为一种正则表达式。字段转换是根据转换规则将字段的值由原来的格式转换为另一种格式。其中,转换规则规定了字段原有的格式,即对满足转换规则中规定的格式的字段进行转换。
例如,在上述预设配置文件和原始日志的例子中,根据目的IP字段中的<mapIPradix="16"Value=""/>,IPradix这里定义为16,意思为若该字段的原值为16进制时,则将原值转换为10进制。目的IP字段的值为C0A80001,为16进制,因此还需要进行字段转换,即将C0A80001转换为10进制,为192.168.0.1。
又根据严重等级字段中的<map Key="中"Value="4"/>,需要对该字段进行字段映射。其中,Key表示原值,Value表示映射后的值。上述得到的严重等级字段的值为“中”,因此要将它映射为“4”。
可选的,还可以对上述匹配出来的字段进行二次匹配,形式例如<map Match="\?"Value="question"/>,其中,Match为正则表达式,如果字段能够匹配正则表达式,则利用Value作为字段的值,如果Value的值为空,那么值就是字段的值。
可选的,若上述步骤中得到的目标数据字段为预设的类型,则根据所述预设类型,使用相应的处理引擎对所述目标数据字段进行处理。
示例性的,本实施例中,预设类型包括:时间类型、经纬度类型。若目标数据字段为时间类型,则使用时间处理引擎对其进行处理,处理过程包括:时间制式识别,时间标准化,以及时区转换等。若目标数据字段为经纬度类型,则使用经纬度处理引擎对其进行处理,处理过程包括:校验字段的合法性,将字段标准化等。
S104、将所述第二数量的目标数据字段以及每个所述目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
所述预设格式为结构化数据格式。本实施例中,结构化数据格式为二维表格式。因此,将以上处理得到的目标数据字段按照二维表的格式进行合并,最终得到的解析日志为:
本申请提供的日志解析的方法,采用配置文件的方式针对原始日志进行解析;抽取指定的数据字段后,形成结构化存储的数据格式进行存储;并且我们利用配置文件即可完成非结构化数据至结构化数据的转换;提供一种支持多种格式日志的通用解析方法,这些格式的解析都无需开发人员进行代码开发,而是直接配置完成,从而便于后续的统计分析,能够节省时间成本和人力成本。
本申请实施例可以根据上述方法示例对装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图2示出了上述实施例中所涉及的装置的一种可能的结构示意图。该装置包括获取模块201、处理模块202。
其中,所述获取模块201,用于获取原始日志,所述原始日志包括第一数量的数据字段。
所述处理模块202,用于根据所述原始日志的格式,在预设配置文件中找到与所述原始日志的格式对应的目标第一匹配规则;其中,所述预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及所述数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志;所述处理模块,还用于根据目标第一匹配规则,从第一数量的数据字段中确定第二数量的目标数据字段,以及与每个目标数据字段对应的字段名称、索引号、字段属性;所述处理模块,还用于将第二数量的目标数据字段以及每个目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
图3示出了上述实施例中所涉及的日志解析的装置的又一种可能的结构示意图。该装置包括:处理器301和通信接口302。处理器301用于对装置的动作进行控制管理,例如,执行上述处理模块201执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信接口302用于支持装置与其他装置实体的通信,例如,执行上述获取模块201执行的步骤。装置还可以包括存储器303和总线304,存储器303用于存储装置的程序代码和数据。
其中,上述处理器301可以是装置中的处理器,该处理器可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器或控制器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
通信接口302可以是装置中的收发器、收发电路或通信接口等。
存储器303可以是装置中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
总线304可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当装置执行该指令时,该装置执行上述方法实施例所示的方法流程中装置执行的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种日志解析的方法,其特征在于,包括:
获取原始日志,所述原始日志包括第一数量的数据字段;
根据所述原始日志的格式,在预设配置文件中找到与所述原始日志的格式对应的目标第一匹配规则;其中,所述预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及所述数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志;
根据所述目标第一匹配规则,从所述第一数量的数据字段中确定第二数量的目标数据字段,以及与每个所述目标数据字段对应的字段名称、索引号、字段属性;
将所述第二数量的目标数据字段以及每个所述目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
2.根据权利要求1所述的方法,其特征在于,所述预设配置文件还包括:至少一个第二匹配规则;
在所述根据所述目标第一匹配规则,从所述第一数量的数据字段中确定第二数量的目标数据字段,以及与每个所述目标数据字段对应的字段名称、索引号、字段属性之后,所述方法还包括:
根据所述第二匹配规则,对所述目标数据字段进行处理;
所述处理包括以下处理方式中的一种或多种:字段映射、字段匹配、字段转换。
3.根据权利要求2所述的方法,其特征在于,所述第二匹配规则包括:至少一个映射规则,每个映射规则包括一个原始值和一个目标值的对应关系;
所述字段映射包括:
根据所述目标数据字段的值以及所述映射规则,确定所述目标数据字段的值作为原始值时所对应的目标值。
4.根据权利要求2所述的方法,其特征在于,所述第二匹配规则包括:至少一个第三匹配规则,每个第三匹配规则包括至少一个数据字段;
所述字段匹配包括:
根据所述第三匹配规则,提取所述目标数据字段中与所述第三匹配规则中数据字段相匹配的字段。
5.根据权利要求2所述的方法,其特征在于,所述第二匹配规则包括:至少一个转换规则,每个转换规则包括字段属性,以及所述字段属性对应的字段格式;
所述字段转换包括:
根据所述第二匹配规则和所述目标数据字段的字段属性,确定与所述目标数据字段的字段属性对应的目标转换规则;
根据所述目标转换规则,将所述目标数据字段转换为对应的字段格式。
6.根据权利要求2所述的方法,其特征在于,在所述将所述第二数量的目标数据字段以及每个所述目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志之前,还包括:
若所述目标数据字段为预设类型,则根据所述预设类型,使用相应的处理引擎对所述目标数据字段进行处理。
7.一种日志解析的装置,其特征在于,包括:
获取模块,用于获取原始日志,所述原始日志包括第一数量的数据字段;
处理模块,用于根据所述原始日志的格式,在预设配置文件中找到与所述原始日志的格式对应的目标第一匹配规则;其中,所述预设配置文件包括至少一个第一匹配规则,每个第一匹配规则中包括至少一个数据字段,以及所述数据字段对应的字段名称、索引号和字段属性;每个第一匹配规则用于解析至少一种格式的日志;所述目标第一匹配规则用于解析与所述原始日志格式相同的日志;
所述处理模块,还用于根据所述目标第一匹配规则,从所述第一数量的数据字段中确定第二数量的目标数据字段,以及与每个所述目标数据字段对应的字段名称、索引号、字段属性;
所述处理模块,还用于将所述第二数量的目标数据字段以及每个所述目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志。
8.根据权利要求7所述的装置,其特征在于,所述预设配置文件还包括:至少一个第二匹配规则;
在所述根据所述目标第一匹配规则,从所述第一数量的数据字段中确定第二数量的目标数据字段,以及与每个所述目标数据字段对应的字段名称、索引号、字段属性之后,所述处理模块还用于:
根据所述第二匹配规则,对所述目标数据字段进行处理;
所述处理包括以下处理方式中的一种或多种:字段映射、字段匹配、字段转换。
9.根据权利要求8所述的装置,其特征在于,所述第二匹配规则包括:至少一个映射规则,每个映射规则包括一个原始值和一个目标值的对应关系;
所述字段映射包括:
根据所述目标数据字段的值以及所述映射规则,确定所述目标数据字段的值作为原始值时所对应的目标值。
10.根据权利要求8所述的装置,其特征在于,所述第二匹配规则包括:至少一个第三匹配规则,每个第三匹配规则包括至少一个数据字段;
所述字段匹配包括:
根据所述第三匹配规则,提取所述目标数据字段中与所述第三匹配规则中数据字段相匹配的字段。
11.根据权利要求8所述的装置,其特征在于,所述第二匹配规则包括:至少一个转换规则,每个转换规则包括字段属性,以及所述字段属性对应的字段格式;
所述字段转换包括:
根据所述第二匹配规则和所述目标数据字段的字段属性,确定与所述目标数据字段的字段属性对应的目标转换规则;
根据所述目标转换规则,将所述目标数据字段转换为对应的字段格式。
12.根据权利要求8所述的装置,其特征在于,在所述将所述第二数量的目标数据字段以及每个所述目标数据字段对应的字段名称、索引号、字段属性按照预设格式合并,得到解析日志之前,所述处理模块还用于:
若所述目标数据字段为预设类型,则根据所述预设类型,使用相应的处理引擎对所述目标数据字段进行处理。
CN201811094331.0A 2018-09-19 2018-09-19 日志解析的方法及装置 Active CN109325009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811094331.0A CN109325009B (zh) 2018-09-19 2018-09-19 日志解析的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811094331.0A CN109325009B (zh) 2018-09-19 2018-09-19 日志解析的方法及装置

Publications (2)

Publication Number Publication Date
CN109325009A true CN109325009A (zh) 2019-02-12
CN109325009B CN109325009B (zh) 2021-11-30

Family

ID=65264885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811094331.0A Active CN109325009B (zh) 2018-09-19 2018-09-19 日志解析的方法及装置

Country Status (1)

Country Link
CN (1) CN109325009B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920466A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种硬盘测试数据解析方法、装置、终端及存储介质
CN110188073A (zh) * 2019-04-19 2019-08-30 平安科技(深圳)有限公司 活体检测日志解析的方法、装置、存储介质及计算机设备
CN110460876A (zh) * 2019-08-15 2019-11-15 网易(杭州)网络有限公司 直播日志的处理方法、装置及电子设备
CN110765118A (zh) * 2019-10-21 2020-02-07 北京明略软件系统有限公司 一种数据的修订方法、修订装置及可读存储介质
CN110866022A (zh) * 2019-10-24 2020-03-06 贝壳技术有限公司 基于日志文件的数据解析方法、系统及装置
CN111198850A (zh) * 2019-12-14 2020-05-26 深圳猛犸电动科技有限公司 一种日志消息的处理方法、装置以及物联网平台
CN111324510A (zh) * 2020-02-21 2020-06-23 腾讯科技(深圳)有限公司 日志处理方法、装置及电子设备
CN111339052A (zh) * 2020-02-28 2020-06-26 中国银联股份有限公司 一种非结构化日志数据处理方法及装置
CN111708860A (zh) * 2020-06-15 2020-09-25 北京优特捷信息技术有限公司 信息提取方法、装置、设备及存储介质
CN111782727A (zh) * 2020-06-28 2020-10-16 平安医疗健康管理股份有限公司 基于机器学习的数据处理方法及装置
CN111832260A (zh) * 2020-05-26 2020-10-27 国电南瑞南京控制系统有限公司 一种syslog日志到电力系统通用告警日志的转换方法
CN112131291A (zh) * 2020-09-11 2020-12-25 重庆誉存大数据科技有限公司 基于json数据的结构化解析方法、装置、设备及存储介质
CN112148674A (zh) * 2020-10-12 2020-12-29 平安科技(深圳)有限公司 日志数据处理方法、装置、计算机设备和存储介质
CN112148694A (zh) * 2019-06-28 2020-12-29 华为技术有限公司 一种用于电子设备的数据压缩、数据解压方法及电子设备
CN112347165A (zh) * 2019-08-08 2021-02-09 腾讯科技(深圳)有限公司 日志处理方法、装置及服务器和计算机可读存储介质
CN112560395A (zh) * 2020-12-24 2021-03-26 凌云光技术股份有限公司 一种用于文本中包含数据进行格式化的装置及方法
CN112882991A (zh) * 2019-11-29 2021-06-01 北京数安鑫云信息技术有限公司 日志数据的归一化处理方法、装置、介质及计算机设备
CN113159971A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 信息提取方法、装置、电子设备及可读存储介质
CN114116935A (zh) * 2021-11-17 2022-03-01 北京中知智慧科技有限公司 地理标志的检索方法及系统
CN114385396A (zh) * 2021-12-27 2022-04-22 华青融天(北京)软件股份有限公司 一种日志解析方法、装置、设备及介质
CN115048352A (zh) * 2022-08-12 2022-09-13 北京优特捷信息技术有限公司 一种日志字段提取方法、装置、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768636A (zh) * 2011-05-05 2012-11-07 阿里巴巴集团控股有限公司 一种日志解析方法及装置
WO2015051061A1 (en) * 2013-10-02 2015-04-09 Nec Laboratories America, Inc. Heterogeneous log analysis
CN105447099A (zh) * 2015-11-11 2016-03-30 中国建设银行股份有限公司 日志结构化信息提取方法及装置
CN107273269A (zh) * 2017-06-12 2017-10-20 北京奇虎科技有限公司 日志解析方法及装置
CN107818150A (zh) * 2017-10-23 2018-03-20 中国移动通信集团广东有限公司 一种日志审计方法及装置
CN108108288A (zh) * 2018-01-09 2018-06-01 北京奇艺世纪科技有限公司 一种日志数据解析方法、装置及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768636A (zh) * 2011-05-05 2012-11-07 阿里巴巴集团控股有限公司 一种日志解析方法及装置
WO2015051061A1 (en) * 2013-10-02 2015-04-09 Nec Laboratories America, Inc. Heterogeneous log analysis
CN105447099A (zh) * 2015-11-11 2016-03-30 中国建设银行股份有限公司 日志结构化信息提取方法及装置
CN107273269A (zh) * 2017-06-12 2017-10-20 北京奇虎科技有限公司 日志解析方法及装置
CN107818150A (zh) * 2017-10-23 2018-03-20 中国移动通信集团广东有限公司 一种日志审计方法及装置
CN108108288A (zh) * 2018-01-09 2018-06-01 北京奇艺世纪科技有限公司 一种日志数据解析方法、装置及设备

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920466A (zh) * 2019-02-27 2019-06-21 苏州浪潮智能科技有限公司 一种硬盘测试数据解析方法、装置、终端及存储介质
CN110188073A (zh) * 2019-04-19 2019-08-30 平安科技(深圳)有限公司 活体检测日志解析的方法、装置、存储介质及计算机设备
CN112148694A (zh) * 2019-06-28 2020-12-29 华为技术有限公司 一种用于电子设备的数据压缩、数据解压方法及电子设备
CN112148694B (zh) * 2019-06-28 2022-06-14 华为技术有限公司 一种用于电子设备的数据压缩、数据解压方法及电子设备
CN112347165A (zh) * 2019-08-08 2021-02-09 腾讯科技(深圳)有限公司 日志处理方法、装置及服务器和计算机可读存储介质
CN112347165B (zh) * 2019-08-08 2023-11-03 腾讯科技(深圳)有限公司 日志处理方法、装置及服务器和计算机可读存储介质
CN110460876A (zh) * 2019-08-15 2019-11-15 网易(杭州)网络有限公司 直播日志的处理方法、装置及电子设备
CN110765118A (zh) * 2019-10-21 2020-02-07 北京明略软件系统有限公司 一种数据的修订方法、修订装置及可读存储介质
CN110866022A (zh) * 2019-10-24 2020-03-06 贝壳技术有限公司 基于日志文件的数据解析方法、系统及装置
CN112882991A (zh) * 2019-11-29 2021-06-01 北京数安鑫云信息技术有限公司 日志数据的归一化处理方法、装置、介质及计算机设备
CN111198850A (zh) * 2019-12-14 2020-05-26 深圳猛犸电动科技有限公司 一种日志消息的处理方法、装置以及物联网平台
CN111324510A (zh) * 2020-02-21 2020-06-23 腾讯科技(深圳)有限公司 日志处理方法、装置及电子设备
CN111324510B (zh) * 2020-02-21 2024-04-02 腾讯科技(深圳)有限公司 日志处理方法、装置及电子设备
CN111339052A (zh) * 2020-02-28 2020-06-26 中国银联股份有限公司 一种非结构化日志数据处理方法及装置
CN111832260B (zh) * 2020-05-26 2024-03-26 国电南瑞南京控制系统有限公司 一种syslog日志到电力系统通用告警日志的转换方法
CN111832260A (zh) * 2020-05-26 2020-10-27 国电南瑞南京控制系统有限公司 一种syslog日志到电力系统通用告警日志的转换方法
CN111708860A (zh) * 2020-06-15 2020-09-25 北京优特捷信息技术有限公司 信息提取方法、装置、设备及存储介质
CN111782727A (zh) * 2020-06-28 2020-10-16 平安医疗健康管理股份有限公司 基于机器学习的数据处理方法及装置
CN111782727B (zh) * 2020-06-28 2022-08-12 深圳平安医疗健康科技服务有限公司 基于机器学习的数据处理方法及装置
CN112131291A (zh) * 2020-09-11 2020-12-25 重庆誉存大数据科技有限公司 基于json数据的结构化解析方法、装置、设备及存储介质
CN112131291B (zh) * 2020-09-11 2023-12-15 重庆誉存大数据科技有限公司 基于json数据的结构化解析方法、装置、设备及存储介质
CN112148674A (zh) * 2020-10-12 2020-12-29 平安科技(深圳)有限公司 日志数据处理方法、装置、计算机设备和存储介质
WO2021189954A1 (zh) * 2020-10-12 2021-09-30 平安科技(深圳)有限公司 日志数据处理方法、装置、计算机设备和存储介质
CN112148674B (zh) * 2020-10-12 2023-12-19 平安科技(深圳)有限公司 日志数据处理方法、装置、计算机设备和存储介质
CN112560395A (zh) * 2020-12-24 2021-03-26 凌云光技术股份有限公司 一种用于文本中包含数据进行格式化的装置及方法
CN113159971A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 信息提取方法、装置、电子设备及可读存储介质
CN114116935B (zh) * 2021-11-17 2023-03-17 北京中知智慧科技有限公司 地理标志的检索方法及系统
CN114116935A (zh) * 2021-11-17 2022-03-01 北京中知智慧科技有限公司 地理标志的检索方法及系统
CN114385396A (zh) * 2021-12-27 2022-04-22 华青融天(北京)软件股份有限公司 一种日志解析方法、装置、设备及介质
CN115048352B (zh) * 2022-08-12 2022-11-18 北京优特捷信息技术有限公司 一种日志字段提取方法、装置、设备和存储介质
CN115048352A (zh) * 2022-08-12 2022-09-13 北京优特捷信息技术有限公司 一种日志字段提取方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN109325009B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN109325009A (zh) 日志解析的方法及装置
CN110795697B (zh) 逻辑表达式的获取方法、装置、存储介质以及电子装置
CN103793372A (zh) 从电子文档中的表格结构提取语义关系
CN109933786B (zh) 基于编译规则的应答器报文工具的构建方法
CN109614327B (zh) 用于输出信息的方法和装置
CN110674360A (zh) 一种用于数据关联图谱的构建和数据的溯源方法和系统
CN111240772B (zh) 一种基于区块链的数据处理方法、装置及存储介质
CN114218318B (zh) 一种用于电力大数据的数据处理系统及方法
CN109815112A (zh) 基于功能测试的数据调试方法、装置及终端设备
CN109189395A (zh) 一种数据解析方法及装置
CN106126721A (zh) 一种实时计算平台的数据处理方法和装置
CN116702181A (zh) 基于Apache Calcite的数据脱敏方法、系统、设备及介质
CN103235757B (zh) 基于自动化造数对输入域测试对象进行测试的装置和方法
CN113987815A (zh) 一种换流站模型校验方法及系统
CN117556792A (zh) 文件处理方法及设备
CN105630839A (zh) 网页信息的获取方法和装置
CN117093619A (zh) 一种规则引擎处理方法、装置、电子设备及存储介质
CN102609482A (zh) 一种json数据格式的封装方法
CN115759029A (zh) 文档模板处理方法、装置、电子设备及存储介质
CN109324963A (zh) 自动测试收益结果的方法及终端设备
CN108763053A (zh) 埋点名称的生成方法及终端设备
CN103605777B (zh) 数据库索引处理方法和装置
CN104111965B (zh) 基于差别矩阵的ogc地理信息服务描述词汇约简方法
CN110134373A (zh) 一种函数信息获取的方法以及装置
CN109408368A (zh) 一种测试辅助信息的输出方法、存储介质和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant