CN108228875A - 基于完美哈希的日志解析方法及装置 - Google Patents

基于完美哈希的日志解析方法及装置 Download PDF

Info

Publication number
CN108228875A
CN108228875A CN201810050447.8A CN201810050447A CN108228875A CN 108228875 A CN108228875 A CN 108228875A CN 201810050447 A CN201810050447 A CN 201810050447A CN 108228875 A CN108228875 A CN 108228875A
Authority
CN
China
Prior art keywords
analyzed
keyword
log
hash
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810050447.8A
Other languages
English (en)
Other versions
CN108228875B (zh
Inventor
王天凤
王凯峰
王俏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qianxin Technology Co Ltd
Original Assignee
Beijing Qianxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qianxin Technology Co Ltd filed Critical Beijing Qianxin Technology Co Ltd
Priority to CN201810050447.8A priority Critical patent/CN108228875B/zh
Publication of CN108228875A publication Critical patent/CN108228875A/zh
Application granted granted Critical
Publication of CN108228875B publication Critical patent/CN108228875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种基于完美哈希的日志解析方法及装置。所述方法包括:获取待解析日志并根据预设规则对待解析日志进行信息提取,获取待解析日志的待解析关键字及对应的值;根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;根据各第一哈希值获得对应的待解析关键字类型,并将待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。所述装置用于执行所述方法。本发明实施例通过利用哈希查找的方法来识别待解析关键字,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。

Description

基于完美哈希的日志解析方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种基于完美哈希的日志解析方法及装置。
背景技术
计算机系统中任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志中包含了安全管理人员、运维人员和业务分析人员感兴趣的大量的信息,例如访问者的IP、访问的时间、来源的地址以及访问者所使用的客户端信息、分析用户行为特征等。
大多数日志为字符串,且固定位置表示一个固定的字段,以防火墙日志为例,这种字符串格式的日志无法满足防火墙日志内容在一定范围内变化的需求,故防火墙上使用键值对的方式发送日志,当监控装置接收到防火墙发送的日志后,传统的方法是使用字符串遍历找出每对键和值,获取到键后,通过关键字匹配获取关键字的类型,其中关键字匹配的时间与关键字的长度成正比,当关键字较多时,处理效率低下,严重影响了对防火墙日志的解析效率。
因此,如何提高对日志的解析效率是现如今亟待解决的课题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于完美哈希的日志解析方法及装置。
第一方面,本发明实施例提供一种基于完美哈希的日志解析方法,包括:
获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
第二方面,本发明实施例提供一种基于完美哈希的日志解析装置,包括:
信息提取模块,用于获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
计算模块,用于根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
解析模块,用于根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法步骤。
本发明实施例提供的基于完美哈希的日志解析方法及装置,通过利用完美哈希函数获得待解析关键字对应的第一哈希值,从而获得待解析关键字的类型,将待解析关键字对应的值存储到对应的结构中,以获得结构化数据,从而在识别待解析关键字时,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于完美哈希的日志解析方法流程示意图;
图2为本发明实施例提供的待解析关键字类型对应的结构;
图3为本发明实施例提供的基于完美哈希的日志解析装置结构示意图;
图4为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的基于完美哈希的日志解析方法流程示意图,如图1所示,所述方法,包括:
步骤101:获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及待解析关键字对应的值;
具体的,解析装置获取待解析日志,其中获取待解析日志的方式可以是实时获取也可以是周期性获取。在获取到待解析日志后,根据预设规则对待解析日志进行信息提取,获得待解析日志中所包含的所有的待解析关键字以及每一个待解析关键字对应的值。可以理解的是,由于不同程序产生的待解析日志的格式不同,有的是以字符串的形式,有的是以键值对的形式,因此,可以根据待解析日志的格式选择对应的预设规则来进行信息提取。解析装置并不能得知经过信息提取后获得的待解析关键字的具体类型,因此需要对待解析关键字进行识别,具体类型可以为源地址、目的地址、用户名、源端口号、目的端口号等等。
步骤102:根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
具体的,预先构建一个完美哈希函数,通过完美哈希函数计算每一个待解析关键字对应的第一哈希值,其中应当说明的是,完美哈希函数的构建是根据关键字和第二哈希值构建的,且每一个关键字对应唯一一个第二哈希值,不会发生冲突。
步骤103:根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
具体的,在经过完美哈希函数计算得到的第一哈希值后,第一哈希值即待解析关键字对应的待解析关键字类型,应当说明的是,预先建立哈希列表,其中哈希列表中包括多个关键字及每个关键字对应的第二哈希值,可以理解的是,第二哈希值就是对应关键字的关键字类型,关键字是预先获取待解析日志中可能出现的所有的关键字,然后为哈希列表中的每一个关键字设置唯一一个第二哈希值。根据关键字及对应的第二哈希值创建完美哈希函数,因此,通过该完美哈希函数即可计算获得待解析关键字对应的待解析关键字类型。每一个待解析关键字类型对应唯一一个结构,根据待解析关键字类型将待解析关键字对应的值存储到对应的结构中。图2为本发明实施例提供的待解析关键字类型对应的结构,如图2所示,被框起来的参数为待解析关键字类型,待解析关键字类型下面就是要填入待解析关键字对应的值,获得结构化数据。当将所有的待解析关键字的值存储到对应的结构中后便完成了对待解析日志的解析,解析出来的日志就可以通过结构来访问或者处理。
本发明实施例通过利用完美哈希函数获得待解析关键字对应的第一哈希值,然后根据第一哈希值从哈希列表中获取匹配成功的第二哈希值对应的关键字,从而获得待解析关键字的类型,将待解析关键字对应的值存储到对应的结构中,以获得结构化数据,从而在识别待解析关键字时,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
在上述实施例的基础上,所述方法,还包括:
预先获取多个关键字及每一关键字对应的第二哈希值,根据所述多个关键字和所述第二哈希值构建所述完美哈希函数。
具体的,根据历史经验获取待解析日志中可能包括的所有关键字,然后为每一个关键字设置一个第二哈希值,应当说明的是,由于是完美哈希,因此,每一个关键字对应的第二哈希值都是唯一的,根据所有的关键字以及各个关键字对应的第二哈希值构建完美哈希函数。可以理解的是,通过任意一个关键字,利用构建的完美哈希函数均可以计算得到与之对应的第二哈希值。因此,假如待解析关键字与哈希列表中的某个关键字相同时,那么通过完美哈希函数的计算,即可根据第一哈希值与第二哈希值的匹配找到该关键字,从而得知待解析关键字的具体类型。应当说明的是,第二哈希值可以是枚举型数值,还可以是其他类型的数值,本发明实施例对此不做具体限定。
应当说明的是,可以将建立的哈希列表和调用接口写到完美哈希函数生成器gperf的输入文件中,由gperf生成对应的包含了完美哈希函数的c文件,通过调用接口即可获取与待解析关键字的第一哈希值匹配成功的第二哈希值对应的关键字,以实现对待解析关键字的识别。
本发明实施例首先通过对待解析日志的信息提取,获取到待解析关键字,但此时并不能确定该待解析关键字具体是什么,通过完美哈希函数计算获得第一哈希值,进而得知待解析关键字类型,并将其解析为结构化数据,通过哈希查找的方法快速的确定了待解析关键字的具体类型,从而提高了解析效率。
在上述实施例的基础上,所述获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,包括:
若所述待解析日志的格式为键值对格式,则遍历所述待解析日志,并根据预定义的键值对格式进行信息提取。
具体的,如果待解析日志的格式是键值对的格式,因此,可以遍历待解析日志,然后根据预定义的键值对格式选择对应的预设规则来进行信息提取。一般情况下,键值对中的键和值之间是用“=”来分隔的,因此可以通过识别“=”来提取出键和值,其中,键是指待解析关键字,值是指待解析关键字对应的值。应当说明的是,待解析日志还可以是其他格式,但是均包括有待解析关键字及对应的值,因此,在获知待解析日志的格式后,选择对应的预设规则便可以提取到待解析关键字和值。
本发明实施例通过利用完美哈希函数获得待解析关键字对应的第一哈希值,然后根据第一哈希值从哈希列表中获取匹配成功的第二哈希值对应的关键字,从而获得待解析关键字的类型,将待解析关键字对应的值存储到对应的结构中,以获得结构化数据,从而在识别待解析关键字时,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
图3为本发明实施例提供的基于完美哈希的日志解析装置结构示意图,如图3所示,所述装置,包括:信息提取模块301、计算模块302、匹配模块303和解析模块304,其中:
信息提取模块301用于获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及待解析关键字对应的值;计算模块302用于根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;解析模块303用于根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
具体的,信息提取模块301获取待解析日志,其中获取待解析日志的方式可以是实时获取也可以是周期性获取。在获取到待解析日志后,信息提取模块301根据预设规则对待解析日志进行信息提取,获得待解析日志中所包含的所有的待解析关键字以及每一个待解析关键字对应的值。可以理解的是,由于不同程序产生的待解析日志的格式不同,有的是以字符串的形式,有的是以键值对的形式,因此,可以根据待解析日志的格式选择对应的预设规则来进行信息提取。解析装置并不能得知经过信息提取后获得的待解析关键字的具体类型,具体类型可以为源地址、目的地址、用户名、源端口号、目的端口号等等。预先构建一个完美哈希函数,计算模块302通过完美哈希函数计算每一个待解析关键字对应的第一哈希值,其中应当说明的是,完美哈希函数的构建是根据关键字和第二哈希值构建的,且每一个关键字对应唯一一个第二哈希值,不会发生冲突。
在经过完美哈希函数计算得到的第一哈希值后,第一哈希值即待解析关键字对应的待解析关键字类型,应当说明的是,预先建立哈希列表,其中哈希列表中包括多个关键字及每个关键字对应的第二哈希值,可以理解的是,第二哈希值就是对应关键字的关键字类型,关键字是预先获取待解析日志中可能出现的所有的关键字,然后为哈希列表中的每一个关键字设置唯一一个第二哈希值。由于根据关键字及对应的第二哈希值创建完美哈希函数,因此,解析模块303通过该完美哈希函数即可计算获得待解析关键字对应的待解析关键字类型。每一个待解析关键字类型对应唯一一个结构,根据待解析关键字类型将待解析关键字对应的值存储到对应的结构中。当将所有的待解析关键字的值存储到对应的结构中后便完成了对待解析日志的解析,解析出来的日志就可以通过结构来访问或者处理。
本发明提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
本发明实施例通过利用完美哈希函数获得待解析关键字对应的第一哈希值,然后根据第一哈希值从哈希列表中获取匹配成功的第二哈希值对应的关键字,从而获得待解析关键字的类型,将待解析关键字对应的值存储到对应的结构中,以获得结构化数据,从而在识别待解析关键字时,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
在上述实施例的基础上,所述装置,还包括:
构建模块,用于预先获取多个关键字及每一关键字对应的第二哈希值,根据所述多个关键字和所述第二哈希值构建所述完美哈希函数。
具体的,根据历史经验获取待解析日志中可能包括的所有关键字,然后为每一个关键字设置一个第二哈希值,应当说明的是,由于是完美哈希,因此,每一个关键字对应的第二哈希值都是唯一的,构建模块根据所有的关键字以及各个关键字对应的第二哈希值构建完美哈希函数。可以理解的是,通过任意一个关键字,利用构建的完美哈希函数均可以计算得到与之对应的第二哈希值。因此,假如待解析关键字与哈希列表中的某个关键字相同时,那么通过完美哈希函数的计算,即可根据第一哈希值与第二哈希值的匹配找到该关键字,从而得知待解析关键字的具体类型。应当说明的是,第二哈希值可以是枚举型数值,还可以是其他类型的数值,本发明实施例对此不做具体限定。
本发明实施例首先通过对待解析日志的信息提取,获取到待解析关键字,但此时并不能确定该待解析关键字具体是什么,通过完美哈希函数计算获得第一哈希值,从而得到待解析关键字类型,并将其解析为结构化数据,通过哈希查找的方法快速的确定了待解析关键字的具体类型,从而提高了解析效率。
在上述实施例的基础上,所述信息提取模块,具体用于:
若所述待解析日志的格式为键值对格式,则遍历所述待解析日志,并根据预定义的键值对格式进行信息提取。
具体的,如果待解析日志的格式是键值对的格式,因此,可以遍历待解析日志,然后信息提取模块根据预定义的键值对格式选择对应的预设规则来进行信息提取。一般情况下,键值对中的键和值之间是用“=”来分隔的,因此可以通过识别“=”来提取出键和值,其中,键是指待解析关键字,值是指待解析关键字对应的值。应当说明的是,待解析日志还可以是其他格式,但是均包括有待解析关键字及对应的值,因此,在获知待解析日志的格式后,选择对应的预设规则便可以提取到待解析关键字和值。
本发明实施例通过利用完美哈希函数获得待解析关键字对应的第一哈希值,然后根据第一哈希值从哈希列表中获取匹配成功的第二哈希值对应的关键字,从而获得待解析关键字的类型,将待解析关键字对应的值存储到对应的结构中,以获得结构化数据,从而在识别待解析关键字时,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
图4为本发明实施例提供的电子设备实体结构示意图,如图4所示,所述电子设备,包括:处理器(processor)401、存储器(memory)402和总线403;其中,
所述处理器401和存储器402通过所述总线403完成相互间的通信;
所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及待解析关键字对应的值;根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及待解析关键字对应的值;根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及待解析关键字对应的值;根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于完美哈希的日志解析方法,其特征在于,包括:
获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
预先获取多个关键字及每一关键字对应的第二哈希值,根据所述多个关键字和所述第二哈希值构建所述完美哈希函数。
3.根据权利要求1所述的方法,其特征在于,所述获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,包括:
若所述待解析日志的格式为键值对格式,则遍历所述待解析日志,并根据预定义的键值对格式进行信息提取。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第二哈希值为枚举型数值。
5.一种基于完美哈希的日志解析装置,其特征在于,包括:
信息提取模块,用于获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
计算模块,用于根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
解析模块,用于根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
6.根据权利要求5所述的装置,其特征在于,所述装置,还包括:
构建模块,用于预先获取多个关键字及每一关键字对应的第二哈希值,根据所述多个关键字和所述第二哈希值构建所述完美哈希函数。
7.根据权利要求5所述的装置,其特征在于,所述信息提取模块,具体用于:
若所述待解析日志的格式为键值对格式,则遍历所述待解析日志,并根据预定义的键值对格式进行信息提取。
8.根据权利要求5-7任一项所述的装置,其特征在于,所述第二哈希值为枚举型数值。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-4任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1-4任一项所述的方法。
CN201810050447.8A 2018-01-18 2018-01-18 基于完美哈希的日志解析方法及装置 Active CN108228875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810050447.8A CN108228875B (zh) 2018-01-18 2018-01-18 基于完美哈希的日志解析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810050447.8A CN108228875B (zh) 2018-01-18 2018-01-18 基于完美哈希的日志解析方法及装置

Publications (2)

Publication Number Publication Date
CN108228875A true CN108228875A (zh) 2018-06-29
CN108228875B CN108228875B (zh) 2021-12-14

Family

ID=62667715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810050447.8A Active CN108228875B (zh) 2018-01-18 2018-01-18 基于完美哈希的日志解析方法及装置

Country Status (1)

Country Link
CN (1) CN108228875B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110244956A (zh) * 2019-06-04 2019-09-17 北京中亦安图科技股份有限公司 数据解析方法、装置以及系统
CN111475324A (zh) * 2020-04-03 2020-07-31 西安广和通无线软件有限公司 日志信息的分析方法、装置、计算机设备和存储介质
CN112491723A (zh) * 2020-12-07 2021-03-12 上海励驰半导体有限公司 网关报文转发方法、装置、存储介质及网关
CN112866029A (zh) * 2021-02-03 2021-05-28 树根互联股份有限公司 基于云平台的日志数据处理方法、装置以及服务端设备
CN113535857A (zh) * 2021-08-04 2021-10-22 阿波罗智联(北京)科技有限公司 数据同步方法及装置
CN115221013A (zh) * 2022-09-21 2022-10-21 云智慧(北京)科技有限公司 一种日志模式的确定方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464899A (zh) * 2009-01-13 2009-06-24 阿里巴巴集团控股有限公司 低误查率的大规模词典存储方法及查询方法
US8141149B1 (en) * 2005-11-08 2012-03-20 Raytheon Oakley Systems, Inc. Keyword obfuscation
CN104717085A (zh) * 2013-12-16 2015-06-17 中国移动通信集团湖南有限公司 一种日志解析方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8141149B1 (en) * 2005-11-08 2012-03-20 Raytheon Oakley Systems, Inc. Keyword obfuscation
CN101464899A (zh) * 2009-01-13 2009-06-24 阿里巴巴集团控股有限公司 低误查率的大规模词典存储方法及查询方法
CN104717085A (zh) * 2013-12-16 2015-06-17 中国移动通信集团湖南有限公司 一种日志解析方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TIANKONG: "GNU工具-gperf详解(完美哈希函数生成器)", 《HTTPS://BLOG_CSDN_NET/TIANKONG_/ARTICLE/DETAILS/76732226》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110244956A (zh) * 2019-06-04 2019-09-17 北京中亦安图科技股份有限公司 数据解析方法、装置以及系统
CN111475324A (zh) * 2020-04-03 2020-07-31 西安广和通无线软件有限公司 日志信息的分析方法、装置、计算机设备和存储介质
CN111475324B (zh) * 2020-04-03 2024-03-15 西安广和通无线软件有限公司 日志信息的分析方法、装置、计算机设备和存储介质
CN112491723A (zh) * 2020-12-07 2021-03-12 上海励驰半导体有限公司 网关报文转发方法、装置、存储介质及网关
CN112491723B (zh) * 2020-12-07 2022-03-01 上海励驰半导体有限公司 网关报文转发方法、装置、存储介质及网关
CN112866029A (zh) * 2021-02-03 2021-05-28 树根互联股份有限公司 基于云平台的日志数据处理方法、装置以及服务端设备
CN112866029B (zh) * 2021-02-03 2023-09-29 树根互联股份有限公司 基于云平台的日志数据处理方法、装置以及服务端设备
CN113535857A (zh) * 2021-08-04 2021-10-22 阿波罗智联(北京)科技有限公司 数据同步方法及装置
CN115221013A (zh) * 2022-09-21 2022-10-21 云智慧(北京)科技有限公司 一种日志模式的确定方法、装置及设备

Also Published As

Publication number Publication date
CN108228875B (zh) 2021-12-14

Similar Documents

Publication Publication Date Title
CN108228875B (zh) 基于完美哈希的日志解析方法及装置
JP7373611B2 (ja) ログ監査方法、装置、電子機器、媒体およびコンピュータプログラム
US20150356091A1 (en) Method and system for identifying microblog user identity
US9009850B2 (en) Database management by analyzing usage of database fields
US20210385251A1 (en) System and methods for integrating datasets and automating transformation workflows using a distributed computational graph
US20140279803A1 (en) Disambiguating data using contextual and historical information
US11546380B2 (en) System and method for creation and implementation of data processing workflows using a distributed computational graph
CN109918554A (zh) 网页数据爬取方法、装置、系统及计算机可读存储介质
US9330075B2 (en) Method and apparatus for identifying garbage template article
US20160092960A1 (en) Product recommendations over multiple stores
CN112131507A (zh) 网站内容处理方法、装置、服务器和计算机可读存储介质
US10671686B2 (en) Processing webpage data
WO2014151668A1 (en) Supporting Font Character Kerning
CN115051863B (zh) 异常流量检测的方法、装置、电子设备及可读存储介质
WO2023151257A1 (zh) 模拟攻击杀伤链的方法、装置、存储介质及电子设备
CN115982503A (zh) 一种基于云平台的网站信息采集方法及系统
CN115470489A (zh) 检测模型训练方法、检测方法、设备以及计算机可读介质
US7383532B2 (en) System and method for client-side locale specific numeric format handling in a web environment
US20220092186A1 (en) Security information analysis device, system, method and program
US9959304B2 (en) Automatic NER dictionary generation from structured business data
CN111125685A (zh) 一种网络安全态势的预测方法及装置
CN116127236B (zh) 基于并行结构的网页web组件识别方法及装置
CN116719986B (zh) 基于Python的数据抓取方法、装置、设备及存储介质
US12032615B2 (en) System and method for sensitive content analysis prioritization based on file metadata
CN113992436B (zh) 本地情报产生方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 332, floor 3, Building 102, No. 28, Xinjiekou outer street, Xicheng District, Beijing 100088

Applicant after: QAX Technology Group Inc.

Address before: 1701-26, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015

Applicant before: BEIJING QIANXIN TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant