CN104281684A - 海量日志存储和查询方法及系统 - Google Patents

海量日志存储和查询方法及系统 Download PDF

Info

Publication number
CN104281684A
CN104281684A CN201410525799.6A CN201410525799A CN104281684A CN 104281684 A CN104281684 A CN 104281684A CN 201410525799 A CN201410525799 A CN 201410525799A CN 104281684 A CN104281684 A CN 104281684A
Authority
CN
China
Prior art keywords
time
burst
daily record
inquiry
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410525799.6A
Other languages
English (en)
Other versions
CN104281684B (zh
Inventor
王承志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201410525799.6A priority Critical patent/CN104281684B/zh
Publication of CN104281684A publication Critical patent/CN104281684A/zh
Application granted granted Critical
Publication of CN104281684B publication Critical patent/CN104281684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种海量日志存储和查询方法及系统,其中的方法包括将分片后的日志按照主从关系存储为文件结构,其中,分片后的日志按照主从关系存储在主文件和从文件内,主文件包括日志的聚合数量、分片开始时间和分片结束时间,且主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,从文件包括日志的发生时间和发生日志的设备的IP;在主文件和从文件内对日志进行查询。利用上述发明能够在海量的日志中,查询满足时间范围和一定条件的所有日志,并采用文件结构进行存储,存储体积更小,方便压缩,方便更长时间的保存日志。

Description

海量日志存储和查询方法及系统
技术领域
本发明涉及通讯日志处理技术领域,更为具体地,涉及一种海量日志存储和查询方法及系统。
背景技术
随着云计算、移动互联网、物联网的崛起与发展,大数据的时代已经来临。各种系统、程序、运维、交易等的日志作为系统恢复、错误跟踪、安全检测等操作的重要依据,变得越来越重要。因此,在海量日志中快速的寻找到有用的信息,也变得十分重要。
例如,入侵监测、漏洞扫描、审计等系统作为安全监测系统,能够完成对安全构成威胁的任何一个行为进行报警,即生成操作日志。当某一个操作持续进行时,就会发出相同的操作日志,假设一个黑客使用暴力破解软件进行一个主机的密码操作时,这台主机就会不停的报出密码错误的操作日志。如果管理员每天的看这些日志,就难免会将一些有用的信息掩没在这海量的日志中,从而无法从海量日志中定位目标日志。
针对上述问题,目前的日志审计系统或相关产品,可以实现日志采集、审计分析、集中存储和信息展示等功能。这类产品的一个主要的特点是对相同的日志进行聚合,相同的日志指的是同一种类的日志,比如上面提到的密码错误就属于同一种类的日志,密码成功就是另外一种日志。对日志进行聚合的目的是方便展示,其存储方式还是按照日志事件的主从关系存储到表或数据结构中。主关系存储事件的特征信息和聚合的数量,比如,密码错误50次。从关系存储具体信息,比如,发生密码错误的具体时间、来源的IP地址等等。
管理员除了关注聚合数量外,还需要关注日志在不同时间段的发生频率和某一时间段具体日志的内容,这样就引入了海量日志聚合后的查询问题。对应以上的问题,一般的实现是查询从关系并关联主关系的方式,具体实现如下:
一般情况下,将主从关系对应到数据库中的主从表中,并将从表按照时间进行分区。查询条件为时间或者是时间和设备类型相结合,返回结果为时间轴(TimeLine)和列表相结合的方式。这种方式查询性能低,即使是使用分区存储效果也不好,随着日志数量的增多,性能下降的更加明显,此外,需轮询消息列队,效率较低。
综上所述,使用传统的主从表做联合查询、分组和排序存在以下缺点:
1、查询性能非常的低,即使是使用分区存储效果也不好。并且随着日志数量的增多,性能下降的非常明显。当到达一定数量时,界面几乎无响应。
2、查询到之后,必须等排序完成后才能返回结果。
发明内容
鉴于上述问题,本发明的目的是提供一种海量日志存储和查询方法及系统,以解决现有对日志处理中以主从表做查询、分组和排序存在的查询效率低等问题。
根据本发明的一个方面,提供了一种海量日志存储和查询方法,包括将聚合后的日志按时间进行分片,其中,分片的时间根据日志的聚合时间确定;将分片后的日志按照主从关系存储为文件结构,其中,分片后的日志按照主从关系存储在主文件和从文件内,主文件包括日志的聚合数量、分片开始时间和分片结束时间,且主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,从文件包括日志的发生时间和发生日志的设备的IP;在主文件和从文件内对日志进行查询。
其中,在对日志进行查询的过程中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合。
其中,在对日志进行查询的过程中,包括两种情况:第一种情况,对现在至过去一个时间段的日志进行查询,当分片的开始时间晚于查询的开始时间时,将该时间段内的所有分片中的相同日志做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间时,对从文件中的日志进行计算,并作为第二批数据进行显示;第二种情况,对过去某一个时间段内的日志进行查询,当分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间时,将该时间段内的所有分片中相同的事件做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间,或者分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间时,将从文件中的日志进行计算,并作为第二批数据进行显示。
根据本发明的另一方面,提供了一种海量日志存储和查询系统,包括分片模块,用于将聚合后的日志按时间进行分片,其中,分片的时间根据日志的聚合时间确定;存储模块,用于将分片后的日志按照主从关系存储为文件结构,其中,分片后的日志按照主从关系存储在主文件和从文件内,主文件包括日志的聚合数量、分片开始时间和分片结束时间,且主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,从文件包括日志的发生时间和发生日志的设备的IP。
其中,在查询模块中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合。
其中,对日志进行查询的过程包括两种情况:第一种情况,对现在至过去一个时间段的日志进行查询,当分片的开始时间晚于查询的开始时间时,将该时间段内的所有分片中的相同日志做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间时,对从文件中的日志进行计算,并作为第二批数据进行显示;第二种情况,对过去某一个时间段内的日志进行查询,当分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间时,将该时间段内的所有分片中相同的事件做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间,或者分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间时,将从文件中的日志进行计算,并作为第二批数据进行显示。
利用上述根据本发明的海量日志存储和查询方法及系统,具有以下优点:
(1)在海量日志中,快速查询到满足时间范围和一定条件的所有日志;
(2)特有的主从文件式结构,可以快速的统计聚合日志的数量并快速的查询详细事件;
(3)可以快速的形成以时间为横坐标、以数量为纵坐标的时间轴;
(4)特有的主从文件式结构,存储体积小、易于压缩,方便保存更长时间的日志;
(5)对查询事件分批返回,界面响应及时,用户体验好。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为根据本发明实施例的海量日志存储和查询方法的流程图;
图2为根据本发明实施例的海量日志存储和查询方法的主从文件结构示意图;
图3为根据本发明实施例的海量日志存储和查询方法的第一种查询情况分片结构示意图;
图4为根据本发明实施例的海量日志存储和查询方法的第二种查询情况分片结构示意图;
图5为根据本发明实施例的海量日志存储和查询系统方框示意图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。
根据目前使用的主从表做联合查询、分组和排序,存在查询性能非常低的问题,即使是使用分区存储,查询效果也不好,并且查询到之后,必须等排序完成后才能返回结果。针对上述现有技术中存在的问题,本发明通过将聚合后的日志进行分片,对分片后的数据分段存储,并根据查询条件将分段后的数据快速拼装,提高日志查询效率,并能快速返回查询结果。
以下将结合附图对本发明的具体实施例进行详细描述。
图1示出了根据本发明实施例的海量日志存储和查询方法流程。
如图1所示,根据本发明的海量日志存储和查询方法流程包括:
S110:将聚合后的日志按时间进行分片,其中,分片的时间根据日志的聚合时间确定。
具体地,将聚合后的日志事件做分片的预先处理,将长时间的日志聚合改为中、短时间的分片。例如,将永久聚合的同一日志事件,改为按照一天或者一小时的聚合。在本发明中对聚合后的所有日志按照整点、整分的时间进行分片,分片的时间根据日志聚合时间的大小进行确定,也就是说日志聚合时间大小不同,分片时间的大小也不同,同时,对分片后的日志以特殊结构进行存储,以方便用户对日志进行查询和保存。
S120:将分片后的日志按照主从关系存储为文件结构,其中,分片后的日志按照主从关系存储在主文件和从文件内,主文件包括日志的聚合数量、分片开始时间和分片结束时间,且主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,从文件包括日志的发生时间和发生日志的设备的IP。
具体地,将聚合日志进行分片后,按照主从文件的结构进行存储。其中,当分片后的日志按照主从关系存储在主文件和从文件内时,主文件主要包括日志的聚合数量、分片开始时间和分片结束时间,从文件主要包括日志的发生时间和发生日志的设备的IP。此外,文件名为对聚合日志进行分片的开始时间,分片的结束时间可以由分片的开始时间和分片大小计算得出。
其中,对于上述描述也可以理解为,在本发明的海量日志存储和查询方法中,设置两个存储单元,一个主存储单元和一个从存储单元,可知存储单元为文件结构。其中,主存储单元的主要字段有日志事件的聚合数量、分片的开始时间和结束时间;从存储单元存储详细的每一个日志事件。主存储单元对应数据库中的主文件,从存储单元对应数据库中的从文件。
作为示例,图2示出了根据本发明实施例的海量日志存储和查询方法的主从文件结构。
如图2所示,主文件存储日志的聚合时间,从文件存储日志的详细事件。此外,文件名为分片的开始时间,分片的结束时间可以由开始时间和分片大小计算得出。在该实施例中,主文件名为20140801000000,表示存储2014年8月1日零点以后的分片数据,由于分片时间设定为一天,所以该分片的结束时间为20140801232359,即该分片的结束时间为2014年8月1日23点23分59秒。从文件名为20140801000000_d,该从文件与下划线之前同名的主文件相对应。
需要说明的是,在本发明的海量日志存储和查询方法中,按照主从文件的结构对分片后的日志进行存储时,主文件采用XML的数据结构,表示对相应的从文件中日志时间的结构描述,主要包括event元素、count元素、Level元素和Keyword元素。具体地,上述示例的主文件中存储的内容如下所述:
其中,主文件中的Event元素为必须项,表示该时间段内日志事件的信息,属性count表示该种日志事件的数量,上述内容中用逗号分隔的数字表示从文件中对应的行号。在数据存储时,先追加从文件的内容,由于是增量操作,只能在原有的文件后面进行追加,所以行号是不会改变的。然后,修改Event元素,Event元素需要先读入到内存中,修改后再写回到主文件中。由于写入主文件和从文件的时候都是定时或者批量完成的,不会出现频繁的磁盘输入/输出情况。
此外,主文件的其它元素,如Level、Keyword等,用做扩展使用。在以时间为查询条件的前提下,用做数据查询,通过对查询条件做预先的处理,可以大大提高日志的查询速度。内容中用逗号分隔的数字表示从文件中对应的行号,查询的时候只需要找到相应的元素,将元素中的行号做交集计算,即可以得到查询后的日志事件数量和相对应的日志事件。
对应上述主文件内容,从文件中存储的内容如下所述:
其中,通过设定的查询条件,在主文件的各元素中进行筛选,并对各元素内的行号取交集运算,最终得到一个行号值,并对该值在从文件内进行对应,进而得到具体的查询日志信息。
S130:在主文件和从文件内对日志进行查询。
其中,在对日志进行查询的过程中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合,也就是说在对日志事件进行查询的时候,时间为必须条件,事件的等级、名称、关键字、设备类型等为可选条件。根据查询条件对主存储单元内容进行筛选,以确定最终的查询结果并进行显示,存储单元为主从文件结构,需要到对应的主存储单元中进行行号的交集计算。
具体地,在查询过程中会出现两种情况,以下将结合附图对这两种情况分别进行说明。
图3示出了根据本发明实施例的海量日志存储和查询方法的第一种查询情况分片结构。
如图3所示,在第一种情况中,对现在至过去一个时间段的日志进行查询,当分片的开始时间晚于查询的开始时间时,将该时间段内的所有分片中的相同日志做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间时,对从文件中的日志进行计算,并作为第二批数据进行显示。
具体地,对最近一段时间内的日志进行查询(例如,最近1小时或最近1天),此时,双向箭头部分(分片的开始时间晚于查询的开始时间)为确定数量,需要进行分组计算后(将多个分片中相同的事件做合并),作为第一批在界面显示的数据。单向箭头部分(分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间)为不确定的数量,需要到从存储单元即从文件中进行计算后(对从存储单元做逐一过滤,由于是已经确定到很小的分片中,并且事件是按照时间上的先后顺序插入的,即使是有其它条件查询也比较快。),作为第二批在界面显示的数据。如果选择的开始时间都是整点,并且数据存储也是按照整点进行存储的,那么所有的数据都在双向箭头中,不需要操作从存储单元即可完成。
图4示出了根据本发明实施例的海量日志存储和查询方法中的第二种查询情况分片结构。
如图4所示,在第二种查询情况中,对过去某一个时间段内的日志进行查询,当分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间时,将该时间段内的所有分片中相同的事件做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间,或者分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间时,将从文件中的日志进行计算,并作为第二批数据进行显示。
具体地,对过去某一个时间段内的日志进行查询,其中,双向箭头部分(分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间)为确定数量,需要进行分组计算后(将多个分片中相同的事件做合并),作为第一批在界面显示的数据。单向箭头部分(分片的开始时间早于查询的开始时间,并且分片的结束时间晚于查询的开始时间。分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间)为不确定的数量,需要到从存储单元即从文件中进行计算后(做逐一过滤,由于是已经确定到很小的分片中,并且事件是按照时间上的先后顺序插入的,即使是有其它条件查询也比较快。),作为第二批在界面显示的数据。如果选择的开始时间和结束时间都是整点,并且数据存储也是按照整点进行存储的,那么所有的数据都在双向箭头中,不需要操作从存储单元即可完成。
根据上述本发明提供的海量日志存储和查询方法,本发明还提供一种海量日志存储和查询系统。图5示出了根据本发明实施例的海量日志存储和查询系统。
如图5所示,本发明提供的海量日志存储和查询系统500包括分片模块510、存储模块520和查询模块530,其中,
分片模块510,用于将聚合后的日志按时间进行分片其中,分片的时间根据日志的聚合时间确定。
具体地,将聚合后的日志事件做分片的预先处理,将长时间的日志聚合改为中、短时间的分片,对聚合后的所有日志按照整点、整分的时间进行分片,分片的大小根据日志聚合时间的大小进行确定,也就是说日志聚合时间大小不同,时间分片的大小也不同。
存储模块520,用于将分片后的日志按照主从关系存储为文件结构,其中,分片后的日志按照主从关系存储在主文件和从文件内,主文件包括日志的聚合数量、分片开始时间和分片结束时间,且主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,从文件包括日志的发生时间和发生日志的设备的IP。
具体地,将聚合日志进行分片后,按照主从文件的结构进行存储。其中,在以文件结构进行存储的过程中,主文件包括日志的聚合数量、分片开始时间和分片结束时间,从文件存储详细日志事件。此外,文件名为对聚合日志进行分片的开始时间,分片的结束时间可以由开始时间和分片大小计算得出。
查询模块530,用于在主文件和从文件内对日志进行查询。
具体地,在对日志进行查询的过程中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合,也就是说在对日志事件进行查询的时候,时间为必须条件,事件的等级、名称、关键字、设备类型等为可选条件。根据查询条件对主文件和从文件的内容进行筛选,以确定最终的查询结果并进行显示,分片后的日志存储为文件结构,需要到对应的存储内容中进行行号的交集计算。
利用上述本发明提供的海量日志存储和查询方法及系统,能够在短时间内,在海量日志中查询满足时间范围和一定条件的所有日志,并能以图像化的方式展现给用户。此外,采用特有的文件式结构,也可以快速的统计日志聚合数量和快速的查询详细日志事件,存储体积小,方便压缩和保存。
如上参照附图以示例的方式描述根据本发明的海量日志存储和查询方法及系统。但是,本领域技术人员应当理解,对于上述本发明所提出的海量日志存储和查询方法及系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (6)

1.一种海量日志存储和查询方法,包括:
将聚合后的日志按时间进行分片,其中,分片的时间根据所述日志的聚合时间确定;
将分片后的日志按照主从关系存储为文件结构,其中,所述分片后的日志按照主从关系存储在主文件和从文件内,所述主文件包括日志的聚合数量、分片开始时间和分片结束时间,且所述主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,所述从文件包括日志的发生时间和发生日志的设备的IP;
在所述主文件和从文件内对日志进行查询。
2.如权利要求1所述的海量日志存储和查询方法,其中,在对日志进行查询的过程中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合。
3.如权利要求1所述的海量日志存储和查询方法,其中,对日志进行查询的过程包括两种情况:
第一种情况,对现在至过去一个时间段的日志进行查询,当分片的开始时间晚于查询的开始时间时,将该时间段内的所有分片中的相同日志做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间时,对所述从文件中的日志进行计算,并作为第二批数据进行显示;
第二种情况,对过去某一个时间段内的日志进行查询,当分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间时,将该时间段内的所有分片中相同的事件做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间,或者分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间时,将所述从文件中的日志进行计算,并作为第二批数据进行显示。
4.一种海量日志存储和查询系统,包括:
分片模块,用于将聚合后的日志按时间进行分片,其中,分片的时间根据所述日志的聚合时间确定;
存储模块,用于将分片后的日志按照主从关系存储为文件结构,其中,所述分片后的日志按照主从关系存储在主文件和从文件内,所述主文件包括日志的聚合数量、分片开始时间和分片结束时间,且所述主文件采用XML数据结构,包括event元素、count元素、Level元素和Keyword元素,所述从文件包括日志的发生时间和发生日志的设备的IP;
查询模块,用于在所述主文件和从文件内对日志进行查询。
5.如权利要求4所示的海量日志存储和查询系统,其中,在所述查询模块中,查询条件为时间或者为时间与日志的等级、名称、关键字或设备类型中至少一个的结合。
6.如权利要求4所示的海量日志存储和查询系统,其中,对日志进行查询的过程包括两种情况:
第一种情况,对现在至过去一个时间段的日志进行查询,当分片的开始时间晚于查询的开始时间时,将该时间段内的所有分片中的相同日志做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间时,对所述从文件中的日志进行计算,并作为第二批数据进行显示;
第二种情况,对过去某一个时间段内的日志进行查询,当分片的开始时间晚于查询的开始时间、并且分片的结束时间早于查询的结束时间时,将该时间段内的所有分片中相同的事件做合并,作为第一批数据进行显示;当分片的开始时间早于查询的开始时间、并且分片的结束时间晚于查询的开始时间,或者分片的结束时间晚于查询的结束时间、并且查询的结束时间晚于分片的开始时间时,将所述从文件中的日志进行计算,并作为第二批数据进行显示。
CN201410525799.6A 2014-09-30 2014-09-30 海量日志存储和查询方法及系统 Active CN104281684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410525799.6A CN104281684B (zh) 2014-09-30 2014-09-30 海量日志存储和查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410525799.6A CN104281684B (zh) 2014-09-30 2014-09-30 海量日志存储和查询方法及系统

Publications (2)

Publication Number Publication Date
CN104281684A true CN104281684A (zh) 2015-01-14
CN104281684B CN104281684B (zh) 2017-08-25

Family

ID=52256557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410525799.6A Active CN104281684B (zh) 2014-09-30 2014-09-30 海量日志存储和查询方法及系统

Country Status (1)

Country Link
CN (1) CN104281684B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117403A (zh) * 2015-07-16 2015-12-02 中国人民大学 日志数据分片与查询方法及装置
CN105302909A (zh) * 2015-11-06 2016-02-03 西安交大捷普网络科技有限公司 基于分区偏移计算的网络安全日志系统大数据检索方法
CN106055630A (zh) * 2016-05-27 2016-10-26 北京小米移动软件有限公司 日志存储的方法及装置
CN106293647A (zh) * 2015-05-12 2017-01-04 江苏金思维软件有限公司 一种支持相对日期时间的软件查询方法及系统
CN106776632A (zh) * 2015-11-23 2017-05-31 北京国双科技有限公司 数据查询方法及装置
CN106874414A (zh) * 2017-01-22 2017-06-20 中国移动通信集团江苏有限公司 分布式系统业务调用链的时长统计方法和装置
CN107710202A (zh) * 2015-06-29 2018-02-16 微软技术许可有限责任公司 与旧有工具集成的云原生文档
CN108984623A (zh) * 2018-06-14 2018-12-11 东软集团股份有限公司 数据查询条件生成方法、装置、存储介质和电子设备
CN111970368A (zh) * 2020-08-24 2020-11-20 北京微步在线科技有限公司 一种基于ip信誉数据的信息处理方法、服务端及系统
CN112799863A (zh) * 2019-11-13 2021-05-14 北京百度网讯科技有限公司 用于输出信息的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030113797A1 (en) * 2001-06-27 2003-06-19 Unigen Pharmaceuticals, Inc. Method for generating, screening and dereplicating natural product libraries for the discovery of therapeutic agents
CN101477486A (zh) * 2009-01-22 2009-07-08 中国人民解放军国防科学技术大学 一种基于扇区重组的文件备份恢复方法
CN103957133A (zh) * 2014-04-22 2014-07-30 北京联时空网络通信设备有限公司 一种日志监测方法及装置
CN104036039A (zh) * 2014-06-30 2014-09-10 浪潮(北京)电子信息产业有限公司 一种数据的并行处理方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030113797A1 (en) * 2001-06-27 2003-06-19 Unigen Pharmaceuticals, Inc. Method for generating, screening and dereplicating natural product libraries for the discovery of therapeutic agents
CN101477486A (zh) * 2009-01-22 2009-07-08 中国人民解放军国防科学技术大学 一种基于扇区重组的文件备份恢复方法
CN103957133A (zh) * 2014-04-22 2014-07-30 北京联时空网络通信设备有限公司 一种日志监测方法及装置
CN104036039A (zh) * 2014-06-30 2014-09-10 浪潮(北京)电子信息产业有限公司 一种数据的并行处理方法和系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106293647A (zh) * 2015-05-12 2017-01-04 江苏金思维软件有限公司 一种支持相对日期时间的软件查询方法及系统
US11080344B2 (en) 2015-06-29 2021-08-03 Microsoft Technology Licensing, Llc Cloud-native documents integrated with legacy tools
CN107710202A (zh) * 2015-06-29 2018-02-16 微软技术许可有限责任公司 与旧有工具集成的云原生文档
CN105117403A (zh) * 2015-07-16 2015-12-02 中国人民大学 日志数据分片与查询方法及装置
CN105117403B (zh) * 2015-07-16 2019-10-11 中国人民大学 日志数据分片与查询方法及装置
CN105302909B (zh) * 2015-11-06 2019-03-26 西安交大捷普网络科技有限公司 基于分区偏移计算的网络安全日志系统大数据检索方法
CN105302909A (zh) * 2015-11-06 2016-02-03 西安交大捷普网络科技有限公司 基于分区偏移计算的网络安全日志系统大数据检索方法
CN106776632A (zh) * 2015-11-23 2017-05-31 北京国双科技有限公司 数据查询方法及装置
CN106055630A (zh) * 2016-05-27 2016-10-26 北京小米移动软件有限公司 日志存储的方法及装置
CN106874414A (zh) * 2017-01-22 2017-06-20 中国移动通信集团江苏有限公司 分布式系统业务调用链的时长统计方法和装置
CN106874414B (zh) * 2017-01-22 2020-05-12 中国移动通信集团江苏有限公司 分布式系统业务调用链的时长统计方法和装置
CN108984623A (zh) * 2018-06-14 2018-12-11 东软集团股份有限公司 数据查询条件生成方法、装置、存储介质和电子设备
CN108984623B (zh) * 2018-06-14 2020-11-03 东软集团股份有限公司 数据查询条件生成方法、装置、存储介质和电子设备
CN112799863A (zh) * 2019-11-13 2021-05-14 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN112799863B (zh) * 2019-11-13 2024-07-09 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN111970368A (zh) * 2020-08-24 2020-11-20 北京微步在线科技有限公司 一种基于ip信誉数据的信息处理方法、服务端及系统
CN111970368B (zh) * 2020-08-24 2021-11-23 北京微步在线科技有限公司 一种基于ip信誉数据的信息处理方法、服务端及系统

Also Published As

Publication number Publication date
CN104281684B (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
CN104281684A (zh) 海量日志存储和查询方法及系统
US10102261B2 (en) System and method for correlating cloud-based big data in real-time for intelligent analytics and multiple end uses
US8965914B2 (en) Grouping identity records to generate candidate lists to use in an entity and relationship resolution process
US9020802B1 (en) Worldwide distributed architecture model and management
US9489426B2 (en) Distributed feature collection and correlation engine
US11580259B1 (en) Identity security architecture systems and methods
US20150180891A1 (en) Using network locations obtained from multiple threat lists to evaluate network data or machine data
US10108634B1 (en) Identification and removal of duplicate event records from a security information and event management database
US20140195502A1 (en) Multidimension column-based partitioning and storage
US20190319975A1 (en) Universal link to extract and classify log data
CN105447113A (zh) 一种基于大数据的信息分析方法
WO2022252512A1 (zh) 根因分析方法、装置、电子设备、介质和程序
US20170300517A1 (en) Index maintenance management of a relational database management system
JP2020057416A (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN108234392B (zh) 一种网站的监控方法及装置
CN110572364A (zh) 一种虚拟化环境中威胁告警的实现方法
US11269930B1 (en) Tracking granularity levels for accessing a spatial index
CN117151045A (zh) 基于区块链的报表加工方法、装置及计算机设备
CN111522918A (zh) 数据汇聚方法、装置、电子设备及计算机可读存储介质
US8473496B2 (en) Utilizing density metadata to process multi-dimensional data
CN116340328A (zh) 数据更新方法、数据查询方法、设备及存储介质
CN112651840B (zh) 基于区块链和数字金融的业务数据日志处理方法及系统
CN101901211A (zh) 报表的处理方法
Cuzzocrea Approximate OLAP query processing over uncertain and imprecise multidimensional data streams
Yue et al. Sensor Web event detection and geoprocessing over Big data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant