CN110442559A - 日志检索方法、装置以及服务器 - Google Patents

日志检索方法、装置以及服务器 Download PDF

Info

Publication number
CN110442559A
CN110442559A CN201910605568.9A CN201910605568A CN110442559A CN 110442559 A CN110442559 A CN 110442559A CN 201910605568 A CN201910605568 A CN 201910605568A CN 110442559 A CN110442559 A CN 110442559A
Authority
CN
China
Prior art keywords
log
index
search rule
pretreatment
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910605568.9A
Other languages
English (en)
Inventor
陈友雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN201910605568.9A priority Critical patent/CN110442559A/zh
Publication of CN110442559A publication Critical patent/CN110442559A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种日志检索方法、一种日志检索装置以及一种服务器,其中,日志检索方法包括:根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;将第一检索规则存储为检索规则集合;根据检索规则集合建立预处理日志集合的索引;将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明提供的日志检索方法,根据搜索规则从原始日志中检索出数据,将这些数据形成预处理日志,同时将搜索规则存储到检索规则集合中,用户在对日志进行检索时,从检索规则集合中选取检索规则组合成适合的条件进行检索,得到需要的数据,从而能够从大量的日志中精确快速地获取需要的数据。

Description

日志检索方法、装置以及服务器
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种日志检索方法、一种日志检索装置以及一种服务器。
背景技术
目前,采用两种日志采集方法:关系型数据库采集和文件存储采集,关系型数据库采集存在搜索速度慢的问题,文件存储采集存在数据不精确的问题。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的第一个方面在于,提出一种日志检索方法。
本发明的第二个方面在于,提出一种日志检索装置。
本发明的第三个方面在于,提出一种服务器。
有鉴于此,根据本发明的第一个方面,提供了一种日志检索方法,包括:根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;将第一检索规则存储为检索规则集合;根据检索规则集合建立预处理日志集合的索引;将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
本发明提供的日志检索方法,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志按照检索规则集合存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。根据第一检索规则在原始日志中查找日志,将得到的全部日志存储为预处理日志集合,将全部第一检索规则存储为检索规则集合,根据检索规则集合建立预处理日志集合的索引,即将检索规则集合与预处理日志集合相对应,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,在用户使用一个或多个检索条件找到目标日志之后,将使用的一个或多个检索条件重新存储为一个检索条件并存储在检索规则集合之中,重新建立规则集合与预处理日志集合的对应关系(即重新建立目标日志的索引),使得当用户再次以同样的检索条件检索时,能够迅速准确地找到目标日志。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
另外,根据本发明提供的上述技术方案中的日志检索方法,还可以具有如下附加技术特征:
在上述技术方案中,优选地,日志检索方法还包括:根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志。
在该技术方案中,根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志按照检索规则集合存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。
优选地,在用户使用一个或多个检索条件找到目标日志之后,将使用的一个或多个检索条件重新存储为一个检索条件并存储在检索规则集合之中,重新建立规则集合与预处理日志集合的对应关系(即重新建立目标日志的索引),使得当用户再次以同样的检索条件检索时,能够迅速准确地找到目标日志。
在上述技术方案中,优选地,根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志的步骤,具体包括:根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引;根据目标索引在存储单元中查找目标日志。
在该技术方案中,根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引,根据目标索引在存储单元中查找目标日志。由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,用户随机选择一组检索模块,系统将检索规则同时发给该组检索模块里的N台检索器LQ,系统根据各个LQ返回的日志进行合并和叠加处理形成最终的显示数据返回给用户,与此同时使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn方便后续建立更精确的检索规则集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(HadoopDistributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
在上述技术方案中,优选地,在根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志的步骤之后还包括:将一个或多个检索规则存储为第二检索规则;将第二检索规则存储到检索规则集合中;根据检索规则集合更新目标日志的索引;将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该技术方案中,将一个或多个检索规则存储为第二检索规则,将第二检索规则存储到检索规则集合中,根据检索规则集合更新目标日志的索引,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop DistributedFile System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
在上述技术方案中,优选地,分权限存储原始日志和预处理日志。
在该技术方案中,分权限存储原始日志和预处理日志,有利于技术人员管理日志数据,同时,分权限存储原始日志和预处理日志,提升了日志存储的安全性,优选地,可以分别加密原始日志和预处理日志。
根据本发明的第二个方面,提供了一种日志检索装置,包括查找模块、存储模块、索引模块和发送模块;查找模块用于根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;存储模块用于将第一检索规则存储为检索规则集合;索引模块用于根据检索规则集合建立预处理日志集合的索引;发送模块将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
本发明提供的日志检索装置,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,检索模块在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。查找模块根据第一检索规则在原始日志中查找日志,存储模块将得到的全部日志存储为预处理日志集合,将全部第一检索规则存储为检索规则集合,索引模块根据检索规则集合建立预处理日志集合的索引,即将检索规则集合与预处理日志集合相对应,发送模块将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
另外,根据本发明提供的上述技术方案中的日志检索装置,还可以具有如下附加技术特征:
在上述任一技术方案中,优选地,日志检索装置还包括:检索模块;检索模块用于根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志。
在该技术方案中,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,检索模块在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。
优选地,在用户使用一个或多个检索条件通过检索模块找到目标日志之后,将使用的一个或多个检索条件重新存储为一个检索条件并存储在检索规则集合之中,重新建立规则集合与预处理日志集合的对应关系(即重新建立目标日志的索引),使得当用户再次以同样的检索条件检索时,检索模块能够迅速准确地找到目标日志。
在上述任一技术方案中,优选地,检索模块具体用于:根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引;根据目标索引在存储单元中查找目标日志。
在该技术方案中,检索模块根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引,检索模块根据目标索引在存储单元中查找目标日志。由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此检索模块能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。
优选地,用户随机选择一组检索模块,系统将检索规则同时发给该组检索模块里的N台检索器LQ,系统根据各个LQ返回的日志进行合并和叠加处理形成最终的显示数据返回给用户,与此同时使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(HadoopDistributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn方便后续建立更精确的检索规则集合(条件检索池)。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
在上述任一技术方案中,优选地,存储模块还用于,将一个或多个检索规则存储为第二检索规则;存储模块还用于,将第二检索规则存储到检索规则集合中;索引模块还用于,根据检索规则集合更新目标日志的索引;发送模块还用于,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该技术方案中,存储模块将一个或多个检索规则存储为第二检索规则,将第二检索规则存储到检索规则集合中,索引模块根据检索规则集合更新目标日志的索引,发送模块将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
在上述任一技术方案中,优选地,存储模块还用于,分权限存储原始日志和预处理日志。
在该技术方案中,存储模块分权限存储原始日志和预处理日志,有利于技术人员管理日志数据,同时,分权限存储原始日志和预处理日志,提升了日志存储的安全性,优选地,可以分别加密原始日志和预处理日志。
根据本发明的第三个方面,提供了一种服务器,包括如上述任一技术方案的检索装置,因而具备该检索装置的全部技术效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明一个实施例的日志检索方法的示意流程图;
图2示出了本发明另一个实施例的日志检索方法的示意流程图;
图3示出了本发明再一个实施例的日志检索方法的示意流程图;
图4示出了本发明又一个实施例的日志检索方法的示意流程图;
图5示出了本发明又一个实施例的日志检索方法的示意流程图;
图6示出了本发明一个实施例的日志检索装置的示意框图;
图7示出了本发明另一个实施例的日志检索装置的示意框图;
图8示出了本发明一个实施例的日志检索方法的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
本发明第一个方面的实施例提供了一种日志检索方法。
图1示出了本发明一个实施例的日志检索方法的示意流程图。如图1所示,该方法包括:
S102,根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
S104,将第一检索规则存储为检索规则集合;
S106,根据检索规则集合建立预处理日志集合的索引;
S108,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
本发明提供的日志检索方法,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志按照检索规则集合存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。根据第一检索规则在原始日志中查找日志,将得到的全部日志存储为预处理日志集合,将全部第一检索规则存储为检索规则集合,根据检索规则集合建立预处理日志集合的索引,即将检索规则集合与预处理日志集合相对应,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,在用户使用一个或多个检索条件找到目标日志之后,将使用的一个或多个检索条件重新存储为一个检索条件并存储在检索规则集合之中,重新建立规则集合与预处理日志集合的对应关系(即重新建立目标日志的索引),使得当用户再次以同样的检索条件检索时,能够迅速准确地找到目标日志。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
图2示出了本发明一个实施例的日志检索方法的示意流程图。如图2所示,该方法包括:
S202,根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
S204,将第一检索规则存储为检索规则集合;
S206,根据检索规则集合建立预处理日志集合的索引;
S208,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元;
S210,根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志。
在该实施例中,根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志按照检索规则集合存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。
优选地,在用户使用一个或多个检索条件找到目标日志之后,将使用的一个或多个检索条件重新存储为一个检索条件并存储在检索规则集合之中,重新建立规则集合与预处理日志集合的对应关系(即重新建立目标日志的索引),使得当用户再次以同样的检索条件检索时,能够迅速准确地找到目标日志。
图3示出了本发明一个实施例的日志检索方法的示意流程图。如图3所示,该方法包括:
S302,根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
S304,将第一检索规则存储为检索规则集合;
S306,根据检索规则集合建立预处理日志集合的索引;
S308,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元;
S310,根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引;
S312,根据目标索引在存储单元中查找目标日志。
在该实施例中,根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引,根据目标索引在存储单元中查找目标日志。由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,用户随机选择一组检索模块,系统将检索规则同时发给该组检索模块里的N台检索器LQ,系统根据各个LQ返回的日志进行合并和叠加处理形成最终的显示数据返回给用户,与此同时使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn方便后续建立更精确的检索规则集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(HadoopDistributed File System,分布式文件系统)分发到存储模块的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
图4示出了本发明一个实施例的日志检索方法的示意流程图。如图4所示,该方法包括:
S402,根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
S404,将第一检索规则存储为检索规则集合;
S406,根据检索规则集合建立预处理日志集合的索引;
S408,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元;
S410,根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志;
S412,将一个或多个检索规则存储为第二检索规则;
S414,将第二检索规则存储到检索规则集合中;
S416,根据检索规则集合更新目标日志的索引;
S418,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该实施例中,将一个或多个检索规则存储为第二检索规则,将第二检索规则存储到检索规则集合中,根据检索规则集合更新目标日志的索引,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
图5示出了本发明一个实施例的日志检索方法的示意流程图。如图5所示,该方法包括:
S502,根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
S504,将第一检索规则存储为检索规则集合;
S506,根据检索规则集合建立预处理日志集合的索引;
S508,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元;
S510,根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引;
S512,根据目标索引在存储单元中查找目标日志;
S514,将一个或多个检索规则存储为第二检索规则;
S516,将第二检索规则存储到检索规则集合中;
S518,根据检索规则集合更新目标日志的索引;
S520,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该实施例中,将一个或多个检索规则存储为第二检索规则,将第二检索规则存储到检索规则集合中,根据检索规则集合更新目标日志的索引,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成。
在本发明的一个实施例中,优选地,分权限存储原始日志和预处理日志。
在该实施例中,分权限存储原始日志和预处理日志,有利于技术人员管理日志数据,同时,分权限存储原始日志和预处理日志,提升了日志存储的安全性,优选地,可以分别加密原始日志和预处理日志。
本发明第二个方面的实施例提供了一种日志检索装置。
图6示出了本发明一个实施例的日志检索装置的示意框图。如图6所示,该日志检索装置100包括:
查找模块102,用于根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
存储模块104,用于将第一检索规则存储为检索规则集合;
索引模块106,用于根据检索规则集合建立预处理日志集合的索引;
发送模块108,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该实施例中,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。查找模块102根据第一检索规则在原始日志中查找日志,存储模块104将得到的全部日志存储为预处理日志集合,将全部第一检索规则存储为检索规则集合,索引模块106根据检索规则集合建立预处理日志集合的索引,即将检索规则集合与预处理日志集合相对应,发送模块108将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块104的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块104的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块106或者对HDFS索引目录删除索引再分发到对应的日志索引模块106;添加:新添加的数据用另一台服务器来生成。
图7示出了本发明一个实施例的日志检索装置的示意框图。如图7所示,该日志检索装置200包括:
查找模块202,用于根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
存储模块204,用于将第一检索规则存储为检索规则集合;
索引模块206,用于根据检索规则集合建立预处理日志集合的索引;
发送模块208,将索引通过分布式文件系统发送到存储预处理日志集合的存储单元
检索模块210,用于根据检索规则集合中的一个或多个检索规则在预处理日志集合中查找目标日志。
在该实施例中,日志管理服务对日志有预存储功能,建立检索规则集合,即形成条件检索池,根据检索规则集合中的检索规则在原始日志中检索日志,将检索得到的日志存储为预处理日志集合,即形成检索日志库,检索规则集合与预处理日志集合相对应(建立索引),用户可以从检索规则集合中选取需要的检索条件,检索模块210在预处理日志集合中搜索目标日志,由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。查找模块202根据第一检索规则在原始日志中查找日志,存储模块204将得到的全部日志存储为预处理日志集合,将全部第一检索规则存储为检索规则集合,索引模块206根据检索规则集合建立预处理日志集合的索引,即将检索规则集合与预处理日志集合相对应,发送模块208将索引通过分布式文件系统发送到存储预处理日志集合的存储单元。本发明能够让管理员自己建立规则形成自己的检索日志库,相对于一个自定义cache(高速缓冲存储器)功能。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块204的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。其中,使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块204的各存储单元,能够实时更新、存储数据,保证了日志检索服务的时效性,同时分布式文件系统采用先进先出的存储策略,存储速度比较快。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块206或者对HDFS索引目录删除索引再分发到对应的日志索引模块206;添加:新添加的数据用另一台服务器来生成。
在本发明的一个实施例中,优选地,检索模块210具体用于:根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引;根据目标索引在存储单元中查找目标日志。
在该实施例中,检索模块210根据检索规则集合中的一个或多个检索规则在预处理日志的索引中查找目标索引,检索模块210根据目标索引在存储单元中查找目标日志。由于用户能够通过检索规则集合(条件检索池)中的检索规则直接在预处理日志集合(检索日志库)中获取目标日志,而非在全部日志中逐一检索,因此检索模块210能够在大量的日志中精确快速地获取需要的数据,提升了日志检索的速度和精度,提升了用户使用日志检索服务的使用体验。
优选地,用户随机选择一组检索模块210,系统将检索规则同时发给该组检索模块210里的N台检索器LQ,系统根据各个LQ返回的日志进行合并和叠加处理形成最终的显示数据返回给用户,与此同时使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块204的各存储单元LS1、LS2、…LSn方便后续建立更精确的检索规则集合(条件检索池)。
在本发明的一个实施例中,如图7所示,优选地,如下所述:
存储模块204还用于,将一个或多个检索规则存储为第二检索规则;
存储模块204还用于,将第二检索规则存储到检索规则集合中;
索引模块206还用于,根据检索规则集合更新目标日志的索引;
发送模块208还用于,将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
在该实施例中,存储模块204将一个或多个检索规则存储为第二检索规则,将第二检索规则存储到检索规则集合中,索引模块206根据检索规则集合更新目标日志的索引,发送模块208将更新后的索引通过分布式文件系统发送到存储预处理日志集合的存储单元。
优选地,使用Mapper/Reducer(映射器/缩减器)对预处理后得到的预处理日志集合进行建立和更新索引,将索引从HDFS(Hadoop Distributed File System,分布式文件系统)分发到存储模块204的各存储单元LS1、LS2、…LSn,方便日志管理服务建立更精确的预处理日志集合(条件检索池)。
优选地,对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现。删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块206或者对HDFS索引目录删除索引再分发到对应的日志索引模块206;添加:新添加的数据用另一台服务器来生成。
在本发明的一个实施例中,如图7所示,优选地,存储模块204还用于,分权限存储原始日志和预处理日志。
在该实施例中,存储模块204分权限存储原始日志和预处理日志,有利于技术人员管理日志数据,同时,分权限存储原始日志和预处理日志,提升了日志存储的安全性,优选地,可以分别加密原始日志和预处理日志。
在本发明的一个实施例中,如图8所示,优选地,本发明的技术方案具体的实现步骤主要分4大服务进行处理:日志管理服务、日志预处理服务、日志检索服务和日志存储服务;日志管理服务:管理员预先建立日志预搜索规则,并下发到日志预处理服务同时把预搜索规则存储到“条件检索池”;日志预处理服务:接收日志管理服务的预搜索规则,根据搜索规则抽取用户关心的日志属性,并按照规则重新将抽取的日志属性归档,形成预处理后的IT日志即“预处理日志”;日志检索服务:用户从“条件检索池”组合成自己将要搜索的条件结合系统权限进行全文检索与精确检索,形成用户需要查看的数据;具体过程为:用户随机选择一组检索模块,系统将检索条件同时发给该组检索模块里的N台检索器LQ,系统根据各个LQ返回的日志进行合并和叠加处理形成最终的显示数据返回给用户,与此同时使用Mapper/Reducer(映射器/缩减器)对预处理后的IT日志更新索引,再将索引从HDFS(HadoopDistributed File System,分布式文件系统)分发到存储模块的各存储单元LS1、LS2、…LSn方便后续建立更精确的“条件检索池”,其中对索引的更新分为两步:先删除后添加。删除和添加步骤可按不同定时策略来实现;删除:在HDFS上删除索引,将生成的*.del文件分发到所有的日志索引模块或者对HDFS索引目录删除索引再分发到对应的日志索引模块;添加:新添加的数据用另一台服务器来生成;日志存储服务:分权限以HDFS存储“原始日志”和“预处理日志”。
本发明第三个方面的实施例提供了一种服务器,包括如上述任一实施例的检索装置,因而具备该检索装置的全部技术效果,在此不再赘述。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种日志检索方法,其特征在于,包括:
根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
将所述第一检索规则存储为检索规则集合;
根据所述检索规则集合建立所述预处理日志集合的索引;
将所述索引通过分布式文件系统发送到存储所述预处理日志集合的存储单元。
2.根据权利要求1所述的日志检索方法,其特征在于,还包括:
根据所述检索规则集合中的一个或多个检索规则在所述预处理日志集合中查找目标日志。
3.根据权利要求2所述的日志检索方法,其特征在于,所述根据所述检索规则集合中的一个或多个检索规则在所述预处理日志集合中查找目标日志的步骤,具体包括:
根据所述检索规则集合中的一个或多个检索规则在所述预处理日志的索引中查找目标索引;
根据所述目标索引在所述存储单元中查找所述目标日志。
4.根据权利要求2所述的日志检索方法,其特征在于,在所述根据所述检索规则集合中的一个或多个检索规则在所述预处理日志集合中查找目标日志的步骤之后还包括:
将所述一个或多个检索规则存储为第二检索规则;
将所述第二检索规则存储到所述检索规则集合中;
根据所述检索规则集合更新所述目标日志的索引;
将更新后的索引通过分布式文件系统发送到存储所述预处理日志集合的存储单元。
5.根据权利要求1至4中任一项所述的日志检索方法,其特征在于,
分权限存储所述原始日志和所述预处理日志。
6.一种日志检索装置,其特征在于,包括:
查找模块,用于根据第一检索规则在原始日志中查找日志,将得到的日志存储为预处理日志集合;
存储模块,用于将所述第一检索规则存储为检索规则集合;
索引模块,用于根据所述检索规则集合建立所述预处理日志集合的索引;
发送模块,将所述索引通过分布式文件系统发送到存储所述预处理日志集合的存储单元。
7.根据权利要求6所述的日志检索装置,其特征在于,还包括:
检索模块,用于根据所述检索规则集合中的一个或多个检索规则在所述预处理日志集合中查找目标日志。
8.根据权利要求7所述的日志检索装置,其特征在于,所述检索模块具体用于:
根据所述检索规则集合中的一个或多个检索规则在所述预处理日志的索引中查找目标索引;
根据所述目标索引在所述存储单元中查找所述目标日志。
9.根据权利要求7所述的日志检索装置,其特征在于,
所述存储模块还用于,将所述一个或多个检索规则存储为第二检索规则;
所述存储模块还用于,将所述第二检索规则存储到所述检索规则集合中;
所述索引模块还用于,根据所述检索规则集合更新所述目标日志的索引;
所述发送模块还用于,将更新后的索引通过分布式文件系统发送到存储所述预处理日志集合的存储单元。
10.根据权利要求6至9中任一项所述的日志检索装置,其特征在于,
所述存储模块还用于,分权限存储所述原始日志和所述预处理日志。
11.一种服务器,其特征在于,包括如权利要求6至10中任一项所述的日志检索装置。
CN201910605568.9A 2019-07-05 2019-07-05 日志检索方法、装置以及服务器 Pending CN110442559A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605568.9A CN110442559A (zh) 2019-07-05 2019-07-05 日志检索方法、装置以及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605568.9A CN110442559A (zh) 2019-07-05 2019-07-05 日志检索方法、装置以及服务器

Publications (1)

Publication Number Publication Date
CN110442559A true CN110442559A (zh) 2019-11-12

Family

ID=68429422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605568.9A Pending CN110442559A (zh) 2019-07-05 2019-07-05 日志检索方法、装置以及服务器

Country Status (1)

Country Link
CN (1) CN110442559A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177023A (zh) * 2021-04-19 2021-07-27 杭州海康威视系统技术有限公司 一种日志检索方法、装置及电子设备
CN115460214A (zh) * 2022-11-10 2022-12-09 北京天元特通科技有限公司 一种分布式网络通联日志存储检索方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279891A (zh) * 2011-09-02 2011-12-14 深圳中兴网信科技有限公司 一种并行搜索it日志的检索方法、装置及系统
CN102609502A (zh) * 2012-02-02 2012-07-25 深圳市中兴移动通信有限公司 基于日志方式的移动终端桌面搜索方法及系统
US20130006997A1 (en) * 2011-06-30 2013-01-03 Atsushi Asayama Information processing apparatus, client management method and client management system
CN105320754A (zh) * 2015-10-08 2016-02-10 上海瀚银信息技术有限公司 一种数据搜索系统及方法
CN106878264A (zh) * 2016-12-21 2017-06-20 重庆华龙艾迪信息技术有限公司 一种数据管理方法及服务器
CN107423336A (zh) * 2017-04-27 2017-12-01 努比亚技术有限公司 一种数据处理方法、装置及计算机存储介质
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006997A1 (en) * 2011-06-30 2013-01-03 Atsushi Asayama Information processing apparatus, client management method and client management system
CN102279891A (zh) * 2011-09-02 2011-12-14 深圳中兴网信科技有限公司 一种并行搜索it日志的检索方法、装置及系统
CN102609502A (zh) * 2012-02-02 2012-07-25 深圳市中兴移动通信有限公司 基于日志方式的移动终端桌面搜索方法及系统
CN105320754A (zh) * 2015-10-08 2016-02-10 上海瀚银信息技术有限公司 一种数据搜索系统及方法
CN106878264A (zh) * 2016-12-21 2017-06-20 重庆华龙艾迪信息技术有限公司 一种数据管理方法及服务器
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN107423336A (zh) * 2017-04-27 2017-12-01 努比亚技术有限公司 一种数据处理方法、装置及计算机存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177023A (zh) * 2021-04-19 2021-07-27 杭州海康威视系统技术有限公司 一种日志检索方法、装置及电子设备
CN115460214A (zh) * 2022-11-10 2022-12-09 北京天元特通科技有限公司 一种分布式网络通联日志存储检索方法及装置
CN115460214B (zh) * 2022-11-10 2023-02-07 北京天元特通科技有限公司 一种分布式网络通联日志存储检索方法及装置

Similar Documents

Publication Publication Date Title
CN103345526B (zh) 一种云环境下高效的隐私保护密文查询方法
CN105426408B (zh) 一种多索引的数据处理方法及装置
CN102521405B (zh) 支持高速加载的海量结构化数据存储、查询方法和系统
CN103853727B (zh) 提高大数据量查询性能的方法及系统
CN106959963A (zh) 一种数据查询方法、装置及系统
CN104021205B (zh) 一种建立微博索引的方法及装置
CN107943952A (zh) 一种基于Spark框架进行全文检索的实现方法
CN101459901B (zh) 基于多级切片方式的矢量地图数据传输方法
CN104657387B (zh) 一种数据查询方法及装置
CN106528787A (zh) 一种基于海量数据多维分析的查询方法及装置
CN106294772A (zh) 分布式内存列式数据库的缓存管理方法
CN105956123A (zh) 基于局部更新软件的数据处理方法及装置
CN110442559A (zh) 日志检索方法、装置以及服务器
CN110134879A (zh) 一种基于差分隐私保护的兴趣点推荐算法
CN106933833A (zh) 一种基于空间索引技术的位置信息快速查询方法
CN109740034A (zh) 基于图形数据库的企业涉案信息查询方法及装置
CN109087121A (zh) 营销信息投放平台构建方法及装置
CN108090125A (zh) 一种非查询式的重复数据删除方法及装置
CN106557499A (zh) HBase二级索引创建方法和装置
CN104636368B (zh) 数据检索方法、装置及服务器
CN102891872A (zh) 一种对等网络中数据存储和查询的方法及系统
CN106815258A (zh) 一种数据存储方法和协调节点
CN103226567A (zh) 旅行管理
CN107688922A (zh) 基于节点树的工程监理任务处理方法及装置
CN103559307A (zh) 一种查询的缓存方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191112