CN113326243A - 分析日志数据的方法和装置 - Google Patents

分析日志数据的方法和装置 Download PDF

Info

Publication number
CN113326243A
CN113326243A CN202110588014.XA CN202110588014A CN113326243A CN 113326243 A CN113326243 A CN 113326243A CN 202110588014 A CN202110588014 A CN 202110588014A CN 113326243 A CN113326243 A CN 113326243A
Authority
CN
China
Prior art keywords
log
data
data set
analysis
log data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110588014.XA
Other languages
English (en)
Other versions
CN113326243B (zh
Inventor
孙宇博
曲中鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110588014.XA priority Critical patent/CN113326243B/zh
Publication of CN113326243A publication Critical patent/CN113326243A/zh
Application granted granted Critical
Publication of CN113326243B publication Critical patent/CN113326243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种分析日志数据的方法和装置,涉及数据处理技术领域,尤其涉及数据挖掘技术领域。具体实现方案为:确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集;针对至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集;根据聚合数据集中日志数据的场景类型,确定与聚合数据集对应的分析配置信息;以及根据与聚合数据集对应的分析配置信息,对聚合数据集进行分析处理,得到分析结果。

Description

分析日志数据的方法和装置
技术领域
本公开涉及数据处理技术领域,尤其涉及数据挖掘技术领域。
背景技术
计算机中的服务是一种应用程序类型。在对服务进行性能测试过程中,会对服务所对应的日志进行监控,通过对日志(例如notice日志、warning日志)中某些关键字段进行分析来判断对应的服务有无明显缺陷。通过在性能测试过程中分析日志,能帮助测试人员定位服务存在的问题,发现其他测试手段难以发现的程序漏洞。
发明内容
本公开提供了一种分析日志数据的方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种分析日志数据的方法,包括:确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集;针对所述至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集;根据所述聚合数据集中日志数据的场景类型,确定与所述聚合数据集对应的分析配置信息;以及根据与所述聚合数据集对应的分析配置信息,对所述聚合数据集进行分析处理,得到分析结果。
根据本公开的另一方面,提供了一种分析日志数据的装置,包括:分类模块,用于确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集;聚合模块,用于针对所述至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集;确定模块,用于根据所述聚合数据集中日志数据的场景类型,确定与所述聚合数据集对应的分析配置信息;以及分析模块,用于根据与所述聚合数据集对应的分析配置信息,对所述聚合数据集进行分析处理,得到分析结果。
本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所示的方法。
根据本公开实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所示的方法。
根据本公开实施例的另一方面,提供了一种计算机程序产品,计算机程序,所述计算机程序在被处理器执行时实现本公开实施例所示的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开的实施例的分析曰志数据的方法的流程图;
图2示意性示出了根据本公开另一实施例的分析日志数据的方法的流程图;
图3示意性示出了根据本公开的实施例的获取日志数据的方法的示意图;
图4示意性示出了根据本公开的实施例的聚合处理的示意图;
图5示意性示出了根据本公开实施例的分析日志数据的装置的框图;以及
图6示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,本公开的技术方案中,所涉及的数据的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
以下将结合图1,对分析日志数据的方法进行详细描述。
图1示意性示出了根据本公开的实施例的分析日志数据的方法的流程图。
如图1所示,该方法100包括操作S110~操作S140。
在操作S110,确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集。
根据本公开的实施例,日志数据可以用于记录服务的运行过程。日志数据例如包括notice(通知)日志、warning(告警)日志和fatal(错误)日志等等。场景类型可以根据服务所对应的各种场景来预先设置。
示例性地,以地图服务为例,日志数据可以包括状态信息、终点位置信息和起点位置信息等等。场景类型可以包括短途场景、长途场景、行前场景、行中场景等等。
根据本公开的实施例,根据在日志数据包括状态信息的情况下,可以根据状态信息,确定日志数据的场景类型。例如,状态信息可以由日志数据中的state字段表示,基于此,可以根据日志中的state字段来确定日志数据的场景类型。例如,偏好信息可以由日志数据中的prefer字段表示,基于此,可以根据日志中的prefer字段区分不同的算路偏好场景。
根据本公开的实施例,在日志数据包括终点位置信息和起点位置信息的情况下,可以根据终点位置信息和起点位置信息,确定终点与起点之间的距离。根据终点与起点之间的距离,确定日志数据的场景类型。若终点与起点之间的距离在第一预设距离,则可以确定日志数据的场景类型为短途场景,若终点与起点之间的距离在第一预设距离以上,则可以确定日志数据的场景类型为长途场景。
然后,在操作S120,针对至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集。
根据本公开的实施例,通过在分析前对日志数据进行聚合处理,可以减少后续需要分析处理的日志数据的数量。
根据本公开的实施例,对于格式固定的日志数据,可以确定数据集中每个日志数据的代码行数;以及合并数据集中代码行数相同的日志数据。
根据本公开的另一实施例,对于格式不固定的日志数据,可以确定数据集中每个日志数据的动态字段和关键字段。然后,删除数据集中每个日志数据的动态字段,得到多个精简日志数据。接下来,合并多个精简日志数据中关键字段相同的精简日志数据。
根据本公开的实施例,动态字段可以为日志数据中数量、类型和内容不固定的字段,动态字段例如可以包括用户的身份标识id、道路的属性id、当前路线的唯一标识等。关键字段可以为需要后续分析的字段。关键字段可以根据用户的实际需要进行设定。
相关技术受困于日志数据中的动态字段的影响,无法对日志数据进行有效分析。根据本公开的实施例,通过删除动态字段,对日志数据进行聚合,可以减少动态字段对分析结果的影响,可以更好地对曰志数据进行分析。
在操作S130,根据聚合数据集中日志数据的场景类型,确定与聚合数据集对应的分析配置信息。
根据本公开的实施例,预先对每种场景类型配置有对应的分析配置信息。分析配置信息例如可以包括至少一个分析项目,以及针对至少一个分析项目中每个分析项目的报警规则和报警阈值。其中,分析项目用于表示日志中需要进行分析处理的字段。
根据本公开的实施例,分析项目例如可以包括普适分析项和个性化分析项。其中,普适分析项例如可以包括服务错误码分布、平均响应时间以及分位线(例如99分位线,即99%的请求的某个数值都小于这个数,则这个数就叫做99分位线)、warning日志聚类数据、fatal日志聚类数据等等。个性化分析项可以由用户根据业务特性自行定义。示例性地,本实施例中,为了提高可拓展性,可以提供接口,用于用户自主定义分析项。
下面以地图的算路服务为例对个性化分析项作进一步说明,在算路的过程中,算路服务召回若干条路线,然后需要删除这些路线中不可用的路线,例如删除违反交规限行等原因的路线,因此日志数据中会记录删路的路线与总路线数据的比例,即删路比例。基于此,可以将删路比例作为个性化分析项。又例如,算路的过程中,算路服务生成多个拓扑图,每个拓扑图可召回不同的特色路线,如0号图可召回距离最短的路线,1号图可召回时间最短的路线等,可以从这些路线中选择预设数量的路径展现给用户。因此日志数据中会记录每个图号召回的路线中被展示数量与总数量的比例,即各图号的召回路线占比。基于此,可以将各图号的召回路线占比作为个性化分析项。
根据本公开的实施例,采用公共分析项和个性化分析项相结合的方式,可以提高适用性。
根据本公开的实施例,报警规则例如可以包括:数值大于报警阈值、数值小于报警阈值、数值等于报警阈值、数值不等于报警阈值、数值增量大于报警阈值、数值增量小于报警阈值、数值增量绝对值大于报警阈值、数值增比大于报警阈值、数值增比小于报警阈值、数值增比绝对值大于报警阈值等等。
根据本公开的实施例,报警阈值可以由用户设置,也可以由深度学习模型来生成。示例性地,本实施例中,可以获取性能测试报告,其中,性能测试报告包括至少一个实际字段值和对应的性能指标,至少一个实际字段值与至少一个分析项目对应。然后利用深度学习模型对性能测试报告中的实际字段值和对应的性能指标进行分析,生成与至少一个分析项目对应的报警阈值。
在操作S140,根据与聚合数据集对应的分析配置信息,对聚合数据集进行分析处理,得到分析结果。
根据本公开的实施例,可以针对聚合数据集中的每个日志数据,确定日志数据中与每个分析项目对应的字段值。根据与该分析项目对应的报警规则和报警阈值,确定针对该字段值的分析结果。
根据本公开的实施例的分析日志数据的方法实现了对被测服务日志的自动分析,并自动得出分析结果。具备高效、全面且普遍适用性强等优点,可以解放测试人员的人力。
在分析日志数据的过程中,相关技术将全部场景归为一类,在分析时统一设定报警规则和报警阈值。这种方式不适合场景众多的业务(例如地图服务),给出的分析结果精细化程度较低,参考性不强。
根据本公开的实施例,通过确定日志数据的场景类型,分别采用与日志数据的场景类型对应的分析配置信息来对日志数据进行分析,可以生成与各种场景类型对应的分析结果,使得分析结果更为精细,参考性更强。
图2示意性示出了根据本公开另一实施例的分析日志数据的方法的流程图。
如图2所示,该方法200包括操作S210~操作S260。该方法可以由分析日志的装置执行。
在操作S210,向客户端发送日志分析脚本,并指示客户端在该客户端的目标容器环境中运行的日志分析脚本。
根据本公开的实施例,曰志分析脚本可以用于收集目标服务的日志数据。目标容器环境为与目标服务对应的容器环境。
根据本公开的实施例,分析日志数据的装置与客户端之间可以基于HTTP(HyperText Transfer Protocol,超文本传输协议)进行通讯。基于此,分析日志数据的装置可以将日志分析脚本封装为第一HTTP数据包。然后将第一HTTP数据包发送至客户端。
在操作S220,通过容器环境中运行的日志分析脚本,获取目标服务的日志数据。
根据本公开的实施例,客户端在收到第一HTTP数据包之后,会解析第一HTTP数据包,获取日志分析脚本,并在目标容器环境中执行日志分析脚本。日志分析脚本会收集目标容器环境中目标服务的日志,并将日志封装为HTTP数据包(即第二HTTP数据包),发回分析日志数据的装置。
根据本公开的实施例,可以获取性能测试的开始时间和终止时间,然后利用日志分析脚本确定目标容器环境中每条日志的打印时间,对打印时间在开始时间和终止时间之间的日志进行保留。另外,为了适配不同服务的日志名称不同的情况,可利用日志分析脚本根据关键词对日志进行模糊匹配,从而自动找到目标服务的日志数据(例如notice日志、warning日志等),无需用户挨个对每个服务进行配置,减少了接入成本。
根据本公开的实施例,可以获取来自客户端的第二HTTP数据包。然后通过解析第二HTTP数据包,得到目标服务的日志数据。
在操作S230,确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集。
在操作S240,针对至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集。
在操作S250,根据聚合数据集中日志数据的场景类型,确定与聚合数据集对应的分析配置信息。
在操作S260,根据与聚合数据集对应的分析配置信息,对聚合数据集进行分析处理,得到分析结果。
根据本公开的实施例,操作S230~操作S260例如可以参考上文描述,在此不再赘述。
相关技术通过SSH(Secure Shell,安全外壳协议)命令登录客户端以执行指令,这种方式需要指令发起方与客户端彼此授予相应的权限,以建立信任关系,若无法建立信任关系,则会失败。
根据本公开的实施例,通过HTTP协议实现了分析日志数据的装置与客户端间的通讯,从而可以绕过权限,在目标服务所在容器环境执行各项命令。这种方法不需要建立信任关系,任意目标环境均可执行,可靠性较高。
下面参考图3,结合具体实施例对的方法做进一步说明。本领域技术人员可以理解,以下示例实施例仅用于理解本公开,本公开并不局限于此。
图3示意性示出了根据本公开的实施例的获取日志数据的方法的示意图。
如图3所示,本地环境310可以包括数据库311和代理程序(agent)312。服务环境320可以包括客户端程序(client)321和日志目录322。其中,服务环境320例如可以为目标服务所在的容器环境。
根据本公开的实施例,可以从数据库311读取日志分析配置信息31,根据日志分析配置信息31自动生成日志分析脚本32。然后通过agent 312将日志分析脚本32发送至client 321。client 321在服务环境320中执行日志分析脚本,以从日志目录322中获取日志数据。获取日志数据后,client321通过HTTP协议将日志数据发送至agent 312。
下面参考图4,结合具体实施例对聚合处理做进一步说明。本领域技术人员可以理解,以下示例实施例仅用于理解本公开,本公开并不局限于此。
图4示意性示出了根据本公开的实施例的聚合处理的示意图。
示例性地,在本实施例中,预先设置有性能测试时间段。
如图4所示,聚合处理例如可以包括在操作S410,自动搜索性能测试时间段内生成的日志,得到日志数据。
在操作S420,对于格式固定的日志,可以根据日志的代码行数,确定日志是否为相同日志。然后执行操作S450。
根据本公开的实施例,对于格式固定的日志,若两个日志具有相同的代码行数,则可以确定该两个日志为相同日志。若两个日志的代码行数不同,则该两个日志为不同日志。
在操作S430,对于格式不固定的日志,可以提取每条目志的关键字段。
在操作S440,通过比较日志的关键字段来确定同类日志。
根据本公开的实施例,对于格式不固定的日志(例如warning日志和fatal),若两个日志日志的关键字段相同,则确定该两个日志为同类日志。若两个日志日志的关键字段不同,则确定该两个日志不是同类日志。
在操作S450,将相同的日志聚类。
根据本公开的实施例,可以删除日志数据中重复的日志,并将相同的日志合并。
在操作S460,选取作为demo(样例)的日志。
根据本公开的实施例,作为demo的日志可以用于展示该类别的日志特征。示例性地,本实施例中,可以获取前5条日志作为demo。
在操作S470,将聚类后的日志数据和demo在前端展示。
不同于具有错误码、响应时间等字段较为固定的日志,warning日志(或fatal日志)有打印量级大、打印字段不确定、打印内容难以理解等特点,且与业务逻辑强相关,分析难度较大。同一类别的warning日志(或fatal日志)打印的文本并不完全相同,如用户的身份id不同、道路的linkid不同等,日志虽属于同一类别,但是文本不同。若不先聚类只是根据数量判断的话,一个服务的日志需要配置上万个规则,用户根本无法维护。
根据本公开的实施例,通过在分析前对日志数据进行聚合处理,可以减少后续需要分析处理的日志数据的数量,并减小了维护难度。
下面结合具体实施例对分析日志数据的方法做进一步说明。本领域技术人员可以理解,以下示例实施例仅用于理解本公开,本公开并不局限于此。
本实施例中,对于不同服务的日志,可以事先设置与日志的场景类型,以及每种场景类型对应的日志分析子项、报警规则和报警阈值等配置信息。示例性地,本实施例中,设置有可视化平台,用户可以通过该可视化平台设置日志数据的场景类型,以及各场景类型日志的报警规则及报警阈值。
其中,报警阈值可以由人工设置,也可以利用深度学习模型来确定。示例性地,本实施例中,可以定时分析已有的性能测试报告,针对每一报警规则,利用深度学习模型自动生成不同时间段的阈值,即动态阈值,从而可以解决地图服务特有的受路况等因素影响不同时间段服务压力不同的问题。
根据本公开的实施例,报警规则和报警阈值可以存储在数据库中。示例性地,本实施例中,用户还可以通过可视化平台快速对日志的分析项目、报警规则和报警阈值进行查询和修改,从而提高了测试效率和分析结果的准确度。
根据本公开的实施例,可以基于日志的统一特点,将各个日志所具备的共性指标,如平响、错误码等抽象成公共分析项,并对分析项设置默认配置。通过配置公共分析项,可以减少用户的接入成本。
另外,为了提高可拓展性,可以提供接口,用于用户自主定义分析项。根据本公开的实施例,用户可通过该接口对不同服务的日志中需要分析的字段进行标注,以将用户标注的字段设置为分析项目,并设定对应的报警规则和报警阈值。通过用户自定义分析项,可以将用户的经验进行固化和积累,应用于日后的性能测试中,指导其他人员的测试,极大降低了日志数据的分析门槛,进一步提高了测试效率。
用户还可以通过另一接口上传日志分析脚本。在获取到日志分析脚本之后,可以将日志分析脚本以HTTP数据包的形式发送至发送至地图服务的容器环境中运行,以收集地图服务的日志数据。本实施例中,日志数据例如可以包括warning(警告)日志、fatal(致命错误)日志等。
对于warning日志和/或fatal日志,在分析前可以进行聚合处理,以减少后续需要分析处理的日志数据的数量。例如,可以将warning日志和/或fatal日志中的动态字段(例如用户的身份标识id、道路的属性id、当前路线的唯一标识等)全部剔除,保留关键字段,得到精简后的warning日志和/或fatal日志。将精简后的warning日志和/或fatal日志中的关键字段进行一对一比较,关键字段相同的warning日志和/或fatal日志视为同种类别。记录每种类别的日志条数,同一类别的日志统一进行后续的场景的分类和规则阈值的判定。另外,针对每种类别,还可以从该类别的日志中选择部分日志作为demo,用于展示该类别的日志特征。从而至少部分地解决了地图服务动态字段多无法聚焦的问题。
在获取到地图服务的日志之后,可以根据日志所对应的场景,将日志进行分类,针对每个类别的日志,应用对应的分析规则,对该类型的日志中的每个分析子项进行分析。例如,确定每个分析子项的值是否超过阈值,或者是否小于阈值。
例如,早高峰时间段客户端向导航服务的某实例共计发送请求10w条,其中包含长途算路请求、短途算路请求、时间优先算路、躲避拥堵算路、导航过程中刷新路况请求等多种类型的请求。在处理每个请求的过程中,会生成相应的服务日志。
其中,对于请求计算的路径长度在150km以下的算路请求分为短途算路场景,对于请求计算的路径长度在500km以上的算路请求分为长途算路场景。示例性地,本实施例中,可以根据请求所对应的起点和终点,计算起点至终点之间的球面距离,作为该请求所请求计算的路径长度。
另外,可以对于在行前阶段产生的请求(例如在设置起点和终点后用于获取多条路线规划的请求)分为用户行前场景,对于用于在行中阶段产生的请求分为用户行中场景。示例性地,本实施例中,可以根据请求所对应的日志中的state字段来确定该请求产生的阶段,若state=1,则可以表示请求是行前阶段产生的,若state=4则表示请求是行中阶段产生的。
在每种场景中再根据用户设定的规则和阈值进行判断。例如,短途算路场景的请求的服务的平均响应时间不能超过100ms,长途算路场景的请求的服务的平均响应时间不能超过500ms,用户行中场景不能出现errno(错误码)=22,用户行前场景不能出现errno=5等。然后生成分析结果,用于指示每类场景下,服务的哪些项字段不符合要求。例如在长途算路的场景下服务的平均响应时间超过了500ms,则可以在分析结果中标示出该服务的处理能力过差。
根据本公开的实施例,通过根据场景对日志数据进行分类,对每一类日志数据使用对应的分析规则进行分析,可以对日志数据进行更精细化的分析,从而适合例如地图服务等场景众多的业务。
示例性地,本实施例中提供了以下报警规则:数值大于报警阈值、数值小于报警阈值、数值等于报警阈值、数值不等于报警阈值、数值增量大于报警阈值、数值增量小于报警阈值、数值增量绝对值大于报警阈值、数值增比大于报警阈值、数值增比小于报警阈值、数值增比绝对值大于报警阈值等。这些报警规则全方位覆盖了绝对值、增量、增比等多个场景,同一日志子项可设置多个报警规则,多个报警规则之间可以取“或”和取“与”,从而进一步提高了日志分析的灵活性和分析结果的准确度。
根据本公开的实施例,还可以对每个分析项目设置报警等级。例如,可以将报警等级分为三级:0、1、2。其中,0级与1级的报警项可直接影响总体分析结果。当任意一项0或1级分析项目超过其对应的报警阈值后,此项分析项目即判定为优化或劣化,若为劣化,则总体分析结果直接判定为fail(失败)。
图5示意性示出了根据本公开实施例的分析日志数据的装置的框图。
如图5所示,装置500包括分类模块510、聚合模块520、确定模块530和分析模块540。
分类模块510,可以用于确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集。
聚合模块520,可以用于针对至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集。
确定模块530,可以用于根据聚合数据集中日志数据的场景类型,确定与聚合数据集对应的分析配置信息。
分析模块540,可以用于根据与聚合数据集对应的分析配置信息,对聚合数据集进行分析处理,得到分析结果。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如分析日志数据的方法。例如,在一些实施例中,分析日志数据的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的分析日志数据的方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行分析日志数据的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (14)

1.一种分析日志数据的方法,包括:
确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集;
针对所述至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集;
根据所述聚合数据集中日志数据的场景类型,确定与所述聚合数据集对应的分析配置信息;以及
根据与所述聚合数据集对应的分析配置信息,对所述聚合数据集进行分析处理,得到分析结果。
2.根据权利要求1所述的方法,其中,所述对数据集进行数据聚合处理包括:
确定所述数据集中每个日志数据的动态字段和关键字段;
删除所述数据集中每个日志数据的动态字段,得到多个精简曰志数据;以及
合并所述多个精简日志数据中关键字段相同的精简日志数据。
3.根据权利要求1所述的方法,其中,所述对数据集进行数据聚合处理包括:
确定所述数据集中每个日志数据的代码行数;以及
合并所述数据集中代码行数相同的日志数据。
4.根据权利要求1所述的方法,还包括:
向客户端发送日志分析脚本,并指示所述客户端在该客户端的目标容器环境中运行的所述日志分析脚本,其中,所述日志分析脚本用于收集目标服务的日志数据,所述目标容器环境为与目标服务对应的容器环境;以及
通过所述容器环境中运行的所述日志分析脚本,获取所述目标服务的日志数据。
5.根据权利要求4所述的方法,其中,所述向客户端发送日志分析脚本包括:
将日志分析脚本封装为第一HTTP数据包;以及
将所述第一HTTP数据包发送至所述客户端。
6.根据权利要求4所述的方法,其中,所述通过所述容器环境中运行的所述日志分析脚本,获取所述日志数据,包括:
获取来自所述客户端的第二HTTP数据包,其中,所述第二HTTP数据包是根据所述目标服务的日志数据生成的;以及
通过解析所述第二HTTP数据包,得到所述日志数据。
7.根据权利要求1所述的方法,其中,所述分析配置信息包括至少一个分析项目,以及针对所述至少一个分析项目中每个分析项目的报警规则和报警阈值;
所述根据与所述聚合数据集对应的分析配置信息,对所述聚合数据集进行分析处理,得到分析结果,包括:
针对所述聚合数据集中的每个日志数据:
确定所述日志数据中与所述每个分析项目对应的字段值;以及
根据与所述分析项目对应的报警规则和报警阈值,确定针对所述字段值的分析结果。
8.根据权利要求7所述的方法,还包括:
获取性能测试报告,其中,所述性能测试报告包括至少一个实际字段值和对应的性能指标,所述至少一个实际字段值与所述至少一个分析项目对应;以及
利用深度学习模型对所述性能测试报告中的实际字段值和对应的性能指标进行分析,生成与所述至少一个分析项目对应的报警阈值。
9.根据权利要求1-8中任一项所述的方法,还包括:
在所述日志数据包括状态信息的情况下,根据所述状态信息,确定所述日志数据的场景类型。
10.根据权利要求1-8中任一项所述的方法,还包括:
在所述日志数据包括终点位置信息和起点位置信息的情况下,根据所述终点位置信息和所述起点位置信息,确定终点与起点之间的距离;以及
根据所述终点与起点之间的距离,确定所述日志数据的场景类型。
11.一种分析日志数据的装置,包括:
分类模块,用于确定多个日志数据中场景类型相同的日志数据作为一个数据集,得到至少一个数据集;
聚合模块,用于针对所述至少一个数据集中的每个数据集进行数据聚合处理,得到至少一个聚合数据集;
确定模块,用于根据所述聚合数据集中日志数据的场景类型,确定与所述聚合数据集对应的分析配置信息;以及
分析模块,用于根据与所述聚合数据集对应的分析配置信息,对所述聚合数据集进行分析处理,得到分析结果。
12.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
13.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。
CN202110588014.XA 2021-05-27 2021-05-27 分析日志数据的方法和装置 Active CN113326243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110588014.XA CN113326243B (zh) 2021-05-27 2021-05-27 分析日志数据的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110588014.XA CN113326243B (zh) 2021-05-27 2021-05-27 分析日志数据的方法和装置

Publications (2)

Publication Number Publication Date
CN113326243A true CN113326243A (zh) 2021-08-31
CN113326243B CN113326243B (zh) 2022-08-16

Family

ID=77421793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110588014.XA Active CN113326243B (zh) 2021-05-27 2021-05-27 分析日志数据的方法和装置

Country Status (1)

Country Link
CN (1) CN113326243B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150135018A1 (en) * 2013-11-12 2015-05-14 Fujitsu Limited Analysis method, analysis apparatus, computer-readable storage medium storing analysis program
CN106528619A (zh) * 2016-09-30 2017-03-22 国家电网公司 一种基于关键字段的交换机日志快速聚合方法
CN107426022A (zh) * 2017-07-21 2017-12-01 上海携程商务有限公司 安全事件监测方法及装置、电子设备、存储介质
CN109634818A (zh) * 2018-10-24 2019-04-16 中国平安人寿保险股份有限公司 日志分析方法、系统、终端及计算机可读存储介质
CN110347653A (zh) * 2019-07-10 2019-10-18 中国工商银行股份有限公司 数据处理方法及装置、电子设备和可读存储介质
CN112650599A (zh) * 2020-12-21 2021-04-13 深圳前海微众银行股份有限公司 一种日志处理方法、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150135018A1 (en) * 2013-11-12 2015-05-14 Fujitsu Limited Analysis method, analysis apparatus, computer-readable storage medium storing analysis program
CN106528619A (zh) * 2016-09-30 2017-03-22 国家电网公司 一种基于关键字段的交换机日志快速聚合方法
CN107426022A (zh) * 2017-07-21 2017-12-01 上海携程商务有限公司 安全事件监测方法及装置、电子设备、存储介质
CN109634818A (zh) * 2018-10-24 2019-04-16 中国平安人寿保险股份有限公司 日志分析方法、系统、终端及计算机可读存储介质
CN110347653A (zh) * 2019-07-10 2019-10-18 中国工商银行股份有限公司 数据处理方法及装置、电子设备和可读存储介质
CN112650599A (zh) * 2020-12-21 2021-04-13 深圳前海微众银行股份有限公司 一种日志处理方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张春生等: "基于大数据技术的IT基础设施日志分析系统设计与实现", 《微型电脑应用》 *

Also Published As

Publication number Publication date
CN113326243B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
US10649838B2 (en) Automatic correlation of dynamic system events within computing devices
US20210383295A1 (en) Method and apparatus for stress testing, electronic device and computer readable medium
US10592327B2 (en) Apparatus, system, and method for analyzing logs
US20180095819A1 (en) Incident analysis program, incident analysis method, information processing device, service identification program, service identification method, and service identification device
CN112380131A (zh) 模块测试方法、装置及电子设备
CN111400361A (zh) 数据实时存储方法、装置、计算机设备和存储介质
KR20220166760A (ko) 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법
CN113326243B (zh) 分析日志数据的方法和装置
CN111464637A (zh) 无人车数据处理方法、装置、设备和介质
CN115687406A (zh) 一种调用链数据的采样方法、装置、设备及存储介质
CN114756301A (zh) 日志处理方法、装置和系统
CN114706893A (zh) 故障检测方法、装置、设备及存储介质
CN114546799A (zh) 埋点日志校验方法、装置、电子设备、存储介质及产品
US11487746B2 (en) Business impact analysis
CN114428711A (zh) 数据检测方法、装置、设备及存储介质
CN114884813A (zh) 一种网络架构确定方法、装置、电子设备及存储介质
CN111865699A (zh) 故障识别方法、装置、计算设备和介质
CN113760856A (zh) 数据库管理方法及装置、计算机可读存储介质、电子设备
CN116431872B (zh) 可观测系统及基于可观测系统的服务观测方法
CN114338472B (zh) 地图服务器的容量测试方法、装置、设备、介质及产品
US20170109250A1 (en) Monitoring apparatus, method of monitoring and non-transitory computer-readable storage medium
CN113138903B (zh) 用于跟踪存储系统的性能的方法和设备
US20240119385A1 (en) Methods and systems for discovery and monitoring of business flows
CN116225746A (zh) 系统问题的确定方法、装置、设备、存储介质及程序产品
CN117650967A (zh) 一种多集群指标处理方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant