CN117194179B - 一种指标的确定方法、装置、电子设备及存储介质 - Google Patents

一种指标的确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117194179B
CN117194179B CN202311478819.4A CN202311478819A CN117194179B CN 117194179 B CN117194179 B CN 117194179B CN 202311478819 A CN202311478819 A CN 202311478819A CN 117194179 B CN117194179 B CN 117194179B
Authority
CN
China
Prior art keywords
index
log
acquired
calculation
logs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311478819.4A
Other languages
English (en)
Other versions
CN117194179A (zh
Inventor
周云韬
谢陈成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xingrui Network Information Technology Co ltd
Original Assignee
Hangzhou Xingrui Network Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xingrui Network Information Technology Co ltd filed Critical Hangzhou Xingrui Network Information Technology Co ltd
Priority to CN202311478819.4A priority Critical patent/CN117194179B/zh
Publication of CN117194179A publication Critical patent/CN117194179A/zh
Application granted granted Critical
Publication of CN117194179B publication Critical patent/CN117194179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开提供了一种指标的确定方法、装置、电子设备及存储介质,涉及数据处理技术领域,本方法包括:根据待采集指标的类型,生成配置文件,所述配置文件包括与待采集指标对应的日志标识以及计算方式;基于所述日志标识和所述计算方式,生成与所述待采集指标对应的计算策略函数;按照预设的日志格式,获取当前业务对应的各个日志;通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志;通过所述计算策略函数对所述目标日志中的事件记录数据进行计算,确定所述待采集指标的数值。本方法提供了一种弱侵入的方式确定定制化指标的方法,应用本方法跨语言能力强,无需对应用程序代码进行实质性更改,对应用程序代码影响较小。

Description

一种指标的确定方法、装置、电子设备及存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及一种指标的确定方法、装置、电子设备及存储介质。
背景技术
指标是用于描述系统当前某种状态的数据。在运维管理中,指标采集是一个非常重要的环节。目前指标的采集方法主要包括开源遥测框架(Opentelemetry)、分布式追踪系统(Skywalking)、Java生态系统中的度量库(Micrometer)、开源的监控和警报工具(Prometheus)等。
现有的方法中,无侵入性的指标采集功能只能支持采集常规通用的指标。例如,采集超文本传输协议(Hypertext Transfer Protocol,HTTP)请求、存储器使用率、java虚拟机性能指标等,无法对业务定制化的指标进行收集。现有方法中的侵入性采集方法,需要开发人员学习每种方法所提供的软件开发包(Software Development Kit,SDK)的使用方法,学习成本高。部分现有方法,如Micrometer只提供单一语言(java语言)的SDK。如Opentelemetry、Skywalking等,针对不同的开发语言提供的SDK各有所不同,跨语言能力弱,提高了业务的开发成本。针对需要计算才能采集的指标,例如统计token请求的耗时,需在子链路开始处添加计时器并启动,在子链路结束后关闭计时器,然后统计耗时,这样的方式对应用程序代码的侵入性较大,降低了应用程序代码的可读性和可维护性。
发明内容
本公开提供了一种指标的确定方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。
根据本公开的第一方面,提供了一种指标的确定方法,所述方法包括:
根据待采集指标的类型,生成配置文件,所述配置文件包括与所述待采集指标对应的日志标识以及计算方式;基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数;按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志;通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志;通过所述计算策略函数对所述目标日志中的事件记录数据进行计算,确定所述待监测系统中的所述待采集指标的数值,其中,所述待监测系统为递归调用系统或分布式系统。
在一可实施方式中,所述根据待采集指标的类型,生成配置文件,包括:根据所述待采集指标的类型,确定计算所述待采集指标的数值所需的日志标识和计算方式;根据所述日志标识和所述计算方式,生成配置文件。
在一可实施方式中,所述基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数,包括:基于所述日志标识和所述计算方式,利用所述go语言的闭包函数生成与所述待采集指标对应的计算策略函数。
在一可实施方式中,所述通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志,包括:确定所述各个日志对应的日志标识;通过所述计算策略函数对所述各个日志对应的日志标识进行筛选,将所述各个日志中与所述待采集指标具有相同日志标识的日志确定为目标日志。
在一可实施方式中,所述方法还包括:确定多个时间下所述待采集指标的数值;根据每个数值的确定时间,得到所述待采集指标对应的数值时序序列。
在一可实施方式中,所述方法还包括:通过可视化工具,得到所述待采集指标对应的数值时序序列的可视化图表。
根据本公开的第二方面,提供了一种指标的确定装置,所述装置包括:第一生成模块,用于根据待采集指标的类型,生成配置文件,所述配置文件包括与所述待采集指标对应的日志标识以及计算方式;第二生成模块,用于基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数;获取模块,用于按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志;计算模块,用于通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志;所述计算模块,还用于通过所述计算策略函数对所述目标日志中的事件记录数据进行计算,确定所述待监测系统中的所述待采集指标的数值,其中,所述待监测系统为递归调用系统或分布式系统。
在一可实施方式中,所述第一生成模块,还用于根据所述待采集指标的类型,确定计算所述待采集指标的数值所需的日志标识和计算方式;根据所述日志标识和所述计算方式,生成配置文件。根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
本公开的一种指标的确定方法、装置、电子设备及存储介质,首先根据待采集指标的类型,生成配置文件,然后基于配置文件,生成与待采集指标对应的计算策略函数;按照预设的日志格式,获取当前业务对应的各个日志,通过计算策略函数,从各个日志中筛选出待采集指标对应的目标日志,并对目标日志中的事件记录数据进行计算,确定待采集指标对应的数值。本方法在业务过程中只需要按照预设的日志格式获取相关日志,而无需在应用程序中直接插入大量的新代码用以获取指标,因此,不会影响应用程序的核心逻辑,是一种弱侵入方式,保证了应用程序代码的可读性和可维护性,且本方法对开发人员的专业能力要求较低,跨语言能力较强。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本公开实施例一种指标的确定方法的实现流程示意图一;
图2示出了本公开实施例一种指标的确定方法的实现流程示意图二;
图3示出了本公开实施例一种待采集指标可视化示意图;
图4示出了本公开实施例一种指标的确定系统的示意图一;
图5示出了本公开实施例一种指标的确定系统的示意图二;
图6示出了本公开实施例一种指标的确定装置的组成结构示意图一;
图7示出了本公开实施例一种指标的确定装置的组成结构示意图二;
图8示出了本公开实施例一种电子设备的组成结构示意图。
具体实施方式
为使本公开的目的、特征、优点能够更加的明显和易懂,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而非全部实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
图1示出了本公开实施例一种指标的确定方法的实现流程示意图一。根据本公开实施例的第一方面,提供了一种指标的确定方法,如图1所示,本方法包括:
步骤101,根据待采集指标的类型,生成配置文件,配置文件包括与待采集指标对应的日志标识以及计算方式。
待采集指标为需要采集计算的指标,待采集指标的类型为指标的具体内容,例如统计token(令牌)请求的耗时、语音合成的合成性能等。日志标识用于识别每一条日志,可以根据每一条日志的特性,人为定义每一条日志的日志标识,待采集指标对应的日志标识为计算该待采集指标的数值所需要用到的所有日志的日志标识。计算方式为计算出待采集指标的数值所需要的每条日志中的事件记录数据之间存在的数学关系。
例如,待采集指标为“确定某条链路的耗时”,计算某条链路的耗时需要在该链路开始处打印开始日志,结束处打印结束日志,定义在开始处打印的日志的日志标识为“开始日志”,定义在结束处打印的日志的日志标识为“结束日志”,因此,该待采集指标对应的配置文件中应该包括日志标识:“开始日志”、“结束日志”,计算方式:“结束日志”的时间减去“开始日志”的时间。
步骤102,基于日志标识和计算方式,通过go语言生成与待采集指标对应的计算策略函数。
对配置文件进行解析,解析出该待采集指标对应的日志标识和计算方式。基于go语言的闭包函数的特性,将待采集指标对应的日志标识和计算方式作为闭包函数的参数传入,然后在其返回的函数中使用,如此可以根据待采集指标对应的配置文件,生成每个待采集指标各自对应的计算策略函数。在实施时,可将日志标识和计算方式作为闭包函数的输入,闭包函数基于该输入进行运算生成计算策略函数并返回,闭包函数的返回函数即为计算策略函数。将生成的计算策略函数进行存储。
步骤103,按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志。
当前业务对应的各个日志包括与当前业务中所需要确定的所有待采集指标相关的日志。具体的,预设的日志格式可以为以下格式:timestamp|traceld|keyword|value|pattern1|pattern2|……。其中,timestamp为此条日志生成的时间;traceld为链路流程编号,用于定位某次请求链路;keyword为此条日志的日志标识,用于标识此条日志;value为此条日志中的事件记录数据,为与日志相关的带有含义的数据值,用于参与待采集指标计算;pattern1、pattern2……是一个可选择、可扩展的选项,主要用于递归情况下的子级别指标收集,没有pattern表示待采集指标时间复杂度为O(n),pattern1表示待采集指标时间复杂度为O(),pattern2表示待采集指标时间复杂度为O(/>),以此类推。
具体的,首先定义好日志的格式,然后按照当前任务每个执行节点定义在哪些节点需要进行打印日志以及打印哪些日志。在待监测系统执行当前任务过程中,系统会按照预设的日志格式,逐一打印出每个日志。最后需要将系统打印出的日志,全部采集起来。
步骤104,通过计算策略函数,从各个日志中筛选出与待采集指标对应的目标日志。
具体的,每一个待采集指标对应的多个目标日志中都会存在一个日志的日志标识被定义为触发关键词,当检测到采集到的各个日志中包括日志标识为触发关键词的日志后,就会触发该待采集指标对应的计算策略函数,待采集指标对应的计算策略函数知道该待采集指标对应的所有目标日志的日志标识,然后根据日志标识从采集到的各个日志中筛选出与待采集指标对应的所有日志,筛选出的日志可作为目标日志使用。
步骤105,通过计算策略函数对目标日志中的事件记录数据进行计算,确定待监测系统中的待采集指标的数值,其中,待监测系统为递归调用系统或分布式系统。
日志中的事件记录数据为日志中和日志相关带有含义的数据值,例如步骤101中所举例的“开始日志”中,其事件记录数据即为开始的时间。通过计算策略函数筛选出目标日志后,对所有目标日志中的事件记录数据进行计算,得到待采集指标的取值。以待采集指标为“确定某条链路的耗时”为例,例如“开始日志”的事件记录数据为三点三十分,“结束日志”的事件记录数据为三点三十一分,则用三点三十一分减去三点三十分,得到“确定某条链路的耗时”的数值为一分钟,则待采集指标“某条链路的耗时”的数值为1分钟。
本公开的一种指标的确定方法,只需要让应用程序按照预设的日志格式打印相关日志,然后在配置文件中定义待采集指标需要的日志以及计算方式,即可确定待采集指标的数值,相较于现有侵入式的指标采集方法,本方法无需在应用程序中直接插入大量的用以获取指标的新代码,未对应用程序进行实质性的更改,不会影响应用程序的核心逻辑,因此,本方法属于一种弱侵入的采集方式,保证了应用程序代码的可读性和可维护性,无需开发人员学习各种语言的SDK,对开发人员的专业能力要求较低,降低了开发成本,跨语言能力较强、扩展性好。
在本公开的一个实施例中,所述根据待采集指标的类型,生成配置文件,包括:根据所述待采集指标的类型,确定计算所述待采集指标的数值所需的日志标识和计算方式;根据所述日志标识和所述计算方式,生成配置文件。
以下以一个具体的实施场景对该实施例进行说明,该实施场景为语音合成业务场景,待采集指标为“统计合成引擎每毫秒可以合成的音频时长”,待采集指标的数值可用于评估合成引擎的性能。
如图2所示,在本场景中,需要将合成文本片段集合合成为相应的语音,在语音合成过程中,为了可以提供更自然、流畅的语音输出,通常需要将较长的文本分段进行合成,所以,在本场景中首先将合成文本片段集合分为N个小片段,然后N个文本小片段依次进行语音合成,即依次将每个小片段文本转换成相应的语音。在每个小片段进行语音合成前,进行第一次日志打印。如图2所示,第一次打印的日志至少包括4条日志,4条日志可以分别为主机IP(例如“2023_03_22 00:54:32.772|c7be096ce0c446d2858f13f767tc4eabl|tts_ip|172.168.1.1”)、语音合成模型类型(例如“2023-03-22 00:54:32.773|c7be096ce0c446d2858f13f767tc4eabl|tts_moudel|xiaohua”)、引擎类型(例如“2023-03-22 00:54:32.774|c7be096ce0c446d2858f13f767tc4eabl|app_id|A352CED352535235”)、开始合成(例如“2023-03-22 00:54:32.775|c7be096ce0c446d2858f13f767tc4eabl|split_tts_start|n”)等日志信息。然后调用合成引擎,开始进行语音合成,然后返回合成音频,语音合成后进行第二次日志打印。第二次打印的日志至少包括终止合成(例如“2023-03-22 00:54:35.815|c7be096ce0c446d2858f13f767tc4eabl |spit_tts_stop|n”)、合成音频长度(例如“2023-03-22 00:54:35.816| c7be096ce0c446d2858f13f767tc4eabl|tts_vioce_len|200n”)等日志信息。
然后对收集到的这7条日志进行定义,生成如下配置文件:
metrics:
server-name: TTS
statistics:
statistic: onnx_tts_rt
end-keyword: tts_voice_len
keywords:
name: tts_model
name: tts_ip
name: app_id
name: split_tts_start
depth: 1
value-tye: int64
name: split_tts_stop
depth:1
value-type: int64
name:tts_voice_len
depth: 1
value-type: int64
expression:record["tts_voice_len"]["value"]/(record["split_tts_end"]["time"]– record["split_tts_start"]["time"]
time: tts_voice_len
tags:
key: model_name
value: tts_model
key: ip_address
value: tts_ip
key: app_id
value: app_id
其中,server-name:TTS为这个待采集指标所属的业务类型;onnx_tts_rt为这个待采集指标的名称;end-keyword为定义的触发计算策略函数的关键词,即收到keyword为end-keyword中定义的关键词时,触发该待采集指标的计算;keywords中定义了计算这个待采集指标需要收集的日志,其中name为日志的日志标识,depth为日志的深度,即复杂度信息,如果日志中包含pattern1,则depth为1,包含pattern2,则depth为2,以此类推,用于在结构化日志中做检索;value-type在需要某条日志的value参与计算时,定义value的变量类型,此处默认为string类型;expression定义了这个待采集指标的计算方式,上述计算方式可以描述为:这条待采集指标的数值是通过日志标识为tts_voice_len的日志的value值除以日志标识为split_tts_end与split_tts_start的时间差,即用合成产出音频时长除以合成耗时;tags为此条指标的维度信息,即为这条指标的其他组成成员,用于指标的检索、分类和聚合等。
在本公开的一个实施例中,所述基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数,包括:基于所述日志标识和所述计算方式,利用所述go语言的闭包函数生成与所述待采集指标对应的计算策略函数。
go语言的闭包函数可以简单的理解为一个函数的返回值仍然是一个函数,以下以一个具体例子进行说明:
package main
import(
"fmt"
"github.com/xujiajun/utils/strconv2"
func main( ) {
counter := func(start int) func( ) int {
counter := func( ) int {
start = start+1
return start
}
return counter
}(5)
i := counter( )
fmt.Printf(strconv2.IntToStr(i) + "")
i = counter( )
fmt.Printf(strconv2.IntToStr(i))
}
这段代码展示了一个闭包的概念,首先在导入了一个必要的包后,进入“main”函数,“counter”是一个闭包,它接收一个起始值“start”,并返回一个函数,这个返回的函数被定义为匿名函数“func () int”,它会增加“start”的值并返回。调用闭包“counter”并传入起始值5,这将在闭包内部的“start”中初始化,第一次调用“counter()”,它会返回6,因为“start”初始值为5,增加1后返回,使用“fmt.Printf”,将结果进行打印。第二次调用“counter()”,它会返回7,因为之前的调用已经将“start”更新为6,再增加1后返回。在闭包是“counter”的情况下,计算函数策略是前述代码中返回的函数“func( ) int”,闭包函数“counter”本身可以作为值返回给“func( ) int”,在本方法中配置文件作为一个闭包函数,然后再返回的计算函数策略中使用。
通过上述方式,可以设计一个计算策略函数生成函数,具体方式如下:
func makeSchemaFunction(rawInfo statistics.StatisticInfo,serverNamestring) func(context context.Context,patterns…string){}
这个函数声明有两个参数:“rawInfo”和“serverName”,分别是“statistics.StatisticInfo”类型的参数和“ string”类型的参数,而函数本身的返回类型是一个函数。这段代码的意思为定义了一个名为“makeSchemaFunction”的函数,它接受两个参数“rawInfo”和“ serverName”,并返回一个函数,这个返回的函数即为计算策略函数。其中,“rawInfo”即为结构化后的配置文件,“serverName”为业务名,是一个预留的参数,它可以用来区分一个配置文件中定义的指标可以用来计算不同的系统,不同的系统可以通过“serverName”来做区分。
在这个计算策略函数生成函数中,将从配置文件中解析出来的关于指标的信息和业务名等信息作为参数传入,然后在返回的计算策略函数中使用,这两个参数将成为计算策略函数的专属属性。
然后利用go语言中函数可以变量传递的特性,将生成的计算策略函数以触发关键字为end-keyword存入策略函数集合中,具体通过以下代码进行实现:
for -, statistic := range monitor.Statistics {
function :=makeSchemaFunction(statistic,monitor.ServerName)
Schema[statistic.EndKeyword]=append(Schema[statistic.EndKeyword],function)。
在本公开的一个实施例中,通过计算策略函数,从各个日志中筛选出与待采集指标对应的目标日志,包括:首先确定各个日志对应的日志标识;然后通过计算策略函数对各个日志对应的日志标识进行筛选,将各个日志中与待采集指标具有相同日志标识的日志确定为目标日志。
每条日志中均包括该条日志的日志标识,计算策略函数中已知待采集指标对应的日志标识,然后基于待采集指标对应的日志标识,从获取到的所有的日志中挑选出日志标识与待采集指标对应的日志标识一致的日志作为目标日志。
在本公开的一个实施例中,本方案中指标的确定方法还包括:确定多个时间下待采集指标的数值;根据每个数值的确定时间,得到待采集指标对应的数值时序序列。
多个时间可根据实际情况进行设定,例如每隔10分钟,按照前述步骤101到步骤105的方案,获取一次该待采集指标的数值,然后将该待采集指标在所有时间点下获取到的数据按照时间进行排序整理,得到数值时序序列,数值时序序列为各个时间上的待采集指标的数值的集合。例如,待采集指标为“token请求的耗时”,得到的该指标十点的数据为0.5毫秒、十点十分的数据为0.4毫秒、十点二十分的数据为0.7毫秒等等。
在本公开的一个实施例中,方法还包括:通过可视化工具,得到待采集指标对应的数值时序序列的可视化图表。
可视化工具可以将数据转换成图形或图像在屏幕上显示出来,例如grafana。具体的,将同一待采集指标对应的数值时序序列存储到时序数据库中,需要输出时将数值以时序数据库所规定的形式进行输出。以时序数据库为influxDB为例,得到的待采集指标的数值将以influxDB行协议的形式输出,如图2所示的例子,计算策略函数将会生成以下行协议:tts_rt,model_name=xiaohua,appid=A352CED352535235,ip_address=172.168.1.1,value=5 1676897386196。相似的,时序数据库为Prometheus时,指标生成函数同样可以按Prometheus协议的标准,实现Prometheus协议接口,推送指标到Prometheus出口并定时被Prometheus获取。
在时序数据库中,得到该待采集指标对应的数值时序序列,然后通过可视化工具查询时序数据库中的数值时序序列,通过仪表盘即可实现将待采集指标在各个时间上的数值进行可视化展示。
图3示出了前述语音合成场景下,待采集指标为“统计合成引擎每毫秒可以合成的音频时长”的数值时序序列的可视化图表,如图3所示图表的横坐标为指标的时间,纵坐标为音频时长。从图3中可以看出合成引擎分别在五点、五点五分、五点十分……六点三十分时每毫秒可以合成的音频的时长,如图3中所示出的点1和点2分别表征获取到待采集指标五点三十分和五点五十分的数值,即在五点三十分时,合成引擎每毫秒可以合成的音频时长为6.9毫秒,在五点五十分时,合成引擎每毫秒可以合成的音频时长为7.0毫秒。从可视化图标中可以形象、方便的观察到某个待采集指标的数值的数据趋势和变化规律,便于监测系统的状态。
在本公开的一个实施例中,提出了一种具体的系统架构用以实现本公开的指标确定方法,该系统的整体架构通过使用go语言编程,在待监测系统中添加Telegraf插件实现,如图4所示,系统主要由以下几个模块组成:
采集模块(tail module):用于在子协程中采集业务中打印的所有的用于指标计算的日志;该模块支持多个日志文件的并发采集,且支持日志滚动归档后释放原日志文件句柄,并自动定位采集新的日志文件。
内存模块(go-cache):用于临时存储tail module收集到的格式化后的日志数据,用于指标计算;
配置文件(metrics.yaml):用于定义计算待采集指标需要采集的日志以及通过日志计算生成指标的方式;
策略模块(scheme module):通过对配置文件进行解析,根据配置文件中定义内容,利用go语言闭包函数的特性,生成计算策略函数;
计算模块(calculation module):由策略模块生成的计算策略函数组成的计算模块,用于计算待采集指标的数值。通过触发关键词对计算策略韩式进行触发,检索go-cache中的格式化日志,计算待采集指标的数值;
时间序列数据库(InfluxDB):用于存储待采集指标的数值并对数值进行实时计算的存储工具;此处的时间序列数据库还可以替换为Prometheus;
可视化工具 (Grafana):通过从时间序列数据库中获取待采集指标的数值用于展示,支持各种类型的图表。
该系统应用于递归调用系统的指标采集。具体的,系统在进行某项业务过程中会采集到多种的日志(log),tail module利用轻量级线程(goroutine),将这些日志进行收集,并存入go-cache中待检索计算。根据待采集指标的类型,在metrics.yaml中定义计算该待采集指标需要的日志及计算方式,该系统启动时,scheme module通过对解析配置文件动态生成计算策略函数,并存入到calculation module中,calculation module中的计算策略函数通过goroutine,对待采集指标的数值进行计算。
由此实现了将指标的计算生成的业务逻辑从原有的系统中剥离,保证了原有系统的可维护性。
当包含触发关键词的日志被收集时,表征需要计算待采集指标的数据了,系统将会启动goroutine,触发calculation module中与出发关键词对应的计算策略函数,计算策略函数在go-cache中检索出配置文件中定义的所有目标日志,并对目标日志中的事件记录数据进行计算,得到待采集指标的数值。最后在将计算出来的待采集指标的数值发送到时序数据库并通过grafana进行可视化展示。
本系统中采用轻量级线程,与内核态的线程相比,内存方面,每个用户态的轻量级线程所需要的内存仅为8千字节左右,结合GMP调度及锁定CPU调度核心的能力,1G内存即可提供大约13万的并发计算,8G内存即可支持百万的并发能力,占用空间小、计算力强。
另一实施方式中,本方法除了用于递归调用系统的指标采集,也可以用于分布式系统的指标采集。应用在分布式系统中的具体架构如图5所示,其中除了内存模块,其他模块均与图4所示模块相同,在此不再赘述,在该系统中仅是将图4所示系统中的内存模块go-cache换成了分布式数据库,分布式数据库例如redis、mongodb等。分别在不同的系统中获取到日志后,统一存储到分布式数据库中,实现了分布式系统中指标的确定。待采集指标的计算将通过触发关键词所落在的机器上触发,保证了非重复性和一致性。
根据本公开的另一方面,提供了一种指标的确定装置,图6示出了本公开实施例一种指标的确定装置的组成结构示意图,如图6所示,该装置包括:
第一生成模块601,用于根据待采集指标的类型,生成配置文件,配置文件包括与待采集指标对应的日志标识以及计算方式;
第二生成模块602,用于基于日志标识和计算方式,通过go语言生成与待采集指标对应的计算策略函数;
获取模块603,用于按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志;
计算模块604,用于通过计算策略函数,从各个日志中筛选出与待采集指标对应的目标日志;
计算模块604,还用于通过计算策略函数对目标日志中的事件记录数据进行计算,确定待监测系统中的待采集指标的数值,其中,待监测系统为递归调用系统或分布式系统。
在本公开的一个实施例中,第一生成模块601,还用于根据待采集指标的类型,确定计算待采集指标的数值所需的日志标识和计算方式;根据日志标识和计算方式,生成配置文件。
在本公开的一个实施例中,第二生成模块602,还用于基于日志标识和计算方式,利用go语言的闭包函数生成与待采集指标对应的计算策略函数。
在本公开的一个实施例中,计算模块604,还用于确定各个日志对应的日志标识;通过计算策略函数对各个日志对应的日志标识进行筛选,将各个日志中与待采集指标具有相同日志标识的日志确定为目标日志。
在本公开的一个实施例中,如图7所示,该装置还包括确定模块605,用于确定多个时间下所述待采集指标的数值;根据每个数值的确定时间,得到所述待采集指标对应的数值时序序列。
在本公开的一个实施例中,该装置还包括可视化模块606,用于通过可视化工具,得到所述待采集指标对应的数值时序序列的可视化图表。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如一种指标的确定方法。例如,在一些实施例中,一种指标的确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的一种指标的确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一种指标的确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种指标的确定方法,其特征在于,所述方法包括:
根据待采集指标的类型,生成配置文件,所述配置文件包括与所述待采集指标对应的日志标识以及计算方式;
基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数;
按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志;
通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志;
通过所述计算策略函数对所述目标日志中的事件记录数据进行计算,确定所述待监测系统中的所述待采集指标的数值,其中,所述待监测系统为递归调用系统或分布式系统;
所述根据待采集指标的类型,生成配置文件,包括:根据所述待采集指标的类型,确定计算所述待采集指标的数值所需的日志标识和计算方式;根据所述日志标识和所述计算方式,生成配置文件;
所述基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数,包括:基于所述日志标识和所述计算方式,利用所述go语言的闭包函数生成与所述待采集指标对应的计算策略函数。
2.根据权利要求1所述的方法,其特征在于,所述通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志,包括:
确定所述各个日志对应的日志标识;
通过所述计算策略函数对所述各个日志对应的日志标识进行筛选,将所述各个日志中与所述待采集指标具有相同日志标识的日志确定为目标日志。
3.根据权利要求1至2任一项所述的方法,其特征在于,所述方法还包括:
确定多个时间下所述待采集指标的数值;
根据每个数值的确定时间,得到所述待采集指标对应的数值时序序列。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过可视化工具,得到所述待采集指标对应的数值时序序列的可视化图表。
5.一种指标的确定装置,其特征在于,所述装置包括:
第一生成模块,用于根据待采集指标的类型,生成配置文件,所述配置文件包括与所述待采集指标对应的日志标识以及计算方式;
第二生成模块,用于基于所述日志标识和所述计算方式,通过go语言生成与所述待采集指标对应的计算策略函数;
获取模块,用于按照预设的日志格式,从待监测系统中获取当前业务对应的各个日志;
计算模块,用于通过所述计算策略函数,从所述各个日志中筛选出与所述待采集指标对应的目标日志;
所述计算模块,还用于通过所述计算策略函数对所述目标日志中的事件记录数据进行计算,确定所述待监测系统中的所述待采集指标的数值,其中,所述待监测系统为递归调用系统或分布式系统;
所述第一生成模块,还用于根据所述待采集指标的类型,确定计算所述待采集指标的数值所需的日志标识和计算方式;根据所述日志标识和所述计算方式,生成配置文件;
所述第二生成模块,还用于基于所述日志标识和所述计算方式,利用所述go语言的闭包函数生成与所述待采集指标对应的计算策略函数。
6.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
7.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行根据权利要求1-4中任一项所述的方法。
CN202311478819.4A 2023-11-08 2023-11-08 一种指标的确定方法、装置、电子设备及存储介质 Active CN117194179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311478819.4A CN117194179B (zh) 2023-11-08 2023-11-08 一种指标的确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311478819.4A CN117194179B (zh) 2023-11-08 2023-11-08 一种指标的确定方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117194179A CN117194179A (zh) 2023-12-08
CN117194179B true CN117194179B (zh) 2024-04-16

Family

ID=89005662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311478819.4A Active CN117194179B (zh) 2023-11-08 2023-11-08 一种指标的确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117194179B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103220188A (zh) * 2013-04-11 2013-07-24 江苏中科惠软信息技术有限公司 一种http数据采集设备
CN105681276A (zh) * 2015-12-25 2016-06-15 亿阳安全技术有限公司 一种敏感信息泄露主动监控与责任认定方法与装置
CN106789303A (zh) * 2016-12-29 2017-05-31 北京奇艺世纪科技有限公司 一种容器日志采集方法及装置
WO2017166644A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 一种数据采集方法和系统
CN107979477A (zh) * 2016-10-21 2018-05-01 苏宁云商集团股份有限公司 一种业务监控的方法及系统
CN108600035A (zh) * 2018-07-21 2018-09-28 杭州安恒信息技术股份有限公司 一种非侵入式web应用监控与日志查询方法
CN112463527A (zh) * 2020-11-13 2021-03-09 完美世界控股集团有限公司 一种数据处理方法、装置、设备、系统及存储介质
CN113448798A (zh) * 2020-12-30 2021-09-28 北京新氧科技有限公司 日志数据监控方法及相关设备
CN114416685A (zh) * 2021-12-22 2022-04-29 北京百度网讯科技有限公司 日志处理方法、系统和存储介质
CN116542558A (zh) * 2023-04-27 2023-08-04 上海数禾信息科技有限公司 业务指标计算方法、装置、计算机设备和存储介质
CN116743692A (zh) * 2023-08-16 2023-09-12 杭州星锐网讯科技有限公司 一种历史消息折叠方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103220188A (zh) * 2013-04-11 2013-07-24 江苏中科惠软信息技术有限公司 一种http数据采集设备
CN105681276A (zh) * 2015-12-25 2016-06-15 亿阳安全技术有限公司 一种敏感信息泄露主动监控与责任认定方法与装置
WO2017166644A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 一种数据采集方法和系统
CN107979477A (zh) * 2016-10-21 2018-05-01 苏宁云商集团股份有限公司 一种业务监控的方法及系统
CN106789303A (zh) * 2016-12-29 2017-05-31 北京奇艺世纪科技有限公司 一种容器日志采集方法及装置
CN108600035A (zh) * 2018-07-21 2018-09-28 杭州安恒信息技术股份有限公司 一种非侵入式web应用监控与日志查询方法
CN112463527A (zh) * 2020-11-13 2021-03-09 完美世界控股集团有限公司 一种数据处理方法、装置、设备、系统及存储介质
CN113448798A (zh) * 2020-12-30 2021-09-28 北京新氧科技有限公司 日志数据监控方法及相关设备
CN114416685A (zh) * 2021-12-22 2022-04-29 北京百度网讯科技有限公司 日志处理方法、系统和存储介质
CN116542558A (zh) * 2023-04-27 2023-08-04 上海数禾信息科技有限公司 业务指标计算方法、装置、计算机设备和存储介质
CN116743692A (zh) * 2023-08-16 2023-09-12 杭州星锐网讯科技有限公司 一种历史消息折叠方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数据溯源研究与实践进展;王芳;赵洪;;情报学进展;20200731(第00期);第318-358页 *

Also Published As

Publication number Publication date
CN117194179A (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
CN111400186B (zh) 性能测试方法及系统
US10116534B2 (en) Systems and methods for WebSphere MQ performance metrics analysis
JP2000011005A (ja) データ分析方法及び装置及びデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2001086437A1 (en) Method and apparatus for correlation of events in a distributed multi-system computing environment
KR102067032B1 (ko) 하이브리드 빅데이터 시스템 기반 데이터 처리 방법 및 시스템
CN114791846B (zh) 一种针对云原生混沌工程实验实现可观测性的方法
CN111581060A (zh) 基于Prometheus的日志告警系统、方法以及相关设备
CN112804079A (zh) 云计算平台告警分析方法、装置、设备及存储介质
CN111400189A (zh) 代码覆盖率监测方法、装置、电子设备及存储介质
CN111694561A (zh) 一种接口管理方法、装置、设备及存储介质
CN110351131B (zh) 一种用于分布式链路的监控方法、装置和电子设备
CN116107703A (zh) 接口控制文档的生成方法及装置
CN111327466A (zh) 一种告警分析方法、系统、设备以及介质
CN112540808A (zh) 一种程序行为层级调用关系的记录方法及相关设备
CN117194179B (zh) 一种指标的确定方法、装置、电子设备及存储介质
CN112948262A (zh) 一种系统测试方法、装置、计算机设备和存储介质
CN112363935A (zh) 数据联调方法、装置、电子设备及存储介质
CN112363774B (zh) Storm实时任务的配置方法及装置
Ehrenstein Scalability evaluation of explorviz with the universal scalability law
CN110413496B (zh) 一种实现电子证照运行数据组件化收集的方法
JP2021163475A (ja) ログベースのマッシュアップのコード生成
CN116743508B (zh) 一种电力系统网络攻击链检测方法、装置、设备及介质
CN116860555A (zh) 软件运行监控方法、装置、设备以及计算机存储介质
US11847448B2 (en) Automatic generation of exporter configuration rules
CN113282276B (zh) 一种模型的映射方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant