CN117056175A - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117056175A CN117056175A CN202311325542.1A CN202311325542A CN117056175A CN 117056175 A CN117056175 A CN 117056175A CN 202311325542 A CN202311325542 A CN 202311325542A CN 117056175 A CN117056175 A CN 117056175A
- Authority
- CN
- China
- Prior art keywords
- index data
- data
- timer
- query
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 239000000306 component Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241000533950 Leucojum Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及计算机技术领域,具体涉及一种数据处理方法、装置、电子设备及存储介质,该数据处理方法包括:获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;在到达所述启动时间时,启动所述定时器执行所述指标数据查询语句,以获取指标数据;将所述指标数据转换为目标格式的指标数据。该数据处理方法能够提高指标数据的查询效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。
背景技术
目前,通常使用普罗米修斯Prometheus收集和监控终端设备上运行的指标数据。收集指标数据后,再将指标数据上传到云端进行统一分析。Prometheus 是一个开源的系统监控和警报工具,用于收集、存储和查询各种应用程序和系统组件的指标数据。Prometheus被广泛用于云原生环境中的监控和警报领域,特别是在容器化应用程序和微服务架构中。
相关技术中,会将用于查询指标数据的查询语句写到代码中,然后运行代码,以执行查询语句,进而获取指标数据,再将指标数据上传至服务器。但是,采用这样的方式,如果需要新增查询的指标数据,则需要修改代码,并对修改的代码重新进行编译。编译通过后,重新执行代码,再获取指标数据。因此,采用相关技术研发人员的工作量较大,并且数据查询效率较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种数据处理方法,具有提高数据查询效率的优点。
根据本发明实施例的第一方面,提供一种数据处理方法,包括:
获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
将所述指标数据转换为目标格式的指标数据。
在本发明的一种示例性实施例中,所述采用多个线程执行所述指标数据查询语句包括:
获取所述指标数据查询语句的数量;
基于所述数量生成N个查询线程,N为大于1或者等于1的整数;
建立各所述指标数据查询语句与各所述查询线程的对应关系;
各所述查询线程分别按照所述对应关系执行与其对应的所述指标数据查询语句,以获取所述指标数据。
所述执行所述指标数据查询语句前,所述方法还包括:
建立M个数据上传线程,M为大于1或者等于1的整数;
所述执行所述指标数据查询语句后,所述方法还包括:
各所述查询线程将所述指标数据加入数据队列;
各所述数据上传线程分别从所述数据队列中获取所述指标数据,并将所述指标数据上传至服务器。
在本发明的一种示例性实施例中,所述将所述指标数据转换为目标格式的指标数据包括:
生成所述指标数据的标识信息;
获取所述指标数据的各字段与所述字段对应的字段值;
基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据。
在本发明的一种示例性实施例中,所述基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据包括:
将所述字段和所述字段值按照预设顺序进行排列,得到排列结果;
将所述排列结果进行字符串拼接,得到拼接结果;
生成所述拼接结果的标识码;
基于所述标识信息、所述标识码、所述字段以及所述字段值生成所述目标结构的指标数据。
在本发明的一种示例性实施例中,所述获取所述定时器的启动时间包括:
获取所述定时器的表达式;
从所述表达式中获取所述定时器的启动时间。
在本发明的一种示例性实施例中,所述将所述指标数据转换为目标格式的指标数据后,所述方法还包括:
生成与所述定时器对应的目标文件;
将所述目标格式的指标数据存储至所述目标文件。
在本发明的一种示例性实施例中,所述将所述目标格式的指标数据存储至所述目标文件后,所述方法还包括:
循环执行预设步骤,直至所述目标文件中的所有指标数据均已上传,所述预设步骤包括:
从所述目标文件中获取预设数量的所述目标格式的指标数据;
将所述预设数量的所述目标格式的指标数据通过目标接口上传至服务器。
根据本发明实施例的第二方面,提供一种数据处理装置,包括:
启动时间获取模块,用于获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
查询语句获取模块,用于从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
指标数据获取模块,用于在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
指标数据转换模块,用于将所述指标数据转换为目标格式的指标数据。
根据本发明实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项所述的数据处理方法。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面中任一项所述的数据处理方法。
综上所述,本发明实施例的数据处理方法,通过获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;在到达所述启动时间时,启动所述定时器采用所述多个线程执行所述指标数据查询语句,以获取指标数据;将所述指标数据转换为目标格式的指标数据;一方面,在需要新增查询的指标数据时,只需在查询语句配置文件中配置该指标数据的查询语句即可,不需要修改代码,更不需要对代码重新进行编译,从而减少了研发人员的工作量,并且提高了数据查询效率,另一方面,采用所述多个线程执行所述指标数据查询语句,能够进一步提高数据查询效率;再一方面,通过将所述指标数据转换为目标格式的指标数据,能够对指标数据的格式进行统一,进而提高数据处理效率。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是根据一示例性实施例提供的一种数据处理方法的流程图;
图2是根据一示例性实施例提供的一种指标数据查询语句的执行方法的流程图;
图3是根据一示例性实施例提供的一种指标数据生成方法的流程图;
图4是根据一示例性实施例提供的一种数据处理装置的方框图;
图5是根据一示例性实施例提供的一种存储介质的示意图;
图6是根据一示例性实施例提供的一种电子设备的方框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的数据处理方法进行说明。参考图1所示,上述的数据处理方法可以包括以下步骤:
S1、获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
S2、从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
S3、在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
S4、将所述指标数据转换为目标格式的指标数据。
综上所述,本发明实施例的数据处理方法,通过获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;在到达所述启动时间时,启动所述定时器采用所述多个线程执行所述指标数据查询语句,以获取指标数据;将所述指标数据转换为目标格式的指标数据;一方面,在需要新增查询的指标数据时,只需在查询语句配置文件中配置该指标数据的查询语句即可,不需要修改代码,更不需要对代码重新进行编译,从而减少了研发人员的工作量,并且提高了数据查询效率,另一方面,采用所述多个线程执行所述指标数据查询语句,能够进一步提高数据查询效率;再一方面,通过将所述指标数据转换为目标格式的指标数据,能够对指标数据的格式进行统一,进而提高数据处理效率。
下面,将结合附图及实施例对本示例实施方式中的数据处理方法中各个步骤进行更详细的说明。
在步骤S1中,获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动。
在本发明的一种示例性实施例中,上述获取定时器的启动时间包括:
S11、获取所述定时器的表达式;
S12、从所述表达式中获取所述定时器的启动时间。
在本发明的一种示例性实施例中,执行该数据处理方法的YAML配置文件中配置有多个定时器,可以通过定时器的标识信息(例如定时器的名称)从YAML配置文件获取定时器的执行时间cron表达式。(YAML, Yet Another Markup Language)是一种人类可读的数据序列化格式,常用于配置文件和数据交换。 cron表达式是一种用于指定任务在某个时间点或周期性执行的字符串表达式。它包含6个或7个域,每个域代表不同的含义,从左到右依次为"秒 分 时 日 月 星期几 年",其中年不是必须的。cron表达式的配置简洁方便,因此在定时调度任务中被广泛使用。例如,将cron表达式中的“分”和“时”分别设置为“0”和“5”,其他设置为空,代表每天的0时5分启动定时器。
在步骤S2中,从查询语句配置文件中获取与所述定时器对应的指标数据查询语句。
在本发明的一种示例性实施例中,指标数据查询语句为普罗米修斯查询语句(PromQL,Prometheus Query Language)。PromQL是用于查询和分析普罗米修斯Prometheus时间序列数据的查询语言。它是 Prometheus 监控系统的核心组件之一,能够提供丰富的功能和灵活的语法,用于过滤、聚合和计算监控指标数据。
在本发明的一种示例性实施例中,查询语句配置文件中配置有与所有定时器中每个定时器分别对应的指标数据查询语句,该指标数据查询语句中包含有与其对应的定时器的名称。在通过定时器的名称获取定时器的执行时间cron表达式,从该执行时间cron表达式获取该定时器的启动时间后,根据该定时器的名称确定与该定时器对应的指标数据查询语句。在本发明的一种示例性实施例中,指标数据查询语句的结构如下:
promql:
- name:
remark: ""
scheduler_name: "OneDayCollectorJob"
source_product: ""
target_metric_name: "inspector_slow_requests"
target_metric_scope: "application"
target_metric_kind: "business"
query: ''
其中, promql为根名称;name为指标名字信息;remark为备注,用于说明指标含义或者刮取逻辑;scheduler_name为与该指标数据查询语句对应的定时器的名称,例如1天1次的OneDayCollectorJob;source_product标识来源产品名称,说明此指标是来源哪个接口; target_metric_name表示根据指标名字信息和指标的value值生成的新的指标名称,用于在将指标数据上传服务器后,服务器根据该新的指标名称进行数据统计和分析,例如该新的指标名称可以为巡查缓慢请求inspector_slow_requests;target_metric_scope为指标大类,例如应用application;target_metric_kind表示指标小类,例如商业business;query表示去Prometheus查询的语句。
在步骤S3中,在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据。
在本发明的一种示例性实施例中,在到达该启动时间时,启动该定时器采用多个线程执行该指标数据查询语句,从Prometheus服务中获取与该指标查询语句对应的指标数据。例如,使用该指标数据查询语句中source_product标识的接口获取指标数据。具体的,通过该接口从与该指标数据查询语句中target_metric_scope对应的平台中获取小类别与target_metric_kind对应,且名称信息与指标数据查询语句中name一致的指标数据。例如,当target_metric_scope的取值为应用application,target_metric_kind的取值为商业business,则从应用平台获取business类型的指标数据。
基于上述内容,在本发明的一种示例性实施例中,如图2所示,上述采用多个线程执行所述指标数据查询语句包括:
S31、获取所述指标数据查询语句的数量;
S32、基于所述数量生成N个查询线程,N为大于1或者等于1的整数;
S33、建立各所述指标数据查询语句与各所述查询线程的对应关系;
S34、各所述查询线程分别按照所述对应关系执行与其对应的所述指标数据查询语句,以获取所述指标数据。
在本发明的一种示例性实施例中,主进程可以在获取指标数据查询语句的数量,后基于指标数据查询语句的数量建立对应的N个查询线程。查询线程的数量N可以为指标数据查询语句数量的1/3、1/4或者其他比例的取整结果。例如,当获取所述指标数据查询语句的数量为12时,可以建立4个查询线程。然后建立各指标数据查询语句与各所述查询线程的对应关系。例如,可以将第1-3个指标数据查询语句与第1个查询线程对应,将第4-6个指标数据查询语句与第2个查询线程对应,将第7-9个指标数据查询语句与第3个查询线程对应,将第10-12个指标数据查询语句与第4个查询线程对应。
进一步地,建立该对应关系后,将各指标数据查询语句分配给对应的查询线程,各查询线程分别按照该对应关系执行与其对应的指标数据查询语句,调用普罗米修斯的查询接口,以获取所述指标数据。通过使用多个线程并发进行数据查询,能够提高数据查询效率。
基于上述内容,在本发明的一种示例性实施例中,所述执行所述指标数据查询语句前,所述方法还包括:
S35、建立M个数据上传线程,M为大于1或者等于1的整数;
所述执行所述指标数据查询语句后,所述方法还包括:
S36、各所述查询线程将所述指标数据加入数据队列;
S37、各所述数据上传线程分别从所述数据队列中获取所述指标数据,并将所述指标数据上传至服务器。
在本发明的一种示例性实施例中,可以从YAML配置文件预先设置上传线程的数量M,在执行所述指标数据查询语句前,从YAML配置文件中上传线程的数量M,然后建立M个数据上传线程。
进一步地,各查询线程分别按照所述对应关系执行与其对应的指标数据查询语句,获取所述指标数据后,将获取的指标数据加入数据队列。然后M个数据上传线程监控该数据队列,在监控到数据队列存在指标数据时,从队列中获取该指标数据,并将该指标数据上传至服务器。通过使用多个线程并发上传数据,能够提高数据处理效率。在本发明的一种示例性实施例中,数据队列可以使用线程安全的并发链接队列Concurrent Linked Queue类实现。
在步骤S4中,将所述指标数据转换为目标格式的指标数据。
基于上述内容,在本发明的一种示例性实施例中,如图3所示,上述将所述指标数据转换为目标格式的指标数据包括:
S41、生成所述指标数据的标识信息;
在本发明的一种示例性实施例中,各数据上传线程从数据队列中获取指标数据后,可以雪花算法生成该指标数据的唯一标识信息(Identity,ID)。
S42、获取所述指标数据的各字段与所述字段对应的字段值。
在本发明的一种示例性实施例中,指标数据的字段包括上述的指标名称、大类别、小类别等信息,还包括获取的指标数据中指标的时间信息,例如指标数据对应的年和月。字段对应的字段值即为该字段的值。
S43、基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据。
在本发明的一种示例性实施例中,数据上传线程将所述字段和所述字段值按照预设顺序进行排列,得到排列结果;将所述排列结果进行字符串拼接,得到拼接结果;生成所述拼接结果的标识码;基于所述标识信息、所述标识码、所述字段以及所述字段值生成所述目标结构的指标数据。进一步地,数据上传线程生成目标结构的指标数据后,将该目标结构的指标数据上传至服务器。
具体来说,可以获取各字段的首字母,然后将各字段和其对应的字段值按照字段首字母的字母增序进行排列,得到排列结果。然后将排列结果拼接成一个字符串,并采用消息摘要算法第五版(Message Digest Algorithm ,MD5)生成该字符串的MD5码。MD5为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。MD5算法具有抗修改性的优点,使得对指标数据进行任何微小的改动,所得到的MD5码都有很大区别。MD5算法还具有强抗碰撞的优点,即已知原数据和其MD5值,很难伪造具有相同MD5值的其他数据,能够避免数据伪造。
进一步地,基于该指标数据的唯一ID、该MD5码、该指标数据的各个字段以及与各个字段分别对应的字段值生成目标结构例如JSON结构的指标数据。JSON(JavaScriptObject Notation) 是一种轻量级的数据交换格式,能够方便人们进行阅读和编写,同时也方便了机器进行解析和生成。JSON采用完全独立于程序语言的文本格式,但是也使用了类C语言的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。在本发明的一种示例性实施例中,JSON结构的指标数据的结构如下所示:
{"data":[{"insp_day":"202308xx","insp_name":"inspector_node_load5_max","insp_value":3.57,"insp_businessid":"bS9DPbWpyN/lCneSn3gHGQ==","insp_id":87132870136696847,"insp_kind":"node","insp_month":"202308","job":"node","insp_product":"xxx"}。
其中,"insp_day"、"insp_month"表示指标数据的时间字段,"insp_name"表示指标数据的名字字段,"insp_value"表示指标数据的value值字段,insp_businessid表示MD5码,insp_id表示雪花算法生成的唯一ID,insp_kind表示指标数据的类型字段,insp_product表示指标数据的产品来源字段,job表示指标数据的工作类型字段。
基于上述内容,在本发明的一种示例性实施例中,上述将所述指标数据转换为目标格式的指标数据后,所述方法还包括:
S51、生成与所述定时器对应的目标文件;
S52、将所述目标格式的指标数据存储至所述目标文件。
在本发明的一种示例性实施例中,为了避免没有网络连接时,指标数据无法上传服务器的问题,生成JSON结构的指标数据后,可以生成与该定时器对应的目标文件,再将该JSON结构的指标数据存储至该目标文件,以在存在网络连接时,将目标文件中的JSON结构的指标数据上传至服务器。
基于上述内容,在本发明的一种示例性实施例中,上述将所述目标格式的指标数据存储至所述目标文件后,所述方法还包括:
S53、循环执行预设步骤,直至所述目标文件中的所有指标数据均已上传,所述预设步骤包括:
S54、从所述目标文件中获取预设数量的所述目标格式的指标数据;
S55、将所述预设数量的所述目标格式的指标数据通过目标接口上传至服务器。
在本发明的一种示例性实施例中,上述YAML配置文件设置有该预设数量。从YAML配置文件获取该预设数量后,在存在网络连接时,通过调用服务器提供的预设接口例如表征性状态转移(Representational State Transfer)restful接口,循环执行获取预设数量的JSON结构的指标数据,并将该预设数量的JSON结构的指标数据通过restful接口上传至服务器的步骤,直至目标文件中的所有指标数据均已上传。
例如,可以每次获取 10到50条的JSON格式的指标数据,并将该10到50条的JSON格式的指标数据通过restful接口上传至服务器。
通过将包含唯一标识符以及MD5码的JSON结构的指标数据分批次上传服务器,可以实现把多个数据文件批量幂等上传到服务器中,防止数据库中出现重复数据。另外,由于JSON结构的指标数据包含唯一标识符以及MD5码,遇到结构一致的指标数据时,云服务器通过唯一标识符以及MD5码迅速识别该指标数据为新增指标数据还是更新后的指标数据,从而使得服务器能够快速的对数据库进行新增或者更新操作。幂等是一个数学与计算机学概念,常见于抽象代数中。在编程中一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同。幂等函数,或幂等方法,是指可以使用相同参数重复执行,并能获得相同结果的函数。
综上所述,本发明提供的数据处理方法,一方面,在需要新增查询的指标数据时,只需在查询语句配置文件中配置该指标数据的查询语句即可,不需要修改代码,更不需要对代码重新进行编译,从而减少了研发人员的工作量;另一方面,通过多个并发线程分别进行数据查询和数据上传,大大提高了数据处理效率;第三方面,通过生成包括唯一标识符和标识码的目标结构的指标数据,能够以实现把多个数据文件批量幂等上传到服务器中,防止数据库中出现重复数据。
在介绍了本发明示例性实施方式的数据处理方法之后,接下来,参考图4对本发明示例性实施方式的数据处理装置进行描述。
参考图4所示,本发明示例性实施方式的数据处理装置40可以包括:启动时间获取模块401、查询语句获取模块402、指标数据获取模块403以及指标数据转换模块404;其中,
启动时间获取模块401,用于获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
查询语句获取模块402,用于从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
指标数据获取模块403,用于在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
指标数据转换模块404,用于将所述指标数据转换为目标格式的指标数据。
在本发明的一种示例性实施例中,所述指标数据获取模块包括:
数量获取单元,用于获取所述指标数据查询语句的数量;
查询线程生成单元,用于基于所述数量生成N个查询线程,N为大于1或者等于1的整数;
对应关系建立单元,用于建立各所述指标数据查询语句与各所述查询线程的对应关系;
指标数据获取单元,用于各所述查询线程分别按照所述对应关系执行与其对应的所述指标数据查询语句,以获取所述指标数据。
在本发明的一种示例性实施例中,所述装置还包括:
上传线程建立单元,用于建立M个数据上传线程,M为大于1或者等于1的整数;
所述装置还包括:
数据上传模块,用于:各所述查询线程将所述指标数据加入数据队列;
各所述数据上传线程分别从所述数据队列中获取所述指标数据,并将所述指标数据上传至服务器。
在本发明的一种示例性实施例中,所述指标数据转换模块包括:
标识信息生成单元,用于生成所述指标数据的标识信息;
字段值获取单元,用于获取所述指标数据的各字段与所述字段对应的字段值;
指标数据生成单元,用于基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据。
在本发明的一种示例性实施例中,所述指标数据生成单元包括:
排列结果生成单元,用于将所述字段和所述字段值按照预设顺序进行排列,得到排列结果;
拼接结果生成单元,用于将所述排列结果进行字符串拼接,得到拼接结果;
标识码生成单元,用于生成所述拼接结果的标识码;
指标数据生成子单元,用于基于所述标识信息、所述标识码、所述字段以及所述字段值生成所述目标结构的指标数据。
在本发明的一种示例性实施例中,所述启动时间获取模块包括:
表达式获取单元,用于获取所述定时器的表达式;
启动时间获取单元,用于从所述表达式中获取所述定时器的启动时间。
在本发明的一种示例性实施例中,所述装置还包括:
指标数据存储模块,包括:
目标文件生成单元,用于生成与所述定时器对应的目标文件;
指标数据存储单元,用于将所述目标格式的指标数据存储至所述目标文件。
在本发明的一种示例性实施例中,所述装置还包括:
预设步骤执行模块,用于循环执行预设步骤,直至所述目标文件中的所有指标数据均已上传,所述预设步骤包括:
从所述目标文件中获取预设数量的所述目标格式的指标数据;
将所述预设数量的所述目标格式的指标数据通过目标接口上传至服务器。
由于本发明实施方式的数据处理装置的各个功能模块与上述数据处理方法发明实施方式中相同,因此在此不再赘述。
在介绍了本发明示例性实施方式的数据处理方法、数据处理装置之后,接下来,参考图5对本发明示例性实施方式的存储介质进行说明。参考图5所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如"C"语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在介绍了本发明示例性实施方式的存储介质之后,接下来,参考图6对本发明示例性实施方式的电子设备进行说明。
图6显示的电子设备60仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备60以通用计算设备的形式表现。电子设备60的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640。其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述"示例性方法"部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示的步骤S1至步骤S4。
存储单元620可以包括易失性存储单元,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以包括数据总线、地址总线和控制总线。
电子设备60也可以与一个或多个外部设备70(例如键盘、指向设备、蓝牙设备等)通信,这种通信可以通过输入/输出(I/O)接口650进行。电子设备60还包括显示单元640,其连接到输入/输出(I/O)接口650,用于进行显示。并且,电子设备60还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器660通过总线630与电子设备60的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备60使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。应当注意,尽管在上文详细描述中提及了数据处理装置的若干模块或子模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (11)
1.一种数据处理方法,其特征在于,包括:
获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
将所述指标数据转换为目标格式的指标数据。
2.根据权利要求1所述的方法,其特征在于,所述采用多个线程执行所述指标数据查询语句包括:
获取所述指标数据查询语句的数量;
基于所述数量生成N个查询线程,N为大于1或者等于1的整数;
建立各所述指标数据查询语句与各所述查询线程的对应关系;
各所述查询线程分别按照所述对应关系执行与其对应的所述指标数据查询语句,以获取所述指标数据。
3.根据权利要求2所述的方法,其特征在于,所述执行所述指标数据查询语句前,所述方法还包括:
建立M个数据上传线程,M为大于1或者等于1的整数;
所述执行所述指标数据查询语句后,所述方法还包括:
各所述查询线程将所述指标数据加入数据队列;
各所述数据上传线程分别从所述数据队列中获取所述指标数据,并将所述指标数据上传至服务器。
4.根据权利要求1所述的方法,其特征在于,所述将所述指标数据转换为目标格式的指标数据包括:
生成所述指标数据的标识信息;
获取所述指标数据的各字段与所述字段对应的字段值;
基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据。
5.根据权利要求4所述的方法,其特征在于,所述基于所述标识信息、各所述字段和分别与各所述字段对应的字段值生成目标结构的指标数据包括:
将所述字段和所述字段值按照预设顺序进行排列,得到排列结果;
将所述排列结果进行字符串拼接,得到拼接结果;
生成所述拼接结果的标识码;
基于所述标识信息、所述标识码、所述字段以及所述字段值生成所述目标结构的指标数据。
6.根据权利要求1所述的方法,其特征在于,所述获取所述定时器的启动时间包括:
获取所述定时器的表达式;
从所述表达式中获取所述定时器的启动时间。
7.根据权利要求1所述的方法,其特征在于,所述将所述指标数据转换为目标格式的指标数据后,所述方法还包括:
生成与所述定时器对应的目标文件;
将所述目标格式的指标数据存储至所述目标文件。
8.根据权利要求7所述的方法,其特征在于,所述将所述目标格式的指标数据存储至所述目标文件后,所述方法还包括:
循环执行预设步骤,直至所述目标文件中的所有指标数据均已上传,所述预设步骤包括:
从所述目标文件中获取预设数量的所述目标格式的指标数据;
将所述预设数量的所述目标格式的指标数据通过目标接口上传至服务器。
9.一种数据处理装置,其特征在于,包括:
启动时间获取模块,用于获取定时器的启动时间,所述启动时间用于指示所述定时器定时启动;
查询语句获取模块,用于从查询语句配置文件中获取与所述定时器对应的指标数据查询语句;
指标数据获取模块,用于在到达所述启动时间时,启动所述定时器采用多个线程执行所述指标数据查询语句,以获取指标数据;
指标数据转换模块,用于将所述指标数据转换为目标格式的指标数据。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至8中任一项所述的数据处理方法。
11.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至8中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311325542.1A CN117056175B (zh) | 2023-10-13 | 2023-10-13 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311325542.1A CN117056175B (zh) | 2023-10-13 | 2023-10-13 | 数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117056175A true CN117056175A (zh) | 2023-11-14 |
CN117056175B CN117056175B (zh) | 2024-02-23 |
Family
ID=88655814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311325542.1A Active CN117056175B (zh) | 2023-10-13 | 2023-10-13 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056175B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120278351A1 (en) * | 2011-04-26 | 2012-11-01 | Microsoft Corporation | Presenting results with visual cues |
CN107748658A (zh) * | 2017-09-30 | 2018-03-02 | 银联商务股份有限公司 | 一种软件开发方法、系统、计算机可读存储介质及电子设备 |
CN108664657A (zh) * | 2018-05-20 | 2018-10-16 | 湖北九州云仓科技发展有限公司 | 一种大数据任务调度方法、电子设备、存储介质及平台 |
CN111309818A (zh) * | 2020-01-16 | 2020-06-19 | 平安医疗健康管理股份有限公司 | 基于定时任务的文档变更方法、装置、计算机设备及计算机存储介质 |
CN113010582A (zh) * | 2019-12-20 | 2021-06-22 | 京东安联财产保险有限公司 | 数据处理方法、装置、计算机可读介质及电子设备 |
CN114238487A (zh) * | 2021-12-27 | 2022-03-25 | 中国建设银行股份有限公司 | 数据库卸数的方法、装置、系统、存储介质及程序产品 |
CN114500645A (zh) * | 2021-12-30 | 2022-05-13 | 兰州乐智教育科技有限责任公司 | 数据采集系统及数据采集方法 |
CN116070586A (zh) * | 2021-10-25 | 2023-05-05 | 中移(苏州)软件技术有限公司 | 预览文件生成方法、文件预览方法、装置及计算设备 |
CN116414819A (zh) * | 2021-12-29 | 2023-07-11 | 美的集团股份有限公司 | 云平台系统的数据交互方法、装置和电子设备 |
-
2023
- 2023-10-13 CN CN202311325542.1A patent/CN117056175B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120278351A1 (en) * | 2011-04-26 | 2012-11-01 | Microsoft Corporation | Presenting results with visual cues |
CN107748658A (zh) * | 2017-09-30 | 2018-03-02 | 银联商务股份有限公司 | 一种软件开发方法、系统、计算机可读存储介质及电子设备 |
CN108664657A (zh) * | 2018-05-20 | 2018-10-16 | 湖北九州云仓科技发展有限公司 | 一种大数据任务调度方法、电子设备、存储介质及平台 |
CN113010582A (zh) * | 2019-12-20 | 2021-06-22 | 京东安联财产保险有限公司 | 数据处理方法、装置、计算机可读介质及电子设备 |
CN111309818A (zh) * | 2020-01-16 | 2020-06-19 | 平安医疗健康管理股份有限公司 | 基于定时任务的文档变更方法、装置、计算机设备及计算机存储介质 |
CN116070586A (zh) * | 2021-10-25 | 2023-05-05 | 中移(苏州)软件技术有限公司 | 预览文件生成方法、文件预览方法、装置及计算设备 |
CN114238487A (zh) * | 2021-12-27 | 2022-03-25 | 中国建设银行股份有限公司 | 数据库卸数的方法、装置、系统、存储介质及程序产品 |
CN116414819A (zh) * | 2021-12-29 | 2023-07-11 | 美的集团股份有限公司 | 云平台系统的数据交互方法、装置和电子设备 |
CN114500645A (zh) * | 2021-12-30 | 2022-05-13 | 兰州乐智教育科技有限责任公司 | 数据采集系统及数据采集方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117056175B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180365005A1 (en) | Distributed parallel build system | |
US9336288B2 (en) | Workflow controller compatibility | |
US20170351989A1 (en) | Providing supply chain information extracted from an order management system | |
US10116534B2 (en) | Systems and methods for WebSphere MQ performance metrics analysis | |
CN107885609B (zh) | 业务冲突处理方法及装置、存储介质和电子设备 | |
CN114417408B (zh) | 数据处理方法、装置、设备以及存储介质 | |
CN109522341A (zh) | 实现基于sql的流式数据处理引擎的方法、装置、设备 | |
CN108768790A (zh) | 分布式搜索集群监控方法及装置、计算设备、存储介质 | |
US11200373B2 (en) | Automatic translation of spreadsheets into scripts | |
US20120023071A1 (en) | Converting two-tier resource mapping to one-tier resource mapping | |
CN111782452A (zh) | 接口对比测试的方法、系统、设备和介质 | |
CN113760677A (zh) | 异常链路分析方法、装置、设备及存储介质 | |
WO2023000785A1 (zh) | 用于处理数据的方法、装置、系统、服务器和介质 | |
CN110188308B (zh) | 客户端自动打点上报方法、存储介质、设备及系统 | |
CN109473178B (zh) | 医疗数据整合的方法、系统、设备及存储介质 | |
CN113962597A (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
CN113065139A (zh) | 告警接入方法及系统、电子设备及介质 | |
CN117056175B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
Kadochnikov et al. | Service monitoring system for JINR Tier-1 | |
CN114970476A (zh) | 数据处理方法、系统、电子设备及存储介质 | |
CN111046020B (zh) | 信息处理方法与装置、存储介质、电子设备 | |
CN114047999A (zh) | 页面配置的方法、系统、电子设备和存储介质 | |
CN116340363B (zh) | 一种基于关系型数据库的数据存储、加载方法及相关装置 | |
CN113485693B (zh) | 接口配置方法、装置、设备及存储介质 | |
CN117632386A (zh) | 任务调度方法及装置、计算机可读存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |