CN115982240A - 时序数据的处理方法、电子设备和存储介质 - Google Patents
时序数据的处理方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115982240A CN115982240A CN202211728212.2A CN202211728212A CN115982240A CN 115982240 A CN115982240 A CN 115982240A CN 202211728212 A CN202211728212 A CN 202211728212A CN 115982240 A CN115982240 A CN 115982240A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- time sequence
- sequence data
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请提供时序数据的处理方法、电子设备和存储介质。设有用于处理不同时间粒度的时序数据的多个进程,该方法包括:从数据源获取待处理时序数据,其中,所述数据源的时序数据为目标时间粒度的时序数据;通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理。从而通过该目标进程对待处理时序数据所进行的聚合处理,来降低该待处理时序数据存储时所占用的存储资源。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及时序数据的处理方法、电子设备和存储介质。
背景技术
时间序列是一种高维数据,是由客观对象的某个物理量在不同时间点的采样值,按照时间先后次序排列而组成的序列。时间数据在业务处理过程中具有重要价值,比如可以基于时序数据对业务的各个维度进行监控。然而,时序数据的存储通常需要占用大量的存储资源。
发明内容
本申请实施例的目的在于提供时序数据的处理方法、电子设备和存储介质,用于解决现有技术中的技术问题。
本申请实施例第一方面提供了一种时序数据的处理方法,设有用于处理不同时间粒度的时序数据的多个进程,所述方法包括:
从数据源获取待处理时序数据,其中,所述数据源的时序数据为目标时间粒度的时序数据;
通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理。
于一实施例中,所述方法还包括:
利用配置文件,预先将所述数据源与所述目标进程进行关联,以用于通过所述目标进程对所述数据源的时序数据进行聚合处理。
于一实施例中,所述数据源具体包括生成原始时序数据的原始数据源;所述方法还包括:通过所述目标进程,预先启动与所述原始数据源对应的协程;以及,
通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理,具体包括:
利用所述目标进程所预先启动的,与所述原始数据源所对应的协程,对所述待处理时序数据进行聚合处理。
于一实施例中,对所述待处理时序数据进行聚合处理,具体包括:
根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,其中,所述目标时序数据的时间戳所表征的时间段,包含所述待处理时序数据的时间戳所表征的数据生成时刻。
于一实施例中,所述待处理时序数据还携带有设备标识、传输速率和传输流量;以及,根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,具体包括:
根据所述待处理时序数据所携带的时间戳和设备标识,确定出包含所述时间戳所表征的数据生成时刻,并具有所述设备标识的时序数据,作为所述目标时序数据;
计算所述待处理时序数据的传输速率,与所述目标时序数据的传输速率的加权平均传输速率,作为聚合后的时序数据的传输速率;
计算所述待处理时序数据的传输流量,与所述目标时序数据的传输流量之和,作为聚合后的时序数据的传输流量。
于一实施例中,所述方法还包括:将聚合后的时序数据存储至短时间窗口监控数据统计表。
于一实施例中,所述数据源具体包括短时间窗口监控数据统计表;以及,
从数据源获取待处理时序数据,具体包括:
根据所设置的定时任务,从所述短时间窗口监控数据统计表获取所述待处理时序数据。
于一实施例中,所述方法还包括:将聚合后的时序数据,存储至长时间窗口监控数据统计表,其中,所述长时间窗口监控数据统计表所存储的时序数据的时间粒度,大于所述短时间窗口监控数据统计表所存储的时序数据的时间粒度;以及,
定期清理所述长时间窗口监控数据统计表中,过期的时序数据。
本申请实施例第二方面提供了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述第一方面任一项所述的方法。
本申请实施例第三方面提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述第一方面任一项所述的方法。
采用本申请实施例所提供的时序数据的处理方法,服务器设有用于处理不同时间粒度的时序数据的多个进程,这样先从数据源获取待处理时序数据,该数据源的时序数据为目标时间粒度的时序数据,然后能够通过用于处理该目标时间粒度的时序数据的目标进程,对待处理时序数据进行聚合处理,从而通过该目标进程对待处理时序数据所进行的聚合处理,来降低该待处理时序数据存储时所占用的存储资源。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的电子设备的具体结构示意图;
图2为本申请一实施例提供的,时序数据的处理方法的具体流程示意图;
图3为本申请一实施例提供的,时序数据的处理装置的具体结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性或先后顺序。
如前所述,时序数据的存储通常需要占用大量的存储资源,比如时序数据通常会包括各个时间粒度下的数据细节,对这些数据进行存储会占用大量的存储资源。
有鉴于此,本申请实施例提供了一种时序数据的处理方法、装置、电子设备和存储介质,能够用于对时序数据进行聚合处理,从而在对时序数据存储时,降低存储资源的占用。如图1所示为本申请实施例所提供的电子设备1的具体结构示意图,该电子设备1包括:至少一个处理器11和存储器12,图1中以一个处理器为例。处理器11和存储器12可以通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。
在实际应用中,该电子设备1可以是笔记本电脑、台式电脑、其组成的服务器或服务器集群等。
为了便于理解,这里可以对本申请实施例所提供的时序数据的处理方法的发明构思进行简单说明,本申请实施例所提供的方法,根据时间粒度对时序数据进行划分,进而通过不同的进程对不同时间粒度的时间数据进行聚合处理,从而通过该聚合处理来降低时序数据的数据细节,降低时序数据所占用的存储资源。如图2所示为本申请实施例所提供的,时序数据的处理方法的具体流程示意图,该方法可以由图1所示的电子设备1作为服务器来执行,具体来说,该服务器设有多个进程,这些进程用于处理不同时间粒度的时序数据。该方法包括如下步骤:
步骤S21:从数据源获取待处理时序数据,该数据源的时序数据为目标时间粒度的时序数据。
需要说明的是,该数据源可以生成时序数据,或存储有时序数据,因此在该步骤S21中,可以从该数据源获取到时序数据,作为该待处理时序数据。
另外,对于该数据源所生成或所存储的时序数据(即该数据源的时序数据),该时序数据为目标时间粒度的时序数据,其中,该目标时间粒度可以为3秒、5秒、10秒、15秒、1分钟、2分钟、5分钟、15分钟、1小时、2小时、24小时等。并且在实际应用中,通常可以将小于或等于5分钟的时间粒度称之为短时间粒度,大于5分钟的时间粒度称之为长时间粒度。
比如,在实际应用中,该数据源可以为生成原始时序数据的原始数据源,比如该原始数据源可以为业务处理系统,该业务处理系统在业务处理过程中会产生原始时序数据,这些原始时序数据通常具有相对较小的时间粒度,该原始时序数据的目标时间粒度通常为3秒、5秒、10秒等,对这些原始时序数据进行存储时,会占用大量存储资源。因此,可以将该原始数据源作为步骤S21中的数据源,并而从该数据源中获取到时序数据作为该待处理时序数据,进而通过本申请实施例所提供的方法进行聚合处理。
当然,该数据源还可以是存储有时序数据的流式数据库或其他类型的数据库,流式数据库或其他类型的数据库中所存储的时序数据,对于该时序数据的时间粒度通常为1分钟、2分钟、5分钟等,因此往往大于原始时序数据的时间粒度,但仍然可以将该流式数据库或其他类型的数据库作为数据源,并从该数据源中获取时序数据作为待处理时序数据,进而通过本申请实施例所提供的方法进行聚合处理。
步骤S22:通过用于处理该目标时间粒度的时序数据的目标进程,对该待处理时序数据进行聚合处理。
上述提到在服务器上设有多个进程,这些进程用于处理不同时间粒度的时序数据。因此在该步骤S22中,可以通过该目标进程对该待处理时序数据进行聚合处理,其中,该目标进程用于处理该目标时间粒度的时序数据。
比如,在实际应用中,为了能够通过该目标进程对该待处理时序数据进行聚合处理,通常可以利用配置文件,预先将该数据源与该目标进程进行关联,从而能够通过该目标进程对该数据源的时序数据进行聚合处理。这样在通过上述步骤S21从该数据源获取到该待处理时序数据之后,能够利用该关联关系来确定出该目标进程,进而通过该目标进程对该待处理时序数据进行聚合处理。
采用本申请实施例所提供的时序数据的处理方法,服务器设有用于处理不同时间粒度的时序数据的多个进程,这样先从数据源获取待处理时序数据,该数据源的时序数据为目标时间粒度的时序数据,然后能够通过用于处理该目标时间粒度的时序数据的目标进程,对待处理时序数据进行聚合处理,从而通过该目标进程对待处理时序数据所进行的聚合处理,来降低该待处理时序数据存储时所占用的存储资源。
当然,在对该待处理时序数据进行聚合处理之后,由于数据量相对与处理之前较小,因此还能够提高数据查询效率。比如,将时序数据库中的时序数据,分别作为待处理时序数据,进而利用本申请实施例所提供的方法进行聚合之后,能够降低该时序数据库中的数据量,因此提高该时序数据库中时序数据的查询效率。
上述提到,步骤S21中的数据源可以为原始数据源,该原始数据源可以为业务处理系统。在实际应用中,通常可以有多个不同的业务处理系统,这些业务处理系统可以处理不同的业务,也可以处理相同的业务或相同业务的不同业务维度等,进而分别生成原始时序数据,并且这些不同的业务处理系统所生成的原始时序数据的时间粒度也可以相同或不同,比如可以均为上述的目标时间粒度。
因此,在实际应用中,为了便于对这些业务处理系统所生成的原始时序数据进行聚合处理,该方法还可以通过上述的目标进程,预先启动与各个业务处理系统分别对应的协程,这样在上述步骤S21中,可以通过对应的协程从该数据源(即业务处理系统)获取待处理时序数据,该数据源的时序数据为目标时间粒度的时序数据,然后在上述的步骤S22中,可以利用该目标进程所预先启动的,与该原始数据源所对应的协程,对该待处理时序数据进行聚合处理。
比如,在实际应用中设置有三个业务处理系统,分别为业务处理系统1、业务处理系统2和业务处理系统3,因此可以通过目标进程预先启动三个协程,分别为协程1、协程2和协程3,这三个协程分别对应业务处理系统1、业务处理系统2和业务处理系统3。这样,对于上述的步骤S21和步骤S22,在步骤S21的数据源为业务处理系统1的情况下,可以通过协程1来执行步骤S21和步骤S22,从而将业务处理系统1所生成的时序数据作为待处理时序数据,对该待处理时序数据进行聚合处理;在步骤S21的数据源为业务处理系统2的情况下,将业务处理系统2所生成的时序数据作为待处理时序数据,通过协程2来执行步骤S21和步骤S22,从而对该待处理时序数据进行聚合处理;在步骤S21的数据源为业务处理系统3的情况下,将业务处理系统3所生成的时序数据作为待处理时序数据,通过协程3来执行步骤S21和步骤S22,从而对该待处理时序数据进行聚合处理。
需要进一步说明的是,在业务处理系统的数量较多的情况下,分别针对这些业务处理系统预先启动对应的协程之后,这些协程同时调用运算资源来执行上述的步骤S21和步骤S22,会占用大量的运算资源,进而可能会影响服务器的运行。因此,通常还可以预先构建消息队列,这样当业务处理系统生成时序数据之后,可以将该时序数据按照生成时刻的先后顺序添加到该消息队列,进而使所对应的协程能够从该消息队列中依次获取该时序数据,作为待处理时序数据,从而执行本申请实施例所提供的方法,通过该方式能够对这些协程执行上述步骤S21和步骤S22进行调控,从而降低对运算资源的占用。其中,该消息队列可以为Kafka消息队列,也可以为其他的消息队列。
在实际应用中,对于时序数据而言,通常会携带时间戳,该时间戳表征该时序数据的数据生成时刻,或所属的时间段,比如对于原始数据源所生成的原始时序数据,该原始时序数据所携带的时间戳表征的是该原始时序数据的数据生成时刻,而对于其他的时序数据而言,该时序数据表征的是所属的时间段。
因此,在步骤S21中的数据源具体为生成原始时序数据的原始数据源的情况下,该待处理时序数据所携带的时间戳表征的是数据生成时刻,此时对该待处理时序数据进行聚合处理可以具体为,先获取该待处理时序数据所携带的时间戳,然后根据该待处理时序数据所携带的时间戳,将该待处理时序数据与目标时序数据进行聚合,该目标时序数据的时间戳所表征的时间段,包含该待处理时序数据的时间戳所表征的数据生成时刻。其中,该目标时序数据可以是从短时间窗口监控数据统计表中获取的时序数据,也可以是从缓存中获取的时序数据。比如,可以先将待处理时序数据和短时间窗口监控数据统计表中的目标时序数据读取至内存中,然后在内存中将该待处理时序数据与该目标时序数据进行聚合,当然也可以从缓存中将该目标时序数据读取至内存中,然后在内存中将该待处理时序数据与该目标时序数据进行聚合。
该短时间窗口监控数据统计表中所存储的时序数据为短时间粒度的时序数据,比如可以构建多个短时间窗口监控数据统计表,分别用于存储1分钟、2分钟、5分钟的短时间粒度的时序数据。
比如,该待处理时序数的时间戳为10:01:03(即10点01分03秒),该时间戳表征该待处理时序数的数据生成时刻为10点01分03秒,可以将该待处理时序数据与短时间窗口监控数据统计表中的目标时序数据进行聚合,比如,该短时间窗口监控数据统计表用于存储5分钟短时间粒度的时序数据,此时该目标时序数据的时间戳为10:00:00,该时间戳所表征的时间段为10:00:00~10:05:00,该时间段包含10点01分03秒,因此可以将待处理时序数与该目标时序数据进行聚合。
需要说明的是,对于该待处理时序数据而言,通常还携带有设备标识、传输速率和传输流量,其中,该设备标识具体是生成该待处理时序数据的原始数据源的设备标识,该传输速率反映的是该原始数据源在该数据生成时刻的数据传输速率,该传输流量反映的是该原始数据源在该数据生成时刻的传输流量。此时,根据待处理时序数据所携带的时间戳,将待处理时序数据与短时间窗口监控数据统计表中的目标时序数据进行聚合可以具体是,根据该待处理时序数据所携带的时间戳和设备标识,从该短时间窗口监控数据统计表中确定出包含该时间戳所表征的数据生成时刻,并具有该设备标识的时序数据,作为该目标时序数据,然后计算该待处理时序数据的传输速率,与该目标时序数据的传输速率的加权平均传输速率,作为聚合后的时序数据的传输速率,在计算该加权平均传输速率时,对于该待处理时序数据的传输速率和目标时序数据的传输速率各自的权重,可以根据该目标时间粒度与短时间窗口监控数据统计表所存储的时序数据的时间粒度之比来确定,比如,该目标时间粒度为3秒,该短时间窗口监控数据统计表所存储的时序数据的时间粒度为1分钟,则待处理时序数据的传输速率和目标时序数据的传输速率的权重之比为1:20(即3秒:1分钟);并且计算待处理时序数据的传输流量,与目标时序数据的传输流量之和,作为聚合后的时序数据的传输流量。
也就是说,先根据待处理时序数据所携带的时间戳和设备标识,从短时间窗口监控数据统计表中确定出目标时序数据,然后计算两者传输速率的加权平均传输速率,并计算两者传输流量之和,从而实现该聚合。当然,对于聚合后的时序数据,可以将该聚合后的时序数据存储至该短时间窗口监控数据统计表。
另外,该待处理时序数据还可以包括携带传输时延、抖动率和丢包率,此时将待处理时序数据与短时间窗口监控数据统计表中的目标时序数据进行聚合可以具体是,计算该待处理时序数据的传输时延,与该目标时序数据的传输时延的加权平均传输时延,作为聚合后的时序数据的传输时延;计算该待处理时序数据的抖动率,与该目标时序数据的抖动率的加权平均抖动率,作为聚合后的时序数据的抖动率;计算该待处理时序数据的丢包率,与该目标时序数据的丢包率的加权平均丢包率,作为聚合后的时序数据的丢包率。其中,在计算加权平均传输时延、加权平均抖动率和加权平均丢包率时,权重的计算方式可以与上述计算加权平均传输速率相同,这里对此不再说明。
上述提到,对于步骤S21中的数据源为原始数据源的情况下的相关技术细节,在实际应用中,该数据源还可以为短时间窗口监控数据统计表,也就是说,从该短时间窗口监控数据统计表中获取待处理时序数据,然后进行聚合处理,这里也可以对该实施方式进行具体说明。其中,该短时间窗口监控数据统计表可以为所存储的时序数据,可以为1分钟、2分钟、5分钟等短时间粒度的时序数据。
比如,可以构建三个短时间窗口监控数据统计表,分别用于存储1分钟、2分钟、5分钟时间粒度的时序数据,然后针对各个短时间窗口监控数据统计表分别生成相应的定时任务,比如,针对1分钟时间粒度的时序数据的短时间窗口监控数据统计表,生成每10分钟执行一次的定时任务(称之为第一定时任务);针对2分钟时间粒度的时序数据的短时间窗口监控数据统计表,生成每20分钟执行一次的定时任务(称之为第二定时任务);针对5分钟时间粒度的时序数据的短时间窗口监控数据统计表,生成每1小时执行一次的定时任务(称之为第三定时任务),其中对于各个定时任务的执行周期,可以根据实际需要进行配置,比如,第三定时任务的执行周期还可以为每15分钟执行一次等。然后,对于该步骤S21中从数据源获取待处理时序数据的具体方式,可以是根据所设置的定时任务,从该短时间窗口监控数据统计表获取该待处理时序数据。
比如,根据所设置的第一定时任务,从1分钟时间粒度的时序数据的短时间窗口监控数据统计表中,获取该待处理时序数据等;根据所设置的第二定时任务,从2分钟时间粒度的时序数据的短时间窗口监控数据统计表中,获取该待处理时序数据;根据所设置的第三定时任务,从5分钟时间粒度的时序数据的短时间窗口监控数据统计表中,获取该待处理时序数据。
相应的,该待处理时序数据所携带的时间戳表征该待处理时序数据所属的时间段,比如,从1分钟时间粒度的时序数据的短时间窗口监控数据统计表中,所获取的待处理时序数据的时间戳为10:00:00,表征该时序数据的数据所属的时间段为10:00:00~10:01:00,此时的目标时间粒度为1分钟;从2分钟时间粒度的时序数据的短时间窗口监控数据统计表中,所获取的待处理时序数据的时间戳为10:00:00,表征该时序数据的数据所属的时间段为10:00:00~10:02:00,此时的目标时间粒度为2分钟;从5分钟时间粒度的时序数据的短时间窗口监控数据统计表中,所获取的待处理时序数据的时间戳为10:00:00,表征该时序数据的数据所属的时间段为10:00:00~10:05:00,此时的目标时间粒度为5分钟。
当然,对该待处理时序数据进行聚合处理可以具体为,根据该待处理时序数据所携带的时间戳,将该待处理时序数据与长时间窗口监控数据统计表中的第二目标时序数据进行聚合,该第二目标时序数据的时间戳所表征的时间段,包含该待处理时序数据所属的时间段。其中,该长时间窗口监控数据统计表用于存储长时间粒度的时序数据,也就是说,该长时间窗口监控数据统计表所存储的时序数据的时间粒度,大于该短时间窗口监控数据统计表所存储的时序数据的时间粒度。比如,该短时间窗口监控数据统计表所存储的时序数据的时间粒度为5分钟,该长时间窗口监控数据统计表所存储的时序数据的时间粒度为15分钟。
比如,可以先根据该待处理时序数据所携带的时间戳,从长时间窗口监控数据统计表中确定出该第二目标时序数据,然后将该待处理时序数据与该第二目标时序数据进行聚合处理;当然,在该待处理时序数据携带设备标识的情况下,还可以根据该待处理时序数据携带的时间戳和设备标识,从该长时间窗口监控数据统计表中确定出该第二目标时序数据;对于两者聚合处理的具体方式,也可以计算该待处理时序数据的传输速率,与该第二目标时序数据的传输速率的加权平均传输速率,作为聚合后的时序数据的传输速率,并且计算该待处理时序数据的传输流量,与该第二目标时序数据的传输流量之和,作为聚合后的时序数据的传输流量。
在得到聚合后的时序数据之后,还可以将聚合后的时序数据存储至该长时间窗口监控数据统计表。
在实际应用中,通过该方式可以将不断地将短时间窗口监控数据统计表中的时序数据,作为该待处理时序数据,进而通过本申请实施例所提供的方式进行聚合,从而聚合到长时间窗口监控数据统计表,使长时间窗口监控数据统计表的数据量不断增大。因此在实际应用中,还可以定期清理该长时间窗口监控数据统计表中,过期的时序数据,比如,可以针对该长时间窗口监控数据统计表也设置定时任务,通过该定时任务来定期(比如每天1次)清理过期的时序数据。其中,该清理过期的时序数据可以为存储时间超过预设阈值的时序数据,该预设阈值可以为30天、1年、半年等。
上述是对本申请实施例所提供的时序数据的处理方法的具体说明,为了便于理解,这里可以结合具体的示例,对该方法进一步说明。在该示例中,服务器设有两个进程,分别用于处理短时间粒度的时序数据和长时间粒度的时序数据,并且针对各个业务处理系统分别设有对应的协程,这些协程能够通过用于处理短时间粒度的时序数据的进程进行启动。其中,用于处理短时间粒度的时序数据的进程可以称之为数据计算进程,用于处理长时间粒度的时序数据的进程可以称之为数据整合进程,该数据计算进程可以是基于GO编程语言进行开发得到,从而利用该GO编程语言的特点,能够支持多种聚合场景进行多维度的聚合;数据整合进程可以是基于python编程语言进行开发得到。
这样,针对各个业务处理系统(作为数据源),对应的协程可以从该业务处理系统获取原始时序数据,作为待处理时序数据,其中,业务处理系统的原始时序数据的目标时间粒度通常为30秒;然后通过数据计算进程启动对应的协程,对该待处理时序数据进行聚合处理;当然,还可以将整合处理后得到的时序数据存储至短时间窗口监控数据统计表,其中,该短时间窗口监控数据统计表所存储的时序数据的时间粒度可以为5分钟。
对于短时间窗口监控数据统计表,可以设置对应的定时任务,然后根据该定时任务,可以从短时间窗口监控数据统计表(作为数据源)获取待处理时序数据,该待处理时序数据的目标时间粒度比如5分钟,然后利用数据整合进程对该待处理时序数据进行聚合处理,并将整合处理后得到的时序数据存储至长时间窗口监控数据统计表。
另外,该数据计算进程用于处理长时间粒度的时序数据,比如1分钟、2分钟、5分钟的时序数据,能够确保不会长时间占用服务器的CPU和内存资源,并且还能够针对该数据计算进程设置监控进程,以监控数据计算进程的状态,从而在该数据计算进程出现异常的情况下,能够重连接或进行终止,从而提高稳定性。
基于与本申请实施例所提供的,时序数据的处理方法相同的发明构思,本申请实施例还可以提供一种时序数据的处理装置,对于该装置实施例的内容,如有不清楚之处,可以参考方法实施例中的对应内容,其中,该装置可以设置于服务器,该服务器设有用于处理不同时间粒度的时序数据的多个进程。如图3所示为该装置30的具体结构示意图,该装置30包括:
获取单元301,用于从数据源获取待处理时序数据,其中,所述数据源的时序数据为目标时间粒度的时序数据;
聚合单元302,用于通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理。
显然,该装置30也能够解决现有技术的问题,这里对此不再赘述。另外,对于该装置30通过结合实体装置、云技术等所取得的技术效果,也属于本申请的保护范围之内,这里对此不再赘述。
该装置30还可以包括:关联单元,用于利用配置文件,预先将所述数据源与所述目标进程进行关联,以用于通过所述目标进程对所述数据源的时序数据进行聚合处理。
数据源具体包括生成原始时序数据的原始数据源;该装置30还可以包括:协程启动单元,用于通过所述目标进程,预先启动与所述原始数据源对应的协程;以及,该聚合单元302可以包括聚合子单元,用于利用所述目标进程所预先启动的,与所述原始数据源所对应的协程,对所述待处理时序数据进行聚合处理。
其中,对所述待处理时序数据进行聚合处理,可以具体包括:
根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,其中,所述目标时序数据的时间戳所表征的时间段,包含所述待处理时序数据的时间戳所表征的数据生成时刻。
所述待处理时序数据还携带有设备标识、传输速率和传输流量;以及,根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,可以具体包括:
根据所述待处理时序数据所携带的时间戳和设备标识,确定出包含所述时间戳所表征的数据生成时刻,并具有所述设备标识的时序数据,作为所述目标时序数据;
计算所述待处理时序数据的传输速率,与所述目标时序数据的传输速率的加权平均传输速率,作为聚合后的时序数据的传输速率;
计算所述待处理时序数据的传输流量,与所述目标时序数据的传输流量之和,作为聚合后的时序数据的传输流量。
该装置30还可以包括存储单元,用于将聚合后的时序数据存储至短时间窗口监控数据统计表。
数据源具体包括短时间窗口监控数据统计表;以及,
获取单元301可以具体包括获取子单元,用于根据所设置的定时任务,从所述短时间窗口监控数据统计表获取所述待处理时序数据。
该装置30还可以包括存储清理单元,用于将聚合后的时序数据,存储至长时间窗口监控数据统计表,其中,该长时间窗口监控数据统计表所存储的时序数据的时间粒度,大于该短时间窗口监控数据统计表所存储的时序数据的时间粒度;以及,定期清理所述长时间窗口监控数据统计表中,过期的时序数据。
本发明实施例还提供了一种计算机可读存储介质,该存储介质储有计算机程序,该计算机程序可由处理器执行,以完成上述实施例中方法的全部或部分流程。其中,存储介质可为磁盘、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等。存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种时序数据的处理方法,其特征在于,设有用于处理不同时间粒度的时序数据的多个进程,所述方法包括:
从数据源获取待处理时序数据,其中,所述数据源的时序数据为目标时间粒度的时序数据;
通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用配置文件,预先将所述数据源与所述目标进程进行关联,以用于通过所述目标进程对所述数据源的时序数据进行聚合处理。
3.根据权利要求1所述的方法,其特征在于,所述数据源具体包括生成原始时序数据的原始数据源;所述方法还包括:通过所述目标进程,预先启动与所述原始数据源对应的协程;以及,
通过用于处理所述目标时间粒度的时序数据的目标进程,对所述待处理时序数据进行聚合处理,具体包括:
利用所述目标进程所预先启动的,与所述原始数据源所对应的协程,对所述待处理时序数据进行聚合处理。
4.根据权利要求3所述的方法,其特征在于,对所述待处理时序数据进行聚合处理,具体包括:
根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,其中,所述目标时序数据的时间戳所表征的时间段,包含所述待处理时序数据的时间戳所表征的数据生成时刻。
5.根据权利要求4所述的方法,其特征在于,所述待处理时序数据还携带有设备标识、传输速率和传输流量;以及,根据所述待处理时序数据所携带的时间戳,将所述待处理时序数据与目标时序数据进行聚合,具体包括:
根据所述待处理时序数据所携带的时间戳和设备标识,确定出包含所述时间戳所表征的数据生成时刻,并具有所述设备标识的时序数据,作为所述目标时序数据;
计算所述待处理时序数据的传输速率,与所述目标时序数据的传输速率的加权平均传输速率,作为聚合后的时序数据的传输速率;
计算所述待处理时序数据的传输流量,与所述目标时序数据的传输流量之和,作为聚合后的时序数据的传输流量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将聚合后的时序数据存储至短时间窗口监控数据统计表。
7.根据权利要求1所述的方法,其特征在于,所述数据源具体包括短时间窗口监控数据统计表;以及,
从数据源获取待处理时序数据,具体包括:
根据所设置的定时任务,从所述短时间窗口监控数据统计表获取所述待处理时序数据。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:将聚合后的时序数据,存储至长时间窗口监控数据统计表,其中,所述长时间窗口监控数据统计表所存储的时序数据的时间粒度,大于所述短时间窗口监控数据统计表所存储的时序数据的时间粒度;以及,
定期清理所述长时间窗口监控数据统计表中,过期的时序数据。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行如权利要求1-8任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-8任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211728212.2A CN115982240A (zh) | 2022-12-29 | 2022-12-29 | 时序数据的处理方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211728212.2A CN115982240A (zh) | 2022-12-29 | 2022-12-29 | 时序数据的处理方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115982240A true CN115982240A (zh) | 2023-04-18 |
Family
ID=85962320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211728212.2A Pending CN115982240A (zh) | 2022-12-29 | 2022-12-29 | 时序数据的处理方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115982240A (zh) |
-
2022
- 2022-12-29 CN CN202211728212.2A patent/CN115982240A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734271B2 (en) | Data query method, apparatus and device | |
CN110222091B (zh) | 一种海量数据实时统计分析方法 | |
US20170220500A1 (en) | Method, controller, and system for service flow control in object-based storage system | |
CN111352967B (zh) | 滑动窗口算法的频次控制方法、系统、设备及介质 | |
CN111966289B (zh) | 基于Kafka集群的分区优化方法和系统 | |
US9292336B1 (en) | Systems and methods providing optimization data | |
US9893973B2 (en) | Real-time, low memory estimation of unique client computers communicating with a server computer | |
US20160379122A1 (en) | Recommendation algorithm optimization method, device and system | |
WO2016172848A1 (zh) | 一种调整云计算中虚拟资源的方法及装置 | |
CN107346270B (zh) | 基于实时计算的基数估计的方法和系统 | |
CN112751726A (zh) | 一种数据处理方法、装置、电子设备和存储介质 | |
CN112506619A (zh) | 作业处理方法、装置、电子设备、存储介质和程序产品 | |
CN114490078A (zh) | 一种微服务的动态缩扩容方法、装置及设备 | |
US20160094392A1 (en) | Evaluating Configuration Changes Based on Aggregate Activity Level | |
US9600251B1 (en) | Enhancing API service schemes | |
CN117081996B (zh) | 基于服务端实时反馈和软阈值的流量控制方法及相关设备 | |
CN110061933B (zh) | 一种数据处理方法及装置、设备、存储介质 | |
WO2023051035A1 (zh) | 机器人的数据传输方法及装置、电子设备、存储介质 | |
CN115982240A (zh) | 时序数据的处理方法、电子设备和存储介质 | |
CN112131198B (zh) | 一种日志分析方法、装置及电子设备 | |
CN115499513A (zh) | 数据请求的处理方法、装置、计算机设备和存储介质 | |
CN113835905A (zh) | 一种消息队列负载均衡方法、装置、电子设备及介质 | |
CN110874268B (zh) | 数据处理方法、装置和设备 | |
CN115544031A (zh) | 一种数据存储系统、方法及电子设备和存储介质 | |
CN112800089A (zh) | 一种中间数据存储级别调整方法、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |