CN115455060A - 一种数据处理方法、装置、设备及介质 - Google Patents
一种数据处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115455060A CN115455060A CN202211302898.9A CN202211302898A CN115455060A CN 115455060 A CN115455060 A CN 115455060A CN 202211302898 A CN202211302898 A CN 202211302898A CN 115455060 A CN115455060 A CN 115455060A
- Authority
- CN
- China
- Prior art keywords
- data
- stream
- streams
- basic
- data streams
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据处理方法、装置、设备及介质。其中,方法包括:获取多个业务数据集合,对各业务数据集合中的业务数据进行序列化处理,得到对应的数据流;通过流数据处理引擎,确定与各数据流关联的其他数据流,对各数据流、以及与各数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;将各基础关联数据流缓存至预设数据库中;通过流数据处理引擎,确定与各基础关联数据流关联的其他基础关联数据流,进行合并处理,得到至少一个目标关联数据流;将各目标关联数据流提供给目标用户。本发明实施例可以对不同来源的业务数据构成的大量的不同的数据流进行整合,便于用户快速地对业务数据进行查看与分析。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备及介质。
背景技术
企业的业务系统在进行业务操作时,会产生大量的业务数据。业务系统所产生的业务数据可能会散落在不同的数据库或文件系统中。需要对业务系统所产生的业务数据进行统一存储和管理,便于用户根据业务数据进行业务分析,对企业的业务操作情况进行监控。
相关技术中,通常从不同的数据库或文件系统中,提取业务系统所产生的业务数据,然后将获取的业务数据存储在指定数据库中。相关技术中的数据处理方案将来自多个来源的业务数据存储在指定数据库中,导致指定数据库的数据量较大,数据较为分散,给用户对业务数据的查看与分析带来一定困难。
发明内容
本发明提供了一种数据处理方法、装置、设备及介质,以解决相关技术中的数据处理方案将来自多个来源的业务数据存储在指定数据库中,导致指定数据库的数据量较大,数据较为分散,给用户对业务数据的查看与分析带来一定困难的问题。
根据本发明的一方面,提供了一种数据处理方法,包括:
获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流;
通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;
将各所述基础关联数据流缓存至预设数据库中;
通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;
将各所述目标关联数据流提供给目标用户。
根据本发明的另一方面,提供了一种数据处理装置,包括:
数据集合获取模块,用于获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流;
第一处理模块,用于通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;
数据流缓存模块,用于将各所述基础关联数据流缓存至预设数据库中;
第二处理模块,用于通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;
数据流提供模块,用于将各所述目标关联数据流提供给目标用户。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据处理方法。
本发明实施例的技术方案,通过获取多个业务数据集合,对各业务数据集合中的业务数据进行序列化处理,得到与各业务数据集合对应的数据流;然后通过流数据处理引擎,根据各数据流对应的时间区间,确定与各数据流关联的其他数据流,对各数据流、以及与各数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;将各基础关联数据流缓存至预设数据库中;再通过流数据处理引擎,根据各预设时间窗口,确定与各基础关联数据流关联的其他基础关联数据流,对各基础关联数据流、以及与各基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;最后将各目标关联数据流提供给目标用户,解决了数据处理方案将来自多个来源的业务数据存储在指定数据库中,导致指定数据库的数据量较大,数据较为分散,给用户对业务数据的查看与分析带来一定困难的问题,取到了通过流数据处理引擎,对不同来源的业务数据构成的大量的不同的数据流进行整合,得到数据较为集中的各个预设时间窗口下的目标关联数据流,便于用户基于各个预设时间窗口下的目标关联数据流,快速地对业务数据进行查看与分析的有益效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种数据处理方法的流程图。
图2为本发明实施例二提供的一种数据处理方法的流程图。
图3为本发明实施例三提供的一种数据处理装置的结构示意图。
图4为实现本发明实施例的数据处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“目标”、“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包含”、“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种数据处理方法的流程图。本实施例可适用于对来自多个来源的业务数据进行处理,便于用户对业务数据进行查看与分析的情况,该方法可以由数据处理装置来执行,该数据处理装置可以采用硬件和/或软件的形式实现,该数据处理装置可配置于电子设备中。如图1所示,该方法包括:
步骤101、获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流。
可选的,每一个业务数据集合包含从某一个数据库或文件系统中提取的多个业务数据。各个业务数据集合的业务数据来源是不同的。业务数据是用于记录业务操作的数据。
可选的,所述对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流,包括:针对每一个业务数据集合执行下述操作:根据业务数据的业务时间从前到后的顺序,对当前处理的业务数据集合中的各业务数据进行排序,得到业务数据序列;将所述业务数据序列确定为所述当前处理的业务数据集合对应的数据流。当前处理的业务数据集合为各所述业务数据集合中一个业务数据集合。
可选的,业务数据的业务时间可以是生成业务数据的时间。示例性的,业务数据是在12点08分生成,业务数据的业务时间为12点08分。根据业务数据的业务时间从前到后的顺序,对当前处理的业务数据集合中的各业务数据进行排序,得到业务数据序列。所述业务数据序列中的各业务数据按照业务时间从前到后的顺序排列。将所述业务数据序列确定为所述当前处理的业务数据集合对应的数据流。
步骤102、通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流。
可选的,流数据处理引擎可以为用户设置于电子设备中的流数据处理引擎Flink。电子设备可以通过流数据处理引擎,根据数据流对应的时间区间或预设时间窗口,确定与各数据流关联的其他数据流,对各数据流、以及与各数据流关联的其他数据流进行合并处理。
可选的,所述通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,包括:通过流数据处理引擎,对各所述数据流对应的时间区间进行比对,将各所述数据流中的时间区间相同的至少两个数据流确定为关联的数据流。
可选的,每一个数据流对应的时间区间是由数据流中的第一个业务数据的业务时间和最后一个业务数据的业务时间构成的时间区间。示例性的,某一个数据流中的第一个业务数据的业务时间为12点05分,最后一个业务数据的业务时间为12点25分。该数据流对应的时间区间为12点05分至12点25分。
可选的,电子设备将各所述数据流输入至流数据处理引擎。流数据处理引擎对各所述数据流对应的时间区间进行比对,将各所述数据流中的时间区间相同的至少两个数据流确定为关联的数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流。对应的时间区间相同的至少两个数据流为关联的数据流。
可选的,所述对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流,包括:通过所述流数据处理引擎,针对每一个数据流执行下述操作:将当前处理的数据流、以及与所述当前处理的数据流关联的其他数据流进行合并处理,得到一个基础关联数据流。当前处理的数据流是各所述数据流中的一个还未进行合并处理的数据流。基础关联数据流是关联的多个数据流合并后得到的一个数据流。
可选的,若不存在与所述当前处理的数据流关联的其他数据流,则将所述当前处理的数据流确定为一个基础关联数据流。
可选的,将当前处理的数据流、以及与所述当前处理的数据流关联的其他数据流进行合并处理,得到一个基础关联数据流,包括:提取当前处理的数据流、以及与所述当前处理的数据流关联的其他数据流中的所有业务数据;根据业务数据的业务时间从前到后的顺序,对提取的各业务数据进行排序,得到一个业务数据序列;将所述业务数据序列确定为一个基础关联数据流。
步骤103、将各所述基础关联数据流缓存至预设数据库中。
可选的,电子设备将各所述基础关联数据流缓存至预设数据库中。预设数据库是设置于电子设备中的用于存储基础关联数据流的数据库。预设数据库可以为内存数据库Redis。
步骤104、通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流。
可选的,所述通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,包括:通过所述流数据处理引擎,根据各所述基础关联数据流对应的时间区间,确定各所述基础关联数据流对应的预设时间窗口,将对应同一个预设时间窗口的至少两个基础关联数据流确定为关联的基础关联数据流。
可选的,预设时间窗口是电子设备根据指定的时间间隔设置的时间窗口。示例性的,各预设时间窗口包括:0点至3点,3点至6点,6点至9点,9点至12点,12点至15点,15点至18点,18点至21点,21点至24点。
可选的,确定各所述基础关联数据流对应的预设时间窗口,包括:将包含各所述基础关联数据流对应的时间区间的预设时间窗口,确定为各所述基础关联数据流对应的预设时间窗口。
可选的,电子设备将各预设时间窗口和各所述基础关联数据输入至流数据处理引擎。流数据处理引擎根据各所述基础关联数据流对应的时间区间,确定各所述基础关联数据流对应的预设时间窗口,将对应同一个预设时间窗口的至少两个基础关联数据流确定为关联的基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流。对应的预设时间窗口是同一个预设时间窗口的至少两个基础关联数据流为关联的基础关联数据流。目标关联数据流是关联的多个基础关联数据流合并后得到的一个数据流。
可选的,所述对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流,包括:通过所述流数据处理引擎,针对每一个基础关联数据流执行下述操作:将当前处理的基础关联数据流、以及与所述当前处理的基础关联数据流关联的其他基础关联数据流进行合并处理,得到一个目标关联数据流。
可选的,若不存在与所述当前处理的基础关联数据流关联的其他基础关联数据流,则将所述当前处理的基础关联数据流确定为一个目标关联数据流。
可选的,将当前处理的基础关联数据流、以及与所述当前处理的基础关联数据流关联的其他基础关联数据流进行合并处理,得到一个目标关联数据流,包括:提取当前处理的基础关联数据流、以及与所述当前处理的基础关联数据流关联的其他基础关联数据流中的所有业务数据;根据业务数据的业务时间从前到后的顺序,对提取的各业务数据进行排序,得到一个业务数据序列;将所述业务数据序列确定为一个目标关联数据流。
步骤105、将各所述目标关联数据流提供给目标用户。
可选的,所述将各所述目标关联数据流提供给目标用户,包括:将各所述目标关联数据流发送至目标用户的终端设备。目标用户是负责管理业务数据的工作人员。
本发明实施例的技术方案,通过获取多个业务数据集合,对各业务数据集合中的业务数据进行序列化处理,得到与各业务数据集合对应的数据流;然后通过流数据处理引擎,根据各数据流对应的时间区间,确定与各数据流关联的其他数据流,对各数据流、以及与各数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;将各基础关联数据流缓存至预设数据库中;再通过流数据处理引擎,根据各预设时间窗口,确定与各基础关联数据流关联的其他基础关联数据流,对各基础关联数据流、以及与各基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;最后将各目标关联数据流提供给目标用户,解决了数据处理方案将来自多个来源的业务数据存储在指定数据库中,导致指定数据库的数据量较大,数据较为分散,给用户对业务数据的查看与分析带来一定困难的问题,取到了通过流数据处理引擎,对不同来源的业务数据构成的大量的不同的数据流进行整合,得到数据较为集中的各个预设时间窗口下的目标关联数据流,便于用户基于各个预设时间窗口下的目标关联数据流,快速地对业务数据进行查看与分析的有益效果。
实施例二
图2为本发明实施例二提供的一种数据处理方法的流程图。本发明实施例可以与上述一个或者多个实施例中各个可选方案结合。如图2所示,该方法包括:
步骤201、获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流。
步骤202、通过流数据处理引擎,对各所述数据流对应的时间区间进行比对,将各所述数据流中的时间区间相同的至少两个数据流确定为关联的数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流。
步骤203、将各所述基础关联数据流缓存至预设数据库中。
步骤204、通过所述流数据处理引擎,根据各所述基础关联数据流对应的时间区间,确定各所述基础关联数据流对应的预设时间窗口,将对应同一个预设时间窗口的至少两个基础关联数据流确定为关联的基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流。
步骤205、将各所述目标关联数据流提供给目标用户。
本发明实施例的技术方案,取到了通过流数据处理引擎,对不同来源的业务数据构成的大量的不同的数据流进行整合,得到数据较为集中的各个预设时间窗口下的目标关联数据流,便于用户基于各个预设时间窗口下的目标关联数据流,快速地对业务数据进行查看与分析的有益效果。
实施例三
图3为本发明实施例三提供的一种数据处理装置的结构示意图。该数据处理装置可配置于电子设备中。如图3所示,数据处理装置包括:数据集合获取模块301、第一处理模块302、数据流缓存模块303、第二处理模块304以及数据流提供模块305。
其中,数据集合获取模块301,用于获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流;第一处理模块302,用于通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;数据流缓存模块303,用于将各所述基础关联数据流缓存至预设数据库中;第二处理模块304,用于通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;数据流提供模块305,用于将各所述目标关联数据流提供给目标用户。
本发明实施例的技术方案,通过获取多个业务数据集合,对各业务数据集合中的业务数据进行序列化处理,得到与各业务数据集合对应的数据流;然后通过流数据处理引擎,根据各数据流对应的时间区间,确定与各数据流关联的其他数据流,对各数据流、以及与各数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;将各基础关联数据流缓存至预设数据库中;再通过流数据处理引擎,根据各预设时间窗口,确定与各基础关联数据流关联的其他基础关联数据流,对各基础关联数据流、以及与各基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;最后将各目标关联数据流提供给目标用户,解决了数据处理方案将来自多个来源的业务数据存储在指定数据库中,导致指定数据库的数据量较大,数据较为分散,给用户对业务数据的查看与分析带来一定困难的问题,取到了通过流数据处理引擎,对不同来源的业务数据构成的大量的不同的数据流进行整合,得到数据较为集中的各个预设时间窗口下的目标关联数据流,便于用户基于各个预设时间窗口下的目标关联数据流,快速地对业务数据进行查看与分析的有益效果。
在本发明实施例的一个可选实施方式中,可选的,数据集合获取模块301具体用于:针对每一个业务数据集合执行下述操作:根据业务数据的业务时间从前到后的顺序,对当前处理的业务数据集合中的各业务数据进行排序,得到业务数据序列;将所述业务数据序列确定为所述当前处理的业务数据集合对应的数据流。
在本发明实施例的一个可选实施方式中,可选的,第一处理模块302在执行通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流的操作时,具体用于:通过流数据处理引擎,对各所述数据流对应的时间区间进行比对,将各所述数据流中的时间区间相同的至少两个数据流确定为关联的数据流。
在本发明实施例的一个可选实施方式中,可选的,第一处理模块302在执行对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流的操作时,具体用于:通过所述流数据处理引擎,针对每一个数据流执行下述操作:将当前处理的数据流、以及与所述当前处理的数据流关联的其他数据流进行合并处理,得到一个基础关联数据流。
在本发明实施例的一个可选实施方式中,可选的,第二处理模块304在执行通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流的操作时,具体用于:通过所述流数据处理引擎,根据各所述基础关联数据流对应的时间区间,确定各所述基础关联数据流对应的预设时间窗口,将对应同一个预设时间窗口的至少两个基础关联数据流确定为关联的基础关联数据流。
在本发明实施例的一个可选实施方式中,可选的,第二处理模块304在执行对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流的操作时,具体用于:通过所述流数据处理引擎,针对每一个基础关联数据流执行下述操作:将当前处理的基础关联数据流、以及与所述当前处理的基础关联数据流关联的其他基础关联数据流进行合并处理,得到一个目标关联数据流。
在本发明实施例的一个可选实施方式中,可选的,数据流提供模块305具体用于:将各所述目标关联数据流发送至目标用户的终端设备。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述数据处理装置可执行本发明任意实施例所提供的数据处理方法,具备执行数据处理方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实现本发明实施例的数据处理方法的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18构建到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据处理方法。
在一些实施例中,数据处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序构建到RAM 13并由处理器11执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的数据处理方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流;
通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;
将各所述基础关联数据流缓存至预设数据库中;
通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;
将各所述目标关联数据流提供给目标用户。
2.根据权利要求1所述的方法,其特征在于,所述对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流,包括:
针对每一个业务数据集合执行下述操作:
根据业务数据的业务时间从前到后的顺序,对当前处理的业务数据集合中的各业务数据进行排序,得到业务数据序列;
将所述业务数据序列确定为所述当前处理的业务数据集合对应的数据流。
3.根据权利要求1所述的方法,其特征在于,所述通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,包括:
通过流数据处理引擎,对各所述数据流对应的时间区间进行比对,将各所述数据流中的时间区间相同的至少两个数据流确定为关联的数据流。
4.根据权利要求1所述的方法,其特征在于,所述对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流,包括:
通过所述流数据处理引擎,针对每一个数据流执行下述操作:
将当前处理的数据流、以及与所述当前处理的数据流关联的其他数据流进行合并处理,得到一个基础关联数据流。
5.根据权利要求1所述的方法,其特征在于,所述通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,包括:
通过所述流数据处理引擎,根据各所述基础关联数据流对应的时间区间,确定各所述基础关联数据流对应的预设时间窗口,将对应同一个预设时间窗口的至少两个基础关联数据流确定为关联的基础关联数据流。
6.根据权利要求1所述的方法,其特征在于,所述对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流,包括:
通过所述流数据处理引擎,针对每一个基础关联数据流执行下述操作:
将当前处理的基础关联数据流、以及与所述当前处理的基础关联数据流关联的其他基础关联数据流进行合并处理,得到一个目标关联数据流。
7.根据权利要求1所述的方法,其特征在于,所述将各所述目标关联数据流提供给目标用户,包括:
将各所述目标关联数据流发送至目标用户的终端设备。
8.一种数据处理装置,其特征在于,包括:
数据集合获取模块,用于获取多个业务数据集合,对各所述业务数据集合中的业务数据进行序列化处理,得到与各所述业务数据集合对应的数据流;
第一处理模块,用于通过流数据处理引擎,根据各所述数据流对应的时间区间,确定与各所述数据流关联的其他数据流,对各所述数据流、以及与各所述数据流关联的其他数据流进行合并处理,得到至少两个基础关联数据流;
数据流缓存模块,用于将各所述基础关联数据流缓存至预设数据库中;
第二处理模块,用于通过所述流数据处理引擎,根据各预设时间窗口,确定与各所述基础关联数据流关联的其他基础关联数据流,对各所述基础关联数据流、以及与各所述基础关联数据流关联的其他基础关联数据流进行合并处理,得到至少一个目标关联数据流;
数据流提供模块,用于将各所述目标关联数据流提供给目标用户。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211302898.9A CN115455060A (zh) | 2022-10-24 | 2022-10-24 | 一种数据处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211302898.9A CN115455060A (zh) | 2022-10-24 | 2022-10-24 | 一种数据处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115455060A true CN115455060A (zh) | 2022-12-09 |
Family
ID=84310995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211302898.9A Pending CN115455060A (zh) | 2022-10-24 | 2022-10-24 | 一种数据处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115455060A (zh) |
-
2022
- 2022-10-24 CN CN202211302898.9A patent/CN115455060A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114461644A (zh) | 一种数据采集方法、装置、电子设备及存储介质 | |
CN114861039B (zh) | 一种搜索引擎的参数配置方法、装置、设备及存储介质 | |
CN115934550A (zh) | 一种测试方法、装置、电子设备及存储介质 | |
CN116414814A (zh) | 数据检核方法、装置、设备、存储介质和程序产品 | |
CN115794744A (zh) | 一种日志展示方法、装置、设备和存储介质 | |
CN115438007A (zh) | 一种文件合并方法、装置、电子设备及介质 | |
CN114416583A (zh) | 一种自动化测试的工作量确定方法、装置、设备和存储介质 | |
CN115544010A (zh) | 一种映射关系确定方法、装置、电子设备及存储介质 | |
CN115454971A (zh) | 数据迁移方法、装置、电子设备及存储介质 | |
CN115455060A (zh) | 一种数据处理方法、装置、设备及介质 | |
CN115344627A (zh) | 数据筛选方法、装置、电子设备及存储介质 | |
CN117150215B (zh) | 一种考核结果确定方法、装置、电子设备及存储介质 | |
CN116431698B (zh) | 一种数据提取方法、装置、设备及存储介质 | |
CN115794555A (zh) | 一种业务日志处理方法、装置、设备及存储介质 | |
CN115730000A (zh) | 一种基于数据湖的医疗数据集成方法、装置、设备及介质 | |
CN114706578A (zh) | 一种数据处理方法、装置、设备以及介质 | |
CN115567624A (zh) | 一种报文处理方法、装置、电子设备及介质 | |
CN116401269A (zh) | 一种数据查询方法、装置、电子设备及存储介质 | |
CN115686517A (zh) | 基于移动开发平台的前端页面埋点方法、装置、电子设备和存储介质 | |
CN115271505A (zh) | 一种运维指标的统计方法、装置、平台及存储介质 | |
CN115983222A (zh) | 基于EasyExcel的文件数据读取方法、装置、设备及介质 | |
CN115964409A (zh) | 一种系统访问数据的管理方法、装置、设备及存储介质 | |
CN115437955A (zh) | 一种项目测试方法、装置、设备及存储介质 | |
CN115495380A (zh) | 测试用例生成方法、装置、电子设备及存储介质 | |
CN116186176A (zh) | 一种数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |