CN113792039A - 数据处理方法及装置、电子设备、存储介质 - Google Patents
数据处理方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN113792039A CN113792039A CN202110276205.2A CN202110276205A CN113792039A CN 113792039 A CN113792039 A CN 113792039A CN 202110276205 A CN202110276205 A CN 202110276205A CN 113792039 A CN113792039 A CN 113792039A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- field
- data table
- general
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 title claims abstract description 59
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 238000004519 manufacturing process Methods 0.000 claims abstract description 151
- 238000012545 processing Methods 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 16
- 238000000605 extraction Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 3
- 238000011958 production data acquisition Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据处理方法及装置、电子设备、存储介质,涉及计算机技术领域。该数据处理方法包括:获取数据生产方的实时生产数据以及通用数据表;将生产数据与通用数据表进行比对处理,确定生产数据中与通用数据表中的原始字段不相同的目标字段;将目标字段对应的目标字段值作为第一数据,并将原始字段对应的原始字段值作为第二数据;将第一数据和第二数据进行组装得到目标数据,并将目标数据发送给数据消费方。本公开实施例的技术方案可以通过通用数据表筛选得到生产数据对应的目标字段,并将目标字段的字段值和原始字段对应的原始字段值进行组装生成目标数据,提高了目标数据的生成速率以及对生产数据的管理效率。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种数据处理方法、数据处理装置、电子设备以及计算机可读存储介质。
背景技术
在相关的数据仓库的数据管理方法中,通过日志提取工具从实时的生产数据库中提取生产数据,并根据业务的加工逻辑和业务指标等实时加工生产数据得到数据宽表,对数据宽表中的字段进行整合以生成消费数据。
然而,在相关的数据仓库的数据管理方法中不同的生产数据库对应的数据宽表是彼此独立的,使得不同的业务系统不能互相调用数据宽表,进而仍需其它业务系统再次通过日志提取工具从对应的生产数据库中提取生产数据,并对生产数据进行加工处理以生成相同的数据宽表;在此过程中需要对生产数据库中的数据进行多次提取和加工,使得生产数据库中的数据以及数据宽表中的数据的管理效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种数据处理方法、数据处理装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服生产数据库中的数据以及数据宽表中的数据的管理效率较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种数据处理方法,包括:获取生产数据方的实时生产数据以及预构建的通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;以及将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
在本公开的一些示例实施例中,基于前述方案,获取预构建的通用数据表,包括:获取所述数据生产方的历史日志文件,并基于所述历史日志文件确定历史生产数据;将所述历史生产数据进行汇总处理得到汇总数据,并基于所述汇总数据构建所述通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述基于所述汇总数据构建所述通用数据表,还包括:获取预设的存储时长阈值;若检测到所述通用数据表在内存中的生命周期小于或等于所述存储时长阈值,则将所述通用数据表存储到所述内存中;若检测到所述通用数据表在内存中的生命周期大于所述存储时长阈值,则将所述通用数据表存储到缓存数据库中。
在本公开的一些示例实施例中,基于前述方案,所述方案还包括:将所述目标字段和目标字段值存储到所述通用数据表中,以根据所述目标字段和目标字段值更新所述通用数据表,得到更新通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述方案还包括:将所述通用数据表对应的原始字段和所述更新通用数据表对应的目标字段存储到大数据平台以实现对所述历史生产数据和实时生产数据的实时追踪。
在本公开的一些示例实施例中,基于前述方案,所述将所述第一数据和第二数据进行组装得到目标数据,将与所述目标字段对应的目标数据发送给数据消费方,包括:获取所述目标数据预设的加工逻辑,并将所述加工逻辑存储到所述通用数据表中;基于所述加工逻辑组装所述第一数据和第二数据得到目标数据;所述加工逻辑包括数据指标和数据统一口径。
在本公开的一些示例实施例中,基于前述方案,所述将与所述目标字段对应的目标数据发送给数据消费方,包括:将所述目标字段存储到目标数组中;确定所述目标数组中目标字段的数目对应的统计阈值;在检测到所述目标数组中所述目标字段的数目大于所述统计阈值时,将与所述目标字段对应的目标数据发送给数据消费方。
根据本公开实施例的第二方面,提供了一种数据处理装置,包括:获取模块、目标字段确定模块、字段值确定模块、目标数据发送模块;其中,所述获取模块,用于获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;所述目标字段确定模块,用于将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;所述字段值确定模块,用于将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;所述目标数据发送模块,用于将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
在本公开的一些示例实施例中,基于前述方案,所述获取模块包括汇总数据生成单元,所述汇总数据生成单元,用于获取所述数据生产方的历史日志文件,并基于所述历史日志文件确定历史生产数据;将所述历史生产数据进行汇总处理得到汇总数据,并基于所述汇总数据构建所述通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述获取模块还包括检测单元,所述检测单元,用于获取预设的存储时长阈值;若检测到所述通用数据表在内存中的生命周期小于或等于所述存储时长阈值,则将所述通用数据表存储到所述内存中;若检测到所述通用数据表在内存中的生命周期大于所述存储时长阈值,则将所述通用数据表存储到缓存数据库中。
在本公开的一些示例实施例中,基于前述方案,所述数据处理装置还包括更新模块,所述更新模块,用于将所述目标字段和目标字段值存储到所述通用数据表中,以根据所述目标字段和目标字段值更新所述通用数据表,得到更新通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述数据处理装置还包括存储模块,所述存储模块,用于将所述通用数据表对应的原始字段和所述更新通用数据表对应的目标字段存储到大数据平台以实现对所述历史生产数据和实时生产数据的实时追踪。
在本公开的一些示例实施例中,基于前述方案,所述将所述第一数据和第二数据进行组装得到目标数据,将与所述目标字段对应的目标数据发送给数据消费方,包括:获取所述目标数据预设的加工逻辑,并将所述加工逻辑存储到所述通用数据表中;基于所述加工逻辑组装所述第一数据和第二数据得到目标数据;所述加工逻辑包括数据指标和数据统一口径。
在本公开的一些示例实施例中,基于前述方案,所述目标数据发送模块包括目标数据发送单元,所述目标数据发送单元,用于将与所述目标字段对应的目标数据发送给数据消费方,包括:将所述目标字段存储到目标数组中;预设所述目标数组中目标字段的数目对应的统计阈值;在检测到所述目标数组中所述目标字段的数目大于所述统计阈值时,将与所述目标字段对应的目标数据发送给数据消费方。
根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现上述任意一项所述的数据处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的数据处理方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开的示例实施例中的数据处理方法,获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;以及将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。一方面,可以通过通用数据表获取不同生产数据对应的字段和字段对应的字段值,进而提高对不同业务系统的数据的管理效率;另一方面,可以将实时获取的生产数据与通用数据表进行比对,将与通用数据表中的原始字段不相同的字段作为目标字段,并将目标字段对应的目标字段值作为第一数据,以及将原始字段对应的原始字段值作为第二数据,将第一数据和第二数据进行组装得到目标数据,提高了目标数据的生成速率,也提高了对数据消费方的数据需求的响应效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示例性示出了相关的数据处理的框架结构示意图;
图2示意性示出了根据本公开的一些实施例的数据处理方法流程的示意图;
图3示意性示出了根据本公开的一些实施例的通用数据表构建方法流程的示意图;
图4示意性示出了根据本公开的一些实施例的通用数据表多级缓存方法流程的示意图;
图5示意性示出了根据本公开的一些实施例的目标数据生成方法流程的示意图;
图6示意性示出了根据本公开的一些实施例的数据处理框架结构示意图;
图7示意性示出了根据本公开的一些实施例的数据处理装置的示意图;
图8示意性示出了根据本公开的一些实施例的电子设备的计算机系统的结构示意图;
图9示意性示出了根据本公开的一些实施例的计算机可读存储介质的示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
此外,附图仅为示意性图解,并非一定是按比例绘制。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示例性示出了相关的数据处理的框架结构示意图;参考图1,相关的数据处理框架结构示意图100主要包括三个模块:生产数据获取模块110、实时数据计算模块120、数据存储模块130。
其中,生产数据获取模块110用于通过日志提取工具从生产数据库中获取生产数据,实时数据计算模块120用于对获取的生产数据进行逻辑加工、指标计算、规则引擎、数据清洗、数据压缩、数据封装处理;数据存储模块130用于通过接口将生产数据经过实时计算得到的消费数据发送给数据消费方或通过缓存数据库或外部存储将消费数据存储到业务系统可以调用的大数据平台。
在相关的数据处理方案中,主要将生产数据按照项目或业务划分,进而各个业务对应的底层数据宽表是基于各业务对应的需求生成的;然而,不同的项目或业务可能需要相同的生产数据和生产数据对应的底层宽表,且没有在数据加工逻辑中引入数据中台,每个项目或业务必须重新从生产数据库中接入新的生产数据,使得生产数据被重复接入和多次开发;进而,由于不同的项目指标逻辑参差不齐,使得对底层数据宽表的管理效率较低;因此,无论从资源上、还是从维护上、项目时间上现有的数据处理方案都不是最优的方案。
针对以上相关的数据处理方案中存在的问题,首先提供了一种数据处理方法,该数据处理方法可以应用于服务器,也可以应用于终端设备,例如手机、电脑等电子设备。图2示意性示出了根据本公开的一些实施例的数据处理方法流程的示意图。参考图2所示,该数据处理方法可以包括以下步骤:
步骤S210,获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;
步骤S220,将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;
步骤S230,将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;
步骤S240,将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
根据本示例实施例中的数据处理方法,一方面,可以通过通用数据表获取不同生产数据对应的字段和字段对应的字段值,进而提高对不同业务系统的数据的管理效率;另一方面,可以将实时获取的生产数据与通用数据表进行比对,将与通用数据表中的原始字段不相同的字段作为目标字段,并将目标字段对应的目标字段值作为第一数据,以及将原始字段对应的原始字段值作为第二数据,将第一数据和第二数据进行组装得到目标数据,提高了目标数据的生成速率,也提高了对数据消费方的数据需求的响应效率。
下面,将对本示例实施例中的数据处理方法进行进一步的说明。
在步骤S210中,获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值。
在本公开的一个示例实施例中,生产数据可以指通过日志提取工具从业务系统的生产数据库中得到的数据,例如,当业务系统为某网店,生产数据可以是日销售-流量数据如页面日浏览量或点击量、日回访客数、日订单数、日用户数、日回头客数、日支付成功笔数、日支付成功金额等,当然,生产数据还可以是通过日志提取工具从其他业务系统对应的生产数据库中提取得到的数据,本例实施例对此不作特殊限定。
通用数据表可以指将多个业务系统对应的生产数据进行汇总得到的数据表,例如,通用数据表可以是将业务系统A对应的生产数据库中的生产数据和业务系统B对应的生产数据库中的生产数据进行汇总得到数据表,当然,通用数据表还可以是其他多个业务系统的生产数据库中的生产数据进行汇总得到的数据表,本例实施例对此不作特殊限定。
原始字段可以指在通用数据表中的字段,例如,通用数据表中有页面日点击量字段、日订单数字段、日订单号字段、日用户数字段、日支付成功笔数字段、日支付成功金额字段,则页面日点击量字段、日订单数字段、日订单号字段、日用户数字段、日支付成功笔数字段、日支付成功金额字段均为通用数据表的原始字段,当然,原始字段还可以是通用数据表中汇总的其他生产数据对应的字段,本例实施例对此不作特殊限定。
原始字段值可以指原始字段对应的具体内容,例如,原始字段是页面日点击量字段,原始字段值可以是原始字段对应的具体数值如58240,原始字段也可以是日订单数字段,原始字段值可以是日订单数对应的具体数值如319,当然,原始字段值还可以是其他原始字段对应的具体数值,本例实施例对此不作特殊限定。
可以通过日志提取工具实时获取的生产数据以及从内存或缓存中获取通用数据表,进而比较实时的生产数据中的字段是否与通用数据表中的原始字段值是否相同,若实时的生产数据中的字段与原始字段值不相同,则将实时的生产数据对应的字段添加到通用数据表中,并根据消费数据对应的加工逻辑将该字段对应的字段值与原始字段对应的原始字段值进行组装得到消费数据,从而将消费数据发送给数据消费方以满足数据消费方的数据需求。
在步骤S220中,将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段。
在本公开的一个示例实施例中,目标字段可以指实时的生产数据对应的与原始字段不相同的字段,例如,目标字段可以是相对于通用数据表中新增的字段,如实时的生产数据对应的字段是下单的商品名称以及下单的单品的货号,而原始字段是页面日点击量以及成交金额,由于实时的生产数据对应的字段和原始字段不相同,则目标字段可以是下单的商品名称以及下单的单品的货号,当然,目标字段还可以是与其他原始字段不相同的字段如对原始字段进行更改后得到的字段值,本例实施例对此不作特殊限定。
可以通过将实时的生产数据对应的字段与通用数据表中的原始字段进行比对处理,将实时的生产数据对应的与原始字段不相同的字段作为目标字段,将目标字段以及目标字段对应的字段值存储到通用数据表中以实现对通用数据表的实时更新,还可以将目标字段对应的字段值与原始字段值按照预设的加工逻辑进行加工处理,得到目标数据以满足数据消费方的数据需求。
在步骤S230中,将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据。
在本公开的一个示例实施例中,目标字段值可以指目标字段对应的具体的内容,例如,当目标字段是订单的商品名称,则目标字段值可以是订单的商品名称对应的具体内容如裤子,当目标字段是订单的货号时,目标字段值可以是订单的货号对应的具体内容如8001,当然,目标字段值还可以是其他目标字段对应的具体的内容,本例实施例对此不作特殊限定。
将目标字段值作为第一数据,并将原始字段值作为第二数据,根据通用数据表中存储的数据加工逻辑,对第一数据和第二数据进行加工处理,可以得到目标数据,从而响应数据消费方的数据需求。
在步骤S240中,将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
在本公开的一个示例实施例中,目标数据可以指对第一数据和第二数据按照加工逻辑进行加工处理后得到的数据,例如,第一数据是支付时间2021年2月10日21点34分25秒、支付方式P、交易单号2938、商户单号5515、商家名称a旗舰店、收货地址A省B市C区、当前物流进度数据如快件已发货、预计到货时间2021年2月12日,第二数据是用户账号12345、商品名称M、订单号S56789、交易金额45元、用户联系方式123456789,对于数据消费方可以将商品数据、账单数据和物流数据按顺序进行拼接构成目标数据,进而可以将第一数据和第二数据进行组装得到目标数据如商家名称a旗舰店、商品名称M、商户单号5515、订单号S56789、交易金额45元、当前物流进度数据如快件已发货、预计到货时间2021年2月12日、收货地址A省B市C区,当然,目标数据还可以是按照其他加工逻辑第一数据和第二数据组装得到的数据,本例实施例对此不作特殊限定。
优选的,在数据生产方和数据消费方之间引入数据中台,数据中台可以将通过日志提取工具从多个生产数据库中获取实时的生产数据,将生产数据进行汇总和加工处理如将获取的实时生产数据与预先构建的通用数据表进行比对处理,将生产数据中与通用数据表的原始字段不相同的字段作为目标字段,将目标字段对应的目标字段值作为第一数据,将原始字段对应的原始字段值作为第二数据,按照相同的标准和口径,对第一数据和第二数据进行加工处理得到目标数据,并将目标数据发送给数据消费方;同时,也可以将目标字段和目标字段值存储到预先构建的通用数据表中以实现对通用数据表的实时更新,避免了其他业务系统需要调用相同的数据表时需要重新从生产数据库中对生产数据进行加工处理,提高了对生产数据和通用数据表的管理效率。
图3示意性示出了根据本公开的一些实施例的通用数据表构建方法流程的示意图。参考图3所示,该通用数据表构建方法可以包括以下步骤:
在步骤S310中,获取所述数据生产方的历史日志文件,并基于所述历史日志文件确定历史生产数据;
在步骤S320中,将所述历史生产数据进行汇总处理得到汇总数据,并基于所述汇总数据构建所述通用数据表。
其中,历史日志文件可以指用于提取历史生产数据的文件集合,例如,历史日志文件可以是内核及系统日志文件,历史日志文件也可以是用于记录系统用户登录及退出系统的相关信息的文件集合,包括用户名、登录的终端IP地址、登录时间、历史浏览数据等文件集合的用户日志文件,历史日志文件还可以是历史程序日志文件,当然,历史日志文件还可以是其他类型的历史文件集合,本例实施例对此不作特殊限定。
汇总数据可以指对生产数据进行汇总处理得到的数据,例如,生产数据是2020年1月份用户A的消费信息如订单编号、账户ID、支付方式、金额以及2020年2月份用户A的消费信息如订单编号、账户ID、支付方式、金额,可以将2020年1月份和2月份用户A的消费信息进行汇总处理,汇总数据可以是用户A在2020年的前两个月的消费数据,当然,汇总数据还可以是对其他生产数据进行汇总得到的数据,本例实施例对此不作特殊限定。
通用数据表可以指将多个汇总数据按数据指标进行存储得到的数据表,例如,当数据指标是日购买数量超过2000的商品时,可以汇总日销商品的信息,从而从汇总数据中筛选得到购买数量超过2000的商品名称、商品对应的购买数量、商品被加入购物车的次数、商品对应的回头客数量字段以及各字段对应的字段值,通用数据表可以是由购买数量超过2000的商品名称、商品对应的购买数量、商品被加入购物车的次数、商品对应的回头客数量字段以及各个字段对应的字段值构成的数据表,当然,通用数据表还可以是根据其他数据指标从汇总数据中筛选得到的字段和字段值构成的数据表,本例实施例对此不作特殊限定。
优选的,可以在数据生产方和数据消费方之间引入数据中台,进而通过数据中台通过日志提取工具从各个生产数据库中获取生产数据,并将不同的生产数据进行汇总处理得到汇总数据,根据不同业务系统的数据消费方需要的目标数据设置对应的数据指标或者加工逻辑,并按照目标数据对应的数据指标或者数据加工逻辑对汇总数据进行加工处理得到通用数据表,其他业务系统可以直接调用该通用数据表,并不需要再次通过日志提取工具从对应的生产数据库中提取生产数据,并对生产数据进行汇总处理以及按照统一数据指标或口径对生产数据多次加工,提高了对生产数据以及通用数据表中数据的管理效率,也避免了对同一生产数据进行多次加工,提高了目标数据的生成效率。
图4示意性示出了根据本公开的一些实施例的通用数据表多级缓存方法流程的示意图。参考图4所示,该通用数据表多级缓存方法可以包括以下步骤:
在步骤S410中,获取预设的存储时长阈值;
在步骤S420中,若检测到所述通用数据表在内存中的生命周期小于或等于所述存储时长阈值,则将所述通用数据表存储到所述内存中;
在步骤S430中,若检测到所述通用数据表在内存中的生命周期大于所述存储时长阈值,则将所述通用数据表存储到缓存数据库中。
其中,存储时长阈值可以指通用数据表在内存中存储的时长阈值,例如,存储时长阈值为2天时,当将预构建的通用数据表存储到内存中的时间为2021-12-21-14-29-36,则在时间2021-12-23-14-29-36为通用数据表在内存中的存储截止时间,当然,存储时长阈值还可以是通用数据表在内存中存储的其他时长阈值,本例实施例对此不作特殊限定。
生命周期可以指通用数据表从生成到更新对应的时间周期,例如,生成通用数据表1的时间戳为2021-12-21-14-29-36,而通用数据表1在2021-12-23-14-29-36被更新为通用数据表2,则通用数据表1的生命周期为2天。
优选的,由于内存中数据的读取速率大于缓存数据库中数据的读取效率,而缓存数据库中的读取效率大于搜索引擎的读取速率,可以将通用数据表按时间段进行多级缓存;通过预设通用数据表在内存中的存储时长阈值,并检测通用数据表的生命周期是否小于或等于预设的存储时长阈值,若通用数据表的生命周期小于或等于存储时长阈值,则将通用数据表存储在内存中,当通用数据表的生命周期大于存储时长阈值,则将通用数据表存储到缓存数据库如Redis中,避免将通用数据表存储在搜索引擎中,从而提高了搜索引擎的工作效率,也通过多级缓存机制缓解了内存的存储负担,提高了通用数据表的存储效率。
在本公的一个示例实施例中,可以将生产数据中与通用数据表中的原始字段不相同的目标字段和目标字段对应的目标字段值存储到所述通用数据表中,以根据所述目标字段和目标字段值更新所述通用数据表,得到更新通用数据表。
其中,更新通用数据表可以指根据实时的生产数据对应的目标字段对内存中或缓存数据库中已存在的通用数据表进行更新得到的数据表,例如,内存或缓存数据库中存在的通用数据表是包含购买数量超过2000的商品名称、商品对应的购买数量、商品被加入购物车的次数、商品对应的回头客数量字段构成的原始字段以及各原始字段对应的字段值的数据表,而实时获取的生产数据中存在与通用数据表中原始字段不相同的字段如用户年龄和用户性别,进而可以将用户年龄和用户性别作为目标字段,并将目标字段和目标字段对应的目标字段值导入通用数据表中,则更新通用数据表可以是包含购买数量超过2000的商品名称、商品对应的购买数量、商品被加入购物车的次数、商品对应的回头客数量、用户年龄、用户性别字段以及各个字段对应的字段值构成的数据表,当然,更新数据表还可以是由其他生产数据对应的目标字段对内存中或缓存数据库中已存在的通用数据表进行更新得到的数据表,本例实施例对此不作特殊限定。
可以通过日志提取工具从生产数据库中获取实时的生产数据,并将生产数据对应的字段与通用数据表的原始字段进行比对处理,并将生产数据中与原始字段不相同的字段作为目标字段,以及将目标字段存储到通用数据表中,同时将目标字段对应的目标字段值导入到通用数据表中,得到更新后的通用数据表。
优选的,通过将实时的生产数据中的字段与内存或缓存数据库中已存储的通用数据表中的原始字段进行比对处理,检测到生产数据中存在与原始字段不相同的字段时,将生产数据中与原始字段不相同的字段作为目标字段,将目标字段以及目标字段对应的目标字段值同时导入内存或缓存数据中已存储的通用数据表中,得到更新后的通用数据表;进而,其他业务系统可以根据内存中或缓存数据库中更新后的通用数据表得到实时的目标数据,避免了对实时的生产数据和历史生产数据进行加工处理,提高了目标数据的更新效率和共享效率。
在本公的一个示例实施例中,可以将更新前的通用数据表对应的原始字段值和更新后的通用数据表对应的目标字段值存储到大数据平台以实现对生产数据的实时追踪。
其中,可以将存储在内存或者缓存数据库中的更新前的通用数据表对应的字段,以及更新后的通用数据表对应的目标字段进行备份,并将备份后的原始字段和目标字段存储到大数据平台中,进而可以根据数据中台中存储的通用数据表字段对应的字段值,查询向数据消费方下发的目标数据以对生产数据库中的生产数据进行追踪。
优选的,可以将更新前的通用数据表对应的原始字段和更新后的通用数据表对应的目标字段持久化存储到大数据平台,进而可以根据数据中台中存储的原始字段对应的原始字段值和目标字段对应的目标字段值,甚至各业务系统在通用数据表中存储的数据加工逻辑或目标数据对应的常用数据指标,查询向数据消费方下发的历史目标数据以实现对生产数据库中生产数据的实时追踪,提高生产数据的安全性和完整性。
图5示意性示出了根据本公开的一些实施例的目标数据生成方法流程的示意图。参考图5所示,该的目标数据生成方法可以包括以下步骤:
在步骤S510中,获取所述目标数据预设的加工逻辑,并将所述加工逻辑存储到所述通用数据表中;
在步骤S520中,基于所述加工逻辑组装所述第一数据和第二数据得到目标数据;所述加工逻辑包括数据指标和数据统一口径。
其中,加工逻辑可以指基于目标字段值与原始字段值生成的与数据消费方数据需求相对应的目标数据的逻辑,例如,加工逻辑可以是按照目标数据对应的数据指标或业务系统的数据统一口径将目标字段值与原始字段值进行拼接得到对应的目标数据的逻辑,加工逻辑也可以是按照目标数据对应的数据指标或业务系统的数据统一口径生成判定表或判定树,进而根据判定表或判定树中的逻辑条件将目标字段值和原始字段值进行组装得到对应的目标数据的逻辑,当然,加工逻辑还可以指基于目标字段值与原始字段值生成的与数据消费方数据需求相对应的目标数据的其他逻辑,本例实施例对此不作特殊限定。第一数据可以指目标字段对应的目标字段值,第二数据可以指通用数据表中原始字段对应的原始字段值。
数据统一口径可以指用于约束目标数据的展现形式的口径,例如,数据统一口径可以是用于从生产数据库表和通用数据表中回溯得到目标数据的数据来源统一口径,数据统一口径也可以是用于管理将相同的目标数据以相同的形式如报表形式展现给多个数据消费方的数据输出统一口径,当然,数据统一口径还可以是用于约束目标数据的展现形式的其他口径,本例实施例对此不作特殊限定。
优选的,可以将业务系统对应的数据指标或数据统一口径,甚至目标数据对应的加工逻辑预先存储到通用数据表中,进而可以直接将通用数据表中原始字段值和实时获取的与通用数据表中原始字段不相同的目标字段对应的目标字段值进行加工处理,生成数据消费方需要的目标数据,提高响应数据消费方数据需求的速率。
在本公的一个示例实施例中,可以将目标字段存储到目标数组中,并确定目标数组中目标字段的数目对应的统计阈值,在检测到目标数组中目标字段的数目大于所述统计阈值时,将与目标字段对应的目标数据发送给数据消费方。
其中,统计阈值以指目标数组中存储的目标字段对应的数量的阈值,例如,目标字段的统计阈值为100,表示实时获取的生产数据中存在与通用数据表中原始字段的不相同的目标字段的数目不小于100时,可以根据各个业务系统对应的数据统一口径或业务指标对目标字段对应的目标字段值和原始字段值进行组装生成目标数据,当然,统计阈值还可以是针对目标数组中存储的目标字段对应的数据的最大阈值,本例实施例对此不作特殊限定。
优选的,可以将原始字段对应的更新字段或实时获取的生产数据对应的新增字段存储到目标数组中,将更新字段对应的原始字段存储到原始数组中,并检测目标数组中目标字段的数目是否超过预设的统计阈值;若检测到目标数组中目标字段对应的数目超过或等于预设的阈值时,则将目标字段对应的目标字段值和原始数组中存储的原始字段对应的原始字段值按照数据统一口径或业务指标生成的目标数据发送给数据消费方,进而,提高对生产数据和通用数据表中的数据的管理效率,以及提高生成目标数据的效率。
图6示意性示出了根据本公开的一些实施例的数据处理的框架结构示意图。参考图6所示,该数据处理的框架结构示意图600主要包括4个模块,生产数据获取模块610、数据中台模块620、大数据平台模块630、目标数据发送模块640。
其中,数据中台模块620包括实时数据计算单元621和通用数据表存储单元622。具体的,生产数据获取模块610,用于通过日志提取工具从生产数据库中实时的获取生产数据;实时数据计算单元621,用于将生产数据进行逻辑加工、指标计算、规则引擎、数据清洗、数据压缩、数据封装得到目标字段,以及目标字段对应的目标字段值;通用数据表存储单元622,用于通过缓存数据库或外部存储将通用数据表分时间段存储到内存中或缓存数据库中以实现对更新前的通用数据表和更新后的通用数据表的多级缓存,并实现原始数组和目标数组的多级缓存;大数据平台630,用于将更新前的通用数据表和更新后的通用数据表持久化存储到大数据平台以实现对生产数据和目标数据的实时追踪;目标数据发送模块640,用于将目标数据按需发送给对应的数据消费方,并实现在数据消费方对应的终端实现对目标数据的存储。
优选的,通过在数据生产方和数据消费方之间引入实时的数据中台,通过实时的获取生产数据库中的生产数据,并将生产数据与预先构建的通用数据表进行比对处理,检测生产数据中是否存在与通用数据表中原始字段不相同的目标字段,并将目标字段对应的字段值与原始字段对应的原始字段值进行组装得到目标数据,同时,根据目标字段和目标字段对应的目标字段值实时的更新通用数据表;最后,将目标数据按需发送个多个数据消费方,不但可以在数据消费方实现数据的透明,而且数据消费方无需做其他改动来适配实时中台,只需将通用数据宽表视为一张新的表即可;此外,通过将通用数据表进行多级缓存,提高了搜索引擎的工作效率,也提高了生产数据和目标数据的存储效率,还可以将更新前的通用数据表和更新后的通用数据表持久化存储到大数据平台,提高了生产数据和目标数据的追踪效率。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
此外,在本示例实施例中,还提供了一种数据处理装置。参照图7所示,该数据处理装置700包括:获取模块710、目标字段确定模块720、字段值确定模块730、目标数据发送模块740。其中:所述获取模块710,用于获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;所述目标字段确定模块720,用于将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;所述字段值确定模块730,用于将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;所述目标数据发送模块740,用于将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
在本公开的一些示例实施例中,基于前述方案,所述获取模块710包括汇总数据生成单元,所述汇总数据生成单元,用于获取所述数据生产方的历史日志文件,并基于所述历史日志文件确定历史生产数据;将所述历史生产数据进行汇总处理得到汇总数据,并基于所述汇总数据构建所述通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述获取模块710还包括检测单元,所述检测单元,用于获取预设的存储时长阈值;若检测到所述通用数据表在内存中的生命周期小于或等于所述存储时长阈值,则将所述通用数据表存储到所述内存中;若检测到所述通用数据表在内存中的生命周期大于所述存储时长阈值,则将所述通用数据表存储到缓存数据库中。
在本公开的一些示例实施例中,基于前述方案,所述数据处理装置700还包括更新模块,所述更新模块,用于将所述目标字段和目标字段值存储到所述通用数据表中,以根据所述目标字段和目标字段值更新所述通用数据表,得到更新通用数据表。
在本公开的一些示例实施例中,基于前述方案,所述数据处理装700还包括存储模块,所述存储模块,用于将所述通用数据表对应的原始字段和所述更新通用数据表对应的目标字段存储到大数据平台以实现对所述历史生产数据和实时的生产数据的实时追踪。
在本公开的一些示例实施例中,基于前述方案,所述字段值确定模块730包括字段值目标数据生成单元,所述目标数据生成单元,用于获取所述目标数据预设的加工逻辑,并将所述加工逻辑存储到所述通用数据表中;基于所述加工逻辑组装所述第一数据和第二数据得到目标数据;所述加工逻辑包括数据指标和数据统一口径。
在本公开的一些示例实施例中,基于前述方案,所述目标数据发送模块740包括目标数据发送单元,所述目标数据发送单元,用于将所述目标数据发送给数据消费方,包括:将所述目标字段存储到目标数组中;确定所述目标数组中目标字段的数目对应的统计阈值;在检测到所述目标数组中所述目标字段的数目大于所述统计阈值时,将与所述目标字段对应的目标数据发送给数据消费方。
上述中数据处理装置各模块的具体细节已经在对应的数据处理方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了数据处理装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述数据处理方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述根据本公开的这种实施例的电子设备800。图8所示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,所述处理单元810可以执行如图2中所示的步骤S210,获取数据生产方的实时生产数据以及预构建的通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;步骤S220,将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;步骤S230,将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;步骤S240,将所述第一数据和第二数据进行组装得到目标数据,将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。
存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
参考图9所示,描述了根据本公开的实施例的用于实现上述数据处理方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施例的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取数据生产方的实时生产数据以及预构建的通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;
将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;
将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;以及
将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
2.根据权利要求1所述的数据处理方法,其特征在于,所述获取预构建的通用数据表,包括:
获取所述数据生产方的历史日志文件,并基于所述历史日志文件确定历史生产数据;
将所述历史生产数据进行汇总处理得到汇总数据,并基于所述汇总数据构建所述通用数据表。
3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述汇总数据构建所述通用数据表,还包括:
获取预设的存储时长阈值;
若检测到所述通用数据表在内存中的生命周期小于或等于所述存储时长阈值,则将所述通用数据表存储到所述内存中;
若检测到所述通用数据表在内存中的生命周期大于所述存储时长阈值,则将所述通用数据表存储到缓存数据库中。
4.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
将所述目标字段和目标字段值存储到所述通用数据表中,以根据所述目标字段和目标字段值更新所述通用数据表,得到更新通用数据表。
5.根据权利要求4所述的数据处理方法,其特征在于,所述方法还包括:
将所述通用数据表对应的原始字段和所述更新通用数据表对应的目标字段存储到大数据平台以实现对所述历史生产数据和实时生产数据的实时追踪。
6.根据权利要求1所述的数据处理方法,其特征在于,所述将所述第一数据和第二数据进行组装得到目标数据,包括:
获取所述目标数据预设的加工逻辑,并将所述加工逻辑存储到所述通用数据表中;
基于所述加工逻辑组装所述第一数据和第二数据得到目标数据;所述加工逻辑包括数据指标和数据统一口径。
7.根据权利要求6所述的数据处理方法,其特征在于,所述将与所述目标字段对应的目标数据发送给数据消费方,包括:
将所述目标字段存储到目标数组中;
确定所述目标数组中目标字段的数目对应的统计阈值;
在检测到所述目标数组中所述目标字段的数目大于所述统计阈值时,将与所述目标字段对应的目标数据发送给数据消费方。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取数据生产方的实时生产数据以及通用数据表;所述通用数据表包括原始字段和所述原始字段对应的原始字段值;
目标字段确定模块,用于将所述生产数据与所述通用数据表进行比对处理,确定所述生产数据中与所述通用数据表中的所述原始字段不相同的目标字段;
字段值确定模块,用于将所述目标字段对应的目标字段值作为第一数据,并将所述原始字段对应的原始字段值作为第二数据;以及
目标数据发送模块,用于将所述第一数据和第二数据进行组装得到目标数据,并将所述目标数据发送给数据消费方以满足数据消费方的数据需求。
9.一种电子设备,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276205.2A CN113792039B (zh) | 2021-03-15 | 2021-03-15 | 数据处理方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110276205.2A CN113792039B (zh) | 2021-03-15 | 2021-03-15 | 数据处理方法及装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113792039A true CN113792039A (zh) | 2021-12-14 |
CN113792039B CN113792039B (zh) | 2024-03-01 |
Family
ID=78876854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110276205.2A Active CN113792039B (zh) | 2021-03-15 | 2021-03-15 | 数据处理方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792039B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610959A (zh) * | 2022-05-12 | 2022-06-10 | 恒生电子股份有限公司 | 数据处理方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279542A (zh) * | 2013-06-05 | 2013-09-04 | 中国电子科技集团公司第十五研究所 | 数据导入处理方法及数据处理装置 |
CN104462604A (zh) * | 2014-12-31 | 2015-03-25 | 成都市卓睿科技有限公司 | 数据加工方法及系统 |
CN104657461A (zh) * | 2015-02-10 | 2015-05-27 | 北京航空航天大学 | 基于内存与ssd协作式的文件系统元数据搜索缓存方法 |
CN105447090A (zh) * | 2015-11-05 | 2016-03-30 | 华中科技大学 | 一种自动化数据挖掘预处理方法 |
CN108897796A (zh) * | 2018-06-12 | 2018-11-27 | 平安科技(深圳)有限公司 | 一种业务系统调用influxdb数据库的方法、存储介质和服务器 |
CN109165119A (zh) * | 2018-08-07 | 2019-01-08 | 泾县麦蓝网络技术服务有限公司 | 一种电子商务数据处理方法和系统 |
CN109254969A (zh) * | 2018-08-31 | 2019-01-22 | 平安科技(深圳)有限公司 | 数据表处理方法、装置、设备及存储介质 |
CN109559808A (zh) * | 2018-11-07 | 2019-04-02 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111143350A (zh) * | 2019-11-27 | 2020-05-12 | 深圳壹账通智能科技有限公司 | 企业数据监控方法、装置、计算机设备及存储介质 |
-
2021
- 2021-03-15 CN CN202110276205.2A patent/CN113792039B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279542A (zh) * | 2013-06-05 | 2013-09-04 | 中国电子科技集团公司第十五研究所 | 数据导入处理方法及数据处理装置 |
CN104462604A (zh) * | 2014-12-31 | 2015-03-25 | 成都市卓睿科技有限公司 | 数据加工方法及系统 |
CN104657461A (zh) * | 2015-02-10 | 2015-05-27 | 北京航空航天大学 | 基于内存与ssd协作式的文件系统元数据搜索缓存方法 |
CN105447090A (zh) * | 2015-11-05 | 2016-03-30 | 华中科技大学 | 一种自动化数据挖掘预处理方法 |
CN108897796A (zh) * | 2018-06-12 | 2018-11-27 | 平安科技(深圳)有限公司 | 一种业务系统调用influxdb数据库的方法、存储介质和服务器 |
CN109165119A (zh) * | 2018-08-07 | 2019-01-08 | 泾县麦蓝网络技术服务有限公司 | 一种电子商务数据处理方法和系统 |
CN109254969A (zh) * | 2018-08-31 | 2019-01-22 | 平安科技(深圳)有限公司 | 数据表处理方法、装置、设备及存储介质 |
CN109559808A (zh) * | 2018-11-07 | 2019-04-02 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111143350A (zh) * | 2019-11-27 | 2020-05-12 | 深圳壹账通智能科技有限公司 | 企业数据监控方法、装置、计算机设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610959A (zh) * | 2022-05-12 | 2022-06-10 | 恒生电子股份有限公司 | 数据处理方法、装置、设备及存储介质 |
CN114610959B (zh) * | 2022-05-12 | 2022-08-16 | 恒生电子股份有限公司 | 数据处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113792039B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11694257B2 (en) | Utilizing artificial intelligence to make a prediction about an entity based on user sentiment and transaction history | |
CN110795509A (zh) | 一种数据仓库的指标血缘关系图的构建方法、装置和电子设备 | |
CN111339073A (zh) | 实时数据处理方法、装置、电子设备及可读存储介质 | |
US20200357063A1 (en) | Systems and computer-implemented processes for model-based underwriting | |
CN112016796B (zh) | 综合风险评分请求处理方法、装置及电子设备 | |
CN110795478A (zh) | 一种应用于金融业务的数据仓库更新方法、装置和电子设备 | |
CN112017023A (zh) | 小微企业资源额度确定方法、装置及电子设备 | |
CN110807016A (zh) | 一种应用于金融业务的数据仓库构建方法、装置和电子设备 | |
CN110705998A (zh) | 基于区块链的信息审核方法及装置、电子设备、存储介质 | |
CN111062799A (zh) | 家庭客户的管理方法、装置、电子设备及存储介质 | |
CN111260142B (zh) | 商品指标数据预测方法、装置、存储介质及电子设备 | |
CN116860856A (zh) | 一种财务数据处理方法、装置、计算机设备及存储介质 | |
CN113792039B (zh) | 数据处理方法及装置、电子设备、存储介质 | |
CN112287208B (zh) | 用户画像生成方法、装置、电子设备及存储介质 | |
CN112348658A (zh) | 资源分配方法、装置及电子设备 | |
CN112330502A (zh) | 合同审核方法及装置、电子设备、存储介质 | |
CN111144987A (zh) | 异常购物行为的限制方法、限制组件及购物系统 | |
CN115983770A (zh) | 一种产品部件采购方法、装置、电子设备和存储介质 | |
US20190180294A1 (en) | Supplier consolidation based on acquisition metrics | |
Biju et al. | Comparative Analysis of selected big data analytics tools | |
CN113672771A (zh) | 数据录入处理方法、装置、介质及电子设备 | |
CN114547106A (zh) | 数据查询方法及装置、存储介质、计算机系统 | |
CN112016791A (zh) | 资源分配方法、装置及电子设备 | |
CN113971007B (zh) | 信息处理方法、装置、电子设备及介质 | |
Biju et al. | Comparative analysis of big data analytics software in assessing sample data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |