CN111400304A - 一种获取截面日期全量数据的方法、装置、电子设备及存储介质 - Google Patents
一种获取截面日期全量数据的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111400304A CN111400304A CN202010102603.8A CN202010102603A CN111400304A CN 111400304 A CN111400304 A CN 111400304A CN 202010102603 A CN202010102603 A CN 202010102603A CN 111400304 A CN111400304 A CN 111400304A
- Authority
- CN
- China
- Prior art keywords
- date
- data
- filing
- section
- data structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种获取截面日期全量数据的方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法的一具体实施方式包括:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;获取归档日期在所述起始日期和所述截面日期之间的归档数据;按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。该实施方式节省存储空间;提高数据查询和计算的效率,便于清晰直观的了解截面日期的全量数据。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取截面日期全量数据的方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的发展,以及互联网和大数据技术的广泛应用,需要存储和处理的数据越来越多。为了充分利用数据,出现了越来越多的管理数据的需求,例如,查询某一日期的截面数据。为了满足用户的查询某一日期的截面数据的需求,现有技术通常的做法是:为每个需要查询的日期保存一个全量数据。这种做法的缺陷是:数据管理系统每日保存一份全量数据,其中有些数据是没有变化的,浪费了大量存储空间。
发明内容
有鉴于此,本发明实施例提供一种获取截面日期全量数据的方法、装置、电子设备及存储介质,能够节省存储空间;确定尽量小的截面数据计算范围,提高数据查询和计算的效率;使截面日期全量数据按照截面日期的初始数据结构形式排列,数据结构更新,便于清晰直观的了解截面日期的全量数据。
为实现上述目的,根据本发明实施例的一个方面,提供一种获取截面日期全量数据的方法,包括:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;获取归档日期在所述起始日期和所述截面日期之间的归档数据;按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
可选的,在所述得到截面日期的全量数据之前,还包括:检查在所述起始日期和所述截面日期之间的归档数据的归档日期是否为连续日期。
可选的,在所述确定计算截面日期全量数据的起始日期之前,还包括如下步骤:待归档数据在归档到归档表时,判断所述待归档数据的初始数据结构与所述归档表的数据结构是否一致,若不一致,调整所述待归档数据,使所述待归档数据的数据结构与所述归档表的数据结构一致,同时对所述待归档数据的初始数据结构进行登记。
可选的,所述归档日期在所述起始日期和所述截面日期之间的归档数据为增量数据或减量数据。
可选的,所述归档日期在所述起始日期和所述截面日期之间的归档数据为减量数据,减量数据所对应的主键字段不再校验。
可选的,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致,若不一致,则调整归档日期在所述起始日期和所述截面日期之间的归档数据,使其与所述截面日期的归档数据的初始数据结构一致;
可选的,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致的方法为:判断所述归档表的数据结构与所述截面日期的归档数据的初始数据结构是否一致。
可选的,判断所述归档表的数据结构与所述截面日期的归档数据的初始数据结构是否一致的方法为:比较所述归档表的数据结构的主键字段及主键字段之间的排列顺序是否分别与所述截面日期的归档数据的初始数据结构的主键字段及主键字段之间的排列顺序一致,所述主键字段值之间的排列顺序即为主键字段值的栏位信息。
可选的,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构缺少第一主键字段,则在所述第一主键字段所在的栏位上增加空占位,将除所述第一主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
可选的,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构多第二主键字段,则将所述第二主键字段所对应的数据删除或移到最后,将除所述第二主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
可选的,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若归档表的数据结构的主键字段的排列顺序不同,则将所述起始日期和所述截面日期之间的归档数据重新排序,使所述起始日期和所述截面日期之间的归档数据的栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
根据本发明实施例的第二个方面,提供一种获取截面日期全量数据的装置,包括:起始日期确定模块,用于确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;归档数据获取模块,用于获取归档日期在所述起始日期和所述截面日期之间的归档数据;截面日期全量数据获取模块,用于按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
根据本发明实施例的第三个方面,提供了一种获取截面日期全量数据的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如以上所述获取截面日期全量数据方法中任一所述的方法。
根据本发明实施例的第四个方面,提供了一种获取截面日期全量数据的计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如以上所述获取截面日期全量数据方法中任一所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:全量数据通过计算获取,不需要为每个时间点保存一份全量数据,节省了存储空间;通过选择距距所述截面日期最近的全量数据的归档日期作为计算截面日期全量数据的起始日期,确定了一个尽量小的截面数据计算范围,提高数据查询和计算的效率;截面日期全量数据按照截面日期的数据结构形式排列,数据结构更新,便于清晰直观的了解截面日期的全量数据。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的获取截面日期全量数据的方法的主要流程的示意图;
图2是根据本发明实施例的获取截面日期全量数据的方法的主要流程的示意图;
图3是根据本发明实施例的获取截面日期全量数据的方法的主要流程的示意图;
图4是根据本发明实施例的获取截面日期全量数据的装置的主要模块的示意图;
图5是根据本发明实施例的获取截面日期全量数据的装置的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的一种获取截面日期全量数据的方法的主要步骤的示意图,如图1所示,本发明实施例中的获取截面日期全量数据的方法主要包括如下的步骤S101至步骤S103:
S101:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;
若截面日期的数据类型若为全量数据或初始量数据,则可直接获取截面日期的全量数据。若截面日期的数据类型不是全量数据或初始量数据,则需要从截面日期起,向前搜索历史数据,直至找出归档数据类型为全量数据的归档日期,将其作为计算截面日期全量数据的起始日期。为了提高查找效率,不需要遍历所有归档数据,仅需要找到离截面日期最近的全量数据即可。
S102:获取归档日期在所述起始日期和所述截面日期之间的归档数据;
所述起始日期的数据类型为全量数据或初始量数据,所述起始日期到所述截面日期之间(包括截面日期)的数据类型为增量数据或减量数据。
S103:按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
截面日期的归档数据在归档到归档表时,若初始数据结构与归档表的数据结构不同,需要将截面日期的归档数据由初始数据结构调整为归档数据结构,同时登记截面日期归档数据的初始数据结构。
所述截面日期的归档数据为增量数据或减量数据,所述截面日期的增量数据或减量数据的初始数据结构包括与截面日期的全量数据相同的全部主键字段及全部主键字段的排列顺序。由于在同一时间点即同一截面日期的增量数据、减量数据、全量数据、初始量数据的全部主键字段及全部主键字段的排列顺序是相同的,所以用截面日期的增量数据或减量数据的初始数据结构作为截面日期的全量数据的数据结构。
所述截面日期的归档数据的初始数据结构可以为截面日期的归档数据的初始数据结构,若截面日期无归档数据,也可以选择截面日期之前距离截面日期最近的日期的归档数据的初始数据结构作为截面日期归档数据的初始数据结构。
所述归档日期在所述起始日期和所述截面日期之间的归档数据为从归档表中获取,从归档表中获取的归档数据与归档表的数据结构一致,因此获取的所述归档日期在所述起始日期和所述截面日期之间的归档数据与归档表的数据结构一致。
在本公开的一个实施例中,按照截面日期的归档数据的初始数据结构得到截面日期的全量数据的方法为:首先,从所述归档表中获取所述归档日期在所述起始日期和所述截面日期之间的归档数据,然后,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,最后,将获取的各个主键字段的最新数据调整为截面日期的归档数据的初始数据结构。
在本公开的一个实施例中,按照截面日期的归档数据的初始数据结构得到截面日期的全量数据的方法为,首先,从所述归档表中获取所述归档日期在所述起始日期和所述截面日期之间的归档数据,然后,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致,若不一致,调整所述获取的归档日期在所述起始日期和所述截面日期之间的归档数据,使所述获取的归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构与所述截面日期的归档数据的初始数据结构一致,最后,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据。
将归档数据按照截面日期的归档数据的初始数据结构重新排列,可以更新归档数据的结构,便于不同归档日期的主键字段所对应的数据都在同一列,方便比较查找,数据更加清晰直观。
所述截面日期的归档数据的初始数据结构为截面日期的源系统数据的初始数据结构,不是按照归档表的数据结构调整后的数据结构。获取截面日期的归档数据的初始数据结构,方法如下:判断数据资产表是否存储有截面日期的DDL文件,若是,则获取截面日期的DDL文件,通过截面日期的DDL文件获取截面日期的归档数据的初始数据结构;若否,则获取归档表的DDL文件,通过归档区的DDL文件获取截面日期的归档数据的初始数据结构。
具体的,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致,可以判断归档表的数据结构的DDL文件与所述截面日期的归档数据的初始数据结构的DDL文件相比是否相同,若相同则将归档数据存入截面日期全量数据表;若不同,则调整归档日期在所述起始日期和所述截面日期之间的归档数据,使归档数据的数据结构与所述截面日期的归档数据的初始数据结构一致,并将调整后的归档日期在所述起始日期和所述截面日期之间的归档数据存入截面日期全量数据表。具体如下:
(1)所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构缺少第一主键字段,则在所述第一主键字段所在的栏位上增加空占位,将除所述第一主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
(2)所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构多第二主键字段,则将所述第二主键字段所对应的数据删除或移到最后,将除所述第二主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
(3)所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若归档表的数据结构的主键字段的排列顺序不同,则将所述起始日期和所述截面日期之间的归档数据重新排序,使所述起始日期和所述截面日期之间的归档数据的栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
图2是根据本发明实施例的一种获取截面日期全量数据的方法的主要步骤的示意图,如图2所示,本发明实施例中的获取截面日期全量数据的方法主要包括如下的步骤S201至步骤S204:
S201:待归档数据归档到归档表时,将待归档数据由初始数据结构调整为归档数据结构,同时登记待归档数据的初始数据结构信息。
源系统指数据产生系统,源系统数据归档时,对数据的相关信息进行登记。数据的相关信息包括物理存储信息和初始数据结构信息,物理存储信息包括数据类型、数据存储日期范围、数据归档日期等信息,初始数据结构信息包括数据归档日期的全部主键字段及全部主键字段的排列顺序,所述全部主键字段的排列顺序由各个主键字段的栏位信息所确定,所述数据归档日期即为数据产生日期。
将源系统的数据类型划分为全量(full)、增量(incr)、减量(del)、初始量(init)四大类数据,增量数据:相对最近一次提取数据后增加、修改的数据;减量数据:相对最近一次提取数据后删除的数据;全量数据:某张表的全部数据;初始量数据:某张表首次卸载提供的数据;截面数据:截面日期的全量数据,即某个特定时间点(通常是特定日)的全量数据。
数据归档过程中,数据存储类型包括:主档表和明细表,其中,主档表是反映客观事实主体属性的表,产生新主体时会增加到主档信息,主体发生变更时会修改主档信息,主体消失时会删除或标记主档信息;明细表是反映客观事实主体历史变化情况的表。
待归档数据(源系统数据)在归档到归档表时,根据归档表的数据结构调整待归档数据。归档表的数据结构包括预先设定的主键字段及主键字段的排列顺序。需要判断待归档数据的初始数据结构与归档表的数据结构是否一致,若不一致,需要将待归档数据由初始数据结构调整为归档数据结构,所述归档数据结构即为归档表的数据结构,使待归档数据的数据结构与归档表的数据结构一致,同时对待归档数据的初始数据结构进行登记。
下面以归档表为Hive表说明源系统数据的分区存储及数据的物理存储信息的生成。源系统数据归档到Hive表中。归档到Hive中的数据,都采用同一种存储方式,即Hive表增加hds___datamode、hds___sdate、hds___edate三个分区字段,其中hds___datamode字段对应四大数据类型,即增量数据、减量数据、全量数据、初始量数据;hds___sdate和hds___edate对应存储日期范围,日期分区方式包括:按日分区、按月分区、按季分区、按半年分区、按年分区。数据分区存储便于查找。
这里以增量减量数据按月分区、全量数据按日分区来描述。每日主档增量数据归档存储在当月的增量数据分区中,并且为每条主档数据强制增加字段“hds___date”,标记该条记录的归档日期。若主档表当日还有全量数据,则全量数据归档存储在当日的全量数据分区中,并且为每条主档数据强制增加字段“hds___date”,标记该条记录的归档日期。若主档表当日还有减量数据,则减量数据归档存储在当月的减量数据分区中,并且为每条主档数据强制增加字段“hds___date”,标记该条记录的归档日期。形成数据的物理存储信息,如表1所示。
表1数据的物理存储信息
按以上方式存储后,可能会产生很多小文件,因此需要找出同一个分区内单个文件小于某一数值比如256M的归档数据文件,合并为一个文件。归档文件名采用随机字符串命名方式,由于数据访问通过Hive外部表形式进行,随机字符串命名不会影响数据访问。
待归档数据(源系统数据)在接入到归档区时,会伴随着传送DDL(DataDefinition Language数据库模式定义语言)文件,即源系统数据结构文件,DDL文件中记录了待归档数据的初始结构信息,包括待归档数据在归档日期的全部主键字段和全部主键字段之间的排列顺序,即全部主键字段对应的栏位信息。待归档数据的DDL文件通过解析后,需要与归档表的DDL文件进行比较,归档表的DDL文件记录了归档表的数据结构信息,包括主键字段及主键字段之间的排列顺序,即主键字段对应的栏位信息。归档表的数据结构信息可以根据需求预先定义。判断待归档数据的DDL文件与归档表的DDL文件是否一致,若一致,则不需要登记DDL文件信息,并直接将待归档数据归档到归档表;若不一致,需要登记待归档数据的DDL文件信息,同时调整待归档数据,使待归档数据的数据结构与归档表的数据结构一致,并将调整后的待归档数据归档入归档表。具体如下:
(1)与归档表的数据结构相比,若待归档数据缺少第三主键字段,则修改待归档数据,在所述第三主键字段所在的栏位上增加空占位;将除所述第三主键字段之外的其他主键字段调整至栏位信息与所述归档表的主键字段的栏位信息一致。
(2)与归档表的数据结构相比,若待归档数据多第四主键字段,即待归档数据有第四主键字段,归档表无第四主键字段,则修改待归档数据将所述第四主键字段的数据移到最后,并将所述第四主键字段添加到归档表的最后,将除所述第四主键字段之外的其他主键字段调整至栏位信息与所述归档表的主键字段的栏位信息一致。
(3)与归档表的数据结构相比,若待归档数据的主键字段排列顺序不同,修改待归档数据按归档表主键字段位置做重新排列。若归档表的数据结构的主键字段的排列顺序不同,则将所述待归档数据重新排序,使所述待归档数据的栏位信息与所述归档表的主键字段的栏位信息一致。
上述数据转换工作在归档预处理区进行,待归档数据经过转换后,使得待归档数据的主键字段个数、顺序和类型调整为与归档表一致。
待归档数据归档到归档表时,统一按照归档表的数据结构排列,不同归档日期的主键字段数据在同一列,更加清晰,并且便于数据的统计和处理。
在同一归档日期的源系统数据的不同数据类型的数据结构是相同的,均包括当前归档日期的全部主键字段及全部主键字段的排列顺序。比如在所述截面日期的源系统数据可能为增量数据、减量数据、初始量数据或全量数据,不同数据类型的数据结构是相同的,即所述截面日期的增量数据或减量数据的数据结构包括与截面日期的全量数据或初始量数据相同的全部主键字段及全部主键字段的排列顺序。区别在于全量数据及初始量数据包括全部主键字段对应的数据,而增量数据或减量数据包括部分主键字段所对应的数据。
S202:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;
S203:获取归档日期在所述起始日期和所述截面日期之间的归档数据;
S204:按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
图3是根据本发明实施例的一种获取截面日期全量数据的方法的主要步骤的示意图,如图3所示,本发明实施例中的获取截面日期全量数据的方法主要包括如下的步骤S301至步骤S304:
S301:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;
S302:获取归档日期在所述起始日期和所述截面日期之间的归档数据;
S303:检查在所述起始日期和所述截面日期之间的归档数据的归档日期是否为连续日期。
S304:按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
如果所述起始日期和所述截面日期之间的归档数据的归档日期不是连续日期,可以发出告警,比如抛出异常。对以上各个步骤的顺序不作限定,如S303步骤可以在S302步骤之前。
图4是根据本发明实施例的一种获取截面日期全量数据的装置的示意图,如图4所示,本发明实施例中的获取截面日期全量数据的装置主要包括以下模块:起始日期确定模块401,用于确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;归档数据获取模块402,用于获取归档日期在所述起始日期和所述截面日期之间的归档数据;截面日期全量数据获取模块403,用于按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
图5是根据本发明实施例的一种获取截面日期全量数据的装置的示意图,如图5所示,本发明实施例中的获取截面日期全量数据的装置主要包括以下模块:起始日期确定模块501,用于确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;归档数据获取模块502,用于获取归档日期在所述起始日期和所述截面日期之间的归档数据;截面日期全量数据获取模块503,用于按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据;数据检查模块504,用于检查在所述起始日期和所述截面日期之间的归档数据的归档日期是否为连续日期。
图6示出了可以应用本发明实施例的一种获取截面日期全量数据的方法或一种获取截面日期全量数据的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务端605。网络604用以在终端设备601、602、603和服务端605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务端605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务端605可以是提供各种服务的服务端,例如对用户利用终端设备601、602、603所获取的图片或信息提供支持的后台管理服务端。后台管理服务端可以对接收到的截面日期等数据进行分析等处理,并将截面日期全量数据等处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的一种获取截面日期全量数据的方法一般由终端设备或服务端执行,相应地,一种获取截面日期全量数据的装置一般设置于终端设备或服务端中。
应该理解,图6中的终端设备、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务端。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括:起始日期确定模块、归档数据获取模块、截面日期全量数据获取模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,归档数据获取模块还可以被描述为“用于获取归档日期在所述起始日期和所述截面日期之间的归档数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;获取归档日期在所述起始日期和所述截面日期之间的归档数据;按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
根据本发明实施例的技术方案,全量数据通过计算获取,不需要为每个时间点保存一份全量数据,节省了存储空间;通过选择距距所述截面日期最近的全量数据的归档日期作为计算截面日期全量数据的起始日期,确定了一个尽量小的截面数据计算范围,提高数据查询和计算的效率;截面日期全量数据按照截面日期的数据结构形式排列,数据结构更新,便于清晰直观的了解截面日期的全量数据。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (15)
1.一种获取截面日期全量数据的方法,其特征在于,包括:
确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;
获取归档日期在所述起始日期和所述截面日期之间的归档数据;
按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
2.根据权利要求1所述的方法,其特征在于,在所述得到截面日期的全量数据之前,还包括:检查在所述起始日期和所述截面日期之间的归档数据的归档日期是否为连续日期。
3.根据权利要求1所述的方法,其特征在于,在所述确定计算截面日期全量数据的起始日期之前,还包括如下步骤:待归档数据在归档到归档表时,判断所述待归档数据的初始数据结构与所述归档表的数据结构是否一致,若不一致,调整所述待归档数据,使所述待归档数据的数据结构与所述归档表的数据结构一致,同时对所述待归档数据的初始数据结构进行登记。
4.根据权利要求1所述的方法,其特征在于,所述归档日期在所述起始日期和所述截面日期之间的归档数据为增量数据或减量数据。
5.根据权利要求4所述的方法,其特征在于,所述归档日期在所述起始日期和所述截面日期之间的归档数据为减量数据,减量数据所对应的主键字段不再校验。
6.根据权利要求1所述的方法,其特征在于,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致,若不一致,则调整归档日期在所述起始日期和所述截面日期之间的归档数据,使其与所述截面日期的归档数据的初始数据结构一致。
7.根据权利要求6所述的方法,其特征在于,判断归档日期在所述起始日期和所述截面日期之间的归档数据的数据结构是否与所述截面日期的归档数据的初始数据结构一致的方法为:判断所述归档表的数据结构与所述截面日期的归档数据的初始数据结构是否一致。
8.根据权利要求7所述的方法,其特征在于,判断所述归档表的数据结构与所述截面日期的归档数据的初始数据结构是否一致的方法为:比较所述归档表的数据结构的主键字段及主键字段之间的排列顺序是否分别与所述截面日期的归档数据的初始数据结构的主键字段及主键字段之间的排列顺序一致,所述主键字段值之间的排列顺序即为主键字段值的栏位信息。
9.根据权利要求8所述的方法,其特征在于,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构缺少第一主键字段,则在所述第一主键字段所在的栏位上增加空占位,将除所述第一主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
10.根据权利要求8所述的方法,其特征在于,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若所述归档表的数据结构多第二主键字段,则将所述第二主键字段所对应的数据删除或移到最后,将除所述第二主键字段之外的其他主键字段调整至栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
11.根据权利要求8所述的方法,其特征在于,所述归档表的数据结构与所述截面日期归档数据的初始数据结构相比,若归档表的数据结构的主键字段的排列顺序不同,则将所述起始日期和所述截面日期之间的归档数据重新排序,使所述起始日期和所述截面日期之间的归档数据的栏位信息与所述截面日期归档数据的初始数据结构的主键字段的栏位信息一致。
12.一种获取截面日期全量数据的装置,其特征在于,包括:
起始日期确定模块,用于确定用于计算截面日期全量数据的起始日期,所述起始日期为小于所述截面日期并且距所述截面日期最近的全量数据的归档日期;
归档数据获取模块,用于获取归档日期在所述起始日期和所述截面日期之间的归档数据;
截面日期全量数据获取模块,用于按照截面日期的归档数据的初始数据结构,基于起始日期的全量数据,从归档日期在所述起始日期和所述截面日期之间的归档数据中获取各个主键字段的最新数据,得到截面日期的全量数据。
13.根据权利要求12所述的获取截面日期全量数据的装置,其特征在于,还包括:数据检查模块,用于检查在所述起始日期和所述截面日期之间的归档数据的归档日期是否为连续日期。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-11中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010102603.8A CN111400304A (zh) | 2020-02-19 | 2020-02-19 | 一种获取截面日期全量数据的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010102603.8A CN111400304A (zh) | 2020-02-19 | 2020-02-19 | 一种获取截面日期全量数据的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111400304A true CN111400304A (zh) | 2020-07-10 |
Family
ID=71432661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010102603.8A Pending CN111400304A (zh) | 2020-02-19 | 2020-02-19 | 一种获取截面日期全量数据的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400304A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148711A (zh) * | 2020-09-21 | 2020-12-29 | 建信金融科技有限责任公司 | 一种批处理任务的处理方法和装置 |
CN113127448A (zh) * | 2021-04-23 | 2021-07-16 | 深圳市酷开网络科技股份有限公司 | 一种地域维度表生成方法、装置、服务器及存储介质 |
CN113535481A (zh) * | 2021-07-20 | 2021-10-22 | 北京京东振世信息技术有限公司 | 数据的回溯方法、装置和非易失性计算机可读存储介质 |
CN113704268A (zh) * | 2021-09-02 | 2021-11-26 | 中国农业银行股份有限公司 | 一种数据处理方法、装置、存储介质和设备 |
CN116719971A (zh) * | 2023-05-08 | 2023-09-08 | 中银金融科技有限公司 | 拉链表数据加载方法、装置和电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149796A1 (en) * | 2005-01-04 | 2006-07-06 | Jan Aalmink | Archiving engine |
CN105447172A (zh) * | 2015-12-07 | 2016-03-30 | 北京先进数通信息技术股份公司 | 一种Hadoop平台下的数据处理方法和系统 |
CN105468728A (zh) * | 2015-11-20 | 2016-04-06 | 北京先进数通信息技术股份公司 | 一种获取截面数据的方法和系统 |
CN108365971A (zh) * | 2018-01-10 | 2018-08-03 | 深圳市金立通信设备有限公司 | 日志解析方法、设备及计算机可读介质 |
CN108804708A (zh) * | 2018-06-22 | 2018-11-13 | 平安科技(深圳)有限公司 | 业务数据表归档修正方法、装置、计算机设备和存储介质 |
US20190095479A1 (en) * | 2017-09-26 | 2019-03-28 | Fujitsu Limited | Information processing apparatus and information processing system |
CN109684270A (zh) * | 2018-12-11 | 2019-04-26 | 泰康保险集团股份有限公司 | 数据库归档方法、装置、系统、设备及可读存储介质 |
CN109726174A (zh) * | 2018-12-28 | 2019-05-07 | 江苏满运软件科技有限公司 | 数据归档方法、系统、设备以及存储介质 |
CN110737630A (zh) * | 2019-09-04 | 2020-01-31 | 平安科技(深圳)有限公司 | 电子归档文件的处理方法、装置、计算机设备及存储介质 |
-
2020
- 2020-02-19 CN CN202010102603.8A patent/CN111400304A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149796A1 (en) * | 2005-01-04 | 2006-07-06 | Jan Aalmink | Archiving engine |
CN105468728A (zh) * | 2015-11-20 | 2016-04-06 | 北京先进数通信息技术股份公司 | 一种获取截面数据的方法和系统 |
CN105447172A (zh) * | 2015-12-07 | 2016-03-30 | 北京先进数通信息技术股份公司 | 一种Hadoop平台下的数据处理方法和系统 |
US20190095479A1 (en) * | 2017-09-26 | 2019-03-28 | Fujitsu Limited | Information processing apparatus and information processing system |
CN108365971A (zh) * | 2018-01-10 | 2018-08-03 | 深圳市金立通信设备有限公司 | 日志解析方法、设备及计算机可读介质 |
CN108804708A (zh) * | 2018-06-22 | 2018-11-13 | 平安科技(深圳)有限公司 | 业务数据表归档修正方法、装置、计算机设备和存储介质 |
CN109684270A (zh) * | 2018-12-11 | 2019-04-26 | 泰康保险集团股份有限公司 | 数据库归档方法、装置、系统、设备及可读存储介质 |
CN109726174A (zh) * | 2018-12-28 | 2019-05-07 | 江苏满运软件科技有限公司 | 数据归档方法、系统、设备以及存储介质 |
CN110737630A (zh) * | 2019-09-04 | 2020-01-31 | 平安科技(深圳)有限公司 | 电子归档文件的处理方法、装置、计算机设备及存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148711A (zh) * | 2020-09-21 | 2020-12-29 | 建信金融科技有限责任公司 | 一种批处理任务的处理方法和装置 |
CN112148711B (zh) * | 2020-09-21 | 2023-04-25 | 建信金融科技有限责任公司 | 一种批处理任务的处理方法和装置 |
CN113127448A (zh) * | 2021-04-23 | 2021-07-16 | 深圳市酷开网络科技股份有限公司 | 一种地域维度表生成方法、装置、服务器及存储介质 |
CN113535481A (zh) * | 2021-07-20 | 2021-10-22 | 北京京东振世信息技术有限公司 | 数据的回溯方法、装置和非易失性计算机可读存储介质 |
CN113535481B (zh) * | 2021-07-20 | 2024-05-17 | 北京京东振世信息技术有限公司 | 数据的回溯方法、装置和非易失性计算机可读存储介质 |
CN113704268A (zh) * | 2021-09-02 | 2021-11-26 | 中国农业银行股份有限公司 | 一种数据处理方法、装置、存储介质和设备 |
CN113704268B (zh) * | 2021-09-02 | 2023-12-08 | 中国农业银行股份有限公司 | 一种数据处理方法、装置、存储介质和设备 |
CN116719971A (zh) * | 2023-05-08 | 2023-09-08 | 中银金融科技有限公司 | 拉链表数据加载方法、装置和电子设备 |
CN116719971B (zh) * | 2023-05-08 | 2024-04-09 | 中银金融科技有限公司 | 拉链表数据加载方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400304A (zh) | 一种获取截面日期全量数据的方法、装置、电子设备及存储介质 | |
CN107704202B (zh) | 一种数据快速读写的方法和装置 | |
CN109614402B (zh) | 多维数据查询方法和装置 | |
CN110019367B (zh) | 一种统计数据特征的方法和装置 | |
CN112597126B (zh) | 一种数据迁移方法和装置 | |
CN110689268B (zh) | 一种提取指标的方法和装置 | |
CN112835904A (zh) | 一种数据处理方法和数据处理装置 | |
CN112783887A (zh) | 一种基于数据仓库的数据处理方法及装置 | |
CN112100168A (zh) | 一种确定数据关联关系的方法和装置 | |
CN111753019A (zh) | 一种应用于数据仓库的数据分区方法和装置 | |
CN112579673A (zh) | 一种多源数据处理方法及装置 | |
CN118210811A (zh) | 一种业务处理方法、装置、电子设备及计算机可读介质 | |
CN113760600B (zh) | 一种数据库备份方法、数据库还原方法和相关装置 | |
CN112783914B (zh) | 优化语句的方法和装置 | |
CN113704242B (zh) | 一种数据处理方法和装置 | |
CN113722007A (zh) | Vpn分支设备的配置方法、装置及系统 | |
CN113448957A (zh) | 一种数据查询方法和装置 | |
CN112948334A (zh) | 日志处理方法和装置 | |
CN112711572A (zh) | 适用于分库分表的在线扩容方法和装置 | |
CN113495891A (zh) | 一种数据处理方法和装置 | |
CN111290927A (zh) | 一种数据监控方法和装置 | |
CN111695059A (zh) | 一种信息视图列表处理方法、装置和显示设备 | |
CN113760965B (zh) | 数据查询的方法和装置 | |
CN113778318B (zh) | 一种数据存储方法和装置 | |
CN112115165B (zh) | 一种数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220923 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right |