CN113220802A

CN113220802A - 一种关系型数据库下大数据量的数据处理方法及系统

Info

Publication number: CN113220802A
Application number: CN202110593543.9A
Authority: CN
Inventors: 段宏刚
Original assignee: Shandong Yingxin Computer Technology Co Ltd
Current assignee: Shandong Yingxin Computer Technology Co Ltd
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-08-06

Abstract

本发明属于大数据量的数据处理技术领域,具体涉及一种关系型数据库下大数据量的数据处理方法及系统，所述的方法包括以下步骤：S 1：切割数据库为工单表、业务表、历史表三个表；S2：业务表根据业务量设置评估规则,并按机器ID或用户ID尾号取模分表；S3：设置定时任务,工单表和业务表根据设定好的时间对工单表及业务表数据切割流入历史表；S4：定期将历史表数据落文件增量备份存储。本发明提高了关系型数据库下大数据量处理效率，通过工单进行数据更新流转，完成业务和底层数据处理的解耦。

Description

一种关系型数据库下大数据量的数据处理方法及系统

技术领域

本发明属于大数据量的数据处理技术领域，具体涉及一种关系型数据库下大数据量的数据处理方法及系统。

背景技术

目前，现有的数据存储模型已经无法满足生产日常业务处理及维护的便利性，数据表规划不合理、冗余历史数据及无效数据过多导致业务处理达到瓶颈，因此，有必要对数据存储架构进行升级，而关系型数据库的事务带来的一致性、丰富的数据库语言又是日常业务处理不可或缺的。此为现有技术存在的缺陷。

有鉴于此，本发明给出一种关系型数据库下大数据量的数据处理方法及系统的技术方案；以解决现有技术中存在的缺陷和问题。

发明内容

针对现有技术中存在的现有的数据存储模型已经无法满足生产日常业务处理及维护的便利性，数据表规划不合理、冗余历史数据及无效数据过多导致业务处理达到瓶颈的问题；本发明提供一种关系型数据库下大数据量的数据处理方法及系统，以解决上述技术问题。

为实现上述目的，本发明给出以下技术方案：

第一方面，本发明提供一种关系型数据库下大数据量的数据处理方法，包括以下步骤：

S1：切割数据库为工单表、业务表、历史表三个表；

S2：业务表根据业务量设置评估规则,并按机器ID或用户ID尾号取模分表；

S3：设置定时任务,工单表和业务表根据设定好的时间对工单表及业务表数据切割流入历史表；

S4：定期将历史表数据落文件增量备份存储。

作为优选，所述步骤S1中，所述的工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order，所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引；

业务表中，当业务新增或更新时生成新工单，上发生成的新工单表，程序轮询根据工单标志位对业务表进行数据操纵语言操作；

历史表按统一的历史表命名规则，只需在当前表后面加后缀_his，具体分为工单历史表和业务历史表两类。

作为优选，所述步骤S2中，所述的评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表。

该步骤的效果是：根据判断业务量大小与设定阈值的关系，并进一步按照机器ID或用户ID取模分表，合理取模分表，提高大数据量的数据处理效率。

作为优选，所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词用于对外提供查询服务，当新增业务表或用户表时只需更新查询视图或同义词，避免业务程序代码的变更；所述的配置表数据规模较小及变更频率较低，毋须做特殊规划。

作为优选，所述步骤S3中，执行所述的定时任务,对工单表按设定好的时间将历史数据转移进历史表形成工单历史表,对业务表按设定好的时间将历史数据转移进历史表形成业务历史表，通过将定时任务部署在业务量较低的时间段，避开业务量较高的高峰期，减轻服务器压力。

第二方面，本发明提供一种关系型数据库下大数据量的数据处理系统，包括：

切割数据库模块：切割数据库为工单表、业务表、历史表三个表；

取模分表模块：业务表根据业务量设置评估规则,并按机器ID或用户ID尾号取模分表；

历史数据转移模块：设置定时任务,工单表和业务表根据设定好的时间对工单表及业务表数据切割流入历史表；

定期备份存储模块：定期将历史表数据落文件增量备份存储。

作为优选，所述的切割数据库模块中，工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order，所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引；

作为优选，所述的取模分表模块中，评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表；根据判断业务量大小与设定阈值的关系，并进一步按照机器ID或用户ID取模分表，合理取模分表，提高大数据量的数据处理效率，所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词，所述的视图或同义词用于对外提供查询服务，当新增业务表或用户表时只需更新查询视图或同义词，避免业务程序代码的变更；所述的配置表数据规模较小、变更频率较低，毋须做特殊规划。

作为优选，所述的历史数据转移模块中，执行所述的定时任务,对工单表按设定好的时间将历史数据转移进历史表形成工单历史表,对业务表按设定好的时间将历史数据转移进历史表形成业务历史表，通过将定时任务部署在业务量较低的时间段，避开业务量较高的高峰期，减轻服务器压力。

本发明的有益效果在于，本发明提供了一种关系型数据库下大数据量的数据处理方法及系统，通过工单表、业务表、历史表进行解耦，避免因为小的问题进行代码的大改动，存储架构确定，实现灵活，避免了单一代码的实现约束。通过定期将业务表数据表的历史数据转移至历史表，保障了业务处理的准确高效。此外，本发明设计原理可靠，结构简单，具有非常广泛的应用前景。

由此可见，本发明与现有技术相比，具有突出的实质性特点和显著的进步，其实施的有益效果也是显而易见的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例1提供的一种关系型数据库下大数据量的数据处理方法流程图。

图2是本发明实施例2提供的一种关系型数据库下大数据量的数据处理系统原理框图。

其中，1-切割数据库模块，2-取模分表模块，3-历史数据转移模块，4-定期备份存储模块。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例1：

如图1所示，本实施例提供一种关系型数据库下大数据量的数据处理方法，包括以下步骤：

S1：切割数据库为工单表、业务表、历史表三个表；

所述步骤S1中，所述的工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order，所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引，提高工单流转效率；

所述步骤S2中，评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表。根据判断业务量大小与设定阈值的关系，并进一步按照机器ID或用户ID取模分表，合理取模分表，提高大数据量的数据处理效率。

所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词用于对外提供查询服务，当新增业务表或用户表时只需更新查询视图或同义词，避免业务程序代码的变更；所述的配置表数据规模较小及变更频率较低，毋须做特殊规划。

S3：设置定时任务,工单表和业务表根据设定好的时间对工单表及业务表数据切割流入历史表，定时任务有shell脚本通过sqlplus调用实现，定时任务可部署至crontab；

所述步骤S3中，执行所述的定时任务为对工单表按设定好的时间将历史数据转移进历史表形成工单历史表,对业务表按设定好的时间将历史数据转移进历史表形成业务历史表，通过将定时任务部署在业务量较低的时间段，避开业务量较高的高峰期，减轻服务器压力。

S4：定期将历史表数据落文件增量备份存储，将历史表数据落文件具体是将历史表数据按照规则导出成文件，并将文件存储在磁盘上，历史表数据落文件由Oracle数据库下的exp及sqlloader均能实现。

实施例2：

如图2所示，本实施例提供一种关系型数据库下大数据量的数据处理系统，包括：

切割数据库模块1：切割数据库为工单表、业务表、历史表三个表；

所述的切割数据库模块1中，工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order，

所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引，提高工单流转效率；

取模分表模块2：业务表根据业务量设置评估规则,并按机器ID或用户ID尾号取模分表。

所述的取模分表模块2中，评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表；根据判断业务量大小与设定阈值的关系，并进一步按照机器ID或用户ID取模分表，合理取模分表，提高大数据量的数据处理效率，所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词，所述的视图或同义词用于对外提供查询服务，当新增业务表或用户表时只需更新查询视图或同义词，避免业务程序代码的变更；所述的配置表数据规模较小、变更频率较低，毋须做特殊规划。

历史数据转移模块3：设置定时任务,工单表和业务表根据设定好的时间对工单表及业务表数据切割流入历史表，定时任务有shell脚本通过sqlplus调用实现，定时任务可部署至crontab；

所述的历史数据转移模块3中，执行所述的定时任务,对工单表按设定好的时间将历史数据转移进历史表形成工单历史表，对业务表按设定好的时间将历史数据转移进历史表形成业务历史表，通过将定时任务部署在业务量较低的时间段，避开业务量较高的高峰期，减轻服务器压力。

定期备份存储模块4：定期将历史表数据落文件增量备份存储，将历史表数据落文件具体是将历史表数据按照规则导出成文件，并将文件存储在磁盘上，历史表数据落文件由Oracle数据库下的exp及sqlloader均能实现。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述，但本发明并不限于此。在不脱离本发明的精神和实质的前提下，本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换，而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种关系型数据库下大数据量的数据处理方法，其特征在于，包括以下步骤：

S1：切割数据库为工单表、业务表、历史表三个表；

S4：定期将历史表数据落文件增量备份存储。

2.根据权利要求1所述的一种关系型数据库下大数据量的数据处理方法，其特征在于，所述步骤S1中，所述的工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order，所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引；

3.根据权利要求2所述的一种关系型数据库下大数据量的数据处理方法，其特征在于，所述步骤S2中，所述的评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表。

4.根据权利要求3所述的一种关系型数据库下大数据量的数据处理方法，其特征在于，所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词用于对外提供查询服务。

5.根据权利要求4所述的一种关系型数据库下大数据量的数据处理方法，其特征在于，所述步骤S3中，执行所述的定时任务,对工单表按设定好的时间将历史数据转移进历史表形成工单历史表,对业务表按设定好的时间将历史数据转移进历史表形成业务历史表。

6.一种关系型数据库下大数据量的数据处理系统，其特征在于，包括：

7.根据权利要求6所述的一种关系型数据库下大数据量的数据处理系统，其特征在于，所述的切割数据库模块中，工单表遵循统一的工单表命名规则，在业务表、用户表后面加后缀_order；

所述的工单表按业务表规模进行分表，分表逻辑与用户表一致，根据业务ID及日期创建单列索引或组合索引；

8.根据权利要求7所述的一种关系型数据库下大数据量的数据处理系统，其特征在于，所述的取模分表模块中，所述的评估规则为设置业务量阈值，当业务量低于设定阈值，按机器ID或用户ID尾号取模分为业务表、配置表，当业务量超过设定阈值，按机器ID或用户ID尾号取模分为用户表、业务表、配置表；所述的用户表根据业务ID及日期创建单列索引或组合索引，同时创建视图或同义词。

9.根据权利要求8所述的一种关系型数据库下大数据量的数据处理系统，其特征在于，所述的历史数据转移模块中，执行所述的定时任务,对工单表按设定好的时间将历史数据转移进历史表形成工单历史表，对业务表按设定好的时间将历史数据转移进历史表形成业务历史表。