CN113254442A

CN113254442A - 一种用于出行行业的分库分表方法

Info

Publication number: CN113254442A
Application number: CN202110556650.4A
Authority: CN
Inventors: 牛京; 郑晕
Original assignee: Shouyue Technology Beijing Co Ltd
Current assignee: Shouyue Technology Beijing Co Ltd
Priority date: 2021-05-21
Filing date: 2021-05-21
Publication date: 2021-08-13

Abstract

本发明公开了一种用于出行行业的分库分表方法，包括以下步骤：数据存储：创建若干个独立的MySQL库，根据订单数据特征分类存储；数据访问：非订单号查询转为订单号查询；将订单号查询分为单个订单号查询和批量订单号查询，本发明适用于存储技术领域，通过将将订单数据分为归档数据、热点数据及历史数据，分别存储于归档库、线上库及历史库内，使得相同硬件成本，更大程度地保证数据高效存储及访问，存储相同数据量订单，更大程度地节省存储空间，增加数据存储的灵活性和存储空间的利用率，减少硬件资源的浪费，根据数据特征，在保证访问效率的情况下，选择成本较低的硬件存储，降低数据访问的操作难度，提高数据访问效率，实现高效硬件资源利用和数据快速访问的效果。

Description

一种用于出行行业的分库分表方法

技术领域

本发明属于存储技术领域，具体是一种用于出行行业的分库分表方法。

背景技术

分库分表就是为了解决由于数据量过大而导致数据库性能降低的问题,将原来独立的数据库拆分成若干数据库组成,将数据大表拆分成若干数据表组成,使得单一数据库、单一数据表的数据量变小,从而达到提升数据库性能的目的。

随着业务的发展，业务数据量越来越大，原有单表数据存储不能满足业务快速发展的需求，需要将数据合理分散存储，以高效访问，降低系统延迟，业界传统的分库分表一般是严格按照时间或者用户等维度切分，灵活性和资源利用率上略显欠缺，其中，严格按照用户维度切分，需要司机冗余表、需要更多硬件资源，严格按照时间维度切分，批量订单查询场景查询复杂度高，需要扫描很多数据表。

发明内容

本发明的目的在于克服现有技术的缺陷，提供一种用于出行行业的分库分表方法。

为实现上述目的，本发明采用了如下技术方案：

一种用于出行行业的分库分表方法，包括以下步骤：

数据存储：

创建若干个独立的MySQL库，根据订单数据特征分类存储；

数据访问：

非订单号查询转为订单号查询；

将订单号查询分为单个订单号查询和批量订单号查询。

优选的，所述MySQL库数目为三个，包括归档库、线上库及历史库。

优选的，所述根据订单数据特征分类存储，包括：将订单数据分为归档数据、热点数据及历史数据，分别存储于归档库、线上库及历史库内；

所述归档数据为未派到司机且无后续访问的订单数据；

所述热点数据为近一个月的订单数据；

所述历史数据为超过一个月的订单数据。

优选的，所述非订单号查询转为订单号查询，包括：基于司机ID或者乘客ID，到ElasticSearch查询符合条件的订单号，转为订单号查询。

优选的，所述单个订单号查询，包括：对于热点数据，直接查询线上库，对于历史数据，先根据ElasticSearch定位分表，再到历史库查询数据，然后将查询结果返回。

优选的，所述批量订单号查询，包括以下步骤：

将批量订单号按月份分类，对于热点数据，直接查询线上表，对于历史数据，根据月份到历史库查询对应表，然后将查询结果合并返回。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

本发明通过将将订单数据分为归档数据、热点数据及历史数据，分别存储于归档库、线上库及历史库内，使得相同硬件成本，更大程度地保证数据高效存储及访问，存储相同数据量订单，更大程度地节省存储空间，增加了数据存储的灵活性和存储空间的利用率，减少了硬件资源的浪费，根据数据特征，在保证访问效率的情况下，选择成本较低的硬件存储，降低了数据访问的操作难度，提高了数据访问效率，实现高效硬件资源利用和数据快速访问的效果。

附图说明

图1是本发明一种用于出行行业的分库分表方法的数据存储流程图；

图2是本发明一种用于出行行业的分库分表方法中数据访问流程图。

具体实施方式

以下结合附图1-2，进一步说明本发明一种用于出行行业的分库分表方法的具体实施方式。本发明一种用于出行行业的分库分表方法不限于以下实施例的描述。

实施例：

本实施例给出一种用于出行行业的分库分表方法的具体结构，如图1-2所示，包括以下步骤：

数据存储：

创建若干个独立的MySQL库，根据订单数据特征分类存储；

数据访问：

非订单号查询转为订单号查询；

将订单号查询分为单个订单号查询和批量订单号查询。

具体地，MySQL库数目为三个，包括归档库、线上库及历史库。

具体地，根据订单数据特征分类存储，包括：将订单数据分为归档数据、热点数据及历史数据，分别存储于归档库、线上库及历史库内；

归档数据为未派到司机且无后续访问的订单数据；

热点数据为近一个月的订单数据；

历史数据为超过一个月的订单数据。

具体地，非订单号查询转为订单号查询，包括：基于司机ID或者乘客ID，到ElasticSearch查询符合条件的订单号，转为订单号查询。

进一步的，单个订单号查询，包括：对于热点数据，直接查询线上库，对于历史数据，先根据ElasticSearch定位分表，再到历史库查询数据，然后将查询结果返回。

进一步的，批量订单号查询，包括以下步骤：

工作原理：

如图1所示，未派到司机且无后续访问的订单数据，记为归档数据，每天晚上业务低峰期定时归档到归档库内；

派到司机的订单数据中，近一个月的订单数据，记为热点数据，存储于线上库内，保证99.5％的业务高效访问，可以使用CPU、内存配置较高的机器，由于时间周期短，数据量在100G左右，可以用比较小的成本实现高效访问；

超过一个月的订单数据，记为历史数据，存储于历史库内，这部分数据依照传统方案分表，按月份切分,每个月一张独立的数据表，根据司机或乘客ID查询时，需要扫描全部分表；加入使用ElasticSearch存储部分关键字段配合，特点为大量存储，高效搜索，先用ElasticSearch查询索引字段查询用户或自己满足条件的订单号，定位分表，可以避免扫描全部分表，用以解决用户维度和司机维度的查询效率问题。

如图2所示，单个订单号的查询，热点数据直接查询线上库，否则，先根据ElasticSearch定位分表，再到冷库查询数据，然后将查询结果返回；

批量订单号查询，先按月份分批，若都是一个月内的热点数据，直接查询线上表，否则根据月份到历史库查询对应表，然后将查询结果合并返回根据司机ID或者乘客ID查询，先到ElasticSearch查询符合条件的订单号，然后转为按订单号查询。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种用于出行行业的分库分表方法，其特征在于，包括以下步骤：

数据存储：

创建若干个独立的MySQL库，根据订单数据特征分类存储；

数据访问：

非订单号查询转为订单号查询；

将订单号查询分为单个订单号查询和批量订单号查询。

2.如权利要求1所述的一种用于出行行业的分库分表方法，其特征在于，所述MySQL库数目为三个，包括归档库、线上库及历史库。

3.如权利要求2所述的一种用于出行行业的分库分表方法，其特征在于，所述根据订单数据特征分类存储，包括：将订单数据分为归档数据、热点数据及历史数据，分别存储于归档库、线上库及历史库内；

所述归档数据为未派到司机且无后续访问的订单数据；

所述热点数据为近一个月的订单数据；

所述历史数据为超过一个月的订单数据。

4.如权利要求3所述的一种用于出行行业的分库分表方法，其特征在于，所述非订单号查询转为订单号查询，包括：基于司机ID或者乘客ID，到ElasticSearch查询符合条件的订单号，转为订单号查询。

5.如权利要求4所述的一种用于出行行业的分库分表方法，其特征在于，所述单个订单号查询，包括：对于热点数据，直接查询线上库，对于历史数据，先根据ElasticSearch定位分表，再到历史库查询数据，然后将查询结果返回。

6.如权利要求4所述的一种用于出行行业的分库分表方法，其特征在于，所述批量订单号查询，包括以下步骤：