CN114238333A - 数据拆分方法、装置以及设备 - Google Patents

数据拆分方法、装置以及设备 Download PDF

Info

Publication number
CN114238333A
CN114238333A CN202111556759.4A CN202111556759A CN114238333A CN 114238333 A CN114238333 A CN 114238333A CN 202111556759 A CN202111556759 A CN 202111556759A CN 114238333 A CN114238333 A CN 114238333A
Authority
CN
China
Prior art keywords
data
splitting
data splitting
predetermined number
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111556759.4A
Other languages
English (en)
Inventor
朱峰
黎育龙
邓辉
薛亮
王飞龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Postal Savings Bank of China Ltd
Original Assignee
Postal Savings Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Postal Savings Bank of China Ltd filed Critical Postal Savings Bank of China Ltd
Priority to CN202111556759.4A priority Critical patent/CN114238333A/zh
Publication of CN114238333A publication Critical patent/CN114238333A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/24569Query processing with adaptation to specific hardware, e.g. adapted for using GPUs or SSDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据拆分方法、装置以及设备。其中,该方法包括:获取目标数据的与分片器一一对应的数据拆分策略;根据数据拆分策略控制分片器对目标数据进行拆分。本发明通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。

Description

数据拆分方法、装置以及设备
技术领域
本发明涉及金融业务系统技术领域,具体而言,涉及一种数据拆分方法、装置、设备、计算机可读存储介质以及处理器。
背景技术
商业银行核心系统的批处理程序处理的数据量规模通常较大,一个批次的数据量可达百万级别,使用单一线程处理规模如此庞大的数据在处理效率上是不能接受的,为了提升处理效率,通常会对数据进行拆分,将一个批次的数据拆分成多个分片,每个分片承载一部分数据,批处理程序并行地处理这些分片。
数据拆分可以显著提升批处理任务的执行效率,但分片并不是越多越好,分片越多意味着处理线程越多,需消耗的内存、CPU、数据库连接等资源就越多,如果不能合理控制分片数量,随着并行执行的分片数量的不断增加,系统负载也会不断增加,最终可能导致系统崩溃等得不偿失的严重问题。因而如何合理的进行数据拆分就显得尤为重要。现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据拆分方法、数据拆分装置、数据拆分设备、计算机可读存储介质以及处理器,至少解决现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
根据本发明实施例的一个方面,提供了一种数据拆分方法,包括:获取目标数据的数据拆分策略,其中,所述数据拆分策略与分片器一一对应;根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理。
可选地,在获取目标数据的数据拆分策略之前,还包括:确定数据拆分策略,其中,所述数据拆分策略包括以下至少之一:分库分表型、多库单表型以及单库单表型。
可选地,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:在所述数据拆分策略为所述分库分表型时,则所述分片器根据所述分库分表型按照所述数据单元、所述数据库、物理表以及所述数据区域的层次进行所述目标数据的拆分,其中,所述分库分表型包括第一预定数量的所述数据单元,每个所述数据单元包含第二预定数量的所述数据库,每个所述数据库包含第三预定数量的逻辑表,每个所述逻辑表包含第四预定数量的所述数据区域。
可选地,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:在所述数据拆分策略为所述多库单表型时,则所述分片器根据所述多库单表型按照所述数据单元、所述数据库、物理表以及所述数据区域进行所述目标数据的拆分,其中,逻辑表名与所述物理表名是相同的,所述多库单表型包括第五预定数量的所述数据单元,每个所述数据单元包含第六预定数量的所述数据库,每个所述数据库包含第七预定数量的逻辑表,每个所述逻辑表包含第八预定数量的所述数据区域。
可选地,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:在所述数据拆分策略为所述单库单表型时,则所述分片器根据所述单库单表型按照所述数据单元、所述数据库、物理表以及所述数据区域进行所述目标数据的拆分,其中,逻辑表名与所述物理表名是相同的,所述单库单表型包括第九预定数量的所述数据单元,每个所述数据单元包含第十预定数量的所述数据库,每个所述数据库包含第十一预定数量的逻辑表,每个所述逻辑表包含第十二预定数量的所述数据区域。
可选地,在根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理之前,还包括:调整所述数据拆分策略中所述逻辑表的数量和/或所述数据区域的数量。
根据本发明实施例的另一方面,还提供了一种数据拆分装置,包括获取单元和控制单元,其中,上述获取单元用于获取目标数据的数据拆分策略,其中,所述数据拆分策略与分片器一一对应;上述控制单元用于根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理。
根据本发明实施例的另一方面,还提供了一种数据拆分设备,包括控制器以及与所述控制器连接的分片器,其中,所述控制器用于控制所述分片器执行任一种所述的数据拆分方法。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任一种所述的数据拆分方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一种所述的数据拆分方法。
在本发明实施例中,上述数据拆分方法,首先,获取目标数据的与分片器一一对应的数据拆分策略;之后,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分。本申请通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据拆分方法的流程图;
图2是本申请实施例中分库分表型数据拆分策略逻辑图;
图3是本申请实施例中多库单表型数据拆分策略逻辑图;
图4是本申请实施例中单库单表型数据拆分策略逻辑图;
图5是根据本申请实施例的数据拆分装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
分片器:某种数据拆分策略的具体实现,包含名称、分片属性等要素。
数据区域:Data Zone,数据的一个特殊属性,具有相同Data Zone值的数据属于同一数据区域。
正如背景技术中所说的,现有技术中未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种数据拆分方法、装置、设备、计算机可读存储介质以及处理器。
根据本发明实施例,提供了一种数据拆分方法实施例,图1是根据本发明实施例的数据拆分方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取目标数据的数据拆分策略,其中,上述数据拆分策略与分片器一一对应;
步骤S102,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理。
上述数据拆分方法,首先,获取目标数据的与分片器一一对应的数据拆分策略;之后,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分。该方法通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
为了满足银行的不同业务,本申请的一种实施例中,在获取目标数据的数据拆分策略之前,还包括:确定数据拆分策略,其中,上述数据拆分策略包括以下至少之一:分库分表型、多库单表型以及单库单表型。
本申请的另一种实施例中,如图2所示,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理,包括:在上述数据拆分策略为上述分库分表型时,则上述分片器根据上述分库分表型按照上述数据单元、上述数据库、物理表以及上述数据区域的层次进行上述目标数据的拆分,其中,上述分库分表型包括第一预定数量的上述数据单元,每个上述数据单元包含第二预定数量的上述数据库,每个上述数据库包含第三预定数量的逻辑表,每个上述逻辑表包含第四预定数量的上述数据区域。该实施例适用于业务数据既分库又分表的场景。上述数据区域扩展了数据的层次,进一步实现灵活控制数据的分片数量。
具体地,上述第一预定数量可以是2个,上述第二预定数量可以是2个,上述第三预定数量可以是2个,上述第四预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为2×2×2×10=80。
本申请的一种具体实施例中,分片器对上述目标数据进行拆分按照以下四个不同的层次:数据单元、数据库、物理表以及数据区域,相比现有技术中按照数据单元、数据库以及物理表这三个层次进行数据拆分,该实施例引入数据区域进行拆分使得拆分的细粒度更高。数据区域作为配置项,可分为全局数据区域、表级数据区域、作业级数据区域,优先级依此递增,即作业级数据区域配置会覆盖表级数据区域配置,表级数据区域配置会覆盖全局数据区域配置。全局、表级数据区域作为企业级配置中心中的配置项,作业级数据区域作为作业参数的配置项,在作业运行时动态传入,并支持多种格式,以达到灵活配置的目的。由于在系统稳定运行、不考虑扩缩容的情况下,数据单元数量,数据库分库分表规则是稳定不变的,也就是数据单元、数据库和物理表是不变的,因此,可以通过数据区域的取值来灵活控制分片数据量的大小,数据区域的取值越小,单个分片的数据量越大。当数据区域=1时,分片策略退化为表级分片,即单张表的数据即为一个分片。
本申请的又一种实施例中,如图3所示,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理,包括:在上述数据拆分策略为上述多库单表型时,则上述分片器根据上述多库单表型按照上述数据单元、上述数据库、物理表以及上述数据区域进行上述目标数据的拆分,其中,逻辑表名与上述物理表名是相同的,上述多库单表型包括第五预定数量的上述数据单元,每个上述数据单元包含第六预定数量的上述数据库,每个上述数据库包含第七预定数量的逻辑表,每个上述逻辑表包含第八预定数量的上述数据区域。该实施例适用于业务数据分库但不分表的场景。
具体地,上述第五预定数量可以是2个,上述第六预定数量可以是2个,上述第七预定数量可以是1个,上述第八预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为2×2×1×10=40
本申请的再一种实施例中,如图4所示,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理,包括:在上述数据拆分策略为上述单库单表型时,则上述分片器根据上述单库单表型按照上述数据单元、上述数据库、物理表以及上述数据区域进行上述目标数据的拆分,其中,逻辑表名与上述物理表名是相同的,上述单库单表型包括第九预定数量的上述数据单元,每个上述数据单元包含第十预定数量的上述数据库,每个上述数据库包含第十一预定数量的逻辑表,每个上述逻辑表包含第十二预定数量的上述数据区域。该实施例适用于业务数据既不分库又不分表的场景。
具体地,上述第九预定数量可以是1个,上述第十预定数量可以是1个,上述第十一预定数量可以是1个,上述第十二预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为1×1×1×10=10。
为了更进一步灵活控制分片数据量的大小,本申请的另一种实施例中,在根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理之前,还包括:调整上述数据拆分策略中上述逻辑表的数量和/或上述数据区域的数量。在根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理之前,先调整数据拆分策略中上述逻辑表的数量或者数据区域的数量,防止由于数据量较小时分片过多没有显著提升处理效率反而导致线程开销增大以及对后续的数据归并操作产生较大复杂性。
本申请的另一种具体实施例中,上述物理表可以为空,表示一个库级分片器,也就是说上述数据库中的数据都会在同一个分片中被处理;上述数据区域也可以为空,表示一个表级分片器,也就是说一张物理表中的数据都会在一个分片中被处理。
本申请实施例还提供了一种数据拆分装置,需要说明的是,本申请实施例的数据拆分装置可以用于执行本申请实施例所提供的数据拆分方法。以下对本申请实施例提供的数据拆分装置进行介绍。
图5是根据本申请实施例的数据拆分装置的示意图,如图5所示,该装置包括:
获取单元10,用于获取目标数据的数据拆分策略,其中,上述数据拆分策略与分片器一一对应;
控制单元20,用于根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理。
上述数据拆分装置,通过获取单元10获取目标数据的与分片器一一对应的数据拆分策略;通过控制单元20根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分。该装置通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
为了满足银行的不同业务,本申请的一种实施例中,该装置还包括确定单元,上述确定单元用于在获取目标数据的数据拆分策略之前,确定数据拆分策略,其中,上述数据拆分策略包括以下至少之一:分库分表型、多库单表型以及单库单表型。
本申请的另一种实施例中,上述控制单元包括第一拆分子单元,上述第一拆分子单元用于在上述数据拆分策略为上述分库分表型时,则上述分片器根据上述分库分表型按照上述数据单元、上述数据库、物理表以及上述数据区域的层次进行上述目标数据的拆分,其中,上述分库分表型包括第一预定数量的上述数据单元,每个上述数据单元包含第二预定数量的上述数据库,每个上述数据库包含第三预定数量的逻辑表,每个上述逻辑表包含第四预定数量的上述数据区域。该实施例适用于业务数据既分库又分表的场景。上述数据区域扩展了数据的层次,进一步实现灵活控制数据的分片数量。
具体地,上述第一预定数量可以是2个,上述第二预定数量可以是2个,上述第三预定数量可以是2个,上述第四预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为2×2×2×10=80。
本申请的一种具体实施例中,分片器对上述目标数据进行拆分按照以下四个不同的层次:数据单元、数据库、物理表以及数据区域,相比现有技术中按照数据单元、数据库以及物理表这三个层次进行数据拆分,该实施例引入数据区域进行拆分使得拆分的细粒度更高。数据区域作为配置项,可分为全局数据区域、表级数据区域、作业级数据区域,优先级依此递增,即作业级数据区域配置会覆盖表级数据区域配置,表级数据区域配置会覆盖全局数据区域配置。全局、表级数据区域作为企业级配置中心中的配置项,作业级数据区域作为作业参数的配置项,在作业运行时动态传入,并支持多种格式,以达到灵活配置的目的。由于在系统稳定运行、不考虑扩缩容的情况下,数据单元数量,数据库分库分表规则是稳定不变的,也就是数据单元、数据库和物理表是不变的,因此,可以通过数据区域的取值来灵活控制分片数据量的大小,数据区域的取值越小,单个分片的数据量越大。当数据区域=1时,分片策略退化为表级分片,即单张表的数据即为一个分片。
本申请的又一种实施例中,上述控制单元包括第二拆分子单元,上述第二拆分子单元用于在上述数据拆分策略为上述多库单表型时,则上述分片器根据上述多库单表型按照上述数据单元、上述数据库、物理表以及上述数据区域进行上述目标数据的拆分,其中,逻辑表名与上述物理表名是相同的,上述多库单表型包括第五预定数量的上述数据单元,每个上述数据单元包含第六预定数量的上述数据库,每个上述数据库包含第七预定数量的逻辑表,每个上述逻辑表包含第八预定数量的上述数据区域。该实施例适用于业务数据分库但不分表的场景。
具体地,上述第五预定数量可以是2个,上述第六预定数量可以是2个,上述第七预定数量可以是1个,上述第八预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为2×2×1×10=40
本申请的再一种实施例中,上述控制单元包括第三拆分子单元,上述第三拆分子单元用于在上述数据拆分策略为上述单库单表型时,则上述分片器根据上述单库单表型按照上述数据单元、上述数据库、物理表以及上述数据区域进行上述目标数据的拆分,其中,逻辑表名与上述物理表名是相同的,上述单库单表型包括第九预定数量的上述数据单元,每个上述数据单元包含第十预定数量的上述数据库,每个上述数据库包含第十一预定数量的逻辑表,每个上述逻辑表包含第十二预定数量的上述数据区域。该实施例适用于业务数据既不分库又不分表的场景。
具体地,上述第九预定数量可以是1个,上述第十预定数量可以是1个,上述第十一预定数量可以是1个,上述第十二预定数量可以是10个,对上述目标数据进行拆分得到总的数据分片数量为1×1×1×10=10。
为了更进一步灵活控制分片数据量的大小,本申请的另一种实施例中,该装置还包括调整单元,上述调整单元用于在根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理之前,调整上述数据拆分策略中上述逻辑表的数量和/或上述数据区域的数量。在根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理之前,先调整数据拆分策略中上述逻辑表的数量或者数据区域的数量,防止由于数据量较小时分片过多没有显著提升处理效率反而导致线程开销增大以及对后续的数据归并操作产生较大复杂性。
本申请的另一种具体实施例中,上述物理表可以为空,表示一个库级分片器,也就是说上述数据库中的数据都会在同一个分片中被处理;上述数据区域也可以为空,表示一个表级分片器,也就是说一张物理表中的数据都会在一个分片中被处理。
上述数据拆分装置包括处理器和存储器,上述获取单元和控制单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有技术中的未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述数据拆分方法。
本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述数据拆分方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤S101,获取目标数据的数据拆分策略,其中,上述数据拆分策略与分片器一一对应;
步骤S102,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤S101,获取目标数据的数据拆分策略,其中,上述数据拆分策略与分片器一一对应;
步骤S102,根据上述数据拆分策略控制上述分片器对上述目标数据进行拆分处理。
本申请的另一种典型实施例中,还提供了一种数据拆分设备,包括控制器以及与上述控制器连接的分片器,其中,上述控制器用于控制上述分片器执行任一种上述的数据拆分方法。
上述数据拆分设备通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的数据拆分方法,首先,获取目标数据的与分片器一一对应的数据拆分策略;之后,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分。该方法通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
2)、本申请的数据拆分装置,通过获取单元获取目标数据的与分片器一一对应的数据拆分策略;通过控制单元根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分。该装置通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
3)、本申请的数据拆分设备,通过采用数据拆分策略控制分片器,对目标数据进行拆分,进而解决了现有技术方案中,未能清晰描述具体的数据拆分规则,未能实现对分片数量的灵活控制的技术问题。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种数据拆分方法,其特征在于,包括:
获取目标数据的数据拆分策略,其中,所述数据拆分策略与分片器一一对应;
根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理。
2.根据权利要求1所述的方法,其特征在于,在获取目标数据的数据拆分策略之前,还包括:
确定数据拆分策略,其中,所述数据拆分策略包括以下至少之一:分库分表型、多库单表型以及单库单表型。
3.根据权利要求2所述的方法,其特征在于,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:
在所述数据拆分策略为所述分库分表型时,则所述分片器根据所述分库分表型按照所述数据单元、所述数据库、物理表以及所述数据区域的层次进行所述目标数据的拆分,其中,所述分库分表型包括第一预定数量的所述数据单元,每个所述数据单元包含第二预定数量的所述数据库,每个所述数据库包含第三预定数量的逻辑表,每个所述逻辑表包含第四预定数量的所述数据区域。
4.根据权利要求2所述的方法,其特征在于,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:
在所述数据拆分策略为所述多库单表型时,则所述分片器根据所述多库单表型按照所述数据单元、所述数据库、物理表以及所述数据区域进行所述目标数据的拆分,其中,逻辑表名与所述物理表名是相同的,所述多库单表型包括第五预定数量的所述数据单元,每个所述数据单元包含第六预定数量的所述数据库,每个所述数据库包含第七预定数量的逻辑表,每个所述逻辑表包含第八预定数量的所述数据区域。
5.根据权利要求2所述的方法,其特征在于,根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理,包括:
在所述数据拆分策略为所述单库单表型时,则所述分片器根据所述单库单表型按照所述数据单元、所述数据库、物理表以及所述数据区域进行所述目标数据的拆分,其中,逻辑表名与所述物理表名是相同的,所述单库单表型包括第九预定数量的所述数据单元,每个所述数据单元包含第十预定数量的所述数据库,每个所述数据库包含第十一预定数量的逻辑表,每个所述逻辑表包含第十二预定数量的所述数据区域。
6.根据权利要求3至5中任意一项所述的方法,其特征在于,在根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理之前,还包括:
调整所述数据拆分策略中所述逻辑表的数量和/或所述数据区域的数量。
7.一种数据拆分装置,其特征在于,包括:
获取单元,用于获取目标数据的数据拆分策略,其中,所述数据拆分策略与分片器一一对应;
控制单元,用于根据所述数据拆分策略控制所述分片器对所述目标数据进行拆分处理。
8.一种数据拆分设备,其特征在于,包括:控制器以及与所述控制器连接的分片器,其中,所述控制器用于控制所述分片器执行权利要求1至6中任意一项所述的数据拆分方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至6中任意一项所述的数据拆分方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的数据拆分方法。
CN202111556759.4A 2021-12-17 2021-12-17 数据拆分方法、装置以及设备 Pending CN114238333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111556759.4A CN114238333A (zh) 2021-12-17 2021-12-17 数据拆分方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111556759.4A CN114238333A (zh) 2021-12-17 2021-12-17 数据拆分方法、装置以及设备

Publications (1)

Publication Number Publication Date
CN114238333A true CN114238333A (zh) 2022-03-25

Family

ID=80758547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111556759.4A Pending CN114238333A (zh) 2021-12-17 2021-12-17 数据拆分方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN114238333A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122510A1 (en) * 2012-10-31 2014-05-01 Samsung Sds Co., Ltd. Distributed database managing method and composition node thereof supporting dynamic sharding based on the metadata and data transaction quantity
CN106294565A (zh) * 2016-07-27 2017-01-04 中国农业银行股份有限公司 一种数据库访问方法及系统
CN106844397A (zh) * 2015-12-07 2017-06-13 阿里巴巴集团控股有限公司 基于分库分表的任务传输方法、装置及系统
CN110928665A (zh) * 2019-12-06 2020-03-27 深圳乐信软件技术有限公司 数据处理方法、装置、存储介质及终端
CN111324606A (zh) * 2020-01-23 2020-06-23 北京恒华伟业科技股份有限公司 数据分片的方法及装置
CN113742343A (zh) * 2021-09-01 2021-12-03 上海浦东发展银行股份有限公司 基于大量业务数据场景的数据拆分方法、装置和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122510A1 (en) * 2012-10-31 2014-05-01 Samsung Sds Co., Ltd. Distributed database managing method and composition node thereof supporting dynamic sharding based on the metadata and data transaction quantity
CN106844397A (zh) * 2015-12-07 2017-06-13 阿里巴巴集团控股有限公司 基于分库分表的任务传输方法、装置及系统
CN106294565A (zh) * 2016-07-27 2017-01-04 中国农业银行股份有限公司 一种数据库访问方法及系统
CN110928665A (zh) * 2019-12-06 2020-03-27 深圳乐信软件技术有限公司 数据处理方法、装置、存储介质及终端
CN111324606A (zh) * 2020-01-23 2020-06-23 北京恒华伟业科技股份有限公司 数据分片的方法及装置
CN113742343A (zh) * 2021-09-01 2021-12-03 上海浦东发展银行股份有限公司 基于大量业务数据场景的数据拆分方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US9047129B2 (en) Systems and methods for load balancing of time-based tasks in a distributed computing system
US11775825B2 (en) Secure intelligent networked architecture including an asymmetric parallel processing appliance
US20180167461A1 (en) Method and apparatus for load balancing
CN102495857A (zh) 一种分布式数据库的负载均衡方法
CN104111804A (zh) 一种分布式文件系统
CN112379971B (zh) 应用容器管理方法、装置及设备
CN110928638A (zh) 一种虚拟机部署的宿主机的选择方法和装置
US20220237506A1 (en) Using container and model information to select containers for executing models
US8443369B1 (en) Method and system for dynamically selecting a best resource from each resource collection based on resources dependencies, prior selections and statistics to implement an allocation policy
CN110716813A (zh) 数据流处理方法、装置、可读存储介质及处理器
CN105373746B (zh) 一种分布式数据处理方法和装置
CN106055706A (zh) 一种缓存资源存储方法及装置
CN111708629A (zh) 一种资源分配方法、装置、电子设备和存储介质
US10606478B2 (en) High performance hadoop with new generation instances
CN114238333A (zh) 数据拆分方法、装置以及设备
CN114253456A (zh) 一种缓存负载均衡方法和装置
CN112751892B (zh) 一种信息分发方法、装置、设备及存储介质
US20230153172A1 (en) Capacity adjustment method and apparatus, system, and computing device
CN115118785B (zh) 服务器资源保护方法、装置、设备、介质和程序产品
US10803036B2 (en) Non-transitory computer-readable storage medium, data distribution method, and data distribution device
Oonhawat et al. Hotspot management strategy for real-time log data in MongoDB
CN110059062B (zh) 一种文件系统的条带设置方法、系统及相关组件
US20210142263A1 (en) Document-based Distributed Inventory System With Rebalancing
CN115794305B (zh) 虚拟机内存的调整方法和装置、存储介质及电子装置
WO2022142515A1 (zh) 管理实例的方法、装置以及云应用引擎

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination