CN111414422A - 一种数据分布方法、装置、设备和存储介质 - Google Patents

一种数据分布方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111414422A
CN111414422A CN202010195239.4A CN202010195239A CN111414422A CN 111414422 A CN111414422 A CN 111414422A CN 202010195239 A CN202010195239 A CN 202010195239A CN 111414422 A CN111414422 A CN 111414422A
Authority
CN
China
Prior art keywords
data
hash
distribution
node
redistribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010195239.4A
Other languages
English (en)
Other versions
CN111414422B (zh
Inventor
王攀
郭琰
韩朱忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN202010195239.4A priority Critical patent/CN111414422B/zh
Publication of CN111414422A publication Critical patent/CN111414422A/zh
Application granted granted Critical
Publication of CN111414422B publication Critical patent/CN111414422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Abstract

本发明实施例公开了一种数据分布方法、装置、设备和存储介质,其中该方法包括:确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个;分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的;当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。采用上述技术方案,通过在MPP系统中存储非固定的哈希值与节点的分布映射关系,实现数据分布的逻辑与物理分离,当MPP系统中添加新节点时,可以更加高效地实现数据重分布,进而实现快速的系统扩展。

Description

一种数据分布方法、装置、设备和存储介质
技术领域
本发明实施例涉及数据库技术领域,尤其涉及一种数据分布方法、装置、设备和存储介质。
背景技术
大规模并行处理(Massively Parallel Processing,MPP)系统处理任务时,通过将任务并行地分散到多个节点上,在每个节点完成各自的计算后,将所得的部分数据结果汇总在一起得到最终的结果。
MPP系统中常用的分布方式可以包括随机分布、范围分布和哈希(HASH)分布等,而数据分布情况对于MPP系统的计算性能有很大影响。其中哈希分布与MPP系统中的节点数量有直接关系。目前,大多MPP系统中哈希分布的方式采用直接与整个MPP系统中的节点相关联的方式,即将系统中的节点数量作为哈希分布表的分槽数,当MPP系统中增加或删除节点时,数据分布的哈希值发生改变,则系统中的数据需要重新分布,将数据在节点间移动。而上述分布方式在增加节点时对原有数据的分布情况影响较大,重分布的效率较低,且不能实现高效的扩展。
发明内容
本发明实施例提供一种数据分布方法、装置、设备和存储介质,可以优化MPP系统中的数据分布方案,实现数据分布逻辑与物理的分离,当增加新节点时提高数据重分布的效率。
第一方面,本发明实施例提供了一种数据分布方法,包括:
确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
可选的,在所述分配节点给各所述哈希值之前,还包括:
将各节点上的表空间确定为物理表空间,并创建所述物理表空间逻辑所在的逻辑表空间。
可选的,一个所述逻辑表空间中包括至少一个所述物理表空间,一个所述物理表空间属于至少一个所述逻辑表空间。
可选的,所述分配节点给各所述哈希值,包括:
基于所述逻辑表空间为各所述哈希值分配存储其数据的物理表空间。
可选的,所述存储所述哈希分布表中各所述哈希值与节点的分布映射关系,包括:
在数据字典中存储所述哈希分布表的各所述哈希值与物理表空间的分布映射关系。
可选的,所述基于预设的重分布方式进行数据重分布,包括:
如果重分布数据包括目标哈希分布表的数据,则通过修改所述目标哈希分布表的分槽数进行数据重分布。
可选的,所述基于预设的重分布方式进行数据重分布,包括:
如果重分布数据包括目标哈希分布表在目标节点上的数据,则将所述目标哈希分布表在所述目标节点上的数据以数据页、表空间或数据文件为单位进行迁移。
第二方面,本发明实施例还提供了一种数据分布装置,该装置包括:
参数确定模块,用于确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
数据分布模块,用于分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
数据重分布模块,用于当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的数据分布方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的数据分布方法。
本发明实施例提供的数据分布方案,确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个,分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的,当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。采用上述技术方案,通过在MPP系统中存储非固定的哈希值与节点的分布映射关系,实现数据分布的逻辑与物理分离,当MPP系统中添加新节点时,可以更加高效地实现数据重分布,进而实现快速的系统扩展。
附图说明
图1为本发明实施例提供的一种数据分布方法的流程图;
图2为本发明实施例提供的一种表空间的示意图;
图3为本发明实施例提供的一种物理表空间的示意图;
图4为本发明实施例提供的一种基于物理表空间的数据分布示意图;
图5为本发明实施例提供的一种基于物理表空间的数据重分布示意图;
图6为本发明实施例提供的一种物理表空间与逻辑表空间的关系示意图;
图7为本发明实施例提供的一种另一种数据分布方法的流程图;
图8为本发明实施例提供的一种数据分布方装置的结构示意图;
图9为本发明实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
图1为本发明实施例提供的一种数据分布方法的流程图,本实施例可适用于在MPP系统中实现数据分布的情况,该方法可以由数据分布装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如服务器或终端设备,典型的终端设备包括移动终端,具体包括手机、电脑或平板电脑等。如图1所示,该方法具体可以包括:
S110、确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个。
其中,哈希分布表是一种采用哈希分布方式作为数据分布方式的表,哈希分布是将节点数量作为分槽数,数据计算哈希值之后,按照哈希值分配到不同的节点上,例如MPP系统中有N个节点,可以计算数据的哈希值,并将数据存储在节点号为该哈希值的节点中。传统的哈希分布当节点数量变化时,也就是N值变化,所有的数据都需要重新分布,将导致大量的数据迁移,效率较低。
本发明实施例中,创建哈希分布表时,可以设置其对应的分槽数,该分槽数可以为自定义的分槽数,即可以设置为节点数量,也可以不设置为节点数量。确定分槽数之后,即可得到对应的哈希值,哈希值的数量为至少两个,例如分槽数为3,则哈希值分别为0,1和2。
S120、分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的。
其中,分布映射关系可以为MPP系统中新增用于在基于数据哈希值存储数据的映射关系,该分布映射关系是非固定的,即在MPP系统中节点的数量发生变化时,该分布映射关系也可以灵活改变,以实现数据分布逻辑和物理的分离。
具体的,在确定哈希分布表的分槽数和哈希值之后,可以为每个哈希值分配存储其数据的节点,并将分槽数以及哈希分布表中各哈希值与节点的分布映射关系存储在数据字典中,以基于哈希值将数据存储在对应节点中。
其中,数据字典是一种用户可以访问的记录数据库元数据的目录,可以对数据的数据项、数据结构、数据流、数据存储、处理逻辑等进行定义和描述。本实施例中可以在数据字典中增加各个哈希分布表的分槽数,以及哈希分布表的各个哈希值与存储该哈希值数据的节点的分布映射关系。
示例性的,数据字典中可以添加如下内容:通过分布映射关系“HASH_DIS_TAB_INFO(TABID,HASH_NUM)”来存放各哈希分布表的分槽数,其中,“TABID”表示哈希分布表的标识,“HASH_NUM”表示分槽数;通过分布映射关系“HASH_DIS_TAB_STOR_INFO(TABID,HASH_VAL,EPNO)”来存放各哈希分布表的各哈希值与其所在节点的分布映射关系,其中,“TABID”表示哈希分布表的标识,“HASH_VAL”表示哈希值,“EPNO”表示节点标识。
基于上述数据字典,MPP系统创建哈希分布表的逻辑如下:创建哈希分布表时,可以当时MPP系统中的节点总数作为哈希分布表的分槽数,自动为哈希值分配存储其数据的节点;更进一步的,可以配置分槽数以及其分布。示例性的,配置一个哈希分布表可以为“T1(C1 int,C2 int)STORAGE ON TS1,DISTRIBUTED BY HASH(C1)SLOT NUMBER(3),HASHVALUE 0ON EP01,HASH VALUE 1ON EP02,HASH VALUE 2ON EP03;”其中,C1和C2为用户指定的列名,在这个例子中,在创建哈希分布表T1时,指定存储表空间为TS1,分槽数为3,其中哈希值为0的数据存储在节点EP01上的TS1表空间中,哈希值为1的数据存储在节点EP02上的TS1表空间中,哈希值为2的数据存储在节点EP03上的TS1表空间中。基于上述示例,即使MPP系统中节点数大于3,表T1的数据也只分布在EP01、EP02和EP03三个节点上。
基于上述数据字典,插入数据的逻辑如下:计算数据的哈希值,本实施例中可以对哈希值的计算方式不作限定,例如计算数据的哈希值的方法可以定义为“hash_val=F(val,hash_num)”,其中“hash_num”表示之前建表时指定的分槽数,该分槽数可以根据插入操作所对应目标哈希表的标识,通过查找分布映射关系“HASH_DIS_TAB_INFO”获取;获取该哈希值所在的节点,根据计算得到的哈希值以及插入操作所对应的目标哈希表的标识,查找分布映射关系“HASH_DIS_TAB_STOR_INFO”确定其对应的节点标识。
S130、当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
本发明实施例中,当添加新增节点之后,可以根据实际情况确定是否进行数据重分布,如果不进行数据重分布,则仅仅添加了一个空节点,不会影响原有数据的分布情况;如果进行数据重分布,则可以发起数据重分布请求。数据重分布请求可以为在MPP系统中当添加节点之后用于对原有数据进行重新分布的请求,本实施例中对上述数据重分布请求的获取方式不做限定,例如当添加节点时,可以确定获取到数据重分布请求,或者接收到管理人员的设定操作之后,可以确定获取到数据重分布请求,该设定操作本实施例中不作限定。重分布方式可以为在MPP系统中预先设置的对原有数据重新进行哈希分布的不同方式,重分布方式具体可以根据实际情况进行设定。
可选的,基于预设的重分布方式进行数据重分布,可以包括:如果重分布数据包括目标哈希分布表的数据,则通过修改目标哈希分布表的分槽数进行数据重分布。重分布数据可以为MPP系统中添加节点之后需要处理的数据,重分布数据可以为不限节点但是在指定的哈希分布表中的数据,也可以为指定的哈希分布表在指定节点上的数据。重分布数据可以为MPP系统管理人员根据实际情况进行设定。
当重分布数据仅需要处理指定的目标哈希分布表的数据时,通过修改目标哈希分布表的分槽数,不会影响其他表的数据。修改分槽数为基础的数据重分布方式,需要调整目标哈希分布表所涉及的所有节点的数据。确定修改后的分槽数之后,对目标哈希分布表中的所有数据一条一条进行读取和分析,进而重新分布到各个节点中,新增节点中也分布有数据。数据迁移之后,对数据字典中重分布数据所在哈希分布表中各哈希值与节点的分布映射关系进行修改。
可选的,基于预设的重分布方式进行数据重分布,可以包括:如果重分布数据包括目标哈希分布表在目标节点上的数据,则将目标哈希分布表在目标节点上的数据以数据页、表空间或数据文件为单位进行迁移。当重分布数据为指定的目标哈希分布表在目标节点上的数据时,执行数据重分布时不必分析数据,直接进行数据迁移即可,具体迁移的位置可以为新增节点,也可以为根据实际情况设置的其他节点。相较于修改分槽数的重分布方式,效率较高。
数据迁移的方式意味着不修改目标哈希分布表的分槽数,而是将目标哈希表在目标节点上的数据迁移到其他节点,例如新增节点或除存储目标哈希表其他哈希值数据的节点之外的节点。数据迁移的方式不需要读取及分析数据,直接迁移该目标哈希表在目标节点中所有索引的B树即可,迁移索引B树即可实现按照数据页为单位进行数据迁移。B树是一种按排序顺序在其节点中存储数据的数据结构。数据迁移完成之后,仅需要修改数据字典中重分布数据所对应分布映射关系中节点的标识即可。
如果目标哈希分布表在目标节点对应表空间或数据文件的数据满足完整性条件,则将表空间或数据文件的数据作为整体进行迁移。其中,完整性条件是指目标哈希分布表所有的数据均存储在目标节点对应的表空间或数据文件内。如果一个或几个表空间或数据文件内的数据是完整的,则可以表空间或数据文件为整体进行数据迁移。数据迁移完成后,也仅需要修改数据字典的分布映射关系中节点的标识即可。
本发明实施例提供的数据分布方案,确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个,分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的,当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。采用上述技术方案,通过在MPP系统中存储非固定的哈希值与节点的分布映射关系,实现数据分布的逻辑与物理分离,当MPP系统中添加新节点时,可以更加高效地实现数据重分布,进而实现快速的系统扩展。
在一些实施例中,在分配节点给各哈希值之前,还可以包括:将各节点上的表空间确定为物理表空间,并创建物理表空间逻辑所在的逻辑表空间。其中,一个逻辑表空间中包括至少一个物理表空间,一个物理表空间属于至少一个逻辑表空间。
在一些实施例中,分配节点给各哈希值,可以包括:基于逻辑表空间为各哈希值分配存储其数据的物理表空间。可选的,存储哈希分布表中各哈希值与节点的分布映射关系,可以包括:在数据字典中存储哈希分布表的各哈希值与物理表空间的分布映射关系。
其中,表空间是数据库的逻辑划分,一个表空间只能属于一个数据库,所有的数据库对象都存放在指定的表空间中,但主要存放的是表,所以称作表空间。当前MPP系统中使用的表空间概念,各个节点中的表空间配置都是相同的,使用表空间时,指的是所有节点中所有同名的表空间。图2为本发明实施例提供的一种表空间的示意图,如图2所示,MPP系统中的所有节点上都有表空间TS1和TS2,且配置相同。
本申请实施例中,可以对数据库的表空间进行封装来实现进一步的逻辑与物理的分离。具体将各节点上的表空间确定为物理表空间,并可以为每个物理表空间分配唯一的标识,允许各节点有不同的表空间配置。在数据字典中为物理表空间增加记录其所属的节点信息,物理表空间信息PHY_TS_INFO结构可以为“PHY_TS_INFO(PHY_TS_ID,EPNO)”,其中“PHY_TS_ID”表示物理表空间标识,“EPNO”表示物理表空间所属节点,在此基础上,数据字典中哈希值与节点的分布映射关系修改为哈希值与物理表空间的分布映射关系,可以为“HASH_DIS_TAB_STOR_INFO(TABID,HASH_VAL,PHY_TS_ID)”,“TABID”表示哈希分布表,“HASH_VAL”表示哈希值,“PHY_TS_ID”表示物理表空间标识。
基于上述物理表空间的概念,在创建哈希分布表时,通过物理表空间配置哈希分布,使用物理表空间时创建方式如下“T1(C1 int,C2 int),DISTRIBUTED BY HASH(C1)SLOTNUMBER(3),HASH VALUE 0ON Phy_TS1,HASH VALUE 1ON Phy_TS3,HASH VALUE 2ON Phy_TS5;”,如图3所示,图3为本发明实施例提供的一种物理表空间的示意图,哈希值为0的数据可以存储在物理表空间Phy_TS1中,哈希值为1的数据可以存储在物理表空间Phy_TS3中,哈希值为2的数据可以存储在物理表空间Phy_TS5中。
通过此方式,上述直接迁移表空间的逻辑更加方便,仅需要修改数据字典中该表空间所属的节点标识即可。例如,当表T02和表T03在节点EP01上都存储在物理表空间Phy_TS2中时,将其迁移到新节点EP04,可直接将物理表空间Phy_TS2对应的数据复制到节点EP04上。在复制数据之后,不必再收集存储于该物理表空间的表的信息,也不需要更新数据字典中哈希值与节点的分布映射关系,只需要将物理表空间Phy_TS2在分布映射关系中对应的节点从EP01改为EP04即可。
可选的,基于物理表空间还可以创建一个分槽数大于节点数的哈希分布表。例如,创建的哈希分布表可以为“T1(C1 int,C2 int),DISTRIBUTED BY HASH(C1)SLOT NUMBER(6),HASH VALUE 0ON PHY_TS1,HASH VALUE 1ON PHY_TS2,HASH VALUE 2ON PHY_TS3,HASHVALUE 3ON PHY_TS4,HASH VALUE 4ON PHY_TS5,HASH VALUE 5ON PHY_TS6;”,如图4所示,图4为本发明实施例提供的一种基于物理表空间的数据分布示意图,哈希值为0-5的数据分别存储在物理表空间PHY_TS1-PHY_TS6。
在MPP系统中添加节点后,可以通过直接迁移表空间的方式,平衡各节点的数据分布,例如,在图4基础上,添加节点EP04和EP05,数据迁移后的数据分布如图5所示,图5为本发明实施例提供的一种基于物理表空间的数据重分布示意图,图4中节点EP02上的物理表空间PHY_TS4整体被迁移到节点EP04,节点EP03上的物理表空间PHY_TS6被整体迁移到节点EP05。本申请实施例中,设置分槽数大的哈希分布表有利于物理表空间的数据迁移,使MPP系统资源利用更加合理。
本申请实施例中,逻辑表空间可以理解为一种存储配置方案,物理表空间和逻辑表空间之间是多对多的关系,一个物理表空间可以属于一个或多个逻辑表空间,一个逻辑表空间可包括一个或多个物理表空间,参见图6,图6为本发明实施例提供的一种物理表空间与逻辑表空间的关系示意图,逻辑表空间LOGIC_TS1可以包括物理表空间Phy_TS1、物理表空间Phy_TS3和物理表空间Phy_TS5,物理表空间Phy_TS1可以属于逻辑表空间LOGIC_TS1,而物理表空间Phy_TS4可以属于逻辑表空间LOGIC_TS2和逻辑表空间LOGIC_TS3。
基于逻辑表空间,在创建哈希分布表时,可以指定一个逻辑表空间,由系统自动为哈希值分配存储其数据的物理表空间。例如,“T1(C1 int,C2 int)DISTRIBUTED BY HASH(C1)ON LOGIC_TS1”,对于哈希分布表T1,由逻辑表空间LOGIC_TS1为其分配其所包括的物理表空间。这样设置的好处在于,在MPP系统中创建哈希分布表只需指定一个逻辑表空间,不再需要指定多个物理表空间,当物理表空间很多时,可以简化建表操作,提高效率。
图7为本发明实施例提供的另一种数据分布方法的流程图。本实施例在上述实施例的基础上,进一步对上述数据分布方法进行了具体说明。相应的,如图7所示,本实施例的方法具体包括:
S210、确定哈希分布表的分槽数和哈希值。
哈希值的数量为至少两个。
S220、分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中。
其中,分布映射关系是非固定的;
S230、当添加新增节点之后,获取数据重分布请求,数据重分布请求中包括重分布数据。
S240、判断重分布数据的类型,如果重分布数据为目标哈希分布表的数据,则执行S251-S253;如果重分布数据为目标哈希分布表在目标节点上的数据,则执行S261-S264。
S240之后,可以执行S251-S253或者S261-S264,具体根据重分布数据的类型进行确定。
S251、确定重分布方式为修改目标哈希分布表的分槽数以进行重分布。
S252、将原有节点添加新增节点后的节点数量确定为目标哈希分布表的修改后的分槽数。
S253、将目标哈希分布表中的数据按照修改后的分槽数重新分布。
S253之后,可以执行S270。
S261、确定重分布方式为数据迁移。
S262、判断目标哈希分布表在目标节点对应表空间或数据文件的数据是否满足完整性条件,若是,则执行S263;否则,执行S264。
S263、将表空间或数据文件的数据作为整体进行迁移。
示例性的,如果当前数据库有TS1、TS2两个表空间,以及T01、T02和T03三个哈希分布表,数据存储的情况如表1。
表1数据存储表
所在表空间
T01 TS1
T02 TS2
T03 TS2
如表1所示,表空间TS1和表空间TS2的数据都是完整的,即满足完整性条件。如果要迁移表空间TS2在节点EP01的数据,将其迁移到新节点EP04,可以直接采用数据迁移的方式将节点EP01上表空间TS2的数据整体复制到节点EP04,之后从数据字典中收集到存储在该表空间TS2内的表T02和T03,更新数据字典中分布映射关系“HASH_DIS_TAB_STOR_INFO”中TABID=T02或T03,与EPNO=EP01的记录,将EPNO设置为EP04,然后删除节点EP01上表空间TS2的数据即可。
S263之后,可以执行S270。
S264、将目标哈希分布表在目标节点上的数据以数据页为单位进行迁移。
S264之后,可以执行S270。
S270、更新数据字典中重分布数据对应的分布映射关系。
本发明实施例中,当添加新增节点之后,可以根据实际情况确定是否进行数据重分布,如果不进行数据重分布,则仅仅添加了一个空节点,不会影响原有数据的分布情况;如果进行数据重分布,则可以发起数据重分布请求,执行数据重分布之后,更新数据字典中存储的重分布数据所在哈希分布表中各哈希值与节点的分布映射关系或者重分布数据所在哈希分布表中各哈希值与物理表空间的分布映射关系。
本发明实施例提供的数据分布方案,确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个,分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的,当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。采用上述技术方案,通过在MPP系统中存储非固定的哈希值与节点的分布映射关系,实现数据分布的逻辑与物理分离,当MPP系统中添加新节点时,可以更加高效地实现数据重分布,进而实现快速的系统扩展。
图8为本发明实施例提供的一种数据分布装置的结构示意图,本实施例可适用于在MPP系统中实现数据分布的情况。本发明实施例所提供的数据分布装置可执行本发明任意实施例所提供的数据分布方法,具备执行方法相应的功能模块和有益效果。该装置具体包括:
参数确定模块310,用于确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
数据分布模块320,用于分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
数据重分布模块330,用于当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
本发明实施例提供的数据分布方案,确定哈希分布表的分槽数和哈希值,哈希值的数量为至少两个,分配节点给各哈希值,并存储分槽数以及哈希分布表中各哈希值与节点的分布映射关系,以将各哈希值的数据分布在对应节点中,其中,分布映射关系是非固定的,当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。采用上述技术方案,通过在MPP系统中存储非固定的哈希值与节点的分布映射关系,实现数据分布的逻辑与物理分离,当MPP系统中添加新节点时,可以更加高效地实现数据重分布,进而实现快速的系统扩展。
可选的,所述装置还包括表空间封装模块,具体用于:
在所述分配节点给各所述哈希值之前,将各节点上的表空间确定为物理表空间,并创建所述物理表空间逻辑所在的逻辑表空间。
可选的,一个所述逻辑表空间中包括至少一个所述物理表空间,一个所述物理表空间属于至少一个所述逻辑表空间。
可选的,所述数据分布模块320具体用于:
基于所述逻辑表空间为各所述哈希值分配存储其数据的物理表空间。
可选的,所述数据分布模块320具体用于:
在数据字典中存储所述哈希分布表的各所述哈希值与物理表空间的分布映射关系。
可选的,所述数据重分布模块330具体用于:
如果重分布数据包括目标哈希分布表的数据,则通过修改所述目标哈希分布表的分槽数进行数据重分布。
可选的,所述数据重分布模块330具体用于:
如果重分布数据包括目标哈希分布表在目标节点上的数据,则将所述目标哈希分布表在所述目标节点上的数据以数据页、表空间或数据文件为单位进行迁移。
本发明实施例所提供的数据分布装置可执行本发明任意实施例所提供的数据分布方法,具备执行方法相应的功能模块和有益效果。
图9为本发明实施例提供的一种设备的结构示意图。图9示出了适于用来实现本发明实施方式的示例性设备412的框图。图9显示的设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,设备412以通用设备的形式表现。设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储装置428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
设备412也可以与一个或多个外部设备414(例如键盘、指向终端、显示器424等)通信,还可与一个或者多个使得用户能与该设备412交互的终端通信,和/或与使得该设备412能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图9所示,网络适配器420通过总线418与设备412的其它模块通信。应当明白,尽管图中未示出,可以结合设备412使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据分布方法,该方法包括:
确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的数据分布方法,该方法包括:
确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种数据分布方法,其特征在于,包括:
确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
2.根据权利要求1所述的方法,其特征在于,在所述分配节点给各所述哈希值之前,还包括:
将各节点上的表空间确定为物理表空间,并创建所述物理表空间逻辑所在的逻辑表空间。
3.根据权利要求2所述的方法,其特征在于,一个所述逻辑表空间中包括至少一个所述物理表空间,一个所述物理表空间属于至少一个所述逻辑表空间。
4.根据权利要求2所述的方法,其特征在于,所述分配节点给各所述哈希值,包括:
基于所述逻辑表空间为各所述哈希值分配存储其数据的物理表空间。
5.根据权利要求4所述的方法,其特征在于,所述存储所述哈希分布表中各所述哈希值与节点的分布映射关系,包括:
在数据字典中存储所述哈希分布表的各所述哈希值与物理表空间的分布映射关系。
6.根据权利要求1所述的方法,其特征在于,所述基于预设的重分布方式进行数据重分布,包括:
如果重分布数据包括目标哈希分布表的数据,则通过修改所述目标哈希分布表的分槽数进行数据重分布。
7.根据权利要求1所述的方法,其特征在于,所述基于预设的重分布方式进行数据重分布,包括:
如果重分布数据包括目标哈希分布表在目标节点上的数据,则将所述目标哈希分布表在所述目标节点上的数据以数据页、表空间或数据文件为单位进行迁移。
8.一种数据分布装置,其特征在于,包括:
参数确定模块,用于确定哈希分布表的分槽数和哈希值,所述哈希值的数量为至少两个;
数据分布模块,用于分配节点给各所述哈希值,并存储所述分槽数以及所述哈希分布表中各所述哈希值与节点的分布映射关系,以将各所述哈希值的数据分布在对应节点中,其中,所述分布映射关系是非固定的;
数据重分布模块,用于当添加新增节点之后,基于预设的重分布方式进行数据重分布并更新对应的分布映射关系。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的数据分布方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的数据分布方法。
CN202010195239.4A 2020-03-19 2020-03-19 一种数据分布方法、装置、设备和存储介质 Active CN111414422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010195239.4A CN111414422B (zh) 2020-03-19 2020-03-19 一种数据分布方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010195239.4A CN111414422B (zh) 2020-03-19 2020-03-19 一种数据分布方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111414422A true CN111414422A (zh) 2020-07-14
CN111414422B CN111414422B (zh) 2023-09-29

Family

ID=71493097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010195239.4A Active CN111414422B (zh) 2020-03-19 2020-03-19 一种数据分布方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111414422B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541039A (zh) * 2020-12-07 2021-03-23 武汉联影医疗科技有限公司 数据库处理方法、装置、计算机设备和存储介质
CN112698926A (zh) * 2021-03-25 2021-04-23 成都新希望金融信息有限公司 数据处理方法、装置、设备、存储介质及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009295127A (ja) * 2008-06-09 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> アクセス方法、アクセス装置及び分散データ管理システム
CN104113606A (zh) * 2014-08-02 2014-10-22 成都致云科技有限公司 一致性动态均衡的分布式元数据节点架构
US20150149513A1 (en) * 2013-11-26 2015-05-28 Johannes Beigel Table redistribution in distributed databases
CN104932986A (zh) * 2014-03-19 2015-09-23 中国移动通信集团公司 一种数据重分布方法及装置
CN105095290A (zh) * 2014-05-15 2015-11-25 中国银联股份有限公司 一种分布式存储系统的数据布局方法
WO2016197994A1 (zh) * 2015-12-03 2016-12-15 中兴通讯股份有限公司 容量扩展方法及装置
CN106407308A (zh) * 2016-08-31 2017-02-15 天津南大通用数据技术股份有限公司 一种分布式数据库的扩容方法及装置
CN107451271A (zh) * 2017-08-03 2017-12-08 上海达梦数据库有限公司 一种哈希表处理方法、装置、设备及存储介质
CN107450855A (zh) * 2017-08-08 2017-12-08 山东浪潮云服务信息科技有限公司 一种用于分布式存储的模型可变的数据分布方法及系统
CN108932256A (zh) * 2017-05-25 2018-12-04 中兴通讯股份有限公司 分布式数据重分布控制方法、装置及数据管理服务器
CN109933284A (zh) * 2019-02-26 2019-06-25 启迪云计算有限公司 一种分布式块存储系统的数据分布算法
CN110502507A (zh) * 2019-08-29 2019-11-26 上海达梦数据库有限公司 一种分布式数据库的管理系统、方法、设备和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009295127A (ja) * 2008-06-09 2009-12-17 Nippon Telegr & Teleph Corp <Ntt> アクセス方法、アクセス装置及び分散データ管理システム
US20150149513A1 (en) * 2013-11-26 2015-05-28 Johannes Beigel Table redistribution in distributed databases
CN104932986A (zh) * 2014-03-19 2015-09-23 中国移动通信集团公司 一种数据重分布方法及装置
CN105095290A (zh) * 2014-05-15 2015-11-25 中国银联股份有限公司 一种分布式存储系统的数据布局方法
CN104113606A (zh) * 2014-08-02 2014-10-22 成都致云科技有限公司 一致性动态均衡的分布式元数据节点架构
WO2016197994A1 (zh) * 2015-12-03 2016-12-15 中兴通讯股份有限公司 容量扩展方法及装置
CN106407308A (zh) * 2016-08-31 2017-02-15 天津南大通用数据技术股份有限公司 一种分布式数据库的扩容方法及装置
CN108932256A (zh) * 2017-05-25 2018-12-04 中兴通讯股份有限公司 分布式数据重分布控制方法、装置及数据管理服务器
CN107451271A (zh) * 2017-08-03 2017-12-08 上海达梦数据库有限公司 一种哈希表处理方法、装置、设备及存储介质
CN107450855A (zh) * 2017-08-08 2017-12-08 山东浪潮云服务信息科技有限公司 一种用于分布式存储的模型可变的数据分布方法及系统
CN109933284A (zh) * 2019-02-26 2019-06-25 启迪云计算有限公司 一种分布式块存储系统的数据分布算法
CN110502507A (zh) * 2019-08-29 2019-11-26 上海达梦数据库有限公司 一种分布式数据库的管理系统、方法、设备和存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
裴沛等: "一种改进的分布式存储系统节点动态扩展策略", 《广西民族大学学报(自然科学版)》 *
裴沛等: "一种改进的分布式存储系统节点动态扩展策略", 《广西民族大学学报(自然科学版)》, no. 02, 15 May 2016 (2016-05-15), pages 91 - 94 *
陈占龙等: "GSHR-Tree:一种基于动态空间槽和哈希表的网格环境下的空间索引树", 《地球科学(中国地质大学学报)》 *
陈占龙等: "GSHR-Tree:一种基于动态空间槽和哈希表的网格环境下的空间索引树", 《地球科学(中国地质大学学报)》, no. 03, 15 May 2010 (2010-05-15), pages 137 - 144 *
陈蓓;刘文涛;: "银行业如何玩转分布式数据库", 金融电子化, no. 12, pages 44 - 45 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541039A (zh) * 2020-12-07 2021-03-23 武汉联影医疗科技有限公司 数据库处理方法、装置、计算机设备和存储介质
CN112541039B (zh) * 2020-12-07 2022-06-17 武汉联影医疗科技有限公司 数据库处理方法、装置、计算机设备和存储介质
CN112698926A (zh) * 2021-03-25 2021-04-23 成都新希望金融信息有限公司 数据处理方法、装置、设备、存储介质及系统

Also Published As

Publication number Publication date
CN111414422B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
EP3637280B1 (en) Data storage method and device, and storage medium
CN107301214B (zh) 在hive中数据迁移方法、装置及终端设备
US8429162B1 (en) Facilitating data redistribution in database sharding
US9489411B2 (en) High performance index creation
US9892121B2 (en) Methods and systems to identify and use event patterns of application workflows for data management
US11288287B2 (en) Methods and apparatus to partition a database
CN103810212A (zh) 一种数据库索引的自动创建方法及系统
CN107480205B (zh) 一种进行数据分区的方法和装置
CN108073696B (zh) 基于分布式内存数据库的gis应用方法
CN104881466A (zh) 数据分片的处理以及垃圾文件的删除方法和装置
CN113220659B (zh) 一种数据迁移的方法、系统、电子装置和存储介质
US10102267B2 (en) Method and apparatus for access control
CN106557307B (zh) 业务数据的处理方法及处理系统
CN107016115B (zh) 数据导出方法、装置、计算机可读存储介质及电子设备
US10489356B1 (en) Truncate and append database operation
CN111414422B (zh) 一种数据分布方法、装置、设备和存储介质
CN108460161B (zh) 分层抽样方法、装置和计算机设备
CN115048254B (zh) 数据分配策略的仿真测试方法、系统、设备和可读介质
US20210349918A1 (en) Methods and apparatus to partition a database
CN111061740B (zh) 一种数据同步方法、设备和存储介质
CN109542912B (zh) 区间数据存储方法、装置、服务器及存储介质
US9053100B1 (en) Systems and methods for compressing database objects
CN111475279B (zh) 用于备份的智能数据负载平衡的系统和方法
CN114297196A (zh) 元数据存储方法、装置、电子设备及存储介质
CN111782834A (zh) 图像检索的方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant