CN109783472A - 表数据的迁移方法、装置、计算机设备和存储介质 - Google Patents
表数据的迁移方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109783472A CN109783472A CN201811534166.6A CN201811534166A CN109783472A CN 109783472 A CN109783472 A CN 109783472A CN 201811534166 A CN201811534166 A CN 201811534166A CN 109783472 A CN109783472 A CN 109783472A
- Authority
- CN
- China
- Prior art keywords
- node
- destination node
- processing capacity
- group network
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭示了一种向大数据集群网络迁移表数据的方法、装置、计算机设备和存储介质,应用于包括多个节点的大数据集群网络的数据迁移中,属于数据迁移技术领域,所述方法包括:分别读取源节点存储的表的数据项信息和表结构信息;读取大数据集群网络中每个节点的剩余处理能力;根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。这样,大大提高了数据迁移的效率,避免了数据处理过程中变慢、死机的情况。
Description
技术领域
本发明涉及数据迁移技术领域,特别是涉及向大数据集群网络迁移表数据的方法、装置、计算机设备和存储介质。
背景技术
现有技术中,大数据集群间表数据迁移没有成熟的解决方案,在hadoop中虽然提供了数据迁移的工具,但是表数据的迁移还需要把表的结构迁移并且重建,而且表本身的原数据存储在metastore中,如果想迁移就必须读出来重新拼接之后再迁移。用这种方式实现数据迁移非常的麻烦,而且任务量会非常大,传输起来也不方便,容易出现机器卡死、崩溃甚至死机的情况。
发明内容
基于此,为解决相关技术中大数据集群网络间表数据迁移步骤繁琐不方便的技术问题,本发明提供了一种向大数据集群网络迁移表数据的方法、装置、计算机设备和存储介质。
第一方面,提供了一种向大数据集群网络迁移表数据的方法,包括:
分别读取源节点存储的表的数据项信息和表结构信息;
读取大数据集群网络中每个节点的剩余处理能力;
根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
在其中一个实施例中,所述剩余处理能力包括剩余内存容量、剩余外存容量、处理器内核未使用率中的至少一项。
在其中一个实施例中,,所述根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
根据读取的每个节点的剩余处理能力,确定所述每个节点的剩余处理能力分数:
根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例。
在其中一个实施例中,所述根据读取的每个节点的剩余处理能力,确定所述每个节点的剩余处理能力分数,具体包括:
根据所述每个节点的剩余内存容量,赋予所述每个节点一个第一分数;
根据所述每个节点的剩余外存容量,赋予所述每个节点一个第二分数;
根据所述每个节点的处理器内核未使用率,赋予所述每个节点一个第三分数;
确定所述每个节点的第一、第二、第三分数的加权和,以所述每个节点的加权和作为所述每个节点的剩余处理能力分数。
在其中一个实施例中,所述迁移目标节点为所述大数据集群网络中的每个节点;
所述根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
将大数据集群网络中每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
在其中一个实施例中,所述迁移目标节点为所述大数据集群网络中的剩余处理能力分数超过预定阈值的每个节点;
所述根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
将大数据集群网络中剩余处理能力分数超过预定阈值的每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
第二方面,提供了一种向大数据集群网络迁移表数据的装置,包括:
信息读取单元,用于分别读取源节点存储的表的数据项信息和表结构信息;
节点读取单元,用于读取大数据集群网络中每个节点的剩余处理能力;
节点确定单元,用于根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
信息划分单元,用于将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
信息发送单元,用于向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述向大数据集群网络迁移表数据的方法的步骤。
第四方面,提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述向大数据集群网络迁移表数据的方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
上述向大数据集群网络迁移表数据的方法、装置、计算机设备和存储介质,通过先分别读取源节点存储的表的数据项信息和表结构信息,所述源表的数据项信息存储在源数据库的多个源节点中,表结构信息分成多个部分分别存储在同一个节点中,将这些散的数据读取出来先不组装,再读取大数据集群网络中每个节点的剩余处理能力;然后根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;以防止传输过程中出现由于单个节点负荷过高而导致崩溃的情况。然后将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;最后向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。这样,在表数据迁移的过程中,就不用将表结构读取出来重建之后再迁移,而是直接读取迁移,大大提高了数据迁移的效率。而且所述方案通过根据剩余处理能力分配节点的方法,保证了各个节点的任务量是均衡的,不会在传输中出现节点负载过重而出现卡顿、崩溃或者死机的情况。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
图1是一个实施例中提供的向大数据集群网络迁移表数据的方法的实施环境图。
图2是根据一示例性实施例示出的一种向大数据集群网络迁移表数据的方法的流程图。
图3是根据图2对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S130的一种具体实现流程图。
图4是根据图3对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S131的一种具体实现流程图。
图5是根据一示例性实施例示出的一种向大数据集群网络迁移表数据的装置的框图。
图6示意性示出一种用于实现上述向大数据集群网络迁移表数据的方法的电子设备示例框图。
图7示意性示出一种用于实现上述向大数据集群网络迁移表数据的方法的计算机可读存储介质。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中提供的向大数据集群网络迁移表数据的方法的实施环境图,如图1所示,在该实施环境中,包括第一大数据集群网络100以及第二大数据集群网络200。
第一大数据集群网络100以及第二大数据集群网络200都包含有多个节点,当所述第一大数据集群网络100要向第二大数据集群网络200传输数据时,所述第一大数据集群网络100先分别读取自身要传输数据的节点(源节点)中存储的要传输的表数据项信息和表结构信息,再读取第二大数据集群网络200中每个节点的剩余处理能力,根据读取的第二大数据集群网络200中每个节点的剩余处理能力,在第二大数据集群网络200中确定迁移目标节点和与迁移目标节点对应的数据分配比例;将数据项信息按照与第二大数据集群网络200中的迁移目标节点对应的数据分配比例进行划分,传送到第二大数据集群网络200中的迁移目标节点;向确定的迁移目标节点发送表结构信息,第二大数据集群网络200中的迁移目标节点将接收的数据项信息按照表结构信息进行组装,形成一个结构完整的表。这样就大大提高了机器处理的效率,避免出现机器处理速度变慢甚至死机的情况。
需要说明的是,第一大数据集群网络100以及第二大数据集群网络200可为大数据服务器集群网络、大数据云集群网络等,但并不局限于此。第一大数据集群网络100以及第二大数据集群网络200可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者其他通讯连接方式进行连接,本发明在此不做限制。
如图2所示,在一个实施例中,提出了一种向大数据集群网络迁移表数据的方法,所述向大数据集群网络迁移表数据的方法可以应用于上述的,第一大数据集群网络100中,具体可以包括以下步骤:
步骤S110,分别读取源节点存储的表的数据项信息和表结构信息;
步骤S120,读取大数据集群网络中每个节点的剩余处理能力;
步骤S130,根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
步骤S140,将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
步骤S150,向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
本发明实施例中向大数据集群网络迁移表数据的是指将源数据库的数据迁移至目标数据库(即大数据集群网络),同时也是将源数据库的表数据迁移至目标数据库的对应表中。下面本实施例将以hive表做例子详述具体实施方式。
Hive是基于Hadoop构建的一个数据仓库工具,可以将结构化的数据文件映射为一张张数据库表,并定义了类结构化查询语言(SQL,Structured Query Language)的Hibernate查询语言(HQL,Hibernate Query Language)提供完整的查询功能,同时提供一系列工具用于对数据提取、转化和加载,以此来存储、查询和分析存储在Hadoop中的大规模数据
由于源数据库中的源表的数据项信息存储在源数据库的多个源节点中,表结构信息分成多个部分分别存储在同一个节点中,若想要传输,需要把这些信息全部先读取出来,即先获取源表的数据项信息和表结构信息。
然后由于所述大数据集群网络也是由多个节点组成的,在传输数据之前需要对所述大数据集群网络的每个节点的处理能力进行统计,根据每个节点的处理能力进行任务的分配。对处理能力进行统计的依据有多种,例如剩余处理能力,已占用处理能力等,本实施例将以剩余处理能力为例,因为剩余处理能力更直观地展示出一个节点还能处理多少任务量的能力,更有利于给各节点分配合理的任务量。
然后再根据统计的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例。例如,有三个节点的剩余处理能力之比为5:2:1,则他们数据分配比例就是5:2:1,即处理能力为5的节点分配总数据量的5/8,处理能力为2的节点分配总数据量的1/4,处理能力为1的节点分配总数据量的1/8,这样可以保证各个节点的任务量是均衡的,不会在传输中出现卡死的情况。
然后将数据项信息按照与迁移目标节点对应的数据分配比例也进行划分,分块传送到迁移目标节点。这样可以让分块后的不同块的数据同时传送至不同节点,大大提高了传输的速度和效率,节约了时间,也避免了出现机器卡死、崩溃或者死机的状况。
然后将表组装后填充数据,因为在Hadoop中,所述表的数据项信息都是分布式存储在各节点中的,表结构信息是分成多个部分后分别分布式存储在同一节点中的,若需要一个完整的表,还需要将所述数据项信息按照表结构信息进行组装,才能得到一个完整的表,使得表的数据项信息和表结构信息有所关联,这样才算完成了hive表的迁移。
可选的,在一个实施例中,所述剩余处理能力包括剩余内存容量、剩余外存容量、处理器内核未使用率中的至少一项。
内存容量、外存容量和处理器内核未使用率都是体现所述节点的剩余处理能力的指标之一,剩余内存容量表示当前阶段还能处理的数据的大小,剩余外存容量表示当前阶段还能存储的数据的大小,处理器内核未使用率当前阶段还能处理的数据量,所述三个指标从不同的角度都反映出了所述节点的剩余处理能力,且所述三个指标中的任意一个的值过大都会使机器的处理速度变慢甚至崩溃、死机。故这三个指标都可以作为剩余处理能力的判断标准。
可选的,图3是根据图2对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S130的细节描述,该向大数据集群网络迁移表数据的方法中,步骤S130可以包括以下步骤:
步骤S131,根据读取的每个节点的剩余处理能力,确定所述每个节点的剩余处理能力分数:
步骤S132,根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例。
根据读取的每个节点的剩余处理能力,给每个节点打分,是将每个节点的剩余处理能力量化的一个方法,这样能够比较客观直接地反映每个节点剩余处理能力,以方便后续根据分数更科学合理地分配节点迁移数据以及分配迁移到每个节点的数据的比例,使每个节点的处理负荷分配更均匀,大大提高了处理的效率,节约了处理的时间。
可选的,图4是根据图3对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S131的细节描述,该向大数据集群网络迁移表数据的方法中,步骤S131可以包括以下步骤:
步骤S1311,根据所述每个节点的剩余内存容量,赋予所述每个节点一个第一分数;
步骤S1312,根据所述每个节点的剩余外存容量,赋予所述每个节点一个第二分数;
步骤S1313,根据所述每个节点的处理器内核未使用率,赋予所述每个节点一个第三分数;
步骤S1314,确定所述每个节点的第一、第二、第三分数的加权和,以所述每个节点的加权和作为所述每个节点的剩余处理能力分数。
在本实施例中,所述第一、第二、第三分数的权重可以具体按照节点的配置情况及数据的具体情况设置,本发明在此不做限定。例如针对一个有8核32线程的处理器、8吉字节内存容量、512吉字节的外存容量的节点,可以设置为第一分数的权重为0.3、第二分数的权重为0.2、第三分数的权重为0.5。
这是一个综合判断的方案,内存容量、外存容量和处理器内核未使用率都是体现所述节点的剩余处理能力的指标之一,剩余内存容量表示当前阶段还能处理的数据的大小,剩余外存容量表示当前阶段还能存储的数据的大小,处理器内核未使用率当前阶段还能处理的数据量,所述三个指标从不同的角度都反映出了所述节点的剩余处理能力,且所述三个指标中的任意一个的值过大都会使机器的处理速度变慢甚至崩溃、死机。根据这三者综合判断所述节点的剩余处理能力更为科学严谨,能够多角度地避免少数节点负载过大而导致机器的处理速度变慢甚至崩溃、死机。
可选的,本实施例是根据图3对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S132的细节描述,所述向大数据集群网络迁移表数据的方法中,所述迁移目标节点为所述大数据集群网络中的每个节点,步骤S132可以包括以下步骤:
将大数据集群网络中每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
将大数据网络中的所有节点均作为迁移目标节点,可以充分利用大数据网络中的每一个节点的资源,提高传输的效率,使数据的存储分布更为均衡,提高机器的处理效率,使得处理过程中更不容易出现少数几个节点处理负荷过高的情况,避免了因为单个节点处理负荷过高而导致机器的处理速度变慢甚至崩溃、死机的情况。
可选的,本实施例是根据图3或对应实施例示出的向大数据集群网络迁移表数据的方法中步骤S132的细节描述,该向大数据集群网络迁移表数据的方法中,所述迁移目标节点为所述大数据集群网络中的剩余处理能力分数超过预定阈值的每个节点,步骤S132可以包括以下步骤:
将大数据集群网络中剩余处理能力分数超过预定阈值的每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
所述预定阈值例如是80分、60分、30分、80分、4分等,按照实际的应用场景确定,本发明再次不做限定。分数超过预定阈值的节点一般为剩余处理能力较高的节点,将分数超过预定阈值的节点作为迁移目标节点,可以更好的利用空置的节点资源,使节点资源分配更均衡。相比于选择剩余处理能力最小的节点存储数据,能够更好地避免出现由于短时任务分配过多导致少数几个节点负载过高的情况出现。
如图5所示,在一个实施例中,提供了一种向大数据集群网络迁移表数据的装置,该向大数据集群网络迁移表数据的装置可以集成于上述的第一大数据集群网络100中,具体可以包括信息读取单元110、节点读取单元120、节点确定单元130、信息划分单元140、信息发送单元150。
信息读取单元110,用于分别读取源节点存储的表的数据项信息和表结构信息;
节点读取单元120,用于读取大数据集群网络中每个节点的剩余处理能力;
节点确定单元130,用于根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
信息划分单元140,用于将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
信息发送单元150,用于向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
上述装置中各个模块的功能和作用的实现过程具体详见上述向大数据集群网络迁移表数据的方法中对应步骤的实现过程,在此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图6来描述根据本发明的这种实施方式的电子设备500。图6显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图2中所示的步骤S110,分别读取源节点存储的表的数据项信息和表结构信息;步骤S120,读取大数据集群网络中每个节点的剩余处理能力;步骤S130,根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;步骤S140,将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;步骤S150,向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
Claims (9)
1.一种向大数据集群网络迁移表数据的方法,所述大数据集群网络包括多个节点,其特征在于,所述方法包括:
分别读取源节点存储的表的数据项信息和表结构信息;
读取大数据集群网络中每个节点的剩余处理能力;
根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
2.如权利要求1所述的方法,其特征在于,所述剩余处理能力包括剩余内存容量、剩余外存容量、处理器内核未使用率中的至少一项。
3.如权利要求2所述的方法,其特征在于,所述根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
根据读取的每个节点的剩余处理能力,确定所述每个节点的剩余处理能力分数:
根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例。
4.如权利要求3所述的方法,其特征在于,所述根据读取的每个节点的剩余处理能力,确定所述每个节点的剩余处理能力分数,具体包括:
根据所述每个节点的剩余内存容量,赋予所述每个节点一个第一分数;
根据所述每个节点的剩余外存容量,赋予所述每个节点一个第二分数;
根据所述每个节点的处理器内核未使用率,赋予所述每个节点一个第三分数;
确定所述每个节点的第一、第二、第三分数的加权和,以所述每个节点的加权和作为所述每个节点的剩余处理能力分数。
5.如权利要求3所述的方法,其特征在于,所述迁移目标节点为所述大数据集群网络中的每个节点;
所述根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
将大数据集群网络中每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
6.如权利要求3所述的方法,其特征在于,所述迁移目标节点为所述大数据集群网络中的剩余处理能力分数超过预定阈值的每个节点;
所述根据所述每个节点的剩余处理能力分数,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例,具体包括:
将大数据集群网络中剩余处理能力分数超过预定阈值的每个节点的剩余处理能力分数的比,作为与迁移目标节点对应的数据分配比例。
7.一种向大数据集群网络迁移表数据的装置,其特征在于,所述装置包括:
信息读取单元,用于分别读取源节点存储的表的数据项信息和表结构信息;
节点读取单元,用于读取大数据集群网络中每个节点的剩余处理能力;
节点确定单元,用于根据读取的每个节点的剩余处理能力,在大数据集群网络中确定迁移目标节点和与迁移目标节点对应的数据分配比例;
信息划分单元,用于将数据项信息按照与迁移目标节点对应的数据分配比例进行划分,传送到迁移目标节点;
信息发送单元,用于向确定的迁移目标节点发送表结构信息,以便迁移目标节点将接收的数据项信息按照表结构信息进行组装。
8.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述的方法。
9.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811534166.6A CN109783472A (zh) | 2018-12-14 | 2018-12-14 | 表数据的迁移方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811534166.6A CN109783472A (zh) | 2018-12-14 | 2018-12-14 | 表数据的迁移方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109783472A true CN109783472A (zh) | 2019-05-21 |
Family
ID=66496971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811534166.6A Pending CN109783472A (zh) | 2018-12-14 | 2018-12-14 | 表数据的迁移方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783472A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111338941A (zh) * | 2020-02-21 | 2020-06-26 | 北京金堤科技有限公司 | 信息处理方法和装置、电子设备和存储介质 |
CN111367889A (zh) * | 2020-03-09 | 2020-07-03 | 中国工商银行股份有限公司 | 基于网页界面的跨集群数据迁移方法和装置 |
CN112486953A (zh) * | 2020-12-01 | 2021-03-12 | 广州虎牙科技有限公司 | 数据迁移方法、装置、计算机设备及存储介质 |
CN112632033A (zh) * | 2020-12-16 | 2021-04-09 | 深圳前海微众银行股份有限公司 | 集群数据迁移方法、装置及电子设备 |
CN112948354A (zh) * | 2021-03-01 | 2021-06-11 | 北京金山云网络技术有限公司 | 副本集群的创建方法和装置、电子设备和存储介质 |
CN113126884A (zh) * | 2019-12-30 | 2021-07-16 | 阿里巴巴集团控股有限公司 | 数据迁移方法、装置、电子设备及计算机存储介质 |
CN113448970A (zh) * | 2021-08-31 | 2021-09-28 | 深圳市一号互联科技有限公司 | 一种图数据存储方法及系统 |
CN113778692A (zh) * | 2021-11-10 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及装置、计算机设备和存储介质 |
CN114047883A (zh) * | 2021-11-19 | 2022-02-15 | 北京天融信网络安全技术有限公司 | 一种基于分布式存储系统的数据均衡方法及装置 |
CN114598652A (zh) * | 2022-03-04 | 2022-06-07 | 中信银行股份有限公司 | 一种流量调控方法、装置、设备及可读存储介质 |
-
2018
- 2018-12-14 CN CN201811534166.6A patent/CN109783472A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113126884A (zh) * | 2019-12-30 | 2021-07-16 | 阿里巴巴集团控股有限公司 | 数据迁移方法、装置、电子设备及计算机存储介质 |
CN113126884B (zh) * | 2019-12-30 | 2024-05-03 | 阿里巴巴集团控股有限公司 | 数据迁移方法、装置、电子设备及计算机存储介质 |
CN111338941A (zh) * | 2020-02-21 | 2020-06-26 | 北京金堤科技有限公司 | 信息处理方法和装置、电子设备和存储介质 |
CN111338941B (zh) * | 2020-02-21 | 2024-02-20 | 北京金堤科技有限公司 | 信息处理方法和装置、电子设备和存储介质 |
CN111367889B (zh) * | 2020-03-09 | 2023-08-04 | 中国工商银行股份有限公司 | 基于网页界面的跨集群数据迁移方法和装置 |
CN111367889A (zh) * | 2020-03-09 | 2020-07-03 | 中国工商银行股份有限公司 | 基于网页界面的跨集群数据迁移方法和装置 |
CN112486953A (zh) * | 2020-12-01 | 2021-03-12 | 广州虎牙科技有限公司 | 数据迁移方法、装置、计算机设备及存储介质 |
CN112632033A (zh) * | 2020-12-16 | 2021-04-09 | 深圳前海微众银行股份有限公司 | 集群数据迁移方法、装置及电子设备 |
CN112948354A (zh) * | 2021-03-01 | 2021-06-11 | 北京金山云网络技术有限公司 | 副本集群的创建方法和装置、电子设备和存储介质 |
CN113448970B (zh) * | 2021-08-31 | 2022-07-12 | 深圳市一号互联科技有限公司 | 一种图数据存储方法及系统 |
CN113448970A (zh) * | 2021-08-31 | 2021-09-28 | 深圳市一号互联科技有限公司 | 一种图数据存储方法及系统 |
CN113778692B (zh) * | 2021-11-10 | 2022-03-08 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及装置、计算机设备和存储介质 |
CN113778692A (zh) * | 2021-11-10 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及装置、计算机设备和存储介质 |
CN114047883A (zh) * | 2021-11-19 | 2022-02-15 | 北京天融信网络安全技术有限公司 | 一种基于分布式存储系统的数据均衡方法及装置 |
CN114047883B (zh) * | 2021-11-19 | 2023-12-01 | 北京天融信网络安全技术有限公司 | 一种基于分布式存储系统的数据均衡方法及装置 |
CN114598652A (zh) * | 2022-03-04 | 2022-06-07 | 中信银行股份有限公司 | 一种流量调控方法、装置、设备及可读存储介质 |
CN114598652B (zh) * | 2022-03-04 | 2024-01-30 | 中信银行股份有限公司 | 一种流量调控方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109783472A (zh) | 表数据的迁移方法、装置、计算机设备和存储介质 | |
CN106503791B (zh) | 用于有效神经网络部署的系统和方法 | |
WO2021031619A1 (zh) | 存储设备、分布式存储系统以及数据处理方法 | |
US20220391260A1 (en) | Method and Apparatus for Creating Container, Device, Medium, and Program Product | |
CN109582234A (zh) | 储存资源分配方法、装置、电子设备及计算机可读介质 | |
CN103970607A (zh) | 使用等价集合来计算优化虚拟机分配的方法和装置 | |
US11574233B2 (en) | Suggestion and completion of deep learning models from a catalog | |
CN103299274A (zh) | 确定运行图像的最佳计算环境 | |
CN108961033A (zh) | 多业务系统交互方法及装置、存储介质、电子终端 | |
CN108287764A (zh) | 分布式任务调度方法及其系统、存储介质、电子设备 | |
CN107070716B (zh) | 游戏服务器状态获取方法、装置、电子设备及存储介质 | |
CN109933405A (zh) | 虚拟机创建方法及装置、电子设备、存储介质 | |
CN110750331B (zh) | 一种针对教育桌面云应用的容器集群调度方法及平台 | |
US20190065284A1 (en) | Hybrid acceleration in a processing environment | |
CN107678752A (zh) | 一种面向异构集群的任务处理方法及装置 | |
CN110309108A (zh) | 数据采集及储存方法、装置、电子设备、存储介质 | |
CN103294556B (zh) | 用于主机系统准入控制的方法和系统 | |
CN103927216A (zh) | 用于管理虚拟装置的方法和系统 | |
CN111552550A (zh) | 一种基于图形处理器gpu资源的任务调度方法、设备及介质 | |
CN109032788B (zh) | 预留资源池动态调度方法、装置、计算机设备及存储介质 | |
CN107944000A (zh) | 航班运价更新方法、装置、电子设备、存储介质 | |
CN111966361A (zh) | 用于确定待部署模型的方法、装置、设备及其存储介质 | |
CN115485679A (zh) | 使用图划分动态地生成面 | |
CN115658301A (zh) | 存储资源调度方法、装置、存储介质以及电子设备 | |
Narantuya et al. | Multi-Agent Deep Reinforcement Learning-Based Resource Allocation in HPC/AI Converged Cluster. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: 201, room 518000, building A, No. 1, front Bay Road, Qianhai Shenzhen Guangdong Shenzhen Hong Kong cooperation zone (Qianhai business secretary) Applicant after: Shenzhen one ledger Intelligent Technology Co., Ltd. Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A Applicant before: Shenzhen one ledger Intelligent Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |