CN104331439B - 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法 - Google Patents

基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法 Download PDF

Info

Publication number
CN104331439B
CN104331439B CN201410575719.8A CN201410575719A CN104331439B CN 104331439 B CN104331439 B CN 104331439B CN 201410575719 A CN201410575719 A CN 201410575719A CN 104331439 B CN104331439 B CN 104331439B
Authority
CN
China
Prior art keywords
packet
planner
solution
node
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410575719.8A
Other languages
English (en)
Other versions
CN104331439A (zh
Inventor
刘垚
孔令雷
王小玉
霍卫平
金正皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BONC TECHNOLOGY Co Ltd
Original Assignee
BEIJING BONC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BONC TECHNOLOGY Co Ltd filed Critical BEIJING BONC TECHNOLOGY Co Ltd
Priority to CN201410575719.8A priority Critical patent/CN104331439B/zh
Publication of CN104331439A publication Critical patent/CN104331439A/zh
Application granted granted Critical
Publication of CN104331439B publication Critical patent/CN104331439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,包括:S1:Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态;S2:Planner从名称节点上读取表的所有数据包的分布信息;S3:通过Planner读取的所有数据分析引擎系统中全部存活节点的IP地址和负载状态以及从名称节点上读取表的所有数据包的分布信息利用迭代式回溯算法实现负载均衡。本发明通过产生的Planner在尽力保证计算本地化的基础上,能够快速、高效的实现负载均衡。

Description

基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法
技术领域
本发明涉及计算机分布式数据库技术领域,尤其涉及基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法。
背景技术
目前,大部分数据分析引擎是通过搬动HDFS文件来实现负载均衡,即改变HDFS文件的物理位置,例如,从Data Node A(数据节点A)搬到Data Node B(数据节点B),本发明人还没有发现在数据运行时实现负载均衡方面的相关研究。Map Reduce模型的不足是分配任务方式存在一些不必要的远程读取,影响查询或者存储数据的性能。
发明内容
本发明所要解决的技术问题是如何将大表计算发送到数据存储的节点去执行,尽量避免数据通过网络传输到其它节点去计算,节约带宽占用的关键问题。
为此目的,本发明提出了基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,提高系统的计算和查询速度。具体包括以下步骤:
S1:Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态;
S2:Planner从名称节点上读取表的所有数据包的分布信息;
S3:通过Planner读取的数据分析引擎系统中全部存活节点的IP地址和负载状态以及从所述名称节点上读取表的所有数据包的分布信息利用迭代式回溯算法实现负载均衡。
进一步地,所述步骤S1还包括:Planner将全部存活节点的负载状态换算为相对应大小的数据包。
进一步地,所述步骤S1还包括:内存空间量最大的节点不需要进行换算为相对应大小的数据包。
具体地,所述Planner将全部存活节点的负载状态换算为相对应大小的数据包的具体过程为:找到空闲内存量最大的节点,将其空闲内存值记为Mmax;以及分别计算其它节点的数据包的大小,等于Mmax-Mfree其中,Mfree为当前机器的空闲内存量。
进一步地,所述步骤S2还包括:如果副本所在的节点地址列表为空,则该数据包的副本所在的机器上没有运行数据分析引擎,通过远程读取,将副本地址设置成所有存活的数据分析引擎的地址;如果副本所在的节点地址列表不为空,则不添加数据分析引擎地址到地址列表中。
进一步地,所述步骤S3还包括:
S31:Planner将所有的数据包分成N组,每组M个数据包;
S32:将可能最优解初始化为空,评价值设为-1;
S33:从第一组开始,每向前搜索一步,便用剪枝函数判断该条分支是否有可能产生更优的解;
S34:如果该分支不能产生更优解则剪掉该分支,后退一步,用剪枝函数寻找到可能产生更优解的其它分支,继续搜索;
S35:搜索到此组数据包队列的末尾,产生新的解;
S36:利用评价函数A计算新解的评价值;
S37:如果可能最优解的评价值为-1,则将所述新产生的解保存为可能最优解;如果评价值小于可能最优解,则判定新产生的解更好,则将所述新产生的解保存为可能最优解;如果评价值大于可能最优解,则丢弃掉。
S38:Planner根据所有的数据包的分配结果和当前组将要分配的数据包的数据量进行计算的,其中,Planner使用S31-S37上述这种方法可以使之前分配的信息对后续数据包的分配产生影响,且分配方式能让每组数据包的分配不会彼此独立,使得分配的数据量更接近均衡。
进一步地,所述步骤S37还包括:如果评价值大于可能最优解,则丢弃掉,继续搜索其它分支,直到搜索组的搜索结束,其中,保存的可能最优解是所有产生的可能解中最优的解。
具体地,所述负载状态包括CPU使用情况与内存使用情况。
具体地,所述读取表的所有数据包的分布信息包括:数据包的大小和副本所在的节点地址。
本发明公开了基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,通过Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态;Planner从名称节点上读取表的所有数据包的分布信息;通过Planner读取的所有数据分析引擎系统中全部存活节点的IP地址和负载状态以及从名称节点上读取表的所有数据包的分布信息利用迭代式回溯算法实现负载均衡。即产生的Planner在尽力保证计算本地化的基础上,能够快速、高效的实现负载均衡。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明实施例中的基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法的步骤流程图。
具体实施方式
下面将结合附图对本发明的实施例进行详细描述。
计算本地化是将计算发到数据存储的节点去执行,尽量避免数据通过网络传输到其它节点去计算,节约带宽的占用。本发明数据分析引擎中的Planner,即执行计划产生器根据数据包的分析信息以及各个节点的负载状况,选择在哪些节点进行扫描,以及扫描哪些数据包。
为了更好的理解与应用本发明提出的基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,以如下附图示例进行详细说明。
如图1所示,本发明提供了基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,具体包括以下步骤:
步骤S1:Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态。其中,负载状态包括CPU、内存的使用情况。
具体地,Planner将全部存活节点的负载状态换算成相应大小的数据包。其中,内存空闲量最大的节点不需要进行换算成相应大小的数据包,对于其他节点预先分配一个数据包,但是数据包的大小不相同,且计算数据包大小的规则为:首先找到空闲内存量最大的节点,将其空闲内存值记为Mmax;以及分别计算其它节点的数据包的大小,等于Mmax-Mfree其中,Mfree为当前机器的空闲内存量。因此,Planner在后续分配数据包时,会给负载重的节点减少分配任务,给负载轻的节点增多分配任务。
步骤S2:Planner从Name Node(名称节点)上读取表的所有数据包的分布信息。其中,包括:数据包的大小,副本所在的节点地址,通常HDFS的备份因子是3,所以通常每个数据包都有三个副本。
具体地,Planner发现没有运行在数据分析引擎的节点地址,会将其删除。其中,某些Data Node(数据节点)上没有安装数据分析引擎或者数据分析引擎崩溃的情况,也会执行上述操作。
进一步地,如果副本所在的节点地址列表是空的,则该数据包的副本所在的机器上没有运行数据分析引擎,则只能通过远程读取,即只能将数据通过网络发送到计算所在的节点上,将副本地址设置成所有存活的数据分析引擎的地址;如果副本所在的节点地址列表不是空的,则不会添加其它的数据分析引擎地址到地址列表里。上述操作在后续做负载均衡时,选取的执行计算节点,也是数据存储的节点,避免了执行计算的节点通过网络从其它节点远程读取数据。
更进一步地,Planner将所有需要远程读取的数据包放在数据包队列的末尾,方便在后面分组的时候,将远程读取的数据包分给负载轻的节点,比如那些没有存储数据包,并且安装有数据分析引擎的节点。如果所有的Data Node上都安装有数据分析引擎,则不会有远程读取的数据包。
步骤S3:通过Planner读取的所有数据分析引擎系统中全部存活节点的IP地址和负载状态以及从名称节点上读取表的所有数据包的分布信息利用迭代式回溯算法实现负载均衡。
具体地,如果Planner直接通过回溯算法来执行,能得到最优的结果,但是时间的花费成本非常大,甚至超过查询语句的执行时间;如果Planner用贪心算法来执行,得到的结果质量较差,导致分配任务时产生倾斜性,任务分配不均匀严重。故本发明提出的Planner通过迭代式回溯算法来执行实现负载均衡。
进一步地,在本发明中利用迭代式回溯算法使用到的参数及函数包括:数据包量的平均值、可能最优解、评价函数A、评价函数B以及剪枝函数。
具体地,在本发明中利用迭代式回溯算法使用到的参数为:数据包量的平均值为平均每台机器应该处理的数据包的数据量。其中,所有数据包的大小的总和,包括通过负载状态换算出来的数据包,再除以机器的数量。单位为MB。例如:有个5个数据包,大小分别为800MB,600MB,700MB,850MB,400MB,集群共有4台机器,且内存空闲量一样,即(800+600+700+850+400)/4,则数据包均值为837MB,取整,省略小数;可能最优解用于暂时存放已经产生的解中评价值最低的一个。如果后续产生了评价更低的解,则用新的解覆盖上述解,用新的解作为可能最优解,直到遍历所有的解,将这个可能最优解作为最终结果进行返回。
具体地,在本发明中利用迭代式回溯算法使用到的函数为:评价函数A用于评价新产生的解,值越低越好。本发明选择采用的是计算标准方差的计算方法,数据倾斜大的解,标准方差会很大,数据分布比较均匀的解,标准方差会比较小。Planner选择利用数据包量的平均值计算标准方法。本发明的Planner是根据前面几组数据包的分配结果和当前组将要分配的数据包的数据量来进行计算的,Planner使用上述这种方法可以使之前分配的信息对后续数据包的分配产生影响,且上述分配方式能让每组数据包的分配不会彼此独立,使得分配的数据量更接近均衡;评价函数B用于评价中间解。其中,评价值越低越好,本发明的Planner计算分配数据包的量高于数据包量的平均值的节点的标准方差,且进一步地,剪枝函数会使用评价函数B,本发明只计算超过数据包量的平均值的节点,是因为在后面尝试分配数据包时,大于均值的节点会使评价值越来越大,且为评价值的下限,即使出现小于均值的节点使评价值越来越小,但也不会小于上述的下限;剪枝函数为在产生解的过程中,提前去掉不可能的解。其中,如果中间解的评价值大于可能最优解的评价值,则该分支不可能产生更优的解,所以剪掉该分支,不再继续向下搜索;如果可能最优解的评价值为-1,则说明还没有产生可能最优解,该分支不能被剪掉,这种操作就保证了不管解的评价值有多不理想,都会至少产生一个解。
更进一步地,本发明提出的Planner通过迭代式回溯算法来执行实现负载均衡操作步骤如下:
步骤S31:Planner将所有的数据包分成N组,每组M个数据包,其中,需要远程读取的数据包放在最后面的几个组里。
步骤S32:将可能最优解初始化为空,其评价值设为-1。
步骤S33:从第一组开始,每向前搜索一步,便用剪枝函数判断该条分支是否有可能产生更优的解。
步骤S34:如果该分支不能产生更优解则剪掉该分支,后退一步,用剪枝函数寻找到可能产生更优解的其它分支,继续搜索。其中,对于不是必须要远程读取的数据包,如步骤2提供的节点地址都是数据包实际存储的地址,这就保证该算法在搜索解的过程中,选取的下发计算任务的节点地址,都是数据包实际存储的地址,且无论前进还是后退,都会用剪枝函数,这样避免搜索其它分支。
步骤S35:搜索到此组数据包队列的末尾,产生新的解。
步骤S36:利用评价函数A计算新解的评价值。
步骤S37:如果可能最优解的评价值为-1,则将新产生的解保存为可能最优解;如果评价值小于可能最优解,则判定新产生的解更好,则将新产生的解保存为可能最优解;如果大于可能最优解,则丢弃掉。
步骤S38:Planner根据所有的数据包的分配结果和当前组将要分配的数据包的数据量进行计算的,其中,Planner使用S31-S37上述这种方法可以使之前分配的信息对后续数据包的分配产生影响,且分配方式能让每组数据包的分配不会彼此独立,使得分配的数据量更接近均衡。
进一步地,步骤S37还包括:如果评价值大于可能最优解,则丢弃掉,然后后退一步,继续搜索其它分支,直到此组的搜索结束之后,之前保存的可能最优解是所有产生的可能解中最优的解。
更进一步地,在搜索解的过程中,使用多线程并发的方式,这样可以充分利用系统资源,减少总的运算时间,读取当前系统CPU的核心数,为K个,将每组数据包的解空间,拆解成K个彼此独立的分支,每个线程处理一个分支,每个分支都会产生一个可能最优解,即从K个可能最优解选取评价值最小的,作为可能最优解。其中,拆解方法为:假定当前这组数据包的副本数是:F1,F2,F3….,其中,F1表示第一个数据包的备份数量,F2表示第二个数据包的备份数量,如果F1小于K*2,则取下一个,直到找到i满足F1*F2*F3*…Fi<=K*2并且F1*F2*F3*…Fi+1>K*2,则按照F1,F2,F3…Fi来拆分解。例如:假设这个表有5个数据包,i的最大值是数据包的个数-1,即i的最大值是5-1,通常HDFS的备份因子是3,所以F1=F2=F3=F4=F5=3,假设当前系统CPU核心数是5,即K=5,假定集群只有三台机器,0表示0号机器,1表示1号机器,2表示2号机器,这个五个数据包在这三台机器上都有一个副本,解空间如下:
0,1,2
0,1,2
0,1,2
0,1,2
0,1,2
其中,F1*F2<=K*2<F1*F2*F3,即3*3<5*2<3*3*3,所以i=2,共启动9个线程,第一个线程只处理0,0这个分支,即第一个线程的前面两个数据包必须是0号节点和0号节点上处理,后面三个数据包可以根据任务分配的平衡情况,考虑在0号、1号、2号节点上处理;第二个线程处理0,1这个分支,即第二个线程的前面两个数据包必须是0号节点和1号节点上处理,后面三个数据包可以根据任务分配的平衡情况,考虑在0号、1号、2号节点上处理;第三个线程处理0,2这个分支;第四个线程处理1,0这个分支;第五个线程处理1,1这个分支;第六个线程处理1,2这个分支;第七个处理2,0;第八个处理2,1;第九个处理2,2。这个算法的优势为当数据量比较大,数据包比较多时,能够快速的实现负载均衡,同时,还可以根据机器的性能,调整每组数据包的个数M,M越大,得到的解可能会越好。
本发明公开了基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,通过Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态;Planner从名称节点上读取表的所有数据包的分布信息;通过Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态,从名称节点上读取表的所有数据包的分布信息,利用迭代式回溯算法实现负载均衡。即产生的Planner在尽力保证计算本地化的基础上,能够快速、高效的实现负载均衡。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (6)

1.基于HDFS的迭代式回溯算法的负载均衡与计算本地化方法,其特征在于,包括具体以下步骤:
S1:Planner读取所有数据分析引擎系统中全部存活节点的IP地址和负载状态;
S2:Planner从名称节点上读取表的所有数据包的分布信息;
S3:通过Planner读取的数据分析引擎系统中全部存活节点的IP地址和负载状态以及从所述名称节点上读取表的所有数据包的分布信息利用迭代式回溯算法实现负载均衡;
所述步骤S1还包括:Planner将全部存活节点的负载状态换算为相对应大小的数据包;
所述步骤S1还包括:内存空间量最大的节点不需要进行换算为相对应大小的数据包;
所述Planner将全部存活节点的负载状态换算为相对应大小的数据包的具体过程为:找到空闲内存量最大的节点,将其空闲内存值记为Mmax;以及分别计算其它节点的数据包的大小,等于Mmax-Mfree其中,Mfree为当前机器的空闲内存量。
2.如权利要求1所述的方法,其特征在于,所述步骤S2还包括:如果副本所在的节点地址列表为空,则该数据包的副本所在的机器上没有运行数据分析引擎,通过远程读取,将副本地址设置成所有存活的数据分析引擎的地址;如果副本所在的节点地址列表不为空,则不添加数据分析引擎地址到地址列表中。
3.如权利要求1所述的方法,其特征在于,所述步骤S3还包括:
S31:Planner将所有的数据包分成N组,每组M个数据包;
S32:将可能最优解初始化为空,评价值设为-1;
S33:从第一组开始,每向前搜索一步,便用剪枝函数判断从第一组开始到当前搜索位置的这条分支是否有可能产生更优的解;
S34:如果该分支不能产生更优解则剪掉该分支,后退一步,用剪枝函数寻找到可能产生更优解的其它分支,继续搜索;
S35:搜索到此组数据包队列的末尾,产生新的解;
S36:利用评价函数A计算新解的评价值;
S37:如果可能最优解的评价值为-1,则将所述新产生的解保存为可能最优解;如果评价值小于可能最优解,则判定新产生的解更好,则将所述新产生的解保存为可能最优解;如果评价值大于可能最优解,则丢弃掉;
S38:Planner根据所有的数据包的分配结果和当前组将要分配的数据包的数据量进行计算的,其中,Planner使用S31-S37上述这种方法可以使之前分配的信息对后续数据包的分配产生影响,且分配方式能让每组数据包的分配不会彼此独立,使得分配的数据量更接近均衡。
4.如权利要求3所述的方法,其特征在于,所述步骤S37还包括:如果评价值大于可能最优解,则丢弃掉,继续搜索其它分支,直到搜索组的搜索结束,其中,保存的可能最优解是所有产生的可能解中最优的解。
5.如权利要求1所述的方法,其特征在于,所述负载状态包括CPU使用情况与内存使用情况。
6.如权利要求1所述的方法,其特征在于,所述读取表的所有数据包的分布信息包括:数据包的大小和副本所在的节点地址。
CN201410575719.8A 2014-10-24 2014-10-24 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法 Active CN104331439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410575719.8A CN104331439B (zh) 2014-10-24 2014-10-24 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410575719.8A CN104331439B (zh) 2014-10-24 2014-10-24 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法

Publications (2)

Publication Number Publication Date
CN104331439A CN104331439A (zh) 2015-02-04
CN104331439B true CN104331439B (zh) 2017-11-14

Family

ID=52406166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410575719.8A Active CN104331439B (zh) 2014-10-24 2014-10-24 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法

Country Status (1)

Country Link
CN (1) CN104331439B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161599A (zh) * 2016-06-24 2016-11-23 电子科技大学 一种存在数据依赖关系时降低云存储整体开销的方法
CN107122242B (zh) * 2017-03-28 2020-09-11 成都优易数据有限公司 一种有效提升分布式运算性能的大数据均衡切片方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929989A (zh) * 2012-10-19 2013-02-13 南京邮电大学 一种地理空间数据在云计算平台上的负载均衡方法
CN103533058A (zh) * 2013-10-17 2014-01-22 南京大学镇江高新技术研究院 面向HDFS/Hadoop存储集群的资源监控系统及方法
CN103561061A (zh) * 2013-10-17 2014-02-05 南京邮电大学 一种弹性的云数据挖掘平台部署方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150723B2 (en) * 2009-01-09 2012-04-03 Yahoo! Inc. Large-scale behavioral targeting for advertising over a network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929989A (zh) * 2012-10-19 2013-02-13 南京邮电大学 一种地理空间数据在云计算平台上的负载均衡方法
CN103533058A (zh) * 2013-10-17 2014-01-22 南京大学镇江高新技术研究院 面向HDFS/Hadoop存储集群的资源监控系统及方法
CN103561061A (zh) * 2013-10-17 2014-02-05 南京邮电大学 一种弹性的云数据挖掘平台部署方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Hadoop中云数据负载均衡算法的研究及优化;刘琨,肖琳,赵海燕;《微电子学与计算机》;20120930;第18-22页 *

Also Published As

Publication number Publication date
CN104331439A (zh) 2015-02-04

Similar Documents

Publication Publication Date Title
CN103905311B (zh) 流表匹配方法和装置以及交换机
CN110297699B (zh) 调度方法、调度器、存储介质及系统
CN103106249B (zh) 一种基于Cassandra的数据并行处理系统
CN103345514A (zh) 大数据环境下的流式数据处理方法
US20050177833A1 (en) Method and apparatus for reassigning objects to processing units
CN100445999C (zh) 一种数据存储及搜索方法
CN103473334A (zh) 数据存储、查询方法及系统
CN103176849B (zh) 一种基于资源分类的虚拟机集群的部署方法
CN109885397A (zh) 一种边缘计算环境中时延优化的负载任务迁移算法
CN103745008A (zh) 一种大数据索引的排序方法
CN103491024B (zh) 一种面向流式数据的作业调度方法及装置
CN101604261B (zh) 超级计算机的任务调度方法
CN109379230B (zh) 一种基于广度优先搜索的服务功能链部署方法
CN106407207A (zh) 一种实时新增数据更新方法和装置
CN106371924B (zh) 一种最小化MapReduce集群能耗的任务调度方法
CN106339388A (zh) 数据库弹性调度方法及装置
CN110147372A (zh) 一种面向htap的分布式数据库智能混合存储方法
CN109799956A (zh) 一种存储控制器及io请求处理方法
CN104331439B (zh) 基于hdfs的迭代式回溯算法的负载均衡与计算本地化方法
CN108875035A (zh) 分布式文件系统的数据存储方法及相关设备
CN103326925A (zh) 一种消息推送方法及装置
CN107169727A (zh) 面向模具制造的云服务组合方法及平台
US20070043865A1 (en) Method of assigning objects to processing units
CN109165729A (zh) 神经网络的调度方法及系统
CN106776810B (zh) 一种大数据的数据处理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Load balancing and computation localization method of iterative backtracking algorithm based on HDFS (Hadoop distributed file system)

Effective date of registration: 20190709

Granted publication date: 20171114

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: BEIJING BONC TECHNOLOGY CO., LTD.

Registration number: 2019990000686

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20211202

Granted publication date: 20171114

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: BUSINESS-INTELLIGENCE OF ORIENTAL NATIONS Corp.,Ltd.

Registration number: 2019990000686

PC01 Cancellation of the registration of the contract for pledge of patent right