CN110119405B - 分布式并行数据库资源管理方法 - Google Patents

分布式并行数据库资源管理方法 Download PDF

Info

Publication number
CN110119405B
CN110119405B CN201910242182.6A CN201910242182A CN110119405B CN 110119405 B CN110119405 B CN 110119405B CN 201910242182 A CN201910242182 A CN 201910242182A CN 110119405 B CN110119405 B CN 110119405B
Authority
CN
China
Prior art keywords
resource
node
nodes
direct neighbor
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910242182.6A
Other languages
English (en)
Other versions
CN110119405A (zh
Inventor
史英杰
周淳
周于超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Nanrui Ruizhong Data Co ltd
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Original Assignee
CHINA REALTIME DATABASE CO LTD
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
NARI Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA REALTIME DATABASE CO LTD, State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, NARI Group Corp filed Critical CHINA REALTIME DATABASE CO LTD
Priority to CN201910242182.6A priority Critical patent/CN110119405B/zh
Publication of CN110119405A publication Critical patent/CN110119405A/zh
Application granted granted Critical
Publication of CN110119405B publication Critical patent/CN110119405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式并行数据库资源管理方法,通过基于分散非结构化P2P网络关联的内容分发器,保证分布式并行处理数据库系统在动态变化的环境中的高性能及稳定性;通过采用基于有向图Lookahead的资源查找算法,令查询节点缓存两级邻居节点的资源信息,解决因冗余消息过多而导致的网络堵塞问题,降低因差异化配置导致的资源不均衡而产生的“木桶效应”;通过采用linuxcgroups资源管理机制,充分考虑多租户及基于多因素的资源调度策略,减少资源碎片,更好地满足分布式并行处理数据库存储或热点处理问题。

Description

分布式并行数据库资源管理方法
技术领域
本发明属于分布式并行处理数据库资源优化技术领域,尤其涉及一种分布式并行数据库资源管理方法。
背景技术
大规模分布式并行处理数据库(MPP数据库)作为企业数据仓库核心基础软件,广泛为各类分析型应用提供结构化数据支撑。目前主流的大规模分布式并行处理(MPP)数据库均采用P2P(Peer-to-Peer)对等部署方式,通过节点之间的相互协作实现系统功能,从而充分利用了网络资源,具有良好的扩展性、并发性和自治性等特点。P2P网络资源包括节点计算资源和分散在节点上的数据资源。如何高效地管理和利用节点资源和数据资源是MPP数据库应用的基础性关键问题。特别是,P2P网络对等、分布式等特点以及节点的异构性、动态性给资源的有效管理带来了很多挑战和困难。一方面,计算及存储节点随着硬件配置的不同,处理效率及资源占用率呈现较大的差异,如果处理不妥当,容易导致“木桶效应”,从而影响数据库整体性能;另一方面,分布式环境下用户访问量、数据变化量以及用户操作模式都是随时变化,容易导致数据库系统出现存储或者处理热点问题。为了提高系统整体操作性能,大规模分布式并行处理数据库必须具有动态弹性的能力来对系统资源以及系统负载进行调整。
目前,国内外很多的研究机构都对分布式资源管理技术进行过大量的研究,主要从资源分配、资源调度及资源整合等方面进行节点负载均衡研究分析,并且取得了一定研究成果。例如发明专利《一种分布式数据库负载均衡预测方法和预测分析器》采用多层循环神经网络模型的方法对本地数据节点的负载指标进行预测;发明专利《对等部署的分布式数据库资源管理与负载调节方法》以及发明专利《基于对等部署的分布式数据库查询优先级管理的实现方法》通过划分资源组,并在各个执行节点上设置一致优先级的方式进行资源管理。现有的负载均衡算法都是在某一个或是某些方面对负载均衡进行了改进,进而来提高系统的效率,大多数算法仍然存在一些缺陷:
(1)有些算法只考虑了部分系统资源的使用情况,不能全面反映节点的真实负载;
(2)有些算法实现起来太复杂,占用了较多的系统资源,增加了系统的负载;
(3)有些算法在进行资源收集时,在网络上产生了较多的数据,占用了较大的网络带宽;
(4)在实际应用中,考虑到数据安全性和性能问题,大型企业很少将数据库部署到云端,分配资源时,将数据库作为整体资源分配给中、小型租户,缺乏灵活性,若租户需要定制若干模式或者数据表,现有的资源分配策略将无法满足租户的需求;
(5)基于负载均衡的单因素资源调度策略具有一定的局限性,不能解决服务器负载相近时的资源调度问题;
(6)在选择分配物理资源的服务器时,采用空间适应原则,忽略了剩余资源被潜在租户利用的可能性,若剩余的资源太少,不能满足任何租户的需求,容易形成资源碎片,造成资源浪费。
发明内容
发明目的:针对以上问题,本发明提出一种分布式并行数据库资源管理方法,解决分布式并行处理数据库因计算及存储节点差异化配置而导致的性能不均衡、不稳定的问题。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种分布式并行数据库资源管理方法,所述数据库包括多个资源调度节点以及资源存储节点,每个资源调度节点和所述多个资源存储节点相连,每个资源调度节点包括内容分发器,所述方法包括步骤:资源调度节点的内容分发器收到资源查询请求,在本地通过基于有向图的Lookahead资源查找算法进行查询;在查询失败时,所述内容分发器根据有向图向邻居节点发送资源查询请求消息,所述资源查询请求消息在所述多个资源调度节点中不断转发,直到找到所需资源;定位到资源存储节点后,单个资源存储节点采用设置完成的cgroups隔离技术进行资源隔离优化。
进一步包括:在查询成功时,直接返回查询结果。
进一步地,所述内容分发器存储叶子节点的拓扑资源信息,以及预先进行文件分片后的文件索引信息和文件的基本信息;叶子节点用于实际数据及资源的存储,同时向内容分发器发送其自身的CPU、内存、IO和网络资源信息。
进一步地,所述多个资源调度节点之间通过分散的非结构化P2P网络关联,资源调度节点和资源存储节点之间采用星型拓扑结构连接。
进一步地,所述基于有向图的Lookahead资源查找算法的网络拓扑为有向图,节点之间的消息转发采用有向图的方式进行,查询节点缓存两级邻居节点的资源信息,在资源查询过程中,查询消息向前传播。
进一步地,所述内容分发器按照以下步骤转发资源查询请求消息:
找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点不是资源查询请求消息的转发节点;
得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的间接邻居节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;
在所述间接邻居节点作为多个直接邻居节点的直接邻居节点时,只转发一次。
进一步地,所述基于cgroups的资源管理隔离包括CPU资源隔离和IO资源隔离。
一种分布式并行数据库,包括多个资源调度节点以及资源存储节点,每个资源调度节点与所述多个资源存储节点相连,每个资源调度节点包括内容分发器,其中,所述内容分发器包括查询请求接收模块、资源查找模块和资源隔离优化模块;
查询请求接收模块,用于接收资源查询请求;
资源查找模块,用于在本地通过基于有向图的Lookahead资源查找算法进行查询,并在查询失败时,根据有向图向邻居节点发送资源查询请求消息,所述资源查询请求消息在所述多个资源调度节点中不断转发,直到找到所需资源;
资源隔离优化模块,用于在定位到资源存储节点后,针对单个资源存储节点采用cgroups隔离技术进行资源隔离优化。
进一步包括:结果返回模块,用于在查询成功时,直接返回查询结果。
进一步地,所述资源查找模块,包括:
第一查找单元,用于找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点不是资源查询请求消息的转发节点;
第二查找单元,用于得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的间接邻居节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;在所述间接邻居节点作为多个直接邻居节点的直接邻居节点时,只转发一次。
有益效果:本发明通过基于分散非结构化P2P网络关联的内容分发器,保证分布式并行处理数据库系统在动态变化的环境中的高性能及稳定性;通过采用基于有向图的资源查找算法,令查询节点缓存两级邻居节点的资源信息,解决因冗余消息过多而导致的网络堵塞问题,降低因差异化配置导致的资源不均衡而产生的“木桶效应”;通过采用linuxcgroups资源管理机制,充分考虑多租户及基于多因素的资源调度策略,减少资源碎片,更好地满足分布式并行处理数据库存储或热点处理问题。
附图说明
图1是本发明管理方法的整体结构示意图;
图2是内容分发器拓扑结构示意图;
图3是本发明实施例中基于有向图的Lookahead资源查找算法拓扑结构图;
图4是本发明实施例中本地节点V需要缓存的信息示意图;
图5是本发明实施例中基于有向图的Lookahead资源查找算法执行过程图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,本发明所述的分布式并行数据库资源管理方法:
(1)在整体结构上,依据P2P对等部署的MPP数据库特征,将常见的数据库节点按照资源功能划分为资源调度节点和资源存储节点,同时在每个资源调度节点中定义内容分发器用于统一的资源管理及调度。
整个系统采用两层的体系结构,上层由资源调度节点以及内容分发器组成,采用非结构化的P2P模式,组成的群组称为管理域。下层由资源存储节点组成,统称为叶子节点。资源调度节点和叶子节点之间采用星型拓扑结构,一个资源调度节点和多个叶子节点相连。
如图2所示,管理域中的资源调度节点核心是内容分发器,主要是部署在各个资源调度节点中的一个资源调度服务,服务之间通过分散的非结构化P2P网络关联,由于没有中心节点的控制,因此具有很高的可扩展性。内容分发器不存储资源及用户数据等内容,而是存储叶子节点的拓扑资源信息,以及分片后的文件索引信息以及文件的基本信息。此外,在非结构化的P2P体系中,节点的加入无关于网络拓扑结构,资源的存储位置并不受控制。因此,节点的状态变化(例如上线和下线)过程中,系统无需对节点的状态信息进行传递,资源也不用改变它的存储位置,这样的特点就保证了系统在较高动态变化的环境中仍具有很好的性能。
叶子节点由资源存储节点组成,对应于MPP数据库的计算节点或数据节点。叶子节点用于实际数据以及资源的存储,同时向内容分发器发送其自身的CPU、内存、IO和网络资源信息。叶子节点同样采用P2P的对等部署方式,各个节点上、下线相互不产生影响,因此具有较高的动态弹性的能力,可扩展性良好,同时满足MPP数据库对等的计算节点部署结构,契合度非常高。
内容分发器与叶子节点之间采用C/S的方式进行通信,这样的通信方式保证了域中查找资源时具有较低的网络带宽消耗和较高的查找速度。
(2)MPP数据库资源管理过程;
(2.1)资源存储过程;
资源存储节点负责存储文件的分片,同时定时向内容分发器发送自己的CPU、内存、IO、网络等资源性能信息。资源存储节点具备以下功能:
能力信息上传:该功能定时向内容分发器发送节点的CPU、内存、IO、网络等性能信息,作为内容分发器如何选取数据库计算节点的依据。
文件分片存储:该功将保证文件分片以及其他相关信息存储到本地磁盘上。
文件分片上传:该功能保证在接收到内容分发器的请求后,在本地磁盘中找到对应的文件分片,然后计算结果上传给内容分发器。
资源调度节点内,内容分发器通过资源信息表存储叶子节点的CPU、内存、IO、网络资源信息。并通过非结构化P2P有向图网络关联,保证高可靠性。
(2.2)资源获取过程;
资源查询时,首先向内容分发器发送请求,内容分发器收到请求后,通过资源查找算法寻找对应表的空闲存储节点,通过资源存储节点获取所需的文件分片,对文件进行重组,然后将重组的文件发送给查询节点,完成数据资源的分布式查询。
当需要获取资源时,需经过以下步骤。
步骤1:资源存储节点的初始化,设置cgroups相关的cpu、IO参数,对相关资源进行优先级、上限设置;
步骤2:MPP数据库连接请求首先发给内容分发器进行资源查询;
步骤3:内容分发器收到资源查询请求时,首先在本地通过基于有向图的Lookahead资源查找算法进行查询,如果查询成功,则返回查询结果;
步骤4:如果查询失败,内容分发器会根据有向图向邻居节点发送查询请求,如此,请求信息会在整个上层的非结构化P2P网络中不断转发,直到找到所需资源;
步骤5:当定位到资源存储节点后,针对单个资源存储节点采用设置完成的cgroups的隔离技术进行资源隔离优化,从而优化单个计算节点在数据查询、数据写入等方面的计算效率。
(3)采用基于有向图Lookahead的资源查找算法,令查询节点缓存两级邻居节点的资源信息,在资源查询过程中,查询消息向前传播,以解决因冗余消息过多而导致的网络堵塞问题,同时,采用Lookahead思路进行资源查找,有效降低因资源不均衡而产生的“木桶效应”。
内容分发器的资源查找算法主体采用广度优先查找算法,同时应满足资源因素考虑尽量多、无单点失效问题、查找速度高、可扩展性好等特点,具体设计思路如下:
1、以Lookahead算法为基础,通过采用有向图的方式,缓存查询节点两级邻居节点的路由信息,在资源查询过程中,查询消息向前传播,以解决单点失效的问题;
2、采用广度优先查找算法思路,满足查找速度高的要求;
3、综合考虑CPU、内存、IO及网络等资源因素,全面反映节点的真实负载;
4、查找算法充分利用各个内容分发器中存储的资源信息表,减少在资源查找过程中产生的冗余信息量,降低网络带宽消耗,提高系统的可扩展性。
基于有向图的Lookahead资源查找算法的网络拓扑为有向图,节点之间的消息转发采用有向图的方式进行,从而避免了因消息无限转发导致的网络风暴,降低了网络带宽消耗。
对于节点存储的路由信息的更新方式采用事件驱动策略:当相关信息发生改变后对节点发送更新消息,同时将更新内容发送给节点。采用这种方式,可以大大降低为维护这些信息一致性所消耗的网络带宽和相关信息的传输频率。
资源信息表采用普通的二维表结构方式,字段包含CPU、内存、IO及网络,记录每个叶子节点的相关资源信息,并采用定时更新和事件驱动两种策略进行更新维护。
叶子节点资源值的计算过程采用乘积累加法,将资源信息因素与影响因子的乘积进行累加,得出最终的资源值。并定义阈值范围,用于判断节点资源使用情况。定义:
直接邻居:该节点在网络拓扑图中指向的节点;
间接邻居:该节点在网络拓扑图中的直接邻居指向的节点;
父节点:在网络拓扑图中指向该节点的节点。
内容分发器按照以下步骤转发资源查询请求消息:
Step 1:找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点也不是资源查询请求消息的转发节点;
Step2:得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;
Step3:间接邻居节点如果作为多个直接邻居节点的直接邻居节点,则只转发一次。
(4)对叶子节点采用linuxcgroups(control groups)进行操作系统级的资源管理机制,充分考虑多租户及基于多因素的资源调度策略,限制、记录、隔离进程组(processgroups)所使用的物理资源(如:cpu、memory、IO等),有效减少资源碎片,从而使系统资源得到充分利用。
cgroups是control groups的缩写,是Linux内核提供的一种可以限制、记录、隔离进程组所使用的物理资源的机制。Cgroups将整个操作系统看做资源池,主要实现限制进程组可以使用的资源数量、进程组的优先级控制、进程组隔离等功能。
当定位到资源存储节点后,为了针对不同优先级请求或者用户提供精细化的资源管理,例如在同一个节点同时写入数据时按照优先级等规则进行写入,为使资源进行合理分配,针对单个资源存储节点采用基于cgroups的隔离技术进行资源隔离管理。
(4.1)CPU资源隔离:通过配置资源池的priority参数和cpu_percent参数实现CPU的资源隔离和按优先级共享。其中,priority为优先级参数,cpu_percent为相对权重。当一个cgroup中的任务空闲即未完全使用CPU时间时,剩余时间被收集到一个公共的未使用cpu池中。其他cgroup允许借用这个池中的CPU时间。这表现为CPU满负荷的情况下按比例分配,在CPU空闲的情况下按需分配,资源在各组间可以共享。
表1
(4.2)IO资源隔离:使用cgroups的blkio子系统控制和监测块设备的I/O访问。blkio子系统不支持带缓冲的写操作,它主要针对直接I/O操作,带缓冲的读操作起作用。通过weight和weight_device两个参数设定权重划分,内部通过linux内核完全公平队列I/O调度器来实现,这个策略允许设置指定cgroup的权重,每个cgroup可以有一个全部I/O操作的百分比。同时通过配置资源池的write_bps_device和throttle.read_bps_device参数限定资源池的磁盘I/O读写速率上限。
表2
本发明通过基于分散非结构化P2P网络关联的内容分发器,保证分布式并行处理数据库系统在动态变化的环境中的高性能及稳定性;通过采用基于有向图Lookahead的资源查找算法,令查询节点缓存两级邻居节点的资源信息,解决因冗余消息过多而导致的网络堵塞问题,降低因差异化配置导致的资源不均衡而产生的“木桶效应”;通过采用linuxcgroups资源管理机制,充分考虑多租户及基于多因素的资源调度策略,减少资源碎片,更好地满足分布式并行处理数据库存储或热点处理问题。
下面举例说明某个节点需要缓存的信息。
如图3所示,基于有向图的Lookahead资源查找算法拓扑结构,节点V的直接邻居节点为节点U和节点X,间接邻居节点为节点X和节点Y,直接邻居节点父节点为节点U和节点Y,基于此,节点V需要保存的信息如图4所示。
如图5所示,基于有向图的Lookahead资源查找算法执行过程中,X是资源查询请求消息的发起节点,节点N中含有所需资源,具体的查找过程包括以下几个步骤:
步骤1:开始时,节点X查询自己的资源信息列表以及自己缓存的邻居资源信息列表,未找到所需资源,按照规则转发查询资源请求消息到间接邻居节点V,节点V未存储所需资源,V的直接邻居节点有X,U,W1,W2,W3,W4;
步骤2:对节点V的直接邻居节点进行以下操作:节点X是资源查询请求消息的发起节点,不需要处理,节点U是X的直接邻居节点,不需要操作,因此只需要对W1,W2,W3,W4节点进行查询,这四个节点也未存储所需资源,于是向这四个节点的直接邻居节点转发资源查询请求消息;
步骤3:W1没有直接邻居节点,不需要转发;
步骤4:W2的直接邻居节点为W1和Y1,W1是节点V的直接邻居节点,不需要转发,节点Y1需要转发;
步骤5:W3的直接邻居节点为Y1和Y2,节点Y1被转发过一次,不需要再次转发,Y2需要转发;
步骤6:W4的直接邻居节点为Y3和N,节点Y和N都满足转发条件,需要转发。最终在节点N中找到所需要的资源。
在这个过程中,转发消息仅经过了节点X,V,Y1,Y2,Y3和N。图5中虚线表示出了资源查询请求消息的转发路线。
对于MPP数据库,其基于linuxcgroups的动态资源池的优先级和百分比可用二维表表示,下表为一个典型案例,其中横向包括三个资源优先级,从高到低依次为Level1、Level2、Level3,纵向按照MPP数据库案例内部功能划分为6个资源组,依次为超级组(Superpool)、OLTP组、OLAP组、加载组(Load pool)、开发组(Develop pool)、其他组(Otherpool),根据功能优先级设置示例如下:
表3
资源组 Level1 Level2 Level3
Super pool 90%
OLTP pool 50%
OLAP pool 20%
Load pool 10%
Develop pool 50%
Other pool 50%
本发明还提供一种分布式并行数据库,包括多个资源调度节点以及资源存储节点,每个资源调度节点与所述多个资源存储节点相连,每个资源调度节点包括内容分发器,其中,所述内容分发器包括查询请求接收模块、资源查找模块和资源隔离优化模块。
查询请求接收模块,用于接收资源查询请求;资源查找模块,用于在本地通过基于有向图的Lookahead资源查找算法进行查询,并在查询失败时,根据有向图向邻居节点发送资源查询请求消息,所述资源查询请求消息在所述多个资源调度节点中不断转发,直到找到所需资源;资源隔离优化模块,用于在定位到资源存储节点后,针对单个资源存储节点采用cgroups隔离技术进行资源隔离优化。
本发明还包括结果返回模块,用于在查询成功时,直接返回查询结果。
资源查找模块,包括第一查找单元和第二查找单元。第一查找单元,用于找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点不是资源查询请求消息的转发节点;第二查找单元,用于得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的间接邻居节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;在所述间接邻居节点作为多个直接邻居节点的直接邻居节点时,只转发一次。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (8)

1.一种分布式并行数据库资源管理方法,其特征在于,所述数据库包括多个资源调度节点以及多个资源存储节点,每个资源调度节点和所述多个资源存储节点相连,每个资源调度节点包括内容分发器,所述方法包括步骤:资源调度节点的内容分发器收到资源查询请求,在本地通过基于有向图的Lookahead资源查找算法进行查询;在查询失败时,所述内容分发器根据有向图向邻居节点发送资源查询请求消息,所述资源查询请求消息在所述多个资源调度节点中不断转发,直到找到所需资源;定位到资源存储节点后,单个资源存储节点采用设置完成的cgroups隔离技术进行资源隔离优化;
所述内容分发器存储叶子节点的拓扑资源信息,以及预先进行文件分片后的文件索引信息和文件的基本信息;叶子节点用于实际数据及资源的存储,同时向内容分发器发送其自身的CPU、内存、IO和网络资源信息;
所述多个资源调度节点之间通过分散的非结构化P2P网络关联,资源调度节点和资源存储节点之间采用星型拓扑结构连接。
2.根据权利要求1所述的分布式并行数据库资源管理方法,其特征在于,进一步包括:在查询成功时,直接返回查询结果。
3.根据权利要求1所述的分布式并行数据库资源管理方法,其特征在于,所述基于有向图的Lookahead资源查找算法的网络拓扑为有向图,节点之间的消息转发采用有向图的方式进行,查询节点缓存两级邻居节点的资源信息,在资源查询过程中,查询消息向前传播。
4.根据权利要求1所述的分布式并行数据库资源管理方法,其特征在于,所述内容分发器按照以下步骤转发资源查询请求消息:
找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点不是资源查询请求消息的转发节点;
得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的间接邻居节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;
在所述间接邻居节点作为多个直接邻居节点的直接邻居节点时,只转发一次。
5.根据权利要求1所述的分布式并行数据库资源管理方法,其特征在于,所述采用设置完成的cgroups隔离技术进行资源隔离优化包括CPU资源隔离和IO资源隔离。
6.一种分布式并行数据库,其特征在于,包括多个资源调度节点以及多个资源存储节点,每个资源调度节点与所述多个资源存储节点相连,每个资源调度节点包括内容分发器,其中,所述内容分发器包括查询请求接收模块、资源查找模块和资源隔离优化模块;
查询请求接收模块,用于接收资源查询请求;
资源查找模块,用于在本地通过基于有向图的Lookahead资源查找算法进行查询,并在查询失败时,根据有向图向邻居节点发送资源查询请求消息,所述资源查询请求消息在所述多个资源调度节点中不断转发,直到找到所需资源;
资源隔离优化模块,用于在定位到资源存储节点后,针对单个资源存储节点采用cgroups隔离技术进行资源隔离优化;
所述内容分发器存储叶子节点的拓扑资源信息,以及预先进行文件分片后的文件索引信息和文件的基本信息;叶子节点用于实际数据及资源的存储,同时向内容分发器发送其自身的CPU、内存、IO和网络资源信息;
所述多个资源调度节点之间通过分散的非结构化P2P网络关联,资源调度节点和资源存储节点之间采用星型拓扑结构连接。
7.根据权利要求6所述的分布式并行数据库,其特征在于,进一步包括:结果返回模块,用于在查询成功时,直接返回查询结果。
8.根据权利要求6所述的分布式并行数据库,其特征在于,所述资源查找模块,包括:
第一查找单元,用于找到满足条件的直接邻居节点,应当满足的条件为:该直接邻居节点的父节点不是资源查询请求消息的转发节点,且该直接邻居节点不是资源查询请求消息的转发节点;
第二查找单元,用于得到满足条件的直接邻居节点后,在这些直接邻居节点的直接邻居节点中找到满足条件的间接邻居节点,应当满足的条件为:该节点不是资源查询请求消息的转发节点且该节点不是该转发节点的直接邻居节点;在所述间接邻居节点作为多个直接邻居节点的直接邻居节点时,只转发一次。
CN201910242182.6A 2019-03-28 2019-03-28 分布式并行数据库资源管理方法 Active CN110119405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910242182.6A CN110119405B (zh) 2019-03-28 2019-03-28 分布式并行数据库资源管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910242182.6A CN110119405B (zh) 2019-03-28 2019-03-28 分布式并行数据库资源管理方法

Publications (2)

Publication Number Publication Date
CN110119405A CN110119405A (zh) 2019-08-13
CN110119405B true CN110119405B (zh) 2023-10-13

Family

ID=67520571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910242182.6A Active CN110119405B (zh) 2019-03-28 2019-03-28 分布式并行数据库资源管理方法

Country Status (1)

Country Link
CN (1) CN110119405B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159443B (zh) * 2019-12-31 2022-03-25 深圳云天励飞技术股份有限公司 一种图像特征值的搜索方法、装置及电子设备
CN112749005B (zh) * 2020-07-10 2023-10-31 腾讯科技(深圳)有限公司 资源数据处理方法、装置、计算机设备和存储介质
CN112506654B (zh) * 2020-12-07 2023-07-18 中国船舶集团有限公司第七一六研究所 一种工业机器人分布式协同调试方法及系统
CN116916054B (zh) * 2023-09-14 2023-12-05 美冠(北京)科技有限公司 基于云播控的数字化媒介内容分发系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286678A1 (en) * 2014-04-02 2015-10-08 Futurewei Technologies, Inc. System and Method for Massively Parallel Processing Database
CN105183554A (zh) * 2015-07-31 2015-12-23 国家超级计算深圳中心(深圳云计算中心) 高性能计算与云计算混合计算系统及其资源管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286678A1 (en) * 2014-04-02 2015-10-08 Futurewei Technologies, Inc. System and Method for Massively Parallel Processing Database
CN105183554A (zh) * 2015-07-31 2015-12-23 国家超级计算深圳中心(深圳云计算中心) 高性能计算与云计算混合计算系统及其资源管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
非结构化对等网信息缓存资源查找算法;王艳丽 等;《小型微型计算机系统》;20080915(第09期);第1657-1663页 *

Also Published As

Publication number Publication date
CN110119405A (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN110119405B (zh) 分布式并行数据库资源管理方法
Kalia et al. Analysis of hadoop MapReduce scheduling in heterogeneous environment
US9342574B2 (en) Distributed storage system and distributed storage method
KR101928529B1 (ko) 코드 분산 해쉬테이블 기반의 맵리듀스 시스템 및 방법
EP2710470B1 (en) Extensible centralized dynamic resource distribution in a clustered data grid
US10866970B1 (en) Range query capacity allocation
US11048716B1 (en) Managed virtual warehouses for tasks
US20200042608A1 (en) Distributed file system load balancing based on available node capacity
Chen et al. E2FS: an elastic storage system for cloud computing
CN104679594A (zh) 一种中间件分布式计算方法
Arfat et al. Big data for smart infrastructure design: Opportunities and challenges
US10942651B1 (en) Network data management protocol redirector
Wang et al. Actcap: Accelerating mapreduce on heterogeneous clusters with capability-aware data placement
Jeong et al. Towards energy-efficient service scheduling in federated edge clouds
Sun et al. SORD: a new strategy of online replica deduplication in Cloud-P2P
Selvi et al. Popularity (hit rate) based replica creation for enhancing the availability in cloud storage
Abdi et al. The Impact of Data Replicatino on Job Scheduling Performance in Hierarchical data Grid
CN104683480A (zh) 一种基于应用的分布式计算方法
WO2012124295A1 (ja) コンピュータシステム、制御システム、制御方法および制御プログラム
Wen et al. Load balancing consideration of both transmission and process responding time for multi-task assignment
Sharma et al. A review on data locality in hadoop MapReduce
US20100299386A1 (en) Computer-based system comprising several nodes in a network
Xue et al. Two phase enhancing replica selection in cloud storage system
CN101729387A (zh) 内容节点双向聚类的系统、装置及方法
Wei et al. Towards a cloud storage data management model based on RNPT network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 19 Chengxin Avenue, Moling Street, Jiangning District, Nanjing City, Jiangsu Province, 211106

Patentee after: Nanjing Nanrui Ruizhong Data Co.,Ltd.

Country or region after: China

Patentee after: NARI Group Corp.

Patentee after: STATE GRID CORPORATION OF CHINA

Patentee after: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd.

Address before: 210000 180 software Avenue, Yuhuatai District, Nanjing, Jiangsu Province

Patentee before: CHINA REALTIME DATABASE Co.,Ltd.

Country or region before: China

Patentee before: NARI Group Corp.

Patentee before: STATE GRID CORPORATION OF CHINA

Country or region before: China

Patentee before: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd.

CP03 Change of name, title or address