CN105279026A - 一种分布式云计算环境中基于p2pt健康组网方法 - Google Patents

一种分布式云计算环境中基于p2pt健康组网方法 Download PDF

Info

Publication number
CN105279026A
CN105279026A CN201410331069.2A CN201410331069A CN105279026A CN 105279026 A CN105279026 A CN 105279026A CN 201410331069 A CN201410331069 A CN 201410331069A CN 105279026 A CN105279026 A CN 105279026A
Authority
CN
China
Prior art keywords
node
computing
core calculations
core
p2pt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410331069.2A
Other languages
English (en)
Inventor
王坤侠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Boi Automation Science And Technology Co Ltd
Original Assignee
Shanghai Boi Automation Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Boi Automation Science And Technology Co Ltd filed Critical Shanghai Boi Automation Science And Technology Co Ltd
Priority to CN201410331069.2A priority Critical patent/CN105279026A/zh
Publication of CN105279026A publication Critical patent/CN105279026A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种分布式计算环境中基于P2PT健康组网方法,包括以下步骤:a.定时对计算节点进行健康状态检查;b.经过较长周期的健康数据作为依据,并计算健康评分;c.自动挑选评分较高的计算节点升级成核心计算节点;d。核心计算节点进行网状拓扑形式组网;e.实现以核心计算节点群组为核心的分布式云计算环境。本发明使整个分布式云计算系统运行更加稳定可靠,更可以实现更多传统P2P网络无法实现的功能需求。

Description

一种分布式云计算环境中基于P2PT健康组网方法
技术领域
本发明涉及分布式云计算系统的领域,具体涉及一种基于P2PT健康组网方法,特别是基于核心计算节点群组的网状拓扑结构的组网方法。
背景技术
利用海量闲置计算机的计算力实现分布式云计算系统的领域。进行大规模组网的问题之一是海量计算机之间的计算任务能够高效调度。传统P2P对等互连技术,由于受到并发连接数的限制,无法满足海量高效调度的需求。且传统P2P对等互连技术由于缺乏有效的调度模块,导致更有价值、更具挑战的新需求无法满足,仅能完成诸如BT下载、视频流等基本功能需求。因此,分布式云计算系统需要一种海量高效的调度方法。使整个分布式云计算系统能够满足更加丰富的功能需求,进而为超大规模分布式云计算系统提供广泛的商业化空间,轻松完成诸如超大规模科学计算、海量大数据分析、并行计算等应用。
发明内容
本发明的目的在于提供一种分布式计算环境中基于P2PT健康组网方法,解决了分布式云计算系统中海量计算机之间的高效调度问题。
分布式云计算系统中,每台计算机都是一个计算节点,计算节点分为普通计算节点和核心计算节点,多个核心节点组成核心计算节点群组。每台计算机接入云计算系统后,都将作为普通计算节点提供计算力。同时计算节点定时检查本机的健康状态,并计算健康评分。核心计算节点检查当前组网规模,当需要扩容增加核心计算节点时,自动挑选健康评分较高的计算节点升级成核心计算节点。升级后的核心计算节点将进行网状拓扑组网,并入核心计算节点群组。
此过程中,完全由计算节点计算机根据既定算法自动完成,无需任何干预。每个核心计算节点将同时连接500-2000个普通计算节点,并依托群组资源进行高效调度。每个核心计算节点将同时连接百个其他核心计算节点,能够同时调度的普通计算节点计算机多达数十上百万台。
所述P2PT健康组网方法分为四大部分,分别为:计算节点、健康状态检查评分算法、核心计算节点群组、高效调度算法。
所述计算节点,由普通计算节点和核心计算节点组成。普通计算节点负责为云平台提供计算力资源,核心计算节点负责居中高效调度任务和调配计算力资源。普通计算节点同时连接2-5个核心计算节点,核心计算节点同时连接500-2000个普通计算节点和上百个其他核心计算节点。
所述健康状态检查评分算法,是一套能够检查计算机自身健康状态的评分算法,参数包括但不限于开机时段、带宽提供商、带宽测速、路由跳数、公网IP资源、Socket并发能力、CPU型号、GPU型号、物理内存、CPU资源日常消耗均值、磁盘测速。根据参数权重综合计算健康评分。健康评分标准100分。计算节点定时对自身健康状态评分并上报。当云计算系统需要新的核心计算节点时,将根据健康评分确定评分最高的普通计算节点升级成核心计算节点。
所述核心计算节点群组,每个核心计算节点都保持连接上百个其他核心计算节点。多个核心计算节点相互连接,形成一个网状结构的核心计算节点群组。
所述高效调度算法,核心计算节点负责分配计算任务,调度计算力资源。基于核心计算节点群组互连,实时汇总分享各个核心计算节点当前计算力状况数据。核心计算节点通过第一级调度在直接连接的普通计算节点内分配计算任务;未分配完的任务,通过直接连接的其他核心计算节点第二级调度在间接连接的普通计算节点内分配计算任务;仍未分配完的任务,通过委托某个空闲核心计算节点的方式继续分配,直至完成。通过该调度算法,即便数十万个并行任务,也将在二级调度内就已分配完成。
附图说明
图1为本发明的实施例中核心计算节点内部拓扑结构示意图。
图2为本发明的实施例中核心计算节点群组内部拓扑结构示意图。
图3为本发明的实施例中提供了健康状态检查算法流程示意图。
图4为本发明的实施例中提供了高效调度算法流程示意图。
具体实施方式
以下结合附图,具体说明本发明。
首先,结合附图1,普通计算节点1-1,接入云计算系统,与核心计算节点1-2连接,即接入成功。每个核心计算节点可接入500-2000个普通计算节点。
然后,结合附图2,核心计算节点2-1与2-2\2-3\2-4\2-5\2-6\2-7相互连接,核心计算节点2-2可与上百个其他核心计算节点互连,数以万计的核心计算节点相互交织,形成网状拓扑结构的群组。
当核心计算节点中的普通计算节点连接达到一定数量时,将普通计算节点中健康评分最高的计算节点升级成核心计算节点,并重定向已连接的普通计算节点到新的核心计算节点上,完成扩容。
健康评分状态检查流程,结合附图3,计算节点通知核心计算节点开始健康状态检查3-1,核心计算节点随机分配若干个普通计算节点配合健康检查流程;计算节点与被分配的计算节点协同进行网络参数检测3-2;然后检测本机内部CPU、内存、硬盘等各个参数3-3;参数检测完成后,通过加权平均算法,计算健康评分,并上报健康评分到核心计算节点3-4。
最后,高效调度算法流程实施过程,结合附图4,进行详细描述。
1、核心计算节点分配任务时,直接连接的普通计算节点内分配计算任务4-1;
2、未分配完的任务,通过群组内直接连接的其他核心计算节点再分配计算任务4-2;
3、仍未分配完的任务,委托某个空闲核心计算节点的方式继续分配4-3;
4、直至任务分配完成4-4。

Claims (4)

1.一种分布式云计算环境中基于P2PT健康组网方法,其特征在于,包括以下步骤:
a.计算节点按照健康评分,划分为普通计算节点和核心计算节点,分别负责提供计算力和居中调度工作;
b.核心计算节点间连接成网状拓扑结构的群组;
c.核心计算节点分配任务时,优先在核心节点内部分配任务,然后通过核心计算节点群组间接分配任务,最后委托某个空闲核心计算节点继续分配任务,直至完成。
2.根据权利要求1所述的基于P2PT健康组网方法,其特征在于步骤a中,是否按照计算机健康评分,划分了提供计算力节点和居中调度节点。
3.根据权利要求1所述的基于P2PT健康组网方法,其特征在于步骤b中,负责居中调度任务的核心计算节点是否相互连接成网状拓扑结构。
4.根据权利要求1所述的基于P2PT健康组网方法,其特征在于步骤c中,是否只由核心计算节点分配任务。
CN201410331069.2A 2014-07-10 2014-07-10 一种分布式云计算环境中基于p2pt健康组网方法 Pending CN105279026A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410331069.2A CN105279026A (zh) 2014-07-10 2014-07-10 一种分布式云计算环境中基于p2pt健康组网方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410331069.2A CN105279026A (zh) 2014-07-10 2014-07-10 一种分布式云计算环境中基于p2pt健康组网方法

Publications (1)

Publication Number Publication Date
CN105279026A true CN105279026A (zh) 2016-01-27

Family

ID=55148077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410331069.2A Pending CN105279026A (zh) 2014-07-10 2014-07-10 一种分布式云计算环境中基于p2pt健康组网方法

Country Status (1)

Country Link
CN (1) CN105279026A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562956A (zh) * 2017-09-30 2018-01-09 麦格创科技(深圳)有限公司 分布式爬虫任务分配方法及系统
CN108334738A (zh) * 2017-12-29 2018-07-27 创业软件股份有限公司 一种针对分布式大数据处理的算力动态分配方法
WO2019061385A1 (zh) * 2017-09-30 2019-04-04 麦格创科技(深圳)有限公司 分布式爬虫任务分配方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562956A (zh) * 2017-09-30 2018-01-09 麦格创科技(深圳)有限公司 分布式爬虫任务分配方法及系统
WO2019061385A1 (zh) * 2017-09-30 2019-04-04 麦格创科技(深圳)有限公司 分布式爬虫任务分配方法及系统
CN108334738A (zh) * 2017-12-29 2018-07-27 创业软件股份有限公司 一种针对分布式大数据处理的算力动态分配方法

Similar Documents

Publication Publication Date Title
CN105729491B (zh) 机器人任务的执行方法、装置及系统
TWI547817B (zh) 叢集運算架構的資源規劃方法、系統及裝置
CN109492774B (zh) 一种基于深度学习的云资源调度方法
CN104281496A (zh) 虚拟资源的分配方法及分配装置
CN103457752A (zh) 一种虚拟网络映射方法
CN104104621B (zh) 一种基于非线性降维的虚拟网络资源动态自适应调节方法
CN107209746A (zh) 模型参数融合方法及装置
CN107426003A (zh) 一种故障检测方法及装置
CN103957280B (zh) 一种物联网中的传感网络连接分配和调度方法
CN114996018A (zh) 面向异构计算的资源调度方法、节点、系统、设备及介质
CN102110014A (zh) 虚拟机负载均衡处理的方法
CN103941662A (zh) 一种基于云计算的任务调度系统和调度方法
CN106375328A (zh) 一种大规模数据分发系统运行时自适应优化方法
Bukhsh et al. A decentralized edge computing latency-aware task management method with high availability for IoT applications
CN109819032A (zh) 一种联合考虑基站选择与计算迁移的云机器人任务分配方法
CN103997515B (zh) 一种分布式云中计算中心选择方法及其应用
CN102012891A (zh) 计算机集群管理方法、装置和系统
CN105279026A (zh) 一种分布式云计算环境中基于p2pt健康组网方法
CN112084015A (zh) 一种基于云计算的仿真云平台搭建系统及方法
CN105553732A (zh) 一种分布式网络模拟方法及系统
CN104809026B (zh) 一种使用远程节点借用cpu计算资源的方法
CN102098223B (zh) 节点设备调度方法、装置和系统
CN103678537B (zh) 基于集群的元数据修改方法、装置及节点设备
CN108304261A (zh) 一种基于6D-Torus网络的作业调度方法和装置
CN105138391B (zh) 面向广域分布云系统公平的多任务虚拟机分配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: SHANGHAI BOI AUTOMATION SCIENCE AND TECHNOLOGY CO., LTD.

Document name: Notification of before Expiration of Request of Examination as to Substance

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: SHANGHAI BOI AUTOMATION SCIENCE AND TECHNOLOGY CO., LTD.

Document name: Notification that Application Deemed to be Withdrawn

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160127