CN104219226B - 一种确定云平台中最优通信代理节点数目的方法 - Google Patents

一种确定云平台中最优通信代理节点数目的方法 Download PDF

Info

Publication number
CN104219226B
CN104219226B CN201410395123.XA CN201410395123A CN104219226B CN 104219226 B CN104219226 B CN 104219226B CN 201410395123 A CN201410395123 A CN 201410395123A CN 104219226 B CN104219226 B CN 104219226B
Authority
CN
China
Prior art keywords
cloud platform
communication agent
represent
virtual machine
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410395123.XA
Other languages
English (en)
Other versions
CN104219226A (zh
Inventor
任海军
龙澜
潘璐璐
吴良俊
郭晓东
吴海燕
王博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Yibang Science And Technology Co ltd
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201410395123.XA priority Critical patent/CN104219226B/zh
Publication of CN104219226A publication Critical patent/CN104219226A/zh
Application granted granted Critical
Publication of CN104219226B publication Critical patent/CN104219226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明的目的是解决现有技术没有确定云平台中最优通信代理节点的数目的问题。为实现本发明目的而采用的技术方案是这样的,一种确定云平台中最优通信代理节点数目的方法,构建一个包括一台控制节点服务器和若干台计算节点服务器的云平台,每一台所述的计算节点服务器上构建若干台虚拟机。所述云平台基于OpenStackHavana版搭建。在所述云平台的服务器上构建若干个通信代理节点,所述通信代理节点用于管理虚拟机。根据map阶段(分发处理阶段)总耗时、Reduce阶段(合并处理阶段)总耗时和MapReduce进程(大数据处理进程)过程耗时的表达式确定获得云平台中最优的通信代理节点数目。

Description

一种确定云平台中最优通信代理节点数目的方法
技术领域
本发明涉及云平台大数据处理。
背景技术
基于云平台的大数据处理集群由于其弹性可伸缩的计算框架以及“按需获取”的新型业务模式正逐渐的被工业界采纳。
从OpenStack Grizzly版开始,为了改善虚拟网络的性能和可靠性,可以允许租户在多主机上部署通信代理节点。但是,虚拟网络组件Neutron只实现了虚拟网络的通信功能,并没有进一步关注虚拟网络通信性能的提升。也就是说,没有提供有效的通信代理节点部署分配策略。而针对基于OpenStack的Hadoop集群,我们需要如何去设计通信代理分配策略来优化虚拟网络的性能以提升集群大数据处理的能力是我们亟需解决的问题。具体来说,就是为基于OpenStack的虚拟网络优化部署提供解决方案,而其中一个关键问题就是要确定云平台中最优通信代理节点的数目。
发明内容
本发明的目的是解决现有技术没有确定云平台中最优通信代理节点的数目的问题。
为实现本发明目的而采用的技术方案是这样的,一种确定云平台中最优通信代理节点数目的方法,构建一个包括一台控制节点服务器和若干台计算节点服务器的云平台,每一台所述的计算节点服务器上构建若干台虚拟机。所述云平台基于OpenStack Havana版搭建。在所述云平台的服务器上构建若干个通信代理节点,所述通信代理节点用于管理虚拟机。
所述通信代理节点的数目k通过以下步骤确定:
1)map阶段(分发处理阶段)总耗时:
其中,代表map阶段总耗时,m代表计算节点服务器的数量,ni代表第i号计算节点服务器上虚拟机的数量,代表map阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,S代表map阶段稳态时,固定时间段内输入云平台的数据总大小的期望,B代表任意两个计算节点服务器之间传输1GB数据所需时间,μij代表第i号计算节点服务器上的第j台虚拟机当前的处理能力,μtotal代表当前云平台中所有虚拟机的性能总和,k代表云平台中通信代理节点的数目,Na代表构建在有通信代理的服务器上的虚拟机数量之和。
2)Reduce阶段(合并处理阶段)总耗时:
其中:代表reduce阶段总耗时,m代表计算节点服务器的数量,ni代表第i号计算节点服务器上虚拟机的数量,代表reduce阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,Sr代表reduce阶段稳态时,固定时间段内输入的数据总大小的期望,nr处理reduce阶段数据的虚拟机的数量,B代表任意两个计算节点服务器之间传输1GB数据所需时间,k代表云平台中通信代理节点的数目,μtotal代表当前云平台中所有虚拟机的性能总和,Na代表构建在有通信代理的服务器上的虚拟机数量之和。
3)MapReduce进程(大数据处理进程)过程耗时的表达式:
4)根据Ttotal的表达式,求解获得云平台中最优的通信代理节点数目的表达式:
本发明的技术效果是毋庸置疑的。基于上述方法,为基于OpenStack的虚拟网络优化部署提供了解决方案,解决了其中一个关键问题--确定云平台中最优通信代理节点的数目。
附图说明
图1为云平台大数据处理流程示意图。
图2为最优通信代理节点的数目确定流程图。
图3为实施例2的实验效果。
图4为实施例3的实验效果。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
本实施例公开一种确定云平台中最优通信代理节点数目的方法。根据现有技术,将要构建一个包括一台控制节点服务器和m台计算节点服务器的云平台,计算节点服务器的编号用变量i表示,i=1、2……m。每一台(第i台)所述的计算节点服务器上构建ni,i=1、2……m台虚拟机,虚拟机的编号用变量j表示,j=1、2……ni。有的计算节点服务器上没有虚拟机,则对应的ni=0。所述云平台基于OpenStack Havana版搭建。在所述云平台的计算节点服务器上构建k个通信代理节点,所述通信代理节点用于管理虚拟机。值得说明的是,m和ni(即{n1、n2……nm})的具体值是确定的,通信代理节点数目k待定。
最优的通信代理节点数目k通过以下步骤确定:
1)map阶段(分发处理阶段)总耗时:
Map阶段分为三个过程:第一步,将大数据切分成小型数据块,然后分发给平台中的通信代理;第二步,通信代理将第一阶段传输过来的数据分发给它负责的虚拟机;第三步,虚拟机处理通信代理转发来的数据。
其中,代表map阶段总耗时,m代表计算节点服务器的数量,ni代表第i台计算节点服务器上虚拟机的数量,代表map阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,S代表map阶段稳态时,固定时间段内输入云平台的数据总大小的期望,B代表任意两个计算节点服务器之间传输1GB数据所需时间,μij代表第i号计算节点服务器上的第j台虚拟机当前的处理能力,μtotal代表当前云平台中所有虚拟机的性能总和,k代表云平台中通信代理节点的数目(待求),Na代表构建在有通信代理的服务器上的虚拟机数量之和。
2)Reduce阶段(合并处理阶段)总耗时:
Reduce阶段的工作由三部分构成:第一部分,Mapper将处理完的结果提交给负责它的通信代理。第二部分,所有通信代理将汇聚过来的结果发送给Reducer的通信代理。第三部分,Reducer通信代理将结果转发给目的虚拟机。
其中:代表reduce阶段总耗时,m代表计算节点服务器的数量,ni代表第i号计算节点服务器上虚拟机的数量,代表reduce阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,Sr代表reduce阶段稳态时,固定时间段内输入的数据总大小的期望,nr代表reduce阶段数据的虚拟机的数量,B代表任意两个计算节点服务器之间传输1GB数据所需时间,k代表云平台中通信代理节点的数目,μtotal代表当前云平台中所有虚拟机的性能总和,Na代表构建在有通信代理的服务器上的虚拟机数量之和。
3)MapReduce进程(大数据处理进程)过程耗时的表达式:
4)根据Ttotal的表达式,求解获得云平台中最优的通信代理节点数目k:
N代表map阶段在MapReduce进程(大数据处理进程)中可用的虚拟机数量,S代表map阶段稳态时,固定时间段内输入云平台的数据总大小的期望,μtotal代表map阶段当前云平台中所有虚拟机的性能总和,Sr代表reduce阶段稳态时,固定时间段内输入的数据总大小的期望,nr代表reduce阶段数据的虚拟机的数量,B代表reduce阶段任意两个计算节点服务器之间传输1GB数据所需时间。
实施例2
一种确定云平台中最优通信代理节点的数目的方法,构建一个包括一台控制节点服务器和3台计算节点服务器的云平台。每一台所述的计算节点服务器上构建若干台虚拟机,即第1台计算节点服务器上构建有3台虚拟机,第2台计算节点服务器上构建有2台虚拟机,第3台计算节点服务器上构建有3台虚拟机。所述云平台基于OpenStack Havana版搭建。
本发明所求得最优通信代理数目表达式
N=8个(平台搭建好后即可得出该数),S=2.1GB(以vSphere测得),nr=4个(平台搭建好后即可得出该数),μtotal=19GHz(以vSphere测得),B=100s/GB(以vSphere测得),Sr=1.2GB(以vSphere测得),代入上式,求得k约等于2,即需要设置2个通信代理,能使数据处理性能最高。
选用经典的MapReduce程序:WordCount,测试数据通过网络爬虫在Wikipedia上爬取21G的文本数据。在WordCount程序运行完之后,得出整个MapReduce阶段的总时间。从图3中可以看出当通信代理设置为2个时,耗时最低,故最优通信代理数目为2,与公式所求吻合。
实施例3:
基于OpenStack Havana版搭建云平台。构建了一个包含21台服务器的云计算IaaS平台,其中包括1台控制节点,20台计算节点。具体服务器配置和每台服务器上的虚拟机如表1所示。该平台以虚拟资源的方式为用户提供虚拟资源的使用,提供的虚拟资源的模板种类如表2所示。选用统一的微型主机模板。然后在IaaS平台中分配了246台虚拟机,搭建了基于云计算的并行计算集群。其中配置一台虚拟机作为Hadoop的master节点,其他245台作为Hadoop的slave节点。为了对本方法进行评估,以计算机程序设计语言对方法进行了实现,并整合到OpenStack平台中,在实际的IaaS应用场景中,对本方法进行详细的评估。
表1云计算IaaS平台服务器配置
表2云计算IaaS平台提供的虚拟资源种类
基于采集到的实际用户在利用Hadoop的MapReduce过程中稳定时达到的作业大小,我们对实际的云平台上的大数据处理场景进行了模拟。我们选用了经典的MapReduce程序:WordCount,而测试数据是我们在通过网络爬虫在维基百科上爬到的43G的文本数据。在WordCount程序运行完之后,我们统计每个slave上的时间,进而得出整个MapReduce阶段的总时间。
图4中表示没有利用我们的任何发明策略,实验的总时间随着数据量增大的曲线。而是采用本发明方法优化了通信代理数量的实验结果。

Claims (1)

1.一种确定云平台中最优通信代理节点数目的方法,构建一个包括一台控制节点服务器和若干台计算节点服务器的云平台,每一台所述的计算节点服务器上构建若干台虚拟机;所述云平台基于OpenStack Havana版搭建;在所述云平台的服务器上构建若干个通信代理节点,所述通信代理节点用于管理虚拟机;
其特征在于:最优的通信代理节点数目k通过以下步骤确定:
1)map阶段(分发处理阶段)总耗时:
其中, 代表map阶段总耗时,m代表计算节点服务器的数量,ni代表第i台计算节点服务器上虚拟机的数量,代表map阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,S代表map阶段稳态时,固定时间段内输入云平台的数据总大小的期望,B代表任意两个计算节点服务器之间传输1GB数据所需时间,μij代表第i号计算节点服务器上的第j台虚拟机当前的处理能力,μtotal代表当前云平台中所有虚拟机的性能总和,k代表云平台中通信代理节点的数目,Na代表构建在有通信代理的服务器上的虚拟机数量之和;
2)Reduce阶段(合并处理阶段)总耗时:
其中:代表reduce阶段总耗时,m代表计算节点服务器的数量,ni代表第i号计算节点服务器上虚拟机的数量,代表reduce阶段第i台计算节点服务器上第j个虚拟机耗时,N代表在MapReduce进程(大数据处理进程)中可用的虚拟机数量,Sr代表reduce阶段 稳态时,固定时间段内输入的数据总大小的期望,nr代表reduce阶段数据的虚拟机的数量,B代表任意两个计算节点服务器之间传输1GB数据所需时间,k代表云平台中通信代理节点的数目,μtotal代表当前云平台中所有虚拟机的性能总和,Na代表构建在有通信代理的服务器上的虚拟机数量之和;
3)MapReduce进程(大数据处理进程)过程耗时的表达式:
4)根据Ttotal的表达式,求解获得云平台中最优的通信代理节点数目k:
CN201410395123.XA 2014-08-12 2014-08-12 一种确定云平台中最优通信代理节点数目的方法 Active CN104219226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410395123.XA CN104219226B (zh) 2014-08-12 2014-08-12 一种确定云平台中最优通信代理节点数目的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410395123.XA CN104219226B (zh) 2014-08-12 2014-08-12 一种确定云平台中最优通信代理节点数目的方法

Publications (2)

Publication Number Publication Date
CN104219226A CN104219226A (zh) 2014-12-17
CN104219226B true CN104219226B (zh) 2017-10-27

Family

ID=52100360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410395123.XA Active CN104219226B (zh) 2014-08-12 2014-08-12 一种确定云平台中最优通信代理节点数目的方法

Country Status (1)

Country Link
CN (1) CN104219226B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104836836B (zh) * 2015-03-23 2019-05-17 海尔优家智能科技(北京)有限公司 网络连接的方法、装置及终端
CN104734892A (zh) * 2015-04-02 2015-06-24 江苏物联网研究发展中心 大数据处理系统Hadoop在云平台OpenStack上自动部署系统
CN108234175B (zh) * 2016-12-21 2020-01-17 中国移动通信有限公司研究院 一种基于容器的云平台存储切换方法及云平台
CN107426320A (zh) * 2017-07-31 2017-12-01 郑州云海信息技术有限公司 用于Openstack的信息处理方法和信息处理系统
CN112511427B (zh) * 2020-01-14 2024-05-07 中兴通讯股份有限公司 段路由业务处理方法、装置、路由设备及存储介质
CN117492934B (zh) * 2024-01-02 2024-04-16 深圳市伊登软件有限公司 一种基于云服务智能部署的数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004006137A1 (en) * 2002-07-02 2004-01-15 British Telecommunications Public Limited Company Optimisation method and apparatus
CN103023963A (zh) * 2012-10-31 2013-04-03 浪潮集团有限公司 一种用于云存储资源优化分配的方法
CN103824127A (zh) * 2014-02-20 2014-05-28 上海交通大学 云计算环境下服务的自适应组合优化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9158563B2 (en) * 2012-03-27 2015-10-13 Microsoft Technology Licensing, Llc Dynamic plugin(s) for cloud application(s)

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004006137A1 (en) * 2002-07-02 2004-01-15 British Telecommunications Public Limited Company Optimisation method and apparatus
CN103023963A (zh) * 2012-10-31 2013-04-03 浪潮集团有限公司 一种用于云存储资源优化分配的方法
CN103824127A (zh) * 2014-02-20 2014-05-28 上海交通大学 云计算环境下服务的自适应组合优化方法

Also Published As

Publication number Publication date
CN104219226A (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
CN104219226B (zh) 一种确定云平台中最优通信代理节点数目的方法
CN107111517A (zh) 针对归约器任务的虚拟机优化分配和/或生成
CN110325968A (zh) 分布式计算系统中的系统升级管理
CN110661842B (zh) 一种资源的调度管理方法、电子设备和存储介质
US20170078409A1 (en) Systems and methods for decentralized service placement in a resource pool
CN104981781B (zh) 分布式计算系统及操作分布式计算系统的方法
CN104754008B (zh) 网络存储节点、网络存储系统以及用于网络存储节点的装置和方法
CN108932588A (zh) 一种前后端分离的水电站群优化调度系统及方法
CN109726004B (zh) 一种数据处理方法及装置
CN104199912B (zh) 一种任务处理的方法及装置
Li et al. An effective scheduling strategy based on hypergraph partition in geographically distributed datacenters
US20150263981A1 (en) Run-time experimentation with user interface configurations
CN105354656A (zh) 基于分区解耦的配电网状态估计的分布式并行计算方法及系统
Zhou et al. Hybrid glowworm swarm optimization for task scheduling in the cloud environment
CN105426255B (zh) Hadoop大数据平台中基于网络I/O代价评估的ReduceTask数据本地性调度方法
Ke et al. Aggregation on the fly: Reducing traffic for big data in the cloud
CN105159759B (zh) 应用实例部署方法和装置
Higashino et al. Cepsim: A simulator for cloud-based complex event processing
CN109960579A (zh) 一种调整业务容器的方法及装置
CN104598250B (zh) 一种系统管理架构及其实现管理的方法
CN104009904B (zh) 面向云平台大数据处理的虚拟网络构建方法及系统
CN104219285B (zh) 确定云平台中通信代理节点和虚拟机的映射关系的方法
Yang et al. A queueing analytical model for service mashup in mobile cloud computing
JP2016506557A (ja) 異なる環境どうし間でのジョブ実行依頼のトランスペアレントなルーティング
CN105190599A (zh) 云应用带宽建模

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210119

Address after: 409800 a-056, phase I plant of Xiaoba national entrepreneurship Park, Taohuayuan Town, Youyang County, Chongqing

Patentee after: Chongqing Yibang Science and Technology Co.,Ltd.

Address before: 400044 No. 174 Shapingba street, Shapingba District, Chongqing

Patentee before: Chongqing University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210419

Address after: 401147 0805, 164 Xinnan Road, high tech Zone, Yubei District, Chongqing

Patentee after: Chongqing Huike new energy Co.,Ltd.

Address before: 409800 a-056, phase I plant of Xiaoba national entrepreneurship Park, Taohuayuan Town, Youyang County, Chongqing

Patentee before: Chongqing Yibang Science and Technology Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220727

Address after: 401121 No.1, 6th floor, building D, Qilin, no.55-2, middle section of Huangshan Avenue, Dazhulin street, Liangjiang New Area, Yubei District, Chongqing

Patentee after: Chongqing Yibang Science and Technology Co.,Ltd.

Address before: 401147 0805, No. 164, Xinnan Road, high tech Zone, Yubei District, Chongqing

Patentee before: Chongqing Huike new energy Co.,Ltd.

TR01 Transfer of patent right