CN110245005A - 一种云训练平台 - Google Patents

一种云训练平台 Download PDF

Info

Publication number
CN110245005A
CN110245005A CN201910540486.0A CN201910540486A CN110245005A CN 110245005 A CN110245005 A CN 110245005A CN 201910540486 A CN201910540486 A CN 201910540486A CN 110245005 A CN110245005 A CN 110245005A
Authority
CN
China
Prior art keywords
virtual machine
management module
unit
user
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910540486.0A
Other languages
English (en)
Other versions
CN110245005B (zh
Inventor
邸彦强
朱元昌
冯少冲
陈志佳
孟宪国
崔浩浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN201910540486.0A priority Critical patent/CN110245005B/zh
Publication of CN110245005A publication Critical patent/CN110245005A/zh
Application granted granted Critical
Publication of CN110245005B publication Critical patent/CN110245005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开一种云训练平台。本发明提供的云训练平台包括云服务器,所述云服务器上集成有门户模块、用户管理模块、虚拟机管理模块、资源调度管理模块、资源监控管理模块和多个虚拟机。虚拟机管理模块能够根据用户输入的资源申请信息为用户匹配对应的虚拟机,与虚拟机管理模块连接的资源调度管理模块能够为用户调度对应的虚拟机。可见,本发明提供的云训练平台,能够根据用户输入的资源申请信息,为用户提供对应的虚拟机进行训练,灵活性好,能够为用户提供多样化的训练服务。而且,本发明提供的云训练平台,基于云服务器这一统一的支撑环境,能够支持实现大规模协同训练。同时,本发明提供的云训练平台的训练资源还能够实现共享和重复利用。

Description

一种云训练平台
技术领域
本发明涉及云服务器领域,特别是涉及一种云训练平台。
背景技术
随着我军信息化基础建设的发展、武器装备训练方式的转变以及训练规模的增大,传统的大规模装备模拟训练系统结构复杂,且节点类型和数量众多,而各节点作用固定,难以灵活地为用户提供多样化的训练服务。
发明内容
本发明的目的是提供一种云训练平台,能够根据用户输入的资源申请信息,为用户提供对应的虚拟机进行训练,灵活性好,能够为用户提供多样化的训练服务。
为实现上述目的,本发明提供了如下方案:
一种云训练平台,所述云训练平台包括云服务器,所述云服务器上集成有门户模块、用户管理模块、虚拟机管理模块、资源调度管理模块、资源监控管理模块和多个虚拟机;其中,
所述门户模块为使用云训练平台的入口,用于接收用户的输入信息;
所述用户管理模块与所述门户模块连接,用于接收所述门户模块传输的所述输入信息,并根据所述输入信息进行注册审核、用户创建、账号注销、密码管理和资源申请审核;
所述虚拟机管理模块分别与所述门户模块和各所述虚拟机连接,所述虚拟机管理模块用于根据用户输入的资源申请信息为用户匹配对应的虚拟机;
所述资源调度管理模块分别与所述虚拟机管理模块、所述门户模块和各所述虚拟机连接,所述资源调度管理模块用于为用户调度对应的虚拟机;
所述资源监控管理模块分别与所述门户模块和所述资源调度管理模块连接,所述资源监控管理模块用于对各虚拟机和服务器资源进行监控。
可选的,所述门户模块包括人机关系管理单元,所述人机关系管理单元与所述资源调度管理模块连接,所述资源调度管理模块用于采用模糊算法实现人机关系管理,所述人机关系管理单元能够调用所述资源调度管理模块进行人机关系的管理,所述人机关系为用户与虚拟机之间的映射关系。
可选的,所述门户模块包括监控管理单元,所述监控管理单元与所述资源监控管理模块连接,所述监控管理单元将监控信息发送给资源监控管理模块,实现虚拟机资源监控和/或服务器资源监控。
可选的,所述门户模块包括虚拟机维护单元,所述虚拟机维护单元与所述虚拟机管理模块连接,所述虚拟机维护单元用于将虚拟机维护功能信息发送给所述虚拟机管理模块,所述虚拟机管理模块根据所述虚拟机维护功能信息调用资源调度管理模块对虚拟机进行管理维护。
可选的,所述虚拟机管理模块包括判断单元和人机关系调用单元;其中,
所述判断单元用于判断是否有空闲的虚拟机资源与用户输入的资源申请信息匹配;
所述人机关系调用单元用于当所述判断单元的判断结果为是时,调用所述资源调度管理模块中的人机关系调度单元将用户输入的申请人用户名映射到匹配的虚拟机,并将虚拟机返回给用户。
可选的,所述虚拟机管理模块还包括虚拟机创建单元,所述虚拟机创建单元用于当所述判断单元的判断结果为否时,根据用户输入的资源申请信息在云服务器上创建对应的虚拟机。
可选的,所述资源调度管理模块包括虚拟机配置调度单元,所述虚拟机维护单元用于接收用户输入的虚拟机配置调度信息,所述虚拟机配置调度单元与所述虚拟机维护单元连接,所述虚拟机配置调度单元根据虚拟机配置调度信息,采用优化算法优化虚拟机的配置。
可选的,所述虚拟机管理模块包括迁移虚拟机单元,所述云服务器为多个,所述虚拟机维护单元用于接收用户输入的虚拟机迁移请求,并将所述虚拟机迁移请求发送给所述迁移虚拟机单元;所述迁移虚拟机单元用于
判断请求迁移的虚拟机是否带图形处理器;
若是,将请求迁移的虚拟机关机后,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机迁移到所述优化结果指定的服务器;
若否,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机迁移到所述优化结果指定的服务器。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的云训练平台包括云服务器,所述云服务器上集成有门户模块、用户管理模块、虚拟机管理模块、资源调度管理模块、资源监控管理模块和多个虚拟机。门户模块为使用云训练平台的入口,能够接收用户的输入信息。用户管理模块能够根据用户的输入信息进行注册审核、用户创建、账号注销、密码管理和资源申请审核。虚拟机管理模块能够根据用户输入的资源申请信息为用户匹配对应的虚拟机,与虚拟机管理模块连接的资源调度管理模块能够为用户调度对应的虚拟机。可见,本发明提供的云训练平台,能够根据用户输入的资源申请信息,为用户提供对应的虚拟机进行训练,灵活性好,能够为用户提供多样化的训练服务。而且,本发明提供的云训练平台,基于云服务器这一统一的支撑环境,能够支持实现大规模协同训练。同时,本发明提供的云训练平台的训练资源还能够实现共享和重复利用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种云训练平台的结构框图;
图2为本发明实施例提供的门户模块的功能图;
图3为本发明实施例提供的用户管理模块的功能图;
图4为本发明实施例提供的虚拟机管理模块的功能图;
图5为本发明实施例提供的资源调度管理模块的功能图;
图6为本发明实施例提供的资源监控管理模块的功能图;
图7为本发明实施例提供的云训练平台中的硬件资源模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种云训练平台,能够根据用户输入的资源申请信息,为用户提供对应的虚拟机进行训练,灵活性好,能够为用户提供多样化的训练服务。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例1提供的一种云训练平台的结构框图。如图1所示,所述云训练平台包括云服务器1,所述云服务器1上集成有门户模块2、用户管理模块3、虚拟机管理模块4、资源调度管理模块5、资源监控管理模块6和多个虚拟机7。
所述门户模块2为使用云训练平台的入口,用于接收用户的输入信息。
所述用户管理模块3与所述门户模块2连接,用于接收所述门户模块2传输的所述输入信息,并根据所述输入信息进行注册审核、用户创建、账号注销、密码管理和资源申请审核。
所述虚拟机管理模块4分别与所述门户模块2和各所述虚拟机7连接,所述虚拟机管理模块4用于根据用户输入的资源申请信息为用户匹配对应的虚拟机7。
所述资源调度管理模块5分别与所述虚拟机管理模块4、所述门户模块2和各所述虚拟机7连接,所述资源调度管理模块5用于为用户调度对应的虚拟机7。
所述资源监控管理模块6分别与所述门户模块2和所述资源调度管理模块5连接,所述资源监控管理模块6用于对各虚拟机7和服务器资源进行监控。
具体地,所述门户模块2包括人机关系管理单元、监控管理单元和/或虚拟机维护单元。所述人机关系管理单元与所述资源调度管理模块5连接,所述资源调度管理模块5用于采用模糊算法实现人机关系管理,所述人机关系管理单元能够调用所述资源调度管理模块5进行人机关系的管理,所述人机关系为用户与虚拟机7之间的映射关系。所述监控管理单元与所述资源监控管理模块6连接,所述监控管理单元将监控信息发送给资源监控管理模块6,实现虚拟机资源监控和/或服务器资源监控。所述虚拟机维护单元与所述虚拟机管理模块4连接,所述虚拟机维护单元用于将虚拟机维护功能信息发送给所述虚拟机管理模块4,所述虚拟机管理模块4根据所述虚拟机维护功能信息调用资源调度管理模块5对虚拟机7进行管理维护。
具体地,所述虚拟机管理模块4包括判断单元、人机关系调用单元和/或虚拟机创建单元。所述判断单元用于判断是否有空闲的虚拟机资源与用户输入的资源申请信息匹配。所述人机关系调用单元用于当所述判断单元的判断结果为是时,调用所述资源调度管理模块5中的人机关系调度单元将用户输入的申请人用户名映射到匹配的虚拟机7,并将虚拟机7返回给用户。所述虚拟机创建单元用于当所述判断单元的判断结果为否时,根据用户输入的资源申请信息在云服务器1上创建对应的虚拟机7。
具体地,所述资源调度管理模块5包括虚拟机配置调度单元,所述虚拟机维护单元用于接收用户输入的虚拟机配置调度信息,所述虚拟机配置调度单元与所述虚拟机维护单元连接,所述虚拟机配置调度单元根据虚拟机配置调度信息,采用优化算法优化虚拟机的配置。
所述虚拟机管理模块4包括迁移虚拟机单元,所述云服务器1为多个,所述虚拟机维护单元用于接收用户输入的虚拟机迁移请求,并将所述虚拟机迁移请求发送给所述迁移虚拟机单元;所述迁移虚拟机单元用于
判断请求迁移的虚拟机是否带图形处理器;
若是,将请求迁移的虚拟机7关机后,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机7迁移到所述优化结果指定的服务器;
若否,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机7迁移到所述优化结果指定的服务器。
图2为本发明实施例提供的门户模块的功能图。如图2所示,门户模块2主要面向用户,为用户提供注册和使用云训练平台的入口。
图3为本发明实施例提供的用户管理模块的功能图。如图3所示,用户管理模块3主要面向后端管理员,提供用户申请、创建账号、注销账号等功能。
图4为本发明实施例提供的虚拟机管理模块的功能图。如图4所示,虚拟机管理模块4主要提供各类虚拟机管理功能。
图5为本发明实施例提供的资源调度管理模块的功能图。如图5所示,资源调度管理模块5主要采用默认或者后期人为添加的调度算法,实现资源的调度功能。
图6为本发明实施例提供的资源监控管理模块的功能图。如图6所示,资源监控管理模块6主要提供硬件和虚拟硬件的资源监控功能,即监控服务器资源和虚拟机资源的使用情况。
图7为本发明实施例提供的云训练平台中的硬件资源模块图。如图7所示,硬件资源主要包括云服务器、存储器、处理器等硬件资源。
门户模块2中包含人机关系管理单元、监控管理单元和虚拟机维护单元。门户模块2通过人机关系管理单元与资源调度管理模块5关联,门户模块2中人机关系管理单元直接调用资源调度管理模块5中的人机关系调度算法单元实现人机关系的管理;通过监控管理单元与资源监控管理模块6关联,门户模块2中的监控管理单元将信息发送给资源监控管理模块6,实现虚拟机资源监控和服务器资源监控;通过虚拟机维护单元与虚拟机管理模块4关联,虚拟机维护功能信息从虚拟机维护单元传递至虚拟机管理模块4,虚拟机管理模块4通过调用资源调度管理模块5相关方法模块实现相关的虚拟机管理功能。
门户模块2与用户管理模块3存在数据传输关系,用户注册、登陆退出、资源申请、资源使用、资源反馈、个人信息管理信息由门户模块2传输至用户管理模块3,用户管理模块3进行注册审核、用户创建、账号注销、密码管理、资源申请审核的操作。虚拟机管理模块4和资源调度管理模块5存在数据传输关系,资源监控管理模块6与资源调度管理模块5存在数据传输关系。
本发明提供的云训练平台的使用过程如下:
(1)用户登陆后,首先使用门户模块中的资源申请单元来申请训练资源。
资源申请包括如下步骤:
1)门户模块采集用户填写训练资源申请。
2)训练资源申请信息经由资源申请单元传递给虚拟机管理模块,虚拟机管理模块根据申请人指定的训练信息来搜索是否存在空闲虚拟机。
3)如果有空闲的虚拟机,虚拟机管理模块向资源调度管理算法模块发送人机关系映射请求,资源调度管理算法模块中的人机关系调度单元将申请人用户名映射到虚拟机,并将虚拟机交付给用户。
4)如果没有空闲的虚拟机,虚拟机管理模块会根据申请人的资源申请信息所指定的模板,通过虚拟机创建类型单元明确类型,通过创建虚拟机单元在云服务器上创建一个全新的虚拟机。
5)虚拟机创建成功后,通过人机关系调度单元将申请人用户名映射到虚拟机,并将虚拟机交付给用户。
资源申请审核过程如下:
1)资源申请单元接收用户提交资源使用申请,系统判断所选资源的类型。
2)如果该资源的创建类型是MCS(机器创建系统类型),资源申请审核单元将判断当前的审核模式。
a)如果当前为自动审核模式,且没有可用的虚拟机,资源申请审核单元将返回审核失败的消息。
b)如果当前为自动审核,且有可用的虚拟机,人机关系调度单元将为用户与该虚拟机建立人机关系,资源申请审核单元返回审核成功的消息。
c)如果当前为手动审核,且审核不通过,资源申请审核单元将返回审核失败的消息。
d)如果当前为手动审核,且审核通过,若有可用虚拟机,管理员则手动采用门户模块中的人机关系管理单元进行人机关系创建。
e)如果当前为手动审核,且审核通过,若无可用虚拟机,管理员可以选择是否创建一台新虚拟机用于关联,若选择是,则通过创建虚拟机单元在云服务器上自动创建一台虚拟机,并手动创建人机关系。
3)如果该资源的创建类型是EXISTING,则只能使用手动审核,步骤同2)中的c)、d)、e)步骤。
4)人机关系建立成功后,流程结束。
(2)资源申请单元将申请信息传递给虚拟机管理模块,虚拟机管理模块判断是否有空闲资源可用。
(3)若有,则通过人机关系调度单元将申请人用户名映射到虚拟机,并将虚拟机交付给用户。
(4)若无,虚拟机管理模块会根据资源申请信息所指定的模板,通过虚拟机管理模块中的虚拟机创建类型单元明确类型,通过创建虚拟机单元在云服务器上创建一个全新的虚拟机。
创建虚拟机的过程如下:
1)虚拟机管理模块中的创建虚拟机单元收到创建虚拟机请求提交后,会判断该虚拟机的模板是否已经生成了对应的计算机目录和交付组。
2)如果没有,则生成计算机目录和交付组。
3)如果有计算机目录和交付组,虚拟机创建单元将向计算机目录和交付组里添加新虚拟机。
4)如果是EXISTING类型虚拟机,虚拟机创建单元通过模板复制虚拟机操作完成后,会继续执行修改计算机名称和加入域的操作;如果是MCS类型虚拟机,虚拟机在创建完成以后,虚拟机创建单元操作虚拟机改名、加入域。
5)虚拟机创建完成后,虚拟机创建单元将新虚拟机添加到指定的计算机目录和交付组。
6)创建虚拟机流程完成。
(5)然后通过人机关系调度单元将申请人用户名映射到虚拟机,并将虚拟机交付给用户。
建立人机关系的过程如下:
1)建立人机关系操作提交后,人机关系管理单元根据用户检索当前是否已经关联了AD账户。
2)如果没有关联AD账户,则随机选择一个空闲的AD账户,并锁定。
3)如果没有空闲的AD账户用于关联,人机关系调度单元将返回错误消息。
4)如果已关联上AD账户,人机关系调度单元将随机选择指定资源里的空闲虚拟机或使用指定虚拟机与AD账号做关联,虚拟机随即被锁定。如果没有空闲虚拟机,人机关系调度单元将解锁AD账户,并返回错误消息。
5)AD账号完成与空闲虚拟机的关联操作后,人机关系建立成功。
(6)至此,用户可正常使用虚拟机中的训练资源。
(7)用户使用过程中,若感觉当前资源配置不足或者配置过剩,则可通过门户模块中的虚拟机维护单元进行虚拟机配置调度,虚拟机维护单元将虚拟机配置调度信息传递给资源调度管理模块中的虚拟机配置调度单元。配置调度单元调用资源调度管理模块中配置优化调度单元的最终优化结果,来设置虚拟机配置。
虚拟机配置调度过程如下:
1)虚拟机维护单元收到用户提交的配置需求后,虚拟机维护单元判断虚拟机是否正在运行。
2)如果虚拟机正在运行,虚拟机维护单元将关闭虚拟机,将信息传递给资源调度管理模块中的虚拟机配置调度单元。
3)虚拟机关闭后,配置调度单元调用资源调度管理模块中配置优化调度单元的最终优化结果,来设置虚拟机配置,如包括CPU、内存、GPU等的配置。
4)设置完毕,流程结束。
(8)用户使用过程中,若通过监控管理查看到服务器资源不足,则可迁移虚拟机到其他服务器中,方法是通过门户模块中的虚拟机维护单元进行虚拟机迁移,请求提交后,虚拟机管理模块中的迁移虚拟机单元将该虚拟机迁移到指定服务器。
迁移虚拟机的过程如下:
1)迁移虚拟机请求提交后,迁移虚拟机单元会判断指定虚拟机是否带GPU。
2)如果虚拟机带GPU,迁移虚拟机单元会先将虚拟机关机,完成后,迁移虚拟机单元调用资源调度管理模块中配置优化调度单元的最终结果,将该虚拟机迁移到指定服务器。
3)如果虚拟机不带GPU,迁移虚拟机单元调用资源调度管理模块中配置优化调度单元的最终结果,直接将虚拟机迁移到指定服务器。
(9)用户使用完毕后,可手动提交拆除人机关系,或者达到预设时间后,自动拆除人机关系,人机关系调度单元将解除AD账号与用户的关联关系。
拆除人机关系的过程如下:
1)拆除关系请求提交成功后,人机关系调度单元首先将虚拟机解锁。
2)判断该用户是否存在其它人机关系,如果存在,保留AD账号与用户的关联。
3)如果不存在其它人机关系,人机关系调度单元将解除AD账号与用户的关联关系。
4)人机关系拆除完成。
(10)用户通过门户模块中的虚拟机维护单元提交删除虚拟机请求,虚拟机维护单元调用资源调度管理模块中的虚拟机删除调度单元输出消息,判断需要删除哪些虚拟机,然后将虚拟机信息发送给人机关系调度单元,以拆除人机关系,然后再将该虚拟机从交付组和计算机目录中移除并最终删除虚拟机。
删除虚拟机的过程如下:
1)用户通过门户模块中的虚拟机维护单元提交删除虚拟机请求,虚拟机维护单元调用资源调度管理模块中的虚拟机删除调度单元输出消息,判断需要删除哪些虚拟机;
2)得到需要删除的虚拟机后,虚拟机维护单元将请求首先发送至人机关系调度单元,判断该虚拟机是否存在人机关系。
3)如果存在人机关系,人机关系调度单元将首先删除该虚拟机的人机关系。
4)如果不存在人机关系,人机关系调度单元会将人机关系删除信息回传给虚拟机删除单元,将该虚拟机从交付组和计算机目录中移除。
5)最后物理删除该虚拟机,删除完成。
本发明提供的云训练平台的训练资源主要以安装有训练软件的虚拟机为单位,以虚拟机的形式交付给用户。用户基于浏览器访问平台,获取训练资源。通过云训练平台管理系统的集中管理、统一调度,实现训练资源的管理和调度,提升训练效率和资源使用效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种云训练平台,其特征在于,所述云训练平台包括云服务器,所述云服务器上集成有门户模块、用户管理模块、虚拟机管理模块、资源调度管理模块、资源监控管理模块和多个虚拟机;其中,
所述门户模块为使用云训练平台的入口,用于接收用户的输入信息;
所述用户管理模块与所述门户模块连接,用于接收所述门户模块传输的所述输入信息,并根据所述输入信息进行注册审核、用户创建、账号注销、密码管理和资源申请审核;
所述虚拟机管理模块分别与所述门户模块和各所述虚拟机连接,所述虚拟机管理模块用于根据用户输入的资源申请信息为用户匹配对应的虚拟机;
所述资源调度管理模块分别与所述虚拟机管理模块、所述门户模块和各所述虚拟机连接,所述资源调度管理模块用于为用户调度对应的虚拟机;
所述资源监控管理模块分别与所述门户模块和所述资源调度管理模块连接,所述资源监控管理模块用于对各虚拟机和服务器资源进行监控。
2.根据权利要求1所述的云训练平台,其特征在于,所述门户模块包括人机关系管理单元,所述人机关系管理单元与所述资源调度管理模块连接,所述资源调度管理模块用于采用模糊算法实现人机关系管理,所述人机关系管理单元能够调用所述资源调度管理模块进行人机关系的管理,所述人机关系为用户与虚拟机之间的映射关系。
3.根据权利要求1所述的云训练平台,其特征在于,所述门户模块包括监控管理单元,所述监控管理单元与所述资源监控管理模块连接,所述监控管理单元将监控信息发送给资源监控管理模块,实现虚拟机资源监控和/或服务器资源监控。
4.根据权利要求1所述的云训练平台,其特征在于,所述门户模块包括虚拟机维护单元,所述虚拟机维护单元与所述虚拟机管理模块连接,所述虚拟机维护单元用于将虚拟机维护功能信息发送给所述虚拟机管理模块,所述虚拟机管理模块根据所述虚拟机维护功能信息调用资源调度管理模块对虚拟机进行管理维护。
5.根据权利要求1所述的云训练平台,其特征在于,所述虚拟机管理模块包括判断单元和人机关系调用单元;其中,
所述判断单元用于判断是否有空闲的虚拟机资源与用户输入的资源申请信息匹配;
所述人机关系调用单元用于当所述判断单元的判断结果为是时,调用所述资源调度管理模块中的人机关系调度单元将用户输入的申请人用户名映射到匹配的虚拟机,并将虚拟机返回给用户。
6.根据权利要求5所述的云训练平台,其特征在于,所述虚拟机管理模块还包括虚拟机创建单元,所述虚拟机创建单元用于当所述判断单元的判断结果为否时,根据用户输入的资源申请信息在云服务器上创建对应的虚拟机。
7.根据权利要求4所述的云训练平台,其特征在于,所述资源调度管理模块包括虚拟机配置调度单元,所述虚拟机维护单元用于接收用户输入的虚拟机配置调度信息,所述虚拟机配置调度单元与所述虚拟机维护单元连接,所述虚拟机配置调度单元根据虚拟机配置调度信息,采用优化算法优化虚拟机的配置。
8.根据权利要求7所述的云训练平台,其特征在于,所述虚拟机管理模块包括迁移虚拟机单元,所述云服务器为多个,所述虚拟机维护单元用于接收用户输入的虚拟机迁移请求,并将所述虚拟机迁移请求发送给所述迁移虚拟机单元;所述迁移虚拟机单元用于
判断请求迁移的虚拟机是否带图形处理器;
若是,将请求迁移的虚拟机关机后,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机迁移到所述优化结果指定的服务器;
若否,调用虚拟机配置调度单元的优化结果,将请求迁移的虚拟机迁移到所述优化结果指定的服务器。
CN201910540486.0A 2019-06-21 2019-06-21 一种云训练平台 Active CN110245005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910540486.0A CN110245005B (zh) 2019-06-21 2019-06-21 一种云训练平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910540486.0A CN110245005B (zh) 2019-06-21 2019-06-21 一种云训练平台

Publications (2)

Publication Number Publication Date
CN110245005A true CN110245005A (zh) 2019-09-17
CN110245005B CN110245005B (zh) 2021-05-25

Family

ID=67888665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910540486.0A Active CN110245005B (zh) 2019-06-21 2019-06-21 一种云训练平台

Country Status (1)

Country Link
CN (1) CN110245005B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012118268A2 (ko) * 2011-02-28 2012-09-07 ㈜지노게임즈 멀티 버추얼 머신을 이용한 멀티 쓰레드 처리시스템 및 그 방법
CN102662757A (zh) * 2012-03-09 2012-09-12 浪潮通信信息系统有限公司 一种云计算程序平滑迁移的资源需求预估方法
US20120304169A1 (en) * 2011-05-25 2012-11-29 International Business Machines Corporation Optimizing the configuration of virtual machine instances in a networked computing environment
US8405666B2 (en) * 2009-10-08 2013-03-26 Advanced Micro Devices, Inc. Saving, transferring and recreating GPU context information across heterogeneous GPUs during hot migration of a virtual machine
CN103220364A (zh) * 2013-04-27 2013-07-24 清华大学 一种基于云的系统管理训练平台架构
CN103338246A (zh) * 2013-06-19 2013-10-02 华南师范大学 一种基础设施云资源分配过程中的虚拟机选择方法及系统
CN103533086A (zh) * 2013-10-31 2014-01-22 中国科学院计算机网络信息中心 一种云计算系统中的资源统一调度方法
CN103885812A (zh) * 2012-12-21 2014-06-25 华为技术有限公司 虚拟机规格调整方法及装置
CN104202419A (zh) * 2014-09-18 2014-12-10 温武少 一种云计算系统动态分配虚拟机的方法
CN106126317A (zh) * 2016-06-24 2016-11-16 安徽师范大学 应用于云计算环境的虚拟机调度方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8405666B2 (en) * 2009-10-08 2013-03-26 Advanced Micro Devices, Inc. Saving, transferring and recreating GPU context information across heterogeneous GPUs during hot migration of a virtual machine
US20130179884A1 (en) * 2009-10-08 2013-07-11 Advanced Micro Devices, Inc. Saving, Transferring and Recreating GPU Context Information Across Heterogeneous GPUs During Hot Migration of a Virtual Machine
WO2012118268A2 (ko) * 2011-02-28 2012-09-07 ㈜지노게임즈 멀티 버추얼 머신을 이용한 멀티 쓰레드 처리시스템 및 그 방법
US20120304169A1 (en) * 2011-05-25 2012-11-29 International Business Machines Corporation Optimizing the configuration of virtual machine instances in a networked computing environment
CN102662757A (zh) * 2012-03-09 2012-09-12 浪潮通信信息系统有限公司 一种云计算程序平滑迁移的资源需求预估方法
CN103885812A (zh) * 2012-12-21 2014-06-25 华为技术有限公司 虚拟机规格调整方法及装置
CN103220364A (zh) * 2013-04-27 2013-07-24 清华大学 一种基于云的系统管理训练平台架构
CN103338246A (zh) * 2013-06-19 2013-10-02 华南师范大学 一种基础设施云资源分配过程中的虚拟机选择方法及系统
CN103533086A (zh) * 2013-10-31 2014-01-22 中国科学院计算机网络信息中心 一种云计算系统中的资源统一调度方法
CN104202419A (zh) * 2014-09-18 2014-12-10 温武少 一种云计算系统动态分配虚拟机的方法
CN106126317A (zh) * 2016-06-24 2016-11-16 安徽师范大学 应用于云计算环境的虚拟机调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SERGIO ISERTE ET AL: "GSaaS: A Service to Cloudify and Schedule GPUs", 《 IEEE ACCESS》 *
温少君等: "一种云平台中优化的虚拟机部署机制", 《计算机工程》 *
王云华等: "《CloudStack云平台部署与应用实践》", 30 June 2017, 武汉大学出版社 *

Also Published As

Publication number Publication date
CN110245005B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN110636103B (zh) 一种多异构集群作业统一调度方法及api接口
JP6894944B2 (ja) ブロックチェーンネットワークに基づくアプリケーション実現方法、装置、デバイス及び記憶媒体
CN108108223B (zh) 基于Kubernetes的容器管理平台
CA2543753C (en) Method and system for accessing and managing virtual machines
CN110083455B (zh) 图计算处理方法、装置、介质及电子设备
CN105677452A (zh) 任务平台任务处理方法和装置
EA007778B1 (ru) Генератор прикладных программ
CN107733704A (zh) 一种基于虚拟化和容器技术的勘探开发云的系统和方法
JP6595625B2 (ja) 自動再チャージシステム、方法、およびサーバ
CN104980494B (zh) 一种具有本地缓存的云存储下载共享平台及方法
CN111541760A (zh) 基于无服务器雾计算系统架构的复杂任务分配方法
CN110636057B (zh) 一种应用访问方法、装置和计算机可读存储介质
CN108563697A (zh) 一种数据处理方法、装置和存储介质
CN103997482B (zh) 桌面云业务中用户登录的方法、系统
US20190354395A1 (en) Limiting folder and link sharing
CN102306370A (zh) 一种基于云计算的数字图像处理系统
CN103685535A (zh) 一种大规模分布异构数据处理的云数据库系统接口设计
CN105957170A (zh) 一种基于云计算的智能考勤管理方法及系统
CN109298915A (zh) 一种云计算环境下的提供Openstack即服务的方法
US20110153826A1 (en) Fault tolerant and scalable load distribution of resources
CN104967515B (zh) 一种身份认证方法及服务器
CN110245005B (zh) 一种云训练平台
CN103828300A (zh) 逻辑交付点到物理交付点的电信信息网络架构式映射系统
CN112860398A (zh) 基于规则引擎的数据处理方法、装置、设备及介质
CN112580143A (zh) 一种基于bim的装配式建筑协同云平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant