CN115098354A - 一种搭建高性能云仿真设计平台的方法 - Google Patents
一种搭建高性能云仿真设计平台的方法 Download PDFInfo
- Publication number
- CN115098354A CN115098354A CN202210906263.3A CN202210906263A CN115098354A CN 115098354 A CN115098354 A CN 115098354A CN 202210906263 A CN202210906263 A CN 202210906263A CN 115098354 A CN115098354 A CN 115098354A
- Authority
- CN
- China
- Prior art keywords
- simulation
- performance
- node
- task
- simulation software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3457—Performance evaluation by simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45504—Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
- G06F9/45508—Runtime interpretation or emulation, e g. emulator loops, bytecode interpretation
- G06F9/45512—Command shells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5021—Priority
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种搭建高性能云仿真设计平台的方法。准备服务器,并将服务器接入网络;创建节点服务器,搭建高性能集群;在主节点服务器上部署消息传递组件和作业管理工具;编写高性能应用服务脚本;在每个从节点服务器上安装部署仿真软件;在云端部署Nginx组件,采用Nginx对每一个主节点上的高性能应用服务做高性能应用服务集群;登录Nginx,Nginx根据负载均衡策略选择某个主节点上的高性能应用服务;登录创建任务模块,选择仿真软件运行的脚本;作业管理工具选择M个从节点服务器中的计算资源充足的从节点;从节点上的作业管理工具的任务接收组件接收仿真任务;从节点启动仿真软件执行仿真任务中的仿真软件运行的脚本;最后通过文件管理模块进行存储。
Description
技术领域
本发明涉及工业方向仿真模拟和高性能计算技术领域,具体涉及一种搭建高性能云仿真设计平台的方法。
背景技术
工业仿真领域一般采用单机加载仿真软件对仿真算例进行仿真计算,仿真计算,需要消耗大量的计算资源,执行一个仿真算例,往往需要数小时,甚至是数天才能输出仿真结果,不仅影响工业生产,而且,单机加载仿真软件执行仿真算例计算,当仿真算例需要海量仿真计算时,有时还会导致单机死机或宕机,无法给出仿真结果,只能重启单机服务器,再次执行仿真计算。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种高性能云仿真设计平台搭建的方法。
为实现上述目的,本发明采用了如下技术方案:一种高性能云仿真设计平台搭建的方法,具体方法如下:
S1:准备服务区,并将服务器连接网络;
准备N+M台服务器,将服务器接入网络,各服务器之间网络互通;N和M为服务器的台数;其中N≥1,且N为整数;M≥1,且M为整数。
S2:创建节点服务器,搭建HPC高性能集群;
所述节点服务器包括主节点服务器和从节点服务器;
所述HPC为High Performance Computing的缩写;
较佳的,创建2个主节点服务器,和3个从节点服务器,对5个服务器进行集群,形成HPC高性能集群。
S3:在主节点服务器上部署消息传递组件和作业管理工具;
在所述主节点服务器上部署Massage Passing Interfac消息传递组件和Protable Batch System作业管理工具。
S4:编写HPC高性能应用服务脚本,在每个主节点服务器上创建HPC高性能应用服务;
所述HPC高性能应用服务包括创建任务模块、集群状态查看模块、作业管理模块、队列管理模块、节点列表查看模块、模板管理模块以及文件管理模块;
模板管理模块用于管理仿真软件的模板,所述仿真软件的模板为仿真软件运行的脚本;
编写仿真软件运行的脚本,所述仿真软件运行的脚本包括仿真软件的名称、设定的计算模型,将编写好的仿真软件运行的脚本存储在模板管理模块中作为模板。
S5:在每个从节点服务器上安装部署仿真软件
所述仿真软件为市场上现有的仿真计算软件,属于现有技术;再次不作重复累赘阐述。
S6:在云端部署Nginx组件,采用Nginx对每一个主节点上的HPC高性能应用服务做HPC高性能应用服务集群。
S7:登录Nginx,Nginx根据负载均衡策略选择某个主节点上的HPC高性能应用服务;
所述Nginx包括负载均衡策略,配置负载均衡策略,登录Nginx,Nginx根据配置的负载均衡策略选择某个主节点上的HPC高性能应用服务。
S8:登录创建任务模块,选择仿真软件运行的脚本;
设置仿真运行的CPU的个数、节点数,填写作业名称,选择仿真任务队列,选择计算模型,创建仿真任务,并将仿真任务递交至Protable Batch System作业管理工具。
S9:Protable Batch System作业管理工具通过计算选择M个从节点服务器中的计算资源充足的从节点;
Protable Batch System作业管理工具包括任务接收组件、修改作业组件、激活调度器(PBS Scheduler)组件、和通知PBS执行器(PBS Moms)组件;
任务接收组件用于接收作业任务;
修改作业组件用于修改作业任务;
激活调度器(PBS Scheduler)组件用于根据资源管理器获知节点的资源情况和作业信息生成相应的作业优先级列表;
通知PBS执行器(PBS Moms)组件每个节点均有一个后台进程,该后台进程用于启动、停止、提交到该节点的作业;
通过选择计算资源充足的从节点,提升了仿真效能,还避免了仿真任务排队堵塞。
S10:从节点上的Protable Batch System作业管理工具的任务接收组件接收仿真任务,激活调度器PBS Scheduler根据资源管理器获知每个节点的资源情况和仿真任务作业信息生成相应的仿真作业优先级列表,通知PBS执行器PBS Moms每个节点均有一个后台进程,该后台进程将仿真作业优先级列表中的仿真任务提交到相应的从节点;
通过将仿真任务作业信息生成相应的仿真作业优先级列表,提升了仿真计算效率,避免了一个仿真任务依据上一个仿真任务的结果才能计算,导致的仿真任务长时间等待和堵塞。
S11:从节点启动仿真软件执行仿真任务中的仿真软件运行的脚本,仿真软件执行仿真软件运行的脚本中设定的计算模型并进行仿真计算,输出仿真计算结果。
S12:仿真软件将仿真计算结果通过文件管理模块进行存储。
与现有技术相比,本发明的有益效果为:通过本发明搭建高性能云仿真设计平台的方法搭建的仿真计算云平台可以为工业设计通过仿真技术带来真实效果,如模拟测试汽车领域的座椅是否安全、新能源汽车的电池性能。生成可行性的分析报告文档和需要工业设计的参数同级。提高产品设计,降低成本,仿真模拟测试。解决了单机服务器执行仿真算例死机、宕机的难题,还提供了仿真效率。
本发明搭建高性能云仿真设计平台的方法,基于Massage Passing Interfac消息传递式并行程序设计技 术,支持多款工业主流有限元建模仿真软件如LS-DYNA、hyWorks等。把一个超大的仿真计算问题分解成多个且有相关的子问题,然后散列到各个节点机上并行执行从而最终解决问题,提升了仿真效率,同时,还解决了单节点出现问题后,导致云仿真设计平台无法使用的技术难题。
附图说明
图1为本发明一种高性能云仿真设计平台搭建的方法流程图。
具体实施方式
为使对本发明的目的、构造、特征、及其功能有进一步的了解,兹配合实施例详细说明如下。
请结合参照图1,本发明提供了一种高性能云仿真设计平台搭建的方法,具体方法如下:S1:准备服务区,并将服务器连接网络;
准备N+M台服务器,将服务器接入网络,各服务器之间网络互通;N和M为服务器的台数;其中N≥1,且N为整数;M≥1,且M为整数。
S2:创建节点服务器,搭建HPC高性能集群;
所述节点服务器包括主节点服务器和从节点服务器;
所述HPC为High Performance Computing的缩写;
创建N个主节点服务器,和M个从节点服务器,对N+M个服务器进行集群,形成HPC高性能集群;
较佳的,创建2个主节点服务器,和3个从节点服务器,对5个服务器进行集群,形成HPC高性能集群;
通过划分主节点和从节点,明确了仿真计算资源,同时设置2个及2个以上的主节点服务器,防止1个主节点服务器出现问题时,无法执行仿真任务的难题。
S3:在主节点服务器上部署消息传递组件和作业管理工具;
在所述主节点服务器上部署Massage Passing Interfac消息传递组件和Protable Batch System作业管理工具;
Massage Passing Interfac(简称MPI)是一个跨语言的通讯协议,用于编写并行程序。
S4:编写HPC高性能应用服务脚本,在每个主节点服务器上创建HPC高性能应用服务;
所述HPC高性能应用服务包括创建任务模块、集群状态查看模块、作业管理模块、队列管理模块、节点列表查看模块、模板管理模块以及文件管理模块;
所述创建任务模块用于创建仿真任务;
集群状态查看模块用于查看HPC高性能集群信息,所述HPC高性能集群信息包括CPU、内存、磁盘容量;
作业管理模块用于查看、暂停、删除运行中的仿真任务;
队列管理模块用于创建仿真任务队列;
节点列表查看模块用于查看节点服务器,以列表形式展现;
模板管理模块用于管理仿真软件的模板,所述仿真软件的模板为仿真软件运行的脚本;
编写仿真软件运行的脚本,所述仿真软件运行的脚本包括仿真软件的名称、设定的计算模型,将编写好的仿真软件运行的脚本存储在模板管理模块中作为模板;
文件管理模块用于管理和存储仿真软件仿真的结果。
S5:在每个从节点服务器上安装部署仿真软件;
所述仿真软件为市场上现有的仿真计算软件,属于现有技术;再次不作重复累赘阐述。
S6:在云端部署Nginx组件,采用Nginx对每一个主节点上的HPC高性能应用服务做HPC高性能应用服务集群。
S7:登录Nginx,Nginx根据负载均衡策略选择某个主节点上的HPC高性能应用服务;
所述Nginx包括负载均衡策略,配置负载均衡策略,登录Nginx,Nginx根据配置的负载均衡策略选择某个主节点上的HPC高性能应用服务;
若某个主节点出现问题时,Nginx根据配置负载均衡策略,选择正常的主节点上的HPC高性能应用服务;避免了主节点出现问题时,导致仿真任务无法执行。
S8:登录创建任务模块,选择仿真软件运行的脚本;
设置仿真运行的CPU的个数、节点数,填写作业名称,选择仿真任务队列,选择计算模型,创建仿真任务,并将仿真任务递交至Protable Batch System作业管理工具;
所述计算模型为仿真计算算例,该仿真计算算例由需要仿真的厂家或客户提供。
S9:Protable Batch System作业管理工具通过计算选择M个从节点服务器中的计算资源充足的从节点;
Protable Batch System作业管理工具包括任务接收组件、修改作业组件、激活调度器(PBS Scheduler)组件、和通知PBS执行器(PBS Moms)组件;
任务接收组件用于接收作业任务;
修改作业组件用于修改作业任务;
激活调度器(PBS Scheduler)组件用于根据资源管理器获知节点的资源情况和作业信息生成相应的作业优先级列表;
通知PBS执行器(PBS Moms)组件每个节点均有一个后台进程,该后台进程用于启动、停止、提交到该节点的作业;
通过选择计算资源充足的从节点,提升了仿真效能,还避免了仿真任务排队堵塞。
S10:从节点上的Protable Batch System作业管理工具的任务接收组件接收仿真任务,激活调度器PBS Scheduler根据资源管理器获知每个节点的资源情况和仿真任务作业信息生成相应的仿真作业优先级列表,通知PBS执行器PBS Moms每个节点均有一个后台进程,该后台进程将仿真作业优先级列表中的仿真任务提交到相应的从节点;
通过将仿真任务作业信息生成相应的仿真作业优先级列表,提升了仿真计算效率,避免了一个仿真任务依据上一个仿真任务的结果才能计算,导致的仿真任务长时间等待和堵塞。
S11:从节点启动仿真软件执行仿真任务中的仿真软件运行的脚本,仿真软件执行仿真软件运行的脚本中设定的计算模型并进行仿真计算,输出仿真计算结果。
S12:仿真软件将仿真计算结果通过文件管理模块进行存储。
本发明已由上述相关实施例加以描述,然而上述实施例仅为实施本发明的范例。必需指出的是,已揭露的实施例并未限制本发明的范围。相反地,在不脱离本发明的精神和范围内所作的更动与润饰,均属本发明的专利保护范围。
Claims (6)
1.一种搭建高性能云仿真设计平台的方法,其特征在于:包括如下步骤:S1:准备服务器,并将服务器接入网络;
S2:创建节点服务器,搭建HPC高性能集群;
S3:在主节点服务器上部署消息传递组件和作业管理工具;
S4:编写HPC高性能应用服务脚本,在每个主节点服务器上创建HPC高性能应用服务;
S5:在每个从节点服务器上安装部署仿真软件;
S6:在云端部署Nginx组件,采用Nginx对每一个主节点上的HPC高性能应用服务做HPC高性能应用服务集群;
S7:登录Nginx,Nginx根据负载均衡策略选择某个主节点上的HPC高性能应用服务;
S8:登录创建任务模块,选择仿真软件运行的脚本;
S9:Protable Batch System作业管理工具通过计算选择M个从节点服务器中的计算资源充足的从节点;
S10:从节点上的Protable Batch System作业管理工具的任务接收组件接收仿真任务;
S11:从节点启动仿真软件执行仿真任务中的仿真软件运行的脚本;
S12:仿真软件将仿真计算结果通过文件管理模块进行存储。
2.如权利要求1所述的一种搭建高性能云仿真设计平台的方法,其特征在于: 所述步骤S2中,创建2个主节点服务器,和3个从节点服务器,对5个服务器进行集群,形成HPC高性能集群。
3.如权利要求1所述的一种搭建高性能云仿真设计平台的方法,其特征在于:所述步骤S4中,HPC高性能应用服务包括创建任务模块、集群状态查看模块、作业管理模块、队列管理模块、节点列表查看模块、模板管理模块以及文件管理模块。
4.如权利要求3所述的一种搭建高性能云仿真设计平台的方法,其特征在于:所述模板管理模块用于管理仿真软件的模板,所述仿真软件的模板为仿真软件运行的脚本;编写仿真软件运行的脚本,所述仿真软件运行的脚本包括仿真软件的名称、设定的计算模型,将编写好的仿真软件运行的脚本存储在模板管理模块中作为模板。
5.如权利要求1所述的一种搭建高性能云仿真设计平台的方法,其特征在于:所述步骤S9中Protable Batch System作业管理工具包括任务接收组件、修改作业组件、激活调度器组件、和通知PBS执行器组件。
6.如权利要求1所述的一种搭建高性能云仿真设计平台的方法,其特征在于:所述步骤S12中仿真软件将仿真计算结果还可以通过文件的形式发送至管理者的邮箱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210906263.3A CN115098354A (zh) | 2022-07-29 | 2022-07-29 | 一种搭建高性能云仿真设计平台的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210906263.3A CN115098354A (zh) | 2022-07-29 | 2022-07-29 | 一种搭建高性能云仿真设计平台的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115098354A true CN115098354A (zh) | 2022-09-23 |
Family
ID=83301553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210906263.3A Pending CN115098354A (zh) | 2022-07-29 | 2022-07-29 | 一种搭建高性能云仿真设计平台的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115098354A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115562758A (zh) * | 2022-11-10 | 2023-01-03 | 北京卓翼智能科技有限公司 | 一种云仿真平台部署方法、系统、存储介质及电子设备 |
CN116629163A (zh) * | 2023-07-20 | 2023-08-22 | 北京凌云智擎软件有限公司 | 一种计算流体力学的仿真平台及计算方法 |
-
2022
- 2022-07-29 CN CN202210906263.3A patent/CN115098354A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115562758A (zh) * | 2022-11-10 | 2023-01-03 | 北京卓翼智能科技有限公司 | 一种云仿真平台部署方法、系统、存储介质及电子设备 |
CN116629163A (zh) * | 2023-07-20 | 2023-08-22 | 北京凌云智擎软件有限公司 | 一种计算流体力学的仿真平台及计算方法 |
CN116629163B (zh) * | 2023-07-20 | 2023-11-14 | 北京凌云智擎软件有限公司 | 一种计算流体力学的仿真平台及计算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108600029B (zh) | 一种配置文件更新方法、装置、终端设备及存储介质 | |
CN115098354A (zh) | 一种搭建高性能云仿真设计平台的方法 | |
WO2017206667A1 (zh) | 分布式部署Hadoop集群的方法及装置 | |
CN113742031B (zh) | 节点状态信息获取方法、装置、电子设备及可读存储介质 | |
CN106874189B (zh) | 一种电网实时数据库系统的自动化测试系统的实现方法 | |
CN102404381A (zh) | 一种云计算环境下基于工作流的软件部署系统及部署方法 | |
CN113569987A (zh) | 模型训练方法和装置 | |
WO2017202211A1 (zh) | 虚拟机上安装业务版本的方法及装置 | |
CN111274052A (zh) | 数据分发方法、服务器及计算机可读存储介质 | |
CN110632857B (zh) | 用于大规模层次化控制系统的控制性能验证方法 | |
CN112862098A (zh) | 一种集群训练任务处理的方法及系统 | |
CN103414767A (zh) | 将应用软件部署在云计算平台上的方法和装置 | |
US9262494B2 (en) | Importing data into dynamic distributed databases | |
US20200371902A1 (en) | Systems and methods for software regression detection | |
CN111984274A (zh) | 一种一键自动化部署etcd集群的方法及装置 | |
CN109905263A (zh) | 一种自动化运维部署系统 | |
CN113783953A (zh) | 基于云边协同的工业物联网管控方法及系统 | |
CN112153126A (zh) | 一种针对k8s集群的部署和节点管理方法和系统 | |
CN113658351A (zh) | 一种产品生产的方法、装置、电子设备及存储介质 | |
CN114510317A (zh) | 虚拟机管理方法、装置、设备及存储介质 | |
CN116107694A (zh) | k8s子集群的部署方法、装置及存储介质 | |
CN110727570A (zh) | 并发压测方法及相关装置 | |
CN115629856A (zh) | 一种云管平台的运维工具和云管平台的系统运维方法 | |
CN110868330A (zh) | 云平台可划分cpu资源的评估方法、装置及评估系统 | |
Warrender et al. | Job scheduling in a high performance computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |