CN109088776A - 一种基于超级计算机的并行cfd计算与通信重叠优化方法 - Google Patents
一种基于超级计算机的并行cfd计算与通信重叠优化方法 Download PDFInfo
- Publication number
- CN109088776A CN109088776A CN201811062456.5A CN201811062456A CN109088776A CN 109088776 A CN109088776 A CN 109088776A CN 201811062456 A CN201811062456 A CN 201811062456A CN 109088776 A CN109088776 A CN 109088776A
- Authority
- CN
- China
- Prior art keywords
- communication
- parallel
- calculating
- flow field
- mpi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45504—Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multi Processors (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于超级计算机的并行CFD计算与通信重叠优化方法,包括以下步骤:首先通过区域分解将离散后的流场网格划分为多个计算量均衡的流场区域。采用“单程序多数据”的数据并行策略,机群中每个节点计算其中一个流场区域的近似数值解。在计算过程中,根据流场网格在流场区域中的不同位置,将流场网格分为两类:纯内部网格与边界网格,位于不同节点的相邻流场区域需要通过互连网络通信交换边界网格的流场数值;其次通过分析并行CFD算法中各流场数值的读写依赖关系,识别计算与通信过程的并行性;最后调整并行CFD程序的计算与通信流程,实现并行CFD程序的计算与通信重叠,并通过性能分析工具TAU(Tuning and Analysis Utilities)对计算与通信重叠后的并行CFD程序进行性能调优。
Description
技术领域
本发明属于计算流体力学与计算机科学交叉领域,特别涉及一种基于超级计算机的并行CFD计算与通信重叠优化方法。
背景技术
计算流体动力学(Computational Fluid Dynamics,CFD)作为一门涉及流体力学,数值数学和计算机科学的交叉学科,是继理论分析和实验验证之后研究流动问题的第三种方法。基于CFD进行物理流场模拟时,首先要将物理流场离散化为流场网格,再利用数值方法将刻画流体规律的流动控制方程转化为求解每个流场网格上各物理量的代数方程组,以并行CFD程序为计算工具求得物理流场的近似数值解,用于模拟流体机械的复杂流动现象和变化规律。
现阶段,采用机群系统结构的天河二号为我国并行CFD程序扩大求解问题规模、提高求解精度、加快求解速度提供了硬件平台。但是,相对于单节点的串行CFD程序,并行CFD程序会因为节点间的互连网络通信开销使程序的实测性能和理想性能之间存在一定差距。为了降低并行CFD程序在天河二号上运行时的互连网络通信开销,目前常用的通信优化方法主要分为两大类:第一类是通过以计算代替通信等方式优化并行CFD算法,属于CFD领域研究内容;第二类是通过管理软件优化任务调度策略、设计低延迟高带宽的物理硬件、实现高效的通信原语库等优化并行CFD程序,属于计算机科学领域研究内容。受限于研究领域的不同,研究人员对以并行CFD算法为核心的并行CFD程序进行通信优化时,往往局限于各自的研究领域,只能达到有限的优化效果。
发明内容
本发明的目的在于提供一种基于超级计算机的并行CFD计算与通信重叠优化方法,以解决上述问题。
为实现上述目的,本发明采用以下技术方案:
一种基于超级计算机的并行CFD计算与通信重叠优化方法,包括以下步骤:
步骤1,将整个待求解的物理流场离散为有限个流场网格,通过区域分解将离散后的流场网格划分为多个计算量均衡的流场区域;采用“单程序多数据”的数据并行策略,机群中每个节点计算其中一个流场区域的近似数值解;在计算过程中,根据流场网格在流场区域中的不同位置,将流场网格分为两类:纯内部网格与边界网格,位于不同节点的相邻流场区域需要通过互连网络通信交换边界网格的流场数值;
步骤2,通过分析并行CFD算法中各流场数值的读写依赖关系,识别计算与通信过程的并行性;
步骤3,调整并行CFD程序的计算与通信流程,实现并行CFD程序的计算与通信重叠,并通过性能分析工具对计算与通信重叠后的并行CFD程序进行性能调优。
进一步的,步骤1具体包括以下步骤:
1)在每个流场区域的边界网格之外引入一层虚拟网格,用于通信过程中接收相邻网格区域边界网格的流场数值;
2)基于超级计算机天河二号消息传递接口MPICH-GLEX2中的非阻塞通信语句MPI_Isend/MPI_Irecv/MPI_Wait实现并行CFD程序的通信过程;
3)基于天河二号消息传递接口MPICH-GLEX2中的虚拟进程简化并行CFD程序的通信实现过程。
进一步的,步骤2具体包括以下步骤:
1)如果通信部分是非阻塞消息发送MPI_Isend过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在写后读数据依赖;
2)如果通信部分是非阻塞消息接收MPI_Irecv过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在读后写或写后写数据依赖;
3)如果通信部分是验证消息传递是否完成MPI_Wait过程,则通信后的计算过程是否是通信无关过程依赖于与MPI_Wait配对的是消息发送MPI_Isend过程还是消息接收MPI_Irecv过程:若为前者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在读后写数据依赖;若为后者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在写后读或写后写数据依赖。
进一步的,步骤3具体包括以下步骤:
1)通过步骤2识别出并行CFD算法中独立于通信的计算过程后,分别前移非阻塞消息发送MPI_Isend/非阻塞消息接收MPI_Irecv过程,后移验证消息传递是否完成MPI_Wait过程,使非阻塞通信区间包含尽量多独立于通信的计算过程,基于天河二号网卡端NIC提供的卸载优化机制完成并行CFD程序的计算与通信重叠;
2)使用性能分析工具TAU对计算与通信重叠后的并行CFD程序进行插桩性能分析,通过获得的统计数据和事件跟踪文件分析计算与通信重叠是否隐藏全部通信开销;若计算不足以隐藏通信开销,则返回步骤2发掘更多可重叠的计算过程,直到并行CFD算法中与通信独立的计算过程全部被重叠;若计算足以隐藏通信开销,则终止循环。
与现有技术相比,本发明有以下技术效果:
本发明首先使用天河二号自主实现的消息传递接口MPICH-GLEX2的非阻塞通信原语和虚拟进程实现并简化并行CFD程序的非阻塞通信过程;其次通过分析流场数值的读写依赖关系,快速识别并行CFD算法中与通信独立的计算过程;最后,调整计算与通信流程,基于天河二号网卡端NIC提供的卸载优化机制实现并行CFD程序的计算与通信重叠,并通过性能分析工具TAU对计算与通信重叠后的并行CFD程序进行进一步的性能调优。基于天河二号网卡端NIC的卸载优化机制和消息传递接口MPICH-GLEX2,结合并行CFD算法的计算与通信特点,突破研究领域的局限,提供了一种通用、高效的并行CFD程序计算与通信重叠优化方法,减少网络通信开销对并行CFD程序的性能影响。
附图说明
图1为本发明提出的优化方法流程图;
图2为区域分解完成及引入虚拟网格后,每个流场区域内的网格分类示意图;
图3为轴流压气机转子进出口方向边界示意图;
图4a和图4b为虚拟进程简化通信过程对比流程图;
图5为天河二号计算与通信重叠硬件资源并行示意图。
具体实施方式
以下结合附图对本发明进一步说明:
请参阅图1,一种基于超级计算机的并行CFD计算与通信重叠优化方法,包括以下步骤:
步骤1,将整个待求解的物理流场离散为有限个流场网格,通过区域分解将离散后的流场网格划分为多个计算量均衡的流场区域。采用“单程序多数据”的数据并行策略,机群中每个节点计算其中一个流场区域的近似数值解。在计算过程中,根据流场网格在流场区域中的不同位置,将流场网格分为两类:纯内部网格与边界网格,位于不同节点的相邻流场区域需要通过互连网络通信交换边界网格的流场数值;
步骤2,通过分析并行CFD算法中各流场数值的读写依赖关系,识别计算与通信过程的并行性;
步骤3,调整并行CFD程序的计算与通信流程,实现并行CFD程序的计算与通信重叠,并通过性能分析工具对计算与通信重叠后的并行CFD程序进行性能调优。
步骤1具体包括以下步骤:
1)在每个流场区域的边界网格之外引入一层虚拟网格,用于通信过程中接收相邻网格区域边界网格的流场数值;
2)基于超级计算机天河二号消息传递接口MPICH-GLEX2中的非阻塞通信语句(MPI_Isend/MPI_Irecv/MPI_Wait)实现并行CFD程序的通信过程;
3)基于天河二号消息传递接口MPICH-GLEX2中的虚拟进程简化并行CFD程序的通信实现过程。
步骤2具体包括以下步骤:
1)如果通信部分是非阻塞消息发送(MPI_Isend)过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在写后读数据依赖;
2)如果通信部分是非阻塞消息接收(MPI_Irecv)过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在读后写或写后写数据依赖;
3)如果通信部分是验证消息传递是否完成(MPI_Wait)过程,则通信后的计算过程是否是通信无关过程依赖于与MPI_Wait配对的是消息发送(MPI_Isend)过程还是消息接收(MPI_Irecv)过程:若为前者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在读后写数据依赖;若为后者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在写后读或写后写数据依赖。
步骤3具体包括以下步骤:
1)通过步骤2识别出并行CFD算法中独立于通信的计算过程后,分别前移非阻塞消息发送(MPI_Isend)/非阻塞消息接收(MPI_Irecv)过程,后移验证消息传递是否完成(MPI_Wait)过程,使非阻塞通信区间包含尽量多独立于通信的计算过程,基于天河二号网卡端(NIC)提供的卸载优化机制完成并行CFD程序的计算与通信重叠;
2)使用性能分析工具TAU(Tuning and Analysis Utilities)对计算与通信重叠后的并行CFD程序进行插桩性能分析,避免手动插桩带来的误差问题,通过获得的统计数据和事件跟踪文件分析计算与通信重叠是否隐藏全部通信开销。若计算不足以隐藏通信开销,则返回步骤2发掘更多可重叠的计算过程,直到并行CFD算法中与通信独立的计算过程全部被重叠;若计算足以隐藏通信开销,则终止循环。
实施例:
以轴流压气机转子数值模拟算法为例,本发明提出的一种基于超级计算机的并行CFD计算与通信重叠优化方法包括以下步骤:
步骤1,对网格离散后的轴流压气机转子模型完成区域分解后,机群中每个节点负责不同流场区域内每个流场网格的近似数值解计算。
步骤1.1,在每个流场区域的边界网格之外引入一层虚拟网格,用于通信过程中接收相邻网格区域边界网格的原始守恒量;如图2所示。
步骤1.2,基于天河二号消息传递接口MPICH-GLEX2中的非阻塞通信原语(MPI_Isend/MPI_Irecv/MPI_Wait)实现轴流压气机转子数值模拟程序的互连网络通信过程;
步骤1.3,利用真实进程和虚拟进程通信时,真实进程会立即正确返回,如同执行空操作的特点,在轴流压气机转子数值模拟程序的非阻塞通信过程中引入虚拟进程,使程序简洁易懂。如图3所示,以轴流压气机转子的进出口方向通信过程为例,区域分解后一个完整的流道在进出口方向被分为三部分,区域分解产生的虚拟边界需要通过非阻塞通信传递相邻流场区域的边界网格流场近似值,而区域分解之前存在的真实边界(进口边界、出口边界)无需参与非阻塞通信过程,所以非阻塞通信前需要复杂的条件判断,如图4所示,引入虚拟进程可以省略通信前的条件判断,统一处理进出口方向通信过程,使程序简洁易懂。
步骤2,轴流压气机转子数值模拟算法使用龙格-库塔方法进行显示时间离散。在这种方法中,通过对流场数值的读写依赖分析可知:通信(MPI_Isend/MPI_Irecv)前,纯内部网格原始守衡量的计算过程和边界网格原始守衡量的通信(MPI_Isend/MPI_Irecv)过程不存在写后读与写后写数据依赖;验证消息传递是否完成(MPI_Wait)后的计算过程与通信过程存在读后写和写后读数据依赖。所以,区域分解完成后,在每个流场区域内,通信前纯内部网格原始守衡量的计算和边界网格原始守衡量的通信过程相互独立,可以实现重叠;通信后的计算过程和通信过程存在数据依赖关系,无法实现重叠。
步骤3,如图5所示,以非阻塞消息发送(MPI_Isend)过程为例,将非阻塞消息发送(MPI_Isend)过程前移至纯内部网格原始守衡量计算过程之前,保持验证消息传递是否完成的通信(MPI_Wait)语句位置不变。处理器调用消息发送(MPI_Isend)语句后,将边界网格原始守衡量的通信过程卸载至天河二号网卡端(NIC)完成,处理器立即执行纯内部网格原始守衡量的计算,纯内部网格原始守衡量的计算完成后,处理器调用验证消息传递是否完成的通信语句(MPI_Wait),判断通信是否完成,是否可以求解最终流场近似值。根据性能测试工具TAU的性能分析结果,确定是否需要继续挖掘并行CFD算法中更多可重叠通信的计算过程。
Claims (4)
1.一种基于超级计算机的并行CFD计算与通信重叠优化方法,其特征在于,包括以下步骤:
步骤1,将整个待求解的物理流场离散为有限个流场网格,通过区域分解将离散后的流场网格划分为多个计算量均衡的流场区域;采用“单程序多数据”的数据并行策略,机群中每个节点计算其中一个流场区域的近似数值解;在计算过程中,根据流场网格在流场区域中的不同位置,将流场网格分为两类:纯内部网格与边界网格,位于不同节点的相邻流场区域需要通过互连网络通信交换边界网格的流场数值;
步骤2,通过分析并行CFD算法中各流场数值的读写依赖关系,识别计算与通信过程的并行性;
步骤3,调整并行CFD程序的计算与通信流程,实现并行CFD程序的计算与通信重叠,并通过性能分析工具对计算与通信重叠后的并行CFD程序进行性能调优。
2.根据权利要求1所述的一种基于超级计算机的并行CFD计算与通信重叠优化方法,其特征在于,步骤1具体包括以下步骤:
1)在每个流场区域的边界网格之外引入一层虚拟网格,用于通信过程中接收相邻网格区域边界网格的流场数值;
2)基于超级计算机天河二号消息传递接口MPICH-GLEX2中的非阻塞通信语句MPI_Isend/MPI_Irecv/MPI_Wait实现并行CFD程序的通信过程;
3)基于天河二号消息传递接口MPICH-GLEX2中的虚拟进程简化并行CFD程序的通信实现过程。
3.根据权利要求1所述的一种基于超级计算机的并行CFD计算与通信重叠优化方法,其特征在于,步骤2具体包括以下步骤:
1)如果通信部分是非阻塞消息发送MPI_Isend过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在写后读数据依赖;
2)如果通信部分是非阻塞消息接收MPI_Irecv过程,则通信前的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在读后写或写后写数据依赖;
3)如果通信部分是验证消息传递是否完成MPI_Wait过程,则通信后的计算过程是否是通信无关过程依赖于与MPI_Wait配对的是消息发送MPI_Isend过程还是消息接收MPI_Irecv过程:若为前者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所发送的数据进行写操作,即两者不存在读后写数据依赖;若为后者,则通信后的计算过程是通信无关过程,当且仅当计算过程不对所接收的数据进行读或写操作,即两者不存在写后读或写后写数据依赖。
4.根据权利要求1所述的一种基于超级计算机的并行CFD计算与通信重叠优化方法,其特征在于,步骤3具体包括以下步骤:
1)通过步骤2识别出并行CFD算法中独立于通信的计算过程后,分别前移非阻塞消息发送MPI_Isend/非阻塞消息接收MPI_Irecv过程,后移验证消息传递是否完成MPI_Wait过程,使非阻塞通信区间包含尽量多独立于通信的计算过程,基于天河二号网卡端NIC提供的卸载优化机制完成并行CFD程序的计算与通信重叠;
2)使用性能分析工具TAU对计算与通信重叠后的并行CFD程序进行插桩性能分析,通过获得的统计数据和事件跟踪文件分析计算与通信重叠是否隐藏全部通信开销;若计算不足以隐藏通信开销,则返回步骤2发掘更多可重叠的计算过程,直到并行CFD算法中与通信独立的计算过程全部被重叠;若计算足以隐藏通信开销,则终止循环。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811062456.5A CN109088776B (zh) | 2018-09-12 | 2018-09-12 | 一种基于超级计算机的并行cfd计算与通信重叠优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811062456.5A CN109088776B (zh) | 2018-09-12 | 2018-09-12 | 一种基于超级计算机的并行cfd计算与通信重叠优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109088776A true CN109088776A (zh) | 2018-12-25 |
CN109088776B CN109088776B (zh) | 2020-07-28 |
Family
ID=64841389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811062456.5A Active CN109088776B (zh) | 2018-09-12 | 2018-09-12 | 一种基于超级计算机的并行cfd计算与通信重叠优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109088776B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828841A (zh) * | 2019-01-21 | 2019-05-31 | 南京航空航天大学 | 一种cfd并行计算方法 |
CN110096838A (zh) * | 2019-05-16 | 2019-08-06 | 杭州电子科技大学 | 一种基于n-s方程的直升机流场数值并行隐式求解方法 |
CN110135067A (zh) * | 2019-05-16 | 2019-08-16 | 杭州电子科技大学 | 一种双时间步方法下的直升机流场重叠混合网格并行方法 |
CN112632874A (zh) * | 2020-12-31 | 2021-04-09 | 杭州电子科技大学 | 一种直升机流场数值模拟的优化方法及系统 |
CN116225722A (zh) * | 2023-05-08 | 2023-06-06 | 中国空气动力研究与发展中心计算空气动力研究所 | 流场变量的通信方法、装置、终端设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226540A (zh) * | 2013-05-21 | 2013-07-31 | 中国人民解放军国防科学技术大学 | 基于分组多流的gpu上多区结构网格cfd加速方法 |
CN104143027A (zh) * | 2014-08-01 | 2014-11-12 | 北京理工大学 | 一种基于sph算法的流体热运动仿真系统 |
CN106529063A (zh) * | 2016-11-14 | 2017-03-22 | 宜兴八达流体技术有限公司 | 基于cfd技术的流体系统及其设计方法 |
US20170206291A1 (en) * | 2016-01-20 | 2017-07-20 | Soliton Holdings Corporation, Delaware Corporation | Method for computational fluid dynamics and apparatuses for jet-effect use |
CN107529638A (zh) * | 2017-08-18 | 2018-01-02 | 浙江远算云计算有限公司 | 线性求解器的加速方法、存储数据库及gpu系统 |
CN107844676A (zh) * | 2017-12-18 | 2018-03-27 | 北京工业大学 | 一种基于多性能约束的结构拓扑优化设计方法 |
-
2018
- 2018-09-12 CN CN201811062456.5A patent/CN109088776B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226540A (zh) * | 2013-05-21 | 2013-07-31 | 中国人民解放军国防科学技术大学 | 基于分组多流的gpu上多区结构网格cfd加速方法 |
CN104143027A (zh) * | 2014-08-01 | 2014-11-12 | 北京理工大学 | 一种基于sph算法的流体热运动仿真系统 |
US20170206291A1 (en) * | 2016-01-20 | 2017-07-20 | Soliton Holdings Corporation, Delaware Corporation | Method for computational fluid dynamics and apparatuses for jet-effect use |
CN106529063A (zh) * | 2016-11-14 | 2017-03-22 | 宜兴八达流体技术有限公司 | 基于cfd技术的流体系统及其设计方法 |
CN107529638A (zh) * | 2017-08-18 | 2018-01-02 | 浙江远算云计算有限公司 | 线性求解器的加速方法、存储数据库及gpu系统 |
CN107844676A (zh) * | 2017-12-18 | 2018-03-27 | 北京工业大学 | 一种基于多性能约束的结构拓扑优化设计方法 |
Non-Patent Citations (1)
Title |
---|
王勇献: "结构网格CFD应用程序在天河超级计算机上的高效并行与优化", 《电子学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109828841A (zh) * | 2019-01-21 | 2019-05-31 | 南京航空航天大学 | 一种cfd并行计算方法 |
CN110096838A (zh) * | 2019-05-16 | 2019-08-06 | 杭州电子科技大学 | 一种基于n-s方程的直升机流场数值并行隐式求解方法 |
CN110135067A (zh) * | 2019-05-16 | 2019-08-16 | 杭州电子科技大学 | 一种双时间步方法下的直升机流场重叠混合网格并行方法 |
CN112632874A (zh) * | 2020-12-31 | 2021-04-09 | 杭州电子科技大学 | 一种直升机流场数值模拟的优化方法及系统 |
CN116225722A (zh) * | 2023-05-08 | 2023-06-06 | 中国空气动力研究与发展中心计算空气动力研究所 | 流场变量的通信方法、装置、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109088776B (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109088776A (zh) | 一种基于超级计算机的并行cfd计算与通信重叠优化方法 | |
Mirhoseini et al. | Device placement optimization with reinforcement learning | |
US11836641B2 (en) | Machine learning-based prediction of metrics at early-stage circuit design | |
CN102307369B (zh) | 支持无线传感网并行仿真和实物模拟的装置及方法 | |
CN110516325A (zh) | 一种cae自动化仿真分析方法和系统 | |
US20220027542A1 (en) | Memory efficient scalable distributed static timing analysis using structure based self-aligned parallel partitioning | |
US11860227B2 (en) | Machine learning delay estimation for emulation systems | |
CN108363660B (zh) | 一种测试程序生成方法和装置 | |
CN104239595B (zh) | 用于实现用于设计规划和架构探索的系统级设计工具的方法和装置 | |
CN112433853B (zh) | 一种面向超级计算机数据并行应用的异构感知数据划分方法 | |
CN111949631A (zh) | 一种确定数据库的配置参数的方法及装置 | |
US20230118981A1 (en) | General purpose functionality processor with a scalable architecture for neural networks | |
CN117093871B (zh) | 一种面向深度学习分布式训练测评方法和系统 | |
Wang et al. | A first look at mobile intelligence: Architecture, experimentation and challenges | |
Strönisch et al. | Multi-GPU Approach for Training of Graph ML Models on large CFD Meshes | |
CN106407005A (zh) | 一种基于多尺度耦合的并行进程合并方法及系统 | |
Schirner et al. | Result-oriented modeling—A novel technique for fast and accurate TLM | |
CN117435451A (zh) | 移动边缘计算中虚拟计算单元的功耗和性能模型建立方法 | |
Zhou et al. | Scheduling-efficient framework for neural network on heterogeneous distributed systems and mobile edge computing systems | |
Ma et al. | GPU parallelization of unstructured/hybrid grid ALE multigrid unsteady solver for moving body problems | |
Uddin et al. | Signature-based high-level simulation of microthreaded many-core architectures | |
CN103034615B (zh) | 一种适用于流应用多核处理器的存储管理方法 | |
Fehling | Algorithms for massively parallel generic hp-adaptive finite element methods | |
CN113988493A (zh) | 终端评价模型的构建方法、装置和存储介质 | |
Bobrek et al. | Shared resource access attributes for high-level contention models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |