CN117056090B - 非结构隐式lusgs线程并行方法、设备、介质及系统 - Google Patents
非结构隐式lusgs线程并行方法、设备、介质及系统 Download PDFInfo
- Publication number
- CN117056090B CN117056090B CN202311323608.3A CN202311323608A CN117056090B CN 117056090 B CN117056090 B CN 117056090B CN 202311323608 A CN202311323608 A CN 202311323608A CN 117056090 B CN117056090 B CN 117056090B
- Authority
- CN
- China
- Prior art keywords
- grid
- parallel
- unstructured
- implicit
- hierarchy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 5
- 230000001174 ascending effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000009191 jumping Effects 0.000 claims description 4
- 239000012530 fluid Substances 0.000 abstract description 2
- 239000011159 matrix material Substances 0.000 description 10
- UJCHIZDEQZMODR-BYPYZUCNSA-N (2r)-2-acetamido-3-sulfanylpropanamide Chemical compound CC(=O)N[C@@H](CS)C(N)=O UJCHIZDEQZMODR-BYPYZUCNSA-N 0.000 description 4
- 241001669680 Dormitator maculatus Species 0.000 description 4
- 238000004040 coloring Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明公开了一种非结构隐式LUSGS线程并行方法、设备、介质及系统,属于计算流体力学领域,包括步骤:以非结构网格的体单元要素映射为邻接关系,邻接关系与计算网格在拓扑结构上等价;根据拓扑结构将非结构网格划分并行层级,能够并行执行的网格单元划分至同一层级,不能并行执行的网格单元划分至不同层级;划分得到并行层级后,在向前扫描的计算中,按照第一顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行;在向后扫描的计算中,按照第二顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。本发明提供了一种无精度损失的非结构隐式LUSGS线程并行方法。
Description
技术领域
本发明涉及计算流体力学领域,更为具体的,涉及一种非结构隐式LUSGS线程并行方法、设备、介质及系统。
背景技术
当前CFD计算方法包括结构网格和非结构网格,非结构网格具有自动化、高适体性、高效率等优点,可以较好解决复杂外形飞行器在网格生成中的多种问题,因此非结构网格的相关技术受到越来越多的关注。其中非结构网格隐式LUSGS方法是一种高精度、高效率的求解(预条件)手段,具有较好的收敛鲁棒性和计算精度,被广泛应用于CFD工程计算中。
隐式LUSGS方法的具体流程如下:
求解线性方程,其中A为系数矩阵,/>为待求解的向量组,b为系数矩阵A与待求解的向量组/>的计算结果。首先,将系数矩阵A分解为下列形式:
其中D为对角矩阵,L和U分别是下三角矩阵和上三角矩阵,用D+L+U代替矩阵A,则线性方程组可以改写成
然后近似LU分解,将A表述为下三角部分、对角逆部分以及上三角部分的乘积为:
其中,I为单位矩阵,是/>的逆矩阵,定义:
最终线性方程组可以写成:
如此,已知,结合上述公式,经过一次向前扫描就可以解出/>,再经过一次向后扫描就可以最终求得/>。
然而,隐式LUSGS方法具有强数据依赖性,在工程计算中,为确保复杂外形算例的鲁棒性,LUSGS计算部分多采用串行计算,不能充分挖掘多核/众核处理器的计算潜能,极大地限制了整体计算效率。而现有的LUSGS线程并行方法需要改变原有数据依赖模式,如公开号为CN115222870A的中国发明专利《非结构网格隐式LUSGS均衡着色方法、设备及介质》所述方法,虽然能够解耦数据依赖模式,但其计算流程改变了隐式算法数学特性,降低计算的收敛精度,不利于推广到具有复杂非结构外形的实际工程应用中。因此亟需研究非结构网格隐式LUSGS方法并行技术,进一步提高计算性能。
发明内容
本发明的目的在于克服现有技术的不足,提供一种非结构隐式LUSGS线程并行方法、设备、介质及系统,在不改变隐式特性的前提下,提升计算性能,并运用于实际工程计算。
本发明的目的是通过以下方案实现的:
一种非结构隐式LUSGS线程并行方法,包括以下步骤:
S1,以非结构网格的体单元要素映射为邻接关系,邻接关系与计算网格在拓扑结构上等价;
S2,根据拓扑结构将非结构网格划分并行层级,能够并行执行的网格单元划分至同一层级,不能并行执行的网格单元划分至不同层级;
S3,划分得到并行层级后,在向前扫描的计算中,按照第一顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行;在向后扫描的计算中,按照第二顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。
进一步地,在步骤S2中,所述根据拓扑结构将非结构网格划分并行层级,具体包括如下划分依据:大编号体单元不能在小编号的上层级;邻接体单元不能位于同一层级。
进一步地,在步骤S2中,所述根据拓扑结构将非结构网格划分并行层级,包括如下子步骤:
S21,初始化网格单元对应的并行层级;
S22,升序遍历所有网格单元;
S23,检查当前网格单元i对应邻接单元的层级,如果所有邻接单元均未划分层级,则当前网格单元i的层级为前一个网格单元i-1的层级,否则,当前网格单元i的层级为所有邻接单元层级中的最大值+1;
S24,判断是否存在下一个网格,如是则跳到步骤S22,否则结束。
进一步地,在步骤S3中,所述第一顺序为从顶层到底层。
进一步地,在步骤S3中,所述第二顺序为从底层到顶层。
进一步地,在步骤S21中,所述初始化网格单元对应的并行层级,包括子步骤:初始化网格单元对应的并行层级为-1。
进一步地,在步骤S22中,所述升序遍历所有网格单元,包括子步骤:以编号为0的体网格开始,依次升序遍历所有网格单元。
一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时执行如上任一项所述的方法。
一种可读存储介质,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时执行如上任一项所述的方法。
一种非结构隐式LUSGS线程并行系统,包括如上所述的计算机设备。
本发明的有益效果包括:
本发明提供了一种无精度损失的非结构隐式LUSGS线程并行方法,在不改变原有隐式LUSGS算法流程的前提下,通过对计算网格的解耦实现线程级并行,提升了隐式LUSGS方法的计算性能,且保证了结果的鲁棒性。
本发明结构简单实用,实现过程简单,效果显著,工程应用中可实现性强,适用于不同复杂气动外形的CFD计算。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1a表示NACA翼型非结构网格的邻接矩阵,其中,数字1,2,3,4,5,6,7,8为网格体编号;
图1b表示使用本发明方法划分后的并行层次;
图2为本发明实施例的LUSGS并行分层方法的具体实施步骤;
图3为NACA翼型算例下流场气动力残差收敛曲线;其中,基准为在CPU硬件上串行执行的结果,运行1为使用本发明方法在同一CPU上线程并行的结果,运行2为使用本发明方法在GPU上执行的结果,运行3为使用发明专利《非结构网格隐式LUSGS均衡着色方法、设备及介质》(公开号:CN115222870A)中方法在CPU上线程并行的结果;
需要说明,图中填充色为必需,具有技术含义,即用于展示网格单元间的邻接关系。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
鉴于背景中的问题,本发明实施例提出了一种无精度损失的非结构隐式LUSGS线程并行方法,提出了新的基于非结构网格邻接关系的水平集划分方法,可以保持隐式LUSGS线程并行计算的收敛精度,使LUSGS实现无精度损失的线程并行,提升在多核/众核的计算效率,可以满足非结构网格隐式算法的工程计算需求。
1)以非结构网格的体单元要素映射为邻接关系,邻接关系与计算网格在拓扑结构上等价,图1a~图1b为非结构网格示例分层级划分的示意图,数字1,2,3,4,5,6,7,8为网格体编号。在具体实施中,图1a表示NACA翼型非结构网格的的邻接矩阵,图1b表示使用本发明方法划分后的并行层次。
2)根据拓扑逻辑结构将非结构网格划分并行层级,能够并行执行的网格体单元划分至同一层级,不能并行执行的网格体单元划分至不同层级,划分依据有两条:①大编号体单元不能在小编号的上层级;②邻接体单元不能位于同一层级,具体流程如图2所示:步骤1、初始化网格单元对应的并行层级为-1;步骤2、以编号为0的体网格开始,依次升序遍历所有网格单元;步骤3、检查当前网格单元i邻接单元的层级,如果所有邻接单元均未划分层级,则当前网格单元i的层级为前一个网格单元i-1的层级,否则,当前网格单元i的层级为所有邻接单元层级中的最大值+1。判断是否存在下一个网格,如是则跳到升序遍历所有网格单元步骤中,否则结束。
3)通过上述方法划分得到并行层级后,在向前扫描的计算中,按照从顶层到底层的顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。在向后扫描的计算中,按照从底层到顶层的顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。
与现有的非结构网格隐式LUSGS线程级并行方法相比,本发明能够有效利用多核/众核处理器,在提升计算性能的前提下,不改变计算收敛结果,如图3所示(图3为NACA翼型算例下流场气动力残差收敛曲线;其中,基准为在CPU硬件上串行执行的结果,运行1为使用本发明方法在同一CPU上线程并行的结果,运行2为使用本发明方法在GPU上执行的结果,运行3为使用公开号:CN115222870A的中国发明专利《非结构网格隐式LUSGS均衡着色方法、设备及介质》中方法在CPU上线程并行的结果),不降低残差收敛精度,适用于各类复杂计算外形网格,具有良好的计算可解释性和鲁棒性。
需要说明的是,在本发明权利要求书中所限定的保护范围内,以下实施例均可以从上述具体实施方式中,例如公开的技术原理,公开的技术特征或隐含公开的技术特征等,以合乎逻辑的任何方式进行组合和/或扩展、替换。
实施例1
一种非结构隐式LUSGS线程并行方法,包括以下步骤:
S1,以非结构网格的体单元要素映射为邻接关系,邻接关系与计算网格在拓扑结构上等价;
S2,根据拓扑结构将非结构网格划分并行层级,能够并行执行的网格单元划分至同一层级,不能并行执行的网格单元划分至不同层级;
S3,划分得到并行层级后,在向前扫描的计算中,按照第一顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行;在向后扫描的计算中,按照第二顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。
实施例2
在实施例1的基础上,在步骤S2中,所述根据拓扑结构将非结构网格划分并行层级,具体包括如下划分依据:大编号体单元不能在小编号的上层级;邻接体单元不能位于同一层级。
实施例3
在实施例1的基础上,在步骤S2中,所述根据拓扑结构将非结构网格划分并行层级,包括如下子步骤:
S21,初始化网格单元对应的并行层级;
S22,升序遍历所有网格单元;
S23,检查当前网格单元i对应邻接单元的层级,如果所有邻接单元均未划分层级,则当前网格单元i的层级为前一个网格单元i-1的层级,否则,当前网格单元i的层级为所有邻接单元层级中的最大值+1;
S24,判断是否存在下一个网格,如是则跳到步骤S22,否则结束。
实施例4
在实施例1的基础上,在步骤S3中,所述第一顺序为从顶层到底层。
实施例5
在实施例1的基础上,在步骤S3中,所述第二顺序为从底层到顶层。
实施例6
在实施例3的基础上,在步骤S21中,所述初始化网格单元对应的并行层级,包括子步骤:初始化网格单元对应的并行层级为-1。
实施例7
在实施例3的基础上,在步骤S22中,所述升序遍历所有网格单元,包括子步骤:以编号为0的体网格开始,依次升序遍历所有网格单元。
实施例8
一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时执行如实施例1~实施例7任一项所述的方法。
实施例9
一种可读存储介质,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时执行如实施例1~实施例7任一项所述的方法。
实施例10
一种非结构隐式LUSGS线程并行系统,包括如实施例8所述的计算机设备。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本发明实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本发明实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (8)
1.一种非结构隐式LUSGS线程并行方法,其特征在于,包括以下步骤:
S1,以非结构网格的体单元要素映射为邻接关系,邻接关系与计算网格在拓扑结构上等价;
S2,根据拓扑结构将非结构网格划分并行层级,能够并行执行的网格单元划分至同一层级,不能并行执行的网格单元划分至不同层级;所述根据拓扑结构将非结构网格划分并行层级,具体包括如下划分依据:大编号体单元不能在小编号的上层级;邻接体单元不能位于同一层级;
所述根据拓扑结构将非结构网格划分并行层级,包括如下子步骤:
S21,初始化网格单元对应的并行层级;
S22,升序遍历所有网格单元;
S23,检查当前网格单元i对应邻接单元的层级,如果所有邻接单元均未划分层级,则当前网格单元i的层级为前一个网格单元i-1的层级,否则,当前网格单元i的层级为所有邻接单元层级中的最大值+1;
S24,判断是否存在下一个网格,如是则跳到步骤S22,否则结束;
S3,划分得到并行层级后,在向前扫描的计算中,按照第一顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行;在向后扫描的计算中,按照第二顺序,依次完成对应的隐式算法,且每一层级的网格单元并行执行。
2.根据权利要求1所述的非结构隐式LUSGS线程并行方法,其特征在于,在步骤S3中,所述第一顺序为从顶层到底层。
3.根据权利要求1所述的非结构隐式LUSGS线程并行方法,其特征在于,在步骤S3中,所述第二顺序为从底层到顶层。
4.根据权利要求1所述的非结构隐式LUSGS线程并行方法,其特征在于,在步骤S21中,所述初始化网格单元对应的并行层级,包括子步骤:初始化网格单元对应的并行层级为-1。
5.根据权利要求1所述的非结构隐式LUSGS线程并行方法,其特征在于,在步骤S22中,所述升序遍历所有网格单元,包括子步骤:以编号为0的体网格开始,依次升序遍历所有网格单元。
6.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时执行如权利要求1~5任一项所述的方法。
7.一种可读存储介质,其特征在于,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时执行如权利要求1~5任一项所述的方法。
8.一种非结构隐式LUSGS线程并行系统,其特征在于,包括如权利要求6所述的计算机设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311323608.3A CN117056090B (zh) | 2023-10-13 | 2023-10-13 | 非结构隐式lusgs线程并行方法、设备、介质及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311323608.3A CN117056090B (zh) | 2023-10-13 | 2023-10-13 | 非结构隐式lusgs线程并行方法、设备、介质及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117056090A CN117056090A (zh) | 2023-11-14 |
CN117056090B true CN117056090B (zh) | 2023-12-26 |
Family
ID=88657656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311323608.3A Active CN117056090B (zh) | 2023-10-13 | 2023-10-13 | 非结构隐式lusgs线程并行方法、设备、介质及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056090B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136145A (zh) * | 2011-04-27 | 2011-07-27 | 中国科学院遥感应用研究所 | 阈值约束最小生成树算法的区域合并方法 |
CN103885839A (zh) * | 2014-04-06 | 2014-06-25 | 孙凌宇 | 基于多水平划分法和赋权有向超图的云计算任务调度方法 |
CN106201732A (zh) * | 2016-07-18 | 2016-12-07 | 电子科技大学 | 在粒子模拟算法并行中去除数据竞争的线分配并行方法 |
US9619748B1 (en) * | 2002-09-30 | 2017-04-11 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
CN114880112A (zh) * | 2022-03-31 | 2022-08-09 | 深圳清华大学研究院 | 三类顶点度数感知的1.5维度图划分方法及应用 |
CN115016951A (zh) * | 2022-08-10 | 2022-09-06 | 中国空气动力研究与发展中心计算空气动力研究所 | 流场数值模拟方法、装置、计算机设备和存储介质 |
CN115222870A (zh) * | 2022-09-15 | 2022-10-21 | 中国空气动力研究与发展中心计算空气动力研究所 | 非结构网格隐式lusgs均衡着色方法、设备及介质 |
CN116663369A (zh) * | 2023-06-28 | 2023-08-29 | 中国人民解放军国防科技大学 | 非结构网格cfd共享存储并行处理方法和系统 |
-
2023
- 2023-10-13 CN CN202311323608.3A patent/CN117056090B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9619748B1 (en) * | 2002-09-30 | 2017-04-11 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
CN102136145A (zh) * | 2011-04-27 | 2011-07-27 | 中国科学院遥感应用研究所 | 阈值约束最小生成树算法的区域合并方法 |
CN103885839A (zh) * | 2014-04-06 | 2014-06-25 | 孙凌宇 | 基于多水平划分法和赋权有向超图的云计算任务调度方法 |
CN106201732A (zh) * | 2016-07-18 | 2016-12-07 | 电子科技大学 | 在粒子模拟算法并行中去除数据竞争的线分配并行方法 |
CN114880112A (zh) * | 2022-03-31 | 2022-08-09 | 深圳清华大学研究院 | 三类顶点度数感知的1.5维度图划分方法及应用 |
CN115016951A (zh) * | 2022-08-10 | 2022-09-06 | 中国空气动力研究与发展中心计算空气动力研究所 | 流场数值模拟方法、装置、计算机设备和存储介质 |
CN115222870A (zh) * | 2022-09-15 | 2022-10-21 | 中国空气动力研究与发展中心计算空气动力研究所 | 非结构网格隐式lusgs均衡着色方法、设备及介质 |
CN116663369A (zh) * | 2023-06-28 | 2023-08-29 | 中国人民解放军国防科技大学 | 非结构网格cfd共享存储并行处理方法和系统 |
Non-Patent Citations (3)
Title |
---|
"Low-Cost Load Balancing for Parallel Particle-in-Cell Simulations with Thick Overlapping Layers";Yohei Miyake;《2013 12th IEEE International Conference on Trust, Security and Privacy in Computing and Communications》;第1107-1114页 * |
"基于神威异构超算平台的三维不可压流动CFD并行计算研究";张亚英;《中国优秀硕士学位论文全文数据库 基础科学辑》(2023年第03期);第A004-38页 * |
"面向多核CPU/众核GPU架构的非结构CFD共享内存并行计算技术研究";张健;《航空学报》;第1-24页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117056090A (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110413B (zh) | 一种基于材料场缩减级数展开的结构拓扑优化方法 | |
CN111859530B (zh) | 一种飞行器动态气动特性模拟的迭代推进扰动域更新方法 | |
Williamschen et al. | Parallel anisotropic block-based adaptive mesh refinement algorithm for three-dimensional flows | |
Solano-Quinde et al. | Unstructured grid applications on GPU: performance analysis and improvement | |
CN114282372B (zh) | 一种等几何应力拓扑优化方法及其应用 | |
Mostafazadeh Davani et al. | Unsteady Navier-Stokes computations on GPU architectures | |
CN102819454A (zh) | 基于gpu的有限元显式并行求解仿真方法 | |
CN106096183B (zh) | 一种基于特征线法的多重并行方法 | |
CN117056090B (zh) | 非结构隐式lusgs线程并行方法、设备、介质及系统 | |
CN115222870B (zh) | 非结构网格隐式lusgs均衡着色方法、设备及介质 | |
Freret et al. | Enhanced anisotropic block-based adaptive mesh refinement for three-dimensional inviscid and viscous compressible flows | |
Liu et al. | pGRASS-Solver: A Graph Spectral Sparsification-Based Parallel Iterative Solver for Large-Scale Power Grid Analysis | |
Zhang et al. | Adaptation for hybrid unstructured grid with hanging node method | |
CN112434451A (zh) | 一种基于分块并行计算的有限元分析方法 | |
CN107563080A (zh) | 基于gpu的两相介质随机模型并行生成方法、电子设备 | |
CN114969857B (zh) | 一种结构设计优化方法、系统、计算机设备和存储介质 | |
WO2021249374A1 (zh) | 特征线追踪方法、堆芯中子物理计算方法和装置 | |
Shende et al. | New migratory memory algorithm for implicit finite volume solvers | |
CN112446004B (zh) | 非结构网格dilu预条件子众核并行优化方法 | |
Gao et al. | A multi-level parallel tie-dye algorithm for auto-CFD | |
Zhao et al. | Conformal and non-conformal adaptive mesh refinement with hierarchical array-based half-facet data structures | |
CN117494509B (zh) | 一种基于多物理场的块结构自适应网格细化方法 | |
Tyson et al. | Comparison of r-Adaptation Techniques for 2-D CFD Applications | |
CN112632825B (zh) | 一种基于有限元超收敛性的静电场光滑有限元数值算法 | |
Gao et al. | Efficient and Robust parallel mesh motion solver using radial basis functions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |