CN114970206A - 一种反应堆离散纵标法的结构化网格多级并行方法和设备 - Google Patents

一种反应堆离散纵标法的结构化网格多级并行方法和设备 Download PDF

Info

Publication number
CN114970206A
CN114970206A CN202210736121.7A CN202210736121A CN114970206A CN 114970206 A CN114970206 A CN 114970206A CN 202210736121 A CN202210736121 A CN 202210736121A CN 114970206 A CN114970206 A CN 114970206A
Authority
CN
China
Prior art keywords
parallel
calculation
structured grid
reactor
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210736121.7A
Other languages
English (en)
Inventor
明平洲
李治刚
潘俊杰
强胜龙
尹强
郭凤晨
马永强
安萍
芦韡
余红星
夏榜样
刘�东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuclear Power Institute of China
Original Assignee
Nuclear Power Institute of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuclear Power Institute of China filed Critical Nuclear Power Institute of China
Priority to CN202210736121.7A priority Critical patent/CN114970206A/zh
Publication of CN114970206A publication Critical patent/CN114970206A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E30/00Energy generation of nuclear origin
    • Y02E30/30Nuclear fission reactors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种反应堆离散纵标法的结构化网格多级并行方法和设备,方法包括:将每个卦限的结构化网格进行轴向分层,在轴向每一层进行径向区域分解,使用多进程并行扫描计算;在轴向每一层划分的分块区域,使用多线程并行扫描计算。本发明采用多级并行策略,改进了现有工程计算中的并行扫描算法的性能,提高了计算效率,并节约了资源。

Description

一种反应堆离散纵标法的结构化网格多级并行方法和设备
技术领域
本发明涉及堆芯数值计算、中子/光子输运计算等技术领域,具体涉及一种反应堆离散纵标法的结构化网格多级并行方法和设备。
背景技术
反应堆物理求解中子输运方程,主要获得物理参数中子注量率(中子通量)
Figure BDA0003715780140000011
其中与位置、能量、离散方向和时间相关。波尔兹曼输运方程是粒子分布函数随时间和空间变化的微分-积分方程,它可以区分为在稳态和瞬态情况下的求解方案,一般情况下稳态方程包含空间自由度,能量和运动方向六个自变量。
Figure BDA0003715780140000012
求解中子输运方程时,常用的近似方法是把变量Ω直接离散的数值方法,即只对选定的若干个离散方向Ωm对中子输运方程求解。从中子输运方程求出φ(r,E,Ωm)后,关于方向Ω的有关积分则用数值积分来近似表示。
Figure BDA0003715780140000013
式中求积系数ωm,离散方向及其数目取决于计算精度的要求,这便是离散纵标方法(SN方法,又写作SN)。此处下标N表示方向向量在某个纵坐标方向上(例如直角坐标系的x方向坐标轴)的离散点数目。在反应堆物理和屏蔽计算中,对中子角通量密度分布各向异性比较严重或非均匀性比较强烈的问题(例如栅元或燃料组件)的计算中都广泛应用。用SN数值方法求解中子输运方程的一个重要问题是对计算的加速,一方面可以通过收敛算法来减少迭代计算的次数,另一方面可以利用SN方法在局部计算的天然并行性,通过并行计算机来并行求解加快求解速度。
然而现有的输运方程求解方法,例如Hydra-SN3D软件是使用SN方法求解输运方程的通用程序,强调在结构化网格情况下使用KBA并行扫描算法来并行求解几何的各个区域。然而该现有技术仍然存在资源浪费,效率较低的问题。
发明内容
针对上述问题,本发明提供了一种反应堆离散纵标法的结构化网格多级并行方法和系统。本发明首先对结构化网络按照所在的卦限进行并行求解,在每个卦限内部的计算外层循环为单个离散方向和轴向分层,在每一层的径向上按照二维进程数划分为多个区域,实施多级并行扫描计算,本发明提高了计算效率。
本发明通过下述技术方案实现:
一种反应堆离散纵标法的结构化网格多级并行方法,包括:
将每个卦限的结构化网格进行轴向分层,在轴向每一层进行径向区域分解,使用多进程并行扫描计算;在轴向每一层划分的分块区域,使用多线程并行扫描计算。
作为优选实施方式,本发明的在轴向每层进行径向区域分解,具体为:
在每一层的径向上按照二维进程数划分为多个区域。
作为优选实施方式,本发明的在轴向每一层划分的分块区域,使用多线程并行扫描计算,具体为:
划分的分块区域存在三个维度,外层循环的维度保持不变,在径向坐标上按照线程数划分为多个分块,使用多线程并行扫描计算。
作为优选实施方式,本发明的多进程并行的结构化网格是流水线波前栅元的扫描结构。
作为优选实施方式,本发明的多进程并行扫描计算过程中:
当进程位于边界时,只执行发送操作;
当进程位于中间时,只执行接收操作;
其中,接收操作采用阻塞式通信函数,发送操作采用阻塞式通信函数或非阻塞式通信函数。
作为优选实施方式,本发明的多进程并行扫描计算过程中:
计算过程采用KBA并行扫描算法。
作为优选实施方式,本发明的多线程并行扫描计算中:
每一层的径向坐标扫描计算具备流水线并行。
作为优选实施方式,本发明的多进程并行扫描计算使用MPI实现;多线程并行扫描计算使用OpenMP实现。
第二方面,本发明提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本发明所述方法的步骤。
第三方面,本发明提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明所述方法的步骤。
本发明具有如下的优点和有益效果:
本发明采用多级并行策略,改进了现有工程计算中的并行扫描算法的性能,提高了计算效率,并节约了资源。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为现有Hydra-SN3D软件迭代计算原理框图。
图2为本发明实施例的XYZ坐标系中结构化网格示意图。其中,(a)为第一卦象的结构化网格;(b)为结构化网格轴向分层示意图。
图3为本发明实施例的多进程并行计算运行示意图。
图4为本发明实施例的LWR池式堆芯例题的布置图。
图5为本发明实施例的KUCA压水堆堆芯例题的布置图。
图6为本发明实施例的LWR池式堆芯例题的计算结果(通量分布图)。
图7为本发明实施例的KUCA压水堆堆芯例题的计算结果(通量分布图)。
图8为本发明实施例的计算机设备原理框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
工程计算软件Hydra-SN3D软件采用SN方法(又称离散坐标法,即Discrete-Ordinates Method),利用源迭代的算法来求解输运方程,总共包含内外两层迭代,如图1所示。内迭代中对整个几何区域使用了KBA(Koch-Baker-Alcouffe)并行扫描算法来求解通量矩信息,由于是XYZ坐标系结构化网格,多进程运行时各个分块区域采用平均划分的方式在径向上进行(i,j)分割。然而该KBA并行扫描算法的性能仍然存在浪费资源、效率不够高的问题,针对此,本实施例提出了一种反应堆离散纵标法的结构化网格多级并行方法,本实施例的方法基于SN方法中的KBA多进程并行扫描算法,进一步对该算法在每个进程中的计算内容进行分解,实现多级并行策略。
本实施例的方法依序对结构化网络所在的卦限进行并行求解,并在每个卦限内部的计算外层循环为单个离散方向和轴向分层,在每一层的径向上按照二维进程数划分为多个区域,使用多进程并行扫描计算;划分的分块区域存在三个维度,外层循环的维度k保持不变,在径向坐标(i,j)上按照线程数划分为多个分块,使用多线程并行扫描计算。
本实施例以两级算法对上述多级并行方法进行说明:
第一级是进程级别,主要是区域分解提升并行度,这一部分计算内容具备天然并行性,每个进程求解当前分层内的一个区域。多进程并行,在对每个卦限内的各个离散角方向进行扫描计算时,结构化网格在轴向上进行了分层,每个分层在径向上按照二维进程(i,j)的方式进行区域分解,每个进程代表了一个分块区域,它可能位于整个几何的边界,也可能位于整个几何的中间,因此并行计算过程中,每个进程需要判断自身是否在几何的边界,以及存储与其相邻的进程号,当进程位于边界时,只执行发送操作,当进程位于中间时,只执行接收操作。
第二级是线程级别,考虑到径向坐标(i,j)存在着数据变量的互斥访问,需要针对结构化网络的扫描方向采用流水线并行提升并行度。多线程并行,在每个分块区域仍然需要对网格按照(i,j,k)的方式进行扫描计算。每个进程的当前分块区域逐层进行计算,每层的径向(i,j)扫描计算具备流水线并行。
本实施例以分块区域为(4,4)的径向结构为例进行说明,如表1所示,从时刻T开始执行扫描计算,单线程运行共需要16个栅元结构计算时间。按照本实施例的方法,四个线程共需要7个栅元结构计算时间,其中线程1在T+1时刻完成第一列第一个栅元结构的计算,则线程2在T+1时刻开始执行第二列第一个栅元结构的计算。该实施方式反映了离散纵标法底层计算的流水线结构,它与结构化网格的数据组织形式紧密相关。
表1
T T+1 T+2 T+3
T+1 T+2 T+3 T+4
T+2 T+3 T+4 T+5
T+3 T+4 T+5 T+6
具体的,结构化网格通常具有对称的特性,结构化网格在XYZ坐标系中通常表达为八个卦限及其离散角方向,每个卦限的结构化网格示意图如图2所示,当网格参数为:
[x,y,z]=50×50×50
轴向上分为5层,则每一层的网格数量为50×50×10,即每层在轴向上有10个分段,径向上仍然为50×50的计算量,可以进行分块的区域分解。以上的分解形式保证轴向上具有迭代计算的先后顺序,径向上可以按照(i,j)的二维进程划分。图2所示为离散纵坐标法的结构化网格形式,离散角方向按照卦限进行区分,每个卦限内均对所有50×50×50网格执行相似的扫描计算。
本实施例中,径向上对每一层的区域按照二维进程数进行划分,在径向上将(i,j)区域分解为(ib,jb),此时进程数量(PI,PJ)具有二维特性,进程之间的相互关系表明了网格分块之间的相邻关系。这使得整体计算量固定的前提下降低每个进程的计算量,从而起到提升计算效率的目标。
具体的,本实施例以5×2个进程分割为例,每一层每个区域的网格数量为:
[x,y,z]=10×25×10
第一卦限的进程序号与数据分块将如图3所示,进程9首先开始计算,完成网格数据分块的计算后将通量矩计算结果发送给相邻的数据分块(进程4和进程8),此时进程4和进程8可以同时计算,计算完成后发送计算结果给进程3,进程3再开始计算,以此类推。由此可见SN方法的第一级并行的结构化网格是流水线波前栅元的扫描结构。本实施例的多进程并行计算可采用MPI(Message Passing Interface,消息传递接口)编程实现。
各个分块区域的并行度在多级并行方法中通过多线程并行来实现,它取决于单个结构化网格使用的SN方法外推公式、数据组织形式等多种因素,但一般与离散角方向的扫描顺序关联,结构化网格在XYZ坐标系中通常表达为八个卦限及其离散角方向,多线程并行区域的扫描计算在各个卦限按照(i,j,k)的方向依次取值为:(-1,-1,-1),(-1,-1,+1),(+1,-1,-1),(+1,-1,+1),(-1,+1,-1),(-1,+1,+1),(+1,+1,-1),(+1,+1,+1)。考虑到数量变量存在着互斥访问,本实施例提出的多线程并行将在(i,j)这个循环层次开展并行,最外层循环k方向保持不变。本实施例中的多线程并行计算可采用OpenMP(Open Multi-Processing,多线程并发的编程接口)进行编程实现。
综上所述,进程级别的并行表示每层上的分块区域的并行度,线程级别的并行则表明每个分块区域的并行度。
实施例2
本实施例采用二维LWR池式堆芯例题和三维KUCA压水堆堆芯例题对上述实施例1提出的多级并行方法进行验证,它们作为基准例题,分别使用单群输运截面数据和两群输运截面数据。数值实验选用基于Intel编译器的MPI工具链,优化选项固定为-O0。
二维LWR池式堆芯例题和三维KUCA压水堆堆芯例题的有效增殖系数keff见表2:
表2
LWR池式堆芯例题 KUCA压水堆堆芯例题
K<sub>eff</sub>=1.00872 K<sub>eff</sub>=0.977167
采用现有的Hydra-SN3D软件的计算效率(计时单位:秒)如表3所示:
表3
Figure BDA0003715780140000081
采用上述实施例1提出的多级并行方法的计算效率(计时单位:秒)如表4所示:
表4
Figure BDA0003715780140000082
通过上述实验结果可知,采用上述实施例1的多级并行方法使得单进程的计算效率得到了较大提升。每个基准例题使用8个线程实施的多线程并行均起到了加速的作用。受限于流水线结构和结构化网格的组织形式,多线程并行不能实现线性加速效果(两个例题的线程加速效果为1.6和3.0),可以推断不同的例题可以使用不同的线程数目来取得增益的最大化。与此同时,上述实施例1提出的多级并行方法可以联合多进程并行和多线程并行,使得两个例题的计算效率在计算资源充足的情况下均有较大提升(加速效果呈线性)。
上述实施例1提出的多级并行方法能够使用更多的计算资源,且当计算资源固定进程数和线程数的乘积前提下,多级并行可以通过进程数和线线程数的不同组合来取得更高的性能增益。
如图4所示,二维LWR池式堆芯结构中,清水区域内包含两个较大的体源区域和吸收体区域,即共有五种材料布置成池式堆芯。整个堆芯取真空边界条件。结构化网格数量为96×86。
如图5所示,三维KUCA压水堆堆芯提供两群的输运截面,整个堆芯取为1/4结构,有两个方向为反射边界条件。结构化网格数量为50×50×50。
对二维LWR池式堆芯的结构化网格的标通量进行可视化,在串行和多级并行运行情况下具有相同的通量分布图,如图6所示。
对三维KUCA压水堆堆芯的结构化网格的标通量进行可视化,在串行和多级并行运行情况下具有相同的通量分布图,如图7所示。
具体如图8所示,计算机设备包括处理器、内存储器和系统总线;内存储器和处理器在内的各种设备组件连接到系统总线上。处理器是一个用来通过计算机系统中基本的算术和逻辑运算来执行计算机程序指令的硬件。内存储器是一个用于临时或永久性存储计算程序或数据(例如,程序状态信息)的物理设备。系统总线可以为以下几种类型的总线结构中的任意一种,包括存储器总线或存储控制器、外设总线和局部总线。处理器和内存储器可以通过系统总线进行数据通信。其中内存储器包括只读存储器(ROM)或闪存(图中未示出),以及随机存取存储器(RAM),RAM通常是指加载了操作系统和计算机程序的主存储器。
计算机设备一般包括一个外存储设备。外存储设备可以从多种计算机可读介质中选择,计算机可读介质是指可以通过计算机设备访问的任何可利用的介质,包括移动的和固定的两种介质。例如,计算机可读介质包括但不限于,闪速存储器(微型SD卡),CD-ROM,数字通用光盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并可由计算机设备访问的任何其它介质。
计算机设备可在网络环境中与一个或者多个网络终端进行逻辑连接。网络终端可以是个人电脑、服务器、路由器、智能电话、平板电脑或者其它公共网络节点。计算机设备通过网络接口(局域网LAN接口)与网络终端相连接。局域网(LAN)是指在有限区域内,例如家庭、学校、计算机实验室、或者使用网络媒体的办公楼,互联组成的计算机网络。WiFi和双绞线布线以太网是最常用的构建局域网的两种技术。
应当指出的是,其它包括比计算机设备更多或更少的子系统的计算机系统也能适用于发明。
如上面详细描述的,适用于本实施例的计算机设备能执行反应堆离散纵标法的结构化网格多级并行方法的指定操作。计算机设备通过处理器运行在计算机可读介质中的软件指令的形式来执行这些操作。这些软件指令可以从存储设备或者通过局域网接口从另一设备读入到存储器中。存储在存储器中的软件指令使得处理器执行上述的群成员信息的处理方法。此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本发明。因此,实现本实施例并不限于任何特定硬件电路和软件的组合。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,包括:
将每个卦限的结构化网格进行轴向分层,在轴向每一层进行径向区域分解,使用多进程并行扫描计算;在轴向每一层划分的分块区域,使用多线程并行扫描计算。
2.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,在轴向每层进行径向区域分解,具体为:
在每一层的径向上按照二维进程数划分为多个区域。
3.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,在轴向每一层划分的分块区域,使用多线程并行扫描计算,具体为:
划分的分块区域存在三个维度,外层循环的维度保持不变,在径向坐标上按照线程数划分为多个分块,使用多线程并行扫描计算。
4.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,多进程并行的结构化网格是流水线波前栅元的扫描结构。
5.根据权利要求4所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,多进程并行扫描计算过程中:
当进程位于边界时,只执行发送操作;
当进程位于中间时,只执行接收操作;
其中,接收操作采用阻塞式通信函数,发送操作采用阻塞式通信函数或非阻塞式通信函数。
6.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,多进程并行扫描计算过程中:
计算过程采用KBA并行扫描算法。
7.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,多线程并行扫描计算中:
每一层的径向坐标扫描计算具备流水线并行。
8.根据权利要求1所述的一种反应堆离散纵标法的结构化网格多级并行方法,其特征在于,多进程并行扫描计算使用MPI实现;多线程并行扫描计算使用OpenMP实现。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。
CN202210736121.7A 2022-06-27 2022-06-27 一种反应堆离散纵标法的结构化网格多级并行方法和设备 Withdrawn CN114970206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210736121.7A CN114970206A (zh) 2022-06-27 2022-06-27 一种反应堆离散纵标法的结构化网格多级并行方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210736121.7A CN114970206A (zh) 2022-06-27 2022-06-27 一种反应堆离散纵标法的结构化网格多级并行方法和设备

Publications (1)

Publication Number Publication Date
CN114970206A true CN114970206A (zh) 2022-08-30

Family

ID=82965634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210736121.7A Withdrawn CN114970206A (zh) 2022-06-27 2022-06-27 一种反应堆离散纵标法的结构化网格多级并行方法和设备

Country Status (1)

Country Link
CN (1) CN114970206A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126927A (zh) * 2016-06-24 2016-11-16 西安交通大学 一种用于反应堆屏蔽计算的并行扫描方法
CN106951683A (zh) * 2017-02-28 2017-07-14 西安交通大学 一种用于核电厂厂房屏蔽计算的高效并行扫描方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126927A (zh) * 2016-06-24 2016-11-16 西安交通大学 一种用于反应堆屏蔽计算的并行扫描方法
CN106951683A (zh) * 2017-02-28 2017-07-14 西安交通大学 一种用于核电厂厂房屏蔽计算的高效并行扫描方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
明平洲;唐松乾;安萍;芦韡;刘东;余红星: "反应堆中子学屏蔽计算软件Hydra-SN3D的改进", 中国核电, vol. 13, no. 02, pages 157 - 158 *

Similar Documents

Publication Publication Date Title
US8400458B2 (en) Method and system for blocking data on a GPU
Baker An sn algorithm for modern architectures
Pereira et al. PSkel: A stencil programming framework for CPU‐GPU systems
Chen et al. A flow-guided file layout for out-of-core streamline computation
Bhatele et al. Heuristic-based techniques for mapping irregular communication graphs to mesh topologies
Gunney et al. Parallel clustering algorithms for structured AMR
Jeon et al. Parallel exact inference on a CPU-GPGPU heterogenous system
Almasri et al. Parallel k-clique counting on gpus
Nunes et al. A fast approximate string matching algorithm on GPU
Saad et al. Mixed shared-distributed hash tables approaches for parallel state space construction
Tang et al. Optimizing and auto-tuning iterative stencil loops for GPUs with the in-plane method
CN114970206A (zh) 一种反应堆离散纵标法的结构化网格多级并行方法和设备
CN106484532B (zh) 面向sph流体模拟的gpgpu并行计算方法
Khorramizadeh et al. A bee colony optimization approach for mixed blocking constraints flow shop scheduling problems
Taylor et al. Accelerating the yinyang k-means algorithm using the GPU
CN111832144B (zh) 一种全振幅量子计算模拟方法
Jo et al. Collaborative processing of data-intensive algorithms with CPU, intelligent SSD, and GPU
WO2019141160A1 (zh) 一种数据处理的方法及装置
Capozzoli et al. The success of GPU computing in applied electromagnetics
Xiao et al. Shell: A spatial decomposition data structure for ray traversal on GPU
Topa Cellular automata model tuned for efficient computation on GPU with global memory cache
Gao et al. A Multi-level Parallel Tie-dye Algorithm for Auto-CFD
CN104050175A (zh) 利用gpu片上树群实现二维数据近邻搜索的并行方法
Sasidharan et al. A general space-filling curve algorithm for partitioning 2D meshes
Sakai et al. Parallel processing for density-based spatial clustering algorithm using complex grid partitioning and its performance evaluation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220830