CN107526887B - 一种基于GPU并行的LeapfrogADI-FDTD方法 - Google Patents

一种基于GPU并行的LeapfrogADI-FDTD方法 Download PDF

Info

Publication number
CN107526887B
CN107526887B CN201710725448.3A CN201710725448A CN107526887B CN 107526887 B CN107526887 B CN 107526887B CN 201710725448 A CN201710725448 A CN 201710725448A CN 107526887 B CN107526887 B CN 107526887B
Authority
CN
China
Prior art keywords
gpu
calculation
grid
equation
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710725448.3A
Other languages
English (en)
Other versions
CN107526887A (zh
Inventor
金晓林
刘智超
李斌
杨中海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710725448.3A priority Critical patent/CN107526887B/zh
Publication of CN107526887A publication Critical patent/CN107526887A/zh
Application granted granted Critical
Publication of CN107526887B publication Critical patent/CN107526887B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/23Design optimisation, verification or simulation using finite element methods [FEM] or finite difference methods [FDM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于计算电磁学与高性能计算领域,具体为一种基于GPU并行的Leapfrog ADI‑FDTD方法。本发明采用Yee网格,通过将GPU并行计算技术应用到含有CPML吸收边界的Leapfrog ADI‑FDTD算法中,形成了基于GPU并行加速的含有CPML吸收边界的Leapfrog ADI‑FDTD算法,在保持Leapfrog ADI‑FDTD算法与CPML吸收边界的优良特性的同时,极大地提高了计算效率,大大节约了计算时间,减少了数值模拟实验的时间周期和成本,达到了相关科学研究或器件设计的高效需求。

Description

一种基于GPU并行的LeapfrogADI-FDTD方法
技术领域
本发明属于计算电磁学与高性能计算领域。涉及一种基于GPU并行加速的计算技术,具体为一种基于GPU并行的Leapfrog ADI-FDTD方法。
背景技术
近30年来,由于高功率微波和毫米波源技术在科学技术和工业方面的广泛应用,高功率微波和毫米波源技术发展很快。近20年来,由于在生命医学、天体物理、等离子体加热、雷达和高速数据通讯等方面具有重要的应用前景,太赫兹技术也得到了快速的发展。无论是高功率微波和毫米波的应用,还是太赫兹的应用,中等功率或高功率的源是基础。真空电子器件是能够工作在室温条件下,并产生高功率微波、毫米波和低频段太赫兹波的主要器件。真空电子器件是通过将高压脉冲所具有的能量转化为电磁波的能量,通过波导以及天线将电磁波能量辐射出去。真空电子器件主要包括:返波管、回旋管、速调管、行波管、磁控管、振荡器和自由电子激光器等。
因为真空电子器件的实验设计和研制费用很高,研制周期较长,所以,现阶段真空电子器件的设计越来越依赖数值模拟,这样可以大大减少器件设计所需的时间及经费。在真空电子器件设计中的关键物理问题之一是微波的传输与放大特性,如何精确求解时变电磁场至关重要。在微波传输与放大特性的数值模拟中主要解决三个问题:1、内部场的求解问题;2、吸收边界的处理问题;3、计算效率问题。在真空电子器件内部,时变电磁场的求解采用的主要算法有时域有限差分算法(FDTD)、交替隐式时域有限差分算法(ADI-FDTD)以及蛙跳交替隐式时域有限差分算法(Leapfrog ADI-FDTD)。
FDTD是由Maxwell方程组离散后得到的显式差分算法,必须满足CFL时间稳定性条件,也就是时间步长的取值由计算空间中的空间步长的最小值决定,这就要求时间步长必须取的足够小。而时间步长的减小,使得迭代步数和运算时间大量增加,极大地增加了计算成本。为了弥补FDTD的缺陷,90年代后期曾提出了交替隐式时域有限差分算法(ADI-FDTD)。该算法存在中间的子时间步,在无条件稳定的同时损失了一定的计算资源,同时也使得对其并行变得无法实现,制约了它的发展与应用范围。
针对ADI-FDTD算法出现的不足,在2009年Cooke等人提出了一种新的无条件稳定的蛙跳交替方向隐式时域有限差分(Leapfrog ADI-FDTD)算法。在Leapfrog ADI-FDTD算法中,E和H在时间格点上同样相差Δt/2,但E和H都采用隐式公式。其每个时间步长所计算的场量与FDTD算法和ADI-FDTD算法的对比图如图1所示。较传统的ADI-FDTD算法,该算法没有子时间步的计算资源消耗,迭代方程更为简单,但仍然保持了无条件稳定的优点,所以该算法相对传统的无条件稳定算法有更高的效率。
由于计算机的局限性,基于有限差分的电磁数值模拟只能在有限区域内进行,这样必须对计算区域的边界进行截断处理。分析现有文献发现,在数值模拟电磁场的过程中,通常假设计算区域足够大,使得截断边界离激励源和目标的距离足够远。该方式由于计算域范围过大,数值计算时占用大量的计算内存,耗费大量的计算时间,导致计算效率极低。
为了克服以上缺点,在使用FDTD算法模拟电磁场时,通常采用缩小计算域范围,并在截断边界处设置合适吸收边界的形式。目前应用较多的吸收边界有Mur吸收边界、廖氏吸收边界和完全匹配层(Perfectly Matched Layer,PML)吸收边界。
Mur吸收边界虽然简单方便、占用内存小,但计算精度不高,在角区域存在较大误差;二阶近似的Mur吸收边界虽然精度有所改善,但对低频感应场的吸收效果差。廖氏吸收边界能够很好地吸收来自计算区域的电磁波,但它的高阶吸收边界不稳定。PML吸收边界给吸收边界的研究带来了本质性的突破,但它采用分裂电磁场的方式来描述各向异性材料,对计算机的硬件要求很高,并且在模拟电磁波时对高有耗介质中的波和倏逝波的吸收效果不佳。而在PML基础上发展的UPML(uniaxial PML)吸收边界则直接使用各向异性材料而不改变电磁场形式,能作为电磁波的吸收边界,但它的递推公式与材料特性有关,并且对大角度入射波及电磁波里低频成份的吸收效果差。
目前最具潜力的当属卷积完全匹配层(Convolutional PML,CPML)吸收边界,它除了具有UPML吸收边界的性能外,还能对倏逝波、晚时反射波以及低频感应场进行有效的吸收,因而CPML吸收边界特别适合用做电磁波数值模拟计算中截断边界的处理。
简单来说,为了达到较好的数值模拟效果,目前最好的处理办法是将LeapfrogADI-FDTD算法与CPML吸收边界结合,形成统一的计算算法进行数值模拟计算,这样既保证了Leapfrog ADI-FDTD算法的优良计算特性,同时也兼顾了CPML的吸收特性。但是,由于这种隐式求解方式需要求解矩阵方程,而求解矩阵方程的过程中计算资源消耗大、计算效率低下、计算时间长,因此增加了数值模拟实验的时间周期和成本,无法达到相关科学研究或器件设计的高效需求。
发明内容
针对上述存在的问题和不足,为解决含有CPML吸收边界的Leapfrog ADI-FDTD算法计算效率低下、计算时间过长的问题,本发明提供了一种基于GPU并行的Leapfrog ADI-FDTD方法,其基于GPU并行且含有CPML吸收边界。具体技术方案如下:
步骤1、将求解区域使用Yee网格划分。
对CPU主机端与GPU上的数据进行初始化,即在CPU主机端定义结构体数组,大小为模拟求解区域的总网格数,用于存放GPU返回的各个网格点的电磁场计算结果,并将各个网格的电磁场场值赋值为0。同时,在GPU上的全局内存中定义同样大小的结构体数组,用于存储电磁场计算结果,并将各个网格的电磁场场值赋值为0。
步骤2、数据预处理,在GPU全局内存上开辟空间,并利用下述推导的计算式,计算得到矩阵方程的系数矩阵。数据预处理流程如图4所示。
在三维情形下,含有CPML的Leapfrog ADI-FDTD算法计算的场量有六个,包括:电场的三个分量:Ex、Ey、Ez;磁场的三个分量:Hx、Hy、Hz。其中,Ex的计算公式如式(1)、(2)、(3)所示,Hx的计算公式如式(4)、(5)、(6)所示:
Figure BDA0001385910570000031
其中:
Figure BDA0001385910570000033
Figure BDA0001385910570000034
其中:
Figure BDA0001385910570000036
其中,μ为磁导率,ε为介电常数,ks为坐标伸缩系数(s=x,y,z),Δt为单位时间步长,Δx、Δy、Δz分别为沿x、y、z方向的单位网格长度,as与bs为中间计算结果,二者的计算是为了得到ψ,其计算式如式(21)(20)所示,ψ为方程右端常数项的中间结果,i、j、k为模拟区域中网格在x、y、z方向上的编号,n为当前时间步长。其他方向的电场Ey、Ez与磁场分量Hy、Hz计算式同理可得。
由于在Yee网格中,存在半网格位置,为了在计算机中进行数值模拟计算,我们需要将地址映射到整数网格点。将上述(1)~(6)式进行地址映射与化简后我们得到Ex的计算式如式(7)~(12)所示,Hx的计算式如式(13)~(18)所示:
Figure BDA0001385910570000041
其中:
Figure BDA0001385910570000042
Figure BDA0001385910570000043
CEx=AEx (10)
Figure BDA0001385910570000044
Figure BDA0001385910570000045
Figure BDA0001385910570000046
其中:
Figure BDA0001385910570000047
Figure BDA0001385910570000048
CHx=AHx (16)
Figure BDA0001385910570000051
Figure BDA0001385910570000052
其中,AEx、BEx、CEx为Ex计算方程中左端的系数,AHx、BHx、CHx为Hx计算方程中左端的系数。其他方向电场分量Ey、Ez与磁场分量Hy、Hz计算式同理可得。
其中,方程中特定的变量求解式如下:
(s=x,y,z) (19)
Figure BDA0001385910570000053
Figure BDA0001385910570000054
Figure BDA0001385910570000055
Figure BDA0001385910570000056
Figure BDA0001385910570000058
kzmax=8 (26)
kxmax=kymax=1 (27)
m=4 (28)
其中m与mα是多项式的阶数,s0是CPML与模拟区域交界位置,s是当前CPML位置,d是CPML层的厚度,σ、α为中间计算变量,用于as、bs的计算。
根据以上计算式分别得到各个场分量计算方程的系数和方程右端常数项,根据计算方程的特点,其系数构成了三对角矩阵,我们将三对角矩阵压缩存储在GPU全局内存中的数组A、B、C中,方程右端常数项存储在GPU全局内存中的数组X中。
步骤3、使用在GPU上开辟的线程去求解计算电场的矩阵方程。从而得到每个网格处的电场场值Ex、Ey、Ez,最后进行电场边界的处理。电场计算流程如图5所示。
步骤4、利用上一步计算得到的电场场值,使用在GPU上开辟的线程去求解计算磁场的矩阵方程,从而得到每个网格处的磁场场值Hx、Hy、Hz,最后进行磁场边界的处理。磁场计算流程如图6所示。
步骤5、存储计算结果至GPU全局内存并重复步骤3、4,在每个时间步长都更新每个网格的电场与磁场的场值,从step=0迭代直至达到step=STEPS,STEPS为设置的模拟总时间步长数。
步骤6、将步骤5的计算结果从GPU传回CPU主机端,进行数据分析与存储。
本发明适用于一维、二维及三维结构,适用于二维时,分布在激励源网格处的电磁场分量分别对应为Ey、Hz;电磁场分量对应公式相应退化。适用于一维时,分布在激励源网格处的电磁场分量对应为Ey;电磁场分量对应公式相应退化。
GPU是为了解决计算密集型、高度并行的问题而设计,它拥有大规模高度并行的流处理器,能够把高强度的计算需求通过合适的方式转变成为并行的流式数据计算模式,吞吐量很大,可以提供数十倍乃至于上百倍高于CPU的计算性能,在速度上获得一个数量级的提升。
本发明采用Yee网格,通过将GPU并行计算技术应用到含有CPML吸收边界的Leapfrog ADI-FDTD算法中,形成了基于GPU并行加速的含有CPML吸收边界的LeapfrogADI-FDTD算法,在保持Leapfrog ADI-FDTD算法与CPML吸收边界的优良特性的同时,极大地提高了计算效率,大大节约了计算时间,减少了数值模拟实验的时间周期和成本,达到了相关科学研究或器件设计的高效需求。
附图说明
图1为三种算法中场量随时间步长更新方式对比图;
图2为三维Yee网格示意图;
图3为算法总体流程图;
图4为预处理模块流程图;
图5为电场求解模块流程图;
图6为磁场求解模块流程图;
图7为三维矩形波导计算实例示意图;
具体实施方式
下面结合附图和实例对本发明作进一步详细说明。
实例中测试了三维均匀矩形波导模型。其横截面示意图如图7所示。波导宽度为a=20.0mm,对模拟求解区域进行Yee网格划分,三个方向上的网格数分别为:Nx=22、Ny=12、Nz=142,波导边界采用金属边界,取CPML层的厚度为40层(40*Δz),加入CPML吸收边界的位置为沿传播方向Z的第100号网格,故令s0=99。激励源采用了TE10模式的强迫性激励源作为面源,频率f=10GHz,激励源加载在波导输入端口的截面上,所加激励源方程为:
Figure BDA0001385910570000071
ω=2πf (30)
其中,X=0.02,Δx=1mm。单位网格大小Δx=Δy=Δz=1mm,单位时间步长Δt=0.57749ps,模拟时间步长数STEPS=5000。
步骤1、将模拟求解区域使用Yee网格划分,三个方向上的网格数分别为:Nx=22、Ny=12、Nz=142,在CPU主机端定义结构体数组,大小为22*12*142,用于存放GPU返回的电磁场计算结果并初始化各个网格的电磁场场值为0,同时在GPU的全局内存上定义同样大小的结构体数组,用于存储电磁场计算结果,并将各个网格的电磁场场值赋值为0。
步骤2、数据预处理,在GPU全局内存上开辟空间,根据前一部分推导的计算式我们可知,其系数构成了三对角矩阵,我们将三对角矩阵压缩存储在GPU全局内存中的数组A、B、C中,方程右端常数项存储在GPU全局内存中的数组X中。其中Ex的系数数组A、B、C与方程右端常数项中的ψ数组的计算式如(31)~(35)所示,Hx的系数数组A、B、C与方程右端常数项中的ψ数组的计算式如(36)~(40)所示:
Figure BDA0001385910570000072
Figure BDA0001385910570000073
CEx=AEx (33)
Figure BDA0001385910570000074
Figure BDA0001385910570000075
Figure BDA0001385910570000077
CHx=AHx (38)
Figure BDA0001385910570000081
Figure BDA0001385910570000082
其他方向的电磁场计算方程的系数数组A、B、C与常数项数组X也可同理得到。
步骤3、使用在GPU上开辟的线程去求解计算电场的矩阵方程。从而得到每个网格处的电场场值Ex、Ey、Ez,同时按金属边界条件将波导边界截面的切向电场分量赋值为0,最后根据当前时间步长更新激励源。
步骤4、利用步骤3计算得到的电场场值,使用在GPU上开辟的线程去求解计算磁场的矩阵方程,从而得到每个网格处的磁场场值Hx、Hy、Hz,最后按金属边界条件将波导边界截面的法向磁场分量赋值为0。
步骤5、将步骤3、4的计算结果存储在GPU的全局内存中并重复步骤3、4,从step=0迭代直至达到STEPS=5000。
步骤6、将步骤5的计算结果从GPU的全局内存传回CPU主机端内存中,保存计算结果。
经过计算并对比未进行GPU加速的CPU串行版本的含有CPML的Leapfrog ADI-FDTD算法可知,计算速度有了显著的提升。由CPU串行版本的16465.904秒计算时间缩短到GPU炳新版本的316.652秒计算时间,加速比达到了52,显著缩短了模拟计算时间,极大地提高了计算效率,减少了数值模拟实验的时间周期和成本,达到了相关科学研究或器件设计的高效需求。

Claims (3)

1.一种基于GPU并行的Leapfrog ADI-FDTD方法,具体步骤如下:
步骤1、将求解区域使用Yee网格划分;
对CPU主机端与GPU上的数据进行初始化,即在CPU主机端定义结构体数组,大小为模拟求解区域的总网格数,用于存放GPU返回的各个网格点的电磁场计算结果,并将各个网格的电磁场场值赋值为0;同时,在GPU上的全局内存中定义同样大小的结构体数组,用于存储电磁场计算结果,并将各个网格的电磁场场值赋值为0;
步骤2、数据预处理,在GPU全局内存上开辟空间,并利用下述推导的计算式,计算得到矩阵方程的系数矩阵;
含有CPML的Leapfrog ADI-FDTD算法计算的场量包括电场的三个分量Ex、Ey、Ez,磁场的三个分量Hx、Hy、Hz;其中,Ex的计算公式如式(1)、(2)、(3)所示,Hx的计算公式如式(4)、(5)、(6)所示:
Figure FDA0001385910560000011
Figure FDA0001385910560000012
Figure FDA0001385910560000013
Figure FDA0001385910560000014
Figure FDA0001385910560000015
其中,μ为磁导率,ε为介电常数,ks为坐标伸缩系数s=x,y,z,Δt为单位时间步长,Δx、Δy、Δz分别为沿x、y、z方向的单位网格长度,as与bs为中间计算结果,二者的计算是为了得到ψ,其计算式如式(21)(20)所示,ψ为方程右端常数项的中间结果,i、j、k为模拟区域中网格在x、y、z方向上的编号,n为当前时间步长;
其他方向的电场Ey、Ez与磁场Hy、Hz分量计算式同理可得;
由于在Yee网格中,存在半网格位置,将地址映射到整数网格点,将(1)~(6)式进行地址映射与化简后得到Ex的计算式如式(7)~(12)所示,Hx的计算式如式(13)~(18)所示:
Figure FDA0001385910560000029
其中:
Figure FDA0001385910560000021
Figure FDA0001385910560000022
CEx=AEx (10)
Figure FDA0001385910560000023
Figure FDA0001385910560000024
Figure FDA0001385910560000025
其中:
Figure FDA0001385910560000026
Figure FDA0001385910560000027
CHx=AHx (16)
Figure FDA0001385910560000028
Figure FDA0001385910560000031
其中,AEx、BEx、CEx为Ex计算方程中左端的系数,AHx、BHx、CHx为Hx计算方程中左端的系数;其他方向电场分量与磁场分量计算式同理可得;
其中,方程中特定的变量求解式如下:
(s=x,y,z) (19)
Figure FDA0001385910560000032
Figure FDA0001385910560000034
Figure FDA0001385910560000035
Figure FDA0001385910560000036
Figure FDA0001385910560000037
kzmax=8 (26)
kxmax=kymax=1 (27)
m=4 (28)
其中m与mα是多项式的阶数,s0是CPML与模拟区域交界位置,s是当前CPML位置,d是CPML层的厚度,σ、α为中间计算变量,用于as、bs的计算;
根据以上计算式分别得到各个场分量计算方程的系数和方程右端常数项,根据计算方程的特点,其系数构成了三对角矩阵,将三对角矩阵压缩存储在GPU全局内存中的数组A、B、C中,方程右端常数项存储在GPU全局内存中的数组X中;
步骤3、使用在GPU上开辟的线程去求解计算电场的矩阵方程,从而得到每个网格处的电场场值Ex、Ey、Ez,最后进行电场边界的处理;
步骤4、利用步骤3计算得到的电场场值,使用在GPU上开辟的线程去求解计算磁场的矩阵方程,从而得到每个网格处的磁场场值Hx、Hy、Hz,最后进行磁场边界的处理;
步骤5、存储计算结果至GPU全局内存并重复步骤3、4,在每个时间步长都更新每个网格的电场与磁场的场值,从step=0迭代直至达到step=STEPS,STEPS为设置的模拟总时间步长数;
步骤6、将步骤5的计算结果从GPU传回CPU主机端,进行数据分析与存储。
2.如权利要求1所述基于GPU并行的Leapfrog ADI-FDTD方法,其特征在于:适用于二维时,分布在激励源网格处的电磁场分量分别对应为Ey、Hz;电磁场分量对应公式相应退化。
3.如权利要求1所述基于GPU并行的Leapfrog ADI-FDTD方法,其特征在于:适用于一维时,分布在激励源网格处的电磁场分量对应为Ey;电磁场分量对应公式相应退化。
CN201710725448.3A 2017-08-22 2017-08-22 一种基于GPU并行的LeapfrogADI-FDTD方法 Active CN107526887B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710725448.3A CN107526887B (zh) 2017-08-22 2017-08-22 一种基于GPU并行的LeapfrogADI-FDTD方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710725448.3A CN107526887B (zh) 2017-08-22 2017-08-22 一种基于GPU并行的LeapfrogADI-FDTD方法

Publications (2)

Publication Number Publication Date
CN107526887A CN107526887A (zh) 2017-12-29
CN107526887B true CN107526887B (zh) 2020-02-18

Family

ID=60681895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710725448.3A Active CN107526887B (zh) 2017-08-22 2017-08-22 一种基于GPU并行的LeapfrogADI-FDTD方法

Country Status (1)

Country Link
CN (1) CN107526887B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416107B (zh) * 2018-02-05 2021-07-06 电子科技大学 一种应用于pic的推动粒子运动有限元算法
CN111079249B (zh) * 2019-11-06 2023-08-15 中国人民解放军92942部队 一种用于电磁仿真的方法及装置、服务器
CN111209249B (zh) * 2020-01-10 2021-11-02 中山大学 一种时域有限差分法硬件加速器系统及其实现方法
CN111324972B (zh) * 2020-03-16 2023-02-24 郑州大学 一种基于gpu并行的探地雷达电磁波数值模拟计算方法
CN113051804A (zh) * 2021-04-22 2021-06-29 东南大学 一种用于ota仿真的复包络蛙跳隐式时域有限差分法
CN114117872B (zh) * 2022-01-24 2022-06-14 广州中望龙腾软件股份有限公司 一种多gpu并行的时域有限差分电磁仿真方法、设备及介质
CN115358173B (zh) * 2022-10-21 2023-04-07 芯和半导体科技(上海)股份有限公司 一种芯片封装电源网络电磁建模方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GPU-based acceleration of the time-domain electrical full-wave solvers in PI/SI/EMI simulation;Hideki Asai;《2011 International Conference on Electromagnetics in Advanced Applications》;20110916;全文 *
Speed it up;Cen Yen Ong等;《IEEE Microwave Magazine》;20100430;第11卷(第2期);70-78 *
单步无条件稳定时域有限差分方法及其在复杂电磁结构数值仿真中的应用研究;王向华;《中国博士学位论文全文数据库工程科技Ⅱ辑》;20160115;C032-2 *
计算电磁学中的新型时域有限差分法;杨顺川;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20120715;C042-9 *

Also Published As

Publication number Publication date
CN107526887A (zh) 2017-12-29

Similar Documents

Publication Publication Date Title
CN107526887B (zh) 一种基于GPU并行的LeapfrogADI-FDTD方法
Sumithra et al. Review on computational electromagnetics
Li et al. Recent developments to the microwave tube simulator suite
Wu et al. Performance enhanced Crank-Nicolson boundary conditions for EM problems
Xu et al. GPU accelerated unconditionally stable Crank-Nicolson FDTD method for the analysis of three-dimensional microwave circuits
CN115600435A (zh) 一种介质涂覆导体复合目标电磁散射隐式计算方法及装置
EP3485404A1 (en) Eigen augmentation methods for electromagnetic modelling and simulation
Pan et al. Hierarchical interpolative decomposition multilevel fast multipole algorithm for dynamic electromagnetic simulations
Stefanski et al. Acceleration of the 3D ADI-FDTD method using graphics processor units
Zhao et al. A new decomposition solver for complex electromagnetic problems [EM Programmer's Notebook]
Zhao et al. Parallel MoM-PO method with out-of-core technique for analysis of complex arrays on electrically large platforms
Wang et al. A parallel-in-space-and-time method for transient electromagnetic problems
Kong et al. Parallel hardware architecture of the 3d fdtd algorithm with convolutional perfectly matched layer boundary condition
Jiang et al. Modified adaptive cross approximation algorithm for analysis of electromagnetic problems
Cao et al. An improved GMRES method for solving electromagnetic scattering problems by MoM
Liang et al. Implementation of ADE-CFS-PML for the single field WCS-FDTD method
Yu et al. Enhanced DGTD Method Based on AVX Acceleration Technique
Hollander et al. Adaptive multilevel nonuniform grid algorithm for the accelerated analysis of composite metallic–dielectric radomes
Yang et al. Parallel high-order FE-BI-MLFMA for scattering by large and deep coated cavities loaded with obstacles
Xu et al. A 3-D finite-element eigenvalue analysis of slow-wave structures of traveling-wave tubes without matching meshes
Jiang et al. Preconditioned MDA-SVD-MLFMA for analysis of multi-scale problems
CN118551630B (zh) 一种结构网格频域电磁场网格序列加速有限体积方法
Zunoubi et al. Analysis of 3-dimensional electromagnetic fields in dispersive media using CUDA
CN116522624B (zh) 基于不连续伽辽金的微波器件击穿阈值高效预测方法
Ren et al. Parallel Subdomain Level DGTD Method with Automatic Load Balancing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant