CN105374006A - 基于遗传算法的ct图像重建反投影加速方法 - Google Patents

基于遗传算法的ct图像重建反投影加速方法 Download PDF

Info

Publication number
CN105374006A
CN105374006A CN201510808472.4A CN201510808472A CN105374006A CN 105374006 A CN105374006 A CN 105374006A CN 201510808472 A CN201510808472 A CN 201510808472A CN 105374006 A CN105374006 A CN 105374006A
Authority
CN
China
Prior art keywords
back projection
projection
genetic algorithm
image reconstruction
cuda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510808472.4A
Other languages
English (en)
Other versions
CN105374006B (zh
Inventor
李磊
闫镔
张峰
王敬雨
孙艳敏
韩玉
张翔
陈思宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN201510808472.4A priority Critical patent/CN105374006B/zh
Publication of CN105374006A publication Critical patent/CN105374006A/zh
Application granted granted Critical
Publication of CN105374006B publication Critical patent/CN105374006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本<b>发明</b>公开了一种<b>基于遗传算法的</b><b>CT</b>图像<b>重建反投影加速方法</b>,克服了现有技术中,利用CUDA加速CT重建反投影的实现方式存在访存带宽受限、自适应程度低等问题。该发明其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:(1)一次反投影核函数运算处理多个投影;(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问;(3)使用常数存储器保存反投影中的常数;(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;(5)约简反投影运算中的相同因子。本发明不需要人为来识别,加速策略的自适应程度高。

Description

基于遗传算法的CT图像重建反投影加速方法
技术领域
该发明涉及一种CT图像重建的方法,特别是涉及一种基于遗传算法的CT图像重建反投影加速方法。
背景技术
计算机断层成像(ComputedTomography,CT)以其无损、精确、三维可视化等优点在工业无损检测和医疗诊断领域获得了广泛的应用。然而CT设备在提高成像质量和重建分辨率的同时,相应需求的计算资源和存储资源都非常大,重建速度已成为CT技术走向实用的一个瓶颈,如何对CT重建过程加速是目前该领域研究的一个难点问题。
目前,实际CT系统中应用的主流算法主要集中于以滤波反投影为基础的解析类重建算法上,如FBP、FDK等算法。在这类算法中,反投影过程所占计算消耗的比例最高,对反投影计算的加速是实际应用中重建加速的关键点。
在半导体工艺和并行计算技术进步的推动下,特别是以GPU为代表的众核处理器的推出,使得图像重建速度已不再是一个瓶颈。在众多高性能计算方案中,基于CUDA的图像重建算法加速效果十分显著,利用CUDA实现对CT重建的反投影过程进行加速是该领域的重要研究方向。
经过现有技术的文献检索发现,利用CUDA加速CT重建反投影的文章采取的实现方式存在访存带宽受限、自适应程度低等不足。2011年,Papenhausen在WorkshoponHighPerformanceImageReconstruction上发表《GPU-acceleratedback-projectionrevisited:squeezingperformancebycarefultuning》,通过常数存储器、纹理存储器和一次反投影多个投影等更精细的优化策略,使得GPU在图像重建中的优势得到更好的发挥。2014年,Zhang等人在AppliedMechanicsandMaterials上发表《ComparisonofParallelComputingMethodsforFastCone-BeamReconstructionwithSimilarOptimizationStrategies》,充分利用了GPU受限于访存带宽而不是计算带宽的特点,通过一次反投影更多投影的方式,对于5123的重建图像仅需要2.1秒。但上述方法的性能瓶颈是都需要人为来识别,加速策略的自适应程度低。
发明内容
本发明克服了现有技术中,利用CUDA加速CT重建反投影的实现方式存在访存带宽受限、自适应程度低等问题,提供一种自适应程度高的基于遗传算法的CT图像重建反投影加速方法。
本发明的技术解决方案是,提供一种具有以下步骤的基于遗传算法的CT图像重建反投影加速方法:其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:
(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;
(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟;
(3)使用常数存储器保存反投影中的常数,比如三角函数值,减少算术指令的运算时间;
(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;
(5)约简反投影运算中的相同因子,如相同的除法,减少算术指令的运算时间。
所述定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素,建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
( I , K , B x , B y ) o p t = arg ( I , K , B x , B y ) min T ( I , K , B x , B y ) ,
s . t . I , K , B x , B y &Element; N I &Element; &lsqb; 1 , m i n ( N p , N l a y e r , N m ) &rsqb; , K &Element; &lsqb; 1 , N z &rsqb; B x &Element; &lsqb; 1 , m i n ( N x , N t ) &rsqb; , B y &Element; &lsqb; 1 , m i n ( N y , N t ) &rsqb; B x * B y &Element; &lsqb; 1 , N t &rsqb; , mod ( B x * B y , 32 ) = 0 .
公式中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp(包含32个线程)的整数倍。
所述最优化模型采用SGA求解步骤如下:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码。由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件。如果满足,则执行下一步;否则重新执行步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
本方法其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
与现有技术相比,本发明基于遗传算法的CT图像重建反投影加速方法具有以下优点:本发明反投影过程所占计算消耗的比例低,通过常数存储器、纹理存储器和一次反投影多个投影等更精细的优化策略,使得GPU在图像重建中的优势得到更好的发挥;不需要人为来识别,加速策略的自适应程度高。提出的流水处理方法优点是时序控制简单,容易实现。
附图说明
图1是本发明基于遗传算法的CT图像重建反投影加速方法的加速流程图;
图2是本发明基于遗传算法的CT图像重建反投影加速方法采用SGA来求解模型的算法流程图;
图3是本发明基于遗传算法的CT图像重建反投影加速方法中反投影流水处理方法的示意图;
图4是本发明基于遗传算法的CT图像重建反投影加速方法中RabbitCT的(a)xy切片、(b)xz切片、(c)yz切片、(d)三维渲染图像的重建图像。
具体实施方式
下面结合附图和具体实施方式对本发明基于遗传算法的CT图像重建反投影加速方法作进一步说明:一种基于遗传算法的CT图像重建反投影加速方法,在CUDA编程框架下,基于CUDA的反投影并行计算策略包括以下几点:(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟;(3)使用常数存储器保存反投影中的常数(比如三角函数值等),减少算术指令的运算时间;(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;(5)约简反投影运算中的相同因子(如相同的除法),减少算术指令的运算时间。
对于不同的GPU平台,上述并行计算策略中的(3)-(5)都是不变的,但策略(1)和(2)需要调整其中的配置参数才能使反投影并行计算达到最优。目前,调整策略(1)和(2)中的配置参数完全由人工尝试,若有一种方法能够使得策略(1)和(2)自动地随GPU硬件的变化而改变,则图像重建算法在GPU上的最优并行计算就可以达到自适应的目的,而不必人工进行干预。
为此,本发明提出以反投影的配置参数为变量、以反投影时间为目标函数的最优化模型,然后通过遗传算法来搜索最优的配置参数,从而实现反投影的自适应计算。
本方法确定的最优化模型如下:定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素。本发明建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
( I , K , B x , B y ) o p t = arg ( I , K , B x , B y ) min T ( I , K , B x , B y ) ,
s . t . I , K , B x , B y &Element; N I &Element; &lsqb; 1 , m i n ( N p , N l a y e r , N m ) &rsqb; , K &Element; &lsqb; 1 , N z &rsqb; B x &Element; &lsqb; 1 , m i n ( N x , N t ) &rsqb; , B y &Element; &lsqb; 1 , m i n ( N y , N t ) &rsqb; B x * B y &Element; &lsqb; 1 , N t &rsqb; , mod ( B x * B y , 32 ) = 0 . - - - ( 1 )
式(1)中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp(包含32个线程)的整数倍。
最优化模型求解如下:目前,遗传算法有许多变种,但由Goldberg提出的基本遗传算法(SimpleGeneticAlgorithm,SGA)是许多算法的原型。SGA包含选择与复制算子、交叉算子和变异算子,具有遗传进化过程操作简单的优点。
本发明采用SGA来求解模型(1)的计算步骤可以描述为:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码。由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件。如果满足,则执行下一步;否则重新执行步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
通过求解模型(1)可以得到使反投影核函数在GPU上运行时间最少的配置参数,但整个反投影运算的时间还应包括投影数据从内存传入显存和重建图像从显存传回内存的时间,因此下面介绍隐藏数据传输时间的方法:考虑到一次数据上传的时间远小于一次反投影核函数运算的时间,本发明设计了一种新的隐藏数据传输时间的流水处理,如图3所示,其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
本发明提出的流水处理方法优点是时序控制简单,容易实现。本方法基于RabbitCT平台,设定重建图像矩阵为5123,体素边长为0.5mm,数据类型为float。设置遗传算法的初始种群规模M=200,交叉算子中的交叉概率Pc=0.75,变异算子中的变异概率Pm=0.05,最大遗传代数Ng=500,ediff=0.01s。最优化模型中的Nm根据各GPU的显存容量和RabbitCT中单个投影的数据量计算得到。本方法使用的GPU为NVIDIA公司的TeslaK40c,实验平台的其它参数为:2颗IntelXeonE5-26208核CPU,主频2GHz;24GB内存;Windows764位操作系统;程序开发集成环境为visualstudio2010,C语言;CUDA6.564位程序开发包。将上述参数代入本发明算法的程序运行10次,取其中最优的个体作为最优的配置参数,得到重建图像如图4所示,其中(a)-(c)图的显示窗口为[-2905HU,10300HU],(d)图为使用VGstudio软件渲染的三维图像,在TeslaK40c上测试结果如表1所示。
表1反投影最优配置参数的计算结果
GPU I K Bx By 反投影时间/ms
K40c 62 4 128 8 954

Claims (4)

1.一种基于遗传算法的CT图像重建反投影加速方法,其特征在于:其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:
(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;
(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟;
(3)使用常数存储器保存反投影中的常数,比如三角函数值,减少算术指令的运算时间;
(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;
(5)约简反投影运算中的相同因子,如相同的除法,减少算术指令的运算时间。
2.根据权利要求1所述的基于遗传算法的CT图像重建反投影加速方法,其特征在于:所述定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素,建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
( I , K , B x , B y ) o p t = arg ( I , K , B x , B y ) min T ( I , K , B x , B y ) ,
s . t . I , K , B x , B y &Element; N I &Element; &lsqb; 1 , m i n ( N p , N l a y e r , N m ) &rsqb; , K &Element; &lsqb; 1 , N z &rsqb; B x &Element; &lsqb; 1 , m i n ( N x , N t ) &rsqb; , B y &Element; &lsqb; 1 , m i n ( N y , N t ) &rsqb; B x * B y &Element; &lsqb; 1 , N t &rsqb; , mod ( B x * B y , 32 ) = 0 .
公式中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp(包含32个线程)的整数倍。
3.根据权利要求2所述的基于遗传算法的CT图像重建反投影加速方法,其特征在于:所述最优化模型采用SGA求解步骤如下:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码;由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件;如果满足,则执行下一步;否则重新执行步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
4.根据权利要求1所述的基于遗传算法的CT图像重建反投影加速方法,其特征在于:其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
CN201510808472.4A 2015-11-21 2015-11-21 基于遗传算法的ct图像重建反投影加速方法 Active CN105374006B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510808472.4A CN105374006B (zh) 2015-11-21 2015-11-21 基于遗传算法的ct图像重建反投影加速方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510808472.4A CN105374006B (zh) 2015-11-21 2015-11-21 基于遗传算法的ct图像重建反投影加速方法

Publications (2)

Publication Number Publication Date
CN105374006A true CN105374006A (zh) 2016-03-02
CN105374006B CN105374006B (zh) 2018-04-17

Family

ID=55376179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510808472.4A Active CN105374006B (zh) 2015-11-21 2015-11-21 基于遗传算法的ct图像重建反投影加速方法

Country Status (1)

Country Link
CN (1) CN105374006B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188098A (zh) * 2019-04-26 2019-08-30 浙江大学 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统
CN111552478A (zh) * 2020-04-30 2020-08-18 上海商汤智能科技有限公司 用于生成cuda程序的设备、方法和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567944A (zh) * 2012-03-09 2012-07-11 中国人民解放军信息工程大学 基于fpga的ct图像重建硬件加速方法
CN102609978A (zh) * 2012-01-13 2012-07-25 中国人民解放军信息工程大学 基于cuda架构的gpu加速锥束ct图像重建的方法
CN102779350A (zh) * 2012-06-07 2012-11-14 中国人民解放军信息工程大学 一种锥束ct迭代重建算法投影矩阵构建方法
CN103310484A (zh) * 2013-07-03 2013-09-18 西安电子科技大学 一种基于cuda架构加速ct图像重建的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609978A (zh) * 2012-01-13 2012-07-25 中国人民解放军信息工程大学 基于cuda架构的gpu加速锥束ct图像重建的方法
CN102567944A (zh) * 2012-03-09 2012-07-11 中国人民解放军信息工程大学 基于fpga的ct图像重建硬件加速方法
CN102779350A (zh) * 2012-06-07 2012-11-14 中国人民解放军信息工程大学 一种锥束ct迭代重建算法投影矩阵构建方法
CN103310484A (zh) * 2013-07-03 2013-09-18 西安电子科技大学 一种基于cuda架构加速ct图像重建的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TIMO ZINSSER 等: "Systematic Performance Optimization of Cone-Beam Back-Projection on the Kepler Architecture", 《THE 12TH INTERNATIONAL MEETING ON FULLY THREE-DIMENSIONAL IMAGE RECONSTRUCTION IN RADIOLOGY AND NUCLEAR MEDICINE》 *
韩玉 等: "锥束CT FDK重建算法的GPU并行实现", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188098A (zh) * 2019-04-26 2019-08-30 浙江大学 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统
CN110188098B (zh) * 2019-04-26 2021-02-19 浙江大学 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统
CN111552478A (zh) * 2020-04-30 2020-08-18 上海商汤智能科技有限公司 用于生成cuda程序的设备、方法和存储介质
CN111552478B (zh) * 2020-04-30 2024-03-22 上海商汤智能科技有限公司 用于生成cuda程序的设备、方法和存储介质

Also Published As

Publication number Publication date
CN105374006B (zh) 2018-04-17

Similar Documents

Publication Publication Date Title
Dally et al. Evolution of the graphics processing unit (GPU)
Oyama et al. The case for strong scaling in deep learning: Training large 3d cnns with hybrid parallelism
Zinsser et al. Systematic performance optimization of cone-beam back-projection on the Kepler architecture
Rungsawang et al. Fast pagerank computation on a gpu cluster
CN111738435B (zh) 一种基于移动设备的在线稀疏训练方法及系统
Chen et al. A hybrid architecture for compressive sensing 3-D CT reconstruction
Lai et al. Accelerating Strassen-Winograd's matrix multiplication algorithm on GPUs
CN108984483B (zh) 基于dag及矩阵重排的电力系统稀疏矩阵求解方法和系统
Mueller‐Roemer et al. Ternary sparse matrix representation for volumetric mesh subdivision and processing on GPUs
CN105374006A (zh) 基于遗传算法的ct图像重建反投影加速方法
Wang et al. GPU computation of the euler characteristic curve for imaging data
Gong et al. GWMA: the parallel implementation of woodpecker mating algorithm on the GPU
Cossell et al. Concurrent dynamic programming for grid-based problems and its application for real-time path planning
Cheng et al. Fast visualization of 3D massive data based on improved Hilbert R-tree and stacked LSTM models
Yu et al. Parallel computing simulation of electrical excitation and conduction in the 3D human heart
Zhou et al. A Parallel Scheme for Large‐scale Polygon Rasterization on CUDA‐enabled GPUs
CN115310209A (zh) 基于vae的气动形状迁移优化方法及相关装置
Gao et al. A joint row and column action method for cone-beam computed tomography
CN109859302B (zh) 光传输矩阵的压缩感测
WO2021248356A1 (en) Method and system for generating images
Eckhardt et al. On-the-fly memory compression for multibody algorithms
CN105678820A (zh) 一种基于cuda的s-bpf重建算法加速方法
Zhu et al. Implementation of 3D SRAD algorithm on CUDA
CN117407177B (zh) 任务执行方法、装置、电子设备及可读存储介质
Cui et al. Fully 3-D list-mode positron emission tomography image reconstruction on GPU using CUDA

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant