CN105374006B - 基于遗传算法的ct图像重建反投影加速方法 - Google Patents
基于遗传算法的ct图像重建反投影加速方法 Download PDFInfo
- Publication number
- CN105374006B CN105374006B CN201510808472.4A CN201510808472A CN105374006B CN 105374006 B CN105374006 B CN 105374006B CN 201510808472 A CN201510808472 A CN 201510808472A CN 105374006 B CN105374006 B CN 105374006B
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- back projection
- mtd
- projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种基于遗传算法的CT图像重建反投影加速方法,克服了现有技术中,利用CUDA加速CT重建反投影的实现方式存在访存带宽受限、自适应程度低等问题。该发明其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:(1)一次反投影核函数运算处理多个投影;(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问;(3)使用常数存储器保存反投影中的常数;(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;(5)约简反投影运算中的相同因子。本发明不需要人为来识别,加速策略的自适应程度高。
Description
技术领域
该发明涉及一种CT图像重建的方法,特别是涉及一种基于遗传算法的CT图像重建反投影加速方法。
背景技术
计算机断层成像(Computed Tomography,CT)以其无损、精确、三维可视化等优点在工业无损检测和医疗诊断领域获得了广泛的应用。然而CT设备在提高成像质量和重建分辨率的同时,相应需求的计算资源和存储资源都非常大,重建速度已成为CT技术走向实用的一个瓶颈,如何对CT重建过程加速是目前该领域研究的一个难点问题。
目前,实际CT系统中应用的主流算法主要集中于以滤波反投影为基础的解析类重建算法上,如FBP、FDK等算法。在这类算法中,反投影过程所占计算消耗的比例最高,对反投影计算的加速是实际应用中重建加速的关键点。
在半导体工艺和并行计算技术进步的推动下,特别是以GPU为代表的众核处理器的推出,使得图像重建速度已不再是一个瓶颈。在众多高性能计算方案中,基于CUDA的图像重建算法加速效果十分显著,利用CUDA实现对CT重建的反投影过程进行加速是该领域的重要研究方向。
经过现有技术的文献检索发现,利用CUDA加速CT重建反投影的文章采取的实现方式存在访存带宽受限、自适应程度低等不足。2011年,Papenhausen在Workshop on HighPerformance Image Reconstruction上发表《GPU-accelerated back-projectionrevisited:squeezing performance by careful tuning》,通过常数存储器、纹理存储器和一次反投影多个投影等更精细的优化策略,使得GPU在图像重建中的优势得到更好的发挥。2014年,Zhang等人在Applied Mechanics and Materials上发表《Comparison ofParallel Computing Methods for Fast Cone-Beam Reconstruction with SimilarOptimization Strategies》,充分利用了GPU受限于访存带宽而不是计算带宽的特点,通过一次反投影更多投影的方式,对于5123的重建图像仅需要2.1秒。但上述方法的性能瓶颈是都需要人为来识别,加速策略的自适应程度低。
发明内容
本发明克服了现有技术中,利用CUDA加速CT重建反投影的实现方式存在访存带宽受限、自适应程度低等问题,提供一种自适应程度高的基于遗传算法的CT图像重建反投影加速方法。
本发明的技术解决方案是,提供一种具有以下步骤的基于遗传算法的CT图像重建反投影加速方法:其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:
(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;
(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟;
(3)使用常数存储器保存反投影中的常数,比如三角函数值,减少算术指令的运算时间;
(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;
(5)约简反投影运算中的相同因子,如相同的除法,减少算术指令的运算时间。
所述定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素,建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
公式中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp(包含32个线程)的整数倍。
所述最优化模型采用SGA求解步骤如下:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码。由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件。如果满足,则执行下一步;否则重新执行步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
本方法其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
与现有技术相比,本发明基于遗传算法的CT图像重建反投影加速方法具有以下优点:本发明反投影过程所占计算消耗的比例低,通过常数存储器、纹理存储器和一次反投影多个投影等更精细的优化策略,使得GPU在图像重建中的优势得到更好的发挥;不需要人为来识别,加速策略的自适应程度高。提出的流水处理方法优点是时序控制简单,容易实现。
附图说明
图1是本发明基于遗传算法的CT图像重建反投影加速方法的加速流程图;
图2是本发明基于遗传算法的CT图像重建反投影加速方法采用SGA来求解模型的算法流程图;
图3是本发明基于遗传算法的CT图像重建反投影加速方法中反投影流水处理方法的示意图;
图4是本发明基于遗传算法的CT图像重建反投影加速方法中RabbitCT的(a)xy切片、(b)xz切片、(c)yz切片、(d)三维渲染图像的重建图像。
具体实施方式
下面结合附图和具体实施方式对本发明基于遗传算法的CT图像重建反投影加速方法作进一步说明:一种基于遗传算法的CT图像重建反投影加速方法,在CUDA编程框架下,基于CUDA的反投影并行计算策略包括以下几点:(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟;(3)使用常数存储器保存反投影中的常数(比如三角函数值等),减少算术指令的运算时间;(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;(5)约简反投影运算中的相同因子(如相同的除法),减少算术指令的运算时间。
对于不同的GPU平台,上述并行计算策略中的(3)-(5)都是不变的,但策略(1)和(2)需要调整其中的配置参数才能使反投影并行计算达到最优。目前,调整策略(1)和(2)中的配置参数完全由人工尝试,若有一种方法能够使得策略(1)和(2)自动地随GPU硬件的变化而改变,则图像重建算法在GPU上的最优并行计算就可以达到自适应的目的,而不必人工进行干预。
为此,本发明提出以反投影的配置参数为变量、以反投影时间为目标函数的最优化模型,然后通过遗传算法来搜索最优的配置参数,从而实现反投影的自适应计算。
本方法确定的最优化模型如下:定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素。本发明建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
式(1)中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp(包含32个线程)的整数倍。
最优化模型求解如下:目前,遗传算法有许多变种,但由Goldberg提出的基本遗传算法(Simple Genetic Algorithm,SGA)是许多算法的原型。SGA包含选择与复制算子、交叉算子和变异算子,具有遗传进化过程操作简单的优点。
本发明采用SGA来求解模型(1)的计算步骤可以描述为:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码。由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件。如果满足,则执行下一步;否则重新执行步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
通过求解模型(1)可以得到使反投影核函数在GPU上运行时间最少的配置参数,但整个反投影运算的时间还应包括投影数据从内存传入显存和重建图像从显存传回内存的时间,因此下面介绍隐藏数据传输时间的方法:考虑到一次数据上传的时间远小于一次反投影核函数运算的时间,本发明设计了一种新的隐藏数据传输时间的流水处理,如图3所示,其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
本发明提出的流水处理方法优点是时序控制简单,容易实现。本方法基于RabbitCT平台,设定重建图像矩阵为5123,体素边长为0.5mm,数据类型为float。设置遗传算法的初始种群规模M=200,交叉算子中的交叉概率Pc=0.75,变异算子中的变异概率Pm=0.05,最大遗传代数Ng=500,ediff=0.01s。最优化模型中的Nm根据各GPU的显存容量和RabbitCT中单个投影的数据量计算得到。本方法使用的GPU为NVIDIA公司的Tesla K40c,实验平台的其它参数为:2颗Intel Xeon E5-26208核CPU,主频2GHz;24GB内存;Windows 7 64位操作系统;程序开发集成环境为visual studio 2010,C语言;CUDA 6.5 64位程序开发包。将上述参数代入本发明算法的程序运行10次,取其中最优的个体作为最优的配置参数,得到重建图像如图4所示,其中(a)-(c)图的显示窗口为[-2905HU,10300HU],(d)图为使用VG studio软件渲染的三维图像,在Tesla K40c上测试结果如表1所示。
表1 反投影最优配置参数的计算结果
GPU | I | K | Bx | By | 反投影时间/ms |
K40c | 62 | 4 | 128 | 8 | 954 |
Claims (3)
1.一种基于遗传算法的CT图像重建反投影加速方法,其特征在于:其在CUDA编程框架下,基于CUDA的反投影并行计算策略如下:
(1)一次反投影核函数运算处理多个投影,减少重建图像体素值更新时对全局存储器的访问次数;
(2)合理设计线程网格(grid)和线程块(block)的维度和顺序来保证全局存储器的合并访问,降低重建图像体素值更新时对全局存储器的访问延迟,具体步骤如下:定义策略(1)中一次反投影处理I个投影,策略(2)中block的维度为(Bx,By)、一个线程更新K个体素,建立以(I,K,Bx,By)为参数、以反投影计算时间T(I,K,Bx,By)为代价函数的最优化模型
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<msup>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mo>,</mo>
<mi>K</mi>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mi>o</mi>
<mi>p</mi>
<mi>t</mi>
</mrow>
</msup>
<mo>=</mo>
<munder>
<mi>arg</mi>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mo>,</mo>
<mi>K</mi>
<mo>,</mo>
<mi>B</mi>
<mi>x</mi>
<mo>,</mo>
<mi>B</mi>
<mi>y</mi>
<mo>)</mo>
</mrow>
</munder>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mi> </mi>
<mi>T</mi>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mo>,</mo>
<mi>K</mi>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>,</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mtable>
<mtr>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>I</mi>
<mo>,</mo>
<mi>K</mi>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>&Element;</mo>
<mi>N</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>I</mi>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>,</mo>
<mi>min</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mi>p</mi>
</msub>
<mo>,</mo>
<msub>
<mi>N</mi>
<mrow>
<mi>l</mi>
<mi>a</mi>
<mi>y</mi>
<mi>e</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>m</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>,</mo>
<mi>K</mi>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>z</mi>
</msub>
<mo>&rsqb;</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>,</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mi>x</mi>
</msub>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>,</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>,</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>N</mi>
<mi>y</mi>
</msub>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>*</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>,</mo>
<msub>
<mi>N</mi>
<mi>t</mi>
</msub>
<mo>&rsqb;</mo>
<mo>,</mo>
<mi>mod</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>B</mi>
<mi>x</mi>
</msub>
<mo>*</mo>
<msub>
<mi>B</mi>
<mi>y</mi>
</msub>
<mo>,</mo>
<mn>32</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mtd>
</mtr>
</mtable>
</mtd>
</mtr>
</mtable>
<mo>,</mo>
</mrow>
公式中N代表自然数空间,(Nx,Ny,Nz)为重建图像沿三个坐标轴方向的体素数量,Np为CT采集的投影数量,Nlayer为GPU硬件对于多层纹理层数的上限,Nm为GPU全局存储器容量存储投影数量的上限,Nt为GPU硬件对于block中所包含线程数量的上限,约束mod(Bx*By,32)=0是为了保证block中的线程数量为warp的整数倍,其中warp包含32个线程;
(3)使用常数存储器保存反投影中的常数,常数为三角函数值,减少算术指令的运算时间;
(4)使用纹理存储器实现双线性插值,减少算术指令的运算时间;
(5)约简反投影运算中的相同因子,相同因子为相同的除法,减少算术指令的运算时间。
2.根据权利要求1所述的基于遗传算法的CT图像重建反投影加速方法,其特征在于:所述最优化模型采用标准遗传算法SGA求解步骤如下:
步骤1:随机生成M个个体(I,K,Bx,By)作为初始种群,并对每个个体进行编码;由于个体(I,K,Bx,By)全部是整数,因此直接采用每个参数的二进制表示作为基因编码,并将其串联在一起组成基因序列;
步骤2:编译每个个体对应的反投影核函数为动态链接库,参数最优化搜索程序调用该动态链接库并记录反投影时间,从而得到每个个体的适应度;
步骤3:当终止条件未达到时,执行下述操作:
子步骤3.1:基于轮盘赌算法执行选择与复制算子;
子步骤3.2:以概率Pc执行交叉算子;
子步骤3.3:以概率Pm执行变异算子;
子步骤3.4:验证新产生的个体是否满足模型的约束条件;如果满足,则执行下一步;否则重新执行子步骤3.2和3.3,直至满足约束条件;
子步骤3.5:对每个个体的基因编码进行解码得到(I,K,Bx,By),然后重复步骤2,计算新一代种群中每个个体的适应度;
步骤4:当终止条件达到时,输出适应度最小的个体,并对其进行解码得到最优的配置参数。
3.根据权利要求1所述的基于遗传算法的CT图像重建反投影加速方法,其特征在于:其在CUDA编程框架下,基于CUDA的反投影并行计算分为三个优化部分:
优化1:在第一次反投影核函数运算之前,首先完成I个投影的数据上传,然后在核函数运算的同时上传下次需要处理的投影数据;
优化2:在接下来的反投影中,GPU在对上次上传的投影数据进行反投影的同时,上传下次需要处理的投影数据;
优化3:对于最后一次反投影,将重建图像分成均等的两个部分,采用两个核函数分别完成对应的反投影,当第一个核函数完成反投影之后即开始下载数据到内存,同时第二个核函数计算另一半重建图像,待反投影结束后下载数据到内存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510808472.4A CN105374006B (zh) | 2015-11-21 | 2015-11-21 | 基于遗传算法的ct图像重建反投影加速方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510808472.4A CN105374006B (zh) | 2015-11-21 | 2015-11-21 | 基于遗传算法的ct图像重建反投影加速方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105374006A CN105374006A (zh) | 2016-03-02 |
CN105374006B true CN105374006B (zh) | 2018-04-17 |
Family
ID=55376179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510808472.4A Active CN105374006B (zh) | 2015-11-21 | 2015-11-21 | 基于遗传算法的ct图像重建反投影加速方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105374006B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188098B (zh) * | 2019-04-26 | 2021-02-19 | 浙江大学 | 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统 |
CN111552478B (zh) * | 2020-04-30 | 2024-03-22 | 上海商汤智能科技有限公司 | 用于生成cuda程序的设备、方法和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567944A (zh) * | 2012-03-09 | 2012-07-11 | 中国人民解放军信息工程大学 | 基于fpga的ct图像重建硬件加速方法 |
CN102609978A (zh) * | 2012-01-13 | 2012-07-25 | 中国人民解放军信息工程大学 | 基于cuda架构的gpu加速锥束ct图像重建的方法 |
CN102779350A (zh) * | 2012-06-07 | 2012-11-14 | 中国人民解放军信息工程大学 | 一种锥束ct迭代重建算法投影矩阵构建方法 |
CN103310484A (zh) * | 2013-07-03 | 2013-09-18 | 西安电子科技大学 | 一种基于cuda架构加速ct图像重建的方法 |
-
2015
- 2015-11-21 CN CN201510808472.4A patent/CN105374006B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609978A (zh) * | 2012-01-13 | 2012-07-25 | 中国人民解放军信息工程大学 | 基于cuda架构的gpu加速锥束ct图像重建的方法 |
CN102567944A (zh) * | 2012-03-09 | 2012-07-11 | 中国人民解放军信息工程大学 | 基于fpga的ct图像重建硬件加速方法 |
CN102779350A (zh) * | 2012-06-07 | 2012-11-14 | 中国人民解放军信息工程大学 | 一种锥束ct迭代重建算法投影矩阵构建方法 |
CN103310484A (zh) * | 2013-07-03 | 2013-09-18 | 西安电子科技大学 | 一种基于cuda架构加速ct图像重建的方法 |
Non-Patent Citations (2)
Title |
---|
Systematic Performance Optimization of Cone-Beam Back-Projection on the Kepler Architecture;Timo Zinßer 等;《The 12th International Meeting on Fully Three-Dimensional Image Reconstruction in Radiology and Nuclear Medicine》;20131231;第225-228页 * |
锥束CT FDK重建算法的GPU并行实现;韩玉 等;《计算机应用》;20120501;第32卷(第5期);第1408页第2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN105374006A (zh) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pratx et al. | GPU computing in medical physics: A review | |
Pantaleoni et al. | HLBVH: Hierarchical LBVH construction for real-time ray tracing of dynamic geometry | |
Arora et al. | Parallelization of binary and real-coded genetic algorithms on GPU using CUDA | |
Zinsser et al. | Systematic performance optimization of cone-beam back-projection on the Kepler architecture | |
CN108427861A (zh) | 一种基于mpt工具包构建材料周期性多晶结构的方法 | |
Li et al. | Learning skeletal articulations with neural blend shapes | |
Rohkohl et al. | RabbitCT—an open platform for benchmarking 3D cone‐beam reconstruction algorithms a | |
CN105931280A (zh) | 基于gpu的快速三维ct迭代重建方法 | |
CN105374006B (zh) | 基于遗传算法的ct图像重建反投影加速方法 | |
Tchiboukdjian et al. | Binary mesh partitioning for cache-efficient visualization | |
Zollhöfer et al. | GPU based ARAP Deformation using Volumetric Lattices. | |
CN108615254A (zh) | 基于树型结构网格矢量量化的点云渲染方法、系统及装置 | |
CN104298871B (zh) | 一种辐射防护中基于gpu加速的体素人体模型剂量评估加速方法 | |
Zhang et al. | Development of a GPU-based three-dimensional neutron transport code | |
Manolios et al. | Implementing survey propagation on graphics processing units | |
Xue et al. | Efficient GPU out-of-core visualization of large-scale CAD models with voxel representations | |
Dey et al. | Procedural feature generation for volumetric terrains using voxel grammars | |
Que et al. | Implementing medical CT algorithms on stand-alone FPGA based systems using an efficient workflow with SysGen and simulink | |
Biguri | Iterative reconstruction and motion compensation in computed tomography on GPUs | |
Vintache et al. | Iterative reconstruction for transmission tomography on GPU using Nvidia CUDA | |
CN202093573U (zh) | 一种用于工业ct图像重建的并行加速装置 | |
CN115310209A (zh) | 基于vae的气动形状迁移优化方法及相关装置 | |
Jiménez et al. | Performance analysis for GPU-based ray-triangle algorithms | |
Kim et al. | Dynamic particle system for mesh extraction on the gpu | |
Goel et al. | Unified many-worlds browsing of arbitrary physics-based animations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |