CN102354392A - 一种用于工业ct图像重建的并行加速装置 - Google Patents
一种用于工业ct图像重建的并行加速装置 Download PDFInfo
- Publication number
- CN102354392A CN102354392A CN2011101516184A CN201110151618A CN102354392A CN 102354392 A CN102354392 A CN 102354392A CN 2011101516184 A CN2011101516184 A CN 2011101516184A CN 201110151618 A CN201110151618 A CN 201110151618A CN 102354392 A CN102354392 A CN 102354392A
- Authority
- CN
- China
- Prior art keywords
- image
- external memory
- data
- memory storage
- parallel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种用于工业CT图像重建的并行加速装置,其包括处理装置和存储装置,处理装置包括控制装置和运算装置,控制装置确定整个成像处理过程中的数据选择和数据流向,运算装置根据控制装置所确定的数据选择和数据流向,对需要进行运算的数据进行运算处理和更新处理,存储装置包括内部存储器和外部存储器,内部存储器采用双组奇偶双口RAM结构,并采用了并行加速技术,内部存储器用于存储运算过程中的中间数据,外部存储器用于存储CT图像,本发明的优点是,内部存储器采用了双组奇偶双口RAM结构,并采用了并行加速技术,对CT图像的重建过程进行加速,本发明具有运行速度快、装置性能高的优点,可以大大的缩短CT图像重建的时间。
Description
技术领域
本发明涉及CT图像重建的技术领域,更具体的说是涉及一种用于工业CT图像重建的并行加速装置。
背景技术
计算机断层摄像技术CT(Computerized Tomography)是20世纪医学的重大成果之一,被广泛应用于工业无损检测和医学图像处理中。
CT技术的核心是由投影进行图像重建的理论,目前图像重建的方法主要有两种:变换法和迭代法。变换法虽具有计算量小,重建速度快等优点,但对于不完全投影数据,不能获得很好的重建质量。迭代算法计算量巨大,重建时间成为制约其大范围实时性应用的瓶颈。
实现CT图像重建加速的基本机制可以分为硬件加速和软件加速,软件加速是常规的用CPU完成CT图像的重建,主要方法是针对重建算法做出改进及优化,近几年来采用软件加速的方法主要有以下3类:一种是查找几何参数表的方法,该方法针对三维重建的FDK算法,用几何参数表以及预插值和最近邻插值的办法避免大量、重复的函数运算及线性插值运算,与精确重建相比也能保证图像质量。还有一种利用重建算法的对称性并结合递归技术来降低重建过程的复杂度,实现快速重建。利用反投影算法的对称性,对于扇形束CT扫描只计算部分图像数据并对称得到其他图像数据,计算量仅为原来的四分之一。利用对称性并结合递归技术的SBP-RT算法实现了Feldkamp算法在普通微机上的快速重建,其重建速度提高约32倍,且不会带来新的重建误差。最后一种采用单指令多数据(SingleInstruction Multiple Data,SIMD)技术进行数据并行处理。主要原理是基于Intel Pentium 4CPU的PC平台,利用SSE/SSE2技术开发了三维图像快速重建引擎。实验结果表明该方法非常有效,与原始重建算法相比,在保证图像质量不受损失的前提下取得了20倍以上的重建加速比。
软件加速的方法只是通过算法的改进来达到加速目的,一定条件下会受到硬件的制约,加速效果有限,因此硬件加速方法成为当前的重要研究对象,是我们急需解决的一个问题。
发明内容
本发明的目的是针对上述现有技术的不足之处,提供一种用于工业CT图像重建的并行加速装置。
本发明的实现由以下技术方案完成:
一种用于工业CT图像重建的并行加速装置,其包括处理装置和存储装置:
所述处理装置包括控制装置和运算装置,所述控制装置确定整个成像处理过程中的数据选择和数据流向,所述运算装置根据控制装置所确定的数据选择和数据流向,对需要进行运算的数据进行运算处理和更新处理;
所述存储装置包括内部存储器和外部存储器,所述内部存储器采用双组奇偶双口RAM结构,并采用了并行加速技术,内部存储器用于存储运算过程中的中间数据,所述外部存储器用于存储CT图像。
优选的,所述运算装置包括运算器模块、预运算模块和更新模块:
所述运算器模块用于对相应CT图像的测量投影值和估算投影值以及系数平方和做减法和除法运算;
所述预运算模块用于对运算器模块中得到的运算结果进行预处理;
所述更新模块用于对预运算模块中得到的结果和从外部存储器取出的CT图像的像素值进行处理,得到更新后的像素值。
优选的,所述控制装置将相应CT图像的测量投影值从外部存储器中取出,同时将相应CT图像的估算投影值以及系数平方和从内部存储器中取出来,送到运算器模块中做减法和除法运算,再把运算的结果存到内部存储器中,直到把每一个探测器的测量投影值和估算投影值运算完毕并将运算结果存到内部存储器,然后控制将运算结果从内部存储器中取出,运算结果先经预运算模块处理,再和外部存储器存储的CT图像的像素值一起送到更新模块中进行更新,再控制将更新的结果存储到外部存储器中的相应位置,从而得到重建的CT图像。优选的,所述外部存储器采用闪存。
本发明的优点是,内部存储器采用了双组奇偶双口RAM结构,并采用了并行加速技术,对CT图像的重建过程进行加速,本发明具有运行速度快、装置性能高的优点,可以大大的缩短CT图像重建的时间。
附图说明
图1是本发明的结构示意图;
图2是本发明中双组奇偶双口RAM结构的示意图;
图3是本发明中寻址计算时的双线性插值数据关系图;
图4是本发明中外存储器的引脚图。
图中1、处理装置,2、运算装置,101、控制装置,102、运算装置,103、运算器模块,104、预运算模块,105、更新模块,201、内部存储器,202、外部存储器。
具体实施方式
以下结合实施例和附图对本发明特征及其它相关特征作进一步详细说明:
一种用于工业CT图像重建的并行加速装置,其包括处理装置1和存储装置2,所述处理装置1包括控制装置101和运算装置102,控制装置101确定整个成像处理过程中的数据选择和数据流向,运算装置102根据控制装置101所确定的数据选择和数据流向,对需要进行运算的数据进行运算处理和更新处理,存储装置2包括内部存储器201和外部存储器202,所述内部存储器201用于存储运算过程中的中间数据,所述外部存储器202用于存储CT图像。
运算装置102包括运算器模块103、预运算模块104和更新模块105,控制装置101将相应CT图像的测量投影值从外部存储器202中取出,同时将相应CT图像的估算投影值以及系数平方和从内部存储器201中取出来,送到运算器模块103中做减法和除法运算,再把运算的结果存到内部存储器201中,直到把每一个探测器的测量投影值和估算投影值运算完毕并将运算结果存到内部存储器201,然后控制将运算结果从内部存储器201中取出,运算结果先经预运算模块104处理,再和外部存储器202存储的CT图像的像素值一起送到更新模块105中进行更新,再控制将更新的结果存储到外部存储器202中的相应位置,从而得到重建的CT图像。
本发明中的内部存储器201采用双组奇偶双口RAM结构,如图2所示,图中两组共4个存储空间均为双口RAM,当第一组RAM处于数据写入过程时,分别向该组两块RAM写入奇数行数据与偶数行数据,另一组RAM中的数据进行双线性插值,当计算完成后,两组RAM可以进行读写状态的互换,从而完成一次乒乓循环。
图3所示,同一组RAM中的RAM1和RAM2分行存储奇数行数据和偶数行数据,在重建过程当中进行寻址计算时,点F进行双线性插值所需的4个点A、B、C、D分别处于RAM2和RAM1中,首先计算出A点的纵坐标y,即A所处的行位置,对其奇偶性进行判断,根据判断结果到相应的RAM中读取数据即可,由于两个RAM里各有两个所需数据,一个时钟周期内即同时读出,通过这种双组奇偶双口RAM缓存结构的设计在不增加片内存储资源消耗的前提下消除了空泡,实现了无等待流水线,在一个时钟周期内就可更新一个重建点的结果,极大的加快了速度,未来随着存储器技术的发展,CT重建还可以取得更好的加速效果。
本发明中的外部存储器202采用闪存,如图4所示,本实施例中采用的是8M的闪存芯片,该芯片有22跟地址线,负责8M的存储空间寻址。有16根数据输出线,根据不同的设置存贮器工作在不同的工作模式,可以以16位数据线输入输出,也可以8位数据输入输出,即在控制端信号FLASH_BYTE_n为高电平时输出16位的字,为低电平时输出8位,为字节形式。CE为芯片使能端,低电平有效,OE为输出使能。主要由WE,OE两个信号控制数据的读入读出。
以上所述的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干相似的变形和改进,这些也应视为本发明的保护范围之内。
Claims (4)
1.一种用于工业CT图像重建的并行加速装置,其特征在于,其包括处理装置和存储装置:
所述处理装置包括控制装置和运算装置,所述控制装置确定整个成像处理过程中的数据选择和数据流向,所述运算装置根据控制装置所确定的数据选择和数据流向,对需要进行运算的数据进行运算处理和更新处理;
所述存储装置包括内部存储器和外部存储器,所述内部存储器采用双组奇偶双口RAM结构,并采用了并行加速技术,内部存储器用于存储运算过程中的中间数据,所述外部存储器用于存储CT图像。
2.根据权利要求1所述的一种用于工业CT图像重建的并行加速装置,其特征在于,所述运算装置包括运算器模块、预运算模块和更新模块:
所述运算器模块用于对相应CT图像的测量投影值和估算投影值以及系数平方和做减法和除法运算;
所述预运算模块用于对运算器模块中得到的运算结果进行预处理;所述更新模块用于对预运算模块中得到的结果和从外部存储器取出的CT图像的像素值进行处理,得到更新后的像素值。
3.根据权利要求2所述的一种用于工业CT图像重建的并行加速装置,其特征在于,所述控制装置将相应CT图像的测量投影值从外部存储器中取出,同时将相应CT图像的估算投影值以及系数平方和从内部存储器中取出来,送到运算器模块中做减法和除法运算,再把运算的结果存到内部存储器中,直到把每一个探测器的测量投影值和估算投影值运算完毕并将运算结果存到内部存储器,然后控制将运算结果从内部存储器中取出,运算结果先经预运算模块处理,再和外部存储器存储的CT图像的像素值一起送到更新模块中进行更新,再控制将更新的结果存储到外部存储器中的相应位置,从而得到重建的CT图像。
4.根据权利要求1所述的一种用于工业CT图像重建的并行加速装置,其特征在于,所述外部存储器采用闪存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101516184A CN102354392A (zh) | 2011-06-08 | 2011-06-08 | 一种用于工业ct图像重建的并行加速装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101516184A CN102354392A (zh) | 2011-06-08 | 2011-06-08 | 一种用于工业ct图像重建的并行加速装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102354392A true CN102354392A (zh) | 2012-02-15 |
Family
ID=45577953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101516184A Pending CN102354392A (zh) | 2011-06-08 | 2011-06-08 | 一种用于工业ct图像重建的并行加速装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102354392A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194864A (zh) * | 2017-04-24 | 2017-09-22 | 中国人民解放军信息工程大学 | 基于异构平台的ct图像三维重建加速方法及其装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127604A2 (en) * | 2007-04-11 | 2008-10-23 | Apple Inc. | Shared stream memory on multiple processors |
CN101408902A (zh) * | 2008-10-06 | 2009-04-15 | 南京大学 | 基于fpga和usb总线的高速数据采集与传输方法 |
CN101729919A (zh) * | 2009-10-30 | 2010-06-09 | 无锡景象数字技术有限公司 | 基于fpga的全自动平面视频转立体视频系统 |
CN202093573U (zh) * | 2011-06-08 | 2011-12-28 | 无锡引速得信息科技有限公司 | 一种用于工业ct图像重建的并行加速装置 |
-
2011
- 2011-06-08 CN CN2011101516184A patent/CN102354392A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127604A2 (en) * | 2007-04-11 | 2008-10-23 | Apple Inc. | Shared stream memory on multiple processors |
CN101408902A (zh) * | 2008-10-06 | 2009-04-15 | 南京大学 | 基于fpga和usb总线的高速数据采集与传输方法 |
CN101729919A (zh) * | 2009-10-30 | 2010-06-09 | 无锡景象数字技术有限公司 | 基于fpga的全自动平面视频转立体视频系统 |
CN202093573U (zh) * | 2011-06-08 | 2011-12-28 | 无锡引速得信息科技有限公司 | 一种用于工业ct图像重建的并行加速装置 |
Non-Patent Citations (4)
Title |
---|
《核电子学与探测技术》 20100220 王珏、刘巍等 "基于硬件实现的锥束CT图像重建系统的存储机制设计" 第211-216页 1-2、4 第30卷, 第2期 * |
《电子技术应用》 20100906 邓靖飞、李建新、李磊、闫镔 "FPGA加速三维CT图像重建" 第50-53页 1-2、4 第36卷, 第9期 * |
王珏、刘巍等: ""基于硬件实现的锥束CT图像重建系统的存储机制设计"", 《核电子学与探测技术》, vol. 30, no. 2, 20 February 2010 (2010-02-20), pages 211 - 216 * |
邓靖飞、李建新、李磊、闫镔: ""FPGA加速三维CT图像重建"", 《电子技术应用》, vol. 36, no. 9, 6 September 2010 (2010-09-06), pages 50 - 53 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194864A (zh) * | 2017-04-24 | 2017-09-22 | 中国人民解放军信息工程大学 | 基于异构平台的ct图像三维重建加速方法及其装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105869117B (zh) | 一种针对深度学习超分辨率技术的gpu加速方法 | |
US9058678B1 (en) | System and method for reducing the complexity of performing broad-phase collision detection on GPUs | |
US8762655B2 (en) | Optimizing output vector data generation using a formatted matrix data structure | |
CN103049241B (zh) | 一种提高cpu+gpu异构装置计算性能的方法 | |
US20120143932A1 (en) | Data Structure For Tiling And Packetizing A Sparse Matrix | |
CN110516316B (zh) | 一种间断伽辽金法求解欧拉方程的gpu加速方法 | |
CN105739951A (zh) | 一种基于gpu的l1最小化问题快速求解方法 | |
CN103177414A (zh) | 一种基于结构的图节点相似度并行计算方法 | |
CN202093573U (zh) | 一种用于工业ct图像重建的并行加速装置 | |
CN103413273A (zh) | 一种基于gpu加速实现图像复原处理方法 | |
KR20230081697A (ko) | 팽창 컨볼루션 계산 가속화 방법 및 장치 | |
WO2020103883A1 (zh) | 执行矩阵乘法运算的方法、电路及soc | |
CN110414672B (zh) | 卷积运算方法、装置及系统 | |
CN102110310A (zh) | 利用图形处理器实现三维反投影的方法 | |
US20200349433A1 (en) | Streaming-based artificial intelligence convolution processing method and apparatus, readable storage medium and terminal | |
CN117539546A (zh) | 基于非空列存储的稀疏矩阵向量乘加速方法及装置 | |
CN102354392A (zh) | 一种用于工业ct图像重建的并行加速装置 | |
CN110515872A (zh) | 直接内存存取方法、装置、专用计算芯片及异构计算系统 | |
CN108920097B (zh) | 一种基于交织存储的三维数据处理方法 | |
Kapusta et al. | Acceleration of image reconstruction in 3D Electrical Capacitance Tomography in heterogeneous, multi-GPU system using sparse matrix computations and Finite Element Method | |
Kim et al. | Optimizing seam carving on multi-GPU systems for real-time content-aware image resizing | |
CN104992425A (zh) | 一种基于gpu加速的dem超分辨率方法 | |
Jiang et al. | GLARE: Accelerating Sparse DNN Inference Kernels with Global Memory Access Reduction | |
CN114117896A (zh) | 面向超长simd管线的二值规约优化实现方法及系统 | |
CN110322389A (zh) | 池化方法、装置及系统、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120215 |