CN104281490A - 一种基于多gpu的高速计算全息图的方法 - Google Patents

一种基于多gpu的高速计算全息图的方法 Download PDF

Info

Publication number
CN104281490A
CN104281490A CN201410209081.6A CN201410209081A CN104281490A CN 104281490 A CN104281490 A CN 104281490A CN 201410209081 A CN201410209081 A CN 201410209081A CN 104281490 A CN104281490 A CN 104281490A
Authority
CN
China
Prior art keywords
hologram
equipment end
data
modulation factor
lut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410209081.6A
Other languages
English (en)
Other versions
CN104281490B (zh
Inventor
刘娟
马晓
王涌天
贾甲
张迎曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201410209081.6A priority Critical patent/CN104281490B/zh
Publication of CN104281490A publication Critical patent/CN104281490A/zh
Application granted granted Critical
Publication of CN104281490B publication Critical patent/CN104281490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Holo Graphy (AREA)

Abstract

本发明涉及一种基于多GPU的高速计算全息图的方法,利用多个GPU同时计算,并且运用基于点元法的表格数据压缩方法计算全息图,在计算LUT表格数据时,将建立的三维空间分成多个虚拟的二维截面图层,由于每个二维平面所有点对应的传播方向的调制因子相同,所以在记录查找表数据时,将Z方向调制因子提取出来,只需记录二维平面内水平和竖直方向的调制因子,减少了层数倍的存储空间。结合并行实现压缩查找表的方法,不仅减少了查找表的存储空间,还加快了全息图的计算速度。同时,编程建立在主流GPU架构上,方便开发,利于推广。可广泛应用于各图形处理器当中。

Description

一种基于多GPU的高速计算全息图的方法
技术领域
本发明涉一种高速计算全息图的方法,尤其涉及一种基于多GPU系统的全息图的快速计算方法。 
背景技术
国内外在全息图计算加速方面主要有两种方式,一是利用硬件进行快速运算,二是基于全息图计算原理,利用快速算法进行加速。 
新加坡的Yuechao Pan小组2009年在GPU上实现了该小组提出的加速算法S-LUT,通过GPU并行运算,达到了实时的计算速度。算法基于LUT方法,通过分析菲涅尔衍射的计算公式,将x方向与y方向分离开独立计算,记录x和y方向的调制因子,计算时,先将两个调制因子相乘,然后叠加得到整个全息图。 
现有的两种方法存在的问题是,首先记录的数据量仍然很大,较大的数据量会超出CPU缓存的容量;并且因为CPU的计算效率远远低于GPU,因此CPU从内存中读取数据的时间会增加数据的读取时间,从而降低计算速度;最后编程模块不通用,需要单独设计,且对硬件要求也高,因此不适合推广。 
发明内容
(一)要解决的技术问题 
本发明要解决的技术问题就是如何基于多GPU的高速计算全息图的方法,结合快速算法,提出一种将编程建立在主流GPU架构上的高速计算全息图的方法。 
(二)技术方案 
为了解决上述技术问题,本发明提供了一种基于多GPU的高速计 算全息图的方法,其特征在于,首先在Off-line下预先计算全息图,并存储于表格中;然后,在In-line下,首先从表格中读取构建目标物体点对应的X,Y方向调制因子,然后乘以对应的Z方向的调制因子,从而获得所需点的全息图; 
其中,Off-line的计算过程包括以下步骤: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:建立LUT空间,并将数据传输到设备端; 
步骤三:调用设备端的kernel函数,该函数在设备端进行运算; 
步骤四:设备端保存主机端传来的物体数据; 
步骤五:设备端计算X,Y方向的调制因子,每个线程索引分别对应X,Y的值; 
步骤六:将计算结果传回主机端; 
步骤七:保存设备端传回的调制因子数据,释放申请的主机端和设备端空间; 
In-line的计算过程包括以下步骤: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:读取物体数据和LUT中保存的数据; 
步骤三:将数据信息传输到设备端; 
步骤四:调用设备端的kernel函数,该函数在设备端进行运算; 
步骤五:设备端保存主机端传来的物体数据和LUT空间数据; 
步骤六:设备端进行运算,对于同一二维面上的物点,首先计算所有相同X坐标的点的Y方向的调制因子之和,然后乘以相应的相同Y坐标的点的X方向的调制因子之和,最后乘以对应平面的Z方向的调制因子便可以得出该平面物体的全息图; 
步骤七:将计算结果传回主机; 
步骤八:保存设备端传回的全息图数据,释放申请的主机端和设备端空间,保存并显示计算结果。 
优选地,所述Off-line或In-line的计算过程中,首先划分并行计算的任务,将全息图平面上的各个像素点分别交给GPU的各个thread进行计算。 
(三)有益效果 
本发明的一种基于多GPU的高速计算全息图的方法,利用多个GPU同时计算,并且运用基于点元法的表格数据压缩方法计算全息图,在计算LUT表格数据时,将建立的三维空间分成多个虚拟的二维截面图层,由于每个二维平面所有点对应的传播方向的调制因子相同,所以在记录查找表数据时,只需记录二维平面内水平和竖直方向的调制因子,减少了层数倍的存储空间。结合并行实现压缩查找表的方法,不仅减少了查找表的存储空间,还加快了全息图的计算速度。同时,编程建立在主流GPU编程架构上,方便开发,利于推广。 
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 
图1:Off-line下的计算流程示意图; 
图2:in-line下的计算流程示意图; 
图3:计算全息图的任务划分结构示意图; 
具体实施方式
下面结合附图和实施例对本发明的实施方式作进一步详细描述。以下实施例用于说明本发明,但不能用来限制本发明的范围。点元法的基本思想是:将物体离散成独立的物点,将每个物点看成是点光源,利用球面波传播公式,分别计算每个物点传播到全息图平面上的光场分布,然后把每个物点所对应的全息图上的光场分布按物体的组合形式进行线性叠加,叠加的最后结果,即为物体传播到全息图上的光场分布。全息图平面的复振幅分布可以由式(1)求得: 
H ( x , y ) = Σ j = 1 N A j exp [ i ( kr j + φ j ) ] - - - ( 1 )
式中,H(x,y)是组成三维物体的各个离散点光源在全息图平面的复振幅分布的叠加。N为抽样点数,Aj为点光源的光强,φj为光源的初始相位(为了使物体漫反射化,通常设为随机位相),rj为三维物体上第j个点光源(xj,yj,zj)与全息图平面上(x,y,0)点的距离,xj,yj,zj分别是物体空间内,三维物体在x,y,z方向的坐标,x,y分别是全息图空间内,全息图上的x,y,z方向的像素坐标,d为三维物体所在的空间坐标系到全息图平面的垂直距离。: 
r j = ( x - x j ) 2 + ( y - y j ) 2 + ( d + z j ) 2 - - - ( 2 )
表格数据压缩方法是基于夫琅禾费衍射。对于再现像,我们只关注它的强度信息,因此可以在菲涅尔衍射区观察到夫琅禾费衍射。全息平面上的复振幅可以近似表示为: 
H ( x , y ) = Σ j = 0 N - 1 A j exp ( ik x 2 + y 2 2 ( d - z j ) ) × exp ( - ik x j x + y j y d - z j ) , ( 3 )
如果d>>zj,上式可近似并进一步分解为: 
H ( x , y ) = Σ j = 0 N - 1 A j exp ( ik x 2 + y 2 2 ( d - z j ) ) exp ( - ik x i x + y j y d ) = Σ j = 0 N - 1 A j exp ( ik x 2 + y 2 2 ( d - z j ) ) exp ( - ik x j x d ) exp ( - ik y j y d ) , ( 4 )
定义exp(ik(x2+y2)2(d-zj))为Z方向的调制因子,H(x)=exp(-ikxxj/d)为x向的调制因子,V(y)=exp(-ikyyj/d)为y向的调制因子。则式(4)可以化简为: 
H ( x , y ) = Σ j = 0 N - 1 A j H ( x ) V ( y ) L ( z ) , ( 5 )
可以认为三维物体是由Nz个二维点阵组成,每一个二维点阵共有物点Nxy个。对于每一层上的采样点,它们具有相同的轴向调制因子。对于每一层,若有Ny个点分布在同一垂直方向,那么这些点具有相同的水平方向的调制因子,如果每层有Nx个不同的垂直方向,最后可得全息图计算公式: 
H ( x , y ) = Σ j z = 0 N z - 1 { Σ j x = 0 N x - 1 [ Σ j y = 0 N y - 1 A jy V ( y , y jy ) ] H ( x , x j x ) } L ( z , z jz ) - - - ( 6 )
计算主要分为两步,第一步,将Z方向的调制因子提取出来,在Off-line下预先计算X和Y方向调制因子,并存储于表格中。第二步,在In-line下,首先从表格中读取构建目标物体点对应的X,Y方向调制因子,然后乘以对应的Z方向的调制因子,从而获得所需点的全息图。 
Off-line的计算过程,如图1所示: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:建立LUT空间,并将数据传输到GPU端; 
步骤三:调用设备端的kernel函数,该函数在GPU设备端进行运算; 
步骤四:GPU端保存CPU端传来的物体数据; 
步骤五:GPU端并行计算x和y方向的调制因子,每个线程索引分别对应x和y的值; 
步骤六:将计算结果传回主机。 
步骤七:保存设备端传回的调制因子数据,释放申请的主机端和设备端空间。 
In-line的计算过程,如图2所示: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:读取物体数据和LUT中保存的数据; 
步骤三:将数据信息传输到GPU端; 
步骤四:调用设备端的kernel函数,该函数在GPU设备端进行运算; 
步骤五:GPU端保存CPU端传来的物体数据和LUT空间数据; 
步骤六:GPU端进行运算,对于同一二维面上的物点,首先计算所有相同x坐标的点的y方向的调制因子之和,然后乘以相应的相同y坐标的点的x方向的调制因子之和,最后乘以对应平面的z方向的调制因子便可以得出该平面物体的全息图。 
步骤七:将计算结果传回主机。 
步骤八:保存设备端传回的全息图数据,释放申请的主机端和设备端空间,保存并显示计算结果。 
GPU实现该算法时,在Off-line和In-line下,都可以用并行思想进行优化。计算时,首先需要划分并行计算的任务。针对全息图平面上的M×N个抽样点,可以将其交给M×N个threads进行计算,每个thread负责一个全息图抽样点的计算,这些threads分布于不同的线程块block和线程格grid中。其划分方式如图3所示,A是线程格grid组块,B是线程块block组块,C表示全息图。 
本实施例用并行的思想计算全息图,比传统的串行算法更快;高速的硬件GPU系统具有比CPU更高的浮点运算能力,对于计算性的工作,GPU效率比CPU高几百倍;多个GPU并行计算可以计算大尺寸的全息图及较大数据量的三维场景,提高显示的质量;提出的快速算法有效的节省了存储空间,降低了数据传输造成的时间 损耗,也加快了记录的速度。 
以上实施方式仅用于说明本发明,而非对本发明的限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行各种组合、修改或者等同替换,都不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。 

Claims (2)

1.一种基于多GPU的高速计算全息图的方法,其特征在于,用GPU并行的方法,并将Z方向的调制因子提取出来,在Off-line下预先计算计算全息图的X和Y方向的调制因子,并存储于表格中;然后,在In-line下,首先从表格中读取构建目标物体点对应的X,Y方向调制因子,然后乘以对应的Z方向的调制因子,从而获得所需点的全息图; 
其中,Off-line的计算过程包括以下步骤: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:建立LUT空间,并将数据传输到设备端; 
步骤三:调用设备端的kernel函数,该函数在设备端进行运算; 
步骤四:设备端保存主机端传来的物体数据; 
步骤五:设备端计算X,Y方向的调制因子,每个线程索引分别对应X,Y的值; 
步骤六:将计算结果传回主机端; 
步骤七:保存设备端传回的调制因子数据,释放申请的主机端和设备端空间; 
In-line的计算过程包括以下步骤: 
步骤一:在主机端申请LUT和设备端的内存空间; 
步骤二:读取物体数据和LUT中保存的数据; 
步骤三:将数据信息传输到设备端; 
步骤四:调用设备端的kernel函数,该函数在设备端进行运算; 
步骤五:设备端保存主机端传来的物体数据和LUT空间数据; 
步骤六:设备端进行运算,对于同一二维面上的物点,首先计算所有相同X坐标的点的Y方向的调制因子之和,然后乘以相应的相同Y坐标的点的X方向的调制因子之和,最后乘以对应平面的Z方向的调制因子便可以得出该平面物体的全息图; 
步骤七:将计算结果传回主机; 
步骤八:保存设备端传回的全息图数据,释放申请的主机端和设备端空间,保存并显示计算结果。 
2.根据权利要求1所述的基于多GPU的高速计算全息图的方法,其特征在于,所述Off-line或In-line的计算过程中,首先划分并行计算的任务,将全息图平面上的各个像素点分别交给GPU的各个thread进行计算。 
CN201410209081.6A 2014-05-16 2014-05-16 一种基于多gpu的高速计算全息图的方法 Active CN104281490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410209081.6A CN104281490B (zh) 2014-05-16 2014-05-16 一种基于多gpu的高速计算全息图的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410209081.6A CN104281490B (zh) 2014-05-16 2014-05-16 一种基于多gpu的高速计算全息图的方法

Publications (2)

Publication Number Publication Date
CN104281490A true CN104281490A (zh) 2015-01-14
CN104281490B CN104281490B (zh) 2017-06-13

Family

ID=52256391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410209081.6A Active CN104281490B (zh) 2014-05-16 2014-05-16 一种基于多gpu的高速计算全息图的方法

Country Status (1)

Country Link
CN (1) CN104281490B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023060A (zh) * 2016-05-12 2016-10-12 清华大学深圳研究生院 一种基于cuda的gpu并行计算全息图的方法
CN109002509A (zh) * 2018-06-27 2018-12-14 西安交通大学 一种二维衍射谱压缩存储方法
CN109885046A (zh) * 2019-01-18 2019-06-14 中国矿业大学 一种基于粒子滤波的移动机器人定位加速方法
CN111241317A (zh) * 2020-01-08 2020-06-05 四川大学 一种基于多个二维查找表的相位和调制信息获取方法
CN112037110A (zh) * 2020-08-25 2020-12-04 北京航空航天大学 一种基于可伸缩查找表的相息图生成方法
CN112379582A (zh) * 2020-11-02 2021-02-19 湖南大学 一种制作超构表面的方法、超构表面以及打印装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101512445A (zh) * 2006-09-01 2009-08-19 视瑞尔技术公司 借助亚全息图实时生成视频全息图的方法
US20100046750A1 (en) * 2006-11-24 2010-02-25 Bayer Innovation Gmbh Coding method, decoding method, codec and data storage medium for holographic storage
CN102866616A (zh) * 2012-07-03 2013-01-09 上海大学 全视差全息图快速计算与制作装置及方法
CN103076734A (zh) * 2012-11-28 2013-05-01 中国人民解放军装甲兵工程学院 一种利用二次全息的数字全息图打印系统
CN103293935A (zh) * 2012-02-23 2013-09-11 Lg电子株式会社 用于生成全息图的全息显示装置和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101512445A (zh) * 2006-09-01 2009-08-19 视瑞尔技术公司 借助亚全息图实时生成视频全息图的方法
US20100073744A1 (en) * 2006-09-01 2010-03-25 Seereal Technologies S.A. Method for Generating Video Holograms in Real Time by Means of Subholograms
US20100046750A1 (en) * 2006-11-24 2010-02-25 Bayer Innovation Gmbh Coding method, decoding method, codec and data storage medium for holographic storage
CN103293935A (zh) * 2012-02-23 2013-09-11 Lg电子株式会社 用于生成全息图的全息显示装置和方法
CN102866616A (zh) * 2012-07-03 2013-01-09 上海大学 全视差全息图快速计算与制作装置及方法
CN103076734A (zh) * 2012-11-28 2013-05-01 中国人民解放军装甲兵工程学院 一种利用二次全息的数字全息图打印系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
朱竹青等: "基于GPU的数字全息系统实时探测三维物体动态变化的实验研究", 《中国光学学会2010年光学大会论文集》 *
贾甲等: "计算全息三维实时显示的研究进展", 《激光与光电子学进展 》 *
韩剑等: "基于空间光调制器的全息透镜记录波前像差优化方法", 《中国激光》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023060A (zh) * 2016-05-12 2016-10-12 清华大学深圳研究生院 一种基于cuda的gpu并行计算全息图的方法
CN109002509A (zh) * 2018-06-27 2018-12-14 西安交通大学 一种二维衍射谱压缩存储方法
CN109885046A (zh) * 2019-01-18 2019-06-14 中国矿业大学 一种基于粒子滤波的移动机器人定位加速方法
CN111241317A (zh) * 2020-01-08 2020-06-05 四川大学 一种基于多个二维查找表的相位和调制信息获取方法
CN111241317B (zh) * 2020-01-08 2022-03-11 四川大学 一种基于多个二维查找表的相位和调制信息获取方法
CN112037110A (zh) * 2020-08-25 2020-12-04 北京航空航天大学 一种基于可伸缩查找表的相息图生成方法
CN112037110B (zh) * 2020-08-25 2022-07-15 北京航空航天大学 一种基于可伸缩查找表的相息图生成方法
CN112379582A (zh) * 2020-11-02 2021-02-19 湖南大学 一种制作超构表面的方法、超构表面以及打印装置

Also Published As

Publication number Publication date
CN104281490B (zh) 2017-06-13

Similar Documents

Publication Publication Date Title
CN104281490A (zh) 一种基于多gpu的高速计算全息图的方法
US10013731B2 (en) Maximizing parallel processing in graphics processors
CN107341544A (zh) 一种基于可分割阵列的可重构加速器及其实现方法
CA2810526A1 (en) System and method for generating images of subsurface structures
CN103135132A (zh) Cpu/gpu协同并行计算的混合域全波形反演方法
CN110515053B (zh) 基于cpu和多gpu的异构平台sar回波仿真并行方法
CN102831275B (zh) 一种3d流体的仿真方法及系统
CN102222316A (zh) 一种基于dma的双缓冲乒乓并行结构图像处理优化方法
CN105069839A (zh) 一种三维点云模型的计算全息图生成方法
CN105122310A (zh) 用于基于瓦片的渲染的帧内时戳
Zhang et al. Fast processing method to generate gigabyte computer generated holography for three-dimensional dynamic holographic display
US10578787B2 (en) Hologram generating method and hologram generating apparatus
US8587852B2 (en) Generation of a hologram pattern
CN103675895A (zh) 一种利用gpu提高波场延拓计算效率的方法
KR102041960B1 (ko) 병렬 처리 방법 및 병렬 처리 장치
CN104182996B (zh) 一种数字基元全息图的压缩存储与快速恢复方法
CN105488753A (zh) 一种对图像进行二维傅立叶变换或反变换的方法及装置
CN104794102B (zh) 一种加速实现Cholesky分解的嵌入式片上系统
CN207541416U (zh) 一种能够表示再现像遮挡关系的计算全息三维显示装置
US20110310447A1 (en) Method for generating 3d video computer generated hologram using look-up table and spatial redundancy, and apparatus thereof
CN102568031A (zh) 三维图像并行数字构建方法
Wang et al. Real-time photorealistic computer-generated holograms based on backward ray tracing and wavefront recording planes
CN101635046B (zh) 基于统一计算设备架构技术的图像处理方法和装置
Liu et al. Occlusion calculation algorithm for computer generated hologram based on ray tracing
CN104360708A (zh) 一种基于三角函数查找表的快速计算全息算法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant