CN111507891A - 基于cuda的数字图像几何变换方法、装置、设备及介质 - Google Patents

基于cuda的数字图像几何变换方法、装置、设备及介质 Download PDF

Info

Publication number
CN111507891A
CN111507891A CN202010288204.5A CN202010288204A CN111507891A CN 111507891 A CN111507891 A CN 111507891A CN 202010288204 A CN202010288204 A CN 202010288204A CN 111507891 A CN111507891 A CN 111507891A
Authority
CN
China
Prior art keywords
texture
digital image
cuda
memory
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010288204.5A
Other languages
English (en)
Inventor
田园
张梅
保富
张航
张新阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Center of Yunnan Power Grid Co Ltd
Original Assignee
Information Center of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Center of Yunnan Power Grid Co Ltd filed Critical Information Center of Yunnan Power Grid Co Ltd
Priority to CN202010288204.5A priority Critical patent/CN111507891A/zh
Publication of CN111507891A publication Critical patent/CN111507891A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)
  • Image Processing (AREA)

Abstract

本申请涉及一种基于CUDA的数字图像几何变换方法、基于CUDA的数字图像几何变换装置、计算机设备及计算机可读存储介质,上述方法包括:根据纹理内存拾取纹理参数;根据所述纹理参数,得到源图片的纹理坐标;对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及根据所述参考图像坐标,得到并显示数字图像。上述基于CUDA的数字图像几何变换方法,能够进行高速缓存从而提高图像转换速度,并且所受限制较少。

Description

基于CUDA的数字图像几何变换方法、装置、设备及介质
技术领域
本发明涉及计算机图像处理技术领域,特别是涉及一种基于CUDA的数字图像几何变换方法、基于CUDA的数字图像几何变换装置、计算机设备及计算机可读存储介质。
背景技术
随着数字电网的建设不断推进,海量的电网数据给电网的大数据挖掘工作了大量的机遇和挑战。人们通过数据可视化,即利用计算机图像转换技术将电网数据转换为可视化的图像,使得便于直观的呈现电网数据,从而高效的进行大规模的数据分析,以提高电网管理业务水平。
传统的计算机图像转换技术中,常通过读取全局内存或常量内存以得到所需要的参数,从而进行计算机图像转换,但是这种方式耗费时间长、需要遵循相应的访问模式才能得到较好的性能,应用限制较多。
发明内容
基于此,有必要针对传统的计算机图像转换技术耗费时间长、需要遵循相应的访问模式才能得到较好性能使得应用受限制的技术问题,提供一种基于CUDA的数字图像几何变换方法、基于CUDA的数字图像几何变换装置、计算机设备及计算机可读存储介质。
一种基于CUDA的数字图像几何变换方法,所述方法包括以下步骤:
根据纹理内存拾取纹理参数;
根据所述纹理参数,得到源图片的纹理坐标;
对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及
根据所述参考图像坐标,得到并显示数字图像。
上述基于CUDA的数字图像几何变换方法,根据纹理内存拾取纹理参数,并根据纹理参数得到源图片的纹理坐标;对纹理坐标进行坐标变换以得到参考图像坐标;最后,根据参考图像坐标得到数字图像并进行显示。拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
在其中一个实施例中,所述根据纹理内存拾取纹理参数,包括:
获取纹理拾取函数,并从所述纹理内存中获取纹理函数初值;
将所述纹理函数初值代入所述纹理拾取函数,以计算所述纹理参数。
在其中一个实施例中,所述根据所述参考图像坐标,得到并显示数字图像,包括:
CPU读取所述参考图像坐标;
将所述CPU读取的所述参考图像坐标复制给GPU,并利用所述GPU对所述参考图像坐标进行并行计算,以得到所述数字图像;
将所述数字图像复制给主机,并由主机显示所述数字图像。
在其中一个实施例中,所述基于CUDA的数字图像几何变换方法还包括:
对所述参考图像坐标进行归一化处理。
在其中一个实施例中,所述根据纹理内存拾取纹理参数的步骤之前,还包括:
初始化CUDA。
在其中一个实施例中,所述纹理内存包括CUDA数组。
一种基于CUDA的数字图像几何变换装置,包括:
获取模块,用于根据纹理内存拾取纹理参数;
计算模块,用于根据所述纹理参数,得到源图片的纹理坐标;
坐标变换模块,用于对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及
处理模块,用于根据所述参考图像坐标,得到并显示数字图像。
上述基于CUDA的数字图像几何变换装置,根据纹理内存拾取纹理参数,并根据纹理参数得到源图片的纹理坐标;对纹理坐标进行坐标变换以得到参考图像坐标;最后,根据参考图像坐标得到数字图像并进行显示。拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
在其中一个实施例中,所述获取模块在执行所述根据纹理内存拾取纹理参数步骤时:
获取纹理拾取函数,并从所述纹理内存中获取纹理函数初值;
将所述纹理函数初值代入所述纹理拾取函数,以计算所述纹理参数。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一项所述基于CUDA的数字图像几何变换方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述基于CUDA的数字图像几何变换方法的步骤。
附图说明
图1为一个实施例中基于CUDA的数字图像几何变换方法的流程图。
图2为另一个实施例中基于CUDA的数字图像几何变换方法的流程图。
图3为一个实施例中基于CUDA的数字图像几何变换装置的结构框图。
图4为一实施例中的计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
随着数字电网的建设不断推进,海量的电网数据给电网的大数据挖掘工作了大量的机遇和挑战。人们通过数据可视化,即利用计算机图像转换技术将电网数据转换为可视化的图像,使得便于直观的呈现电网数据,从而高效的进行大规模的数据分析,以提高电网管理业务水平。
传统的计算机图像转换技术中,常通过读取全局内存或常量内存以得到所需要的参数,从而进行计算机图像转换,但是这种方式耗费时间长、需要遵循相应的访问模式才能得到较好的性能,应用限制较多。
基于此,有必要针对传统的计算机图像转换技术耗费时间长、需要遵循相应的访问模式才能得到较好性能使得应用受限制的技术问题,提供一种基于CUDA的数字图像几何变换方法。
图1为一实施例中的基于CUDA的数字图像几何变换方法的流程图。如图1所示,基于CUDA的数字图像几何变换方法包括以下步骤:
步骤S12,根据纹理内存拾取纹理参数。
具体的,传统的计算机图像并不自然,缺乏各种纹路,例如,磨损、裂痕、指纹和污渍等,而这些纹路会增加三维物体的真实感。在计算机图形学中,纹理指的是一张表示物体表面细节的位图。纹理内存可以指线性内存或者CUDA数组。拾取纹理参数也即对存在于线性内存或CUDA数组中的纹理参数进行读取。在拾取纹理参数时,拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存。后续根据纹理参考选择对应的纹理内存拾取其余的纹理参数。
拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
根据纹理内存拾取纹理参数,从而进行数字图像几何变换可以增加数字图像的真实感,有利于将电网数据转换为更加直观的可视化图像,从而能够更好的对电网数据进行分析。
步骤S14,根据纹理参数,得到源图片的纹理坐标。
具体的,纹理坐标位于纹理空间中,当把纹理贴到三维空间中图元的表面时,源图片中各部分的人坐标可以映射为纹理空间中的一个纹理坐标。源图片可以是拍摄装置拍摄的图片,例如,在对电网数据进行分析时,可以先采集各用电区域的三维图片,从而便于对该三维图片中的供电、用电等数据进行分析,用电区域的三维图片可以作为源图片。根据纹理参数,得到该源图片中各部分的坐标对应的纹理坐标。源图片中的各部分可以包括供电变压器、居民楼、道路、树木等。
步骤S16,对纹理坐标进行坐标变换,以得到参考图像坐标。
步骤S18,根据参考图像坐标,得到并显示数字图像。
具体的,对纹理坐标进行变换得到参考图像坐标,对参考图像坐标进行处理可以得到根据电网数据转换得到的数字图像。由于数据量较大,因此可以通过GPU辅助进行参考图像坐标的并行计算最终得到数字图像,从而提高图像转换速度。
上述基于CUDA的数字图像几何变换方法,根据纹理内存拾取纹理参数,并根据纹理参数得到源图片的纹理坐标;对纹理坐标进行坐标变换以得到参考图像坐标;最后,根据参考图像坐标得到数字图像并进行显示。拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
图2为另一实施例中的基于CUDA的数字图像几何变换方法的流程图。如图2所示,基于CUDA的数字图像几何变换方法包括以下步骤:
步骤S10,初始化CUDA。
具体的,在电网数据中,对各地图区域的实时指标计算,如负荷监控、重过载监控等热力图播放场景。在计算过程中,由于计算的数据量过大,可以采用GPU并行计算的方式进行计算。本实施例中的GPU并行计算框架采用CUDA框架,该框架使得GPU能够解决复杂的计算问题。对CUDA初始化,从而便于后续利用CUDA框架进行后续计算。GPU并行运算技术在执行过程中线程之间的通行总是难以解决,各个线程之间的通行过程总是会存在很长的延迟,而CUDA因为共享寄存器的存在,其在保存共用计数器或者线程块内的公共结果时,省去大量时间进行线程间通行,所以相应的速率会提升很多。
步骤S12,根据纹理内存拾取纹理参数。
具体的,传统的计算机图像并不自然,缺乏各种纹路,例如,磨损、裂痕、指纹和污渍等,而这些纹路会增加三维物体的真实感。在计算机图形学中,纹理指的是一张表示物体表面细节的位图。纹理内存可以指线性内存或者CUDA数组。拾取纹理参数也即对存在于线性内存或CUDA数组中的纹理参数进行读取。拾取纹理参数也即对存在于线性内存或CUDA数组中的纹理参数进行读取。在拾取纹理参数时,拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存。后续根据纹理参考选择对应的纹理内存拾取其余的纹理参数。
本实施例中的纹理内存包括CUDA数组,根据CUDA数组拾取纹理参数。若CUDA数组中的纹理参数在片上的高速缓存中,则可以潜在的获得较高带宽。并且,CUDA数组相对于在线性内存中分配的纹理能够具有更多维度,支持纹理过滤,可以使用归一化或非归一化的整数纹理坐标寻址,寻址模式多样化等好处。
拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
根据纹理内存拾取纹理参数,从而进行数字图像几何变换可以增加数字图像的真实感,有利于将电网数据转换为更加直观的可视化图像,从而能够更好的对电网数据进行分析。
步骤S12包括步骤S122和步骤S124。
步骤S122,获取纹理拾取函数,并从纹理内存中获取纹理函数初值。
步骤S124,将纹理函数初值代入纹理拾取函数,以计算纹理参数。
具体的,纹理拾取函数可以是根据经验获得的,纹理参数为纹理拾取函数中各未知数的因数,纹理函数初值为纹理函数中的未知数的其中一个或多个值。将从纹理内存中获取的纹理函数初值代理纹理函数,通过计算可以得到纹理参数。
步骤S14,根据纹理参数,得到源图片的纹理坐标。
具体的,纹理坐标位于纹理空间中,当把纹理贴到三维空间中图元的表面时,源图片中各部分的人坐标可以映射为纹理空间中的一个纹理坐标。源图片可以是拍摄装置拍摄的图片,例如,在对电网数据进行分析时,可以先采集各用电区域的三维图片,从而便于对该三维图片中的供电、用电等数据进行分析,用电区域的三维图片可以作为源图片。根据纹理参数,得到该源图片中各部分的坐标对应的纹理坐标。源图片中的各部分可以包括供电变压器、居民楼、道路、树木等。
步骤S16,对纹理坐标进行坐标变换,以得到参考图像坐标。
步骤S18,根据参考图像坐标,得到并显示数字图像。
具体的,对纹理坐标进行变换得到参考图像坐标。可选的,还可以在得到参考图像坐标后进行归一化处理等。对参考图像坐标进行处理可以得到根据电网数据转换得到的数字图像。由于数据量较大,因此可以通过GPU辅助进行参考图像坐标的并行计算最终得到数字图像,从而提高图像转换速度。
步骤S18包括步骤S182和步骤S184。
步骤S182,CPU读取参考图像坐标。
步骤S184,将CPU读取的参考图像坐标复制给GPU,并利用GPU对参考图像坐标进行并行计算,以得到数字图像。
具体的,CPU为结果分配内存,配置阵列和复制图像数据,设置纹理参数,绑定数组纹理,由GPU完成并行化核心程序参考图像坐标。图形处理器(GPU,Graphics ProcessingUnit),又称显示核心、视觉处理器、显示芯片。GPU是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。对于电网数据中的海量数据,利用高性能存储加载海量数据,利用服务端GPU并行计算,可以在毫秒级实现大规模的全景规模数据可视化展示。因为整个全景数据从加载到出图时间很短,所以可以支持基于时间序列的全景热力图播放,可以做到像动画一样的随着时间变化的热力效果变化。即,GPU的并行计算有利于有效的提高将电网数据转换为可视化数字图像的效率。
步骤S186,将数字图像复制给主机,并由主机显示数字图像。
具体的,GPU运行完毕后,将数字图像复制给主机。数字图像的存储空间由主机进行配置,之后主机显示该存储空间内的数字图像。
本申请还提供一种基于CUDA的数字图像几何变换装置。图3为一实施例中的基于CUDA的数字图像几何变换装置的结构框图。如图3所示,基于CUDA的数字图像几何变换装置包括获取模块310、计算模块320、坐标变换模块330以及处理模块340。
获取模块310用于根据纹理内存拾取纹理参数。
具体的,传统的计算机图像并不自然,缺乏各种纹路,例如,磨损、裂痕、指纹和污渍等,而这些纹路会增加三维物体的真实感。在计算机图形学中,纹理指的是一张表示物体表面细节的位图。纹理内存可以指线性内存或者CUDA数组。拾取纹理参数也即对存在于线性内存或CUDA数组中的纹理参数进行读取。在拾取纹理参数时,拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存。后续根据纹理参考选择对应的纹理内存拾取其余的纹理参数。
拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
根据纹理内存拾取纹理参数,从而进行数字图像几何变换可以增加数字图像的真实感,有利于将电网数据转换为更加直观的可视化图像,从而能够更好的对电网数据进行分析。
计算模块320用于根据纹理参数,得到源图片的纹理坐标。
具体的,纹理坐标位于纹理空间中,当把纹理贴到三维空间中图元的表面时,源图片中各部分的人坐标可以映射为纹理空间中的一个纹理坐标。源图片可以是拍摄装置拍摄的图片,例如,在对电网数据进行分析时,可以先采集各用电区域的三维图片,从而便于对该三维图片中的供电、用电等数据进行分析,用电区域的三维图片可以作为源图片。根据纹理参数,得到该源图片中各部分的坐标对应的纹理坐标。源图片中的各部分可以包括供电变压器、居民楼、道路、树木等。
坐标变换模块330用于对纹理坐标进行坐标变换,以得到参考图像坐标。
处理模块340用于根据参考图像坐标,得到并显示数字图像。
具体的,对纹理坐标进行变换得到参考图像坐标,对参考图像坐标进行处理可以得到根据电网数据转换得到的数字图像。由于数据量较大,因此可以通过GPU辅助进行参考图像坐标的并行计算最终得到数字图像,从而提高图像转换速度。
在一实施例中,处理模块340在执行根据参考图像坐标,得到并显示数字图像时,具体包括:CPU读取参考图像坐标;将CPU读取的参考图像坐标复制给GPU,并利用GPU对参考图像坐标进行并行计算,以得到数字图像;将数字图像复制给主机,并由主机显示数字图像。
具体的,CPU为结果分配内存,配置阵列和复制图像数据,设置纹理参数,绑定数组纹理,由GPU完成并行化核心程序参考图像坐标。图形处理器(GPU,Graphics ProcessingUnit),又称显示核心、视觉处理器、显示芯片。GPU是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。对于电网数据中的海量数据,利用高性能存储加载海量数据,利用服务端GPU并行计算,可以在毫秒级实现大规模的全景规模数据可视化展示。因为整个全景数据从加载到出图时间很短,所以可以支持基于时间序列的全景热力图播放,可以做到像动画一样的随着时间变化的热力效果变化。即,GPU的并行计算有利于有效的提高将电网数据转换为可视化数字图像的效率。GPU运行完毕后,将数字图像复制给主机。数字图像的存储空间由主机进行配置,之后主机显示该存储空间内的数字图像。
上述基于CUDA的数字图像几何变换方法,根据纹理内存拾取纹理参数,并根据纹理参数得到源图片的纹理坐标;对纹理坐标进行坐标变换以得到参考图像坐标;最后,根据参考图像坐标得到数字图像并进行显示。拾取纹理内存与读取全局内存或常量内存相比,能够进行高速缓存从而提高图像转换速度,并且,拾取纹理内存并不受访问模式的约束,从而相对于读取全局内存或常量内存的应用所受限制较少。此外,拾取纹理内存寻址计算的延迟隐藏的更好,从而能够改善应用程序执行随机访问数据的性能。
在一实施例中,基于CUDA的数字图像几何变换装置300还包括初始化模块,初始化模块用于初始化CUDA。具体的,在电网数据中,对各地图区域的实时指标计算,如负荷监控、重过载监控等热力图播放场景。在计算过程中,由于计算的数据量过大,可以采用GPU并行计算的方式进行计算。本实施例中的GPU并行计算框架采用CUDA框架,该框架使得GPU能够解决复杂的计算问题。对CUDA初始化,从而便于后续利用CUDA框架进行后续计算。GPU并行运算技术在执行过程中线程之间的通行总是难以解决,各个线程之间的通行过程总是会存在很长的延迟,而CUDA因为共享寄存器的存在,其在保存共用计数器或者线程块内的公共结果时,省去大量时间进行线程间通行,所以相应的速率会提升很多。
在一实施例中,获取模块310在执行根据纹理内存拾取纹理参数步骤时:获取纹理拾取函数,并从纹理内存中获取纹理函数初值;将纹理函数初值代入纹理拾取函数,并计算得到纹理参数。
具体的,纹理拾取函数可以是根据经验获得的,纹理参数为纹理拾取函数中各未知数的因数,纹理函数初值为纹理函数中的未知数的其中一个或多个值。将从纹理内存中获取的纹理函数初值代理纹理函数,通过计算可以得到纹理参数。
上述方法和系统可以在计算机设备中实现。该计算机设备的内部结构图如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现前述任一实施例中的基于CUDA的数字图像几何变换方法的步骤。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请还提供一种存储介质,其上存储有计算机程序。该计算机程序被处理器执行时实现如上任意一个实施例中的基于CUDA的数字图像几何变换方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于CUDA的数字图像几何变换方法,其特征在于,所述方法包括以下步骤:
根据纹理内存拾取纹理参数;
根据所述纹理参数,得到源图片的纹理坐标;
对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及
根据所述参考图像坐标,得到并显示数字图像。
2.根据权利要求1所述的基于CUDA的数字图像几何变换方法,其特征在于,所述根据纹理内存拾取纹理参数,包括:
获取纹理拾取函数,并从所述纹理内存中获取纹理函数初值;
将所述纹理函数初值代入所述纹理拾取函数,以计算所述纹理参数。
3.根据权利要求1所述的基于CUDA的数字图像几何变换方法,其特征在于,所述根据所述参考图像坐标,得到并显示数字图像,包括:
CPU读取所述参考图像坐标;
将所述CPU读取的所述参考图像坐标复制给GPU,并利用所述GPU对所述参考图像坐标进行并行计算,以得到所述数字图像;
将所述数字图像复制给主机,并由主机显示所述数字图像。
4.根据权利要求1所述的基于CUDA的数字图像几何变换方法,其特征在于,所述基于CUDA的数字图像几何变换方法还包括:
对所述参考图像坐标进行归一化处理。
5.根据权利要求1所述的基于CUDA的数字图像几何变换方法,其特征在于,所述根据纹理内存拾取纹理参数的步骤之前,还包括:
初始化CUDA。
6.根据权利要求1所述的基于CUDA的数字图像几何变换方法,其特征在于,所述纹理内存包括CUDA数组。
7.一种基于CUDA的数字图像几何变换装置,其特征在于,包括:
获取模块,用于根据纹理内存拾取纹理参数;
计算模块,用于根据所述纹理参数,得到源图片的纹理坐标;
坐标变换模块,用于对所述纹理坐标进行坐标变换,以得到参考图像坐标;以及
处理模块,用于根据所述参考图像坐标,得到并显示数字图像。
8.根据权利要求7所述的基于CUDA的数字图像几何变换装置,其特征在于,所述获取模块在执行所述根据纹理内存拾取纹理参数步骤时:
获取纹理拾取函数,并从所述纹理内存中获取纹理函数初值;
将所述纹理函数初值代入所述纹理拾取函数,以计算所述纹理参数。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任意一项所述基于CUDA的数字图像几何变换方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可实现权利要求1至6中任意一项所述基于CUDA的数字图像几何变换方法的步骤。
CN202010288204.5A 2020-04-14 2020-04-14 基于cuda的数字图像几何变换方法、装置、设备及介质 Pending CN111507891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010288204.5A CN111507891A (zh) 2020-04-14 2020-04-14 基于cuda的数字图像几何变换方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010288204.5A CN111507891A (zh) 2020-04-14 2020-04-14 基于cuda的数字图像几何变换方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN111507891A true CN111507891A (zh) 2020-08-07

Family

ID=71864684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010288204.5A Pending CN111507891A (zh) 2020-04-14 2020-04-14 基于cuda的数字图像几何变换方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111507891A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598566A (zh) * 2020-12-25 2021-04-02 南方电网海南数字电网研究院有限公司 基于gpu的cuda的图像处理方法、装置和存储介质
CN115049532A (zh) * 2022-08-15 2022-09-13 南京砺算科技有限公司 图形处理器、纹理坐标采样方法、编译方法及装置、介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598566A (zh) * 2020-12-25 2021-04-02 南方电网海南数字电网研究院有限公司 基于gpu的cuda的图像处理方法、装置和存储介质
CN115049532A (zh) * 2022-08-15 2022-09-13 南京砺算科技有限公司 图形处理器、纹理坐标采样方法、编译方法及装置、介质
CN115049532B (zh) * 2022-08-15 2022-11-22 南京砺算科技有限公司 图形处理器、纹理坐标采样方法、编译方法及装置、介质

Similar Documents

Publication Publication Date Title
JP5437485B2 (ja) レンダリングされたグラフィックス要素のためのパフォーマンスメトリックの視覚的表現の表示
JP4639232B2 (ja) フラグメントシェーディングパイプラインにおけるスケーラビリティの向上
US20220012842A1 (en) Graphics rendering method and apparatus, and computer-readable storage medium
CA2880345C (en) Hit testing method and apparatus
TW200818054A (en) Tile based precision rasterization in graphics pipeline
CN106296790A (zh) 用于对计算机图形图像进行阴影化和纹理化的方法及设备
US20110148894A1 (en) Demand-paged textures
CN108122266B (zh) 一种缓存骨骼动画渲染纹理的方法、装置和存储介质
CN113012269A (zh) 基于gpu的三维图像数据渲染方法及设备
CN111507891A (zh) 基于cuda的数字图像几何变换方法、装置、设备及介质
US20180165790A1 (en) Out-of-order cache returns
Tzevanidis et al. From multiple views to textured 3d meshes: a gpu-powered approach
Hofmann et al. A GPGPU accelerated descriptor for mobile devices
US20210358174A1 (en) Method and apparatus of data compression
CN115952388B (zh) 基于图像数据处理的卷积运算方法、装置、处理器及介质
CN113838180A (zh) 一种渲染指令处理方法及其相关设备
DE112017004132T5 (de) Mechanismus zur gemeinsamen nutzung statischer daten für eine heterogene verarbeitungsumgebung
CN114998504B (zh) 二维图像光照渲染方法、装置、系统和电子装置
US7525551B1 (en) Anisotropic texture prefiltering
Malkin et al. CUDA-Optimized real-time rendering of a Foveated Visual System
CN114020390A (zh) Bim模型显示方法、装置、计算机设备和存储介质
CN108921908B (zh) 表面光场的采集方法、装置及电子设备
DENG et al. Design and optimization for multiprocessor interactive GPU
Calı et al. Performance analysis of Roberts edge detection using CUDA and OpenGL
JP2016527631A (ja) グラフィックス処理ユニットを用いたヒストグラム計算のシステム及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination