CN105163128A - 一种利用gpu并行加速图像转换的屏幕图像获取方法 - Google Patents

一种利用gpu并行加速图像转换的屏幕图像获取方法 Download PDF

Info

Publication number
CN105163128A
CN105163128A CN201510551426.0A CN201510551426A CN105163128A CN 105163128 A CN105163128 A CN 105163128A CN 201510551426 A CN201510551426 A CN 201510551426A CN 105163128 A CN105163128 A CN 105163128A
Authority
CN
China
Prior art keywords
image
view data
data
work
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510551426.0A
Other languages
English (en)
Other versions
CN105163128B (zh
Inventor
陆璐
古伟楷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510551426.0A priority Critical patent/CN105163128B/zh
Publication of CN105163128A publication Critical patent/CN105163128A/zh
Application granted granted Critical
Publication of CN105163128B publication Critical patent/CN105163128B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)

Abstract

本发明公开的一种利用GPU并行加速图像转换的屏幕图像获取方法,包括以下步骤:利用GDI图形设备接口获取实时系统屏幕图像即RGB32图像,并基于OpenCL异构计算框架,利用GPU并行计算将获得的RGB32图像转换为视频编解码适用的YUV420图像,最终将YUV420图像数据推送出去。本发明的屏幕图像获取方法,对图像转换过程进行计算加速,大大提高了整体处理速度,支持高分辨率屏幕图像的实时获取。

Description

一种利用GPU并行加速图像转换的屏幕图像获取方法
技术领域
本发明涉及一种利用GPU并行加速图像转换的屏幕图像获取方法,特别涉及一种利用GPU并行加速图像转换的屏幕图像获取方法。
背景技术
DirectShow是针对基于微软Windows平台的流媒体应用的框架,能完美提供高质量的多媒体流的数据采集和回放处理。它能为常见的高性能多媒体应用如文件播放器、TV和DVD播放器、视频编辑软件、格式转换器、音视频采集软件、解码器、编码器、数字信号处理器等提供完美的解决方案。DirectShow支持丰富的流媒体数据格式和压缩格式,包括ASF、MPEG、AVI、MP3、WAV音频文件等,和ACC、DV、H.264、MJPEG-1、MPEG-2等压缩格式。DirectShow的出现,一方面帮助简化了多媒体应用开发过程中涉及的播放、格式转换、捕获等任务;同时它还提供了可定制的解决方案来访问底层流媒体架构,开发人员甚至还可以通过创建自己的DirectShow组件来支持不同的新格式和定制处理效果。
图形设备接口(GraphicsDeviceInterface或GraphicalDeviceInterface,缩写GDI),是微软公司视窗操作系统(MicrosoftWindows)的三大核心部件(也称“子系统”)之一。GDI是微软视窗系统表征图形对象及将其传送给诸如显示器、打印机之类输出设备的标准。图形设备接口的出现使程序员无需要关心硬件设备及设备驱动,就可以将应用程序的输出转化为硬件设备上的输出,实现了程序开发者与硬件设备的隔离,大大方便了开发工作。GDI最大的好处是它有可以直接访问硬件设备的能力。通过GDI可以非常容易的在不同类型的设备上绘制图形,像显示屏和打印机或类似的显示设备。这些能力是微软Windows系统“所见即所得”程序的核心。
在WindowsSDK的PushSourceFiltersSample中,有利用GDI接口获取当前屏幕图像的DirectShowFilter参考代码,其功能单一并仅获取了当前屏幕的RGB32图像进行输出。RogerPack在开源项目screen-capture-recorder中对其进行了改善,并增加了将图像转换为视频编解码适用的YUV420图像数据的功能。但是由于图像转换计算量较大,图像转换的处理速度非常低下,导致对于较大分辨率的屏幕图像无法实现实时获取。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种利用GPU并行加速图像转换的屏幕图像获取方法。
本发明的目的通过以下的技术方案实现:
一种利用GPU并行加速图像转换的屏幕图像获取方法,包括以下步骤:
利用GDI图形设备接口获取实时系统屏幕图像即RGB32图像,并基于OpenCL异构计算框架,利用GPU并行计算将获得的RGB32图像高效转换为视频编解码适用的YUV420图像,最终将YUV420图像数据推送出去。
所述的获取实时系统屏幕图像,是通过DirectShowFilter实现的,DirectShowFilter命名为ScreenRecorder,ScreenRecorder仅具有一个输出Pin,输出Pin的媒体类型为视频流MEDIATYPE_Video/MEDIASUBTYPE_NV12,ScreenRecorder的整体对外功能为按设定的频率获取屏幕区域图像,并将其以YUV4:2:0图像数据的NV12格式码流输出到下游Filter中。
ScreenRecorder继承自DirectShowFilter的基类库中的CSource,利用其中的DirectShowSourceFilter基本功能的实现。ScreenRecorder的主要功能实现在于其输出Pin中,ScreenRecorder中定自定义了一个输出Pin类作为其输出Pin使用的类,命名为“ScreanRecorderPin”。ScreanRecorderPin继承自DirectShowFilter的基类库中的CSourceStream,利用其中的输出Pin的连接和数据传输等基本功能的实现,数据传输方式属于Push模式。
ScreenRecorder获取屏幕区域图像的工作基于微软的Windows图形设备接口(GraphicsDeviceInterface,GDI)来进行,获取到的图像数据为RGB颜色空间的位图图像数据格式。ScreenRecorder会将获取到的屏幕区域图像根据用户设置的图像处理要求,进行相应的图像处理后,将其从RGB颜色空间的位图图像数据格式转换为YUV4:2:0图像数据的NV12格式码流进行输出。这部分图像处理和格式转换工作基于OpenCL异构计算框架进行开发实现,利用GPU并行计算实现高性能低功耗的图像处理和格式转换,同时降低CPU计算资源的占用。
所述的ScreenRecorder,其工作流程为:
ScreenRecorder获取到屏幕区域图像后,根据图像大小创建OpenCLBuffer用以存放图像数据,用来和GPU设备进行数据传输;
将图像数据写入到OpenCLBuffer中后,对OpenCLBuffer中的图像根据用户设置的图像处理要求进行相应的图像处理工作;
图像处理完成后,将OpenCLBuffer中的图像数据从RGB颜色空间的位图图像数据格式转换为YUV4:2:0图像数据的NV12格式存放;
完成图像数据转换后,从OpenCLBuffer中读取NV12格式图像数据回到系统内存中;
最后跟据输出媒体类型将此图像数据封装成Sample并传递给下游Filter中,进入下一次获取屏幕区域图像的循环中。
所述的图像处理和图像数据转换,都以OpenCLBuffer作为图像数据的存储载体,即这部分图像处理和图像数据转换工作过程中,图像数据都存放在GPU管理的显存中,和CPU管理的系统内存之间没有额外的数据传输操作;直到图像数据转换成NV12格式图像数据后,才从OpenCLBuffer中取回输出的图像数据到系统内存中。
所述的图像处理和图像数据转换,都在GPU上进行,并且只进行了两次host端(系统内存)和device端(显存)之间的数据传输,分别是:(1)进行图像处理和图像数据转换前,将图像数据从host端(系统内存)传输到device端(显存);(2)图像处理和图像数据转换完成后,将图像数据从device端(显存)取回到host端(系统内存)中。
所述的GPU并行计算,包含以下步骤:
根据OpenCL异构计算框架和NV12图像存储格式的特点,对转换图像的每个2×2像素区域安排一个work-item进行颜色空间转换和色度亚采样计算;
每个work-item从输入的RGB32图像中读取对应像素数据,并将计算结果数据按照NV12图像存储格式存放到输出图像中;在这种安排下,每个work-item只需要从输入图像中读取其对应的2×2像素区域中4个RGB32像素数据,并将转换结果数据写入输出图像中Y-plane对应的2×2像素区域的4个字节数据和UV-plane对应的一个像素的2个字节数据。不同的work-item之间不存在数据访问冲突。
鉴于常用的标准视频尺寸中,图像宽度和高度均为16的倍数,所以对转换图像的每个16×16像素区域的颜色空间转换和色度亚采样计算工作安排在一个work-group中进行,每个work-group的大小为8×8,其中有64个work-item。由于一个work-item负责一个2×2像素区域的颜色空间转换和色度亚采样计算工作,所以每个work-group的大小为8×8,其中有64个work-item。而且根据AMDGPU的设备信息(KernelPreferredworkgroupsizemultiple),将work-group大小设置为64也较为适宜。
所述的GPU并行计算,具体包含以下步骤:
进行滤波计算前,检查当前work‐item对应像素位置是否超出处理图像范围,若超出则不进行后续计算和操作(由于SIMD计算核心特性,实际执行时仍然进行了计算,但会舍弃计算结果不输出);
利用GPU高带宽内存访问能力,从输入的RGB32图像读入2×2像素区域数据时,使用内置内存访问函数vload8分别将2对连续存放的2个像素点的4个通道分量一次性读取到寄存器中,减少内存访问请求;对于输入图像共进行了2次内存读取的访问请求;
根据输入的4个RGB32像素数据,计算得出4个亮度Y值和1对色度UV值;
利用GPU高带宽内存访问能力,将4个亮度Y值和1对色度UV值写入输出图像时,使用内置内存访问函数vstore2分别将2对连续存放的2个像素点的亮度Y值和1对色度UV值一次性写入到输出图像的Y‐plane和UV‐plane中,减少内存访问请求,对于输出图像共进行了3次内存写入的访问请求。
本发明与现有技术相比,具有如下优点和有益效果:
在传统的屏幕图像获取方法中,仅使用CPU完成所有处理工作,包括计算量较大的图像转换过程。与之相比,本发明基于OpenCL异构计算框架,利用GPU并行计算带来的强大并行计算能力,对图像转换过程进行计算加速,大大提高了整体处理速度,支持高分辨率屏幕图像的实时获取。
附图说明
图1为ScreenRecorder的工作原理图。
图2为ScreenRecorder的工作流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
一种利用GPU并行加速图像转换的屏幕图像获取方法,包括以下步骤:
利用GDI图形设备接口获取实时系统屏幕图像即RGB32图像,并基于OpenCL异构计算框架,利用GPU并行计算将获得的RGB32图像高效转换为视频编解码适用的YUV420图像,最终将YUV420图像数据推送出去。
具体如下:
(一)屏幕图像获取Filter设计
提供利用GPU并行加速图像转换的屏幕区域图像获取并转换为视频图像序列功能的DirectShowFilter命名为“ScreenRecorder”,属于SourceFilter,仅具有一个输出Pin,输出Pin的媒体类型为视频流MEDIATYPE_Video/MEDIASUBTYPE_NV12。ScreenRecorder的整体对外功能为按设定的频率获取屏幕区域图像,并将其以YUV4:2:0图像数据的NV12格式码流输出到下游Filter中。
ScreenRecorder继承自DirectShowFilter的基类库中的CSource,利用其中的DirectShowSourceFilter基本功能的实现。如图1,ScreenRecorder的主要功能实现在于其输出Pin中,ScreenRecorder中定自定义了一个输出Pin类作为其输出Pin使用的类,命名为“ScreanRecorderPin”。ScreanRecorderPin继承自DirectShowFilter的基类库中的CSourceStream,利用其中的输出Pin的连接和数据传输等基本功能的实现,数据传输方式属于Push模式。
ScreenRecorder获取屏幕区域图像的工作基于微软的Windows图形设备接口(GraphicsDeviceInterface,GDI)来进行,获取到的图像数据为RGB颜色空间的位图图像数据格式。ScreenRecorder会将获取到的屏幕区域图像根据用户设置的图像处理要求,进行相应的图像处理后,将其从RGB颜色空间的位图图像数据格式转换为YUV4:2:0图像数据的NV12格式码流进行输出。这部分图像处理和格式转换工作基于OpenCL异构计算框架进行开发实现,利用GPU并行计算实现高性能低功耗的图像处理和格式转换,同时降低CPU计算资源的占用。
ScreenRecorder的主要工作流程如图2所示。ScreenRecorder获取到屏幕区域图像后,根据图像大小创建OpenCLBuffer用以存放图像数据,用来和GPU设备进行数据传输。将图像数据写入到OpenCLBuffer中后,对OpenCLBuffer中的图像根据用户设置的图像处理要求进行相应的图像处理工作。图像处理完成后,将OpenCLBuffer中的图像数据从RGB颜色空间的位图图像数据格式转换为YUV4:2:0图像数据的NV12格式存放。完成图像数据转换后,从OpenCLBuffer中读取NV12格式图像数据回到系统内存中。图像处理和图像数据转换工作都以OpenCLBuffer作为图像数据的存储载体,即这部分图像处理和图像数据转换工作过程中,图像数据都存放在GPU管理的显存中,和CPU管理的系统内存之间没有额外的数据传输操作。直到图像数据转换成NV12格式图像数据后,才从OpenCLBuffer中取回输出的图像数据到系统内存中。所有图像处理和图像数据转换工作都在GPU上进行,并且只进行了两次host端(系统内存)和device端(显存)之间的数据传输,分别是:(1)进行图像处理和图像数据转换前,将图像数据从host端(系统内存)传输到device端(显存);(2)图像处理和图像数据转换完成后,将图像数据从device端(显存)取回到host端(系统内存)中。最后跟据输出媒体类型将此图像数据封装成Sample并传递给下游Filter中,进入下一次获取屏幕区域图像的循环中。
(二)GPU并行加速图像转换
根据OpenCL异构计算框架和NV12图像存储格式的特点,对转换图像的每个2×2像素区域安排一个work-item进行颜色空间转换和色度亚采样计算。每个work-item从输入的RGB32图像中读取对应像素数据,并将计算结果数据按照NV12图像存储格式存放到输出图像中。在这种安排下,每个work-item只需要从输入图像中读取其对应的2×2像素区域中4个RGB32像素数据,并将转换结果数据写入输出图像中Y-plane对应的2×2像素区域的4个字节数据和UV-plane对应的一个像素的2个字节数据。不同的work-item之间不存在数据访问冲突。
鉴于常用的标准视频尺寸中,图像宽度和高度均为16的倍数,所以对转换图像的每个16×16像素区域的颜色空间转换和色度亚采样计算工作安排在一个work-group中进行。由于一个work-item负责一个2×2像素区域的颜色空间转换和色度亚采样计算工作,所以每个work-group的大小为8×8,其中有64个work-item。而且根据AMDGPU的设备信息(KernelPreferredworkgroupsizemultiple),将work-group大小设置为64也较为适宜。
在kernel实现中有以下计算逻辑:
1、进行滤波计算前,检查当前work‐item对应像素位置是否超出处理图像范围,若超出则不进行后续计算和操作。(由于SIMD计算核心特性,实际执行时仍然进行了计算,但会舍弃计算结果不输出。)
2、利用GPU高带宽内存访问能力,从输入的RGB32图像读入2×2像素区域数据时,使用内置内存访问函数vload8分别将2对连续存放的2个像素点的4个通道分量一次性读取到寄存器中,减少内存访问请求。对于输入图像共进行了2次内存读取的访问请求。
3、根据输入的4个RGB32像素数据,通过4.2.1中所述公式进行计算得出4个亮度Y值和1对色度UV值。
4、利用GPU高带宽内存访问能力,将计算结果4个亮度Y值和1对色度UV值写入输出图像时,使用内置内存访问函数vstore2分别将2对连续存放的2个像素点的亮度Y值和1对色度UV值一次性写入到输出图像的Y‐plane和UV‐plane中,减少内存访问请求。对于输出图像共进行了3次内存写入的访问请求。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于,包括以下步骤:
利用GDI图形设备接口获取实时系统屏幕图像即RGB32图像,并基于OpenCL异构计算框架,利用GPU并行计算将获得的RGB32图像转换为视频编解码适用的YUV420图像,最终将YUV420图像数据推送出去。
2.根据权利要求1所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的获取实时系统屏幕图像,是通过DirectShowFilter实现的,DirectShowFilter命名为ScreenRecorder,ScreenRecorder仅具有一个输出Pin,输出Pin的媒体类型为视频流MEDIATYPE_Video/MEDIASUBTYPE_NV12,ScreenRecorder的整体对外功能为按设定的频率获取屏幕区域图像,并将其以YUV4:2:0图像数据的NV12格式码流输出。
3.根据权利要求2所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于,所述的ScreenRecorder,其工作流程为:
ScreenRecorder获取到屏幕区域图像后,根据图像大小创建OpenCLBuffer用以存放图像数据,用来和GPU设备进行数据传输;
将图像数据写入到OpenCLBuffer中后,对OpenCLBuffer中的图像根据用户设置的图像处理要求进行相应的图像处理工作;
图像处理完成后,将OpenCLBuffer中的图像数据从RGB颜色空间的位图图像数据格式转换为YUV4:2:0图像数据的NV12格式存放;
完成图像数据转换后,从OpenCLBuffer中读取NV12格式图像数据回到系统内存中;
最后跟据输出媒体类型将此图像数据封装成Sample并传递给下游Filter中,进入下一次获取屏幕区域图像的循环中。
4.根据权利要求3所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的图像处理和图像数据转换,都以OpenCLBuffer作为图像数据的存储载体,即这部分图像处理和图像数据转换工作过程中,图像数据都存放在GPU管理的显存中,和CPU管理的系统内存之间没有额外的数据传输操作;直到图像数据转换成NV12格式图像数据后,才从OpenCLBuffer中取回输出的图像数据到系统内存中。
5.根据权利要求3所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的图像处理和图像数据转换,都在GPU上进行,并且只进行了两次host端和device端之间的数据传输,分别是:(1)进行图像处理和图像数据转换前,将图像数据从host端传输到device端;(2)图像处理和图像数据转换完成后,将图像数据从device端取回到host端中。
6.根据权利要求3所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于,所述的GPU并行计算,包含以下步骤:
对转换图像的每个2×2像素区域安排一个work-item进行颜色空间转换和色度亚采样计算;
每个work-item从输入的RGB32图像中读取对应像素数据,并将计算结果数据按照NV12图像存储格式存放到输出图像中;
对转换图像的每个16×16像素区域的颜色空间转换和色度亚采样计算工作安排在一个work-group中进行,每个work-group的大小为8×8,其中有64个work-item。
7.根据权利要求1或6所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的GPU并行计算,具体包含以下步骤:
进行滤波计算前,检查当前work‐item对应像素位置是否超出处理图像范围,若超出则不进行后续计算和操作;
从输入的RGB32图像读入2×2像素区域数据时,使用内置内存访问函数vload8分别将2对连续存放的2个像素点的4个通道分量一次性读取到寄存器中;对于输入图像共进行了2次内存读取的访问请求;
根据输入的4个RGB32像素数据,计算得出4个亮度Y值和1对色度UV值;
将4个亮度Y值和1对色度UV值写入输出图像时,使用内置内存访问函数vstore2分别将2对连续存放的2个像素点的亮度Y值和1对色度UV值一次性写入到输出图像的Y‐plane和UV‐plane中,对于输出图像共进行了3次内存写入的访问请求。
CN201510551426.0A 2015-08-31 2015-08-31 一种利用gpu并行加速图像转换的屏幕图像获取方法 Expired - Fee Related CN105163128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510551426.0A CN105163128B (zh) 2015-08-31 2015-08-31 一种利用gpu并行加速图像转换的屏幕图像获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510551426.0A CN105163128B (zh) 2015-08-31 2015-08-31 一种利用gpu并行加速图像转换的屏幕图像获取方法

Publications (2)

Publication Number Publication Date
CN105163128A true CN105163128A (zh) 2015-12-16
CN105163128B CN105163128B (zh) 2018-04-13

Family

ID=54803868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510551426.0A Expired - Fee Related CN105163128B (zh) 2015-08-31 2015-08-31 一种利用gpu并行加速图像转换的屏幕图像获取方法

Country Status (1)

Country Link
CN (1) CN105163128B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106331532A (zh) * 2016-08-26 2017-01-11 北京金山安全软件有限公司 一种数据转换方法、装置及电子设备
CN106412598A (zh) * 2016-09-13 2017-02-15 中山大学 基于cuda显卡编码的无线视频传输系统及其传输方法
CN107465929A (zh) * 2017-07-21 2017-12-12 山东大学 基于hevc的dvfs控制方法、系统、处理器及存储设备
CN107968923A (zh) * 2017-11-30 2018-04-27 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110063302A1 (en) * 2009-09-16 2011-03-17 Nvidia Corporation Compression for co-processing techniques on heterogeneous graphics processing units
CN102665135A (zh) * 2012-04-18 2012-09-12 山东大学 一种嵌入式屏幕传输系统及其操作方法
CN103414751A (zh) * 2013-07-16 2013-11-27 广东工业大学 一种pc屏幕内容分享互动控制方法
CN103607581A (zh) * 2013-08-01 2014-02-26 广东本致数码科技有限公司 基于三维图像视频监控图像显示方法
CN104580837A (zh) * 2015-01-20 2015-04-29 南京纳加软件有限公司 一种基于gpu+cpu+io构架的视频导播引擎及其使用方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110063302A1 (en) * 2009-09-16 2011-03-17 Nvidia Corporation Compression for co-processing techniques on heterogeneous graphics processing units
CN102665135A (zh) * 2012-04-18 2012-09-12 山东大学 一种嵌入式屏幕传输系统及其操作方法
CN103414751A (zh) * 2013-07-16 2013-11-27 广东工业大学 一种pc屏幕内容分享互动控制方法
CN103607581A (zh) * 2013-08-01 2014-02-26 广东本致数码科技有限公司 基于三维图像视频监控图像显示方法
CN104580837A (zh) * 2015-01-20 2015-04-29 南京纳加软件有限公司 一种基于gpu+cpu+io构架的视频导播引擎及其使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯可,周军: "基于DirectShow的视频实时校正系统设计", 《电视技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106331532A (zh) * 2016-08-26 2017-01-11 北京金山安全软件有限公司 一种数据转换方法、装置及电子设备
CN106412598A (zh) * 2016-09-13 2017-02-15 中山大学 基于cuda显卡编码的无线视频传输系统及其传输方法
CN107465929A (zh) * 2017-07-21 2017-12-12 山东大学 基于hevc的dvfs控制方法、系统、处理器及存储设备
CN107968923A (zh) * 2017-11-30 2018-04-27 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算设备及存储介质

Also Published As

Publication number Publication date
CN105163128B (zh) 2018-04-13

Similar Documents

Publication Publication Date Title
CN108206937B (zh) 一种提升智能分析性能的方法和装置
CN103888771A (zh) 基于gpgpu技术的并行视频图像处理方法
US20110148894A1 (en) Demand-paged textures
TW201706840A (zh) 促進圖形處理命令的動態運行時變換以用於在計算裝置之改善的圖形效能
CN105163128A (zh) 一种利用gpu并行加速图像转换的屏幕图像获取方法
KR101410168B1 (ko) 다중 포맷 비디오 프로세싱을 위한 재구성 가능 버퍼 할당
US9916634B2 (en) Facilitating efficient graphics command generation and execution for improved graphics performance at computing devices
US20140086309A1 (en) Method and device for encoding and decoding an image
CN108352050B (zh) 基于视频解码模式更新用于显示的区域
CN103179393B (zh) 降低运动补偿和显示刷新中的功耗的dram压缩方案
US8928680B1 (en) Method and system for sharing a buffer between a graphics processing unit and a media encoder
TW201131511A (en) Super-resolution method for video display
US20220100576A1 (en) Video processing method and device, electronic equipment and storage medium
WO2022206960A1 (zh) 视频转码方法、系统及电子设备
KR102231975B1 (ko) 순방향 변환 행렬을 사용하여 비디오 인코더에 의해 순방향 변환을 수행하는 기술
Guo et al. Lossy compression for embedded computer vision systems
EP2787738B1 (en) Tile-based compression for graphic applications
CN107920253B (zh) 一种基于gpu的视频处理方法
CN103765888A (zh) 分析辅助编码
WO2023109086A1 (zh) 文字识别方法、装置、设备及存储介质
US9779465B2 (en) Apparatus and method for implementing power saving techniques when processing floating point values
US9471995B2 (en) Codec engine with inline image processing
CN116880937A (zh) 互动课堂的桌面截屏数据处理方法、装置、设备及介质
CN105263021A (zh) 一种基于uvd的hevc视频解码方法
CN113052748B (zh) 图形处理器以及视频解码显示方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180413

Termination date: 20210831