CN106951322A - 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统 - Google Patents

一种cpu/gpu异构环境的图像协同处理程序获取方法及系统 Download PDF

Info

Publication number
CN106951322A
CN106951322A CN201710113952.8A CN201710113952A CN106951322A CN 106951322 A CN106951322 A CN 106951322A CN 201710113952 A CN201710113952 A CN 201710113952A CN 106951322 A CN106951322 A CN 106951322A
Authority
CN
China
Prior art keywords
image processing
image
gpu
cpu
digital image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710113952.8A
Other languages
English (en)
Inventor
杨洪余
姜青山
李成明
单小红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201710113952.8A priority Critical patent/CN106951322A/zh
Publication of CN106951322A publication Critical patent/CN106951322A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5055Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Abstract

本发明适用计算机技术领域,提供了一种CPU/GPU异构环境的图像协同处理程序获取方法及系统,该方法包括:接收用户输入的数字图像处理算法,对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤,根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段,根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序,从而实现数字图像处理算法到图像协同处理程序的转化,提高了利用图像处理算法的程序的通用性以及程序运行时的并行性。

Description

一种CPU/GPU异构环境的图像协同处理程序获取方法及系统
技术领域
本发明属于计算机技术领域,尤其涉及一种CPU/GPU异构环境的图像协同处理程序获取方法及系统。
背景技术
随着摩尔定律的不断发展,图像处理单元(Graphics Processing Unit,缩写为GPU)中集成的晶体管数目已经超过了中央处理单元(Central Processing Unit,缩写为CPU)中集成的晶体管数目,GPU的通用计算能力正在不断发展,其并行计算能力也正在不断被挖掘和应用。目前,包括多个内核(例如,多个CPU、GPU)的异构多核处理器被广泛地应用在现代计算机系统中,由于这些系统中的GPU具有高效的并行计算能力,使得高速内存带宽和并行编程模型可被广泛地应用于计算密集型程序。现在无论在个人电脑,还是超级计算机或者GPU集群中,GPU都作为主要的加速器件负责计算任务,利用GPU加速计算任务成为主流,现在越来越多的高性能计算机采用由CPU与GPU组成的异构系统作为其主要的计算单元。而随着图像获取的技术不断提高,使得图像的分辨率和图像的质量不断提高,导致现有的在CPU平台上的处理图像工具已经无法满足图像处理的需求,容易造成图像数据的堆积,无法实时处理图像,影响图像处理的效率,使整个图像处理的时间增加。因此如何快速有效的处理图像成为了一个急需解决的问题。
由于GPU专用于图像处理,近年来不少专家学者成功地将GPU的并行计算能力应用于图像处理中,并取得不错的加速效果。例如,将GPU应用于图像匹配技术中,加速图像匹配的速度,以减少匹配的时间,将GPU应用于图像边缘检测中,以在加快图像边缘检测的速度的同时保留图像的重要结构属性。然而,在这些特定的应用中,利用GPU进行计算的算法只是一些特定的算法,并没有形成通用的移植模型,难以推广到其它数字图像处理算法,难以有效提高图像处理的效率。
发明内容
本发明的目的在于提供一种CPU/GPU异构环境的图像协同处理程序获取方法及系统,旨在解决由于现有技术无法提供一种有效的图像处理程序转化方法,导致利用图像处理算法的程序通用性差、运行时并行性差的问题。
一方面,本发明提供了一种CPU/GPU异构环境的图像协同处理程序获取方法,所述方法包括下述步骤:
接收用户输入的数字图像处理算法;
对所述数字图像处理算法进行解析,以获取所述数字图像处理算法中用于图像分块处理的可并行运行步骤;
根据预设的CPU和GPU上图像分块分配方式,将所述可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;
根据所述计算机程序代码段获取利用所述数字图像处理算法的图像协同处理程序。
另一方面,本发明提供了一种CPU/GPU异构环境的图像协同处理程序获取系统,所述系统包括:
算法接收单元,用于接收用户输入的数字图像处理算法;
算法解析单元,用于对所述数字图像处理算法进行解析,以获取所述数字图像处理算法中用于图像分块处理的可并行运行步骤;
步骤映射单元,用于根据预设的CPU和GPU上图像分块分配方式,将所述可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;以及
第一程序获取单元,用于根据所述计算机程序代码段获取利用所述数字图像处理算法的图像协同处理程序。
本发明在接收用户输入的数字图像处理算法后,对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤,根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段,根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序,从而实现数字图像处理算法到图像协同处理程序的转化,提高了利用图像处理算法的程序的通用性以及程序运行时的并行性。
附图说明
图1是本发明实施例一提供的CPU/GPU异构环境的图像协同处理程序获取方法的实现流程图;
图2是本发明实施例二提供的CPU/GPU异构环境的图像协同处理程序获取方法的实现流程图;
图3是本发明实施例三提供的CPU/GPU异构环境的图像协同处理程序获取系统的结构示意图;以及
图4是本发明实施例四提供的CPU/GPU异构环境的图像协同处理程序获取系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的CPU/GPU异构环境的图像协同处理程序获取方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收用户输入的数字图像处理算法。
本发明实施例适用于程序编译器或图像处理程序自动生成系统,数字图像处理算法描述了处理数字图像的方法,数字图像处理算法具体可通过伪代码、流程图或类语言等方式表示。
在步骤S102中,对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤。
在本发明实施例中,在对数字图像处理算法进行解析时,可通过人工(例如,编程人员)对表示算法的流程图或伪代码进行分析,也可以通过对表示算法的流程图或伪代码进行机器自动解析,得到对应的可并行运行步骤或伪代码描述。作为示例地,例如,可对数字图像处理算法处理像素的特点,判断该数字图像处理算法是否针对各个像素点进行、各个像素点的计算顺序有没有先后关系,如果处理算法针对各个像素点进行,且处理结果互不影响,则该数字图像处理算法中对各个像素点的处理可并行化实现,这样,可得到数字图像处理算法中用于图像处理的可并行运行步骤。
在步骤S103中,根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。
在本发明实施例中,预先设置CPU和GPU上图像分块分配方式,即分配CPU和GPU上处理的图像分块数量或图像数据数量,在具体分配时可根据运行计算机程序的CPU/GPU异构计算机中CPU和GPU核心的数量进行分配,也可以以其他方式分配,之后根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。具体地,可通过人工将可并行运行步骤转换为CPU和GPU上可并行运行的计算机程序代码段,或自动将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。
在步骤S104中,根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序。
在本发明实施例中,根据前述已得到的可并行运行的计算机程序代码段获取利用数字图像处理算法的图像协同处理程序,从而实现数字图像处理算法到图像协同处理程序的转化,提高了利用图像处理算法的程序的通用性以及程序运行时的并行性。具体在根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序时,可通过人工或自动生成方式得到利用前述数字图像处理算法的图像协同处理程序。
实施例二:
图2示出了本发明实施例二提供的CPU/GPU异构环境的图像协同处理程序获取方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S201中,获取利用数字图像处理算法在CPU上运行的第一图像处理程序,并获取利用数字图像处理算法在GPU上运行的第二图像处理程序。
在步骤S202中,运行第一和第二图像处理程序,分别对预设的测试用图像进行处理,以得到第一和第二图像处理程序处理测试用图像的运行时间。
在本发明实施例中,第一图像处理程序为预先编写的利用CPU上进行运行的图像处理程序,第一图像处理程序为预先编写的利用GPU上进行运行的图像处理程序。获取第一和第二图像处理程序后运行第一和第二图像处理程序,对预设的测试用图像进行处理,以得到第一和第二图像处理程序处理测试用图像的运行时间。
在步骤S203中,根据第一和第二图像处理程序处理测试用图像的运行时间,确定CPU和GPU上图像分块分配方式并设置。
在本发明实施例中,为了提高CPU和GPU的并行性,要求两者处理分配的图像时间相同,从而充分提高包括CPU和GPU的计算机的性能。因此,优选地,将CPU上处理的图像分块数量确定为将GPU上处理的图像分块数量确定为其中,S表示图像的总数据量或总分块数,α为第一和第二图像处理程序处理测试用图像的运行时间的比值,在这里,考虑到CPU在进行进程调度时需要一定的切换时间,因此设置调节因子β,以对CPU和GPU的任务量进行调节,提高异构计算机的并行性。其中,β的取值范围为0.5≤β<1。优选地,β的值为0.9,从而进一步提高利用CPU/GPU异构计算机中CPU和GPU处理图像时的并行性,实现CPU和GPU上处理图像数据的精确分配。
在步骤S204中,接收用户输入的数字图像处理算法。
在步骤S205中,对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤。
在本发明实施例中,数字图像处理算法描述了处理数字图像的方法,数字图像处理算法具体可通过伪代码、流程图或类语言等方式表示。在对数字图像处理算法进行解析时,可通过人工(例如,编程人员)对表示算法的流程图或伪代码进行分析,也可以通过对表示算法的流程图或伪代码进行机器自动解析,得到对应的可并行运行步骤或伪代码描述。作为示例地,例如,可对数字图像处理算法处理像素的特点,判断该数字图像处理算法是否针对各个像素点进行、各个像素点的计算顺序有没有先后关系,如果处理算法针对各个像素点进行,且处理结果互不影响,则该数字图像处理算法中对各个像素点的处理可并行化实现,这样,可得到数字图像处理算法中用于图像处理的可并行运行步骤。
在步骤S206中,根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。
在本发明实施例中,预先设置CPU和GPU上图像分块分配方式,即分配CPU和GPU上处理的图像分块数量或图像数据数量,在具体分配时可根据运行计算机程序的CPU/GPU异构计算机中CPU和GPU核心的数量进行分配,也可以以其他方式分配,之后根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。具体地,可通过人工将可并行运行步骤转换为CPU和GPU上可并行运行的计算机程序代码段,或自动将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段。
在步骤S207中,根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序。
在本发明实施例中,根据前述已得到的可并行运行的计算机程序代码段获取利用数字图像处理算法的图像协同处理程序,从而实现数字图像处理算法到图像协同处理程序的转化,提高了利用图像处理算法的程序的通用性以及程序运行时的并行性。具体在根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序时,可通过人工或自动生成方式得到利用前述数字图像处理算法的图像协同处理程序。
在步骤S208中,对获取的图像协同处理程序进行优化。
在本发明实施例中,考虑到访存对齐和数据向量化,可以通过向量指令集加快数据的并行处理,从而实现图像协同处理程序中CPU代码的优化。对于GPU代码的优化,可减少GPU代码中的分支处理,提高计算密集度。另外,在代码中存在数据复用时尽可能使用共享存储器,访问全局内存时尽量做到合并访问,合理使用纹理存储加快全局内存的访问速度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例三:
图3示出了本发明实施例三提供的CPU/GPU异构环境的图像协同处理程序获取系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
算法接收单元31,用于接收用户输入的数字图像处理算法;
算法解析单元32,用于对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤;
步骤映射单元33,用于根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;以及
第一程序获取单元34,用于根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序。
在本发明实施例中,CPU/GPU异构环境的图像协同处理程序获取系统的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考实施一的描述,在此不再赘述。
实施例四:
图4示出了本发明实施例四提供的CPU/GPU异构环境的图像协同处理程序获取系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
第二程序获取单元41,用于获取利用数字图像处理算法在CPU上运行的第一图像处理程序,并获取利用数字图像处理算法在GPU上运行的第二图像处理程序;
程序运行单元42,用于运行第一和第二图像处理程序,分别对预设的测试用图像进行处理,以得到第一和第二图像处理程序处理测试用图像的运行时间;
分配确定单元43,用于根据第一和第二图像处理程序处理测试用图像的运行时间,确定CPU和GPU上图像分块分配方式;
算法接收单元44,用于接收用户输入的数字图像处理算法;
算法解析单元45,用于对数字图像处理算法进行解析,以获取数字图像处理算法中用于图像分块处理的可并行运行步骤;
步骤映射单元46,用于根据预设的CPU和GPU上图像分块分配方式,将可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;以及
第一程序获取单元47,用于根据计算机程序代码段获取利用数字图像处理算法的图像协同处理程序;以及
程序优化单元48,用于对图像协同处理程序进行优化。
其中,分配确定单元43包括分配确定子单元431,用于将CPU上处理的图像分块数量确定为将GPU上处理的图像分块数量确定为其中,S表示图像的总数据量或总分块数,α为第一和第二图像处理程序处理测试用图像的运行时间的比值,β为调节因子。优选地,β的取值范围为0.5≤β<1。
在本发明实施例中,CPU/GPU异构环境的图像协同处理程序获取系统的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考实施二的描述,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种CPU/GPU异构环境的图像协同处理程序获取方法,其特征在于,所述方法包括下述步骤:
接收用户输入的数字图像处理算法;
对所述数字图像处理算法进行解析,以获取所述数字图像处理算法中用于图像分块处理的可并行运行步骤;
根据预设的CPU和GPU上图像分块分配方式,将所述可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;
根据所述计算机程序代码段获取利用所述数字图像处理算法的图像协同处理程序。
2.如权利要求1所述的方法,其特征在于,根据预设的图像分块分配方式,将所述可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段的步骤之前,所述方法还包括:
获取利用所述数字图像处理算法在CPU上运行的第一图像处理程序,并获取利用所述数字图像处理算法在GPU上运行的第二图像处理程序;
运行所述第一和第二图像处理程序,分别对预设的测试用图像进行处理,以得到所述第一和第二图像处理程序处理所述测试用图像的运行时间;
根据所述第一和第二图像处理程序处理所述测试用图像的运行时间,确定所述CPU和GPU上图像分块分配方式。
3.如权利要求2所述的方法,其特征在于,根据所述第一和第二图像处理程序处理所述测试用图像的运行时间,确定所述CPU和GPU上图像分块分配方式的步骤,包括:
将所述CPU上处理的图像分块数量确定为将所述GPU上处理的图像分块数量确定为其中,S表示图像的总数据量或总分块数,α为所述第一和第二图像处理程序处理所述测试用图像的运行时间的比值,β为调节因子。
4.如权利要求3所述的方法,其特征在于,β的取值范围为0.5≤β<1。
5.如权利要求1所述的方法,其特征在于,根据所述计算机程序代码段获取利用所述数字图像处理算法的图像协同处理程序的步骤之后,所述方法还包括:
对所述图像协同处理程序进行优化。
6.一种CPU/GPU异构环境的图像协同处理程序获取系统,其特征在于,所述系统包括:
算法接收单元,用于接收用户输入的数字图像处理算法;
算法解析单元,用于对所述数字图像处理算法进行解析,以获取所述数字图像处理算法中用于图像分块处理的可并行运行步骤;
步骤映射单元,用于根据预设的CPU和GPU上图像分块分配方式,将所述可并行运行步骤映射为CPU和GPU上可并行运行的计算机程序代码段;以及
第一程序获取单元,用于根据所述计算机程序代码段获取利用所述数字图像处理算法的图像协同处理程序。
7.如权利要求6所述的系统,其特征在于,所述系统还包括:
第二程序获取单元,用于获取利用所述数字图像处理算法在CPU上运行的第一图像处理程序,并获取利用所述数字图像处理算法在GPU上运行的第二图像处理程序;
程序运行单元,用于运行所述第一和第二图像处理程序,分别对预设的测试用图像进行处理,以得到所述第一和第二图像处理程序处理所述测试用图像的运行时间;以及
分配确定单元,用于根据所述第一和第二图像处理程序处理所述测试用图像的运行时间,确定所述CPU和GPU上图像分块分配方式。
8.如权利要求7所述的系统,其特征在于,所述分配确定单元包括:
分配确定子单元,用于将所述CPU上处理的图像分块数量确定为将所述GPU上处理的图像分块数量确定为其中,S表示图像的总数据量或总分块数,α为所述第一和第二图像处理程序处理所述测试用图像的运行时间的比值,β为调节因子。
9.如权利要求8所述的系统,其特征在于,β的取值范围为0.5≤β<1。
10.如权利要求6所述的系统,其特征在于,所述系统还包括:
程序优化单元,用于对所述图像协同处理程序进行优化。
CN201710113952.8A 2017-02-28 2017-02-28 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统 Pending CN106951322A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710113952.8A CN106951322A (zh) 2017-02-28 2017-02-28 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710113952.8A CN106951322A (zh) 2017-02-28 2017-02-28 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统

Publications (1)

Publication Number Publication Date
CN106951322A true CN106951322A (zh) 2017-07-14

Family

ID=59466609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710113952.8A Pending CN106951322A (zh) 2017-02-28 2017-02-28 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统

Country Status (1)

Country Link
CN (1) CN106951322A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945098A (zh) * 2017-11-24 2018-04-20 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN108198124A (zh) * 2017-12-27 2018-06-22 上海联影医疗科技有限公司 医学图像处理方法、装置、计算机设备和存储介质
CN109388428A (zh) * 2017-08-11 2019-02-26 华为技术有限公司 图层遍历方法、控制装置及数据处理系统
CN109871352A (zh) * 2017-12-01 2019-06-11 北京搜狗科技发展有限公司 一种协同计算方法及装置
CN109959887A (zh) * 2017-12-26 2019-07-02 深圳先进技术研究院 一种三维磁共振成像重建方法、装置、应用及可读介质
CN111352727A (zh) * 2018-12-20 2020-06-30 中国科学院计算机网络信息中心 一种应用于图像混合集群处理系统的图像处理方法
CN111489281A (zh) * 2020-04-09 2020-08-04 常州奥创医疗科技有限公司 一种基于gpu和cpu协同运算的检测方法
CN111610976A (zh) * 2020-04-08 2020-09-01 曙光信息产业(北京)有限公司 异构应用移植方法、装置和计算机设备
CN111625358A (zh) * 2020-05-25 2020-09-04 浙江大华技术股份有限公司 一种资源分配方法、装置、电子设备及存储介质
CN111984417A (zh) * 2020-08-26 2020-11-24 展讯通信(天津)有限公司 用于移动终端的图像处理方法及装置、存储介质、终端
CN113362219A (zh) * 2021-07-02 2021-09-07 展讯通信(天津)有限公司 一种图像数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080240236A1 (en) * 2007-03-30 2008-10-02 Kabushiki Kaisha Toshiba Information processing apparatus
CN104331858A (zh) * 2014-11-24 2015-02-04 厦门美图之家科技有限公司 一种同时利用cpu和gpu进行图像处理的加速方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080240236A1 (en) * 2007-03-30 2008-10-02 Kabushiki Kaisha Toshiba Information processing apparatus
CN104331858A (zh) * 2014-11-24 2015-02-04 厦门美图之家科技有限公司 一种同时利用cpu和gpu进行图像处理的加速方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WEN HUANG等: "A CPU-GPGPU Scheduler Based on Data Transmission Bandwidth of Workload A CPU-GPGPU Scheduler Based on Data Transmission Bandwidth of Workload", 《2012 13TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED COMPUTING, APPLICATIONS AND TECHNOLOGIES》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109388428B (zh) * 2017-08-11 2021-05-04 华为技术有限公司 图层遍历方法、控制装置及数据处理系统
CN109388428A (zh) * 2017-08-11 2019-02-26 华为技术有限公司 图层遍历方法、控制装置及数据处理系统
CN107945098B (zh) * 2017-11-24 2022-03-01 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN107945098A (zh) * 2017-11-24 2018-04-20 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN109871352A (zh) * 2017-12-01 2019-06-11 北京搜狗科技发展有限公司 一种协同计算方法及装置
CN109959887A (zh) * 2017-12-26 2019-07-02 深圳先进技术研究院 一种三维磁共振成像重建方法、装置、应用及可读介质
CN108198124A (zh) * 2017-12-27 2018-06-22 上海联影医疗科技有限公司 医学图像处理方法、装置、计算机设备和存储介质
CN108198124B (zh) * 2017-12-27 2023-04-25 上海联影医疗科技股份有限公司 医学图像处理方法、装置、计算机设备和存储介质
CN111352727A (zh) * 2018-12-20 2020-06-30 中国科学院计算机网络信息中心 一种应用于图像混合集群处理系统的图像处理方法
CN111352727B (zh) * 2018-12-20 2023-03-31 中国科学院计算机网络信息中心 一种应用于图像混合集群处理系统的图像处理方法
CN111610976A (zh) * 2020-04-08 2020-09-01 曙光信息产业(北京)有限公司 异构应用移植方法、装置和计算机设备
CN111489281A (zh) * 2020-04-09 2020-08-04 常州奥创医疗科技有限公司 一种基于gpu和cpu协同运算的检测方法
CN111625358A (zh) * 2020-05-25 2020-09-04 浙江大华技术股份有限公司 一种资源分配方法、装置、电子设备及存储介质
CN111625358B (zh) * 2020-05-25 2023-06-20 浙江大华技术股份有限公司 一种资源分配方法、装置、电子设备及存储介质
CN111984417A (zh) * 2020-08-26 2020-11-24 展讯通信(天津)有限公司 用于移动终端的图像处理方法及装置、存储介质、终端
WO2022042587A1 (zh) * 2020-08-26 2022-03-03 展讯通信(天津)有限公司 用于移动终端的图像处理方法及装置、存储介质、终端
CN113362219A (zh) * 2021-07-02 2021-09-07 展讯通信(天津)有限公司 一种图像数据处理方法及装置
CN113362219B (zh) * 2021-07-02 2023-08-11 展讯通信(天津)有限公司 一种图像数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN106951322A (zh) 一种cpu/gpu异构环境的图像协同处理程序获取方法及系统
CN105022670B (zh) 一种云计算平台中的异构分布式任务处理系统及其处理方法
Li et al. Quantum supremacy circuit simulation on Sunway TaihuLight
WO2020108303A1 (zh) 一种基于异构计算的任务处理方法及软硬件框架系统
CN106095588B (zh) 基于gpgpu平台的cdvs提取过程加速方法
US20140333638A1 (en) Power-efficient nested map-reduce execution on a cloud of heterogeneous accelerated processing units
CN106991011A (zh) 一种针对大数据任务处理的基于cpu多线程与gpu多粒度并行及协同优化的方法
CN103049241B (zh) 一种提高cpu+gpu异构装置计算性能的方法
WO2014197384A1 (en) Efficient execution of graph-based programs
CN106547627A (zh) 一种Spark MLlib数据处理加速的方法及系统
CN107657599B (zh) 基于混合粒度划分和动态负载分配的遥感图像融合系统并行实现方法
CN106055311A (zh) 基于流水线多线程的MapReduce任务并行化方法
CN110751676A (zh) 一种基于目标检测的异构计算系统、方法和可读存储介质
US20100251223A1 (en) System and method for the distribution of a program among cooperating processing elements
CN110659278A (zh) 基于cpu-gpu异构架构的图数据分布式处理系统
CN102253919A (zh) 基于gpu和cpu协同运算的并行数值模拟方法和系统
CN102298567A (zh) 一种集成中央运算和图形加速的移动处理器架构
CN104317751A (zh) 一种gpu上数据流处理系统及其数据流处理方法
CN109657794A (zh) 一种基于指令队列的分布式深度神经网络性能建模方法
Poli et al. Voice command recognition with dynamic time warping (dtw) using graphics processing units (gpu) with compute unified device architecture (cuda)
Wang et al. Energy and performance characterization of mobile heterogeneous computing
CN112241289A (zh) 一种文本数据的处理方法和电子设备
US11817117B2 (en) Speaker adaptive end of speech detection for conversational AI applications
US11714992B1 (en) Neural network processing based on subgraph recognition
Liu et al. Multivariate modeling and two-level scheduling of analytic queries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170714