CN112463388B - 一种基于多线程的sgrt数据处理方法及装置 - Google Patents

一种基于多线程的sgrt数据处理方法及装置 Download PDF

Info

Publication number
CN112463388B
CN112463388B CN202011430585.2A CN202011430585A CN112463388B CN 112463388 B CN112463388 B CN 112463388B CN 202011430585 A CN202011430585 A CN 202011430585A CN 112463388 B CN112463388 B CN 112463388B
Authority
CN
China
Prior art keywords
data
processed
processing
dividing
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011430585.2A
Other languages
English (en)
Other versions
CN112463388A (zh
Inventor
蓝培钦
龚强
蔡博凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Klarity Medical & Equipment Gz Co ltd
Original Assignee
Klarity Medical & Equipment Gz Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Klarity Medical & Equipment Gz Co ltd filed Critical Klarity Medical & Equipment Gz Co ltd
Priority to CN202011430585.2A priority Critical patent/CN112463388B/zh
Publication of CN112463388A publication Critical patent/CN112463388A/zh
Application granted granted Critical
Publication of CN112463388B publication Critical patent/CN112463388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/40ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Urology & Nephrology (AREA)
  • Public Health (AREA)
  • Surgery (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Multi Processors (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多线程的SGRT数据处理方法及装置,应用于装有GPU内核的数据处理系统,所述方法包括:在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;按照所述处理容量生成对应的运行线程,得到多个运行线程;确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。本发明可以实现GPU内核的串联并行运算,从而提高数据的处理效率。

Description

一种基于多线程的SGRT数据处理方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于多线程的SGRT数据处理方法及装置。
背景技术
人体体表追踪SGRT(结构影像引导的放疗),广泛应用于治疗及检查过程中患者的定位摆放指导、对治疗过程中患者体位姿态变化的监控和SGRT中的呼吸门控功能,用于训练患者呼吸模式,监控患者的呼吸状态,并保障在最佳呼吸区间进行放疗照射
由于SGRT人体体表追踪是一个动态监控的过程,所以对实时性要求高。若出现延迟,会导致照射位置与实际位置出现误差,降低治疗效果。为了解决上述问题,现有技术是通过GPU进行数据处理,从而缩短数据处理时间
但由于GPU在处理数据时往往是单任务进行,而GPU本身是多内核,导致GPU在数据处理时,往往只使用一个内核,多个内核处于闲置状态,大大浪费了GPU的内核资源,而且在一个内核在处理过程中,其它内核需要排队等待,也增加了数据处理时间,降低了数据处理效率。
发明内容
本发明提出一种方法及装置,所述方法可以解决因GPU的单任务数据方式导致数据的处理时间长和处理效率低的技术问题。
本发明一实施例提供了一种基于多线程的SGRT数据处理方法,应用于装有GPU内核的数据处理系统,所述方法包括:
在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;
获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;
按照所述处理容量生成对应的运行线程,得到多个运行线程;
确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。
进一步的,所述将所述待处理数据分别划分成多个最小待处理数据块,包括:
确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间;
将所述总处理时间除以所述最长处理时间得到划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述将所述待处理数据分别划分成多个最小待处理数据块,包括:
获取所述待处理数据的循环体个数,以所述循环体个数为划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述数据处理系统还设有宿主机内存池,所述宿主机内存池与所述GPU内核连接;
在所述确定所述多个最小待处理数据块的处理顺序的步骤前,所述方法还包括:
获取所述GPU内核内存储的在先运算数据,所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据;
将所述在先运算数据存储在宿主机内存池中,以使所述宿主机内存池寄存所述在先运算数据。
进一步的,所述数据处理系统采用异步通信方式发送所述多个运行线程至所述GPU内核。
相应的,本发明一实施例还提供了一种基于多线程的SGRT数据处理装置,应用于装有GPU内核的数据处理系统,所述装置包括:
划分模块,用于在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;
获取模块,用于获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;
生成模块,用于按照所述处理容量生成对应的运行线程,得到多个运行线程;
发送模块,用于确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。
进一步的,所述划分模块还用于:
确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间;
将所述总处理时间除以所述最长处理时间得到划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述划分模块还用于:
获取所述待处理数据的循环体个数,以所述循环体个数为划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述数据处理系统还设有宿主机内存池,所述宿主机内存池与所述GPU内核连接;
所述装置还包括:
先行模块,用于获取所述GPU内核内存储的在先运算数据,所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据;
存储模块,用于将所述在先运算数据存储在宿主机内存池中,以使所述宿主机内存池寄存所述在先运算数据。
进一步的,所述数据处理系统采用异步通信方式发送线程至所述GPU内核。
相应的,本发明一实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上所述的基于多线程的SGRT数据处理方法。
相应的,本发明一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上所述的基于多线程的SGRT数据处理方法。
相比于现有技术,本发明实施例提供的基于多线程的SGRT数据处理方法及装置,其有益效果在于:本发明可以将待处理数据划分成多个最小待处理数据块,从而可以对每个最小待处理数据块按照其运算方式或运算要求生成对应的运行线程,再将多个运行线程分别发送给GPU,从而实现GPU的串联并行运算,大大提高了数据的处理效率,同时有效合理地分配GPU资源,提高资源利用率,减少资源浪费。
附图说明
图1是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的流程示意图;
图2是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的数据暂存示意图;
图3是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的线程分配示意图;
图4是本发明一实施例提供的一种装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于SGRT人体体表追踪是一个动态监控的过程,所以对实时性要求高。若出现延迟,会导致照射位置与实际位置出现误差,降低治疗效果。为了解决上述问题,现有技术是通过GPU进行数据处理,从而缩短数据处理时间
但由于GPU在处理数据时往往是单任务进行,而GPU本身是多内核,导致GPU在数据处理时,往往只使用一个内核,GPU的大多数处理内核处于闲置状态,大大浪费了GPU的内核资源,而且在一个内核在处理过程中,其它内核需要排队等待,也增加了数据处理时间,降低了数据处理效率。
为了解决上述问题,下面将通过以下具体的实施例对本申请实施例提供的一种方法进行详细介绍和说明。
参照图1,示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的流程示意图,在本实施例中,所述基于多线程的SGRT数据处理方法可以应用于装有GPU内核的数据处理系统。所述数据处理系统设有宿主机内存池,所述宿主机内存池与所述GPU内核连接。
其中,作为示例的,所述基于多线程的SGRT数据处理方法可以包括:
S11、在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块。
该待处理数据为大量由SGRT采集需要到GPU来进行3D数据计算的数据。由于数据量大,同时交由一个GPU计算的效率低。可以先将待处理数据划分成多个最小待处理数据块。再由GPU串联并行处理每个最小待处理数据块,从而可以提高处理效率。
为了能尽可能地将划分的多个最小待处理数据块的数量与GPU的内核数量相同,从而让更多的内核可以同时处理多个最小待处理数据块,其中,作为示例的,所述步骤S11可以包括以下子步骤:
子步骤S111、确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间。
该总处理时间为GPU在单线程情况下处理待处理数据时所需要的总时间。该最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间。例如,需要处理乘法、除法、加法三种运算,三种运算分别对应的运算时间为1秒、2秒和3秒,则GPU的最长处理时间为3秒。
子步骤S112、将所述总处理时间除以所述最长处理时间得到划分数量。
在本实施例中,可以将总处理时间除以最长处理时间得到划分数量。
例如,总处理时间60秒,最长处理时间为5秒,划分数量=60/5=12。
子步骤S113、按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
接着数据处理系统可以按照划分数量将待处理数据划分成对应数量的最小待处理数据块。
例如划分数量等于12,则可以将待处理数据划分成12个最小待处理数据块。
将待处理数据划分成最小待处理数据块既可以让更多的GPU参与运算操作,提高运算效率,避免资源浪费,同时也可以统一GPU的处理时间,让数据处理形成流水线式操作,进一步提高处理效率。
在另一可选的实施例中,由于SGRT采集的数据都是大量需要循环计算的数据,而循环计算的数据中可能需要用到在先循环计算得到的数据,为了不打破原有的计算结构,其中,作为示例的,所述步骤S11还可以包括以下子步骤:
子步骤S114、获取所述待处理数据的循环体个数,以所述循环体个数为划分数量。
该循环体个数为计算或处理该待处理数据时所需要的执行循环类型的个数。
例如,该待处理数据需要的执行循环类型包括加分循环和乘法循环。则该循环体个数为2。
子步骤S115、按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
再按照循环体个数将待处理数据划分成多个最小待处理数据块。例如,循环体个数为5,可以将待处理数据划分成5个最小待处理数据块。
按照循环体个数划分待处理数据,可以在避免破坏待处理数据原有的计算结构的同时简化待处理数据,提高数据处理的效率。
S12、获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量。
该处理数量为最小待处理数据块的划分数量,该处理容量为处理该最小待处理数据块所需要的内存容量。
在划分多个最小待处理数据块后,可以获取多个最小待处理数据块的处理数量以及每个待处理数据块的处理容量,从而可以方便分配和安排GPU进行运算处理。
S13、按照所述处理容量生成对应的运行线程,得到多个运行线程。
由于每个最小待处理数据块需要进行的运算方式不同,而每个容量对应的数据也不同,所以可以根据其容量确定对应的运算方式,根据该运算方式生成对应的运行线程。
同时由于最小待处理数据块包括多个,需要对多个最小待处理数据块均进行运算处理,所以需要生成多个运行线程,得到多个运行线程。
在实际操作中,可以按照每个最小待处理数据块对应的运算方式,生成该最小待处理数据块对应运行线程,得到多个运行线程。
由于GPU在进出数据时,都必须是先释放了所有GPU内存,然后才能从新分配给新数据,即使只是一小部分被占用的内存也需要先释放后再分配。大大限制了GPU的通过率。
为了解决上述问题,本发明引入了宿主机内存池。
S14、获取所述GPU内核内存储的在先运算数据,所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据。
该在先运算数据为GPU执行完上一个运算操作后,储存在GPU内的数据。
由于本发明的GPU在处理数据时是串联并行处理,在执行下一个运算操作的GPU的运算未执行完之前,前一个GPU的数据会暂存起来。
S15、将所述在先运算数据存储在宿主机内存池中,以使所述宿主机内存池寄存所述在先运算数据。
在获取GPU的在先运算数据后,可以将再先运算数据存储在宿主机内存池中,从而通过宿主机内存池暂时存储该在先运算数据。
通过宿主机内存池可以提高GPU内存的分配与释放,使得在GPU上数据通过率大为提高,从而提高GPU的运算效率。
参照图2,示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的数据暂存示意图。
S16、确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。
由于待处理数据为串联并行处理,需要进行多种不同类型的运算,该处理顺序为待处理数据需要执行的多种相同或不同运算的顺序。
在生成了多个运行线程以及清理了GPU的内存后,可以获取多个最小待处理数据块的处理顺序。具体地,可以获取待处理数据的多种运算类型及其运算顺序得到处理顺序。
接着按照处理顺序排列多个运行线程,并将多个运行线程分别发送给多个GPU,使得每个GPU对应运行一个运行线程。由GPU按照运行线程的要求对最小待处理数据块执行对应的运算。
参照图3,示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的线程分配示意图。
另外,由于每个GPU处理的运算类型不同,处理的时间有可能不同,因此,在运行完一次后,需要再次获取运行线程的时间也不同。为了能提高数据处理系统与多个GPU之间的通信效率。在本实施例中,所述数据处理系统采用异步通信方式发送线程至所述GPU内核。
在本实施例中,本发明实施例提供了一种基于多线程的SGRT数据处理方法,其有益效果在于:本发明可以将待处理数据划分成多个最小待处理数据块,从而可以对每个最小待处理数据块按照其运算方式或运算要求生成对应的运行线程,再将多个运行线程分别发送给多个GPU,从而实现多个GPU的串联并行运算,大大提高了数据的处理效率,同时有效合理地分配GPU资源,提高资源利用率,减少资源浪费。
本发明实施例还提供了一种基于多线程的SGRT数据处理装置,参见图4,示出了本发明一实施例提供的一种基于多线程的SGRT数据处理装置的结构示意图。
所述基于多线程的SGRT数据处理装置可以应用于装有GPU内核的数据处理系统
其中,作为示例的,所述基于多线程的SGRT数据处理装置可以包括:
划分模块401,用于在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;
获取模块402,用于获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;
生成模块403,用于按照所述处理容量生成对应的运行线程,得到多个运行线程;
发送模块404,用于确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。
进一步的,所述划分模块还用于:
确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间;
将所述总处理时间除以所述最长处理时间得到划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述划分模块还用于:
获取所述待处理数据的循环体个数,以所述循环体个数为划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
进一步的,所述数据处理系统还设有宿主机内存池,所述宿主机内存池与所述GPU内核连接;
所述装置还包括:
先行模块,用于获取所述GPU内核内存储的在先运算数据,所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据;
存储模块,用于将所述在先运算数据存储在宿主机内存池中,以使所述宿主机内存池寄存所述在先运算数据。
进一步的,所述数据处理系统采用异步通信方式发送线程至所述GPU内核。
进一步的,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的基于多线程的SGRT数据处理方法。
进一步的,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述实施例所述的基于多线程的SGRT数据处理方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (6)

1.一种基于多线程的SGRT数据处理方法,其特征在于,应用于装有GPU内核的数据处理系统,所述方法包括:
在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;
获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;
按照所述处理容量生成对应的运行线程,得到多个运行线程;
确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块;
所述将所述待处理数据分别划分成多个最小待处理数据块,包括:
确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间;
将所述总处理时间除以所述最长处理时间得到划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块;
或者;
所述将所述待处理数据分别划分成多个最小待处理数据块,包括:
获取所述待处理数据的循环体个数,以所述循环体个数为划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
2.根据权利要求1所述的基于多线程的SGRT数据处理方法,其特征在于,所述数据处理系统还设有宿主机内存池,所述宿主机内存池与所述GPU内核连接;
在所述确定所述多个最小待处理数据块的处理顺序的步骤前,所述方法还包括:
获取所述GPU内核内存储的在先运算数据,所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据;
将所述在先运算数据存储在宿主机内存池中,以使所述宿主机内存池寄存所述在先运算数据。
3.根据权利要求1所述的基于多线程的SGRT数据处理方法,其特征在于,所述数据处理系统采用异步通信方式发送所述多个运行线程至所述GPU内核。
4.一种基于多线程的SGRT数据处理装置,其特征在于,应用于装有GPU内核的数据处理系统,所述装置包括:
划分模块,用于在接收到待处理数据时,将所述待处理数据分别划分成多个最小待处理数据块;
获取模块,用于获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量;
生成模块,用于按照所述处理容量生成对应的运行线程,得到多个运行线程;
发送模块,用于确定所述多个最小待处理数据块的处理顺序,按照所述处理顺序将所述多个运行线程发送至所述GPU内核,以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块;
所述划分模块还用于:
确定总处理时间和最长处理时间,所述总处理时间为GPU内核单线程处理所述待处理数据的时间,所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间;
将所述总处理时间除以所述最长处理时间得到划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块;
所述划分模块还用于:
获取所述待处理数据的循环体个数,以所述循环体个数为划分数量;
按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。
5.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3任意一项所述的基于多线程的SGRT数据处理方法。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-3任意一项所述的基于多线程的SGRT数据处理方法。
CN202011430585.2A 2020-12-09 2020-12-09 一种基于多线程的sgrt数据处理方法及装置 Active CN112463388B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011430585.2A CN112463388B (zh) 2020-12-09 2020-12-09 一种基于多线程的sgrt数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011430585.2A CN112463388B (zh) 2020-12-09 2020-12-09 一种基于多线程的sgrt数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112463388A CN112463388A (zh) 2021-03-09
CN112463388B true CN112463388B (zh) 2023-03-10

Family

ID=74800432

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011430585.2A Active CN112463388B (zh) 2020-12-09 2020-12-09 一种基于多线程的sgrt数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112463388B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013107819A1 (fr) * 2012-01-17 2013-07-25 Thales Procédé d'optimisation de traitement parallèle de données sur une plateforme matérielle.
CN103784158A (zh) * 2012-10-29 2014-05-14 株式会社日立医疗器械 Ct 装置及ct 图像生成方法
CN107608769A (zh) * 2017-09-13 2018-01-19 郑州云海信息技术有限公司 一种数据处理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103427844B (zh) * 2013-07-26 2016-03-02 华中科技大学 一种基于gpu和cpu混合平台的高速无损数据压缩方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013107819A1 (fr) * 2012-01-17 2013-07-25 Thales Procédé d'optimisation de traitement parallèle de données sur une plateforme matérielle.
CN103784158A (zh) * 2012-10-29 2014-05-14 株式会社日立医疗器械 Ct 装置及ct 图像生成方法
CN107608769A (zh) * 2017-09-13 2018-01-19 郑州云海信息技术有限公司 一种数据处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于GPU的并行人脸检测方法研究;龚强等;《长江大学学报(自科版)》;20160905(第25期);全文 *

Also Published As

Publication number Publication date
CN112463388A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN110297661B (zh) 基于amp构架dsp操作系统的并行计算方法、系统及介质
Jo et al. Accelerating LINPACK with MPI-OpenCL on clusters of multi-GPU nodes
US11816061B2 (en) Dynamic allocation of arithmetic logic units for vectorized operations
CN106293947B (zh) 虚拟化云环境下gpu-cpu混合资源分配系统和方法
CN115033356B (zh) 一种基于异构可重构的动态资源调度方法及系统
Michailidis et al. Implementing parallel LU factorization with pipelining on a multicore using OpenMP
CN110162398B (zh) 一种疾病分析模型的调度方法、装置及终端设备
CN112463388B (zh) 一种基于多线程的sgrt数据处理方法及装置
Thomas et al. Dynamic optimizations in gpu using roofline model
Tumeo et al. A dual-priority real-time multiprocessor system on fpga for automotive applications
US9760969B2 (en) Graphic processing system and method thereof
US9268601B2 (en) API for launching work on a processor
CN116107634A (zh) 指令控制方法、装置及相关设备
CN110969565A (zh) 图像处理的方法和装置
CN114911610A (zh) 一种任务编译方法、装置和编译器
CN111400013B (zh) 一种多核处理器的数据流的处理方法及系统
CN113076190A (zh) 一种基于cpu与gpu协作的计算方法
CN113485845A (zh) 一种多线程人工智能资源分配方法及装置
Aghapour Integrated ARM big
Ho et al. Towards FPGA-assisted spark: An SVM training acceleration case study
EP0481458A2 (en) High speed synchronous processing system for executing parallel processing of programs
CN111090508A (zh) 一种基于OpenCL的异构协同并行计算中设备间动态任务调度方法
CN117632520B (zh) 基于申威众核处理器的主从核监测交互的计算量调度方法
US20240061711A1 (en) Computing device, operation method of computing device and system on chip
CN113886057B (zh) 异构众核上基于剖析技术以及数据流信息的动态资源调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant