CN112463388B

CN112463388B - 一种基于多线程的sgrt数据处理方法及装置

Info

Publication number: CN112463388B
Application number: CN202011430585.2A
Authority: CN
Inventors: 蓝培钦; 龚强; 蔡博凡
Original assignee: Klarity Medical & Equipment Gz Co ltd
Current assignee: Klarity Medical & Equipment Gz Co ltd
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2023-03-10
Anticipated expiration: 2040-12-09
Also published as: CN112463388A

Abstract

本发明公开了一种基于多线程的SGRT数据处理方法及装置，应用于装有GPU内核的数据处理系统，所述方法包括：在接收到待处理数据时，将所述待处理数据分别划分成多个最小待处理数据块；获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量；按照所述处理容量生成对应的运行线程，得到多个运行线程；确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。本发明可以实现GPU内核的串联并行运算，从而提高数据的处理效率。

Description

一种基于多线程的SGRT数据处理方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于多线程的SGRT数据处理方法及装置。

背景技术

人体体表追踪SGRT(结构影像引导的放疗)，广泛应用于治疗及检查过程中患者的定位摆放指导、对治疗过程中患者体位姿态变化的监控和SGRT中的呼吸门控功能，用于训练患者呼吸模式，监控患者的呼吸状态，并保障在最佳呼吸区间进行放疗照射

由于SGRT人体体表追踪是一个动态监控的过程，所以对实时性要求高。若出现延迟，会导致照射位置与实际位置出现误差，降低治疗效果。为了解决上述问题，现有技术是通过GPU进行数据处理，从而缩短数据处理时间

但由于GPU在处理数据时往往是单任务进行，而GPU本身是多内核，导致GPU在数据处理时，往往只使用一个内核，多个内核处于闲置状态，大大浪费了GPU的内核资源，而且在一个内核在处理过程中，其它内核需要排队等待，也增加了数据处理时间，降低了数据处理效率。

发明内容

本发明提出一种方法及装置，所述方法可以解决因GPU的单任务数据方式导致数据的处理时间长和处理效率低的技术问题。

本发明一实施例提供了一种基于多线程的SGRT数据处理方法，应用于装有GPU内核的数据处理系统，所述方法包括：

在接收到待处理数据时，将所述待处理数据分别划分成多个最小待处理数据块；

获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量；

按照所述处理容量生成对应的运行线程，得到多个运行线程；

确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。

进一步的，所述将所述待处理数据分别划分成多个最小待处理数据块，包括：

确定总处理时间和最长处理时间，所述总处理时间为GPU内核单线程处理所述待处理数据的时间，所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间；

将所述总处理时间除以所述最长处理时间得到划分数量；

按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。

获取所述待处理数据的循环体个数，以所述循环体个数为划分数量；

进一步的，所述数据处理系统还设有宿主机内存池，所述宿主机内存池与所述GPU内核连接；

在所述确定所述多个最小待处理数据块的处理顺序的步骤前，所述方法还包括：

获取所述GPU内核内存储的在先运算数据，所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据；

将所述在先运算数据存储在宿主机内存池中，以使所述宿主机内存池寄存所述在先运算数据。

进一步的，所述数据处理系统采用异步通信方式发送所述多个运行线程至所述GPU内核。

相应的，本发明一实施例还提供了一种基于多线程的SGRT数据处理装置，应用于装有GPU内核的数据处理系统，所述装置包括：

划分模块，用于在接收到待处理数据时，将所述待处理数据分别划分成多个最小待处理数据块；

获取模块，用于获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量；

生成模块，用于按照所述处理容量生成对应的运行线程，得到多个运行线程；

发送模块，用于确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。

进一步的，所述划分模块还用于：

将所述总处理时间除以所述最长处理时间得到划分数量；

进一步的，所述划分模块还用于：

所述装置还包括：

先行模块，用于获取所述GPU内核内存储的在先运算数据，所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据；

存储模块，用于将所述在先运算数据存储在宿主机内存池中，以使所述宿主机内存池寄存所述在先运算数据。

进一步的，所述数据处理系统采用异步通信方式发送线程至所述GPU内核。

相应的，本发明一实施例还提供了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如上所述的基于多线程的SGRT数据处理方法。

相应的，本发明一实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如上所述的基于多线程的SGRT数据处理方法。

相比于现有技术，本发明实施例提供的基于多线程的SGRT数据处理方法及装置，其有益效果在于：本发明可以将待处理数据划分成多个最小待处理数据块，从而可以对每个最小待处理数据块按照其运算方式或运算要求生成对应的运行线程，再将多个运行线程分别发送给GPU，从而实现GPU的串联并行运算，大大提高了数据的处理效率，同时有效合理地分配GPU资源，提高资源利用率，减少资源浪费。

附图说明

图1是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的流程示意图；

图2是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的数据暂存示意图；

图3是本发明一实施例提供的一种基于多线程的SGRT数据处理方法的线程分配示意图；

图4是本发明一实施例提供的一种装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

但由于GPU在处理数据时往往是单任务进行，而GPU本身是多内核，导致GPU在数据处理时，往往只使用一个内核，GPU的大多数处理内核处于闲置状态，大大浪费了GPU的内核资源，而且在一个内核在处理过程中，其它内核需要排队等待，也增加了数据处理时间，降低了数据处理效率。

为了解决上述问题，下面将通过以下具体的实施例对本申请实施例提供的一种方法进行详细介绍和说明。

参照图1，示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的流程示意图，在本实施例中，所述基于多线程的SGRT数据处理方法可以应用于装有GPU内核的数据处理系统。所述数据处理系统设有宿主机内存池，所述宿主机内存池与所述GPU内核连接。

其中，作为示例的，所述基于多线程的SGRT数据处理方法可以包括：

S11、在接收到待处理数据时，将所述待处理数据分别划分成多个最小待处理数据块。

该待处理数据为大量由SGRT采集需要到GPU来进行3D数据计算的数据。由于数据量大，同时交由一个GPU计算的效率低。可以先将待处理数据划分成多个最小待处理数据块。再由GPU串联并行处理每个最小待处理数据块，从而可以提高处理效率。

为了能尽可能地将划分的多个最小待处理数据块的数量与GPU的内核数量相同，从而让更多的内核可以同时处理多个最小待处理数据块，其中，作为示例的，所述步骤S11可以包括以下子步骤：

子步骤S111、确定总处理时间和最长处理时间，所述总处理时间为GPU内核单线程处理所述待处理数据的时间，所述最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间。

该总处理时间为GPU在单线程情况下处理待处理数据时所需要的总时间。该最长处理时间为GPU处理待处理数据时所需要使用的多种运算类型中耗时最长的运算类型对应的时间。例如，需要处理乘法、除法、加法三种运算，三种运算分别对应的运算时间为1秒、2秒和3秒，则GPU的最长处理时间为3秒。

子步骤S112、将所述总处理时间除以所述最长处理时间得到划分数量。

在本实施例中，可以将总处理时间除以最长处理时间得到划分数量。

例如，总处理时间60秒，最长处理时间为5秒，划分数量＝60/5＝12。

子步骤S113、按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。

接着数据处理系统可以按照划分数量将待处理数据划分成对应数量的最小待处理数据块。

例如划分数量等于12，则可以将待处理数据划分成12个最小待处理数据块。

将待处理数据划分成最小待处理数据块既可以让更多的GPU参与运算操作，提高运算效率，避免资源浪费，同时也可以统一GPU的处理时间，让数据处理形成流水线式操作，进一步提高处理效率。

在另一可选的实施例中，由于SGRT采集的数据都是大量需要循环计算的数据，而循环计算的数据中可能需要用到在先循环计算得到的数据，为了不打破原有的计算结构，其中，作为示例的，所述步骤S11还可以包括以下子步骤：

子步骤S114、获取所述待处理数据的循环体个数，以所述循环体个数为划分数量。

该循环体个数为计算或处理该待处理数据时所需要的执行循环类型的个数。

例如，该待处理数据需要的执行循环类型包括加分循环和乘法循环。则该循环体个数为2。

子步骤S115、按照所述划分数量将所述待处理数据划分成多个最小待处理数据块。

再按照循环体个数将待处理数据划分成多个最小待处理数据块。例如，循环体个数为5，可以将待处理数据划分成5个最小待处理数据块。

按照循环体个数划分待处理数据，可以在避免破坏待处理数据原有的计算结构的同时简化待处理数据，提高数据处理的效率。

S12、获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量。

该处理数量为最小待处理数据块的划分数量，该处理容量为处理该最小待处理数据块所需要的内存容量。

在划分多个最小待处理数据块后，可以获取多个最小待处理数据块的处理数量以及每个待处理数据块的处理容量，从而可以方便分配和安排GPU进行运算处理。

S13、按照所述处理容量生成对应的运行线程，得到多个运行线程。

由于每个最小待处理数据块需要进行的运算方式不同，而每个容量对应的数据也不同，所以可以根据其容量确定对应的运算方式，根据该运算方式生成对应的运行线程。

同时由于最小待处理数据块包括多个，需要对多个最小待处理数据块均进行运算处理，所以需要生成多个运行线程，得到多个运行线程。

在实际操作中，可以按照每个最小待处理数据块对应的运算方式，生成该最小待处理数据块对应运行线程，得到多个运行线程。

由于GPU在进出数据时，都必须是先释放了所有GPU内存，然后才能从新分配给新数据，即使只是一小部分被占用的内存也需要先释放后再分配。大大限制了GPU的通过率。

为了解决上述问题，本发明引入了宿主机内存池。

S14、获取所述GPU内核内存储的在先运算数据，所述在先运算数据为GPU对在先待处理数据块完成数据处理后暂存的数据。

该在先运算数据为GPU执行完上一个运算操作后，储存在GPU内的数据。

由于本发明的GPU在处理数据时是串联并行处理，在执行下一个运算操作的GPU的运算未执行完之前，前一个GPU的数据会暂存起来。

S15、将所述在先运算数据存储在宿主机内存池中，以使所述宿主机内存池寄存所述在先运算数据。

在获取GPU的在先运算数据后，可以将再先运算数据存储在宿主机内存池中，从而通过宿主机内存池暂时存储该在先运算数据。

通过宿主机内存池可以提高GPU内存的分配与释放，使得在GPU上数据通过率大为提高，从而提高GPU的运算效率。

参照图2，示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的数据暂存示意图。

S16、确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。

由于待处理数据为串联并行处理，需要进行多种不同类型的运算，该处理顺序为待处理数据需要执行的多种相同或不同运算的顺序。

在生成了多个运行线程以及清理了GPU的内存后，可以获取多个最小待处理数据块的处理顺序。具体地，可以获取待处理数据的多种运算类型及其运算顺序得到处理顺序。

接着按照处理顺序排列多个运行线程，并将多个运行线程分别发送给多个GPU，使得每个GPU对应运行一个运行线程。由GPU按照运行线程的要求对最小待处理数据块执行对应的运算。

参照图3，示出了本发明一实施例提供的一种基于多线程的SGRT数据处理方法的线程分配示意图。

另外，由于每个GPU处理的运算类型不同，处理的时间有可能不同，因此，在运行完一次后，需要再次获取运行线程的时间也不同。为了能提高数据处理系统与多个GPU之间的通信效率。在本实施例中，所述数据处理系统采用异步通信方式发送线程至所述GPU内核。

在本实施例中，本发明实施例提供了一种基于多线程的SGRT数据处理方法，其有益效果在于：本发明可以将待处理数据划分成多个最小待处理数据块，从而可以对每个最小待处理数据块按照其运算方式或运算要求生成对应的运行线程，再将多个运行线程分别发送给多个GPU，从而实现多个GPU的串联并行运算，大大提高了数据的处理效率，同时有效合理地分配GPU资源，提高资源利用率，减少资源浪费。

本发明实施例还提供了一种基于多线程的SGRT数据处理装置，参见图4，示出了本发明一实施例提供的一种基于多线程的SGRT数据处理装置的结构示意图。

所述基于多线程的SGRT数据处理装置可以应用于装有GPU内核的数据处理系统

其中，作为示例的，所述基于多线程的SGRT数据处理装置可以包括：

划分模块401，用于在接收到待处理数据时，将所述待处理数据分别划分成多个最小待处理数据块；

获取模块402，用于获取所述多个最小待处理数据块的处理数量和每个待处理数据块的处理容量；

生成模块403，用于按照所述处理容量生成对应的运行线程，得到多个运行线程；

发送模块404，用于确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块。

进一步的，所述划分模块还用于：

将所述总处理时间除以所述最长处理时间得到划分数量；

进一步的，所述划分模块还用于：

所述装置还包括：

进一步的，本申请实施例还提供了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例所述的基于多线程的SGRT数据处理方法。

进一步的，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如上述实施例所述的基于多线程的SGRT数据处理方法。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种基于多线程的SGRT数据处理方法，其特征在于，应用于装有GPU内核的数据处理系统，所述方法包括：

确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块；

所述将所述待处理数据分别划分成多个最小待处理数据块，包括：

将所述总处理时间除以所述最长处理时间得到划分数量；

按照所述划分数量将所述待处理数据划分成多个最小待处理数据块；

或者；

2.根据权利要求1所述的基于多线程的SGRT数据处理方法，其特征在于，所述数据处理系统还设有宿主机内存池，所述宿主机内存池与所述GPU内核连接；

3.根据权利要求1所述的基于多线程的SGRT数据处理方法，其特征在于，所述数据处理系统采用异步通信方式发送所述多个运行线程至所述GPU内核。

4.一种基于多线程的SGRT数据处理装置，其特征在于，应用于装有GPU内核的数据处理系统，所述装置包括：

发送模块，用于确定所述多个最小待处理数据块的处理顺序，按照所述处理顺序将所述多个运行线程发送至所述GPU内核，以使所述GPU内核按照所述处理顺序分别并行处理所述多个最小待处理数据块；

所述划分模块还用于：

将所述总处理时间除以所述最长处理时间得到划分数量；

所述划分模块还用于：

5.一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-3任意一项所述的基于多线程的SGRT数据处理方法。

6.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1-3任意一项所述的基于多线程的SGRT数据处理方法。