WO2021135629A1

WO2021135629A1 - 波束合成处理方法、装置、计算机设备和存储介质

Info

Publication number: WO2021135629A1
Application number: PCT/CN2020/126530
Authority: WO
Inventors: 郭震; 李文祥; 郑曙光
Original assignee: 飞依诺科技(苏州)有限公司
Priority date: 2019-12-31
Filing date: 2020-11-04
Publication date: 2021-07-08
Also published as: CN111239745A

Abstract

一种波束合成处理方法、装置、计算机设备和存储介质。波束合成处理方法应用于GPU（110），包括：接收多个接收通道对应的前端接收数据（S210）；接收CPU（120）传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的信息（S220）；根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据（S230）。通过将多通道的前端接收数据直接传输至图形处理器GPU（110）中，提高了数据传输效率，从而满足波束合成的实时性需求，且能够满足后续处理需要的中间图像的数据质量。

Description

波束合成处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及超声数据处理技术领域，特别是涉及一种波束合成处理方法、装置、计算机设备和存储介质。

背景技术

数字波束合成技术是超声检测，也是整个信号接收处理系统的核心技术。传统的多路超声并行数据采集与处理系统基本以FPGA(Field Programmable Gate Array，现场可编程逻辑门阵列)为基础，通常通过基于FPGA的各个模块对信号并行处理，充分利用FPGA并行工作的优点，实现对多路信号并行采样、数字处理等工作，实现了精确延时和快速加权求和，之后FPGA将加权求和数据通过PCIE总线写入到CPU做后续处理。

相关技术中，波束合成处理结合使用CPU(Central Processing Unit，中央处理器)和GPU(Graphics Processor Unit，图形处理器)，通过FPGA将超声前端数据传输至CPU中，由CPU进行波束合成。然后，将处理后的数据传输至数GPU，在GPU上对处理后的数据进行复合、解调等进一步处理，实现超高速成像。然而，相关技术中，将超声前端数据传输至CPU会存在一定的时延，从而导致数据传输效率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高大量超声数据多设备间数据传输效率、便于调试、移植的波束合成处理方法、装置、计算机设备和存储介质。

为了实现上述目的，一方面，本申请实施例提供了一种波束合成处理方法，应用于图形处理器GPU，所述方法包括：

接收多个接收通道对应的前端接收数据；

接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的位置的信息；

根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

在其中一个实施例中，图形处理器中设置的线程结构为二维网格结构，二维网格结构的水平维度对应多根接收线的线数，竖直维度方向对应各接收线中采样点的数量。

在其中一个实施例中，图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据，包括：

根据各接收线的坐标信息以及各接收线中包含的采样点信息，确定各接收线中各采样点的位置信息；

通过每个线程块，根据对应的一根接收线中各采样点的位置信息、多个接收通道的位置信息，以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据；

对各接收线中的采样点的接收数据进行加权和，得到各接收线的接收数据。

在其中一个实施例中，通过每个线程块，根据对应的一根接收线中各采样点的位置信息、多个接收通道的位置信息，以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据，包括：

根据接收线中各采样点的位置信息，得到各采样点与各接收通道的距离值；

根据距离值，确定接收线中各采样点相对各接收通道的延时；

根据各采样点相对各接收通道的延时，以及各接收通道对应的前端接收数据，生成各采样点的接收数据。

在其中一个实施例中，根据多个采样点的位置信息以及多个接收通道对应的前端接收数据，进行合成得到多根接收线的接收数据之后，还包括：

将多根接收线的接收数据存储至预先设置的共享数据缓冲区；

通过共享数据缓冲区将多根接收线的接收数据传输至CPU中。

在其中一个实施例中，所述方法还包括：

根据获取的采样频率以及组织速度，确定各接收线中单位距离采样点的数量。

在其中一个实施例中，接收多个接收通道对应的前端接收数据，包括：

通过高速串行计算机扩展总线标准PCIe，接收多个接收通道对应的前端接收数据。

另一方面，本申请实施例还提供了一种波束合成处理装置，所述装置包括：

接收模块，用于接收多个接收通道对应的前端接收数据；

接收模块，还用于接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的信息；

波束合成模块，用于根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

又一方面，本申请实施例还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的波束合成处理方法的步骤。

又一方面，本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的波束合成处理方法的步骤。

上述波束合成处理方法、装置、计算机设备和存储介质，通过将多通道的前端接收数据直接传输至图形处理器GPU中，提高了数据传输效率；通过利用CPU和GPU平台具有开发周期短、调试方便和便于移植的优势，可以减少波束合成的成本；通过利用GPU的高速并行计算能力和并行多任务处理能力，实现了同时对多接收线的数据处理，从而提高了波束合成的实时性且能够满足后续处理需要的中间图像的数据质量。

附图说明

图1为一个实施例中波束合成处理方法的应用环境图；

图2为一个实施例中波束合成处理方法的流程示意图；

图2a为一个实施例中GPU与CPU波束合成的时延对比图；

图3为一个实施例中线程块处理一根接收线的接收数据的流程示意图；

图4为一个实施例中线程块处理一根接收线的接收数据的流程示意图；

图4a为一个实施例中根据采样点位置信息得到延时值的示意图；

图5为一个实施例中波束合成处理方法的流程示意；

图6为一个实施例中波束合成处理装置的结构框图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的波束合成处理方法，可以应用于如图1所示的应用环境中。该应用环境包括GPU 110、CPU 120和AFE 130(Analog Front End，模拟前端)。GPU全称是图形处理器(Graphics Processor Unit)，它是显卡的核心单元。从GPU产生以来一直担任着对图形的渲染任务，随着NVIDIA(英伟达)公司推出了统一的计算架构CUDA(Compute Unified Device Architecture，统一计算设备架构)，AMD(Advanced Micro Devices，美国超微半导体公司)公司其采用OPENCL(Open Computing Language，开放运算语言)语言作为开发语言，GPU的编程从而变得方便、简单，也促使GPU在除了图形计算以外的数据计算处理领域大放异彩，比如通用高性能计算领域。在结构上，CPU基本都是控制器和缓存寄存器，而GPU结构上拥有大量的逻辑运算单元，这就使得在并行处理大量数据时GPU更合适，并且GPU的开发高性能计算能力远远超过CPU。具体地，AFE 130(Analog Front End，模拟前端)将对模拟回波信号进行处理得到的多接收通道的前端接收数据通过预设协议传输至GPU 110中。预设协议可以是指PCI(Peripheral Component Interconnect，外设部件互连标准)总线协议、PCIe(Peripheral Component Interconnect express，一种高速串行计算机扩展总线标准)等。GPU 110接收多接收通道对应的前端接收数据。在执行波束合成处理的时候，CPU 120将其中的控制指令和相关数据传输至GPU 110中，使GPU 110按照线程网格的概念，根据控制指令执行波束合成处理办法。GPU 110中包括多个线程网格，每一个线程网格又可以包含多个线程块，每一个线程块中又可以包含多个线程。当要执行任务的时候，每一个线程网格把任务分成一部分至各线程块，再由各线程块再至其中的线程来完成。具体地，GPU 110接收多个接收通道对应的前端接收数据；GPU 110接收CPU 120传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的信息；GPU 110根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。GPU 110将得到的多根接收线的接收数据传输至CPU 120中进行后续处理。

在一个实施例中，如图2所示，提供了一种波束合成处理方法，以该方法应用于图1中的GPU 110为例进行说明，包括以下步骤：

步骤210，接收多个接收通道对应的前端接收数据。

其中，前端接收数据是指对接收到的超声回波进行处理得到的数字回波信号。具体地，硬件平台下发指令让探头按照一定要求发射超声波，之后探头接收超声回波。由于超声在发射、接收路径上存在散射等损耗，因此接收到的超声回波信号一定是随接收时间增加，其回波相对强度越小，如果直接利用这样的信号进行后续处理，那么得到的超声图像在不同的探测深度会表现出不同的亮度，这样对于真实反映被探测的组织结构是不利的。因此，对接收到超声回波信号采用时间增益补偿可以削弱由于信号强度随深度减少而带来的后续处理问题。在该处理之后的信号实际上是模拟信号，因此为提升信号处理效率，降低硬件平台复杂度，需要采用模拟数字转换(ADC)将模拟回波信号转换为数字回波信号，即得到每个接收通道对应的前端接收数据。在得到多个接收通道对应的前端接收数据，将数据直接传输至GPU中进行波束合成处理。GPU全称是图形处理器(Graphics Processor Unit)，它是显卡的核心单元，其结构上拥有大量的逻辑运算单元，可以容纳上千个没有逻辑关系的数值计算线程。

步骤220，接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含采样的信息。

其中，采样点是指根据一定的采样规则从接收线上进行采样得到的点。采样信息可以但不限于各接收线中采样点的数量等信息。具体地，本实施例中采用CPU+GPU架构进行波束合成处理，其中，CPU完成任务组织和发送，每当CPU遇到需要并行计算的任务时，则将要做的运算组织成相应的控制指令。然后，CPU将该控制指令传输至GPU，由GPU根据接收到的控制指令完成并行计算。在每接收到一次新的波束合成处理任务时，CPU都会根据本次的任务更新相应的参数，以使GPU能够准确地进行并行计算。在本实施中,CPU可以将控制指令传输至GPU中的共享数据区，控制指令中包含波束合成得到的多个接收通道的位置信息、多根接收线的位置坐标、每根接收线中采样点的数量和位置等信息，从而使GPU能够根据这些信息计算得到每根接收线中采样点的接收数据。

步骤230，根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

具体地，GPU在获取到多个接收通道的位置信息、多根接收线的位置坐标，以及每根接收线中采样点的数量等信息后，可以根据每根接收线的位置坐标，以及每根接收线中采样点的数量和位置，确定每个采样点相对每个通道的距离，从而可以按照由采样点到通道距离的差异带来的延时进行数字波束合成形成接收线的接收数据。

上述波束合成处理方法中，通过将多通道的前端接收数据直接传输至图形处理器GPU中，提高了数据传输效率；通过利用CPU和GPU平台具有开发周期短、调试方便和便于移植的优势，可以减少波束合成的成本；通过利用GPU的高速并行计算能力和并行多任务处理能力，实现了同时对多接收线的数据处理，从而提高了波束合成的实时性且能够满足后续处理需要的中间图像的数据质量。相对相关技术中采用CPU进行波束合成处理而言，由于CPU基本都是控制器和缓存寄存器，而GPU结构上拥有大量的逻辑运算单元，因此在并行处理大量数据时GPU更合适，并且GPU的开发高性能计算能力远远超过CPU。图如2a所示，示出了一个实施例中分别采用CPU和GPU处理30根接收线所用到的时长，参照图2a可知，采用GPU进行波束合成的时延远远小于CPU的时延。

在一个实施例中，图形处理器GPU中设置的线程结构为二维网格结构，二维网格结构的水平维度对应多根接收线的线数，竖直维度方向对应各接收线中采样点的数量。

具体地，将GPU的线程结构设置为二维网格结构，网格的X维度为多接收线的数量，网格的Y维度为一根线上所有采样点的数量。通过利用GPU多线程并行处理的运算能力，在Y维度上计算每个采样点波束合成加和得到的接收数据；利用GPU的多维度并行处理能力，根据每个采样点的接收数据，并行处理多根接收线的接收数据。本实施例中，通过利用GPU并行处理的优势，使GPU能够高速并行计算得到多根接收线的接收数据，从而满足波束合成实时性的需求。

在一个实施例中，图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；如图3所示，根据多个接收通道的位置道信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据，包括以下步骤：

步骤231，根据各接收线的坐标信息以及各接收线中包含的采样点信息，确定各接收线中各采样点的位置信息。

步骤232，通过每个线程块，根据对应的一根接收线中各采样点的位置信息、多个接收通道的位置信息，以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据。

具体地，GPU线程结构由网格(Grid)、线程块(Block)和线程(Thread)组成，相当于把GPU上的计算单元分为若干个网格，每个网格内包含若干个线程块，每个线程块包含若干个线程。而线程是GPU运算中的最小执行单元，线程能够完成一个最小的逻辑意义操作。本实施例中将GPU的线程结构设置为二维网格结构，每个网格中的一个线程块负责处理一根接收线的接收数据；每个线程块中的一个线程负责处理一根接收线中的一个采样点的接收数据。即，若共有N(N≥4)条接收线，每条接收线上有M(M＞1000)个采样点，那么本实施例中的GPU线程结构中则包括N个线程块，每个线程块中包含M个线程，一共N*M个线程，该N*M个线程可以并行执行采样点的接收数据的处理。示例性地，对于某根接收线中的某个采样点，由其对应的线程块中某个线程得到负责处理该采样点的接收数据。该线程可以根据该采样点相对每个接收通道的距离，确定该采样点相对每个接收通道的延时，从而根据该延时对每个接收通道的前端接收数据进行延时。采样点相对每个接收通道的距离可以根据接收到的各接收通道的位置信息、各接收线的位置坐标信息，以及采样点在各接收线中的位置信息确定。

步骤233，对各接收线中的采样点的接收数据进行加权和，得到各接收线的接收数据。

具体地，可以利用GPU中多个计算单元，在每一个计算单元上将延时后的多个接收通道的前端接收数据进行叠加得到采样点的接收数据。然后，将所有计算单元得到的多个采样点的接收数据进行加权和，得到对应的一根接收线的接收数据，从而完成一根接收线的波束合成处理。同理，对于多根接收线，可以采样上述方式处理得到接收线的接收数据。本实施例中，通过对GPU的线程结构进行优化，使每个线程块对应处理一根接收线的接收数据，利用GPU并行数据处理的优势，使优化得到的GPU能够高速并行计算对多根接收线的接收数据，从而满足波束合成实时性的需求。

在一个实施例中，如图4所示，通过每个线程块，根据对应的一根接收线中各采样点的位置信息以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据，包括：

步骤2311，根据接收线中各采样点的位置信息以及各接收通道的位置信息，得到各采样点与各接收通道的距离值。

步骤2312，根据距离值，确定接收线中各采样点相对各接收通道的延时。

其中，计算延时的目的是获得同一接收采样点相对各个接收通道的相同相位前端接收数据。具体地，GPU可以根据接收线中各采样点的位置坐标，确定各采样点距离每个通道的距离值。然后根据与每个通道的距离值，确定对每个通道的前端接收数据进行延时的延时值。如图4a所示，示出了一个实施例中，根据采样点的位置信息确定各接收通道的延时的示意图。图4中一共包括A个接收通道，d代表采样点至接收通道的垂直距离，d1代表采样点至接收通道A-1的距离，d2代表采样点至接收通道A-2的距离。可以通过以下方式确定采样点与接收通道A-1的延时值idelay1＝(d+d1)*X ₁，其中X ₁代表系数，依实际情况而定。同理，采样点与接收通道A-2的延时值idelay2＝(d+d2)*X ₂。可以理解的是，延时值随着采样点相对接收通道的距离的增大而增大。

步骤2313，根据各采样点相对各接收通道的延时，以及各接收通道对应的前端接收数据，生成各采样点的接收数据。

具体地，在确定采样点相对每个接收通道的延时值之后，根据采样点相对每个接收通道的延时值，得到每个接收通道的相同相位的前端接收数据。然后，将该相同相位的多个接收通道的前端接收数据进行相加得到采样点的接收数据。进一步地，对于某根接收线而言，在通过同一线程块的多个线程并行处理该根接收线上的多个采样点，得到多个采样点的采样数据后，将该多个采样点的接收数据进行加权和，既可以得到这根接收线的接收数据。

在一个实施例中，根据多个采样点的位置信息以及多个接收通道对应的前端接收数据，进行合成得到多根接收线的接收数据之后，还包括：将多根接收线的接收数据存储至预先设置的共享数据缓冲区；通过共享数据缓冲区将多根接收线的接收数据传输至CPU中。

具体地，预先在GPU中创建输出的共享数据缓冲区，作为并行计算的输出缓冲区，在共享数据缓冲区中将波束合成之后的接收数据进行排列。最终得到的多根接收线的接收数据可以通过该共享数据缓冲区传输至CPU内存中，使得CPU内存能够根据该多根接收线的接收数据做进一步处理，进一步处理是指对接收数据进行解码、滤波等处理，从而为最后的图像显示准备。本实施例中，通过在GPU中创建输出数据的共享数据缓冲区，使得GPU并行计算得到的数据能够有序的传输至CPU进行处理，从而提高了数据传输的效率。

在一个实施例中，接收线中采样点的确定方式可以为：根据获取的采样频率以及组织速度，确定各接收线中单位距离采样点的数量。

其中，组织速度是指超声回波速度。具体地，接收线中单位距离采样点的数据，根据采样深度不同而变化，采样深度越深，采样点越多。接收线中单位距离的采样点数量可以由采样频率和组织速度确定，可以通过以下公式确定接收线中单位距离的采样点数量：单位距离的采样点数量＝采样频率/组织速度。可以理解的是，采样深度越深，组织速度将会越低。本实施例中，通过随着采样深度改变改变采样点的数量，可以使采样点的选取更为全面，从而提高了波束合成的准确性。

在一个实施例中，接收多个接收通道对应的前端接收数据，包括：通过高速串行计算机扩展总线标准PCIe，接收多个接收通道对应的前端接收数据。本实施例中，通过PCIe将多个接收通道对应的前端接收数据直接传输至GPU中，使波束合成处理过程能够满足超高速成像对数据传输速率的需求以及能够满足后续处理需要的中间图像数据质量。

在一个实施例中，如图5所示，通过一个具体的实施例说明波束合成处理方法，包括以下步骤：

步骤501，GPU通过PCIe总线标准接收多个接收通道对应的前端接收数据。其中，GPU的中设置的线程结构为二维网格结构，二维网格结构的水平维度对应所述多根接收线的线数，竖直维度方向对应各接收线中采样点的数量。GPU中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据。

步骤502，接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含采样点的信息。

步骤503，通过每个线程块中的线程根据多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中的采样点的信息，得到各采样点与各接收通道的距离值。

步骤504，根据距离值，确定接收线中各采样点相对各接收通道的延时。

步骤505，利用GPU中每一个计算单元并行对延时后的各接收通道对应的前端接收数据进行相加，得到各采样点的接收数据。

步骤506，将所有计算单元得到的一根接收线中的采样点的接收数据进行加权和，完成对应的一根接收线的接收数据处理。同理，可以得到所有接收线的接收数据。

步骤507，将多根接收线的接收数据存储至预先设置的共享数据缓冲区。

步骤508，通过共享数据缓冲区将多根接收线的接收数据传输至CPU中。

应该理解的是，虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-5中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种波束合成处理装置600，包括：接收模块601和波束合成模块602，其中：

接收模块601，用于接收多个接收通道对应的前端接收数据；

接收模块601，还用于接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含采样点的信息；

波束合成模块602，用于根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

在一个实施例中，图形处理器中设置的线程结构为二维网格结构，二维网格结构的水平维度对应多根接收线的线数，竖直维度方向对应各接收线中采样点的数量。

在一个实施例中，图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；波束合成模块602，具体用于根据各接收线的坐标信息以及各接收线中包含的采样点信息，确定各接收线中各采样点的位置信息；通过每个线程块，根据对应的一根接收线中各采样点的位置信息多个接收通道的位置信息，以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据；对各接收线中的采样点的接收数据进行加权和，得到各接收线的接收数据。

在一个实施例中，波束合成模块602，具体用于根据接收线中各采样点的位置信息以及各接收通道的位置信息，得到各采样点与各接收通道的距离值；根据距离值，确定接收线中各采样点相对各接收通道的延时；根据各采样点相对各接收通道的延时，以及各接收通道对应的前端接收数据，生成各采样点的接收数据。

在一个实施例中，还包括数据传输模块(图6中未示出)，用于将多根接收线的接收数据存储至预先设置的共享数据缓冲区；通过共享数据缓冲区将多根接收线的接收数据传输至CPU中。

在一个实施例中，还包括采样点确定模块(图6中未示出)，用于根据获取的采样频率以及组织速度，确定各接收线中单位距离采样点的数量。

在一个实施例中，接收模块601，具体用于通过高速串行计算机扩展总线标准PCIe，接收多个接收通道对应的前端接收数据。

关于波束合成处理装置的具体限定可以参见上文中对于波束合成处理方法的限定，在此不再赘述。上述波束合成处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种波束合成处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

接收多个接收通道对应的前端接收数据；接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的信息；根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

在一个实施例中，图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；处理器执行计算机程序时还实现以下步骤：

根据各接收线的坐标信息以及各接收线中包含的采样点信息，确定各接收线中各采样点的位置信息；通过每个线程块，根据对应的一根接收线中各采样点的位置信息、多个接收通道的位置信息，以及多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据；对各接收线中的采样点的接收数据进行加权和，得到各接收线的接收数据。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

根据接收线中各采样点的位置信息以及各接收通道的位置信息，得到各采样点与各接收通道的距离值；根据距离值，确定接收线中各采样点相对各接收通道的延时；根据各采样点相对各接收通道的延时，以及各接收通道对应的前端接收数据，生成各采样点的接收数据。

将多根接收线的接收数据存储至预先设置的共享数据缓冲区；通过共享数据缓冲区将多根接收线的接收数据传输至CPU中。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

接收多个接收通道对应的前端接收数据；接收CPU传输的控制指令，控制指令携带有多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含采样点的信息；根据多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。

在一个实施例中，图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种波束合成处理方法，其特征在于，所述方法应用于图形处理器GPU，所述方法包括：

接收多个接收通道对应的前端接收数据；

接收CPU传输的控制指令，所述控制指令携带有所述多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的多个采样点的信息；

根据所述多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对所述多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。
根据权利要求1所述的方法，其特征在于，所述图形处理器中设置的线程结构为二维网格结构，所述二维网格结构的水平维度对应所述多根接收线的线数，竖直维度方向对应各接收线中采样点的数量。
根据权利要求2所述的方法，其特征在于，所述图形处理器中设置有多个线程块，每个线程块处理对应的一根接收线的接收数据；所述根据所述多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对所述多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据，包括：

根据各接收线的坐标信息以及各接收线中包含的采样点的信息，确定各接收线中各采样点的位置信息；

通过每个线程块，根据对应的一根接收线中各采样点的位置信息、所述多个接收通道的位置信息，以及所述多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据；

对各接收线中的采样点的接收数据进行加权和，得到各接收线的接收数据。
根据权利要求3所述的方法，其特征在于，所述通过每个线程块，根据对应的一根接收线中各采样点的位置信息、所述多个接收通道的位置信息，以及所述多个接收通道对应的前端接收数据，计算对应的一根接收线中各采样点的接收数据，包括：

根据接收线中各采样点的位置信息以及各接收通道的位置信息，得到各采样点与各接收通道的距离值；

根据所述距离值，确定所述接收线中各采样点相对各接收通道的延时；

根据各采样点相对各接收通道的延时，以及各接收通道对应的前端接收数据，生成各采样点的接收数据。
根据权利要求1至4任意一项所述的方法，其特征在于，所述根据所述多个采样点的位置信息以及所述多个接收通道对应的前端接收数据，进行合成得到多根接收线的接收数据之后，还包括：

将所述多根接收线的接收数据存储至预先设置的共享数据缓冲区；

通过所述共享数据缓冲区将所述多根接收线的接收数据传输至CPU中做后续处理。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据获取的采样频率以及组织速度，确定所述各接收线中单位距离采样点的数量。
根据权利要求1所述的方法，其特征在于，所述接收多个接收通道对应的前端接收数据，包括：

通过高速串行计算机扩展总线标准PCIE，接收所述多个接收通道对应的前端接收数据。
一种波束合成处理装置，其特征在于，所述装置包括：

接收模块，用于接收多个接收通道对应的前端接收数据；

所述接收模块，还用于接收CPU传输的控制指令，所述控制指令携带有所述多个接收通道的位置信息、多根接收线的坐标信息，以及各接收线中包含的采样点的信息；

波束合成模块，用于根据所述多个接收通道的位置信息、多根接收线的坐标信息以及各接收线中包含的采样点的信息，对所述多个接收通道对应的前端接收数据进行合成得到多根接收线的接收数据。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。