WO2023207632A1

WO2023207632A1 - 基于gpu并行计算的卫星导航系统码片形状相关器和方法

Info

Publication number: WO2023207632A1
Application number: PCT/CN2023/088342
Authority: WO
Inventors: 崔晓伟; 王传瑞; 刘刚; 陆明泉
Original assignee: 清华大学
Priority date: 2022-04-29
Filing date: 2023-04-14
Publication date: 2023-11-02
Also published as: CN117008162A

Abstract

本申请公开了一种基于GPU并行计算的实时码片形状相关器以及方法。码片形状相关器包括：遮罩生成单元，其配置成根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；以及信号压缩单元，其配置成：使用所述即时本地伪随机噪声码对所述遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算以生成用于测量所述输入信号的码片形状的数据；和/或根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算，以生成用于测量所述输入信号与本地伪随机噪声码的协相关的相关峰的数据。

Description

基于GPU并行计算的卫星导航系统码片形状相关器和方法

交叉引用

本申请要求于2022年04月29日向中国专利局提交的、发明名称为“基于GPU并行计算的卫星导航系统码片形状相关器和方法”的第202210473223.4号发明专利申请的优先权，上述专利申请的全部内容通过引用并入本文。

技术领域

本申请涉及无线电导航软件接收机领域，特别涉及一种基于GPU并行计算的卫星导航系统实时码片形状相关器和方法。

背景技术

全球导航卫星系统(GNSS，Global Navigation Satellite System)无线电软件(SDR，software defined radio)接收机的主要信号处理过程均通过软件处理模块实现，相较于硬件接收机更容易调试和升级修改，且有更好的可配置性，因此在GNSS的各种应用领域中发挥着着很重要的作用。而相关运算中包含大量的乘累加运算，沉重的计算负担使得基于处理器(CPU)的SDR接收机的实时性很难保证。而基于图形处理器(GPU)并行计算可以使SDR接收机中的相关计算大幅加速，从而满足实时性要求。

随着对GNSS精度和完好性要求的不断提高，SDR接收机中越来越复杂的信号处理算法对于相关器的输出也提出了更高的要求。标准相关器通常只输出3-5路相关值用于信号跟踪，但一些多径抑制和信号质量监测算法需要更多的相关值输出组成的相关峰。而标准相关器每多计算一路相关值都需要一次完整的相关运算，SDR接收机的标准相关器很难实时计算多路相关值。码片形状相关器可以利用多路相关值之间的重复计算，减小计算多路相关值的计算量。同时，码片形状相关器也可以测量码片形状，以用于多径抑制算法以及基于码片域观测量的信号质量监测算法。但SDR接收机码片形状相关器对于内存的分配和访问提出了更高的要求。

因此，为了能够满足实时测量相关峰以及码片形状的需求，需要设计更加合理的基于GPU并行计算的卫星导航系统实时码片形状相关器和方法。

发明内容

为了解决上述问题或本领域中存在的其它问题，本申请提供了一种基于GPU并行计算的GNSS SDR接收机实时码片形状相关器系统和方法。

根据本申请的一个方面，提供了一种基于GPU并行计算的实时码片形状相关器，包括：遮罩生成单元，其配置成根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；以及信号压缩单元，其配置成：使用即时本地伪随机噪声码对遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对经压缩信号进行计算以生成用于测量输入信号的码片形状的数据；和/或根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对经压缩信号进行计算，以生成用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据；其中，超前伪随机噪声码和滞后伪随机噪声码相对于即时本地伪随机噪声码分别超前和滞后预定数目的码片。

在一个实施例中，预定数目码片可以包括1个码片。

在一个实施例中，经压缩信号的大小为一个码片，且被划分为多个码片格子。

在一个实施例中，信号压缩单元进一步配置成：确定经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及将经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。

在一个实施例中，当即时本地伪随机噪声码的相邻两个码片之间的边缘分别符合(1)为上升沿，(2)为下降沿，(3)保持+1，(4)保持-1时，根据即时本地伪随机噪声码的码片边缘所生成的遮罩信号的两个相邻的半码片的值与即时本地伪随机噪声码相一致且其余码片的值为0。

在一个实施例中，实时码片形状相关器可以进一步包括：码片形状测量单元，其配置成根据信号压缩单元所生成的、用于测量输入信号的码片形状的数据，确定输入信号的、包括码片上升沿和下降沿的实时码片形状；以及累加单元，其配置成对信号压缩单元所生成的、用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得相关峰。

根据本申请的另一方面，提供了一种基于GPU并行计算的方法，包括：根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；使用即时本地伪随机噪声码对遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对经压缩信号进行计算以生成用于测量输入信号的码片形状的数据；和/或根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对经压缩信号进行计算，以生成用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据；其中，超前伪随机噪声码和所述滞后伪随机噪声码相对于即时本地伪随机噪声码分别超前和滞后预定数目的码片。

其中，生成经压缩信号的步骤包括：确定经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及将经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。

其中，上述方法进一步包括：根据信号压缩单元所生成的、用于测量输入信号的码片形状的数据，确定输入信号的、包括码片上升沿和下降沿的实时码片形状，以及对信号压缩单元所生成的、用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得相关峰。

根据本申请的另一方面，提供了一种基于GPU并行计算的装置，包括：存储器，存储有计算机可执行的指令；以及处理器，执行指令以实现如上所述的方法。

根据本申请的另一方面，提供了一种存储介质，其包括计算机可执行的指令，该指令被执行时实现如上所述的方法。

根据本申请的一个实施例，对信号压缩单元中一个跟踪通道的全部采样点进行并行计算，采用将采样点根据其所属的码片格子映射到对应的一个线程的并行运算方法，并且线程通过确定属于同一个码片格子的相邻采样点之间的间隔，来高效寻找属于同一个码片格子的全部采样点以完成累加。该并行计算方式使得每个线程所需使用的寄存器数量大幅降低，提高了计算效率以及码片形状和相关峰测量的分辨率上限。

附图说明

图1示出了根据本申请实施例的基于GPU并行计算的卫星导航系统实时码片形状相关器的示意图。

图2示出了根据本申请一个实施例的用于实现相关峰测量的过程的示意图。

图3示出了根据本申请一个实施例的本地伪随机噪声码产生的四种遮罩信号，以及通过信号压缩来测量码片形状的过程的示意图。

图4示出了根据本申请实施例的码片形状相关器测量GPS L1C/A信号的1号卫星的1s平滑相关峰的结果。

图5示出了根据本申请实施例的码片形状相关器测量添加了幅度为0.5、延迟为0.2码片的同向多径GPS L1C/A信号的1号卫星的1s平滑相关峰的结果。

图6示出了根据本申请实施例的码片形状相关器测量添加了幅度为0.5、延迟为0.2码片的反向多径GPS L1C/A信号的1号卫星的相关峰的结果。

图7示出了根据本申请实施例的码片形状相关器测量GPS L1C/A信号的1号卫星的1s平滑码片上升沿的结果。

图8示出了根据本申请实施例的码片形状相关器测量添加了幅度为0.5、延迟为0.2码片的同向多径的GPS L1C/A信号的1号卫星的1s平滑码片上升沿的结果。

图9示出了根据本申请实施例的码片形状相关器测量添加了幅度为0.5、延迟为0.2码片的反向多径的GPS L1C/A信号的1号卫星的1s平滑码片上升沿的结果。

具体实施方式

以下描述参考附图更全面地说明本公开的实施例及其各种特征和细节。省略对公知部件和处理技术的描述，以免不必要地模糊本公开的实施例。另外，本公开描述的各种实施例无需相互排斥，因为一些实施例可以与一个或多个其他实施例组合以形成新的实施例。除非另外指明，否则如本公开使用的术语“或”指的是非排他的或。本公开使用的示例仅仅意图帮助理解可以实践本公开的实施例的方式，并且进一步使得本领域的技术人员能够实践本公开的实施例。因此，示例不应被解释为限制本公开的实施例的范围。

还应理解的是，诸如“包括”、“包括有”、“具有”、“包含”和/或“包含有”等表述在本说明书中是开放性而非封闭性的表述，其表示存在所陈述的特征、元件和/或部件，但不排除一个或多个其它特征、元件、部件和/或它们的组合的存在。此外，当诸如“……中的至少一个”的表述出现在所列特征的列表之后时，其修饰整列特征，而非仅仅修饰列表中的单独元件。此外，当描述本申请的实施方式时，使用“可”表示“本申请的一个或多个实施方式”。并且，用语“示例性的”旨在指代示例或举例说明。

除非另外限定，否则本文中使用的全部措辞(包括工程术语和科技术语)均具有与本申请所属领域普通技术人员的通常理解相同的含义。还应理解的是，除非本申请中有明确的说明，否则在常用词典中定义的词语应被解释为具有与它们在相关技术的上下文中的含义一致的含义，而不应以理想化或过于形式化的意义解释。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。另外，除非明确限定或与上下文相矛盾，否则本申请所记载的方法中包含的具体步骤不必限于所记载的顺序，而可以任意顺序执行或并行地执行。下面将参考附图并结合实施例来详细说明本申请。

图1示出了根据本申请实施例的基于GPU并行计算的卫星导航系统实时码片形状相关器10的示意框图。实时码片形状相关器10可包括遮罩生成单元101和信号压缩单元102。遮罩生成单元101根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号。信号压缩单元102可使用即时本地伪随机噪声码对遮罩信号与输入的载波剥离后的信号的乘积进行压缩，生成经压缩信号，并且对经压缩信号进行计算以生成用于测量输入的载波剥离后的信号的码片形状的数据。

在一个示例中，信号压缩单元102还可以使用超前、即时、滞后伪随机码，对输入的载波剥离后的信号进行信号压缩，生成经压缩信号，并且对经压缩信号进行计算，以生成用于测量输入的载波剥离后的信号与本地伪随机噪声码的协相关的相关峰的数据。

优选地，超前伪随机噪声码和滞后伪随机噪声码可以相对于即时本地伪随机噪声码分别超前和滞后1个的码片。

当即时本地伪随机噪声码的相邻两个码片之间的边缘分别符合(1)为上升沿，(2)为下降沿，(3)保持+1，(4)保持-1时，根据即时本地伪随机噪声码的码片边缘所生成的遮罩信号的两个相邻的半码片的值与即时本地伪随机噪声码相一致且其余码片的值为0。

导航信号的本地伪随机噪声码可以表示为以下形式：

即本地伪随机噪声码m(t)可以表示为码片函数c(t)通过ε_k＝±1加权，移位若干个码片周期T_c相加得到。在信号压缩单元102中，用本地伪随机噪声码的ε_k对输入信号进行加权累加，即

经压缩后的信号只有一个码片的长度，且保留了信号的全部信息。另外，由于信号压缩将一段时间内信号中全部的码片进行了相干累加，获得了载噪比的增益，因此原本淹没在噪声中的码片可以从压缩信号中得到可视化的观测。对于实际使用的离散的情况，通常在不同的码片中不会有严格对应的采样点。因此，离散情况下的信号压缩是将码片均匀划分为M个格子，在信号压缩的过程中对属于同一个格子的采样点进行累加。

图2示出了根据本申请一个实施例的、累加单元104对从信号压缩单元102得到的经压缩信号进行滑动累加以计算多路相关值，实现相关峰检测的过程的示意图20。离散相关值也可以由压缩信号计算。具体如下：

其中T_b＝T_c/M，是码片格子周期。

在基于码片形状的相关峰检测中，使用即时伪随机码以及相对于即时伪随机码分别超前和滞后1个码片的超前伪随机码和滞后伪随机码对所接收的信号进行信号压缩，得到包括超前、即时、滞后三个码片(共3M个码片格子)的压缩信号，设其标号为-M到2M-1，则标号为n至n+M-1(-M-n≤M)的M个格子的和为R_rm(nT_b)，即为码相位为n/M的相关值。因此只需要进行M次加法运算，即可得到一个相关值，从而以很小的运算量得到多路相关值。设跟踪数据的总采样点数为N_s，相关器输出L路相关值，且L>3，则采用多路相关器方法需要O(L·N_s)的乘法运算和O(L·N_s)的加法运算，而码片形状相关器10只需要O(N_s)的乘法运算以及O(N_s+M·L)的加法运算。由于M＜＜N_s，因此码片形状相关器10所需的乘法运算和加法运算都要少于传统的多路相关器。

图3示出了用来获得码片边缘为上升沿、下降沿、保持+1、保持-1四种情况的码片形状而根据本地伪随机噪声码产生的四种遮罩信号，以及通过信号压缩来测量码片形状的过程的示意图30。

在信号压缩单元102中，如果直接使用本地伪随机噪声码进行信号压缩，则码片边缘情况不同的码片会被叠加在一起，因此得到的码片边缘是没有意义的。因此，本申请根据本地伪随机噪声码的4种码片边缘情况生成图3中所示的四种遮罩信号y(t)。只有在本地伪随机噪声码相邻的两个码片之间的边缘符合要求时两个相邻的半码片的遮罩信号的值与本地伪随机噪声码一致，其余部分皆为0。这样，输入信号与遮罩信号的乘积y(t)·r(t)经信号压缩单元102通过以下规则压缩：

在信号压缩的过程中只对边缘满足要求的码片单独进行累加，因此可以确保对于码片边缘的测量是准确的。而大小为一个码片的压缩信号经过码片形状测量单元103交换前一半码片和后一半码片，可以分别得到上升沿、下降沿、保持+1、保持-1这四种情况的码片形状的准确测量结果。

在经压缩信号的大小为一个码片，且被划分为多个码片格子的情况下，信号压缩单元102进一步配置成：确定所述经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及将所述经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。

实时码片形状相关器10可以进一步包括码片形状测量单元103，其配置成根据信号压缩单元102所生成的、用于测量输入信号的码片形状的数据，确定所述输入信号的、包括码片上升沿和下降沿的实时码片形状。

实时码片形状相关器10可以进一步包括累加单元104，其配置成对信号压缩单元102所生成的、用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得相关峰。

信号压缩单元102中的基于GPU的并行算法可以采用CUDA实现，也可以推广至其他异构平台程序编写的框架。每个跟踪通道映射到一个CUDA的线程块进行并行计算，采样点映射到CUDA线程块中的线程并行进行累加计算。信号压缩的计算结果是长度为M的压缩信号，而信号压缩单元102为了计算相关值需要完成E、P、L压缩信号的同向和正交分量的信号压缩，因此每个线程存储全部的信号压缩结果需要6M个寄存器。而GPU上的寄存器是稀缺资源，CUDA中一个线程的寄存器数量最大值为255。为了避免出现寄存器溢出导致的计算效率降低，M的取值不能超过42。这意味着对于相关峰和码片形状的测量无法达到很高的分辨率。因此，为了避免这一问题，在本申请的信号压缩单元102的实现中，每个线程只负责落入某一个码片格子的全部采样点的乘累加计算，只需要6个寄存器来存储某一个码片格子的6路累加结果，从而避免了寄存器溢出，提高了计算效率。而且M的取值上限也扩展到CUDA中线程块中的最大线程数1024，码片形状相关器10的分辨率上限也随着提升。

基于信号压缩单元102的采样点到线程的映射机制，线程通过一种高效算法判断与属于同一个码片格子的下一个采样点的间距，从而寻找落入自身所负责计算的码片格子的全部采样点。在给定的采样率f_s、码速率f_c以及码片格子的数量M下，相邻的采样点的间隔只有几个固定的可能取值P_i(P₁<P₂<…<P_n)，且可以通过一种简单的判断准则来确定当前的具体取值：在从当前采样点偏移P_i个采样点之后，除了可能移动了整数的码片相位以外，还会产生一个分数的码片相位偏移，如下式所示：

由于码片被划分为M个码片格子，因此可以定义对应的码片格子的分数相位偏移为：

假设在当前采样点位置时还存在一个之前移动产生的分数相位偏移F(0≤F<1)，那么在移动P_i个采样点后，如果采样点仍然在同一个码片格子中，则新的分数相位偏移需要满足：
0≤F+A_i<1 8)

因此，按照升序的方式检查A_i是否能够满足上述条件，第一个满足条件的A_i所对应的P_i即为当前采样点到下一个采样点之间的间距。由于属于同一个码片格子的相邻采样点之间的最大间隔为max(P_i)，因此，连续的max(P_i)采样点中一定能找到全部码片格子中的至少一个采样点，作为码片格子中的第一个采样点，再通过上述的判断准则不断找到属于这个码片格子的下一个采样点，从而递推的找到属于这个码片格子的全部采样点。

在给定的采样率f_s，码速率f_c和码片格子数量M下，P_i的特定取值计算过程如下：首先，计算属于同一个码片格子的全部采样点的间距的可能取值Q_i。由于P_i是属于同一个码片格子的相邻采样点之间的间距，而Q_i是属于同一个码片格子的相邻采样点之间的间距的可能取值，因此Q_i中一定包含全部P_i。设n₁和n₂是属于同一个码片格子的两个采样点的索引，因此需要满足：

令

将k＝1、2、……代入上式中，即可计算出属于同一个码片格子的两个采样点之间的索引之差的全部可能，即为Q_i。

随后，从Q_i中选出P_i。在上述的Q_i中，只有其中的一些可能属于同一个码片格子的相邻采样点之间的索引间距P_i，因此还需要从Q_i中筛选出P_i。当移动了Q_i个采样点后，分数码片格子的改变为如下偏移：

如果在移动Q_i后的采样点仍然属于同一个码片格子，则必有改变后的分数频率仍处于0到1的范围内，即：
0≤F_i+A_i<1

因此，按照升序的顺序计算Q_i所对应的F_i，如果前k个F_i的并集是[0,1)，则对于0≤F<1的初始分数码片格子情况，都可以在Q_i...Q_k中找到Q_i，使得0≤F+A_i<1，即Q_i...Q_k中包含了属于同一个码片格子的相邻采样点之间的间距的全部可能性，即为所要求的P_i。

以下给出根据本申请的一种基于GPU并行计算的卫星导航系统实时码片形状相关器和方法的评估实施例。

对于GPS L1CA信号，码速率f_c＝1.023MHz，并采用f_s＝24MHz进行采样，信号压缩单元102中一个码片的格子数为40。则按照上述基于GPU并行计算的信号压缩方法，首先确定P_i的取值。代入参数到上面提及的不等式13)确定出：

因此当k＝1时得到的不等式如下：

n₂-n₁＝23,24

当k＝2时得到的不等式如下：

n₂-n₁＝47

所以Q₁＝23、Q₂＝24、Q₃＝47是属于相同码片格子的采样点之间的间隔的3个最小可能值。

由Q₁＝23、Q₂＝24、Q₃＝47计算得到对应的分数格子偏移为A₁＝-0.785、A₂＝0.92、A₃＝0.135，因此，要满足偏移后仍在同一个码片格子，对应的初始分数格子偏移区间应为：
F₁∈[0.785,1),F₂∈[0,0.08),F₃∈[0,0.865)

由于：
[0.785,1)∪[0,0.08)∪[0,0.865)＝[0,1)

因此，已经包含了全部的初始分数格子情况，属于同一码片格子的相邻采样点之间的间隔只有P₁＝23、P₂＝24、P₃＝47三种情况。

根据参数P₁、P₂、P₃，按照基于GPU并行计算的信号压缩算法，可以并行进行L1CA信号的信号压缩，实现相关峰和码片形状的实时测量。

根据本申请的另一个方面，提供了一种基于GPU并行计算的方法。该方法包括：根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；使用即时本地伪随机噪声码对遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对经压缩信号进行计算以生成用于测量输入信号的码片形状的数据；和/或根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对经压缩信号进行计算，以生成用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据。其中，超前伪随机噪声码和滞后伪随机噪声码相对于即时本地伪随机噪声码分别超前和滞后预定数目的码片。

示例性地，预定数目码片可以是1个码片。

示例性地，经压缩信号的大小可以为一个码片，且可以被划分为多个码片格子。

示例性地，生成经压缩信号的步骤可以包括：确定经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及将经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。

示例性地，根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号的步骤可以包括：响应于即时本地伪随机噪声码的相邻两个码片之间的边缘分别符合(1)为上升沿，(2)为下降沿，(3)保持+1，(4)保持-1，根据即时本地伪随机噪声码的码片边缘生成遮罩信号，其中遮罩信号的两个相邻的半码片的值与即时本地伪随机噪声码相一致且其余码片的值为0。

示例性地，上述方法可以进一步包括：根据信号压缩单元102所生成的、用于测量输入信号的码片形状的数据，确定输入信号的、包括码片上升沿和下降沿的实时码片形状，以及对信号压缩单元102所生成的、用于测量输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得相关峰。

本申请对信号压缩单元中一个跟踪通道的全部采样点进行并行计算，采用将采样点根据其所属的码片格子映射到对应的一个线程的并行运算方法，并且线程通过确定属于同一个码片格子的相邻采样点之间的间隔来高效寻找属于同一个码片格子的全部采样点以完成累加。该并行计算方式使得每个线程所需使用的寄存器数量大幅降低，提高了计算效率以及码片形状和相关峰测量的分辨率上限。

根据本申请的另一方面，提供了一种基于GPU并行计算的装置，包括：存储器，存储有计算机可执行的指令；以及处理器，执行指令以实现上文所述的方法。

根据本申请的另一方面，提供了一种存储介质，其包括计算机可执行的指令，该指令被执行时实现上文所述的方法。

图4示出了根据本申请实施例的码片形状相关器监测GPS L1CA信号的1号卫星的1s平滑相关峰的结果40。此处的信号由Spirent GSS9000模拟源生成，经过信号压缩单元102的压缩后，由累加单元104进行滑动相加，得到多路的相关值，实现相关峰的实时测量。在码片的格子数为40的情况下，最多可以生成81路相关值，而本实施例中按照0.05码片间隔生成了39路相关值。从图中可以看出，测量得到的相关峰和标准的相关峰十分接近，说明当前接收信号正常。

图5和图6分别示出了根据本申请实施例的码片形状相关器监测添加了幅度为0.5、延迟为0.2码片的同向和反向多径GPS L1CA信号的1号卫星的1s平滑相关峰的结果50和60。从图中可以看出，在相关峰第四个采样点处相关函数的斜率发生了明显的变化，因此可以得知多径的延迟为0.2码片，多径的相位和幅度也可以根据具体的斜率计算得出。这说明了根据本申请实施例的码片形状相关器可以通过相关峰实时测量来实现对接收信号多径等失真的监测。

图7示出了根据本申请实施例的码片形状相关器监测GPS L1C/A信号的1号卫星的1s平滑码片上升沿的结果70。在码片相位为-0.5到0.5的一个码片内，共有40个格子，因此，码相位间隔为0.025码片，能够较为清晰的表示码片的上升沿形状。

图8和图9分别示出了根据本申请实施例的码片形状相关器监测添加了幅度为0.5、延迟为0.2码片的同向和反向多径下的GPS L1C/A信号的1号卫星的1s平滑码片上升沿的结果80和90。从图中可以看出，多径导致了码片形状的很大改变。所得到的码片上升沿信息，可以用于多径抑制等技术的后续处理。

下面的表1示出了根据本申请实施例的码片形状相关器方法和传统多路相关器方法在跟踪环节处理1ms数据所需要的平均时间。测试所使用的GPU为NVIDIA GeForce RTX 3080，测试中同时处理GPS系统的L1C/A和L5信号，BDS系统的B1C、B2a、B1I信号，以及GAL系统的E1OS和E5a信号，共7种信号，每种信号12个通道，因此，总共84个通道，其中作为对照的传统多路相关器方法同样通过GPU并行计算，输出5路相关信号。根据本申请实施例的码片形状相关器分为只输出39路相关值、以及输出39路相关值的同时输出码片上升沿形状这两种情况。可以看出，由于采用信号压缩方法减少了计算量，码片形状相关器计算39路相关值所花费的时间小于使用传统多路相关器计算5路相关值所花费的时间，而码片形状相关器额外计算码片上升沿会使得时间消耗增加，但平均0.58ms处理1ms的数据仍然可以保证接收机运行的实时性。

码片形状相关器方法和传统多路相关器方法处理1ms数据所需平均时间如下表1所示。

表1

以上实施方式仅用于说明本申请，而并非对本申请的限制。有关技术领域的普通技术人员，在不脱离本申请的精神和范围的情况下，可以对本申请所公开的实施方式和实施例做出各种变化和变型，因此所有等同的技术方案也属于本申请的范畴，本申请的专利保护范围由权利要求限定。

Claims

一种基于GPU并行计算的实时码片形状相关器，包括：

遮罩生成单元，其配置成根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；以及

信号压缩单元，其配置成：

使用所述即时本地伪随机噪声码对所述遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算以生成用于测量所述输入信号的码片形状的数据；和/或

根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算，以生成用于测量所述输入信号与本地伪随机噪声码的协相关的相关峰的数据；其中，所述超前伪随机噪声码和所述滞后伪随机噪声码相对于所述即时本地伪随机噪声码分别超前和滞后预定数目的码片。
根据权利要求1所述的实时码片形状相关器，其中，所述预定数目码片包括1个码片。
根据权利要求1-2中任一项所述的实时码片形状相关器，其中，所述经压缩信号的大小为一个码片，且被划分为多个码片格子；

其中，所述信号压缩单元进一步配置成：

确定所述经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，

根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及

将所述经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。
根据权利要求1所述的实时码片形状相关器，其中，当所述即时本地伪随机噪声码的相邻两个码片之间的边缘分别符合(1)为上升沿，(2)为下降沿，(3)保持+1，(4)保持-1时，根据所述即时本地伪随机噪声码的码片边缘所生成的所述遮罩信号的两个相邻的半码片的值与所述即时本地伪随机噪声码相一致且其余码片的值为0。
根据权利要求1所述的实时码片形状相关器，进一步包括：

码片形状测量单元，其配置成根据所述信号压缩单元所生成的、用于测量所述输入信号的码片形状的数据，确定所述输入信号的、包括码片上升沿和下降沿的实时码片形状；以及

累加单元，其配置成对所述信号压缩单元所生成的、用于测量所述输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得所述相关峰。
一种基于GPU并行计算的方法，包括：

根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号；

使用所述即时本地伪随机噪声码对所述遮罩信号与输入信号的乘积进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算以生成用于测量所述输入信号的码片形状的数据；和/或

根据即时本地伪随机噪声码、超前伪随机噪声码和滞后伪随机噪声码对输入信号进行压缩，生成经压缩信号，并且对所述经压缩信号进行计算，以生成用于测量所述输入信号与本地伪随机噪声码的协相关的相关峰的数据；其中，所述超前伪随机噪声码和所述滞后伪随机噪声码相对于所述即时本地伪随机噪声码分别超前和滞后预定数目的码片。
根据权利要求6所述的方法，其中，所述预定数目码片包括1个码片。
根据权利要求6-7中任一项所述的方法，其中，所述经压缩信号的大小为一个码片，且被划分为多个码片格子；

其中，生成所述经压缩信号的步骤包括：

确定所述经压缩信号的属于同一个码片格子的相邻采样点之间的间隔，

根据所确定的间隔来寻找属于同一个码片格子的全部采样点，以及

将所述经压缩信号的属于同一个码片格子的全部采样点映射到统一计算设备架构CUDA的一个线程以执行并行计算。
根据权利要求6所述的方法，其中，根据即时本地伪随机噪声码的码片边缘生成相应的遮罩信号的步骤包括：

响应于所述即时本地伪随机噪声码的相邻两个码片之间的边缘分别符合(1)为上升沿，(2)为下降沿，(3)保持+1，(4)保持-1，根据所述即时本地伪随机噪声码的码片边缘生成所述遮罩信号，其中所述遮罩信号的两个相邻的半码片的值与所述即时本地伪随机噪声码相一致且其余码片的值为0。
根据权利要求6所述的方法，进一步包括：

根据所述信号压缩单元所生成的、用于测量所述输入信号的码片形状的数据，确定所述输入信号的、包括码片上升沿和下降沿的实时码片形状，以及

对所述信号压缩单元所生成的、用于测量所述输入信号与本地伪随机噪声码的协相关的相关峰的数据进行滑动累加，以获得所述相关峰。
一种基于GPU并行计算的装置，包括：

存储器，存储有计算机可执行的指令；以及

处理器，执行所述指令以实现如权利要求6-10中任一项所述的方法。
一种存储介质，包括计算机可执行的指令，所述指令被执行时实现权利要求6-10中任一项所述的方法。