CN113708916A - 一种基于gpu的pcm/fm遥测信号并行多符号检测方法 - Google Patents

一种基于gpu的pcm/fm遥测信号并行多符号检测方法 Download PDF

Info

Publication number
CN113708916A
CN113708916A CN202110789622.7A CN202110789622A CN113708916A CN 113708916 A CN113708916 A CN 113708916A CN 202110789622 A CN202110789622 A CN 202110789622A CN 113708916 A CN113708916 A CN 113708916A
Authority
CN
China
Prior art keywords
data
signal
parallel
module
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110789622.7A
Other languages
English (en)
Other versions
CN113708916B (zh
Inventor
焦义文
孙宽飞
马宏
杨文革
吴涛
李超
李冬
滕飞
毛飞龙
高泽夫
李远鹏
柴恬怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Original Assignee
Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peoples Liberation Army Strategic Support Force Aerospace Engineering University filed Critical Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority to CN202110789622.7A priority Critical patent/CN113708916B/zh
Publication of CN113708916A publication Critical patent/CN113708916A/zh
Application granted granted Critical
Publication of CN113708916B publication Critical patent/CN113708916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L7/00Arrangements for synchronising receiver with transmitter
    • H04L7/02Speed or phase control by the received code signals, the signals containing no special synchronisation information
    • H04L7/033Speed or phase control by the received code signals, the signals containing no special synchronisation information using the transitions of the received signal to control the phase of the synchronising-signal-generating means, e.g. using a phase-locked loop
    • H04L7/0337Selecting between two or more discretely delayed clocks or selecting between two or more discretely delayed received code signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/38Synchronous or start-stop systems, e.g. for Baudot code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/18Phase-modulated carrier systems, i.e. using phase-shift keying
    • H04L27/22Demodulator circuits; Receiver circuits
    • H04L27/233Demodulator circuits; Receiver circuits using non-coherent demodulation
    • H04L27/2332Demodulator circuits; Receiver circuits using non-coherent demodulation using a non-coherent carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/18Phase-modulated carrier systems, i.e. using phase-shift keying
    • H04L27/22Demodulator circuits; Receiver circuits
    • H04L27/233Demodulator circuits; Receiver circuits using non-coherent demodulation
    • H04L27/2334Demodulator circuits; Receiver circuits using non-coherent demodulation using filters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L7/00Arrangements for synchronising receiver with transmitter
    • H04L7/04Speed or phase control by synchronisation signals
    • H04L7/10Arrangements for initial synchronisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供基于GPU的PCM/FM遥测信号并行多符号检测方法,所述方法基于具有GPU的遥测解调系统实现,所述具有GPU的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;信号采集模块对信号进行数字采样及调节信号幅度;高速接口模块接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;系统控制模块将分段后的数据分配给所述核心运算模块;核心运算模块包括多个GPU;所述方法包括:并行数字下变频、并行FIR滤波、并行鉴频、并行多符号检测和多普勒频偏估计,多符号检测又分为并行滑动相关运算、累加求幅度运算、比较求最值三部分。本发明的方案,可靠性更高,扩展性更好,可以实现信号的实时解调。

Description

一种基于GPU的PCM/FM遥测信号并行多符号检测方法
技术领域
本发明涉及通信技术领域,尤其涉及一种基于GPU的PCM/FM遥测信号并行多符号检测方法。
背景技术
飞行器遥测是导弹、火箭、卫星等航天器试验和运行过程中必不可少的重要支持系统,能够实时监测航天器内部工作状态、电气性能、环境参数等重要信息,为航天器性能检测、效能评估及故障分析提供依据。现如今随着航天事业的深入发展,全球各个航天大国对宇宙的探索和对宇宙资源的争夺愈加强烈,这就使得遥测技术突显出更为重要的作用。
脉冲编码调制/调频(PCM/FM)技术具有较强的抗尾焰效应能力、抗噪声性能强、发射机功率高等特点,成为国内外航空航天遥测领域长期采用的一种主流体制。PCM/FM体制在遥测系统中运用多年,调频信号本身具有较好的抗干扰能力,传统解调方式为非相干解调,非相干解调具有结构简单的解调设计电路。
经过几十年的发展,遥测系统已经从早期的功能分立的专用设备逐步发展成为多功能数字遥测系统,具有数字化程度高、多功能一体化等优点,较好地满足了现有任务的需要。面向未来任务日益多样化,试验环境日趋复杂化,对遥测系统的灵活适应性提出了更高要求。传统基于软件无线电设计理念的遥测系统侧重于功能的“软件实现”,尽管近年来软件化程度越来越高,但其灵活适应性仍然受到限制,主要体现在:①系统控制和执行设备仍然相互依赖,硬件资源不可切割和按需分配,性能升级与功能扩展需要对硬件环境进行重新部署,这种单纯通过扩展设备量和增加系统复杂度的方式,不适应未来日益增多的试验任务需求;②面向既定任务和功能需求的定制化研发模式,难以快速响应用户的即时需求,不适应未来复杂多变的试验任务需求。因此,迫切需要寻求对传统软件无线电遥测系统的设计理念和研发模式的转型,进一步提高遥测系统的灵活适应性。
传统的PCM/FM遥测解调多采用基于FPGA的硬件板卡实现,核心解调算法由FPGA完成。常用的基于FPGA的PCM/FM遥测信号解调器由信号处理模块、接口模块和数据采集模块组成,系统的结构框图如图1所示。其中数据采集模块将模拟信号进行数字采样,信号处理模块完成信号的下变频、滤波、多符号检测,接口模块负责将解调数据输出。
图1所示的结构以基于FPGA的信号处理板卡为核心,外加一些时钟管理和电源管理等模块,该板卡主要完成遥测信号的解调以及数据格式转换,但存在以下不足:
(1)硬件系统结构复杂,嵌入式系统开发周期长、成本高,升级维护难度大;(2)软硬件之间高度的耦合性使得系统专用性强,一旦设计制造完成,功能扩展和修改困难大;(3)系统开发门槛高,完成系统的整体开发和调试需要开发人员克服硬件系统、软件语言、处理算法等多方面困难。
发明内容
为解决上述技术问题,本发明提出了一种基于GPU的PCM/FM遥测信号并行多符号检测方法,所述方法,用于解决现有技术中(1)基于FPGA板卡的信号处理所存在的软硬件紧耦合、开发周期长和升级难度大的技术问题;(2)基于GPU的多符号检测算法的实时性问题。
根据本发明的第一方面,提供一种基于GPU的PCM/FM遥测信号并行多符号检测方法,
所述具有GPU的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;所述信号采集模块包括ADC模块、10MHz频标,用于对信号进行数字采样及调节信号幅度;所述高速接口模块包括高速以太网卡、存储服务器及处理模块,所述高速接口模块用于接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;所述系统控制模块包括CPU及缓存单元,所述缓存单元用于缓存所述数据信号,CPU用于调度任务、分发数据,并将数据分配给所述核心运算模块;所述核心运算模块包括多个GPU,所述核心运算模块以并行方式处理所述系统控制模块发送的据,进行并行数字下变频、重采样、并行鉴频、位同步以及多符号检测解调,多符号检测分为并行滑动相关运算、累加求幅度运算和比较求最值,GPU之间通过Nvlink总线互联,CPU和GPU之间的数据交互以及CPU对GPU的系统调度通过PCIE总线完成;
所述方法包括以下步骤:
步骤S401:所述信号采集模块包括ADC模块和数据分发服务(DDS,DataDistribution Servic)中间件,在所述数据采集模块中,模拟数据经过幅度调节后由模数转换模块进行采样;采样后的数字信号利用DDS中间件进行发布,然后通过万兆网络发送到所述高速接口模块的万兆网卡;
步骤S402:所述高速接口模块通过16x PCIE总线将采集到的数据输入到DDS中间件的缓存区,并在系统控制模块的调度下开始数据的循环缓存;
步骤S403:在所述系统控制模块的调度下,对DDS中间件缓冲区内的数据分段,GPU按段订阅数据,获取PCM/FM信号;
步骤S404:各GPU收到调度指令并获得数据后,将数据转化为浮点数;
步骤S405:各GPU利用数字控制振荡器(NCO)产生的信号进行并行下变频以降低频率,并根据估计的多普勒频偏误差对该数字控制振荡器的信号作实时消除误差处理;
步骤S406:对并行下变频后的数据进行并行时域滤波运算,以消除高频信号的干扰;同步执行步骤S407和步骤S408;
步骤S407:将滤波后的数据进行并行叉积鉴频运算;将得到的鉴频结果用于估计多普勒频偏误差,然后将所述频率偏差反馈到NCO进行频率修正;
步骤S408:对并行滤波后的数据进行4倍抽取以降低采样率,从而减小计算量;
步骤S409:对抽取后的数据进行位同步使数据位对齐,处理后的数据即为观测数据;
步骤S410:对所述观测数据,通过滑动窗口机制为其进行分段,以并行的方式计算每段观测数据的相关,每个线程块对应一段观测数据的计算;所述滑动窗口机制为:对所述观测数据,从所述观测数据的起始位开始,基于滑动步长及滑动窗口长度,同时获取所述观测数据的全部分段,每段观测数据的长度与滑动窗口长度相同;
步骤S411:对每段观测数据,将相关后的数据点按符号累加,并求每个符号位的幅度;
步骤S412:对每段观测数据,将每段观测数据的模平方结果划分为长度相同的两部分,获取前一半数据中幅度的最大值,以及后一半数据中幅度的最大值;
步骤S413:对每段观测数据,比较每段观测数据的两个幅度,进行符号位判决,若前一半数据对应的幅度最大值较大,则此符号位输出-1;若后一半数据对应的幅度的最大值较大,则此符号位输出1。
根据本发明的第二方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于GPU的PCM/FM遥测信号并行多符号检测方法。
根据本发明第三方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的GPU的PCM/FM遥测信号并行多符号检测方法。
根据本发明的上述方案,本发明对传统软件无线电遥测系统的设计思路进行改进,采用CPU+GPU的异构并行计算平台,以GPU作为核心的数据处理器件,用CPU完成任务的分配和调度,设计了基于GPU的PCM/FM遥测信号多符号检测方法,本发明可以有效降低遥测解调器的开发难度;商用器件和软件运算可有效提高系统对各种不同接口遥测解调系统的适应能力,可根据性能需求灵活配置GPU,克服现有技术不足。具有重构灵活、扩展性好等优势。利用GPU并行运算提高运算效率。可靠性更高,扩展性更好,设计实现更简单,可满足测控系统中PCM/FM遥测信号的实时解调需求。与传统基于FPGA的PCM/FM遥测信号解调器相比,本发明可靠性更高,扩展性更好;与传统基于GPU的PCM/FM遥测信号解调器相比,本发明并行性更好,可实现信号的实时解调。本发明利用GPU并行运算提高运行效率,可靠性更高,扩展性更好,更易实现,能够满足PCM/FM遥测信号的实时解调需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明提供如下附图进行说明。在附图中:
图1为现有技术中基于FPGA的PCM/FM遥测解调系统结构示意图;
图2为本发明一个实施方式的基于GPU的PCM/FM遥测解调系统结构示意图;
图3为本发明PCM/FM遥测信号解调框图;
图4为本发明一个实施方式的基于GPU的PCM/FM遥测信号并行多符号检测方法流程示意图;
图5为本发明一个实施方式的基于GPU的PCM/FM遥测信号多符号检测示意图;
图6为本发明一个实施方式的基带正交多符号检测原理示意图;
图7为本发明一个实施方式的多符号检测串行执行方式示意图;
图8为本发明一个实施方式的并行非相干鉴频流程示意图;
图9为本发明一个实施方式的多符号检测并行执行方式示意图;
图10为本发明一个实施方式的参考序列排列方式示意图。
具体实施方式
首先说明本发明一个实施方式的基于GPU的PCM/FM遥测信号多符号检测方法流程。所述基于GPU的PCM/FM遥测信号多符号检测方法,基于具有GPU的遥测解调系统实现,如图2所示,所述具有GPU的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;所述信号采集模块包括ADC模块、10MHz频标,用于对信号进行数字采样及调节信号幅度;所述高速接口模块包括高速以太网卡、存储服务器及处理模块,所述高速接口模块用于接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;所述系统控制模块包括CPU及缓存单元,所述缓存单元用于缓存所述数据信号,CPU用于调度任务、分发数据,并将数据分配给所述核心运算模块;所述核心运算模块包括多个GPU,所述核心运算模块以并行方式处理所述系统控制模块发送的据,进行并行数字下变频、重采样、并行鉴频、位同步以及多符号检测解调,多符号检测又分为并行滑动相关运算、累加求幅度运算和比较求最值三部分完成,GPU之间通过Nvlink总线互联,CPU和GPU之间的数据交互以及CPU对GPU的系统调度通过PCIE总线完成。
本实施例中,所述具有GPU的遥测解调系统采用CPU+GPU的异构并行计算平台,所述具有GPU的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块。所述数据采集模块由ADC模块、10MHz频标等部分构成,用于完成模拟中频信号的数字采样,同时辅以信号的幅度调节功能。所述系统控制模块是系统管控中心,由PC主机和缓存组成,用于分发数据、各模块的管理调度以及逻辑控制计算。所述核心运算模块由多块GPU计算显卡组成,是具有GPU的遥测解调系统的核心模块,此模块上进行并行运算,进行并行数字下变频、重采样、并行鉴频、位同步以及多符号检测解调,多符号检测又分为并行滑动相关运算、累加求幅度运算和比较求最值三部分完成。
本实施例中,多个GPU之间通过高速Nvlink总线互联,完成中间数据的交互,CPU和GPU之间的数据交互以及CPU对GPU的系统调度通过高速PCIE总线完成。各个模块之间通过高速以太网连接,上述实现方式提高了灵活性和可扩展性。
从调频特征来看待PCM/FM信号,其解调可以采用鉴频方式。但是遥测传输信道复杂,遥测信号在传输过程中受多径衰落的影响,难以提取相干载波,所以相干解调鉴频难于实施。在工程上常采用非相干鉴频解调方法,这种方法结构简单,容易实现,且对因多径衰落造成的幅度和相位方面的失真有较强的抗干扰能力。但非相干鉴频解调存在门限效应,多符号检测(Multi-symbol Detection,MSD)是一种充分利用码元之间的连续性来提高解调性能的技术。因此,PCM/FM遥测信号解调原理如图3所示,首先使用AD转换模块将模拟信号转换成数字信号。然后数字下变频模块(Digital Down Converter,简称DDC),将中频输入信号下变频到零中频信号,低通滤波器滤除高频干扰信号。之后进行内插、重采样以减小解调计算量,加快解调速度。利用I路、Q路信号进行非相干叉积鉴频,将得到的鉴频结果用于估计多普勒频偏,然后将频率偏差反馈到NCO进行频率修正;将重采样后的数据进行位同步;将位同步后的数据和本地存储数据作为多符号检测的输入,通过并行滑动相关计算、按符号累加、求幅度和比较幅度大小,获得最大幅度,并以此最大幅度得出-1或+1作为解调数据的输出。
多符号检测(MSD)是数字信号处理中的一项重要技术,由于其高计算复杂性,MSD算法在专用信号处理设备中实现,并且接收到的信号是连续的数据流、到达率极高,该数据流可能是无限的。因此,基于MSD的算法都要在单个PC或工作站上串行运行,将花费大量时间,结果导致需要实时处理的应用程序失败。因此本发明将利用GPU的特性实现并行多符号检测,进而达到实时解调的目的。
由于相干的多符号检测太过复杂难以实现,因此本实施例采用非相干的多符号检测方法。多符号检测就是在接收端产生所观测的2n+1个码元的所有可能传输的本地波形并分别和接收到相应的信号进行相关及平方运算,然后比较并判决第n+1个码元的极性(本例取n=2),使误码率达到最低。因此,便可以得到非相干多符号检测的原理图如图5所示。
多符号检测算法的串行执行方式如图7所示。假设观测长度为5,又观测长度决定着参考序列的个数,则参考序列的个数为32(=25)。s表示采样率,c表示码速率,则s/c为码长。码长为8,那么参考序列长度为40(=8*5)。MSD算法首先计算接收到信号实数部分与每一个参考序列点乘的结果,然后在虚数部分执行类似过程。根据计算结果,得到模值,选取最大模值对应的参考序列作为这一组信号判定的结果。然后将接收信号向前滑动一个单位,重复以上计算过程,所有接收信号被判定完成。MSD算法的串行伪代码如下:
Figure BDA0003160562030000081
Figure BDA0003160562030000091
本实施例中,将数据并行与任务并行相结合,由系统控制模块中的数据预处理模块将缓存单元中的数据分解为多个片段。由于数据在时间上具有连续性和依赖性,所以在把数据划分为多个片段时,每个片段的端部均与其相邻的片段端部具有部分数据重叠,用以保持数据的连续性和依赖性。重叠部分的长度等于观测长度,例如,将每一片段的头部与其相邻的片段的尾部作观测长度的重叠,将每一片段的尾部与其相邻的片段的头部作观测长度的重叠。由于数据重叠部分的长度远小于每段数据的长度,所以每段都有的重复计算所占用的时间微不足道。
再对每个片段按流水方式进行任务分解,所述核心运算模块包括并行下变频模块、并行FIR低通滤波模块、并行鉴频模块和多符号检测模块,其中多符号检测模块用于进行并行滑动相关运算、累加求幅度运算和比较求最值。所述核心运算模块对每个片段数据进行流水式的任务分解,由一个核函数各自完成一个任务,多个核函数实现任务的并行处理。本实施例的方式,既解决了数据连续性问题,又解决了并行处理问题,能够应用于基于高性能计算的遥测解调中。
如图4、图6所示,图8为基于CUDA(Compute Unified Device Architecture,统一计算设备架构)架构的并行非相干鉴频流程,数据需要经过下变频、FIR低通滤波和鉴频操作。数据的处理包括:(1)在数据预处理阶段,根据数据特性和计算资源数量将数据分解为M段;(2)对每一个数据段,在数据段内,根据频率生成NCO,执行并行下变频,将中心频率搬移到基带;(3)对下变频后的数据执行并行滤波,同步执行步骤(4)和步骤(5);(4)对滤波后的数据进行差分鉴频;并利用鉴频结果计算多普勒频偏,并根据多普勒频偏结果对NCO进行多普勒误差补偿;(5)对并行滤波后的数据进行4倍抽取以降低采样率达到减小计算量的目的;(6)对抽取后的数据进行位同步使数据位对齐,提高多符号检测的准确性;(7)将位同步后的数据与本地数据进行并行滑动相关,为了加速内存读取效率将数据存在共享内存中;(8)将相关后的数据点按符号累加,并求每个符号位的幅度;(9)获取前一半数据幅度的最大值和后一半数据幅度的最大值;(10)比较两个幅度,若前一半数据幅度的最大值较大,则此符号位输出-1;若后一半数据幅度的最大值较大,则此符号位输出+1。
本实施例中,利用数据分段将数据和流程最大限度解耦合,提高系统的并行性,用空间复杂度换取数据处理时间复杂度,实现处理数据的并行化。由于MSD计算复杂度很高,MSD串行执行的时间消耗非常大,因此采用基于GPU的并行的MSD方法。基于GPU的PCM/FM遥测信号并行多符号检测方法包括:
步骤S401:所述信号采集模块包括ADC模块和数据分发服务(DDS,DataDistribution Servic)中间件,在所述数据采集模块中,模拟数据经过幅度调节后由模数转换模块进行采样;采样后的数字信号利用DDS中间件进行发布,然后通过万兆网络发送到所述高速接口模块的万兆网卡;
步骤S402:所述高速接口模块通过16x PCIE总线将采集到的数据输入到DDS中间件的缓存区,并在系统控制模块的调度下开始数据的循环缓存;
步骤S403:在所述系统控制模块的调度下,对DDS中间件缓冲区内的数据分段,GPU按段订阅数据,获取PCM/FM信号;
步骤S404:各GPU收到调度指令并获得数据后,将数据转化为浮点数;
步骤S405:各GPU利用数字控制振荡器(NCO)产生的信号进行并行下变频以降低频率,并根据估计的多普勒频偏误差对该数字控制振荡器的信号作实时消除误差处理;
本实施例中,进行数字下变频以降低频率,包括:
将观测时段内接收到的中频信号进行数字下变频处理,得到同相和正交两路基带正交信号,
观测时段内接收到的中频信号可以简化表示为:
s(t)=cos[ωct+f(t)+θ1] (公式1)
其中s(t)为PCM/FM遥测信号,ωc为载波频率,t为时间,f(t)为调制信号,θ1为初始相位;
对s(t)进行数字下变频处理,采用NCO产生的正交本振为cos(ωct)和sin(ωct)与s(t)相乘,经过混频滤波之后,得到正交基带信号为:
I=cos(f(t)+θ1) (公式2)
Q=-sin(f(t)+θ1) (公式3)
转化为复信号形式:R=I+j·Q=cos(f(t)+θ1)-j·sin(f(t)+θ1) (公式4)
其中R为接收到的遥测信号,I为同相信号,Q为正交信号;
步骤S406:对并行下变频后的数据进行并行时域滤波运算,以消除高频信号的干扰;同步执行步骤S407和步骤S408;
步骤S407:将滤波后的数据进行并行叉积鉴频运算;将得到的鉴频结果用于估计多普勒频偏误差,然后将所述频率偏差反馈到NCO进行频率修正;
步骤S408:对并行滤波后的数据进行4倍抽取以降低采样率,从而减小接下来的计算量;
步骤S409:对抽取后的数据进行位同步使数据位对齐,处理后的数据即为观测数据;
步骤S410:对所述观测数据,通过滑动窗口机制为其进行分段,以并行的方式计算每段观测数据的相关,每个线程块对应一段观测数据的计算;所述滑动窗口机制为:对所述观测数据,从所述观测数据的起始位开始,基于滑动步长及滑动窗口长度,同时获取所述观测数据的全部分段,每段观测数据的长度与滑动窗口长度相同;
本实施例中,以观测数据长度为10位为例,设定步长为1,滑动窗口长度为5,则从所述观测数据的起始位开始,基于滑动步长及滑动窗口长度,同时获取所述观测数据的全部分段,所述分段后观测数据分别为1-5位、2-6位、3-7位、4-8位、5-10位对应的观测数据。
并行处理方式如图9所示,本例中为提高内存读取效率,将本地数据和观测数据存在共享内存中。
本实施例中,计算每段观测数据的相关,包括:
发送所述当前观测数据,将与发送信号相同的本地复信号在观测时段内表示为:
L=cos(f(t)+θ2)+j·sin(f(t)+θ2) (公式5)
其中,L为本地复信号,θ2为本地复信号的初始相位,j为虚数单位;
将本地信号与所述正交基带信号相乘,得到
R·L=cos(θ21)+j·sin(θ21)
=IB+j·QB (公式6)
其中,IB为相关结果的同相分量,QB为相关结果的正交分量。
基于公式6可知,用和观测时段内传送的码元完全相同的那一个本地信号与接收到的正交基带信号相乘之后,得到的复信号保持不变。而其他的情况下,由于与所传送的那组基带码元不同,进行乘法运算后的复信号时刻发生着变化。本实施例中,每个线程块内由每个线程对应计算一种本地数据的组合。
步骤S411:对每段观测数据,将相关后的数据点按符号累加,并求每个符号位的幅度;
本实施例中,假设观测时段内的采样点数为Nc,则对公式6在观测时间内进行积分,得到:
M=Nc·IB+j·Nc·QB (公式7)
其中,M为累加结果;
对公式6得到的复信号进行模平方运算,得到
S=Nc 2·(IB 2+QB 2) (公式8)
步骤S412:对每段观测数据,将每段观测数据的模平方结果划分为长度相同的两部分,获取前一半数据中幅度的最大值,以及后一半数据中幅度的最大值;
步骤S413:对每段观测数据,比较每段观测数据的两个幅度,进行符号位判决,若前一半数据对应的幅度最大值较大,则此符号位输出-1;若后一半数据对应的幅度的最大值较大,则此符号位输出1。
又一实施方式为,在步骤S413后,还有步骤S414:监听符号位判决直至判决结束,方法结束。在该实施方式中,所述步骤S407为:将滤波后的数据进行并行叉积鉴频运算;将得到的鉴频结果用于估计多普勒频偏误差,然后将所述频率偏差反馈到NCO进行频率修正,进入步骤S414。
公式8表示的是当观测时段内与传送码元完全相同的那个本地信号对接收到的基带正交复信号进行相关平方等运算后的取值。由于其他情况下本地信号与接收到的正交信号相乘之后得到的复信号都是时变的,相关平方之后得到的值也都小于公式8的取值,因此,便可以通过上述过程判决所传送基带符号的极性。
本实施例中,不需要将所有相关结果存储到全局内存中,这会影响计算效率。可以将参考序列如图10排列,假设观测长度为5,则参考序列的个数为32(=25),分为两部分,每部分16个参考序列,第一组中间一位为-1,第二组中间一位为1。这样得出每部分的最大值M1、M2之后,再比较M1、M2大小,就能直接确定在观测长度的中间值是1或是-1。
多符号检测算法的并行执行的伪代码为:
Figure BDA0003160562030000141
Figure BDA0003160562030000151
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于GPU的PCM/FM遥测信号并行多符号检测方法。
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于GPU的PCM/FM遥测信号并行多符号检测方法。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,实体机服务器,或者网络云服务器等,需安装Windows、Linux或者Windows Server操作系统)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (6)

1.一种基于GPU的PCM-FM遥测信号并行多符号检测方法,其特征在于,所述具有GPU的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;所述信号采集模块包括ADC模块、10MHz频标,用于对信号进行数字采样及调节信号幅度;所述高速接口模块包括高速以太网卡、存储服务器及处理模块,所述高速接口模块用于接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;所述系统控制模块包括CPU及缓存单元,所述缓存单元用于缓存所述数据信号,CPU用于调度任务、分发数据,并将数据分配给所述核心运算模块;所述核心运算模块包括多个GPU,所述核心运算模块以并行方式处理所述系统控制模块发送的据,进行并行数字下变频、重采样、并行鉴频、位同步以及多符号检测解调,多符号检测分为并行滑动相关运算、累加求幅度运算和比较求最值,GPU之间通过Nvlink总线互联,CPU和GPU之间的数据交互以及CPU对GPU的系统调度通过PCIE总线完成;
所述方法包括以下步骤:
步骤S401:所述信号采集模块包括ADC模块和数据分发服务(DDS,Data DistributionServic)中间件,在所述数据采集模块中,模拟数据经过幅度调节后由模数转换模块进行采样;采样后的数字信号利用DDS中间件进行发布,然后通过万兆网络发送到所述高速接口模块的万兆网卡;
步骤S402:所述高速接口模块通过16x PCIE总线将采集到的数据输入到DDS中间件的缓存区,并在系统控制模块的调度下开始数据的循环缓存;
步骤S403:在所述系统控制模块的调度下,对DDS中间件缓冲区内的数据分段,GPU按段订阅数据,获取PCM/FM信号;
步骤S404:各GPU收到调度指令并获得数据后,将数据转化为浮点数;
步骤S405:各GPU利用数字控制振荡器(NCO)产生的信号进行并行下变频以降低频率,并根据估计的多普勒频偏误差对该数字控制振荡器的信号作实时消除误差处理;
步骤S406:对并行下变频后的数据进行并行时域滤波运算,以消除高频信号的干扰;同步执行步骤S407和步骤S408;
步骤S407:将滤波后的数据进行并行叉积鉴频运算;将得到的鉴频结果用于估计多普勒频偏误差,然后将所述频率偏差反馈到NCO进行频率修正;
步骤S408:对并行滤波后的数据进行4倍抽取以降低采样率,从而减小计算量;
步骤S409:对抽取后的数据进行位同步使数据位对齐,处理后的数据即为观测数据;
步骤S410:对所述观测数据,通过滑动窗口机制为其进行分段,以并行的方式计算每段观测数据的相关,每个线程块对应一段观测数据的计算;所述滑动窗口机制为:对所述观测数据,从所述观测数据的起始位开始,基于滑动步长及滑动窗口长度,同时获取所述观测数据的全部分段,每段观测数据的长度与滑动窗口长度相同;
步骤S411:对每段观测数据,将相关后的数据点按符号累加,并求每个符号位的幅度;
步骤S412:对每段观测数据,将每段观测数据的模平方结果划分为长度相同的两部分,获取前一半数据中幅度的最大值,以及后一半数据中幅度的最大值;
步骤S413:对每段观测数据,比较每段观测数据的两个幅度,进行符号位判决,若前一半数据对应的幅度最大值较大,则此符号位输出-1;若后一半数据对应的幅度的最大值较大,则此符号位输出1。
2.如权利要求1所述的基于GPU的PCM-FM遥测信号并行多符号检测方法,其特征在于,所述步骤S405,进行数字下变频以降低频率,包括:
将观测时段内接收到的中频信号进行数字下变频处理,得到同相和正交两路基带正交信号,
观测时段内接收到的中频信号可以简化表示为:
s(t)=cos[ωct+f(t)+θ1] (公式1)
其中s(t)为PCM/FM遥测信号,ωc为载波频率,t为时间,f(t)为调制信号,θ1为初始相位;
对s(t)进行数字下变频处理,采用NCO产生的正交本振为cos(ωct)和sin(ωct)与s(t)相乘,经过混频滤波之后,得到正交基带信号为:
I=cos(f(t)+θ1) (公式2)
Q=-sin(f(t)+θ1) (公式3)
转化为复信号形式:R=I+j·Q=cos(f(t)+θ1)-j·sin(f(t)+θ1) (公式4)
其中R为接收到的遥测信号,I为同相信号,Q为正交信号。
3.如权利要求2所述的基于GPU的PCM-FM遥测信号并行多符号检测方法,其特征在于,步骤S410中,计算每段观测数据的相关包括:
发送位同步后的数据,将与发送信号相同的本地复信号在观测时段内表示为:
L=cos(f(t)+θ2)+j·sin(f(t)+θ2) (公式5)
其中,L为本地复信号,θ2为本地复信号的初始相位,j为虚数单位;
将本地信号与所述正交基带信号相乘,得到
R·L=cos(θ21)+j·sin(θ21)
=IB+j·QB (公式6)
其中,IB为相关结果的同相分量,QB为相关结果的正交分量。
4.如权利要求3所述的基于GPU的PCM-FM遥测信号并行多符号检测方法,其特征在于,步骤S411:将相关后的数据点按符号累加,并求每个符号位的幅度,包括:
假设观测时段内的采样点数为Nc,则对公式6在观测时间内进行积分,得到:
M=Nc·IB+j·Nc·QB (公式7)
其中,M为累加结果;
对公式6得到的复信号进行模平方运算,得到
S=Nc 2·(IB 2+QB 2) (公式8)。
5.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4中任一项所述的基于GPU的PCM-FM遥测信号非相干解调实现方法。
6.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4中任一项所述的基于GPU的PCM/FM遥测信号并行非相干解调实现方法。
CN202110789622.7A 2021-07-13 2021-07-13 一种基于gpu的pcm/fm遥测信号并行多符号检测方法 Active CN113708916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110789622.7A CN113708916B (zh) 2021-07-13 2021-07-13 一种基于gpu的pcm/fm遥测信号并行多符号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110789622.7A CN113708916B (zh) 2021-07-13 2021-07-13 一种基于gpu的pcm/fm遥测信号并行多符号检测方法

Publications (2)

Publication Number Publication Date
CN113708916A true CN113708916A (zh) 2021-11-26
CN113708916B CN113708916B (zh) 2022-10-18

Family

ID=78648925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110789622.7A Active CN113708916B (zh) 2021-07-13 2021-07-13 一种基于gpu的pcm/fm遥测信号并行多符号检测方法

Country Status (1)

Country Link
CN (1) CN113708916B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124341A (zh) * 2022-01-21 2022-03-01 北京融为科技有限公司 一种适用于高码率调频信号的同步方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594393A (zh) * 2012-01-29 2012-07-18 北京航空航天大学 一种卫星综合基带设备的通用伪码同步系统
US20190028316A1 (en) * 2017-07-24 2019-01-24 Abov Semiconductor Co., Ltd. Method of simultaneously performing packet detection, symbol timing acquisition, and carrier frequency offset estimation using multiple correlation detection, and bluetooth apparatus using same
CN111682880A (zh) * 2020-04-17 2020-09-18 中国人民解放军战略支援部队航天工程大学 一种基于gpu的流式架构宽带信号数字下变频系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594393A (zh) * 2012-01-29 2012-07-18 北京航空航天大学 一种卫星综合基带设备的通用伪码同步系统
US20190028316A1 (en) * 2017-07-24 2019-01-24 Abov Semiconductor Co., Ltd. Method of simultaneously performing packet detection, symbol timing acquisition, and carrier frequency offset estimation using multiple correlation detection, and bluetooth apparatus using same
CN111682880A (zh) * 2020-04-17 2020-09-18 中国人民解放军战略支援部队航天工程大学 一种基于gpu的流式架构宽带信号数字下变频系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
成亚勇等: "基于GPU实现的调频遥测解调方法", 《无线电工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124341A (zh) * 2022-01-21 2022-03-01 北京融为科技有限公司 一种适用于高码率调频信号的同步方法
CN114124341B (zh) * 2022-01-21 2022-05-20 北京融为科技有限公司 一种适用于高码率调频信号的同步方法

Also Published As

Publication number Publication date
CN113708916B (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
CN107315168B (zh) 一种软件化雷达信号数据处理系统及方法
CN110488718B (zh) 超多通道全同步数据采集系统
CN108563144B (zh) 一种弹载雷达信号处理半实物仿真测试系统
CN103868513B (zh) 一种分布式pos用数据处理计算机系统
CN113708916B (zh) 一种基于gpu的pcm/fm遥测信号并行多符号检测方法
CN109443390B (zh) 一种数字陀螺仪相位延时测试系统
CN114050950B (zh) 一种基于gpu的pcm/fm多符号检测位同步方法
CN114167407A (zh) 一种多雷达融合感知处理方法、装置、车辆及存储介质
CN105259410A (zh) 一种强噪声干扰下的欠采样波形的频率估计方法及其装置
CN110460653A (zh) 自动驾驶车辆数据传输的方法及装置
CN105242287B (zh) 基于gpu和imu的卫星导航软件接收机及其导航方法
CN113672541B (zh) 一种基于gpu的pcm/fm遥测信号非相干解调实现方法
CN108768605B (zh) 管道内检测漏磁和惯导子系统数据的在线同步方法
CN110531314A (zh) 一种基于fpga异构计算的光纤矢量水听器目标方位估计方法及装置
CN101912277B (zh) 一种基于流水线设计的实时数字正交解调的方法与装置
US8615031B2 (en) Signal processing method, correlator, software signal receiver by using code cycle
CN109901128A (zh) 基于fpga的微波报靶信号处理系统
CN107592176A (zh) 组网气象雷达的时间和频率同步方法及装置
CN114461012B (zh) 一种嵌入式系统不同时钟域运行时戳获取方法及装置
CN109644041B (zh) 飞行器时间同步系统
CN107064942B (zh) 一种高精度多普勒信号模拟方法
CN103199879A (zh) 数字接收机信号的检测方法
CN111443336B (zh) 一种降低fmcw雷达系统数据传输吞吐量的方法
CN114839905A (zh) 一种量子测控方法及系统
CN113985374A (zh) 一种用于雷达系统的测试平台和测试方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant