CN107133110A - 基于集群并行运算的gnss导航信号海量数据快速处理方法 - Google Patents

基于集群并行运算的gnss导航信号海量数据快速处理方法 Download PDF

Info

Publication number
CN107133110A
CN107133110A CN201710284834.3A CN201710284834A CN107133110A CN 107133110 A CN107133110 A CN 107133110A CN 201710284834 A CN201710284834 A CN 201710284834A CN 107133110 A CN107133110 A CN 107133110A
Authority
CN
China
Prior art keywords
data
node
cluster
parallel
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710284834.3A
Other languages
English (en)
Other versions
CN107133110B (zh
Inventor
贺成艳
卢晓春
郭际
王雪
饶永南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Time Service Center of CAS
Original Assignee
National Time Service Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Time Service Center of CAS filed Critical National Time Service Center of CAS
Priority to CN201710284834.3A priority Critical patent/CN107133110B/zh
Publication of CN107133110A publication Critical patent/CN107133110A/zh
Application granted granted Critical
Publication of CN107133110B publication Critical patent/CN107133110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明提供了一种基于集群并行运算的GNSS导航信号海量数据快速处理方法,收集所有有关GNSS导航数据处理的各类型数据;挑选出能够综合分析、相互无依赖关系的数据;采用若干计算机作为节点构建集群环境;针对挑选出的数据进行任务分解、数据分解或数据流分解;最终构建可并行执行算法。本发明将GNSS导航信号处理算法的多数据源特性和集群的多任务进行无缝集成,针对GNSS导航信号处理的数据种类繁多、数据量巨大等问题,提出了构建基于集群环境的并行执行框架,大大提高运算效率和实时性,提高运算的可靠性。

Description

基于集群并行运算的GNSS导航信号海量数据快速处理方法
技术领域
本发明涉及一种信号并行处理方法。
背景技术
卫星导航从基础研究领域(天文学、力学、物理学、地球动力学等)到工程技术领域(信息传递、深空探测、空间飞行器、时间传递、测速授时等),以及关系国民经济建设和国家安全的诸多重要部门和领域(海事、交通、救援、精准农业、地震监测、电子通讯等)等各个方面,均占据重要地位,发挥着重要作用。可以说,卫星导航技术是各种基础理论、最新科技成果、国家科技水平和综合实力的集中体现。
卫星导航信号是卫星导航系统中最重要的组成部分,是卫星、地面运控与用户之间协调工作的纽带。卫星导航信号质量的好坏将直接关系到系统定位、授时和测速等基本功能、关键性能和关键指标的实现。因此,全球导航卫星系统(Global NavigationSatellite System,GNSS)导航信号质量监测评估是卫星导航系统完好性的重要保障手段。
目前国内外已经开展对GNSS卫星导航信号质量的监测评估工作,而且随着科技的发展,信号质量监测评估技术和手段越来越成熟,监测越来越全面,数据量越来越大:例如美国斯坦福大学、德国宇航研究院、英国奇尔波顿天文台、中国科学院国家授时中心、中国卫星导航定位总站、中国电子科技集团54所、北京航空航天大学、华中科技大学等单位和机构,他们均利用国内外可利用的高增益天线(天线增益大于20dBi)、相应的测试测量仪器(频谱仪、矢量信号分析仪、示波器、功率计、硬件接收机)及高速数据采集设备(多通道高速数据同步采集设备),对接收的卫星导航信号进行全方位多角度的实时监测、采集和离线分析。
然而研究发现,GNSS导航信号质量评估工作中每天连续监测采集的数据量非常之大:每天有若干台频谱仪、矢量信号分析仪、示波器、功率计等标准测量仪器对信号进行实时不间断的监测;有若干台全向天线接收机实时监测所有可视在轨卫星,并实时输出各颗卫星的伪距、载波相位、多普勒、载噪比、相关曲线、定位解算数据;有若干台监测接收机实时监测高增益大口径天线(一般增益高于20dbi)所对准的卫星,并实时输出该颗卫星的伪距、载波相位、多普勒、载噪比、相关曲线数据;还有多通道同步数据高速采集设备,能够对接收的卫星信号进行多个通道的高速高采样率同步数据采集与回放;另外,还有来自整个监测评估接收系统的自身标校测量数据,来自外界周边电磁环境的干扰监测数据,来自气象测试测量仪器有关温度、湿度、气压的测量数据。粗略计算结果表明:频谱仪、矢量信号分析仪、示波器、功率计等标准测量仪器按每秒输出一个测量值计算,则每天每台标准仪器输出的数据量大约为120MBytes,按5台测量仪器计算为600M Bytes/天;监测接收机每天每台数据量大约为20MBytes,按8台测量仪器计算为160M Bytes/天;多通道同步数据采集设备数据量巨大,按照250MHz的采样率计算,每通道每采集1秒的数据量即为500M Bytes,按3个通道计算为1.5G Bytes/秒,若每天采集1小时的数据,则约为5400G Bytes/天;另外,为提高GNSS信号分析测量精度,还有定期或不定期的其他测量数据,如接收系统自身标校测量数据、周边电磁环境监测数据、气象测量数据。
然而,如此巨大的数据量,若还是按照传统的串行计算方法进行离线分析,则事后分析滞后时间太长,不能及时发现GNSS卫星出现的各种故障,用户接收到异常的GNSS卫星导航信号,会产生较大的定位、测速和授时误差,因此会给用户带来较大程度的影响。
发明内容
为了克服现有技术在数据处理过程中经常存在速度慢、实时性差的不足,本发明提供一种基于集群环境的针对GNSS海量数据处理的并行算法,通过构建集群并行运算环境及基于动态分配的并行算法,能够提高数据处理运算效率,为我国卫星导航服务性能的实时监测评估以及故障快速预测预警提供有价值的参考,进一步为保障我国卫星导航系统的高可靠服务性能和安全性做贡献。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1,收集所有有关GNSS导航数据处理的各类型数据;挑选出能够综合分析、相互无依赖关系的数据;
步骤2,采用若干计算机作为节点构建集群环境,包括用户节点、管理节点、存储节点和计算节点;所述的用户节点提供用户界面,接受用户任务,通过运行调度器将任务分派到其它节点,并将运算结果返回给用户;所述的管理节点对集群中的任意节点进行监视和操作,并处理集群中所有节点的日志和报警信息;所述的存储节点提供存储共享,确保数据同步访问;所述的计算节点包括胖节点和工作节点,胖节点的计算能力优于工作节点,每个集群包括1个胖节点和若干工作节点;各个节点间通过进程间通信网络在执行并行任务时进行进程间通信,管理节点通过管理网络收集集群信息、监视集群计算机和执行维护任务的网络,计算节点通过存储访问网络访问存储节点;
步骤3,针对步骤1挑选出的数据进行任务分解、数据分解或数据流分解;所述的任务分解对应用程序根据其执行的功能进行分解;所述的数据分解将应用程序根据各任务所处理的数据进行分解,利用多个线程对不同的数据块执行相同的操作;所述的数据流分解将一个线程的输出作为另一个线程的输入;
步骤4,构建可并行执行算法,具体步骤如下:
(1)通过提取存储节点的数据文件和文件列表文件标识,完成数据采集文件的提取;
(2)对提取的数据文件进行合理性检验、剔除野值、系统误差修正和公共误差修正;
(3)将M个同步通道、每个通道N颗卫星、每颗卫星L个频点的任务一次性投入集群系统,并行计算,最后在胖节点上面完成各工作节点计算数据比价汇总;
(4)对于需要其他指标结果作为输入的数据,在执行并行计算后执行串行计算。
所述的步骤(4)之后,客户端与集群绘图服务程序建立TCP Socket连接,通过并行和管道两种方式传输绘图或显示所需数据,由集群JAVA接口配合绘图调度完成绘图并行处理。
所述的步骤(4)计算的参数及结果图形在胖节点上按照预定义的评估结果报表格式或要求汇总,利用多线程进行作业日志管理和报表显示。
本发明的有益效果是:
本发明为克服目前现有技术无法实现巨大数据的存储、管理和处理等问题,提出了一种基于集群并行运算的GNSS导航信号海量数据快速处理技术,不仅涵盖如何确定数据处理算法是否可并行执行,以及如何构建集群并行运算环境,还解决了如何分解待并行执行的算法,以及如何构建可并行的执行算法的问题。相比现有技术,本发明将GNSS导航信号处理算法的多数据源特性和集群的多任务进行无缝集成,针对GNSS导航信号处理的数据种类繁多、数据量巨大等问题,提出了构建基于集群环境的并行执行框架,大大提高运算效率和实时性,提高运算的可靠性。
本发明可应用于全球卫星导航系统(包括我国BeiDou、美国GPS、欧盟Galileo等系统)卫星导航信号的分析处理,尤其是对GNSS卫星导航信号质量的监测评估、导航信号畸变的快速诊断与实时预警建模技术的研究与实现,有重要作用,在有效提高数据处理的运算效率基础上,能够在信号畸变未对用户造成影响或影响不严重的情况下,及时发现该异常并在最短时间内进行异常诊断,然后及时告知卫星、地面运控及用户,给系统决策者提供有效决策依据,便于其及时采取相应措施进行修正或补救,从而将信号畸变对用户和整个系统的影响降到最低,提高卫星导航系统服务性能的可靠性和完好性,进一步提高我国在国际卫星导航领域的地位,提高我国卫星导航系统在国际上的竞争力。
附图说明
图1为集群环境构建示意图;
图2为集群软件系统结构图;
图3为OpenMP并行计算内存共享示意图;
图4为OpenMP并行计算原理示意图;
图5为GNSS导航信号处理集群硬件环境架构图;
图6为GNSS导航信号处理算法整体并行执行框架;
图7为GNSS导航信号标准测量仪器数据处理并行执行框架;
图8为GNSS导航信号接收机数据处理并行执行框架;
图9为GNSS导航信号多通道同步数据处理捕获算法并行执行框架;
图10为GNSS导航信号多通道同步数据处理整体算法并行执行框架;
图11为GNSS导航信号综合分析处理并行执行框架;
图12为GNSS导航信号各类计算结果综合及绘图算法并行执行框架。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
本发明包括以下步骤:
一、步骤1,收集所有有关GNSS导航数据处理的各类型数据;挑选出能够综合分析、相互无依赖关系的数据。若数据间相互依赖较大,则并行处理效果不明显,不建议利用本发明设计的并行处理技术。本步骤所涉及的主要发明内容主要为:卫星导航信号数据处理算法是否可并行执行的判决方法,具体判决方法如下:
根据数据收集情况,若各类型数据的处理之间无相互依赖关系,也即对某种数据的处理并不依赖于其他数据的处理情况,而在最终能够综合各种数据的分析结果,给出综合评估结果,则能够综合分析相互无依赖关系数据的处理算法适合进行集群并行处理。然后,相互无依赖关系的各类数据共同进入下一步的集群处理。例如,对于GNSS导航数据处理的各类型数据,包括标准测量仪器数据、全向天线接收机数据、监测接收机数据、多通道同步数据采集数据、标校数据、干扰监测数据和气象测试测量数据,各类数据之间无相互依赖关系,如对标准测量仪器的数据处理并不依赖于其他数据,各类型数据可单独进行处理,而在各类型数据处理完毕后,综合各类数据分析处理结果,从而给出GNSS导航信号评估最终结果。
由于各种数据的数据类型、数据大小、数据频率有可能不同,因此,在进行并行处理前,先进行可并行性分析。进行GNSS导航信号评估,每天都需要利用多种测量仪器设备实时或非实时地采集不同类型数据:每天有若干台全向天线接收机实时监测所有可视在轨卫星,并实时输出各颗卫星的伪距、载波相位、多普勒、载噪比、相关曲线、定位解算数据;由于全向天线的低信噪比特点,需要利用高增益大口径天线(一般增益大于20dbi)连接若干台监测接收机实时监测单颗在轨卫星,进行单星精细质量观测和数据采集,并实时输出该颗卫星的伪距、载波相位、多普勒、载噪比、相关曲线数据;还有多通道同步数据高速采集设备,能够对接收的卫星信号进行多个通道的高速高采样率同步数据采集与回放;另外,还有来自整个监测评估接收系统的自身标校测量数据,来自外界周边电磁环境的干扰监测数据,来自气象测试测量仪器有关温度、湿度、气压测量数据。
技术效果:该发明内容能够明确待分析算法是否可以进行基于集群的并行运算,仅当算法具备可并行执行的潜能,才能提利用本发明提高运算效率。
二、步骤2,采用若干计算机作为节点构建集群环境,包括用户节点、管理节点、存储节点和计算节点;所述的用户节点提供用户界面,接受用户任务,通过运行调度器将任务分派到其它节点,并将运算结果返回给用户;所述的管理节点对集群中的任意节点进行监视和操作,并处理集群中所有节点的日志和报警信息;所述的存储节点提供存储共享,确保数据同步访问;所述的计算节点包括胖节点和工作节点,胖节点的计算能力优于工作节点,每个集群包括1个胖节点和若干工作节点;各个节点间通过进程间通信网络在执行并行任务时进行进程间通信,管理节点通过管理网络收集集群信息、监视集群计算机和执行维护任务的网络,计算节点通过存储访问网络访问存储节点。
本步骤所涉及的主要发明内容主要为:集群环境的最优化构建方法,具体构建方法如下:
若数据处理算法可并行,则下一步是针对算法构建集群并行运算环境。并行计算的基本思想是,利用多个处理器来协同求解同一问题,将被分析的问题根据其特点分解成若干部分,每个不同的部分分别交由一个独立的线程来并行计算,然后将各个线程的计算结果按照分解的特点进行交互和整合。集群并行运算系统是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,称之为节点。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用的资源的具体位置,集群系统会自动完成。
集群环境使用的服务器根据各自的功能,通常可以分为用户节点、管理节点、存贮节点和计算节点四种。它们的角色分别是:
(1)用户节点
提供用户界面的计算机。它从用户那里接受任务,运行调度器将任务分派到其它计算机,并将运算结果返回给用户。
(2)管理节点
提供管理功能的计算机。它能够使管理员从这一计算机对集群中的任意一台计算机进行监视和操作,并处理集群中所有计算机的日志和报警信息。
(2)存储节点
提供存储共享的计算机。为了使任务可以并行执行,每台执行任务的计算机必须能够访问同样的数据。存储节点通过网络共享或其它方式来确保数据访问的同步。
(4)计算节点
真正执行计算任务的计算机,根据其计算能力,又被分为胖节点和工作节点:一般胖节点的计算能力和计算机性能优于工作节点。每个集群环境一般仅需要1台胖节点和若干台工作节点。实际应用中可根据所使用的计算机类型和计算机性能,选择性能最高的作为胖节点。集群中的大部分计算机都是计算节点这种类型,而其中大部分又都为工作节点,仅有少数需要耗费大量资源的并行线程工作在胖节点。
一个高性能集群环境通常同时使用三个网络,它们分别是进程间通信网络(用于并行任务执行时的进程间通信的专用网络,通常要求延迟小,带宽大)、管理网络(用来收集集群信息、监视集群计算机和执行维护任务的网络)和存储访问网络(用来访问公用存储的专用网络)。根据具体的使用需求和选择的节点特性,这些网络可以使用多种介质和协议。本发明附图1-附图5中详细给出了如何构建集群环境的三个网络:通信网、管理网和存储访问网。
技术效果:该发明内容能够帮助构建基于集群的并行运算环境,为算法的并行实施提供硬件基础条件。
实例说明:如附图1至附图5所示,构建集群并行运算环境。本发明提供一种已成功应用在某部GNSS导航信号质量监测评估系统中的集群环境构建方法:
(1)集群硬件运行环境
1)计算节点服务器
a)计算机类型:IBM X3650M4
b)CPU:2*E5-2620
c)内存:32GB
d)网卡:双端口万兆网卡
e)数量:7台
2)胖节点服务器
a)计算机类型:IBM X3850X5
b)CPU:4*E7-4830
c)内存:128GB
d)网卡:双端口万兆网卡
e)数量:1台
3)存储服务器
a)计算机类型:IBM X3650M4
b)CPU:E5-2620
c)内存:32GB
d)硬盘空间:4*1TB
e)网卡:双端口万兆网卡
f)数量:1台
4)集群管理服务器
a)计算机类型:IBM X3650M4
b)CPU:E5-2620
c)内存:32GB
d)网卡:双端口万兆网卡
e)数量:1台
(2)软件支撑环境
1)集群节点操作系统:Linux(CentOS 6.4 64位);
2)程序开发语言(集群):Matlab、C/C++、Java、Shell、python。
(3)运行库
序号 内容 版本号
1 Pich2 1.5
2 Gcc 4.4.7
3 G++ 4.4.7
4 Fortran g77
5 Matlab 2013a
6 Cuda 5.5
7 Hadoop 1.2.1
8 Spark 0.7.3
9 Scala 2.9.3
10 Mesos 0.14.2
11 Python 2.6.6
12 JDK 1.7
13 Thrift 0.9.0
Open MP定义了一套编译指导语句,用于指定程序的并行性、数据的共享和私有信息。Open MP以线程为基础,采用Fork-Join的形式,即在程序开始执行的时候,只有主线程的运行线程存在,当遇到需要并行的时候,派生出Fork线程(创建新线程或者唤醒已有线程)来执行并行任务,此时主线程和派生线程共同工作,并行结束后,派生线程退出或者挂起,不再工作,控制流程回到单独的主线程中(Join,即多线程的会和)。
三、步骤3,针对步骤1挑选出的数据进行任务分解、数据分解或数据流分解;所述的任务分解对应用程序根据其执行的功能进行分解;所述的数据分解将应用程序根据各任务所处理的数据进行分解,利用多个线程对不同的数据块执行相同的操作;所述的数据流分解将一个线程的输出作为另一个线程的输入。
本步骤所涉及的主要发明内容主要为:并行执行算法的分解方法,具体分解方法如下:
根据数据处理的任务不同、数据类型不同、每种数据的特点不同,本发明提出从以下三个层次进行算法分解的方式,具体分解方法设计如下:
(1)任务分解:对应用程序根据其执行的功能进行分解的过程称为任务分解(taskdecomposition)。例如,GNSS信号处理需要每天给出一个评估结果报告,但是每天可能有若干个任务,在不同时间段对不同数据进行采集。这就需要根据不同任务进行分解,每个任务独立分析,最终给出多个任务的综合分析结果。
(2)数据分解:数据分解也称为数据级并行(data-level parallelism),是将应用程序根据各任务所处理的数据,而非按任务来进行分解的方法,利用多个线程对不同的数据块执行相同的操作。例如,GNSS信号处理的每个任务一般都需要采集各类型的数据,这种情况下可对不同数据进行分解,每种互不依赖的数据进行独立分析,最终给出该任务下的数据综合分析结果。
(3)数据流分解:一个线程的输出作为另一个线程的输入,应注意尽量避免延迟。在很多情况下,当对一个问题进行分解时,关键问题在于数据在这些任务之间是如何流动的,这个时候就要采用数据流分解方式。例如,对于各类标准测量仪器,每天可能会连续采集较长时间(几个小时或十几、二十几个小时)的数据,对于T0时刻的数据,它既是T0+1时刻预测模型的输入,也是T0时刻数据分析步骤的输入,也即每时刻数据都有不同的数据流动,根据各种数据类型数据的流动特点,并行执行各类数据流,最终给出每种数据的综合数据分析结果。
技术效果:该发明内容能够帮助实现算法的最优化并行分解,更加充分地利用集群并行环境资源,更加高效地实现算法的并行处理。
实例说明:如附图6所示,将数据处理算法分解为若干可并行执行的部分。本发明提供一种已成功应用在某部GNSS导航信号质量监测评估系统中的可并行执行数据分解方法。具体做法是将GNSS导航信号处理算法分解为五大子步骤,分解方法和原理如下:
子步骤一:任务管理和任务配置:用于服务管理,负责调度、状态上报、用户信息接收、记录各种日志、管理接口;
子步骤二:数据处理并行分解:标准测量仪器数据处理、接收机数据处理、多通道同步数据处理、标校数据处理、干扰数据处理和气象数据处理;
(1)标准测量仪器数据处理:启用独立的集群线程专门用于处理来自频谱仪、信号分析仪、示波器、功率计数据;
(2)接收机数据处理:启用独立的集群线程专门用于处理来自全向天线接收机和监测接收机输出的伪距、载波相位、多普勒、载噪比、相关曲线、定位解算数据;
(3)多通道同步数据处理:启用独立的集群线程专门用于处理来自多通道同步数据采集设备的高采样率大数据,这部分数据量巨大,并行执行过程应分配给该部分绝大部分的计算资源;
(4)标校数据处理:启用独立的集群线程专门用于处理整个导航信号接收通道的标校数据,包括幅频特性、相频特性、群时延特性,尽量减小接收通道的非理想特性给评估结果带来的不确定影响;
(5)干扰数据处理:启用独立的集群线程,专门用于处理导航信号接收系统周边电磁干扰的数据,包括干扰的功率、频点和带宽,尽量减小电磁干扰对评估结果带来的不确定影响;
(6)气象数据处理:启用独立的集群线程,专门用于处理导航信号采集过程中的气象监测数据,包括气压、温度、湿度,尽量减小气象条件对评估结果带来的不确定影响。
子步骤三:综合分析处理:综合标准测量仪器数据处理分析结果、接收机数据处理分析结果、多通道同步数据处理分析结果,并结合接收系统自身标校测量数据、周边电磁干扰监测数据、气象测量数据的处理结果,给出GNSS导航信号分析处理综合评估结果;
子步骤四:动态界面管理:人机交互界面,专门用于各类输入参数和输出项的设置和选择;
子步骤五:评估结果报表管理:根据各部分的综合分析结果,给出最终评估结果。
四、步骤4,构建可并行执行算法,具体步骤如下:
(1)通过提取存储节点的数据文件和文件列表文件标识,完成数据采集文件提取;
(2)对提取的数据文件进行合理性检验、剔除野值、系统误差修正和公共误差修正;
(3)将M个同步通道、每个通道N颗卫星、每颗卫星L个频点的任务一次性投入集群系统,并行计算,最后在胖节点上面完成各工作节点计算数据比价汇总;
(4)对于需要其他指标结果作为输入的数据,在执行并行计算后执行串行计算。
本步骤所涉及的主要发明内容主要为:可并行执行算法最优化构建方法,具体分解方法如下:
明确了数据处理能够进行并行运算,并构建了基于集群的并行运算环境,同时也确定了对算法进行何种分解之后,最后是进行算法的并行执行和实施。GNSS导航信号监测和评估需要分析处理来自不同仪器设备和各种来源的数据,包括各种标准测量仪器如频谱仪、信号分析仪、示波器、功率计数据,来自全向天线接收机和监测接收机输出的伪距、载波相位、多普勒、载噪比、相关曲线、定位解算数据,来自多通道同步数据采集设备的高采样率大数据,以及来自接收系统自身标校测量数据、周边电磁环境监测数据、气象测量数据,数据量之大、数据种类之多,因此,必须构建可并行执行的算法,以期最大程度上提高算法的运算效率,提高算法的实时性。
本发明将算法的多元性和集群的多任务进行无缝集成,针对GNSS导航信号处理的多数据源和大数据量等问题,提出构建基于集群环境的并行执行框架,根据GNSS导航信号分析处理的数据源特性和算法的功能,将算法分为五大步骤(详见具体实施方式),从而实现算法的最优化并行处理。
技术效果:该发明内容能够帮助实现GNSS卫星导航信号处理算法的最优化并行设计与实施,相比传统处理方法,能够大大提高运算效率和实时性,提高运算的可靠性。
实例说明:将算法分解后,根据各类型输入数据特点,构建可并行快速执行的基于集群环境的并行处理算法。本发明提供一种已成功应用在某部GNSS导航信号质量监测评估系统中的并行执行算法最优化构建方法。具体做法如下:
(1)任务管理和任务配置:主要负责各并行执行部分间的调度与状态上报,所以根据负责内容的不同,在编写程序过程中,最好按照程序负责内容的不同,编译不同的目标可执行文件,其目的就是可以根据需要启动或是注销不同功能数据处理部分,以便利用多进程或是线程,并且有效的利用内存空间,不会发生长时间无人职守工作期间任何内存泄漏现象发生。
(2)标准测量仪器数据处理:如附图7所示,主要完成对示波器、矢量信号分析仪、实时频谱分析仪、矢量网络信号分析仪、功率计等仪器监测数据的读取、解析、处理、中间参数计算和参数存贮功能。读取数据库中相关数据,完成参数计算和图形绘制工作。利用集群系统进行多个仪器并行处理,数据处理能力大,虽然需计算参数之间相互有依赖,但时间延时不是很大,所以总体上可以表现出并行效果。
标准测量仪器数据处理可以显示并修改界面输入数据,可以显示标准测量仪器数据处理的中间计算结果,并将中间结果和最终分析结果显示并用文本导出。
(3)接收机数据处理:如附图8所示,类似标准测量仪器数据处理,多种不同类型或不同的接收机数据投入集群系统同时并行处理,完成对各类接收机数据的高速实时处理,分析评估接收机输出的伪距、载波相位、多普勒、载噪比、相关曲线、定位解算数据。
接收机数据处理可以显示并修改界面输入数据,可以显示接收机数据处理的中间计算结果,并将中间结果和最终分析结果显示并用文本导出。
(4)多通道同步数据处理:如附图9和附图10所示。这部分需要处理的数据量巨大,是利用集群系统资源最多的部分。
第一步,通过提取多通道同步数据采集存储设备的数据文件和文件列表文件标识,完成数据采集文件的提取工作;
第二步,提取的数据文件预处理,目的是对所接收的协议转换后的数据,进行合理性检验、剔除野值和作必要的系统误差修正和公共误差修正,对各类观测数据进行检验、系统差修正和其它处理,为进一步的信息处理做前期数据准备;
第三步,主要完成软件接收机的捕获工作,由于捕获各颗卫星数据之间互不依赖,所以使用并行方法,一次性投入集群系统,并行计算结果,最后在胖节点上面完成各分计算节点计算数据比价汇总,得出结论。如附图9所示,假设有M个同步通道,每个通道N颗卫星,每颗卫星有L个频点,则这M*N*L个小任务之间互不依赖,可以MPI并行化;
第四步,主要完成软件接收机的跟踪工作。如附图10所示,因为跟踪过程前后数据有部分依赖关系,因此,可将不依赖前后数据的计算放入了集群系统中并行运算。而且M个通道互不依赖,可利用MPI并行化;
第五步,参数计算。绝大多数参数可以独立进行计算,因此投入集群系统并行计算能大大提高运算效率,但对于有些指标的计算还需要其他很多指标结果作为输入的情况,则将可并行部分执行完后,再执行串行计算。
多通道同步数据处理可以显示并修改界面输入数据,可以显示中间计算结果,并将中间结果和最终分析结果显示并用文本导出。
(5)标校数据、干扰数据和气象数据的处理:这部分是启用独立的集群线程,专门用于处理整个导航信号接收通道的标校数据、干扰数据和气象数据,输出整个导航信号接收通道的幅频特性、相频特性、群时延特性,输出导航信号接收系统周边电磁干扰的功率、频点和带宽,输出导航信号接收时的气压、温度、湿度特性,尽量减小接收通道的非理想特性、电磁干扰和气象条件给评估结果带来的不确定影响;
(6)综合分析处理:如图11所示,综合评估主要是利用各类型数据的计算结果(标准处理仪器数据处理、接收机数据处理、多通道同步数据处理、标校数据处理、电磁干扰数据处理和气象数据处理结果)以及预设的门限值,完成对已计算出的指标汇总,包括了对底层服务、各个部分计算结果的参数融合、最终评估指标的计算和存储功能,需要进行数据挖掘、数据信息再加工、多数据的联合绘图、指标门限超限报警。该部分由于需要调用多种数据关系,而且数据间存在依赖关系,因此在胖节点上完成。
综合分析处理可以显示并修改界面输入数据,可以显示中间计算结果,并将中间结果和最终分析结果显示并用文本导出。
(7)动态界面管理:该部分完成对客户端与服务器控制信令、参数和图片数据的交互。用户通过互联网或者局域网访问Web服务器,服务器随即调用相应的服务,经过计算返回结果给访问者。其主进程在胖节点上运行,每一个用户登录都是一个独立的进程,界面上的每一个并行执行部分、图表都分为了独立的线程,可以独立刷新,从而保证页面的完整性和流畅性。因为考虑到今后使用安全性的要求,该部分可先部署在胖节点上,并且只具有读权限,随着技术的完善和操作的成熟,可增加高级用户的写权限。
五、步骤5:评估结果并行计算及并行绘图显示。
如附图12所示,各部分数据处理实时计算相应参数,一旦参数计算成功,则具体绘图工作由集群JAVA接口配合绘图调度完成并行处理,图形绘制服务不仅需要传输大量实时或是非实时数据,还需要同时兼顾用户操作和图形配置参数,因此,本发明使用两种数据传输方式:一是并行方式,二是管道方式。如图12所示,Gnuplot是一个命令行的交互式绘图工具(command-driven interactive function plotting program)。用户通过输入命令,可以逐步设置或修改绘图环境。
绘图的根源来自客户端,可以是人为手动操作或自动定时刷新。客户端要和集群的绘图服务程序建立TCP Socket连接,而绘图服务程序会启动绘图子进程,通过管道传输绘图需要的参数,图形绘制完成后,画图服务程序读取该文件并发给客户端。客户端和绘图服务程序间每一个图形文件请求都用独立的线程来完成。
技术效果:该发明内容能够将卫星导航信号各参数的计算及结果绘制同时进行,相比传统串行数据处理方法,能够大大提高运算效率,从而进一步提高卫星导航信号数据处理实时性。
六、步骤6:最终结果并行输出。
评估结果报表管理负责将GNSS导航信号处理的最终结果以报表的形式或按照所需格式和方式输出。因为需要综合各类并行执行数据处理部分输出的中间数据和结果信息,所以该部分最好在胖节点上运行,按照定义好的生成步骤,并行逐一汇总。该部分主要有两大方面:一是作业日志管理,二是输出报表显示,可作多线程处理。
技术效果:该发明内容能够将并行执行算法的输出结果并行输出显示,相比传统串行结果展示处理方法,能够大大提高数据处理效率。

Claims (3)

1.一种基于集群并行运算的GNSS导航信号海量数据快速处理方法,其特征在于包括下述步骤:
步骤1,收集所有有关GNSS导航数据处理的各类型数据;挑选出能够综合分析、相互无依赖关系的数据;
步骤2,采用若干计算机作为节点构建集群环境,包括用户节点、管理节点、存储节点和计算节点;所述的用户节点提供用户界面,接受用户任务,通过运行调度器将任务分派到其它节点,并将运算结果返回给用户;所述的管理节点对集群中的任意节点进行监视和操作,并处理集群中所有节点的日志和报警信息;所述的存储节点提供存储共享,确保数据同步访问;所述的计算节点包括胖节点和工作节点,胖节点的计算能力优于工作节点,每个集群包括1个胖节点和若干工作节点;各个节点间通过进程间通信网络在执行并行任务时进行进程间通信,管理节点通过管理网络收集集群信息、监视集群计算机和执行维护任务的网络,计算节点通过存储访问网络访问存储节点;
步骤3,针对步骤1挑选出的数据进行任务分解、数据分解或数据流分解;所述的任务分解对应用程序根据其执行的功能进行分解;所述的数据分解将应用程序根据各任务所处理的数据进行分解,利用多个线程对不同的数据块执行相同的操作;所述的数据流分解将一个线程的输出作为另一个线程的输入;
步骤4,构建可并行执行算法,具体步骤如下:
(1)通过提取存储节点的数据文件和文件列表文件标识,完成数据采集文件的提取;
(2)对提取的数据文件进行合理性检验、剔除野值、系统误差修正和公共误差修正;
(3)将M个同步通道、每个通道N颗卫星、每颗卫星L个频点的任务一次性投入集群系统,并行计算,最后在胖节点上面完成各工作节点计算数据比价汇总;
(4)对于需要其他指标结果作为输入的数据,在执行并行计算后执行串行计算。
2.根据权利要求1所述基于集群并行运算的GNSS导航信号海量数据快速处理方法,其特征在于:所述的步骤(4)之后,客户端与集群绘图服务程序建立TCP Socket连接,通过并行和管道两种方式传输绘图或显示所需数据,由集群JAVA接口配合绘图调度完成绘图并行处理。
3.根据权利要求2所述基于集群并行运算的GNSS导航信号海量数据快速处理方法,其特征在于:所述的步骤(4)计算的参数及结果图形在胖节点上按照预定义的评估结果报表格式或要求汇总,利用多线程进行作业日志管理和报表显示。
CN201710284834.3A 2017-04-27 2017-04-27 基于集群并行运算的gnss导航信号海量数据快速处理方法 Active CN107133110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710284834.3A CN107133110B (zh) 2017-04-27 2017-04-27 基于集群并行运算的gnss导航信号海量数据快速处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710284834.3A CN107133110B (zh) 2017-04-27 2017-04-27 基于集群并行运算的gnss导航信号海量数据快速处理方法

Publications (2)

Publication Number Publication Date
CN107133110A true CN107133110A (zh) 2017-09-05
CN107133110B CN107133110B (zh) 2020-07-14

Family

ID=59716453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710284834.3A Active CN107133110B (zh) 2017-04-27 2017-04-27 基于集群并行运算的gnss导航信号海量数据快速处理方法

Country Status (1)

Country Link
CN (1) CN107133110B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542946A (zh) * 2018-10-26 2019-03-29 贵州斯曼特信息技术开发有限责任公司 一种实时计算大数据系统和方法
CN110837497A (zh) * 2019-11-07 2020-02-25 青岛市光电工程技术研究院 数据质量的检测方法、装置及服务器
CN111061697A (zh) * 2019-12-25 2020-04-24 中国联合网络通信集团有限公司 日志数据处理方法、装置、电子设备及存储介质
CN111597051A (zh) * 2020-05-21 2020-08-28 天水师范学院 一种多通道数字信号处理的方法
CN111624631A (zh) * 2020-05-19 2020-09-04 中国科学院国家授时中心 一种并行化信号质量评估方法
CN112583884A (zh) * 2020-08-21 2021-03-30 中国科学院国家授时中心 一种对外发布服务方法
CN113115330A (zh) * 2021-03-17 2021-07-13 中国人民解放军国防科技大学 一种基于大数据分析的北斗短报文服务优化方法与系统
CN113836130A (zh) * 2021-09-28 2021-12-24 深圳创维智慧科技有限公司 数据质量评估方法、装置、设备及存储介质
WO2023279815A1 (zh) * 2021-07-08 2023-01-12 华为技术有限公司 性能监控系统及相关方法
CN116859419A (zh) * 2023-07-11 2023-10-10 中国科学院空天信息创新研究院 一种基于分布式架构的卫星导航实时数据流管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103037002A (zh) * 2012-12-21 2013-04-10 中标软件有限公司 一种云计算集群环境中服务器集群的部署方法及系统
CN103412897A (zh) * 2013-07-25 2013-11-27 中国科学院软件研究所 一种基于分布式结构的并行数据处理方法
CN103455633A (zh) * 2013-09-24 2013-12-18 浪潮齐鲁软件产业有限公司 一种海量网络发票明细数据分布式分析方法
CN104572941A (zh) * 2014-12-30 2015-04-29 杭州华为数字技术有限公司 数据存储方法、装置和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103037002A (zh) * 2012-12-21 2013-04-10 中标软件有限公司 一种云计算集群环境中服务器集群的部署方法及系统
CN103412897A (zh) * 2013-07-25 2013-11-27 中国科学院软件研究所 一种基于分布式结构的并行数据处理方法
CN103455633A (zh) * 2013-09-24 2013-12-18 浪潮齐鲁软件产业有限公司 一种海量网络发票明细数据分布式分析方法
CN104572941A (zh) * 2014-12-30 2015-04-29 杭州华为数字技术有限公司 数据存储方法、装置和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李林阳等: "海量GNSS数据分布式存储与计算方法", 《导航定位学报》 *
陈正生等: "大规模GNSS数据的分布式处理与实现", 《武汉大学学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109542946A (zh) * 2018-10-26 2019-03-29 贵州斯曼特信息技术开发有限责任公司 一种实时计算大数据系统和方法
CN110837497A (zh) * 2019-11-07 2020-02-25 青岛市光电工程技术研究院 数据质量的检测方法、装置及服务器
CN111061697B (zh) * 2019-12-25 2023-06-13 中国联合网络通信集团有限公司 日志数据处理方法、装置、电子设备及存储介质
CN111061697A (zh) * 2019-12-25 2020-04-24 中国联合网络通信集团有限公司 日志数据处理方法、装置、电子设备及存储介质
CN111624631A (zh) * 2020-05-19 2020-09-04 中国科学院国家授时中心 一种并行化信号质量评估方法
CN111597051A (zh) * 2020-05-21 2020-08-28 天水师范学院 一种多通道数字信号处理的方法
CN112583884A (zh) * 2020-08-21 2021-03-30 中国科学院国家授时中心 一种对外发布服务方法
CN113115330A (zh) * 2021-03-17 2021-07-13 中国人民解放军国防科技大学 一种基于大数据分析的北斗短报文服务优化方法与系统
CN113115330B (zh) * 2021-03-17 2022-06-17 中国人民解放军国防科技大学 一种基于大数据分析的北斗短报文服务优化方法与系统
WO2023279815A1 (zh) * 2021-07-08 2023-01-12 华为技术有限公司 性能监控系统及相关方法
CN113836130A (zh) * 2021-09-28 2021-12-24 深圳创维智慧科技有限公司 数据质量评估方法、装置、设备及存储介质
CN113836130B (zh) * 2021-09-28 2024-05-10 深圳创维智慧科技有限公司 数据质量评估方法、装置、设备及存储介质
CN116859419A (zh) * 2023-07-11 2023-10-10 中国科学院空天信息创新研究院 一种基于分布式架构的卫星导航实时数据流管理方法
CN116859419B (zh) * 2023-07-11 2024-04-30 中国科学院空天信息创新研究院 一种基于分布式架构的卫星导航实时数据流管理方法

Also Published As

Publication number Publication date
CN107133110B (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN107133110A (zh) 基于集群并行运算的gnss导航信号海量数据快速处理方法
CN108306756B (zh) 一种基于电力数据网全息评估系统及其故障定位方法
Lindsay et al. Towards real-time eruption forecasting in the Auckland Volcanic Field: application of BET_EF during the New Zealand National Disaster Exercise ‘Ruaumoko’
CN104156296B (zh) 智能监控大规模数据中心集群计算节点的系统和方法
Guo et al. Complex power system status monitoring and evaluation using big data platform and machine learning algorithms: a review and a case study
CN106547882A (zh) 一种智能电网中营销大数据的实时处理方法及系统
CN109831478A (zh) 基于规则及模型的分布式实时处理智能决策系统及方法
CN108801441A (zh) 一种基于工业互联网及边缘计算的汽轮机数据采集系统
CN104793612B (zh) 一种无人机地面控制站测试与数据采集方法及其系统
Wan et al. Kfiml: Kubernetes-based fog computing iot platform for online machine learning
CN107729138A (zh) 一种高性能分布式矢量空间数据的分析方法和装置
CN104008443A (zh) 一种陆地观测卫星数据地面接收站网的任务规划调度系统
CN108763299A (zh) 一种大规模数据处理计算加速系统
CN102945198B (zh) 一种表征高性能计算应用特征的方法
CN110968636A (zh) 面向地震预警的多维大数据分析与处理系统
CN102982037B (zh) 检测数据库节点健康状况的方法及装置
Hasan et al. The role of big data in China’s sustainable forest management
CN103501253A (zh) 一种高性能计算应用特征的监控组织方法
CN104199889A (zh) 基于CEP技术的RTLogic大数据处理系统及方法
CN106067096A (zh) 一种数据处理方法、装置及系统
Fiore et al. Big data analytics on large-scale scientific datasets in the indigo-datacloud project
Krawczyk et al. Tryton supercomputer capabilities for analysis of massive data streams
CN104299037B (zh) 一种自动化空间环境模式评估系统及方法
Khan et al. Web performance evaluation of high volume streaming data visualization
Kuehn et al. Monitoring data streams at process level in scientific big data batch clusters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant