CN113946575B - 时空轨迹数据处理方法、装置、电子设备及存储介质 - Google Patents

时空轨迹数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113946575B
CN113946575B CN202111066298.2A CN202111066298A CN113946575B CN 113946575 B CN113946575 B CN 113946575B CN 202111066298 A CN202111066298 A CN 202111066298A CN 113946575 B CN113946575 B CN 113946575B
Authority
CN
China
Prior art keywords
data
time
trajectory data
space
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111066298.2A
Other languages
English (en)
Other versions
CN113946575A (zh
Inventor
吴亚非
李小娟
臧义华
马兴民
梁佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 15 Research Institute
Original Assignee
CETC 15 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 15 Research Institute filed Critical CETC 15 Research Institute
Priority to CN202111066298.2A priority Critical patent/CN113946575B/zh
Publication of CN113946575A publication Critical patent/CN113946575A/zh
Application granted granted Critical
Publication of CN113946575B publication Critical patent/CN113946575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种时空轨迹数据处理方法、装置、电子设备及存储介质,该方法包括:建立分布式列式数据库的数据表结构;实时获取海上目标的时空轨迹数据;从时空轨迹数据中提取位置信息、时间信息以及时空轨迹数据类型信息;分别根据位置信息、时间信息以及时空轨迹数据类型信息得到相应的全球剖分网格编码值、时间版本号以及列族名;以得到的全球剖分网格编码值、时间版本号以及列族名作为索引将时空轨迹数据保存到分布式列式数据库中。本发明的时空轨迹数据处理方法充分考虑时空轨迹数据的时间和空间特性,提出了时间分层、空间分块的分布式“大表”结构模型,实现了对海量的多源异构时空轨迹数据的统一组织、集中管理和存储。

Description

时空轨迹数据处理方法、装置、电子设备及存储介质
技术领域
本发明属于大数据技术领域,尤其涉及一种时空轨迹数据处理方法、装置、电子设备及存储介质。
背景技术
航海是人类经济和社会活动的重要内容,各种海上目标在广阔的海域上进行着军事、民用的海事活动。随着信息技术的飞速发展,船舶自动识别系统(AutomaticIdentification System,AIS)、船载航行数据记录仪(Voyage Data Recorder,VDR)、北斗卫星和雷达等多种感知传感器广泛应用于对全球海上目标的航行活动进行位置定位、监控及航运交通管理,因此以船舶轨迹数据(影像数据、AIS数据、文本数据)为代表的时空轨迹数据呈现出爆炸式增长。
目前,很多信息系统均能够提供海上目标的时空信息服务应用,不同信息系统对于船舶轨迹数据的采集都有满足自身特点的采集方式,从而形成了实际场景中海上目标的时空轨迹数据的多源化和异构化。此外,海上目标的时空轨迹数据是多维的,其中包含时间和空间信息等各种属性信息。
而随着时空轨迹数据规模的迅速增长,用户对于轨迹数据的存储的要求也越来越高,同时由于业务需要高频次访存轨迹的不同样本或轨迹的不同部分,这需要高效的数据管理技术,可以快速存储实时数据和检索所需的轨迹数据。但传统的轨迹数据库通常采用关系数据库,关系数据库的表结构和数据类型过于固定,而不同类型海上目标的轨迹差异较大,已经难以满足时空轨迹数据的数据存储和管理要求。
发明内容
本发明意在提供一种时空轨迹数据处理方法、装置、电子设备及存储介质,以解决传统的轨迹数据库难以满足多源化和异构化的海上目标时空轨迹数据的数据存储和管理要求,本发明要解决的技术问题通过以下技术方案来实现:
本发明提供了一种时空轨迹数据处理方法,包括:
建立分布式列式数据库的数据表结构;所述数据表结构由行和包含多个列的列族构成,所述数据表结构采用行键标识每一行,所述行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,所述数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,所述列族中的每一列以代表属性信息的列名来标识,所述数据表结构的每一行键下均包含多个时间戳,每个所述时间戳采用代表不同时间段的时间版本号来标识;
实时获取海上目标的时空轨迹数据;
从所述时空轨迹数据中提取所述海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
确定与所述位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与所述时间信息所属时间段相对应的第一时间版本号,确定与所述时空轨迹数据类型信息相对应的第一列族名;
以行键为所述第一全球剖分网格编码值、时间戳为所述第一时间版本号、列族名为所述第一列族名作为索引,将所述海上目标的时空轨迹数据保存到所述分布式列式数据库中。
优选地,上述时空轨迹数据处理方法还包括:
确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;
以行键为所述第二全球剖分网格编码值、时间戳为所述第二时间版本号作为索引,从所述分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
对所述目标时空轨迹数据进行预处理;
对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;
对经身份融合处理后的所述目标时空轨迹数据进行汇总整理。
优选地,对所述目标时空轨迹数据进行预处理的步骤包括:
对所述目标时空轨迹数据中的非结构化数据进行结构分析和属性分析得到分析结果;
根据所述分析结果对所述目标时空轨迹数据中的非结构化数据进行数据解析得到解析数据;
按照结构化数据格式中包含的属性信息对所述解析数据进行补全处理。
优选地,对所述目标时空轨迹数据进行预处理的步骤还包括:删除所述目标时空轨迹数据中存在信息缺失和/或信息错误的数据。
优选地,预处理后的所述目标时空轨迹数据中包括来自m个数据源的多个数据集合,同一数据集合中的时空轨迹数据来自相同数据源且包含相同的目标标识;则,对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据的步骤包括:
从所述m个数据源中选择一个数据源作为基准源,其余m-1个数据源为{Yj|j=1,2,…,(m-1)};
对来自基准数据源的一个基准数据集合与来自数据源Yj的每一个待定数据集合执行以下身份融合处理:
遍历所述基准数据集合中的每一个时空轨迹数据Ai,从待定数据集合中确定满足时间要求的特定数据,所述时间要求为所述特定数据的时间在ti±Δt的时间范围内,其中,ti表示Ai的时间,Δt表示预设时间参数,i=1,2,…;计算Ai的位置坐标与所述特定数据的位置坐标之间的距离Di;判断Di是否小于预设距离阈值Dthred,若是,则对计数值进行累加;不断执行上述步骤直至遍历完所述基准数据集合中的所有时空轨迹数据;
如果最终得到的计数值大于或等于预设数量阈值,则确定所述待定数据集合与所述基准数据集合属于同一海上目标。
优选地,所述对经身份融合处理后的所述目标时空轨迹数据进行汇总整理的步骤包括:
采用特定算法对来自不同数据源的属于同一海上目标的时空轨迹数据中包含的目标标识进行运算,得到全局标识;所述来自不同数据源的属于同一海上目标的时空轨迹数据均对应于所述全局标识。
另一方面,本发明还提供了一种时空轨迹数据处理装置,包括:
数据表建立模块,用于建立分布式列式数据库的数据表结构;所述数据表结构由行和包含多个列的列族构成,所述数据表结构采用行键标识每一行,所述行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,所述数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,所述列族中的每一列以代表属性信息的列名来标识,所述数据表结构的每一行键下均包含多个时间戳,每个所述时间戳采用代表不同时间段的时间版本号来标识;
第一获取模块,用于实时获取海上目标的时空轨迹数据;
信息提取模块,用于从所述第一获取模块获取到的时空轨迹数据中提取所述海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
索引信息获取模块,用于确定与所述位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与所述时间信息所属时间段相对应的第一时间版本号,确定与所述时空轨迹数据类型信息相对应的第一列族名;
以及,数据保存模块,用于以行键为所述第一全球剖分网格编码值、时间戳为所述第一时间版本号、列族名为所述第一列族名作为索引,将所述海上目标的时空轨迹数据保存到所述分布式列式数据库中。
优选地,上述时空轨迹数据处理装置中还包括:第二获取模块、预处理模块、融合汇总模块,其中:
所述索引信息获取模块,还用于确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;
所述第二获取模块,用于以行键为所述第二全球剖分网格编码值、时间戳为所述第二时间版本号作为索引,从所述分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
所述预处理模块,用于对所述第二获取模块获取到的目标时空轨迹数据进行预处理;
所述融合汇总模块,用于对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;对经身份融合处理后的所述目标时空轨迹数据进行汇总整理。
再一方面,本发明还提供了一种电子设备,包括:处理器和存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述时空轨迹数据处理方法。
又一方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述时空轨迹数据处理方法。
为满足大数据的海量存储、统一组织、集中管理、多维检索、高效访问的要求,本发明的时空轨迹数据处理方法充分考虑时空轨迹数据的时间和空间特性,基于全球剖分网格编码和稀疏数据的列式管理,提出了时间分层、空间分块的分布式“大表”结构模型,实现了对海量的多源异构时空轨迹数据的统一组织、集中管理和存储。
附图说明
图1为本发明实施例的时空轨迹数据处理方法的流程示意图;
图2为GeoSOT网格的64位二进制2维编码结构示意图;
图3为本发明另一实施例的时空轨迹数据处理方法的流程示意图;
图4为图3中步骤204的一种实施例的流程示意图;
图5为本发明一种实施例的时空轨迹数据处理装置的结构框图;
图6为本发明另一种实施例的时空轨迹数据处理装置的结构框图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
参见图1所示,本发明实施例提供了一种时空轨迹数据处理方法,包括:
步骤102:建立分布式列式数据库的数据表结构;数据表结构由行和包含多个列的列族构成,数据表结构采用行键标识每一行,行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,列族中的每一列以代表属性信息的列名来标识,数据表结构的每一行键下均包含多个时间戳,每个时间戳采用代表不同时间段的时间版本号来标识。
稀疏数据是指在二维表中含有大量空值的数据,即在数据集中绝大多数数值缺失或者为零的数据。稀疏数据具有维度高、稀疏、模式易变等特点。由于存储稀疏数据的表中包含的属性很多(即宽表),而每次执行查询时并不需要读取表中的所有属性,因此,通常使用列式数据库来存储稀疏数据。稀疏数据的列式管理可以解决稀疏、动态、多结构数据的管理和存储。本实施例中考虑到时空轨迹数据不仅是稀疏数据,而且具有时间和空间特征,因而采用分布式列式数据库对海量的多源异构时空轨迹数据进行存储管理。在建立分布式列式数据库时首先要设置其数据表结构,该数据表是一个稀疏、多维、排序的映射表。
另外,考虑到时空轨迹数据具备空间和时间特性,设计数据表结构时按照全球剖分网格编码和时间版本号对数据进行时间分层、空间分块。
全球剖分网格是依据某种原则将地球表面逐级划分为多层次、无缝的、拟合地球表面的球面网格单元,每个网格单元代表不同尺度的空间区域,并有唯一的剖分编码值与之对应。通过全球剖分网格编码将全球空间进行分块;在时间维度上,对时间进行切分得到多个连续的时间段,每个时间段对应一个时间版本号,即时间分层。
步骤104:实时获取海上目标的时空轨迹数据;
本步骤中可以通过船舶自动识别系统(AIS)、船载航行数据记录仪(VDR)、北斗卫星和雷达等多种感知传感器获取海上目标的时空轨迹数据。
步骤106:从该时空轨迹数据中提取海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
本步骤中可以采用数据解析方法从时空轨迹数据中提取海上目标的位置信息、时间信息以及时空轨迹数据类型信息。
步骤108:确定与该位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与该时间信息所属时间段相对应的第一时间版本号,确定与该时空轨迹数据类型信息相对应的第一列族名;
本步骤中根据海上目标的位置信息确定对应的全球剖分网格编码值,根据时间信息确定时间版本号,并根据时空轨迹数据类型信息确定列族名。
步骤110:以行键为第一全球剖分网格编码值、时间戳为第一时间版本号、列族名为第一列族名作为索引,将海上目标的时空轨迹数据保存到分布式列式数据库中。
本步骤中,以全球剖分网格编码值、时间版本号以及列族名作为数据表结构的行/列索引将时空轨迹数据保存到分布式列式数据库中。
本发明实施例中,采用全球剖分网格编码为数据的时空关联展现提供了便利,与传统的统计展现方式相比,全球剖分网格编码可以更直观地展示全球不同区域的海上目标分布情况。通过无限可扩展列、基于空间分块的索引、基于时间分层的版本的多维数据管理模型,不仅提高海上目标大数据集的管理组织效率,而且有力支持了后续目标分析挖掘处理。可以支持上亿级数量的层次编码版本索引和千万数量级的列簇字段,提供高效、快速的时空轨迹数据汇聚管理手段,更好地支持分布式的大数据计算分析处理。
为满足大数据的海量存储、统一组织、集中管理、多维检索、高效访问的要求,本发明实施例的时空轨迹数据处理方法充分考虑时空轨迹数据的时间和空间特性,基于全球剖分网格编码和稀疏数据的列式管理,提出了时间分层、空间分块的分布式“大表”结构模型,实现了对海量的多源异构时空轨迹数据的统一组织、集中管理和存储。
在数据表结构中,在空间维度上利用全球剖分网格编码的数值作为行键,按照分块最大包含的原则实现数据的空间聚集,能够基于空间分块的高性能存取数据;在时间维度上提出时间版本的概念并将时间版本号作为数据的时间戳,将时间划分为多个连续时间段,时间段与时间版本号一一对应,同一时间段内的数据为同一版本,否则为新版本数据,便于各类数据能够在时间上聚集,便于数据按时间范围检索获取;在数据类型和属性信息维度上,数据表的每一个列族对应一种数据类型,列族中的每一个列对应于一种属性信息;从而可以将多源、海量、多结构的海上目标时空轨迹数据按照时间、空间、数据类型、属性信息等多个维度,分布存储至分布式列式数据库之中。
具体的,本实施例中分布式列式数据库可以是HBase数据库,其是一个分布式的、面向列(面向列族)的数据库,它可以用于超大规模的数据集存储,从而可以实现对超大规模数据的实时随机访问。本实施例中分布式列式数据库的数据表以行键(Row Key)、列族(Column Family)和时间戳(Time Stamp)作为索引,表的内容按照行键的值域来水平划片,包含在同一值域范围的多个行组成一个小表,这样不仅数据模型简单而且还可以让用户来动态控制数据的在不同存储节点上的分布,支持高并发的读写操作以及数据版本管理,这样比较好地适应了内容稀疏、灵活扩展的多源异构的海上目标轨迹数据的统一组织、集中管理和存储。
具体的,在空间维度上,将全球剖分网格编码值集合作为行键的赋值范围,每一个全球剖分网格编码值唯一标识一个空间区域块。
在时间维度上,对时间进行切分得到N个连续的时间段,每个时间段对应一个时间版本号,将N个时间版本号作为时间戳的赋值范围,每个时间版本号唯一标识一个时间段。例如,可以将时间划分为24(N=24)个连续的时间段,如表1所示,每一个时间段的长度均为1小时。在实际实施过程中,可以根据实际需求划分时间段,这里对时间段数量、以及时间段的长度不做限定。
表1
时间版本号 时间段
T1 00:00-01:00
T2 01:00-02:00
T3 02:00-03:00
T4 03:00-04:00
…… ……
T24 23:00-24:00
基于此,本发明实施例中的分布式列式数据库的数据表结构如表2所示:
表2
Figure BDA0003258535220000091
下面对如表2所示的数据表的相关概念进行详细介绍:
数据表:由行和列族组成,列族中包含多个列。
行:数据表包含多个行,采用行键来唯一标识一个行,行键的赋值范围为全球剖分网格编码值集合;所有对数据表的访问必须通过行键,访问数据表中的行有三种方式:通过单个行键进行查询、通过一个行键的区间来访问、全表扫描。
列族:列族中包含多个列,列族通过列族名标识,每一个列族对应于一种数据类型,且列族下的列结构支持无限在线扩展。列族中的每一个列对应于一种属性信息。例如,如表2所示,按照信息形态和表征不同,分别设计列族1、列族2、……;列族1对应于影像数据类型,列族1中的多个列分别对应来源、内容、传感器等属性信息;列族2对应于AIS数据类型,列族2中的多个列分别对应来源、船籍、航速、船名等属性信息。列族下的列结构可对实体属性信息进行全面组织管理,提供高效、快速地时空轨迹数据管理手段,更好地支持多源异构的分布式大数据计算分析处理。
列:数据表中的每一个列均归属于某一个列族,列通过列名唯一标识,列名中包含列族名+属性信息标识。
时间戳:表示在数据表中保存的时空轨迹数据的时间版本,时间戳的赋值范围为N个时间版本号{T1,T2,T3,…,TN}。具体的,确定时空轨迹数据的时间信息(可以是产生该数据的时间,或者是该数据中包含的时间)所属的时间段,与该时间段对应的时间版本号即为该时空轨迹数据的时间戳。这样,同一时间段内的数据为同一版本,否则为不同版本,便于各类数据在时间维度上聚集,便于数据按时间范围进行访问。
这样,通过在空间和时间两个维度上进行划分,一个时空区域可以理解为具有时间维度的时空立方体。对海量的时空轨迹数据进行时间切片和空间切块的两个维度一致化处理。对空间区域进行空间切块为等面积和等形状的层次状面片,可以解决传统数据模型在全球范围内多尺度、海量数据和层次数据上存在的局限性。
可选的,本发明实施例的时空轨迹数据处理方法采用基于2n及整型一维数组的全球经纬度剖分网格进行不同空间区域的编码。基于2n及整型一维数组的全球经纬度剖分网格即GeoSOT(Geographical coordinates Subdividing grid with One dimensionintegral coding on 2n Tree),将地球表面经纬度范围空间经过3次扩展后再对其进行严格的递归四叉剖分,由此将整个地球分割为大到全球、小到厘米级的整度、整分、整秒和秒以下的层次网格体系。根据GeoSOT网格的划分规格,从第0级(大小为512°)到第9级(大小为1°)为度级剖分网格。其中,第0级网格定义为以赤道与本初子午线交点为中心点的512°×512°方格;第1级网格在第0级网格的基础上平均分为四份,每个网格大小为256°×256°;第2级网格在第1级网格的基础上平均分为四份,每个网格大小为128°×128°;第3级网格在第2级网格的基础上平均分为四份,每个网格大小为64°×64°;从第10级(大小为32')到第15级(大小为1′)为分级剖分网格,分级网格的根节点与第9级网格(1°网格或60′网格)一一对应,网格大小从60′扩展到64′。GeoSOT剖分的第10级网格定义为在分级网格根节点基础上平均分为四份,每个网格大小为32′×32′。从第16级(大小为32″)到第21级(大小为1″)为秒级剖分网格,第22级以后则为秒以下级剖分网格。秒级网格的根节点与第15级网格(1′网格或60″网格)一一对应,网格大小从60″扩展到64″。GeoSOT剖分在第16级网格开始,定义为在秒级网格根节点基础上平均分为四份。
GeoSOT网格编码用于对每个网格单元进行唯一标识。由于GeoSOT网格中每个剖分面片在地球上具有确定的地理空间范围,因此GeoSOT网格编码具有了准确的地理空间含义,可在某种程度上具有地理空间坐标的意义。依据GeoSOT网格剖分原理,采用二进制2维编码方法,将GeoSOT网格编码分为三段,包括度级、分级、秒级及秒以下网格编码,如图2所示。
在一些实施例中,参见图3所示,本发明的时空轨迹数据处理方法中还包括:
步骤202:确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;以行键为第二全球剖分网格编码值、时间戳为第二时间版本号作为索引,从分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
当需要对时空轨迹数据进行分析处理、数据挖掘等操作时,可以从上述分布式列式数据库中获取所需数据,进行相应处理。例如可直接通过全球剖分网格编码值作为行键查询所需数据;或者,按照时间范围对应的时间版本号作为时间戳分批获取数据,用于分析不同时相下海上静态目标(或较长时间不动的目标)的时相变化情况;或者,通过列扫描的方式,获取某一个/某些属性信息的值(不为空),进而利用典型列分析海上目标的空间活动变化情况;还支持多个维度组合作为索引,快速获得数据信息,提供高效的海上目标时空轨迹数据的检索能力。具体的,以全球剖分网格编码值为行键、时间版本号为时间戳作为索引,在如表2所示的分布式列式数据库中查询获取数据,获取到的数据为来自多个数据源(可以通过“来源”这一属性信息来确定)的大量时空轨迹数据。例如,获取到了数据源为AIS的大量AIS数据,数据源为北斗的大量北斗数据,数据源为卫星的大量影像数据。
步骤204:对步骤202中获取到的目标时空轨迹数据进行预处理;
由于数据库中保存的都是从不同数据源获得的原始数据,因此,从数据库中查询到所需数据后,需要先对数据进行预处理,以便去除一些不可用数据,节省后续的工作量。
步骤206:对预处理后的目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;
步骤208:对经身份融合处理后的目标时空轨迹数据进行汇总整理。
由于获取到的一定空间区域范围内、一定时间范围内的时空轨迹数据的数据来源不同(来自不同的信息系统或传感器等),不同数据源系统中对于海上目标的标识方式不同,即使用不同的目标标识,例如,某些系统中使用MMSI(Maritime Mobile ServiceIdentity,海上移动通信业务标识)来标识海上目标,而某些系统中使用船舶号或者自定义编号来标识海上目标,因此,来自不同数据源的数据无法确定是否属于同一海上目标,通过对这些数据进行身份融合可以将来自不同数据源的属于同一海上目标的时空轨迹数据汇总整理到一起。数据的身份融合可以实现对多源数据的综合,获取具有较高准确度的目标关联属性,融合生成目标属性特征描述集。
本实施例中通过对不同数据源的数据进行预处理及身份融合,从而将来自不同数据源的属于同一海上目标的时空轨迹数据汇总在一起,以便后续基于汇总数据进行分析处理、数据挖掘等操作。
在一些实施例中,参见图4所示,本发明实施例的步骤204中对目标时空轨迹数据进行预处理的过程具体包括:
步骤301:对目标时空轨迹数据中的非结构化数据进行结构分析和属性分析得到分析结果;
步骤302:根据分析结果对目标时空轨迹数据中的非结构化数据进行数据解析得到解析数据;
步骤303:按照结构化数据格式中包含的属性信息对解析数据进行补全处理。
在实际实施过程中,可以按照实际需要对时空轨迹数据进行结构化处理。
结构化处理过程具体为:
由于数据来源不同,某些时空轨迹数据是非结构化数据,非结构化数据主要包括:卫星影像、流媒体、文字报、电子邮件、电子表格等。这些非结构化数据需要预先进行结构化处理。首先进行数据的结构分析和属性分析,然后进行不同数据结构的解析,将解析的结果按照结构化数据格式进行补全存储,使得结构化处理后的属性信息尽可能多。
例如,经结构化处理后的数据包含如表3所示的属性信息:
表3
Figure BDA0003258535220000131
在一些实施例中,本发明实施例的步骤204中对目标时空轨迹数据进行预处理的过程还可以包括:删除目标时空轨迹数据中存在信息缺失和/或信息错误的数据(即数据清理处理)。
在实际实施过程中,可以按照实际需要对时空轨迹数据进行数据清理处理。
数据清理过程具体为:
在AIS数据接收及解码的过程中,发现部分信息存在错误和缺失,主要有以下三类原因:
a)静态信息输入错误和部分信息未输入;
b)船舶航次相关信息输入错误或信息未输入;
c)由于传感器故障,导致船舶动态信息中出现错误。
因此,需要对这部分错误和缺失的信息进行清理。主要工作有:删除动态信息表中船舶MMSI为0的记录;删除明显错误的数据(如出现速度为负值,经度大于180度,纬度大于90度等)。
本申请实施例中,经步骤204的预处理后的目标时空轨迹数据中包括来自m(m≥2)个数据源的多个数据集合,同一数据集合中的时空轨迹数据来自相同数据源且包含相同的目标标识(即,同一数据集合中的时空轨迹数据在本数据源中属于同一海上目标);则,步骤206中对预处理后的目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据,具体包括:
步骤401,从m个数据源中选择一个数据源作为基准源,其余m-1个数据源为{Yj|j=1,2,…,(m-1)};
在实际实施过程中,可以选择数据量最多的数据源作为基准,通常选择AIS数据源作为基准。
步骤402,对来自基准数据源的一个基准数据集合与来自数据源Yj的每一个待定数据集合执行以下身份融合处理:
遍历基准数据集合中的每一个时空轨迹数据Ai,从待定数据集合中确定满足时间要求的特定数据,该时间要求为特定数据的时间在ti±Δt的时间范围内,其中,ti表示Ai的时间,Δt表示预设时间参数,i=1,2,…;计算Ai的位置坐标与特定数据的位置坐标之间的距离Di;判断Di是否小于预设距离阈值Dthred,若是,则对计数值进行累加;不断执行上述步骤直至遍历完基准数据集合中的所有时空轨迹数据;
如果最终得到的计数值大于或等于预设数量阈值,则确定待定数据集合与基准数据集合属于同一海上目标。
下面通过举例对上述身份融合处理进行说明。假设,经步骤204的预处理后的目标时空轨迹数据中包括来自AIS数据源、北斗数据源、卫星数据源的多个数据集合(此时m=3),同一数据集合中的时空轨迹数据来自相同数据源且包含相同的目标标识。选择AIS数据源作为基准数据源,将一个AIS数据集合与每一个北斗数据源以及每一个卫星影像数据集合进行身份融合处理。
对一个AIS数据集合与一个北斗数据集合进行身份融合处理的步骤包括:
步骤501:遍历AIS数据集合中的每一个AIS数据Ai,从北斗数据集合中确定满足时间要求的特定北斗数据,该时间要求为特定北斗数据的时间在ti±Δt的时间范围内,其中,ti表示Ai的时间,Δt表示预设时间参数,i=1,2,…;
步骤502:计算AIS数据Ai的位置坐标与特定北斗数据的位置坐标之间的距离Di
步骤503:判断Di是否小于预设距离阈值Dthred,若是,则对计数值进行累加;
步骤504:不断执行上述步骤501-503直至遍历完AIS数据集合中的所有AIS数据;如果最终的计数值大于或等于预设数量阈值,则确定北斗数据集合与AIS数据集合属于同一海上目标,否则,不属于同一海上目标。
针对不同数据源的数据,将同一数据源中具有相同目标标识的时空轨迹数据组成一个数据集合,从而得到属于AIS数据源的多个AIS数据集合、属于北斗数据源的多个北斗数据集合、以及属于卫星数据源的多个卫星影像数据集合。时空轨迹数据中包含位置坐标和时间等信息,位置坐标主要由经度和纬度组成。
按照上述步骤501-504的过程,将一个AIS数据集合与所有北斗数据集合、所有卫星影像数据集合进行身份融合处理。之后,继续处理下一个AIS数据集合,将其与所有北斗数据集合、所有卫星影像数据集合进行身份融合处理。最终处理完所有的AIS数据集合。
在一些实施例中,本发明实施例的步骤208中对经身份融合处理后的目标时空轨迹数据进行汇总整理,具体包括:采用特定算法对来自不同数据源的属于同一海上目标的时空轨迹数据中包含的目标标识进行运算,得到全局标识;这些来自不同数据源的属于同一海上目标的时空轨迹数据均对应于该全局标识。
对完成身份融合的数据进行汇总整理,将来自不同数据源的属于同一海上目标的时空轨迹数据保存到一起需要采用特定算法计算来自不同数据源的属于同一海上目标的时空轨迹数据的全局标识,这些时空轨迹数据对应于相同的全局标识,表示属于同一海上目标。例如,上述特定算法可以是MD5(Message-Digest Algorithm 5,消息摘要算法第5版)算法。
汇总整理后的数据结构示例如表4所示:
表4
Figure BDA0003258535220000161
另一方面,参见图5所示,本发明还提供了一种时空轨迹数据处理装置1,包括:
数据表建立模块10,用于建立分布式列式数据库的数据表结构;数据表结构由行和包含多个列的列族构成,数据表结构采用行键标识每一行,行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,列族中的每一列以代表属性信息的列名来标识,数据表结构的每一行键下均包含多个时间戳,每个时间戳采用代表不同时间段的时间版本号来标识;
第一获取模块20,用于实时获取海上目标的时空轨迹数据;
信息提取模块30,用于从第一获取模块20获取到的时空轨迹数据中提取海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
索引信息获取模块40,用于确定与位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与时间信息所属时间段相对应的第一时间版本号,确定与时空轨迹数据类型信息相对应的第一列族名;
以及,数据保存模块50,用于以行键为第一全球剖分网格编码值、时间戳为第一时间版本号、列族名为第一列族名作为索引,将海上目标的时空轨迹数据保存到分布式列式数据库中。
如图6所示,上述时空轨迹数据处理装置1中还包括:第二获取模块60、预处理模块70、融合汇总模块80,其中:
索引信息获取模块40,还用于确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;
第二获取模块60,用于以行键为第二全球剖分网格编码值、时间戳为第二时间版本号作为索引,从分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
预处理模块70,用于对第二获取模块60获取到的目标时空轨迹数据进行预处理;
融合汇总模块80,用于对预处理后的目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;对经身份融合处理后的目标时空轨迹数据进行汇总整理。
其中,预处理模块70具体用于:对目标时空轨迹数据中的非结构化数据进行结构分析和属性分析得到分析结果;根据分析结果对目标时空轨迹数据中的非结构化数据进行数据解析得到解析数据;按照结构化数据格式中包含的属性信息对解析数据进行补全处理。
预处理模块70还用于:删除目标时空轨迹数据中存在信息缺失和/或信息错误的数据。
其中,经预处理模块70预处理后的目标时空轨迹数据中包括来自m个数据源的多个数据集合,同一数据集合中的时空轨迹数据来自相同数据源且包含相同的目标标识;则,融合汇总模块80包括:
选择单元,用于从m个数据源中选择一个数据源作为基准源,其余m-1个数据源为{Yj|j=1,2,…,(m-1)};;
处理单元,用于对来自基准数据源的一个基准数据集合与来自数据源Yj的每一个待定数据集合执行以下身份融合处理:遍历基准数据集合中的每一个时空轨迹数据Ai,从待定数据集合中确定满足时间要求的特定数据,该时间要求为特定数据的时间在ti±Δt的时间范围内,其中,ti表示Ai的时间,Δt表示预设时间参数,i=1,2,…;计算Ai的位置坐标与特定数据的位置坐标之间的距离Di;判断Di是否小于预设距离阈值Dthred,若是,则对计数值进行累加;不断执行上述步骤直至遍历完基准数据集合中的所有时空轨迹数据;如果最终得到的计数值大于或等于预设数量阈值,则确定待定数据集合与基准数据集合属于同一海上目标。
融合汇总模块80还包括:计算单元,用于采用特定算法对来自不同数据源的属于同一海上目标的时空轨迹数据中包含的目标标识进行运算,得到全局标识;来自不同数据源的属于同一海上目标的时空轨迹数据均对应于全局标识。
再一方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时实现如上述实施例所述的时空轨迹数据处理方法。
具体地,上述存储器和处理器能够为通用的存储器和处理器,这里不做具体限定,当处理器运行存储器存储的计算机可读指令时,能够执行上述实施例所述的时空轨迹数据处理方法。
又一方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例所述的时空轨迹数据处理方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
应该指出,上述详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语均具有与本申请所属技术领域的普通技术人员的通常理解所相同的含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请所述的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,在这里可以使用空间相对术语,如“在……之上”、“在……上方”、“在……上表面”、“上面的”等,用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如,如果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而,示例性术语“在……上方”可以包括“在……上方”和“在……下方”两种方位。该器件也可以其他不同方式定位,如旋转90度或处于其他方位,并且对这里所使用的空间相对描述作出相应解释。
在上面详细的说明中,参考了附图,附图形成本文的一部分。在附图中,类似的符号典型地确定类似的部件,除非上下文以其他方式指明。在详细的说明书、附图及权利要求书中所描述的图示说明的实施方案不意味是限制性的。在不脱离本文所呈现的主题的精神或范围下,其他实施方案可以被使用,并且可以作其他改变。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种时空轨迹数据处理方法,其特征在于,包括:
建立分布式列式数据库的数据表结构;所述数据表结构由行和包含多个列的列族构成,所述数据表结构采用行键标识每一行,所述行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,所述数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,所述列族中的每一列以代表属性信息的列名来标识,所述数据表结构的每一行键下均包含多个时间戳,每个所述时间戳采用代表不同时间段的时间版本号来标识;
实时获取海上目标的时空轨迹数据;
从所述时空轨迹数据中提取所述海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
确定与所述位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与所述时间信息所属时间段相对应的第一时间版本号,确定与所述时空轨迹数据类型信息相对应的第一列族名;
以行键为所述第一全球剖分网格编码值、时间戳为所述第一时间版本号、列族名为所述第一列族名作为索引,将所述海上目标的时空轨迹数据保存到所述分布式列式数据库中;
所述方法还包括:
确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;
以行键为所述第二全球剖分网格编码值、时间戳为所述第二时间版本号作为索引,从所述分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
对所述目标时空轨迹数据进行预处理;
对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;
对经身份融合处理后的所述目标时空轨迹数据进行汇总整理;
其中,所述对经身份融合处理后的所述目标时空轨迹数据进行汇总整理的步骤包括:
采用特定算法对来自不同数据源的属于同一海上目标的时空轨迹数据中包含的目标标识进行运算,得到全局标识;所述来自不同数据源的属于同一海上目标的时空轨迹数据均对应于所述全局标识,所述特定算法为MD5算法。
2.根据权利要求1所述的时空轨迹数据处理方法,其特征在于,对所述目标时空轨迹数据进行预处理的步骤包括:
对所述目标时空轨迹数据中的非结构化数据进行结构分析和属性分析得到分析结果;
根据所述分析结果对所述目标时空轨迹数据中的非结构化数据进行数据解析得到解析数据;
按照结构化数据格式中包含的属性信息对所述解析数据进行补全处理。
3.根据权利要求2所述的时空轨迹数据处理方法,其特征在于,对所述目标时空轨迹数据进行预处理的步骤还包括:
删除所述目标时空轨迹数据中存在信息缺失和/或信息错误的数据。
4.根据权利要求1所述的时空轨迹数据处理方法,其特征在于,预处理后的所述目标时空轨迹数据中包括来自m个数据源的多个数据集合,同一数据集合中的时空轨迹数据来自相同数据源且包含相同的目标标识;则,对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据的步骤包括:
从所述m个数据源中选择一个数据源作为基准源,其余m-1个数据源为{Yj|j=1,2,…,(m-1)};
对来自基准数据源的一个基准数据集合与来自数据源Yj的每一个待定数据集合执行以下身份融合处理:
遍历所述基准数据集合中的每一个时空轨迹数据Ai,从待定数据集合中确定满足时间要求的特定数据,所述时间要求为所述特定数据的时间在ti±△t的时间范围内,其中,ti表示Ai的时间,△t表示预设时间参数,i=1,2,…;计算Ai的位置坐标与所述特定数据的位置坐标之间的距离Di;判断Di是否小于预设距离阈值Dthred,若是,则对计数值进行累加;不断执行上述步骤直至遍历完所述基准数据集合中的所有时空轨迹数据;
如果最终得到的计数值大于或等于预设数量阈值,则确定所述待定数据集合与所述基准数据集合属于同一海上目标。
5.一种时空轨迹数据处理装置,其特征在于,包括:
数据表建立模块,用于建立分布式列式数据库的数据表结构;所述数据表结构由行和包含多个列的列族构成,所述数据表结构采用行键标识每一行,所述行键的赋值范围为标识不同空间区域的全球剖分网格编码值集合,所述数据表结构采用代表时空轨迹数据类型的列族名来标识每一列族,所述列族中的每一列以代表属性信息的列名来标识,所述数据表结构的每一行键下均包含多个时间戳,每个所述时间戳采用代表不同时间段的时间版本号来标识;
第一获取模块,用于实时获取海上目标的时空轨迹数据;
信息提取模块,用于从所述第一获取模块获取到的时空轨迹数据中提取所述海上目标的位置信息、时间信息以及时空轨迹数据类型信息;
索引信息获取模块,用于确定与所述位置信息所属空间区域相对应的第一全球剖分网格编码值,确定与所述时间信息所属时间段相对应的第一时间版本号,确定与所述时空轨迹数据类型信息相对应的第一列族名;
以及,数据保存模块,用于以行键为所述第一全球剖分网格编码值、时间戳为所述第一时间版本号、列族名为所述第一列族名作为索引,将所述海上目标的时空轨迹数据保存到所述分布式列式数据库中;
所述装置还包括:第二获取模块、预处理模块、融合汇总模块,其中:
所述索引信息获取模块,还用于确定与特定空间区域相对应的第二全球剖分网格编码值,确定与特定时间范围所属时间段相对应的第二时间版本号;
所述第二获取模块,用于以行键为所述第二全球剖分网格编码值、时间戳为所述第二时间版本号作为索引,从所述分布式列式数据库中查询并获取得到来自不同数据源的目标时空轨迹数据;
所述预处理模块,用于对所述第二获取模块获取到的目标时空轨迹数据进行预处理;
所述融合汇总模块,用于对预处理后的所述目标时空轨迹数据进行身份融合处理以确定来自不同数据源的属于同一海上目标的时空轨迹数据;对经身份融合处理后的所述目标时空轨迹数据进行汇总整理;
其中,所述融合汇总模块用于对经身份融合处理后的所述目标时空轨迹数据进行汇总整理具体包括:
采用特定算法对来自不同数据源的属于同一海上目标的时空轨迹数据中包含的目标标识进行运算,得到全局标识;所述来自不同数据源的属于同一海上目标的时空轨迹数据均对应于所述全局标识,所述特定算法为MD5算法。
6.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至4中任一项所述的时空轨迹数据处理方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的时空轨迹数据处理方法。
CN202111066298.2A 2021-09-13 2021-09-13 时空轨迹数据处理方法、装置、电子设备及存储介质 Active CN113946575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111066298.2A CN113946575B (zh) 2021-09-13 2021-09-13 时空轨迹数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111066298.2A CN113946575B (zh) 2021-09-13 2021-09-13 时空轨迹数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113946575A CN113946575A (zh) 2022-01-18
CN113946575B true CN113946575B (zh) 2022-10-14

Family

ID=79328365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111066298.2A Active CN113946575B (zh) 2021-09-13 2021-09-13 时空轨迹数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113946575B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547228B (zh) * 2022-04-22 2022-07-19 阿里云计算有限公司 轨迹生成方法、装置、设备及存储介质
CN114996598B (zh) * 2022-08-01 2022-10-18 武汉大学 一种基于通信大数据的时空关联分析方法、装置及设备
CN115147934B (zh) * 2022-09-01 2022-12-23 中科星图股份有限公司 行为分析方法、装置、设备和计算机可读存储介质
CN115905124B (zh) * 2022-11-03 2024-04-30 昆易电子科技(上海)有限公司 多类型数据文件的回放方法、装置、设备、介质
CN116521805A (zh) * 2023-03-27 2023-08-01 山东省国土空间数据和遥感技术研究院(山东省海域动态监视监测中心) 一种基于剖分网格的空间轨迹存储、查询与生成方法
CN116881244B (zh) * 2023-06-05 2024-03-26 易智瑞信息技术有限公司 一种基于列存数据库的空间数据的实时处理方法及装置
CN116881308A (zh) * 2023-07-31 2023-10-13 北京和德宇航技术有限公司 一种卫星遥测数据的显示方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040092082A (ko) * 2003-04-24 2004-11-03 홍봉희 무선 인터넷 상에서 연속적으로 이동하는 이동체를 관리하기 위한 시공간 색인 방법 및 이를 위한 시스템
CN102750356A (zh) * 2012-06-11 2012-10-24 清华大学 一种键值库辅助索引的构建与管理方法
CN107016374A (zh) * 2017-04-12 2017-08-04 电子科技大学 面向特定目标的智能检测追踪及时空轨迹的生成方法
CN109783665A (zh) * 2018-12-29 2019-05-21 武汉大学 基于Google S2实现Hbase数据库遥感大数据入库模型的设计方法
CN110765331A (zh) * 2019-07-08 2020-02-07 中国人民解放军战略支援部队信息工程大学 一种时空数据的检索方法及系统
CN111797295A (zh) * 2020-06-19 2020-10-20 云从科技集团股份有限公司 一种多维时空轨迹融合方法、装置、机器可读介质及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040092082A (ko) * 2003-04-24 2004-11-03 홍봉희 무선 인터넷 상에서 연속적으로 이동하는 이동체를 관리하기 위한 시공간 색인 방법 및 이를 위한 시스템
CN102750356A (zh) * 2012-06-11 2012-10-24 清华大学 一种键值库辅助索引的构建与管理方法
CN107016374A (zh) * 2017-04-12 2017-08-04 电子科技大学 面向特定目标的智能检测追踪及时空轨迹的生成方法
CN109783665A (zh) * 2018-12-29 2019-05-21 武汉大学 基于Google S2实现Hbase数据库遥感大数据入库模型的设计方法
CN110765331A (zh) * 2019-07-08 2020-02-07 中国人民解放军战略支援部队信息工程大学 一种时空数据的检索方法及系统
CN111797295A (zh) * 2020-06-19 2020-10-20 云从科技集团股份有限公司 一种多维时空轨迹融合方法、装置、机器可读介质及设备

Also Published As

Publication number Publication date
CN113946575A (zh) 2022-01-18

Similar Documents

Publication Publication Date Title
CN113946575B (zh) 时空轨迹数据处理方法、装置、电子设备及存储介质
CN110442444B (zh) 一种面向海量遥感影像的并行数据访问方法与系统
CN109284338B (zh) 一种基于混合索引的卫星遥感大数据优化查询方法
CN107220285B (zh) 面向海量轨迹点数据的时空索引构建方法
Chang et al. Titan: a high-performance remote-sensing database
EP2263180B1 (en) Indexing large-scale gps tracks
JP6032467B2 (ja) 時空間データ管理システム、時空間データ管理方法、及びそのプログラム
CN102521386B (zh) 基于集群存储的空间元数据分组方法
CN113946700A (zh) 一种时空索引构建方法、装置、计算机设备及存储介质
CN111522892B (zh) 地理要素的检索方法及装置
Zhang et al. Effectively indexing the uncertain space
CN101692231B (zh) 一种适合空间查询的遥感影像分块排序存储方法
EP3182299B1 (en) Methods and systems for estimating the number of points in two-dimensional data
EP3559824B1 (en) Methods, systems and apparatus to improve spatial-temporal data management
CN113742505B (zh) 一种海量合成孔径雷达干涉测量(InSAR)数据在线可视化方法
CN113282584B (zh) 一种对地观测影像时空立方体数据检索方法及系统
Phan et al. All in one: mining multiple movement patterns
Faloutsos et al. Analysis of n-dimensional quadtrees using the Hausdorff fractal dimension
Pabreja et al. A data warehousing and data mining approach for analysis and forecast of cloudburst events using OLAP-based data hypercube
CN110674134A (zh) 一种地理信息数据存储方法、查询方法及装置
Agarwal et al. Advances in indexing for mobile objects
Li et al. Spatial Data Science
CN113722415A (zh) 点云数据的处理方法、装置、电子设备及存储介质
CN113032504A (zh) 村镇社区公共服务时空数据汇聚方法及装置
CN116860907B (zh) 跨云的多维遥感数据立方体在线时空轴显示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant