CN112765207A - 资源大数据的表示、存储与查询方法 - Google Patents

资源大数据的表示、存储与查询方法 Download PDF

Info

Publication number
CN112765207A
CN112765207A CN202110370643.5A CN202110370643A CN112765207A CN 112765207 A CN112765207 A CN 112765207A CN 202110370643 A CN202110370643 A CN 202110370643A CN 112765207 A CN112765207 A CN 112765207A
Authority
CN
China
Prior art keywords
target
resource
ground
information
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110370643.5A
Other languages
English (en)
Other versions
CN112765207B (zh
Inventor
叶昭晖
李俊
陈修亮
王薇薇
姚煊道
郑龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110370643.5A priority Critical patent/CN112765207B/zh
Publication of CN112765207A publication Critical patent/CN112765207A/zh
Application granted granted Critical
Publication of CN112765207B publication Critical patent/CN112765207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Abstract

本申请涉及一种资源大数据的表示、存储与查询方法。所述方法包括:构建地面目标模型、构建资源能力模型以及构建联合搜索模型,对地面目标所处的空间区域进行剖分,得到系列子空间;根据采用地面目标模型表示空间区域中的地面目标,得到地面目标集合,对地面目标集合中的每一个地面目标的目标描述信息,提取得到关键词信息,得到词条集合;根据地面目标与系列子空间的对应关系、地面目标与资源的对应关系构建目标资源组合体;采用本方法可以准确的对资源大数据进行表示。

Description

资源大数据的表示、存储与查询方法
技术领域
本申请涉及数据处理技术领域,特别是涉及一种资源大数据的表示、存储与查询方法。
背景技术
随着火箭发射、太空探测等航天技术不断发展,航天装备建设不断扩大规模,航天装备资源数量空前增长,航天装备资源信息呈现大数据爆发态势,如何合理、高效并智能地管理运用好航天装备资源大数据成为摆在装备资源管理者面前的一个重要问题。
基于这些大量的航天装备资源,更多的注意力集中到了如何高效而智能地完成遥感探测任务,尤其是针对目标的探测任务。由于航天装备性质、任务的差别,在完成某一目标的探测任务时需要将多种航天装备资源进行联合式的部署运用才能获得该目标全维、整体的信息,这就对传统的航天装备资源信息管理手段提出了挑战,需要过渡到围绕任务目标来组织航天装备资源信息管理的技术体制上来。
文献[1]指出航天测控装备需要利用大数据技术进行管理,阐述了针对航天测控装备信息的数据采集、数据存储和数据分析3阶段大数据管理方法,该项工作阐述的很笼统,没有具体的方法。文献[2]从航天装备保障出发,设计了装备综合保障信息管理平台体系结构,阐述了装备数据采集分析及技术状态管控、保障性设计和分析、虚实结合的交互式训练、远程专家支持、交互式电子手册、健康与维护管理、供应链管理等多个子系统,该项工作的出发点是如何为保持和提升系统战备完好性,降低全寿命周期费用,因此并不是合理、高效、智能地面向联合运用航天装备资源的有效办法。文献[3]从管理航天装备试验鉴定数据出发,设计了航天装备试验鉴定大数据管理与分析平台,详细阐述了平台中的数据采集、数据存储和数据分析过程,该项工作是阐述平台,并没有涉及到具体的管理方法。文献[4]从航天复杂产品生产管理出发,阐述了生产进度、三维模型等方法,该工作并没有涉及到航天装备资源信息本身。
[1] 赵国强. 大数据的航天测控装备信息管理应用探讨. 通信世界 2019
[2] 邵世纲, 邢冠楠, 崔寅, 崔文星, 刘岭. 航天装备综合保障信息管理平台体系架构及工程研制实践. 导弹与航天运载技术. 2018
[3] 李亚楠, 田雪颖, 王志梅. 基于大数据的航天装备试验鉴定数据管理及分析应用研究. 航天工业管理. 2018
[4] 刘晓亮; 施国强; 陶栾; 林廷宇. 一种航天复杂产品生产管理方法、系统、设备及介质. 专利申请号: CN201810641978.4. 2018。
发明内容
基于此,有必要针对上述技术问题,提供一种资源大数据的表示、存储与查询方法。
一种资源大数据的表示方法,所述方法包括:
构建地面目标模型;所述地面目标模型包括:目标标识、目标坐标信息、目标描述信息以及目标等级信息;
构建资源能力模型;所述资源能力模型包括:资源标识、资源能力信息以及资源描述信息;所述资源能力信息表示一段时间内的空间感知范围;
构建联合搜索模型;所述联合搜索模型包括:所述目标标识以及所述资源标识集合;在联合搜索模型中,每个所述目标标识的目标坐标信息内,资源能力模型对应的资源能力信息均能够探测到所述目标标识;
对地面目标所处的空间区域进行剖分,得到系列子空间;
根据采用所述地面目标模型表示空间区域中的地面目标,得到地面目标集合,对所述地面目标集合中的每一个地面目标的目标描述信息,提取得到关键词信息,得到词条集合;
根据所述地面目标集合中的每一个地面目标的目标坐标信息,确定地面目标与所述系列子空间的对应关系;
采用资源能力模型表示资源,针对所述地面目标集合中的每一个地面目标的目标坐标信息,确定所述资源能力模型中每个资源的资源能力信息与所述目标坐标信息的感知关系,得到地面目标与所述资源的对应关系;
根据地面目标与所述系列子空间的对应关系、地面目标与所述资源的对应关系构建目标资源组合体;所述目标资源组合体表示在系列子空间中,目标资源组合体包括:目标标识、词条集合、可感知地面目标的资源标识、资源能力信息以及资源描述信息。
在其中一个实施例中,还包括:采用自然语言处理中的关键词提取技术,提取得到关键词信息。
在其中一个实施例中,所述资源能力信息包括:探测空间、起始时间和终止时间;所述探测空间为资源从起始时间到终止时间的空间感知范围;还包括:判断所述目标坐标信息是否在所述探测空间中,若是,则将所述资源与地面目标建立对应关系。
在其中一个实施例中,还包括:建立组织模型;所述组织模型包括:系列子空间和目标资源组合体;所述系列子空间和目标资源组合体对应。
在其中一个实施例中,还包括:采用网格均匀剖分地面目标所处的空间区域,得到系列子空间。
一种资源大数据的存储方法,所述方法包括:
获取存储介质的最小存储字节,以及获取根据上述资源大数据的表示方法生成的目标资源组合体;
将所述目标资源组合体对应的系列子空间进行均匀剖分,得到剖分区域,直到所述剖分区域中对应目标资源组合体的字节小于或等于所述最小存储字节;
对所述目标资源组合体对应的系列子空间进行序列编码以及对所述剖分区域进行编码;每个系列子空间通过子空间编码标识进行标记;每个剖分区域通过剖分编码标识进行标记;
对所述子空间编码标识和所述剖分编码标识进行拼接,得到全局编码标识;
根据所述全局编码标识建立索引表以及将系列子空间和/或剖分区域中的目标资源组合体存储至存储介质中。
在其中一个实施例中,将所述系列子空间进行2×2的网格进行递归式均匀剖分,得到剖分区域。
一种资源大数据的查询方法,所述方法包括:
根据上述的资源大数据存储方法对目标资源组合体进行存储;
根据待查询窗口与系列子空间的叠加部分,得到剖分标识列表;待查询窗口包括:查询区域、查询起始时间和查询终止时间;查询起始时间和查询终止时间构成查询时间段;
根据所述剖分标识列表查询所述索引表得到存储地址列表;
针对所述存储地址列表中的每一个地址,读取目标资源组合体列表;
根据目标资源组合体列表中每一个目标资源组合体中的目标坐标信息以及资源能力信息分别与所述查询区域和所述查询时间段的对应关系,得到候选地面目标对应的候选结果列表;
将候选地面目标的词条集合和目标等级信息输入预先训练的深度学习模型,得到候选地面目标对应的资源任务关键词;
根据所述资源任务关键词匹配所述候选结果列表,得到查询资源。
在其中一个实施例中,还包括:提取资源对应资源描述信息的关键词,得到关键词列表;
对所述词条集合与所述关键词列表进行标注,形成训练样本;
通过词向量模型对所述训练样本进行向量化,得到样本向量,根据所述样本向量对自回归模型进行训练,得到训练好的深度学习模型。
上述资源大数据的表示、存储与查询方法,一方面提出了地面目标模型、航天资源能力信息模型以及面向目标的航天装备资源联合搜索模型,这3个模型从面向目标的航天装备资源组织的角度对目标、航天装备资源以及联合搜索任务进行建模,为后续的信息表示组织、存储以及搜索提供了可利用可描述的属性表示能力。这3个模型也较为创新的选取了可以支持面向目标组织航天装备资源的属性,与当前的管理手段相比,突出了目标-航天装备资源关联的目的。另一方面以子空间为单元将其中的目标与可扫描的航天装备资源绑定,这种表示方法具有,第一,以子空间为空间单元,方便按区域将目标进行管理,方便后续的存储;第二,以目标为中心组织航天装备资源,将可扫描到该目标的航天装备资源都关联到该目标中,这为后续的检索提供了高效的技术基础,也为分析联合探测任务需要的多个航天装备资源提供了一种有效的组织手段。相比过去单纯的存储航天装备资源,这种组织方式更适合面向目标的航天装备资源联合管理。
附图说明
图1为一个实施例中资源大数据的表示方法的流程示意图;
图2为一个实施例中资源大数据的表示的示意图;
图3为一个实施例中资源大数据的存储方法的流程示意图;
图4为一个实施例中资源大数据的存储的示意图;
图5为一个实施例中资源大数据的查询方法的流程示意图;
图6为一个实施例中资源大数据的查询的示意图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种资源大数据的表示方法,包括以下步骤:
步骤102,构建地面目标模型。
地面目标模型包括:目标标识、目标坐标信息、目标描述信息以及目标等级信息。
步骤104,构建资源能力模型。
资源能力模型包括:资源标识、资源能力信息以及资源描述信息;所述资源能力信息表示一段时间内的空间感知范围。
步骤106,构建联合搜索模型。
联合搜索模型包括:目标标识以及资源标识集合;在联合搜索模型中,每个目标标识的目标坐标信息内,资源能力模型对应的资源能力信息均能够探测到所述目标标识。
步骤108,对地面目标所处的空间区域进行剖分,得到系列子空间。
步骤110,根据采用地面目标模型表示空间区域中的地面目标,得到地面目标集合,对地面目标集合中的每一个地面目标的目标描述信息,提取得到关键词信息,得到词条集合。
步骤112,根据地面目标集合中的每一个地面目标的目标坐标信息,确定地面目标与系列子空间的对应关系。
步骤114,采用资源能力模型表示资源,针对地面目标集合中的每一个地面目标的目标坐标信息,确定资源能力模型中每个资源的资源能力信息与目标坐标信息的感知关系,得到地面目标与资源的对应关系。
步骤116,根据地面目标与所述系列子空间的对应关系、地面目标与资源的对应关系构建目标资源组合体。
目标资源组合体表示在系列子空间中,目标资源组合体包括:目标标识、词条集合、可感知地面目标的资源标识、资源能力信息以及资源描述信息。
上述资源大数据的表示方法中,一方面提出了地面目标模型、航天资源能力信息模型以及面向目标的航天装备资源联合搜索模型,这3个模型从面向目标的航天装备资源组织的角度对目标、航天装备资源以及联合搜索任务进行建模,为后续的信息表示组织、存储以及搜索提供了可利用可描述的属性表示能力。这3个模型也较为创新的选取了可以支持面向目标组织航天装备资源的属性,与当前的管理手段相比,突出了目标-航天装备资源关联的目的。另一方面以子空间为单元将其中的目标与可扫描的航天装备资源绑定,这种表示方法具有,第一,以子空间为空间单元,方便按区域将目标进行管理,方便后续的存储;第二,以目标为中心组织航天装备资源,将可扫描到该目标的航天装备资源都关联到该目标中,这为后续的检索提供了高效的技术基础,也为分析联合探测任务需要的多个航天装备资源提供了一种有效的组织手段。相比过去单纯的存储航天装备资源,这种组织方式更适合面向目标的航天装备资源联合管理。
在其中一个实施例中,如图2所示,给出资源大数据的表示示意图,其中包括:目标t,子空间s、资源h的扫描空间范围1以及资源h的扫描空间范围2,阴影部分表示资源h的扫描能力。
在其中一个实施例中,采用自然语言处理中的关键词提取技术,提取得到关键词信息。
在其中一个实施例中,资源能力信息包括:探测空间、起始时间和终止时间;探测空间为资源从起始时间到终止时间的空间感知范围。判断目标坐标信息是否在探测空间中,若是,则将资源与地面目标建立对应关系。
在其中一个实施例中,建立组织模型;组织模型包括:系列子空间和目标资源组合体;系列子空间和目标资源组合体对应。
在其中一个实施例中,采用网格均匀剖分地面目标所处的空间区域,得到系列子空间。
具体的,资源为航天装备资源,给定地面目标集合
Figure 964504DEST_PATH_IMAGE001
,全部航天装备资源集合
Figure 288170DEST_PATH_IMAGE002
,面向目标的航天装备资源的组织和表示方法如下:
S1:使用
Figure 599065DEST_PATH_IMAGE003
网格均匀剖分目标集合
Figure 384487DEST_PATH_IMAGE004
所处的整个地域空间
Figure 464439DEST_PATH_IMAGE005
,形成一系列子空间,设其集合为
Figure 818060DEST_PATH_IMAGE006
S2:针对目标集合
Figure 491618DEST_PATH_IMAGE007
中每一个目标
Figure 221676DEST_PATH_IMAGE008
,利用自然语言处理的提取关键词技术,将属性
Figure 782233DEST_PATH_IMAGE009
进行关键词化,形成一组词条集合
Figure 306755DEST_PATH_IMAGE010
S3:检查每一个目标
Figure 326664DEST_PATH_IMAGE011
的坐标
Figure 470200DEST_PATH_IMAGE012
)与每个子空间
Figure 259165DEST_PATH_IMAGE013
的关系;
S21:若子空间
Figure 344801DEST_PATH_IMAGE014
的空间窗口覆盖此
Figure 852006DEST_PATH_IMAGE015
,则将该目标归为
Figure 658288DEST_PATH_IMAGE016
所有,停止比较,否则转入S22;
S22:
Figure 442704DEST_PATH_IMAGE017
,执行S21;
S4:针对目标集合
Figure 309029DEST_PATH_IMAGE018
中每一个目标
Figure 303530DEST_PATH_IMAGE019
的坐标
Figure 539602DEST_PATH_IMAGE020
,比较与集合
Figure 303158DEST_PATH_IMAGE021
中每个资源
Figure 481330DEST_PATH_IMAGE022
扫描地域
Figure 963127DEST_PATH_IMAGE023
的关系;
S41:若
Figure 111211DEST_PATH_IMAGE024
,则将
Figure 853908DEST_PATH_IMAGE025
这个元组归为
Figure 327615DEST_PATH_IMAGE026
所有,否则转入S42;
S42:
Figure 172074DEST_PATH_IMAGE027
,执行S41;
S43:针对每个资源
Figure 858270DEST_PATH_IMAGE028
都执行S41,直到遍历完全部航天装备资源;
S5:组织与表示的结果为每个
Figure 861998DEST_PATH_IMAGE029
Figure 150283DEST_PATH_IMAGE030
Figure 606672DEST_PATH_IMAGE031
是一个目标-航天资源组合体,其结构为
Figure 971926DEST_PATH_IMAGE032
,即目标标识,词条集合,可扫描覆盖
Figure 564581DEST_PATH_IMAGE033
的航天装备资源标识、扫描空间范围、扫描时间范围所形成的集合。
在其中一个实施例中,如图3所示,提供一种资源大数据的存储方法,具体步骤如下:
步骤302,获取存储介质的最小存储字节,以及获取目标资源组合体。
该目标资源组合体是以上述资源大数据的表示方法得到的。
步骤304,将目标资源组合体对应的系列子空间进行均匀剖分,得到剖分区域,直到剖分区域中对应目标资源组合体的字节小于或等于最小存储字节。
步骤306,对目标资源组合体对应的系列子空间进行序列编码以及对剖分区域进行编码。
每个系列子空间通过子空间编码标识进行标记;每个剖分区域通过剖分编码标识进行标记。
步骤308,对子空间编码标识和剖分编码标识进行拼接,得到全局编码标识。
步骤310,根据全局编码标识建立索引表以及将系列子空间和/或剖分区域中的目标资源组合体存储至存储介质中。
上述资源大数据的存储方法中,通过考虑分布于地面的目标具有偏斜分布的可能,因此使用了递归式划分空间的办法,将偏斜的部分进行均匀划分,并采用了前向匹配方法将剖分空间一维化后排序,相比于传统的航天装备资源管理方式,第一,本发明所提出以目标为中心、以剖分空间为基本存储单元的存储方式是一种全新的存储方式,既考虑了面向目标的航天装备资源联合搜索又考虑了目标分布偏斜对存储的压力;第二,利用前向匹配将剖分后的空间进行排序,并设计了索引表,为后续的高效检索提供了技术手段。
在其中一个实施例中,将所述系列子空间进行2×2的网格进行递归式均匀剖分,得到剖分区域。
具体如图4所示,提供一种资源大数据的存储示意图,其中,图4a为空间存储部分,图4b为索引表。
以图4给出的存储示意,以及考虑到地面目标的分布可能出现偏斜分布,因此存储时要考虑对偏斜部分进行进一步细化,否则可能会影响存储性能。进一步以给定地面目标集合T,全部航天装备资源集合H,以及磁盘存储的最小单元字节大小BZ,存储方法如下:
S1:利用上述表示方法形成对每个地面目标的表示结构,即一系列目标资源组合体
Figure 504724DEST_PATH_IMAGE034
S2:针对每个子空间
Figure 182830DEST_PATH_IMAGE035
,计算其所包含的所有
Figure 741987DEST_PATH_IMAGE034
的字节大小总和
Figure 330095DEST_PATH_IMAGE036
Figure 785347DEST_PATH_IMAGE037
的关系;
S21:若
Figure 842427DEST_PATH_IMAGE038
,将子空间
Figure 939696DEST_PATH_IMAGE039
按照2×2的网格进行递归式均匀剖分,直到某个剖分内所有
Figure 506943DEST_PATH_IMAGE040
的字节大小总和小于或等于
Figure 274042DEST_PATH_IMAGE041
S22:否则,
Figure 192320DEST_PATH_IMAGE042
,执行S21;
S3:剖分完毕后,对子空间
Figure 952334DEST_PATH_IMAGE043
按照从左到右、从上到下的顺序进行等长度序列编码,每个子空间都有唯一的编码标识
Figure 374088DEST_PATH_IMAGE044
S4:对每个子空间四等分的剖分部分按照从左到右、从上到下的顺序分别编以1~4的编码,对再向下递归四等分的剖分部分除了按照1~4的编码外,编码首部再拼接其父剖分的编码,每个剖分都编码完毕后,其首部再拼接所在子空间的
Figure 436722DEST_PATH_IMAGE044
,这样每个剖分就有全局唯一的编码
Figure 452083DEST_PATH_IMAGE045
S5:对剖分完毕的符合存储最小单元要求的剖分(或子空间)依据
Figure 891154DEST_PATH_IMAGE045
(或
Figure 167415DEST_PATH_IMAGE046
)按照前向匹配的顺序进行存储,并建立索引表
Figure 292628DEST_PATH_IMAGE047
,每一个表项为
Figure 919918DEST_PATH_IMAGE048
(或
Figure 772468DEST_PATH_IMAGE046
),每存储写入一个剖分(或子空间),其存储的起始地址就存储写入索引表中对应
Figure 903235DEST_PATH_IMAGE048
(或
Figure 573251DEST_PATH_IMAGE046
)的值。
在其中一个实施例中,如图5所示,提供一种资源大数据的查询方法,具体步骤如下:
步骤502,根据资源大数据存储方法对目标资源组合体进行存储。
步骤504,根据待查询窗口与系列子空间的叠加部分,得到剖分标识列表。
待查询窗口包括:查询区域、查询起始时间和查询终止时间;查询起始时间和查询终止时间构成查询时间段。
步骤506,根据剖分标识列表查询索引表得到存储地址列表。
步骤508,针对存储地址列表中的每一个地址,读取目标资源组合体列表。
步骤510,根据目标资源组合体列表中每一个目标资源组合体中的目标坐标信息以及资源能力信息分别与查询区域和查询时间段的对应关系,得到候选地面目标对应的候选结果列表。
步骤512,将候选地面目标的词条集合和目标等级信息输入预先训练的深度学习模型,得到候选地面目标对应的资源任务关键词。
步骤514,根据资源任务关键词匹配候选结果列表,得到查询资源。
上述资源大数据的查询方法中,利用索引表和学习模型进行高效和智能化的搜索满足联合扫描的航天装备资源,与传统方式相比,第一,提高了检索效率,这是因为前述的信息表示就已经将目标和对应的航天装备资源组合完毕,检索效率大大提高,第二,利用机器学习技术直接将需要联合探测的航天装备资源进行智能查找,提高了效率也提高了精确性。
在其中一个实施例中,提取资源对应资源描述信息的关键词,得到关键词列表;对所述词条集合与所述关键词列表进行标注,形成训练样本;通过词向量模型对所述训练样本进行向量化,得到样本向量,根据所述样本向量对自回归模型进行训练,得到训练好的深度学习模型。
具体的,针对探测某一目标时应该联合哪些航天装备资源才能全面覆盖探测任务,需要形成如下搜索能力,给定目标
Figure 546892DEST_PATH_IMAGE049
和航天装备资源集合
Figure 327766DEST_PATH_IMAGE050
,针对
Figure 719564DEST_PATH_IMAGE051
Figure 294902DEST_PATH_IMAGE052
信息,从
Figure 896785DEST_PATH_IMAGE053
中依据
Figure 841869DEST_PATH_IMAGE054
信息选定航天装备资源子集
Figure 212808DEST_PATH_IMAGE055
,使得联合
Figure 959047DEST_PATH_IMAGE055
中的航天装备资源可以满足对
Figure 658012DEST_PATH_IMAGE056
的探测任务。
S1:将
Figure 46268DEST_PATH_IMAGE057
中每个航天装备资源的
Figure 130768DEST_PATH_IMAGE058
信息进行关键词提取处理,形成针对每个航天装备资源的一组关键词
Figure 313488DEST_PATH_IMAGE059
S2:经领域专家人工标注,形成给定
Figure 624383DEST_PATH_IMAGE060
信息,可映射出对应的一系列航天装备资源任务关键词
Figure 426117DEST_PATH_IMAGE061
S3:利用BERT(https://arxiv.org/abs/1810.04805)词向量模型将
Figure 506069DEST_PATH_IMAGE062
Figure 745508DEST_PATH_IMAGE063
都表示为向量;
S4:针对标注的样本向量,利用自回归模型进行训练;
S5:训练完毕后,将模型参数进行存储。
上述机器学习的模型训练方法,将探测目标需要的航天装备资源能力的规则形式化,并采用了机器学习模型进行训练,传统方式基本采用规则匹配方式,扩展性和准确性较差,本发明利用机器学习方法进行训练,为后续目标更新与扩展情况下确保匹配的正确性提供了技术手段。
具体的,如图6所示,提供一种资源大数据的查询示意图,其中图6(a)表示空间检索部分,图6(b)表示索引表,针对一个地面目标集合
Figure 278121DEST_PATH_IMAGE064
,全部航天装备资源集合
Figure 883545DEST_PATH_IMAGE065
,给定时空查询窗口
Figure 818003DEST_PATH_IMAGE066
,查询的方法过程如下:
S1:计算
Figure 732739DEST_PATH_IMAGE067
与现有整个地域空间
Figure 18226DEST_PATH_IMAGE068
的剖分部分交叠情况,计算出与
Figure 161763DEST_PATH_IMAGE069
交叠的剖分标识列表;
S2:依据S1中的标识列表查找索引表
Figure 216307DEST_PATH_IMAGE070
的索引项对应的存储地址列表
Figure 911730DEST_PATH_IMAGE071
S3:针对
Figure 45034DEST_PATH_IMAGE072
中每一个
Figure 851315DEST_PATH_IMAGE073
S31:读取
Figure 760366DEST_PATH_IMAGE074
对应的剖分中目标-航天资源组合体列表
Figure 502057DEST_PATH_IMAGE075
S32:针对
Figure 762137DEST_PATH_IMAGE076
中每个目标-航天资源组合体
Figure 231164DEST_PATH_IMAGE077
,比较其中的目标
Figure 994721DEST_PATH_IMAGE078
坐标;
S321:若目标
Figure 31947DEST_PATH_IMAGE079
坐标在
Figure 389110DEST_PATH_IMAGE080
内;
S3211比较目标对应的航天装备资源
Figure 802774DEST_PATH_IMAGE081
的扫描时间段是否与
Figure 420837DEST_PATH_IMAGE082
交叠;
S32111:若交叠,将该航天装备资源的标识加入目标
Figure 520642DEST_PATH_IMAGE083
的候选结果列表
Figure 224156DEST_PATH_IMAGE084
S32112:否则,读取组合体
Figure 51298DEST_PATH_IMAGE085
中目标
Figure 789447DEST_PATH_IMAGE086
的下一个航天装备资源列表,并执行S3211;
S322:否则,
Figure 168476DEST_PATH_IMAGE087
,转入S32;
S4:执行完上述步骤后,每个目标
Figure 483919DEST_PATH_IMAGE088
会产生一个航天装备资源的候选结果列表
Figure 239386DEST_PATH_IMAGE089
S5:将每个目标
Figure 972986DEST_PATH_IMAGE090
Figure 788496DEST_PATH_IMAGE091
信息输入探测组合能力深度学习模型中,会产生针对这个目标
Figure 466602DEST_PATH_IMAGE092
的一系列航天装备资源任务关键词
Figure 386278DEST_PATH_IMAGE093
S6:针对每个
Figure 833440DEST_PATH_IMAGE094
列表中的航天装备资源,检查其
Figure 695217DEST_PATH_IMAGE095
对应的关键词列表是否与目标
Figure 126198DEST_PATH_IMAGE096
的任务关键词列表
Figure 957888DEST_PATH_IMAGE097
有交叠,若有,则将该航天装备资源加入结果列表
Figure 649769DEST_PATH_IMAGE098
S7:针对每个目标
Figure 541502DEST_PATH_IMAGE099
,返回对应的
Figure 335146DEST_PATH_IMAGE098
应该理解的是,虽然图1、3和5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、3和5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储航天资源数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种资源大数据的表示、存储和查询方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种资源大数据的表示方法,其特征在于,所述方法包括:
构建地面目标模型;所述地面目标模型包括:目标标识、目标坐标信息、目标描述信息以及目标等级信息;
构建资源能力模型;所述资源能力模型包括:资源标识、资源能力信息以及资源描述信息;所述资源能力信息表示一段时间内的空间感知范围;
构建联合搜索模型;所述联合搜索模型包括:所述目标标识以及所述资源标识集合;在联合搜索模型中,每个所述目标标识的目标坐标信息内,资源能力模型对应的资源能力信息均能够探测到所述目标标识;
对地面目标所处的空间区域进行剖分,得到系列子空间;
根据采用所述地面目标模型表示空间区域中的地面目标,得到地面目标集合,对所述地面目标集合中的每一个地面目标的目标描述信息,提取得到关键词信息,得到词条集合;
根据所述地面目标集合中的每一个地面目标的目标坐标信息,确定地面目标与所述系列子空间的对应关系;
采用资源能力模型表示资源,针对所述地面目标集合中的每一个地面目标的目标坐标信息,确定所述资源能力模型中每个资源的资源能力信息与所述目标坐标信息的感知关系,得到地面目标与所述资源的对应关系;
根据地面目标与所述系列子空间的对应关系、地面目标与所述资源的对应关系构建目标资源组合体;所述目标资源组合体表示在系列子空间中,目标资源组合体包括:目标标识、词条集合、可感知地面目标的资源标识、资源能力信息以及资源描述信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述地面目标集合中的每一个地面目标的目标描述信息,提取得到关键词信息,包括:
采用自然语言处理中的关键词提取技术,提取得到关键词信息。
3.根据权利要求1所述的方法,其特征在于,所述资源能力信息包括:探测空间、起始时间和终止时间;所述探测空间为资源从起始时间到终止时间的空间感知范围;
所述针对所述地面目标集合中的每一个地面目标的目标坐标信息,确定所述资源能力模型中每个资源的资源能力信息与所述目标坐标信息的感知关系,得到地面目标与所述资源的对应关系,包括:
判断所述目标坐标信息是否在所述探测空间中,若是,则将所述资源与地面目标建立对应关系。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
建立组织模型;所述组织模型包括:系列子空间和目标资源组合体;所述系列子空间和目标资源组合体对应。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述对地面目标所处的空间区域进行剖分,得到系列子空间,包括:
采用网格均匀剖分地面目标所处的空间区域,得到系列子空间。
6.一种资源大数据的存储方法,其特征在于,所述方法包括:
获取存储介质的最小存储字节,以及获取根据权利要求1至5任一项所述的资源大数据的表示方法生成的目标资源组合体;
将所述目标资源组合体对应的系列子空间进行均匀剖分,得到剖分区域,直到所述剖分区域中对应目标资源组合体的字节小于或等于所述最小存储字节;
对所述目标资源组合体对应的系列子空间进行序列编码以及对所述剖分区域进行编码;每个系列子空间通过子空间编码标识进行标记;每个剖分区域通过剖分编码标识进行标记;
对所述子空间编码标识和所述剖分编码标识进行拼接,得到全局编码标识;
根据所述全局编码标识建立索引表以及将系列子空间和/或剖分区域中的目标资源组合体存储至存储介质中。
7.根据权利要求6所述的方法,其特征在于,所述将所述目标资源组合体对应的系列子空间进行均匀剖分,得到剖分区域,包括:
将所述系列子空间进行2×2的网格进行递归式均匀剖分,得到剖分区域。
8.一种资源大数据的查询方法,其特征在于,所述方法包括:
根据权利要求6至7任一项所述的资源大数据存储方法对目标资源组合体进行存储;
根据待查询窗口与系列子空间的叠加部分,得到剖分标识列表;待查询窗口包括:查询区域、查询起始时间和查询终止时间;查询起始时间和查询终止时间构成查询时间段;
根据所述剖分标识列表查询所述索引表得到存储地址列表;
针对所述存储地址列表中的每一个地址,读取目标资源组合体列表;
根据目标资源组合体列表中每一个目标资源组合体中的目标坐标信息以及资源能力信息分别与所述查询区域和所述查询时间段的对应关系,得到候选地面目标对应的候选结果列表;
将候选地面目标的词条集合和目标等级信息输入预先训练的深度学习模型,得到候选地面目标对应的资源任务关键词;
根据所述资源任务关键词匹配所述候选结果列表,得到查询资源。
9.根据权利要求8所述的方法,其特征在于,训练深度学习模型的步骤,包括:
提取资源对应资源描述信息的关键词,得到关键词列表;
对所述词条集合与所述关键词列表进行标注,形成训练样本;
通过词向量模型对所述训练样本进行向量化,得到样本向量,根据所述样本向量对自回归模型进行训练,得到训练好的深度学习模型。
CN202110370643.5A 2021-04-07 2021-04-07 资源大数据的处理、存储与查询方法 Active CN112765207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110370643.5A CN112765207B (zh) 2021-04-07 2021-04-07 资源大数据的处理、存储与查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110370643.5A CN112765207B (zh) 2021-04-07 2021-04-07 资源大数据的处理、存储与查询方法

Publications (2)

Publication Number Publication Date
CN112765207A true CN112765207A (zh) 2021-05-07
CN112765207B CN112765207B (zh) 2021-06-18

Family

ID=75691203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110370643.5A Active CN112765207B (zh) 2021-04-07 2021-04-07 资源大数据的处理、存储与查询方法

Country Status (1)

Country Link
CN (1) CN112765207B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110079A (zh) * 2007-06-27 2008-01-23 中国科学院遥感应用研究所 一种数字地球原型系统
CN103412883A (zh) * 2013-07-17 2013-11-27 中国人民解放军国防科学技术大学 基于p2p技术的语义智能信息发布订阅方法
US20140282244A1 (en) * 2013-03-15 2014-09-18 Luminoso Technologies, Inc. Word cloud rotatable through N dimensions via user interface
CN107741579A (zh) * 2017-11-15 2018-02-27 中国矿业大学(北京) 基于压缩感知子空间重构的toa矿井目标定位方法
US9916507B1 (en) * 2011-10-06 2018-03-13 Rkf Engineering Solutions Llc Detecting orbital debris
US10402490B1 (en) * 2015-08-14 2019-09-03 Shutterstock, Inc. Edit distance based spellcheck
CN110287392A (zh) * 2019-06-20 2019-09-27 沈阳航空航天大学 一种基于安全划分树的安全空间网络查询方法
CN112632381A (zh) * 2020-12-24 2021-04-09 中电金信软件有限公司 信息查询方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110079A (zh) * 2007-06-27 2008-01-23 中国科学院遥感应用研究所 一种数字地球原型系统
US9916507B1 (en) * 2011-10-06 2018-03-13 Rkf Engineering Solutions Llc Detecting orbital debris
US20140282244A1 (en) * 2013-03-15 2014-09-18 Luminoso Technologies, Inc. Word cloud rotatable through N dimensions via user interface
CN103412883A (zh) * 2013-07-17 2013-11-27 中国人民解放军国防科学技术大学 基于p2p技术的语义智能信息发布订阅方法
US10402490B1 (en) * 2015-08-14 2019-09-03 Shutterstock, Inc. Edit distance based spellcheck
CN107741579A (zh) * 2017-11-15 2018-02-27 中国矿业大学(北京) 基于压缩感知子空间重构的toa矿井目标定位方法
CN110287392A (zh) * 2019-06-20 2019-09-27 沈阳航空航天大学 一种基于安全划分树的安全空间网络查询方法
CN112632381A (zh) * 2020-12-24 2021-04-09 中电金信软件有限公司 信息查询方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张思源等: "基于地理探测器的内蒙古植被NDVI时空变化与驱动力分析", 《草地学报》 *
赵国强: "大数据的航天测控装备信息管理应用探讨", 《通讯世界》 *

Also Published As

Publication number Publication date
CN112765207B (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN110689081B (zh) 一种基于分歧学习的弱监督目标分类和定位方法
Lines et al. A shapelet transform for time series classification
CN109886554B (zh) 违规行为判别方法、装置、计算机设备和存储介质
CN112528035B (zh) 基于关系注意力的知识图谱推理方法、装置和计算机设备
CN111444724B (zh) 医疗问答对质检方法、装置、计算机设备和存储介质
CN111177405A (zh) 数据搜索匹配方法、装置、计算机设备和存储介质
CN111291264A (zh) 基于机器学习的访问对象预测方法、装置和计算机设备
CN112732883A (zh) 基于知识图谱的模糊匹配方法、装置和计算机设备
CN113934830A (zh) 文本检索模型训练、问答检索方法、装置、设备及介质
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
Zhang et al. Foundations of intelligent knowledge management
CN111506719A (zh) 一种关联问句推荐方法、装置、设备及可读存储介质
CN115545300B (zh) 一种基于图神经网络进行用户行为预测的方法及装置
CN109492081A (zh) 文本信息搜索和信息交互方法、装置、设备及存储介质
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
CN110413994B (zh) 热点话题生成方法、装置、计算机设备和存储介质
CN112613321A (zh) 一种抽取文本中实体属性信息的方法及系统
CN113590737B (zh) 基于知识图谱的事件数据处理方法、装置、设备和介质
CN112464660B (zh) 文本分类模型构建方法以及文本数据处理方法
CN112765207B (zh) 资源大数据的处理、存储与查询方法
US20200279148A1 (en) Material structure analysis method and material structure analyzer
CN110909975B (zh) 科研平台效益评估方法、装置
CN115917562A (zh) 深度学习模型的推理方法、装置、计算机设备和存储介质
CN116503031A (zh) 基于简历解析的人员相似性计算方法、装置、设备及介质
CN116304155A (zh) 基于二维图片的三维构件检索方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant