CN116628281A - 遥感资源数据的检索方法、装置、设备以及存储介质 - Google Patents

遥感资源数据的检索方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN116628281A
CN116628281A CN202310611477.2A CN202310611477A CN116628281A CN 116628281 A CN116628281 A CN 116628281A CN 202310611477 A CN202310611477 A CN 202310611477A CN 116628281 A CN116628281 A CN 116628281A
Authority
CN
China
Prior art keywords
remote sensing
entity
metadata
natural disaster
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310611477.2A
Other languages
English (en)
Inventor
李文凯
史经业
金家栋
王春生
刘宏新
马冯
赵娜
魏庆鑫
王嘉辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Xingtu Huian Technology Co ltd
Original Assignee
Zhongke Xingtu Huian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Xingtu Huian Technology Co ltd filed Critical Zhongke Xingtu Huian Technology Co ltd
Priority to CN202310611477.2A priority Critical patent/CN116628281A/zh
Publication of CN116628281A publication Critical patent/CN116628281A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种遥感资源数据的检索方法、装置、设备以及存储介质,应用于遥感数据检索领域。该方法包括获取包括应用任务信息的待检索信息,在将待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到元数据索引;再根据元数据索引获取对应的遥感资源数据作为自然灾害数据集,并基于元数据索引对应的应用任务实体,从自然灾害数据集中提取应用任务信息对应的目标自然灾害数据集。以此方式,可以针对庞大的遥感数据量,快速地完成与自然灾害相匹配的遥感资源数据的检索,从而提高获取目标结果的精确度和效率。

Description

遥感资源数据的检索方法、装置、设备以及存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及遥感数据检索技术领域,具体涉及一种遥感资源数据的检索方法、装置、设备以及存储介质。
背景技术
对于自然灾害频发的地区,洪涝、干旱、地震、森林草原火灾等灾害不断发生,对生命财产安全构成重大威胁。当前,受限于遥感技术发展,遥感卫星仅作为自然灾害监测的辅助手段,在监测过程中未进行大规模应用,遥感数据需求不大,分散度高,处理繁琐且人工参与程度高。随着航天事业的蓬勃发展,遥感卫星商业化程度加深,遥感数据类型不断丰富。针对自然灾害监测而言,遥感技术慢慢占据主导地位,从灾中监测逐步延申到灾前预防和灾后重建等系列监测活动,因此,面向海量的遥感数据资源实现快速检索显得越来越迫切。
随着经济高速发展,自然灾害造成的生命财产损失也越发严重。由于地理、气候的影响,导致不同区域自然灾害特征不尽相同,同时,伴随高分系列、减灾系列、环境系列和其他商用卫星的持续补充,形成了高光谱、多光谱、全色、雷达等多系列产品集,不同类型卫星荷载在分辨率、表现力、穿透力方面又各具特色。
然而,当前的遥感数据检索方式主要是基于元数据或关键字,根据遥感影像的元数据将遥感影像的检索问题转为数据库的属性检索问题,满足在遥感数据量不大,自然灾害响应要求不高的情况应用。面对日渐增长的遥感数据量和高要求的自然灾害响应,通过当前的遥感数据检索方式获取目标结果的精确度和效率较低,已经不能满足在遥感数据量庞大,自然灾害响应要求高的情况应用。
发明内容
本公开提供了一种遥感资源数据的检索方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种遥感资源数据的检索方法。该方法包括:
获取第一待检索信息,所述第一待检索信息包括应用任务信息;
在将所述第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将所述元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,所述预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;
根据所述第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于所述第一元数据索引对应的应用任务实体,从所述第一自然灾害数据集中提取所述应用任务信息对应的第一目标自然灾害数据集。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预设遥感影像元数据库的构建过程包括:
对历史遥感资源数据进行分析和实体识别,提取空间实体、致灾因子实体和应用任务实体;所述历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
对所述空间实体、所述致灾因子实体和所述应用任务实体进行形式化处理,构建预设遥感影像元数据库,所述预设遥感影像元数据库为三元组形式。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述自然灾害领域知识图谱的构建包括:
将历史遥感资源数据输入预先训练的遥感影像领域实体提取模型,输出遥感影像领域实体;所述历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
在所述遥感影像领域实体包括应用任务实体的情况下,对所述遥感影像领域实体中各实体进行语义扩展,得到各实体对应的实体拓展集;
对各实体对应的实体拓展集进行语义组合,得到查询语句;
对所述查询语句进行结构化处理,得到自然灾害领域知识图谱。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述遥感影像领域实体提取模型的构建包括:
将所述历史遥感资源数据作为样本,所述历史遥感资源数据对应的遥感影像领域实体作为标注,得到的训练集对预设神经网络模型进行训练;
迭代计算所述预设神经网络模型输出的遥感影像领域实体与标注的匹配准确度,直至所述匹配准确度大于匹配准确度阈值,得到训练完成的遥感影像领域实体提取模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
根据所述第一目标自然灾害数据集,生成数字正射影像图或者数字表面模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
在将所述应用任务信息输入预先构建的自然灾害领域知识图谱,未输出遥感实体初始候选集合的元数据的情况下,将所述第一待检索信息作为元数据查询条件在所述预设遥感影像元数据库中进行影像检索,得到第二元数据索引;
根据所述第二元数据索引,获取对应的遥感资源数据作为第二自然灾害数据集,并基于所述第二元数据索引,从所述第二自然灾害数据集中提取第二目标自然灾害数据集。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
获取第二待检索信息,所述第二待检索信息不包括应用任务信息;
将所述第二待检索信息作为元数据查询条件在所述预设遥感影像元数据库中进行影像检索,得到第三元数据索引;
根据所述第三元数据索引,获取对应的遥感资源数据作为第三自然灾害数据集,并基于所述第三元数据索引,从所述第三自然灾害数据集中提取第三目标自然灾害数据集。
根据本公开的第二方面,提供了一种遥感资源数据的检索装置。该装置包括:
获取模块,用于获取第一待检索信息,所述第一待检索信息包括应用任务信息;
检索模块,用于在将所述第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将所述元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,所述预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;
提取模块,用于根据所述第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于所述第一元数据索引对应的应用任务实体,从所述第一自然灾害数据集中提取所述应用任务信息对应的第一目标自然灾害数据集。
根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
本申请实施例提供的一种遥感资源数据的检索方法、装置、设备以及存储介质,能够通过获取包括应用任务信息的第一待检索信息,在将第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;再根据第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,以便针对庞大的遥感数据量,快速地完成与自然灾害相匹配的遥感资源数据的检索,从而提高获取目标结果的精确度和效率,同时基于第一元数据索引对应的应用任务实体,从第一自然灾害数据集中提取应用任务信息对应的第一目标自然灾害数据集,以便针对高要求的自然灾害响应,精准并快速地完成目标要素的提取和生产。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案,不构成对本公开的限定在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本公开的实施例的遥感资源数据的检索方法的流程图;
图2示出了根据本公开的实施例的自然灾害领域知识图谱构建的示意图;
图3示出了根据本公开的实施例的遥感影像领域实体提取模型框架的示意图;
图4示出了根据本公开的实施例的遥感资源数据的检索方法中致灾因子与遥感特征数据组织流程的示意图;
图5示出了根据本公开的实施例的遥感资源数据的检索装置的方框图;
图6示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本公开中,能够针对庞大的遥感数据量,快速地完成与自然灾害相匹配的遥感资源数据的检索,从而提高获取目标结果的精确度和效率,同时还能够针对高要求的自然灾害响应,精准并快速地完成目标要素的提取和生产。
图1示出了根据本公开实施例的遥感资源数据的检索方法100的流程图。
在框110,获取第一待检索信息,第一待检索信息包括应用任务信息。
在一些实施例中,第一待检索信息可以是用户输入的需要进行检索的信息,即用户输入的查询条件。第一待检索信息可以包括应用任务信息,以及空间信息、致灾因子信息、遥感信息和其他信息。
在一些实施例中,致灾因子信息可以是自然或人为环境中,能够对人类生命、财产或各种活动产生不利影响,并达到造成灾害的罕见或极端的事件信息。致灾因子包括但不限于暴雨洪涝、干旱、热带气旋、风暴潮、霜冻、低温、冰雹、海啸、地震、滑坡以及泥石流。
在一些实施例中,遥感信息可以包括遥感实体信息和遥感数据信息。
在一些实施例中,遥感实体信息可以是获取遥感数据的遥感卫星的信息,如“GF3SAR”卫星。
在一些实施例中,遥感数据信息可以是基于遥感卫星进行远距离探测获取的遥感数据的信息。例如,运用传感器/遥感器对物体的电磁波的辐射、反射特性的进行探测得到的遥感数据信息,遥感数据信息包括遥感特征,遥感特征可以由传感器采用的光谱区间决定,主要包括光学和微波两类。其中,光学影像具有高解析度与易于解读等优点,而微波影像具长距离、全天候、穿透性强之优点,适合经常被云雾遮盖之地的成像需求。
例如,第一待检索信息可以为“辽宁盘锦市饶阳河洪涝发生溃堤,导致附近基础设施被淹没。基于GF3 SAR影像对溃堤区域开展长时序监测,采用深度学习法提取洪涝灾害范围,利用叠加分析和NDVI差值法,提取受损农作物范围和面积”。
其中,致灾因子信息为“洪涝发生溃堤”,空间信息为“辽宁省盘锦市”,遥感实体信息为“GF3 SAR”,应用任务信息为“洪涝灾害范围提取”、“农作物损毁范围和面积提取”。
在框120,在将第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体。
在一些实施例中,遥感实体初始候选集合的元数据可以包括遥感实体初始候选集合中每个遥感实体应用对应的时间、空间、应用任务和遥感影像产品信息。
在一些实施例中,将第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况,即为用户输入的查询条件中包括应用任务信息,且基于自然灾害领域知识图谱确定并提取出应用任务实体,并利用自然灾害领域知识图谱对遥感影像领域实体中各实体进行实体语义拓展和推理,得到并输出遥感实体初始候选集合的元数据的情况。
其中,语义推理目的是通过自然灾害领域知识图谱强大的关联分析、知识推理和搜索能力满足用户需求的候选影像产品信息。
在一些实施例中,遥感影像领域实体中各实体包括时间实体、空间实体、致灾因子实体以及应用任务实体。
例如,以第一待检索信息为例,致灾因子实体为“洪涝”、空间实体“辽宁省盘锦市”、遥感实体“GF3 SAR”、应用任务实体“洪涝灾害范围提取”、“农作物损毁面积”。
在一些实施例中,在基于自然灾害领域知识图谱确定并提取出应用任务实体和空间实体后,可以对对应用任务实体和空间实体进行语义扩展,得到各实体对应的实体拓展集,即空间实体扩展集和应用任务实体扩展集。再对空间实体扩展集和应用任务实体扩展集进行语义组合。比如,对于包括了空间和应用任务的用户输入的查询条件,语义组合为:<?y,R:空间为,E:空间实体>and<?y,致灾因子,E:致灾因子实体:>。随后,构造结构化的查询语句,在自然灾害领域知识图谱中执行查询操作,获得遥感实体初始候选集合。再通过自然灾害领域知识图谱查询可获取遥感实体初始候选集合中每个遥感实体应用对应的时间、空间、应用任务和遥感影像产品信息,从而将获得的遥感影像产品集作为用户查询候选需求。若用户输入查询中有属性约束信息,则在自然灾害领域知识图谱中执行查询时加入属性约束信息。
在一些实施例中,将第一元数据作为查询条件,提交至预设遥感影像元数据库中的元数据检索模块,执行查询操作,在预设遥感影像元数据库中进行影像检索得到相关的元数据检索结果,即第一元数据索引。
在框130,根据第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于第一元数据索引对应的应用任务实体,从第一自然灾害数据集中提取应用任务信息对应的第一目标自然灾害数据集。
在一些实施例中,第一自然灾害数据集可以是根据第一元数据索引检索得到的对应的遥感资源数据,即遥感影像。第一目标自然灾害数据集可以是基于元数据检索结果,数据自动引接到对应自然灾害数据集,并基于<空间、致灾因子、应用任务>三元组中的应用任务实体,自动启动数据处理流程,完成数字正射影像图(Digital Orthophoto Model,DOM)、数字表面模型(Digital Surface Model,DSM)生产和目标要素的提取,得到的对应的数据集。
综上可见,通过上述过程,基于领域知识图谱研究致灾因子与遥感灾害特征相关性,能够将复杂的致灾因子与遥感特征建立起相关性,实现自然灾害突发时,快速构架自然灾害监测数据集,完成星源自动匹配,实时获取遥感数据资源,自动调取正射影像生产模型、目标要素提取模型,开展标准产品生产,并实现遥感数据自动检索、引接、处理和监测,持续获取关联数据,支撑灾害监测。
同时,从遥感数据检索、数据引接、标准产品质检和数据质检等过程皆无需人为干预,数据组织流程处于自动阶段,自动化程度高;同时形成自然灾害组织数据集,无需要经过多次循环获得,过程简单,时间和人力成本投入较低。另外,通过上述方案,并未在各环节处都形成接口,从而避免接口处产生沉没时间,提高了整个数据组织的效率,并且相比与当前遥感数据检索方式主要是基于元数据或关键字,根据遥感影像的元数据将遥感影像的检索问题转为数据库的属性检索问题,本公开提供的方式不需要用户具有专业的知识背景支撑,对于不具备行业知识的非专业用户,也可以获取目标结果。
根据本公开的实施例,实现了以下技术效果:
能够通过获取包括应用任务信息的第一待检索信息,在将第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;再根据第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,以便针对庞大的遥感数据量,快速地完成与自然灾害相匹配的遥感资源数据的检索,从而提高获取目标结果的精确度和效率,同时基于第一元数据索引对应的应用任务实体,从第一自然灾害数据集中提取应用任务信息对应的第一目标自然灾害数据集,以便针对高要求的自然灾害响应,精准并快速地完成目标要素的提取和生产。
在一些实施例中,上述预设遥感影像元数据库的构建过程包括:
对历史遥感资源数据进行分析和实体识别,提取空间实体、致灾因子实体和应用任务实体;历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
对空间实体、致灾因子实体和应用任务实体进行形式化处理,构建预设遥感影像元数据库,预设遥感影像元数据库为三元组形式。
在一些实施例中,在构建预设遥感影像元数据库的过程中,可以借助于自然灾害领域知识图谱强大的语义理解能力,以知识和任务为驱动,在明确用户实际应用需求的前提下,深度理解用户搜索需求,实现高效、智能的遥感影像检索。
在一些实施例中,致灾因子引发自然灾害,用户建立自然灾害时间,设置灾害发生区域,通过自然语言处理技术对其进行分词、实体识别等操作,抽取处时间实体、空间实体、致灾因子实体、应用任务实体等信息,即基于自然灾害领域知识图谱,对历史遥感资源数据进行分析和实体识别,提取时间实体、空间实体、致灾因子实体、应用任务实体等信息,然后形式化<空间、致灾因子、应用任务>三元组形式,完成预设遥感影像元数据库的构建。
在一些实施例中,预设遥感影像元数据库,即影像元数据,包括元数据检索模块和元数据索引模块。
根据本公开的实施例,通过构建三元组形式的预设遥感影像元数据库,基于三元形式,可以进一步提高获取目标结果的精确度和效率。
在一些实施例中,上述自然灾害领域知识图谱的构建包括:
将历史遥感资源数据输入预先训练的遥感影像领域实体提取模型,输出遥感影像领域实体;历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
在遥感影像领域实体包括应用任务实体的情况下,对遥感影像领域实体中各实体进行语义扩展,得到各实体对应的实体拓展集;
对各实体对应的实体拓展集进行语义组合,得到查询语句;
对查询语句进行结构化处理,得到自然灾害领域知识图谱。
在一些实施例中,构建的自然灾害领域知识图谱可以是特定领域构建的知识图谱,以结构化的形式描述客观世界中概念、实体及其之间的关系,是结构化的语义知识库,其本质是一种大规模的语义网络,提供了一种更好地组织、管理和理解海量信息的能力,实现知识的快速聚集、查询响应和推理等。自然灾害领域知识图谱的构建一般采用自顶向下构建模式层和自底向上抽取数据层相结合的方法,涉及到知识表示、自然语言处理、数据挖掘等一系列技术。
需要说明的是,自然灾害领域知识图谱的构建是一个递进式不断迭代更新的过程,每轮迭代过程主要包括三个环节,即知识提取、知识融合和知识加工。
图2示出了根据本公开的实施例的自然灾害领域知识图谱构建的示意图。参见图2,首先从模式设计开始,随后进行数据来源的获取、知识获取、知识融合以及质量控制,以便构建自然灾害领域知识图谱。在构建自然灾害领域知识图谱的迭代更新过程,需要进行应用更新,以便逐渐完善自然灾害领域知识图谱。
在一些实施例中,自然灾害领域知识图谱需要融合不同来源的数据,用以丰富其语义信息。按照组织形式分为结构化数据、半结构化数据和非结构化数据三类。
根据本公开的实施例,通过构建自然灾害领域知识图谱,实现知识的快速聚集、查询响应和推理,可以进一步提高获取目标结果的精确度和效率。
在一些实施例中,上述遥感影像领域实体提取模型的构建包括:
将历史遥感资源数据作为样本,历史遥感资源数据对应的遥感影像领域实体作为标注,得到的训练集对预设神经网络模型进行训练;
迭代计算预设神经网络模型输出的遥感影像领域实体与标注的匹配准确度,直至匹配准确度大于匹配准确度阈值,得到训练完成的遥感影像领域实体提取模型。
在一些实施例中,可以基于致灾因子特征和遥感特征,通过遥感影像领域实体的标准规范,对样本数据进行人工和半自动方式标注构建语料库,在此基础上采用Bi-LSTM+CRF神经网络模型,实现遥感影像领域实体的半监督学习。
图3示出了根据本公开的实施例的遥感影像领域实体提取模型框架的示意图。参见图3,采用BIOES标签标注方式,与实体类型标签组合,将每个元素标注为“B-X”、“I-X”、“E-X”、“S-X”或“O”。其中,“B-X”表示当前词处于X类型实体的开头,“I-X”表示当前词处于X类型实体的内部,“E-X”表示当前词处于X类型实体的结束,S-X表示当前词为一个单独的X类型实体,“O”表示不属于任何类型。
遥感影像领域实体提取模型的结构由分布式表示、Bi-LSTM(即LSTM输出、后向LSTM以及前向LSTM)、CRF(即条件随机层)三层构成。Bi-LSTM是对LSTM的改进,同时考量实体的过去和未来特征,提升标签的准确度,使用CRF作为模型的解码层,考虑标签间的相关性,获得全局最优的输出序列。
其中,x1-x5表示不通长度的词向量,h1-h5表示不同的字向量,P1-P5表示第一句至第五句中句子中第i各字是j标间非归一化概率(得分)。其中,P可以表示为如下所示:
其中,n表示输入长度,k表示标签数。
在一些实施例中,基于构建完成的遥感影像领域实体提取模型,可见遥感影像应用的要素并不是简单的<属性,值>对,对象之间存在着时间、空间和语义关系。通过领域命名实体识别及推理得到遥感应用活动的各个要素及其类别,如类别、空间、时间、观测对象、观测属性,基于本体模型关系获取对应的实体数据并构建实体数据关系。领域主体关系从领域语义关系抽取和领域实体属性抽取两个方向实现。语义关系抽取应用历史自然灾害数据为主要数据源。实体识别任务中以确定了遥感影像应用实例对应的致灾因子、空间、遥感影像集应用任务要素,通过本体中定义的关系类型集实体识别任务中确定的实体类别,实现致灾因子与遥感特征的自动语义映射。
根据本公开的实施例,通过构建遥感影像领域实体提取模型,实现对遥感影像领域实体的标准规范,可以进一步提高获取目标结果的精确度和效率。
在一些实施例中,上述历史遥感资源数据包括但不限于历史自然灾害数据库、遥感影像数据、遥感影像在自然灾害应用的文献、开发链接数据以及开发知识库。
在一些实施例中,历史遥感资源数据为多源异构数据,基于此,可以基于多源异构数据的领域指数抽取作为自然语言处理领域非常重要的任务,以致力于从海量非结构化或半结构化的自然语言文本中抽取重要信息,以结构化形式呈现。
在一些实施例中,上述方法还包括:
根据第一目标自然灾害数据集,生成数字正射影像图或者数字表面模型。
在一些实施例中,在完成目标要素的提取和生产后,可以将目标要素进行数据组织流程化、自动化和可视化的处理,如数字正射影像图或者数字表面模型,以便直接展示检索结果,便于用户直观感受。
在一些实施例中,上述方法还包括:
在将应用任务信息输入预先构建的自然灾害领域知识图谱,未输出遥感实体初始候选集合的元数据的情况下,将第一待检索信息作为元数据查询条件在预设遥感影像元数据库中进行影像检索,得到第二元数据索引;
根据第二元数据索引,获取对应的遥感资源数据作为第二自然灾害数据集,并基于第二元数据索引,从第二自然灾害数据集中提取第二目标自然灾害数据集。
在一些实施例中,若自然灾害领域知识图谱未输出遥感实体初始候选集合的元数据,则表示此时用户输入的查询条件不考虑实质的应用任务,即无需基于自然灾害领域知识图谱进行实体拓展和推理,可以直接将第一待检索信息作为元数据查询条件在预设遥感影像元数据库中进行影像检索,并完成后续的数据接引和处理。
在一些实施例中,上述方法还包括:
获取第二待检索信息,第二待检索信息不包括应用任务信息;
将第二待检索信息作为元数据查询条件在预设遥感影像元数据库中进行影像检索,得到第三元数据索引;
根据第三元数据索引,获取对应的遥感资源数据作为第三自然灾害数据集,并基于第三元数据索引,从第三自然灾害数据集中提取第三目标自然灾害数据集。
在一些实施例中,若可以直接识别出用户输入的查询条件不包括应用任务信息,则可以直接将用户输入的空间信息或其他信息作为查询条件执行元数据查询,即在预设遥感影像元数据库中进行影像检索,并完成后续的数据接引和处理。
在一些实施例中,上述涉及遥感资源数据的检索方法中致灾因子与遥感特征数据组织流程的全流程,可以如图4所示。参见图4,查询输入用于用户输入待检索信息,基于对待检索信息的识别,根据不同的输入方式采用不同的查询模式。当采取用户输入不包括应用任务信息的输入方式时,可以直接将待检索信息作为查询条件在影像元数据中进行影像检索,即通过元数据检索输出元数据索引。当采取用户输入包括应用任务信息的输入方式时,将待检索信息输入领域知识图谱,进行查询分析。具体地,通过信息提取,判断待检索信息是否包含任务实体,若不包含任务实体,则直接根据待检索信息执行影像检索,若包含任务实体,则对任务实体进行语义拓展、语义推理和查询调整,最后输出元数据作为查询条件执行影像检索。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
图5示出了根据本公开的实施例的遥感资源数据的检索装置500的方框图。如图5所示,装置500包括:
获取模块510,用于获取第一待检索信息,第一待检索信息包括应用任务信息;
检索模块520,用于在将第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;
提取模块530,用于根据第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于第一元数据索引对应的应用任务实体,从第一自然灾害数据集中提取所述应用任务信息对应的第一目标自然灾害数据集。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了能够实施本公开的实施例的示例性电子设备600的方框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
电子设备600包括计算单元601,其可以根据存储在ROM602中的计算机程序或者从存储单元608加载到RAM603中的计算机程序,来执行各种适当的动作和处理。在RAM603中,还可存储电子设备600操作所需的各种程序和数据。计算单元601、ROM602以及RAM603通过总线604彼此相连。I/O接口605也连接至总线604。
电子设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如方法100。例如,在一些实施例中,方法100可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。
在一些实施例中,计算机程序的部分或者全部可以经由ROM602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM803并由计算单元601执行时,可以执行上文描述的方法100的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法100。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置;以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (10)

1.一种遥感资源数据的检索方法,其特征在于,包括:
获取第一待检索信息,所述第一待检索信息包括应用任务信息;
在将所述第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将所述元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,所述预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;
根据所述第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于所述第一元数据索引对应的应用任务实体,从所述第一自然灾害数据集中提取所述应用任务信息对应的第一目标自然灾害数据集。
2.根据权利要求1所述的方法,其特征在于,所述预设遥感影像元数据库的构建过程包括:
对历史遥感资源数据进行分析和实体识别,提取空间实体、致灾因子实体和应用任务实体;所述历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
对所述空间实体、所述致灾因子实体和所述应用任务实体进行形式化处理,构建预设遥感影像元数据库,所述预设遥感影像元数据库为三元组形式。
3.根据权利要求1所述的方法,其特征在于,所述自然灾害领域知识图谱的构建包括:
将历史遥感资源数据输入预先训练的遥感影像领域实体提取模型,输出遥感影像领域实体;所述历史遥感资源数据为历史致灾因子导致的自然灾害事件集合数据;
在所述遥感影像领域实体包括应用任务实体的情况下,对所述遥感影像领域实体中各实体进行语义扩展,得到各实体对应的实体拓展集;
对各实体对应的实体拓展集进行语义组合,得到查询语句;
对所述查询语句进行结构化处理,得到自然灾害领域知识图谱。
4.根据权利要求3所述的方法,其特征在于,所述遥感影像领域实体提取模型的构建包括:
将所述历史遥感资源数据作为样本,所述历史遥感资源数据对应的遥感影像领域实体作为标注,得到的训练集对预设神经网络模型进行训练;
迭代计算所述预设神经网络模型输出的遥感影像领域实体与标注的匹配准确度,直至所述匹配准确度大于匹配准确度阈值,得到训练完成的遥感影像领域实体提取模型。
5.根据权利要求1-4任意一项权利要求所述的方法,其特征在于,所述方法还包括:
根据所述第一目标自然灾害数据集,生成数字正射影像图或者数字表面模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在将所述应用任务信息输入预先构建的自然灾害领域知识图谱,未输出遥感实体初始候选集合的元数据的情况下,将所述第一待检索信息作为元数据查询条件在所述预设遥感影像元数据库中进行影像检索,得到第二元数据索引;
根据所述第二元数据索引,获取对应的遥感资源数据作为第二自然灾害数据集,并基于所述第二元数据索引,从所述第二自然灾害数据集中提取第二目标自然灾害数据集。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二待检索信息,所述第二待检索信息不包括应用任务信息;
将所述第二待检索信息作为元数据查询条件在所述预设遥感影像元数据库中进行影像检索,得到第三元数据索引;
根据所述第三元数据索引,获取对应的遥感资源数据作为第三自然灾害数据集,并基于所述第三元数据索引,从所述第三自然灾害数据集中提取第三目标自然灾害数据集。
8.一种遥感资源数据的检索装置,其特征在于,包括:
获取模块,用于获取第一待检索信息,所述第一待检索信息包括应用任务信息;
检索模块,用于在将所述第一待检索信息输入预先构建的自然灾害领域知识图谱,输出遥感实体初始候选集合的元数据的情况下,将所述元数据作为查询条件在预设遥感影像元数据库中进行影像检索,得到第一元数据索引;其中,所述预设遥感影像元数据库根据遥感资源数据构建,包括应用任务实体;
提取模块,用于根据所述第一元数据索引,获取对应的遥感资源数据作为第一自然灾害数据集,并基于所述第一元数据索引对应的应用任务实体,从所述第一自然灾害数据集中提取所述应用任务信息对应的第一目标自然灾害数据集。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一权利要求所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一权利要求所述的方法。
CN202310611477.2A 2023-05-26 2023-05-26 遥感资源数据的检索方法、装置、设备以及存储介质 Pending CN116628281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310611477.2A CN116628281A (zh) 2023-05-26 2023-05-26 遥感资源数据的检索方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310611477.2A CN116628281A (zh) 2023-05-26 2023-05-26 遥感资源数据的检索方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN116628281A true CN116628281A (zh) 2023-08-22

Family

ID=87612943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310611477.2A Pending CN116628281A (zh) 2023-05-26 2023-05-26 遥感资源数据的检索方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN116628281A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117851458A (zh) * 2024-01-08 2024-04-09 中国林业科学研究院资源信息研究所 可快速空间定位的林草资源数据查询方法及系统
CN117931810A (zh) * 2024-03-21 2024-04-26 成都歧明通信息科技有限公司 一种空间影像数据的结构化管理方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117851458A (zh) * 2024-01-08 2024-04-09 中国林业科学研究院资源信息研究所 可快速空间定位的林草资源数据查询方法及系统
CN117851458B (zh) * 2024-01-08 2024-08-02 中国林业科学研究院资源信息研究所 可快速空间定位的林草资源数据查询方法及系统
CN117931810A (zh) * 2024-03-21 2024-04-26 成都歧明通信息科技有限公司 一种空间影像数据的结构化管理方法及系统

Similar Documents

Publication Publication Date Title
CN116628281A (zh) 遥感资源数据的检索方法、装置、设备以及存储介质
Dong et al. Oil palm plantation mapping from high-resolution remote sensing images using deep learning
CN113032672A (zh) 多模态poi特征的提取方法和装置
CN111143588B (zh) 一种基于机器学习的图像时空索引快速检索方法
CN113947188A (zh) 目标检测网络的训练方法和车辆检测方法
CN113139110B (zh) 区域特征处理方法、装置、设备、存储介质和程序产品
Lin et al. An unsupervised transformer-based multivariate alteration detection approach for change detection in VHR remote sensing images
CN111832358A (zh) 一种点云语义解析方法和装置
Çalışkan et al. Forest road extraction from orthophoto images by convolutional neural networks
CN115248890A (zh) 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN112528146A (zh) 内容资源推荐方法、装置、电子设备及存储介质
CN114691918B (zh) 基于人工智能的雷达图像检索方法、装置以及电子设备
CN116521895A (zh) 生成遥感影像的场景图的方法、系统、装置和介质
CN116644185A (zh) 用于构建遥感领域知识图谱的方法、系统、装置和介质
Wang et al. Farmland quality assessment using deep fully convolutional neural networks
CN115168622A (zh) 语言模型的训练方法、装置、电子设备及存储介质
CN113704494B (zh) 基于知识图谱的实体检索方法、装置、设备以及存储介质
CN115482436A (zh) 图像筛选模型的训练方法、装置以及图像筛选方法
CN112182409B (zh) 数据处理方法、装置、设备及计算机存储介质
Ma et al. Generative Adversarial Differential Analysis for Infrared Small Target Detection
CN114091463A (zh) 地区工单乱点分析方法、装置、电子设备及可读存储介质
CN110781283B (zh) 连锁品牌词库生成方法、装置以及电子设备
CN116883711B (zh) 基于多源地理数据的废弃矿井再利用智能分类方法
CN116450856B (zh) 气象海洋非结构化文本知识构建方法、装置及电子设备
Li et al. Square ancient sites detection in typical regions of the Mongolian plateau using improved faster R-CNN from Google Earth high-resolution images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination