CN117972116A - 融合时序知识图谱的农作物遥感影像智能样本库构建方法 - Google Patents
融合时序知识图谱的农作物遥感影像智能样本库构建方法 Download PDFInfo
- Publication number
- CN117972116A CN117972116A CN202410391737.4A CN202410391737A CN117972116A CN 117972116 A CN117972116 A CN 117972116A CN 202410391737 A CN202410391737 A CN 202410391737A CN 117972116 A CN117972116 A CN 117972116A
- Authority
- CN
- China
- Prior art keywords
- crop
- remote sensing
- time sequence
- time
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 11
- 238000002372 labelling Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 25
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 9
- 238000013508 migration Methods 0.000 claims description 9
- 230000005012 migration Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 6
- 238000007635 classification algorithm Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 2
- 230000008447 perception Effects 0.000 abstract 1
- 241000209140 Triticum Species 0.000 description 17
- 235000021307 Triticum Nutrition 0.000 description 17
- 241000209094 Oryza Species 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 235000009566 rice Nutrition 0.000 description 10
- 238000011835 investigation Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 239000002352 surface water Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 238000009331 sowing Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002310 reflectometry Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Image Processing (AREA)
Abstract
本发明涉及融合时序知识图谱的农作物遥感影像智能样本库构建方法,包括:根据农作物的物候期获取遥感影像数据、地类图斑数据;从地类图斑数据中提取农作物地块,对农作物地块对应的遥感影像标注属性信息和地块基础信息,形成农作物时空遥感影像样本库;以农作物地块为核心,构建以时序三元组表达知识的时序知识图谱模型;以农作物地块的唯一标识为基准,关联农作物时空遥感样影像本库与时序知识图谱,形成融合时序知识图谱的农作物遥感影像样本库。本发明通过引入时序关系,构建更为完整和动态的农作物生长历史,从而提高对农田时序信息的全面感知和准确理解。
Description
技术领域
本发明属于遥感技术及数据识别技术(农业信息处理领域)领域,具体涉及一种融合时序知识图谱的农作物遥感影像智能样本库构建方法。
背景技术
农业遥感监测作为现代农业管理的支柱之一,旨在通过获取和分析农田的遥感影像数据来实现对农作物生长状况的监测。传统的静态图像分类方法虽然在一定程度上满足了对农作物类型的初步判别,但对于农作物的生长动态、季节性变化等时序性特征的把握却显得相当有限。由此产生的监测结果可能无法全面反映真实的农田状态,制约了现代农业精细化管理的发展。面对农业管理的时序化需求,传统监测方法的局限性凸显出更为迫切的技术改进需求。
发明内容
本发明的目的在于克服上述现有技术存在的缺陷,提供融合时序知识图谱的农作物遥感影像智能样本库构建方法,通过引入时序关系,构建更为完整和动态的农作物生长历史,从而提高对农田时序信息的全面感知和准确理解。
为实现上述技术目的,本发明采用如下技术方案:
融合时序知识图谱的农作物遥感影像智能样本库构建方法,包括:
根据农作物的物候期,获取不同时间点的农作物高分辨率、中分辨率遥感影像数据、与影像数据匹配的地类图斑数据;
从地类图斑数据中提取耕地地块,基于中分辨率遥感影像数据将耕地地块划分为不同农作物类别,提取农作物地块,并对农作物地块赋予唯一标识码;对农作物地块对应的高分辨率、中分辨率遥感影像标注属性信息和地块基础信息,形成农作物时空遥感影像样本库;
以农作物地块为核心,构建以时序三元组表达知识的时序知识图谱模型,基于收集和处理得到的数据,抽取时序知识图谱模型需要的实体、关系和属性,获取一系列三元组,将三元组加上其有效时间,生成时序三元组,即时序知识图谱,并存储;
以农作物地块的唯一标识为基准,关联农作物时空遥感样影像本库与时序知识图谱,形成融合时序知识图谱的农作物遥感影像样本库。
作为一种优选的实施方式,从地类图斑数据中提取耕地地块后,对提取的耕地地块结合高分辨率遥感影像数据进行优化,包括剔除长度超出阈值的道路,剔除耕地地块边缘的单棵树木或行树,剔除耕地地块中的其它地类。
作为一种优选的实施方式,通过中分辨率遥感影像数据计算NDVI、EVI和LWSI指数,采用决策树分类算法提取耕地地块内农作物种植结构。
作为一种优选的实施方式,计算NDVI、EVI和LWSI指数后,基于S-G滤波重构NDVI、EVI和LWSI指数时序数据。
作为一种优选的实施方式,利用中分辨率遥感影像数据进行农作物类别划分前,对利用影像数据计算的指数时序数据进行缺失信息的插补,包括:
当存在光谱信息缺失时,优先采用空间知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度,从周边地块中进行当前地块缺失信息的插补;
当空间知识迁移不满足时,采用历史知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度,从上一年同一位置或周边地块中进行当前地块缺失信息的插补。
作为一种优选的实施方式,所述将地块划分为不同农作物类别包括:
利用中分辨率遥感影像数据提取耕地地块内农作物种植结构,之后根据地块内农作物占比进行编码:
当某一耕地地块内只有一种农作物,且单一农作物占比达到b以上,则认为该耕地地块为该农作物,并继承当前耕地地块的唯一标识码;当单一农作物占比小于a,则删除该耕地地块样本;单一农作物占比在a-b之间,则根据地块纹理进行切分,并继承当前耕地地块的唯一标识码;
当某一耕地地块内有多种农作物时,只切分单一农作物占比在a以上的农作物种类,并在继承当前耕地地块的唯一标识码后,根据农作物种类进行下一级续编;
a、b为预设百分比阈值。
作为一种优选的实施方式,所述属性信息包括影像名称、空间坐标系、分辨率、获取时间;所述地块基础信息包括唯一标识码、空间坐标系、作物名称、周长、面积。
作为一种优选的实施方式,所述以农作物地块为核心,构建以时序三元组表达知识的时序知识图谱模型包括:
定义模型相关的实体类、关系类和时间类;
基于顾及时间的主谓宾语义关系,构建类之间的关系;
基于模型的类和关系设置模型的数据属性。
作为一种优选的实施方式,所述抽取时序知识图谱模型需要的实体、关系和属性包括:
利用GIS工具抽取空间关系中的拓扑关系、方位关系和距离关系,基于所述地类图斑数据生成关系数据库;
利用遥感处理工具获取高分辨率遥感影像中纹理信息的特征统计量、中分辨率遥感影像中光谱信息的特征统计量,基于所述影像数据生成关系数据库;
采用R2RML方法从收集和处理得到的数据中抽取时序知识图谱模型需要的实体、关系和属性。
作为一种优选的实施方式,基于构建的时序知识图谱模型,选用Neo4j图模型数据库用RDF三元组存储所述时序三元组
融合时序知识图谱的构建不仅是对传统方法的有力补充,更是农业遥感领域向更高水平迈进的关键一步。时序知识图谱的引入为遥感影像分类提供了新的视角,通过捕捉不同时间点的地物信息和时序关系,使得我们能够更全面、更准确地掌握农作物的生长动态。本申请构建的智能样本库兼顾时空信息,通过融合多源时序数据,为农业决策提供更为准确、全面的支持,从而推动农业向数字化、智能化迈进。该技术有望为农业遥感技术注入新的活力,为现代农业管理带来实质性的进步。
附图说明
图1是本发明的融合时序知识图谱的农作物遥感影像智能样本库构建方法的总体流程图。
图2是0.5米1:1万标准分幅正射影像获取时间分布图。
图3是某一地区的耕地地块。
图4是NDVI时序数据重构对比图。
图5是缺失信息插补示意图。
图6是农作物分类决策树。
图7是直接保留的单一农作物地块。
图8是需要删除的单一农作物地块。
图9是需要切分的单一农作物地块。
图10是切分的多种农作物地块。
图11是农作物时空遥感影像样本库示意图。
图12是模型的类。
图13是RDF三元组表示一个时序三元组。
具体实施方式
为使本发明实施例的目的和技术方案更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
融合时序知识图谱的农作物遥感影像智能样本库构建方法,其特征在于,包括以下步骤:
(1)数据收集:根据农作物的物候期,从多个时间点获取农作物遥感影像数据、与影像数据相匹配的年度国土变更调查地类图斑数据、土壤类型数据及相关元数据等;
所述从多个时间点获取农作物遥感影像数据,其时间点是根据农作物物候期确定;遥感影像数据至少包括1期在整个农作物物候期内优于1米分辨率的高分辨率遥感影像;包括在整个农作物物候期内时间精度优于10天,空间分辨率优于20米的中分辨率遥感影像;与影像数据相匹配的年度国土变更调查地类图斑数据为物候期内最新的数据;元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据;遥感影像数据格式为后缀名*.jpg的JPEG、*.GIF的TIFF或*.img的IMAGINE Image中的一种或数种;元数据、年度国土变更调查地类图斑数据和土壤类型数据为后缀名*.shp的Shapefile、后缀名*.mdb的Personal Geodatabase或后缀名*.gdb的File Geodatabase中的一种或数种。
以2023年江淮某一地区冬小麦需要的遥感影像为例,其物候期主要包括6个时间节点:播种出苗(2022年10月20日-2022年11月20日)、分蘖-越冬-返青(2022年11月20日-2023年2月20日)、拔节(2023年2月20日-2023年3月31日)、抽穗开花(2023年4月1日-2023年4月30日)、乳熟(2023年5月1日-2023年5月20日)、成熟(2023年5月20日-2023年6月10日)。收集的优于1米分辨率的高分辨率遥感影像为0.5米1:1万标准分幅卫星正射影像,获取时间、分辨率等信息从元数据中获取,如图2所示;收集的精度优于10天,空间分辨率优于20米用于计算光谱特征的中分辨率遥感影像为时间精度为5天,分辨率为10米的哨兵数据,播种出苗时间节点的部分数据如表1所示。年度国土变更调查地类图斑数据为时间节点为2022年12月31日。
表1播种出苗时间节点部分哨兵数据
(2)农作物分类:从年度国土变更调查地类图斑中提取耕地地块作为农作物本底数据,基于多时序中分辨率遥感影像,采用决策树分类算法将地块划分为不同的农作物类别;
(I)地块提取:根据年度国土变更调查地类图斑中的“地类名称”字段提取地类图斑数据中的水田、旱地和水浇地作为耕地地块。提取的地块需要结合优于1米分辨率的高分辨率遥感影像人工优化,因为国土变更数据是较为准确的实地调查数据,但影像大多有滞后性,例如3月份在内业根据影像更新一块耕地的范围,5月份外业实地核实后范围更新了,这样采集的范围就不与影像套合了,不符合样本的要求,因此需人工调整为与影像一致。此外,优化还可处理采集精度造成的问题,例如耕地边缘的树木由于不够单独采集的标准,就并入耕地了,耕地中独栋房屋不够上图面积也并入耕地了。为了提高样本准确率,需进行优化。
具体优化方法是通过国土变更调查叠加当期高分辨率影像,进行人工优化,优化的原则如下:
(a)提取的地块必须为耕地。
(b)耕地地块内的纹理为大致均匀的统一体,边界规则平整。
(c)连片区域内小于1米道路(渠道、田埂)可计入,1米以上道路需去除。
(d)耕地地块边缘的单棵树木或行树需要剔除。
(e)耕地地块中的房屋、农业设施、电线塔等其它地类需要剔除。
图3为某一区域最终获取的耕地地块。
(II)光谱特征计算:在辐射定标、大气校正、几何校正、影像裁剪、图像融合等预处理的基础上通过中分辨率遥感影像计算NDVI、EVI和LWSI。 高分辨的光谱信息有限且获取周期长,分辨率高,地块范围的完整性、准确性有保证,但难以实现地块内农作物种植结构的区分。中分辨率影像光谱信息丰富,且获取周期短,很容易通过构建时序数据计算NDVI、LSWI、EVI数据,可确定地块内具体种植了什么,但分辨率低,地块完整性、准确性难以保证。利用高分辨率影像优化地块,结合中分辨率影像提取种植结构,即保证了地块范围的完整性、准确性,又保证了地块内种植结构判断的准确性。
现阶段常用的植被指数因子有归一化差异植被指数(Normalized DifferenceVegetation,NDVI)和增强植被指数(Enhanced Vegetation Index,EVI)。NDVI是监测作物生长状态的最佳指示因子,还能反映出植物冠层的背景(如土壤、潮湿地面、雪和枯叶等)影响,当土地还未耕作时裸露地表的NDVI指数接近0。EVI设置了更窄的红边波段,可以减少水汽的影响,加强了对植被稀疏地区的监测能力。另外,它引入蓝光波段能够降低土壤背景和大气噪声的干扰,可稳定地反映地表植被特征。
地表水分指数(Land Surface Water Index,LWSI),是指植被冠层中水分的含量。其基本原理是植被在近红外波段的吸收率较低,而在短波红外波段的吸收率较高。
NDVI、LSWI、EVI可以利用红、蓝、近红外(841~875nm)、短波红外(1628~1652)的反射率来计算:
式中,ρ nir 、ρ red 、ρ blue 、ρ swir 分别为近红外、红、蓝、短波红外波段的反射率。
(III)时序数据重构:基于S-G滤波原理,对植被指数因子时间序列数据进行重构,提高光谱的平滑性,降低噪音的干扰。
以NDVI时间序列数据重构为例,完整的植被指数时间序列数据集能够较好地反映作物从播种-生长-成熟-收割的全过程。由于传感器数据在成像时受到云和大气等因素的干扰,导致时间序列数据存在严重的噪声和可变性,NDVI时序曲线呈现不规则波动,对农作物提取产生影响,降低提取精度。为了更好的进行阈值划分,需要对NDVI时序数据进行处理,提高光谱的平滑性,降低噪音的干扰。Savitzky-Golay(S-G)滤波法是一种移动窗口的加权平均算法,通过在滑动窗口内对给定高阶多项式的最小二乘拟合得出的。这种滤波器最大的特点是,在滤除噪声的同时可以确保信号的形状、宽度不变。
基于S-G滤波原理,对NDVI时间序列数据进行重构,S-G算法表达式:
式中:R是NDVI原始值;为NDVI拟合值;A j 为第j个NDVI值滤波时权重,其值取决于滤波窗口的宽度n以及平滑多项式最小二乘拟合的次数d;R i+1为时间序列中第i+1个NDVI值,M=2n+1为滤波器长度。采用移动窗口n=3,拟合次数d=3;移动窗口n=4,拟合次数d=4,重构效果如图4所示。
(IV)缺失信息插补:采用地理实体时空匹配模型,实现以耕地地块为单位的时间序列特征缺失信息的插补。
以耕地地块为单位的时间序列特征数据是遥感提取的基础,而光学遥感观测的特点决定了其不可能避免会受云影覆盖的影响,造成信息缺失,降低模型提取精度,常规的数学插值方法难以准确描述缺失序列的变化特征。虽然时序数据重构在整体上能提高光谱的平滑性,降低噪音的干扰,但还未精细到地块级别,因此,采用地理实体时空匹配模型,该模型原理如图5所示。当出现信息(光谱信息)缺失时,优先采用空间知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度(计算方式参照申请人在先专利ZL202210159662.8),从周边(地块1000米缓冲范围内)地块中进行当前地块缺失信息的插补;当空间知识迁移不满足时,采用历史知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度,从上一年同一位置或周边(地块1000米缓冲范围内)地块中进行当前地块缺失信息的插补,可以有效的解决信息缺失的问题,使数据更加完整、精确。
(V)农作物决策树分类:基于NDVI、LSWI、EVI等光谱特征,采用决策树分类算法,实现耕地地块内农作物种植结构信息提取。
以某一区域几种主要农作物决策树分类为例:在耕地地块获取的基础上,在利用生长期NDVI参数对冬小麦、水稻进行初分类的前提下,利用水稻移栽灌水期的地表水体指数与增强植被指数的关系作为进一步区分水稻与其他作物的依据,构建决策树分层分类的农作物提取模型(其中,NDVI 2,2,03表示编号为2,2月3日影像的归一化差异植被指数;LSWI 11,6,23表示编号为11,6月23日影像的地表水分指数;EVI 13,7,08表示编号为13,7月8日影像的增强植被指数)。
本实施例中的决策树分类模型如下:
①基于下示第一模型对耕地进行初分类:
NDVI 2,2,03≥0.2,NDVI 4,3,30≥0.4;
NDVI 6,4,19≥0.7,NDVI 7,5,04≥0.7;
NDVI 8,5,09≥0.65,NDVI 11,6,23≤0.4;
满足上述条件则分类为冬小麦,否则分类为其他作物;
②基于下示第二模型对①中分类得到的冬小麦进行分类:
NDVI 16,9,21≥0.7,NDVI 17,10,1≥0.4;
NDVI 19,11,10≤0.4,LWSI 11,6,23+0.05≥EVI 11,6,23或LWSI 12,6,28+0.05≥EVI 12,6,28或LWSI 13,7,8+0.05≥EVI 13,7,8;
满足上述条件则分类为冬小麦晚稻(混合作物),否则分类为冬小麦;
③基于上述第二模型对①中分类得到的其他作物进行分类:
满足条件则分类为晚稻,否则分类为其他作物;
④基于下示第三模型对③中分类得到的其他作物进行分类:
NDVI 2,2,0.3≤0.3,NDVI 6,4,19≥0.58,NDVI 8,5,09≤NDVI 7,5,04;
满足上述条件则分类为春小麦,否则分类为其他作物。此处案例为示意性的分类方式,还可根据实际种植情况对包含的其他作物例如大豆、水稻等继续分类。
(VI)耕地地块内分类:根据耕地地块内单一农作物的占比P k 进行农作物地块分类,并对得到的农作物地块进行唯一标识编码。
sum k 为某一耕地地块内其中一种农作物的面积,0≤k≤M,M为某一耕地地块内所有农作物种类。当某一耕地地块内只有一种农作物时,单一农作物占比达到90%以上,则认为该地块为该农作物(如图7),并直接继承当前耕地地块的唯一标识码;单一农作物占比小于30%,则删除该耕地地块样本(如图8);单一农作物占比大于等于30%且小于等于90%的,根据耕地地块纹理进行切分(如图9),并直接继承当前耕地地块的唯一标识码(仅农作物部分地块继承编码,无农作物部分切分后剔除出样本)。
当某一耕地地块内有多种农作物时,只切分单一农作物占比大于等于30%的农作物种类(如图10),在继承当前耕地地块的唯一标识码的基础上,根据农作物种类进行下一级续编。例如当前地块内有n种农作物,继承的唯一标识码为320312211000096449,则n种农作物的唯一标识码为:3203122110000964491、3203122110000964492…320312211000096449n(n≤3)。
(3)农作物时空遥感影像样本库构建:通过农作物地块标注高分辨率遥感影像和多时序中分辨率遥感影像数据构建农作物时空遥感影像样本库;
(I)统一获取农作物地块与多源多时相遥感影像的空间坐标系。
(II)基于农作物地块和多源多时相遥感影像的基础信息实现农作物类别的标注,农作物时空遥感影像样本库示意图如图11所示。
农作物地块的基础信息主要包括:唯一标识码、空间坐标系、作物名称、周长、面积等;多源多时相影像的而基础信息主要包括:影像名称、空间坐标系、分辨率、获取时间等。
(4)时序知识图谱建模:以农作物地块为核心,在定义实体类的同时将关系和时间实体化,构建时序三元组表达知识的时序知识图谱模型;
(I)设计模型的类:时序知识图谱模型按照实际意义可分为实体类、关系类和时间类,其描述如图12所示,共36个类。
实体类是描述客观存在的人、物的概念集合,可以被实例化为实体,例如农作物可以实例化出“冬小麦”、“大豆”、“水稻”等实体,共有15个实体类,详情如表2所示。
表2时序知识图谱模型中的实体类
关系类是描述知识图谱中带有时间属性的关系,关系类是关系实体化的结果。例如,“语义关系”中的“种植”作为一个时间关系,该关系的有效性随时间变化。比如,编号为001的同一地块(水浇地),2022年3月份种植的是冬小麦,2022年7月份种植的是水稻。实体化后的关系类虽然不能进行实例化,但是拥有自己的关系和数据属性,可以属性被描述,进而实现了对关系添加时间的目的,能用于描述客观世界的动态性,共有18个关系类,详情如表3所示。
表3 时序知识图谱模型中的关系类
时间类是时间概念的集合,用于描述客观世界的时间,包括时间点和时间段,是为了更加准确详细的描述知识图谱中的时序知识而设计的。传统的实体-关系-实体,实体-属性-属性值三元组模型不能准确地表达真实世界中的动态知识。例如,001地块-种植-冬小麦这一知识的正确性受时间制约,并不是一直正确的。为了正确描述这一知识点,时序知识模型使用时序三元组(实体,关系,实体,开始时间,结束时间) 表达知识,所以模型中设计添加了时间类。时间类可以划分为时间点子类和时间段子类。时间点,可以实例化为具体的某一年、某一天、某一秒。时间段,表示了一个状态的持续过程,它有两个属性,一个是开始时间,一个是结束时间,两个属性共同决定了一个时间区间,共有3个时间类,详情如表4所示。
表4 时序知识图谱模型中的时间类
(II)构建类之间的关系:基于顾及时间的“(s(主语),p(谓语),o(宾语 ))”语义关系,构建类之间的关系。
由于实体之间的关系已经实体化,所以基于语法顺序,模型中实体类和关系类之间只有两种关系:主语与谓语之间的关系;谓语与宾语之间的关系。在加上关系类与时间类之间的关系,共3个类之间的关系,详情如表5所示。
表5 时序知识图谱模型中的关系
(III)设置模型的数据属性:基于模型的类和关系设置模型的数据属性。
模型的数据属性是以字面量为值的属性,即通常所说的属性,例如在三元组 (影像1,分辨率,0.5) 中“分辨率”就是一个数据属性。模型的所有属性如表6 所示,共26项。
表6 时序知识图谱模型中的属性表
(5)图谱时序知识抽取:基于收集和处理得到的数据,采用R2RML方法以RDF框架的形式抽取时序知识图谱模型需要的实体、关系和属性;
(I)空间关系中的拓扑关系、方位关系和距离关系借助专业GIS工具,基于年度国土变更调查地类图斑数据生成关系数据库,本申请采用ArcGIS地理信息软件。
(II)高分辨率遥感影像中纹理信息的特征统计量、中分辨率遥感影像中光谱信息的特征统计量借助专业遥感工具,基于高分辨率遥感影像和多时序哨兵影像数据生成关系数据库,本申请采用ENVI遥感处理平台。
(III)基于预处理后的数据及收集的数据(包含前述(I)、(II)中生成的关系数据库)采用R2RML方法抽取时序知识图谱模型需要的实体、关系和属性,获取一系列RDF三元组。
R2RML映射语言是一种用于表示关系数据库到RDF数据集的自定义映射的语言。通过使用R2RML,用户可以在关系数据上灵活定义视图。每个R2RML映射都针对特定的数据库模式和目标词汇量身定制。R2RML映射的输入是符合该模式的关系数据库,输出是采用目标词汇表中谓词和类型描述的RDF数据集。
(6)时序知识图谱构建:定义时序知识图谱中知识的结构形式,采用Neo4j图模型数据库实现时序知识的存储。
(I)时序三元组生成:将知识图谱的三元组都加上其有效时间,生成时序知识图谱。
在农作物分类结果的基础上采用资源描述框架 (resource descriptionframework,RDF)生成时序三元组。一个 RDF 三元组可以看成是主体 s和客体o之间有一条边 p,则一个 RDF 三元组的集合就是一个 RDF 图,三元组的主体和客体是图的顶点,谓词是图的边。将知识图谱的三元组都加上其有效时间,则知识图谱就变成了时序知识图谱。
(II)图谱知识存储:基于构建的时序知识图谱模型,选用Neo4j图模型数据库用RDF三元组存储时序三元组。
Neo4i数据库具有ACID特性,通过关系的构建能够清晰表示三元组知识间的关联。此外,Neo4j数据库通过Cypher语言采用批量导入等方式,可以便捷的开展RDF三元组存储,同时基于Cypher语言可以对知识点进行关联查询、动态更新等操作。
以时序三元组(001地块,种植,冬小麦,2022年10月1日,2023年6月30日)为例,在本申请构建的时序知识图谱模型下,关系类“种植”具有了时间属性,仍可以采用多个RDF三元组表示一个时序三元组:(001地块,性质是,种植)、(种植,对象是,冬小麦)、(种植,开始时间,2022年10月1日)、(种植,结束时间,2023年6月30日),结果如图13。该存储方式,不仅可以完美兼容RDF框架,还可以与已存的使用RDF 三元组表示的知识图谱进行无缝融合。
(7)图库融合:以农作物地块的唯一标识为基准,实现农作物时空遥感样影像本库与时序知识图谱库的关联,形成融合时序知识图谱的农作物遥感影像智能样本库。
Claims (10)
1.融合时序知识图谱的农作物遥感影像智能样本库构建方法,其特征在于,包括:
根据农作物的物候期,获取不同时间点的农作物高分辨率、中分辨率遥感影像数据、与影像数据匹配的地类图斑数据;
从地类图斑数据中提取耕地地块,基于中分辨率遥感影像数据将耕地地块划分为不同农作物类别,提取农作物地块,并对农作物地块赋予唯一标识码;对农作物地块对应的高分辨率、中分辨率遥感影像标注属性信息和地块基础信息,形成农作物时空遥感影像样本库;
以农作物地块为核心,构建以时序三元组表达知识的时序知识图谱模型,基于收集和处理得到的数据,抽取时序知识图谱模型需要的实体、关系和属性,获取一系列三元组,将三元组加上其有效时间,生成时序三元组,即时序知识图谱,并存储;
以农作物地块的唯一标识为基准,关联农作物时空遥感样影像本库与时序知识图谱,形成融合时序知识图谱的农作物遥感影像样本库。
2.根据权利要求1所述的方法,其特征在于,从地类图斑数据中提取耕地地块后,对提取的耕地地块结合高分辨率遥感影像数据进行优化,包括剔除长度超出阈值的道路,剔除耕地地块边缘的单棵树木或行树,剔除耕地地块中的其它地类。
3.根据权利要求1所述的方法,其特征在于,通过中分辨率遥感影像数据计算NDVI、EVI和LWSI指数,采用决策树分类算法提取耕地地块内农作物种植结构。
4.根据权利要求3所述的方法,其特征在于,计算NDVI、EVI和LWSI指数后,基于S-G滤波重构NDVI、EVI和LWSI指数时序数据。
5.根据权利要求1或3所述的方法,其特征在于,利用中分辨率遥感影像数据进行农作物类别划分前,对利用影像数据计算的指数时序数据进行缺失信息的插补,包括:
当存在光谱信息缺失时,优先采用空间知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度,从周边地块中进行当前地块缺失信息的插补;
当空间知识迁移不满足时,采用历史知识迁移的方式,根据地块之间属性特征和形状特征的综合匹配度,从上一年同一位置或周边地块中进行当前地块缺失信息的插补。
6.根据权利要求1所述的方法,其特征在于,所述将地块划分为不同农作物类别包括:
利用中分辨率遥感影像数据提取耕地地块内农作物种植结构,之后根据地块内农作物占比进行编码:
当某一耕地地块内只有一种农作物,且单一农作物占比达到b以上,则认为该耕地地块为该农作物,并继承当前耕地地块的唯一标识码;当单一农作物占比小于a,则删除该耕地地块样本;单一农作物占比在a-b之间,则根据地块纹理进行切分,并继承当前耕地地块的唯一标识码;
当某一耕地地块内有多种农作物时,只切分单一农作物占比在a以上的农作物种类,并在继承当前耕地地块的唯一标识码后,根据农作物种类进行下一级续编;
a、b为预设百分比阈值。
7.根据权利要求1所述的方法,其特征在于,所述属性信息包括影像名称、空间坐标系、分辨率、获取时间;所述地块基础信息包括唯一标识码、空间坐标系、作物名称、周长、面积。
8.根据权利要求1所述的方法,其特征在于,所述以农作物地块为核心,构建以时序三元组表达知识的时序知识图谱模型包括:
定义模型相关的实体类、关系类和时间类;
基于顾及时间的主谓宾语义关系,构建类之间的关系;
基于模型的类和关系设置模型的数据属性。
9.根据权利要求1所述的方法,其特征在于,所述抽取时序知识图谱模型需要的实体、关系和属性包括:
利用GIS工具抽取空间关系中的拓扑关系、方位关系和距离关系,基于所述地类图斑数据生成关系数据库;
利用遥感处理工具获取高分辨率遥感影像中纹理信息的特征统计量、中分辨率遥感影像中光谱信息的特征统计量,基于所述影像数据生成关系数据库;
采用R2RML方法从收集和处理得到的数据中抽取时序知识图谱模型需要的实体、关系和属性。
10.根据权利要求1所述的方法,其特征在于,基于构建的时序知识图谱模型,选用Neo4j图模型数据库用RDF三元组存储所述时序三元组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410391737.4A CN117972116A (zh) | 2024-04-02 | 2024-04-02 | 融合时序知识图谱的农作物遥感影像智能样本库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410391737.4A CN117972116A (zh) | 2024-04-02 | 2024-04-02 | 融合时序知识图谱的农作物遥感影像智能样本库构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117972116A true CN117972116A (zh) | 2024-05-03 |
Family
ID=90865055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410391737.4A Pending CN117972116A (zh) | 2024-04-02 | 2024-04-02 | 融合时序知识图谱的农作物遥感影像智能样本库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117972116A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395914A (zh) * | 2019-08-15 | 2021-02-23 | 中国科学院遥感与数字地球研究所 | 一种融合遥感影像时序与纹理特征的地块作物识别方法 |
CN113989668A (zh) * | 2021-10-27 | 2022-01-28 | 辽宁工程技术大学 | 一种基于时间序列特征的遥感农作物自动分类方法 |
US20240005344A1 (en) * | 2022-06-29 | 2024-01-04 | Sichuan Provincial Institute of Forestry and Grassland Inventory and Planning | Continuous monitoring method and system for forest stock and execution method therefor |
-
2024
- 2024-04-02 CN CN202410391737.4A patent/CN117972116A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395914A (zh) * | 2019-08-15 | 2021-02-23 | 中国科学院遥感与数字地球研究所 | 一种融合遥感影像时序与纹理特征的地块作物识别方法 |
CN113989668A (zh) * | 2021-10-27 | 2022-01-28 | 辽宁工程技术大学 | 一种基于时间序列特征的遥感农作物自动分类方法 |
US20240005344A1 (en) * | 2022-06-29 | 2024-01-04 | Sichuan Provincial Institute of Forestry and Grassland Inventory and Planning | Continuous monitoring method and system for forest stock and execution method therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111598019B (zh) | 基于多源遥感数据的作物类型与种植模式识别方法 | |
US8111924B2 (en) | Remote sensing and probabilistic sampling based method for determining the carbon dioxide volume of a forest | |
CN111666815B (zh) | 一种基于Sentinel-2遥感影像的大蒜种植信息自动化提取方法 | |
CN108458978B (zh) | 基于敏感波段和波段组合最优的树种多光谱遥感识别方法 | |
Kordi et al. | Crop classification based on phenology information by using time series of optical and synthetic-aperture radar images | |
CN111598045B (zh) | 一种基于对象图谱和混合光谱的遥感耕地变化检测方法 | |
CN114821362B (zh) | 一种基于多源数据的水稻种植面积提取方法 | |
CN114387516B (zh) | 一种针对复杂地形环境下中小田块的单季稻sar识别方法 | |
CN112183428A (zh) | 一种小麦种植区域分割与产量预测方法 | |
CN116543316B (zh) | 一种利用多时相高分辨率卫星影像识别稻田内草皮的方法 | |
CN115641412B (zh) | 基于高光谱数据的三维语义地图的生成方法 | |
CN116824384A (zh) | 一种基于标准曲线的大豆识别方法 | |
CN111967440A (zh) | 一种农作物病害的综合识别处理方法 | |
CN115861831A (zh) | 基于作物物候知识的时间序列遥感数据农作物识别方法 | |
Kang et al. | Construction of multidimensional features to identify tea plantations using multisource remote sensing data: A case study of Hangzhou city, China | |
CN117972116A (zh) | 融合时序知识图谱的农作物遥感影像智能样本库构建方法 | |
CN115861836A (zh) | 基于多时相Sentinel-2数据的大豆种植区提取方法 | |
CN115661641A (zh) | 一种基于多源无人机遥感评估不同生长阶段茶园重要表型参数的方法及系统 | |
Knapp‐Wilson et al. | Three‐dimensional phenotyping of peach tree‐crown architecture utilizing terrestrial laser scanning | |
Qi et al. | Mapping tea plantations using multitemporal spectral features by harmonised Sentinel-2 and Landsat images in Yingde, China | |
CN116597302A (zh) | 一种三七种植区的遥感识别方法 | |
CN114972838B (zh) | 基于卫星数据得到的冬小麦识别方法 | |
van Niekerk et al. | THE APPLICATION OF NATIONAL SCALE REMOTELY SENSED EVAPOTRANSPIRATION (ET) ESTIMATES TO QUANTIFY WATER USE AND DIFFERENCES BETWEEN PLANTATIONS IN COMMERCIAL FORESTRY REGIONS OF SOUTH AFRICA | |
CN117347974B (zh) | 一种灌丛植被地上生物量的估测方法及装置 | |
CN117218531B (zh) | 一种面向海陆生态交错带红树林植物地上碳储量估算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |