CN114201692B - 作物类型样本的采集方法及装置 - Google Patents

作物类型样本的采集方法及装置 Download PDF

Info

Publication number
CN114201692B
CN114201692B CN202210150097.9A CN202210150097A CN114201692B CN 114201692 B CN114201692 B CN 114201692B CN 202210150097 A CN202210150097 A CN 202210150097A CN 114201692 B CN114201692 B CN 114201692B
Authority
CN
China
Prior art keywords
data
sample
confidence
sample data
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210150097.9A
Other languages
English (en)
Other versions
CN114201692A (zh
Inventor
俞乐
李曦煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210150097.9A priority Critical patent/CN114201692B/zh
Publication of CN114201692A publication Critical patent/CN114201692A/zh
Application granted granted Critical
Publication of CN114201692B publication Critical patent/CN114201692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供一种作物类型样本的采集方法及装置,包括如下步骤:从社交网络数据平台获取带位置信息的样本数据;根据文本数据中的位置信息,对文本数据进行矢量转化处理得到文本矢量数据,以及获取与位置信息对应的遥感数据;分别根据文本矢量数据计算样本数据的位置置信度、根据遥感数据计算样本数据的光谱置信度和根据图片数据计算样本数据的图像匹配度;基于预设样本筛选规则,根据样本数据的位置置信度、光谱置信度和图像匹配度判断样本数据的可用性。利用本发明能够解决目前获取样本点的方式存在费时费力、无法获取历史样本、准确性存疑以及范围限制等问题。

Description

作物类型样本的采集方法及装置
技术领域
本发明涉及遥感制图技术领域,更为具体地,涉及一种作物类型样本的采集方法及装置。
背景技术
遥感技术具有大范围、长时间、动态监测的优势。不同地物展现出不同的光谱特征,这使得遥感技术能够广泛应用到地表覆盖制图中来。作物种植区制图是在地表覆盖制图中农地类型的进一步细分。作物类型众多,种植区轮转变化频繁,机遇与挑战并存。
在作物种植区遥感制图的过程中,高效地获取较为准确、数量可观的样本点是遥感制图的第一步,也是比较难以解决的一大问题。
当前的研究往往通过以下三种方式获取样本点:第一,通过实地调查获取样本点,这样的方式比较准确,但是费时费力,难以在长时间尺度、大空间范围展开,并且这样的方法无法获取历史样本;第二,通过结合影像信息进行样本点的室内解译,例如可以结合高分辨率的影像、结合影像指标的时间序列变化等对样本点类型进行判定,但是这一方法对专家经验和知识的要求很高,往往存在主观臆断、准确性存疑的问题;第三,在已有的地图产品上进行采集,这样的方法只能重复完成一些制图工作,即在同样的空间范围、时间范围进行制图工作,通过样本或模型的时空迁移,能够在一定程度上对时间范围进行延展,但是仍旧无法脱离原有样本分布的范围限制。
因此当前研究中仍缺乏一种样本点获取的新型数据源以及与之配套的样本采集方法。
发明内容
鉴于上述问题,本发明的目的是提供一种作物类型样本的采集方法及装置,以解决目前获取样本点的方式存在费时费力、无法获取历史样本、准确性存疑以及范围限制等问题。
本发明提供一种作物类型样本的采集方法,包括如下步骤:
从预设的社交网络数据平台获取带位置信息的样本数据;其中,所述样本数据包括带位置信息的文本数据和与所述文本数据对应的图片数据;
根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据,以及获取与所述位置信息对应的遥感数据;
分别根据所述文本矢量数据计算所述样本数据的位置置信度、根据所述遥感数据计算所述样本数据的光谱置信度和根据所述图片数据计算所述样本数据的图像匹配度;
基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性。
此外,优选的方案是,所述从预设的社交网络数据平台获取带位置信息的样本数据包括:
根据获取的样本数据采集指令,生成数据申请信息;
将所述数据申请信息发送至所述社交网络数据平台,获取平台授权信息;
根据所述平台授权信息,基于预设搜索条件,从所述社交网络数据平台中获取所述带位置信息的样本数据。
此外,优选的方案是,所述根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据包括:
从所述文本数据中获取表示所述位置信息的四个坐标点的经纬度;
将所述四个坐标点的经纬度转化为矢量数据格式,得到初级矢量数据;
当所述初级矢量数据中四个坐标点重合时,则将生成的点要素矢量数据作为文本矢量数据;当所述初级矢量数据中四个坐标点不重合时,则将生成的面要素矢量数据作为文本矢量数据。
此外,优选的方案是,所述获取与所述位置信息对应的遥感数据包括:
当所述文本矢量数据为点要素矢量数据时,将所述点要素矢量数据的点要素作为所述文本数据的位置属性;当所述文本矢量数据为面要素矢量数据时,取所述面要素矢量数据的面要素中心点作为所述文本数据的位置属性;
根据所述文本数据的位置属性,获取与所述位置信息对应的遥感数据。
此外,优选的方案是,所述根据所述文本矢量数据计算所述样本数据的位置置信度包括:
当将所述点要素矢量数据的点要素作为样本数据的位置属性时,所述样本数据的位置置信度为1;
当将所述面要素矢量数据的面要素中心点作为样本数据的位置属性时,根据预设位置置信度计算公式计算所述样本数据的位置置信度;其中,所述预设位置置信度计算公式为:
Confidence=1/Area*Factor
其中,Confidence为位置置信度,Area为所述面要素矢量数据中四个坐标点组成的平面的面积,单位为平方米,Factor为尺度转化系数。
此外,优选的方案是,所述根据所述遥感数据计算所述样本数据的光谱置信度包括:
对所述遥感数据进行波段筛选,选取绿光波段、红光波段、近红外波段和短波红外1 波段作为待计算波段;
根据所述待计算波段,分别通过预设归一化植被指数计算公式计算归一化植被指数和通过预设改进的归一化差异水指数计算公式计算改进的归一化差异水指数,并将所述归一化植被指数和所述改进的归一化差异水指数作为所述遥感数据的光谱特征;其中,
所述预设归一化植被指数计算公式为:
NDVI=(B5-B4)/(B5+B4),式中,NDVI为归一化植被指数,B4为遥感数据中红光波段的地表反射率,B5为遥感数据中近红外波段的地表反射率;
所述预设改进的归一化差异水指数计算公式为:
MNDVI=(B6-B3)/(B6+B3),式中,MNDVI为改进的归一化差异水指数,B3为遥感数据中绿光波段的地表反射率,B6为遥感数据中短波红外 1 波段的地表反射率;
基于所述遥感数据的光谱特征及波段和预设训练样本库进行分类器训练,得到用于计算所述样本数据的光谱置信度的随机森林分类器;
通过所述随机森林分类器对所述样本数据的光谱置信度进行计算,得到所述样本数据的光谱置信度。
此外,优选的方案是,所述根据所述图片数据计算所述样本数据的图像匹配度包括:
采用图片识别技术识别出所述图片数据中作物的名称关键词;
当所述作物的名称关键词在所述文本数据中出现,则所述样本数据的图像匹配度为1;当所述作物的名称关键词未在所述文本数据中出现,则所述样本数据的图像匹配度为0。
此外,优选的方案是,所述基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性包括:
只有当所述位置置信度大于预设标准位置置信度、所述图像匹配度大于预设标准图像匹配度、以及所述光谱置信度大于预设光谱置信度时,所述样本数据具有可用性;否则所述样本数据不具有可用性;和/或,
根据所述位置置信度、所述光谱置信度和所述图像匹配度,通过预设综合置信度计算公式计算所述样本数据的综合置信度;其中,所述设综合置信度计算公式为A=I*L*S;式中,A 为样本数据的综合置信度,I 为图像匹配度,L 为位置置信度,S 为光谱置信度;
当所述样本数据的综合置信度大于预设标准综合置信度时,所述样本数据具有可用性;否则所述样本数据不具有可用性。
此外,优选的方案是,所述方法还包括:将具有可用性的样本数据用于遥感制图。
本发明提供的作物类型样本采集装置,包括:
样本数据获取模块,用于从预设的社交网络数据平台获取带位置信息的样本数据;其中,所述样本数据包括带位置信息的文本数据和与所述文本数据对应的图片数据;
数据处理模块,用于根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据,以及获取与所述位置信息对应的遥感数据;
计算模块,用于分别根据所述文本矢量数据计算所述样本数据的位置置信度、根据所述遥感数据计算所述样本数据的光谱置信度和根据所述图片数据计算所述样本数据的图像匹配度;
可用性判断模块,用于基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性。
从上面的技术方案可知,本发明提供的作物类型样本的采集方法及装置,通过从社交网络数据平台获取带位置信息的样本数据,相比于传统的作物类型样本采集方法扩充了可利用的数据来源,并且采集效率更高;通过对样本数据进行位置置信度、光谱置信度以及图像匹配度的计算,具体量化了样本的位置和类型的准确程度,能为后续遥感制图提供更为扎实的数据基础。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为根据本发明实施例的作物类型样本的采集方法的流程示意图;
图2为根据本发明实施例的作物类型样本的采集方法的具体流程示意图。
在附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。
针对前述提出的目前获取样本点的方式存在费时费力、无法获取历史样本、准确性存疑以及范围限制等问题,提出了一种作物类型样本的采集方法及装置。
以下将结合附图对本发明的具体实施例进行详细描述。
为了说明本发明提供的作物类型样本的采集方法,图1示出了根据本发明实施例的作物类型样本的采集方法的流程;图2示出了根据本发明实施例的作物类型样本的采集方法的具体流程。
如图1结合图2共同所示,本发明提供的作物类型样本的采集方法,包括如下步骤:
S1、从预设的社交网络数据平台获取带位置信息的样本数据;其中,样本数据包括带位置信息的文本数据和与文本数据对应的图片数据。
具体的,社交网络数据平台如微博、推特等社交网络平台,在该类社交网络数据平台中,用户会上传带有文本、配图以及位置信息的分享数据,即社交数据,这些数据均储存在社交网络数据平台中,将该类从社交网络数据平台中获取的数据作为样本数据。
作为本发明的一个优选方案,从预设的社交网络数据平台获取带位置信息的样本数据包括:
根据获取的样本数据采集指令,生成数据申请信息;
将数据申请信息发送至社交网络数据平台,获取平台授权信息;
根据平台授权信息,基于预设搜索条件,从社交网络数据平台中获取带位置信息的样本数据。
具体的,当处理器接收到样本数据指令时,自动生成数据申请信息,并将该申请信息发送给社交网络数据平台,以获取平台的权限,当平台授权后,通过设置数据搜索条件,如关键词、数量、地理范围和语言等,从社交网络数据平台中获取带位置信息的样本数据。申请社交网络数据平台时获取的权限可通过得到Key、Secret、Token等形式进行,之后可调用API进行数据下载,并设置数据搜索条件,如可把作物名称作为第一个关键词,为了筛选出跟作物实地分布位置密切相关的数据,可把“field”作为第二个关键词,数量和地理范围不做限制,语言范围限制为英语。
S2、根据文本数据中的位置信息,对文本数据进行矢量转化处理得到文本矢量数据,以及获取与位置信息对应的遥感数据。
具体的,将文本数据即社交网络数据中的位置信息(四个坐标点的经纬度)和其他属性从文本格式转化为矢量数据格式。便于后续的位置置信度的计算,并根据位置属性获取与位置信息对应的遥感数据。
作为本发明的一个优选方案,根据文本数据中的位置信息,对文本数据进行矢量转化处理得到文本矢量数据包括:
从文本数据中获取表示位置信息的四个坐标点的经纬度;
将四个坐标点的经纬度转化为矢量数据格式,得到初级矢量数据;
当初级矢量数据中四个坐标点重合时,则将生成的点要素矢量数据作为文本矢量数据;当初级矢量数据中四个坐标点不重合时,则将生成的面要素矢量数据作为文本矢量数据。
具体的,如果位置信息比较精确,即四个坐标点重合,则将生成点要素矢量数据;如果位置信息比较粗略,即四个坐标点之间不重合,则通过面要素矢量数据来表征样本点位置的粗略范围。
作为本发明的一个优选方案,获取与位置信息对应的遥感数据包括:
当文本矢量数据为点要素矢量数据时,将点要素矢量数据的点要素作为文本数据的位置属性;当文本矢量数据为面要素矢量数据时,取面要素矢量数据的面要素中心点作为文本数据的位置属性;
根据文本数据的位置属性,获取与位置信息对应的遥感数据。
具体的,根据获取到的文本数据的位置属性可确定样本数据的位置,通过卫星等采集该位置的遥感影像作为遥感数据。
S3、分别根据文本矢量数据计算样本数据的位置置信度、根据遥感数据计算样本数据的光谱置信度和根据图片数据计算样本数据的图像匹配度。
通过计算样本数据的位置置信度、光谱置信度和图像匹配度,筛选出更为精确的样本数据。
作为本发明的一个优选方案,根据文本矢量数据计算样本数据的位置置信度包括:
当将点要素矢量数据的点要素作为样本数据的位置属性时,样本数据的位置置信度为1;
当将面要素矢量数据的面要素中心点作为样本数据的位置属性时,根据预设位置置信度计算公式计算样本数据的位置置信度;其中,预设位置置信度计算公式为:
Confidence=1/Area*Factor
其中,Confidence为位置置信度,Area为所述面要素矢量数据中四个坐标点组成的平面的面积,单位为平方米,Factor为尺度转化系数。
具体的,根据生成的矢量数据计算位置置信度,若矢量数据为点要素,则位置置信度视为1,若矢量数据为面要素,则位置置信度与其面积的倒数成正比。
作为本发明的一个优选方案,根据遥感数据计算样本数据的光谱置信度包括:
对遥感数据进行波段筛选,选取绿光波段、红光波段、近红外波段和短波红外 1波段作为待计算波段;
根据待计算波段,分别通过预设归一化植被指数计算公式计算归一化植被指数和通过预设改进的归一化差异水指数计算公式计算改进的归一化差异水指数,并将归一化植被指数和改进的归一化差异水指数作为所述遥感数据的光谱特征;其中,
预设归一化植被指数计算公式为:
NDVI=(B5-B4)/(B5+B4),式中,NDVI为归一化植被指数,B4为遥感数据中红光波段的地表反射率,B5为遥感数据中近红外波段的地表反射率;
预设改进的归一化差异水指数计算公式为:
MNDVI=(B6-B3)/(B6+B3),式中,MNDVI为改进的归一化差异水指数,B3为遥感数据中绿光波段的地表反射率,B6为遥感数据中短波红外 1 波段的地表反射率;
基于遥感数据的光谱特征及波段和预设训练样本库进行分类器训练,得到用于计算样本数据的光谱置信度的随机森林分类器;
通过随机森林分类器对样本数据的光谱置信度进行计算,得到样本数据的光谱置信度。
具体的,首先进行特征提取,选取遥感影像中的以下波段:B2(蓝光波段),B3(绿光波段),B4(红光波段),B5(近红外波段),B6(短波红外1波段),B7(短波红外2波段),并进一步计算两种光谱指数:NDVI(归一化植被指数),MNDWI(改进的归一化水指数)。以上波段及特征通过按NDVI这一指数进行最大值合成(quality Mosaic)。
基于预设样本训练库与上述特征训练随机森林分类器,RF分类器只需要定义两个参数来生成一个模型:期望的决策树数量(k)和每个节点用于分裂需要的特征数量(m)。这里将决策树数量(k)设置为100,每个节点用于分裂需要的特征数量(m)则使用默认设置的输入特征个数的平方根。样本库中包含全球地表覆盖各类型,将其重分类为农地(0)与非农地(1)两类。
将训练得到的随机森林分类器用于样本的光谱置信度计算。随机森林分类器的输出结果在0-1之间,通过与1做差值得到最终的光谱置信度。光谱置信度越接近1,说明该样本落在某种作物类型种植区的可能性越高。
作为本发明的一个优选方案,根据图片数据计算样本数据的图像匹配度包括:
采用图片识别技术识别出图片数据中作物的名称关键词;
当作物的名称关键词在文本数据中出现,则样本数据的图像匹配度为1;当作物的名称关键词未在所述文本数据中出现,则样本数据的图像匹配度为0。
具体的,首先根据图片链接下载图片数据,接着调用图像识别算法对社交网络数据中的图片数据进行分析处理,返回对图片中植物类别(names)和置信度(score)的判别结果。由于图片识别结果中植物类别(names)中显示的是中文名称且大多为细化、具体的学名,因此将图像匹配度计算标准设定如下:将之前作为搜索关键词之一的英文作物名称通过翻译转化为中文结果,如果图片识别结果字符中含有相应作物名称的中文关键词,则将该样本的图像匹配度视为1,如果图片识别结果并不包含作物关键词(如非植物或其他作物),则将该样本的图像匹配度视为0。或者,将识别出图片数据中作物的名称关键词与文本数据中的文字进行比较,当作物的名称关键词在文本数据中出现,则样本数据的图像匹配度为1;当作物的名称关键词未在所述文本数据中出现,则样本数据的图像匹配度为0。
S4、基于预设样本筛选规则,根据样本数据的位置置信度、光谱置信度和图像匹配度判断样本数据的可用性。
具体的,根据预设样本筛选规则,综合样本数据的位置置信度、光谱置信度和图像匹配度判断样本数据的可用性。
作为本发明的一个优选方案,基于预设样本筛选规则,根据样本数据的位置置信度、光谱置信度和图像匹配度判断样本数据的可用性包括:
只有当位置置信度大于预设标准位置置信度、图像匹配度大于预设标准图像匹配度、以及光谱置信度大于预设光谱置信度时,样本数据具有可用性;否则样本数据不具有可用性;和/或,
根据位置置信度、光谱置信度和图像匹配度,通过预设综合置信度计算公式计算样本数据的综合置信度;其中,设综合置信度计算公式为A=I*L*S;式中,A 为样本数据的综合置信度,I 为图像匹配度,L 为位置置信度,S 为光谱置信度;
当样本数据的综合置信度大于预设标准综合置信度时,样本数据具有可用性;否则样本数据不具有可用性。
具体的,筛选出图像匹配度、位置置信度达到一定条件的样本(如图像匹配度=1、位置置信度>0.1),根据其光谱置信度(>0.5)确定最终可用的样本。或将以上三种指标相乘得到综合置信度,整体衡量样本的可用性,计算公式如下:A=I*L*S,其中,A为该样本的综合置信度,I为图像匹配度,L为位置置信度,S为光谱置信度。
作为本发明的一个优选方案,方法还包括:将具有可用性的样本数据用于遥感制图。
本发明提供的作物类型样本采集装置,包括:
样本数据获取模块,用于从预设的社交网络数据平台获取带位置信息的样本数据;其中,样本数据包括带位置信息的文本数据和与文本数据对应的图片数据;
数据处理模块,用于根据文本数据中的位置信息,对文本数据进行矢量转化处理得到文本矢量数据,以及获取与位置信息对应的遥感数据;
计算模块,用于分别根据文本矢量数据计算样本数据的位置置信度、根据遥感数据计算样本数据的光谱置信度和根据图片数据计算样本数据的图像匹配度;
可用性判断模块,用于基于预设样本筛选规则,根据样本数据的位置置信度、光谱置信度和图像匹配度判断样本数据的可用性。
通过上述具体实施方式可看出,本发明提供的作物类型样本的采集方法及装置,通过从社交网络数据平台获取带位置信息的样本数据,相比于传统的作物类型样本采集方法扩充了可利用的数据来源,并且采集效率更高;通过对样本数据进行位置置信度、光谱置信度以及图像匹配度的计算,具体量化了样本的位置和类型的准确程度,能为后续遥感制图提供更为扎实的数据基础。
如上参照附图以示例的方式描述了根据本发明提出的作物类型样本的采集方法及装置。但是,本领域技术人员应当理解,对于上述本发明所提出的作物类型样本的采集方法及装置,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (10)

1.一种作物类型样本的采集方法,其特征在于,包括如下步骤:
从预设的社交网络数据平台获取带位置信息的样本数据;其中,所述样本数据包括带位置信息的文本数据和与所述文本数据对应的图片数据;
根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据,以及获取与所述位置信息对应的遥感数据;
分别根据所述文本矢量数据计算所述样本数据的位置置信度、根据所述遥感数据计算所述样本数据的光谱置信度和根据所述图片数据计算所述样本数据的图像匹配度;
基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性。
2.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述从预设的社交网络数据平台获取带位置信息的样本数据包括:
根据获取的样本数据采集指令,生成数据申请信息;
将所述数据申请信息发送至所述社交网络数据平台,获取平台授权信息;
根据所述平台授权信息,基于预设搜索条件,从所述社交网络数据平台中获取所述带位置信息的样本数据。
3.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据包括:
从所述文本数据中获取表示所述位置信息的四个坐标点的经纬度;
将所述四个坐标点的经纬度转化为矢量数据格式,得到初级矢量数据;
当所述初级矢量数据中四个坐标点重合时,则将生成的点要素矢量数据作为所述文本矢量数据;当所述初级矢量数据中四个坐标点不重合时,则将生成的面要素矢量数据作为所述文本矢量数据。
4.根据权利要求3所述的作物类型样本的采集方法,其特征在于,所述获取与所述位置信息对应的遥感数据包括:
当所述文本矢量数据为点要素矢量数据时,将所述点要素矢量数据的点要素作为所述文本数据的位置属性;当所述文本矢量数据为面要素矢量数据时,取所述面要素矢量数据的面要素中心点作为所述文本数据的位置属性;
根据所述文本数据的位置属性,获取与所述位置信息对应的遥感数据。
5.根据权利要求4所述的作物类型样本的采集方法,其特征在于,所述根据所述文本矢量数据计算所述样本数据的位置置信度包括:
当将所述点要素矢量数据的点要素作为样本数据的位置属性时,所述样本数据的位置置信度为1;
当将所述面要素矢量数据的面要素中心点作为样本数据的位置属性时,根据预设位置置信度计算公式计算所述样本数据的位置置信度;其中,所述预设位置置信度计算公式为:
Confidence=1/Area*Factor
其中,Confidence为位置置信度,Area为所述面要素矢量数据中四个坐标点组成的平面的面积,单位为平方米,Factor为尺度转化系数。
6.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述根据所述遥感数据计算所述样本数据的光谱置信度包括:
对所述遥感数据进行波段筛选,选取绿光波段、红光波段、近红外波段和短波红外 1波段作为待计算波段;
根据所述待计算波段,分别通过预设归一化植被指数计算公式计算归一化植被指数和通过预设改进的归一化差异水指数计算公式计算改进的归一化差异水指数,并将所述归一化植被指数和所述改进的归一化差异水指数作为所述遥感数据的光谱特征;其中,
所述预设归一化植被指数计算公式为:
NDVI=(B5-B4)/(B5+B4),式中,NDVI为归一化植被指数,B4为遥感数据中红光波段的地表反射率,B5为遥感数据中近红外波段的地表反射率;
所述预设改进的归一化差异水指数计算公式为:
MNDVI=(B6-B3)/(B6+B3),式中,MNDVI为改进的归一化差异水指数,B3为遥感数据中绿光波段的地表反射率,B6为遥感数据中短波红外 1 波段的地表反射率;
基于所述遥感数据的光谱特征及波段和预设训练样本库进行分类器训练,得到用于计算所述样本数据的光谱置信度的随机森林分类器;
通过所述随机森林分类器对所述样本数据的光谱置信度进行计算,得到所述样本数据的光谱置信度。
7.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述根据所述图片数据计算所述样本数据的图像匹配度包括:
采用图片识别技术识别出所述图片数据中作物的名称关键词;
当所述作物的名称关键词在所述文本数据中出现,则所述样本数据的图像匹配度为1;当所述作物的名称关键词未在所述文本数据中出现,则所述样本数据的图像匹配度为0。
8.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性包括:
只有当所述位置置信度大于预设标准位置置信度、所述图像匹配度大于预设标准图像匹配度、以及所述光谱置信度大于预设光谱置信度时,所述样本数据具有可用性;否则所述样本数据不具有可用性;和/或,
根据所述位置置信度、所述光谱置信度和所述图像匹配度,通过预设综合置信度计算公式计算所述样本数据的综合置信度;其中,所述设综合置信度计算公式为A=I*L*S;式中,A 为样本数据的综合置信度,I 为图像匹配度,L 为位置置信度,S 为光谱置信度;
当所述样本数据的综合置信度大于预设标准综合置信度时,所述样本数据具有可用性;否则所述样本数据不具有可用性。
9.根据权利要求1所述的作物类型样本的采集方法,其特征在于,所述方法还包括:
将具有可用性的样本数据用于遥感制图。
10.一种作物类型样本采集装置,其特征在于,包括:
样本数据获取模块,用于从预设的社交网络数据平台获取带位置信息的样本数据;其中,所述样本数据包括带位置信息的文本数据和与所述文本数据对应的图片数据;
数据处理模块,用于根据所述文本数据中的位置信息,对所述文本数据进行矢量转化处理得到文本矢量数据,以及获取与所述位置信息对应的遥感数据;
计算模块,用于分别根据所述文本矢量数据计算所述样本数据的位置置信度、根据所述遥感数据计算所述样本数据的光谱置信度和根据所述图片数据计算所述样本数据的图像匹配度;
可用性判断模块,用于基于预设样本筛选规则,根据所述样本数据的位置置信度、光谱置信度和图像匹配度判断所述样本数据的可用性。
CN202210150097.9A 2022-02-18 2022-02-18 作物类型样本的采集方法及装置 Active CN114201692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210150097.9A CN114201692B (zh) 2022-02-18 2022-02-18 作物类型样本的采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210150097.9A CN114201692B (zh) 2022-02-18 2022-02-18 作物类型样本的采集方法及装置

Publications (2)

Publication Number Publication Date
CN114201692A CN114201692A (zh) 2022-03-18
CN114201692B true CN114201692B (zh) 2022-05-20

Family

ID=80645518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210150097.9A Active CN114201692B (zh) 2022-02-18 2022-02-18 作物类型样本的采集方法及装置

Country Status (1)

Country Link
CN (1) CN114201692B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133325A (zh) * 2017-05-05 2017-09-05 南京大学 一种基于街景地图的互联网照片地理空间定位方法
CN111126130A (zh) * 2018-10-30 2020-05-08 赫尔环球有限公司 基于环境的地图数据检索的方法和装置
CN111598019A (zh) * 2020-05-19 2020-08-28 华中农业大学 基于多源遥感数据的作物类型与种植模式识别方法
CN112131946A (zh) * 2020-08-21 2020-12-25 长沙银汉空间科技有限公司 光学遥感影像植被和水体信息自动提取方法
CN113807219A (zh) * 2021-09-06 2021-12-17 苏州中科蓝迪软件技术有限公司 一种种植地块粮油作物类型分步识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740799B (zh) * 2016-01-27 2018-02-16 深圳大学 基于三维Gabor特征选择的高光谱遥感图像分类方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133325A (zh) * 2017-05-05 2017-09-05 南京大学 一种基于街景地图的互联网照片地理空间定位方法
CN111126130A (zh) * 2018-10-30 2020-05-08 赫尔环球有限公司 基于环境的地图数据检索的方法和装置
CN111598019A (zh) * 2020-05-19 2020-08-28 华中农业大学 基于多源遥感数据的作物类型与种植模式识别方法
CN112131946A (zh) * 2020-08-21 2020-12-25 长沙银汉空间科技有限公司 光学遥感影像植被和水体信息自动提取方法
CN113807219A (zh) * 2021-09-06 2021-12-17 苏州中科蓝迪软件技术有限公司 一种种植地块粮油作物类型分步识别方法

Also Published As

Publication number Publication date
CN114201692A (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
Cihlar et al. Classification by progressive generalization: A new automated methodology for remote sensing multichannel data
Kalantar et al. Drone-based land-cover mapping using a fuzzy unordered rule induction algorithm integrated into object-based image analysis
de Colstoun et al. National Park vegetation mapping using multitemporal Landsat 7 data and a decision tree classifier
Liang et al. Atmospheric correction of Landsat ETM+ land surface imagery. II. Validation and applications
Friedl et al. Maximizing land cover classification accuracies produced by decision trees at continental to global scales
Apan Land cover mapping for tropical forest rehabilitation planning using remotely-sensed data
JP5542530B2 (ja) サンプリング位置決定装置
Gounaridis et al. Land cover of Greece, 2010: a semi-automated classification using random forests
Gao et al. Object-based classification with features extracted by a semi-automatic feature extraction algorithm–SEaTH
DomaÇ et al. Integration of environmental variables with satellite images in regional scale vegetation classification
Medina Machin et al. Vegetation species mapping in a coastal-dune ecosystem using high resolution satellite imagery
Su et al. Analysis of wavelet packet and statistical textures for object-oriented classification of forest-agriculture ecotones using SPOT 5 imagery
Munyati Optimising multiresolution segmentation: delineating savannah vegetation boundaries in the Kruger National Park, South Africa, using Sentinel 2 MSI imagery
Jiao et al. Improving MODIS land cover classification by combining MODIS spectral and angular signatures in a Canadian boreal forest
Defourny et al. 14 Global Land-Cover Map Validation Experiences
Ovakoglou et al. Downscaling of MODIS leaf area index using landsat vegetation index
Tian et al. Improving change detection in forest areas based on stereo panchromatic imagery using kernel MNF
Queinnec et al. Mapping dominant boreal tree species groups by combining area-based and individual tree crown LiDAR metrics with Sentinel-2 data
van Geffen et al. SiDroForest: A comprehensive forest inventory of Siberian boreal forest investigations including drone-based point clouds, individually labelled trees, synthetically generated tree crowns and Sentinel-2 labelled image patches
Drobnjak et al. Testing a new ensemble vegetation classification method based on deep learning and machine learning methods using aerial photogrammetric images
Arenas-Castro et al. Mapping wild pear trees (Pyrus bourgaeana) in Mediterranean forest using high-resolution QuickBird satellite imagery
Wu et al. Per‐field urban land use classification based on tax parcel boundaries
Orndahl et al. Mapping tundra ecosystem plant functional type cover, height, and aboveground biomass in Alaska and northwest Canada using unmanned aerial vehicles
Brumby et al. Evolving forest fire burn severity classification algorithms for multispectral imagery
CN114201692B (zh) 作物类型样本的采集方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant