CN113722530B - 一种细粒度地理位置定位方法 - Google Patents
一种细粒度地理位置定位方法 Download PDFInfo
- Publication number
- CN113722530B CN113722530B CN202111049543.9A CN202111049543A CN113722530B CN 113722530 B CN113722530 B CN 113722530B CN 202111049543 A CN202111049543 A CN 202111049543A CN 113722530 B CN113722530 B CN 113722530B
- Authority
- CN
- China
- Prior art keywords
- geographic
- grained
- land utilization
- text
- geographic position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 22
- 238000003062 neural network model Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 239000011248 coating agent Substances 0.000 claims description 2
- 238000000576 coating method Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 6
- 230000010365 information processing Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000013074 reference sample Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000283095 Elephas maximus Species 0.000 description 1
- 240000008790 Musa x paradisiaca Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种细粒度地理位置定位方法,首先获取待研究区的多源文本数据,并对其进行提取,得到地理关联文本数据集;然后获取待研究区的遥感影像,并基于图像分类方法对其进行分类,得到土地利用覆被类型图像数据;再使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集;最后基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位。本发明提升了地理位置空间化的质量,完善地理编码与地名检索服务功能,同时,更好地消除地理信息系统中的语义鸿沟,促进智能化地理信息处理。
Description
技术领域
本发明涉及地理信息技术领域,特别是涉及一种细粒度地理位置定位方法。
背景技术
来源于人工监测、新闻媒体和社交媒体等渠道的多源文本数据内蕴含丰富的地理信息,是地理信息获取与更新的重要数据源和传递地理信息的重要媒介,已成为用户表达和接收地理信息的主要方式之一,为地理信息的深度挖掘和知识发现带来了巨大机遇;但其内文本形态的地理位置信息往往难以被直接使用。为了增强地理位置文本的可用性,使位置信息发布者、接受者跨越机器语义障碍,直接进行语义沟通,需将地理位置文本描述与现实世界中的空间位置相关联,使其发挥空间参考作用,从而更好地消除地理信息系统中非结构化数据的语义鸿沟,促进智能化地理信息处理。
然而,现有的地理位置定位方法主要包括依赖地名地址词典的匹配定位、模糊区域建模定位以及地名消歧辅助定位,只适用于大区域内粗粒度地理位置,难以实现小区域内颗粒度较小、显著度较低的细粒度地理位置定位。其中,依赖地名地址词典的匹配定位通常使用自建的地名地址词典,或者借助互联网地图服务供应商如百度、高德和谷歌提供的地理编码功能完成,这两种方式的实质都是词典匹配;但因其依赖地名地址词典与地理编码服务系统,而构建新的词典存在人力成本较高、工作量较大以及时效性较差等问题,且很多地名地址未被词典收录,因而无法实现“未登录”的细粒度地理位置定位。而对于模糊区域建模与地名消歧辅助定位方法,具有使用范围及限制条件,不支持大规模推广应用,且其定位精度难以满足实际应用的需求。
发明内容
有鉴于此,本发明提供了一种细粒度地理位置定位方法,提升了地理位置空间化质量,完善了地理编码与地名检索服务功能。
为实现上述目的,本发明提供了如下方案:
一种细粒度地理位置定位方法,包括:
基于神经网络模型对待研究区的多源文本数据进行提取,得到地理关联文本数据集;
基于图像分类方法对待研究区的遥感影像进行分类,得到土地利用覆被类型图像数据;
使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集;
基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位。
优选地,所述地理关联文本数据集包括地理位置实体文本集、土地利用覆被类型文本集和空间关系文本集。
优选地,所述基于神经网络模型对待研究区的多源文本数据进行提取,得到地理关联文本数据集,包括:
获取待研究区的多源文本数据;
基于所述多源文本数据构建所述神经网络模型;
设置超参数并对所述神经网络模型进行训练;
对训练后的所述神经网络模型的提取精度进行判断;若所述提取精度达到第一设定值,则应用训练好的所述神经网络模型对所述多源文本数据进行提取,得到所述地理关联文本数据集;若所述提取精度没有达到所述第一设定值,则修改所述超参数,并对所述神经网络模型重新进行训练,重复此过程,直至所述提取精度达到所述第一设定值。
优选地,所述神经网络模型包括ALBERT-CRF模型和BiGRU-Dual Attention模型;
所述ALBERT-CRF模型用于对所述多源文本数据进行提取,得到所述地理位置实体文本集和所述土地利用覆被类型文本集;
所述BiGRU-DualAttention模型用于对所述多源文本数据进行提取,得到所述空间关系文本集。
优选地,所述对训练后的所述神经网络模型的提取精度进行判断,具体为基于精确率、召回率和调和平均数对训练后的所述神经网络模型的所述提取精度进行判断。
优选地,所述基于图像分类方法对待研究区的遥感影像进行分类,得到土地利用覆被类型图像数据,包括:
获取待研究区的所述遥感影像;所述遥感影像为高空间分辨率遥感影像;
基于图像分类方法对所述遥感影像进行分类,得到初始土地利用覆被类型图像数据;
对所述遥感影像的分类精度进行判断;若所述分类精度达到第二设定值,则将所述初始土地利用覆被类型图像数据作为所述土地利用覆被类型图像数据;若所述分类精度没达到所述第二设定值,参照所述遥感影像对所述初始土地利用覆被类型图像数据进行修正,得到所述土地利用覆被类型图像数据。
优选地,所述对所述遥感影像的分类精度进行判断,具体为基于总体精度、用户精度、制图精度和Kappa系数四个指标对所述遥感影像的分类精度进行判断。
优选地,使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集,包括:
对所述地理位置实体文本集进行标准化,得到所述规范地理位置集;
基于在线地理编码服务和所述规范地理位置集,通过坐标转换工具得到坐标集;
将所述规范地理位置集与所述坐标集进行匹配得到所述粗粒度地理位置实体定位集。
优选地,所述基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位,包括:
提取第n个粗粒度地理位置定位实体Gn,判断所述土地利用覆被类型文本集中是否存在与Gn有关联的土地利用覆被类型文本;n∈N,N为所述粗粒度地理位置定位集中粗粒度地理位置定位实体的数量;
若不存在,则在所述土地利用覆被类型图像数据中直接输出Gn;若存在,则判断所述空间关系文本集中与Gn关联的空间关系文本的数量;
若只有一个空间关系文本Rm,则基于自然语言空间关系转换模型对Rm进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位;
若存在t个空间关系文本,t为大于1的正整数;则基于自然语言空间关系转换模型对t个空间关系文本进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位。
优选地,所述自然语言空间关系转换模型包括方位关系近似转换模型、度量关系近似转换模型和拓扑关系近似转换模型。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明涉及一种细粒度地理位置定位方法,首先获取待研究区的多源文本数据,并对其进行提取,得到地理关联文本数据集;然后获取待研究区的遥感影像,并基于图像分类方法对其进行精细分类,得到土地利用覆被类型图像数据;再使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集;最后基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位。本发明提升了地理位置空间化的质量,完善地理编码与地名检索服务功能,同时,更好地消除地理信息系统中的语义鸿沟,促进智能化地理信息处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明细粒度地理位置定位方法流程图;
图2为本发明ALBERT-CRF模型结构图;
图3为本发明BiGRU-DualAttention模型结构图;
图4为本发明土地利用覆被类型图像数据图;
图5为本发明细粒度位置定位结果图;
图6为本发明定位验证点精度区间分布对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种细粒度地理位置定位方法,提升了地理位置空间化质量,完善了地理编码与地名检索服务功能。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明粒度地理位置定位方法流程图,如图1所示,本发明提供了一种细粒度地理位置定位方法,包括:
步骤S1,基于神经网络模型对待研究区的多源文本数据进行提取,得到地理关联文本数据集。本实施例中,所述地理关联文本数据集包括地理位置实体文本集、土地利用覆被类型文本集L和空间关系文本集R。具体地,所述步骤S1包括:
获取待研究区的初始多源文本数据,对所述初始多源文本数据进行删除特殊符号、删除空行、去停用词与数据标注等处理得到所述多源文本数据。
基于所述多源文本数据构建所述神经网络模型。优选地,本实施例中,所述神经网络模型包括ALBERT-CRF模型和BiGRU-DualAttention模型。
设置第一超参数并基于第一训练集对所述ALBERT-CRF模型进行训练,设置第二超参数并基于第二训练集对所述BiGRU-DualAttention模型进行训练。
基于精确率、召回率和调和平均数对训练后的所述ALBERT-CRF模型和所述BiGRU-DualAttention模型的提取精度进行判断;
若所述ALBERT-CRF模型的提取精度达到第一设定值,则应用训练好的所述ALBERT-CRF模型对所述多源文本数据进行提取,得到所述地理位置实体文本集和所述土地利用覆被类型文本集;若所述ALBERT-CRF模型的提取精度没有达到所述第一设定值,则修改所述第一超参数,并对所述ALBERT-CRF模型重新进行训练,重复此过程,直至所述ALBERT-CRF模型的提取精度达到所述第一设定值。
若所述BiGRU-DualAttention模型的提取精度达到第一设定值,则应用训练好的所述BiGRU-DualAttention模型对所述多源文本数据进行提取,得到所述空间关系文本集集;若所述BiGRU-DualAttention模型的提取精度没有达到所述第一设定值,则修改所述第二超参数,并对所述ALBERT-CRF模型重新进行训练,重复此过程,直至BiGRU-DualAttention模型的提取精度达到所述第一设定值。本实施例中,所述第一设定值取0.9。
具体地,所述精确率P的计算公式为:所述召回率Q的计算公式为:所述调和平均数F的计算公式为:/>
式中:TP表示正确识别的实体数量;FP表示错误识别的实体数量;FN表示未被识别出的实体数量。
步骤S2,基于图像分类方法对待研究区的遥感影像进行分类,得到土地利用覆被类型图像数据。具体地,所述步骤S2包括:
获取待研究区的所述遥感影像;所述遥感影像为高空间分辨率遥感影像。
基于图像分类方法对所述遥感影像进行分类,得到初始土地利用覆被类型图像数据。
对所述遥感影像的分类精度进行判断;若所述分类精度达到第二设定值,则将所述初始土地利用覆被类型图像数据作为所述土地利用覆被类型图像数据;若所述分类精度没达到所述第二设定值,参照所述遥感影像对所述初始土地利用覆被类型图像数据进行修正,得到所述土地利用覆被类型图像数据。
作为一种可选的实施方式,所述对所述遥感影像的分类精度进行判断,具体为,基于所述遥感影像和所述初始土地利用覆被类型图像数据得到分类结果,并基于总体精度、用户精度、制图精度和Kappa系数四个指标对所述分类结果进行分析得到所述分类精度,对所述分类精度进行判断。
其中,总体精度表示分类结果与参考样本的土地利用覆被类型相同的概率;用户精度表示分类结果中任一随机样本,其类型与同一位置参考样本类型相同的概率;制图精度表示任一参考样本与分类结果在同一位置类型相同的概率。
步骤S3,使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集。
进一步地,所述步骤S3包括:
对所述地理位置实体文本集进行标准化,得到所述规范地理位置集。
基于在线地理编码服务和所述规范地理位置集,通过坐标转换工具得到坐标集。本实施例中,所述坐标集中的坐标为基于WGS-84坐标系的坐标。
将所述规范地理位置集与所述坐标集进行匹配得到所述粗粒度地理位置实体定位集G。
步骤S4,基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位。
具体地,所述步骤S4包括:
提取第n个粗粒度地理位置定位实体Gn,判断所述土地利用覆被类型文本集中是否存在与Gn有关联的土地利用覆被类型文本;n∈N,N为所述粗粒度地理位置定位集中粗粒度地理位置定位实体的数量。
若不存在,则在所述土地利用覆被类型图像数据中直接输出Gn;若存在,则判断所述空间关系文本集中与Gn关联的空间关系文本的数量;
若只有一个空间关系文本Rm,则基于自然语言空间关系转换模型对Rm进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位;
若存在t个空间关系文本,t为大于1的正整数;则基于自然语言空间关系转换模型对t个空间关系文本进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位。
优选地,所述步骤S4由Python语言编程匹配完成。
作为一种可选的实施方式,本发明所述自然语言空间关系转换模型包括方位关系近似转换模型、度量关系近似转换模型和拓扑关系近似转换模型。具体地,所述方位关系近似转换模型为依赖相对参考框架和八方向锥形模型的模型;所述度量关系近似转换模型为基于欧氏距离和误差参数的模型;所述拓扑关系近似转换模型为基于点状、线状、面状参照物的相离、包含、相接和相交关系描述的模型。
下述以云南省普洱市澜沧拉祜族自治县与西双版纳傣族自治州勐海县部分区域作为研究区进行说明,具体范围为东经100°13'54"—100°25'06",北纬22°13'14"—22°24'14"。
初始多源文本数据为待研究区内的750条亚洲象活动肇事文本数据,通过监测员提供和使用Python程序从新闻媒体与社交媒体自行爬取,然后对其进行删除特殊符号、删除空行、去停用词与数据标注等处理得到待研究区的多源文本数据。
构建的ALBERT-CRF模型如图2所示,图中,Input为输入层;ALBERT为预训练模型;CRF为条件随机场(Conditional RandomFields,CRF)模型;B-LOC与I-LOC为地理位置实体输出标记,B-LUC与I-LUC为土地利用/覆被实体输出标记。
训练好的ALBERT-CRF模型的提取精度如表1所示。
表1 ALBERT-CRF模型提取精度
构建的BiGRU-DualAttention模型如图3所示,图中,Input为输入层;BiGRU为隐含层;字级别Attention层为字级别机制层;句级别Attention层为句级别机制层;Sofmax为输出层,采用Sofmax函数。
训练好的ALBERT-CRF模型的提取精度如表1所示。
表2 BiGRU-DualAttention模型提取精度
选取待研究区2020年高分二号卫星影像。首先,进行高分二号卫星影像预处理;继而,使用人机交互式遥感解译方法,识别研究区内林地、茶园、水体、建设用地、道路、甘蔗地和香蕉地土地利用覆被类型,结果如图4所示。最后,借助野外实地验证与Google Earth高分辨率影像判读样本,使用总体精度、用户精度、制图精度和Kappa系数四个指标进行分类结果的精度评价,评价结果如表3所示。分类结果如图4所示。
表3 2020年研究区土地利用/覆被分类精度
基于自建的研究区地名词典,匹配完成地理位置实体名称标准化,得到规范的地理位置名称;基于地名词典与在线地理编码服务,通过正向最大匹配法,借助坐标转换工具或程序,匹配完成WGS-84坐标系下规范的粗粒度地理位置定位,部分示例如表4所示。通过计算匹配坐标与实验数据原始坐标之间的欧氏距离,评价定位精度。
表4标准化地理位置定位示例
通过步骤S4得到待研究区的细粒度位置定位,结果如图5所示。选取待研究区内75个典型采样点,评价细粒度位置模糊定位的定位精度,并与现有的主流地理编码服务商的定位精度评价结果进行对比,对比结果如图6所示,指标由位置误差距离即定位坐标与真实坐标之间的欧氏距离反映,并将计算出的位置误差距离划分为六级精度区间:第一级:[0,50m]、第二级:(50m,200m]、第三级:(200m,500m]、第四级:(500m,1000m]、第五级:(1000m,2000m]与第六级:(2000m,∞),从图中可以看出,本发明的定位精度明显远远高于现有的主流地理编码服务商的定位精度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种细粒度地理位置定位方法,其特征在于,包括:
基于神经网络模型对待研究区的多源文本数据进行提取,得到地理关联文本数据集;
基于图像分类方法对待研究区的遥感影像进行分类,得到土地利用覆被类型图像数据;
使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集;
基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位。
2.根据权利要求1所述的细粒度地理位置定位方法,其特征在于,所述地理关联文本数据集包括地理位置实体文本集、土地利用覆被类型文本集和空间关系文本集。
3.根据权利要求1所述的细粒度地理位置定位方法,其特征在于,所述基于神经网络模型对待研究区的多源文本数据进行提取,得到地理关联文本数据集,包括:
获取待研究区的多源文本数据;
基于所述多源文本数据构建所述神经网络模型;
设置超参数并对所述神经网络模型进行训练;
对训练后的所述神经网络模型的提取精度进行判断;若所述提取精度达到第一设定值,则应用训练好的所述神经网络模型对所述多源文本数据进行提取,得到所述地理关联文本数据集;若所述提取精度没有达到所述第一设定值,则修改所述超参数,并对所述神经网络模型重新进行训练,重复此过程,直至所述提取精度达到所述第一设定值。
4.根据权利要求2所述的细粒度地理位置定位方法,其特征在于,所述神经网络模型包括ALBERT-CRF模型和BiGRU-Dual Attention模型;
所述ALBERT-CRF模型用于对所述多源文本数据进行提取,得到所述地理位置实体文本集和所述土地利用覆被类型文本集;
所述BiGRU-Dual Attention模型用于对所述多源文本数据进行提取,得到所述空间关系文本集。
5.根据权利要求3所述的细粒度地理位置定位方法,其特征在于,所述对训练后的所述神经网络模型的提取精度进行判断,具体为基于精确率、召回率和调和平均数对训练后的所述神经网络模型的所述提取精度进行判断。
6.根据权利要求1所述的细粒度地理位置定位方法,其特征在于,所述基于图像分类方法对待研究区的遥感影像进行分类,得到土地利用覆被类型图像数据,包括:
获取待研究区的所述遥感影像;所述遥感影像为高空间分辨率遥感影像;
基于图像分类方法对所述遥感影像进行分类,得到初始土地利用覆被类型图像数据;
对所述遥感影像的分类精度进行判断;若所述分类精度达到第二设定值,则将所述初始土地利用覆被类型图像数据作为所述土地利用覆被类型图像数据;若所述分类精度没达到所述第二设定值,参照所述遥感影像对所述初始土地利用覆被类型图像数据进行修正,得到所述土地利用覆被类型图像数据。
7.根据权利要求6所述的细粒度地理位置定位方法,其特征在于,所述对所述遥感影像的分类精度进行判断,具体为基于总体精度、用户精度、制图精度和Kappa系数四个指标对所述遥感影像的分类精度进行判断。
8.根据权利要求2所述的细粒度地理位置定位方法,其特征在于,使用待研究区地名词典进行粗粒度地理位置名称标准化,得到规范地理位置集,并基于在线地理编码服务,得到粗粒度地理位置实体定位集,包括:
对所述地理位置实体文本集进行标准化,得到所述规范地理位置集;
基于在线地理编码服务和所述规范地理位置集,通过坐标转换工具得到坐标集;
将所述规范地理位置集与所述坐标集进行匹配得到所述粗粒度地理位置实体定位集。
9.根据权利要求2所述的细粒度地理位置定位方法,其特征在于,所述基于所述地理关联文本数据集、所述土地利用覆被类型图像数据和所述粗粒度地理位置定位集对待研究区进行细粒度地理位置定位,包括:
提取第n个粗粒度地理位置定位Gn,判断所述土地利用覆被类型文本集中是否存在与Gn有关联的土地利用覆被类型文本;n∈N,N为所述粗粒度地理位置定位集中粗粒度地理位置定位实体的数量;
若不存在,则在所述土地利用覆被类型图像数据中直接输出Gn;若存在,则判断所述空间关系文本集中与Gn关联的空间关系文本的数量;
若只有一个空间关系文本Rm,则基于自然语言空间关系转换模型对Rm进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位;
若存在t个空间关系文本,t为大于1的正整数;则基于自然语言空间关系转换模型对t个空间关系文本进行计算得到Gn的搜索范围,基于Gn的搜索范围,在所述土地利用覆被类型图像数据中检索与匹配,得到与Gn有关联的土地利用覆被类型文本Lm的细粒度位置定位。
10.根据权利要求9所述的细粒度地理位置定位方法,其特征在于,所述自然语言空间关系转换模型包括方位关系近似转换模型、度量关系近似转换模型和拓扑关系近似转换模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049543.9A CN113722530B (zh) | 2021-09-08 | 2021-09-08 | 一种细粒度地理位置定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111049543.9A CN113722530B (zh) | 2021-09-08 | 2021-09-08 | 一种细粒度地理位置定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113722530A CN113722530A (zh) | 2021-11-30 |
CN113722530B true CN113722530B (zh) | 2023-10-24 |
Family
ID=78682630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111049543.9A Active CN113722530B (zh) | 2021-09-08 | 2021-09-08 | 一种细粒度地理位置定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113722530B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657602A (zh) * | 2018-12-17 | 2019-04-19 | 中国地质大学(武汉) | 基于街景数据和迁移学习的自动城市功能分区方法及系统 |
CN110263717A (zh) * | 2019-06-21 | 2019-09-20 | 中国科学院地理科学与资源研究所 | 一种融入街景影像的土地利用类别确定方法 |
AU2020103654A4 (en) * | 2019-10-28 | 2021-01-14 | Nanjing Normal University | Method for intelligent construction of place name annotated corpus based on interactive and iterative learning |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10534960B2 (en) * | 2016-04-01 | 2020-01-14 | California Institute Of Technology | System and method for locating and performing fine grained classification from multi-view image data |
US11809825B2 (en) * | 2017-09-28 | 2023-11-07 | Oracle International Corporation | Management of a focused information sharing dialogue based on discourse trees |
-
2021
- 2021-09-08 CN CN202111049543.9A patent/CN113722530B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657602A (zh) * | 2018-12-17 | 2019-04-19 | 中国地质大学(武汉) | 基于街景数据和迁移学习的自动城市功能分区方法及系统 |
CN110263717A (zh) * | 2019-06-21 | 2019-09-20 | 中国科学院地理科学与资源研究所 | 一种融入街景影像的土地利用类别确定方法 |
AU2020103654A4 (en) * | 2019-10-28 | 2021-01-14 | Nanjing Normal University | Method for intelligent construction of place name annotated corpus based on interactive and iterative learning |
Non-Patent Citations (1)
Title |
---|
基于面向对象与规则的Sentinel-2A影像土地覆被分类――以江西省都昌县为例;张宏涛;黄宏胜;魏康宁;钟海燕;;测绘通报(06);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113722530A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Resch et al. | Combining machine-learning topic models and spatiotemporal analysis of social media data for disaster footprint and damage assessment | |
Girres et al. | Quality assessment of the French OpenStreetMap dataset | |
CN113434623B (zh) | 一种基于多源异构空间规划数据的融合方法 | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN111881290A (zh) | 一种基于加权语义相似度的配网多源网架实体融合方法 | |
CN108388559A (zh) | 地理空间应用下的命名实体识别方法及系统、计算机程序 | |
CN109933797A (zh) | 基于Jieba分词及地址词库的地理编码方法和系统 | |
TW201933879A (zh) | 內容推薦方法及裝置 | |
CN112288247A (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
Guzmán Q et al. | On the relationship of fractal geometry and tree–stand metrics on point clouds derived from terrestrial laser scanning | |
Qiu et al. | Spatially oriented convolutional neural network for spatial relation extraction from natural language texts | |
Wang et al. | Mapping and spatial analysis of multiethnic toponyms in Yunnan, China | |
Moura et al. | Reference data enhancement for geographic information retrieval using linked data | |
Wang et al. | Drainage pattern recognition method considering local basin shape based on graph neural network | |
CN115017425A (zh) | 地点检索方法、装置、电子设备以及存储介质 | |
Iqbal et al. | The last two decades of computer vision technologies in water resource management: A bibliometric analysis | |
CN113722530B (zh) | 一种细粒度地理位置定位方法 | |
van Erp et al. | Georeferencing animal specimen datasets | |
CN105608217A (zh) | 一种基于遥感数据的热点主题展示方法 | |
CN111325235B (zh) | 面向多语种的通用地名语义相似度计算方法及其应用 | |
Zhou et al. | A points of interest matching method using a multivariate weighting function with gradient descent optimization | |
Schockaert et al. | Automatic acquisition of fuzzy footprints | |
Yang et al. | Point‐of‐interest detection from Weibo data for map updating | |
CN111339446B (zh) | 一种兴趣点挖掘方法、装置、电子设备和存储介质 | |
Twaroch et al. | Acquisition of vernacular place names from web sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |