CN114549689A - 一种基于图卷积神经网络的河流模式识别方法与装置 - Google Patents

一种基于图卷积神经网络的河流模式识别方法与装置 Download PDF

Info

Publication number
CN114549689A
CN114549689A CN202210146768.4A CN202210146768A CN114549689A CN 114549689 A CN114549689 A CN 114549689A CN 202210146768 A CN202210146768 A CN 202210146768A CN 114549689 A CN114549689 A CN 114549689A
Authority
CN
China
Prior art keywords
river
graph
reach
nodes
river reach
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210146768.4A
Other languages
English (en)
Other versions
CN114549689B (zh
Inventor
武芳
刘呈熠
翟仁健
巩现勇
杜佳威
行瑞星
殷吉崇
王安东
邱越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Engineering University of PLA Strategic Support Force
Original Assignee
Information Engineering University of PLA Strategic Support Force
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Engineering University of PLA Strategic Support Force filed Critical Information Engineering University of PLA Strategic Support Force
Priority to CN202210146768.4A priority Critical patent/CN114549689B/zh
Publication of CN114549689A publication Critical patent/CN114549689A/zh
Application granted granted Critical
Publication of CN114549689B publication Critical patent/CN114549689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于河系空间分布模式识别技术领域,提出一种基于图卷积神经网络的河流模式识别方法与装置,该方法包括:在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,完成自然河系图结构数据基本要素的构建;从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并与河段建立映射关系,完成河流特征向量提取;基于河流特征向量构建自然河系空间分布模式的神经网络识别模型;基于识别模型进行自然河系空间分布模式的识别。本发明实现了自然河系空间分布模式的识别。

Description

一种基于图卷积神经网络的河流模式识别方法与装置
技术领域
本发明属于河系空间分布模式识别技术领域,尤其涉及一种基于图卷积神经网络的河流模式识别方法与装置。
背景技术
一些学者根据河系空间分布模式的特征差异设计量化参数,并采用不同的分类器达到河系模式自动识别的目的,包括决策树法,自相似性统计法以及支持向量机法。然而,这些方法通常需要对大量特征参数进行统计汇总,适用于大型河系的空间分布模式识别,而针对河系规模小,河系特征无法支撑现有方法对特征量的需求。同时,越来越多的学者意识到自然河系的空间分布模式识别不只是单纯的线性映射问题,而是复杂的非线性映射问题,通过专家经验设置约束规则的经典方法无法有效解决自然河系的多空间分布模式识别问题。
发明内容
本发明针对通过专家经验设置约束规则的经典方法无法有效解决自然河系的多空间分布模式识别问题的问题,提出一种基于图卷积神经网络的河流模式识别方法与装置。
为了实现上述目的,本发明采用以下技术方案:
本发明一方面提出一种基于图卷积神经网络的河流模式识别方法,包括:
步骤1:在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
步骤2:从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
步骤3:基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
步骤4:基于构建的识别模型进行自然河系空间分布模式的识别。
进一步地,所述步骤1还包括:
采用独热编码的方式对图进行标注,每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
进一步地,所述步骤2包括:
步骤2.1:在整体层面,利用Horton编码对自然河系的整体层级进行划分,并对不同层级河段数量、长度进行统计;
步骤2.2:在局部流域层面,以河段及其上游组成的流域为统计单元,从流域伸长比、面积比、河流分布密度、发育平衡度方面对河系的区域特征进行描述;
步骤2.3:在河段个体层面,提取矢量线段的几何特征,包括长度、方向、曲折度、正交程度;
步骤2.4:将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河系图结构特征向量提取。
进一步地,所述步骤2.1包括:
步骤2.1.1:通过拓扑运算获取首尾点重合的邻近河段,构建每条河段的邻接表,然后获得河系图整体的连通关系,即邻接矩阵;
步骤2.1.2:根据Horton编码对河系层级进行划分,即无分叉的顶端河段被定义为第一级,当两个及以上同等级的河流交汇后,下游的河段等级增加一级;当两个及以上不同等级的河流交汇时,下游的河段等级则于上游河段等级中的最大值保持一致,依次对河系内所有河段层级进行编码;
步骤2.1.3:根据层级对河段进行分组,获取每个层级的河段数量;
步骤2.1.4:根据层级对河段进行分组,获取每个层级河段的平均长度。
进一步地,所述步骤2.4包括:
选择图节点、即河段作为所有特征项的映射对象,在整体特征项中,连通关系作为图结构的一个基本要素不计入特征矩阵,而各层级的统计值,包括长度,河段数量则采用共享参数值的方式分配给每个层级的对应河段;在局部流域特征项中,将该层次流域的特征值赋予给流域的末端河段;河段个体特征项则依次赋予给对应河段;按此方式,所有特征项均转换为与图节点一一映射的特征矩阵,从而实现矢量河系数据到图结构数据的转换。
进一步地,所述数据输入层中,采用批处理方式以加快模型训练收敛的速度,提高模型训练效果;其次,对图数据中的特征矩阵统一进行归一化处理;每个图的邻接矩阵按照如下方式被转换为非标准化的拉普拉斯矩阵L,并包含了每个节点的自连接;同时按照图顺序对特征矩阵内节点进行排列;
Figure BDA0003508568690000031
其中
Figure BDA0003508568690000032
表示未加入节点自连接图邻接矩阵,I表示N维单位矩阵,N表示该图的节点数量,D表示邻接矩阵A的度矩阵;同时,所有节点的邻接关系亲疏一致,即邻接矩阵中存在节点邻接关系对应的像元值为1。
进一步地,所述池化层中,按照如下方式为各图节点计算自注意力分数、即权重:
Z=σ(LHθatt+b) 式5
其中
Figure BDA0003508568690000033
表示卷积层的输出;
Figure BDA0003508568690000034
表示权重向量,初始是随机值,F′表示输出的维度;
Figure BDA0003508568690000035
表示随机偏差值;激活函数σ为tanh函数;
以图为单元,根据图内各节点的自注意力分数进行图内各节点Top-rank掩膜操作;
对剩余节点进行最大池化和平均池化操作,得到输出结果。
进一步地,所述全连接分类层中包含2个隐藏层和1个输出层,每个隐藏层的计算如下:
h(l+1)=σ(h(l)W+b(l)) 式8
其中h(l)表示第l层的输入,W表示不同特征项的权重,b(l)表示第l层的偏差,激活函数σ为ReLU函数。
本发明另一方面提出一种基于图卷积神经网络的河流模式识别装置,包括:
自然河系图结构数据构建模块,用于在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
特征向量提取模块,用于从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
模式识别模型构建模块,用于基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
模式识别模块,用于基于构建的识别模型进行自然河系空间分布模式的识别。
进一步地,所述自然河系图结构数据构建模块还用于采用独热编码的方式对图进行标注,每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
进一步地,所述特征向量提取模块具体用于:
步骤2.1:在整体层面,利用Horton编码对自然河系的整体层级进行划分,并对不同层级河段数量、长度进行统计;
步骤2.2:在局部流域层面,以河段及其上游组成的流域为统计单元,从流域伸长比、面积比、河流分布密度、发育平衡度方面对河系的区域特征进行描述;
步骤2.3:在河段个体层面,提取矢量线段的几何特征,包括长度、方向、曲折度、正交程度;
步骤2.4:将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河系图结构特征向量提取。
进一步地,所述步骤2.1包括:
步骤2.1.1:通过拓扑运算获取首尾点重合的邻近河段,构建每条河段的邻接表,然后获得河系图整体的连通关系,即邻接矩阵;
步骤2.1.2:根据Horton编码对河系层级进行划分,即无分叉的顶端河段被定义为第一级,当两个及以上同等级的河流交汇后,下游的河段等级增加一级;当两个及以上不同等级的河流交汇时,下游的河段等级则于上游河段等级中的最大值保持一致,依次对河系内所有河段层级进行编码;
步骤2.1.3:根据层级对河段进行分组,获取每个层级的河段数量;
步骤2.1.4:根据层级对河段进行分组,获取每个层级河段的平均长度。
进一步地,所述步骤2.4包括:
选择图节点、即河段作为所有特征项的映射对象,在整体特征项中,连通关系作为图结构的一个基本要素不计入特征矩阵,而各层级的统计值,包括长度,河段数量则采用共享参数值的方式分配给每个层级的对应河段;在局部流域特征项中,将该层次流域的特征值赋予给流域的末端河段;河段个体特征项则依次赋予给对应河段;按此方式,所有特征项均转换为与图节点一一映射的特征矩阵,从而实现矢量河系数据到图结构数据的转换。
进一步地,所述数据输入层中,采用批处理方式以加快模型训练收敛的速度,提高模型训练效果;其次,对图数据中的特征矩阵统一进行归一化处理;每个图的邻接矩阵按照如下方式被转换为非标准化的拉普拉斯矩阵L,并包含了每个节点的自连接;同时按照图顺序对特征矩阵内节点进行排列;
Figure BDA0003508568690000051
其中
Figure BDA0003508568690000052
表示未加入节点自连接图邻接矩阵,I表示N维单位矩阵,N表示该图的节点数量,D表示邻接矩阵A的度矩阵;同时,所有节点的邻接关系亲疏一致,即邻接矩阵中存在节点邻接关系对应的像元值为1。
进一步地,所述池化层中,按照如下方式为各图节点计算自注意力分数、即权重:
Z=σ(LHθatt+b) 式5
其中
Figure BDA0003508568690000053
表示卷积层的输出;
Figure BDA0003508568690000054
表示权重向量,初始是随机值,F′表示输出的维度;
Figure BDA0003508568690000055
表示随机偏差值;激活函数σ为tanh函数;
以图为单元,根据图内各节点的自注意力分数进行图内各节点Top-rank掩膜操作;
对剩余节点进行最大池化和平均池化操作,得到输出结果。
进一步地,所述全连接分类层中包含2个隐藏层和1个输出层,每个隐藏层的计算如下:
h(l+1)=σ(h(l)W+b(l)) 式8
其中h(l)表示第l层的输入,W表示不同特征项的权重,b(l)表示第l层的偏差,激活函数σ为ReLU函数。
与现有技术相比,本发明具有的有益效果:
(1)基于地形特征和制图要求的自然河系空间分布模式分类与定义。自然河系的空间分布模式差异往往反映出区域地质构造、地形变化、气候条件甚至人类活动的特点,具有重要的地理意义,所以在制图综合中需要被关注和强调。本发明从河流地貌特点出发,结合不同模式河系在几何或拓扑特征上的差异,分离出6种典型的自然河系空间分布模式,为后续解决其识别问题也奠定了基础。
(2)自然河系的图表示。与以往针对栅格或矢量数据解决河系综合问题不同,本发明进一步探索了自然河系的数据表达形式。在矢量河系数据的基础上,构建以河段及其连接关系为基本要素的图结构,并根据不同空间分布模式的典型特征,从整体、局部、个体3个层面提取特征并实现参数化,将这些特征参数与河段一一建立映射关系,完成了矢量数据向图结构数据的转换,从而实现了以图数据形式存储自然河系的几何、拓扑特征,为后续深度学习的模型提供重要的数据支撑。
(3)数据驱动的空间分布模式挖掘。过去,地图要素的空间分布模式识别常采用专家知识指导下的规则制定策略以提取一定范围内的目标模式,具有很强的指向性。而本发明从数据本身的关系和特征出发,构建以图卷积、自注意力机制和多层全连接为支撑的深度学习模型,旨在挖掘不同空间分布模式潜在的特征差异,从而实现自然河系空间分布模式的识别。这不仅有助于解决传统方法难以处理的非线性问题,还能提高计算机的智能化水平,强化计算机在模拟人类思维方面的能力,从而促进制图综合进一步向自动化方向迈进。
附图说明
图1为本发明实施例一种基于图卷积神经网络的河流模式识别方法的基本流程图;
图2为本发明实施例图数据存储结构示意图;
图3为本发明实施例自然河系的图结构构建示意图;
图4为本发明实施例不同空间分布模式的独热编码标签示意图;
图5为本发明实施例部分河系描述参数计算示意图;
图6为本发明实施例自然河系空间分布模式的神经网络识别模型框架图;
图7为本发明实施例训练过程中损失值和准确率的变化曲线图;
图8为本发明实施例部分测试河系对应模式的模型预测概率;
图9为本发明实施例一种基于图卷积神经网络的河流模式识别装置的结构示意图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
如图1所示,一种基于图卷积神经网络的河流模式识别方法,包括:
步骤1:在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
步骤2:从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
步骤3:基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
步骤4:基于构建的识别模型进行自然河系空间分布模式的识别。
具体地,进行如下展开阐述:
1.自然河系的图表示
1.1图结构数据
一个图G由节点集N和边集V构成,记为G={N,V}。每一条边由两个顶点构成,如v1=(n1,n2)表示点n1与n2存在联系。若某一图中边的顶点集顺序先后存在固定含义,则该图称为有向图,否则称为无向图。
在一个图中,从一个节点出发,通过边到达其他节点的轨迹被称为路径。特殊地,若某条路径在没有重复边的情况下以同一个节点为始末点,则该条路径就是一个环结构,这也是检测不同空间分布模式自然河系环路特征的重要结构。
在节点和边的基础上,图的数据存储格式主要包括图结构、邻接表和邻接矩阵,如图2所示。其中图邻接矩阵中行列数分别代表对应节点,像元值则表示节点之间是否存在联系(边)。1表示存在直接连接,0表示不存在直接连接,一般还加入节点的自连接,这也是图卷积运算的重要数据格式之一。同时,考虑到不同节点的影响程度不同,还会引入权重来控制节点之间的亲疏远近关系。
除了节点和边这类基本要素外,图结构数据还包含大量用于描述节点、边、图的特征数据。这些特征数据与所属对象构建映射关系,极大地提高了图结构数据的描述范围,既可以是现实世界的道路网、自然河系,也可以是虚拟世界的社交网。
1.2自然河系图结构数据的构建
在制图领域,自然河流一般以矢量数据存储。根据深度学习模型的数据要求,需要首先将矢量结构转换图结构。在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,如图3中(a)所示。因此,本实施例将一个河系作为一个完整的图,将河段作为图节点,如图3中(b)中河段中心点即表示为图节点;根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建。
由于后续采用的是监督学习型神经网络以达到自然河系空间分布模式的分类任务,每一个自然河系的图还需要根据其不同的分类给予不同的图标签。本发明采用独热编码的方式对图进行标注,如图4所示。每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
1.3特征向量的提取
自然河系的特征是深度学习重要的数据支撑,直接影响着河系空间分布模式分类模型的有效性。为此,根据矢量数据以河段为单元的数据结构,本发明将从全局、局部以及河段个体三个层面提取描述自然河系特征的参数。从整体层面来看,以节点和边构建的邻接关系着重描述了图的整体结构,是重要的结构特征;在整体结构的基础上,利用Horton编码对自然河系的整体层级进行划分;并对不同层级河段数量、长度进行统计。从局部层面来看,以河段及其上游组成的流域为统计单元,着重从流域伸长比、面积比、河流分布密度,发育平衡度方面对河系的区域特征进行描述。从河段个体来看,重点提取矢量线段的几何特征,包括长度、方向、曲折度、正交程度等。
1、整体层面
(1)连通关系:通过拓扑运算获取首尾点重合的邻近河段,构建每条河段的邻接表,然后获得河系图整体的连通关系,即邻接矩阵。
(2)河段层级:根据Horton编码对河系层级进行划分,即无分叉的顶端河段被定义为第一级,当两个及以上同等级的河流交汇后,下游的河段等级增加一级;当两个及以上不同等级的河流交汇时,下游的河段等级则于上游河段等级中的最大值保持一致,依次对河系内所有河段层级进行编码,如图5中(a)所示。
(3)层级河段数量:根据层级对河段进行分组,获取每个层级的河段数量。
(4)层级河段平均长度:根据层级对河段进行分组,获取每个层级河段的平均长度。
2、局部流域层面
(1)流域伸长比:用于描述流域在水平方向和垂直方向上发育的差异。如图5中(b)所示。构建流域河段的最小面积矩形,采用矩形长与宽的比值表示流域伸长比,若该值越大,则表明该流域向一个方向发育的程度较高;而越近于1,则表明该流域在水平和垂直方向上发展平均。
(2)面积比:用于描述河系的发育程度,采用根据流域河段构建的凸包面积与最小面积矩阵的比值来表示。若该值越大,说明流域河段向各个方向均有发育。
(3)密度:用于描述流域内河段的分布密度,采用流域内河段的累计长度与流域凸包面积的比值来表示,该值越大,则表明该流域河流分布密度越大。
(4)发育平衡度:用于描述流域内主流两侧河段发育的对比。在识别主流的基础上采用如下公式计算该参数。
Figure BDA0003508568690000091
其中αbalance表示该流域的发育平衡度,Lleft表示主流左侧河段的累加长度,Lright表示主流右侧的累加长度。
3、河段个体层面
(1)长度:河段长度,即河段内各线段长度总和。
(2)方向:河段方向,即河段首尾点连线与X轴正向的夹角大小,该值的变化范围为[0°,180°]。
(3)曲折度:河段首尾点连线长度与河段长度的比值。
(4)正交度:用于描述河段存在的直角化程度,如图5中(c)所示,将河段方向取值范围分为18个组,每组范围为10°。根据河段方向对河段进行分组,并计算每组内河段的累计长度,取长度前二的两个组,并计算两个组中心线的夹角大小(红色虚线构的角度),即为该河段的正交度,取值范围为(0°,180°)。若正交度越接近90°,则表明该河段内越多线段按照相互垂直的方向分布连接。
尽管以上参数分别从整体、局部和河段个体特征进了描述,但仍然需要与图结构中的基本要素建立映射关系,本发明选择图节点(河段)作为所有特征项的映射对象。在整体特征项中,连通关系作为图结构的一个基本要素不计入特征矩阵,而各层级的统计值,包括长度,河段数量则采用共享参数值的方式分配给每个层级的对应河段。在局部流域特征项中,将该层次流域的特征值赋予给流域的末端河段。河段个体特征项则依次赋予给对应河段。按此方式,所有特征项均转换为与图节点一一映射的特征矩阵,从而实现矢量河系数据到图结构数据的转换,为后续深度学习模型提供重要的数据支持。
2.自然河系空间分布模式的神经网络识别模型
2.1自然河系空间分布模式识别模型框架
在自然河系的图结构数据的基础上,其空间分布模式的识别问题也可以被视为自然河系的图分类问题。鉴于深度学习在图分类问题上已获得不错的应用效果,例如建筑群规则程度的分类,道路网网格模式分类,在自然河系空间分布模式识别问题上引入深度学习方法。为此,本发明提出一种基于空域图卷积的河系模式分类模型。该模型主要分为4部分,如图6所示,包含数据输入层,图卷积层,池化层和全连接分类层。
当前,尽管谱域图卷积方式得到了诸多应用,但对自然河系的空间分布模式的识别任务仍存在一定不适用性:①需要限制图尺寸,即固定图中节点数量;而对于完整模式下的自然河系来说,河段的数量难以控制且不同河系节点数量差异较大;②需要进行复杂的数据转换,需要对图特征矩阵进行基于拉普拉斯矩阵的特征分解;③图卷积操作需要消耗较多算力,主要包含特征分解和傅里叶变换,尽管在后续方法改进过程中引入了切比雪夫多项式作为滤波器拟合卷积核来降低计算复杂度,但仍然不能解决图尺寸限制导致的扩展性差等问题。为此,本发明将空域图卷积方式引入深度学习模型,解除对图节点数量的约束,提高模型的扩展力,以便于后续研究中应对图节点的变化。
在池化层中,考虑到通过多次卷积运算,不同特征对分类结果的影响效果存在差异,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息。
在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果。
2.2数据输入层
所有自然河系的图结构数据同时输入数据输入层,即采用一个批处理方式以加快模型训练收敛的速度,提高模型训练效果。其次,对图数据中的特征矩阵统一进行归一化处理,其归一化公式如下所示。
Figure BDA0003508568690000111
其中X为所有图节点的原始特征矩阵,mean(X,axis=0)表示所有节点不同特征的平均值,std(X,axis=0)表示所有节点不同特征的标准差。
每个图的邻接矩阵被转换为非标准化的拉普拉斯矩阵,并包含了每个节点的自连接,邻接矩阵的转换公式如下:
Figure BDA0003508568690000112
其中
Figure BDA0003508568690000113
表示未加入节点自连接图邻接矩阵,I表示N维单位矩阵,N表示该图的节点数量,D表示邻接矩阵A的度矩阵。同时,所有节点的邻接关系亲疏一致,即邻接矩阵中存在节点邻接关系对应的像元值为1。
除此以外,特征矩阵内节点也需要按照图顺序进行排列,例如图i有两个节点,图j有三个节点,则其特征矩阵中节点到图的映射为[1,1,2,2,2]。
2.3图卷积层
将图卷积层设为3层,卷积运算公式如下。
h(l+1)=σ(Lh(l)WF×F′+b(l)) 式4
其中h(l)表示第l层的输入,
Figure BDA0003508568690000121
表示卷积权重,F表示输入的维度,F′表示输出的维度,在第一层图卷积运算时,F和F′的值不一定相等,但第二层和第三层图卷积运算,F和F′的值相等。
Figure BDA0003508568690000122
表示第l层卷积运算的偏差项。在激活函数σ方面,选用ReLU函数增加模型的非线性成分。
通过3次卷积运算,分别得到3组维度为F′的输出,并将其进行拼接得到维度为3F′的输出。
2.4池化层
池化层的目的就是通过压缩节点数量降低特征“噪音”,保留有效特征。为此,本层引入自注意力机制以衡量不同特征的重要性。通过池化操作,在保留卷积运算输出中的重要特征的同时,将不同尺寸的特征矩阵压缩到相同尺寸,方便后续操作。
(1)自注意力分数。根据卷积运算的输出以及邻接矩阵关系,自注意力兼顾了节点特征和拓扑关系。自注意力分数计算公式如下。
Z=σ(LHθatt+b) 式5
其中L表示为邻接关系拉普拉斯矩阵的近似,其计算方式详见公式3,
Figure BDA0003508568690000123
Figure BDA0003508568690000124
表示卷积层的输出,
Figure BDA0003508568690000125
表示权重向量,初始是随机值,
Figure BDA0003508568690000126
表示随机偏差值,此处激活函数σ为tanh函数。
(2)Top-rank掩膜。Top-rank是根据不同评分方式对节点重要性进行排序并以此完成池化操作的一种手段。以图为单元,根据图内节点的自注意力分数由高到低对节点进行排序。设置节点保留比例为K,K为超参数,变化范围为(0,1],得到保留节点数量为KNi,Ni为第i个图数据的节点数量。那么,该图的Top-rank掩膜即可用一个逻辑矩阵进行定义,具体计算公式如下。
Figure BDA0003508568690000127
其中ni,j表示为第i个图结构中第j个节点,根据节点保留比例K得到对应保留节点的最低自注分数得分Z(KNi),注意KNi需要取小于等于该值的最大整数值,那么Z(i)与Z(KNi)相等。
(3)读出操作。由于原始图尺寸的差异,即使通过Top-rank掩膜操作,各图的节点数量可能仍然存在差异。为保证池化层输出的维度相同,对剩余节点进行最大池化和平均池化操作,得到输出结果,具体计算方式如下。
Figure BDA0003508568690000131
其中n表示某个图剩余节点的数量,Xj表示图中第j个节点的卷积运算输出,||表示为向量拼接。
2.5全连接分类层
全连接分类层包含2个隐藏层和1个输出层。通过池化操作得到的维度为6F′的特征根据图分组统一进入全连接分类层,即每个图均有6F′个特征项,隐藏层神经元数量分别为3F′,1.5F′,每层的运算如下。
h(l+1)=σ(h(l)W+b(l)) 式8
其中W表示不同特征项的权重,b(l)表示第l层的偏差,激活函数σ为ReLU函数。
通过全连接运算,设置该层输出为6维,对应不同空间分布模式的标签值。通过sigmoid函数将输出的各像元值映射到[0,1]区间,从而得到模型的评估结果,即图为像元对应空间分布模式的概率。进一步地,对比训练集中每个图空间分布模式预测值和标签值之间的差异,计算交叉熵得到训练样本的损失值,通过反向传播更新模型参数以达到降低损失值,优化模型效果的目的。
为验证本发明效果,进行如下实验:
在实验数据方面,本发明以OpenStreetMap数据(http:// download.geofabrik.de/)为基础,通过人工判断、选取和标注的方式,得到共900组不同空间分布模式的自然河系矢量数据。其中包含720个训练样本和180个测试样本,且6种空间分布模式的样本数量均相等,即训练集中每种模式120个,测试集中每种模式30个,经过图结构的构建和特征提取,样本的节点数量统计信息如表1所示。
由表可知,所有样本中,图节点最多的达到157个,最少的仅有9个节点,总体上平均节点数为50个,图节点数量差距大,而本发明方法无需固定图尺寸大小,适用与自然河系图结构数据。
本发明在Python和PyTorch支持下构建了自然河系空间分布模式识别模型,并依托i7-8750H和NVIDIA GTX1060的硬件基础进行模型的训练工作。模型预设的超参数设置如下。
表1样本节点数量统计
Figure BDA0003508568690000141
表2超参数设置
Figure BDA0003508568690000142
在初始化模型中各类权值后,通过不断降低测试集损失值反向传播更新各类权值权值。随着多次训练迭代,训练样本总体的损失值以及各空间分布模式训练样本的准确率变化如图7所示。
图7中损失值和准确率均表示样本在训练过程中的整体变化情况,而其余带符号“#”的曲线则表示不同空间分布模式样本的准确率变化情况,模式对应关系与表1一致。可以发现,经过了123次训练迭代,样本整体的损失值下降至0.034,准确率提高到0.996,除此以外,各空间分布模式训练样本的准确率均达到了0.80以上。若当前训练得到的损失值高于前100次损失平均值,则训练终止以防止过拟合。除此以外,根据多次训练结果设置训练的最高次数为150次。
将180个测试样本输入训练好的识别模型,得到所有样本以及各模式的识别准确率,如下表所示。
表3测试样本的准确率
Figure BDA0003508568690000143
由表3可知,所有测试样本的准确率达到了0.822。在这些样本中,网络状的识别准确率达到最高,其他模式的测试样本准确率也均高于0.74,识别效果较好,也说明本发明提出的自然河系空间分布模式识别模型具有较好的泛化能力。
在此基础上,本发明从测试样本中选取了部分自然河系矢量数据以及识别模型在对应空间分布模式方面的评估概率,如图8所示。
从整体上看,不同空间分布模式的测试样本均能够被模型正确分类,特别是网络状河系,其预测概率达到1.00,这也体现了了识别模型强大的分类能力。从每个空间分布模式内的样本来看,尽管归属于同一个模式,不同样本之间也存在较大的几何特征和拓扑特征差异,即一种模式下其样本具体的表现形式也可能千差万别,但本发明模型依旧能在测试集中表现出较高的识别准确率,这也表明模型在河系空间分布模式识别问题上的泛化能力较强,能够应用到更多河系模式识别的样本上。当然,也存在预测准确率较低的情况,例如图8中平行状河系第三个样本,模型对于平行状模式的预测概率为0.586,虽然依旧被识别为平行状河系,但相对于其他样本,其预测概率较低。从样本特征来看,尽管支流方向基本一致且分布密集,但由于支流长度差异大,层次不齐,导致该河系的平行特征不典型,因此预测概率相对较低。为解决该类问题,还需要进一步增加类似特征的样本,加强对此类样本的学习以提高识别模型的稳定性。综上,本发明提出的自然河系空间分布模式的识别模型能够较好地完成分类任务,并与人类视知觉感知结果接近一致。
在识别模型实验的基础上,本发明选用其他3个对比模型来反映本发明方法的优势,包括多层感知器模型(MLP)、经典图卷积模型(GCN)以及多层自注意力图卷积池化模型(SAGPoolh)。MLP模型包含了两个隐藏层和一个输出层,类似于本发明模型的多连接输出层。GCN模型则是需要固定的图尺寸,然后利用图卷积、池化和输出是实现训练任务。SAGPoolh模型则是在本发明提及的图卷积基础上,采用多层自注意力池化的策略实现训练任务。
在实验设置方面,GCN模型包含3个卷积层,与本发明模型一致,且其卷积层的维度与本发明模型相同。考虑到该模型需要保证图结构数据具有相同的尺寸,在特征矩阵和邻接矩阵输入之前加入虚拟节点及其特征,对应特征像元值均用0表示,这类节点的邻接关系仅有自连接。SAGPoolh模型中的相关参数设置均与本发明保持一致,其中每一个池化层的节点保留比例均为0.9。
在训练阶段,采用与本发明训练相同的样本数据对对比模型进行迭代优化,并利用测试集对模型识别效果进行检验。为保证不同模型测试结果的稳定性,每个模型分别进行了10次训练过程,并得到测试样本的平均准确率以及10次测试结果准确率的标准差,如下表所示。
表4. 10次测试的模型平均准确率和方差结果
Figure BDA0003508568690000161
从平均准确率上看,本发明模型的平均准确率到达了0.802,远高于对比模型的平均准确率;从准确率方差上看,本发明模型仅有0.013,在四个模型中处于低位。综上表明,本发明模型在自然河系空间分布模式的识别方面质量高,稳定性好。从模型结构上来看,MLP模型直接采用全连接的策略忽视了节点的邻近关系对模型结果产生了影响;相对地,GCN模型顾及了节点的邻近关系,但由于不同图之间节点数量差异大,填补的大量虚拟特征影响模型结果。SAGPoolh和本发明模型均无需限制图尺寸,顾及邻近关系且均引入了自注意力机制以保留重要特征,因此从模型结果上看平均准确率均在0.77以上,这也反映出自注意力池化模块能够有效提高模型的效果。同时,由于SAGPoolh多层池化的机制一般用于节点数量较多的图数据,在小尺寸图结构数据中难以发挥作用,因此本发明模型在自然河系的小尺寸图数据上更显优势。
在上述实施例的基础上,如图9所示,本发明还提出一种基于图卷积神经网络的河流模式识别装置,包括:
自然河系图结构数据构建模块,用于在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
特征向量提取模块,用于从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
模式识别模型构建模块,用于基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
模式识别模块,用于基于构建的识别模型进行自然河系空间分布模式的识别。
进一步地,所述自然河系图结构数据构建模块还用于采用独热编码的方式对图进行标注,每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
进一步地,所述特征向量提取模块具体用于:
步骤2.1:在整体层面,利用Horton编码对自然河系的整体层级进行划分,并对不同层级河段数量、长度进行统计;
步骤2.2:在局部流域层面,以河段及其上游组成的流域为统计单元,从流域伸长比、面积比、河流分布密度、发育平衡度方面对河系的区域特征进行描述;
步骤2.3:在河段个体层面,提取矢量线段的几何特征,包括长度、方向、曲折度、正交程度;
步骤2.4:将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河系图结构特征向量提取。
进一步地,所述步骤2.1包括:
步骤2.1.1:通过拓扑运算获取首尾点重合的邻近河段,构建每条河段的邻接表,然后获得河系图整体的连通关系,即邻接矩阵;
步骤2.1.2:根据Horton编码对河系层级进行划分,即无分叉的顶端河段被定义为第一级,当两个及以上同等级的河流交汇后,下游的河段等级增加一级;当两个及以上不同等级的河流交汇时,下游的河段等级则于上游河段等级中的最大值保持一致,依次对河系内所有河段层级进行编码;
步骤2.1.3:根据层级对河段进行分组,获取每个层级的河段数量;
步骤2.1.4:根据层级对河段进行分组,获取每个层级河段的平均长度。
进一步地,所述步骤2.4包括:
选择图节点、即河段作为所有特征项的映射对象,在整体特征项中,连通关系作为图结构的一个基本要素不计入特征矩阵,而各层级的统计值,包括长度,河段数量则采用共享参数值的方式分配给每个层级的对应河段;在局部流域特征项中,将该层次流域的特征值赋予给流域的末端河段;河段个体特征项则依次赋予给对应河段;按此方式,所有特征项均转换为与图节点一一映射的特征矩阵,从而实现矢量河系数据到图结构数据的转换。
进一步地,所述数据输入层中,采用批处理方式以加快模型训练收敛的速度,提高模型训练效果;其次,对图数据中的特征矩阵统一进行归一化处理;每个图的邻接矩阵按照如下方式被转换为非标准化的拉普拉斯矩阵L,并包含了每个节点的自连接;同时按照图顺序对特征矩阵内节点进行排列;
Figure BDA0003508568690000181
其中
Figure BDA0003508568690000182
表示未加入节点自连接图邻接矩阵,I表示N维单位矩阵,N表示该图的节点数量,D表示邻接矩阵A的度矩阵;同时,所有节点的邻接关系亲疏一致,即邻接矩阵中存在节点邻接关系对应的像元值为1。
进一步地,所述池化层中,按照如下方式为各图节点计算自注意力分数、即权重:
Z=σ(LHθatt+b) 式5
其中
Figure BDA0003508568690000183
表示卷积层的输出;
Figure BDA0003508568690000184
表示权重向量,初始是随机值,F′表示输出的维度;
Figure BDA0003508568690000185
表示随机偏差值;激活函数σ为tanh函数;
以图为单元,根据图内各节点的自注意力分数进行图内各节点Top-rank掩膜操作;
对剩余节点进行最大池化和平均池化操作,得到输出结果。
进一步地,所述全连接分类层中包含2个隐藏层和1个输出层,每个隐藏层的计算如下:
h(l+1)=σ(h(l)W+b(l)) 式8
其中h(l)表示第l层的输入,W表示不同特征项的权重,b(l)表示第l层的偏差,激活函数σ为ReLU函数。
综上,
(1)基于地形特征和制图要求的自然河系空间分布模式分类与定义。自然河系的空间分布模式差异往往反映出区域地质构造、地形变化、气候条件甚至人类活动的特点,具有重要的地理意义,所以在制图综合中需要被关注和强调。本发明从河流地貌特点出发,结合不同模式河系在几何或拓扑特征上的差异,分离出6种典型的自然河系空间分布模式,为后续解决其识别问题也奠定了基础。
(2)自然河系的图表示。与以往针对栅格或矢量数据解决河系综合问题不同,本发明进一步探索了自然河系的数据表达形式。在矢量河系数据的基础上,构建以河段及其连接关系为基本要素的图结构,并根据不同空间分布模式的典型特征,从整体、局部、个体3个层面提取特征并实现参数化,将这些特征参数与河段一一建立映射关系,完成了矢量数据向图结构数据的转换,从而实现了以图数据形式存储自然河系的几何、拓扑特征,为后续深度学习的模型提供重要的数据支撑。
(3)数据驱动的空间分布模式挖掘。过去,地图要素的空间分布模式识别常采用专家知识指导下的规则制定策略以提取一定范围内的目标模式,具有很强的指向性。而本发明从数据本身的关系和特征出发,构建以图卷积、自注意力机制和多层全连接为支撑的深度学习模型,旨在挖掘不同空间分布模式潜在的特征差异,从而实现自然河系空间分布模式的识别。这不仅有助于解决传统方法难以处理的非线性问题,还能提高计算机的智能化水平,强化计算机在模拟人类思维方面的能力,从而促进制图综合进一步向自动化方向迈进。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于图卷积神经网络的河流模式识别方法,其特征在于,包括:
步骤1:在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
步骤2:从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
步骤3:基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
步骤4:基于构建的识别模型进行自然河系空间分布模式的识别。
2.根据权利要求1所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述步骤1还包括:
采用独热编码的方式对图进行标注,每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
3.根据权利要求1所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述步骤2包括:
步骤2.1:在整体层面,利用Horton编码对自然河系的整体层级进行划分,并对不同层级河段数量、长度进行统计;
步骤2.2:在局部流域层面,以河段及其上游组成的流域为统计单元,从流域伸长比、面积比、河流分布密度、发育平衡度方面对河系的区域特征进行描述;
步骤2.3:在河段个体层面,提取矢量线段的几何特征,包括长度、方向、曲折度、正交程度;
步骤2.4:将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河系图结构特征向量提取。
4.根据权利要求3所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述步骤2.1包括:
步骤2.1.1:通过拓扑运算获取首尾点重合的邻近河段,构建每条河段的邻接表,然后获得河系图整体的连通关系,即邻接矩阵;
步骤2.1.2:根据Horton编码对河系层级进行划分,即无分叉的顶端河段被定义为第一级,当两个及以上同等级的河流交汇后,下游的河段等级增加一级;当两个及以上不同等级的河流交汇时,下游的河段等级则于上游河段等级中的最大值保持一致,依次对河系内所有河段层级进行编码;
步骤2.1.3:根据层级对河段进行分组,获取每个层级的河段数量;
步骤2.1.4:根据层级对河段进行分组,获取每个层级河段的平均长度。
5.根据权利要求3所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述步骤2.4包括:
选择图节点、即河段作为所有特征项的映射对象,在整体特征项中,连通关系作为图结构的一个基本要素不计入特征矩阵,而各层级的统计值,包括长度,河段数量则采用共享参数值的方式分配给每个层级的对应河段;在局部流域特征项中,将该层次流域的特征值赋予给流域的末端河段;河段个体特征项则依次赋予给对应河段;按此方式,所有特征项均转换为与图节点一一映射的特征矩阵,从而实现矢量河系数据到图结构数据的转换。
6.根据权利要求1所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述数据输入层中,采用批处理方式以加快模型训练收敛的速度,提高模型训练效果;其次,对图数据中的特征矩阵统一进行归一化处理;每个图的邻接矩阵按照如下方式被转换为非标准化的拉普拉斯矩阵L,并包含了每个节点的自连接;同时按照图顺序对特征矩阵内节点进行排列;
Figure FDA0003508568680000021
其中
Figure FDA0003508568680000022
表示未加入节点自连接图邻接矩阵,I表示N维单位矩阵,N表示该图的节点数量,D表示邻接矩阵A的度矩阵;同时,所有节点的邻接关系亲疏一致,即邻接矩阵中存在节点邻接关系对应的像元值为1。
7.根据权利要求6所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述池化层中,按照如下方式为各图节点计算自注意力分数、即权重:
Z=σ(LHθatt+b) 式5
其中
Figure FDA0003508568680000031
表示卷积层的输出;
Figure FDA0003508568680000032
表示权重向量,初始是随机值,F′表示输出的维度;
Figure FDA0003508568680000033
表示随机偏差值;激活函数σ为tanh函数;
以图为单元,根据图内各节点的自注意力分数进行图内各节点Top-rank掩膜操作;
对剩余节点进行最大池化和平均池化操作,得到输出结果。
8.根据权利要求1所述的一种基于图卷积神经网络的河流模式识别方法,其特征在于,所述全连接分类层中包含2个隐藏层和1个输出层,每个隐藏层的计算如下:
h(l+1)=σ(h(l)W+b(l)) 式8
其中h(l)表示第l层的输入,W表示不同特征项的权重,b(l)表示第l层的偏差,激活函数σ为ReLU函数。
9.一种基于图卷积神经网络的河流模式识别装置,其特征在于,包括:
自然河系图结构数据构建模块,用于在矢量数据中,以河段为单元,通过河段首末点的重合表示河段相连的拓扑关系,构成河系的完整形态,将一个河系作为一个完整的图,将河段作为图节点,根据拓扑运算获得河段的连接关系,该连接关系则构成连接邻近节点的边,从而实现了自然河系图结构数据基本要素的构建;
特征向量提取模块,用于从全局、局部以及河段个体三个层面提取描述自然河系特征的参数,并将各参数与图结构中的基本要素建立映射关系,选择图节点、即河段作为所有特征项的映射对象,完成河流特征向量提取;
模式识别模型构建模块,用于基于提取的河流特征向量构建自然河系空间分布模式的神经网络识别模型,所述识别模型包括数据输入层,图卷积层,池化层和全连接分类层;包括:将空域图卷积方式引入深度学习模型,解除对图节点数量的约束;在池化层中,引入自注意力机制决定不同节点的权重,保留相对重要的特征信息;在全连接层,采用多层感知器的结构,增加模型深度,以提高模型的学习效果;
模式识别模块,用于基于构建的识别模型进行自然河系空间分布模式的识别。
10.根据权利要求9所述的一种基于图卷积神经网络的河流模式识别装置,其特征在于,所述自然河系图结构数据构建模块还用于采用独热编码的方式对图进行标注,每个图的类型标签都由一个六元组矩阵组成,每个元组对应每种自然河系空间分布模式,即像元值为1则表示该图属于对应空间分布模式,0则表示该图不属于对应空间分布模式。
CN202210146768.4A 2022-02-17 2022-02-17 一种基于图卷积神经网络的河流模式识别方法与装置 Active CN114549689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210146768.4A CN114549689B (zh) 2022-02-17 2022-02-17 一种基于图卷积神经网络的河流模式识别方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210146768.4A CN114549689B (zh) 2022-02-17 2022-02-17 一种基于图卷积神经网络的河流模式识别方法与装置

Publications (2)

Publication Number Publication Date
CN114549689A true CN114549689A (zh) 2022-05-27
CN114549689B CN114549689B (zh) 2022-11-29

Family

ID=81675828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210146768.4A Active CN114549689B (zh) 2022-02-17 2022-02-17 一种基于图卷积神经网络的河流模式识别方法与装置

Country Status (1)

Country Link
CN (1) CN114549689B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649602A (zh) * 2023-12-06 2024-03-05 燕东科技(广东)有限公司 基于人工智能的图像处理方法及系统
CN117649602B (zh) * 2023-12-06 2024-06-07 燕东科技(广东)有限公司 基于人工智能的图像处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315813A (zh) * 2017-06-29 2017-11-03 中国测绘科学研究院 一种stroke特征约束的树状河系层次关系构建及简化方法
US20200285944A1 (en) * 2019-03-08 2020-09-10 Adobe Inc. Graph convolutional networks with motif-based attention
CN112270266A (zh) * 2020-10-29 2021-01-26 中国测绘科学研究院 多特征约束的网状河流主流识别方法
CN112733602A (zh) * 2020-12-07 2021-04-30 北京航空航天大学 关系引导的行人属性识别方法
CN114021433A (zh) * 2021-10-22 2022-02-08 华中科技大学 一种电力系统的主导失稳模式识别模型的构建方法及应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315813A (zh) * 2017-06-29 2017-11-03 中国测绘科学研究院 一种stroke特征约束的树状河系层次关系构建及简化方法
US20200285944A1 (en) * 2019-03-08 2020-09-10 Adobe Inc. Graph convolutional networks with motif-based attention
CN112270266A (zh) * 2020-10-29 2021-01-26 中国测绘科学研究院 多特征约束的网状河流主流识别方法
CN112733602A (zh) * 2020-12-07 2021-04-30 北京航空航天大学 关系引导的行人属性识别方法
CN114021433A (zh) * 2021-10-22 2022-02-08 华中科技大学 一种电力系统的主导失稳模式识别模型的构建方法及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIONGFENG YAN 等: "A graph convolutional neural network for classification of building patterns", 《ELSEVIER》 *
令振飞 等: "样本数量不平衡下的建筑群模式识别方法研究", 《地球信息科学学报》 *
李成名等: "Sroke特征约束的树状河系层次关系构建及简化方法", 《测绘学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649602A (zh) * 2023-12-06 2024-03-05 燕东科技(广东)有限公司 基于人工智能的图像处理方法及系统
CN117649602B (zh) * 2023-12-06 2024-06-07 燕东科技(广东)有限公司 基于人工智能的图像处理方法及系统

Also Published As

Publication number Publication date
CN114549689B (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
CN109508360B (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN104077613B (zh) 一种基于级联多级卷积神经网络的人群密度估计方法
CN107229904A (zh) 一种基于深度学习的目标检测与识别方法
CN110532859A (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN110334705A (zh) 一种结合全局和局部信息的场景文本图像的语种识别方法
CN116108758B (zh) 滑坡易发性评价方法
CN109241834A (zh) 一种基于隐变量的嵌入的群体行为识别方法
CN109165743A (zh) 一种基于深度压缩自编码器的半监督网络表示学习算法
CN109784283A (zh) 基于场景识别任务下的遥感图像目标提取方法
CN114170533A (zh) 基于注意力机制和多模态表征学习的滑坡识别方法及系统
CN109767312A (zh) 一种信用评估模型训练、评估方法与装置
Fisichella et al. Can deep learning improve technical analysis of forex data to predict future price movements?
CN109919112B (zh) 一种复杂场景中流动人群的分布与计数检测的方法
CN112766283B (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN113159067A (zh) 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置
CN109635726A (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN108364073A (zh) 一种多标记学习方法
CN115965864A (zh) 一种用于农作物病害识别的轻量级注意力机制网络
Manzari et al. A robust network for embedded traffic sign recognition
Murugan et al. A novel CNN method for the accurate spatial data recovery from digital images
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN114549689B (zh) 一种基于图卷积神经网络的河流模式识别方法与装置
CN117034060A (zh) 基于ae-rcnn的洪水分级智能预报方法
CN116662468A (zh) 基于地理对象空间模式特征的城市功能区识别方法及系统
CN110378880A (zh) 基于视觉的火化机燃烧时间计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant