CN117034116A - 一种基于机器学习的传统村落空间类型识别的方法 - Google Patents
一种基于机器学习的传统村落空间类型识别的方法 Download PDFInfo
- Publication number
- CN117034116A CN117034116A CN202311018705.1A CN202311018705A CN117034116A CN 117034116 A CN117034116 A CN 117034116A CN 202311018705 A CN202311018705 A CN 202311018705A CN 117034116 A CN117034116 A CN 117034116A
- Authority
- CN
- China
- Prior art keywords
- village
- traditional
- space
- traditional village
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000010801 machine learning Methods 0.000 title claims abstract description 38
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 230000004913 activation Effects 0.000 claims abstract description 13
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012876 topography Methods 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000011835 investigation Methods 0.000 claims description 6
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims 1
- 238000005303 weighing Methods 0.000 claims 1
- 230000006872 improvement Effects 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于机器学习的传统村落空间类型识别的方法,包括以下步骤:S1:建立传统村落空间要素数据采集与基本信息数据库;S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;S3:采用监督机器学习算法划分传统村落空间类型;S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型;S5:搭建传统村落空间类型自动识别与分析平台。该技术方案通过机器学习算法及BP神经网络综合解决了传统村落空间特征提取、传统村落空间类型划分及传统村落空间类型识别等问题,更加客观地分析提取各个传统村落的空间特征及其类型,进而有针对性地制定活态化保护策略,在提升利用效率的同时保护传统村落的空间特色。
Description
技术领域
本发明涉及一种方法,具体涉及一种基于机器学习的传统村落空间类型识别的方法,属于建筑学、城乡规划学科体系下的传统村落保护利用技术领域。
背景技术
我国幅员辽阔、文化深厚,不同地域、文化背景下的传统村落呈现出不同的空间特征。然而在快速城镇化背景下,大量传统村落面临城市发展的持续冲击,其地域特色逐渐丧失,同时也造成一系列的人居环境品质低下问题。因此,需要对传统村落进行分类指导,保留其传统风貌特色。
目前学界主要通过大量绘制传统村落各种分析图的方式,依据多年的研究经验通过人工方式分析传统村落的空间特征,划分空间类型,如绘制景观基因谱系或空间基因图谱以探讨统村落的空间形态及空间组合关系。虽然此类方法可视化程度高,便于设计人员对于形态的图示化认知,但在面对大容量样本时,存在分析难度大、人力成本高、耗费时间长、分析结果精确度下降等诸多问题,且存在方法应用的地域局限性,无法广泛、快速地推广以应对传统村落风貌特色日益消亡的社会背景。因此,迫切需要一种新的技术方案用以解决上述问题,更为有效地分析传统村落的空间类型。
发明内容
本发明正是针对现有技术中存在的不足,提供一种基于机器学习的传统村落空间类型识别的方法,该技术方案通过机器学习算法及BP神经网络综合解决了传统村落空间特征提取、传统村落空间类型划分及传统村落空间类型识别等问题,形成一种基于机器学习的传统村落空间类型的识别方法与分析系统,以获取数据样本蕴含的内在规律,更为客观地分析提取各传统村落的空间特征及其类型,从而有针对性地制定活态化保护策略,在提升利用效率的同时保护传统村落的空间特色。
为了实现上述目的,本发明的技术方案如下,一种基于机器学习的传统村落空间类型识别的方法,所述方法包括以下步骤:
S1:建立传统村落空间要素数据采集与基本信息数据库;
S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;
S3:采用监督机器学习算法划分传统村落空间类型;
S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型;
S5:搭建传统村落空间类型自动识别和分析平台。
作为本发明的一种改进,S1:建立传统村落空间要素数据采集与基本信息数据库,具体如下:
S1.1:采用层次分析法(AHP)构建传统村落空间特征识别指标体系,所述指标体系包含山体、水系、林地、田地、村落、道路、建筑等空间要素属性指标、空间形态描绘指标及空间要素关系指标;所述传统村落空间特征识别指标至少包括地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系、建筑组合关系等;
S1.2:通过田野调查、文献调查、档案查询等方式获取传统村落地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系、建筑组合关系等数据;
S1.3:采用插值法对缺失值、异常值及不一致的值进行数据清洗,并初步进行数据探索,分析指标之间的相关性,从而建立传统村落空间类型信息数据库;
作为本发明的一种改进,S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;具体如下:
S2.1:进行KMO和巴特利特球形度检验,满足条件为KMO>0.5且巴特利特球形检验值p<0.05;未满足条件的传统村落空间数据应返回S1.3步骤进行数据清洗与数据探索,满足条件的传统村落空间数据进入下一步数据分析步骤;
S2.2:采用最大方差法计算各主成分的方差解释,选取总方差解释量大于80%的主成分;
S2.3:根据各主成分所对应的显著指标,进一步解释各主成分性质,定义所提取的空间特征,从而识别传统村落空间特征;
作为本发明的一种改进,S3:采用监督机器学习算法划分传统村落空间类型;具体如下:S3.1:计算样本数据的误差平方和(SSE),绘制SSE手肘图,确定传统村落聚类数量k值。SSE数值越小表征簇内聚合程度越高,但应控制选取的聚类数量(k值),权衡聚类数量及其所表征的数据信息,以合理划分传统村落的空间类型。SSE计算公式如下:
其中k是聚类簇的数量,ξ是ωi中的样本,ωi是传统村落数据库第i个聚类簇,mi是Ci的质心,即第i个聚类簇中样本的均值;
S3.2:设定算法聚类目标,即设定纯度(Purity)、兰德系数(Rand Index,RI)、F值(F-score)等表征聚类效果的参数阈值,选取满足参数设定要求的聚类结果。Purity计算公式如下:
其中N是数据库样本量,是Ω={ω1,ω2,…,ωk}是传统村落聚类簇集合,ωi是第i个聚类簇集合,C={c1,c2…cj}是真实传统村落聚类簇集合,cj是第j个真实传统村落聚类簇集合,Purity取值[0,1],越大表示聚类效果越好;该计算过程可由SPSS或Python编程计算完成;
S3.3:结合S2.2特征提取结果,绘制传统村落簇集合的空间特征得分雷达图,分析各传统村落聚类簇集合对应的显著空间特征,划分各传统村落簇集合所对应传统村落的空间类型。
作为本发明的一种改进,S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型,具体如下:
S4.1:结合S2.2、S2.3及S3.3计算结果,更新传统村落空间类型信息数据库,添加传统村落空间类型标签;
S4.2:构建K近邻分类(KNN)、决策树(ID3)、神经网络(BP)、朴素贝叶斯(NBM)、随机森林(RF)和梯度提升机(GBM)算法模型,设定合适的激活函数、隐藏层数量、神经元数量等;
S4.3:划分传统村落空间类型信息数据库为训练集、验证集及测试集,分别训练上述不同算法模型并进行参数调整;
S4.4:比对多种算法模型的计算准确率、精确率及召回率,以最优算法模型为基础,参考其他算法模型结果,输出传统村落空间类型识别结果的最优算法。
作为本发明的一种改进,S5:搭建传统村落空间类型自动识别和分析平台,具体如下:S5.1:以S1~4的分析结果及算法搭建传统村落空间类型分析平台,创建待分析传统村落信息输入、传统村落空间要素特征分析、传统村落空间类型识别及同类传统村落查询等功能;
S5.2:输入待分析传统村落信息至传统村落空间类型识别和分析平台,分析传统村落空间特征、识别传统村落类型及查询同类传统村落;
S5.3:输出待分析传统村落空间类型分析结果,所获得传统村落空间类型及各特征表现结果为相关政策、活化策略及设计方法制定提供依据。
相对于现有技术,本发明具有如下优点,本发明旨在提供一种基于机器学习的传统村落空间类型识别的方法与系统,经传统村落基础信息采集、清洗及输入,通过多种机器学习算法及神经网络模型搭建、训练及运算,综合解决了传统村落空间特征提取、传统村落空间类型划分及传统村落空间类型识别等问题,获得传统村落空间类型分析结果;
其中传统村落空间特征提取,类型划分及类型识别三大模块计算结果环环相扣,特征提取模块为类型划分模块提供划分依据,类型划分模块为类型识别模块提供数据基础,类型识别模块结果反馈修正特征提取模块及类型划分模块。
本方法的优点:
1、本发明通过对空间要素属性、空间关系、空间形态等传统村落基础信息采集,根据指标标准进行数据整理,初步建立传统村落空间类型信息数据库,为传统村落活态化保护提供基础信息和数据支撑;
2、传统村落空间特征提取模块简化现阶段繁杂的指标体系,通过主成分分析等算法识别并提取传统村落空间的核心特征,减少人为因素影响,利于准确地把握传统村落空间特征,针对性促进村落的活态化保护利用;
3、传统村落空间特征提取模块通过特征变换,采用缩放的方差解释率为特征权重,获得空间特征识别结果,包括计算传统村落空间特征综合识别结果及其各空间特征表现,揭示不同指标的权重分级及传统村落重要性顺序,利于各个传统村落活态化保护更新次序的排布,便于有限的活化资金的有效利用;
4、传统村落空间类型划分模块通过指标特征表现,以数理关系为基础,选取误差平方和的突变值并进行k-means聚类分析,结合不同聚类簇集合中传统村落在所识别的空间特征中的显著情况,获得传统村落空间类型划分结果,为传统村落活态化保护策略有效制定提供了数据分析的支持;
5、传统村落空间类型识别模块以特征提取与类型划分结果为数据基础,训练机器学习及神经网络模型,综合识别传统村落空间类型,分析传统村落空间类型及特征。传统村落空间类型识别模块可将传统村落空间特征提取模块及传统村落空间类型花费模块中已有的分析结果更为广泛地应用于非样本数据村落,从而拓展本方法可应用传统村落的广度,具有良好的生长性;
6、本发明所搭建传统村落类型自动识别和分析平台,可通过输入传统村落信息可实现快速提取传统村落空间特征、识别传统村落类型及查询同类传统村落等功能。相比于现有的基于景观基因谱系等分析传统空间特征及划分空间类型的方法,本方法可快速获得空间类型及特征表现结果。随着平台使用过程中样本数据量不断增加,其精确性也随之不断上升。且不同于一般针对具体地域的方法,本方法基于传统村落空间数据的数理关系探究获得一般的传统村落特征,其可应用的传统村落范围广、适用性强;
7、本发明的一种基于机器学习算法的传统村落空间类型识别的方法与系统,具有良好的拓展性,其表现为可根据所需解决的传统村落空间分析问题,调整所构建的传统村落指标体系,采集相应的传统村落空间数据,从而基于数理关系获得相关分析结果。
附图说明
图1传统村落空间类型识别与分析模块组合关系图;
图2传统村落空间类型识别与分析系统流程图;
图3传统村落空间特征识别指标体系;
图4传统村落空间类型自动识别与分析平台界面。
具体实施方式
为了加深对本发明的理解,下面结合附图对本实施例做详细的说明。
实施例1:参见图1-图4,一种基于机器学习的传统村落空间类型识别的方法与系统,包括以下步骤:
S1:建立传统村落空间要素数据采集与基本信息数据库;
S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;
S3:采用监督机器学习算法划分传统村落空间类型;
S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型;
S5:搭建传统村落空间类型自动识别和分析平台;
进一步地,所述S1步骤具体是:
S1.1:采用层次分析法(AHP)构建传统村落空间特征识别指标体系;如图3所示,指标体系包含山体、水系、林地、田地、村落、道路、建筑等空间要素属性指标、空间形态描绘指标及空间要素关系指标;所述传统村落空间特征识别指标至少包括地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系、建筑组合关系等;
S1.2:通过田野调查、文献调查、档案查询等方式获取传统村落地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系、建筑组合关系等数据;
S1.3:采用插值法对缺失值、异常值及不一致的值进行数据清洗,并初步进行数据探索,分析指标之间的相关性,从而建立传统村落空间类型信息数据库;
进一步地,所述S2步骤具体是:
S2.1:进行KMO和巴特利特球形度检验,满足条件为KMO>0.5且巴特利特球形检验值p<0.05;未满足条件的传统村落空间数据应返回S1.3步骤进行数据清洗与数据探索,满足条件的传统村落空间数据进入下一步数据分析步骤;
S2.2:采用最大方差法计算各主成分的方差解释,选取总方差解释量大于80%的主成分,从而识别传统村落空间特征;
S2.3:根据各主成分所对应的显著指标,进一步解释各主成分性质,定义所提取的空间特征;
进一步地,所述S3步骤具体是:
S3.1:计算样本数据的误差平方和(SSE),绘制SSE手肘图,确定传统村落聚类数量k值。SSE数值越小表征簇内聚合程度越高,但应控制选取的聚类数量(k值),权衡聚类数量及其所表征的数据信息,以合理划分传统村落的空间类型。SSE计算公式如下:
其中k是聚类簇集合的数量,ξ是ωi中的样本,ωi是传统村落数据库第i个聚类簇集合,mi是Ci的质心,即第i个聚类簇集合中样本的均值;
S3.2:设定算法聚类目标,即设定纯度(Purity)、兰德系数(Rand Index,RI)、F值(F-score)等表征聚类效果的参数阈值,选取满足参数设定要求的聚类结果。其中Purity的计算公式如下:
其中N是数据库样本量,是Ω={ω1,ω2,…,ωk}是传统村落聚类簇集合,ωi是第i个聚类簇集合,C={c1,c2…cj}是真实传统村落聚类簇集合,cj是第j个真实传统村落聚类簇集合,Purity取值[0,1],越大表示聚类效果越好;该计算过程可由SPSS或Python编程计算完成;
S3.3:结合S2.2特征提取结果,绘制传统村落簇集合的空间特征得分雷达图,分析各传统村落聚类簇集合对应的显著空间特征,划分各传统村落簇集合所对应传统村落的空间类型;
进一步地,所述S4步骤具体是:
S4.1:结合S2.2、S2.3及S3.3计算结果,更新传统村落空间类型信息数据库,添加传统村落空间类型标签;
S4.2:构建K近邻分类(KNN)、决策树(ID3)、神经网络(BP)、朴素贝叶斯(NBM)、随机森林(RF)和梯度提升机(GBM)算法模型,设定合适的激活函数、隐藏层数量、神经元数量等;
S4.3:划分传统村落空间类型信息数据库为训练集、验证集及测试集,分别训练上述不同算法模型并进行参数调整;
S4.4:比对多种算法模型的计算准确率、精确率及召回率,以最优算法模型为基础,参考其他算法模型结果,输出传统村落空间类型识别结果的最优算法;
进一步地,所述S5步骤具体是:
S5.1:以S1~4的分析结果及算法搭建传统村落空间类型分析平台,创建待分析传统村落信息输入、传统村落空间要素特征分析、传统村落空间类型识别及同类传统村落查询等功能;
S5.2:输入待分析传统村落信息至传统村落空间类型识别和分析平台,分析传统村落空间特征、识别传统村落类型及查询同类传统村落;
S5.3:输出待分析传统村落空间类型分析结果,所获得传统村落空间类型及各特征表现结果为相关政策、活化策略及设计方法制定提供依据;
需要说明的是上述实施例,并非用来限定本发明的保护范围,在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。
Claims (6)
1.一种基于机器学习的传统村落空间类型识别的方法,其特征在于,所述方法包括以下步骤:
S1:建立传统村落空间要素数据采集与基本信息数据库;
S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;
S3:采用监督机器学习算法划分传统村落空间类型;
S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型;
S5:搭建传统村落空间类型自动识别与分析平台。
2.根据权利要求1所述的基于机器学习的传统村落空间类型识别的方法,其特征在于,S1:建立传统村落空间要素数据采集与基本信息数据库,具体如下:
S1.1:采用层次分析法(AHP)构建传统村落空间特征识别指标体系;所述指标体系包含山体、水系、林地、田地、村落、道路、建筑空间要素属性指标、空间形态描绘指标及空间要素关系指标;传统村落空间特征识别指标至少包括地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系、建筑组合关系;
S1.2:通过田野调查、文献调查、档案查询方式获取传统村落的地形类型、村山关系、水系类型、河道宽度、村水关系、村林关系、村田关系、用地规模、平均高程、坡度、朝向、形状指数、平面形态、立面形态、道路结构、路网与水网关系、建筑密度、建筑与地形关系以及建筑组合关系基础数据;
S1.3:采用插值法对缺失值、异常值及不一致的值进行数据清洗,并初步进行数据探索,分析指标之间的相关性,从而建立传统村落空间类型信息数据库。
3.根据权利要求2所述的基于机器学习的传统村落空间类型识别的方法,其特征在于,S2:采用非监督机器学习算法进行传统村落空间特征识别与提取;具体如下:
S2.1:进行KMO和巴特利特球形度检验,满足条件为KMO>0.5且巴特利特球形检验值p<0.05;未满足条件的传统村落空间数据应返回S1.3步骤进行数据清洗与数据探索,满足条件的传统村落空间数据进入下一步数据分析步骤;
S2.2:采用最大方差法计算各主成分的方差解释,选取总方差解释量大于80%的主成分,从而识别传统村落空间特征;
S2.3:根据各主成分所对应的显著指标,进一步解释各主成分性质,定义所提取的空间特征。
4.根据权利要求3所述的基于机器学习的传统村落空间类型识别的方法,其特征在于,S3:采用监督机器学习算法划分传统村落空间类型;具体如下:
S3.1:计算样本数据的误差平方和(SSE),绘制SSE手肘图,确定传统村落聚类数量k值,权衡聚类数量及其所表征的数据信息,以合理划分传统村落的空间类型,SSE计算公式如下:
其中k是聚类簇集合的数量,ξ是ωi中的样本,ωi是传统村落数据库第i个聚类簇集合,mi是Ci的质心,即第i个聚类簇集合中样本的均值;
S3.2:设定算法聚类目标,即设定纯度(Purity)、兰德系数(Rand Index,RI)、F值(F-score)表征聚类效果的参数阈值,选取满足参数设定要求的聚类结果,其中Purity的计算公式如下:
其中N是数据库样本量,是Ω={ω1,ω2,…,ωk}是传统村落聚类簇集合,ωi是第i个聚类簇集合,C={c1,c2…cj}是真实传统村落聚类簇集合,cj是第j个真实传统村落聚类簇集合,Purity取值[0,1],越大表示聚类效果越好;该计算过程可由SPSS或Python编程计算完成;
S3.3:结合S2.2特征提取结果,绘制传统村落簇的空间特征得分雷达图,分析各传统村落聚类簇集合对应的显著空间特征,划分各传统村落簇集合所对应传统村落集合的空间类型。
5.根据权利要求3或4所述的基于机器学习的传统村落空间类型识别的方法,其特征在于,S4:结合监督机器学习算法及神经网络模型识别传统村落空间类型,具体如下:
S4.1:结合S2.2、S2.3及S3.3计算结果,更新传统村落空间类型信息数据库,添加传统村落空间类型标签;
S4.2:构建K近邻分类(KNN)、决策树(ID3)、神经网络(BP)、朴素贝叶斯(NBM)、随机森林(RF)和梯度提升机(GBM)算法模型,设定合适的激活函数、隐藏层数量、神经元数量;
S4.3:划分传统村落空间类型信息数据库为训练集、验证集及测试集,分别训练上述不同算法模型并进行参数调整;
S4.4:比对多种算法模型的计算准确率、精确率及召回率,以最优算法模型为基础,参考其他算法模型结果,输出传统村落空间类型识别结果的最优算法。
6.根据权利要求5所述的基于机器学习的传统村落空间类型识别方法,其特征在于,S5:搭建传统村落空间类型自动识别与分析平台,具体如下:
S5.1:以S1~4的分析结果及算法搭建传统村落空间类型分析平台,创建待分析传统村落信息输入、传统村落空间要素特征分析、传统村落空间类型识别及同类传统村落查询功能;
S5.2:输入待分析传统村落信息至传统村落空间类型识别与分析平台,分析传统村落空间特征、识别传统村落类型及查询同类传统村落;
S5.3:输出待分析传统村落空间类型分析结果,所获得传统村落空间类型结果及各特征表现结果,为相关政策、活化策略及设计方法制定提供依据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311018705.1A CN117034116A (zh) | 2023-08-11 | 2023-08-11 | 一种基于机器学习的传统村落空间类型识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311018705.1A CN117034116A (zh) | 2023-08-11 | 2023-08-11 | 一种基于机器学习的传统村落空间类型识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117034116A true CN117034116A (zh) | 2023-11-10 |
Family
ID=88624056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311018705.1A Pending CN117034116A (zh) | 2023-08-11 | 2023-08-11 | 一种基于机器学习的传统村落空间类型识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117034116A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935062A (zh) * | 2024-03-22 | 2024-04-26 | 中国电建集团西北勘测设计研究院有限公司 | 村落图像的收集及评估系统、方法 |
CN118332144A (zh) * | 2024-04-17 | 2024-07-12 | 昆明理工大学 | 基于循环证析的传统村落空间数据库建构方法 |
-
2023
- 2023-08-11 CN CN202311018705.1A patent/CN117034116A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935062A (zh) * | 2024-03-22 | 2024-04-26 | 中国电建集团西北勘测设计研究院有限公司 | 村落图像的收集及评估系统、方法 |
CN118332144A (zh) * | 2024-04-17 | 2024-07-12 | 昆明理工大学 | 基于循环证析的传统村落空间数据库建构方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117034116A (zh) | 一种基于机器学习的传统村落空间类型识别的方法 | |
CN108399748B (zh) | 一种基于随机森林与聚类算法的道路旅行时间预测方法 | |
WO2018045642A1 (zh) | 一种母线负荷预测方法 | |
CN111914611B (zh) | 城市绿地高分遥感监测方法与系统 | |
CN110738247B (zh) | 一种基于选择性稀疏采样的细粒度图像分类方法 | |
CN110807760B (zh) | 一种烟叶分级方法及系统 | |
CN110377605B (zh) | 一种结构化数据的敏感属性识别与分类分级方法 | |
Yi et al. | An improved initialization center algorithm for K-means clustering | |
CN109492796A (zh) | 一种城市空间形态自动分区方法与系统 | |
CN110097060A (zh) | 一种面向树干图像的开集识别方法 | |
CN114564982A (zh) | 雷达信号调制类型的自动识别方法 | |
CN109558467A (zh) | 用电用户类别识别方法及系统 | |
Yu et al. | A recognition method of soybean leaf diseases based on an improved deep learning model | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN113988198B (zh) | 一种基于地标约束的多尺度城市功能分类方法 | |
CN114239962A (zh) | 一种基于开源信息的精细化空间负荷预测方法 | |
CN112149556B (zh) | 一种基于深度互学习和知识传递的人脸属性识别方法 | |
CN115273645B (zh) | 一种室内面要素自动聚类的地图制图方法 | |
CN109409394A (zh) | 一种基于半监督聚类的cop-kmeans方法与系统 | |
CN112348360A (zh) | 一种基于大数据技术的中药生产工艺参数分析系统 | |
CN108446740B (zh) | 一种用于脑影像病历特征提取的多层一致协同方法 | |
CN103336781B (zh) | 一种医学图像聚类方法 | |
CN115546179A (zh) | 基于优化模糊深度网络的林木胸径材积精准预测方法 | |
CN116386034A (zh) | 一种基于多尺度注意力特征增强的宫颈细胞分类方法 | |
CN115115943A (zh) | 一种基于单期遥感影像的地物信息提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |