CN117933748A - 一种基于机器学习的城市土地利用规划方法及系统 - Google Patents
一种基于机器学习的城市土地利用规划方法及系统 Download PDFInfo
- Publication number
- CN117933748A CN117933748A CN202410100791.9A CN202410100791A CN117933748A CN 117933748 A CN117933748 A CN 117933748A CN 202410100791 A CN202410100791 A CN 202410100791A CN 117933748 A CN117933748 A CN 117933748A
- Authority
- CN
- China
- Prior art keywords
- data
- urban land
- individual
- adaptive
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000010801 machine learning Methods 0.000 title claims abstract description 20
- 230000006870 function Effects 0.000 claims abstract description 44
- 230000003044 adaptive effect Effects 0.000 claims abstract description 37
- 238000005315 distribution function Methods 0.000 claims abstract description 27
- 230000001186 cumulative effect Effects 0.000 claims abstract description 26
- 238000012937 correction Methods 0.000 claims abstract description 23
- 230000000739 chaotic effect Effects 0.000 claims abstract description 12
- 238000010276 construction Methods 0.000 claims abstract description 12
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 238000013461 design Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 25
- 230000002159 abnormal effect Effects 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 3
- 238000012876 topography Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims 1
- 230000005856 abnormality Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于机器学习的城市土地利用规划方法及系统,方法包括:数据采集、城市土地数据异常处理、构建城市土地利用规划模型、模型参数搜索和城市土地利用规划。本发明属于土地利用规划技术领域,具体是指一种基于机器学习的城市土地利用规划方法及系统,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据;调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建;使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新。
Description
技术领域
本发明属于土地利用规划技术领域,具体是指一种基于机器学习的城市土地利用规划方法及系统。
背景技术
城市土地利用规划是对城市土地资源进行科学合理布局和利用,提高土地利用效率,促进城市可持续发展。但是采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题;现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题;现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供了一种基于机器学习的城市土地利用规划方法及系统,针对采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,更准确地衡量数据的分布情况和偏斜程度,从而更好地判断数据的异常程度,保证选择数据集的质量和可靠性;针对现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题,本方案引入差值控制量和加权变量设计差值损失函数,增强模型的准确性,使其更好地适应城市土地利用规划任务;针对现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题,本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置,保证个体的位置分布较为均匀,并基于自适应影响力构建个体的自适应邻里组,能够利用邻居间的信息交流来提升搜索效果,基于修正因子进行位置更新,通过修正因子调整个体位置的变化,在一定程度上控制位置的变化幅度,避免过大或过小的变化,提高搜索效率和全局搜索能力,提高城市土地利用规划的效果。
本发明采取的技术方案如下:本发明提供的一种基于机器学习的城市土地利用规划方法,该方法包括以下步骤:
步骤S1:数据采集,采集城市土地数据和利用类型;
步骤S2:城市土地数据异常处理,计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据;
步骤S3:构建城市土地利用规划模型,调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建;
步骤S4:模型参数搜索,使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新;
步骤S5:城市土地利用规划,基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
进一步地,在步骤S1中,所述数据采集是采集城市土地数据和利用类型,城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据,利用类型包括商业区、工业区、公共区、住宅区和景观区,将利用类型作为数据标签。
进一步地,在步骤S2中,所述城市土地数据异常处理具体包括以下步骤:
步骤S21:预处理,对采集的数据进行归一化、去除噪声和缺失值处理,基于预处理后的数据构建土地数据处理集A;
步骤S22:计算经验累积分布函数,对于第d1个特征的边界值b,计算在土地数据处理集A中小于等于b的比例和大于等于b的比例,得到第一经验累积分布函数和第二经验累积分布函数,所用公式如下:
;
;
式中,1{}是指示函数,当其参数为真时为1,否则为0;是第d1个特征的第一经验累积分布函数,/>是第d1个特征的第二经验累积分布函数,/>是土地数据处理集A中第n1个数据的第d1个特征的值,b是边界值,d1是数据的特征索引,N1是土地数据处理集A中的数据数量,D1是数据的特征数量,n1是土地数据处理集A中的数据索引;
步骤S23:计算偏度系数,基于第d1个特征的所有数据的平均值得到偏度系数,所用公式如下:
;
;
式中,是第d1个特征的偏度系数,/>是第d1个特征的数据平均值;
步骤S24:计算异常得分,分别基于第一经验累积分布函数、第二经验累积分布函数和偏度系数得到三种异常得分,所用公式如下:
;
;
;
式中,是/>的第一异常得分,/>是/>的第二异常得分,/>是的第三异常得分;
步骤S25:计算最终异常得分,预先设定第一异常得分的权重γ1、第二异常得分的权重γ2和第三异常得分的权重γ3,所用公式如下:
;
式中,是/>的最终异常得分;
步骤S26:删除异常数据,预先设定异常阈值β,当≥β时,则将该/>数据识别为异常数据并删除;否则,将其保留,从最后保留的数据中随机选取70%的数据构建训练数据集,基于剩余30%的数据构建测试数据集。
进一步地,在步骤S3中,所述构建城市土地利用规划模型具体包括以下步骤:
步骤S31:模型训练,利用python导入sklearn库调用SVM函数,基于训练数据集完成模型训练;
步骤S32:设计差值损失函数,将测试数据集输入模型中,基于损失值设计差值损失函数,所用公式如下:
;
;
式中,Lossc是第c个样本数据的损失值,Hc是第c个样本数据的真实标签,是第c个样本数据的模型输出标签,K是差值控制量,Ψ是加权变量,c是样本数据的索引,Nxl是测试数据集的样本数据数量,Losszh是差值损失函数。
进一步地,在步骤S4中,所述模型参数搜索具体包括以下步骤:
步骤S41:初始化个体位置,用个体位置是模型参数的代表,在[0,1]范围内随机生成一个位置初始值G0,基于引入自适应因子改进的帐篷混沌映射函数初始化个体位置,所用公式如下:
;
式中,Gi是第i个个体的初始化位置,Gi-1是第i-1个个体的初始化位置,i是个体的索引,NG是个体总数量,ε是自适应因子;
步骤S42:计算个体的自适应影响力,将城市土地利用规划模型性能作为个体的适应度值,按照适应度值从大到小的顺序进行排序,根据个体在排序中的位置和适应度值,计算每个个体在所有个体中的相对影响力大小,计算个体的自适应影响力所用公式如下:
;
式中,YXp(t)是第t次迭代时第p个个体的自适应影响力,即第t次迭代时第p个个体在所有个体中的相对影响力大小,p是排序后的个体索引即个体排名,Sp(t)是第t次迭代时第p个个体的适应度值,t是迭代索引;
步骤S43:构建个体的自适应邻里组,预先设定邻里阈值,根据邻里阈值/>,判断每对个体之间的自适应邻里关系,若YXp(t)或YXq(t)中有一个大于邻里阈值/>,则将个体p和个体q之间的自适应邻里关系记为1;否则,将个体p和个体q之间的自适应邻里关系记为0,基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Zp(t);其中,YXq(t)是第t次迭代时第q个个体的自适应影响力,q是不等于p的排序后的个体索引;
步骤S44:基于修正因子进行位置更新,为每个个体随机生成一个位置更新策略选择值hp,基于修正因子进行位置更新所用公式如下:
;
;
;
式中,Gp(t)是第t+1次迭代时第p个个体的位置,是第一修正因子,/>是第二修正因子,j是自适应邻里组Zp(t)中的个体索引,Np是自适应邻里组Zp(t)中的个体数量,Ej是第j个个体在自适应邻里组Zp(t)中的权重,r是更新随机值,Gj(t)是第t次迭代时自适应邻里组Zp(t)中第j个个体的位置;
步骤S45:参数确定,预先设定适应度阈值σ和最大迭代次数T,更新个体的适应度值,当最高适应度值大于适应度阈值σ时,则基于当前模型参数构建城市土地利用规划模型;否则,若达到最大迭代次数T,则转至步骤S41;否则转至步骤S42。
进一步地,在步骤S5中,所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据,预处理后输入至城市土地利用规划模型中进行规划,根据模型输出的数据标签对城市土地的利用类型进行合理规划。
本发明提供的一种基于机器学习的城市土地利用规划系统,包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块;
所述数据采集模块采集城市土地数据和利用类型,并将数据发送到城市土地数据异常处理模块;
所述城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,并将数据发送至构建城市土地利用规划模型模块;
所述构建城市土地利用规划模型模块调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建,并将数据发送至模型参数搜索模块;
所述模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新,完成参数搜索,并将数据发送至城市土地利用规划模块;
所述城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
采用上述方案本发明取得的有益效果如下:
(1)针对采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,更准确地衡量数据的分布情况和偏斜程度,从而更好地判断数据的异常程度,保证选择数据集的质量和可靠性。
(2)针对现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题,本方案引入差值控制量和加权变量设计差值损失函数,增强模型的准确性,使其更好地适应城市土地利用规划任务,并减少模型对训练数据的过度拟合,提高模型的泛化能力,可以加快模型的收敛速度,使模型更快地达到较好的性能。
(3)针对现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题,本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置,保证个体的位置分布较为均匀,增加搜索空间的覆盖率,并基于自适应影响力构建个体的自适应邻里组,能够利用邻居间的信息交流来提升搜索效果,基于修正因子进行位置更新,通过修正因子调整个体位置的变化,在一定程度上控制位置的变化幅度,避免过大或过小的变化,提高搜索效率和全局搜索能力,既保持搜索的多样性,又提升搜索的精细度和效率,优化模型性能,提高城市土地利用规划的效果。
附图说明
图1为本发明提供的一种基于机器学习的城市土地利用规划方法的流程示意图;
图2为本发明提供的一种基于机器学习的城市土地利用规划系统的示意图;
图3为步骤S2的流程示意图;
图4为步骤S4的流程示意图。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例一,参阅图1,本发明提供的一种基于机器学习的城市土地利用规划方法,该方法包括以下步骤:
步骤S1:数据采集,采集城市土地数据和利用类型,将利用类型作为数据标签;
步骤S2:城市土地数据异常处理,计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据;
步骤S3:构建城市土地利用规划模型,调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建;
步骤S4:模型参数搜索,使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新;
步骤S5:城市土地利用规划,基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
实施例二,参阅图1,该实施例基于上述实施例,在步骤S1中,数据采集是采集城市土地数据和利用类型,城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据,利用类型包括商业区、工业区、公共区、住宅区和景观区,将利用类型作为数据标签。
实施例三,参阅图1和图3,该实施例基于上述实施例,在步骤S2中,城市土地数据异常处理具体包括以下步骤:
步骤S21:预处理,对采集的数据进行归一化、去除噪声和缺失值处理,基于预处理后的数据构建土地数据处理集A;
步骤S22:计算经验累积分布函数,对于第d1个特征的边界值b,计算在土地数据处理集A中小于等于b的比例和大于等于b的比例,得到第一经验累积分布函数和第二经验累积分布函数,所用公式如下:
;
;
式中,1{}是指示函数,当其参数为真时为1,否则为0;是第d1个特征的第一经验累积分布函数,/>是第d1个特征的第二经验累积分布函数,/>是土地数据处理集A中第n1个数据的第d1个特征的值,b是边界值且b∈R,R是实数域,d1是数据的特征索引,N1是土地数据处理集A中的数据数量,D1是数据的特征数量,n1是土地数据处理集A中的数据索引;
步骤S23:计算偏度系数,基于第d1个特征的所有数据的平均值得到偏度系数,所用公式如下:
;
;
式中,是第d1个特征的偏度系数,/>是第d1个特征的数据平均值;
步骤S24:计算异常得分,分别基于第一经验累积分布函数、第二经验累积分布函数和偏度系数得到三种异常得分,所用公式如下:
;
;
;
式中,是/>的第一异常得分,/>是/>的第二异常得分,/>是的第三异常得分;
步骤S25:计算最终异常得分,预先设定第一异常得分的权重γ1、第二异常得分的权重γ2和第三异常得分的权重γ3,所用公式如下:
;
式中,是/>的最终异常得分;
步骤S26:删除异常数据,预先设定异常阈值β,当≥β时,则将该/>数据识别为异常数据并删除;否则,将其保留,从最后保留的数据中随机选取70%的数据构建训练数据集,基于剩余30%的数据构建测试数据集。
通过执行上述操作,针对采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,更准确地衡量数据的分布情况和偏斜程度,从而更好地判断数据的异常程度,保证选择数据集的质量和可靠性。
实施例四,参阅图1,该实施例基于上述实施例,在步骤S3中,构建城市土地利用规划模型具体包括以下步骤:
步骤S31:模型训练,利用python导入sklearn库调用SVM函数,基于训练数据集完成模型训练;
步骤S32:设计差值损失函数,将测试数据集输入模型中,基于损失值设计差值损失函数,所用公式如下:
;
;
式中,Lossc是第c个样本数据的损失值,Hc是第c个样本数据的真实标签,是第c个样本数据的模型输出标签,K是差值控制量,Ψ是加权变量且Ψ>1,c是样本数据的索引,Nxl是测试数据集的样本数据数量,Losszh是差值损失函数。
通过执行上述操作,针对现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题,本方案引入差值控制量和加权变量设计差值损失函数,增强模型的准确性,使其更好地适应城市土地利用规划任务,并减少模型对训练数据的过度拟合,提高模型的泛化能力,可以加快模型的收敛速度,使模型更快地达到较好的性能。
实施例五,参阅图1和图4,该实施例基于上述实施例,在步骤S4中,模型参数搜索具体包括以下步骤:
步骤S41:初始化个体位置,用个体位置是模型参数的代表,在[0,1]范围内随机生成一个位置初始值G0,基于引入自适应因子改进的帐篷混沌映射函数初始化个体位置,所用公式如下:
;
式中,Gi是第i个个体的初始化位置,Gi-1是第i-1个个体的初始化位置,i是个体的索引,NG是个体总数量,ε是自适应因子;
步骤S42:计算个体的自适应影响力,将城市土地利用规划模型性能作为个体的适应度值,按照适应度值从大到小的顺序进行排序,根据个体在排序中的位置和适应度值,计算每个个体在所有个体中的相对影响力大小,计算个体的自适应影响力所用公式如下:
;
式中,YXp(t)是第t次迭代时第p个个体的自适应影响力,即第t次迭代时第p个个体在所有个体中的相对影响力大小,p是排序后的个体索引即个体排名,Sp(t)是第t次迭代时第p个个体的适应度值,t是迭代索引;
步骤S43:构建个体的自适应邻里组,预先设定邻里阈值,根据邻里阈值/>,判断每对个体之间的自适应邻里关系,若YXp(t)或YXq(t)中有一个大于邻里阈值/>,则将个体p和个体q之间的自适应邻里关系记为1;否则,将个体p和个体q之间的自适应邻里关系记为0,基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Zp(t),p=1,2,…,NG;其中,YXq(t)是第t次迭代时第q个个体的自适应影响力,q是不等于p的排序后的个体索引;
步骤S44:基于修正因子进行位置更新,为每个个体随机生成一个(0,1)之间的位置更新策略选择值hp,基于修正因子进行位置更新所用公式如下:
;
;
;
式中,Gp(t)是第t+1次迭代时第p个个体的位置,是第一修正因子,/>是第二修正因子,j是自适应邻里组Zp(t)中的个体索引,Np是自适应邻里组Zp(t)中的个体数量,Ej是第j个个体在自适应邻里组Zp(t)中的权重,r是[0,1]之间的更新随机值,Gj(t)是第t次迭代时自适应邻里组Zp(t)中第j个个体的位置;
步骤S45:参数确定,预先设定适应度阈值σ和最大迭代次数T,更新个体的适应度值,当最高适应度值大于适应度阈值σ时,则基于当前模型参数构建城市土地利用规划模型;否则,若达到最大迭代次数T,则转至步骤S41;否则转至步骤S42。
通过执行上述操作,针对现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题,本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置,保证个体的位置分布较为均匀,增加搜索空间的覆盖率,并基于自适应影响力构建个体的自适应邻里组,能够利用邻居间的信息交流来提升搜索效果,基于修正因子进行位置更新,通过修正因子调整个体位置的变化,在一定程度上控制位置的变化幅度,避免过大或过小的变化,提高搜索效率和全局搜索能力,既保持搜索的多样性,又提升搜索的精细度和效率,优化模型性能,提高城市土地利用规划的效果。
实施例六,参阅图1,该实施例基于上述实施例,在步骤S5中,城市土地利用规划是采集需要进行利用规划区域的城市土地数据,预处理后输入至城市土地利用规划模型中进行规划,根据模型输出的数据标签对城市土地的利用类型进行合理规划。
实施例七,参阅图2,该实施例基于上述实施例,本发明提供的一种基于机器学习的城市土地利用规划系统,包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块;
数据采集模块采集城市土地数据和利用类型,并将数据发送到城市土地数据异常处理模块;
城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,并将数据发送至构建城市土地利用规划模型模块;
构建城市土地利用规划模型模块调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建,并将数据发送至模型参数搜索模块;
模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新,完成参数搜索,并将数据发送至城市土地利用规划模块;
城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
Claims (8)
1.一种基于机器学习的城市土地利用规划方法,其特征在于:该方法包括以下步骤:
步骤S1:数据采集,采集城市土地数据和利用类型;
步骤S2:城市土地数据异常处理,计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据;
步骤S3:构建城市土地利用规划模型,调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建;
步骤S4:模型参数搜索,使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新;
步骤S5:城市土地利用规划,基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
2.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤S2中,所述城市土地数据异常处理具体包括以下步骤:
步骤S21:预处理,对采集的数据进行归一化、去除噪声和缺失值处理,基于预处理后的数据构建土地数据处理集A;
步骤S22:计算经验累积分布函数,所用公式如下:
;
;
式中,1{}是指示函数,当其参数为真时为1,否则为0;是第d1个特征的第一经验累积分布函数,/>是第d1个特征的第二经验累积分布函数,/>是土地数据处理集A中第n1个数据的第d1个特征的值,b是边界值,d1是数据的特征索引,N1是土地数据处理集A中的数据数量,D1是数据的特征数量,n1是土地数据处理集A中的数据索引;
步骤S23:计算偏度系数,所用公式如下:
;
;
式中,是第d1个特征的偏度系数,/>是第d1个特征的数据平均值;
步骤S24:计算异常得分,所用公式如下:
;
;
;
式中,是/>的第一异常得分,/>是/>的第二异常得分,/>是/>的第三异常得分;
步骤S25:计算最终异常得分,预先设定第一异常得分的权重γ1、第二异常得分的权重γ2和第三异常得分的权重γ3,所用公式如下:
;
式中,是/>的最终异常得分;
步骤S26:删除异常数据,预先设定异常阈值β,当≥β时,则将该/>数据识别为异常数据并删除;否则,将其保留,从最后保留的数据中随机选取70%的数据构建训练数据集,基于剩余30%的数据构建测试数据集。
3.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤S4中,所述模型参数搜索具体包括以下步骤:
步骤S41:初始化个体位置,用个体位置是模型参数的代表,在[0,1]范围内随机生成一个位置初始值G0,基于引入自适应因子改进的帐篷混沌映射函数初始化个体位置,所用公式如下:
;
式中,Gi是第i个个体的初始化位置,Gi-1是第i-1个个体的初始化位置,i是个体的索引,NG是个体总数量,ε是自适应因子;
步骤S42:计算个体的自适应影响力,将城市土地利用规划模型性能作为个体的适应度值,按照适应度值从大到小的顺序进行排序,计算个体的自适应影响力所用公式如下:
;
式中,YXp(t)是第t次迭代时第p个个体的自适应影响力,p是排序后的个体索引即个体排名,Sp(t)是第t次迭代时第p个个体的适应度值,t是迭代索引;
步骤S43:构建个体的自适应邻里组,预先设定邻里阈值,若YXp(t)或YXq(t)中有一个大于邻里阈值/>,则将个体p和个体q之间的自适应邻里关系记为1;否则,将个体p和个体q之间的自适应邻里关系记为0,基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Zp(t);其中,YXq(t)是第t次迭代时第q个个体的自适应影响力,q是不等于p的排序后的个体索引;
步骤S44:基于修正因子进行位置更新,为每个个体随机生成一个位置更新策略选择值hp,基于修正因子进行位置更新所用公式如下:
;
;
;
式中,Gp(t)是第t+1次迭代时第p个个体的位置,是第一修正因子,/>是第二修正因子,j是自适应邻里组Zp(t)中的个体索引,Np是自适应邻里组Zp(t)中的个体数量,Ej是第j个个体在自适应邻里组Zp(t)中的权重,r是更新随机值,Gj(t)是第t次迭代时自适应邻里组Zp(t)中第j个个体的位置;
步骤S45:参数确定,预先设定适应度阈值σ和最大迭代次数T,更新个体的适应度值,当最高适应度值大于适应度阈值σ时,则基于当前模型参数构建城市土地利用规划模型;否则,若达到最大迭代次数T,则转至步骤S41;否则转至步骤S42。
4.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤S3中,所述构建城市土地利用规划模型具体包括以下步骤:
步骤S31:模型训练,利用python导入sklearn库调用SVM函数,基于训练数据集完成模型训练;
步骤S32:设计差值损失函数,将测试数据集输入模型中,基于损失值设计差值损失函数,所用公式如下:
;
;
式中,Lossc是第c个样本数据的损失值,Hc是第c个样本数据的真实标签,是第c个样本数据的模型输出标签,K是差值控制量,Ψ是加权变量,c是样本数据的索引,Nxl是测试数据集的样本数据数量,Losszh是差值损失函数。
5.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤S1中,所述数据采集是采集城市土地数据和利用类型,城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据,利用类型包括商业区、工业区、公共区、住宅区和景观区,将利用类型作为数据标签。
6.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤S5中,所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据,预处理后输入至城市土地利用规划模型中进行规划,根据模型输出的数据标签对城市土地的利用类型进行合理规划。
7.一种基于机器学习的城市土地利用规划系统,用于实现如权利要求1-6中任一项所述的一种基于机器学习的城市土地利用规划方法,其特征在于:包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块。
8.根据权利要求7所述的一种基于机器学习的城市土地利用规划系统,其特征在于:
所述数据采集模块采集城市土地数据和利用类型,并将数据发送到城市土地数据异常处理模块;
所述城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,并将数据发送至构建城市土地利用规划模型模块;
所述构建城市土地利用规划模型模块调用SVM函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建,并将数据发送至模型参数搜索模块;
所述模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新,完成参数搜索,并将数据发送至城市土地利用规划模块;
所述城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100791.9A CN117933748B (zh) | 2024-01-25 | 2024-01-25 | 一种基于机器学习的城市土地利用规划方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100791.9A CN117933748B (zh) | 2024-01-25 | 2024-01-25 | 一种基于机器学习的城市土地利用规划方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117933748A true CN117933748A (zh) | 2024-04-26 |
CN117933748B CN117933748B (zh) | 2024-09-20 |
Family
ID=90750503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410100791.9A Active CN117933748B (zh) | 2024-01-25 | 2024-01-25 | 一种基于机器学习的城市土地利用规划方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117933748B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118350788A (zh) * | 2024-06-17 | 2024-07-16 | 山东同晟建设工程有限公司 | 一种基于gis的国土空间规划处理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163367A (zh) * | 2020-08-20 | 2021-01-01 | 同济大学 | 融合萤火虫算法和元胞自动机的城市扩张模拟预测方法 |
US20210217117A1 (en) * | 2019-01-25 | 2021-07-15 | Southeast University | Automatic urban land identification system integrating business big data with building form |
CN115438855A (zh) * | 2022-09-05 | 2022-12-06 | 河海大学 | 一种山地城市土地利用优化配置方法 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
CN117130263A (zh) * | 2023-10-26 | 2023-11-28 | 博创联动科技股份有限公司 | 一种基于车联网大数据的整车智能控制方法及系统 |
CN117333035A (zh) * | 2023-10-10 | 2024-01-02 | 黄校 | 基于卫星遥感数据的城市土地利用策略生成方法、装置、设备及介质 |
-
2024
- 2024-01-25 CN CN202410100791.9A patent/CN117933748B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210217117A1 (en) * | 2019-01-25 | 2021-07-15 | Southeast University | Automatic urban land identification system integrating business big data with building form |
CN112163367A (zh) * | 2020-08-20 | 2021-01-01 | 同济大学 | 融合萤火虫算法和元胞自动机的城市扩张模拟预测方法 |
CN115438855A (zh) * | 2022-09-05 | 2022-12-06 | 河海大学 | 一种山地城市土地利用优化配置方法 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
CN117333035A (zh) * | 2023-10-10 | 2024-01-02 | 黄校 | 基于卫星遥感数据的城市土地利用策略生成方法、装置、设备及介质 |
CN117130263A (zh) * | 2023-10-26 | 2023-11-28 | 博创联动科技股份有限公司 | 一种基于车联网大数据的整车智能控制方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118350788A (zh) * | 2024-06-17 | 2024-07-16 | 山东同晟建设工程有限公司 | 一种基于gis的国土空间规划处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117933748B (zh) | 2024-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117933748B (zh) | 一种基于机器学习的城市土地利用规划方法及系统 | |
Kao et al. | An ACO-based clustering algorithm | |
KR101072448B1 (ko) | 무선센서 네트워크 시스템 및 그의 클러스터링 방법 | |
CN107437098B (zh) | 一种基于差分进化改进的二进制蚁群算法的高光谱图像波段选择方法 | |
CN109215344B (zh) | 用于城市道路短时交通流量预测的方法和系统 | |
Bacanin et al. | RFID network planning by ABC algorithm hybridized with heuristic for initial number and locations of readers | |
CN114167898B (zh) | 一种无人机收集数据的全局路径规划方法及系统 | |
CN118114083B (zh) | 基于大数据的学生学业表现预测方法 | |
CN114580762A (zh) | 一种基于XGBoost的水文预报误差校正方法 | |
CN117077041B (zh) | 基于物联网的智慧社区管理方法及系统 | |
CN118114985A (zh) | 基于双向反馈机制的客户服务风险评估方法及系统 | |
CN117114144A (zh) | 基于人工智能的水稻耐盐碱性能预测方法及系统 | |
Gupta et al. | Image enhancement using ant colony optimization | |
CN116170328A (zh) | 图形编码的使用带宽预测方法及装置 | |
Anand et al. | Oga-uct: On-the-go abstractions in uct | |
CN107105396A (zh) | 无线传感器网络农田污染区域跟踪系统 | |
Chen et al. | A comprehensive survey on the chicken swarm optimization algorithm and its applications: state-of-the-art and research challenges | |
Islam et al. | Ensemble machine learning approach for agricultural crop selection | |
CN113310490A (zh) | Grnn结合遗传算法的室内定位方法及系统 | |
CN113112357A (zh) | 一种针对以太坊平台的交易行为追踪方法及系统 | |
CN118352011B (zh) | 一种基于人工智能的医学科技档案智能管理方法及系统 | |
CN117974366B (zh) | 基于工商业储能的能源管理系统 | |
CN117491850B (zh) | 一种基于人工智能的电路故障监测方法及系统 | |
CN115493592B (zh) | 基于多目标进化算法的室内定位方法及系统 | |
CN118471327B (zh) | 基于基因型与环境互作异构图的基因组预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |