CN117933748A

CN117933748A - 一种基于机器学习的城市土地利用规划方法及系统

Info

Publication number: CN117933748A
Application number: CN202410100791.9A
Authority: CN
Inventors: 肖鹤; 刘军; 赵乃君; 潘虹; 张东驰; 潘海鹏; 郭志先
Original assignee: Guangzhou Zhuding Architecture And Planning Design Institute Co ltd
Current assignee: Guangzhou Zhuding Architecture And Planning Design Institute Co ltd
Priority date: 2024-01-25
Filing date: 2024-01-25
Publication date: 2024-04-26
Anticipated expiration: 2044-01-25
Also published as: CN117933748B

Abstract

本发明公开了一种基于机器学习的城市土地利用规划方法及系统，方法包括：数据采集、城市土地数据异常处理、构建城市土地利用规划模型、模型参数搜索和城市土地利用规划。本发明属于土地利用规划技术领域，具体是指一种基于机器学习的城市土地利用规划方法及系统，本方案计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据；调用SVM函数，引入差值控制量和加权变量设计差值损失函数，完成模型构建；使用自适应因子改进的帐篷混沌映射函数初始化个体位置，基于自适应影响力构建自适应邻里组，基于修正因子进行位置更新。

Description

一种基于机器学习的城市土地利用规划方法及系统

技术领域

本发明属于土地利用规划技术领域，具体是指一种基于机器学习的城市土地利用规划方法及系统。

背景技术

城市土地利用规划是对城市土地资源进行科学合理布局和利用，提高土地利用效率，促进城市可持续发展。但是采集的城市土地数据存在异常值，增加数据的不准确性和不可靠性，并且现有的异常值检测算法难以准确评估数据的异常程度的问题；现有的城市土地利用规划模型存在过拟合风险，效率和准确性低的问题；现有的城市土地利用规划模型在参数搜索时，初始化位置分布不均匀，位置更新时没有进行任何有效的信息交换，扰乱了算法的收敛速度的问题。

发明内容

针对上述情况，为克服现有技术的缺陷，本发明提供了一种基于机器学习的城市土地利用规划方法及系统，针对采集的城市土地数据存在异常值，增加数据的不准确性和不可靠性，并且现有的异常值检测算法难以准确评估数据的异常程度的问题，本方案计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据，更准确地衡量数据的分布情况和偏斜程度，从而更好地判断数据的异常程度，保证选择数据集的质量和可靠性；针对现有的城市土地利用规划模型存在过拟合风险，效率和准确性低的问题，本方案引入差值控制量和加权变量设计差值损失函数，增强模型的准确性，使其更好地适应城市土地利用规划任务；针对现有的城市土地利用规划模型在参数搜索时，初始化位置分布不均匀，位置更新时没有进行任何有效的信息交换，扰乱了算法的收敛速度的问题，本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置，保证个体的位置分布较为均匀，并基于自适应影响力构建个体的自适应邻里组，能够利用邻居间的信息交流来提升搜索效果，基于修正因子进行位置更新，通过修正因子调整个体位置的变化，在一定程度上控制位置的变化幅度，避免过大或过小的变化，提高搜索效率和全局搜索能力，提高城市土地利用规划的效果。

本发明采取的技术方案如下：本发明提供的一种基于机器学习的城市土地利用规划方法，该方法包括以下步骤：

步骤S1：数据采集，采集城市土地数据和利用类型；

步骤S2：城市土地数据异常处理，计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据；

步骤S3：构建城市土地利用规划模型，调用SVM函数，引入差值控制量和加权变量设计差值损失函数，完成模型构建；

步骤S4：模型参数搜索，使用自适应因子改进的帐篷混沌映射函数初始化个体位置，基于自适应影响力构建自适应邻里组，基于修正因子进行位置更新；

步骤S5：城市土地利用规划，基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。

进一步地，在步骤S1中，所述数据采集是采集城市土地数据和利用类型，城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据，利用类型包括商业区、工业区、公共区、住宅区和景观区，将利用类型作为数据标签。

进一步地，在步骤S2中，所述城市土地数据异常处理具体包括以下步骤：

步骤S21：预处理，对采集的数据进行归一化、去除噪声和缺失值处理，基于预处理后的数据构建土地数据处理集A；

步骤S22：计算经验累积分布函数，对于第d₁个特征的边界值b，计算在土地数据处理集A中小于等于b的比例和大于等于b的比例，得到第一经验累积分布函数和第二经验累积分布函数，所用公式如下：

；

式中，1{}是指示函数，当其参数为真时为1，否则为0；是第d₁个特征的第一经验累积分布函数，/>是第d₁个特征的第二经验累积分布函数，/>是土地数据处理集A中第n₁个数据的第d₁个特征的值，b是边界值，d₁是数据的特征索引，N₁是土地数据处理集A中的数据数量，D₁是数据的特征数量，n₁是土地数据处理集A中的数据索引；

步骤S23：计算偏度系数，基于第d₁个特征的所有数据的平均值得到偏度系数，所用公式如下：

；

式中，是第d₁个特征的偏度系数，/>是第d₁个特征的数据平均值；

步骤S24：计算异常得分，分别基于第一经验累积分布函数、第二经验累积分布函数和偏度系数得到三种异常得分，所用公式如下：

；

式中，是/>的第一异常得分，/>是/>的第二异常得分，/>是的第三异常得分；

步骤S25：计算最终异常得分，预先设定第一异常得分的权重γ₁、第二异常得分的权重γ₂和第三异常得分的权重γ₃，所用公式如下：

；

式中，是/>的最终异常得分；

步骤S26：删除异常数据，预先设定异常阈值β，当≥β时，则将该/>数据识别为异常数据并删除；否则，将其保留，从最后保留的数据中随机选取70%的数据构建训练数据集，基于剩余30%的数据构建测试数据集。

进一步地，在步骤S3中，所述构建城市土地利用规划模型具体包括以下步骤：

步骤S31：模型训练，利用python导入sklearn库调用SVM函数，基于训练数据集完成模型训练；

步骤S32：设计差值损失函数，将测试数据集输入模型中，基于损失值设计差值损失函数，所用公式如下：

；

式中，Loss_c是第c个样本数据的损失值，H_c是第c个样本数据的真实标签，是第c个样本数据的模型输出标签，K是差值控制量，Ψ是加权变量，c是样本数据的索引，N_xl是测试数据集的样本数据数量，Loss_zh是差值损失函数。

进一步地，在步骤S4中，所述模型参数搜索具体包括以下步骤：

步骤S41：初始化个体位置，用个体位置是模型参数的代表，在[0，1]范围内随机生成一个位置初始值G₀，基于引入自适应因子改进的帐篷混沌映射函数初始化个体位置，所用公式如下：

；

式中，G_i是第i个个体的初始化位置，G_i-1是第i-1个个体的初始化位置，i是个体的索引，N_G是个体总数量，ε是自适应因子；

步骤S42：计算个体的自适应影响力，将城市土地利用规划模型性能作为个体的适应度值，按照适应度值从大到小的顺序进行排序，根据个体在排序中的位置和适应度值，计算每个个体在所有个体中的相对影响力大小，计算个体的自适应影响力所用公式如下：

；

式中，YX_p（t）是第t次迭代时第p个个体的自适应影响力，即第t次迭代时第p个个体在所有个体中的相对影响力大小，p是排序后的个体索引即个体排名，S_p（t）是第t次迭代时第p个个体的适应度值，t是迭代索引；

步骤S43：构建个体的自适应邻里组，预先设定邻里阈值，根据邻里阈值/>，判断每对个体之间的自适应邻里关系，若YX_p（t）或YX_q（t）中有一个大于邻里阈值/>，则将个体p和个体q之间的自适应邻里关系记为1；否则，将个体p和个体q之间的自适应邻里关系记为0，基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Z_p（t）；其中，YX_q（t）是第t次迭代时第q个个体的自适应影响力，q是不等于p的排序后的个体索引；

步骤S44：基于修正因子进行位置更新，为每个个体随机生成一个位置更新策略选择值h_p，基于修正因子进行位置更新所用公式如下：

；

式中，G_p（t）是第t+1次迭代时第p个个体的位置，是第一修正因子，/>是第二修正因子，j是自适应邻里组Z_p（t）中的个体索引，N_p是自适应邻里组Z_p（t）中的个体数量，E_j是第j个个体在自适应邻里组Z_p（t）中的权重，r是更新随机值，G_j（t）是第t次迭代时自适应邻里组Z_p（t）中第j个个体的位置；

步骤S45：参数确定，预先设定适应度阈值σ和最大迭代次数T，更新个体的适应度值，当最高适应度值大于适应度阈值σ时，则基于当前模型参数构建城市土地利用规划模型；否则，若达到最大迭代次数T，则转至步骤S41；否则转至步骤S42。

进一步地，在步骤S5中，所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据，预处理后输入至城市土地利用规划模型中进行规划，根据模型输出的数据标签对城市土地的利用类型进行合理规划。

本发明提供的一种基于机器学习的城市土地利用规划系统，包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块；

所述数据采集模块采集城市土地数据和利用类型，并将数据发送到城市土地数据异常处理模块；

所述城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据，并将数据发送至构建城市土地利用规划模型模块；

所述构建城市土地利用规划模型模块调用SVM函数，引入差值控制量和加权变量设计差值损失函数，完成模型构建，并将数据发送至模型参数搜索模块；

所述模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置，基于自适应影响力构建自适应邻里组，基于修正因子进行位置更新，完成参数搜索，并将数据发送至城市土地利用规划模块；

所述城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。

采用上述方案本发明取得的有益效果如下：

（1）针对采集的城市土地数据存在异常值，增加数据的不准确性和不可靠性，并且现有的异常值检测算法难以准确评估数据的异常程度的问题，本方案计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据，更准确地衡量数据的分布情况和偏斜程度，从而更好地判断数据的异常程度，保证选择数据集的质量和可靠性。

（2）针对现有的城市土地利用规划模型存在过拟合风险，效率和准确性低的问题，本方案引入差值控制量和加权变量设计差值损失函数，增强模型的准确性，使其更好地适应城市土地利用规划任务，并减少模型对训练数据的过度拟合，提高模型的泛化能力，可以加快模型的收敛速度，使模型更快地达到较好的性能。

（3）针对现有的城市土地利用规划模型在参数搜索时，初始化位置分布不均匀，位置更新时没有进行任何有效的信息交换，扰乱了算法的收敛速度的问题，本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置，保证个体的位置分布较为均匀，增加搜索空间的覆盖率，并基于自适应影响力构建个体的自适应邻里组，能够利用邻居间的信息交流来提升搜索效果，基于修正因子进行位置更新，通过修正因子调整个体位置的变化，在一定程度上控制位置的变化幅度，避免过大或过小的变化，提高搜索效率和全局搜索能力，既保持搜索的多样性，又提升搜索的精细度和效率，优化模型性能，提高城市土地利用规划的效果。

附图说明

图1为本发明提供的一种基于机器学习的城市土地利用规划方法的流程示意图；

图2为本发明提供的一种基于机器学习的城市土地利用规划系统的示意图；

图3为步骤S2的流程示意图；

图4为步骤S4的流程示意图。

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

实施例一，参阅图1，本发明提供的一种基于机器学习的城市土地利用规划方法，该方法包括以下步骤：

步骤S1：数据采集，采集城市土地数据和利用类型，将利用类型作为数据标签；

实施例二，参阅图1，该实施例基于上述实施例，在步骤S1中，数据采集是采集城市土地数据和利用类型，城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据，利用类型包括商业区、工业区、公共区、住宅区和景观区，将利用类型作为数据标签。

实施例三，参阅图1和图3，该实施例基于上述实施例，在步骤S2中，城市土地数据异常处理具体包括以下步骤：

；

式中，1{}是指示函数，当其参数为真时为1，否则为0；是第d₁个特征的第一经验累积分布函数，/>是第d₁个特征的第二经验累积分布函数，/>是土地数据处理集A中第n₁个数据的第d₁个特征的值，b是边界值且b∈R，R是实数域，d₁是数据的特征索引，N₁是土地数据处理集A中的数据数量，D₁是数据的特征数量，n₁是土地数据处理集A中的数据索引；

；

式中，是/>的最终异常得分；

通过执行上述操作，针对采集的城市土地数据存在异常值，增加数据的不准确性和不可靠性，并且现有的异常值检测算法难以准确评估数据的异常程度的问题，本方案计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据，更准确地衡量数据的分布情况和偏斜程度，从而更好地判断数据的异常程度，保证选择数据集的质量和可靠性。

实施例四，参阅图1，该实施例基于上述实施例，在步骤S3中，构建城市土地利用规划模型具体包括以下步骤：

；

式中，Loss_c是第c个样本数据的损失值，H_c是第c个样本数据的真实标签，是第c个样本数据的模型输出标签，K是差值控制量，Ψ是加权变量且Ψ>1，c是样本数据的索引，N_xl是测试数据集的样本数据数量，Loss_zh是差值损失函数。

通过执行上述操作，针对现有的城市土地利用规划模型存在过拟合风险，效率和准确性低的问题，本方案引入差值控制量和加权变量设计差值损失函数，增强模型的准确性，使其更好地适应城市土地利用规划任务，并减少模型对训练数据的过度拟合，提高模型的泛化能力，可以加快模型的收敛速度，使模型更快地达到较好的性能。

实施例五，参阅图1和图4，该实施例基于上述实施例，在步骤S4中，模型参数搜索具体包括以下步骤：

；

步骤S43：构建个体的自适应邻里组，预先设定邻里阈值，根据邻里阈值/>，判断每对个体之间的自适应邻里关系，若YX_p（t）或YX_q（t）中有一个大于邻里阈值/>，则将个体p和个体q之间的自适应邻里关系记为1；否则，将个体p和个体q之间的自适应邻里关系记为0，基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Z_p（t），p=1，2，…，N_G；其中，YX_q（t）是第t次迭代时第q个个体的自适应影响力，q是不等于p的排序后的个体索引；

步骤S44：基于修正因子进行位置更新，为每个个体随机生成一个（0，1）之间的位置更新策略选择值h_p，基于修正因子进行位置更新所用公式如下：

；

式中，G_p（t）是第t+1次迭代时第p个个体的位置，是第一修正因子，/>是第二修正因子，j是自适应邻里组Z_p（t）中的个体索引，N_p是自适应邻里组Z_p（t）中的个体数量，E_j是第j个个体在自适应邻里组Z_p（t）中的权重，r是[0，1]之间的更新随机值，G_j（t）是第t次迭代时自适应邻里组Z_p（t）中第j个个体的位置；

通过执行上述操作，针对现有的城市土地利用规划模型在参数搜索时，初始化位置分布不均匀，位置更新时没有进行任何有效的信息交换，扰乱了算法的收敛速度的问题，本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置，保证个体的位置分布较为均匀，增加搜索空间的覆盖率，并基于自适应影响力构建个体的自适应邻里组，能够利用邻居间的信息交流来提升搜索效果，基于修正因子进行位置更新，通过修正因子调整个体位置的变化，在一定程度上控制位置的变化幅度，避免过大或过小的变化，提高搜索效率和全局搜索能力，既保持搜索的多样性，又提升搜索的精细度和效率，优化模型性能，提高城市土地利用规划的效果。

实施例六，参阅图1，该实施例基于上述实施例，在步骤S5中，城市土地利用规划是采集需要进行利用规划区域的城市土地数据，预处理后输入至城市土地利用规划模型中进行规划，根据模型输出的数据标签对城市土地的利用类型进行合理规划。

实施例七，参阅图2，该实施例基于上述实施例，本发明提供的一种基于机器学习的城市土地利用规划系统，包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块；

数据采集模块采集城市土地数据和利用类型，并将数据发送到城市土地数据异常处理模块；

城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数，得到数据三个不同的异常得分，采用加权平均法计算数据最终异常得分，并根据异常阈值识别并删除异常数据，并将数据发送至构建城市土地利用规划模型模块；

构建城市土地利用规划模型模块调用SVM函数，引入差值控制量和加权变量设计差值损失函数，完成模型构建，并将数据发送至模型参数搜索模块；

模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置，基于自适应影响力构建自适应邻里组，基于修正因子进行位置更新，完成参数搜索，并将数据发送至城市土地利用规划模块；

城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种基于机器学习的城市土地利用规划方法，其特征在于：该方法包括以下步骤：

步骤S1：数据采集，采集城市土地数据和利用类型；

2.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法，其特征在于：在步骤S2中，所述城市土地数据异常处理具体包括以下步骤：

步骤S22：计算经验累积分布函数，所用公式如下：

；

步骤S23：计算偏度系数，所用公式如下：

；

步骤S24：计算异常得分，所用公式如下：

；

式中，是/>的第一异常得分，/>是/>的第二异常得分，/>是/>的第三异常得分；

；

式中，是/>的最终异常得分；

3.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法，其特征在于：在步骤S4中，所述模型参数搜索具体包括以下步骤：

；

步骤S42：计算个体的自适应影响力，将城市土地利用规划模型性能作为个体的适应度值，按照适应度值从大到小的顺序进行排序，计算个体的自适应影响力所用公式如下：

；

式中，YX_p（t）是第t次迭代时第p个个体的自适应影响力，p是排序后的个体索引即个体排名，S_p（t）是第t次迭代时第p个个体的适应度值，t是迭代索引；

步骤S43：构建个体的自适应邻里组，预先设定邻里阈值，若YX_p（t）或YX_q（t）中有一个大于邻里阈值/>，则将个体p和个体q之间的自适应邻里关系记为1；否则，将个体p和个体q之间的自适应邻里关系记为0，基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组Z_p（t）；其中，YX_q（t）是第t次迭代时第q个个体的自适应影响力，q是不等于p的排序后的个体索引；

；

4.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法，其特征在于：在步骤S3中，所述构建城市土地利用规划模型具体包括以下步骤：

；

5.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法，其特征在于：在步骤S1中，所述数据采集是采集城市土地数据和利用类型，城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据，利用类型包括商业区、工业区、公共区、住宅区和景观区，将利用类型作为数据标签。

6.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法，其特征在于：在步骤S5中，所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据，预处理后输入至城市土地利用规划模型中进行规划，根据模型输出的数据标签对城市土地的利用类型进行合理规划。

7.一种基于机器学习的城市土地利用规划系统，用于实现如权利要求1-6中任一项所述的一种基于机器学习的城市土地利用规划方法，其特征在于：包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块。

8.根据权利要求7所述的一种基于机器学习的城市土地利用规划系统，其特征在于：