CN113361827B - 一种基于强化学习的土地规划优化算法 - Google Patents

一种基于强化学习的土地规划优化算法 Download PDF

Info

Publication number
CN113361827B
CN113361827B CN202110827714.XA CN202110827714A CN113361827B CN 113361827 B CN113361827 B CN 113361827B CN 202110827714 A CN202110827714 A CN 202110827714A CN 113361827 B CN113361827 B CN 113361827B
Authority
CN
China
Prior art keywords
action
target
land
state
polygons
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110827714.XA
Other languages
English (en)
Other versions
CN113361827A (zh
Inventor
叶茂
王帆飞
汪雯雯
高进秋
黄骏龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Information Technology College
Original Assignee
Sichuan Information Technology College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Information Technology College filed Critical Sichuan Information Technology College
Priority to CN202110827714.XA priority Critical patent/CN113361827B/zh
Publication of CN113361827A publication Critical patent/CN113361827A/zh
Application granted granted Critical
Publication of CN113361827B publication Critical patent/CN113361827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/043Optimisation of two dimensional placement, e.g. cutting of clothes or wood
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及土地规划技术领域,尤其涉及一种基于强化学习的土地规划优化算法,将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数,首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,设置强化学习的学习率为learn_rate,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,最后得到优化后的建议图。本发明适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。

Description

一种基于强化学习的土地规划优化算法
技术领域
本发明涉及土地规划技术领域,尤其涉及一种基于强化学习的土地规划优化算法。
土地规划指一国或一定地区范围内,按照经济发展的前景和需要,对土地的合理使用所作出的长期安排。旨在保证土地的利用能满足国民经济各部门按比例发展的要求。规划的依据是现有自然资源、技术资源和人力资源的分布和配置状况,务使土地得到充分、有效的利用,而不因人为的原因造成浪费。土地利用总体规划是在一定区域内,根据国家社会经济可持续发展的要求和自然、经济、社会条件,对土地的开发、利用、治理和保护在空间上、时间上所做的总体安排和布局。
土地规划项目报建中,经常存在项目报建地块与土地规划政策,以及现有地块存在冲突,表现为在地理空间上存在重叠或冲突,也成为压盖,当前国土规划领域,对于报建项目,只能提示和哪些地块存在压盖情况,但是无法给出优化建议。
发明内容
有鉴于此,本发明的目的是提供一种基于强化学习的土地规划优化算法,本发明具体按以下步骤执行,
S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;
S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分为V0,以及已建项目的初始坐标(X0, Y0)形成系统初始状态S0 = (X0, Y0);
S3: 计算某一状态St下得分函数如式(1);
Figure 304531DEST_PATH_IMAGE001
式(1)
其中
Figure 594884DEST_PATH_IMAGE002
是状态
Figure 708203DEST_PATH_IMAGE003
下的得分值,Pi是目标集合与宗地Ei的压盖面积,Tj是目标集 合和宗地Ej的邻近距离,
Figure 672933DEST_PATH_IMAGE004
Figure 408808DEST_PATH_IMAGE005
是权重系数,如不考虑邻近的情况,
Figure 138571DEST_PATH_IMAGE005
设置为0,
Figure 745319DEST_PATH_IMAGE006
Figure 200440DEST_PATH_IMAGE007
分别为宗地Ei和Ej的优先级系数,将不同地块设为不同的优先级;通过计算目标多边形集合 与宗地Ei多边形集合的交集,再计算交集部分的面积Pi;Pi乘以宗地Ei的优先级系数
Figure 747145DEST_PATH_IMAGE006
,再 进行逐项求和,得到
Figure 922616DEST_PATH_IMAGE008
。计算目标多边形集合与宗地Ej的最短距离,如果距离小于阈 值,则设置邻近距离Tj值为某一正数,以识别目标与宗地Ej过于邻近的情况,Tj乘以宗地Ej 的优先级系数
Figure 494729DEST_PATH_IMAGE007
,再进行逐项求和,得到
Figure 692492DEST_PATH_IMAGE010
S4:目标集合的动作集合是一个离散集合,定义为action={M东,M西,M南,M北},分别表示目标集合向东西南北四个方向移动M米,或者使用经纬度为单位;限制最大移动距离,避免出现不符合实际的规划需求,在移动最大步数后,仍然无法到达终止态,则算法结束,优化结果失败。
S5:设置强化学习的学习率为learn_rate,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,或者是随机选择一个行动;
S6:目标集合完成一个动作a后,系统从状态St进入一个新状态St+1;此时目标的坐标位置从(Xt, Yt)移动到(Xt+1, Yt+1),则该动作a的回报函数如式(2):
R(a) = V(St) - V(St+1)-ʋ(t+1) 式(2)
其中ʋ是惩罚系数,用于在算法中减少宗地移动步数;t+1表示t之后的下一步搜索移动的距离绝对值;
S7:基于当前状态s,以及每个动作a的回报函数R(a),更新状态-动作函数Q(s,a),如式(3):
Figure 100002_DEST_PATH_IMAGE011
式(3)
其中Q(s,a)是当前状态-动作函数值,new Q(s,a)是根据动作a以及计算最大奖励后更新的回报函数后的状态-动作函数值,lr是学习效率,gamma是折扣因子,是给定状态和行动下获得的最大奖励,lr越大,学习速度越快,gamma越小,旧Q值占比越大。或者通过强化学习领域通用的蒙特卡洛方法、时序差分方法或者DQN方法更新策略集合。
进一步,经过步骤S1到S7的搜索后,如果在某一状态,压盖得分函数V(St)的值小于等于某阈值vt,则认为搜索状态达到终止态,通常情况下,将阈值vt设为0,如式(4)。
V(St) ≤vt 式(4)
进一步,河流、水道或道路的线型工程先计算出现压盖的段落,将存在压盖的部分独立为单独的多边形,再执行步骤S1-S7进行局部优化,完成优化后,将修改后的段落和原段落连接起来,恢复项目的完整性,具体按以下步骤执行:
S2.1:计算线型工程河流、水道或道路的线型工程先计算出现压盖的段落目标集 合地块存在压盖的区域,得到多个子目标多边形
Figure 659497DEST_PATH_IMAGE012
Figure 290198DEST_PATH_IMAGE013
S2.2:记录子目标多边形
Figure 578802DEST_PATH_IMAGE014
和原目标多边形的公共顶点集合;
S2.3:对于子目标多边形
Figure 467309DEST_PATH_IMAGE014
,使用算法步骤S1到S7进行优化,完成后得到新的多 边形
Figure 374085DEST_PATH_IMAGE015
S2.4:根据公共顶点集合,将
Figure 860747DEST_PATH_IMAGE015
与原目标多边形的公共顶点连接,并替换
Figure 351957DEST_PATH_IMAGE014
中其 他顶点,恢复线型工程目标多边形。
进一步,其中M为可修改的算法参数,执行动作M东后,目标集合横坐标X=X+m;执行动作M西后,目标集合横坐标X=X-m;执行动作M南后,目标集合纵坐标Y=Y-m;执行动作M北后,目标集合纵坐标Y=Y+m。
本发明的一种基于强化学习的土地规划优化算法的有益效果为:
1、使用人工智能领域的强化学习技术,创新地将报建的目标地块作为一个智能体,智能体在二维地理空间中移动,可以在有限步骤内得到较优规划建议。和传统的BFS、DFS寻路算法比,本发明的算法基于强化学习的算法的最大优势是可以在线学习,以适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。
2、本发明使用人工智能领域的强化学习技术,创新地将报建的目标地块作为一个智能体,智能体在二维地理空间中移动,可以在有限步骤内得到较优规划建议。和传统的BFS、DFS寻路算法比,基于强化学习的算法的最大优势是可以在线学习,以适应多个规则集合,而且训练后的模型可复用,能够优化后续搜索的效率。
3、使用强化学习的方法搜索项目选址优化路径,得到最佳项目选址建议。使用优先级系数、压盖宗地数量、压盖面积等对土地规划政策完成定量分析。对于线型工程(公路、铁路等),实现分段选址优化,从而减少选址修改量。
附图说明
图1是本发明的目标宗地存在压盖图;
图2是本发明的经过算法优化目标宗地选址解决压盖的最终状态图;
图3是本发明的从初始态S0到终止态S5的搜索过程图;
图4是本发明的线性工程示意图;
图5是本发明的线性工程分段优化图。
具体实施方式
以下将结合附图和具体实施例对本发明进行详细说明,显然,所描述的实施例仅仅只是本申请一部分实施例,而不是全部的实施例,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本实施例中,首先根据步骤S5设置强化学习的超参数,其中学习率为learn_rate=0.02,回报延迟参数为gamma=0.8,贪心策略系数为e_greedy=0.9。
本实施例中,如图1所示,根据步骤S1,设置目标宗地多边形为[(149, 60), (292,50), (292, 122), (149, 122), (149, 60) ],其中每组数字第一个数字是横坐标,第二个数字是纵坐标,单位是米。基本农田1地块多边形[(15, 9), (136, 9), (136, 67),(15, 67), (15, 9)],基本农田2地块多边形[(141, 9), (264, 9), (264, 67), (141,67), (141, 9)],基本农田1和基本农田2地块优先级系数都为3。自然保护区多边形[(269,9), (430, 9), (430, 99), (269, 99), (269, 9)],优先级系数为2。宗地多边形[(65,84), (160, 83), (130, 164), (34, 164), (65, 84)],优先级系数为1。禁入区多边形[(285, 147), (409, 147), (376, 235), (316, 235), (285, 147)],禁入区优先级系数为9。
本实施例中,根据步骤S2和步骤S3,使用式1计算得分函数V(St),计算“目标”和其 他宗地的压盖情况,为了计算简便,我们只考虑压盖情况,不考虑邻近情况。权重系数
Figure DEST_PATH_IMAGE017
=1 和
Figure 184389DEST_PATH_IMAGE019
=0,计算目标多边形与其他宗地多边形的交集部分的面积,结合地块的优先级系数, 得到初始状态S(0)的得分函数V(S(0))= 3*0 + 3*1267.4 + 2*1108.5 + 1*161.3 + 9*0 = 6180.5。其中1267.4是目标地块与基本农田2地块的交集多边形面积。1108.5是目标地块 与自然保护区多边形的交集多边形面积。161.3是目标地块与宗地1的交集多边形面积。
本实施例中,根据步骤S4,使用贪心策略选择下一步行动,选择步骤为:生成一个0到1之间的均匀分布随机数,如果随机数小于0.9(e_greedy),则选择价值函数表Q(s,a)中值最大的行动a;否则随机选择一个行动a。对目标进行行动a后,回到第3步重新计算价值函数;
本实施例中,行动集合每次移动距离为m=2米,即每次从行动集合中选择一个方向,移动2米。第一次由于状态-动作函数Q的值为空,所以先随机选择一个方向,例如向东移动2米,则“目标”多边形更新为[(151, 60), (294, 50), (294, 122), (151, 122),(151, 60) ],再次计算更新后的目标多边形与其他宗地多边形的交集部分面积,得到得分函数值V(S(1))= 3*0 + 3*1237.4 + 2*1203.1 + 1*108.0 + 9*0 = 6226.7;其中1237.4是目标地块与基本农田2地块的交集多边形面积。1203.1是目标地块与自然保护区多边形的交集多边形面积。108.0是目标地块与宗地1的交集多边形面积。状态从S(0)=(0, 0)转移为S(1)=(2, 0),根据步骤S6中公式2,计算向东移动2米后的回报函数,设阈值vt=0,设惩罚因子ʋ=100,移动距离绝对值为2+0=2,则R(S0, a) = V(S(0)) - V(S(1)) + ʋ*abs(2+0) =6180.5 - 6226.7 - 100*2 = -246.2;判断V(S1)=6226.7>vt,说明当前没有到达终止状态。
本实施例中,根据步骤S7,先初始化状态-动作函数Q为一个二维数组,数组索引是目标宗地移动的横坐标和纵坐标,Q数组的值是向东、西、南、北四个方向移动的回报值,初始为Q=[(0,0),0,0,0,0]。如目标宗地经过行动a,向东边移动2米,向北移动0米,得到新状态S1,状态S1=(2,0)未在状态-动作函数Q表中,则在Q表中增加一条数据,更新后Q表为{[(0,0),0,0,0,0], [(2,0),0,0,0,0]}。
经过行动a后,达到状态S1,此时的得分函数值V(S1)>阈值vt,未达到终止态,则根据公式3更新策略表Q值,更新步骤为:如上计算回报函数R(S0,a)=-246.2;再使用学习率lr=0.02更新Q值Q(S1,a) = (1-lr)*Q(S1,a) + gamma * (R(S0,a)+lr*(Q表中最大值)) =(1-0.02)*0 + 0.9* ( -246.2 + 0.02*0 )= -221.58。状态-动作函数Q更新为{[(0,0),0,0,0,0], [(2,0),-221.58,0,0,0]}。
如上完成了从步骤S1到步骤S7的所有步骤的实例。再回到步骤S4,通过贪心策略选择下一步的行动。如此反复,直到达到终止状态。
本实施例中,对于水道、道路等线型工程,根据目标地块多边形集合与其他地块集合压盖的情况,将压盖部分独立为单独多边形,进行分段局部优化。本实施例中:
如图4所示,道路目标宗地多边形为[(22, 223), (73, 163), (261, 109),(438, 105), (527, 71) , (655, 53), (724, 36), (729, 49), (663, 65), (529,83), (440, 115), (261, 120), (81, 174), (30, 230), (22, 223)],其中每组数字第一个数字是横坐标,第二个数字是纵坐标,单位是米。基本农田1地块多边形[(15, 9),(136, 9), (136, 67), (15, 67), (15, 9)],基本农田2地块多边形[(141, 9), (264,9), (264, 67), (141, 67), (141, 9)],基本农田1和基本农田2地块优先级系数都为3。自然保护区多边形[(269, 9), (430, 9), (430, 99), (269, 99), (269, 9)],优先级系数为2。宗地多边形[(65, 84), (160, 83), (130, 164), (34, 164), (65, 84)],优先级系数为1。禁入区多边形[(285, 147), (409, 147), (376, 235), (316, 235), (285,147)],禁入区优先级系数为9。
根据步骤S2.1,计算目标多边形与基本农田1等地块的交集,得到交集多边形D1=[(58, 181), (72, 150), (157, 138), (153, 152), (75, 173), (71, 181), (58,181)],以及交集多边形D2=[(295, 107), (438, 103), (470, 91), (470, 102), (437,113), (295, 119), (295, 107)];
根据步骤S2.2,记录D1与目标的公共顶点集合为[(58, 181), (74, 181), (157,138), (153, 152)],D2与目标的公共顶点集合为[(295, 107), (295, 119), (470, 91),(470, 102)];
根据步骤S2.3,对D1和D2,分别使用S1-S7步骤,完成规划优化,D1部分向南移动5 米,0得到
Figure 733499DEST_PATH_IMAGE020
=[(58, 231), (72, 200), (157, 188), (153, 202), (75, 223), (71, 231), (58, 231)];D2部分向南移动22米,得到
Figure 598556DEST_PATH_IMAGE021
=[(295, 129), (438, 125), (470, 113), (470, 135), (437, 135), (295, 141), (295, 129)],如图5所示。
根据步骤S2.4,再将
Figure 401613DEST_PATH_IMAGE020
Figure 694371DEST_PATH_IMAGE021
与原目标多边形的公共顶点相连,并替换D1和D2中的 其他顶点,得到新的目标多边形为[(22, 223), (58, 181),(58, 231), (72, 200), (157, 188) ,(157, 138), (261, 109),(295, 107),(295, 129), (438, 125), (470, 113), (470, 91),(527, 71) , (655, 53), (724, 36), (729, 49), (663, 65), (529, 83), (470, 102),(470, 135), (437, 135), (295, 141), (295, 119), (261, 120), (153, 152), (153, 202), (75, 223),(71, 231), (74, 181), (30, 230), (22, 223)]。到此,本实施例完成了对线型目标地块的分段优化过程。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。

Claims (5)

1.一种基于强化学习的土地规划优化算法,其特征在于:具体按以下步骤执行,
S1: 将地图上自然保护区、耕地、基本农田、已建项目的坐标定义为多边形,多个多边形组成多边形集合,不同规划和土地类型对应的多边形集合对应相应的优先级系数;
S2: 首先根据报建项目坐标,在地图上根据坐标进行识别,并且标注多边形,多个多边形组成一个目标集合,将目标集合与地图上已存在的其他多边形进行空间压盖以及邻近分析,根据压盖宗地面积、邻近宗地距离、不同宗地的优先级系数,计算得分函数V0;根据已建项目的初始坐标(X0, Y0)形成系统初始状态S(0) = (X0, Y0);
S3: 计算某一状态St下得分函数如式(1);
Figure DEST_PATH_IMAGE001
式(1)
其中
Figure 801451DEST_PATH_IMAGE002
是状态
Figure DEST_PATH_IMAGE003
下的得分值,Pi是目标集合与宗地Ei的压盖面积,Tj是目标集合和宗 地Ej的邻近距离,
Figure 493333DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
是权重系数,如不考虑邻近的情况,
Figure 371683DEST_PATH_IMAGE005
设置为0,
Figure 962065DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
分别为宗地Ei 和Ej的优先级系数;通过计算目标多边形集合与宗地Ei多边形集合的交集,再计算交集部分 的面积Pi;Pi乘以宗地Ei的优先级系数
Figure 456500DEST_PATH_IMAGE006
,再进行逐项求和,得到
Figure 612675DEST_PATH_IMAGE008
,计算目标多边形 集合与宗地Ej的最短距离,如果距离小于阈值,则设置邻近距离Tj值为某一正数,以识别目 标与宗地Ej过于邻近的情况,Tj乘以宗地Ej的优先级系数
Figure 596680DEST_PATH_IMAGE007
,再进行逐项求和,得到
Figure DEST_PATH_IMAGE009
S4:目标集合的动作集合是一个离散集合,定义为action={M东,M西,M南,M北},分别表示目标集合向东西南北四个方向移动M米,或者使用经纬度为单位;
S5:设置强化学习的学习率为lr,回报延迟参数为gamma,贪心策略系数为e_greedy,每次根据贪心策略,从行动集合action中选择期望回报率最好的行动,或者是随机选择一个行动;
S6:目标集合完成一个动作a后,系统从状态St进入一个新状态St+1;此时目标的坐标位置从(Xt, Yt)移动到(Xt+1, Yt+1),则该动作a的回报函数如式(2):
R(a) = V(S(t)) - V(S(t+1))-ʋ(t+1) 式(2)
其中ʋ是惩罚系数,用于在算法中减少宗地移动步数;t+1表示t之后的下一步搜索移动的距离绝对值;
S7:基于当前状态s,以及每个动作a的回报函数R(a),更新状态-动作函数Q(s,a),如式(3):
Figure 333079DEST_PATH_IMAGE010
式(3)
其中Q(s,a)是当前状态-动作函数值,new Q(s,a)是根据动作a以及计算最大奖励后更新的回报函数后的状态-动作函数值,lr是学习效率,gamma是折扣因子,是给定状态和行动下获得的最大奖励,lr越大,学习速度越快,gamma越小,旧Q值占比越大;或者通过强化学习领域通用的蒙特卡洛方法、时序差分方法或者DQN方法来更新策略集合;
经过S1到S7的搜索后,如果在某一状态,压盖得分函数V(St)的值小于等于某阈值vt,则认为搜索状态达到终止态,将阈值vt设为0,如式(4);
V(St) ≤vt 式(4)。
2.根据权利要求1所述的一种基于强化学习的土地规划优化算法,其特征在于:河流、水道或道路的线型工程先计算出现压盖的段落,将存在压盖的部分独立为单独的多边形,再执行步骤S1-S7进行局部优化,完成优化后,将修改后的段落和原段落连接起来,恢复项目的完整性,具体按以下步骤执行:
S2.1:计算线型工程河流、水道或道路的线型工程先计算出现压盖的段落目标集合地 块存在压盖的区域,得到多个子目标多边形
Figure DEST_PATH_IMAGE011
Figure 100047DEST_PATH_IMAGE012
S2.2:记录子目标多边形
Figure DEST_PATH_IMAGE013
和原目标多边形的公共顶点集合;
S2.3:对于子目标多边形
Figure 579570DEST_PATH_IMAGE013
,使用算法步骤S1到S7进行优化,完成后得到新的多边形
Figure 56DEST_PATH_IMAGE014
S2.4:根据公共顶点集合,将
Figure 237133DEST_PATH_IMAGE014
与原目标多边形的公共顶点连接,并替换
Figure 401267DEST_PATH_IMAGE013
中其他顶 点,恢复线型工程目标多边形。
3.根据权利要求1所述的一种基于强化学习的土地规划优化算法,其特征在于:其中M为可修改的算法参数,执行动作M东后,目标集合横坐标X=X+m;执行动作M西后,目标集合横坐标X=X-m;执行动作M南后,目标集合纵坐标Y=Y-m;执行动作M北后,目标集合纵坐标Y=Y+m。
4.根据权利要求1所述的一种基于强化学习的土地规划优化算法,其特征在于:在步骤S7中,学习率lr越大,学习速度越快,回报延迟参数gamma越小,状态-动作函数Q更新越慢,或者通过强化学习领域通用的蒙特卡洛方法、时序差分方法或者DQN方法更新策略集合。
5.根据权利要求1所述的一种基于强化学习的土地规划优化算法,其特征在于:在步骤S4中,限制最大移动距离,在移动最大步数后,仍然无法到达终止态,则算法结束,优化结果失败。
CN202110827714.XA 2021-07-22 2021-07-22 一种基于强化学习的土地规划优化算法 Active CN113361827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110827714.XA CN113361827B (zh) 2021-07-22 2021-07-22 一种基于强化学习的土地规划优化算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110827714.XA CN113361827B (zh) 2021-07-22 2021-07-22 一种基于强化学习的土地规划优化算法

Publications (2)

Publication Number Publication Date
CN113361827A CN113361827A (zh) 2021-09-07
CN113361827B true CN113361827B (zh) 2021-11-02

Family

ID=77540165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110827714.XA Active CN113361827B (zh) 2021-07-22 2021-07-22 一种基于强化学习的土地规划优化算法

Country Status (1)

Country Link
CN (1) CN113361827B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557585B (zh) * 2024-01-12 2024-03-12 自然资源部第三地理信息制图院 一种宗地地块分割方法、系统、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325451A (zh) * 2017-12-31 2019-02-12 苏州中科天启遥感科技有限公司 一种基于深度学习的高空间分辨率耕地地块全自动提取技术
CN111090899A (zh) * 2019-11-07 2020-05-01 郑州大学 一种用于城市建筑空间布局设计方法
CN111523189A (zh) * 2020-04-23 2020-08-11 广东博智林机器人有限公司 一种建筑规划方法、装置、电子设备及存储介质
CN112104495A (zh) * 2020-09-09 2020-12-18 四川信息职业技术学院 一种基于网络拓扑的系统故障根因定位算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775850B2 (en) * 2016-01-27 2023-10-03 Microsoft Technology Licensing, Llc Artificial intelligence engine having various algorithms to build different concepts contained within a same AI model
US10990096B2 (en) * 2018-04-27 2021-04-27 Honda Motor Co., Ltd. Reinforcement learning on autonomous vehicles

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325451A (zh) * 2017-12-31 2019-02-12 苏州中科天启遥感科技有限公司 一种基于深度学习的高空间分辨率耕地地块全自动提取技术
CN111090899A (zh) * 2019-11-07 2020-05-01 郑州大学 一种用于城市建筑空间布局设计方法
CN111523189A (zh) * 2020-04-23 2020-08-11 广东博智林机器人有限公司 一种建筑规划方法、装置、电子设备及存储介质
CN112104495A (zh) * 2020-09-09 2020-12-18 四川信息职业技术学院 一种基于网络拓扑的系统故障根因定位算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Automatic Land Cover Reconstruction From Historical Aerial Images:An Evaluation of Features Extraction and Classification;Rémi Ratajczak 等;《IEEE Transactions on Image Processing》;20190131;第28卷(第7期);第3357-3371页 *
基于多智能体强化学习的居住用地增长模拟——以深圳市为例;李志锋 等;《地理与地理信息科学》;20200515;第36卷(第3期);第63-70页 *
基于强化学习的异构多智能体区域覆盖算法研究;王晓东;《万方数据-学位》;20161025;第1-77页 *

Also Published As

Publication number Publication date
CN113361827A (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
Peng et al. Applying ant colony algorithm to identify ecological security patterns in megacities
Lin et al. Scenario-based flood risk assessment for urbanizing deltas using future land-use simulation (FLUS): Guangzhou Metropolitan Area as a case study
He et al. Modeling urban growth boundary based on the evaluation of the extension potential: A case study of Wuhan city in China
CN106780738A (zh) 基于输变电工程环境敏感区的路径站址优化方法
CN112556686B (zh) 可预测动态时空环境的最短时间路径规划方法
Clarke et al. Calibrating SLEUTH with big data: Projecting California's land use to 2100
CN101685465B (zh) 用于综合管网地理信息系统的一体化三维数据建模方法
CN113361827B (zh) 一种基于强化学习的土地规划优化算法
CN103838829A (zh) 一种基于分层次边界拓扑搜索模型的栅格转矢量系统
CN108665117A (zh) 一种室内空间最短路径的计算方法、装置、终端设备以及存储介质
CN106874415A (zh) 基于gis系统的环境敏感区数据库构建方法及服务器
CN107220724A (zh) 客流量预测方法及装置
CN114840896A (zh) 一种基于城市道路bim的内涝积水模拟分析方法
CN106485017A (zh) 一种基于CA‑Markov模型的土地利用时空变化模拟方法
CN113011720B (zh) 一种基于ca模型的增量递减的城镇开发边界划定方法
Ortiz et al. Modeling urban futures: Data-driven scenarios of climate change and vulnerability in cities
CN117151499A (zh) 一种国土空间规划的监测评估方法及系统
CN116205505A (zh) 一种生态安全格局的确定方法、系统、存储介质及设备
Wu et al. Study on forecast scenarios for simulation of future urban growth in Shenyang City based on SLEUTH model
Peng et al. Key technologies for an urban overland flow simulation system to support what-if analysis
Ye et al. Urban land use simulation and carbon-related driving factors analysis based on RF-CA in Shanghai, China
Tiwari et al. Predicting Future Urban Growth in Bhopal, India using Artificial Intelligence based Modelling
CN118037027B (zh) 智能化土木工程施工管理方法及系统
Zhu et al. Research on Salvage Path Planning Method of Enteromorpha Based on Reinforcement Learning
El Meouche et al. Investigating the Effects of Population Growth and Urban Fabric on the Simulation of a 3D City Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant