CN116523165A - 柔性作业车间amr路径规划与生产调度的协同优化方法 - Google Patents

柔性作业车间amr路径规划与生产调度的协同优化方法 Download PDF

Info

Publication number
CN116523165A
CN116523165A CN202310792405.2A CN202310792405A CN116523165A CN 116523165 A CN116523165 A CN 116523165A CN 202310792405 A CN202310792405 A CN 202310792405A CN 116523165 A CN116523165 A CN 116523165A
Authority
CN
China
Prior art keywords
amr
path
time
processing
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310792405.2A
Other languages
English (en)
Other versions
CN116523165B (zh
Inventor
刘娇娇
孙宝凤
姚天姿
丁威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202310792405.2A priority Critical patent/CN116523165B/zh
Publication of CN116523165A publication Critical patent/CN116523165A/zh
Application granted granted Critical
Publication of CN116523165B publication Critical patent/CN116523165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Manufacturing & Machinery (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)

Abstract

本发明属于生产调度技术领域,尤其涉及一种柔性作业车间多AMR路径规划与生产调度的协同优化方法,方法为:获取调度资源信息,初始化算法参数,确定初始种群,计算种群的多样性和每个个体的适应度,自适应确定交叉和变异概率,选择、交叉、变异操作,合并获得新种群,计算适应度和多样性,重复操作直至达到最大迭代次数,获得适应度值最低的最优个体,进行解码,获得最佳集成调度方案以及每一个工序的无冲突运输路径;本发明考虑智能车间内运输与生产活动之间强烈的耦合关系,融合Dijkstra最短路径和基于强化学习的自学习遗传算法构建一个双层的算法框架,协同决策了AMR与机器的集成调度以及AMR无冲突路径规划的问题。

Description

柔性作业车间AMR路径规划与生产调度的协同优化方法
技术领域
本发明属于生产调度技术领域,尤其涉及一种柔性作业车间AMR路径规划与生产调度的协同优化方法。
背景技术
在以智能制造为主题的工业4.0时代,制造企业为提高市场竞争力,积极引进自动化加工或配送设备以实现智能化转型升级。基于人工智能、自主定位与导航等技术的自主移动机器人(Autonomous mobile robot,AMR)由于其具有更好的灵活性、鲁棒性与环境适应能力,逐步成为智能车间物料搬运设备升级的首要选择。AMR的引入提高了车间作业的柔性化与自动化水平的同时,因此而带来的运输与生产活动之间强烈的耦合关系也为制造系统的控制与管理带来了新的挑战。
一方面,与传统运输设备类似,作为制造过程中关键的生产资源,AMR需要与作业、加工机器集成调度以实现各生产资源的协同控制,进而保证生产系统高效运行。另一方面,与传统运输设备不同,由于其具有自主导航能力,AMR的运输路径灵活多变,相应的运输时间因此而具有不确定性。且在复杂的车间环境中,多个AMR之间存在潜在的路径冲突风险。然而在柔性作业车间集成调度问题中,运输路径及其时间的不确定性通常被忽略。例如中国专利CN 113671910 B公开了一种集成多AGV柔性作业车间调度方法、装置及介质,其中,AGV(Automated Guided Vehicle)表示自动导引运输车,根据给定机器之间的运输时间,通过采用运输设备任务信息记录矩阵实现了柔性作业车间的运输与生产设备的集成调度。中国专利CN 112949077 B公开了结合运输设备约束的柔性作业车间智能调度决策方法,结合作业柔性工艺路线,考虑工序多阶段运输时间与加工时间之间的约束关系,构建了柔性作业车间加工机器与运输设备集成调度的数学决策模型。以上专利假设了运输车辆按照预定的最短路径行驶,而忽略了实际生产中运输路径的不确定性和潜在冲突性,这可能会引起车辆碰撞或者路径锁死等问题,将严重影响车间生产效率。因此,协同决策柔性作业车间AMR与机器的集成调度和AMR无冲突路径规划这两个问题对于保障制造系统稳定和高效运作具有重要理论价值与实践意义。
一个能够协同求解两个子问题的算法框架是实现上述决策的关键。对于柔性作业车间集成调度问题,遗传算法(GA)被广泛应用。为改善遗传算法易陷入局部最优的缺陷,研究者应用基于迭代次数或者适应度值等相关参数的遗传概率替代原遗传概率,提出自适应遗传算法。该方法以预定义的方式更新遗传概率,并未实现真正意义上的动态调整。而强化学习方法则是通过与环境交互而具有自学习能力,能够根据每一次新种群适应度的变化情况给予反馈信号并动态调整遗传概率,实现自学习遗传算法。对于该问题中的AMR无冲突路径规划的子问题,在应用最短路径算法实现路径规划的同时,另一个难点在于,结合作业工序的机器分配、AMR分派、加工和运输顺序获得每一个运输任务的起讫点与开始时间,并能够在多AMR运输过程中避免时空冲突。
发明内容
为解决背景技术中存在的问题,本发明提供一种柔性作业车间AMR路径规划与生产调度的协同优化方法。
本发明的技术方案如下:
一种柔性作业车间AMR路径规划与生产调度的协同优化方法,包括以下步骤:
步骤S1:获取柔性作业车间中的调度资源信息
包括加工机器的集合,AMR的集合/>;生产期内工件的集合/>,每个工件工序的集合/>,每个工序的候选加工机器的集合/>及其相应的加工时间/>
步骤S2:初始化算法参数
包括遗传算法的种群规模、代沟/>和最大迭代次数/>;Q-learning强化学习算法的学习率/>、折扣率/>和贪婪率/>
步骤S3:确定初始种群
采用基于工序的三层编码方法随机确定所有待加工工件的工序序列向量、机器分配向量/>和AMR分派向量/>,构成长度为/>的染色体以表示一个可行解;向量/>和/>的长度均为生产期内所有工件工序的总数量/>;一条染色体表示一个个体,个个体构成初始种群/>
在向量中,为保证同一工件中各工序被按既定顺序加工,即约束工序/>的加工完成时间/>早于工序/>的开始时间/>,以工件编号及其出现的次数表示该工件的加工工序,如从左到右工件编号/>出现第/>次表示加工该工件的第/>个工序/>
在向量中,以向量/>中相应位置工序/>的候选加工机器的集合/>中随机的位置编号表示机器分配,如/>,向量/>中工序/>的机器分配编码为2,表示/>中第2个机器/>被分配了工序/>,该方式保证每个工序分配一个来自于其候选机器集的加工机器;
在向量中,以AMR编号直接表示向量/>中相应位置工序/>的运输AMR,与向量类似,每个工序仅分派一个运输AMR;
步骤S4:计算种群的多样性和每个个体的适应度
种群的多样性以其中个体适应度值之间的差异表示,个体的适应度值以决策目标表示,即最小化最大完工时间;通过解码种群中个体的染色体,确定每个工序的机器分配和AMR分派、加工与运输顺序,根据各过程之间的相互约束关系,结合运输与加工时长,获得个体中每个工序的运输与加工的开始和完成时间,最终确定最晚完工时间作为适应度值,其中运输时长通过路径规划获得,多样性与适应度值公式为:
式中,表示第/>代种群的多样性,其中/>为种群中与个体/>的适应度值不同的其他个体的数量表;/>表示个体/>的适应度值,为生产期内最大的完工时间;/>为工序/>在机器/>上加工的完成时间;
步骤S5:自适应确定交叉和变异概率
通过Q-learning强化学习方法自适应地确定第次迭代的交叉概率/>和变异概率/>
步骤S6:选择操作
采用轮盘赌方法从父代种群中选择个体遗传至下一代群体,用于遗传操作以生产新的子代;
步骤S7:交叉操作
逐个对种群中的个体依交叉概率实施交叉操作,向量/>应用部分匹配交叉方法,即先进行两点交叉,再施以“基因修补”;向量/>应用单点交叉,若交叉后/>,则随机选取一个机器/>;向量/>采用两点交叉;
步骤S8:变异操作
逐个对种群中的个体依变异概率实施变异操作,列向量/>、向量/>和向量/>均采用两点交换的变异方法,变异后应用与交叉操作类似的方法调整基因序列;
步骤S9:合并子代与父代个体获得新种群
应用精英保留策略,选择父代种群中具有最小适应度值的个个体,与子代个体合并,构成新种群/>
步骤S10:按照步骤S4计算新种群的适应度和多样性
步骤S11:重复操作步骤S5 - S10,直至达到最大迭代次数,获得适应度值最低的最优个体;
步骤S12:对最优个体进行解码,获得所有待加工工件的最佳集成调度方案以及每一个工序的无冲突运输路径,输出调度甘特图和运输路径;最佳集成调度方案包括工序的机器分配、机器上工序的加工顺序、工序的AMR分派、AMR上工序的运输顺序以及每个工序开始运输和加工的时间。
作为本发明的优选,步骤S4中通过对个体解码获取适应度值的方法如下:
A1初始化生产资源位置及其可用时间
初始时刻,所有工件与AMR在装/卸载区且均可用,初始化AMR 和工件/>的初始位置为起始节点/>;初始化工件/>、机器/>和AMR />的开始可用时间均为0;
A2读取工序
按照位置顺序从向量中依次读取其元素值/>,并计算位置/>处的/>在向量/>中出现的次数/>,获取加工工序/>
A3索引加工机器
读取向量中第/>个元素值/>,按照步骤S3机器分配向量的编码方法,取工序/>候选机器集/>中第/>个机器/>作为工序/>的加工机器,并从/>中读取相应的加工时间/>
A4 确定运输AMR
读取向量中第/>个元素值/>,获得工序/>的运输车辆/>
A5 获取工序空载和负载运输过程的起终点
根据工序的机器与AMR分配,获得工序空载运输的起点为/>当前位置/>;空载运输的终点为工件当前所在位置/>,负载运输的起点为空载的终点/>;负载运输的终点为工序/>所分配的加工机器/>
A6 计算运输与加工时间
对于一个工序,需经过空载行程、负载行程和加工过程三个阶段的操作,阶段之间相互依赖,根据工件机器分配、加工时长、空载与负载运输过程的起终点,计算工序运输开始与完成时间、运输时长、加工开始与完成时间;
A7 获取最晚完成时间为适应度值
对个体内所有工序的加工完成时间进行排序,取最晚完成时间作为个体的适应度值。
作为本发明的优选,步骤A6中,工序的运输开始与完成时间、运输时长、加工开始与完成时间具体获取过程如下:
A6.1 根据工序与机器的分配关系,判断当前工序与其紧前工序/>是否在同一加工机器/>上加工,如果是,工序/>不需要运输过程,空载行程时长/>与负载行程时长/>,空载与负载的完成时间为/>,/>,执行A6.5,计算加工开始与完成时间;否则,执行A6.2,判断是否需要空载运输;
A6.2 判断上一运输任务工序/>负载行程的终点是否为当前运输任务工序/>空载运输的终点,即工序/>的加工机器/>所在的位置,如果是,/>无需执行工序/>的空载运输,/>,/>,执行A6.4计算负载完成时间;否则,执行A6.3,计算空载完成时间;
A6.3 空载运输时间
在完成上一个运输任务工序/>的负载行程之后,从当前位置空载前往/>的加工机器所在位置,如A5中空载运输的起点、终点;
空载开始时间一定晚于/>完成上一个任务负载行程结束时间/>,应用带时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时长/>,获得空载运输完成时间为/>,更新/>负载可开始时间为/>,转至A6.4,计算负载完成时间;
A6.4负载运输时间
若机器上工序/>被加工完成,直接开始负载行程;否则等待工序/>加工完成后,/>开始装载工件/>并将其运输至工序/>的加工机器/>所在位置;
负载开始时间为,通过带滚动时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时间为/>,负载结束时间为/>,更新工件/>开始可用时间为/>,位置/>为/>,更新/>可开始空载行程的时间/>为/>,工序/>可开始加工时间为/>为/>,/>位置为/>,转至A6.5,计算加工完成时间;
A6.5 加工时间
工件到达机器/>后,若/>加工完成其上一个工序/>,则可以开始加工工序/>,否则,等待工序/>被完成,/>被释放后开始加工工序/>,工序/>的开始加工时间为/>,加工时长为/>,完工时间为/>,更新工件/>开始可用时间/>为/>,位置为/>,更新机器/>开始可用时间/>为/>
作为本发明的优选,步骤A6.3和A6.4中,无冲突运输路径的具体获取过程如下:
B1根据生产环境与AMR的运行速度,建立栅格地图,确定各机器与装/卸载区位置,每个栅格节点的坐标,栅格之间的邻接距离矩阵/>,划分栅格长度为AMR单位时间内行驶的长度;
B2初始化栅格地图中所有路段的时间窗为0,运输路径为空,/>为所有工序数量;
B3判断工序是否为第一个被运输的工序,即车间内第一条运输路径,如果是,转至B4,否则转至B5;
B4 应用算法规划最短路径;
B5为预规划/>条由/>到/>的路径,获得路径集合/>,选取/>的第一条路径;
B6获得所选路径相应的栅格时间窗,判断与已经规划完成或者正在运行路径的时间窗是否存在冲突,如果是,选择/>的下一条路径,重复该步骤直到路径集合中所有路径全部被遍历,转至B7,否则转至B8;
B7选取路径集合中第一条路径,确定冲突分类并采取相应等待或变路径策略获得新的路径,路径冲突约束如下:
分别为节点冲突约束和路段冲突约束,公式中为路径选择决策变量,如果/>至/>时刻/>由节点/>行驶至节点/>,/>;否则,/>;在一般节点不能同时存在超过1个AMR;在加工机器所在节点,由于缓存区存在,能够停靠多个AMR;在两个节点之间的一个路段上,同一时段不能超过1个AMR;
B8获得最终由/>到/>的无冲突最短时间路径、路径的栅格时间窗以及路径时长。
作为本发明的优选,B4中,应用算法规划最短路径的详细步骤如下:
B4.1获取工序的运输/>,运输的起点/>、终点/>,运输开始时间/>
B4.2在中插入起点/>,坐标为/>,/>,/>的距离为0,其余节点加入至集合/>;根据邻接矩阵,若/>与/>中节点/>邻接,选择其中一个距离最近的节点作为该阶段移动终点,任意时刻,AMR仅能选择一条路径;否则,/>不是/>的出边邻接点,其距离赋值为/>
B4.3从中选择一个距离/>最近的邻接节点/>,将其加入路径中,确定路径长度为两点之间的距离/>,更新/>、/>之间栅格的时间窗/>为/>;将节点/>移除/>
B4.4以节点为新考虑的中间节点,根据邻接矩阵,确定/>中各节点到/>的距离;
B4.5重复B4.3和B4.4直到终点包含在路径/>中,到达终点的时间为,获得/>由/>到/>的路径以及每条路径栅格被占用的时间窗/>和运输时长/>
B4.6对所有路径的转弯次数由小到大排序,确定具有最少转弯次数的路径为最终运输路径,记录相应的栅格时间窗/>和运输时长/>
作为本发明的优选,B7中,针对冲突的具体策略如下:
B7.1 遍历路径中所有栅格,比较和确定该路径中与之前运输路径/>重叠的栅格/>及其被占用的时间窗/>和/>
B7.2 如果,表示/>与/>在/>位置不冲突,否则,表示冲突;
B7.3 如果为/>的起始栅格且为/>终点,则无需处理该节点冲突,因为所有路径的起终点均为足够大的加工机器缓冲区,不会发生冲突,否则,转至B7.4进一步判断是否为包含冲突;
B7.4取路径中的下一栅格/>及其时间窗/>,取路径/>中的下一栅格/>及其时间窗/>,转至B7.2判断是否为冲突节点,若是,则为相遇冲突,转至B7.5,否则,为节点冲突,转至B7.6;
B7.5 对于相遇冲突,在最后一个重叠栅格所在节点设置临时障碍,返回B4重新规划的剩余路径;
B7.6对于路径途中的节点冲突,约束中的车辆执行等待策略,在栅格/>被释放后进入该栅格,继续沿剩余栅格前进直到终点。
作为本发明的优选,步骤S5中,应用Q-learning强化学习算法自适应地选择交叉概率和变异概率/>的过程如下:
C1 初始化强化学习环境状态集合、动作集合和价值函数表
应用标准化的种群平均适应度值和多样性的加权和表示环境状态,通过初始种群适应度值和多样性获得状态值,将区间/>等分为/>个子区间,作为环境状态集合,计算公式如下:
式中表示第/>代种群的平均适应度,/>和/>为以第一代种群为基准标准化的第/>代种群的平均适应度值和多样性;/>和/>分别为两者的权重,若,则表示该代种群状态为/>,/>
根据交叉和变异概率的一般取值范围,和/>,分别将其等分为/>个子区间,构成交叉概率和变异概率选择动作的集合/>和/>
价值函数值表示强化学习中智能体/>时刻在状态/>下为采取动作/>所获得回报的期望,初始化/>l列/>表中所有元素为0,/>如下:
C2 在当前种群状态下,依据/>选择策略,确定智能体在/>状态下所执行的动作/>和/>,/>选择策略如下:
其中,r为[0,1]内的随机数,该公式表示,学习过程中智能体以的概率选择具有最大/>值的动作/>,以/>的概率随机选择动作;
C3 根据智能体所执行的动作、/>和C1中动作集合,确定交叉概率/>和变异概率
C4 获得实施遗传算法中交叉和变异操作后新种群的平均适应度值和多样性,确定新种群状态/>
C5 计算状态到状态/>下的奖励/>,执行选择/>动作/>的奖励/>以最佳个体/>适应度值/>的变化反应,执行选择/>动作/>的奖励/>以种群平均适应度值的变化反应,公式如下:
C6 根据奖励与历史价值期望,更新状态下智能体执行动作/>的期望价值/>,公式如下:
式中,为在状态/>下执行动作/>后所获得的回报,/>表示状态/>下按照/>策略选择动作/>的最大期望Q值;
C7 与遗传算法种群进化过程同步,每一次迭代中循环步骤C1-C6,自适应地确定每一代遗传操作的交叉概率和变异概率/>
作为本发明的优选,该方法是在下述问题假设和约束的基础上建立:
1)任意时刻,每台机器最多只能加工一个工件,每个工件仅能在一台机器上加工;
2)AMR单次负载能力为一个工件;
3)加工和运输过程一旦开始便不可中断;
4)不考虑作业过程中机器与AMR故障和充电情况;
5)每台加工机器具有能够供AMR和工件临时停靠和存储的缓冲区;
6) AMR在车间内匀速行驶,忽略避障、载重对其行驶速度的影响;
7) AMR为双向单通道,一个路段内同时只能容纳一个AMR通过;
8) AMR路径规划中,若存在两条以上相同时长的路径,选择转弯次数最少的路径作为最终路径,若多条路径的运输时间和转弯次数均相同,则随机选择其中一条;
9) AMR在一个节点处可向8个邻接节点行驶,包括4个水平或者垂直方向的相邻栅格和4个对角线相邻栅格;
10) AMR采用分布共享策略服务于车间内工件的运输,即完成当前工序运输任务后可以开始运输其他工序,而不用一直跟随某一工件直到其加工完成;
11) AMR完成当前工序的空载和负载行程之后,在该节点等待或者前往下一个任务节点,而不返回装/卸载区。
本发明的另一个目的是提供一种计算机应用程序,该程序执行上述方法。
本发明的有益效果如下:
(1)本发明考虑智能车间内运输与生产活动之间强烈的耦合关系,融合最短路径和基于强化学习的自学习遗传算法构建一个双层的算法框架,以协同决策柔性作业车间AMR与机器的集成调度和AMR无冲突路径规划两个问题,实现了智能车间生产与运输活动的联合决策;
(2)本发明中在上层自学习遗传算法中嵌入Q-learning强化学习算法来根据遗传算子性能动态调整遗传概率,以较高效率获得具有最小最大完工时间的多资源集成调度方案;在下层最短路径算法中,应用滚动时间窗方法和等待与更换路径两种冲突避免策略,为车间内多AMR规划无冲突最短时间运输路径。
附图说明
通过参考以下结合附图的说明,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解,在附图中:
图1 为本发明的流程图;
图2 为本发明中多AMR无冲突路径规划算法流程图;
图3 为一个以AMR为运输资源的柔性作业车间初始状态的简单示例图;
图4为本发明中实施例2的电子栅格地图;
图5为本发明中实施例2的工件工序信息与加工时间;
图6为本发明中实施例2的调度甘特图;
图7 为本发明中实施实2的工序运输路径与时间窗;
图8 为同一批任务,利用不同算法所获得的调度甘特图对比。
具体实施方式
为使本领域技术人员能够更好的理解本发明的技术方案及其优点,下面结合附图对本申请进行详细描述,但并不用于限定本发明的保护范围。
实施例1
参阅图1和图2所示,一种柔性作业车间AMR路径规划与生产调度的协同优化方法,包括以下步骤:
步骤S1:获取柔性作业车间中的调度资源信息
包括加工机器的集合,AMR的集合/>;生产期内工件的集合/>,每个工件工序的集合/>,每个工序的候选加工机器的集合/>及其相应的加工时间/>
步骤S2:初始化算法参数
包括遗传算法的种群规模、代沟/>和最大迭代次数/>;Q-learning强化学习算法的学习率/>、折扣率/>和贪婪率/>
步骤S3:确定初始种群
采用基于工序的三层编码方法随机确定所有待加工工件的工序序列向量、机器分配向量/>和AMR分派向量/>,构成长度为/>的染色体以表示一个可行解;向量/>和/>的长度均为生产期内所有工件工序的总数量/>;一条染色体表示一个个体,个个体构成初始种群/>
在向量中,为保证同一工件中各工序被按既定顺序加工,即约束工序/>的加工完成时间/>早于工序/>的开始时间/>,约束为:
式中为机器分配决策变量,若工序/>被分配至加工机器/>,/>;否则,;因此,在向量/>中以工件编号及其出现的次数表示该工件的工序以保证相同工件中工序的优先顺序,如从左到右工件编号/>出现第/>次表示加工该工件的第/>个工序/>
在向量中,以向量/>中相应位置工序/>的候选加工机器的集合/>中随机的位置编号表示机器分配,如/>,向量/>中工序/>的机器分配编码为2,表示/>中第2个机器/>被分配了工序/>,该方式保证每个工序分配一个来自于其候选机器集的加工机器,约束为:
在向量中,以AMR编号直接表示向量/>中相应位置工序/>的运输AMR,与向量类似,每个工序仅分派一个运输AMR,约束为:
式中,为AMR分派决策变量,若工序/>被分配至加工机器/>,/>;否则,
步骤S4:计算种群的多样性和每个个体的适应度
种群的多样性以其中个体适应度值之间的差异表示,个体的适应度值以决策目标表示,即最小化最大完工时间;通过解码种群中个体的染色体,确定每个工序的机器分配和AMR分派、加工与运输顺序,根据各过程之间的相互约束关系,结合运输与加工时长,获得个体中每个工序的运输与加工的开始和完成时间,最终确定最晚完工时间作为适应度值,其中运输时长通过路径规划获得,多样性与适应度值公式为:
式中,表示第/>代种群的多样性,其中/>为种群中与个体/>的适应度值不同的其他个体的数量表;/>表示个体/>的适应度值,为生产期内最大的完工时间;/>为工序/>在机器/>上加工的完成时间;
步骤S5:自适应确定交叉和变异概率
通过Q-learning强化学习方法自适应地确定第次迭代的交叉概率/>和变异概率/>
步骤S6:选择操作
采用轮盘赌方法从父代种群中选择个体遗传至下一代群体,用于遗传操作以生产新的子代;
步骤S7:交叉操作
逐个对种群中的个体依交叉概率实施交叉操作,向量/>应用部分匹配交叉方法,即先进行两点交叉,再施以“基因修补”;向量/>应用单点交叉,若交叉后/>,则随机选取一个机器/>;向量/>采用两点交叉;
步骤S8:变异操作
逐个对种群中的个体依变异概率实施变异操作,列向量/>、向量/>和向量/>均采用两点交换的变异方法,变异后应用与交叉操作类似的方法调整基因序列;
步骤S9:合并子代与父代个体获得新种群
应用精英保留策略,选择父代种群中具有最小适应度值的个个体,与子代个体合并,构成新种群/>
步骤S10:按照步骤S4计算新种群的适应度和多样性
步骤S11:重复操作步骤S5 - S10,直至达到最大迭代次数,获得适应度值最低的最优个体;
步骤S12:对最优个体进行解码,获得所有待加工工件的最佳集成调度方案以及每一个工序的无冲突运输路径,输出调度甘特图和运输路径;最佳集成调度方案包括工序的机器分配、机器上工序的加工顺序、工序的AMR分派、AMR上工序的运输顺序以及每个工序开始运输和加工的时间。
进一步地,步骤S4中通过对个体解码获取适应度值的方法如下:
A1初始化生产资源位置及其可用时间
初始时刻,所有工件与AMR在装/卸载区且均可用,初始化AMR 和工件/>的初始位置为起始节点/>;初始化工件/>、机器/>和AMR />的开始可用时间均为0;
A2读取工序
按照位置顺序从向量中依次读取其元素值/>,并计算位置/>处的/>在向量/>中出现的次数/>,获取加工工序/>
A3索引加工机器
读取向量中第/>个元素值/>,按照步骤S3机器分配向量的编码方法,取工序/>候选机器集/>中第/>个机器/>作为工序/>的加工机器,并从/>中读取相应的加工时间/>
A4 确定运输AMR
读取向量中第/>个元素值/>,获得工序/>的运输车辆/>
A5 获取工序空载和负载运输过程的起终点
根据工序的机器与AMR分配,获得工序空载运输的起点为/>当前位置/>;空载运输的终点为工件当前所在位置/>,负载运输的起点为空载的终点/>;负载运输的终点为工序/>所分配的加工机器/>
A6 计算运输与加工时间
对于一个工序,需经过空载行程、负载行程和加工过程三个阶段的操作,阶段之间相互依赖,根据工件机器分配、加工时长、空载与负载运输过程的起终点,计算工序运输开始与完成时间、运输时长、加工开始与完成时间;/>
A7 获取最晚完成时间为适应度值
对个体内所有工序的加工完成时间进行排序,取最晚完成时间作为个体的适应度值。
进一步地,步骤A6中,工序的运输开始与完成时间、运输时长、加工开始与完成时间具体获取过程如下:
A6.1 根据工序与机器的分配关系,判断当前工序与其紧前工序/>是否在同一加工机器/>上加工,如果是,工序/>不需要运输过程,空载行程时长/>与负载行程时长/>,空载与负载的完成时间为/>,/>,执行A6.5,计算加工开始与完成时间;否则,执行A6.2,判断是否需要空载运输;
A6.2 判断上一运输任务工序/>负载行程的终点是否为当前运输任务工序/>空载运输的终点,即工序/>的加工机器/>所在的位置,如果是,/>无需执行工序/>的空载运输,/>,/>,执行A6.4计算负载完成时间;否则,执行A6.3,计算空载完成时间;
A6.3 空载运输时间
在完成上一个运输任务工序/>的负载行程之后,从当前位置空载前往/>的加工机器所在位置,如A5中空载运输的起点、终点,约束为:
式中为AMR />上运输任务优先顺序决策变量,如果工序/>先于/>有/>运输,/>;否则,/>;空载开始时间/>一定晚于/>完成上一个任务负载行程结束时间/>,应用带时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时长/>,获得空载运输完成时间为/>,更新/>负载可开始时间为/>,转至A6.4,计算负载完成时间;
A6.4负载运输时间
若机器上工序/>被加工完成,直接开始负载行程;否则等待工序/>加工完成后,/>开始装载工件/>并将其运输至工序/>的加工机器/>所在位置,约束为:
负载开始时间为,通过带滚动时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时间为/>,负载结束时间为/>,更新工件/>开始可用时间为/>,位置/>为/>,更新/>可开始空载行程的时间/>为/>,工序/>可开始加工时间为/>为/>,/>位置为/>,转至A6.5,计算加工完成时间;
A6.5 加工时间
工件到达机器/>后,若/>加工完成其上一个工序/>,则可以开始加工工序/>,约束为:
否则,等待工序被完成,/>被释放后开始加工工序/>,工序/>的开始加工时间为/>,约束为:
式中为/>上加工任务优先顺序决策变量,如果工序/>先于工序/>在/>上加工,/>;否则,/>;加工时长为/>,完工时间为/>,更新工件/>开始可用时间/>为/>,位置/>为/>,更新机器/>开始可用时间/>为/>
进一步地,步骤A6中,无冲突运输路径的具体获取过程如下:
B1根据生产环境与AMR的运行速度,建立栅格地图,确定各机器与装/卸载区位置,每个栅格节点的坐标,栅格之间的邻接距离矩阵/>,划分栅格长度为AMR单位时间内行驶的长度;
B2初始化栅格地图中所有路段的时间窗为0,运输路径为空,/>为所有工序数量;
B3判断工序是否为第一个被运输的工序,即车间内第一条运输路径,如果是,转至B4,否则转至B5;
B4 应用算法规划最短路径;
B5为预规划/>条由/>到/>的路径,获得路径集合/>,选取/>的第一条路径;
B6获得所选路径相应的栅格时间窗,判断与已经规划完成或者正在运行路径的时间窗是否存在冲突,如果是,选择/>的下一条路径,重复该步骤直到路径集合中所有路径全部被遍历,转至B7,否则转至B8;
B7选取路径集合中第一条路径,确定冲突分类并采取相应等待或变路径策略获得新的路径,路径冲突约束如下:
分别为节点冲突约束和路段冲突约束,公式中为路径选择决策变量,如果/>至/>时刻/>由节点/>行驶至节点/>,/>;否则,/>;在一般节点不能同时存在超过1个AMR;在加工机器所在节点,由于缓存区存在,能够停靠多个AMR;在两个节点之间的一个路段上,同一时段不能超过1个AMR;/>
B8获得最终由/>到/>的无冲突最短时间路径、路径的栅格时间窗以及路径时长。
进一步地,B4中,应用算法规划最短路径的详细步骤如下:
B4.1获取工序的运输/>,运输的起点/>、终点/>,运输开始时间/>
B4.2在中插入起点/>,坐标为/>,/>,/>的距离为0,其余节点加入至集合/>;根据邻接矩阵,若/>与/>中节点/>邻接,选择其中一个距离最近的节点作为该阶段移动终点,任意时刻,AMR仅能选择一条路径;否则,/>不是/>的出边邻接点,其距离赋值为/>
B4.3从中选择一个距离/>最近的邻接节点/>,将其加入路径中,确定路径长度为两点之间的距离/>,更新/>、/>之间栅格的时间窗/>为/>;将节点/>移除/>
B4.4以节点为新考虑的中间节点,根据邻接矩阵,确定/>中各节点到/>的距离;
B4.5重复B4.3和B4.4直到终点包含在路径/>中,到达终点的时间为/>,获得/>由/>到/>的路径以及每条路径栅格被占用的时间窗/>和运输时长
B4.6对所有路径的转弯次数由小到大排序,确定具有最少转弯次数的路径为最终运输路径,记录相应的栅格时间窗/>和运输时长/>
进一步地,B7中,针对冲突的具体策略如下:
B7.1 遍历路径中所有栅格,比较和确定该路径中与之前运输路径/>重叠的栅格/>及其被占用的时间窗/>和/>
B7.2 如果,表示/>与/>在/>位置不冲突,否则,表示冲突;
B7.3 如果为/>的起始栅格且为/>终点,则无需处理该节点冲突,因为所有路径的起终点均为足够大的加工机器缓冲区,不会发生冲突,否则,转至B7.4进一步判断是否为包含冲突;
B7.4取路径中的下一栅格/>及其时间窗/>,取路径/>中的下一栅格/>及其时间窗/>,转至B7.2判断是否为冲突节点,若是,则为相遇冲突,转至B7.5,否则,为节点冲突,转至B7.6;
B7.5 对于相遇冲突,在最后一个重叠栅格所在节点设置临时障碍,返回B4重新规划的剩余路径;
B7.6对于路径途中的节点冲突,约束中的车辆执行等待策略,在栅格/>被释放后进入该栅格,继续沿剩余栅格前进直到终点。
进一步地,步骤S5中,应用Q-learning强化学习算法自适应地选择交叉概率和变异概率/>的过程如下:
C1 初始化强化学习环境状态集合、动作集合和价值函数表;/>
应用标准化的种群平均适应度值和多样性的加权和表示环境状态,通过初始种群适应度值和多样性获得状态值,将区间/>等分为/>个子区间,作为环境状态集合,计算公式如下:
式中表示第/>代种群的平均适应度,/>和/>为以第一代种群为基准标准化的第/>代种群的平均适应度值和多样性;/>和/>分别为两者的权重,若,则表示该代种群状态为/>,/>
根据交叉和变异概率的一般取值范围,和/>,分别将其等分为/>个子区间,构成交叉概率和变异概率选择动作的集合/>
价值函数值表示强化学习中智能体/>时刻在状态/>下为采取动作/>所获得回报的期望,初始化/>l列/>表中所有元素为0,/>如下:
C2 在当前种群状态下,依据/>选择策略,确定智能体在/>状态下所执行的动作/>和/>,/>选择策略如下:
其中,r为[0,1]内的随机数,该公式表示,学习过程中智能体以的概率选择具有最大/>值的动作/>,以/>的概率随机选择动作;
C3 根据智能体所执行的动作、/>和C1中动作集合,确定交叉概率/>和变异概率
C4 获得实施遗传算法中交叉和变异操作后新种群的平均适应度值和多样性,确定新种群状态/>
C5 计算状态到状态/>下的奖励/>,执行选择/>动作/>的奖励/>以最佳个体/>适应度值/>的变化反应,执行选择/>动作/>的奖励/>以种群平均适应度值的变化反应,公式如下:/>
C6 根据奖励与历史价值期望,更新状态下智能体执行动作/>的期望价值,公式如下:
式中,为在状态/>下执行动作/>后所获得的回报,/>表示状态/>下按照/>策略选择动作/>的最大期望Q值;
C7 与遗传算法种群进化过程同步,每一次迭代中循环步骤C1-C6,自适应地确定每一代遗传操作的交叉概率和变异概率/>
进一步地,该方法是在下述问题假设和约束的基础上建立:
1)任意时刻,每台机器最多只能加工一个工件,每个工件仅能在一台机器上加工;
2)AMR单次负载能力为一个工件;
3)加工和运输过程一旦开始便不可中断;
4)不考虑作业过程中机器与AMR故障和充电情况;
5)每台加工机器具有能够供AMR和工件临时停靠和存储的缓冲区;
6) AMR在车间内匀速行驶,忽略避障、载重对其行驶速度的影响;
7) AMR为双向单通道,一个路段内同时只能容纳一个AMR通过;
8) AMR路径规划中,若存在两条以上相同时长的路径,选择转弯次数最少的路径作为最终路径,若多条路径的运输时间和转弯次数均相同,则随机选择其中一条;
9) AMR在一个节点处可向8个邻接节点行驶,包括4个水平或者垂直方向的相邻栅格和4个对角线相邻栅格;
10) AMR采用分布共享策略服务于车间内工件的运输,即完成当前工序运输任务后可以开始运输其他工序,而不用一直跟随某一工件直到其加工完成;
11) AMR完成当前工序的空载和负载行程之后,在该节点等待或者前往下一个任务节点,而不返回装/卸载区。
实施例2
如图3为一个以AMR为运输资源的柔性作业车间初始状态的简单示例图,在该车间内开始时刻所有AMR和工件在装卸在区等待生产开始;在车间开始运作之后,由AMR运输工件前往各柔性机器加工。本发明提供协同优化方法,旨在该生产环境下以最小化最大完成时间为目标决策工序机器和AMR分配及运输与加工顺序,在该过程中,一方面需要保证各AMR之间不发生路径冲突,另一方面确保运输与生产活动之间的约束关系。
以一个具有2个加工机器,2个AMR和3个工件的柔性作业车间实践为例,验证本发明提供的协同优化方法的有效性。由生产环境抽象而来的电子栅格地图如图4所示,M0和M3分别为装载和卸载点,M1和M2为加工机器,具有横纹的栅格5表示障碍物。各工件的工序信息、加工机器与加工时间如图5所示。将上述环境与生产信息输入本发明的柔性作业车间AMR路径规划与生产调度的协同优化方法中,可获得柔性作业车间工件、AMR和机器集成调度方案如图6,工序无冲突运输路径与路径时间窗如图7。
从图6的甘特图中可以明确工序、机器与AMR分配关系和相应的加工与运输顺序,最大完工时间makespan=66.0。如机器依次加工工序/>→/>→/>→/>,/>运输顺序为/>→/>;所有完工工件均被送回装卸区U/L。详细地,AMR/>首先从时间0开始将工件2运输至机器/>上加工第1道工序/>,该工序无需空载运输过程,负载运输路径为图7中栅格4→7→8→9,格栅的时间窗如图7中[0,1,2,3,4],表示在[0,1]时段内栅格4被占用,不允许其他车辆进入。此外,/>完成/>负载运输之后,空载前往工件3所在位置取件后,将其运输至机器/>加工。工序/>和/>在相同机器上加工,/>无需运输过程,相应图7中没有任何运输路径。该实验充分验证了本发明方法的有效性。
进一步,在相同算例下,将本发明的基于自学习遗传算法和带时间窗的的协同优化方法(SLGA-D)所获得的调度方案与其他三种方法相比,包括基于自适应遗传算法与/>的协同优化方法(PGA-D)、基于遗传算法与/>的协同优化方法(GA-D)和基于混合粒子群与/>的协同优化方法(HPSO-D),通过4种算法所获得的调度甘特图如图8,可见SLGA-D方法获得了最小的最晚完工时间,makespan=39.6,这进一步验证了本发明方法优化能力的优越性。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,包括以下步骤:
步骤S1:获取柔性作业车间中的调度资源信息
包括加工机器的集合,AMR的集合/>;生产期内工件的集合/>,每个工件工序的集合/>,每个工序的候选加工机器的集合/>及其相应的加工时间/>
步骤S2:初始化算法参数
包括遗传算法的种群规模、代沟/>和最大迭代次数/>;Q-learning强化学习算法的学习率/>、折扣率/>和贪婪率/>
步骤S3:确定初始种群
采用基于工序的三层编码方法随机确定所有待加工工件的工序序列向量、机器分配向量/>和AMR分派向量/>,构成长度为/>的染色体以表示一个可行解;向量/>的长度均为生产期内所有工件工序的总数量/>;一条染色体表示一个个体,个个体构成初始种群/>
在向量中,为保证同一工件中各工序被按既定顺序加工,即约束工序/>的加工完成时间/>早于工序/>的开始时间/>,以工件编号及其出现的次数表示该工件的加工工序,如从左到右工件编号/>出现第/>次表示加工该工件的第/>个工序/>
在向量中,以向量/>中相应位置工序/>的候选加工机器的集合/>中随机的位置编号表示机器分配,如/>,向量/>中工序/>的机器分配编码为2,表示/>中第2个机器/>被分配了工序/>,该方式保证每个工序分配一个来自于其候选机器集的加工机器;
在向量中,以AMR编号直接表示向量/>中相应位置工序/>的运输AMR,与向量/>类似,每个工序仅分派一个运输AMR;
步骤S4:计算种群的多样性和每个个体的适应度
种群的多样性以其中个体适应度值之间的差异表示,个体的适应度值以决策目标表示,即最小化最大完工时间;通过解码种群中个体的染色体,确定每个工序的机器分配和AMR分派、加工与运输顺序,根据各过程之间的相互约束关系,结合运输与加工时长,获得个体中每个工序的运输与加工的开始和完成时间,最终确定最晚完工时间作为适应度值,其中运输时长通过路径规划获得,多样性与适应度值公式为:
式中,表示第/>代种群的多样性,其中/>为种群中与个体/>的适应度值不同的其他个体的数量表;/>表示个体/>的适应度值,为生产期内最大的完工时间;为工序/>在机器/>上加工的完成时间;
步骤S5:自适应确定交叉和变异概率
通过Q-learning强化学习方法自适应地确定第次迭代的交叉概率/>和变异概率
步骤S6:选择操作
采用轮盘赌方法从父代种群中选择个体遗传至下一代群体,用于遗传操作以生产新的子代;
步骤S7:交叉操作
逐个对种群中的个体依交叉概率实施交叉操作,向量/>应用部分匹配交叉方法,即先进行两点交叉,再施以“基因修补”;向量/>应用单点交叉,若交叉后/>,则随机选取一个机器/>;向量/>采用两点交叉;
步骤S8:变异操作
逐个对种群中的个体依变异概率实施变异操作,列向量/>、向量/>和向量/>均采用两点交换的变异方法,变异后应用与交叉操作类似的方法调整基因序列;
步骤S9:合并子代与父代个体获得新种群
应用精英保留策略,选择父代种群中具有最小适应度值的个个体,与子代个体合并,构成新种群/>
步骤S10:按照步骤S4计算新种群的适应度和多样性
步骤S11:重复操作步骤S5 - S10,直至达到最大迭代次数,获得适应度值最低的最优个体;
步骤S12:对最优个体进行解码,获得所有待加工工件的最佳集成调度方案以及每一个工序的无冲突运输路径,输出调度甘特图和运输路径;最佳集成调度方案包括工序的机器分配、机器上工序的加工顺序、工序的AMR分派、AMR上工序的运输顺序以及每个工序开始运输和加工的时间。
2.根据权利要求1所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,步骤S4中通过对个体解码获取适应度值的方法如下:
A1初始化生产资源位置及其可用时间
初始时刻,所有工件与AMR在装/卸载区且均可用,初始化AMR 和工件/>的初始位置为起始节点/>;初始化工件/>、机器/>和AMR />的开始可用时间均为0;
A2读取工序
按照位置顺序从向量中依次读取其元素值/>,并计算位置/>处的/>在向量/>中出现的次数/>,获取加工工序/>
A3索引加工机器
读取向量中第/>个元素值/>,按照步骤S3机器分配向量的编码方法,取工序/>候选机器集/>中第/>个机器/>作为工序/>的加工机器,并从/>中读取相应的加工时间/>
A4 确定运输AMR
读取向量中第/>个元素值/>,获得工序/>的运输车辆/>
A5 获取工序空载和负载运输过程的起终点
根据工序的机器与AMR分配,获得工序空载运输的起点为/>当前位置/>;空载运输的终点为工件当前所在位置/>,负载运输的起点为空载的终点/>;负载运输的终点为工序所分配的加工机器/>
A6 计算运输与加工时间
对于一个工序,需经过空载行程、负载行程和加工过程三个阶段的操作,阶段之间相互依赖,根据工件机器分配、加工时长、空载与负载运输过程的起终点,计算工序运输开始与完成时间、运输时长、加工开始与完成时间;
A7 获取最晚完成时间为适应度值
对个体内所有工序的加工完成时间进行排序,取最晚完成时间作为个体的适应度值。
3.根据权利要求2所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,步骤A6中,工序的运输开始与完成时间、运输时长、加工开始与完成时间具体获取过程如下:
A6.1 根据工序与机器的分配关系,判断当前工序与其紧前工序/>是否在同一加工机器/>上加工,如果是,工序/>不需要运输过程,空载行程时长/>与负载行程时长/>,空载与负载的完成时间为/>,/>,执行A6.5,计算加工开始与完成时间;否则,执行A6.2,判断是否需要空载运输;
A6.2 判断上一运输任务工序/>负载行程的终点是否为当前运输任务工序/>空载运输的终点,即工序/>的加工机器/>所在的位置,如果是,/>无需执行工序/>的空载运输,/>,/>,执行A6.4计算负载完成时间;否则,执行A6.3,计算空载完成时间;
A6.3 空载运输时间
在完成上一个运输任务工序/>的负载行程之后,从当前位置空载前往/>的加工机器所在位置,如A5中空载运输的起点、终点;
空载开始时间一定晚于/>完成上一个任务负载行程结束时间/>,应用带时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时长/>,获得空载运输完成时间为/>,更新/>负载可开始时间为/>,转至A6.4,计算负载完成时间;
A6.4负载运输时间
若机器上工序/>被加工完成,直接开始负载行程;否则等待工序/>加工完成后,/>开始装载工件/>并将其运输至工序/>的加工机器/>所在位置;
负载开始时间为,通过带滚动时间窗的/>算法规划/>至/>的无冲突运输路径,获得运输时间为/>,负载结束时间为/>,更新工件/>开始可用时间/>,位置/>为/>,更新/>可开始空载行程的时间/>为/>,工序/>可开始加工时间为为/>,/>位置为/>,转至A6.5,计算加工完成时间;
A6.5 加工时间
工件到达机器/>后,若/>加工完成其上一个工序/>,则可以开始加工工序/>,否则,等待工序/>被完成,/>被释放后开始加工工序/>,工序/>的开始加工时间为/>,加工时长为/>,完工时间为/>,更新工件/>开始可用时间/>为/>,位置/>,更新机器/>开始可用时间/>为/>
4.根据权利要求3所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,步骤A6.3和A6.4中,无冲突运输路径的具体获取过程如下:
B1根据生产环境与AMR的运行速度,建立栅格地图,确定各机器与装/卸载区位置,每个栅格节点的坐标,栅格之间的邻接距离矩阵/>,划分栅格长度为AMR单位时间内行驶的长度;
B2初始化栅格地图中所有路段的时间窗为0,运输路径为空,为所有工序数量;
B3判断工序是否为第一个被运输的工序,即车间内第一条运输路径,如果是,转至B4,否则转至B5;
B4 应用算法规划最短路径;
B5为预规划/>条由/>到/>的路径,获得路径集合/>,选取/>的第一条路径;
B6获得所选路径相应的栅格时间窗,判断与已经规划完成或者正在运行路径的时间窗是否存在冲突,如果是,选择/>的下一条路径,重复该步骤直到路径集合中所有路径全部被遍历,转至B7,否则转至B8;
B7选取路径集合中第一条路径,确定冲突分类并采取相应等待或变路径策略获得新的路径,路径冲突约束如下:
分别为节点冲突约束和路段冲突约束,公式中为路径选择决策变量,如果/>时刻/>由节点/>行驶至节点/>,/>;否则,/>;在一般节点不能同时存在超过1个AMR;在加工机器所在节点,由于缓存区存在,能够停靠多个AMR;在两个节点之间的一个路段上,同一时段不能超过1个AMR;
B8获得最终由/>到/>的无冲突最短时间路径、路径的栅格时间窗以及路径时长。
5.根据权利要求4所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,B4中,应用算法规划最短路径的详细步骤如下:
B4.1获取工序的运输/>,运输的起点/>、终点/>,运输开始时间/>
B4.2在中插入起点/>,坐标为/>,/>,/>的距离为0,其余节点加入至集合/>;根据邻接矩阵,若/>与/>中节点/>邻接,选择其中一个距离最近的节点作为该阶段移动终点,任意时刻,AMR仅能选择一条路径;否则,不是/>的出边邻接点,其距离赋值为/>
B4.3从中选择一个距离/>最近的邻接节点/>,将其加入路径中,确定路径长度为两点之间的距离/>,更新/>、/>之间栅格的时间窗/>为/>;将节点/>移除/>
B4.4以节点为新考虑的中间节点,根据邻接矩阵,确定/>中各节点到的距离;
B4.5重复B4.3和B4.4直到终点包含在路径/>中,到达终点的时间为/>,获得/>由/>到/>的路径以及每条路径栅格被占用的时间窗/>和运输时长/>
B4.6对所有路径的转弯次数由小到大排序,确定具有最少转弯次数的路径为最终运输路径,记录相应的栅格时间窗/>和运输时长/>
6.根据权利要求5所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,B7中,针对冲突的具体策略如下:
B7.1 遍历路径中所有栅格,比较和确定该路径中与之前运输路径/>重叠的栅格/>及其被占用的时间窗/>和/>
B7.2 如果,表示/>与/>在/>位置不冲突,否则,表示冲突;
B7.3 如果为/>的起始栅格且为/>终点,则无需处理该节点冲突,因为所有路径的起终点均为足够大的加工机器缓冲区,不会发生冲突,否则,转至B7.4进一步判断是否为包含冲突;
B7.4取路径中的下一栅格/>及其时间窗/>,取路径/>中的下一栅格/>及其时间窗/>,转至B7.2判断是否为冲突节点,若是,则为相遇冲突,转至B7.5,否则,为节点冲突,转至B7.6;
B7.5 对于相遇冲突,在最后一个重叠栅格所在节点设置临时障碍,返回B4重新规划的剩余路径;
B7.6对于路径途中的节点冲突,约束中的车辆执行等待策略,在栅格/>被释放后进入该栅格,继续沿剩余栅格前进直到终点。
7.根据权利要求1所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,步骤S5中,应用Q-learning强化学习算法自适应地选择交叉概率和变异概率/>的过程如下:
C1 初始化强化学习环境状态集合、动作集合和价值函数表
应用标准化的种群平均适应度值和多样性的加权和表示环境状态,通过初始种群适应度值和多样性获得状态值,将区间/>等分为/>个子区间,作为环境状态集合/>,计算公式如下:
式中表示第/>代种群的平均适应度,/>和/>为以第一代种群为基准标准化的第/>代种群的平均适应度值和多样性;/>和/>分别为两者的权重,若,则表示该代种群状态为/>,/>
根据交叉和变异概率的一般取值范围,和/>,分别将其等分为/>个子区间,构成交叉概率和变异概率选择动作的集合/>和/>
价值函数值表示强化学习中智能体/>时刻在状态/>下为采取动作/>所获得回报的期望,初始化/>l列/>表中所有元素为0,/>如下:
C2 在当前种群状态下,依据/>选择策略,确定智能体在/>状态下所执行的动作/>和/>,/>选择策略如下:
其中,r为[0,1]内的随机数,该公式表示,学习过程中智能体以的概率选择具有最大/>值的动作/>,以/>的概率随机选择动作;
C3 根据智能体所执行的动作、/>和C1中动作集合,确定交叉概率/>和变异概率/>
C4 获得实施遗传算法中交叉和变异操作后新种群的平均适应度值和多样性,确定新种群状态/>
C5 计算状态到状态/>下的奖励/>,执行选择/>动作/>的奖励/>以最佳个体/>适应度值/>的变化反应,执行选择/>动作/>的奖励/>以种群平均适应度值的变化反应,公式如下:
C6 根据奖励与历史价值期望,更新状态下智能体执行动作/>的期望价值/>,公式如下:
式中,为在状态/>下执行动作/>后所获得的回报,/>表示状态/>下按照/>策略选择动作/>的最大期望Q值;
C7 与遗传算法种群进化过程同步,每一次迭代中循环步骤C1-C6,自适应地确定每一代遗传操作的交叉概率和变异概率/>
8.根据权利要求1所述的柔性作业车间AMR路径规划与生产调度的协同优化方法,其特征在于,该方法是在下述问题假设和约束的基础上建立:
1)任意时刻,每台机器最多只能加工一个工件,每个工件仅能在一台机器上加工;
2)AMR单次负载能力为一个工件;
3)加工和运输过程一旦开始便不可中断;
4)不考虑作业过程中机器与AMR故障和充电情况;
5)每台加工机器具有能够供AMR和工件临时停靠和存储的缓冲区;
6) AMR在车间内匀速行驶,忽略避障、载重对其行驶速度的影响;
7) AMR为双向单通道,一个路段内同时只能容纳一个AMR通过;
8) AMR路径规划中,若存在两条以上相同时长的路径,选择转弯次数最少的路径作为最终路径,若多条路径的运输时间和转弯次数均相同,则随机选择其中一条;
9) AMR在一个节点处可向8个邻接节点行驶,包括4个水平或者垂直方向的相邻栅格和4个对角线相邻栅格;
10) AMR采用分布共享策略服务于车间内工件的运输,即完成当前工序运输任务后可以开始运输其他工序,而不用一直跟随某一工件直到其加工完成;
11) AMR完成当前工序的空载和负载行程之后,在该节点等待或者前往下一个任务节点,而不返回装/卸载区。
9.一种计算机应用程序,其特征在于,该程序执行权利要求1所述方法。
CN202310792405.2A 2023-06-30 2023-06-30 柔性作业车间amr路径规划与生产调度的协同优化方法 Active CN116523165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310792405.2A CN116523165B (zh) 2023-06-30 2023-06-30 柔性作业车间amr路径规划与生产调度的协同优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310792405.2A CN116523165B (zh) 2023-06-30 2023-06-30 柔性作业车间amr路径规划与生产调度的协同优化方法

Publications (2)

Publication Number Publication Date
CN116523165A true CN116523165A (zh) 2023-08-01
CN116523165B CN116523165B (zh) 2023-12-01

Family

ID=87390597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310792405.2A Active CN116523165B (zh) 2023-06-30 2023-06-30 柔性作业车间amr路径规划与生产调度的协同优化方法

Country Status (1)

Country Link
CN (1) CN116523165B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934207A (zh) * 2023-09-19 2023-10-24 弥费科技(上海)股份有限公司 半导体传送运单任务处理方法、装置和计算机设备
CN117132181A (zh) * 2023-08-21 2023-11-28 北京工业大学 一种分布式柔性生产与运输协同调度方法
CN117634749A (zh) * 2024-01-25 2024-03-01 深圳市大数据研究院 柔性加工系统的工件加工方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109270904A (zh) * 2018-10-22 2019-01-25 中车青岛四方机车车辆股份有限公司 一种柔性作业车间批量动态调度优化方法
CN109726866A (zh) * 2018-12-27 2019-05-07 浙江农林大学 基于q学习神经网络的无人船路径规划方法
CN110530369A (zh) * 2019-08-22 2019-12-03 北京交通大学 基于时间窗的agv任务调度方法
CN112001541A (zh) * 2020-08-24 2020-11-27 南京理工大学 一种用于路径优化的改进遗传算法
CN112286203A (zh) * 2020-11-11 2021-01-29 大连理工大学 一种基于蚁群算法的多智能体强化学习路径规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109270904A (zh) * 2018-10-22 2019-01-25 中车青岛四方机车车辆股份有限公司 一种柔性作业车间批量动态调度优化方法
CN109726866A (zh) * 2018-12-27 2019-05-07 浙江农林大学 基于q学习神经网络的无人船路径规划方法
CN110530369A (zh) * 2019-08-22 2019-12-03 北京交通大学 基于时间窗的agv任务调度方法
CN112001541A (zh) * 2020-08-24 2020-11-27 南京理工大学 一种用于路径优化的改进遗传算法
CN112286203A (zh) * 2020-11-11 2021-01-29 大连理工大学 一种基于蚁群算法的多智能体强化学习路径规划方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIU JIAOJIAO等: "An integrated scheduling approach considering dispatching strategy and confict free route of AMRs in fexible job shop", 《THE INTERNATIONAL JOURNAL OF ADVANCED MANUFACTURING TECHNOLOGY》, pages 1979 - 2002 *
孙宝凤等: "第 II 类机器人混流装配线的平衡与排序联合决策", 《浙江大学学报 (工学版)》 *
王世进: "基于自治与协商机制的柔性制造车间智能调度技术研究", 《中国博士学位论文全文数据库工程科技Ⅱ辑》 *
钟慧超: "基于强化遗传算法的车间调度方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132181A (zh) * 2023-08-21 2023-11-28 北京工业大学 一种分布式柔性生产与运输协同调度方法
CN117132181B (zh) * 2023-08-21 2024-05-28 北京工业大学 一种分布式柔性生产与运输协同调度方法
CN116934207A (zh) * 2023-09-19 2023-10-24 弥费科技(上海)股份有限公司 半导体传送运单任务处理方法、装置和计算机设备
CN116934207B (zh) * 2023-09-19 2024-01-19 弥费科技(上海)股份有限公司 半导体传送运单任务处理方法、装置和计算机设备
CN117634749A (zh) * 2024-01-25 2024-03-01 深圳市大数据研究院 柔性加工系统的工件加工方法及相关设备
CN117634749B (zh) * 2024-01-25 2024-05-17 深圳市大数据研究院 柔性加工系统的工件加工方法及相关设备

Also Published As

Publication number Publication date
CN116523165B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN116523165B (zh) 柔性作业车间amr路径规划与生产调度的协同优化方法
Gen et al. Evolutionary techniques for optimization problems in integrated manufacturing system: State-of-the-art-survey
CN111596658A (zh) 一种多agv无碰撞运行的路径规划方法及调度系统
Lin et al. Network model and effective evolutionary approach for AGV dispatching in manufacturing system
CN113359702B (zh) 一种基于水波优化-禁忌搜索的智能仓库agv作业优化调度方法
Liu et al. Integrated task allocation and path coordination for large-scale robot networks with uncertainties
Du et al. Research on multi-load AGV path planning of weaving workshop based on time priority
Moon et al. Adaptive genetic algorithm for advanced planning in manufacturing supply chain
Dang et al. A heuristic approach to schedule mobile robots in flexible manufacturing environments
CN112465192B (zh) 任务调度的方法、装置、设备及介质
CN112016811A (zh) 一种基于强化学习的agv智能调度系统及方法
Sun et al. An autonomous vehicle interference-free scheduling approach on bidirectional paths in a robotic mobile fulfillment system
CN113396367A (zh) 在共享环境中保障物理实体的资源
CN116224926A (zh) 面向单件小批柔性制造车间的动态调度优化方法及装置
CN114358233A (zh) 基于双混合粒子群的多agv路径规划问题优化方法及系统
Liu et al. Research on flexible job shop scheduling optimization based on segmented AGV
Wang et al. Study on scheduling and path planning problems of multi-AGVs based on a heuristic algorithm in intelligent manufacturing workshop
CN113408988B (zh) 仓储系统的调度优化方法、电子设备及存储介质
Takahashi et al. Online optimization of AGV transport systems using deep reinforcement learning
Petrović et al. Towards a conceptual design of intelligent material transport using artificial intelligence
Pagani et al. A neural network-based algorithm with genetic training for a combined job and energy management for AGVs
Xin et al. Simultaneous Scheduling of Processing Machines and Automated Guided Vehicles via a Multi-View Modeling-Based Hybrid Algorithm
Dang et al. Simultaneous scheduling of machines and mobile robots
Badakhshian et al. Performance optimization of simultaneous machine and automated guided vehicle scheduling using fuzzy logic controller based genetic algorithm
Qu et al. Coordinative scheduling of the mobile robots and machines based on hybrid GA in flexible manufacturing systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant