CN111160755B - 一种基于dqn的飞机大修车间实时调度方法 - Google Patents
一种基于dqn的飞机大修车间实时调度方法 Download PDFInfo
- Publication number
- CN111160755B CN111160755B CN201911362387.4A CN201911362387A CN111160755B CN 111160755 B CN111160755 B CN 111160755B CN 201911362387 A CN201911362387 A CN 201911362387A CN 111160755 B CN111160755 B CN 111160755B
- Authority
- CN
- China
- Prior art keywords
- time
- real
- dqn
- workshop
- aircraft
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于DQN的飞机大修实时调度方法,属于机器学习与智能制造领域;通过物联网技术获取飞机大修车间实时信息,并以此为基础,建立关于飞机大修车间调度问题的马尔科夫决策模型。利用实时信息对DQN方法进行训练,使其具有自适应的飞机大修车间实时调度能力。同时使用两个具有相同结构的Q网络和经验回放策略来提高DQN方法的训练速度和训练效果。利用该方法进行飞机大修车间实时调度,能够有效缩短飞机大修完工时间。
Description
技术领域
本发明属于机器学习与智能制造领域,具体涉及一种基于DQN的飞机大修车间实时调度方法。
背景技术
为了提高市场竞争力,飞机大修企业必须制定合理的调度策略,传统的飞机大修车间调度方法主要集中在传统智能算法的应用方面。然而随着当今飞机大修过程变得越来越复杂,大修车间环境也变得难以预测,传统的调度方法已经无法满足大修过程的需求;传统的调度方法事先进行任务分配,不考虑车间的实时信息,导致计划与实际生产产生较大的偏差,如文献《庄新村,卢宇灏,李从心.基于遗传算法的车间调度问题[J].计算机工程,2006(01):199-200+203.》。尤其是在复杂的飞机大修车间环境下,传统的调度方法会面临稳定性不高,自适应能力差的问题。因此,需要一种结合前沿技术并具有良好自适应能力的飞机大修车间实时调度方法。
发明内容
要解决的技术问题:
为了避免现有技术的不足之处,本发明提出一种基于DQN(Deep Q-Learing,深度Q网络)的飞机大修车间实时调度方法,包括DQN训练阶段和基于DQN的飞机大修实时调度阶段;基于从飞机大修车间获得的实时信息,DQN制定了相应的调度规则,输入是有关车间的实时信息,输出是调度规则。一旦空闲机器出现在车间,缓冲区中的任务就会根据DQN提供的调度规则进行分配。执行相应的调度规则后,系统进入下一个状态,并且此循环继续进行,直到处理完所有任务为止。
本发明的技术方案是:一种基于DQN的飞机大修车间实时调度方法,其特征在于具体步骤如下:
步骤一:利用物联网技术收集飞机大修车间中产生的实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;
步骤二:通过步骤一获取飞机大修车间的实时信息后,将飞机大修实时调度模型构造为马尔科夫决策模型,将实时信息转化为实时状态;构筑所述马尔科夫决策模型包括状态空间设置、动作空间设置和奖励函数设置;
1)状态空间设置:通过3个特征变量μt、Et、Bt来定义飞机大修车间的实时状态;其中,μt表示加工机器在时间步t的完好率,Et表示在时间步t缓冲区中所有任务的预期平均EPT,Bt代表在时间步t处缓冲区的容量比;
2)动作空间设置:采用先进先出、最短处理时间、最长处理时间三种作业车间调度规则作为马尔科夫决策模型的动作;
3)奖励函数设置:奖励函数包括即时奖励和最终奖励,所述即时奖励r1由当前时刻车间所处的环境给定,公式如下:
其中,V是所有机器修理时间的方差,tm是机器m截止到当前时刻的总的修理时间,是t1到tm的平均值,C1是一个设定的常数;
所述最终奖励r2是等到所有的任务处理完,根据完工时间计算而得,公式如下:
其中C2和C3是常数,TMS是完工时间;
步骤三:通过步骤一和步骤二得出飞机大修车间实时状态,将所述实时状态信息存储在记忆库中,随机抽取部分状态信息、动作以及奖励进行DQN训练;
步骤四:经过步骤一至步骤三,DQN完成训练;在实际飞机大修车间调度中,将车间实时状态输入到训练完成的DQN中,然后输出调度规则,用于飞机大修车间的动作;以上为一个闭环过程,一直持续直至所有大修任务修理完成。
本发明的进一步技术方案是:所述DQN的训练过程包括Q网络和经验回放,所述Q网络包括主Q网络和目标Q网络。
有益效果
本发明的有益效果在于:本发明提出了一种基于DQN的飞机大修车间实时调度方法,首先,通过物联网技术获取飞机大修车间实时信息。基于这些信息,将飞机大修车间实时调度问题转化为一个马尔科夫决策问题。马尔科夫决策问题的模型定义包括动作空间设置、状态空间设置、奖励函数设置。使用该DQN方法来求解马尔科夫决策问题的最优解。在该方法的训练过程中,利用配置记忆库来降低训练信息之间的关联度,提高方法的训练速度。经过多次训练,得到训练好的DQN方法。和传统的调度方法不同,DQN方式是根据大修车间的实时信息而做出决策的,这使得该方法能够很好的应对飞机大修环境的动态变化,具有较高的稳定性和自适应性。验证还表明,该方法能够有效的缩短飞机大修完工时间。
附图说明
图1为本发明一种基于DQN的飞机大修实时调度方法流程图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本实施是一种基于DQN的飞机大修实时调度方法。
随着物联网技术在飞机大修工作车间中的快速发展,可以获得大量的实时数据,从而促进了高效的实时调度。但是,车间中的许多不确定性,例如机器故障,不确定的任务处理时间等,都给实时调度带来了严峻的挑战。为了解决这些挑战,针对采用物联网的灵活工作车间,提出了一种使用DQN的高效实时调度方法,以最大程度地缩短完工时间。实时调度问题被表述为马尔可夫决策过程。然后,提出了一种新颖的基于DQN的实时调度方法来确定该问题的最佳策略,通过该方法可以获取合适的规则来执行针对各种车间状态的调度。
参阅图1,本实施基于DQN的飞机大修实时调度方法。主要分为两个方面,分别是马尔科夫决策模型的建立以及DQN的训练过程。包括以下步骤:
第一步,利用物联网技术从飞机大修车间中收集实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;这些信息的收集对于后面的DQN的训练至关重要。
第二步,马尔科夫决策问题模型的建立。
马尔科夫决策问题模型可以很好地描述随机动力学系统。在本文中,我们应用具有离散时间步长的有限马尔科夫决策问题模型来描述实时飞机大修调度。具体而言,任何两台机器空闲的时间间隔是两个相邻时间步t之间的时间间隔。在时间步骤t,我们观察到系统状态st,该状态包括有关车间信息,分别是加工机器的完好率,任务缓冲区中的任务总数以及机器数量。有了这些信息,我们将选择适当的操作。执行此操作后,我们可以观察新系统状态st+1的状态,并在时间步t+1处选择操作。马尔科夫决策问题模型提供了一种数学体系结构,用于在结果部分随机且部分受决策者控制的情况下对决策过程进行建模。马尔科夫决策问题模型是一个四元组<S,A,T,R>,其中S是包含所有状态的有限集,A是包含所有动作的有限集,T是定义为T:S×A×S→[0,1]的状态转移概率S→[0,1],R是定义为的奖励方程。考虑到任务的随机到达,EPT不确定性,随机机器故障等,我们定义的飞机大修实时调度的马尔科夫决策问题模型的详细定义如下。
1.状态空间定义
在时间步t,系统状态定义为向量st=(μtEt,Bt),其中包含三种类型的状态指示符。
1)μt表示加工机器在时间步t的完好率,即
其中,m′代表在时间步t的非故障机器的数量。它用于描述时间步t时整个系统的处理能力。m代表车间中所有机器的数量。
2)Et表示在时间步t缓冲区中所有任务的预期平均EPT(Estimated processingtime,估计处理时间),即
其中Ti代表任务第i个任务的的预期EPT。它用于描述时间步t的任务总数。N表示任务缓冲区中的任务总数。任务缓冲区用于存储所有要处理的任务。
3)Bt代表在时间步t处缓冲区的容量比,即
其中B代表任务缓冲区的容量。
状态的定义可以充分涉及车间的所有可能条件。因此,可以很好地反映车间的不确定性。
2.动作空间设置:
对于状态st,使用作业车间调度规则定义操作。它们是先进先出,最短处理时间,最短处理时间。以下是这些规则的详细说明:
1)先进先出:任务越早到达,优先级越高。
2)最短处理时间:处理时间越短,优先级越高。
3)最短处理时间:处理时间越长,优先级越高。
3.奖励函数设置:
奖励功能是马尔科夫决策过程最重要的部分。这是因为奖励函数隐式定义了学习目标。奖励功能用于控制系统的优化方向。为了获得最小完工时间,我们定义了奖励函数,其中包含当前奖励和最终奖励,如下所示。
1)即时奖励
其中,V是所有机器修理时间的方差,tm是机器m截止到当前时刻的总的修理时间,
是t1到tm的平均值,C1是一个合适的常数。
2)最终奖励
其中C2和C3是常数,TMS是完工时间。
第三步,经过第二步的状态空间的计算,车间实时信息被转化成实时状态。将转换好的实时状态存储在记忆库中,作为DQN训练的输入。
第四步,DQN的训练。我们使用车间的实时状态作为Q网络的输入。输出训练好的Q网络的参数,并根据贪婪策略选择最合适的动作。执行此操作后,系统进入下一个状态st+1。DQN的训练过程主要包括两个部分:Q网络(主Q网络和目标Q网络)和经验回放。
1.Q网络
在以往DQN的训练中,目标Q值的计算使用当前要训练的Q网络参数来计算Q(st+1,a;θ),然后使用同一网络。这在迭代中导致两者之间的过度相关,这不利于算法的收敛。为了使算法的性能更加稳定,我们建立了两个结构相同但参数不同的神经网络:主Q网络和目标Q网络。
在初始时刻,将主Q网络的参数分配给目标Q网络,然后主Q网络继续更新神经网络参数,而目标Q网络的参数是固定的。稍后,将主Q网络的参数分配给目标Q网络。来回循环直到训练完成。这会使目标Q值在一段时间内保持恒定,从而使算法更新更加稳定。
主Q网络和目标Q网络是结构相同的两个Q网络。具体而言,Q(s,a;θ)表示主Q网络的输出,并用于评估与当前状态和操作相对应的值函数。Q(st+1,a;θ-)表示目标Q网络的输出。Q网络由三层网络组成。输入层完全连接到具有v个节点的隐藏层。每个隐藏层的值是
vt=g(W1×xt+b1) (6)
其中xt表示输入向量,g是整流后的激活函数,W1是权重矩阵,b1是偏差向量。然后,隐藏层完全连接到输出层。Q网络的输出是系统状态下所有可行调度规则的作用值,即
Q(st,a)=g(W2×vt+b2) (7)
其中W2是权重矩阵,b2是阈值矩阵。输出是具有最大操作值的调度规则。
2.经验回放
在飞机大修车间系统中,相邻状态之间的相关性特别高。因此,如果将这些数据用于顺序训练,则神经网络的稳定性不够高。鉴于此,我们使用经验重播的方法来训练Q网络,这可能会破坏数据之间的关联。具体方法是在学习过程中建立“经验回放”。将所有st,at,st+1和rt存储在内存中一段时间。训练神经网络时,会从内存中随机选择一些数据进行训练,这会破坏原始数据的顺序并削弱数据的相关性。
第五步,飞机大修实时调度
经过第四步的DQN训练后,用于飞机大修车间实时调度的Q网络参数被固定。当输入飞机大修车间实时状态时,DQN输出合适的调度规则,用于当前时刻的飞机大修车间实时调度。在完成本次调度后,飞机大修车间进入下一个状态,直至飞机大修任务全部修理完成。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (2)
1.一种基于DQN的飞机大修车间实时调度方法,其特征在于具体步骤如下:
步骤一:利用物联网技术收集飞机大修车间中产生的实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;
步骤二:通过步骤一获取飞机大修车间的实时信息后,将飞机大修实时调度模型构造为马尔科夫决策模型,将实时信息转化为实时状态;构筑所述马尔科夫决策模型包括状态空间设置、动作空间设置和奖励函数设置;
1)状态空间设置:通过3个特征变量μt、Et、Bt来定义飞机大修车间的实时状态;其中,μt表示加工机器在时间步t的完好率,Et表示在时间步t缓冲区中所有任务的预期平均EPT,Bt代表在时间步t处缓冲区的容量比,N表示任务缓冲区中的任务总数,B代表任务缓冲区的容量;
2)动作空间设置:采用先进先出、最短处理时间、最长处理时间三种作业车间调度规则作为马尔科夫决策模型的动作;
3)奖励函数设置:奖励函数包括即时奖励和最终奖励,所述即时奖励r1由当前时刻车间所处的环境给定,公式如下:
其中,V是所有机器修理时间的方差,tm是机器m截止到当前时刻的总的修理时间,是t1到tm的平均值,C1是一个设定的常数,m代表车间中所有机器的数量;
所述最终奖励r2是等到所有的任务处理完,根据完工时间计算而得,公式如下:
其中C2和C3是常数,TMS是完工时间;
步骤三:通过步骤一和步骤二得出飞机大修车间实时状态,将所述实时状态信息存储在记忆库中,随机抽取部分状态信息、动作以及奖励进行DQN训练;
步骤四:经过步骤一至步骤三,DQN完成训练;在实际飞机大修车间调度中,将车间实时状态输入到训练完成的DQN中,然后输出调度规则,用于飞机大修车间的动作;以上为一个闭环过程,一直持续直至所有大修任务修理完成。
2.根据权利要求1所述基于DQN的飞机大修车间实时调度方法,其特征在于:所述DQN的训练过程包括Q网络和经验回放,所述Q网络包括主Q网络和目标Q网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362387.4A CN111160755B (zh) | 2019-12-26 | 2019-12-26 | 一种基于dqn的飞机大修车间实时调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362387.4A CN111160755B (zh) | 2019-12-26 | 2019-12-26 | 一种基于dqn的飞机大修车间实时调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111160755A CN111160755A (zh) | 2020-05-15 |
CN111160755B true CN111160755B (zh) | 2023-08-18 |
Family
ID=70556614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911362387.4A Active CN111160755B (zh) | 2019-12-26 | 2019-12-26 | 一种基于dqn的飞机大修车间实时调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160755B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598309B (zh) * | 2020-12-29 | 2022-04-19 | 浙江工业大学 | 基于Keras的作业车间调度方法 |
CN113112051B (zh) * | 2021-03-11 | 2022-10-25 | 同济大学 | 一种基于增强学习的串行生产系统生产维护联合优化方法 |
CN113506048A (zh) * | 2021-09-09 | 2021-10-15 | 宁波帅特龙集团有限公司 | 一种柔性作业车间的调度方法 |
CN114862170B (zh) * | 2022-04-27 | 2024-04-19 | 昆明理工大学 | 一种用于通信设备制造过程的学习型智能调度方法、系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390195A (zh) * | 2013-05-28 | 2013-11-13 | 重庆大学 | 一种基于强化学习的机械车间任务调度节能优化系统 |
CN108964042A (zh) * | 2018-07-24 | 2018-12-07 | 合肥工业大学 | 基于深度q网络的区域电网运行点调度优化方法 |
CN108966352A (zh) * | 2018-07-06 | 2018-12-07 | 北京邮电大学 | 基于深度增强学习的动态波束调度方法 |
CN109067842A (zh) * | 2018-07-06 | 2018-12-21 | 电子科技大学 | 面向车联网的计算任务卸载方法 |
CN109655066A (zh) * | 2019-01-25 | 2019-04-19 | 南京邮电大学 | 一种基于Q(λ)算法的无人机路径规划方法 |
CN109829468A (zh) * | 2018-04-16 | 2019-05-31 | 南京航空航天大学 | 基于贝叶斯网络的民机复杂系统故障诊断方法 |
CN109976909A (zh) * | 2019-03-18 | 2019-07-05 | 中南大学 | 边缘计算网络中基于学习的低延时任务调度方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170032245A1 (en) * | 2015-07-01 | 2017-02-02 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Providing Reinforcement Learning in a Deep Learning System |
US10929743B2 (en) * | 2016-09-27 | 2021-02-23 | Disney Enterprises, Inc. | Learning to schedule control fragments for physics-based character simulation and robots using deep Q-learning |
EP3422130B8 (en) * | 2017-06-29 | 2023-03-22 | The Boeing Company | Method and system for autonomously operating an aircraft |
CN108319359B (zh) * | 2017-12-29 | 2020-01-03 | 华中科技大学 | 一种基于微云的能耗优化方法 |
-
2019
- 2019-12-26 CN CN201911362387.4A patent/CN111160755B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390195A (zh) * | 2013-05-28 | 2013-11-13 | 重庆大学 | 一种基于强化学习的机械车间任务调度节能优化系统 |
CN109829468A (zh) * | 2018-04-16 | 2019-05-31 | 南京航空航天大学 | 基于贝叶斯网络的民机复杂系统故障诊断方法 |
CN108966352A (zh) * | 2018-07-06 | 2018-12-07 | 北京邮电大学 | 基于深度增强学习的动态波束调度方法 |
CN109067842A (zh) * | 2018-07-06 | 2018-12-21 | 电子科技大学 | 面向车联网的计算任务卸载方法 |
CN108964042A (zh) * | 2018-07-24 | 2018-12-07 | 合肥工业大学 | 基于深度q网络的区域电网运行点调度优化方法 |
CN109655066A (zh) * | 2019-01-25 | 2019-04-19 | 南京邮电大学 | 一种基于Q(λ)算法的无人机路径规划方法 |
CN109976909A (zh) * | 2019-03-18 | 2019-07-05 | 中南大学 | 边缘计算网络中基于学习的低延时任务调度方法 |
Non-Patent Citations (1)
Title |
---|
吴锋 ; 马里 ; .面向MES的装配作业调度系统研究.杭州电子科技大学学报.2010,(04),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111160755A (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160755B (zh) | 一种基于dqn的飞机大修车间实时调度方法 | |
CN112884239B (zh) | 一种基于深度强化学习的航天起爆器生产调度方法 | |
Mahadevan et al. | Optimizing production manufacturing using reinforcement learning. | |
CN114611897B (zh) | 一种智能产线自适应动态调度策略选择方法 | |
CN114186791B (zh) | 一种面向多型号小批量的复杂装备产品装调生产动态调度方法 | |
CN114912826B (zh) | 一种基于多层深度强化学习的柔性作业车间调度方法 | |
CN111985672B (zh) | 一种多Agent深度强化学习的单件作业车间调度方法 | |
CN114565247B (zh) | 一种基于深度强化学习的车间调度方法、装置和系统 | |
CN112836974B (zh) | 一种基于dqn和mcts的箱区间多场桥动态调度方法 | |
CN115454005B (zh) | 一种面向有限运输资源场景的制造车间动态智能调度方法及装置 | |
CN111144710A (zh) | 一种可持续性混合流水车间的构建和动态调度方法 | |
CN107357267B (zh) | 基于离散花朵授粉算法求解混合流水线调度问题的方法 | |
CN113867295A (zh) | 一种基于数字孪生的制造车间agv动态调度方法、系统、设备及存储介质 | |
CN116500986A (zh) | 一种分布式作业车间的优先调度规则生成方法及系统 | |
CN109902741A (zh) | 一种制冷系统故障诊断方法 | |
CN111353646A (zh) | 带切换时间的炼钢柔性调度优化方法、系统、介质及设备 | |
CN114219274B (zh) | 一种基于深度强化学习适应机器状态的车间调度方法 | |
CN117891220A (zh) | 一种基于多智能体深度强化学习的分布式混合流水车间调度方法 | |
CN117519051A (zh) | 分布式装配作业车间的调度方法、终端设备及存储介质 | |
CN116500994B (zh) | 一种低碳分布式柔性作业车间的动态多目标调度方法 | |
CN113050644A (zh) | 基于迭代贪婪进化的agv调度方法 | |
CN111401769A (zh) | 一种基于深度强化学习的配电网故障智能抢修方法及装置 | |
CN116562584A (zh) | 一种基于Conv-Dueling与泛化表征的动态车间调度方法 | |
CN113112051B (zh) | 一种基于增强学习的串行生产系统生产维护联合优化方法 | |
CN114819273A (zh) | 基于多Agent全局与局部优化结合的车间调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |