CN111160755A - 一种基于dqn的飞机大修车间实时调度方法 - Google Patents

一种基于dqn的飞机大修车间实时调度方法 Download PDF

Info

Publication number
CN111160755A
CN111160755A CN201911362387.4A CN201911362387A CN111160755A CN 111160755 A CN111160755 A CN 111160755A CN 201911362387 A CN201911362387 A CN 201911362387A CN 111160755 A CN111160755 A CN 111160755A
Authority
CN
China
Prior art keywords
time
real
dqn
scheduling
workshop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911362387.4A
Other languages
English (en)
Other versions
CN111160755B (zh
Inventor
贾晓亮
符式峰
刘括
胡昊
孙冰洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201911362387.4A priority Critical patent/CN111160755B/zh
Publication of CN111160755A publication Critical patent/CN111160755A/zh
Application granted granted Critical
Publication of CN111160755B publication Critical patent/CN111160755B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于DQN的飞机大修实时调度方法,属于机器学习与智能制造领域;通过物联网技术获取飞机大修车间实时信息,并以此为基础,建立关于飞机大修车间调度问题的马尔科夫决策模型。利用实时信息对DQN方法进行训练,使其具有自适应的飞机大修车间实时调度能力。同时使用两个具有相同结构的Q网络和经验回放策略来提高DQN方法的训练速度和训练效果。利用该方法进行飞机大修车间实时调度,能够有效缩短飞机大修完工时间。

Description

一种基于DQN的飞机大修车间实时调度方法
技术领域
本发明属于机器学习与智能制造领域,具体涉及一种基于DQN的飞机大修车间实时调度方法。
背景技术
为了提高市场竞争力,飞机大修企业必须制定合理的调度策略,传统的飞机大修车间调度方法主要集中在传统智能算法的应用方面。然而随着当今飞机大修过程变得越来越复杂,大修车间环境也变得难以预测,传统的调度方法已经无法满足大修过程的需求;传统的调度方法事先进行任务分配,不考虑车间的实时信息,导致计划与实际生产产生较大的偏差,如文献《庄新村,卢宇灏,李从心.基于遗传算法的车间调度问题[J].计算机工程,2006(01):199-200+203.》。尤其是在复杂的飞机大修车间环境下,传统的调度方法会面临稳定性不高,自适应能力差的问题。因此,需要一种结合前沿技术并具有良好自适应能力的飞机大修车间实时调度方法。
发明内容
要解决的技术问题:
为了避免现有技术的不足之处,本发明提出一种基于DQN(Deep Q-Learing,深度Q网络)的飞机大修车间实时调度方法,包括DQN训练阶段和基于DQN的飞机大修实时调度阶段;基于从飞机大修车间获得的实时信息,DQN制定了相应的调度规则,输入是有关车间的实时信息,输出是调度规则。一旦空闲机器出现在车间,缓冲区中的任务就会根据DQN提供的调度规则进行分配。执行相应的调度规则后,系统进入下一个状态,并且此循环继续进行,直到处理完所有任务为止。
本发明的技术方案是:一种基于DQN的飞机大修车间实时调度方法,其特征在于具体步骤如下:
步骤一:利用物联网技术收集飞机大修车间中产生的实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;
步骤二:通过步骤一获取飞机大修车间的实时信息后,将飞机大修实时调度模型构造为马尔科夫决策模型,将实时信息转化为实时状态;构筑所述马尔科夫决策模型包括状态空间设置、动作空间设置和奖励函数设置;
1)状态空间设置:通过3个特征变量μt、Et、Bt来定义飞机大修车间的实时状态;其中,μt表示加工机器在时间步t的完好率,Et表示在时间步t缓冲区中所有任务的预期平均EPT,Bt代表在时间步t处缓冲区的容量比;
2)动作空间设置:采用先进先出、最短处理时间、最长处理时间三种作业车间调度规则作为马尔科夫决策模型的动作;
3)奖励函数设置:奖励函数包括即时奖励和最终奖励,所述即时奖励r1由当前时刻车间所处的环境给定,公式如下:
Figure BDA0002337524650000021
其中,V是所有机器修理时间的方差,tm是机器mj截止到当前时刻的总的修理时间,
Figure BDA0002337524650000022
是t1到tm的平均值,C1是一个设定的常数;
所述最终奖励r2是等到所有的任务处理完,根据完工时间计算而得,公式如下:
Figure BDA0002337524650000023
其中C2和C3是常数,TMS是完工时间;
步骤三:通过步骤一和步骤二得出飞机大修车间实时状态,将所述实时状态信息存储在记忆库中,随机抽取部分状态信息、动作以及奖励进行DQN训练;
步骤四:经过步骤一至步骤三,DQN完成训练;在实际飞机大修车间调度中,将车间实时状态输入到训练完成的DQN中,然后输出调度规则,用于飞机大修车间的动作;以上为一个闭环过程,一直持续直至所有大修任务修理完成。
本发明的进一步技术方案是:所述DQN的训练过程包括Q网络和经验回放,所述Q网络包括主Q网络和目标Q网络。
有益效果
本发明的有益效果在于:本发明提出了一种基于DQN的飞机大修车间实时调度方法,首先,通过物联网技术获取飞机大修车间实时信息。基于这些信息,将飞机大修车间实时调度问题转化为一个马尔科夫决策问题。马尔科夫决策问题的模型定义包括动作空间设置、状态空间设置、奖励函数设置。使用该DQN方法来求解马尔科夫决策问题的最优解。在该方法的训练过程中,利用配置记忆库来降低训练信息之间的关联度,提高方法的训练速度。经过多次训练,得到训练好的DQN方法。和传统的调度方法不同,DQN方式是根据大修车间的实时信息而做出决策的,这使得该方法能够很好的应对飞机大修环境的动态变化,具有较高的稳定性和自适应性。验证还表明,该方法能够有效的缩短飞机大修完工时间。
附图说明
图1为本发明一种基于DQN的飞机大修实时调度方法流程图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本实施是一种基于DQN的飞机大修实时调度方法。
随着物联网技术在飞机大修工作车间中的快速发展,可以获得大量的实时数据,从而促进了高效的实时调度。但是,车间中的许多不确定性,例如机器故障,不确定的任务处理时间等,都给实时调度带来了严峻的挑战。为了解决这些挑战,针对采用物联网的灵活工作车间,提出了一种使用DQN的高效实时调度方法,以最大程度地缩短完工时间。实时调度问题被表述为马尔可夫决策过程。然后,提出了一种新颖的基于DQN的实时调度方法来确定该问题的最佳策略,通过该方法可以获取合适的规则来执行针对各种车间状态的调度。
参阅图1,本实施基于DQN的飞机大修实时调度方法。主要分为两个方面,分别是马尔科夫决策模型的建立以及DQN的训练过程。包括以下步骤:
第一步,利用物联网技术从飞机大修车间中收集实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;这些信息的收集对于后面的DQN的训练至关重要。
第二步,马尔科夫决策问题模型的建立。
马尔科夫决策问题模型可以很好地描述随机动力学系统。在本文中,我们应用具有离散时间步长的有限马尔科夫决策问题模型来描述实时飞机大修调度。具体而言,任何两台机器空闲的时间间隔是两个相邻时间步t之间的时间间隔。在时间步骤t,我们观察到系统状态st,该状态包括有关车间信息,分别是加工机器的完好率,任务缓冲区中的任务总数以及机器数量。有了这些信息,我们将选择适当的操作。执行此操作后,我们可以观察新系统状态st+1的状态,并在时间步t+1处选择操作。马尔科夫决策问题模型提供了一种数学体系结构,用于在结果部分随机且部分受决策者控制的情况下对决策过程进行建模。马尔科夫决策问题模型是一个四元组<S,A,T,R>,其中S是包含所有状态的有限集,A是包含所有动作的有限集,T是定义为T:S×A×S→[0,1]的状态转移概率S→[0,1],R是定义为R:
Figure BDA0002337524650000044
的奖励方程。考虑到任务的随机到达,EPT不确定性,随机机器故障等,我们定义的飞机大修实时调度的马尔科夫决策问题模型的详细定义如下。
1.状态空间定义
在时间步t,系统状态定义为向量st=(μt,Et,Bt),其中包含三种类型的状态指示符。
1)μt表示加工机器在时间步t的完好率,即
Figure BDA0002337524650000041
其中,m′代表在时间步t的非故障机器的数量。它用于描述时间步t时整个系统的处理能力。m代表车间中所有机器的数量。
2)Et表示在时间步t缓冲区中所有任务的预期平均EPT(Estimated processingtime,估计处理时间),即
Figure BDA0002337524650000042
其中Ti代表任务第i个任务的的预期EPT。它用于描述时间步t的任务总数。N表示任务缓冲区中的任务总数。任务缓冲区用于存储所有要处理的任务。
3)Bt代表在时间步t处缓冲区的容量比,即
Figure BDA0002337524650000043
其中B代表任务缓冲区的容量。
状态的定义可以充分涉及车间的所有可能条件。因此,可以很好地反映车间的不确定性。
2.动作空间设置:
对于状态st,使用作业车间调度规则定义操作。它们是先进先出,最短处理时间,最短处理时间。以下是这些规则的详细说明:
1)先进先出:任务越早到达,优先级越高。
2)最短处理时间:处理时间越短,优先级越高。
3)最短处理时间:处理时间越长,优先级越高。
3.奖励函数设置:
奖励功能是马尔科夫决策过程最重要的部分。这是因为奖励函数隐式定义了学习目标。奖励功能用于控制系统的优化方向。为了获得最小完工时间,我们定义了奖励函数,其中包含当前奖励和最终奖励,如下所示。
1)即时奖励
Figure BDA0002337524650000051
其中,V是所有机器修理时间的方差,tm是机器mj在当前时刻总的修理时间,
Figure BDA0002337524650000053
是t1到tm的平均值,C1是一个合适的常数。
2)最终奖励
Figure BDA0002337524650000052
其中C2和C3是常数,TMS是完工时间。
第三步,经过第二步的状态空间的计算,车间实时信息被转化成实时状态。将转换好的实时状态存储在记忆库中,作为DQN训练的输入。
第四步,DQN的训练。我们使用车间的实时状态作为Q网络的输入。输出训练好的Q网络的参数,并根据贪婪策略选择最合适的动作。执行此操作后,系统进入下一个状态st+1。DQN的训练过程主要包括两个部分:Q网络(主Q网络和目标Q网络)和经验回放。
1.Q网络
在以往DQN的训练中,目标Q值的计算使用当前要训练的Q网络参数来计算Q(st+1,a;θ),然后使用同一网络。这在迭代中导致两者之间的过度相关,这不利于算法的收敛。为了使算法的性能更加稳定,我们建立了两个结构相同但参数不同的神经网络:主Q网络和目标Q网络。
在初始时刻,将主Q网络的参数分配给目标Q网络,然后主Q网络继续更新神经网络参数,而目标Q网络的参数是固定的。稍后,将主Q网络的参数分配给目标Q网络。来回循环直到训练完成。这会使目标Q值在一段时间内保持恒定,从而使算法更新更加稳定。
主Q网络和目标Q网络是结构相同的两个Q网络。具体而言,Q(s,a;θ)表示主Q网络的输出,并用于评估与当前状态和操作相对应的值函数。Q(st+1,a;θ-)表示目标Q网络的输出。Q网络由三层网络组成。输入层完全连接到具有v个节点的隐藏层。每个隐藏层的值是
vt=g(W1×xt+b1) (6)
其中xt表示输入向量,g是整流后的激活函数,W1是权重矩阵,b1是偏差向量。然后,隐藏层完全连接到输出层。Q网络的输出是系统状态下所有可行调度规则的作用值,即
Q(st,a)=g(W2×vt+b2) (7)
其中W2是权重矩阵,b2是阈值矩阵。输出是具有最大操作值的调度规则。
2.经验回放
在飞机大修车间系统中,相邻状态之间的相关性特别高。因此,如果将这些数据用于顺序训练,则神经网络的稳定性不够高。鉴于此,我们使用经验重播的方法来训练Q网络,这可能会破坏数据之间的关联。具体方法是在学习过程中建立“经验回放”。将所有st,at,st+1和rt存储在内存中一段时间。训练神经网络时,会从内存中随机选择一些数据进行训练,这会破坏原始数据的顺序并削弱数据的相关性。
第五步,飞机大修实时调度
经过第四步的DQN训练后,用于飞机大修车间实时调度的Q网络参数被固定。当输入飞机大修车间实时状态时,DQN输出合适的调度规则,用于当前时刻的飞机大修车间实时调度。在完成本次调度后,飞机大修车间进入下一个状态,直至飞机大修任务全部修理完成。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (2)

1.一种基于DQN的飞机大修车间实时调度方法,其特征在于具体步骤如下:
步骤一:利用物联网技术收集飞机大修车间中产生的实时信息,所述实时信息包括加工机器的完好率,任务缓冲区中的任务总数以及机器数量;
步骤二:通过步骤一获取飞机大修车间的实时信息后,将飞机大修实时调度模型构造为马尔科夫决策模型,将实时信息转化为实时状态;构筑所述马尔科夫决策模型包括状态空间设置、动作空间设置和奖励函数设置;
1)状态空间设置:通过3个特征变量μt、Et、Bt来定义飞机大修车间的实时状态;其中,μt表示加工机器在时间步t的完好率,Et表示在时间步t缓冲区中所有任务的预期平均EPT,Bt代表在时间步t处缓冲区的容量比;
2)动作空间设置:采用先进先出、最短处理时间、最长处理时间三种作业车间调度规则作为马尔科夫决策模型的动作;
3)奖励函数设置:奖励函数包括即时奖励和最终奖励,所述即时奖励r1由当前时刻车间所处的环境给定,公式如下:
Figure FDA0002337524640000011
其中,V是所有机器修理时间的方差,tm是机器mj截止到当前时刻的总的修理时间,
Figure FDA0002337524640000012
是t1到tm的平均值,C1是一个设定的常数;
所述最终奖励r2是等到所有的任务处理完,根据完工时间计算而得,公式如下:
Figure FDA0002337524640000013
其中C2和C3是常数,TMS是完工时间;
步骤三:通过步骤一和步骤二得出飞机大修车间实时状态,将所述实时状态信息存储在记忆库中,随机抽取部分状态信息、动作以及奖励进行DQN训练;
步骤四:经过步骤一至步骤三,DQN完成训练;在实际飞机大修车间调度中,将车间实时状态输入到训练完成的DQN中,然后输出调度规则,用于飞机大修车间的动作;以上为一个闭环过程,一直持续直至所有大修任务修理完成。
2.根据权利要求1所述基于DQN的飞机大修车间实时调度方法,其特征在于:所述DQN的训练过程包括Q网络和经验回放,所述Q网络包括主Q网络和目标Q网络。
CN201911362387.4A 2019-12-26 2019-12-26 一种基于dqn的飞机大修车间实时调度方法 Active CN111160755B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911362387.4A CN111160755B (zh) 2019-12-26 2019-12-26 一种基于dqn的飞机大修车间实时调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911362387.4A CN111160755B (zh) 2019-12-26 2019-12-26 一种基于dqn的飞机大修车间实时调度方法

Publications (2)

Publication Number Publication Date
CN111160755A true CN111160755A (zh) 2020-05-15
CN111160755B CN111160755B (zh) 2023-08-18

Family

ID=70556614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911362387.4A Active CN111160755B (zh) 2019-12-26 2019-12-26 一种基于dqn的飞机大修车间实时调度方法

Country Status (1)

Country Link
CN (1) CN111160755B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598309A (zh) * 2020-12-29 2021-04-02 浙江工业大学 基于Keras的作业车间调度方法
CN113112051A (zh) * 2021-03-11 2021-07-13 同济大学 一种基于增强学习的串行生产系统生产维护联合优化方法
CN113506048A (zh) * 2021-09-09 2021-10-15 宁波帅特龙集团有限公司 一种柔性作业车间的调度方法
CN114862170A (zh) * 2022-04-27 2022-08-05 昆明理工大学 一种用于通信设备制造过程的学习型智能调度方法、系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103390195A (zh) * 2013-05-28 2013-11-13 重庆大学 一种基于强化学习的机械车间任务调度节能优化系统
US20170032245A1 (en) * 2015-07-01 2017-02-02 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Providing Reinforcement Learning in a Deep Learning System
US20180089553A1 (en) * 2016-09-27 2018-03-29 Disney Enterprises, Inc. Learning to schedule control fragments for physics-based character simulation and robots using deep q-learning
CN108964042A (zh) * 2018-07-24 2018-12-07 合肥工业大学 基于深度q网络的区域电网运行点调度优化方法
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN109067842A (zh) * 2018-07-06 2018-12-21 电子科技大学 面向车联网的计算任务卸载方法
US20190005828A1 (en) * 2017-06-29 2019-01-03 The Boeing Company Method and system for autonomously operating an aircraft
CN109655066A (zh) * 2019-01-25 2019-04-19 南京邮电大学 一种基于Q(λ)算法的无人机路径规划方法
CN109829468A (zh) * 2018-04-16 2019-05-31 南京航空航天大学 基于贝叶斯网络的民机复杂系统故障诊断方法
US20190208467A1 (en) * 2017-12-29 2019-07-04 Huazhong University Of Science And Technology Method for cloudlet-based optimization of energy consumption
CN109976909A (zh) * 2019-03-18 2019-07-05 中南大学 边缘计算网络中基于学习的低延时任务调度方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103390195A (zh) * 2013-05-28 2013-11-13 重庆大学 一种基于强化学习的机械车间任务调度节能优化系统
US20170032245A1 (en) * 2015-07-01 2017-02-02 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Providing Reinforcement Learning in a Deep Learning System
US20180089553A1 (en) * 2016-09-27 2018-03-29 Disney Enterprises, Inc. Learning to schedule control fragments for physics-based character simulation and robots using deep q-learning
US20190005828A1 (en) * 2017-06-29 2019-01-03 The Boeing Company Method and system for autonomously operating an aircraft
US20190208467A1 (en) * 2017-12-29 2019-07-04 Huazhong University Of Science And Technology Method for cloudlet-based optimization of energy consumption
CN109829468A (zh) * 2018-04-16 2019-05-31 南京航空航天大学 基于贝叶斯网络的民机复杂系统故障诊断方法
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN109067842A (zh) * 2018-07-06 2018-12-21 电子科技大学 面向车联网的计算任务卸载方法
CN108964042A (zh) * 2018-07-24 2018-12-07 合肥工业大学 基于深度q网络的区域电网运行点调度优化方法
CN109655066A (zh) * 2019-01-25 2019-04-19 南京邮电大学 一种基于Q(λ)算法的无人机路径规划方法
CN109976909A (zh) * 2019-03-18 2019-07-05 中南大学 边缘计算网络中基于学习的低延时任务调度方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIA XIAOLIANG等: "Research and application on blank material dispatching lean management technology oriented aircraft part manufacturing", 《2008 IEEE INTERNATIONAL CONFERENCE ON AUTOMATION AND LOGISTICS》 *
刘括等: "基于实时信息的飞机部装车间物料配送框架" *
吴锋;马里;: "面向MES的装配作业调度系统研究", 杭州电子科技大学学报, no. 04 *
王立群;朱舜;韩笑;何军;: "基于深度Q值网络的自动小车控制方法", no. 11 *
肖鹏飞等: "基于深度强化学习的非置换流水车间调度问题" *
蔡忠义;陈云翔;朱亚明;康海滨;: "军用飞机大修效率评估方法", 火力与指挥控制, no. 05 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598309A (zh) * 2020-12-29 2021-04-02 浙江工业大学 基于Keras的作业车间调度方法
CN112598309B (zh) * 2020-12-29 2022-04-19 浙江工业大学 基于Keras的作业车间调度方法
CN113112051A (zh) * 2021-03-11 2021-07-13 同济大学 一种基于增强学习的串行生产系统生产维护联合优化方法
CN113112051B (zh) * 2021-03-11 2022-10-25 同济大学 一种基于增强学习的串行生产系统生产维护联合优化方法
CN113506048A (zh) * 2021-09-09 2021-10-15 宁波帅特龙集团有限公司 一种柔性作业车间的调度方法
CN114862170A (zh) * 2022-04-27 2022-08-05 昆明理工大学 一种用于通信设备制造过程的学习型智能调度方法、系统
CN114862170B (zh) * 2022-04-27 2024-04-19 昆明理工大学 一种用于通信设备制造过程的学习型智能调度方法、系统

Also Published As

Publication number Publication date
CN111160755B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN111160755A (zh) 一种基于dqn的飞机大修车间实时调度方法
CN112615379B (zh) 基于分布式多智能体强化学习的电网多断面功率控制方法
CN112884239B (zh) 一种基于深度强化学习的航天起爆器生产调度方法
CN109388484B (zh) 一种基于Deep Q-network算法的多资源云作业调度方法
Guo et al. Applications of particle swarm optimisation in integrated process planning and scheduling
CN111861039A (zh) 基于lstm和广义预测控制算法的电力负荷预测方法、系统、设备及存储介质
Lim et al. Fast scheduling of semiconductor manufacturing facilities using case-based reasoning
Bremer et al. Sampling the Search Space of Energy Resources for Self-organized, Agent-based Planning of Active Power Provision.
CN110414826A (zh) 一种云制造环境下柔性多任务前摄性调度优化方法
CN109214559A (zh) 物流业务的预测方法及装置、可读存储介质
CN112836974B (zh) 一种基于dqn和mcts的箱区间多场桥动态调度方法
CN115940294B (zh) 多级电网实时调度策略调整方法、系统、设备及存储介质
CN115454005A (zh) 一种面向有限运输资源场景的制造车间动态智能调度方法及装置
CN111144710A (zh) 一种可持续性混合流水车间的构建和动态调度方法
CN115793657B (zh) 基于时态逻辑控制策略的配送机器人路径规划方法
CN114565247A (zh) 一种基于深度强化学习的车间调度方法、装置和系统
CN107357267B (zh) 基于离散花朵授粉算法求解混合流水线调度问题的方法
Qu et al. Dynamic scheduling in modern processing systems using expert-guided distributed reinforcement learning
CN111401769A (zh) 一种基于深度强化学习的配电网故障智能抢修方法及装置
CN117331700A (zh) 一种算力网络资源调度系统及方法
CN117149410A (zh) 一种基于ai智能模型训练调度指挥监控系统
CN117215789A (zh) 数据处理任务的资源配置方法、装置和计算机设备
CN115022231B (zh) 一种基于深度强化学习的最优路径规划的方法和系统
CN110674470A (zh) 一种动态环境中多机器人的分布式任务规划方法
Tran et al. A cloud QoS-driven scheduler based on deep reinforcement learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant