CN117669988A - 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 - Google Patents
一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 Download PDFInfo
- Publication number
- CN117669988A CN117669988A CN202311811947.6A CN202311811947A CN117669988A CN 117669988 A CN117669988 A CN 117669988A CN 202311811947 A CN202311811947 A CN 202311811947A CN 117669988 A CN117669988 A CN 117669988A
- Authority
- CN
- China
- Prior art keywords
- job
- neh
- sequence
- pdr
- priority
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 23
- 230000006872 improvement Effects 0.000 title abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000003780 insertion Methods 0.000 claims abstract description 25
- 230000037431 insertion Effects 0.000 claims abstract description 25
- 230000008569 process Effects 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 5
- 230000002787 reinforcement Effects 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000003754 machining Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Manufacturing & Machinery (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- General Factory Administration (AREA)
Abstract
本发明公开了一种基于Q‑Learning算法改进NEH的装配式预制构件生产调度方法,涉及生产调度技术领域。为了改进NEH启发式算法中的插入规则,从而能够搜索更为广阔的可行解空间进而更好的适用不同的PFS问题实例。本发明提出了一种基于Q‑Learning算法改进NEH的装配式预制构件生产调度方法,通过构建一个PDR库,用强化学习算法Q‑Learning来持续的选择PDR,逐个确定每一个作业的加工优先级,调度目标是最小化作业最大完工时间(Makespan)。本发明的有益效果为:以被广泛应用于工程领域的NEH启发式算法为基础,提高了其对不同实例的适应能力,降低了调度目标Makespan,从而提高生产效率。
Description
技术领域
本发明涉及生产调度技术领域,特别涉及一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法。
背景技术
装配式预制构件生产流程可划分为组模、放置钢筋和埋件、浇筑、养护、脱模、精加工六道工序,每道工序均设一个工作站对预制构件加工,各类预制构件在上述六道工作站按相同的程序进行生产,但是不同构件在不同工序上的处理时间不同,构件根据排序依次进入流水生产线,最终完成生产。
装配式预制构件生产流程属于一种典型的置换流水车间调度(PFS)问题。为优化作业的完工时间,目前被广泛应用的求解启发式算法为NEH算法,它是一种以总处理时间越大的作业越优先插入队列中确定作业序列的方法。因为对于总处理时间相同的作业安排随机且启发式算法很难在不同实例问题中都有良好效果。因此,改变作业插入优先级是改进NEH调度能力的关键。
优先级规则(PDR)因其计算资源占用少、计算效率高的优势,适合构建作业插入规则库,它是以作业属性来确定作业的优先级。强化学习算法因其强大的探索和学习能力,能够用来选择确定作业插入PDR,可改进NEH去适用不同的PFS问题实例的能力。
发明内容
针对以上问题,本发明提出了一种基于Q-Learning算法改变NEH算法中从未确定加工优先级的作业中选择作业的规则,从而提升NEH算法在求解PFS问题方面的性能。
为了改进NEH启发式算法中的插入规则,从而能够搜索更为广阔的可行解空间进而更好的适用不同的PFS问题实例。本发明提出了一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法,通过构建一个PDR库,用强化学习算法Q-Learning来持续的选择PDR,逐个确定每一个作业的加工优先级,调度目标是最小化作业最大完工时间(Makespan)。
本发明是通过如下措施实现的:一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法包括:插入规则库的构建;基于NEH调度过程确定Q-Learning训练所需要的元素;通过Q-learning算法训练得到为作业序列提供依据的Q表格;依据Q表格进行作业序列的确定。
所述插入规则库的设置包括作业参数的选择和PDR库的组建。
所述作业参数的选择是选择与作业在工序上被处理时间相关的作业属性,包括每个工序处理作业的时间和整个工艺流程处理作业的总时间。共选择了m+1个作业属性,其中,m表示工序的数量。
所述PDR库的构建是选择已确定好的作业属性为参数的PDR,每个作业属性对应两个PDR,分别为最短时间优先规则和最长时间优先规则。因此,共选择了2(m+1)个PDR组成插入规则库I,表达式如式(1)所示。SPTi表示以作业在工序i上被处理的时间为参数进行增序排列的优先规则,LPTi表示以作业在工序i上被处理的时间为参数进行降序排列的优先规则,STPT表示以作业的总处理时间为参数进行增序排列的优先规则,LTPT表示以作业的总处理时间为参数进行降序排列的优先规则。
I={SPTi,LPTi,STPT,LTPT|i=1,2,…,m} (1)
所述Q-learning算法训练过程所需要的状态、动作、奖励、智能体与环境的交互过程设计如下所述:
状态(S):确定一个作业的加工优先级时定义为一个状态。因为第一个被加工的作业时间是不确定的,导致初始状态不固定。因此,本发明设定一个虚拟作业,该作业被所有机器的处理时间都为0,它不会影响生产系统的Makespan。因此,共有n+1个状态,n表示实际需要加工作业的数量,状态集S={s1,s2,…,sn+1},其中,作业的索引比状态索引小1。
动作(A):在每一个状态下,从插入规则库中选择一个PDR对剩余作业设定优先级,选择优先级高的作业处理。由插入规则库中PDR数量得动作集A中共有个2(m+1)动作,A={a1,a2,…,a2(m+1)}。
奖励(R):确定一个作业加工优先级后,已确定的作业优先级的作业序列的Makespan的相反数定义为奖励,如式(2)所示,表示已确定作业加工优先级中优先级最高的作业,其中,C(t,m)表示作业t的Makespan。因为需要确定加工优先级的作业有n个,因此奖励集R={r1,r2,…,rn}。
rt=-C(t,m) (2)
智能体与环境的交互过程:智能体是选择动作的Q表格,环境为NEH的调度过程。交互过程定义为当环境的处于某个状态时,智能体从插入规则库中选择一个PDR,使用该PDR确定未调度作业的加工优先级,从其中选择最高加工优先级的作业进而将该作业插入到已调度完成的作业序列中,然后环境转移到下一个状态。每次交互环境都会给智能体一个奖励反馈。从环境的初始状态持续转移到状态sn+1定义为一轮智能体与环境的交互。
通过Q-learning算法训练得到为作业序列提供依据的Q表格,包括包括初始化Q表格、Q-learning训练和Q表格的更新。
所述初始化Q表格是生成一个n+1行、2(m+1)列的Q表格,Q表格中的元素全部为足够小的一个负数。
所述Q表格的更新是根据式(3)进行更新,其中表示Q表格第在状态st下选择动作a对应的价值,α表示学习率,γ表示折扣系数,其中,作业的索引比状态的索引少1表示作业的索引比Q表格行索引少1。
所述作业序列的确定是根据最终确定的Q表格,按照Q表格每行最大值的列索引确定插入顺序进而选择需要被插入的作业,基于NEH调度过程获得作业序列,按顺序往已确定作业序列中插入作业,最终确定作业序列。
本发明提出的一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法的有益效果在于:本发明提出的是一种静态调度方法,构建一个插入PDR库,然后基于NEH的插入作业的流程,设计Q-Learning训练所需要的状态、动作、奖励和智能体与环境的交互过程。上述过程使用Q-Learning算法打破NEH调度方法选择插入作业的顺序,进而提高NEH优化调度系统makespan和增强对不同调度实例的适用的能力。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中使用的附图作一简单地介绍,显而易见地,下面所列附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法的流程图;
图2为调度算法训练时的收敛过程;
图3为调度方法鲁棒性表达。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参见图1-图3,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一个实施例中,收集了48种预制构件作为一个调度系统的作业,认为每个预制构件被每个工序上的处理时间包括了作业在工序之间的运输时间,每个工序的加工过程不出现中断现象且不考虑插单的扰动,48个预制构件作业的加工信息如下表所示,单位为小时。
包含上述作业的调度系统的makspanCmax求解过程如式(4)-(8)所示。其中,π(j)表示优先级为j的作业索引,pπ(j),i表示作业π(j)在工序i上被处理所需的时间,C(π(j),i)表示作业π(j)被工序i的完成时间,n表示调度系统中的作业总数量,本实施例中n=48,m表示工艺流程中工序的数量,本实施例中m=6。
C(π(1),1)=pπ(1),1 (4)
C(π(j),1)=C(π(j)-1,1)+pπ(j),1 j>1 (5)
C(π(1),i)=C(π(1),i-1)+pπ(1),i i>1 (6)
C(π(j),i)=max(C(π(j)-1,i),C(π(j),i-1))+pπ(j),i i,j>1 (7)
Cmax=C(π(n),m) (8)
如图1所示,一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法的流程包括构建PDR库、基于NEH调度过程确定Q-Learning训练所需要的元素、初始化Q表格、Q-Learning训练、更新Q表格、确定作业的插入顺序、基于NEH调度过程获得作业序列。
构建PDR库:以作业分别被各工序上的处理时间和作业的总处理时间为参数,选择最短和最长处理时间优先规则对应的13个PDR构建PDR库。
基于NEH调度过程确定Q-Learning训练所需要的元素:实施例中Q-Learning训练所需要元素应包括状态、动作、奖励、智能体与环境的交互过程。
NEH选择被插入作业的规则是最短总处理时间优先规则。每选择一个作业并确定它在已经确定的作业序列中的优先级后,完成状态的转移,因为本发明对插入规则的破坏,第一个被加工的作业无法在初始状态确定,在初始状态设定一个虚拟作业,该作业被所有机器的处理时间都为0。因此,本实施例共有49个状态,S={s1,s2,…,s49},其中,作业的索引比状态索引小1,其中,s1为初始状态。
动作则是每次确定将要插入的作业而从PDR库中选择PDR的过程,因为PDR库中共有13个PDR。因此,动作集A={a1,a2,…,a13}。
奖励为每确定一个作业的优先级后,所有确定作业优先级的作业完工时间的相反数,如式(2)所示。因为实施例中共有48个作业,虚拟作业的作业序列固定且完成它所需要的时间为0,因此奖励集R={0,r2,r3,…,r49}。
智能体与环境的交互过程当环境处于状态sj时,智能体从PDR库中选择一个PDR确定剩余未确定加工优先级作业的优先级,优先级最高的作业为该状态下插入到确定加工优先的作业序列中,加入NEH方法,然后环境给智能体一个奖励反馈,状态转移到sj+1。当状态转移到s49时,本实施例智能体与环境的一轮交互完成。
初始化Q表格:Q表格为一个49×13的矩阵,矩阵中的元素设定为一个小于0且足够小的数,为-1000。
Q-Learning训练:根据式(3)更新Q表格。设置的各参数如下α=0.9,γ=0.95,选择动作的贪婪系数ε=0.05。
更新Q表格:设定迭代次数为100,迭代完成后,获得最终的Q表格,进而指导该实施例作业序列的确定。
确定作业的插入顺序:从Q表格的第0行开始,Q表格中每行的最大值的列索引为选择的插入规则,该插入规则为剩余未插入的作业设定加工优先级,最高加工优先级的作业优先插入,然后转移到作业索引加1行的Q表格中,然后迭代上述过程。
基于NEH调度过程获得作业序列:依次选择作业插入过程,使用NEH的调度方法,按顺序往已确定作业序列中插入作业,最终确定作业序列。
为了测试使用Q-Learning改进NEH的调度方法(INEH)在求解Makespan调度目标中的优越性和鲁棒性,运行了10次后与NEH性能的对比如图2所示,INEH的运行10次的标准差为2.46,且每次运行结果都比NEH性能优越。
为了验证本发明所提方法在不同调度系统中的性能优越性,从表1中的随机选取10、15、20、25、30、35、40、45个作业,每个规模的作业随机选取5次,与NEH效果对比如下表所示,对比指标是每个作业规模的5个调度系统makespan的平均值,证明了本发明所提方法的优越性。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法,其特征在于,包括:
插入规则库的构建;
基于NEH调度过程确定Q-Learning训练所需要的元素;
通过Q-learning算法训练得到为作业序列提供依据的Q表格;
依据Q表格进行作业序列的确定。
2.根据权利要求1所述生产调度方法,其特征在于,所述插入规则库的构建包括包括作业参数的选择和PDR库的组建。
3.根据权利要求2所述生产调度方法,其特征在于,所述作业参数的选择是选择与作业在工序上被处理时间相关的作业属性,包括每个工序处理作业的时间和整个工艺流程处理作业的总时间;
所述PDR库的组建是选择已确定好的作业属性为参数的PDR,每个作业属性对应两个PDR,分别为最短时间优先规则和最长时间优先规则。
4.根据权利要求3所述生产调度方法,其特征在于,所述基于NEH调度过程确定Q-Learning训练所需要的元素包括状态、动作、奖励、智能体与环境的交互过程。
5.根据权利要求4所述生产调度方法,其特征在于,所述状态是确定一个作业的加工优先级时定义为一个状态;
动作是在每一个状态下,从插入规则库中选择一个PDR对剩余作业设定优先级,选择优先级高的作业处理;
奖励是确定一个作业加工优先级后,已确定的作业优先级的作业序列的Makespan的相反数定义为奖励;
智能体与环境的交互过程是:智能体是选择动作的Q表格,环境为NEH的调度过程,交互过程定义为当环境的处于某个状态时,智能体从插入规则库中选择一个PDR,使用该PDR确定未调度作业的加工优先级,从其中选择最高加工优先级的作业进而将该作业插入到已调度完成的作业序列中,然后环境转移到下一个状态。
6.根据权利要求1所述生产调度方法,其特征在于,通过Q-learning算法训练得到为作业序列提供依据的Q表格,包括初始化Q表格、Q-learning训练和Q表格的更新。
7.根据权利要求6所述生产调度方法,其特征在于,所述初始化Q表格是生成一个n+1行、2(m+1)列的Q表格,Q表格中的元素全部为足够小的一个负数。
8.根据权利要求6所述生产调度方法,其特征在于,所述Q表格的更新是根据下式进行更新,其中表示Q表格第在状态st下选择动作a对应的价值,α表示学习率,γ表示折扣系数,其中,作业的索引比状态的索引少1表示作业的索引比Q表格行索引少1,公式为:
9.根据权利要求8所述生产调度方法,其特征在于,依据Q表格进行作业序列的确定,包括根据最终确定的Q表格,按照Q表格每行最大值的列索引确定插入顺序:基于NEH调度过程获得作业序列,按顺序往已确定作业序列中插入作业,最终确定作业序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311811947.6A CN117669988B (zh) | 2023-12-26 | 2023-12-26 | 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311811947.6A CN117669988B (zh) | 2023-12-26 | 2023-12-26 | 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117669988A true CN117669988A (zh) | 2024-03-08 |
CN117669988B CN117669988B (zh) | 2024-07-05 |
Family
ID=90068227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311811947.6A Active CN117669988B (zh) | 2023-12-26 | 2023-12-26 | 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117669988B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681818A (zh) * | 2018-05-18 | 2018-10-19 | 昆明理工大学 | 一种齿轮机械加工过程的优化调度方法 |
CN110378462A (zh) * | 2019-06-22 | 2019-10-25 | 南京理工大学 | 求解带准备时间置换流水车间调度问题的改进eda算法 |
CN112734172A (zh) * | 2020-12-25 | 2021-04-30 | 南京理工大学 | 一种基于时序差分的混合流水车间调度方法 |
CN113935586A (zh) * | 2021-09-16 | 2022-01-14 | 杭州电子科技大学 | 基于深度强化学习的云订单动态接受与调度方法 |
KR20220121568A (ko) * | 2021-02-25 | 2022-09-01 | 창원대학교 산학협력단 | 강화학습을 이용한 생산공정의 스케줄링 장치 및 방법 |
CN115640898A (zh) * | 2022-10-27 | 2023-01-24 | 西南交通大学 | 一种基于ddqn算法的大规模柔性作业车间调度方法 |
CN115933568A (zh) * | 2022-12-27 | 2023-04-07 | 河南工业大学 | 一种多目标分布式混合流水车间调度方法 |
CN116466659A (zh) * | 2023-03-21 | 2023-07-21 | 昆明理工大学 | 一种基于深度强化学习的分布式装配流水车间调度方法 |
CN116542445A (zh) * | 2023-04-07 | 2023-08-04 | 沈阳工业大学 | 基于深度强化学习的装备制造车间智能调度方法和系统 |
CN116700176A (zh) * | 2023-06-19 | 2023-09-05 | 兰州理工大学 | 一种基于强化学习的分布式阻塞流水车间调度优化系统 |
-
2023
- 2023-12-26 CN CN202311811947.6A patent/CN117669988B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681818A (zh) * | 2018-05-18 | 2018-10-19 | 昆明理工大学 | 一种齿轮机械加工过程的优化调度方法 |
CN110378462A (zh) * | 2019-06-22 | 2019-10-25 | 南京理工大学 | 求解带准备时间置换流水车间调度问题的改进eda算法 |
CN112734172A (zh) * | 2020-12-25 | 2021-04-30 | 南京理工大学 | 一种基于时序差分的混合流水车间调度方法 |
KR20220121568A (ko) * | 2021-02-25 | 2022-09-01 | 창원대학교 산학협력단 | 강화학습을 이용한 생산공정의 스케줄링 장치 및 방법 |
CN113935586A (zh) * | 2021-09-16 | 2022-01-14 | 杭州电子科技大学 | 基于深度强化学习的云订单动态接受与调度方法 |
CN115640898A (zh) * | 2022-10-27 | 2023-01-24 | 西南交通大学 | 一种基于ddqn算法的大规模柔性作业车间调度方法 |
CN115933568A (zh) * | 2022-12-27 | 2023-04-07 | 河南工业大学 | 一种多目标分布式混合流水车间调度方法 |
CN116466659A (zh) * | 2023-03-21 | 2023-07-21 | 昆明理工大学 | 一种基于深度强化学习的分布式装配流水车间调度方法 |
CN116542445A (zh) * | 2023-04-07 | 2023-08-04 | 沈阳工业大学 | 基于深度强化学习的装备制造车间智能调度方法和系统 |
CN116700176A (zh) * | 2023-06-19 | 2023-09-05 | 兰州理工大学 | 一种基于强化学习的分布式阻塞流水车间调度优化系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117669988B (zh) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A hybrid fruit fly optimization algorithm for the realistic hybrid flowshop rescheduling problem in steelmaking systems | |
Nie et al. | Evolving scheduling rules with gene expression programming for dynamic single-machine scheduling problems | |
CN104268722B (zh) | 基于多目标进化算法的动态柔性作业车间调度方法 | |
CN111985672B (zh) | 一种多Agent深度强化学习的单件作业车间调度方法 | |
CN103309316A (zh) | 带有批处理机的多阶段变异混合流水车间调度方法 | |
CN111340345B (zh) | 一种基于改进粒子群算法的刀具调度方法 | |
CN111353646A (zh) | 带切换时间的炼钢柔性调度优化方法、系统、介质及设备 | |
CN116466659A (zh) | 一种基于深度强化学习的分布式装配流水车间调度方法 | |
CN115933568A (zh) | 一种多目标分布式混合流水车间调度方法 | |
CN115935616A (zh) | 一种一致批次的序列依赖流水车间组调度多目标优化方法 | |
CN112488543B (zh) | 基于机器学习的智慧工地智能排班方法及系统 | |
CN117669988B (zh) | 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 | |
CN113505910A (zh) | 一种含多路径有限连续输出库存的混合车间生产调度方法 | |
CN115793583B (zh) | 基于深度强化学习的流水车间新订单插入优化方法 | |
CN116562584A (zh) | 一种基于Conv-Dueling与泛化表征的动态车间调度方法 | |
CN116070826A (zh) | 一种铁路货车车身喷涂作业并行机调度方法 | |
CN114819660A (zh) | 一种动态演进的设计众包的人力资源任务匹配方法系统 | |
CN110928253B (zh) | 自动制造系统的动态加权启发式调度方法 | |
CN113792924B (zh) | 一种基于Deep Q-network深度强化学习的单件作业车间调度方法 | |
CN110716522A (zh) | 基于任意时间a*启发式搜索的制造企业车间调度优化方法 | |
CN118171892B (zh) | 一种考虑工人技能水平和疲劳程度的车间调度方法和装置 | |
CN114545884B (zh) | 基于增强拓扑神经进化的等效并行机动态智能调度方法 | |
Wang et al. | An Improved Spatial Scheduling Algorithm for Sub-Assembly in Shipbuilding | |
CN117519030B (zh) | 一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法 | |
CN116596236A (zh) | 一种基于蒙特卡洛树搜索算法的机加工柔性排产方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |