CN101216710A - 一种由计算机实现的自适应选择动态生产调度控制系统 - Google Patents

一种由计算机实现的自适应选择动态生产调度控制系统 Download PDF

Info

Publication number
CN101216710A
CN101216710A CNA2007101920152A CN200710192015A CN101216710A CN 101216710 A CN101216710 A CN 101216710A CN A2007101920152 A CNA2007101920152 A CN A2007101920152A CN 200710192015 A CN200710192015 A CN 200710192015A CN 101216710 A CN101216710 A CN 101216710A
Authority
CN
China
Prior art keywords
scheduling
workpiece
knowledge
state
learner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101920152A
Other languages
English (en)
Inventor
严洪森
杨宏兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CNA2007101920152A priority Critical patent/CN101216710A/zh
Publication of CN101216710A publication Critical patent/CN101216710A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)

Abstract

一种由计算机实现的自适应选择动态生产调度控制系统,其特征在于:设置包括系统仿真器、学习器、决策器、调度规则库、调度知识库、搬运小车、加工设备及其缓冲站,缓冲站设有光栅、传感器以及检测设备,工件到达缓冲站并被加工时,学习器检测当前系统状态进行学习,获取系统的动态调度知识,进而对调度知识库里的知识进行更新,当某加工设备需要调度时,决策器将根据检测到的系统状态,读取调度知识库中对应的调度知识,通过不断地与加工系统交互学习而获取新的调度知识,面向系统中加工设备及工件的状态来动态选取调度规则,选择最优的调度规则对该加工设备进行调度。本发明能够适应不稳定的、时变的车间动态生产环境,可以得到比现有的规则调度技术更好的工件排序,有效减少工序等待时间,提高企业产品交货期满足率。

Description

一种由计算机实现的自适应选择动态生产调度控制系统
技术领域
本发明涉及计算机集成制造技术和自动化技术领域,具体地是一种由计算机实现的自适应选择动态生产调度控制系统。
背景技术
由计算机实现的生产调度是通过计算机对一个可用的加工设备集在时间上进行加工零件集的分配,以满足一个性能指标集。具体地说,该调度的任务是在车间有限的资源约束下,确定工件在相关设备上的加工顺序和加工时间,以保证生产任务的执行时间或成本目标最优。按照工件到达车间的特点、车间环境变化情况等不同因素,可以把由计算机实现的生产调度系统分成静态调度系统和动态调度系统两大类。
实际生产中常常为了简化,调度模型通常只考虑静态问题,即问题的所有环境、任务在调度中都是已知的,所有安排加工的工件均处于待加工状态,而一次调度后,所有作业的加工就被确定了,在以后的加工过程中就不再改变。但在实际的生产过程中,不可避免地存在着大量的具有不确定性和随机性的动态事件,具体地说,这些动态事件可以分为以下三类:
1)与工件相关的事件,包括工件随机到达,工件加工时间不确定,交货期变化,定单变化,定单动态优先级,工序延误以及工件质量不稳定等。
2)与机器相关的事件,包括机器故障/修复,负载有限,机器阻塞/死锁等。
3)其它事件,包括产品需求量变化、原材料有缺陷,原材料拖期,以及与操作人员有关的操作失误等。
诸如此类动态事件发生常常导致实际的调度环境经常呈现动态的、不稳定的、时变的特性,然而静态调度模型严重依赖于已知的调度环境和任务,因此当静态调度模型面对这些实际生产中的不确定扰动时,所得到的调度结果与实际生产中期望值存在着较大偏差,调度效果往往不尽如人意。由此可见,对于加工任务和车间环境具有时变特点,或者制造环境具有一些不可预测扰动时,动态调度就显得尤为重要,也更能符合实际生产的需求。
经过对现有技术的文献检索发现,目前,解决动态调度问题的主要方法有:最优化方法、系统仿真方法、启发式方法、人工智能方法及计算智能方法等。当加工设备数M≥3的N个工件的调度问题就是NP困难(NP-hard)的,至今尚未找到多项式复杂程度的方法解决此问题,且随着调度问题规模的增大,动态调度的计算复杂性也呈指数上升。因此大多数方法都很难满足动态调度的实时性要求,而调度规则方法作为启发式方法的一种,具有对NP特性不敏感且实时性好等优点,是当前实际生产中应用最为广泛的一种方法。
虽然调度规则方法具有简单易用的特点,但其一般较难获得调度问题的最优解,有时满意解也不能得到,这是因为调度规则性能受到制造系统状态的影响,当制造系统状态发生变化时,原来效果较好的调度规则可能会变得平庸,导致单个调度规则缺乏全局性。
因此,当面对系统参数频繁变动的动态调度时,调度规则方法需要结合其它的方法,根据系统的变化情况来动态地选取合适的调度规则来进行调度,以适应车间环境的不断变化。Arzi等人在《IIETransactions》(31,217-230,1999)上撰文“Neural network-based adaptive production control system for aflexible manufacturing cell under a random environment(面向随机环境下柔性制造单元的基于神经网络自适应生产控制系统)”,该文利用神经网络构建生产控制系统,选取合适的调度规则进行调度。但该方法训练时间长,对结果的解释能力较差,且随着问题规模的增大,网络结构会变得更加复杂,也存在着训练样本获取困难的缺点。
发明内容
本发明的目的是针对现有技术的不足,提出一种由计算机实现的自适应选择动态生产调度控制系统,以适应调度环境和任务存在不可预测扰动的情况,从而可以得到比现有的动态调度方法更为有效的优化技术,有效地减少工件等待时间,提高企业产品交货期满足率。
本发明思想是由计算机按照基本顺序算法方案(BSAS)对系统状态进行合理聚类而得到聚类状态,引入调度目标函数并提出一种调度优化方法,在现有调度规则的基础上,通过学习器与制造系统的不断交互而获取有效的调度知识,用于优化生产过程。通过以下技术方案实现的:
一种由计算机实现的白适应选择动态生产调度控制系统,其特征在于:设置包括系统仿真器、学习器、决策器、调度规则库、调度知识库、搬运小车、加工设备及其缓冲站,缓冲站设有光栅、传感器以及检测设备,工件到达缓冲站并被加工时,学习器检测当前系统状态进行学习,获取系统的动态调度知识,进而对调度知识库里的知识进行更新,当某加工设备需要调度时,决策器将根据检测到的系统状态,读取调度知识库中对应的调度知识,通过不断地与加工系统交互学习而获取新的调度知识,面向系统中加工设备及工件的状态来动态选取调度规则,选择最优的调度规则对该加工设备进行调度。
具体方法是通过建立调度优化目标函数,选取系统的状态特征,在定义系统的讦估函数Q(su c,av)及聚类状态su c基础上,采用基本顺序算法方案BSAS对系统仿真器产生的状态进行聚类,得到系统的聚类状态,通过B-Q学习方法的迭代学习模型对评估函数进行迭代,根据得到的评估函数值选取最优的调度规则对缓冲站中的工件进行实时调度。
系统状态特征的选取,具体如下:
定义加工系统的相对机器负载ω,然后选取调度规则性能影响较大的四个状态特征:平均交货因子f、系统利用率μ、相对机器负载ω和平均松弛时间ζ,其中,f=∑fi/Nd,fi是到达系统第j个工件的交货因子;μ是加工设备中当前非空闲加工设备数和总的加工设备数之比;若ζj,表示第j个工件的松弛时间,有 ζ j = d j - t - Σ q = k d k j p jq , 其中t是当前时刻,pjq表示第j个工件的工序q所需加工时间(若工序q正在被加工,则pjq为该工序的剩余加工时间),kd是工件正在被加工或等待加工的工序数,kj表示工件j的工序总数,则有ζ=(∑ζj)/Nd。因此系统状态si可用四元组表示,即si=(ω,f,μ,ζ)。
系统聚类状态的得到,具体如下:
采用比例因子法对状态特征值进行标准化预处理,然后基于基本顺序算法方案(BSAS)对系统状态进行聚类,聚类过程中采用欧几里德(Euclidean)距离法计算状态si到聚类Cl的不相似性测度d(si,Cl),进而得到聚类状态su c
评估函数Q(su c,av)及聚类状态su c的确定,具体如下:
系统从t时刻的聚类状态st c开始,根据某个控制策略执行动作(调度规则)at,则此后也遵循该策略执行所得的折算累积回报期望值,称之为状态一动作对(st c,at)的评估函数,记为Q(st c,at)。通过BSAS对系统状态进行聚类并得到x个聚类,则把第u个聚类中所有系统状态的中心称为聚类状态su c,故共有x个聚类状态,记为sc=su c(u=1,2,…,x)。
B-Q学习方法的迭代学习模型,具体如下:
确定系统最优评估函数Q*(su c,av),即系统最大的折算累积回报期望值。B-Q学习方法的迭代学习模型为
Figure S2007101920152D00031
式中γ(0≤γ<1)是对延迟回报的折扣因子,rt+1为加工设备选择某个调度规则后系统的立即回报值,立即回报值的设定是与调度目标函数相关联的,φ(n)是循环次数n的函数,αn为步长参数,其中:
Δ Θ 1 = r t + 1 + γ max a Q n - 1 ( s t + 1 c , a ) - Q n - 1 ( s t c , a t ) - Θ
Δ Θ 2 = r t + 1 + γ max a Q n - 1 ( s t + 1 c , a ) - Q n - 1 ( s t c , a t ) + Θ
式中的Θ为引入的评估函数阈值。当Qn(st c,at)收敛到最优评估函数Q*(su c,av)时停止迭代。
按如下步骤对加工设备缓冲站中的工件队列进行动态调度:
(1)按下列公式分别对平均交货因子f、系统利用率μ、相对机器负载ω和平均松弛时间ζ赋值,并把这些赋值保存在计算机中:
f=∑fj/Nd
μ=Nb/Nm
Figure S2007101920152D00034
ζ=(∑ζj)/Nd
(2)学习器通过基本顺序算法方案BSAS得到系统的聚类状态sh c,赋初始值给评估函数Q0(su c,av),置循环次数n=1,并存储到计算机中,决策器任意选择调度规则库中的调度规则对空闲加工设备缓冲站中的工件队列进行调度;
(3)学习器检测系统当前时刻t的状态st,通过计算不相似性测度d(st,Cl)并按照 d ( s t , C u ) = min 1 ≤ l ≤ x d ( s t , C l ) 计算,获得系统聚类状态st c
(4)决策器根据ε-greedy法选择调度规则av对加工设备缓冲站中的工件队列进行调度;
(5)决策器检测并判断工件是否已经加工完毕,若还有待加工工件,则学习器观察t+1时刻制造系统的状态st+1,计算不相似性测度得到当前系统聚类状态st+1 c,此时学习器会接受到一个立即回报值rt+1’调用B-Q学习迭代模型公式计算评估函数Qn(st c,at)值并存储在计算机中,学习器用学习到的新调度知识对调度知识库里面的知识进行更新;若工件已经加工完毕,则转入步骤(10);
(6)学习器用聚类状态st+1 c替换st c,并更新循环次数:n=n+1;
(7)学习器判断所有评估函数是否已经是最优评估函数Q*(su c,av),若还有评估函数未达到最优,则转入步骤(4);
(8)调度决策模块检测系统当前状态,决策器调用知识库中的对应调度知识对加工设备缓冲站中的工件进行调度;
(9)判断制造系统中所有工件是否都已加工完毕,若还有剩余未加工工件,转步骤(8);否则转步骤(10);
(10)结束整个生产调度过程。
为有效地减小学习过程中Q(st c,at)的波动,有利于提高学习效果。所述的学习器在B-Q学习过程中引入了评估函数阈值。
在给出一种由计算机实现的调度规则自适应选择及其生产控制之前,还需完成如下几个步骤:步骤1如何最小化产品拖期是制造企业非常关心的问题,为此建立最小化平均拖期的目标函数为:
式中,是工件拖期完工惩罚因子,dj为第j个工件的理想交货期,工件的实际完工时间为Cj
N是总的加工工件数,工件集合表示为J={J1,J2,…,JN},每个工件都由多工序组成。
步骤2基于将要优化的调度目标函数Obj,设定系统的立即回报值r。
步骤3选取对调度规则性能影响较大的四个状态特征:平均交货因子(average flow allowance factor)f、系统利用率(system utilization)μ、相对机器负载(relative machine workloads)ω和平均松弛时间(average slack time)ζ,对系统状态进行描述,因此状态si是由四元组组成的,即si=(ω,f,μ,ζ)。其中,
Figure S2007101920152D00042
ωmax是机器最大负载,
Figure S2007101920152D00043
为平均机器负载;f=∑fj/Nd,fj是到达系统第j个工件的交货因子;μ是加工设备中当前非空闲加工设备数和总的加工设备数之比;若ζj表示第j个工件的松弛时间,有 ζ j = d j - t - Σ q = k d k j p jq , 其中t是当前时刻,pjq表示第j个工件的工序q所需加工时间(若工序q正在被加工,则pjq为该工序的剩余加工时间),kd是工件正在被加工或等待加工的工序数,kj表示工件j的工序总数,则有ζ=(∑ζj)/Nd
本发明的优点及有益效果:本发明解决了背景技术中存在的问题。该调度技术是根据制造系统的瞬时状态,动态地选取最有效的调度规则对缓冲站中工件进行调度,以减少工件拖期现象的发生。嵌入到学习器中的B-Q学习方法模块具有很强的自学习能力,对那些因加工环境的变化或者某些不确定因素的发生而导致系统状态变化的动态调度,本控制决策系统将会通过学习来获取新的调度知识,以适应这些调度环境的变化。在实际生产中,动态调度的先验知识和精确的训练样本一般是很难得到的,该控制决策系统在学习过程中,是不需要任何先验知识或者精确的训练样本,这就使得本发明具有更广泛的适用性。本控制决策系统中学习器的学习以及对调度知识库中的知识更新完全可以通过离线学习来完成,这对保证实际生产中的调度实时性要求是很有意义的。本发明可以得到比现有的规则调度更好的调度效果,可使所有加工工件的平均拖期时间减少10%-50%,可用于多种制造业领域的优化调度。加工设备的缓冲站均带有光栅以及传感器等一些检测设备,能够实时读取缓冲站中工件的类型和数量,学习器和决策器具有对系统状态进行实时监控、数据采集、信息处理及决策的能力。
附图说明
图1是由计算机实现的自适应选择动态生产调度控制系统意图;
图2是由计算机实现的自适应选择动态生产调度控制系统的工作原理示意图。
具体实施方式
结合本发明技术的内容进一步提供以下实施例:
本发明提供的一种由计算机实现的自适应选择动态生产调度控制系统,请参见图1,具体包括如下几个步骤:
步骤l  对系统状态进行聚类,得到系统的聚类状态:
1.1初始化聚类数x=1,i=1,置最大聚类数为K,系统仿真器产生的状态数为κ。运行系统仿真器,学习器得到仿真器产生的初始状态s1,对s1进行特征标准化处理,得到第x个聚类 C x = { s 1 } · d ( s t , C u ) = min 1 ≤ l ≤ x d ( s t , C l ) ;
1.2 i=i+1,对制造状态si(2≤i≤κ)进行特征标准化处理,采用欧几里德(Euclidean)距离法计算状态si到聚类Cl(1≤l≤x)的不相似性测度d(si,Cl),得到与si不相似性测度最小的聚类Ch,即 d ( s i , C h ) = min 1 ≤ l ≤ x d ( s i , C l ) ;
1.3如果x<K,且d(si,Ch)>Ω,Ω为基本顺序算法方案(BSAS)的不相似性阈值,则有x=x+1,聚类Cx={si},否则将状态sj聚类到Ch中,即有Ch=Ch∪si,并重新计算聚类状态sh c。返回步骤1.2,直至将所有κ个状态聚类完毕,可得到x个聚类Cl和聚类状态su c,l=1,2,…,x,u=l,2,…,x。
步骤2初始化所有动作-状态对(su c,av)的评估函数,记为Q0(su c,av),u=1,2,…,x,v=1,2,…,β。置循环次数n=1。在制造系统运行的初始时刻t0,从动作集(调度规则集)中任意选择动作(调度规则)at0对空闲加工设备缓冲站中的工件队列进行调度。
步骤3学习器检测制造系统当前时刻t的状态st,计算不相似性测度d(st,Cl),l=1,2,…,x,得到 d ( s t , C u ) = min l ≤ l ≤ x d ( s t , C l ) , 则t时刻的聚类状态 s t c = s u c .
步骤4决策器根据ε-greedy法选择动作(调度规则)av对加工设备缓冲站中的工件队列进行调度,即以概率(1-ε)选择具有最大评估函数值
Figure S2007101920152D00055
的动作(调度规则)av,以概率ε随机选取调度规则集A中其它动作,即at=av,av∈A,A={a1,a2,…,aβ}。
步骤5判断制造系统中所有工件是否都已加工完毕,若还有剩余未加工工件,转步骤6;否则停止迭代,转步骤10。
步骤6观察t+1时刻制造系统的状态St+1,计算不相似性测度得到当前系统聚类状态St+1 c,此时学习器会收到一个立即回报值rt+1利用下列B-Q学习方法的迭代模型
Figure S2007101920152D00056
对评估函数Qn(su c,av)进行迭代调整。上式中γ(0≤γ<1)是对延迟回报的折扣因子,rt+1为加工设备选择某个调度规则后系统的立即回报值,φ(n)是循环次数n的函数,an为步长参数,可由下式得到:
α n = ( s t c , a t ) = C α / ( 1 + visits n ( s t c , a t ) )
式中Ca是步长参数的权系数变量,visitsn(st c,at)表示在n次循环中,状态一动作对(st c,at)被访问的总次数。B-Q学习方法的迭代模型公式中的ΔΘ1、ΔΘ2为:
Δ Θ 1 = r t + 1 + γ max a Q n - 1 ( s t + 1 c , a ) - Q n - 1 ( s t c , a t ) - Θ
Δ Θ 2 = r t + 1 + γ max a Q n - 1 ( s t + 1 c , a ) - Q n - 1 ( s t c , a t ) + Θ
式中Θ为引入的评估函数阈值。
步骤7用聚类状态st+1 c替换st c,n=n+1,循环步骤4~步骤7,直到学习到所有动作-状态对的最优评估函数Q*(su c,av)。
步骤8用学习到的新调度知识更新调度知识库里的已有调度知识,用于对加工设备缓冲站中的工件进行动态调度。
步骤9判断制造系统中所有工件是否都已加工完毕,若还有剩余未加工工件,转步骤8;否则转步骤10。
步骤10程序结束。
用于实现上面所述技术的控制决策系统主要包括系统仿真器、学习器、决策器、调度规则库、调度知识库、搬运小车、加工设备及其缓冲站等,请参见图2,其执行动态调度的具体方案如下:
学习器运用B-Q学习方法进行迭代学习,得到系统的动态调度知识,进而对调度决策模块中的调度知识库里的调度知识进行更新。当制造系统中有处于空闲状态的加工设备,且其缓冲站中有等待被加工的工件时,决策器将会检测制造系统当前的状态,根据从调度知识库中读取到的调度知识,选择规则库里的调度规则对该加工设备缓冲站中工件进行调度,从而保证生产过程的有效执行。
本发明实施例中工件到达车间的时间间隔服从负指数分布,平均到达率为λ。工件j的工序总数kj为集合{1,2,…,6}中随机选取的整数,每道工序加工时间服从均匀分布U(upl,up2)。工件被随机分配到任意机器缓冲站中等待加工,且同一工件的相邻两道工序不能由同一个加工设备处理,共有M台加工设备。
图2调度规则库中调度规则选用最早交货期优先EDD、最短加工时间优先SPT和最小松弛时间优先MST三个常用规则。第j个工件的交货期dj设定如下:
d j = rt j + f j Σ q = 1 k j p jq
式中,pjq表示第j工件的工序q所需加工时间,kj表示工件j的工序总数,rtj是工件到达车间时刻,交货因子fj服从均匀分布,即fj~U(uf1,uf2)。由于本发明的目标函数是最小化平均拖期,而B-Q学习方法收敛于最大值,故将目标函数乘以负数转换成最大值问题,于是对B-Q学习方法中的立即回报值r设定如下:
Figure S2007101920152D00071
本发明实施例主要参数如下表所示。
    M     N     λ     up1     up2     uf1     uf2    ε     γ
    6     2400     1/5.5     2     13     1     6    0.15     0.7
定义每加工完成2400个工件称为一个episode,共对500个episode进行实验,考虑到车间各种随机因素的影响,依次对50个episode平均拖期的均值进行比较。根据本发明方法中实施步骤对实施例进行调度后,得到工件平均拖期的结果如下表所示,不难看出,本发明的调度技术大部分时间都优于其它三个调度规则,对于500个episode而言,工件平均拖期比最好的EDD规则降低改进约11.86%,比最差的SPT规则降低改进了43.17%。这样的改进程度显示了本发明与现有技术方案相比所具有显著的创造性与实用性。
  调度规则   每50个episode平均拖期的均值   总均值(500episode)
  1     2     3     4     5   6     7   8   9   10
  EDD   10.27     9.86     10.45     10.44     10.57   10.33     10.29   11.45   9.67   9.61   10.29
  MST   10.04     10.64     11.17     9.68     9.65   9.98     10.81   10.91   11.30   10.55   10.47
  SPT   16.09     15.59     17.14     15.59     14.87   16.59     14.59   16.40   16.48   16.26   15.96
  本发明   9.62     8.78     7.92     9.52     9.40   9.42     9.13   8.85   9.01   9.06   9.07
本发明是国家高技术研究发展计划现代制造集成技术专题资助项目(2007AA04Z112),国家自然科学基金资助项目(60574062,50475075)和高等学校博士学科点专项科研基金资助项目(20040286012)的共同成果。

Claims (4)

1.一种由计算机实现的自适应选择动态生产调度控制系统,其特征在于:设置包括系统仿真器、学习器、决策器、调度规则库、调度知识库、搬运小车、加工设备及其缓冲站,缓冲站设有光栅、传感器以及检测设备,工件到达缓冲站并被加工时,学习器检测当前系统状态进行学习,获取系统的动态调度知识,进而对调度知识库里的知识进行更新,当某加工设备需要调度时,决策器将根据检测到的系统状态,读取调度知识库中对应的调度知识,通过不断地与加工系统交互学习而获取新的调度知识,面向系统中加工设备及工件的状态来动态选取调度规则,选择最优的调度规则对该加工设备进行调度。
2.根据权利要求1所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于通过建立调度优化目标函数,选取系统的状态特征,在定义系统的评估函数及聚类状态基础上,采用基本顺序算法方案BSAS对系统仿真器产生的状态进行聚类,得到系统的聚类状态,通过B-Q学习方法的迭代学习模型对评估函数进行迭代,根据得到的评估函数值选取最优的调度规则对缓冲站中的工件进行实时调度。
3.根据权利要求2所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于,按如下步骤对加工设备缓冲站中的工件队列进行动态调度:
(1)按下列公式分别对平均交货因子f、系统利用率μ、相对机器负载ω和平均松弛时间ζ赋值,并把这些赋值保存在计算机中:
f=∑fj/Nd
μ=Nb/Nm
Figure S2007101920152C00011
ζ=(∑ζj)/Nd
(2)学习器通过基本顺序算法方案BSAS得到系统的聚类状态sh c,赋初始值给评估函数Q0(sn c,av),置循环次数n=1,并存储到计算机中,决策器任意选择调度规则库中的调度规则对空闲加工设备缓冲站中的工件队列进行调度;
(3)学习器检测系统当前时刻t的状态st,通过计算不相似性测度d(st,Cl)并按照 d ( s t , C u ) = min 1 ≤ l ≤ x d ( s t , C l ) 计算,获得系统聚类状态St c
(4)决策器根据ε-greedy法选择调度规则av对加工设备缓冲站中的工件队列进行调度;
(5)决策器检测并判断工件是否已经加工完毕,若还有待加工工件,则学习器观察t+1时刻制造系统的状态st+1,计算不相似性测度得到当前系统聚类状态st+1 c,此时学习器会接受到一个立即回报值rt+1,调用B-Q学习迭代模型公式计算评估函数Qn(st c,at)值并存储在计算机中,学习器用学习到的新调度知识对调度知识库里面的知识进行更新;若工件已经加工完毕,则转入步骤(10);
(6)学习器用聚类状态st+1 c替换st c,并更新循环次数:n=n+1;
(7)学习器判断所有评估函数是否已经是最优评估函数Q*(Sn c,av),若还有评估函数未达到最优,则转入步骤(4);
(8)调度决策模块检测系统当前状态,决策器调用知识库中的对应调度知识对加工设备缓冲站中的工件进行调度;
(9)判断制造系统中所有工件是否都已加工完毕,若还有剩余未加工工件,转步骤(8);否则转步骤(10);
(10)结束整个生产调度过程。
4.根据权利要求2或3所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于:为有效地减小学习过程中Q(st c,at)的波动,有利于提高学习效果。所述的学习器在B-Q学习过程中引入了评估函数阈值。
CNA2007101920152A 2007-12-28 2007-12-28 一种由计算机实现的自适应选择动态生产调度控制系统 Pending CN101216710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101920152A CN101216710A (zh) 2007-12-28 2007-12-28 一种由计算机实现的自适应选择动态生产调度控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101920152A CN101216710A (zh) 2007-12-28 2007-12-28 一种由计算机实现的自适应选择动态生产调度控制系统

Publications (1)

Publication Number Publication Date
CN101216710A true CN101216710A (zh) 2008-07-09

Family

ID=39623154

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101920152A Pending CN101216710A (zh) 2007-12-28 2007-12-28 一种由计算机实现的自适应选择动态生产调度控制系统

Country Status (1)

Country Link
CN (1) CN101216710A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101788819A (zh) * 2010-03-08 2010-07-28 清华大学 大规模生产过程一种基于迭代式分解和流松驰的调度方法
CN101727098B (zh) * 2008-10-21 2012-01-25 中芯国际集成电路制造(上海)有限公司 生产周期目标测量方法及系统
CN102360178A (zh) * 2011-08-16 2012-02-22 上海交通大学 用于混合并行机和作业车间的组批动态控制方法
CN102542411A (zh) * 2011-12-22 2012-07-04 浙江工业大学 基于aca模型的多品种多工艺制造企业车间调度控制方法
CN102799700A (zh) * 2011-05-27 2012-11-28 同济大学 基于ann的特征制造行为序列构建方法
CN103093311A (zh) * 2013-01-15 2013-05-08 西北工业大学 基于不等量二分法的开放车间调度问题关键操作识别方法
CN103105837A (zh) * 2012-12-21 2013-05-15 上海交通大学 基于可变时间窗实施两级混合优化批处理调度的方法
CN103116324A (zh) * 2012-12-17 2013-05-22 清华大学 基于指标预测和在线学习的微电子生产线调度方法
CN103390195A (zh) * 2013-05-28 2013-11-13 重庆大学 一种基于强化学习的机械车间任务调度节能优化系统
CN104462205A (zh) * 2014-11-03 2015-03-25 南京信息工程大学 一种基于动态知识网的制造系统自适应组织方法
CN104635772A (zh) * 2014-12-08 2015-05-20 南京信息工程大学 一种制造系统自适应动态调度方法
CN104808629A (zh) * 2015-04-20 2015-07-29 广东工业大学 一种柔性机器人制造单元的调度方法
CN105917313A (zh) * 2013-12-02 2016-08-31 英特尔公司 优化平台仿真资源消耗的方法和装置
CN107024867A (zh) * 2017-06-01 2017-08-08 合肥工业大学 一种考虑前视距离的相容工件族的优化控制方法
CN108197839A (zh) * 2018-02-11 2018-06-22 沈阳建筑大学 一种具有路由缓冲区的客车制造车间排产方法
CN108256778A (zh) * 2018-01-31 2018-07-06 北京仿真中心 一种基于机器学习和平行仿真的高级计划与排程方法
CN108427828A (zh) * 2018-02-07 2018-08-21 李荣陆 一种自动评估平面设计布局质量与优化的装置
CN108572654A (zh) * 2018-04-25 2018-09-25 哈尔滨工程大学 基于q学习的欠驱动auv虚拟锚泊三维镇定控制及实现方法
CN109189009A (zh) * 2018-07-26 2019-01-11 沈阳建筑大学 一种基于公共缓冲区的客车制造车间动态增容调度方法
CN109382838A (zh) * 2017-08-07 2019-02-26 发那科株式会社 控制装置以及机器学习装置
CN109858515A (zh) * 2018-12-24 2019-06-07 合肥工业大学智能制造技术研究院 用于对智能制造的供应链进行订单分批配置的方法及系统
CN110109433A (zh) * 2019-05-15 2019-08-09 上海海得自动化控制软件有限公司 柔性流水车间的基于辊道的缓冲区智能物流调度系统
CN110147078A (zh) * 2019-01-25 2019-08-20 安庆师范大学 一种无故障rgv智能系统二道工序加工动态调度方法
CN110363380A (zh) * 2019-05-30 2019-10-22 大连理工大学 一种集装箱堆场双场桥动态协同调度方法
CN110531704A (zh) * 2019-09-11 2019-12-03 东北大学 基于spt规则的双代理开放车间工件加工排序方法
CN110653801A (zh) * 2019-09-30 2020-01-07 哈尔滨工业大学 机器人操作臂的导引操纵系统及其柔顺操纵控制与示教学习方法
CN110865599A (zh) * 2019-11-20 2020-03-06 同济大学 一种基于plc的模拟智能加工设备及方法
CN110926470A (zh) * 2019-09-25 2020-03-27 吉林大学珠海学院 一种agv导航控制方法及系统
CN111199272A (zh) * 2019-12-30 2020-05-26 同济大学 一种面向智能车间的自适应调度方法
CN111290360A (zh) * 2020-03-25 2020-06-16 湖南大学 一种铸造生产线多目标优化方法
CN113031543A (zh) * 2021-02-24 2021-06-25 同济大学 一种半导体生产线的控制调度方法及装置
CN113657742A (zh) * 2021-08-09 2021-11-16 武汉科技大学 车间调度方法、装置、电子设备及存储介质

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727098B (zh) * 2008-10-21 2012-01-25 中芯国际集成电路制造(上海)有限公司 生产周期目标测量方法及系统
CN101788819B (zh) * 2010-03-08 2011-09-14 清华大学 大规模生产过程一种基于迭代式分解和流松弛的调度方法
CN101788819A (zh) * 2010-03-08 2010-07-28 清华大学 大规模生产过程一种基于迭代式分解和流松驰的调度方法
CN102799700A (zh) * 2011-05-27 2012-11-28 同济大学 基于ann的特征制造行为序列构建方法
CN102799700B (zh) * 2011-05-27 2014-10-22 同济大学 基于ann的特征制造行为序列构建方法
CN102360178A (zh) * 2011-08-16 2012-02-22 上海交通大学 用于混合并行机和作业车间的组批动态控制方法
CN102360178B (zh) * 2011-08-16 2013-07-10 上海交通大学 用于混合并行机和作业车间的组批动态控制方法
CN102542411A (zh) * 2011-12-22 2012-07-04 浙江工业大学 基于aca模型的多品种多工艺制造企业车间调度控制方法
CN103116324B (zh) * 2012-12-17 2014-06-04 清华大学 基于指标预测和在线学习的微电子生产线调度方法
CN103116324A (zh) * 2012-12-17 2013-05-22 清华大学 基于指标预测和在线学习的微电子生产线调度方法
CN103105837B (zh) * 2012-12-21 2015-04-01 上海交通大学 基于可变时间窗实施两级混合优化批处理调度的方法
CN103105837A (zh) * 2012-12-21 2013-05-15 上海交通大学 基于可变时间窗实施两级混合优化批处理调度的方法
CN103093311B (zh) * 2013-01-15 2015-08-05 西北工业大学 基于不等量二分法的开放车间调度问题关键操作识别方法
CN103093311A (zh) * 2013-01-15 2013-05-08 西北工业大学 基于不等量二分法的开放车间调度问题关键操作识别方法
CN103390195A (zh) * 2013-05-28 2013-11-13 重庆大学 一种基于强化学习的机械车间任务调度节能优化系统
CN103390195B (zh) * 2013-05-28 2016-11-09 重庆大学 一种基于强化学习的机械车间任务调度节能优化系统
CN105917313A (zh) * 2013-12-02 2016-08-31 英特尔公司 优化平台仿真资源消耗的方法和装置
CN104462205B (zh) * 2014-11-03 2017-11-03 南京信息工程大学 一种基于动态知识网的制造系统自适应组织方法
CN104462205A (zh) * 2014-11-03 2015-03-25 南京信息工程大学 一种基于动态知识网的制造系统自适应组织方法
CN104635772A (zh) * 2014-12-08 2015-05-20 南京信息工程大学 一种制造系统自适应动态调度方法
CN104635772B (zh) * 2014-12-08 2017-02-08 南京信息工程大学 一种制造系统自适应动态调度方法
CN104808629A (zh) * 2015-04-20 2015-07-29 广东工业大学 一种柔性机器人制造单元的调度方法
CN104808629B (zh) * 2015-04-20 2017-08-22 广东工业大学 一种柔性机器人制造单元的调度方法
CN107024867A (zh) * 2017-06-01 2017-08-08 合肥工业大学 一种考虑前视距离的相容工件族的优化控制方法
CN107024867B (zh) * 2017-06-01 2019-10-25 合肥工业大学 一种考虑前视距离的相容工件族的优化控制方法
CN109382838A (zh) * 2017-08-07 2019-02-26 发那科株式会社 控制装置以及机器学习装置
CN109382838B (zh) * 2017-08-07 2021-05-28 发那科株式会社 控制装置以及机器学习装置
CN108256778B (zh) * 2018-01-31 2021-09-10 北京仿真中心 一种基于机器学习和平行仿真的高级计划与排程方法
CN108256778A (zh) * 2018-01-31 2018-07-06 北京仿真中心 一种基于机器学习和平行仿真的高级计划与排程方法
CN108427828A (zh) * 2018-02-07 2018-08-21 李荣陆 一种自动评估平面设计布局质量与优化的装置
CN108427828B (zh) * 2018-02-07 2022-04-26 李荣陆 一种自动评估平面设计布局质量与优化的装置
CN108197839A (zh) * 2018-02-11 2018-06-22 沈阳建筑大学 一种具有路由缓冲区的客车制造车间排产方法
CN108572654A (zh) * 2018-04-25 2018-09-25 哈尔滨工程大学 基于q学习的欠驱动auv虚拟锚泊三维镇定控制及实现方法
CN109189009A (zh) * 2018-07-26 2019-01-11 沈阳建筑大学 一种基于公共缓冲区的客车制造车间动态增容调度方法
CN109858515A (zh) * 2018-12-24 2019-06-07 合肥工业大学智能制造技术研究院 用于对智能制造的供应链进行订单分批配置的方法及系统
CN110147078A (zh) * 2019-01-25 2019-08-20 安庆师范大学 一种无故障rgv智能系统二道工序加工动态调度方法
CN110147078B (zh) * 2019-01-25 2021-12-07 安庆师范大学 一种无故障rgv智能系统二道工序加工动态调度方法
CN110109433B (zh) * 2019-05-15 2021-01-01 上海海得自动化控制软件有限公司 柔性流水车间的基于辊道的缓冲区智能物流调度系统
CN110109433A (zh) * 2019-05-15 2019-08-09 上海海得自动化控制软件有限公司 柔性流水车间的基于辊道的缓冲区智能物流调度系统
CN110363380A (zh) * 2019-05-30 2019-10-22 大连理工大学 一种集装箱堆场双场桥动态协同调度方法
CN110363380B (zh) * 2019-05-30 2022-05-10 大连理工大学 一种集装箱堆场双场桥动态协同调度方法
CN110531704A (zh) * 2019-09-11 2019-12-03 东北大学 基于spt规则的双代理开放车间工件加工排序方法
CN110926470A (zh) * 2019-09-25 2020-03-27 吉林大学珠海学院 一种agv导航控制方法及系统
CN110653801A (zh) * 2019-09-30 2020-01-07 哈尔滨工业大学 机器人操作臂的导引操纵系统及其柔顺操纵控制与示教学习方法
CN110653801B (zh) * 2019-09-30 2022-06-17 哈尔滨工业大学 机器人操作臂的导引操纵系统及其柔顺操纵控制与示教学习方法
CN110865599A (zh) * 2019-11-20 2020-03-06 同济大学 一种基于plc的模拟智能加工设备及方法
CN111199272A (zh) * 2019-12-30 2020-05-26 同济大学 一种面向智能车间的自适应调度方法
CN111199272B (zh) * 2019-12-30 2023-11-03 同济大学 一种面向智能车间的自适应调度方法
CN111290360A (zh) * 2020-03-25 2020-06-16 湖南大学 一种铸造生产线多目标优化方法
CN111290360B (zh) * 2020-03-25 2021-07-02 湖南大学 一种铸造生产线多目标优化方法
CN113031543A (zh) * 2021-02-24 2021-06-25 同济大学 一种半导体生产线的控制调度方法及装置
CN113657742A (zh) * 2021-08-09 2021-11-16 武汉科技大学 车间调度方法、装置、电子设备及存储介质
CN113657742B (zh) * 2021-08-09 2024-04-19 武汉科技大学 车间调度方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN101216710A (zh) 一种由计算机实现的自适应选择动态生产调度控制系统
Kuhnle et al. Designing an adaptive production control system using reinforcement learning
WO2023184939A1 (zh) 基于深度强化学习的云数据中心自适应高效资源分配方法
CN107888669B (zh) 一种基于深度学习神经网络的大规模资源调度系统及方法
Umar et al. Hybrid multiobjective genetic algorithms for integrated dynamic scheduling and routing of jobs and automated-guided vehicle (AGV) in flexible manufacturing systems (FMS) environment
Wang et al. Application of reinforcement learning for agent-based production scheduling
Zavadlav et al. Self-buffering, self-balancing, self-flushing production lines
CN109375601A (zh) 基于数据驱动建模与仿真优化的流水线规划方法及设备
CN110351348B (zh) 一种基于dqn的云计算资源调度优化方法
CN106802553A (zh) 一种基于强化学习的铁路机车运行操控系统混合任务调度方法
CN109902954A (zh) 一种基于工业大数据的柔性作业车间动态调度方法
Lim et al. Fast scheduling of semiconductor manufacturing facilities using case-based reasoning
CN109960573A (zh) 一种基于智能感知的跨域计算任务调度方法及系统
CN111160755B (zh) 一种基于dqn的飞机大修车间实时调度方法
Mahnam et al. Single machine scheduling with unequal release times and idle insert for minimizing the sum of maximum earliness and tardiness
CN115543626A (zh) 采用异构计算资源负载均衡调度的电力缺陷图像仿真方法
CN102566423A (zh) 一种单边装配线的平衡控制方法
Zhang et al. A Q-learning-based hyper-heuristic evolutionary algorithm for the distributed flexible job-shop scheduling problem with crane transportation
CN115249121A (zh) 一种基于深度强化学习的离散制造车间鲁棒调度优化方法
CN116755397B (zh) 一种基于图卷积策略梯度的多机协同任务调度方法
Hussain et al. A multi-agent based dynamic scheduling of flexible manufacturing systems
CN113506048A (zh) 一种柔性作业车间的调度方法
Zaman et al. Evolutionary algorithm for project scheduling under irregular resource changes
WO2020062047A1 (zh) 更新调度规则的方法、设备、系统、存储介质和终端
CN116562584A (zh) 一种基于Conv-Dueling与泛化表征的动态车间调度方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080709