CN104679710A - 一种面向半导体生产线搬运系统软件故障快速恢复方法 - Google Patents
一种面向半导体生产线搬运系统软件故障快速恢复方法 Download PDFInfo
- Publication number
- CN104679710A CN104679710A CN201310626874.3A CN201310626874A CN104679710A CN 104679710 A CN104679710 A CN 104679710A CN 201310626874 A CN201310626874 A CN 201310626874A CN 104679710 A CN104679710 A CN 104679710A
- Authority
- CN
- China
- Prior art keywords
- main frame
- machine
- handling system
- production line
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明涉及一种面向半导体生产线搬运系统软件故障快速恢复方法,包括以下步骤:将生产线搬运系统的控制主机与从机连接,分别同时运行相同的搬运系统控制软件并进行数据同步;当主机发生故障时,从机发出报警并接替主机对搬运系统进行控制;主机故障解除后,从机进入故障等待状态。本发明方法使搬运系统软件在发生故障时,能够快速的恢复并继续工作;同时,由于该方法分为主机和从机,主机如果出现了某些严重的问题,导致短期内无法工作,从机可代替主机进行一切工作,从而极大的提高了生产效率,也给技术人员充足的时间来解决问题。
Description
技术领域
本发明涉及一种软件故障快速恢复方法,尤其是针对半导体生产线搬运系统调度控制软件的故障快速恢复方法。
背景技术
在主流的半导体生产工厂内,生产线由很多种工艺加工设备以晶圆存储设备等组成,半导体生产线搬运系统在这些设备间搬运晶圆,极大地提高半导体生产线的自动化能力。搬运系统在半导体生产工厂起到大动脉的作用,如果搬运系统出现故障,整个生产线都要停止生产。所以搬运系统运行的稳定性及故障快速恢复能力对整个生产线产能影响很大。现行的搬运系统在控制软件出现故障后需人工处理,并且需要自我检测或重新启动等很多步骤才能恢复成故障之前的工作状态。
发明内容
为了克服搬运系统控制件故障恢复时间慢的不足,本发明提供一种面向半导体生产线搬运系统软件故障快速恢复方法,使搬运系统软件在出现故障后可以快速恢复至故障前的工作状态。
本发明解决其技术问题所采用的技术方案是:一种面向半导体生产线搬运系统软件故障快速恢复方法,包括以下步骤:将生产线搬运系统的控制主机与从机连接,分别同时运行相同的搬运系统控制软件并进行数据同步;当主机发生故障时,从机发出报警并接替主机对搬运系统进行控制;主机故障解除后,从机进入故障等待状态。
所述主机和从机在同一个网络内并可以互相访问。
所述进行数据同步具体为:主机处于工作状态时,主机的控制软件定期将搬运系统的工作状态数据存入主机的数据库中,并同时通过网络存入从机的数据库中。
所述从机发出报警并接替主机对搬运系统进行控制包括以下步骤:
当主机的控制软件检测到搬运系统发生故障时,主机向从机发出故障状态信息并自动切换成故障等待状态;从机接收到故障状态信息后,从机的控制软件从故障等待状态切换成正常工作状态,读取从机数据库中的工作状态数据,接替主机对搬运系统进行控制;
当主机的控制软件未检测到搬运系统故障且从机在一定时间内没有接收到主机发来的状态信息时,从机从故障等待状态切换成正常工作状态,读取从机数据库中的工作状态数据,接替主机对搬运系统进行控制,并向主机的监控程序发送重新启动主机控制软件指令,强制主机的控制软件重新启动;从机接替主机的控制工作后进行报警。
本发明具有以下有益效果及优点:
1.本发明方法使轨道搬运系统软件在发生故障时,能够快速的恢复并继续工作。
2.由于该方法分为主机和从机,主机如果出现了某些严重的问题,导致短期内无法工作,从机可代替主机进行一切工作,从而极大的提高了生产效率,也给技术人员充足的时间来解决问题。
3.由于采用了数据同步机制,从机可以将主机的工作状态数据进行及时的备份,避免由于主机故障而导致数据丢失,增强系统的安全性。
附图说明
图1是本发明的系统结构图;
图2是软件故障处理流程图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明。
一种面向半导体生产线搬运系统软件故障快速恢复方法,具体步骤如下:
主机与从机分别同时运行相同的搬运系统控制软件并拥有数据同步功能。当主机发生故障时,从机发出报警,并接替主机进行控制操作。主机故障解除后,从机进入故障等待状态。
所述主机与从机,是指两台相同配置的计算机,计算机中安装完全相同的搬运系统控制软件、软件监控程序和数据库软件,两台计算机在同一个网络内,可以互相访问。
所述数据同步功能,是指主机处于工作状态时,主机的控制软件会将工作状态数据存入数据库中,主机数据库与从机数据库中的数据利用网络通讯实现实时同步的功能。
工作状态数据包括软件工作状态数据和硬件工作状态数据;
其中软件工作状态数据包括调度模块状态、天车模块状态、仓储模块状态。各个模块的状态是指各个模块在运行过程中,模块内部的用于表示模块状态的各个参数的参数值。这三个模块分别利用控制软件,将模块状态参数的参数值存入数据库中。
调度模块状态参数包括调度模块的总体状态(正常、繁忙、错误),调度模块的当前所执行的指令,调度模块当前控制的设备列表等;
天车模块状态参数包括天车模块的总体状态(正常、繁忙、错误),天车模块的当前所执行的指令,天车的运行速度,天车装载的晶圆数量等;
仓储模块状态参数包括仓储模块的总体状态(正常、繁忙、错误),仓储模块的当前所执行的指令,仓库所存储的晶圆数量、仓库可容纳的晶圆数量等。
硬件工作状态数据是指搬运系统中的各个硬件设备的I/O参数数据,包括天车的移动控制I/O、机械手的伸展控制I/O、仓库门的开关控制I/O等。搬运系统中有很多个硬件设备,每个硬件设备通常也包含几百个I/O参数,因此硬件工作状态数据的数据量远远大于软件工作状态数据。
所述主机发生故障的类型分为普通故障和严重故障,普通故障是指控制软件可检测的故障,严重故障时指导致控制软件无法响应的故障。
当搬运系统发生普通故障时,主机向从机发出故障状态信息,主机自动切换成故障等待状态。从机接收到主机发送的故障状态信息后,从机的控制程序切换成正常工作状态,读取数据库中的设备状态,接替主机系统对搬运系统进行控制。所述故障等待状态,是指从机仍会接收主机数据库发出的同步数据,存入从机的数据库中,但从机只负责接收数据,不进行任何软件控制操作。
当搬运系统发生严重故障时,从机在一定时间内没有接收到主机发来的状态信息后,会切换成正常工作状态,读取数据库中的工作状态数据,接替主机系统对搬运系统进行控制。同时,从机向主机的监控程序发送重新启动主机控制软件指令,强制主机的控制软件重新启动。
当搬运系统发生严重故障时,从机在一定时间内没有接收到主机发来的状态信息后,会切换成正常工作状态,读取数据库中的设备状态,接替主机系统对搬运系统进行控制。同时,从机向主机的监控程序发送重新启动主机控制软件指令,强制主机的控制软件重新启动。若控制软件重新启动失败,从机发出报警,通知给工程技术人员。
参见附图1,本发明的系统结构如下:
本发明使用两台计算机,分别命名为主机和从机,它们分别同时运行同一个套搬运系统控制软件、软件监控程序及数据库软件,两台计算机在同一个网络内可以互相访问。图中箭头代表数据的流向。
主机的运行数据保存在数据库中,主机的数据库与从机的数据库通过网络通讯实现实时同步。
主机的运行数据是指控制软件内存中的各变量的参数值,监控程序会定期读取全部变量的参数值,然后将这些变量存入数据库中的内存变量表。
数据库中的内存变量表的表结构为:表中包含3个字段,分别为变量ID、变量名称和变量值。每次向内存变量表存储数据时,都先将内存变量表清空,再将全部参数数据存入表中。
主机数据库和从机数据库利用数据同步程序进行数据的实时同步,数据同步程序是一个独立的进程,该进程会定期读取主机数据库中的数据,并发送给从机,最终将数据存入从机的数据库中。
主机的控制软件出现故障时,主机的监控程序向从机发送故障信息。
从机的监控程序接收到故障信息后,在从机的数据库中读取运行数据,并发送给从机的控制软件。
从机的控制软件读取运行数据后,接替主机,开始对生产线搬运系统进行控制。
参见附图2,本发明的软件故障处理流程如下:
主机控制软件出现故障时,监控程序判断故障类型。主机发生故障的类型分为普通故障和严重故障,普通故障是指控制软件可检测的故障,严重故障时指导致控制软件无法响应的故障。
当搬运系统发生普通故障时,主机向从机发出故障状态信息,主机自动切换成故障等待状态。从机接收到主机发送的故障状态信息后,从机的控制程序切换成正常工作状态,读取数据库中的设备状态,接替主机系统对搬运系统进行控制。
当搬运系统发生严重故障时,从机在一定时间内没有接收到主机发来的状态信息后,会切换成正常工作状态,读取数据库中的设备状态,接替主机系统对搬运系统进行控制。同时,从机向主机的监控程序发送重新启动主机控制软件指令,强制主机的控制软件重新启动。
从机接替主机的控制工作后,从机发出报警,通知技术人员解决主机出现的故障。
主机故障恢复并重新开始工作后,监控程序将故障恢复的消息发送给从机,从机接收消息后进入故障等待状态。
Claims (4)
1.一种面向半导体生产线搬运系统软件故障快速恢复方法,其特征在于包括以下步骤:将生产线搬运系统的控制主机与从机连接,分别同时运行相同的搬运系统控制软件并进行数据同步;当主机发生故障时,从机发出报警并接替主机对搬运系统进行控制;主机故障解除后,从机进入故障等待状态。
2.根据权利要求1所述的一种面向半导体生产线搬运系统软件故障快速恢复方法,其特征在于:所述主机和从机在同一个网络内并可以互相访问。
3.根据权利要求1所述的一种面向半导体生产线搬运系统软件故障快速恢复方法,其特征在于:所述进行数据同步具体为:主机处于工作状态时,主机的控制软件定期将搬运系统的工作状态数据存入主机的数据库中,并同时通过网络存入从机的数据库中。
4.根据权利要求1所述的一种面向半导体生产线搬运系统软件故障快速恢复方法,其特征在于:所述从机发出报警并接替主机对搬运系统进行控制包括以下步骤:
当主机的控制软件检测到搬运系统发生故障时,主机向从机发出故障状态信息并自动切换成故障等待状态;从机接收到故障状态信息后,从机的控制软件从故障等待状态切换成正常工作状态,读取从机数据库中的工作状态数据,接替主机对搬运系统进行控制;
当主机的控制软件未检测到搬运系统故障且从机在一定时间内没有接收到主机发来的状态信息时,从机从故障等待状态切换成正常工作状态,读取从机数据库中的工作状态数据,接替主机对搬运系统进行控制,并向主机的监控程序发送重新启动主机控制软件指令,强制主机的控制软件重新启动;从机接替主机的控制工作后进行报警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310626874.3A CN104679710A (zh) | 2013-11-28 | 2013-11-28 | 一种面向半导体生产线搬运系统软件故障快速恢复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310626874.3A CN104679710A (zh) | 2013-11-28 | 2013-11-28 | 一种面向半导体生产线搬运系统软件故障快速恢复方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104679710A true CN104679710A (zh) | 2015-06-03 |
Family
ID=53314777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310626874.3A Pending CN104679710A (zh) | 2013-11-28 | 2013-11-28 | 一种面向半导体生产线搬运系统软件故障快速恢复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104679710A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105808411A (zh) * | 2016-03-08 | 2016-07-27 | 李小荣 | 一种通过社交应用对系统故障进行报警的方法和装置 |
CN107025723A (zh) * | 2016-02-02 | 2017-08-08 | 富士电机株式会社 | 自动售货机及自动售货机系统 |
CN109885016A (zh) * | 2017-12-06 | 2019-06-14 | 富士迈半导体精密工业(上海)有限公司 | 半导体加工系统 |
CN113359409A (zh) * | 2021-07-14 | 2021-09-07 | 江苏天芯微半导体设备有限公司 | 一种多腔体cvd设备分布式控制系统及其方法 |
CN114035497A (zh) * | 2021-10-26 | 2022-02-11 | 江西五十铃汽车有限公司 | 一种适用于汽车涂装厂面漆烘干炉的应急切换控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1715956A (zh) * | 2004-06-30 | 2006-01-04 | 上海神开科技工程有限公司 | 双机热备份的双采集机系统及其双采集方法 |
US7065620B2 (en) * | 2001-01-31 | 2006-06-20 | Hewlett-Packard Development Company, L.P. | Systems and methods for backing up data |
CN102006190A (zh) * | 2010-11-23 | 2011-04-06 | 浪潮(北京)电子信息产业有限公司 | 一种高可用集群备份系统及其备份方法 |
-
2013
- 2013-11-28 CN CN201310626874.3A patent/CN104679710A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7065620B2 (en) * | 2001-01-31 | 2006-06-20 | Hewlett-Packard Development Company, L.P. | Systems and methods for backing up data |
CN1715956A (zh) * | 2004-06-30 | 2006-01-04 | 上海神开科技工程有限公司 | 双机热备份的双采集机系统及其双采集方法 |
CN102006190A (zh) * | 2010-11-23 | 2011-04-06 | 浪潮(北京)电子信息产业有限公司 | 一种高可用集群备份系统及其备份方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025723A (zh) * | 2016-02-02 | 2017-08-08 | 富士电机株式会社 | 自动售货机及自动售货机系统 |
CN107025723B (zh) * | 2016-02-02 | 2021-07-13 | 富士电机株式会社 | 自动售货机子机及自动售货机系统 |
CN105808411A (zh) * | 2016-03-08 | 2016-07-27 | 李小荣 | 一种通过社交应用对系统故障进行报警的方法和装置 |
CN109885016A (zh) * | 2017-12-06 | 2019-06-14 | 富士迈半导体精密工业(上海)有限公司 | 半导体加工系统 |
CN113359409A (zh) * | 2021-07-14 | 2021-09-07 | 江苏天芯微半导体设备有限公司 | 一种多腔体cvd设备分布式控制系统及其方法 |
CN114035497A (zh) * | 2021-10-26 | 2022-02-11 | 江西五十铃汽车有限公司 | 一种适用于汽车涂装厂面漆烘干炉的应急切换控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN202798798U (zh) | 基于云计算技术的高可用系统 | |
CN102394774B (zh) | 一种云计算操作系统的控制器服务状态监控和故障恢复方法 | |
CN104679710A (zh) | 一种面向半导体生产线搬运系统软件故障快速恢复方法 | |
CN105095001A (zh) | 分布式环境下虚拟机异常恢复方法 | |
CN104038373B (zh) | 信息预警与自修复系统及方法 | |
CN102752093B (zh) | 基于分布式文件系统的数据处理方法、设备和系统 | |
CN104506357A (zh) | 一种高可用集群节点管理方法 | |
CN102064962B (zh) | 基于命名管道通信的列车自动监控系统输入输出组件的实现方法 | |
CN105554074A (zh) | 一种基于rpc通信的nas资源监控系统及监控方法 | |
CN106330523A (zh) | 一种集群服务器容灾系统、方法和服务器节点 | |
CN103036719A (zh) | 一种基于主备集群服务器的跨地区服务容灾方法及装置 | |
CN102025562A (zh) | 一种路径检测方法及装置 | |
CN103384212A (zh) | 一种通信应用系统双机高可用方案及其实现 | |
CN105243004A (zh) | 一种故障资源检测方法及装置 | |
CN103490919A (zh) | 故障管理系统和故障管理方法 | |
CN102355368A (zh) | 一种网络设备的故障处理方法及系统 | |
CN105227385A (zh) | 一种故障处理的方法及系统 | |
CN104750596A (zh) | 一种告警信息处理方法及服务子系统 | |
CN104113428A (zh) | 一种设备管理装置和方法 | |
CN105068763B (zh) | 一种针对存储故障的虚拟机容错系统和方法 | |
CN104216795A (zh) | 一种多进程保护系统及其实现方法 | |
CN102045230A (zh) | 一种以太环网链路保护倒换的方法及装置 | |
CN108445857B (zh) | 一种scada系统的1+n冗余机制设计方法 | |
CN108459984A (zh) | 一种机柜i2c总线死锁处理方法、系统、介质及设备 | |
CN104270270B (zh) | 一种中高端机架式大容量设备通信管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150603 |