CN115774656A - 装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质 - Google Patents

装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质 Download PDF

Info

Publication number
CN115774656A
CN115774656A CN202211016320.7A CN202211016320A CN115774656A CN 115774656 A CN115774656 A CN 115774656A CN 202211016320 A CN202211016320 A CN 202211016320A CN 115774656 A CN115774656 A CN 115774656A
Authority
CN
China
Prior art keywords
information
cluster
inter
management system
device management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211016320.7A
Other languages
English (en)
Inventor
大西贵子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Publication of CN115774656A publication Critical patent/CN115774656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质,能够高精度地进行与计算机组合使用的装置的故障原因的估计。装置的管理系统具备:日志数据取得单元,其取得日志,所述日志是与所述装置的控制有关的软件的动作记录;聚类信息提取单元,其从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示与所述装置的运转有关的各步骤的内容的信息,所述聚类间迁移信息是与一个所述步骤和另一个所述步骤之间的迁移有关的信息;异常度计算单元,其计算所述提取出的各个所述聚类间迁移信息的异常度;以及故障原因估计单元,其基于由所述异常度计算单元计算出的所述异常度,估计所述装置的故障原因。

Description

装置管理系统、装置的故障原因估计方法以及非暂时性地存 储程序的存储介质
技术领域
本发明涉及装置管理系统、装置的故障原因估计方法以及程序。
背景技术
关于产业用途的装置(或设备)的维护业务,在发生了装置的动作的停止、性能的降低等故障的情况下,进行其原因的分析。而且,这样的故障原因的分析通常是操作人员一边相互参照软件的动作记录(日志)、装置的机械部件的运转状态(各种传感器计测值、马达转速等)、控制装置(计算机)的运转状态(CPU使用率、存储器使用量、网络收发量、基板温度等)这样的多种信息,一边进行分析。
然而,根据这样对照多样的信息来进行分析的方法,存在操作人员的负担大、分析结果被个人的经验/知识大幅左右这样的问题。
针对这样的问题,近年来,提出了包含自动化在内的维护业务的高效化的各种方法。例如,进行了蓄积与装置的状态有关的数据,有助于故障对策的自动化的努力。特别是,在反复进行固定的单纯动作的装置中,通过针对从传感器得到的信号数据执行学习来检测异常值、变化点(所谓的离群值)是有效的,提出了使用这些信息来进行故障原因的估计、故障的预测(例如,非专利文献1等)。
然而,在检查装置、加工设备等与控制装置(计算机)组合而进行复杂的动作的装置中,在使用简单的数据的现有技术中难以得到充分的结果。鉴于这一点,近年来还进行了使用深层学习等方法来灵活运用从多个传感器取得的大量数据的研究(例如,非专利文献2等)。
另外,还提出了如下方案:代替传感器数据,活用控制装置的软件日志、维护记录这样的文本数据,以它们为对象执行学习来估计维护的最佳定时(例如,非专利文献3等)。
现有技术文献
非专利文献
非专利文献1:Ferreiro,S.,Konde,E.,Fernandez,S.,and Prado,A.,2016.Industry4.0:predictive intelligent maintenance for productionequipment.European Conference of the Prognostics and Health ManagementSociety,no(pp.1-8).researchgate.net.
非专利文献2:Ademujimi,T.T.,Brundage,M.P.,and Prabhu,V.V.,2017.AReview of Current Machine Learning Techniques Used in ManufacturingDiagnosis.Advances in Production Management Systems.The Path to Intelligent,Collaborative and Sustainable Manufacturing(pp.407-415).SpringerInternational Publishing.
非专利文献3:Patil,R.B.,Patil,M.A.,Ravi,V.,and Naik,S.,2017.Predictivemodeling for corrective maintenance of imaging devices from machinelogs.Conference proceedings:...Annual International Conference of the IEEEEngineering in Medicine and Biology Society.IEEE Engineering in Medicine andBiology Society.Conference,2017,1676-1679.ieeexplore.ieee.org.
发明内容
发明所要解决的课题
然而,为了估计与计算机组合的比较复杂的装置的故障原因,在仅使用传感器数据的以往的方法中,存在无法应对与软件的动作联动地产生的不良情况的问题。另外,即使是针对软件日志、维护记录等文本数据执行学习来进行分析的方法,也能够记录、学习已知的故障、劣化的状态来进行分析,但存在难以学习未知的或者预想外的故障、无法应对这样的故障的问题。
本发明是鉴于上述那样的实际情况而完成的,其目的在于提供一种能够高精度地进行与计算机组合使用的装置的故障原因的估计的技术。
用于解决课题的手段
为了实现上述目的,本发明采用以下的结构。即,一种装置的管理系统,其是装置的管理系统,所述装置管理系统的特征在于,具备:日志数据取得单元,其取得日志,所述日志是与所述装置的控制有关的软件的动作记录;聚类信息提取单元,其从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示与所述装置的运转有关的各步骤的内容的信息,所述聚类间迁移信息是与一个所述步骤和另一个所述步骤之间的迁移有关的信息;异常度计算单元,其计算所述提取出的各个所述聚类间迁移信息的异常度;以及故障原因估计单元,其基于由所述异常度计算单元计算出的所述异常度,估计所述装置的故障原因。
根据这样的结构,对于发生了故障的装置,能够针对与装置的运转有关的细微的各个举动计算异常度,基于该异常度进行故障原因的估计,因此对于未知的(或者预想外的)故障原因,也能够估计为其是故障的原因。
另外,所述异常度计算单元也可以基于所述装置正常时的所述聚类间迁移信息,计算所述提取出的各个所述聚类间迁移信息的异常度。若是这样的结构,则能够不使用装置存在故障时的学习数据,而仅基于装置正常运转时的数据来计算故障发生时的异常度,因此能够应用于从结构简单的装置到复杂的装置的各种对象。
另外,也可以是,在所述聚类间迁移信息中包含与所述装置中的多个所述步骤间的迁移的发生频度有关的信息,所述装置管理系统还具备聚类间迁移信息评价单元,所述聚类间迁移信息评价单元基于所述发生频度,进行所述提取出的各个所述聚类间迁移信息的加权,所述异常度计算单元使用所述加权的信息,计算所述异常度。这样,通过具备进行基于步骤间的迁移的发生频度的加权的单元,能够高效且高精度地计算异常度。
另外,也可以是,所述装置管理系统还具备硬件信息取得单元,所述硬件信息取得单元取得与所述装置的硬件的状态有关的硬件信息,所述聚类间迁移信息评价单元进一步基于所述硬件信息取得单元取得的所述硬件信息,进行所述提取出的各个所述聚类间迁移信息的加权。
在此,硬件信息是指各种传感器数据以及根据该传感器数据得到的与装置的硬件面的动作、状态有关的信息。这样,通过使用硬件信息进一步进行加权,能够更高精度地计算异常度。
另外,也可以是,所述故障原因估计单元估计为在由所述异常度计算单元计算出的所述异常度满足规定条件的所述聚类间迁移信息确定的步骤中存在所述装置的故障原因。具体而言,规定条件例如能够设为超过规定的阈值的情况等。在该情况下,阈值可以由用户预先设定,也可以通过根据装置的运转实绩进行学习而自动地设定。由此,能够高效地估计装置的故障原因。
另外,也可以是,所述装置管理系统还具备显示单元,所述显示单元能够显示表示由所述异常度计算单元计算出的所述异常度和/或由所述故障原因估计单元估计出的所述故障原因的信息。根据这样的结构,用户能够容易地确认估计出的故障原因。
另外,也可以是,所述装置管理系统还具备有向图生成单元,所述有向图生成单元将所述聚类信息作为节点,将所述聚类间迁移信息作为边,生成表示各个所述聚类信息与所述聚类间迁移信息的关系的有向图,所述显示单元能够显示所述有向图。
根据这样的结构,用户能够以有向图的方式确认与装置的控制有关的软件的动作,能够为了装置的管理、维护而灵活运用该信息。
另外,也可以是,所述聚类间迁移信息是通过规定方法进行了附加重要度的评价的加权的信息,所述有向图生成单元生成能够视觉确认各个所述聚类间迁移信息中的所述加权的所述有向图。另外,这里的加权的手段没有特别限定,例如如上所述,能够设为基于聚类间迁移的发生频度、对应的硬件信息(传感器数据)等的加权。根据这样的结构,用户能够确认反映了加权的有向图,因此能够根据有向图获取更详细的信息。
另外,也可以是,所述有向图生成单元通过将表示所述聚类间迁移信息中的所述加权的数值显示在所述边的附近,生成能够视觉确认地表现所述加权的有向图。
另外,也可以是,所述有向图生成单元通过对表示各个所述聚类间迁移信息的所述边的清晰度设置差异地进行显示,生成能够视觉确认地表现所述加权的有向图。在此,对清晰度设置差异是指例如考虑根据权重使边的线的粗细变粗、根据权重使边的线的亮度、明度变高等。
另外,也可以是,在所述聚类信息中包含作为从所述日志提取出的文本信息的单词,所述有向图生成单元按照出现次数从多到少的顺序提取各个所述聚类信息中包含的所述单词,并且生成使用了所述提取出的单词作为表示所述聚类信息的内容的信息的所述有向图。根据这样的结构,用户能够基于单词容易地掌握有向图的各节点的内容。
另外,也可以是,所述装置管理系统还具备提取日志显示图像生成单元,所述提取日志显示图像生成单元从所述日志的集合中提取与满足规定条件的所述聚类间迁移信息对应的日志,作为表示满足所述规定条件的所述聚类间迁移信息的内容的信息,并且生成表示该提取出的日志的内容的提取日志显示图像,所述显示单元能够显示所述提取日志显示图像。
此外,这里所说的“满足规定条件”能够设为异常度超过规定值的情况、用户选择了上述有向图中的与上述聚类间迁移信息对应的边的情况等。根据这样的结构,用户能够迅速地确认与所述聚类间迁移信息对应的日志。
另外,所述提取日志显示图像也可以在表示与该提取日志显示图像所示的提取日志对应的所述聚类间迁移信息的所述边的附近弹出显示。如果是这样的显示,则能够容易地掌握被弹出显示的所述提取日志显示图像与表示对应的所述聚类间迁移信息的所述边的关系。此外,提取日志显示图像的显示部位没有特别限定,也可以与上述弹出显示无关地设置特定的显示区域。
另外,本发明也能够作为装置的故障原因估计方法来应用,其是估计装置的故障原因的方法,所述装置的故障原因估计方法包含如下步骤:日志数据取得步骤,取得日志,所述日志是与所述装置的控制有关的软件的动作历史信息;聚类信息提取步骤,从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示由所述装置进行的处理的各步骤的内容的信息,所述聚类间迁移信息是与所述装置中的多个所述步骤间的迁移有关的信息;异常度计算步骤,计算所述提取出的各个所述聚类间迁移信息的异常度;以及故障原因估计步骤,基于在所述异常度计算步骤中计算出的所述异常度,估计所述装置的故障原因。
另外,本发明也可以理解为用于使计算机执行上述方法的程序、非暂时性地记录了这样的程序的计算机可读取的记录介质。
此外,上述各个结构以及处理只要不产生技术上的矛盾就能够相互组合而构成本发明。
发明效果
根据本发明,能够提供一种能够高精度地进行与信息处理装置组合使用的装置的故障原因的估计的技术。
附图说明
[图1]图1是示出实施方式1的装置管理系统的概要的示意图。
[图2]图2是示出软件日志的例子的说明图。
[图3]图3是示出由实施方式1的装置管理系统执行的处理的流程的流程图。
[图4]图4是示出实施方式1的装置管理系统中的处理的子例程的流程图。
[图5]图5是说明软件日志的分离处理的说明图。
[图6]图6是说明被聚类的日志线的说明图。
[图7]图7是说明在实施方式1的装置管理系统中生成的日志聚类序列的说明图。
[图8]图8的(A)是对由实施方式1的装置管理系统生成的有向图进行说明的第1图。图8的(B)是对由实施方式1的装置管理系统生成的有向图进行说明的第2图。
[图9]图9是示出由根据第一实施方式的装置管理系统生成的有向图的一例的图。
[图10]图10的(A)是示出实施方式1的变形例中显示于画面的有向图的一例的图。图10的(B)是表示在实施方式1的变形例中显示于画面的有向图的另一例的图。
[图11]图11是示出实施方式1的另一变形例的装置管理系统的概要的示意图。
[图12]图12是说明实施方式1的另一变形例的装置管理系统中显示的画面的一例的图。
[图13]图13是示出实施方式2的装置管理系统的概要的示意图。
[图14]图14是示出由实施方式2的装置管理系统进行的处理的流程的流程图。
[图15]图15是示出实施方式2的装置管理系统中的处理的子例程的流程图。
[图16]图16是示出传感器数据与变化得分之间的关系的说明图。
[图17]图17是示出由实施方式2的装置管理系统生成的被映射了变化得分的日志聚类序列的例子的说明图。
标号说明
1、2、3:装置管理系统;100、200、300:信息处理终端;120:外观检查装置;121:照相机;122:X工作台;123:Y工作台;124:输送机;O:检查对象物。
具体实施方式
以下,基于附图对本发明的实施例进行说明。但是,以下的各例中记载的构成要素的尺寸、材质、形状、其相对配置等只要没有特别记载,就不意味着将本发明的范围仅限定于此。
<应用例>
(应用例的结构)
本发明例如能够作为通过对由拍摄单元拍摄检查对象物而得到的图像进行处理来对检查对象物进行检查的外观检查装置的管理系统来应用。图1是表示本应用例的装置管理系统1的概略的示意图。
装置管理系统1包含信息处理终端100和外观检查装置120。信息处理终端100可以与外观检查装置120一体地构成,也可以是与外观检查装置120可通信地连接的分体的装置,例如能够由通用的计算机构成。另外,信息处理终端100既可以由单一的计算机构成,也可以由相互协作的多台计算机构成。外观检查装置120例如是通过对部件搭载基板等检查对象物进行拍摄并进行图像处理而自动地进行检查对象物的检查的装置。
信息处理终端100包含日志数据取得部101、聚类信息提取部102、聚类间迁移信息评价部103、有向图生成部104、基准数据生成部105、异常度计算部106、故障原因估计部107、显示部108和存储部109的各功能部。此外,虽未图示,但也可以具备鼠标、键盘等各种输入单元、通信单元等。
外观检查装置120构成为具备将检查对象物O搬运至拍摄位置的输送机124、拍摄检查对象物O的照相机121、使照相机121沿水平方向移动的X工作台122及Y工作台123。另外,虽然未图示,但外观检查装置120具备对拍摄到的图像进行处理的图像处理部、基于图像进行检查的检查处理部、输出检查结果的输出处理部等。
(故障原因估计的方法)
本应用例的装置管理系统1预先准备使用多个外观检查装置120的正常动作时的数据进行学习(模型化)而得到的基准数据,在外观检查装置120发生了故障的情况下,基于该基准数据来估计故障原因。
具体而言,首先,通过日志数据取得部101取得与外观检查装置120的正常动作时的控制有关的软件日志(以下,也简称为日志)。日志如图2所示那样构成为文本信息,通过由聚类信息提取部102处理该文本信息,提取表示与外观检查装置120的运转有关的各步骤的内容的聚类信息。进而,提取与外观检查装置120的运转所涉及的一个步骤和其他步骤之间的迁移有关的信息即聚类间迁移信息。
此外,有向图生成部104生成表示所提取的各个聚类信息和聚类间迁移信息之间的关系的有向图。以生成基准数据所需的量反复进行多次该处理,取得多个有向图。进而,通过基准数据生成部105,将取得的多个有向图置换为矩阵表现,并且针对矩阵的各元素计算平均/方差,将其作为基准数据保存。
然后,在外观检查装置120发生了故障的情况下,取得与故障发生时的控制有关的日志,通过与基准数据生成时同样的处理生成有向图,将其变换为矩阵表现。接着,通过异常度计算部106,将取得的故障发生时的矩阵数据的各元素与基准数据的矩阵的各元素进行对比,按每个元素计算表示与基准数据的背离的大小的异常度。然后,故障原因估计部107认为与异常度为规定的阈值以上的元素对应的步骤(或者步骤间的迁移)是故障的原因的可能性高,将该步骤估计为故障原因。
如上所述,本应用例的装置管理系统1能够仅基于正常动作时的数据生成基准数据,进行故障发生时的数据与基准数据的对比,由此估计故障的发生原因。由此,对于未知的故障原因也能够高精度地进行估计。
<实施方式1>
接着,基于图1至图9,更详细地对本发明的实施方式进行说明。首先,对本实施方式的装置管理系统1的信息处理终端100所具备的功能部进行说明。
(信息处理终端的功能)
日志数据取得部101取得与外观检查装置120的控制有关的软件的动作记录即日志。聚类信息提取部102从所获取的日志集合中提取聚类信息和聚类间迁移信息,聚类信息是表示与外观检查装置120的运转有关的各步骤的内容的信息,聚类间迁移信息是与一个步骤和另一个步骤之间的迁移有关的信息。对此,在后面详细叙述。
另外,在上述聚类间迁移信息中,包含与外观检查装置120中的多个步骤间的迁移的发生频度有关的信息,聚类间迁移信息评价部103至少使用该发生频度的信息进行提取出的各个聚类间迁移信息的加权。
另外,有向图生成部104将提取出的聚类信息作为节点,将聚类间迁移信息作为边,生成表示各个聚类信息和聚类间迁移信息的关系的有向图。基准数据生成部105生成作为用于故障原因估计的基准的基准数据。具体而言,将对外观检查装置120的正常运转时的日志数据进行多个采样而取得的多个有向图置换为矩阵表现,并且对矩阵的各元素计算平均/方差,将其作为基准数据保存于存储部109。
异常度计算部106将根据故障发生时的日志数据生成的有向图置换为矩阵表现,并且将矩阵的各元素与上述的基准数据进行对比,由此针对每个元素计算表示与基准数据的背离的大小的异常度。矩阵的各元素分别与从日志提取出的各个聚类间迁移信息对应,因此矩阵的各元素的异常度成为对应的各个聚类间迁移信息的异常度。
故障原因估计部107认为与计算出的异常度为规定的阈值以上的聚类间迁移信息对应的软件日志所示的步骤是故障的原因的可能性高,将该步骤估计为故障原因。
显示部108是液晶显示器等图像显示装置,显示包含上述有向图、估计出的故障原因、聚类间迁移信息的异常度等在内的各种信息。存储部109可以包含例如只读存储器(ROM)、随机存取存储器(RAM)等主存储部和EPROM、硬盘驱动器(HDD)、可移动介质等辅助存储部。
在辅助存储部中,除了操作系统(OS)、各种程序以外,还能够保存上述的基准数据、管理对象装置的运转实绩、维护记录等各种信息。另外,通过将存储在辅助存储部中的程序加载到主存储部的作业区域中并执行,通过程序的执行来控制各结构部等,能够实现达成上述那样的规定目的的功能部。此外,一部分或者全部的功能部也可以通过ASIC、FPGA那样的硬件电路来实现。
(故障原因估计处理的流程)
接着,对本实施方式的装置管理系统1中的外观检查装置120的故障原因估计处理的流程进行说明。图3是表示装置管理系统1的故障原因估计处理的一例的流程图。如图3所示,在装置管理系统1中,首先基于从正常运转时的外观检查装置120取得的数据,生成基准数据(S101)。
在此,参照图4,对步骤S101的基准数据生成处理的详细情况进行说明。图4是表示本实施方式中的基准数据生成处理的子例程的流程的流程图。如图4所示,首先,日志数据取得部101取得正常运转时的日志数据(S201)。接下来,聚类信息提取部102基于规定的规则进行分离日志信息的处理(S202)。在图5中示出关于这样的日志信息的分离处理的说明图。如图5所示,日志数据由各行表示时刻的时刻数据部分和消息字符串构成,聚类信息提取部102将日志按每行分解为时刻数据和消息字符串。在此,对消息字符串进一步进行删除数字以及符号,分解为单词单位的处理。
接下来,聚类信息提取部102使用例如TF-IDF方法来进行将日志各行的单词集向量化的处理。TF-IDF是公知的方法,因此省略详细的说明,TF-IDF是基于TF(TermFrequency:单词的出现频度)和IDF(Inverse Document Frequency:逆文档频度)这两个指标来求出单词的重要度的方法。
如图6所示,聚类信息提取部102还使用例如K-平均法将所有行的向量集合聚类为例如200个聚类(S203)。图6是对聚类后的日志线进行说明的说明图。另外,K-平均法是公知的聚类方法,因此省略详细的说明。
接着,如图7所示,聚类信息提取部102基于各日志线被输出的时刻,生成使聚类编号为连续编号的日志聚类序列。这样,通过按时间序列排列聚类编号,能够取得与聚类间的迁移有关的信息。即,可以提取以这种方式从日志的文本消息(单词)获得的表示与外观检查装置120的运转有关的各步骤的内容的聚类信息以及作为与一个聚类(步骤)和另一个聚类之间的迁移有关的信息的聚类间迁移信息。即,在本实施方式中,步骤S202、步骤S203的处理相当于聚类信息提取步骤。
接着,有向图生成部104生成以各聚类信息为节点、以聚类间迁移信息为边的有向图(S204)。此时,可以在每个节点上显示相应的聚类的聚类编号。
接着,聚类间迁移信息评价部103基于有向图的节点间(即对应的聚类间)的迁移频度,进行有向图的各边的加权(S205)。在图8中示出对在S205中进行的加权进行说明的说明图。图8的(A)是基于输出日志线的时刻,将与各日志线对应的聚类的聚类编号按时间序列从左向右排列的图。图8的(B)是表示反映了加权的有向图的图。在图8的(B)的有向图的边附近记载有数值,该数字表示该边(即,聚类间的迁移)的发生频度。参照图8的(A),从聚类编号2向聚类编号2的迁移产生了2次,从聚类编号2向聚类编号0的迁移产生了2次,从聚类编号0向聚类编号6的迁移产生了3次,从聚类编号6向聚类编号0的迁移产生了1次,从聚类编号6向聚类编号2的迁移产生了1次。并且,在图8的(B)的有向图中,将该迁移的次数显示在边附近,并且与迁移的发生频度相应地将边的粗细显示得较粗。
这样,通过进行步骤S201至步骤S205的处理,针对一个正常运转时的日志数据的一系列处理结束。图9表示对一个正常运转时的日志数据的一系列处理结束时生成的有向图的一例。
接着,基准数据生成部105进行判定是否取得了生成基准数据所需的规定数量(例如100件)的如上述那样加权后的有向图的处理(S206)。在此,在未取得规定数量的有向图数据的情况下,返回步骤S201,取得新的正常运转时的日志数据,重复以后的处理。
另一方面,在步骤S206中判定为已取得规定数量的有向图数据的情况下,进入步骤S207,基准数据生成部105进行将所取得的全部有向图变换为矩阵表现的处理。具体而言,如下述式(1)所示,进行变换为将有向图中的从一个节点迁移到另一个节点的边的权重作为矩阵的各元素的边权重矩阵W的处理。如上述的例子那样,在将聚类的数量设为200个的情况下,边权重矩阵W成为200×200的矩阵。
Figure BDA0003812666750000111
在此,作为矩阵的元素的W00表示从示出聚类编号0的节点0(以下,也仅记载为节点0)向节点0迁移的边(即,聚类间迁移信息)的权重,Wn0表示从节点n向节点0迁移的边的权重。即,Wij表示从节点i向节点j迁移的边的权重。
基准数据生成部105在结束了对全部有向图置换为该矩阵表现的处理后,对矩阵的各元素进行计算平均和方差的处理(S208)。例如,在使用100件的量的正常运转时的数据的情况下,作为综合了100件的量的矩阵数据的结果,将表示100件的量的平均的一个平均权重矩阵和表示100件的量的方差的一个方差权重矩阵分别计算为基准数据(S209)。另外,以下,关于平均权重矩阵的各元素,记载为表示100件的量的Wij的平均的μij,关于方差权重矩阵的各元素,记载为表示100件的量的Wij的方差的σij
这样,如果步骤S209的处理结束,则基准数据生成处理(S101)的一系列的子例程结束。将说明返回到表示图3的故障原因估计处理的流程图,如果步骤S101的处理结束,则基准数据生成部105将生成的基准数据保存在存储部109中(S102)。
接着,在外观检查装置120发生了故障时,日志数据取得部101取得该故障发生时的日志数据(S103)。然后,执行从故障发生时的日志数据进行聚类信息的提取,基于此生成加权后的有向图,取得对有向图进行矩阵变换后的数据的一系列处理(S104)。在步骤S104中进行的具体的处理内容与在上述的步骤S202至步骤S205以及步骤S207中进行的处理相同。因此,在此省略说明。
接着,异常度计算部106通过将在步骤S104中取得的故障发生时的矩阵数据与基准数据进行对比,来计算关于故障发生时的各矩阵元素的异常度aij(S105)。具体而言,基于下述式(2)计算异常度。
Figure BDA0003812666750000112
然后,故障原因估计部107将满足规定的条件(例如,超过阈值等)的异常度的矩阵元素估计为故障的原因(S106)。然后,例如在估计为矩阵元素Wij是故障的原因的情况下,由于矩阵元素Wij具有节点i的聚类信息和节点j的聚类信息,所以将这些聚类信息(或者,对应的日志线)作为表示估计出的故障原因的信息显示于显示部108(S107)。
如以上那样,故障原因估计处理的一系列的流程结束。此外,步骤S101和步骤S102的处理不需要在每次进行故障原因的估计时都执行,也可以在一次生成并保存基准数据之后,从步骤S103的处理开始故障原因估计处理。当然,也可以适当执行步骤S101和步骤S102的处理,根据需要更新基准数据。
根据以上那样的装置管理系统1,仅基于正常动作时的数据来生成基准数据,进行故障发生时的数据与基准数据的对比,由此能够计算出表示各步骤的元素的异常度,估计故障的发生原因。由此,对于未知的故障原因也能够高精度地进行估计。另外,通过利用聚类间的迁移的发生频度进行加权,能够针对重要度高的事项适当地计算异常度。
(变形例1)
此外,在上述实施方式1中,说明了将作为表示估计出的故障原因的信息的聚类信息显示于显示部108,但能够在显示部108显示各种信息。图10是表示作为显示于显示部108的信息的一例的有向图的图。图10的(A)示出显示与各节点对应的聚类编号的通常的有向图。图10的(B)是表示有向图的变形显示例的图。有向图生成部104也可以将与各节点对应的聚类信息所包含的单词按照出现次数从多到少的顺序提取,并且生成使用了该提取出的单词的有向图作为表示与各个节点对应的聚类的内容的信息(参照图10的(B)),将其显示于显示部108。由此,用户能够基于单词容易地掌握有向图的各节点的内容。
(变形例2)
图11是表示本实施方式1的又一变形例的装置管理系统2的概略结构的概略图。此外,以下,对与在上述的实施例中说明的结构、处理相同的结构、处理标注相同的附图标号,并省略重复的说明。如图11所示,本变形例的装置管理系统2仅在信息处理终端200中具备提取日志显示图像生成部201这一点上与实施方式1的装置管理系统1不同,其他方面相同。
提取日志显示图像生成部201从日志的集合中提取与满足规定条件的边对应的日志,并且生成表示该提取出的日志的内容的提取日志显示图像,显示于显示部108,作为表示该满足规定条件的边(聚类间迁移信息)的内容的信息。图12表示在有向图的边附近弹出显示与该边的内容有关的提取日志显示图像的状态的显示画面例。
此外,这里所说的“满足规定条件”能够设为异常度超过规定值的情况、用户通过鼠标操作等选择了上述有向图中的与上述聚类间迁移信息对应的边的情况等。另外,提取日志显示图像不限于有向图的边附近,能够以任意的方式显示,也能够设为画面上具有专用的显示区域的用户界面。如果是这样的本变形例的结构,则用户能够迅速地确认与聚类间迁移信息对应的日志。
<实施方式2>
接着,基于图13至图17对本发明的其他实施方式进行说明。图13是表示本实施方式的装置管理系统3的概略结构的概略图。如图13所示,本实施方式的装置管理系统3与装置管理系统1相比,在信息处理终端300中具备传感器数据取得部301这一点上不同。另外,本实施方式的聚类间迁移信息评价部303在如后述那样进行与实施方式1的聚类间迁移信息评价部103一部分不同的处理这一点上不同。其他方面与实施方式1的装置管理系统1相同。
传感器数据取得部301获取用于检测与外观检查装置120的硬件(例如,输送机124、照相机121、X工作台122、Y工作台123、输出装置等)的状态有关的信息的传感器数据。传感器数据是记录了硬件的状态的时间序列的数值数据,从外观检查装置120所具备的各种传感器、马达、位置控制系统等设备取得。传感器数据以文本形式、二进制形式中的哪一种形式记录取决于装置的规格,但只要能够取得时间与数值的对应关系,则可以是任意形式。另外,在本实施方式中,各种传感器、传感器数据取得部301等相当于硬件信息取得部。
外观检查装置120的自动检查处理中,关于1个检查对象的处理大致由6个步骤构成。具体而言,步骤分为检查对象物O的搬入、检查对象物O的拍摄、图像处理、好坏判定、检查结果输出、检查对象物O的搬出。而且,硬件的动作按每个步骤而不同,各步骤的长度、重复次数也不固定。因此,记录了硬件的状态的传感器数据也根据对象物而大幅变动。即,可以说通过对硬件的动作(表示它的传感器数据)进行学习来估计装置的故障原因并不容易。
接着,对本实施方式的装置管理系统3中的外观检查装置120的故障原因估计处理的流程进行说明。图14是表示装置管理系统3的故障原因估计处理的一例的流程图。如图14所示,作为整体的流程,与实施方式1的情况下的处理大致相同。
在本实施方式的装置管理系统3中,首先基于从正常运转时的外观检查装置120取得的数据,生成基准数据(S301)。在此,基于图15对步骤S301的子例程进行说明。图15是表示本实施方式中的基准数据生成处理的子例程的流程的流程图。
如图15所示,本实施方式中的基准数据生成时的子例程也大致与实施方式1相同,从步骤S201到步骤S205进行与实施方式1相同的处理。即,取得正常运转时的日志数据(S201),进行分离该日志信息的处理(S202),进行分离后的日志信息的聚类化(S203),使用聚类化后的数据生成有向图(S204),进行基于聚类间的迁移的发生频度的边的加权(S205)。
在本实施方式中,作为接下来的步骤,传感器数据获取部301获取外观检查装置120的正常运转时的传感器数据(S401)。接着,聚类间迁移信息评价部303根据在步骤S401中输出的传感器数据,进行对有向图的边进一步加权的处理(S402)。
具体地,聚类间迁移信息评估部303使用Change-Finder算法将从硬件获取的传感器数据(时间序列数值数据)变换为表示时间序列中的各时刻的变化的大小的数据(变化得分)。图16表示说明传感器数据与变化得分的关系的说明图。另外,Change-Finder算法是公知的方法,因此省略详细的说明。
此时,如图16所示,成为变化得分的基础的传感器数据的数值范围根据成为对象的硬件等而不同,因此变化得分也反映出这样的差异,数值范围产生偏差。因此,将所有的变化得分在0~1之间进行标准化。
接着,聚类间迁移信息评价部303将变化得分映射到聚类信息提取部102生成的日志聚类序列(参照图7),对在哪个聚类间的迁移时变化得分大建立对应。图17表示映射了变化得分的日志聚类序列的例子。
然后,聚类间迁移信息评价部303通过反映有向图的各边(各聚类间迁移)的变化得分的大小,对有向图的各边进行基于硬件信息的加权。
这样,当步骤S402的处理结束时,进入步骤S206,但基准数据生成处理(S301)的子例程所涉及的以后的处理与在实施方式1中说明的相同,因此省略此处的说明。
将说明返回到图14的表示故障原因估计处理的流程图,如果步骤S301的处理结束,则基准数据生成部105将生成的基准数据保存在存储部109中(S102)。然后,在外观检查装置120的故障发生时,日志数据取得部101取得故障发生时的日志数据(S103),传感器数据取得部301取得表示故障发生时的硬件状态的传感器数据(S302)。
然后,在信息处理终端300中,执行从故障发生时的日志数据中提取聚类信息,基于该聚类信息生成加权后的有向图,进一步对该有向图进行基于传感器数据的加权,取得对有向图进行矩阵变换后的数据的一系列处理(S303)。此外,在步骤S303中进行的具体的处理内容与在上述的步骤S301的子例程中的步骤S202至步骤S205、步骤S402以及步骤S207中进行的处理相同。因此,省略再次的说明。
另外,本实施方式中的步骤S105以后的处理也与实施方式1的内容相同,因此省略此处的说明。
根据本实施方式的装置管理系统3,能够使用表示外观检查装置120的硬件状态的传感器数据,进一步进行有向图的边(即聚类间迁移信息)的加权。在仅以聚类间的迁移的发生频度进行加权的有向图中,与外观检查装置120中的步骤的切换、硬件状态的变化对应的(虽然频度低)重要的聚类间迁移信息有可能被过小评价。对此,在本实施方式的装置管理系统3中,检测传感器数据的重要的变化点,基于此进一步进行边的加权,因此能够抑制重要的聚类间迁移信息被过小评价,得到更高精度的故障原因的估计结果。
<其他>
上述各实施方式只不过是例示性地说明本发明,本发明并不限定于上述的具体的方式。本发明能够在其技术思想的范围内进行各种变形和组合。例如,在上述实施方式中,说明了以外观检查装置为对象的管理系统,但装置管理系统的管理对象的装置不限于此。如上所述,不使用故障发生时的异常的数据,而使用仅通过正常运转时的数据进行学习后的基准数据来进行故障的发生原因的估计,因此能够仅使用在装置的实际运用线能够收集的数据来运用,因此能够将本发明应用于各种装置。
另外,作为正常运转时的数据,不将由装置进行的处理的对象物(检查、加工的对象)限定为1个,也能够在收集对多个对象物进行了处理时的数据的基础上,将它们混合而生成基准数据。在该情况下,也不需要对象物在哪个定时被变更为什么等数据,能够仅通过软件日志和传感器数据来生成基准数据。
另外,在上述实施方式中,设为包含管理对象的装置的系统,但也能够仅将上述实施方式中的信息处理终端理解为本发明的管理系统。即,本发明也可以理解为由与管理对象的装置分体构成的信息处理终端构成的装置管理终端。
<附记1>
一种装置的管理系统(1、2、3),其特征在于,具备:
日志数据取得单元(101),其取得日志,所述日志是与所述装置的控制有关的软件的动作记录;
聚类信息提取单元(102),其从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示与所述装置的运转有关的各步骤的内容的信息,所述聚类间迁移信息是与一个所述步骤和另一个所述步骤之间的迁移有关的信息;
异常度计算单元(106),其计算所述提取出的各个所述聚类间迁移信息的异常度;以及
故障原因估计单元(107),其根据由所述异常度计算单元计算出的所述异常度,估计所述装置的故障原因。
<附记2>
一种装置的故障原因估计方法,是估计装置的故障原因的方法,包含如下步骤:
日志数据取得步骤(S201、S103),取得日志,所述日志是与所述装置的控制有关的软件的动作历史信息;
聚类信息提取步骤(S202、S203),从取得的所述日志的集合中,提取聚类信息以及聚类间迁移信息,所述聚类信息是表示由所述装置进行的处理的各步骤的内容的信息,所述聚类间迁移信息是与所述装置中的多个所述步骤间的迁移有关的信息;
异常度计算步骤(S105),计算所述提取出的各个所述聚类间迁移信息的异常度;以及
故障原因估计步骤(S106),基于由所述异常度计算单元计算出的所述异常度,估计所述装置的故障原因。

Claims (15)

1.一种装置管理系统,其是装置的管理系统,所述装置管理系统的特征在于,具备:
日志数据取得单元,其取得日志,所述日志是与所述装置的控制有关的软件的动作记录;
聚类信息提取单元,其从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示与所述装置的运转有关的各步骤的内容的信息,所述聚类间迁移信息是与一个所述步骤和另一个所述步骤之间的迁移有关的信息;
异常度计算单元,其计算所述提取出的各个所述聚类间迁移信息的异常度;以及
故障原因估计单元,其基于由所述异常度计算单元计算出的所述异常度,估计所述装置的故障原因。
2.根据权利要求1所述的装置管理系统,其特征在于,
所述异常度计算单元基于所述装置正常时的所述聚类间迁移信息,计算所述提取出的各个所述聚类间迁移信息的异常度。
3.根据权利要求1或2所述的装置管理系统,其特征在于,
在所述聚类间迁移信息中包含与所述装置中的多个所述步骤间的迁移的发生频度有关的信息,
所述装置管理系统还具备聚类间迁移信息评价单元,所述聚类间迁移信息评价单元基于所述发生频度,进行所述提取出的各个所述聚类间迁移信息的加权,
所述异常度计算单元使用所述加权的信息,计算所述异常度。
4.根据权利要求3所述的装置管理系统,其特征在于,
所述装置管理系统还具备硬件信息取得单元,所述硬件信息取得单元取得与所述装置的硬件的状态有关的硬件信息,
所述聚类间迁移信息评价单元进一步基于所述硬件信息取得单元取得的所述硬件信息,进行所述提取出的各个所述聚类间迁移信息的加权。
5.根据权利要求1或2所述的装置管理系统,其特征在于,
所述故障原因估计单元估计为在由所述异常度计算单元计算出的所述异常度满足规定条件的所述聚类间迁移信息所确定的步骤中存在所述装置的故障原因。
6.根据权利要求1或2所述的装置管理系统,其特征在于,
所述装置管理系统还具备显示单元,所述显示单元能够显示表示由所述异常度计算单元计算出的所述异常度和/或由所述故障原因估计单元估计出的所述故障原因的信息。
7.根据权利要求6所述的装置管理系统,其特征在于,
所述装置管理系统还具备有向图生成单元,所述有向图生成单元将所述聚类信息作为节点,将所述聚类间迁移信息作为边,生成表示各个所述聚类信息与所述聚类间迁移信息的关系的有向图,
所述显示单元能够显示所述有向图。
8.根据权利要求7所述的装置管理系统,其特征在于,
所述聚类间迁移信息是通过规定方法进行了附加重要度的评价的加权的信息,
所述有向图生成单元生成能够视觉确认各个所述聚类间迁移信息中的所述加权的所述有向图。
9.根据权利要求8所述的装置管理系统,其特征在于,
所述有向图生成单元通过将表示所述聚类间迁移信息中的所述加权的数值显示在所述边的附近,生成能够视觉确认地表现所述加权的有向图。
10.根据权利要求8所述的装置管理系统,其特征在于,
所述有向图生成单元通过对表示各个所述聚类间迁移信息的所述边的清晰度设置差异地进行显示,生成能够视觉确认地表现所述加权的有向图。
11.根据权利要求7所述的装置管理系统,其特征在于,
在所述聚类信息中包含作为从所述日志提取出的文本信息的单词,
所述有向图生成单元按照出现次数从多到少的顺序提取各个所述聚类信息中包含的所述单词,并且生成使用了所述提取出的单词作为表示所述聚类信息的内容的信息的所述有向图。
12.根据权利要求7所述的装置管理系统,其特征在于,
所述装置管理系统还具备提取日志显示图像生成单元,所述提取日志显示图像生成单元从所述日志的集合中提取与满足规定条件的所述聚类间迁移信息对应的日志,作为表示满足所述规定条件的所述聚类间迁移信息的内容的信息,并且生成表示该提取出的日志的内容的提取日志显示图像,
所述显示单元能够显示所述提取日志显示图像。
13.根据权利要求12所述的装置管理系统,其特征在于,
所述提取日志显示图像在表示与该提取日志显示图像所示的提取日志对应的所述聚类间迁移信息的所述边的附近弹出显示。
14.一种装置的故障原因估计方法,其是估计装置的故障原因的方法,所述装置的故障原因估计方法包含如下步骤:
日志数据取得步骤,取得日志,所述日志是与所述装置的控制有关的软件的动作历史信息;
聚类信息提取步骤,从取得的所述日志的集合中提取聚类信息以及聚类间迁移信息,所述聚类信息是表示由所述装置进行的处理的各步骤的内容的信息,所述聚类间迁移信息是与所述装置中的多个所述步骤间的迁移有关的信息;
异常度计算步骤,计算所述提取出的各个所述聚类间迁移信息的异常度;以及
故障原因估计步骤,基于在所述异常度计算步骤中计算出的所述异常度,估计所述装置的故障原因。
15.一种存储介质,其非暂时性地存储程序,所述程序用于使计算机执行权利要求14所述的方法的各步骤。
CN202211016320.7A 2021-09-06 2022-08-24 装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质 Pending CN115774656A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021145011A JP2023038095A (ja) 2021-09-06 2021-09-06 装置管理システム、装置の障害原因推定方法、及びプログラム
JP2021-145011 2021-09-06

Publications (1)

Publication Number Publication Date
CN115774656A true CN115774656A (zh) 2023-03-10

Family

ID=85226567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211016320.7A Pending CN115774656A (zh) 2021-09-06 2022-08-24 装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质

Country Status (4)

Country Link
JP (1) JP2023038095A (zh)
CN (1) CN115774656A (zh)
DE (1) DE102022208921A1 (zh)
TW (1) TWI824681B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100742685B1 (ko) * 2002-12-26 2007-07-25 니뽄 다바코 산교 가부시키가이샤 해석시스템 및 그 시스템에 있어서의 해석방법 및 해석에 이용하는 조사결과를 수집하는 시스템
TWI684139B (zh) * 2018-10-16 2020-02-01 中華電信股份有限公司 基於自動學習的基地台異常之預測的系統與方法
JP7467168B2 (ja) 2020-03-11 2024-04-15 キヤノン株式会社 撮像素子ユニット及び撮像装置

Also Published As

Publication number Publication date
DE102022208921A1 (de) 2023-03-09
TWI824681B (zh) 2023-12-01
TW202311879A (zh) 2023-03-16
JP2023038095A (ja) 2023-03-16

Similar Documents

Publication Publication Date Title
JP6652699B2 (ja) アノマリ評価プログラム、アノマリ評価方法、および情報処理装置
US8682616B2 (en) Identifying failures in an aeroengine
EP2854053B1 (en) Defect prediction method and device
CN114065613A (zh) 基于深度迁移学习的多工况流程工业故障检测诊断方法
US10901401B2 (en) Plan generation apparatus, method and computer readable medium for multi-process production of intermediate product
JP2013025367A (ja) 設備状態監視方法およびその装置
JP2013143009A (ja) 設備状態監視方法およびその装置
JP6711323B2 (ja) プロセスの異常状態診断方法および異常状態診断装置
JP2015170121A (ja) 異常診断装置及びプログラム
CN112016689B (zh) 信息处理装置、预测判别系统以及预测判别方法
CN112272763A (zh) 异常探测装置、异常探测方法以及异常探测程序
JP2013041173A (ja) 障害予測システム及びプログラム
JP6866930B2 (ja) 生産設備監視装置、生産設備監視方法及び生産設備監視プログラム
EP3910437B1 (en) Monitoring apparatus, monitoring method, and computer-readable medium
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
CN112000081A (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
JP5668425B2 (ja) 障害検知装置、情報処理方法、およびプログラム
CN115774656A (zh) 装置管理系统、装置的故障原因估计方法以及非暂时性地存储程序的存储介质
JP6579163B2 (ja) プロセスの状態診断方法及び状態診断装置
Gatta et al. Capability of the Bayesian Forecasting Method to Predict Field Time Series
JP6247777B2 (ja) 異常診断装置および異常診断方法
JP6627258B2 (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
WO2023144934A1 (ja) 情報処理装置、情報処理システム、顧客装置、情報処理方法及び非一時的なコンピュータ可読媒体
Onishi et al. Machine Failure Diagnosis by Combining Software Log and Sensor Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination