CN113287104A - 数据分类装置 - Google Patents

数据分类装置 Download PDF

Info

Publication number
CN113287104A
CN113287104A CN201980088720.9A CN201980088720A CN113287104A CN 113287104 A CN113287104 A CN 113287104A CN 201980088720 A CN201980088720 A CN 201980088720A CN 113287104 A CN113287104 A CN 113287104A
Authority
CN
China
Prior art keywords
data
evaluation index
qualitative
category
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980088720.9A
Other languages
English (en)
Inventor
堀嘉成
关合孝朗
黑羽义幸
平塚政幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN113287104A publication Critical patent/CN113287104A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Manufacturing & Machinery (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据分类装置,其考虑到成套设备的定性信息,使成套设备的状态与评价指标的关卡可视化,能够灵活用于运转指导。本发明的数据分类装置的特征在于,具有:运转数据数据库,其存储成套设备的运转数据;评价指标数据库,其存储成套设备的评价指标;定性数据数据库,其存储与成套设备相关的定性数据;数据分类单元,其使用数据聚类技术将运转数据按类别分类,将所分类的类别与评价指标和定性数据关联起来,学习它们的关系;以及分类结果显示单元,其在三维图表中显示由数据分类单元学习到的结果。

Description

数据分类装置
技术领域
本发明涉及一种对温度、压力、流量等运转数据进行分类的数据分类装置。
背景技术
在发电成套设备、化学成套设备等中,以成套设备的监视、控制为目的,设置有温度计、压力计、流量计等多个传感器。近年来,希望灵活运用这些传感器的测量数据,来提高成套设备的运用效率、由成套设备生产的产品的收获率等要求日益高涨。
为了提高成套设备的运用效率、产品的收获率等评价指标,需要将成套设备的状态与评价指标的关系模型化。
作为这样的本技术领域的背景技术,例如有日本特开2018-49314号公报(专利文献1)。在该专利文献1中记载了一种成套设备数据显示处理装置,具备:数据分类部,其将运转数据按与类似度对应的类别进行分类;评价指标计算部,其根据运转数据的值计算类别的评价指标;以及分类结果显示处理部,其根据各类别中包含的运转数据,按每个类别计算运转数据的代表值,根据运转数据的代表值的类似度,将各类别的识别信息映射为二维,将该类别的识别信息表示于由第一轴和第二轴构成的平面,并且生成将由评价指标计算部求出的类别的评价指标表示于第三轴的三维图像数据(参照摘要)。
现有技术文献
专利文献
专利文献1:日本特开2018-49314号公报
发明内容
发明所要解决的课题
在专利文献1中记载了使成套设备的状态与评价指标的关系可视化。
但是,在专利文献1中,并不是与评价指标的变动联动地变化,其没有针对考虑成套设备的定性信息,使成套设备的状态与评价指标的关系可视化的情况进行记载。
对此,本发明提供一种数据分类装置,其考虑到成套设备的定性信息,使成套设备的状态与评价指标的关系可视化,并能够灵活应用于运转指导。
用于解决课题的手段
为了解决上述课题,本发明的数据分类装置的特征在于,具有:运转数据数据库,其存储成套设备的运转数据;评价指标数据库,其存储成套设备的评价指标;定性数据数据库,其存储与成套设备相关的定性数据;数据分类单元,其使用数据聚类技术将运转数据分类为类别,将分类出的类别与评价指标以及定性数据关联起来,学习它们的关系;以及分类结果显示单元,其在三维图表中显示由数据分类单元学习到的结果。
发明效果
根据本发明,能够提供一种数据分类装置,其考虑到成套设备的定性信息,使成套设备的状态与评价指标的关系可视化,并能够灵活应用于运转指导。
另外,通过以下的实施方式的说明,将使上述以外的课题、结构以及效果更加清楚。
附图说明
图1是表示专利文献1所记载的类别编号与评价指标的关系的图表。
图2是表示本实施例中记载的数据分类装置的说明图。
图3是表示本实施例中记载的类别编号与评价指标的关系的图表。
图4是本实施例所记载的成套设备的系统图。
图5是表示运转数据数据库中存储的运转数据的说明图。
图6是表示评价指标数据库中存储的评价指标的说明图。
图7是表示定性数据数据库中存储的定性数据的说明图。
图8是表示被转换为时序数据的定性数据的说明图。
图9是表示使用自适应共振理论(ART)的运转数据的分类方法的说明图。
图10是在ART中对二维的运转数据进行了分类的情况的示意图。
图11是考虑定性数据对二维的运转数据进行了分类的情况的示意图。
图12是表示数据分类算法的流程图。
图13是表示考虑定性数据分类而得的类别编号与评价指标的关系的图表。
图14是表示实施例2所记载的数据分类装置的说明图。
图15是对考虑定性数据而将二维的运转数据分类而得的结果和未学习数据一并表示的示意图。
图16是对考虑定性数据而分类而得的类别编号与评价指标的关系和推定结果一并表示的图表。
具体实施方式
下面使用附图对本发明实施例进行说明。另外,对相同或类似的结构标注相同的附图标记,在说明重复的情况下,有时省略其说明。
实施例1
首先,在说明本发明的实施例之前,对专利文献1所记载的图表进行说明。
图1是表示专利文献1所记载的类别编号与评价指标的关系的图表。
该图表的Z轴是评价指标,图表上显示的编号表示类别编号。在图1中,表示在类别编号1的情况下评价指标高,在类别编号3、5、8的情况下评价指标低。此外,由于在X-Y平面上的位置表示类别编号之间的位置关系,因此,例如,在视觉上确认类别编号5接近类别编号8,类别编号1、类别编号7远离类别编号8。
因此,通过使用这些信息,例如,在当前的成套设备的状态为类别编号3的情况下,能够灵活应用于以评价指标高、且位置接近的类别编号1为目标即可等的运转指导。
但是,在这样灵活应用于运转指导的情况下,例如,即使在评价指标降低到相同程度的情况下,其原因也存在被认为是原料的组成发生了变化的影响、设备的性能发生了劣化的影响等成套设备的定性的影响。这样的成套设备的定性的影响(信息)并不是与评价指标的变动联动地变化,无法单纯地对该图表附加信息。
对此,本实施例所记载的数据分类装置考虑这样的成套设备的定性的影响(信息),使成套设备的状态与评价指标的关系可视化,并灵活应用于运转指导。
图2是表示本实施例中记载的数据分类装置的说明图。
本实施例中记载的数据分类装置具有:运转数据数据库3、评价指标数据库4、定性数据数据库5、数据分类单元6、分类结果显示单元7。
另外,以下将“数据库”称为“DB”进行说明。
并且,在本实施例所记载的数据分类装置上连接有成套设备1、控制装置2。进而,数据分类装置、成套设备1、控制装置2构成成套设备控制系统。
成套设备1具有设备、连接设备的配管、阀等。另外,为了对成套设备1的状态进行监视以及控制,设置有温度计、压力计以及流量计等传感器。
控制装置2使用设置于成套设备1的温度计、压力计以及流量计等传感器所测量的温度、压力和流量等测量数据,对成套设备1的状态进行监视以及控制。然后,使用这些测量数据,确定阀的开度等操作量,对成套设备1进行监视和控制。
在运转数据DB3中,存储从成套设备1测量的温度、压力及流量等测量数据、阀的开度等操作量数据、用于控制的设定值数据来作为时间序列数据。此外,以下将“测量数据、操作量数据、设定值数据”称为“运转数据”进行说明。并且,该运转数据表示成套设备1的状态。即,运转数据DB3存储成套设备1的运转数据。
在评价指标DB4中存储有表示成套设备1的性能评价的评价指标。在本实施例中,作为成套设备1的性能评价,存储由控制装置2求出的成套设备1的运用效率(以下,称为“成套设备效率”来进行说明)。另外,该成套设备效率(评价指标)也可以根据存储于运转数据DB3的运转数据来求出。另外,例如也可以离线分析原料的组成、设备的性能等,将其分析结果存储为评价指标。
定性数据DB5中,关于成套设备1,存储定性数据(不成为数值的成套设备1的定性信息)。在本实施例中,作为定性数据,存储通过工厂1的检查而获取的“阀A不良”、“反应器R4劣化”等信息(检查数据)。
数据分类单元6对存储于运转数据DB3的运转数据、存储于评价指标DB4的工厂效率、存储于定性数据DB6的检查数据的关系进行学习。具体而言,使用数据聚类技术将多维的运转数据按类别分类,将所分类的类别与成套设备效率(评价指标)以及检查数据(定性数据)关联起来,学习它们的关系。
分类结果显示单元7用三维图表显示由数据分类单元6分类而得的结果(学习的结果)。
图3是表示本实施例中记载的类别编号与评价指标的关系的图表。
该三维图表的各轴与图1相同,Z轴为评价指标(在本实施例中为成套设备效率),XY平面是表示对运转数据进行分类而得的类别的位置关系的平面。
但是,在图1中,作为凡例,在各类别的代表值上显示有类别编号,但在本实施例中,除了类别编号以外,还显示“阀A不良”、“反应器R4劣化”等检查数据(定性数据)。另外,各类别的代表值是该类别中包含的运转数据的平均值、加权平均(重心)。
即,本实施例所示的三维图表是使预定的轴(例如,Z轴)表示评价指标(成套设备效率),使其他2轴(例如XY平面)表示所分类的类别的代表值的图表,在标绘的各点的凡例示出类别编号及其类别编号的定性数据(检查数据)。
这样,在本实施例中,例如在类别编号3、5、8的情况下,对与成套设备效率降低这样的信息和成为其原因的成套设备1的定性的信息(“阀A不良”、“反应器R4劣化”等检查数据)也一起显示。由此,能够使对运转指导有用的信息可视化。
图4是本实施例所记载的成套设备的系统图。
该系统图例如是由系统图制作用CAD(computer、aided design)软件制作的电子文件,在系统图中记载了设备、连接设备的配管、阀、温度计、压力计以及流量计等传感器(测量设备)。
系统图也被称为配管计装线图、或者P&ID(Piping&Instrument Flow Diagram)。在系统图中记载有设备、连接设备的配管、阀、测量设备等信息。另外,在图4中,对测量仪器附加有F1、P1、T1等标签。在本实施例中,F表示流量计,P表示压力计,T表示温度计。另外,R表示反应器。另外,在本实施例中,设置有28个测量设备、4个反应器(R1~R4)、3个阀(A~C)。
图5是表示存储于运转数据数据库的运转数据的说明图。
存储于运转数据DB3的运转数据是每个时刻的流量、压力、温度的时序数据。在本实施例中,对反应器R1的入口流量T1、反应器R1的入口压力P1、反应器R1的入口流量F1等在成套设备1的系统图(参照图4)的各部位(28个测量仪器)测量的测量数据(运转数据)例如以1分钟间隔来进行储存。
图6是表示存储在评价指标数据库中的评价指标的说明图。
在评价指标DB4中,作为评价指标存储有表示成套设备1的性能评价的成套设备效率。在本实施例中,将由控制装置2求出的每个时刻(例如,1分钟间隔)的成套设备效率被存储为时间序列数据。另外,在本实施例中,工厂效率和运转数据被分别记录,但也可以在图5所示的运转数据中记录工厂效率。
图7是表示定性数据数据库中存储的定性数据的说明图。
定性数据DB5中存储定性数据作为成套设备1的定性的信息。在本实施例中,作为定性数据,存储通过成套设备1的检查而获取的“阀A不良”、“反应器R4劣化”等检查数据。并且,在本实施例中,存储通过检查确认阀A不良、反应器R4劣化的时刻(开始时刻)和其对策结束的时刻(结束时刻)。
但是,在向数据分类单元6输入这些测量数据(运转数据)、成套设备效率(评价指标)、检查数据(定性数据)的情况下,需要将检查数据(定性数据)如图5所示的测量数据(运转数据)或图6所示的成套设备效率(评价指标)那样变换为每个时刻的数据格式。因此,将该检查数据(定性数据)变换为时间序列数据。
图8是表示变换为时序数据的定性数据的说明图。
在本实施例中,例如对于“阀A不良”的情况,在2018/3/1010:01:00~2018/3/1015:15:00存储为“阀A不良”,在2018/3/1015:16:00~2018/4/12 0:00:00存储为“正常”。这样,检查数据(定性数据)也与测量数据(运转数据)、成套设备效率(评价指标)同样地,被存储为与它们相同的每个时刻(例如,1分钟间隔)的时间序列数据。
另外,在本实施例中,使用检查数据作为定性数据,但也可以使用原料的产地等表示原料的组成的信息来作为定性数据。
接着,对数据分类单元6进行说明。在数据分类单元6中,使用具有训练数据的学习型的数据聚类技术,学习多维的运转数据与成套设备效率和检查数据的关系。在说明该学习算法之前,对成为前提的数据聚类技术进行说明。
在本实施例中,作为数据聚类技术,使用作为无监督学习中的1种的自适应共振理论(Adaptive Resonance Theory:ART)。另外,作为数据聚类技术,并不限定于ART,也可以使用其他的数据聚类技术。
ART是模拟了人的模式识别算法的模型,能够基于其类似度将多维的数据分类为多个类别。关于ART的结构,由于是公知的,所以省略说明,对使用ART的数据的分类方法进行说明。
图9是表示使用自适应共振理论(ART)的运转数据的分类方法的说明图。
在图9的上图中,横轴表示时刻,纵轴表示运转数据。另外,在图9的下图中,横轴表示时刻,纵轴表示类别编号(成套设备1的状态)。
一般来说,输入至ART的运转数据是四维以上的数据,但是这里,针对将数据简单化并对图9的上图所示的二维的时间序列数据(数据1以及数据2)进行分类的情况进行说明。该每个时刻的运转数据成为数据1以及数据2的二维的时间序列数据(输入数据)。另外,在此,为了便于说明,在图9的上图中记载有数据1及数据2这两个运转数据,但在本实施例中,由于具有由28个测量设备测量的测量数据(运转数据),因此记载有数据1~数据28的运转数据。即,28个运转数据(对应于28个测量设备所测量的测量数据(运转数据))作为输入数据被输入到ART。
若将该二维的时间序列数据(运转数据)输入到作为数据分类单元6的ART,则例如数据1的值较大,且数据2的值较小的区域1的数据被分类为某个类别(类别1)(参照图9的下图)。另外,区域2的数据由于区域1的数据与数据1与数据2的关系不同,因此被分类为其他类别(类别2)(参照图9的下图)。同样地,区域3的数据、区域4的数据分别被分类为不同的类别。
这样,ART基于类似度按时间序列将输入数据分类为多个类别。另外,在本实施例中,在对类别进行分类时,虽然使用类别编号(数字),但并不限定于编号(数字)。另外,图9的下图中的“○”表示各类别中的每个时刻(例如,1分钟间隔)的成套设备1的状态。
但是,由于ART是无监督学习型的算法,因此难以学习运转数据、评价指标、定性数据这三者的关系。
对此,在本实施例中,进一步使用监督学习型的算法。在示出本实施例中使用的学习算法之前,使用图10以及图11对学习算法的想法进行说明。
图10是在ART中对二维的运转数据进行了分类的情况下的示意图。
在图10中,各点表示运转数据,运转数据的颜色的浓淡表示评价指标。颜色越浓,则评价指标(成套设备效率)越低,颜色越淡,则表示评价指标(成套设备效率)越高。
在图10中,运转数据被分类为4个类别。但是,在分类为各类别的运转数据中评价指标高的运转数据和评价指标低的运转数据混在一起,无法将类别与评价指标关联起来。另外,在类别编号1所包含的运转数据中包含有异常A的数据和异常B的数据,无法进行类别与定性数据(检查数据)的关联。另外,在此,“异常A”、“异常B”是检查数据的种类,表示“阀A不良”、“反应器R4劣化”等。
对此,在本实施例中,使类别的范围(大小:以后述的警戒系数进行调整)减小,使1个类别中包含的运转数据减少,以将评价指标的范围(后述的偏差度)设为一定值以下,将某个定性数据的比例(后述的匹配度)设为一定值以上的方式进行分类。另外,“将评价指标的范围设为一定值以下”是指将评价指标的范围设为一定的比例以下,将“某个定性数据的比例设为一定值以上”是指例如将某个类别中包含的异常A(例如,比例最高的异常)的比例设为一定值以上。
即,在本实施例中,数据分类单元6将与按各类别进行了分类的运转数据相关联的定性数据中的比例最高的定性数据的比例设为一定值以上,将与按各类别进行了分类的运转数据相关联的评价指标的范围设为一定值以下。
图11是考虑定性数据对二维的运转数据进行了分类时的示意图。
在图11中,各点也表示运转数据,运转数据的颜色的浓淡表示评价指标。表示为颜色越浓,则评价指标(成套设备效率)越低,颜色越淡,则评价指标(成套设备效率)越高。
在图11中,运转数据被分类为8个类别。图11所示的1个类别中包含的运转数据比图10所示的1个类别中包含的运转数据少。其结果是,被分类为各类别的运转数据的评价指标的偏差变小。例如,在图10的类别编号1中,评价指标从低到高混在一起,但在图11中,图10的类别编号1中包含的运转数据被分类为类别编号1、2、8这3个类别,类别编号1为评价指标比较低的类别,类别编号2为评价指标为中等程度的类别,类别编号8为评价指标比较高的类别。
另外,在图10的类别编号1中,异常A的数据和异常B的数据混在一起,但在图11中,图10的类别编号1中包含的运转数据被分类为类别编号1、2、8这3个类别,因此类别编号1中仅包含异常A的运转数据,类别编号8中仅包含异常B的运转数据。由此,例如,被分类为类别编号1的运转数据如“评价指标低,且为异常A的运转数据”那样,能够将运转数据与评价指标和定性数据关联起来。即,能够学习运转数据、评价指标、定性数据的关系。
在此,对能够进行这样的分类的数据分类算法的详细内容进行说明。
图12是表示数据分类算法的流程图。
在步骤1中,从运转数据DB3、评价指标DB4、定性数据DB5读入运转数据、评价指标、定性数据。如图5、图6、图8所示,这些数据是每个时刻的时序数据,因此示出某时刻的运转数据与评价指标和定性数据的关系。
在步骤2中,设定各类别(设为j)的警戒系数pj。在此,警戒系数pj是决定类别的范围的参数,取0~1之间的值。越接近1,类别的范围就越小,越接近0,类别的范围就越大。在本实施例中,针对每个类别j设定警戒系数pj,调整类别j的范围。此外,关于警戒系数pj,操作员设定为初始值。
在步骤3中,使用在步骤2中设定的警戒系数pj,使用图9所示的ART(数据聚类技术),将运转数据按各类别分类。
在步骤4中,针对按各类别分类的运转数据,计算定性数据的匹配度和/或评价指标的偏差度。
类别j中的定性数据的匹配度Mj由公式(1)定义,并根据公式(1)求出。
Mj=Nm/Nj (1)
在此,Nm是运转数据(Nj)中最多的(比例最高的)定性数据的数量,Nj是类别j的运转数据数量。
例如,在被分类为类别j的运转数据数量为100(Nj),其中,异常A的运转数据数量为70(Nm),正常的运转数据数量为25,异常B的运转数据数量为5的情况下,比例最高的定性数据为异常A,因此定性数据的数量为70,定性数据的匹配度Mj为0.7。
另外,就评价指标的偏差度Vj而言,若将评价指标设为Z,则根据被分类为类别j的评价指标Z的最大值-最小值(以下,称为“范围”来说明评价指标)求出评价指标的偏差度Vj
例如,如果将被分类为类别j的运转数据的评价指标(成套设备效率)Z的最大值设为0.954,将评价指标(成套设备效率)Z的最小值设为0.941,则评价指标的偏差度Vj为0.013。
在步骤5中,对按每个类别j在步骤4中求出的Mj和Vj与所设定的阈值(设定值)进行比较,判定是否满足条件。
具体而言,若将定性数据的匹配度的设定值设为Mset,则定性数据的匹配度Mj比设定值Mset大的情况下,匹配度高,因此判定为满足条件。另外,若将评价指标的偏差度的设定值设为Vset,则在评价指标的偏差度Vj比设定值Vset小的情况下,偏差度较低,因此判定为满足条件。
在此,设定值Mset是决定某个定性数据的比例的“一定值”,设定值Vset是决定评价指标的范围的“一定值”。另外,设定值Mset、设定值Vset是操作员根据图表的使用目的而预先设定的。
满足匹配度以及偏差度两方的条件的情况(是)为图11所示的状态,能够学习类别(运转数据)与评价指标和定性数据的关系,因此进入步骤8。
另一方面,不满足匹配度以及偏差度中的任意一方的条件的情况为是图10所示的状态,因此需要变更警戒系数pj,进入步骤6。
在步骤6中,为了变更警戒系数pj,计算警戒系数pj的变更量。
在此,将变更前的警戒系数pj设为pj(k),将变更后的警戒系数pj设为pj(k+1)。在本实施例中,使用公式(2)~公式(4)求出pj(k+1)。
pj(k+1)=max(pVj·pMj) (2)
[数学式1]
Figure BDA0003157968330000101
[数学式2]
Figure BDA0003157968330000111
即,求出根据评价指标的偏差度决定的pVj和根据定性数据的匹配度决定的pMj,将它们中的较大的一方设为pj(k+1),设为变更后的警戒系数pj。即,pVj或pMj表示根据来自各个设定值的“偏差”的程度求出的警戒系数的更新值。
另外,在公式(3)中,设p的最大值为pmax,评价指标的偏差度越大,pVj为越接近pmax的值。另外,aV是其调整系数。
同样地,在公式(4)中,设p的最大值为pmax,定性数据的匹配度越小,则pMj为越接近pmax的值。另外,aM是其调整系数。
在步骤7中,使用在步骤6中求出的pj来变更警戒系数pj
这样,数据分类单元6求出类别的警戒系数pj、定性数据的匹配度Mj、评价指标的偏差度Vj
然后,返回步骤3,在步骤3中,使用在步骤7中变更的警戒系数pj,将运转数据分类为各类别。
通过重复以上的步骤,能够学习多维的运转数据与评价指标和定性数据的关系。另外,在本实施例中,作为评价指标的偏差度而使用范围,但也可以使用标准偏差、方差等。
最后,对分类结果显示单元7进行说明。在分类结果显示单元7中,以三维图表显示(输出)由数据分类单元6所分类的结果。
这样,根据本实施例,能够同时学习运转数据与评价指标和定性数据的关系,使它们的关系可视化,因此能够提供考虑了评价指标和定性数据双方的运转引导。
图13是表示考虑定性数据分类而得的类别编号与评价指标的关系的图表。图13以三维图表来表示图11所示的分类结果。
三维图表的Z轴是评价指标(成套设备效率),XY平面是表示对运转数据进行了分类的类别的位置关系的平面。
另外,一般而言,运转数据为三维以上,在该情况下,无法严格地在XY平面上再现类别的位置关系。在本实施例中,通过多维尺度法,将三维以上的数据的位置关系虚拟地表现在二维的XY平面上。
另外,在图11的例子中,为了简化说明,将运转数据设为二维,各类别的位置关系以二维表示。因此,以二维表示的图11的各类别的位置关系,被严格地示出于图13的XY平面中。
另外,在凡例中,除了类别编号1~8以外,还显示“异常A”、“正常”这样的检查数据。这样,通过显示与各类别编号对应的评价指标(成套设备效率)、定性数据(检查数据),成套设备1的状态被更明确地可视化,能够灵活应用于更明确的运转指导。
另外,在本实施例中,在分类结果显示单元7中,使用以评价指标为Z轴的三维图表来显示了运转数据与评价指标的关系,但也可以使用变更了基于评价指标的值而标绘的点的颜色的二维图表。另外,在运转数据的维数为三维以上的情况下,也可以用三维图表表现类别的位置关系,变更基于评价指标的值而标绘的点的颜色。
这样,根据本实施例,考虑成套设备的定性信息(定性数据),使成套设备的状态(例如,基于运转数据分类的类别)与评价指标的关系可视化,并能够灵活用于运转指导。
实施例2
在实施例1中,示出了对预先获取的运转数据与评价指标和定性数据的关系进行学习、可视化,并灵活应用于运转引导的例子,但在本实施例中,示出了仅能够获取运转数据,而评价指标、定性数据不明的情况的例子。
即,本实施例中记载的数据分类装置通过预先离线学习运转数据与评价指标和定性数据的关系,由此针对新获取的运转数据推定评价指标、定性数据。
图14是表示实施例2所记载的数据分类装置的说明图。
本实施例中记载的数据分类装置是在实施例1记载的数据分类装置中加入未学习数据推定单元8的装置。
本实施例包括:以离线的方式对运转数据与评价指标和定性数据的关系进行学习、可视化的步骤、以及通过未学习数据推定单元8根据新获取的运转数据推定性能指标和定性数据的步骤这2个步骤。前者与实施例1所记载的相同,因此在此省略说明。以下,对后者的未学习数据推定单元8进行说明。
未学习数据推定单元8的处理根据由数据分类单元6对运转数据进行分类所得的类别而不同。
首先,针对将所获取的运转数据分类为在已进行学习时所分类的类别中的任意类别的情况进行说明。
例如,在根据离线的数据(运转数据、评价指标、定性数据)学习到的运转数据的分类结果(学习类别)具有图11所示的关系的情况下,如果新的运转数据(未在学习类别中使用的运转数据)被分类为类别编号1~8中的某一个学习类别,则能够推定与该学习类别相关联的评价指标以及定性数据。
即,在未学习数据推定单元8中,在由数据分类单元6分类的学习类别中包含推定出的推定类别的情况下,将与所分类的学习类别相关联的评价指标以及定性数据作为推定值输出。
接着,对新的运转数据被分类为学习类别中没有的新类别的情况进行说明。
例如,在新的运转数据不被分类为任何学习类别而分类为新的类别编号9的情况下,由于没有与类别编号9相关联的评价指标和定性数据,因此无法推定评价指标和定性数据。
因此,未学习数据推定单元8在新的运转数据不被分类为任何学习类别的情况下,根据位于新类别的附近的学习类别的评价值以及定性数据,推定新类别的评价指标以及定性数据。
以下,对具体的算法进行说明。将已进行学习时所分类的类别数量设为J,将学习类别j(j=1,2,..,J)的运转数据的代表值(运转数据的平均值)设为xj,将评价指标的代表值设为ZVj,将定性数据的值设为ZMj
新(推定)类别(J+1)的评价指标的代表值(推定值)ZV(J+1)由公式(5)和公式(6)计算。
[数学式3]
Figure BDA0003157968330000131
[数学式4]
dj=|xJ+1-xj|···(6)
另外,dj是从与运转数据的维度相同的多维空间上的新类别(J+1)到各学习类别j的距离,f(x)是随着x增加而减少的函数,在本实施例中,利用公式(7)。
f(x)=1/x (7)
即,新类别(J+1)的评价指标的代表值根据已进行学习时的学习类别的加权平均求出。并且,该系数成为与距离呈反比的值。通过该算法,即使是新类别,也能够求出评价指标的推定值(代表值)。另外,f(x)不限于公式(7)。
另外,新(推定)类别(J+1)的定性数据的值(推定值)ZM(J+1)由于定性数据不是数值,所以也求出推定值为ZM(J+1)的概率P(ZM(J+1))。在本实施例中,将定性数据的种类为k(k=1,2,..K)的类别数设为Jk,通过公式(8)计算概率P(k)。
[数学式5]
Figure BDA0003157968330000141
在此,f(x)使用公式(7),dj是从新类别(J+1)到各学习类别j的距离。并且,系数成为与距离呈反比的值。
即,新类别(J+1)的定性数据的值根据已进行学习时的学习类别的频率的加权平均求出。而且,该值成为对定性数据的种类k的频率考虑了从新类别(J+1)起的距离的概率。
这样,未学习数据推定单元8即使在新的运转数据不被分类为任何学习类别而被分类为新的类别编号9的情况下,也能够推定与类别编号9相关联的评价指标以及定性数据。
图15是将考虑定性数据对二维的运转数据进行分类后的结果和未学习数据一并示出的示意图。
例如,在新的运转数据的类别的代表值是点A的情况下,接近学习类别编号7(异常B)以及学习类别编号8(异常B),接着,接近学习类别编号1(异常A)。即,在该情况下,定性数据被推定为异常B。
图16是将考虑定性数据而分类所得的类别编号与评价指标的关系和推定结果一并示出的图表。
如图16所示,根据点A的XY坐标和评价指标的推定值ZVj,确定三维图表上的坐标,并一并显示定性数据的推定值ZM(J+1)及其概率P(ZM(J+1))。
这样,即使在新的运转数据不被分类为任何学习类别而被分类为新的类别编号9的情况下,也能够推定评价指标以及定性数据并进行可视化。
此外,将学习类别的代表值的XY平面上的坐标固定,以使公式(9)的e(J+1)最小的方式求出点A的XY坐标。
[数学式6]
Figure BDA0003157968330000151
这里,d’j是从新类别(J+1)的代表值到学习类别的代表值为止的XY平面上的距离,dj如上所述是从新类别(J+1)的代表值到学习类别的代表值为止的多维空间上的距离。由此,学习类别的代表值的XY坐标不会变化,能够求出点A的XY坐标。
另外,在本实施例中,对产生1个新类别的情况进行了说明,但对于将多个运转数据进行分类并产生了多个新类别的情况下的处理,同样地也能够以使学习类别的代表值的XY坐标不变化的方式求出。
另外,在学习类别的代表值的XY坐标变化亦可的情况下,也可以通过多维尺度法来求出将新类别和学习类别合并起来的全部(J+1)个XY坐标。
这样,未学习数据推定单元8在由数据分类单元6所分类的学习类别中不包含推定出的推定类别的情况下,将与所分类的学习类别相关联的评价指标的加权平均和定性数据的频率的加权平均作为推定值输出。
即,本实施例所记载的数据分类装置特别是数据分类单元6使用数据聚类技术将运转数据(测量数据)按类别分类,将所分类的类别与评价指标(成套设备效率)以及定性数据(检查数据)关联起来,预先以离线的方式学习运转数据与评价指标和定性数据的关系,基于学习到的关系,针对新获取的运转数据(测量数据)推定评价指标(成套设备效率)、定性数据(检查数据)。
并且,分类结果显示单元7将由数据分类单元6和未学习数据推定单元8学习到的结果显示在三维图表中。
这样,根据本实施例,能够基于考虑了预先以离线的方式获取的成套设备的定性信息(定性数据)的成套设备的状态(例如,基于运转数据分类的学习类别)与评价指标的关系,使新获取的运转数据可视化,并灵活应用于运转指导。因此,也能够灵活应用于实时地获取了成套设备的运转数据的情况下的运转引导。
此外,本发明并非仅限定于上述的实施例,也包括各种变形例。例如,上述的实施例是为了容易理解地说明本发明而详细记载的,并不限定于必须具有所说明的全部结构。另外,能够将一个实施例的结构的一部分置换为其他实施例的结构的一部分,另外,也能够在一个实施例的结构中添加其他实施例的结构。
附图标记说明
1:成套设备、2:控制装置、3:运转数据数据库、4:评价指标数据库、5:定性数据数据库、6:数据分类单元、7:分类结果显示单元、8:未学习数据推定单元。

Claims (11)

1.一种数据分类装置,其特征在于,
所述数据分类装置具有:
运转数据数据库,其存储成套设备的运转数据;
评价指标数据库,其存储所述成套设备的评价指标;
定性数据数据库,其存储与所述成套设备相关的定性数据;
数据分类单元,其使用数据聚类技术将所述运转数据按类别分类,将所分类的类别与所述评价指标和所述定性数据关联起来,并学习它们的关系;以及
分类结果显示单元,其将由所述数据分类单元学习到的结果显示在图表中。
2.根据权利要求1所述的数据分类装置,其特征在于,
所述图表是在预定的轴上示出所述评价指标,并在其他两轴上示出所分类的类别的代表值的位置关系的三维图表,并表示类别编号和所述类别编号的定性数据。
3.根据权利要求1所述的数据分类装置,其特征在于,
所述图表是示出所分类的类别的代表值的位置关系,并且基于评价指标的值而变更了所标绘的点的颜色的二维图表或三维图表,并表示类别编号和所述类别编号的定性数据。
4.根据权利要求1所述的数据分类装置,其特征在于,
所述定性数据被保存为与所述运转数据和所述评价指标相同的每个时刻的时序数据。
5.根据权利要求1所述的数据分类装置,其特征在于,
所述数据聚类技术是自适应共振理论。
6.根据权利要求1所述的数据分类装置,其特征在于,
所述数据分类单元以将与按各类别分类出的运转数据关联的定性数据中的比例最高的定性数据的比例设为一定值以上,将与按各类别分类出的运转数据关联的评价指标的范围设为一定值以下的方式来进行分类。
7.根据权利要求1所述的数据分类装置,其特征在于,
上述数据分类单元求出类别的警戒系数、定性数据的匹配度、评价指标的偏差度。
8.一种数据分类装置,其特征在于,
所述数据分类装置具有:
运转数据数据库,其存储成套设备的运转数据;
评价指标数据库,其存储上述成套设备的评价指标;
定性数据数据库,其存储与所述成套设备相关的定性数据;
数据分类单元,其使用数据聚类技术将所述运转数据按类别分类,将所分类的类别与所述评价指标和所述定性数据关联起来,并预先以离线的方式学习运转数据与评价指标和定性数据的关系;
未学习数据推定单元,其基于预先以离线的方式学习到的运转数据与评价指标和定性数据的关系,并根据新获取的运转数据来推定评价指标、定性数据;以及
分类结果显示单元,其将由所述数据分类单元和所述未学习数据推定单元学习到的结果显示在图表中。
9.根据权利要求8所述的数据分类装置,其特征在于,
所述未学习数据推定单元推定实时获取的运转数据的类别。
10.根据权利要求9所述的数据分类装置,其特征在于,
在由所述数据分类单元分类出的类别中包含所推定的类别的情况下,所述未学习数据推定单元输出与所分类的类别关联起来的评价指标和定性数据作为推定值。
11.根据权利要求8所述的数据分类装置,其特征在于,
在由所述数据分类单元分类出的类别中不包含所推定的类别的情况下,所述未学习数据推定单元输出与所分类的类别关联起来的评价指标的加权平均和定性数据的频率的加权平均作为推定值。
CN201980088720.9A 2019-03-12 2019-10-09 数据分类装置 Pending CN113287104A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019044476A JP7239354B2 (ja) 2019-03-12 2019-03-12 データ分類装置
JP2019-044476 2019-03-12
PCT/JP2019/039757 WO2020183766A1 (ja) 2019-03-12 2019-10-09 データ分類装置

Publications (1)

Publication Number Publication Date
CN113287104A true CN113287104A (zh) 2021-08-20

Family

ID=72427412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980088720.9A Pending CN113287104A (zh) 2019-03-12 2019-10-09 数据分类装置

Country Status (3)

Country Link
JP (1) JP7239354B2 (zh)
CN (1) CN113287104A (zh)
WO (1) WO2020183766A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6976392B1 (ja) 2020-09-04 2021-12-08 住友化学株式会社 リチウム金属複合酸化物、リチウム二次電池用正極及びリチウム二次電池
JP7218338B2 (ja) * 2020-09-28 2023-02-06 横河電機株式会社 データ処理システム、データ処理方法、および、データ処理プログラム
WO2022113274A1 (ja) * 2020-11-27 2022-06-02 日本電信電話株式会社 時系列データ分析装置、時系列データ分析方法、及び時系列データ分析プログラム
JP7094431B1 (ja) 2021-10-29 2022-07-01 西日本技術開発株式会社 プラント性能管理方法、プラント性能管理装置、及びプラント性能管理プログラム
WO2023135769A1 (ja) * 2022-01-14 2023-07-20 中国電力株式会社 評価装置及び評価システム

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08101710A (ja) * 1994-09-30 1996-04-16 Babcock Hitachi Kk プラントの運転制御装置
JP2010237893A (ja) * 2009-03-31 2010-10-21 Hitachi Ltd プラントの異常診断装置及び異常診断方法
CN102418919A (zh) * 2010-08-31 2012-04-18 株式会社日立制作所 设备的控制装置和火力发电设备的控制装置
WO2012073289A1 (ja) * 2010-12-02 2012-06-07 株式会社日立製作所 プラントの診断装置及びプラントの診断方法
CN102881125A (zh) * 2012-09-25 2013-01-16 杭州立高科技有限公司 基于多信息融合集中处理平台的报警监控系统
CN102999038A (zh) * 2011-09-12 2013-03-27 株式会社日立制作所 发电设备的诊断装置、以及发电设备的诊断方法
US20150254555A1 (en) * 2014-03-04 2015-09-10 SignalSense, Inc. Classifying data with deep learning neural records incrementally refined through expert input
CN105511750A (zh) * 2014-09-26 2016-04-20 联想(北京)有限公司 一种切换方法及电子设备
CN105992977A (zh) * 2013-11-28 2016-10-05 株式会社日立制作所 成套设备的诊断装置和诊断方法
CN107025514A (zh) * 2016-12-27 2017-08-08 贵州电网有限责任公司电力科学研究院 一种动态评估变压器设备状态的评价方法及输变电设备
KR20170140588A (ko) * 2016-06-13 2017-12-21 두산중공업 주식회사 발전소 상태 판단 장치 및 방법
WO2018051568A1 (ja) * 2016-09-15 2018-03-22 株式会社日立製作所 プラント異常診断装置及びプラント異常診断システム
JP2018049314A (ja) * 2016-09-20 2018-03-29 株式会社日立製作所 プラントデータ表示処理装置及びプラント制御システム
CN108241360A (zh) * 2016-12-27 2018-07-03 株式会社日立制作所 在线监视装置以及在线监视方法
JP2018147360A (ja) * 2017-03-08 2018-09-20 株式会社日立製作所 プラントデータ分類装置、プラントデータ表示処理装置及びプラント制御システム
CN108665007A (zh) * 2018-05-22 2018-10-16 阿里巴巴集团控股有限公司 一种基于多分类器的推荐方法、装置及电子设备
JP2018180759A (ja) * 2017-04-07 2018-11-15 株式会社日立製作所 システム分析装置、及びシステム分析方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08101710A (ja) * 1994-09-30 1996-04-16 Babcock Hitachi Kk プラントの運転制御装置
JP2010237893A (ja) * 2009-03-31 2010-10-21 Hitachi Ltd プラントの異常診断装置及び異常診断方法
CN102418919A (zh) * 2010-08-31 2012-04-18 株式会社日立制作所 设备的控制装置和火力发电设备的控制装置
WO2012073289A1 (ja) * 2010-12-02 2012-06-07 株式会社日立製作所 プラントの診断装置及びプラントの診断方法
CN102999038A (zh) * 2011-09-12 2013-03-27 株式会社日立制作所 发电设备的诊断装置、以及发电设备的诊断方法
CN102881125A (zh) * 2012-09-25 2013-01-16 杭州立高科技有限公司 基于多信息融合集中处理平台的报警监控系统
CN105992977A (zh) * 2013-11-28 2016-10-05 株式会社日立制作所 成套设备的诊断装置和诊断方法
US20150254555A1 (en) * 2014-03-04 2015-09-10 SignalSense, Inc. Classifying data with deep learning neural records incrementally refined through expert input
CN105511750A (zh) * 2014-09-26 2016-04-20 联想(北京)有限公司 一种切换方法及电子设备
KR20170140588A (ko) * 2016-06-13 2017-12-21 두산중공업 주식회사 발전소 상태 판단 장치 및 방법
WO2018051568A1 (ja) * 2016-09-15 2018-03-22 株式会社日立製作所 プラント異常診断装置及びプラント異常診断システム
JP2018049314A (ja) * 2016-09-20 2018-03-29 株式会社日立製作所 プラントデータ表示処理装置及びプラント制御システム
CN107025514A (zh) * 2016-12-27 2017-08-08 贵州电网有限责任公司电力科学研究院 一种动态评估变压器设备状态的评价方法及输变电设备
CN108241360A (zh) * 2016-12-27 2018-07-03 株式会社日立制作所 在线监视装置以及在线监视方法
JP2018147360A (ja) * 2017-03-08 2018-09-20 株式会社日立製作所 プラントデータ分類装置、プラントデータ表示処理装置及びプラント制御システム
JP2018180759A (ja) * 2017-04-07 2018-11-15 株式会社日立製作所 システム分析装置、及びシステム分析方法
CN108665007A (zh) * 2018-05-22 2018-10-16 阿里巴巴集团控股有限公司 一种基于多分类器的推荐方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李山;石源;刘红军;: "基于ART2网络的三维模型聚类分析方法", 计算机集成制造系统, no. 09, 15 September 2011 (2011-09-15), pages 3 - 10 *

Also Published As

Publication number Publication date
JP2020149181A (ja) 2020-09-17
JP7239354B2 (ja) 2023-03-14
WO2020183766A1 (ja) 2020-09-17

Similar Documents

Publication Publication Date Title
CN113287104A (zh) 数据分类装置
US7917240B2 (en) Univariate method for monitoring and analysis of multivariate data
US7729882B2 (en) Method and system for assessing performance of control systems
US20160076970A1 (en) Detecting apparatus, detection method, and program
US8032340B2 (en) Method and system for modeling a process variable in a process plant
WO2017022783A1 (ja) 異常予兆診断システム及び異常予兆診断方法
JP5480440B1 (ja) 異常予兆診断装置及び異常予兆診断方法
KR20080098332A (ko) 다변수 결함 기여도를 나타내기 위한 그래픽 사용자인터페이스
JP2016033778A (ja) 異常予兆診断装置及び異常予兆診断方法
JP2007249997A (ja) 工業プロセスの監視方法及び監視システム
JP6723944B2 (ja) プラントデータ分類装置、プラントデータ表示処理装置及びプラント制御システム
KR20160094383A (ko) 프로세스 장치에서 전체 프로세스 섹션의 상태를 자동 모니터링하고 측정하는 컴퓨터 실행 방법 및 시스템
WO2021253550A1 (zh) 一种基于双核t分布随机近邻嵌入的过程监测可视化方法
WO2020188696A1 (ja) 異常検知装置および異常検知方法
JP2022035686A (ja) 診断装置及びパラメータ調整方法
WO2008042739A2 (en) On-line monitoring and diagnostics of a process using multivariate statistical analysis
WO2020183781A1 (ja) 異常診断装置
US11669082B2 (en) Online fault localization in industrial processes without utilizing a dynamic system model
JP6785715B2 (ja) 正常異常判別装置、正常異常判別方法、及び正常異常判別システム
Sheriff Novel Data-Based and Model-Based Algorithms for Process Monitoring and Equipment Degradation Tracking
WO2008042759A2 (en) On-line multivariate analysis in a distributed process control system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination