WO2019092997A1 - データ分類装置 - Google Patents

データ分類装置 Download PDF

Info

Publication number
WO2019092997A1
WO2019092997A1 PCT/JP2018/035281 JP2018035281W WO2019092997A1 WO 2019092997 A1 WO2019092997 A1 WO 2019092997A1 JP 2018035281 W JP2018035281 W JP 2018035281W WO 2019092997 A1 WO2019092997 A1 WO 2019092997A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
category
categories
data classification
classification
Prior art date
Application number
PCT/JP2018/035281
Other languages
English (en)
French (fr)
Inventor
林 喜治
孝朗 関合
義幸 黒羽
政幸 平塚
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to CN201880061740.2A priority Critical patent/CN111108455A/zh
Priority to EP18875747.0A priority patent/EP3712777A4/en
Publication of WO2019092997A1 publication Critical patent/WO2019092997A1/ja
Priority to PH12020550507A priority patent/PH12020550507A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Definitions

  • the present invention relates to a data classification device and an abnormality diagnosis system.
  • thermometers thermometers
  • pressure gauges pressure gauges
  • flow meters for monitoring and control purposes.
  • sensors such as acceleration sensors have been installed in infrastructure facilities such as bridges and roads, and monitoring of equipment status has also been implemented.
  • a feature of such sensor data is that it is multi-dimensional time-series data that has a plurality of related sensor data and is measured in a certain time period.
  • Various methods have been proposed as state monitoring methods utilizing such multi-dimensional time-series data.
  • the simplest method is a method of selecting a data item to be focused on among multi-dimensional data items and detecting a state change based on whether the value of the data item exceeds a preset threshold value.
  • multidimensional data are clustered and divided into categories to detect an abnormality.
  • Non-Patent Document 1 The method disclosed in Non-Patent Document 1 will be described with reference to FIG.
  • ART adaptive resonance theory
  • ART has a function of classifying multidimensional data into a plurality of categories according to the degree of similarity.
  • this function is used to detect equipment abnormalities in two stages, the learning phase and the diagnosis phase.
  • operation data of the equipment in a normal state is input to ART. Since the ART classifies the operation data into a plurality of categories according to the similarity of data, it is possible to define a category to be generated when the operation data is normal.
  • operation data (diagnosis data) to be diagnosed is input to the ART which has learned normal data.
  • data having high similarity to learning data is classified into the same category as the learning phase.
  • a category (new category) different from the learning data it is classified into a category (new category) different from the learning data. In this way, it is possible to determine the state change of the equipment from the categories classified by ART.
  • Non-Patent Document 1 there was a case where part of data classified as normal data was classified into a new category. The example is demonstrated using FIG. 2, FIG.
  • FIG. 2 is a diagram schematically showing the classification result of learning data.
  • the part surrounded by practice shows the area of the category at the time of learning.
  • FIG. 3 schematically shows the classification result when data m is input near the area of the category at the time of learning and a new category is generated.
  • data k which has been classified into a category at the time of learning may be classified into a new category.
  • ART since data falling into the area of either category is classified into closer categories, such an event as described above may occur depending on the occurrence position of the new category. That is, since the data classification characteristic changes due to the occurrence of the new category, the detection accuracy is not considered.
  • One representative example of the present invention is a data classification device including a data classification unit that classifies operation data into a plurality of categories, and a classification result database that manages the output of the data classification unit,
  • the data classification device according to claim 1 wherein the data classification unit preferentially selects, as category candidates, those having small generation numbers representing the order in which the categories are generated as category candidates.
  • FIG. 1 shows the configuration of a first embodiment of the present invention.
  • FIG. 5 illustrates a data classification algorithm of an embodiment of the present invention.
  • FIG. 6 is a view showing an example of a condition setting screen of the display / operation unit according to the embodiment of the present invention.
  • FIG. 7 is a view showing an example of a classification result display screen of the display / operation unit according to the embodiment of the present invention.
  • FIG. 4 shows a first example according to the embodiment of the present invention.
  • the present embodiment is an example in which the data classification device of the present invention is applied to a plant abnormality diagnosis system, which comprises a plant 10, an operation data database 20, a data classification unit 30, a classification result database 40, and a display / operation unit 50. .
  • a plant abnormality diagnosis system which comprises a plant 10, an operation data database 20, a data classification unit 30, a classification result database 40, and a display / operation unit 50.
  • the outline of each component is described below.
  • the plant 10 is provided with sensors such as a flow meter, a thermometer, and a pressure gauge, and is used for control and monitoring of the plant.
  • data measured by the sensors of the plant 10 is stored as time-series data per minute.
  • normal data specified by the display / operation unit 50 is cut out as learning data and sent to the data learning unit 30.
  • data measured in real time by the plant is also temporarily stored in the operation data database, and then sent to the data classification unit 30 as diagnostic data at a constant cycle.
  • the data classification unit 30 classifies multi-dimensional driving data into a plurality of categories using a clustering algorithm based on Adaptive Resonance Theory (ART) (hereinafter, referred to as “modified ART”).
  • modified ART Adaptive Resonance Theory
  • ART Adaptive Resonance Theory
  • the improved ART in addition to the category number into which the input multidimensional data is classified, a generation number indicating the generation order of the category number is output. Also, when classifying data, the category number is determined in consideration of the generation number. A detailed algorithm for determining the category number will be described later.
  • the classification result database 40 manages the category number output from the data classification unit 30 and the generation number of each category.
  • the display / operation unit 50 sets conditions of learning data and diagnostic data as described above. Moreover, the trend graph of a category number as shown in the lower part of FIG. 1 and a diagnostic result are displayed.
  • the plant 10 is configured of equipment, piping connecting the same, valves, and the like.
  • the equipment and piping are equipped with sensors such as flowmeters, thermometers and pressure gauges for monitoring and controlling the state of the plant.
  • sensors such as flowmeters, thermometers and pressure gauges for monitoring and controlling the state of the plant.
  • these sensors have tags such as TIC 001. This tag is an ID of each sensor, and each sensor is identified by tag information.
  • operation data database 20 data measured by the sensors of the plant 10 are recorded as time-series data.
  • An example of operation data is shown in FIG. As shown in FIG. 1, sensor data installed in the plant 10 is stored for each time. Although this time interval can be specified arbitrarily, in the present embodiment, the time interval is one minute.
  • the data classification unit 30 classifies data using a modified ART based on adaptive resonance theory (ART).
  • ART adaptive resonance theory
  • the detailed configuration of the data classification unit 30 is shown in FIG.
  • the data classification unit 30 includes a data pre-processing unit 31 and an improved ART 32.
  • Xi (xi-xi_lower) / (xi_Upper-xi_lower) ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ (1)
  • xi_Upper is the upper limit value of normalization and the lower limit value of xi_lower.
  • the configuration of the improved ART shown in FIG. 6 is the same as the configuration of the conventional ART, except that the generation number stored in the classification result database 40 is used to select a category. Therefore, first, an outline of the algorithm of the conventional ART is shown, and then the improvement will be described.
  • the F0 layer set the size of the input data vector to 1 and remove noise.
  • the denoised input data is stored as short-term memory.
  • the category that most closely matches the input data is selected from the weighting factors defined for each category and the input data stored in the F1 layer.
  • the selection subsystem determines if the category selected in the F2 layer is valid, and if so, adopts the selected category as the output category. If it is not appropriate, the selected category is judged to be rejected and a reset signal is sent to the F2 layer. Repeating this process selects an appropriate category, but if all categories are not adopted, a new category is generated.
  • generation numbers used in this algorithm will be described.
  • the generation number is newly defined as a number indicating the order in which the categories are generated.
  • a specific example of the generation number will be described with reference to FIG.
  • This figure is trend data of category numbers when diagnostic data 1 to diagnostic data 4 are diagnosed in order after learning with learning data.
  • Category 0 and category 1 generated by learning data are the fastest generated categories, and are generation number 0.
  • category 2 newly generated by inputting diagnostic data 1 becomes generation number 1
  • category 3 and category 4 newly generated by diagnostic data 3 become generation number 2.
  • step 321 target input data is input and processed in the F0 layer and the F1 layer. Also, the variable GN is set to an initial value (0).
  • step 322 selects the most suitable candidate category as a category of object data from the category whose generation number is GN in the F2 layer.
  • Step 323 determines in the selection subsystem whether the selected candidate category is valid. If it is valid, the process proceeds to step 329 and the selected category is output. If it is not valid, the process proceeds to step 324. Step 324 rejects the selected candidate category. Note that the rejected category will not be a candidate again for the target input data.
  • step 325 it is determined whether the generation number is GN and there are any categories that have not been rejected.
  • Step 326 determines whether GN is the maximum value of the generation number. If it is not the maximum value, step 327 follows. If it is the maximum value, step 328 follows. Step 327 increments the value of GN by 1, and proceeds to the processing of step 322. By this processing, candidate categories are selected again from the categories having a large generation number. In step 328, since the candidate category is not adopted for all generation numbers according to the result of step 326, a new category is generated, and it is set as a candidate category, and the process proceeds to step 329. Step 329 outputs the selected candidate category.
  • FIG. 9 An example of data classification using this algorithm is shown in FIG.
  • the classified data is the same as the data shown in FIG.
  • data k classified into category 3 in the conventional algorithm is classified into category 2 in the present algorithm. That is, by using such an algorithm, it is possible to prevent data used as learning data from being classified as normal data.
  • FIG. 10 An example of the classification result database is shown in FIG. 10 and FIG.
  • normalized driving data and a category number into which the driving data is classified are recorded.
  • the upper limit value of normalization is 4.0 and the lower limit value is 3.0.
  • the attached example it can be seen that all data of 10:03 to 10:03 are classified into category 2 in the attached example.
  • FIG. 11 information on categories is recorded.
  • generation numbers and attributes of each category are recorded.
  • the generation number indicates the generation order of the categories as described above.
  • This figure corresponds to the result of FIG. 7, the generation number of categories 1 and 2 in which the learning data is classified is 0, and the generation number of category 3 output when the diagnostic data 1 is classified is 1 As is being recorded.
  • the attribute is for recording the state of the plant when each category occurs, and is an item that can be input by the user if necessary.
  • the category numbers 4 and 5 when the category numbers 4 and 5 occur, an abnormality is found in the pressure of the device, and therefore, “pressure abnormality” is registered.
  • the display / operation unit 50 sets conditions of learning data and diagnostic data as described above, and displays the classification result.
  • condition setting screen An example of the condition setting screen is shown in FIG.
  • the conditions of the learning data are set by the period and the conditions.
  • the period specifies a start time and an end time, and extracts data contained therein.
  • 3 months from 0 o'clock of 2016/9/1 to 0 o'clock of 2016/12/1, and 2 months from 0 o'clock of 2017/1/1 to 0 o'clock of 2017/3/1 A period of 5 months in total is set as the learning period.
  • the condition of data to be used is specified in the "condition" column.
  • Condition 1 FIC002 is 2.5 or more and the value of Condition 2: FIC 003 is 3.5 or more is used as learning data.
  • the OR condition can also be specified by setting the formula of the compound condition part to 1 + 2. By setting such conditions, for example, it is possible to extract only data that is stably operating, with the raw material supply amount to the plant being equal to or more than a certain value.
  • a diagnostic cycle is set on the setting screen.
  • the sampling cycle is automatically determined from time data of data.
  • the sampling period is one minute.
  • N 10 and diagnosis is performed at intervals of 10 minutes. That is, ten points of one minute data are collectively input to the data classification unit 50 every ten minutes, and the category of the ten points of data is determined.
  • FIG. 13 is an example of a classification result display screen of the display / operation unit 50.
  • a trend graph of driving data is displayed at the top, and the transition of category numbers in the same period as the trend graph is shown at the bottom.
  • the category number is 3 or more as a new category, and the value of PIC001 is increased when the new category occurs.
  • data used as learning data can be prevented from being classified as normal data.
  • the state of multidimensional time-series data is classified, the reproducibility of past data classification results is improved.
  • Plant 20 Operation data database 30: Data classification unit 40: Classification result database 50: Display / operation unit

Abstract

誤検知を低減することのできるデータ分類装置及び異常診断システムを提供することを目的とする。 上記課題を解決するため、本発明に係るデータ分類装置は、運転データを複数のカテゴリーに分類するデータ分類部30と、データ分類部の出力を管理する分類結果データベース40と、を有するデータ分類装置であって、データ分類部30はカテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して運転データのカテゴリー決定する。

Description

データ分類装置
本発明は、データ分類装置及び異常診断システムに関する。
 発電プラントや装置には、監視及び制御を目的として、温度計、圧力計及び流量計などの多くのセンサーが設置されている。また、近年では、橋梁や道路などのインフラ設備にも加速度センサー等のセンサーを設置し、設備の状態監視を監視することも実施されている。
 このようなセンサーデータの特徴は、複数の関連するセンサーデータがあり、ある時間周期で計測された、多次元の時系列データであるということである。このような多次元の時系列データを活用した状態監視方法には様々な方法が提案されている。最もシンプルなものは、多次元のデータ項目のうち、着目すべきデータ項目を選定し、データ項目の値が予め設定した閾値を超えるか否かで状態変化を検知する方法である。また、非特許文献1に示す方法では、多次元のデータをクラスタリングして、カテゴリーに分割することで異常を検知する。
 非特許文献1に示された方法について、図1を用いて説明する。本先行技術では、データクラスタリング技術の1つとして適応共鳴理論(以下、ARTと称す)を用いている。ARTでは、多次元データを類似度に応じて複数のカテゴリーに分類する機能を持つ。本検知方法では、この機能を利用して、学習フェーズと診断フェーズの2段階で設備の異常を検知する。
 学習フェーズでは、設備が正常な状態の運転データをARTに入力する。ARTはデータの類似度に応じて、運転データを複数のカテゴリーに分類するため、運転データが正常な場合に生成するカテゴリーを規定できる。
 診断フェーズでは、正常データを学習したARTに診断したい運転データ(診断データ)を入力する。その結果、学習データとの類似度が高いデータは、学習フェーズと同じカテゴリーに分類される。しかし、設備になんらかの異常が生じ、データの傾向が変わった場合には、学習データとは異なるカテゴリー(新規カテゴリー)に分類される。このように、ARTにより分類されたカテゴリーから設備の状態変化を判定することができる。
日本機械学会誌 Vol. 118 (2015)  No. 1163  p. 624-627 G.A.Carpenter and S.Grossberg:"ART2:Self-                OrganizatioNo.f stable category recognition codes         for analog input patterns",Applied                 Optics,Vol26,No.23,(1987)
 しかしながら、非特許文献1に記載の技術では、正常データに分類されていたデータの一部が新規カテゴリーに分類される場合があった。その例を図2、図3を用いて説明する。
 図2は、学習データの分類結果を模式的に示した図である。実践で囲まれた部分が学習時のカテゴリーの領域を示している。図3は、学習時のカテゴリーの領域の近傍にデータmが入力され、新規カテゴリーが生成した場合の分類結果を模式的に表している。本図に示したように、学習データの近くに新規カテゴリーが生成した場合、学習時のカテゴリーに分類されていたデータkが新規カテゴリーに分類されることがある。ARTでは、どちらのカテゴリーの領域にも入るデータは、より近いカテゴリーに分類されるため、新規カテゴリーの発生位置によっては、上記のような事象が起こりうる。すなわち、新規カテゴリーの発生によってデータ分類特性が変化するため、検知精度については配慮されていない。
 本発明に代表的なものの一つについて示せば、運転データを複数のカテゴリーに分類するデータ分類部と、前記データ分類部の出力を管理する分類結果データベースと、を有するデータ分類装置であって、前記データ分類部は前記カテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して前記運転データのカテゴリー決定するデータ分類装置。
 本発明によれば誤検知を低減することのできるデータ分類装置及び異常診断システムを提供することができる。
非特許文献1に示された方法でデータを分類する考え方を示す図。 非特許文献1に示された方法で正常なデータを学習した例を示す図。 非特許文献1に示された方法でデータを診断した例を示す図。 本発明の第一の実施例の構成を示す図。 運転データデータベースに格納されている運転データの例を示す図。 本発明の実施例のデータ分類部の構成を示す図。 カテゴリーの世代番号の考え方を示す図。 本発明の実施例のデータ分類アルゴリズムを示す図。 本発明の実施例で示した方法でデータを診断した例を示す図。 本発明の実施例の分類結果データベースに記録された運転データの一例を示す図。 本発明の実施例の分類結果データベースに記録された世代番号の一例を示す図。 本発明の実施例の表示・操作部の条件設定画面の一例を示す図。 本発明の実施例の表示・操作部の分類結果表示画面の一例を示す図。
 以下、本発明の実施形態について添付図面を参照しながら説明する。
 図4は本発明の実施形態にかかる第一の実施例を示す。本実施例は、本発明のデータ分類装置をプラントの異常診断システムに利用した例であり、プラント10、運転データデータベース20、データ分類部30、分類結果データベース40、および表示・操作部50からなる。以下に各構成要素の概要を述べる。
 プラント10には、流量計、温度計、圧力計などのセンサーが設置されており、プラントの制御及び監視のために利用している。
 運転データデータベース20には、プラント10のセンサーで計測されたデータが、1分毎の時系列データとして保存されている。保存されている運転データのうち、表示・操作部50で指定された正常データが学習データとして切り出され、データ学習部30に送られる。また、プラントでリアルタイムに計測されたデータも一時的に運転データデータベースに格納されたのち、診断データとして一定の周期でデータ分類部30に送られる。
 データ分類部30では、適応共鳴理論(ART: Adaptive Resonance Theory)をベースとしたクラスタリングアルゴリズム(以下、改良ARTと称す)を用いて、多次元の運転データを複数のカテゴリーに分類する。改良ARTでは、入力された多次元のデータが分類されるカテゴリー番号に加え、そのカテゴリー番号の生成順を示す世代番号を出力する。また、データを分類する際に、世代番号を考慮してカテゴリー番号を決定する。なお、カテゴリー番号を決定する詳細なアルゴリズムについては、後述する。
 分類結果データベース40では、データ分類部30から出力されたカテゴリー番号と各カテゴリーの世代番号を管理する。
 表示・操作部50では、前述したように学習データ、診断データの条件設定をする。また、図1の下部に示したようなカテゴリー番号のトレンドグラフや診断結果を表示する。
 次に、本実施例について詳細に説明する。
 プラント10は、機器とそれをつなぐ配管、バルブ等から構成されている。機器と配管には、プラントの状態の監視および制御のために、流量計、温度計、圧力計などのセンサーが設置されている。これらのセンサーには、例えば、温度計であれば、TIC001のようなタグがついている。このタグが各センサーのIDとなり、タグ情報により各センサーを識別する。
 運転データデータベース20には、プラント10のセンサーで計測されたデータが時系列データとして記録されている。運転データの一例を図5に示す。図1に示すように、プラント10に設置されたセンサーデータが時間毎に保存されている。この時間間隔は任意に指定することが可能であるが、本実施例では、時間間隔を1分とした。
 データ分類部30では、適応共鳴理論(ART)をベースとした改良ARTを用いてデータを分類する。データ分類部30の詳細な構成を図6に示す。データ分類部30は、データ前処理部31と改良ART32からなる。
 データ前処理部31では、運転データを[0,1]の範囲に正規化し、補数を追加する。具体的には、n次元の運転データxi(i=1,2,..n)があったとすると、まず、式(1)で正規化したデータXi(i=1,2,..n)を作成する。
  Xi = (xi-xi_lower)/(xi_Upper-xi_lower)・・・・・・(1)
 ここで、xi_Upperは、正規化の上限値、xi_lowerの下限値である。
 次に、Xiの補数Xciを式(2)で求め、2n次元のデータにする。
  Xci =1-Xi・・・・・・(2)
 このように、n次元のデータを2n次元にする前処理は、ARTでデータを分類する際に必要な前処理である。理由は、非特許文献2に記載されているため、ここでは説明を割愛する。
 次に、改良ART32について説明する。図6に示した改良ARTの構成は、従来のARTの構成と同じであるが、分類結果データベース40に保存されている世代番号を活用してカテゴリーを選択する点が異なる点である。そこで、まず、従来のARTのアルゴリズムの概要を示した後、改良点について説明する。
 F0レイヤーでは,入力データベクトルの大きさを1にし,ノイズを除去する。F1 レイヤーでは,ノイズ除去された入力データを短期記憶として保持する。F2 レイヤーでは,カテゴリー毎に定義されている重み係数とF1レイヤーで保持された入力データから、入力データに最もよく一致するカテゴリーを選択する。選択サブシステムでは, F2 レイヤーで選択したカテゴリーが妥当であるかを判定し、妥当であれば、選択したカテゴリーを出力カテゴリーとして採用する。妥当でない場合は、選択したカテゴリーを不採用と判断し,リセット信号をF2 レイヤーに送信する。この処理を繰り返すことで適切なカテゴリーを選択するが、全てのカテゴリーが採用されない場合は,新規カテゴリーが生成する。
 次に、改良点について詳細に説明する。まず、本アルゴリズムで利用する世代番号について説明する。世代番号は、カテゴリーが生成した順序を表す番号として、新しく定義したものである。図7を用いて、世代番号の具体的例を説明する。本図は、学習データで学習後、診断データ1~診断データ4を順に診断した場合のカテゴリー番号のトレンドデータである。学習データで生成したカテゴリー0とカテゴリー1は、最も早く生成したカテゴリーであり、世代番号0となる。次に、診断データ1を入力して新たに生成したカテゴリー2は世代番号1となり、診断データ3で新たに生成したカテゴリー3およびカテゴリー4は、世代番号2となる。
 次に、世代番号を用いた改良アルゴリズムの処理について説明する。改良アルゴリズムでは、F2レイヤーでカテゴリーの候補を選択する際、世代番号が小さいものを優先的に選択する。すなわち、まず、世代番号0である学習時のカテゴリーの中で候補を選択し、全ての世代番号0のカテゴリーが不適切と判断された場合に、世代番号1のカテゴリーを候補として選択する。さらに、世代番号1のカテゴリーが全て不適切と判断された場合は、世代番号2のカテゴリーを候補として選択する。最終的に、全てのカテゴリーが不適切と判断された場合は、新しいカテゴリーを追加する。
 このアルゴリズムの詳細について、図8に示す。ステップ321は対象となる入力データが入力され、F0レイヤー、F1レイヤーで処理される。また、変数GNを初期値(0)に設定する。ステップ322はF2レイヤーにおいて、世代番号がGNであるカテゴリーから、対象データのカテゴリーとして、最も適切な候補カテゴリーを選択する。ステップ323は選択サブシステムにおいて、選択された候補カテゴリーが妥当か否かを判定する。妥当であれば、ステップ329に進み選択したカテゴリーが出力される。妥当でなければ、ステップ324に進む。ステップ324は選択した候補カテゴリーを不採用とする。なお、不採用となったカテゴリーは、対象となった入力データに対し、再度候補となることはない。ステップ325は世代番号がGNであり、不採用になっていないカテゴリーが残っているかを判定する。残っていれば、ステップ322に戻り、再度候補のカテゴリーを選択する。残っていなければ、ステップ326に進む。ステップ326はGNが世代番号の最大値になっているかを判定する。最大値になっていなければ、ステップ327に進み、最大値になっていればステップ328に進む。ステップ327はGNの値を1増加させ、ステップ322の処理に進む。この処理により、世代番号が1大きいカテゴリーの中から、再度候補カテゴリーを選択することになる。ステップ328はステップ326の結果より、全ての世代番号について、候補カテゴリーが不採用となっているため、新規カテゴリーを生成し、候補カテゴリーとし、ステップ329に進む。ステップ329は選択された候補カテゴリーを出力する。
 本アルゴリズムを用いてデータを分類した例を図9に示す。分類したデータは、図3に示したデータと同じである。図9より、従来のアルゴリズムではカテゴリー3に分類されたデータkが、本アルゴリズムでは、カテゴリー2に分類されている。すなわち、このようなアルゴリズムとすることで、学習データとして用いたデータが正常データに分類されることを防ぐことができる。
 次に、分類結果データベース40について説明する。分類結果データベースの一例を図10と図11に示す。図10は、正規化された運転データと運転データが分類されたカテゴリー番号が記録されている。例えば、FIC001は、正規化の上限値が4.0、下限値が3.0として正規化されている。また、添付の例では、10時1分のデータから10時3分のデータは、全てカテゴリー2に分類されていることが分かる。
 図11は、カテゴリーに関する情報が記録されている。本実施例では、各カテゴリーの世代番号と属性が記録されている。世代番号は、前述したようにカテゴリーの発生順序を表すものである。本図は、図7の結果に対応しており、学習データが分類されたカテゴリー1、2の世代番号は0、診断データ1を分類した際に出力されたカテゴリー3の世代番号は1とういように記録されている。また、属性とは、各カテゴリーが発生したときのプラントの状態を記録するためのものであり、必要であれば、ユーザが入力できる項目である。図11の例では、カテゴリー番号4,5が発生した際に、機器の圧力に異常が見られたため、「圧力異常」と登録している。
 最後に、表示・操作部50について説明する。表示・操作部50では、前述したように学習データ、診断データの条件設定し、分類結果を表示する。
 条件設定画面の一例を図12に示す。図12の上部では、学習データの条件を期間と条件で設定している。期間は、開始時刻と終了時刻を指定し、その中に含まれるデータを抽出する。図12の例では、2016/9/1の0時から2016/12/1の0時までの3ヶ月と、2017/1/1の0時から2017/3/1の0時までの2ヶ月の合計5ヶ月の期間を学習期間として設定している。ただし、その期間に含まれるデータを全て利用するわけではなく、「条件」欄で利用するデータの条件を指定する。ここでは、条件1:FIC002の値が2.5以上、条件2:FIC003の値が3.5以上という2つの条件のAND条件に合致するデータのみを学習データとして利用する。また、本実施例では、条件1と条件2のAND条件を指定した例を示したが、複合条件部分の数式を1+2とすることで、OR条件も指定することができる。このような条件を設定することで、例えば、プラントへの原料供給量が一定値以上となり、安定稼動しているデータのみを抽出することができる。
 次に、図12の下部にある診断データの設定画面について説明する。診断時には、一定の診断周期でデータを診断するため、設定画面では、診断周期を設定する。サンプリング周期は、データの時刻データから自動的に判別する。本実施例では、サンプリング周期が1分の例を示している。診断周期は、サンプリング周期のN倍(N=1,2,..)の値を設定する。本実施例では、N=10とし、10分間隔で診断する。すなわち、10分毎に、10点の1分データをまとめてデータ分類部50に入力し、10点のデータのカテゴリーを判定する。
 図13は、表示・操作部50の分類結果表示画面の例である。ここでは、上部に運転データのトレンドグラフを表示し、下部には、トレンドグラフと同じ期間のカテゴリー番号の推移を示す。この結果グラフの表示により、新規カテゴリーが発生し、異常を検知した場合に、合わせて運転データの変化を確認することができる。本実施例では、カテゴリー番号が3以上が新規カテゴリーであり、新規カテゴリー発生時にPIC001の値が大きくなっていることがわかる。
 以上のように、本発明のデータ分類装置を用いることで、学習データとして用いたデータが正常データに分類されることを防ぐことができる。また、多次元の時系列データの状態を分類した場合に、過去のデータ分類結果の再現性が向上する。
10:プラント
20:運転データデータベース
30:データ分類部
40:分類結果データベース
50:表示・操作部

Claims (6)

  1.  運転データを複数のカテゴリーに分類するデータ分類部と、
     前記データ分類部の出力を管理する分類結果データベースと、を有するデータ分類装置であって、
     前記データ分類部は前記カテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して前記運転データのカテゴリー決定するデータ分類装置。
  2.  請求項1に記載のデータ分類装置であって、
     前記カテゴリー候補の妥当性について判定を行い、妥当であれば前記カテゴリー候補を前記運転データのカテゴリーとし、妥当でない場合は前記カテゴリー候補を不採用とするデータ分類装置。
  3.  請求項2に記載のデータ分類装置であって、
     前記不採用と判断した際に他の前記カテゴリー候補が存在する場合には他の前記カテゴリー候補を選択し、他の前記カテゴリー候補が存在しない場合には新規カテゴリーを生成し前記カテゴリー候補とするデータ分類装置。
  4.  請求項1ないし3のいずれか1項に記載のデータ分類装置を備える異常診断システムであって、
     プラントと、
     前記プラントの前記運転データが保存される運転データデータベースと、
     前記運転データのうち正常データを選択する表示・操作部と、を備える異常診断システム。
  5.  請求項4に記載の異常診断システムであって、
     前記表示・操作部は前記データ分類部のデータ分類期間又は閾値を設定する異常診断システム。
  6.  請求項4に記載の異常診断システムであって、
     前記表示・操作部は前記分類結果データベースの分類結果を表示する異常診断システム。
PCT/JP2018/035281 2017-11-13 2018-09-25 データ分類装置 WO2019092997A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201880061740.2A CN111108455A (zh) 2017-11-13 2018-09-25 数据分类装置
EP18875747.0A EP3712777A4 (en) 2017-11-13 2018-09-25 DATA CLASSIFICATION DEVICE
PH12020550507A PH12020550507A1 (en) 2017-11-13 2020-04-29 Data classification device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-217883 2017-11-13
JP2017217883A JP6951202B2 (ja) 2017-11-13 2017-11-13 データ分類装置

Publications (1)

Publication Number Publication Date
WO2019092997A1 true WO2019092997A1 (ja) 2019-05-16

Family

ID=66437751

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/035281 WO2019092997A1 (ja) 2017-11-13 2018-09-25 データ分類装置

Country Status (5)

Country Link
EP (1) EP3712777A4 (ja)
JP (1) JP6951202B2 (ja)
CN (1) CN111108455A (ja)
PH (1) PH12020550507A1 (ja)
WO (1) WO2019092997A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756722B (zh) * 2022-04-25 2022-10-04 珠海市鸿瑞信息技术股份有限公司 一种多元数据集中管理控制系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005165375A (ja) * 2003-11-28 2005-06-23 Hitachi Ltd 設備の診断装置及び診断方法
JP2011138374A (ja) * 2009-12-28 2011-07-14 Hitachi Ltd 診断装置および診断方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4676149B2 (ja) * 2004-03-10 2011-04-27 株式会社日立製作所 データ分類装置
JP4641537B2 (ja) * 2007-08-08 2011-03-02 株式会社日立製作所 データ分類方法および装置
JP2010237892A (ja) * 2009-03-31 2010-10-21 Hitachi Ltd データ分類方法及び装置
JP5097739B2 (ja) * 2009-03-31 2012-12-12 株式会社日立製作所 プラントの異常診断装置及び異常診断方法
JP2010244149A (ja) * 2009-04-02 2010-10-28 Hitachi Ltd データ分類方法,データ分類装置,診断方法,診断装置
WO2011089649A1 (ja) * 2010-01-22 2011-07-28 株式会社日立製作所 診断装置及び診断方法
JP5469131B2 (ja) * 2011-07-19 2014-04-09 株式会社日立製作所 プラントの診断方法及び装置。
JP2016012158A (ja) * 2014-06-27 2016-01-21 株式会社日立製作所 プラント異常予知装置、異常予知装置、表示装置及び表示方法
CN104198183A (zh) * 2014-09-17 2014-12-10 重庆大学 风电机组传动链振动噪声抑制及其早期故障特征提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005165375A (ja) * 2003-11-28 2005-06-23 Hitachi Ltd 設備の診断装置及び診断方法
JP2011138374A (ja) * 2009-12-28 2011-07-14 Hitachi Ltd 診断装置および診断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
G. A. CARPENTERS. GROSSBERG: "RT2:Self-OrganizatioNo.f stable category recognition codes for analog input patterns", APPLIED OPTICS, vol. 26, no. 23, 1987
JOURNAL OF THE JAPAN SOCIETY OF MECHANICAL ENGINEERS, vol. 118, no. 1163, 2015, pages 624 - 627
See also references of EP3712777A4 *

Also Published As

Publication number Publication date
EP3712777A1 (en) 2020-09-23
EP3712777A4 (en) 2021-07-07
PH12020550507A1 (en) 2021-03-22
JP6951202B2 (ja) 2021-10-20
JP2019091128A (ja) 2019-06-13
CN111108455A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US10809153B2 (en) Detecting apparatus, detection method, and program
JP7105932B2 (ja) アプリケーション情報に関連する時系列ズデータに関する深層学習を使用した異常検出
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
CN102870057B (zh) 机械设备的诊断装置、诊断方法及诊断程序
JP6200833B2 (ja) プラントと制御装置の診断装置
US11526783B2 (en) Abnormality determination device, learning device, and abnormality determination method
US10976731B2 (en) Abnormality diagnostic system
CN112818066A (zh) 一种时序数据异常检测方法、装置及电子设备和存储介质
CN108572880B (zh) 设备机器的异常诊断系统
US20230213924A1 (en) Abnormal irregularity cause identifying device, abnormal irregularity cause identifying method, and abnormal irregularity cause identifying program
CN112348261A (zh) 一种交易量预测方法、设备、装置及存储介质
CN116066343A (zh) 一种输油泵机组故障模型的智能预警方法及系统
TW202006488A (zh) 資料處理裝置及資料處理方法
Arul et al. Data anomaly detection for structural health monitoring of bridges using shapelet transform
CN114563150A (zh) 桥梁健康在线检测模块生成方法、检测方法、工具箱及装置
JP5824959B2 (ja) 異常診断装置
CN110956331A (zh) 数字工厂运营状态预测方法、系统、装置
US20210348985A1 (en) Abnormality diagnostic device, abnormality diagnostic method, and program
WO2019092997A1 (ja) データ分類装置
JP6685124B2 (ja) 診断装置及び診断方法
JP7233258B2 (ja) 異常診断装置
JP5447831B2 (ja) 診断装置および診断方法
JP6347771B2 (ja) 異常診断装置、異常診断方法及び異常診断プログラム
CN117421616B (zh) 一种矿山竖井井筒检测系统及方法
KR102226459B1 (ko) 스파이크 진단 장치 및 그것의 제어 방법

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018875747

Country of ref document: EP

Effective date: 20200615