JP7500980B2 - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP7500980B2
JP7500980B2 JP2020017098A JP2020017098A JP7500980B2 JP 7500980 B2 JP7500980 B2 JP 7500980B2 JP 2020017098 A JP2020017098 A JP 2020017098A JP 2020017098 A JP2020017098 A JP 2020017098A JP 7500980 B2 JP7500980 B2 JP 7500980B2
Authority
JP
Japan
Prior art keywords
data
information processing
clusters
processing device
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020017098A
Other languages
Japanese (ja)
Other versions
JP2021124886A (en
Inventor
慎大 原
賢哉 村上
智志 桐生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP2020017098A priority Critical patent/JP7500980B2/en
Publication of JP2021124886A publication Critical patent/JP2021124886A/en
Application granted granted Critical
Publication of JP7500980B2 publication Critical patent/JP7500980B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

近年、機械学習を用いたデータの分類によって、各種装置の異常検知を行う事例が増えている(例えば特許文献1)。 In recent years, there has been an increase in cases where abnormalities in various devices are detected by classifying data using machine learning (for example, Patent Document 1).

特開2019-056983号公報JP 2019-056983 A

ところで、例えば深層学習に基づく学習モデルを用いる場合、異常が検知された際に、一般に異常の要因を特定することは困難である。 However, when using a learning model based on deep learning, for example, it is generally difficult to identify the cause of an anomaly when one is detected.

本発明の目的は、分類の要因となる特徴を推定することが可能な情報処理装置を提供することである。 The object of the present invention is to provide an information processing device capable of estimating features that are factors in classification.

上記目的を達成するための一の発明は、複数の変数を含む複数の第1データを、複数のクラスタにグループ化するクラスタリング部と、前記複数のクラスタの夫々に含まれるデータを前記複数のクラスタ毎に識別する識別情報を、前記複数の第1データの夫々に付与し、複数の第2データを生成する生成部と、前記複数のクラスタの夫々に含まれるデータに基づく複数のパターンのうち、入力されるデータを、何れかのパターンに分類するための第1学習モデルを、前記複数の第2データに基づいて構築するモデル構築部と、前記複数の第2データ及び前記第1学習モデルに基づいて、前記複数のパターンの夫々における前記複数の変数の夫々の影響度を示す影響度情報を算出する算出部と、を備える情報処理装置である。本発明の他の特徴については、本明細書の記載により明らかにする。 One invention for achieving the above object is an information processing device including a clustering unit that groups a plurality of first data including a plurality of variables into a plurality of clusters, a generating unit that assigns identification information for identifying the data included in each of the plurality of clusters to each of the plurality of first data and generates a plurality of second data, a model constructing unit that constructs, based on the plurality of second data, a first learning model for classifying input data into one of a plurality of patterns based on the data included in each of the plurality of clusters, and a calculating unit that calculates, based on the plurality of second data and the first learning model, influence information indicating the influence of each of the plurality of variables in each of the plurality of patterns. Other features of the present invention will be made clear by the description in this specification.

本発明によれば、分類の要因となる特徴を推定することが可能な情報処理装置を提供することができる。 The present invention provides an information processing device capable of estimating features that are factors in classification.

情報処理システムの10構成を示す図である。FIG. 10 is a diagram showing the configuration of an information processing system. 情報処理装置20のハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of an information processing device 20. 第1データ41の一例を示す図である。FIG. 4 is a diagram showing an example of first data 41. 第1データ41を説明するための図である。FIG. 4 is a diagram for explaining first data 41. 情報処理装置20に実現される機能ブロックの一例を示す図である。FIG. 2 is a diagram illustrating an example of functional blocks realized in the information processing device 20. 複数のクラスタにグループ化された第1データ41の一例を示す散布図である。1 is a scatter plot showing an example of first data 41 grouped into a plurality of clusters. 第2データ42の一例を示す図である。FIG. 4 is a diagram showing an example of second data 42. 第1学習モデルM1を説明するための図である。A diagram for explaining the first learning model M1. 影響度情報70の一例を示す図である。FIG. 2 is a diagram showing an example of impact information 70. 第1データ41及び第2学習モデルM2を説明するための図である。A figure for explaining the first data 41 and the second learning model M2. 情報処理装置20で実行される処理の一例を示すフローチャートである。4 is a flowchart showing an example of processing executed by the information processing device 20. 診断装置21のハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of a diagnostic device 21. 診断装置21に実現される機能ブロックの一例を示す図である。FIG. 2 is a diagram showing an example of a functional block realized in a diagnostic device 21. 診断装置21で実行される処理の一例を示すフローチャートである。4 is a flowchart showing an example of a process executed by a diagnostic device 21.

=====本実施形態=====
<<<情報処理システム10の構成>>>
図1は、本発明の一実施形態である情報処理システム10の構成を示す図である。情報処理システム10は、所定の装置の異常の要因となる特徴を、推定するためのシステムであり、情報処理装置20、診断装置21を含む。本実施形態では、所定の装置の一例として、商業施設に設置されたショーケース300を用いて説明する。
== ...
<<<<Configuration of Information Processing System 10>>>
1 is a diagram showing the configuration of an information processing system 10 according to an embodiment of the present invention. The information processing system 10 is a system for estimating features that are factors in causing an abnormality in a predetermined device, and includes an information processing device 20 and a diagnostic device 21. In this embodiment, a description will be given using a showcase 300 installed in a commercial facility as an example of the predetermined device.

ショーケース300は、例えば、食品等を冷却し、保管するためのケースである。ショーケース300には、ショーケース300の状態を観測するセンサ310が、複数取り付けられている。なお、図1では、便宜上、複数のセンサ310は、1つのブロックとして描かれている。 The showcase 300 is, for example, a case for cooling and storing food and the like. The showcase 300 is equipped with a number of sensors 310 that monitor the state of the showcase 300. For convenience, the multiple sensors 310 are depicted as a single block in FIG. 1.

そして、情報処理システム10は、複数のセンサ310の夫々から出力されるデータに基づいて、ショーケース300が正常であるか又は異常であるかを診断する。更に、情報処理システム10は、診断処理において、複数のセンサ310の夫々から出力されるデータの影響度(後述)を出力する。 The information processing system 10 then diagnoses whether the showcase 300 is normal or abnormal based on the data output from each of the multiple sensors 310. Furthermore, in the diagnostic process, the information processing system 10 outputs the degree of influence (described below) of the data output from each of the multiple sensors 310.

なお、ここでは、「異常」の例として、例えば、ショーケース300の庫内の温度を所定温度に維持できない場合や、ショーケース300から異音が出る場合等の、通常とは異なる挙動を示す場合のことが挙げられる。 In this case, examples of "abnormalities" include cases where the temperature inside showcase 300 cannot be maintained at a specified temperature, or where showcase 300 makes an abnormal noise, or where other behavior that differs from normal is observed.

また、以下、ショーケース300の動作が正常である際のデータを、「正常データ」または「正常なデータ」と称し、ショーケース300の動作が異常である際のデータを、「異常データ」または「異常なデータ」と称する。 Furthermore, hereinafter, data when the showcase 300 is operating normally will be referred to as "normal data" or "normal data", and data when the showcase 300 is operating abnormally will be referred to as "abnormal data" or "abnormal data".

情報処理装置20は、複数のセンサ310が出力するデータに基づいて、ショーケース300に異常が有るか否かを判定するためのモデルを機械学習によって構築する。 The information processing device 20 uses machine learning to construct a model for determining whether or not there is an abnormality in the showcase 300 based on the data output by the multiple sensors 310.

診断装置21は、運転中のショーケース300において、複数のセンサ310が出力するデータと、情報処理装置20で構築されたモデルとに基づいて、ショーケース300に異常が有るか否かを診断する。更に、診断装置21は、診断処理において、複数のセンサ310の夫々から出力されるデータの影響度を出力する。なお、情報処理装置20と、診断装置21とは、ネットワーク25を介して接続されている。 The diagnostic device 21 diagnoses whether or not there is an abnormality in the showcase 300 during operation based on data output from the multiple sensors 310 and a model constructed by the information processing device 20. Furthermore, the diagnostic device 21 outputs the degree of influence of the data output from each of the multiple sensors 310 in the diagnostic process. The information processing device 20 and the diagnostic device 21 are connected via a network 25.

<<<情報処理装置20について>>>
==情報処理装置20の構成==
図2は、情報処理装置20のハードウェア構成の一例を示す図である。情報処理装置20は、CPU(Central Processing Unit)30、メモリ31、記憶装置32、入力装置33、表示装置34、及び通信装置35を含むコンピュータである。
<<<<About the information processing device 20>>>
==Configuration of Information Processing Device 20==
2 is a diagram showing an example of a hardware configuration of the information processing device 20. The information processing device 20 is a computer including a CPU (Central Processing Unit) 30, a memory 31, a storage device 32, an input device 33, a display device 34, and a communication device 35.

CPU30は、メモリ31や記憶装置32に格納されたプログラムを実行することにより、情報処理装置20における様々機能を実現する。 The CPU 30 executes programs stored in the memory 31 and the storage device 32 to realize various functions in the information processing device 20.

メモリ31は、例えばRAM(Random-Aaccess Mmemory)等であり、プログラムやデータ等の一時的な記憶領域として用いられる。 Memory 31 is, for example, a RAM (Random Access Memory) and is used as a temporary storage area for programs, data, etc.

記憶装置32は、CPU30によって実行あるいは処理される制御プログラム40や第1データ41(後述)等の各種のデータを格納する不揮発性の記憶装置である。 The storage device 32 is a non-volatile storage device that stores various data such as the control program 40 executed or processed by the CPU 30 and the first data 41 (described below).

制御プログラム40は、情報処理装置20が有する各種機能を実現するためのプログラムであり、例えば、OS(Operating System)等を含む。 The control program 40 is a program for implementing various functions of the information processing device 20, and includes, for example, an OS (Operating System), etc.

複数の第1データ41は、第1学習モデルM1又は第2学習モデルM2(後述)を構築する際に用いられるデータである。図3は、本実施形態の第1データ41を示す図である。複数の第1データ41の夫々は、複数の変数(本実施形態では4個の変数)x1~x4のデータを含む。また、複数の第1データ41は、所定の属性を有するデータである。本実施形態では、所定の属性は、所定の装置が正常に動作しているか否かを示す情報である。 The multiple first data 41 are data used when constructing the first learning model M1 or the second learning model M2 (described later). FIG. 3 is a diagram showing the first data 41 in this embodiment. Each of the multiple first data 41 includes data on multiple variables (four variables in this embodiment) x1 to x4. In addition, the multiple first data 41 are data having a predetermined attribute. In this embodiment, the predetermined attribute is information indicating whether or not a predetermined device is operating normally.

ここで、「変数x1」及び「変数x2」は夫々、例えば、ショーケース300の所定の場所に取り付けられた第1温度センサ及び第2温度センサが示す温度を意味する。「変数x1のデータ」及び「変数x2のデータ」は夫々、第1温度センサ及び第2温度センサから出力された値である。 Here, "variable x1" and "variable x2" respectively refer to the temperatures indicated by, for example, a first temperature sensor and a second temperature sensor attached to a predetermined location of the showcase 300. "Data of variable x1" and "data of variable x2" are values output from the first temperature sensor and the second temperature sensor, respectively.

「変数x3」は、例えば、ショーケース300内のコンプレッサの圧力を計測する圧力センサが示す圧力を意味する。「変数x3のデータ」は、圧力センサから出力された値である。また、「変数x4」は、例えば、コンプレッサの冷媒の流量を計測する流量計が示す流量を意味する。「変数x4のデータ」は、流量計から出力された値である。 "Variable x3" means, for example, the pressure indicated by a pressure sensor that measures the pressure of the compressor inside showcase 300. "Data of variable x3" is the value output from the pressure sensor. Furthermore, "Variable x4" means, for example, the flow rate indicated by a flow meter that measures the flow rate of the refrigerant in the compressor. "Data of variable x4" is the value output from the flow meter.

また、「属性」は、変数x1~x4のデータが“正常データ”であるか、“異常データ”であるかを示すデータである。本実施形態では、変数x1~x4のデータが“正常データ”である場合、“0”が付され、変数x1~x4のデータが“異常データ”である場合、“1”が付されている。 The "attribute" is data that indicates whether the data of variables x1 to x4 is "normal data" or "abnormal data." In this embodiment, if the data of variables x1 to x4 is "normal data," a "0" is assigned, and if the data of variables x1 to x4 is "abnormal data," a "1" is assigned.

本実施形態では、第1データ41は、i個の“正常データ”と、j個の“異常データ”とを含み、予め記憶装置32に格納されている。また、第1データ41の1番目のデータは、例えば、時刻t1に取得された、ショーケース300が正常な場合の変数x1~x4のデータである。 In this embodiment, the first data 41 includes i pieces of "normal data" and j pieces of "abnormal data", and is stored in advance in the storage device 32. The first data of the first data 41 is, for example, data of variables x1 to x4 obtained at time t1 when the showcase 300 is normal.

図4は、図3に示した第1データ41を示す散布図である。なお、複数の第1データ41の夫々は、4個の変数x1~x4のデータ及び属性を含むが、便宜上、図4ではデータが変数x1及びx2の2個の変数のデータであるとして図示している。 Figure 4 is a scatter plot showing the first data 41 shown in Figure 3. Note that each of the multiple first data 41 includes data and attributes for four variables x1 to x4, but for convenience, Figure 4 illustrates the data as being for two variables, x1 and x2.

入力装置33は、ユーザによるコマンドやデータの入力を受け付ける装置であり、キーボード、タッチパネルディスプレイ上でのタッチ位置を検出するタッチセンサなどの入力インタフェースを含む。 The input device 33 is a device that accepts commands and data input by the user, and includes input interfaces such as a keyboard and a touch sensor that detects the touch position on a touch panel display.

表示装置34は、例えばディスプレイなどの装置であり、通信装置35は、ネットワーク25を介して、診断装置21や他のコンピュータと各種プログラムやデータの受け渡しを行う。 The display device 34 is, for example, a device such as a display, and the communication device 35 exchanges various programs and data with the diagnostic device 21 and other computers via the network 25.

==機能ブロックの実施例==
図5は、情報処理装置20に実現される機能ブロックの一例を示す図である。情報処理装置20のCPU30が、制御プログラム40を実行することにより、情報処理装置20には、クラスタリング部50、生成部51、モデル構築部52、算出部53、及び第1取得部54が実現される。
Example of Functional Blocks
5 is a diagram showing an example of functional blocks realized in the information processing device 20. When the CPU 30 of the information processing device 20 executes the control program 40, a clustering unit 50, a generating unit 51, a model constructing unit 52, a calculating unit 53, and a first acquiring unit 54 are realized in the information processing device 20.

クラスタリング部50は、複数の第1データ41を、複数のクラスタにグループ化する。なお、ここで「グループ化」とは、1以上のグループにデータを分けることをいう。 The clustering unit 50 groups the multiple first data 41 into multiple clusters. Note that "grouping" here means dividing data into one or more groups.

具体的には、クラスタリング部50は、先ず、記憶装置32に格納された第1データ41を取得する。そして、クラスタリング部50は、“正常データ”及び“異常データ”の夫々を、複数のクラスタにグループ化する。 Specifically, the clustering unit 50 first acquires the first data 41 stored in the storage device 32. Then, the clustering unit 50 groups each of the "normal data" and "abnormal data" into multiple clusters.

複数のクラスタにグループ化する処理を施すアルゴリズムとしては、例えばk-meansのようにクラスタの数を予め仮定するアルゴリズムを用いてもよく、またはx-meansのようにクラスタの数を予め仮定しないアルゴリズムを用いてもよい。複数のクラスタにグループ化することができれば他のアルゴリズムを用いてもよい。本実施形態では、クラスタリング部50は、複数の第1データ41に対しx-meansによる処理を施す。 As an algorithm for grouping into multiple clusters, an algorithm that pre-assumes the number of clusters, such as k-means, may be used, or an algorithm that does not pre-assume the number of clusters, such as x-means, may be used. Other algorithms may be used as long as they are capable of grouping into multiple clusters. In this embodiment, the clustering unit 50 processes the multiple first data 41 using x-means.

図6は、“正常データ”と“異常データ”とが、夫々複数のクラスタの分類された状態を説明するための図である。ここでは、“正常データ”は、2個のクラスタC1及びC2にグループ化され、“異常データ”は、2個のクラスタC3及びC4にグループ化されている。 Figure 6 is a diagram for explaining a state in which "normal data" and "abnormal data" are each classified into multiple clusters. Here, "normal data" is grouped into two clusters, C1 and C2, and "abnormal data" is grouped into two clusters, C3 and C4.

ここで、仮に、第1データ41の“正常データ”と、“異常データ”とを分けずにクラスタリング部50が、全ての第1データ41を複数のクラスタにグループ化した場合、一のクラスタが“正常データ”と、“異常データ”とを含んでしまうことがある。このような場合、クラスタに含まれるデータを学習用データとすると、学習用データは“正常データ”を示すデータであるか、“異常データ”を示すデータであるかが不明瞭となる。 If the clustering unit 50 groups all of the first data 41 into multiple clusters without separating the "normal data" and "abnormal data" of the first data 41, one cluster may contain both "normal data" and "abnormal data." In such a case, if the data contained in the cluster is used as learning data, it becomes unclear whether the learning data is data indicating "normal data" or data indicating "abnormal data."

本実施形態では、第1データ41の“正常データ”と、“異常データ”とを分けた状態で、夫々を複数のクラスタにグループ化する。したがって、本実施形態では、学習用データの精度を高めることができる。 In this embodiment, the first data 41 is separated into "normal data" and "abnormal data," and each of the data is grouped into multiple clusters. Therefore, in this embodiment, the accuracy of the learning data can be improved.

なお、クラスタリング部50は、第1データ41の“正常データ”と、“異常データ”との双方を、夫々複数のクラスタにグループ化しなくてもよい。例えば、“異常データ”のみを、複数のクラスタにグループ化してもよい。 The clustering unit 50 does not have to group both the "normal data" and the "abnormal data" of the first data 41 into multiple clusters. For example, only the "abnormal data" may be grouped into multiple clusters.

生成部51は、複数のクラスタの夫々に含まれるデータを、複数のクラスタ毎に識別する識別情報を、複数の第1データ41の夫々に付与し、複数の第2データ42を生成する。図7は、本実施形態の第2データ42を示す図である。この例では、第1データ41のうち、クラスタC1にグループ化された第1データ41には識別情報“1”を付与し、クラスタC2にグループ化された第1データ41には識別情報“2”を付与する。 The generation unit 51 assigns identification information for identifying the data contained in each of the multiple clusters to each of the multiple first data 41, thereby generating multiple second data 42. FIG. 7 is a diagram showing the second data 42 of this embodiment. In this example, among the first data 41, the first data 41 grouped into cluster C1 is assigned identification information "1", and the first data 41 grouped into cluster C2 is assigned identification information "2".

更に、クラスタC3にグループ化された第1データ41には識別情報“3”を付与し、クラスタC4にグループ化された第1データ41には識別情報“4”を付与することによって、第2データ42を生成している。 Furthermore, the first data 41 grouped into cluster C3 is given the identification information "3", and the first data 41 grouped into cluster C4 is given the identification information "4", thereby generating second data 42.

モデル構築部52は、複数の第2データ42に基づいて、第1学習モデルM1を構築する。第1学習モデルM1は、複数のパターンのうち、入力されるデータを、何れかのパターンに分類するための学習モデルである。複数のパターンは、複数のクラスタの夫々に含まれるデータに基づいている。 The model construction unit 52 constructs a first learning model M1 based on the multiple second data 42. The first learning model M1 is a learning model for classifying input data into one of multiple patterns. The multiple patterns are based on the data contained in each of the multiple clusters.

本実施形態では、複数のパターンは、パターン1~パターン4からなる。パターン1はクラスタC1に含まれるデータに基づき、パターン2はクラスタC2に含まれるデータに基づき、パターン3はクラスタC3に含まれるデータに基づき、パターン4はクラスタC4に含まれるデータに基づいている。 In this embodiment, the multiple patterns consist of Pattern 1 to Pattern 4. Pattern 1 is based on the data contained in Cluster C1, Pattern 2 is based on the data contained in Cluster C2, Pattern 3 is based on the data contained in Cluster C3, and Pattern 4 is based on the data contained in Cluster C4.

本実施形態では、第1学習モデルM1の学習が行われると、第1学習モデルM1の関数の係数等が調整される。なお、第1学習モデルM1は、例えばサポートベクターマシン(SVM)の手法に基づいて構築され、第1学習モデルM1の関数は、例えば、y=f1(x1,x2,x3,x4)と表される。 In this embodiment, when the first learning model M1 is learned, the coefficients of the function of the first learning model M1 are adjusted. Note that the first learning model M1 is constructed based on, for example, a support vector machine (SVM) technique, and the function of the first learning model M1 is expressed as, for example, y = f1 (x1, x2, x3, x4).

図8においては、複数の第2データ42を、4つのパターンのうち、いずれかのパターンに分類する第1学習モデルM1を示す関数f1の一例をx1-x2平面において図示している。 In FIG. 8, an example of a function f1 representing a first learning model M1 that classifies multiple second data 42 into one of four patterns is illustrated on the x1-x2 plane.

モデル構築部52は、更に、後述する第1取得部54が取得したデータに基づいて、第2学習モデルM2を構築する。第2学習モデルM2は、第1学習モデルM1と同様に、入力されるデータが複数のパターンの何れに属するかを分類するための学習モデルである。つまり、本実施形態の第2学習モデルM2も、入力されるデータが、パターン1~4の何れに属するかを分類する。 The model construction unit 52 further constructs a second learning model M2 based on the data acquired by the first acquisition unit 54 described below. Like the first learning model M1, the second learning model M2 is a learning model for classifying input data as to which of a plurality of patterns it belongs to. In other words, the second learning model M2 of this embodiment also classifies input data as to which of patterns 1 to 4 it belongs to.

第2学習モデルM2は、診断装置21に出力される学習モデルである。第2学習モデルM2を構築する方法についての詳細は後述する。 The second learning model M2 is a learning model that is output to the diagnostic device 21. Details of how to construct the second learning model M2 will be described later.

算出部53は、影響度情報70を算出する。影響度情報70とは、複数のパターンの夫々における複数の変数の夫々の影響度を示す情報である。 The calculation unit 53 calculates the influence information 70. The influence information 70 is information indicating the influence of each of the multiple variables in each of the multiple patterns.

ここでの影響度とは、第1学習モデルM1に基づく分類の結果に対する、分類された第2データ42が有する複数の変数の各々の影響度を意味する。影響度は、影響度を示す値として、例えば0~100%のように、所定の範囲の数値で表現されてもよい。また、影響度は、影響度を示す値に対して所定の値を閾とし、“強”又は“弱”のように2値化したもので表現されもてよいし、3以上に多値化したもので表現されてもよい。 Here, the influence level refers to the influence level of each of the multiple variables contained in the classified second data 42 on the result of classification based on the first learning model M1. The influence level may be expressed as a value indicating the influence level in a predetermined range, for example, 0 to 100%. In addition, the influence level may be expressed as a binary value such as "strong" or "weak" with a predetermined value set as a threshold for the value indicating the influence level, or may be expressed as a multi-value value of three or more.

影響度を示す情報とは、複数の変数、及び複数の変数の夫々の影響度のうち、少なくとも一部を含む情報である。つまり、影響度を示す情報は、複数の変数、及び複数の変数の夫々の影響度の全てを含んでもよい。また、影響度を示す情報は、影響度を示す値が最も高いものに対応する変数のみでもよい。 The information indicating the degree of influence is information including at least a portion of the multiple variables and the respective degrees of influence of the multiple variables. In other words, the information indicating the degree of influence may include all of the multiple variables and the respective degrees of influence of the multiple variables. Furthermore, the information indicating the degree of influence may be only the variable corresponding to the highest value indicating the degree of influence.

図9は、本実施形態の影響度情報70を示す図である。本実施形態の影響度情報70は、複数のパターンの夫々における複数の変数の夫々の影響度を示す値を含む情報である。この例では、影響度を示す値は、0~100%の範囲で示されている。また、夫々のパターンにおいて、変数x1~x4の夫々の影響度の総和が100%となるよう規格化されている。 Figure 9 is a diagram showing the impact information 70 of this embodiment. The impact information 70 of this embodiment is information that includes values indicating the impact of each of multiple variables in each of multiple patterns. In this example, the values indicating the impact are shown in the range of 0 to 100%. Furthermore, in each pattern, the sum of the impacts of each of the variables x1 to x4 is normalized to be 100%.

以下では、「影響度を示す値」を、単に「影響度」と呼ぶことにする。本実施形態では、パターンk(k=1~4)における変数xl(l=1~4)の影響度を、影響度Aklとする。 Hereinafter, the "value indicating the degree of influence" will be simply referred to as the "degree of influence." In this embodiment, the degree of influence of a variable xl (l=1 to 4) in a pattern k (k=1 to 4) is defined as the degree of influence A kl .

本実施形態の影響度Aklは、第1学習モデルM1によってパターンkに分類された第2データ42に対して出力される影響度である。つまり、本実施形態の影響度Aklは、入力された変数xl(l=1~4)のデータがパターンkに分類される限り、変数xl(l=1~4)のデータによらず一定となるように近似された影響度である。影響度Aklを算出する方法の詳細については後述する。 The influence A kl in this embodiment is the influence output for the second data 42 classified into pattern k by the first learning model M1. That is, the influence A kl in this embodiment is an influence that is approximated so as to be constant regardless of the data of the variable xl (l = 1 to 4) as long as the data of the input variable xl (l = 1 to 4) is classified into pattern k. A method for calculating the influence A kl will be described in detail later.

例えば、図9の影響度情報70に示されるパターン3は、クラスタC3に含まれる第2データ42に基づいている(図6)。クラスタC3に含まれる第2データ42は、“異常データ”を示す属性“1”及び識別情報“3”が付されたデータである(図7)。 For example, pattern 3 shown in the impact information 70 in FIG. 9 is based on the second data 42 included in cluster C3 (FIG. 6). The second data 42 included in cluster C3 is data that is assigned the attribute "1" indicating "abnormal data" and the identification information "3" (FIG. 7).

図9では、パターン3における変数x1の影響度(A31)が10%、変数x2の影響度(A32)が2%、変数x3の影響度(A33)が80%、変数x4の影響度(A34)が8%であることを示している。 FIG. 9 shows that in pattern 3, the influence of variable x1 (A 31 ) is 10%, the influence of variable x2 (A 32 ) is 2%, the influence of variable x3 (A 33 ) is 80%, and the influence of variable x4 (A 34 ) is 8%.

この例では、入力された変数xl(l=1~4)のデータがパターン3に分類された場合、変数x3の影響度が支配的である。このことは、第1学習モデルM1を用いた分類において、変数x3のデータが最も重要視された結果であることを意味する。また、このことは、変数x3を意味する圧力センサの出力値が異常であると推定できることを意味する。 In this example, when the data of the input variable xl (l = 1 to 4) is classified into pattern 3, the influence of the variable x3 is dominant. This means that in the classification using the first learning model M1, the data of the variable x3 is considered to be the most important result. This also means that it can be estimated that the output value of the pressure sensor representing the variable x3 is abnormal.

以下、本実施形態の影響度情報70を示す値を算出する方法について説明する。影響度情報70を示す値は、複数の第2データ42及び第1学習モデルM1に基づいて算出される。 The following describes a method for calculating a value indicating the impact information 70 in this embodiment. The value indicating the impact information 70 is calculated based on a plurality of second data 42 and the first learning model M1.

先ず、算出部53は、機械学習モデルの解釈法として使用可能なアルゴリズムを用いて、複数の第2データ42の夫々に対する影響度を算出する。アルゴリズムとしては、例えばLIME(local interpretable model-agnostic explanations)やSHAP(SHapley Additive exPlanations)といったアルゴリズムを用いることができる。本実施形態では、LIMEを用いて影響度を算出する。 First, the calculation unit 53 calculates the degree of influence for each of the multiple second data 42 using an algorithm that can be used as a method for interpreting the machine learning model. As the algorithm, for example, an algorithm such as LIME (local interpretable model-agnostic explanations) or SHAP (SHapley Additive exPlanations) can be used. In this embodiment, the degree of influence is calculated using LIME.

具体的には、LIMEを用いて、複数の第2データ42のうち、識別情報“k”(k=1~4)が付された一の第2データ42について、変数xl(l=1~4)の影響度akl(l=1~4)を算出する。このとき、一の第2データ42の周辺で、第1学習モデルM1に基づいて局所的な線形近似モデルを生成し、線形近似モデルにおける変数xl(l=1~4)の重みwkl(l=1~4)を算出する。 Specifically, using LIME, the influence a kl (l = 1 to 4) of the variable xl (l = 1 to 4) is calculated for one second data 42 to which identification information "k" (k = 1 to 4) is assigned among the multiple second data 42. At this time, a local linear approximation model is generated based on the first learning model M1 around the one second data 42, and the weight w kl (l = 1 to 4) of the variable xl (l = 1 to 4) in the linear approximation model is calculated.

そして、算出された重みwkl(k=1~4、l=1~4)を、lについての総和が100となるように規格化したものを、一の第2データ42についての変数xl(l=1~4)の影響度akl(k=1~4、l=1~4)とする。以上の算出処理を全ての第2データ42について行う。 Then, the calculated weights w kl (k=1 to 4, l=1 to 4) are normalized so that the sum for l is 100, and the result is defined as the influence a kl (k=1 to 4, l=1 to 4) of the variable xl (l=1 to 4) for one second data 42. The above calculation process is performed for all second data 42.

次いで、複数の第2データ42のうち、識別情報“k”(k=1~4)が付与された全ての第2データ42について、影響度akl(l=1~4)を足し合わせたものを、重みWkl(l=1~4)とする。そして、算出された重みWkl(l=1~4)を、lについての総和が100となるように規格化したものを、上述の影響度Akl(l=1~4)とする。 Next, the influence a kl (l=1 to 4) is added up for all the second data 42 to which identification information "k" (k=1 to 4) is assigned among the multiple second data 42, and the sum is set as the weight W kl (l=1 to 4). The calculated weights W kl (l=1 to 4) are then normalized so that the sum for l is 100, and the above-mentioned influence A kl (l=1 to 4) is set as the above-mentioned influence A kl (l=1 to 4).

第1取得部54は、複数の第2データ42のうち、複数のクラスタの夫々に含まれるデータを少なくとも一つ含む一部のデータを取得する。前述のように、複数の第2データ42のうち、第1取得部54によって取得された取得された第2データ42は、モデル構築部52が第2データ42を構築するために用いられる。 The first acquisition unit 54 acquires a portion of the second data 42, including at least one piece of data contained in each of the multiple clusters. As described above, the second data 42 acquired by the first acquisition unit 54 from the multiple second data 42 is used by the model construction unit 52 to construct the second data 42.

図10は、第1取得部54によって取得された第2データ42を示す図である。図10において、黒丸は、複数の第2データ42のうち、第1取得部54によって取得された第2データ42を示している。一方、白丸は、複数の第2データ42のうち、第1取得部54によって取得された第2データ42以外の第2データ42を示している。 Figure 10 is a diagram showing the second data 42 acquired by the first acquisition unit 54. In Figure 10, black circles indicate the second data 42 acquired by the first acquisition unit 54 among the multiple pieces of second data 42. On the other hand, white circles indicate the second data 42 other than the second data 42 acquired by the first acquisition unit 54 among the multiple pieces of second data 42.

第1取得部54は、複数の第2データ42のうち、複数のクラスタの夫々の重心に最も近いデータを少なくとも取得する。なお、ここで、一のクラスタの「重心」とは、の一のクラスタに含まれる複数の第2データ42の平均値である。 The first acquisition unit 54 acquires at least the data closest to the center of gravity of each of the plurality of clusters among the plurality of second data 42. Note that the "center of gravity" of a cluster here is the average value of the plurality of second data 42 included in the cluster.

図10の例では、第1取得部54は、複数のクラスタの夫々の重心から所定の距離以内に存在する第2データ42(黒丸)を取得する。ここでの距離としては特に限定されないが、例えばユークリッド距離、マンハッタン距離、チェビシェフ距離等を用いることができる。 In the example of FIG. 10, the first acquisition unit 54 acquires the second data 42 (black circles) that exist within a predetermined distance from the center of gravity of each of the multiple clusters. The distance here is not particularly limited, but for example, the Euclidean distance, Manhattan distance, Chebyshev distance, etc. can be used.

第2学習モデルM2は、前述した第1学習モデルM1と同様の手法に基づいて構築され、第2学習モデルM2の関数は、例えば、y=f2(x1,x2,x3,x4)と表される。 The second learning model M2 is constructed based on a method similar to that of the first learning model M1 described above, and the function of the second learning model M2 is expressed as, for example, y = f2 (x1, x2, x3, x4).

つまり、第2学習モデルM2は、複数の第2データ42のうち、複数のクラスタの夫々の重心の近傍に存在する代表的な第2データ42に基づいて構築されることになる。この結果、モデル構築部52は、第2データ42の分布に関する情報を保ちつつ、少ないデータ量を用いて第2学習モデルM2の学習を行う。なお、「データの分布」とは、例えば、データx1~x4のそれぞれを一つのベクトルとした際のベクトル空間における分布である。 In other words, the second learning model M2 is constructed based on representative second data 42 that exists near the center of gravity of each of the multiple clusters, among the multiple second data 42. As a result, the model construction unit 52 trains the second learning model M2 using a small amount of data while maintaining information about the distribution of the second data 42. Note that the "distribution of data" refers to, for example, the distribution in vector space when each of the data x1 to x4 is treated as a vector.

このようにして構築された第2学習モデルM2は、第1学習モデルM1を近似的に表した学習モデルといえる。また、第2学習モデルM2は、第1学習モデルM1よりも少ないデータ量を用いて構築されるため、第2学習モデルM2の関数f2は、第1学習モデルM1の関数f1よりもデータ量が少ない。 The second learning model M2 constructed in this way can be said to be a learning model that approximately represents the first learning model M1. Furthermore, since the second learning model M2 is constructed using a smaller amount of data than the first learning model M1, the function f2 of the second learning model M2 has a smaller amount of data than the function f1 of the first learning model M1.

第2学習モデルM2は、後述する診断装置21において、分類部81がSVMにより診断データを複数のパターンの何れかに分類する処理に用いられる。この分類する処理において、第1学習モデルM1よりもデータ量が少ない第2学習モデルM2を用いることにより、第1学習モデルM1を用いる場合に比べて処理速度を高速化することができる。 The second learning model M2 is used by the classification unit 81 in the diagnostic device 21 described below in a process of classifying diagnostic data into one of a number of patterns using an SVM. In this classification process, by using the second learning model M2, which has a smaller amount of data than the first learning model M1, the processing speed can be increased compared to when the first learning model M1 is used.

<<情報処理S10>>
以下、各機能ブロックが実行する処理の一例を、図11等を参照しつつ説明する。図11は、情報処理装置20で実行される処理の一例を示すフローチャートである。
<<Information Processing S10>>
An example of the process executed by each functional block will be described below with reference to Fig. 11 etc. Fig. 11 is a flowchart showing an example of the process executed by the information processing device 20.

先ず、クラスタリング部50は、記憶装置32に格納された第1データ41(図3、4)を取得する(S11)。 First, the clustering unit 50 acquires the first data 41 (FIGS. 3 and 4) stored in the storage device 32 (S11).

次いで、クラスタリング部50は、第1データ41を複数のクラスタにグループ化する(S12、図6)。このとき、クラスタリング部50は、第1データ41の“正常データ”と、“異常データ”とを分けた状態で、夫々を複数のクラスタにグループ化する。 Next, the clustering unit 50 groups the first data 41 into multiple clusters (S12, FIG. 6). At this time, the clustering unit 50 separates the "normal data" and "abnormal data" of the first data 41 and groups each of them into multiple clusters.

次いで、生成部51は、複数のクラスタの夫々に含まれるデータを、複数のクラスタ毎に識別する識別情報を、複数の第1データ41の夫々に付与し、複数の第2データ42を生成する(S13、図7)。 Next, the generation unit 51 assigns identification information for identifying the data contained in each of the multiple clusters to each of the multiple first data 41, thereby generating multiple second data 42 (S13, Figure 7).

次いで、モデル構築部52は、S13で生成された複数の第2データ42に基づいて、第1学習モデルM1を構築する(S14、図8)。 Next, the model construction unit 52 constructs a first learning model M1 based on the multiple second data 42 generated in S13 (S14, Figure 8).

次いで、算出部53は、S13で生成された複数の第2データ42及びS14で構築された第1学習モデルM1に基づいて、影響度情報70を算出する(S15、図9)。 Next, the calculation unit 53 calculates the impact information 70 based on the multiple second data 42 generated in S13 and the first learning model M1 constructed in S14 (S15, Figure 9).

次いで、第1取得部54は、複数の第2データ42のうち、複数のクラスタの夫々に含まれるデータを少なくとも一つ含む一部のデータを取得する(S16、図10)。 Next, the first acquisition unit 54 acquires a portion of the second data 42 that includes at least one piece of data contained in each of the multiple clusters (S16, FIG. 10).

次いで、モデル構築部52は、S16で取得された複数の第2データ42の一部に基づいて、第2学習モデルM2を構築する(S17、図10)。 Next, the model construction unit 52 constructs a second learning model M2 based on a portion of the multiple second data 42 acquired in S16 (S17, FIG. 10).

次いで、情報処理装置20は、S15で算出された影響度情報70と、S17で構築された第2学習モデルM2を、診断装置21に出力する。 Next, the information processing device 20 outputs the impact information 70 calculated in S15 and the second learning model M2 constructed in S17 to the diagnostic device 21.

<<<診断装置21について>>>
==診断装置21の構成==
図12は、診断装置21のハードウェア構成の一例を示す図である。診断装置21は、CPU60、メモリ61、記憶装置62、入力装置63、表示装置64、及び通信装置65を含むコンピュータである。なお、診断装置21のハードウェア構成は、情報処理装置20のハードウェア構成と同様であるため、ここでは詳細な説明は省略する。
<<<About the diagnosis device 21>>>
==Configuration of Diagnosis Device 21==
12 is a diagram showing an example of a hardware configuration of the diagnostic device 21. The diagnostic device 21 is a computer including a CPU 60, a memory 61, a storage device 62, an input device 63, a display device 64, and a communication device 65. Note that the hardware configuration of the diagnostic device 21 is similar to that of the information processing device 20, and therefore a detailed description thereof will be omitted here.

記憶装置62は、第2学習モデルM2、影響度情報70、及び診断プログラム71を記憶する。第2学習モデルM2は、情報処理装置20で構築されたモデルである。 The storage device 62 stores the second learning model M2, the impact information 70, and the diagnostic program 71. The second learning model M2 is a model constructed by the information processing device 20.

診断プログラム71は、制御プログラム40と同様に、診断装置21が有する各種機能を実現するためのプログラムを総称している。 The diagnostic program 71, like the control program 40, is a general term for the programs for realizing the various functions of the diagnostic device 21.

==機能ブロック==
図12は、診断装置21に実現される機能ブロックの一例を示す図である。診断装置21のCPU60が、診断プログラム71を実行することにより、診断装置21には、第2取得部80、分類部81、出力部82、及び記憶部83が実現される。
==Function Blocks==
12 is a diagram showing an example of functional blocks realized in the diagnostic device 21. When the CPU 60 of the diagnostic device 21 executes the diagnostic program 71, a second acquisition unit 80, a classification unit 81, an output unit 82, and a storage unit 83 are realized in the diagnostic device 21.

第2取得部80は、複数の変数を含み診断対象となる診断データを取得する。具体的には、第2取得部80は、運転中のショーケース300のセンサ310から出力される変数x1~x4のデータを、所定時間間隔毎(例えば、30秒毎)に取得する。なお、センサ310から出力される変数x1~x4のデータが「診断データ」に相当する。 The second acquisition unit 80 acquires diagnostic data that includes multiple variables and is to be diagnosed. Specifically, the second acquisition unit 80 acquires data of variables x1 to x4 output from the sensor 310 of the showcase 300 during operation at predetermined time intervals (e.g., every 30 seconds). The data of variables x1 to x4 output from the sensor 310 corresponds to "diagnostic data."

分類部81は、情報処理装置20のモデル構築部52によって構築された第2学習モデルM2に基づいて、診断データを複数のパターンの何れかに分類する。本実施形態の複数のパターンとは、前述のように、パターン1~パターン4からなる。 The classification unit 81 classifies the diagnostic data into one of a plurality of patterns based on the second learning model M2 constructed by the model construction unit 52 of the information processing device 20. In this embodiment, the plurality of patterns consists of pattern 1 to pattern 4, as described above.

出力部82は、診断データが分類されたパターンの影響度情報70(図9)を出力する。例えば、ある時刻に取得された診断データが分類部81によってパターン4に分類された場合、本実施形態では、出力部82は、変数x1の影響度(A41)が1%、変数x2の影響度(A42)が4%、変数x3の影響度(A43)が0%、変数x4の影響度(A44)が95%である旨を出力する。このとき、出力部82は、表示装置64に出力してもよいし、音声情報により出力してもよい。 The output unit 82 outputs the influence information 70 ( FIG. 9 ) of the pattern into which the diagnostic data has been classified. For example, when the diagnostic data acquired at a certain time is classified into pattern 4 by the classification unit 81, in this embodiment, the output unit 82 outputs that the influence (A 41 ) of the variable x1 is 1%, the influence (A 42 ) of the variable x2 is 4%, the influence (A 43 ) of the variable x3 is 0%, and the influence (A 44 ) of the variable x4 is 95%. At this time, the output unit 82 may output to the display device 64 or may output by audio information.

そして、作業者は、出力部82による出力を確認することにより、ショーケース300に異常が検知されたことを把握する。この場合、作業者は、異常の主な要因が、変数x4が意味するコンプレッサの冷媒の流量であることを把握する。 Then, the worker confirms the output from the output unit 82 and realizes that an abnormality has been detected in the showcase 300. In this case, the worker realizes that the main cause of the abnormality is the flow rate of the refrigerant in the compressor, which is represented by the variable x4.

記憶部83は、情報処理装置20から診断装置21に出力された影響度情報70を記憶する。これによって、診断処理において、過去に生成した影響度情報70を用いることができる。これによって、情報処理装置20によって第2学習モデルM2及び影響度情報70を生成する回数を抑えることができる。また、これによって、診断データの夫々に対し、LIME等を用いて影響度を算出する必要がなく、診断処理における計算負荷を削減することができる。 The storage unit 83 stores the impact information 70 output from the information processing device 20 to the diagnostic device 21. This allows previously generated impact information 70 to be used in the diagnostic process. This reduces the number of times the information processing device 20 generates the second learning model M2 and the impact information 70. This also eliminates the need to calculate the impact for each piece of diagnostic data using LIME or the like, reducing the calculation load in the diagnostic process.

なお、本実施形態では、分類部81は、第2学習モデルM2に基づいて、診断データを複数のパターンの何れかに分類する態様を示したが、これに限られない。分類部81は、第2学習モデルM2ではなく、第1学習モデルM1に基づいて分類してもよい。 In this embodiment, the classification unit 81 classifies the diagnostic data into one of a plurality of patterns based on the second learning model M2, but this is not limited to the above. The classification unit 81 may classify the diagnostic data based on the first learning model M1 instead of the second learning model M2.

この場合、情報処理装置20は、第2学習モデルM2を構築する必要はない。また、この場合、情報処理装置20は、第2学習モデルM2に代えて、第1学習モデルM1を診断装置21に出力する。 In this case, the information processing device 20 does not need to construct the second learning model M2. In addition, in this case, the information processing device 20 outputs the first learning model M1 to the diagnostic device 21 instead of the second learning model M2.

<<診断処理S20>>
以下、各機能ブロックが実行する処理の一例を、図14等を参照しつつ説明する。図14は、診断装置21で実行される処理の一例を示すフローチャートである。
<<Diagnosis Process S20>>
An example of the process executed by each functional block will be described below with reference to Fig. 14 etc. Fig. 14 is a flow chart showing an example of the process executed by the diagnostic device 21.

まず、図14に示すように、第2取得部80は、複数の変数を含み診断対象となる診断データを取得する(S21)。次いで、分類部81は、第2学習モデルM2に基づいて、診断データを複数のパターンの何れかに分類する(S22)。次いで、出力部82は、診断データが分類されたパターンの影響度情報70を出力する(S23)。 First, as shown in FIG. 14, the second acquisition unit 80 acquires diagnostic data that includes multiple variables and is to be diagnosed (S21). Next, the classification unit 81 classifies the diagnostic data into one of multiple patterns based on the second learning model M2 (S22). Next, the output unit 82 outputs impact information 70 of the classified patterns of the diagnostic data (S23).

===まとめ===
以上、本実施形態の情報処理システム10について説明した。かかる実施形態によれば、分類の要因となる特徴を推定することが可能な情報処理システムを提供することができる。
====Summary====
The above describes the information processing system 10 according to the present embodiment. According to this embodiment, it is possible to provide an information processing system capable of estimating features that are factors in classification.

また、かかる実施形態によれば、クラスタリング部50が複数の第1データ41を複数のクラスタにグループ化する際、x-meansによる処理を施す。そのため、クラスタの数を仮定する必要がない。これによって、分類の要因となる特徴を推定する際に、特徴の数に対する先入観が排除されるため、正確な推定をすることができる。 Furthermore, according to this embodiment, when the clustering unit 50 groups the multiple first data 41 into multiple clusters, it performs x-means processing. Therefore, it is not necessary to assume the number of clusters. This eliminates preconceptions about the number of features when estimating the features that are factors in classification, allowing for accurate estimation.

また、かかる実施形態によれば、複数の第1データ41は、所定の属性を有するデータである。そのため、クラスタリング部50が複数の第1データ41を複数クラスタにグループ化する際、属性ごとに分けてグループ化することができる。これによって、複数の第1データ41の、学習用データとしての精度を高めることができる。 Furthermore, according to this embodiment, the multiple first data 41 are data having a predetermined attribute. Therefore, when the clustering unit 50 groups the multiple first data 41 into multiple clusters, the multiple first data 41 can be grouped by attribute. This can improve the accuracy of the multiple first data 41 as learning data.

また、かかる実施形態によれば、所定の属性は、所定の装置が正常に動作しているか否かを示す情報である。つまり、クラスタリング部50は、複数の第1データ41の“正常データ”と、“異常データ”とを分けた状態で、夫々を複数のクラスタにグループ化することができる。そのため、一のクラスタに“正常データ”と、“異常データ”が混在することがなく、複数の第1データ41の、学習用データとしての精度を高めることができる。 Furthermore, according to this embodiment, the specified attribute is information indicating whether or not the specified device is operating normally. In other words, the clustering unit 50 can group the multiple first data 41 into multiple clusters while separating the "normal data" and "abnormal data". Therefore, "normal data" and "abnormal data" are not mixed in one cluster, and the accuracy of the multiple first data 41 as learning data can be improved.

また、かかる実施形態によれば、影響度情報70は、複数の変数の夫々の影響度を示す値を含む情報である。これによって、分類の要因となる特徴を定量的に推定することが可能となる。 Furthermore, according to this embodiment, the influence information 70 is information that includes values indicating the influence of each of a plurality of variables. This makes it possible to quantitatively estimate the characteristics that are the factors behind the classification.

また、かかる実施形態によれば、第1取得部54は、複数の第2データ42のうち、複数のクラスタの夫々に含まれるデータを少なくとも一つ含む一部のデータを取得する。これによって、第2データ42の分布に関する情報を保ちつつ、より少ないデータ量を用いて第2学習モデルM2の学習を行うことができる。これによって、第2学習モデルM2の学習時間を削減することができる。 Furthermore, according to this embodiment, the first acquisition unit 54 acquires a portion of the second data 42, including at least one piece of data contained in each of the multiple clusters. This makes it possible to train the second learning model M2 using a smaller amount of data while maintaining information about the distribution of the second data 42. This makes it possible to reduce the training time of the second learning model M2.

また、かかる実施形態によれば、第1取得部54は、複数の第2データ42のうち、複数のクラスタの夫々の重心に最も近いデータを少なくとも取得する。これによって、第2データ42の分布に関する情報を保ちつつ、第2学習モデルM2の学習に用いるデータ量を効率的に減らすことができる。 Furthermore, according to this embodiment, the first acquisition unit 54 acquires at least the data closest to the center of gravity of each of the plurality of clusters among the plurality of second data 42. This makes it possible to efficiently reduce the amount of data used to train the second learning model M2 while maintaining information about the distribution of the second data 42.

また、かかる実施形態によれば、診断処理において、所定の装置から出力される診断データの夫々に対し、第2学習モデルM2による分類の結果に基づいて影響度情報70を参照することによって、分類の要因となる特徴を推定することができる。 Furthermore, according to this embodiment, in the diagnostic process, for each piece of diagnostic data output from a specific device, the characteristics that are factors in the classification can be estimated by referring to the influence information 70 based on the results of classification by the second learning model M2.

従来の異常検知方法では、診断処理において、装置から出力される診断データの夫々に対し、LIMEやSHAP等の機械学習モデルの既存の解釈法を用いて影響度を算出する。そのため、診断処理における計算負荷が膨大となるという課題があった。 In conventional anomaly detection methods, the degree of impact is calculated for each piece of diagnostic data output from the device during diagnostic processing using existing interpretation methods for machine learning models such as LIME and SHAP. This poses the problem of a huge computational load during diagnostic processing.

しかしながら、かかる実施形態の診断処理によれば、診断データの夫々に対し、影響度を算出する必要がない。これによって、診断処理における計算負荷を削減することができる。 However, according to the diagnostic process of this embodiment, there is no need to calculate the degree of influence for each piece of diagnostic data. This reduces the calculation load in the diagnostic process.

また、かかる実施形態によれば、診断装置21は、影響度情報70を記憶する記憶部83を備える。これによって、診断処理において、過去に生成した影響度情報70を用いることができる。これにより、情報処理装置20によって第2学習モデルM2及び影響度情報70を生成する回数を抑えることができる。 Furthermore, according to this embodiment, the diagnostic device 21 includes a storage unit 83 that stores the impact information 70. This allows previously generated impact information 70 to be used in the diagnostic process. This reduces the number of times the information processing device 20 generates the second learning model M2 and the impact information 70.

上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その趣旨を逸脱することなく、変更や改良され得るとともに、本発明にはその等価物が含まれるのはいうまでもない。 The above embodiment is intended to facilitate understanding of the present invention, and is not intended to limit the present invention. Furthermore, the present invention may be modified or improved without departing from the spirit of the present invention, and it goes without saying that the present invention includes equivalents.

10:情報処理システム
20:情報処理装置
21:診断装置
25:ネットワーク
30:CPU
31:メモリ
32:記憶装置
33:入力装置
34:表示装置
35:通信装置
40:制御プログラム
41:第1データ
42:第2データ
50:クラスタリング部
51:生成部
52:モデル構築部
53:算出部
54:第1取得部
60:CPU
61:メモリ
62:記憶装置
63:入力装置
64:表示装置
65:通信装置
70:影響度情報
71:診断プログラム
80:第2取得部
81:分類部
82:出力部
83:記憶部
300:ショーケース
310:センサ
M1:第1学習モデル
M2:第2学習モデル
10: Information processing system 20: Information processing device 21: Diagnostic device 25: Network 30: CPU
31: Memory 32: Storage device 33: Input device 34: Display device 35: Communication device 40: Control program 41: First data 42: Second data 50: Clustering unit 51: Generation unit 52: Model construction unit 53: Calculation unit 54: First acquisition unit 60: CPU
61: Memory 62: Storage device 63: Input device 64: Display device 65: Communication device 70: Impact information 71: Diagnostic program 80: Second acquisition unit 81: Classification unit 82: Output unit 83: Storage unit 300: Showcase 310: Sensor M1: First learning model M2: Second learning model

Claims (11)

複数の変数を含む複数の第1データを、複数のクラスタにグループ化するクラスタリング部と、
前記複数のクラスタの夫々に含まれるデータを前記複数のクラスタ毎に識別する識別情報を、前記複数の第1データの夫々に付与し、複数の第2データを生成する生成部と、
前記複数のクラスタの夫々に含まれるデータに基づく複数のパターンのうち、入力されるデータを、何れかのパターンに分類するための第1学習モデルを、前記複数の第2データに基づいて構築するモデル構築部と、
前記複数の第2データ及び前記第1学習モデルに基づいて、前記複数のパターンの何れかへの分類の要因となる特徴である前記複数の変数の夫々の影響度を示す影響度情報を算出する算出部と、
を備える情報処理装置。
A clustering unit that groups a plurality of first data including a plurality of variables into a plurality of clusters;
a generating unit that generates a plurality of second data by adding, to each of the plurality of first data, identification information that identifies data included in each of the plurality of clusters for each of the plurality of clusters;
a model construction unit that constructs a first learning model based on the plurality of second data for classifying input data into one of a plurality of patterns based on data included in each of the plurality of clusters;
A calculation unit that calculates influence information indicating an influence of each of the plurality of variables , which are characteristics that are factors in classifying the plurality of patterns, based on the plurality of second data and the first learning model;
An information processing device comprising:
請求項1に記載の情報処理装置であって、
前記クラスタリング部は、前記複数の第1データに対しx-meansによる処理を施すこと、
を特徴とする情報処理装置。
2. The information processing device according to claim 1,
The clustering unit performs x-means processing on the plurality of first data;
An information processing device comprising:
請求項1または2に記載の情報処理装置であって、
前記複数の第1データは、所定の属性を有するデータであること、
を特徴とする情報処理装置。
3. The information processing device according to claim 1,
the plurality of first data are data having a predetermined attribute;
An information processing device comprising:
請求項3に記載の情報処理装置であって、
前記所定の属性は、所定の装置が正常に動作しているか否かを示す情報であること、
を特徴とする情報処理装置。
4. The information processing device according to claim 3,
the predetermined attribute is information indicating whether a predetermined device is operating normally;
An information processing device comprising:
請求項1~4の何れか一項に記載の情報処理装置であって、
前記影響度情報は、前記複数の変数の夫々の影響度を示す値を含む情報であること、
を特徴とする情報処理装置。
The information processing device according to any one of claims 1 to 4,
the influence information includes a value indicating an influence of each of the plurality of variables;
An information processing device comprising:
請求項1~5の何れか一項に記載の情報処理装置であって、
前記複数の第2データのうち、前記複数のクラスタの夫々に含まれるデータを少なくとも一つ含む一部のデータを取得する第1取得部を備え、
前記モデル構築部は、
前記第1取得部が取得したデータに基づいて、入力されるデータが前記複数のパターンの何れに属するかを分類するための第2学習モデルを構築すること、
を特徴とする情報処理装置。
The information processing device according to any one of claims 1 to 5,
a first acquisition unit that acquires a portion of the second data including at least one piece of data included in each of the plurality of clusters,
The model construction unit includes:
constructing a second learning model for classifying input data into which of the plurality of patterns the data belongs, based on the data acquired by the first acquisition unit;
An information processing device comprising:
請求項6に記載の情報処理装置であって、
前記第1取得部は、
前記複数の第2データのうち、前記複数のクラスタの夫々の重心に最も近いデータを少なくとも取得すること、
を特徴とする情報処理装置。
7. The information processing device according to claim 6,
The first acquisition unit is
acquiring at least data closest to a center of gravity of each of the plurality of clusters from among the plurality of second data;
An information processing device comprising:
請求項6または7に記載の情報処理装置と、
前記複数の変数を含み診断対象となる診断データを取得する第2取得部と、
前記第2学習モデルに基づいて、前記診断データを前記複数のパターンの何れかに分類する分類部と、
前記診断データが分類されたパターンの前記影響度情報を出力する出力部と、
を含む診断装置と、を備える情報処理システム。
An information processing device according to claim 6 or 7;
A second acquisition unit that acquires diagnostic data that includes the plurality of variables and is to be diagnosed;
a classification unit that classifies the diagnostic data into one of the plurality of patterns based on the second learning model;
an output unit that outputs the impact information of a pattern in which the diagnostic data is classified;
and a diagnostic device including the above.
請求項8に記載の情報処理システムであって、
前記診断装置は、前記影響度情報を記憶する記憶部を備えること、
を特徴とする情報処理システム。
9. The information processing system according to claim 8,
the diagnostic device includes a storage unit that stores the impact information;
An information processing system comprising:
複数の変数を含む複数の第1データを、複数のクラスタにグループ化するステップと、
前記複数のクラスタの夫々に含まれるデータを前記複数のクラスタ毎に識別する識別情報を、前記複数の第1データの夫々に付与し、複数の第2データを生成するステップと、
前記複数のクラスタの夫々に含まれるデータに基づく複数のパターンのうち、入力されるデータを、何れかのパターンに分類するための第1学習モデルを、前記複数の第2データに基づいて構築するステップと、
前記複数の第2データ及び前記第1学習モデルに基づいて、前記複数のパターンの何れかへの分類の要因となる特徴である前記複数の変数の夫々の影響度を示す影響度情報を算出するステップと、
を含む情報処理方法。
Grouping a plurality of first data including a plurality of variables into a plurality of clusters;
a step of generating a plurality of second data by assigning identification information to each of the plurality of first data, the identification information being used to identify data included in each of the plurality of clusters for each of the plurality of clusters;
constructing a first learning model based on the plurality of second data for classifying input data into one of a plurality of patterns based on data included in each of the plurality of clusters;
Calculating influence information indicating an influence of each of the plurality of variables , which are characteristics that are factors in classifying the plurality of patterns, based on the plurality of second data and the first learning model;
An information processing method comprising:
コンピュータに、
複数の変数を含む複数の第1データを、複数のクラスタにグループ化させ、
前記複数のクラスタの夫々に含まれるデータを前記複数のクラスタ毎に識別する識別情報を、前記複数の第1データの夫々に付与し、複数の第2データを生成させ、
前記複数のクラスタの夫々に含まれるデータに基づく複数のパターンのうち、入力されるデータを、何れかのパターンに分類するための第1学習モデルを、前記複数の第2データに基づいて構築させ、
前記複数の第2データ及び前記第1学習モデルに基づいて、前記複数のパターンの何れかへの分類の要因となる特徴である前記複数の変数の夫々の影響度を示す影響度情報を算出させる、
ことを特徴とする情報処理プログラム。
On the computer,
Grouping a plurality of first data including a plurality of variables into a plurality of clusters;
assigning identification information to each of the plurality of first data, the identification information identifying the data included in each of the plurality of clusters for each of the plurality of clusters, to generate a plurality of second data;
constructing a first learning model based on the plurality of second data, the first learning model being used to classify input data into one of a plurality of patterns based on data included in each of the plurality of clusters;
calculating influence information indicating an influence of each of the plurality of variables , which are characteristics that are factors in classifying the plurality of patterns, based on the plurality of second data and the first learning model;
23. An information processing program comprising:
JP2020017098A 2020-02-04 2020-02-04 Information processing device, information processing method, and information processing program Active JP7500980B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020017098A JP7500980B2 (en) 2020-02-04 2020-02-04 Information processing device, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020017098A JP7500980B2 (en) 2020-02-04 2020-02-04 Information processing device, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP2021124886A JP2021124886A (en) 2021-08-30
JP7500980B2 true JP7500980B2 (en) 2024-06-18

Family

ID=77459025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020017098A Active JP7500980B2 (en) 2020-02-04 2020-02-04 Information processing device, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP7500980B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7452563B2 (en) 2022-03-03 2024-03-19 横河電機株式会社 Apparatus, method and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191556A (en) 2009-02-17 2010-09-02 Hitachi Ltd Abnormality detecting method and abnormality detecting system
WO2011135606A1 (en) 2010-04-26 2011-11-03 株式会社 日立製作所 Time-series data diagnostic compression method
WO2018163375A1 (en) 2017-03-09 2018-09-13 株式会社日立製作所 Control device, control system, and server
JP2018151821A (en) 2017-03-13 2018-09-27 株式会社日立製作所 Abnormality diagnosis system of facility apparatus
JP6615963B1 (en) 2018-08-31 2019-12-04 株式会社日立パワーソリューションズ Abnormal sign diagnostic apparatus and abnormal sign diagnostic method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191556A (en) 2009-02-17 2010-09-02 Hitachi Ltd Abnormality detecting method and abnormality detecting system
WO2011135606A1 (en) 2010-04-26 2011-11-03 株式会社 日立製作所 Time-series data diagnostic compression method
WO2018163375A1 (en) 2017-03-09 2018-09-13 株式会社日立製作所 Control device, control system, and server
JP2018151821A (en) 2017-03-13 2018-09-27 株式会社日立製作所 Abnormality diagnosis system of facility apparatus
JP6615963B1 (en) 2018-08-31 2019-12-04 株式会社日立パワーソリューションズ Abnormal sign diagnostic apparatus and abnormal sign diagnostic method

Also Published As

Publication number Publication date
JP2021124886A (en) 2021-08-30

Similar Documents

Publication Publication Date Title
CN109542740B (en) Abnormality detection method and apparatus
JP6555061B2 (en) Clustering program, clustering method, and information processing apparatus
JP2019521422A (en) Method, apparatus and computer readable medium for detecting abnormal user behavior related application data
US9311729B2 (en) Information processing apparatus, information processing method, and program
JP7040851B2 (en) Anomaly detection device, anomaly detection method and anomaly detection program
JP2008546046A (en) Mahalanobis distance genetic algorithm method and system
JP6538615B2 (en) Abnormality detection device, abnormality detection method and abnormality detection program
US11796989B2 (en) Monitoring system and monitoring method
WO2021071911A1 (en) Sensor contribution ranking
US20220245405A1 (en) Deterioration suppression program, deterioration suppression method, and non-transitory computer-readable storage medium
JP6952660B2 (en) Update support device, update support method and program
KR102079359B1 (en) Process Monitoring Device and Method using RTC method with improved SAX method
CN111834010A (en) COVID-19 detection false negative identification method based on attribute reduction and XGboost
JP2013161295A (en) Label addition device, label addition method, and program
US11250351B2 (en) System and method for one-class similarity machines for anomaly detection
KR20160064710A (en) Apparatus and method for detecting anomaly intrusion using local deviation factor graph based algorithm
JP7207540B2 (en) LEARNING SUPPORT DEVICE, LEARNING SUPPORT METHOD, AND PROGRAM
JP6950504B2 (en) Abnormal candidate extraction program, abnormal candidate extraction method and abnormal candidate extraction device
JP7500980B2 (en) Information processing device, information processing method, and information processing program
US11741394B2 (en) Information processing method, information processing apparatus, and abnormality determination system
CN112669908A (en) Predictive model incorporating data packets
JP7119901B2 (en) Analysis device, analysis method and analysis program
JP6930195B2 (en) Model identification device, prediction device, monitoring system, model identification method and prediction method
JP7484261B2 (en) Information processing device, information processing method, and information processing program
JP2020095583A (en) Bankruptcy probability calculation system utilizing artificial intelligence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240520

R150 Certificate of patent or registration of utility model

Ref document number: 7500980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150