JP2020144493A - Learning model generation support device and learning model generation support method - Google Patents

Learning model generation support device and learning model generation support method Download PDF

Info

Publication number
JP2020144493A
JP2020144493A JP2019039130A JP2019039130A JP2020144493A JP 2020144493 A JP2020144493 A JP 2020144493A JP 2019039130 A JP2019039130 A JP 2019039130A JP 2019039130 A JP2019039130 A JP 2019039130A JP 2020144493 A JP2020144493 A JP 2020144493A
Authority
JP
Japan
Prior art keywords
learning model
feature
features
learning
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019039130A
Other languages
Japanese (ja)
Other versions
JP7171471B2 (en
Inventor
貴之 今田
Takayuki Imada
貴之 今田
卓也 小松田
Takuya Komatsuda
卓也 小松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019039130A priority Critical patent/JP7171471B2/en
Publication of JP2020144493A publication Critical patent/JP2020144493A/en
Application granted granted Critical
Publication of JP7171471B2 publication Critical patent/JP7171471B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

To provide information which supports generation of a learning model.SOLUTION: A learning model generation support device generates, with respect to each of features available for generation of a learning model, a variation detection model for generating a variation score being a value indicative of a degree of variation of time-series data by using respective time-series data in a learning period of used features which were used for generation of an already generated learning model, as learning data, inputs respective new time-series data to respective variation detection models of the plurality of features to obtain individual variation scores being respective variation scores of the plurality of features in a new period, obtains an overall variation score being a value indicative of a degree of variation of the whole of the plurality of features in the new period on the basis of respective variation scores of the plurality of features, and identifies a contributing feature being a feature contributing to the overall variation score on the basis of respective individual variation scores of the plurality of features.SELECTED DRAWING: Figure 1

Description

本発明は、学習モデル生成支援装置、及び学習モデル生成支援方法に関する。 The present invention relates to a learning model generation support device and a learning model generation support method.

特許文献1には、モデルを用いて所定の対象を適切に予測することを目的として構成された予測モデルの更新装置について記載されている。更新装置は、取得部と更新部とを有する。取得部は、所定の対象を予測する予測モデルに関する情報を取得し、更新部は、所定の条件を満たす場合に取得部により取得された予測モデルを更新する。また更新部は、所定の組合情報に対応する予測モデルが所定の条件を満たす場合に当該予測モデルの重みを再計算することにより当該予測モデルを更新する。 Patent Document 1 describes an update device for a prediction model configured for the purpose of appropriately predicting a predetermined object using a model. The update device has an acquisition unit and an update unit. The acquisition unit acquires information about a prediction model that predicts a predetermined target, and the update unit updates the prediction model acquired by the acquisition unit when a predetermined condition is satisfied. Further, the update unit updates the prediction model by recalculating the weight of the prediction model when the prediction model corresponding to the predetermined union information satisfies the predetermined condition.

非特許文献1には、データストリームからの異常値と変化点を検出する技術に関し、その性質が時間の経過とともに変化するデータソースを追跡するオンライン割引学習アルゴリズムを用いてデータソースの確率論的モデルを学習する技術に関して記載されている。 Non-Patent Document 1 describes a technique for detecting outliers and change points from a data stream, which is a stochastic model of the data source using an online discount learning algorithm that tracks the data source whose properties change over time. It describes the technique of learning.

特開2017−151867号公報Japanese Unexamined Patent Publication No. 2017-151867

A Unifying Framework for Detecting Outliers and Change Points from Time Series, IEEE Transactions on Knowledge and Data Engineering archive Volume 18 Issue 4, April 2006,Pages 482-492A Unifying Framework for Detecting Outliers and Change Points from Time Series, IEEE Transactions on Knowledge and Data Engineering archive Volume 18 Issue 4, April 2006, Pages 482-492

昨今、製品の製造現場においては、生産効率改善等を目的としてIoT(Internet of Things)の導入が推進されており、製品の良品/不良品の分類や装置の故障予知等への機械学習を応用した技術の活用が進められている。こうした機械学習においては、製造現場に設けられたセンサ装置等のデータ取得装置から様々な特徴についての学習データを取得し、取得した学習データに基づき学習モデルが生成(学習)される。そして生成された学習モデルに製造現場で新たに取得されるデータを入力することにより分類結果や予測結果等の情報を取得し、取得した情報を用いて製品の生産が進められる。 In recent years, the introduction of IoT (Internet of Things) has been promoted at product manufacturing sites for the purpose of improving production efficiency, and application of machine learning to classify non-defective / defective products and predict equipment failures. Utilization of the advanced technology is being promoted. In such machine learning, learning data about various features is acquired from a data acquisition device such as a sensor device installed at a manufacturing site, and a learning model is generated (learned) based on the acquired learning data. Then, by inputting data newly acquired at the manufacturing site into the generated learning model, information such as classification results and prediction results is acquired, and product production is promoted using the acquired information.

ところで、学習モデルの性能(例えば分類精度や予測精度)はその生成に用いた特徴に依存し、学習に用いる特徴の選出は学習モデルの性能を確保する上で重要な作業である。また学習モデルを使い続けるうちに現場の状況変化等によって学習モデルの性能が低下することがあり、学習モデルに用いる特徴は随時見直しを行い、必要であれば学習モデルを生成し直す(更新する)必要がある。また学習モデルの利用現場において検討対象となる特徴の数は通常は膨大であるため、特徴は効率よく適切に選出する必要もある。 By the way, the performance of the learning model (for example, classification accuracy and prediction accuracy) depends on the features used for its generation, and the selection of the features used for learning is an important task for ensuring the performance of the learning model. In addition, the performance of the learning model may deteriorate due to changes in the situation at the site while continuing to use the learning model, so the features used in the learning model should be reviewed as needed, and the learning model should be regenerated (updated) if necessary. There is a need. In addition, since the number of features to be examined at the site where the learning model is used is usually enormous, it is necessary to efficiently and appropriately select the features.

特許文献1には、予測モデルの重みを再計算することにより予測モデルを更新することが記載されている。しかし特許文献1に記載の更新装置は、予測モデルの更新時においても最初に生成された学習モデルに利用された特徴が考慮されるに過ぎず、例えば、最初に生成された学習モデルの生成に用いた特徴以外の特徴の変化が原因で学習モデルの性能が低下する場合に対応することができない。 Patent Document 1 describes updating the prediction model by recalculating the weight of the prediction model. However, the update device described in Patent Document 1 only considers the features used in the first generated learning model even when the prediction model is updated. For example, in the generation of the first generated learning model. It is not possible to deal with the case where the performance of the learning model deteriorates due to changes in features other than the features used.

非特許文献1には、複数の特徴の時系列データを入力として、特徴全体としての変化や個々の特徴の変化を検知する技術について記載されている。しかし非特許文献1に記載の技術は特徴全体としての変化に寄与する個々の特徴を特定することができない。例えば、学習モデルの利用現場においては、学習モデルの更新に際し、何故学習モデルを更新する必要があるのか、現場に生じたどのような原因を理由として学習モデルを更新するのか等の情報を詳細に把握したいというニーズがあるが、非特許文献1に記載の技術はこうしたニーズに対応することができない。 Non-Patent Document 1 describes a technique for detecting changes in the entire feature or changes in individual features by inputting time-series data of a plurality of features. However, the technique described in Non-Patent Document 1 cannot identify individual features that contribute to changes in the features as a whole. For example, in the field where the learning model is used, when updating the learning model, detailed information such as why the learning model needs to be updated and what kind of cause occurred in the field is the reason for updating the learning model. There is a need to grasp, but the technology described in Non-Patent Document 1 cannot meet such a need.

本発明はこのような背景に基づきなされたものであり、学習モデルの生成を支援する情報を提供することが可能な、学習モデル生成支援装置、及び学習モデル生成支援方法を提供することを目的とする。 The present invention has been made based on such a background, and an object of the present invention is to provide a learning model generation support device and a learning model generation support method capable of providing information for supporting the generation of a learning model. To do.

上記目的を達成するための本発明の一つは、学習モデルの生成を支援する情報処理装置であって、学習モデルの生成に利用可能な特徴の時系列データを記憶する記憶部、前記特徴の夫々について、生成済みの前記学習モデルの生成に利用した前記特徴である利用特徴の学習期間における夫々の時系列データを学習データとして、夫々の前記時系列データの変化の度合いを示す値である変化スコアを生成する機械学習モデルである変化検知モデルを生成する、変化検知モデル生成部、複数の前記特徴の夫々について、新たな期間の時系列データを取得するデータ取得部、前記複数の特徴の夫々の前記変化検知モデルに夫々の前記新たな時系列データを入力することにより、前記新たな期間おける前記複数の特徴の夫々の前記変化スコアである個別変化スコアを求める個別変化スコア算出部、前記複数の特徴の夫々の前記個別変化スコアに基づき、前記新たな期間おける前記複数の特徴の全体としての変化の度合いを示す値である全体変化スコアを求める、全体変化スコア算出部、前記複数の特徴の夫々の前記個別変化スコアに基づき、前記全体変化スコアに寄与する前記特徴である寄与特徴を特定する、寄与特徴特定部、を備える。 One of the present inventions for achieving the above object is an information processing device that supports the generation of a learning model, and is a storage unit that stores time-series data of features that can be used for generating the learning model. For each, a change indicating the degree of change of the time-series data, using each time-series data in the learning period of the usage feature, which is the feature used for generating the generated learning model, as training data. A change detection model generation unit that generates a change detection model that is a machine learning model that generates a score, a data acquisition unit that acquires time-series data for a new period for each of the plurality of features, and each of the plurality of features. The individual change score calculation unit, which obtains the individual change score which is the change score of each of the plurality of features in the new period by inputting the new time series data into the change detection model of the above. The overall change score calculation unit, which obtains the overall change score, which is a value indicating the degree of change of the plurality of features as a whole in the new period, based on the individual change scores of each of the features of the plurality of features. Based on each of the individual change scores, a contribution feature specifying unit for specifying the contribution feature, which is the feature that contributes to the overall change score, is provided.

その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。 In addition, the problems disclosed in the present application and the solutions thereof will be clarified by the column of the form for carrying out the invention and the drawings.

本発明によれば、学習モデルの生成を支援する情報を提供することができる。 According to the present invention, it is possible to provide information that supports the generation of a learning model.

機械学習システムの概略的な構成を示す図である。It is a figure which shows the schematic structure of the machine learning system. 学習モデル生成支援装置のハードウェア構成例を示す図である。It is a figure which shows the hardware configuration example of the learning model generation support apparatus. 学習データの一例である。This is an example of training data. 学習モデル情報の一例である。This is an example of learning model information. 変化検知モデル情報の一例である。This is an example of change detection model information. 特徴変化関連情報の一例である。This is an example of information related to feature changes. 学習モデル生成処理を説明するフローチャートである。It is a flowchart explaining the learning model generation process. 変化検知モデル生成処理を説明するフローチャートである。It is a flowchart explaining the change detection model generation process. 全体変化スコア算出処理を説明するフローチャートである。It is a flowchart explaining the total change score calculation process. 全体変化スコアの算出方法を説明する図である。It is a figure explaining the calculation method of the total change score. 支援情報提示処理を説明するフローチャートである。It is a flowchart explaining the support information presentation process. 支援情報提示画面の一例である。This is an example of a support information presentation screen. 他の変化検知手法による変化検知モデルの生成方法を説明する図である。It is a figure explaining the generation method of the change detection model by another change detection method. 他の変化検知手法による変化検知モデルを用いた場合の変化検知モデル生成処理を説明するフローチャートである。It is a flowchart explaining the change detection model generation process when the change detection model by another change detection method is used. 他の変化検知手法による変化検知モデルを用いた場合の全体変化スコア算出処理を説明するフローチャートである。It is a flowchart explaining the overall change score calculation process when the change detection model by another change detection method is used. 変化検知方法選択画面の一例である。This is an example of a change detection method selection screen. 学習モデル設定画面の一例である。This is an example of the learning model setting screen. 時系列データ送信制御処理を説明するフローチャートである。It is a flowchart explaining the time series data transmission control processing.

以下、実施形態について図面を参照しつつ説明する。以下の説明において、同一のまたは類似する構成について同一の符号を付して重複した説明を省略することがある。 Hereinafter, embodiments will be described with reference to the drawings. In the following description, the same or similar configurations may be designated by the same reference numerals and duplicate description may be omitted.

以下に示す実施形態では、製品の製造現場に導入されている、製品の良品/不良品の分類や装置の故障予知等を行う機械学習システムを一例として説明する。上記機械学習システムにおいては、製造現場に設けられたセンサ等から取得される複数の特徴についての時系列データを学習データとして学習モデルが生成される。ここでこうした学習モデルの性能(分類精度や故障予知精度等)を恒常的に確保しつつ効率よく学習モデルを生成するには、学習モデルの生成に用いる特徴を容易かつ適切に選択できるようにする必要がある。そこで本実施形態で説明する学習モデル生成支援装置100は、学習モデルの学習に用いる特徴の選択を支援する様々な情報(以下、「支援情報」と称する。)を提供する。 In the embodiment shown below, a machine learning system introduced at a product manufacturing site for classifying non-defective products / defective products and predicting device failures will be described as an example. In the machine learning system, a learning model is generated using time-series data about a plurality of features acquired from sensors or the like provided at the manufacturing site as learning data. Here, in order to efficiently generate a learning model while constantly ensuring the performance of such a learning model (classification accuracy, failure prediction accuracy, etc.), the features used for generating the learning model can be easily and appropriately selected. There is a need. Therefore, the learning model generation support device 100 described in the present embodiment provides various information (hereinafter, referred to as “support information”) that supports selection of features used for learning the learning model.

例えば、学習モデル生成支援装置100は、各特徴の変化を検知するための機械学習のモデルである変化検知モデルを、所定の変化検知手法(「Change Finder」、「One Class
SVM」等)により生成し、生成した変化検知モデルを用いて各特徴の変化の度合いを示す値である個別変化スコアを求め、また求めた個別変化スコアに基づき、各特徴の全体的な変化の度合いを示す値である全体変化スコアを求め、個別変化スコアや全体変化スコアに関する情報を支援情報として提供する。
For example, the learning model generation support device 100 uses a predetermined change detection method (“Change Finder”, “One Class”) for a change detection model, which is a machine learning model for detecting changes in each feature.
The individual change score, which is a value indicating the degree of change of each feature, is obtained by using the change detection model generated by SVM (etc.), and the overall change of each feature is calculated based on the obtained individual change score. The overall change score, which is a value indicating the degree, is obtained, and information on the individual change score and the overall change score is provided as support information.

また学習モデル生成支援装置100は、例えば、求めた全体変化スコアに寄与する特徴(以下、「寄与特徴」と称する。)に関する情報を支援情報として提供する。また学習モデル生成支援装置100は、例えば、その時系列データの変化が寄与特徴と相関の高い、寄与特徴以外の他の特徴(以下、「相関特徴」と称する。)に関する情報を支援情報として提供する。 Further, the learning model generation support device 100 provides, for example, information on a feature that contributes to the obtained overall change score (hereinafter, referred to as “contribution feature”) as support information. Further, the learning model generation support device 100 provides, for example, information on features other than the contribution features (hereinafter, referred to as “correlation features”) in which changes in the time-series data have a high correlation with the contribution features as support information. ..

尚、上記支援情報の提供に際し、学習モデル生成支援装置100は、学習に用いることが可能な特徴を、学習モデルの学習に利用した特徴であ利用特徴と学習モデルの学習に未利用の特徴である未利用特徴とに分類する。そして学習モデル生成支援装置100は、学習モデルの学習に用いた学習データの量(時系列データの長さ(期間))が十分である(予め設定された閾値以上である)ときは、個別変化スコアや全体変化スコアの算出に未利用特徴のみを用い、学習モデルの学習に用いた学習データの量が不十分である(上記閾値未満である)ときは、個別変化スコアや全体変化スコアの算出に利用特徴と未利用特徴の双方を用いる。 In providing the above support information, the learning model generation support device 100 uses features that can be used for learning as features that are used for learning the learning model and features that are not used for learning the learning model. Classify as a certain unused feature. Then, when the amount of learning data (length (period) of time-series data) used for learning the learning model is sufficient (greater than or equal to a preset threshold value), the learning model generation support device 100 changes individually. When only unused features are used to calculate the score and overall change score, and the amount of training data used for learning the learning model is insufficient (less than the above threshold), the individual change score and overall change score are calculated. Both used and unused features are used for.

図1に機械学習システム1の概略的な構成を示す。同図に示すように、機械学習システム1は、学習モデル生成支援装置100とデータ提供装置3とを含む。これらの装置は通信ネットワーク5を介して互いに通信可能に接続されている。通信ネットワーク5は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット
、専用線、公衆通信網(公衆電話網、携帯電話網等)である。
FIG. 1 shows a schematic configuration of the machine learning system 1. As shown in the figure, the machine learning system 1 includes a learning model generation support device 100 and a data providing device 3. These devices are communicably connected to each other via the communication network 5. The communication network 5 is, for example, a LAN (Local Area Network), a WAN (Wide Area Network), the Internet, a leased line, or a public communication network (public telephone network, mobile telephone network, etc.).

データ提供装置3は、製造現場(環境)に設けられた各種のセンサ等から取得される時系列データを、通信ネットワーク5を介して学習モデル生成支援装置100に随時送信する。尚、データ提供装置3としては、例えば、エッジコンピューティングにおけるエッジ側装置として機能するものが想定される。 The data providing device 3 transmits time-series data acquired from various sensors and the like provided at the manufacturing site (environment) to the learning model generation support device 100 at any time via the communication network 5. As the data providing device 3, for example, a device that functions as an edge-side device in edge computing is assumed.

学習モデル生成支援装置100は、データ提供装置3から送られてくる時系列データを学習データとして用いて学習モデルを生成するとともに上記支援情報の提供を行う。 The learning model generation support device 100 generates a learning model using the time-series data sent from the data providing device 3 as learning data, and also provides the above-mentioned support information.

図2に、学習モデル生成支援装置100やデータ提供装置3の実現に用いる情報処理装置のハードウェアの一例を示す。同図に示すように、例示する情報処理装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、及び通信装置16を備える。これらは図示しないバス等の通信手段を介して互いに通信可能に接続されている。情報処理装置10は、例えば、パーソナルコンピュータ、オフィスコンピュータ、メインフレーム等である。情報処理装置10は、例えば、クラウドシステムにより提供されるクラウドサーバのように仮想的な情報処理資源を用いて実現されるものであってもよい。 FIG. 2 shows an example of the hardware of the information processing device used to realize the learning model generation support device 100 and the data providing device 3. As shown in the figure, the illustrated information processing device 10 includes a processor 11, a main storage device 12, an auxiliary storage device 13, an input device 14, an output device 15, and a communication device 16. These are communicably connected to each other via a communication means such as a bus (not shown). The information processing device 10 is, for example, a personal computer, an office computer, a mainframe, or the like. The information processing device 10 may be realized by using virtual information processing resources such as a cloud server provided by a cloud system.

プロセッサ11は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、AI(Artificial Intelligence)チップ、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)等を用いて構成されている。 The processor 11 includes, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), a GPU (Graphics Processing Unit), an AI (Artificial Intelligence) chip, an FPGA (Field Programmable Gate Array), an ASIC (Application Specific Integrated Circuit), and the like. It is configured using.

主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
The main storage device 12 is a device that stores programs and data, and is, for example, a ROM (Read).
Only Memory), RAM (Random Access Memory), non-volatile memory (NVRAM (Non Volatile RAM)) and the like.

補助記憶装置13は、例えば、ハードディスクドライブ、SSD(Solid State Drive
)、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは主記憶装置12に随時読み込まれる。
入力装置14は、外部からの入力を受け付けるインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、音声入力装置等である。
The auxiliary storage device 13 is, for example, a hard disk drive or an SSD (Solid State Drive).
), Optical storage device (CD (Compact Disc), DVD (Digital Versatile Disc), etc.), storage system, IC card, reading / writing device for recording media such as SD card and optical recording medium, storage of cloud server Area etc. Programs and data can be read into the auxiliary storage device 13 via a reading device for a recording medium or a communication device 16. Programs and data stored (stored) in the auxiliary storage device 13 are read into the main storage device 12 at any time.
The input device 14 is an interface that accepts input from the outside, and is, for example, a keyboard, a mouse, a touch panel, a card reader, a voice input device, and the like.

出力装置15は、処理経過や処理結果等の各種情報を出力するインタフェースである。出力装置15は、例えば、上記の各種情報を可視化する表示装置(液晶モニタ、LCD(Liquid Crystal Display)、グラフィックカード等)、上記の各種情報を音声化する装置(音声出力装置(スピーカ等))、上記の各種情報を文字化する装置(印字装置等)である。尚、例えば、情報処理装置10が通信装置16を介して他の装置との間で情報の入力や出力を行う構成としてもよい。以下では、出力装置15は表示装置であるものとし、「出力」という場合は原則として「表示装置への表示」を意味するものとする。 The output device 15 is an interface that outputs various information such as processing progress and processing results. The output device 15 is, for example, a display device (liquid crystal monitor, LCD (Liquid Crystal Display), graphic card, etc.) that visualizes the above-mentioned various information, and a device (voice output device (speaker, etc.)) that visualizes the above-mentioned various information. , A device (printing device, etc.) that converts the above-mentioned various information into characters. In addition, for example, the information processing device 10 may be configured to input and output information to and from another device via the communication device 16. In the following, it is assumed that the output device 15 is a display device, and the term “output” means “display on the display device” in principle.

通信装置16は、他の装置との間の通信を実現する装置である。通信装置16は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット等の通信手
段を介した他の装置との間の通信を実現する有線方式又は無線方式の通信インタフェースであり、例えば、NIC(Network Interface Card)、無線通信モジュール、USB(Universal Serial Bus)モジュール、シリアル通信モジュール等である。
The communication device 16 is a device that realizes communication with other devices. The communication device 16 is a wired or wireless communication interface that realizes communication with other devices via communication means such as LAN (Local Area Network), WAN (Wide Area Network), and the Internet. , NIC (Network Interface Card), wireless communication module, USB (Universal Serial Bus) module, serial communication module and the like.

学習モデル生成支援装置100やデータ提供装置3の機能は、プロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、これらの装置を構成するハードウェア(AIチップ、FPGA、ASIC等)により実現される。 The functions of the learning model generation support device 100 and the data providing device 3 are performed by the processor 11 reading and executing a program stored in the main storage device 12, or by hardware (AI chip) constituting these devices. , FPGA, ASIC, etc.).

図1に示すように、学習モデル生成支援装置100は、記憶部110、学習データ管理部120、学習モデル管理部130、及び支援情報出力部140の各機能を有する。尚、学習モデル生成支援装置100は、上記の構成に加えて、例えば、デバイスドライバ、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)等をさらに備えていてもよい。 As shown in FIG. 1, the learning model generation support device 100 has each function of a storage unit 110, a learning data management unit 120, a learning model management unit 130, and a support information output unit 140. In addition to the above configuration, the learning model generation support device 100 may further include, for example, a device driver, an operating system, a file system, a DBMS (DataBase Management System), and the like.

上記機能のうち、記憶部110は、主記憶装置12や補助記憶装置13、或いは通信装置16を介して接続する外部の記憶装置等を記憶資源として用いることにより、学習データ111、学習モデル情報112、変化検知モデル情報113、及び特徴変化関連情報114の各情報を記憶する。記憶部110は、例えば、DBMSにより管理されるテーブルやファイルシステムが管理するファイルとして上記の各情報を記憶する。 Among the above functions, the storage unit 110 uses the main storage device 12, the auxiliary storage device 13, or an external storage device connected via the communication device 16 as a storage resource to obtain learning data 111 and learning model information 112. , Change detection model information 113, and feature change-related information 114 are stored. The storage unit 110 stores each of the above information as, for example, a table managed by the DBMS or a file managed by the file system.

学習データ管理部120は、データ取得部121及びデータ更新部122の各機能を有する。このうちデータ取得部121は、データ提供装置3からの学習データ111(時系列データ)の取得(受信)に関する各種の処理を行う。またデータ取得部121は、データ提供装置3と通信することにより、データ提供装置3からの時系列データの提供(送信)を特徴毎に制御する機能を有する。データ更新部122は、学習データ111の内容の更新等の学習データ111に関する各種の処理を行う。 The learning data management unit 120 has the functions of the data acquisition unit 121 and the data update unit 122. Of these, the data acquisition unit 121 performs various processes related to acquisition (reception) of learning data 111 (time-series data) from the data providing device 3. Further, the data acquisition unit 121 has a function of controlling the provision (transmission) of time series data from the data providing device 3 for each feature by communicating with the data providing device 3. The data update unit 122 performs various processes related to the learning data 111, such as updating the contents of the learning data 111.

学習モデル管理部130は、学習モデルの生成(学習)や評価、学習モデルの管理等を行う。同図に示すように、学習モデル管理部130は、特徴選択部131、学習モデル生成部132、学習モデル性能検証部133、及び学習モデル情報管理部134の各機能を有する。 The learning model management unit 130 generates (learns) and evaluates a learning model, manages the learning model, and the like. As shown in the figure, the learning model management unit 130 has the functions of the feature selection unit 131, the learning model generation unit 132, the learning model performance verification unit 133, and the learning model information management unit 134.

このうち特徴選択部131は、学習モデルの生成に用いる特徴の選択に関する処理を行う。学習モデル生成部132は、学習モデル情報112の生成に関する処理を行う。学習モデル性能検証部133は、学習モデルの性能(分類精度や故障予知精度等)が予め設定された基準を満たしているか否か評価に関する処理を行う。学習モデル情報管理部134は、学習モデル情報112の管理に関する処理を行う。 Of these, the feature selection unit 131 performs processing related to selection of features used for generating a learning model. The learning model generation unit 132 performs processing related to the generation of the learning model information 112. The learning model performance verification unit 133 performs processing related to evaluation of whether or not the performance of the learning model (classification accuracy, failure prediction accuracy, etc.) satisfies a preset standard. The learning model information management unit 134 performs processing related to management of the learning model information 112.

支援情報出力部140は、前述した変化検知モデルの生成、生成した変化検知モデルに基づく前述した個別変化スコアや全体変化スコアの算出や出力、前述した寄与特徴や相関特徴の特定や出力、前述した相関係数の出力等の処理を行う。同図に示すように、支援情報出力部140は、変化検知モデル生成部141、個別変化スコア算出部142、全体変化スコア算出部143、寄与特徴特定部144、相関特徴特定部145、情報出力部146、及び実行制御部147の各機能を有する。 The support information output unit 140 generates the change detection model described above, calculates and outputs the individual change score and the overall change score described above based on the generated change detection model, identifies and outputs the contribution feature and the correlation feature described above, and describes the above. Performs processing such as output of the correlation coefficient. As shown in the figure, the support information output unit 140 includes a change detection model generation unit 141, an individual change score calculation unit 142, an overall change score calculation unit 143, a contribution feature identification unit 144, a correlation feature identification unit 145, and an information output unit. It has each function of 146 and execution control unit 147.

このうち変化検知モデル生成部141は、変化検知モデルの生成に関する処理を行う。個別変化スコア算出部142は、個別変化スコアの算出に関する処理を行う。全体変化スコア算出部143は、全体変化スコアの算出に関する処理を行う。寄与特徴特定部144は、全体変化スコアに寄与する特徴である寄与特徴の特定に関する処理を行う。相関特徴特定部145は、寄与特徴に類似する特徴である相関特徴の特定に関する処理を行う。情報出力部146は、前述した支援情報である特徴変化関連情報114(全体変化スコア、寄与特徴、相関特徴、相関係数等)の生成や支援情報の提示に関する処理を行う。実行制御部147は、個別変化スコアの算出に関する処理や全体変化スコアの算出に関する処理について実行制御を行う。 Of these, the change detection model generation unit 141 performs processing related to generation of the change detection model. The individual change score calculation unit 142 performs processing related to the calculation of the individual change score. The overall change score calculation unit 143 performs processing related to the calculation of the overall change score. Contribution feature identification unit 144 performs processing related to identification of contribution features, which are features that contribute to the overall change score. The correlation feature identification unit 145 performs processing related to the identification of the correlation feature, which is a feature similar to the contribution feature. The information output unit 146 performs processing related to generation of feature change-related information 114 (overall change score, contribution feature, correlation feature, correlation coefficient, etc.), which is the support information described above, and presentation of support information. The execution control unit 147 performs execution control for processing related to the calculation of the individual change score and processing related to the calculation of the overall change score.

図3に学習データ111の一例を示す。同図に示すように、学習データ111は、特徴ID1111及び学習データ1112の各項目を有する一つ以上のレコードを含む。学習データ111の一つのレコードは一つの特徴に対応している。特徴ID1111には、特
徴ごとに付与される識別子である特徴IDが設定される。学習データ1112には、学習データの実体(時系列データ)が格納される。
FIG. 3 shows an example of the learning data 111. As shown in the figure, the learning data 111 includes one or more records having each item of the feature ID 1111 and the learning data 1112. One record of the training data 111 corresponds to one feature. A feature ID, which is an identifier assigned to each feature, is set in the feature ID 1111. The learning data 1112 stores the substance of the learning data (time series data).

図4に学習モデル情報112の一例を示す。学習モデル情報112には、学習モデルに関する情報が管理される。同図に示すように、学習モデル情報112は、学習モデルID1121、学習モデルパラメータ1122、利用特徴1123、学習データ量1124、性能検証情報1125、及び全体変化スコア1126の各項目を有する一つ以上のレコードを含む。学習モデル情報112の各レコードは、学習モデルID1121により特定される。 FIG. 4 shows an example of the learning model information 112. Information about the learning model is managed in the learning model information 112. As shown in the figure, the learning model information 112 is one or more items having each item of learning model ID 1121, learning model parameter 1122, usage feature 1123, learning data amount 1124, performance verification information 1125, and overall change score 1126. Includes records. Each record of the learning model information 112 is specified by the learning model ID 1121.

上記項目のうち、学習モデルID1121には、学習モデルの識別子である学習モデルIDが設定される。学習モデルパラメータ1122には、当該学習モデルのパラメータが設定される。利用特徴1123には、当該学習モデルの学習に利用した一つ以上の特徴(利用特徴)の特徴IDが設定される。学習データ量1124には、当該学習モデルの学習に用いた学習データの量(例えば、時系列データの長さ)が十分か否か(学習データの量が予め設定された閾値以上か当該閾値未満か)を示す情報が設定される。本例では、学習データの量が十分であるときは「十分」が、十分でないときは「不十分」が、学習データ量1124に設定される。 Among the above items, the learning model ID 1121, which is an identifier of the learning model, is set in the learning model ID 1121. The parameters of the learning model are set in the learning model parameter 1122. In the usage feature 1123, a feature ID of one or more features (usage features) used for learning the learning model is set. Whether or not the amount of training data used for learning the training model (for example, the length of time series data) is sufficient for the training data amount 1124 (the amount of training data is equal to or more than a preset threshold or less than the threshold). Information indicating (?) Is set. In this example, when the amount of training data is sufficient, "sufficient" is set, and when the amount is not sufficient, "insufficient" is set in the training data amount 1124.

性能検証情報1125は、全体変化スコアの算出に際し事前の当該学習モデルの性能の検証の要否を示す情報が設定される検証要否11251と、上記要否の判定に用いる閾値である判定閾値が設定される判定閾値11252の各項目を含む。 The performance verification information 1125 includes a verification necessity 11251 in which information indicating the necessity of verification of the performance of the learning model in advance is set when calculating the overall change score, and a determination threshold value which is a threshold value used for determining the necessity. Each item of the determination threshold value 11252 to be set is included.

全体変化スコア1126には、全体変化スコア(本例では全体変化スコアの時系列データ)に関する情報、もしくは上記情報の格納先(リンク先)を示す情報が設定される。 In the overall change score 1126, information on the overall change score (time-series data of the overall change score in this example) or information indicating a storage destination (link destination) of the above information is set.

図5に変化検知モデル情報113の一例を示す。変化検知モデル情報113には、変化検知モデルに関する情報が管理される。同図に示すように、変化検知モデル情報113は、学習モデルID1131、特徴ID1132、変化スコアタイプ1133、学習時利用有無1134、変化検知モデルID1135、及び変化検知モデルパラメータ1136の各項目を有する一つ以上のレコードを含む。変化検知モデル情報113の各レコードは、学習モデルID1131、特徴ID1132、及び変化スコアタイプ1133の組合せにより特定される。 FIG. 5 shows an example of the change detection model information 113. Information about the change detection model is managed in the change detection model information 113. As shown in the figure, the change detection model information 113 has one item having each item of learning model ID 1131, feature ID 1132, change score type 1133, use / non-use during learning 1134, change detection model ID 1135, and change detection model parameter 1136. Includes the above records. Each record of change detection model information 113 is identified by a combination of learning model ID 1131, feature ID 1132, and change score type 1133.

上記項目のうち、学習モデルID1131には、学習モデルIDが設定される。特徴ID1132には、特徴IDが設定される。変化スコアタイプ1133には、変化検知モデルの生成に用いる変化検知手法の種類を示す情報(「Change Finder」、「One Class SVM」等)である変化スコアタイプが設定される。学習時利用有無1134には、当該特徴が利用特徴であるか未利用特徴であるかを示す情報(本例では「利用」または「未利用」)が設定される。変化検知モデルID1135には、変化検知モデルの識別子である変化検知モデルIDが設定される。変化検知モデルパラメータ1136には、当該変化検知モデルのパラメータが設定される。 Among the above items, the learning model ID is set in the learning model ID 1131. A feature ID is set in the feature ID 1132. The change score type 1133 is set to a change score type that is information (“Change Finder”, “One Class SVM”, etc.) indicating the type of change detection method used to generate the change detection model. Information (“used” or “unused” in this example) indicating whether the feature is a used feature or an unused feature is set in the use / non-use 1134 during learning. A change detection model ID, which is an identifier of the change detection model, is set in the change detection model ID 1135. The parameter of the change detection model is set in the change detection model parameter 1136.

図6に特徴変化関連情報114の一例を示す。特徴変化関連情報114には、前述した特徴変化関連情報(全体変化スコア、寄与特徴、相関特徴、相関係数等)が設定される。同図に示すように、特徴変化関連情報114は、学習モデルID1141、特徴ID1142、変化スコアタイプ1143、及び関連情報1144(複数種類の関連情報♯1〜関連情報♯Mを含む)の各項目を有する一つ以上のレコードで構成される。特徴変化関連情報114の各レコードは、学習モデルID1141、特徴ID1142、及び変化スコアタイプ1143の組合せにより特定される。尚、本例では関連情報1144としてM種類
の情報を保持可能としているが、必ずしも全ての関連情報1144を用いなくてもよい。
FIG. 6 shows an example of the feature change related information 114. The feature change-related information (overall change score, contribution feature, correlation feature, correlation coefficient, etc.) described above is set in the feature change-related information 114. As shown in the figure, the feature change-related information 114 includes items of learning model ID 1141, feature ID 1142, change score type 1143, and related information 1144 (including a plurality of types of related information # 1 to related information #M). Consists of one or more records with. Each record of feature change related information 114 is identified by a combination of learning model ID 1141, feature ID 1142, and change score type 1143. In this example, M types of information can be held as the related information 1144, but it is not always necessary to use all the related information 1144.

上記項目のうち、学習モデルID1141には、学習モデルIDが設定される。特徴ID1142には特徴IDが設定される。変化スコアタイプ1143には、変化スコアタイプが設定される。関連情報1144には、特徴変化関連情報が設定される。 Among the above items, the learning model ID is set in the learning model ID 1141. A feature ID is set in the feature ID 1142. A change score type is set for the change score type 1143. Characteristic change-related information is set in the related information 1144.

続いて、学習モデル生成支援装置100が行う各種の処理についてフローチャートとともに説明する。 Subsequently, various processes performed by the learning model generation support device 100 will be described together with a flowchart.

図7は、学習モデルの生成に際し、学習モデル生成支援装置100が行う処理(以下、学習モデル生成処理S700と称する。)を説明するフローチャートである。以下、同図とともに学習モデル生成処理S700について説明する。尚、学習モデルの生成には、生成済みの学習モデル(以下、「既存の学習モデル」とも称する。)が、データ提供装置3から取得した新たな期間の学習データ(時系列データ)を用いて更新される場合も含む。 FIG. 7 is a flowchart illustrating a process (hereinafter, referred to as a learning model generation process S700) performed by the learning model generation support device 100 when the learning model is generated. Hereinafter, the learning model generation process S700 will be described with reference to the figure. In addition, in the generation of the learning model, the generated learning model (hereinafter, also referred to as “existing learning model”) uses the learning data (time series data) of a new period acquired from the data providing device 3. Including when it is updated.

同図に示すように、学習モデル管理部130の学習モデル生成部132は、学習モデルを生成するタイミングが到来したか否かを随時判定する(S711)。上記タイミングが到来したと判定すると(S711:YES)、学習モデル生成部132は、S712からの処理を行う。尚、上記タイミングは、例えば、学習モデル生成支援装置100がユーザから学習モデルの生成指示を受け付けた場合に到来する。また上記タイミングは、例えば、学習データ管理部120が、データ提供装置3から新たな学習データ(所定期間分の時系列データ等)を取得した場合に到来する。 As shown in the figure, the learning model generation unit 132 of the learning model management unit 130 determines at any time whether or not the timing for generating the learning model has arrived (S711). When it is determined that the above timing has arrived (S711: YES), the learning model generation unit 132 performs the process from S712. The above timing comes, for example, when the learning model generation support device 100 receives a learning model generation instruction from the user. Further, the above timing comes, for example, when the learning data management unit 120 acquires new learning data (time-series data for a predetermined period, etc.) from the data providing device 3.

S712では、特徴選択部131が、学習モデルの生成に用いる特徴を選択する。上記の選択は、例えば、選択する特徴の特徴IDを予め学習モデル生成支援装置100に格納しておき、これを参照することにより行ってもよいし、例えば、学習データ111の内容を表示してユーザに選択させるようにしてもよい。尚、ユーザは、例えば、学習モデル生成支援装置100が提示する支援情報を参照した上で学習モデルの生成に用いる特徴を選択する。また所定の情報(学習モデルの生成に用いた特徴や学習モデルの精度についての履歴情報等)に基づき特徴選択部131が自動的に特徴を選択するようにしてもよい。 In S712, the feature selection unit 131 selects the feature to be used for generating the learning model. The above selection may be performed, for example, by storing the feature ID of the feature to be selected in the learning model generation support device 100 in advance and referring to the feature ID, or by displaying the contents of the learning data 111, for example. You may let the user choose. The user selects, for example, a feature to be used for generating the learning model with reference to the support information presented by the learning model generation support device 100. Further, the feature selection unit 131 may automatically select features based on predetermined information (features used for generating the learning model, history information about the accuracy of the learning model, etc.).

続いて、学習モデル生成部132は、選択した特徴の学習データ111に基づき学習モデルを生成する(S713)。学習モデル生成部132は、所定の機械学習のアルゴリズム(決定木、SVM(Support Vector Machine)、ニューラルネットワーク等)を用いて
学習モデルを生成する。
Subsequently, the learning model generation unit 132 generates a learning model based on the learning data 111 of the selected feature (S713). The learning model generation unit 132 generates a learning model using a predetermined machine learning algorithm (decision tree, SVM (Support Vector Machine), neural network, etc.).

続いて、記憶部110が、生成した学習モデルに関する情報を学習モデル情報112として記憶する(S714)。具体的には、記憶部110は、生成した学習モデルのパラメータを学習モデル情報112の学習モデルパラメータ1122として、また学習モデルの生成に用いた特徴の特徴IDを利用特徴1123として、学習モデル情報112に格納する。尚、このように学習モデルの生成に用いた特徴の特徴IDが利用特徴1123として学習モデル情報112に管理されることで、各特徴の学習データが、利用特徴の学習データと未利用特徴の学習データとに分類されて管理される。 Subsequently, the storage unit 110 stores the generated information about the learning model as the learning model information 112 (S714). Specifically, the storage unit 110 uses the generated learning model parameter as the learning model parameter 1122 of the learning model information 112, and the feature ID of the feature used for generating the learning model as the utilization feature 1123, and uses the learning model information 112. Store in. In this way, the feature ID of the feature used to generate the learning model is managed in the learning model information 112 as the usage feature 1123, so that the learning data of each feature is the learning data of the usage feature and the learning of the unused feature. It is classified and managed as data.

図8は、学習モデル生成処理S700において生成された学習モデルについて、各特徴の変化検知モデルを生成する処理(以下、変化検知モデル生成処理S800と称する。)を説明するフローチャートである。変化検知モデル生成処理S800は、例えば、学習モデル生成処理S700が実行された後に実行される。以下、同図とともに変化検知モデル生成処理S800について説明する。 FIG. 8 is a flowchart illustrating a process of generating a change detection model of each feature (hereinafter, referred to as a change detection model generation process S800) for the learning model generated in the learning model generation process S700. The change detection model generation process S800 is executed, for example, after the learning model generation process S700 is executed. Hereinafter, the change detection model generation process S800 will be described with reference to the figure.

まず学習モデル性能検証部133が、学習モデル生成処理S700で生成された学習モデルの学習モデル情報112の学習データ量1124の値に基づき、変化検知モデルの生成に用いる特徴の範囲(未利用特徴のみか、利用特徴と未利用特徴の双方か)を決定する(S811〜S813)。 First, the range of features used by the learning model performance verification unit 133 to generate a change detection model based on the value of the learning data amount 1124 of the learning model information 112 of the learning model generated by the learning model generation process S700 (unused features only). Or both the used feature and the unused feature) (S811 to S813).

学習データ量1124に「十分」が設定されている場合(S811:十分)、学習モデル性能検証部133は、変化検知モデルの生成に用いる特徴の範囲を、未利用特徴の学習データのみと決定する(S812)。一方、学習データ量1124に「不十分」が設定されている場合(S811:不十分)、学習モデル性能検証部133は、変化検知モデルの生成に用いる特徴の範囲を、未利用特徴の学習データと利用特徴の学習データの双方と決定する(S813)。 When "sufficient" is set in the training data amount 1124 (S811: sufficient), the learning model performance verification unit 133 determines that the range of features used for generating the change detection model is only the training data of unused features. (S812). On the other hand, when "insufficient" is set in the training data amount 1124 (S811: insufficient), the learning model performance verification unit 133 sets the range of features used for generating the change detection model to the learning data of unused features. And the learning data of the usage characteristics are both determined (S813).

S814からの処理は、S812またはS813で決定した範囲の利用特徴または未利用特徴を順次選択しつつ繰り返されるループ処理である。 The process from S814 is a loop process that is repeated while sequentially selecting the used or unused features in the range determined in S812 or S813.

まず変化検知モデル生成部141は、決定した範囲の特徴のうち上記ループ処理で未選択の特徴の一つを選択する(S814)。 First, the change detection model generation unit 141 selects one of the features in the determined range that has not been selected by the loop processing (S814).

続いて、変化検知モデル生成部141が、選択中の特徴について、先行して実行された学習モデル生成処理S700で用いた学習データ(時系列データ)の期間(以下、「学習期間」と称する。)における当該選択中の特徴についての学習データ(時系列データ)を、変化検知手法(ここでは「Change Finder」であるとする。)に入力することにより、
選択中の特徴の変化検知モデルを生成する(S815)。具体的には、選択中の特徴が未利用特徴である場合、変化検知モデル生成部141は、当該未利用特徴の上記学習期間における学習データ(時系列データ)を上記変化検知手法に入力することにより、選択中の特徴の変化検知モデルを生成する。また選択中の特徴が利用特徴である場合、変化検知モデル生成部141は、当該利用特徴の上記学習期間における学習データ(時系列データ)を上記変化検知手法に入力することにより、選択中の特徴の変化検知モデルを生成する。
Subsequently, the change detection model generation unit 141 refers to the selected feature as a period of learning data (time series data) used in the learning model generation process S700 executed in advance (hereinafter, referred to as a “learning period”. ), By inputting the learning data (time series data) about the selected feature into the change detection method (here, it is assumed to be "Change Finder").
A change detection model of the selected feature is generated (S815). Specifically, when the selected feature is an unused feature, the change detection model generation unit 141 inputs the learning data (time series data) of the unused feature in the learning period into the change detection method. Generates a change detection model for the selected feature. When the feature being selected is a usage feature, the change detection model generation unit 141 inputs the learning data (time series data) of the usage feature in the learning period into the change detection method, so that the feature being selected is selected. Generate a change detection model for.

続いて、記憶部110が、生成された変化検知モデルの情報を変化検知モデル情報113として記憶する(S816)。具体的には、記憶部110は、生成された変化検知モデルのパラメータを変化検知モデル情報113の変化検知モデルパラメータ1136に、選択中の特徴の特徴IDを特徴ID1132に、生成に用いた変化検知手法(「Change Finder」)を変化スコアタイプ1133に、夫々設定した変化検知モデル情報113を記憶
する。
Subsequently, the storage unit 110 stores the generated change detection model information as the change detection model information 113 (S816). Specifically, the storage unit 110 sets the parameters of the generated change detection model in the change detection model parameter 1136 of the change detection model information 113, the feature ID of the selected feature in the feature ID 1132, and the change detection used for generation. The change detection model information 113 in which the method (“Change Finder”) is set in the change score type 1133 is stored.

続いて、個別変化スコア算出部142が、生成された変化検知モデルに上記学習期間における学習データ(時系列データ)を適用することにより、上記学習期間における個別変化スコアの最大値を求める(S817)。尚、この最大値は全体変化スコアの算出に用いられる。 Subsequently, the individual change score calculation unit 142 obtains the maximum value of the individual change score in the learning period by applying the learning data (time series data) in the learning period to the generated change detection model (S817). .. This maximum value is used to calculate the overall change score.

続いて、記憶部110が、上記の最大値を特徴変化関連情報114として記憶する(S818)。具体的には、記憶部110は、先行して実行された学習モデル生成処理S700で生成された学習モデルの学習モデルIDを学習モデルID1141に、選択中の特徴の特徴IDを特徴ID1142に、生成に用いた変化検知手法(ここでは「Change Finder」)を変化スコアタイプ1143に、求めた個別変化スコアの最大値を関連情報114
4に、夫々設定した特徴変化関連情報114を記憶する。
Subsequently, the storage unit 110 stores the above maximum value as the feature change-related information 114 (S818). Specifically, the storage unit 110 generates the learning model ID of the learning model generated in the learning model generation process S700 executed in advance in the learning model ID 1141 and the feature ID of the selected feature in the feature ID 1142. The change detection method used in (here, "Change Finder") is set to change score type 1143, and the maximum value of the obtained individual change score is set to related information 114.
In 4, the feature change-related information 114 set respectively is stored.

続いて、個別変化スコア算出部142は、S817において変化検知モデルのパラメータが更新されているか否かを判定し、更新されていれば変化検知モデル情報113を上記
更新後の内容に更新する(S819)。尚、上記更新は、変化検知モデルに用いられている変化検知手法が変化検知モデルの更新機能を備えている場合に行われる。本例で取り上げる「Change Finder」は上記更新機能を備えているため、変化検知モデルのパラメータ
が更新されていれば変化検知モデル情報113が更新される。
Subsequently, the individual change score calculation unit 142 determines in S817 whether or not the parameters of the change detection model have been updated, and if updated, updates the change detection model information 113 to the updated contents (S819). ). The above update is performed when the change detection method used in the change detection model has a change detection model update function. Since the "Change Finder" taken up in this example has the above-mentioned update function, the change detection model information 113 is updated if the parameters of the change detection model are updated.

続いて、個別変化スコア算出部142は、S812またはS813で決定した範囲の全ての特徴をS814で選択済か否かを判定する(S820)。全ての特徴を選択済でない場合(S820:NO)、処理はS814に戻り、未選択の特徴についてループ処理が繰り返し実行される。全ての特徴を選択済である場合(S820:YES)、変化検知モデル生成処理S800は終了する。 Subsequently, the individual change score calculation unit 142 determines whether or not all the features in the range determined in S812 or S813 have been selected in S814 (S820). If all the features have not been selected (S820: NO), the process returns to S814, and the loop process is repeatedly executed for the unselected features. When all the features have been selected (S820: YES), the change detection model generation process S800 ends.

図9は、既存の学習モデルについて随時行われる処理(以下、「全体変化スコア算出処理S900」と称する。)を説明するフローチャートである。以下、同図とともに全体変化スコア算出処理S900について説明する。尚、以下では、学習モデルの一つ(以下、「対象学習モデル」と称する。)に注目して説明する。 FIG. 9 is a flowchart illustrating a process (hereinafter, referred to as “overall change score calculation process S900”) that is performed at any time for the existing learning model. Hereinafter, the overall change score calculation process S900 will be described with reference to the figure. In the following, one of the learning models (hereinafter, referred to as “target learning model”) will be focused on and described.

まず実行制御部147が、学習モデル情報112の対象学習モデルの性能検証情報1125の検証要否を参照し、対象学習モデルについて事前の性能評価が必要か否かを判定する(S911)。尚、性能検証情報1125の内容は、例えば、ユーザにより手動設定される。 First, the execution control unit 147 refers to the verification necessity of the performance verification information 1125 of the target learning model of the learning model information 112, and determines whether or not the performance evaluation of the target learning model is necessary in advance (S911). The content of the performance verification information 1125 is manually set by the user, for example.

対象学習モデルについて事前の性能評価は不要と判定した場合(S911:不要)、実行制御部147はS913からの処理を開始する。一方、対象学習モデルについて性能評価が必要と判定した場合(S911:必要)、実行制御部147は、対象学習モデルの性能を示す指標値(例えば分類精度)が対象学習モデルの性能検証情報1125の判定閾値未満となっているか否かを随時判定し、上記指標値が上記判定閾値未満であると判定すると(S912:YES)、S913からの処理を開始する。尚、上記指標値は、例えば、データ提供装置3から随時提供される情報に基づき求められる。 When it is determined that the performance evaluation in advance is unnecessary for the target learning model (S911: unnecessary), the execution control unit 147 starts the process from S913. On the other hand, when it is determined that the performance evaluation of the target learning model is necessary (S911: necessary), the execution control unit 147 has an index value (for example, classification accuracy) indicating the performance of the target learning model of the performance verification information 1125 of the target learning model. Whether or not it is less than the determination threshold value is determined at any time, and when it is determined that the index value is less than the determination threshold value (S912: YES), the process from S913 is started. The index value is obtained, for example, based on information provided from the data providing device 3 at any time.

S913では、支援情報出力部140は、学習モデル情報112の学習データ量1124の値に基づき、対象学習モデルの学習に用いた学習データの量が十分であったか否かを判定する。支援情報出力部140が対象学習モデルの学習に用いた学習データの量が十分であったと判定すると(S913:十分)、個別変化スコア算出部142が、各未利用特徴について個別変化スコアを算出する(S914)。一方、支援情報出力部140が対象学習モデルの学習に用いた学習データの量が十分でなかったと判定すると(S913:不十分)、個別変化スコア算出部142が、各未利用特徴と各利用特徴の双方について個別変化スコアを算出する(S915)。尚、S914及びS915のいずれの処理においても、個別変化スコアは、各特徴について生成された変化検知モデルを用いて求められる。 In S913, the support information output unit 140 determines whether or not the amount of learning data used for learning the target learning model is sufficient based on the value of the learning data amount 1124 of the learning model information 112. When the support information output unit 140 determines that the amount of training data used for learning the target learning model is sufficient (S913: sufficient), the individual change score calculation unit 142 calculates the individual change score for each unused feature. (S914). On the other hand, when the support information output unit 140 determines that the amount of training data used for learning the target learning model is not sufficient (S913: insufficient), the individual change score calculation unit 142 determines each unused feature and each usage feature. The individual change score is calculated for both of the above (S915). In any of the processes of S914 and S915, the individual change score is obtained by using the change detection model generated for each feature.

S916では、支援情報出力部140は、S914またはS915の処理において変化検知モデルのパラメータが更新されているか否かを判定し、更新されていれば変化検知モデル情報113を上記更新後の内容に更新する。尚、上記更新は、変化検知モデルに用いられている変化検知手法が変化検知モデルの更新機能を備えている場合に行われる。本例で取り上げる「Change Finder」は上記更新機能を備えているため、変化検知モデルのパ
ラメータが更新されていれば変化検知モデル情報113が更新される。
In S916, the support information output unit 140 determines whether or not the parameters of the change detection model have been updated in the processing of S914 or S915, and if updated, updates the change detection model information 113 to the updated contents. To do. The above update is performed when the change detection method used in the change detection model has a change detection model update function. Since the "Change Finder" taken up in this example has the above-mentioned update function, the change detection model information 113 is updated if the parameters of the change detection model are updated.

続いて、個別変化スコア算出部142が、S818で求めた最大値とS914またはS915で求めた個別変化スコアとに基づき全体変化スコアを求め、求めた全体変化スコアを学習モデル情報112の全体変化スコア1126として記憶する(S917)。 Subsequently, the individual change score calculation unit 142 obtains the overall change score based on the maximum value obtained in S818 and the individual change score obtained in S914 or S915, and obtains the obtained overall change score as the overall change score of the learning model information 112. It is stored as 1126 (S917).

尚、本実施形態では、全体変化スコア算出処理S900はデータ提供装置3から所定量の新たな学習データ(時系列データ)を受信するたびに繰り返し実行され、それにより生成される全体変化スコアの時系列データが全体変化スコア1126として記憶されるものとする。 In the present embodiment, the overall change score calculation process S900 is repeatedly executed every time a predetermined amount of new learning data (time series data) is received from the data providing device 3, and when the overall change score is generated thereby. It is assumed that the series data is stored as the overall change score 1126.

図10に変化検知方法が「Change Finder」であるときの全体変化スコアの算出方法の
一例を示す。同図に示すように、本例の場合、個別変化スコア算出部142が、各特徴の時系列データに基づき各特徴の個別変化スコアを求め、全体変化スコア算出部143が、各個別変化スコアに基づき全体変化スコアを求める。
FIG. 10 shows an example of a method of calculating the overall change score when the change detection method is “Change Finder”. As shown in the figure, in the case of this example, the individual change score calculation unit 142 obtains the individual change score of each feature based on the time series data of each feature, and the overall change score calculation unit 143 determines each individual change score. Calculate the overall change score based on this.

具体的には、個別変化スコア算出部142が、各特徴について、既存の学習モデルの学習データ(時系列データ)の学習期間よりも後の新たな期間に取得された学習データ(時系列データ)を夫々の変化検知モデルに適用することにより、上記新たな期間における個別変化スコアを求める。そして全体変化スコア算出部143が、各特徴について、夫々の個別変化スコアと夫々についてS817で求めた夫々の最大値とを比較し、新たな期間における個別変化スコアが最大値以上である特徴の総数を全体変化スコアとして求める。 Specifically, the learning data (time-series data) acquired by the individual change score calculation unit 142 in a new period after the learning period of the learning data (time-series data) of the existing learning model for each feature. Is applied to each change detection model to obtain the individual change score in the above new period. Then, the overall change score calculation unit 143 compares the individual change score of each feature with the maximum value of each obtained in S817 for each feature, and the total number of features whose individual change score in the new period is equal to or more than the maximum value. Is calculated as the overall change score.

尚、全体変化スコアの算出方法は必ずしも以上の方法に限定されない。例えば、各特徴に重みづけを行った上で合計した値を全体変化スコアとしてもよい。 The method of calculating the overall change score is not necessarily limited to the above method. For example, each feature may be weighted and the total value may be used as the overall change score.

図9に戻り、続いて、寄与特徴特定部144が、新たな期間における個別変化スコアがS817で求めた夫々の最大値以上である特徴を寄与特徴として特定し、特定した寄与特徴に関する情報を記憶する(S918)。より詳細には、寄与特徴特定部144は、特徴変化関連情報114の寄与特徴の特徴IDの関連情報1144に当該特徴が寄与特徴であることを示す情報を設定する。尚、本例では、前述したように全体変化スコアが時系列データとして記憶されるので、寄与特徴を示す情報についても時系列データとして記憶される。 Returning to FIG. 9, the contribution feature identification unit 144 identifies the feature whose individual change score in the new period is equal to or higher than the maximum value obtained in S817 as the contribution feature, and stores the information on the identified contribution feature. (S918). More specifically, the contributing feature identification unit 144 sets information indicating that the feature is a contributing feature in the related information 1144 of the feature ID of the contributing feature of the feature change related information 114. In this example, since the overall change score is stored as time-series data as described above, the information indicating the contributing feature is also stored as time-series data.

続いて、相関特徴特定部145が、寄与特徴と寄与特徴以外の他の特徴の間の相関(相関係数)を求め、両者の類似度(相関係数)が予め設定された閾値以上である他の特徴を相関特徴として特定し、特定した相関特徴を示す情報を記憶する(S919)。より詳細には、相関特徴特定部145は、特徴変化関連情報114の寄与特徴の特徴IDの関連情報1144に当該特徴が相関特徴であることを示す情報を設定する。本例では、前述したように全体変化スコアが時系列データとして記憶されるので、相関特徴を示す情報ついても時系列データとして記憶される。 Subsequently, the correlation feature identification unit 145 obtains the correlation (correlation coefficient) between the contributing feature and other features other than the contributing feature, and the degree of similarity (correlation coefficient) between the two is equal to or higher than a preset threshold value. Other features are specified as correlation features, and information indicating the identified correlation features is stored (S919). More specifically, the correlation feature identification unit 145 sets information indicating that the feature is a correlation feature in the related information 1144 of the feature ID of the contributing feature of the feature change related information 114. In this example, since the overall change score is stored as time-series data as described above, the information indicating the correlation feature is also stored as time-series data.

図11は、情報出力部146が、指定された学習モデルについての支援情報を提示する処理(以下、「支援情報提示処理S1100」と称する。)を説明するフローチャートである。以下、同図とともに支援情報提示処理S1100について説明する。 FIG. 11 is a flowchart illustrating a process in which the information output unit 146 presents support information for the designated learning model (hereinafter, referred to as “support information presentation process S1100”). Hereinafter, the support information presentation process S1100 will be described with reference to the figure.

まず情報出力部146は、学習モデル(学習モデルID)の指定をユーザから受け付ける(S1111)。 First, the information output unit 146 accepts the designation of the learning model (learning model ID) from the user (S1111).

続いて、情報出力部146は、指定された学習モデルについて、全体変化スコアに関する情報(全体変化スコアの時系列データ等)を表示する(S1112)。 Subsequently, the information output unit 146 displays information on the overall change score (time-series data of the overall change score, etc.) for the designated learning model (S1112).

続いて、情報出力部146は、指定された学習モデルについて、寄与特徴に関する情報(寄与特徴の時系列データ等)を表示する(S1113)。 Subsequently, the information output unit 146 displays information on the contributing features (time-series data of the contributing features, etc.) for the designated learning model (S1113).

続いて、情報出力部146は、指定された学習モデルについて、相関特徴に関する情報
(相関特徴の時系列データや相関特徴の相関係数等)を表示する(S1114)。
Subsequently, the information output unit 146 displays information on the correlation feature (time series data of the correlation feature, the correlation coefficient of the correlation feature, etc.) for the designated learning model (S1114).

尚、例えば、情報出力部146が、期間の指定をユーザから受け付け、受け付けた期間に対応する支援情報(全体変化スコアの時系列データ、寄与特徴の時系列データ、相関係数、相関特徴の時系列データ等)を表示するようにしてもよい。また情報出力部146が、寄与特徴や相関特徴の一覧を表示してユーザに選択を促し、ユーザが選択した寄与特徴や相関特徴に関する情報のみを表示するようにしてもよい。また情報出力部146が、全体変化スコアへの寄与度の高い(例えば変化スコアが最大値を超える回数の多い)寄与特徴を優先表示(ソートやフィルタリング等して表示、上位所定数まで表示等)するようにしてもよい。また情報出力部146が、相関の高い(相関係数の大きな)相関特徴を優先表示(ソートやフィルタリング等して表示、上位所定数まで表示等)するようにしてもよい。 For example, when the information output unit 146 receives the designation of the period from the user and the support information corresponding to the accepted period (time series data of the overall change score, time series data of the contribution feature, the correlation coefficient, and the correlation feature). Series data, etc.) may be displayed. Further, the information output unit 146 may display a list of contribution features and correlation features to prompt the user to make a selection, and display only information on the contribution features and correlation features selected by the user. In addition, the information output unit 146 preferentially displays the contribution features that have a high degree of contribution to the overall change score (for example, the change score exceeds the maximum value many times) (display by sorting, filtering, etc., displaying up to a predetermined number, etc.) You may try to do it. Further, the information output unit 146 may preferentially display (display by sorting, filtering, etc., display up to a predetermined number of higher ranks, etc.) the correlation features having a high correlation (large correlation coefficient).

図12は、図11の支援情報提示処理S1100に際して情報出力部146が表示する画面(以下、「支援情報提示画面1200」と称する。)の一例である。同図に示すように、支援情報提示画面1200は、変化スコアタイプの表示欄1211、全体変化スコアの表示欄1212、寄与特徴の表示欄1213、及び相関係数及び相関特徴の表示欄1214を有する。 FIG. 12 is an example of a screen (hereinafter referred to as “support information presentation screen 1200”) displayed by the information output unit 146 in the support information presentation process S1100 of FIG. As shown in the figure, the support information presentation screen 1200 has a change score type display field 1211, an overall change score display field 1212, a contribution feature display field 1213, and a correlation coefficient and correlation feature display field 1214. ..

変化スコアタイプの表示欄1211には、変化スコアタイプの種類を示す情報が表示される。全体変化スコアの表示欄1212には、全体変化スコアの時系列データが表示される。寄与特徴の表示欄1213には、寄与特徴の時系列データが表示される。相関係数及び相関特徴の表示欄1214には、相関特徴の時系列データや相関係数が表示される。 Information indicating the type of change score type is displayed in the change score type display field 1211. Time-series data of the overall change score is displayed in the display column 1212 of the overall change score. In the contribution feature display column 1213, time-series data of the contribution feature is displayed. In the correlation coefficient and correlation feature display column 1214, time series data and correlation coefficient of the correlation feature are displayed.

[変化検知手法の他の例]
ところで、以上では、変化検知モデルの生成に変化検知手法(変化スコアタイプ)として「Change Finder」を用いる場合を例として説明したが、例えば変化検知手法として「One Class SVM」を用いて変化検知モデルを生成することもできる。
[Other examples of change detection methods]
By the way, in the above, the case where "Change Finder" is used as the change detection method (change score type) is described as an example for generating the change detection model. For example, the change detection model is used by using "One Class SVM" as the change detection method. Can also be generated.

図13は、「One Class SVM」を用いた場合の変化検知モデルの生成方法を説明する図
である。同図はある特徴についての時系列データのグラフであり、横軸は時間、縦軸は特徴の指標値(特徴量)である。同図に示す学習期間は、既存の学習モデルの学習に用いた学習データ(時系列データ)の期間である。
FIG. 13 is a diagram illustrating a method of generating a change detection model when "One Class SVM" is used. The figure is a graph of time series data for a certain feature, the horizontal axis is time, and the vertical axis is the index value (feature amount) of the feature. The learning period shown in the figure is the period of the learning data (time series data) used for learning the existing learning model.

変化検知モデルの生成に際し、変化検知モデル生成部141は、上記学習期間の時系列データに基づき変化検知モデルの生成に用いる学習データを生成する。同図の例は、ベクトルのサイズを「4」とした場合であり、このサイズで時間軸に沿って設けたウィンドウを単位時間ごとにシフトしていくことにより、[5,1,3,2]、[1,3,2,4]、[3,2,4,4]、[2,4,4,3]といったベクトルを得ることができる。変化検知モデル生成部141は、各特徴について得られるこれらのベクトルを学習データとして「One Class SVM」の学習アルゴリズムに適用することにより各特徴の変化検知モデル
を生成する。
When generating the change detection model, the change detection model generation unit 141 generates learning data to be used for generating the change detection model based on the time series data of the learning period. The example in the figure is the case where the vector size is "4", and by shifting the windows provided along the time axis with this size every unit time, [5, 1, 3, 2 ], [1,3,2,4], [3,2,4,4], [2,4,4,3] and the like can be obtained. The change detection model generation unit 141 generates a change detection model for each feature by applying these vectors obtained for each feature to the learning algorithm of “One Class SVM” as learning data.

尚、生成した変換検知モデルは、データ提供装置3から取得した新たな学習データに基づくベクトルを与えると、新たな学習データに上記学習期間における時系列データの態様(概形)に類似する時系列データの態様(概形)が存在するか否かを示す情報を出力する。そこで例えば、全体変化スコア算出部143は、上記の情報に基づく値(例えば、類似する(類似度が予め設定された閾値以上である)場合は「0」、類似しない(類似度が予め設定された上記閾値未満である)場合は「1」とする)を個別変化スコアとし、各特徴について得られる上記の値を合計することにより全体変化スコアを求める。 When the generated conversion detection model is given a vector based on the new learning data acquired from the data providing device 3, the new training data is given a time series similar to the mode (scheme) of the time series data in the learning period. Outputs information indicating whether or not the aspect (outline form) of the data exists. Therefore, for example, the overall change score calculation unit 143 sets the value based on the above information to "0" when it is similar (for example, the similarity is equal to or higher than a preset threshold value), and dissimilar (the similarity is preset). If it is less than the above threshold value, it is set to "1"), and the total change score is obtained by summing the above values obtained for each feature.

図14は、変化検知手法(変化スコアタイプ)として「One Class SVM」を用いた場合
における、学習モデル生成処理S700で生成された学習モデルについての変化検知モデルを生成する処理(以下、変化検知モデル生成処理S1400と称する。)を説明するフローチャートである。変化検知モデル生成処理S1400は、例えば、学習モデル生成処理S700が実行された後に実行される。以下、同図とともに変化検知モデル生成処理S1400について説明する。
FIG. 14 shows a process of generating a change detection model for the learning model generated by the learning model generation process S700 when “One Class SVM” is used as the change detection method (change score type) (hereinafter, change detection model). It is a flowchart explaining the generation process S1400). The change detection model generation process S1400 is executed, for example, after the learning model generation process S700 is executed. Hereinafter, the change detection model generation process S1400 will be described with reference to the figure.

同図に示すS1411〜S1413の処理は、図8のS811〜S813の処理と同様であるので説明を省略する。 Since the processes of S141 to S1413 shown in the figure are the same as the processes of S811 to S813 of FIG. 8, the description thereof will be omitted.

S1414からの処理は、S1412またはS1413で決定した範囲の特徴を順次選択しつつ繰り返されるループ処理である。 The process from S1414 is a loop process that is repeated while sequentially selecting the features in the range determined in S1412 or S1413.

S1414では、変化検知モデル生成部141は、決定した範囲の特徴のうち上記ループ処理で未選択の特徴の一つを選択する。 In S1414, the change detection model generation unit 141 selects one of the features in the determined range that has not been selected by the loop processing.

続いて、変化検知モデル生成部141は、選択中の特徴について、学習モデル生成処理S700における学習データ(時系列データ)の学習期間における当該特徴の学習データ(時系列データ)を「One Class SVM」に適用することにより、変化検知モデルを生成す
る(S1415)。具体的には、選択中の特徴が未利用特徴である場合、変化検知モデル生成部141は、当該未利用特徴の上記学習期間における学習データ(時系列データ)を「One Class SVM」に適用することにより、選択中の特徴についての変化検知モデルを生
成する。また選択中の特徴が利用特徴である場合、変化検知モデル生成部141は、当該利用特徴の上記学習期間における学習データ(時系列データ)を「One Class SVM」に適
用することにより、選択中の特徴についての変化検知モデルを生成する。
Subsequently, the change detection model generation unit 141 sets the learning data (time series data) of the selected feature in the learning period of the learning data (time series data) in the learning model generation process S700 as “One Class SVM”. A change detection model is generated by applying to (S1415). Specifically, when the selected feature is an unused feature, the change detection model generation unit 141 applies the learning data (time series data) of the unused feature in the learning period to the "One Class SVM". By doing so, a change detection model for the selected feature is generated. When the selected feature is a usage feature, the change detection model generation unit 141 applies the learning data (time series data) of the usage feature in the learning period to the "One Class SVM" to select the feature. Generate a change detection model for features.

続いて、記憶部110が、変化検知モデル生成部141が生成した変化検知モデルの情報を変化検知モデル情報113として記憶する(S1416)。具体的には、記憶部110は、変化検知モデル生成部141が生成した変化検知モデルのパラメータを変化検知モデル情報113の変化検知モデルパラメータ1136として、選択中の特徴の特徴IDを特徴ID1132として、生成に用いた変化検知手法である「One Class SVM」を変化ス
コアタイプ1133として、夫々設定した変化検知モデル情報113を記憶する。
Subsequently, the storage unit 110 stores the information of the change detection model generated by the change detection model generation unit 141 as the change detection model information 113 (S1416). Specifically, the storage unit 110 uses the parameter of the change detection model generated by the change detection model generation unit 141 as the change detection model parameter 1136 of the change detection model information 113, and the feature ID of the selected feature as the feature ID 1132. The change detection model information 113 set in each case is stored with the change detection method "One Class SVM" used for generation as the change score type 1133.

S1420では、個別変化スコア算出部142は、S1412またはS1413で決定した範囲の全ての特徴をS1414で選択済か否かを判定する。全ての特徴を選択済でない場合(S1420:NO)、処理はS1414に戻り、未選択の特徴についてループ処理が繰り返し実行される。全ての特徴を選択済である場合(S1420:YES)、変化検知モデル生成処理S1400は終了する。 In S1420, the individual change score calculation unit 142 determines whether or not all the features in the range determined in S1412 or S1413 have been selected in S1414. If all the features have not been selected (S1420: NO), the process returns to S1414, and the loop process is repeatedly executed for the unselected features. When all the features have been selected (S1420: YES), the change detection model generation process S1400 ends.

図15は、変化検知手法(変化スコアタイプ)として「One Class SVM」を用いた場合
における、既存の各学習モデルについて随時行われる処理(以下、「全体変化スコア算出処理S1500」と称する。)を説明するフローチャートである。尚、基本的な処理の流れは図9の全体変化スコア算出処理S900と同様であるので、以下、相違点を中心に説明する。
FIG. 15 shows a process (hereinafter, referred to as “overall change score calculation process S1500”) performed at any time for each existing learning model when “One Class SVM” is used as the change detection method (change score type). It is a flowchart to explain. Since the basic processing flow is the same as that of the overall change score calculation processing S900 in FIG. 9, the differences will be mainly described below.

同図に示すS1511〜S1513の処理は、図9のS911〜S913の処理と同様であるので説明を省略する。 Since the processes of S151 to S1513 shown in the figure are the same as the processes of S911 to S913 of FIG. 9, the description thereof will be omitted.

S1514またはS1515では、個別変化スコア算出部142は、各未利用特徴また
は各利用特徴の個別変化スコアを、図14の変化検知モデル生成処理S1400で生成した変化点検知モデルを用いて図13とともに説明した前述の方法により求める。
In S1514 or S1515, the individual change score calculation unit 142 describes each unused feature or the individual change score of each used feature together with FIG. 13 using the change point detection model generated by the change detection model generation process S1400 of FIG. It is obtained by the above-mentioned method.

S1516では、全体変化スコア算出部143は、求めた個別変化スコアに基づき、図13とともに説明した前述の方法により全体変化スコアを求めて記憶する。尚、全体変化スコアの算出方法は必ずしも限定されない。例えば、各特徴に重みづけを行った上で合計した値を全体変化スコアとしてもよい。 In S1516, the overall change score calculation unit 143 obtains and stores the overall change score by the method described with reference to FIG. 13 based on the obtained individual change score. The method of calculating the overall change score is not necessarily limited. For example, each feature may be weighted and the total value may be used as the overall change score.

S1517では、寄与特徴特定部144は、求めた変化スコアが全体変化スコアに寄与している特徴を寄与特徴として特定する。例えば、寄与特徴特定部144は、個別変化スコアが「1」(類似しない)である特徴を寄与特徴として特定する。 In S1517, the contribution feature identification unit 144 identifies a feature in which the obtained change score contributes to the overall change score as a contribution feature. For example, the contribution feature identification unit 144 identifies a feature having an individual change score of "1" (not similar) as a contribution feature.

S1518では、相関特徴特定部145は、S919と同様の方法で相関特徴や相関係数を求めて記憶する。 In S1518, the correlation feature specifying unit 145 obtains and stores the correlation feature and the correlation coefficient in the same manner as in S919.

以上のように、変化検知手法(変化スコアタイプ)として「One Class SVM」を用いた
場合も支援情報の表示は図11に示した支援情報提示処理S1100と同様の方法で行われる。尚、「One Class SVM」に類似する他の二値分類のアルゴリズムを変化検知手法と
して用いてもよい。
As described above, even when "One Class SVM" is used as the change detection method (change score type), the support information is displayed by the same method as the support information presentation process S1100 shown in FIG. In addition, another binary classification algorithm similar to "One Class SVM" may be used as a change detection method.

以上、詳細に説明したように、本実施形態の学習モデル生成支援装置100によれば、複数の特徴の全体としての変化の度合いを示す値である全体変化スコアに関する情報を提供することができ、複数の特徴の全体としての変化に関する情報を得ることができる。また全体変化スコアに寄与する特徴である寄与特徴に関する情報を提供することができ、寄与特徴から全体変化スコアを変化させる要因となっている特徴を把握することができる。また既存の学習モデルの学習に際して利用されなかった未利用特徴の中から学習モデルの性能向上に貢献する特徴を発見することができる。このように、本実施形態の学習モデル生成支援装置100によれば、学習モデルの生成に用いる特徴を効率よく適切に特定することができる。 As described in detail above, according to the learning model generation support device 100 of the present embodiment, it is possible to provide information on the overall change score, which is a value indicating the degree of change of the plurality of features as a whole. Information about changes in multiple features as a whole can be obtained. In addition, it is possible to provide information on the contribution feature, which is a feature that contributes to the overall change score, and it is possible to grasp the feature that is a factor that changes the overall change score from the contribution feature. In addition, it is possible to discover features that contribute to improving the performance of the learning model from among unused features that were not used when learning the existing learning model. As described above, according to the learning model generation support device 100 of the present embodiment, the features used for generating the learning model can be efficiently and appropriately specified.

[変化検知方法の指定]
ところで、変化検知モデルの特性は、その生成に用いた変化検知手法によって異なるため、例えば、ユーザが変化検知モデルの生成に用いる変化検知手法を選択できるようにしてもよい。また支援情報の提示に際してユーザに複数の変化検知手法を選択させ、変化検知モデル生成部141が、ユーザが選択した複数の変化検知手法の夫々に基づく複数の変化検知モデルを生成し、複数の変化検知モデルの夫々を用いて支援情報を生成して表示するようにしてもよい。ユーザが変化検知手法を選択できるようにすることで、製品や現場の状況に応じてユーザは適切な変化検知モデルを選択して有用な支援情報を得ることができる。また寄与特徴や相関特徴を優先表示(ソートやフィルタリング等して表示、上位所定数まで表示等)する場合は、選択された変化検知手法に応じて優先順が決定されるので、ユーザは異なる観点に基づく支援情報を得ることができる。
[Specify change detection method]
By the way, since the characteristics of the change detection model differ depending on the change detection method used to generate the change detection model, for example, the user may be able to select the change detection method to be used to generate the change detection model. Further, when presenting the support information, the user is made to select a plurality of change detection methods, and the change detection model generation unit 141 generates a plurality of change detection models based on each of the plurality of change detection methods selected by the user, and a plurality of changes. Support information may be generated and displayed using each of the detection models. By allowing the user to select the change detection method, the user can select an appropriate change detection model according to the situation of the product or the site and obtain useful support information. In addition, when the contribution features and correlation features are preferentially displayed (displayed by sorting, filtering, etc., displaying up to the upper predetermined number, etc.), the priority order is determined according to the selected change detection method, so that the user has a different viewpoint. Support information based on can be obtained.

図16に変化検知方法をユーザに指定させる画面(以下、「変化検知方法選択画面1600」と称する。)の一例を示す。同図に示すように、変化検知方法選択画面1600は、変化検知方法の名称の表示欄1611と選択欄1612とを有する。ユーザは、選択する変化検知方法の選択欄1612に対して選択操作を行うことで、変化検知モデルの生成に用いる変化検知手法を選択することができる。ユーザは、複数の変化検知方法を同時に選択することも可能であり、その場合は選択された複数の変化検知手法の夫々に基づき変化検知モデルが生成され、各変化検知モデルに基づき支援情報が生成される。 FIG. 16 shows an example of a screen for allowing the user to specify a change detection method (hereinafter, referred to as “change detection method selection screen 1600”). As shown in the figure, the change detection method selection screen 1600 has a display field 1611 and a selection field 1612 for the name of the change detection method. The user can select the change detection method to be used for generating the change detection model by performing a selection operation on the selection field 1612 of the change detection method to be selected. The user can also select multiple change detection methods at the same time, in which case a change detection model is generated based on each of the selected multiple change detection methods, and support information is generated based on each change detection model. Will be done.

[学習モデルの設定]
前述した学習モデル情報112の設定は、例えば、所定の画面(以下、「学習モデル設定画面1700」と称する。)を表示してユーザから設定を受け付ける。
[Learning model settings]
For the setting of the learning model information 112 described above, for example, a predetermined screen (hereinafter, referred to as “learning model setting screen 1700”) is displayed and the setting is accepted from the user.

図17に学習モデル設定画面1700の一例を示す。例示する学習モデル設定画面1700は、学習モデルIDの設定欄1711、学習データ量の設定欄1712、及び性能検証情報の設定欄1713を有する。学習モデル生成支援装置100は、学習モデルIDの設定欄1711の設定内容を学習モデルID1121に、学習データ量の設定欄1712の設定内容を学習データ量1124に、性能検証情報の設定欄1713の設定内容を性能検証情報1125に、夫々設定する。学習モデル設定画面1700に設定された内容は、学習モデル情報112に反映される。 FIG. 17 shows an example of the learning model setting screen 1700. The learning model setting screen 1700 to be illustrated has a learning model ID setting field 1711, a learning data amount setting field 1712, and a performance verification information setting field 1713. The learning model generation support device 100 sets the setting contents of the learning model ID setting field 1711 in the learning model ID 1121, the setting contents of the learning data amount setting field 1712 in the learning data amount 1124, and the setting contents of the performance verification information setting field 1713. The contents are set in the performance verification information 1125, respectively. The contents set on the learning model setting screen 1700 are reflected in the learning model information 112.

[時系列データの送信制御]
例えば、機械学習システム1が、データ提供装置3については現場(エッジ)側に設置され、学習モデル生成支援装置100についてはクラウド側に設置される運用形態(エッジコンピューティング等)をとる場合、通信ネットワーク5の通信量を抑えるべく、通常の運用時にデータ提供装置3から学習モデル生成支援装置100に対して学習データとして用いる時系列データの送信を制限していることがある。
[Time series data transmission control]
For example, when the machine learning system 1 takes an operation form (edge computing, etc.) in which the data providing device 3 is installed on the site (edge) side and the learning model generation support device 100 is installed on the cloud side, communication is performed. In order to reduce the amount of communication in the network 5, the data providing device 3 may restrict the transmission of time-series data used as learning data from the data providing device 3 to the learning model generation support device 100 during normal operation.

そのため、前述した変化検知モデル生成処理S800や全体変化スコア算出処理S900(変化検知モデル生成処理S1400や全体変化スコア算出処理S1500も同様)等の未利用特徴の時系列データを利用する処理を実行する際は、送信制限を解除して学習モデル生成支援装置100がデータ提供装置3から未利用特徴の時系列データを取得できるようにする必要がある。また未利用特徴の時系列データの利用が終了した後は、未利用特徴(ユーザが支援情報を参照した結果、利用特徴とすることが決定した特徴を除く)の送信を再度制限して通常の運用状態に戻す必要がある。 Therefore, a process using time-series data of unused features such as the change detection model generation process S800 and the overall change score calculation process S900 (the same applies to the change detection model generation process S1400 and the overall change score calculation process S1500) described above is executed. At that time, it is necessary to release the transmission restriction so that the learning model generation support device 100 can acquire the time series data of the unused features from the data providing device 3. In addition, after the use of the time-series data of the unused features is completed, the transmission of the unused features (excluding the features determined to be the used features as a result of the user's reference to the support information) is restricted again as usual. It is necessary to return to the operational state.

そこで、例えば、学習データ管理部120に、指定された特徴の時系列データの送信要求や指定された特徴の時系列データの送信停止要求をデータ提供装置3に対して送信する機能を設け、未利用特徴の時系列データの送信制御を行うようにする。 Therefore, for example, the learning data management unit 120 is provided with a function of transmitting a request for transmitting time-series data of a specified feature and a request for stopping transmission of time-series data of a specified feature to the data providing device 3, and has not been provided. Control the transmission of time-series data of usage features.

図18は、データ提供装置3に対して時系列データの送信要求や送信停止要求を行う際に学習データ管理部120が行う処理(以下、「時系列データ送信制御処理S1800」と称する。)を説明するフローチャートである。以下、同図とともに時系列データ送信制御処理S1800について説明する。 FIG. 18 shows a process (hereinafter, referred to as “time-series data transmission control process S1800”) performed by the learning data management unit 120 when making a time-series data transmission request or a transmission stop request to the data providing device 3. It is a flowchart to explain. Hereinafter, the time series data transmission control process S1800 will be described with reference to the figure.

まず学習データ管理部120は、データ提供装置3に対して未利用特徴の時系列データの送信要求を送信する(S1811)。 First, the learning data management unit 120 transmits a transmission request for time-series data of unused features to the data providing device 3 (S1811).

上記送信要求を受信すると、データ提供装置3は、未利用特徴の時系列データの送信を開始し、学習モデル生成支援装置100は、データ提供装置3から送られてくる未利用特徴の時系列データの受信を開始する(S1812)。 Upon receiving the transmission request, the data providing device 3 starts transmitting the time-series data of the unused features, and the learning model generation support device 100 starts the time-series data of the unused features sent from the data providing device 3. Starts receiving (S1812).

尚、学習データ管理部120は、例えば、図8に示した変化検知モデル生成処理S800や図14に示した変化検知モデル生成処理S1400の実行に先立ちS1811〜S1812の処理を実行する。 The learning data management unit 120 executes the processes S181 to S1812 prior to the execution of the change detection model generation process S800 shown in FIG. 8 and the change detection model generation process S1400 shown in FIG. 14, for example.

その後、学習データ管理部120は、未利用特徴(ユーザが支援情報を参照した結果、利用特徴とすることが決定した特徴を除く)の時系列データの受信を停止するための処理を開始するか否かを随時判定する(S1813)。学習データ管理部120は、例えば、
ユーザから未利用特徴の時系列データの受信停止指示を受け付けた場合に未利用特徴の時系列データの受信を停止すると判定する。学習データ管理部120が、未利用特徴の時系列データの受信を停止すると判定した場合(S1813:YES)、処理はS1814に進む。
After that, the learning data management unit 120 starts a process for stopping the reception of time-series data of unused features (excluding features determined to be used features as a result of the user referring to the support information). Whether or not it is determined at any time (S1813). The learning data management unit 120, for example,
When an instruction to stop receiving the time-series data of the unused feature is received from the user, it is determined that the reception of the time-series data of the unused feature is stopped. When the learning data management unit 120 determines that the reception of the time-series data of the unused feature is stopped (S1813: YES), the process proceeds to S1814.

S1814では、学習データ管理部120は、時系列データの受信を停止する未利用特徴の指定を受け付ける。尚、学習データ管理部120が、例えば、変化検知モデル情報113を参照することにより、時系列データの受信を停止する未利用特徴を自動的に判定するようにしてもよい。 In S1814, the learning data management unit 120 accepts the designation of an unused feature that stops receiving time-series data. The learning data management unit 120 may automatically determine an unused feature that stops receiving time-series data by referring to, for example, the change detection model information 113.

続いて、学習データ管理部120は、受け付けた特徴の時系列データの送信停止要求をデータ提供装置3に送信する(S1815)。データ提供装置3は、上記送信停止要求を受信すると、指定された特徴についての時系列データの送信を停止する。 Subsequently, the learning data management unit 120 transmits a request for stopping transmission of the received feature time-series data to the data providing device 3 (S1815). Upon receiving the transmission stop request, the data providing device 3 stops the transmission of time-series data for the specified feature.

以上、一実施形態について詳述したが、本発明は以上に説明した実施形態に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。またある実施形態の構成の一部を他の実施形態の構成に置き換えてもよい。またある実施形態の構成に他の実施形態の構成を加えてもよい。また各実施形態の構成の一部について、他の構成の追加、削除、又は置換をしてもよい。 Although one embodiment has been described in detail above, the present invention is not limited to the embodiments described above, and includes various modifications and equivalent configurations within the scope of the appended claims. For example, the above-described embodiment has been described in detail in order to explain the present invention in an easy-to-understand manner, and the present invention is not necessarily limited to those having all the described configurations. Further, a part of the configuration of one embodiment may be replaced with the configuration of another embodiment. Further, the configuration of another embodiment may be added to the configuration of one embodiment. Further, a part of the configuration of each embodiment may be added, deleted, or replaced with another configuration.

例えば、以上の実施形態では、様々な情報を識別するために識別子を用いているが、識別子として例えばUUID(Universally Unique Identifier)を用いてもよい。 For example, in the above embodiments, an identifier is used to identify various information, but for example, a UUID (Universally Unique Identifier) may be used as the identifier.

また前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。 Further, each of the above-described configurations, functions, processing units, processing means, etc. may be realized by hardware by designing a part or all of them by, for example, an integrated circuit, and the processor realizes each function. It may be realized by software by interpreting and executing the program.

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カ
ード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
Information such as programs, tables, and files that realize each function is recorded in a memory, hard disk, storage device such as SSD (Solid State Drive), or IC (Integrated Circuit) card, SD card, DVD (Digital Versatile Disc). It can be stored in a medium.

制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。 The control lines and information lines indicate what is considered necessary for explanation, and do not necessarily indicate all the control lines and information lines necessary for implementation. In practice, it can be considered that almost all configurations are interconnected.

1 機械学習システム、3 データ提供装置、5 通信ネットワーク、100 学習モデル生成支援装置、110 記憶部、111 学習データ、112 学習モデル情報、113 変化検知モデル情報、114 特徴変化関連情報、120 学習データ管理部、121 データ取得部、122 データ更新部、130 学習モデル管理部、131 特徴選択部、132 学習モデル生成部、133 学習モデル性能検証部、134 学習モデル情報管理部、140 支援情報出力部、141 変化検知モデル生成部、142 個別変化スコア算出部、143 全体変化スコア算出部、144 寄与特徴特定部、145 相関特徴特定部、146 情報出力部、147 実行制御部、S700 学習モデル生成処理、S800 変化検知モデル生成処理、S900 全体変化スコア算出処理、1200
支援情報提示画面、1600 変化検知方法選択画面、1700 学習モデル設定画面
1 Machine learning system, 3 Data providing device, 5 Communication network, 100 Learning model generation support device, 110 Storage unit, 111 Learning data, 112 Learning model information, 113 Change detection model information, 114 Feature change related information, 120 Learning data management Unit, 121 Data acquisition unit, 122 Data update unit, 130 Learning model management unit, 131 Feature selection unit, 132 Learning model generation unit, 133 Learning model performance verification unit, 134 Learning model information management unit, 140 Support information output unit, 141 Change detection model generation unit, 142 individual change score calculation unit, 143 overall change score calculation unit, 144 contribution feature identification unit, 145 correlation feature identification unit, 146 information output unit, 147 execution control unit, S700 learning model generation process, S800 change Detection model generation processing, S900 overall change score calculation processing, 1200
Support information presentation screen, 1600 change detection method selection screen, 1700 learning model setting screen

Claims (15)

学習モデルの生成を支援する情報処理装置であって、
学習モデルの生成に利用可能な特徴の時系列データを記憶する記憶部、
前記特徴の夫々について、生成済みの前記学習モデルの生成に利用した前記特徴である利用特徴の学習期間における夫々の時系列データを学習データとして、夫々の前記時系列データの変化の度合いを示す値である変化スコアを生成する機械学習モデルである変化検知モデルを生成する、変化検知モデル生成部、
複数の前記特徴の夫々について、新たな期間の時系列データを取得するデータ取得部、
前記複数の特徴の夫々の前記変化検知モデルに夫々の前記新たな時系列データを入力することにより、前記新たな期間おける前記複数の特徴の夫々の前記変化スコアである個別変化スコアを求める個別変化スコア算出部、
前記複数の特徴の夫々の前記個別変化スコアに基づき、前記新たな期間おける前記複数の特徴の全体としての変化の度合いを示す値である全体変化スコアを求める、全体変化スコア算出部、
前記複数の特徴の夫々の前記個別変化スコアに基づき、前記全体変化スコアに寄与する前記特徴である寄与特徴を特定する、寄与特徴特定部、
を備える、学習モデル生成支援装置。
An information processing device that supports the generation of learning models.
A storage unit that stores time-series data of features that can be used to generate learning models,
For each of the features, a value indicating the degree of change of the time-series data, using each time-series data in the learning period of the feature-based feature used for generating the generated learning model as learning data. A change detection model generator that generates a change detection model, which is a machine learning model that generates a change score.
A data acquisition unit that acquires time-series data for a new period for each of the plurality of features.
By inputting the new time series data into the change detection model of each of the plurality of features, an individual change for obtaining an individual change score which is the change score of each of the plurality of features in the new period is obtained. Score calculation department,
An overall change score calculation unit, which obtains an overall change score which is a value indicating the degree of change of the plurality of features as a whole in the new period based on the individual change scores of the plurality of features.
Contribution feature identification unit, which identifies the contribution feature that is the feature that contributes to the overall change score based on the individual change score of each of the plurality of features.
A learning model generation support device equipped with.
請求項1に記載の学習モデル生成支援装置であって、
前記個別変化スコア算出部は、前記複数の特徴の夫々について、夫々の前記変化検知モデルに前記学習期間における夫々の時系列データを入力することにより、前記学習期間における前記個別変化スコアの最大値を求め、
前記全体変化スコア算出部は、前記複数の特徴の夫々について、夫々の前記新たな期間おける前記個別変化スコアを夫々の前記最大値と比較し、前記個別変化スコアが前記最大値以上の前記特徴の数が多いほど値が大きくなるように前記全体変化スコアを求める、
学習モデル生成支援装置。
The learning model generation support device according to claim 1.
The individual change score calculation unit obtains the maximum value of the individual change score in the learning period by inputting each time-series data in the learning period into the change detection model for each of the plurality of features. Ask,
The overall change score calculation unit compares the individual change score in each of the new periods with the maximum value of each of the plurality of features, and the individual change score of the feature having the individual change score of the maximum value or more. The overall change score is calculated so that the larger the number, the larger the value.
Learning model generation support device.
請求項2に記載の学習モデル生成支援装置であって、
前記寄与特徴特定部は、前記個別変化スコアが前記最大値以上である前記特徴を前記寄与特徴として特定する、
学習モデル生成支援装置。
The learning model generation support device according to claim 2.
The contributing feature specifying unit identifies the feature whose individual change score is equal to or higher than the maximum value as the contributing feature.
Learning model generation support device.
請求項2に記載の学習モデル生成支援装置であって、
前記変化検知モデル生成部は、時系列データの変化を検知するアルゴリズムである「Change Finder」を用いて前記変化検知モデルを生成する、
学習モデル生成支援装置。
The learning model generation support device according to claim 2.
The change detection model generation unit generates the change detection model by using "Change Finder" which is an algorithm for detecting changes in time series data.
Learning model generation support device.
請求項1に記載の学習モデル生成支援装置であって、
前記個別変化スコア算出部は、前記複数の特徴の夫々について、前記学習期間における前記時系列データの態様と前記新たな期間における時系列データの態様との間の類似度が予め設定された閾値以上であるか否かに基づき前記個別変化スコアを求め、
前記全体変化スコア算出部は、前記類似度が前記閾値未満である特徴の数が多いほど値が大きくなるように前記変化スコアを求める、
学習モデル生成支援装置。
The learning model generation support device according to claim 1.
For each of the plurality of features, the individual change score calculation unit has a degree of similarity between the mode of the time series data in the learning period and the mode of the time series data in the new period equal to or higher than a preset threshold value. The individual change score is calculated based on whether or not
The overall change score calculation unit obtains the change score so that the larger the number of features whose similarity is less than the threshold value, the larger the value.
Learning model generation support device.
請求項5に記載の学習モデル生成支援装置であって、
前記寄与特徴特定部は、前記類似度が前記閾値未満である前記特徴を前記寄与特徴として特定する、
学習モデル生成支援装置。
The learning model generation support device according to claim 5.
The contributing feature specifying unit identifies the feature whose similarity is less than the threshold value as the contributing feature.
Learning model generation support device.
請求項5に記載の学習モデル生成支援装置であって、
前記変化検知モデル生成部は、時系列データの変化を検知するアルゴリズムである「One Class SVM」を用いて前記変化検知モデルを生成する、
学習モデル生成支援装置。
The learning model generation support device according to claim 5.
The change detection model generation unit generates the change detection model by using "One Class SVM" which is an algorithm for detecting changes in time series data.
Learning model generation support device.
請求項1に記載の学習モデル生成支援装置であって、
前記個別変化スコア算出部は、
前記学習モデルの生成に用いた前記学習データの量が予め設定された閾値未満である場合は、前記複数の利用可能な特徴のうち前記学習モデルの生成に利用されていない特徴である未利用特徴について、夫々の前記変化検知モデルに夫々の前記新たな時系列データを入力することにより前記個別変化スコアを求め、
前記学習モデルの生成に用いた前記学習データの量が前記閾値以上である場合は、前記未利用特徴及び前記利用特徴の双方について、夫々の前記変化検知モデルに夫々の前記新たな時系列データを入力することにより前記個別変化スコアを求める、
学習モデル生成支援装置。
The learning model generation support device according to claim 1.
The individual change score calculation unit
When the amount of the training data used to generate the training model is less than a preset threshold value, the unused feature is a feature not used in the generation of the training model among the plurality of available features. By inputting the new time-series data into each of the change detection models, the individual change score was obtained.
When the amount of the training data used to generate the learning model is equal to or greater than the threshold value, the new time-series data is added to the change detection model for both the unused feature and the used feature. The individual change score is obtained by inputting.
Learning model generation support device.
請求項1に記載の学習モデル生成支援装置であって、
前記全体変化スコアに関する情報及び前記寄与特徴に関する情報を出力する支援情報提示部をさらに備える、
学習モデル生成支援装置。
The learning model generation support device according to claim 1.
It further includes a support information presentation unit that outputs information on the overall change score and information on the contributing features.
Learning model generation support device.
請求項9に記載の学習モデル生成支援装置であって、
その時系列データの前記寄与特徴の新たな時系列データとの間の相関係数が予め設定された閾値以上である前記利用可能な特徴である相関特徴を特定する相関特徴特定部を更に備え、
前記支援情報提示部は、前記相関特徴に関する情報を出力する、
学習モデル生成支援装置。
The learning model generation support device according to claim 9.
Further provided with a correlation feature identification unit for specifying the correlation feature which is the available feature in which the correlation coefficient of the time series data with the new time series data of the contribution feature is equal to or higher than a preset threshold value.
The support information presenting unit outputs information regarding the correlation feature.
Learning model generation support device.
請求項10に記載の学習モデル生成支援装置であって、
前記支援情報提示部は、前記全体変化スコアの時系列データ、前記寄与特徴の時系列データ、及び前記相関特徴の時系列データを出力する、
学習モデル生成支援装置。
The learning model generation support device according to claim 10.
The support information presenting unit outputs the time-series data of the overall change score, the time-series data of the contribution feature, and the time-series data of the correlation feature.
Learning model generation support device.
請求項9に記載の学習モデル生成支援装置であって、
前記変化検知モデル生成部は、時系列データの変化を検知する複数のアルゴリズムの夫々に基づき複数の前記変化検知モデルを生成し、
前記支援情報提示部は、前記アルゴリズムの指定を受け付け、指定された前記アルゴリズムに基づく前記変化検知モデルによる前記全体変化スコアに関する情報と前記寄与特徴に関する情報とを出力する、
学習モデル生成支援装置。
The learning model generation support device according to claim 9.
The change detection model generation unit generates a plurality of the change detection models based on each of a plurality of algorithms for detecting changes in time-series data.
The support information presenting unit accepts the designation of the algorithm and outputs information on the overall change score and information on the contribution feature by the change detection model based on the designated algorithm.
Learning model generation support device.
請求項1に記載の学習モデル生成支援装置であって、
前記学習モデルの性能が予め設定された基準を満たしているか否かを評価する学習モデル性能検証部と、
前記学習モデルの性能が前記基準を満たしていない場合に、前記個別変化スコア算出部による前記個別変化スコアの算出処理と、前記全体変化スコア算出部による前記全体変化スコアの算出処理を実行する、実行制御部と、
を更に備える、
学習モデル生成支援装置。
The learning model generation support device according to claim 1.
A learning model performance verification unit that evaluates whether the performance of the learning model meets preset criteria, and
When the performance of the learning model does not meet the criteria, the individual change score calculation unit executes the individual change score calculation process and the overall change score calculation unit executes the overall change score calculation process. Control unit and
Further prepare
Learning model generation support device.
請求項8に記載の学習モデル生成支援装置であって、
前記利用可能な特徴の時系列データを提供する情報処理装置であるデータ提供装置と通信可能に接続する通信部と、
前記利用可能な特徴を前記データ提供装置から受信するデータ取得部と、
前記データ取得部は、
前記個別変化スコア算出部による前記個別変化スコアの算出に先立ち、前記未利用特徴の送信要求を前記データ提供装置に送信し、
前記個別変化スコア算出部による前記個別変化スコアの算出後に、前記未利用特徴の送信停止要求を前記データ提供装置に送信する、
学習モデル生成支援装置。
The learning model generation support device according to claim 8.
A communication unit that is communicably connected to a data providing device that is an information processing device that provides time-series data of the available features.
A data acquisition unit that receives the available features from the data provider, and
The data acquisition unit
Prior to the calculation of the individual change score by the individual change score calculation unit, a transmission request for the unused feature is transmitted to the data providing device.
After the individual change score calculation unit calculates the individual change score, a transmission stop request for the unused feature is transmitted to the data providing device.
Learning model generation support device.
学習モデルの生成を支援する方法であって、
情報処理装置が、
学習モデルの生成に利用可能な特徴の時系列データを記憶するステップ、
前記特徴の夫々について、生成済みの前記学習モデルの生成に利用した前記特徴である利用特徴の学習期間における夫々の時系列データを学習データとして、夫々の前記時系列データの変化の度合いを示す値である変化スコアを生成する機械学習モデルである変化検知モデルを生成するステップ、
複数の前記特徴の夫々について、新たな期間の時系列データを取得するステップ、
前記複数の特徴の夫々の前記変化検知モデルに夫々の前記新たな時系列データを入力することにより、前記新たな期間おける前記複数の特徴の夫々の前記変化スコアである個別変化スコアを求めるステップ、
前記複数の特徴の夫々の前記個別変化スコアに基づき、前記新たな期間おける前記複数の特徴の全体としての変化の度合いを示す値である全体変化スコアを求めるステップ、
前記複数の特徴の夫々の前記個別変化スコアに基づき、前記全体変化スコアに寄与する前記特徴である寄与特徴を特定するステップ、
を実行する、学習モデル生成支援方法。
A way to help generate learning models
Information processing device
Steps to store time series data of features that can be used to generate training models,
For each of the features, a value indicating the degree of change of the time-series data, using each time-series data in the learning period of the feature-based feature used for generating the generated learning model as learning data. Steps to generate a change detection model, which is a machine learning model that generates a change score,
Steps to acquire time series data for a new period for each of the plurality of above features,
A step of obtaining an individual change score, which is the change score of each of the plurality of features in the new period, by inputting the new time series data into the change detection model of each of the plurality of features.
A step of obtaining an overall change score, which is a value indicating the degree of change of the plurality of features as a whole in the new period, based on the individual change score of each of the plurality of features.
A step of identifying a contributing feature, which is a feature that contributes to the overall change score, based on the individual change score of each of the plurality of features.
A learning model generation support method that executes.
JP2019039130A 2019-03-05 2019-03-05 LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD Active JP7171471B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019039130A JP7171471B2 (en) 2019-03-05 2019-03-05 LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019039130A JP7171471B2 (en) 2019-03-05 2019-03-05 LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD

Publications (2)

Publication Number Publication Date
JP2020144493A true JP2020144493A (en) 2020-09-10
JP7171471B2 JP7171471B2 (en) 2022-11-15

Family

ID=72353641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019039130A Active JP7171471B2 (en) 2019-03-05 2019-03-05 LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD

Country Status (1)

Country Link
JP (1) JP7171471B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220180533A1 (en) * 2019-04-25 2022-06-09 Nec Corporation Object feature extraction device, object feature extraction method, and non-transitory computer-readable medium
WO2022162957A1 (en) * 2021-02-01 2022-08-04 オムロン株式会社 Information processing device, control system, and report output method
WO2022181007A1 (en) * 2021-02-24 2022-09-01 オムロン株式会社 Information processing device, information processing program, and information processing method
WO2022251162A1 (en) * 2021-05-24 2022-12-01 Capital One Services, Llc Resource allocation optimization for multi-dimensional machine learning environments
JP7487144B2 (en) 2021-06-09 2024-05-20 株式会社東芝 Information processing device, method and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004054370A (en) * 2002-07-17 2004-02-19 Nec Corp Autoregressive model learning device for time series data and device for detecting deviated value and changing point using the same
JP2004086896A (en) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd Method and system for constructing adaptive prediction model

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004054370A (en) * 2002-07-17 2004-02-19 Nec Corp Autoregressive model learning device for time series data and device for detecting deviated value and changing point using the same
JP2004086896A (en) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd Method and system for constructing adaptive prediction model

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANDREW PHELPS CASSIDY ET AL.: ""Calculating Feature Importance in Data Streams with Concept Drift using Online Random Forest"", 2014 IEEE INTERNATIONAL CONFERENCE ON BIG DATA, JPN6022018486, 2014, US, pages 23 - 28, XP032717209, ISSN: 0004773240, DOI: 10.1109/BigData.2014.7004352 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220180533A1 (en) * 2019-04-25 2022-06-09 Nec Corporation Object feature extraction device, object feature extraction method, and non-transitory computer-readable medium
US11875518B2 (en) * 2019-04-25 2024-01-16 Nec Corporation Object feature extraction device, object feature extraction method, and non-transitory computer-readable medium
WO2022162957A1 (en) * 2021-02-01 2022-08-04 オムロン株式会社 Information processing device, control system, and report output method
WO2022181007A1 (en) * 2021-02-24 2022-09-01 オムロン株式会社 Information processing device, information processing program, and information processing method
WO2022251162A1 (en) * 2021-05-24 2022-12-01 Capital One Services, Llc Resource allocation optimization for multi-dimensional machine learning environments
JP7487144B2 (en) 2021-06-09 2024-05-20 株式会社東芝 Information processing device, method and program

Also Published As

Publication number Publication date
JP7171471B2 (en) 2022-11-15

Similar Documents

Publication Publication Date Title
JP7171471B2 (en) LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD
JP6402265B2 (en) Method, computer device and storage device for building a decision model
US10643135B2 (en) Linkage prediction through similarity analysis
JP6954003B2 (en) Determining device and method of convolutional neural network model for database
US20210136098A1 (en) Root cause analysis in multivariate unsupervised anomaly detection
JP2017224184A (en) Machine learning device
US10511681B2 (en) Establishing and utilizing behavioral data thresholds for deep learning and other models to identify users across digital space
JP6823612B2 (en) Predictors, prediction methods, and prediction programs
JP6937330B2 (en) Machine learning model compression system, machine learning model compression method and program
JP2017146888A (en) Design support device and method and program
US20160055496A1 (en) Churn prediction based on existing event data
US20210174189A1 (en) Optimization Framework for Real-Time Rendering of Media Using Machine Learning Techniques
JP2014174753A (en) Information processing unit, information processing method, and information processing program
CN110995459A (en) Abnormal object identification method, device, medium and electronic equipment
CN111858934A (en) Method and device for predicting article popularity
US9760933B1 (en) Interactive shopping advisor for refinancing product queries
CN109951859B (en) Wireless network connection recommendation method and device, electronic equipment and readable medium
CN104123307A (en) Data loading method and system
CN115470190A (en) Multi-storage-pool data classification storage method and system and electronic equipment
JP7440352B2 (en) Educational content creation system and method
US20210365831A1 (en) Identifying claim complexity by integrating supervised and unsupervised learning
CN113296951A (en) Resource allocation scheme determination method and equipment
JP7097261B2 (en) Learning data analysis method and computer system
US20240086762A1 (en) Drift-tolerant machine learning models
US20230185791A1 (en) Prioritized data cleaning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221102

R150 Certificate of patent or registration of utility model

Ref document number: 7171471

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150