JP2021105807A - Computer system and method for analyzing operating environment of business system - Google Patents
Computer system and method for analyzing operating environment of business system Download PDFInfo
- Publication number
- JP2021105807A JP2021105807A JP2019236299A JP2019236299A JP2021105807A JP 2021105807 A JP2021105807 A JP 2021105807A JP 2019236299 A JP2019236299 A JP 2019236299A JP 2019236299 A JP2019236299 A JP 2019236299A JP 2021105807 A JP2021105807 A JP 2021105807A
- Authority
- JP
- Japan
- Prior art keywords
- inference
- unit
- result
- computer
- operating environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000004458 analytical method Methods 0.000 claims abstract description 116
- 238000004364 calculation method Methods 0.000 claims abstract description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 50
- 230000008859 change Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 description 49
- 238000011156 evaluation Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 24
- 238000007726 management method Methods 0.000 description 12
- 238000013523 data management Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000007613 environmental effect Effects 0.000 description 6
- 238000003891 environmental analysis Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、AIを活用したシステムの運用環境を解析するシステム及び方法に関する。 The present invention relates to a system and a method for analyzing the operating environment of a system utilizing AI.
近年、医療及び金融等の様々な分野でAIを活用したシステムが提供されている。例えば、医療分野では、AIを活用して、病気の発症率の予測及び症状の特定等が行われる。また、金融分野では、AIを活用して、与信審査等が行われる。本明細書では、AIを活用したシステムをAIシステム(業務システム)と記載する。 In recent years, systems utilizing AI have been provided in various fields such as medical care and finance. For example, in the medical field, AI is used to predict the incidence of diseases and identify symptoms. In the financial field, AI is used to conduct credit screening. In this specification, a system utilizing AI is referred to as an AI system (business system).
AIのモデルは学習データを用いた機械学習により生成される。AIシステムを長期に運用した場合、ターゲットの変化及び世界情勢の変化等、AIシステムの運用環境が変化する。そのため、想定したAIシステムの運用環境と、実際のAIシステムの運用環境との間のズレが生じて、AIの予測精度が低下する問題がある。 The AI model is generated by machine learning using training data. When the AI system is operated for a long period of time, the operating environment of the AI system changes due to changes in the target and changes in the world situation. Therefore, there is a problem that the expected accuracy of AI prediction is lowered due to a deviation between the assumed operating environment of the AI system and the actual operating environment of the AI system.
したがって、AIシステムを長期に運用するためには、運用環境の変化を検知し、変化の要因を解析し、解析結果を用いた再学習を行う必要がある。特に、運用環境の変化を検知するための仕組みが重要である。 Therefore, in order to operate the AI system for a long period of time, it is necessary to detect changes in the operating environment, analyze the factors of the changes, and perform re-learning using the analysis results. In particular, a mechanism for detecting changes in the operating environment is important.
これに対してAIの継続的な学習を実現するLML(Lifelong Machine Learning)が注目されている。LMLは、前例のない観測データの出現を環境変化として検知する機能を有する。LMLを利用した技術としては、例えば、特許文献1のような技術が知られている。
On the other hand, LML (Lifelong Machine Learning), which realizes continuous learning of AI, is attracting attention. LML has a function of detecting the appearance of unprecedented observation data as an environmental change. As a technique using LML, for example, a technique such as
特許文献1には、「分離した識別サブシステム及びアプリケーションサブシステムを備えた階層型機械学習システムであって、第1層の第1ノードは第1入力を処理し、第1入力の少なくとも一部を処理して第1特徴ベクトルを生成し、第2層の第2ノードは、第1特徴ベクトルの少なくとも一部を含む第2入力を処理して、第2特徴ベクトルを生成する。第1のノードは、第1の特徴ベクトルから第1のスパース特徴ベクトルを生成し、第2のノードは、第2の特徴ベクトルから第2のスパース特徴ベクトルを生成する。識別サブシステムの第3のノードは、第1のスパース特徴ベクトルまたは第2のスパース特徴ベクトルの少なくとも一方を処理して、出力を決定する。」ことが記載されている。
従来技術では、ユーザが、特徴ベクトル等のモデルの内部情報を解釈し、運用環境の変化を検知する必要がある。モデルの内部情報は、入力したデータとの関連性を直接的に表す情報ではないため解釈方法を定義することが難しい。また、再学習を行った場合、モデルが変化するためこれまで使用してきた解釈方法をそのまま流用できない。 In the prior art, the user needs to interpret the internal information of the model such as the feature vector and detect the change in the operating environment. Since the internal information of the model is not information that directly expresses the relationship with the input data, it is difficult to define the interpretation method. In addition, when re-learning is performed, the model changes, so the interpretation method used so far cannot be used as it is.
すなわち、モデルの内部情報は可読性が低いため、当該情報を利用するための労力及び時間を要するという問題がある。また、従来技術では、モデルの内部情報を取得できるような構造のモデルである必要があり、適用可能なモデルが限定される。 That is, since the internal information of the model is not readable, there is a problem that it takes labor and time to use the information. Further, in the prior art, the model needs to have a structure capable of acquiring the internal information of the model, and the applicable model is limited.
本発明は、モデルの構造に限定されず、かつ、可読性に優れたAIシステムの運用環境を把握するための情報を出力する方法及びシステムを提供する。 The present invention provides a method and a system for outputting information for grasping the operating environment of an AI system having excellent readability without being limited to the structure of the model.
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、推論を行う推論部を有する業務システムの運用環境を解析する計算機システムであって、プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを有する少なくとも一つの計算機を含み、複数の特徴量を含むデータを前記推論部に入力することによって得られた推論結果を解釈するための解釈指標を算出する解釈指標算出部と、前記解釈指標に基づいて、現在の前記業務システムの運用環境を解析し、前記解析の結果を出力する解析部と、を備え、前記解釈指標は、前記推論部に入力された前記データに含まれる前記複数の特徴量の各々の前記推論結果に対する影響度を成分とする根拠ベクトルである。 A typical example of the invention disclosed in the present application is as follows. That is, it is a computer system that analyzes the operating environment of a business system having an inference unit that performs inference, and includes at least one computer having a processor, a memory connected to the processor, and a network interface connected to the processor. , An interpretation index calculation unit that calculates an interpretation index for interpreting the inference result obtained by inputting data including a plurality of feature quantities into the reasoning unit, and the current business system based on the interpretation index. It is provided with an analysis unit that analyzes the operating environment of the above and outputs the result of the analysis, and the interpretation index is for the inference result of each of the plurality of feature quantities included in the data input to the inference unit. It is a basis vector whose component is the degree of influence.
本発明によれば、モデルの構造に限定されず、かつ、可読性に優れたAIシステムの運用環境を把握するための情報を出力することができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。 According to the present invention, it is possible to output information for grasping the operating environment of an AI system having excellent readability without being limited to the structure of the model. Issues, configurations and effects other than those mentioned above will be clarified by the description of the following examples.
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。 Hereinafter, examples of the present invention will be described with reference to the drawings. However, the present invention is not construed as being limited to the description of the embodiments shown below. It is easily understood by those skilled in the art that a specific configuration thereof can be changed without departing from the idea or gist of the present invention.
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。 In the configurations of the invention described below, the same or similar configurations or functions are designated by the same reference numerals, and duplicate description will be omitted.
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。 The notations such as "first", "second", and "third" in the present specification and the like are attached to identify the components, and do not necessarily limit the number or order.
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。 The position, size, shape, range, etc. of each configuration shown in the drawings and the like may not represent the actual position, size, shape, range, etc., in order to facilitate understanding of the invention. Therefore, the present invention is not limited to the position, size, shape, range, etc. disclosed in the drawings and the like.
図1は、実施例1の計算機システムの構成例を示す図である。 FIG. 1 is a diagram showing a configuration example of the computer system of the first embodiment.
計算機システムは、複数の計算機100−1、100−2、100−3、及び端末101から構成される。複数の計算機100−1、100−2、100−3、及び端末101は、ネットワーク105を介して互いに接続される。ネットワーク105は、例えば、WAN(Wide Area Network)及びLAN(Local Area Network)である。ネットワーク105の接続方式は有線及び無線のいずれでもよい。
The computer system is composed of a plurality of computers 100-1, 100-2, 100-3, and a terminal 101. The plurality of computers 100-1, 100-2, 100-3, and the terminal 101 are connected to each other via the
以下の説明では、計算機100−1、100−2、100−3を区別しない場合、計算機100と記載する。
In the following description, when computers 100-1, 100-2, and 100-3 are not distinguished, they are referred to as
端末101は、ユーザが操作する計算機である。端末101は、例えば、パーソナルコンピュータ、スマートフォン、及びタブレット端末等である。端末101は、ユーザの操作に基づいて、AI(推論部111)による推論に必要な評価対象データ500(図5参照)等を入力する。評価対象データ500は複数の項目の値(特徴量)から構成される。
The terminal 101 is a computer operated by the user. The terminal 101 is, for example, a personal computer, a smartphone, a tablet terminal, or the like. The terminal 101 inputs evaluation target data 500 (see FIG. 5) and the like necessary for inference by AI (inference unit 111) based on the user's operation. The
なお、端末101は、プロセッサ、メモリ、ネットワークインタフェース、入力装置、及び出力装置を備える。入力装置は、キーボード、マウス、及びタッチパネル等の装置であり、出力装置は、タッチパネル及びディスプレイ等の装置である。 The terminal 101 includes a processor, a memory, a network interface, an input device, and an output device. The input device is a device such as a keyboard, a mouse, and a touch panel, and the output device is a device such as a touch panel and a display.
計算機100−1は、AI(推論部111)を構築する計算機である。計算機100−1は、学習部110を備え、また、事例データ管理情報120を保持する。
The computer 100-1 is a computer for constructing an AI (inference unit 111). The computer 100-1 includes a
学習部110は、推論部111に設定するモデル(アルゴリズム)を生成するための学習処理を実行する。なお、本発明はモデルの学習方法に限定されない。また、本発明は、モデルの種別及び構造に限定されない。例えば、モデルはニューラルネットワーク及び決定木等である。
The
事例データ管理情報120は、学習処理に用いる学習データを管理するための情報である。本実施例の学習データは、過去の事例に基づいて生成されたデータである。以下の説明では、学習データを事例データとも記載する。
The case
計算機100−2は、任意のモデル(アルゴリズム)に基づいて、評価対象データ500を用いた推論を行い、推論結果を出力する計算機である。評価対象データ500を用いた推論は、例えば、分類及び事象の推論等である。計算機100−2は、推論を行う推論部111を備える。
The computer 100-2 is a computer that performs inference using the
なお、学習処理では、推論部111に事例データが入力され、推定処理では、推論部111に評価対象データ500が入力される。以下の説明では、評価対象データ500及び事例データを区別しない場合、入力データと記載する。
In the learning process, case data is input to the
計算機100−3は、推論部111を用いたAIシステムの運用環境を解析する計算機である。計算機100−3は、根拠ベクトル生成部112、解析部113、及び結果出力部114を備え、また、根拠ベクトル管理情報121を保持する。
The computer 100-3 is a computer that analyzes the operating environment of the AI system using the
根拠ベクトル生成部112は、推論結果を解釈するための指標となる根拠ベクトル502(図5参照)を生成する。根拠ベクトル502は、推論部111に入力したデータ(事例データ又は評価対象データ500)に含まれる各特徴量の推論結果に対する影響度を成分とするベクトルである。
The rationale
解析部113は、根拠ベクトル502を用いて、AIシステムの運用環境を解析する。
The
結果出力部114は、解析部113の解析結果に基づいて表示データを生成し、当該表示データを端末101に送信する。
The
なお、計算機100−1、100−2、100−3のいずれかは、端末101からの要求を受けつけるためのAPI(Application Programming Interface)を提供する操作受付部を有する。 In addition, any one of the computers 100-1, 100-2, and 100-3 has an operation reception unit that provides an API (Application Programming Interface) for receiving a request from the terminal 101.
ここで、計算機100のハードウェア構成について説明する。図2は、実施例1の計算機100のハードウェア構成の一例を示す図である。
Here, the hardware configuration of the
計算機100は、プロセッサ201、主記憶装置202、副記憶装置203、及びネットワークインタフェース204を有する。各ハードウェアは内部バスを介して互いに接続される。なお、計算機100は、副記憶装置203を有していなくてもよい。また、計算機100は、入力装置及び出力装置を有してもよい。
The
プロセッサ201は、主記憶装置202に格納されるプログラムを実行する。プロセッサ201がプログラムにしたがって処理を実行することによって、根拠ベクトル生成部112等、特定の機能を実現する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、プロセッサ201が当該機能部を実現するプログラムを実行していることを示す。
The
主記憶装置202は、プロセッサ201が実行するプログラム及び当該プログラムが使用する情報を格納する。また、主記憶装置202は、プログラムが一時的に使用するワークエリアを含む。
The main storage device 202 stores a program executed by the
計算機100−1の主記憶装置202は、学習部110を実現するためのプログラムを格納する。計算機100−2の主記憶装置202は、推論部111を実現するためのプログラムを格納する。計算機100−3の主記憶装置202は、根拠ベクトル生成部112、解析部113、及び結果出力部114を実現するためのプログラムを格納する。また、いずれかの計算機100−1、100−2、100−3の主記憶装置202は、操作受付部を実現するためのプログラムを格納する。
The main storage device 202 of the computer 100-1 stores a program for realizing the
副記憶装置203は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等、データを永続的に格納する。
The
計算機100−1の副記憶装置203は事例データ管理情報120を格納する。計算機100−2の副記憶装置203は、学習部110によって生成されたモデルの情報(図示省略)を格納する。計算機100−3の副記憶装置203は、根拠ベクトル管理情報121を格納する。
The
なお、各計算機100が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。また、各計算機100が有する機能を一つの計算機100にまとめてもよい。
Regarding each functional unit included in each
図3は、実施例1の事例データ管理情報120のデータ構造の一例を示す図である。
FIG. 3 is a diagram showing an example of the data structure of the case
事例データ管理情報120は、ID301、特徴量302、及び正解値303を含むエントリを複数格納する。一つのエントリが一つの事例データに対応する。
The case
ID301は、事例データの識別情報を格納するフィールドである。実施例1のID301には番号が格納される。
ID301 is a field for storing identification information of case data. A number is stored in the
特徴量302は、事例データを構成する項目の値である特徴量を格納するフィールド群である。項目は、例えば、築年数、駅距離、及び建築材等である。
The
正解値303は、事例データに対する推論の正解値を格納するフィールドである。正解値303に格納される値は予め与えられている。
The
なお、ユーザ又は計算機100は、正解値を対応づけた評価対象データ500を、事例データとして事例データ管理情報120に登録してもよい。
The user or the
図4は、実施例1の根拠ベクトル管理情報121のデータ構造の一例を示す図である。
FIG. 4 is a diagram showing an example of the data structure of the basis
根拠ベクトル管理情報121は、ID401、影響度402、推論結果403、及びクラスタ404を含むエントリを複数格納する。一つのエントリが一つの入力データの根拠ベクトル502に対応する。
The rationale
ID401は、入力データの識別情報を格納するフィールドである。
影響度402は、推論結果に対する各項目の特徴量の影響の大きさを表す影響度を格納するフィールド群である。実施例1では、影響度402に含まれる各フィールドの値を成分とするベクトルが根拠ベクトル502として扱われる。
The
推論結果403は、推論部111が出力した推論結果を格納するフィールドである。
The
クラスタ404は、入力データが属するクラスタの識別情報を格納するフィールドである。後述するように、根拠ベクトル502に基づいてクラスタリングが行われる。
The
図5は、実施例1の計算機システムの処理の流れを示す図である。 FIG. 5 is a diagram showing a processing flow of the computer system of the first embodiment.
図中の矢印はデータの流れを示す。実線は、事例データの根拠ベクトル502を生成するための処理におけるデータの流れを示す。点線は、評価対象データ500の推論結果を出力するための処理におけるデータの流れを示す。一点鎖線は、AIシステムの運用環境の解析結果を出力するための処理におけるデータの流れを示す。
The arrows in the figure indicate the data flow. The solid line shows the data flow in the process for generating the
まず、事例データの根拠ベクトル502を算出するための処理の流れについて説明する。
First, the flow of processing for calculating the
操作受付部は、端末101から推論部111の生成要求を受けつけた場合、計算機100−2にモデル生成指示を出力する。また、操作受付部は、端末101から事例データの根拠ベクトル502の生成要求を受けつけた場合、計算機100−3に事例データの根拠ベクトル502の生成指示を出力する。
When the operation reception unit receives the generation request of the
計算機100−2は、推論部111の生成指示を受信した場合、学習処理を実行し、推論部111に設定するモデルを生成する。
When the computer 100-2 receives the generation instruction of the
計算機100−3の根拠ベクトル生成部112は、事例データの根拠ベクトル502の生成指示を受信した場合、事例データに含まれる各特徴量の影響度を算出し、根拠ベクトル502を生成する。影響度を算出方法としては、非特許文献1から非特許文献3の技術を用いることが考えられる。
When the basis
非特許文献2に記載の算出方法を採用した場合、以下のような処理が実行される。指標算出部510は、事例データから計算用データを生成し、計算用データを推論部111に入力して推論結果を取得する。分配部511は、計算用データ及び推論結果を用いて、事例データに含まれる各特徴量の推論結果(正解値)への影響度を算出する。さらに、分配部511は、各特徴量の影響度を成分とする根拠ベクトル502を生成し、根拠ベクトル管理情報121に登録する。
When the calculation method described in
なお、指標算出部510及び分配部511は、必要に応じて、影響度を算出するための計算アルゴリズム520を参照する。計算アルゴリズム520は、例えば、非特許文献1から非特許文献3のいずれかを実現するアルゴリズムである。
The
次に、評価対象データ500の推論結果を出力するための処理の流れについて説明する。
Next, the flow of processing for outputting the inference result of the
操作受付部は、端末101から評価対象データ500を含む推論要求を受けつけた場合、計算機100−2に評価対象データ500を含む推論指示を出力する。また、操作受付部は、計算機100−3に評価対象データ500の根拠ベクトル502の生成指示を出力する。
When the operation reception unit receives an inference request including the
計算機100−2の推論部111は、推論指示を受信した場合、評価対象データ500を用いた推論を行い、操作受付部に推論結果501を出力する。操作受付部は、推論結果501を端末101に送信する。
When the
計算機100−3の根拠ベクトル生成部112は、評価対象データ500の根拠ベクトル502の算出指示を受信した場合、評価対象データ500の根拠ベクトル502を生成する。評価対象データ500の根拠ベクトル502の生成方法は、事例データの根拠ベクトル502の生成方法と同様であるため説明を省略する。根拠ベクトル生成部112は、評価対象データ500の根拠ベクトル502を根拠ベクトル管理情報121に登録する。
When the basis
次に、AIシステムの運用環境の解析結果を出力するための処理の流れについて説明する。 Next, the flow of processing for outputting the analysis result of the operating environment of the AI system will be described.
計算機100−3の解析部113は、操作受付部から環境解析指示を受けつけた場合、実行条件を満たした場合、又は、周期的に、環境解析処理を実行する。例えば、評価対象データ500の根拠ベクトル502の算出を実行条件として設定できる。解析部113は処理結果を結果出力部114に出力する。
The
計算機100−3の結果出力部114は、解析処理の結果を表示するための環境解析情報503を生成する。結果出力部114は、当該環境解析情報503を操作受付部に出力する。操作受付部は、環境解析情報503を端末101に送信する。
The
根拠ベクトル502は、推論部111(モデル)の特性を示す情報として扱うことができる。一方、影響度は推論部111の内部から取得される情報ではない。すなわち、根拠ベクトル502は、モデルの更新にかかわらず、一義的に解釈できる可読性の高い情報として使用できる。したがって、実施例1の計算機システムは、モデルが更新された場合でも、根拠ベクトル502を用いて、AIシステムの運用環境を自動的に解析することができる。
The
次に、具体的な処理の内容について説明する。まず、推論部111に設定するモデルを生成するための処理について説明する。
Next, the specific contents of the processing will be described. First, a process for generating a model to be set in the
図6は、実施例1の学習部110が実行するモデル生成処理の一例を説明するフローチャートである。
FIG. 6 is a flowchart illustrating an example of a model generation process executed by the
学習部110は、事例データ管理情報120から事例データを取得する(ステップS101)。なお、取得する事例データの数及び範囲は任意に設定できる。
The
学習部110は、事例データを用いて学習処理を実行する(ステップS102)。学習処理は公知の技術であるため詳細な説明は省略する。
The
学習部110は、終了条件を満たすか否かを判定する(ステップS103)。例えば、評価用のデータを用いた推論の精度が閾値より高い場合、学習部110は終了条件を満たすと判定する。また、学習処理の実行回数が閾値より大きい場合、学習部110は終了条件を満たすと判定する。
The
終了条件を満たさないと判定された場合、学習部110は、ステップS102に戻り、同様の処理を実行する。
If it is determined that the end condition is not satisfied, the
終了条件を満たすと判定された場合、学習部110はモデル生成処理を終了する。
When it is determined that the end condition is satisfied, the
図7は、実施例1の根拠ベクトル生成部112が実行する根拠ベクトル生成処理の一例を説明するフローチャートである。ここでは、非特許文献2に記載の算出方法を一例として根拠ベクトル生成処理を説明する。
FIG. 7 is a flowchart illustrating an example of the basis vector generation process executed by the basis
根拠ベクトル生成部112は入力データを取得する(ステップS201)。事例データの根拠ベクトル502を算出する場合、指標算出部510は事例データ管理情報120から事例データを取得する。評価対象データ500の根拠ベクトル502を算出する場合、指標算出部510は生成指示に含まれる評価対象データ500を取得する。
The basis
次に、根拠ベクトル生成部112は、入力データから計算用データを生成する(ステップS202)。
Next, the basis
具体的には、指標算出部510は、特徴量のバックグラウンドデータセットに基づいて、入力データの一部の項目の特徴量を変化させることによって計算用データを生成する。ここでは、一つの入力データからK個の計算用データが生成されるものとする。各計算用データには識別情報が付与される。
Specifically, the
計算アルゴリズム520には特徴量のバックグラウンドデータセットが格納される。また、変化させる特徴量の数、変化量、及び生成する計算用データの数等を決定するためのルールが計算アルゴリズム520に格納される。
The background data set of the feature quantity is stored in the
次に、根拠ベクトル生成部112は、変数kに初期値「1」を設定する(ステップS203)。
Next, the basis
次に、根拠ベクトル生成部112は、変数kに対応する計算用データの推論結果を取得する(ステップS204)。
Next, the basis
具体的には、指標算出部510は、変数kに対応する計算用データを推論部111に入力することによって推論結果を取得する。
Specifically, the
次に、根拠ベクトル生成部112は、主記憶装置202の記憶領域に計算用データ及び推論結果の組を格納する(ステップS205)。
Next, the basis
次に、根拠ベクトル生成部112は、変数kがKに一致するか否かを判定する(ステップS206)。すなわち、全ての計算用データの推論結果を取得したか否かが判定される。
Next, the basis
変数kがKに一致しないと判定された場合、根拠ベクトル生成部112は、変数kの値に1を加算した値を変数kに設定する(ステップS207)。その後、根拠ベクトル生成部112は、ステップS204に戻り、同様の処理を実行する。
When it is determined that the variable k does not match K, the basis
変数kがKに一致すると判定された場合、根拠ベクトル生成部112は、根拠ベクトル502を生成する(ステップS208)。
When it is determined that the variable k matches K, the rationale
具体的には、分配部511は、計算用データ及び推論結果の組を用いて、重回帰分析等の統計分析を実行することによって、推論結果に対する入力データの各項目の特徴量の影響度を算出する。さらに、分配部511は、各特徴量の影響度を成分とする根拠ベクトル502を生成する。
Specifically, the
次に、根拠ベクトル生成部112は、根拠ベクトル502を推論結果とともに根拠ベクトル管理情報121に登録する(ステップS209)。その後、根拠ベクトル生成部112は、根拠ベクトル生成処理を終了する。この時点では、登録された根拠ベクトル502に対応するエントリのクラスタ404は空欄である。
Next, the basis
なお、非特許文献3に記載の算出方法では、指標算出部510は特徴マップを算出し、分配部511は、特徴マップの各座標の平均値に各クラスのチャネルの重要度を乗算した値の総和を影響度として算出する。
In the calculation method described in
図8は、実施例1の解析部113が実行する環境解析処理の一例を説明するフローチャートである。
FIG. 8 is a flowchart illustrating an example of the environment analysis process executed by the
解析部113は、根拠ベクトル管理情報121から根拠ベクトル502を取得する(ステップS301)。
The
なお、解析部113は、クラスタ404が空欄のエントリに対応する根拠ベクトル502のみを取得してもよい。
Note that the
解析部113は、根拠ベクトル502を用いたクラスタリングを実行することによって、入力データのクラスタを生成する(ステップS302)。
The
このとき、解析部113は、クラスタリングの結果に基づいて、根拠ベクトル管理情報121の各エントリのクラスタ404の値を更新する。また、解析部113は、クラスタリングの結果に基づいてクラスタ情報を生成する。クラスタ情報のデータ構造は根拠ベクトル管理情報121と同一である。
At this time, the
次に、解析部113は、ソート条件に基づいて入力データをソートする(ステップS303)。ソート条件は予め設定されているものとする。なお、解析部113は、操作受付部を介して端末101からソート条件を受けつけてもよい。
Next, the
ソート条件としては、時系列、特徴量、影響度、推論結果、及び入力データの識別情報等が考えられる。複数の観点を組み合わせたソート条件でもよい。また、クラスタリングの結果を用いたソート条件でもよい。 As the sorting condition, a time series, a feature amount, an influence degree, an inference result, identification information of input data, and the like can be considered. A sort condition that combines a plurality of viewpoints may be used. Further, a sort condition using the result of clustering may be used.
解析部113は、過去に生成されたクラスタ情報が存在するか否かを判定する(ステップS304)。過去に生成されたクラスタ情報が存在しない場合とは、初めて、環境解析処理が実行される場合である。
The
過去に生成されたクラスタ情報が存在しないと判定された場合、解析部113は、各クラスタの特性を解析する(ステップS305)。
When it is determined that the cluster information generated in the past does not exist, the
例えば、解析部113は、クラスタに属する入力データの影響度が大きい特徴量の範囲等を特定する。また、解析部113は、クラスタに属する入力データの推論結果の傾向を特定する。
For example, the
次に、解析部113は、クラスタ情報、ソート結果、及び解析結果を結果出力部114に出力する(ステップS306)。その後、解析部113は環境解析処理を終了する。すなわち、初めて環境解析処理が実行された場合、現在のAIシステムの運用環境を示す情報が結果出力部114から出力される。
Next, the
ステップS304において、過去に生成されたクラスタ情報が存在すると判定された場合、解析部113は、過去に生成されたクラスタ情報と、今回生成されたクラスタ情報とを比較し、新規クラスタが出現したか否かを判定する(ステップS307)。
If it is determined in step S304 that the cluster information generated in the past exists, the
なお、過去に生成されたクラスタ情報が複数存在する場合、解析部113は、時系列が最も新しいクラスタ情報と、今回生成されたクラスタ情報とを比較する。
When a plurality of cluster information generated in the past exists, the
新規クラスタが出現していないと判定された場合、解析部113は、クラスタ情報及びソート結果を結果出力部114に出力する(ステップS308)。その後、解析部113は環境解析処理を終了する。この場合、現在のAIシステムの運用環境を示す情報が結果出力部114から出力される。
When it is determined that no new cluster has appeared, the
なお、解析部113は、属する入力データの数が変化したクラスタの特性を解析し、当該解析結果を出力してもよい。
The
新規クラスタが出現していると判定された場合、解析部113は、新規クラスタに属する入力データの特性を解析する(ステップS309)。解析方法は、ステップS305と同一である。
When it is determined that a new cluster has appeared, the
次に、解析部113は、クラスタ情報、ソート結果、解析結果、及び環境変化通知を結果出力部114に出力する(ステップS310)。その後、解析部113は環境解析処理を終了する。この場合、現在のAIシステムの運用環境を示す情報、及び運用環境の変化が検知されたことを示す情報が結果出力部114から出力される。
Next, the
なお、解析部113は、属する入力データの数が変化したクラスタの特性を解析し、当該解析結果を出力してもよい。
The
本実施例では、根拠ベクトル502の成分を軸とする特徴量空間上でクラスタリングが行われる。根拠ベクトル502は、評価対象データ500に対する推論部111の挙動を表す情報である。したがって、新規クラスタの出現は、推論部111がこれまでとは異なる挙動をしていることを示す。すなわち、新規クラスタの出現は、今までの運用環境では想定していなかった評価対象データ500が入力されたことを示す。このように、根拠ベクトル502を用いることによってAIシステムの運用環境を的確に把握できる。
In this embodiment, clustering is performed on the feature space centered on the component of the
また、根拠ベクトル502は、推論部111の内部情報から生成された情報ではないため、推論部111が更新されても取扱いは変わらない。そのため、根拠ベクトル502を解釈するための労力及び時間は必要ない。さらに、モデルの構造に限定されない。
Further, since the
次に、解析部113から出力された情報に基づく表示について説明する。
Next, the display based on the information output from the
図9、図10A、図10B、及び図11は、実施例1の結果出力部114が生成した環境解析情報503に基づいて表示される画面の一例を示す図である。
9, FIG. 10A, FIG. 10B, and FIG. 11 are diagrams showing an example of a screen displayed based on the
図9は、クラスタ情報及び環境変化通知に基づいて生成された環境解析情報503により表示される画面900の一例を示す。
FIG. 9 shows an example of the
画面900には、根拠ベクトル502の成分を軸とする特徴量空間上のクラスタを示すグラフ910が表示される。グラフ910には根拠ベクトル502がプロットされる。また、グラフ910には、クラスタ情報に基づいて三つのクラスタ911−1、911−2、911−3が表示される。各クラスタ911には、解析結果に基づいて吹出912が表示される。
On the
クラスタ911−1、911−2は、既存のクラスタである。クラスタ911−3は新規クラスタである。クラスタ911−3は環境変化通知に基づいて強調表示される。 Clusters 911-1 and 911-2 are existing clusters. Cluster 911-3 is a new cluster. Cluster 911-3 is highlighted based on the environmental change notification.
なお、クラスタ情報のみから生成された環境解析情報503により表示される画面では、全てのクラスタ911が同じ表示形式で表示される。
On the screen displayed by the
図10A及び図10Bは、ソート結果に基づいて生成された環境解析情報503により表示される画面1000の一例を示す。
10A and 10B show an example of the
画面1000には、ソート結果を示すグラフ1010が表示される。図10Aのグラフ1010の縦軸は推定結果を示し、横軸はクラスタを示す。図10Bのグラフ1010の縦軸は推定結果を示し、横軸は時刻を示す。
A
図10Aのグラフ1010には、入力データの根拠ベクトル502を表すアイコン1011を用いた入力データのソート結果が表示される。アイコン1011は、影響度はアイコン1011内の領域の大きさとして表される。アイコン1011の白部分は正の影響度を表し、斜線部分は負の影響度を表す。アイコン1011の大きさは推論結果に基づいて決定される。グラフ1010には、解析結果に基づいて吹出1012が表示される。また、アイコン1011は、属するクラスタを明示する情報を付与してもよい。図10Aでは、属するクラスタに応じてアイコン1011の外枠を変えている。
In the
ユーザは、図10Aの画面1000に基づいて、クラスタにおける入力データの特性等を把握することができる。
The user can grasp the characteristics of the input data in the cluster based on the
図10Bのグラフ1010には、アイコン1011及びポインタ1013が表示される。ポインタ1013は、運用環境が変化した推定時刻を示す。
The
ユーザは、図10Bの画面1000に基づいて、運用環境が変化した時刻を把握することができる。
The user can grasp the time when the operating environment has changed based on the
図11は、クラスタ情報に基づいて生成された環境解析情報503により表示される画面1100の一例を示す。
FIG. 11 shows an example of the
画面1100には、入力データの根拠ベクトル502を表すアイコン1101が表示される。ユーザが所定の領域にポインタ1102を合わせた場合、当該領域の入力データの特徴量及び影響度が表示される。
On the
なお、図9、図10A、図10B、及び図11で説明した画面は一例であってこれに限定されない。同様の情報を提示できる画面であればよい。 The screens described with reference to FIGS. 9, 10A, 10B, and 11 are merely examples and are not limited thereto. Any screen that can present similar information will do.
以上で説明したように、実施例1の計算機システムは、根拠ベクトル502を用いたクラスタリングによって生成されたクラスタに関する情報を提示できる。根拠ベクトル502は、入力データと推論部111との関係性を示す情報であり、可読性に優れている。したがって、クラスタに関する情報は、AIシステムの運用環境を把握のための可読性に優れた情報として扱うことができる。
As described above, the computer system of the first embodiment can present information about the cluster generated by the clustering using the
また、従来技術では、モデルの更新とともに内部情報の解釈方法も変更する必要があるため、自動的な環境変化の検知が困難であった。一方、実施例1では、モデルの内部情報に依存せず、かつ、モデルの挙動を示す根拠ベクトル502を用いているため、自動的な環境変化の検知が可能である。
Further, in the prior art, it is difficult to automatically detect environmental changes because it is necessary to change the interpretation method of internal information as the model is updated. On the other hand, in the first embodiment, since the
実施例2の計算機システムは、推論部111の推論精度の低下を検知する。以下、実施例1との差異を中心に実施例2について説明する。
The computer system of the second embodiment detects a decrease in the inference accuracy of the
実施例2のシステム構成は実施例1と同一である。実施例2の計算機100のハードウェア構成及びソフトウェア構成は実施例1と同一である。実施例2で扱う情報は実施例1と同一である。また、実施例2の学習部110、推論部111、根拠ベクトル生成部112、及び結果出力部114が実行する処理は実施例1と同一である。
The system configuration of the second embodiment is the same as that of the first embodiment. The hardware configuration and software configuration of the
実施例2では、解析部113が実行する処理が一部異なる。図12は、実施例2の計算機システムの処理の流れを示す図である。
In the second embodiment, the processing executed by the
実施例2では、評価対象データ500に対応づけられた正解データ504が解析部113に入力される。正解データ504は、評価対象データ500の識別情報と、評価対象データ500に対する推論の正解とを含む。
In the second embodiment, the
正解データ504は、環境解析処理の実行前に入力されてもよいし、また、ステップS307の判定結果がYESの場合に入力してもよい。
The
図13は、実施例2の解析部113が実行する環境解析処理の一例を説明するフローチャートである。
FIG. 13 is a flowchart illustrating an example of the environment analysis process executed by the
ステップS301からステップS309までの処理の流れは実施例1と同一である。ステップS309の処理が実行された後、解析部113は、新規クラスタに属する評価対象データ500の推論誤差を算出する(ステップS351)。
The processing flow from step S301 to step S309 is the same as that in the first embodiment. After the process of step S309 is executed, the
推論部111が出力する推論結果が数値である場合、解析部113は、推論結果及び正解の差を推論誤差として算出する。推論部111が出力する推論結果が数値以外の値である場合、解析部113は、推論結果及び正解が一致する場合は「1」、推論結果及び正解が一致しない場合は「0」を推論誤差として算出する。なお、前述した算出方法は一例であってこれに限定されない。
When the inference result output by the
次に、解析部113は、推論誤差の平均値が閾値以上であるか否かを判定する(ステップS352)。閾値は予め設定されているものとする。すなわち、推論部111の推論精度が低下しているか否かが判定される。
Next, the
推論誤差の平均値が閾値より小さいと判定された場合、解析部113はステップS310に進む。実施例2のステップS310の処理は実施例1と同一である。
If it is determined that the average value of the inference error is smaller than the threshold value, the
推論誤差の平均値が閾値以上であると判定された場合、解析部113は、クラスタ情報、ソート結果、解析結果、環境変化通知、及びアラートを結果出力部114に出力する(ステップS353)。その後、解析部113は、環境解析処理を終了する。この場合、現在のAIシステムの運用環境を示す情報、運用環境の変化が検知されたことを示す情報、及び推論部111の推論精度が低下したことを示す情報が結果出力部114から出力される。
When it is determined that the average value of the inference error is equal to or greater than the threshold value, the
なお、解析部113は、属する入力データの数が変化したクラスタの特性を解析し、当該解析結果を出力してもよい。
The
なお、クラスタの特性の解析において、解析部113は、クラスタに属する評価対象データ500の推論誤差の平均値を算出してもよい。
In the analysis of the characteristics of the cluster, the
図14は、実施例2の結果出力部114が生成した環境解析情報503に基づいて表示される画面の一例を示す図である。
FIG. 14 is a diagram showing an example of a screen displayed based on the
図14は、クラスタ情報、環境変化通知、及びアラートに基づいて生成された環境解析情報503により表示される画面900の一例を示す。
FIG. 14 shows an example of the
実施例2では、吹出912にクラスタ911に属する評価対象データ500の推論誤差の平均値が含まれる。また、推論誤差の平均値が閾値以上である場合、アラートに基づいて吹出912の推論誤差の平均値が強調表示される。
In the second embodiment, the
実施例2によれば、AIシステムの運用環境を把握のための可読性に優れた情報を出力することができる。また、計算機システムは、推論精度の低下を検知できる。これによって、再学習の自動化、及び、ユーザへの再学習の推奨が可能となる。 According to the second embodiment, it is possible to output highly readable information for grasping the operating environment of the AI system. In addition, the computer system can detect a decrease in inference accuracy. This makes it possible to automate re-learning and recommend re-learning to users.
実施例3の計算機システムは、AIシステムの運用環境の変化に合わせて根拠ベクトル502の算出方法(計算アルゴリズム520)を更新する。以下、実施例1との差異を中心に実施例3について説明する。
The computer system of the third embodiment updates the calculation method (calculation algorithm 520) of the
図15は、実施例3の計算機システムの構成例を示す図である。 FIG. 15 is a diagram showing a configuration example of the computer system of the third embodiment.
図15に示すように実施例3のシステム構成は実施例1と同一である。実施例3の計算機100のハードウェア構成は実施例1と同一である。実施例3の計算機100−1、100−2のソフトウェア構成は実施例1と同一である。
As shown in FIG. 15, the system configuration of the third embodiment is the same as that of the first embodiment. The hardware configuration of the
実施例3では、計算機100−3のソフトウェア構成が一部異なる。具体的には、実施例3の計算機100−3は、計算アルゴリズム520を更新するアルゴリズム更新部115を含む。
In the third embodiment, the software configuration of the computer 100-3 is partially different. Specifically, the computer 100-3 of the third embodiment includes an
実施例3の学習部110、推論部111、根拠ベクトル生成部112、及び結果出力部114が実行する処理は実施例1と同一である。
The processing executed by the
実施例3では、解析部113が実行する処理が一部異なる。図16は、実施例3の計算機システムの処理の流れを示す図である。
In the third embodiment, the processing executed by the
実施例3では、解析部113が、クラスタに属する入力データの解析結果をアルゴリズム更新部115に出力する。アルゴリズム更新部115は、当該解析結果に基づいて、計算アルゴリズム520を更新する。
In the third embodiment, the
図17は、実施例3の解析部113が実行する環境解析処理の一例を説明するフローチャートである。
FIG. 17 is a flowchart illustrating an example of the environment analysis process executed by the
ステップS301からステップS309までの処理の流れは実施例1と同一である。ステップS309の処理が実行された後、解析部113は、解析結果をアルゴリズム更新部115に出力する(ステップS361)。その後、ステップS310に進む。実施例3のステップS310の処理は実施例1と同一である。
The processing flow from step S301 to step S309 is the same as that in the first embodiment. After the process of step S309 is executed, the
図18は、実施例3のアルゴリズム更新部115が実行するアルゴリズム更新処理の一例を説明するフローチャートである。
FIG. 18 is a flowchart illustrating an example of the algorithm update process executed by the
アルゴリズム更新部115は、解析部113から解析結果を受けつけた場合、アルゴリズム更新処理を実行する。
When the
アルゴリズム更新部115は、根拠ベクトル生成部112から計算アルゴリズム520の定義情報を取得する(ステップS401)。
The
アルゴリズム更新部115は、解析結果に基づいて、計算アルゴリズム520の定義情報を更新する(ステップS402)。
The
アルゴリズム更新部115は、更新された計算アルゴリズム520の定義情報を根拠ベクトル生成部112に出力する(ステップS403)。その後、アルゴリズム更新部115はアルゴリズム更新処理を終了する。
The
ここで、具体例を用いて計算アルゴリズム520の更新方法について説明する。ここでは、非特許文献2に記載の処理を実現する計算アルゴリズム520及び非特許文献3に記載の処理を実現する計算アルゴリズム520の更新方法について説明する。
Here, a method of updating the
(1)非特許文献2
非特許文献2に記載の処理では、バックグラウンドデータセットを用いて計算用データが生成される。非特許文献2に記載の処理を採用する場合、バックグラウンドデータセットが計算アルゴリズム520に含まれる。
(1)
In the process described in
ここでは、各特徴量の平均値がバックグラウンドデータセットとして定義されているものとする。この場合、根拠ベクトル生成部112は、各特徴量を平均値の範囲内で増減させることによって計算用データを生成する。例えば、入力データの変数x1の特徴量が8で、平均値が5である場合、根拠ベクトル生成部112は、3から13の範囲で変数x1の特徴量を変化させた計算用データを生成する。
Here, it is assumed that the average value of each feature is defined as a background data set. In this case, the basis
アルゴリズム更新部115は、解析結果に基づいて各特徴量の平均値を算出する。アルゴリズム更新部115は、算出結果をバックグラウンドデータセットに反映させることによって計算アルゴリズム520を更新する。
The
(2)非特許文献3
CNNの出力の特徴マップの各クラスへの分類スコアScは式(1)で算出される。Cはクラスを表す。Aijは特徴マップを表し、wk cは重みを表す。また、i、jはピクセルの座標を表す。Zは特徴マップのサイズを表す。
(2)
Classification score S c to each class of feature map of CNN output is calculated by the equation (1). C represents a class. A ij represents a feature map and w k c represents a weight. Further, i and j represent the coordinates of the pixel. Z represents the size of the feature map.
重みは入力したデータがクラスCと分類するための式(2)の重要度と理解される。 The weight is understood as the importance of equation (2) for classifying the input data as class C.
ここで、式(1)の有限和の順序を入れ替えて式(3)のように変形する。 Here, the order of the finite sum of the equation (1) is changed and transformed as in the equation (3).
このとき、式(3)の括弧内の項は、ピクセル(i.j)がクラスCに分類される影響の大きさと理解できる。ここで、重みは式(4)のように算出できる。ここでyCは推論部111の推論結果501を表す。
At this time, the term in parentheses in the equation (3) can be understood as the magnitude of the influence that the pixel (i.j) is classified into the class C. Here, the weight can be calculated as in the equation (4). Here, y C represents the
非特許文献3では、式(5)に示すような影響度(重要度)を特徴マップの各チャネルの重み付き和として可視化している。
In
式(4)に示すように、重みは、AIシステムの運用環境、特に、特徴量の分布の変化の影響を受ける。そこで、アルゴリズム更新部115は、特徴量の分布の変化に基づいて重みを補正する。
As shown in equation (4), the weight is affected by the operating environment of the AI system, especially the change in the distribution of features. Therefore, the
具体的には、アルゴリズム更新部115は、解析結果に基づいて各特徴量の平均値を算出する。アルゴリズム更新部115は、算出結果に基づいて入力データから計算用データを生成する。アルゴリズム更新部115は、計算用データを推論部111に入力して推論結果501を取得する。
Specifically, the
アルゴリズム更新部115は、入力データの推論結果501(yc)と計算用データの推論結果501(y’c)を用いて重みを補正する。具体的には、式(6)を用いて重みを算出する。
なお、アルゴリズム更新部115は、異なる入力データ及び計算用データのペアを生成し、yc−y’c空間にプロットすることによって、式(7)の勾配を算出してもよい。
Incidentally, the
実施例3によれば、AIシステムの運用環境の変化に合わせて、根拠ベクトル502を算出するための計算アルゴリズム520を自動的に更新することができる。これによって、AIシステムの運用環境を監視するためのアルゴリズムの開発及び解釈の定義等を行う必要がない。
According to the third embodiment, the
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。 The present invention is not limited to the above-described examples, and includes various modifications. Further, for example, the above-described embodiment describes the configuration in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to the one including all the described configurations. In addition, a part of the configuration of each embodiment can be added, deleted, or replaced with another configuration.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。 Further, each of the above configurations, functions, processing units, processing means and the like may be realized by hardware by designing a part or all of them by, for example, an integrated circuit. The present invention can also be realized by a program code of software that realizes the functions of the examples. In this case, a storage medium in which the program code is recorded is provided to the computer, and the processor included in the computer reads out the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the program code itself and the storage medium storing the program code itself constitute the present invention. Examples of the storage medium for supplying such a program code include a flexible disk, a CD-ROM, a DVD-ROM, a hard disk, an SSD (Solid State Drive), an optical disk, a magneto-optical disk, a CD-R, and a magnetic tape. Non-volatile memory cards, ROMs, etc. are used.
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。 In addition, the program code that realizes the functions described in this embodiment can be implemented in a wide range of programs or script languages such as assembler, C / C ++, perl, Shell, PHP, and Java (registered trademark).
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。 Further, by distributing the program code of the software that realizes the functions of the examples via the network, it is stored in a storage means such as a hard disk or memory of a computer or a storage medium such as a CD-RW or a CD-R. , The processor provided in the computer may read and execute the program code stored in the storage means or the storage medium.
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。 In the above-described embodiment, the control lines and information lines show what is considered necessary for explanation, and do not necessarily indicate all the control lines and information lines in the product. All configurations may be interconnected.
100 計算機
101 端末
105 ネットワーク
110 学習部
111 推論部
112 根拠ベクトル生成部
113 解析部
114 結果出力部
115 アルゴリズム更新部
120 事例データ管理情報
121 根拠ベクトル管理情報
201 プロセッサ
202 主記憶装置
203 副記憶装置
204 ネットワークインタフェース
500 評価対象データ
501 推論結果
502 根拠ベクトル
503 環境解析情報
504 正解データ
510 指標算出部
511 分配部
520 計算アルゴリズム
900、1000、1100 画面
100
Claims (14)
プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを有する少なくとも一つの計算機を含み、
複数の特徴量を含むデータを前記推論部に入力することによって得られた推論結果を解釈するための解釈指標を算出する解釈指標算出部と、
前記解釈指標に基づいて、現在の前記業務システムの運用環境を解析し、前記解析の結果を出力する解析部と、を備え、
前記解釈指標は、前記推論部に入力された前記データに含まれる前記複数の特徴量の各々の前記推論結果に対する影響度を成分とする根拠ベクトルであることを特徴とする計算機システム。 A computer system that analyzes the operating environment of a business system that has an inference unit that makes inferences.
Includes a processor, memory connected to the processor, and at least one calculator having a network interface connected to the processor.
An interpretation index calculation unit that calculates an interpretation index for interpreting the inference result obtained by inputting data including a plurality of features into the inference unit, and an interpretation index calculation unit.
It is provided with an analysis unit that analyzes the current operating environment of the business system based on the interpretation index and outputs the result of the analysis.
The computer system is characterized in that the interpretation index is a basis vector whose component is the degree of influence of each of the plurality of feature quantities included in the data input to the inference unit on the inference result.
前記解析部は、
前記根拠ベクトルを用いたクラスタリングを実行し、
前記クラスタリングの結果に基づいて、前記業務システムの運用環境の変化が発生したか否かを判定し、
前記クラスタリングの結果及び前記判定の結果を出力することを特徴とする計算機システム。 The computer system according to claim 1.
The analysis unit
Perform clustering using the rationale vector
Based on the result of the clustering, it is determined whether or not a change in the operating environment of the business system has occurred.
A computer system characterized by outputting the result of the clustering and the result of the determination.
前記解析部は、
前記クラスタリングの結果に基づいてクラスタ情報を生成し、
過去に生成された前記クラスタ情報と、新たに生成された前記クラスタ情報とを比較することによって、新規クラスタが出現したか否かを判定し、
前記新規クラスタが出現した場合、前記業務システムの運用環境の変化が発生したと判定することを特徴とする計算機システム。 The computer system according to claim 2.
The analysis unit
Cluster information is generated based on the result of the clustering.
By comparing the cluster information generated in the past with the newly generated cluster information, it is determined whether or not a new cluster has appeared.
A computer system characterized in that when a new cluster appears, it is determined that a change in the operating environment of the business system has occurred.
前記解析部は、
前記新規クラスタに属する前記データの前記推論結果の精度を解析することによって、前記推論部の推論の精度が低下しているか否かを判定し、
前記推論部の推論の精度が低下していると判定された場合、前記推論部の推論の精度の低下を通知する情報を出力することを特徴とする計算機システム。 The computer system according to claim 3.
The analysis unit
By analyzing the accuracy of the inference result of the data belonging to the new cluster, it is determined whether or not the inference accuracy of the inference unit is lowered.
A computer system characterized in that when it is determined that the inference accuracy of the inference unit is reduced, information for notifying the decrease in the inference accuracy of the inference unit is output.
前記解析部は、ソート条件に基づいて、前記データをソートし、前記ソートの結果を出力することを特徴とする計算機システム。 The computer system according to claim 2.
A computer system characterized in that the analysis unit sorts the data based on sort conditions and outputs the result of the sort.
前記ソート条件は、前記特徴量、前記根拠ベクトル、前記データの時系列、前記データが属するクラスタ、前記推論結果、及び前記推論結果の精度の少なくともいずれかであることを特徴とする計算機システム。 The computer system according to claim 5.
A computer system characterized in that the sort condition is at least one of the feature amount, the basis vector, the time series of the data, the cluster to which the data belongs, the inference result, and the accuracy of the inference result.
前記解釈指標算出部は、計算アルゴリズムに基づいて前記解釈指標を算出し、
前記解析部は、前記解析の結果に基づいて、前記計算アルゴリズムを更新することを特徴とする計算機システム。 The computer system according to claim 1.
The interpretation index calculation unit calculates the interpretation index based on the calculation algorithm.
The analysis unit is a computer system characterized in that the calculation algorithm is updated based on the result of the analysis.
前記計算機システムは、プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを有する少なくとも一つの計算機を含み、
前記業務システムの運用環境の解析方法は、
前記少なくとも一つの計算機が、複数の特徴量を含むデータを前記推論部に入力することによって得られた推論結果を解釈するための解釈指標を算出する第1のステップと、
前記少なくとも一つの計算機が、前記解釈指標に基づいて、現在の前記業務システムの運用環境を解析し、前記解析の結果を出力する第2のステップと、含み、
前記解釈指標は、前記推論部に入力された前記データに含まれる前記複数の特徴量の各々の前記推論結果に対する影響度を成分とする根拠ベクトルであることを特徴とする業務システムの運用環境の解析方法。 It is an analysis method of the operating environment of a business system that has an inference unit that performs inference, which is executed by a computer system.
The computer system includes a processor, a memory connected to the processor, and at least one computer having a network interface connected to the processor.
The method of analyzing the operating environment of the business system is as follows.
A first step in which the at least one computer calculates an interpretation index for interpreting an inference result obtained by inputting data including a plurality of feature quantities into the inference unit.
The at least one computer analyzes the current operating environment of the business system based on the interpretation index, and includes a second step of outputting the result of the analysis.
The interpretation index is a basis vector whose component is the degree of influence of each of the plurality of feature quantities included in the data input to the inference unit on the inference result. analysis method.
前記第2のステップは、
前記少なくとも一つの計算機が、前記根拠ベクトルを用いたクラスタリングを実行する第3のステップと、
前記少なくとも一つの計算機が、前記クラスタリングの結果に基づいて、前記業務システムの運用環境の変化が発生したか否かを判定する第4のステップと、
前記少なくとも一つの計算機が、前記クラスタリングの結果及び前記判定の結果を出力する第5のステップと、を含むことを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 8.
The second step is
A third step in which the at least one computer performs clustering using the rationale vector,
A fourth step in which the at least one computer determines whether or not a change in the operating environment of the business system has occurred based on the result of the clustering.
A method for analyzing an operating environment of a business system, wherein the at least one computer includes a fifth step of outputting the result of the clustering and the result of the determination.
前記第3のステップは、前記少なくとも一つの計算機が、前記クラスタリングの結果に基づいてクラスタ情報を生成するステップを含み、
前記第4のステップは、
前記少なくとも一つの計算機が、過去に生成された前記クラスタ情報と、新たに生成された前記クラスタ情報とを比較することによって、新規クラスタが出現したか否かを判定するステップと、
前記少なくとも一つの計算機が、前記新規クラスタが出現した場合、前記業務システムの運用環境の変化が発生したと判定するステップと、を含むことを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 9.
The third step includes a step in which the at least one computer generates cluster information based on the result of the clustering.
The fourth step is
A step in which the at least one computer determines whether or not a new cluster has appeared by comparing the cluster information generated in the past with the newly generated cluster information.
A method for analyzing the operating environment of a business system, which comprises a step of determining that a change in the operating environment of the business system has occurred when the new cluster appears.
前記第4のステップは、
前記少なくとも一つの計算機が、前記新規クラスタに属する前記データの前記推論結果の精度を解析することによって、前記推論部の推論の精度が低下しているか否かを判定するステップと、
前記推論部の推論の精度が低下していると判定された場合、前記少なくとも一つの計算機が、前記推論部の推論の精度の低下を通知する情報を出力するステップと、を含むことを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 10.
The fourth step is
A step in which the at least one computer analyzes the accuracy of the inference result of the data belonging to the new cluster to determine whether or not the inference accuracy of the inference unit is lowered.
When it is determined that the inference accuracy of the inference unit is low, the at least one computer includes a step of outputting information notifying that the inference accuracy of the inference unit is low. How to analyze the operating environment of the business system to be used.
前記第2のステップは、
前記少なくとも一つの計算機が、ソート条件に基づいて、前記データをソートするステップと、
前記少なくとも一つの計算機が、前記ソートの結果を出力するステップと、を含むことを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 9.
The second step is
A step in which the at least one computer sorts the data based on the sorting conditions.
A method for analyzing an operating environment of a business system, wherein the at least one computer includes a step of outputting the result of the sort.
前記ソート条件は、前記特徴量、前記根拠ベクトル、前記データの時系列、前記データが属するクラスタ、前記推論結果、及び前記推論結果の精度の少なくともいずれかであることを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 12.
The operation of the business system, wherein the sort condition is at least one of the feature amount, the basis vector, the time series of the data, the cluster to which the data belongs, the inference result, and the accuracy of the inference result. How to analyze the environment.
前記第1のステップは、前記少なくとも一つの計算機が、計算アルゴリズムに基づいて前記解釈指標を算出するステップを含み、
前記解析方法は、前記少なくとも一つの計算機が、前記解析の結果に基づいて、前記計算アルゴリズムを更新するステップを含むことを特徴とする業務システムの運用環境の解析方法。 The method for analyzing the operating environment of the business system according to claim 8.
The first step includes a step in which the at least one computer calculates the interpretation index based on a calculation algorithm.
The analysis method is a method for analyzing an operating environment of a business system, wherein the at least one computer includes a step of updating the calculation algorithm based on the result of the analysis.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019236299A JP2021105807A (en) | 2019-12-26 | 2019-12-26 | Computer system and method for analyzing operating environment of business system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019236299A JP2021105807A (en) | 2019-12-26 | 2019-12-26 | Computer system and method for analyzing operating environment of business system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021105807A true JP2021105807A (en) | 2021-07-26 |
JP2021105807A5 JP2021105807A5 (en) | 2022-05-06 |
Family
ID=76918893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019236299A Pending JP2021105807A (en) | 2019-12-26 | 2019-12-26 | Computer system and method for analyzing operating environment of business system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021105807A (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194791A (en) * | 2014-03-31 | 2015-11-05 | 日本電気株式会社 | Pos terminal equipment |
JP2017076287A (en) * | 2015-10-15 | 2017-04-20 | キヤノン株式会社 | Data analysis device, data analysis method, and program |
JP2017117034A (en) * | 2015-12-22 | 2017-06-29 | 株式会社日立製作所 | Diagnosis device and diagnostic method |
WO2018015988A1 (en) * | 2016-07-19 | 2018-01-25 | 株式会社オプティム | Person painting identification system, person painting identification method, and program |
JP2019082883A (en) * | 2017-10-31 | 2019-05-30 | 株式会社デンソー | Inference device, inference method and program |
JP2021018466A (en) * | 2019-07-17 | 2021-02-15 | 株式会社PKSHA Technology | Rule extracting apparatus, information processing apparatus, rule extracting method, and rule extracting program |
-
2019
- 2019-12-26 JP JP2019236299A patent/JP2021105807A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194791A (en) * | 2014-03-31 | 2015-11-05 | 日本電気株式会社 | Pos terminal equipment |
JP2017076287A (en) * | 2015-10-15 | 2017-04-20 | キヤノン株式会社 | Data analysis device, data analysis method, and program |
JP2017117034A (en) * | 2015-12-22 | 2017-06-29 | 株式会社日立製作所 | Diagnosis device and diagnostic method |
WO2018015988A1 (en) * | 2016-07-19 | 2018-01-25 | 株式会社オプティム | Person painting identification system, person painting identification method, and program |
JP2019082883A (en) * | 2017-10-31 | 2019-05-30 | 株式会社デンソー | Inference device, inference method and program |
JP2021018466A (en) * | 2019-07-17 | 2021-02-15 | 株式会社PKSHA Technology | Rule extracting apparatus, information processing apparatus, rule extracting method, and rule extracting program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240185133A1 (en) | Root cause discovery engine | |
Churpek et al. | Multicenter comparison of machine learning methods and conventional regression for predicting clinical deterioration on the wards | |
Lee et al. | Finding the non-dominated Pareto set for multi-objective simulation models | |
US8494996B2 (en) | Creation and revision of network object graph topology for a network performance management system | |
JP6975692B2 (en) | Method of presenting information related to the basis of the predicted value output by the computer system and the predictor. | |
Schmiester et al. | Efficient parameterization of large-scale dynamic models based on relative measurements | |
US20210319366A1 (en) | Method, apparatus and device for generating model and storage medium | |
US20130332812A1 (en) | Method and system to generate a process flow diagram | |
Deelman et al. | The role of machine learning in scientific workflows | |
Lievens et al. | Supervised ranking in the WEKA environment | |
JP7057761B2 (en) | Computer system and information presentation method | |
JP7051724B2 (en) | How to present useful information to achieve the purpose of the computer system and the target. | |
US20210174217A1 (en) | Systems and methods driven by link-specific numeric information for predicting associations based on predicate types | |
US20220207414A1 (en) | System performance optimization | |
Wang et al. | A novel graph clustering method with a greedy heuristic search algorithm for mining protein complexes from dynamic and static PPI networks | |
JP2021064049A (en) | Calculator system and mathematical model generation support method | |
US20210248482A1 (en) | Maintaining a knowledge database based on user interactions with a user interface | |
Trivodaliev et al. | Exploring function prediction in protein interaction networks via clustering methods | |
Wang et al. | Integrating ε-dominance and RBF surrogate optimization for solving computationally expensive many-objective optimization problems | |
CN111209930A (en) | Method and device for generating credit granting strategy and electronic equipment | |
CN104573127B (en) | Assess the method and system of data variance | |
CN111582313A (en) | Sample data generation method and device and electronic equipment | |
JP2021105807A (en) | Computer system and method for analyzing operating environment of business system | |
US20220083703A1 (en) | Customizable reinforcement learning of column placement in structural design | |
CN114282121A (en) | Service node recommendation method, system, device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220422 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220422 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230516 |