JP7292235B2 - Analysis support device and analysis support method - Google Patents

Analysis support device and analysis support method Download PDF

Info

Publication number
JP7292235B2
JP7292235B2 JP2020052908A JP2020052908A JP7292235B2 JP 7292235 B2 JP7292235 B2 JP 7292235B2 JP 2020052908 A JP2020052908 A JP 2020052908A JP 2020052908 A JP2020052908 A JP 2020052908A JP 7292235 B2 JP7292235 B2 JP 7292235B2
Authority
JP
Japan
Prior art keywords
analysis
case
model
analyzed
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020052908A
Other languages
Japanese (ja)
Other versions
JP2021152751A (en
Inventor
文也 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020052908A priority Critical patent/JP7292235B2/en
Publication of JP2021152751A publication Critical patent/JP2021152751A/en
Application granted granted Critical
Publication of JP7292235B2 publication Critical patent/JP7292235B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、分析支援装置及び分析支援方法に関する。 The present invention relates to an analysis support device and an analysis support method.

近年、多くの産業分野において業務データの収集が可能であり、売り上げを始めとした企業活動におけるKPI(Key Performance Indicator)を予測するモデルの生成や、要因分析などのデータ分析を補助及び自動化するニーズが高まっている。また、過去の分析事例を学習し、データ分析に必要な前処理、特徴生成、及びモデリングを支援するツールが開発されている。 In recent years, it is possible to collect business data in many industrial fields, and there is a need to support and automate data analysis such as generating models that predict KPIs (Key Performance Indicators) in corporate activities such as sales, and factor analysis. is rising. In addition, tools have been developed that learn from past analysis cases and support preprocessing, feature generation, and modeling required for data analysis.

本技術分野の背景技術として国際公開第2019/073900号(特許文献1)がある。この公報には、「生体活動に起因する生体音に基づいて、簡易かつ高精度に疾患を判定する。生体活動に起因する生体音に基づいて疾患の判定を行うための判定アルゴリズムD2を学習する機械学習装置(3)であって、複数の被験体の前記生体音の音情報を取得する音情報取得部(33)と、前記複数の被験体の疾患に関する診断情報を取得する診断情報取得部(34)と、前記各被験体の前記音情報および前記診断情報に基づいて、判定アルゴリズムD2を学習する学習部(35)と、を備えた、機械学習装置(3)。」と記載されている(要約参照)。 As background art in this technical field, there is International Publication No. 2019/073900 (Patent Document 1). In this publication, "Disease can be easily and highly accurately determined based on body sounds caused by body activity. Learning a determination algorithm D2 for determining disease based on body sounds caused by body activity A machine learning device (3), comprising: a sound information acquisition unit (33) for acquiring sound information of the body sounds of a plurality of subjects; and a diagnostic information acquisition unit for acquiring diagnostic information regarding diseases of the plurality of subjects. (34), and a learning unit (35) that learns a determination algorithm D2 based on the sound information and the diagnostic information of each subject." (see summary).

国際公開第2019/073900号WO2019/073900

従来技術は、分析済み事例のデータと分析対象事例のデータとから、予め定義した属性情報を抽出し、分析済み事例と分析対象事例との類似度を求めて、分析対象事例に類似する分析済み事例を抽出する。しかし、類似度の算出に用いられる属性情報は設計者が選択するものであるため、分析対象事例に類似する分析済み事例を精度良く抽出するための属性情報が必ずしも選択されているとは限らない。さらに、設計者が選択した属性情報は、事例データが持つ性質の一部しか表現できていない可能性が高い。つまり、従来技術では、類似度の設計自体が困難であった。 The conventional technology extracts predefined attribute information from the data of the analyzed case and the data of the case to be analyzed, obtains the degree of similarity between the analyzed case and the case to be analyzed, Extract examples. However, since the attribute information used to calculate the degree of similarity is selected by the designer, the attribute information for accurately extracting analyzed cases similar to the analysis target case is not necessarily selected. . Furthermore, there is a high possibility that the attribute information selected by the designer can express only a part of the properties of the case data. In other words, it was difficult to design similarity in the conventional technology.

また特許文献1に記載の技術は、決められた種類のモデリングと特徴量を用いて判定アルゴリズムを学習するが、過去のモデリング結果を利用して効率よく学習を行う仕組みを有していない。そこで本発明の一態様は、分析対象事例を高精度に分析するために、分析対象事例に類似する分析済み事例を高精度かつ効率良く特定することを目的とする。 Further, the technique described in Patent Document 1 learns a determination algorithm using a predetermined type of modeling and feature amounts, but does not have a mechanism for efficient learning using past modeling results. Accordingly, an object of one aspect of the present invention is to accurately and efficiently identify an analyzed case similar to an analysis target case in order to analyze the analysis target case with high accuracy.

上記課題を解決するため、本発明の一態様は以下の構成を採用する。分析支援装置は、プロセッサとメモリとを有し、前記メモリは、分析対象事例の説明変数と目的変数とを示す分析対象事例データと、分析済み事例を分析したモデル及び前記モデルに適用されたパラメータの組み合わせと、前記パラメータが適用されたモデルによって前記分析済み事例が分析されたときの当該モデルの評価値と、を示す分析評価データと、を保持し、前記プロセッサは、前記分析評価データに含まれる予め定められた一部のモデル及びパラメータの組み合わせを前記分析対象事例の説明変数に適用して前記分析対象事例の目的変数を予測したときの当該モデルの評価値を算出し、前記算出した評価値と、前記分析評価データが示す評価値それぞれと、を比較して類似度を算出し、前記算出した類似度に基づいて、前記分析対象事例に類似する分析済み事例である類似事例を特定する。 In order to solve the above problems, one embodiment of the present invention employs the following configuration. The analysis support device has a processor and a memory, and the memory stores analysis target case data indicating explanatory variables and objective variables of analysis target cases, a model obtained by analyzing the analyzed cases, and parameters applied to the model. and an evaluation value of the model when the analyzed case is analyzed by the model to which the parameter is applied, and the processor retains analysis evaluation data indicating a combination of calculating the evaluation value of the model when predicting the objective variable of the analysis target case by applying a combination of a predetermined model and parameters of the analysis target case to the explanatory variables of the analysis target case, and calculating the calculated evaluation A similarity is calculated by comparing the value and each evaluation value indicated by the analysis evaluation data, and a similar case that is an analyzed case similar to the analysis target case is specified based on the calculated similarity. .

本発明の一態様によれば、分析対象事例を高精度に分析するために、分析対象事例に類似する分析済み事例を高精度かつ効率良く特定することができる。 According to one aspect of the present invention, in order to analyze a case to be analyzed with high accuracy, an analyzed case similar to the case to be analyzed can be specified with high accuracy and efficiency.

上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will be clarified by the following description of the embodiments.

実施例1における分析支援装置の構成例を示すブロック図である。1 is a block diagram showing a configuration example of an analysis support device according to Embodiment 1; FIG. 実施例1における入力テーブルの一例である。It is an example of an input table in Example 1. FIG. 実施例1における分析情報の一例である。It is an example of the analysis information in Example 1. FIG. 実施例1における分析データベースの一例である。1 is an example of an analysis database in Example 1. FIG. 実施例1におけるパラメータデータベースの一例である。4 is an example of a parameter database in Example 1. FIG. 実施例1における自動分析実行処理の一例を示すフローチャートである。6 is a flow chart showing an example of automatic analysis execution processing in Embodiment 1. FIG. 実施例1におけるルールベース問題分類処理の一例を示すフローチャートである。4 is a flow chart showing an example of rule-based problem classification processing in Example 1. FIG. 実施例1における共通パラメータ探索処理の一例を示すフローチャートである。7 is a flow chart showing an example of common parameter search processing in Embodiment 1. FIG. 実施例1における類似事例抽出処理の一例を示すフローチャートである。10 is a flowchart illustrating an example of similar case extraction processing according to the first embodiment; 実施例1における類似事例抽出処理の具体例を示す説明図である。FIG. 10 is an explanatory diagram showing a specific example of similar case extraction processing according to the first embodiment; 実施例1におけるパラメータレコメンド処理の一例を示すフローチャートである。5 is a flowchart showing an example of parameter recommendation processing in Example 1. FIG. 実施例1における周辺探索処理の一例を示すフローチャートである。6 is a flowchart showing an example of peripheral search processing according to the first embodiment; 実施例1における再学習処理の一例を示すフローチャートである。7 is a flowchart illustrating an example of re-learning processing in Example 1; 実施例1における分析データベース作成処理の一例を示すフローチャートである。5 is a flow chart showing an example of analysis database creation processing in Example 1. FIG. 実施例1における自動分析実行処理が行われるときに出力装置に表示される表示画面の一例である。4 is an example of a display screen displayed on the output device when automatic analysis execution processing is performed in Embodiment 1. FIG.

以下、本発明の実施形態を図面に基づいて詳細に説明する。本実施形態において、同一の構成には原則として同一の符号を付け、繰り返しの説明は省略する。なお、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail based on the drawings. In this embodiment, in principle, the same components are denoted by the same reference numerals, and repeated descriptions are omitted. It should be noted that the present embodiment is merely an example for realizing the present invention and does not limit the technical scope of the present invention.

図1は、分析支援装置の構成例を示すブロック図である。分析支援装置100は、例えば、それぞれが互いにバス107等の内部通信線で接続された、CPU(Control Processing Unit)101、メモリ102、補助記憶装置103、入力装置104、出力装置105、及び通信装置106を有する計算機によって構成される。 FIG. 1 is a block diagram showing a configuration example of an analysis support device. The analysis support apparatus 100 includes, for example, a CPU (Control Processing Unit) 101, a memory 102, an auxiliary storage device 103, an input device 104, an output device 105, and a communication device, which are connected to each other by an internal communication line such as a bus 107. 106.

CPU101は、プロセッサを含み、メモリ102に格納されたプログラムを実行する。メモリ102は、不揮発性の記憶素子であるROM(Read Only Memory)及び揮発性の記憶素子であるRAM(Random Access Memory)を含む。ROMは、不変のプログラム(例えば、BIOS(Basic Input/Output System))などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、CPU101が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。 CPU 101 includes a processor and executes programs stored in memory 102 . The memory 102 includes ROM (Read Only Memory), which is a non-volatile storage element, and RAM (Random Access Memory), which is a volatile storage element. The ROM stores immutable programs (for example, BIOS (Basic Input/Output System)) and the like. The RAM is a high-speed and volatile storage device such as a DRAM (Dynamic Random Access Memory), and temporarily stores programs executed by the CPU 101 and data used when the programs are executed.

補助記憶装置103は、例えば、磁気記憶装置(HDD(Hard Disk Drive))、フラッシュメモリ(SSD(Solid State Drive))等の大容量かつ不揮発性の記憶装置であり、CPU101が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置103から読み出されて、メモリ102にロードされて、CPU101によって実行される。 The auxiliary storage device 103 is, for example, a magnetic storage device (HDD (Hard Disk Drive)), a flash memory (SSD (Solid State Drive)), or other large-capacity and non-volatile storage device. Stores data used when running That is, the program is read from the auxiliary storage device 103, loaded into the memory 102, and executed by the CPU 101. FIG.

入力装置104は、オペレータからの入力を受け付ける装置であり、例えば、キーボードやマウス等である。出力装置105は、プログラムの実行結果をオペレータが視認可能な形式で出力する装置であり、例えば、ディスプレイやプリンタ等である。通信装置106は、所定のプロトコルに従って、他の装置との通信を制御するネットワークインターフェース装置である。 The input device 104 is a device that receives input from an operator, such as a keyboard and a mouse. The output device 105 is a device that outputs the execution result of the program in a format that can be visually recognized by the operator, and is, for example, a display or a printer. A communication device 106 is a network interface device that controls communication with other devices according to a predetermined protocol.

CPU101が実行するプログラムは、リムーバブルメディア(CD-ROM、フラッシュメモリなど)又はネットワークを介して分析支援装置100に提供され、非一時的記憶媒体である不揮発性の補助記憶装置103に格納される。このため、分析支援装置100は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。 Programs executed by the CPU 101 are provided to the analysis support apparatus 100 via removable media (CD-ROM, flash memory, etc.) or a network, and stored in the non-volatile auxiliary storage device 103, which is a non-temporary storage medium. Therefore, the analysis support apparatus 100 preferably has an interface for reading data from removable media.

分析支援装置100は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。 The analysis support apparatus 100 is a computer system configured on one physical computer or on a plurality of computers configured logically or physically, and operates on the same computer with separate threads. Alternatively, it may operate on a virtual computer built on a plurality of physical computer resources.

CPU101は、例えば、自動分析実行部111、分析データベース作成部112、ルールベース問題分類部113、共通パラメータ探索部114、類似事例抽出部115、パラメータレコメンド部116、周辺探索部117、及び再学習部118を含む。 The CPU 101 includes, for example, an automatic analysis execution unit 111, an analysis database creation unit 112, a rule-based problem classification unit 113, a common parameter search unit 114, a similar case extraction unit 115, a parameter recommendation unit 116, a peripheral search unit 117, and a relearning unit. 118.

自動分析実行部111は、後述する入力テーブル121が示す分析対象事例の自動分析処理を制御する。分析データベース作成部112は、後述する分析データベース123を生成する。ルールベース問題分類部113は、入力テーブル121が示す分析対象事例においてモデルによって解かれる問題を特定する。 The automatic analysis execution unit 111 controls automatic analysis processing of analysis target cases indicated by an input table 121, which will be described later. The analysis database creation unit 112 creates an analysis database 123, which will be described later. The rule-based problem classification unit 113 identifies a problem to be solved by the model in the analysis target case indicated by the input table 121 .

共通パラメータ探索部114は、分析データベース123が示す一部のパラメータが適用されたモデルを入力テーブル121の説明変数に適用する。類似事例抽出部115は、分析対象事例に類似する過去に分析済みの事例である類似事例を抽出する。 The common parameter search unit 114 applies a model to which some parameters indicated by the analysis database 123 are applied to the explanatory variables of the input table 121 . The similar case extraction unit 115 extracts similar cases, which are previously analyzed cases similar to the analysis target case.

パラメータレコメンド部116は、類似事例において適用済みのパラメータのうち、分析対象事例に適用すると最も良い評価値を示すパラメータをレコメンドする。周辺探索部117は、レコメンドされたパラメータの周辺のパラメータを探索し、探索したパラメータのうち分析対象事例に適用すると最も良い評価値を示すベストパラメータを出力する。再学習部118は、ベストパラメータを用いて分析対象事例を分析するための後述するモデル124を生成する。 The parameter recommendation unit 116 recommends a parameter showing the best evaluation value when applied to the analysis target case among the parameters already applied to the similar cases. The surrounding search unit 117 searches for parameters around the recommended parameter, and outputs the best parameter indicating the best evaluation value when applied to the case to be analyzed among the searched parameters. The relearning unit 118 uses the best parameters to generate a model 124, which will be described later, for analyzing the case to be analyzed.

例えば、CPU101は、メモリ102にロードされた自動分析実行プログラムに従って動作することで、自動分析実行部111として機能し、メモリ102にロードされた分析データベース作成プログラムに従って動作することで、分析データベース作成部112として機能する。 For example, the CPU 101 operates according to an automatic analysis execution program loaded into the memory 102 to function as an automatic analysis execution unit 111, and operates according to an analysis database creation program loaded into the memory 102 to operate as an analysis database creation unit. 112.

なお、CPU101に含まれる機能部による機能の一部又は全部が、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)等のハードウェアによって実現されてもよい。 Some or all of the functions of the functional units included in the CPU 101 may be realized by hardware such as ASIC (Application Specific Integrated Circuit) or FPGA (Field-Programmable Gate Array).

補助記憶装置103は、例えば、入力テーブル121、分析情報122、分析データベース123、モデル124、及びパラメータデータベース125を保持する。なお、補助記憶装置103に格納されている一部又は全部の情報は、メモリ102に格納されていてもよいし、分析支援装置100に接続されているデータベース等に格納されていてもよい。 The auxiliary storage device 103 holds an input table 121, analysis information 122, an analysis database 123, a model 124, and a parameter database 125, for example. Part or all of the information stored in the auxiliary storage device 103 may be stored in the memory 102 or may be stored in a database or the like connected to the analysis support device 100 .

入力テーブル121は、分析対象事例のデータを保持する。分析情報122は、入力テーブル121を分析するための追加情報を保持する。分析データベース123は、過去に分析済みの事例において分析に用いられたモデル及びパラメータ、並びに評価値を示す情報を保持する。後述するように分析データベース123は、分析済み事例そのもの(分析済み事例の属性情報)を直接的に示す情報を有している必要はない。 The input table 121 holds data of cases to be analyzed. Analysis information 122 holds additional information for analyzing input table 121 . The analysis database 123 holds information indicating models and parameters used for analysis in cases that have been analyzed in the past, and evaluation values. As will be described later, the analysis database 123 does not need to have information that directly indicates the analyzed case itself (attribute information of the analyzed case).

モデル124は、入力テーブル121が示す分析対象事例を分析するためのモデル、及び過去に分析済みの事例を分析したモデルを含む。パラメータデータベース125は、モデル124に適用されるパラメータを示す情報を保持する。 The model 124 includes models for analyzing cases to be analyzed indicated by the input table 121 and models for analyzing cases that have been analyzed in the past. The parameter database 125 holds information indicating parameters applied to the model 124 .

なお、本実施形態において、分析支援装置100が使用する情報は、データ構造に依存せずどのようなデータ構造で表現されていてもよい。本実施形態ではテーブル形式で情報が表現されているが、例えば、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。
図2は、入力テーブル121の一例である。入力テーブル121は、列方向に同じ変数の値を格納し、行方向に各変数の値を格納するテーブルデータである。
In this embodiment, the information used by the analysis support apparatus 100 may be represented by any data structure without depending on the data structure. Although the information is represented in the form of a table in this embodiment, the information can be stored in a data structure suitably selected from, for example, a list, database, or queue.
FIG. 2 is an example of the input table 121. As shown in FIG. The input table 121 is table data in which the values of the same variables are stored in the column direction and the values of the respective variables are stored in the row direction.

図2の例では、入力テーブル121は、PassengerId欄1211、Survived欄1212、Sex欄1213、Age欄1214、SibSp欄1215、Fare欄1216、Embarked欄1217と、を含む。入力テーブル121に含まれる変数(列)の数は任意であり、各変数は文字列、フラグ、連続数(数値)等の様々な型の値を取ることができる。 In the example of FIG. 2, the input table 121 includes a PassengerId column 1211, a Survived column 1212, a Sex column 1213, an Age column 1214, a SibSp column 1215, a Fare column 1216, and an Embarked column 1217. The number of variables (columns) included in the input table 121 is arbitrary, and each variable can take values of various types such as character strings, flags, consecutive numbers (numerical values), and the like.

図2の例では、PassengerId欄1211がIDカラム(即ちレコードを識別するための変数)、Survived欄1212が目的変数カラムであり、他の欄は説明変数カラムである。本実施例における分析の目的は、説明変数カラムの値から目的変数カラムの値をより正確に予測する予測式であるモデルを生成することを含む。 In the example of FIG. 2, the PassengerId column 1211 is an ID column (that is, a variable for identifying a record), the Survived column 1212 is a target variable column, and the other columns are explanatory variable columns. The purpose of the analysis in this example includes generating a model, which is a prediction formula that more accurately predicts the value of the objective variable column from the value of the explanatory variable column.

図2の入力テーブル121ではSurvived欄1212が目的変数カラムであり、Survived欄1212の値は1又は0のいずれかをとるため、Survived欄1212の値を予測することは二値分類の問題である。一般的に、IDカラムはデータサンプルを識別する通し番号であるため、分析には直接的に用いられないことが多い。 In the input table 121 of FIG. 2, the Survived column 1212 is the objective variable column, and the value of the Survived column 1212 takes either 1 or 0, so predicting the value of the Survived column 1212 is a binary classification problem. . Since the ID column is generally a serial number that identifies a data sample, it is often not directly used for analysis.

図3は、分析情報122の一例である。分析情報122は、例えば、ID欄1221、目的変数名欄1222、問題欄1223、及び型欄1224を含む。ID欄1221は、分析情報122のレコードを識別するIDを保持する。目的変数名欄1222は、入力テーブル121の目的変数カラムを示す。問題欄1223は、入力テーブル121が二値分類、多クラス分類、又は回帰等の、どのクラスの問題に分類されるかを示す。型欄1224は、目的変数カラムの型を示す。 FIG. 3 is an example of the analysis information 122. As shown in FIG. The analysis information 122 includes, for example, an ID column 1221, a target variable name column 1222, a question column 1223, and a type column 1224. The ID column 1221 holds IDs that identify records of the analysis information 122 . A target variable name column 1222 indicates the target variable column of the input table 121 . A question column 1223 indicates which class of problem the input table 121 is classified into, such as binary classification, multiclass classification, or regression. A type column 1224 indicates the type of the objective variable column.

図4は、分析データベース123の一例である。分析データベース123は問題分類ごとに定義されており、図4は問題分類が多クラス問題かつ稀現象問題である分析データベース123の例を示す。分析データベース123は、例えば、Analysis_ID欄1231、Model_Name欄1232、Common_Search欄1233、Recipe_ID欄1234、Best_Flag欄1235、及びAccuracy欄1236を含み、過去の探索結果情報を保持する。 FIG. 4 is an example of the analysis database 123. As shown in FIG. The analysis database 123 is defined for each problem classification, and FIG. 4 shows an example of the analysis database 123 whose problem classification is multi-class problem and rare phenomenon problem. The analysis database 123 includes, for example, an Analysis_ID column 1231, a Model_Name column 1232, a Common_Search column 1233, a Recipe_ID column 1234, a Best_Flag column 1235, and an Accuracy column 1236, and holds past search result information.

Analysis_ID欄1231は、分析事例を識別するID(つまり1つの入力テーブル121を分析する際に付与されるID)を保持する。一つの分析事例に対してパラメータを変化させて1回以上の探索と評価が行われるため、一つのAnalysis_IDに対して複数の結果が保存され得る。 The Analysis_ID column 1231 holds IDs that identify analysis cases (that is, IDs that are assigned when one input table 121 is analyzed). Multiple results can be stored for one Analysis_ID because one or more searches and evaluations are performed with different parameters for one analysis case.

Model_Name欄1232は分析に用いられたモデル124の名称を保持する。線形回帰、Logistic回帰、XG Boost、Random Forest、SVM(Support Vector Machine)、SVR(Support Vector Regression)、Neural Network、及びGaussian Processは、いずれも分析に用いられるモデル124の一例である。 A Model_Name column 1232 holds the name of the model 124 used in the analysis. Return to Logistic, Return to Logistic, XG Boost, RANDOM FOREST, SVM (SUPPORT VECTOR MACHINE), SVR (SUPPPORT VECTOR REGRESSION), NEURAL NETWORK, And Gaussian Process is an example of a model 124 used for analysis.

Common_Search欄1233は、入力テーブル121が示す分析対象事例に類似する分析済みの事例を抽出するために、利用されるパラメータを識別するためのフラグを保持する。 The Common_Search column 1233 holds flags for identifying parameters used to extract analyzed cases similar to the analysis target cases indicated by the input table 121 .

本実施例の分析支援装置100は、分析対象事例に類似する分析済み事例を抽出し、分析対象事例の分析に用いられると精度の高い分析が可能なパラメータをレコメンドする。分析支援装置100は、この類似する事例を見つけるために、探索対象のパラメータを同一にすることで事例間の比較を行うことができる。そのため分析データベース123は、分析事例間で同一パラメータを探索したサンプルを識別するためのフラグとしてCommon_Search欄1233を有する。 The analysis support apparatus 100 of the present embodiment extracts analyzed cases similar to an analysis target case, and recommends parameters that enable highly accurate analysis when used to analyze the analysis target case. In order to find similar cases, the analysis support apparatus 100 can compare cases by making the search target parameters the same. Therefore, the analysis database 123 has a Common_Search column 1233 as a flag for identifying samples searching for the same parameter among analysis cases.

Recipe_ID欄1234は、探索済みのパラメータセットそれぞれを識別するIDであるRecipe_IDを保持する。分析データベース123に含まれるパラメータセットがレコメンドされる際には、このRecipe_IDによってパラメータセットが指定される。 The Recipe_ID column 1234 holds Recipe_ID, which is an ID for identifying each searched parameter set. When a parameter set included in the analysis database 123 is recommended, the parameter set is designated by this Recipe_ID.

Best_Flag欄1235は、同一の分析事例、即ち同一のAnalysis_IDを有する事例において、モデルが最も良い性能を示したパラメータセットを識別するためのフラグであるBest_Flagを保持する。図4の例では予測精度(Accuracy欄1236の値)によってモデルの性能が評価されているが、他の評価指標及びモデルの安定性などの様々な観点によって、モデルの性能を評価することができる。 Best_Flag column 1235 holds Best_Flag, which is a flag for identifying the parameter set for which the model performed best in the same analysis case, ie, the case with the same Analysis_ID. In the example of FIG. 4, the performance of the model is evaluated by the prediction accuracy (the value of the Accuracy column 1236), but it is possible to evaluate the performance of the model from various viewpoints such as other evaluation indexes and model stability. .

Accuracy欄1236は、Recipe_ID欄1234が示すパラメータセットをモデルに適用した際のモデルの評価値の一例である予測精度(Accuracy)を示す。なお、分析データベース123は説明の便宜上データベースと名付けられているが、必ずしもデータベースである必要はなく、例えばテキスト形式や他の形式であってもよい。 The Accuracy column 1236 indicates the prediction accuracy (Accuracy), which is an example of the evaluation value of the model when the parameter set indicated by the Recipe_ID column 1234 is applied to the model. Although the analysis database 123 is named database for convenience of explanation, it does not necessarily have to be a database, and may be in a text format or other format, for example.

図5は、パラメータデータベース125の一例である。パラメータデータベース125は、例えば、Recipe_IDを保持するRecipe_ID欄1251を含む。また、パラメータデータベース125は、例えば、いずれもパラメータ値を保持する、param_max_depth欄1252、param_leafe_num欄1253、param_n_estimator欄1254、及びparam_learing_rate欄1255を含む。図5の例では、パラメータデータベース125は、4つのパラメータを保持しているが、パラメータデータベース125が保持するパラメータの種類及び数は、分析支援装置100が有するモデル124に依存する。 FIG. 5 is an example of the parameter database 125. As shown in FIG. The parameter database 125 includes, for example, a Recipe_ID column 1251 that holds Recipe_IDs. The parameter database 125 also includes, for example, a param_max_depth column 1252, a param_leafe_num column 1253, a param_n_estimator column 1254, and a param_learning_rate column 1255, all of which hold parameter values. In the example of FIG. 5, the parameter database 125 holds four parameters, but the types and number of parameters held by the parameter database 125 depend on the model 124 that the analysis support apparatus 100 has.

なお、補助記憶装置103が有する各データが有する図示された欄はあくまで一例であり、各テーブルは図示された全ての欄を必ずしも有していなくてもよいし、別の欄をさらに有していてもよい。 It should be noted that the illustrated columns of each data in the auxiliary storage device 103 are merely examples, and each table does not necessarily have all the illustrated columns, and may have additional columns. may

図6は、自動分析実行処理の一例を示すフローチャートである。図6の処理の前に入力テーブル121及び分析情報122の値が入力済みであるものとする。但し分析情報122の問題欄1223には値が格納されていなくてもよい(null値が格納されていてもよい)。 FIG. 6 is a flowchart showing an example of automatic analysis execution processing. It is assumed that the values of the input table 121 and the analysis information 122 have been input before the processing of FIG. However, the problem column 1223 of the analysis information 122 does not have to store a value (a null value may be stored).

自動分析実行処理において、自動分析実行部111は、入力テーブル121と分析情報122とパラメータデータベース125と、に基づいて、分析データベース123から分析対象事例に類似する過去の分析済み事例を検索する。そして、自動分析実行部111は、最良の評価値を示すパラメータを抽出し、当該抽出したパラメータを適用して、分析対象事例を分析するためのモデルを出力する。 In the automatic analysis execution process, the automatic analysis execution unit 111 searches the analysis database 123 for past analyzed cases similar to the analysis target case based on the input table 121 , the analysis information 122 and the parameter database 125 . Then, the automatic analysis execution unit 111 extracts a parameter indicating the best evaluation value, applies the extracted parameter, and outputs a model for analyzing the analysis target case.

図6の各ステップの詳細については後述するため、ここでは簡潔に説明する。まず、ルールベース問題分類部113は、入力テーブル121が示す分析対象事例においてモデルによって解かれる問題が、どの問題に属するかを判定する(S601)。共通パラメータ探索部114は、過去の分析済み事例に適用されたパラメータを用いたモデルを入力テーブル121の説明変数に適用した場合のモデルの評価値を算出する(S602)。 Since the details of each step in FIG. 6 will be described later, they will be briefly described here. First, the rule-based problem classification unit 113 determines to which problem the problem solved by the model in the analysis target case indicated by the input table 121 belongs (S601). The common parameter search unit 114 calculates the evaluation value of the model when the model using the parameters applied to past analyzed cases is applied to the explanatory variables of the input table 121 (S602).

類似事例抽出部115は、当該パラメータが適用された、分析対象事例である入力テーブル121おける評価値と、過去の分析済み事例における評価値と、を比較して、分析対象事例に最も類似する分析済み事例である類似事例を抽出する(S603)。 The similar case extracting unit 115 compares the evaluation value in the input table 121, which is the analysis target case to which the parameter is applied, with the evaluation values of the past analyzed cases, and performs the analysis most similar to the analysis target case. Similar cases, which are completed cases, are extracted (S603).

パラメータレコメンド部116は、類似事例に適用されたパラメータのうち最も評価値が高いパラメータを抽出し、レコメンドする(S604)。周辺探索部117は、レコメンドされたパラメータの周辺を探索してベストパラメータを抽出する(S605)。再学習部118は、ベストパラメータを用いて、分析対象事例を分析するためのモデル124を生成する。 The parameter recommendation unit 116 extracts and recommends the parameter with the highest evaluation value among the parameters applied to the similar cases (S604). The surrounding search unit 117 searches around the recommended parameters and extracts the best parameters (S605). The relearning unit 118 uses the best parameters to generate a model 124 for analyzing the case to be analyzed.

図7は、ステップS601のルールベース問題分類処理の一例を示すフローチャートである。ルールベース問題分類部113は、入力テーブル121及び分析情報122を読み出す(S701)。 FIG. 7 is a flowchart showing an example of rule-based problem classification processing in step S601. The rule-based problem classification unit 113 reads the input table 121 and analysis information 122 (S701).

ルールベース問題分類部113は、分析情報122において問題分類が定義されているか、即ち問題欄1223に値が入力されているかを判定する(S702)。 The rule-based problem classification unit 113 determines whether a problem classification is defined in the analysis information 122, that is, whether a value is entered in the problem field 1223 (S702).

ルールベース問題分類部113は、分析情報122において問題分類が定義されていると判定した場合(S702:Yes)、問題欄1223が示す問題分類を問題分類結果として出力し(S707)、ルールベース問題分類処理を終了する。 When the rule-based problem classification unit 113 determines that the problem classification is defined in the analysis information 122 (S702: Yes), it outputs the problem classification indicated by the problem column 1223 as a problem classification result (S707). End the classification process.

ルールベース問題分類部113は、分析情報122において問題分類が定義されていないと判定した場合(S702:No)、分析情報122の目的変数名欄1222から入力テーブル121の目的変数カラムを特定し、入力テーブル121の目的変数カラムのユニーク要素数(即ち要素の種類数)が2以下であるかを判定する(S703)。 When the rule-based problem classification unit 113 determines that the problem classification is not defined in the analysis information 122 (S702: No), it identifies the objective variable column of the input table 121 from the objective variable name column 1222 of the analysis information 122, It is determined whether the number of unique elements (that is, the number of element types) in the objective variable column of the input table 121 is 2 or less (S703).

ルールベース問題分類部113は、目的変数カラムのユニーク要素数が2以下であると判定した場合(S703:Yes)、入力テーブル121の問題が二値分類問題を含むことを示す情報を問題分類結果に含め、稀現象判定処理を実行して(S705)、問題分類結果を出力し(S707)、ルールベース問題分類処理を終了する。 When the rule-based problem classification unit 113 determines that the number of unique elements in the objective variable column is 2 or less (S703: Yes), the problem classification result , executes the rare phenomenon determination process (S705), outputs the problem classification result (S707), and terminates the rule-based problem classification process.

なお、ルールベース問題分類部113は、ステップS705において、目的変数カラムの値の偏りが大きい場合に、入力テーブル121の問題が稀現象問題を含むことを示す情報を問題分類結果に含める。具体的には、例えば、ルールベース問題分類部113は、目的変数カラムの値の分散が所定値以上である場合や、目的変数カラムの値の最大の相対度数と最小の相対度数との差が所定値以上である場合等に、目的変数カラムの値の偏りが大きいと判定する。 Note that, in step S705, the rule-based problem classification unit 113 includes information indicating that the problem in the input table 121 includes a rare phenomenon problem in the problem classification result when the bias in the values of the objective variable column is large. Specifically, for example, the rule-based problem classification unit 113 determines whether the variance of the objective variable column values is equal to or greater than a predetermined value, or when the difference between the maximum relative frequency and the minimum relative frequency of the objective variable column values is If the value is equal to or greater than a predetermined value, etc., it is determined that the bias in the values of the objective variable column is large.

ルールベース問題分類部113は、目的変数カラムのユニーク要素数が2を超えると判定した場合(S703:No)、目的変数が文字データであるかを判定する(S705)。具体的には、例えば、ルールベース問題分類部113は、分析情報122の型欄1224の値を参照して目的変数が文字データであるか否かを判定してもよいし、入力テーブル121の目的変数カラムの値に1つでも文字データが含まれている場合に目的変数が文字データであると判定してもよい。このようにルールベース問題分類部113は、目的変数のデータ型に基づいて問題分類を実行する。 When the rule-based problem classification unit 113 determines that the number of unique elements in the objective variable column exceeds 2 (S703: No), it determines whether the objective variable is character data (S705). Specifically, for example, the rule-based problem classification unit 113 may refer to the value of the type column 1224 of the analysis information 122 to determine whether or not the objective variable is character data. If at least one character data is included in the value of the objective variable column, it may be determined that the objective variable is character data. Thus, the rule-based problem classification unit 113 executes problem classification based on the data type of the objective variable.

ルールベース問題分類部113は、目的変数が文字データであると判定した場合(S704:Yes)、入力テーブル121の問題が多クラス問題を含むことを示す情報を問題分類結果に含め、稀現象判定処理を実行して(S705)、問題分類結果を出力し(S707)、ルールベース問題分類処理を終了する。 When the rule-based problem classification unit 113 determines that the objective variable is character data (S704: Yes), the problem classification result includes information indicating that the problem in the input table 121 includes a multi-class problem, and the rare phenomenon is determined. The process is executed (S705), the problem classification result is output (S707), and the rule-based problem classification process ends.

ルールベース問題分類部113は、目的変数が文字データでない(即ち数値データである)と判定した場合(S704:No)、入力テーブル121の目的変数カラムのユニーク要素数が予め定められた閾値α以下であるかを判定する(S705)。 When the rule-based problem classification unit 113 determines that the objective variable is not character data (that is, is numerical data) (S704: No), the number of unique elements in the objective variable column of the input table 121 is equal to or less than the predetermined threshold α. (S705).

ルールベース問題分類部113は、目的変数カラムのユニーク要素数がα以下であると判定した場合(S705:Yes)、入力テーブル121の問題が多クラス問題を含むことを示す情報を問題分類結果に含め、稀現象判定処理を実行して(S705)、問題分類結果を出力し(S707)、ルールベース問題分類処理を終了する。ルールベース問題分類部113は、目的変数カラムのユニーク要素数がαを超えると判定した場合(S705:No)、入力テーブル121の問題が回帰問題であることを示す情報を問題分類結果に含め、問題分類結果を出力し(S707)、ルールベース問題分類処理を終了する。 When the rule-based problem classification unit 113 determines that the number of unique elements in the objective variable column is equal to or less than α (S705: Yes), the problem classification result includes information indicating that the problem in the input table 121 includes a multi-class problem. The rare phenomenon determination process is executed (S705), the problem classification result is output (S707), and the rule-based problem classification process ends. When the rule-based problem classification unit 113 determines that the number of unique elements in the objective variable column exceeds α (S705: No), the problem classification result includes information indicating that the problem in the input table 121 is a regression problem, The problem classification result is output (S707), and the rule-based problem classification process ends.

図7の処理により、入力テーブル121の問題分類結果は、分析情報122の問題欄1223が示す問題、二値問題、二値問題かつ稀現象問題、多クラス問題、多クラス問題かつ稀現象問題、又は回帰問題のいずれかに該当する。 By the processing of FIG. 7, the problem classification results of the input table 121 include the problem indicated by the problem column 1223 of the analysis information 122, the binary problem, the binary problem and rare phenomenon problem, the multiclass problem, the multiclass problem and rare phenomenon problem, or regression problem.

図8は、ステップS602の共通パラメータ探索処理の一例を示すフローチャートである。共通パラメータ探索部114は、入力テーブル121と、分析情報122と、ステップS707で出力された問題分類結果が示す問題に対応する分析データベース123と、を読み出す(S801)。 FIG. 8 is a flowchart showing an example of common parameter search processing in step S602. The common parameter searching unit 114 reads out the input table 121, the analysis information 122, and the analysis database 123 corresponding to the problem indicated by the problem classification result output in step S707 (S801).

共通パラメータ探索部114は、ステップS801で読み出した分析データベース123のCommon_Search欄1233の値が1であるレコードのモデルとRecipe_IDとを特定し、特定したRecipe_IDに対応するパラメータセットをcommon_gridとしてパラメータデータベース125から抽出する(S802)。 The common parameter search unit 114 identifies the model and Recipe_ID of the record whose value in the Common_Search column 1233 of the analysis database 123 read in step S801 is 1, and extracts the parameter set corresponding to the identified Recipe_ID from the parameter database 125 as common_grid. Extract (S802).

共通パラメータ探索部114は、common_gridとして抽出したパラメータセットそれぞれについて、当該パラメータセットに分析データベース123において対応するモデルを入力テーブル121の説明変数の値に適用して、当該パラメータセットが適用されたモデルが入力テーブル121の説明変数に適用されたときの当該モデルの評価値(例えば予測精度(Accuracy))を算出する(S803)。 For each parameter set extracted as common_grid, the common parameter search unit 114 applies a model corresponding to the parameter set in the analysis database 123 to the values of the explanatory variables in the input table 121, and the model to which the parameter set is applied is An evaluation value (for example, prediction accuracy) of the model when applied to the explanatory variables of the input table 121 is calculated (S803).

共通パラメータ探索部114は、ステップS802で抽出したパラメータセットである探索済みパラメータ群θsearchと、ステップS803において得られた評価値と、を対応付けて出力する(S804)。 The common parameter search unit 114 outputs the searched parameter group θ search , which is the parameter set extracted in step S802, in association with the evaluation value obtained in step S803 (S804).

図9は、ステップS603の類似事例抽出処理の一例を示すフローチャートである。類似事例抽出部115は、入力テーブル121と、分析情報122と、ステップS804で出力された探索済みパラメータ群θsearchと、ステップS707で出力された問題分類結果が示す問題に対応する分析データベース123と、を読み出す(S901)。 FIG. 9 is a flowchart showing an example of similar case extraction processing in step S603. The similar case extraction unit 115 extracts the input table 121, the analysis information 122, the searched parameter group θ search output in step S804, and the analysis database 123 corresponding to the problem indicated by the problem classification result output in step S707. , is read out (S901).

類似事例抽出部115は、分析データベース123の分析済み事例のAnalysis_IDそれぞれについて、common_gridに対する評価値(Accuracy)と、探索済みパラメータ群θsearchにおける評価値と、を比較して、当該分析済み事例と、入力テーブル121の分析対象事例と、の類似度を算出する(S902)。 The similar case extraction unit 115 compares the evaluation value (Accuracy) for common_grid with the evaluation value in the searched parameter group θ search for each Analysis_ID of the analyzed case in the analysis database 123, and compares the analyzed case with The degree of similarity with the analysis target case in the input table 121 is calculated (S902).

類似事例抽出部115は、ステップS902において、例えば、分析済み事例のcommon_gridに対する評価値と、探索済みパラメータ群θsearchにおける評価値と、の間の相関係数、ユークリッド距離、マンハッタン距離、又は絶対誤差等のいずれかを類似度として算出する。類似事例抽出部115は、入力テーブル121の分析対象事例との間の類似度が最も高い分析済み事例のAnalysis_IDを類似事例IDとして出力する(S903)。 In step S902, the similar case extraction unit 115 calculates , for example, the correlation coefficient, Euclidean distance, Manhattan distance, or absolute error or the like is calculated as the degree of similarity. The similar case extraction unit 115 outputs the Analysis_ID of the analyzed case with the highest similarity to the analysis target case in the input table 121 as the similar case ID (S903).

図10は、図9に示した類似事例抽出処理の具体例を示す説明図である。前述したように類似事例抽出部115は、入力テーブル121から得られた分析対象事例における、探索済みパラメータ群θsearchを適用した場合のモデルの評価値であるAccuracyと、分析データベース123の分析済み事例それぞれにおけるθsearchに対応するパラメータセットの評価値であるAccuracyと、の類似度を算出する。前述したように分析データベース123には複数の分析済み事例が格納されており、分析済み事例を識別するAnalysis_IDが付与されている。 FIG. 10 is an explanatory diagram showing a specific example of the similar case extraction processing shown in FIG. As described above, the similar case extraction unit 115 extracts Accuracy, which is the evaluation value of the model when the searched parameter group θ search is applied, in the analysis target cases obtained from the input table 121, and the analyzed cases in the analysis database 123. The degree of similarity between Accuracy, which is the evaluation value of the parameter set corresponding to θ search in each case, is calculated. As described above, the analysis database 123 stores a plurality of analyzed cases and is given an Analysis_ID for identifying the analyzed cases.

Analysis_IDが「1」、「2」、「3」、「4」の事例の評価値に対して、入力テーブル121から得られた分析対象事例における評価値との相関係数が、それぞれ、r=0.11、r=0.32、r=0.25、r=0.85、である。従って、図10の例では、分析対象事例と最も類似度の高い分析済み事例はr=0.85を示したAnalysis_IDが「4」の分析済み事例であることがわかる。 Correlation coefficients between the evaluation values of the cases with Analysis_ID of "1", "2", "3", and "4" and the evaluation values of the analysis target cases obtained from the input table 121 are r= 0.11, r=0.32, r=0.25, r=0.85. Therefore, in the example of FIG. 10, it can be seen that the analyzed case with the highest degree of similarity to the analysis target case is the analyzed case with Analysis_ID of "4" showing r=0.85.

従って、図10の例では、類似事例抽出部115は、類似事例IDとして「4」を出力する。なお、類似事例抽出部115は、相関係数を類似度として算出する場合、相関係数の絶対値が最大の分析済み事例のAnalysis_IDを類似事例IDとして出力してもよい。 Therefore, in the example of FIG. 10, the similar case extraction unit 115 outputs "4" as the similar case ID. When calculating the correlation coefficient as the degree of similarity, the similar case extraction unit 115 may output the Analysis_ID of the analyzed case with the largest absolute value of the correlation coefficient as the similar case ID.

上記した処理により、分析支援装置100は、分析済み事例の分析結果のうちcommon_gridについてのみ、入力テーブル121が示す分析対象事例におけるモデルの評価値を算出し、算出した評価値と、過去分析済み事例におけるモデルの評価値と、を比較して類似事例を抽出するため、少ない処理量によって類似事例を抽出することができる。 Through the above-described processing, the analysis support apparatus 100 calculates the evaluation value of the model in the analysis target case indicated by the input table 121 only for common_grid among the analysis results of the analyzed cases, and calculates the calculated evaluation value and the past analyzed case. Since similar cases are extracted by comparing the evaluation value of the model in and , similar cases can be extracted with a small amount of processing.

また、分析支援装置100は、上記した処理において、分析済み事例のデータそのもの(分析済み事例の属性情報)を利用することなく、分析データベース123(分析済み事例のモデル及びパラメータ、並びにモデルの評価値)を用いて類似事例を抽出することができるため、データ量を節減できる上に、仮に分析データベース123が漏洩しても個人情報等が漏洩することはない。 In addition, in the above-described processing, the analysis support apparatus 100 uses the analysis database 123 (the models and parameters of the analyzed cases, and the evaluation values of the models) without using the data of the analyzed cases themselves (the attribute information of the analyzed cases). ) can be used to extract similar cases, the amount of data can be reduced, and even if the analysis database 123 is leaked, personal information and the like will not be leaked.

図11は、ステップS604のパラメータレコメンド処理の一例を示すフローチャートである。パラメータレコメンド部116は、入力テーブル121と、分析情報122と、ステップS904で出力された類似事例IDと、パラメータデータベース125と、問題分類結果に対応する分析データベース123を読み出す(S1101)。 FIG. 11 is a flowchart showing an example of parameter recommendation processing in step S604. The parameter recommendation unit 116 reads out the input table 121, the analysis information 122, the similar case ID output in step S904, the parameter database 125, and the analysis database 123 corresponding to the problem classification results (S1101).

パラメータレコメンド部116は、問題分類結果に対応する分析データベース123を参照して、類似事例IDが示す分析済み事例の評価値であるAccuracyが最も高い値を最良評価値として検索する(S1102)。 The parameter recommendation unit 116 refers to the analysis database 123 corresponding to the problem classification result, and searches for the highest Accuracy evaluation value of the analyzed case indicated by the similar case ID as the best evaluation value (S1102).

パラメータレコメンド部116は、最良評価値を示すレコードのRecipe_IDを取得し、パラメータデータベース125から当該Recipe_IDに対応するパラメータセットを取得する(S1103)。パラメータレコメンド部116は、取得したパラメータセットをレコメンドパラメータθrecommendとして出力し(S1104)、パラメータレコメンド処理を終了する。 The parameter recommendation unit 116 acquires the Recipe_ID of the record indicating the best evaluation value, and acquires the parameter set corresponding to the Recipe_ID from the parameter database 125 (S1103). The parameter recommendation unit 116 outputs the acquired parameter set as a recommended parameter θ recommend (S1104), and terminates the parameter recommendation process.

図11の例では、パラメータレコメンド部116は、類似事例において最も高い評価値を示したパラメータセットを一つレコメンドしているが、例えば、類似事例において最も低い評価値を示したパラメータセットをレコメンドパラメータθrecommendとして出力してもよいし、評価値の数値の大小以外の観点で選択されたパラメータセットをレコメンドパラメータθrecommendとして出力してもよい。 In the example of FIG. 11, the parameter recommendation unit 116 recommends one parameter set showing the highest evaluation value in similar cases. It may be output as θrecommend , or a parameter set selected from a viewpoint other than the numerical value of the evaluation value may be output as the recommended parameter θrecommend.

また、パラメータレコメンド部116は、例えば、類似事例において評価値が高い順に所定数(例えば10個)のパラメータセットをレコメンドパラメータθrecommendとして出力してもよいし、類似事例において評価値が低い順に所定数(例えば10個)のパラメータセットをレコメンドパラメータθrecommendとして出力してもよい。 Further, the parameter recommendation unit 116 may, for example, output a predetermined number (for example, 10) of parameter sets in descending order of evaluation values in similar cases as recommended parameters θrecommend , or output predetermined parameters in descending order of evaluation values in similar cases. A number (for example, 10) of parameter sets may be output as the recommended parameter θrecommend.

また、パラメータレコメンド部116は、例えば、類似事例において評価値が所定以上の全てのパラメータセットをレコメンドパラメータθrecommendとして出力してもよいし、パラメータレコメンド部116は、例えば、類似事例において評価値が所定未満の全てのパラメータセットをレコメンドパラメータθrecommendとして出力してもよい。 Further, the parameter recommendation unit 116 may output, for example, all parameter sets with evaluation values equal to or greater than a predetermined value in similar cases as recommended parameters θ recommend . All parameter sets that are less than a predetermined value may be output as recommended parameters θrecommend.

図12は、ステップS605の周辺探索処理の一例を示すフローチャートである。周辺探索部117は、入力テーブル121と、分析情報122と、ステップS1104で出力されたレコメンドパラメータθrecommendと、を読み出す(S1201)。 FIG. 12 is a flow chart showing an example of the peripheral search processing in step S605. The surrounding search unit 117 reads the input table 121, the analysis information 122, and the recommendation parameter θrecommend output in step S1104 (S1201).

周辺探索部117は、レコメンドパラメータθrecommendを初期値として、レコメンドパラメータθrecommendの周辺のパラメータセットを適用したモデルを入力テーブル121の説明変数に適用し、最良の評価値を示すパラメータセットを探索する(S1202)。周辺探索部117は、最良の評価値を示すパラメータセットをベストパラメータθbestとして出力し(S1203)、探索処理を終了する。 The peripheral search unit 117 uses the recommended parameter θrecommend as an initial value, applies a model to which the parameter set around the recommended parameter θrecommend is applied to the explanatory variables of the input table 121, and searches for the parameter set showing the best evaluation value. (S1202). The surrounding search unit 117 outputs the parameter set indicating the best evaluation value as the best parameter θ best (S1203), and ends the search process.

このように周辺探索部117は、類似事例におけるレコメンドパラメータθrecommendの周辺を探索することにより、精度の高い結果を示すベストパラメータθbestを少ない処理量で取得することができる。 In this way, the peripheral searching unit 117 can acquire the best parameter θ best indicating a highly accurate result with a small amount of processing by searching around the recommended parameter θ recommend in similar cases.

なお、ステップS1202において、周辺探索部117は、例えば、予め定められた範囲のパラメータセットを探索する。 In step S1202, peripheral searching section 117 searches for a parameter set within a predetermined range, for example.

また、ステップS1202において、周辺探索部117は、例えば、レコメンドパラメータθrecommendを中心として所定の条件に基づいて更新(例えば拡大又は縮小した)範囲のパラメータセットを探索してもよい。 Further, in step S1202, the surrounding search unit 117 may search for a parameter set in an updated (for example, enlarged or reduced) range based on a predetermined condition centering on the recommended parameter θrecommend , for example.

具体的には、例えば、周辺探索部117は、var=(xmax-xmin)×(1-|Corr|)を算出する(但しxmax及びxminはそれぞれ予め定められたパラメータの範囲の最大値及び最小値であり、Corrは類似事例と、入力テーブル121が示す分析対象事例と、の相関係数である)。周辺探索部117は、xnew_min=xrecommend-varを更新後のパラメータの範囲の最小値、xnew_max=xrecommend+varを更新後のパラメータの範囲の最大値として、当該範囲においてパラメータセットを探索する(但しxrecommendはレコメンドパラメータである)。 Specifically, for example, the peripheral searching unit 117 calculates var=(x max −x min )×(1−|Corr|) (where x max and x min are each within a predetermined range of parameters). are the maximum value and the minimum value, and Corr is the correlation coefficient between the similar case and the analysis target case indicated by the input table 121). Peripheral search unit 117 sets x new_min = x recommend −var as the minimum value of the updated parameter range and x new_max = x recommend + var as the maximum value of the updated parameter range, and searches for a parameter set in the range. (However, x recommend is a recommendation parameter).

図13は、ステップS606の再学習処理の一例を示すフローチャートである。再学習部118は、入力テーブル121と、分析情報122と、ステップS1203で出力されたベストパラメータθbestと、を読み出す(S1301)。 FIG. 13 is a flow chart showing an example of the relearning process in step S606. The relearning unit 118 reads the input table 121, the analysis information 122, and the best parameter θ best output in step S1203 (S1301).

再学習部118は、ベストパラメータθbestに基づいて、入力テーブル121に対して前処理を実行する(S1302)。具体的には、例えば、再学習部118は、数値カラムの正規化、文字列カラムの表記ゆれの統合、PCA(Principal Component Analysis)などを用いた次元圧縮、文字列カラムに対するダミー変数化処理、外れ値処理、及び異常値処理はいずれも前処理の一例である。 The relearning unit 118 performs preprocessing on the input table 121 based on the best parameter θ best (S1302). Specifically, for example, the relearning unit 118 performs normalization of numeric columns, integration of notational variations in character string columns, dimension compression using PCA (Principal Component Analysis), etc., conversion of character string columns into dummy variables, Both outlier processing and outlier processing are examples of preprocessing.

再学習部118は、ベストパラメータθbestに従って、入力テーブル121の特徴量を生成する(S1303)。具体的には、例えば、再学習部118数値カラムの分割、対数変換、指数変換、時系列特徴量変換、及び/又は時刻データの年月日への変換などによって特徴量を生成する。 The relearning unit 118 generates the feature amount of the input table 121 according to the best parameter θ best (S1303). Specifically, for example, the re-learning unit 118 generates feature values by dividing numerical columns, logarithmic conversion, exponential conversion, time-series feature value conversion, and/or conversion of time data into date.

再学習部118は、ベストパラメータθbestを用いて、入力テーブル121に対してモデリングを実行する(S1304)。線形回帰、Logistic回帰、SVM、SVR、GaussianProcess、RandomForest、LightGBM、XGBoost、及びNeuralNetworkはいずれもモデリングの一例である。再学習部118は、ステップS1304のモデリングにおいて得られる、入力テーブル121の事例の目的変数を予測するモデル124及び当該モデル124による分析結果を出力し(S1305)、再学習処理を終了する。 The relearning unit 118 performs modeling on the input table 121 using the best parameter θ best (S1304). Linear Regression, Logistic Regression, SVM, SVR, GaussianProcess, RandomForest, LightGBM, XGBoost, and NeuralNetwork are all examples of modeling. The relearning unit 118 outputs the model 124 for predicting the target variable of the example in the input table 121 obtained in the modeling in step S1304 and the analysis result of the model 124 (S1305), and ends the relearning process.

図14は、分析データベース作成処理の一例を示すフローチャートである。分析データベース作成処理は、入力テーブル121に対する分析結果を分析データベース123へと蓄積する処理であるため、図6の自動分析実行処理の終了後に行われることが望ましい。
分析データベース作成部112は、入力テーブル121と、分析情報122と、を読み出す(S1401)。
FIG. 14 is a flowchart showing an example of analysis database creation processing. Since the analysis database creation process is a process of accumulating the analysis results for the input table 121 in the analysis database 123, it is desirable to be performed after the automatic analysis execution process of FIG. 6 is completed.
The analysis database creating unit 112 reads the input table 121 and the analysis information 122 (S1401).

分析データベース作成部112は共通パラメータ探索処理を実行する(S1402)。分析データベース作成部112は、ステップS1402において、図8の共通パラメータ探索処理と同様に、入力テーブル121に対して、パラメータセットの探索を行う。 The analysis database creation unit 112 executes common parameter search processing (S1402). In step S1402, the analysis database creation unit 112 searches the input table 121 for a parameter set in the same manner as in the common parameter search process of FIG.

分析データベース作成部112は、詳細探索を実行する(S1403)。ステップS1403において、分析データベース作成部112は、ステップS1402で探索した分析事例間の共通パラメータ以外(即ちcommon_grid)のパラメータセット(例えば、各common_gridから所定範囲以内の全てのパラメータセット)を探索する。 The analysis database creation unit 112 executes detailed search (S1403). In step S1403, the analysis database creation unit 112 searches for parameter sets (for example, all parameter sets within a predetermined range from each common_grid) other than the common parameters (that is, common_grid) between the analysis cases searched in step S1402.

分析データベース作成部112は、ステップS1302とステップS1303とにおいて探索された全てのパラメータセットのうち、最も高い評価値を示すサンプルにBest_Flagとして1を付与する(S1404)。なお、ステップS1404の処理は、運用時の動作を高速化するための処理であるため、必ずしも実行されなくてもよい。 The analysis database creation unit 112 assigns 1 as Best_Flag to the sample showing the highest evaluation value among all the parameter sets searched in steps S1302 and S1303 (S1404). Note that the process of step S1404 is a process for speeding up the operation during operation, so it does not necessarily have to be executed.

分析データベース作成部112は、入力テーブル121の事例に対してAnalysis_IDを付与し、Analysis_ID、Model_Name、Recipe_ID、Best_Flag、及びAccuracyをそれぞれ分析データベース123に記録し(S1404)、分析データベース作成処理を終了する。 The analysis database creation unit 112 assigns Analysis_ID to the cases in the input table 121, records Analysis_ID, Model_Name, Recipe_ID, Best_Flag, and Accuracy in the analysis database 123 (S1404), and ends the analysis database creation process.

なお、分析データベース作成部112は、パラメータデータベース125に格納されていないパラメータセットを探索した場合には、当該パラメータセットに対してRecipe_IDを付与し、当該Recipe_IDと当該パラメータセットをパラメータデータベース125に記録する。 When searching for a parameter set that is not stored in the parameter database 125, the analysis database creation unit 112 assigns a Recipe_ID to the parameter set, and records the Recipe_ID and the parameter set in the parameter database 125. .

また、分析データベース123のCommon_Search欄1233の値は、例えば、分析支援装置100のユーザの入力に従って記録されてもよいし、自動で(例えば所定のモデルのうち、所定値以上のAccuracyを示すレコードについては1、他のレコードについては0)記録されてもよい。 In addition, the value of the Common_Search column 1233 of the analysis database 123 may be recorded, for example, according to the input of the user of the analysis support apparatus 100, or automatically (for example, among predetermined models, for records indicating Accuracy equal to or greater than a predetermined value 1 for other records, 0) may be recorded.

図15は、自動分析実行処理が行われるときに出力装置105に表示される表示画面の一例である。表示画面1500は、例えば、出力情報表示領域1501、類似事例抽出レコメンド実行ボタン1502、再探索実行ボタン1503、及びモデル学習実行ボタン1504を含む。 FIG. 15 is an example of a display screen displayed on the output device 105 when automatic analysis execution processing is performed. The display screen 1500 includes, for example, an output information display area 1501 , a similar case extraction recommendation execution button 1502 , a re-search execution button 1503 , and a model learning execution button 1504 .

類似事例抽出レコメンド実行ボタン1502が選択されると、図6の自動分析実行処理が行われ、出力情報表示領域1501に、例えば、図9の類似事例抽出処理において抽出された類似事例IDと、分析対象事例と当該類似事例との類似度と、図11のパラメータレコメンド処理において出力されたレコメンドパラメータと、が表示される。 When the similar case extraction recommendation execution button 1502 is selected, the automatic analysis execution processing of FIG. The degree of similarity between the target case and the similar case and the recommended parameters output in the parameter recommendation process of FIG. 11 are displayed.

再探索実行ボタン1503が選択されると、図12の周辺探索処理が実行されて、出力情報表示領域1501にベストパラメータがさらに表示される。モデル学習実行ボタン1504が選択されると、図13の再学習処理が実行されて、出力されたモデルがさらに表示される。 When the re-search execution button 1503 is selected, the surrounding search processing of FIG. 12 is executed and the best parameters are further displayed in the output information display area 1501 . When the model learning execution button 1504 is selected, the relearning process of FIG. 13 is executed and the output model is further displayed.

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 In addition, the present invention is not limited to the above-described embodiments, and includes various modifications. For example, the above-described embodiments have been described in detail in order to explain the present invention in an easy-to-understand manner, and are not necessarily limited to those having all the described configurations. It is also possible to replace part of the configuration of one embodiment with the configuration of another embodiment, or to add the configuration of another embodiment to the configuration of one embodiment. Moreover, it is possible to add, delete, or replace a part of the configuration of each embodiment with another configuration.

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。 Further, each of the above configurations, functions, processing units, processing means, and the like may be realized by hardware, for example, by designing them in an integrated circuit. Moreover, each of the above configurations, functions, etc. may be realized by software by a processor interpreting and executing a program for realizing each function. Information such as programs, tables, and files that implement each function can be stored in recording devices such as memories, hard disks, SSDs (Solid State Drives), or recording media such as IC cards, SD cards, and DVDs.

また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 Further, the control lines and information lines indicate those considered necessary for explanation, and not all control lines and information lines are necessarily indicated on the product. In practice, it may be considered that almost all configurations are interconnected.

100 分析支援装置、101 CPU、102 メモリ、103 補助記憶装置、104 入力装置、105 出力装置、106 通信装置、111 自動分析実行部、112 分析データベース作成部、113 ルールベース問題分類部、114 共通パラメータ探索部、115 類似事例抽出部、116 パラメータレコメンド部、117 周辺探索部、118 再学習部、121 入力テーブル、122 分析情報、123 分析データベース、124 モデル、125 パラメータデータベース 100 analysis support device, 101 CPU, 102 memory, 103 auxiliary storage device, 104 input device, 105 output device, 106 communication device, 111 automatic analysis execution unit, 112 analysis database creation unit, 113 rule-based problem classification unit, 114 common parameter search unit 115 similar case extraction unit 116 parameter recommendation unit 117 peripheral search unit 118 relearning unit 121 input table 122 analysis information 123 analysis database 124 model 125 parameter database

Claims (9)

分析支援装置であって、
プロセッサとメモリとを有し、
前記メモリは、
分析対象事例の説明変数と目的変数とを示す分析対象事例データと、
分析済み事例を分析したモデル及び前記モデルに適用されたパラメータの組み合わせと、前記パラメータが適用されたモデルによって前記分析済み事例が分析されたときの当該モデルの評価値と、を示す分析評価データと、を保持し、
前記プロセッサは、
前記分析評価データに含まれる予め定められた一部のモデル及びパラメータの組み合わせを前記分析対象事例の説明変数に適用して前記分析対象事例の目的変数を予測したときの当該モデルの評価値を算出し、
前記算出した評価値と、前記分析評価データが示す評価値それぞれと、を比較して類似度を算出し、
前記算出した類似度に基づいて、前記分析対象事例に類似する分析済み事例である類似事例を特定する、分析支援装置。
An analysis support device,
having a processor and a memory,
The memory is
analysis target case data indicating explanatory variables and objective variables of analysis target cases;
analysis evaluation data indicating a combination of a model that analyzed an analyzed case and parameters applied to the model, and an evaluation value of the model when the analyzed case was analyzed by the model to which the parameters were applied; , and hold
The processor
Calculating the evaluation value of the model when predicting the objective variable of the analysis target case by applying a combination of predetermined models and parameters included in the analysis evaluation data to the explanatory variables of the analysis target case death,
calculating a degree of similarity by comparing the calculated evaluation value with each evaluation value indicated by the analysis evaluation data;
An analysis support device that identifies a similar case, which is an analyzed case similar to the analysis target case, based on the calculated degree of similarity.
請求項1に記載の分析支援装置であって、
前記プロセッサは、前記分析評価データを参照して、前記類似事例を分析したモデル及び当該モデルに適用されたパラメータの組み合わせのうち、評価値が最も高い組み合わせにおけるパラメータをレコメンドパラメータに決定する、分析支援装置。
The analysis support device according to claim 1,
The processor refers to the analysis evaluation data, and determines, as a recommended parameter, the parameter in the combination with the highest evaluation value among the combinations of the model that analyzed the similar case and the parameter applied to the model. Device.
請求項2に記載の分析支援装置であって、
表示装置を有し、
前記プロセッサは、前記類似事例を示す情報と、前記類似度と、前記レコメンドパラメータと、を前記表示装置に表示する、分析支援装置。
The analysis support device according to claim 2,
having a display device;
The analysis support device, wherein the processor displays information indicating the similar cases, the degree of similarity, and the recommended parameters on the display device.
請求項2に記載の分析支援装置であって、
前記プロセッサは、
前記レコメンドパラメータを含み所定条件を満たす探索範囲のパラメータを探索し、
前記探索したパラメータのうち、当該探索したパラメータが適用された前記レコメンドパラメータに対応するモデルによって前記分析対象事例の目的変数を予測したときの当該モデルの評価値が最も高いパラメータを、ベストパラメータに決定する、分析支援装置。
The analysis support device according to claim 2,
The processor
searching for parameters in a search range that includes the recommended parameters and satisfies a predetermined condition;
Among the searched parameters, the parameter with the highest evaluation value of the model when predicting the target variable of the case to be analyzed by the model corresponding to the recommended parameter to which the searched parameter is applied is determined as the best parameter. analysis support device.
請求項4に記載の分析支援装置であって、
前記プロセッサは、
前記算出した評価値と、前記類似事例の評価値と、の相関係数を算出し、
前記相関係数の絶対値が大きいほど前記探索範囲が小さくなるよう前記探索範囲を決定する、分析支援装置。
The analysis support device according to claim 4,
The processor
calculating a correlation coefficient between the calculated evaluation value and the evaluation value of the similar case;
An analysis support device that determines the search range so that the search range becomes smaller as the absolute value of the correlation coefficient increases.
請求項4に記載の分析支援装置であって、
前記プロセッサは、前記ベストパラメータが適用された前記レコメンドパラメータに対応するモデルを前記分析対象事例に適用した分析結果を出力する、分析支援装置。
The analysis support device according to claim 4,
The analysis support device, wherein the processor outputs an analysis result obtained by applying the model corresponding to the recommended parameter to which the best parameter is applied to the case to be analyzed.
請求項1に記載の分析支援装置であって、
前記プロセッサは、前記分析対象事例を分析した前記一部のモデル及び当該モデルに適用されたパラメータの組み合わせと、前記算出した評価値と、を前記分析評価データに格納する、分析支援装置。
The analysis support device according to claim 1,
The analysis support device, wherein the processor stores, in the analysis evaluation data, a combination of the partial model that analyzed the analysis target case and the parameter applied to the model, and the calculated evaluation value.
請求項1に記載の分析装置であって、
前記分析評価データは、前記分析済み事例においてモデルによって解かれた問題を示し、
前記プロセッサは、
前記分析対象事例データにおける、目的変数の要素数と、前記目的変数のデータ型と、前記目的変数の値の相対度数と、に基づいて、前記分析対象事例においてモデルによって解かれる問題を特定し、
前記分析評価データに含まれる前記予め定められた一部のモデル及びパラメータの組み合わせのうち、前記特定した問題に対応するモデル及びパラメータの組み合わせによって前記分析対象事例の目的変数を予測したときの当該モデルの評価値を算出する、分析支援装置。
The analysis device according to claim 1,
the analytical evaluation data indicates a problem solved by the model in the analyzed cases;
The processor
identifying a problem to be solved by a model in the case to be analyzed based on the number of elements of the objective variable, the data type of the objective variable, and the relative frequency of the value of the objective variable in the case data to be analyzed;
The model when the target variable of the case to be analyzed is predicted by the combination of the model and parameters corresponding to the identified problem, among the combinations of the predetermined partial models and parameters included in the analysis evaluation data An analysis support device that calculates the evaluation value of
分析支援装置による分析支援方法であって、
前記分析支援装置は、プロセッサとメモリとを有し、
前記メモリは、
分析対象事例の説明変数と目的変数とを示す分析対象事例データと、
分析済み事例を分析したモデル及び前記モデルに適用されたパラメータの組み合わせと、前記パラメータが適用されたモデルによって前記分析済み事例が分析されたときの当該モデルの評価値と、を示す分析評価データと、を保持し、
前記分析支援方法は、
前記プロセッサが、前記分析評価データに含まれる予め定められた一部のモデル及びパラメータの組み合わせを前記分析対象事例の説明変数に適用して前記分析対象事例の目的変数を予測したときの当該モデルの評価値を算出し、
前記プロセッサが、前記算出した評価値と、前記分析評価データが示す評価値それぞれと、を比較して類似度を算出し、
前記プロセッサが、前記算出した類似度に基づいて、前記分析対象事例に類似する分析済み事例である類似事例を特定する、分析支援方法。
An analysis support method using an analysis support device,
The analysis support device has a processor and a memory,
The memory is
analysis target case data indicating explanatory variables and objective variables of analysis target cases;
analysis evaluation data indicating a combination of a model that analyzed an analyzed case and parameters applied to the model, and an evaluation value of the model when the analyzed case was analyzed by the model to which the parameters were applied; , and hold
The analysis support method includes:
of the model when the processor predicts the objective variable of the analysis target case by applying a combination of predetermined models and parameters included in the analysis evaluation data to the explanatory variables of the analysis target case; Calculate the evaluation value,
The processor compares the calculated evaluation value with each evaluation value indicated by the analysis evaluation data to calculate a degree of similarity;
An analysis support method, wherein the processor identifies a similar case, which is an analyzed case similar to the case to be analyzed, based on the calculated degree of similarity.
JP2020052908A 2020-03-24 2020-03-24 Analysis support device and analysis support method Active JP7292235B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020052908A JP7292235B2 (en) 2020-03-24 2020-03-24 Analysis support device and analysis support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020052908A JP7292235B2 (en) 2020-03-24 2020-03-24 Analysis support device and analysis support method

Publications (2)

Publication Number Publication Date
JP2021152751A JP2021152751A (en) 2021-09-30
JP7292235B2 true JP7292235B2 (en) 2023-06-16

Family

ID=77887319

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020052908A Active JP7292235B2 (en) 2020-03-24 2020-03-24 Analysis support device and analysis support method

Country Status (1)

Country Link
JP (1) JP7292235B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090292A1 (en) * 2021-11-17 2023-05-25 ソニーグループ株式会社 Information processing device, information processing method, and computer program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218869A (en) 2015-05-22 2016-12-22 富士通株式会社 Setting method, setting program, and setting device
JP2019159769A (en) 2018-03-13 2019-09-19 富士通株式会社 Search program, search method, and search device
US20210097343A1 (en) 2019-09-26 2021-04-01 Capital One Services, Llc Method and apparatus for managing artificial intelligence systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218869A (en) 2015-05-22 2016-12-22 富士通株式会社 Setting method, setting program, and setting device
JP2019159769A (en) 2018-03-13 2019-09-19 富士通株式会社 Search program, search method, and search device
US20210097343A1 (en) 2019-09-26 2021-04-01 Capital One Services, Llc Method and apparatus for managing artificial intelligence systems

Also Published As

Publication number Publication date
JP2021152751A (en) 2021-09-30

Similar Documents

Publication Publication Date Title
US11640563B2 (en) Automated data processing and machine learning model generation
US10891315B2 (en) Landmark point selection
TW202029079A (en) Method and device for identifying irregular group
JP7281905B2 (en) Document evaluation device, document evaluation method and program
JP2019049873A (en) Synonym dictionary creation apparatus, synonym dictionary creation program, and synonym dictionary creation method
JP2022037955A (en) System for selecting learning model
Rahul et al. Analysis and processing aspects of data in big data applications
JP6242540B1 (en) Data conversion system and data conversion method
US20220076157A1 (en) Data analysis system using artificial intelligence
Ergezer et al. Time series classification with feature covariance matrices
Shu et al. Short isometric shapelet transform for binary time series classification
CN114118310A (en) Clustering method and device based on comprehensive similarity
JP7292235B2 (en) Analysis support device and analysis support method
Suleman et al. Google play store app ranking prediction using machine learning algorithm
CN110472659A (en) Data processing method, device, computer readable storage medium and computer equipment
CN116561134B (en) Business rule processing method, device, equipment and storage medium
EP4196900A1 (en) Identifying noise in verbal feedback using artificial text from non-textual parameters and transfer learning
Danesh et al. Ensemble-based clustering of large probabilistic graphs using neighborhood and distance metric learning
CN116933130A (en) Enterprise industry classification method, system, equipment and medium based on big data
EP3465470A1 (en) Method and device for generating an electronic document specification based on a n-dimensional data source
JP2013130965A (en) Data analysis device, data analysis method, and program
CN114090869A (en) Target object processing method and device, electronic equipment and storage medium
JPWO2023037399A5 (en)
KR20210023453A (en) Apparatus and method for matching review advertisement
CN112151186A (en) Method, device and system for extracting disease causes and disease causes from medical texts

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230606

R150 Certificate of patent or registration of utility model

Ref document number: 7292235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150