JP2021182329A - Learning model selection method - Google Patents
Learning model selection method Download PDFInfo
- Publication number
- JP2021182329A JP2021182329A JP2020088266A JP2020088266A JP2021182329A JP 2021182329 A JP2021182329 A JP 2021182329A JP 2020088266 A JP2020088266 A JP 2020088266A JP 2020088266 A JP2020088266 A JP 2020088266A JP 2021182329 A JP2021182329 A JP 2021182329A
- Authority
- JP
- Japan
- Prior art keywords
- model
- learning
- input data
- data
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、学習モデル選択方法に係り、特に、転移学習において少ないデータから最適なモデルを選択するのに好適な学習モデル選択方法に関する。 The present invention relates to a learning model selection method, and more particularly to a learning model selection method suitable for selecting an optimum model from a small amount of data in transfer learning.
情報処理技術とそれを支えるベーステクノロジーの進展に伴って、様々な分野において、機械学習の期待が高まっている。機械学習とは、大量のデータまたはあるルールにより学習モデル(本明細書中では、単に「モデル」ともいう)を構築して、その学習モデルに従って最適な問題解決の解を導く手法である。 With the development of information processing technology and the base technology that supports it, expectations for machine learning are increasing in various fields. Machine learning is a method of constructing a learning model (also referred to simply as a "model" in the present specification) with a large amount of data or a certain rule, and deriving an optimum problem-solving solution according to the learning model.
一般に機械学習の精度は、データの量が十分多いほど高い精度を実現可能である。逆にデータが少ない場合は十分な精度のモデルを作成することは困難である。そのため、目的が同じ予測システムを構築しようとした場合でも、データが多く得られる案件では十分な精度だが、データが少ない案件では精度が不十分ということがありうる。 In general, the accuracy of machine learning can be improved as the amount of data is sufficiently large. On the contrary, when the data is small, it is difficult to create a model with sufficient accuracy. Therefore, even if an attempt is made to build a forecasting system with the same purpose, it is possible that the accuracy is sufficient for a project in which a large amount of data can be obtained, but the accuracy is insufficient in a project with a small amount of data.
機械学習の分野で少ないデータで高い精度を実現する手法としては、他のデータで作成したモデル(既存モデル)を丸ごと再利用したり、既存モデルと新しいデータを使った転移学習により既存モデルの一部を再利用する方法が知られている。既存モデルと新しいデータを使った転移学習とは、例えば既存モデルに新しいデータ入力し、その推論結果を新しいデータと結合して、結合後のデータを用いて新しいモデルを作成する方法である。 In the field of machine learning, as a method to achieve high accuracy with a small amount of data, one of the existing models can be reused entirely from a model created with other data (existing model), or transfer learning using an existing model and new data. A method of reusing a part is known. Transfer learning using an existing model and new data is, for example, a method of inputting new data into an existing model, combining the inference result with the new data, and creating a new model using the combined data.
この転移学習の手法においては、いかにして新しいデータに適合するモデルを選択するかが重要になる。そのような機械学習のために、最適なモデルを選択する技術としては、例えば、特許文献1に開示がある。特許文献1に記載された予測モデル選択システムでは、単一のデータから初期値を変えて複数の予測モデルを作成する。そして、予測モデルを構成する要素を数値化し、数値が選択基準を満たさない予測モデルを除外する。これにより、訓練データの数量が十分でない場合でも、適切な予測モデルを選択することができるとしている。
In this transfer learning method, it is important how to select a model that fits the new data. For example,
一般に、最適なモデルを選択して、新たな学習システムを構築するにあたっては、再利用または転移学習に用いる既存モデルの特性が、新モデルの精度を左右することになる。例えば、地域ごとの住宅価格を予測する学習システムを構築する場合、サンプル数が多い都市部では精度の高いモデルを構築可能だが、サンプル数の少ない地方では十分な精度が得られない。この場合、都市部のモデルを転移学習に利用することが考えられるが、複数の都市で構築された多数のモデルの中から、どの都市のモデルを選択すべきかを決める必要がある。 In general, when selecting the optimum model and constructing a new learning system, the characteristics of the existing model used for reuse or transfer learning determine the accuracy of the new model. For example, when building a learning system that predicts house prices for each region, it is possible to build a highly accurate model in urban areas with a large number of samples, but sufficient accuracy cannot be obtained in rural areas with a small number of samples. In this case, it is conceivable to use the urban model for transfer learning, but it is necessary to decide which city model should be selected from a large number of models constructed in multiple cities.
特許文献1によると、単一のデータから初期値を変えて複数の予測モデルを作成し、予測モデルを構成する要素を数値化し、数値が選択基準を満たさない予測モデルを除外する技術が開示されている。しかしながら、異なるデータから生成されたモデルの中から、新規データに類似したモデルを選択するケースは想定されていない。
According to
本発明の目的は、既存モデルの中から新規データに対して、問題解決にあたって精度の高い学習モデルを選択する学習モデル選択方法を提供することにある。 An object of the present invention is to provide a learning model selection method for selecting a learning model with high accuracy in solving a problem for new data from existing models.
本発明の学習モデル選択方法は、好ましくは、情報処理装置が保存している複数の既存のモデルから、新規の入力データから高い精度のモデルを作成する転移学習の手法に適したモデルを選択する学習モデル選択方法であって、情報処理装置が、入力データをテストデータと学習データに分離するステップと、情報処理装置が、入力データから得られる学習データを既存モデルに入力して、一つ以上の既存モデルからそれぞれ転移学習によるモデルを作成するステップと、情報処理装置が、入力データから得られるテストデータを転移学習によるモデルに入力し、推論して得られたデータの目的変数と、入力データの目的変数にあたる項目の真値との誤差を算出するステップと、情報処理装置が、誤差が小さい所定個数の転移モデルを最適なモデルとして選択するステップとを有するようにしたものである。 The learning model selection method of the present invention preferably selects a model suitable for a transfer learning method for creating a highly accurate model from new input data from a plurality of existing models stored in the information processing apparatus. One or more training model selection methods, in which the information processing device separates the input data into test data and training data, and the information processing device inputs the training data obtained from the input data into the existing model. The step of creating a model by transfer learning from each of the existing models of the above, the objective variable of the data obtained by inputting the test data obtained from the input data to the model by transfer learning, and the input data The data processing apparatus has a step of calculating an error from the true value of the item corresponding to the objective variable of the above, and a step of selecting a predetermined number of transfer models having a small error as the optimum model.
本発明によれば、既存モデルの中から新規データに対して、問題解決にあたって精度の高い学習モデルを選択する学習モデル選択方法を提供することができる。 INDUSTRIAL APPLICABILITY According to the present invention, it is possible to provide a learning model selection method for selecting a learning model with high accuracy in solving a problem for new data from existing models.
以下、本発明に係る各実施形態を、図1ないし図28を用いて説明する。 Hereinafter, each embodiment of the present invention will be described with reference to FIGS. 1 to 28.
〔実施形態1〕
以下、本発明に係る実施形態1を、図1ないし図16を用いて説明する。
実施形態1の学習モデル選択方法は、新規モデルに適応させるための最適なモデルを、入力データの値との差異に従って、既存のモデルから選択するものである。
[Embodiment 1]
Hereinafter, the first embodiment according to the present invention will be described with reference to FIGS. 1 to 16.
In the learning model selection method of the first embodiment, the optimum model for adapting to the new model is selected from the existing models according to the difference from the value of the input data.
先ず、図1および図2を用いてモデル選択装置の構成について説明する。
モデル選択装置100は、図1に示されるように、機能構成として、候補モデル分析部110、転移学習部120、モデル評価部130、最適モデル選択部140、モデル管理部150、記憶部160からなる。
First, the configuration of the model selection device will be described with reference to FIGS. 1 and 2.
As shown in FIG. 1, the
候補モデル分析部110は、モデル管理部150を介してモデル管理DB(DataBase)200から取り出した入力データ10を分析するためのモデルの候補を取り出す機能部である。転移学習部120は、モデルの候補に対して、入力データ10に対する転移学習を行う機能部である。モデル評価部130は、転移学習によって構築されたモデルの評価を行う機能部である。最適モデル選択部140は、モデル評価部130の評価に従って、入力データ10に対しての学習モデルとして最適なモデルを選択する機能部である。モデル管理部150は、各部の指示に従って、モデル管理DB200から必要なモデルを取り出したり、モデルに対して情報の入出力や加工を行う機能部である。記憶部160は、データを記憶する機能部である。
The candidate
記憶部160には、モデル管理DB200、入力データDB210、計算結果出DB220が記憶される。
モデル管理DB200は、モデル選択の対象となるモデルを格納するDBである。モデル選択の対象となるモデルは、既に別の学習過程で作成されているものとする。入力データDB210は、学習システムを構築するための対象となる入力データを格納するDBである。計算結果DB220は、モデル選択装置100の行う処理の計算結果を格納するDBである。
なお、モデル選択装置100の処理で使用されるデータのデータ構造については後に詳説する。
The
The
The data structure of the data used in the processing of the
次に、図2を用いてモデル選択装置のハードウェア・ソフトウェア構成について説明する。
モデル選択装置100のハードウェア構成としては、例えば、図2に示されるパーソナルコンピュータのような一般的な情報処理装置で実現される。
Next, the hardware / software configuration of the model selection device will be described with reference to FIG.
The hardware configuration of the
モデル選択装置100は、CPU(Central Processing Unit)502、主記憶装置504、ネットワークI/F(InterFace)506、表示I/F508、入出力I/F510、補助記憶I/F512が、バスにより結合された形態になっている。
In the
CPU502は、モデル選択装置100の各部を制御し、主記憶装置504に必要なプログラムをロードして実行する。
主記憶装置504は、通常、RAMなどの揮発メモリで構成され、CPU502が実行するプログラム、参照するデータが記憶される。
The
The
ネットワークI/F506は、ネットワークと接続するためのインタフェースである。 The network I / F506 is an interface for connecting to the network.
表示I/F508は、LCD(Liquid Crystal Display)などの表示装置520を接続するためのインタフェースである。
The display I /
入出力I/F510は、入出力装置を接続するためのインタフェースである。図2の例では、キーボード530とポインティングデバイスのマウス532が接続されている。
The input / output I /
補助記憶I/F512は、HDD(Hard Disk Drive)550やSSD(Solid State Drive)などの補助記憶装置を接続するためのインタフェースである。
HDD550は、大容量の記憶容量を有しており、本実施形態を実行するためのプログラムが格納されている。
The auxiliary storage I /
The
モデル選択装置100には、候補モデル分析プログラム560、転移学習プログラム561、モデル構築評価プログラム562、最適モデル選択プログラム563がインストールされている。候補モデル分析プログラム560、転移学習プログラム561、モデル構築評価プログラム562、最適モデル選択プログラム563は、それぞれ候補モデル分析部110、転移学習部120、モデル評価部130、最適モデル選択部140の各機能を実行するプログラムである。
また、HDD550には、モデル管理DB200、入力データDB210、計算結果出DB220が格納されている。
A candidate
Further, the
次に、図3を用いて本実施形態のモデル選択方法の考え方を具体的に説明する。
本実施形態では、図3に示されるように、函館の住宅データを入力データとして分析を行う住宅分析システムを例に採り、既存のモデルから転移学習に最適なモデルを選択する例について説明する。本実施形態では、目的変数である住宅価格を予測するために、住宅データの住宅価格の要因(築年数、最寄駅徒歩、面積)を説明変数としたモデルを構築して推論するシステムを例にとる。
Next, the concept of the model selection method of the present embodiment will be specifically described with reference to FIG.
In this embodiment, as shown in FIG. 3, an example of a housing analysis system that analyzes housing data in Hakodate as input data is taken as an example, and an example of selecting the optimum model for transfer learning from existing models will be described. In this embodiment, in order to predict the house price, which is the objective variable, an example is a system in which a model is constructed and inferred using the factors of the house price in the house data (age, walking distance from the nearest station, area) as explanatory variables. To take.
ここで、説明変数とは、機械学習の用語で、結果に影響を与える変数であり、目的変数とは、システムにより求めたい値を示す変数である。 Here, the explanatory variable is a machine learning term, and is a variable that affects the result, and the objective variable is a variable that indicates a value desired to be obtained by the system.
先ず、東京、札幌、旭川などの他の都市の住宅データにより、既存のモデルが構築されているものとする。次に、入力データとなる函館住宅データの学習データを用いて函館住宅価格予測モデルを構築することを考える。函館は学習データが少ないため転移学習により精度を高めたいとする。この時、複数の既存モデルの中でどのモデルを選択するのがよいのかというのが課題である。 First, it is assumed that an existing model is constructed from housing data of other cities such as Tokyo, Sapporo, and Asahikawa. Next, consider constructing a Hakodate housing price prediction model using the learning data of Hakodate housing data as input data. Since Hakodate has little learning data, we want to improve the accuracy by transfer learning. At this time, the issue is which model should be selected from among a plurality of existing models.
本実施形態は、函館住宅データから指定された項目に関する統計量(例えば、分散、平均など)を計算して、既存のモデルの統計量の近いものを候補モデルとして選択する。次に、入力データとなる函館住宅データの学習データを既存のモデル(例えば、モデル(東京)、モデル(札幌)、…)に入力して、転移学習を行い、新たな転移学習によるモデル(以下、「転移モデル」という)(例えば、転移モデル(東京)、転移モデル(札幌)、…)を得る。その後、入力データとなる函館住宅データのテストデータを複数の転移モデルに入力して、推論して得たデータの目的変数(住宅価格)と、入力データの目的変数(住宅価格)を算出し、その誤差を評価することにより、最適なモデルを選択しようとするものである。 In this embodiment, statistics (for example, variance, average, etc.) related to a specified item are calculated from Hakodate housing data, and a model having a close statistic of an existing model is selected as a candidate model. Next, the learning data of the Hakodate housing data, which is the input data, is input to an existing model (for example, model (Tokyo), model (Sapporo), ...), transfer learning is performed, and a new transfer learning model (hereinafter referred to as). , "Transition model") (for example, transfer model (Tokyo), transfer model (Sapporo), ...). After that, the test data of Hakodate housing data, which is the input data, is input to multiple transfer models, and the objective variable (house price) of the inferred data and the objective variable (house price) of the input data are calculated. By evaluating the error, we try to select the optimum model.
次に、図4ないし図8を用いて実施形態1のモデル選択装置で使用されるデータ構造について説明する。
住宅データテーブル300は、住宅分析システムの基本的な住宅データを格納するテーブルであり、例えば、図4に示されるように、住宅ID300a、築年数300b、最寄駅徒歩300c、用途地域300d、面積300e、間取り300f、形態300g、住宅価格300hの各フィールドよりなる。
Next, the data structure used in the model selection apparatus of the first embodiment will be described with reference to FIGS. 4 to 8.
The house data table 300 is a table that stores the basic house data of the house analysis system. For example, as shown in FIG. 4, the
住宅ID300aには、住宅を一意に識別するIDが格納される。築年数300bは、その住宅を立てたときからの年数が格納される。最寄駅徒歩300cは、その住宅から最寄の駅まで歩いてかかる時間が格納される。なお、この時間は一般には、80m/分の基準で距離に換算される。用途地域300dには、その住宅が存在する用途地域(都市計画法で定められた地域区分)、例えば、「住宅専用」、「商用地域」を表す文字列、コードなどが格納される。面積300eには、その住宅の建築面積が格納される。間取り300fには、その住宅の部屋構成、例えば、2LDK、1DKなどを表す文字列、コードが格納される。形態300gには、その住宅の建築形態として、例えば、アパート、マンション(区分所有)、戸建てを表す文字列、コードなどが格納される。住宅価格300hには、その住居の評価価格が格納される。
The
本実施形態では、入力データ10や学習に用いられるデータは、この住宅データテーブル300で表されるデータを例に採って説明する。機械学習の適用にあたり、住宅価格が目的変数となり、その他の項目が説明変数となる。
In the present embodiment, the
統計量項目テーブル420は、住宅データの各々の項目と各統計量を対応付けるテーブルである。項目のフィールドには、図4で示した各々の項目の名称、例えば、築年数、最寄駅徒歩、面積、…が格納される。そして、ヒストグラム、平均値、分散の対応ごとに、各々のフィールドに、統計量を表す文字列、コードが格納される。図5では、i番目のレコードと統計量を表すj番目のフィールドごとに、統計量i−jというシンボルが格納されている。 The statistic item table 420 is a table for associating each item of housing data with each statistic. The item field stores the name of each item shown in FIG. 4, for example, age, walking distance from the nearest station, area, and so on. Then, a character string and a code representing the statistic are stored in each field for each correspondence of the histogram, the average value, and the variance. In FIG. 5, a symbol called statistic i-j is stored in each of the i-th record and the j-th field representing the statistic.
モデル統計量情報テーブル430は、各モデルごとに、統計量の情報を対応付けるテーブルであり、図6に示されるように、モデルID430a、モデルファイルパス430b、統計量1−1、統計量1−2、統計量1−3、…の各フィールドを有する。
The model statistic information table 430 is a table to which the statistic information is associated with each model, and as shown in FIG. 6, the
モデルID430aには、モデルを一意に識別するIDが格納される。モデルファイルパス430bには、そのモデルのファイルシステムにおけるパスが格納される。統計量1−1、統計量1−2、統計量1−3、…には、図5の統計量項目テーブル420により対応付けられた項目に対する値が格納される。例えば、統計量1−1には、築年数に対する分散が格納される。
The
統計量比較テーブル400は、入力データの統計量と、各モデルを作成したときの学習データの統計量(本明細書中では、単に「モデルの統計量」ともいう)の差の結果を格納するテーブルであり、図7に示されるように、モデルID400a、分散σ400b、入力データの分散との差400cからなる。ここでは、統計量の一例として、データ項目の分布の分散とし、モデルの指定された項目の分散と入力データの指定された項目の分散との差をこのテーブルに格納する。
The statistic comparison table 400 stores the result of the difference between the statistic of the input data and the statistic of the training data when each model is created (also referred to simply as "model statistic" in the present specification). It is a table, and as shown in FIG. 7, it is composed of a
モデルID400aには、モデルを一意に識別するIDが格納される。分散σ400bには、そのモデルにおけるあるデータ項目の分布の分散が格納される。入力データの分散との差400cには、各モデルのあるデータ項目の分布の分散と入力データのあるデータ項目の分布の分散との差が格納される。
An ID that uniquely identifies the model is stored in the
転移モデル結果テーブル410には、転移モデルから得られた目的変数となる項目の値と、入力データのその項目の真値の差を格納するテーブルであり、図8に示されるように、転移モデルID410a、モデルファイルパス410b、誤差410cが格納される。
The transfer model result table 410 is a table that stores the difference between the value of the item that is the objective variable obtained from the transfer model and the true value of the item of the input data, and is a transfer model as shown in FIG. The
転移モデルID410aには、転移モデルを一意に識別するIDが格納される。モデルファイルパス410bには、その転移モデルのファイルシステムにおけるパスが格納される。誤差410cには、その転移モデルの推論から得られる目的変数となる項目の値と、入力データのその項目の真値との平均二乗誤差が格納される(詳細は後述)。
The
次に、図9ないし図16を用いてモデル選択装置の行う処理について説明する。 Next, the processing performed by the model selection device will be described with reference to FIGS. 9 to 16.
先ず、図9を用いてモデル選択装置が入力データの取り込みからモデルを選択するまでの一連の処理について説明する。
先ず、モデル選択装置100は、データ分析処理を行う(S01)。データ分析処理の詳細は、後に、図10を用いて説明する。
First, a series of processes from the acquisition of input data to the selection of a model by the model selection device will be described with reference to FIG.
First, the
次に、モデル選択装置100は、候補モデル検索処理を行う(S02)。候補モデル検索処理の詳細は、後に、図11を用いて説明する。
Next, the
次に、モデル選択装置100は、候補モデル選択処理を行う(S03)。候補モデル選択処理の詳細は、後に、図13を用いて説明する。
Next, the
次に、モデル選択装置100は、転移学習処理を行う(S04)。転移学習処理の詳細は、後に、図14を用いて説明する。
Next, the
次に、モデル選択装置100は、転移モデル評価処理を行う(S05)。転移モデル評価処理の詳細は、後に、図15を用いて説明する。
Next, the
次に、モデル選択装置100は、最適モデル選択処理を行う(S06)。最適モデル選択処理の詳細は、後に、図16を用いて説明する。
Next, the
次に、図10を用いてデータ分析処理について説明する。
先ず、モデル選択装置100の候補モデル分析部110は、モデル管理部150を介して、入力データDB210から入力データ10を取得する(S100)。
次に、モデル管理部150を介して、モデル管理DB200の統計量項目対応テーブル420の項目と統計量の対応情報を取得する(S101)。
Next, the data analysis process will be described with reference to FIG.
First, the candidate
Next, the items in the statistic item correspondence table 420 of the
次に、統計量項目対応テーブル420の対応情報に従って、入力データ10の項目の各統計量を計算する(S102)。
次に、その計算結果を、計算結果DB220に格納する(S103)。
次に、取得した入力データ10を、テストデータと学習データに分離する(S104)。データを、テスト用のデータと学習用データに分離するのは、機械学習の分野で一般的に行われる手法である。分離の仕方は、ランダムに選択してもよいが、テストデータは、学習用データよりも一般的に少量である。テストデータ、学習データを使用する処理については、各々後に説明する。
Next, each statistic of the item of the
Next, the calculation result is stored in the calculation result DB 220 (S103).
Next, the acquired
次に、図11および図12を用いて候補モデル検索処理について説明する。
先ず、重視項目入力画面500から、ユーザが重視する分析項目と、モデル分析のために用いる統計量の入力を受け付ける(S200)。
Next, the candidate model search process will be described with reference to FIGS. 11 and 12.
First, from the priority
重視項目入力画面500は、図12に示されるように、重視項目リスト510と、統計リスト520からなり、ユーザは、マウスなどのポイティングデバイスにより、その項目を選択できるようになっている。この例では、重視項目として、「築年」、統計量として、分散が選択されたものとする。
As shown in FIG. 12, the important
次に、選択された重視項目の選択された統計量に関して、計算結果DBに格納している入力データの重視項目におけるS103で計算したその統計量の計算結果を取得する(S201)。 Next, with respect to the selected statistic of the selected priority item, the calculation result of the statistic calculated in S103 in the priority item of the input data stored in the calculation result DB is acquired (S201).
次に、モデルNの統計量の内で、図6のモデル統計量情報テーブル430を参照し、選択された重視項目の選択された統計量を取得する(S202)。ここで、Nの初期値は、1であり、フローチャートの中では、モデル1、モデル2、…のように処理するように記述している。
Next, among the statistics of the model N, the model statistic information table 430 of FIG. 6 is referred to, and the selected statistic of the selected important item is acquired (S202). Here, the initial value of N is 1, and in the flowchart, it is described that the processing is performed as
次に、入力データ10に関し、その重視項目におけるS103で計算したその統計量の計算結果S103と、モデルNの選択された重視項目の選択された統計量との差を計算し、図7に示した統計量比較テーブル400に格納する(S203)。
Next, with respect to the
そして、モデル管理DBで対象とするモデルの全てについて計算したか判定し(S204)、全てのモデルについて計算したときには(S204:YES)、処理を終了し、全てのモデルについて計算していないときには(S204:NO)、Nをインクリメントし(N++)、次のモデルNを取り出し(S210)、S202に戻る。 Then, it is determined in the model management DB whether all the target models have been calculated (S204), when all the models have been calculated (S204: YES), the processing is terminated, and all the models have not been calculated (S204). S204: NO), N is incremented (N ++), the next model N is taken out (S210), and the process returns to S202.
次に、図13を用いて候補モデル選択処理について説明する。
先ず、統計量比較テーブル400に格納された入力データの分散との差が小さい順にソートする(S300)。
Next, the candidate model selection process will be described with reference to FIG.
First, sorting is performed in ascending order of difference from the variance of the input data stored in the statistic comparison table 400 (S300).
次に、上位M(Mは、予め定められた個数)個のモデル、すなわち、入力データの分散との差が小さいM個のモデルを、候補モデルとして選択する(S301)。 Next, upper M (where M is a predetermined number) models, that is, M models having a small difference from the variance of the input data are selected as candidate models (S301).
次に、図14を用いて転移学習処理について説明する。
先ず、入力データから、S104で分離した学習データを取得する(S401)。
次に、モデル選択装置100の転移学習部120は、図13の候補モデル選択処理により選択された所定の上位M個のモデルを、モデル管理部150を介して、モデル管理部150から取得する(S401)。
Next, the transfer learning process will be described with reference to FIG.
First, the learning data separated in S104 is acquired from the input data (S401).
Next, the
次に、取得したモデルと学習データを用いて転移学習を行い、作成した転移モデルに、転移モデルIDを付与し、転移モデルIDをモデル管理DB200に格納し、転移モデルIDとファイルパスを、図7の転移モデル結果テーブル410に格納する(S402)。
Next, transfer learning is performed using the acquired model and training data, a transfer model ID is assigned to the created transfer model, the transfer model ID is stored in the
次に、選択された上位M個の全てに対して処理したか判定し(S403)、全てに対して処理したときには(S403:YES)、処理を終了し、全てに対して処理していないときには(S403:NO)、次のモデルを取り出し(S410)、S402に戻る。 Next, it is determined whether all of the selected upper M elements have been processed (S403), when all have been processed (S403: YES), the processing has been completed, and all have not been processed. (S403: NO), the next model is taken out (S410), and the process returns to S402.
次に、図15を用いて転移モデル評価処理について説明する。
先ず、モデル選択装置100のモデル評価部130は、入力データDBから、S105で分離したテストデータを取得する(S500)。
Next, the transfer model evaluation process will be described with reference to FIG.
First, the
次に、転移モデル統計量テーブル410に格納されている転移モデルIDの転移モデルMを取得する(S501)。ここで、Mの初期値は、1であり、フローチャートの中では、転移モデル1、転移モデル2、…のように処理するように記述している。
Next, the transfer model M of the transfer model ID stored in the transfer model statistic table 410 is acquired (S501). Here, the initial value of M is 1, and in the flowchart, it is described that the
次に、テストデータを転移モデルMによって推論し、転移モデルの推論によって得られたデータの目的変数の値と、入力データの目的変数にあたる項目の真値の平均二乗誤差を計算し、その誤差を転移モデル結果テーブル410に格納する(S502)。平均二乗誤差は、測定値と真値との差の二乗の相加平均をとることにより求められるもので、測定値のバラツキ具合を数量的に表すものであり、平均二乗誤差が小さいほど、その測定精度はよいと考えられる。すなわち、以下の(式1)で求められる量である。ここで、誤差が小さいほど、入力データに適したモデルであることを意味する。 Next, the test data is inferred by the transfer model M, the mean square error of the value of the objective variable of the data obtained by the inference of the transfer model and the true value of the item corresponding to the objective variable of the input data is calculated, and the error is calculated. It is stored in the transfer model result table 410 (S502). The average squared error is obtained by taking the arithmetic mean of the square of the difference between the measured value and the true value, and quantitatively expresses the degree of variation in the measured value. The smaller the average squared error, the more. The measurement accuracy is considered to be good. That is, it is an amount obtained by the following (Equation 1). Here, the smaller the error, the more suitable the model is for the input data.
次に、全ての転移モデルについて計算したかを判定し(S503)、全て計算したときには(S503:YES)、処理を終了し、全て計算していないときには(S503:NO)、Mをインクリメントし(M++)(S510)、S502に戻る。 Next, it is determined whether all the transition models have been calculated (S503), when all have been calculated (S503: YES), the processing is terminated, and when all have not been calculated (S503: NO), M is incremented (S503: NO). Return to M ++) (S510) and S502.
次に、図16を用いて最適モデル評価処理について説明する。
次に、モデル選択装置100の最適モデル選択部140は、転移モデル結果テーブル410の誤差が一番小さな転移モデルを最適モデルとして選択する(S600)。
ここで、予め定めておいたK個の最適モデルを選択してもよい。
Next, the optimum model evaluation process will be described with reference to FIG.
Next, the optimum
Here, K predetermined optimum models may be selected.
以上のように、本実施形態によれば、入力データの求めたい項目(住宅価格)の真値と、転移学習によるモデルから推論によって得られる目的変数(住宅価格)の値の誤差を評価することにより、入力データに最適なモデルを得ることができる。 As described above, according to the present embodiment, the error between the true value of the desired item (house price) of the input data and the value of the objective variable (house price) obtained by inference from the model by transfer learning is evaluated. Therefore, the optimum model for the input data can be obtained.
〔実施形態2〕
以下、図5ないし図18を用いて、本発明に係る実施形態2を説明する。
[Embodiment 2]
Hereinafter, the second embodiment according to the present invention will be described with reference to FIGS. 5 to 18.
実施形態1では、入力データの求めたい項目の真値と、転移学習によるモデルから推論によって得られる目的変数の値の誤差を評価することにより、入力データから推論するための最適なモデルを得た。 In the first embodiment, the optimum model for inferring from the input data was obtained by evaluating the error between the true value of the item to be obtained in the input data and the value of the objective variable obtained by inference from the model by transfer learning. ..
本実施形態は、入力データの求めたい項目の真値と、その入力データを既存モデルに入力して推論することによって得られる目的変数の値の誤差を評価することにより、入力データから推論するための最適なモデルを得ようとするものである。 In this embodiment, in order to infer from the input data by evaluating the error between the true value of the desired item of the input data and the value of the objective variable obtained by inputting the input data into the existing model and inferring. It is an attempt to obtain the optimum model of.
本実施形態では、実施形態1と比較して異なる所を中心に説明する。 In this embodiment, the points different from those in the first embodiment will be mainly described.
以下、図17を用いて本実施形態のモデル選択方法の考え方を具体例を用いて説明する。
本実施形態も、実施形態1と同様、図17に示されるように、函館の住宅データを入力データとして分析を行う住宅分析システムを例に採り、既存のモデルから転移学習に用いるのに最適な既存モデルを選択する例について説明する。
Hereinafter, the concept of the model selection method of the present embodiment will be described with reference to FIG. 17 by using a specific example.
Similar to the first embodiment, this embodiment is also most suitable for transfer learning from an existing model by taking a housing analysis system that analyzes the housing data of Hakodate as input data as an example, as shown in FIG. An example of selecting an existing model will be described.
先ず、東京、札幌、旭川などの他の都市の住宅データにより、既存のモデルが構築されているものとする。
このとき、転移学習に用いるモデルとして、この中でどのモデルを選択するのがよいのかというのが課題である。
First, it is assumed that an existing model is constructed from housing data of other cities such as Tokyo, Sapporo, and Asahikawa.
At this time, the issue is which model should be selected as the model used for transfer learning.
本実施形態は、函館住宅データから求めたい項目(住宅価格)の真値と、その入力データを既存モデルに入力して推論することによって得られる目的変数(住宅価格)との誤差を評価することにより、最適なモデルを選択しようとするものである。 In this embodiment, the error between the true value of the item (house price) to be obtained from the Hakodate house data and the objective variable (house price) obtained by inputting the input data into the existing model and inferring it is evaluated. This is an attempt to select the optimum model.
先ず、図18を用いて実施形態2のモデル選択装置で使用されるデータ構造について説明する。
モデル結果テーブル440は、既存のモデルの統計量と入力データの分布の統計量との差を格納するテーブルであり、図18に示されるように、転移モデルID440a、モデルファイルパス440b、誤差440cが格納される。
First, the data structure used in the model selection device of the second embodiment will be described with reference to FIG.
The model result table 440 is a table that stores the difference between the statistics of the existing model and the statistics of the distribution of the input data, and as shown in FIG. 18, the
転移モデルID440aには、モデルを一意に識別するIDが格納される。モデルファイルパス440bには、そのモデルのファイルシステムにおけるパスが格納される。誤差440cには、そのモデルから得られる目的変数の値と、入力データとの目的変数の項目にあたる真値との平均二乗誤差が格納される(詳細は後述)。
The
次に、図19ないし図21を用いてモデル選択装置の行う処理について説明する。 Next, the processing performed by the model selection device will be described with reference to FIGS. 19 to 21.
先ず、図19を用いてモデル選択装置が入力データの取り込みからモデルを選択するまでの一連の処理について説明する。
先ず、モデル選択装置100は、データ分析処理を行う(S11)このデータ分析処理は、後に、図20を用いて説明する。
次に、モデル選択装置100は、候補モデル検索処理を行う(S12)。候補モデル検索処理の詳細は、後に、図21を用いて説明する。
次に、モデル選択装置100は、最適モデル選択処理を行う(S06)。この最適モデル選択処理は、実施形態1の図16の処理と同様である。
First, a series of processes from the acquisition of input data to the selection of a model by the model selection device will be described with reference to FIG.
First, the
Next, the
Next, the
次に、図20を用いて実施形態2のデータ分析処理について説明する。
先ず、モデル選択装置100の候補モデル分析部110は、モデル管理部150を介して、入力データDB210から入力データ10を取得する(S100)
次に、取得した入力データ10を、テストデータと学習データに分離する(S104)。
この各々の処理は、実施形態1の図10に示したデータ分析処理の該当するステップと同様である。
Next, the data analysis process of the second embodiment will be described with reference to FIG.
First, the candidate
Next, the acquired
Each of these processes is the same as the corresponding step of the data analysis process shown in FIG. 10 of the first embodiment.
次に、図21を用いて実施形態2の候補モデル検索処理について説明する。
先ず、入力データDBから、図20のS104で分離した入力データ10のテストデータを取得する(S1000)、
次に、モデル管理部150を介して、モデル管理DB200からモデルNを取得する(S1001)。ここで、Nの初期値は、1であり、フローチャートの中では、モデル1、モデル2、…のように処理するように記述している。
Next, the candidate model search process of the second embodiment will be described with reference to FIG.
First, the test data of the
Next, the model N is acquired from the
次に、テストデータをモデルNによって推論して得られたデータの目的変数の値と、入力データの目的変数にあたる項目の真値の平均二乗誤差を計算し、その誤差をモデル結果テーブル440に格納する(S1002)。 Next, the mean square error of the value of the objective variable of the data obtained by inferring the test data by the model N and the true value of the item corresponding to the objective variable of the input data is calculated, and the error is stored in the model result table 440. (S1002).
そして、モデル管理DBで対象とするモデルの全てについて計算したか判定し(S1003)、全てのモデルについて計算したときには(S1003:YES)、処理を終了し、全てのモデルについて計算していないときには(S1003:NO)、Nをインクリメントし(N++)(S1010)、S1001に戻る。 Then, it is determined in the model management DB whether all the target models have been calculated (S1003), when all the models have been calculated (S1003: YES), the processing is finished, and when all the models have not been calculated (S1003). S1003: NO), N is incremented (N ++) (S1010), and the process returns to S1001.
最適モデル選択処理では、図18のモデル結果テーブルの誤差の値が最小のモデルを最適モデルとして選択する。 In the optimum model selection process, the model having the smallest error value in the model result table of FIG. 18 is selected as the optimum model.
以上のように、本実施形態によれば、入力データの求めたい項目(住宅価格)の真値と、その入力データのテストデータを入力して、既存モデルから推論によって得られる目的変数(住宅価格)の値の誤差を評価することにより、入力データに最適なモデルを得ることができる。 As described above, according to the present embodiment, the true value of the item (house price) to be obtained for the input data and the test data of the input data are input, and the objective variable (house price) obtained by inference from the existing model is input. By evaluating the error of the value of), the optimum model for the input data can be obtained.
〔実施形態3〕
以下、図22ないし図28を用いて、本発明に係る実施形態3を説明する。
[Embodiment 3]
Hereinafter, the third embodiment according to the present invention will be described with reference to FIGS. 22 to 28.
実施形態1では、入力データの求めたい項目の真値と、転移学習によるモデルから推論によって得られる目的変数の値の誤差を評価することにより、入力データから推論するための最適なモデルを得た。 In the first embodiment, the optimum model for inferring from the input data was obtained by evaluating the error between the true value of the item to be obtained in the input data and the value of the objective variable obtained by inference from the model by transfer learning. ..
本実施形態は、入力データから得られる新モデルのFI(Feature Importance)と、既にあるモデルのFIを比較することにより、最適なモデルを得ようとするものである。FIとは、ツリー系の学習モデルにおける各説明変数の目的変数の寄与度を表す指標である。 This embodiment attempts to obtain an optimum model by comparing the FI (Feature Importance) of a new model obtained from input data with the FI of an existing model. FI is an index showing the contribution of the objective variable of each explanatory variable in the learning model of the tree system.
本実施形態では、実施形態1と比較して異なる所を中心に説明する。 In this embodiment, the points different from those in the first embodiment will be mainly described.
先ず、図22ないし図24を用いて実施形態のモデル選択装置で使用されるデータ構造について説明する。 First, the data structure used in the model selection device of the embodiment will be described with reference to FIGS. 22 to 24.
モデルFI管理テーブル450は、各モデルのFIの情報を上位から下位にわたって保持するテーブルであり、図22に示されるように、モデルID450a、モデルファイルパス450b、FI1位項目名450c1、FI1位項目名の値450c2、FI2位項目名450d1、FI2位項目名の値450d2、…の各フィールドを有する。
The model FI management table 450 is a table that holds the FI information of each model from the upper level to the lower level, and as shown in FIG. 22, the
モデルID450aには、モデルを一意に識別するIDが格納される。モデルファイルパス450bには、そのモデルのファイルシステムにおけるパスが格納される。それ以降のフィールドは、FIの項目名とその項目名の値をペアとして、FIが大きい順から格納される。図22の例では、第一レコードの値として、FI1位の項目名として、「築年数」、その値として、4.5、FI2位の項目名として、「最寄駅徒歩」、その値として、2.5が格納されている。
The
新モデルFI結果テーブル460は、入力データの学習データから新たに生成した新モデルのFIを計算した結果を格納するテーブルであり、図23に示されるように、FI1位項目名460a1、FI1位項目名の値460a2、FI2位項目名460b1、FI2位項目名の値460b2、…の各フィールドを有する。 The new model FI result table 460 is a table that stores the result of calculating the FI of the new model newly generated from the training data of the input data, and as shown in FIG. 23, the FI 1st place item name 460a1 and the FI 1st place item. It has the fields of the name value 460a2, the FI second place item name 460b1, the FI second place item name value 460b2, and so on.
FI1位項目名460a1、FI1位項目名の値460a2には、入力データの学習データから新たに生成した新モデルのFIで、その値が一番大きなFIの項目名と、値が格納される。そして、同様に、それ以降のフィールドは、FIの項目名とその項目名の値をペアとして、FIが大きい順から格納される。 The FI 1st place item name 460a1 and the FI 1st place item name value 460a2 store the item name and the value of the FI having the largest value in the FI of the new model newly generated from the learning data of the input data. Similarly, the subsequent fields are stored in descending order of FI, with the item name of FI and the value of the item name as a pair.
モデルFI比較テーブル470は、新モデルと既存のモデルのFIを選択したときの結果を格納するテーブルであり、図24に示されるように、モデルID470a、候補選択フラグ470bの各フィールドを有する。
The model FI comparison table 470 is a table that stores the results when the FIs of the new model and the existing model are selected, and has the fields of the
モデルID470aには、モデルを一意に識別するIDが格納される。候補選択フラグ470bには、新モデルと比較したときの結果を示すフラグ(詳細は後述)が格納される。なお、候補選択フラグ470bの初期値は、0(選択されていない)とする。
The
次に、図25ないし図28を用いて実施形態3のモデル選択装置が行う処理について説明する。 Next, the processing performed by the model selection device of the third embodiment will be described with reference to FIGS. 25 to 28.
先ず、図25を用いてモデル選択装置が入力データの取り込みからモデルを選択するまでの一連の処理について説明する。
先ず、モデル選択装置100は、データ分析処理を行う(S01)。このデータ分析処理は、実施形態1の図9の処理と同様である。
First, a series of processes from the acquisition of input data to the selection of a model by the model selection device will be described with reference to FIG. 25.
First, the
次に、モデル選択装置100は、候補モデル検索処理を行う(S22)。候補モデル検索処理の詳細は、後に、図26を用いて説明する。
Next, the
次に、モデル選択装置100は、候補モデル選択処理を行う(S23)。候補モデル選択処理の詳細は、後に、図27を用いて説明する。
Next, the
次に、モデル選択装置100は、転移学習処理を行う(S04)。転移学習処理は、実施形態1の図9の処理と同様である。
Next, the
次に、モデル選択装置100は、転移モデル評価処理を行う(S05)。転移モデル評価処理は、実施形態1の図9の処理と同様である。
Next, the
次に、モデル選択装置100は、最適モデル選択処理を行う(S06)。最適モデル選択処理は、実施形態1の図9の処理と同様である。
Next, the
次に、図26を用いて実施形態3の候補モデル検索処理について説明する。
先ず、入力データDBから、図10のS206で分離した入力データ10の学習データを取得する(S1200)。
次に、その学習データを用いて新モデルを作成し、FIを計算する(S1201)。
Next, the candidate model search process of the third embodiment will be described with reference to FIG. 26.
First, the learning data of the
Next, a new model is created using the training data, and the FI is calculated (S1201).
次に、モデル管理部150を介して、モデル管理DB200のモデルFI管理テーブル450からモデルNのモデルID、FIを取得する(S1202)。ここで、Nの初期値は、1であり、フローチャートの中では、モデル1、モデル2、…のように処理するように記述している。
Next, the model ID and FI of the model N are acquired from the model FI management table 450 of the
次に、S2001で作成された新モデルのFIと、モデルNのFIの項目名が所定個数(例えば、上位10個)同じか否かを判定し(S1203)、同じときには(S1203:YES)、モデルFI結果比較テーブル470の候補選択フラグ470bに1をセットし(S1210)、違うときには(S1203:NO)、S1204に行く。
Next, it is determined whether or not the FI of the new model created in S2001 and the item name of the FI of the model N are the same by a predetermined number (for example, the top 10) (S1203), and when they are the same (S1203: YES).
そして、モデル管理DBで対象とするモデルの全てについて処理したか判定し(S1204)、全てのモデルについて処理したときには(S1204:YES)、処理を終了し、全てのモデルについて処理していないときには(S1204:NO)、Nをインクリメントし(N++)(S1210)、S1202に戻る。 Then, it is determined whether or not all the target models have been processed in the model management DB (S1204), and when all the models have been processed (S1204: YES), the processing is terminated and all the models have not been processed (S1204). S1204: NO), N is incremented (N ++) (S1210), and the process returns to S1202.
次に、図27および図28を用い実施形態3の候補モデル選択処理について説明する。 Next, the candidate model selection process of the third embodiment will be described with reference to FIGS. 27 and 28.
先ず、図26のS1201の新モデルのFIの検索結果と、S1203の比較処理により、モデルFI比較テーブル470の候補選択フラグが1のモデルIDのFIを、転移候補選択画面340に表示する(S1300)。 First, by comparing the FI of the new model of S1201 in FIG. 26 and the comparison process of S1203, the FI of the model ID whose candidate selection flag of the model FI comparison table 470 is 1 is displayed on the transfer candidate selection screen 340 (S1300). ).
転移候補選択画面340は、図28に示されるように、転移モデルの候補を選択する画面である。転移候補選択画面340は、新モデルFI表示欄350と、既存モデル表示欄360からなる。
As shown in FIG. 28, the transfer
既存モデル表示欄360は、選択チェックボックス361と、モデルID表示欄362、FI表示欄363からなり、ユーザは、各々のモデルのFIを確認し、選択チェックボックス361により、転移モデルの候補をマウスなどポィンティングデバイスにより指示して選択することができる。
次に、ユーザは、転移モデルの候補を選択する(S1301)。
The existing
Next, the user selects a candidate for the transfer model (S1301).
以上のように、本実施形態では、FIという項目のモデル寄与度を表す指標を明示して、ユーザに選択することによって、より最適な転移学習のモデル候補を選択することができる。 As described above, in the present embodiment, a more optimal model candidate for transfer learning can be selected by clearly indicating an index representing the model contribution of the item FI and selecting it for the user.
なお、本実施形態では、モデルの項目に関するFIを計算して、ユーザに提示したが、同様に、項目の寄与度を表す指標として、SHAPのサマリプロットを用いて、ユーザに提示するようにしてもよい。ここで、SHAPのサマリプロットとは、モデル構築ための説明変数が目的変数へ影響を与える寄与度を視覚的に表示したものである。 In the present embodiment, the FI related to the item of the model is calculated and presented to the user. Similarly, as an index showing the contribution of the item, the SHAP summary plot is used and presented to the user. May be good. Here, the SHAP summary plot is a visual representation of the contribution of the explanatory variables for model construction to the objective variable.
10…入力データ
110…候補モデル分析部
120…転移学習部
130…モデル評価部
140…最適モデル選択部
150…モデル管理部
160…記憶部
200……モデル管理DB
210…入力データDB
220…計算結果出DB
10 ...
210 ... Input data DB
220 ... Calculation result output DB
Claims (8)
入力データは目的変数と説明変数とを含んでおり、
情報処理装置が、既存の学習モデルと入力データとを使って転移学習によってモデルを生成するステップと、
前記入力データを前記転移学習によるモデルに入力した推論結果と、前記入力データに含まれる目的変数である真値との誤差を算出するステップと、
前記誤差が小さい学習モデルを選択するステップとを有することを特徴とする学習モデル選択方法。 An information processing device is a learning model selection method that selects a learning model suitable for transfer learning from existing learning models when generating a learning model for input data by transfer learning.
The input data includes the objective variable and the explanatory variables.
A step in which an information processing device generates a model by transfer learning using an existing learning model and input data.
A step of calculating an error between the inference result in which the input data is input to the model by the transfer learning and the true value which is the objective variable included in the input data.
A learning model selection method comprising: a step of selecting a learning model having a small error.
前記入力データの指定された項目の値に関する統計量を算出するステップと、
前記既存のモデルの該当する項目の値に関する統計量との差分を算出するステップと、
前記差分が小さい学習モデルを、転移学習に用いる学習モデルの候補として選択するステップとを有することを特徴とする、請求項1記載の学習モデル選択方法。 An information processing device is a learning model selection method that selects a learning model suitable for transfer learning from existing learning models when generating a learning model for input data by transfer learning.
The step of calculating the statistic about the value of the specified item of the input data, and
The step of calculating the difference from the statistic regarding the value of the corresponding item of the existing model, and
The learning model selection method according to claim 1, further comprising a step of selecting a learning model having a small difference as a candidate for a learning model used for transfer learning.
前記入力データを既存の学習モデルに入力した推論結果と、前記入力データに含まれる目的変数である真値との誤差を算出するステップと、
前記誤差が小さい学習モデルを、転移学習に用いる学習モデルの候補として選択するステップとを有することを特徴とする、請求項1記載の学習モデル選択方法。 An information processing device is a learning model selection method that selects a learning model suitable for transfer learning from existing learning models when generating a learning model for input data by transfer learning.
A step of calculating an error between an inference result in which the input data is input to an existing learning model and a true value which is an objective variable included in the input data.
The learning model selection method according to claim 1, further comprising a step of selecting a learning model having a small error as a candidate for a learning model used for transfer learning.
入力データから新学習モデルを生成し、前記新学習モデルの推論結果に対して前記入力データの各項目が及ぼす寄与度を算出するステップと、
前記既存モデルを生成する際に用いた入力データの各項目の寄与度とを比較し、前記新モデルのデータの各項目の寄与度が大きい上位の項目と、既存のモデルのデータの各項目の寄与度が大きい上位の項目が、所定数一致する既存のモデルを、転移学習に用いる学習モデルの候補として選択するステップとを有することを特徴とする、請求項1記載の学習モデル選択方法。 An information processing device is a learning model selection method that selects a learning model suitable for transfer learning from existing learning models when generating a learning model for input data by transfer learning.
A step of generating a new learning model from the input data and calculating the contribution of each item of the input data to the inference result of the new learning model.
Comparing the contribution of each item of the input data used when generating the existing model, the upper item with the large contribution of each item of the data of the new model and each item of the data of the existing model The learning model selection method according to claim 1, wherein a higher-ranking item having a large contribution includes a step of selecting an existing model that matches a predetermined number as a candidate for a learning model used for transfer learning.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020088266A JP2021182329A (en) | 2020-05-20 | 2020-05-20 | Learning model selection method |
PCT/JP2021/016553 WO2021235177A1 (en) | 2020-05-20 | 2021-04-23 | Learning model selection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020088266A JP2021182329A (en) | 2020-05-20 | 2020-05-20 | Learning model selection method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021182329A true JP2021182329A (en) | 2021-11-25 |
Family
ID=78606624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020088266A Pending JP2021182329A (en) | 2020-05-20 | 2020-05-20 | Learning model selection method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2021182329A (en) |
WO (1) | WO2021235177A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023223535A1 (en) * | 2022-05-20 | 2023-11-23 | 株式会社日立ハイテク | Search device, search method, and semiconductor equipment manufacturing system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6804934B2 (en) * | 2016-10-26 | 2020-12-23 | 株式会社東芝 | Energy consumption prediction device and energy consumption prediction method |
-
2020
- 2020-05-20 JP JP2020088266A patent/JP2021182329A/en active Pending
-
2021
- 2021-04-23 WO PCT/JP2021/016553 patent/WO2021235177A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023223535A1 (en) * | 2022-05-20 | 2023-11-23 | 株式会社日立ハイテク | Search device, search method, and semiconductor equipment manufacturing system |
Also Published As
Publication number | Publication date |
---|---|
WO2021235177A1 (en) | 2021-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6536295B2 (en) | Prediction performance curve estimation program, prediction performance curve estimation device and prediction performance curve estimation method | |
US7801836B2 (en) | Automated predictive data mining model selection using a genetic algorithm | |
CN110569322A (en) | Address information analysis method, device and system and data acquisition method | |
CN113434623B (en) | Fusion method based on multi-source heterogeneous space planning data | |
CN110674636B (en) | Power consumption behavior analysis method | |
WO2021235177A1 (en) | Learning model selection method | |
KR101625124B1 (en) | The Technology Valuation Model Using Quantitative Patent Analysis | |
CN114036452B (en) | Yield evaluation method applied to discrete production line | |
Wang et al. | Decision support model based on case-based reasoning approach for estimating the restoration budget of historical buildings | |
Massaro | Implementation of a decision support system and business Intelligence algorithms for the automated management of insurance agents activities | |
Dodangeh et al. | Best project selection by using of Group TOPSIS method | |
Goerigk et al. | A framework for inherently interpretable optimization models | |
CN116341059A (en) | Tunnel intelligent design method based on similarity | |
CN116089595A (en) | Data processing pushing method, device and medium based on scientific and technological achievements | |
US20060005121A1 (en) | Discretization of dimension attributes using data mining techniques | |
Yousif et al. | Shape clustering using k-medoids in architectural form finding | |
Zaabar et al. | A two-phase part family formation model to optimize resource planning: a case study in the electronics industry | |
Wang et al. | An integrated and interactive 3D space planning framework considering collective multi-criteria optimization based on multi-agent constraints solving | |
CN117216081B (en) | Automatic question bank updating method and device, electronic equipment and storage medium | |
Herla et al. | How many snow profiles can you process? Making the wealth of information included in large-scale snowpack simulations more accessible for operational avalanche forecasting | |
CN117787569B (en) | Intelligent auxiliary bid evaluation method and system | |
CN113064962B (en) | Environment complaint reporting event similarity analysis method | |
US20210319259A1 (en) | Method and apparatus for extracting a pattern of time series data | |
das Neves Martins | Exploration and evaluation of design quality through floor plan layout (FPLs) of an existing design space using the ARLE GPS tool. Case study | |
CN117539520A (en) | Firmware self-adaptive upgrading method, system and equipment |