JPWO2020085114A1 - 情報処理装置、情報処理方法、および、プログラム - Google Patents
情報処理装置、情報処理方法、および、プログラム Download PDFInfo
- Publication number
- JPWO2020085114A1 JPWO2020085114A1 JP2020553140A JP2020553140A JPWO2020085114A1 JP WO2020085114 A1 JPWO2020085114 A1 JP WO2020085114A1 JP 2020553140 A JP2020553140 A JP 2020553140A JP 2020553140 A JP2020553140 A JP 2020553140A JP WO2020085114 A1 JPWO2020085114 A1 JP WO2020085114A1
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- model
- entry
- information processing
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 55
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 230000013016 learning Effects 0.000 claims abstract description 156
- 238000000034 method Methods 0.000 claims abstract description 111
- 238000010801 machine learning Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 abstract description 15
- 238000007726 management method Methods 0.000 description 96
- 238000011156 evaluation Methods 0.000 description 56
- 238000012549 training Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 13
- 239000007787 solid Substances 0.000 description 10
- 238000003825 pressing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012854 evaluation process Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
本技術は、学習の履歴を簡単に比較検討することができるようにする情報処理装置、情報処理方法、および、プログラムに関する。情報処理装置は、機械学習による学習済みモデルである複数の予測モデルと、予測モデルに関するモデル情報を表示する制御を行う制御部を備える。本技術は、例えば、機械学習による学習と予測を行う情報処理装置等に適用できる。
Description
本技術は、情報処理装置、情報処理方法、および、プログラムに関し、特に、学習の履歴を簡単に比較検討することができるようにした情報処理装置、情報処理方法、および、プログラムに関する。
近年、機械学習が様々な分野に広く適用されてきている。例えば、不動産物件の取引(売買)の成約確率を機械学習で予測する技術などが提案されている(例えば、特許文献1参照)。
機械学習において、精度の高い予測モデルを構築するためには、学習データとして用いる項目や、予測モデル、モデルパラメータなどを調整し、学習と、学習により得られた予測モデルの評価とを複数回繰り返し行う必要がある。そのため、予測モデルを効率的に構築するためには、それまでの学習の履歴を簡単に比較検討できるツールが望まれる。
本技術は、このような状況に鑑みてなされたものであり、学習の履歴を簡単に比較検討することができるようにするものである。
本技術の一側面の情報処理装置は、機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部を備える。
本技術の一側面の情報処理方法は、情報処理装置が、機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う。
本技術の一側面のプログラムは、コンピュータを、機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部として機能させるためのものである。
本技術の一側面においては、機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御が行われる。
なお、本技術の一側面の情報処理装置は、コンピュータにプログラムを実行させることにより実現することができる。このプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
情報処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.予測システムのブロック図
2.履歴管理画面の構成例
3.新規モデル作成処理
4.エントリソート処理
5.ツリー表示処理
6.有意差の有無表示処理
7.エントリ差分表示の例
8.サジェスト機能の表示例
9.コンピュータ構成例
1.予測システムのブロック図
2.履歴管理画面の構成例
3.新規モデル作成処理
4.エントリソート処理
5.ツリー表示処理
6.有意差の有無表示処理
7.エントリ差分表示の例
8.サジェスト機能の表示例
9.コンピュータ構成例
<1.予測システムのブロック図>
図1は、本技術を適用した予測システムの構成例を示すブロック図である。
図1は、本技術を適用した予測システムの構成例を示すブロック図である。
図1の予測システム1は、予測アプリ11、操作部12、ストレージ13、および、ディスプレイ14を含み、機械学習による学習を行い、その結果得られた学習済みモデルを予測モデルとして用いて、所定の予測対象項目を予測するシステムである。
予測システム1は、パーソナルコンピュータ、サーバ装置、スマートフォン等の一台の情報処理装置で構成されてもよいし、サーバクライアントシステムのように、インターネット、LAN(Local Area Network)等のネットワークを介して接続された複数の情報処理装置で構成されてもよい。
予測アプリ11は、アプリケーションプログラムで構成され、例えば、パーソナルコンピュータ等のCPU(Central Processing Unit)により実行されることにより、学習部21、予測部22、および学習履歴管理部23を有する。学習部21、予測部22、および学習履歴管理部23のそれぞれは、操作部12から供給されるユーザの指示操作に基づいて所定の処理を実行する操作制御部としての機能と、学習結果や予測結果等の所定の情報をディスプレイ14に表示させる表示制御部としての機能を備える。
操作部12は、例えば、キーボード、マウス、スイッチ、タッチパネル等で構成され、ユーザの指示操作を受け付け、予測アプリ11に供給する。
ストレージ13は、例えば、ハードディスク、半導体メモリ等の記録媒体を有するデータ記憶部であり、学習および予測に必要なデータセットやアプリケーションプログラムなどを記憶する。ストレージ13は、データセットとして、学習のための学習用データセット、学習により得られた予測モデルを評価するための評価用データセット、および、学習により得られた予測モデルを用いて予測を行うための予測用データセットを記憶する。
図2は、学習用データセットの一例を示している。
図2は、個人に融資を行う際の与信審査のため、個人の経歴や資産から債務不履行となる確率を予測する予測モデルの学習に用いられる学習用データセットの一部を示している。
図2の学習用データセットは、データ項目(特徴量)として、ID、年齢、職種、最終学歴、教育年数、結婚歴、職業、家族構成、人種、性別、キャピタルゲイン、キャピタルロス、週間労働時間、出身国、および、Label(ラベル)を有している。学習用データセットの最後の項目であるLabel(ラベル)は、予測対象項目の既知の答えであり、yesは、その個人が融資を完済したことを表し、noは、その個人が債務不履行であったことを表す。
図1に戻り、ディスプレイ14は、例えば、LCD(Liquid Crystal Display)または有機EL(Electro-Luminescence)ディスプレイなどの表示デバイスであり、予測アプリ11から供給された画像を表示させる。例えば、ディスプレイ14は、学習時のパラメータ設定画面や予測結果などを表示する。
予測アプリ11の学習部21は、ストレージ13に記憶されている学習用データセットを用いて、所定の学習モデルによる学習処理(機械学習)を実行する。学習処理によって得られた学習済みモデルが、予測部22において、所定の予測対象項目を予測する予測モデルとして使用される。学習部21は、例えば、学習モデル(予測モデル)として、ロジスティック回帰、ニューラルネット、ランダムフォレストを有し、ユーザの指示操作に応じて所定の学習モデルを選択して学習処理を行う。また、学習部21は、予測対象項目の答えが既知である評価用データセットを用いて、学習処理によって得られた学習モデルの精度(予測精度)を評価する評価処理も行う。
予測部22は、学習部21による学習処理によって得られた学習済みモデルである予測モデルを用いて予測処理を実行し、所定の予測対象項目を予測する。予測処理には、ストレージ13に記憶されている予測用データセットが用いられる。
学習履歴管理部23は、学習部21によって実行された複数回の学習処理の履歴を管理する。すなわち、機械学習では、学習処理と、学習処理により得られた学習モデルの評価とを複数回繰り返し実行することにより、精度の高い学習モデルが構築される。例えば、複数の学習処理を行う際に、学習データとして用いるデータ項目や、学習モデル、正則化項の係数などの学習パラメータ、予測対象項目などが、適宜変更され、予測精度の向上が見られるか否かが検証される。また、学習用データセットを更新(拡充)し、再度、学習モデルを再計算する場合もある。学習履歴管理部23は、学習部21によって実行された複数回の学習処理の詳細、例えば、各学習処理におけるデータセットや学習モデルの違い、精度評価指標の値などをユーザに分かり易く提示する。なお、本実施の形態において、学習処理または学習といった場合にも、その後に実行される精度評価も含むものとする。また、学習履歴管理部23は、過去の学習処理で生成された複数の学習モデルどうしの比較や、過去に実行された複数の学習処理に基づいて、より望ましいと推測される学習モデルの提案なども行う。
予測アプリ11は、学習履歴管理部23が実行する学習履歴の管理機能に大きな特徴を有している。そこで、以下では、学習部21による学習処理および予測部22による予測処理の詳細は省略し、学習履歴管理部23の機能について詳しく説明する。学習部21による学習処理および予測部22による予測処理は、一般的な手法によって、適切に実行されているものとする。
<2.履歴管理画面の構成例>
図3は、学習履歴管理部23によってディスプレイ14に表示される履歴管理画面の構成例を示している。
図3は、学習履歴管理部23によってディスプレイ14に表示される履歴管理画面の構成例を示している。
学習履歴管理部23は、予測アプリ11において学習履歴の管理機能が実行された場合、学習処理によって得られた学習済みモデルである複数の予測モデルと、その予測モデルに関するモデル情報を表示する図3の履歴管理画面41を生成し、ディスプレイ14に表示させる。
図3の履歴管理画面41は、大きくは3つの領域に分類されており、具体的には、プロジェクト表示領域51、エントリ表示領域52、および、サマリ表示領域53に分けられる。
プロジェクト表示領域51は、履歴管理画面41の上部に表示されている。そして、プロジェクト表示領域51の下側の領域を左右に二分し、左側にエントリ表示領域52が配置され、右側にサマリ表示領域53が配置されている。
学習履歴管理部23は、学習の履歴をプロジェクト単位に管理する。プロジェクト表示領域51は、履歴管理画面41が表示している現在のプロジェクトを表示する。図3の例では、プロジェクト表示領域51には“ProjectA”が表示されており、プロジェクト表示領域51は、“ProjectA”という名称のプロジェクトを表示していることを示している。以下では、“ProjectA”は、図2に示したようなデータ例のデータセットを用いて、債務不履行となる確率を予測する予測モデルを学習及び予測するプロジェクトであるとする。
エントリ表示領域52には、新規モデル作成ボタン61、ソートボタン62、ツリー表示ボタン63、および、サジェストボタン64の各ボタンと、表示されている現在のプロジェクト(図3の例では、“ProjectA”)で過去に実行された学習の履歴(リスト)を表示する履歴表示領域65とが配置されている。
履歴表示領域65には、1回の学習に対して1つのエントリ66が生成され、表示される。図3の履歴表示領域65には、時系列に3つのエントリ66−1乃至66−3が表示されており、現在までに、3回の学習が実行されていることを示している。
履歴表示領域65における複数のエントリ66の配列方法は、例えば、エントリ66が生成された順とすることができる。この場合、最も新しいエントリ66が、履歴表示領域65内の最上位に表示される。図3の例では、履歴表示領域65の3つのエントリ66−1乃至66−3のうち、エントリ66−3が最も新しく、エントリ66−1が最も古い。
あるいはまた、履歴表示領域65における複数のエントリ66の配列方法は、例えば、予測精度の評価値の高い順とすることができる。この場合、予測精度の評価値が最も高いエントリ66が、履歴表示領域65内の最上位に表示される。図3の例では、履歴表示領域65の3つのエントリ66−1乃至66−3のうち、エントリ66−3の評価値が最も高く、エントリ66−1の評価値が最も低い。
履歴表示領域65における複数のエントリ66の配列方法は、プルダウンリスト等を用いて、時系列順や、評価値の高い順など、複数のなかからユーザの指定に基づいて適宜変更できるようにしてもよい。
履歴表示領域65内に表示される各エントリ66は、アイコン71、モデル名表示部72、精度表示部73、および、コメント表示部74を含む。アイコン71は、そのエントリ66で学習された予測モデルの予測値タイプを表す。アイコン71として表示されるマークは、後述する図5の新規モデルの詳細設定画面121の予測値タイプ設定部132に示されている3種類のマークに対応する。
モデル名表示部72には、そのエントリ66の予測モデルの名前が表示される。モデル名表示部72に表示される名前は、図4の新規モデル作成画面101において、ユーザ入力によって決定される。精度表示部73には、そのエントリ66の予測モデルの予測精度の評価結果が表示される。予測精度の評価結果は、例えば、AUC(Area Under the Curve)である。コメント表示部74には、そのエントリ66の予測モデルに対するコメントが表示される。コメントは、図4の新規モデル作成画面101において、ユーザが入力した場合に表示される。
履歴表示領域65内に表示されている複数のエントリ66のうち、マウス等によってユーザが選択したエントリ66(以下、選択エントリと称する。)が、色等で区別して表示される。そして、選択エントリに関する詳細な情報が、右側のサマリ表示領域53に表示される。図3の例では、3つのエントリ66−1乃至66−3のうち、真ん中のエントリ66−2が灰色で表示され、選択された状態を示している。選択エントリを表す表現方法は、図3のような灰色表示に限らず、任意の表示方法を採用することができる。
新規モデル作成ボタン61は、新規の予測モデルを作成する際に押下されるボタンである。新規モデル作成ボタン61が押下されると、図4の新規モデル作成画面101が表示される。新規モデル作成ボタン61が押下された場合の処理については後述する。
ソートボタン62は、履歴表示領域65内に表示される複数のエントリ66を、時系列順の表示から、予測精度の順でソートして表示する際に押下されるボタンである。ソートボタン62が押下されると、図6を参照して後述するエントリソート処理が実行される。
ツリー表示ボタン63は、履歴表示領域65内の表示を、図3に示される、アイコン71、モデル名表示部72、精度表示部73、および、コメント表示部74を含む表示から、ツリー表示に変更する際に押下されるボタンである。ツリー表示ボタン63が押下されると、履歴表示領域65の表示が、図9を参照して後述するツリー表示に切り替えられる。
サジェストボタン64は、サジェスト表示処理を実行する際に押下されるボタンである。サジェスト表示処理とは、過去に実行された複数の学習に基づいて、より望ましいと推測される予測モデルを、学習履歴管理部23がユーザに提案する処理である。サジェスト表示処理を実行する際には、履歴表示領域65に表示されている複数のエントリ66のなかから、いずれか1つをマウスで選択した後、サジェストボタン64が押下される。あるいはまた、複数のエントリ66のなかから、いずれか1つをマウスで選択し、マウスの右クリックで表示されるメニューから「サジェスト」を選択することによっても実行することができる。サジェスト表示処理の詳細については、図14等を参照して後述する。
履歴管理画面41の右側のサマリ表示領域53には、コピー新規作成ボタン81、基本情報表示領域82、使用項目表示領域83、および、精度評価値表示領域84が含まれる。基本情報表示領域82、使用項目表示領域83、および、精度評価値表示領域84に表示される各項目は、予測モデルのモデル情報を特定する詳細項目である。
コピー新規作成ボタン81は、エントリ表示領域52で現在選択されているエントリ66である選択エントリ(モデル名「model2 20180701」)をベースにして新たな予測モデルの学習設定を行う際に押下されるボタンである。コピー新規作成ボタン81の機能を利用することにより、選択エントリの学習設定を引き継いで、簡単に学習を行わせることができる。
基本情報表示領域82には、選択エントリの基本情報が表示される。具体的には、予測値タイプ、予測ターゲット、学習データ、および、学習時間が表示される。予測値タイプには、学習設定で設定された予測値の種類が表示される。予測値タイプとしては、二値分類、多値分類、または、数値予測のいずれかを取り得る。予測ターゲットには、学習設定で設定された予測対象項目が表示される。学習データには、学習に使用されたデータセットのファイル名が表示される。学習時間には、学習処理にかかった時間が表示される。
使用項目表示領域83には、選択エントリの予測モデルの学習データ(学習用データセット)に含まれているデータ項目と、その中で学習に使用されたデータ項目が表示される。使用項目表示領域83に表示されたデータ項目が、学習データに含まれているデータ項目を表し、実線の枠で囲まれたデータ項目が学習に使用されたデータ項目、破線の枠で囲まれたデータ項目が学習に使用されなかったデータ項目を表す。なお、データ項目の使用または非使用を表す表現方法は、これに限らず、例えば、色の違い等で表してもよい。
精度評価値表示領域84には、選択エントリの予測モデルの予測精度の評価結果(評価値)が表示される。予測精度の評価指標としては、Precision(適合率)、Recall(再現率)、F-measure(F値)、Accuracy(全体正解率)、および、AUC(ROC曲線下面積)などが表示される。
図3の履歴管理画面41では、学習済みの複数の予測モデルがエントリ表示領域52に表示され、そこで選択された所定の予測モデル(エントリ66)のモデル情報がサマリ表示領域53に表示される。これにより、ユーザは、学習の履歴を簡単に比較検討することができる。
<3.新規モデル作成処理>
次に、図3の履歴管理画面41において新規モデル作成ボタン61が押下された場合に実行される新規モデル作成処理について説明する。
次に、図3の履歴管理画面41において新規モデル作成ボタン61が押下された場合に実行される新規モデル作成処理について説明する。
図4は、新規モデル作成ボタン61が押下された場合に表示される新規モデル作成画面の例を示している。
図4の新規モデル作成画面101は、新規に作成する予測モデル(学習モデル)のモデル名および説明用コメントの入力と、学習データの指定を行うことができる。テキストボックス111には、新規に作成する予測モデルのモデル名が入力される。テキストボックス111に入力された名称が、履歴管理画面41のモデル名表示部72に表示される。テキストボックス112には、新規に作成する予測モデルについての説明文が入力される。テキストボックス112に入力された説明文が、履歴管理画面41のコメント表示部74に表示される。ファイル設定部113には、学習データとして使用するファイルのファイル名が入力される。ファイルの入力には、ファイルを参照するダイアログを表示して、そのダイアログから、学習データとして使用するファイルを指定することができる。
決定ボタン114の押下により、図5に示される新規モデルの詳細設定画面121が表示される。キャンセルボタン115の押下により、新規モデル作成処理がキャンセル(中止)される。
図5は、図4の新規モデル作成画面101において決定ボタン114が押下された場合に表示される新規モデルの詳細設定画面の例を示している。
図5の新規モデルの詳細設定画面121は、予測ターゲット設定部131、予測値タイプ設定部132、モデルタイプ設定部133、学習データ設定部134、データ項目設定部135、学習評価実行ボタン136、および、キャンセルボタン137を含む。
予測ターゲット設定部131では、ユーザは、プルダウンリストを用いて、予測ターゲットを設定することができる。予測ターゲットとは、学習データに含まれるデータ項目のうち、予測対象とするデータ項目を表す。プルダウンリストには、図4の新規モデル作成画面101のファイル設定部113で指定した学習データに含まれるデータ項目が表示される。図5のプルダウンリストでは、図2に示した学習用データセットの例のうち、Labelが予測対象項目として選択されている。
予測値タイプ設定部132では、予測対象項目の予測値の種類として、二値分類、多値分類、または、数値予測のいずれかを設定することができる。3種類のマークは、図3の履歴管理画面41のエントリ表示領域52に表示される各エントリ66のアイコン71と対応する。ユーザは、二値分類、多値分類、または、数値予測のいずれかのマークを選択することで、予測値タイプを設定する。
モデルタイプ設定部133では、学習に用いる予測モデル(学習モデル)のモデルタイプをラジオボタンにより選択することができる。予測モデルのモデルタイプとしては、ロジスティック回帰、ニューラルネット、ランダムフォレストのいずれかを選択することができる。また、過学習を防止するための正規化項の係数も設定することができる。
学習データ設定部134には、図4の新規モデル作成画面101のファイル設定部113において学習データとして指定されたファイルが表示される。変更ボタン138を押下することによりファイル参照ダイアログが表示され、必要に応じて、ファイルを変更することも可能である。予測モデルの学習が終了した後に実行される予測精度の評価処理には、例えば、学習データの一部が、評価用データ(評価用データセット)として分割されて、利用される。
データ項目設定部135には、学習データとして指定された学習用データセットに含まれる全てのデータ項目が表示される。ユーザは、表示された全てのデータ項目のなかから、学習データに使用するデータ項目のチェックボックスをオンすることにより、学習データに使用するデータ項目を指定する。なお、予測ターゲット設定部131で予測対象項目として選択されたデータ項目は指定できないように構成されている。
学習評価実行ボタン136は、学習処理および精度評価処理を開始する際に押下される。キャンセルボタン137は、新規モデル作成処理をキャンセル(中止)する際に押下される。
図3の履歴管理画面41において新規モデル作成ボタン61が押下された場合、図4の新規モデル作成画面101と図5の新規モデルの詳細設定画面121とにより必要な設定項目が順次決定され、学習評価実行ボタン136の押下により、学習処理および予測精度評価処理が実行される。
<4.エントリソート処理>
次に、図3の履歴管理画面41においてソートボタン62が押下された場合に実行されるエントリソート処理について、図6および図7を参照して説明する。
次に、図3の履歴管理画面41においてソートボタン62が押下された場合に実行されるエントリソート処理について、図6および図7を参照して説明する。
図3の履歴管理画面41においてソートボタン62が押下された場合、学習履歴管理部23は、図6のフローチャートに示されるエントリソート処理を実行し、履歴表示領域65の複数のエントリ66の表示を変更する。
図6のエントリソート処理では、初めに、ステップS11において、学習履歴管理部23は、現在のプロジェクト“ProjectA”に含まれる全てのエントリに対して、予測値タイプと予測ターゲットが同じエントリでグループを作成する。したがって、グループの作成において学習データの違いは無視される。
ステップS12において、学習履歴管理部23は、作成された1以上のグループのうち、所定の2つのグループを選択してグループのペアを形成し、形成したペアのグループどうしの比較が可能か否かの判定を行う比較可能判定処理を実行する。また、学習履歴管理部23は、グループのペアの全ての組合せについて、比較が可能か否かの判定を行う比較可能判定処理を実行する。
ここで、ステップS12で、形成されたグループのペアに対して実行される比較可能判定処理について、図7のフローチャートを参照して説明する。予測値タイプと予測ターゲットが同じエントリは1つのグループを構成しているので、ペアが形成された2つのグループは、予測値タイプと予測ターゲットのどちらか一方が少なくとも異なるエントリの集合となっている。
ステップS31において、学習履歴管理部23は、ペアが形成された2つのグループは予測ターゲットが異なるかを判定する。ステップS31で、ペアが形成された2つのグループの予測ターゲットが異ならない、すなわち、2つのグループの予測ターゲットが同じである、と判定された場合、処理は後述するステップS36に進む。
一方、ステップS31で、ペアが形成された2つのグループの予測ターゲットが異なると判定された場合、処理はステップS32に進み、学習履歴管理部23は、2つのグループの予測ターゲットの少なくとも一方が数値であるかを判定する。
ステップS32で、2つのグループの予測ターゲットの少なくとも一方が数値であると判定された場合、処理はステップS33に進む。一方、2つのグループの予測ターゲットの両方とも数値ではない、すなわち、2つのグループの予測ターゲットの両方がカテゴリカル化されていると判定された場合、処理はステップS37に進む。
ステップS32で、予測ターゲットの少なくとも一方が数値であると判定された場合の次の処理であるステップS33では、学習履歴管理部23は、2つのグループそれぞれについて、グループ内の各エントリの予測ターゲットの統計量を、使用した学習データから算出する。ここで算出される予測ターゲットの統計量は、例えば、平均値、中央値、標準偏差、最大値、最小値などである。
次に、ステップS34において、学習履歴管理部23は、2つのグループそれぞれについて、グループ内のエントリ全体の予測ターゲットの各統計量の平均値を算出する。すなわち、ステップS33で算出された各エントリの予測ターゲットの各統計量のグループとしての平均値が計算される。例えば、グループ内の各エントリの予測ターゲットの平均値を、グループ全体でさらに平均した値が計算される。中央値、標準偏差、最大値、最小値などのその他の統計量についても同様である。
そして、ステップS35において、学習履歴管理部23は、2つのグループの各統計量の平均値の差分が所定値以下であるかを判定する。ステップS35で、2つのグループの各統計量の平均値の差分が所定値以下であると判定された場合、処理はステップS36に進む。一方、ステップS35で、2つのグループの各統計量の平均値の差分が所定値より大きいと判定された場合、処理はステップS38に進む。
一方、上述したステップS32で、2つのグループの予測ターゲットの両方がカテゴリカル化されていると判定された場合の次の処理であるステップS37では、学習履歴管理部23は、2つのグループの予測ターゲットの取り得る値に共通部分があるかを判定する。ステップS37で、2つのグループの予測ターゲットの取り得る値に共通部分があると判定された場合、処理はステップS36に進む。一方、ステップS37で、2つのグループの予測ターゲットの取り得る値に共通部分がないと判定された場合、処理はステップS38に進む。
ステップS36において、学習履歴管理部23は、ペアが形成された2つのグループは比較可能であると判定して、比較可能判定処理を終了する。ステップS36の処理は、ステップS31で、ペアが形成された2つのグループの予測ターゲットが同じである、と判定された場合、ステップS35で、2つのグループの各統計量の平均値の差分が所定値以下であると判定された場合、または、ステップS37で、2つのグループの予測ターゲットの取り得る値に共通部分があると判定された場合に実行される。したがって、ペアが形成された2つのグループの予測ターゲットが同じである場合、2つのグループの各統計量の平均値の差分が所定値以下である場合、または、予測ターゲットがカテゴリカルである2つのグループの予測ターゲットの取り得る値に共通部分がある場合に、ペアが形成された2つのグループどうしは比較可能であると判定される。
これに対して、ステップS38において、学習履歴管理部23は、ペアが形成された2つのグループは比較不可能であると判定して、比較可能判定処理を終了する。ステップS38の処理は、ステップS35で、2つのグループの各統計量の平均値の差分が所定値より大きいと判定された場合と、ステップS37で、2つのグループの予測ターゲットの取り得る値に共通部分がないと判定された場合に実行される。したがって、2つのグループの各統計量の平均値の差分が所定値より大きいと判定された場合、または、2つのグループの予測ターゲットの取り得る値に共通部分がないと判定された場合に、ペアが形成された2つのグループは比較不可能であると判定される。
図6のフローチャートの説明に戻り、ステップS12では、図7を参照して説明した比較可能判定処理が、グループのペアの全ての組合せについて実行される。
予測ターゲットが数値であり、予測値タイプが数値予測である学習設定を、多値分類の予測値タイプとして学習する場合がある。例えば、0乃至50の範囲の値を取り得る予測ターゲットを、0乃至10、11乃至20、21乃至30、31乃至40、および、41乃至50の5つに分類した多値分類として学習する場合などである。そのように予測値タイプが異なる場合であっても、0乃至10、11乃至20、21乃至30、31乃至40、および、41乃至50の5つにカテゴリの中央値で数値予測したとして、数値予測の指標で評価値を算出することができるので、比較可能判定処理によれば、比較可能と判定することができる。
また、同じ予測ターゲットでも、予測対象の抽象度が変わる場合がある。例えば、予測ターゲットが、契約を「継続」するか「離脱」するかの予測をするような場合、「継続」または「離脱」の2値分類とすることもできるし、「継続」、「契約満了」、または、「途中解約」の3値分類とすることもできる。そのように予測対象の抽象度(カテゴリ数)が変わる場合、共通する値(上述の例では「継続」)か、それ以外か、という2値分類として評価値を算出することができるので、比較可能判定処理によれば、比較可能と判定することができる。
図6のステップS12の後、ステップS13において、学習履歴管理部23は、比較可能と判定されたグループどうしを結合する。
ステップS14において、学習履歴管理部23は、グループごとに、予測精度の高い順でグループ内のエントリをソートする。
ステップS15において、学習履歴管理部23は、エントリ数(予測モデルのモデル数)の多いグループの順番で、各グループのソート結果を連結して、図3の履歴管理画面41のエントリ表示領域52に表示して、エントリソート処理を終了する。
図8は、エントリソート処理が実行された後の履歴管理画面の例を示している。
図8の履歴管理画面では、履歴表示領域65に、5個のエントリ66−1乃至66−5が表示されており、予測精度の評価値の高い順に、エントリ66−1乃至66−5が表示されている。
履歴表示領域65に表示されている5個のエントリ66−1乃至66−5のうち、エントリ66−1、66−3、および、66−5のアイコン71は、二値分類のものとなっており、エントリ66−2、および、66−4のアイコン71は、多値分類のものとなっている。したがって、図8の履歴管理画面は、予測値タイプが異なる複数のエントリをソートした結果の画面となっている。
図8の例では、5個のエントリ66−1乃至66−5のうち、エントリ66−2がユーザによって選択された選択エントリとなっており、エントリ66−2に関する詳細な情報が、右側のサマリ表示領域53に表示されている。
エントリソート処理によれば、予測ターゲットと予測値タイプが同一であって、学習データが異なるエントリは、同一のグループとしてエントリが並べられて表示される。また、予測ターゲットが異なり、グループも異なるエントリは、エントリ数の多いグループの順番で、かつ、同一グループ内については予測精度の高い順で、エントリ表示領域52に表示される。
なお、エントリソート処理では、予測値タイプごとの評価値を全ての予測値タイプに共通な評価指標、例えば、5段階評価などに変換して、共通評価値に応じたソート表示をしてもよい。この場合、全てのエントリが共通の評価指標で比較が可能となるので、ステップS12の比較可能判定処理や、ステップS13の比較可能なグループどうしを結合する結合処理は省略することができる。
<5.ツリー表示処理>
次に、図3の履歴管理画面41においてツリー表示ボタン63が押下された場合に実行されるツリー表示処理について、図9および図10を参照して説明する。
次に、図3の履歴管理画面41においてツリー表示ボタン63が押下された場合に実行されるツリー表示処理について、図9および図10を参照して説明する。
ツリー表示ボタン63が押下された場合、学習履歴管理部23は、図3に示した履歴管理画面41の履歴表示領域65をツリー形式表現に変更する。
図9は、ツリー表示ボタン63が押下された場合の履歴管理画面の例を示している。
図9の履歴管理画面41は、履歴表示領域65のみが図3の履歴管理画面41と異なる。そのため、履歴管理画面41の履歴表示領域65以外の説明は省略する。
履歴表示領域65は、各エントリ66を丸(○)のノード161で表し、ノード161どうしを、実線のノード接続線162で接続したノード表現形式で表示されている。丸のノード161内には、エントリ66の予測モデルの名前と対応する文字、例えば、エントリ66の予測モデルの名前を2文字の文字で簡略化して表した文字が表示される。実線のノード接続線162の矢印は、ノード161のエントリ66が生成された時系列に対応する。図9の例では、予測モデル“m1”(予測モデルmode1)のノード161−1から、予測モデル“m2”(予測モデルmode2)のノード161−2へ、実線のノード接続線162−1が接続され、予測モデル“m2”(予測モデルmode2)のノード161−2から、予測モデル“m3”(予測モデルmode3)のノード161−3へ、実線のノード接続線162−2が接続されている。これは、予測モデル“m1”(予測モデルmode1)、予測モデル“m2”(予測モデルmode2)、予測モデル“m3”(予測モデルmode3)の時間順で、エントリ66が生成されたことを表している。
また、図9のツリー形式表現では、予測モデル“m2”のノード161−2が灰色で表示され、選択された状態を示している。非選択の予測モデル“m1”および“m3”のノード161−1および161−3は白色で表示されている。
さらに、図9のツリー形式表現では、予測モデル“m3”のノード161−3から、予測モデル“m1”のノード161−1へ、破線のコピーノード接続線163が表示されている。この破線のコピーノード接続線163は、接続元のノード161−3の予測モデル“m3”のエントリ66が、接続先のノード161−1の予測モデル“m1”のエントリ66を基に生成されたことを表している。換言すれば、ユーザが、接続先のノード161−1の予測モデル“m1” のエントリ66を選択エントリとしている状態で、コピー新規作成ボタン81を押下して新たな予測モデルの学習を行った場合に、このような破線のコピーノード接続線163が表示される。
以上のように、ツリー表示ボタン63が押下された場合に、履歴表示領域65に表示されるツリー形式表現によれば、同一プロジェクト内の各エントリ66の実行順や、コピー新規作成ボタン81を押下して新たな予測モデルの学習を行った場合の作成元のエントリ66を、視覚的に容易に認識することができる。
履歴表示領域65のツリー形式表現は、図9で説明した表現形式の他、図10のAまたはBのような表現形式で表示することも可能である。
図10のAおよびBは、ツリー表示ボタン63が押下された場合の履歴表示領域65のツリー形式表現のその他の例を示している。
図10のAおよびBのツリー形式表現は、コピー新規作成ボタン81を押下して新たな予測モデルの学習設定を行った場合のコピー元とコピー先を接続する表現形式が図9と異なる。
図9では、コピー元とコピー先のエントリ66のノード161が破線の矢印(コピーノード接続線163)で接続されていた。これに対して、図10のAでは、コピー先のエントリ66のノード161が、コピー元のエントリ66のノード161の右横に配置され、実線のコピーノード接続線164で接続されている。
図10のAにおいて、予測モデル“m21”のノード161−21は、予測モデル“m2”のノード161−2の右横に配置され、実線のコピーノード接続線164−1で接続されている。これは、予測モデル“m21”のノード161−21が、予測モデル“m2”のノード161−2を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
また、予測モデル“m11”のノード161−11は、予測モデル“m3”のノード161−3の右横に配置され、実線のコピーノード接続線164−2で接続されている。これは、予測モデル“m11”のノード161−11が、予測モデル“m3”のノード161−3を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
また、予測モデル“m12”のノード161−12は、予測モデル“m3”のノード161−3の右横で、さらに、予測モデル“m11”のノード161−11の右横に配置され、予測モデル“m11”のノード161−11と実線のコピーノード接続線164−3で接続されている。これは、予測モデル“m12”のノード161−12が、予測モデル“m3”のノード161−3または予測モデル“m11”のノード161−11のどちらかを基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
これに対して、図10のBでは、予測モデル“m21”のノード161−21は、予測モデル“m2”のノード161−2から右横に引き出され、上に折り曲げられたL字状の実線のコピーノード接続線165−1で接続されている。これは、予測モデル“m21”のノード161−21が、予測モデル“m2”のノード161−2を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
また、予測モデル“m22”のノード161−22も、予測モデル“m2”のノード161−2から右横に引き出され、予測モデル“m21”のノード161−21よりも右側で上に折り曲げられたL字状の実線のコピーノード接続線165−2で接続されている。これは、予測モデル“m22”のノード161−22が、予測モデル“m2”のノード161−2を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
さらに、図10のBでは、予測モデル“m11”のノード161−11は、予測モデル“m3”のノード161−3から右横に引き出され、上に折り曲げられたL字状の実線のコピーノード接続線165−3で接続されている。これは、予測モデル“m11”のノード161−11が、予測モデル“m3”のノード161−3を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
また、予測モデル“m12”のノード161−12が、予測モデル“m11”のノード161−11の上に配置され、実線のコピーノード接続線165−4で接続されている。これは、予測モデル“m12”のノード161−12が、予測モデル“m11”のノード161−11を基としてコピー新規作成ボタン81を押下し、新たな予測モデルの学習を行ったエントリ66であることを表している。
図10のAおよびBで示したツリー形式表現を採用した場合でも、同一プロジェクト内の各エントリ66の実行順や、コピー新規作成ボタン81を押下して新たな予測モデルの学習を行った場合の作成元のエントリ66を、視覚的に容易に認識することができる。
また、既存の予測モデルをコピーして作成したエントリ66と、既存の予測モデルをコピーしないで作成したエントリ66とを区別したツリー形式表現とすることで、既存の予測モデルをコピーして作成したエントリ66を分かり易く表示することができる。
<6.有意差の有無表示処理>
図11は、図3に示した履歴管理画面のその他の構成例を示している。
図11は、図3に示した履歴管理画面のその他の構成例を示している。
図11の履歴管理画面41は、図3に示した履歴管理画面41から、さらに、2つのエントリ66−4および66−5が追加されている。
図11の履歴管理画面41の履歴表示領域65において、予測精度が最も高いエントリ66−5と、その次に予測精度が高いエントリ66−4のそれぞれの予測精度の評価値に、枠(四角の囲み)が表示されている。
この予測精度の評価値を囲む枠は、予測精度が最も高いエントリ66−5の予測精度の評価値に対し、予測精度が次に高いエントリ66−4が、統計的に有意差が無いことを表している。このように、学習履歴管理部23は、予測精度が最も高いエントリ66と統計的に有意差が無いエントリ66が存在する場合、それらの予測精度の評価値を、予測精度が最も高いエントリ66の予測精度の評価値と同様の強調表示を行う。なお、統計的に有意差が無いことを表す強調表示の方法は、図11のような囲みの表示に限られない。例えば、他のエントリ66の予測精度の評価値と異なる色を用いて、同色で表示してもよい。
複数のエントリ66の有意差の有無を判定するためには、エントリ66ごとに評価値が複数回計算され、エントリ66ごとの複数回の評価値の平均値と標準偏差が算出されている必要がある。学習履歴管理部23は、エントリ66の評価値が複数回計算され、平均値と標準偏差が算出可能である場合に、エントリ66単位で評価値の平均値と標準偏差を予め計算し、記憶しておく。そして、学習履歴管理部23は、履歴表示領域65を予測精度の評価値の高い順で表示する場合に、予測精度が最も高いエントリ66と、その次に予測精度が高いエントリ66とで有意差の有無を判定する。2番目に予測精度が高いエントリ66と有意差が無いと判定された場合、3番目に予測精度が高いエントリ66について、有意差の有無が判定される。そして、最上位のエントリ66との有意差が有ると判定されるまで、それより下位のエントリ66との有意差の有無が判定される。あるいはまた、履歴管理画面41の履歴表示領域65を、評価値の高い順に表示する場合に、最上位のエントリ66が確定した時点で、最上位のエントリ66と、それより下位のエントリ66との有意差を判定してもよい。
このように、学習履歴管理部23が、最上位のエントリ66に対する有意差の有無を表示することにより、ユーザは、有意差の無い複数のエントリ66を把握し、比較することができる。
<7.エントリ差分表示の例>
学習履歴管理部23は、2つのエントリ66に対応する予測モデルのモデル情報の差分を表示して、2つの予測モデルを簡単に比較するエントリ差分表示機能を備える。
学習履歴管理部23は、2つのエントリ66に対応する予測モデルのモデル情報の差分を表示して、2つの予測モデルを簡単に比較するエントリ差分表示機能を備える。
例えば、ユーザは、図3の履歴管理画面41のエントリ表示領域52に表示された複数のエントリ66のなかから、コントロールボタン等を押下しながら2つのエントリ66を選択し、マウスの右クリックで表示されるメニューから「差分エントリ」を選択する。すると、学習履歴管理部23は、図12のエントリ差分表示画面を表示する。あるいはまた、図9の履歴管理画面41のエントリ表示領域52に表示された複数のノード161のなかから、コントロールボタン等を押下しながら2つのノード161を選択し、マウスの右クリックで表示されるメニューから「差分エントリ」を選択することでも同様に、図12のエントリ差分表示画面を表示することができる。
図12は、エントリ差分表示画面の構成例を示している。
エントリ差分表示画面では、選択された2つのエントリ66の異なる項目が容易に分かるように、異なる項目が強調表示される。項目が異なるか否か検討される項目は、図3の履歴管理画面41のサマリ表示領域53にモデル情報として表示される各項目である。
学習履歴管理部23は、選択された2つのエントリ66の一方(例えば、先に選択されたエントリ66)を差分元エントリ、他方(例えば、後に選択されたエントリ66)を差分先エントリとして、図12のエントリ差分表示画面181の左側に、差分元エントリの各項目を表示する。そして、差分元エントリの各項目に対して、差分先エントリの項目が異なる場合に、その項目の右側に矢印と、差分先エントリの異なる項目の具体的な値が表示される。
図12のエントリ差分表示画面181の例では、差分元エントリと差分先エントリでは、学習時間、予測モデルのモデルタイプ、データの使用項目、Precision、Recall、F-measure、Accuracy、および、AUCが異なることが表されている。
具体的には、学習時間については、差分元エントリが“03:01:21 h”であるのに対して、差分先エントリは、“01:44:11 h”であることが表示されている。予測モデルのモデルタイプについては、差分元エントリが“ニューラルネット”であるのに対して、差分先エントリは、“ランダムフォレスト”であることが表示されている。
データの使用項目については、差分元エントリにあって差分先エントリにないデータ項目が太実線で表され、差分元エントリになくて差分先エントリにあるデータ項目が太破線で表されている。具体的には、データ項目“教育年数”が差分元エントリにあって差分先エントリになく、データ項目“家族構成”が差分元エントリになくて差分先エントリにあることが表示されている。
予測精度の評価値については、差分元エントリのPrecision、Recall、F-measure、Accuracy、および、AUCが、それぞれ、“0.72”、“0.42”、“0.51”、“0.75”、“0.71”であるのに対して、差分先エントリのPrecision、Recall、F-measure、Accuracy、および、AUCが、それぞれ、“0.74”、“0.47”、“0.55”、“0.77”、“0.74”であることが表示されている。
評価値の比較では、差分元エントリと差分先エントリとで、評価値が改善している場合を赤色、評価値が悪化している場合を青色で表示するなど、改善と悪化で色を変えて分かり易くしてもよい。
図12のエントリ差分表示画面181を表示するエントリ差分表示機能により、ユーザは、所望の2つのエントリ66の違いを容易に比較し、検討することができる。
<8.サジェスト機能の表示例>
学習履歴管理部23は、所定のエントリ66を選択し、その選択されたエントリ66(選択エントリ)よりも予測精度が改善されると思われる学習設定を提案するサジェスト機能を備える。サジェスト機能は、図3または図9の履歴管理画面41においてエントリ表示領域52に表示されているエントリ66またはノード161の1つをマウス等で選択し、サジェストボタン64の押下、または、マウスの右クリックで表示されるメニューから「サジェスト」を選択することによって、実行される。
学習履歴管理部23は、所定のエントリ66を選択し、その選択されたエントリ66(選択エントリ)よりも予測精度が改善されると思われる学習設定を提案するサジェスト機能を備える。サジェスト機能は、図3または図9の履歴管理画面41においてエントリ表示領域52に表示されているエントリ66またはノード161の1つをマウス等で選択し、サジェストボタン64の押下、または、マウスの右クリックで表示されるメニューから「サジェスト」を選択することによって、実行される。
図13は、サジェスト機能が実行された場合に表示されるサジェスト画面の例を示している。
なお、以下のサジェスト機能の説明では、予測モデルの予測値タイプが2値分類である場合について説明する。
図13のサジェスト画面201には、予測モデルのモデルタイプ、未使用提案項目、追加使用提案項目の各項目について、選択エントリよりも予測精度が改善されると思われる学習設定が表示されている。また、サジェスト画面201には、予測精度の改善が見込まれる度合いとして、評価値の増加分も表示されている。なお、図13の例では、評価指標としてAUCが表示されているが、その他の評価指標を表示してもよい。
図13のサジェスト画面201では、学習履歴管理部23は、予測モデルに関しては、予測モデルのモデルタイプを“ニューラルネット”とし、正規化項の係数を“0.02”とすることを示している。
また、学習履歴管理部23は、未使用提案項目に関しては、選択エントリで使用しているデータ項目のうち、“結婚歴”、“家族構成”、および、“人種”のデータ項目を使用しない方がよいことを示している。
さらに、学習履歴管理部23は、追加使用提案項目に関しては、選択エントリで使用しているデータ項目に対して、“性別”のデータ項目を追加した方がよいことを示している。
そして、学習履歴管理部23は、AUC増加分に関しては、上述のような予測モデルの変更を行うと、AUCの評価値を0.25だけ増加できることを示している。
図14のフローチャートを参照して、図13のサジェスト画面201のようなサジェスト表示を行うサジェスト表示処理について説明する。この処理は、上述したように、所定のエントリ66を選択した後、サジェストボタン64の押下、または、マウスの右クリックで表示されるメニューから「サジェスト」を選択することによって、実行される。
初めに、ステップS71において、学習履歴管理部23は、現在のプロジェクト“ProjectA”に含まれる全てのエントリ66のなかから、2つのエントリ66を選択して、エントリ66のペアを作成し、差分エントリを作成する。
学習履歴管理部23は、差分エントリを、次のようにして作成する。
まず、作成したエントリ66のペアのうち、予測精度の評価値の小さい方が差分元エントリ、大きい方が差分先エントリに決定される。
そして、差分元エントリと差分先エントリそれぞれの予測モデルのモデルタイプと正則化項の係数が差分エントリに登録される。また、差分元エントリは使用しているが、差分先エントリは使用していないデータ項目が未使用項目として差分エントリに登録される。さらに、差分元エントリは使用していないが、差分先エントリは使用しているデータ項目が追加使用項目として差分エントリに登録される。また、差分元エントリから差分先エントリへの予測精度の評価値の増加分が計算され、差分エントリに登録される。
図15は、所定の1つのエントリ66のペアについて作成された差分エントリの例を示している。
図15の差分エントリの差分元エントリと差分先エントリそれぞれの予測モデルのモデルタイプは“ニューラルネット”であり、正則化項の係数は“0.02”である。また、差分エントリの未使用項目は“結婚歴”、“家族構成”、および、“人種”であり、追加使用項目は“性別”であり、AUC増加分は“0.25”である。
図14のフローチャートに戻り、ステップS71の後、処理はステップS72に進み、学習履歴管理部23は、現在のプロジェクト“ProjectA”に含まれる全てのエントリ66のペアについて差分エントリを作成したかを判定する。
ステップS72で、全てのエントリ66のペアについて差分エントリをまだ作成していないと判定された場合、処理はステップS71に戻り、別の差分エントリが作成される。
そして、ステップS71およびS72の処理が所定数繰り返され、ステップS72で、全てのエントリ66のペアについて差分エントリを作成したと判定された場合、処理はステップS73に進む。
ステップS73において、学習履歴管理部23は、作成された複数の差分エントリのなかから、1つの差分エントリを選択して、処理をステップS74に進める。
ステップS74において、学習履歴管理部23は、選択した差分エントリの差分元の予測モデルのモデルタイプが、選択エントリの予測モデルのモデルタイプと一致するかを判定する。ここで、選択エントリとは、サジェストボタン64の押下、または、マウスの右クリックで表示されるメニューから「サジェスト」を選択する前にユーザが選択したエントリ66を表す。
ステップS74で、選択した差分エントリの差分元の予測モデルのモデルタイプが、選択エントリの予測モデルのモデルタイプと一致すると判定された場合、処理はステップS75に進み、学習履歴管理部23は、選択した差分エントリをサジェストする差分エントリの候補であるサジェスト候補に設定して、処理をステップS78に進める。
一方、ステップS74で、選択した差分エントリの差分元の予測モデルのモデルタイプが、選択エントリの予測モデルのモデルタイプと一致しないと判定された場合、処理はステップS76に進み、学習履歴管理部23は、選択した差分エントリの未使用項目を、選択エントリが使用しているかを判定する。
ステップS76で、選択した差分エントリの未使用項目を、選択エントリが使用していると判定された場合、処理はステップS75に進み、学習履歴管理部23は、選択した差分エントリをサジェストする差分エントリの候補であるサジェスト候補に設定して、処理をステップS78に進める。
一方、ステップS76で、選択した差分エントリの未使用項目を、選択エントリが使用していないと判定された場合、処理はステップS77に進み、学習履歴管理部23は、選択した差分エントリの追加使用項目を、選択エントリが使用しているかを判定する。
ステップS77で、選択した差分エントリの追加使用項目を、選択エントリが使用していると判定された場合、処理はステップS75に進み、学習履歴管理部23は、選択した差分エントリをサジェストする差分エントリの候補であるサジェスト候補に設定して、処理をステップS78に進める。
一方、ステップS77で、選択した差分エントリの追加使用項目を、選択エントリが使用していないと判定された場合、処理はステップS78に進む。
したがって、ステップS74乃至S77の処理により、学習履歴管理部23は、以下の条件(1)乃至(3)のいずれか1つが少なくとも成立する場合に、いま選択している差分エントリを、サジェスト候補に設定する。
(1)選択した差分エントリの差分元の予測モデルのモデルタイプが、選択エントリの予測モデルのモデルタイプと一致する
(2)選択した差分エントリの未使用項目を、選択エントリが使用している
(3)選択した差分エントリの追加使用項目を、選択エントリが使用している
(1)選択した差分エントリの差分元の予測モデルのモデルタイプが、選択エントリの予測モデルのモデルタイプと一致する
(2)選択した差分エントリの未使用項目を、選択エントリが使用している
(3)選択した差分エントリの追加使用項目を、選択エントリが使用している
そして、ステップS78において、学習履歴管理部23は、作成した全ての差分エントリを選択したかを判定する。ステップS78で、まだ全ての差分エントリを選択していないと判定された場合、処理がステップS73に戻され、次の差分エントリが選択される。そして、上述したステップS74乃至S78が実行される。
一方、ステップS78で、全ての差分エントリを選択したと判定された場合、処理はステップS79に進み、学習履歴管理部23は、サジェスト候補に設定された差分エントリのなかで、AUC増加分が最も大きい差分エントリを、サジェストする差分エントリに決定し、図13のようなサジェスト画面201を生成して表示させ、サジェスト表示処理を終了する。
以上のように、サジェスト表示処理では、現在のプロジェクトに含まれる全てのエントリ66から差分エントリを生成して、2つのエントリの差分を分析することにより、選択エントリよりも予測精度が改善されると思われる学習設定が表示される。
ステップS74乃至S77の判定のうち、条件(1)が成立している場合、サジェストする差分エントリの差分先エントリの予測モデルのモデルタイプと正則化項の係数が、図13に示したサジェスト画面201の予測モデルの部分に表示される。
ステップS74乃至S77の判定のうち、条件(2)が成立している場合、サジェストする差分エントリの未使用項目のデータ項目が、図13に示したサジェスト画面201の未使用提案項目の部分に表示される。
ステップS74乃至S77の判定のうち、条件(3)が成立している場合、サジェストする差分エントリの追加使用項目のデータ項目が、図13に示したサジェスト画面201の追加使用提案項目の部分に表示される。
そして、サジェストする差分エントリのAUC増加分が、図13に示したサジェスト画面201のAUC増加分の部分に表示される。AUC増加分の項目は、省略してもよい。
以上の学習履歴管理部23のサジェスト機能により、ユーザは、評価値(AUC)が増加する学習設定を、より簡単かつ迅速に見つけることができる。
<9.コンピュータ構成例>
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図16は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
バス304には、さらに、入出力インタフェース305が接続されている。入出力インタフェース305には、入力部306、出力部307、記憶部308、通信部309、及びドライブ310が接続されている。
入力部306は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部307は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部308は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部309は、ネットワークインタフェースなどよりなる。ドライブ310は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体311を駆動する。
以上のように構成されるコンピュータでは、CPU301が、例えば、記憶部308に記憶されているプログラムを、入出力インタフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。RAM303にはまた、CPU301が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU301)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体311に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブル記録媒体311をドライブ310に装着することにより、入出力インタフェース305を介して、記憶部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記憶部308にインストールすることができる。その他、プログラムは、ROM302や記憶部308に、あらかじめインストールしておくことができる。
本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、上述した複数の実施の形態の全てまたは一部を組み合わせた形態を採用することができる。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。
なお、本技術は以下のような構成も取ることができる。
(1)
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
を備える情報処理装置。
(2)
前記制御部は、さらに、前記複数の予測モデルを、予測精度の順でソートして表示する
前記(1)に記載の情報処理装置。
(3)
前記制御部は、前記予測モデルの予測値の種類である予測値タイプと、前記予測モデルが予測するデータ項目である予測ターゲットが同じ前記複数の予測モデルで同じグループを作成し、前記グループごとに、予測精度の高い順で前記複数の予測モデルをソートして表示する
前記(2)に記載の情報処理装置。
(4)
前記制御部は、前記予測モデルのモデル数の多い前記グループの順番で、各グループのソート結果を連結して表示する
前記(3)に記載の情報処理装置。
(5)
前記制御部は、作成した2つの前記グループどうしの比較が可能か否かの判定を行う比較可能判定処理を実行する
前記(3)または(4)に記載の情報処理装置。
(6)
前記制御部は、前記比較可能判定処理において、2つの前記グループの予測ターゲットが同じである場合には、比較が可能であると判定する
前記(5)に記載の情報処理装置。
(7)
前記制御部は、前記比較可能判定処理において、2つの前記グループの統計量の平均値の差分が所定値以下である場合には、比較が可能であると判定する
前記(5)または(6)に記載の情報処理装置。
(8)
前記制御部は、前記比較可能判定処理において、予測ターゲットがカテゴリカルである2つの前記グループの取り得る値に共通部分がある場合には、比較が可能であると判定する
前記(5)乃至(7)のいずれかに記載の情報処理装置。
(9)
前記制御部は、さらに、前記複数の予測モデルを、ツリー形式表現で表示する制御を行う
前記(1)乃至(8)のいずれかに記載の情報処理装置。
(10)
前記制御部は、既存の前記予測モデルをコピーして作成した予測モデルと、コピーしないで作成した予測モデルとを区別したツリー形式表現で表示する
前記(9)に記載の情報処理装置。
(11)
前記制御部は、さらに、予測精度が最も高い前記予測モデルに対する有意差の有無を示す表示を行う
前記(1)乃至(10)のいずれかに記載の情報処理装置。
(12)
前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を表示する制御を行う
前記(1)乃至(11)のいずれかに記載の情報処理装置。
(13)
前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を分析することで、予測精度が改善されると思われる学習設定を表示する制御を行う
前記(1)乃至(12)のいずれかに記載の情報処理装置。
(14)
前記制御部は、前記複数の予測モデルのなかから選択された予測モデルである選択モデルに対して、予測精度が改善されると思われる予測モデルを表示する
前記(13)に記載の情報処理装置。
(15)
前記制御部は、前記学習設定として、予測モデルのモデルタイプを表示する
前記(13)または(14)に記載の情報処理装置。
(16)
前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、使用しない方がよいデータ項目を表示する
前記(14)または(15)に記載の情報処理装置。
(17)
前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、追加した方がよいデータ項目を表示する
前記(14)乃至(16)のいずれかに記載の情報処理装置。
(18)
情報処理装置が、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う
情報処理方法。
(19)
コンピュータを、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
として機能させるためのプログラム。
(1)
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
を備える情報処理装置。
(2)
前記制御部は、さらに、前記複数の予測モデルを、予測精度の順でソートして表示する
前記(1)に記載の情報処理装置。
(3)
前記制御部は、前記予測モデルの予測値の種類である予測値タイプと、前記予測モデルが予測するデータ項目である予測ターゲットが同じ前記複数の予測モデルで同じグループを作成し、前記グループごとに、予測精度の高い順で前記複数の予測モデルをソートして表示する
前記(2)に記載の情報処理装置。
(4)
前記制御部は、前記予測モデルのモデル数の多い前記グループの順番で、各グループのソート結果を連結して表示する
前記(3)に記載の情報処理装置。
(5)
前記制御部は、作成した2つの前記グループどうしの比較が可能か否かの判定を行う比較可能判定処理を実行する
前記(3)または(4)に記載の情報処理装置。
(6)
前記制御部は、前記比較可能判定処理において、2つの前記グループの予測ターゲットが同じである場合には、比較が可能であると判定する
前記(5)に記載の情報処理装置。
(7)
前記制御部は、前記比較可能判定処理において、2つの前記グループの統計量の平均値の差分が所定値以下である場合には、比較が可能であると判定する
前記(5)または(6)に記載の情報処理装置。
(8)
前記制御部は、前記比較可能判定処理において、予測ターゲットがカテゴリカルである2つの前記グループの取り得る値に共通部分がある場合には、比較が可能であると判定する
前記(5)乃至(7)のいずれかに記載の情報処理装置。
(9)
前記制御部は、さらに、前記複数の予測モデルを、ツリー形式表現で表示する制御を行う
前記(1)乃至(8)のいずれかに記載の情報処理装置。
(10)
前記制御部は、既存の前記予測モデルをコピーして作成した予測モデルと、コピーしないで作成した予測モデルとを区別したツリー形式表現で表示する
前記(9)に記載の情報処理装置。
(11)
前記制御部は、さらに、予測精度が最も高い前記予測モデルに対する有意差の有無を示す表示を行う
前記(1)乃至(10)のいずれかに記載の情報処理装置。
(12)
前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を表示する制御を行う
前記(1)乃至(11)のいずれかに記載の情報処理装置。
(13)
前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を分析することで、予測精度が改善されると思われる学習設定を表示する制御を行う
前記(1)乃至(12)のいずれかに記載の情報処理装置。
(14)
前記制御部は、前記複数の予測モデルのなかから選択された予測モデルである選択モデルに対して、予測精度が改善されると思われる予測モデルを表示する
前記(13)に記載の情報処理装置。
(15)
前記制御部は、前記学習設定として、予測モデルのモデルタイプを表示する
前記(13)または(14)に記載の情報処理装置。
(16)
前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、使用しない方がよいデータ項目を表示する
前記(14)または(15)に記載の情報処理装置。
(17)
前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、追加した方がよいデータ項目を表示する
前記(14)乃至(16)のいずれかに記載の情報処理装置。
(18)
情報処理装置が、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う
情報処理方法。
(19)
コンピュータを、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
として機能させるためのプログラム。
1 予測システム, 11 予測アプリ, 14 ディスプレイ, 21 学習部, 22 予測部, 23 学習履歴管理部, 41 履歴管理画面, 62 ソートボタン, 63 ツリー表示ボタン, 64 サジェストボタン, 181 エントリ差分表示画面, 201 サジェスト画面, 301 CPU, 302 ROM, 303 RAM, 306 入力部, 307 出力部, 308 記憶部, 309 通信部, 310 ドライブ
Claims (19)
- 機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
を備える情報処理装置。 - 前記制御部は、さらに、前記複数の予測モデルを、予測精度の順でソートして表示する
請求項1に記載の情報処理装置。 - 前記制御部は、前記予測モデルの予測値の種類である予測値タイプと、前記予測モデルが予測するデータ項目である予測ターゲットが同じ前記複数の予測モデルで同じグループを作成し、前記グループごとに、予測精度の高い順で前記複数の予測モデルをソートして表示する
請求項2に記載の情報処理装置。 - 前記制御部は、前記予測モデルのモデル数の多い前記グループの順番で、各グループのソート結果を連結して表示する
請求項3に記載の情報処理装置。 - 前記制御部は、作成した2つの前記グループどうしの比較が可能か否かの判定を行う比較可能判定処理を実行する
請求項3に記載の情報処理装置。 - 前記制御部は、前記比較可能判定処理において、2つの前記グループの予測ターゲットが同じである場合には、比較が可能であると判定する
請求項5に記載の情報処理装置。 - 前記制御部は、前記比較可能判定処理において、2つの前記グループの統計量の平均値の差分が所定値以下である場合には、比較が可能であると判定する
請求項5に記載の情報処理装置。 - 前記制御部は、前記比較可能判定処理において、予測ターゲットがカテゴリカルである2つの前記グループの取り得る値に共通部分がある場合には、比較が可能であると判定する
請求項5に記載の情報処理装置。 - 前記制御部は、さらに、前記複数の予測モデルを、ツリー形式表現で表示する制御を行う
請求項1に記載の情報処理装置。 - 前記制御部は、既存の前記予測モデルをコピーして作成した予測モデルと、コピーしないで作成した予測モデルとを区別したツリー形式表現で表示する
請求項9に記載の情報処理装置。 - 前記制御部は、さらに、予測精度が最も高い前記予測モデルに対する有意差の有無を示す表示を行う
請求項1に記載の情報処理装置。 - 前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を表示する制御を行う
請求項1に記載の情報処理装置。 - 前記制御部は、さらに、2つの前記予測モデルの前記モデル情報の差分を分析することで、予測精度が改善されると思われる学習設定を表示する制御を行う
請求項1に記載の情報処理装置。 - 前記制御部は、前記複数の予測モデルのなかから選択された予測モデルである選択モデルに対して、予測精度が改善されると思われる予測モデルを表示する
請求項13に記載の情報処理装置。 - 前記制御部は、前記学習設定として、予測モデルのモデルタイプを表示する
請求項13に記載の情報処理装置。 - 前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、使用しない方がよいデータ項目を表示する
請求項14に記載の情報処理装置。 - 前記制御部は、前記学習設定として、前記選択モデルの予測モデルに対して、追加した方がよいデータ項目を表示する
請求項14に記載の情報処理装置。 - 情報処理装置が、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う
情報処理方法。 - コンピュータを、
機械学習による学習済みモデルである複数の予測モデルと、前記予測モデルに関するモデル情報を表示する制御を行う制御部
として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018201499 | 2018-10-26 | ||
JP2018201499 | 2018-10-26 | ||
PCT/JP2019/040171 WO2020085114A1 (ja) | 2018-10-26 | 2019-10-11 | 情報処理装置、情報処理方法、および、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2020085114A1 true JPWO2020085114A1 (ja) | 2021-09-16 |
Family
ID=70331187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020553140A Pending JPWO2020085114A1 (ja) | 2018-10-26 | 2019-10-11 | 情報処理装置、情報処理方法、および、プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210356920A1 (ja) |
JP (1) | JPWO2020085114A1 (ja) |
CN (1) | CN112789636A (ja) |
WO (1) | WO2020085114A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7239519B2 (ja) * | 2020-03-25 | 2023-03-14 | 株式会社日立製作所 | 機械学習モデル運用管理システムおよび運用管理方法 |
WO2022201512A1 (ja) * | 2021-03-26 | 2022-09-29 | 日本電気株式会社 | 受注予測装置、受注予測方法、学習装置、学習方法、及び、記録媒体 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235848A (ja) * | 2005-02-23 | 2006-09-07 | Mitsubishi Electric Corp | データマイニング補助装置 |
WO2016152053A1 (ja) * | 2015-03-23 | 2016-09-29 | 日本電気株式会社 | 精度推定モデル生成システムおよび精度推定システム |
JP2017151614A (ja) * | 2016-02-23 | 2017-08-31 | 株式会社日立製作所 | 計算機及び分析指標の算出方法 |
JP2018124851A (ja) * | 2017-02-02 | 2018-08-09 | アズビル株式会社 | 支援装置および支援方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6742003B2 (en) * | 2001-04-30 | 2004-05-25 | Microsoft Corporation | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
US7734457B2 (en) * | 1999-10-16 | 2010-06-08 | Computer Associates Think, Inc. | Method and system for generating dynamic comparison models |
WO2002095533A2 (en) * | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Model selection for cluster data analysis |
CH703073B1 (de) * | 2003-03-19 | 2011-11-15 | Roland Pulfer | Vergleich von Modellen eines komplexen Systems. |
US7558803B1 (en) * | 2007-02-01 | 2009-07-07 | Sas Institute Inc. | Computer-implemented systems and methods for bottom-up induction of decision trees |
US8533224B2 (en) * | 2011-05-04 | 2013-09-10 | Google Inc. | Assessing accuracy of trained predictive models |
US8843427B1 (en) * | 2011-07-01 | 2014-09-23 | Google Inc. | Predictive modeling accuracy |
CN102968670B (zh) * | 2012-10-23 | 2016-08-17 | 北京京东世纪贸易有限公司 | 预测数据的方法和装置 |
US20140379310A1 (en) * | 2013-06-25 | 2014-12-25 | Citigroup Technology, Inc. | Methods and Systems for Evaluating Predictive Models |
US9886669B2 (en) * | 2014-02-26 | 2018-02-06 | Microsoft Technology Licensing, Llc | Interactive visualization of machine-learning performance |
US10268948B2 (en) * | 2015-07-23 | 2019-04-23 | The Boeing Company | Data driven classification and troubleshooting system and method using associative memory and a machine learning algorithm to improve the accuracy and performance of the associative memory |
US20180137424A1 (en) * | 2016-11-17 | 2018-05-17 | General Electric Company | Methods and systems for identifying gaps in predictive model ontology |
JP7120649B2 (ja) * | 2017-05-09 | 2022-08-17 | 日本電気株式会社 | 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム |
US10685044B2 (en) * | 2017-06-07 | 2020-06-16 | Accenture Global Solutions Limited | Identification and management system for log entries |
US11501201B2 (en) * | 2017-07-17 | 2022-11-15 | MetiStream, Inc. | Systems, methods, and apparatuses for training, storage, and interaction with machine learning models |
US20170330078A1 (en) * | 2017-07-18 | 2017-11-16 | Ashok Reddy | Method and system for automated model building |
WO2019028468A1 (en) * | 2017-08-04 | 2019-02-07 | Fair Ip, Llc | COMPUTER SYSTEM FOR CONSTRUCTING, TRAINING AND PRODUCING AUTOMATIC LEARNING MODELS |
US20190065607A1 (en) * | 2017-08-28 | 2019-02-28 | Facebook, Inc. | Automated application analytics |
WO2019182590A1 (en) * | 2018-03-21 | 2019-09-26 | Visa International Service Association | Automated machine learning systems and methods |
CN108573358A (zh) * | 2018-05-09 | 2018-09-25 | 平安普惠企业管理有限公司 | 一种逾期预测模型生成方法及终端设备 |
US11501191B2 (en) * | 2018-09-21 | 2022-11-15 | International Business Machines Corporation | Recommending machine learning models and source codes for input datasets |
US10936768B2 (en) * | 2018-10-15 | 2021-03-02 | Aible, Inc. | Interface for visualizing and improving model performance |
US10586164B1 (en) * | 2018-10-15 | 2020-03-10 | AIble Inc. | Interface for visualizing and improving model performance |
-
2019
- 2019-10-11 JP JP2020553140A patent/JPWO2020085114A1/ja active Pending
- 2019-10-11 WO PCT/JP2019/040171 patent/WO2020085114A1/ja active Application Filing
- 2019-10-11 US US17/286,268 patent/US20210356920A1/en active Pending
- 2019-10-11 CN CN201980063773.5A patent/CN112789636A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235848A (ja) * | 2005-02-23 | 2006-09-07 | Mitsubishi Electric Corp | データマイニング補助装置 |
WO2016152053A1 (ja) * | 2015-03-23 | 2016-09-29 | 日本電気株式会社 | 精度推定モデル生成システムおよび精度推定システム |
JP2017151614A (ja) * | 2016-02-23 | 2017-08-31 | 株式会社日立製作所 | 計算機及び分析指標の算出方法 |
JP2018124851A (ja) * | 2017-02-02 | 2018-08-09 | アズビル株式会社 | 支援装置および支援方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2020085114A1 (ja) | 2020-04-30 |
US20210356920A1 (en) | 2021-11-18 |
CN112789636A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645319B1 (en) | Systems and methods for identifying issues in electronic documents | |
Amindoust et al. | Textile supplier selection in sustainable supply chain using a modular fuzzy inference system model | |
Lin et al. | Using AHP and TOPSIS approaches in customer-driven product design process | |
Keršulienė et al. | Integrated fuzzy multiple criteria decision making model for architect selection | |
Cables et al. | The LTOPSIS: An alternative to TOPSIS decision-making approach for linguistic variables | |
Song et al. | Prioritising technical attributes in QFD under vague environment: a rough-grey relational analysis approach | |
Khan et al. | Smart organisations: modelling of enablers using an integrated ISM and fuzzy-MICMAC approach | |
US20120041910A1 (en) | Method of establishing a process decision support system | |
Gong et al. | Design and interactive performance of human resource management system based on artificial intelligence | |
Sathyan et al. | A combined big data analytics and Fuzzy DEMATEL technique to improve the responsiveness of automotive supply chains | |
JPWO2020085114A1 (ja) | 情報処理装置、情報処理方法、および、プログラム | |
Zhong et al. | Sustainable supply chain partner selection and order allocation: A hybrid fuzzy PL-TODIM based MCGDM approach | |
Carneiro et al. | A predictive and user-centric approach to Machine Learning in data streaming scenarios | |
Sakai et al. | Card Sorting Techniques for Domain Characterization in Problem-driven Visualization Research. | |
Bettayeb et al. | Success Factors in Adopting AI in Human Resource Management in UAE Firms: Neutrosophic Analysis | |
Jiménez et al. | A 2-tuple linguistic multi-period decision making approach for dynamic green supplier selection | |
Fournier-Viger et al. | Machine learning for intelligent industrial design | |
Perkins et al. | Practical Data Science for Actuarial Tasks | |
Xu et al. | Product-service supplier pre-evaluation with modified fuzzy ANP reducing decision information distortion | |
García et al. | CompareML: a novel approach to supporting preliminary data analysis decision making | |
WO2021186338A1 (en) | System and method for determining solution for problem in organization | |
US20200342302A1 (en) | Cognitive forecasting | |
Kern et al. | Predicting bid success with a case-based reasoning approach: Explainability and business acceptance | |
Yahya et al. | Generation of business process reference model considering multiple objectives | |
Kulkarni et al. | Actions, Biases, and Human-in-the-Loop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231121 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240206 |