JP2019200510A - 予測システム、及び、予測方法 - Google Patents

予測システム、及び、予測方法 Download PDF

Info

Publication number
JP2019200510A
JP2019200510A JP2018093567A JP2018093567A JP2019200510A JP 2019200510 A JP2019200510 A JP 2019200510A JP 2018093567 A JP2018093567 A JP 2018093567A JP 2018093567 A JP2018093567 A JP 2018093567A JP 2019200510 A JP2019200510 A JP 2019200510A
Authority
JP
Japan
Prior art keywords
prediction
user
prediction model
learning data
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018093567A
Other languages
English (en)
Inventor
芳樹 松浦
Yoshiki Matsuura
芳樹 松浦
直一 根本
Naoichi Nemoto
直一 根本
勇太 武藤
Yuta Muto
勇太 武藤
木下 雅文
Masafumi Kinoshita
雅文 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018093567A priority Critical patent/JP2019200510A/ja
Publication of JP2019200510A publication Critical patent/JP2019200510A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】利用者の好みを反映した予測モデルを再生成するようにする。【解決手段】予測モデルを再生成する予測システムであって、利用者毎の利用データを予測モデルに入力して予測結果を算出する予測値算出部123と、予測結果を利用者に表示し、表示した予測結果に対する利用者の評価が入力される表示部112と、評価に基づいて学習用データを修正する学習用データ修正部132と、修正した学習用データを入力として利用者毎の予測モデルを再生成する予測モデル生成部133と、を有する。【選択図】図1

Description

本発明は、予測システム、及び、予測方法に関する。
近年、履歴などの学習用データを入力として予測モデルを生成し、生成した予測モデルに学習用データとは異なる現在のデータを入力して算出される未来の予測結果としての予測値を返したり、或いは関係性の高い情報を提示する予測システムが普及している。例えば、EC(Electronic Commerce)サイトのレコメンドシステムがある。このような予測システムは、予測モデルに入力される学習用データの特性によって、予測結果が左右される。完全にランダムなデータで学習する場合、一般性の高い予測モデルが生成され、偏ったデータで学習する場合、特定の条件に特化した予測モデルが生成される。そのため、生成された予測システムを他の利用者に提供するためには、学習用データをなるべくランダムなデータで学習する必要がある。
しかし、産業用途などにおいて、企業が保有するデータで学習した予測モデルを他の企業に提供する場合、完全にランダムなデータを収集することが難しく、偏ったデータセットを入力として学習するケースが多分にある。例えば、特許文献1には、ホテルの未来の需要及び価格の予測システムの例が開示されている。この例では、一の地域(例えば、「伊豆」)に存在するホテルの過去の予約情報を学習用データとして予測モデルを生成し、生成した予想モデルに基づいて他の地域(例えば、「熱海」)の需要及び価格を予測している。しかし、一の地域では有効な予測結果も、他の地域で利用すると、両地域間における特定の条件が異なるために、予測誤差が大きくなり、有効に機能しない。
そこで、上記特許文献1には、偏った学習用データで生成した予測モデルを一般性の高い予測モデルに修正する方法が開示されている。
特開2015−87973号公報
しかし、一般性の高い予測モデルでは、利用者側の好みを反映することはできない。利用者が企業の場合、企業は、差別化のために他の企業とは別の戦略をとることが多く、一般性の高い予測モデルによる予測結果は、そのまま利用することができず、参考値としての利用に留まってしまう。
そこで、利用者の好みに合った予測モデルを再生成する方法が考えられる。しかし、利用者自身が学習用データを保有していない場合、そもそも適切な予測モデルを再生成することが困難となる。さらに、利用者の好みに合ったデータを元の学習用データから抽出する方法も考えられる。しかし、利用者の好みがどの項目値と関連があるのかを判断することも困難となる。さらに、利用者自身が好みを明確に提示できない場合もある。このような場合、データの抽出は、試行錯誤となり、予測モデルの再生成に時間及び労力が掛かる。
本発明は、上記課題に鑑みてなされたもので、その目的は、利用者の好みを反映した予測モデルを再生成することができる技術を提供することにある。
上記課題を解決すべく、本発明に従う予測システムは、予測モデルを再生成する予測システムであって、利用者毎の利用データを前記予測モデルに入力して予測結果を算出する算出部と、前記予測結果を利用者に表示し、表示した予測結果に対する前記利用者の評価が入力される表示部と、前記評価に基づいて前記学習用データを修正する学習用データ修正部と、前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成する予測モデル生成部と、を有する。
本発明によれば、利用者の好みを反映した予測モデルを生成することができる。
予測システム全体の構成図。 各種サーバの物理的な構成図。 予測モデル管理記憶部のテーブルの構成図。 学習用データ管理記憶部のテーブルの構成図。 評価履歴管理記憶部のテーブルの構成図。 予測モデル生成処理を示すシーケンス図。 学習用データ修正処理を示すフローチャート。 予測モデル生成処理を示すフローチャート。 表示部の画面の説明図。
以下の説明では、予測システムは、一以上の計算機で構成されてよい。予測システムによる情報の表示は、予測システムの表示デバイスに情報を表示することであってもよいし、表示用情報を遠隔の表示用計算機(情報処理主体)に送信することであってもよい。
図1は、予測システム全体の構成図である。
予測システムは、クライアント端末101と、管理端末102と、ネットワーク103と、フロントサーバ110と、予測モデル利用サーバ120と、予測モデル生成サーバ130と、データ管理サーバ140とを有する。
クライアント端末101と、管理端末102と、それ以外のサーバ(フロントサーバ110と、予測モデル利用サーバ120と、予測モデル生成サーバ130と、データ管理サーバ140)とが、同一ネットワーク103に接続されている。クライアント端末101と、管理端末102と、それ以外のサーバとは、異なるネットワークに接続されていてもよい。例えば、クライアント端末101と、フロントサーバ110と、予測モデル利用サーバ120とが、ローカルエリア内にある同じネットワークで接続されていてもよい。さらに、管理端末102と、予測モデル生成サーバ130と、データ管理サーバ140とが、インターネットを介した広域なネットワークに接続されていてもよい。
クライアント端末101は、予測システムの利用者(ユーザとも呼ぶ)が使用する端末である。クライアント端末101には、利用者から予測システムに処理させるためのデータが入力される。クライアント端末101は、入力データと共に処理要求をフロントサーバ110に送信するために用いられる。さらに、クライアント端末101は、予測結果を閲覧したり、予測結果を評価するために用いられる。クライアント端末101は、例えば、会社や工場内のパーソナルコンピュータやサーバである。或いは、クライアント端末101は、スマートフォンやタブレット端末などの、通信機能を有する通信デバイスでもよい。
管理端末102は、予測システムの運用者が使用する端末であり、管理端末102は、学習用データから予測モデルを生成する要求を送信するために用いられる。管理端末102も、クライアント端末101と同様に、会社や工場内のパーソナルコンピュータや、サーバ、或いはスマートフォンやタブレット端末などの、通信機能を有するデバイスである。
ネットワーク103は、通信キャリアなどによって提供される無線ネットワークまたは有線ネットワークである。ネットワーク103の一部には、個別の会社などが所有するネットワークを含んでもよい。ネットワーク103は、複数種類のプロトコルを通過させるネットワークでもよい。
フロントサーバ110は、リクエスト受付部111と、表示部112とを有している。リクエスト受付部111は、ネットワーク103に接続されている。リクエスト受付部111は、クライアント端末101からの処理要求を受け付け、受け付けた処理要求に基づいて予測モデル利用サーバ120に処理を依頼する。リクエスト受付部111は、処理結果をクライアント端末101に返信する。表示部112は、例えば、タッチパネルディスプレイである。表示部112は、予測モデルを利用して算出された予測結果を利用者に表示し、表示した予測結果に対する利用者の評価(以下、評価結果)を入力可能に構成されている。
予測モデル利用サーバ120は、入出力部121と、モデル取得部122と、「算出部」の一例としての予測値算出部123とを有している。入出力部121は、モデル取得部122及び予測値算出部123を、ネットワーク103に接続する。モデル取得部122は、利用者に応じた予測モデルを、データ管理サーバ140の後述する予測モデル管理記憶部141から選択する。予測値算出部123は、フロントサーバ110からの処理要求に基づいて、利用者毎の学習用データを予測モデルに入力して予測値(予測結果とも呼ぶ)を算出する。予測値算出部123は、算出した予測結果を表示部112に送信する。
予測モデル生成サーバ130は、入出力部131と、学習用データ修正部132と、予測モデル生成部133と、評価結果格納部134とを有している。入出力部131は、学習用データ修正部132、予測モデル生成部133及び評価結果格納部134を、ネットワーク103に接続する。学習用データ修正部132は、評価結果に基づいて学習用データを修正する学習用データ修正処理を実行する。具体的には、学習用データ修正処理は、評価結果に影響を与える項目値及びその項目値の値を抽出し、抽出した項目値及びその項目値の範囲に基づいて学習用データを修正する。予測モデル生成部133は、学習用データを入力として予測モデルを生成する予測モデル生成処理を実行する。これらの処理の動作タイミングは、運用者が管理端末102から処理を要求する場合や、利用者がクライアント端末101から処理を要求するタイミングに合わせて予測モデル利用サーバ120から処理を要求する場合がある。評価結果格納部134は、利用者毎の評価結果を格納する。
データ管理サーバ140は、予測モデル管理記憶部141と、学習用データ管理記憶部142と、評価履歴管理記憶部143とを有している。予測モデル管理記憶部141は、利用者毎に予測モデルを格納する。学習用データ管理記憶部142は、学習用データを格納する。評価履歴管理記憶部143は、複数の評価結果を評価履歴として格納する。これにより、評価結果の汎用性を高めることができる。データ管理サーバ140は、データがファイルの場合は、共有ファイルサーバであってよい。データ管理サーバ140は、データをレコードとして格納しておく場合は、構造データベースサーバであってよい。データ管理サーバ140は、データをjsonなどの形式で格納しておく場合は、キーバリューストアなどの非構造データベースのデータを格納するサーバでよい。
本実施形態では、これらのサーバ110,120,130,140は、それぞれ物理的に異なる計算機である。但し、これらのサーバ110,120,130,140は、必ずしも異なる計算機である必要はなく、各サーバ110,120,130,140が有する機能部が、単一の計算機上に実装されてよい。例えば、予測システム内に、各サーバ110,120,130,140に代えて、1台の計算機(仮に「管理サーバ」と呼ぶ)を設け、各サーバ110,120,130,140が有する機能部を、その管理サーバ上に設けてよい。或いは、1台以上の処理サーバが、管理サーバとして用いられてよい。
さらに、予測システム内に設けられた1台以上の計算機上で、いわゆる仮想計算機を提供するためのソフトウェア(一般的にハイパーバイザと呼ばれる)を実行させてもよい。この場合、計算機上には、各サーバ110,120,130,140の役割を果たす仮想計算機を定義することによって、情報処理システムが構成されてもよい。
図2は、各種サーバの物理的な構成図である。各種サーバとは、図1で示したフロントサーバ110と、予測モデル利用サーバ120と、予測モデル生成サーバ130と、データ管理サーバ140と、クライアント端末101と、管理端末102である。
本実施形態では、これらのサーバ(または端末)には、プロセッサ(以下、CPU)201と、メモリ202と、補助記憶装置203と、通信インターフェース(通信I/F)204とを有する計算機200が用いられる。この計算機200は、一例として、パーソナルコンピュータ(PC)等の汎用的な計算機でよい。
CPU201は、メモリ202に格納されたプログラムを実行する。CPU201の数は、1以上でもよい。計算機200は、複数のCPU201を有してもよい。さらに、CPU201は、複数のプロセッサコアを有する、いわゆるマルチコアプロセッサであってもよい。メモリ202は、不揮発性の記憶素子であるROM(Read Only Memory)及び揮発性の記憶素子であるRAM(Random Access Memory)を含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ201が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。
補助記憶装置203は、例えば、磁気記憶装置(HDD)、フラッシュメモリ(SSD)等の大容量かつ不揮発性の記憶装置である。補助記憶装置203は、CPU201が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置203から読み出された後、メモリ202にロードされ、CPU201によって実行される。通信インターフェース204は、所定のプロトコルに従って、他の装置との通信を制御するネットワークインターフェース装置である。
計算機200は、入力インターフェース(入力I/F)205と、出力インターフェース(出力I/F)208とを有してもよい。入力インターフェース205には、キーボード206やマウス207などが接続される。入力インターフェース205は、オペレータからの入力を受けるインターフェースである。出力インターフェース208には、ディスプレイ装置209や図示しないプリンタなどが接続される。出力インターフェース208は、プログラムの実行結果をオペレータが視認可能な形式で出力するインターフェースである。
尚、本実施形態では、フロントサーバ110、予測モデル利用サーバ120、予測モデル生成サーバ130、及びデータ管理サーバ140の各々が有する各機能部は、ソフトウェア(プログラム)によって実装される。例えば、予測モデル利用サーバ120では、入出力部121と、モデル取得部122と、予測値算出部123として機能させるためのプログラムが、メモリ202上にロードされ、ロードされたプログラムがCPU201によって実行される。これにより、予測モデル利用サーバ120は、入出力部121と、モデル取得部122と、予測値算出部123とを有する装置として動作する。
以下では、予測モデル利用サーバ120と、予測モデル生成サーバ130とで実行される処理を説明する際に、入出力部121と、モデル取得部122と、予測値算出部123等の機能部を主語とした説明を行う。しかし、実際には、それは機能部を有する計算機200のCPU201が処理を行うことを意味する。
さらに、CPU201が実行するプログラムは、計算機200が読み取り可能な記憶メディアまたはネットワークを介して計算機200に提供され、非一時的記憶媒体である補助記憶装置203に格納される。計算機200が読み取り可能な記憶メディアとは、非一時的なコンピュータ可読媒体で、たとえばCD−ROMやフラッシュメモリなどの、不揮発性のリムーバブルメディアである。このため、計算機200は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。
尚、各機能部の一部またはすべては、FPGA(Field-Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などのハードウェアを用いて実装されてもよい。
図3は、予測モデル管理記憶部のテーブルの構成図である。
本実施例では、予測モデル管理記憶部141が、メモリ202や補助記憶装置203の記憶領域上に形成されたテーブル300に、各種情報を記憶させる例を説明する。
予測モデル管理記憶部141のテーブル300は、学習用データから学習した予測モデルと、予測モデルの更新の履歴とをグループ毎に管理するためのテーブルである。ここで、グループとは、例えば、企業Aというグループなどであり、グループの中に、複数の利用者がいる。つまり、グループという複数の利用者が共通で利用する予測モデルを管理することができる。
予測モデル管理記憶部141のテーブル300は、項目値(またはカラム値。以下同じ)として、グループ301、モデル302、及び、生成日時303を有してよい。
グループ301は、複数の利用者をまとめたグループを一意に識別する名称である。
モデル302は、予測モデルを一意に識別する名称である。
生成日時303は、モデル302に格納されている予測モデルを生成した日時である。
本実施形態では、グループ301が1つだけである場合について説明した。しかし、グループ301は、サブグループなど、さらに小さな複数の階層的なグループを有してもよい。また、予測モデルは、複数のグループ301に属してもよい。この場合は、モデル302に対して、グループ301の値が複数存在することになる。
図4は、学習用データ管理記憶部のテーブルの構成図である。
本実施例では、学習用データ管理記憶部142が、メモリ202や補助記憶装置203の記憶領域上に形成されたテーブル400に、各種情報を記憶させる例を説明する。
学習用データ管理記憶部142のテーブル400は、予測モデルを生成するための基となる学習用データを管理するためのテーブルである。
学習用データ管理記憶部142のテーブル400は、項目値として、グループ401、学習データセット402、元学習データセット403、評価履歴404、及び、モデル405を有してよい。
グループ401は、予測モデル管理記憶部141のグループ301と同様に、複数の利用者をまとめたグループを一意に識別する名称である。
学習データセット402は、予測モデルを生成するための学習用データセットである。ここで、学習用データセットとは、目的となる売り上げ等の実績を表す目的データと、目的の要因となる商品情報などの要因データの2種類がある。本実施形態では、これら目的データ及び要因データは、zip形式のデータである。しかし、目的データ及び要因データそれぞれは、csv形式のファイルでもよいし、これらcsv形式のファイルがさらに複数存在する場合、ファイルが格納されているフォルダのパスやURLなど、学習用データセットの所在が分かる情報でもよい。
元学習用データセット403は、学習用データセット402を生成する際の基となる学習用データセットである。
評価履歴ID404は、学習用データセット402を生成する際の基となる、利用者の評価結果の履歴を表すIDである。利用者の評価結果の履歴を格納するテーブル500は、評価履歴管理記憶部143のテーブルであり、詳細は図5において後述する。
モデル405は、学習用データセットから生成した予測モデルの名称である。モデル405における予測モデルは、予測モデル管理記憶部141のモデル302における予測モデルと同一のものである。
図5は、評価履歴管理記憶部143のテーブルの構成図である。
本実施例では、評価履歴管理記憶部143が、メモリ202や補助記憶装置203の記憶領域上に形成されたテーブル500に、各種情報を記憶させる例を説明する。
評価履歴管理記憶部143のテーブル500は、利用者が利用した予測モデルの評価結果に関する情報を管理するためのテーブルである。
評価履歴管理記憶部143のテーブル500は、項目値として、評価履歴ID501、グループ502、ユーザ503、利用モデル504、評価日時505、結果506、及び、対象データレコードのキー値507を有してよい。
評価履歴ID501は、利用者が予測モデルを利用した際の評価結果を一意に識別するIDである。グループ502は、利用者が所属するグループである。ユーザ503は、利用者を一意に識別する名称である。利用モデル504は、利用者が利用した予測モデルを一意に識別する名称である。評価日時505は、利用者が評価結果を登録した日時である。結果506は、利用者が利用モデルを利用した際の評価結果である。ここでは、評価結果は、利用者の好みに合っている場合には「良」の一例としての「Like」、好みと乖離がある場合には「不良」の一例としての「Unlike」を登録してよい。評価の方法は、「Like」「Unlike」の2段階評価だけではなく、5段階評価や、予測結果の中の特定の項目のみが良い(Like)と登録してもよい。
対象データレコードのキー値507は、利用者が評価した予測結果に該当する学習用データセット内のデータレコードを一意に識別する値である。
ここで、予測モデルにより出力される予測結果は、学習用データセットの目的の要因となる情報の1レコードと対応させることができる。例えば、ECサイトのレコメンドシステムでは、予測モデルを利用して、利用者情報に基づいて、要因データの中からお勧めする商品情報を複数提示する。利用者は、提示された商品情報から良いものを選択すると、選択された商品情報は、要因データの中の1レコードに相当することになる。
図6は、予測モデル生成処理を示すシーケンス図である。
まず、利用者は、クライアント端末101を操作して、フロントサーバ110にログインを行う(S601)。この際、利用者は、グループ、ユーザ及びを登録する。フロントサーバ110におけるリクエスト受付部111は、利用者がログイン認証すると、利用者が操作する操作画面であって利用者のリクエストを受け付けるリクエスト受付画面を生成する(S602)。表示部112は、生成したリクエスト受付画面をクライアント端末101上に表示する(S603)。利用者は、クライアント端末101を操作して、予測モデルを利用するための利用データを生成し(S604)、利用する予測モデルを選択して(S605)、予測リクエスト(S606)をフロントサーバ110に要求する。
フロントサーバ110におけるリクエスト受付部111は、予測リクエストを予測モデル利用サーバ120に転送する。予測モデルサーバ120におけるモデル取得部122は、転送された予測リクエストを受け付けると、予測モデル管理記憶部141から利用者が選択した利用モデルを取得する(S607)。予測値算出部123は、取得した予測モデルに利用データを入力して予測値を算出する(S608)。予測値算出部123は、予測結果としての予測値をフロントサーバ110に返却する。フロントサーバ110における表示部112は、予測値に基づいて、予測結果を示す予測結果画面を生成し(S609)、予測結果画面をクライアント端末101に表示する(S610)。
利用者は、好みに応じて予測結果の修正の要求が必要か否かを判断する(S611)。S611の判断が肯定的であった場合(S611:Yes)、クライアント端末101の予測結果画面上にある予測結果の評価ボタンを押下するなどして、予測結果に対する利用者の評価結果を入力する(S612)。評価結果の入力後に、利用者は、再評価ボタンなどを押下して、評価結果通知リクエスト(S613)をフロントサーバ110に送信する。フロントサーバ110におけるリクエスト受付部111は、評価結果通知リクエストを受け付けると、予測モデル利用サーバ120に転送する。予測モデル利用サーバ120における入出力部121は、評価履歴管理記憶部143に評価結果を格納すると共に(S614)、予測モデルの修正リクエスト(S615)を予測モデル生成サーバ130に送信する。
予測モデル生成サーバ130における学習用データ修正部132は、修正リクエストの送信者である利用者のグループと、利用していた予測モデルと、評価履歴とに基づいて、学習用データを修正する学習用データ修正処理を実行する(S616)。予測モデル生成部133は、修正した学習用データを入力として利用者毎の予測モデルを再生成する予測モデル生成処理を実行する(S617)。そして、予測モデル生成部133は、予測モデル利用サーバ120に処理の完了を通知(S618)する。予測モデル利用サーバ120におけるモデル取得部122が利用モデルを取得し、予測値算出部123が再び利用データを修正された予測モデルに入力して予測値を算出する(S607,608)。そして、フロントサーバ110を経由して表示部112がクライアント端末101に予測結果画面を表示する(S609,610)。これらのステップ(S607〜S618)を利用者が満足するまで繰り返すことによって、利用者の好みに合った学習用データセット及び予測モデルが生成され、予測モデルの修正を終了する(S620)。
上記実施形態では、予測モデル生成部133は、評価結果通知リクエスト(S613)がフロントサーバ110に送信されたタイミングで、評価履歴に基づいて予測モデルを再生成していた。しかし、予測モデル生成部133は、ある程度の量の予測評価履歴を評価結果格納部134に溜めておき、1日一回バッチ的に予測モデル生成サーバ130に修正リクエスト(S615)を送信して、予測モデルを再生成してもよい。この場合、利用者のクライアント端末101には、フロントサーバ110におけるリクエスト受付部111が評価結果通知リクエスト(S613)を受け付け、予測モデル利用サーバ120における入出力部121が予測結果を格納(S614)後、直ぐに、受付完了等の返信が返される。
図7は、学習用データ修正処理を示すフローチャートである。
学習用データ修正部132は、グループと、予測モデルと、評価履歴とから構成される修正リクエスト(S615)を受け取ると、まず、予測モデルの学習用データセットを学習用データ管理記憶部142から取得する(S701)。
次に、学習用データ修正部132は、評価履歴管理記憶部143から、利用した予測モデルの全ての評価結果を評価履歴として取得する(S702)。ここで、学習用データ修正部132は、予測モデル以外に、予測モデルの基となる予測モデルなど、同系列の予測モデルに関する評価結果を取得してもよい。つまり、学習用データ修正部132は、過去の履歴をさかのぼって評価結果を取得してもよい。
学習用データ修正部132は、評価履歴に含まれる評価結果が100件以上であるか否かを判定する(S703)。S703の判定結果が真の場合(S703:YES)、S704に進み、S703の判定結果が偽の場合(S703:NO)、S706に進む。
(S704)学習用データ修正部132は、取得した評価履歴の中から、利用者の好みを反映している項目値を、対象データレコードのキー値に基づいて学習用データセットの中から抽出する。例えば、対象データレコードのキー値のデータを取得し、データを項目別にクラスタリングなどにより分類し、分類した中で同一クラスタに属しているデータが多い場合、利用者の好みを反映している項目値と当該項目値の範囲等を選定する。これらを、LikeとUnlikeとの2パターンで行うことによって、好みの項目値及びその項目値の範囲と、好みではない項目値及びその項目値の範囲とを抽出する。
次に、学習用データ修正部132は、抽出した項目値およびその項目値の範囲に該当するデータレコードを学習用データセットから抽出する。学習用データ修正部132は、抽出したデータレコードに対して、パラメータの変更や、データレコードそのものを削除するなどの、修正を行う(S705)。
最後に、学習用データ修正部132は、修正した学習用データセットを学習用データ管理記憶部142に格納して(S706)、終了する。
図8は、予測モデル生成処理を示すフローチャートである。
予測モデル生成部133は、まず学習用データセットを学習用データ管理記憶部142から取得する(S801)。予測モデル生成部133は、取得した学習用データセットに基づいて予測モデルを生成する(S802)。ここで、予測モデルの生成方法は、重回帰分析や決定木分析、集団学習法であるランダムフォレスト、またはニューラルネットワークを用いた手法などでよい。予測モデル生成部133は、生成した予測モデルを予測モデル管理記憶部141及び学習用データ管理記憶部142に格納して(S803)、終了する。
図9は、表示部の表示画面の説明図である。
表示部112の表示画面900は、利用者が、利用データを登録し、利用する予測モデルを選定し、予測結果を確認および評価するための画面である。本実施例では、予測システムが、銀行における企業間のビジネスマッチングに利用された例である。さらに、本実施例では、フロントサーバ110が、この表示画面900を作成し、作成した表示画面900をクライアント端末110に提供する(クライアント端末101のディスプレイ装置209に表示させる)例を説明する。ただし、フロントサーバ110以外の計算機が、この設定画面900を作成してもよい。
図9において、符号901は、利用者が選定した利用データが入力される利用データ入力ボックスである。符号902は、利用者が選定した利用モデルが入力される利用モデル入力ボックスである。符号903は、利用データを予測モデルに入力して予測結果を算出する予測処理(図6におけるS608)の実行を開始させる予測開始ボタンである。符号904は、データレコード毎の予測結果を表示する予測結果表示欄である。符号905は、再評価を要求する再評価要求ボタンである。符号906は、各種リクエスト及び処理を終了させる終了ボタンである。
予測結果表示欄904は、項目値として、ランク、スコア、予測結果キー、所在値、A出荷量、及び、評価を有してよい。ランク、スコア、予測結果キー、所在値、及び、A出荷量は、「予測結果」の一例である。ランクは、全データレコード内の順位である。スコアは、企業間のビジネスマッチ度である。予測結果キーは、算出された予測結果を一意に識別する値である。尚、ランク及びスコアは、前回値も表示してよい。予測結果キーは、表示されなくてもよい。
利用者が利用データ入力ボックス901及び利用モデル入力ボックス902それぞれを入力して、予測開始ボタン903を押下することによって、フロントサーバ110を経由して予測モデル利用サーバ120に処理が要求される。予測モデル利用サーバ120は、予測値を算出し、その予測値を予測結果として予測結果表示欄904にスコア順に表示する画面を作成し、クライアント端末101に表示させる。
利用者は、予測結果表示欄904に表示される各予測結果を確認して、各予測結果が利用者の好みに合っているかどうかを項目値などを参照しながら評価し、その評価結果を評価欄にLikeもしくはUnlikeとして入力する。利用者は、各予測結果の評価後、再評価ボタン905を押下すると、評価結果通知リクエスト(S613)がフロントサーバ110を経由して、予測モデル利用サーバ120及び予測モデル生成サーバ130に送信される。これにより、予測モデルが再生成され、新たな予測結果が予測結果表示欄904に表示される。そして、利用者は、再び予測結果表示欄904の予測結果に対する評価結果を評価欄に入力して、再評価ボタン905を押下して、予測モデルを再生成することを繰り返すことによって、利用者の好みに合った予測モデルが生成される。これにより、予測結果表示欄904には、利用者の好みに合った予測モデルによる予測結果が表示されるようになる。
本実施例に係る予測システムは、前述した機能を備えている。これにより、予測システムは、特定の学習用データを用意する必要がなく、一般的な汎用データや他の利用者から収集した特定のデータなどのあらゆる学習用データを入力として、利用者の好みに合った特化した予測モデルを生成することができる。
さらに、利用者の好みを徐々に予測モデルに反映できるため、利用者の好みが変化しても、その都度、利用者の好みを反映させることができる。これにより、利用者の好みの反映に特別なカスタマイズが不要となり、予測システムの提供者は、多数の利用者に適切な予測モデルを容易に提供することができる。
さらに、予測システムは、学習用データを格納する学習用データ管理記憶部と、予測モデルを格納する予測モデル管理記憶部と、利用者に応じた予測モデルを予測モデル記憶部から選択する予測モデル取得部と、を更に有する。これにより、学習用データ及び予測モデルを管理し易い。
さらに、評価結果は、良または不良の何れかであり、学習用データ修正部132は、利用者の好みに合う項目値及び当該項目値の範囲を抽出する。これにより、利用者の好みに基づいて予測モデルを生成することができる。
さらに、学習用データ修正部132は、利用者の好みに合う項目値及びその項目値の範囲をクラスタリングによって抽出する。これにより、予測モデルを容易に生成することができる。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
クライアント端末101は、複数のユーザが所属する複数グループによってクラウド上で共同利用されてよい。即ち、利用者は、複数の利用者が所属するグループ単位でよい。この場合、表示部112には、複数の利用者の評価結果が入力されてもよい。これにより、評価結果の汎用性を高めることができる。
112:表示部、122:モデル取得部、123:予測値算出部、132:学習用データ修正部、133:予測モデル生成部、141:予測モデル管理記憶部、142:学習用データ管理記憶部、143:評価履歴管理記憶部、503:ユーザ

Claims (11)

  1. 予測モデルを再生成する予測システムであって、
    利用者毎の利用データを前記予測モデルに入力して予測結果を算出する算出部と、
    前記予測結果を前記利用者に表示し、表示した予測結果に対する前記利用者の評価が入力される表示部と、
    前記評価に基づいて前記学習用データを修正する学習用データ修正部と、
    前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成する予測モデル生成部と、
    を有する、
    予測システム。
  2. 前記学習用データ修正部は、
    前記評価に影響を与える項目値及び当該項目値の範囲を抽出し、抽出した項目値及び当該項目値の範囲に対応する前記学習用データを修正する、
    請求項1に記載の予測システム。
  3. 複数の前記評価を評価履歴として格納する評価履歴管理記憶部を更に有する、
    請求項1に記載の予測システム。
  4. 前記学習用データを格納する学習用データ管理記憶部と、
    前記予測モデルを格納する予測モデル管理記憶部と、
    前記利用者に応じた前記予測モデルを前記予測モデル管理記憶部から選択する予測モデル取得部と、
    を更に有する、
    請求項2に記載の予測システム。
  5. 前記評価は、良または不良のいずれかであり、
    前記学習用データ修正部は、
    前記利用者の好みに合う項目値及び当該項目値の範囲を抽出する、
    請求項2に記載の予測システム。
  6. 前記学習用データ修正部は、
    前記利用者の好みに合う項目値及び当該項目値の範囲をクラスタリングによって抽出する、
    請求項5に記載の予測システム。
  7. 前記学習用データ修正部は、
    前記評価が前記利用者の好みに合う場合、抽出した項目値及び当該項目値の範囲に対応する前記学習用データのパラメータを変更する、
    請求項2に記載の予測システム。
  8. 前記利用者は、複数のユーザが所属するグループである、
    請求項2に記載の予測システム。
  9. 前記予測結果は、企業間のビジネスマッチ度を示すスコアを含む、
    請求項2に記載の予測システム。
  10. 前記予測結果は、所在地及び出荷量を含む、
    請求項9に記載の予測システム。
  11. 予測モデルを再生成する予測方法であって、
    利用者毎の利用データを前記予測モデルに入力して予測結果を算出し、
    前記予測結果を前記利用者に表示し、表示した予測結果に対する前記利用者の評価が入力され、
    前記評価に基づいて前記学習用データを修正し、
    前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成し、
    前記再生成した予測モデルに前記利用者毎の利用データを入力して予測結果を算出する、
    予測方法。

JP2018093567A 2018-05-15 2018-05-15 予測システム、及び、予測方法 Pending JP2019200510A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018093567A JP2019200510A (ja) 2018-05-15 2018-05-15 予測システム、及び、予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018093567A JP2019200510A (ja) 2018-05-15 2018-05-15 予測システム、及び、予測方法

Publications (1)

Publication Number Publication Date
JP2019200510A true JP2019200510A (ja) 2019-11-21

Family

ID=68612116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018093567A Pending JP2019200510A (ja) 2018-05-15 2018-05-15 予測システム、及び、予測方法

Country Status (1)

Country Link
JP (1) JP2019200510A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161896A1 (ja) * 2020-02-14 2021-08-19 ソニーグループ株式会社 情報処理装置、情報処理方法、プログラム
JP7400651B2 (ja) 2020-07-21 2023-12-19 株式会社豊田自動織機 箱選定装置、梱包実績修正方法、及び梱包実績修正プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161896A1 (ja) * 2020-02-14 2021-08-19 ソニーグループ株式会社 情報処理装置、情報処理方法、プログラム
JP7400651B2 (ja) 2020-07-21 2023-12-19 株式会社豊田自動織機 箱選定装置、梱包実績修正方法、及び梱包実績修正プログラム

Similar Documents

Publication Publication Date Title
US11797595B2 (en) Method, apparatus, and computer program product for user-specific contextual integration for a searchable enterprise platform
EP3893154A1 (en) Recommendation model training method and related apparatus
CN109242612B (zh) 一种产品推荐的方法及设备
US9886500B2 (en) System and method for providing technology assisted data review with optimizing features
US9064212B2 (en) Automatic event categorization for event ticket network systems
JP6414363B2 (ja) 予測システム、方法およびプログラム
US11727420B2 (en) Time series clustering analysis for forecasting demand
JP6253744B1 (ja) 情報解析装置、情報解析方法、および情報解析プログラム
US10936601B2 (en) Combined predictions methodology
JP5662299B2 (ja) 情報推薦装置及び方法及び装置及びプログラム
US8793236B2 (en) Method and apparatus using historical influence for success attribution in network site activity
CN111797927A (zh) 用于确定机器学习样本的重要特征的方法及系统
CN113610240A (zh) 利用嵌套机器学习模型来执行预测的方法及系统
JP2018077615A (ja) 広告画像生成装置、広告画像生成方法、広告画像生成装置用プログラム
CN110046155B (zh) 特征数据库的更新、数据特征的确定方法、装置及设备
JP2019200510A (ja) 予測システム、及び、予測方法
US20140280216A1 (en) Automated ranking of contributors to a knowledge base
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
US20230004842A1 (en) Hybrid clustered prediction computer modeling
JP7450190B2 (ja) 特許情報処理装置、特許情報処理方法、およびプログラム
WO2015191741A1 (en) Systems and methods for conducting relationship dependent online transactions
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
US20140324524A1 (en) Evolving a capped customer linkage model using genetic models
JP6751955B1 (ja) 学習方法、評価装置、及び評価システム
CN112668703A (zh) 一种用户收入确定方法及装置