JP2019200510A

JP2019200510A - 予測システム、及び、予測方法

Info

Publication number: JP2019200510A
Application number: JP2018093567A
Authority: JP
Inventors: 芳樹松浦; Yoshiki Matsuura; 直一根本; Naoichi Nemoto; 勇太武藤; Yuta Muto; 木下　雅文; Masafumi Kinoshita; 雅文木下
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2018-05-15
Filing date: 2018-05-15
Publication date: 2019-11-21

Abstract

【課題】利用者の好みを反映した予測モデルを再生成するようにする。【解決手段】予測モデルを再生成する予測システムであって、利用者毎の利用データを予測モデルに入力して予測結果を算出する予測値算出部１２３と、予測結果を利用者に表示し、表示した予測結果に対する利用者の評価が入力される表示部１１２と、評価に基づいて学習用データを修正する学習用データ修正部１３２と、修正した学習用データを入力として利用者毎の予測モデルを再生成する予測モデル生成部１３３と、を有する。【選択図】図１

Description

本発明は、予測システム、及び、予測方法に関する。

近年、履歴などの学習用データを入力として予測モデルを生成し、生成した予測モデルに学習用データとは異なる現在のデータを入力して算出される未来の予測結果としての予測値を返したり、或いは関係性の高い情報を提示する予測システムが普及している。例えば、ＥＣ（Electronic Commerce）サイトのレコメンドシステムがある。このような予測システムは、予測モデルに入力される学習用データの特性によって、予測結果が左右される。完全にランダムなデータで学習する場合、一般性の高い予測モデルが生成され、偏ったデータで学習する場合、特定の条件に特化した予測モデルが生成される。そのため、生成された予測システムを他の利用者に提供するためには、学習用データをなるべくランダムなデータで学習する必要がある。

しかし、産業用途などにおいて、企業が保有するデータで学習した予測モデルを他の企業に提供する場合、完全にランダムなデータを収集することが難しく、偏ったデータセットを入力として学習するケースが多分にある。例えば、特許文献１には、ホテルの未来の需要及び価格の予測システムの例が開示されている。この例では、一の地域（例えば、「伊豆」）に存在するホテルの過去の予約情報を学習用データとして予測モデルを生成し、生成した予想モデルに基づいて他の地域（例えば、「熱海」）の需要及び価格を予測している。しかし、一の地域では有効な予測結果も、他の地域で利用すると、両地域間における特定の条件が異なるために、予測誤差が大きくなり、有効に機能しない。

そこで、上記特許文献１には、偏った学習用データで生成した予測モデルを一般性の高い予測モデルに修正する方法が開示されている。

特開２０１５−８７９７３号公報

しかし、一般性の高い予測モデルでは、利用者側の好みを反映することはできない。利用者が企業の場合、企業は、差別化のために他の企業とは別の戦略をとることが多く、一般性の高い予測モデルによる予測結果は、そのまま利用することができず、参考値としての利用に留まってしまう。

そこで、利用者の好みに合った予測モデルを再生成する方法が考えられる。しかし、利用者自身が学習用データを保有していない場合、そもそも適切な予測モデルを再生成することが困難となる。さらに、利用者の好みに合ったデータを元の学習用データから抽出する方法も考えられる。しかし、利用者の好みがどの項目値と関連があるのかを判断することも困難となる。さらに、利用者自身が好みを明確に提示できない場合もある。このような場合、データの抽出は、試行錯誤となり、予測モデルの再生成に時間及び労力が掛かる。

本発明は、上記課題に鑑みてなされたもので、その目的は、利用者の好みを反映した予測モデルを再生成することができる技術を提供することにある。

上記課題を解決すべく、本発明に従う予測システムは、予測モデルを再生成する予測システムであって、利用者毎の利用データを前記予測モデルに入力して予測結果を算出する算出部と、前記予測結果を利用者に表示し、表示した予測結果に対する前記利用者の評価が入力される表示部と、前記評価に基づいて前記学習用データを修正する学習用データ修正部と、前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成する予測モデル生成部と、を有する。

本発明によれば、利用者の好みを反映した予測モデルを生成することができる。

予測システム全体の構成図。各種サーバの物理的な構成図。予測モデル管理記憶部のテーブルの構成図。学習用データ管理記憶部のテーブルの構成図。評価履歴管理記憶部のテーブルの構成図。予測モデル生成処理を示すシーケンス図。学習用データ修正処理を示すフローチャート。予測モデル生成処理を示すフローチャート。表示部の画面の説明図。

以下の説明では、予測システムは、一以上の計算機で構成されてよい。予測システムによる情報の表示は、予測システムの表示デバイスに情報を表示することであってもよいし、表示用情報を遠隔の表示用計算機（情報処理主体）に送信することであってもよい。

図１は、予測システム全体の構成図である。

予測システムは、クライアント端末１０１と、管理端末１０２と、ネットワーク１０３と、フロントサーバ１１０と、予測モデル利用サーバ１２０と、予測モデル生成サーバ１３０と、データ管理サーバ１４０とを有する。

クライアント端末１０１と、管理端末１０２と、それ以外のサーバ（フロントサーバ１１０と、予測モデル利用サーバ１２０と、予測モデル生成サーバ１３０と、データ管理サーバ１４０）とが、同一ネットワーク１０３に接続されている。クライアント端末１０１と、管理端末１０２と、それ以外のサーバとは、異なるネットワークに接続されていてもよい。例えば、クライアント端末１０１と、フロントサーバ１１０と、予測モデル利用サーバ１２０とが、ローカルエリア内にある同じネットワークで接続されていてもよい。さらに、管理端末１０２と、予測モデル生成サーバ１３０と、データ管理サーバ１４０とが、インターネットを介した広域なネットワークに接続されていてもよい。

クライアント端末１０１は、予測システムの利用者（ユーザとも呼ぶ）が使用する端末である。クライアント端末１０１には、利用者から予測システムに処理させるためのデータが入力される。クライアント端末１０１は、入力データと共に処理要求をフロントサーバ１１０に送信するために用いられる。さらに、クライアント端末１０１は、予測結果を閲覧したり、予測結果を評価するために用いられる。クライアント端末１０１は、例えば、会社や工場内のパーソナルコンピュータやサーバである。或いは、クライアント端末１０１は、スマートフォンやタブレット端末などの、通信機能を有する通信デバイスでもよい。

管理端末１０２は、予測システムの運用者が使用する端末であり、管理端末１０２は、学習用データから予測モデルを生成する要求を送信するために用いられる。管理端末１０２も、クライアント端末１０１と同様に、会社や工場内のパーソナルコンピュータや、サーバ、或いはスマートフォンやタブレット端末などの、通信機能を有するデバイスである。

ネットワーク１０３は、通信キャリアなどによって提供される無線ネットワークまたは有線ネットワークである。ネットワーク１０３の一部には、個別の会社などが所有するネットワークを含んでもよい。ネットワーク１０３は、複数種類のプロトコルを通過させるネットワークでもよい。

フロントサーバ１１０は、リクエスト受付部１１１と、表示部１１２とを有している。リクエスト受付部１１１は、ネットワーク１０３に接続されている。リクエスト受付部１１１は、クライアント端末１０１からの処理要求を受け付け、受け付けた処理要求に基づいて予測モデル利用サーバ１２０に処理を依頼する。リクエスト受付部１１１は、処理結果をクライアント端末１０１に返信する。表示部１１２は、例えば、タッチパネルディスプレイである。表示部１１２は、予測モデルを利用して算出された予測結果を利用者に表示し、表示した予測結果に対する利用者の評価（以下、評価結果）を入力可能に構成されている。

予測モデル利用サーバ１２０は、入出力部１２１と、モデル取得部１２２と、「算出部」の一例としての予測値算出部１２３とを有している。入出力部１２１は、モデル取得部１２２及び予測値算出部１２３を、ネットワーク１０３に接続する。モデル取得部１２２は、利用者に応じた予測モデルを、データ管理サーバ１４０の後述する予測モデル管理記憶部１４１から選択する。予測値算出部１２３は、フロントサーバ１１０からの処理要求に基づいて、利用者毎の学習用データを予測モデルに入力して予測値（予測結果とも呼ぶ）を算出する。予測値算出部１２３は、算出した予測結果を表示部１１２に送信する。

予測モデル生成サーバ１３０は、入出力部１３１と、学習用データ修正部１３２と、予測モデル生成部１３３と、評価結果格納部１３４とを有している。入出力部１３１は、学習用データ修正部１３２、予測モデル生成部１３３及び評価結果格納部１３４を、ネットワーク１０３に接続する。学習用データ修正部１３２は、評価結果に基づいて学習用データを修正する学習用データ修正処理を実行する。具体的には、学習用データ修正処理は、評価結果に影響を与える項目値及びその項目値の値を抽出し、抽出した項目値及びその項目値の範囲に基づいて学習用データを修正する。予測モデル生成部１３３は、学習用データを入力として予測モデルを生成する予測モデル生成処理を実行する。これらの処理の動作タイミングは、運用者が管理端末１０２から処理を要求する場合や、利用者がクライアント端末１０１から処理を要求するタイミングに合わせて予測モデル利用サーバ１２０から処理を要求する場合がある。評価結果格納部１３４は、利用者毎の評価結果を格納する。

データ管理サーバ１４０は、予測モデル管理記憶部１４１と、学習用データ管理記憶部１４２と、評価履歴管理記憶部１４３とを有している。予測モデル管理記憶部１４１は、利用者毎に予測モデルを格納する。学習用データ管理記憶部１４２は、学習用データを格納する。評価履歴管理記憶部１４３は、複数の評価結果を評価履歴として格納する。これにより、評価結果の汎用性を高めることができる。データ管理サーバ１４０は、データがファイルの場合は、共有ファイルサーバであってよい。データ管理サーバ１４０は、データをレコードとして格納しておく場合は、構造データベースサーバであってよい。データ管理サーバ１４０は、データをｊｓｏｎなどの形式で格納しておく場合は、キーバリューストアなどの非構造データベースのデータを格納するサーバでよい。

本実施形態では、これらのサーバ１１０，１２０，１３０，１４０は、それぞれ物理的に異なる計算機である。但し、これらのサーバ１１０，１２０，１３０，１４０は、必ずしも異なる計算機である必要はなく、各サーバ１１０，１２０，１３０，１４０が有する機能部が、単一の計算機上に実装されてよい。例えば、予測システム内に、各サーバ１１０，１２０，１３０，１４０に代えて、１台の計算機（仮に「管理サーバ」と呼ぶ）を設け、各サーバ１１０，１２０，１３０，１４０が有する機能部を、その管理サーバ上に設けてよい。或いは、１台以上の処理サーバが、管理サーバとして用いられてよい。

さらに、予測システム内に設けられた１台以上の計算機上で、いわゆる仮想計算機を提供するためのソフトウェア（一般的にハイパーバイザと呼ばれる）を実行させてもよい。この場合、計算機上には、各サーバ１１０，１２０，１３０，１４０の役割を果たす仮想計算機を定義することによって、情報処理システムが構成されてもよい。

図２は、各種サーバの物理的な構成図である。各種サーバとは、図１で示したフロントサーバ１１０と、予測モデル利用サーバ１２０と、予測モデル生成サーバ１３０と、データ管理サーバ１４０と、クライアント端末１０１と、管理端末１０２である。

本実施形態では、これらのサーバ（または端末）には、プロセッサ（以下、ＣＰＵ）２０１と、メモリ２０２と、補助記憶装置２０３と、通信インターフェース（通信Ｉ／Ｆ）２０４とを有する計算機２００が用いられる。この計算機２００は、一例として、パーソナルコンピュータ（ＰＣ）等の汎用的な計算機でよい。

ＣＰＵ２０１は、メモリ２０２に格納されたプログラムを実行する。ＣＰＵ２０１の数は、１以上でもよい。計算機２００は、複数のＣＰＵ２０１を有してもよい。さらに、ＣＰＵ２０１は、複数のプロセッサコアを有する、いわゆるマルチコアプロセッサであってもよい。メモリ２０２は、不揮発性の記憶素子であるＲＯＭ（Read Only Memory）及び揮発性の記憶素子であるＲＡＭ（Random Access Memory）を含む。ＲＯＭは、不変のプログラム（例えば、ＢＩＯＳ）などを格納する。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶素子であり、プロセッサ２０１が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。

補助記憶装置２０３は、例えば、磁気記憶装置（ＨＤＤ）、フラッシュメモリ（ＳＳＤ）等の大容量かつ不揮発性の記憶装置である。補助記憶装置２０３は、ＣＰＵ２０１が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置２０３から読み出された後、メモリ２０２にロードされ、ＣＰＵ２０１によって実行される。通信インターフェース２０４は、所定のプロトコルに従って、他の装置との通信を制御するネットワークインターフェース装置である。

計算機２００は、入力インターフェース（入力Ｉ／Ｆ）２０５と、出力インターフェース（出力Ｉ／Ｆ）２０８とを有してもよい。入力インターフェース２０５には、キーボード２０６やマウス２０７などが接続される。入力インターフェース２０５は、オペレータからの入力を受けるインターフェースである。出力インターフェース２０８には、ディスプレイ装置２０９や図示しないプリンタなどが接続される。出力インターフェース２０８は、プログラムの実行結果をオペレータが視認可能な形式で出力するインターフェースである。

尚、本実施形態では、フロントサーバ１１０、予測モデル利用サーバ１２０、予測モデル生成サーバ１３０、及びデータ管理サーバ１４０の各々が有する各機能部は、ソフトウェア（プログラム）によって実装される。例えば、予測モデル利用サーバ１２０では、入出力部１２１と、モデル取得部１２２と、予測値算出部１２３として機能させるためのプログラムが、メモリ２０２上にロードされ、ロードされたプログラムがＣＰＵ２０１によって実行される。これにより、予測モデル利用サーバ１２０は、入出力部１２１と、モデル取得部１２２と、予測値算出部１２３とを有する装置として動作する。

以下では、予測モデル利用サーバ１２０と、予測モデル生成サーバ１３０とで実行される処理を説明する際に、入出力部１２１と、モデル取得部１２２と、予測値算出部１２３等の機能部を主語とした説明を行う。しかし、実際には、それは機能部を有する計算機２００のＣＰＵ２０１が処理を行うことを意味する。

さらに、ＣＰＵ２０１が実行するプログラムは、計算機２００が読み取り可能な記憶メディアまたはネットワークを介して計算機２００に提供され、非一時的記憶媒体である補助記憶装置２０３に格納される。計算機２００が読み取り可能な記憶メディアとは、非一時的なコンピュータ可読媒体で、たとえばＣＤ−ＲＯＭやフラッシュメモリなどの、不揮発性のリムーバブルメディアである。このため、計算機２００は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。

尚、各機能部の一部またはすべては、ＦＰＧＡ（Field-Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェアを用いて実装されてもよい。

図３は、予測モデル管理記憶部のテーブルの構成図である。

本実施例では、予測モデル管理記憶部１４１が、メモリ２０２や補助記憶装置２０３の記憶領域上に形成されたテーブル３００に、各種情報を記憶させる例を説明する。

予測モデル管理記憶部１４１のテーブル３００は、学習用データから学習した予測モデルと、予測モデルの更新の履歴とをグループ毎に管理するためのテーブルである。ここで、グループとは、例えば、企業Ａというグループなどであり、グループの中に、複数の利用者がいる。つまり、グループという複数の利用者が共通で利用する予測モデルを管理することができる。

予測モデル管理記憶部１４１のテーブル３００は、項目値（またはカラム値。以下同じ）として、グループ３０１、モデル３０２、及び、生成日時３０３を有してよい。

グループ３０１は、複数の利用者をまとめたグループを一意に識別する名称である。

モデル３０２は、予測モデルを一意に識別する名称である。

生成日時３０３は、モデル３０２に格納されている予測モデルを生成した日時である。

本実施形態では、グループ３０１が１つだけである場合について説明した。しかし、グループ３０１は、サブグループなど、さらに小さな複数の階層的なグループを有してもよい。また、予測モデルは、複数のグループ３０１に属してもよい。この場合は、モデル３０２に対して、グループ３０１の値が複数存在することになる。

図４は、学習用データ管理記憶部のテーブルの構成図である。

本実施例では、学習用データ管理記憶部１４２が、メモリ２０２や補助記憶装置２０３の記憶領域上に形成されたテーブル４００に、各種情報を記憶させる例を説明する。

学習用データ管理記憶部１４２のテーブル４００は、予測モデルを生成するための基となる学習用データを管理するためのテーブルである。

学習用データ管理記憶部１４２のテーブル４００は、項目値として、グループ４０１、学習データセット４０２、元学習データセット４０３、評価履歴４０４、及び、モデル４０５を有してよい。

グループ４０１は、予測モデル管理記憶部１４１のグループ３０１と同様に、複数の利用者をまとめたグループを一意に識別する名称である。

学習データセット４０２は、予測モデルを生成するための学習用データセットである。ここで、学習用データセットとは、目的となる売り上げ等の実績を表す目的データと、目的の要因となる商品情報などの要因データの２種類がある。本実施形態では、これら目的データ及び要因データは、ｚｉｐ形式のデータである。しかし、目的データ及び要因データそれぞれは、ｃｓｖ形式のファイルでもよいし、これらｃｓｖ形式のファイルがさらに複数存在する場合、ファイルが格納されているフォルダのパスやＵＲＬなど、学習用データセットの所在が分かる情報でもよい。

元学習用データセット４０３は、学習用データセット４０２を生成する際の基となる学習用データセットである。

評価履歴ＩＤ４０４は、学習用データセット４０２を生成する際の基となる、利用者の評価結果の履歴を表すＩＤである。利用者の評価結果の履歴を格納するテーブル５００は、評価履歴管理記憶部１４３のテーブルであり、詳細は図５において後述する。

モデル４０５は、学習用データセットから生成した予測モデルの名称である。モデル４０５における予測モデルは、予測モデル管理記憶部１４１のモデル３０２における予測モデルと同一のものである。

図５は、評価履歴管理記憶部１４３のテーブルの構成図である。

本実施例では、評価履歴管理記憶部１４３が、メモリ２０２や補助記憶装置２０３の記憶領域上に形成されたテーブル５００に、各種情報を記憶させる例を説明する。

評価履歴管理記憶部１４３のテーブル５００は、利用者が利用した予測モデルの評価結果に関する情報を管理するためのテーブルである。

評価履歴管理記憶部１４３のテーブル５００は、項目値として、評価履歴ＩＤ５０１、グループ５０２、ユーザ５０３、利用モデル５０４、評価日時５０５、結果５０６、及び、対象データレコードのキー値５０７を有してよい。

評価履歴ＩＤ５０１は、利用者が予測モデルを利用した際の評価結果を一意に識別するＩＤである。グループ５０２は、利用者が所属するグループである。ユーザ５０３は、利用者を一意に識別する名称である。利用モデル５０４は、利用者が利用した予測モデルを一意に識別する名称である。評価日時５０５は、利用者が評価結果を登録した日時である。結果５０６は、利用者が利用モデルを利用した際の評価結果である。ここでは、評価結果は、利用者の好みに合っている場合には「良」の一例としての「Ｌｉｋｅ」、好みと乖離がある場合には「不良」の一例としての「Ｕｎｌｉｋｅ」を登録してよい。評価の方法は、「Ｌｉｋｅ」「Ｕｎｌｉｋｅ」の２段階評価だけではなく、５段階評価や、予測結果の中の特定の項目のみが良い（Ｌｉｋｅ）と登録してもよい。

対象データレコードのキー値５０７は、利用者が評価した予測結果に該当する学習用データセット内のデータレコードを一意に識別する値である。

ここで、予測モデルにより出力される予測結果は、学習用データセットの目的の要因となる情報の１レコードと対応させることができる。例えば、ＥＣサイトのレコメンドシステムでは、予測モデルを利用して、利用者情報に基づいて、要因データの中からお勧めする商品情報を複数提示する。利用者は、提示された商品情報から良いものを選択すると、選択された商品情報は、要因データの中の１レコードに相当することになる。

図６は、予測モデル生成処理を示すシーケンス図である。

まず、利用者は、クライアント端末１０１を操作して、フロントサーバ１１０にログインを行う（Ｓ６０１）。この際、利用者は、グループ、ユーザ及びを登録する。フロントサーバ１１０におけるリクエスト受付部１１１は、利用者がログイン認証すると、利用者が操作する操作画面であって利用者のリクエストを受け付けるリクエスト受付画面を生成する（Ｓ６０２）。表示部１１２は、生成したリクエスト受付画面をクライアント端末１０１上に表示する（Ｓ６０３）。利用者は、クライアント端末１０１を操作して、予測モデルを利用するための利用データを生成し（Ｓ６０４）、利用する予測モデルを選択して（Ｓ６０５）、予測リクエスト（Ｓ６０６）をフロントサーバ１１０に要求する。

フロントサーバ１１０におけるリクエスト受付部１１１は、予測リクエストを予測モデル利用サーバ１２０に転送する。予測モデルサーバ１２０におけるモデル取得部１２２は、転送された予測リクエストを受け付けると、予測モデル管理記憶部１４１から利用者が選択した利用モデルを取得する（Ｓ６０７）。予測値算出部１２３は、取得した予測モデルに利用データを入力して予測値を算出する（Ｓ６０８）。予測値算出部１２３は、予測結果としての予測値をフロントサーバ１１０に返却する。フロントサーバ１１０における表示部１１２は、予測値に基づいて、予測結果を示す予測結果画面を生成し（Ｓ６０９）、予測結果画面をクライアント端末１０１に表示する（Ｓ６１０）。

利用者は、好みに応じて予測結果の修正の要求が必要か否かを判断する（Ｓ６１１）。Ｓ６１１の判断が肯定的であった場合（Ｓ６１１：Ｙｅｓ）、クライアント端末１０１の予測結果画面上にある予測結果の評価ボタンを押下するなどして、予測結果に対する利用者の評価結果を入力する（Ｓ６１２）。評価結果の入力後に、利用者は、再評価ボタンなどを押下して、評価結果通知リクエスト（Ｓ６１３）をフロントサーバ１１０に送信する。フロントサーバ１１０におけるリクエスト受付部１１１は、評価結果通知リクエストを受け付けると、予測モデル利用サーバ１２０に転送する。予測モデル利用サーバ１２０における入出力部１２１は、評価履歴管理記憶部１４３に評価結果を格納すると共に（Ｓ６１４）、予測モデルの修正リクエスト（Ｓ６１５）を予測モデル生成サーバ１３０に送信する。

予測モデル生成サーバ１３０における学習用データ修正部１３２は、修正リクエストの送信者である利用者のグループと、利用していた予測モデルと、評価履歴とに基づいて、学習用データを修正する学習用データ修正処理を実行する（Ｓ６１６）。予測モデル生成部１３３は、修正した学習用データを入力として利用者毎の予測モデルを再生成する予測モデル生成処理を実行する（Ｓ６１７）。そして、予測モデル生成部１３３は、予測モデル利用サーバ１２０に処理の完了を通知（Ｓ６１８）する。予測モデル利用サーバ１２０におけるモデル取得部１２２が利用モデルを取得し、予測値算出部１２３が再び利用データを修正された予測モデルに入力して予測値を算出する（Ｓ６０７，６０８）。そして、フロントサーバ１１０を経由して表示部１１２がクライアント端末１０１に予測結果画面を表示する（Ｓ６０９，６１０）。これらのステップ（Ｓ６０７〜Ｓ６１８）を利用者が満足するまで繰り返すことによって、利用者の好みに合った学習用データセット及び予測モデルが生成され、予測モデルの修正を終了する（Ｓ６２０）。

上記実施形態では、予測モデル生成部１３３は、評価結果通知リクエスト（Ｓ６１３）がフロントサーバ１１０に送信されたタイミングで、評価履歴に基づいて予測モデルを再生成していた。しかし、予測モデル生成部１３３は、ある程度の量の予測評価履歴を評価結果格納部１３４に溜めておき、１日一回バッチ的に予測モデル生成サーバ１３０に修正リクエスト（Ｓ６１５）を送信して、予測モデルを再生成してもよい。この場合、利用者のクライアント端末１０１には、フロントサーバ１１０におけるリクエスト受付部１１１が評価結果通知リクエスト（Ｓ６１３）を受け付け、予測モデル利用サーバ１２０における入出力部１２１が予測結果を格納（Ｓ６１４）後、直ぐに、受付完了等の返信が返される。

図７は、学習用データ修正処理を示すフローチャートである。

学習用データ修正部１３２は、グループと、予測モデルと、評価履歴とから構成される修正リクエスト（Ｓ６１５）を受け取ると、まず、予測モデルの学習用データセットを学習用データ管理記憶部１４２から取得する（Ｓ７０１）。

次に、学習用データ修正部１３２は、評価履歴管理記憶部１４３から、利用した予測モデルの全ての評価結果を評価履歴として取得する（Ｓ７０２）。ここで、学習用データ修正部１３２は、予測モデル以外に、予測モデルの基となる予測モデルなど、同系列の予測モデルに関する評価結果を取得してもよい。つまり、学習用データ修正部１３２は、過去の履歴をさかのぼって評価結果を取得してもよい。

学習用データ修正部１３２は、評価履歴に含まれる評価結果が１００件以上であるか否かを判定する（Ｓ７０３）。Ｓ７０３の判定結果が真の場合（Ｓ７０３：ＹＥＳ）、Ｓ７０４に進み、Ｓ７０３の判定結果が偽の場合（Ｓ７０３：ＮＯ）、Ｓ７０６に進む。

（Ｓ７０４）学習用データ修正部１３２は、取得した評価履歴の中から、利用者の好みを反映している項目値を、対象データレコードのキー値に基づいて学習用データセットの中から抽出する。例えば、対象データレコードのキー値のデータを取得し、データを項目別にクラスタリングなどにより分類し、分類した中で同一クラスタに属しているデータが多い場合、利用者の好みを反映している項目値と当該項目値の範囲等を選定する。これらを、ＬｉｋｅとＵｎｌｉｋｅとの２パターンで行うことによって、好みの項目値及びその項目値の範囲と、好みではない項目値及びその項目値の範囲とを抽出する。

次に、学習用データ修正部１３２は、抽出した項目値およびその項目値の範囲に該当するデータレコードを学習用データセットから抽出する。学習用データ修正部１３２は、抽出したデータレコードに対して、パラメータの変更や、データレコードそのものを削除するなどの、修正を行う（Ｓ７０５）。

最後に、学習用データ修正部１３２は、修正した学習用データセットを学習用データ管理記憶部１４２に格納して（Ｓ７０６）、終了する。

図８は、予測モデル生成処理を示すフローチャートである。

予測モデル生成部１３３は、まず学習用データセットを学習用データ管理記憶部１４２から取得する（Ｓ８０１）。予測モデル生成部１３３は、取得した学習用データセットに基づいて予測モデルを生成する（Ｓ８０２）。ここで、予測モデルの生成方法は、重回帰分析や決定木分析、集団学習法であるランダムフォレスト、またはニューラルネットワークを用いた手法などでよい。予測モデル生成部１３３は、生成した予測モデルを予測モデル管理記憶部１４１及び学習用データ管理記憶部１４２に格納して（Ｓ８０３）、終了する。

図９は、表示部の表示画面の説明図である。

表示部１１２の表示画面９００は、利用者が、利用データを登録し、利用する予測モデルを選定し、予測結果を確認および評価するための画面である。本実施例では、予測システムが、銀行における企業間のビジネスマッチングに利用された例である。さらに、本実施例では、フロントサーバ１１０が、この表示画面９００を作成し、作成した表示画面９００をクライアント端末１１０に提供する（クライアント端末１０１のディスプレイ装置２０９に表示させる）例を説明する。ただし、フロントサーバ１１０以外の計算機が、この設定画面９００を作成してもよい。

図９において、符号９０１は、利用者が選定した利用データが入力される利用データ入力ボックスである。符号９０２は、利用者が選定した利用モデルが入力される利用モデル入力ボックスである。符号９０３は、利用データを予測モデルに入力して予測結果を算出する予測処理（図６におけるＳ６０８）の実行を開始させる予測開始ボタンである。符号９０４は、データレコード毎の予測結果を表示する予測結果表示欄である。符号９０５は、再評価を要求する再評価要求ボタンである。符号９０６は、各種リクエスト及び処理を終了させる終了ボタンである。

予測結果表示欄９０４は、項目値として、ランク、スコア、予測結果キー、所在値、Ａ出荷量、及び、評価を有してよい。ランク、スコア、予測結果キー、所在値、及び、Ａ出荷量は、「予測結果」の一例である。ランクは、全データレコード内の順位である。スコアは、企業間のビジネスマッチ度である。予測結果キーは、算出された予測結果を一意に識別する値である。尚、ランク及びスコアは、前回値も表示してよい。予測結果キーは、表示されなくてもよい。

利用者が利用データ入力ボックス９０１及び利用モデル入力ボックス９０２それぞれを入力して、予測開始ボタン９０３を押下することによって、フロントサーバ１１０を経由して予測モデル利用サーバ１２０に処理が要求される。予測モデル利用サーバ１２０は、予測値を算出し、その予測値を予測結果として予測結果表示欄９０４にスコア順に表示する画面を作成し、クライアント端末１０１に表示させる。

利用者は、予測結果表示欄９０４に表示される各予測結果を確認して、各予測結果が利用者の好みに合っているかどうかを項目値などを参照しながら評価し、その評価結果を評価欄にＬｉｋｅもしくはＵｎｌｉｋｅとして入力する。利用者は、各予測結果の評価後、再評価ボタン９０５を押下すると、評価結果通知リクエスト（Ｓ６１３）がフロントサーバ１１０を経由して、予測モデル利用サーバ１２０及び予測モデル生成サーバ１３０に送信される。これにより、予測モデルが再生成され、新たな予測結果が予測結果表示欄９０４に表示される。そして、利用者は、再び予測結果表示欄９０４の予測結果に対する評価結果を評価欄に入力して、再評価ボタン９０５を押下して、予測モデルを再生成することを繰り返すことによって、利用者の好みに合った予測モデルが生成される。これにより、予測結果表示欄９０４には、利用者の好みに合った予測モデルによる予測結果が表示されるようになる。

本実施例に係る予測システムは、前述した機能を備えている。これにより、予測システムは、特定の学習用データを用意する必要がなく、一般的な汎用データや他の利用者から収集した特定のデータなどのあらゆる学習用データを入力として、利用者の好みに合った特化した予測モデルを生成することができる。

さらに、利用者の好みを徐々に予測モデルに反映できるため、利用者の好みが変化しても、その都度、利用者の好みを反映させることができる。これにより、利用者の好みの反映に特別なカスタマイズが不要となり、予測システムの提供者は、多数の利用者に適切な予測モデルを容易に提供することができる。

さらに、予測システムは、学習用データを格納する学習用データ管理記憶部と、予測モデルを格納する予測モデル管理記憶部と、利用者に応じた予測モデルを予測モデル記憶部から選択する予測モデル取得部と、を更に有する。これにより、学習用データ及び予測モデルを管理し易い。

さらに、評価結果は、良または不良の何れかであり、学習用データ修正部１３２は、利用者の好みに合う項目値及び当該項目値の範囲を抽出する。これにより、利用者の好みに基づいて予測モデルを生成することができる。

さらに、学習用データ修正部１３２は、利用者の好みに合う項目値及びその項目値の範囲をクラスタリングによって抽出する。これにより、予測モデルを容易に生成することができる。

上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。

クライアント端末１０１は、複数のユーザが所属する複数グループによってクラウド上で共同利用されてよい。即ち、利用者は、複数の利用者が所属するグループ単位でよい。この場合、表示部１１２には、複数の利用者の評価結果が入力されてもよい。これにより、評価結果の汎用性を高めることができる。

１１２：表示部、１２２：モデル取得部、１２３：予測値算出部、１３２：学習用データ修正部、１３３：予測モデル生成部、１４１：予測モデル管理記憶部、１４２：学習用データ管理記憶部、１４３：評価履歴管理記憶部、５０３：ユーザ

Claims

予測モデルを再生成する予測システムであって、
利用者毎の利用データを前記予測モデルに入力して予測結果を算出する算出部と、
前記予測結果を前記利用者に表示し、表示した予測結果に対する前記利用者の評価が入力される表示部と、
前記評価に基づいて前記学習用データを修正する学習用データ修正部と、
前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成する予測モデル生成部と、
を有する、
予測システム。
前記学習用データ修正部は、
前記評価に影響を与える項目値及び当該項目値の範囲を抽出し、抽出した項目値及び当該項目値の範囲に対応する前記学習用データを修正する、
請求項１に記載の予測システム。
複数の前記評価を評価履歴として格納する評価履歴管理記憶部を更に有する、
請求項１に記載の予測システム。
前記学習用データを格納する学習用データ管理記憶部と、
前記予測モデルを格納する予測モデル管理記憶部と、
前記利用者に応じた前記予測モデルを前記予測モデル管理記憶部から選択する予測モデル取得部と、
を更に有する、
請求項２に記載の予測システム。
前記評価は、良または不良のいずれかであり、
前記学習用データ修正部は、
前記利用者の好みに合う項目値及び当該項目値の範囲を抽出する、
請求項２に記載の予測システム。
前記学習用データ修正部は、
前記利用者の好みに合う項目値及び当該項目値の範囲をクラスタリングによって抽出する、
請求項５に記載の予測システム。
前記学習用データ修正部は、
前記評価が前記利用者の好みに合う場合、抽出した項目値及び当該項目値の範囲に対応する前記学習用データのパラメータを変更する、
請求項２に記載の予測システム。
前記利用者は、複数のユーザが所属するグループである、
請求項２に記載の予測システム。
前記予測結果は、企業間のビジネスマッチ度を示すスコアを含む、
請求項２に記載の予測システム。
前記予測結果は、所在地及び出荷量を含む、
請求項９に記載の予測システム。
予測モデルを再生成する予測方法であって、
利用者毎の利用データを前記予測モデルに入力して予測結果を算出し、
前記予測結果を前記利用者に表示し、表示した予測結果に対する前記利用者の評価が入力され、
前記評価に基づいて前記学習用データを修正し、
前記修正した学習用データを入力として前記利用者毎の前記予測モデルを再生成し、
前記再生成した予測モデルに前記利用者毎の利用データを入力して予測結果を算出する、
予測方法。