WO2023149120A1

WO2023149120A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2023149120A1
Application number: PCT/JP2022/047415
Authority: WO
Inventors: 紘士飯田; 寛人山本; 正典宮原; 裕士堀口
Original assignee: ソニーグループ株式会社
Priority date: 2022-02-07
Filing date: 2022-12-22
Publication date: 2023-08-10

Abstract

学習時における入力データに基づいて生成された複数の予測モデルを用いて本番環境における入力データに基づいて予測モデルごとの複数の予測結果を得る予測部と、判別モデルを用いて、複数の予測結果から本番環境であるか否かを判別する判別部とを備える情報処理装置である。

Description

情報処理装置、情報処理方法およびプログラム

　本技術は、情報処理装置、情報処理方法およびプログラムに関する。

　近年、小売業、製造業、人材採用や育成等の様々な分野において、機械学習を活用して予測（推論）を行うシステムが導入され始めている。こうした情報処理システムにおいては、実際の運用を通じて継続的に予測の精度を維持することが求められる。

　予測（推論）の精度を維持する手法として、推論を行う複数の推論部を用意し、推論精度の低下が検出された場合に推論部を切り替える技術が提案されている（特許文献１）

特開２０２１－１１７７０６号公報

　しかし、特許文献１の技術は予測（推論）のための入力データに正解が存在することが前提となっており、正解がない入力データに対しては予測を行うことができないという問題がある。また、予測モデルを用いて予測を行う場合、予測モデルを生成する学習時と予測を行う本番環境があるが、入力データに正解がない本番環境においては予測モデルが正しい予測結果を出力していることを保証するのが難しいという問題がある。

　本技術はこのような問題点に鑑みなされたものであり、正解がない入力データに基づいても正しい予測結果を出力する予測モデルを生成する情報処理装置、情報処理方法およびプログラムを提供することを目的とする。

　上述した課題を解決するために、第１の技術は、学習時における入力データに基づいて生成された複数の予測モデルを用いて、学習時よりも後である本番環境における入力データに基づいて予測モデルごとの複数の予測結果を得る予測部と、判別モデルを用いて、複数の予測結果から本番環境であるか否かを判別する判別部とを備える情報処理装置である。

　また、第２の技術は、学習時における入力データに基づいて生成された複数の予測モデルを用いて、学習時よりも後である本番環境における入力データに基づいて予測モデルごとの複数の予測結果を取得し、判別モデルを用いて、複数の予測結果から本番環境であるか否かを判別する情報処理方法である。

　さらに、第３の技術は、学習時における入力データに基づいて生成された複数の予測モデルを用いて、学習時よりも後である本番環境における入力データに基づいて予測モデルごとの複数の予測結果を取得し、判別モデルを用いて、複数の予測結果から本番環境であるか否かを判別する情報処理方法をコンピュータに実行させるプログラムである。

情報処理装置１００の構成を示すブロック図である。学習時データと本番環境データの説明図である。予測部１１０の構成を示すブロック図である。判別部１２０の構成を示すブロック図である。情報処理装置１００の全体処理を示すフローチャートである。予測部１１０による処理を示すフローチャートである。入力データの分割の説明図である。ＣＶ（Cross Validation）の説明図である。判別部１２０による処理を示すフローチャートである。データ結合部１２１によるデータの結合の説明図である。判別結果処理部１３０による処理を示すフローチャートである。本番環境ではないと判別された行の項目（列）を変化させる処理の説明図である。ユーザインターフェースの例を示す図である。

　以下、本技術の実施の形態について図面を参照しながら説明する。なお、説明は以下の順序で行う。
＜１．実施の形態＞
［１－１．情報処理装置１００の構成］
［１－２．情報処理装置１００における処理］
［１－２－１．全体処理］
［１－２－２．予測部１１０による処理］
［１－２－３．判別部１２０による処理］
［１－２－４．判別結果処理部１３０による処理］
＜２．ユーザインターフェース＞
＜３．具体的使用例＞
＜４．変形例＞

＜１．実施の形態＞
［１－１．情報処理装置１００の構成］
　図１を参照して本技術における情報処理装置１００の構成について説明する。情報処理装置１００は予測部１１０、判別部１２０、判別結果処理部１３０により構成されている。

　情報処理装置１００は、複数の予測モデルを生成し、その複数の予測モデルの中から予測サービスで使用するモデルを選択する。

　予測サービスとは、入力データがあれば、ユーザが数クリックの簡単な入力操作を行うだけで高度な予測分析を自動的に実行して予測結果をユーザに提供するサービスである。予測分析とは、統計アルゴリズムや機械学習を用いて過去の実績から将来の結果を予測するデータ分析手法の１つある。予測サービスは例えば既存ビジネスの効率化や新規ビジネスの創出などの用途において有用である。なお、予測サービスはソフトウェアやアプリケーションとして提供されてもよいし、インターネットブラウザ上のサービスやクラウドサービスとして提供されてもよい。

　本実施の形態では、情報処理装置１００と予測サービスは、複数の保険契約者（以下、契約者と称する）が契約を解約するか否かを予測するものとして説明を行う。

　情報処理装置１００による処理には学習時における処理と、本番環境における処理がある。学習時とは本番環境より前であり、学習時の入力データである学習時データに基づいて予測モデルと判別モデルを生成する段階である。本番環境とは学習時の後であり、本番環境の入力データである本番環境データを学習時に生成された予測モデルに入力することにより予測を行う段階である。

　入力データには学習時における学習時データと、本番環境における本番環境データがある。本実施の形態では、学習時データと本番環境データは行と列により構成されるＣＳＶ（Comma-Separated values）ファイルであるとする。

　ＣＳＶファイルである入力データは図２に示すように、行ＩＤで区別される各行をそれぞれ契約者とし、各列に契約者に関する各種情報である項目が対応した、複数の行と列からなるデータである。なお、図２に示す入力データの各項目（列）はあくまで一例であり、その他にも、契約者ＩＤ、年齢、契約時期、性別、顧客ランクなど、契約者に関連する情報であればどのようなものを各項目（列）として入力データに含めてもよい。学習時データは図２Ａに示すような、正解（契約を解約したか否か）付きの過去のデータが蓄積されたＣＳＶファイルであり、本番環境データは予測サービスを使用するクライアントなどから提供され、図２Ｂに示すように正解のないＣＳＶファイルである。

　予測部１１０は、学習時データに基づいて予測モデルを生成する。また、予測部１１０は学習時データを予測モデルに入力して学習時の予測結果を取得し、さらに、本番環境データを予測モデルに入力して本番環境の予測結果を得る。本実施の形態では、契約者が契約を解約したか否かという正解が蓄積された過去のデータを学習時データとし、予測部１１０は、正解のない本番環境データに基づいて、将来保険契約者が契約を解約するか否かを予測する。

　判別部１２０は、予測部１１０が取得した学習時の予測結果と本番環境の予測結果から本番環境であるか否かを判別する判別モデルを生成し、その判別モデルを用いて本番環境であるか否かを判別する。複数の予測モデルには、学習時データと本番環境データの差違の影響を受けない、または受けても影響が小さい頑健な予測モデルと、影響を大きく受ける頑健ではないモデルがあると想定される。そこで、生成した予測モデルのそれぞれの予測結果から本番環境であるかどうかを判別する判別モデルを生成することで、複数の予測モデルの中から学習時データと本番環境データの差違に対して頑健な予測モデルを特定する。頑健な予測モデルとは学習時データと本番環境データの差違の影響を受けて予測結果が変化してしまうことがない予測モデル、すわなち、学習時データと本番環境データの差違の影響を受けずに予測結果を得ることができる予測モデルである。本技術では、複数の予測モデルの各予測結果から直接、本番環境であるか否かを判別する判別モデルを生成する。

　判別結果処理部１３０は、判別部１２０による判別結果に基づいて、予め生成されている複数の予測モデルのうちのいずれかを予測サービスで使用する予測モデルとして選択する。また、判別結果処理部１３０は判別結果によっては対応処理を行う。

　次に予測部１１０の構成について説明する。図３に示すように予測部１１０は、データ分割部１１１、予測モデル生成部１１２、予測結果出力部１１３により構成されている。

　データ分割部１１１は、入力データを学習用データと評価用データに分割して、学習用データを予測モデル生成部１１２に出力し、評価用データを予測結果出力部１１３に出力する。学習用データとは予測モデルを生成するためのデータであり、評価用データとは生成された予測モデルを評価するためのデータである。

　予測モデル生成部１１２は、学習用データの各行を参照して契約者が契約を解約したか否かの正解を教師データとして二値分類の学習を行うことにより契約者が契約を解約するか否かを予測する予測モデルを生成する。

　予測結果出力部１１３は、予測モデル生成部１１２が生成した予測モデルに対して評価用データ（入力データのうち、予測モデルの生成には使用していないデータ）を入力することにより、評価用データの各行に対して予測を行い、評価用データの行に予測結果としての契約者が契約を解約する確率（以下、解約予測確率と称する場合がある）を対応付ける。

　予測部１１０は本番環境の前の学習時において複数の学習時データに基づいて複数（ｎ個）の予測モデルを生成するものとする。

　また、予測部１１０は本番環境においては入力された本番環境データに基づいて予測を行い、予測結果としての解約予測確率を対応付ける。なお、本番環境において予測部１１０は予測モデルを生成する必要はない。

　次に判別部１２０の構成について説明する。図４に示すように判別部１２０はデータ結合部１２１、データ分割部１２２、判別モデル生成部１２３、判別結果出力部１２４により構成されている。

　データ結合部１２１は、予測部１１０により各行に対して複数の予測結果が対応付けられた学習時データと、予測部１１０により各行に対して複数の予測結果が対応付けられた本番環境データと、本番環境であることを示す識別情報である本番環境フラグを結合する。本番環境フラグは本番環境であるか否か示す正解データであるといえる。以下、その結合されたデータを結合データと称する場合がある。

　データ分割部１２２は、結合データを行単位で分割することにより学習用データと評価用データに分割して、学習用データを判別モデル生成部１２３に出力し、評価用データを判別結果出力部１２４に出力する。学習用データとは判別モデルを生成するためのデータであり、評価用データとは判別モデルを評価するためのデータである。

　判別モデル生成部１２３は、学習用データに基づいて、本番環境フラグを教師データとして二値分類を学習することで本番環境フラグを見分ける、すなわち、本番環境であるか否かを判別する判別モデルを生成する。

　判別結果出力部１２４は、判別モデル生成部１２３が生成した判別モデルに対して評価用データ（本番環境データのうち、判別モデルの生成には使用していないデータ）を入力することにより、評価用データの各行に対して判別結果である、本番環境であるか否かの確率（本番環境確率）を算出して、評価用データの行に判別結果（本番環境確率）を対応付ける。判別結果は０～１の間の確率値である本番環境確率という形で算出される。本番環境確率が所定の閾値以上である場合、本番環境であると判別することができる。

　情報処理装置１００は以上のようにして構成されている。情報処理装置１００は、パーソナルコンピュータ、スマートフォン、タブレット端末、サーバ装置、クラウドサーバなどの電子機器において動作する。それらの電子機器が予め情報処理装置１００としての機能を備えていてもよいし、コンピュータとしての機能を備えるそれらの電子機器においてプログラムを実行することにより情報処理装置１００および本技術の方法が実現されてもよい。そのプログラムは予めそれらの電子機器にインストールされていてもよいし、ダウンロード、記憶媒体などで配布されて、ユーザなどがインストールするようにしてもよい。また、情報処理装置１００は単体の装置として構成されてもよい。

　また、情報処理装置１００は予測サービスを実行する各種機器（パーソナルコンピュータ、スマートフォン、タブレット端末、サーバ装置、クラウドサーバなど）と同一の機器で動作してもよいし、異なる機器において動作してもよい。異なる機器で動作する場合、情報処理装置１００と予測サービスを実行する機器はネットワーク（有線無線を問わない）で接続され、情報処理装置１００は生成した予測モデルや予測サービスで使用する予測モデルを特定する情報などをその機器に出力する必要がある。

［１－２．情報処理装置１００における処理］
［１－２－１．全体処理］
　次に図５を参照して情報処理装置１００における処理について説明する。まず情報処理装置１００による全体処理について説明する。

　まずステップＳ１０１で、予測部１１０が学習時データに基づいて予測モデルを生成するともに、生成した予測モデルに学習時データを入力することで学習時の予測結果を得る。

　なお、次のステップＳ１０２を行う前に、複数の学習時データに基づいて、このステップＳ１０１の予測部１１０による処理を複数回行って複数の予測モデルを生成しておく。

　次にステップＳ１０２で、ステップＳ１０１で生成した複数の予測モデルに本番環境データを入力することにより予測部１１０が本番環境の予測結果を得る。

　次にステップＳ１０３で、判別部１２０が学習時の予測結果と本番環境の予測結果に基づいて判別モデルを生成するとともに、生成した判別モデルを用いて、本番環境であるか否かを判別する。

　そしてステップＳ１０４で、判別結果処理部１３０が判別部１２０の判別結果に基づいて所定の処理を行う。

　以上のようにして情報処理装置１００の全体処理が行われる。

［１－２－２．予測部１１０による処理］
　次に図６のフローチャートを参照して、上述のステップＳ１０２の予測部１１０による処理について説明する。

　まずステップＳ２０１で、データ分割部１１１は学習時データを学習用データと評価用データに分割する。上述したように学習時データは正解付きの行と列を持つＣＳＶファイルであり、データ分割部１１１は、図７に示すようにそのＣＳＶファイルを行単位で分割することにより学習時データを学習用データと評価用データに分割する。データ分割部１１１は学習用データを予測モデル生成部１１２に出力し、評価用データを予測結果出力部１１３に出力する。

　次にステップＳ２０２で、予測モデル生成部１１２は、学習用データの各行を参照して契約者が契約を解約したか否かの正解を教師データとして二値分類の学習を行うことにより契約者が契約を解約するか否かを予測する予測モデルを生成する。

　次にステップＳ２０３で、予測結果出力部１１３は、生成された予測モデルに対して評価用データ（学習時データのうち予測モデルの生成には使用していないデータ）を入力して、評価用データである行に対して予測モデルで予測を行う。これにより、図７に示すように評価用データである行に対して予測結果としての解約予測確率を対応付ける。

　なお、学習時データを学習用データと評価用データに分割して学習時データの各行に予測結果を対応付ける際にＣＶ（Cross Validation）を行うことにより、学習データの全ての行に対して予測結果を対応付けることができる。一方、ＣＶを行わない場合には評価用データとした行のみに予測結果を対応付けることができる。

　ここでＣＶについて説明する。まず、図８Ａに示すように、学習時データの各行をグループ分けするためのグループＩＤを各行に対応付ける。ここでは一例としてグループを３つとし、グループＩＤを１～３の値で定義する。ただし、グループは特定の個数に限定されるものではない。

　そして同一の学習時データに対する予測部１１０の１回目の処理においては、グループＩＤ１の行（グループＩＤ１の行が複数ある場合にはそれら複数の行）を評価用データとし、グループＩＤ２およびグループＩＤ３の行は学習用データとする。これにより、まず学習用データであるグループＩＤ２およびグループＩＤ３の行に基づいて予測モデルを生成し、生成された予測モデルに評価用データであるグループＩＤ１の行を入力することにより、グループＩＤ１の行に予測結果（解約予測確率）を対応付けることができる。

　次に、予測部１１０の２回目の処理においては、グループＩＤ２の行（グループＩＤ２の行が複数ある場合にはそれら複数の行）を評価用データとし、グループＩＤ１およびグループＩＤ３の行は学習用データとする。これにより、まず学習用データであるグループＩＤ１およびグループＩＤ３の行に基づいて予測モデルを生成し、生成された予測モデルに評価用データであるグループＩＤ２の行を入力することにより、グループＩＤ２の行に予測結果（解約予測確率）を対応付けることができる。

　次に、予測部１１０の３回目の処理においては、グループＩＤ３の行（グループＩＤ３の行が複数ある場合にはそれら複数の行）を評価用データとし、グループＩＤ１およびグループＩＤ２の行は学習用データとする。これにより、まず学習用データであるグループＩＤ１およびグループＩＤ２の行に基づいて予測モデルを生成し、生成された予測モデルに評価用データであるグループＩＤ３の行を入力することにより、グループＩＤ３の行に予測結果（解約予測確率）を対応付けることができる。

　このようにして全てのグループが評価用データとなるように処理を繰り返す。ここではグループは３つであるため、評価用データと学習用データを変更しながら処理を３回繰り返すことになる。そうすると学習時データの全ての行が評価用データとなり、図８Ｂに示すように全ての行に対して予測結果としての解約予測確率を対応付けることができる。なお、ＣＶを行わない場合には学習時データを構成する各行のうち、評価用データとした行にのみ予測結果としての解約予測確率を対応付けることができる。

　予測部１１０により、同一の学習時データを用いた複数回学習を予測モデルのパラメータを変更して行うことにより複数の予測モデルを生成し、その複数の予測モデルにより、学習時データにおける各行に対して複数の予測モデルの予測結果を対応付ける事ができる。本実施の形態では図８Ｃに示すように予測モデルＡ、予測モデルＢ、予測モデルＣという３つの予測モデルが生成され、それぞれの予測モデルによる予測結果が学習時データの各行に対応付けられているとする。

　予測部１１０は、本番環境においては、本番環境データを学習時に生成した予測モデルに入力することにより、本番環境データの各行に複数の予測モデルによる複数の予測結果を対応付ける。

［１－２－３．判別部１２０による処理］
　次に図９を参照して、上述のステップＳ１０３の判別部１２０による処理について説明する。なお、判別部１２０による処理の前に、ステップＳ１０２で複数の予測モデル（予測モデルＡ、Ｂ、Ｃ）を用いて学習時データの各行に各予測モデルによる予測結果が対応付けられているものとする。さらに、複数の予測モデル（予測モデルＡ、Ｂ、Ｃ）を用いて本番環境データの各行に各予測モデルによる予測結果が対応付けられているものとする。なお、ここでは複数の予測モデルを３つであるとして説明を行っているが、予測モデルの数は３つに限られず２つ以上であればいくつであってもよい。

　まずステップＳ３０１で、データ結合部１２１は、学習時データの各行に対応付けられた学習時の複数の予測結果と、本番環境データの各行に対応付けられた本番環境の複数の予測結果と、本番環境であることを示す本番環境フラグを結合して結合データを生成する。

　図１０に示すように、学習時の予測結果と本番環境の予測結果をそれぞれ行方向に結合し、本番環境か否かを０と１で示す本番環境フラグを各行に対応付けて結合データを生成する。本番環境フラグは本番環境を１で示し、本番環境ではない学習時を０で示すものとするため、本番環境の予測結果の行には本番環境フラグ１を対応付け、学習時の予測結果の行には本番環境フラグ０を対応付ける。

　次にステップＳ３０２で、データ分割部１２２は、結合データを行単位で分割することにより学習用データと評価用データに分割する。データ分割部１２２は学習用データを判別モデル生成部１２３に出力し、評価用データを判別結果出力部１２４に出力する。

　次にステップＳ３０３で、判別モデル生成部１２３は、学習用データに基づいて、本番環境フラグを教師データとして二値分類を学習することで本番環境フラグ１を見分ける、すなわち、データの行が本番環境であるか否かを判別する判別モデルを生成する。

　次にステップＳ２０４で、判別結果出力部１２４は判別モデルを用いて評価用データである行が本番環境であるか否かを判別する。

　判別モデルは、評価用データである行が本番環境であるか否かを判別する際に、各予測モデルの予測結果の組み合わせに基づいて評価用データの行が本番環境であるか否かを判別する。具体的には、全ての予測モデルＡ～Ｃの予測結果がある場合、予測モデルＡの予測結果を除いた場合、予測モデルＢの予測結果を除いた場合、予測モデルＣの予測結果を除いた場合、予測モデルＡおよび予測結果Ｂの予測結果を除いた場合、予測モデルＡおよび予測結果Ｃの予測結果を除いた場合、予測モデルＢおよび予測結果Ｃの予測結果を除いた場合で本番環境であるか否かの判別を行う。

　これにより、どの予測モデルの予測結果が本番環境を判別するのに有効であるかを特定することができる。例えば、予測モデルＡを除いた場合に評価用データの行が本番環境であるか判別できない場合、予測モデルＡは判別に有効であるといえる。どの予測モデルの予測結果が本番環境を判別するのに有効かどうかを特定することで各予測モデルの予測結果が本番環境で影響を受けているかどうかを把握することができる。

　ＣＶを行って、全てのグループが評価用データとなるように処理を繰り返すことにより、結合データに含まれる全ての行について判別結果としての本番環境確率を対応付けることができる。ＣＶの方法は図８を参照して説明した方法を同様である。

　以上のようにして判別部１２０による処理が行われる。判別結果は判別結果処理部１３０に出力される。

［１－２－４．判別結果処理部１３０による処理］
　次に図１１を参照して上述のステップＳ１０４の判別結果処理部１３０による処理について説明する。

　まずステップＳ４０１で、各予測モデルによって得られた予測結果が本番環境であるか否かを判別するのに有効ではない（全ての予測モデルの予測結果を用いても本番環境であるか否かを判別することができない）場合、処理はステップＳ４０２に進む（ステップＳ４０１のＹｅｓ）。

　そしてステップＳ４０２で、判別結果処理部１３０は、複数の予測モデルのいずれかを予測サービスで使用する予測モデルとして選択する。全ての予測モデルの予測結果に基づいても本番環境であるか否かを判別できなかった場合、すなわち、全ての予測モデルの予測結果が本番環境であるか否かを判別するのに有効ではない場合とは、学習時データと本番環境データに差違がない、または差異があっても予測結果に影響がないといえる。なぜなら本番環境であるか判別できないということは学習時と本番環境で予測結果が同じであり区別できないからである。この場合、複数の予測モデルのいずれを予測サービスで使用しても問題はない。また、複数の予測モデルのうちのいずれかを既に予測サービスで使用している場合にはその予測モデルの使用を続けても問題はない。予測モデルは、学習時データと本番環境データの差違の影響を受けて予測結果が変化するのは好ましくなく、学習時データと本番環境データの差違の影響を受けた予測モデルは使用すべきではなく、差違の影響を受けない予測モデルを使用すべきだからである。

　一方、ステップＳ４０１で、各予測モデルによって得られた予測結果の全てまたは一部が本番環境であるか否かを判別するのに有効である場合、処理はステップＳ４０３に進む（ステップＳ４０１のＮｏ）。

　次にステップＳ４０３で、一部の予測モデルによって得られた予測結果が本番環境であるか否かを判別するのに有効である場合、処理はステップＳ４０４に進む（ステップＳ４０３のＹｅｓ）。

　そしてステップＳ４０４で、判別結果処理部１３０は、判別に有効ではない予測モデルを予測サービスで使用する予測モデルとして選択する。判別に有効ではない予測モデルでは、学習時データと本番環境データに差異があっても予測結果はその差異の影響を受けていない、または影響を受けていてもわずかな影響であるといえる。この場合、その判別に有効ではない予測モデルを予測サービスで使用するのが好ましい。予測モデルは、学習時データと本番環境データの差違の影響を受けるのは好ましくなく、学習時データと本番環境データの差違の影響を受けた判別に有効な（判別の精度向上に寄与する）予測モデルは使用すべきではなく、差違の影響を受けない予測モデルを使用すべきだからである。よって、判別に有効ではない予測モデルを予測サービスで使用することにより、データの差違に頑健な予測結果を出力する予測サービスを実現することができる。

　予測サービスが判別結果処理部１３０により選択された予測モデルを使用するために、情報処理装置１００は予測サービスを実行する装置に対して、選択された予測モデル自体を送信する必要がある。なお、予測サービスを実行する装置がすでに複数の予測モデルを保持している場合には、情報処理装置１００は予測サービスを実行する装置に対して、選択された予測モデルを示す情報を出力すればよい。予測サービスを実行する装置はその情報に基づいて使用する予測モデルを採用して予測を行う。

　一方、ステップＳ４０３で、全ての予測モデルの予測結果が本番環境であるか否かの判別に有効である場合、処理はステップＳ４０５に進む（ステップＳ４０３のＮｏ）。

　次にステップＳ４０５で、判別結果処理部１３０は対応処理を行う。全ての予測モデルの予測結果が本番環境であるか否かの判別に有効である場合、学習時データと本番環境データに差違があり、全ての予測モデルの予測結果がその差違の影響を受けることにより、予測結果が変化しているといえる。上述したように、学習時データと本番環境データの差違の影響を受けた予測モデルは使用すべきではなく、差違の影響を受けない予測モデルを使用すべきだからである。よって、この場合は対応処理が必要となる。対応処理としては第１の対応処理である新たな予測モデルの再生成と、第２の対応処理である既存の予測モデルの再学習がある。なお、対応処理は予測部１１０が行ってもよい。

　第１の対応処理である新たな予測モデルの再生成と、第２の対応処理である既存の予測モデルの再学習のいずれを行う場合でも、入力データにおいて予測結果に影響を与えた項目（列）を特定し、その項目（列）を入力データから除外する必要がある。

　本番環境である確率が高い（例えば、確率が所定の閾値以上）行は、本番環境に特有の行である、すなわち、学習時データには含まれてない特徴を有している行であるといえる。よって、判別モデルが高い確率で本番環境であると判別した行を確認することで、具体的にどのような行が学習時とは異なる本番環境特有の行なのかを知ることができる。

　また、判別モデルにより本番環境ではないと判別された学習時データにおける項目（列）を変化させて再び判別モデルに入力した場合、本番環境であると判別されるか否かを確認する。本番環境ではないと判別された学習時データが項目（列）を変化させることにより本番環境であると判別された場合、その変化させた項目（列）は判別結果の変化に影響を与える項目（列）であると特定することができる。

　例えば、図１２において円で囲って示すように、本番環境ではないと判別された行の項目（列）（例えば支払額）を変化させて、再び判別モデルに入力した結果、本番環境であると判別された場合、「支払額」が判別結果に影響を与える項目（列）であると特定することができる。よって、項目（列）を総当り的に変化させて判別モデルに入力することにより、どの項目（列）をどの程度変化させると判定結果が変わるのかということを把握することができる。なお、本番環境ではないと判別された学習時データの項目（列）を変化させるのは総当り的に行ってもよいし、特定の項目（列）に限定して行ってもよいし、ユーザが任意の項目（列）を任意の値に変更できるようにしてもよい。

　そして、判別結果の変化に影響を与える特定の項目（列）を特定できた場合、第１の対応処理として、その判別結果の変化に影響を与える項目（列）を入力データから除いてその特定の項目（列）に影響されない新たな予測モデルを再生成する。

　また、判別結果の変化に影響を与える特定の項目（列）を特定できた場合、第２の対応処理として、その判別結果の変化に影響を与える項目（列）を年度ごとに正規化することによりその特定の項目に依存されないようにして、既存の予測モデルを再学習する。

　以上のようにして判別結果処理部１３０による処理が行われる。第１の対応処理と第２の対応処理のどちらを行うかは予測サービスの運営者など情報処理装置１００を利用するものが選択できるようにしてもよい。

　以上の情報処理装置１００の処理によれば、複数の予測モデルの中から予測結果の変化が少ないような予測モデルを選択して使用することで、学習時データと本番環境データの差違に対して頑健な予測結果を継続的に得ることができる。また、正解がない入力データに基づいても正しい予測結果を出力する予測モデルを生成することができる。

　複数の予測モデルの予測結果から、本番環境かどうかを判別する判別モデルを作成することで、学習時データと本番環境データの差違に対して頑健な予測結果を出力する予測モデルを特定することができる。従来手法である統計量ベースの手法に比べて分布を仮定しないため幅広い分布のずれに対応でき、評価用データによる検証を行うことで誤検出の防止も期待できる。これにより、入力データの変化に影響を受けていない予測結果を本番環境で得ることができる。

　また、学習時データと本番環境データの差違に対して、予測結果も学習時と本番環境でずれているかどうかを知ることができる。また、どの入力データのどの行において本番環境で予測結果がずれているかを把握することができる。また、学習時データが本番環境ではどのように変化しているかを事例ベースで定量的に知ることができる。さらに、予測モデルを再学習する際に、入力データにどのような変更を加えて再学習を行うべきかを把握することができる。

　また、入力データの行ごとに本番環境である確率を算出することで、予測結果が変化しているデータを事例ベースで把握することができる。加えて、本番環境か否かを判別できなくなるような最小のデータの差違を探すことで、予測結果に影響を与えるデータはどのように変化しているかを具体的な値として把握できる。これにより、学習時データと本番環境データにどのような差違があるかがわかり、予測結果が変化してしまっているデータについても把握することができる。またこれらは定量的な値で提示されるため予測モデルを再学習するときの指針にもなると考えられる。

＜２．ユーザインターフェース＞
　次に本技術の利用におけるユーザインターフェースについて説明する。このユーザインターフェースは情報処理装置１００または予測サービスが動作する電子機器（パーソナルコンピュータ、スマートフォン、タブレット端末）におけるディスプレイに表示されるものである。

　図１３Ａは予測モデルの詳細をユーザに提示するためのＵＩである。

　図１３Ｂは、複数の予測モデルをユーザに提示するためのＵＩである。このＵＩでは複数の予測モデルを識別するためにモデルに付された名称と、各予測モデルによる本番環境の予測結果と学習時の予測結果の乖離度、各予測モデルのステータスなどが表示される。予測モデルのステータスとしては、現在予測サービスで稼働中であるか否か、情報処理装置１００により選択された予測モデルに切り替えるか否か、などが表示されている。

　図１３Ｃは、上述した対応処理（予測モデルの再生成と再学習）のために入力データの行を構成する項目（列）を任意の値に変更するためのＵＩである。

＜３．具体的使用例＞
　上述の実施の形態では保険契約者が契約を解約するか否かを予測する例で説明を行ったが、本技術はその例に限られるものではない。以下、複数の具体例について説明する。

　例えば本技術は、予測サービスが、顧客が興味のありそうな映画のコンテンツを予測して、ユーザが予測結果に基づいて映画を推薦する場合にも使用できる。

　この場合、過去の顧客の視聴履歴を学習時データとして、候補となる複数の予測モデルを作成する（精度は予測モデルによって１～２％ほどしかずれないのが一般的である）。

　複数の予測モデルの中から最も精度の高い予測モデルを本番環境で使用し、予測サービスにおける予測モデルとして活用する。本番環境で稼働した際のデータが蓄積されてきた段階で、そのデータの検証を行う。

　実施の形態で説明した予測部１１０と判別部１２０による処理を行い、例えば、学習時と本番環境の予測結果を判別できないという結果が出た場合、学習時に想定した通りの予測結果が本番環境でも出続けている可能性が高く、今後もその最も精度の高い予測モデルを使用し続けてモニタリングを継続的に行うとよい。

　また本技術は、予測サービスが、採用する営業職員が離職する確率を予測してユーザが予測結果を採用の参考にする場合にも使用できる。

　この場合、過去に採用した営業職員が離職したか否かの情報を学習時データとして、候補となる複数の予測モデルを作成する。

　実施の形態で説明した予測部１１０と判別部１２０による処理を行い、例えば、学習時と本番環境の予測結果の違いはいくつかの予測モデルの予測結果を使うと判別できるということが分かった場合、学習時と本番環境の違いが判別できない予測結果を出力する予測モデルの中から一番離職予測の精度が高くなる予測モデルを選択し、以後はその予測モデルを使用して本番環境で予測を行うとよい。

　さらに本技術は、予測サービスが、顧客が生命保険に追加で加入する確率を予測して、ユーザが予測結果を生命保険の営業に用いる場合にも使用できる。実際の生命保険ビジネスにおいては追加で購入する確率が高い顧客に対して営業の電話やメールによるアプローチを行っているため、生命保険に追加で加入する確率を予測するのは生命保険ビジネスにおいて重要である。

　この場合、過去に生命保険に加入した顧客の情報を学習時データとして、候補となる複数の予測モデルを作成する。

　実施の形態で説明した予測部１１０と判別部１２０による処理を行い、例えば、学習時と本番環境の予測結果の違いはどの予測モデルを使用しても判別できるということがわかった場合、どの予測モデルを使用しても問題が起きるため、具体的にどのような変化が起きているかを事例ベースで調べる必要がある。

　予測結果が変化している確率が高い個別の顧客について把握し、特に本番環境である確率が高い顧客については優先度を下げて、一時的に電話を行わないという運用を行うことができる。

　また、学習時の学習時データを本番環境の本番環境データに変換した所、本番環境データだと前年支払額が全体的に減っている傾向があることが分かった場合、予測モデルは再学習する必要があるため保険の支払額を年度ごとに正規化して予測モデルを再作成することができる。

＜４．変形例＞
　以上、本技術の実施の形態について具体的に説明したが、本技術は上述の実施の形態に限定されるものではなく、本技術の技術的思想に基づく各種の変形が可能である。

　本技術の使用用途は上述した具体例に限られず、蓄積された過去のデータから予測するものであればどのような予測にも本技術を使用することができる。

　入力データはＣＳＶファイルに限られず、他の形式、例えば、ＴＳＶ（Tab-Separated Values）ファイル、エクセル形式のファイル、非零の値をキーとバリューで表現した疎形式のファイルなどでもよい。

　本技術は以下のような構成も取ることができる。
（１）
　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を得る予測部と、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する判別部と、
を備える情報処理装置。
（２）
　前記複数の予測結果が本番環境であるかを判別するのに有効であるか否かに基づいて前記複数の予測モデルのいずれかを選択する判別結果処理部を備える（１）に記載の情報処理装置。
（３）
　前記複数の予測結果の全てが本番環境であるか否かを判別するのに有効ではない場合、前記判別結果処理部は、前記複数の予測モデルのいずれかを選択する（２）に記載の情報処理装置。
（４）
　前記複数の予測結果の一部が本番環境であるかを予測するのに有効である場合、前記判別結果処理部は、有効ではない予測結果を出力した前記予測モデルを選択する（２）または（３）に記載の情報処理装置。
（５）
　前記複数の予測結果の全てが本番環境であるかを予測するのに有効である場合、前記判別結果処理部は、対応処理を行う（２）から（４）のいずれかに記載の情報処理装置。
（６）
　前記対応処理は、新たな予測モデルの生成である（５）に記載の情報処理装置。
（７）
　前記対応処理は、生成済みの前記予測モデルの再学習である（５）に記載の情報処理装置。
（８）
　前記入力データから前記予測結果に影響を与えるデータを除外して前記対応処理を行う（５）から（７）のいずれかに記載の情報処理装置。
（９）
　選択された前記予測モデルは予測サービスにおいて使用される（２）から（８）のいずれかに記載の情報処理装置。
（１０）
　前記予測モデルは、学習時の入力データに含まれる正解を教師データとして二値分類を学習することにより作成される（１）から（９）のいずれかに記載の情報処理装置。
（１１）
　前記判別モデルは、学習時の前記予測モデルによる予測結果と本番環境の前記予測モデルによる予測結果に基づいて生成される（１）から（１０）のいずれかに記載の情報処理装置。
（１２）
　学習時の前記予測モデルによる予測結果と本番環境時の前記予測モデルによる予測結果に本番環境時の予測結果であることを示す識別情報を結合し、前記識別情報を教師データとして二値分類を学習することにより前記判別モデルが生成される（１１）に記載の情報処理装置。
（１３）
　前記入力データは複数の行と列により構成されるデータである（１）から（１２）のいずれかに記載の情報処理装置。
（１４）
　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を取得し、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する
情報処理方法。
（１５）
　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を取得し、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する
情報処理方法をコンピュータに実行させるプログラム。

１００・・・情報処理装置
１１０・・・予測部
１２０・・・判別部
１３０・・・判別結果処理部

Claims

　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を得る予測部と、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する判別部と、
を備える情報処理装置。
　前記複数の予測結果が本番環境であるかを判別するのに有効であるか否かに基づいて前記複数の予測モデルのいずれかを選択する判別結果処理部を備える
請求項１に記載の情報処理装置。
　前記複数の予測結果の全てが本番環境であるか否かを判別するのに有効ではない場合、前記判別結果処理部は、前記複数の予測モデルのいずれかを選択する
請求項２に記載の情報処理装置。
　前記複数の予測結果の一部が本番環境であるかを予測するのに有効である場合、前記判別結果処理部は、有効ではない予測結果を出力した前記予測モデルを選択する
請求項２に記載の情報処理装置。
　前記複数の予測結果の全てが本番環境であるかを予測するのに有効である場合、前記判別結果処理部は、対応処理を行う
請求項２に記載の情報処理装置。
　前記対応処理は、新たな予測モデルの生成である
請求項５に記載の情報処理装置。
　前記対応処理は、生成済みの前記予測モデルの再学習である
請求項５に記載の情報処理装置。
　前記入力データから前記予測結果に影響を与えるデータを除外して前記対応処理を行う
請求項５に記載の情報処理装置。
　選択された前記予測モデルは予測サービスにおいて使用される
請求項２に記載の情報処理装置。
　前記予測モデルは、学習時の入力データに含まれる正解を教師データとして二値分類を学習することにより作成される
請求項１に記載の情報処理装置。
　前記判別モデルは、学習時の前記予測モデルによる予測結果と本番環境の前記予測モデルによる予測結果に基づいて生成される
請求項１に記載の情報処理装置。
　学習時の前記予測モデルによる予測結果と本番環境時の前記予測モデルによる予測結果に本番環境時の予測結果であることを示す識別情報を結合し、前記識別情報を教師データとして二値分類を学習することにより前記判別モデルが生成される
　請求項１１に記載の情報処理装置。
　前記入力データは複数の行と列により構成されるデータである
請求項１に記載の情報処理装置。
　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を取得し、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する
情報処理方法。
　学習時における入力データに基づいて生成された複数の予測モデルを用いて、本番環境における入力データに基づいて前記予測モデルごとの複数の予測結果を取得し、
　判別モデルを用いて、前記複数の予測結果から本番環境であるか否かを判別する
情報処理方法をコンピュータに実行させるプログラム。