WO2020250723A1

WO2020250723A1 - 情報処理方法、情報処理装置、及び、プログラム

Info

Publication number: WO2020250723A1
Application number: PCT/JP2020/021540
Authority: WO
Inventors: 慎吾高松; 正典宮原; 紘士飯田; 健人中田; 裕士堀口
Original assignee: ソニー株式会社
Priority date: 2019-06-11
Filing date: 2020-06-01
Publication date: 2020-12-17
Also published as: US20220230096A1

Abstract

本技術は、予測モデルの予測精度を向上させることができるようにする情報処理方法、情報処理装置、及び、プログラムに関する。１以上の情報処理装置を備える情報処理システムが、予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う。また、１以上の情報処理装置を備える情報処理システムが、学習データ及び予測データに基づいて学習された予測モデルと、前記予測データとに基づいて、予測分析を行う。本技術は、例えば、各種のサービスの予測分析を行うシステムに適用できる。

Description

情報処理方法、情報処理装置、及び、プログラム

　本技術は、情報処理方法、情報処理装置、及び、プログラムに関し、特に、予測モデルの予測精度を向上させるようにした情報処理方法、情報処理装置、及び、プログラムに関する。

　近年、様々な分野で予測分析が利用されている（例えば、特許文献１参照）。予測分析とは、例えば、機械学習により過去の結果に基づいて未来の事象を予測する技術である。

国際公開第２０１６／１３６０５６号

　しかしながら、予測分析に用いられる予測モデルの学習に用いられた学習データの特徴と、予測分析に実際に用いられる予測データの特徴とが大きく異なる場合、予測分析の精度が低下するおそれがある。

　例えば、過去１年分の学習データに基づいて、あるサービスにおける顧客の行動を予測する予測モデルを生成し、来月分の予測データに基づいて予測分析を行う場合、過去１年間にサービスの状況が大きく変化したとき（例えば、サービス内容の大幅な変更、強力なライバル会社の出現等）、学習データの特徴と予測データの特徴とが大幅に異なる可能性がある。そして、学習データの特徴と予測データの特徴とが大幅に異なる場合、予測分析の精度が低下するおそれがある。

　本技術は、このような状況に鑑みてなされたものであり、予測モデルの予測精度を向上させるようにするものである。

　本技術の一側面の情報処理方法は、１以上の情報処理装置を備える情報処理システムが、予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う。

　本技術の一側面の情報処理装置は、予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う学習部を備える。

　本技術の一側面のプログラムは、予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う処理をコンピュータに実行させる。

　本技術の一側面においては、予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習が行われる。

本技術を適用した情報処理システムの一実施の形態を示すブロック図である。学習データと予測データの例を示す図である。学習処理の第１の実施の形態を説明するためのフローチャートである。学習データ生成処理の詳細を説明するためのフローチャートである。学習データの対象となる顧客と予測データの対象となる顧客の範囲の例を示す図である。 one-of-kベクトルの詳細を説明するためのフローチャートである。予測処理の第１の実施の形態を説明するためのフローチャートである。学習処理の第２の実施の形態を説明するためのフローチャートである。予測精度の計算結果の例を示すグラフである。学習処理の第３の実施の形態を説明するためのフローチャートである。類似度算出処理の詳細を説明するためのフローチャートである。類似度の計算結果の例を示すグラフである。学習処理の第４の実施の形態を説明するためのフローチャートである。予測処理の第２の実施の形態を説明するためのフローチャートである。学習処理の第５の実施の形態を説明するためのフローチャートである。設定画面の例を示す図である。コンピュータの構成例を示す図である。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．第１の実施の形態
　２．第２の実施の形態
　３．第３の実施の形態
　４．第４の実施の形態
　５．第５の実施の形態
　６．変形例
　７．その他

　＜＜１．第１の実施の形態＞＞
　まず、図１乃至図７を参照して、本技術の第１の実施の形態について説明する。

　＜情報処理システム１１の構成例＞
　図１は、本技術を適用した情報処理システム１１の構成例を示している。

　情報処理システム１１は、各種のサービスに関する予測分析を行うシステムである。情報処理システム１１は、顧客・契約データベース２１、学習処理部２２、予測部２３、及び、ＵＩ（ユーザインタフェース）部２４を備える。

　顧客・契約データベース２１は、サービスを利用する顧客及び契約に関するデータを格納するデータベースである。

　学習処理部２２は、各種のサービスに関する予測分析に用いる予測モデルの学習処理を行う。学習処理部２２は、データ生成部３１及び学習部３２を備える。

　データ生成部３１は、学習データ生成部４１及び予測データ生成部４２を備える。

　学習データ生成部４１は、顧客・契約データベース２１に格納されているデータに基づいて、予測モデルの学習に用いる学習データを生成する。

　予測データ生成部４２は、顧客・契約データベース２１に格納されているデータに基づいて、予測モデルを用いた予測分析に用いる予測データを生成する。予測データ生成部４２は、生成した予測データを予測部２３に供給する。

　図２は、学習データと予測データの例を示している。学習データＡは、１以上の所定の項目に対する値を示す入力データ、及び、予測モデルにより予測される対象の正解を示すラベルを含む。一方、予測データＢは、学習データＡと同じ項目の入力データを含むが、ラベルは含まない。

　学習部３２は、学習データ及び予測データに基づいて、予測モデルの学習を行い、予測モデルを生成する。すなわち、従来の学習処理では、図２の学習データＡのみに基づいて予測モデルの学習が行われるが、後述するように、学習部３２は、学習データに加えて、必要に応じて予測データも加味して、予測モデルの学習を行う。その結果、予測モデルの予測精度が向上する。学習部３２は、生成した予測モデルを予測部２３に供給する。

　予測部２３は、予測モデル及び予測データに基づいて、各種のサービスに関する予測分析を行う。例えば、予測部２３は、サービスを利用する顧客の行動予測、サービスの需要予測等を行う。

　ＵＩ部２４は、情報処理システム１１を使用するユーザ（例えば、サービス提供者）に対するユーザインタフェースを提供する。例えば、ＵＩ部２４は、ユーザからの入力を受け付けたり、情報処理システム１１を使用するための情報、学習部３２による学習結果、及び、予測部２３による予測結果をユーザに提示したりする。

　なお、以下、定額音楽配信サービスからの顧客の退会を削減するために行う電話施策の効率及び効果を上げるために、顧客の退会予測を行う事例を具体例として挙げながら、情報処理システム１１の処理について説明する。

　電話施策は人件費等のコストがかかるため、全顧客に対して実施するのは非効率である。従って、例えば、機械学習により顧客の属性や行動等に基づいてサービスからの退会確率を予測し、退会確率の高い顧客に対してのみ電話施策を実施するのが効率的である。また、顧客の退会確率の予測精度が高くなるほど、退会する顧客の数を減らすことが期待できる。

　なお、以下、定額音楽配信サービスの契約期間を１年間とし、顧客は１年毎に契約を更新するか退会するかを決定するものとする。また、顧客が契約を更新するか退会するかの意思決定期間は、契約更新日から１か月以内とする。なお、契約更新日は、毎年契約日と同じ日に設定されるものとする。例えば、契約日が２０１７年の５月１日である場合、次の契約更新日は２０１８年の５月１日に設定され、その次の契約更新日は２０１９年５月１日に設定されるものとする。

　また、以下、毎月末（例えば、２０１９年４月３０日）に次月（例えば、２０１９年５月）に契約更新日を迎える顧客の退会確率が予測され、退会確率が上位の所定の数の顧客、又は、退会確率が所定の閾値以上の顧客に対して、退会を防止するために、契約更新を促すための電話がかけられるものとする。

　なお、以下、ある期間に契約更新日を迎える又は迎えた顧客を、その期間の更新対象者と称する。例えば、２０１９年５月に契約更新日を迎える又は迎えた顧客を２０１９年５月の更新対象者と称する。

　さらに、以下、顧客・契約データベース２１が、顧客情報及びサービス契約情報を含むデータを格納するものとする。

　顧客情報は、顧客の特徴を表す情報であり、例えば、顧客の属性、及び、顧客のサービス上での行動ログに基づく情報を含む。例えば、顧客情報は、顧客の年齢、性別、住所、過去に聴いた楽曲、よく聴く楽曲のジャンル等を含む。サービス契約情報は、顧客の契約内容に関する情報であり、例えば、契約日、契約更新日、退会日、支払方法等を含む。

　　＜学習処理の第１の実施の形態＞
　次に、図３のフローチャートを参照して、情報処理システム１１により実行される学習処理の第１の実施の形態について説明する。

　なお、以下、２０１９年５月の更新対象者の退会確率を予測する場合を例に挙げて説明する。すなわち、現在が２０１９年４月３０日であり、２０１９年５月１日から２０１９年５月３１日までの期間内に契約更新日を迎える顧客の退会確率を予測する場合を例に挙げて説明する。

　なお、以下、退会確率を予測する対象となる期間を予測期間と称する。この例の場合、２０１９年５月１日から２０１９年５月３１日までの期間が予測期間となる。また、予測期間が月単位で設定される場合、予測期間を予測対象月とも称する。この例の場合、２０１９年５月が予測対象月となる。

　ステップＳ１において、学習データ生成部４１は、学習データ生成処理を行う。

　ここで、図４のフローチャートを参照して、学習データ生成処理の詳細について説明する。

　ステップＳ３１において、学習データ生成部４１は、データサンプルを生成する顧客を選択する。学習データは、顧客毎に生成されるデータサンプルの集合からなる。そして、学習データ生成部４１は、顧客・契約データベース２１において所定の条件を満たす顧客の中から、まだデータサンプルを生成していない顧客を１人選択する。

　なお、以下、図５に示されるように、過去１年間の更新対象者が、学習データの対象とされるものとする。すなわち、過去１年間に契約期間が満了し、契約更新日を迎えた顧客の契約期間中の顧客情報に基づいて、学習データが生成されるものとする。

　また、以下、学習データが生成され、予測モデルの学習の対象となる期間を学習期間と称する。従って、学習期間内の更新対象者の顧客情報に基づいて学習データが生成され、生成された学習データに基づいて、予測モデルが学習される。現在の例の場合、過去１年間が学習期間となる。

　さらに、以下、この先１か月以内の更新対象者が、予測データの対象とされるものとする。すなわち、この先１か月以内に契約期間が満了し、契約更新日を迎える顧客の契約期間中の顧客情報に基づいて、予測データが生成されるものとする。

　従って、現在の例では、２０１８年５月１日から２０１９年４月３０日までの期間（学習期間）内の更新対象者が、学習データに含まれる。すなわち、当該期間内の更新対象者の契約期間中の顧客情報に基づいて学習データが生成される。

　また、２０１９年５月１日から２０１９年５月３１日までの期間（予測期間）内の更新対象者が、予測データに含まれる。すなわち、当該期間内の更新対象者の契約期間中の顧客情報に基づいて予測データが生成される。

　なお、２０１８年５月１日から２０１８年５月３１日までの期間内の更新対象者であって、契約を更新した更新対象者は、学習データ及び予測データの両方の対象となる。ただし、当該更新対象者の１つ前の契約期間中の顧客情報が学習データの対象となり、当該顧客の現在の契約期間中の顧客情報が予測データの対象となる。

　また、２０１８年６月１日以降に入会した顧客は、学習データ及び予測データのどちらにも含まれない。すなわち、当該顧客は、学習データ及び予測データのいずれの対象にもならない。

　以下、ステップＳ３１の処理で選択された顧客を注目顧客と称する。

　ステップＳ３２において、学習データ生成部４１は、one-of-kベクトルを生成する項目を選択する。学習データ生成部４１は、顧客・契約データベース２１の注目顧客の顧客情報の特徴量ベクトルの対象となる項目の中から、まだone-of-kベクトルを生成していない項目を１つ選択する。one-of-kベクトルとは、ｋ次元のベクトルであり、１つの要素のみ値が１となり、残りのｋ－１個の要素の値が０となるベクトルである。

　以下、ステップＳ３２の処理で選択された項目を注目項目と称する。

　ステップＳ３３において、学習データ生成部４１は、one-of-kベクトル生成処理を行う。

　ここで、図６のフローチャートを参照して、one-of-kベクトル生成処理の詳細について説明する。

　ステップＳ６１において、学習データ生成部４１は、選択した項目（注目項目）の値を取得する。すなわち、学習データ生成部４１は、顧客・契約データベース２１の注目顧客の顧客情報から注目項目の値を取得する。

　なお、顧客情報の各項目は、例えば、カテゴリカル値（例えば、性別、住所等）、又は、連続値（例えば、年齢、月間再生数等）により表される。

　ステップＳ６２において、学習データ生成部４１は、取得した値に割り当てられたインデックスｉを取得する。

　例えば、注目項目がｋ種類の値を取り得る場合、各値に対して１からｋまでの異なるインデックスが予め割り当てられる。

　例えば、注目項目が年齢であり、取り得る値の範囲が１８歳から９９歳までの場合、１８歳から９９歳までの各値に対して、１から８２までのインデックスが割り当てられる。そして、注目顧客の年齢が２０歳である場合、インデックス３が取得される。

　例えば、注目項目が音楽のジャンルであり、ｋ種類のジャンルに分類される場合、各ジャンルに対して１からｋまでのインデックスが割り当てられる。

　また、例えば、注目項目の値をｋ個のグループに分割し、各グループに対して１からｋまでのインデックスを割り当てるようにしてもよい。

　例えば、注目項目が年齢である場合、年齢が１０歳未満、１０代、２０代、・・・、９０代、１００歳以上のグループに分割され、各年齢のグループに１から１１までのインデックスが割り当てられる。

　例えば、注目項目が連続値である場合、注目項目の最大値と最小値の間がｋ等分され、各範囲に対して１からｋまでのインデックスがそれぞれ割り当てられる。

　ステップＳ６３において、学習データ生成部４１は、ｉ番目の次元の値が１で、他の次元の値が０であるｋ次元ベクトルを生成する。

　例えば、上述した年齢の例の場合、顧客の年齢が２０歳であれば、３次元目の値が１で、他の次元の値が０の８２次元のone-of-kベクトルが生成される。

　なお、例えば、注目顧客の注目項目の値が想定範囲外である場合、又は、注目顧客の注目項目の値が欠損している場合、全ての次元の値が０のone-of-kベクトルが生成される。なお、注目顧客の注目項目の値が想定範囲外である場合は、実際に注目項目の値が想定範囲外である場合に加えて、入力ミス等により想定範囲外の値が入力された場合も想定される。

　また、例えば、注目項目が連続値で表される場合、学習データ生成部４１は、各顧客の注目項目の平均及び標準偏差に基づいて外れ値（例えば、平均から標準偏差の３倍以上離れている値）を定義し、注目顧客の注目項目の値が外れ値であるとき、全ての次元の値が０のone-of-kベクトルを生成するようにしてもよい。

　さらに、例えば、注目項目がカテゴリカル値で表される場合、顧客・契約データベース２１での出現頻度が所定の閾値未満の値を欠損値扱いとするようにしてもよい。

　その後、one-of-kベクトル生成処理は終了する。

　図４に戻り、ステップＳ３４において、学習データ生成部４１は、全ての項目についてone-of-kベクトルを生成したか否かを判定する。学習データ生成部４１は、注目顧客の顧客情報の特徴量ベクトルの対象となる項目の中に、まだone-of-kベクトルを生成していない項目が残っている場合、まだ全ての項目についてone-of-kベクトルを生成していないと判定し、処理はステップＳ３２に戻る。

　その後、ステップＳ３４において、全ての項目についてone-of-kベクトルを生成したと判定されるまで、ステップＳ３２乃至ステップＳ３４の処理が繰り返し実行される。

　一方、ステップＳ３４において、学習データ生成部４１は、注目顧客の顧客情報の特徴量ベクトルの対象となる項目の中にone-of-kベクトルを生成していない項目が残っていない場合、全ての項目についてone-of-kベクトルを生成したと判定し、処理はステップＳ３５に進む。

　ステップＳ３５において、学習データ生成部４１は、各項目のone-of-kベクトルを連結し、特徴量ベクトルを生成する。すなわち、学習データ生成部４１は、注目顧客の各項目のone-of-kベクトルを所定の順序で連結することにより、注目顧客の特徴量ベクトルを生成する。

　なお、必ずしも顧客情報の全ての項目を特徴量ベクトルの生成に用いる必要はなく、特徴量ベクトルの生成に用いる項目を選択するようにしてもよい。例えば、学習対象となる顧客の顧客情報において、データの欠損率が所定の閾値以上の項目を、特徴量ベクトルの生成に用いる項目から除外するようにしてもよい。

　ステップＳ３６において、学習データ生成部４１は、データサンプルを生成する。具体的には、学習データ生成部４１は、注目顧客が退会したか否かを示すデータを顧客・契約データベース２１から取得する。そして、学習データ生成部４１は、特徴量ベクトルを入力データとし、退会したか否かを示すデータをラベルとするデータサンプルを生成する。

　また、学習データ生成部４１は、注目顧客の契約更新日又は退会日を時間情報としてデータサンプルに付与する。従って、時間情報は、データサンプルの新しさを示す。

　なお、退会日は、注目顧客が契約を更新しなかった場合に、当該契約の契約更新日に設定されるものとする。例えば、注目顧客の契約更新日が２０１９年５月１日の場合、注目顧客が契約を更新しなかったとき、２０１９年５月１日が退会日に設定されるものとする。

　なお、以下、学習データのｉ番目のデータサンプルを（ｘ^ｌ _ｉ，ｙ^ｌ _ｉ）で表す。ｘ^ｌ _ｉは特徴量ベクトルを表し、ｙ^ｌ _ｉはラベルを表している。ｌは、学習データの特徴量ベクトル又はラベルであることを示す添え字である。また、以下、特徴量ベクトルの次元数をｄで表すものとする。さらに、ラベルｙ^ｌ _ｉは、サービスを退会した場合には、１に設定され、サービスを退会せずに契約を更新した場合には、０に設定されるものとする。

　また、以下、予測データのｊ番目のデータサンプルをｘ^ｐ _ｊで表す。ｘ^ｐ _ｊは、特徴量ベクトルを表し、学習データの特徴量ベクトルｘ^ｌ _ｉと同じ種類の特徴量を表すベクトルである。ｐは、学習データの特徴量ベクトルであることを示す添え字である。なお、予測データの対象となる顧客は、サービスを退会しているか否かが未定であるため、予測データのデータサンプルは、ラベルを含まない。

　なお、以下、時間情報が所定の期間内のデータサンプルを、その期間のデータサンプルと称する。例えば、時間情報が２０１９年５月の範囲内のデータサンプル、すなわち、契約更新日又は退会日が２０１９年５月の範囲内の顧客のデータサンプルを、２０１９年５月のデータサンプルと称する。

　ステップＳ３７において、学習データ生成部４１は、対象となる全ての顧客のデータサンプルを生成したか否かを判定する。例えば、学習データ生成部４１は、過去１年間の更新対象者の中に、まだデータサンプルを生成していない顧客が残っている場合、まだ対象となる全ての顧客のデータサンプルを生成していないと判定し、処理はステップＳ３１に戻る。

　その後、ステップＳ３７において、対象となる全ての顧客のデータサンプルを生成したと判定されるまで、ステップＳ３１乃至ステップＳ３７の処理が繰り返し実行される。

　一方、ステップＳ３７において、例えば、学習データ生成部４１は、過去１年間の更新対象者の中にデータサンプルを生成していない顧客が残っていない場合、対象となる全ての顧客のデータサンプルを生成したと判定し、学習データ生成処理は終了する。

　図３に戻り、ステップＳ２において、学習部３２は、学習データに対する重みを設定する。例えば、学習部３２は、学習データに含まれる各データサンプルに対して、予測データとの関係に基づいて、重みを設定する。

　例えば、学習部３２は、データサンプルの属性である時間情報と、予測データの属性である時間情報との差、すなわち、データサンプルと予測データとの間の時間的な差に基づいて、各データサンプルの重みを設定する。より具体的には、学習部３２は、例えば、時間情報が予測データの時間情報に近いデータサンプルほど、すなわち、新しいデータサンプルほど重みを大きくする。

　ステップＳ３において、学習部３２は、学習データ及び重みに基づいて、予測モデルの学習を行う。

　予測モデルｐは、例えば、次式（１）により表される。

　ｐ（ｙ_ｉ＝１｜ｘ_ｉ）＝ｆ（ｘ_ｉ；ｗ）　・・・（１）

　ｆは、特徴量ｘ_ｉの顧客の退会確率を算出する関数である。ｆには、様々な関数が適用できるが、例えば、ニューラルネットワークを用いた関数が適用される。ｗは、予測モデルのパラメータを表す。以下、パラメータｗの数（パラメータ数）をＤで表す。

　また、予測モデルｐの学習においては、例えば、クロスエントロピーロスを誤差関数とし、学習データの全データサンプルに関する誤差関数の和に対し、勾配法を実行することにより、パラメータｗが計算される。誤差関数の和は、例えば、次式（２）により表される。

　ａ_ｉは、予測データのｉ番目のデータンプルに対する重みを表し、ステップＳ２の処理で設定される。ｌ（ｘ_ｉ，ｙ_ｉ，ｗ）は、誤差関数を表している。ｎは、学習データのデータサンプルの総数を示している。

　ここで、例えば、学習期間と予測期間との間で、データサンプルの特徴、すなわち、各顧客の特徴量ベクトルの傾向が大きく異なる場合が想定される。例えば、予測データの対象となる顧客の契約期間の直前又は契約期間中に、サービス内容の大幅な変更、強力なライバル会社の出現又は消滅、顧客層の大幅な変化等が起こった場合、予測データのデータサンプルの特徴が、学習データのデータサンプルの特徴と大きく異なる場合が想定される。

　これに対して、上述したように、時間的に予測データに近い学習データのデータサンプルほど重みａ_ｉを大きくすることにより、予測モデルの予測精度が向上する。

　ステップＳ４において、情報処理システム１１は、予測モデルを更新する。例えば、学習部３２は、ステップＳ３の処理で計算した予測モデルｐのパラメータｗを予測部２３に供給する。予測部２３は、予測モデルｐのパラメータｗを更新する。

　その後、学習処理は終了する。

　　＜予測処理の第１の実施の形態＞
　次に、図７のフローチャートを参照して、図３の学習処理に対応して、情報処理システム１１により実行される予測処理について説明する。

　ステップＳ１０１において、情報処理システム１１は、予測データを生成する。具体的には、予測データ生成部４２は、図３のステップＳ１と同様の処理により、予測データの対象となる各顧客の特徴量ベクトルを生成する。また、予測データ生成部４２は、各顧客の特徴量ベクトルを入力データとして含むデータサンプルを顧客毎に生成するとともに、各顧客の契約更新日を時間情報として各データサンプルに付与する。そして、予測データ生成部４２は、各顧客のデータサンプルを含む予測データを生成し、予測部２３に供給する。

　ステップＳ１０２において、予測部２３は、予測モデル及び予測データに基づいて、予測分析を行う。すなわち、予測部２３は、予測データに含まれる各顧客のデータサンプルを予測モデルに適用することにより、各顧客の退会確率を計算する。

　その後、予測処理は終了する。

　以上のようにして、予測データとの関係に基づいて、学習データの各データサンプルの重みを適切に設定し、予測モデルの予測精度を向上させることができる。

　また、従来、予測モデルの学習時に予測データを加味する手法として、共変量シフトと呼ばれる手法が知られている。共変量シフトでは、学習データの特徴量ベクトルを生成する確率分布、及び、予測データの特徴量ベクトルを生成する確率分布に基づいて、学習データの各データサンプルが重み付けされて、学習が行われる。しかし、確率分布の推定に必要な計算量が大きい上に、推定が困難である。また、確率分布の推定に適してない学習データが存在する。

　一方、本技術は、予測データとの関係に基づいて、学習データの各データサンプルの重みを設定するだけであり、計算量が少なく、また、学習データの種類に関わらず適用することが可能である。

＜＜２．第２の実施の形態＞＞
　次に、図８及び図９を参照して、本技術の第２の実施の形態について説明する。

　なお、第２の実施の形態は、第１の実施の形態と比較して、学習処理が異なる。具体的には、学習データを生成する対象となる期間が調整される。

　　＜学習処理の第２の実施の形態＞
　図８のフローチャートを参照して、情報処理システム１１により実行される学習処理の第２の実施の形態について説明する。

　なお、以下、第１の実施の形態と同様に、２０１９年５月の更新対象者の退会確率を予測する場合の例について説明する。

　ステップＳ２０１において、図２のステップＳ１の処理と同様に、学習データ生成処理が行われる。なお、この処理では、例えば、過去１３か月以内の更新対象者を対象にして、学習データが生成される。例えば、２０１８年４月１日から２０１９年４月３０日までの更新対象者の契約期間中の顧客情報に基づいて、学習データが生成される。

　ステップＳ２０２において、学習部３２は、学習期間を変化させながら予測精度を計算する。

　例えば、学習部３２は、２０１９年３月の更新対象者のデータサンプルを学習データから抽出した部分データを生成する。そして、学習部３２は、生成した部分データを用いて予測モデルの学習を行う。これにより、学習期間が２０１９年３月の予測モデルが生成される。

　次に、学習部３２は、２０１９年２月から２０１９年３月までの期間内の更新対象者のデータサンプルを学習データから抽出した部分データを生成する。そして、学習部３２は、生成した部分データを用いて予測モデルの学習を行う。これにより、学習期間が２０１９年２月から２０１９年３月までの予測モデルが生成される。

　次に、学習部３２は、２０１９年１月から２０１９年３月までの期間内の更新対象者のデータサンプルを学習データから抽出した部分データを生成する。そして、学習部３２は、生成した部分データを用いて予測モデルの学習を行う。これにより、学習期間が２０１９年１月から２０１９年３月までの予測モデルが生成される。

　以下、同様にして、学習部３２は、部分データの範囲を２０１８年４月まで１月ずつ広げながら、各部分データを用いて予測モデルの学習を行う。これにより、２０１９年４月を基準にして、学習期間がそれぞれ異なる過去Ｎか月（Ｎは１から１２までの自然数）の１２個の予測モデルが生成される。

　次に、学習部３２は、学習データから２０１９年４月の更新対象者のデータサンプルを抽出し、各更新対象者のデータサンプルからラベルを削除することにより、仮想の予測データを生成する。この仮想の予測データは、他の部分データより実際の予測データに時間的に近いデータとなる。すなわち、仮想の予測データは、学習データの一部から生成され、他の部分データより実際の予測データに近い期間のデータサンプルを含む。

　次に、学習部３２は、仮想の予測データを各予測モデルに適用することにより、２０１９年４月の各更新対象者の退会確率を予測する。

　そして、学習部３２は、２０１９年４月の各更新対象者の退会確率の予測値、及び、実際の各更新対象者の退会の有無に基づいて、各予測モデルの予測精度を計算する。予測精度の計算には、例えば、ＡＵＣ（Are Under the Curve）等が用いられる。

　ステップＳ２０３において、学習部３２は、予測精度に基づいて、学習期間を設定する。例えば、学習部３２は、予測精度が最も高い予測モデルの学習に用いられた部分データの期間を、予測モデルの学習に用いられる学習データの対象期間（学習期間）に設定する。

　図９は、予測モデルの予測精度の計算結果の例を示すグラフである。図９の横軸は、予測モデルの生成に用いた部分データの期間（学習期間）を示し、縦軸は予測精度を示している。

　この例では、５か月前から１か月前まで（過去５か月）の部分データを用いて学習した予測モデルの予測精度が最も高くなっている。従って、例えば、学習期間が５か月に設定される。すなわち、予測対象月の５か月前から１か月前までの期間が、予測モデルの学習に用いられる学習データの対象期間に設定される。

　なお、例えば、ＵＩ部２４が、図９のグラフをユーザに提示し、ユーザに学習期間を設定させるようにしてもよい。図９では、ユーザにより学習期間が７か月に設定された例が示されている。

　ステップＳ２０４において、学習部３２は、設定した学習期間の学習データに基づいて、予測モデルの学習を行う。例えば、学習部３２は、学習期間が５か月に設定された場合、予測対象月である２０１９年５月の５か月前の２０１８年１２月から２０１９年４月までの更新対象者のデータサンプルを学習データから抽出し、部分データを生成する。そして、学習部３２は、生成した部分データを用いて、予測モデルの学習を行う。

　ステップＳ２０５において、図３のステップＳ４の処理と同様に、予測モデルが更新される。

　その後、学習処理は終了する。

　以上のようにして、学習期間が適切に設定され、その結果、予測モデルの予測精度が向上する。

　なお、例えば、一度学習期間が設定された後は、上述したステップＳ２０２及びステップＳ２０３の処理を行わずに、学習期間を固定するようにしてもよい。これにより、予測モデルの学習に要する演算量及び時間を削減することができる。また、学習期間が１年より短く設定されることにより、学習データのデータ量が削減され、学習時間が短縮される。

　なお、学習期間を固定するようにした場合、例えば、学習部３２は、定期的にステップＳ２０２及びステップＳ２０３の処理を実行し、学習期間を更新するようにしてもよい。

　＜＜３．第３の実施の形態＞＞
　次に、図１０乃至図１２を参照して、本技術の第３の実施の形態について説明する。

　なお、第３の実施の形態は、上述した実施の形態と比較して、学習処理が異なる。具体的には、学習データと予測データとの類似度に基づいて、学習データの重みが設定され、学習処理が行われる。

　　＜学習処理の第３の実施の形態＞
　図１０のフローチャートを参照して、情報処理システム１１により実行される学習処理の第３の実施の形態について説明する。

　ステップＳ３０１において、図２のステップＳ１の処理と同様に、学習データ生成処理が行われる。すなわち、２０１８年５月から２０１９年４月までの更新対象者の契約期間中の顧客情報に基づいて、学習データが生成される。

　ステップＳ３０２において、学習データ生成部４１は、学習データを分割する。例えば、学習部３２は、２０１８年５月から２０１９年４月までの各月の更新対象者毎に学習データを分割することにより、それぞれ異なる期間の（各月の）更新対象者のデータサンプルをそれぞれ含む１２個の部分データを生成する。

　ステップＳ３０３において、図７のステップＳ１０１の処理と同様に、予測データが生成される。すなわち、２０１９年５月の更新対象者の契約期間中の顧客情報に基づいて、予測データが生成される。

　ステップＳ３０４において、学習部３２は、類似度を算出する部分データを選択する。すなわち、学習部３２は、まだ類似度を算出していない部分データを１つ選択する。

　ステップＳ３０５において、学習部３２は、類似度算出処理を行う。

　ここで、図１１のフローチャートを参照して、類似度算出処理の詳細について説明する。

　ステップＳ３３１において、学習部３２は、部分データの各項目について統計量を計算する。具体的には、学習部３２は、部分データに含まれる各データサンプルの特徴量ベクトルにより表される各項目の特徴量の統計量を計算する。

　なお、各項目の特徴量の統計量の計算方法は、特に限定されない。例えば、ある項目の特徴量が連続値で表される場合、各データサンプル間で正規化を行った後に、平均、標準偏差、及び、中央値の３種類の値が計算され、それらの値を要素とする３次元ベクトルが、その項目に対する統計量として計算される。また、例えば、ある項目の特徴量がカテゴリカル値で表される場合、ｋ種類の取り得る値のそれぞれの出現率を要素とするｋ次元のベクトルが、その項目に対する統計量として計算される。

　ステップＳ３３２において、学習部３２は、予測データの各項目について統計量を計算する。具体的には、学習部３２は、ステップＳ３３１と同様の方法により、予測データに含まれる各データサンプルの特徴量ベクトルにより表される各項目の特徴量の統計量を計算する。

　ステップＳ３３３において、学習部３２は、算出した統計量に基づいて、部分データと予測データの項目毎の類似度を計算する。

　なお、各項目の類似度の計算方法は、特に限定されない。例えば、ある項目の統計量がベクトルにより表される場合、学習部３２は、部分データのベクトルと予測データのベクトルの内積を、その項目の類似度して計算する。

　ステップＳ３３４において、学習部３２は、項目毎の類似度に基づいて、部分データと予測データの類似度を計算する。例えば、学習部３２は、項目毎の類似度を加算することにより、部分データと予測データの類似度を算出する。

　その後、類似度算出処理は終了する。

　図１０に戻り、ステップＳ３０６において、学習部３２は、全ての部分データの類似度を算出したか否かを判定する。学習部３２は、まだ類似度を算出していない部分データが残っている場合、まだ全ての部分データの類似度を算出していないと判定し、処理はステップＳ３０４に戻る。

　その後、ステップＳ３０６において、全ての部分データの類似度が算出されたと判定されるまで、ステップＳ３０４乃至ステップＳ３０６の処理が繰り返し実行される。

　一方、ステップＳ３０６において、全ての部分データの類似度が算出されたと判定された場合、処理はステップＳ３０７に進む。

　図１２は、各部分データと予測データとの類似度の計算結果の例を示すグラフである。横軸は、部分データの対象となる期間を示し、縦軸は、類似度を示している。すなわち、図１２は、１か月前の更新対象者を対象とする部分データと予測データとの類似度、２か月前の更新対象者を対象とする部分データと予測データとの類似度、・・・、１２か月前の更新対象者を対象とする部分データと予測データとの類似度を示している。

　ステップＳ３０７において、学習部３２は、類似度に基づいて、各部分データに対する重みを設定する。例えば、学習部３２は、予測データとの類似度が高い部分データに含まれるデータサンプルほど重みを大きくし、予測データとの類似度が低い部分データに含まれるデータサンプルほど重みを小さくする。

　ステップＳ３０８において、図３のステップＳ３と同様の処理により、学習データ及び重みに基づいて、予測モデルの学習が行われる。

　ステップＳ３０９において、図３のステップＳ４と同様の処理により、予測モデルが更新される。

　その後、学習処理は終了する。

　以上のように、各部分データと予測データとの類似度を加味して予測モデルの学習を行うことにより、予測モデルの予測精度を向上させることができる。例えば、顧客の行動が季節等により周期的に変化する場合、予測モデルの予測精度を向上させることができる。例えば、特定の月（例えば、１２月）の顧客の行動が他の月と大きく異なる場合、その月の予測分析を行う場合、１年前の同じ月の部分データに対する重みを大きくすることにより、予測精度を向上させることができる。

　なお、以上の例では、学習データを１か月単位で分割する例を示したが、学習データを分割する単位を調整するようにしてもよい。例えば、学習部３２は、図８の学習処理と同様の方法により、学習データを分割する単位を変化させながら（例えば、１週間、１か月、２か月等）、分割単位毎の予測精度を計算し、予測精度に基づいて、分割単位を設定するようにしてもよい。

　また、この実施の形態では、学習処理において予測データが生成される。従って、学習処理で生成された予測データを用いることにより、予測処理において予測データを生成する処理を削減することができる。

　＜＜４．第４の実施の形態＞＞
　次に、図１３及び図１４を参照して、本技術の第４の実施の形態について説明する。

　なお、第４の実施の形態は、上述した実施の形態と比較して、学習処理及び予測処理が異なる。具体的には、学習データが複数の部分データに分割され、部分データ毎に予測モデルが生成され、複数の予測モデルを用いて予測分析が行われる。

　　＜学習処理の第４の実施の形態＞
　まず、図１３のフローチャートを参照して、情報処理システム１１により実行される学習処理の第４の実施の形態について説明する。

　ステップＳ４０１において、図２のステップＳ１の処理と同様に、学習データ生成処理が行われる。すなわち、２０１８年５月から２０１９年４月までの更新対象者の契約期間中の顧客情報に基づいて、学習データが生成される。

　ステップＳ４０２において、図１０のステップＳ３０２の処理と同様に、学習データが分割される。これにより、例えば、２０１８年５月から２０１９年４月までの各月の更新対象者毎に学習データが分割され、各月の更新対象者のデータサンプルをそれぞれ含む１２個の部分データが生成される。

　ステップＳ４０３において、学習部３２は、部分データ毎に予測モデルの学習を行う。これにより、２０１８年５月から２０１９年４月までの各月の部分データに基づいて、学習期間がそれぞれ異なる１２個の予測モデルが生成される。

　なお、以下、ある月の部分データに基づいて生成された予測モデルを、その月の予測モデルと称する。例えば、２０１９年４月の部分データに基づいて生成された予測モデルを、２０１９年４月の予測モデルと称する。

　ステップＳ４０４において、情報処理システム１１は、予測モデルを更新する。具体的には、学習部３２は、ステップＳ４０３の処理で計算した各予測モデルのパラメータを予測部２３に供給する。予測部２３は、各予測モデルのパラメータを更新する。

　その後、学習処理は終了する。

　なお、例えば、この学習処理が毎月定期的に行われる場合、１か月前の２０１９年３月までの予測モデルは、すでに生成されている。従って、例えば、２０１９年４月の学習データのみを生成し、２０１９年４月の学習データに基づいて、２０１９年４月の予測モデルを生成するようにすることも可能である。これにより、学習処理の負荷を軽減することができる。

　　＜予測処理の第２の実施の形態＞
　次に、図１４を参照して、図１３の学習処理に対応して、情報処理システム１１により実行される予測処理について説明する。

　ステップＳ４５１において、図７のステップＳ１０１の処理と同様に、予測データが生成される。すなわち、２０１９年５月の更新対象者の契約期間中の顧客情報に基づいて、予測データが生成される。

　ステップＳ４５２において、図１０のステップＳ３０４の処理と同様に、類似度を算出する部分データが選択される。

　ステップＳ４５３において、図１０のステップＳ３０５の処理と同様に、類似度算出処理が行われる。これにより、選択された部分データと予測データとの類似度が算出される。

　ステップＳ４５４において、図１０のステップＳ３０６の処理と同様に、全ての部分データの類似度を算出したか否かが判定される。まだ全ての部分データの類似度が算出されていないと判定された場合、処理はステップＳ４５２に戻る。

　その後、ステップＳ４５４において、全ての部分データの類似度が算出されたと判定されるまで、ステップＳ４５２乃至ステップＳ４５４の処理が繰り返し実行される。

　一方、ステップＳ４５４において、全ての部分データの類似度が算出されたと判定された場合、処理はステップＳ４５５に進む。

　ステップＳ４５５において、予測部２３は、類似度に基づいて、各予測モデルに対する重みを設定する。具体的には、予測部２３は、予測モデルに対応する学習データ、すなわち、予測モデルの学習に用いた学習データの予測データとの類似度が高くなるほど、その予測モデルに対する重みを大きくする。一方、予測部２３は、予測モデルに対応する学習データの予測データとの類似度が低くなるほど、その予測モデルに対する重みを小さくする。

　ステップＳ４５６において、予測部２３は、各予測モデル、各予測モデルに対する重み、及び、予測データに基づいて、予測分析を行う。具体的には、予測部２３は、各予測モデルに予測データを適用することにより、予測対象月の各更新対象者の退会確率を予測モデル毎に予測する。これにより、各更新対象者について、予測モデル毎に複数の退会確率が予測される。

　次に、予測部２３は、各予測モデルに対する重みを用いて、各更新対象者の予測モデル毎の退会確率の加重平均を計算することにより、各更新対象者の最終的な退会確率を計算する。

　その後、予測処理は終了する。

　以上のように、各部分データに基づいて予測モデルを生成し、各部分データと予測データとの類似度を加味して各予測モデルの予測結果を合成することにより、予測精度を向上させることができる。例えば、第３の実施の形態と同様に、顧客の行動が季節等により周期的に変化する場合、予測精度を向上させることができる。

＜＜５．第５の実施の形態＞＞
　次に、図１５及び図１６を参照して、本技術の第５の実施の形態について説明する。

　なお、第５の実施の形態は、予測データを加味して学習処理を行うか否かを選択して学習処理を行うようにするものである。

　　＜学習処理の第５の実施の形態＞
　図１５のフローチャートを参照して、情報処理システム１１により実行される学習処理の第５の実施の形態について説明する。

　ステップＳ５０１において、学習部３２は、予測データを加味した学習処理の実行の判定処理を行う。

　ステップＳ５０２において、学習部３２は、ステップＳ５０１の処理の結果に基づいて、予測データを加味した学習処理を行うか否かを判定する。予測データを加味した学習処理を行うと判定された場合、処理はステップＳ５０３に進む。

　ステップＳ５０３において、学習部３２は、予測データを加味した学習処理を行う。換言すれば、学習部３２は、学習データ及び予測データに基づいた学習方法により、予測モデルの学習を行う。

　その後、学習処理は終了する。

　一方、ステップＳ５０２において、予測データを加味した学習処理を行わないと判定された場合、処理はステップＳ５０４に進む。

　ステップＳ５０４において、学習部３２は、予測データを加味せずに学習処理を行う。換言すれば、学習部３２は、予測データを用いずに、学習データ（のみ）に基づいた学習方法により、予測モデルの学習を行う。

　その後、学習処理は終了する。

　ここで、この学習処理の具体例について説明する。

　例えば、学習部３２は、学習データと予測データとの類似度に基づいて、予測データを加味した学習処理を行うか否かを判定する。

　例えば、学習部３２は、予測データ内のデータサンプル数と同じ数のデータサンプルを学習データから無作為に抽出する。そして、学習部３２は、抽出したデータサンプルを含む学習データと予測データとの類似度を算出する。

　なお、類似度の算出方法は、特に限定されないが、例えば、図１１を参照して上述した方法を適用することが可能である。

　そして、例えば、学習データと予測データとの類似度が所定の閾値未満である場合、学習データの特徴と予測データの特徴が大きく異なるため、予測データを加味した学習処理が行われる。例えば、図３、図８、図１０、又は、図１３の学習処理が行われる。これにより、予測モデルの予測精度が向上する。

　一方、学習データと予測データとの類似度が所定の閾値以上である場合、学習データの特徴と予測データの特徴があまり変わらない。従って、予測データを加味せずに学習処理が行われる。これにより、学習処理の負荷が軽減され、学習時間が短縮される。

　また、例えば、学習部３２は、学習データをそれぞれ異なる期間の複数の部分データに分類し、部分データ間の類似度に基づいて、予測データを加味した学習処理を行うか否かを判定する。

　例えば、学習部３２は、学習データを月単位で分割し、月毎の部分データを生成する。そして、学習部３２は、例えば、各部分データ間の類似度をそれぞれ算出する。

　そして、例えば、部分データ間の類似度の差の平均が所定の閾値以上である場合、部分データ間の変化が大きく、学習データの特徴と予測データの特徴が大きく異なる可能性が高い。従って、予測データを加味した学習処理が行われる。例えば、図３、図８、図１０、又は、図１３の学習処理が行われる。これにより、予測モデルの予測精度が向上する。

　一方、部分データ間の類似度の差の平均が所定の閾値未満である場合、部分データ間の変化が小さく、学習データの特徴と予測データの特徴が大きく異なる可能性が低い。従って、予測データを加味せずに学習処理が行われる。これにより、学習処理の負荷が軽減され、学習時間が短縮される。

　或いは、例えば、学習部３２は、部分データ間の類似度の時系列の変化に基づいて、学習方法を選択する。

　例えば、学習部３２は、最も古い月の部分データと他の各月の部分データとの類似度をそれぞれ算出する。そして、部分データ間の時間間隔が長くなるにつれて、類似度が所定の閾値以上低下している場合、学習データの時系列の変化が大きく、学習データの特徴と予測データの特徴が大きく異なる可能性が高い。従って、予測データを加味した学習処理が行われる。例えば、図３、図８、図１０、又は、図１３の学習処理が行われる。これにより、予測モデルの予測精度が向上する。

　一方、部分データ間の時間間隔が長くなっても、類似度の低下が所定の閾値未満である場合、学習データの時系列の変化が小さく、学習データの特徴と予測データの特徴が大きく異なる可能性が低い。従って、予測データを加味せずに学習処理が行われる。これにより、学習処理の負荷が軽減され、学習時間が短縮される。

　さらに、例えば、学習部３２は、予測データを加味した場合と予測データを加味しなかった場合との予測精度を推定し、推定した予測精度に基づいて、予測データを加味した学習処理を行うか否かを判定する。

　例えば、学習部３２は、図８を参照して上述した方法と同様の方法により、学習データ、及び、仮想の予測データに基づいて、予測データを加味した学習処理を行い、生成した予測モデルの予測精度を算出する。また、学習部３２は、学習データのみに基づいて、予測データを加味しない学習処理を行い、生成した予測モデルの予測精度を算出する。さらに、学習部３２は、予測データを加味した場合の予測精度と予測データを加味しない場合の予測精度との差を、予測精度の改善率の推定値として算出する。

　そして、例えば、学習部３２は、予測精度の改善率の推定値が所定の閾値以上である場合、予測データを加味した学習処理を行う。これにより、予測モデルの予測精度が向上する。一方、例えば、学習部３２は、予測精度の改善率の推定値が所定の閾値未満である場合、予測データを加味せずに学習処理が行われる。これにより、学習処理の負荷が軽減され、学習時間が短縮される。

　なお、予測モデルの予測精度に加えて、学習時間（予測モデルの学習に要した時間）も加味して、予測データを加味して学習処理を行うか否かを判定するようにしてもよい。

　例えば、学習部３２は、予測データを加味した場合の学習処理に要した時間÷予測データを加味しない場合の学習処理に要した時間を、学習時間の増加率の推定値として算出する。この学習時間の増加率は、予測データを加味した場合の学習処理に要した時間と、予測データを加味しない場合の学習処理に要した時間との差を表す。

　そして、例えば、学習部３２は、予測精度の改善度の推定値が所定の閾値以上、かつ、学習時間の増加率の推定値が所定の閾値未満である場合、予測データを加味した学習処理を行う。これにより、学習時間の増大が抑制されつつ、予測モデルの予測精度が向上する。一方、例えば、学習部３２は、予測精度の改善度の推定値が所定の閾値未満、又は、学習時間の増加率の推定値が所定の閾値以上である場合、予測データを加味せずに学習処理を行う。これにより、学習処理の負荷が軽減され、学習時間が短縮される。

　なお、例えば、ＵＩ部２４が、図１６の設定画面を提示し、予測データを加味した学習を行うか否かをユーザに選択させるようにしてもよい。

　図１６の設定画面には、予測データを加味した場合の予測精度の推定値（７９．６％）、予測データを加味しない場合の予測精度の推定値（７４．０％）、及び、予測精度の改善率の推定値（５．６％）が表示されている。また、学習時間（図内では計算時間）の増加率（２．３倍）が表示されている。

　また、学習期間の入力欄１０１及び予測期間の入力欄１０２が表示されている。

　さらに、通常の学習を実行するための実行ボタン１０３、及び、予測データを加味した学習を実行するための実行ボタン１０４が表示されている。

　これにより、例えば、ユーザは、予測精度の改善率、及び、学習時間の増加率を考慮して、ユーザのニーズにあった学習方法を選択し、実行させることができる。

　＜＜６．変形例＞＞
　以下、上述した本技術の実施の形態の変形例について説明する。

　　＜第１の実施の形態の変形例＞
　例えば、時間情報に加えて、又は、時間情報の代わりに、他の属性を用いて、学習データの各データサンプルの重みを設定するようにしてもよい。

　具体的には、例えば、学習データ及び予測データの各データサンプルが空間情報（例えば、顧客の所在地、データの取得場所等）を有する場合、学習データの各データサンプルの空間情報と、予測データの空間情報との差に基づいて、各データサンプルの重みを設定するようにしてもよい。例えば、予測データから空間的に近いデータサンプルほど重みを大きくし、予測データから空間的に遠いデータサンプルほど重みを小さくするようにしてもよい。

　　＜第２の実施の形態の変形例＞
　例えば、学習期間が重ならないように変化させながら、各学習期間の予測精度を計算するようにしてもよい。

　また、例えば、時間情報に加えて、又は、時間情報の代わりに、他の属性を用いて、学習データの範囲を変化させながら予測精度を計算し、予測モデルの学習に用いる学習データの範囲を設定するようにしてもよい。

　具体的には、例えば、学習データの各データサンプルが空間情報を有する場合、学習データの空間的な範囲を変化させながら予測精度を計算し、予測モデルの学習に用いる学習データの空間的な範囲（例えば、顧客の地域、データが取得された地域等）を設定するようにしてもよい。この場合、例えば、仮想の予測データには、学習データ内の他の部分データより実際の予測データに空間的に近いデータが用いられる。

　　＜第３の実施の形態の変形例＞
　例えば、時間情報に加えて、又は、時間情報の代わりに、他の属性を用いて、学習データを複数の範囲に分割し、各部分データと予測データとの類似度を算出するようにしてもよい。

　具体的には、例えば、学習データの各データサンプルが空間情報を有する場合、学習データを空間的に複数の範囲に分割することにより、部分データを生成するようにしてもよい。また、例えば、所定のクラスタリング手法により、学習データを分割するようにしてもよい。

　　＜第４の実施の形態の変形例＞
　例えば、時間情報に加えて、又は、時間情報の代わりに、他の属性を用いて、学習データを複数の範囲に分割し、各学習データをそれぞれ用いて複数の予測モデルを生成するようにしてもよい。

　例えば、学習データの各データサンプルが空間情報を有する場合、学習データを空間的に複数の範囲に分割することにより、部分データを生成するようにしてもよい。また、例えば、所定のクラスタリング手法により、学習データを複数の範囲に分割するようにしてもよい。

　　＜第５の実施の形態の変形例＞
　例えば、時間情報に加えて、又は、時間情報の代わりに、他の属性を用いて、学習データを複数の範囲に分割し、各部分データ間の類似度に基づいて、予測データを加味した学習処理を行うか否かを判定するようにしてもよい。

　具体的には、例えば、学習データの各データサンプルが空間情報を有する場合、学習データを空間的に複数の範囲に分割し、各部分データ間の類似度に基づいて、予測データを加味した学習処理を行うか否かを判定するようにしてもよい。

　　＜学習データの生成方法に関する変形例＞
　例えば、予測データに基づいて、学習データを生成するようにしてもよい。

　具体的には、例えば、予測データに基づいて、学習データの特徴量ベクトルを生成するようにしてもよい。より具体的には、例えば、予測データを加味して、特徴量ベクトルの生成に用いる特徴量を設定するようにしてもよい。

　例えば、学習期間内の顧客情報において顧客間の差がほとんどない項目は、顧客の特徴が顕著に現れないため、特徴量ベクトルに用いられない場合がある。しかし、予測期間内の顧客情報において、当該項目の顧客間の差が所定の閾値超える場合には、当該項目を特徴量ベクトルの生成に用いるようにしてもよい。すなわち、特徴量ベクトルが、当該項目により表される特徴量を含むようにしてもよい。これは、例えば、顧客の傾向や行動が大きく変化した場合等が想定される。

　逆に、例えば、学習期間内の顧客情報において顧客間の差が大きすぎる項目、例えば、カテゴリカル値で表される項目において、顧客数（データ数）に対して設定された値の種類の数（ユニーク数）が多すぎる項目も、特徴量ベクトルに用いられない場合がある。しかし、予測期間内の顧客情報において、当該項目において、データ数に対するユニーク数の割合が所定の閾値未満の場合には、当該項目を特徴量ベクトルの生成に用いるようにしてもよい。すなわち、特徴量ベクトルが、当該項目により表される特徴量を含むようにしてもよい。

　また、例えば、学習期間内の顧客情報においてデータの欠損率が高い項目は、特徴量ベクトルに用いられない場合がある。しかし、予測期間内の顧客情報において、当該項目の顧客情報における欠損率が所定の閾値未満である場合には、当該項目を特徴量ベクトルの生成に用いるようにしてもよい。すなわち、特徴量ベクトルが、当該項目により表される特徴量を含むようにしてもよい。これは、例えば、顧客から情報を収集する項目が新たに追加された場合等が想定される。

　さらに、例えば、学習データだけでなく、予測データも用いて、各種の統計量（例えば、平均、分散、最小値、最大値、出現頻度、欠損率等）を算出し、算出した統計量を用いて、特徴量ベクトルを生成するようにしてもよい。この場合、学習データと予測データとで異なる重みを用いて統計量を算出するようにしてもよい。

　また、例えば、学習データ及び予測データを用いて算出した統計量に基づいて、学習データにおける特異なデータサンプルを特定するようにしてもよい。

　　＜その他の変形例＞
　学習データを範囲（例えば、期間、領域等）が異なる部分データに分割する場合、各部分データの範囲が互いに重ならないようにしてもよいし、一部が重なるようにしてもよい。後者の場合、１つのデータサンプルが、複数の部分データに含まれる場合がある。換言すれば、複数の部分データが、同じデータサンプルを含む場合がある。

　また、図１の情報処理システム１１の構成は、その一例であり、変更することが可能である。

　例えば、データ生成部３１を学習処理部２２とは別に設けたり、予測データ生成部４２を予測部２３に設けたりすることが可能である。

　さらに、例えば、情報処理システム１１を１つの情報処理装置により構成したり、複数の情報処理装置により構成したりすることが可能である。

　また、例えば、学習データの一部を仮想の予測データとして用いて、複数の異なる学習方法（例えば、第１乃至第４の実施の形態の学習方法）による予測モデルの予測精度を計算し、その結果に基づいて、予測モデルの学習方法を選択するようにしてもよい。

　さらに、本技術は、上述したサービスに関する予測分析を行う場合だけでなく、各種の予測分析を行う場合に適用することが可能である。すなわち、本技術は、学習データを用いて予測モデルの学習を行い、予測モデル及び予測データを用いて各種の予測分析を行う場合に適用することができる。

　＜＜７．その他＞＞
　　＜コンピュータの構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図１７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータ１０００において、CPU（Central Processing Unit）１００１，ROM（Read Only Memory）１００２，RAM（Random Access Memory）１００３は、バス１００４により相互に接続されている。

　バス１００４には、さらに、入出力インターフェース１００５が接続されている。入出力インターフェース１００５には、入力部１００６、出力部１００７、記録部１００８、通信部１００９、及びドライブ１０１０が接続されている。

　入力部１００６は、入力スイッチ、ボタン、マイクロフォン、撮像素子などよりなる。出力部１００７は、ディスプレイ、スピーカなどよりなる。記録部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインターフェースなどよりなる。ドライブ１０１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体１０１１を駆動する。

　以上のように構成されるコンピュータ１０００では、CPU１００１が、例えば、記録部１００８に記録されているプログラムを、入出力インターフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ１０００（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータ１０００では、プログラムは、リムーバブル記録媒体１０１１をドライブ１０１０に装着することにより、入出力インターフェース１００５を介して、記録部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記録部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記録部１００８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　＜構成の組み合わせ例＞
　本技術は、以下のような構成をとることもできる。

（１）
　１以上の情報処理装置を備える情報処理システムが、
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う
　情報処理方法。
（２）
　前記情報処理システムは、
　前記学習データに含まれる各データサンプルに対して、前記予測データとの関係に基づいて重みを設定し、
　各前記データサンプル、及び、各前記データサンプルに対する重みに基づいて、前記予測モデルの学習を行う
　前記（１）に記載の情報処理方法。
（３）
　前記情報処理システムは、
　前記データサンプルと前記予測データとの間の所定の属性の差に基づいて、前記重みを設定する
　前記（２）に記載の情報処理方法。
（４）
　前記属性は、前記データサンプルと前記予測データとの時間的な差に基づいて前記重みを設定する
　前記（３）に記載の情報処理方法。
（５）
　前記情報処理システムは、
　前記学習データの複数の異なる範囲の部分データにそれぞれ基づいて、複数の前記予測モデルの学習を行い、
　前記学習データの一部を仮想の予測データとして用いて、各前記予測モデルの予測精度を計算し、
　各前記予測モデルの予測精度に基づいて、前記予測モデルの学習に用いる前記学習データの範囲を設定する
　前記（１）乃至（４）のいずれかに記載の情報処理方法。
（６）
　前記情報処理システムは、
　前記学習データの複数の異なる期間の前記部分データにそれぞれ基づいて、各前記予測モデルの学習を行い、
　各前記予測モデルの予測精度に基づいて、前記予測モデルの学習に用いる前記学習データの期間を設定する
　前記（５）に記載の情報処理方法。
（７）
　前記情報処理システムは、
　前記学習データを複数の部分データに分割し、
　各前記部分データと前記予測データとの類似度を計算し、
　前記類似度に基づいて各前記部分データに対する重みを設定し、
　各前記部分データ、及び、各前記部分データに対する重みに基づいて、前記予測モデルの学習を行う
　前記（１）乃至（４）のいずれかに記載の情報処理方法。
（８）
　前記情報処理システムは、
　前記学習データを複数の異なる期間の前記部分データに分割する
　前記（７）に記載の情報処理方法。
（９）
　前記情報処理システムは、
　前記予測データに基づいて、前記学習データを生成し、
　生成した前記学習データに基づいて、前記予測モデルの学習を行う
　前記（１）乃至（８）のいずれかに記載の情報処理方法。
（１０）
　前記情報処理システムは、
　前記予測データに基づいて、前記学習データに用いる特徴量を設定する
　前記（９）に記載の情報処理方法。
（１１）
　前記情報処理システムは、
　前記学習データと前記予測データとの類似度に基づいて、前記学習データ及び前記予測データに基づく学習方法、又は、前記学習データに基づく学習方法を選択して、前記予測モデルの学習を行う
　前記（１）乃至（１０）のいずれかに記載の情報処理方法。
（１２）
　前記情報処理システムは、
　前記学習データの複数の異なる範囲の部分データ間の類似度に基づいて、前記学習データ及び前記予測データに基づく学習方法、又は、前記学習データに基づく学習方法を選択して、前記予測モデルの学習を行う
　前記（１）乃至（１０）のいずれかに記載の情報処理方法。
（１３）
　前記情報処理システムは、
　前記学習データの複数の異なる期間の前記部分データ間の類似度の時系列の変化に基づいて、前記学習方法を選択する
　前記（１２）に記載の情報処理方法。
（１４）
　前記情報処理システムは、
　前記学習データの一部を仮想の予測データとして用いて、前記学習データ及び前記予測データに基づく学習方法による第１の予測モデルの予測精度、並びに、前記学習データのみに基づく学習方法による第２の予測モデルの予測精度を計算し、
　前記第１の予測モデルの予測精度及び前記第２の予測モデルの予測精度に基づいて、前記学習方法を選択して、前記予測モデルの学習を行う
　前記（１）乃至（１０）のいずれかに記載の情報処理方法。
（１５）
　前記情報処理システムは、
　さらに前記第１の予測モデルの学習に要した時間及び前記第２の予測モデルの学習に要した時間に基づいて、前記学習方法を選択する
　前記（１４）に記載の情報処理方法。
（１６）
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う学習部を
　備える情報処理装置。
（１７）
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う
　処理をコンピュータに実行させるためのプログラム。
（１８）
　１以上の情報処理装置を備える情報処理システムが、
　学習データ及び予測データに基づいて学習された予測モデルと、前記予測データとに基づいて、予測分析を行う
　情報処理方法。
（１９）
　学習データ及び予測データに基づいて学習された予測モデルと、前記予測データとに基づいて、予測分析を行う予測部を
　備える情報処理装置。
（２０）
　学習データ及び予測データに基づいて学習された予測モデルと、前記予測データとに基づいて、予測分析を行う
　処理をコンピュータに実行させるためのプログラム。
（２１）
　１以上の情報処理装置を備える情報処理システムが、
　学習データの複数の異なる範囲の部分データに基づいてそれぞれ学習された複数の予測モデルに対する重みを、各前記予測モデルに対応する前記部分データと予測データとの類似度に基づいてそれぞれ設定し、
　各前記予測モデル、各前記予測モデルに対する重み、及び、前記予測データに基づいて、予測分析を行う
　情報処理方法。
（２２）
　各前記予測モデルは、前記学習データの複数の異なる期間の前記部分データに基づいてそれぞれ学習される
　前記（２１）に記載の情報処理方法。
（２３）
　学習データの複数の異なる範囲の部分データに基づいてそれぞれ学習された複数の予測モデルに対する重みを、各前記予測モデルに対応する前記部分データと予測データとの類似度に基づいてそれぞれ設定し、各前記予測モデル、各前記予測モデルに対する重み、及び、前記予測データに基づいて、予測分析を行う予測部を
　備える情報処理装置。
（２４）
　学習データの複数の異なる範囲の部分データに基づいてそれぞれ学習された複数の予測モデルに対する重みを、各前記予測モデルに対応する前記部分データと予測データとの類似度に基づいてそれぞれ設定し、
　各前記予測モデル、各前記予測モデルに対する重み、及び、前記予測データに基づいて、予測分析を行う
　処理をコンピュータに実行させるためのプログラム。
（２５）
　１以上の情報処理装置を備える情報処理システムが、
　学習データの複数の異なる範囲の部分データにそれぞれ基づいて、複数の予測モデルの学習を行う
　情報処理方法。
（２６）
　前記情報処理システムは、
　前記学習データの複数の異なる期間の前記部分データにそれぞれ基づいて、各前記予測モデルの学習を行う
　前記（２５）に記載の情報処理方法。
（２７）
　学習データの複数の異なる範囲の部分データにそれぞれ基づいて、複数の予測モデルの学習を行う学習部を
　備える情報処理装置。
（２８）
　学習データの複数の異なる範囲の部分データにそれぞれ基づいて、複数の予測モデルの学習を行う
　処理をコンピュータに実行させるためのプログラム。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　１１　情報処理システム，　２１　顧客・契約データベース，　２２　学習処理部，　２３　予測部，　２４　ＵＩ部，　３１　データ生成部，　３２　学習部，　４１　学習データ生成部，　４２　予測データ生成部

Claims

　１以上の情報処理装置を備える情報処理システムが、
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う
　情報処理方法。
　前記情報処理システムは、
　前記学習データに含まれる各データサンプルに対して、前記予測データとの関係に基づいて重みを設定し、
　各前記データサンプル、及び、各前記データサンプルに対する重みに基づいて、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記データサンプルと前記予測データとの間の所定の属性の差に基づいて、前記重みを設定する
　請求項２に記載の情報処理方法。
　前記属性は、前記データサンプルと前記予測データとの時間的な差に基づいて前記重みを設定する
　請求項３に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データの複数の異なる範囲の部分データにそれぞれ基づいて、複数の前記予測モデルの学習を行い、
　前記学習データの一部を仮想の予測データとして用いて、各前記予測モデルの予測精度を計算し、
　各前記予測モデルの予測精度に基づいて、前記予測モデルの学習に用いる前記学習データの範囲を設定する
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データの複数の異なる期間の前記部分データにそれぞれ基づいて、各前記予測モデルの学習を行い、
　各前記予測モデルの予測精度に基づいて、前記予測モデルの学習に用いる前記学習データの期間を設定する
　請求項５に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データを複数の部分データに分割し、
　各前記部分データと前記予測データとの類似度を計算し、
　前記類似度に基づいて各前記部分データに対する重みを設定し、
　各前記部分データ、及び、各前記部分データに対する重みに基づいて、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データを複数の異なる期間の前記部分データに分割する
　請求項７に記載の情報処理方法。
　前記情報処理システムは、
　前記予測データに基づいて、前記学習データを生成し、
　生成した前記学習データに基づいて、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記予測データに基づいて、前記学習データに用いる特徴量を設定する
　請求項９に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データと前記予測データとの類似度に基づいて、前記学習データ及び前記予測データに基づく学習方法、又は、前記学習データに基づく学習方法を選択して、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データの複数の異なる範囲の部分データ間の類似度に基づいて、前記学習データ及び前記予測データに基づく学習方法、又は、前記学習データに基づく学習方法を選択して、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データの複数の異なる期間の前記部分データ間の類似度の時系列の変化に基づいて、前記学習方法を選択する
　請求項１２に記載の情報処理方法。
　前記情報処理システムは、
　前記学習データの一部を仮想の予測データとして用いて、前記学習データ及び前記予測データに基づく学習方法による第１の予測モデルの予測精度、並びに、前記学習データのみに基づく学習方法による第２の予測モデルの予測精度を計算し、
　前記第１の予測モデルの予測精度及び前記第２の予測モデルの予測精度に基づいて、前記学習方法を選択して、前記予測モデルの学習を行う
　請求項１に記載の情報処理方法。
　前記情報処理システムは、
　さらに前記第１の予測モデルの学習に要した時間及び前記第２の予測モデルの学習に要した時間に基づいて、前記学習方法を選択する
　請求項１４に記載の情報処理方法。
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う学習部を
　備える情報処理装置。
　予測モデルを用いた予測分析に用いられる予測データ、及び、学習データに基づいて、前記予測モデルの学習を行う
　処理をコンピュータに実行させるためのプログラム。