WO2017163277A1

WO2017163277A1 - 情報処理システム、情報処理方法および情報処理プログラム

Info

Publication number: WO2017163277A1
Application number: PCT/JP2016/001751
Authority: WO
Inventors: 洋介本橋; 圭介梅津
Original assignee: 日本電気株式会社
Priority date: 2016-03-25
Filing date: 2016-03-25
Publication date: 2017-09-28
Also published as: US20190034945A1; JPWO2017163277A1; JP6604431B2

Abstract

複数の分類により特定される予測対象を、予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理システム８０であって、受付部８１と、集計部８２とを備えている。受付部８１は、予測対象を特定する分類を受け付ける。集計部８２は、予測対象のうち受け付けられた分類により特定される予測対象について、予測対象に対応する予測モデルにより定まる寄与度を、変数ごとに集計する。

Description

情報処理システム、情報処理方法および情報処理プログラム

　本発明は、予測対象に寄与し得る要因を分析する情報処理システム、情報処理方法および情報処理プログラムに関する。

　大量の実績データに基づいて様々な分析を行う方法が知られている。ＰＯＳ（Point of sale ）データは、各店舗の売上実績を表わすデータの一例である。例えば、全国に１０００店舗の小売店を展開する企業が、１店舗あたり２０００種類の商品の売上数量を月ごとに集計している場合、このＰＯＳデータの数は、１年で、１０００（店舗）×１２（月／年）×２０００（種類／月・店舗）＝２４，０００，０００になる。

　このようなＰＯＳデータを分析する方法として、例えば、ＥＸＣＥＬ（登録商標）のピボットテーブルのような機能を有する集計ツールを利用する方法が挙げられる。ユーザがこのような集計ツールにＰＯＳデータを読み込ませることで、商品の売上数を、店舗ごと、季節ごと、商品ごとなど、様々な観点で集計でき、ミクロな観点からマクロな観点まで、売上に寄与した要因を自由に分析することが可能になる。

　他にも、このような統計に特化したソフトウェアの例として、Ｔａｂｌｅａｕ（登録商標）や、ＳＡＳ（登録商標）、ＳＰＳＳ（登録商標）などが知られている。

　また、特許文献１には、複数のデータを用いて不特定多数者を集計するシステムが記載されている。特許文献１に記載されたシステムは、入力データに基づいて所定の場所への来場者を計数して来場者数データを取得するとともに、入力データに基づいて来場者の特性を推定して特性推定データを取得する。

再特ＷＯ２００９／０４１２４２号

　特許文献１に記載の技術によれば、入力データに基づいて所定の場所への来場者数を計数することはできる。しかし、特許文献１に記載の技術は、所定の場所への来場者数について、どのような要因が来場者数にどの程度寄与したのかを分析することは考慮されていない。

　そこで、本発明は、予測対象に寄与し得る要因を分析できる情報処理システム、情報処理方法および情報処理プログラムを提供することを目的とする。

　本発明による情報処理システムは、複数の分類により特定される予測対象を、予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理システムであって、予測対象を特定する分類を受け付ける受付部と、予測対象のうち受け付けられた分類により特定される予測対象について、予測対象に対応する予測モデルにより定まる寄与度を、変数ごとに集計する集計部とを備えたことを特徴とする。

　本発明による情報処理方法は、複数の分類により特定される予測対象を、予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理方法であって、予測対象を特定する分類を受け付け、予測対象のうち受け付けられた分類により特定される予測対象について、予測対象に対応する予測モデルにより定まる寄与度を、変数ごとに集計することを特徴とする。

　本発明による情報処理プログラムは、複数の分類により特定される予測対象を、予測対象に影響し得る変数を含む予測モデルを用いて予測するコンピュータに適用される情報処理プログラムであって、コンピュータに、予測対象を特定する分類を受け付ける受付処理、および、予測対象のうち受け付けられた分類により特定される予測対象について、予測対象に対応する予測モデルにより定まる寄与度を、変数ごとに集計する集計処理を実行させることを特徴とする。

　本発明によれば、予測対象に寄与し得る要因を分析できる。

本発明による情報処理システムの第１の実施形態の構成例を示すブロック図である。予測対象と複数の分類とを対応付けて記憶する例を示す説明図である。説明変数の例を示す説明図である。予測対象の予測モデルの例を示す説明図である。説明変数の実測値の具体例を示す説明図である。予測対象を特定する処理の例を示す説明図である。説明変数の重みの総和を算出する処理の例を示す説明図である。第１の実施形態の情報処理システムの動作例を示すフローチャートである。集計対象の予測モデルを特定する動作例を示すフローチャートである。説明変数ごとに算出された積の総和を算出する処理の例を示す説明図である。第２の実施形態の情報処理システムの動作例を示すフローチャートである。複数の予測モデルを用いて要因分析する処理の例を示す説明図である。カテゴリが設定された説明変数の例を示す説明図である。第３の実施形態の情報処理システムの動作例を示すフローチャートである。カテゴリごとに寄与度を集計した場合の例を示す説明図である。場合分け予測器の例を示す説明図である。集計画面例を示す説明図である。ドロップダウンリストに含まれる情報の例を示す説明図である。予測対象に寄与する要因を出力した結果の例を示す説明図である。予測対象に寄与する要因を出力した結果の他の例を示す説明図である。予測対象に寄与するカテゴリを出力した結果の例を示す説明図である。予測対象に寄与するカテゴリを出力した結果の他の例を示す説明図である。上位分類および下位分類のいずれの集計結果も出力する例を示す説明図である。予測対象の予測モデルの他の例を示す説明図である。予測対象のカテゴリごとの重みを表形式で表した例を示す説明図である。集計結果をヒートマップ形式で出力した例を示す説明図である。集計結果をバランスチャートで出力した例を示す説明図である。各説明変数の寄与度の比率を可視化した例を示す説明図である。カテゴリに属する説明変数の寄与度を出力する例を示す説明図である。予測対象を変更した例を示す説明図である。予測対象を変更した他の例を示す説明図である。本発明による情報処理システムの概要を示すブロック図である。

　特許文献１に記載されているように、情報の分析には、過去の大量の実績データを利用することが一般的である。一方、情報の分析には、過去の実績データそのものだけでなく、過去の実績データに基づいて予測対象ごとに学習された予測モデルを利用することも考えられる。実績データに基づいて適切に学習された予測モデルは、その実績データの性質を適切に反映していると考えられる。このため、このような予測モデルに基づいて、予測対象に寄与し得る要因の分析を行うことが可能になる。

　ただし、予測モデルは結果を予測するために用いられることが一般的であり、大量の予測モデルそのものを要因分析に利用することは通常行われていない。予測対象ごとに予測モデルが学習される場合には、予測対象が大量に存在すると予測モデルも大量に存在することになる。本発明者は、大量の予測モデルを集計することにより、予測対象に寄与し得る要因を分析するという着想を得た。

　以下、本発明の実施形態を図面を参照して説明する。以下の説明では、予測モデルを用いて各予測対象の予測が行われるものとし、予測モデルは、予め過去の実績データ等により学習済みであるとする。また、１つの予測対象には、１つの予測モデルが対応付けられる。

　予測モデルは、説明変数と目的変数の相関関係を表す情報である。予測モデルは、例えば、説明変数に基づいて目的とする変数を算出することにより予測対象の結果を予測するためのコンポーネントである。予測モデルは、既に目的変数の値が得られている学習用データと任意のパラメータとを入力として、学習器により生成される。予測モデルは、例えば、入力ｘを正解ｙに写像する関数ｃにより表されてもよい。予測モデルは、予測対象の数値を予測するものであってもよいし、予測対象のラベルを予測するものであってもよい。予測モデルは、目的変数の確率分布を記述する変数を出力してもよい。予測モデルは、「モデル」、「学習モデル」、「推定モデル」、「予測式」または「推定式」などと記載されることもある。

　本実施形態において、予測モデルは、予測対象の予測結果に寄与し得る要因を示す１以上の説明変数を含む予測式で表される。予測モデルは、例えば、複数の説明変数を含む線形回帰式で目的変数が表される。前述の例では、目的変数が正解ｙに相当し、説明変数が入力ｙに相当する。例えば、予測モデルの解釈性を高めたり過学習を防いだりする目的で、一つの予測モデルに含まれる説明変数の最大個数が制限されているとしてもよい。なお、後述するように、１つの予測対象を予測するために用いられる予測式は１つに限定されず、説明変数の値に応じて予測式が選択される場合分け予測器が予測モデルとして用いられてもよい。

　予測対象は、ユーザにより指定された１つ以上の分類に属するものとする。分類は、単独でもよく、階層構造であってもよい。小売店を例に挙げると、予測対象は、例えば、「東京都のＡ店で販売されるオレンジジュースの売上数」である。この場合、予測対象は、販売店舗という分類（東京都＞Ａ店）や、商品という分類（飲料＞果汁飲料＞オレンジジュース）により特定される。ここで、「＞」で示す記号は、分類が階層構造になっていることを示す。

　他にも、予測対象は、例えば「Ａ社が経営するＢ店において２０１６年３月に販売される、Ａ社プライベートブランドのボールペンの売上数」である。この場合、予測対象は、販売店舗という分類（Ａ社が経営＞Ｂ店）や、販売時期という分類（２０１６年＞２０１６年３月）や、商品という分類（Ａ社プライベートブランド＞文房具＞ボールペン）により特定される。

実施形態１．
　図１は、本発明による情報処理システムの第１の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム１００は、受付部１０と、集計部２０と、記憶部３０と、出力部４０とを備えている。

　記憶部３０は、予測対象ごとに予測モデルを記憶する。図２～図５は、記憶部３０が記憶する情報の例を示す説明図である。記憶部３０は、予測対象と分類とを対応付けて記憶していてもよい。また、記憶部３０は、説明変数の実測値を記憶していてもよい。ここで、説明変数の実測値とは、例えば、図５に例示するように、実際に測定された各説明変数の値を意味する。

　図２は、記憶部３０が、予測対象と複数の分類とを対応付けて記憶する例を示している。図２に示す例では、予測対象が予測対象ＩＤで一意に識別され、それぞれの予測対象ＩＤに、分類である「店舗」、「商品」および「時期」がそれぞれ対応付けられていることを示す。例えば、予測対象ＩＤ＝１で識別される予測対象は、「店舗」の観点では、東京都のＡ店に分類され、「商品」の観点では、飲料のうち果汁飲料であるアップルジュースに分類され、「時期」の観点では、２０１６年３月に分類されることを示す。

　図３は、説明変数の例を示している。また、図４は、記憶部３０が、予測対象の予測モデルを記憶している例を示している。ここでは、図３に例示する説明変数が、図４に例示する予測モデルで用いられているとする。

　図４に示す例では、表の縦方向が予測対象を示し、表の横方向がその予測対象の予測モデルを表わす説明変数の重みを示す。例えば、予測対象ＩＤ＝１で識別される予測対象の予測モデルは、説明変数ｘ_３，ｘ_７，ｘ_１０，ｘ_１５を用いて表され、それらの重みがそれぞれ１．５，０．６，１．２，２．１であることを示す。例えば、予測モデルが線形回帰式である場合には、予測対象ＩＤ＝１で識別される予測対象の予測モデルは、目的変数をｙとすると、ｙ＝１．５ｘ_３＋０．６ｘ_７＋１．２ｘ_１０＋２．１ｘ_１５である。なお、図４に例示する予測モデルは、一日ごとの商品需要量を予測するものとし、予測モデル（予測式）は、月末に更新されるとする。

　図５は、説明変数の実測値の具体例を示す。例えば、説明変数Ｘ_１０が「その日の最高気温」を表わす変数である場合、図５に例示する実測値は、実際に測定された各日の最高気温の値である。なお、実測値と説明変数との集計期間が異なる場合、予め定めた規則に応じて、実測値を集計し、集計結果を説明変数の実測値としてもよい。例えば、説明変数が、「当該月の最高気温」であり、実測値が「各日の最高気温」である場合、当該月内の最高気温を特定し、その値を実測値としてもよい。

　記憶部３０は、たとえば、磁気ディスク装置により実現される。出力部４０は、集計部２０による集計結果を出力する。また、出力部４０は、出力結果に対するユーザからの入力を受け付けてもよい。出力部４０は、例えば、ディスプレイ装置やタッチパネルにより実現される。

　受付部１０は、予測対象を特定する分類を受け付ける。言い換えると、受付部１０は、要因を分析する予測対象を特定するための分類を受け付ける。受け付ける分類は１つに限られず、複数であってもよい。例えば、２０１６年３月の各店舗の「アップルジュース」の要因分析をする場合、受付部１０は、分類として、「２０１６年３月」および「アップルジュース」を受け付ける。また、分類が階層構造になっている場合、受付部１０は、最下位の分類だけでなく、上位の分類を受け付けてもよい。受付部１０は、例えば、出力部４０に候補となる分類を表示させ、ユーザにより選択された１つ以上の分類を受け付けてもよい。他にも、受付部１０は、通信ネットワークを介して分類を受け付けてもよい。

　集計部２０は、受け付けた分類に基づいて予測対象を特定し、特定された予測対象の予測モデルを特定する。具体的には、集計部２０は、記憶部３０から予測対象の予測モデルを特定する。

　図６は、受け付けた分類に基づいて、図２～図５に例示する情報から予測対象を特定する処理の例を示す説明図である。例えば、２０１６年３月の各店舗の「アップルジュース」の要因分析を行うとして、受付部１０が、「２０１６年３月」および「アップルジュース」を分類として受け付ける。このとき、集計部２０は、図２に例示する表から商品＝「アップルジュース」、時期＝「２０１６年３月」に該当する予測対象ＩＤ＝１，６，１１，１６の予測対象を特定する。そして、集計部２０は、図４に例示する表から、予測対象の予測モデルを特定する。

　なお、受付部１０が、階層構造における上位の分類を受け付けた場合、集計部２０は、その分類に属する全ての下位の分類が指定されたと判断し、該当する分類の予測対象を全て特定してもよい。例えば、図２に示す例で、商品の分類として「果汁飲料」が指定された場合、集計部２０は、予測対象ＩＤ＝１～５で識別される予測対象を特定してもよい。

　そして、集計部２０は、特定した予測モデルに含まれる説明変数ごとに、その説明変数の重みを集計する。具体的には、集計部２０は、特定した予測モデルに含まれる説明変数ごとに重みの総和を算出することで、各説明変数の重みを集計する。予測式が線形回帰式で表される場合、説明変数の重みは係数に対応するため、集計部２０は、説明変数ごとに、その説明変数の係数を集計する。

　説明変数の重みが大きいほど予測結果に寄与する度合いが高いことから、以下の説明では、説明変数ごとに特定される重み、または、所定の観点で集計した重みの集計値を、説明変数の寄与度と記す。なお、説明変数の寄与度を、以下、単に寄与度と記すこともある。

　また、以下の説明では、特定された予測対象の予測モデルに含まれる説明変数ごとの重みの総和を、第一の寄与度と記す。

　図７は、説明変数の重みの総和（第一の寄与度）を算出する処理の例を示す説明図である。図７に示す例では、３種類の予測対象Ｔ_１～Ｔ_３が特定され、それぞれの予測式Ｙ_１～Ｙ_３も特定されていることを示す。また、図７に示す例では、特定された３つの予測式には全部で４種類の説明変数ｘ_１～ｘ_４が含まれているとする。なお、各予測式に全ての説明変数が含まれている必要はない。

　集計部２０は、各説明変数の重みの総和を算出する。図７に示す例では、集計部２０は、説明変数ｘ_１～ｘ_４ごとに係数の総和を算出する。なお、重みの総和を算出する際、各説明変数の寄与する度合いを示すため、重みには係数の絶対値が用いられる。例えば、説明変数ｘ_１の寄与度ｗ_１を算出する場合、集計部２０は、ｗ_１＝｜ａ_１１｜＋｜ａ_３１｜で寄与度を算出する。他の説明変数についても同様である。集計部２０は、集計結果を出力部４０に出力する。

　なお、重みとして係数の絶対値ではなく係数の値が用いられてもよい。具体的には、重みが符号付きの値であってもよい。この場合、集計部２０は、正の係数と負の係数とを相殺しあいながら（すなわち、符号に則して加減算を行うことで）、各説明変数の重みの総和を算出してもよい。また、集計部２０は、ある一つの説明変数について、正の寄与度と負の寄与度とをそれぞれ別個に集計してもよい。このように、集計部２０がある一つの説明変数について符号ごとに寄与度を集計することで、一つの説明変数を二つの説明変数としての観点で利用することが可能になる。

　なお、集計部２０は、各予測式に含まれる係数を標準化してもよい。具体的には、集計部２０は、各予測式の係数の合計値が１になる（すなわち、平均が０、分散が１になる）ようにそれぞれの係数を補正してもよい。例えば、図７に例示する予測式Ｙ_１の場合、集計部２０は、Ｙ_１に含まれる係数ａ_１１，ａ_１２，ａ_１３を標準化する。なお、標準化は、各説明変数の重みの総和を算出した後で、算出された重みの総和に対して行われてもよい。

　また、集計部２０は、算出した各説明変数の寄与度（第一の寄与度）の比率を算出してもよい。具体的には、集計部２０は、第一の寄与度の総和に対する各説明変数の第一の寄与度の比率を、説明変数ごとに算出してもよい。例えば、図７に例示する予測式が存在し、各説明変数ｘ_１～ｘ_４の第一の寄与度がそれぞれｗ_１～ｗ_４であるとする。このとき、集計部２０は、例えば、説明変数ｘ_１の第一の寄与度ｗ_１の比率を、ｗ_１／ｗ_１＋ｗ_２＋ｗ_３＋ｗ_４で算出してもよい。他の説明変数の第一の寄与度の比率の算出方法も同様である。

　さらに、集計部２０は、算出した各説明変数の寄与度を標準化してもよい。具体的には、集計部２０は、各説明変数の寄与度の合計値が１になる（すなわち、平均が０、分散が１になる）ようにそれぞれの寄与度を補正してもよい。例えば、図７に示す例の場合、集計部２０は、算出した各説明変数ｗ_１，ｗ_２，ｗ_３，ｗ_４標準化する。このような標準化をすることで、スケールの異なる他の寄与度と比較することが可能になる。

　このように、集計部２０が各予測式の係数を標準化する、または、寄与度の比率を算出することで、他の説明変数の寄与度との比較が容易になる。

　受付部１０と、集計部２０と、出力部４０とは、プログラム（情報処理プログラム）に従って動作するコンピュータのＣＰＵによって実現される。例えば、プログラムは、記憶部３０に記憶され、ＣＰＵは、そのプログラムを読み込み、プログラムに従って、受付部１０および集計部２０として動作してもよい。また、情報処理システムの機能がＳａａＳ（Software as a Service ）形式で提供されてもよい。

　また、受付部１０と、集計部２０と、出力部４０とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

　また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　次に、本実施形態の情報処理システムの動作を説明する。図８は、第１の実施形態の情報処理システム１００の動作例を示すフローチャートである。まず、受付部１０は、予測対象を特定する分類を受け付ける（ステップＳ１１）。次に、集計部２０は、受け付けた分類から予測対象を特定し（ステップＳ１２）、特定された予測対象に対応する予測モデルにより定まる寄与度を説明変数ごとに集計する（ステップＳ１３）。具体的には、集計部２０は、特定された予測対象の予測モデルに含まれる説明変数の重みの総和を第一の寄与度として、説明変数ごとに算出する。

　次に、受け付けた分類から予測モデルを特定する動作を説明する。図９は、記憶部３０が記憶する予測モデルから、受付部１０が受け付けた情報に基づいて集計対象の予測モデルを特定する動作例を示すフローチャートである。ここでは、記憶部３０は、図２に例示するような予測対象と分類とを対応付けた表と、図４に例示するような予測対象と予測モデルとを対応付けた表とを記憶しているものとする。

　集計部２０は、図２に例示する表から、受け付けた分類が対応付けられた予測対象を特定する（ステップＳ１４）。具体的には、集計部２０は、図２に例示する表から、予測対象を識別する予測対象ＩＤを特定する。そして、集計部２０は、図４に例示する表から、予測対象に対応する予測モデルを特定する（ステップＳ１５）。具体的には、集計部２０は、特定した予測対象ＩＤで図４に例示する表から説明変数および説明変数の重みを特定し、その説明変数を含む予測モデルを特定する。

　以上のように、本実施形態では、受付部１０が、予測対象を特定する分類を受け付け、集計部２０が、受け付けられた分類により特定される予測対象について、その予測対象に対応する予測モデルにより定まる寄与度を、変数ごとに集計する。そのため、予測結果に寄与し得る要因を分析できる。

　すなわち、本実施形態では、受付部１０が予測対象の分類を受け付けることで集計部２０が分析対象を絞り込むことができる。また、集計部２０が、予測対象に寄与し得る要因である各説明変数の重み（係数）に着目して集計するため、ユーザは、各要因の影響度合い（寄与度合い）を把握することが可能になる。

　以下、本実施形態の効果を、具体例を示しながら詳細に説明する。
　本願発明では、大量の予測モデルが作成されている状況が想定される。すなわち、本実施形態では、細かい予測対象ごとに予測モデルが作成され、作成された複数の予測モデルを集計することにより要因分析が行われる。

　例えば、「果汁飲料」という分類と、「果汁飲料」の下位の分類として「オレンジジュース」、「グレープジュース」、「アップルジュース」の３種類のみ存在する状況を想定する。「果汁飲料」に着目した要因分析を行う場合、（１）果汁飲料全体について作成した予測モデルに基づいて要因分析する方法と、（２）オレンジジュース、グレープジュース、アップルジュースのそれぞれに対して作成された予測モデルを集計することにより要因分析する方法とが考えられる。

　本願発明のように、細かい予測対象ごとに予測モデルが作成されている場合、上記（２）のように、個々の予測対象に対して作成された予測モデルを集計することにより要因分析するほうが、要因分析の精度は高くなる。例えば、オレンジジュースにはキャンペーンＡを行い、アップルジュースには別のキャンペーンＢを行ったとする。この場合、「果汁飲料」全体について要因分析するよりも、粒度が細かく作成された個々の予測モデルについて要因分析するほうが、より細かい要因（説明変数）を考慮できるためである。特に、モデルの解釈容易性を上げるためや過学習を防ぐために、予測モデルに含まれる説明変数の種類の上限を制限している場合、より顕著な効果を有する。

　また、細かい単位で予測モデルを作成しておくことで、様々な観点（店舗、商品、時期など）で、自由自在に集計できるという効果も得られる。

　なお、集計部２０は、共通の説明変数の係数を標準化してもよい。具体的には、集計部２０は、各説明変数の係数の合計値が１になる（平均が０、分散が１になる）ようにそれぞれの係数を補正してもよい。例えば、図７に例示する説明変数ｘ_１の場合、集計部２０は、Ｙ_１およびＹ_３に含まれる係数ａ_１１，ａ_３１を標準化する。

　また、集計部２０は、各予測式間で説明変数の係数の比率を算出してもよい。具体的には、集計部２０は、算出された説明変数の係数の総和に対する説明変数の係数の比率を、予測対象ごとに算出してもよい。例えば、図７に例示する説明変数ｘ_１の係数の比率を、ａ_１１／ａ_１１＋ａ_３１で算出してもよい。他の説明変数の係数の比率の算出方法も同様である。

　このように、集計部２０が各説明変数の係数を標準化する、または、係数の比率を算出することで、同じ説明変数に対する寄与度を予測対象ごとに比較できる

実施形態２．
　次に、本発明による情報処理システムの第２の実施形態を説明する。第２の実施形態の構成は、第１の実施形態の構成と同様である。ただし、本実施形態では、集計部２０が説明変数の実測値を含めて寄与度を算出する点において第１の実施形態と異なる。なお、受付部１０の動作は、第１の実施形態と同様である。

　本実施形態では、予測モデルが複数の説明変数を含む線形回帰式で表されているものとする。集計部２０は、受け付けた分類に基づいて予測対象を特定し、特定された予測対象の予測モデルを特定する。また、集計部２０は、併せて、受け付けた分類に基づいて、その予測モデルに含まれる説明変数の実測値を特定する。実測値は、例えば、記憶部３０に記憶される。

　集計部２０は、線形回帰式における説明変数の重み（係数）とその説明変数の実測値との積を、説明変数ごとに算出する。そして、集計部２０は、算出した積の総和を説明変数ごとに算出して寄与度とする。以下の説明では、説明変数ごとに算出された積の総和を、第二の寄与度と記す。

　図１０は、説明変数ごとに算出された積の総和（第二の寄与度）を算出する処理の例を示す説明図である。図１０に示す例では、図７に示す例と同様、３種類の予測対象Ｔ_１～Ｔ_３が特定され、それぞれの予測式Ｙ_１～Ｙ_３も特定され、特定された３つの予測式には全部で４種類の説明変数ｘ_１～ｘ_４が含まれているとする。また、図１０に示す例では、各予測対象Ｔ_１～Ｔ_３についての説明変数ｘ_１～ｘ_４の実測値Ｄ_１～Ｄ_３も特定されているとする。

　集計部２０は、説明変数の係数と実測値との積を説明変数ごとに算出する。図１０に示す例では、集計部２０は、例えば説明変数ｘ_１について、ｗ_１＝｜ａ_１１ｄ_１１｜＋｜ａ_３１ｄ_３１｜で寄与度を算出する。他の説明変数についても同様である。

　なお、集計部２０は、第１の実施形態と同様に、各予測式で算出される説明変数の係数と実測値との積を標準化してもよい。具体的には、集計部２０は、積の合計値が１になる（平均が０、分散が１になる）ようにそれぞれの積を補正してもよい。なお、標準化は、各説明変数の積の総和を算出した後で行われてもよい。

　また、集計部２０は、算出した各説明変数の寄与度（第二の寄与度）の比率を算出してもよい。具体的には、集計部２０は、第二の寄与度の総和に対する各説明変数の第二の寄与度の比率を、説明変数ごとに算出してもよい。

　次に、本実施形態の情報処理システムの動作を説明する。図１１は、第２の実施形態の情報処理システム１００の動作例を示すフローチャートである。まず、受付部１０は、予測対象を特定する分類を受け付ける（ステップＳ１１）。次に、集計部２０は、受け付けた分類から予測対象を特定し（ステップＳ１２）、さらに、実績値を特定する（ステップＳ２１）。そして、集計部２０は、説明変数の重み（係数）とその説明変数の実測値との積を説明変数ごとに算出し、算出した積の総和を第二の寄与度として説明変数ごとに算出する（ステップＳ２２）。

　以上のように、本実施形態では、集計部２０が、線形回帰式における説明変数の重みである係数とその説明変数の実測値との積を説明変数ごとに算出し、算出した積の総和を第二の寄与度として説明変数ごとに算出する。そのため、第１の実施形態の効果に加え、実績値を反映した分析が可能になる。

　以下、本実施形態の効果を、具体例を示しながら詳細に説明する。
　例えば、「Ａ店の２０１６年３月のある日におけるオレンジジュースの売上数」が以下の予測式により説明されるとする。ここで、括弧内は、説明変数を表わす。
　売上数＝　－１１．３＊（Ａ店近傍における当該月の最高気温）＋６０＊（Ａ店近傍における当該日の総降水量）＋１３０

　上記式だけで判断すると、一見、当該日の総降水量は、係数の値が大きいため、Ａ店の３月のある日におけるオレンジジュースの売上数に大きく寄与しているようにも見える。しかし、実際には、３月のある日にＡ店近傍において雨が全く降らなかったとする。その場合、実際には、Ａ店近傍における当該日の総降水量はＡ店の３月のある日におけるオレンジジュースの売上数に全く寄与しなかったということができる。

　したがって、第１の実施形態と比較すると、本実施形態では、当該説明変数の寄与度を、“予測式における係数の値”と“当該係数が係る説明変数の実測値”との積の値によって算出することで、実績値を反映した分析が可能になる。

　なお、集計部２０は、第１の実施形態と同様に、説明変数の係数と実測値との積を共通の説明変数について標準化してもよい。具体的には、集計部２０は、各説明変数についての積の合計値が１になる（平均が０、分散が１になる）ようにそれぞれの積の値を補正してもよい。

　また、集計部２０は、各予測式間で説明変数の係数と実測値との積の比率を説明変数ごとに算出してもよい。具体的には、集計部２０は、算出された説明変数についての積の総和に対する各説明変数の積の比率を、予測式ごとに算出してもよい。

　次に、第２の実施形態の変形例を説明する。第２の実施形態では、実測値を用いて寄与度を算出する方法を説明した。一方、予測モデルを用いることで結果を予測することも可能である。この場合、予測モデルに基づいて予測した予測結果と、実際に取得された実測結果との差分（誤差）を特定することが可能である。そのため、集計部２０は、予測モデルに基づいて予測された予測結果と、実際に取得された実測結果との差分である誤差を利用して、寄与度を補正してもよい。

　集計部２０は、例えば、予測対象ごとに、予測結果と実測結果の差分に基づいて、各説明変数の寄与度を同じ割合で補正してもよい。例えば、実測結果が予測結果の２倍の値を取った場合、集計部２０は、各説明変数の寄与度をそれぞれ２倍してもよい。

　他にも、集計部２０は、例えば、予測結果と実測結果の差分を示す新たな説明変数を設け、その差分を新たな説明変数の寄与度としてもよい。

　なお、集計部２０が誤差に応じて寄与度を補正する方法は、上述する例に限定されない。集計部２０は、寄与度を補正する割合を変更してもよく、新たな説明変数を２つ以上設けてもよい。

実施形態３．
　次に、本発明による情報処理システムの第３の実施形態を説明する。第１の実施形態および第２の実施形態では、説明変数ごとに寄与度を算出する方法を説明した。一方、予測に用いられる説明変数は、その数が非常に多くなることも想定される。すなわち、分析に用いられる要因を細かくしすぎると、集約した際に説明変数の種類が非常に膨大になり、解釈性に影響を及ぼす可能性がある。

　以下、説明変数の種類が膨大になる理由を、具体例を用いて説明する。例えば、全国に１０００店舗の小売店を展開する企業が、１店舗あたり２０００種類の商品の売上数量を月ごとに予測している場合、その予測モデルの数は、１年で、１０００（店舗）×１２（月／年）×２０００（種類／月・店舗）＝２４，０００，０００になる。

　ここで、オペレータが、特定の月における特定の商品の全国の売上について、売上の要因分析を行いたいとする。この場合、受付部１０は、オペレータから、予測対象を特定する分類として「２０１６年３月のある日におけるオレンジジュースの売上数」という分類を受け付ける。受付部１０が受け付けた分類により、１０００店舗分の予測モデルが特定される。すなわち、１０００店舗それぞれにおける２０１６年３月のある日におけるオレンジジュースの売上数を予測する予測モデルが特定される。

　一方、予測モデルの数が増加するほど、その予測モデルに含まれる説明変数の種類も増加する。このことについて、図４に示す予測モデルを例に説明する。図１２は、複数の予測モデルを用いて要因分析する処理の例を示す説明図である。ここでは、Ａ店からＤ店までの２０１６年３月のある日のオレンジジュースの売上の要因分析を行うものとする。同じ時期（例えば、２０１６年３月）における同じ商品（例えば、オレンジジュース）であっても、その売上に寄与する要因（すなわち、説明変数）は、店舗によって様々であると考えられる。

　例えば、図４に示す例では、Ａ店のオレンジジュースの売上に寄与する要因（すなわち、説明変数）は、予測対象ＩＤ＝２で特定される予測モデルに含まれる説明変数ｘ_２，ｘ_４，ｘ_９，ｘ_１１，ｘ_１７が示す要因と考えられる。一方、Ｂ店のオレンジジュースの売上に寄与する要因（すなわち、説明変数）は、予測対象ＩＤ＝７で特定される予測モデルに含まれる説明変数ｘ_２，ｘ_５，ｘ_９，ｘ_１２，ｘ_１５，ｘ_１６が示す要因と考えられる。同様に、Ｃ店では、予測対象ＩＤ＝１２で特定される予測モデルに含まれる説明変数ｘ_４，ｘ_７，ｘ_１０，ｘ_１２，ｘ_１３，ｘ_１５が示す要因が考えられ、Ｄ店では、予測対象ＩＤ＝１７で特定される予測モデルに含まれる説明変数ｘ_３，ｘ_６，ｘ_７，ｘ_１３，ｘ_１５が示す要因が考えられる。

　これらの要因を全て集計すると、Ａ店からＤ店までの２０１６年３月のオレンジジュースの売上には、説明変数ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_９，ｘ_１０，ｘ_１１，ｘ_１２，ｘ_１３，ｘ_１５，ｘ_１６，ｘ_１７が示す要因が影響していることが分かる。しかし、考慮すべき説明変数が増えすぎると、解釈性に影響を及ぼす可能性がある。その結果、集計部２０が大量の予測モデルについて集計処理を行うと、予測モデルに含まれる説明変数の種類が多すぎることで、その集計結果が人間にとって解釈しづらいものとなるおそれがある。すなわち、一つの予測式を構成する説明変数の数自体がそれほど多くはなくても、予測式の数が増えるにしたがって、含まれる説明変数の種類は増加してしまうことがある。そこで、本実施形態では、予測対象に寄与し得る要因を、より大域的な観点から分析できる方法を説明する。

　本実施形態では、各説明変数に、変数の性質を示すカテゴリがそれぞれ設定される。ただし、第１の実施形態および第２の実施形態の説明変数にカテゴリが設定されていてもよい。図１３は、カテゴリが設定された説明変数の例を示す説明図である。

　例えば、予測モデルに、「テレビ広告」、「インターネット掲載」、「チラシ配布」などの説明変数が含まれている場合、これらの説明変数には、例えば、「広告」というカテゴリが設定される。また、例えば、予測対象が一日毎に予測されるとして、予測モデルに「日曜日であるか否か」、「祝日であるか否か」、「祝日の前日であるか否か」などの説明変数が含まれている場合、これらの説明変数には、例えば、「カレンダー」というカテゴリが設定される。また、例えば、予測対象が一日毎に予測されるとして、予測モデルに「雨の日か否か」、「最高気温」、「日照量」などの説明変数が含まれている場合、これらの説明変数には、例えば、「気象」というカテゴリが設定される。説明変数とその説明変数が属するカテゴリとの関係は、例えば、あらかじめ設定されているものとする。

　第３の実施形態の構成も、第１の実施形態および第２の実施形態の構成と同様である。ただし、本実施形態では、集計部２０が説明変数に設定されるカテゴリごとに縮約して寄与度を算出する点において他の実施形態と異なる。なお、カテゴリごとに寄与度を算出するか、説明変数ごとに寄与度を算出するかは、予め定められていてもよく、受付部１０が寄与度を算出する方法を受け付けてもよい。

　まず、集計部２０は、説明変数ごとに寄与度を算出する。集計部２０は、第１の実施形態に記載された第一の寄与度を説明変数ごとの寄与度として算出してもよく、第２の実施形態に記載された第二の寄与度を説明変数ごとの寄与度として算出してもよい。

　次に、集計部２０は、算出された寄与度を説明変数のカテゴリごとに集計する。例えば、図７に例示する説明変数ｘ_１と説明変数ｘ_２が同じカテゴリに属する場合、集計部２０は、説明変数ｘ_１の寄与度ｗ_１と説明変数ｘ_２の寄与度ｗ_２を加算し、そのカテゴリの寄与度とする。以下の説明では、カテゴリごとに集計された寄与度を、第三の寄与度と記す。

　本実施形態においても、集計部２０は、カテゴリごとに集計された寄与度を標準化してもよい。具体的には、集計部２０は、カテゴリごとに集計された寄与度の合計値が１になる（すなわち、平均が０、分散が１になる）ようにそれぞれの寄与度を補正してもよい。

　また、集計部２０は、カテゴリごとに集計された寄与度（第三の寄与度）の比率を算出してもよい。具体的には、集計部２０は、第三の寄与度の総和に対する各カテゴリの第三の寄与度の比率を、カテゴリごとに算出してもよい。

　次に、本実施形態の情報処理システムの動作を説明する。図１４は、第３の実施形態の情報処理システム１００の動作例を示すフローチャートである。まず、受付部１０は、予測対象を特定する分類を受け付ける（ステップＳ１１）。次に、集計部２０は、受け付けた分類から予測対象を特定し（ステップＳ１２）、特定された予測対象の予測モデルに含まれる共通のカテゴリの説明変数ごとに、そのカテゴリの重みを寄与度（第三の寄与度）として集計する（ステップＳ３１）。

　以上のように、本実施形態では、集計部２０が、説明変数ごとに算出された寄与度を、その説明変数のカテゴリごとに集計し、第三の寄与度として算出する。そのため、第１の実施形態または第２の実施形態の効果に加え、より大域的な観点で分析することが可能になる。

　図１５は、カテゴリごとに寄与度を集計した場合の例を示す説明図である。図１２に示す例では、要因（すなわち、説明変数）が１４種類存在していたが、カテゴリごとに集計することで、要因が広告、カレンダー、気象および価格の４種類に集約されている。また、このように、似たような大量の説明変数を集計することで、要因の解釈性を高めることが可能になる。例えば、図１５に示す例では、カテゴリ「カレンダー」に関する要因が大きいことが一見して判断しやすくなる。

　なお、集計部２０は、第１の実施形態または第２の実施形態と同様に、各予測式でカテゴリごとに集計した寄与度を標準化してもよい。具体的には、集計部２０は、各カテゴリについての寄与度の合計値が１になる（平均が０、分散が１になる）ようにそれぞれの寄与度を補正してもよい。

　また、集計部２０は、各予測式間でカテゴリごとの寄与度の比率を算出してもよい。具体的には、集計部２０は、算出されたカテゴリごとの寄与度の総和に対する各カテゴリの寄与度の比率を、予測式ごとに算出してもよい。

実施形態４．
　次に、本発明による情報処理システムの第４の実施形態を説明する。第４の実施形態の構成も、第１の実施形態の構成と同様である。ただし、本実施形態では、適用される変数の値（実測値）に応じて予測式が特定される予測モデルを用いて寄与度を算出する方法を説明する。実測値に応じて予測式が特定される予測モデルとして、例えば、サンプルに応じて１つの予測式を特定する場合分け予測器が挙げられる。なお、受付部１０の動作は、第１の実施形態と同様である。

　図１６は、場合分け予測器の例を示す説明図である。図１６は、サンプルに応じて予測式が変化することを模式的に示している。図１６に例示する予測器は、サンプルが示す曜日が土曜日または日曜日（週末）の場合には予測式１が使用され、週末以外で天気が晴れの場合には予測式２が使用され、それ以外の場合には予測式３が使用されることを示す。また、図１６に例示する選択割合は、各予測式がサンプルに応じて選択される割合を例示している。言い換えると、サンプルに応じて予測式が選択されることから、選択割合は、予測式に対応するサンプル数の割合を示していると言うことができる。また、本実施形態で説明する場合分け予測器は、実測値に応じて予測式が特定される予測モデルを表わしていると言える。

　集計部２０は、適用される変数の値に応じて予測式が特定される予測モデル（すなわち、場合分け予測器）を用いて、説明変数ごとに寄与度を算出する。具体的には、集計部２０は、上記場合分け予測器を用いて、使用するサンプルごとに該当する予測式を特定する。

　その後、集計部２０は、第１の実施形態で示す第一の寄与度（すなわち、特定された予測対象の予測モデルに含まれる説明変数の重みの総和）を算出してもよいし、第２の実施形態で示す第二の寄与度（すなわち、説明変数ごとに算出された積の総和）を算出してもよい。また、集計部２０は、第３の実施形態で示す第三の寄与度（すなわち、カテゴリごとに集計された寄与度）を算出してもよい。

　例えば、第一の寄与度を算出する場合、集計部２０は、予測式の特定に用いたサンプルの割合を予測式ごとに算出する。図１６に示す例では、予測式１の特定に用いられたサンプルの割合が３０％、予測式２の特定に用いられたサンプルの割合が４０％、予測式３の特定に用いられたサンプルの割合が３０％である。

　次に、集計部２０は、算出した割合に応じて係数を補正する。具体的には、集計部２０は、算出した割合を対応する予測式の係数に乗じる。そして、集計部２０は、特定された予測式に含まれる説明変数ごとに、その説明変数の係数を集計する。これが、１つの予測対象について各説明変数の寄与度になる。

　第二の寄与度を算出する場合、集計部２０は、サンプルに応じて特定した予測式における説明変数の係数とその説明変数のサンプルの値との積を、説明変数ごとに算出する。そして、集計部２０は、算出した積の総和を説明変数ごとに算出して寄与度とする。これが、１つの予測対象について各説明変数の寄与度になる。

　第三の寄与度を算出する場合、集計部２０は、第一の寄与度または第二の寄与度を算出した後で、カテゴリが共通する説明変数ごとに寄与度を集計すればよい。

　以上のように、本実施形態では、集計部２０が、適用される変数の値に応じて予測式が特定される予測モデルを用いて、説明変数ごとに寄与度を算出する。そのため、第１～３の実施形態の効果に加え、サンプルに応じて予測式が選択されるような予測モデルを用いても寄与度を算出できる。

　次に、本願発明の情報処理システムの具体例を説明する。
　まず、第一の具体例では、受付部１０が受け付けた分類に基づいて特定された１０～１００個程度の予測モデルに対して、ユーザが様々な観点から集計処理を行う方法を説明する。第一の具体例では、図２および図４に例示する情報から特定される予測モデルが記憶部３０に記憶されているとする。

　図１７は、出力部４０が表示する集計画面例を示す説明図である。図１７に示す例では、集計画面の初期状態を示し、上部に分析を行う対象を指定する画面Ｓ１が存在し、下部に集計結果を表示する画面Ｓ２が存在するものとする。

　また、図１７に示す例では、画面Ｓ１に、予測対象を特定する分類ごとにドロップダウンリストＤ１～３が設けられている。図１８は、ドロップダウンリストに含まれる情報の例を示す説明図である。図１８に示す例では、商品分類の飲料に果汁飲料が含まれ、さらに、果汁飲料の分類に複数のジュースが含まれていることを示す。分類が階層構造になることを考慮し、出力部４０は、分類の階層に応じて集計結果を表示してもよい。

　また、図１７に示す例では、上位の分類が選択された場合に下位の分類ごとに集計結果を表示するか否かを指定するチェックボックスＣ１～３が分類ごとに設けられている。

　また、画面Ｓ１には、集計方法を指定するために、要因（すなわち、説明変数）ごとに集計するか、カテゴリごとに集計するか選択するためのラジオボタンＲ１が設けられる。さらに、画面Ｓ１には、第１の実施形態で説明した説明変数の重みを寄与度として表示するか、実測値も考慮して第２の実施形態で説明した説明変数と実績値との積を寄与度として表示するか選択するためのラジオボタンＲ２も設けられる。

　ユーザが分類および集計方法を選択して図１７に例示する実行ボタンＢ１を押下すると、受付部１０および集計部２０は、集計処理を行い、出力部４０が、集計結果を画面Ｓ２に出力する。

　以下、ユーザから２種類の観点での要因分析を受け付けた場合の集計結果の例を説明する。１種類目は、２０１６年３月、東京都の全店舗（すなわち、Ａ店，Ｂ店，Ｃ店およびＤ店）におけるオレンジジュースの売上の要因分析であり、２種類目は、２０１６年３月、特定の店舗（Ａ店）における果汁飲料全体（アップルジュース、オレンジジュース、パインジュース、グレープジュースおよびピーチジュース）の売上の要因分析である。

　図１９～図２３は、出力部４０が表示する出力結果画面例を示す説明図である。図１９は、東京都の全店舗におけるオレンジジュースの売上の要因を出力した結果の例を示す。また、図２０は、Ａ店における果汁飲料全体の売上の要因を出力した結果の例を示す。

　図１９および図２０に例示するように、本願発明の情報処理システムを用いることで、様々な観点から予測対象に寄与し得る要因を分析できる。

　なお、図１９および図２０に示すように、対象とする予測モデルが増加するに従い、寄与し得る要因（説明変数）も増加する。そこで、第３の実施形態で説明したように、要因（説明変数）をカテゴリごとに集計することで、解釈性容易性を高めることが可能になる。

　図２１は、東京都の全店舗におけるオレンジジュースの売上の要因をカテゴリで集計して出力した結果の例を示す。また、図２２は、Ａ店における果汁飲料全体の売上の要因をカテゴリで集計して出力した結果の例を示す。図１９に示す例では、要因が１４個だったのに対し、図２１に示す例では、４つのカテゴリに集約されている。また、図２０に示す例では、要因が１５個だったのに対し、図２２に示す例では、４つのカテゴリに集約されている。いずれの場合も、より解釈性が高くなっていると言える。

　また、出力部４０は、上位の分類が指定された場合に、下位に含まれる分類ごとに集計結果を表示してもよい。図２３は、東京都の果汁飲料の売上のカテゴリごとの要因分析をする際、果汁飲料の下位の分類に含まれるアップルジュース、オレンジジュース、パインジュース、グレープジュースおよびピーチジュースの集計結果を出力した例を示す。

　次に、本願発明の情報処理システムの第二の具体例を説明する。第二の具体例では、様々な予測対象の要因を一覧で可視化する方法を説明する。第二の具体例では、説明変数が属するカテゴリとして、「立地」、「気象」、「カレンダー」、「棚割り」、「価格」および「広告」の６つを想定する。また、「広告」カテゴリに属する説明変数として、「テレビ広告」、「インターネット掲載」および「チラシ配布」の３つを想定する。

　また、売上を予測する予測対象を、「全飲料」、「果汁飲料」、「コーヒー」、「３５０ｍｌ缶単品」、「３５０ｍｌ缶セット」、「５００ｍｌペットボトル単品」および「５００ｍｌペットボトルセット」の６つに縮約するものとする。「果汁飲料」の中には、「オレンジジュース」、「グレープジュース」および「アップルジュース」が含まれるものとし、関東地区に含まれる東京にＡ店が存在するものとする。また、初期の分類として、１月の関東地区の売上を想定する。

　図２４は、予測モデルの例を示す説明図である。図２４に例示する表の意味は、図４に例示する表の意味と同様である。すなわち、表の縦方向が予測対象を示し、表の横方向がその予測対象の予測モデルを表わす説明変数の重みを示す。ただし、本具体例で示す予測モデルは、予測対象および説明変数の内容が異なる。

　図２５は、図２４に例示する予測モデルに基づいて予測対象のカテゴリごとの重みを標準化した例を示す説明図である。図２５に例示する表を生成するため、集計部２０は、図２４に例示する予測モデルについて、説明変数のカテゴリごとに係数の絶対値を集計した後、その集計値を標準化している。図２５に例示する係数が、本実施形態の重み（寄与度）に対応する。

　出力部４０は、図２５に例示する集計結果をヒートマップ形式で出力してもよい。図２６は、図２５に例示する集計結果をヒートマップ形式で出力した例を示す説明図である。ヒートマップで集計結果を表示することで、全体の傾向の視認性を向上させることができる。

　また、出力部４０は、図２５に例示する集計結果をバランスチャートで出力してもよい。図２７は、図２５に例示する集計結果をバランスチャートで出力した例を示す説明図である。図２７に例示するバランスチャートは、図２５に例示する予測結果のうち、３つの予測結果（「全飲料」、「果汁飲料」および「コーヒー」）を選択して出力したものである。

　また、出力部４０は、直接制御可能な説明変数を含むカテゴリについて集計された結果と、直接制御可能でない説明変数を含むカテゴリについて集計された結果とを、互いに区別し得る態様にて表示してもよい。

　図２７に示す例では、直接制御可能な説明変数を含むカテゴリである「広告」、「価格」、および「棚割り」の集計結果と、直接制御可能でない説明変数を含むカテゴリである「立地」、「気象」および「カレンダー」とを、見出しを黒枠で囲むように表示することで互いに区別している。ただし、区別する方法は見出し自体の態様を変化させる方法に限定されず、例えば、出力する値やプロットの態様を変化させてもよい。

　なお、図２７に示す例では、カテゴリごとに集計した結果を出力しているが、説明変数ごとに集計した結果を出力する場合も同様である。この場合、出力部４０は、直接制御可能な説明変数について集計された結果と、直接制御可能でない説明変数について集計された結果とを、互いに区別し得る態様にて表示すればよい。

　また、出力部４０は、算出された説明変数の寄与度の総和に対する各説明変数の寄与度の比率を可視化してもよい。図２８は、各説明変数の寄与度の比率を可視化した例を示す説明図である。図２８に示す例では、予測対象が「コーヒー」の場合の比率（図２８（ａ）参照）と、予測対象が「５００ｍｌペットボトル」の場合の比率（図２８（ｂ）参照）を円グラフで表している。このように比率を表示することで、予測対象に寄与し得る要因の影響度合いを、他の説明変数と比較しながら視覚的に把握することが可能になる。

　また、本願発明では、予測対象ごとに設けられた予測モデル（予測式）を縮約して寄与度を集計しているため、説明変数のカテゴリ方向、および、予測対象の分類方向のいずれの方向にも展開および集約して表示することが可能である。

　図２９は、カテゴリに属する説明変数の寄与度を出力する例を示す説明図である。例えば、図２５に例示する表から画面操作等によりカテゴリが選択された場合、出力部４０は、選択されたカテゴリに含まれる説明変数ごとに寄与度を出力してもよい。図２９に示す例では、図２５に例示する表から、カテゴリ「広告」が選択された場合に、集計部２０が、カテゴリ「広告」に属する説明変数である「テレビ広告」、「インターネット掲載」および「チラシ配布」の寄与度を算出し、出力部４０がその集計結果を出力していることを示す。

　図３０は、予測対象を変更した例を示す説明図である。例えば、図２５に例示する表から画面操作等により予測対象が選択された場合、出力部４０は、選択された予測対象に含まれる予測式の寄与度を出力してもよい。図３０に示す例では、図２５に例示する表から、予測対象「果汁飲料」が選択された場合に、集計部２０が、予測対象「果汁飲料」に含まれる予測対象である「オレンジジュース」、「グレープジュース」および「アップルジュース」の寄与度をカテゴリごとに算出し、出力部４０がその集計結果を出力していることを示す。

　図３１は、予測対象を変更した他の例を示す説明図である。図３１に示す例では、予測対象を関東の中から東京を選択した例を示している。図３１に例示するように、出力部４０は、予測対象を特定可能な分類を選択的に表示してもよい。なお、予測対象の階層は１段階に限定されず、複数存在してもよい。例えば、東京の下位の階層として店舗（例えば、「Ａ店」）を選択できるようにしてもよい。

　なお、図２９から図３１に示す例では、寄与度を表示する対象をドリルダウンで選択する場合を例示したが、出力内容の変更はドリルダウンで指定する場合に限定されない。ユーザ等の指示に応じて別の範囲の予測対象（または予測対象の分類）が指定された場合、集計部２０は、指定された内容に応じて寄与度を算出し、出力部４０は、その算出結果を出力すればよい。

　なお、上記具体例では、商品に関する売上を予測対象とする場合について説明したが、サービスに関する対象を予測対象とする場合も同様に対応可能である。サービスに関する予測対象として、例えば、あるサービスを提供する施設への来場者数などが挙げられる。

　また、上記具体例では、予測対象の分類として、商品の内容や性質、商品が提供される場所を例示したが、予測対象の分類はこれらの内容に限定されない。例えば、分類が、販売者または購買者の観点で設けられてもよいし、商品が提供される時間の観点で設けられてもよい。また、この分類は、予測対象が商品に関する対象である場合に限られず、予測対象がサービスに関する対象の場合にも、同様に採用することが可能である。

　例えば、あるサービスを提供する施設Ｆの来場者数の要因を分析するとする。この場合、分類として、時期（２０１５年３月）を設定することが考えられる。また、要因（説明変数）として、広告（例えば、タレントＡを起用したＣＭを関西地方で放映回数、所定の電車の車内中吊り広告掲載回数）などが用いられてもよい。

　他にも、例えば、ある生活習慣病の要因を分析するとする。このとき、例えば、分類として、年代（４０代）、性別（男性）などが挙げられる。

　また、このような観点から、本願発明の情報処理システムを、小売店の売上予測だけでなく、製造業向けの生産予測や鉄道会社向けの乗客数予測、電気事業者向けの需要予測など、幅広い業種および予測対象に利用することが可能である。

　次に、本発明の概要を説明する。図３２は、本発明による情報処理システムの概要を示すブロック図である。本発明による情報処理システム８０は、複数の分類により特定される予測対象を、予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理システム（例えば、情報処理システム１００）であって、予測対象を特定する分類を受け付ける受付部８１（例えば、受付部１０）と、予測対象のうち受け付けられた分類により特定される予測対象について、予測対象に対応する予測モデルにより定まる寄与度を、変数（例えば、説明変数）ごとに集計する集計部８２（例えば、集計部２０）とを備えている。

　そのような構成により、予測対象に寄与し得る要因を分析できる。

　また、情報処理システム８０は、複数の分類により特定される予測対象に、予測対象に影響し得る変数を含む予測モデルを対応付けて記憶している記憶部（例えば、記憶部３０）を更に備えていてもよい。そして集計部８２は、記憶部が記憶している複数の予測対象のうち、受け付けられた分類により特定される予測対象について、集計してもよい。

　また、集計部８２は、変数とその変数が属するカテゴリとの対応関係に基づいて、寄与度（例えば、第三の寄与度）をカテゴリごとに集計してもよい。そのような構成により、より大域的な観点で分析することが可能になる。

　具体的には、集計部８２は、変数の重みを寄与度として集計してもよい。また、集計部８２は、特定された予測対象の予測モデルに含まれる変数の重みの総和を第一の寄与度として変数ごとに算出してもよい。そのような構成により、複数の予測対象を縮約して、寄与し得る要因（説明変数）を分析できる。

　また、予測モデルが複数の変数を含む線形回帰式で表されていてもよい。このとき、集計部８２は、予測モデルに含まれる変数の係数をその変数の重みとして集計してもよい。

　また、予測モデルが複数の変数を含む線形回帰式で表されている場合に、集計部８２は、予測モデルに含まれる変数の係数とその変数の実測値との積を変数ごとに算出し、算出した積の総和を第二の寄与度として変数ごとに算出してもよい。そのような構成により、実績値を反映した分析が可能になる。

　その際、集計部８２は、予測対象の予測値と実測値との差分である誤差に基づいて寄与度を補正してもよい。また、集計部８２は、予測対象の予測値と実測値との差分である誤差を、その誤差を示す変数の寄与度として集計してもよい。

　また、集計部８２は、変数ごとに算出された寄与度を標準化してもよい。例えば、図７に示す例の場合、集計部８２は、説明変数ごとに算出した寄与度ｗ_１～ｗ_４を標準化（横方向に標準化）してもよい。

　また、集計部８２は、算出された変数の寄与度の総和に対する変数の寄与度の比率を変数ごとに算出してもよい。例えば、図７に示す例の場合、集計部８２は、説明変数ごとに算出した寄与度ｗ_１～ｗ_４の総和を算出し、その総和に対する各説明変数の寄与度の比率（横方向の比率）を算出してもよい。

　一方、集計部８２は、各予測式で共通する変数の重みをその変数ごとに標準化してもよい。例えば、図７に示す例の場合、集計部８２は、対象とする予測式に含まれる説明ｘ_１の係数ａ_１１，ａ_３１を標準化（縦方向に標準化）してもよい。

　また、集計部８２は、共通する変数の重みの総和に対する変数の重みの比率を予測対象ごとに算出してもよい。例えば、図７に示す例の場合、集計部８２は、説明変数ｘ_１の重みの総和（ａ_１１＋ａ_３１）に対する各予測式の説明変数ｘ_１の重みの比率（ａ_１１／ａ_１１＋ａ_３１，ａ_３１／ａ_１１＋ａ_３１）（縦方向の比率）を算出してもよい。

　また、集計部８２は、適用される変数（例えば、サンプル）の値に応じて予測式が特定される予測モデル（例えば、場合分け予測器）を用いて、変数ごとに寄与度を算出してもよい。

　なお、予測対象は、商品またはサービスに関する対象であってもよい。そして、分類は、商品またはサービスの、内容若しくは性質、販売者若しくは購買者、または、商品またはサービスが提供される場所もしくは時間、のうちのいずれかを示す情報であってもよい。

　また、情報処理システムは、直接制御可能な変数（例えば、図２７に例示する「立地」、「気象」、「カレンダー」）について集計された結果と、直接制御可能でない変数（例えば、図２７に例示する「広告」、「価格」、「棚割り」）について集計された結果とを、互いに区別し得る態様（図２７に示す例ではカテゴリを黒枠表示）にて表示する出力部（例えば、出力部４０）を備えていてもよい。

　また、これまで、予測モデルが線形回帰式である場合について説明した。しかし、予測モデルは線形回帰式には限定されない。予測モデルが予測対象に影響し得る変数から構成され、予測対象への寄与度が予測モデルにより定まるならば、本発明を適用可能である。

　１０　受付部
　２０　集計部
　３０　記憶部
　４０　出力部
　１００　情報処理システム

Claims

　複数の分類により特定される予測対象を、前記予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理システムであって、
　前記予測対象を特定する分類を受け付ける受付部と、
　前記予測対象のうち前記受け付けられた分類により特定される予測対象について、前記予測対象に対応する予測モデルにより定まる寄与度を、前記変数ごとに集計する集計部とを備えた
　ことを特徴とする情報処理システム。
　複数の分類により特定される予測対象に、前記予測対象に影響し得る変数を含む予測モデルを対応付けて記憶している記憶部を更に備え、
　前記集計部は、前記記憶部が記憶している複数の予測対象のうち、前記受け付けられた分類により特定される予測対象について、集計する
　請求項１記載の情報処理システム。
　前記集計部は、変数と前記変数が属するカテゴリとの対応関係に基づいて、前記寄与度を前記カテゴリごとに集計する
　請求項１または請求項２記載の情報処理システム。
　前記集計部は、前記変数の重みを寄与度として集計する
　請求項１から請求項３のうちのいずれか１項に記載の情報処理システム。
　前記集計部は、特定された予測対象の予測モデルに含まれる変数の重みの総和を第一の寄与度として当該変数ごとに算出する
　請求項４記載の情報処理システム。
　予測モデルが複数の変数を含む線形回帰式で表され、
　前記集計部は、前記予測モデルに含まれる変数の係数を当該変数の重みとして集計する
　請求項４または請求項５記載の情報処理システム。
　予測モデルが複数の変数を含む線形回帰式で表され、
　前記集計部は、前記予測モデルに含まれる変数の係数と当該変数の実測値との積を当該変数ごとに算出し、算出した積の総和を第二の寄与度として当該変数ごとに算出する
　請求項４記載の情報処理システム。
　前記集計部は、予測対象の予測値と実測値との差分である誤差に基づいて寄与度を補正する
　請求項７記載の情報処理システム。
　前記集計部は、予測対象の予測値と実測値との差分である誤差を、当該誤差を示す変数の寄与度として集計する
　請求項７記載の情報処理システム。
　前記集計部は、変数ごとに算出された寄与度を標準化する
　請求項１から請求項９のうちのいずれか１項に記載の情報処理システム。
　前記集計部は、算出された変数の寄与度の総和に対する変数の寄与度の比率を当該変数ごとに算出する
　請求項１から請求項８のうちのいずれか１項に記載の情報処理システム。
　前記集計部は、各予測式で共通する変数の重みを当該変数ごとに標準化する
　請求項１から請求項９のうちのいずれか１項に記載の情報処理システム。
　集計部は、共通する変数の重みの総和に対する変数の重みの比率を予測対象ごとに算出する
　請求項１から請求項９のうちのいずれか１項に記載の情報処理システム。
　前記集計部は、適用される変数の値に応じて予測式が特定される予測モデルを用いて、変数ごとに寄与度を算出する
　請求項１から請求項１３のうちのいずれか１項に記載の情報処理システム。
　予測対象は、商品またはサービスに関する対象であり、
　分類は、前記商品またはサービスの、内容若しくは性質、販売者若しくは購買者、または、前記商品またはサービスが提供される場所もしくは時間、のうちのいずれかを示す情報である
　請求項１から請求項１４のうちのいずれか１項に記載の情報処理システム。
　直接制御可能な変数について集計された結果と、直接制御可能でない変数について集計された結果とを、互いに区別し得る態様にて表示する出力部を備えた
　請求項１から請求項１５のうちのいずれか１項に記載の情報処理システム。
　複数の分類により特定される予測対象を、前記予測対象に影響し得る変数を含む予測モデルを用いて予測する情報処理方法であって、
　前記予測対象を特定する分類を受け付け、
　前記予測対象のうち前記受け付けられた分類により特定される予測対象について、前記予測対象に対応する予測モデルにより定まる寄与度を、前記変数ごとに集計する
　ことを特徴とする情報処理方法。
　複数の分類により特定される予測対象に、前記予測対象に影響し得る変数を含む予測モデルを対応付けて記憶している記憶部が記憶している複数の当該予測対象のうち、前記受け付けられた分類により特定される予測対象について、集計する
　請求項１７記載の情報処理方法。
　複数の分類により特定される予測対象を、前記予測対象に影響し得る変数を含む予測モデルを用いて予測するコンピュータに適用される情報処理プログラムであって、
　前記コンピュータに、
　前記予測対象を特定する分類を受け付ける受付処理、および、
　前記予測対象のうち前記受け付けられた分類により特定される予測対象について、前記予測対象に対応する予測モデルにより定まる寄与度を、前記変数ごとに集計する集計処理
　を実行させるための情報処理プログラム。
　コンピュータに、
　前記集計処理で、複数の分類により特定される予測対象に、前記予測対象に影響し得る変数を含む予測モデルを対応付けて記憶している記憶部が記憶している複数の当該予測対象のうち、前記受け付けられた分類により特定される予測対象について、集計させる
　請求項１９記載の情報処理プログラム。