WO2023058080A1

WO2023058080A1 - 情報処理装置、情報処理方法、及び、プログラム

Info

Publication number: WO2023058080A1
Application number: PCT/JP2021/036575
Authority: WO
Inventors: 航平廣松; 康洲鎌
Original assignee: 三菱電機株式会社
Priority date: 2021-10-04
Filing date: 2021-10-04
Publication date: 2023-04-13
Also published as: JPWO2023058080A1; JP7375990B2

Abstract

情報処理装置１は、予測対象において、説明変数及び結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する。また、情報処理装置１は、予測モデルに入力された説明変数及び予測モデルから出力された予測値を取得する取得部３１と、説明変数に対応した結果変数の実績値と予測値の誤差を算出する誤差算出部３２と、誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部３３と、予測対象に類似する対象であって、候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部３４と、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価部３６とを備える。

Description

情報処理装置、情報処理方法、及び、プログラム

　本開示は、情報処理装置、情報処理方法、及び、プログラムに関する。

　従来から、因果関係を有する原因となっている変数（以降、説明変数と称する。）と、その原因を受けて発生した結果となっている変数（以降、結果変数と称する。）の関係を学習して構築された予測モデルを用いて、所望の説明変数に対応した結果変数の予測値を導出する技術がある。

　そして、入力された説明変数に対応した結果変数の予測値と、過去に入力された説明変数に対応した結果変数の実績値との間に誤差がある場合、予測モデルの予測精度の向上を目的として、新たな説明変数を用いて予測モデルを更新することがある。

特許文献１には、予測モデルの更新に用いる新たな説明変数の候補を利用者に提示することで、予測モデルの更新に用いる新たな説明変数の獲得に要する時間を削減することが開示されている。

特許第６６０３６００号

　しかしながら、特許文献１に開示された技術においては、例えば、予測モデルの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標が示されていないため、予測モデルの更新に用いる新たな説明変数の選択は操作者の知見に依存していた。そのため、特許文献１に開示された技術においては、予測モデルの更新に用いる新たな説明変数を選択する作業に対して操作者が煩わしさを感じてしまうという課題があった。

　本開示は、前述のような問題点を解決するためになされたものであり、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することを目的とする。

　この開示に係る情報処理装置は、予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する。また、この開示に係る情報処理装置は、予測モデルに入力された説明変数、及び、予測モデルから出力された予測値を取得する取得部と、取得部で取得された説明変数に対応した結果変数の実績値と、取得部で取得された予測値の誤差を算出する誤差算出部と、誤差算出部で算出された誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部と、予測対象に類似する対象であって、候補説明変数取得部で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部と、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価部とを備えることを特徴とする。

　本開示によれば、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができる。

実施の形態１に係る情報処理装置のハードウェア構成の一例を示す図である。情報処理装置１の機能ブロック図の一例である。類似予測対象を特定する態様を説明するための図である。予測モデルを更新する候補説明変数の選択画面を示す図である。予測モデル更新処理を示すフローチャート図である。第２の実施形態における予測モデル更新処理を示すフローチャート図である。予測モデルを更新する候補説明変数の選択画面を示す図である。

　本開示に係る情報処理装置は、因果関係を有する原因となっている変数（以降、説明変数と称する。）と、その原因を受けて発生した結果となっている変数（以降、結果変数と称する。）の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応した結果変数の予測値を出力する機能を有するものである。

　また、本開示に係る情報処理装置は、入力された説明変数に対応した結果変数の予測値と、過去に入力された説明変数に対応した結果変数の実績値との間に誤差がある場合、予測モデルの予測精度の向上を目的として、新たな説明変数を用いて予測モデルを更新する機能を有するものである。

　本開示においては、複数の店舗を有する小売業者が、各店舗で販売する商品の需要量を予測するために情報処理装置を用いる例について説明する。なお、情報処理装置は、店舗で販売する商品に限らず、例えば、宿泊施設、レジャー施設、飛行機、鉄道、公演、観戦などのチケットの需要量を予測してもよい。また、情報処理装置は、需要量に限らず、例えば、対策を講じた際の効果、及び／又は、変化を結果変数として、その予測値を出力してもよい。即ち、情報処理装置は、少なくとも、因果関係を有する２つの変数の関係を学習した予測モデルに基づいて、一方の変数の入力値から他方の変数の予測値を出力すればよい。

　以下に図面を参照して、本開示に係る情報処理装置、情報処理方法、及び、プログラムの実施の形態について詳細に説明する。

・実施の形態１
　図１は、実施の形態１に係る情報処理装置１のハードウェア構成の一例を示す図である。
　情報処理装置１は、インターネット又はＬＡＮ（Local Area Network）などのネットワーク３を介して各店舗に設置された販売店端末２に接続される。

　販売店端末２は、例えば、商品の販売・支払いが行われた店舗で、その商品に関する商品データ（商品名、価格、売れた時間、店舗名、割引データ、クーポンデータなど）を含む購買履歴データが入力される。また、販売店端末２は、例えば、商品につけられたバーコードをレジのスキャナーで読み取ること、及び／又は、タッチパネルやキーボードで商品を選択することにより、購買履歴データが入力される。購買履歴データは、商品データに限らず、例えば、その商品を購入した購入者に関する購入者データ（年齢、性別、人数）を含んでいても良い。また、購買履歴データは、例えば、店舗に設置されたセンサから取得した店舗の混雑度を示す混雑データなど、商品の需要量を予測するために活用可能なデータを含んでいてもよい。

　情報処理装置１は、販売店端末２から取得した購買履歴データなどを学習して構築された予測モデルを用いて、店舗で販売する商品の需要量などを予測する。なお、情報処理装置１は、購買履歴データを販売店端末２から取得する必要はなく、例えば、商品やサービスを販売するＥＣ（electronic commerce）サイトから取得してもよい。

　情報処理装置１は、プロセッサ１１、メモリ１２、通信インタフェース１３、表示部１４、操作部１５、及び、記憶部１６を備えている。

　プロセッサ１１は、例えば、ＣＰＵ(Central Processing Unit)又はＧＰＵ(Graphic Processing Unit)であり、メモリ１２、通信インタフェース１３、操作部１５から入力されたデータを処理して、その処理結果をメモリ１２、通信インタフェース１３、表示部１４などに出力する。

　メモリ１２は、例えば、主記憶装置として機能するＤＲＡＭ(Dynamic Random Access Memoryである。メモリ１２は、例えば、通信インタフェース１３や操作部１５から入力されたデータ、プロセッサ１１で実行されるプログラムやデータ、及び／又は、プロセッサ１１の処理結果を示すデータなどが一時的に記憶され、それらのデータをプロセッサ１１の要求に応じて出力する。

　表示部１４は、例えば、ディスプレイであり、プロセッサ１１から出力されたデータを表示する。操作部１５は、例えば、マウスやキーボードであり、利用者からの操作を受け付ける。なお、情報処理装置１は、表示部１４及び操作部１５を個別に備えるのではなく、夫々の機能を有するタッチパネルディスプレイを備えていてもよい。また、情報処理装置１は、表示部１４及び／又は操作部１５を備えず、外付けの構成としてもよい。

　通信インタフェース１３は、例えば、ＬＡＮアダプタや無線ＬＡＮ送受信機である。通信インタフェース１３は、ネットワーク３を介して、販売店端末２と接続する。

　記憶部１６は、例えば、補助記憶装置として機能するＨＤＤ(Hard Disk Drive)やＳＳＤ(Solid State Drive)である。記憶部１６は、プロセッサ１１で実行されるプログラム、及び、プログラムで使用されるデータを記憶する。記憶部１６は、例えば、販売店データ、ＳＮＳ（Social networking service）データ、検索データ、気象データ、及び／又は、購買履歴データといった、情報処理装置１が処理を行うためのデータを記憶する。以降、記憶部１６に記憶された販売店データ、ＳＮＳデータ、検索データ、気象データ、及び、購買履歴データを夫々区別して説明する必要が無い場合には、データセットと称する。なお、データセットに含まれるデータは、これらに限らず、政治・経済に関するデータ、交通機関に関するデータなどを含んでいてもよい。

　また、記憶部１６は、予測モデルＭを記憶する。予測モデルＭは、因果関係を有する原因となっている説明変数と、その原因を受けて発生した結果となっている結果変数の関係を学習することで構築される。予測モデルＭは、入力された説明変数に対応した結果変数の予測値を出力する。予測モデルＭは、例えば、重回帰式、ニューラルネットワーク、ランダムフォレスト、勾配ブースティング決定木など、周知の技術を用いることで構築されればよい。

　販売店データは、例えば、各店舗の在庫データ（取り扱い商品、取り扱い商品の価格、取り扱い商品の在庫数）、キャンペーンデータ（割引、クーポンの配付）、利用客の属性データ（人数、客単価、性別、年齢）、店舗の属性データ（営業時間、定休日、所在地、アクセス方法、周辺環境、及び／又は、駐車場データ）などを含む。

　ＳＮＳデータは、例えば、小売業者側（本部、及び／又は、各店舗）が投稿した投稿データ、投稿の数（投稿数）、投稿が閲覧された数（閲覧数）、投稿が共有された数（共有数）などを含む。また、ＳＮＳデータは、小売業者側が投稿した投稿データに限らず、例えば、利用者側が投稿した、各店舗の取り扱い商品、及び／又は、キャンペーンに関する文字列を含む投稿データ、投稿数、及び／又は、共有数などを含んでいてもよい。また、ＳＮＳデータは、各店舗の周辺で開催されるイベントに関する投稿データなど、各店舗の取り扱い商品とは直接関わりのない投稿データを含んでいてもよい。なお、ＳＮＳデータは、ＳＮＳの運営側から提供されるＡＰＩ(Application Programming Interface)を用いるなど、周知の技術を用いることで取得されればよい。

　検索データは、例えば、小売業者側が運用及び／又は管理するウェブサイトから取得された、各店舗の取り扱い商品を紹介するページの閲覧数、キャンペーンの閲覧数、キャンペーンの応募数、クーポンの閲覧数、及び／又は、クーポンのダウンロード数などを含む。また、検索データは、ウェブサイトを閲覧したユーザを識別するユーザ識別情報を含んでいても良い。

　気象データは、例えば、政府機関や企業によって過去から現在に至るまでに公表された気象予報データ、及び／又は、過去から現在に至るまでに実際に観測された降水・風・気温・雪・災害の状況を含む気象観測データを含む。また、気象データは、例えば、利用者側がＳＮＳなどに投稿した、各店舗の所在地周辺の気象に関する投稿データを含んでいてもよい。

　ここで、本開示においては、或る商品の価格を値引きするクーポンの配布と、或る商品の売り上げ（需要量）との間に因果関係があるものとする。具体的には、或る商品の価格を値引きするクーポンを配布しない場合の需要量が１００であるのに対し、価格を値引きするクーポンを配布した場合の需要量が２５０に増加するという因果関係があるものとする。この場合、予測モデルＭは、「或る商品の価格を値引きするクーポンの配布」を説明変数、「或る商品の需要量の増加」を結果変数として、夫々の因果関係を学習することで構築される。なお、因果関係を有する原因となる説明変数、及び、結果変数の組み合わせはこれに限らない。

　なお、情報処理装置１は、記憶部１６を備えず、外付けの構成としてもよい。即ち、情報処理装置１は、販売店データ、ＳＮＳデータ、検索データ、気象データ、購買履歴データ、及び／又は、予測モデルといった、情報処理装置１の処理に必要な各種データの一部又は全部を、図示せぬ外部の記憶媒体からネットワーク３を介して取得してもよい。

　図２は、情報処理装置１の機能ブロック図の一例である。
　情報処理装置１のプロセッサ１１は、メモリ１２に格納されたプログラムなどを実行することにより、予測処理部２０と予測モデル更新部３０という各機能を実現する。なお、図２において情報処理装置１は、記憶部１６を外付けの構成としている。ただし、情報処理装置１は、記憶部１６の一部又は全部を備える構成としてもよい。

・予測処理部２０により実行される予測処理について
　情報処理装置１は、予測処理部２０により予測処理を実行する。予測処理部２０は、因果関係を有する原因となっている説明変数と、その原因を受けて発生した結果となっている結果変数の関係を学習して構築された予測モデルＭを用いて、入力された説明変数に対応した結果変数の予測値を出力する。

　予測処理部２０は、入力部２１、予測部２２、及び、出力部２３を有する。
　入力部２１は、販売店端末２又は操作部１５から入力された説明変数を予測部２２に出力する。
　ここで、本開示において入力部２１に入力された説明変数は、例えば、「或る商品の価格を値引きするクーポンの配布」であるものとする。

　予測部２２は、入力部２１から入力された説明変数を予測モデルＭに対して出力する。また、予測モデルＭは、入力された説明変数に対応した結果変数の予測値を出力する。予測部２２は、予測モデルＭから入力された結果変数の予測値を出力部２３に対して出力する。また、予測部２２は、予測モデルＭに対して出力した説明変数、及び、予測モデルＭから入力された結果変数の予測値を対応づけて、予測モデル更新部３０の取得部３１に対して出力する。

　ここで、結果変数の予測値は、予測処理の実行日の翌日、翌週、翌月、又は、翌年の結果変数の値を予測したものであってもよい。また、結果変数の予測値は、利用者により指定された任意の日付、又は、任意の時刻における結果変数の値を予測したものであってもよい。また、結果変数の予測値は、利用者により任意に指定された期間（Ｎ時間、Ｎ日、Ｎか月、又は、Ｎ年，Ｎは任意の自然数）における結果変数の値を予測したものであってもよい。また、予測モデル更新部３０の取得部３１は、少なくとも、予測処理部２０の予測部２２で予測された結果変数の予測値を取得できればよい。具体的には、予測処理部２０の予測部２２は、結果変数の予測値を、予測モデル更新部３０の取得部３１に対して出力するのではなく、記憶部１６に記憶させてもよい。そして、予測モデル更新部３０の取得部３１は、記憶部１６に記憶された結果変数の予測値を取得してもよい。

　ここで、本開示において予測部２２から出力された結果変数の予測値は、例えば、「或る商品の需要量の増加（２５０）」であるものとする。

　出力部２３は、予測部２２から入力された結果変数の予測値を、表示部１４、及び／又は、販売店端末２に対して出力する。また、出力部２３は、予測モデルＭに入力された説明変数、及び、予測モデルＭから出力された結果変数の予測値を対応づけて出力してもよい。例えば、出力部２３から表示部１４に対して説明変数、及び、結果変数の予測値が出力された場合、表示部１４には、或る商品の価格を値引きするクーポンの配布（説明変数）に伴って、或る商品の需要量の増加（２５０）（結果変数の予測値）が予測される旨が表示されることになる。

　ところで、クーポンの配布と売り上げの因果関係を学習して構築された予測モデルを用いた場合であっても、説明変数に対応した結果変数の予測値と、説明変数に対応した結果変数の実績値との間に誤差が生じることがある。この誤差の要因としては、例えば、クーポンの割引率の変化、気象の変化、又は、競合店舗の出店など、予測モデルＭが学習していない因果関係による影響が考えられる。そして、誤差が生じた場合、予測モデルの予測精度の向上を目的として、販売店データ、気象データなどが示す新たな説明変数を用いて予測モデルを更新することが求められる。しかしながら、予測モデルの更新作業者が、誤差の原因を特定するのは容易ではない。そこで、本開示における情報処理装置１の予測モデル更新部３０は、予測モデルＭの更新に用いる新たな説明変数を選択する作業に対する更新作業者の煩わしさを低減するために予測モデル更新処理を実行する。

・予測モデル更新部３０により実行される予測モデル更新処理について
　予測モデル更新部３０は、予測モデルＭの更新に用いる新たな説明変数を選択する作業に対する作業者の煩わしさを低減すること、及び、予測モデルＭの予測精度の向上を目的として、予測モデルＭを更新する新たな説明変数の候補（以降、候補説明変数と称する。）、及び、候補説明変数を選択する際の指標となる影響値を算出する。さらに、予測モデル更新部３０は、候補説明変数、及び、候補説明変数の影響値に基づいて選択された候補説明変数を用いて予測モデルを更新する。ここで、候補説明変数を選択するための影響値は、少なくとも、予測モデルの予測精度の向上に寄与する程度を示す値であればよい。

　予測モデル更新部３０は、取得部３１、誤差算出部３２、候補説明変数取得部３３、類似予測対象取得部３４、評価部３５、及び、更新部３６を有する。

　取得部３１は、販売店端末２又は操作部１５から入力部２１に入力された説明変数であって、予測部２２から予測モデルＭに対して出力された説明変数を予測部２２から取得する。また、取得部３１は、予測モデルＭから予測部２２に入力された結果変数の予測値であって、出力部２３から表示部１４及び／又は販売店端末２に対して出力された結果変数の予測値を予測部２２から取得する。さらに、取得部３１は、販売店端末２又は操作部１５から入力部２１に入力された説明変数、及び、該当の説明変数に対応した結果変数の実績値を記憶部１６に記憶されたデータセットから取得する。

　ここで、本開示における説明変数は、例えば、「或る商品の価格を値引きするクーポンの配布」であるものとする。そして、本開示における説明変数に対応した結果変数の予測値は、例えば、「或る商品の需要量の増加（２５０）」である一方、この説明変数に対応した結果変数の実績値は、例えば、「或る商品の需要量の増加（５００）」であるものとする。

　誤差算出部３２は、取得部３１が予測部２２から取得した説明変数に対応した結果変数の予測値と、取得部３１が記憶部１６から取得した説明変数に対応した結果変数の実績値との誤差を算出する。ここで、本開示における誤差算出部３２は、該当の誤差を２５０と算出したものとする。

　次に、候補説明変数取得部３３は、誤差算出部３２で算出した誤差が閾値以上である場合、誤差の原因となっている説明変数の候補である候補説明変数を取得する。閾値は、任意の値、割合などが定められていればよい。具体的には、候補説明変数取得部３３は、誤差算出部３２で算出した誤差が閾値以上であると判定したタイミングから所定の期間（以降、誤差発生期間と称する）前後に変化があったデータを候補説明変数として、記憶部１６に記憶されたデータセットから取得する。また、候補説明変数取得部３３は、誤差算出部３２で算出した誤差が閾値以上であると判定したタイミング、及び、誤差算出部３２で算出した誤差が閾値未満であると判定したタイミングにおいて変化があったデータを候補説明変数として、記憶部１６に記憶されたデータセットから取得してもよい。ここでいう変化とは、データが示す事象の数、性質、又は、状態などが、経時的に、閾値以上の差を有する別の数、別の性質、又は、別の状態に遷移したことをいう。

販売店データから候補説明変数を取得する場合、候補説明変数取得部３３は、例えば、誤差発生期間前後に変化した、在庫データ、キャンペーンデータ、利用者の属性データ、店舗の属性データを候補説明変数として取得する。

　また、ＳＮＳデータから候補説明変数を取得する場合、候補説明変数取得部３３は、例えば、誤差発生期間前後に変化した、投稿数、閲覧数、又は、共有数が示すデータを候補説明変数として取得する。

　また、検索データから候補説明変数を取得する場合、候補説明変数取得部３３は、例えば、誤差発生期間前後に変化した、閲覧数、応募数、又は、ダウンロード数が示すデータを候補説明変数として取得する。また、ウェブサイトを閲覧する利用者の属性データを把握している場合、候補説明変数取得部３３は、属性データでフィルタを掛けたデータを候補説明変数として取得してもよい。

　次に、類似予測対象取得部３４は、予測対象に類似する対象であって、候補説明変数取得部３３で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する。ここで、「予測対象」とは、例えば、店舗ａなど、因果関係を有する事象が発生する対象であって、説明変数に対応した結果変数の予測値を算出する対象をいう。また、類似予測対象取得部３４は、説明変数、候補説明変数、結果変数の実績値、及び、属性の少なくとも１つ以上が、予測対象に類似する対象を類似予測対象として取得する。次に、類似予測対象を特定する具体的なパターンについて説明するが、夫々のパターンを組み合わせても良い。

・パターン１．説明変数、候補説明変数、結果変数の実績値に基づいて、類似予測対象を特定するパターン。
　類似予測対象取得部３４は、結果変数の実績値と結果変数の予測値の誤差に影響を及ぼすと判定された候補説明変数以外に、結果変数の実績値の変動に影響を及ぼすような候補説明変数がない対象を類似予測対象として特定する。
　また、類似予測対象取得部３４は、結果変数の実績値の変動に影響を及ぼすような候補説明変数があるが、結果変数の実績値の変動の向きが予測対象と類似する対象を類似予測対象として特定する。

・パターン２．結果変数の実績値に基づいて、類似予測対象を特定するパターン。
　類似予測対象取得部３４は、誤差発生期間前後に誤差が生じる予測対象と、誤差が生じない対象で結果変数の実績値の変動のタイミングが類似する場合、誤差が生じない対象を類似予測対象として特定する。

・パターン３．予測対象の属性情報に基づいて、類似予測対象を特定するパターン。
　類似予測対象取得部３４は、予測対象の属性と同一又は類似した属性の対象を類似予測対象として特定する。例えば、類似予測対象取得部３４は、予測対象が店舗である場合、販売店データに含まれた利用客の属性データ、店舗の属性データなどが類似した店舗（対象）を類似予測対象として特定する。

　図３は、類似予測対象を特定する態様を説明するための図である。
　店舗ａ、店舗ｂ、及び、店舗ｃには、情報処理装置１に接続された販売店端末２が設けられているものとする。そして、情報処理装置１の記憶部１６には、店舗ａ、店舗ｂ、及び、店舗ｃに関するデータセットが記憶されているものとする。ここで、予測対象を店舗ａとし、店舗ｂ、店舗ｃの何れか一方を類似予測対象として特定する方法を説明する。

　図３（Ａ）は、店舗ａ、店舗ｂ、及び、店舗ｃの割引率の推移を示す図である。図３（Ａ）に示すように、時間Ｔ１において、店舗ａの商品の割引率が１０％から３０％に引き上げられ、店舗ｂ及び店舗ｃの商品の割引率が１０％のまま据え置かれている。

　図３（Ｃ）は、店舗ａ、店舗ｂ、及び、店舗ｃの需要量の実績値の推移を示す図である。図３（Ｃ）に示すように、時間Ｔ１以降の時間において、店舗ａの商品の需要量の実績値が、店舗ｂ及び店舗ｃの商品の需要量の実績値よりも増大している。

　ここで、図３（Ｃ）の時間Ｔ１よりも前の時間において、店舗ａの需要量の実績値と、店舗ｂの需要量の実績値が変動するタイミングが類似している。一方、店舗ｃは、時間Ｔ１よりも前の時間において、店舗ａの需要量の実績値が一時的に増加しているときに、店舗ｃの需要量の実績値が減少している。即ち、店舗ｂは、パターン２の条件を満たしているが、店舗ｃは、パターン２の条件を満たしていない。従って、類似予測対象取得部３４は、予測対象である店舗ａの類似予測対象として店舗ｂを取得する。

　図３（Ｂ）は、店舗ａ、店舗ｂ、及び、店舗ｃの休日情報を示す図である。店舗ａ、店舗ｂ、及び、店舗ｃの休日情報は同一である。しかしながら、図３（Ｃ）に示すように、店舗ｃの休日の需要量の推移は、店舗ａ及び店舗ｂの休日の需要量の推移と相違している。これは、例えば、店舗の属性データの相違によって生じ得る。具体的には、店舗ｃが、オフィス街に位置し、店舗ａ及び店舗ｂは、住宅街に位置するような場合である。即ち、店舗ｂは、パターン３の条件を満たしているが、店舗ｃは、パターン３の条件を満たしていない。従って、類似予測対象取得部３４は、予測対象である店舗ａに類似する類似予測対象として店舗ｂを取得する。

　なお、類似予測対象取得部３４は、公知のユークリッド距離及び／又はコサイン類似度などを用いて、店舗ａの割引率を引き上げる前の時系列データ間の差を数値として演算することで、店舗ａ（予測対象）に類似する店舗を類似予測対象として取得してもよい。

　また、類似予測対象取得部３４は、上述の処理により特定された類似予測対象の数が上限値を示す閾値よりも多い場合、予測対象と共通の属性を有する類似予測対象のみに絞り込んでも良い。また、類似予測対象取得部３４は、上述の処理により特定された類似予測対象の数が下限値を示す閾値よりも少ない場合、候補説明変数取得部３３で取得された候補説明変数を原因とする誤差が生じていないと判定する基準を緩和してもよい。　

　次に、評価部３５は、候補説明変数の影響値を算出する。評価部３５は、予測対象における候補説明変数に対応する結果変数の実績値と、予測対象における候補説明変数の影響を受けていない結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する。ここで、予測対象における候補説明変数の影響を受けていない結果変数の実績値を取得することは出来ない。そのため、評価部３５は、公知の反実仮想の技術を用いて、予測対象における候補説明変数の影響を受けていない結果変数の実績値の代替として、類似予測対象における候補説明変数に対応する結果変数の実績値を採用する。即ち、評価部３５は、類似予測対象取得部３４で取得された類似予測対象（店舗ｂ）のデータセットを参照することで、候補説明変数に対応する結果変数の実績値を取得する。

　また、評価部３５は、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象において候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する評価モデルを用いることで、候補説明変数の影響値を算出してもよい。また、評価部３５は、予測値と実績値の差（誤差）の絶対値を計算し、その総和をデータ数で割った値で示される平均絶対誤差（ＭＡＥ：Mean Absolute Error）を影響値としてもよい。

　また、評価部３５は、類似予測対象に関するデータセットから取得したデータを学習することで構築された仮想モデルを用いて、類似予測対象において候補説明変数に対応する結果変数の実績値（仮想実績値）を算出してもよい。なお、仮想モデルは、例えば、傾向スコア法、マッチング法、差分の差分析法など、公知の技術を用いて構築されればよい。

　更新部３６は、候補説明変数取得部３３で取得された１又は複数の候補説明変数の中から、評価部３５で算出された影響値の選択基準に基づいて選択した候補説明変数のデータを用いて予測モデルＭを更新する。より具体的には、更新部３６は、影響値が最も高い又は影響値が閾値以上の候補説明変数を選択し、予測モデルＭの説明変数に候補説明変数を追加して新たな説明変数を作成する。そして、更新部３６は、候補説明変数及び結果変数の実績値に基づき予測モデルＭを更新する。

　ここで、選択基準を、影響値が最も高い候補説明変数、又は、影響値が閾値以上の候補説明変数を選択するものとしたがこれに限られない。例えば、更新部３６は、選択基準を設けずに、候補説明変数取得部３３で取得された１又は複数の候補説明変数、及び、評価部３５で算出された候補説明変数の影響値を対応づけて表示させ、操作者によって選択操作された候補説明変数のデータを用いて予測モデルＭを更新してもよい。

　図４は、予測モデルを更新する候補説明変数の選択画面を示す図である。
　評価部３５は、予測モデルＭを更新する候補説明変数、及び、候補説明変数を選択するための指標となる影響値を示す選択画面Ｇ１を表示部１４に表示出力する。選択画面Ｇ１には、番号、入力構成、影響値、及び、選択ボタンが対応付けられたリストＲ１が表示されている。ここで、入力構成は、予測モデルＭに学習させる候補の説明変数（候補説明変数）の他、予測モデルＭに学習済の説明変数（学習済説明変数）を含む。また、影響値として、ＭＡＥを示している。ＭＡＥは、その数値が小さいほど誤差が小さいこと、即ち、予測の精度が高いことを示す。図４において、網掛けが施された入力構成は、予測モデルＭに学習済の説明変数を示す。番号は、入力構成、影響値、及び、選択ボタンを識別するための情報を示す。リストＲ１の番号１には、候補説明変数として「割引率」、学習済説明変数として「前日の需要量」「前日の来客数」「予報気温」、候補説明変数のＭＡＥ（影響値）として「１２．３５」が示されている。リストＲ１の番号４には、候補説明変数として「ＳＮＳ広告の共有数」、学習済説明変数として「前日の需要量」「前日の来客数」、「予報気温」、候補説明変数のＭＡＥとして「９．２８」が示されている。この場合、候補説明変数のＭＡＥの値が小さい番号４を選択し、候補説明変数「ＳＮＳ広告の共有数」を用いて予測モデルを更新Ｍすることで、番号４以外の番号を選択した場合よりも、予測モデルＭの予測精度を向上させることができる。

　このように、情報処理装置１の予測モデルの更新作業者は、リストＲ１に示された影響値を参照したうえで、所望の番号に対応づけられた選択ボタンを選択できるから、自身の知見に依存することなく、予測モデルの更新に用いる新たな説明変数を選択することができる。従って、更新作業者は、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさが低減される。即ち、情報処理装置１は、説明変数を選択するための指標となる影響値を表示することにより、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさを低減することが可能となる。

　なお、情報処理装置１は、水平スクロールバーＨ、垂直スクロールバーＶに対する操作入力を受け付けることにより、図示されていない、説明変数及び／又は番号を表示可能にしてもよい。また、情報処理装置１は、学習済説明変数を網掛けして示しているが、この表示態様に限らず、予測モデルＭに学習済である旨が識別可能であれば如何なる態様を用いてもよい。

　図５は、予測モデル更新処理を示すフローチャート図である。
　ステップＳ１００において、取得部３１は、予測モデルＭに入力された説明変数、及び、予測モデルＭから出力された予測値を取得する。

　ステップＳ１０１において、誤差算出部３２は、取得部３１で取得された説明変数に対応した結果変数の実績値と、取得部３１で取得された予測値の誤差を算出する。

　ステップＳ１０２において、誤差算出部３２は、算出した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、閾値は、自然数である。誤差算出部３２は、誤差の絶対値が閾値未満の場合、予測モデルを更新する必要が無いものとして、処理を終了する（ステップＳ１０２：ＮＯ）。一方、誤差算出部３２は、誤差の絶対値が閾値以上の場合、予測モデルを更新する必要があるものとしてステップＳ１０３へと進む。

ステップＳ１０３において、候補説明変数取得部３３は、誤差算出部３２で算出された誤差が閾値以上である場合（ステップＳ１０２：ＹＥＳ）、記憶部１６に記憶されたデータセットから、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する。

　ステップＳ１０４において、類似予測対象取得部３４は、予測対象に類似する対象であって、候補説明変数取得部３３で取得された候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する。

　ステップＳ１０５において、評価部３５は、予測対象における候補説明変数に対応する結果変数の実績値と、類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値（ＭＡＥ）を高く算出する。

　ステップＳ１０６において、更新部３６は、候補説明変数取得部３３で取得された１又は複数の候補説明変数の中から、評価部３５で算出された影響値の選択基準に基づいて選択した候補説明変数を用いて予測モデルＭを更新する。また、更新部３６は、候補説明変数取得部３３で取得された１又は複数の候補説明変数、及び、評価部３５で算出された候補説明変数の影響値（ＭＡＥ）を対応づけて表示させ、選択操作された候補説明変数を用いて予測モデルＭを更新する。

　以上のように、実施の形態１における情報処理装置１は、予測モデルの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標を示すことができるから、予測モデルの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができるといった効果を奏する。

・第２の実施形態
　予測モデルを更新する態様は、第１の実施形態に限られない。ここで、店舗ｃ（予測対象）と、店舗ｃに類似する店舗ｄ（類似予測対象）が情報処理装置１に接続されているものとする。そして、誤差算出部３２は、店舗ｄの誤差が閾値以上であると判定した場合、かつ、店舗ｃの誤差が閾値未満であると判定した場合に、店舗ｄで演算した影響値を用いて店舗ｃの予測モデルＭを更新してもよい。

　図６は、第２の実施形態における予測モデル更新処理を示すフローチャート図である。
　ステップＳ１００、Ｓ１０１、Ｓ１０３～Ｓ１０８の処理は、図５に示した各ステップの処理と同じであるため説明を省略する。

　ステップＳ１０２′において誤差算出部３２は、ステップＳ１０１で演算した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、誤差算出部３２は、店舗ｃの誤差が閾値未満であると判定する。閾値は、自然数である。誤差算出部３２は、誤差の絶対値が閾値未満であるとして、ステップＳ２０１に進む。なお、誤差算出部３２は、誤差の絶対値が閾値以上である場合には、ステップＳ１０３に進む。

ステップＳ２０１において、類似予測対象取得部３４は、予測対象（店舗ｃ）に類似する少なくとも１つの対象を類似予測対象（店舗ｄ）として取得する。なお、予測対象（店舗ｃ）に類似する類似予測対象（店舗ｄ）を取得する処理は、図５に示したステップＳ１０４の処理と同様でよい。

　ステップＳ２０２において、誤差算出部３２は、類似予測対象取得部３４で取得された類似予測対象の店舗ｄの説明変数に対応した結果変数の予測値と実績値の誤差を算出する。

　ステップＳ２０３において、誤差算出部３２は、算出した誤差の絶対値が閾値以上であるか、未満であるか判定する。ここで、閾値は、自然数であるものとする。誤差算出部３２は、誤差の絶対値が閾値未満である場合、予測モデルＭを更新する必要が無いものとして、処理を終了する（ステップＳ２０３：ＮＯ）。一方、誤差算出部３２は、誤差の絶対値が閾値以上である場合、予測モデルＭを更新する必要があるものとしてステップＳ２０４へと進む（ステップＳ２０３：ＹＥＳ）。

　ステップＳ２０４において、候補説明変数取得部３３は、ステップＳ２０２で算出された誤差の原因となっている説明変数の候補である候補説明変数を取得する。

　ステップＳ２０５において、評価部３５は、ステップＳ２０４で取得された候補説明変数の影響値を算出する。具体的には、評価部３５は、予測対象（店舗ｃ）における候補説明変数に対応する結果変数の実績値と、類似予測対象（店舗ｄ）における候補説明変数に対応する結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出する。

　ステップＳ２０６において、更新部３６は、ステップＳ２０５で算出された影響値の選択基準に基づいて選択した候補説明変数を用いて店舗ｃの予測モデルＭを更新する。

　以上のように、実施の形態２における情報処理装置１は、予測モデルＭの予測精度の向上に寄与する程度といった、新たな説明変数を選択するための指標を示すことができる。これにより、実施の形態２における情報処理装置１は、予測モデルＭの更新に用いる新たな説明変数を選択する作業に対する操作者の煩わしさを低減することができるといった効果を奏する。

・その他の応用例１
　第１の実施形態においては、候補説明変数が与える誤差期間内の影響値のみを指標として予測モデルを更新したが、評価部３５は、誤差算出部３２で算出した誤差が閾値以上であると判定したタイミング、及び、誤差算出部３２で算出した誤差が閾値未満であると判定したタイミングの夫々で、候補説明変数の影響値を算出してもよい。また、評価部３５は、夫々のタイミングで算出した候補説明変数の影響値を候補説明変数の選択画面に表示出力してもよい。なお、ここでは、評価部３５は、影響値の一例であるＭＡＥを算出するものとする。以降の説明においては、誤差期間内に算出した候補説明変数の影響値を誤差期間内ＭＡＥ、誤差期間外に算出した候補説明変数の影響値を誤差期間外ＭＡＥと称する。

　図７は、予測モデルを更新する候補説明変数の選択画面を示す図である。
　評価部３５は、予測モデルＭに学習させる候補の説明変数（候補説明変数）を原因とする誤差が生じていない期間、及び、誤差が生じている期間の夫々において算出された候補説明変数に対応する結果変数の実績値の差の大きさに基づいて影響値（誤差期間内ＭＡＥ、誤差期間外ＭＡＥ）を算出する。また、評価部３５は、候補説明変数、予測モデルＭに学習済の説明変数（学習済説明変数）、候補説明変数を選択するための指標となる影響値（誤差期間内ＭＡＥ、誤差期間外ＭＡＥ）、グラフ、及び、選択ボタンを含む選択画面Ｇ２を表示部１４に表示出力する。ここで、グラフは、少なくとも、予測対象における結果変数の実績値、及び、予測値の推移を含むものとする。

　例えば、選択画面Ｇ２の番号１には、候補説明変数として「割引率」を選択した場合の予測対象（店舗ａ）における需要量の実績値８４（実線）及び予測値８３（破線）の推移を示すグラフ、誤差期間内ＭＡＥ（９．８７）、及び、誤差期間外ＭＡＥ（１６．３７」が示されている。さらに、選択画面Ｇ２の番号１には、予測対象における需要量の実績値及び予測値の推移を示すグラフ、割引率の推移を示すグラフ、及び、前日の需要量の推移を示すグラフが、夫々同じ時系列に示されている。

　また、例えば、選択画面Ｇ２の番号４には、候補説明変数として「ＳＮＳ広告の共有数」を選択した場合の、予測対象（店舗ａ）における需要量の実績値及び予測値の推移を示すグラフ、誤差期間内ＭＡＥ（６．５４）、及び、誤差期間外ＭＡＥ（９．９１）で表示される。さらに、選択画面Ｇ２の番号４には、予測対象における需要量の実績値及び予測値の推移を示すグラフ、ＳＮＳ広告の共有数の推移を示すグラフ、及び、前日の需要量の推移を示すグラフが、夫々同じ時系列に示されている。

　このように、誤差期間内ＭＡＥ、及び、誤差期間外ＭＡＥの夫々を算出して表示出力することで、更新作業者は、誤差期間内及び誤差期間外の予測モデルの予測精度が向上するような候補説明変数を選択しやすくなる。また、予測対象における需要量の実績値及び予測値の推移を示すグラフを表示出力することで、更新作業者は、候補説明変数が予測モデルに与える影響を視覚的に視認しやすくなる。即ち、情報処理装置１は、実施の形態１に比べて、予測モデルの予測精度を向上させつつも、予測モデルの更新に用いる新たな説明変数を選択する作業に対する煩わしさを低減することが可能となる。

　なお、情報処理装置１は、垂直スクロールバーＶ１、Ｖ２に対する操作入力を受け付けることにより、図示されていない、説明変数及び／又は番号を表示可能にしてもよい。図７に表示された候補説明変数は、図４に表示された候補説明変数に対応している。図７のＮｏ．２、Ｎｏ．３に同じ候補説明変数が図示されているが、垂直スクロールバーＶ２をスクロールさせることで、図示されていない候補説明変数が表示される。

・その他の応用例２
　第１の実施形態において、類似予測対象取得部３４は、説明変数、候補説明変数、結果変数の実績値、及び、属性の少なくとも１つ以上が、予測対象に類似する対象を類似予測対象として取得した。そして、評価部３５は、予測対象における候補説明変数に対応する結果変数の実測値と、予測対象における候補説明変数の影響を受けていない結果変数の実績値との差が大きいほど、候補説明変数の影響値を高く算出した。しかしながら、このようにして取得及び評価された類似予測対象は、候補説明変数取得部３３で取得された候補説明変数による影響を含んでいる恐れがある。

　そこで、類似予測対象取得部３４は、取得した類似予測対象を、候補説明変数の影響がある類似予測対象店舗（以下、影響あり類似店舗ｂ１と称する。）と、影響がない類似予測対象店舗（以下、影響なし類似店舗ｂ２と称する。）に分類してもよい。例えば、類似予測対象取得部３４は、予測対象である店舗ａと同時期に同じキャンペーンを実施する店舗を影響あり類似店舗Ｂ１、予測対象である店舗ａと同時期に異なるキャンペーンを実施する店舗を影響なし類似店舗Ｂ２に分類してもよい。

　更に、評価部３５は、影響あり類似店舗ｂ１の実績値、及び、影響なし類似店舗ｂ２の実績値の差が大きいほど、候補説明変数の影響値を高く算出してもよい。

　上述した情報処理装置１が実施する処理は、コンピュータを機能させるためのプログラムとして構成されてもよい。

　１　情報処理装置、２　販売店端末、３　ネットワーク、１１　プロセッサ、１２　メモリ、１３　通信インタフェース、１４　表示部、１５　操作部、１６　記憶部、２０　予測処理部、２１　入力部、２２　予測部、２３　出力部、３０　予測モデル更新部、３１　取得部、３２　誤差算出部、３３　候補説明変数取得部、３４　類似予測対象取得部、３５　評価部、３６　更新部。

Claims

　予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理装置であって、
　前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得部と、
　前記取得部で取得された前記説明変数に対応した結果変数の実績値と、前記取得部で取得された前記予測値の誤差を算出する誤差算出部と、
　前記誤差算出部で算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得部と、
　前記予測対象に類似する対象であって、前記候補説明変数取得部で取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得部と、
　前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価部と
　を備えることを特徴とする情報処理装置。
　前記評価部は、
　前記候補説明変数を原因とする誤差が生じていない対象、及び、当該誤差が生じている対象の夫々において算出された当該候補説明変数に対応する結果変数の実績値の差の大きさに基づいて評価すること
　を特徴とする請求項１に情報処理装置。
　前記評価部は、
　前記候補説明変数を原因とする誤差が生じていない期間、及び、当該誤差が生じている期間の夫々において算出された当該候補説明変数に対応する結果変数の実績値の差の大きさに基づいて評価すること
　を特徴とする請求項１又は２に情報処理装置。
　前記情報処理装置は、更に、
　前記候補説明変数取得部で取得された１又は複数の前記候補説明変数の中から、前記評価部で算出された影響値の選択基準に基づいて選択した前記候補説明変数を用いて前記予測モデルを更新する更新部
　を備えることを特徴とする請求項１～３のいずれかに記載の情報処理装置。　
　前記情報処理装置は、更に、
　前記候補説明変数取得部で取得された１又は複数の前記候補説明変数、及び、前記評価部で算出された当該候補説明変数の影響値を対応づけて表示させ、選択操作された候補説明変数を用いて前記予測モデルを更新する更新部
　を備えることを特徴とする請求項１～３のいずれかに記載の情報処理装置。　
　前記類似予測対象取得部は、
　前記説明変数、前記候補説明変数、前記結果変数の実績値、及び、属性の少なくとも１つ以上が、前記予測対象に類似する対象を類似予測対象として取得すること
　を特徴とする請求項１～５のいずれか１項に記載の情報処理装置。
　前記誤差算出部で算出された前記誤差が閾値未満である場合に、前記予測対象に類似する対象であって、前記候補説明変数取得部で取得された前記候補説明変数を原因とする誤差が生じている対象を類似予測対象として取得する類似予測対象取得部と、
　前記予測対象における候補説明変数に対応する結果変数の実績値と、前記類似予測対象における候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価部と
　を備えることを特徴とする請求項１～６のいずれか１項に記載の情報処理装置。
　予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理方法であって、
　前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得ステップと、
　前記取得ステップで取得された前記説明変数に対応した結果変数の実績値と、前記取得ステップで取得された前記予測値の誤差を算出する誤差算出ステップと、
　前記誤差算出ステップで算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得ステップと、
　前記予測対象に類似する対象であって、前記候補説明変数取得ステップで取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得ステップと、
　前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価ステップと
　を備えることを特徴とする情報処理方法。
　予測対象において、因果関係の原因となっている説明変数、及び、当該因果関係の結果となっている結果変数の関係を学習して構築された予測モデルを用いて、入力された説明変数に対応する結果変数の予測値を出力する情報処理方法であって、
　前記予測モデルに入力された前記説明変数、及び、前記予測モデルから出力された前記予測値を取得する取得ステップと、
　前記取得ステップで取得された前記説明変数に対応した結果変数の実績値と、前記取得ステップで取得された前記予測値の誤差を算出する誤差算出ステップと、
　前記誤差算出ステップで算出された前記誤差が閾値以上である場合に、当該誤差の原因となっている説明変数の候補である候補説明変数を取得する候補説明変数取得ステップと、
　前記予測対象に類似する対象であって、前記候補説明変数取得ステップで取得された前記候補説明変数を原因とする誤差が生じていない対象を、類似予測対象として取得する類似予測対象取得ステップと、
　前記予測対象における前記候補説明変数に対応する結果変数の実績値と、前記類似予測対象における前記候補説明変数に対応する結果変数の実績値との差が大きいほど、当該候補説明変数の影響値を高く算出する評価ステップと
　をコンピュータに実行させることを特徴とするプログラム。