JP2019200487A - 利用数予測装置、利用数予測方法及びプログラム - Google Patents
利用数予測装置、利用数予測方法及びプログラム Download PDFInfo
- Publication number
- JP2019200487A JP2019200487A JP2018093296A JP2018093296A JP2019200487A JP 2019200487 A JP2019200487 A JP 2019200487A JP 2018093296 A JP2018093296 A JP 2018093296A JP 2018093296 A JP2018093296 A JP 2018093296A JP 2019200487 A JP2019200487 A JP 2019200487A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- model
- usage
- value
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims abstract description 53
- 238000013145 classification model Methods 0.000 claims description 99
- 238000012937 correction Methods 0.000 claims description 19
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 14
- 235000012054 meals Nutrition 0.000 description 109
- 238000007637 random forest analysis Methods 0.000 description 20
- 230000006399 behavior Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 5
- 235000013305 food Nutrition 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010411 cooking Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】サービスの利用数を予測することができる利用数予測装置、利用数予測方法及びプログラムを提供することである。【解決手段】実施形態の利用数予測装置は、取得部と、複数モデル作成部と、選択部と、利用数算出部とを持つ。取得部は、在館者数、サービスの利用率、サービスに対する利用者の支払い、天気、日付、特異日の情報のうちひとつ以上を日ごとに示す履歴データから目的変数である利用率又はサービス利用有無の値と説明変数の値とを学習データとして取得する。複数モデル作成部は、学習データを使用して予測モデルを作成し、作成された予測モデルにおいて重要度が閾値よりも低い説明変数を学習データから削除する処理を繰り返す。選択部は、予測の誤差に基づいて予測モデルを選択する。利用数算出部は、選択された予測モデルに予測対象日の説明変数の値を入力して得られた目的変数の予測値に基づいて予測の利用数を算出する。【選択図】図2
Description
本発明の実施形態は、利用数予測装置、利用数予測方法及びプログラムに関する。
食堂は、利用者に食事を提供するサービスを行う。食堂では、見込まれるサービスの利用数、すなわち、食事数に従って食材を仕入れ、営業開始時刻よりも前から食事を提供する準備を始める。しかし、見込みの食事数が実際に注文された食事数と乖離し、廃棄される食材の量が多くなることや、用意していた食事数では不足してしまうことがあった。
本発明が解決しようとする課題は、サービスの利用数を予測することができる利用数予測装置、利用数予測方法及びプログラムを提供することである。
実施形態の利用数予測装置は、取得部と、複数モデル作成部と、選択部と、利用数算出部とを持つ。取得部は、過去の所定期間における施設の在館者数の情報と、前記施設の在館者のうち所定のサービスを利用した割合である利用率の情報と、前記サービスに対する利用者の支払いの情報と、天気の情報と、日付の情報と、在館者数が減少する特異日の情報とのうちひとつ以上の情報を日ごとに示す履歴データから目的変数である利用率又はサービス利用有無の値と前記目的変数の算出に用いる複数種類の説明変数の値とを学習データとして取得する。複数モデル作成部は、前記学習データを使用して、前記説明変数の値を入力に用いて前記目的変数の値を予測する予測モデルを作成し、作成された前記予測モデルにおいて前記目的変数の予測に対する重要度が閾値よりも低い前記説明変数を前記学習データから削除する処理を行い、削除後の前記学習データを使用して当該処理を繰り返す。選択部は、前記複数モデル作成部が作成した前記予測モデルの中から当該予測モデルを用いた予測の誤差に基づいて、予測に使用する前記予測モデルを選択する。利用数算出部は、前記選択部が選択した前記予測モデルに予測対象日における前記説明変数の値を入力して得られた前記目的変数の予測値に基づいて前記サービスの予測の利用数を算出する。
以下、実施形態の利用数予測装置、利用数予測方法及びプログラムを、図面を参照して説明する。以下では、予測対象のサービスの利用数が、施設内の食堂において提供される食事数である場合を例に説明する。以下では、食堂において提供する食事数を、「食堂食事数」又は「食事数」と記載する。
(第1の実施形態)
図1は、食事数の予測対象となる食堂の環境を示す図である。ビル50は、食堂を備える施設の一例である。施設は、例えば、工場、事業所、学校、病院などでもよい。ビル50は、例えば、オフィスビルである。ビル50は、複数階のフロアからなる。ビル50の出入り口となるフロアにはゲート51aが設置される。会社の従業員は、ビル50に入るとき及びビル50から出るときに、ゲート51aに個人ID(識別子)が記録された従業員証をかざす。また、ビル50の事務所フロアの各部屋の入口付近にはゲート51bが設定される。従業員は、ビル50内の部屋に入退出又は入室する際に、部屋の入口付近に設置されているゲート51bに従業員証をかざす。ゲート51aとゲート51bを総称してゲート51と記載する。ゲート51は、従業員証から個人IDを読み出す。個人IDは、従業員を特定する識別子である。ゲート51は、ゲートデータをデータベース6に記録する。ゲートデータは、ゲートIDと、従業員証から読み取った個人IDと、ゲート通過時刻と、入退出種別とを含む。入退出種別は、ビル50又は部屋に入ったか、あるいは、ビル50又は部屋から出たかの種別を示す。ゲートIDは、ゲート51を識別する情報である。
図1は、食事数の予測対象となる食堂の環境を示す図である。ビル50は、食堂を備える施設の一例である。施設は、例えば、工場、事業所、学校、病院などでもよい。ビル50は、例えば、オフィスビルである。ビル50は、複数階のフロアからなる。ビル50の出入り口となるフロアにはゲート51aが設置される。会社の従業員は、ビル50に入るとき及びビル50から出るときに、ゲート51aに個人ID(識別子)が記録された従業員証をかざす。また、ビル50の事務所フロアの各部屋の入口付近にはゲート51bが設定される。従業員は、ビル50内の部屋に入退出又は入室する際に、部屋の入口付近に設置されているゲート51bに従業員証をかざす。ゲート51aとゲート51bを総称してゲート51と記載する。ゲート51は、従業員証から個人IDを読み出す。個人IDは、従業員を特定する識別子である。ゲート51は、ゲートデータをデータベース6に記録する。ゲートデータは、ゲートIDと、従業員証から読み取った個人IDと、ゲート通過時刻と、入退出種別とを含む。入退出種別は、ビル50又は部屋に入ったか、あるいは、ビル50又は部屋から出たかの種別を示す。ゲートIDは、ゲート51を識別する情報である。
ビル50が備える食堂には、POS(Point Of Sale)53が設置されている。POS53は、利用者が食堂で利用した飲食メニューの支払いに利用される。支払い方法には、従業員証を用いた支払いのほか、現金による支払や支払い用カードによる支払がある。支払い用カードは、例えば、電子マネーにより支払いを行うためのカードや、クレジットカード等である。POS53は、個人IDと、支払い時刻と、支払い金額と、支払い方法とを設定したPOSデータをデータベース6に記録する。支払い方法は、従業員証による支払と、従業員証以外による支払のいずれであるかを示す。なお、支払い用カードを用いた場合、個人IDが設定されないPOSデータが記録される。
データベース6は、1台又は複数台のデータベースサーバにより実現される。データベース6が複数のデータベースサーバにより実現される場合、各データベースサーバは異なるシステムに属してもよい。例えば、データベース6は、ゲート51を有するゲート管理システムのデータベースサーバ、POS53を有するPOSシステムのデータベースサーバを含んでもよい。データベース6は、ゲートデータ及びPOSデータの履歴を記憶する。さらに、データベース6は、食堂利用率情報及び天気情報の履歴、ならびに、カレンダー情報を記憶する。カレンダー情報は、日付情報と、会社の休日を示す特異日情報とを含む。
図2は、第1の実施形態による食事数予測装置1の構成を示すブロック図である。食事数予測装置1は、利用数予測装置の一例である。食事数予測装置1は、個人行動データを用いずに食事数を予測する。データベース6は、食事数予測装置1が食事数の予測に用いる各種データを記憶する。食事数予測装置1は、予測モデル作成部11と、利用率算出部12と、食事数算出部13とを備える。
予測モデル作成部11は、学習データを用いて機械学習により食堂利用率の予測モデルを作成する。機械学習には、例えば、変数選択付きランダムフォレスト(RF)が用いられる。変数選択付きRFは、例えば、文献「Ramon Diaz-Uriarte, et.al, “Gene selection and classification of microarray data using random forest,” BMC Bioinformatics, January 6, 2006」に記載されている。予測モデル作成部11は、取得部111と、複数モデル作成部112と、選択部113とを備える。
取得部111は、データベース6に蓄積されている各種情報の履歴データから予測モデルの作成に使用するデータを読み出す。取得部111は、過去の所定期間における日ごとのゲートデータ、POSデータ、天気情報、特異日情報(会社休日)、食堂利用率情報及び日付情報を読み出す。取得部111は、読み出したこれらの情報からRFの目的変数である利用率の実績値と、目的変数の算出に用いる複数種類の説明変数の実績値とを学習データとして取得する。複数モデル作成部112は、取得部111が取得した学習データを使用して、説明変数を入力に用いて利用率を予測する予測モデルを作成し、作成した予測モデルを用いた予測の誤差を算出する。複数モデル作成部112は、作成した予測モデルにおいて、利用率の予測に対する重要度が所定よりも低い説明変数を学習データから削除する。複数モデル作成部112は、重要度が低い説明変数が削除された学習データを用いて、予測モデルを作成し、予測の誤差を算出する処理を繰り返す。選択部113は、複数モデル作成部112が作成した予測モデルの中から、誤差に基づいて、利用率の予測に使用する予測モデルを選択する。
利用率算出部12は、選択部113が選択した予測モデルに入力データを入力し、食堂利用率を算出する。入力データは、予測対象日における説明変数の値である。利用率算出部12は、予測対象日のゲートデータ、POSデータ、天気情報、特異日情報(会社休日)、食堂利用率情報及び日付情報のうちひとつ以上の情報から予測モデルへの入力データを得る。食事数算出部13は、利用率算出部12が算出した食堂利用率に予測対象日における在館者数を乗算し、食事数の予測値を算出する。食事数算出部13は、在館者数を予測対象日のゲートデータから得る。
なお、本実施形態では、予測を行うタイミングを12時00分とし、その日の11時55分時点までに収集したデータを用いて、学習済みの予測モデルにより食事数を予測する場合を例に説明する。また、本実施形態においては、食堂における支払い1回を、食事数1回とする。
図3〜図5は、予測モデルに用いられる説明変数を示す図である。なお、予測モデルの種類によって使用される説明変数は異なる。本実施形態の予測モデル作成部11は、全体回帰モデルを作成する。個人分類モデル及び全体分類モデルは、後述する第2の実施形態において用いられる。図3〜図5では、説明変数の分類、内容、名称、各種類の予測モデルに用いられるか否かを示す。〇は説明変数として用いることを、◇は目的変数であることを、×は説明変数に用いられないことを示す。また、分類は、説明変数の取得元となるデータを示す。
図3に示すように、ゲートデータからは、説明変数gate1155、n1000、n1100、n1155が得られる。説明変数gate1155は、11時55分の各個人の在館状況を示す。データn1000は、10時00分時点の在館者数を示す。説明変数n1100は、11時00分時点の在館者数を示す。説明変数n1155は、11時55分時点の在館者数を示す。POSデータからは、説明変数cafeが得られる。説明変数cafeは、食堂利用の有無を示す2値データである。
天気情報からは、説明変数maxtemp、mintemp、sunny、cloudy、rainingが得られる。説明変数maxtempは、当該日の最高気温を示す。説明変数mintempは、当該日の最低気温を示す。説明変数sunnyは、当該日の天気が晴れであるか否かを示す2値データである。説明変数cloudyは、当該日の天気が曇りであるか否かを示す2値データである。説明変数rainingは、当該日の天気が雨であるか否かを示す2値データである。特異日情報は、説明変数specialdayとして用いられる。説明変数specialdayは、特異日であるか否かを示す2値データである。特異日は、在館者数が通常と異なる日である。例えば、特異日は、会社の休日である。
図4に示すように、食堂利用率情報からは、説明変数rday07.1155、rday14.1155、rday21.1155、rday28.1155、rday07.1155.wid、rday14.1155.wid、rday14.1155.wid、rday28.1155.wid、rday07.1155.woid、rday14.1155.woid、rday21.1155.woid、rday28.1155.woidが得られる。食堂利用率情報は、ビル50の在館者数により、食堂利用者数を除算して得られる。在館者数はゲートデータから得られ、食堂利用者数はPOSデータから得られる。本実施形態では、食堂利用率情報をデータベース6から読み出しているが、取得部111が、データベース6から読み出したゲートデータ及びPOSデータを用いて生成してもよい。
説明変数rday07.1155、rday14.1155、rday21.1155、rday28.1155はそれぞれ、一週間前、二週間前、三週間前、四週間前の11時55分時点の在館者数に対する全食堂利用者の食堂利用率を示す。説明変数rday07.1155.wid、rday14.1155.wid、rday21.1155.wid、rday28.1155.widはそれぞれ、一週間前、二週間前、三週間前、四週間前の11時55分時点の在館者数に対する、従業員証により支払いを行った食堂利用者の割合を示す。説明変数rday07.1155.woid、rday14.1155.woid、rday21.1155.woid、rday28.1155.woidはそれぞれ、一週間前、二週間前、三週間前、四週間前の11時55分時点の在館者数に対する従業員証以外により支払いを行った食堂利用者の割合を示す。
図5に示すように、日付情報からは、説明変数month、fday、wday、weeknum2、hdaym3、hdaym2、hdaym1、hday0、hdayp1、hdayp2、hdayp3、hdaynumが得られる。説明変数monthは、月を示す。説明変数fdayは、月初め(当月の1日)であるか否かを示す2値データである。説明変数wdayは、曜日を示す。説明変数weeknum2は、当月内での週番号を示す。週番号とは、当月における何週目であるかを示す。説明変数hdaym3、hdaym2、hdaym1はそれぞれ、当該日の3日前、2日前、前日が休日であるか否かを示す2値データである。説明変数hday0、hdayp1、hdayp2、hdayp3はそれぞれ、当該日、当該日の翌日、当該日の2日後、当該日の3日後が休日であるか否かを示す2値データである。説明変数hdaynumは、当該日の前後3日間の休日数を示す2値データである。
図6は、食事数予測装置1の処理を示すフロー図である。予測モデル作成部11は、食事数Nallを0に初期化する(ステップS11)。取得部111は、学習期間内のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報をデータベース6から取得する。なお、取得部111は、天気情報などの一部の情報を、食事数予測装置1とネットワークを介して接続される情報提供装置から取得してもよい。学習期間は、予測対象日から直近の過去90日間とする。なお、学習期間は一例であり、適切な任意の期間とすることができる。例えば、学習期間は、連続した期間であってもよく、過去数年間の同一の月など、連続した期間でなくてもよい。
取得部111は、取得したデータから各日の説明変数の値及び目的変数の値を取得する(ステップS12)。ここでは、取得部111は、図3〜図5において全体RF回帰モデルに〇又は◇が記載されている説明変数の値及び目的変数の値を取得する。予測モデル作成部11は、学習期間内の各日の説明変数の値及び目的変数の値を学習データとして用い、全体回帰モデルを作成する(ステップS13)。作成された全体回帰モデルには、ステップS12において取得した説明変数のうち重要な説明変数が使用される。ここで重要とは、予測結果に与える影響が大きいことを示す。全体回帰モデルの作成処理については、後述する図7に詳細を示す。
利用率算出部12は、予測対象日の11時55分時点の各説明変数の値をデータベース6から取得する。利用率算出部12は、全体回帰モデルに用いられる説明変数の値を少なくとも取得すればよい。利用率算出部12は、ステップS12において作成された全体回帰モデルにより、取得した説明変数の値を用いて食堂利用率の予測値を計算する(ステップS14)。食事数算出部13は、予測対象の日の11時55分時点の在館者数の実績値をデータベース6から取得する。食事数算出部13は、ステップS14において算出した食堂利用率の予測値と、取得した在館者数の実績値とを乗算し、予測の食事数Nallを算出する(ステップS15)。
図7は、予測モデル作成部11による全体回帰モデル作成処理を示すフロー図である。まず、複数モデル作成部112は、RFにより、図6のステップS12において取得した日ごとの学習データの全ての説明変数を用いて目的変数の食堂利用率を得るRF回帰モデルを作成する(ステップS21)。複数モデル作成部112は、作成されたRF回帰モデルを用いて、説明変数の重要度及びOOB(Out-of-Bag)エラーを算出する(ステップS22)。説明変数の重要度の算出方法には、GINI係数を用いる手法や、OOBエラーを用いる手法などがあるが、既存の任意の手法を用いることができる。
複数モデル作成部112は、削除可能な説明変数があるか否かを判断する(ステップS23)。例えば、複数モデル作成部112は、現在学習データに用いられている説明変数の数が閾値以上である場合に、削除可能な説明変数があると判断する。例えば、後述するステップS24において下位の20%の説明変数を削除する場合、現在学習データに使用されている説明変数の数に対する1つの説明変数の割合が20%以上であるときの数、つまり、5個を閾値とする。複数モデル作成部112は、削除可能な説明変数があると判断した場合(ステップS23:YES)、ステップS24の処理を行う。
複数モデル作成部112は、ステップS22において算出した重要度が低い説明変数を削除対象として選択する。例えば、複数モデル作成部112は、重要度を高い順から並べた時に、順位が下位の20%に相当する説明変数を削除する。なお、20%は一例であり、任意に設定可能である。あるいは、予測モデル作成部11は、順位の低いものから所定数の説明変数を選択する。複数モデル作成部112は、選択した削除対象の説明変数を現在の学習データから削除する(ステップS24)。複数モデル作成部112は、ステップS24において説明変数を削除した学習データを用いて、ステップS21からの処理を繰り返す。そして、複数モデル作成部112は、削除可能な説明変数がないと判断した場合(ステップS23:NO)、複数RF回帰モデルの作成終了を選択部113に通知する。
通知を受けた選択部113は、例えば、1SEルールを適用してRF回帰モデルを選択する。具体的には、選択部113は、上記で複数モデル作成部112が作成した全てのRF回帰モデルのうち、OOBエラーの最小値から1標準偏差以内に含まれているRF回帰モデルを選択する。選択部113は、選択したRF回帰モデルの中からさらに、使用している説明変数の個数が最も少ないモデルを全体RF回帰モデルとする(ステップS25)。あるいは、選択部113は、OOBエラーが最小のRF回帰モデルを選択し、全体RF回帰モデルとしてもよい。このように、選択部113は、誤差が閾値よりも低いRF回帰モデルの中から使用されている説明変数の数が少ない予測モデルを選択する。
食事数は、在館者数の影響を受けやすい。本実施形態の食事数予測装置1は、食堂利用率を予測する回帰モデルを学習し、学習した回帰モデルを用いて予測した食堂利用率に在館者数を乗算することにより、食事数を出力する回帰モデルを用いることにより予測精度を向上させる。
本実施形態によれば、取得部111は、過去の所定期間におけるビル50の在館者数の情報と、ビル50の在館者のうち食堂で食事をした割合である利用率の情報と、食堂における食事に対する利用者の支払いの情報であるPOSデータと、天気の情報と、日付の情報と、在館者数が減少する特異日の情報とのうち少なくとも一部の情報を日ごとに示す履歴データから、目的変数である食堂の利用率と、目的変数の算出に用いる複数種類の説明変数の値とを学習データとして取得する。複数モデル作成部112は、学習データを使用して、説明変数の値を入力に用いて目的変数の値を予測する予測モデルを作成し、作成された予測モデルにおいて目的変数の予測に対する重要度が閾値よりも低い説明変数を学習データから削除する。複数モデル作成部112は、削除後の学習データを使用して予測モデルを作成し、作成された予測モデルにおいて重要度が閾値よりも低い説明変数を学習データから削除する処理を繰り返す。選択部113は、複数モデル作成部112が作成した予測モデルの中から、各予測モデルを用いた予測の誤差に基づいて、予測に使用する予測モデルを選択する。例えば、選択部113は、予測誤差を最小にする予測モデルの中から、1SEルールを適用した予測モデルを選択する。1SEルールでは、予測誤差の最小値より1標準偏差分だけ説明変数個数が少ない方向へ離れた予測モデルを選択する。利用率算出部12及び食事数算出部13は、利用数算出部の一例である。利用数算出部は、選択部113が選択した予測モデルに予測対象日における説明変数の値を入力して得られた目的変数の予測値に基づいて、予測の食事数を算出する。本実施形態によれば、個人を特定せずに、食事数を予測することができる。
(第2の実施形態)
第1の実施形態の食事数予測装置は、個人行動データを用いずに、変数選択を行いながら機械学習(RF)により予測モデルを作成し、食事数を予測した。第2の実施形態の食事数予測装置は、個人行動データを用いて変数選択を行いながら、機械学習により予測モデルを作成し、食事数を予測する。個人により食堂利用頻度や回数が異なるため、個人行動データには、偏りがある。そこで、食事数予測装置は、個人別に食堂利用率やデータ量に応じた予測モデルを作成し、食堂利用有無を予測する。さらに、この予測の精度を向上させるために必要に応じて、食事数予測装置は、食堂利用率の分布に基づいて残差モデルを作成し、予測を補正してもよい。一方で、個人行動のデータが不足している場合、食事数予測装置は、個人行動をグループ化し、そのグループの予測モデルを作成して食堂利用有無の予測を行う。本実施形態の食事数予測装置は、このように、複数のモデルを組み合わせて予測を行う。以下では、第1の実施形態との差分を中心に説明する。
第1の実施形態の食事数予測装置は、個人行動データを用いずに、変数選択を行いながら機械学習(RF)により予測モデルを作成し、食事数を予測した。第2の実施形態の食事数予測装置は、個人行動データを用いて変数選択を行いながら、機械学習により予測モデルを作成し、食事数を予測する。個人により食堂利用頻度や回数が異なるため、個人行動データには、偏りがある。そこで、食事数予測装置は、個人別に食堂利用率やデータ量に応じた予測モデルを作成し、食堂利用有無を予測する。さらに、この予測の精度を向上させるために必要に応じて、食事数予測装置は、食堂利用率の分布に基づいて残差モデルを作成し、予測を補正してもよい。一方で、個人行動のデータが不足している場合、食事数予測装置は、個人行動をグループ化し、そのグループの予測モデルを作成して食堂利用有無の予測を行う。本実施形態の食事数予測装置は、このように、複数のモデルを組み合わせて予測を行う。以下では、第1の実施形態との差分を中心に説明する。
図8は、第2の実施形態による食事数予測装置2の構成を示すブロック図である。食事数予測装置2は、分類予測モデル作成部21と、食事数算出部22と、補正部23とを備える。
分類予測モデル作成部21は、分類部211と、個人分類モデル作成部212と、全体分類モデル作成部213と、全体回帰モデル作成部214とを備える。
分類部211は、学習期間のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報をデータベース6から取得する。分類部211は、POSデータに含まる個人IDより特定された各従業員の食堂利用日数及び食堂利用率に基づいて、個人分類モデル、利用率モデル、全体分類モデルのうちいずれを適用するか判断する。分類部211は、POSデータに個人IDが含まれないためにより個人が特定されなかった利用者全体については、全体回帰モデルを適用すると判断する。
分類部211は、学習期間のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報をデータベース6から取得する。分類部211は、POSデータに含まる個人IDより特定された各従業員の食堂利用日数及び食堂利用率に基づいて、個人分類モデル、利用率モデル、全体分類モデルのうちいずれを適用するか判断する。分類部211は、POSデータに個人IDが含まれないためにより個人が特定されなかった利用者全体については、全体回帰モデルを適用すると判断する。
図9は、各予測モデルの適用条件を示す図である。従業員証を利用して食堂で支払いを行った場合、POSデータに個人IDが設定され、その個人IDの従業員が食堂を利用した履歴が得られる。そして、学習期間における各日のPOSデータから、その個人が食堂を利用した日数Ndaysが得られる。また、学習期間におけるゲートデータから、個人の在館日数が得られる。各個人の学習期間における食堂利用日数Ndaysを在館日数により除算することで、食堂利用率αが得られる。
分類部211は、食堂利用日数Ndaysが第1の閾値T1日以上かつ、食堂利用率αが第2の閾値T2(T2≧0)以上第3の閾値T3(T2≦T3≦1)以下の従業員については、個人分類モデルを適用すると判断する。個人分類モデルは、個人ごとに作成され、その個人の食堂利用有無を結果として出力する。以下では、学習期間が90日、T1=10、T2=0.2、T3=0.8である場合を例に説明するが、学習期間、T1、T2、T3は任意の値を用いることができる。例えば、予め学習期間、T1、T2、T3を食事数予測装置2に設定してもよい。あるいは、分類予測モデル作成部21は、学習期間、T1、T2、T3の値を変化させながら予測モデルを学習し、最も予測結果と実績値との誤差が少ない値の組み合わせを採用してもよい。
分類部211は、食堂利用日数Ndaysが10日以上かつ、食堂利用率αが0.2未満又は0.8を超える従業員については、個人利用率モデルを適用すると判断する。個人利用率モデルは、食堂利用率αに基づいて個人ごとの食堂利用有無を結果として出力する。個人利用率モデルは、αが0.2未満であれば食堂利用無、αが0.8を超えれば食堂利用有と判断する予測モデルである。
分類部211は、食堂利用日数Ndaysが10日未満の従業員の場合、データが少ないため、全体分類モデルを適用すると判断する。全体分類モデルは、食堂利用日数Ndaysが10日未満の全従業員のデータを用いて作成される。全体分類モデルは、個人の食堂利用有無を結果として出力する。
従業員が従業員証を利用せずに食堂で支払いを行った場合、個人IDの行動データを取得することはできない。そこで、分類部211は、個人IDが得られない従業員全体については、第1の実施形態と同様の全体回帰モデルを適用すると判断する。全体回帰モデルは、日にちごとの食堂利用率を結果として出力する。
図8の構成の説明に戻る。個人分類モデル作成部212は、学習データを用いて個人ごとに個人分類モデルを作成する。全体分類モデル作成部213は、学習データを用いて全体分類モデルを作成する。全体回帰モデル作成部214は、学習データを用いて全体回帰モデルを作成する。なお、個人分類モデル作成部212、全体分類モデル作成部213及び全体回帰モデル作成部214は、第1の実施形態の予測モデル作成部11と同様の構成である。ただし、第1の実施形態の予測モデル作成部11が作成する全体回帰モデルとは、説明変数、又は、説明変数及び目的変数が異なる。
食事数算出部22は、個人分類モデル適用部221と、個人利用率モデル適用部222と、全体分類モデル適用部223と、利用率算出部224と、従業員証不使用食事数算出部225と、加算部226とを備える。
個人分類モデル適用部221は、個人分類モデル作成部212が作成した個人ごとの個人分類モデルを用いて、その個人の食堂利用有無の予測を得る。個人利用率モデル適用部222は、個人利用率モデルを用いて個人ごとの食堂利用の有無の予測を得る。全体分類モデル適用部223は、全体分類モデル作成部213が作成した全体分類モデルを用いて、個人ごとの食堂利用有無の予測を得る。個人分類モデル適用部221、個人利用率モデル適用部222、及び、全体分類モデル適用部223はそれぞれ、食堂を利用すると予測した個人の数を予測の食事数として算出する。
利用率算出部224は、第1の実施形態の利用率算出部12と同様の処理により、全体回帰モデル作成部214が作成した全体回帰モデルを用いて予測の食堂利用率を算出する。従業員証不使用食事数算出部225は、第1の実施形態の食事数算出部13と同様に、利用率算出部224が算出した予測の食堂利用率に予測対象日における在館者数を乗算し、食事数の予測値を算出する。加算部226は、個人分類モデル適用部221、個人利用率モデル適用部222、及び、全体分類モデル適用部223のそれぞれが算出した予測の食事数と、従業員証不使用食事数算出部225が算出した予測の食事数とを加算する。
補正部23は、加算部226が算出した予測の食事数を補正する。例えば、補正部23は、テスト期間内の説明変数の値を用いて個人分類モデルにより算出した予測の食事数と、食事数の実績値との乖離を算出し、算出結果に基づいて補正値を得る。補正部23は、得られた補正値によって、加算部226が出力した予測対象日の予測の食事数を補正して、最終的な予測の食事数を算出する。
図10〜図12は、食事数予測装置2の処理を示すフロー図である。図10において、分類部211は、全体の食事数Nall、従業員証利用者の食事数Nwid及び従業員証不使用者の食事数Nwoidを0に初期化する(ステップS31)。
分類部211は、学習期間内のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報をデータベース6から取得する。分類部211は、POSデータから食堂を利用した従業員の個人IDを抽出する(ステップS32)。分類部211は、抽出した個人IDを1つずつ選択し、選択した個人IDについて以下のステップS33〜ステップS37を行う。選択した個人IDを選択個人IDと記載する。
分類部211は、選択個人IDが設定されているPOSデータを参照し、学習期間内の食堂利用日数Ndaysを取得する。分類部211は、食堂利用日数Ndaysが10日未満であると判断した場合(ステップS33:NO)、選択個人IDに適用する予測モデルを全体分類モデルと判断する(ステップS34)。
分類部211は、食堂利用日数Ndaysが10日以上であると判断した場合(ステップS33:YES)、食堂利用日数Ndaysを学習期間における選択個人IDの在館日数により除算して食堂利用率αを算出する。分類部211は、食堂利用率αが0.2以上かつ0.8以下であると判断した場合(ステップS35:YES)、選択個人IDに適用する予測モデルを個人分類モデルと判断する(ステップS36)。一方、分類部211は、食堂利用率αが0.2未満又は0.8を超えると判断した場合(ステップS35:NO)、選択個人IDに適用する予測モデルを個人利用率モデルと判断する(ステップS37)。
個人分類モデル作成部212は、個人分類モデルを適用する個人IDを1つずつ選択し、個人分類モデル作成部212は、選択された個人IDについて以下のステップS38〜ステップS41の処理を行う。個人分類モデル作成部212は、選択個人IDの食堂利用日数Ndays分の学習データを用いて、第1の実施形態の図7と同様の処理により個人分類モデルを作成する(ステップS38)。ただし、個人分類モデル作成部212は、学習期間内のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報から、図3〜図5において、個人分類モデルに〇又は◇が記載されている説明変数の値及び目的変数の値を学習データとして取得する。
個人分類モデル適用部221は、予測対象日の11時55分時点の各説明変数の値をデータベース6から取得する。個人分類モデル適用部221は、ステップS38において作成された個人分類モデルにより、取得した説明変数の値を用いて食堂利用有無の予測を計算する(ステップS39)。個人分類モデル適用部221は、利用有と予測した場合(ステップS40:YES)、現在のNwidの値に1を加算する(ステップS41)。個人分類モデル適用部221が利用無と予測した場合(ステップS40:NO)、又は、ステップS41の処理の後、個人分類モデル作成部212は、次の個人IDを選択してステップS38からの処理を繰り返す。
図11において、個人利用率モデル適用部222は、個人利用率モデルを適用する個人IDを1つずつ選択し、以下のステップS51〜ステップS52の処理を行う。個人利用率モデル適用部222は、選択個人IDの食堂利用率αが0.8を超えると判定した場合(ステップS51:YES)、選択個人IDの従業員は食堂を利用すると判断し、現在の食事数Nwidに1を加算する(ステップS52)。個人利用率モデル適用部222は、選択個人IDの食堂利用率αが0.8以下であると判断した場合(ステップS51:NO)、又は、ステップS52の処理の後、次の個人IDを選択してステップS51からの処理を繰り返す。
全体分類モデル作成部213は、ステップS32において抽出された個人ID全てについての学習データを用いて、第1の実施形態の図7と同様の処理により全体分類モデルを作成する(ステップS53)。ただし、全体分類モデル作成部213は、学習期間内のゲートデータ、POSデータ、天気情報、特異日情報、食堂利用率情報及び日付情報から、図3〜図5において、全体分類モデルに〇又は◇が記載されている説明変数の値及び目的変数の値を学習データとして取得する。また、全体分類モデル作成部213は、図4の符号G1に含まれる説明変数rday07.1155、rday14.1155、rday21.1155及びrday28.1155の組、符号G2に含まれる説明変数rday07.1155.wid、rday14.1155.wid、rday14.1155.wid及びrday28.1155.widの組、符号G3に含まれる説明変数rday07.1155.woid、rday14.1155.woid、rday21.1155.woid及びrday28.1155.woidの組のいずれかを使用する。
全体分類モデル適用部223は、全体分類モデルを適用する個人IDを1つずつ選択し、以下の処理を行う。全体分類モデル適用部223は、予測対象日の11時55分時点の各説明変数の値をデータベース6又は情報提供装置から取得する。全体分類モデル適用部223は、ステップS53において作成された全体分類モデルにより、取得した説明変数の値を用いて食堂利用有無の予測を計算する(ステップS54)。全体分類モデル適用部223は、利用有と予測した場合(ステップS55:YES)、現在のNwidの値に1を加算する(ステップS56)。全体分類モデル適用部223が利用無と予測した場合(ステップS55:NO)、又は、ステップS56の処理の後、全体分類モデル適用部223は、次の個人IDを選択してステップS54からの処理を繰り返す。
図12において、全体回帰モデル作成部214は、第1の実施形態の図7の処理と同様に全体回帰モデルを作成する(ステップS61)。ただし、全体回帰モデル作成部214は、図4の符号G4に含まれる説明変数rday07.1155、rday14.1155、rday21.1155及びrday28.1155の組、符号G5に含まれる説明変数rday07.1155.woid、rday14.1155.woid、rday21.1155.woid及びrday28.1155.woidのいずれかを使用する。符号G5を用いる場合、目的変数はrday07.1155.woidとなる。
利用率算出部224は、予測対象日の11時55分時点の各説明変数の値をデータベース6から取得する。利用率算出部224は、ステップS61において作成された全体分類モデルにより、取得した説明変数の値を用いて食堂利用率の予測値を計算する(ステップS62)。従業員証不使用食事数算出部225は、予測対象の日の11時55分時点の在館者数の実績値をデータベース6から取得する。従業員証不使用食事数算出部225は、ステップS62において算出された食堂利用率の予測値と、取得した在館者数の実績値とを乗算し、従業員証不使用者の食事数Nwoidを算出する(ステップS63)。
加算部226は、従業員証利用者の食事数Nwidと従業員証不使用者の食事数Nwoidを加算し、全体の食事数Nallを算出する(ステップS64)。補正部23は、全体の食事数Nallに補正を行って、出力する(ステップS65)。
図13は、食事数の予測対象となる食堂の利用状況のサンプルを示す図である。同図では、食堂利用率と、その食堂利用率の従業員が実際に食堂を利用した人数との関係を示している。同図に示す場合においては、食堂利用率が高い従業員の利用者が多く、食堂利用率に偏りが生じている。個人分類モデル及び全体分類モデルでは各個人の食堂利用の有無を予測するが、食堂利用率がある程度高い従業員については食堂利用有の予測結果が得られる可能性がある。そのため、食堂利用率が高い従業員の割合が多いと、食事数の予測が高く算出される傾向がある。
図14は、予測結果の残差を示す図である。同図では、第1の実施形態の食事数予測装置1(ベースモデル)により予測を行った結果及び第2の実施形態の食事数予測装置2(個人行動モデル)により予測を行った結果の残差を示す図である。同図に示すように、ベースモデルにより予測を行った結果は、0付近で残差がばらついている。一方で、個人行動モデルにより予測を行った結果は、残差が正の方向に傾いている。そこで、補正部23は、学習期間又は過去の所定期間の各日について予測を行ったときに加算部226から出力された予測の食事数と、実際の食事数との残差を算出する。補正部23は、個人行動モデルの残差の平均を補正項として使用し、加算部226から出力された予測の食事数から減算する。あるいは、補正部23は、残差を天気情報や日付情報などの説明変数でモデル化し、補正項として使用する。
なお、補正部23による補正を行わず、加算部226から出力をそのまま予測の食事数としてもよい。
なお、補正部23による補正を行わず、加算部226から出力をそのまま予測の食事数としてもよい。
上記では、全体分類モデル作成部213は、個人行動データが少ない従業員についてまとめて全体分類モデルを作成していた。しかし、オフィスビルでは、フロアごとに利用している企業が異なる場合や、部署が異なる場合がある。企業や部署によっては、外出が多いなど、行動に違いがみられることがある。そこで、全体分類モデル作成部213は、フロア、企業又は部署の分類ごとに、その分類に属する個人IDについての学習データを用いて全体分類モデルを作成してもよい。例えば、個人IDに対応したフロア、企業又は部署を示す従業員情報をデータベース6に記憶しておき、分類部211は、この従業員情報を読み出して各従業員を分類する。また、分類部211は、ゲートデータを参照して各従業員が最も長く滞在しているフロア又は部屋を特定し、特定されたフロア又は部屋に基づいて企業又は部署を特定してもよい。全体分類モデル作成部213は、分類部211による分類ごとに全体分類モデルを作成する。全体分類モデル適用部223は、選択個人IDの従業員が所属するフロア、企業又は部署について作成された全体分類モデルを用いて、食堂の利用の有無を予測する。
また、全体分類モデル作成部213は、食堂利用率の範囲で示される分類ごとに、その分類に属する個人IDについての学習データを用いて全体分類モデルを作成してもよい。全体分類モデル適用部223は、選択個人IDの従業員の食堂利用率αが含まれる分類の全体分類モデルを用いて、食堂の利用の有無を予測する。
またあるいは、分類予測モデル作成部21は、POSデータから個人IDが得られた従業員全体を対象として、フロア、企業、部署又は食堂利用率の分類ごとに全体分類モデルを作成してもよい。食事数算出部22は、POSデータから個人IDが得られた従業員が所属する分類の全体分類モデルを用いて、食堂の利用の有無を予測する。なお、分類予測モデル作成部21は、学習期間における食堂利用数、学習期間における食堂利用率、ビル50において従業員が普段在館しているフロアや部屋などの場所、従業員の所属先の部署や企業を任意に組み合わせて分類してもよい。
また、分類部211は、従業員の食堂利用日数Ndaysが10日未満である場合、その従業員については、食堂利用日数Ndaysが10日以上となるまで学習期間を長くし、個人分類モデル又は個人利用率モデルを適用してもよい。
本実施形態によれば、食事数予測装置2は、データベース6に記憶されている利用者情報に基づいて、利用者を分類する分類部211を備える。データベース6に記憶される履歴データを利用者情報として用いてもよい。分類部211は、利用者のサービスの利用日数、利用者のサービスの利用率、施設において利用者が在館している場所、利用者の所属のうち一以上を用いて利用者を分類する。分類予測モデル作成部21の個人分類モデル作成部212、全体分類モデル作成部213、全体回帰モデル作成部214はそれぞれ、複数モデル作成部及び選択部を有している。これにより、分類予測モデル作成部21は、分類ごとに、複数の予測モデルを作成し、予測の誤差に基づいて使用する予測モデルを選択する。分類ごとの予測モデルの目的変数は、食堂利用率又は食堂利用有無である。食事数算出部22は、利用数算出部の一例であり、分類ごとに予測モデルを用いて算出した予測の食事数を合計する。なお、食事数算出部22は、一部の分類には個人利用率モデルのように予め用意された予測モデルを用いて予測の食事数を算出してもよい。補正部23は、選択された予測モデルに過去の説明変数の値を用いて得られた目的変数の予測値と、目的変数の実績値との乖離を表す残差に基づいて、食事数算出部22が算出した予測の食事数を補正する。
上述した実施形態において、食事数予測装置2は、RFによって予測モデルを作成し、食堂の利用有無を推定しているが他の機械学習を用いてもよい。また、食事数予測装置2は、ベイズ推定によって食堂利用有無を推定してもよい。すなわち、食事数予測装置2は、個人分類モデル、個人利用率モデル、全体分類モデルにベイズ推定を用いる。なお、これらのモデル全てにベイズ推定を用いてもよく、これらのモデルのうち一部にベイズ推定を用いてもよい。ベイズ推定では、ベータ関数B(α,β)を用いて事前分布及び事後分布を定義し、食事数を予測する。
図15は、ベイズ推定による食事数の予測を説明する図である。ここでは、簡単のため。個人IDが得られた従業員がAさん、Bさん、Cさんの3人である場合を例に示している。ゲートデータからは各従業員の所定期間の在館日数が得られ、POSデータからはその所定期間において各従業員が食堂を利用した回数及び食堂を利用しなかった回数が得られる。
ベイズ推定では、以下の式(1)が成り立つ。
p(x|y)は、事象yが発生した下で事象xが発生する事後分布(事後確率)であり、p(x)はpが発生する事前分布(事前確率)であり、p(y|x)は事象xの尤度である。式(1)に示すように、p(x|y)は、p(x)p(y|x)に比例する。事象yは在館していることを、事象xは食堂の利用に相当する。p(y|x)は、食堂を使用する尤度である。尤度はベータ分布となる。
ベータ分布(α,β)は、確率密度がxα−1(1−x)β−1に比例する確率分布である。ベータ分布(α,β)は、以下の式(2)により表される。
ベータ分布の密度関数f(x)(積分すると1)は式(3)で示され、ベータ分布の平均μは式(4)で示される。
ベータ関数B(α,β)により事後分布を定義したベイズ推定を用いると、図15に示すように、各従業員の食堂食事数の事後分布が算出される。一様分布の事前分布、シェフリーズの事前分布、ホールデンの事前分布によってα、βの値が異なるため、いずれの事前分布を仮定するかによって事後分布は異なる。各従業員の事後分布を合計することで、3人の従業員についての食堂食事数の予測値が算出される。ベイズ推定を行った場合、補正部23による補正を行わなくてもよいが、補正部23による補正を行ってもよい。
なお、上記実施形態においては、個人IDを従業員証から取得したが、他のカードから取得してもよい。例えば、施設が一般の飲食店である場合、食堂で利用可能なポイントカードなどから個人IDを取得してもよい。また、支払い時に用いた従業員証以外のカードから読み出した情報に基づいて個人IDを特定してもよい。
上述した実施形態では、サービスが食堂における食事の提供である場合を例に説明したが、サービスは任意の物品の販売でもよく、物品の販売を伴わないサービスでもよい。
上述した実施形態では、サービスが食堂における食事の提供である場合を例に説明したが、サービスは任意の物品の販売でもよく、物品の販売を伴わないサービスでもよい。
以上説明した少なくともひとつの実施形態によれば、予測モデル作成部を持つことにより、食堂が提供する食事数を予測することができる。食堂における食事数を予測することにより、廃棄食材の低減や調理作業負荷の低減につながる可能性がある。
上述した食事数予測装置1、2の機能をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1…食事数予測装置、2…食事数予測装置、11…予測モデル作成部、12…利用率算出部、13…食事数算出部、21‥分類予測モデル作成部、22…食事数算出部、24…補正部、111…取得部、112…複数モデル作成部、113…選択部、211…分類部、212…個人分類モデル作成部、213…全体分類モデル作成部、214…全体回帰モデル作成部、221…個人分類モデル適用部、222…個人利用率モデル適用部、223…全体分類モデル適用部、224…利用率算出部、225…従業員証不使用食事数算出部、226…加算部
Claims (11)
- 過去の所定期間における施設の在館者数の情報と、前記施設の在館者のうち所定のサービスを利用した割合である利用率の情報と、前記サービスに対する利用者の支払いの情報と、天気の情報と、日付の情報と、在館者数が減少する特異日の情報とのうちひとつ以上の情報を日ごとに示す履歴データから目的変数である利用率又はサービス利用有無の値と前記目的変数の算出に用いる複数種類の説明変数の値とを学習データとして取得する取得部と、
前記学習データを使用して、前記説明変数の値を入力に用いて前記目的変数の値を予測する予測モデルを作成し、作成された前記予測モデルにおいて前記目的変数の予測に対する重要度が閾値よりも低い前記説明変数を前記学習データから削除する処理を行い、削除後の前記学習データを使用して当該処理を繰り返す複数モデル作成部と、
前記複数モデル作成部が作成した前記予測モデルの中から当該予測モデルを用いた予測の誤差に基づいて、予測に使用する前記予測モデルを選択する選択部と、
前記選択部が選択した前記予測モデルに予測対象日における前記説明変数の値を入力して得られた前記目的変数の予測値に基づいて前記サービスの予測の利用数を算出する利用数算出部と、
を備える利用数予測装置。 - 前記利用数算出部は、前記目的変数が利用率である場合、前記目的変数の予測値と、前記予測対象日における前記施設の在館者数との乗算結果に基づいて前記サービスの予測の利用数を算出する、
請求項1に記載の利用数予測装置。 - 前記選択部は、前記誤差が閾値よりも低い前記予測モデルの中から使用されている前記説明変数の数が少ない予測モデルを選択する、
請求項1又は請求項2に記載の利用数予測装置。 - 前記履歴データは、前記利用者に関する情報を示す利用者情報をさらに含み、
前記利用数予測装置は、前記利用者情報に基づいて前記利用者を分類する分類部をさらに備え、
前記複数モデル作成部は、前記分類ごとに前記予測モデルを作成し、
前記選択部は、前記分類ごとに、前記複数モデル作成部が作成した前記予測モデルの中から予測に使用する前記予測モデルを選択し、
前記利用数算出部は、前記分類ごとに算出した前記サービスの予測の利用数を合計する、
請求項1から請求項3のいずれか一項に記載の利用数予測装置。 - 前記利用数算出部は、一部の前記分類には予め用意された予測モデルを用いて前記サービスの予測の利用数を算出する、
請求項4に記載の利用数予測装置。 - 前記分類部は、前記利用者の前記サービスの利用日数、前記利用者の前記サービスの利用率、前記施設において前記利用者が在館している場所、前記利用者の所属のうち一以上を用いて前記利用者を分類する、
請求項4又は請求項5に記載の利用数予測装置。 - 前記分類部は、前記履歴データから前記利用者の一部が特定される場合、特定された前記利用者を、前記サービスの利用日数が第1の閾値よりも多く、かつ、前記利用率が第2の閾値以上かつ第3の閾値の以下のときは個人分類モデル適用利用者に、前記サービスの利用日数が前記第1の閾値よりも多く、かつ、前記利用率が前記第2の閾値未満又は前記第3の閾値を超えるときには個人利用率モデル適用利用者に、前記サービスの利用日数が第1の閾値以下のときには全体分類モデル適用利用者に分類し、
前記複数モデル作成部は、前記個人分類モデル適用利用者については、前記取得部が前記個人分類モデル適用利用者個別に取得した前記学習データを用いて前記説明変数の値から前記目的変数であるサービス利用有無の値を予測する前記予測モデルである個人分類モデルを作成し、前記全体分類モデル適用利用者については、前記取得部が特定された前記利用者全体について取得した前記学習データを用いて前記説明変数の値から前記目的変数であるサービス利用有無の値を予測する前記予測モデルである全体分類モデルを作成し、個人が特定されなかった利用者全体について前記取得部が取得した前記学習データを用いて前記説明変数の値から前記目的変数であるサービス利用率の値を予測する前記予測モデルである全体回帰モデルを作成し、
前記利用数算出部は、前記個人分類モデル適用利用者については当該個人分類モデル適用利用者の前記個人分類モデルを用いてサービス利用有無の予測を取得し、前記個人利用率モデル適用利用者については当該個人利用率モデル適用利用者の前記利用率と前記第3の閾値との比較に基づいてサービス利用有無を予測する個人利用率モデルを利用してサービス利用有無の予測を取得し、前記全体分類モデル適用利用者については前記全体分類モデルを用いてサービス利用有無の予測を取得し、個人が特定されなかった利用者全体については前記全体回帰モデルを用いて前記利用率の予測値を算出し、サービス利用有と予測された前記利用者の数に、前記利用率の予測値と前記予測対象日における前記施設の在館者数との乗算結果を加算する、
請求項4に記載の利用数予測装置。 - 前記第1の閾値、前記第2の閾値及び前記第3の閾値は、任意に設定可能である、
請求項7に記載の利用数予測装置。 - 前記選択部により選択された前記予測モデルに過去の前記説明変数の値を用いて得られた前記目的変数の予測値の残差に基づいて、前記利用数算出部が算出した前記サービスの予測の利用数を補正する補正部をさらに備える、
請求項1に記載の利用数予測装置。 - 過去の所定期間における施設の在館者数の情報と、前記施設の在館者のうち所定のサービスを利用した割合である利用率の情報と、前記サービスに対する利用者の支払いの情報と、天気の情報と、日付の情報と、在館者数が減少する特異日の情報とのうちひとつ以上の情報を日ごとに示す履歴データから目的変数である利用率又はサービス利用有無の値と前記目的変数の算出に用いる複数種類の説明変数の値とを学習データとして取得する取得ステップと、
前記学習データを使用して、前記説明変数の値を入力に用いて前記目的変数の値を予測する予測モデルを作成し、作成された前記予測モデルにおいて前記目的変数の予測に対する重要度が閾値よりも低い前記説明変数を前記学習データから削除する処理を行い、削除後の前記学習データを使用して当該処理を繰り返す複数モデル作成ステップと、
前記複数モデル作成ステップにおいて作成された前記予測モデルの中から当該予測モデルを用いた予測の誤差に基づいて、予測に使用する前記予測モデルを選択する選択ステップと、
前記選択ステップにおいて選択された前記予測モデルに予測対象日における前記説明変数の値を入力して得られた前記目的変数の予測値に基づいて前記サービスの予測の利用数を算出する利用数算出ステップと、
を有する利用数予測方法。 - コンピュータに、
過去の所定期間における施設の在館者数の情報と、前記施設の在館者のうち所定のサービスを利用した割合である利用率の情報と、前記サービスに対する利用者の支払いの情報と、天気の情報と、日付の情報と、在館者数が減少する特異日の情報とのうちひとつ以上の情報を日ごとに示す履歴データから目的変数である利用率又はサービス利用有無の値と前記目的変数の算出に用いる複数種類の説明変数の値とを学習データとして取得する取得ステップと、
前記学習データを使用して、前記説明変数の値を入力に用いて前記目的変数の値を予測する予測モデルを作成し、作成された前記予測モデルにおいて前記目的変数の予測に対する重要度が閾値よりも低い前記説明変数を前記学習データから削除する処理を行い、削除後の前記学習データを使用して当該処理を繰り返す複数モデル作成ステップと、
前記複数モデル作成ステップにおいて作成された前記予測モデルの中から当該予測モデルを用いた予測の誤差に基づいて、予測に使用する前記予測モデルを選択する選択ステップと、
前記選択ステップにおいて選択された前記予測モデルに予測対象日における前記説明変数の値を入力して得られた前記目的変数の予測値に基づいて前記サービスの予測の利用数を算出する利用数算出ステップと、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018093296A JP2019200487A (ja) | 2018-05-14 | 2018-05-14 | 利用数予測装置、利用数予測方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018093296A JP2019200487A (ja) | 2018-05-14 | 2018-05-14 | 利用数予測装置、利用数予測方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019200487A true JP2019200487A (ja) | 2019-11-21 |
Family
ID=68612085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018093296A Pending JP2019200487A (ja) | 2018-05-14 | 2018-05-14 | 利用数予測装置、利用数予測方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019200487A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021179668A (ja) * | 2020-05-11 | 2021-11-18 | Tdk株式会社 | データ解析システム、データ解析方法及びデータ解析プログラム |
JP2022151738A (ja) * | 2021-03-23 | 2022-10-07 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
JP7396736B1 (ja) | 2022-11-30 | 2023-12-12 | Necプラットフォームズ株式会社 | 食堂管理システム、食堂管理方法、及びプログラム |
JP7401610B1 (ja) | 2022-07-21 | 2023-12-19 | ソフトバンク株式会社 | 情報処理装置、情報処理装置の制御方法、及び情報処理装置の制御プログラム |
JP7477930B1 (ja) | 2023-12-27 | 2024-05-02 | 株式会社HataLuck and Person | 情報処理方法、情報処理システム及びプログラム |
WO2024116417A1 (ja) * | 2022-12-02 | 2024-06-06 | 日本電信電話株式会社 | 客数予測装置、学習装置、客数予測方法、学習方法、及びプログラム |
JP7545314B2 (ja) | 2020-12-18 | 2024-09-04 | トヨタ自動車株式会社 | 食事提供システム |
-
2018
- 2018-05-14 JP JP2018093296A patent/JP2019200487A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021179668A (ja) * | 2020-05-11 | 2021-11-18 | Tdk株式会社 | データ解析システム、データ解析方法及びデータ解析プログラム |
JP7456273B2 (ja) | 2020-05-11 | 2024-03-27 | Tdk株式会社 | データ解析システム、データ解析方法及びデータ解析プログラム |
JP7545314B2 (ja) | 2020-12-18 | 2024-09-04 | トヨタ自動車株式会社 | 食事提供システム |
JP2022151738A (ja) * | 2021-03-23 | 2022-10-07 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
JP7416111B2 (ja) | 2021-03-23 | 2024-01-17 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
JP7401610B1 (ja) | 2022-07-21 | 2023-12-19 | ソフトバンク株式会社 | 情報処理装置、情報処理装置の制御方法、及び情報処理装置の制御プログラム |
JP2024013922A (ja) * | 2022-07-21 | 2024-02-01 | ソフトバンク株式会社 | 情報処理装置、情報処理装置の制御方法、及び情報処理装置の制御プログラム |
JP7396736B1 (ja) | 2022-11-30 | 2023-12-12 | Necプラットフォームズ株式会社 | 食堂管理システム、食堂管理方法、及びプログラム |
JP2024078841A (ja) * | 2022-11-30 | 2024-06-11 | Necプラットフォームズ株式会社 | 食堂管理システム、食堂管理方法、及びプログラム |
WO2024116417A1 (ja) * | 2022-12-02 | 2024-06-06 | 日本電信電話株式会社 | 客数予測装置、学習装置、客数予測方法、学習方法、及びプログラム |
JP7477930B1 (ja) | 2023-12-27 | 2024-05-02 | 株式会社HataLuck and Person | 情報処理方法、情報処理システム及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019200487A (ja) | 利用数予測装置、利用数予測方法及びプログラム | |
US20210334844A1 (en) | Method and system for generation of at least one output analytic for a promotion | |
Barth et al. | Identifying earnings assimilation of immigrants under changing macroeconomic conditions | |
US20190361890A1 (en) | Systems and methods for forecasting record object completions | |
Lasek et al. | Restaurant sales and customer demand forecasting: Literature survey and categorization of methods | |
US20150310336A1 (en) | Predicting customer churn in a telecommunications network environment | |
US11107109B2 (en) | Method and system for personalizing offers | |
Hathaway et al. | Personalized priority policies in call centers using past customer interaction information | |
McFowland III et al. | A prescriptive analytics framework for optimal policy deployment using heterogeneous treatment effects. | |
Faezirad et al. | Preventing food waste in subsidy-based university dining systems: An artificial neural network-aided model under uncertainty | |
KR20170106242A (ko) | 구내식당 방문자수 예측 시스템 | |
Cui et al. | Targeting high value customers while under resource constraint: partial order constrained optimization with genetic algorithm | |
Gomes et al. | Mechanism for measuring system complexity applying sensitivity analysis | |
Melian et al. | Customer churn prediction in telecommunication industry. A data analysis techniques approach | |
Raats et al. | Double-checking auditors: a Bayesian approach | |
Sapunkov et al. | Software for automation of user requirements prioritization | |
Siddiquee et al. | A fuzzy based recommendation system with collaborative filtering | |
JP2020149363A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Alaghebandha et al. | A soft computing-based approach to optimise queuing-inventory control problem | |
Guo et al. | Prediction and analysis of success on crowdfunding projects | |
JP6067882B2 (ja) | 情報処理システムおよび情報処理方法 | |
CN111008871A (zh) | 一种房地产复购客户跟进数量计算方法、装置及存储介质 | |
CN112330411B (zh) | 团体产品推荐方法、装置、计算机设备及存储介质 | |
JP7145461B2 (ja) | 営業支援システム、営業支援方法及びプログラム | |
Smith et al. | SimHealth: Estimating Small Area Populations Using Deterministic Spatial Microsimulation in Leeds and Bradford. |