添付図面を参照して、本発明の好適な実施形態について説明する。(なお、各図において、同一の符号を付したものは、同一、又は同様の構成を有する。)
(1)全体構成
図1は、本実施形態に係る情報処理システム1の構成の一例を示す概略図である。図1に示すとおり、情報処理システム1は、例えば、インターネット等の所定の通信ネットワークNを介して互いに通信可能に接続されたサーバ装置10及びユーザ端末20を有する。サーバ装置10は、ユーザ端末20からの要求に応じて、既存店舗に関する変数を含む学習データを用いた機械学習等によって売上予測モデルを生成し、当該売上予測モデルを用いて売上予測の対象となる店舗(対象店舗)の売上予測値等をユーザ端末20に対して提供する。
(2)各部の構成
(2-1)ハードウェア構成
サーバ装置10及びユーザ端末20それぞれのハードウェア構成について説明する。サーバ装置10及びユーザ端末20はそれぞれ、1台又は複数台のコンピュータ500によって構成することができる。図2は、本実施形態に係るコンピュータ500のハードウェア構成の一例を示す概略図である。図2に示すように、コンピュータ500は、プロセッサ501、メモリ503、記憶装置505、入力I/F部507、データI/F部509、通信I/F部511、及び表示装置513を含む。
プロセッサ501は、メモリ503に記憶されているプログラムを実行することによりコンピュータ500におけるさまざまな処理を制御する。例えば、サーバ装置10が有するコード取得部111、統計値・地理情報取得部112、前処理部121、売上予測モデル生成部122、売上予測部123、ユーザ端末20が有する操作受付部21、送受信部22、出力部23等は、メモリ503に一時記憶された上で、おもにプロセッサ501上で動作するプログラムとして実現可能である。
メモリ503は、例えばRAM(RandomAccessMemory)等の記憶媒体である。メモリ503は、プロセッサ501によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
記憶装置505は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置505は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。このようなプログラムやデータは、必要に応じてメモリ503にロードされることにより、プロセッサ501から参照される。
入力I/F部507は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部507の具体例としては、キーボードやマウス、タッチパネル、各種センサ、ウェアラブル・デバイス等が挙げられる。入力I/F部507は、例えばUSB(UniversalSerialBus)等のインタフェースを介してコンピュータ500に接続されてもよい。
データI/F部509は、コンピュータ500の外部からデータを入力するためのデバイスである。データI/F部509の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部509は、コンピュータ500の外部に設けられることも考えられる。その場合、データI/F部509は、例えばUSB等のインタフェースを介してコンピュータ500へと接続される。
通信I/F部511は、コンピュータ500の外部の装置と有線又は無線により、インターネットNを介したデータ通信を行うためのデバイスである。通信I/F部511は、コンピュータ500の外部に設けられることも考えられる。その場合、通信I/F部511は、例えば有線又は無線のLAN( LocalAreaNetwork)を介してコンピュータ500に接続される。
表示装置513は、各種情報を表示するためのデバイスである。表示装置513の具体例としては、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示装置513は、コンピュータ500の外部に設けられてもよい。その場合、表示装置513は、例えばディスプレイケーブル等を介してコンピュータ500に接続される。
(2-2)サーバ装置10の機能構成
図3は、本実施形態に係るサーバ装置10の機能構成を示すブロック図の一例である。サーバ装置10は、例えば、1台又は複数台のコンピュータ500によって構成され、サーバ装置10は、ユーザ端末20からの要求に応じて、既存店舗に関する変数を含む学習データを用いた機械学習等によって売上予測モデルを生成し、当該売上予測モデルを用いて対象店舗の売上予測値等をユーザ端末20に対して提供する。サーバ装置10は、例えば、地域メッシュ統計値・地理情報取得部11、及び店舗売上予測部12を有する。
(2-2-1)地域メッシュ統計値・地理情報取得部11
地域メッシュ統計値・地理情報取得部11は、ユーザ端末20からの店舗立地点(例えば、既存店舗又は対象店舗が立地する地点)の経度及び緯度の入力によって、店舗立地点を含む地域メッシュ(店舗立地点地域メッシュ)やその周辺の地域メッシュ(周辺地域メッシュ)を特定し、当該店舗立地点地域メッシュに対応付けられた各種の地域メッシュ統計値を取得する。ユーザによる店舗の経度及び緯度の入力によって取得された統計値は、店舗売上予測部12に提供され、ユーザ端末20に送信される。地域メッシュ統計値・地理情報取得部11は、例えば、コード取得部111と、統計値・地理情報取得部112と、統計値・地理情報DB群113と、を有する。
ここで、「地域メッシュ」とは、経度及び緯度に基づいて地域をほぼ同じ大きさの矩形(メッシュ)に分けたものである。「地域メッシュ」を識別するためのコードを「地域メッシュコード」という。例えば、「地域メッシュコード」は、1km地域メッシュでは8桁、500m地域メッシュでは9桁、250m地域メッシュは10桁、125m地域メッシュは11桁の整数をとる。
本実施形態に係る地域メッシュ統計値・地理情報取得部11では、地域メッシュコードとして、例えば、行政管理庁(現在の総務省)の「統計に用いる標準地域メッシュおよび標準地域メッシュコード」(後のJISC6304、JISX0410地域メッシュコード)が用いられてもよい。地域メッシュは、境界線が経度及び緯度で決められている。「基準地域メッシュ」(一辺の長さが約1kmであることから、「1km地域メッシュ」ともよばれる)を基本として、統合あるいは分割して、各種の標準地域メッシュが作成される。基準地域メッシュの緯度の間隔は30秒、経度の間隔は45秒である。基準地域メッシュを緯線方向と経線方向に2等分すると、「2分の1地域メッシュ」(「500m地域メッシュ」あるいは「第4次地域区画」ともよばれる)になる。500m地域メッシュの緯度の間隔は15秒、経度の間隔は22.5秒である。
本実施形態に係る地域メッシュ統計値・地理情報取得部11では、例えば、「500m地域メッシュ」及び「1km地域メッシュ」が使用される。なお、地域メッシュは、これらに限らず、「基準地域メッシュ」を縦横4等分した「4分の1地域メッシュ」(「250m地域メッシュ」)や、8等分した「8分の1地域メッシュ」(「125m地域メッシュ」)等であってもよい。
図4は、本実施形態に係るコード取得部111の地域コード取得方法の一例を示している。コード取得部111は、店舗立地点の経度及び緯度を示す情報に基づいて、店舗立地点を中心に、使用される地域メッシュと同じ大きさのメッシュMSを生成する。そして、別途生成した地域メッシュ中心点の経度及び緯度に基づき、その中に含まれる中心点の地域メッシュのコードを、店舗立地点地域メッシュコードとして取得する。また、コード取得部111は、同じような方法に基づいて、店舗立地点地域メッシュ周辺の地域メッシュ(周辺地域メッシュ)の地域メッシュコードを取得してもよい。例えば、コード取得部111は、店舗立地点を含む地域メッシュ(店舗立地点地域メッシュ)を囲む8つの地域メッシュ(周辺地域メッシュ)の地域メッシュコード(周辺地域メッシュコード)を取得してもよい。
統計値・地理情報取得部112は、例えば、コード取得部111によって取得された地域メッシュコード(店舗立地点地域メッシュコード及び周辺地域メッシュコード等)を受け取り、統計値・地理情報DB群113に含まれる各種のデータベースで一元管理している地域メッシュコードに対応付けられた各種の地域メッシュ統計値を取得する。本実施形態に係る店舗売上予測システムの第一の特徴は、分散している地域メッシュ統計値を一元管理し、店舗立地点の地域メッシュとその周辺の地域メッシュを同定して、店舗立地点に係る「地域メッシュ統計値の自動取得」を行う点である。従来は、店舗立地点が含まれる地域メッシュの統計値を取得するために、地理情報システム(GIS)を利用して、店舗レイヤと地域メッシュレイヤを重ね合わせた上で、目視や分析により地域メッシュコードを確認し、それに係る地域メッシュ統計値を取得する必要があった。このために、ユーザは、GISのソフトウェアと、地域メッシュ統計値を属性として付与した地域メッシュレイヤと店舗レイヤ等のレイヤを用意するとともに、GISのソフトウェアを取り扱う技術を学ぶ必要があった。本実施形態に係る地域メッシュ統計値・地理情報取得部11は、対象店舗や既存店舗の経度及び緯度を示す情報を入力するだけで、その立地点及び周辺の地域メッシュ統計値を「自動取得」できるため、店舗の用地選定に係るユーザにとっては、大幅な業務効率化をもたらす。また、本実施形態に係る地域メッシュ統計値・地理情報取得部11は、地点の経度及び緯度と地域メッシュコードとの関係を扱う「地図の分野」と、地域メッシュコードと地域メッシュ統計値を扱う「統計の分野」の二分野を、GISを利用せずに統合した点で、地域メッシュ統計の利便性を大きく向上させる。
統計値・地理情報DB群113は、地域メッシュコードに対応付けられた各種の統計値等と、経度及び緯度の位置情報を付与した地理事象の属性とを記憶するデータベースを少なくとも1つ含む。統計値や地理情報の種類は特に限定されず、任意の種類のものであってよい。統計値・地理情報DB群113に含まれるデータベースは、国や地方公共団体によって作成・公表されたものであってもよいし、あるいは、ユーザによって作成された任意のものであってもよい。本実施形態に係る統計値・地理情報DB群113は、例えば、商業統計DB113aと、国勢調査DB113bと、経済センサスDB113cと、大都市交通センサスDB113dと、道路交通センサスDB113eと、及び地理情報DB113fとを含む。
商業統計DB113aは、地域メッシュごとに、商業の事業所数、従業者数、年間販売額、及び売場面積等が対応付けられたデータベースである。事業所数は、地域メッシュに含まれる商業の事業所の数である。従業者数は、地域メッシュにおいて商業の事業に従事する従業者の数である。年間販売額は、地域メッシュにおいて行われる商業の事業の年間の販売額である。売場面積は、地域メッシュにおける商業の売場の面積である。
国勢調査DB113bは、例えば、地域メッシュごとに、常住人口数や性別及び年代ごとの人口(性別・年代別人口)が対応付けられたデータベースである。また、地域メッシュごとに推計された、5年後、10年後の推計将来人口のデータベースがあってもよい。
経済センサスDB113cは、例えば、地域メッシュごとに、各業種の従業者数が対応付けられたデータベースである。業種は特に限定するものではないが、例えば、従業者総数、卸売業・小売業従業者数(以下、小売従業者数)、宿泊業・飲食サービス業従業者数(以下、飲食従業者数)、事業所従業者数(従業者総数から前2業種の従業者数を引いた数値)等を含む。
大都市交通センサスDB113dは、例えば、鉄道事業者ごとの駅に関する乗降客数の統計値を記憶している。特に、大都市交通センサスDB113dは、駅ごとの定期券及び普通券利用者数、駅構外乗換駅の乗換人数等を記憶している。
道路交通センサスDB113eは、例えば、道路の種類別に道路ごとの観測地点の道路交通量に関する統計値を記憶している。特に、道路交通センサスDB113eは、国道・主要地方道・一般都道府県道の12時間小型車・大型車交通量や混雑度等のデータを記憶している。
地理情報DB113fは、例えば、既存店舗や対象店舗が立地する地域に対し、売上に影響すると考えられる地理事象に関し、経度及び緯度の位置情報を付与した属性である地理情報を含むデータベースである。地理情報DB113fが記憶している地理事象は、例えば、自社店舗、競合店舗、駅中心点、道路交差点、主要な商業施設、鉄道、河川、公園、用途地域、ハザードマップなどである。
(2-2-2)店舗売上予測部12
前出の図3で、店舗売上予測部12は、統計値・地理情報DB群113から取得された統計値・地理情報を事前に処理した後、既存店舗に関する変数を含む学習データを用いた機械学習等によって売上予測モデルを生成し、当該売上予測モデルを用いて対象店舗の売上予測値を出力する。店舗売上予測部12は、例えば、売上予測モデルの生成処理又は売上予測モデルに用いる統計値・地理情報の所定の前処理を実行する前処理部121と、既存店舗に関する変数を含む学習データを用いた機械学習等によって売上予測モデルを生成する売上予測モデル生成部122と、売上予測モデルに対して所定の変数値を入力することにより対象店舗の売上予測値を出力する売上予測部123と、を有する。
前処理部121は、売上予測モデルの生成処理においては、学習データに含まれる既存店舗に関する変数の一部に対し数値を算出する前処理と、また、売上予測モデルを用いた売上予測処理においては、売上予測モデルを用いる対象店舗(売上予測の対象となる店舗)に関する変数の一部に対し数値を算出する前処理と、を実行する。そのために、前処理部121は、例えば、前処理としての距離測定処理を実行する距離測定部121aと、前処理としての判定処理を実行する判定部121bと、前処理としての配分・集計処理を実行する配分・集計部121cとを有する。
本実施形態に係る距離測定部121aは、2地点の経度及び緯度の入力により、2地点間の距離(直線距離)をメートル単位で測定する。売上予測モデルに投入する多くの変数は、既存店舗・対象店舗・競合店舗などの店舗立地点、500m地域メッシュの補間点、駅中心点、道路交差点、主な商業施設の立地点、公園の中心点など、位置に関係付けられた地点データであることから、本実施形態に係る店舗売上予測システムの第二の特徴は、地点の位置を把握する方法として、「経度」及び「緯度」を用い、距離測定部121aにおいて2地点間の「距離の自動測定」を行う点である。
売上に係る地点間の影響は、例えば、対象店舗立地点と競合店舗立地点間のように、その間の距離が近ければ強く、遠ければ弱く現れる。距離測定部121aは、既存店舗や対象店舗の売上に影響する事象、例えば、競合店舗や駅、公園などを取り上げ、その影響度合いを見るため、距離測定処理を実行し距離を測定する。
本実施形態に係る判定部121bは、店舗立地点の「地理ビジネス環境」や「商業集積地の階層水準」を判定するとともに、店舗立地点がどのような「用途地域」や「自然災害地域」に入いるかを判定する。
店舗売上は、地理ビジネス環境の影響を大きく受けていることが、最近指摘されている(高阪宏行,2014,「ジオビジネス:GISによる小売店の立地評価と集客予測」古今書院.p.87)。従来では、「都心店」、「市街地店」、「郊外店」という用語は、店舗の立地型として広く使用されてきたが、単なる店舗の立地分類だけの意味しか持たなかった。一方、本実施形態に係る判定部121bは、地理的な視点を活かし「地理ビジネス環境」を自動判定することが可能である。本実施形態に係る判定部121bは、店舗立地点の経度及び緯度を示す情報に基づいて、統計値・地理情報DB群113を参照することにより、当該店舗立地点に対応する「地理ビジネス環境」の属性(「都心」、「市街地」、及び「郊外」)を判定することができる。
表1は、「地理ビジネス環境」の判定基準の一例を示す。
表1は、「地理ビジネス環境」の取り得る値を、「都心1」、「都心2」、及び「都心3」、「市街地1」及び「市街地2」、「郊外1」~「郊外6」に分けている。そして、「地理ビジネス環境」の取り得る値が、「1km圏内の駅の有無」、「小売年間販売額(千万円)」、及び「従業者数(人)」の3つの変数によって決定される。「1km圏内の駅の有無」は、店舗立地点から1km圏内に駅があるか否かを示す情報である。「小売年間販売額(千万円)」は、店舗立地点を中心とした500m圏内の小売年間販売額である。「従業者数(人)」は、店舗立地点を中心とした500m圏内の従業者数である。なお、一定距離圏内の駅の有無や統計値は、距離測定部121aと下記の配分・集計部121cで処理された結果を用いる。地理ビジネス環境が「都心1」と判定される条件は、「1km圏内の駅の有無」が「有る」、「小売年間販売額(千万円)」が「20000以上」、且つ「従業者数(人)」が「50000以上」である。「都心」は、都心機能の卓越度に応じ3つに分けられる。「都心1」は、銀座や新宿といった狭義の都心である。「都心2」及び「都心3」に判定されると都心機能の卓越度は低下し、市街地的要素も現れはじめる漸移帯に相当する。「市街地」と「郊外」も同じで、番号が多くなるほど都心機能は低下する。このように判定部121bは、当該判定基準に基づいて、店舗立地点の「地理ビジネス環境」の属性を判定する。本実施形態に係る店舗売上予測システムの第三の特徴は、店舗立地点に対し、地理ビジネス環境(都心・市街地・郊外)を「自動判定」する点である。
表2は、「地理ビジネス環境」ごとに、売上予測モデルの因子と、因子を構成する典型的な要素と、要素の変数データを取得する地域メッシュの大きさ及び集計地域の範囲を示す。
本実施形態に係る店舗売上予測部12では、表2に示すように、「地理ビジネス環境」の属性の判定結果に応じて、売上予測モデルを構成する5つの因子に対し、取り上げる要素が異なることを示す。「交通」因子については、「都心」及び「市街地」では、「鉄道」が取り上げられるが、「郊外」では車による「道路」交通になる。この「交通」因子の要素の相違は、「需要」因子に影響し、「都心」では主な要素(需要発生源)は「従業者(都心への通勤者)」であり、次いで「鉄道利用者」になる。それに対し、「市街地」では、「鉄道利用者」の比重は下がり、主な要素は、「従業者」と「居住者」になる。「郊外」では「従業者」の比重が下がり、主に「居住者」になる。「供給」因子は、店舗の立地場所であり、「都心」では「商業ビル」、「市街地」では「商業ビル」と「ショッピングセンター(SC)」、「郊外」では「ショッピングセンター(SC)」と「単独店」が典型的である。このように「地理ビジネス環境」の属性の判定結果は、売上予測モデルを構成する要素を変えるので、当然、売上予測モデルに投入する変数も異なる。例えば、売上予測モデルにおいて、「交通」という因子に対し、都心や市街地では、「鉄道」という要素についての駅への距離という変数を投入するが、郊外では、「道路」という要素について交通量の多い交差点への距離という変数になる。
判定部121bによる「地理ビジネス環境」の属性の判定結果は、売上予測モデルに投入する変数の統計量を集計する範囲(集計領域)の大きさも変える。一般に、小売企業が同一規模の店舗を立地展開しても、「都心」では商圏は小さく、「市街地」、更に「郊外」と都心から遠くなるにつれて、人口密度が逓減することから、その人口減少を補うため、商圏は拡大することが知られている(高阪宏行,2021「国勢調査を用いたSCに立地するスーパーマーケットの商圏分析」エストレーラ,No.325.)。このことから、表2では、例えば居住者による需要量を計測する場合、「都心」では店舗を中心とした「500m圏」で、「市街地」では「1km圏」で、「郊外」では「2km圏」で、常住人口数を集計する。このように判定部121bによる「地理ビジネス環境」の属性の判定結果が、変数の統計量の「集計領域」の大きさを変えることは、変数の統計量を取得する地域メッシュの大きさも変える。例えば、表2では、「都心」と「市街地」では、「500m地域メッシュ」が用いられるのに対し「郊外」では、「1km地域メッシュ」が用いられる。「地理ビジネス環境」の相違が、売上予測モデルに投入する変数の統計量を集計する空間スケールを変えることから、本実施形態に係る店舗売上予測システムは、「空間スケール可変型システム」とよぶことができる。本実施形態に係る店舗売上予測システムの第四の特徴は、地理ビジネス環境の判定結果に基づき、売上予測モデルの要素と変数、更に変数の統計値の集計領域の大きさを変更する点である。
判定部121bは、当該判定基準に基づいて、小売企業が所有する既存店舗に対して、店舗立地点の「地理ビジネス環境」の属性を判定する。既存店舗の立地点は、判定結果に基づき、都心、市街地、郊外に三分される。次に、例えば都心立地していると判定された既存店舗(すなわち都心店)は、都心の売上予測モデルを構築するときに、学習用のサンプル店舗として使用される。同様に、立地点が市街地あるいは郊外と判定された既存店舗は、それぞれ市街地あるいは郊外の売上予測モデルを構築するときに、学習用のサンプル店舗として使用される。「地理ビジネス環境」が同じと判定された既存店舗のデータを用いて、売上予測モデルを特定化するのは、売上をもたらす地理ビジネス環境を同一に揃えるというスクリーニングを行っていることであり、売上予測モデルの予測精度を向上させる重要な手段の1つになる。
判定部121bはまた、当該判定基準に基づいて、小売企業が開店しようとする対象店舗(出店候補物件)に対して、店舗立地点の「地理ビジネス環境」の属性を判定する。対象店舗の「地理ビジネス環境」は、判定結果に基づき、都心、市街地、郊外に三分される。次に、例えば、対象店舗の立地点が都心と判定された場合は、都心の売上予測モデルを用いて、売上予測が実行される。同様に、市街地あるいは郊外として判定された場合は、それぞれ市街地あるいは郊外の売上予測モデルが使用され、売上予測値が求められる。
本実施形態に係る配分・集計部121cでは、以下に示す「地域メッシュ統計値の自動集計」、「駅統計値の自動空間集計」、「立地点数の自動カウント」の3つの自動処理を実行する。これは、本実施形態に係る店舗売上予測システムの第五の特徴をなす。
本実施形態に係る配分・集計部121cは、地域メッシュ統計値の自動集計を行うにあたって、店舗立地点を含む店舗立地点地域メッシュ(第1地域メッシュの一例)の地域メッシュコード(店舗立地点地域メッシュコード)と、店舗立地点地域メッシュに隣接する周辺の8つの周辺地域メッシュ(第2地域メッシュの一例)の地域メッシュコード(周辺地域メッシュコード)とを、コード取得部111から取得する。図5には、中央に店舗立地点地域メッシュM0が示されており、更に、店舗立地点地域メッシュに隣接して8つの周辺地域メッシュM1~M8が示されている。なお、周辺地域メッシュの数は、8つに限らず、7つ以下であってもよいし、9つ以上であってもよい。また、周辺地域メッシュは、店舗立地地域メッシュに隣接していなくてもよい。
配分・集計部121cは、例えば店舗立地点地域メッシュM0及び周辺地域メッシュM1~M8のそれぞれの中に、複数の補間点を設定する。これにより、各補間点には、経度及び緯度を示す情報が対応付けられる。図5には、補間点の一例として、店舗立地点地域メッシュM0及び周辺地域メッシュM1~M8のそれぞれにおいて、10行×10列で等間隔に配置された黒丸で表された補間点が示されている。なお、図5に示したのはあくまで一例であって、補間点の間隔や数は任意に設定することができ、補間点は必ずしも等間隔で配置されなくてもよい。また、補間点の配置の仕方は、地域メッシュに対応付けられた任意の変数に応じて設定されてよい。
次に、配分・集計部121cは、店舗立地点地域メッシュM0及び周辺地域メッシュM1~M8のそれぞれに対応付けられた統計値を、当該地域メッシュに含まれる補間点に割り当てる。「割り当ての方法」は、例えば、いずれの補間点に対して「均等」に割り当ててもよい。具体的には、例えば、商業統計の地域メッシュにおいて、統計値として小売年間販売額を取り上げると、特定の地域メッシュ(店舗立地点地域メッシュM0又は周辺地域メッシュM1~M8のいずれか)に対応付けられた統計値が小売年間販売額の1000万円であり、補間点が100個(10行×10列)であった場合、1つ1つの補間点には「1000万円÷100個」の「10万円」が割り当てられる。なお、補間点に対する地域メッシュ統計値の「割り当ての方法」は、補間点の何らかの指標(例えば、建物の棟数)に比例させてもよい。また、例えば、店舗からの距離の増加に伴い「段階」的な逓減や、連続的な「距離逓減」関数に基づいてもよい。
図5は、本実施形態に係る配分・集計部121cが実行する「集計処理」の概要を説明するための概略図でもある。当該集計処理は、所定の「集計領域」について合計することにより「空間集計処理」とも称され得る。配分・集計部121cでは、割り当てられた統計値を集計するための所定領域として、店舗立地点を含む「集計領域」を設定する。図5には、「集計領域」の一例として、店舗立地点P0を中心とする半径rの円Cが示されている。半径rの値は特に限定されないが、前記のように、店舗立地点の判定された地理ビジネス環境の属性(「都心」など)に対応した任意の変数値、例えば500mに基づいて設定されてもよい。「集計領域」の形状は、円形に限らず、任意の形状で設定可能であってよい。
次に、配分・集計部121cは、「集計領域」に含まれるすべての補間点について、割り当てられた統計値を集計する。補間点が「集計領域」に含まれるか否かは、距離測定部121aの機能を用いる。例えば、店舗立地点の経度及び緯度を示す情報と、補間点の経度及び緯度を示す情報とを用いて、店舗立地点と補間点間の距離を測定した上で、当該距離を「集計領域」の半径rと比較することにより判定される。すなわち、店舗立地点と補間点間の距離が、「集計領域」の半径rより短い場合は、当該補間点は「集計領域」に含まれると判定され、店舗立地点と補間点間の距離が、「集計領域」の半径rより長い場合は、当該補間点は「集計領域」に含まれないと判定される。図5では、「集計領域」は、店舗立地点地域メッシュM0の全てを含むため、店舗立地点地域メッシュM0に含まれる全ての補間点に割り当てられた統計値の合計(すなわち、店舗立地点地域メッシュM0に対応付けられた統計値そのもの)を集計値に含める。更に、配分・集計部121cは、周辺地域メッシュM1~M8の中で「集計領域」に含まれる補間点についても、当該補間点に割り当てられた統計値を集計値に含める。
店舗を立地させると店舗の周囲には、「集客地域」が形成される。配分・集計部121cにおける地域メッシュ統計値の「集計領域」は、店舗の「集客地域」と考えることもできる。この「集客地域」では、競合店舗が周囲に存在しなくても、距離の影響を受けて、どこかで居住者あるいは従業者の来店確率は0になる。来店確率の分布は、不連続分布と連続分布で表現される。図6の上図は、店舗を中心とした半径rの「集計領域」の断面図(換言すれば、店舗からの所定の半径における距離と、来店確率とのグラフ)を示している。店舗から距離rまでは、来店確率が1と均等であるが、距離rを超えると来店確率が0となるような「均等」であるが不連続な境界を持つ「集客地域」を画定したと捉えることができる。それに対し中図は、来店確率が段階的に(不連続に)低下する「階段的な境界」を持つ「集客地域」を、下図は連続的に「距離逓減」する境界の「集客地域」を表している。スポーツクラブのような会員制の企業やポイント・カードを発行している企業では、保有している利用者の居住地情報から、店舗と利用者間の距離を測定することができるので、「階段状」の来店確率や「距離逓減」関数(例えば、負の指数関数)の係数推計は、予測精度の向上につながる。
図7は、本実施形態に係る配分・集計部121cが実行する「配分処理」の概要を説明するための概略図である。図7では、自社店舗(既存店舗や対象店舗)の店舗立地点P0のほかに、P1に競合他社の「競合店舗」が立地する場合を示している。配分・集計部121cは、このように競合店舗が少なくとも1つ存在する場合、競合店舗についても集計領域を設定してもよい。競合店舗について設定される集計領域の形状や寸法は、対象店舗について設定される集計領域の形状や寸法と同一であってもよいし、異なっていてもよい。図7に示すように、店舗立地点P0を中心とする半径rの円C0で表わされた集計領域と、店舗立地点P1を中心とする半径rの円C1で表わされた集計領域とが相互に重複している場合、2店舗間で競合が発生すると考える。競合とは、補間点に対し割り当てられた地域メッシュ統計値を店舗間で取り合う行為であり、配分・集計部121cの「配分処理」で実行される。
配分・集計部121cでは、例えば、2店舗が相互に重複している集計領域(対象店舗の集計領域と競合店舗の集計領域とが重なる部分)に対しては、補間点に対し割り当てられた地域メッシュ統計値を所定の方法で割り当ててもよい。割り当ての方法は、特に限定されないが、例えば単純に「均等」に二等分してもよいし、「競合モデル」に基づいて、店舗の規模と距離の側面から配分してもよい。図8は、競合モデルの一例として、距離係数=2、規模係数=1の「ハフモデル」の数式と計算例を示している。「ハフモデル」は一例であって、他の競合モデルが用いられてもよい。なお、小売企業が店舗ごとに顧客の住所情報を保有している場合は、競合モデルの距離係数や規模係数が推定できるようになるので、それらの係数を用いることで、より詳細な競合関係が再現でき、予測精度の向上につながる。競合モデルとしては、店舗に対し距離係数と規模係数を推定する空間的相互作用モデルなどさまざまなモデルが考案されており、本実施形態で利用できる(Church, R.L. and Murray, A.T. 2009. Business Site Selection, Location Analysis, and GIS. Wiley, 81-106)。
従来、店舗を中心とした一定距離圏内の地域メッシュ統計値の集計は、GISを利用して、店舗レイヤと地域メッシュレイヤを重ね合わせ、地域メッシュコードによる地域メッシュ統計値の結合、バッファ生成、クリップ(切り取り)処理、面積按分などの数段階の空間処理を経て行われてきた。上記のとおり、本実施形態に係る店舗売上予測部12の配分・集計部121cによる「集計処理」は、地域メッシュを補間点によって細分化し、統計値を割り当てた上で、補間点に割り当てられた統計値を「集計領域」で集計するという方法を採用している。本実施形態に係る手法は、GISを使わない簡便的な方法として、地域メッシュ統計から一定距離圏内の「地域メッシュ統計値の自動集計」ができるので、地域メッシュ統計に対し大きな利便性の向上をもたらす。
配分・集計部121cによる「地域メッシュ統計値の自動集計」は、上記の商業統計の「一定距離圏内の小売年間販売額」のほかに、国勢調査の「一定距離圏内の常住人口数」、経済センサスの「一定距離圏内の小売従業者数」や「一定距離圏内の飲食従業者数」など、各種の地域メッシュ統計から一定距離圏内の統計値を集計することができる。
本実施形態に係る駅統計値とは、鉄道事業者が発表している駅の乗降客数のほかに、大都市交通センサスが調査している首都圏・近畿圏・中京圏の駅の統計データを指す。これらの駅統計値は、大都市交通センサスDB113dに記憶されており、そのままデータとして利用されるほかに、地域メッシュ統計値と同じように、本実施形態に係る配分・集計部121cで配分・集計処理され、一定距離圏内の統計値として集計されることもある。
本実施形態に係る配分・集計部121cで配分・集計処理され、一定距離圏内の統計値として駅統計値を集計するには、まず、ユーザによる店舗の経度及び緯度の入力によって、本実施形態に係る地理情報DB113fから駅中心点(駅プラットフォームの中心点)の経度及び緯度が読み込まれ、距離測定部121aにより店舗と駅中心点間の距離が測定される。店舗から一定距離圏(例えば500m圏)内の駅に対しては、大都市交通センサスDB113d から、例えば、その駅の普通券降車人数が読み込まれる。更に、配分・集計部121cにおいて、該当の駅中心点を中心に、駅統計値の「集計領域」として、独自の「駅メッシュ」を生成する。一例として、図9では、該当の駅中心点を中心に生成した「500mメッシュ」を示している。この「500mメッシュ」は、総務庁管轄下にある500m地域メッシュとは、大きさは同じであるが、カバーする範囲が異なることから、「500m地域メッシュ」とはよばない。駅統計値の「集計領域」は、「駅メッシュ」と称され得る。駅メッシュの寸法は、500mに限らず、任意の値であってもよい。また、駅メッシュの形状は、矩形に限らず、円形や他の任意の形状であってもよい。
「500mメッシュ」等の駅メッシュの内部には、例えば10×10の「補間点」を設ける。なお、駅メッシュの内部に設定される補間点の位置や数は任意に設定してもよい。駅の普通券降車人数は、例えば100個の補間点に「均等」に割り当てられてもよいし、駅からの距離逓減率などが考慮されてもよい。次に、距離測定部121aにより、店舗(例えば、図9で店舗1)と補間点間の距離が測定され、店舗1の500m圏に含まれると判定された場合、補間点に割り当てられた駅統計値は、店舗1の変数「一定距離圏内の普通券降車人数」として空間集計される。
図9に示すように、競合店舗(店舗2)が、同じ駅を一定距離圏(例えば500m圏)内に持つならば、「集計領域」(駅メッシュ)としての「500mメッシュ」の補間点に対し競合が発生する可能性が生まれる。配分・集計部121cにおいて、補間点に割り当てられた駅統計値を店舗間で配分してもよい。配分の方法は、特に限定されないが、「均等」な配分であってもよいし、「ハフモデル」などの「競合モデル」による配分であってもよい。なお、「500mメッシュ」等の集計領域(駅メッシュ)は、配分・集計部121cで生成される駅統計値の「集計領域」であり、「駅勢圏」と考えることもできる。前記したのと同様に、駅の周辺に形成される駅勢圏は、「500mメッシュ」などのような矩形でなく、円形など他の形状をとってもよい。前掲の図6で店舗を駅と読み替えると、駅から距離rまでは、駅利用(来店)確率が1、距離rを超えると利用確率が0となるような「駅勢圏」を画定したと捉えることもできる。また、駅の「集計領域」及び「駅勢圏」を、段階状に低下する駅利用確率や、連続的に距離逓減する負の指数関数等の減少関数(距離が増加する程減少する任意の関数)で表現してもよい。
なお、駅統計値に対する本実施形態に係る配分・集計部121cが実行する配分集計処理が、前出の地域メッシュ統計値の処理と異なる点は、店舗から一定距離圏(例えば500m圏)内に複数の駅(又は路線のプラットホーム中心点)が入る場合である。図10の駅の例では、1つの駅に対し5つの路線の鉄道事業者が営業している。普通券降車人数や駅構外乗換駅の乗換人数といった路線ごとの駅統計値には、位置情報として、図10に示すように、各路線の線セグメントで表示されるプラットホームの中心点の経度及び緯度が付与される。図10は、店舗から例えば500m圏内に,2つの路線(の駅プラットホームの中心点)が入る例を示している。そして、各路線の線セグメントで表示されるプラットホームの中心点に対し、例えば「500mメッシュ」等の「集計領域」を生成し、その内部に10×10等の「補間点」を設ける。補間点には路線ごとの駅統計値が割り当てられ、例えば補間点が店舗の500m圏に含まれると判定された場合、割り当てられた路線の駅統計値はすべて、店舗の集計値に含められる。なお、路線を駅と読み替えて、店舗から一定距離圏に同一鉄道事業者の複数の駅が入る場合でも同じである。このように配分・集計部121cは、集計領域内に複数の鉄道事業者それぞれが営業する複数の駅が含まれる場合や、同一鉄道事業者の複数の駅が入る場合、各鉄道事業者及び各駅について配分集計処理を実行し、配分値を集計してもよい。
同じように、駅統計値に係る変数には、「一定距離圏内の駅構外乗換駅の乗換人数」、及び「一定距離圏内の乗降客数」などが挙げられ、本実施形態に係る地理情報DB113fからデータを読み取り、距離測定部121a、大都市交通センサスDB113d、配分・集計部121cによる処理過程を経て「駅統計の自動空間集計」が実行される。
本実施形態に係る配分・集計部121cが実行するそのほかの処理には、一定距離圏内の店舗や施設の「立地点数の自動カウント」がある。ユーザによる店舗の経度及び緯度の入力によって、本実施形態に係る地理情報DB113fから、例えば、自社の既存店舗の経度及び緯度が読み込まれ、距離測定部121aで店舗と自社店舗間の距離を測定し、一定距離圏内の自社店舗数をカウントして、変数「一定距離圏内の自社店舗数」が自動集計される。同じように、本実施形態に係る地理情報DB113fから施設データを読み取り、距離測定部121aと配分・集計部121cのカウント処理という過程を経て作成される変数データは、「一定距離圏内の他社店舗数」、「一定距離圏内のインターチェンジICの有無」、「公園の有無」などが挙げられる。
売上予測モデル生成部122は、売上予測モデルを回帰モデルとして生成するため、売上を説明するのに重要と考えられる変数を取り上げ、既存店舗に対しそれらの変数データを取得する。更に、取得された変数データの中から、既存店舗の売上を説明するのに最も大きな説明力を有する変数の組み合わせを探索し、回帰モデルを特定化する。そのために、売上予測モデル生成部122は、例えば、各変数について既存店舗のデータを取得する変数データ取得部122aと、最も大きな説明力を有する変数の組み合わせを探索し、回帰モデルを特定化する売上予測モデル特定化部122bとを有する。
図11は、本実施形態に係る売上予測モデルを特定化するために使用する、既存店舗の売上を説明するのに重要と考えられる変数を、因子-要素-特徴-変数という形式の体系化で位置づけている。一例として、ここでは都心の飲食店舗の事例を取り上げているが、業種によって、変数とその計測方法は異なってもよい。以下では、図11に基づいて、変数データ取得部122aで取り上げる変数を説明する。
店舗の売上に影響する最上位の要因は、因子とよばれる。図11に示す例では、因子として、「需要」、「供給」、「競合と集積」、「交通」、「地理」の5つが挙げられているが、これらに限られるものではない。これらの因子は、店舗がどのような業種であろうと、売上を説明する上での基本的な経済主体と経済メカニズム、そして経済を支える背景を示している。
5つの因子は、要素に分解され、地理的事象として具現化される。売上予測モデルの第一因子の「需要」は、図11に示す例のように、「居住者」、「従業者」、「一時通行者」の3要素に分けられる。従来の売上予測モデルでは、需要をおもに「居住者」として捉えてきた。本実施形態に係る店舗売上予測システムの第六の特徴は、「居住者」のほかに、「従業者」と「一時通行者」を加え、需要を3要素で構成する点である。実施形態に係る店舗売上予測システムは、この3種類の需要に係る変数を自動集計することを、重要な開発目標に掲げている。
因子「需要」の要素「居住者」は、店舗立地点を中心とした一定距離圏内の居住地の需要であり、居住者を需要発生源とする需要を捉える。要素「居住者」は、市場をマスとして捉えた「規模」のほかに、「性」や「年代」などで市場細分化(マーケットセグメンテーション)を行い「若年」・「高齢」・「女性」といったさまざまな特徴として捉えられ、それぞれの変数で計測される。図11に示す例では、「一定距離圏(例えば都心では500m圏)内の女性常住人口数」である。都心で距離圏を500m圏とした理由は、都心では駅密度が1km2当たり1駅と高いことから、居住者の歩行距離の上限が500m程度になると考えたからである。
因子「需要」の要素「従業者」は、店舗立地点を中心とした一定距離圏内の業務地の需要であり、業務地に勤務する従業者を発生源とする需要を捉える。要素「従業者」は、「規模」・「業種」・「通勤者」などさまざまな特徴を持ち、それぞれの変数で計測される。図11に示す例では、「一定距離圏(例えば都心では500m圏)内の小売・飲食従業者を除く従業者数」という変数で計測される。都心で距離圏を500m圏とした理由は、昼休み等の1時間程度の休憩時間内に業務地を出てまた戻って来ることの可能な移動範囲を、500m圏と考えたからである。また、従業者数から小売・飲食従業者数を除いたのは、売上予測を行う店舗の業種を、一例として飲食としているので、目的変数の飲食店舗の売上に対し、説明変数に飲食店関係の変数(飲食従業者数)を加えると、トートロジー(説明変数に目的変数の一部が組み込まれていること)になるので、加えないことが適切と考えたからである。更に、小売従業者を除いたのは、小売業関係のデータには、従業者(遺伝子型)のほかに年間販売額(表現型)もあり、表現型の年間販売額の方が小売業の実態をより精確に表現できると考えたからである。
因子「需要」の要素「一時通行者」は、店舗立地点を中心とした一定距離圏内の商業集積地・業務地・観光地の需要であり、一時的に訪れる買物客・業務地(ビジネス)訪問者・観光客等を発生源とする需要を捉える。要素「一時通行者」は、「買物客」・「事業所訪問者」・「駅構外乗換駅乗換人員」・「観光客」などさまざまな特徴を持ち、それぞれの変数で計測される。図11に示す例では、「一時通行者」を発生源とする需要は、駅に係る2つの変数で計測される。第一は、「一定距離圏(例えば都心では500m圏)内の駅の普通券降車人数」という変数である。普通券降車人数を取り上げたのは、買物・業務地訪問・観光などの一時的訪問は、都心では鉄道の普通券で乗車し、目的地(店舗立地点の最寄駅)で降車した場合、それを捉えればよいと考えたからである。都心で距離圏を500m圏としたのは、都心では駅密度が1km2当たり1駅と高いことから、一時通行者の歩行距離の上限が500m程度になると考えたからである。
要素「一時通行者」を捉える第二の変数は、「一定距離圏(例えば都心では500m圏)内の駅構外乗換駅の乗換人数」である。図12は、駅構外乗換駅の乗換人員の一例を示す概略図である。駅構外乗換駅とは、鉄道路線を乗換える場合、一度駅の構外に出なければならない駅である。JRと私鉄や地下鉄との乗換えのときに、そのような状況に出会うことが多い。店舗立地点を駅外(駅中ではなく)と考えた場合、駅構外乗換駅での乗換人員は、「一時通行者」のもう1つの需要発生源と考えられる。
売上予測モデルの第二因子の「供給」は、図11に示す例では、「店舗」、「入居ビル(SCを含む)」、「機能特化地域」、「商業集積地」の4つの要素に分解されるが、これらに限られるものではない。
因子「供給」の要素「店舗」は、更に「規模」・「営業活動量」・「視認性」・「近接性」といった4つの特徴を持つが、これらに限られるものではない。
因子「供給」の要素「店舗」の特徴「規模」は、空間的規模、及び時間的規模を含む任意の規模を含んでもよいが、これらに限られるものではない。図11に示す例では、空間的規模を示す変数として、「テーブル数」が含まれるが、「椅子の数」等の他の空間的規模の変数が含まれてもよい。「テーブル数」は、店舗が有するテーブルの数を示す変数である。このように、同一の特徴に対し、「テーブル数」と「椅子の数」の2つの変数、あるいは、それ以上の変数を取り上げる場合もあり、売上予測モデル特定化部122bにおいて、店舗売上に対する説明力を比較して、最も大きい変数のみが、最終的に回帰モデルの説明変数に組み込まれることもある。
因子「供給」の要素「店舗」の特徴「営業活動量」については、図11に示す例では、時間的規模を示す変数として、「営業時間」と「営業日数」が含まれるが、他の時間的規模の変数が含まれてもよい。「営業時間」は、店舗が1日に営業を行う時間の総数を示す変数である。「営業日数」は、店舗が1年間に営業を行う日数を示す変数である。
因子「供給」の要素「店舗」の特徴「視認性」は、店舗の存在が人々に知られているかに関連する特徴である。図11に示す例では、「店舗が見えるか」であるが、このほかに「サインボード(看板)」や「入口」、「セットバック」などの変数で計測される。「店舗が見えるか」の変数をより詳しく示すと、ユーザで任意に変数設定が可能であるが、例えば、「よく見える」=3、「見える」=2、「ほとんど見えない」=1、「まったく見えない」=0というような評価得点で評価される。「よく見える」とは、店舗の前を通る通行者の視界によく入り、店舗の存在をよく認識しているということである。「まったく見えない」とは、地下階にある店舗のように、店舗の前を通過するとき、視界にまったく入らない店舗である。
因子「供給」の要素「店舗」の特徴「近接性」については、図11に示す例では、「立地階数」の変数を取り上げている。より詳しく示すと、例えば、「1階」=4、「2階」及び「地下階」=3、「3階」=2、「4階」=1、「5階以上」=0というような評価得点で評価される。近接性の特徴は、広く考えると、このほかに「駅からの距離」、「道路の種類」、「障害物(バリア)」なども含まれるが、店舗売上に強く影響するため、以下で詳しく取り上げる。
因子「供給」の要素「入居ビル(SCを含む)」は、店舗が入居するビルに関連し、「種類」・「競合と集積」・「規模」などさまざまな特徴を持つ。図11に示す例では、「入居ビル」の特徴「種類」に注目し、「入居ビルの種類」の変数が挙げられている。要素「入居ビル」の特徴「種類」は、予測を行おうとしている店舗の業種等に応じて任意に変数の設定が可能である。図11に示す飲食店の場合では、アミューズメントビル、ファッションビル、ホテルビル、飲食店ビル、商業ビル、オフィスビル、住居ビル、SC、単独店等に分類される。
因子「供給」の要素「入居ビル(SCを含む)」の特徴「競合と集積」は、「同業種の店舗数」の変数で計測される。売上に対する寄与は、業種によって異なり、競合して売上に対してマイナスの影響を及ぼす場合もあれば、集積して売上に対してプラスの影響を生じる場合もある。
「入居ビル(SCを含む)」の特徴「規模」は、入居ビルのテナント数(同業種店舗を含む)の変数で計測される。なお、郊外では、要素が入居ビルとしてSC(ショッピングセンター)が多く立地し、「競合と集積」・「規模」のほかに、「施設の新しさ」・「施設の運営者」といった特徴が取り上げられる。
因子「供給」の要素「機能特化地域」では、同業種店舗の「集積量」といった特徴に注目する。図11に示す例は、飲食店の場合を示し、「一定距離圏(例えば都心では500m圏)内の飲食従業者数」という変数で計測される。同業種店舗の集積量の売上に対する寄与は、業種によって異なり、例えば、競合して売上にマイナスの影響を及ぼす場合もあれば、集積して売上にプラスの影響(局地化経済の集積利益)を生じる場合もある。
因子「供給」の要素「商業集積地」では、異業種店舗の集積量を表わし、営業活動量・規模・経済水準といった特徴に注目する。図11に示す例は、「一定距離圏(例えば都心では500m圏)内の小売年間販売額」のほかに、「商業集積地の階層水準」や「最高路線価」という変数で計測されてもよい。
因子「供給」の要素「商業集積地」の特徴「規模」は、商業集積地の「階層水準」として区分された属性を示す変数で計測される。商業集積地の「階層水準」には、判定部121bによる判定処理の結果が入力される。商業集積地の「階層水準」の取り得る属性は、例えば、小売地理学の観点による属性としての「全国」、「広域」、「地域」、「都市」、「地区」、「近隣」の6つの階層水準を含んでもよい。一般に、店舗は、規模が大きい商業集積地に立地するほど、異業種店舗の集積による都市化経済の集積利益を享受すると考えられるので、商業集積地の「階層水準」は、都市化経済の集積利益を示す変数になる。
表3は、商業集積地の「階層水準」の判定基準の一例を示す。
判定部121bは、当該判定基準に基づいて、店舗立地点を含む地域メッシュの商業集積地の「階層水準」を判定する。表3に示すとおり、商業集積地の「階層水準」は、当該店舗立地点を含む500m地域メッシュにおける小売年間販売額によって判定される。また、表3には、商業集積地の規模が「全国」、「広域」、及び「地域」については、隣接500m地域メッシュをもまとめて小売年間販売額に集計する基準が含まれる。例えば、東京駅の南や東に広がる有楽町・銀座や日本橋の商業集積地、新宿、池袋、渋谷の商業集積地では、店舗立地点を含む500m地域メッシュの小売年間販売額が5000憶円以上で、その地域メッシュに隣接する500m地域メッシュの小売年間販売額が300憶円以上である場合は、隣接500m地域メッシュも商業集積地に含めるとともに、それらの小売年間販売額を合計した数値で、商業集積地の「階層水準」を自動判定する。
以上のとおり、本実施形態に係る売上予測モデルでは、店舗立地点の経度及び緯度を示す情報を入力することによって、判定基準に基づいて、店舗が立地する商業集積地を同定するとともに、その規模が、全国・広域・地域・都市・地区・近隣のいずれに当たるかを自動判定する。商業集積地の同定と規模の自動判定は、従来見られなかったシステムであると同時に、その判定結果が売上予測モデルの変数に用いられることもなかった。
因子「供給」の要素「商業集積地」の特徴「経済水準」として、店舗が立地する商業集積地の最高路線価を変数に採用することもできる。都市の地代理論(O‘brien, L. and Harris, F. 1991. Retailing: Shopping, Society, and Space. David Fulton Publishers, London, p.77.)から、商業集積地の中心は地価の最高地点であり、そこから離れるに従って、地点の集客能力が低下することが報告されている。そこで、本実施形態に係る売上予測モデルでは、「最高路線価」を変数に採用し、商業集積地の中心の「経済水準」を計測してもよい。
本実施形態に係る変数データ取得部122aにおいて、以上の因子「供給」に関しては、図11の右欄の「既存店舗:所与」とある変数では、すでにその変数データが決まっていることを表している。例えば、因子「供給」の要素「店舗」の特徴「規模」の変数は、「テーブル数」で計測されるが、既存店舗ではその値はすでに定まっている。「既存店舗:所与」とある変数は、そのほかに、「営業時間」、「店舗が見えるか」、「立地階数」、「入居ビルの種類」など因子「供給」で多く見られ、既存店舗のデータとなる。ユーザは、このような既存店舗のデータに関して、データファイルとしてサーバに送ることが必要となり、その「取得方法」は「ユーザ入力」になる。
売上予測モデルの第三因子は、「競合と集積」である。すでに前出の因子「供給」の要素「入居ビル(SC)」、「機能特化地域」及び「商業集積地」において、ビルレベルと地域レベルで「競合と集積」を捉えている。ここでは、従来あまり考慮されてこなかった個店レベルでの「競合と集積」を取り上げる。図11で示されるように、「同業種店舗」と「主な施設」の2つの要素に分解されるが、これらに限られるものではない。
因子「競合と集積」の要素「同業種店舗」は、特徴として「自社」があり、例えば、「一定距離圏(例えば都心では500m圏)内の自社店舗数」の変数で計測される。自社店舗が近隣に立地していると、カニバリゼーション(共食い)とよばれる自社競合が生まれる可能性が高くなる。
因子「競合と集積」の要素「同業種店舗」は、特徴として「他社」があり、「一定距離圏(例えば都心では500m圏)内の他社店舗数」の変数で計測される。同業種の他社店舗が近隣に立地している場合、業種によって影響が異なる。例えば、飲食店の場合は、飲食店街で見られるように、競合による損失より集積の利益が大きい。それに対し、スポーツクラブでは、会員制により顧客を囲い込みするため、競合のみが発生する。
因子「競合と集積」の要素「主な施設」は、例えば、特徴として「商業」と「娯楽」があり、一定距離圏内の主な商業施設や娯楽施設が挙げられるが、これらに限られるものではない。これらの施設は大きな集客力を持つので、異業種であるが店舗周辺にこれらの施設が立地することは、プラスの顧客トリクルダウン(滴り落ち;おこぼれ)効果を受けることになる。
売上予測モデルの第四因子である「交通」は、売上予測における交通に関連し、図11で示されるように「鉄道」と「道路」の2つの要素に分解されるが、これらに限られるものではない。小売地理学では、交通因子は、需要因子と供給因子を結びつけるものとして取り上げられる。鉄道交通は都心と市街地で卓越し、道路交通は郊外で卓越する傾向にある。したがって、都心と市街地では鉄道交通が重要であり、郊外では道路交通が重要になる。
因子「交通」の要素「鉄道」は、店舗立地点の周囲における鉄道交通駅に関連し、「近接性」、「結節性」及び「規模」の特徴があるが、これらに限られるものではない。
因子「交通」の要素「鉄道」の特徴「近接性」の変数として、図11に示す例では、「最寄駅への距離」が含まれるが、これに限られるものではない。同じく要素「鉄道」の特徴「結節性」の変数としては、「最寄駅の路線数」が、特徴「規模」の変数としては、「最寄駅の乗降客数」が挙げられる。
因子「交通」の要素「道路」は、店舗立地点の周囲における道路(自動車)交通に関連し、「種類」・「交通量」・「近接性」や「結節性」といった特徴があるが、これらに限られるものではない。
因子「交通」の要素「道路」の特徴「種類」は、図11に示す例では、店舗立地点の「前面道路の種類」が取り上げられている。「前面道路」とは店舗の入口が面する道路のことで、更に敷地の周囲の「周辺道路」の種類を考慮する場合もある。「道路の種類」には、例えば、道路の利用者に基づいて、自動車道路の「高速道路」、「国道」、「都道府県道」、「シンボル市道」(道路名称のある市道)、「市区町村道」、「一般道路」等や、歩行者道路の「歩道」、「歩行者専用道路」、「アーケード」、「地下道」、「路地」等を含んでもよい。
因子「交通」の要素「道路」の特徴「交通量」は、「平日12時間小型車交通量」が含まれるが、これに限られるものでもない。
因子「交通」の要素「道路」の特徴「近接性」は、店舗立地点の前面道路と周辺道路でのアクセスを示す変数である。例えば、「中央分離帯の有無」、「駐車場への直接イン」、一方通行、(法規上・構造上)右折禁止等が含まれてもよい。同じく、要素「道路」の特徴「結節性」は、「一定距離圏内のインターチェンジICの有無」や「主要交差点の有無」が含まれるが、これらに限られるものでもない。
売上予測モデルの第五因子である「地理」は、図11で示されるように、「「地域」と「障害物(バリア)」の2つの要素に分解されるが、これらに限られるものではない。
因子「地理」の要素「地域」は、店舗が立地する地域に関連する。特徴は、「種類」・「経済水準」・「土地利用」・「自然災害」などがあるが、これらに限られるものではない。
因子「地理」の要素「地域」の特徴「種類」は、都道府県のほかに、地方、大都市圏などがある。図11に示す例では、「種類」として都道府県が取り上げられ、変数として、「都道府県名」が含まれるが、これに限られるものではない。
因子「地理」の要素「地域」の特徴「経済水準」は、例として「都道府県別最低賃金」や「都道府県別1人当たり外食食事代」の変数が挙げられる。同じく要素「地域」の特徴「土地利用」では用途地域の種類が、特徴「自然災害」ではハザードマップにより店舗立地点が水害地域に含まれるか等が変数になる。
因子「地理」の要素「障害物(バリア)」は、店舗立地点の周辺の地理的・物理的な障害物に関連し、「分断」と「占拠」の2つの特徴を示す。図11に示す例では、分断バリアの変数として「河川の有無」、占拠のバリアの変数として「公園の有無」が含まれるが、これらに限られるものではない。
表4は、ユーザが作成する既存店舗の変数データファイルの一例を表している。
本実施形態に係る店舗売上予測システムでは、ユーザは、表4に示すように、既存店舗IDと「既存店舗の経度及び緯度」、及び売上予測モデルの目的変数になる「売上」とともに、「ユーザ入力」の変数を含む既存店舗のデータファイルを作成し、インターネット等の所定の通信ネットワークNを介して、サーバ装置10に送信することになる。なお、既存店舗ごとに店舗利用者の住所情報を保有し、集客地域の距離逓減係数を推定して、売上予測のより高い精度を目指す小売企業は、別途に、既存店舗ごとの利用者の住所情報又は経度及び緯度を保存したファイルもサーバ装置10に送信することになる。
変数データ取得部122aでは、売上予測モデルの「目的変数」となる既存店舗の「売上」データと、「説明変数」の選定対象となる変数が、前出の自動処理とユーザによる送信によって取得された。売上予測モデルの特定化のため、既存店舗に対して「目的変数」と「説明変数」の選定対象となるデータが準備されたことになる。
売上予測モデル特定化部122bは、既存店舗の変数データを使用して、回帰モデルとしての売上予測モデルを特定化する。回帰モデルの特定化とは、「目的変数」の値を予測するため、回帰モデルに組み込む「説明変数」の選定を行うことである。変数データ取得部122aで取得された変数の中から、既存店舗の売上の変動を最も良く説明する変数の組み合わせが探索され、回帰モデルに組み込む「説明変数」が選定される。「説明変数」の組み合わせについては、任意のアルゴリズムによって探索されてもよいし、予め店舗の地理ビジネス環境等の属性に応じて規定されてもよい。
売上予測の回帰モデルを特定化するとき、「機械学習手法」と「統計学的手法」とが選択的に用いられてもよい。「機械学習手法」では、「サンプル店舗」となる既存店舗を、「訓練(学習)店舗」と「テスト店舗」に分割するので、例えば売上予測モデル特定化部122bは、「機械学習手法」と「統計学的手法」とのいずれの手法を使うかを、例えば既存店舗数(小売企業が所有する既存店舗の数)等に応じて決定してもよい。例えば、企業が有する既存店舗(データが取得できる既存店舗)のうち、判定部121bによって、地理ビジネス環境が、都心、市街地、あるいは、郊外として、それぞれ300店舗程度判定された場合は、例えば、その8割を「訓練店舗」に、残りの2割を「テスト店舗」として用いるのに十分な「サンプル店舗」があると考え、売上予測モデル特定化部122bにより「機械学習手法」が採用されてもよく、この場合、都心、市街地、あるいは、郊外に対し、「機械学習手法」を用いて回帰モデルが特定化される。
それに対し、企業が有する既存店舗のうち、判定部121bによって、地理ビジネス環境が、都心、市街地、あるいは、郊外として、それぞれ100店舗程度しか判定されない場合は、「機械学習手法」を実行するのに十分な「サンプル店舗」がないとみなし、売上予測モデル特定化部122bにより「機械学習手法」ではなく「統計学的手法」が採用されてもよく、この場合、都心、市街地、あるいは、郊外に対し、「統計学的手法」を用いた回帰モデルが特定化されてもよい。このことから、本実施形態に係る店舗売上予測システムの第七の特徴は、地理ビジネス環境ごとにユーザが所有する既存店舗数に応じて、「機械学習手法」と「統計的手法」とを使い分けて、売上予測モデルを生成し、売上予測値を求める点である。なお、「機械学習手法」と「統計学的手法」のいずれを採用するかの基準としての既存店舗数は、特に限定されず、100店舗、200店舗、300店舗等や、これら未満やこれら以上であってもよい。
小売企業が所有する既存店舗の地理ビジネス環境を、当該判定基準に基づいて、都心、市街地、郊外と三分したとき、個々の店舗数が、「統計学的手法」の回帰分析を実行するのに十分なサンプル数の100店程度にならない場合、あるいは、「機械学習手法」の回帰分析を実行するのに十分なサンプル数の300店程度にならない場合は、地理ビジネス環境ができるだけ近い店舗をまとめることになる。例えば、都心1・都心2・都心3に立地している既存店舗では数が少ない場合は、前出の表1に示されているように、地理ビジネス環境が近い市街地1を「サンプル店舗」に加えてもよい。また、郊外に立地している既存店舗では数が少ない場合は、地理ビジネス環境が近い市街地2を「サンプル店舗」に加えてもよい。
変数データ取得部122aで取得された変数を、「説明変数」として回帰モデルに組み込む場合、変数(機械学習手法では特徴量という)をそのまま利用してもよいし、複数の変数と組み合わせて作成した複合変数を用いることもできる。これは、「特徴量エンジニアリング」とよばれ、表現が豊かな複合変数にまとめることによって、予測精度を向上させることにつながる(Zheng and Casari, 2019, オーム社,p.6)。
前記の図11に示した因子「供給」の要素「入居ビル」の特徴「種類」では、予測を行う店舗の業種等に応じて任意に変数の設定が可能である。例えば、飲食店の場合では、入居ビルの種類ごとに「目的変数」(店舗売上)の平均値を算出し、平均値の順位に応じて(評価の高いものを高得点として)、アミューズメントビルは8点、ファッションビルは7点、ホテルビルは6点、飲食ビルは5点、オフィスビルは4点、商業ビルと住居ビルは3点、小規模商業ビルは2点、単独店は1点というように、評価得点を設定してもよい。
因子「供給」の要素「店舗」の特徴「視認性」で、「店舗が見えるか」の変数は、ユーザで任意に変数設定が可能であるが、例えば、「よく見える」=3、「見える」=2、「ほとんど見えない」=1、「まったく見えない」=0というような評価得点で評価される。同様に、「サインボード」、「入口」、「セットバック」のほかの3つの「視認性」変数も評価得点で評価し、4変数の評価得点を合計し総合得点を算出し、「総合評価」することもできる。さらに、4変数の評価得点で低い場合のみを考慮するなど、さまざまな工夫が行われる。これらの4変数の評価得点及び総合得点等は、本実施形態に係る売上予測モデルの変数として取り上げられる。
因子「供給」の要素「店舗」の特徴「営業活動量」では、図11に示したように、1日の「営業時間」と年間の「営業日数」の2変数があるが、それらの積の「交互作用特徴量」=「営業時間」×「営業日数」として、「年間営業時間」を算出することで、簡潔な「複合変数」になる。
図11に示したように、因子「需要」の要素「居住者」は、特徴「規模」のほかに、特徴「性」と特徴「年代」がある。特徴「規模」は市場をマスとして捉え、「人口数」で計測されるのに対し、特徴「性」と特徴「年代」をクロスするならば、性×年代に基づいた市場細分化(セグメンテーション)を考慮した計測が可能となる。例えば、男10歳代・20歳代・30歳代・40歳代・50歳代・60歳代・70歳以上、女10歳代・20歳代・30歳代・40歳代・50歳代・60歳代・70歳以上と、市場を14に細分化するならば(ただし、10歳未満は取り上げない)、「性・年代細分化人口数」は、mw1×「男10歳代人口数」+mw2×「男20歳代人口数」+―――+mw7×「男70歳以上人口」+fw1×「女10歳代人口数」+fw2×「女20歳代人口数」+―――+fw7×「女70歳以上人口数」で計測される。ただし、mw1、mw2やfw1、fw2は、男女の顧客構成比を示す。小売企業が、店頭調査などを通じて、顧客構成比のデータを持つ場合は、そのデータで加重することで、居住者の「需要量」に対し、性×年代の市場細分化に基づく表現力の豊かな「複合変数」が作成される。
図11に示したように、因子「需要」は、「居住者」・「従業者」・「一時通行者」の3つの要素で構成される。需要を「総需要量」として複合変数にまとめるには、「総需要量」=w1×「居住者数」+w2×「従業者数」+w3×「一時通行者数」となる。このような線形モデルで「複合変数」にまとめると、「居住者」の変数「一定距離圏内の常住人口数」、「従業者」の変数「一定距離圏内の小売・飲食従業者を除く従業者数」、及び「一時通行者」の変数「一定距離圏内の駅の普通券降車人数」と「一定距離圏内の駅構外乗換駅の乗換人数」は、1つの「複合変数」にまとめられる。図13は、需要の3要素である「居住者」・「従業者」・「一時通行者」の加重値(w1、w2、w3)を変えて、店舗から500m圏内の「総需要量」と「飲食店従業者数」(総供給量)の間の決定係数の変化を3次元表示している。ポイントが黒くなるほど、決定係数が高い加重値の組み合わせを表している。3要素の加重値が均等であるよりも、「従業者」の加重値が高まるほど、「総需要量」の説明力は上昇し、(個店の供給量ではないが)「総供給量」の変動の半分程度を「総需要量」で説明できるようになることがわかる。小売企業が、店頭でのアンケート調査などを通じて、「居住者」・「従業者」・「一時通行者」の顧客構成比が得られる場合は、そのデータを利用して加重値を算出することで、「総需要量」とよばれる表現力の豊かで簡潔な「複合変数」が作成される。
図11に示したように、因子「交通」の要素「鉄道」では、「近接性」・「結節性」・「規模」の3つの特徴があり、最寄駅への「距離」・「路線数」・「乗降客数」の3変数で計測される。この3変数は、売上予測モデルの「説明変数」として個々に取り上げてもよいが、3変数をクロス集計し、「鉄道交通」として複合変数にまとめることもできる。まず、最寄駅への「距離」は、駅ビル・駅前・駅から100m・200m・300m・400m・500mと7区分する。「路線数」と「乗降客数」は、例えば、2路線以上と1路線、4万人以上と4万人未満と、それぞれ2区分する。すると、「鉄道交通」は、7×2×2=28に区分されたことになる。この区分に基づき、既存店舗を3重クロス集計するとともに、「目的変数」(店舗売上)の平均値を算出する。そして、平均値に基づき、例えば「距離」7区分を、3区分にまとめるといった分離集合のプロセスを経ることで、既存店舗に対し「鉄道交通」の3変数の典型的な組み合わせを確立し、「目的変数」(店舗売上)の平均点の順位に応じて(評価の高いものを高得点とする)「鉄道交通」の複合変数が作成される。
同じく、因子「交通」の要素「道路」の特徴「種類」では、既存店舗の「前面道路」と「周辺道路」の道路の種類に注目し、「高速道路」・「国道」・「都道府県道」・「シンボル市道」・「市区町村道」・「一般道路」に対し、例えば「高速道路」+「国道」のように、どのような組み合わせで構成されているかを検討する。既存店舗に対し、道路の「種類」の典型的な組み合わせが確立されたならば、「目的変数」(店舗売上)の平均点の順位に応じて(評価の高いものを高得点とする)「道路交通」の複合変数が作成される。
なお、鉄道と道路を合わせた「交通」の複合変数を作るには、駅から500m圏内は「鉄道交通」、500m圏外は「道路交通」とし、鉄道と道路の各典型的組み合わせをすべて合わせて、「目的変数」(店舗売上)の平均値を順位付け、評価の高いものを高得点とすることで、「交通」の複合変数が作成される。
売上予測モデルを特定化するとき、「機械学習手法」と「統計学的手法」のいずれの手法が利用されても、変数(特徴量)間のデータの取りうる範囲(スケール)を揃えるため、「正規化」と「標準化」といった「特徴量スケーリング」を行うことが必要な場合がある。その時は、例えば、変数ごとに、シャピロ・ウィルク検定を用いて、そのデータの正規性を検定する。データの正規性の仮説が棄却された場合は、右裾が長い正の非対称のときはデータを対数変換し、左裾が長い負の非対称のときはデータをべき乗変換する。こうしてデータが正規性を有するようになったならば、更に平均が0、標準偏差が1となるように「標準化」する。
判定部121bによって、都心、市街地、あるいは、郊外に、それぞれ300店舗程度の既存店舗が判定された場合では、「機械学習手法」により売上予測の回帰モデルが特定化される。機械学習に用いられる機械学習アルゴリズムは、特に限定されるものではないが、例えば、決定木(勾配ブースティング及びランダムフォレストを含む)、サポートベクターマシン、ニューラルネットワーク等が挙げられるが、これらに限られるものではない。
機械学習により生成される売上予測モデルの採用基準は、任意であるが、売上予測値の「平均絶対誤差(MAE)」が平均売上実績値の10%以内であるとか、「決定係数」が7割を超えるとか、あるいは、「テスト店舗」の80%に対し、売上実績値の±20%以内に入る売上予測値が得られるような精度であってよい。
図14は、本実施形態に係る売上予測システムの「機械学習手法」による、売上予測モデルの特定化の一例を示す。機械学習アルゴリズムは、勾配ブースティングを用い、市街地の305店舗に対し、20変数のデータを投入し、売上予測モデルを特定化した。20変数については、小売企業との業務契約上の守秘義務のため、具体的な変数名を示すことはできないが、20変数のうち、図11に示された変数をそのまま利用したのが12変数、「総需要量」を含め複合変数のような「特徴量エンジニアリング」を行ったのが8変数である。「決定係数」は、「訓練店舗」に対しては0.971、「テスト店舗」に対しては0.707となり、売上の7割程度と説明力の高い売上予測モデルが生成できたことを示す。図14のグラフは、横軸に売上実績値、縦軸に売上予測値をとり、「テスト店舗」をプロットしている。直線は、売上予測値=売上実績値を表わし、それを中心に売上予測値がおおむね分布していることが読み取れる。
売上予測モデルの特定化で用いた説明変数を、5つの因子にまとめると、供給が31%、店舗が24%、交通が22%で、この3因子で5因子全体の説明力の77%を説明する売上予測モデルであることが判明する。なお、店舗の売上は、立地で7割が決定されるといわれ、小売業は立地産業と一般によばれている。この予測結果は、店舗の24%を除く、残りの4因子(いわゆる立地因子)で76%を説明していることから、一般的常識とも一致している。
「機械学習手法」による回帰モデルは、高精度な予測を可能とする一方で、入出力の関係が分かりづらい(ブラックボックスである)という「解釈性の問題」を抱えている。店舗の立地評価やマーケティングでは、ユーザは、予測結果を経営決定に利用する場合が多いため、説明責任も生じ得る。一般に、予測精度と解釈性との間には、トレードオフの関係が見られ、どちらに重点を置くかは、解くべきタスクによって変わる。そこで、本実施形態に係る売上予測モデル特定化部122bでは、予測結果に至るプロセスが説明可能なXAI(Explainable AI:説明可能なAI)のモデルを採用してもよい。これにより、本実施形態に係る店舗売上予測部12は、「高精度予測」と「解釈性に重きを置いた予測」を選択することが可能となる。例えば、入出力の複雑な関係を要約する手法のPDP(Partial Dependence Plot)を用いるならば、興味ある変数に対しそれ以外の変数の影響を周辺化して消すことで、興味ある変数の入出力の関係を単純化することができる。また、ブラックボックスから予測を分解し、各変数の寄与度を示すBreakDownを用いるなど、ほかのXAIモデルであってもよい。
1千店舗から成る店舗網を有する大手小売企業に比べ、多くの小売企業では、都心、市街地、あるいは、郊外として100店程度しか「サンプル店舗」(既存店舗)が得られないことが多い。その場合は、「統計学的手法」により売上予測回帰モデルの特定化を行う。「統計学的手法」の回帰分析では、説明変数の数は、サンプル店舗数の1/10程度しか取れないことが知られている(Peduzzi, et al., 1995. Importance of events per independent variable in proportional hazards regression analysis II. Accuracy and precision of regression estimates. Journal of Clinical Epidemiology, 48(12), 1503-1510.)。したがって、例えば、都心で100程度のサンプル店舗しか判定できない場合では、その売上予測モデルの説明変数の数は10変数程度となり、変数を絞りこむことが必要である。
多数の変数の中から、有用な変数を選択する方法として、「変数選択法」がある。回帰モデルでは、説明変数を増やすほど目的変数に対する説明力は上がり、「決定係数」が大きな値となる。これは、説明変数間で相関関係が高いときに起り、「多重共線性」とよばれ、回帰係数の推定を不安定にする。そこで、例えば、「変数選択法」の1つである「変数減少法」を用いて、最初に全説明変数を回帰モデルに取り込み、取り込まれた説明変数間で「多重共線性」の疑いのある変数を探して外す。
更に、回帰モデルの各変数に対し、「統計学的手法」で最小二乗法により回帰モデルの回帰係数を求めたとき、統計的有意性を表す指標として、t検定統計量の「t値」と、t値の絶対値のパーセント表示(P値の1=100%)の「P値」が得られる。「t値」の絶対値が2以上、「P値」が0.05以下のとき、統計的に意味のある回帰係数が得られた(その回帰係数の値が「ゼロであるとは言えない」)という意味で、回帰モデルの説明変数として残される。因果モデルとして回帰式を使用する場合は、上記の統計的有意性を厳守する必要があるが、予測モデルの場合は、統計的厳密性を緩める場合も認められるので、有意水準に対応する「t値」(及び「P値」)の臨界値(上記の2や0.05)を参考にして、「サンプル店舗」数の10分の1程度の変数とその回帰係数を組み込んだ回帰モデルの特定化が、売上予測モデル特定化部122bの「統計学的手法」で行われる。
本実施形態に係る売上予測部123は、売上予測モデル生成部122により、「機械学習手法」及び「統計的手法」により回帰モデルとして生成された売上予測モデルを含んでおり、当該売上予測モデルを用いて、対象店舗(用地や居抜き店舗など出店候補物件)の売上予測値を出力する。
売上予測部123は、売上予測を行う対象店舗数を限定しないが、以下では1店舗で説明する。すでに、既存店舗によって売上予測回帰モデルは特定化されているので、ユーザは、対象店舗1店舗に対する説明変数のデータを収集し、サーバ装置10に保存されている図15の右図の入力フォームに、インターネット等の所定の通信ネットワークNを介して、ユーザ端末20からアクセスし、説明変数データを入力するとともに送信する。図15の右図は、対象店舗(出店候補物件)の説明変数データの入力フォームの一例を示している。入力フォームに示されている変数は、売上予測モデルの説明変数を少なくとも含んでいなければならないが、説明変数よりも多くてもよい。
ユーザは、説明変数のデータを、入力フォームのボックスに半角の数値で入力し、チェックボックスには選択するボックスにチェックを入れ、都道府県名は、1つを選択する。売上予測を行う対象店舗の経度及び緯度の入力は、その立地点の経度及び緯度を調べなければならない。地点の経度及び緯度を調べるには、例えば、Google Map上で店舗立地点にマウスを当てると、35.7107286,139.7140038のようなWGS84座標系の緯度及び経度がウィンドウに表示され、コピーされる。この経度及び緯度を、弊社のHPの入力フォームにある「緯度」と「経度」のボックスで入力する(貼り付ける)。
図15の入力フォームにおいて、ユーザが「感染症」にチェックを入れたこと等に応じて、売上予測モデルの因子「需要」の要素「従業者」の特徴「規模」に対する変数「一定距離圏内の小売・飲食従業者を除く従業者数」の値に、感染症の影響度(例えば、「1-在宅勤務率」)を乗じて、感染症の影響を考慮もよい。また、店舗立地点を中心とした500m圏に対する、感染症発生前後の携帯電話通話量の変化率を乗じて、感染症の影響を考慮もよい。
図15の入力フォームにおいて、ユーザが「人口減少」にチェックを入れたこと等に応じて、売上予測モデルの因子「需要」の要素「居住者」の特徴「規模」に対する変数の値として、国勢調査DB113bから将来予測人口(例えば、5年後人口等)の値を読み込み、「一定距離圏内の常住人口数」の代わりに用いて、人口変化の影響を考慮もよい。
図15の右図の入力フォームにおいて、ユーザが「自然災害」にチェックを入れたこと等に応じて、地理情報DB113fから水害のハザードマップを読み込み、判定部121bで、対象店舗が浸水地域の可能性の高い地区に立地しているかを判定してもよい。
図15の入力フォームにすべての説明変数のデータが入力し終わったならば、「送信」をクリックする。インターネット等の所定の通信ネットワークNを介して送信された対象店舗の説明変数データは、コンピュータ500の記憶装置505に記憶される。対象店舗の売上予測値は、記憶されている対象店舗の説明変数データをメモリ503に読み込み、売上予測部123において地理ビジネス環境の属性に応じた「売上予測モデル」を実行することで算出される。
(2-3)ユーザ端末20の機能構成
図16は、本実施形態に係るユーザ端末20の機能構成を示すブロック図の一例である。ユーザ端末20は、例えば、1台又は複数台のコンピュータ500によって構成される。ユーザ端末20は、例えば、パーソナルコンピュータ(PC)、携帯電話(スマートフォンやフィーチャーフォン等)、及びタブレット端末等の情報処理装置である。ユーザ端末20は、例えば、操作受付部21と、送受信部22と、出力部23とを有する。
操作受付部21は、ユーザによる入力I/F部507を介した操作を受け付ける。例えば、操作受付部21は、売上予測モデルを生成するための学習データ(各既存店舗についての売上実績値及び所定の変数データ)の入力を受け付ける。また、例えば、操作受付部21は、売上予測の対象となる店舗(対象店舗)の各種の変数データの入力を受け付ける。
送受信部22は、他の情報処理装置との間で、通信ネットワークを介した情報の送信及び/又は受信を行う。送受信部22は、例えば、ユーザが入力した、売上予測モデルを生成するための学習データ(各既存店舗についての売上実績値及び所定の変数データ)をサーバ装置10に送信する。また、送受信部22は、例えば、ユーザが入力した、売上予測の対象店舗に関する各種の変数データをサーバ装置10に送信する。また、送受信部22は、例えば、売上予測モデルにより出力された対象店舗の売上予測値等をサーバ装置10から受信する。
出力部23は、表示データに基づいて、各種の画面や情報をユーザ端末20の表示装置513に表示させる。出力部23は、例えば、既存店舗の売上実績値及び所定の変数データ等を入力するための入力画面を表示装置513に表示させる。また、出力部23は、例えば、サーバ装置10から受信した対象店舗の売上予測値を含む出力画面を表示装置513に表示させる。
(3)動作
(3-1)売上予測モデル生成処理
図17は、本実施形態に係る情報処理システム1による売上予測モデル生成処理の一例を示す動作シーケンスである。
(S101)
まず、ユーザ端末20の操作受付部21は、売上予測モデルを生成するための学習データの入力を受け付ける。具体的には、ユーザが、各既存店舗についての売上実績値及び所定の変数データをユーザ端末20に対して入力すると、ユーザ端末20は、当該入力を受け付ける。ユーザが入力する当該変数は、例えば、図11において入力方法が「ユーザ入力」として規定されている「テーブル数」、「営業時間」、「店舗が見えるか」、「立地階数」、「入居ビルの種類」、「前面道路の種類」、「都道府県名」、及び「河川の有無」等を含んでよい。なお、ユーザによる入力操作の代わりに、表4のように、予め所定の記憶部に記憶された各既存店舗についての売上実績値及び所定の変数データが呼び出されてもよい。
(S102)
次に、ユーザ端末20の送受信部22は、上記したステップS101において入力され又は呼び出された各既存店舗についての売上実績値及び所定の変数データをサーバ装置10に送信する。
(S103)
次に、サーバ装置10の地域メッシュ統計値・地理情報取得部11は、ユーザ端末20から受信した各既存店舗についての売上実績値及び所定の変数データに基づいて、地域メッシュ統計値を取得する。具体的には、まず、地域メッシュ統計値・地理情報取得部11のコード取得部111が、受信データに含まれる各既存店舗の店舗立地点の情報(経度及び緯度)に基づいて、各既存店舗の店舗立地点地域メッシュコードと、周辺地域メッシュコードとを取得する。そして、統計値・地理情報取得部112が、店舗立地点地域メッシュコード及び周辺地域メッシュコードに対応付けられた各種の地域メッシュ統計値を取得するとともに、駅統計値及び地理情報も統計値・地理情報DB群113から取得する。
(S104)
次に、店舗売上予測部12の前処理部121は、ユーザ端末20から取得された各既存店舗についての売上実績値及び所定の変数データ、及び地域メッシュ統計値・地理情報取得部11により取得された地域メッシュ統計値、駅統計値及び地理情報に基づいて、所定の前処理を実行する。例えば、判定部121bは、各既存店舗の「地理ビジネス環境」を判定する。また、判定部121bは、各既存店舗が立地する「商業集積地の階層水準」を判定する。また、例えば、配分・集計部121cは、各既存店舗についての「周辺の商業集積規模」、「居住者数」、「事業所従業者数」、「普通券降車人数」、及び「駅構外乗換駅の乗換人数」それぞれの値を自動集計する。更に、配分・集計部121cは、一定距離圏内に競合店舗がある場合は、競合モデルを用いて、「周辺の商業集積規模」、「居住者数」、「事業所従業者数」、「普通券降車人数」、及び「駅構外乗換駅の乗換人数」それぞれの値を配分処理後に自動集計する。また、距離測定部121aは、各既存店舗についての「一定圏内の自社競合店舗数」、「一定圏内の他社競合店舗数」、「公園の有無」、及び「最寄駅からの距離」等を自動カウントあるいは測定する。これら変数の値は、各既存店舗の学習データに含められる。
また、ステップS104において、売上予測モデル特定化部122bは、ある変数の値に応じて、他の説明変数を選定してもよい。例えば、本実施形態に係る売上予測モデルでは、売上予測モデル特定化部122bは、変数「地理ビジネス環境」の属性に応じて、他の変数を選定してもよい。より具体的には、例えば、売上予測モデル特定化部122bは、「地理ビジネス環境」の属性が「都心」の場合、売上予測モデルにおける因子「需要」の説明変数については、「居住者数」及び「従業者数」の両方を含めてもよい。その一方で、売上予測モデル特定化部122bは、「地理ビジネス環境」の属性が「郊外」の場合、売上予測モデルにおける因子「需要」の説明変数については、「居住者数」のみを含めて、「従業者数」を含めないようにしてもよい。
また、例えば、売上予測モデル特定化部122bは、「地理ビジネス環境」の属性が「都心」、及び「市街地」の場合、売上予測モデルにおける因子「交通」の説明変数については、要素「鉄道交通」の説明変数である「最寄駅からの距離」のみを含めて、要素「道路交通」の説明変数である「道路の種類」は含めなくてもよい。その一方で、「地理ビジネス環境」の属性が「郊外」の場合、売上予測モデルにおける因子「交通」の説明変数については、要素「道路交通」の説明変数である「道路の種類」を含めて、要素「鉄道交通」の説明変数である「最寄駅からの距離」は含めなくてもよい。
本実施形態に係る売上予測モデルでは、ある変数の値に応じて、他の変数の値を算出する基礎となる地域メッシュ統計の地域メッシュの大きさや、地域メッシュ統計値の集計規模を変更してもよい。例えば、本実施形態に係る売上予測モデルでは、「地理ビジネス環境」の属性に応じて、地域メッシュ統計値・地理情報取得部11が取得する地域メッシュ統計の地域メッシュの大きさを、500m地域メッシュから1km地域メッシュに変更してもよい。また、例えば、本実施形態に係る売上予測モデルでは、「地理ビジネス環境」の属性に応じて、店舗売上予測部12の配分・集計部121cが実行する空間集計処理の基礎となる集計領域の大きさ(例えば、図5に示す集計領域の円Cの半径r)を変更してもよい。
より具体的には、例えば、「地理ビジネス環境」の属性が「都心」、及び「市街地」の場合、地域メッシュ統計値・地理情報取得部11が取得する地域メッシュ統計値の地域メッシュの大きさは500m地域メッシュであり、また、空間集計処理の基礎となる集計領域の大きさは500m圏(店舗立地点を中心とする半径約500m内の範囲)であってよい。また、例えば、「地理ビジネス環境」の属性が「郊外」の場合、地域メッシュ統計値・地理情報取得部11が取得する地域メッシュ統計値の地域メッシュの大きさは1km地域メッシュであり、また、空間集計処理の基礎となる集計領域の大きさは2km圏(店舗立地点を中心とする半径約2km内の範囲)であってよい。
都心・市街地と郊外の交通手段の相違は、集客地域の空間スケールに影響することから、本実施形態に係る売上予測モデルでは、このように地理的事象の空間的広がりに応じた地域メッシュの可変化を採用している。売上予測モデルの高精度化は、店舗の立地点の地理ビジネス環境を判定し、分析や予測で取り上げる店舗、変数、及び分析する空間スケールを柔軟に変更することによって達成される。
(S105)
次に、店舗売上予測部12の売上予測モデル生成部122は、上記した各既存店舗についての売上実績値と所定の変数データ及び自動処理で作成された説明変数データに基づいて、例えば既存店舗数が100店舗程度の場合は「統計的手法」を、既存店舗数が300店舗以上の場合は「機械学習手法」を用いて回帰分析を実行し、売上予測モデルを生成する。生成された売上予測モデルは、店舗売上予測部12の売上予測部123に含められる。「機械学習手法」で用いられる機械学習アルゴリズムは、特に限定されるものではないが、例えば、決定木(勾配ブースティング及びランダムフォレストを含む)、サポートベクターマシン、ニューラルネットワーク、説明可能なAI等が挙げられるが、これらに限られるものではない。「機械学習手法」により生成される売上予測モデルの採用基準は、任意であるが、例えば、「テスト店舗」に対する売上予測値が売上実績値の±10%以内の精度であることや、決定係数が7割を超えることであってよい。以上で、売上予測モデルの生成処理が終了する。
(3-2)売上予測処理
図18は、本実施形態に係る情報処理システム1による売上予測処理に係る動作シーケンスの一例を示す図である。なお、前出の図15の左図による入力フォームで、対象店舗の経度及び緯度のデータをサーバ装置10に送信し、ユーザ端末20の送受信部22は、対象店舗の地理ビジネス環境の判定結果をすでに受信しているという前提の下で、売上予測処理を説明する。
(S201)
まず、ユーザ端末20の出力部23が入力画面を表示した状態において、ユーザが対象店舗の地理ビジネス環境判定結果を参照し、地理ビジネス環境に応じた入力フォームを用いて対象店舗に関する各種の説明変数に係るデータ等を入力すると、ユーザ端末20の操作受付部21は当該変数データの入力を受け付ける。図15の右図は、本実施形態に係る対象店舗に関する各種の説明変数に係るデータの入力画面の一例を示す図である。図15の右図に示す入力画面では、一例として、店舗立地点の経度及び緯度、予定している店舗のテーブル数、営業時間、営業日数、入居ビルの種類、都道府県名の選択、影響の考慮(感染症、人口減少、自然災害)の項目のデータが入力可能となっている。これらの項目は、上記した「売上予測モデル」の説明変数と説明変数を作成するためのデータに相当する。
(S202)
次に、ユーザ端末20の送受信部22は、ステップS201において入力された対象店舗に関する各種の説明変数に係る変数データを、サーバ装置10に送信する。
(S203)
次に、サーバ装置10の地域メッシュ統計値・地理情報取得部11は、ユーザ端末20から受信した対象店舗に関する各種の説明変数に係るデータのほかに、対象店舗立地点の経度及び緯度を示す情報に基づいて、地域メッシュ統計値、駅統計値及び各種地理情報を取得する。具体的には、まず、地域メッシュ統計値・地理情報取得部11のコード取得部111が、対象店舗立地点の経度及び緯度を示す情報に基づいて、対象店舗の店舗立地点地域メッシュコードと、周辺地域メッシュコードとを取得する。そして、統計値・地理情報取得部112が、店舗立地点地域メッシュコード及び周辺地域メッシュコードに対応付けられた各種の地域メッシュ統計値を取得するとともに、駅統計値及び地理情報を統計値・地理情報DB群113から取得する。
(S204)
次に、店舗売上予測部12の前処理部121は、ユーザ端末20から取得された対象店舗に関する各種の説明変数に係るデータ、及び地域メッシュ統計値・地理情報取得部11により取得された各種の地域メッシュ統計値、駅統計値及び地理情報に基づいて、所定の前処理を実行する。例えば、判定部121bは、対象店舗立地点の「商業集積地の階層水準」を判定する。また、例えば、配分・集計部121cは、対象店舗についての「周辺の商業集積規模」、「居住者数」、「事業所従業者数」、「普通券降車人数」、及び「駅構外乗換駅の乗換人数」のそれぞれの値を自動集計する。更に、配分・集計部121cは、一定距離圏内に競合店舗がある場合は、競合モデルを用いて、「周辺の商業集積規模」、「居住者数」、「事業所従業者数」、「普通券降車人数」、及び「駅構外乗換駅の乗換人数」それぞれの値を配分処理後に自動集計する。また、例えば、距離測定部121aは、対象店舗についての「一定圏内の自社競合店舗数」、「一定圏内の他社競合店舗数」、及び「最寄駅からの距離」等を自動カウントあるいは測定する。
(S205)
売上予測部123は、前記のステップで判定された「地理ビジネス環境」に応じた「売上予測モデル」に対して、ステップS203で取得した対象店舗に関する各種の説明変数に係るデータと、ステップS204の前処理(距離測定処理、判定処理、及び配分・集計処理)によって得られた説明変数データとを、入力することにより、対象店舗の売上予測値を出力する。
(S206)
売上予測部123は、出力した対象店舗の売上予測値を、ユーザ端末20に送信する。なお、サーバ装置10は、対象店舗の売上予測値に限らず、地域メッシュ統計値・地理情報取得部11により取得された各種の地域メッシュ統計値と駅統計値及び地理情報、店舗売上予測部12が算出した各種の変数データや決定係数などの統計量を、ユーザ端末20に送信してもよい。
(S207)
ユーザ端末20の送受信部22が、サーバ装置10から対象店舗の売上予測値を受信すると、ユーザ端末20の出力部23は、受信した対象店舗の売上予測値を表示装置513に表示する。また、出力部23は、地域メッシュ統計値・地理情報取得部11により取得された各種の地域メッシュ統計値と駅統計値及び地理情報、店舗売上予測部12が算出した各種の変数のデータや統計量を、表示装置513に表示してもよい。以上で、売上予測処理が終了する。図19は、ユーザ端末20に送信される売上予測結果のフォーム(画面)の一例を示している。まず、対象店舗は都心2に立地し、「都心」の「売上予測モデル」により、売上予測値6百6拾万円/月が算出された。このように対象店舗の売上予測値のほかに、売上予測モデルへの説明変数データと調整済み決定係数(0.657)で構成される。需要に関わる4変数に関しては、この立地点の周辺では、人口は3千人と少なく、従業者数も1.2万人とそれほど多くないが、普通券降車人数は28万人で、駅構外乗換駅の乗換人数が8万人に達することがわかる。本実施形態に係る売上予測結果の画面には、既存店舗の売上実績値の任意の分布(例えば、図19に示す度数分布を含む)や、当該分布において対象店舗の売上予測値がどこに位置するかを示す情報(例えば、図19に示す縦軸に平行な直線)などが含まれてもよい。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその条件等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
第一の課題に対する手段としては、本発明の一態様に係る情報処理装置に、地域メッシュ統計値と駅統計値及び地理情報を取得する地域メッシュ統計値・地理情報取得部と、データ処理に対応する前処理部を設けることで、地域メッシュ統計に対する位置を同定し、分散しているデータを一元管理するとともに、データの自動取得と自動処理・分析を行い、膨大なデータの処理・分析を可能にする。第二の課題に対しては、商業統計・国勢調査・経済センサスから取得された商業・人口・従業者の地域メッシュ統計値を保存する統計値DBと、駅及び道路に関する多種類の統計値を保存する駅DB及び道路DB、店舗・大型施設・公園など位置に関連付けられた属性データを保存する地理情報DBで構成されるDB群を構築する。第三の課題については、変数データ取得部において、売上に影響する変数群を、需要、供給、競合と集積、交通、地理の5つの因子にまとめ、因子-要素-特徴-変数という形式で体系化することを試みた。第四の課題に対しては、前処理部の中に、予測を行う対象店舗と、競合店舗、交通の中心となる駅、店舗利用を阻害する河川や公園(バリア)などとの間の距離を測定する距離測定部を設けるとともに、対象店舗や駅周辺に設けた補間点に、地域メッシュ統計値や駅統計値を割り当て、対象店舗との距離に応じて配分・集計する配分・集計部を設けることで、売上予測モデルに投入する変数に距離の影響を反映させる。第五の課題は、対象店舗の立地点に対して、都心・市街地・郊外といった地理ビジネス環境を判定する判定部を設け、その判定結果に応じて、取り込まれる変数とデータの集計領域を可変させる売上予測モデルを生成することで解決される。
本発明の一態様に係る情報処理装置によって、第一に、店舗売上予測システムは、多種類の地域メッシュ統計値、駅統計値、地理情報を自動取得できるようになる。第二に、店舗売上予測システムは、自動取得されたデータから、都心・市街地・郊外を自動判定し、判定結果に基づいて、売上予測モデルに投入する5因子の要素を限定することができるようになる。第三に、店舗売上予測システムは、限定された因子の要素に対して、距離の影響を考慮してさまざまな特徴の説明変数データを自動作成できるようになる。これらの説明変数の中から、売上を最も良く説明する変数の組み合わせを探索することで、精度の高い売上予測モデルが特定化される。これらの発明の効果は、店舗売上予測の自動化と精度向上を可能とさせる情報処理装置、情報処理方法、及びプログラムを提供することができるようになる。
本実施形態に係る判定部121bは、店舗立地点の「地理ビジネス環境」や「商業集積地の階層水準」を判定するとともに、店舗立地点がどのような「用途地域」や「自然災害地域」に入るかを判定する。
本実施形態に係る店舗売上予測部12では、表2に示すように、「地理ビジネス環境」の属性の判定結果に応じて、売上予測モデルを構成する5つの因子に対し、取り上げる要素が異なる。「交通」因子については、「都心」及び「市街地」では、「鉄道」が取り上げられるが、「郊外」では車による「道路」交通になる。この「交通」因子の要素の相違は、「需要」因子に影響し、「都心」では主な要素(需要発生源)は「従業者(都心への通勤者)」であり、次いで「鉄道利用者」になる。それに対し、「市街地」では、「鉄道利用者」の比重は下がり、主な要素は、「従業者」と「居住者」になる。「郊外」では「従業者」の比重が下がり、主に「居住者」になる。「供給」因子は、店舗の立地場所であり、「都心」では「商業ビル」、「市街地」では「商業ビル」と「ショッピングセンター(SC)」、「郊外」では「ショッピングセンター(SC)」と「単独店」が典型的である。このように「地理ビジネス環境」の属性の判定結果は、売上予測モデルを構成する要素を変えるので、当然、売上予測モデルに投入する変数も異なる。例えば、売上予測モデルにおいて、「交通」という因子に対し、都心や市街地では、「鉄道」という要素についての駅への距離という変数を投入するが、郊外では、「道路」という要素について交通量の多い交差点への距離という変数になる。
本実施形態に係る配分・集計部121cで配分・集計処理され、一定距離圏内の統計値として駅統計値を集計するには、まず、ユーザによる店舗の経度及び緯度の入力によって、本実施形態に係る地理情報DB113fから駅中心点(駅プラットフォームの中心点)の経度及び緯度が読み込まれ、距離測定部121aにより店舗と駅中心点間の距離が測定される。店舗から一定距離圏(例えば500m圏)内の駅に対しては、大都市交通センサスDB113dから、例えば、その駅の普通券降車人数が読み込まれる。更に、配分・集計部121cにおいて、該当の駅中心点を中心に、駅統計値の「集計領域」として、独自の「駅メッシュ」を生成する。一例として、図9では、該当の駅中心点を中心に生成した「500m駅メッシュ」を示している。この「500m駅メッシュ」は、総務庁管轄下にある500m地域メッシュとは、大きさは同じであるが、カバーする範囲が異なることから、「500m地域メッシュ」とはよばない。駅統計値の「集計領域」は、「駅メッシュ」で構成される。駅メッシュの寸法は、500mに限らず、任意の値であってもよい。また、駅メッシュの形状は、矩形に限らず、円形や他の任意の形状であってもよい。
なお、駅統計値に対する本実施形態に係る配分・集計部121cが実行する配分集計処理が、前出の地域メッシュ統計値の処理と異なる点は、店舗から一定距離圏(例えば500m圏)内に複数の駅(又は路線のプラットホーム中心点)が入る場合である。図10の駅の例では、1つの駅に対し5つの路線の鉄道事業者が営業している。普通券降車人数や駅構外乗換駅の乗換人数といった路線ごとの駅統計値には、位置情報として、図10に示すように、各路線の線セグメントで表示されるプラットホームの中心点の経度及び緯度が付与される。図10は、店舗から例えば500m圏内に,2つの路線(の駅プラットホームの中心点)が入る例を示している。そして、各路線の線セグメントで表示されるプラットホームの中心点に対し、例えば「500m駅メッシュ」を生成し、その内部に10×10等の「補間点」を設ける。補間点には路線ごとの駅統計値が割り当てられ、例えば補間点が店舗の500m圏に含まれると判定された場合、割り当てられた各路線の駅統計値は、店舗の集計値に含められる。なお、路線を駅と読み替えて、店舗から一定距離圏に同一鉄道事業者の複数の駅が入る場合でも同じである。このように配分・集計部121cは、集計領域内に複数の鉄道事業者それぞれが営業する複数の駅が含まれる場合や、同一鉄道事業者の複数の駅が入る場合、各鉄道事業者及び各駅について配分集計処理を実行し、配分値を集計してもよい。
本実施形態に係る配分・集計部121cが実行するそのほかの処理には、一定距離圏内の店舗や施設の「立地点数の自動カウント」がある。ユーザによる店舗の経度及び緯度の入力によって、本実施形態に係る地理情報DB113fから、例えば、自社の既存店舗の経度及び緯度が読み込まれ、距離測定部121aで店舗と自社店舗間の距離を測定し、一定距離圏内の自社店舗数をカウントして、変数「一定距離圏内の自社店舗数」が自動集計される。同じように、本実施形態に係る地理情報DB113fから施設データを読み取り、距離測定部121aと配分・集計部121cのカウント処理という過程を経て作成される変数データは、「一定距離圏内の他社店舗数」、「一定距離圏内のインターチェンジの有無」、「公園の有無」などが挙げられる。
因子「需要」の要素「一時通行者」は、店舗立地点を中心とした一定距離圏内の商業集積地・業務地・観光地の需要であり、一時的に訪れる買物客・業務地(ビジネス)訪問者・観光客等を発生源とする需要を捉える。要素「一時通行者」は、「買物客」・「事業所訪問者」・「駅構外乗換駅乗換人員」・「観光客」などさまざまな特徴を持ち、それぞれの変数で計測される。図11に示す例では、「一時通行者」を発生源とする需要を、駅に係る2つの変数で計測する。第一は、「一定距離圏(例えば都心では500m圏)内の駅の普通券降車人数」という変数である。普通券降車人数を取り上げたのは、買物・業務地訪問・観光などの一時的訪問は、都心では鉄道の普通券で乗車し、目的地(店舗立地点の最寄駅)で降車した場合、それを捉えればよいと考えたからである。都心で距離圏を500m圏としたのは、都心では駅密度が1km2当たり1駅と高いことから、一時通行者の歩行距離の上限が500m程度になると考えたからである。
因子「交通」の要素「道路」の特徴「近接性」は、店舗立地点の前面道路と周辺道路でのアクセスを示す変数である。例えば、「中央分離帯の有無」、「駐車場への直接イン」、一方通行、(法規上・構造上)右折禁止等が含まれてもよい。同じく、要素「道路」の特徴「結節性」は、「一定距離圏内のインターチェンジの有無」や「主要交差点の有無」が含まれるが、これらに限られるものでもない。
変数データ取得部122aでは、売上予測モデルの「目的変数」となる既存店舗の「売上」データと、「説明変数」の選定対象となる変数が、前出の自動処理とユーザによる送信によって取得される。売上予測モデルの特定化のため、既存店舗に対して「目的変数」と「説明変数」の選定対象となるデータが準備されたことになる。
それに対し、企業が有する既存店舗のうち、判定部121bによって、地理ビジネス環境が、都心、市街地、あるいは、郊外として、それぞれ100店舗程度しか判定されない場合は、「機械学習手法」を実行するのに十分な「サンプル店舗」がないとみなし、売上予測モデル特定化部122bにより「機械学習手法」ではなく「統計学的手法」が採用されてもよく、この場合、都心、市街地、あるいは、郊外に対し、「統計学的手法」を用いた回帰モデルが特定化されてもよい。このことから、本実施形態に係る店舗売上予測システムの第七の特徴は、地理ビジネス環境ごとにユーザが所有する既存店舗数に応じて、「機械学習手法」と「統計学的手法」とを使い分けて、売上予測モデルを生成し、売上予測値を求める点である。なお、「機械学習手法」と「統計学的手法」のいずれを採用するかの基準としての既存店舗数は、特に限定されず、100店舗、200店舗、300店舗等や、これら未満やこれら以上であってもよい。
より具体的には、例えば、「地理ビジネス環境」の属性が「都心」、及び「市街地」の場合、地域メッシュ統計値・地理情報取得部11が取得する地域メッシュ統計値の地域メッシュの大きさは500m地域メッシュであり、また、空間集計処理の基礎となる集計領域の大きさは500m圏(店舗立地点を中心とする半径約500mの範囲)であってよい。また、例えば、「地理ビジネス環境」の属性が「郊外」の場合、地域メッシュ統計値・地理情報取得部11が取得する地域メッシュ統計値の地域メッシュの大きさは1km地域メッシュであり、また、空間集計処理の基礎となる集計領域の大きさは2km圏(店舗立地点を中心とする半径約2kmの範囲)であってよい。
1…情報処理システム、10…サーバ装置、11…地域メッシュ統計値・地理情報取得部、111…コード取得部、112…統計値・地理情報取得部、113…統計値・地理情報DB群、113a…商業統計DB、113b…国勢調査DB、113c…経済センサスDB、113d…大都市交通センサスDB、113e…道路交通センサスDB、113f…地理情報DB、12…店舗売上予測部、121…前処理部、121a…距離測定部、121b…判定部、121c…配分・集計部、122…売上予測モデル生成部、122a…変数データ取得部、122b…売上予測モデル特定化部、123…売上予測部、500…コンピュータ、501…プロセッサ、503…メモリ、505…記憶装置、507…入力I/F部、509…データI/F部、511…通信I/F部、513…表示装置