JP7120649B2 - 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム - Google Patents

情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム Download PDF

Info

Publication number
JP7120649B2
JP7120649B2 JP2019516773A JP2019516773A JP7120649B2 JP 7120649 B2 JP7120649 B2 JP 7120649B2 JP 2019516773 A JP2019516773 A JP 2019516773A JP 2019516773 A JP2019516773 A JP 2019516773A JP 7120649 B2 JP7120649 B2 JP 7120649B2
Authority
JP
Japan
Prior art keywords
prediction model
prediction
variables
classification
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019516773A
Other languages
English (en)
Other versions
JPWO2018207259A1 (ja
Inventor
洋介 本橋
寛樹 中谷
晃 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018207259A1 publication Critical patent/JPWO2018207259A1/ja
Application granted granted Critical
Publication of JP7120649B2 publication Critical patent/JP7120649B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、予測対象に寄与し得る要因を分析するために用いられる情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラムに関する。
大量の実績データに基づいて様々な分析を行う方法が知られている。POS(Point of sale )データは、各店舗の売上実績を表わすデータの一例である。例えば、全国に1000店舗の小売店を展開する企業が、1店舗あたり2000種類の商品の売上数量を月ごとに集計している場合、このPOSデータの数は、1年で、1,000(店舗)×12(月/年)×2,000(種類/月・店舗)=24,000,000になる。
このようなPOSデータを分析する方法として、例えば、EXCEL(登録商標)のピボットテーブルのような機能を有する集計ツールを利用する方法が挙げられる。ユーザがこのような集計ツールにPOSデータを読み込ませることで、商品の売上数を、店舗ごと、季節ごと、商品ごとなど、様々な観点で集計でき、ミクロな観点からマクロな観点まで、売上に寄与した要因を自由に分析することが可能になる。
他にも、このような統計に特化したソフトウェアの例として、Tableau(登録商標)や、SAS(登録商標)、SPSS(登録商標)などが知られている。
また、特許文献1には、店舗内に設定されている防犯カメラ、 複合機等を活用して、着目商品の売上げが伸びない店舗と伸びている店舗を比較し、売れない原因を分析可能な販売分析システムが開示されている。
特許文献2には、調達、引当、営業、不良、生産、販売等の、各業務の指標を特定する指標が、問題解決対象になっている指標「売上」に対して与える影響を特定する技術が開示されている。
特許文献3には、店商品分類別の売上数予測を計算する売上数計算式作成処理と、店商品別の各種コーザル実績と各種コーザル予定から今後の売上数予測値を計算する振替指示用売上数計算処理とが開示されている。これらの処理には、売上データベースに累積した過去の売上実績データと、コーザルデータベースに累積した販売に影響を与える特売の有無、天候、気温、イベントの有無、チラシの有無といった過去のコーザル実績データとが用いられる。また、特許文献3には、今後の売上数予測値を店舗間の商品の振替に利用することが開示されている。
特開2007-179199号公報 特開2011-008375号公報 特開2014-026483号公報
上述するいずれの特許文献にも、予測モデルを要因分析の目的で用いることは記載されていない。さらに、上述する特許文献には、予測モデルが大量に存在する場合に、これらの予測モデルを用いて使い勝手良く要因分析を実行できることについての開示もない。
そこで、本発明は、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量に存在する場合であっても、これらの予測モデルを用いて使い勝手良く要因分析を実行できる情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラムを提供することを目的とする。
本発明による情報処理システムは、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを複数記憶する記憶部と、複数の分類の少なくとも一つを受け付ける受付部と、受付部により受け付けられた分類に基づいて、記憶部から予測モデルを抽出する抽出部と、抽出された予測モデルについて、その予測モデルに含まれる複数の変数の係数またはその変数の係数の絶対値を変数が属するカテゴリごとに加算して集約する集約部とを備え、予測モデルが、予測対象に影響し得る変数と、その変数に係る係数とを、それぞれ複数含み、その予測対象の値が、上記係数で重み付けされた変数を複数含む線形回帰式で表わされることを特徴とする。
本発明による情報処理装置は、複数の分類の少なくとも一つを受け付ける受付部と、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、受付部により受け付けられた分類に基づいて、予測モデルを抽出する抽出部と、抽出された予測モデルについて、その予測モデルに含まれる複数の変数の係数またはその変数の係数の絶対値を変数が属するカテゴリごとに加算して集約する集約部とを備え、予測モデルが、予測対象に影響し得る変数と、その変数に係る係数とを、それぞれ複数含み、その予測対象の値が、上記係数で重み付けされた変数を複数含む線形回帰式で表わされることを特徴とする。
本発明による予測モデル抽出方法は、複数の分類の少なくとも一つを受け付け、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、受け付けられた分類に基づいて、予測モデルを抽出し、抽出された予測モデルについて、その予測モデルに含まれる複数の変数の係数またはその変数の係数の絶対値を変数が属するカテゴリごとに加算して集約し、予測モデルが、予測対象に影響し得る変数と、その変数に係る係数とを、それぞれ複数含み、その予測対象の値が、上記係数で重み付けされた変数を複数含む線形回帰式で表わされることを特徴とする。
本発明による予測モデル抽出プログラムは、コンピュータに、複数の分類の少なくとも一つを受け付ける受付処理、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、受付処理で受け付けられた分類に基づいて、予測モデルを抽出する抽出処理、および、抽出された予測モデルについて、その予測モデルに含まれる複数の変数の係数またはその変数の係数の絶対値を変数が属するカテゴリごとに加算して集約する集約処理を実行させ、予測モデルが、予測対象に影響し得る変数と、その変数に係る係数とを、それぞれ複数含み、その予測対象の値が、上記係数で重み付けされた変数を複数含む線形回帰式で表わされることを特徴とする。
本発明によれば、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量に存在する場合であっても、これらの予測モデルを用いて使い勝手良く要因分析を実行できるという技術的効果を奏する。
予測モデルの例を示す説明図である。 本発明による情報処理システムの第1の実施形態の構成例を示すブロック図である。 予測対象と複数の分類とを対応付けて記憶する例を示す説明図である。 説明変数の例を示す説明図である。 予測モデルの例を示す説明図である。 説明変数の実測値の具体例を示す説明図である。 受け付けた分類に基づいて予測モデルを抽出する処理の例を示す説明図である。 抽出された予測モデルを表示する例を示す説明図である。 予測モデルの重みをグラフ化した例を示す説明図である。 第1の実施形態の情報処理システムの動作例を示すフローチャートである。 抽出された予測モデルの例を示す説明図である。 抽出された予測モデルの他の例を示す説明図である。 複数の予測モデルによる要因の例を示す説明図である。 本発明による情報処理システムの第2の実施形態の構成例を示すブロック図である。 カテゴリが設定された説明変数の例を示す説明図である。 カテゴリごとに重みを集約する処理の例を示す説明図である。 第2の実施形態の情報処理システムの動作例を示すフローチャートである。 本発明による情報処理システムの第3の実施形態の構成例を示すブロック図である。 寄与度を算出する処理の例を示す説明図である。 第3の実施形態の情報処理システムの動作例を示すフローチャートである。 表示装置に表示させる初期状態の画面例を示す説明図である。 ドロップダウンリストに含まれる情報の例を示す説明図である。 指定された分類に基づく抽出結果の例を示す説明図である。 指定された分類に基づく抽出結果の例を示す説明図である。 指定された分類に基づく抽出結果をカテゴリごとに集約した例を示す説明図である。 指定された分類に基づく抽出結果をカテゴリごとに集約した例を示す説明図である。 指定された分類に基づく抽出結果をカテゴリごとに集約した他の例を示す説明図である。 サンプルの例を示す説明図である。 場合分け付き予測モデルの例を示す説明図である。 場合分け付き予測モデルで選択された線形回帰式の例を示す説明図である。 本発明による情報処理システムの第4の実施形態の構成例を示すブロック図である。 場合分け付き予測モデルを表示する例を示す説明図である。 場合分け付き予測モデルを表示する例を示す説明図である。 本発明による情報処理システムの概要を示すブロック図である。 本発明による情報処理装置の概要を示すブロック図である。
理解を容易にするために、本実施形態に係る発明が解決する課題を詳細に説明する。適切な訓練データに基づいて適切に学習された予測モデルは、予測対象の値を予測する目的のみならず、予測対象の要因分析の目的にも用いられることがある。
図1は、予測モデルの例を示す説明図である。図1には、複数の予測モデルが例示されている。ID=1に対応する予測モデルは、「店舗Aにおいて8月のある日にオレンジジュースがどれだけ売れるか」を予測するための予測モデルである。ID=2に対応する予測モデルは、「店舗Aにおいて8月のある日にアップルジュースがどれだけ売れるか」を予測するための予測モデルである。ID=3に対応する予測モデルは、「店舗Aにおいて8月のある日にパインジュースがどれだけ売れるか」を予測するための予測モデルである。
実際には、予測モデルに用いられる各変数の値は標準化される。標準化とは、与えられたデータ群を平均や分散を特定の値になるように調整することであり、一般に、平均が0、分散が1になるように調整される。具体的には、以下に示すように、個々のデータから平均値を引いた値を標準偏差で割ることにより、平均0かつ分散1に調整可能である。
標準化後の個々のデータ = (個々のデータ - 平均値)/標準偏差
以下、分かり易さのため、標準化する前の変数の値にて予測モデルを説明する(他の実施形態についても同様とする)。また、予測モデルに用いられる変数のことを説明変数と記すこともある。
ID=1,2および3に対応する予測モデルによれば、変数xの係数がいずれも正であることから、店舗Aにおける8月のジュースの売り上げは、予測対象日の最高気温に正の相関を有していることがわかる。
また、ID=1,2および3に対応する予測モデルによれば、変数xの係数が正であることから、オレンジジュースは値引きセールの実施に正の強い相関を有していると言える。一方、アップルジュースとパインジュースは、変数xの係数が小さいまたは変数xが予測モデルに含まれていないことから、値引きセールの実施と売上との相関がほとんどないことが分かる。つまり、アップルジュースとパインジュースについては、値引きセールを実施したときと実施しなかったときとで、売り上げがほとんど変わらなかったと言える。
このような知見が得られることは、今後のマーケティング戦略立案にとって有用である。例えば、来年の8月に最高気温が高くなりそうであることが分かれば、ジュースを多く仕入れることが好ましいと考えられる。また、アップルジュースとパインジュースについては、値引きセールの見直しの必要性を把握できる。このように、予測モデルに基づいて、どのような要因が売り上げに寄与したのかを分析し、分析結果をマーケティング戦略立案に役立てることができる。
予測対象が複数ある場合、予測対象を予測するための予測モデルを、予測対象ごとに一覧にできると便利である。しかし、予測対象の数があまりに大量になると、その大量の予測対象のうちから、興味のある(すなわち、予測対象に対応する予測モデルを見たいと思う)予測対象を直接指定することは、ユーザにとって困難である。
例えば、ある小売チェーン店におけるマーケティング責任者が、過去1年分の予測モデルを分析することにより、売上の要因分析を行うことを考える。予測対象が「ある商品がある店舗においてある月にどれだけ売れるか」であるとする。このとき、1店舗あたり商品が5,000種類あり、店舗が100店舗あり、1年分の情報が蓄積されているとすると、予測対象の数量は5,000×100×12=600万個にもなる。
例えば、個々の予測対象に連番のIDが付与されているとする。このときユーザは、興味のある予測対象についての予測モデルを一覧にしようと思うと、600万個の予測対象と600万個のIDとの対応関係を把握していなければならない。これはユーザにとって負荷が大きく使い勝手が悪い。このように、予測対象の数が大量である場合には、予測モデルを要因分析の目的で活用することが、使い勝手の観点から難しくなる。
本実施形態に係る発明では、予測モデルをIDではなく分類により特定する。かかる構成により、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量にある場合に、要因分析を使い勝手良く実行できる情報処理システムを提供できる。
以下、本発明の実施形態を図面を参照して説明する。以下の説明では、予測モデルを用いて各予測対象の予測が行われるものとし、予測モデルは、予め過去の実績データ等により学習済みであるとする。また、1つの予測対象には、1つの予測モデルが対応付けられる。
予測モデルは、説明変数と目的変数の相関関係を表す情報である。予測モデルは、例えば、説明変数に基づいて目的とする変数を算出することにより予測対象の結果を予測するためのコンポーネントである。予測モデルは、既に目的変数の値が得られている学習用データと任意のパラメータとを入力として、学習器により生成される。予測モデルは、例えば、入力xを正解yに写像する関数cにより表されてもよい。予測モデルは、予測対象の数値を予測するものであってもよいし、予測対象のラベルを予測するものであってもよい。予測モデルは、目的変数の確率分布を記述する変数を出力してもよい。予測モデルは、「モデル」、「学習モデル」、「推定モデル」、「予測式」または「推定式」などと記載されることもある。
本実施形態において、予測モデルは、予測対象に影響し得る1つ以上の変数と、その変数にそれぞれ係る重みを含むように構成される。予測モデルは、例えば、複数の説明変数を含む線形回帰式で目的変数が表される。前述の例では、目的変数が正解yに相当し、説明変数が入力xに相当する。例えば、予測モデルの解釈性を高めたり過学習を防いだりする目的で、一つの予測モデルに含まれる説明変数の最大個数が制限されているとしてもよい。なお、1つの予測対象を予測するために用いられる予測式は1つに限定されず、後述するように、説明変数の値に応じて予測式が選択される場合分け付き予測モデルが予測モデルとして用いられてもよい。
予測対象は、ユーザにより指定された1つ以上の分類に属するものとする。分類は、単独でもよく、階層構造であってもよい。小売店を例に挙げると、予測対象は、例えば、「東京都のA店で販売されるオレンジジュースの売上数」である。この場合、予測対象は、販売店舗という分類(東京都>A店)や、商品という分類(飲料>果汁飲料>オレンジジュース)により特定される。ここで、「>」で示す記号は、分類が階層構造になっていることを示す。
他にも、予測対象は、例えば「A社が経営するB店において2016年3月に販売される、A社プライベートブランドのボールペンの売上数」である。この場合、予測対象は、販売店舗という分類(A社が経営>B店)や、販売時期という分類(2016年>2016年3月)や、商品という分類(A社プライベートブランド>文房具>ボールペン)により特定される。
実施形態1.
図2は、本発明による情報処理システムの第1の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム100は、受付部10と、抽出部20と、記憶部30と、表示制御部40と、表示装置50とを備えている。
記憶部30は、予測対象ごとに予測モデルを記憶する。図3~図6は、記憶部30が記憶する情報の例を示す説明図である。記憶部30は、予測対象と分類とを対応付けて記憶していてもよい。また、記憶部30は、説明変数の実測値を記憶していてもよい。ここで、説明変数の実測値とは、例えば、図6に例示するように、実際に測定された各説明変数の値を意味する。
図3は、記憶部30が、予測対象と複数の分類とを対応付けて記憶する例を示している。図3に示す例では、予測対象が予測対象IDで一意に識別され、それぞれの予測対象IDに、分類である「店舗」、「商品」および「時期」がそれぞれ対応付けられていることを示す。
例えば、予測対象ID=1で識別される予測対象は、「店舗」の観点では、東京都のA店に分類され、「商品」の観点では、飲料のうち果汁飲料であるアップルジュースに分類され、「時期」の観点では、2016年3月に分類されることを示す。このように、商品またはサービスの需要量を予測する予測モデルは、商品またはサービスに関する分類、地理的要因に関する分類および時間的要因に関する分類など、複数の分類により特定されることが好ましい。
上記例では、商品またはサービスに関する分類として、「果汁飲料」や「アップルジュース」などが挙げられる。また、地理的要因に関する分類として、例えば、「東京都」や、「A店」などが挙げられる。また、時間的要因に関する分類として、例えば、「2016年」や「2016年3月」などが挙げられる。
図4は、説明変数の例を示している。また、図5は、記憶部30が、予測対象の予測モデルを記憶している例を示している。ここでは、図4に例示する説明変数が、図5に例示する予測モデルで用いられているとする。
図5に示す例では、表の縦方向が予測対象を示し、表の横方向がその予測対象の予測モデルを表わす説明変数の重みを示す。例えば、予測対象ID=1で識別される予測対象の予測モデルは、説明変数x,x,x10,x15を用いて表され、それらの重みがそれぞれ1.5,-0.6,1.2,2.1であることを示す。例えば、予測モデルが線形回帰式である場合には、予測対象ID=1で識別される予測対象の予測モデルは、目的変数をyとすると、y=1.5x-0.6x+1.2x10+2.1x15である。なお、利用される重みは、係数そのものの値であってもよく、係数の絶対値であってもよい。
本実施形態では、図5に例示する予測モデルは、一日ごとの商品需要量を予測するものとする。なお、予測モデルが一日ごとの商品需要量を予測するものであっても、予測モデルは、運用に応じたスパン(例えば、月単位、年単位など)で更新される。例えば、図4に例示する予測モデルは、ある店舗の一日ごとの商品需要量を予測するものであるが、時期が2016年3月の場合、モデルの予測が有効な期間は一か月と言うことができる。また、このモデルの予測が有効な期間は、モデルの運用スパンとも言うことが出来る。本実施形態では、予測モデル(予測式)が、月末に更新されるものとする。
図6は、説明変数の実測値の具体例を示す。例えば、説明変数x10が「その日の最高気温」を表わす変数である場合、図6に例示する実測値は、実際に測定された各日の最高気温の値である。なお、実測値と説明変数との集計期間が異なる場合、予め定めた規則に応じて、実測値を集計し、集計結果を説明変数の実測値としてもよい。例えば、説明変数が、「当該月の最高気温」であり、実測値が「各日の最高気温」である場合、当該月内の最高気温を特定し、その値を実測値としてもよい。
記憶部30は、例えば、磁気ディスク装置により実現される。
表示装置50は、後述する表示制御部40の制御に基づいて各種表示を行う装置である。表示装置50は、例えば、ディスプレイ装置やタッチパネルにより実現される。
受付部10は、予測対象を特定する分類を受け付ける。言い換えると、受付部10は、予測対象を特定するために複数の分類の少なくとも一つを受け付ける。なお、受付部10が受け付ける分類は、図3に例示する「店舗」という分類そのものではなく、「店舗」という分類の特定の値(例えば、「A店」)である。以下の説明では、分類そのものと、ある予測対象を特定するために用いられる分類の特定の値とを区別なく“分類”と表現する。
受付部10が受け付ける分類は1つに限られず、複数であってもよい。例えば、2016年3月の各店舗の「アップルジュース」を予測する予測モデルを抽出する場合、受付部10は、分類として、「2016年3月」および「アップルジュース」を受け付ける。また、分類が階層構造になっている場合、受付部10は、最下位の分類だけでなく、上位の分類を受け付けてもよい。受付部10は、例えば、表示装置50に候補となる分類を表示させ、ユーザにより選択された1つ以上の分類を受け付けてもよい。他にも、受付部10は、通信ネットワークを介して分類を受け付けてもよい。
また、受付部10は、後述する処理でユーザにより指定される各種情報を受け付けてもよい。
抽出部20は、受け付けた分類に基づいて予測モデルを抽出するためのクエリを生成し、生成したクエリに基づいて記憶部30から予測モデルを抽出する。
図7は、受け付けた分類に基づいて、図3~図6に例示する情報から予測モデルを抽出する処理の例を示す説明図である。例えば、2016年3月の各店舗の「アップルジュース」の要因分析を行うとして、受付部10が、「2016年3月」および「アップルジュース」を分類として受け付ける。抽出部20は、例えば、受け付けた分類に基づいて、「時期=“2016年3月” AND 商品=“アップルジュース”」というクエリを生成する。
そして、抽出部20は、図3に例示する表から商品=「アップルジュース」、時期=「2016年3月」に該当する予測対象ID=1,6,11,16の予測対象を特定する。そして、抽出部20は、図5に例示する表から、予測対象の予測モデルを抽出する。
また、いずれかの分類が上述するような階層構造を有している場合、受付部10は、下位階層の分類だけでなく、上位階層の分類を受け付けてもよい。この場合、抽出部20は、その分類に属する全ての下位の分類が指定されたと判断する。そして、抽出部20は、受け付けた上位階層の分類を含むクエリに基づいて、その上位階層の分類に包含される下位階層の分類により特定される複数の予測モデルを記憶部30から抽出してもよい。
例えば、図3に示す例で、商品の分類として「果汁飲料」が指定されたとする。この場合、抽出部20は、果汁飲料の下位分類である「オレンジジュース、アップルジュース、パインジュース、グレープジュースおよびピーチジュース」が指定されたと判断し、「A店」を対象とした場合、予測対象ID=1~5で識別される予測対象を特定する。
表示制御部40は、抽出された予測モデルを表示装置50に表示するための制御を行う。以下の説明では、表示制御部40が表示装置50に表示するための制御を行うことを、単に、表示制御部40が表示する、と記す。
表示制御部40は、抽出された複数の予測モデルを互いに比較可能に表示する。具体的には、表示制御部40は、抽出された予測モデルに含まれる変数と、その変数の重みとを関連付けて表示する。表示制御部40は、例えば、予測モデルを表す予測式をそのまま表示してもよい。なお、複数の予測モデルを表示する際、表示制御部40は、同じ変数の重みが同じ列に揃うように表示することが好ましい。また、表示制御部40は、受付部10を介してユーザより説明変数の指定を受け付け、指定された説明変数の重みが重い順番に予測モデルを並び替えて表示してもよい。
図8は、抽出された予測モデルを表示する例を示す説明図である。図8に例示する抽出結果は、図7に例示する抽出結果と同様である。表示制御部40は、図8(a)に例示するように、同じ説明変数の重みが同じ列に揃うように表示してもよい。また、例えば、説明変数としてxが指定された場合、表示制御部40は、図8(b)に例示するように、xの重みの大きい順に予測モデルをソートして表示してもよい。
また、表示制御部40は、抽出した予測モデルごとに重みをグラフ化して表示してもよい。図9は、予測モデルの重みをグラフ化した例を示す説明図である。図9に示す例では、2つの予測モデルを例示している。予測モデル間で重みを比較できるように、表示制御部40は、同じ説明変数の重みが横方向に揃うように表示することが好ましい。また、表示制御部40は、正の重み(係数)を右方向、負の重み(係数)を左方向に区別して表示してもよいし、重みの正負に応じてグラフの態様を変化させて表示してもよい。
図9に示す例では、予測モデル21の“最高気温”が売り上げと正の相関を有し、“祝日の翌日”が売り上げと負の相関を有することを示している。また、図9に示す例では、予測モデル21で“隣の店舗でのセール”は売上の要因に寄与していないが、予測モデル22と比較しやすいように、スペースを空けて表示していることを示す。
受付部10と、抽出部20と、表示制御部40とは、プログラム(情報処理プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、記憶部30に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、受付部10、抽出部20および表示制御部40として動作してもよい。また、情報処理システムの機能がSaaS(Software as a Service )形式で提供されてもよい。
また、受付部10と、抽出部20と、表示制御部40とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
また、本実施形態の情報処理システムが、タブレットなどの単体の情報処理装置で実現されていてもよい。この場合、情報処理装置が、上述する受付部10と、記憶部30から予測モデルを抽出する抽出部20とを備える構成であってもよい。
次に、本実施形態の情報処理システムの動作を説明する。図10は、第1の実施形態の情報処理システム100の動作例を示すフローチャートである。まず、受付部10は、予測対象を特定するための分類を受け付ける(ステップS11)。次に、抽出部20は、受け付けた分類から予測対象を特定し(ステップS12)、特定された予測対象に対応する予測モデルを抽出する(ステップS13)。そして、表示制御部40は、抽出された予測モデルを表示装置50に表示させる(ステップS14)。
以上のように、本実施形態では、受付部10が、複数の分類の少なくとも一つを受け付け、抽出部20が、受付部10により受け付けられた分類に基づいて、記憶部30から予測モデルを抽出する。よって、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量に存在する場合であっても、これらの予測モデルを用いて使い勝手良く要因分析を実行できる。
すなわち、本実施形態では、識別ID等ではなく、予測モデルを特定可能な複数の分類から、所望の分類を指定して予測モデルを抽出する。そのため、要因分析に必要な予測モデルに限定して抽出できる。よって、ユーザは、大量の予測対象から、興味ある予測対象に対応する予測モデルを、多様な観点(店舗、商品、時間など)から選択し、表示させることで、分析できる。
なお、図5では、予測モデルを20個程度しか例示していないが、図1の説明で示すように、予測対象の予測モデルが数百万になることも想定される。このように、予測モデルが大量になった場合には、より顕著な効果を有する。
例えば、ユーザが、A店とB店におけるオレンジジュースの売れ方の違いを分析したいとする。このとき、ユーザは、「A店」および「B店」並びに「オレンジジュース」を分類に指定すればよい。このような指定を受付部10が受け付けることで、抽出部20は、図5に例示するID=2およびID=7の予測モデルを抽出する。
図11は、抽出された予測モデルの例を示す説明図である。抽出された予測モデルを比較すると、例えば、A店のオレンジジュースの売り上げにもB店のオレンジジュースの売り上げにも、説明変数xが示す「大型連休中であるか否か」が寄与するが、A店の方がB店よりもより寄与が大きい(3.1>1.8)ことが分かる。ユーザは、「A店とB店との立地の違いによるものだろうか?」、「A店の近くに、大型連休中に人がたくさん集まるような施設があるのだろうか?」などのような分析ができる。さらに、ユーザは、この分析から、「後者だとすると、その施設のことをもっと調べてみると、A店にお客さんを集客するヒントがつかめるかもしれない」、といった、対応策を検討することも可能である。
他にも、例えば、ユーザが、A店におけるオレンジジュースとアップルジュースの売れ方の違いを分析したいとする。このとき、ユーザは、「オレンジジュース」および「アップルジュース」並びに「A店」を分類に指定すればよい。このような指定を受付部10が受け付けることで、抽出部20は、図5に例示するID=1およびID=2の予測モデルを抽出する。
図12は、抽出された予測モデルの他の例を示す説明図である。抽出された予測モデルを比較すると、例えば、オレンジジュースは大型連休中にたくさん売れる(xの係数が大きな正の係数である)のに対して、アップルジュースは大型連休中であるか否かが売り上げに全然寄与しない(xが説明変数に含まれていない)ことが分かる。ユーザは、「上記施設に集まる客層と、オレンジジュースを好む客層との間に共通性があるのだろうか?」などのような分析ができる。
このように、本実施形態の情報処理システム100を用いることで、商品の売れ方について、店舗ごと、商品ごと、時間ごと、など、多種多様な観点で分析をすることが可能になる。
実施形態2.
次に、本発明による情報処理システムの第2の実施形態を説明する。第1の実施形態では、説明変数ごとに予測モデルを表示する方法を説明した。一方、予測に用いられる説明変数は、その数が非常に多くなることも想定される。すなわち、分析に用いられる要因を細かくしすぎると、説明変数の種類が非常に膨大になり、解釈性に影響を及ぼす可能性がある。
以下、説明変数の種類が膨大になる理由を、具体例を用いて説明する。例えば、全国に1,000店舗の小売店を展開する企業が、1店舗あたり2,000種類の商品の売上数量を月ごとに予測している場合、その予測モデルの数は、1年で、1,000(店舗)×12(月/年)×2,000(種類/月・店舗)=24,000,000になる。
ここで、オペレータが、特定の月における特定の商品の全国の売上について、売上の要因分析を行いたいとする。この場合、受付部10は、ユーザから、売上数の予測対象を特定する分類として「2016年3月」および「オレンジジュース」という分類を受け付ける。受付部10が受け付けた分類により、1,000店舗分の予測モデルが特定される。すなわち、抽出部20は、1,000店舗それぞれにおける2016年3月のある日におけるオレンジジュースの売上数を予測する予測モデルを抽出する。
一方、予測モデルの数が増加するほど、その予測モデルに含まれる説明変数の種類も増加する。このことについて、図5に示す予測モデルを例に説明する。図13は、複数の予測モデルを用いて要因分析する処理の例を示す説明図である。ここでは、A店からD店までの2016年3月のある日のオレンジジュースの売上の要因分析を行うものとする。同じ時期(例えば、2016年3月)における同じ商品(例えば、オレンジジュース)であっても、その売上に寄与する要因(すなわち、説明変数)は、店舗によって様々であると考えられる。
図13に示す例では、A店のオレンジジュースの売上に寄与する要因(すなわち、説明変数)は、予測対象ID=2で特定される予測モデルに含まれる説明変数x,x,x,x11,x17が示す要因と考えられる。一方、B店のオレンジジュースの売上に寄与する要因(すなわち、説明変数)は、予測対象ID=7で特定される予測モデルに含まれる説明変数x,x,x,x12,x15,x16が示す要因と考えられる。同様に、C店では、予測対象ID=12で特定される予測モデルに含まれる説明変数x,x,x10,x12,x13,x15が示す要因が考えられ、D店では、予測対象ID=17で特定される予測モデルに含まれる説明変数x,x,x,x13,x15が示す要因が考えられる。
これらの要因を全て集計すると、A店からD店までの2016年3月のオレンジジュースの売上には、説明変数x,x,x,x,x,x,x,x10,x11,x12,x13,x15,x16,x17が示す要因(14種類)が影響していることが分かる。しかし、考慮すべき説明変数が増えすぎると、解釈性に影響を及ぼす可能性がある。すなわち、予測モデルに含まれる説明変数の種類が多すぎることで、その集計結果が人間にとって解釈しづらいものとなるおそれがある。このように、一つの予測式を構成する説明変数の数自体がそれほど多くなくても、予測式の数が増えるにしたがって、含まれる説明変数の種類は増加してしまうことがある。そこで、本実施形態では、予測対象に寄与し得る要因を、より大域的な観点から分析できる方法を説明する。
図14は、本発明による情報処理システムの第2の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム200は、受付部10と、抽出部20と、記憶部31と、表示制御部41と、表示装置50と、集約部60とを備えている。受付部10、抽出部20および表示装置50の動作は、第1の実施形態と同様である。
記憶部31は、第1の実施形態と同様に、予測対象ごとに予測モデルを記憶する。さらに、本実施形態の記憶部31は、予測モデルに使用される変数(すなわち、説明変数)とその変数が属するカテゴリとの対応関係を記憶する。すなわち、本実施形態では、変数の性質を示すカテゴリがそれぞれ設定される。ただし、第1の実施形態の説明変数にカテゴリが設定されていてもよい。
図15は、カテゴリが設定された説明変数の例を示す説明図である。例えば、予測モデルに、「テレビ広告」、「インターネット掲載」、「チラシ配布」などの説明変数が含まれている場合、これらの説明変数には、例えば、「広告」というカテゴリが設定される。また、例えば、予測対象が一日毎に予測されるとして、予測モデルに「日曜日であるか否か」、「祝日であるか否か」、「祝日の前日であるか否か」などの説明変数が含まれている場合、これらの説明変数には、例えば、「カレンダー」というカテゴリが設定される。また、例えば、予測対象が一日毎に予測されるとして、予測モデルに「雨の日か否か」、「最高気温」、「日照量」などの説明変数が含まれている場合、これらの説明変数には、例えば、「気象」というカテゴリが設定される。説明変数とその説明変数が属するカテゴリとの関係は、例えば、あらかじめ設定されているものとする。
集約部60は、抽出部20が抽出した各予測モデルについて、予測モデルに含まれる複数の変数の重みを、説明変数に対応するカテゴリごとに集約する。変数の重みは、具体的には、説明変数の係数である。
集約部60は、同じカテゴリに属する説明変数の係数をすべて加算して、カテゴリごとの重みを算出してもよい。このとき、集約部60は、各説明変数の重みを、符号を含めた係数としてもよく、係数の絶対値としてもよい。
図16は、カテゴリごとに重みを集約する処理の例を示す説明図である。例えば、抽出部20が、ID=2,7,12,17で特定される4つの予測モデルを抽出したとする。変数とその変数が属するカテゴリが図15に例示するような対応関係の場合、集約部60は、説明変数x~xの係数を広告カテゴリの重みとして集約する。同様に、集約部60は、説明変数x~xの係数をカレンダーカテゴリの重みとして集約し、説明変数x10~x14の係数を気象カテゴリの重みとして集約し、説明変数x15~x17の係数を価格カテゴリの重みとして集約する。図16では、符号を含めて係数を加算した結果を示す。
図13に示す例では、要因(すなわち、説明変数)が14種類存在していたが、カテゴリごとに集計することで、要因が広告、カレンダー、気象および価格の4種類に集約されている。また、このように、似たような大量の説明変数を集計することで、要因の解釈性を高めることが可能になる。例えば、図16に示す例では、広告や価格に関する要因よりもカレンダーに関する要因が大きいことが一見して判断しやすくなる。
表示制御部41は、抽出された予測モデルに含まれる変数の重みをカテゴリごとに集約して表示装置50に表示させる。表示制御部41は、例えば、図16に例示する結果を表示装置50に表示させる。
なお、受付部10と、抽出部20と、表示制御部41と、集約部60とは、プログラム(情報処理プログラム)に従って動作するコンピュータのCPUによって実現される。
次に、本実施形態の情報処理システムの動作を説明する。図17は、第2の実施形態の情報処理システム200の動作例を示すフローチャートである。なお、受付部10が分類を受け付けて、抽出部20が予測モデルを抽出するまでのステップS11からステップS13までの処理は、図10に示す処理と同様である。
集約部60は、抽出部20が抽出した各予測モデルについて、予測モデルに含まれる複数の変数の重みを、その変数に対応するカテゴリごとに集約する(ステップS21)。そして、表示制御部41は、カテゴリごとに集約した変数の重みを表示装置50に表示させる(ステップS22)。
以上のように、本実施形態では、集約部60が予測モデルに含まれる複数の変数の重みをカテゴリごとに集約する。そのため、第1の実施形態の効果に加え、より大域的な観点で分析することが可能になる。
実施形態3.
次に、本発明による情報処理システムの第3の実施形態を説明する。第1の実施形態および第2の実施形態では、変数の重みとして係数を利用する方法を説明した。本実施形態では、説明変数の実測値を考慮する点において第1の実施形態および第2の実施形態と異なる。
図18は、本発明による情報処理システムの第3の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム300は、受付部10と、抽出部20と、記憶部30と、表示制御部42と、表示装置50と、算出部61とを備えている。受付部10、抽出部20、記憶部30および表示装置50の動作は、第1の実施形態と同様である。
算出部61は、抽出された予測モデルについて、その予測モデルに含まれる変数の係数とその変数の値との積を、その変数の重みとして、変数ごとに算出する。以下の説明では、変数の係数とその変数の値との積を寄与度と記す。そして、表示制御部42は、算出した寄与度を変数と関連付けて表示する。
以下、予測モデルが複数の説明変数を含む線形回帰式で表されているものとして説明する。抽出部20は、受け付けた分類に基づいて予測対象を特定し、特定された予測対象の予測モデルを抽出する。また、抽出部20は、併せて、受け付けた分類に基づいて、その予測モデルに含まれる説明変数の実測値を抽出する。実測値は、例えば、図6に示す内容であり、記憶部30に記憶される。そして、算出部61は、線形回帰式における説明変数の重み(係数)とその説明変数の実測値との積を、説明変数ごとに算出する。
図19は、寄与度を算出する処理の例を示す説明図である。例えば、ID=1で特定される予測モデルは、3つの説明変数(x,x10,x15)を含む。ここで、2016年3月1日は平日であり、最高気温が図6に示す例から15.5度であり、単品割引があったとする。この場合、x=0、x10=15.5、x15=1である。なお、第1の実施形態でも説明したとおり、データの値は標準化されていることが好ましい。ここでは、説明を簡略化するため、実測値そのものを使用して説明する。
算出部61は、xの係数-0.6と実測値0の積(=0)を寄与度として算出する。同様に、算出部61は、x10の係数1.2と実測値15.5の積(=18.6)を寄与度として算出し、x15の係数2.1と実測値1の積(=2.1)を寄与度として算出する。
なお、受付部10と、抽出部20と、表示制御部42と、算出部61とは、プログラム(情報処理プログラム)に従って動作するコンピュータのCPUによって実現される。
次に、本実施形態の情報処理システムの動作を説明する。図20は、第3の実施形態の情報処理システム300の動作例を示すフローチャートである。なお、受付部10が分類を受け付けて、抽出部20が予測モデルを抽出するまでのステップS11からステップS13までの処理は、図10に示す処理と同様である。
算出部61は、抽出された予測モデルに含まれる変数の係数とその変数の値との積(すなわち、寄与度)を変数ごとに算出する(ステップS31)。そして、表示制御部42は、算出した寄与度を変数と関連付けて表示装置50に表示させる(ステップS32)。
以上のように、本実施形態では、算出部61が、予測モデルに含まれる変数の係数とその変数の値との積を変数ごとに算出する。そのため、第1の実施形態の効果に加え、実績値を反映した分析が可能になる。
以下、本実施形態の効果を、具体例を示しながら詳細に説明する。例えば、「A店の2016年3月のある日におけるオレンジジュースの売上数」が以下の予測式により説明されるとする。ここで、括弧内は、説明変数を表わす。
売上数= -11.3*(A店近傍における当該月の最高気温)+60*(A店近傍における当該日の総降水量)+130
上記式だけで判断すると、一見、当該日の総降水量は、係数の値が大きいため、A店の3月のある日におけるオレンジジュースの売上数に大きく寄与しているようにも見える。しかし、実際には、3月のある日にA店近傍において雨が全く降らなかったとする。その場合、実際には、A店近傍における当該日の総降水量はA店の3月のある日におけるオレンジジュースの売上数に全く寄与しなかったということができる。
したがって、第1の実施形態と比較すると、本実施形態では、当該説明変数の寄与度を、“予測式における係数の値”と“当該係数が係る説明変数の実測値”との積の値によって算出することで、実績値を反映した分析が可能になる。
なお、算出した寄与度は、カテゴリごとに集約されてもよい。すなわち、本実施形態の情報処理システム300が、第2の実施形態における集約部60を備え、記憶部30が記憶部31として実現されていてもよい。そして、集約部60が、算出部61によって算出された寄与度をカテゴリごとに集約してもよい。
次に、第3の実施形態の変形例を説明する。第3の実施形態では、実測値を用いて寄与度を算出する方法を説明した。一方、予測モデルを用いることで結果を予測することも可能である。この場合、予測モデルに基づいて予測した予測結果と、実際に取得された実測結果との差分(誤差)を特定することが可能である。そのため、算出部61は、予測モデルに基づいて予測された予測結果と、実際に取得された実測結果との差分である誤差を利用して、寄与度を補正してもよい。
算出部61は、例えば、予測対象ごとに、予測結果と実測結果の差分に基づいて、各説明変数の寄与度を同じ割合で補正してもよい。例えば、実測結果が予測結果の2倍の値を取った場合、算出部61は、各説明変数の寄与度をそれぞれ2倍してもよい。
他にも、算出部61は、例えば、予測結果と実測結果の差分を示す新たな説明変数を設け、その差分を新たな説明変数の寄与度としてもよい。
なお、算出部61が誤差に応じて寄与度を補正する方法は、上述する例に限定されない。算出部61は、寄与度を補正する割合を変更してもよく、新たな説明変数を2つ以上設けてもよい。
以下、第1の実施形態から第3の実施形態において、表示制御部40、表示制御部41または表示制御部42(以下、単に表示制御部と記す。)が、抽出された予測モデルに含まれる変数とその変数の重みとを関連付けて表示装置50に表示させる具体例を説明する。本具体例では、図3および図5に例示する情報から特定される予測モデルが記憶部30に記憶されているとする。
図21は、表示制御部が表示装置50に表示させる画面例を示す説明図である。図21に例示する画面は初期状態を示す。具体的には、この画面には、抽出対象を指定する画面S1が上部に存在し、抽出結果を表示する画面S2が下部に存在するものとする。
また、図21に示す例では、画面S1に、予測対象を特定する分類ごとにドロップダウンリストD1~3が設けられている。図22は、ドロップダウンリストに含まれる情報の例を示す説明図である。図22に示す例では、商品分類の飲料に果汁飲料が含まれ、さらに、果汁飲料の分類に複数のジュースが含まれていることを示す。分類が階層構造になることを考慮し、表示制御部は、分類の階層に応じて抽出結果を表示してもよい。
また、画面S1には、集約方法を指定するために、要因単体で表示するか、カテゴリごとに集約するか選択するためのラジオボタンR1が設けられる。さらに、画面S1には、説明変数の重みをそのまま表示するか、実測値も考慮した寄与度を表示するか選択するためのラジオボタンR2も設けられる。
ユーザが分類および集約方法を選択して図21に例示する実行ボタンB1を押下すると、受付部10および抽出部20は、抽出処理を行い、表示制御部が、抽出結果を画面S2に表示する。
以下、ユーザから2種類の観点での要因分析を受け付けた場合の集計結果の例を説明する。1種類目は、2016年3月、東京都の全店舗(すなわち、A店,B店,C店およびD店)におけるオレンジジュースの売上の要因分析であり、2種類目は、2016年3月、特定の店舗(A店)における果汁飲料全体(アップルジュース、オレンジジュース、パインジュース、グレープジュースおよびピーチジュース)の売上の要因分析である。
図23~図27は、表示制御部が表示する結果画面例を示す説明図である。図23は、東京都の全店舗におけるオレンジジュースの売上の要因を出力した結果の例を示す。また、図24は、A店における果汁飲料全体の売上の要因を出力した結果の例を示す。
指定された条件に応じた出力を行うことにより、図23および図24に例示するように、ユーザの観点に応じて予測モデルを絞り込むことができる。すなわち、本願発明の情報処理システムを用いることで、様々な観点から予測対象に寄与し得る要因を分析できる。
なお、図23および図24に示すように、対象とする予測モデルが増加するに従い、寄与し得る要因(説明変数)も増加する。そこで、第2の実施形態で説明したように、要因(説明変数)をカテゴリごとに集計することで、解釈性容易性を高めることが可能になる。
図25は、東京都の全店舗におけるオレンジジュースの売上の要因をカテゴリで集計して出力した結果の例を示す。また、図26は、A店における果汁飲料全体の売上の要因をカテゴリで集計して出力した結果の例を示す。図23に示す例では、要因が14個だったのに対し、図25に示す例では、4つのカテゴリに集約されている。また、図24に示す例では、要因が15個だったのに対し、図26に示す例でも、4つのカテゴリに集約されている。いずれの場合も、より解釈性が高くなっていると言える。
また、図27は、東京都の果汁飲料の売上のカテゴリごとの要因分析をする際、果汁飲料の下位の分類に含まれるアップルジュース、オレンジジュース、パインジュース、グレープジュースおよびピーチジュースの抽出結果を出力した例を示す。図27に例示するように、表示制御部は、複数の上位分類(東京都および果汁飲料)が指定された場合、それぞれの上位分類ごとに下位分類を展開して表示してもよい。
実施形態4.
次に、本発明による情報処理システムの第4の実施形態を説明する。第4の実施形態の構成は、第1の実施形態の構成と同様である。ただし、本実施形態の情報処理システムは、適用される変数の値(実測値)に応じて線形回帰式が特定される予測モデルを用いる。実測値に応じて線形回帰式が特定される予測モデルとして、例えば、サンプルに応じて1つの線形回帰式を特定する場合分け付き予測モデルが挙げられる。
初めに、場合分け付き予測モデルを用いる必要性を説明する。予測モデルを要因分析の目的に用いるためには、予測モデルが人間にとって解釈可能である必要がある。解釈可能な予測モデルとして、例えば線形回帰式や決定木がある。しかし、解釈困難な予測モデル(例えば、ニューラルネットや非線形サポートベクターマシン)と比較して、線形回帰式や決定木は、複雑なビッグデータの挙動を捉える事ができず、予測精度が低くなってしまう。
精度とわかりやすさを両立するために、データサイエンティストが、規則性が切り替わる要因を想定し、その単位にデータを分割して、それぞれに線形回帰モデルのような単純なモデルを適用するという試行錯誤も広く行われていた。
例えば、コンビニエンスストアにおけるおにぎりの売上を予測するとする。平日はビジネスマンの購入が多く昼食時の商品陳列数と売上が高い相関を持つと考えられる。一方、休日は家族連れが多くライバル店との価格差が売上と高い相関を持つと考えられる。このように、シンプルな切り替えルールとパターンに応じて説明変数を組合せる事で高い精度で予測できる。
しかし、データの場合分けと説明変数の組合せのパターンは無限に存在し、データサイエンティストがその中からしらみつぶしにモデルを探すことは現実的ではない。予測精度と解釈容易性とを両立した予測モデルを学習する方法として、以下に示す異種混合学習が知られている
<参考文献>
Ryohei Fujimaki, Satoshi Morinaga, Hiroshi Tamano, “Fully-Automatic Bayesian Piecewise Sparse Linear Models”, Proceedings of the 17th International Conference on Artificial Intelligence and Statistics (AISTATS), 2014.
異種混合学習では、入力データを決定木形式のルールによって場合分けし、各場合で異なる説明変数を組合せた線形回帰式で予測する予測モデルを学習することができる。このような予測モデルは、人間にとって解釈が容易であり、且つ、予測精度が高い。以降、このような予測モデルを場合分け付き予測モデルと呼ぶ。
ただし、本実施形態に係る発明で用いられる予測モデルは、必ずしも異種混合学習によって学習された場合分け付き予測モデルに限定されない。他の方法により学習された場合分け付き予測モデルや、データサイエンティストが施行錯誤により作成した場合分け付き予測モデルについても、本実施形態に係る発明で用いることができる。
すなわち、場合分け付き予測モデルは、複数の線形回帰式と、変数の値に基づいてその複数の線形回帰式の中から予測に用いる線形回帰式を選択するルール(以下、回帰式選択ルールと記す。)とを含んで構成される。
なお、上述する異種混合学習技術でデータ分析をする場合にも、前処理でデータの標準化が行われる。分析前にデータを標準化しておくことで、各要因(属性)の影響度合いを適切に比較できるようになる。
例えば、ある中古品の価格予測をしたい場合、価格に影響しそうな要因(属性)として、製造年(年)、処理速度(GHz)、解像度(ドット)および色などが挙げられる。これらの属性の中で、予測結果にどの要因(属性)の影響が大きいか分析する場合、標準化されていないデータを用いると、単位もスケールもバラバラのため、要因の比較は困難である。一方、入力データを標準化しておくことで、生成される予測式の係数も標準化されるため、単位やスケールの違いを無視して各要因(属性)の影響を比較できるようになる。
以下、上述する場合分け付き予測モデルについて、具体例を用いて詳細に説明する。以下の説明では、場合分け付き予測モデルが、2017年1月における店舗Aのある日のオレンジジュースの売り上げを予測する予測モデルであるとする。図28は、サンプルの例を示す説明図である。図28に示す例では、予測モデルで用いられる説明変数の値として、週末か否かを示す値(週末の場合1、それ以外は0)、晴れか否かを示す値(晴れの場合1、それ以外は0)が日ごとに特定されていることを示す。なお、図28では、2つの説明変数しか例示していないが、他にも様々な説明変数とその値が特定される。
図29は、場合分け付き予測モデルの例を示す説明図である。図29は、サンプルに応じて線形回帰式が変化することを模式的に示している。図29は、場合分け付き予測モデルが、3つの線形回帰式(線形回帰式1~3)と、曜日および天気を示す変数に基づいて線形回帰式1~3の中から予測に用いる線形回帰式を選択するルールとを含んで構成されていることを示す。
具体的には、図29に例示する場合分け付き予測モデルの回帰式選択ルールは、曜日が土曜日または日曜日の場合には、線形回帰式1を選択し、曜日が土曜日および日曜日でない場合に、天気が晴れの場合には、線形回帰式2を選択し、そうでない場合には線形回帰式3を選択する、というルールである。この回帰式選択ルールを用いることで、サンプルに応じた線形回帰式が選択される。
図30は、場合分け付き予測モデルで選択された線形回帰式の例を示す説明図である。図30は、図29に例示する場合分け付き予測モデルを用いた場合に図28に例示するサンプルで選択された線形回帰式を示す。
なお、図29に例示する選択された頻度は、各線形回帰式が図28に例示するサンプルに応じて選択された割合を例示している。言い換えると、サンプルに応じて線形回帰式が選択されることから、選択された割合は、線形回帰式に対応するサンプル数の割合を示していると言うことができる。
図31は、本発明による情報処理システムの第4の実施形態の構成例を示すブロック図である。本実施形態の情報処理システム400は、受付部10と、抽出部20と、記憶部30と、表示制御部43と、表示装置50とを備えている。受付部10、抽出部20、記憶部30および表示装置50の動作は、第1の実施形態と同様である。すなわち、抽出部20は、受付部10が受け付けた分類に基づいて、記憶部30から場合分け付き予測モデルを抽出する。
また、本実施形態の情報処理システム400が、第2の実施形態における集約部60を備え、記憶部30が記憶部31として実現されていてもよい。この場合、サンプルに応じて各線形回帰式が選択された後、集約部60が複数の変数の重みを対応するカテゴリごとに集約すればよい。
また、本実施形態の情報処理システム400が、第3の実施形態における算出部61を備えていてもよい。この場合、サンプルに応じて各線形回帰式が選択された後、算出部61は、各線形回帰式における係数とその変数の値との積を算出すればよい。
表示制御部43は、抽出された場合分け付き予測モデルを表示装置50に表示させる。その際、表示制御部43は、場合分け付き予測モデルに含まれる複数の線形回帰式のそれぞれについて、図29に例示するように、線形回帰式が予測処理に用いられた頻度や選択割合を線形回帰式に関連付けて表示させてもよい。
図32および図33は、場合分け付き予測モデルを表示する例を示す説明図である。図32および図33は、回帰式選択ルールが木構造で表すことができる場合分け付き予測モデルの例を示す。図32および図33に例示する場合分け付き予測モデルは、各ノードが条件分岐を表し、そのうち葉ノードが線形回帰式を表す。
受付部10が、「A店、B店、C店およびD店」、「1月」、および、「オレンジジュース」という分類を受け付け、抽出部20が4種類の予測モデルを抽出した場合、表示制御部43は、図32に例示する態様で、それぞれ場合分け付き予測モデルを表示してもよい。
場合分け付き予測モデルは、「回帰式選択ルール」と「複数の線形回帰式」を含むため、単純な線形回帰式よりも複雑である。そのため、受付部10は、例えば、マウスなどのポインティングデバイスにて、表示された場合分け付き予測モデルに対する指定(例えば、特定の分岐条件や特定の線形回帰式、特定の変数の指定)を受け付けてもよい。そして、表示制御部43は、指定を受け付けた箇所に応じて、その場合分け付き予測モデルの内容を示す情報の詳細をポップアップ表示してもよい。
図32に示す例では、受付部10が、「A店における1月のある日のオレンジジュースの売り上げ」を表す場合分け付き予測モデルにおいて分岐を表す箇所の指定を受け付ける。このとき、表示制御部43は、例えば、その箇所が示す「予測対象日が晴れであるか否か」という回帰式選択ルールの分岐条件をポップアップ表示してもよい。
他にも、図33に例示するように、受付部10が、線形回帰式を表す箇所の指定を受け付けた場合、表示制御部43は、その線形回帰式の詳細(例えば、関数や説明変数の情報など)を表示してもよい。また、前述したように、表示制御部43は、それぞれの線形回帰式が用いられた頻度を併せて表示してもよい。
次に、本発明の概要を説明する。図34は、本発明による情報処理システムの概要を示すブロック図である。本発明による情報処理システム80は、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを複数記憶する記憶部81(例えば、記憶部30,31)と、複数の分類の少なくとも一つを受け付ける受付部82(例えば、受付部10)と、受付部82により受け付けられた分類に基づいて、記憶部81から予測モデルを抽出する抽出部83(例えば、抽出部20)とを備えている。
そのような構成により、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量に存在する場合であっても、これらの予測モデルを用いて使い勝手良く要因分析を実行できる。
また、複数の分類の少なくとも一つは階層構造を有しており、受付部82は階層構造を有する分類についての上位階層の分類を受け付け、抽出部83は、上位階層の分類に基づいて、記憶部81から上位階層の分類に包含される下位階層の分類により特定される複数の予測モデルを抽出してもよい。
具体的には、複数の分類は、商品またはサービスに関する分類、地理的要因に関する分類および時間的要因に関する分類を含んでいてもよい。
また、具体的には、予測対象は、ある商品がある店舗または地域において、モデルの運用スパン中にどの程度売れるかを示すものであってもよい。
また、具体的には、予測モデルは、予測対象に影響し得る変数と、その変数に係る重みとを、それぞれ複数含んで構成されてもよい。
また、情報処理システム80は、変数とその変数が属するカテゴリとの対応関係を記憶するカテゴリ記憶部(例えば、記憶部31)と、抽出された予測モデルについて、予測モデルに含まれる複数の変数の重みを変数に対応するカテゴリごとに集約する集約部(例えば、集約部60)とを備えていてもよい。そのような構成によれば、より大域的な観点で分析することが可能になる。
また、情報処理システム80は、抽出された予測モデルについて、その予測モデルに含まれる変数の係数と変数の値との積を、その変数の重みとして、変数ごとに算出する算出部(例えば、算出部61)を備えていてもよい。そのような構成によれば、実績値を反映した分析が可能になる。
また、情報処理システム80は、抽出された予測モデルに含まれる変数とその変数の重みとを関連付けて表示装置(例えば、表示装置50)に表示させる表示制御部(例えば、表示制御部40)を備えていてもよい。
一方、予測モデルは、場合分け付き予測モデルであってもよい。そして、場合分け付き予測モデルは、複数の線形回帰式と、変数の値に基づいて複数の線形回帰式の中から予測に用いる線形回帰式を選択するルールを規定した回帰式選択ルールとを含んで構成されてもよい。
また、情報処理システム80は、抽出された場合分け付き予測モデルを表示装置(例えば、表示装置50)に表示させる表示制御部(例えば、表示制御部42)を備えていてもよい。そして、表示制御部は、場合分け付き予測モデルに含まれる複数の線形回帰式のそれぞれについて、線形回帰式が予測処理に用いられた頻度を線形回帰式に関連付けて表示させてもよい。
さらに、受付部82は、表示された場合分け付き予測モデルに対する指定を受け付けてもよい。そして、表示制御部は、指定を受け付けた箇所に応じて、その場合分け付き予測モデルの内容を示す情報を表示装置に表示させてもよい。
図35は、本発明による情報処理装置の概要を示すブロック図である。本発明による情報処理装置90は、複数の分類の少なくとも一つを受け付ける受付部91(例えば、受付部10)と、複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部(例えば、記憶部30,31)から、受付部91により受け付けられた分類に基づいて、予測モデルを抽出する抽出部92(例えば、抽出部20)とを備えている。
そのような構成によっても、予測モデルを要因分析の目的で用いる場合において、予測モデルが大量に存在する場合であっても、これらの予測モデルを用いて使い勝手良く要因分析を実行できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを複数記憶する記憶部と、前記複数の分類の少なくとも一つを受け付ける受付部と、前記受付部により受け付けられた分類に基づいて、前記記憶部から予測モデルを抽出する抽出部とを備えたことを特徴とする情報処理システム。
(付記2)複数の分類の少なくとも一つは階層構造を有しており、受付部は、前記階層構造を有する分類についての上位階層の分類を受け付け、抽出部は、前記上位階層の分類に基づいて、記憶部から前記上位階層の分類に包含される下位階層の分類により特定される複数の予測モデルを抽出する付記1記載の情報処理システム。
(付記3)複数の分類は、商品またはサービスに関する分類、地理的要因に関する分類および時間的要因に関する分類を含む付記1または付記2記載の情報処理システム。
(付記4)予測対象は、ある商品がある店舗または地域において、モデルの運用スパン中にどの程度売れるかを示す付記1から付記3のうちのいずれか1つに記載の情報処理システム。
(付記5)予測モデルは、予測対象に影響し得る変数と、当該変数に係る重みとを、それぞれ複数含んで構成される付記1から付記4のうちのいずれか1つに記載の情報処理システム。
(付記6)変数と当該変数が属するカテゴリとの対応関係を記憶するカテゴリ記憶部と、抽出された予測モデルについて、当該予測モデルに含まれる複数の変数の重みを前記変数に対応するカテゴリごとに集約する集約部とを備えた付記1から付記5のうちのいずれか1つに記載の情報処理システム。
(付記7)抽出された予測モデルについて、当該予測モデルに含まれる変数の係数と当該変数の値との積を、当該変数の重みとして、当該変数ごとに算出する算出部を備えた付記1から付記6のうちのいずれか1つに記載の情報処理システム。
(付記8)抽出された予測モデルに含まれる変数と当該変数の重みとを関連付けて表示装置に表示させる表示制御部を備えた付記1から付記7のうちのいずれか1つに記載の情報処理システム。
(付記9)予測モデルは、場合分け付き予測モデルであり、前記場合分け付き予測モデルは、複数の線形回帰式と、変数の値に基づいて当該複数の線形回帰式の中から予測に用いる線形回帰式を選択するルールを規定した回帰式選択ルールとを含んで構成される付記1から付記8のうちのいずれか1つに記載の情報処理システム。
(付記10)抽出された場合分け付き予測モデルを表示装置に表示させる表示制御部を備え、前記表示制御部は、前記場合分け付き予測モデルに含まれる複数の線形回帰式のそれぞれについて、前記線形回帰式が予測処理に用いられた頻度を当該線形回帰式に関連付けて表示させる付記9記載の情報処理システム。
(付記11)抽出された場合分け付き予測モデルを表示装置に表示させる表示制御部を備え、受付部は、表示された前記場合分け付き予測モデルに対する指定を受け付け、前記表示制御部は、指定を受け付けた箇所に応じて、当該場合分け付き予測モデルの内容を示す情報を表示装置に表示させる付記9または付記10記載の情報処理システム。
(付記12)複数の分類の少なくとも一つを受け付ける受付部と、前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、前記受付部により受け付けられた分類に基づいて、前記予測モデルを抽出する抽出部とを備えたことを特徴とする情報処理装置。
(付記13)複数の分類の少なくとも一つを受け付け、前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、受け付けられた前記分類に基づいて、前記予測モデルを抽出することを特徴とする予測モデル抽出方法。
(付記14)コンピュータに、複数の分類の少なくとも一つを受け付ける受付処理、および、前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、前記受付処理で受け付けられた分類に基づいて、前記予測モデルを抽出する抽出処理を実行させるための予測モデル抽出プログラム。
10 受付部
20 抽出部
30 記憶部
40,41 表示制御部
50 表示装置
60 集約部
61 算出部
100,200,300,400 情報処理システム

Claims (8)

  1. 複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを複数記憶する記憶部と、
    前記複数の分類の少なくとも一つを受け付ける受付部と、
    前記受付部により受け付けられた分類に基づいて、前記記憶部から予測モデルを抽出する抽出部と、
    抽出された予測モデルについて、当該予測モデルに含まれる複数の変数の係数または当該変数の係数の絶対値を前記変数が属するカテゴリごとに加算して集約する集約部とを備え、
    前記予測モデルは、予測対象に影響し得る変数と、当該変数に係る係数とを、それぞれ複数含み、当該予測対象の値が、前記係数で重み付けされた前記変数を複数含む線形回帰式で表わされる
    ことを特徴とする情報処理システム。
  2. 複数の分類の少なくとも一つは階層構造を有しており、
    受付部は、前記階層構造を有する分類についての上位階層の分類を受け付け、
    抽出部は、前記上位階層の分類に基づいて、記憶部から前記上位階層の分類に包含される下位階層の分類により特定される複数の予測モデルを抽出する
    請求項1記載の情報処理システム。
  3. 複数の分類は、商品またはサービスに関する分類、地理的要因に関する分類および時間的要因に関する分類を含む
    請求項1または請求項2記載の情報処理システム。
  4. 予測対象は、ある商品がある店舗または地域において、モデルの運用スパン中にどの程度売れるかを示す
    請求項1から請求項3のうちのいずれか1項に記載の情報処理システム。
  5. 抽出された予測モデルについて、当該予測モデルに含まれる変数の係数と当該変数の値との積を、当該変数ごとに算出する算出部を備えた
    請求項1から請求項4のうちのいずれか1項に記載の情報処理システム。
  6. 複数の分類の少なくとも一つを受け付ける受付部と、
    前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、前記受付部により受け付けられた分類に基づいて、前記予測モデルを抽出する抽出部と、
    抽出された予測モデルについて、当該予測モデルに含まれる複数の変数の係数または当該変数の係数の絶対値を前記変数が属するカテゴリごとに加算して集約する集約部とを備え、
    前記予測モデルは、予測対象に影響し得る変数と、当該変数に係る係数とを、それぞれ複数含み、当該予測対象の値が、前記係数で重み付けされた前記変数を複数含む線形回帰式で表わされる
    ことを特徴とする情報処理装置。
  7. コンピュータが、複数の分類の少なくとも一つを受け付け、
    前記コンピュータが、前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、受け付けられた前記分類に基づいて、前記予測モデルを抽出し、
    前記コンピュータが、抽出された予測モデルについて、当該予測モデルに含まれる複数の変数の係数または当該変数の係数の絶対値を前記変数が属するカテゴリごとに加算して集約し、
    前記コンピュータが、前記予測モデルは、予測対象に影響し得る変数と、当該変数に係る係数とを、それぞれ複数含み、当該予測対象の値が、前記係数で重み付けされた前記変数を複数含む線形回帰式で表わされる
    ことを特徴とする予測モデル抽出方法。
  8. コンピュータに、
    複数の分類の少なくとも一つを受け付ける受付処理、
    前記複数の分類により特定される予測モデルであって、予測対象の値を予測するための予測モデルを、複数記憶する記憶部から、前記受付処理で受け付けられた分類に基づいて、前記予測モデルを抽出する抽出処理、および、
    抽出された予測モデルについて、当該予測モデルに含まれる複数の変数の係数または当該変数の係数の絶対値を前記変数が属するカテゴリごとに加算して集約する集約処理を実行させ、
    前記予測モデルは、予測対象に影響し得る変数と、当該変数に係る係数とを、それぞれ複数含み、当該予測対象の値が、前記係数で重み付けされた前記変数を複数含む線形回帰式で表わされる
    ことを特徴とする予測モデル抽出プログラム。
JP2019516773A 2017-05-09 2017-05-09 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム Active JP7120649B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/017548 WO2018207259A1 (ja) 2017-05-09 2017-05-09 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム

Publications (2)

Publication Number Publication Date
JPWO2018207259A1 JPWO2018207259A1 (ja) 2020-02-27
JP7120649B2 true JP7120649B2 (ja) 2022-08-17

Family

ID=64104496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019516773A Active JP7120649B2 (ja) 2017-05-09 2017-05-09 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム

Country Status (3)

Country Link
US (1) US20200074486A1 (ja)
JP (1) JP7120649B2 (ja)
WO (1) WO2018207259A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11993751B2 (en) 2018-01-30 2024-05-28 Imubit Israel Ltd. Predictive control systems and methods with fluid catalytic cracking volume gain optimization
US20220299952A1 (en) 2018-01-30 2022-09-22 Imubit Israel Ltd. Control system with optimization of neural network predictor
US11200489B2 (en) * 2018-01-30 2021-12-14 Imubit Israel Ltd. Controller training based on historical data
US11494651B2 (en) 2018-01-30 2022-11-08 Imubit Israel Ltd Systems and methods for optimizing refinery coker process
CN112789636A (zh) * 2018-10-26 2021-05-11 索尼公司 信息处理装置、信息处理方法和程序
US20200167669A1 (en) 2018-11-27 2020-05-28 Oracle International Corporation Extensible Software Tool with Customizable Machine Prediction
US11544724B1 (en) 2019-01-09 2023-01-03 Blue Yonder Group, Inc. System and method of cyclic boosting for explainable supervised machine learning
JP7310171B2 (ja) * 2019-02-28 2023-07-19 富士通株式会社 配分方法、抽出方法、配分プログラム、抽出プログラム、配分装置及び抽出装置
JP7168095B2 (ja) * 2019-08-29 2022-11-09 富士通株式会社 パターン抽出プログラム、装置、及び方法
WO2021130916A1 (ja) * 2019-12-25 2021-07-01 日本電気株式会社 意図特徴量抽出装置、学習装置、方法およびプログラム
JP7359393B2 (ja) * 2020-02-18 2023-10-11 株式会社Quick 情報表示システム、情報表示方法及び情報表示プログラム
US20210350426A1 (en) 2020-05-07 2021-11-11 Nowcasting.ai, Inc. Architecture for data processing and user experience to provide decision support
CN112200234B (zh) 2020-09-30 2022-04-12 支付宝(杭州)信息技术有限公司 模型分类的过程中防止模型窃取的方法及装置
CN111932190B (zh) * 2020-09-30 2021-02-02 北京每日优鲜电子商务有限公司 物品信息显示方法、装置、设备和计算机可读介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016177536A (ja) 2015-03-20 2016-10-06 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240799A (ja) * 1997-02-27 1998-09-11 Nri & Ncc Co Ltd 新規出店評価支援装置
JP2002350355A (ja) * 2001-05-30 2002-12-04 Ricoh Co Ltd 光沢ムラ評価装置、光沢ムラ評価方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2004086897A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd モデル構築方法およびモデル構築システム
JP4230975B2 (ja) * 2004-09-17 2009-02-25 キヤノンItソリューションズ株式会社 データ予測装置及びデータ予測方法並びにプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016177536A (ja) 2015-03-20 2016-10-06 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Also Published As

Publication number Publication date
WO2018207259A1 (ja) 2018-11-15
US20200074486A1 (en) 2020-03-05
JPWO2018207259A1 (ja) 2020-02-27

Similar Documents

Publication Publication Date Title
JP7120649B2 (ja) 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム
Fildes et al. Retail forecasting: Research and practice
Hofmann et al. Big data analytics and demand forecasting in supply chains: a conceptual analysis
Falatouri et al. Predictive analytics for demand forecasting–a comparison of SARIMA and LSTM in retail SCM
Petropoulos et al. The inventory performance of forecasting methods: Evidence from the M3 competition data
JP6604431B2 (ja) 情報処理システム、情報処理方法および情報処理プログラム
Paap et al. A dynamic multinomial probit model for brand choice with different long‐run and short‐run effects of marketing‐mix variables
KR20160071990A (ko) 고객 데이터 분석·검증 시스템
Jain et al. Sales forecasting for retail chains
US20130346150A1 (en) System, method, and computer program product for forecasting sales
Gangurde et al. Building prediction model using market basket analysis
CN112365283A (zh) 一种优惠券发放方法、装置、终端设备及存储介质
Shih et al. A LSTM approach for sales forecasting of goods with short-term demands in E-commerce
Jhamtani et al. Size of wallet estimation: Application of K-nearest neighbour and quantile regression
CN114372848A (zh) 一种基于机器学习的烟草行业智能营销系统
GÜR ALI Driver moderator method for retail sales prediction
WO2023090292A1 (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
Mitra et al. Sales forecasting of a food and beverage company using deep clustering frameworks
Heger et al. Assortment optimization: a systematic literature review
Ma et al. Retail forecasting: research and practice
CN111667314A (zh) 商品资源分配方法、装置及电子设备
Vasilev et al. Sales analysis by the rectangle method
WO2019187968A1 (ja) 情報処理システム、情報処理方法及び記憶媒体
Gupta et al. MegaMart Sales Prediction Using Machine Learning Techniques
Meißner et al. Identifying non-intuitive relationships within returns data of a furniture online-shop using temporal data mining

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210204

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211011

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211011

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20211018

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20211019

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20211224

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20211228

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220308

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220412

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220524

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220531

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20220705

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220728

R151 Written notification of patent or utility model registration

Ref document number: 7120649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151