JP6558375B2 - 説明変数表示優先順位決定システム、方法およびプログラム - Google Patents

説明変数表示優先順位決定システム、方法およびプログラム Download PDF

Info

Publication number
JP6558375B2
JP6558375B2 JP2016555053A JP2016555053A JP6558375B2 JP 6558375 B2 JP6558375 B2 JP 6558375B2 JP 2016555053 A JP2016555053 A JP 2016555053A JP 2016555053 A JP2016555053 A JP 2016555053A JP 6558375 B2 JP6558375 B2 JP 6558375B2
Authority
JP
Japan
Prior art keywords
display priority
explanatory variable
value
variable
explanatory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016555053A
Other languages
English (en)
Other versions
JPWO2016063446A1 (ja
Inventor
洋介 本橋
洋介 本橋
佐也香 八木
佐也香 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016063446A1 publication Critical patent/JPWO2016063446A1/ja
Application granted granted Critical
Publication of JP6558375B2 publication Critical patent/JP6558375B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、説明変数を表示する際の優先順位を決定する説明変数表示優先順位決定システム、説明変数表示優先順位決定方法および説明変数表示優先順位決定プログラムに関する。
種々のビジネスの分野において、入手可能なデータから、将来の推定を行うことは業務改善に有効である。例えば、商店において、直近2週間の売り上げデータから将来の売り上げを推定できれば、在庫管理を適切に行うことができる。
非特許文献1には、統計専門家等の分析者が行う入手可能なデータの解析を支援するソフトウェアが開示されている。非特許文献1が開示するソフトウェアは、推定機能と、推定結果を可視化する機能とを備える。
非特許文献2には、複数の予測式の中から予測式を自動的に選択し、その予測式を用いて予測値を算出する場合に、予測値および実績値のグラフとともに、選択した予測式の推移を示すグラフを表示することが記載されている。
ここで、本明細書では、直近2週間の売り上げデータ等、推定の手がかりとするデータを「説明変数」と呼び、将来の売り上げ等、推定したい変数を「目的変数」と呼ぶことにする。
また、目的変数と説明変数との間に見出された規則性を表す式を「推定式」と呼ぶことにする。また、推定式を用いて推定された値を「推定値」と呼ぶことにする。
推定式は、例えば、以下の形式で表される。
y=a+a+・・・+a+b
上記の式において、yは推定値である。また、x,x,・・・,xは、説明変数である。bは定数項であり、a,a,・・・,a,bは、予め学習用データを用いて決定されている。説明変数の値が与えられた場合、上記の式を用いて、推定値yを算出することができる。
"SAS Visual Analytics"、SAS Institute Japan株式会社、[2014年10月23日検索]、インターネット<URL:http://www.sas.com/ja_jp/software/business-intelligence/visual-analytics.html> 「一歩進んだ機械学習 IoTで激増するデータの活用現場に浸透」、日経BP社、「日経ビッグデータ」、2014年06号、p.7−12
分析者にとっては、推定値の変化の表示とともに、与えられた各説明変数(例えば、各説明変数の値の変化)も把握できることが好ましい。しかし、一般に、説明変数の種類は多く、ランダムな順序で全ての説明変数を表示した場合、分析者にとって説明変数と推定値の関連性を把握しづらくなることが生じ得る。
そこで、本発明は、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数を表示することができる説明変数表示優先順位決定システム、説明変数表示優先順位決定方法および説明変数表示優先順位決定プログラムを提供することを目的とする。
本発明による説明変数表示優先順位決定システムは、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、表示優先順位に従って説明変数を表示する表示手段とを備え、表示優先順位決定手段が、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定することを特徴とする。
また、本発明による説明変数表示優先順位決定システムは、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備え、表示優先順位決定手段が、係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、表示手段が、表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、推定値の変化を表示する領域の近くに表示することを特徴とする。
また、本発明による説明変数表示優先順位決定方法は、コンピュータが、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、表示優先順位に従って説明変数を表示し、表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定することを特徴とする。
また、本発明による説明変数表示優先順位決定方法は、コンピュータが、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定し、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示し、表示優先順位を決定するときに、係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、推定値の変化を表示する領域の近くに表示することを特徴とする。
また、本発明による説明変数表示優先順位決定プログラムは、コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、表示優先順位に従って説明変数を表示する表示処理を実行させ、表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定させることを特徴とする。
また、本発明による説明変数表示優先順位決定プログラムは、コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する表示処理を実行させ、表示優先順位決定処理で、係数の絶対値が大きい説明変数ほど表示優先順位を高く設定させ、表示処理で、表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、推定値の変化を表示する領域の近くに表示させることを特徴とする。
本発明によれば、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数を表示することができる。
本発明の第1の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。 説明変数表示優先順位決定システムに入力される説明変数の例を示す図である。 算出された推定値yの例を示す図である。 表示手段による表示例を示す模式図である。 第1の実施形態の処理経過の例を示すフローチャートである。 推定手段が用いる推定式の例を示す模式図である。 推定式を選択するためのモデルの一例を示す模式図である。 推定手段が用いる複数の推定式の例を示す模式図である。 本発明の第2の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。 第2の実施形態の処理経過の例を示すフローチャートである。 残差導出式の例を示す模式図である。 本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。 本発明の最小構成の例を示すブロック図である。
以下、図面を参照して本発明の実施形態を説明する。
既に説明したように、推定式は、例えば、以下に示す式(1)のように表される。
y=a+a+・・・+a+b 式(1)
yは推定値である。式(1)によって推定される対象の例として、例えば、交通量等が挙げられるが、推定される対象は、特に限定されない。
式(1)内で、説明変数は、x,x,・・・,xと表される。式(1)内に表される説明変数の数は、特に限定されない。
推定値算出のために説明変数が与えられた場合、式(1)を用いて推定値yが得られる。
ここで、推定値算出のために与えられる説明変数の種類として、連続型変数とカテゴリ型変数がある。
連続型変数は値として数値をとる。連続型変数の例として、例えば、気温等が挙げられる。
カテゴリ型変数は値として項目をとる。カテゴリ型変数の例として、例えば、「性別」が挙げられる。「性別」を例にして説明すると、カテゴリ型変数である「性別」の取り得る値は、「男性」、「女性」である。また、カテゴリ型変数の他の例として、例えば、曜日等が挙げられる。「曜日」を例にして説明すると、カテゴリ型変数である「曜日」の取り得る値は、例えば、「日曜日」、「月曜日」、・・・、「土曜日」である。
1つの連続型変数は、推定式内の説明変数(換言すれば、推定式に含まれる説明変数)x,x,・・・,xのうちの1つに対応する。そして、連続型変数に該当する説明変数の値(数値)が与えられた場合、その値は、推定式内の対応する説明変数に代入される。
また、1つのカテゴリ型変数の各値は、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。例えば、カテゴリ型変数である「曜日」の取り得る各値(「日曜日」、「月曜日」等の各項目)は、それぞれ、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。カテゴリ型変数に該当する説明変数の値(項目)が与えられた場合、そのカテゴリ型変数の各値に対応する推定式内の各説明変数には、二値(例えば、0と1)のうちいずれかの値が代入される。より具体的には、カテゴリ型変数に該当する説明変数の値(項目)が与えられた場合、その値に対応する推定式内の説明変数には1が代入され、そのカテゴリ型変数の他の各値に対応する推定式内の各説明変数にはそれぞれ0が代入される。例えば、カテゴリ型変数である「曜日」の値として「月曜日」が与えられた場合、月曜日に対応する推定式内の説明変数には1が代入され、月曜日以外の各曜日に対応する推定式内の各説明変数には、それぞれ0が代入される。以下の説明では、二値として0または1が代入されるものとして説明する。
このように、連続型変数に対応する推定式内の説明変数にその連続型変数の値が入力され、カテゴリ型変数の各値に対応する推定式内の各説明変数に二値のいずれかが代入されることで、推定値yが得られる。
なお、上記のように、1つのカテゴリ型変数の各値は、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。従って、1つのカテゴリ型変数と、推定式内の複数の説明変数とが対応しているということができる。
本発明は、推定値yを算出するために与えられる説明変数(種々の連続型変数や種々のカテゴリ型変数)の表示優先順位を決定する。
実施形態1.
図1は、本発明の第1の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。第1の実施形態の説明変数表示優先順位決定システム1は、推定手段2と、表示優先順位決定手段3と、表示手段4とを備える。
説明変数表示優先順位決定システム1には、連続型変数やカテゴリ型変数に該当する種々の説明変数の値が、入力デバイス(図1において図示略)を介して入力される。
推定手段2は、各説明変数の値が入力されると、予め定められた式(1)の形式で表される推定式を用いて、推定値を算出する。推定手段2が用いる推定式は、予め学習用データを用いて決定されている。
推定手段2は、入力された連続型変数に該当する説明変数の値を、その連続型変数に対応する推定式内の説明変数に代入する。また、推定手段2は、入力されたカテゴリ型変数に該当する説明変数の値に対応する推定式内の説明変数に1を代入し、そのカテゴリ型変数の他の各値に対応する推定式内の各説明変数にそれぞれ0を代入する。そして、推定手段2は、推定式を計算することによって、推定値yを算出する。
各説明変数の値は、説明変数表示優先順位決定システム1に入力され、推定手段2は、各説明変数の値と推定式とによって、推定値yを算出する。各説明変数の値は、例えば、時間情報と関連付けされている。この場合には、推定手段2は、個々の時点での各説明変数の値と、推定式とによって、個々の時点における推定値yを算出する。
図2は、説明変数表示優先順位決定システム1に入力される説明変数の例を示す図である。図2では、「日付」および「時間」が時間情報に該当する。そして、説明変数「曜日」、「気温」、「時間区分」および「湿度」がこの時間情報に関連付けられている。なお、「曜日」および「時間区分」は、カテゴリ型変数である。本例では、「時間区分」の取り得る値は、「営業時間内」と「営業時間外」であるとする。「気温」および「湿度」は、連続型変数である。図2に例示するように時間情報に関連付けられた各説明変数の値が入力された場合、推定手段2は、図2に例示する行毎に、推定値yを算出すればよい。
推定手段2は、算出した推定値yを表示手段4に送る。各説明変数の値が時間情報と関連付けされている場合、推定手段2は、算出した推定値yと、推定値yに対応する時間情報とを関連付けて、表示手段4に送る。
図3は、算出された推定値yの例を示す図である。図3では、推定値yとして消費電力量を例示している。また、この推定値(消費電力量)は、図2に示す各説明変数の値と、推定式とによって得られた値である。図3に示す「日付」および「時間」は、図2に示す「日付」および「時間」と同様であり、図3においても、「日付」および「時間」が時間情報に該当する。推定手段2は、図3に例示する行毎に、推定値yと時間情報とを関連付けて表示手段4に送ればよい。
なお、ここでは、説明を簡単にするため、推定手段2が用いる推定式が1つである場合を例にして説明する。
表示優先順位決定手段3は、説明変数表示優先順位決定システム1に入力される説明変数の値の変化を表示する際の各説明変数の表示優先順位を決定する。「説明変数の値の変化」とは、例えば、時間軸に沿った説明変数の値の変化である。表示優先順位決定手段3は、推定手段2が推定値yを算出するために用いる推定式内の各説明変数x,x,・・・,xの係数(より具体的には係数の絶対値)に基づいて、表示優先順位を決定する。表示優先順位決定手段3は、値が入力される説明変数に対応する推定式内の説明変数の係数の絶対値が大きいほど、説明変数の表示優先順位を高くし、係数の絶対値が小さいほど、説明変数の表示優先順位を低くする。
説明を簡単にするため、値が入力される説明変数が全て連続型変数(例えば、気温、湿度等)であり、推定式内の個々の説明変数x,x,・・・,xもそれぞれ連続型変数に対応しているとする。この場合、表示優先順位決定手段3は、その各連続型変数に対応する推定式内の各説明変数の係数の絶対値を比較し、係数の絶対値の降順に、各連続型変数の表示優先順位を決定すればよい。
推定式において、係数の絶対値が大きい説明変数ほど、推定値yへの影響が大きいと言える。例えば、式(1)において、a=−10であり、a=0.1であるとすると、xに対応する説明変数の方が、xに対応する説明変数よりも、推定値yへの影響が大きい。従って、係数の絶対値の降順に各連続型変数の表示優先順位を決定することによって、推定値yへの影響が大きい説明変数の値の変化を優先的に表示することができる。
上記の例では、説明を簡単にするため、推定値yの計算に用いられる説明変数が全て連続型変数であるものとして説明した。ただし、推定値yの計算に用いられる説明変数は、連続型変数のみとは限らず、カテゴリ型変数も含まれることがある。その場合、カテゴリ型変数の値も説明変数表示優先順位決定システム1に入力される。また、推定式内には、そのカテゴリ型変数の各値(各項目)に対応する説明変数が含まれる。このように、推定値yの計算に用いられる説明変数の中にカテゴリ型変数が含まれる場合、表示優先順位決定手段3は、以下のように、各説明変数の表示優先順位を決定する。
表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出する。この場合、カテゴリ型変数毎に1つの値が算出されることになる。そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。具体的には、カテゴリ型変数毎に算出した値(係数の絶対値の和)および各連続型変数に対応する推定式内の係数の絶対値の降順に、表示優先順位決定手段3は、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。
表示優先順位決定手段3は、決定した各説明変数の表示優先順位を表示手段4に送る。
表示手段4は、推定手段2によって算出された推定値の変化を表示するとともに、表示優先順位決定手段3によって決定された表示優先順位に従って、説明変数の値の変化を表示する。図4は、表示手段4による表示例を示す模式図である。表示手段4は、例えば、画面上部に定められた推定値表示領域11に推定値yの変化を表示する(図4参照)。図4に示す例では、推定値yの変化が軸間軸(横軸)に沿って表示されている。そして、表示手段4は、推定値表示領域11の下方に、表示優先順位に従って、種々の説明変数の値の変化を表示する(図4参照)。図4に示す例では、説明変数の値の変化が時間軸に沿って表示されている。ここで、推定値表示領域11における時間軸と、説明変数の値の変化を表示する際の時間軸とは、互いに揃っていることが好ましい、言い換えると、推定値yの変化と、説明変数の値の変化とを、共通の時間軸に沿って表示することが好ましい。このように表示することにより、分析者は、推定値yと説明変数の値とが時間軸に沿ってどのように相関しているかを直感的に把握できるようになる。図4に示す例において、括弧書きで示す値は、表示優先順位を表している。そして、表示手段4は、表示優先順位の順に、推定値表示領域11に近い側から、説明変数「気温」の値の変化、説明変数「時間区分」の値の変化、説明変数「曜日」の値の変化、説明変数「湿度」の値の変化を表示している。
表示手段4は、表示優先順位の順に、全ての説明変数の値の変化を表示してもよい。あるいは、表示手段4は、表示優先順位の上位所定番目までの説明変数の値の変化を表示してもよい。
また、図4では、表示手段4が、説明変数の値の変化を、ヒートマップ形式(値に応じた色や模様を表示する形式)で表す場合を例示しているが、説明変数の値の変化の表示態様は特に限定されない。例えば、表示手段4は、説明変数の値の変化を折れ線グラフ等で表示してもよい。また、分析者の操作に応じて、表示手段4は、個々の説明変数の値の変化の表示態様を切り替えてもよい。
また、図4では、推定値yと説明変数の値とを時間軸(横軸)に沿って表示しているが、横軸は時間軸に限定されない。横軸に対応する情報と説明変数の値とが関連付けされていれば、横軸に対応する情報は、時間情報に限られず、任意の情報でよい。
推定手段2、表示優先順位決定手段3および表示手段4は、例えば、入力デバイスおよびディスプレイ装置をするコンピュータのCPUによって実現される。この場合、CPUは、例えば、コンピュータのプログラム記憶装置(図1において図示略)等のプログラム記録媒体から説明変数表示優先順位決定プログラムを読み込み、その説明変数表示優先順位決定プログラムに従って、推定手段2、表示優先順位決定手段3および表示手段4として動作すればよい。なお、表示手段4に関しては、ディスプレイ装置に表示を実行させる部分が、CPUによって実現される。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
説明変数表示優先順位決定システム1は、2つ以上の物理的に分離した装置が有線または無線で接続されている構成であってもよい。この点は、後述の実施形態においても同様である。
次に、処理経過について説明する。図5は、第1の実施形態の処理経過の例を示すフローチャートである。
表示優先順位決定手段3は、値が入力される各説明変数の表示優先順位を、推定手段2が推定値算出に用いる推定式内の各説明変数の係数に基づいて決定する(ステップS1)。
ステップS1の処理を具体的に説明する。推定手段2が用いる推定式が図6に示す推定式であるとする。図6に示す例では、推定式内の説明変数x〜xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値(「日曜日」、「月曜日」、・・・、「土曜日」)に対応している。また、推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値(「営業時間内」、「営業時間外」)に対応している。また、推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。なお、図6に示す推定式は、説明を簡単にするために模式的に示したものであり、推定式内のxの数や、推定式内のxがどのような説明変数に対応しているかは、図6に示す例に限定されない。
なお、図6に示す推定式が用いられる場合、説明変数表示優先順位決定システム1には、例えば、個々の時点における「曜日」の値、「気温」の値、「時間区分」の値、「湿度」の値の組が、入力される。
表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出する。図6に示す例では、表示優先順位決定手段3は、カテゴリ型変数「曜日」に関して、「曜日」の各値に対応するx〜xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a|+|a|+|a|+|a|+|a|+|a|を計算する。この計算結果をa1to7と記す。同様に、表示優先順位決定手段3は、カテゴリ型変数「時間区分」に関して、「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a10|を計算する。この計算結果をa9to10と記す。
そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した値a1to7,a9to10および各連続型変数「気温」、「湿度」に対応する推定式内の各説明変数の係数の絶対値に基づいて、カテゴリ型変数である説明変数「曜日」、「時間区分」および連続型変数である説明変数「気温」、「湿度」の表示優先順位を決定する。「気温」に対応する推定式内の説明変数xの係数の絶対値は|a|である。「湿度」に対応する推定式内の説明変数x11の係数の絶対値は|a11|である。表示優先順位決定手段3は、a1to7,a9to10,|a|,|a11|の降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。例えば、|a|>a9to10>a1to7>|a11|であれば、表示優先順位決定手段3は、「気温」、「時間区分」、「曜日」、「湿度」の順に、表示優先順位を、1位、2位、3位、4位と決定する。
また、各説明変数の値が説明変数表示優先順位決定システム1に入力されると(ステップS2)、推定手段2は、各説明変数の値と推定式とによって、推定値yを算出する(ステップS3)。例えば、ある時点における各説明変数「曜日」、「気温」、「時間区分」および「湿度」の値として、「日曜日」、「25℃」、「営業時間外」および「60%」が入力されたとする。推定手段2は、x=1,x=25,x10=1,x11=60を代入し、図6に示す推定式内のその他の説明変数には0を代入することによって、その時点における推定値yを算出する。推定手段2は、他の時点における推定値も同様に算出する。推定手段2は、算出した推定値yと、推定値yに対応する時間情報とを関連付けて、表示手段4に送る。
次に、表示手段4は、例えば、図4に例示するように、推定値yの変化を表示するとともに、ステップS1で決定された表示優先順位に従って、説明変数の値の変化を表示する(ステップS4)。上記に例示したように、「気温」、「時間区分」、「曜日」、「湿度」の表示優先順位がそれぞれ1位、2位、3位、4位である場合、表示手段4は、推定値表示領域11(図4参照)に近い側から、気温の変化、時間区分の変化、曜日の変化、湿度の変化を表示すればよい。また、表示手段4は、表示優先順位の上位所定番目(例えば、上位3番目)までの説明変数の値の変化を表示してもよい。上位何番目までの説明変数の値の変化を表示するかは、例えば、予め定めておけばよい。
本実施形態によれば、上記のように、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数の値の変化を表示することができる。その結果、推定値yへの影響が大きい説明変数の値の変化を優先的に表示できる。
また、本実施形態によれば、表示手段4は、推定値の変化を所定の軸(典型的には時間軸)に沿って表示し、さらに、説明変数の値の変化も、共通の時間軸に沿って表示する。言い換えると、表示手段4は、推定値の変化と説明変数の値の変化とを、同一の軸に沿って表示する。これにより、分析者にとって、推定値の変化と説明変数の変化とが、所定の軸に沿ってどのように連動しているかを直感的に把握しやすくなる。
また、表示優先順位に従って表示される対象は、説明変数の値の変化に限定されない。例えば、表示手段4は、説明変数の名称を並べて表示する際に、表示優先順位に従って、説明変数の名称を表示してもよい。この点は、後述の実施形態でも同様である。
上記の実施形態では、推定手段2が用いる推定式が1つである場合を例にして説明したが、推定手段2が用いる推定式が2つ以上存在していてもよい。例えば、推定手段2が複数の推定式の中から1つの推定式を選択し、選択した推定式を用いて推定値を算出してもよい。以下、第1の実施形態の変形例として、この場合の動作について説明する。なお、既に説明した動作と同様の動作については、説明を省略する。
本変形例における説明変数表示優先順位決定システムの構成は、図1に示す構成と同様である。ただし、推定手段2および表示優先順位決定手段3の動作が一部異なる。表示優先順位決定手段3の動作については後述する。
本変形例において、推定手段2は、推定式を選択するためのモデルを記憶している。このモデルは、個々の時点における各説明変数の値に応じて一つの推定式を定めることが可能なモデルである。図7は、推定式を選択するためのモデルの一例を示す模式図である。推定手段2は、ある時点の各説明変数の値に応じて、図7に模式的に示すモデルから推定式を選択し、その時点の各説明変数の値および選択した推定式によって推定値を算出する。推定式を選択した後、その推定式を用いて推定値yを算出する動作は、前述の第1の実施形態における動作と同様である。複数の推定式、および推定式を選択するためのモデルは、予め学習用データを用いて決定されている。
なお、図7では、木構造のモデルを表しているが、モデルは、共通のリーフを有し、ルートが異なる複数の木構造を有するモデルであってもよい。
本変形例における処理経過は、図5における処理経過と同様である。ただし、ステップS1において、表示優先順位決定手段3は、値が入力される各説明変数の表示優先順位を、推定手段2が推定値算出に用いる複数の推定式内の各説明変数の係数に基づいて決定する。
推定手段2が用いる複数の推定式が図8に示す2つの推定式であるとする。ここでは、説明を簡単にするため、推定式が2つであるものとして説明するが、推定式の数は3以上であってもよい。図8に示す例では、2つの推定式にはそれぞれ説明変数x〜x11が含まれている。図6に示す場合と同様に、図8に示す各推定式内の説明変数x〜xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値に対応している。また、各推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、各推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値に対応している。また、各推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。図8に示す2つの推定式は、説明を簡単にするために模式的に示したものであり、推定式内のxの数や、推定式内のxがどのような説明変数に対応しているかは、図8に示す例に限定されない。
表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出する。図8に示す例では、表示優先順位決定手段3は、カテゴリ型変数「曜日」に関して、1番目の推定式で「曜日」の各値に対応するx〜xの各係数の絶対値、および2番目の式で「曜日」の各値に対応するx〜xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a|+|a|+|a|+|a|+|a|+|a|+|a’|+|a’|+|a’|+|a’|+|a’|+|a’|+|a’|を計算する。この計算結果をAとする。同様に、表示優先順位決定手段3は、カテゴリ型変数「時間区分」に関して、1番目の推定式で「時間区分」の各値に対応するx,x10の各係数の絶対値、および2番目の式で「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a10|+|a’|+|a10’|を計算する。この計算結果をAとする。このように、表示優先順位決定手段3は、カテゴリ型変数毎に1つの値を算出する。
また、表示優先順位決定手段3は、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出する。図8に示す例では、表示優先順位決定手段3は、連続型変数「気温」に関して、1番目の推定式で「気温」に対応するxの係数の絶対値、および2番目の推定式で「気温」に対応するxの係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a’|を計算する。この計算結果をAとする。同様に、表示優先順位決定手段3は、連続型変数「湿度」に関して、1番目の推定式で「湿度」に対応するx11の係数の絶対値、および2番目の推定式で「湿度」に対応するx11の係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a11|+|a11’|を計算する。この値をAとする。このように、表示優先順位決定手段3は、連続型変数毎に1つの値を算出する。
そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した係数の絶対値の和(本例では、A,A)と、連続型変数毎に算出した係数の絶対値の和(本例では、A,A)とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。本例では、表示優先順位決定手段3は、A,A,A,Aの降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。例えば、A>A>A>Aであれば、表示優先順位決定手段3は、「気温」、「時間区分」、「曜日」、「湿度」の順に、表示優先順位を、1位、2位、3位、4位と決定する。
各説明変数の値が説明変数表示優先順位決定システム1に入力されると(ステップS2)、推定手段2は、各説明変数の値と前述のモデル(推定式を選択するためのモデル)とによって、推定式を選択し、その各説明変数の値および選択した推定式によって推定値を算出する(ステップS3)。
ステップS4は、既に説明したステップS4と同様であり、説明を省略する。
本変形例においても、第1の実施形態と同様の効果が得られる。
なお、第1の実施形態およびその変形例において、ステップS1の実行タイミングは上記の例に限定されない。例えば、説明変数表示優先順位決定システム1は、ステップS3の後にステップS1を実行してもよい。
実施形態2.
図9は、本発明の第2の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。第2の実施形態の説明変数表示優先順位決定システム1は、推定手段12と、表示優先順位決定手段13と、表示手段4とを備える。表示手段4は、第1の実施形態における表示手段4と同様であり、説明を省略する。
本実施形態の説明変数表示優先順位決定システム1には、第1の実施形態と同様に、各説明変数の値が入力デバイス(図9において図示略)を介して入力される。また、説明変数の組に対応する推定対象の実測値も、説明変数表示優先順位決定システム1に入力デバイスを介して入力される。本実施形態の説明変数表示優先順位決定システム1は、既に実測値が得られている個々の時点での各説明変数の値に基づいて推定値を算出し、個々の時点における推定値と実測値との誤差を求める。そして、説明変数表示優先順位決定システム1は、その誤差の推定値である残差を求めるための推定式(以下、残差推定式と記す。)を導出し、残差推定式内の各説明変数の係数に基づいて、値が入力される各説明変数の表示優先順位を決定する。
以下の説明では、説明変数表示優先順位決定システム1に入力される各説明変数は、図2に例示するように、時間情報に関連付けられているものとする。同様に、説明変数表示優先順位決定システム1に入力される実測値も、時間情報に関連付けられているものとする。
推定手段12は、個々の時点における各説明変数の値が入力されると、予め定められた式(1)の形式で表される推定式と、個々の時点における各説明変数の値とを用いて、推定値yを算出する。推定式を用いて推定値yを算出する動作は、第1の実施形態で説明しているので、ここでは説明を省略する。
なお、推定手段12は、個々の時点における推定値yを算出する際に、第1の実施形態の変形例と同様に、複数の推定式の中から1つの推定式を選択し、その推定式を用いて推定値yを算出してもよい。
推定手段12は、算出した各時点の推定値yを表示優先順位決定手段13および表示手段4に送る。
表示優先順位決定手段13は、個々の時点毎に、推定手段12によって算出された推定値yと、説明変数表示優先順位決定システム1に入力された実測値との誤差を算出する。すなわち、実測値をYとし、推定値yと実測値Yとの誤差をZとすると、表示優先順位決定手段13は、個々の時点毎に、以下に示す式(2)の計算によって誤差Zを算出する。
Z=|y−Y| 式(2)
表示優先順位決定手段13は、個々の時点における誤差Zを算出後、誤差の推定値である残差を求めるための推定式(残差推定式)を導出する。以下、残差を記号zで表す。ここで、表示優先順位決定手段13は、式(1)に示す推定式内の各説明変数x,x,・・・,xを含む残差推定式を導出する。表示優先順位決定手段13は、例えば、個々の時点における各説明変数の値および誤差Zを用いて回帰分析を行うことによって、残差推定式を導出すればよい。誤差推定式は、以下に示す式(3)のように表される。
z=c+c+・・・+c+d 式(3)
dは定数項であり、c〜cはそれぞれ、x〜xの係数である。
表示優先順位決定手段13は、式(3)のように表される残差推定式内の各説明変数の係数(より具体的には係数の絶対値)に基づいて、値が入力される各説明変数の表示優先順位を決定する。
表示優先順位決定手段13が残差推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作は、第1の実施形態において表示優先順位決定手段3が式(1)のように表される推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作と同様である。すなわち、表示優先順位決定手段13は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出する。そして、表示優先順位決定手段13は、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。具体的には、カテゴリ型変数毎に算出した値(係数の絶対値の和)および各連続型変数に対応する残差推定式内の係数の絶対値の降順に、表示優先順位決定手段13は、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。
表示優先順位決定手段13は、決定した各説明変数の表示優先順位を表示手段4に送る。
推定手段12、表示優先順位決定手段13および表示手段4は、例えば、入力デバイスおよびディスプレイ装置をするコンピュータのCPUによって実現される。この場合、CPUは、例えば、コンピュータのプログラム記憶装置(図9において図示略)等のプログラム記録媒体から説明変数表示優先順位決定プログラムを読み込み、その説明変数表示優先順位決定プログラムに従って、推定手段12、表示優先順位決定手段13および表示手段4として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
次に、処理経過について説明する。図10は、第2の実施形態の処理経過の例を示すフローチャートである。
個々の時点での各説明変数の値、およびその個々の時点での推定対象の実測値Yが入力されると(ステップS11)、推定手段12は、個々の時点での各説明変数の値と推定式とによって、個々の時点における推定値yを算出する(ステップS12)。
ステップS12の次に、表示優先順位決定手段13は、個々の時点毎に、推定手段12によって算出された推定値yと、ステップS11で入力された実測値Yとの誤差Zを、前述の式(2)によって算出する。そして、表示優先順位決定手段13は、個々の時点における誤差Zと、ステップS11で入力された個々の時点における各説明変数の値と用いて、例えば、回帰分析によって、式(3)の形式で表される誤差推定式を導出する(ステップS13)。
次に、表示優先順位決定手段13は、残差推定式内の各説明変数の係数に基づいて、値が入力される各説明変数の表示優先順位を決定する(ステップS14)。前述のように、表示優先順位決定手段13が残差推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作は、第1の実施形態において表示優先順位決定手段3が式(1)のように表される推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作と同様である。
ステップ14の処理を具体的に説明する。ステップS13で導出された残差導出式が図11に示す式であるとする。図6に示す場合と同様に、図11に示す残差推定式内の説明変数x〜xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値に対応している。また、残差推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、残差推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値に対応している。また、残差推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。図11に示す残差推定式は、説明を簡単にするために模式的に示したものであり、残差推定式内のxの数や、残差推定式内のxがどのような説明変数に対応しているかは、図11に示す例に限定されない。
表示優先順位決定手段13は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出する。図11に示す例では、表示優先順位決定手段13は、カテゴリ型変数「曜日」に関して、「曜日」の各値に対応するx〜xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段13は、|c|+|c|+|c|+|c|+|c|+|c|+|c|を計算する。この計算結果をc1to7と記す。同様に、表示優先順位決定手段13は、カテゴリ型変数「時間区分」に関して、「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段13は、|c|+|c10|を計算する。この計算結果をc9to10と記す。
そして、表示優先順位決定手段13は、カテゴリ型変数毎に算出した値c1to7,c9to10および各連続型変数「気温」、「湿度」に対応する残差推定式内の各説明変数の係数の絶対値に基づいて、カテゴリ型変数である説明変数「曜日」、「時間区分」および連続型変数である説明変数「気温」、「湿度」の表示優先順位を決定する。「気温」に対応する残差推定式内の説明変数xの係数の絶対値は|c|である。「湿度」に対応する残差推定式内の説明変数x11の係数の絶対値は|c11|である。表示優先順位決定手段13は、c1to7,c9to10,|c|,|c11|の降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。
次に、表示手段4は、例えば、図4に例示するように、推定値yの変化を表示するとともに、ステップS14で決定された表示優先順位に従って、説明変数の値の変化を表示する(ステップS15)。ステップS15は、第1の実施形態におけるステップS4と同様である。例えば、表示手段4は、推定値yの変化と、各説明変数の値の変化とを、それぞれ、共通の時間軸に沿って表示する。なお、表示手段4は、例えば、推定値表示領域11内に、推定値yの変化とともに実測値Yの変化を表示してもよい。
本実施形態によれば、上記のように、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数の値の変化を表示することができる。特に、本実施形態では、表示優先順位決定手段13は、残差推定式内の説明変数の係数の絶対値に基づいて表示優先順位を定める。従って、誤差が大きくなる要因となる度合いの高い説明変数の値の変化を優先的に表示できる。
本実施形態の効果を具体的に説明する。分析者は、説明変数が表示される順番を見ることにより、その説明変数が残差に大きく影響するかを把握することができる。これにより、分析者は、例えば、推定に対して新たに追加しなくてはならない説明変数について、ヒントを得ることができる。例えば、仮に、表示手段4が、説明変数を「曜日」、「時間区分」、「気温」、「湿度」の順に表示したとする。この表示結果を見た分析者は、例えば、さらに曜日毎の誤差を詳細に分析する。ここで、例えば、金曜日の誤差が他の曜日の誤差と比較して大きかったとする。そして、分析者がさらによく調べてみると、例えば、毎月の第3週の金曜日のみ、目的変数(例えば、消費電力量等)に大きく影響するようなイベントが開催されていることが分かったとする。分析者は、これを受けて、新しく「イベントの有無」という説明変数を追加することを思いつくことができる。
このように、分析者が、残差に大きく影響する説明変数の存在に気付くことができると、分析者は、今まで気付かなかった新たな説明変数の存在に気付くきっかけとすることができる。
また、例えば、仮に、説明変数「気温」が残差に大きく影響することが分かったとする。それをきっかけに、分析者は、例えば、気温の値の変化を詳細に確認する。その結果、例えば、説明変数「気温」にノイズが多く含まれていたとする。これを受けて、分析者は、説明変数「気温」に対してデータクレンジング処理を実行することを思い付くことができる。
このように、分析者が、残差に大きく影響する説明変数の存在に気付くと、分析者は、それをきっかけに、データクレンジング処理を実行する必要がある説明変数の存在に気付くことができる。
また、例えば、仮に「時間区分」という説明変数が、残差に大きく影響することが分かったとする。上記の例では、説明変数「時間区分」が取り得る値は「営業時間外」および「営業時間内」のみである。「時間区分」という説明変数が残差に大きく影響することに基づいて、分析者は、説明変数「時間区分」が取り得る値を、より細分化した方がよいということを着想できる。例えば、分析者は、説明変数「時間区分」が取り得る値を、「営業時間外」、「午前営業時間内」および「午後営業時間内」等のように細分化することを着想できる。同様に、例えば、「年代(10年単位)」という説明変数が残差に大きく影響することが分かった場合には、その説明変数を、より詳細な「年齢(1年単位)」という説明変数として扱った方がよい等ということを着想できる。
このように、分析者が、残差に大きく影響する説明変数の存在に気付くことができると、分析者は、それをきっかけに、詳細化や細分化の必要がある説明変数の存在に気付くことができる。
データマイニングにおいては、分析対象である説明変数の種類が、数百種類、数千種類になることも珍しくない。このよう場合、分析者が、この全ての説明変数について詳細な検討を実施することは容易ではない。本実施形態のように、説明変数を、残差に大きく影響する順に優先順位付けすることにより、分析者は、大量の説明変数の中から、より注視すべき説明変数を選択することができる。これにより、データ分析作業の効率が上がる。
第2の実施形態において、表示優先順位決定手段13は、残差推定式の代わりに、他の式を用いてもよい。例えば、表示優先順位決定手段13は、誤差の絶対値の推定式を導出し、その推定式を用いて、各説明変数の表示優先順位を決定してもよい。また、例えば、表示優先順位決定手段13は、誤差の絶対値が一定以上の値になるか否かを判別分析するための式を導出し、その式を用いて、各説明変数の表示優先順位を決定してもよい。
また、残差推定式や上記に例示した種々の式を作るアルゴリズムと、目的変数の推定式を作るアルゴリズムとは、必ずしも一致していなくてよい。また、回帰分析によって目的変数の推定式を作った後に、決定木で「10以上の誤差になるかどうか」の判別分析を行ってもよい。
上記の各実施形態では、各説明変数の値や推定対象の実測値が時間情報と関連付けて入力される場合を例示した。この場合、表示手段4は、時間経過に伴う推定値の変化や説明変数の変化を表示すればよい。また、各説明変数の値や推定対象の実測値は、時間情報以外の情報と関連付けて入力されてもよく、表示手段4は、時間以外の順序に沿った推定値の変化や説明変数の変化を表示すればよい。
また、本発明の説明変数表示優先順位決定システム1は、学習によって得られた推定式によって推定を行う推定装置に実装されてもよい。あるいは、推定式等の学習を行う学習装置に本発明の説明変数表示優先順位決定システム1が実装されてもよい。例えば、学習装置も、学習した推定式の検算等のために、推定式による推定機能を有する場合がある。そのような学習装置に、説明変数表示優先順位決定システム1が実装されてもよい。
図12は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005と、入力デバイス1006とを備える。
各実施形態の説明変数表示優先順位決定システム1は、コンピュータ1000に実装される。説明変数表示優先順位決定システム1の動作は、プログラム(説明変数表示優先順位決定プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って上記の処理を実行する。
補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
次に、本発明の最小構成を示す。図13は、本発明の最小構成の例を示すブロック図である。本発明の説明変数表示優先順位決定システムは、表示優先順位決定手段73と、表示手段74とを備える。
表示優先順位決定手段73(例えば、第2の実施形態の表示優先順位決定手段13)は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する。より具体的には、表示優先順位決定手段73は、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定する。
表示手段74(例えば、第2の実施形態の表示手段4)は、表示優先順位に従って説明変数を表示する。
そのような構成によって、本発明の効果を得ることができる。
また、表示優先順位決定手段73および表示手段74は、以下のように動作してもよい。
表示優先順位決定手段73(例えば、第1の実施形態の表示優先順位決定手段3)は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する。
表示手段74(例えば、第1の実施形態の表示手段4)は、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する。
上記の各実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
(付記1)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、前記表示優先順位に従って前記説明変数を表示する表示手段とを備え、前記表示優先順位決定手段は、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定することを特徴とする説明変数表示優先順位決定システム。
(付記2)前記表示優先順位決定手段は、前記推定値と前記実測値との誤差の推定量である残差を推定するための残差推定式を導出し、当該残差推定式内の各説明変数の係数に基づいて、前記表示優先順位を決定する付記1に記載の説明変数表示優先順位決定システム。
(付記3)前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記2に記載の説明変数表示優先順位決定システム。
(付記4)前記表示手段は、さらに、前記推定式による推定値の変化を、前記推定値に対応する実測値の変化とともに表示する付記1から付記3のうちのいずれかに記載の説明変数表示優先順位決定システム。
(付記5)前記表示手段は、前記推定式による推定値の変化および前記実測値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する付記4に記載の説明変数表示優先順位決定システム。
(付記6)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備えることを特徴とする説明変数表示優先順位決定システム。
(付記7)前記表示優先順位決定手段は、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、前記表示手段は、前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示する付記6に記載の説明変数表示優先順位決定システム。
(付記8)前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記6または付記7に記載の説明変数表示優先順位決定システム。
(付記9)前記表示優先順位決定手段は、推定値を算出するために選択される推定式が複数存在する場合に、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、連続型変数毎に算出した係数の絶対値の和とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記6または付記7に記載の説明変数表示優先順位決定システム。
(付記10)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、前記表示優先順位に従って前記説明変数を表示し、表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定することを特徴とする説明変数表示優先順位決定方法。
(付記11)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定し、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示することを特徴とする説明変数表示優先順位決定方法。
(付記12)コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、前記表示優先順位に従って前記説明変数を表示する表示処理を実行させ、前記表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定させるための説明変数表示優先順位決定プログラム。
(付記13)コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示処理を実行させるための説明変数表示優先順位決定プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2014年10月24日に出願された日本特許出願2014−216839を基礎とする優先権を主張し、その開示の全てをここに取り込む。
産業上の利用の可能性
本発明は、種々の説明変数の値の変化を提示する装置に好適に適用可能である。
1 説明変数表示優先順位決定システム
2,12 推定手段
3,13 表示優先順位決定手段
4 表示手段

Claims (12)

  1. 推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、
    前記表示優先順位に従って前記説明変数を表示する表示手段とを備え、
    前記表示優先順位決定手段は、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定する
    ことを特徴とする説明変数表示優先順位決定システム。
  2. 前記表示優先順位決定手段は、前記推定値と前記実測値との誤差の推定量である残差を推定するための残差推定式を導出し、当該残差推定式内の各説明変数の係数に基づいて、前記表示優先順位を決定する
    請求項1に記載の説明変数表示優先順位決定システム。
  3. 前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
    請求項2に記載の説明変数表示優先順位決定システム。
  4. 前記表示手段は、さらに、前記推定式による推定値の変化を、前記推定値に対応する実測値の変化とともに表示する
    請求項1から請求項3のうちのいずれか1項に記載の説明変数表示優先順位決定システム。
  5. 前記表示手段は、前記推定式による推定値の変化および前記実測値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する
    請求項4に記載の説明変数表示優先順位決定システム。
  6. 推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、
    前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備え
    前記表示優先順位決定手段は、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、
    前記表示手段は、前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示する
    ことを特徴とする説明変数表示優先順位決定システム。
  7. 前記表示優先順位決定手段は、
    カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
    請求項6に記載の説明変数表示優先順位決定システム。
  8. 前記表示優先順位決定手段は、
    推定値を算出するために選択される推定式が複数存在する場合に、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、連続型変数毎に算出した係数の絶対値の和とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
    請求項6に記載の説明変数表示優先順位決定システム。
  9. コンピュータが、
    推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、
    前記表示優先順位に従って前記説明変数を表示し、
    表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定する
    ことを特徴とする説明変数表示優先順位決定方法。
  10. コンピュータが、
    推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定し、
    前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示し、
    前記表示優先順位を決定するときに、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、
    前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示する
    ことを特徴とする説明変数表示優先順位決定方法。
  11. コンピュータに、
    推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、
    前記表示優先順位に従って前記説明変数を表示する表示処理を実行させ、
    前記表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定させる
    ための説明変数表示優先順位決定プログラム。
  12. コンピュータに、
    推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、
    前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示処理を実行させ、
    前記表示優先順位決定処理で、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定させ、
    前記表示処理で、前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示させる
    めの説明変数表示優先順位決定プログラム。
JP2016555053A 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム Active JP6558375B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014216839 2014-10-24
JP2014216839 2014-10-24
PCT/JP2015/004284 WO2016063446A1 (ja) 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2016063446A1 JPWO2016063446A1 (ja) 2017-08-03
JP6558375B2 true JP6558375B2 (ja) 2019-08-14

Family

ID=55760510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016555053A Active JP6558375B2 (ja) 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム

Country Status (4)

Country Link
US (1) US20170308825A1 (ja)
EP (1) EP3211579A4 (ja)
JP (1) JP6558375B2 (ja)
WO (1) WO2016063446A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019039077A1 (ja) * 2017-08-23 2019-02-28 日本電気株式会社 現金需要予測システム、現金需要予測方法および現金需要予測プログラム
JP6845819B2 (ja) * 2018-02-22 2021-03-24 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP7225688B2 (ja) * 2018-11-05 2023-02-21 日本電気株式会社 解析装置、解析方法、および解析プログラム
JP7413843B2 (ja) * 2020-03-02 2024-01-16 富士電機株式会社 情報処理装置、情報処理方法及びプログラム
JP7567922B2 (ja) 2020-09-28 2024-10-16 日本電気株式会社 予測装置、予測方法、及び、プログラム
WO2024154398A1 (ja) * 2023-01-19 2024-07-25 株式会社Nttドコモ 推定装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062521A (ja) * 2002-07-29 2004-02-26 Nippon Telegr & Teleph Corp <Ntt> 日毎雷害故障数予測装置及び日毎雷害故障数予測方法
JP2005149162A (ja) * 2003-11-17 2005-06-09 Sansaara Corporation:Kk 情報表示解析システムおよび方法
FR2893808A1 (fr) * 2005-11-22 2007-05-25 Thomson Licensing Sas Procede et dispositif de codage d'une image video
US8560346B2 (en) * 2009-01-05 2013-10-15 Siemens Medical Solutions Usa, Inc. System and method for ranking quality improvement factors in patient care
JP2012128800A (ja) * 2010-12-17 2012-07-05 Nippon Steel Engineering Co Ltd プロセスの状態予測方法及びそれを用いたプロセス制御装置
CN104364805A (zh) * 2012-06-13 2015-02-18 索尼公司 信息处理器、信息处理方法和程序

Also Published As

Publication number Publication date
EP3211579A4 (en) 2018-03-14
JPWO2016063446A1 (ja) 2017-08-03
WO2016063446A1 (ja) 2016-04-28
US20170308825A1 (en) 2017-10-26
EP3211579A1 (en) 2017-08-30

Similar Documents

Publication Publication Date Title
JP6558375B2 (ja) 説明変数表示優先順位決定システム、方法およびプログラム
WO2016152053A1 (ja) 精度推定モデル生成システムおよび精度推定システム
JP6603600B2 (ja) 需要予測方法、需要予測装置及び需要予測プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2015108904A (ja) 表示方法、表示装置及び表示プログラム
EP3214585A1 (en) Estimated result display system, estimated result display method and estimated result display program
US20160155081A1 (en) Process flow header
US20170337259A1 (en) Visualizing device, visualizing method and visualizing program
JP6399206B2 (ja) 推定器管理システム
JP5993273B2 (ja) 意思決定支援システム及び方法
JP2014182520A (ja) 情報処理プログラム、情報処理方法および情報処理装置
JPWO2016151620A1 (ja) シミュレートシステム、シミュレート方法およびシミュレート用プログラム
JP6760084B2 (ja) 分析用情報表示システム、方法およびプログラム
US20130030759A1 (en) Smoothing a time series data set while preserving peak and/or trough data points
JP5101846B2 (ja) マーケティング支援システム
JP6531820B2 (ja) 推定器可視化システム
WO2016132684A1 (ja) 影響度可視化システム、方法およびプログラム
JP2019032807A (ja) 要因分析システム、要因分析方法およびプログラム
JP5160670B2 (ja) マーケティング支援システム
JP2015187773A (ja) データ解析装置、データ解析プログラム及びデータ解析方法
JPWO2016151639A1 (ja) 人数予測システム、人数予測方法および人数予測プログラム
JP5574206B1 (ja) チャート表示装置、チャート表示方法、プログラムおよびチャート表示システム
JP4419814B2 (ja) サービス品質評価支援装置
US10187271B2 (en) Network-diagram rendering system, network-diagram rendering method, and network-diagram rendering computer readable medium
JP7565500B2 (ja) 品質推定装置および方法
JP7532707B2 (ja) 予測装置および予測方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190701

R150 Certificate of patent or registration of utility model

Ref document number: 6558375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150