JP6418537B1 - 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム - Google Patents

説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム Download PDF

Info

Publication number
JP6418537B1
JP6418537B1 JP2017233058A JP2017233058A JP6418537B1 JP 6418537 B1 JP6418537 B1 JP 6418537B1 JP 2017233058 A JP2017233058 A JP 2017233058A JP 2017233058 A JP2017233058 A JP 2017233058A JP 6418537 B1 JP6418537 B1 JP 6418537B1
Authority
JP
Japan
Prior art keywords
data
input
value
prediction
regression equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017233058A
Other languages
English (en)
Other versions
JP2019101833A (ja
Inventor
池 里 美 小
池 里 美 小
條 美 奈 子 北
條 美 奈 子 北
島 正 裕 中
島 正 裕 中
Original Assignee
シーロムパートナーズ税理士法人
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シーロムパートナーズ税理士法人 filed Critical シーロムパートナーズ税理士法人
Priority to JP2017233058A priority Critical patent/JP6418537B1/ja
Application granted granted Critical
Publication of JP6418537B1 publication Critical patent/JP6418537B1/ja
Publication of JP2019101833A publication Critical patent/JP2019101833A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】予測対象とするデータ項目の入力変数の設定範囲を確率密度関数に基づいて適切に設定できるユーザに使いやすく予測精度が向上したデータ予測システム、データ予測方法、及びデータ予測プログラムを提供する。
【解決手段】本発明のデータ予測システムは、観測データに含まれるデータ項目毎に確率密度関数を算出する手段と、データ項目のいずれか1つを目的変数とし、その余のデータ項目の1つ以上を説明変数とする回帰方程式を設定する手段と、設定された回帰方程式の各説明変数に対応する回帰係数を算出する手段と、予測対象とするデータ項目の説明変数に代入される入力値の確率密度を当該データ項目の確率密度関数から算出して表示し、代入された入力値から予測計算を実行する数値又は数値範囲を設定する手段と、回帰方程式に設定された数値又は数値範囲を代入して目的変数の値を算出する手段とを備える。
【選択図】図2

Description

本発明は、データ予測システム、データ予測方法、及びデータ予測プログラムに関し、より詳しくは、説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラムに関する。
関連する多様な項目のデータに基づいて、目的とする事象について多面的な予測を行い、その予測結果、即ち予測データを評価することは、業務改善や経営戦略の立案などに有用である。例えば、飲食店の経営において、立地、天候、曜日などに応じた多数の店舗の売上データを収集、蓄積して、この蓄積されたデータから、所望の条件における店舗の売上高を予測できれば、飲食店の経営者は、店舗の運営や出店を適切に行うことができる。また、美容院の営業において、店舗ごとの業務記録に基づいた担当者と美容コースとの関係を分析することにより、どのような店舗営業をすれば粗利益が増大するか等を予測できれば、美容院は営業利益を向上できる。
ここで、予測に用いる元データ(例えば、売上データや、実行された営業内容)を説明変数と呼ぶこととする。また、予測したいデータ(例えば、予測したい店舗売上や、予測したい粗利)を目的変数と呼ぶこととする。さらに、説明変数に任意の値を代入(入力)することによって目的変数(予測値)を得ることができる関数を、モデルあるいは予測関数と呼ぶこととする。従来、複数の説明変数と目的変数との関連性を分析するための統計学的な方法として、重回帰分析をはじめとする各種の多変量解析手法が知られている。
例えば、特許文献1に記載の技術では、ホテル内に設置された売店の商品の発注の適切化を図ることを目的に、過去の客数と各商品の売上情報との相関を求めておき、予約情報に基づく各日の予約客数から、先に算出した相関を用いて各日の各商品の売上予測を行い、得られた売上予測に基づいて各日の商品の発注を行うシステムが提案されている。この技術では、予め客の形態(即ち、客層)に応じた複数の区分を設定し、発注商品の品揃えを該当日の予約情報に基づく客の形態に応じて算出している。
しかしながら、この技術において、予測に用いる説明変数に対応する各データ項目の入力値は、ユーザが指定する数値であるため、特定された入力値が未だ存在しない予約受付開始前の将来見込みを予測したい場合には、担当者が、経験と勘を頼りに、想定される数値を繰り返し入力して算出されたそれぞれの値を参考にして、予想値を見積もることになる。この際、算出された値のいずれを予測値とするかについて、具体的な裏付けがないため、予測精度が保証されないという問題がある。つまり、現実に即していない説明変数を用いて予測したことにより、予測値として計算された値が現実に起こり得る可能性が著しく低いものになるという問題がある。
一方、将来予測において説明変数となる各事象のデータは、それぞれが何らかのばらつきを有して分布している。そこで、説明変数となる各事象のデータ分布を求めて、確率論的観点から説明変数の入力範囲を絞り込むことにより、より効率的で精度の高い予測が可能となる。しかし、各事象(以下、データ項目という)ごとに統計処理を行って算出された分布特性から適正な入力条件を設定するには、統計学や表計算ソフトウェア等に関する相当の専門知識及び経験が必要である。このため、専門知識や経験が少ない者であっても簡単に現実に即した入力条件を設定でき、業務改善や経営戦略に活用できるデータ予測システム及びデータ予測方法が求められている。
特開平09−26990号公報
本発明は、上記従来の問題に鑑みてなされたものであって、本発明の目的は、回帰分析によるデータ予測システムにおいて、評価項目の入力範囲を適切に設定できる、説明変数に確率密度関数を適用したデータ予測システム、データ予測方法、及びデータ予測プログラムを提供することにある。
上記目的を達成するためになされた本発明の一態様によるデータ予測システムは、説明変数に確率密度関数を適用した回帰分析によるデータ予測システムであって、
複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、ユーザから回帰方程式及び予測条件の設定入力を受け付ける入力部と、前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定し、前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成する予測項目選択部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、前記受け付けた入力値を、前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、前記の各部、及びシステム全般を制御する制御部と、を備え、前記予測条件設定部は、前記入力値が代入される説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成することを特徴とする。
上記目的を達成するためになされた本発明の一態様によるデータ予測方法は、説明変数に確率密度関数を適用した回帰分析によるデータ予測方法であって、
複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、ユーザからの設定入力を受け付ける入力部と、前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目からなる回帰方程式を設定し、前記観測データから前記設定された回帰方程式の目的変数及び説明変数に対応するデータテーブルを作成する予測項目選択部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、前記受け付けた入力値を前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、前記の各部、及びシステム全般を制御する制御部と、を備えたデータ予測システムにおいて、
前記制御部が、前記入力部でユーザから回帰方程式及び予測条件の設定入力を受け付けるステップと、前記記憶部に格納された前記観測データを読み出すステップと、前記入力部で受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定するステップと、前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成するステップと、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出するステップと、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出するステップと、前記予測条件設定部に、前記設定された回帰方程式の各説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成させるステップと、前記確率密度分布グラフが表示された前記予測条件設定部の入力用画面で、ユーザからの入力値を受け付けるステップと、前記受け付けた入力値を、前記設定された回帰方程式の対応する説明変数に代入して目的変数の値を算出するステップと、前記算出された目的変数の値を前記入力値に対する予測値として出力するステップと、を含むことを特徴とする。
上記目的を達成するためになされた本発明の一態様によるデータ予測プログラムは、複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、ユーザからの設定入力を受け付ける入力部と、前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目からなる回帰方程式を設定し、前記観測データから前記設定された回帰方程式の目的変数及び説明変数に対応するデータテーブルを作成する予測項目選択部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、前記受け付けた入力値を前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、前記の各部、及びシステム全般を制御する制御部と、を備えたコンピュータに、観測データに基づき回帰方程式により予測値を算出する演算処理を実行させるデータ予測プログラムであって、
前記コンピュータに、前記入力部でユーザから回帰方程式及び予測条件の設定入力を受け付けるステップと、前記記憶部に格納された前記観測データを読み出すステップと、前記入力部で受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定するステップと、前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成するステップと、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出するステップと、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出するステップと、前記予測条件設定部に、前記設定された回帰方程式の各説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成させるステップと、前記確率密度分布グラフが表示された予測条件設定部の入力用画面で、ユーザからの入力値を受け付けるステップと、前記受け付けた入力値を、前記設定された回帰方程式の対応する説明変数に代入して目的変数の値を算出するステップと、前記算出された目的変数の値を前記入力値に対する予測値として出力するステップと、を実行させることを特徴とする。
本発明のデータ予測システム及びデータ予測方法によれば、過去の観測データを利用して、回帰分析によるデータ予測を行う際に、観測データの確率密度関数を算出して、予測条件設定時に、各説明変数に対する入力値を当該説明変数に対応する観測データの確率分布と対比して認識できる形態で設定することができるため、より現実に即した条件で予測を行うことができる。したがって、従来より効率的で精度の高い分析が可能になる。また、複雑な予測条件の設定が、表示画面に出力された画像や図表を利用した視覚的な指示操作や数値入力で実行できるため、専門知識や経験が少ない者であってもデータ予測技術を簡単に利用できる。
本発明の一実施形態によるデータ予測システムの構成を示すブロック図である。 本発明の一実施形態によるデータ予測システムの機能的構成を示すブロック図である。 本実施形態によるデータ予測システムの入力部により生成された初期画面の一例を示す図である。 本実施形態によるデータ予測システムの観測データ取得部により生成されたデータ入力用画面の一例を示す図である。 本実施形態によるデータ予測システムの観測データ取得部により生成されたデータテーブルの一例を示す図である。 本実施形態によるデータ予測システムの予測項目選択部により生成された選択入力用画面の一例を示す図である。 本実施形態によるデータ予測システムの予測項目選択部により生成された回帰分析用データテーブルの一例を示す図である。 本実施形態によるデータ予測システムの予測条件設定部により生成された予測条件を設定するための第1の入力用画面の一例を示す図である。 本実施形態によるデータ予測システムの予測条件設定部により生成された予測条件を設定するための第2の入力用画面の一例を示す図である。 本実施形態におけるデータ予測システムの予測処理部により生成された予測結果画面の一例を示す図である。 本実施形態におけるデータ予測システムの予測処理部により生成された予測結果画面の他の例を示す図である。 本発明の一実施形態によるデータ予測方法を示すフローチャートである。 本実施形態による確率密度関数算出部で確率密度関数を算出する方法の一例を示すフローチャートである。
以下、本発明を実施するための形態の具体例を、図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態によるデータ予測システムの構成を示すブロック図である。
図1に示す本発明の一実施形態によるデータ予測システム10は、汎用のコンピュータシステムであって、制御装置11、記憶装置12、入力装置13、表示装置14、及び出力装置15を備える。さらに、外部のデータ端末20等とのネットワーク接続を行う通信装置16を備える。
制御装置11は、中央処理装置(CPU)、並びにROM及びRAM(図示せず)等を有して、OS(Operating System)、所定のプログラム及びデータを読み込み、実行することで、後述する本データ予測システム10を構成する各部(各機能部)を実現するとともにこれら各部を制御する。
記憶装置12には、各種のデータ及びプログラムが格納され、後述するデータ内容に応じた記憶領域(以下、記憶部という)を備える。記憶装置12は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等の不揮発性の記憶装置であることが望ましい。また、1台の記憶装置である必要はなく、ネットワークで接続されて複数台に分散された記憶装置であってもよい。即ち、記憶装置12は、データ予測システム10に内蔵されるか又はネットワークで接続された外部のデータサーバで構成される。
入力装置13は、ユーザからの指示を含む各種入力を受け付けるための装置であって、キーボードやポインティングデバイス、又はタッチパッドなどで構成される。
表示装置14は、取得した情報をユーザに対して視覚的に表すディスプレイ装置である。表示装置14は、タッチ入力が可能なタッチパッドと組み合わされたタッチパネルとして、入力装置13と一部機能を分担する構成とすることも可能である。
出力装置15は、紙媒体への書き込みを行うプリンタ又はコンピュータ読み取り可能な記録媒体への書き込みを行うデータ書き込み装置等であり、コンピュータ本体に接続された外部装置として構成されるか又はコンピュータ内に含まれる形態で構成される。
通信装置16は、ネットワーク接続するための通信デバイス等で構成された通信インタフェースである。通信装置16は、例えば、有線又は無線LAN(Local Area Network)、Bluetooth(登録商標)、又はWi−Fi(登録商標)用の通信カード等であり、また、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は、各種通信用のモデム等であってもよい。
なお、データ端末20は、本データ予測システム10での予測に利用する観測データを提供するネットワーク接続された外部のコンピュータ端末又はデータサーバであり得る。
本発明の一実施形態によるデータ予測システム10は、単独のコンピュータで構成される形態に限定されるものではなく、ネットワーク接続された複数台のコンピュータによって構成され得る。或いは、本データ予測システム10は、外部のクライアント端末からの要求に応答して、データ予測処理を実行し、処理結果をクライアント端末に送信する形態で構成され得る。
以下、本発明の一実施形態によるデータ予測システムについて、図1及び図2を参照しながら説明する。一例として、不動産販売業の営業戦略に利用するデータを予測する場合について説明する。
図2は、本発明の一実施形態によるデータ予測システムの機能的構成を示すブロック図である。
図2に示すように、本実施形態によるデータ予測システム10は、制御装置11でデータ予測プログラムを実行させることで実現されるシステムである。データ予測システム10は、入力部110、予測項目選択部120、予測条件設定部130、観測データ取得部140、確率密度関数算出部150、回帰係数算出部160、予測処理部170、及び出力部180を備え、観測データ格納部210、確率密度関数格納部220、回帰係数格納部230、及び予測データ格納部を含む記憶部200が記憶装置12内に備えられ、これらの構成要素を制御部100が制御する。
入力部110は、ユーザから本システムに実行させる処理を指示する入力を受け付けるための初期画面を生成して表示装置14に出力し、表示された初期画面に基づくユーザの指定入力を、入力装置13から受け取って所定の出力先に出力する。具体的に、入力部110は、後述する回帰方程式の設定入力及び予測条件の設定入力を受け付ける各機能部へ移動する指示入力を受け付けて、受け付けた指示入力を制御部100に出力する。制御部100は、指定入力に対応するプログラムを実行することで実現される各機能部を動作させて指定された処理を進行させる。
図3は、本実施形態によるデータ予測システムの入力部により生成された初期画面の一例を示す図である。
入力部110は、初期画面でユーザから、例えば、予測したい項目を選択する画面に移動する指示入力、即ち、図3に示す「2.予測項目選択」の画像部分を指示(ポインティング)する入力を受け付けると、予測項目選択部120にその指示入力を出力する。
同様に、入力部110は、初期画面でユーザから、予測したい条件範囲を設定する画面に移動する指示入力、即ち、図3に示す「3.予測条件設定」の画像部分を指示(ポインティング)する入力を受けると、予測条件設定部130にその指示入力を出力し、予測に利用する観測データを入力する画面に移動する指示入力、即ち、図3に示す「1.データ入力」の画像部分を指示(ポインティング)する入力を受けると、観測データ取得部140に当該指示入力を出力する。
観測データ取得部140は、入力部110から観測データを入力する画面に移動する指示入力を受け取ると、観測データを取得するための画面を生成して表示装置14に出力し、表示画面に基づいて、入力装置13に入力された指示に応じて、指定された入力先からデータを取得する。なお、以下の説明では、表示装置14がタッチパッドを備えて入力装置13の指示入力機能を果たすものとして説明する。
図4は、本実施形態によるデータ予測システムの観測データ取得部により生成されたデータ入力用画面の一例を示す図である。
観測データ取得部140は、図4に示すデータ入力用画面の「データファイル一覧」からユーザが所望のデータファイルを指定すると、指示されたデータファイルを当該ファイル格納先の記憶装置から読み込んで観測データ格納部210及び確率密度関数算出部150に出力する。具体的に、観測データ取得部140は、指示されたデータファイル中の個々のデータをデータ項目毎に整列させたデータテーブルに構成して観測データ格納部210に保存し、確率密度関数算出部150に出力する。なお、本明細書中の説明において、データファイルは、「観測データ」から成り、「観測データ」は、予測対象の事象(又は事項)に関連する複数のデータ項目の実測値が所定の順に配列されたデータ(即ち、行データ)である。
図5は、本実施形態によるデータ予測システムの観測データ取得部により生成されたデータテーブルの一例を示す図である。
観測データ取得部140は、例えば、過去に販売した不動産物件ごとの利益率、床面積、築年数、最寄り駅、徒歩時間などのデータからなるCSV形式のデータファイルをデータ端末20から取得して、図5に示すように、物件ごとに、これらのデータ項目が並んだデータテーブル(以下、一般データテーブルという)を生成する。なお、データ項目に質的変数を含める場合、ダミー変数を設定する等の手法を適用することができる。
観測データ取得部140は、取得したCSVデータファイルからデータテーブルを生成するための設定入力として、CSVデータファイルに含まれるデータ項目の中から、着目する変数、即ち予測処理に使用する変数に使用するデータ項目を選択する欄Aを、図4に示すデータ入力用画面に表示してもよい。この場合、観測データ取得部140は、図4に示すデータ入力用画面で指定されたデータ項目で構成されたデータテーブル(以下、選択データテーブルという)を別個に生成して、観測データ格納部210に保存し、確率密度関数算出部150に出力する。これにより、ユーザ所望の要因に着目した予測処理が可能となり、また予測処理時間が短縮される。なお、着目する変数の指定がない場合に生成されるデータテーブルは、一般データテーブルに相当する。
確率密度関数算出部150は、観測データ取得部140から観測データの一般データテーブル又は選択データテーブルを直接受け取るか、又は観測データ格納部210から読み出して、取得したデータテーブルに基づいて、データ項目毎に確率密度関数を算出し、算出した確率密度関数を確率密度関数格納部220に保存する。確率密度関数算出部150が算出する確率密度関数は、各データ項目の事象が出現する確率密度の分布を表す。
確率密度関数算出部150は、各データ項目の確率密度関数を推定する方法として、パラメトリック密度推定、ノンパラメトリック密度推定、又はセミパラメトリックな推定手法のいずれかを使用し得る。
パラメトリック密度推定は、収集した観測データが正規分布、ポアソン分布といった一般的な分布に従うことが明らかな場合に、その分布に対応する分布関数を当てはめて、データからその分布関数のパラメータ値を決める方法である。ノンパラメトリック密度推定は、収集したデータがどの分布に従うかが明らかでない場合に、特定の関数型を仮定しないで、データから分布の形を推定する方法である。また、セミパラメトリックな推定手法は、これらの手法の中間的なもので、複雑な分布を表現するためにパラメータの数を系統的に増やせるようにすることで、パラメトリック密度推定よりも一般的な関数型を表現するセミパラメトリックな手法である。
確率密度関数算出部150が、いずれの方法を利用するかは、予測に際して説明変数として収集した観測データの内容(例えば、データ項目)やデータ数に応じて、予めプログラミングされるか、又は別途の試行結果に基づいてユーザが指定できるように構成され得る。
予測項目選択部120は、入力部110から予測したいデータ項目を選択する画面に移動する指示入力(図3を参照)を受け取ると、予測したいデータ項目(目的変数)の選択入力用画面を生成して表示装置14に出力する。なお、選択入力用画面に表示されるデータ項目は、図4の画面で変数に指定されたデータ項目に限定するのが好ましい。
図6は、本実施形態におけるデータ予測システムの予測項目選択部により生成された選択入力用画面の一例を示す図である。
図6に示す選択入力用画面に表示されたデータ項目の中から、ユーザが所望の項目として、例えば、「利益率」を選択(指示)すると、予測項目選択部120は、選択入力用画面で指示されたデータ項目を、後述する重回帰方程式の目的変数に設定し、その余のデータ項目を説明変数に設定する命令を回帰係数算出部160に出力する。なお、選択入力用画面には、表示されていないデータ項目の追加表示を指示するチェックボックスを配置してもよい。
予測項目選択部120は、さらに、選択入力用画面に表示されたその余のデータ項目の中から、特に注目するデータ項目のみを説明変数に限定するための第2の選択入力用画面を生成して表示装置14に出力してもよい。第2の選択入力用画面は、図示しないが、図6と同様の形式で生成され得る。
予測項目選択部120は、観測データ格納部210から一般データテーブル又は選択データテーブルを取得し、上述した選択入力に基づいて、該当するデータ項目をそれぞれ重回帰方程式の目的変数又は説明変数に対応付けて配列し、配列された各データ項目のセルに個々のデータを配置した回帰分析用データテーブルに構成して回帰係数算出部160に出力する。また、回帰分析用データテーブルは、観測データ格納部210に一般データテーブル又は選択データテーブルとは別個に保存される。
図7は、本実施形態におけるデータ予測システムの予測項目選択部により生成された回帰分析用データテーブルの一例を示す図である。
回帰係数算出部160は、予測項目選択部120から予測処理の対象となるデータ項目の指示入力、即ち、目的変数及び説明変数に設定するデータ項目及びこれに対応する回帰分析用データテーブルの指定を受け取ると、受け取った指定に基づいて、該当するデータ項目のそれぞれを、下記の式(1)で表す重回帰方程式の目的変数y及び説明変数(X、・・・、X)に対応付ける。そして、式(1)の目的変数y及び説明変数(X、・・・、X)のそれぞれに、図7に示す回帰分析用データテーブルの対応するセルのデータを代入して、各説明変数(X、・・・、X)の偏回帰係数(β、・・・、β)及び定数βを算出する。偏回帰係数(β、・・・、β)は、例えば、最小二乗法により算出される。
Figure 0006418537
回帰係数算出部160は、算出した偏回帰係数(β、・・・、β)及び定数βを回帰係数格納部230に保存する。なお、回帰係数算出部160は、多重共線性を評価して、予測計算の際に使用し得る説明変数を限定する処理を行ってもよい。本実施形態において、説明変数とするデータ項目を1つだけ選択した場合は、単回帰分析となるのは自明であるので、その説明は省略する。
予測条件設定部130は、入力部110から予測条件を設定する画面に移動する指示入力(図3を参照)を受け取ると、予測条件を設定するための入力用画面を生成して表示装置14に出力する。
図8は、本実施形態におけるデータ予測システムの予測条件設定部により生成された予測条件を設定するための第1の入力用画面の一例を示す図である。
図8に示す第1の入力用画面は、ユーザが先に目的変数に設定したデータ項目に対して、影響を及ぼすデータ項目、言い換えると回帰方程式の説明変数に代入する入力値(以下、入力パラメータという)に設定するデータ項目を選択するための入力用画面である。例えば、ユーザが目的変数に設定したデータ項目の「利益率」に対する「床面積」の影響を調べたい場合、ユーザは同画面上に表示されたデータ項目の中から、「床面積」の欄にチェックを入れる(ポインティングする)。その後、第1の入力用画面に表示された「決定」ボタンが指示(ポインティング)されると、予測条件設定部130は、チェックされたデータ項目に対して、さらに予測条件を設定するための第2の入力画面を生成する。
予測条件設定部130は、第1の入力用画面で入力パラメータに設定するデータ項目を「決定」する上記入力を受け取ると、設定されたデータ項目に対応する確率密度関数を確率密度関数格納部220から取得して、先に取得した回帰分析用データテーブルの当該データ項目に含まれるデータの分布範囲に対応させた確率密度分布グラフを作成する。そして、作成した確率密度分布グラフを含む形態で、予測条件を設定するための第2の入力用画面を生成して表示装置14に出力する。なお、第2の入力用画面の構成及び表示させるグラフ若しくは図表の形式は、予めプログラミングされるか又はユーザが設定できるように構成され得る。
図9は、本実施形態におけるデータ予測システムの予測条件設定部により生成された予測条件を設定するための第2の入力用画面の一例を示す図である。
図9に示す第2の入力用画面は、ユーザが入力パラメータに設定したデータ項目に対して、予測処理を実行するデータ範囲を設定するための画面である。例えば、ユーザが、データ項目の「床面積」を入力パラメータに設定した場合、予測条件設定部130は、横軸を床面積、縦軸を確率密度とするグラフ(分布曲線)を作成して第2の入力用画面内に表示する。また、第2の入力用画面には、入力値のデータ範囲を指定するための入力欄Bが設けられる。具体的に、入力欄Bは、入力値の上限a及び下限bをそれぞれ入力するための欄が個別に設けられてもよい。あるいは、グラフ画面上で入力値のデータ範囲の上限a及び下限bを表す軸線をポインタで移動させる方式で設定できる構成にしてもよい。なお、入力欄Bの上限及び下限を同じ値に設定すれば、その値が単一の入力値として設定される。
予測条件設定部130は、さらに、第2の入力用画面内に、入力中の設定条件を確認するための設定確認欄Cを設けて、入力中のデータ範囲に基づく付加情報を表示させ得る。具体的に、予測条件設定部130は、入力欄Bで設定された入力値のデータ範囲の上限a及び下限bの値に基づき、上限aと下限bとの間の区間に対応する確率を算出し、また上限a及び下限bを示す軸線と確率密度分布曲線との交点位置の高さ(例えば、ピーク高さとの比)を算出して設定確認欄Cに表示する。したがって、ユーザに入力値の妥当性を確認する情報を提供することができる。
第2の入力用画面を上述の構成で生成することにより、ユーザは、影響を評価したいデータ項目に関する予測条件を、現実にデータが存在する範囲とそのデータ分布状態とを視覚的に確認しながら適正に設定することができる。なお、ユーザは、第2の入力用画面の「再設定」を指示することにより、第1の入力用画面に戻って、入力パラメータに設定するデータ項目の選択から、やり直すことができる構成とすることも可能である。
なお、本実施形態では、影響を評価したいデータ項目を1項目とした例について説明したが、これに限定されない。例えば、図9に示す第2の入力用画面で、「次設定」を指示することにより、影響を評価したいデータ項目を複数選択できる構成としてもよい。このために、選択されたデータ項目毎に別個の第2の入力用画面を生成する構成、又は、同一画面上に複数のデータ項目の分布グラフを表示する構成など、多様に変更実施することが可能である。
予測条件設定部130は、図9に示す第2の入力用画面で「完了」を指示する入力を受け取ると、その時点での各入力値を、当該データ項目に対して予測処理を実行するデータ範囲として設定し、予測処理部170に出力する。例えば、図9に示す実施形態では、データ項目の「床面積」が入力パラメータに設定され、入力値のデータ範囲として、下限aに60m、上限bに80mが設定されると、予測条件設定部130は、これらの設定データを予測処理部170に出力する。なお、このように設定された予測条件で、回帰分析の実行開始の指示を受け付ける入力用画面(図示せず)を生成して表示装置14に出力する。
予測処理部170は、予測条件設定部130から受け取った予測条件の設定データに基づいて、確率密度関数格納部220から入力パラメータに設定されたデータ項目の確率密度関数f(x)を取得する。そして、予測処理を実行する入力値のデータ範囲に設定された下限a及び上限bを確率密度関数f(x)に代入して、積分することにより、下限aから上限bまでの区間の確率P(a≦x≦b)を算出する。
予測処理部170は、また、回帰係数格納部230に格納されている偏回帰係数及び定数を取得して、下記の式(2)に表すように、データ項目の「床面積」を入力パラメータxとする重回帰方程式y(x)の対応する各偏回帰係数(β、・・・、β)及び定数βの項に代入する。
Figure 0006418537
ここで、設定される入力パラメータがxのみの1変数である場合、それ以外の各データ項目の説明変数項(X、・・・、X)には、例えば、各データ項目の確率密度分布が最大値となる位置に対応するデータの値又は各データ項目のデータの平均値をそれぞれに対応する定数(K、・・・、K)として代入する。そして、式(2)の入力パラメータに設定されたデータ項目の説明変数項(X)の入力値として、変数xを下限aから上限bまで変化させて、これに対応する目的変数y(x)の値を算出する。
予測処理部170は、設定された入力パラメータに対応する予測処理が完了すると、算出した目的変数y(x)の値を、変数xに対する予測値として出力部180及び予測データ格納部240に出力する。
出力部180は、所定の予測結果画面を生成し、予測処理部170から受け取った目的変数y(x)の値を同面上に所定の形式でプロットして表示装置14に表示させる。また、予測データ格納部240は、算出された目的変数y(x)の値を、予測条件設定部130で受け付けた各予測条件(例えば、説明変数項(X)のデータ項目及びその入力値x)に対応付けて保存する。
図10は、本実施形態におけるデータ予測システムの予測処理部により生成された予測結果画面の一例を示す図である。
図10に示す予測結果画面は、設定された入力パラメータが説明変数X(x)のみの1変数である場合の例である。この実施形態では、回帰方程式が1次式となるため、入力値として上限及び下限が設定されると、予測処理部170は、図9に示す第2の入力用画面のグラフ領域に当該入力パラメータに設定されたデータ項目確率密度分布曲線に重畳される形態で予測結果を線表示するように画面を構成して出力する。但し、予測結果の出力形態は、これに限定されない。図示しないが、入力パラメータに対して予測値を表形式で表示する形態にしてもよい。
本実施形態の他の例として、複数の入力パラメータが設定される場合、予測処理部170は、回帰係数格納部230に格納されている偏回帰係数及び定数を取得して、下記の式(3)に表すように、各データ項目を入力パラメータとする重回帰方程式y(x1、・・・、)の対応する各偏回帰係数(β、・・・、β)及び定数βの項に代入する。
Figure 0006418537
ここで、入力パラメータに設定された各説明変数項には、それぞれ個別のデータ範囲の数値が代入されるため、便宜上、X(x)、・・・、X(x)と表記する。そして、式(3)の各説明変数をそれぞれの下限値から上限値まで変化させて、予測演算を実行させ、これに対応する目的変数y(x1、・・・、)の値を算出する。
また、予測処理部170は、各説明変数のデータ項目に対応する確率密度関数(f(x)、・・・、f(x))を取得して、個別に設定された入力値のデータ範囲のそれぞれの下限a及び上限bを各確率密度関数f(x)に代入して、積分することにより、下限aから上限bまでの区間のそれぞれの確率(P(a≦x≦b)、・・・、P(a≦x≦b))を算出する。
予測処理部170は、設定された入力パラメータに対応する予測処理が完了すると、算出した目的変数y(x1、・・・、)の値を、各説明変数X(x)、・・・、X(x)に対する予測値として予測データ格納部240に保存する。また、予測処理部170は、所定の予測結果画面を生成して表示装置14に出力する。
図11は、本実施形態におけるデータ予測システムの予測処理部により生成された予測結果画面の他の例を示す図である。
図11に示す予測結果画面は、入力パラメータとして複数の説明変数が設定される場合の例である。本実施形態では、予測条件設定部130は、図8に示す第1の入力用画面で入力パラメータに指定された複数のデータ項目のそれぞれに対して確率密度分布グラフを作成し、これらのデータ項目に対応する説明変数のそれぞれに代入する入力値を設定するための第2の入力用画面(図11に示す予測結果画面に対応)を生成する。
本実施形態の第2の入力用画面には、各説明変数に代入する入力値を設定するための入力用テーブルが設けられ、この入力用テーブルの所定欄に各説明変数に対応する確率密度分布グラフが埋め込まれる。そして、ユーザが予測結果を見たい説明変数のセルに確率密度分布グラフを参照して所望の数値を入力すると、予測処理部170は、入力された数値を回帰方程式の該当する説明変数に代入して予測値を算出して、図11に示す予測結果画面の結果表示欄に表示する。なお、数値が入力されない説明変数には、予め算出された所定の定数が代入される。所定の定数は、例えば、説明変数に対応するデータ項目の観測データの平均値又はその確率密度分布が最大値となる位置に対応する同データの値である。
上述のように、本発明のデータ予測システムによれば、ユーザは所望の説明変数に対して、その発現確率を認識しながら予測値を確認することができる。但し、予測結果の出力形態は、これに限定されない。例えば、任意の2つの変動パラメータを選択して、これらを縦軸及び横軸に配した2次元グラフの形態で予測結果を表示するなど、多様に変更実施することが可能である。
また、本発明のデータ予測システムによれば、多数のデータ項目からなる観測データを利用して、回帰分析によるデータ予測を行う際に、各データ項目の確率密度関数を予め推定し、確率的観点から代入されるべき説明変数及びその範囲を絞り込むことができるため、より効果的且つ正確な目的変数の予測が可能になる。
以下、本発明の一実施形態によるデータ予測システム及びデータ予測方法を適用して、予測に利用する観測データからデータ予測を実行する段階を図1〜3及び図12を参照しながら詳細に説明する。
本実施形態によるデータ予測方法では、データ予測システム10が、データ予測プログラムを実行して、後述するステップS100からステップS370までの一連のステップを、ユーザの指示入力に基づいて進行させるため、ユーザによる操作は、上述したデータ予測システム10が画面表示する選択用アイコンの指示(ポインティング)及び入力欄への数値入力に簡略化される。したがって、ユーザは、高度な数学的知識やプログラミング技能を必要とせずに、統計理論に基づく予測結果を得ることができる。なお、本実施形態によるデータ予測システムは、取得した観測データに含まれる全てのデータ項目に対して、予測計算を行うことに代えて、予測に利用するデータ項目を指定することも可能である。
図12は、本発明の一実施形態によるデータ予測方法を示すフローチャートである。
図12に示すように、データ予測システム10が起動されると、データ予測システム10の制御部100は、データ予測プログラムを実行して初期画面(図3を参照)を生成し、表示装置14に表示させる(ステップS100)。なお、以下の説明では各段階の処理を実行する本システムの個々の構成要素の機能及び動作の詳細説明は省略する。画面入力はタッチパネルを備えて入力装置13のポインティング入力機能を兼ねる表示装置14が対応するものとして説明する。
初期画面に表示された「作業項目」の中の「1.データ入力」が選択されると(ステップS110)、制御部100は、観測データ取得部140に、データ入力用画面(図4を参照)を生成して表示させる(ステップS120)。データ入力用画面に表示されたファイルリストから、取得するデータファイルが指定されると、観測データ取得部140は、当該データファイルが格納された記憶装置からデータファイルを取得する(ステップS130)。例えば、ネットワーク接続されたデータ端末20から取得する場合、データ予測システム10は、通信装置16を介して、データ端末20に対して指定のデータファイルを出力するように要請する。
観測データ取得部140は、取得したデータファイル中の個々のデータをデータ項目毎に整列させたデータテーブルを作成し、データファイルに含まれるデータ項目のリストをデータ入力用画面に表示する(ステップS140)。その後、ユーザの選択入力に基づいて、選択されたデータ項目で構成された選択データテーブルを作成して(ステップS150)、観測データ格納部210及び確率密度関数算出部150に出力し、確率密度関数算出部150は、選択データテーブルに基づいて、データ項目毎の確率密度関数を算出し、算出された確率密度関数を確率密度関数格納部220に出力する(ステップS160)。その後、制御部100は、ステップS100に戻って、初期画面を表示させる。なお、確率密度関数算出部150は、選択データテーブルを観測データ取得部140から直接受け取らずに、観測データ格納部210から読み出して、データ項目毎の確率密度関数を算出してもよい。
図13は、本実施形態による確率密度関数算出部で確率密度関数を算出する方法の一例を示すフローチャートである。
以下では、確率密度関数算出部150が、ノンパラメトリック密度推定により、確率密度関数を算出する例を説明する。
図13に示すように、確率密度関数算出部150は、観測データ取得部140から選択データテーブルを受け取ると(ステップS151)、選択データテーブルに含まれるデータ項目毎に、最小値及び最大値を求める(ステップS152)、そして、最小値と最大値との間の領域に所定数のビン(区間)を設定し、設定した各ビン内における各データの値を平均値と見做し、選択データテーブルの対応するデータ項目のデータを利用して各ビン内における各データに対応する確率分布の値を算出する(ステップS153)。確率密度関数を推定するため、本実施形態では、カーネル関数を使用し、カーネル関数としては、正規核関数を用いる。
その後、ステップS153で算出した確率分布の値の平均値を各ビン内における各データ点の関数の値と推定する(ステップS154)。各ビン内における各データの値をx、関数の値をyとしてグラフを作成し、ステップS154で算出した関数の値をベースとし、正規核関数を用いて確率密度関数を算出する(ステップS155)。算出された確率密度関数は、確率密度関数格納部220に保存される(ステップS160)。
次に、初期画面に表示された「作業項目」の中の「2.予測項目選択」が選択されると(ステップS110)、制御部100は、先のステップS140で作成されたデータテーブル及びデータ項目リストを観測データ格納部210から読み出して、予測項目選択部120に、目的変数に設定するデータ項目の選択入力用画面(図6を参照)を生成して表示させる(ステップS220)。なお、先行するステップS140が実行されていない場合、制御部100は、その旨を警告して初期画面に戻るように設定される。
その後、選択入力用画面で目的変数に設定するデータ項目が指示されると、予測項目選択部120は、指示されたデータ項目を目的変数に対応付けるともに、その余のデータ項目を説明変数に対応付けた回帰分析用データテーブル(図7を参照)を作成して回帰係数算出部160に出力する(ステップS230)。回帰係数算出部160は、回帰分析用データテーブルのデータに基づき、これらのデータ項目からなる重回帰方程式について重回帰分析を実行し、各説明変数に対する偏回帰係数を算出する(ステップS240)。その後、制御部100は、ステップS100に戻って、初期画面を表示させる。
最後に、初期画面に表示された「作業項目」の中の「3.予測条件設定」が指示されると(ステップS110)、制御部100は、先のステップS230で作成された回帰分析用データテーブルを読み出して、予測条件設定部130に、予測条件を設定するための第1入力用画面(図8を参照)を生成して表示させる(ステップS320)。予測処理に適用する入力パラメータ、即ち、回帰方程式の説明変数に代入される入力値に設定するデータ項目を選択する指示入力を受け付けると(ステップS330)、予測条件設定部130は、選択されたデータ項目の確率密度分布グラフを作成して、予測処理を実行する際に選択されたデータ項目に対応する入力パラメータのデータ範囲を設定するための第2入力用画面(図9を参照)を生成して表示させる(ステップS340)。予測処理を実行する入力値のデータ範囲を設定する入力を受け付けると(ステップS350)、予測処理部170は、受け取った設定入力に基づいて、設定されたデータ範囲の区間の確率Pと目的変数の値、即ち予測値を算出し、予測結果画面(図10を参照)を生成して表示装置14に出力する(ステップS360)。
その後、制御部100は、予測処理を終了するか又は別の条件で再予測するかを選択するための画像又はアイコンを表示装置14に表示させる(ステップS370)。別の条件で再予測することが選択されると、制御部100は、ステップS100に戻って、初期画面を表示させる。
上述したデータ予測方法は、アセンブラ、C、C++、C#、Java(登録商標)、R言語などのレガシープログラミング言語やオブジェクト指向プログラミング言語などで記述されたコンピュータによる実行可能なプログラムにより実現でき、ROM、EEPROM、EPROM、フラッシュメモリ、フレキシブルディスク、CD−ROM、CD−RW、DVD、SDカード、MOなど装置可読な記録媒体に格納して頒布することができる。
以上、本発明のデータ予測システム及びデータ予測方法によれば、業務ソフト等によって予め作成された観測データを利用して、回帰分析により目的とするデータ項目を予測する際に、説明変数となる各データ項目の確率密度関数を算出して、予測条件設定時に、各説明変数に対する入力値が確率分布と対比して認識できる形態で表示される構成とすることで、ユーザがより現実に即した条件を選択できるように支援することができる。したがって、ランダムに数値を代入する場合と比較して、効率的で効果的な分析が可能になる。さらに、説明変数の確率分布を知ることができるため、シミュレーションしている事象が起こりやすいことであるのか、又は起こりがたいことであるのかについて検証できるという利点がある。
また、本発明のデータ予測システムは、予測条件の設定が表示画面に出力された画像や図表を利用して視覚的に選択する操作で実行できるため、専門知識や経験が少ない者であってもデータ予測技術を簡単に利用できる。さらに、本システムへの入力データは一般的なファイル形式で構成されるため、異なる種類のアプリケーションソフト間のデータ交換が容易であり、使用者の利便性が高いという利点を有する。
以上、本発明の実施形態について図面を参照しながら詳細に説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の技術的範囲から逸脱しない範囲内で多様に変更実施することが可能である。
10 データ予測システム
11 制御装置
12 記憶装置
13 入力装置
14 表示装置
15 出力装置
16 通信装置
20 データ端末
100 制御部
110 入力部
120 予測項目選択部
130 予測条件設定部
140 観測データ取得部
150 確率密度関数算出部
160 回帰係数算出部
170 予測処理部
180 出力部
200 記憶部
210 観測データ格納部
220 確率密度関数格納部
230 回帰係数格納部
240 予測データ格納部

Claims (7)

  1. 説明変数に確率密度関数を適用した回帰分析によるデータ予測システムであって、
    複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、
    ユーザから回帰方程式及び予測条件の設定入力を受け付ける入力部と、
    前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定し、前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成する予測項目選択部と、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、
    前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、
    前記受け付けた入力値を、前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、
    前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、
    前記の各部、及びシステム全般を制御する制御部と、を備え、
    前記予測条件設定部は、前記入力値が代入される説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成することを特徴とするデータ予測システム。
  2. 前記予測条件設定部は、前記設定された回帰方程式の各説明変数の中から選択された特定の説明変数に代入する入力値の最大値及び最小値を指定する入力を受け付け、
    前記予測処理部は、前記選択された特定の説明変数に前記指定された入力値の最大値及び最小値を代入して、前記最大値及び最小値に対応する前記回帰方程式の目的変数の値を算出するとともに、前記算出された確率密度関数を用いて、前記最大値と前記最小値との間の区間の確率を算出することを特徴とする請求項1に記載のデータ予測システム。
  3. 前記予測処理部は、前記設定された回帰方程式の各説明変数の中で、前記入力値が入力されなかった説明変数には、所定の定数を代入することを特徴とする請求項1又は2に記載のデータ予測システム。
  4. 説明変数に確率密度関数を適用した回帰分析によるデータ予測方法であって、
    複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、ユーザからの設定入力を受け付ける入力部と、前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目からなる回帰方程式を設定し、前記観測データから前記設定された回帰方程式の目的変数及び説明変数に対応するデータテーブルを作成する予測項目選択部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、前記受け付けた入力値を前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、前記の各部、及びシステム全般を制御する制御部と、を備えたデータ予測システムにおいて、
    前記制御部が、
    前記入力部でユーザから回帰方程式及び予測条件の設定入力を受け付けるステップと、
    前記記憶部に格納された前記観測データを読み出すステップと、
    前記入力部で受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定するステップと、
    前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成するステップと、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出するステップと、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出するステップと、
    前記予測条件設定部に、前記設定された回帰方程式の各説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成させるステップと、
    前記確率密度分布グラフが表示された前記予測条件設定部の入力用画面で、ユーザからの入力値を受け付けるステップと、
    前記受け付けた入力値を、前記設定された回帰方程式の対応する説明変数に代入して目的変数の値を算出するステップと、
    前記算出された目的変数の値を前記入力値に対する予測値として出力するステップと、
    を含むことを特徴とするデータ予測方法。
  5. 前記ユーザからの入力値を受け付けるステップは、前記設定された回帰方程式の各説明変数の中から選択された特定の説明変数に代入する入力値の最大値及び最小値を指定する入力を受け付けるステップを含み、
    前記目的変数の値を算出するステップは、前記選択された特定の説明変数に前記指定された入力値の最大値及び最小値を代入して、前記最大値及び最小値に対応する前記回帰方程式の目的変数の値を算出するとともに、前記算出された確率密度関数を用いて、前記最大値と前記最小値との間の区間の確率を算出するステップを含むことを特徴とする請求項4に記載のデータ予測方法。
  6. 前記目的変数の値を算出するステップは、前記設定された回帰方程式の各説明変数の中で、前記入力値が入力されなかった説明変数には、所定の定数を代入するステップを含むことを特徴とする請求項4又は5に記載のデータ予測方法。
  7. 複数のデータ項目からなる観測データ及び予測処理に使用されるプログラムを格納する記憶部と、ユーザからの設定入力を受け付ける入力部と、前記受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目からなる回帰方程式を設定し、前記観測データから前記設定された回帰方程式の目的変数及び説明変数に対応するデータテーブルを作成する予測項目選択部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出する回帰係数算出部と、前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出する確率密度関数算出部と、前記設定された回帰方程式の各説明変数に代入する入力値を受け付ける予測条件設定部と、前記受け付けた入力値を前記設定された回帰方程式の各説明変数に代入して目的変数の値を算出する予測処理部と、前記算出された目的変数の値を前記入力値に対する予測値として出力する出力部と、前記の各部、及びシステム全般を制御する制御部と、を備えたコンピュータに、観測データに基づき回帰方程式により予測値を算出する演算処理を実行させるデータ予測プログラムであって、
    前記コンピュータに、
    前記入力部でユーザから回帰方程式及び予測条件の設定入力を受け付けるステップと、
    前記記憶部に格納された前記観測データを読み出すステップと、
    前記入力部で受け付けた設定入力に基づいて、前記観測データに含まれる複数のデータ項目の中のいずれか1つを目的変数とし、その余のデータ項目の中の1つ以上を説明変数とする回帰方程式を設定するステップと、
    前記観測データから前記設定された回帰方程式の前記目的変数及び前記説明変数に対応するデータ項目のデータで構成されたデータテーブルを作成するステップと、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応する回帰係数を算出するステップと、
    前記作成されたデータテーブルを用いて、前記設定された回帰方程式の各説明変数に対応するデータ項目毎に確率密度関数を算出するステップと、
    前記予測条件設定部に、前記設定された回帰方程式の各説明変数に対応するデータ項目の観測データの分布を、前記算出された確率密度関数を用いて確率密度分布グラフの形式で表示させた入力用画面を生成させるステップと、
    前記確率密度分布グラフが表示された前記予測条件設定部の入力用画面で、ユーザからの入力値を受け付けるステップと、
    前記受け付けた入力値を、前記設定された回帰方程式の対応する説明変数に代入して目的変数の値を算出するステップと、
    前記算出された目的変数の値を前記入力値に対する予測値として出力するステップと、 を実行させることを特徴とするデータ予測プログラム。
JP2017233058A 2017-12-05 2017-12-05 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム Active JP6418537B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017233058A JP6418537B1 (ja) 2017-12-05 2017-12-05 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017233058A JP6418537B1 (ja) 2017-12-05 2017-12-05 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム

Publications (2)

Publication Number Publication Date
JP6418537B1 true JP6418537B1 (ja) 2018-11-07
JP2019101833A JP2019101833A (ja) 2019-06-24

Family

ID=64098676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017233058A Active JP6418537B1 (ja) 2017-12-05 2017-12-05 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム

Country Status (1)

Country Link
JP (1) JP6418537B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11410064B2 (en) 2020-01-14 2022-08-09 International Business Machines Corporation Automated determination of explanatory variables

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072844A (ja) * 2005-09-08 2007-03-22 Osaka Gas Co Ltd 予測情報の表示システム
JP2008046835A (ja) * 2006-08-15 2008-02-28 Nomura Research Institute Ltd 企業の信用力算出システム及び算出プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072844A (ja) * 2005-09-08 2007-03-22 Osaka Gas Co Ltd 予測情報の表示システム
JP2008046835A (ja) * 2006-08-15 2008-02-28 Nomura Research Institute Ltd 企業の信用力算出システム及び算出プログラム

Also Published As

Publication number Publication date
JP2019101833A (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
US8799186B2 (en) Choice modelling system and method
JP6848884B2 (ja) 最適化システム、最適化方法、及び、プログラム
KR101263655B1 (ko) 공정 및 비용 관리를 위한 웹 기반의 bim 시스템 및 그의 운용 방법
EP2273448A1 (en) Apparatus and method for supporting cause analysis
JP6856023B2 (ja) 最適化システム、最適化方法および最適化プログラム
US11256996B2 (en) Method for recommending next user input using pattern analysis of user input
US20220253875A1 (en) Method and system for adjustable automated forecasts
JP2017146888A (ja) 設計支援装置及び方法及びプログラム
JP6418537B1 (ja) 説明変数に確率密度関数を適用した回帰分析によるデータ予測システム、データ予測方法、及びデータ予測プログラム
JP7047911B2 (ja) 情報処理システム、情報処理方法及び記憶媒体
JP6594780B2 (ja) 意思決定支援装置を備えるシステム及び意思決定支援方法
WO2002091266A1 (fr) Dispositif fournissant des images
EP3048573A1 (en) An agent-based demand prediction system for generating weather-dependent product demand predictions
JP2023029604A (ja) 特許情報処理装置、特許情報処理方法、およびプログラム
JP5860828B2 (ja) 行動確率推定装置、方法、及びプログラム
US10949320B2 (en) Device, program and recording medium for estimating a number of browsing times of web pages
WO2024134797A1 (ja) 情報処理装置、シミュレーション方法、およびシミュレーションプログラム
JP4879796B2 (ja) Rf分析・rf予測プログラム
JP5696114B2 (ja) 情報推薦装置及び方法及びプログラム
Su et al. Assessing profitability of a newsboy-type product with normally distributed demand based on multiple samples
JP2004302722A (ja) 事業評価システム
AU2016202813A1 (en) Methods and systems for task time estimate re-asssessment in a task scheduling system
JP2022101879A (ja) 需要予測装置、需要予測方法およびプログラム
JP2016091217A (ja) 発注量決定プログラム、発注量決定方法および発注量決定装置
JP2024036587A (ja) 情報処理装置、制御方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180928

R150 Certificate of patent or registration of utility model

Ref document number: 6418537

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250