JP6326510B2

JP6326510B2 - 評価システム、評価方法およびデータ解析システム

Info

Publication number: JP6326510B2
Application number: JP2016574300A
Authority: JP
Inventors: 森脇　紀彦; 紀彦森脇; 知明秋富; 淳一平山; 矢野　和男; 和男矢野; 竜治嶺; 文也工藤; 篤志宮本
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2015-08-28
Filing date: 2015-08-28
Publication date: 2018-05-16
Anticipated expiration: 2035-08-28
Also published as: WO2017037768A1; JPWO2017037768A1

Description

本発明は、評価システム、評価方法およびデータ解析システムに関する。

近年、ビッグデータと呼ばれる大量のデータを解析し、今まで人が勘と経験で行ってきた意思決定を支援するデータ解析システムが急速に発展してきており、そのような解析の結果を利用して顧客に対して施策を提示する技術も発展してきている。

このようなデータ解析システムの例として、特許文献１には、設定した目的変数に対して統計的に相関の高い説明変数を順に羅列する処理や、説明変数と目的変数の関係の回帰式を作成する処理を行うデータ解析システムが記載されている。また、特許文献１では、未知の施策導入のリスクを軽減するためのサービス効果計算処理を行っている。この処理により、施策導入によって顧客や従業員の行動が変わることが、利益等にどのように寄与したのかを、定量的に評価している。

特許文献２には、ある操業変数についての操業評価指標の最大値と最小値の差分を基に、その操業変数の値の変更により操業評価指標がどの程度変化するかを反映した操業影響度というものを求めている。その操業影響度が大きい操業変数を抽出することにより、操業状況の改善に有効な操業変数を選択している。

さらに、特許文献３には、目的変数に関するデータを分割し、分割された２つの目的変数の集合のそれぞれについて偏差平方和から求めるまとまり度を計算し、このまとまり度の値が大きい場合に、それぞれの集合に属するデータ間の統計的有意差が大きいと判断している。

特開２０１４−８１７５０号公報特開２０１３−１４０５４８号公報特開２００８−１６００８号公報

データ解析システム導入により予測される効果は、データ解析システム導入前には顧客にとって不明確な場合もあった。これは、目的とするアウトカム（目的変数）が上昇する可能性があるか否かを施策の実施前に判断することが困難であることに起因する。困難である理由について下記に示す。

特許文献１においては、施策の導入の効果を評価するために、行動変化施策を実施し、一定期間後にサービス効果計算処理を行っている。しかし、この方法では、少なくとも一回はデータ解析システムが提示した施策を実施する必要があり、施策の実施の前にサービス効果を評価することは困難であった。

特許文献２では、操業変数毎に、操業状況の良否判定結果の確率密度に基づいて算出した操業評価指標の最大値と最小値から操業影響度を求めて、操業状況の改善に有効な操業変数を求めている。しかしながら、この計算方法では、あくまで操業変数が操業評価指標に与える影響を求めることは出来るが、操業状況自体に改善する余地があるかどうかの評価をすることは難しかった。例えば、減風発生割合に影響を最も与える操業変数を抽出することは可能だが、データ解析システムの提示する施策の実行により、減風発生割合を低下させ、炉況の好調を維持出来るかどうかの直接的な判断は困難であった。そのため、特許文献２に記載の技術では目的変数（操業状況）自体が向上する可能性を有しているかの判断をすることが難しかった。

さらに、特許文献３では、分割された目的変数の集合ごとに偏差平方和を求め、各集合の偏差平方和を足した値が小さい場合には、分割された２つの目的変数の集合間の統計的有意差が大きいと判断し、その分割により生じた２つの集合をもとにデータ解析を行っている。つまり、各集合内のデータの偏差平方和の値が小さくなればなるほど、そのような集合を生む分割点が解析に適していると判断している。しかしながら、この方法では、目的変数のデータを解析するための分割点を適切に判断することは出来るが、目的変数そのものに向上する余地があるかどうかの判断をすることは困難であった。

このように、従来の技術では、目的変数を変動させる他の説明変数を効率的に見つけ出すことは検討されていたが、目的変数自体が上昇する可能性が高いかどうかの評価についての検討は行われていなかった。更に、目的変数の増減の評価が行われていなく、どの目的変数に着目して解析を行えば良いか判断することが困難であった。さらに、コンピュータ資源等のリソースをどのように準備するかの検討が容易ではなかった。

また、特許文献１などに記載のデータ解析システムは、多数の説明変数を生成してその中から目的変数と相関の高い説明変数を自動抽出するため、人手によるデータの解析では着目が難しい説明変数を抽出することが特徴の一つである。従って、別の課題として、仮に上昇の可能性のある目的変数に着目して解析または目的変数の上昇の可能性のある期間について解析を行っていたとしても、顧客にとって制御困難または不可能な説明変数が抽出される可能性もあった。

以上を踏まえ、本願は、データ解析システムが提案した施策によって、顧客が指定したパフォーマンスを示す指標である目的変数に改善効果をもたらすかどうかをデータ解析システムの導入前に評価し、その評価の高い目的変数と、その評価の高い期間において目的変数と相関の高い説明変数等の情報を表示することをより容易にする技術を提供することを目的とする。

前記課題を解決するための手段のうち代表的なものを例示すれば、データ解析システムの導入効果を表示する評価システムであって、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部と、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算部と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部と、回帰式を表示装置に表示する表示部と、を有する評価システムが挙げられる。

また、データ解析システムの導入効果を評価する評価方法であって、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップと、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算ステップと、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップと、回帰式を表示装置に表示する表示ステップとを有する評価方法が挙げられる。

本発明によれば、顧客が事前に目的変数が上昇する可能性及び施策の実施できる可能性を確認することがより容易になる。これにより、どの目的変数に対してデータ解析システムの解析を行うか、どの期間のデータに対してデータ解析システムの解析を行うか等の情報に基づいたコンピュータリソースの配分もより容易に行うことができる。

本発明の全体概要の例を示した図である。評価システムのハードウェア構成の例を示した図である。評価システムにおけるシステム構成の例を示した図である。目的変数の時系列データのグラフの例を示した図である。評価システムの処理のフローの例を示した図である。表示装置に表示される画面の例を示した図である。目的変数の時系列データのグラフの例を示した図である。目的変数の時系列データのグラフの例を示した図である。表示装置に表示される画面の例を示した図である。回帰式作成部の処理のフローの例を示した図である。評価システムにおけるシステム構成の例を示した図である。解析期間幅の決定処理のフローの例を示した図である。目的変数の時系列データのグラフの例を示した図である。業務データの例を示した図である。データ解析システムにおけるシステム構成の例を示した図である。目的変数の改善を表すグラフの例を示した図である。目的変数の改善を表す表の例を示した図である。評価システムにおけるシステム構成の例を示した図である。

本実施例では、目的変数に関するデータの振れ幅を計算して、データの振れ幅が大きい期間内の回帰式を表示する評価システムの例を説明する。

本明細書中では、評価システムとデータ解析システムを区別して記載している。本実施例におけるデータ解析システムとは、顧客のデータを解析し、顧客の意思決定を支援、プラントや機器を直接制御するシステムのことをいう。例として、機械学習、統計分析を主なデータ解析の手法としているシステムが挙げられる。データ解析システムでは、業務に関するデータから、例えば１万個を超える非常に多数の説明変数を生成してデータの解析を行う。それに対し、本実施例における評価システムとは、データ解析システムの導入の効果を事前に判定するために、目的変数の振れ幅が大きい期間内の回帰式を作成し、効果的な説明変数を抽出するためのシステムのことである。

以下、図面を参照しながら説明する。

図１は、本実施例の全体概要の具体例を示した図である。顧客データセンタ１０および外部のデータ解析サービスセンタ１１のそれぞれの構成およびデータ処理について説明する。

顧客データセンタ１０は、店舗、支店、現場等の職場から集められた業務データ１０１および業務データの内の複数の変数のうちどの変数を目的変数とするかを指定し、データ解析サービスセンタから受け付けた評価結果を表示するシステム端末１０２等から構成される。業務データ１０１およびシステム端末１０２による目的変数の指定は、ネットワーク１０３経由でデータ分析サービスセンタ１１に送信される。

データ解析サービスセンタ１１は、顧客データセンタ側の指示により、実際にデータの解析を行うデータ解析システム１０５、および、顧客データセンタ１０から入出力部１０４を経由して収集されたデータを分析してデータ解析システム１０５の導入効果を評価し、回帰式を作成する評価システム１０６等により構成される。顧客データセンタ１０から送信された業務データ１０１および目的変数の指定はそれぞれ、入出力部１０４を経由して評価システム１０６内の受付部１０７に入力される。

図１の評価システム１０６は、受付部１０７、データ分析部１０８および表示部１０９を備えている。

受付部１０７は、業務データ１０１およびシステム端末１０２により行われた目的変数の指定を受け付けて集約する。業務データ１０１を受け付けた際に、評価システム１０６の処理に適切なデータ形式に変換してもよい。目的変数とは、業務データ１０１中の複数の変数の中から指定された変数のことであり、通常は、顧客が上昇させたい、減少させたい等、望ましい状態を規定する業務上の指標のことをいう。目的変数としては、例えば、売上等の経営指標や作業の生産性、製品の性能ばらつきなどが挙げられる。指定される目的変数は１つとは限らず複数個あっても構わない。複数の目的変数が指定された場合には、それぞれの目的変数についてデータ分析部１０８により分析を行う。

業務データとは、顧客の職場での業務に関する任意のデータのことをいう。例えば、従業員の作業に関するデータや、従業員間でのコミュニケーションに関するデータ、従業員のＩＤ・職位・性別のデータ、売上データ、または、作業個数等の作業効率に関するデータなどが挙げられる。

図１４は、業務データ１０１の例を示した図である。ＰＯＳテーブル１４０１は小売店の来客の商品購入に関する業務データ１０１の一部を示した表であり、作業テーブル１４０２は倉庫の作業に関する業務データ１０１の一部を示した表である。

ＰＯＳテーブル１４０１には、購入金額、購入点数、客単価のデータが小売店の全商品及びエリアＡに陳列されている商品ごとに格納されている。例えば、データ解析サービスセンタにとっての顧客である小売店管理者は、購入金額の全商品合計の値１４０３を目的変数として指定する。

作業テーブル１４０２には、倉庫内の作業ＩＤ、作業者ＩＤ、毎分の作業個数である作業数、作業の開始時刻、作業対象の商品ＩＤが格納されている。例えば、データサービスセンタにとっての顧客である倉庫管理者は、作業数１４０４を目的変数として指定する。ここでの作業は、例えば倉庫での梱包作業、ピッキング作業等が挙げられる。

次に、図１のデータ分析部１０８は、受付部１０７から業務データ１０１および目的変数の指定を受け付けて、目的変数に関する時系列のデータの振れ幅を基にデータ解析システム１０５の導入効果を判定し、判定結果および判定結果に基づいて、目的変数およびその目的変数と相関の高い説明変数を基に作成した回帰式を表示部１０９に送信する。

表示部１０９では、データ分析部１０８から受け付けた導入効果の判定結果および回帰式を、入出力部１０４およびネットワーク１０３を介してシステム端末１０２の表示装置に表示する。

図１では、データ解析サービスセンタ１１は顧客データセンタ１０の外部に構成されているが、データ解析サービスセンタ１１の機能を有するシステムが顧客データセンタ１０内に構成されていてもよく、図１の構成に限らない。データ解析サービスセンタ１１の機能を有するシステムを顧客データセンタ１０内に構成することにより、データの処理をすべて顧客データセンタ内で行うことができるので、顧客情報の保護のためにデータ変換をする必要がなく、データの処理速度向上につながる。

更に、評価システム１０６がデータ解析サービスセンタ１１内に構成されているように記載されているが、外部のサービスセンタに構成されていても構わない。

また、顧客の業種に関しては、特に限定する必要はなく、業務に関してデータを集約しているあらゆる業種の顧客に対して本発明の評価システムを適用することができる。顧客の業種としては例えば、物流業、金融業、製造業、小売業、医療業およびインフラ業等が想定される。

図２は、本実施例における評価システム１０６を実現するハードウェア構成の一例を示す図である。

評価システム１０６におけるハードウェア構成は、コンピュータシステム(計算機)を用いて実現され、少なくとも１組の、ＣＰＵ２０１、ＲＯＭ２０２、ＲＡＭ２０３、キーボード２０４、表示装置２０５、ＨＤＤ２０６、プリンタ２０７、マウス２０８およびデータバス２０９から構成される。

ＲＯＭ２０２は、評価システム１０６のＯＳ(オペレーティングシステム)等を格納する。ＲＡＭ２０３は、評価システム１０６に関するソフトウェアおよび後述する振れ幅閾値等の各閾値を格納するデータベース（図示せず）を格納する。キーボード２０４は、ＣＰＵ２０１を操作する。ＨＤＤ２０６は、入力データや分析データを格納する。表示装置２０５は、入力データ、分析データまたはデータ分析の処理の過程等を示す。マウス２０８は、ＣＰＵ２０１を操作する。データバス２０９は、各々のデータを通信する。

評価システム１０６において、ＣＰＵ２０１で、ＲＡＭ２０３に格納されたデータ分析に関するソフトウェアを実行することで、図１に示した各機能を実現することが出来る。

更に、データ解析システム１０５におけるハードウェア構成も図２に示したものと同一であるため、詳細は省略するが、データ解析システム１０５において、ＲＡＭ２０３に格納されたデータ解析に関するソフトウェアを実行することで、後述するデータ解析システム１０５における各機能を実現することが可能となる。

図３は、評価システム１０６の構成図の例である。評価システム１０６のデータ分析部１０８は、統計値計算部３０１および回帰式作成部３０２を備えている。評価システム１０６は、入出力部１０４から、顧客の業務データ１０１および顧客によるシステム端末１０２からの目的変数の指定を受け付ける。また、統計値計算部３０１により目的変数に関するデータの振れ幅を計算し、回帰式作成部３０２により、統計値計算部３０１により計算された振れ幅を基にデータ解析システム導入の効果を判定し、判定結果に基づいて目的変数および目的変数と相関の高い説明変数により回帰式を作成する。また、回帰式作成部３０２においては、図１５において後述するように、複数の説明変数から生成された複合説明変数を用いて、回帰式を作成することもできる。

受付部１０７は、前述のように業務データ１０１および目的変数の指定を受け付けた後、統計値計算部３０１に業務データ１０１および目的変数の指定を送信する。

統計値計算部３０１は、受付部１０７から顧客の業務データ１０１および目的変数の指定を受け付ける。

業務データの取得方法としては、もともと顧客側が取得していた業務データを受け取ってもよいし、顧客の職場に各種センサを設置してもらい業務データを取得してもよい。各種センサを設置してもらうことにより、より実態に即した業務データを用いて導入効果の評価をすることができ、評価の精度が向上する。

目的変数の指定は顧客データセンタ１０から行われているように図示されているが、データ解析サービスセンタ１１内で任意の目的変数を指定し、それを統計値計算部３０１が受けとってもよい。

統計値計算部３０１は、受け付けた業務データおよび目的変数の指定を基に、指定された目的変数に関する時系列データを抽出し、目的変数に関する時系列データの所定の期間における振れ幅を計算する。

図４は、目的変数に関する時系列データをグラフにして表した図面である。統計値計算部３０１の計算処理について、図４を用いて説明する。

まず、統計値計算部３０１は、業務データに含まれる複数の変数の中から、システム端末１０２により指定された目的変数に関するデータを抽出する。ここでは、目的変数ａおよび目的変数ｂが抽出されたとする。

続いて、統計値計算部３０１は、目的変数ａの時系列データ４０１および目的変数ｂの時系列データ４０２を作成する。図４では、連続的な時系列データとして図示しているが、非連続な点のデータでも構わない。連続的な時系列データは、例えば、スプライン曲線生成などの既存の曲線生成技術によって行う。

次に、抽出した時系列データ４０１および４０２の所定の期間ｔ１〜ｔ２の間の振れ幅を計算する。ここで、所定の期間ｔ１〜ｔ２は、統計値計算部３０１の外部から入力されたものを用いても良いし、統計値計算部３０１が任意に決定したものでもよい。例えば、過去に取得した目的変数に関するデータの全期間をｔ１〜ｔ２としても良いし、何らかの事情で業務の環境が変化した場合には変化したタイミングから現在までの期間をｔ１〜ｔ２として設定しても良い。過去に取得した目的変数に関するデータの全期間をｔ１〜ｔ２とした場合には、より多くのデータに基づいた導入効果の評価をすることができ、評価結果の精度が向上する。また、業務の環境が変化したタイミングから現在までの期間をｔ１〜ｔ２とした場合には、現在の業務環境に則した導入効果の評価をすることができる。なお、ここでは時系列データ４０１および４０２の所定の期間を同じ期間としているが、異なる期間で処理を行っても構わない。

目的変数に関する時系列データの振れ幅とは、目的変数が過去どの程度変化しているかを表した数値であり、時系列データの波形の振れ幅を表している。例えば、データの平均値ａ１とデータの最大値との差４０３、データの平均値ａ１とデータの最小値の差４０４、または、データの最大値と最小値の差４０６等が振れ幅として考えられる。また、上記では平均値との差をとっているが、中央値でも同様に考えられる。

振れ幅が大きい時系列データとは、過去に変動が大きかったことを表している。すなわち、そのような時系列データを持つ目的変数は、日常的にまたは時間的に数値が変化していることを表しており、その数値の上昇または下降のポテンシャルを持っている可能性が高く、データ解析システムの導入により改善がしやすいものであるということがいえる。この点で、特許文献３のように、各集合のデータの偏差平方和の値の和が小さくなればなるほど各集合のデータは解析に値すると判断する技術とは逆の思想であることに留意されたい。

最後に、統計値計算部３０１は、計算した振れ幅を回帰式作成部３０２に送信する。

ここで、振れ幅を計算する対象が目的変数の時系列データそのものであることに留意されたい。この振れ幅を処理の対象とすることにより、特許文献２のように操業状況の良否判定結果の確率密度に基づいて算出した操業評価指標の最大値と最小値を取るだけでは、評価することが出来なかった目的変数自体の変化の可能性を評価することが可能となる。

回帰式作成部３０２は、統計値計算部３０１から受け付けた目的変数に関するデータの振れ幅を基に、データ解析システム１０５導入の効果を判定し、判定結果に基づき回帰式を作成する。

図４の目的変数ａに関しての時系列データ４０１は振れ幅が大きいデータ、目的変数ｂに関しての時系列データ４０２は振れ幅が小さいデータを表したものである。

回帰式作成部３０２は、予め振れ幅閾値を保持している。この振れ幅閾値は、データ解析システム１０５導入の効果を判定する閾値である。回帰式作成部３０２は、振れ幅計算部３０１が計算したｔ１〜ｔ２間の振れ幅と振れ幅閾値を比較し、ｔ１〜ｔ２間の振れ幅が振れ幅閾値よりも大きい場合には、データ解析システム１０５の「導入効果大」と判定し、ｔ１〜ｔ２間の振れ幅が振れ幅閾値未満の場合には、「導入効果小」と判定する。

目的変数が売上の場合の振れ幅閾値として、１日の売上の平均値の１０パーセントの数値が考えられる。例えば、ある店舗の１日の売上の平均が１００（万円）であった場合には、振れ幅閾値は１０（万円）と設定してもよい。１日の売上で閾値を決めたが、１週間でも１ヶ月でも同様に考えられる。

また、目的変数が生産性の場合の振れ幅閾値として、生産性を示す数値の５パーセントの数値が考えられる。例えば、任意の従業員のある物品のピッキング作業の１時間あたりの個数が１５０（個）であった場合には、振れ幅閾値は８（個）と設定される。個数だけでなく、半導体素子の製造における歩留まり割合などの確率でも同様に考えられる。

振れ幅閾値は、評価システム１０６の外部から入力されてもよい。例えば、顧客データセンタ１０のシステム端末１０２が目的変数を指定するのと合わせて、振れ幅閾値を設定するようにしても構わない。この場合には、受付部１０７が振れ幅閾値を受け付ける。このようにすることで、顧客が要求する目的変数の上昇分を基に導入効果を判定することが可能となる。

次に、回帰式作成部３０２は、指定された目的変数について、ｔ１〜ｔ２間の振れ幅と振れ幅閾値との比較から、データ解析システム１０５の「導入効果大」と判定された場合に、ｔ１〜ｔ２間の目的変数およびその目的変数と相関の高い説明変数を用いて回帰式を作成する。回帰式は、顧客データセンタ１０から受け付けた業務データ１０１を基に生成した説明変数と顧客に指定された目的変数から作成される。業務データ１０１から説明変数を生成する方法は、従来の技術を用いればよく、例えば、特許文献１に記載されているような事前に設定される生成ロジックによって、生成してもよい。これらの処理においては、データ解析システムの導入効果大と判定された期間についてのみ説明変数を生成していることから、処理量の低減によるシステムへの負荷を減らすことが可能となる。

具体的には、回帰式作成部３０２は、指定された目的変数と、その要因となる生成された説明変数との関係を調べて、それぞれの関係を明らかにする統計計算を実行する。ここでの統計計算としては、例えば回帰分析等が挙げられる。ここでの統計計算により、指定された目的変数に対して、その振れ幅の大きい期間において統計的に相関の高い説明変数を抽出することが可能となる。ここで、抽出した説明変数と指定された目的変数を基に回帰式を作成する。なお、回帰式作成部３０２においては、図１５において後述するように、複数の説明変数から生成された複合説明変数を用いて、回帰式を作成することもできる。
回帰式としては、以下のような式（１）が考えられる。

その後、回帰式作成部３０２は、表示部１０９に判定した導入効果および作成した回帰式の情報を送信する。

表示部１０９は、回帰式作成部３０２から導入効果の判定結果および作成された回帰式を受け付け、受け付けた判定結果および回帰式をシステム端末１０２の表示装置に表示させる形式に変換し、入出力部１０４を介してシステム端末１０２に送信する。また、評価システム１０６が持つ表示装置２０５に表示させても構わない。

図５は、評価システム１０６の処理のフローを示した図の例である。

ステップ５０１では、受付部１０７により業務データ１０１および目的変数の指定を受け付け、統計値計算部３０１に送信する。

ステップ５０２では、統計値計算部３０１により目的変数の時系列データを作成し、所定の期間における時系列データの振れ幅を計算し、回帰式作成部３０２に送信する。

ステップ５０３〜ステップ５０８は、回帰式作成部３０２によって処理される。これらの処理により、指定された目的変数に対して、データ解析システム１０５の導入効果を判定し、回帰式を作成する。

ステップ５０３では、統計値計算部３０１が受け付けた時系列データの振れ幅と予め保持している振れ幅閾値とを比較する。

ステップ５０３にて、データの振れ幅が振れ幅閾値より大きいと判定された場合には、データ解析システム１０５の「導入効果大」と判定され（ステップ５０４）、データの振れ幅が振れ幅閾値未満と判定された場合には、「導入効果小」と判定される（ステップ５０５）。

ステップ５０６では、回帰式作成部３０２により受け付けた目的変数と相関の高い説明変数を抽出し、目的変数および抽出された説明変数から回帰式を作成する。

ステップ５０７では、回帰式作成部３０２にて、「導入効果小」と判定された導入効果を表示部１０９に送信する。

ステップ５０８では、回帰式作成部３０２にて、「導入効果大」と判定された導入効果及び作成された回帰式を表示部１０９に送信する。

ステップ５０９では、表示部１０９により、導入効果および回帰式をシステム端末１０２の表示装置に表示する形式に変換し、その結果を入出力部１０４に送信する。

図６は、表示部１０９を通して顧客データセンタ１０の表示装置に表示される画面の例を示した図である。この画面は、表示部１０９によって生成される。

本表示画面は、目的変数指定エリア６０１、導入効果表示エリア６０２から構成される。ここで、目的変数指定エリア６０１は、評価システム１０６による処理の前から、表示部１０９によって生成されているエリアである。これに対し導入効果表示エリア６０２は、データ分析部１０８の分析結果を受けて、表示部１０９が生成するエリアである。

目的変数指定エリア６０１は、上記の導入効果の計算処理を行う際の目的変数を指定するエリアである。これは、図１のシステム端末１０２のインタフェースに相当する。ここで、顧客が上昇させたい目的変数６１とデータ解析システムの導入効果を評価するための振れ幅閾値６２を設定する。ここでは、目的変数として、「店舗全体の月単位の売上」が設定され、閾値として、「３００，０００」が設定されている。目的変数と振れ幅閾値が設定され、計算実行ボタン６３が押されると、データ分析部１０８は導入効果の判定および回帰式の作成を行い、その判定結果および回帰式を作成した場合にはその回帰式を導入効果表示エリア６０２に表示する。

導入効果表示エリア６０２は、導入効果および回帰式を表示するエリアであり、回帰式作成部３０２により判定された導入効果の判定結果や回帰式、統計値計算部３０１にて作成された目的変数に関する時系列データ等を表示する。

結果表示エリア６４には、図５のステップ５０３の判定による導入効果の大小の判定結果が表示されている。

また、時系列データ表示エリア６５には、図３の統計値計算部３０１により生成された時系列データが表示されている。ここでは、データの平均値とデータの最大値の差の部分に着目して表示させているが、時系列データの振れ幅が分かる図であれば異なる部分を表示させても構わない。異なる部分の表示の切り替えは、表示グラフ切替ボタン６６により実施される。また、必要に応じて目的変数の名称、指標ＩＤ等の目的変数を特定する情報または振れ幅閾値の数値を長さで表した矢印等を合わせて表示してもよい。

回帰式表示エリア６７には、回帰式作成部３０２によって作成された回帰式が表示されている。回帰式は、図５のステップ５０３による判定で「導入効果大」と判定された場合には、図のように表示すれば良いが、「導入効果小」と判定された場合には、何も表示しなくてもよいし、「導入効果小のため、回帰式の作成をしない」等といった情報を表示してもよい。この回帰式を確認することで、顧客は、目的変数の上昇の可能性のある期間における、その目的変数と相関の高い説明変数が何かを確認することができる。そのため、データ解析システムの導入の効果判断や、どの期間の解析を行えばよいか、どの目的変数に対して解析を行えばよいか、がわかるのでのコンピュータリソースの必要量についても事前検討することが可能となる。

このように、本実施例に係る評価システムは、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部１０７と、目的変数に関する時系列データの所定の期間内における振れ幅を求める統計値計算部３０１と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部３０２と、回帰式を表示装置に表示する表示部１０９を有することを特徴としている。

また、別の表現をすれば、本実施例に係る評価方法は、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップ５０１と、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算ステップ５０２と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップ５０６と、前記回帰式を表示装置に表示する表示ステップ５０９を有することを特徴としている。

係る構成により、データ解析システムを導入する前に、顧客が向上させたい目的変数に対してのデータ解析システム導入の効果を推定することが出来る。これにより、データ解析システムの導入効果の事前判断を容易にすることや、コンピュータ資源等のリソース準備についての検討を容易にすることが可能となる。

＜分散計算を導入効果に用いる変形例＞
次に、目的変数に関するデータの分散値を計算して、データ解析システムの導入効果の判定を行う評価システムの例を説明する。基本的なシステム構成は図３と同じであるが、以下の点が相違する。

統計値計算部３０１は受付部１０７から顧客の業務データ１０１およびシステム端末１０２からの目的変数の指定を受け付けて、目的変数に関する時系列データの分散値を計算し、回帰式作成部３０２に送信する。

図７は、目的変数に関する時系列データをグラフにして表した図面である。本変形例における統計値計算部３０１および回帰式作成部３０２の処理について、図７を用いて説明する。

まず、統計値計算部３０１は、業務データ１０１に含まれる複数の変数の中から、目的変数に関するデータを抽出する。ここでは、目的変数ｃ、目的変数ｄおよび目的変数ｅが抽出されたとする。続いて、目的変数ｃの時系列データ７０１、目的変数ｄの時系列データ７０２および目的変数ｅの時系列データ７０３を作成する。

次に、抽出した時系列データ７０１、７０２および７０３の所定の期間ｔ３〜ｔ４の分散値を計算する。ここで、所定の期間ｔ３〜ｔ４は、ｔ１〜ｔ２と同様に決められるものとする。また、分散値の計算方法は、従来の方法を用いて行う。例えば、以下の式（２）を用いて分散値を計算する。

図７の時系列データ７０１および７０２は、分散値が小さい例を、時系列データ７０３は、分散値が大きい例を示している。

ここで、目的変数ｃおよび目的変数ｄの時系列データの振れ幅、例えば時系列データ７０１の平均値ｃ１と最大値の差７０４及び時系列データ７０２の平均値ｄ１と最小値の差７０５は共に、時系列データ７０３の平均値ｅ１と最大値の差７０６及び平均値ｅ１と最小値の差７０７よりも大きい値となっていることがわかる。しかしながら、目的変数ｃまたは目的変数ｄの変化のようなピークを１つ持ち、他の部分は定常的な変動をしている目的変数よりも、目的変数ｅのような複数のピークを持つ目的変数の方が、データ解析システム１０５の導入による効果が大きいことに発明者は想到した。その理由は以下の通りである。

目的変数ｃまたは目的変数ｄのようにピークを１つ持ち、他の部分は定常的な変動をしている目的変数は、そのピークが現れたタイミングで何らかの非定常的なイベントの影響を大きく受けていると考えられる。このような時系列データを持つ目的変数は、データ解析システムの提示する施策によっては改善が難しい。すなわち、目的変数ｃまたは目的変数ｄのような目的変数は、非定常的なイベントを除いた期間は変化が小さいので、その値の増減する幅が小さく、施策による上昇または下降のポテンシャルが小さい可能性が高い。これに対し、目的変数ｅのように複数のピークを持つ目的変数は、その値が小さい部分に関して、その値を上げるような施策の提示をすることが可能であり、データ解析システムの提示する施策によって目的変数が改善する可能性が高い。このように、データの振れ幅が大きい時系列データでも、必ずしもデータ解析システムの導入効果が高いとは限らない。

ここで、分散とは、式（２）で表されるため、ｔ３〜ｔ４が充分に大きい場合は目的変数ｃ及びｄに関する時系列データの分散値は小さくなる。そのため、これらの目的変数が指定されている場合には、導入効果は小さいと判定されることとなる。

なお、図８の目的変数ｆのように一部の期間（ｔ７〜ｔ６）でピークを１つ持ち、ｔ７〜ｔ６内のピーク以外の他の部分が定常的な変動をしていたとしても、他の期間に複数のピークを持つような時系列データや、目的変数ｇのようにピークを持ち、その前後が定常的な変動をしている時系列データであっても、ｔ８〜ｔ９間に複数のピークが含まれる時系列データは、分散値も大きくなるため、これらのようなデータの評価が小さくなることはない。目的変数ｆの変化を示すデータとしては、例えば、小売店の日ごとの売上額が考えられて、急激な変化をしているタイミングで店舗の付近でイベントが発生したと考えられる。また、目的変数ｇの変化を示すデータとしては、例えば、玩具店への月ごとの入場者数が考えられて、複数の急激な上昇をしている月は１２月である場合等が考えられる。

このように、８０１のような変化を示す目的変数は、ｔ５〜ｔ７間等に複数のピークを持つ期間を含むため、この期間のデータを解析して施策を導入することにより、目的変数を改善することが可能である。また、８０２のような変化を示す目的変数はｔ８〜ｔ９間等に複数のピークを含むため、これらの期間のデータの解析を行うことによって該当期間に対する効果的な施策を提示することが可能である。そこで、一部の突発的な変化による影響を少なくすることが可能な所定の期間内における分散値を評価に用いると良い。

最後に、統計値計算部３０１は、計算した分散値を回帰式作成部３０２に送信する。

回帰式作成部３０２は、予め分散閾値を保持しており、統計値計算部３０１が計算したｔ３〜ｔ４間の分散値と分散閾値を比較し、ｔ３〜ｔ４間の分散値が分散閾値よりも大きい場合には、データ解析システム１０５の「導入効果大」と判定し、ｔ３〜ｔ４間の分散値が分散閾値未満の場合には、「導入効果小」と判定する。分散閾値は、振れ幅閾値と同様、評価システム１０６の外部から入力されても良い。

続いて、回帰式作成部３０２は、分散閾値との比較で「導入効果大」と判定された場合に、ｔ３〜ｔ４間の目的変数およびその目的変数と相関の高い説明変数を用いて回帰式を作成する。回帰式の作成は、上述した方法により行う。

なお、本変形例に係る評価システム１０６の処理フローについては、図５の振れ幅を分散値に変更したものであり、それ以外に異なるフローを有さないため図示を省略する。

このように、本変形例に係る評価システムは、時系列データについて所定の期間における分散値を求める統計値計算部３０１と、分散値が所定の分散閾値より大きい場合に、回帰式を作成する回帰式作成部３０２を有することを特徴としている。

係る構成により、全体が定常的な変化の中、１つのピークを持つ時系列データに関しての導入効果をより正確に評価できるようになる。

＜導入効果を計算する変形例＞
導入効果の大小だけでなく、定量的な導入効果を事前に顧客に提示することは、定量的な導入効果を確認し、データ解析システム導入の費用と比較することが可能となるため、データ解析システムのスムースな導入につながる。

ここでは、生産性向上、費用削減、売上額上昇の値など、解析システムが提示する施策の実行による定量的な導入効果を事前に顧客に提示する内容に関して説明する。基本的なシステム構成は図３と同じであるが、以下の点で相違する。

図１８は、改善値計算部１８０１を有する回帰式作成部３０２を含んだ評価システム１０６の構成図の例である。

データ分析部１０８は、データ解析システム１０５の導入による目的変数の予測改善値を計算して表示部１０９に送信する。

統計値計算部３０１は、指定された目的変数に関する時系列データを抽出し、目的変数に関する時系列データの所定の期間の全てのデータにおける偏差の値を計算する。その後、計算したすべての偏差の値を回帰式作成部３０２内の改善値計算部１８０１に送信する。ここでは、例として偏差の値を計算しているが、中央値を計算して、中央値から差の値を計算し、その後の処理を行っても構わない。

改善値計算部１８０１は、すべての偏差の値を受け付けて、それを基にデータ解析システム１０５の導入による目的変数の改善の予想を示す予測改善値について計算する。

予測改善値とは、データ解析システムの導入により顧客が指定した目的変数の値がどの程度改善する可能性があるかを示した値である。例えば、目的変数が売上額、客単価等の金額に関する変数の場合は、予測改善値は「１，０００」円等の金額として算出され、目的変数が作業効率、不具合発生割合等の生産性に関する変数の場合は、予測改善値は「１３」パーセント、「１０」個等の割合や個数で算出される。

改善値計算部１８０１の計算方法について、図４を用いて説明する。改善値計算部１８０１は、偏差の最大値４０３、偏差の最小値４０４、偏差の最小値の絶対値と偏差の最大値の和４０６、または、ｔ１〜ｔ２間の標準偏差の値を計算し、予測改善値とする。または、振れ幅閾値を超える偏差を抽出し、抽出された偏差の平均を求めて予測改善値としても構わない。

偏差の最大値を予測改善値とすることで、顧客が指定した目的変数についてどの程度上昇する可能性があるかの評価をすることができ、偏差の最小値を予測改善値とすることで、目的変数についてどの程度減少を抑えられる可能性があるかの評価をすることができる。また、偏差の最小値の絶対値と偏差の最大値の和や標準偏差の値を予測改善値とすることで、目的変数の平均を底上げできる可能性を評価することができる。

標準偏差の値の計算方法は、従来の方法を用いて行う。例えば、以下の式（３）を用いて標準偏差の値を計算する。

その後、改善値計算部１８０１は、計算した予測改善値を表示部１０９に送信する。

表示部１０９は、受信した予測改善値を顧客データセンタ１０のシステム端末１０２の表示装置に表示するための変換を行い、入出力部１０４を介してシステム端末１０２に送信する。

図９は予測改善値を表示する画面の例を示した図である。図６と同じ部分には同じ符号を付してあり、表示する内容及び表示のための各構成の動作が同じであるので、説明を省略する。

目的変数６１と振れ幅閾値６２が設定され、計算実行ボタン６３が押されると、データ分析部１０８は、予測改善値の計算を行い、その結果を数値表示エリア９１に表示する。

数値表示エリア９１は、予測改善値を表示するエリアであり、改善値計算部１８０１により計算された予測改善値を表示する。ここでは、計算した予測改善値をそのまま表示してもよいし、四捨五入して表示しても構わない。また、目的変数が生産性等の場合には、例えば、「１５パーセント減少／月」等の表示となる。必要に応じて目的変数の名称や指標ＩＤ等の目的変数を特定する情報を合わせて表示してもよい。この数値表示エリア９１により、データ解析システム１０５の導入効果を確認することが容易となる。

このように、本変形例に係る評価システム１０６は、時系列データについて所定の期間における偏差の値または中央値からの差を求める統計値計算部３０１と、偏差の値または中央値からの差に基づいてデータ解析システム１０５の導入による目的変数の改善を示す値である予測改善値を求める予測改善値計算部１８０１と、予測改善値を表示装置に表示する表示部１０９を有することを特徴としている。

係る構成により、実際の目的変数の予想増加分の計算をすることが容易となる。これにより、顧客サイドは、導入費用と比較することが可能となるため、データ解析システムの導入の検討をすることが容易になる。

＜導入効果の費用変換に関する変形例＞
顧客が指定した目的変数が生産性の場合には、予測改善値は「１３」パーセント上昇等の割合で算出される。この上昇によりどの程度、職場のコストが削減されるかを事前に顧客に提示することは、顧客側のデータ解析システム導入の費用との比較をより容易にする。

ここでは、目的変数の属性が生産性の場合に、計算された予測改善値を予測改善値の分増加または減少した場合に削減されるコストである削減コストを計算する変形例について説明する。目的変数の属性が金額の場合には、上述の計算により求めた予測改善値をそのまま数値表示エリア９１に表示させるが、目的変数の属性が生産性等の金額以外の場合には、削減コストを求めて数値表示エリア９１に表示させる。なお、基本的なシステム構成は図１８と同じであるが、以下の点が異なる。

受付部１０７は、指定された目的変数の属性を受け付ける。顧客データセンタ１０内のシステム端末１０２で目的変数を指定する際に目的変数の属性を指定し、入出力部１０４を介して受付部１０７に送信される。また、目的変数の属性は、データ解析サービスセンタ１１内にて指定され、受付部１０７に送信されてもよい。こうすることで、顧客側の負担を減らすことが可能となる。

目的変数の属性とは、目的変数が金額に関するものか否かを表したものであり、大きく「金額」と「それ以外」に分けられる。受付部１０７は、受け付けた目的変数の属性を改善値計算部１８０１に送信する。

改善値計算部１８０１は受付部１０７から目的変数の属性を受け付け、削減コストを計算する。

改善値計算部１８０１は、コスト算出指標を予め保持している。コスト算出指標とは、目的変数の属性が金額に関するもの以外の場合に関して、その増加または減少によりどの程度費用が削減されるかを表した指標である。例えば、作業員一人あたりの単位時間あたりの作業個数が目的変数であった場合には、その作業個数の増加により減らすことが可能な作業員の作業時間が算出されるため、作業員の人件費と作業時間を掛け合わせることにより、削減されるコストが求められる。このように単位時間あたりの作業個数についての人件費の削減額がコスト算出指標の例である。コスト算出指標の他の例として、店舗入場者数１人あたりの平均購買額、機械停止確率１パーセントあたりの復帰作業費用等が挙げられる。

コスト算出指標は顧客データセンタ１０側が保持している場合もあるため、その場合には、受付部１０７が入出力部１０４経由でコスト算出指標を受け付け、改善値計算部１８０１に送信する。

次に、改善値計算部１８０１は、計算した予測改善値と、コスト算出指標とに基づき削減コストを計算する。例えば、予測改善値にコスト算出指標を掛け合わせることにより、目的変数の属性が金額に関するものでない場合の予測改善値を金額にて表現することができる。その後、計算した削減コストを表示部１０９に送信する。

図１０は改善値計算部１８０１の削減コストの計算処理のフローを示した図の例である。

ステップ１００１では、改善値計算部１８０１により、統計値計算部３０１から偏差の値を受け付け、予測改善値を計算する。具体的な処理は既に述べているので省略する。

ステップ１００２では、改善値計算部１８０１により、受付部１０７から目的変数の属性を受け付ける。

ステップ１００３では、改善値計算部１８０１により、ステップ１００２で受け付けた目的変数の属性が金額に関するものであるか否かの判断を行う。ここで、目的変数の属性が金額に関するものと判断された場合にはステップ１００４に移行し、金額以外に関するものと判断された場合にはステップ１００５に移行する。

ステップ１００４では、改善値計算部１８０１により、ステップ１００１にて計算した予測改善値を表示部１０９に送信する。

ステップ１００５では、改善値計算部１８０１により、ステップ１００１にて計算した予測改善値とコスト算出指標をもとに、削減コストを計算する。

ステップ１００６では、改善値計算部１８０１により、ステップ１００５にて計算した削減コストを表示部１０９に送信する。

このように、本変形例に係る評価システム１０６は、目的変数の属性を受け付ける受付部１０７と、目的変数の属性が金額に関するものでない場合には、時系列データが予測改善値の分増加または減少した場合に削減されるコストである削減コストを求める改善値計算部１８０１、削減コストを表示する表示部１０９を備えている。

係る構成により、目的変数の属性が金額に関するものでない場合でも、顧客は解析システムの提示する施策による目的変数に関しての金額面での効果を事前に知ることができる。これにより、データ解析システムの導入費用との費用対効果を判断することがより容易となり、データ解析システムのスムースな導入に繋がる。

データ解析システムによる解析は、状況変化への追従性を考慮して、解析期間幅を適切に設定してデータ解析をする必要があった。そこで、本実施例では、本発明の評価システムの別の例を示す。

実施例１では、データ分析部によりデータ解析システムの導入効果を評価し、回帰式を作成していたが、実施例２では導入効果が大きいと判定された場合に、業務データをデータ解析システムが解析する解析期間幅を決定するための評価システムの内容について説明する。基本的なシステム構成は図３と同様であるが、以下の点で相違する。

図１１は、本実施例に係る評価システム１０６の構成図の例である。評価システム１０６は、業務データの解析期間幅を決定し、決定した解析期間幅をデータ解析サービスセンタ１１内のデータ解析システム１０５に送信する。評価システム１０６は、図３の構成に加えて、期間候補作成部１１０１および期間決定部１１０２を更に備えている。

期間候補作成部１１０１は、データ分析部１０８から導入効果の判定結果および目的変数に関する時系列データを受け付ける。そして、データ分析部１０８によって、導入効果の判定結果が大きいと判定された場合には、データ解析システム１０５が解析を行う期間の候補である期間候補を作成し、期間決定部１１０２に送信する。

期間決定部１１０２は、期間候補作成部１１０１から目的変数に関する時系列データおよび期間候補を受け付ける。また、期間候補内の目的変数に関する時系列データの形状を基に、受け付けた期間候補が解析に適しているかどうかの判定を行う。さらに、解析に適していると判定された場合には、該当する期間候補の解析期間幅を、データ解析システム１０５に送信する。

解析期間幅とは、データ解析システム１０５が業務データ１０１の解析を逐次行う際に、利用する業務データの時間長のことであり、期間候補とは、解析期間幅の決定の際に仮に作成される期間の候補のことである。例えば、データ解析システム１０５は、目的変数に影響の大きい説明変数を抽出したり、その目的変数を上昇させるための施策を提示したりするために、特に解析期間幅内の業務データ１０１を解析する。

図１２は、評価システム１０６が、所定の期間の目的変数に関する時系列データの振れ幅が振れ幅閾値より大きいと判定した場合、つまりデータ解析システムの導入効果が高いと判定した場合に、解析期間幅の決定を行う処理のフローの例を示した図である。ステップ１２０１の処理が期間候補作成部１１０１によって行われ、ステップ１２０２〜１２０４までの処理が期間決定部１１０２によって行われる。

ステップ１２０１では、期間候補作成部１１０１がデータ分析部１０８から目的変数に関する時系列データを受け付け、時系列データのうちランダムに選定した一定の期間を期間候補として作成する。その後、期間候補および目的変数に関する時系列データを期間決定部１１０２に送信する。

ステップ１２０２では、期間決定部１１０２が期間候補作成部１１０１から期間候補および目的変数に関する時系列データを受け付け、受け付けた目的変数に関する時系列データについて期間候補内に極大点及び極小点が含まれるかを判定する。極大点および極小点が含まれているかの判定は既存の方法を用いて行う。

図１３は、回帰式作成部３０２により導入効果が大きいと判定された目的変数の時系列データの例を示した図である。この時系列データ１３０１は、統計値計算部３０１によって作成されたものである。

ここで、極大点および極小点を少なくとも１つずつ含む期間候補が、データ解析システム１０５による解析に適している理由について説明する。図１３のｔ１１〜ｔ１２間やｔ１２〜ｔ１３間のように極大点および極小点が含まれていない期間においては、その期間だけの業務データを用いてデータ解析を行っても目的変数の値が大きい状態と小さい状態の区別をすることが難しい。その一方、ｔ１０〜ｔ１１間のように極大点１３０２および極小点１３０３が含まれている期間は、目的変数の大きい状態と小さい状態の区別をすることが容易であるため、データ解析に適した期間であることに発明者は想到した。すなわち、データ解析システムは、ｔ１０〜ｔ１１間の極小点付近の目的変数の小さい部分の値を極大点付近の値に上昇させるような施策を提示しやすい。そこで、ｔ１０〜ｔ１１間のように極大点１３０２および極小点１３０３が含まれている期間を解析期間幅に適していると評価することにした。このような期間の業務データを解析することにより、目的変数の増加および減少を説明する説明変数の抽出をすることがより容易になり、データ解析の質が向上する。

ステップ１２０２で、ｔ１１〜ｔ１２およびｔ１２〜ｔ１３のように、期間候補内に極大点および極小点が少なくとも１つずつ含まれていないと判定された場合には、ステップ１２０１に戻り、期間候補の作成から処理を繰り返す。ｔ１０〜ｔ１１のように、期間候補内に極大点および極小点が少なくとも１つずつ含まれていると判定された場合には、ステップ１２０３に進む。

ステップ１２０３では、期間決定部１１０２はステップ１２０２で極大点および極小点が少なくとも１つずつ含まれると判定された期間候補を解析期間幅として決定する。

ステップ１２０４では、期間決定部１１０２により決定された解析期間幅をデータ解析システム１０５に送信する。

このように、本実施例に係る評価システム１０６は、回帰式作成部３０２が、振れ幅が振れ幅閾値より大きいと判定した場合に、データ解析システム１０５が解析を行う期間の候補である期間候補を作成する期間候補作成部１１０１と、期間候補の期間内の時系列データについて、極大点および極小点が少なくとも１つずつ含まれている場合には、期間候補をデータ解析システム１０５が解析を行う解析期間幅に決定する期間決定部１１０２を備えている。

係る構成により、データ解析システムの導入効果が大きいと評価した場合に、その導入効果を更に大きくするためのデータの解析期間幅を適切に決定することが可能となる。更に、データの解析期間幅を適切に決定することで、計算処理量の見積りが可能となり、コンピュータ資源等のリソースを有効に利用することが可能となる。

実施例１では、データ解析システムの導入の効果の判定をするために、導入効果を判定し、回帰式を作成する評価システムについて記載してきた。次に、実際に顧客の業務データを用いて解析を行うデータ解析システムの例を示す。

図１５は、データ解析システム１０５の詳細構成を含む本実施例の概要を示した図である。顧客データセンタ１０および外部のデータ解析システム１０５のそれぞれの構成およびデータ処理について説明する。

顧客データセンタ１０には、業務データ１０１が格納されている。業務データ１０１は、過去データ１０１Ａと当日データ１０１Ｂに分かれて格納される。区別して格納されていない場合には、後に説明する取得部１２０Ａによって、業務データ１０１を受け付けた後に、過去データ１０１Ａおよび当日データ１０１Ｂに区別する。また、顧客の業務システム１１０は、顧客側の従業員に業務の指示を与える業務指示部１１０Ａおよび業務の指示に対しての業績結果を確認する業績管理部１１０Ｂにより構成される。これらの内容はシステム端末１０２より確認できる。なお、図１５は本実施例の顧客データセンタ１０およびデータ解析システム１０５のそれぞれの構成の一例であり、データ解析システム１０５が顧客データセンタ１０内の業務システム１１０内に組み込まれていても構わない。このような構成とすることで、顧客の業務データのやり取りを顧客データセンタ内で完結させることが可能となる。

データ解析システム１０５は、案件管理部１２０、モデル生成部１３０および変数最適化部１４０を備えている。

案件管理部１２０においては、必要なデータを用いて生産性または売上等の目的変数の最適化処理を業務毎に行う。案件管理部１２０は、取得部１２０Ａにより顧客データセンタ１０より過去データ１０１Ａおよびどの変数を目的変数とするかの指定を取得して、モデル生成部１３０に送信する。

モデル生成部１３０は、過去データ取得部１３１、複合説明変数生成部１３２、変数生成ロジックデータベース１３３、複合説明変数データベース１３４、統計モデリング部１３５およびモデルデータベース１３６を備えている。

モデル生成部１３０においては、過去データ取得部１３１にて、過去データ１０１Ａ及び目的変数の指定を受信し、複合説明変数生成部１３２において受信した過去データ１０１Ａを複合的に組み合わせ、複合説明変数に変換した後に複合説明変数データベース１３４に格納する。複合説明変数の生成には格納されている変数生成ロジック１３３が使用される。変数生成ロジック１３３は、予め設定されたロジックを使用することも可能であるが、業績管理部１１０Ｂにおいて管理する業績結果と連動することによりダイナミックに変更したロジックを使用することもできる。ここでは、例えば、過去データ１０１Ａについて、データ同士を複合的に組み合わせて、目的変数に影響を与え得る新たな複合説明変数を生成する処理等が行われる。例えば、１０００個から１００万個を超える大量の複合説明変数を自動生成する。

複合説明変数の生成方法としては、特許文献１に記載のような、条件オペレータ、対象オペレータおよび演算オペレータの３つのオペレータのセットによる説明変数生成処理を行っても良いし、既存の他の方法で複合説明変数を生成しても良い。複合説明変数の例として、室温が１５度以下であるか等のある説明変数についての条件付きの変数や、室温が１５度以下であり、かつ、作業個数が１００個毎分より大きい場合には、目的変数が大きい傾向があるといった場合の「室温×作業個数」を示す変数等が挙げられる。

更に、統計モデリング部１３５においては、複合説明変数データベース１３４に格納されている複合説明変数の中から、顧客の指定した売上や生産性等に関する変数（目的変数ｙ）に影響する変数を統計的に選択し、それらの関係性をモデルとして作成し、作成したモデルをモデルデータベース１３６に格納する。ここでのモデルは、目的変数と複合説明変数との関係を表せるモデルであれば良く、例えば、回帰式等が挙げられる。

業務判断において考慮すべき要因が多数あると、膨大な選択肢からの判断が必要である。例えば、倉庫に１００件の出荷依頼がある場合には、１０の７９乗個（１００の階乗個）という膨大な作業順序の組合せの中から、作業効率が良い作業順序を選択する必要がある。このモデルを利用すると、これらの選択肢の優劣を判断することが可能となる。

また、データ解析システム１０５がウェブＡＰＩを介して業務システム１１０からデータと設定情報を受信することにより、モデルを作成する構成にしても構わない。このような構成にすることで、業務ごとに複雑な個別プログラムを有したデータ解析システム１０５を作成する必要が無くなることで最適化問題の専門知識が無くてもデータ解析を行うことが可能となり、ソフトウェア開発の労力を抑えることが可能となる。

案件管理部１２０は、モデル生成部１３０において生成されたモデルを取得して、変数最適化部１４０に送信する。次に変数最適化部１４０における処理に関して説明する。

変数最適化部１４０は、当日データ取得部１４１、モデル取得部１４２、組合せ変更・複合説明変数生成部１４３および目的変数評価部１４４を備えている。

当日データ取得部１４１は、顧客データセンタ１０から当日データ１０１Ｂを受け付ける。また、モデル取得部１４２は、案件管理部１２０からモデル１３６を受け付ける。顧客データセンタ１０の業務データ１０１が過去データ１０１Ａと当日データ１０１Ｂで分けて格納されていない場合には、案件管理部１２０から区別された当日データを当日データ取得部１４１が受け付ける。

このように取得されたモデル１３６および当日データ１０１Ｂは、組合せ変更・複合説明変数生成部１４３に送信される。

組合せ変更・複合説明変数生成部１４３は、業務タスクの組合せパターンを変更し、実際の当日データを入力して、組合せパターンの変更に該当する複合説明変数を計算する。ここでは、過去データを用いて作成したモデルに対して、当日のデータを入力して複合説明変数を計算しているため、当日の目的変数に対する影響を考慮したモデルの作成が出来ると同時に、業務タスクの組合せのパターンの変更に該当する複合説明変数を計算しているため、後で説明する目的変数の評価および業務タスクの組合せのパターンの変更の繰り返し処理により、目的変数が改善する組合せのパターンを抽出することが可能となる。

次に、目的変数評価部１４４は、業務タスクの組合せに対応する目的変数について、組合せ変更・複合説明変数生成部１４３にて計算された複合説明変数を用いて評価する。目的変数評価部１４４は、業務タスクの組合せに対応する目的変数が改善しているかどうかを判断し、目的変数の値が改善していると判断した場合には、その業務タスクの組合せを業務システム１１０に送信する。目的変数の値が改善していないと判断した場合には、業務タスクの組合せの変更を行わない。ここでは、業務タスクの変更を１回しか行っていないが、これを繰り返し行う処理も可能である。繰り返し処理を行う目的変数評価部１４４の処理の例については、１４５〜１４７に示している。ここでは、業務タスクの組合せパターンは逐次変更され、目的変数が改善されるように探索的な処理が繰り返し実施される。具体的な処理としては、組合せ変更・複合説明変数生成部１４３において、業務タスクの組合せが変更され、複合説明変数を計算し、目的変数が改善されたかどうかのチェックが行われ（１４６）、目的変数が改善されない場合には、組合せの変更を行わず前回組合せが保持される（１４７）。

前回組み合わせに戻す処理（１４７）において、目的変数が改善されていない場合にも、ある確率で組合せの変更を行うことで局所最適に陥らないようにすることも可能である。これらの繰り返し処理は、目的変数が収束するか、または繰り返しの上限回数に達するかどうか、という終了条件によって判定され（１４５）、終了となった場合には、その組合せを最適化の結果として、業務システムに１１０に送信する。終了条件としては、例えば、目的変数の改善レートが所定の改善閾値を超えた場合等が挙げられる。

図１６に、以上の探索処理を行った際の、目的変数の改善レートを図示しており、探索処理開始時からどの程度目的変数が改善したかを縦軸に示してある。図１６における目的変数は、例えば作業時間等の、値の小さい方が好ましい変数である。ここでは、改善閾値１６０１として、閾値５パーセントを設定した例を示している。この改善閾値１６０１を下回ることを終了条件として設定しており、図１６の例では、約１８０００回の組合せ変更の試行により有為な目的変数の改善が行われていると判断することができる。

このように繰り返し処理を行うことで、目的変数が最適化された業務のタスクの組合せパターンを抽出することが可能となる。

図１７には、上記の探索処理で改善される業務の一例として、物流倉庫においてのピッキング処理順序（カートＮｏ）を最適化する処理を示している。ピッキング処理のカートＮｏを入れ替えて、その後にモデル１３６を用いて全体作業時間の評価をし、入れ替えを保持する又は入れ替え前の組合せに戻す処理を繰り返すことにより、作業時間が最適化されるようなピッキング処理順序を得ることができる。なお、この例においては、目的変数としての全体作業時間は、ピッキング作業エリアにおけるカートの各棚への滞在時間（説明変数）の組合せ、として表現される場合を示している。ここでの目的変数と説明変数の組合せは一例であり、売上等の目的変数や店員の滞在エリアへの滞在時間等の説明変数の組合せであっても構わない。

このように、本実施例に係るデータ解析システム１０５は、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける取得部１２０Ａと、業務データのうちの過去のデータを用いて、目的変数と業務データ内の複数の変数との関係性をモデルとして作成する統計モデリング部１３５と、モデルおよび業務データのうちの当日のデータに基づいて、業務のタスクのパターンを変更した場合の目的変数の変化を計算し、目的変数が改善した場合に、パターンの変更を維持する目的変数評価部１４４を備えている。

係る構成により、顧客側で実際に業務のタスクのパターンを変えて効果を判断し、試行錯誤的に最善の業務のタスクのパターンを判断することなく、自動でより目的変数に効果の大きい業務のタスクのパターンを算出することが可能となる。

なお、実施例１、実施例２で説明したように、データ解析システム１０５においては、過去データ１０１Aの中から評価システム１０６にて決定された必要な変数のみを扱うことができ、また、評価システム１０６にて決定された規定された解析期間幅を使用することができる。従って、事前に必要な計算リソースを見積もることができ、コンピュータ資源等を有効に利用することが可能となる。

１０顧客データセンタ、１１データ解析サービスセンタ
１０１業務データ、１０２システム端末、
１０５データ解析システム、１０６評価システム、１０７受付部、
１０８データ分析部、１０９表示部、３０１統計値計算部、
３０２回帰式作成部、４０１目的変数ａの時系列データ、
５０１業務データ・目的変数受付ステップ、
５０２統計値計算ステップ、５０３〜５０５効果判定ステップ、
５０６回帰式作成ステップ、５０７判定結果送信ステップ、
５０８判定結果及び回帰式送信ステップ、
５０９表示ステップ、６０１目的変数指定エリア、
６０２導入効果表示エリア、６４結果表示エリア、
６７回帰式表示エリア、９１数値表示エリア、
１００２属性受付ステップ、１００５削減コスト計算ステップ、
１１０１期間候補作成部、１１０２期間決定部、
１２０１期間候補作成ステップ、
１２０２、１２０３解析期間幅決定ステップ、
１４０１ＰＯＳテーブル、１４０２作業テーブル、
１０１Ａ過去データ、１０１Ｂ当日データ、
１１０Ａ業務指示部、１１０Ｂ業績管理部、１２０案件管理部、
１２０Ａ取得部、１３０モデル生成部、１３１過去データ取得部、
１３２複合説明変数生成部、１３３変数生成ロジックデータベース、
１３４複合説明変数データベース、１３５統計モデリング部、
１３６モデルデータベース、１４０変数最適化部、
１４１当日データ取得部、１４２モデル取得部、
１４３組合せ変更・複合説明変数生成部、１４４目的変数評価部、
１４６目的変数改善表示、１６０１改善閾値、
１８０１改善値計算部

Claims

データ解析システムの導入効果を表示する評価システムであって、
業務データおよび前記業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部と、
前記目的変数である時系列データの所定の期間における値の変動する度合いを示す振れ幅を求める統計値計算部と、
前記振れ幅が所定の振れ幅閾値より大きい場合に、前記所定の期間内の前記目的変数、および、前記目的変数と相関のある前記業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部と、
前記回帰式を表示装置に表示する表示部と、を有することを特徴とする評価システム。
請求項１に記載の評価システムであって、
前記統計値計算部は、前記時系列データについて前記所定の期間における分散値を求め、
前記回帰式作成部は、前記分散値が所定の分散閾値より大きい場合に、前記所定の期間内の前記回帰式を作成することを特徴とする評価システム。
請求項１に記載の評価システムであって、
前記受付部は、顧客から前記振れ幅閾値を受け付け、
前記回帰式作成部は、前記振れ幅が前記顧客から受け付けた前記振れ幅閾値より大きい場合に前記所定の期間内の前記回帰式を作成することを特徴とする評価システム。
請求項１に記載の評価システムであって、
前記回帰式作成部が、前記振れ幅が前記振れ幅閾値より大きいと判定した場合に、前記データ解析システムが解析を行う期間の候補である期間候補を作成する期間候補作成部と、
前記期間候補の期間内の前記時系列データについて、極大点および極小点が少なくとも１つずつ含まれている場合には、前記期間候補を前記データ解析システムが解析を行う期間である解析期間幅に決定する期間決定部を更に有することを特徴とする評価システム。
請求項１に記載の評価システムであって、
前記回帰式作成部は、前記振れ幅が前記所定の振れ幅閾値より大きい場合に前記導入効果が大きいと評価し、
前記表示部は、前記導入効果を前記表示装置に表示することを特徴とする評価システム。
請求項１に記載の評価システムであって、
前記説明変数は、前記業務データ内の変数を組合せて生成した複合説明変数であることを特徴とする評価システム。
データ解析システムの導入効果を評価する評価方法であって、
受付手段が、業務データおよび前記業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップと、
統計値計算手段が、前記目的変数である時系列データの所定の期間における値の変動する度合いを示す振れ幅求める統計値計算ステップと、
回帰式作成手段が、前記振れ幅が所定の振れ幅閾値より大きい場合に、前記所定の期間内の前記目的変数、および、前記目的変数と相関のある前記業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップと、
表示手段が、前記回帰式を表示装置に表示する表示ステップと、を有することを特徴とする評価方法。
請求項７に記載の評価方法であって、
前記統計値計算ステップにおいて、前記統計値計算手段は、前記時系列データについて前記所定の期間における分散値を求め、
前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記分散値が所定の分散閾値より大きい場合に、前記所定の期間内の前記回帰式を作成することを特徴とする評価方法。
請求項７に記載の評価方法であって、
前記受付ステップにおいて、前記受付手段は、顧客から前記振れ幅閾値を受け付け、
前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記振れ幅が前記顧客から受け付けた前記振れ幅閾値より大きい場合に前記所定の期間内の前記回帰式を作成することを特徴とする評価方法。
請求項７に記載の評価方法であって、
前記回帰式作成ステップにおいて、前記回帰式作成手段が、前記振れ幅が前記振れ幅閾値より大きいと判定した場合に、前記データ解析システムが解析を行う期間の候補である期間候補を作成する期間候補作成ステップと、
前記回帰式作成手段が、前記期間候補の期間内の前記時系列データについて、極大点および極小点が少なくとも１つずつ含まれている場合に、前記期間候補を前記データ解析システムが解析を行う期間である解析期間幅に決定する期間決定ステップを更に有することを特徴とする評価方法。
請求項７に記載の評価方法であって、
前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記振れ幅が前記所定の振れ幅閾値より大きい場合に前記導入効果が大きいと評価し、
前記表示ステップにおいて、前記表示手段は、前記導入効果を前記表示装置に表示することを特徴とする評価方法。
請求項７に記載の評価方法であって、
前記説明変数は、前記業務データ内の変数を組合せて生成した複合説明変数であることを特徴とする評価方法。