JP6326510B2 - 評価システム、評価方法およびデータ解析システム - Google Patents

評価システム、評価方法およびデータ解析システム Download PDF

Info

Publication number
JP6326510B2
JP6326510B2 JP2016574300A JP2016574300A JP6326510B2 JP 6326510 B2 JP6326510 B2 JP 6326510B2 JP 2016574300 A JP2016574300 A JP 2016574300A JP 2016574300 A JP2016574300 A JP 2016574300A JP 6326510 B2 JP6326510 B2 JP 6326510B2
Authority
JP
Japan
Prior art keywords
data
period
variable
objective variable
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016574300A
Other languages
English (en)
Other versions
JPWO2017037768A1 (ja
Inventor
森脇 紀彦
紀彦 森脇
知明 秋富
知明 秋富
淳一 平山
淳一 平山
矢野 和男
和男 矢野
竜治 嶺
竜治 嶺
文也 工藤
文也 工藤
篤志 宮本
篤志 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2017037768A1 publication Critical patent/JPWO2017037768A1/ja
Application granted granted Critical
Publication of JP6326510B2 publication Critical patent/JP6326510B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、評価システム、評価方法およびデータ解析システムに関する。
近年、ビッグデータと呼ばれる大量のデータを解析し、今まで人が勘と経験で行ってきた意思決定を支援するデータ解析システムが急速に発展してきており、そのような解析の結果を利用して顧客に対して施策を提示する技術も発展してきている。
このようなデータ解析システムの例として、特許文献1には、設定した目的変数に対して統計的に相関の高い説明変数を順に羅列する処理や、説明変数と目的変数の関係の回帰式を作成する処理を行うデータ解析システムが記載されている。また、特許文献1では、未知の施策導入のリスクを軽減するためのサービス効果計算処理を行っている。この処理により、施策導入によって顧客や従業員の行動が変わることが、利益等にどのように寄与したのかを、定量的に評価している。
特許文献2には、ある操業変数についての操業評価指標の最大値と最小値の差分を基に、その操業変数の値の変更により操業評価指標がどの程度変化するかを反映した操業影響度というものを求めている。その操業影響度が大きい操業変数を抽出することにより、操業状況の改善に有効な操業変数を選択している。
さらに、特許文献3には、目的変数に関するデータを分割し、分割された2つの目的変数の集合のそれぞれについて偏差平方和から求めるまとまり度を計算し、このまとまり度の値が大きい場合に、それぞれの集合に属するデータ間の統計的有意差が大きいと判断している。
特開2014−81750号公報 特開2013−140548号公報 特開2008−16008号公報
データ解析システム導入により予測される効果は、データ解析システム導入前には顧客にとって不明確な場合もあった。これは、目的とするアウトカム(目的変数)が上昇する可能性があるか否かを施策の実施前に判断することが困難であることに起因する。困難である理由について下記に示す。
特許文献1においては、施策の導入の効果を評価するために、行動変化施策を実施し、一定期間後にサービス効果計算処理を行っている。しかし、この方法では、少なくとも一回はデータ解析システムが提示した施策を実施する必要があり、施策の実施の前にサービス効果を評価することは困難であった。
特許文献2では、操業変数毎に、操業状況の良否判定結果の確率密度に基づいて算出した操業評価指標の最大値と最小値から操業影響度を求めて、操業状況の改善に有効な操業変数を求めている。しかしながら、この計算方法では、あくまで操業変数が操業評価指標に与える影響を求めることは出来るが、操業状況自体に改善する余地があるかどうかの評価をすることは難しかった。例えば、減風発生割合に影響を最も与える操業変数を抽出することは可能だが、データ解析システムの提示する施策の実行により、減風発生割合を低下させ、炉況の好調を維持出来るかどうかの直接的な判断は困難であった。そのため、特許文献2に記載の技術では目的変数(操業状況)自体が向上する可能性を有しているかの判断をすることが難しかった。
さらに、特許文献3では、分割された目的変数の集合ごとに偏差平方和を求め、各集合の偏差平方和を足した値が小さい場合には、分割された2つの目的変数の集合間の統計的有意差が大きいと判断し、その分割により生じた2つの集合をもとにデータ解析を行っている。つまり、各集合内のデータの偏差平方和の値が小さくなればなるほど、そのような集合を生む分割点が解析に適していると判断している。しかしながら、この方法では、目的変数のデータを解析するための分割点を適切に判断することは出来るが、目的変数そのものに向上する余地があるかどうかの判断をすることは困難であった。
このように、従来の技術では、目的変数を変動させる他の説明変数を効率的に見つけ出すことは検討されていたが、目的変数自体が上昇する可能性が高いかどうかの評価についての検討は行われていなかった。更に、目的変数の増減の評価が行われていなく、どの目的変数に着目して解析を行えば良いか判断することが困難であった。さらに、コンピュータ資源等のリソースをどのように準備するかの検討が容易ではなかった。
また、特許文献1などに記載のデータ解析システムは、多数の説明変数を生成してその中から目的変数と相関の高い説明変数を自動抽出するため、人手によるデータの解析では着目が難しい説明変数を抽出することが特徴の一つである。従って、別の課題として、仮に上昇の可能性のある目的変数に着目して解析または目的変数の上昇の可能性のある期間について解析を行っていたとしても、顧客にとって制御困難または不可能な説明変数が抽出される可能性もあった。
以上を踏まえ、本願は、データ解析システムが提案した施策によって、顧客が指定したパフォーマンスを示す指標である目的変数に改善効果をもたらすかどうかをデータ解析システムの導入前に評価し、その評価の高い目的変数と、その評価の高い期間において目的変数と相関の高い説明変数等の情報を表示することをより容易にする技術を提供することを目的とする。
前記課題を解決するための手段のうち代表的なものを例示すれば、データ解析システムの導入効果を表示する評価システムであって、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部と、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算部と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部と、回帰式を表示装置に表示する表示部と、を有する評価システムが挙げられる。
また、データ解析システムの導入効果を評価する評価方法であって、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップと、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算ステップと、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップと、回帰式を表示装置に表示する表示ステップとを有する評価方法が挙げられる。
本発明によれば、顧客が事前に目的変数が上昇する可能性及び施策の実施できる可能性を確認することがより容易になる。これにより、どの目的変数に対してデータ解析システムの解析を行うか、どの期間のデータに対してデータ解析システムの解析を行うか等の情報に基づいたコンピュータリソースの配分もより容易に行うことができる。
本発明の全体概要の例を示した図である。 評価システムのハードウェア構成の例を示した図である。 評価システムにおけるシステム構成の例を示した図である。 目的変数の時系列データのグラフの例を示した図である。 評価システムの処理のフローの例を示した図である。 表示装置に表示される画面の例を示した図である。 目的変数の時系列データのグラフの例を示した図である。 目的変数の時系列データのグラフの例を示した図である。 表示装置に表示される画面の例を示した図である。 回帰式作成部の処理のフローの例を示した図である。 評価システムにおけるシステム構成の例を示した図である。 解析期間幅の決定処理のフローの例を示した図である。 目的変数の時系列データのグラフの例を示した図である。 業務データの例を示した図である。 データ解析システムにおけるシステム構成の例を示した図である。 目的変数の改善を表すグラフの例を示した図である。 目的変数の改善を表す表の例を示した図である。 評価システムにおけるシステム構成の例を示した図である。
本実施例では、目的変数に関するデータの振れ幅を計算して、データの振れ幅が大きい期間内の回帰式を表示する評価システムの例を説明する。
本明細書中では、評価システムとデータ解析システムを区別して記載している。本実施例におけるデータ解析システムとは、顧客のデータを解析し、顧客の意思決定を支援、プラントや機器を直接制御するシステムのことをいう。例として、機械学習、統計分析を主なデータ解析の手法としているシステムが挙げられる。データ解析システムでは、業務に関するデータから、例えば1万個を超える非常に多数の説明変数を生成してデータの解析を行う。それに対し、本実施例における評価システムとは、データ解析システムの導入の効果を事前に判定するために、目的変数の振れ幅が大きい期間内の回帰式を作成し、効果的な説明変数を抽出するためのシステムのことである。
以下、図面を参照しながら説明する。
図1は、本実施例の全体概要の具体例を示した図である。顧客データセンタ10および外部のデータ解析サービスセンタ11のそれぞれの構成およびデータ処理について説明する。
顧客データセンタ10は、店舗、支店、現場等の職場から集められた業務データ101および業務データの内の複数の変数のうちどの変数を目的変数とするかを指定し、データ解析サービスセンタから受け付けた評価結果を表示するシステム端末102等から構成される。業務データ101およびシステム端末102による目的変数の指定は、ネットワーク103経由でデータ分析サービスセンタ11に送信される。
データ解析サービスセンタ11は、顧客データセンタ側の指示により、実際にデータの解析を行うデータ解析システム105、および、顧客データセンタ10から入出力部104を経由して収集されたデータを分析してデータ解析システム105の導入効果を評価し、回帰式を作成する評価システム106等により構成される。顧客データセンタ10から送信された業務データ101および目的変数の指定はそれぞれ、入出力部104を経由して評価システム106内の受付部107に入力される。
図1の評価システム106は、受付部107、データ分析部108および表示部109を備えている。
受付部107は、業務データ101およびシステム端末102により行われた目的変数の指定を受け付けて集約する。業務データ101を受け付けた際に、評価システム106の処理に適切なデータ形式に変換してもよい。目的変数とは、業務データ101中の複数の変数の中から指定された変数のことであり、通常は、顧客が上昇させたい、減少させたい等、望ましい状態を規定する業務上の指標のことをいう。目的変数としては、例えば、売上等の経営指標や作業の生産性、製品の性能ばらつきなどが挙げられる。指定される目的変数は1つとは限らず複数個あっても構わない。複数の目的変数が指定された場合には、それぞれの目的変数についてデータ分析部108により分析を行う。
業務データとは、顧客の職場での業務に関する任意のデータのことをいう。例えば、従業員の作業に関するデータや、従業員間でのコミュニケーションに関するデータ、従業員のID・職位・性別のデータ、売上データ、または、作業個数等の作業効率に関するデータなどが挙げられる。
図14は、業務データ101の例を示した図である。POSテーブル1401は小売店の来客の商品購入に関する業務データ101の一部を示した表であり、作業テーブル1402は倉庫の作業に関する業務データ101の一部を示した表である。
POSテーブル1401には、購入金額、購入点数、客単価のデータが小売店の全商品及びエリアAに陳列されている商品ごとに格納されている。例えば、データ解析サービスセンタにとっての顧客である小売店管理者は、購入金額の全商品合計の値1403を目的変数として指定する。
作業テーブル1402には、倉庫内の作業ID、作業者ID、毎分の作業個数である作業数、作業の開始時刻、作業対象の商品IDが格納されている。例えば、データサービスセンタにとっての顧客である倉庫管理者は、作業数1404を目的変数として指定する。ここでの作業は、例えば倉庫での梱包作業、ピッキング作業等が挙げられる。
次に、図1のデータ分析部108は、受付部107から業務データ101および目的変数の指定を受け付けて、目的変数に関する時系列のデータの振れ幅を基にデータ解析システム105の導入効果を判定し、判定結果および判定結果に基づいて、目的変数およびその目的変数と相関の高い説明変数を基に作成した回帰式を表示部109に送信する。
表示部109では、データ分析部108から受け付けた導入効果の判定結果および回帰式を、入出力部104およびネットワーク103を介してシステム端末102の表示装置に表示する。
図1では、データ解析サービスセンタ11は顧客データセンタ10の外部に構成されているが、データ解析サービスセンタ11の機能を有するシステムが顧客データセンタ10内に構成されていてもよく、図1の構成に限らない。データ解析サービスセンタ11の機能を有するシステムを顧客データセンタ10内に構成することにより、データの処理をすべて顧客データセンタ内で行うことができるので、顧客情報の保護のためにデータ変換をする必要がなく、データの処理速度向上につながる。
更に、評価システム106がデータ解析サービスセンタ11内に構成されているように記載されているが、外部のサービスセンタに構成されていても構わない。
また、顧客の業種に関しては、特に限定する必要はなく、業務に関してデータを集約しているあらゆる業種の顧客に対して本発明の評価システムを適用することができる。顧客の業種としては例えば、物流業、金融業、製造業、小売業、医療業およびインフラ業等が想定される。
図2は、本実施例における評価システム106を実現するハードウェア構成の一例を示す図である。
評価システム106におけるハードウェア構成は、コンピュータシステム(計算機)を用いて実現され、少なくとも1組の、CPU201、ROM202、RAM203、キーボード204、表示装置205、HDD206、プリンタ207、マウス208およびデータバス209から構成される。
ROM202は、評価システム106のOS(オペレーティングシステム)等を格納する。RAM203は、評価システム106に関するソフトウェアおよび後述する振れ幅閾値等の各閾値を格納するデータベース(図示せず)を格納する。キーボード204は、CPU201を操作する。HDD206は、入力データや分析データを格納する。表示装置205は、入力データ、分析データまたはデータ分析の処理の過程等を示す。マウス208は、CPU201を操作する。データバス209は、各々のデータを通信する。
評価システム106において、CPU201で、RAM203に格納されたデータ分析に関するソフトウェアを実行することで、図1に示した各機能を実現することが出来る。
更に、データ解析システム105におけるハードウェア構成も図2に示したものと同一であるため、詳細は省略するが、データ解析システム105において、RAM203に格納されたデータ解析に関するソフトウェアを実行することで、後述するデータ解析システム105における各機能を実現することが可能となる。
図3は、評価システム106の構成図の例である。評価システム106のデータ分析部108は、統計値計算部301および回帰式作成部302を備えている。評価システム106は、入出力部104から、顧客の業務データ101および顧客によるシステム端末102からの目的変数の指定を受け付ける。また、統計値計算部301により目的変数に関するデータの振れ幅を計算し、回帰式作成部302により、統計値計算部301により計算された振れ幅を基にデータ解析システム導入の効果を判定し、判定結果に基づいて目的変数および目的変数と相関の高い説明変数により回帰式を作成する。また、回帰式作成部302においては、図15において後述するように、複数の説明変数から生成された複合説明変数を用いて、回帰式を作成することもできる。
受付部107は、前述のように業務データ101および目的変数の指定を受け付けた後、統計値計算部301に業務データ101および目的変数の指定を送信する。
統計値計算部301は、受付部107から顧客の業務データ101および目的変数の指定を受け付ける。
業務データの取得方法としては、もともと顧客側が取得していた業務データを受け取ってもよいし、顧客の職場に各種センサを設置してもらい業務データを取得してもよい。各種センサを設置してもらうことにより、より実態に即した業務データを用いて導入効果の評価をすることができ、評価の精度が向上する。
目的変数の指定は顧客データセンタ10から行われているように図示されているが、データ解析サービスセンタ11内で任意の目的変数を指定し、それを統計値計算部301が受けとってもよい。
統計値計算部301は、受け付けた業務データおよび目的変数の指定を基に、指定された目的変数に関する時系列データを抽出し、目的変数に関する時系列データの所定の期間における振れ幅を計算する。
図4は、目的変数に関する時系列データをグラフにして表した図面である。統計値計算部301の計算処理について、図4を用いて説明する。
まず、統計値計算部301は、業務データに含まれる複数の変数の中から、システム端末102により指定された目的変数に関するデータを抽出する。ここでは、目的変数aおよび目的変数bが抽出されたとする。
続いて、統計値計算部301は、目的変数aの時系列データ401および目的変数bの時系列データ402を作成する。図4では、連続的な時系列データとして図示しているが、非連続な点のデータでも構わない。連続的な時系列データは、例えば、スプライン曲線生成などの既存の曲線生成技術によって行う。
次に、抽出した時系列データ401および402の所定の期間t1〜t2の間の振れ幅を計算する。ここで、所定の期間t1〜t2は、統計値計算部301の外部から入力されたものを用いても良いし、統計値計算部301が任意に決定したものでもよい。例えば、過去に取得した目的変数に関するデータの全期間をt1〜t2としても良いし、何らかの事情で業務の環境が変化した場合には変化したタイミングから現在までの期間をt1〜t2として設定しても良い。過去に取得した目的変数に関するデータの全期間をt1〜t2とした場合には、より多くのデータに基づいた導入効果の評価をすることができ、評価結果の精度が向上する。また、業務の環境が変化したタイミングから現在までの期間をt1〜t2とした場合には、現在の業務環境に則した導入効果の評価をすることができる。なお、ここでは時系列データ401および402の所定の期間を同じ期間としているが、異なる期間で処理を行っても構わない。
目的変数に関する時系列データの振れ幅とは、目的変数が過去どの程度変化しているかを表した数値であり、時系列データの波形の振れ幅を表している。例えば、データの平均値a1とデータの最大値との差403、データの平均値a1とデータの最小値の差404、または、データの最大値と最小値の差406等が振れ幅として考えられる。また、上記では平均値との差をとっているが、中央値でも同様に考えられる。
振れ幅が大きい時系列データとは、過去に変動が大きかったことを表している。すなわち、そのような時系列データを持つ目的変数は、日常的にまたは時間的に数値が変化していることを表しており、その数値の上昇または下降のポテンシャルを持っている可能性が高く、データ解析システムの導入により改善がしやすいものであるということがいえる。この点で、特許文献3のように、各集合のデータの偏差平方和の値の和が小さくなればなるほど各集合のデータは解析に値すると判断する技術とは逆の思想であることに留意されたい。
最後に、統計値計算部301は、計算した振れ幅を回帰式作成部302に送信する。
ここで、振れ幅を計算する対象が目的変数の時系列データそのものであることに留意されたい。この振れ幅を処理の対象とすることにより、特許文献2のように操業状況の良否判定結果の確率密度に基づいて算出した操業評価指標の最大値と最小値を取るだけでは、評価することが出来なかった目的変数自体の変化の可能性を評価することが可能となる。
回帰式作成部302は、統計値計算部301から受け付けた目的変数に関するデータの振れ幅を基に、データ解析システム105導入の効果を判定し、判定結果に基づき回帰式を作成する。
図4の目的変数aに関しての時系列データ401は振れ幅が大きいデータ、目的変数bに関しての時系列データ402は振れ幅が小さいデータを表したものである。
回帰式作成部302は、予め振れ幅閾値を保持している。この振れ幅閾値は、データ解析システム105導入の効果を判定する閾値である。回帰式作成部302は、振れ幅計算部301が計算したt1〜t2間の振れ幅と振れ幅閾値を比較し、t1〜t2間の振れ幅が振れ幅閾値よりも大きい場合には、データ解析システム105の「導入効果大」と判定し、t1〜t2間の振れ幅が振れ幅閾値未満の場合には、「導入効果小」と判定する。
目的変数が売上の場合の振れ幅閾値として、1日の売上の平均値の10パーセントの数値が考えられる。例えば、ある店舗の1日の売上の平均が100(万円)であった場合には、振れ幅閾値は10(万円)と設定してもよい。1日の売上で閾値を決めたが、1週間でも1ヶ月でも同様に考えられる。
また、目的変数が生産性の場合の振れ幅閾値として、生産性を示す数値の5パーセントの数値が考えられる。例えば、任意の従業員のある物品のピッキング作業の1時間あたりの個数が150(個)であった場合には、振れ幅閾値は8(個)と設定される。個数だけでなく、半導体素子の製造における歩留まり割合などの確率でも同様に考えられる。
振れ幅閾値は、評価システム106の外部から入力されてもよい。例えば、顧客データセンタ10のシステム端末102が目的変数を指定するのと合わせて、振れ幅閾値を設定するようにしても構わない。この場合には、受付部107が振れ幅閾値を受け付ける。このようにすることで、顧客が要求する目的変数の上昇分を基に導入効果を判定することが可能となる。
次に、回帰式作成部302は、指定された目的変数について、t1〜t2間の振れ幅と振れ幅閾値との比較から、データ解析システム105の「導入効果大」と判定された場合に、t1〜t2間の目的変数およびその目的変数と相関の高い説明変数を用いて回帰式を作成する。回帰式は、顧客データセンタ10から受け付けた業務データ101を基に生成した説明変数と顧客に指定された目的変数から作成される。業務データ101から説明変数を生成する方法は、従来の技術を用いればよく、例えば、特許文献1に記載されているような事前に設定される生成ロジックによって、生成してもよい。これらの処理においては、データ解析システムの導入効果大と判定された期間についてのみ説明変数を生成していることから、処理量の低減によるシステムへの負荷を減らすことが可能となる。
具体的には、回帰式作成部302は、指定された目的変数と、その要因となる生成された説明変数との関係を調べて、それぞれの関係を明らかにする統計計算を実行する。ここでの統計計算としては、例えば回帰分析等が挙げられる。ここでの統計計算により、指定された目的変数に対して、その振れ幅の大きい期間において統計的に相関の高い説明変数を抽出することが可能となる。ここで、抽出した説明変数と指定された目的変数を基に回帰式を作成する。なお、回帰式作成部302においては、図15において後述するように、複数の説明変数から生成された複合説明変数を用いて、回帰式を作成することもできる。
回帰式としては、以下のような式(1)が考えられる。
Figure 0006326510
その後、回帰式作成部302は、表示部109に判定した導入効果および作成した回帰式の情報を送信する。
表示部109は、回帰式作成部302から導入効果の判定結果および作成された回帰式を受け付け、受け付けた判定結果および回帰式をシステム端末102の表示装置に表示させる形式に変換し、入出力部104を介してシステム端末102に送信する。また、評価システム106が持つ表示装置205に表示させても構わない。
図5は、評価システム106の処理のフローを示した図の例である。
ステップ501では、受付部107により業務データ101および目的変数の指定を受け付け、統計値計算部301に送信する。
ステップ502では、統計値計算部301により目的変数の時系列データを作成し、所定の期間における時系列データの振れ幅を計算し、回帰式作成部302に送信する。
ステップ503〜ステップ508は、回帰式作成部302によって処理される。これらの処理により、指定された目的変数に対して、データ解析システム105の導入効果を判定し、回帰式を作成する。
ステップ503では、統計値計算部301が受け付けた時系列データの振れ幅と予め保持している振れ幅閾値とを比較する。
ステップ503にて、データの振れ幅が振れ幅閾値より大きいと判定された場合には、データ解析システム105の「導入効果大」と判定され(ステップ504)、データの振れ幅が振れ幅閾値未満と判定された場合には、「導入効果小」と判定される(ステップ505)。
ステップ506では、回帰式作成部302により受け付けた目的変数と相関の高い説明変数を抽出し、目的変数および抽出された説明変数から回帰式を作成する。
ステップ507では、回帰式作成部302にて、「導入効果小」と判定された導入効果を表示部109に送信する。
ステップ508では、回帰式作成部302にて、「導入効果大」と判定された導入効果及び作成された回帰式を表示部109に送信する。
ステップ509では、表示部109により、導入効果および回帰式をシステム端末102の表示装置に表示する形式に変換し、その結果を入出力部104に送信する。
図6は、表示部109を通して顧客データセンタ10の表示装置に表示される画面の例を示した図である。この画面は、表示部109によって生成される。
本表示画面は、目的変数指定エリア601、導入効果表示エリア602から構成される。ここで、目的変数指定エリア601は、評価システム106による処理の前から、表示部109によって生成されているエリアである。これに対し導入効果表示エリア602は、データ分析部108の分析結果を受けて、表示部109が生成するエリアである。
目的変数指定エリア601は、上記の導入効果の計算処理を行う際の目的変数を指定するエリアである。これは、図1のシステム端末102のインタフェースに相当する。ここで、顧客が上昇させたい目的変数61とデータ解析システムの導入効果を評価するための振れ幅閾値62を設定する。ここでは、目的変数として、「店舗全体の月単位の売上」が設定され、閾値として、「300,000」が設定されている。目的変数と振れ幅閾値が設定され、計算実行ボタン63が押されると、データ分析部108は導入効果の判定および回帰式の作成を行い、その判定結果および回帰式を作成した場合にはその回帰式を導入効果表示エリア602に表示する。
導入効果表示エリア602は、導入効果および回帰式を表示するエリアであり、回帰式作成部302により判定された導入効果の判定結果や回帰式、統計値計算部301にて作成された目的変数に関する時系列データ等を表示する。
結果表示エリア64には、図5のステップ503の判定による導入効果の大小の判定結果が表示されている。
また、時系列データ表示エリア65には、図3の統計値計算部301により生成された時系列データが表示されている。ここでは、データの平均値とデータの最大値の差の部分に着目して表示させているが、時系列データの振れ幅が分かる図であれば異なる部分を表示させても構わない。異なる部分の表示の切り替えは、表示グラフ切替ボタン66により実施される。また、必要に応じて目的変数の名称、指標ID等の目的変数を特定する情報または振れ幅閾値の数値を長さで表した矢印等を合わせて表示してもよい。
回帰式表示エリア67には、回帰式作成部302によって作成された回帰式が表示されている。回帰式は、図5のステップ503による判定で「導入効果大」と判定された場合には、図のように表示すれば良いが、「導入効果小」と判定された場合には、何も表示しなくてもよいし、「導入効果小のため、回帰式の作成をしない」等といった情報を表示してもよい。この回帰式を確認することで、顧客は、目的変数の上昇の可能性のある期間における、その目的変数と相関の高い説明変数が何かを確認することができる。そのため、データ解析システムの導入の効果判断や、どの期間の解析を行えばよいか、どの目的変数に対して解析を行えばよいか、がわかるのでのコンピュータリソースの必要量についても事前検討することが可能となる。
このように、本実施例に係る評価システムは、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部107と、目的変数に関する時系列データの所定の期間内における振れ幅を求める統計値計算部301と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部302と、回帰式を表示装置に表示する表示部109を有することを特徴としている。
また、別の表現をすれば、本実施例に係る評価方法は、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップ501と、目的変数に関する時系列データの所定の期間における振れ幅を求める統計値計算ステップ502と、振れ幅が所定の振れ幅閾値より大きい場合に、所定の期間内の目的変数、および、目的変数と相関のある業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップ506と、前記回帰式を表示装置に表示する表示ステップ509を有することを特徴としている。
係る構成により、データ解析システムを導入する前に、顧客が向上させたい目的変数に対してのデータ解析システム導入の効果を推定することが出来る。これにより、データ解析システムの導入効果の事前判断を容易にすることや、コンピュータ資源等のリソース準備についての検討を容易にすることが可能となる。
<分散計算を導入効果に用いる変形例>
次に、目的変数に関するデータの分散値を計算して、データ解析システムの導入効果の判定を行う評価システムの例を説明する。基本的なシステム構成は図3と同じであるが、以下の点が相違する。
統計値計算部301は受付部107から顧客の業務データ101およびシステム端末102からの目的変数の指定を受け付けて、目的変数に関する時系列データの分散値を計算し、回帰式作成部302に送信する。
図7は、目的変数に関する時系列データをグラフにして表した図面である。本変形例における統計値計算部301および回帰式作成部302の処理について、図7を用いて説明する。
まず、統計値計算部301は、業務データ101に含まれる複数の変数の中から、目的変数に関するデータを抽出する。ここでは、目的変数c、目的変数dおよび目的変数eが抽出されたとする。続いて、目的変数cの時系列データ701、目的変数dの時系列データ702および目的変数eの時系列データ703を作成する。
次に、抽出した時系列データ701、702および703の所定の期間t3〜t4の分散値を計算する。ここで、所定の期間t3〜t4は、t1〜t2と同様に決められるものとする。また、分散値の計算方法は、従来の方法を用いて行う。例えば、以下の式(2)を用いて分散値を計算する。
Figure 0006326510
図7の時系列データ701および702は、分散値が小さい例を、時系列データ703は、分散値が大きい例を示している。
ここで、目的変数cおよび目的変数dの時系列データの振れ幅、例えば時系列データ701の平均値c1と最大値の差704及び時系列データ702の平均値d1と最小値の差705は共に、時系列データ703の平均値e1と最大値の差706及び平均値e1と最小値の差707よりも大きい値となっていることがわかる。しかしながら、目的変数cまたは目的変数dの変化のようなピークを1つ持ち、他の部分は定常的な変動をしている目的変数よりも、目的変数eのような複数のピークを持つ目的変数の方が、データ解析システム105の導入による効果が大きいことに発明者は想到した。その理由は以下の通りである。
目的変数cまたは目的変数dのようにピークを1つ持ち、他の部分は定常的な変動をしている目的変数は、そのピークが現れたタイミングで何らかの非定常的なイベントの影響を大きく受けていると考えられる。このような時系列データを持つ目的変数は、データ解析システムの提示する施策によっては改善が難しい。すなわち、目的変数cまたは目的変数dのような目的変数は、非定常的なイベントを除いた期間は変化が小さいので、その値の増減する幅が小さく、施策による上昇または下降のポテンシャルが小さい可能性が高い。これに対し、目的変数eのように複数のピークを持つ目的変数は、その値が小さい部分に関して、その値を上げるような施策の提示をすることが可能であり、データ解析システムの提示する施策によって目的変数が改善する可能性が高い。このように、データの振れ幅が大きい時系列データでも、必ずしもデータ解析システムの導入効果が高いとは限らない。
ここで、分散とは、式(2)で表されるため、t3〜t4が充分に大きい場合は目的変数c及びdに関する時系列データの分散値は小さくなる。そのため、これらの目的変数が指定されている場合には、導入効果は小さいと判定されることとなる。
なお、図8の目的変数fのように一部の期間(t7〜t6)でピークを1つ持ち、t7〜t6内のピーク以外の他の部分が定常的な変動をしていたとしても、他の期間に複数のピークを持つような時系列データや、目的変数gのようにピークを持ち、その前後が定常的な変動をしている時系列データであっても、t8〜t9間に複数のピークが含まれる時系列データは、分散値も大きくなるため、これらのようなデータの評価が小さくなることはない。目的変数fの変化を示すデータとしては、例えば、小売店の日ごとの売上額が考えられて、急激な変化をしているタイミングで店舗の付近でイベントが発生したと考えられる。また、目的変数gの変化を示すデータとしては、例えば、玩具店への月ごとの入場者数が考えられて、複数の急激な上昇をしている月は12月である場合等が考えられる。
このように、801のような変化を示す目的変数は、t5〜t7間等に複数のピークを持つ期間を含むため、この期間のデータを解析して施策を導入することにより、目的変数を改善することが可能である。また、802のような変化を示す目的変数はt8〜t9間等に複数のピークを含むため、これらの期間のデータの解析を行うことによって該当期間に対する効果的な施策を提示することが可能である。そこで、一部の突発的な変化による影響を少なくすることが可能な所定の期間内における分散値を評価に用いると良い。
最後に、統計値計算部301は、計算した分散値を回帰式作成部302に送信する。
回帰式作成部302は、予め分散閾値を保持しており、統計値計算部301が計算したt3〜t4間の分散値と分散閾値を比較し、t3〜t4間の分散値が分散閾値よりも大きい場合には、データ解析システム105の「導入効果大」と判定し、t3〜t4間の分散値が分散閾値未満の場合には、「導入効果小」と判定する。分散閾値は、振れ幅閾値と同様、評価システム106の外部から入力されても良い。
続いて、回帰式作成部302は、分散閾値との比較で「導入効果大」と判定された場合に、t3〜t4間の目的変数およびその目的変数と相関の高い説明変数を用いて回帰式を作成する。回帰式の作成は、上述した方法により行う。
その後、回帰式作成部302は、表示部109に判定した導入効果および作成した回帰式の情報を送信する。
なお、本変形例に係る評価システム106の処理フローについては、図5の振れ幅を分散値に変更したものであり、それ以外に異なるフローを有さないため図示を省略する。
このように、本変形例に係る評価システムは、時系列データについて所定の期間における分散値を求める統計値計算部301と、分散値が所定の分散閾値より大きい場合に、回帰式を作成する回帰式作成部302を有することを特徴としている。
係る構成により、全体が定常的な変化の中、1つのピークを持つ時系列データに関しての導入効果をより正確に評価できるようになる。
<導入効果を計算する変形例>
導入効果の大小だけでなく、定量的な導入効果を事前に顧客に提示することは、定量的な導入効果を確認し、データ解析システム導入の費用と比較することが可能となるため、データ解析システムのスムースな導入につながる。
ここでは、生産性向上、費用削減、売上額上昇の値など、解析システムが提示する施策の実行による定量的な導入効果を事前に顧客に提示する内容に関して説明する。基本的なシステム構成は図3と同じであるが、以下の点で相違する。
図18は、改善値計算部1801を有する回帰式作成部302を含んだ評価システム106の構成図の例である。
データ分析部108は、データ解析システム105の導入による目的変数の予測改善値を計算して表示部109に送信する。
統計値計算部301は、指定された目的変数に関する時系列データを抽出し、目的変数に関する時系列データの所定の期間の全てのデータにおける偏差の値を計算する。その後、計算したすべての偏差の値を回帰式作成部302内の改善値計算部1801に送信する。ここでは、例として偏差の値を計算しているが、中央値を計算して、中央値から差の値を計算し、その後の処理を行っても構わない。
改善値計算部1801は、すべての偏差の値を受け付けて、それを基にデータ解析システム105の導入による目的変数の改善の予想を示す予測改善値について計算する。
予測改善値とは、データ解析システムの導入により顧客が指定した目的変数の値がどの程度改善する可能性があるかを示した値である。例えば、目的変数が売上額、客単価等の金額に関する変数の場合は、予測改善値は「1,000」円等の金額として算出され、目的変数が作業効率、不具合発生割合等の生産性に関する変数の場合は、予測改善値は「13」パーセント、「10」個等の割合や個数で算出される。
改善値計算部1801の計算方法について、図4を用いて説明する。改善値計算部1801は、偏差の最大値403、偏差の最小値404、偏差の最小値の絶対値と偏差の最大値の和406、または、t1〜t2間の標準偏差の値を計算し、予測改善値とする。または、振れ幅閾値を超える偏差を抽出し、抽出された偏差の平均を求めて予測改善値としても構わない。
偏差の最大値を予測改善値とすることで、顧客が指定した目的変数についてどの程度上昇する可能性があるかの評価をすることができ、偏差の最小値を予測改善値とすることで、目的変数についてどの程度減少を抑えられる可能性があるかの評価をすることができる。また、偏差の最小値の絶対値と偏差の最大値の和や標準偏差の値を予測改善値とすることで、目的変数の平均を底上げできる可能性を評価することができる。
標準偏差の値の計算方法は、従来の方法を用いて行う。例えば、以下の式(3)を用いて標準偏差の値を計算する。
Figure 0006326510
その後、改善値計算部1801は、計算した予測改善値を表示部109に送信する。
表示部109は、受信した予測改善値を顧客データセンタ10のシステム端末102の表示装置に表示するための変換を行い、入出力部104を介してシステム端末102に送信する。
図9は予測改善値を表示する画面の例を示した図である。図6と同じ部分には同じ符号を付してあり、表示する内容及び表示のための各構成の動作が同じであるので、説明を省略する。
目的変数61と振れ幅閾値62が設定され、計算実行ボタン63が押されると、データ分析部108は、予測改善値の計算を行い、その結果を数値表示エリア91に表示する。
数値表示エリア91は、予測改善値を表示するエリアであり、改善値計算部1801により計算された予測改善値を表示する。ここでは、計算した予測改善値をそのまま表示してもよいし、四捨五入して表示しても構わない。また、目的変数が生産性等の場合には、例えば、「15パーセント減少/月」等の表示となる。必要に応じて目的変数の名称や指標ID等の目的変数を特定する情報を合わせて表示してもよい。この数値表示エリア91により、データ解析システム105の導入効果を確認することが容易となる。
このように、本変形例に係る評価システム106は、時系列データについて所定の期間における偏差の値または中央値からの差を求める統計値計算部301と、偏差の値または中央値からの差に基づいてデータ解析システム105の導入による目的変数の改善を示す値である予測改善値を求める予測改善値計算部1801と、予測改善値を表示装置に表示する表示部109を有することを特徴としている。
係る構成により、実際の目的変数の予想増加分の計算をすることが容易となる。これにより、顧客サイドは、導入費用と比較することが可能となるため、データ解析システムの導入の検討をすることが容易になる。
<導入効果の費用変換に関する変形例>
顧客が指定した目的変数が生産性の場合には、予測改善値は「13」パーセント上昇等の割合で算出される。この上昇によりどの程度、職場のコストが削減されるかを事前に顧客に提示することは、顧客側のデータ解析システム導入の費用との比較をより容易にする。
ここでは、目的変数の属性が生産性の場合に、計算された予測改善値を予測改善値の分増加または減少した場合に削減されるコストである削減コストを計算する変形例について説明する。目的変数の属性が金額の場合には、上述の計算により求めた予測改善値をそのまま数値表示エリア91に表示させるが、目的変数の属性が生産性等の金額以外の場合には、削減コストを求めて数値表示エリア91に表示させる。なお、基本的なシステム構成は図18と同じであるが、以下の点が異なる。
受付部107は、指定された目的変数の属性を受け付ける。顧客データセンタ10内のシステム端末102で目的変数を指定する際に目的変数の属性を指定し、入出力部104を介して受付部107に送信される。また、目的変数の属性は、データ解析サービスセンタ11内にて指定され、受付部107に送信されてもよい。こうすることで、顧客側の負担を減らすことが可能となる。
目的変数の属性とは、目的変数が金額に関するものか否かを表したものであり、大きく「金額」と「それ以外」に分けられる。受付部107は、受け付けた目的変数の属性を改善値計算部1801に送信する。
改善値計算部1801は受付部107から目的変数の属性を受け付け、削減コストを計算する。
改善値計算部1801は、コスト算出指標を予め保持している。コスト算出指標とは、目的変数の属性が金額に関するもの以外の場合に関して、その増加または減少によりどの程度費用が削減されるかを表した指標である。例えば、作業員一人あたりの単位時間あたりの作業個数が目的変数であった場合には、その作業個数の増加により減らすことが可能な作業員の作業時間が算出されるため、作業員の人件費と作業時間を掛け合わせることにより、削減されるコストが求められる。このように単位時間あたりの作業個数についての人件費の削減額がコスト算出指標の例である。コスト算出指標の他の例として、店舗入場者数1人あたりの平均購買額、機械停止確率1パーセントあたりの復帰作業費用等が挙げられる。
コスト算出指標は顧客データセンタ10側が保持している場合もあるため、その場合には、受付部107が入出力部104経由でコスト算出指標を受け付け、改善値計算部1801に送信する。
次に、改善値計算部1801は、計算した予測改善値と、コスト算出指標とに基づき削減コストを計算する。例えば、予測改善値にコスト算出指標を掛け合わせることにより、目的変数の属性が金額に関するものでない場合の予測改善値を金額にて表現することができる。その後、計算した削減コストを表示部109に送信する。
図10は改善値計算部1801の削減コストの計算処理のフローを示した図の例である。
ステップ1001では、改善値計算部1801により、統計値計算部301から偏差の値を受け付け、予測改善値を計算する。具体的な処理は既に述べているので省略する。
ステップ1002では、改善値計算部1801により、受付部107から目的変数の属性を受け付ける。
ステップ1003では、改善値計算部1801により、ステップ1002で受け付けた目的変数の属性が金額に関するものであるか否かの判断を行う。ここで、目的変数の属性が金額に関するものと判断された場合にはステップ1004に移行し、金額以外に関するものと判断された場合にはステップ1005に移行する。
ステップ1004では、改善値計算部1801により、ステップ1001にて計算した予測改善値を表示部109に送信する。
ステップ1005では、改善値計算部1801により、ステップ1001にて計算した予測改善値とコスト算出指標をもとに、削減コストを計算する。
ステップ1006では、改善値計算部1801により、ステップ1005にて計算した削減コストを表示部109に送信する。
このように、本変形例に係る評価システム106は、目的変数の属性を受け付ける受付部107と、目的変数の属性が金額に関するものでない場合には、時系列データが予測改善値の分増加または減少した場合に削減されるコストである削減コストを求める改善値計算部1801、削減コストを表示する表示部109を備えている。
係る構成により、目的変数の属性が金額に関するものでない場合でも、顧客は解析システムの提示する施策による目的変数に関しての金額面での効果を事前に知ることができる。これにより、データ解析システムの導入費用との費用対効果を判断することがより容易となり、データ解析システムのスムースな導入に繋がる。
データ解析システムによる解析は、状況変化への追従性を考慮して、解析期間幅を適切に設定してデータ解析をする必要があった。そこで、本実施例では、本発明の評価システムの別の例を示す。
実施例1では、データ分析部によりデータ解析システムの導入効果を評価し、回帰式を作成していたが、実施例2では導入効果が大きいと判定された場合に、業務データをデータ解析システムが解析する解析期間幅を決定するための評価システムの内容について説明する。基本的なシステム構成は図3と同様であるが、以下の点で相違する。
図11は、本実施例に係る評価システム106の構成図の例である。評価システム106は、業務データの解析期間幅を決定し、決定した解析期間幅をデータ解析サービスセンタ11内のデータ解析システム105に送信する。評価システム106は、図3の構成に加えて、期間候補作成部1101および期間決定部1102を更に備えている。
期間候補作成部1101は、データ分析部108から導入効果の判定結果および目的変数に関する時系列データを受け付ける。そして、データ分析部108によって、導入効果の判定結果が大きいと判定された場合には、データ解析システム105が解析を行う期間の候補である期間候補を作成し、期間決定部1102に送信する。
期間決定部1102は、期間候補作成部1101から目的変数に関する時系列データおよび期間候補を受け付ける。また、期間候補内の目的変数に関する時系列データの形状を基に、受け付けた期間候補が解析に適しているかどうかの判定を行う。さらに、解析に適していると判定された場合には、該当する期間候補の解析期間幅を、データ解析システム105に送信する。
解析期間幅とは、データ解析システム105が業務データ101の解析を逐次行う際に、利用する業務データの時間長のことであり、期間候補とは、解析期間幅の決定の際に仮に作成される期間の候補のことである。例えば、データ解析システム105は、目的変数に影響の大きい説明変数を抽出したり、その目的変数を上昇させるための施策を提示したりするために、特に解析期間幅内の業務データ101を解析する。
図12は、評価システム106が、所定の期間の目的変数に関する時系列データの振れ幅が振れ幅閾値より大きいと判定した場合、つまりデータ解析システムの導入効果が高いと判定した場合に、解析期間幅の決定を行う処理のフローの例を示した図である。ステップ1201の処理が期間候補作成部1101によって行われ、ステップ1202〜1204までの処理が期間決定部1102によって行われる。
ステップ1201では、期間候補作成部1101がデータ分析部108から目的変数に関する時系列データを受け付け、時系列データのうちランダムに選定した一定の期間を期間候補として作成する。その後、期間候補および目的変数に関する時系列データを期間決定部1102に送信する。
ステップ1202では、期間決定部1102が期間候補作成部1101から期間候補および目的変数に関する時系列データを受け付け、受け付けた目的変数に関する時系列データについて期間候補内に極大点及び極小点が含まれるかを判定する。極大点および極小点が含まれているかの判定は既存の方法を用いて行う。
図13は、回帰式作成部302により導入効果が大きいと判定された目的変数の時系列データの例を示した図である。この時系列データ1301は、統計値計算部301によって作成されたものである。
ここで、極大点および極小点を少なくとも1つずつ含む期間候補が、データ解析システム105による解析に適している理由について説明する。図13のt11〜t12間やt12〜t13間のように極大点および極小点が含まれていない期間においては、その期間だけの業務データを用いてデータ解析を行っても目的変数の値が大きい状態と小さい状態の区別をすることが難しい。その一方、t10〜t11間のように極大点1302および極小点1303が含まれている期間は、目的変数の大きい状態と小さい状態の区別をすることが容易であるため、データ解析に適した期間であることに発明者は想到した。すなわち、データ解析システムは、t10〜t11間の極小点付近の目的変数の小さい部分の値を極大点付近の値に上昇させるような施策を提示しやすい。そこで、t10〜t11間のように極大点1302および極小点1303が含まれている期間を解析期間幅に適していると評価することにした。このような期間の業務データを解析することにより、目的変数の増加および減少を説明する説明変数の抽出をすることがより容易になり、データ解析の質が向上する。
ステップ1202で、t11〜t12およびt12〜t13のように、期間候補内に極大点および極小点が少なくとも1つずつ含まれていないと判定された場合には、ステップ1201に戻り、期間候補の作成から処理を繰り返す。t10〜t11のように、期間候補内に極大点および極小点が少なくとも1つずつ含まれていると判定された場合には、ステップ1203に進む。
ステップ1203では、期間決定部1102はステップ1202で極大点および極小点が少なくとも1つずつ含まれると判定された期間候補を解析期間幅として決定する。
ステップ1204では、期間決定部1102により決定された解析期間幅をデータ解析システム105に送信する。
このように、本実施例に係る評価システム106は、回帰式作成部302が、振れ幅が振れ幅閾値より大きいと判定した場合に、データ解析システム105が解析を行う期間の候補である期間候補を作成する期間候補作成部1101と、期間候補の期間内の時系列データについて、極大点および極小点が少なくとも1つずつ含まれている場合には、期間候補をデータ解析システム105が解析を行う解析期間幅に決定する期間決定部1102を備えている。
係る構成により、データ解析システムの導入効果が大きいと評価した場合に、その導入効果を更に大きくするためのデータの解析期間幅を適切に決定することが可能となる。更に、データの解析期間幅を適切に決定することで、計算処理量の見積りが可能となり、コンピュータ資源等のリソースを有効に利用することが可能となる。
実施例1では、データ解析システムの導入の効果の判定をするために、導入効果を判定し、回帰式を作成する評価システムについて記載してきた。次に、実際に顧客の業務データを用いて解析を行うデータ解析システムの例を示す。
図15は、データ解析システム105の詳細構成を含む本実施例の概要を示した図である。顧客データセンタ10および外部のデータ解析システム105のそれぞれの構成およびデータ処理について説明する。
顧客データセンタ10には、業務データ101が格納されている。業務データ101は、過去データ101Aと当日データ101Bに分かれて格納される。区別して格納されていない場合には、後に説明する取得部120Aによって、業務データ101を受け付けた後に、過去データ101Aおよび当日データ101Bに区別する。また、顧客の業務システム110は、顧客側の従業員に業務の指示を与える業務指示部110Aおよび業務の指示に対しての業績結果を確認する業績管理部110Bにより構成される。これらの内容はシステム端末102より確認できる。なお、図15は本実施例の顧客データセンタ10およびデータ解析システム105のそれぞれの構成の一例であり、データ解析システム105が顧客データセンタ10内の業務システム110内に組み込まれていても構わない。このような構成とすることで、顧客の業務データのやり取りを顧客データセンタ内で完結させることが可能となる。
データ解析システム105は、案件管理部120、モデル生成部130および変数最適化部140を備えている。
案件管理部120においては、必要なデータを用いて生産性または売上等の目的変数の最適化処理を業務毎に行う。案件管理部120は、取得部120Aにより顧客データセンタ10より過去データ101Aおよびどの変数を目的変数とするかの指定を取得して、モデル生成部130に送信する。
モデル生成部130は、過去データ取得部131、複合説明変数生成部132、変数生成ロジックデータベース133、複合説明変数データベース134、統計モデリング部135およびモデルデータベース136を備えている。
モデル生成部130においては、過去データ取得部131にて、過去データ101A及び目的変数の指定を受信し、複合説明変数生成部132において受信した過去データ101Aを複合的に組み合わせ、複合説明変数に変換した後に複合説明変数データベース134に格納する。複合説明変数の生成には格納されている変数生成ロジック133が使用される。変数生成ロジック133は、予め設定されたロジックを使用することも可能であるが、業績管理部110Bにおいて管理する業績結果と連動することによりダイナミックに変更したロジックを使用することもできる。ここでは、例えば、過去データ101Aについて、データ同士を複合的に組み合わせて、目的変数に影響を与え得る新たな複合説明変数を生成する処理等が行われる。例えば、1000個から100万個を超える大量の複合説明変数を自動生成する。
複合説明変数の生成方法としては、特許文献1に記載のような、条件オペレータ、対象オペレータおよび演算オペレータの3つのオペレータのセットによる説明変数生成処理を行っても良いし、既存の他の方法で複合説明変数を生成しても良い。複合説明変数の例として、室温が15度以下であるか等のある説明変数についての条件付きの変数や、室温が15度以下であり、かつ、作業個数が100個毎分より大きい場合には、目的変数が大きい傾向があるといった場合の「室温×作業個数」を示す変数等が挙げられる。
更に、統計モデリング部135においては、複合説明変数データベース134に格納されている複合説明変数の中から、顧客の指定した売上や生産性等に関する変数(目的変数y)に影響する変数を統計的に選択し、それらの関係性をモデルとして作成し、作成したモデルをモデルデータベース136に格納する。ここでのモデルは、目的変数と複合説明変数との関係を表せるモデルであれば良く、例えば、回帰式等が挙げられる。
業務判断において考慮すべき要因が多数あると、膨大な選択肢からの判断が必要である。例えば、倉庫に100件の出荷依頼がある場合には、10の79乗個(100の階乗個)という膨大な作業順序の組合せの中から、作業効率が良い作業順序を選択する必要がある。このモデルを利用すると、これらの選択肢の優劣を判断することが可能となる。
また、データ解析システム105がウェブAPIを介して業務システム110からデータと設定情報を受信することにより、モデルを作成する構成にしても構わない。このような構成にすることで、業務ごとに複雑な個別プログラムを有したデータ解析システム105を作成する必要が無くなることで最適化問題の専門知識が無くてもデータ解析を行うことが可能となり、ソフトウェア開発の労力を抑えることが可能となる。
案件管理部120は、モデル生成部130において生成されたモデルを取得して、変数最適化部140に送信する。次に変数最適化部140における処理に関して説明する。
変数最適化部140は、当日データ取得部141、モデル取得部142、組合せ変更・複合説明変数生成部143および目的変数評価部144を備えている。
当日データ取得部141は、顧客データセンタ10から当日データ101Bを受け付ける。また、モデル取得部142は、案件管理部120からモデル136を受け付ける。顧客データセンタ10の業務データ101が過去データ101Aと当日データ101Bで分けて格納されていない場合には、案件管理部120から区別された当日データを当日データ取得部141が受け付ける。
このように取得されたモデル136および当日データ101Bは、組合せ変更・複合説明変数生成部143に送信される。
組合せ変更・複合説明変数生成部143は、業務タスクの組合せパターンを変更し、実際の当日データを入力して、組合せパターンの変更に該当する複合説明変数を計算する。ここでは、過去データを用いて作成したモデルに対して、当日のデータを入力して複合説明変数を計算しているため、当日の目的変数に対する影響を考慮したモデルの作成が出来ると同時に、業務タスクの組合せのパターンの変更に該当する複合説明変数を計算しているため、後で説明する目的変数の評価および業務タスクの組合せのパターンの変更の繰り返し処理により、目的変数が改善する組合せのパターンを抽出することが可能となる。
次に、目的変数評価部144は、業務タスクの組合せに対応する目的変数について、組合せ変更・複合説明変数生成部143にて計算された複合説明変数を用いて評価する。目的変数評価部144は、業務タスクの組合せに対応する目的変数が改善しているかどうかを判断し、目的変数の値が改善していると判断した場合には、その業務タスクの組合せを業務システム110に送信する。目的変数の値が改善していないと判断した場合には、業務タスクの組合せの変更を行わない。ここでは、業務タスクの変更を1回しか行っていないが、これを繰り返し行う処理も可能である。繰り返し処理を行う目的変数評価部144の処理の例については、145〜147に示している。ここでは、業務タスクの組合せパターンは逐次変更され、目的変数が改善されるように探索的な処理が繰り返し実施される。具体的な処理としては、組合せ変更・複合説明変数生成部143において、業務タスクの組合せが変更され、複合説明変数を計算し、目的変数が改善されたかどうかのチェックが行われ(146)、目的変数が改善されない場合には、組合せの変更を行わず前回組合せが保持される(147)。
前回組み合わせに戻す処理(147)において、目的変数が改善されていない場合にも、ある確率で組合せの変更を行うことで局所最適に陥らないようにすることも可能である。これらの繰り返し処理は、目的変数が収束するか、または繰り返しの上限回数に達するかどうか、という終了条件によって判定され(145)、終了となった場合には、その組合せを最適化の結果として、業務システムに110に送信する。終了条件としては、例えば、目的変数の改善レートが所定の改善閾値を超えた場合等が挙げられる。
図16に、以上の探索処理を行った際の、目的変数の改善レートを図示しており、探索処理開始時からどの程度目的変数が改善したかを縦軸に示してある。図16における目的変数は、例えば作業時間等の、値の小さい方が好ましい変数である。ここでは、改善閾値1601として、閾値5パーセントを設定した例を示している。この改善閾値1601を下回ることを終了条件として設定しており、図16の例では、約18000回の組合せ変更の試行により有為な目的変数の改善が行われていると判断することができる。
このように繰り返し処理を行うことで、目的変数が最適化された業務のタスクの組合せパターンを抽出することが可能となる。
図17には、上記の探索処理で改善される業務の一例として、物流倉庫においてのピッキング処理順序(カートNo)を最適化する処理を示している。ピッキング処理のカートNoを入れ替えて、その後にモデル136を用いて全体作業時間の評価をし、入れ替えを保持する又は入れ替え前の組合せに戻す処理を繰り返すことにより、作業時間が最適化されるようなピッキング処理順序を得ることができる。なお、この例においては、目的変数としての全体作業時間は、ピッキング作業エリアにおけるカートの各棚への滞在時間(説明変数)の組合せ、として表現される場合を示している。ここでの目的変数と説明変数の組合せは一例であり、売上等の目的変数や店員の滞在エリアへの滞在時間等の説明変数の組合せであっても構わない。
このように、本実施例に係るデータ解析システム105は、業務データおよび業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける取得部120Aと、業務データのうちの過去のデータを用いて、目的変数と業務データ内の複数の変数との関係性をモデルとして作成する統計モデリング部135と、モデルおよび業務データのうちの当日のデータに基づいて、業務のタスクのパターンを変更した場合の目的変数の変化を計算し、目的変数が改善した場合に、パターンの変更を維持する目的変数評価部144を備えている。
係る構成により、顧客側で実際に業務のタスクのパターンを変えて効果を判断し、試行錯誤的に最善の業務のタスクのパターンを判断することなく、自動でより目的変数に効果の大きい業務のタスクのパターンを算出することが可能となる。
なお、実施例1、実施例2で説明したように、データ解析システム105においては、過去データ101Aの中から評価システム106にて決定された必要な変数のみを扱うことができ、また、評価システム106にて決定された規定された解析期間幅を使用することができる。従って、事前に必要な計算リソースを見積もることができ、コンピュータ資源等を有効に利用することが可能となる。
10 顧客データセンタ、11 データ解析サービスセンタ
101 業務データ、102 システム端末、
105 データ解析システム、106 評価システム、107 受付部、
108 データ分析部、109 表示部、301 統計値計算部、
302 回帰式作成部、401 目的変数aの時系列データ、
501 業務データ・目的変数受付ステップ、
502 統計値計算ステップ、503〜505 効果判定ステップ、
506 回帰式作成ステップ、507 判定結果送信ステップ、
508 判定結果及び回帰式送信ステップ、
509 表示ステップ、601 目的変数指定エリア、
602 導入効果表示エリア、64 結果表示エリア、
67 回帰式表示エリア、91 数値表示エリア、
1002 属性受付ステップ、1005 削減コスト計算ステップ、
1101 期間候補作成部、1102 期間決定部、
1201 期間候補作成ステップ、
1202、1203 解析期間幅決定ステップ、
1401 POSテーブル、1402 作業テーブル、
101A 過去データ、101B 当日データ、
110A 業務指示部、110B 業績管理部、120 案件管理部、
120A 取得部、130 モデル生成部、131 過去データ取得部、
132 複合説明変数生成部、133 変数生成ロジックデータベース、
134 複合説明変数データベース、135 統計モデリング部、
136 モデルデータベース、140 変数最適化部、
141 当日データ取得部、142 モデル取得部、
143 組合せ変更・複合説明変数生成部、144 目的変数評価部、
146 目的変数改善表示、1601 改善閾値、
1801 改善値計算部

Claims (12)

  1. データ解析システムの導入効果を表示する評価システムであって、
    業務データおよび前記業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付部と、
    前記目的変数である時系列データの所定の期間における値の変動する度合いを示す振れ幅を求める統計値計算部と、
    前記振れ幅が所定の振れ幅閾値より大きい場合に、前記所定の期間内の前記目的変数、および、前記目的変数と相関のある前記業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成部と、
    前記回帰式を表示装置に表示する表示部と、を有することを特徴とする評価システム。
  2. 請求項1に記載の評価システムであって、
    前記統計値計算部は、前記時系列データについて前記所定の期間における分散値を求め、
    前記回帰式作成部は、前記分散値が所定の分散閾値より大きい場合に、前記所定の期間内の前記回帰式を作成することを特徴とする評価システム。
  3. 請求項1に記載の評価システムであって、
    前記受付部は、顧客から前記振れ幅閾値を受け付け、
    前記回帰式作成部は、前記振れ幅が前記顧客から受け付けた前記振れ幅閾値より大きい場合に前記所定の期間内の前記回帰式を作成することを特徴とする評価システム。
  4. 請求項1に記載の評価システムであって、
    前記回帰式作成部が、前記振れ幅が前記振れ幅閾値より大きいと判定した場合に、前記データ解析システムが解析を行う期間の候補である期間候補を作成する期間候補作成部と、
    前記期間候補の期間内の前記時系列データについて、極大点および極小点が少なくとも1つずつ含まれている場合には、前記期間候補を前記データ解析システムが解析を行う期間である解析期間幅に決定する期間決定部を更に有することを特徴とする評価システム。
  5. 請求項1に記載の評価システムであって、
    前記回帰式作成部は、前記振れ幅が前記所定の振れ幅閾値より大きい場合に前記導入効果が大きいと評価し、
    前記表示部は、前記導入効果を前記表示装置に表示することを特徴とする評価システム。
  6. 請求項1に記載の評価システムであって、
    前記説明変数は、前記業務データ内の変数を組合せて生成した複合説明変数であることを特徴とする評価システム。
  7. データ解析システムの導入効果を評価する評価方法であって、
    受付手段が、業務データおよび前記業務データ内の複数の変数のうちどの変数を目的変数とするかの指定を受け付ける受付ステップと、
    統計値計算手段が、前記目的変数である時系列データの所定の期間における値の変動する度合いを示す振れ幅求める統計値計算ステップと、
    回帰式作成手段が、前記振れ幅が所定の振れ幅閾値より大きい場合に、前記所定の期間内の前記目的変数、および、前記目的変数と相関のある前記業務データ内の変数である説明変数を基に回帰式を作成する回帰式作成ステップと、
    表示手段が、前記回帰式を表示装置に表示する表示ステップと、を有することを特徴とする評価方法。
  8. 請求項7に記載の評価方法であって、
    前記統計値計算ステップにおいて、前記統計値計算手段は、前記時系列データについて前記所定の期間における分散値を求め、
    前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記分散値が所定の分散閾値より大きい場合に、前記所定の期間内の前記回帰式を作成することを特徴とする評価方法。
  9. 請求項7に記載の評価方法であって、
    前記受付ステップにおいて、前記受付手段は、顧客から前記振れ幅閾値を受け付け、
    前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記振れ幅が前記顧客から受け付けた前記振れ幅閾値より大きい場合に前記所定の期間内の前記回帰式を作成することを特徴とする評価方法。
  10. 請求項7に記載の評価方法であって、
    前記回帰式作成ステップにおいて、前記回帰式作成手段が、前記振れ幅が前記振れ幅閾値より大きいと判定した場合に、前記データ解析システムが解析を行う期間の候補である期間候補を作成する期間候補作成ステップと、
    前記回帰式作成手段が、前記期間候補の期間内の前記時系列データについて、極大点および極小点が少なくとも1つずつ含まれている場合に、前記期間候補を前記データ解析システムが解析を行う期間である解析期間幅に決定する期間決定ステップを更に有することを特徴とする評価方法。
  11. 請求項7に記載の評価方法であって、
    前記回帰式作成ステップにおいて、前記回帰式作成手段は、前記振れ幅が前記所定の振れ幅閾値より大きい場合に前記導入効果が大きいと評価し、
    前記表示ステップにおいて、前記表示手段は、前記導入効果を前記表示装置に表示することを特徴とする評価方法。
  12. 請求項7に記載の評価方法であって、
    前記説明変数は、前記業務データ内の変数を組合せて生成した複合説明変数であることを特徴とする評価方法。
JP2016574300A 2015-08-28 2015-08-28 評価システム、評価方法およびデータ解析システム Expired - Fee Related JP6326510B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/074319 WO2017037768A1 (ja) 2015-08-28 2015-08-28 評価システム、評価方法およびデータ解析システム

Publications (2)

Publication Number Publication Date
JPWO2017037768A1 JPWO2017037768A1 (ja) 2017-08-31
JP6326510B2 true JP6326510B2 (ja) 2018-05-16

Family

ID=58187088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016574300A Expired - Fee Related JP6326510B2 (ja) 2015-08-28 2015-08-28 評価システム、評価方法およびデータ解析システム

Country Status (2)

Country Link
JP (1) JP6326510B2 (ja)
WO (1) WO2017037768A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6727089B2 (ja) * 2016-09-30 2020-07-22 株式会社日立製作所 マーケティング支援システム
JP6919706B2 (ja) * 2017-06-08 2021-08-18 富士通株式会社 情報処理方法、情報処理装置及び情報処理コンピュータプログラム
CN109684468B (zh) * 2018-12-13 2023-05-09 四川大学 针对循证医学的文献筛选标注系统
JP2021002766A (ja) * 2019-06-21 2021-01-07 エヌ・ティ・ティ・コミュニケーションズ株式会社 誘導先評価装置、誘導先評価方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4275359B2 (ja) * 2002-06-21 2009-06-10 富士通マイクロエレクトロニクス株式会社 データ解析方法
JP2005148806A (ja) * 2003-11-11 2005-06-09 Hitachi Ltd 株式運用支援システムおよび方法
JP5011830B2 (ja) * 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
KR101303417B1 (ko) * 2009-12-15 2013-09-05 닛본 덴끼 가부시끼가이샤 정보 처리 장치, 정보 처리 방법 및 기록 매체
JP6082564B2 (ja) * 2012-10-16 2017-02-15 株式会社日立製作所 データ統合分析システム

Also Published As

Publication number Publication date
WO2017037768A1 (ja) 2017-03-09
JPWO2017037768A1 (ja) 2017-08-31

Similar Documents

Publication Publication Date Title
Ripperda et al. Cost effects of modular product family structures: Methods and quantification of impacts to support decision making
Zur Mühlen et al. Business process analytics
JP6009864B2 (ja) 企業評価システム、企業評価方法及び企業評価プログラム
JP6326510B2 (ja) 評価システム、評価方法およびデータ解析システム
US20120123994A1 (en) Analyzing data quality
US9208209B1 (en) Techniques for monitoring transformation techniques using control charts
Mahendrawathi et al. Analysis of customer fulfilment with process mining: A case study in a telecommunication company
AU2020203862A1 (en) Artificial intelligence (ai) based predictions and recommendations for equipment
JPWO2008126182A1 (ja) 業務分析プログラムおよび業務分析装置
Siregar et al. Forecasting of raw material needed for plastic products based in income data using ARIMA method
Uzochukwu et al. Lean production: A frontier for improving performance of oil and gas companies in Nigeria
US20150347952A1 (en) Partner analytics management tool
Burnett et al. A simplified numerical decision-making methodology for physical asset management decisions
Araman et al. A case study on implementing Lean Six Sigma: DMAIC methodology in aluminum profiles extrusion process
Lisovsky Optimization business processes for transition to a sustainable development in the conditions of the fourth industrial revolution
KR101230008B1 (ko) 경영의사 결정 지원시스템
Starzyńska Practical applications of quality tools in Polish manufacturing companies
Härting et al. Cost-benefit considerations for data analytics-an SME-oriented framework enhanced by a management perspective and the process of idea generation
Zaloha et al. Analysis of the theories for assessment of the quality management product efficiency
Li et al. Multi-criteria performance management methodology for decision support in industrial project selection problems
Ayokanmbi The impact of big data analytics on decision-making
Shankararaman et al. A Framework for embedding analytics in a business process
Kastelic et al. Managing IT services: Aligning best practice with a quality method
KR102157216B1 (ko) 자산 운용 서비스 제공 장치 및 방법
Lee et al. Asset lifecycle information quality management: a six-sigma approach

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180416

R150 Certificate of patent or registration of utility model

Ref document number: 6326510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees