JP7262359B2

JP7262359B2 - データ分析装置およびデータ分析方法

Info

Publication number: JP7262359B2
Application number: JP2019181159A
Authority: JP
Inventors: 晋太郎高田; 岳士上原
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-10-01
Filing date: 2019-10-01
Publication date: 2023-04-21
Anticipated expiration: 2039-10-01
Also published as: JP2021056918A

Description

本発明は、データを分析するデータ分析装置およびデータ分析方法に関する。

近年、様々な分野においてビッグデータ解析の利用が普及している。特に、物流倉庫での商品ピッキング作業業務や、工場における組み立て作業業務など、人間が行う作業業務の効率向上のために、過去の大量の実績データをもとに、最適な商品配置や作業順序を業務改善施策として提案するサービスが注目されている。このようなサービスを実現する一つの手段として、過去の大量の実績データから、作業環境や作業内容における諸条件と作業時間の関係性を分析し、任意の作業条件での作業時間を予測可能な作業時間予測モデルを生成し、様々な作業条件の中から、最も作業時間が少なくなるような条件を、予測モデルを用いて探索する方式が挙げられる。

たとえば、特許文献１は、指定された組立作業時間予測製品に対して、実績データ格納手段に格納されている実績データの中から類似の実績データを複数選択し、その得られた実績データのうち、類似製品の部品の種類を説明変数とすると共に組立作業時間を目的変数として重回帰分析を行うことにより、組立作業時間予測モデルを作製し、作製された組立作業時間予測モデルの有効性を統計的に判定し、有効である場合に該組立作業時間モデルより組立作業時間を予測し、また有効でない場合は従来手法により組立作業時間を予測する組立作業時間予測装置を開示する。

特開平０７－１６４２６７号公報

しかしながら、物流倉庫でのピッキング作業業務や、工場での組み立て作業業務などの作業時間は、作業員本人のスキルや、作業員個人にとって得意不得意な作業条件の存在など、個人性に大きく依存する。したがって、特許文献１で生成されたモデルは、作業員の個人性を反映しておらず、作業時間の予測精度に限界がある。本発明は、作業時間の予測精度の向上を図ることを目的とする。

本願において開示される発明の一側面となるデータ分析装置およびデータ分析方法は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ分析装置であって、前記プロセッサは、複数の作業の作業ごとに、作業時間を示す目的変数と、作業環境に関する説明変数と、作業員ごとの前記作業の実施の有無を示す作業員変数と、を有する第１学習データを取得する取得処理と、前記取得処理によって取得された第１学習データに基づいて、前記作業時間を予測する第１予測モデルを生成する予測モデル生成処理と、前記予測モデル生成処理によって生成された第１予測モデルに前記第１学習データを入力することにより、前記作業時間の第１予測値と、前記作業員変数が前記作業ごとの前記第１予測値の統計量に与える影響の度合いを示す第１影響度とを、前記作業ごとに算出する算出処理と、前記作業員ごとの前記複数の作業の各々の第１影響度の分布に基づいて、前記複数の作業員の作業速度を抽象化した抽象化変数を前記作業ごとに生成し、前記作業ごとに、前記目的変数と、前記説明変数と、前記抽象化変数と、を有する第２学習データを生成する学習データ生成処理と、を実行することを特徴とする。

本発明の代表的な実施の形態によれば、作業時間の予測精度の向上を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

図１は、データ分析システムのシステム構成例を示すブロック図である。図２は、データ分析装置のハードウェア構成例を示すブロック図である。図３は、業務実績データの一例を示す説明図である。図４は、商品情報の一例を示す説明図である。図５は、図１に示した予測モデル生成処理の詳細な処理手順例を示すフローチャートである。図６は、作業員ＩＤ使用学習データの一例を示す説明図である。図７は、作業員属性使用学習データの一例を示す説明図である。図８は、中間学習データの一例を示す説明図である。図９は、第１影響度テーブルの一例を示す説明図である。図１０は、全作業における影響度分布情報を示す説明図である。図１１は、抽象化変数使用学習データの一例を示す説明図である。図１２は、第２影響度テーブルの一例を示す説明図である。図１３は、説明変数の影響度分布例を示すグラフである。図１４は、作業員特徴使用学習データの一例を示す説明図である。図１５は、予測モデル生成処理によって生成された作業員特徴使用予測モデルを用いて業務改善施策を生成する業務改善施策生成処理手順例を示すフローチャートである。図１６は、ステップＳ１５０４における各種予測モデルの使い分け処理手順例を示すフローチャートである。図１７は、作業員属性・特徴データの一例を示す説明図である。

以下、添付図面を用いて、データ分析システムについて説明する。以降の説明では、対象となる業務が物流倉庫における商品ピッキング作業であり、予測モデルの予測対象はピッキング作業に要する作業時間である場合を取り上げる。なお、本実施例は作業実績データから予測モデルを生成し、それを用いて業務改善施策を生成するサービス全般に適用可能なものであり、説明するユースケースに限定されるものではない。

＜データ分析システムのシステム構成例＞
図１は、データ分析システムのシステム構成例を示すブロック図である。データ分析システム１００は、業務システム１０１と、データ分析装置１０２と、を有する。業務システム１０１およびデータ分析装置１０２は、ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ（；ＬＡＮ）、ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ（ＷＡＮ）、インターネットのようなネットワークを介して相互に通信可能に接続される。

業務システム１０１は、一つ以上の計算機を有しており、外部から入力されるなどした業務計画の実施及び実施結果を業務実績データとして、業務実績ＤＢ１１０に蓄積する。データ分析装置１０２は、モデル生成処理１２１と、業務改善施策生成処理１２２と、を実行する。

モデル生成処理１２１は、業務システム１０１から業務内容及び業務結果等を含む業務実績データを業務実績ＤＢ１１０から取得して、予測モデルを生成する処理である。業務改善施策生成処理１２２は、あらたな業務実績データを、モデル生成処理１２１によって生成された予測モデルに与えることにより、業務評価指標の改善を実現するための業務改善施策を生成する処理である。

業務評価指標とは、ＫｅｙＰｅｒｆｏｒｍａｎｃｅＩｎｄｉｃａｔｏｒ（ＫＰＩ）等の業務を評価するための指標である。業務実績データは、業務に関連するパラメータである属性を複数含む。属性は、たとえば、タイムスタンプ、性別、金額、および作業時間のような特徴を含む。

業務システム１０１は、データ分析装置１０２から受け取った業務改善施策をもとに、次に実施される業務計画の変更を行い、再び業務の実施及び、業務実績データの蓄積を行う。データ分析システム１００は、以上で述べた業務実施と業務改善のサイクルを継続的に実行する。

＜データ分析装置１０２のハードウェア構成例＞
図２は、データ分析装置１０２のハードウェア構成例を示すブロック図である。データ分析装置１０２は、プロセッサ２０１と、記憶デバイス２０２と、入力デバイス２０３と、出力デバイス２０４と、通信インターフェース（通信ＩＦ）２０５と、を有する。プロセッサ２０１、記憶デバイス２０２、入力デバイス２０３、出力デバイス２０４、および通信ＩＦ２０５は、バス２０６により接続される。プロセッサ２０１は、データ分析装置１０２を制御する。記憶デバイス２０２は、プロセッサ２０１の作業エリアとなる。また、記憶デバイス２０２は、モデル生成処理１２１および業務改善施策生成処理１２２を実行する各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス２０２としては、たとえば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリがある。入力デバイス２０３は、データを入力する。入力デバイス２０３としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス２０４は、データを出力する。出力デバイス２０４としては、たとえば、ディスプレイ、プリンタがある。通信ＩＦ２０５は、ネットワークと接続し、データを送受信する。

記憶デバイス２０２は、具体的には、たとえば、業務実績データ２２１、商品情報２２２、作業員ＩＤ使用学習データ２２３、作業員属性使用学習データ２２４、中間学習データ２２５、第１影響度テーブル２２６、抽象化変数使用学習データ２２７、第２影響度テーブル２２８、作業員特徴使用学習データ２２９、作業員属性・特徴データ２３０、作業員ＩＤ使用予測モデル２３１、作業員属性使用予測モデル２３２、中間予測モデル２３３、抽象化変数使用予測モデル２３４、作業員特徴使用予測モデル２３５を記憶する。

業務実績データ２２１は、業務実績ＤＢ１１０から抽出されデータ分析装置１０２が受け取ったデータである。業務実績データ２２１は、モデル生成処理１２１による予測モデルの生成に用いられたり、業務改善施策生成処理１２２による業務改善施策の生成に用いられたりする。業務実績データ２２１の詳細は、図３で後述する。

商品情報２２２は、商品の属性を示す情報を記憶する。商品情報の詳細は、図４で後述する。

作業員ＩＤ使用学習データ２２３は、目的変数を作業時間、説明変数を作業員の移動距離やピッキングした物品の数量や重量、体積などとして規定される作業を示す学習データであって、説明変数としてさらに作業員ＩＤ変数が付加された学習データである。作業員ＩＤ変数とは、作業員ＩＤで特定される作業員が対象となる作業を行ったか否かを示す変数である。作業員ＩＤ使用学習データの詳細は、図６で後述する。

作業員属性使用学習データ２２４は、目的変数を作業時間、説明変数を作業員の移動距離やピッキングした物品の数量や重量、体積などとして規定される作業を示す学習データであって、説明変数としてさらに作業員属性変数が付加された学習データである。作業員属性変数とは、当該作業員の経験日数などの作業員の属性を示す変数である。作業員属性使用学習データには、作業員ＩＤ変数は含まれない。作業員属性使用学習データの詳細は、図７で後述する。

中間学習データ２２５は、抽象化変数使用学習データ２２７を生成するための中間的な学習データである。中間学習データの詳細は、図８で後述する。

第１影響度テーブル２２６は、説明変数、作業員属性変数、および作業員ＩＤ変数の各影響度を作業別に規定したテーブルである。第１影響度テーブル２２６の詳細は、図９および図１０で後述する。

抽象化変数使用学習データ２２７は、目的変数を作業時間、説明変数を作業員の移動距離やピッキングした物品の数量や重量、体積などとして規定される作業を示す学習データであって、説明変数としてさらに作業員属性変数および作業員ＩＤ抽象化変数が追加された学習データである。すなわち、作業員属性使用学習データに作業員ＩＤ抽象化変数が追加された学習データである。

作業員ＩＤ抽象化変数とは、作業員ＩＤで特定される作業員を作業員ＩＤで特定せずに「作業が遅い」や「作業が速い」のような表現で抽象化した変数である。抽象化変数使用学習データの詳細は、図１１で後述する。

第２影響度テーブル２２８は、モデル生成処理１２１によって抽象化変数使用学習データ２２７を用いて生成された予測モデルに、改善対象の業務実績データ２２１を入力した結果出力されるデータテーブルである。第２影響度テーブル２２８の詳細は、図１２および図１３で後述する。

作業員特徴使用学習データ２２９は、抽象化変数使用学習データ２２７に、作業員特徴変数が追加された学習データである。作業員特徴変数とは、たとえば、「棚上段が得意」のように作業員の特徴を示す変数である。作業員特徴使用学習データ２２９の詳細は、図１４で後述する。

作業員属性・特徴データ２３０は、各作業員の作業員ＩＤに対して、作業員属性や作業員特徴がリスト化されたデータである。作業員属性・特徴データ２３０の詳細は、図１７で後述する。

作業員ＩＤ使用予測モデル２３１は、モデル生成処理１２１によって作業員ＩＤ使用学習データ２２３（図６）を用いて生成された、作業時間を予測する予測モデルである。

作業員属性使用予測モデル２３２は、モデル生成処理１２１によって作業員属性使用学習データ２２４（図７）を用いて生成された、作業時間を予測する予測モデルである。

中間予測モデル２３３は、モデル生成処理１２１によって中間学習データ２２５（図８）を用いて生成された、作業時間を予測する中間的な予測モデルである。

抽象化変数使用予測モデル２３４は、モデル生成処理１２１によって抽象化変数使用学習データ２２７（図１１）を用いて生成された、作業時間を予測する予測モデルである。

作業員特徴使用予測モデル２３５は、モデル生成処理１２１によって作業員特徴使用学習データ２２９を用いて生成された、作業時間を予測する予測モデルである。

＜業務実績データ２２１＞
図３は、業務実績データ２２１の一例を示す説明図である。業務実績データ２２１は、作業ＩＤ３０１と、枝番３０２と、作業員ＩＤ３０３と、商品コード３０４と、場所コード３０５と、個数３０６と、作業開始時刻３０７と、作業終了時刻３０８と、を有する。作業員ＩＤ３０３、商品コード３０４、場所コード３０５、および個数３０６は、商品の配置、取り扱う商品、作業員の構成といった作業環境を示す。

作業ＩＤ３０１は、作業を一意に特定する識別情報であり、作業員がピッキングを行う作業業務の１単位を示す。たとえば、同一の発送先の商品が対象となる一連のピッキング作業が該当する。

枝番３０２は、作業ＩＤ３０１で特定される作業を作業員ＩＤ別または商品コード別に細分化した番号である。以下、作業ＩＤ３０１をｘ（ｘは数字）またはｘ－ｙ（ｙは枝番３０２の数字）で表記する。作業ＩＤ３０１をｘのみで表記した場合は、その作業ＩＤ３０１の全枝番３０２を含むエントリが対象となり、作業ＩＤ３０１をｘ－ｙで表記した場合は、その作業ＩＤ３０１：ｘの枝番３０２：ｙのエントリが対象となる。

作業員ＩＤ３０３は、作業員を一意に特定する識別情報である。商品コード３０４は、作業員ＩＤ３０３で特定される作業員がピッキングした商品を一意に特定する識別情報である。場所コード３０５は、商品コード３０４で特定される商品が収納されている場所を示す識別情報である。場所コード３０５は、たとえば、ａ列－ｂ連－ｃ段（ａ、ｂ、ｃは文字列）で表記され、ａ列の棚のｂ連（奥行き）のｃ段（上、中、下などの棚の高さ）を意味する。

個数３０６は、商品コード３０４で特定される商品をピッキングした数である。作業開始時刻３０７は、作業ＩＤ３０１：ｘ－ｙで特定される作業を開始した日付時刻である。作業終了時刻３０８は、作業ＩＤ３０１：ｘ－ｙで特定される作業を終了した日付時刻である。

＜商品情報＞
図４は、商品情報の一例を示す説明図である。商品情報２２２は、商品コード３０４と、１個当たりの重量４０１と、１個当たりの体積４０２と、を有する。１個当たりの重量４０１は、商品コード３０４で特定される商品１個当たりの重さである。１個当たりの体積４０２は、商品コード３０４で特定される商品１個当たりの体積である。

＜モデル生成処理１２１＞
図５は、図１に示したモデル生成処理１２１の詳細な処理手順例を示すフローチャートである。モデル生成処理１２１とは、業務実績データ２２１から学習データを加工、生成し、作業時間を予測する予測モデルを生成する処理である。

データ分析装置１０２は、モデル生成処理１２１を起動し（ステップＳ５０１）、記憶デバイス２０２から予測モデルを生成する際の学習データの対象期間分の業務実績データ２２１を取得する（ステップＳ５０２）。つぎに、データ分析装置１０２は、業務実績データ２２１を加工して、作業員ＩＤ使用学習データ２２３を生成する（ステップＳ５０３）。これにより、業務実績データ２２１は、作業員ＩＤ使用学習データ２２３に変換される。作業員ＩＤ使用学習データ２２３の一例を図６に示す。

［作業員ＩＤ使用学習データ２２３］
図６は、作業員ＩＤ使用学習データ２２３の一例を示す説明図である。作業員ＩＤ使用学習データ２２３は、作業ＩＤ３０１と、目的変数６０１と、説明変数６０２と、作業員ＩＤ変数６０３と、を有する。目的変数６０１は、予測対象の値であり、本例では作業時間に該当する。作業時間は、同一の作業ＩＤ３０１のエントリの作業終了時刻３０８から作業開始時刻３０７を引いた時間である。枝番３０２により作業ＩＤ３０１に複数のエントリが存在する場合、各エントリの作業時間の総和が作業時間６０１となる。

説明変数６０２は、業務実績データ２２１における各種の値を集計して生成された変数の集合であり、当該作業ＩＤ３０１のエントリの特徴量を示す。具体的には、たとえば、説明変数６０２は、移動距離６２１と、数量６２２と、重量６２３と、体積６２４と、棚上段６２５と、棚中段６２６と、棚下段６２７と、を有する。移動距離６２１は、作業ＩＤ３０１で特定される作業をした作業員が当該作業において移動した距離である。データ分析装置１０２は、場所コード３０５に示した位置情報を含む倉庫内の地図情報を有しており、ピッキングした場所間の道なり距離を算出可能である。

数量６２２は、作業ＩＤ３０１で特定される作業でピッキングされた商品の数または量である。重量６２３は、作業ＩＤ３０１で特定される作業でピッキングされた商品の数量６２２分の重さである。体積６２４は、作業ＩＤ３０１で特定される作業でピッキングされた商品の数量６２２分の大きさである。棚上段６２５は、棚の上段からピッキングした商品の数量である。棚中段６２６は、棚の中段からピッキングした商品の数量である。棚下段６２７は、棚の下段からピッキングした商品の数量である。作業ＩＤ３０１のエントリにおいて、棚上段６２５～棚下段６２７の値の合計が、数量６２２となる。

なお、データ分析装置１０２は、図示しない在庫管理システムと通信可能であり、在庫管理システムは、商品の１個当たりの重量や体積、収納されている場所コード３０５を管理している。したがって、データ分析装置１０２は、在庫管理システムにアクセスすることで、商品ごとに数量６２２～棚下段６２７を取得可能である。

作業員ＩＤ変数６０３は、その作業ＩＤ３０１で特定される作業を、作業員ＩＤ３０３（図６のＩＤ１、ＩＤ２、…）で特定される作業員のうちどの作業員がおこなったかを示す変数である。「ＩＤ＃」（＃は数字）は、作業員ＩＤ３０３を示す。たとえば、作業員ＩＤ変数６０３が「１」であれば、その作業ＩＤ３０１で特定される作業を、その作業員ＩＤ３０３で特定される作業員が行ったことを示す。作業員ＩＤ変数６０３が「０」であれば、その作業ＩＤ３０１で特定される作業を、その作業員ＩＤ３０３で特定される作業員が行っていないことを示す。ここで、図６の説明を終了する。

図５に戻り、データ分析装置１０２は、作業員ＩＤ使用学習データ２２３を用いて、作業員ＩＤ使用予測モデル２３１を生成する（ステップＳ５０４）。この処理は、作業員ＩＤ使用予測モデル２３１を、目的変数６０１である作業時間を予測する回帰モデルとして機械学習によって生成する処理であり、機械学習アルゴリズムの手法自体は問わない。

この機械学習アルゴリズムの手法は、たとえば、説明変数６０２と作業員ＩＤ変数６０３に適当な係数を掛け合わせそれらの総和を予測値とし、学習データの目的変数６０１と予測値との二乗誤差が最小になるような各係数を求める線形回帰式を生成する手法でもよい。また、機械学習アルゴリズムの手法は、ＤＮＮ（ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）などによる非線形な表現によって予測モデルを生成するような手法でもよい。このように、作業員ＩＤ使用予測モデル２３１を生成することで、学習データに十分な作業実績のサンプルを持つ作業員の作業について、様々な説明変数６０２の値に対応した作業時間の予測値の高精度化を図ることができる。

つぎに、データ分析装置１０２は、業務実績データ２２１を加工して、作業員属性使用学習データ２２４を生成する（ステップＳ５０５）。図７に作業員属性使用学習データ２２４の一例を示す。

［作業員属性使用学習データ２２４］
図７は、作業員属性使用学習データ２２４の一例を示す説明図である。作業員属性使用学習データ２２４は、作業員属性変数７００を使用した学習データである。具体的には、たとえば、作業員属性使用学習データ２２４は、作業ＩＤ３０１と、目的変数６０１と、説明変数６０２と、作業員属性変数７００と、を有する。作業員属性変数７００とは、作業員の属性を示す変数である。

作業員属性変数７００は、業務実績データ２２１に格納されている情報を作業員属性変数７００として利用してもよく、新たに作成された変数でもよい。前者の場合、作業員の年齢や性別、身長、作業員のレベルが例として挙げられる。後者については、図７にあるような経験日数７０１や付近の作業員の経験日数７０２が例として挙げられる。

経験日数７０１は、作業員が分析対象の業務に携わってからどれくらいの日数が経過しているかを示す作業員属性変数７００であり、たとえば過去の全期間に渡る業務実績データ２２１から、対象のエントリの作業員ＩＤ３０３が存在する最も古い作業日時を基点日時とし、基点から該当するエントリの作業日時までの日数を計算することで得られる。

また、作業員ＩＤ３０３それぞれに経験日数７０１の初期値を外部から与えられるようにし、その初期値を基点日時にして対象のエントリでの経験日数を計算するようにしてもよい。これによって、業務実績データ２２１を収集する以前から業務に携わっているような作業員の経験日数７０１を正確に反映することができる。

経験日数７０１は日数に限らず、分単位、時間単位、月単位で表現してもよい。さらに、変数の型は連続値に限らず、分類値（たとえば、経験１ヶ月未満、経験６ヶ月以上、など）を用いてもよい。これによって、より業務の特性に特化した経験値を反映した変数とすることができる。

付近の作業員の経験日数７０２は、該当するエントリの作業を実施する際に、近く（たとえば、半径１０メートル以内などの所定範囲）に存在する作業員の経験日数７０１を反映した作業員属性変数７００である。具体的には、たとえば、データ分析装置１０２は、業務実績データ２２１の場所コード３０５、作業開始時刻３０７および作業終了時刻３０８を参照し、ピッキング対象の商品が近い場所に存在し作業時間帯が重なっている別の作業を担当する作業員の経験日数７０１を算出する。この算出結果が、付近の作業員の経験日数７０２となる。

当該別の作業員が複数存在する場合は、データ分析装置１０２は、各別の作業員の経験日数７０１の平均値、中央値、最大値、最小値といった統計値を算出することにより、付近の作業員の経験日数７０２に設定する。特に、最小値が選択された場合、付近に新人の作業員が存在し、業務の支援をするような状況を反映できると考えられる。ここで、図６の説明を終了する。

図５に戻り、データ分析装置１０２は、作業員属性使用学習データ２２４を用いて、作業員属性使用予測モデル２３２を生成する（ステップＳ５０６）。この処理は、ステップＳ５０４の作業員ＩＤ使用予測モデル２３１と同様、作業員属性使用予測モデル２３２を、目的変数６０１である作業時間を予測する回帰モデルとして機械学習によって生成する処理であり、機械学習アルゴリズムの手法は、ステップＳ５０４と同様の手法となる。

このように、作業員属性使用予測モデル２３２を生成することで、作業員ＩＤ３０３ではなく、作業員が持つ作業員属性を説明変数とした普遍的な予測モデルを得ることができる。これによって、学習データ内に実績が存在しない作業員の作業を予測するような場合において、その作業員の属性情報を説明変数として与えることで、精度良く作業時間を予測することができる。なお、作業員属性使用予測モデル２３２は、後述する図１６で使用される。

つぎに、データ分析装置１０２は、中間学習データ２２５を生成する（ステップＳ５０７）。図８に中間学習データ２２５の一例を示す。

［中間学習データ２２５］
図８は、中間学習データ２２５の一例を示す説明図である。中間学習データ２２５は、図７の作業員属性使用学習データ２２４に、図６の作業員ＩＤ変数６０３が追加された学習データである。まず、図８に示すように、データ分析装置１０２は、中間学習データ２２５を生成する。ここで、図８の説明を終了する。

図５に戻り、データ分析装置１０２は、中間学習データ２２５を用いて、中間予測モデル２３３を生成する（ステップＳ５０８）。この処理は、ステップＳ５０４の作業員ＩＤ使用予測モデル２３１と同様、中間予測モデル２３３を、目的変数６０１である作業時間を予測する回帰モデルとして機械学習によって生成する処理であり、機械学習アルゴリズムの手法は、ステップＳ５０４と同様の手法となる。

つぎに、データ分析装置１０２は、中間予測モデル２３３を用いて、中間学習データ２２５の全作業に対して、各々の作業が入力である場合の予測結果に対する各変数の影響度（第１影響度）を算出する（ステップＳ５０９）。具体的には、たとえば、データ分析装置１０２は、第１影響度テーブル２２６を作成する。図９に第１影響度テーブル２２６の一例を示す。

［第１影響度テーブル２２６］
図９は、第１影響度テーブル２２６の一例を示す説明図である。第１影響度テーブル２２６は、全作業において、中間学習データ２２５で生成された予測モデルを用いて算出された予測値に対する各変数の影響度（第１影響度）をテーブルの形式で例示した情報である。具体的には、たとえば、第１影響度テーブル２２６は、作業ＩＤ３０１と、目的変数６０１と、説明変数６０２の影響度９０１と、作業員属性変数７００の影響度９０２と、作業員ＩＤ変数６０３の影響度９０３と、予測値９０４と、を有する。

予測値９０４は、作業ＩＤ３０１ごとに、図８の説明変数６０２、作業員属性変数７００、および作業員ＩＤ変数６０３を、中間学習データ２２５で生成された予測モデルに入力した場合の出力結果（作業時間）である。

説明変数６０２の影響度９０１、作業員属性変数７００の影響度９０２、および作業員ＩＤ変数６０３の影響度９０３は、算出された予測値９０４が、全作業の予測値９０４の平均値に対してどのような影響を各変数から受けて決定されているかを示した情報である。具体的には、たとえば、説明変数６０２の影響度９０１は、説明変数６０２の項目（移動距離６２１、数量６２２、重量６２３、体積６２４、棚上段６２５、棚中段６２６、棚下段６２７、…）ごとに影響度を有する。

作業員属性変数７００の影響度９０２は、作業員属性変数７００の項目（経験日数７０１、付近の作業員の経験日数７０２、…）ごとに影響度を有する。作業員ＩＤ変数６０３の影響度９０３は、作業員ＩＤ変数６０３の項目（ＩＤ１、ＩＤ２、…）ごとに影響度を有する。影響度の値は、大きいほどその作業に影響を与えていることを示す。

たとえば、作業ＩＤ３０１が「１」のエントリの場合、作業員ＩＤ変数６０３の「ＩＤ１」という変数の影響度は、「＋５５」である。これは、すべての予測値９０４の平均値である「３００」に対して「＋５５」の影響を与え、同様にその他の変数の影響度が加算されて最終的に予測値９０４である「４３２」が決定された、ということを意味する。これによって、学習データの各作業それぞれで、各種変数の値が予測値９０４にどのような影響を与えているかが定量的に分かるようになる。

このような影響度を算出する方法としては、たとえば公知の技術として、ＳＨＡＰ（ＳＨａｐｌｅｙＡｄｄｉｔｉｖｅｅｘＰｌａｎａｔｉｏｎｓ）や、ＬＩＭＥ（ＬｏｃａｌＩｎｔｅｒｐｒｅｔａｂｌｅＭｏｄｅｌ－ａｇｎｏｓｔｉｃＥｘｐｌａｉｎａｔｉｏｎｓ）のような手法がある。

これにより、データ分析装置１０２は、任意の予測モデルが出力した予測値９０４について、該当する作業が持つ各変数が予測値９０４にどれくらい影響を与えたかを、定量的な値で得ることができる。ここで、図９の説明を終了する。

つぎに、データ分析装置１０２は、抽象化変数使用学習データ２２７を生成する（ステップＳ５１０）。具体的には、たとえば、データ分析装置１０２は、第１影響度テーブル２２６を用いて、作業員ＩＤ変数６０３を作業員属性変数７００に加工する。図１０を用いて具体的に説明する。

［影響度分布情報］
図１０は、全作業における影響度分布情報を示す説明図である。影響度分布情報１０００は、作業員ＩＤ変数名１００１と影響度分布１００２とを対応付けた情報である。データ分析装置１０２は、作業員ＩＤ３０３ごとに、当該作業員の作業員ＩＤ変数６０３とその影響度を用いて、全作業（作業ＩＤ３０１：１，２，…）における影響度の分布を求める。

すなわち、作業員ＩＤ変数名１００１のある値（作業員ＩＤ３０３）の影響度分布１００２は、図９に示した第１影響度テーブル２２６の作業員ＩＤ変数６０３の影響度９０３における当該作業員ＩＤ変数６０３の影響度９０３の列である。たとえば、当該作業員ＩＤ３０３が「ＩＤ１」であれば、影響度分布１００２は、作業ＩＤ３０１の昇順に「＋５５，０，０，…」の影響度分布１００２となり、当該作業員ＩＤ３０３が「ＩＤ２」であれば、影響度分布１００２は、作業ＩＤ３０１の昇順に「０，－６１，０，…」の影響度分布１００２となる。

図１０では、影響度分布１００２において図８の作業員ＩＤ変数６０３が「０」の作業（不実施作業）における当該作業員ＩＤ変数６０３の影響度９０３が黒丸●、作業員ＩＤ変数６０３が「１」の作業（実施作業）における当該作業員ＩＤ変数６０３の影響度９０３が白丸○で表記される。

たとえば、図８の中間学習データ２２５の作業員ＩＤ変数６０３において「ＩＤ１」の列は、作業ＩＤ３０１の昇順に「１，０，０，…」である。したがって、作業員ＩＤ３０３が「１」の影響度分布１００２において、作業ＩＤ３０１が「１」の影響度「＋５８」に対応する作業員ＩＤ変数６０３の値は「１」であるため、作業ＩＤ３０１が「１」の影響度「＋５８」は白丸○として表記される。

また、作業ＩＤ３０１が「２」の影響度「０」に対応する作業員ＩＤ変数６０３の値は「０」であるため、作業ＩＤ３０１が「２」の影響度「０」は黒丸●として表記される。同様に、作業ＩＤ３０１が「３」の影響度「０」に対応する作業員ＩＤ変数６０３の値は「０」であるため、作業ＩＤ３０１が「３」の影響度「０」は黒丸●として表記される。

このように、作業員ＩＤ変数名１００１ごとに影響度分布１００２を求めることにより、作業員ＩＤ変数６０３の影響度９０３がプラスに大きい作業員ＩＤ３０３と、マイナスに大きい作業員ＩＤ３０３、値が「０」の場合とほとんど差異がない作業員ＩＤ３０３と、を区別することが可能となる。

たとえば、作業員ＩＤ３０３が「１」の作業員は、作業員ＩＤ変数６０３が「１」であるエントリの作業（たとえば、作業ＩＤ３０１が「１」）に参加すると、プラスに大きい影響を与えている、すなわち、作業時間が増加することが分かる。つまり、この作業員ＩＤ変数６０３以外の変数を使用しないと予測精度の低下を招き、作業員特有の影響を考慮、すなわち、作業員ＩＤ変数６０３を使用すると、機械学習によってより予測精度が高い予測モデルが学習されたものとみなせる。したがって、この作業員ＩＤ３０３が「１」の作業員が作業することは作業時間を長くする影響が発生していると解釈できる。

同様に作業員ＩＤ３０３が「２」の作業員は、マイナスに大きな影響を与える作業員で、作業員ＩＤ３０３が「４５」の作業員は、特にこの作業員が作業することで特別な影響を与えていない作業員である、ということが分かる。具体的な判別方法としては、データ分析装置１０２は、作業員ＩＤ変数６０３が「０」（黒丸●）の場合の作業群が持つ影響度の平均値（以下、第１平均値）および分散と、作業員ＩＤ変数６０３が「１」（白丸○）の作業群が持つ影響度の平均値（以下、第２平均値）を求める。

データ分析装置１０２は、第１平均値と第２平均値との差分が分散の定数倍以上であるような場合に、プラスまたはマイナスに大きな影響を与えていると判断を行う。以上のような処理を行うことで、目的変数６０１（作業時間）の予測値９０４にプラスに影響を与える作業員、マイナスに影響を与える作業員、影響を与えない作業員の３種類に分類することが可能となる。

そして、データ分析装置１０２は、本処理結果に基づいて、抽象化変数使用学習データ２２７を生成する。図１１に抽象化変数使用学習データ２２７の一例を示す。

［抽象化変数使用学習データ２２７］
図１１は、抽象化変数使用学習データ２２７の一例を示す説明図である。抽象化変数使用学習データ２２７は、作業ＩＤ３０１と、目的変数６０１と、説明変数６０２と、作業員属性変数７００と、作業員ＩＤ抽象化変数１１０１と、を有する。すなわち、抽象化変数使用学習データ２２７は、図７に示した作業員属性使用学習データ２２４に、作業員ＩＤ抽象化変数１１０１が追加された学習データである。

作業員ＩＤ抽象化変数１１０１とは、作業員ＩＤ３０３を抽象化した変数である。具体的には、たとえば、作業員ＩＤ抽象化変数１１０１は、「作業が遅い」および「作業が速い」という変数を有する。データ分析装置１０２は、作業員ＩＤ抽象化変数１１０１の値を、上述した影響を与えているか否かの判断結果に基づいて決定する。

たとえば、「作業が遅い」の値が「１」であれば、その作業ＩＤ３０１の作業は、作業が遅い作業員によりおこなわれたことを意味し、「作業が速い」の値が「１」であれば、その作業ＩＤ３０１の作業は、作業が速い作業員によりおこなわれたことを意味する。「作業が遅い」および「作業が速い」の値がともに「０」であれば、その作業ＩＤ３０１の作業は、平均的な速さの作業員により行われたことを意味する。このように、「作業が遅い」および「作業が速い」の値の組み合わせにより、作業員をその作業能力で抽象化することができる。ここで、図１１の説明を終了する。

図５に戻り、データ分析装置１０２は、抽象化変数使用学習データ２２７を用いて抽象化変数使用予測モデル２３４を生成する（ステップＳ５１１）。この処理は、ステップＳ５０４の作業員ＩＤ使用予測モデル２３１と同様、抽象化変数使用予測モデル２３４を、目的変数６０１である作業時間を予測する回帰モデルとして機械学習によって生成する処理であり、機械学習アルゴリズムの手法は、ステップＳ５０４と同様の手法となる。

このように、作業員ＩＤ変数６０３の代わりに、作業員ＩＤ抽象化変数１１０１を新たな説明変数として抽象化変数使用予測モデル２３４に適用することにより、より高精度な予測を実現することができる。特に、予測対象の作業員の実績が業務実績データ２２１に存在しないような場合において、当作業員が新人として新たに加入した作業員である場合に、作業員ＩＤ抽象化変数１１０１である「作業が遅い」の値を「１」とすることで、不慣れな新人が作業を行うことによる影響を考慮した予測を行うことができる。

つぎに、データ分析装置１０２は、抽象化変数使用予測モデル２３４に対する作業別変数の影響度（第２影響度）を算出する（ステップＳ５１２）。

［第２影響度テーブル２２８］
図１２は、第２影響度テーブル２２８の一例を示す説明図である。第２影響度テーブル２２８は、ステップＳ５１２で算出された第２影響度を記憶するテーブルである。第２影響度テーブル２２８は、具体的には、たとえば、第２影響度テーブル２２８は、第１影響度テーブル２２６と同様、作業ＩＤ３０１と、目的変数６０１と、説明変数６０２の影響度９０１と、作業員属性変数７００の影響度９０２と、予測値９０４と、を有し、また、あらたに、作業員ＩＤ抽象化変数１１０１の影響度１２０１を有する。各影響度の算出は、第１影響度テーブル２２６と同様であるため、説明を省略する。ここで、図１２の説明を終了する。

図５に戻り、データ分析装置１０２は、第２影響度テーブル２２８を用いて、作業員特徴変数を生成する（ステップＳ５１３）。作業員特徴変数とは、作業員の各々が持つ平均的ではない特異な特徴を表す変数である。同様の傾向を示す作業員の業務実績データ２２１が複数ある場合には、作業員特徴変数は特徴的だが共通的に存在する個人性を表す変数である、と言える。ここで、図１３を用いて具体的な作業員特徴を発見する方法について説明する。

［説明変数６０２の影響度分布］
図１３は、説明変数６０２の影響度分布例を示すグラフである。図１３の影響度分布１３００では、説明変数６０２、作業員属性変数７００、および作業員ＩＤ抽象化変数１１０１のうち、説明変数６０２の棚上段６２５の値を例に挙げて説明するが、他の変数についても同様に実行される。

図１３において、影響度分布１３００の横軸は、変数の値（本例では、棚上段６２５の値）であり、縦軸は、影響度（本例では、図１２の第２影響度テーブル２２８の説明変数６０２の影響度９０１の棚上段６２５の値）である。

データ分析装置１０２は、「棚上段６２５」を選択する。「棚上段６２５」は、該当する作業ＩＤ３０１の作業において、棚の上段に何個の商品が配置されているかを示す変数である。業務に関する事前知識として、該当する変数の値が増加するまたは減少することが作業時間にどのように影響を与えるかは、あらかじめ定義される。たとえば、棚上段６２５の商品の個数３０６が多いほど、作業が遅くなる傾向があると定義される。このような傾向の指定方法は、たとえば、該当する変数は目的変数６０１にプラスの相関があるといった条件を指定することで設定可能である。

データ分析装置１０２は、このように指定された条件を前提とし、図１３の影響度分布１００２を分析する。たとえば、影響度分布１３００によれば、棚上段６２５の値が「５」の場合の影響度は、作業によってバラつきを持つことが分かる。このバラつきの中には、棚上段６２５の値が大きいほど影響度もプラスに大きくなるという条件に反して、あまり影響度が大きくない作業が存在していることが分かる（図１３中における点線の丸）。

このことは、つまり、作業対象の商品が棚上段６２５にあっても作業時間に影響がなかった業務実績の作業であると言え、たとえば、実施した作業員の背が高い場合などの推察が可能となる。このように、データ分析装置１０２は、与えられた事前知識に反した影響度の傾向を持つ作業群を、類似の特徴を持つ（この場合、棚上段６２５での作業が得意な）グループとみなし、作業員特徴変数を、作業員個人の特徴を表す新たな変数として生成する。ここで、図１３の説明を終了する。

図５に戻り、データ分析装置１０２は、作業員特徴変数を用いて、作業員特徴使用学習データ２２９を生成する（ステップＳ５１４）。作業員特徴使用学習データ２２９の一例を図１４に示す。

［作業員特徴使用学習データ２２９］
図１４は、作業員特徴使用学習データ２２９の一例を示す説明図である。抽象化変数使用学習データ２２７に、作業員特徴変数１４０１が説明変数として追加された学習データである。作業員特徴変数１４０１の一例である「棚上段が得意」の値が「１」であれば、その作業は、「棚上段が得意」な作業員により実施されたことを示し、「０」であれば、「棚上段が得意」な作業員により実施されなかったことを示す。

また、作業員特徴変数１４０１の型は、連続値でもよい。連続値の場合、データ分析装置１０２は、一定または特定の幅毎に影響度の分布を算出し、同様に作業員特徴を発見する。たとえば、「年齢」という説明変数６０２が選択された場合、データ分析装置１０２は、０～２０歳、２１歳～４０歳、４１歳～５０歳、５１歳～６０歳、６１歳以上、などの幅で影響度の値をまとめ、影響度分布１００２を生成する。どの変数に対して、どのような分析幅で上記分析を行うかはあらかじめユーザなどによって定義可能とする。ここで、図１４の説明を終了する。

図５に戻り、データ分析装置１０２は、作業員特徴使用学習データ２２９を用いて、作業員特徴使用予測モデル２３５を生成する（ステップＳ５１５）。このように、作業員特徴使用予測モデル２３５を生成することで、新たな説明変数として作業員特徴変数１４０１を追加することができ、より高精度な予測を行うことが可能となる。特に、業務実績データ２２１には実績が存在しない作業員ではあるが、あらかじめその個人的特徴（たとえば、背が高く高い棚での作業を苦にしない）を作業員特徴変数１４０１の値として設定することにより、より高精度な予測が可能となる。

以上で、作業時間を予測する各種予測モデルを生成する処理を完了する（ステップＳ５１６）。なお、データ分析装置１０２は、作業員特徴を分析する際に、業務実績データ２２１における作業時間の実績値と予測値９０４との差異が大きい作業に関しては、分析対象の業務実績データ２２１から除外するようにしてもよい。

たとえば、全作業における差異の平均値を基準にして、分散値の定数倍以上の作業が除外対象となる。これにより、事前知識とは異なる傾向を示す作業の発生要因が、個人的特徴によるものではなく、業務実勢データ取得時の異常値であるような場合における分析への悪影響を排除することができる。

また、一つの作業に対して、事前知識とは異なる傾向示す変数が２つ以上発見された場合は、それらを組み合わせた作業員特徴変数１４０１として生成するようにしてもよい。たとえば、棚上段６２５での作業が得意で、かつ、１個当たりの重量６２３がしきい値以上の商品のピッキングが速い（事前知識として重量６２３の変数が大きいと作業が遅くなる条件のもと、それに反するような影響度の値を示した作業）ような作業員の作業が所定数以上あった場合、データ分析装置１０２は、新たな作業員特徴変数１４０１として「棚上段が得意＆重い荷物が得意」を生成する。これにより、データ分析装置１０２は、複数の条件が組み合わさった作業員の個人的特徴をより詳細に表す作業員特徴変数１４０１を生成することができる。

＜業務改善施策生成処理１２２＞
図１５は、モデル生成処理１２１によって生成された作業員特徴使用予測モデル２３５を用いて業務改善施策を生成する業務改善施策生成処理手順例を示すフローチャートである。データ分析装置１０２は、まず業務改善施策生成処理１２２を起動し（ステップＳ１５０１）、改善対象となる業務実績データ２２１を記憶デバイス２０２から取得する（ステップＳ１５０２）。改善対象となる業務実績データ２２１は、業務を改善したい対象となる期間における業務実績データ２２１であり、たとえば業務改善施策生成処理１２２を実行する次の日以降の業務を改善したい場合は、直近過去１週間の業務実績データ２２１などが対象となる。

直近過去１週間の作業環境（たとえば、商品の配置、取り扱う商品、作業員の構成）は以後の作業環境と等しいと仮定する。直近過去１週間の期間の業務を改善する施策は、今後の業務も改善が見込める施策であるという考えに基づく。

たとえば、データ分析装置１０２は、業務改善施策生成処理１２２を１週間おきに繰り返すことで、継続的に業務を改善し続けることができる。改善対象となる作業環境は、たとえば、商品の配置であるが、商品の配置、取り扱う商品、作業員の構成のうち少なくとも１つを改善対象としてもよい。

データ分析装置１０２は、改善対象となる業務実績データ２２１に対して、商品の配置場所の変更処理を実行する（ステップＳ１５０３）。具体的には、たとえば、データ分析装置１０２は、改善対象となる業務実績データ２２１の商品の場所コード３０５を変更する。場所コード３０５の入替え方法については、特に限定することはなく、データ分析装置１０２がランダムに実行してもよいし、遺伝的アルゴリズムなどの組合せ最適化問題に適した各種アルゴリズムで実行してもよい。

データ分析装置１０２は、当該変更後の改善対象となる業務実績データ２２１に応じて、作業員ＩＤ使用学習データ２２３の説明変数６０２を再計算する。たとえば、場所コード３０５が変更されたため、データ分析装置１０２は、棚上段６２５、棚中段６２６、棚下段６２７の値も変更する。また、データ分析装置１０２は、移動距離６２１を変更後の場所コード３０５に基づいて再計算する。なお、再計算対象は、場所コード３０５の変更によって変更が必要な説明変数６０２であれば、棚上段６２５、棚中段６２６、棚下段６２７および移動距離６２１に限られない。

また、場所コード３０５が変更されたため、付近の作業員も異なってくる。したがって、データ分析装置１０２は、作業員属性使用学習データ２２４の作業員属性変数７００である付近の作業員の経験日数７０２を、変更度の場所コード３０５に応じて再計算する。なお、再計算対象は、場所コード３０５の変更によって変更が必要な作業員属性変数７００であれば、付近の作業員の経験日数７０２に限られない。

データ分析装置１０２は、適用する予測モデルを３種類の予測モデルから選択し、選択した予測モデルに、ステップＳ１５０３で得られた再計算後の作業員ＩＤ使用学習データ２２３を入力することにより、作業時間の予測値９０４を得る（ステップＳ１５０４）。３種類の予測モデルの使い分けについては図１６で後述する。

データ分析装置１０２は、それぞれの作業で得られた作業時間の予測値９０４に対して、総和をとり、１週間での総合計作業時間を計算する（ステップＳ１５０５）。データ分析装置１０２は、得られた総合計作業時間が予め定められた終了条件に一致するか否か判定する（ステップＳ１５０６）。

ここで、予め定められた終了条件とは、業務実績データ２２１における作業時間と比較して改善がなされたか否かや、ステップＳ１５０３の実行回数、商品変更配置の変更による改善度合い、などの条件が適用される。終了条件に満たない場合（ステップＳ１５０６：Ｎｏ）、再度ステップＳ１５０３の処理に戻る。

終了条件を満たした場合（ステップＳ１５０６：Ｙｅｓ）、データ分析装置１０２は、改善施策を決定する（ステップＳ１５０７）。改善施策とは、たとえば、改善対象となる業務実績データ２２１が得られる作業環境である。場所コードの変更により改善対象となる業務実績データ２２１が得られた場合には、改善施策となる作業環境は、場所コードの変更後の商品の配置状態である。

取り扱う商品の商品コードの変更により改善対象となる業務実績データ２２１が得られた場合には、改善施策となる作業環境は、商品コードの変更後の商品の配置状態である。作業員の構成変更により改善対象となる業務実績データ２２１が得られた場合には、改善施策となる作業環境は、作業員の構成変更後の作業員配置である。

そして、データ分析装置１０２は、決定した改善施策を出力する（ステップＳ１５０８）。具体的には、たとえば、データ分析装置１０２は、決定した改善施策をディスプレイに表示したり、業務システム１０１などの他のコンピュータに送信したりする。そして、本処理を終了する（ステップＳ１５０８）。

なお、本説明では直近過去１週間の業務を改善対象としたが、この期間に限定するものではない。また、改善対象の業務をこれから行う予定の作業内容とし、データ分析時点での作業環境を改善するようなユースケースにも適用可能である。この場合、実施予定の作業内容を行うにあたって、最も作業時間が短くなるような作業環境の条件（ピッキング対象の品物の配置、など）を図１５で求めることで実現できる。これによって、作業実施予定の内容に即して、作業環境をその都度改善していくことが可能となり、より高い改善効果を期待できる。

＜予測モデルの使い分け処理＞
ここで、上述したステップＳ１５０４における予測モデルの使い分け処理について説明する。

［予測モデルの使い分け処理］
図１６は、ステップＳ１５０４における各種予測モデルの使い分け処理手順例を示すフローチャートである。データ分析装置１０２は、あらかじめ保有する過去の業務実績データ２２１をもとに、当該業務実績データ２２１に存在する全作業員の作業員ＩＤ３０３に対応した作業員属性および作業員特徴について管理する作業員属性・特徴データ２３０の作成または更新を実行する（ステップＳ１６０１）。ステップＳ１６０１は、たとえば、１週間毎などの決まったタイミングで定期的に実行される。ここで、作業員属性・特徴データ２３０について図１７を用いて具体的に説明する。

［作業員属性・特徴データ２３０］
図１７は、作業員属性・特徴データ２３０の一例を示す説明図である。作業員属性・特徴データ２３０は、作業員ＩＤ３０３と、実績作業数１７０１と、作業員属性変数１７０２と、作業員ＩＤ抽象化変数１７０３と、作業員特徴変数１７０４と、を有する。

実績作業数１７０１は、学習データ内１７１１と、最新１か月以内１７１２と、を有する。学習データ内１７１１の値は、その作業員ＩＤ３０３の作業員についての作業員ＩＤ使用予測モデル２３１を生成する際の作業員ＩＤ使用学習データ２２３内の実績作業数１７０１である。最新１か月以内１７１２の値は、その作業員ＩＤ３０３の作業員についての最新１か月以内の業務実績データ２２１に含まれる実績作業数１７０１である。なお、図１７では、例として「最新１か月」としたが、１か月には限定されない。

学習データ内１７１１および最新１か月以内１７１２の値は、たとえば、作業員ＩＤ使用学習データ２２３内に多く含まれる作業員と、作業員ＩＤ使用学習データ２２３には含まれないが直近の作業の業務実績データ２２１が存在する作業員と、直近の作業の業務実績データ２２１に存在しない作業員と、を判別するために用いられる。

作業員属性変数１７０２は、たとえば、その作業ＩＤ３０１の作業員についての最新経験日数１７２１を含む。最新経験日数１７２１は、その作業ＩＤ３０１の作業員についての最新の時点における経験日数７０１を示す。

作業員ＩＤ使用学習データ２２３は、作業が遅い１７２２、および作業が速い１７２３を含む。作業が遅い１７２２は、その作業ＩＤ３０１の作業員の作業が遅いか否かを示す。値が「１」であれば作業が遅いことを示し、値が「０」であれば作業が速いことを示す。同様に、作業が速い１７２３は、その作業ＩＤ３０１の作業員の作業が速いか否かを示す。値が「１」であれば作業が速いことを示し、値が「０」であれば作業が遅いことを示す。

作業が遅い１７２２および作業が速い１７２３の値は、作業員特徴使用学習データ２２９の生成時に算出された値が用いられる。たとえば、図１０の影響度分布情報１０００において、影響度の平均値ａｖが、ａ≦ａｖ≦ｂ（ａは０より小さい。ｂは０より大きい）であれば、その作業員についての作業が遅い１７２２および作業が速い１７２３の値はともに「０」に設定される。

また、影響度の平均値ａｖが、ａ＞ａｖであれば、その作業員についての作業が遅い１７２２の値は「０」、作業が速い１７２３の値は「１」に設定される。また、影響度の平均値ａｖが、ｂ＜ａｖであれば、その作業員についての作業が遅い１７２２の値は「１」、作業が速い１７２３の値は「０」に設定される。

また、作業員ＩＤ３０３が「４０」の作業員のように、学習データ内１７１１に業務実績データ２２１が存在しない（学習データ内１７１１の値が「０」）作業員に関しては、上述のように学習データから作業が遅い１７２２および作業が速い１７２３の値を設定することができない。この場合、データ分析装置１０２は、最新１ヶ月の業務実績データ２２１に対して影響度分布情報１０００を生成し、作業が遅い１７２２および作業が速い１７２３の値を設定する。

一方、作業員ＩＤ３０３が「５５」の作業員のように、業務実績データ２２１がほぼ存在しない、すなわち、所定数以下の作業員については、データ分析装置１０２は、作業が遅い１７２２および作業が速い１７２３の値を「０」に設定する。但し、業務に関する事前知識に基づき、実績がない作業員について作業員属性変数１７０２の初期値が定義されている場合は、この限りではない。詳細は後述する。

作業員特徴変数１７０４についても、たとえば、データ分析装置１０２は、作業員特徴変数１４０１の「棚上段が得意」の値が「１」の作業ＩＤ３０１を作業員特徴使用学習データ２２９から特定する。そして、データ分析装置１０２は、特定した作業ＩＤ３０１の作業を実施した作業員のエントリにおいて、棚上段が得意１７３１の値に「１」を設定する。同様に、データ分析装置１０２は、作業員特徴変数１４０１の「棚上段が得意」の値が「０」の作業ＩＤ３０１を作業員特徴使用学習データ２２９から特定する。そして、データ分析装置１０２は、特定した作業ＩＤ３０１の作業を実施した作業員のエントリにおいて、棚上段が得意１７３１の値に「０」を設定する。

このように、業務改善施策生成処理１２２の実行時における各作業員の最新の作業員属性変数１７０２、作業員ＩＤ抽象化変数１７０３および作業員特徴変数１７０４の値を管理することが可能となる。ここで、図１７の説明を終了する。

図１６に戻り、データ分析装置１０２は、作業員属性・特徴データ２３０と、作業員ＩＤ使用予測モデル２３１、作業員属性使用予測モデル２３２、および作業員特徴使用予測モデル２３５とを用いて、作業時間の予測の実行を、ステップＳ１５０４により開始する（ステップＳ１６０１）。

まず、データ分析装置１０２は、予測対象作業の作業員の作業員ＩＤ３０３について、学習データ内１７１１における実績作業数１７０１が所定件数（たとえば、１００件）以上か否か判定する（ステップＳ１６０２）。所定件数以上存在する場合（ステップＳ１６０２：Ｙｅｓ）、データ分析装置１０２は、適用する予測モデルを作業員ＩＤ使用予測モデル２３１に決定する（ステップＳ１６０３）。

この場合、ステップＳ１５０５では、データ分析装置１０２は、作業員ＩＤ使用予測モデル２３１に、再計算後の作業員ＩＤ使用学習データ２２３を入力することにより、作業時間９０４の予測を実行することになる。

一方、所定件数以上存在しない場合（ステップＳ１６０２：Ｎｏ）、データ分析装置１０２は、予測対象の作業員が、最新１ヶ月以内１７１２の実績作業数１７０１が所定件数（たとえば、５０件）以上存在しているか否か判定する（ステップＳ１６０４）。所定件数以上存在する場合（ステップＳ１６０４：Ｙｅｓ）、データ分析装置１０２は、適用する予測モデルを作業員特徴使用予測モデル２３５に決定する（ステップＳ１６０５）。

この場合、ステップＳ１５０５では、データ分析装置１０２は、作業員特徴使用予測モデル２３５に、再計算後の作業員ＩＤ使用学習データ２２３に作業員ＩＤ抽象化変数１７０３および作業員特徴変数１７０４が追加された学習データを入力することにより、作業時間９０４の予測を実行することになる。

一方、所定件数以上存在しない場合（ステップＳ１６０４：Ｎｏ）、データ分析装置１０２は、適用する予測モデルを作業員属性使用予測モデル２３２に決定する（ステップＳ１６０６）。

この場合、ステップＳ１５０５では、データ分析装置１０２は、作業員属性使用予測モデル２３２に、再計算後の作業員ＩＤ使用学習データ２２３に作業員属性変数１７０２が追加された学習データを入力することにより、作業時間９０４の予測を実行することになる。

以上の処理によって、データ分析装置１０２は、予測対象の作業の予測作業時間を算出し、本処理を終了する（ステップＳ１６０７）。このように、予測対象の作業員に応じて、使用する予測モデルを適切に使い分けることによって、作業員の業務実績データ２２１の件数に応じた精度の高い作業時間を予測することが可能となる。

すなわち、本例では、ステップＳ１６０２において、過去の業務実績データ２２１の件数が所定件数（たとえば、１００件）以上（ステップＳ１６０２：Ｙｅｓ）の作業員に関しては、データ分析装置１０２は、作業員個人に特化した予測モデルである作業員ＩＤ使用予測モデル２３１により作業時間を予測する（ステップＳ１６０３）。

また、ステップＳ１６０４において、最新１ヶ月の業務実績データ２２１の件数が所定件数（たとえば、５０件）未満である未知の作業員については、データ分析装置１０２は、作業員個人の特徴ではなく、作業員属性使用予測モデル２３２を用いて作業時間を予測する（ステップＳ１６０６）。

この場合、特定の属性に関して業務に関する事前知識によって初期値が定義されてもよい。たとえば、事前知識によって「経験日数が少ない作業員は新人であり作業が遅いと見なす」ことができる場合は、データ分析装置１０２は、事前に、作業員属性・特徴データ２３０において、業務実績データ２２１の件数が所定件数（たとえば、５０件）未満の作業員の「作業が遅い」の値を「１」に設定する。

学習データ内１７１１には存在しないが（ステップＳ１６０２：Ｎｏ）、最新１ヶ月以内１７１２には所定件数（たとえば、１００件）以上存在するような作業員の場合（ステップＳ１６０４：Ｙｅｓ）、データ分析装置１０２は、作業員属性・特徴データ２３０によってあらかじめ付与された変数の値を用い、作業員特徴使用予測モデル２３５を用いて作業時間を予測する（ステップＳ１６０５）。

このように、何れの作業員の場合においても、データ分析装置１０２は、十分な作業量を備えた学習データによって生成された予測モデルで予測を実行する。したがって、精度の高い作業時間の予測が可能となる。以上で説明したデータ分析装置１０２を用いることで、作業時間予測の対象となる作業員の個人性を考慮した作業時間の予測を高精度に行うことが可能となる。

また、上述したデータ分析装置１０２は、下記（１）～（１５）のように構成することもできる。

（１）データ分析装置１０２では、プロセッサ２０１は、複数の作業の作業ごとに、作業時間を示す目的変数６０１と、作業環境に関する説明変数６０２と、作業員ごとの作業の実施の有無を示す作業員ＩＤ変数６０３と、を有する作業員ＩＤ使用学習データ２２３を第１学習データとして取得する取得処理と、取得処理によって取得された作業員ＩＤ使用学習データ２２３に基づいて、作業時間を予測する作業員ＩＤ使用予測モデル２３１を第１予測モデルとして生成する予測モデル生成処理と、予測モデル生成処理によって生成された作業員ＩＤ使用予測モデル２３１に作業員ＩＤ使用学習データを入力することにより、作業時間の第１予測値９０４と、作業員ＩＤ変数６０３が作業ごとの第１予測値９０４の統計量（たとえば、平均値。中央値など他の統計量でもよい。）に与える影響の度合いを示す第１影響度９０３とを、作業ごとに算出する算出処理と、作業員ごとの複数の作業の各々の第１影響度９０３の分布（影響度分布情報１０００）に基づいて、複数の作業員の作業速度を抽象化した作業員ＩＤ抽象化変数１１０１を作業ごとに生成し、作業ごとに、目的変数６０１と、説明変数６０２と、作業員ＩＤ抽象化変数１１０１と、を有する抽象化変数使用学習データ２２７を第２学習データとして生成する学習データ生成処理と、を実行する。

これにより、作業ごとに、作業を実施した複数の作業員を作業速度に抽象化した説明変数を得ることができ、抽象化変数使用学習データ２２７を用いて生成される抽象化変数使用予測モデル２３４（第３予測モデル）の高精度化を図ることができる。

（２）上記（１）のデータ分析装置１０２において、第１学習データは、作業を実施した複数の作業員の各々の経験日数７０１を作業ごとに示す作業員属性変数７００を含む。これにより、第１学習データは、中間学習データ２２５となる。

また、予測モデル生成処理では、プロセッサ２０１は、作業員属性変数７００を含む前記第１学習データである中間学習データ２２５に基づいて、中間予測モデル２３３を第１予測モデルとして生成する。

そして、算出処理では、プロセッサ２０１は、中間予測モデル２３３に中間学習データ２２５を作業ごとに入力することにより、作業時間の第１予測値９０４と、説明変数６０２、作業員属性変数７００および作業員ＩＤ変数６０３の各々が作業ごとの第１予測値９０４の統計量に与える影響の度合いを示す第１影響度９０３とを、作業ごとに算出する。

そして、学習データ生成処理では、プロセッサ２０１は、作業員ごとの第１影響度９０３の分布（影響度分布情報１０００）に基づいて、作業員ＩＤ抽象化変数１１０１を作業ごとに生成し、抽象化変数使用学習データ２２７に、作業ごとの作業員属性変数７００を追加する。これにより、作業員の経験日数７０１を考慮した抽象化変数使用予測モデル２３４を生成することができる。

（３）上記（２）のデータ分析装置１０２において、作業員属性変数７００は、作業員から所定距離内でかつ作業時間帯が重複する付近の作業員の経験日数７０２を含む。これにより、付近の作業員の経験日数７０２が大きいほど、その作業の作業員は、付近の作業員からの業務支援を受けやすいという状況を予測モデルに反映することができ、付近の作業員の経験日数７０２が小さいほど、その作業の作業員は、付近の作業員に業務支援をするという状況を予測モデルに反映することができる。

（４）上記（２）のデータ分析装置１０２において、予測モデル生成処理では、プロセッサ２０１は、作業員属性変数７００を含む第１学習データである作業員属性使用学習データ２２４に基づいて、作業時間を予測する作業員属性使用予測モデル２３２を生成する。

これにより、作業員の経験日数７０１のような作業員属性を考慮した作業員属性使用予測モデル２３２により、そのような作業員属性を有する作業員の作業時間を、作業員個人を特定することなく予測することができる。

（５）上記（１）のデータ分析装置１０２において、予測モデル生成処理では、プロセッサ２０１は、抽象化変数使用学習データ２２７に基づいて、作業時間を予測する抽象化変数使用予測モデル２３４を第３予測モデルとして生成する。

また、算出処理では、プロセッサ２０１は、予測モデル生成処理によって生成された抽象化変数使用予測モデル２３４に抽象化変数使用学習データ２２７を入力することにより、作業時間の第２予測値９０４と、説明変数６０２が作業ごとの第２予測値９０４の統計量に与える影響の度合いを示す第２影響度９０１とを、作業ごとに算出する。

そして、学習データ生成処理では、プロセッサ２０１は、第２影響度９０１の分布１３００に基づいて、説明変数６０２に対する作業員の個人的な特徴を示す作業員特徴変数１４０１を作業ごとに生成し、抽象化変数使用学習データ２２７に、作業ごとの作業員特徴変数１４０１を追加した作業員特徴使用学習データ２２９を第３学習データとして生成する。

これにより、作業員特徴変数１４０１を考慮した作業員特徴使用予測モデル２３５（第４予測モデル）を生成することができる。

（６）上記（５）のデータ分析装置１０２において、予測モデル生成処理では、プロセッサ２０１は、作業員特徴使用学習データ２２９に基づいて、作業時間を予測する作業員特徴使用予測モデル２３５を第４予測モデルとして生成する。

これにより、棚上段が得意といった作業員の個人的な特徴を考慮した作業員特徴使用予測モデル２３５により、そのような特徴を有する作業員の作業時間を、作業員個人を特定することなく予測することができる。

（７）上記（１）のデータ分析装置１０２において、プロセッサ２０１は、作業を実施した作業員、作業時間、作業環境を作業ごとに有する第１実績データ（業務実績データ２２１）に基づいて、目的変数６０１および説明変数６０２を生成し、作業ごとの作業員から作業員ＩＤ変数６０３を生成することにより、第１実績データを作業員ＩＤ使用学習データ２２３に変換する変換処理を実行する。

また、取得処理では、プロセッサ２０１は、第１実績データの作業環境の変更に基づいて作業時間を再計算することにより、第１実績データを第２実績データ（改善対象の業務実績データ２２１）に変換し、第２実績データに基づいて、作業ごとに、再計算された作業時間を示す目的変数６０１と、変更された作業環境に関する説明変数６０２と、作業環境の変更に基づく作業員ごとの作業の実施の有無を示す作業員ＩＤ変数６０３と、を有する作業員ＩＤ使用学習データ２２３を第４学習データとして取得する。

そして、算出処理では、プロセッサ２０１は、作業員ＩＤ使用予測モデル２３１に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、改善対象の業務実績データ２２１から特定される改善業務を予測対象の作業員が実施した場合の各作業の作業時間の予測値を得ることができる。したがって、データ分析装置１０２の利用者は、予測対象の作業員の作業時間が改善されたか否かを特定することができる。

（８）上記（７）のデータ分析装置１０２において、算出処理では、プロセッサ２０１は、第４学習データの作業員ＩＤ変数６０３において予測対象の作業員が実施したことを示す作業の件数が第１所定件数以上存在する場合（Ｓ１６０２：Ｙｅｓ）、作業員ＩＤ使用予測モデル２３１に第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、予測対象の作業員が実施した作業が第１所定件数以上の第４学習データについては、作業員ＩＤ使用予測モデル２３１を優先適用することにより、予測対象の作業員に関する作業時間の予測精度の向上を図ることができる。

（９）上記（８）のデータ分析装置１０２において、プロセッサ２０１は、作業時間の第３予測値９０４が所定の改善条件を充足するか否かを判定する判定処理（ステップＳ１５０７）と、判定処理によって改善条件を充足する判定された場合、第２実績データに関する作業環境を改善施策に決定する決定処理（ステップＳ１５０８）と、決定処理による決定結果を出力する出力処理（ステップＳ１５０９）と、を実行する。

これにより、データ分析装置１０２は、予測対象の作業員が実施する作業について適切な改善施策を提示することができる。

（１０）上記（４）のデータ分析装置１０２において、プロセッサ２０１は、作業を実施した作業員、作業時間、作業環境を作業ごとに有する第１実績データ（業務実績データ２２１）に基づいて、目的変数６０１および説明変数６０２を生成し、作業ごとの作業員から作業員ＩＤ変数６０３を生成することにより、第１実績データを作業員ＩＤ使用学習データ２２３に変換する変換処理を実行する。

また、取得処理では、プロセッサ２０１は、第１実績データの作業環境の変更に基づいて作業時間を再計算することにより、第１実績データを第２実績データ（改善対象の業務実績データ２２１）に変換し、第２実績データに基づいて、作業ごとに、再計算された作業時間を示す目的変数６０１と、変更された作業環境に関する説明変数６０２と、作業環境の変更に基づく作業員ごとの作業の実施の有無を示す作業員ＩＤ変数６０３と、を有し、かつ、作業員属性変数１７０２を追加した第４学習データを取得する。

そして、算出処理では、プロセッサ２０１は、作業員属性使用予測モデル２３２に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する、

これにより、改善対象の業務実績データ２２１から特定される改善業務を予測対象の作業員が実施した場合に、予測対象の作業員の作業員属性を考慮して各作業の作業時間の予測値を得ることができる。したがって、データ分析装置１０２の利用者は、予測対象の作業員の作業時間が改善されたか否かを高精度に特定することができる。

（１１）上記（１０）のデータ分析装置１０２において、算出処理では、プロセッサ２０１は、第４学習データの作業員ＩＤ変数６０３において予測対象の作業員が所定期間内（たとえば、直近過去１か月以内１７１２）で実施したことを示す作業の件数が第２所定件数以上存在しない場合（ステップＳ１６０４：Ｎｏ）、作業員属性使用予測モデル２３２に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、予測対象の作業員が実施した作業が第２所定件数未満の第４学習データについては、作業員個人を特定するのではなく作業員属性を用いた作業員属性使用予測モデル２３２を優先適用することにより、予測対象の作業員に関する作業時間の予測精度の向上を図ることができる。

（１２）上記（５）のデータ分析装置１０２において、プロセッサ２０１は、作業を実施した作業員、作業時間、作業環境を作業ごとに有する第１実績データ（業務実績データ２２１）に基づいて、目的変数６０１および説明変数６０２を生成し、作業ごとの作業員から作業員ＩＤ変数６０３を生成することにより、第１実績データを作業員ＩＤ使用学習データ２２３に変換する変換処理を実行する。

また、取得処理では、プロセッサ２０１は、第１実績データの作業環境の変更に基づいて作業時間を再計算することにより、第１実績データを第２実績データ（改善対象の業務実績データ２２１）に変換し、第２実績データに基づいて、作業ごとに、再計算された作業時間を示す目的変数６０１と、変更された作業環境に関する説明変数６０２と、作業環境の変更に基づく作業員ごとの作業の実施の有無を示す作業員ＩＤ変数６０３と、を有し、かつ、作業員ＩＤ抽象化変数１７０３を追加した第４学習データを取得する。

そして、算出処理では、プロセッサ２０１は、抽象化変数使用予測モデル２３４に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、改善対象の業務実績データ２２１から特定される改善業務を予測対象の作業員が実施した場合に、予測対象の作業員を抽象化した作業速度を考慮して各作業の作業時間の予測値を得ることができる。したがって、データ分析装置１０２の利用者は、予測対象の作業員の作業時間が改善されたか否かを高精度に特定することができる。

（１３）上記（１２）のデータ分析装置１０２において、算出処理では、プロセッサ２０１は、第４学習データの作業員ＩＤ変数６０３において予測対象の作業員が所定期間内（たとえば、直近過去１か月以内１７１２）で実施したことを示す作業の件数が第２所定件数以上存在する場合（ステップＳ１６０４：Ｙｅｓ）、抽象化変数使用予測モデル２３４に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、予測対象の作業員が実施した作業が第２所定件数以上の第４学習データについては、予測対象の作業員の作業速度を抽象化した抽象化変数使用予測モデル２３４を優先適用することにより、予測対象の作業員に関する作業時間の予測精度の向上を図ることができる。

（１４）上記（６）のデータ分析装置１０２において、プロセッサ２０１は、作業を実施した作業員、作業時間、作業環境を作業ごとに有する第１実績データ（業務実績データ２２１）に基づいて、目的変数６０１および説明変数６０２を生成し、作業ごとの作業員から作業員ＩＤ変数６０３を生成することにより、第１実績データを作業員ＩＤ使用学習データ２２３に変換する変換処理を実行する。

また、取得処理では、プロセッサ２０１は、第１実績データの作業環境の変更に基づいて作業時間を再計算することにより、第１実績データを第２実績データ（改善対象の業務実績データ２２１）に変換し、第２実績データに基づいて、作業ごとに、再計算された作業時間を示す目的変数６０１と、変更された作業環境に関する説明変数６０２と、作業環境の変更に基づく作業員ごとの作業の実施の有無を示す作業員ＩＤ変数６０３と、を有し、かつ、作業員特徴変数１７０４を追加した第４学習データを取得する。

そして、算出処理では、プロセッサ２０１は、作業員特徴使用予測モデル２３５に、予測対象の作業員に関する前記第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する。

これにより、改善対象の業務実績データ２２１から特定される改善業務を予測対象の作業員が実施した場合に、予測対象の作業員の個人的な特徴を考慮して各作業の作業時間の予測値を得ることができる。したがって、データ分析装置１０２の利用者は、予測対象の作業員の作業時間が改善されたか否かを高精度に特定することができる。

（１５）上記（１４）のデータ分析装置１０２において、算出処理では、プロセッサ２０１は、第４学習データの作業員ＩＤ変数６０３において予測対象の作業員が所定期間内（たとえば、直近過去１か月以内１７１２）で実施したことを示す作業の件数が第２所定件数以上存在する場合（ステップＳ１６０４：Ｙｅｓ）、作業員特徴使用予測モデル２３５に、予測対象の作業員に関する第４学習データを入力することにより、予測対象の作業員に関する作業時間の第３予測値９０４を作業ごとに算出する。

これにより、予測対象の作業員が実施した作業が第２所定件数以上の第４学習データについては、予測対象の作業員の個人的な特徴を用いた作業員特徴使用予測モデル２３５を優先適用することにより、予測対象の作業員に関する作業時間の予測精度の向上を図ることができる。

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）カード、ＳＤカード、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）の記録媒体に格納することができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

１００データ分析システム
１０１業務システム
１０２データ分析装置
１１０業務実績ＤＢ
１２１モデル生成処理
１２２業務改善施策生成処理
２０１プロセッサ
２０２記憶デバイス
２２１業務実績データ
２２２商品情報
２２３使用学習データ
２２４作業員属性使用学習データ
２２５中間学習データ
２２６第１影響度テーブル
２２７抽象化変数使用学習データ
２２８第２影響度テーブル
２２９作業員特徴使用学習データ
２３０作業員属性・特徴データ
２３１使用予測モデル
２３２作業員属性使用予測モデル
２３３中間予測モデル
２３４抽象化変数使用予測モデル
２３５作業員特徴使用予測モデル

Claims

プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ分析装置であって、
前記プロセッサは、
複数の作業の作業ごとに、作業時間を示す目的変数と、作業環境に関する説明変数と、作業員ごとの前記作業の実施の有無を示す作業員変数と、を有する第１学習データを取得する取得処理と、
前記取得処理によって取得された第１学習データに基づいて、前記作業時間を予測する第１予測モデルを生成する予測モデル生成処理と、
前記予測モデル生成処理によって生成された第１予測モデルに前記第１学習データを入力することにより、前記作業時間の第１予測値と、前記作業員変数が前記作業ごとの前記第１予測値の統計量に与える影響の度合いを示す第１影響度とを、前記作業ごとに算出する算出処理と、
前記作業員ごとの前記複数の作業の各々の第１影響度の分布に基づいて、前記複数の作業員の作業速度を抽象化した抽象化変数を前記作業ごとに生成し、前記作業ごとに、前記目的変数と、前記説明変数と、前記抽象化変数と、を有する第２学習データを生成する学習データ生成処理と、
を実行することを特徴とするデータ分析装置。
請求項１に記載のデータ分析装置であって、
前記第１学習データは、前記作業を実施した複数の作業員の各々の経験日数を前記作業ごとに示す作業員属性変数を含み、
前記予測モデル生成処理では、前記プロセッサは、前記作業員属性変数を含む前記第１学習データに基づいて、前記第１予測モデルを生成し、
前記算出処理では、前記プロセッサは、前記第１予測モデルに前記作業員属性変数を含む前記第１学習データを前記作業ごとに入力することにより、前記作業時間の第１予測値と、前記説明変数、前記作業員属性変数および前記作業員変数の各々が前記作業ごとの前記第１予測値の統計量に与える影響の度合いを示す第１影響度とを、前記作業ごとに算出し、
前記学習データ生成処理では、前記プロセッサは、前記作業員ごとの前記第１影響度の分布に基づいて、前記抽象化変数を前記作業ごとに生成し、前記第２学習データに、前記作業ごとの前記作業員属性変数を追加する、
ことを特徴とするデータ分析装置。
請求項２に記載のデータ分析装置であって、
前記作業員属性変数は、前記作業員から所定距離内でかつ作業時間帯が重複する他の作業員の経験日数を含む、
ことを特徴とするデータ分析装置。
請求項２に記載のデータ分析装置であって、
前記予測モデル生成処理では、前記プロセッサは、前記作業員属性変数を含む前記第１学習データに基づいて、前記作業時間を予測する第２予測モデルを生成する、
ことを特徴とするデータ分析装置。
請求項１に記載のデータ分析装置であって、
前記予測モデル生成処理では、前記プロセッサは、前記第２学習データに基づいて、前記作業時間を予測する第３予測モデルを生成し、
前記算出処理では、前記プロセッサは、前記予測モデル生成処理によって生成された第３予測モデルに前記第２学習データを入力することにより、前記作業時間の第２予測値と、前記説明変数が前記作業ごとの前記第２予測値の統計量に与える影響の度合いを示す第２影響度とを、前記作業ごとに算出し、
前記学習データ生成処理では、前記プロセッサは、前記第２影響度の分布に基づいて、前記説明変数に対する前記作業員の個人的な特徴を示す作業員特徴変数を前記作業ごとに生成し、前記第２学習データに、前記作業ごとの前記作業員特徴変数を追加した第３学習データを生成する、
ことを特徴とするデータ分析装置。
請求項５に記載のデータ分析装置であって、
前記予測モデル生成処理では、前記プロセッサは、前記作業員特徴変数を含む前記第３学習データに基づいて、前記作業時間を予測する第４予測モデルを生成する、
ことを特徴とするデータ分析装置。
請求項１に記載のデータ分析装置であって、
前記プロセッサは、
前記作業を実施した作業員、前記作業時間、前記作業環境を前記作業ごとに有する第１実績データに基づいて、前記目的変数および前記説明変数を生成し、前記作業ごとの前記作業員から前記作業員変数を生成することにより、前記第１実績データを前記第１学習データに変換する変換処理を実行し、
前記取得処理では、前記プロセッサは、前記第１実績データの前記作業環境の変更に基づいて前記作業時間を再計算することにより、前記第１実績データを第２実績データに変換し、前記第２実績データに基づいて、前記作業ごとに、再計算された作業時間を示す目的変数と、変更された作業環境に関する説明変数と、前記作業環境の変更に基づく前記作業員ごとの前記作業の実施の有無を示す作業員変数と、を有する第４学習データを取得し、
前記算出処理では、前記プロセッサは、前記第１予測モデルに、予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項７に記載のデータ分析装置であって、
前記算出処理では、前記プロセッサは、前記第４学習データの前記作業員変数において前記予測対象の作業員が実施したことを示す作業の件数が第１所定件数以上存在する場合、前記第１予測モデルに前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項８に記載のデータ分析装置であって、
前記プロセッサは、
前記作業時間の第３予測値が所定の改善条件を充足するか否かを判定する判定処理と、
前記判定処理によって前記改善条件を充足する判定された場合、前記第２実績データに関する作業環境を改善施策に決定する決定処理と、
前記決定処理による決定結果を出力する出力処理と、
を実行することを特徴とするデータ分析装置。
請求項４に記載のデータ分析装置であって、
前記プロセッサは、
前記作業を実施した作業員、前記作業時間、前記作業環境を前記作業ごとに有する第１実績データに基づいて、前記目的変数および前記説明変数を生成し、前記作業ごとの前記作業員から前記作業員変数を生成することにより、前記第１実績データを前記第１学習データに変換する変換処理を実行し、
前記取得処理では、前記プロセッサは、前記第１実績データの前記作業環境の変更に基づいて前記作業時間を再計算することにより、前記第１実績データを第２実績データに変換し、前記第２実績データに基づいて、前記作業ごとに、再計算された作業時間を示す目的変数と、変更された作業環境に関する説明変数と、前記作業環境の変更に基づく前記作業員ごとの前記作業の実施の有無を示す作業員変数と、を有し、かつ、前記作業員属性変数を追加した第４学習データを取得し、
前記算出処理では、前記プロセッサは、前記第２予測モデルに、予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項１０に記載のデータ分析装置であって、
前記算出処理では、前記プロセッサは、前記第４学習データの前記作業員変数において前記予測対象の作業員が所定期間内で実施したことを示す作業の件数が第２所定件数以上存在しない場合、前記第２予測モデルに、前記予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項５に記載のデータ分析装置であって、
前記プロセッサは、
前記作業を実施した作業員、前記作業時間、前記作業環境を前記作業ごとに有する第１実績データに基づいて、前記目的変数および前記説明変数を生成し、前記作業ごとの前記作業員から前記作業員変数を生成することにより、前記第１実績データを前記第１学習データに変換する変換処理を実行し、
前記取得処理では、前記プロセッサは、前記第１実績データの前記作業環境の変更に基づいて前記作業時間を再計算することにより、前記第１実績データを第２実績データに変換し、前記第２実績データに基づいて、前記作業ごとに、再計算された作業時間を示す目的変数と、変更された作業環境に関する説明変数と、前記作業環境の変更に基づく前記作業員ごとの前記作業の実施の有無を示す作業員変数と、を有し、かつ、前記抽象化変数を追加した第４学習データを取得し、
前記算出処理では、前記プロセッサは、前記第３予測モデルに、予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項１２に記載のデータ分析装置であって、
前記算出処理では、前記プロセッサは、前記第４学習データの前記作業員変数において前記予測対象の作業員が所定期間内で実施したことを示す作業の件数が第２所定件数以上存在する場合、前記第３予測モデルに、前記予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
請求項６に記載のデータ分析装置であって、
前記プロセッサは、
前記作業を実施した作業員、前記作業時間、前記作業環境を前記作業ごとに有する第１実績データに基づいて、前記目的変数および前記説明変数を生成し、前記作業ごとの前記作業員から前記作業員変数を生成することにより、前記第１実績データを前記第１学習データに変換する変換処理を実行し、
前記取得処理では、前記プロセッサは、前記第１実績データの前記作業環境の変更に基づいて前記作業時間を再計算することにより、前記第１実績データを第２実績データに変換し、前記第２実績データに基づいて、前記作業ごとに、再計算された作業時間を示す目的変数と、変更された作業環境に関する説明変数と、前記作業環境の変更に基づく前記作業員ごとの前記作業の実施の有無を示す作業員変数と、を有し、かつ、前記作業員特徴変数を追加した第４学習データを取得し、
前記算出処理では、前記プロセッサは、前記第４予測モデルに、予測対象の作業員に関する前記第４学習データを入力することにより、前記予測対象の作業員に関する作業時間の第３予測値を前記作業ごとに算出する、
ことを特徴とするデータ分析装置。
プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ分析装置が実行するデータ分析方法であって、
前記データ分析方法は、
前記プロセッサが、
複数の作業の作業ごとに、作業時間を示す目的変数と、作業環境に関する説明変数と、作業員ごとの前記作業の実施の有無を示す作業員変数と、を有する第１学習データを取得する取得処理と、
前記取得処理によって取得された第１学習データに基づいて、前記作業時間を予測する第１予測モデルを生成する予測モデル生成処理と、
前記予測モデル生成処理によって生成された第１予測モデルに前記第１学習データを入力することにより、前記作業時間の第１予測値と、前記作業員変数が前記作業ごとの前記第１予測値の統計量に与える影響の度合いを示す第１影響度とを、前記作業ごとに算出する算出処理と、
前記作業員ごとの前記複数の作業の各々の第１影響度の分布に基づいて、前記複数の作業員の作業速度を抽象化した抽象化変数を前記作業ごとに生成し、前記作業ごとに、前記目的変数と、前記説明変数と、前記抽象化変数と、を有する第２学習データを生成する学習データ生成処理と、
を実行することを特徴とするデータ分析方法。