JP5760732B2 - 業務分析装置、業務分析プログラム、及び業務分析方法 - Google Patents

業務分析装置、業務分析プログラム、及び業務分析方法 Download PDF

Info

Publication number
JP5760732B2
JP5760732B2 JP2011133561A JP2011133561A JP5760732B2 JP 5760732 B2 JP5760732 B2 JP 5760732B2 JP 2011133561 A JP2011133561 A JP 2011133561A JP 2011133561 A JP2011133561 A JP 2011133561A JP 5760732 B2 JP5760732 B2 JP 5760732B2
Authority
JP
Japan
Prior art keywords
file
log
information
business
movement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011133561A
Other languages
English (en)
Other versions
JP2013003794A (ja
Inventor
悟 ▲高▼橋
悟 ▲高▼橋
隆夫 毛利
隆夫 毛利
豊 岩山
豊 岩山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011133561A priority Critical patent/JP5760732B2/ja
Publication of JP2013003794A publication Critical patent/JP2013003794A/ja
Application granted granted Critical
Publication of JP5760732B2 publication Critical patent/JP5760732B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本明細書は、ファイル操作の記録を用いて業務分析を行う技術に関する。
どのような業務の作業に、どれだけの時間をかけているかを調べる、業務分析という分析がある。コンピュータを用いた業務作業では、或る業務にかかる時間を調べるために、或る業務の開始・終了時に、どの業務を開始し、あるいは、終了をしたのかが利用者によって入力される。業務分析を自動化する方法として、次の技術がある。
例えば、第1の技術では、ドキュメントに対する操作の履歴をユーザ別に見た場合に、短い時間的範囲での操作は特定の作業に関連した操作に限定されることに注目し、連続した履歴データを短い時間的範囲でのユーザ別の連続した操作列に区切る。さらに、この作成された操作列間の類似度を判定して類似度の高い操作列同士を結合し、より長い時間的範囲でのユーザ操作履歴列を作成する。
また、例えば、第2の技術として、次の技術がある。作業グループ化装置は、操作情報記憶部に記憶されたユーザ操作の記録情報を分析する。それから、作業グループ化装置は、特定のアプリケーションで新規に作成されたファイルの保存先として集中的に指定されているフォルダを、一時利用フォルダと判定する。作業グループ化装置は、操作情報記憶部から取得されたユーザ操作の記録情報から一時利用フォルダと判定されたフォルダに関するユーザ操作を除外して、ユーザ操作をグループ化する。
特開2010−237896号公報 2004−029907号公報 2000−172696号公報 2004−38234号公報
或る業務の作業を行う際に、参照をするファイルを所定のディレクトリに格納して作業をする以外に、或る業務で利用するファイルを一時的な作業領域(デスクトップやマイドキュメントファイル等)に格納して作業し、その一時的な作業領域に異なる業務のファイルを格納することがある。このような場合、上記第1の技術では、ファイルの移動について考慮していないため、その一時的な作業領域のファイルについて他の領域へ移動させる等、ファイルの操作を行うと、どの業務の作業を行ったかを判断することができない。そのため、業務分析ができなくなる。
また、第2の技術では、ユーザ操作の記録のグループ化処理は、一時利用フォルダと判定されたフォルダを除外して行っている。そのため、一時利用フォルダに関するユーザ操作の記録に基づいて、業務を特定することができない。
そこで、本明細書では、一時的格納場所に関係するファイル操作について業務分析を行う業務分析装置を提供する。
業務分析装置は、所在情報格納部、移動関係業務格納部、取得部、判定部、移動分析部、業務推定部を含む。
所在情報格納部には、一時的にファイルが格納される一時的格納場所の所在情報が格納される。
移動関係業務格納部には、ファイル移動情報と、業務名とが関連付けられて格納される。ファイル移動情報は、一時的格納場所へ移動させられるファイルの移動元及び一時的格納場所から移動させられるファイルの移動先を示す情報のうち少なくとも1つを含む。
取得部は、コンピュータログと、ファイル操作ログとを取得する。コンピュータログは、コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含む時刻毎に記録されたものである。ファイル操作ログは、ファイルに対する操作及び該操作の前後の該操作されたファイルの所在の履歴を示す時刻毎のログである
判定部は、所在情報格納部に格納された一時的格納場所の所在情報に基づいて、コンピュータログに含まれる所在情報が一時的格納場所を示すかを判定する。
移動分析部は、一時的格納場所を示す所在情報を含むコンピュータログの日時に対応するファイル操作ログから、一時的格納場所へ移動させられるファイルの移動元及び一時的格納場所から移動させられるファイルの移動先を分析する。
業務推定部は、移動関係業務格納部から、分析により得られたファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索する。それから、業務推定部は、検索した第2のファイル移動情報に対応する業務名を取得し、検索した業務名を第1のファイル移動情報に対応する業務と判定する。
本明細書で説明する業務分析装置によれば、一時的格納場所に関係するファイル操作について業務分析を行うことができる。
本実施形態における業務分析装置を示す。 本実施形態における業務分析装置の構成の一例を示す。 PCログの一例を示す。 業務分類ログを示す。 業務分類ログ31の作成を説明するための図である。 ファイル操作ログの一例を示す。 メール通信ログ33の一例を示す。 業務分類結果表37の一例を示す。 本実施形態における学習処理部22で実行される処理フローを示す。 本実施形態における分類適用部23で実行される処理フローを示す。 業務分析装置20における学習処理部22及び学習DB群25を示す。 集計DB51の一例を示す。 フォルダ対応業務DB52の一例を示す。 汎用フォルダDB53の一例を示す。 ファイル移動関係DB54の一例を示す。 キーワード関係DB55の一例を示す。 業務分析装置20における分類適用部23及び学習DB群25を示す。 本実施形態における全体処理のフローを示す。 学習処理(S23)の詳細を示す。 汎用フォルダを介して移動したファイルのログに関するファイル移動情報の分析フローを示す。 学習・分類適用共通のファイル移動情報分析処理(S45,S77)のフロー(その1)の一例を示す。 学習・分類適用共通のファイル移動情報分析処理(S45,S77)のフロー(その2)の一例を示す。 分類適用処理(S23)の詳細を示す。 キーワードの合致率判定の処理フローの一例である。 学習処理部22において取得されるPCログ30の一例を示す。 学習処理部22において取得される業務分類ログ31の一例を示す。 S37の処理における集計DB51の一例を示す。 S38の処理におけるフォルダ対応業務DB52の一例を示す。 学習処理部22において、同一のフォルダパスに、複数の業務名が対応付けられる場合、そのフォルダパスが格納される汎用フォルダDB53の一例を示す。 汎用フォルダに含まれるフォルダパスを有する集計情報のみ抽出した集計DB51の一例を示す。 学習処理部22において取得されるファイル操作ログ32の一例を示す。 学習処理部22において取得されるメール通信ログ33の一例を示す。 ファイル移動情報分析処理において、(A)集計情報、(B)ファイル操作ログ、(C)メール通信ログから(D)ファイル移動情報を生成するための説明図である。 S47の処理におけるファイル移動関係DB54の一例を示す。 S48の処理におけるキーワード関係DB55の一例を示す。 分類適用部23において取得されるPCログ30’の一例を示す。 分類適用部23において取得されるファイル操作ログ32’の一例を示す。 分類適用部23において取得されるメール通信ログ33’の一例を示す。 (A)S74で得られるPCログ、及び(B)S77のファイル移動情報分析処理で得られるファイル移動情報と(C)学習処理において生成したファイル移動情報の比較を説明するための図である。 分類適応対象データのアプリ名及びタイトル名からキーワードを抽出することについて説明するための図である。 S78において、2つの業務名が取得された場合、その2つの業務名を有するファイル移動情報に対応するキーワード関係情報の一例である。 合致率の判定について説明するための図である。 業務分析装置20のハードウェア環境の構成ブロック図である。
アプリケーションソフトウェアが読み込んでいるファイルが汎用フォルダに保存されていてフォルダから業務名を特定できない場合、分類対象のコンピュータのログからユーザのファイル操作と過去の業務とを関連付けることが困難であった。
上記のような汎用フォルダ(デスクトップやマイドキュメントフォルダ等)に保存されるファイルは、メールソフトなどのアプリケーションソフトウェアにより保存されたり、作業後に外部のフォルダに運ばれるなど作業別の操作が行われることが多いと考えられる。本実施形態では、汎用フォルダにおけるファイルに対する移動操作(ファイル移動)の記録を採取して識別することで、コンピュータのログから業務を推測する。ファイル移動の例としては、特定フォルダに格納する、特定の相手にメール送付する等がある。そこで、汎用フォルダ上のファイルに対するファイル移動を特定し、分類済みの業務内のファイルと同様のファイル移動であるかどうかに基づいて、業務を推測する。
図1は、本実施形態における業務分析装置を示す。業務分析装置1は、所在情報格納部11、移動関係業務格納部12、取得部2、判定部3、移動分析部4、業務推定部5を含む。
所在情報格納部11には、一時的にファイルが格納される一時的格納場所の所在情報が格納される。所在情報格納部11の一例は、汎用フォルダDB53である。一時的格納場所の一例は、汎用フォルダである。なお、本実施形態では、ファイルの格納場所を「フォルダ」と称するが、これに限定されず、ディレクトリであってもよい。
移動関係業務格納部12には、ファイル移動情報と、業務名とが関連付けられて格納される。ファイル移動情報は、一時的格納場所へ移動させられるファイルの移動元及び一時的格納場所から移動させられるファイルの移動先を示す情報のうち少なくとも1つを含む。移動関係業務格納部12の一例は、ファイル移動関係DB54である。
取得部2は、コンピュータログと、ファイル操作ログとを取得する。コンピュータログは、コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含む。ファイル操作ログは、ファイルに対する操作履歴を示す。取得部2の一例は、CPU(Central Processing Unit)102である。
判定部3は、所在情報格納部に格納された一時的格納場所の所在情報に基づいて、コンピュータログに含まれる所在情報が一時的格納場所を示すかを判定する。判定部3の一例は、分類適用部23(ファイル移動分析部61)である。
移動分析部4は、所在情報が一時的格納場所を示すと判定された場合、次の処理を行う。すなわち、移動分析部4は、コンピュータログとファイル操作ログとを用いて、コンピュータログの示すファイルについて、一時的格納場所へ移動させられるファイルの移動元及び一時的格納場所から移動させられるファイルの移動先を分析する。移動分析部4の一例は、分類適用部23(ファイル移動分析部61)である。
業務推定部5は、移動関係業務格納部12から、分析により得られたファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索する。それから、業務推定部5は、検索した第2のファイル移動情報に対応する業務名を取得し、検索した業務名を第1のファイル移動情報に対応する業務と判定する。業務推定部5の一例は、分類適用部23(業務推定部62)である。
このように構成することにより、業務分析装置は一時的格納場所に関係するファイル操作について業務分析を行うことができる。
業務分析装置1は、さらに、処理対象情報生成部7を含む。処理対象情報生成部7は、コンピュータログを単位時間毎に区分けする。それから、処理対象情報生成部7は、区分けした時間帯において最も長時間コンピュータが操作されたことを示すコンピュータログから、処理対象情報を生成する。処理対象情報は、該時間帯におけるソフトウェアによって操作された処理対象となるファイルの所在情報を少なくとも含む。処理対象情報生成部7の一例は、分類適用部23(ファイル移動分析部61)である。処理対象情報の一例は、集計情報である。
このように構成することにより、業務分析装置はコンピュータログを単位時間単位でまとめることができる。
取得部2は、電子メールの送受信履歴を示す通信ログを併せて取得する。移動分析部4は、ファイル操作ログから、処理対象情報の時間帯に属する所定の日時より前で該日時に最も近い日時の第1のファイル操作ログを取得する。そして、第1のファイル操作ログが示すソフトが電子メール送受信用ソフトウェアである場合、移動分析部4は、次の処理を行う。すなわち、移動分析部4は、通信ログから、第1のファイル操作ログにより特定されるファイルと同じファイルが添付され、第1のファイル操作ログの日時より前で該日時に最も近い送受信日時の電子メールについての第1の通信ログを取得する。それから、移動分析部4は、第1の通信ログの送信元を、ファイルの移動元として前記ファイル移動情報に設定する。一方、第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、移動分析部4は、第1のファイル操作ログからファイルの移動元を取得してファイル移動情報に設定する。
また、移動分析部4は、ファイル操作ログから、処理対象情報の時間帯に属する所定の時間帯と重なる第2のファイル操作ログを取得する。そして、第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、移動分析部4は、次の処理を行う。すなわち、移動分析部4は、通信ログから、第2のファイル操作ログにより特定されるファイルと同じファイルが添付され、第2のファイル操作ログの日時より後で該日時に最も近い送受信日時の電子メールについての第2の通信ログを取得する。それから、移動分析部4は、第2の通信ログの送信先を、ファイルの移動先としてファイル移動情報に設定する。一方、第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、移動分析部4は、第2のファイル操作ログからファイルの移動先を取得してファイル移動情報に設定する。
このように構成することにより、業務分析装置はファイル操作によるファイルの移動元または移動先を設定したファイル移動情報を生成することができる。
業務分析装置1は、さらに、類似度判定部8を含む。検索された業務名が複数ある場合、ソフトウェア名及びウィンドウタイトル名の類似度に応じて、類似度判定部8は、第2のファイル移動情報に対応する業務名を第1のファイル移動情報に対応する業務と判定する。ここで、類似度は、第1のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名と、第2のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名の類似度である。類似度判定部8の一例は、分類適用部23(類似度判定部63)である。
このように構成することにより、検索された業務名が複数ある場合、業務分析装置は学習データと分類適用対象のデータのそれぞれに含まれるソフトウェア名及びウィンドウタイトル名の類似度に応じて、業務名を決定することができる。
前記業務分析装置は、さらに、語句関係業務格納部13を含む。語句関係業務格納部13には、移動関係業務格納部に格納されたファイル移動情報が示すファイルを操作したソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群と、業務名とが関係付けられて格納される。語句関係業務格納部13の一例は、キーワード関係DB55である。
分析した業務名が複数ある場合、類似度判定部8は、次の処理を行う。すなわち、語句関係業務格納部13に格納された1以上の組の語句群と、処理対象情報に含まれるソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群のそれぞれとの一致率を算出する。そして、類似度判定部8は、語句関係業務格納部13から、最も一致率の高い語句群の組に対応する業務名を検索する。
このように構成することにより、複数の業務が取得された場合には、業務分析装置はコンピュータログのアプリケーションソフトウェア名からキーワード群を抽出し、学習データのキーワード群との合致率によって業務を推定することができる。
図2は、本実施形態における業務分析装置の構成の一例を示す。業務分析装置20は、コンピュータのログ(PCログ)から業務を推測する装置であり、コンピュータのログに業務名を付けるのを容易にすることができる。
ここで、ウィンドウタイトルを表示しているアプリケーションソフトウェアが読み込んでいるファイルについて、読み込みの前後の時刻のPCログから取得できるファイルの受信元や送信先などの情報は、ファイル移動情報と称される。以下では、アプリケーションソフトウェアを「アプリ」と称する。
本実施形態では、過去におけるファイル移動情報と業務とを予め関連付けて記憶しておく。そして、業務分類の対象となるPCログから得られるファイル移動情報が過去のファイル移動情報と類似していれば、その対象のファイル移動情報は、その過去のファイル移動情報に対応する業務と同様であると推測する。
また、その対象のファイル移動情報に対して、過去のファイル移動情報に対応する業務が複数ある場合には、アプリが読み込んでいるファイルのウィンドウタイトル等の類似性に応じて、業務を推定する。
業務分析装置20は、PCログと業務分類ログを用いて、一定期間のユーザ操作を学習した後、業務分類を行うPCログに対して分類適用処理を行う。業務分析装置20は、初期化部21、学習処理部22、分類適用部23、分類結果出力部24、学習データベース群25を含む。以下では、データベースを「DB」と称する。
初期化部21は、学習DB群25の全DBの内容を初期化する。
学習処理部22は、PCログ30、業務分類ログ31、ファイル操作ログ32、メール通信ログ33)を読み込む。ここで、PCとはパーソナルコンピュータの略称である。PCログ30は、一定の期間(学習期間)に、ユーザが使用したPC38より出力された動作履歴である。業務分類ログ31とは、PCログ30に基づいて作成されるログである。ファイル操作ログ32は、学習期間に、PC38に格納されているデータファイルに対して行われた操作(以下、ファイル操作という)に関するログである。メール通信ログ33は、学習期間にPC38が送信したり、受信したりした電子メール(以下、メールという)のパケットヘッダに関するログである。
学習処理部22は、読み込んだ学習データを用いて、汎用フォルダを介して移動したファイル操作に関する情報及び業務名等を関係付けて、その関係付けたデータを学習DB群25に格納する。ここで、汎用フォルダとは、特定の業務と関係付けていないフォルダであって、一時的に使用するものをいう。
学習処理部22は、PCログ(アプリ名、ウィンドウタイトル名、読込ファイルのフォルダパス)と手作業で作成した業務分類ログの対応付けにおいて、読込ファイルの属するフォルダと業務の対応付けを行う。読込ファイルとは、PCにより読み込まれたファイルである。学習処理部22は、読込ファイルの属するフォルダと業務の対応付けの結果、そのファイルに対して、複数の業務が割り付けられる場合に汎用フォルダと認定する。
そして、学習処理部22は、汎用フォルダに属するフォルダ毎のデータに対して、そのデータの前後のファイル操作ログおよびメール通信ログから、移動元がどこであるかの情報を1つ取得する。学習処理部22は、同様に、汎用フォルダに属するフォルダ毎のデータに対して、そのデータの前後のファイル操作ログおよびメール通信ログから、移動先がどこであるかの情報を1つ、または複数取得する。
学習処理部22は、その移動元・移動先の情報を合わせてファイル移動情報とし、フォルダ毎、ファイル移動情報毎に業務名と対応付ける。なお、移動元・移動先の情報は、片方だけを使用してもよい。
学習処理部22は、さらに、フォルダ毎、ファイル移動情報毎にアプリ名・ウィンドウタイトル名からキーワードを抽出して、その抽出したキーワードと業務名と対応付ける。
分類適用部23は、分類適用データ(PCログ30’、ファイル操作ログ32’、メール通信ログ33’)を読み込む。分類適用データ(PCログ30’、ファイル操作ログ32’、メール通信ログ33’)は、学習期間の経過後の一定の期間(分類適用期間)に蓄積されたPCログ、ファイル操作ログ、メール通信ログである。分類適用部23は、分類適用データと、学習DB群25に格納したデータとを照合して、汎用フォルダを介して移動したファイルに対する操作を業務毎に分類する。
分類適用部23は、学習処理で用いたPCログを除く、業務分類を行っていないPCログ30’について、汎用フォルダに属するデータに対して、学習処理と同様にPCログ毎にファイル移動情報を取得する。その取得したファイル移動情報が学習データと一意に一致すれば、分類適用部23は、その取得したファイル移動情報がその学習データに対応付けられた業務であると推測する。
その取得したファイル移動情報が複数の業務と一致する場合は、分類適用部23は、PCログのアプリ名・タイトル名と学習データのアプリ名・タイトル名の類似度を判定し、最も類似度の高い学習データに対応する業務名を取得する。
分類結果出力部24は、日時毎の業務名を業務分類結果表37として出力する。
なお、図2において、PC38と業務分析装置20とは別体であるが、これに限定されず、同一のコンピュータであってもよい。
図3は、PCログの一例を示す。PCログ30(または30’)は、日時毎のPC38の動作に関するログの一部である。PCログ30は、「日時」30a、「アプリ名」30b、「タイトル名」30c、「フォルダパス+ファイル名」30dのデータ項目を含む。
「日時」30aには、ユーザまたはアプリによりファイル操作が行われた日時が格納される。「アプリ名」30bには、ファイル操作を行ったアプリの実行ファイル名が格納され、ユーザによりファイル操作が行われたときには「ファイル操作」が格納される。「タイトル名」30cには、アプリのウィンドウウタイトルが格納される。「フォルダパス+ファイル名」30dには、アプリが読み込んでいるファイルの所在(フォルダパス+ファイル名)が格納される。
図4は、業務分類ログを示す。業務分類ログ31には、学習期間中に得られたPCログ30を用いて、予めユーザが単位時間毎の業務名を設定する。業務分類ログ31は、「日時」31a、「業務名」31bのデータ項目を含む。業務分類ログ31の作成について図5を用いて説明する。
図5は、業務分類ログ31の作成を説明するための図である。PCログ30において、単位時間毎に、その時間におけるログの示す内容に基づく業務名が1つだけ割り当てられる。図5において、説明の便宜上、単位時間は1分単位とするが、これに限定されず、n(nは0より大きい整数)分単位でもよい。このとき、単位時間内に、複数のファイル操作またはアプリの動作を示すログが存在する場合、そのログのうち最も長い時間占有したログの示す内容に基づく業務名が1つだけ割り当てられる。
例えば、図5において、「13:10」の時間帯には、符号301−304で示す4つのログがある。ログ301とログ302の日時の差分より、ログ301は、5秒間、プレゼンテーション用アプリが動作したことを示す。ログ302とログ303の日時の差分より、ログ302は、35秒間、プレゼンテーション用アプリが動作したことを示す。ログ303とログ304の日時の差分より、ログ303は、12秒間、メールソフトが動作したことを示す。ログ304とログ305の日時の差分より、ログ304は、8秒間、ファイル操作が行われたことを示す。これより、「13:10」の時間帯において、最も長い時間を占有したファイル操作またはアプリの動作ログは、符号302で示されるログである。符号302で示されるログの示す業務名が「〇〇事業資料作成」であるとすると、業務分類ログ31の「日時」31a、「業務名」31bにはそれぞれ、「2010/05/04 13:10:05」、「〇〇事業資料作成」が設定される。
業務分類ログ31は人手で作成されるが、コンピュータを用いて自動で作成してもよい。
図6は、ファイル操作ログの一例を示す。ファイル操作ログ32(または32’)は、PC38上で起動しているオペレーティングシステム(OS)により出力される、ファイルの操作に関するイベント名と、フォルダ情報を含むログの一部である。ファイル操作に関するイベント名としては、例えば、Windows(登録商標)OSでのエクスプローラ上での操作で用いられる、ファイルの、生成(FileCreate)、読み取り(FileRead)、コピー(FileCopy)、移動(FileMove)、削除(FileDelete)等がある。
ファイル操作ログ32は、「日時」32a、「イベント名」32b、「アプリ名」32c、「ファイルのフォルダパス+ファイル名」32d、「移動先のフォルダパス+ファイル名」32eのデータ項目を含む。
「日時」32aには、ファイル操作が行われた日時が格納される。「イベント名」32bには、「Filecreate」、「FileMove」、「FileDelete」、「FileCopy」等のファイル操作の内容を示すイベント名が格納される。「アプリ名」32cには、アプリによりそのファイル操作が実行された場合にはそのアプリ名が格納され、ユーザによるファイル操作によりそのファイル操作が実行された場合には「ファイル操作」が格納される。「ファイルのフォルダパス+ファイル名」32dには、ファイル操作を行う前のファイルの所在情報が格納される。「移動先のフォルダパス+ファイル名」32eには、ファイル操作後のファイルの所在情報が格納される。
図7は、メール通信ログ33の一例を示す。メール通信ログ33は、通信ネットワーククを介して送受信したメールのパケットヘッダより得られる通信ログの一部である。メール通信ログ33は、「日時」33a、「種別」33b、「差出人」33c、「宛先」33d、「添付ファイル」33eのデータ項目を含む。
「日時」33aには、メールを送受信した日時が格納される。「種別」33bには、メール受信を示す種別またはメール送信を示す種別が格納される。「差出人」33cには、メールの差出人のメールアドレスが格納される。「宛先」33dには、メールの宛先のメールアドレスが格納される。「添付ファイル」33eには、そのメールに添付されているファイルの名称が格納される。
図8は、業務分類結果表37の一例を示す。業務分類結果表37には、分類適用期間においてPC38をどの業務に用いたかという情報が単位時間単位で出力される。業務分類結果表37は、「日時」37a、「業務名」37bのデータ項目を含む。
図9は、本実施形態における学習処理部22で実行される処理フローを示す。図9では、学習処理部22の全体処理を簡単に説明し、学習処理部22の処理の詳細な説明については後述する。
学習処理部22は、一定期間(学習期間)に得られたPC38に関するログである学習データ(PCログ30、業務分類ログ31、ファイル操作ログ32、メール通信ログ33)を読み込む。
学習処理部22は、その読み込んだ学習データを用いて、PC38内で操作されたファイルのあるフォルダパスと、そのフォルダパスに対応付けられている業務名を学習する(S1)。学習処理部22は、S1の学習の結果、複数の業務と対応付けられているフォルダを汎用フォルダと認定する(S2)。
学習処理部22は、S2で認定した汎用フォルダに関するファイル移動情報を収集及び学習する(S3)。ファイル移動情報とは、タイトルを表示しているアプリが読み込んでいるファイルについて、その読み込みの前後の時刻のPCログ30から取得できるファイルの移動元/移動先の情報である。なお、ファイルの移動元/移動先には、メールの送信元/送信先も含む。学習処理部22は、収集したファイル移動情報とフォルダパス情報及び業務名を関係付けた情報(ファイル移動関係情報)を学習DB群25へ格納する。
さらに、学習処理部22は、ファイル移動情報別のアプリ・タイトルのキーワードを学習する(S4)。アプリ・タイトルのキーワードとは、アプリ名及びタイトル名を品詞に分解し、名詞等の一定の品詞をキーワードとして抽出した語である。学習処理部22は、ファイル移動情報と、キーワードとを関係付けた情報(キーワード関係情報)を学習DB群25へ格納する。
図10は、本実施形態における分類適用部23で実行される処理フローを示す。図10では、分類適用部23の全体処理を簡単に説明し、分類適用部23の処理の詳細な説明は後述する。
分類適用部23は、学習期間経過後の一定期間に得られた分類適用データ(PCログ30’、ファイル操作ログ32’、メール通信ログ33’)を読み込む。分類適用部23は、PCログ30’から、単位時間毎に操作されたアプリ等に関する情報を取得する。分類適用部23は、読み込んだ分類適用データから、アプリ等により操作されたファイルが格納されているフォルダが汎用フォルダであるかの判定を行う(S11)。
S11においてそのフォルダが汎用フォルダであると判定した場合、分類適用部23は、分類適用データから、その汎用フォルダを移動元/移動先(受信元/送信先も含む)とするファイル移動情報を収集する(S12)。
それから、分類適用部23は、ファイル移動情報による業務分類を行う(S13)。ここでは、分類適用部23は、図9において学習したファイル移動関係情報から、S12で収集した分類適用対象となるファイル移動情報と完全一致または一部一致するファイル移動関係情報を抽出する。分類適用部23は、その抽出したファイル移動関係情報に含まれる業務名を取得する。
S13において、業務名が複数取得された場合(S14で「Yes」)、分類適用部23は、ファイル移動情報別のアプリ・タイトルのキーワードによる業務分類を行う(S15)。分類適用部23は、S13で抽出されたファイル移動情報のアプリ・タイトルのキーワードと、学習データDB群35へ格納したアプリ・タイトルを比較する。分類適用部23は、S13で抽出したファイル移動情報のアプリ・タイトルのキーワードのうち、類似度の最も高いアプリ・タイトルを有するファイル移動情報を取得し、そのファイル移動情報に関係付けられている業務名を取得する。
分類結果出力部24は、S13またはS15で取得された業務名を、単位時間毎に表示した業務分類結果表37を出力する(S16)。
以下に、より詳細な実施の形態を説明する。
図11は、業務分析装置20における学習処理部22及び学習DB群25を示す。学習処理部22は、集計部41、汎用フォルダ抽出部42、ファイル移動分析部43を含む。学習DB群25には、集計DB51、フォルダ対応業務DB52、汎用フォルダDB53、ファイル移動関係DB54、キーワード関係DB55が含まれる。
業務分析装置20は、学習データ(PCログ30、業務分類ログ31、ファイル操作ログ32、メール通信ログ33)を読み込む。
集計部41は、読み込まれたPCログ30、業務分類ログ31を用いて、単位時間毎の業務名、アプリ名、タイトル名、フォルダパス+ファイル名等を集計した集計情報を生成し、集計DB51へ格納する。
汎用フォルダ抽出部42は、読み込まれたPCログ30、業務分類ログ31を用いて、固有の業務と対応付けられるフォルダについての情報(フォルダ対応業務情報)を作成し、フォルダ対応業務DB52へ格納する。さらに、汎用フォルダ抽出部42は、フォルダ対応業務DB52に格納されたフォルダ対応業務情報のうち、複数の業務と対応付けられているフォルダを抽出し、そのフォルダのフォルダパスを汎用フォルダDB53へ格納する。
ファイル移動分析部43は、読み込まれたファイル操作ログ32、メール通信ログ33を用いて、汎用フォルダへ格納されたファイルの移動元及び汎用フォルダから移動したファイルの移動先について分析する。ファイル移動情報分析部41は、分析の結果得られたファイル移動情報、業務名、フォルダパスと関係付けた情報(ファイル移動関係情報)をファイル移動関係DB54に格納する。さらに、ファイル移動分析部43は、ファイルのアプリ名及びファイル名から抽出したキーワードと、ファイル移動情報と、業務名とを関係付けた情報(キーワード関係情報)をキーワード関係DB55に格納する。
図12は、集計DB51の一例を示す。集計DB51は、「日時」51a、「アプリ名」51b、「タイトル名」51c、「フォルダパス+ファイル名」51d、「業務名」51eのデータ項目を含む。
図13は、フォルダ対応業務DB52の一例を示す。フォルダ対応業務DB52は、「フォルダパス」52a、「業務名」52bのデータ項目を含む。「フォルダパス」52aには、フォルダパスが格納される。「業務名」52bには、業務名が格納される。
図14は、汎用フォルダDB53の一例を示す。汎用フォルダDB53は、「フォルダパス」53aのデータ項目を含む。汎用フォルダ抽出部42は、フォルダ対応業務DB52において、複数の業務が割り当てられているフォルダを汎用フォルダと認定する。汎用フォルダ抽出部42は、汎用フォルダDB53に、その汎用フォルダと認定したフォルダのフォルダパスを格納する。
図15は、ファイル移動関係DB54の一例を示す。ファイル移動関係DB54には、汎用フォルダの所在、ファイル移動情報及び業務名が格納される。ファイル移動関係DB54は、「フォルダパス」、1組の移動元情報(種別、引数)、N(Nは0以上の整数)組の移動先情報(種別、引数)、「業務名」のデータ項目を含む。図15の場合、ファイル移動関係DB54は、「フォルダパス」54a、「移動元種別」54b、「移動元引数」54c、「移動先種別1」54d、「移動先引数1」54e、「移動先種別2」54f、「移動先引数2」54g、「業務名」54hのデータ項目を含む。
「フォルダパス」54aには、汎用フォルダの所在(フォルダパス)が格納される。
「移動元種別」54bには、汎用フォルダ内にファイルを入れたときの操作に由来する種別が格納される。例えば、受信したメールに添付されていたファイルがその汎用フォルダに保存された場合、「移動元種別」54bには、「メール受信」が格納される。例えば、ファイル操作によりファイルがその汎用フォルダに移動させられた場合、「移動元種別」54bには、「FileMove」が格納される。
「移動元引数」54cには、ファイルの移動元の所在情報が格納される。移動元種別がメール受信の場合には、「移動元引数」54cには、例えば、送信元のメールアドレスが格納される。
「移動先種別1」54d、「移動先種別2」54fには、汎用フォルダからファイルを移動させたときの操作に由来する種別が格納される。例えば、汎用フォルダに保存されたファイルをメールに添付して送信した場合、「移動先種別1」54dまたは「移動先種別2」54fには、「メール送信」が格納される。例えば、ファイル操作によりファイルがその汎用フォルダに移動させられた場合、「移動元種別」54bには、「FileMove」が格納される。
「移動先引数1」54e、「移動先引数2」54gにはそれぞれ、「移動先種別1」54d、「移動先種別2」54fに対応する、ファイルの移動先の所在情報が格納される。移動元種別がメール送信の場合には、「移動先引数1」54e、「移動先引数2」54gには、例えば、送信先のメールアドレスが格納される。
なお、移動元種別、移動先種別には、他にも、ファイルが新規に作成された場合には、「FileCreate」、ファイルがコピーされた場合には「FileCopy」が格納される。
また、「移動先引数n」及び「移動先引数n」の対は、図15では2対であるが、これに限定されず、1対でも、3対以上でもよい。
「業務名」54hには、業務名が格納される。
図16は、キーワード関係DB55の一例を示す。キーワード関係DB55は、「業務名」55a、「移動元種別」55b、「移動元引数」55c、「移動先種別1」55d、「移動先引数1」55e、「移動先種別2」55f、「移動先引数2」55g、「キーワード」55hのデータ項目を含む。
「業務名」55a、「移動元種別」55b、「移動元引数」55c、「移動先種別1」55d、「移動先引数1」55e、「移動先種別2」55f、「移動先引数2」55g、には、ファイル移動関係DB54のデータ項目54h,54b〜54gが格納される。
「キーワード」55hには、そのファイルのアプリ名及びタイトル名が品詞単位に分解されて、そのうち、例えば、名詞、動詞、形容詞等が抽出されてキーワードとして格納される。
図17は、業務分析装置20における分類適用部23及び学習DB群25を示す。分類適用部22は、ファイル移動分析部61、業務推定部62、類似度判定部63を含む。学習DB群25には、図11で説明したように、汎用フォルダDB53、ファイル移動関係DB54、キーワード関係DB55が含まれる。
業務分析装置20は、分類適用データ(PCログ30’、ファイル操作ログ32’、メール通信ログ33’)を読み込む。
ファイル移動分析部61は、読み込まれたPCログ30’、ファイル操作ログ32’、メール通信ログ33’と、汎用ファイルDB53を用いて、汎用フォルダへ格納されたファイルの移動元及び汎用フォルダから移動したファイルの移動先について分析する。その分析の結果、分類適用データについてのファイル移動情報が得られる。
業務推定部62は、ファイル移動関係DB54から、分析の結果得られた分類適用対象のファイル移動情報と一致(完全一致及び一部一致を含む)するファイル移動情報を抽出する。業務推定部62は、ファイル移動関係DB54から、その抽出したファイル移動情報に対応する業務名を取得する。
業務推定部62において、複数のファイル移動関係情報が抽出されることにより、複数の業務名が取得された場合、類似度判定部63は、次の処理を行う。すなわち、類似度判定部63は、分類適用データについてのアプリ名及びウィンドウタイトルと、学習データについてのアプリ名及びウィンドウタイトルとの類似度を算出し、その類似度に応じて業務名を判定する。具体的には、類似度判定部63は、キーワード関係DB55から、業務推定部62で抽出されたファイル移動情報に対応するキーワード関係情報を抽出する。類似度判定部63は、その抽出したキーワード関係情報のアプリ・タイトルのキーワード群と、分類適用対象のファイル移動情報のアプリ・タイトルのキーワード群を比較する。比較の結果、類似度判定部63は、その抽出したキーワード関係情報のうち、分類適用対象のファイル移動情報のアプリ・タイトルのキーワード群と合致率の最も高いキーワード群を有するキーワード関係情報を取得する。類似度判定部63は、その取得したキーワード関係情報に含まれる業務名を取得する。
分類結果出力部24は、業務推定部62または類似度判定部63で取得された単位時間毎の業務名を出力する。
以下では、図18−図24のフローチャートと、図25−図42を用いて、より具体的に本実施形態の処理を説明する。
図18は、本実施形態における全体処理のフローを示す。初期化部21は、学習DB群25の全DBを初期化する(S21)。
学習処理部22は、PCログ30上でのメールソフトのアプリ名を特定する(S22)。具体的には、PCログ上でのメールソフトのアプリ名をユーザが予め指定し、学習処理部22は、その指定されたアプリ名を、PCログ上でのメールソフトウェアのアプリ名として認識してもよい。または、設定ファイルに予めメールソフトウェアのアプリ名を設定しておき、学習処理部22は、その設定ファイルからメールソフトウェアのアプリ名を読み出して、PCログ上でのメールソフトウェアのアプリ名を特定してもよい。
学習処理部22は、学習データ(PCログ30、業務分類ログ31、ファイル操作ログ32、メール通信ログ33)を読み込む。学習処理部22は、その学習データを用いて、単位時間毎の業務名等の特定、汎用フォルダの認定、及び汎用フォルダに関するファイル移動情報の収集を行う(学習処理)(S23)。
分類適用部23は、分類適用データを用いて、単位時間毎の業務名等を特定し、汎用フォルダに関するファイル移動情報を取得する。分類適用部23は、ファイル移動関係DB54からその取得したファイル移動情報と一致または一部一致するファイル移動情報に対応する業務名を取得して、業務分類を行う(分類適用処理)(S24)。
分類結果出力部24は、分類適用処理により得られた時間帯毎の業務名に基づいて、業務分類結果を出力する(S25)。
図19は、学習処理(S23)の詳細を示す。学習処理部22は、学習データ(PCログ30、業務分類ログ31、ファイル操作ログ32、メール通信ログ33)を取得する(S31)。本実施例では、学習処理部22は、図25に示すPCログ30、図26に示す業務分類ログ31、図31に示すファイル操作ログ32、図32に示すメール通信ログ33を読み込むものとする。ここで、学習データは、入力装置や可搬型記憶媒体によって入力されてもよいし、ネットワークを介して取得されてもよいし、業務分析装置20に設けられた記憶装置より取得されてもよい。
S31で取得したPCログ30について未処理のPCログ30が残っている場合、学習処理部22は、未処理のPCログ30のうち最も古い未処理のPCログ30を単位時間単位で取得する(S32,S33)。
学習処理部22は、S31で取得した業務分類ログ31のうち、S33で取得したPCログ30と同じ日付の業務分類ログ31を取得する(S34)。例えば、学習処理部22は、図26に示す業務分類ログ31を取得する。
学習処理部22は、業務分類ログ31から、取得したPCログの単位時間の時間帯に対応する時間帯の業務分類ログを取得する(S35)。例えば、S33で取得されたPCログが図25の枠72で囲んだログ(「2010/05/04 13:10:00」、「2010/05/04 13:10:05」、「2010/05/04 13:10:40」、及び「2010/05/04 13:10:52」のログ)であるとする。この場合、図26から、取得したPCログの単位時間の時間帯に対応する時間帯の業務分類ログとして、「2010/05/04 13:10 ○○事業資料作成」が得られる。
学習処理部22は、S33で取得したログから、その時間帯で最も長い時間使用されたアプリのログを抽出する。学習処理部22は、その抽出したログからアプリ名、タイトル名、フォルダパス、ファイル名を取得する(S36)。上記の例で取得したログによれば、「2010/05/04 13:10:00」のログの示すアプリの操作時間は5秒である。「2010/05/04 13:10:05」のログの示すアプリの操作時間は35秒である。「2010/05/04 13:10:40」のログの示すアプリの操作時間は12秒である。「2010/05/04 13:10:52」のログの示すファイル操作時間は8秒である。したがって、「2010/05/04 13:10」の時間帯で最も長く使用されたのは、「2010/05/04 13:10:05」のログ(71)の示すアプリであるから、ログ(71)からアプリ名、タイトル名、フォルダパス、ファイル名が取得される。
学習処理部22は、図27に示すように、S36で取得したアプリ名・タイトル名・フォルダパス・ファイル名と、S35で用いた業務分類ログの日時とその日時に対応する業務名とを組にした情報(集計情報)を集計DB51に保存する(S37)。
また、学習処理部22は、図28に示すように、S36で取得したフォルダパスと、S37で用いた業務分類ログ31の業務名とを組にしてフォルダ対応業務DB52に保存する(S38)。
フォルダ対応業務DB52のデータ項目「フォルダパス」について、同一のフォルダパスに、複数の業務名が対応付けられる場合は、図29に示すように、学習処理部22は、そのフォルダパスを汎用フォルダDB53に保存する(S39)。
未処理のPCログ30が残っている間、学習処理部22は、S33−S39を繰り返す。S31で取得したPCログ30全てについてS33−S39の処理が終了すると(S32で「No」)、学習処理部22は、汎用フォルダを介して移動したファイルのログについてファイル移動情報を分析する(S40)。S40については、図20を用いて説明する。
図20は、汎用フォルダを介して移動したファイルのログに関するファイル移動情報の分析フローを示す。学習処理部22は、学習処理部22は、未処理の集計情報が残っている間(S41で「Yes」)、未処理の集計情報のうち最も古い集計情報から「日時」、「アプリ名」、「タイトル名」、「フォルダパス」、「ファイル名」、「業務名」を取得する(S42)。
学習処理部22は、S42で取得した「フォルダパス」が汎用フォルダDB53に含まれているかを判定し、汎用フォルダに含まれているフォルダパスを有する集計情報を取得する(S43で「Yes」)。図30は、汎用フォルダに含まれるフォルダパスを有する集計情報のみ抽出した集計DB51の一例を示す。学習処理部22は、S42で取得した集計情報と同じ日付のファイル操作ログ32(図31)、及びメール通信ログ33(図32)を取得する(S44)。
学習処理部22は、学習・分類適用共通のファイル移動情報分析処理を行ってファイル移動情報を取得する(S45)。S45の処理については、図21、図22及び図33を用いて説明する。
図21及び図22は、学習・分類適用共通のファイル移動情報分析処理(S45,S77)のフローの一例を示す。図21及び図22の処理では、学習処理部22は、集計DB51から取得した集計情報とフォルダパスや添付ファイルにおいて共通する、最も近い日時のファイル操作ログ、メール通信ログを取得する。そして、学習処理部22は、その取得したファイル操作ログ及びメール通信ログを用いて、ファイル移動情報を生成する。
学習処理部22は、ファイル操作ログ32から、処理対象の集計情報の日時より前で最も近い日時のイベント(FileCreate、FileMove、FileCopy)のログを取得する(S51)。例えば、図33(A)に示すように、処理対象の集計情報の日時が「2010/05/04 13:41」であるとする。なお、その日時の秒については、「00秒」として取り扱うがこれに限定されない。この場合、学習処理部22は、図33(B)に示すように、ファイル操作ログ32からその日時「2010/05/04 13:41:00」より前で最も近い日時「2010/05/04 13:40:30」のログを取得する。
S51で取得したファイル操作ログ32のアプリ名がメールソフトの場合(S52で「Yes」)、学習処理部22は、次の処理を行う。すなわち、学習処理部22は、メール通信ログ33から、S51で取得したファイル操作ログ32と同じファイルを添付し、かつそのファイル操作ログ32の日時「2010/05/04 13:40:30」より前で最も近い日時のログを取得する(S53)。図33(B)において、ファイル操作ログ32の「2010/05/04 13:40:30」のログのアプリ名は「メールソフト」である。この場合、学習処理部22は、図33(C)に示すように、メール通信ログ33から、S51で取得したファイル操作ログ32と同じファイル(AA事業仕様検討ファイル)を添付し、かつそのファイル操作ログ32の日時「2010/05/04 13:40:30」より前で最も近い日時「2010/05/04 13:30:20」のログを取得する。
学習処理部22は、S53で取得したメール通信ログから「差出人」名を取得し、ファイル移動情報におけるメール受信のファイル移動元情報とする(S54)。図33(D)の場合、学習処理部22は、メール通信ログ33から取得された「2010/05/04 13:30:20」のログから、種別「メール受信」、差出人「kacho@example.com」を取得し、それぞれファイル移動情報の移動元種別、移動元引数に設定する。
S52において、S51で取得したファイル操作ログ32のアプリ名がメールソフトでない場合(S52で「No」)、学習処理部22は、その取得したファイル操作ログから「イベント名」、「ファイルのフォルダパス」を取得する。学習処理部22は、その取得した「イベント名」、「ファイルのフォルダパス」をそれぞれ、ファイル移動情報の移動元種別、移動元引数に設定する(S55)。
次に、学習処理部22は、ファイル操作ログ32から、処理対象の集計情報の日時と重なるFileMove、FileCopy、File Deleteのログを順番に全て取得する(S56)。S56で取得した全てのログについて、以下に説明するS58−S61の処理を行う(S57で「Yes」)。
S51で取得したファイル操作ログ32のアプリ名がメールソフトの場合(S58で「Yes」)、学習処理部22は、次の処理を行う。すなわち、学習処理部22は、メール通信ログ33から、S56で取得したファイル操作ログ32と同じファイルを添付し、かつそのファイル操作ログより後で最も近い日時のメールを取得する(S59)。図33(B)の例において、ファイル操作ログ32の「2010/05/04 13:40:30」のログのアプリ名は「メールソフト」である。この場合、学習処理部22は、図33(C)のメール通信ログ33から、S51で取得したファイル操作ログ32と同じファイル(AA事業仕様検討ファイル)を添付し、取得したファイル操作ログ32の「2010/05/04 13:40:30」より後で最も近い日時「2010/05/04 14:20:09」のログを取得する。
学習処理部22は、S59で取得したメール通信ログから「宛先」名を取得し、ファイル移動情報におけるメール受信のファイル移動先情報とする(S60)。図33(D)に示すように、学習処理部22は、メール通信ログ33から取得された「2010/05/04 14:20:09」のログから、種別「メール送信」、宛先「kacho@example.com」を取得し、それぞれファイル移動情報の移動先種別1、移動先引数1に設定する。
S58において、S51で取得したファイル操作ログ32のアプリ名がメールソフトでない場合(S58で「No」)、学習処理部22は、その取得したログに含まれる「イベント名」、「移動先のフォルダパス」を取得する。学習処理部22は、その取得した「イベント名」、「移動先のフォルダパス」をそれぞれ、ファイル移動情報の移動先種別、移動元引数に設定する(S61)。図33(D)に示すように、学習処理部22は、その取得したファイル操作ログ32から、イベント名「FileMove」、移動先のフォルダパス「\\外部フォルダ\AA事業資料\ 」を取得し、それぞれファイル移動情報の移動先種別2、移動先引数2に設定する。
S56で取得した全てのログについて、S58−S61の処理が終了すれば(S57で「No」)、図20の処理へ戻る。これにより、ファイル移動情報(ファイル移動元情報、ファイル移動先情報)が得られる。
学習処理部22は、図34で示すように、S43で汎用フォルダに含まれていると判定された集計情報のフォルダパス及び業務名と、ファイル移動情報とを関係付けてファイル移動関係DB54に保存する(S47)。
学習処理部22は、S43で汎用フォルダに含まれていると判定された集計情報に含まれるアプリ名・タイトル名を品詞単位に分解し、例えば、助詞、助動詞等を除いた品詞(例えば、名詞、動詞、形容詞等)をキーワードとして抽出する。学習処理部22は、図35に示すように、その抽出したキーワードと、S43で汎用フォルダに含まれていると判定された集計情報のフォルダパス及び業務名と、ファイル移動情報とを関係付けて、キーワード関係DB55に保存する(S48)。
S41で取得した全てのデータについてS42−S48の処理が終わるまで、これらの処理を繰り返す。
次に、分類適用処理の詳細について説明する。
図23は、分類適用処理(S23)の詳細を示す。分類適用部23は、分類適用データ(図36に示すPCログ30’、図37に示すファイル操作ログ32’、図38に示すメール通信ログ33’)を日付別に取得する(S71)。ここで、分類適用データは、入力装置や可搬型記憶媒体によって入力されてもよいし、ネットワークを介して取得されてもよいし、業務分析装置20に設けられた記憶装置より取得されもよい。S71で取得したPCログ30について未処理のPCログ30が残っている間(S71で「Yes」)、以下に説明するS73−S81の処理を行う。
分類適用部23は、未処理のPCログ30’から、最も古いログを業務分類の単位時間毎に取得する(S73)。分類適用部23は、取得したPCログ30’のうち、最も長時間使用されたことを示すログのアプリの「日時」「アプリ名」「タイトル名」「フォルダパス+ファイル名」を取得する(S74)。その結果、図39(A)に示すように、「日時」「アプリ名」「タイトル名」「フォルダパス+ファイル名」が取得されるとする。
S74で取得したPCログの「フォルダパス」が汎用フォルダDB53に含まれていない場合(S75で「No」)、S72の処理へ戻る。S74で取得したログの「フォルダパス」が汎用フォルダDB53に含まれている場合(S75で「Yes」)、分類適用部23は、S74で取得したPCログ30’と同じ日付のファイル操作ログ32’、メール通信ログ33’を取得する(S76)。
分類適用部23は、学習・分類適用共通のファイル移動情報分析処理を行ってファイル移動情報を取得する(S77)。S77の処理については、図21、図22を用いて説明した内容と同一なので、省略する。S77のファイル移動情報分析処理により、例えば、図39(B)に示すファイル移動情報が得られたとする。
分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と完全一致または一部一致するファイル移動関係情報を取得し、その取得したファイル移動関係に含まれる「業務名」を取得する(S78)。ここで、S78の処理の判定のバリエーション(第1〜第5のバリエーション)について説明する。条件としては、比較する2つのファイル移動情報の移動元情報および移動先情報の最後の項目は必ず一致する必要がある。
第1のバリエーションとしては、完全一致判定がある。完全一致判定では、分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と移動元情報が一致、かつ移動先情報の全ての項目が順番を含めて一致するファイル移動関係情報を取得する。
第2のバリエーションとしては、組み合わせ(順不同ケース)判定がある。組み合わせ(順不同ケース)判定では、分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と移動元情報が一致、かつ移動先情報の最後の項目が一致するファイル移動関係情報を取得する。この場合、その他の移動先情報の項目は各々一致する項目が全て存在するが順は不同であってよい。
第3のバリエーションとしては、包含関係(内包のケース)判定がある。包含関係(内包のケース)判定では、分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と移動元情報が一致、かつ移動先情報の最後の項目が一致するファイル移動関係情報を取得する。このとき、その他の移動先情報は、学習データの項目全てを分類適用データの項目が含んでいればよい(分類適用データには余分な移動先情報がある)。
第4のバリエーションとしては、割合判定がある。割合判定では、分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と移動元情報が一致、かつ移動先情報の最後の項目が一致するファイル移動関係情報を取得する。このとき、その他の移動先情報は、いくつかの項目のみ一致すればよい。また、一致した項目の割合(一致数/学習データの項目数(N−1))が一定値(例えば50%)以上となるファイル移動関係情報を取得するようにする。
第5のバリエーションとしては、必須条件のみ判定がある。必須条件のみ判定分類適用部23は、ファイル移動関係DB54から、S77で取得したファイル移動情報と移動元情報が一致、かつ移動先情報の最後の項目が一致するファイル移動関係情報を取得する。このとき、その他の移動先情報は一致していなくてもよい。
例えば、ファイル移動関係DB54に、図39(C)に示すようなファイル移動関係情報が格納されているとする。図39(B)のファイル移動情報と、図39(C)のファイル移動関係情報を比較すると、移動元引数が一致し、図39(B)のファイル移動情報の移動先が図39(C)のファイル移動関係情報に含まれる移動先の1つと一致している。この場合、分類適用部23は、図39(C)のファイル移動関係情報に含まれる「業務名」を取得する。
S78において取得された業務名が1つだけの場合、S81の処理へ進む。S78において取得された業務名が2以上の場合、分類適用部23は、分類適応対象データのアプリ名及びタイトル名と、学習データのアプリ名及びタイトル名との類似度を判定し、学習データのうち最も類似する学習データの業務名を取得する。すなわち、分類適用部23は、キーワード群の合致率判定を行って、最もキーワード群の合致率の高いファイル移動関係情報の業務名を取得する(S80)。S80について、図24を用いて説明する。
図24は、キーワードの合致率判定の処理フローの一例である。分類適用部23は、分類適応対象データのアプリ名、タイトル名からキーワードを抽出する(S91)。ここでは、分類適用部23は、分類適応対象データのアプリ名及びタイトル名を品詞毎に分解し、例えば、助詞、助動詞を除いた、名刺、動詞、形容詞等をキーワードとして抽出する。図40の例では、アプリ名「プレゼンテーション」及びタイトル名「×〇プロジェクト他者調査のプレゼンテーション」が品詞分解されて、キーワードとして「×〇プロジェクト」、「他者」、「調査」、「プレゼンテーション」が抽出されている。
次に、分類適用部23は、分類適応対象データのフォルダパスとファイル移動情報を取得する(S92)。それから、分類適用部23は、キーワード関係DB55の各行について、分類適応対象データとフォルダパスが一致し、かつ分類適応対象データとファイル移動情報が完全一致または一部一致する行のキーワードを取得する(S93)。すると、図41に示すように、行R1,R2が取得されたとする。
分類適用部23は、S93でキーワード関係DB55から取得した各行のキーワード群と、分類適応対応データのキーワード群の合致度を比較する(S94)。分類適用部23は、分類適応対応データのキーワード群と、最も合致率の高かったキーワード群を含む行の業務名を取得する(S95)。S94,S95について以下に説明する。
図42に示すように、行R1のキーワード群は、「×〇プロジェクト」、「懸案」、「事項」、「プレゼンテーション」の4つである。分類適用データのキーワード群と行R1のキーワード群を比較すると、行R1の4つのキーワードのうち、「×〇プロジェクト」、「プレゼンテーション」の2つが合致する。この場合、合致率は、(2/4)×100=50%となる。
また、行R2のキーワード群は、「BB」、「定義書」、「プレゼンテーション」の3つである。分類適用データのキーワード群と行R2のキーワード群を比較すると、行R2の3つのキーワードのうち、「プレゼンテーション」の1つが合致する。この場合、合致率は、(1/3)×100≒33%となる。この場合、より合致率の高い行は行R1であるから、分類適用部23は、行R1の業務名「AA事業対応」を取得する。これにより、図24のフローは終了し、図23のフローへ戻る。
図24において、業務名を取得後(S79で「Yes」、またはS80の処理後)、分類適用部23は、その取得した業務名を、S73で単位時間毎に切り出した区間における業務として決定する(S81)。PCログ30’の全てについてS73−S81の処理が終了すれば(S72で「No」)、分類的処理は終了する。
その後、分類結果出力部24は、図8で説明したように、S81で得られた単位時間毎に切り出した区間における業務を業務分類結果表として出力する。
図43は、業務分析装置20のハードウェア環境の構成ブロック図である。業務分析装置20は、CPU102、ROM103、RAM106、通信I/F104、記憶装置107、出力I/F101、入力I/F105、読み取り装置108、バス109、出力機器111、入力機器112によって構成されている。
ここで、CPUは、中央演算装置を示す。ROMは、リードオンリメモリを示す。RAMは、ランダムアクセスメモリを示す。I/Fは、通信インターフェースを示す。バス109には、CPU102、ROM103、RAM106、通信I/F104、記憶装置107、出力I/F101、入力I/F105、及び読み取り装置108が接続されている。読み取り装置108は、可搬型記録媒体を読み出す装置である。出力機器111は、出力I/F101に接続されている。入力機器112は、入力I/F105に接続にされている。
記憶装置107としては、ハードディスク、フラッシュメモリ、磁気ディスクなど様々な形式の記憶装置を使用することができる。記憶装置107またはROM103には、CPU102を初期化部21、学習処理部22、分類適応部23、分類結果出力部24として機能させるプログラムが格納されている。
また、記憶装置107またはROM103には、学習DB群25(集計DB51,フォルダ対応業務DB52、汎用フォルダDB53、ファイル移動関係DB54、キーワード関係DB55)が格納されている。
CPU102は、記憶装置107等に格納した上記実施形態で説明した処理を実現するプログラムを読み出し、当該プログラムを実行する。
上記実施形態で説明した処理を実現するプログラムは、プログラム提供者側から通信ネットワーク110、および通信I/F104を介して、例えば記憶装置107に格納してもよい。また、上記実施形態で説明した処理を実現するプログラムは、市販され、流通している可搬型記憶媒体に格納されていてもよい。この場合、この可搬型記憶媒体は読み取り装置108にセットされて、CPU102によってそのプログラムが読み出されて、実行されてもよい。可搬型記憶媒体としてはCD−ROM、フレキシブルディスク、光ディスク、光磁気ディスク、ICカード、USBメモリ装置など様々な形式の記憶媒体を使用することができる。このような記憶媒体に格納されたプログラムが読み取り装置108によって読み取られる。
また、入力機器112には、キーボード、マウス、電子カメラ、ウェブカメラ、マイク、スキャナ、センサ、タブレットなどを用いることが可能である。また、出力機器111には、ディスプレイ、プリンタ、スピーカなどを用いることが可能である。また、ネットワーク110は、インターネット、LAN、WAN、専用線、有線、無線等の通信網であってよい。
また、業務分析装置20による分類適応処理の対象となるPCログ、ファイル操作ログ、及びメール通信ログを出力するPC38も、業務分析装置20と同様のハードウェア構成を有する。
本実施形態によれば、汎用フォルダのファイルについてのファイル移動情報とそれに対応する業務とを学習し、その学習結果から、分類適用対象のファイル移動情報と類似するファイル移動情報に対応する業務を取得する、これにより、分類適用対象のファイル操作ログの業務を分類することができる。
なお、本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。
上記実施形態に関し、更に以下の付記を開示する。
(付記1)
一時的にファイルが格納される一時的格納場所の所在情報が格納される所在情報格納部と、
前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含むファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部と、
コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含むコンピュータログと、前記ファイルに対する操作履歴を示すファイル操作ログとを取得する取得部と、
前記所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定する判定部と、
前記所在情報が前記一時的格納場所を示すと判定された場合、前記コンピュータログと前記ファイル操作ログとを用いて、該コンピュータログの示すファイルについて、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析する移動分析部と、
前記移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する業務推定部と、
を備えることを特徴とする業務分析装置。
(付記2)
前記業務分析装置は、さらに
前記コンピュータログを単位時間毎に区分けし、該区分けした時間帯において最も長時間前記コンピュータが操作されたことを示す前記コンピュータログから、該時間帯におけるソフトウェアによって操作された処理対象となるファイルの所在情報を少なくとも含む処理対象情報を生成する処理対象情報生成部
を備えることを特徴とする付記1に記載の業務分析装置。
(付記3)
前記取得部は、電子メールの送受信履歴を示す通信ログを併せて取得し、
前記移動分析部は、
前記ファイル操作ログから、前記処理対象情報の時間帯に属する所定の日時より前で該日時に最も近い日時の第1のファイル操作ログを取得し、
前記第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第1のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第1のファイル操作ログの日時より前で該日時に最も近い送受信日時の電子メールについての第1の通信ログを取得し、該第1の通信ログの送信元を、該ファイルの移動元として前記ファイル移動情報に設定し、該第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、該第1のファイル操作ログからファイルの移動元を取得して前記ファイル移動情報に設定し、
前記ファイル操作ログから、前記処理対象情報の時間帯に属する所定の時間帯と重なる第2のファイル操作ログを取得し、
前記第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第2のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第2のファイル操作ログの日時より後で該日時に最も近い送受信日時の電子メールについての第2の通信ログを取得し、該第2の通信ログの送信先を、該ファイルの移動先として前記ファイル移動情報に設定し、該第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、前記第2のファイル操作ログからファイルの移動先を取得して前記ファイル移動情報に設定する
を備えることを特徴とする付記2に記載の業務分析装置。
(付記4)
前記業務分析装置は、さらに、
前記検索された業務名が複数ある場合、前記第1のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名と、前記第2のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名の類似度に応じて、該第2のファイル移動情報に対応する業務名を第1のファイル移動情報に対応する業務と判定する類似度判定部と、
を備えることを特徴とする付記1〜3のうちいずれか1項に記載の業務分析装置。
(付記5)
前記業務分析装置は、さらに、
前記移動関係業務格納部に格納されたファイル移動情報が示すファイルを操作したソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群と、前記業務名とが関係付けられて格納された語句関係業務格納部を備え、
前記類似度判定部は、前記分析した業務名が複数ある場合、前記語句関係業務格納部に格納された1以上の組の語句群と、前記処理対象情報に含まれる前記ソフトウェア名及び前記ウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群のそれぞれとの一致率を算出し、該語句関係業務格納部から、最も一致率の高い語句群の組に対応する業務名を検索する
ことを特徴とする付記4に記載の業務分析装置。
(付記6)
前記取得部は、前記過去のコンピュータログと、単位時間で区分けされ時間帯毎の業務名が設定された業務分類ログを取得し、
前記業務分析装置は、さらに、
前記過去のコンピュータログを単位時間毎に読み取り、該読み取った単位時間で示される時間帯において最も長時間前記コンピュータが操作されたことを示す該コンピュータログから、該時間帯におけるソフトウェアによって操作されたファイルの所在情報を少なくとも含むファイル関係情報を生成し、前記業務分類ログから、該ファイルの前記時間帯に対応する業務名を取得し、該取得したファイル情報と業務名と関係付けてファイル関係業務情報を生成し、前記ファイル関係業務情報に含まれるファイルの所在情報のうち、同一の所在情報が2以上の異なる業務名と関係付けられているかを判定し、同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報を前記所在情報格納部に格納する所在情報登録部、
を備えることを特徴とする付記1〜5のうちいずれか1項に記載の業務分析装置。
(付記7)
前記取得部は、前記過去のコンピュータログに対応する過去のファイル操作ログ及び過去の通信ログを取得し、
前記業務分析装置は、さらに、
同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報についてのファイル関係業務情報と、前記過去のファイル操作ログと、前記過去の通信ログとを用いて、該ファイル関係業務情報の示すファイルについての前記ファイル移動情報を生成し、該ファイル移動情報の生成で用いた該ファイル関係業務情報に含まれる業務名と、該生成したファイル移動情報とを関係付けて、前記移動関係業務格納部へ格納する移動関係業務登録部
を備えることを特徴とする付記6に記載の業務分析装置。
(付記8)
前記業務分析装置は、さらに、
前記推定した業務名と、前記ファイル移動情報の生成で用いた前記処理対象情報に対応する前記コンピュータログの日時とを出力する出力部と、
を備えることを特徴とする請求項1〜7のうちいずれか1項に記載の業務分析装置。
(付記9)
コンピュータに、
コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含むコンピュータログと、前記ファイルに対する操作履歴を示すファイル操作ログとを取得し、
前記一時的格納場所の所在情報が格納される所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定し、
前記所在情報が前記一時的格納場所を示すと判定された場合、前記コンピュータログと前記ファイル操作ログとを用いて、該コンピュータログの示すファイルについて、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析し、
一時的にファイルが格納される一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含む該ファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する、
処理を実行させる業務分析プログラム。
(付記10)
前記コンピュータに、さらに
前記コンピュータログを単位時間毎に区分けし、該区分けした時間帯において最も長時間前記コンピュータが操作されたことを示す前記コンピュータログから、該時間帯におけるソフトウェアによって操作された処理対象となるファイルの所在情報を少なくとも含む処理対象情報を生成する
処理を実行させる付記9に記載の業務分析プログラム。
(付記11)
前記ファイル移動情報の分析において、前記コンピュータに、
電子メールの送受信履歴を示す通信ログを併せて取得し、
前記ファイル操作ログから、前記処理対象情報の時間帯に属する所定の日時より前で該日時に最も近い日時の第1のファイル操作ログを取得し、
前記第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第1のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第1のファイル操作ログの日時より前で該日時に最も近い送受信日時の電子メールについての第1の通信ログを取得し、該第1の通信ログの送信元を、該ファイルの移動元として前記ファイル移動情報に設定し、該第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、該第1のファイル操作ログからファイルの移動元を取得して前記ファイル移動情報に設定し、
前記ファイル操作ログから、前記処理対象情報の時間帯に属する所定の時間帯と重なる第2のファイル操作ログを取得し、
前記第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第2のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第2のファイル操作ログの日時より後で該日時に最も近い送受信日時の電子メールについての第2の通信ログを取得し、該第2の通信ログの送信先を、該ファイルの移動先として前記ファイル移動情報に設定し、該第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、前記第2のファイル操作ログからファイルの移動先を取得して前記ファイル移動情報に設定する
処理を実行させる付記10に記載の業務分析プログラム。
(付記12)
前記コンピュータに、さらに、
前記検索された業務名が複数ある場合、前記第1のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名と、前記第2のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名の類似度に応じて、該第2のファイル移動情報に対応する業務名を第1のファイル移動情報に対応する業務と判定する、
処理を実行させる付記9〜11のうちいずれか1項に記載の業務分析プログラム。
(付記13)
前記コンピュータに、
前記分析した業務名が複数ある場合、前記移動関係業務格納部に格納されているファイル移動情報が示すファイルを操作したソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群と、前記業務名とが関係付けられて格納されている語句関係業務格納部に格納された1以上の組の語句群と、前記処理対象情報に含まれる前記ソフトウェア名及び前記ウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群のそれぞれとの一致率を算出し、該語句関係業務格納部から、最も一致率の高い語句群の組に対応する業務名を検索する
処理を実行させる付記12に記載の業務分析プログラム。
(付記14)
前記コンピュータに、
前記過去のコンピュータログと、単位時間で区分けされ時間帯毎の業務名が設定された業務分類ログを取得し、
前記過去のコンピュータログを単位時間毎に読み取り、該読み取った単位時間で示される時間帯において最も長時間前記コンピュータが操作されたことを示す該コンピュータログから、該時間帯におけるソフトウェアによって操作されたファイルの所在情報を少なくとも含むファイル関係情報を生成し、前記業務分類ログから、該ファイルの前記時間帯に対応する業務名を取得し、該取得したファイル情報と業務名と関係付けてファイル関係業務情報を生成し、前記ファイル関係業務情報に含まれるファイルの所在情報のうち、同一の所在情報が2以上の異なる業務名と関係付けられているかを判定し、同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報を前記所在情報格納部に格納する
処理を実行させる付記9〜13のうちいずれか1項に記載の業務分析プログラム。
(付記15)
前記コンピュータに、
前記過去のコンピュータログに対応する過去のファイル操作ログ及び過去の通信ログを取得し、
同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報についてのファイル関係業務情報と、前記過去のファイル操作ログと、前記過去の通信ログとを用いて、該ファイル関係業務情報の示すファイルについての前記ファイル移動情報を生成し、該ファイル移動情報の生成で用いた該ファイル関係業務情報に含まれる業務名と、該生成したファイル移動情報とを関係付けて、前記移動関係業務格納部へ格納する
処理を実行させる付記14に記載の業務分析プログラム。
(付記16)
前記コンピュータに、さらに、
前記推定した業務名と、前記ファイル移動情報の生成で用いた前記処理対象情報に対応する前記コンピュータログの日時とを出力する
処理を実行させる付記9〜15のうちいずれか1項に記載の業務分析プログラム。
(付記17)
コンピュータにより実行される業務分析方法であって、
前記コンピュータは、
コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含むコンピュータログと、前記ファイルに対する操作履歴を示すファイル操作ログとを取得し、
前記一時的格納場所の所在情報が格納される所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定し、
前記所在情報が前記一時的格納場所を示すと判定された場合、前記コンピュータログと前記ファイル操作ログとを用いて、該コンピュータログの示すファイルについて、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析し、
一時的にファイルが格納される一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含む該ファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する、
処理を実行する業務分析方法。
(付記18)
前記コンピュータは、さらに
前記コンピュータログを単位時間毎に区分けし、該区分けした時間帯において最も長時間前記コンピュータが操作されたことを示す前記コンピュータログから、該時間帯におけるソフトウェアによって操作された処理対象となるファイルの所在情報を少なくとも含む処理対象情報を生成する
処理を実行する付記17に記載の業務分析方法。
(付記19)
前記コンピュータは、さらに、
前記検索された業務名が複数ある場合、前記第1のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名と、前記第2のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名の類似度に応じて、該第2のファイル移動情報に対応する業務名を第1のファイル移動情報に対応する業務と判定する、
処理を実行する付記17又は18に記載の業務分析方法。
(付記20)
前記コンピュータは、
前記過去のコンピュータログと、単位時間で区分けされ時間帯毎の業務名が設定された業務分類ログを取得し、
前記過去のコンピュータログを単位時間毎に読み取り、該読み取った単位時間で示される時間帯において最も長時間前記コンピュータが操作されたことを示す該コンピュータログから、該時間帯におけるソフトウェアによって操作されたファイルの所在情報を少なくとも含むファイル関係情報を生成し、前記業務分類ログから、該ファイルの前記時間帯に対応する業務名を取得し、該取得したファイル情報と業務名と関係付けてファイル関係業務情報を生成し、前記ファイル関係業務情報に含まれるファイルの所在情報のうち、同一の所在情報が2以上の異なる業務名と関係付けられているかを判定し、同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報を前記所在情報格納部に格納する
処理を実行する付記17〜19のうちいずれか1項に記載の業務分析方法。
1 業務分析装置
2 取得部
3 判定部
4 移動分析部
5 業務推定部
6 出力部
7 処理対象情報生成部
8 類似度判定部
9 所在情報登録部
10 移動情報業務登録部
11 所在情報格納部
12 移動関係業務格納部
13 語句関係業務格納部
20 業務分析装置
21 初期化部
22 学習処理部
23 分類適用部
24 分類結果出力部
25 学習DB群
30,30’ PCログ
31 業務分類ログ
32,32’ ファイル操作ログ
33,33’ メール通信ログ
37 業務分類結果表
41 集計部
42 汎用フォルダ抽出部
43 ファイル移動分析部
51 集計DB
52 フォルダ対応業務DB
53 汎用フォルダDB
54 ファイル移動関係DB
55 キーワード関係DB
61 ファイル移動分析部
62 業務推定部
63 類似度判定部

Claims (10)

  1. 一時的にファイルが格納される一時的格納場所の所在情報が格納される所在情報格納部と、
    前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含むファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部と、
    コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含む時刻毎に記録されたコンピュータログと、前記ファイルに対する操作及び該操作の前後の該操作されたファイルの所在の履歴を示す時刻毎のファイル操作ログとを取得する取得部と、
    前記所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定する判定部と、
    記一時的格納場所を示す前記所在情報を含む前記コンピュータログの日時に対応する前記ファイル操作ログから、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析する移動分析部と、
    前記移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する業務推定部と、
    を備えることを特徴とする業務分析装置。
  2. 前記業務分析装置は、さらに
    前記コンピュータログを単位時間毎に区分けし、該区分けした時間帯において最も長時間前記コンピュータが操作されたことを示す前記コンピュータログから、該時間帯におけるソフトウェアによって操作された処理対象となるファイルの所在情報を少なくとも含む処理対象情報を生成する処理対象情報生成部
    を備えることを特徴とする請求項1に記載の業務分析装置。
  3. 前記取得部は、電子メールの送受信履歴を示す通信ログを併せて取得し、
    前記移動分析部は、
    前記ファイル操作ログから、前記処理対象情報の時間帯より前の日時で該時間帯に最も近い日時の第1のファイル操作ログを取得し、
    前記第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第1のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第1のファイル操作ログの日時より前で該日時に最も近い送受信日時の電子メールについての第1の通信ログを取得し、該第1の通信ログの送信元を、該ファイルの移動元として前記ファイル移動情報に設定し、該第1のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、該第1のファイル操作ログからファイルの移動元を取得して前記ファイル移動情報に設定し、
    前記ファイル操作ログから、前記処理対象情報の時間帯に対応する第2のファイル操作ログを取得し、
    前記第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアである場合、前記通信ログから、該第2のファイル操作ログにより特定されるファイルと同じファイルが添付され、該第2のファイル操作ログの日時より後で該日時に最も近い送受信日時の電子メールについての第2の通信ログを取得し、該第2の通信ログの送信先を、該ファイルの移動先として前記ファイル移動情報に設定し、該第2のファイル操作ログが示すソフトウェアが電子メール送受信用ソフトウェアでない場合、前記第2のファイル操作ログからファイルの移動先を取得して前記ファイル移動情報に設定する
    を備えることを特徴とする請求項2に記載の業務分析装置。
  4. 前記業務分析装置は、さらに、
    前記移動関係業務格納部に格納された前記ファイル移動情報に対応する前記ファイルのファイル移動情報と、前記業務名と、該ファイルの所在情報と、該ファイル移動情報が示すファイルを操作したソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群と、が関連付けられた語句関係業務情報が格納される語句関係業務格納部と、
    前記検索された業務名が複数ある場合、前記語句関係業務格納部から、前記分析の対象のファイルの所在情報と一致し、前記分析の対象のファイルの移動元及び移動先を示すファイル移動情報と一致または一部一致する前記語句関係業務情報を取得し、前記分析の対象のファイル移動情報に対応するコンピュータログ中のソフトウェア名及びウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群と取得した前記語句関係業務情報のそれぞれに含まれる前記語句群との類似度に応じて、前記検索された業務名から前記第1のファイル移動情報に対応する業務判定する類似度判定部と、
    を備えることを特徴とする請求項1〜3のうちいずれか1項に記載の業務分析装置。
  5. 前記業務分析装置は、さらに
    記類似度判定部は、前記分析した業務名が複数ある場合、前記語句関係業務格納部に格納された1以上の組の語句群と、前記分析の対象のファイル移動情報に対応する前記ソフトウェア名及び前記ウィンドウタイトル名を品詞単位に分割して抽出された1以上の語句を含む語句群のそれぞれとの一致率を算出し、該語句関係業務格納部から、最も一致率の高い語句群の組に対応する業務名を検索する
    ことを特徴とする請求項4に記載の業務分析装置。
  6. 前記取得部は、過去のコンピュータログと、単位時間で区分けされ時間帯毎の業務名が設定された業務分類ログを取得し、
    前記業務分析装置は、さらに、
    前記過去のコンピュータログを単位時間毎に読み取り、該読み取った単位時間で示される時間帯において最も長時間前記コンピュータが操作されたことを示す該コンピュータログから、該時間帯におけるソフトウェアによって操作されたファイルの所在情報を少なくとも含むファイル関係情報を生成し、前記業務分類ログから、該ファイルの前記時間帯に対応する業務名を取得し、該取得したファイル情報と業務名と関係付けてファイル関係業務情報を生成し、前記ファイル関係業務情報に含まれるファイルの所在情報のうち、同一の所在情報が2以上の異なる業務名と関係付けられているかを判定し、同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報を前記所在情報格納部に格納する所在情報登録部、
    を備えることを特徴とする請求項1〜5のうちいずれか1項に記載の業務分析装置。
  7. 前記取得部は、前記過去のコンピュータログに対応する過去のファイル操作ログ及び過去の通信ログを取得し、
    前記業務分析装置は、さらに、
    同一の所在情報が2以上の異なる業務名と関係付けられていると判定した場合、該所在情報についてのファイル関係業務情報と、前記過去のファイル操作ログと、前記過去の通信ログとを用いて、該ファイル関係業務情報の示すファイルについての前記ファイル移動情報を生成し、該ファイル移動情報の生成で用いた該ファイル関係業務情報に含まれる業務名と、該生成したファイル移動情報とを関係付けて、前記移動関係業務格納部へ格納する移動関係業務登録部
    を備えることを特徴とする請求項6に記載の業務分析装置。
  8. 前記業務分析装置は、さらに、
    前記推定した業務名と、前記ファイル移動情報の生成で用いた前記処理対象情報に対応する前記コンピュータログの日時とを出力する出力部と、
    を備えることを特徴とする請求項1〜7のうちいずれか1項に記載の業務分析装置。
  9. コンピュータに、
    コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含む時刻毎に記録されたコンピュータログと、前記ファイルに対する操作及び該操作の前後の該操作されたファイルの所在の履歴を示す時刻毎のファイル操作ログとを取得し、
    時的格納場所の所在情報が格納される所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定し、
    記一時的格納場所を示す前記所在情報を含む前記コンピュータログの日時に対応する前記ファイル操作ログから、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析し、
    一時的にファイルが格納される一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含む該ファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する、
    処理を実行させる業務分析プログラム。
  10. コンピュータにより実行される業務分析方法であって、
    前記コンピュータは、
    コンピュータの動作履歴であってソフトウェアによって操作された処理対象となるファイルの所在情報を含む時刻毎に記録されたコンピュータログと、前記ファイルに対する操作及び該操作の前後の該操作されたファイルの所在の履歴を示す時刻毎のファイル操作ログとを取得し、
    時的格納場所の所在情報が格納される所在情報格納部に格納された前記一時的格納場所の所在情報に基づいて、前記コンピュータログに含まれる前記所在情報が前記一時的格納場所を示すかを判定し、
    記一時的格納場所を示す前記所在情報を含む前記コンピュータログの日時に対応する前記ファイル操作ログから、前記一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を分析し、
    一時的にファイルが格納される一時的格納場所へ移動させられる前記ファイルの移動元及び該一時的格納場所から移動させられる前記ファイルの移動先を示す情報のうち少なくとも1つを含む該ファイル移動情報と、業務名とが関連付けられて格納される移動関係業務格納部から、前記分析により得られた前記ファイルの移動元及び移動先を示す第1のファイル移動情報と一致または一部一致する第2のファイル移動情報を検索し、該検索した第2のファイル移動情報に対応する業務名を取得し、該検索した業務名を第1のファイル移動情報に対応する業務と判定する、
    処理を実行する業務分析方法。
JP2011133561A 2011-06-15 2011-06-15 業務分析装置、業務分析プログラム、及び業務分析方法 Expired - Fee Related JP5760732B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011133561A JP5760732B2 (ja) 2011-06-15 2011-06-15 業務分析装置、業務分析プログラム、及び業務分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011133561A JP5760732B2 (ja) 2011-06-15 2011-06-15 業務分析装置、業務分析プログラム、及び業務分析方法

Publications (2)

Publication Number Publication Date
JP2013003794A JP2013003794A (ja) 2013-01-07
JP5760732B2 true JP5760732B2 (ja) 2015-08-12

Family

ID=47672305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011133561A Expired - Fee Related JP5760732B2 (ja) 2011-06-15 2011-06-15 業務分析装置、業務分析プログラム、及び業務分析方法

Country Status (1)

Country Link
JP (1) JP5760732B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6365195B2 (ja) * 2014-10-03 2018-08-01 富士通株式会社 命令履歴分析プログラム、命令履歴分析装置、および、命令履歴分析方法
JP7358981B2 (ja) 2019-12-27 2023-10-11 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置
WO2021140660A1 (ja) * 2020-01-10 2021-07-15 株式会社日本Aiコンサルティング 評価支援システム、評価支援方法および評価支援プログラム
JP6888863B1 (ja) * 2020-01-10 2021-06-16 株式会社日本Aiコンサルティング 評価支援システム、評価支援方法および評価支援プログラム
JP6959386B2 (ja) * 2020-03-31 2021-11-02 株式会社日立製作所 人材分析システム、方法、およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008152474A (ja) * 2006-12-15 2008-07-03 Hitachi Ltd サービス提供装置、管理サーバ及び管理サーバの制御方法
JP2008257501A (ja) * 2007-04-05 2008-10-23 Hitachi Ltd 日報作成支援システムおよび日報作成支援プログラム
JP5353208B2 (ja) * 2008-11-28 2013-11-27 株式会社日立製作所 作業内容分析方法、プログラム及び作業内容分析システム
JP5278112B2 (ja) * 2009-03-31 2013-09-04 富士通株式会社 作業グループ化プログラムおよび作業グループ化装置
JP5468837B2 (ja) * 2009-07-30 2014-04-09 株式会社日立製作所 異常検出方法、装置、及びプログラム
JP5375642B2 (ja) * 2010-02-09 2013-12-25 富士通株式会社 業務時間集計装置、業務時間集計方法及び業務時間集計プログラム

Also Published As

Publication number Publication date
JP2013003794A (ja) 2013-01-07

Similar Documents

Publication Publication Date Title
JP5313337B2 (ja) モバイル・コンピューティング装置に対する検索結果の提供
JP5760732B2 (ja) 業務分析装置、業務分析プログラム、及び業務分析方法
EP1884877A1 (en) Search query generator apparatus
JP2005122726A5 (ja)
JPWO2016103451A1 (ja) 関連情報取得方法及び装置並びに記憶媒体
JP3803961B2 (ja) データベース生成装置、データベース生成処理方法及びデータベース生成プログラム
JP4361526B2 (ja) 評判情報処理装置、評判情報処理方法、評判情報処理プログラム、及び記録媒体
JP2016018286A (ja) 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム
JP2021192237A (ja) 関連スコア算出システム、方法およびプログラム
Aljedaani et al. A comparison of bugs across the ios and android platforms of two open source cross platform browser apps
Chawla et al. Automatic bug labeling using semantic information from LSI
JP2016066197A (ja) 分析システム及び分析方法
JP5439235B2 (ja) 文書分類方法、文書分類装置、およびプログラム
JP2020201819A (ja) ビジネスマッチング支援装置、及びビジネスマッチング支援方法
US10496693B2 (en) Unified classification and ranking strategy
CN106971117B (zh) 调查设备和调查方法
JP5535270B2 (ja) 文書成分分析装置およびプログラム
CN115577078B (zh) 一种工程造价审计信息检索方法、系统、设备及存储介质
JP7438386B2 (ja) 協力リンク作成システムおよび協力リンク作成方法
JP6664306B2 (ja) 類似文書抽出装置、類似文書抽出方法及び類似文書抽出プログラム
JP5402427B2 (ja) 情報処理装置、情報処理システムおよびプログラム
JP2010128981A (ja) 操作シーケンス抽出方法及び装置及びプログラム
JP2018067040A (ja) テストショット作成支援装置およびテストショット作成支援方法
JP2008262324A (ja) 情報処理装置及び情報処理方法及びプログラム
Vural An Empirical Study of Document Similarity and Term Extraction Using Apache Spark

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150525

R150 Certificate of patent or registration of utility model

Ref document number: 5760732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees