JP5912949B2 - 業務文書処理システム、及びプログラム - Google Patents
業務文書処理システム、及びプログラム Download PDFInfo
- Publication number
- JP5912949B2 JP5912949B2 JP2012156828A JP2012156828A JP5912949B2 JP 5912949 B2 JP5912949 B2 JP 5912949B2 JP 2012156828 A JP2012156828 A JP 2012156828A JP 2012156828 A JP2012156828 A JP 2012156828A JP 5912949 B2 JP5912949 B2 JP 5912949B2
- Authority
- JP
- Japan
- Prior art keywords
- folder
- file
- deletion
- information
- deleted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の実施形態による業務文書処理装置(文書処理システムということもできる)1の内部概略構成を示す機能ブロック図である。図1において、当該業務文書処理装置1は、単独の計算機として示されているが、各構成部が遠隔的に配置され、それぞれがネットワークを介して接続されて構成される、計算機システムとして構成されるようにしても良い。
以下、図2及び3を用いてデータメモリ105に含まれる各情報のデータ構造を説明する。
次に、本実施形態の業務文書処理装置1において行われる処理について説明する。図4は、業務文書処理装置1において行われる全体的な処理の流れを概略的に示すフローチャートである。このフローチャートは、ファイルサーバのファイルの削除可能確率からフォルダ、及びフォルダツリーが削除できるかを判別し、その結果を表示する処理を示す。また、フローチャートにおける処理の主体は中央処理装置(単に、プロセッサということもできる)103とする。
図5は、図4のステップ401における削除ファイル分析処理部109による処理の詳細について説明するためのフローチャートである。当該処理は、過去に削除されたファイル情報から機械学習により分類モデルを生成し、処理対象となる各ファイルについて削除可能確率を計算するものである。また、当該処理は、中央処理装置103が削除ファイル分析処理部(削除ファイル分析処理プログラム)109を実行することにより実現される。
次に、図4のステップ402における削除フォルダ分析処理部110による処理の詳細について説明する。当該処理は、ファイルの削除可能確率を基にフォルダが削除できるかどうかを判別する。フォルダの削除可能確率は0〜100の間の数値であり、通常、これらの集合を基にフォルダの削除可否の判定は削除可能確率の平均値や最小値などを求め、閾値を基準に削除可否の判別を行うことが考えられる。しかし、削除可能確率に偏りがある場合、平均値ではフォルダの削除可否の決定ができない場合がある。例えば、あるフォルダに削除可能確率が10%のファイルが1ファイルと90%のファイルが10ファイルあるとする。すると、これらの削除可能確率の平均値は82%となり、当該ファイルは削除できると判別する。しかし、このフォルダに削除可能確率が10%のファイルがあることから本来ならば削除できないフォルダであるといえる。また、フォルダの中で削除可能確率を対象フォルダの最小値とする場合、大多数の削除できるファイル群を持つフォルダツリーであるにも関わらず、削除可能確率が低いファイルの影響を受けて検知できなくなる可能性がある。あるいは、削除できない削除可能確率の閾値を設定して閾値以下のファイル及びフォルダを除外した場合、本来ならば削除できないフォルダ、例えば、削除可能確率の分布が均等なフォルダが削除できるフォルダとして判別され、また、多くのファイルが削除できないファイルとして残ってしまう。すると、本来の目的である、不要となったカテゴリ、すなわちフォルダツリーで削除する目的であるのに対して、削除後には残留した用途不明のファイルが散在してしまうことになる。
図7は、図4のステップにおける削除候補フォルダツリー登録処理部111による処理(ステップ403)の詳細を説明するためのフローチャートである。なお、当該処理は、中央処理装置103が削除候補フォルダツリー登録処理部(削除候補フォルダツリー登録処理プログラム)111を実行することにより実現される。
図8は、図4のステップ404における削除候補表示処理部112による処理の詳細を説明するためのフローチャートであり、図9、図10、及び図11は当該処理の過程でユーザに表示する画面例である。当該処理は、中央処理装置103が削除候補表示処理部(削除候補表示処理プログラム)112を実行することにより実現される。
図9は、図8のステップ805において行われる、削除候補フォルダツリーのリスト表示の画面例を示す図である。
図10は、図8のステップ807において行われる、削除確認フォルダツリーリスト表示の画面例を示す図である。
図11は、図10において「選択ツリーの確認」ボタンが押下されたときに表示されるフォルダツリーの確認表示の画面例を示す図である。
(i)本発明の実施形態では、ファイルをフォルダツリー単位で削除するための不要とする削除候補フォルダツリーを検知する業務文書処理装置について述べた。当該業務文書処理装置は、過去の削除ファイルデータを基に削除可能確率を計算し、フォルダ直下のファイルについて削除可能確率の偏りからフォルダが削除できるかどうかを判別する。また、ほとんどのファイルが不要と判断したフォルダツリーの中から必要なファイルのみを削除可能確率の偏りを用いることで自動的に削除対象から除外する。これは、フォルダツリーの最下層からルートフォルダまでのファイルの削除可能確率を計算し、フォルダの階層構造について削除可能確率の偏りを用いて解析することで削除できるフォルダツリーを検知している。また、フォルダツリーの検知の際には、格納されているファイルの所有者が単一である条件を加えていることから、検知されたフォルダツリーの所有者は単一ユーザが管理するものであることから、ファイルサーバの利用者が本装置の画面を用いて削除作業をする際に、自身が管理するフォルダツリーについてフォルダの階層を追わずに到達することができ、効率的にフォルダツリーの削除可否の確認作業が行えるようになる。また、複数のユーザを跨ってフォルダツリーの削除可否の確認が不要となる。そして、本装置の画面表示において、ユーザは、削除可能と検知したフォルダツリーについて、リスト表示による各フォルダツリーの削除に関するファイルサイズ及びファイル数の効果と見積もりを確認できる。また、削除候補のフォルダツリーのツリー構造の表示をして、ユーザはツリー構造で表示されたフォルダ名と、削除対象のファイルリストと、削除できないファイルリストを一つの画面でまとめて確認できることから、当該フォルダツリーの削除可否の確認が容易に行える。さらに、ツリー構造の表示において、削除できないファイルを含むフォルダについては色を変えて表示することで、機械学習で削除できると推論したファイルの確認と共に、推論しきれなかった削除できないファイルの発見を促す効果がある。これは、関連性の高いファイルが同一フォルダにまとめられて管理される傾向から、例えば、推論結果が正しい削除できないファイルと同一フォルダにあるファイル群は、関連性が高いため同様に削除できないファイルである可能性がある。これについて、推論結果を反映したフォルダの表示形態について色を変えるなどして強調することで、ファイルサーバに散在する当該フォルダの発見を容易にすることができる。また、確認した結果、削除できるとなった削除候補フォルダツリーに関しては、削除対象外のフォルダを残してまとめて削除することができ、従来での削除対象外のファイルを予め別の格納場所に移動させる作業を省略することができる。このように、当該業務文書処理装置によりユーザは効率的にフォルダツリー単位でのファイルの削除ができるようになる。
(i)本発明では、削除済ファイルの情報に対して機械学習処理を実行して、処理対象ファイルのそれぞれの削除可能確率を算出する(ファイル削除可能確率算出処理)。また、処理対象フォルダのそれぞれの直下の各ファイル及びフォルダの算出された削除可能確率の偏りを算出して、削除可能確率の偏りに基づいて、処理対象フォルダについて削除可否を判断する(フォルダ削除可否分析処理)。さらに、フォルダ削除可否の情報と各フォルダにおける親子関係の情報に基づいて、削除可能なフォルダツリーを示す削除候補フォルダツリー情報を取得する(削除候補フォルダツリー取得処理)。そして、当該削除候補フォルダツリー情報が支援情報として出力(表示、印刷等)される(支援情報出力処理)。このようにすることにより、削除可能なファイル及びフォルダの情報のみを表示するので、ユーザの削除可否確認作業の工数を劇的に削減することができるようになる。なお、この一連の流れの処理を繰返し実行することにより、ファイル削除可能確率の精度が良くなり、最終的に出力される削除可能フォルダやファイルの情報もより正確になる。また、フォルダ削除可否分析処理において、削除可能確率の偏りを求める際には、例えば、削除可能確率の中央値とジニ係数を用いたり、削除可能確率のそれぞれと確率50%との差分の絶対値の平均を用いたりすることが可能である。上記ファイル情報としては、ファイルサーバにおけるファイルのファイル名、親フォルダのフォルダ名、ファイルサイズ、拡張子、テキスト内容、作成日、更新日、アクセス日、及び所有者の情報のうち少なくとも複数種類のメタ情報を用いることができる。また、上記フォルダ情報としては、ファイルサーバにおけるフォルダのフォルダ名、当該フォルダが含むファイルの情報、当該フォルダが含むフォルダの情報、当該フォルダが前記ファイルサーバのフォルダツリーにおける階層の位置の情報を用いることができる。さらに、削除済ファイル情報としては、過去に削除された複数のファイルのファイル名、親フォルダのフォルダ名、ファイルサイズ、拡張子、テキスト内容、作成日、更新日、アクセス日、所有者、及び削除日の情報のうち少なくとも複数種類のメタ情報を用いることができる。
101・・・フォルダ情報DB
102・・・削除済みファイル情報DB
103・・・中央処理装置
104・・・プログラムメモリ
105・・・データメモリ
106・・・表示装置
107・・・入力装置
108・・・機械学習処理部
109・・・削除ファイル分析処理部
110・・・削除フォルダ分析処理部
111・・・削除候補フォルダツリー登録処理部
112・・・削除候補表示処理部
113・・・ファイル情報
114・・・フォルダ情報
115・・・削除済みファイル情報
116・・・削除候補フォルダツリー
117・・・削除確認フォルダツリー
118・・・削除対象外ファイル
Claims (15)
- ファイルサーバに保存されている複数のファイルを整理するための支援情報を提供する業務文書処理システムであって、
処理対象ファイルの情報及び処理対象フォルダの情報と、削除済ファイルの情報と、を格納する記憶デバイスと、
前記支援情報を生成し、生成した当該支援情報を提供するプロセッサと、を有し、
前記プロセッサは、
前記削除済ファイルの情報に対して機械学習処理を実行して、前記処理対象ファイルのそれぞれの削除可能性に関する指標を算出するファイル削除可能性指標算出処理と、
前記処理対象フォルダのそれぞれの直下の各ファイル及びフォルダの前記算出された削除可能性に関する指標のばらつきを算出して、前記削除可能性に関する指標のばらつきに基づいて、前記処理対象フォルダについて削除可否を判断するフォルダ削除可否分析処理と、
前記処理対象フォルダの前記削除可否の情報と各フォルダにおける親子関係の情報に基づいて、削除可能なフォルダツリーを示す削除候補フォルダツリー情報を取得する削除候補フォルダツリー取得処理と、
前記削除候補フォルダツリー情報を前記支援情報として出力する支援情報出力処理と、
を実行することを特徴とする業務文書処理システム。 - 請求項1において、
前記プロセッサは、ユーザが前記支援情報に基づいて実際に削除したファイルの情報を前記削除済ファイルの情報に反映させ、前記ファイル削除可能性指標算出処理、前記フォルダ削除可否分析処理、及び前記削除候補フォルダツリー取得処理を再度実行することを特徴とする業務文書処理システム。 - 請求項1において、
前記プロセッサは、さらに、前記各フォルダについて、所有者が全て同一であるファイルのみを格納したフォルダか否か判定するフォルダ所有者判定処理を実行し、
前記プロセッサは、前記フォルダ所有者判定処理によって同一の所有者であると判定されたファイルのみを含むフォルダを、前記削除候補フォルダツリー取得処理の対象とすることを特徴とする業務文書処理システム。 - 請求項2において、
前記処理対象ファイルの情報は、ファイルサーバにおけるファイルのファイル名、親フォルダのフォルダ名、ファイルサイズ、拡張子、テキスト内容、作成日、更新日、アクセス日、及び所有者の情報のうち少なくとも複数種類のメタ情報を含み、
前記処理対象フォルダの情報は、前記ファイルサーバにおけるフォルダのフォルダ名、当該フォルダが含むファイルの情報、当該フォルダが含むフォルダの情報、当該フォルダが前記ファイルサーバのフォルダツリーにおける階層の位置の情報を含み、
前記削除済ファイルの情報は、過去に削除された複数のファイルのファイル名、親フォルダのフォルダ名、ファイルサイズ、拡張子、テキスト内容、作成日、更新日、アクセス日、所有者、及び削除日の情報のうち少なくとも複数種類のメタ情報を含み、
前記プロセッサは、前記ファイル削除可能性指標算出処理において、前記削除済ファイルの前記メタ情報と、前記ユーザが削除不可であると判断したファイルの前記メタ情報と、を用いて前記機械学習処理を実行することを特徴とする業務文書処理システム。 - 請求項1において、
前記プロセッサは、前記フォルダ削除可否分析処理において、前記処理対象フォルダのそれぞれの直下の各ファイル及びフォルダの前記算出された削除可能性に関する指標の中央値とジニ係数を算出して、当該中央値及びジニ係数を用いて前記処理対象フォルダ内のファイル及びフォルダの削除可能性に関する指標のばらつきを算出し、当該ばらつきに基づいて、前記処理対象フォルダについて削除可否を判断することを特徴とする業務文書処理システム。 - 請求項2において、
前記プロセッサは、前記フォルダ削除可否分析処理において、前記ファイル及びフォルダのジニ係数が第1の閾値以上、かつ前記ファイル及びフォルダの中央値が第2の閾値以上の処理対象フォルダから、前記ファイル及びフォルダの中央値と前記ファイル及びフォルダの削除可能性に関する指標の差が第3の閾値以上のファイル又はフォルダを取り除き、当該処理対象フォルダについてファイル及びフォルダの中央値を再度計算し、当該処理対象フォルダの削除可能性に関する指標とすることを特徴とする業務文書処理システム。 - 請求項1において、
前記プロセッサは、前記フォルダ削除可否分析処理において、前記算出した削除可能性に関する指標のそれぞれと指標50%との差分の絶対値の平均を用いて、前記処理対象フォルダ内のファイル及びフォルダの削除可能性に関する指標のばらつきを求め、当該ばらつきに基づいて、前記処理対象フォルダの削除可否を判断することを特徴とする業務文書処理システム。 - 請求項1において、
前記削除候補フォルダツリー取得処理において、前記プロセッサは、前記フォルダ削除可否分析処理を、前記ファイルサーバにおける最下層のフォルダからルートフォルダの順で行うことによって前記削除候補フォルダツリー情報を取得することを特徴とする業務文書処理システム。 - 請求項1において、
前記削除候補フォルダツリー取得処理において、前記プロセッサは、前記処理対象フォルダの直下にあるファイル及びフォルダの削除可能性に関する指標の値に対してクラスタリングを行うことによって前記削除候補フォルダツリー情報を取得することを特徴とする業務文書処理システム。 - 請求項8において、
前記プロセッサは、前記支援情報出力処理において、前記削除可能なフォルダツリーにおけるルートフォルダについてリスト表示することを特徴とする業務文書処理システム。 - 請求項10において、
前記プロセッサは、前記リスト表示の中で前記削除可能なフォルダツリーにおけるファイル群の合計ファイルサイズ及び前記ファイルサーバ全体に対する合計ファイルサイズの割合、合計ファイル数及び前記ファイルサーバ全体に対するファイル数の合計の割合を表示することを特徴とする業務文書処理システム。 - 請求項10において、
前記プロセッサは、前記リスト表示を合計ファイルサイズ又は合計ファイルについて降順にソートすることを特徴とする業務文書処理システム。 - 請求項8において、
前記プロセッサは、前記支援情報出力処理において、前記削除可能なフォルダツリーを表示し、当該表示されたフォルダツリーからのフォルダの選択アクションに応答して、当該選択されたフォルダが含むファイルと削除対象外となったファイルを区別して表示することを特徴とする業務文書処理システム。 - 請求項13において、
前記プロセッサは、前記表示されたフォルダツリーにおいて前記削除対象外となったファイルを含むフォルダを他のフォルダと区別して表示することを特徴とする業務文書処理システム。 - コンピュータシステムを、ファイルサーバに保存されている複数のファイルを整理するための支援情報を提供する業務文書処理システムとして動作させるためのプログラムであって、
前記コンピュータシステムは、プロセッサと、処理対象ファイルの情報及び処理対象フォルダの情報と、削除済ファイルの情報と、を格納する記憶デバイスと、を有し、
前記プログラムは、前記プロセッサに、
前記削除済ファイルの情報に対して機械学習処理を実行して、前記処理対象ファイルのそれぞれの削除可能性に関する指標を算出するファイル削除可能性指標算出処理と、
前記処理対象フォルダのそれぞれの直下の各ファイル及びフォルダの前記算出された削除可能性に関する指標のばらつきを算出して、前記削除可能性に関する指標のばらつきに基づいて、前記処理対象フォルダについて削除可否を判断するフォルダ削除可否分析処理と、
前記処理対象フォルダの前記削除可否の情報と各フォルダにおける親子関係の情報に基づいて、削除可能なフォルダツリーを示す削除候補フォルダツリー情報を取得する削除候補フォルダツリー取得処理と、
前記削除候補フォルダツリー情報を前記支援情報として出力する支援情報出力処理と、
を実行することを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012156828A JP5912949B2 (ja) | 2012-07-12 | 2012-07-12 | 業務文書処理システム、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012156828A JP5912949B2 (ja) | 2012-07-12 | 2012-07-12 | 業務文書処理システム、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014021552A JP2014021552A (ja) | 2014-02-03 |
JP5912949B2 true JP5912949B2 (ja) | 2016-04-27 |
Family
ID=50196409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012156828A Expired - Fee Related JP5912949B2 (ja) | 2012-07-12 | 2012-07-12 | 業務文書処理システム、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5912949B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6693162B2 (ja) * | 2016-02-17 | 2020-05-13 | 日本電気株式会社 | 整理候補推薦装置、整理候補推薦方法および整理候補推薦プログラム |
JP2017219970A (ja) * | 2016-06-06 | 2017-12-14 | キヤノン株式会社 | 画像形成装置、その制御方法、及びプログラム |
US10956453B2 (en) | 2017-05-24 | 2021-03-23 | International Business Machines Corporation | Method to estimate the deletability of data objects |
JP7322438B2 (ja) | 2019-03-14 | 2023-08-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置および情報処理プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07225704A (ja) * | 1994-02-10 | 1995-08-22 | Fuji Xerox Co Ltd | ファイル管理装置 |
JP2006031464A (ja) * | 2004-07-16 | 2006-02-02 | Canon Inc | 文書管理方法及び装置 |
JP2006302010A (ja) * | 2005-04-21 | 2006-11-02 | Kyocera Mita Corp | 情報処理装置 |
JP5399114B2 (ja) * | 2009-03-30 | 2014-01-29 | 株式会社日立ソリューションズ | ファイルサーバ運用支援装置、方法、プログラム及び記録媒体 |
JP2011059919A (ja) * | 2009-09-09 | 2011-03-24 | Fujitsu Ltd | 情報管理装置、情報管理方法、及び、情報管理プログラム |
-
2012
- 2012-07-12 JP JP2012156828A patent/JP5912949B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014021552A (ja) | 2014-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5346506B2 (ja) | ファイル管理装置 | |
JP4041080B2 (ja) | データ検索装置及びデータ検索プログラム | |
US20160259786A1 (en) | Methods, Systems, And Computer Program Products For Automatically Associating Data With A Resource As Metadata Based On A Characteristic Of The Resource | |
US9030502B2 (en) | System and method for organizing documents | |
JP4911438B2 (ja) | 操作監視装置 | |
CN107291949B (zh) | 信息搜索方法及装置 | |
JP2000067065A (ja) | 文書画像識別方法および記録媒体 | |
JP5912949B2 (ja) | 業務文書処理システム、及びプログラム | |
US20230214091A1 (en) | Multimedia object arrangement method, electronic device, and storage medium | |
JP5512570B2 (ja) | 文書処理装置、及びファイルサーバ管理支援方法、並びにファイルサーバ管理支援プログラム | |
JP2011076396A (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
JP5753056B2 (ja) | 検索装置、文書管理方法、及び文書検索システム | |
US9164970B2 (en) | Using structured data for online research | |
JP5891875B2 (ja) | 情報処理装置及び情報処理プログラム | |
CN103365535A (zh) | 信息处理装置及信息处理方法 | |
WO2014061303A1 (ja) | 情報処理装置及びプログラム | |
US20070055928A1 (en) | User workflow lists to organize multimedia files | |
JPWO2022137356A5 (ja) | ||
WO2019163610A1 (ja) | 情報処理システム及び情報処理方法 | |
US20130060778A1 (en) | Device, method, and program for displaying document list | |
US9208224B2 (en) | Business content hierarchy | |
CN117312774A (zh) | 一种大数据的智能聚合可视化与管控系统 | |
JP6636235B2 (ja) | 文書管理装置、文書管理方法、及びプログラム | |
JP2005196254A (ja) | ディレクトリ構造形成装置及びその方法、ディレクトリサービスシステム | |
CN111858779A (zh) | 数据分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5912949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |