JP3806820B1 - 電子ファイル関連強度自動算出プログラム - Google Patents

電子ファイル関連強度自動算出プログラム Download PDF

Info

Publication number
JP3806820B1
JP3806820B1 JP2005087526A JP2005087526A JP3806820B1 JP 3806820 B1 JP3806820 B1 JP 3806820B1 JP 2005087526 A JP2005087526 A JP 2005087526A JP 2005087526 A JP2005087526 A JP 2005087526A JP 3806820 B1 JP3806820 B1 JP 3806820B1
Authority
JP
Japan
Prior art keywords
file
information
electronic file
electronic
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005087526A
Other languages
English (en)
Other versions
JP2006268598A (ja
Inventor
幸嘉平太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oita Prefectural Government
Original Assignee
Oita Prefectural Government
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oita Prefectural Government filed Critical Oita Prefectural Government
Priority to JP2005087526A priority Critical patent/JP3806820B1/ja
Application granted granted Critical
Publication of JP3806820B1 publication Critical patent/JP3806820B1/ja
Publication of JP2006268598A publication Critical patent/JP2006268598A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 通常は、電子ファイルを記憶装置内に保管するため、手動にてフォルダやディレクトリを構成するが、適切なディレクトリを構築することは難しく、電子ファイル相互の関連性を画面上で自動的に得ることはできない。
【解決手段】 電子ファイルの生成・アクセス・更新といった利用形態の重視度を反映用い、電子ファイル間相互の関連性の強弱を算出する。また、電子ファイル間のコピー・ペースト情報も蓄積収集し、コピー・ペーストの発生頻度が高い電子ファイル間を、関連性の強い組み合わせと判断する。これらの手段によって、自動的に電子ファイル相互の関連性を得ることが可能になり、その結果を画面上に表示することにより、利用者が注目している電子ファイルに対して、関連性の強い電子ファイルを自動表示する。
【選択図】 図1

Description

本発明は、パーソナルコンピュータやファイルサーバー、その他コンピュータ機器などに関し、特に多数の電子ファイルを扱う機器における、電子ファイル間の関連性の自動算出とその結果を表示させる技術に関するものである。
パーソナルコンピュータなどのコンピュータ機器を操作する際、利用者は、文書ファイル、画像ファイル、データファイルなど、多様な電子ファイルを数多く扱う。利用者が作成した電子ファイルは、フォルダと呼ばれる電子的な収納場所に保管される。これらフォルダは、親フォルダや子フォルダなど、利用者によって入れ子的に整理収納され、全体として、木構造型のディレクトリと呼ばれる構造をとる。一般に、これらフォルダや、その全体構造であるディレクトリは、利用者が明示的に手作業で作成する必要がある。
このディレクトリ形式でのファイル格納の手段は、その構造が複雑になるほど、ディレクトリ構造の見通しが悪化し、フォルダ間の移動に要する手間が増える。また、フォルダ数が増えるほど利用者が目的とする電子ファイルの格納場所を探索するのが困難になる。また、ディレクトリの構成が複雑になるほど、いったん構築したディレクトリ構造を変えるのは容易ではない。結果的に、電子ファイルやフォルダの数が多数になると、分類や階層分けなど、利用者の管理に要する手間が増大する。これらの状況は、近年において大容量化が進むコンピュータ機器の記憶装置を用いる場合に、特に顕著である。
例えば、利用者が、コンピュータ機器上で行っている作業の特性によっては、電子ファイルの探索の際、異なる視点での分類や階層で電子ファイルを探索したい場合があるが、従来の技術では、コンピュータ機器上には、任意の時点において、その時点での分類法に基づく1通りのディレクトリ構造しか格納できず、そのディレクトリ構造に従ってのみフォルダ間の移動が可能であるため、電子ファイルの探索が困難になることが多い。
さらに、大容量の記録機器を用いて大量の電子ファイルやフォルダを格納している場合は、人為的に構成されたフォルダやディレクトリ構造では、電子ファイル探索における一覧性が悪い。そのため、目的とする電子ファイルを探索する際、もしくは、関連する電子ファイルを見つけたいとする際、ディレクトリの構造にしたがってフォルダ間を上下横断の移動を繰り返し、それでも発見できない場合は、コンピュータ機器に備わっている検索機能を使って、網羅的に全フォルダの探索を行う場合がある。この全フォルダ検索は、コンピュータ機器に大きな負荷を要求し、また、検索の終了まで長い時間が必要となる。
このような問題を解決するため、電子ファイルの利用日時情報を分析の対象として、注目する電子ファイルに対して、時間距離の近い電子ファイルを表示させる、特開2002-312402号公報の技術が既存するが、そもそも前記技術は、表示させる時点での利用日時情報にのみ基づくものである。そのため、電子ファイルは一般に、利用者によって作成されて以降、更新処理やアクセス処理が繰り返されるものであるが、過去に行われたそれらの行為が形跡として反映されないため、表示結果が一面的なものとなる。そのため、電子ファイル間における確度の高い関連性についての情報が得られにくい。
また、従来の技術では、電子ファイル間で実行された情報のコピー・ペースト情報に基づく、その電子ファイル間の関連性の判断を行っていない。
また、従来の技術では、電子ファイルの利用日時情報をもとにした関連性の分析のみであり、それとコピー・ペーストの発生回数をあわせた、統合的、かつ統計的な分析に基づく関連性の算出にはなっていない。
本発明は、コンピュータ機器の操作において、大量の電子ファイルと、それらを格納したフォルダを取り扱う際に、各電子ファイル間の関連性の強度を、同機器内の演算装置を用いて算出することにより、利用者が注目する電子ファイル、もしくはフォルダに対して、関連性の高い電子ファイル、もしくはフォルダを、利用者が作成したフォルダ、およびディレクトリ構造とは別途に、利用者に対して画面上に提示することにより、電子ファイルの探索における操作性を向上させる手段を有するプログラムを提供することを、目的とするものである。
本発明のプログラムは、情報を電子ファイルの形態で記録装置に格納するコンピュータ機器において、前記機器に格納されており、かつ、利用者の操作によって作成された情報を記録している電子ファイルに対し、前記機器のオペレーティングシステムが属性として付与する、電子ファイルの利用日時情報と、その電子ファイルの名称と、その電子ファイルの格納されているフォルダの名称の、3種類の情報を、オペレーティングシステムに読み取りを行うように指示することにより、前記コンピュータ機器の利用時間にわたって一定時間間隔で連続的に採取し、採取された3種類の情報を、利用日時情報データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
前記機器の利用者によって実行される、電子ファイル間でのデータのコピー・ペーストの行為に対し、それら行為の発生の有無を、オペレーティングシステムを経由することにより、前記機器の利用時間にわたって監視し、それら行為が発生した場合、コピー元の電子ファイルの名称と、その電子ファイルが格納されているフォルダの名称と、ペースト先の電子ファイルの名称と、その電子ファイルが格納されているフォルダの名称の、4種類の情報を、オペレーティングシステムに読み取りを行うように指示することにより、前記機器の利用時間にわたって連続的に採取し、採取された4種類の情報を、コピー・ペースト情報データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
利用日時情報データファイルに記録された電子ファイル全体に対して、2個の電子ファイルを対とする全ての組合せを、前記機器上の演算装置を用いて生成し、それら電子ファイル対における電子ファイル間の利用日時情報の時間差分を、前記機器上の演算装置を用いて、全ての対について算出し、それら電子ファイル対において、得られた時間差分の数値に対し、利用者によって指定された、電子ファイルの作成・更新・アクセスの各作業特性を反映した利用日時情報の性質に対する重視パラメータに基づいた伸縮を、前記演算装置を用いて算出し、その結果得られる時間差分の数値の小さい電子ファイル対を、関連性の強い電子ファイル対として、それら組合せの電子ファイル名と、それら電子ファイルが格納されているフォルダ名と、その時間差分の数値と、を、利用日時情報に基づく関連性分析結果データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
コピー・ペースト情報データファイルに記録された、コピー元・ペースト先の電子ファイル対に対して、それら電子ファイル対におけるコピー・ペースト発生回数を、前記機器上の演算装置を用いて、全ての対について集計し、コピー・ペースト発生回数の大きい電子ファイル対を、関連性の強いファイルとして、それら組合せのファイル名と、それら電子ファイルが格納されているフォルダ名と、コピー・ペースト発生回数とを、コピー・ペースト情報に基づく関連性分析結果データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
保存された利用日時情報に基づく関連性分析結果データファイル、および、コピー・ペースト情報に基づく関連性分析結果データファイルの内容を読み取り、それら内容に基づき、利用者が注目している電子ファイル、もしくはフォルダに対して、関連性が強いとされた電子ファイルを、コンピュータ機器の画面上に表示し、もしくは、関連性が強いとされた電子ファイル、およびフォルダを画面上に表示する手段から構成される、これら手段を実行させるためのプログラムであることを特徴とする。
以上説明したように本発明のプログラムによれば、コンピュータ機器操作の各時点における、利用日時情報に基づく電子ファイル間の関連性、およびコピー・ペースト回数に基づく電子ファイル間の関連性を、連続的、かつ蓄積的に採取した利用者の電子ファイルの利用情報に基づき、同機器内の演算装置を用いて算出し、分析結果として得ることができる。
そのため、利用者が、作業の過程において、ある特定の電子ファイル、もしくはフォルダに注目する場合、その電子ファイル、もしくはフォルダに対して、それらの過去の操作履歴に基づいた高い確度で関連性が強いと思われる電子ファイルやフォルダを、それら分析結果に基づき、自動的に抽出し、画面上にそれらを提示することができるようになる。
その結果、利用者が、関連する電子ファイルやフォルダの探索に要する手間を軽減することや、関連性を反映させたフォルダやディレクトリ構成の作成にかかる手間の軽減を、実現することができるようになる。
以下、本発明のプログラムの一実施例について、図面を参照しながら説明する。
図1は、本発明のプログラムの構成図である。本プログラムは、利用日時情報データファイル作成部101と、利用日時差分データファイル作成部102と、利用日時差分重み付けデータファイル作成部103と、利用日時に基づく関連性分析結果データファイル作成部104と、コピー・ペースト情報データファイル作成部105と、コピー・ペーストに基づく関連性分析結果データファイル作成部106との、6部からなる関連性分析部107と、関連ファイル・フォルダ表示部108とで、構成される。
関連性分析部107は、利用者による本プログラムの開始指示後、コンピュータ機器の動作中、常駐的に動作し、電子ファイルの利用日時情報、および、コピー・ペースト情報に基づいた、関連性の自動算出を行う。ここで、電子ファイル間の関連性の分析を行うために、利用日時情報、もしくは、コピー・ペースト情報のいずれかのみを利用して行っても良い。
関連ファイル・フォルダ表示部108は、コンピュータ機器の動作中、常駐的に動作し、利用者の指定する電子ファイル、もしくはフォルダに対して、関連性が高いとされた電子ファイル、もしくはフォルダに関する情報を、利用日時情報に基づく関連性分析結果データファイル、およびコピー・ペースト情報に基づく関連性分析結果データファイルから抽出し、それらを画面上に表示する。
図2は、本発明のプログラムと、そのプログラムが動作するコンピュータ機器のオペレーティングシステムと、そのプログラムが分析対象とする電子ファイル群と、そのプログラムが結果を表示する画面表示部と、の関係を示したものである。
本プログラム201は、対象となるコンピュータ機器205のオペレーティングシステム202上で稼動する。本プログラム201は、分析に必要な電子ファイル群203に関するデータの取得を、オペレーティングシステム202に指示し、オペレーティングシステム202が、本プログラム201にその結果を返答し、本プログラムがその内容に基づき、分析を行う。本プログラム201は、利用者からの要求に応じて、本プログラム201の分析結果に基づいて、関連性の強い電子ファイル、もしくはフォルダを、オペレーティングシステム202、および画面表示部204を経由して、コンピュータ機器の画面上に表示する。
図3は、電子ファイルの利用日時情報を分析の対象とした場合の、図1の関連性分析部107における、本プログラムのフローチャートである。本プログラムは、ステップ301において、前処理として、その動作に必要な、動作設定用ファイル、利用日時情報データファイル、利用日時差分データファイル、利用日時差分重み付けデータファイル、利用日時に基づく関連性分析結果データファイルの、5種類の電子ファイルを、作成する。
次に、ステップ302において、本プログラムの利用者によって入力された、分析対象とする電子ファイルの種別情報、利用日時情報の性質による重視パラメータ、電子ファイルの利用日時情報の取得の時間間隔、利用日時情報に基づく関連性分析結果データファイル作成の時間間隔、の4種類の情報を、動作設定用ファイルに書き出す。ここで、電子ファイルの種別情報とは、一般のオペレーティングシステムで採用されている電子ファイルの拡張子などを対象として、入力をさせる。マイクロソフト社製のオペレーティングシステム、Windows(登録商標)の場合、文書ファイルの種別を指定するために、「doc」、「xls」、「ppt」などを判別できる情報を、利用者に入力をさせる。
次に、利用日時情報データファイル作成部である、サブルーチン303において、本プログラムが分析の対象とする、電子ファイルのファイル名と、その電子ファイルが格納されているフォルダ名と、その利用日時情報との、3種類の情報を取得し、利用日時情報データファイルに書き出す。ここで、サブルーチン303は、ステップ302において、指定された一定の時間間隔で繰り返し、周期的に実行するものである。ここで、時間間隔を0と指定された場合には、サブルーチン303を連続的に動作させ、電子ファイルの利用日時情報を、その更新があるたびに、リアルタイムに収集するものである。ここで、サブルーチン303における利用日時情報の収集対象となる電子ファイル群は、スタンドアローン型のパーソナルコンピュータ機器に格納されている電子ファイル群だけではなく、複数のコンピュータ機器からネットワーク回線経由で利用される、ファイルサーバーに格納される電子ファイル群でもよい。
ここで、サブルーチン303における利用日時情報の収集対象となる電子ファイル群は、インターネット上のWWW情報を閲覧するブラウザにおいて、URLを記録する箇々のブックマークなど、箇々のデータごとに利用日時情報が属性的に付随し、電子ファイル群と同様の取り扱いができるものであればよい。
次に、利用日時差分データファイル作成部である、サブルーチン304において、サブルーチン303で作成された、利用日時情報データファイルの内容を読み取り、各電子ファイル間の組み合わせにおける、利用日時の差分値を算出し、その結果を、利用日時差分データファイルに書き出す。
次に、利用日時差分重み付けデータファイル作成部である、サブルーチン305において、サブルーチン304で作成された、利用日時差分データファイルの内容を読み取り、利用日時差分データファイルに記録された利用日時の時間差分の数値に対して、利用者が指定した作業特性の重視パラメータを反映する伸縮を行い、その結果を、利用日時差分重み付けデータファイルに書き出す。
次に、利用日時に基づく関連性分析結果データファイル作成部である、サブルーチン306において、サブルーチン305で作成された利用日時差分重み付けデータファイルの内容を読み取り、各電子ファイルにおける、時間差分の数値を小さい順にソートし、その結果に基づき、電子ファイル間におけるそれぞれのファイル名と、その電子ファイルが格納されているフォルダ名と、を関連性分析結果データファイルに書き出す。ここで、フォルダ名は、サブルーチン303で作成された、利用日時情報データファイルから、取得する。ここで、サブルーチン304から、サブルーチン304の間の処理は、利用者が指定した分析の実行の時間間隔で繰り返し、周期的に実行するものである。
図4は、図3中のサブルーチン303である利用日時情報データファイル作成部のフローチャートである。
ステップ401において、動作設定用ファイルより、分析の対象となる電子ファイルの種別を読み取り、次に、ステップ402において、オペレーティングシステムに、コンピュータ機器に格納されている電子ファイルの内、それら種別に該当する電子ファイルのファイル名と、その電子ファイルが格納されているフォルダ名と、利用日時情報との取得を指示し、次に、ステップ403において、得られた利用日時情報を、電子ファイル名と合わせて、利用日時データファイルに書き出す。ここで、利用日時情報データファイルへの、電子ファイル名と利用日時情報の2種類の情報の書き出しは、追記的に行われるものである。ここで、作成日時、更新日時、アクセス日時など、オペレーティングシステムが記録する利用日時情報は、全て書き出しの対象とする。ここで、書き出す利用日時情報には、日時情報自体に加え、その利用特性である、作成、更新、アクセスなど、利用性質に関する情報も含まれる。
図5は、図3中のサブルーチン304である利用日時差分データファイル作成部のフローチャートである。
ステップ501において、利用日時情報データファイルに記録された、電子ファイル名と、利用日時情報と、利用日時情報の性質と、を読み取り、次に、ステップ502において、読み取った電子ファイルの利用日時情報における全ての組合せに対して、それぞれの時間差分値を計算し、次に、ステップ503において、その結果を、組み合わせとなるそれぞれの電子ファイル名と、利用日時情報の性質とを、利用日時差分データファイルに書き出す。
図6は、図3中のサブルーチン305である利用日時差分重み付けデータファイル作成部のフローチャートである。
ステップ601において、利用日時差分データファイルに記録された、電子ファイルの組み合わせのそれぞれのファイル名と、その組み合わせにおける時間差分の数値を読み取り、次に、ステップ602において、動作設定データファイルに記録された、利用者の指定する利用日時情報の性質の重視パラメータを読み取り、次に、ステップ603において、読み取られた重視パラメータにもとづき、時間差分の数値を伸縮しを行うことにより、利用者の意図を反映した重み付けを行い、次に、ステップ604において、伸縮された数値を、電子ファイルの組み合わせのファイル名とあわせて、利用日時差分重み付けデータファイルに書き出す。
図7は、図3中のサブルーチン306である関連性分析結果データファイル作成部のフローチャートである。
ステップ701において、利用日時差分重み付けデータファイルに記録された、電子ファイルの組み合わせのそれぞれのファイル名と、それに対応する重み付けされた時間差分の数値を読み取り、次に、ステップ702において、各電子ファイルのファイル名と、その電子ファイルから見た場合、重み付けされた時間差分の数値の小さい電子ファイルを、差分値の小さい順にソートし、次に、ステップ703において、利用日時情報データファイルに記載された、それぞれの電子ファイルが格納されたフォルダ名を読み取り、次に、ステップ704において、基準となる電子ファイルのファイル名と、その電子ファイルが格納されているフォルダ名と、時間差分の数値の小さい電子ファイルのファイル名と、その電子ファイルが格納されているフォルダ名と、時間差分の数値との、4種類の情報を、関連性分析結果データファイルに書き出す。ここで、時間差分の数値が小さいものほど、関連性が強いと判断する。ここで、電子ファイルのフォルダ名を読み取る際、利用日時情報データファイルにおける、利用日時がもっとも新しい記録であるところの、フォルダ名を取得する。
図8は、図1中の関連性分析部107において、電子ファイルのコピー・ペースト操作を分析の対象とした場合の、本プログラムのフローチャートである。
本プログラムは、ステップ801において、その動作に必要な、動作設定用ファイル、コピー・ペースト分析データファイル、コピー・ペースト関連性分析結果データファイルの、3種類の電子ファイルを、作成する。
次に、ステップ802において、本プログラムの利用者によって入力された、分析対象とする電子ファイルの種別情報、コピー・ペーストに基づく関連性分析結果データファイル作成の時間間隔、の2種類の情報を、動作設定用ファイルに書き出す。次に、ステップ803において、コンピュータ機器の利用者による、分析対象とする電子ファイル間における、コピー・ペースト操作の監視を、コンピュータ機器の利用時間にわたって行う。ここで、コピー・ペースト操作には、いわゆるカット・ペースト操作も含まれる。ここで、監視は本ステップを、コンピュータ機器上で、常駐的に動作させることで実行する。
次に、ステップ804において、ステップ803における監視の結果、コンピュータ機器の利用者による、分析対象とするコンピュータ機器における、コピー・ペースト操作が発見された場合、その発生日時と、コピー元とコピー先の電子ファイルのそれぞれのファイル名と、それらの電子ファイルの保管されているそれぞれのフォルダ名とを、コピー・ペースト情報データファイルに書き出す。ここで、ステップ803とステップ804は、図1のコピー・ペースト情報データ作成部105に該当する。
次に、サブルーチン805において、ステップ804で作成されたコピー・ペースト情報データファイルの内容を読み取り、各電子ファイルの組み合わせと、それら電子ファイルが保管されているフォルダ名と、その組み合わせにおけるコピー・ペースト操作の発生回数とを、コピー・ペースト関連性分析結果データファイルに書き出す。
図9は、図8中のサブルーチン805であるコピー・ペースト情報に基づく関連性分析結果データファイル作成部のフローチャートである。ステップ901において、コピー・ペースト情報データファイルの内容を読み取り、ステップ902において、電子ファイルの組み合わせにおけるコピー・ペーストの発生回数を集計し、ステップ903において、電子ファイルの組み合わせのファイル名と、その組み合わせにおけるコピー・ペーストの発生回数を、コピー・ペーストに基づく関連性分析結果データファイルに書き出す。
図10は、利用日時情報データファイルに記録されたテーブルの例である。ここで、電子ファイルの利用日時情報の性質として、「作成日時」、「更新日時」、「アクセス日時」の3種類を、例としている。
テーブルの1カラム目には、電子ファイルのファイル名が記録されている。ここで、ファイル名の例として、「file 」などと記載している。Aテーブルの2カラム目には、1カラム目の電子ファイルが格納されているフォルダ名が記録されている。テーブルの3カラム目には、その電子ファイルの利用日時情報の性質が記録されている。
テーブルの4カラム目には、その電子ファイルの利用日時情報が記録されている。作成日時は、新規にその電子ファイルを作成した日時であるから、その電子ファイルがそのコンピュータ機器上に格納されている限り、不変である。更新日時は、その電子ファイルを更新するたびに、その日時が新たに付与されるものである。アクセス日時は、その電子ファイルにアクセスするたびに、その日時が新たに付与されるものである。よって、コンピュータ機器上で、一定間隔にて電子ファイルの利用日時情報を収集する際は、記録される作成日時は1つだけであるが、更新日時とアクセス日時は、電子ファイルへの更新、もしくはアクセスの行為を行った回数だけ、その電子ファイルの利用日時情報として、利用日時情報データファイルへ新たに追記され、記録されるものである。なお、この記録の処理は、利用者によって指定された時間間隔で本プログラムが実施するものである。
図10のテーブル場合、収集対象とされた電子ファイルAと電子ファイルBの2つのファイルに対して、合計で20個の利用日時情報が記録されている。電子ファイルAは、2004年9月1日9時17分33秒に、新規に作成されている。電子ファイルBは、2004年9月1日9時47分56秒に、新規に作成されている。その後、電子ファイルAと電子ファイルBに更新とアクセスの操作が繰り返され、各時点において、オペレーティングシステムより更新日時情報とアクセス日時情報が付与されるが、利用日時情報の収集の時間間隔において、本プログラムが新規に取得できたものが、追記されていく。
図11は、利用日時差分データファイルに記録されたテーブルの例である。テーブルの1カラム目には、時間差分の算出の際、基準となる電子ファイルのファイル名が記録されている。
テーブルの2カラム目には、1カラム目の電子ファイルの日時情報の性質が記録されている。テーブルの3カラム目には、1カラム目の電子ファイルの日時情報が記録されている。テーブルの4カラム目には、時間差分の算出対象となる、電子ファイルのファイル名が記録されている。テーブルの5カラム目には、4カラム目の電子ファイルの日時情報の性質が記録されている。テーブルの6カラム目には、4カラム目の電子ファイルの日時情報が記録されている。テーブルの7カラム目には、基準となる電子ファイルの日時情報に対する、比較先の電子ファイルの日時情報の差分の絶対値が、記録されている。ここで例として、時間差分の数値の単位は秒で記載している。
このような電子ファイル対における利用日時情報の差分値を、利用日時情報データファイルに記録された全ての利用日時情報に対し、全ての組み合わせについて、記録する。
図12は、利用日時重み付けデータの算出過程を示すための各表である。
テーブル1200に、2個の電子ファイル、ファイルAとファイルBにおける、利用日時情報の例を示す。
テーブル1201に、利用者によって与えられた重視パラメータの例を示す。この例では、利用者が、電子ファイルの新規の作成作業をもっとも重視し、更新作業はやや重視し、アクセス作業は軽視するとして、電子ファイルの作成、更新、アクセスに対する重視パラメータの数値を、それぞれ、0、20、70と入力した例を示す(カラム1202)。ここで、重視パラメータの入力例として、0〜100までの数値で表現し、小さい値ほど、重要度が高いとしている。ここで、重視パラメータの数値は、利用者が希望する重視の度合いが反映できるものであれば、何でもよい。
例として、カラム1203では、入力された重視パラメータを100で除し、1を加えたものを、時間差分の数値に対する重み付け係数として用いている。この係数を、テーブル1200に示された各ファイルの利用日時情報に基づく時間差分の数値に乗じた結果一覧を、テーブル1204に示す。
カラム1205には、実際の利用日時情報に基づく時間差分の数値が記載されている。カラム1206には、重視パラメータに基づく重み付け係数を、時間差分の数値に乗じた数値が記載されている。ここで、ファイルAとファイルBのそれぞれの作業特性にもとづく重視パラメータの係数を乗じたものをカラム1206に記載している。重視する度合いが低く利用日時情報とその性質に対しては、この場合、時間差分を演算する際、大きな係数を乗ずることになるため、重み付けされた時間差分の数値が大きくなり、関連性が低めに判断されることになる。重視する度合いが高く、利用者が投入した数値が大きい利用日時情報とその性質に対しては、時間差分を演算する際、小さな係数を乗ずることになるため、重み付けされた時間差分の数値が小さくなり、関連性が高めに判断されることになる。ここで、時間差分の数値が小さいほど、関連性が高いと判断している。テーブル1204では、比較元となる電子ファイルAに対して、利用者が重視の度合いが低いとした更新日時、アクセス日時を基準とした時間差分の数値は、相対的に、大きな時間差分の数値となっている。
従って、重視の度合いが低く、かつ、時間差分の数値が大きな電子ファイル間の組み合わせは、重み付けされた時間差分の数値がさらに大きくなり、すなわち、関連性が低いと判断される。ここで記載した重視パラメータによる時間差分の数値の算出法は一例であり、利用者の意図が反映できる計算であればよい。
図13は、利用日時情報に基づく関連性分析結果データファイルに記録されたテーブルの例である。テーブルの1カラム目には、分析を行う際に、差分の算出の基準元となった電子ファイルのファイル名が、記録されている。テーブルの2カラム目には、1カラム目の電子ファイルが格納されているフォルダ名が記録されている。テーブルの3カラム目には、1カラム目の電子ファイルに対する重み付けされた時間差分の数値の小さいものの順に、相手の電子ファイルのファイル名が記録されている。テーブルの4カラム目には、3カラム目の電子ファイルが格納されているフォルダ名が、記録されている。テーブルの5カラム目には、重み付けされた時間差分の数値が、記録されている。ここで、例として、基準となる電子ファイルに対して、時間差分の数値の小さい電子ファイルを、小さい順に、5個、記載している。ここで、時間差分の数値の小さい電子ファイルの記録される数は、いくつでもよい。
このテーブルの場合、fileAに対して重み付けされた時間差分値がもっとも小さい電子ファイルは、fileFであることが分かる。重み付けされた時間差分値は25秒であり、短い時間間隔で使用されたファイルであることが分かる。以下、fileB、fileCも同様である。
図14は、コピー・ペースト情報データファイルに記録された、テーブルの例である。1カラム目に、コピー・ペーストの発生日時が記録されている。この1カラム目の発生日時は、例として記載しているが、本プログラムの処理には不要である。
2カラム目に、コピー・ペースト操作における、コピー元となった電子ファイルのファイル名が、記録されている。3カラム目に、2カラム目に記録された電子ファイルが格納されているフォルダ名が記録されている。4カラム目に、コピー・ペースト操作における、コピー先となった電子ファイルのファイル名が、記録されている。5カラム目に、4カラム目に記録された電子ファイルが格納されているフォルダ名が記録されている。
図15は、コピー・ペースト情報に基づく関連性分析結果データファイルに記録された、テーブルの例である。1カラム目と2カラム目に、コピー元となった電子ファイルのファイル名とそれが格納されているフォルダ名が記録されている。3カラム目と4カラム目に、コピー先となった電子ファイルのファイル名とそれが格納されているフォルダ名が記録されている。5カラム目に、電子ファイルの各組み合わせにおける、コピー・ペースト操作の発生回数が記録されている。
図16は、関連ファイル・フォルダ表示部を用いた、コンピュータ機器の画面上における、関連性の高い電子ファイルの表示例である。利用者が注目している電子ファイルを中心として、関連性分析結果データファイルにて、その電子ファイルと関連性が高いとされた電子ファイルを、画面上に、複数個、表示している。ここで、従来のディレクトリ型電子ファイルの格納構造とは無関係に、表示を行っている。ここで、画面表示のレイアウトなどのデザインは、関連性の強弱が分かれば、いかなるものでもよい。
図17は、関連ファイル・フォルダ表示部を用いた、コンピュータ機器の画面上における、関連性の高い電子フォルダの表示例である。利用者が注目しているフォルダを中心として、関連性分析結果データファイルにて、その電子ファイルと関連性が高いとされた、電子ファイルが格納されているフォルダを、画面上に、複数個、表示している。ここで、従来のディレクトリ型電子ファイルの格納構造とは無関係に、表示を行っている。ここで、画面表示のレイアウトなどのデザインは、関連性の強弱が分かれば、いかなるものでもよい。
図18は、関連ファイル・フォルダ表示部を用いた、コンピュータ機器の画面上における、関連性の高い電子ファイル、およびフォルダのいもづる式的な表示例である。ここで、図16での表示例に加えて、関連する電子ファイルが、さらに関連する電子ファイルを、いもづる式に表示している。ここで、画面表示のレイアウトなどのデザインは、関連性の強弱が分かれば、いかなるものでもよい。
図19は、コンピュータ機器上で一般に行われる、データのコピー・ペーストの例である。コンピュータ機器の利用者が、コンピュータ機器上で作業を行い、電子ファイルを作成する際、過去に作成した電子ファイルの一部、もしくは全部を引用することがある。図はその引用行為の例である。電子ファイルAの一部、「It'safinedaytoday.」を、電子ファイルBの途中に、挿入している。なお、ここでコピー・ペーストと呼んでいるのは、元となる電子ファイルのデータの一部、もしくは全部を削除して、新しい電子ファイルへペーストする、いわゆるカット・ペーストの場合も含む。
図20は、利用日時情報に基づく関連性分析結果データファイルの内容と、コピー・ペースト情報に基づく、関連性分析結果データファイルの内容とにおける、それぞれの関連性を表す数値を統計的に処理し、結合させた例である。テーブル2001は、ファイルAとファイルBとファイルCとファイルDに対する、利用日時情報に基づく関連性分析結果データファイルの例である。3カラム目に、重み付けがなされた時間差分の数値が記録されている。テーブル2002は、ファイルAとファイルBとファイルCに対する、コピー・ペースト情報に基づく関連性分析結果データの例である。3カラム目に、ファイル間のコピー・ペーストの発生回数が記録されている。テーブル2003は、これらテーブル2001の内容を、統合的に処理した例である。ここで、統合的に扱う例として、利用日時の時間差分の数値を、コピー・ペーストの発生回数に1を加えた値で除す例をあげる。テーブル2003の3カラム目には、時間差分の数値を発生回数で除した数値を記入している。利用日時の時間差分の数値が小さく、コピー・ペースト回数が大きいほど、この数値は小さくなるため、利用日時情報とコピー・ペースト回数の両方に基づいた、電子ファイル間の関連性の判断に利用できる。ここで、時間差分の数値とコピー・ペーストの発生回数の数値を統合的に処理する演算は、統計的に有意なものであれば、何でもよい。
図21は、本プログラムにおける、関連性ファイル・フォルダ表示部の、フローチャートである。本表示部の動作が開始されると、ステップ2101において、利用者による、関連する電子ファイル、もしくはフォルダの表示指示を待機する。表示の指示があった場合は、ステップ2102にうつり、関連性分析結果データファイルを開く。ここで、関連性分析結果データファイルは、利用日時情報に基づくものでも、コピー・ペースト情報ものでも、その両方に基づくものでも、いずれでもよい。次の、ステップ2103において、関連性分析結果データファイルにおいて、利用者から指示のあった電子ファイル、もしくはフォルダに対し、関連性が高いとされた電子ファイル、もしくはフォルダの情報を、検索し、取得する。次に、ステップ2104において、取得された電子ファイル、もしくはフォルダの名称を、画面上に表示する。その後、ステップ2101に戻り、常駐状態を続ける。ここで、本表示部は、コンピュータ機器の動作時間内において、常駐的に動作するものである。
本発明のプログラムの、全体構成図である。 本発明のプログラムと、そのプログラムが動作するコンピュータ機器との関係図である。 利用日時情報に基づく関連性分析部のフローチャートである。 サブルーチンである、利用日時情報データファイル作成部のフローチャートである。 サブルーチンである、利用日時差分データファイル作成部のフローチャートである。 サブルーチンである、利用日時重み付けデータファイル作成部のフローチャートである。 サブルーチンである、利用日時情報に基づく関連性分析結果データファイル作成部のフローチャートである。 コピー・ペースト情報に基づく関連性分析部のフローチャートである。 サブルーチンである、コピー・ペースト情報に基づく関連性分析結果データファイル作成部のフローチャートである。 利用日時情報データファイルの例である。 利用日時差分データファイルの例である。 利用日時重み付けデータの計算例である。 利用日時情報に基ついた場合の、関連性分析結果データファイルの例である。 コピー・ペースト情報データファイルの例である。 コピー・ペースト情報に基づく関連性分析結果データファイルの例である。 関連ファイルの表示例である。 関連フォルダの表示例である。 関連ファイルのいもづる式表示例である。 コピー・ペースト操作の例である。 利用日時情報に基づく関連性分析結果と、コピー・ペースト情報に基づく関連性分析結果の統合例である。 関連ファイル・関連フォルダ表示部のフローチャートである。
符号の説明
101 利用日時情報データファイル作成部
102 利用日時差分データファイル作成部
103 利用日時重み付けデータファイル作成部
104 利用日時に基づく関連性分析結果データファイル作成部
105 コピー・ペースト情報データファイル作成部
106 コピー・ペーストに基づく関連性分析結果データファイル作成部
107 関連性分析部
108 関連ファイル・関連フォルダ表示部
201 本発明のプログラム
202 本発明が動作するコンピュータ機器のオペレーティングシステム
203 電子ファイル群
204 画面表示部
205 コンピュータ機器
301 データファイルの作成ステップ
302 利用条件の入力ステップ
303 利用日時情報データファイルへの書き出しステップ
304 利用日時差分データファイルの作成部サブルーチン
305 利用日時差分重み付けデータファイル作成部サブルーチン
306 利用日時に基づく関連性分析結果データファイル作成部サブルーチン
401 分析対象のファイル種別を読み取るステップ
402 当該電子ファイルのファイル名と利用日時情報の読み取りをオペレーティングシステムに指示するステップ
403 利用日時情報データファイルに書き込むステップ
501 電子ファイル名と利用日時情報を読み取るステップ
502 電子ファイル対における時間差分を算出するステップ
503 利用日時差分データファイルに書き込むステップ
601 電子ファイル対と時間差分を読み取るステップ
602 重み付けパラメータを読み取るステップ
603 時間差分の数値を伸縮するステップ
604利用日時差分重み付けデータファイルに書き出すステップ
701 電子ファイルの組み合わせと重み付けされた時間差分を読み取るステップ
702 重み付けされた時間差分の数値の小さい順にソートするステップ
703 電子ファイルの格納されているフォルダ名を読み取るステップ
704 電子ファイル名、フォルダ名、時間差分を、時間差分の小さい順に書き出すステップ
801 各データファイルを作成するステップ
802 利用条件を入力するステップ
803 コピー・ペースト操作の監視ステップ
804 コピー・ペースト情報データ作成部ステップ
805 コピー・ペーストに基づく関連性分析結果データファイル作成部サブルーチン
901 コピー・ペースト分析データファイルの内容を読み取るステップ
902 電子ファイル組み合わせと、コピー・ペーストの回数を集計するステップ
903 関連性分析結果データファイルへ書き出すステップ
1200 利用日時情報の例のテーブル
1201 重視パラメータの例のテーブル
1202 重視パラメータが記載されたカラム
1203 係数化された重視パラメータが記載されたカラム
1204 重視パラメータに基づいて時間差分の伸縮を行った例を記載したテーブル
1205 実時間上の差分値を記載したカラム
1206 重視パラメータによって重み付けされた差分値を記載したカラム
2001 ファイルA、ファイルB、ファイルCのそれぞれに対する、利用日時情報に基づいた関連性分析結果データファイルの例のテーブル
2002 ファイルA、ファイルB、ファイルCのそれぞれに対する、コピー・ペースト情報に基づいた関連性分析結果データファイルの例のテーブル
2003 テーブル2001とテーブル2002の内容を統合したテーブル
2101 常駐を開始するステップ
2102 利用者による関連ファイル・関連フォルダの表示指示を監視するステップ
2103 関連ファイル・関連フォルダの表示の判断分岐ステップ
2104 関連性分析結果データファイルを開くステップ
2105 関連ファイル・関連フォルダを抽出するステップ
2106 関連ファイル・関連フォルダを画面表示するステップ

Claims (1)

  1. 情報を電子ファイルの形態で記録装置に格納するコンピュータ機器を、前記機器に格納されており、かつ、利用者の操作によって作成された情報を記録している電子ファイルに対し、前記機器のオペレーティングシステムが属性として付与する、電子ファイルの利用日時情報と、その利用日時情報の性質と、その電子ファイルの名称と、その電子ファイルの格納されているフォルダの名称の、種類の情報を、オペレーティングシステムに読み取りを行うように指示することにより、前記機器の利用時間にわたって一定時間間隔で連続的に採取し、採取された種類の情報を、前記機器内の記録装置内の利用日時情報データファイルに追記的に書き出し保存する手段と、
    前記機器の利用者によって実行される、電子ファイル間でのデータのコピー・ペーストの行為に対し、それら行為の発生の有無を、オペレーティングシステムを経由することにより、前記機器の利用時間にわたって監視し、それら行為が発生した場合、コピー元の電子ファイルの名称と、その電子ファイルが格納されているフォルダの名称と、ペースト先の電子ファイルの名称と、その電子ファイルが格納されているフォルダの名称の、4種類の情報を、オペレーティングシステムに読み取りを行うように指示することにより、前記機器の利用時間にわたって連続的に採取し、採取された4種類の情報を、コピー・ペースト情報データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
    利用日時情報データファイルに記録された電子ファイル全体に対して、電子ファイル名と利用日時情報の性質と利用日時情報の組を1単位とし、異なる電子ファイル間の全ての組合せを、前記機器上の演算装置を用いて生成し、前記全ての組合せについて、利用日時情報の時間差分を、前記機器上の演算装置を用いて算出し、得られた時間差分の数値に対し、利用者によって指定された、電子ファイルの作成・更新・アクセスの各作業特性を反映した利用日時情報の性質に対する重視パラメータに基づいた伸縮を、前記演算装置を用いて算出し、その結果得られる時間差分の数値の小さい電子ファイル対を、関連性の強い電子ファイル対として、それら組合せの電子ファイル名と、それら電子ファイルが格納されているフォルダ名と、その時間差分の数値と、を、利用日時情報に基づく関連性分析結果データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
    コピー・ペースト情報データファイルに記録された、コピー元・ペースト先の電子ファイル対に対して、それら電子ファイル対におけるコピー・ペースト発生回数を、前記機器上の演算装置を用いて、全ての対について集計し、コピー・ペースト発生回数の大きい電子ファイル対を、関連性の強いファイルとして、それら組合せのファイル名と、それら電子ファイルが格納されているフォルダ名と、コピー・ペースト発生回数とを、コピー・ペースト情報に基づく関連性分析結果データファイルとして、前記機器内の記録装置に書き出し保存する手段と、
    保存された利用日時情報に基づく関連性分析結果データファイル、および、コピー・ペースト情報に基づく関連性分析結果データファイルの内容を読み取り、それら内容に基づき、利用者から指示のあった電子ファイルに対して、関連性が強いとされた電子ファイルを、前記機器の画面上に表示する手段として、機能させるためのプログラム
JP2005087526A 2005-03-25 2005-03-25 電子ファイル関連強度自動算出プログラム Expired - Fee Related JP3806820B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005087526A JP3806820B1 (ja) 2005-03-25 2005-03-25 電子ファイル関連強度自動算出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005087526A JP3806820B1 (ja) 2005-03-25 2005-03-25 電子ファイル関連強度自動算出プログラム

Publications (2)

Publication Number Publication Date
JP3806820B1 true JP3806820B1 (ja) 2006-08-09
JP2006268598A JP2006268598A (ja) 2006-10-05

Family

ID=36968146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005087526A Expired - Fee Related JP3806820B1 (ja) 2005-03-25 2005-03-25 電子ファイル関連強度自動算出プログラム

Country Status (1)

Country Link
JP (1) JP3806820B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680237A (zh) * 2023-06-07 2023-09-01 宁波市电力设计院有限公司 一种基于云存储的文件整理方法、系统和存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059099A (ja) * 2006-08-29 2008-03-13 Access Co Ltd 情報表示装置、情報表示プログラム、および情報表示システム
JP2009176119A (ja) * 2008-01-25 2009-08-06 Sky Co Ltd ファイル利用状況判定システム
JP5488334B2 (ja) * 2010-08-20 2014-05-14 日本電気株式会社 関係コンテンツ評価装置、関係コンテンツ評価システムおよび関係コンテンツ評価方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680237A (zh) * 2023-06-07 2023-09-01 宁波市电力设计院有限公司 一种基于云存储的文件整理方法、系统和存储介质
CN116680237B (zh) * 2023-06-07 2024-07-05 宁波市电力设计院有限公司 一种基于云存储的文件整理方法、系统和存储介质

Also Published As

Publication number Publication date
JP2006268598A (ja) 2006-10-05

Similar Documents

Publication Publication Date Title
JP5689174B2 (ja) ファイル来歴記録システム、ファイル来歴管理装置及びファイル来歴記録方法
JP5238937B2 (ja) セグメンテーション定義の作成
US20140007014A1 (en) Method For Graphical Representation Of A Content Collection
JP4769005B2 (ja) 情報処理支援システム及び情報処理支援プログラム
JP5962277B2 (ja) 文書関連付け装置及びプログラム
US20080313158A1 (en) Database file management system, integration module and browsing interface of database file management system, database file management method
US20090070352A1 (en) Method, program and apparatus for management of related information
EP3103002B1 (en) Batch generation of links to documents based on document name and page content matching
JP2004220215A (ja) 計算機を利用した業務誘導支援システムおよび業務誘導支援方法
JP2011253572A (ja) 情報価値を反映した情報検索方法及びその装置
US20120066257A1 (en) Document management system, search designation method, and storage medium
JP3806820B1 (ja) 電子ファイル関連強度自動算出プログラム
US8060484B2 (en) Graphical user interface for data management
JP7322438B2 (ja) 情報処理装置および情報処理プログラム
JP5615593B2 (ja) 電子文書管理装置、表示方法、表示プログラムおよび記録媒体
JP4452866B2 (ja) 電子ファイル関連強度自動算出プログラム
JP6966289B2 (ja) 情報分析装置、プログラム及び方法
JP2005327297A (ja) 知識情報収集システムおよび知識情報収集方法
JP2004185346A (ja) プロジェクト作業支援方法およびシステム
JP2009199164A (ja) 文書管理装置、文書管理方法及び記録媒体
JP2014203392A (ja) 文書管理装置、文書管理方法、及びプログラム
JP3725088B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP3725837B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP7535873B2 (ja) データ取得装置、データ取得方法、及び、プログラム
JP2011100407A (ja) 検索システム及び検索システムにおける表示方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060427

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110526

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110526

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120526

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130526

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130526

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130526

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130526

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees