JP3673111B2 - Document management method, document management apparatus, and storage medium - Google Patents
Document management method, document management apparatus, and storage medium Download PDFInfo
- Publication number
- JP3673111B2 JP3673111B2 JP09389399A JP9389399A JP3673111B2 JP 3673111 B2 JP3673111 B2 JP 3673111B2 JP 09389399 A JP09389399 A JP 09389399A JP 9389399 A JP9389399 A JP 9389399A JP 3673111 B2 JP3673111 B2 JP 3673111B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- displayed
- index information
- screen
- editing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、例えば、WWWブラウザで閲覧されるWWWページや、ワードプロセッサ、エディタ、表計算ソフトその他のアプリケーションで作成される文書などを記憶・管理する文書管理装置に関する。
【0002】
【従来の技術】
近年のPCやワードプロセッサの普及によりオフィス内での文書の電子化が進んでいる。加えてインターネットやイントラネットの発達で電子メールの利用が急増し上記電子化をいっそう加速している。この結果多くのオフィスが大量の電子化されたデータで溢れかえるようになり、これらを効率良く整理し管理することの重要性が高まってきている。
【0003】
このためこれら電子化された文書を効率良く管理する様々な文書管理装置が開発されてきた。ある装置では文書の登録方法に特徴があり、デスクトップ上のアイコンに対してファイルをドラッグ&ドロップするだけでデータベースに登録することができる。またある装置では文書の検索方法に特徴があり、例えば「昨日の会議で配布された資料」の様に日常使っている自然言語で文書を検索することができる。また電子メイルに特化したある装置では、受け取った電子メールを自動的に取り込み、差出人ごとのフォルダに仕分けてくれる他、後から全文検索などで検索を行うことができる。また最近はこれらの特徴を兼ね備えた装置も出てきている。
【0004】
このように従来、文書管理装置として様々な装置が開発されてきたが、その登録機能はユーザが直接登録操作をしなければならないか、電子メールのように特定の文書だけを対象として自動登録できるシステムであった。
【0005】
また、インターネットとWWW(World Wide Web)の発達により、WWWブラウザを通して情報を入手する割合が増大しており、WWWページを管理することの重要性が高まっている。予め登録しておいたURLに従ってWEBサイトを自動巡回し、WWWページのコピーを収集するソフトが開発されている。しかし自分が見たページを対象として登録するものではない。
【0006】
また、WWWブラウザがディスク上に残しているWWWページのキャッシュを登録する機能を備えた装置がある。この機能を用いれば自分が見たページだけをデータベースに登録できるが、キャッシュがクリアされてしまうと登録できない問題がある。またキャッシュは短時間のうちに膨大な数になるため、登録前に適切なフィルタリングを行う必要があるが、今までにこのようなフィルタリング機能を備えた装置は登場していない。
【0007】
【発明が解決しようとする課題】
このように従来の文書管理装置の登録機能は、ユーザ自身が作成、編集、閲覧したもの、即ち自分が直接操作したもの全てを対象とした自動登録機能を備えたものではなく、ユーザ自身が直接登録操作をしなければならないか、あるいは前記メールのように特定の文書だけを対象としていた。
【0008】
またWWWブラウザを通して得られる膨大な情報に対し、実際に自分が見たページの中からフィルタリングで絞り込んだ物を自動的に登録する機能を備えた装置は存在しなかった。
【0009】
そこで、本発明は、上記問題点に鑑み、ユーザ自身が実際に作成、編集、あるいは閲覧した文書を後に検索可能にするインデックス情報を自動的に作成することにより、文書管理が容易に行える文書管理方法およびそれを用いた文書管理装置を提供することを目的とする。
【0010】
また本発明は、WWWブラウザを通して得られる膨大な文書の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的にローカルマシン上にコピーし、さらにこのコピーしたデータに対するインデックス情報を自動的に作成することにより、文書管理が容易に行える文書管理方法およびそれを用いた文書管理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明の文書管理方法は、記憶されている文書を検索するためのインデックス情報を作成するタイミングを設定して、その設定されたタイミングに従って該文書に関する属性情報を抽出してインデックス情報を作成して該文書に対応付けて記憶することにより、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて文書を容易に検索できる。
【0012】
また、本発明の文書管理方法は、閲覧された文書から抽出した属性情報と、選択すべき文書の属性を定めたプロファイル情報とに基づき、閲覧された文書のうち該文書を検索するためのインデックス情報を作成する文書を選択し、この選択された文書から抽出された属性情報から前記インデックス情報を作成して、前記選択された文書と前記インデックス情報とを対応付けて記憶することにより、WWWブラウザを通して得られる膨大な文書(WWWページ)の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的に記憶し、さらにこの記憶したデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて記憶したWWWページを容易に検索できる。
【0013】
本発明の文書管理装置は、記憶された文書を検索するためのインデックス情報を作成するタイミングを設定するタイミング設定手段と、前記設定されたタイミングで前記文書に関する属性情報を抽出してインデックス情報を作成する作成手段と、前記インデックス情報を該文書に対応付けて記憶する記憶手段とを具備したことにより、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて文書を容易に検索できる。
【0014】
好ましくは、前記インデックス情報に基づき文書を検索する検索手段と、この検索手段での検索結果を少なくとも前記インデックス情報とともに呈示する呈示手段とを具備する。
【0015】
また、本発明の文書管理装置は、閲覧された文書から属性情報を抽出する抽出手段と、前記抽出された属性情報と、選択すべき文書の属性を定めたプロファイル情報とに基づき、閲覧された文書のうち該文書を検索するためのインデックス情報を作成する文書を選択する選択手段と、前記選択された文書から抽出された属性情報から前記インデックス情報を作成する作成手段と、前記選択された文書と前記インデックス情報とを対応付けて記憶する記憶手段とを具備したことにより、WWWブラウザを通して得られる膨大な文書(WWWページ)の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的に記憶し、さらにこの記憶したデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて記憶したWWWページを容易に検索できる。また、WWWページのように日々更新される情報に対しても有効なインデックス情報を生成することが可能になる。
【0016】
好ましくは、前記インデックス情報に基づき文書を検索する検索手段と、この検索手段での検索結果を少なくとも前記インデックス情報とともに呈示する呈示手段とを具備する。例えば、ツリー形式と表形式とで呈示して、双方が互いに連携し合って表示することにより、検索結果から所望の文書を見つける場合など、ユーザにとって使い勝手がよくなる。
【0017】
好ましくは、前記プロファイル情報に基づき指定された属性情報を有する文書を検索する検索手段をさらに具備する。また、前記記憶手段で記憶された文書およびインデックス情報のうち、前記プロファイル情報に基づき指定された属性情報を有する文書およびそのインデックス情報を削除する削除手段をさらに具備する。これにより、文書の検索、削除がより合理的に行え、文書管理の上で利便性が向上する。
【0018】
なお、上記各手段は、コンピュータに実行させるプログラムとして、フロッピーディスク、CD−ROM等の記憶媒体に記録して頒布することができる。例えば、図1、図11のユーザインタフェース部15、ファイル記憶部8、インデックスデータベース9はコンピュータの持つハードウエア資源を利用して構成し、その他の構成部はコンピュータに実行させるプログラムで実現可能である。
【0019】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して説明する。
【0020】
(第1の実施形態)
図1は本発明の第1の実施形態にかかる文書管理装置の構成例を示したものである。
【0021】
閲覧部1は、ファイル記憶部8に保存されている例えば、テキスト文書、HTML文書等の電子化された文書を閲覧あるいは作成、編集するものである。閲覧部1は、この文書管理装置専用に作られたものの他、エディタやワープロなどの既存のアプリケーションなどによって構成される。
【0022】
登録動作設定部2は、閲覧部1で作成、編集、閲覧された文書に対するインデックス情報の作成を開始するタイミングとなる閲覧部1の動作を設定するものである。
【0023】
登録動作定義テーブル3は登録動作設定部2での設定内容を記録保管するためのもので、登録制御部4は、この登録動作定義テーブル3を参照しながら登録制御を行うようになっている。登録動作定義テーブル3は例えば、MS−Windowsの場合、レジストリやINIファイルなどを利用する。他のシステム、例えばUNIXやMacOSなどにおいても同様のものを用いる。
【0024】
登録制御部4は登録動作定義テーブル3の設定値を元に閲覧部1の動作を検知したら、キーワード抽出部5、属性取得部6、インデックス情報作成部7を制御してインデックス情報の作成、登録を実行する。
【0025】
キーワード抽出部5は閲覧部1で閲覧、作成、編集されている文書からキーワードを抽出するものである。キーワードの抽出方法、既存のものでよく、例えば、文書中のテキスト部分を形態素解析して、名詞等の単語を抽出し、その名詞の出現頻度を求めて、出現頻度の高いいくつかの名詞をキーワードとしてもよい。また、予め各分野毎にキーワードとなり得る単語が登録されている辞書を用いて、文書とこの辞書とのマッチングを行って、一致した単語を当該文書のキーワードとしてもよい。
【0026】
属性取得部6は、閲覧部1で閲覧、作成、編集されている文書のキーワード以外の属性を取得するものである。
【0027】
インデックス情報作成部7は、キーワード抽出部5および属性取得部6で得られたキーワードと各種属性値を基に、閲覧部1で閲覧あるいは作成編集された文書に対するインデックス情報を生成する。
【0028】
ファイル記憶部8は、文書の各種ファイルを保存するもので、ハードディスクや各種リムーバブルメディアで構成される。
【0029】
インデックスデータベース9はインデックス情報作成部7で作られたインデックス情報を保存管理するものであり、検索部10はこのインデックス情報により検索を行う。
【0030】
検索部10はユーザからの検索要求を基にインデックスデータベース9に対して検索を行い、その結果を検索結果呈示部14に伝える。
【0031】
検索結果呈示部14は、表形式呈示部11、ツリー形式呈示部12、連携制御部13の3つで構成され、検索部10での検索結果をユーザに呈示するものである。
【0032】
表形式呈示部11は、検索結果を1件につき1行の表にして呈示する。類似度やキーワードなどで結果を一覧しやすいように呈示する。
【0033】
ツリー形式呈示部12は、検索された文書ファイルがファイル記憶部8のどこに保存されているかをわかりやすく呈示するためにディレクトリ構造をツリー状に呈示する。
【0034】
連携制御部13は、表形式呈示部11とツリー形式呈示部12に対して行うユーザの文書選択操作に応じて両方の表示を連携させる制御を行う。
【0035】
ユーザインタフェース部15は、ディスプレイ装置等の出力装置、キーボード、マウス等の各種入力装置から構成され、ユーザが各種指示入力を行ったり、検索式を入力したり、また、文書の表示や、文書検索結果の表示等を行うようになっている。
【0036】
次に、図1の文書管理装置による登録タイミングとその設定について説明する。なお、ここで登録とは、ファイル記憶部8に既に記憶されている文書ファイルについてインデックス情報を作成して、そのインデックス情報をインデックスデータベースに登録することで、このことを「文書の登録」と呼ぶこともある。
【0037】
登録タイミングとして設定される閲覧部1の動作としては、例えば、
▲1▼閲覧部1の終了あるいは閲覧ウインドウのクローズ
▲2▼ユーザ操作によるファイルのセーブ
の2つがあり、ユーザは登録動作設定部2を通して、これら2つのいづれか1つ、あるいは両方を選択すればよい。例えば、▲1▼だけを設定すると閲覧、編集等された文書の全てが登録される。▲2▼だけを設定すると編集した文書だけが登録される。なお、閲覧部1が自動セーブの機能を有する場合、自動セーブ時の登録を▲2▼のオプションとして追加することができる。▲1▼と▲2▼の両方を設定すると▲1▼だけの設定と同じく閲覧された文書、編集された文書の全てが登録されるが、編集時の登録のタイミングが▲1▼だけの設定とは異なる。セーブ時の登録が基本になり、セーブ後に編集を行わずに終了した場合、終了時の登録は行われない。
【0038】
設定内容は登録動作定義テーブル3に書き込まれ、登録制御部4から参照される。
【0039】
以上が登録タイミングの設定手順である。
【0040】
図2は、文書管理装置で用いられるインデックス情報の構造を示した図で、文書ファイルに関する属性情報(例えば、ID番号、ファイル名、パス名、ファイルの種類、メディアの種類、作成日時、タイトル、作者等)と、該文書から抽出されたキーワードをから構成されていて、文書1つに対しこのインデックス情報が1つ作成される。
【0041】
ID番号は、インデックス情報の作成順に「1」、「2」、「3」…と順番に発番され、インデックスデータベース9に格納されている全てのインデックス情報においてユニークな整数値データである。
【0042】
ファイル名は、当該文書ファイルのファイル記憶部8上でのファイル名を表す文字列データである。
【0043】
パス名は、同じく当該文書ファイルのファイル記憶部8上でのパス名を表す文字列データである。
【0044】
ファイル名とパス名の表現方法は、この文書管理装置が動作するOSに依存し、例えばMS−Windowsの場合、それぞれ「Document.txt」、「c:¥home¥My Document¥document.txt」などの文字列データとなる。
【0045】
ファイルの種類は、図3に示すように、ファイルの種類を表す予め定義された数値データであり、例えば、この文書管理装置が動作するOSと利用するアプリケーションと対象とするファイルの種類とに依存する。例えばMS−Windows上でMS−Officeの各アプリケーションのファイルとリッチテキストフォーマット(RTF)ファイル、標準テキストファイルを対象とする場合、図3に示す定義値を利用する。
【0046】
メディアの種類は、図4に示すように、ファイルの保存場所の種類を表す予め定義された数値データであり、例えば、この文書管理装置が動作するOSに依存する。例えば、MS−Windowsの場合は図4に示すような定義値を利用する。
【0047】
作成日時は、当該文書ファイルが作成された日時、あるいは最終更新日時を表す日付型のデータである。
【0048】
タイトルは、当該文書ファイルのタイトルを表す文字列データである。
【0049】
作者は、当該文書ファイルを作成した作者を表す文字列データである。
【0050】
キーワードは、キーワード抽出部5で当該文書のテキスト部分から抽出したキーワードを値とするリスト型のデータである。
【0051】
次に、図5に示すフローチャートを参照して、登録制御部4によるインデックス情報の作成および登録の処理動作について説明する。
【0052】
登録制御部4は、閲覧部1で登録動作定義テーブル3に設定された動作、即ちファイルのセーブもしくは閲覧部1の終了動作の実行を監視する(ステップS1)。動作の実行を監視する方法には、システムに常駐するアプリケーションで標準的に用いられている方法を利用する。例えば、MS−Windowsの場合では、当該動作が行われる際に発生するWindowsメッセージを監視し、該メッセージに対してフックをかけることで当該動作の監視が行える。また、他の方法として、閲覧部1に既存のアプリケーションが利用された場合、該アプリケーション自身の機能として該設定された動作を検知し、さらにその動作に応じた処理を実行することも可能である。例えばMS−WindowsのアプリケーションであるMS−Wordや MS−Excelの場合、マクロ言語VBA(Visual Basic for Application)を用いてアプリケーションのコマンド自体を書き換えることによりアプリケーションの動作をカスタマイズすることが可能で、セーブコマンドに手を加えることでセーブ時の一連の登録処理を実行させることができる。また当該動作時に自動的に実行するマクロを作ることもできる。例えば、Auto_Close()マクロで任意のファイルをクローズした際の処理を、Auto_Exit()マクロでWord自体を終了する際の処理をそれぞれ記述することができるため、これらを用いて終了時の一連の登録処理を実行させることができる。
【0053】
予め設定したセーブあるいは終了の動作が検知された場合(ステップS2)、登録制御部4は、キーワード抽出部5を起動し、キーワード抽出部5は、閲覧部1で閲覧、編集、作成等されていた文書からキーワードを抽出する(ステップS3)。
【0054】
続いて、属性取得部6を起動し、閲覧部1よりファイル名、パス名、ファイルの種類、メディア種別、ファイル作成日時、タイトル、作者の各属性値を取得する(ステップS4)。
【0055】
続いてインデックス情報作成部7を起動し、キーワード抽出部5で抽出されたキーワードと属性取得部6で取得された各属性値を元に図2に示したインデックス情報を作成する(ステップS5)。
【0056】
続いてインデックス情報作成部7は、作成したインデックス情報をインデックスデータベース9に登録する(ステップS6)。
【0057】
属性取得部6での各属性値の取得方法、インデックス情報作成部7でのインデックス情報の作成方法、及びインデックス情報作成部でのインデックス情報のインデックスデータベース9への登録方法については後で改めて説明する。
【0058】
続いて、閲覧部1が引き続き動作しているかを調べる(ステップS7)。セーブ時の登録や、ウインドウを閉じての登録などで閲覧部1が引き続き動作中の場合は、再び(ステップS1)の監視状態に戻り、以上の動作が継続して行われる。
【0059】
以上の様に登録制御部4においてインデックス情報の作成および登録が行われる。
【0060】
次に、属性取得部6における各属性値の取得方法について説明する。
【0061】
ファイル名、パス名は閲覧部1から直接取得する。閲覧部1に既存のアプリケーションを利用する場合は、OS及びアプリケーションの機能から属性を取得する。例えばMS−Windows上のアプリケーションの場合、OLEオートメーションなどによって属性を取得することができる。
【0062】
ファイルの種類はファイル名から取得する。例えば MS−Windowsの場合、ファイル名の拡張子部分からファイルの種類を取得することができる。
【0063】
メディア種別はパス名からドライブ名を取り出し、OSの機能からドライブの種類を調べることによって取得する。
【0064】
ファイル作成日時はOSの機能を用いて取得する。例えば MS−Windowsの場合WindowsAPIの各関数を用いて実装する。
【0065】
タイトルは、当該文書ファイルが例えばMS−Wordの文書ファイルのようにファイル自身の属性としてタイトルを持っている場合には、このタイトルをそのまま利用する。当該文書ファイルが属性としてタイトル持っていない場合、あるいは属性の取得方法がわからない文書ファイルである場合には、例えば、当該文書ファイルのテキスト部分の最初の1文をタイトルとして利用する。この1文が文字列フィールドの大きさを越える場合には、その大きさまでをタイトルとして利用する。
【0066】
作者は、当該文書ファイルが自分の属性として作者の情報を持っている場合には、その値をそのまま利用する。当該文書ファイルが属性として作者の情報を持っていない場合、あるいは属性の取得方法がわからない文書ファイルである場合には、この文書管理装置が動作するOSが文書ファイルの作者を取り出すAPIを備えている場合、このAPI関数によって作者を取得する。APIが無い場合、あるいは値の取得に失敗した場合には、空の文字列を値とする。
【0067】
なお、閲覧部1に既存のアプリケーションを適用する場合、アプリケーションの機能として上記したような属性値を取得することが可能な場合にはこの機能によってその属性値を取得する。例えば MS−Windowsのアプリケーションの場合、OLEオートメーションの機能で属性値の多くをアプリケーションから取得することが可能である。
【0068】
以上のように属性取得部6において各属性値を取得する。
【0069】
次に、インデックス情報作成部7におけるインデックス情報の作成方法について説明する。
【0070】
まず、新しいインデックスを1つ生成し、
(ID番号)=(直前に作られたインデックスのID番号)+1
で定まるID番号を設定する。ID番号としては各インデックスにユニークな値が設定できれば上記方法でなくてもかまわない。例えばインデックス先のデータが無くなったような不要なインデックスの削除で欠番となったID番号を小さい物から優先的に割り当てるような方法でも良い。
【0071】
続いて、キーワード抽出部5で抽出された各キーワードを設定する。キーワードが抽出されなかった場合、本フィールドは空のリスト型となる。またキーワードの数が予めリスト型としてサポートしている最大要素数の上限を越える場合には、キーワードとして検出された順番に最大要素数分のリスト型を形成するものとする。
【0072】
最後に、属性取得部6で取得されたファイル名、パス名、ファイルの種類、メディア種別、ファイル作成日時、タイトル、作者の各属性値を設定する。
【0073】
以上のようにインデックス情報作成部7においてインデックス情報を作成する。
【0074】
次に、図6を参照して、インデックス情報作成部7がインデックスデータベース9にインデックス情報を登録する動作についてを説明する。
【0075】
インデックス情報作成部7は、その作成したインデックス情報と同じ文書のインデックス情報がインデックスデータベース9に既にあるかどうかを調べるために、当該インデックス情報にあるパス名と同じパス名を持ったインデックス情報がインデックスデータベース9にあるかを調べる(ステップS11)。
【0076】
同じパス名のインデックス情報が無い場合、当該作成したインデックス情報をインデックスデータベース9に新規登録する(ステップS12)。
【0077】
同じパス名のインデックス情報が既に存在する場合、この既に登録されたインデックス情報と作成したインデックス情報の各属性値を比較し、異なる属性値が1つ以上存在する場合には(ステップS13)、既にあるインデックス情報を今回作成したインデックス情報で更新する(ステップS14)。
【0078】
異なる属性値が1つも存在しない場合には、変更が無いので今回作成したインデックス情報を破棄し(ステップS15)、登録をしないで終了する。
【0079】
以上のようにして、インデックス情報作成部7においてインデックス情報がインデックスデータベース9へ登録される。
【0080】
次に、図7を参照して、検索部10における文書検索処理動作について説明する。
【0081】
ユーザインタフェース部15を介して、検索部10にインデックスデータベース9に対する検索式を入力する(ステップS21)。この検索式の中身はインデックスデータベース9に依存する。例えばインデックスデータベース9がSQL(Structured Query Language)ベースのデータベースの場合にはSQL文での検索式が用いられる。
【0082】
続いて、検索部10では、この検索式を用いてインデックスデータベース9からインデックス情報を検索し(ステップS22)、その検索結果を受け取って検索結果呈示部14に送る(ステップS23)。検索結果呈示部14では、検索されたインデックス情報をユーザインタフェース部15に呈示する。
【0083】
検索結果呈示部14に呈示された検索結果に所望の文書がない場合、ユーザは引き続き現在の検索結果を破棄してステップS21から検索をやり直すことができる。検索結果が多く所望の文書を見つけられない場合、現在の検索結果に対しての追加の検索を実行することができる(ステップS24)。追加の検索を行う場合には、現在の検索結果即ち検索された文書のすべてのインデックス情報のID番号をメモリ上にデータとして蓄えておき(ステップS25)、追加の検索によってインデックスデータベース9からインデックス情報を取得する際に、当該メモリ上のID番号と一致したものだけを取り出すようにすれば良い。また、それぞれの検索での検索結果を保存しておくことで、以前の検索結果に立ち戻ったり、追加の検索を複数平行して行うこともできる。
【0084】
以上のように検索部10において文書検索が実行される。
【0085】
次に、図8を参照して、検索結果呈示部14での検索結果の取得の動作を説明する。
【0086】
まず、ユーザインタフェース部15に呈示されたインデックス情報の中から、ユーザが所望の文書を選択する(ステップS31)。次に、選択された文書のインデックス情報からファイル名とパス名を抽出し(ステップS32)、ファイル名とパス名とが閲覧部1に伝えられる(ステップS33)。閲覧部1は当該ファイル名とパス名とからファイル記憶部8から該当する文書ファイルを読み込んで呈示する(ステップS34)。
【0087】
以上のように検索結果呈示部14における検索結果の取得が実行される。
【0088】
次に、検索結果呈示部14での検索結果の呈示方法について説明する。検索結果呈示部14では、図9に示すように、検索結果をディスプレイ装置の表示画面に、表形式呈示ウインドウとツリー形式呈示ウインドウとにそれぞれ呈示する。表形式呈示ウインドウには、各文書のインデックス情報の内容をその検索スコアの上位から順に表形式の呈示を行う。ツリー形式呈示ウインドウには、検索されたインデックス情報に含まれているパス情報を基にツリー状に呈示する。
【0089】
これら2つの呈示ウインドウは、連携制御部13によって互いに連携して動作し合う。例えば表形式呈示ウインドウに呈示された任意の文書をマウスなどでクリックして選択すると、ツリー形式呈示ウインドウ上の当該文書の部分が選択されハイライト表示などによって一目でわかるようになる。同様にツリー形式呈示ウインドウに呈示された任意の文書を選択すると、表形式呈示ウインドウ上の当該文書が選択されるようになる。
【0090】
このために連携制御部13では、一方の呈示ウインドウで選択された文書に対するインデックス情報のID番号を他方の呈示ウインドウに伝える働きをする。
【0091】
また、ツリー形式呈示ウインドウには、各フォルダ内の検索されなかった文書ファイルも同時に呈示するようにしてもよい(図10参照)。この場合は、検索されたファイルはハイライト表示を行うなどして検索されなかったファイルと一目で区別ができるようにする。
【0092】
以上のように検索結果呈示部14で検索結果の呈示を行う。
【0093】
(第2の実施形態)
本発明の第2の実施形態にかかる文書管理装置は、図1の閲覧部1に、WWWブラウザアプリケーションを適用した例で、管理対象の文書としての、ユーザ自身が閲覧したWWWページ(WWWブラウザ上に表示されているページ)に対し、後に当該WWWページを検索するために必要なインデックス情報を自動的に作成し、そのインデックス情報を用いて所望のWWWページを検索するためのものである。
【0094】
ところで、WWWページの場合、閲覧している実体は通常ローカルマシンの外にある。また、その実体は日々更新されることが多く、実体に対してのインデックス情報をファイリングしても後日の役に立たないケースが多い。このため、第2の実施形態では上記WWWページのコピーをローカルマシン上のファイルシステムに作成する機能を追加し、そのコピーに対するインデックス情報を作成してインデックスデータベースに登録する方式をとっている。
【0095】
また、日常WWWブラウザを通してWWWページを閲覧していると、知らず知らずのうちに膨大な数のページを閲覧していることに気がつく。第1の実施形態のように閲覧した文書(のインデックス情報)全てを登録する方式の場合、登録数が膨大になってしまうという問題が生じる。そこで第2の実施形態では、予めプロファイル情報を登録し、閲覧したWWWページに対して、このプロファイル情報によるフィルタリング処理を行う機能が追加されている。なお、第2の実施形態に係る文書管理装置の閲覧部は、図11に示すように、WWWブラウザ103に限定するものではなく、エディタやワープロなどの既存のアプリケーションを適用してもかまわない。前者のローカルマシン外にある実体をコピーしてインデックスを生成する機能は、エディタやワープロなどのアプリケーションでフロッピーディスクや光磁気ディスクなどの各種リムーバブルメディア上にある文書ファイルに対する閲覧や編集を行う際に適用することができる。また後者のプロファイル情報によるフィルタリング処理は、そのまま文書ファイルに対して適用することが可能である。
【0096】
図11は、第2の実施形態にかかる文書管理装置の構成例を示したものである。なお、図11において、図1と同一部分には同一符号を付し、異なる部分について説明する。すなわち、図11では、図1の閲覧部1をWWWブラウザ103に置き換え、図1の登録動作設定部2、登録動作定義テーブル3が、プロファイル設定部101、プロファイル登録テーブル102、フィルタリング部106、WWWページ取得・保存部117に置き換わり、さらに、プロファイル情報呈示部117が追加されてた構成となっている。
【0097】
WWWブラウザ103は、既存のブラウザアプリケーションで構成されるが、専用に作り込んだ物であっても構わない。
【0098】
プロファイル設定部101は、フィルタリング部106で行われる文書のフィルタリング処理を行う際に用いるプロファイル情報(図12参照)を設定するためのもので、図12に示すように、例えば、複数のキーワードと複数のURL(Uniform Resource Locator)をそれぞれ設定することができる。
【0099】
プロファイル登録テーブル102は、プロファイル設定部101で設定された図12に示したようなプロファイル情報を、設定された時間とともに、図13に示すテーブル形式で保存するものである。
【0100】
フィルタリング部106は、キーワード抽出部5で抽出されたキーワードと属性取得部6で取得された属性値とプロファイル登録テーブル102に設定された最新のプロファイル情報とを比較し、登録を行うか否かを登録制御部4に伝える。閲覧中のWWWページから抽出されたキーワードおよび属性値がプロファイル情報と一致しているときは、登録制御部4は、当該WWWページの登録を行う。
【0101】
WWWページ取得保存部107は、WWWブラウザ103で閲覧されたページを構成している各オブジェクトを1つのフォルダにまとめてファイル記憶部8上にコピーする。
【0102】
プロファイル情報呈示部117は、プロファイル登録テーブル102の内容を時系列でグラフィカルに呈示するためのもので、呈示したプロファイル情報を基にWWWページの検索と削除を行うこともできる(後述)。
【0103】
図14は、インデックス情報の構造を示したもので、ID番号、URL、フォルダ名、先頭ファイル名、タイトル、作成日時、キーワード、フィルタリング種別、ヒットしたキーワードの各項目によって構成され、登録されるWWWページごとに1つ作成される。
【0104】
ID番号はインデックス情報の作成順に「1」、「2」、「3」…と順番に発番され、インデックスデータベース9の全てのインデックス情報においてユニークな整数値データである。
【0105】
URLは、登録するWWWページのURLを表す文字列データである。
【0106】
フォルダ名はファイル記憶部8上にコピーしたWWWページを保存しているフォルダのパス名を表す文字列データである。
【0107】
先頭ファイル名は、フォルダ内の各ファイルの中で、先頭ページのHTML文書をコピーしたファイルのファイル名を表す文字列データである。
【0108】
タイトルは登録するWWWページに付けられたタイトルを表す文字列データである。
【0109】
作成日時は、コピーしたファイルが作成された日時、あるいは最終更新日時を表す日付型のデータである。
【0110】
キーワードは、キーワード抽出部5においてWWWページのテキスト部分に対して抽出したキーワードを値とするリスト型のデータである。キーワードが抽出されなかった場合、本フィールドは空のリスト型となる。またキーワードの数がリスト型として予め定められた最大要素数の上限を越える場合には、キーワードとして検出された順番に最大要素数分のリスト型を形成するものとする。
【0111】
フィルタリング種別は、登録するWWWページに対するフィルタリング処理がプロファイルに定義されたURLで行われたのか、キーワードで行われたのか、その両方で行われたのか、あるいはフィルタリングが行われなかったのかを表す予め定義された数値のデータで、図15に示す各定義値のいずれかの値を取る。
ヒットしたキーワードは、登録するWWWページに対するフィルタリング処理がキーワードで行われた際に、そのWWWページから抽出されたキーワードのうち、プロファイル情報のキーワードと一致したキーワードを値とするリスト型のデータである。キーワードによるフィルタリングが行われなかった場合、本フィールドは空のリスト型となる。
【0112】
次に、図16を参照して、登録制御部4におけるインデックス情報の作成および登録の処理動作について説明する。
【0113】
WWWブラウザ103で新たなWWWページが表示されたかを監視する(ステップS41)。この監視方法としては、システムに常駐するアプリケーションで標準的に用いられている方法を利用する。例えば、MS−Windowsの場合では、新たなWWWページが表示された際に発生するWindowsメッセージを監視し、そのメッセージに対してフックをかけることで新たなWWWページの表示されたこと検知する。
【0114】
新たなWWWページの表示が検知された場合(ステップS42)、プロファイル登録テーブル102を参照し、プロファイルとしてURLが登録されているかを調べる(ステップS43)。
【0115】
プロファイルにURLが登録されていない場合、ステップS46へ進む。一方、プロファイルにURLが登録されている場合、ステップS44へ進み、属性取得部6を起動し、属性取得部6がWWWページのURLをWWWブラウザ103から取得する(ステップS44)。
【0116】
次に、フィルタリング部106を起動し、プロファイルとして登録されているURLと、現在のWWWページのURLとを比較し、同じURLがあるかを調べる(ステップS45)。同じURLがある場合は、以下の処理を実行し、同じURLがない場合は登録処理を中断し、ステップS41へ戻り、WWWブラウザの監視を行う。
【0117】
次に、プロファイル登録テーブル102を参照し、プロファイルとしてキーワードが登録されているかを調べる(ステップS46)。プロファイルにキーワードが登録されていない場合、ステップS49へ進む。一方、プロファイルにキーワードが登録されている場合、すて47へ進み、キーワード抽出部5を起動し、WWWページ内のテキスト情報からキーワードを抽出する(ステップS47)。なお、キーワードの抽出は前述したように、通常のファイリングシステムや検索システムにおいて通常使われている方法によって行われるものとする。
【0118】
続いて、フィルタリング部106を起動し、当該WWWページから抽出されたキーワードとプロファイル登録テーブル102にプロファイルとして登録されたキーワードとを比較し照合を行う(ステップS48)。一致するキーワード存在しない場合、すなわち、プロファイルとして登録されたキーワードと同じキーワードが当該WWWページに存在しない場合、そのWWWページの登録を中断し、ステップS41へ戻り、再びWWWブラウザの監視を行う。
【0119】
続いて、インデックスデータベース9に当該WWWページと同じURLを持ったインデックス情報があるか否かを調べる(ステップS49)。同じURLのインデックス情報が無い場合は、ステップS51へ進み、以降の登録処理を実行する。インデックスデータベース9に当該WWWページと同じURLを持ったインデックス情報が存在する場合、そのインデックス情報が指しているフォルダにあるWWWページのコピーと閲覧されている当該WWWページを構成している各ファイルとの間でファイル名及びファイルの中身を比較し、異なるファイルが1つも存在しないときは(ステップS50)、その閲覧されているWWWページと同じものが既に登録されていると判断できるので、現在の登録処理を終了して、ステップS41へ戻り、再び、WWWブラウザの監視を行う。一方、異なるファイルが1つでも存在する場合、ステップS51へ進み、以降の登録処理を実行する。
【0120】
WWWページの登録処理では、まず、WWWページ取得・保存部107を起動し、当該WWWページのコピーをファイル記憶部8に作成する(ステップS51)。コピーの作成は、WWWページの自動巡回機能を持ったアプリケーションなどで一般的に行われている方法を用いて行う。
【0121】
次に、属性取得部6を起動して、当閲覧中のWWWページとそのWWWページのコピーから、フォルダ名、先頭ファイル名、タイトル、作成時間の各属性値を取得する(ステップS52)。このうちタイトルはWWWブラウザ103から直接取得する。フォルダ名と先頭ファイル名はコピーの作成時に情報を残しておき、これを読み出すことで取得する。作成時間はコピー先となるフォルダの作成時間を第1の実施形態の場合と同じ方法で取得する。あるいはOSの時計機能で現在の時間を求めてこれを作成時間としても良い。また、URLは先に処理(ステップS44)で取得してあるものを利用する。
【0122】
続いて、インデックス情報作成部7を起動し、キーワード抽出部5で抽出されたキーワードと、属性取得部6で取得された各属性値を基にインデックス情報を作成する(ステップS53)。インデックス情報の作成方法は第1の実施形態と同様である。作成したインデックス情報は、インデックスデータベース9に新規登録する(ステップS54)。その後、ステップS41へ戻り、WWWブラウザ103の監視を行い、以下ブラウザが終了するまで上記処理を継続して行う。
【0123】
次に、登録されたWWWページの検索処理動作について説明する。図11の文書管理装置には、検索部10に対して入力された検索式によって行う第1の実施形態と同様の検索機能と、プロファイル情報呈示部117からの検索機能の2つの検索機能がある。
【0124】
まず、検索部10に対して入力された検索式によって行う検索処理動作について説明する。ここでは、検索結果呈示部14の動作が第1の実施形態の場合と異なる。検索結果呈示部14は、図17に示すように検索されたWWWページを表形式呈示ウインドウとツリー形式呈示ウインドウとにそれぞれ呈示する。表形式呈示ウインドウでは、各WWWページのインデックス情報内容をその検索スコアの上位から順に表形式で呈示を行う。ツリー形式呈示ウインドウでは、各WWWページの中でURLが同じものを1つの階層にまとめ、図17に示すように、全体で2階層のツリー構造にした呈示を行う。これら2つの呈示ウインドウは連携制御部13によって第1の実施形態と同様に互いに連携して動作し合う。
【0125】
なお、ツリー形式呈示ウインドウでは、URLのドメイン表示部分を右側の要素、すなわち第1ドメインから順番に階層的にまとめた図18に示すようなツリー表示を行うこともできる。
【0126】
次に、プロファイル情報呈示部117からの検索処理動作について、図19と図20を参照して説明する。
【0127】
図19にプロファイル情報呈示部11でディスプレイ装置に表示された表示画面の一例を示す。プロファイル情報呈示部11は、プロファイル登録テーブル102の内容を時間軸201に従ってグラフィック表示したもので、プロファイルとして設定された全てのURLとキーワードを、それぞれの期間(プロファイル情報として設定されている、使われる期間)を表した線分で、URLの表示領域204、キーワードの表示領域205の各領域に表示する。例えば、URL「www.aaa.ddd.edu」は1999年11月中旬から2000年1月末まで、キーワード「ネットワーク」は2000年1月末までそれぞれ有効なプロファイル情報であることが図19の表示から確認できる。また、表示領域204、205は時間軸201の左右に付けられたスクロールボタン202、203をマウスなどのポインティングデバイスでクリックすることで左右に(時間軸で)スクロールさせることができる。
【0128】
以下、図20に示すフローチャートを参照して、プロファイル情報呈示部117からの検索処理動作について説明する。
【0129】
まず、ユーザは、プロファイル情報呈示部117より表示された図19に示した表示画面から任意のURL、キーワードを選択する(ステップS61)。以下、URLとキーワードをともに選択する場合を例にとり説明するが、いずれか一方のみを選択する場合も同様である。選択方法としては、ポインティングデバイスでURL、キーワードを表す線分をそれぞれクリックして選択する方法と、図19に示すように、縦の点線で示す時間を指定する線分206をポインティングデバイスによって左右に移動させ、所望のURL、キーワードの線分に重ねることで選択する方法の2種類の選択方法がある。なお後者では線分206を2本にして、両方の線分で囲んだ矩形領域でURL、キーワードを選択することも可能である。
【0130】
次に、検索ボタン207を押下する(ステップS62)。続いて、選択されたURL、キーワードが検索部10に伝えられると(ステップS63)、URLとキーワードとで行われたフィルタリング処理によって、既に登録されているWWWページのインデックス情報が、フィルタリング種別、URL、ヒットしたキーワードの各フィールドに対するフィールド検索によって検索される(ステップS64)。
【0131】
続いて、検索結果が検索結果呈示部14に伝えられ、図17、図18に示したような、検索結果を検索式での検索結果と同様に呈示する(ステップS65)。
【0132】
以下、第1の実施形態の検索と同様に、検索結果からWWWページを選択し(ステップS66)、対応するインデックス情報からファイル名とパス名を取得する(ステップS67)。続いてファイル名とパス名をWWWブラウザに103通知し(ステップS68)、WWWブラウザ103がファイル記憶部8から対応するWWWページを読み込んで呈示する(ステップS69)。
【0133】
次に、プロファイル情報呈示部117における、インデックス情報、WWWページのコピーファイル、プロファイル情報を削除する処理について説明する。
【0134】
プロファイル情報呈示部117は、先に説明したプロファイル情報からのWWWページの検索機能に加え、検索されたインデックス情報とWWWページのコピーファイルとをそれぞれインデックスデータベース9とファイル記憶部8から、さらにプロファイル情報をプロファイル登録テーブル102からそれぞれ削除する機能を有する。この機能により、既に不要となった過去に設定したプロファイル情報とこれに対応したWWWページのコピーファイルとインデックス情報とを効果的に削除することができる。以下、図21に示すフローチャートを参照して削除処理について説明する。
【0135】
まず、ユーザは、プロファイル情報呈示部117に表示された任意のURL、キーワードを選択する(ステップS71)。以下、URLとキーワードをともに選択する場合を例にとり説明すが、いずれか一方のみを選択する場合も同様である。選択方法としては、ポインティングデバイスでURL、キーワードを表す線分をクリックして選択する方法と、図19に示すように縦の点線で示す時間を指定する線分206をポインティングデバイスによって左右に移動させ、所望のURL、キーワードを表す線分に重ねることで選択する方法の2種類の選択方法がある。なお、後者においては、指定時間より以前に有効であった、即ち時間を示指定する線分206よりも左側の領域にのみ存在するURL、キーワードを表す線分を選択することや、あるいは、時間を指定する線分206を2本にして、両方の線分で囲んだ矩形領域でURL、キーワードを選択することもできる。
【0136】
次に、削除ボタン208を押下する(ステップS72)。このとき、選択されたURL、キーワードと同じものが、選択されたもの以外に存在しないかをチェックする(ステップS73)。存在する場合、これらのURL、キーワードは選択から外される(ステップS74)。そして、選択されたURL、キーワードが残っているかを調べる(ステップS75)。残っている場合には、ステップS76に進み、残っていない場合には削除を行わずに処理を終了する。
【0137】
続いて、URLとキーワードが検索部10に伝えられ(ステップS76)、URLとキーワードで行われたフィルタリング処理によって、登録されたWWWページのインデックス情報が、フィルタリング種別、URL、ヒットしたキーワードの各フィールドに対するフィールド検索によって検索される(ステップS77)。
【0138】
次に、プロファイル情報呈示部117では、この検索された全てのインデックス情報のそれぞれについて、フィルタリング種別、URL、ヒットしたキーワードの各フィールド値から、そのインデックス情報が選択した以外のURL、キーワードでフィルタリングされているか調べる(ステップS78)。他のURL、キーワードでフィルタリングされている場合、そのインデックス情報を削除対象から外す(ステップS79)。以上の処理の結果、削除対処となるインデックス情報が残っている場合は(ステップS80)、ステップS81へ進み、残っていない場合にはステップS84へ進む。
【0139】
プロファイル情報呈示部117は、削除対象のインデックス情報からファイル名とパス名を取得する(ステップS81)。プロファイル情報呈示部117では、ファイル記憶部8から対応するWWWページのコピーファイルを削除し(ステップS82)、続いて、インデックスデータベース9から対応するインデックス情報を削除し(ステップS83)、最後にプロファイル登録テーブル102から削除されたWWWページのファイルのプロファイル情報であるURL、キーワードを削除する(ステップS84)。
【0140】
なお、上記実施形態のみ限定されず、要旨を変更しない範囲で、例えば、第1の実施形態と第2の実施形態とを組み合わせる等して、適宜変形して実施できる。
【0141】
以上説明したように、上記実施形態によれば、閲覧部1での動作を検知して、予め設定した動作時に自動的にインデックス情報を作成することで、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、このインデックス情報を用いて後に簡単に文書を検索して呼び出すことが可能になる。
【0142】
また、予め設定したプロファイルを基に閲覧した文書(例えば、WWWページ)をフィルタリングし、閲覧した文書ファイルをコピーすることで、例えば、WWWブラウザを通して得られる膨大な文書のうち、予め設定したプロファイル情報にマッチするものだけを閲覧時に自動的にファイル記憶部8上にコピーし、さらにこのコピーしたデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて簡単に文書を検索して呼び出すことが可能になる。
【0143】
【発明の効果】
以上説明したように、本発明によれば、ユーザ自身が実際に作成、編集、あるいは閲覧した文書を後に容易に検索可能にして、文書管理が容易に行える。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る文書管理装置の構成例を示した図。
【図2】インデックス情報の構造を示した図。
【図3】ファイルの種類を示す値の具体例を示した図。
【図4】メディアの種類を示す値の具体例を示した図。
【図5】インデックス情報作成処理動作を説明するためのフローチャート。
【図6】インデックス情報のインデックスデータベースへの登録処理動作を説明するためのフローチャート。
【図7】検索処理動作を説明するためのフローチャート。
【図8】検索結果呈示部の検索結果取得処理動作を説明するためのフローチャート。
【図9】検索結果の呈示例を示した図。
【図10】検索結果の他の呈示例を示した図。
【図11】本発明の第2の実施形態にかかる文書管理装置の構成例を示した図。
【図12】プロファイル情報の構造を示した図。
【図13】プロファイル登録テーブルの構造を示した図。
【図14】インデックス情報の構造を示した図。
【図15】フィルタリング種別を表す値の具体例を示した図。
【図16】インデックス情報の作成処理動作を説明するためのフローチャート。
【図17】検索結果の呈示例を示した図。
【図18】検索結果の他の呈示例を示した図。
【図19】プロファイル情報呈示部の処理動作を説明するためのもので、プロファイル登録テーブルの内容を時間軸に従ってグラフィック表示したもので、プロファイルとして設定された全てのURLとキーワードを、それぞれの有効期間を表した線分で表示する様子を示した図。
【図20】図19に示した表示内容から文書の検索を行う場合の処理動作を説明するためのフローチャート。
【図21】図19に示した表示内容から文書、インデックス情報の削除を行う場合の処理動作を説明するためのフローチャート。
【符号の説明】
1…閲覧部
2…登録動作設定部
3…登録動作定義テーブル
4…登録制御部
5…キーワード抽出部
6…属性取得部
7…インデックス情報作成部
8…ファイル記憶部
9…インデックスデータベース
10…検索部
11…表形式呈示部
12…ツリー形式呈示部
13…連携制御部
14…検索結果呈示部
15…ユーザインタフェース部
101…プロファイル設定部
102…プロファイル登録テーブル
103…WWWブラウザ
106…フィルタリング部
107…WWWページ取得・保存部
117…プロファイル情報呈示部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a document management apparatus that stores and manages, for example, a WWW page browsed by a WWW browser, a document created by a word processor, an editor, spreadsheet software, or other applications.
[0002]
[Prior art]
With the spread of PCs and word processors in recent years, digitization of documents in offices is progressing. In addition, with the development of the Internet and intranet, the use of e-mail has increased rapidly, and the above digitization has been accelerated further. As a result, many offices are overflowing with a large amount of electronic data, and the importance of efficiently organizing and managing them is increasing.
[0003]
For this reason, various document management apparatuses for efficiently managing these digitized documents have been developed. A certain apparatus has a feature in a document registration method, and can be registered in a database simply by dragging and dropping a file with respect to an icon on a desktop. In addition, a certain apparatus has a feature in a document search method. For example, a document can be searched in a natural language used everyday such as “material distributed at a meeting yesterday”. In addition, a certain apparatus specialized for electronic mail automatically retrieves received electronic mails and sorts them into folders for each sender, and can also perform searches by full-text search later. Recently, devices having these features have also appeared.
[0004]
As described above, various devices have been developed as document management devices. However, the registration function can be automatically registered only for a specific document such as an e-mail or the user has to perform a direct registration operation. It was a system.
[0005]
In addition, with the development of the Internet and WWW (World Wide Web), the rate of obtaining information through a WWW browser is increasing, and the importance of managing WWW pages is increasing. Software that automatically circulates a WEB site according to a URL registered in advance and collects a copy of a WWW page has been developed. However, it is not intended to register the page that you have seen.
[0006]
In addition, there is an apparatus having a function of registering a cache of a WWW page left on a disk by a WWW browser. If you use this function, you can register only the pages you see in the database, but there is a problem that you cannot register if the cache is cleared. In addition, since the cache becomes enormous in a short time, it is necessary to perform appropriate filtering before registration, but no device having such a filtering function has appeared so far.
[0007]
[Problems to be solved by the invention]
As described above, the registration function of the conventional document management apparatus is not provided with an automatic registration function for all items created, edited, and browsed by the user, that is, directly operated by the user. Either a registration operation has to be performed, or only a specific document such as the mail is targeted.
[0008]
In addition, there has been no device that has a function of automatically registering a large amount of information obtained through the WWW browser by filtering out the pages actually viewed by filtering.
[0009]
In view of the above problems, the present invention provides document management that facilitates document management by automatically creating index information that allows a user to search for documents that are actually created, edited, or viewed later. It is an object to provide a method and a document management apparatus using the method.
[0010]
In addition, the present invention automatically copies only documents that hit preset profile information from a vast number of documents obtained through a WWW browser to a local machine at the time of browsing, and further automatically creates index information for the copied data. It is an object of the present invention to provide a document management method and a document management apparatus using the document management method, which can easily manage documents by creating them manually.
[0011]
[Means for Solving the Problems]
The document management method of the present invention sets the timing for creating index information for searching stored documents, extracts attribute information about the document according to the set timing, and creates index information. By storing in association with the document, index information for a document actually created, edited, or viewed by the user can be automatically created, and the document can be easily searched later using the index information.
[0012]
Further, the document management method of the present invention provides an index for searching a document among the browsed documents based on the attribute information extracted from the browsed document and the profile information defining the attribute of the document to be selected. By selecting a document for which information is to be created, creating the index information from attribute information extracted from the selected document, and storing the selected document and the index information in association with each other, a WWW browser Of the enormous amount of documents (WWW pages) obtained through the process, only those that hit the preset profile information are automatically stored at the time of browsing, and index information for the stored data is automatically created. The stored WWW page can be easily searched using this index information.
[0013]
The document management apparatus of the present invention creates timing information by setting timing for creating index information for searching stored documents, and extracts attribute information about the document at the set timing to create index information And a storage means for storing the index information in association with the document, thereby automatically creating index information for a document actually created, edited, or viewed by the user, The document can be easily searched using this index information.
[0014]
Preferably, a search means for searching for a document based on the index information and a presentation means for presenting a search result by the search means together with at least the index information are provided.
[0015]
Further, the document management apparatus of the present invention is browsed based on extraction means for extracting attribute information from the browsed document, the extracted attribute information, and profile information defining attributes of the document to be selected. Selection means for selecting a document for creating index information for searching the document among documents, creation means for creating the index information from attribute information extracted from the selected document, and the selected document And storage means for storing the index information in association with each other, so that only documents that hit preset profile information from among a huge number of documents (WWW pages) obtained through a WWW browser are automatically viewed. And automatically create index information for this stored data, and later on this index information You can easily search for WWW pages stored using. Also, it is possible to generate effective index information for information that is updated daily such as a WWW page.
[0016]
Preferably, a search means for searching for a document based on the index information and a presentation means for presenting a search result by the search means together with at least the index information are provided. For example, by presenting in a tree format and a table format and displaying both in cooperation with each other, it is convenient for the user to find a desired document from the search result.
[0017]
Preferably, the image processing apparatus further includes search means for searching for a document having attribute information designated based on the profile information. Further, the apparatus further includes a deletion unit that deletes the document having the attribute information designated based on the profile information and the index information among the document and the index information stored in the storage unit. This makes it possible to search and delete documents more rationally and improve convenience in document management.
[0018]
Each of the above means can be recorded and distributed as a program to be executed by a computer on a storage medium such as a floppy disk or a CD-ROM. For example, the
[0019]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0020]
(First embodiment)
FIG. 1 shows an example of the configuration of a document management apparatus according to the first embodiment of the present invention.
[0021]
The
[0022]
The registration
[0023]
The registered operation definition table 3 is for recording and storing the setting contents in the registered
[0024]
When the
[0025]
The
[0026]
The
[0027]
The index
[0028]
The
[0029]
The
[0030]
The
[0031]
The search
[0032]
The tabular
[0033]
The tree
[0034]
The
[0035]
The
[0036]
Next, registration timing and its setting by the document management apparatus of FIG. 1 will be described. Here, registration refers to creating index information for a document file already stored in the
[0037]
As an operation of the
(1) Termination of
(2) File saving by user operation
The user only has to select one or both of these two through the registration
[0038]
The setting contents are written in the registration operation definition table 3 and referred to by the
[0039]
The above is the registration timing setting procedure.
[0040]
FIG. 2 is a diagram showing the structure of index information used in the document management apparatus. The attribute information about the document file (for example, ID number, file name, path name, file type, media type, creation date, title, Author) and a keyword extracted from the document, and one index information is created for each document.
[0041]
The ID number is an integer value data that is unique in all index information stored in the
[0042]
The file name is character string data representing the file name of the document file on the
[0043]
Similarly, the path name is character string data representing the path name of the document file on the
[0044]
The method of expressing the file name and path name depends on the OS on which the document management apparatus operates. For example, in the case of MS-Windows, “Document.txt”, “c: \ home \ My Document \ document.txt”, etc. It becomes the character string data.
[0045]
As shown in FIG. 3, the file type is predefined numerical data representing the file type. For example, the file type depends on the OS on which the document management apparatus operates, the application to be used, and the target file type. To do. For example, when a file of each application of MS-Office, a rich text format (RTF) file, and a standard text file are targeted on MS-Windows, the definition values shown in FIG. 3 are used.
[0046]
As shown in FIG. 4, the media type is predefined numerical data representing the type of file storage location, and depends on, for example, the OS on which the document management apparatus operates. For example, in the case of MS-Windows, a definition value as shown in FIG. 4 is used.
[0047]
The creation date / time is date-type data representing the date / time when the document file was created or the last update date / time.
[0048]
The title is character string data representing the title of the document file.
[0049]
The author is character string data representing the author who created the document file.
[0050]
The keyword is list-type data whose value is the keyword extracted from the text portion of the document by the
[0051]
Next, processing operations for creating and registering index information by the
[0052]
The
[0053]
When a preset save or end operation is detected (step S2), the
[0054]
Subsequently, the
[0055]
Subsequently, the index
[0056]
Subsequently, the index
[0057]
A method for acquiring each attribute value in the
[0058]
Subsequently, it is checked whether or not the
[0059]
As described above, the
[0060]
Next, a method for acquiring each attribute value in the
[0061]
The file name and path name are obtained directly from the
[0062]
The file type is obtained from the file name. For example, in the case of MS-Windows, the file type can be acquired from the extension portion of the file name.
[0063]
The media type is obtained by extracting the drive name from the path name and examining the drive type from the OS function.
[0064]
The file creation date and time is acquired using the OS function. For example, in the case of MS-Windows, it implements using each function of WindowsAPI.
[0065]
If the document file has a title as an attribute of the file itself, such as an MS-Word document file, the title is used as it is. If the document file does not have a title as an attribute, or if it is a document file whose attribute acquisition method is unknown, for example, the first sentence of the text portion of the document file is used as the title. When this one sentence exceeds the size of the character string field, up to that size is used as a title.
[0066]
The author uses the value as it is when the document file has the author's information as its own attribute. If the document file does not have the author information as an attribute or is a document file whose attribute acquisition method is unknown, the OS on which the document management apparatus operates has an API for retrieving the author of the document file. In this case, the author is acquired by this API function. When there is no API or when acquisition of a value fails, an empty character string is set as the value.
[0067]
When an existing application is applied to the
[0068]
As described above, the
[0069]
Next, a method for creating index information in the index
[0070]
First, create a new index,
(ID number) = (ID number of the index created immediately before) +1
The ID number determined by is set. The ID number may not be the above method as long as a unique value can be set for each index. For example, a method may be used in which an ID number that is missing due to deletion of an unnecessary index that has lost data at the index destination is preferentially assigned from a small number.
[0071]
Subsequently, each keyword extracted by the
[0072]
Finally, the attribute value of the file name, path name, file type, media type, file creation date / time, title, and author acquired by the
[0073]
As described above, the index
[0074]
Next, with reference to FIG. 6, an operation in which the index
[0075]
In order to check whether the index information of the same document as the created index information already exists in the
[0076]
If there is no index information with the same path name, the created index information is newly registered in the index database 9 (step S12).
[0077]
When index information with the same path name already exists, the attribute values of the already registered index information and the created index information are compared, and when one or more different attribute values exist (step S13), Certain index information is updated with the index information created this time (step S14).
[0078]
If no different attribute value exists, the index information created this time is discarded because there is no change (step S15), and the process ends without registration.
[0079]
As described above, the index
[0080]
Next, a document search processing operation in the
[0081]
A search expression for the
[0082]
Subsequently, the
[0083]
If there is no desired document in the search result presented in the search
[0084]
As described above, the document search is executed in the
[0085]
Next, with reference to FIG. 8, the search result acquisition operation in the search
[0086]
First, the user selects a desired document from the index information presented on the user interface unit 15 (step S31). Next, the file name and path name are extracted from the index information of the selected document (step S32), and the file name and path name are transmitted to the browsing unit 1 (step S33). The
[0087]
As described above, the retrieval
[0088]
Next, a method for presenting search results in the search
[0089]
These two presentation windows operate in cooperation with each other by the
[0090]
For this purpose, the
[0091]
Further, the document file that has not been searched in each folder may be presented at the same time in the tree form presentation window (see FIG. 10). In this case, the searched file is highlighted so that it can be distinguished from the unsearched file at a glance.
[0092]
As described above, the search
[0093]
(Second Embodiment)
The document management apparatus according to the second embodiment of the present invention is an example in which a WWW browser application is applied to the
[0094]
By the way, in the case of a WWW page, the browsing entity is usually outside the local machine. In addition, the entity is often updated every day, and filing index information for the entity is often useless at a later date. For this reason, in the second embodiment, a function of creating a copy of the WWW page in the file system on the local machine is added, and index information for the copy is created and registered in the index database.
[0095]
In addition, when browsing WWW pages through a daily WWW browser, it is noticed that a huge number of pages are being browsed without knowing it. In the case of the method of registering all the documents (index information) viewed as in the first embodiment, there is a problem that the number of registrations becomes enormous. Therefore, in the second embodiment, a function is added in which profile information is registered in advance and filtering processing based on the profile information is performed on the browsed WWW page. Note that the browsing unit of the document management apparatus according to the second embodiment is not limited to the
[0096]
FIG. 11 shows a configuration example of the document management apparatus according to the second embodiment. In FIG. 11, the same parts as those in FIG. 1 are denoted by the same reference numerals, and different parts will be described. That is, in FIG. 11, the
[0097]
The
[0098]
The
[0099]
The profile registration table 102 stores the profile information set in the
[0100]
The
[0101]
The WWW page acquisition / save
[0102]
The profile
[0103]
FIG. 14 shows the structure of index information, which is composed of items of ID number, URL, folder name, head file name, title, creation date, keyword, filtering type, and hit keyword, and is registered. One is created for each page.
[0104]
The ID numbers are numbered in the order of creation of index information in the order of “1”, “2”, “3”... And are unique integer data in all index information in the
[0105]
The URL is character string data representing the URL of the WWW page to be registered.
[0106]
The folder name is character string data representing the path name of the folder storing the WWW page copied on the
[0107]
The first file name is character string data representing the file name of the file in which the HTML document of the first page is copied among the files in the folder.
[0108]
The title is character string data representing the title attached to the WWW page to be registered.
[0109]
The creation date / time is date-type data representing the date / time when the copied file was created or the last update date / time.
[0110]
The keyword is list-type data whose value is the keyword extracted from the text portion of the WWW page by the
[0111]
The filtering type indicates in advance whether the filtering process for the WWW page to be registered was performed with a URL defined in the profile, with a keyword, with both, or with no filtering. The defined numeric data takes one of the defined values shown in FIG.
The hit keyword is list-type data whose value is a keyword that matches the keyword of the profile information among the keywords extracted from the WWW page when the filtering process is performed on the WWW page to be registered. . If filtering by keyword is not performed, this field will be an empty list type.
[0112]
Next, with reference to FIG. 16, processing for creating and registering index information in the
[0113]
It is monitored whether a new WWW page is displayed on the WWW browser 103 (step S41). As this monitoring method, a method that is standardly used by an application resident in the system is used. For example, in the case of MS-Windows, a Windows message generated when a new WWW page is displayed is monitored, and it is detected that a new WWW page is displayed by hooking the message.
[0114]
When the display of a new WWW page is detected (step S42), the profile registration table 102 is referenced to check whether a URL is registered as a profile (step S43).
[0115]
If the URL is not registered in the profile, the process proceeds to step S46. On the other hand, if the URL is registered in the profile, the process proceeds to step S44, where the
[0116]
Next, the
[0117]
Next, referring to the profile registration table 102, it is checked whether or not a keyword is registered as a profile (step S46). If no keyword is registered in the profile, the process proceeds to step S49. On the other hand, if the keyword is registered in the profile, the process proceeds to 47, where the
[0118]
Subsequently, the
[0119]
Subsequently, it is checked whether or not there is index information having the same URL as the WWW page in the index database 9 (step S49). If there is no index information of the same URL, the process proceeds to step S51 and the subsequent registration process is executed. When index information having the same URL as the WWW page exists in the
[0120]
In the WWW page registration process, first, the WWW page acquisition / save
[0121]
Next, the
[0122]
Subsequently, the index
[0123]
Next, the search processing operation for the registered WWW page will be described. The document management apparatus shown in FIG. 11 has two search functions, that is, a search function similar to that of the first embodiment performed by a search expression input to the
[0124]
First, the search processing operation performed by the search expression input to the
[0125]
In the tree form presentation window, the tree display as shown in FIG. 18 in which the domain display portion of the URL is hierarchically arranged in order from the right element, that is, the first domain, can also be performed.
[0126]
Next, the search processing operation from the profile
[0127]
FIG. 19 shows an example of a display screen displayed on the display device by the profile
[0128]
Hereinafter, the search processing operation from the profile
[0129]
First, the user selects an arbitrary URL and keyword from the display screen shown in FIG. 19 displayed by the profile information presentation unit 117 (step S61). Hereinafter, a case where both a URL and a keyword are selected will be described as an example, but the same applies to the case where only one of them is selected. As a selection method, a method of clicking and selecting a line segment representing a URL and a keyword with a pointing device and a line segment 206 for designating a time indicated by a vertical dotted line as shown in FIG. There are two types of selection methods: a method of selecting by moving and overlaying on a desired URL and keyword line segment. In the latter case, it is also possible to select two URLs and keywords in a rectangular area surrounded by both line segments 206.
[0130]
Next, the search button 207 is pressed (step S62). Subsequently, when the selected URL and keyword are transmitted to the search unit 10 (step S63), the index information of the already registered WWW page is obtained by filtering type and URL by the filtering process performed on the URL and the keyword. The field search is performed for each field of the hit keyword (step S64).
[0131]
Subsequently, the search result is transmitted to the search
[0132]
Thereafter, similarly to the search of the first embodiment, a WWW page is selected from the search result (step S66), and the file name and path name are acquired from the corresponding index information (step S67). Subsequently, the file name and path name are notified to the WWW browser 103 (step S68), and the
[0133]
Next, processing for deleting index information, a WWW page copy file, and profile information in the profile
[0134]
In addition to the WWW page search function from the profile information described above, the profile
[0135]
First, the user selects an arbitrary URL and keyword displayed on the profile information presentation unit 117 (step S71). Hereinafter, a case where both a URL and a keyword are selected will be described as an example, but the same applies to the case where only one of them is selected. As a selection method, a method of selecting by clicking a line segment representing a URL or a keyword with a pointing device, and a line segment 206 for designating a time indicated by a vertical dotted line as shown in FIG. 19 are moved left and right by the pointing device. There are two types of selection methods: a method of selecting by overlaying on a line segment representing a desired URL and keyword. In the latter case, it is effective to select a line segment representing a URL or keyword that was valid before the specified time, that is, only in the area on the left side of the line segment 206 indicating the time, or the time. It is also possible to select two URLs and keywords in a rectangular area surrounded by both line segments 206.
[0136]
Next, the delete button 208 is pressed (step S72). At this time, it is checked whether or not the same URL and keyword as the selected one exist other than the selected one (step S73). If they exist, these URLs and keywords are removed from the selection (step S74). Then, it is checked whether the selected URL or keyword remains (step S75). When it remains, it progresses to step S76, and when it does not remain, a process is complete | finished without deleting.
[0137]
Subsequently, the URL and the keyword are transmitted to the search unit 10 (step S76), and the index information of the registered WWW page by filtering processing performed with the URL and the keyword includes the filtering type, URL, and hit keyword fields. Is searched by field search for (step S77).
[0138]
Next, in the profile
[0139]
The profile
[0140]
Note that the present invention is not limited to the above-described embodiment, and can be implemented with appropriate modifications, for example, by combining the first embodiment and the second embodiment within a range that does not change the gist.
[0141]
As described above, according to the above-described embodiment, the user himself / herself actually creates, edits, or creates index information by detecting an operation in the
[0142]
Further, by filtering a document (for example, a WWW page) viewed based on a preset profile and copying the browsed document file, for example, preset profile information in a huge document obtained through a WWW browser Are automatically copied onto the
[0143]
【The invention's effect】
As described above, according to the present invention, documents actually created, edited, or viewed by the user can be easily retrieved later, and document management can be easily performed.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration example of a document management apparatus according to a first embodiment of the present invention.
FIG. 2 is a diagram showing the structure of index information.
FIG. 3 is a diagram showing a specific example of a value indicating a file type.
FIG. 4 is a diagram showing a specific example of a value indicating the type of media.
FIG. 5 is a flowchart for explaining an index information creation processing operation;
FIG. 6 is a flowchart for explaining an operation of registering index information in an index database.
FIG. 7 is a flowchart for explaining a search processing operation;
FIG. 8 is a flowchart for explaining the search result acquisition processing operation of the search result presentation unit.
FIG. 9 is a diagram showing an example of presenting search results.
FIG. 10 is a diagram showing another example of presentation of search results.
FIG. 11 is a diagram showing a configuration example of a document management apparatus according to a second embodiment of the present invention.
FIG. 12 is a diagram showing the structure of profile information.
FIG. 13 is a diagram showing the structure of a profile registration table.
FIG. 14 is a diagram showing the structure of index information.
FIG. 15 is a diagram showing a specific example of a value indicating a filtering type.
FIG. 16 is a flowchart for explaining an index information creation processing operation;
FIG. 17 is a diagram showing an example of presenting search results.
FIG. 18 is a diagram showing another example of presentation of search results.
FIG. 19 is a diagram for explaining the processing operation of the profile information presentation unit, in which the contents of the profile registration table are graphically displayed according to the time axis, and all the URLs and keywords set as profiles are displayed for each valid period. The figure which showed a mode that it displayed with the line segment showing.
20 is a flowchart for explaining a processing operation when searching for a document from the display content shown in FIG.
FIG. 21 is a flowchart for explaining a processing operation when deleting document and index information from the display content shown in FIG. 19;
[Explanation of symbols]
1 ... Browsing part
2. Registration operation setting part
3 ... Registered action definition table
4. Registration control unit
5 ... Keyword extraction unit
6 ... Attribute acquisition unit
7 ... Index information creation part
8 ... File storage
9 ... Index database
10 ... Search section
11 ... Tabular presentation section
12 ... Tree format presentation section
13 ... Cooperation control unit
14 ... Search result presentation section
15. User interface section
101 ... Profile setting section
102 ... Profile registration table
103 ... WWW browser
106: Filtering unit
107 ... WWW page acquisition / storage unit
117 ... Profile information presentation part
Claims (16)
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えた文書管理装置における文書管理方法であって、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を含むことを特徴とする文書管理方法。A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
A document management method in a document management apparatus comprising:
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A document management method comprising:
前記文書管理装置が具備する第3の記憶手段に、入力された前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶するステップと、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択ステップと、
をさらに含み、
前記第5のステップは、前記登録タイミングが検知されたとき、前記選択ステップで選択された文書について、前記第3のステップで抽出されたキーワード及び前記第4のステップで取得された属性情報を含むインデックス情報を生成することを特徴とする請求項1記載の文書管理方法。An input step of inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Storing the inputted profile information together with a time when the profile information is inputted in a third storage means provided in the document management apparatus;
A selection step of selecting a document having a URL included in the profile information and an extracted document having the same keyword as the keyword included in the profile information from among the documents created, edited, and displayed on the screen;
Further including
The fifth step includes the keyword extracted in the third step and the attribute information acquired in the fourth step for the document selected in the selection step when the registration timing is detected. 2. The document management method according to claim 1, wherein index information is generated.
前記検索式と前記第2の記憶手段に記憶されているインデックス情報を用いて、前記第1の記憶手段から文書を検索する検索ステップと、
検索された各文書のインデックス情報と、前記第1の記憶手段での当該検索された文書の記憶位置を示す階層構造とを前記文書管理装置が具備する表示手段で表示するステップと、
前記表示手段で表示されたインデックス情報のうちの1つが選択されると、前記表示手段で表示された階層構造上の当該選択されたインデックス情報に対応する文書の記憶位置をハイライト表示するステップと、
をさらに含むことを特徴とする請求項1記載の文書管理方法。An input step for inputting a search expression for searching for a desired document;
A search step of searching for a document from the first storage means using the search formula and the index information stored in the second storage means;
Displaying the index information of each searched document and the hierarchical structure indicating the storage position of the searched document in the first storage means on the display means provided in the document management device;
When one of the index information displayed on the display means is selected, the step of highlighting the storage position of the document corresponding to the selected index information on the hierarchical structure displayed on the display means; ,
The document management method according to claim 1, further comprising:
前記選択ステップは、前記第3の記憶手段に記憶された複数のプロファイル情報のうち前記時刻が最新のプロファイル情報を用いて文書を選択することを特徴とする請求項2記載の文書管理方法。The third storage means stores a plurality of profile information input in time series by the input means together with the time when each profile information was input,
3. The document management method according to claim 2, wherein the selecting step selects a document by using profile information with the latest time among a plurality of profile information stored in the third storage unit.
前記表示手段で表示されたキーワード及びURLのうちの少なくとも1つを選択するステップと、
をさらに含み、
前記検索ステップは、選択されたキーワード及びURLのうちの少なくとも1つ含む検索式を用いて、前記第2の記憶手段からインデックス情報を検索し、前記第1の記憶手段から当該検索されたインデックス情報に対応する文書を検索することを特徴とする請求項4記載の文書管理方法。Each keyword and each URL included in each profile information stored in the third storage means, and a period during which each keyword and each URL was used as profile information based on the input time of each profile information Displaying on the display means provided in the document management apparatus;
Selecting at least one of the keyword and URL displayed on the display means;
Further including
The search step searches for index information from the second storage means using a search expression including at least one of the selected keyword and URL, and the searched index information from the first storage means. The document management method according to claim 4, wherein a document corresponding to is searched.
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する設定手段と、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する検知手段と、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する抽出手段と、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する取得手段と、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成する生成手段と、
前記インデックス情報を記憶する第2の記憶手段と、
を具備したことを特徴とする文書管理装置。A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. Setting means for setting;
Detection means for detecting the registration timing generated in the creation / editing / display means;
Extraction means for extracting a keyword from a document created, edited and displayed on the screen;
An acquisition means for acquiring attribute information including a file name of a document created, edited and displayed on the screen and a storage position in the first storage means in which the document is stored;
Generating to generate index information including keywords extracted by the extracting unit and attribute information acquired by the acquiring unit for a document created, edited, and displayed on the screen when the registration timing is detected Means,
Second storage means for storing the index information;
A document management apparatus comprising:
前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶する第3の記憶手段と、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択手段と、
をさらに具備し、
前記生成手段は、前記登録タイミングが検知されたとき、前記選択手段で選択された文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成することを特徴とする請求項7記載の文書管理装置。Means for inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Third storage means for storing the profile information together with the time when the profile information was input;
A selection unit that selects a document having a URL included in the profile information and a document extracted with the same keyword as the keyword included in the profile information, among documents created, edited, and displayed on the screen;
Further comprising
The generating unit generates index information including a keyword extracted by the extracting unit and attribute information acquired by the acquiring unit for the document selected by the selecting unit when the registration timing is detected. The document management apparatus according to claim 7.
前記検索式と前記第2の記憶手段に記憶されているインデックス情報を用いて、前記第1の記憶手段から文書を検索する検索手段と、
検索された各文書のインデックス情報と、前記第1の記憶手段での当該検索された文書の記憶位置を示す階層構造とを表示手段で表示する第1の表示制御手段と、
前記表示手段で表示されたインデックス情報のうちの1つが選択されると、前記表示手段で表示された階層構造上の当該選択されたインデックス情報に対応する文書の記憶位置をハイライト表示することを特徴とする請求項7記載の文書管理装置。An input means for inputting a search expression for searching for a desired document;
Search means for searching for a document from the first storage means using the search formula and index information stored in the second storage means;
First display control means for displaying index information of each searched document and a hierarchical structure indicating a storage position of the searched document in the first storage means on the display means;
When one of the index information displayed on the display means is selected, the storage position of the document corresponding to the selected index information on the hierarchical structure displayed on the display means is highlighted. The document management apparatus according to claim 7, wherein:
前記選択手段は、前記第3の記憶手段で記憶された複数のプロファイル情報のうち前記時刻が最新のプロファイル情報を用いて文書を選択することを特徴とする請求項8記載の文書管理装置。The third storage means stores a plurality of profile information input in time series by the input means together with the time when each profile information is input,
9. The document management apparatus according to claim 8, wherein the selection unit selects a document using profile information with the latest time among a plurality of profile information stored in the third storage unit.
前記表示手段で表示されたキーワード及びURLのうちの少なくとも1つを選択する手段と、
をさらに具備し、
前記検索手段は、選択されたキーワード及びURLのうちの少なくとも1つ含む検索式を用いて、前記第2の記憶手段からインデックス情報を検索し、前記第1の記憶手段から検索されたインデックス情報に対応する文書を検索することを特徴とする請求項10記載の文書管理装置。Each keyword and each URL included in each profile information stored in the third storage means, and a period during which each keyword and each URL was used as profile information based on the input time of each profile information Second display control means for displaying on the display means;
Means for selecting at least one of the keyword and URL displayed by the display means;
Further comprising
The search means searches for index information from the second storage means using a search expression including at least one of the selected keyword and URL, and sets the index information searched from the first storage means. The document management apparatus according to claim 10, wherein a corresponding document is searched.
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えたコンピュータに、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を実行させるためのプログラムを記録した機械読み取り可能な記録媒体。A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
On a computer with
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A machine-readable recording medium on which a program for executing the program is recorded.
キーワード及びURL(Uniform Resource Locator)のうちの少なくとも1つを含むプロファイル情報を入力する入力ステップと、
前記コンピュータが備える第3の記憶手段に、入力された前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶するステップと、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択ステップと、
をさらに含み、
前記第5のステップは、前記登録タイミングが検知されたとき、前記選択ステップで選択された文書について、前記第3のステップで抽出されたキーワード及び前記第4のステップで取得された属性情報を含むインデックス情報を生成することを特徴とする請求項13記載の記録媒体。The program is
An input step of inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Storing the input profile information together with the time at which the profile information was input in a third storage means provided in the computer;
A selection step of selecting a document having a URL included in the profile information and an extracted document having the same keyword as the keyword included in the profile information from among the documents created, edited, and displayed on the screen;
Further including
The fifth step includes the keyword extracted in the third step and the attribute information acquired in the fourth step for the document selected in the selection step when the registration timing is detected. 14. The recording medium according to claim 13, wherein index information is generated.
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えた文書管理装置における文書管理方法であって、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を含むことを特徴とする文書管理方法。A screen for creating, editing, and displaying a document, and a creation / edit / display means for detecting creation, editing, and display of the document,
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
A document management method in a document management apparatus comprising:
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A document management method comprising:
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する設定手段と、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する検知手段と、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する抽出手段と、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する取得手段と、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成する生成手段と、
前記インデックス情報を記憶する第2の記憶手段と、
を具備したことを特徴とする文書管理装置。A screen for creating, editing, and displaying a document, and a creation / edit / display means for detecting creation, editing, and display of the document,
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. Setting means for setting;
Detection means for detecting the registration timing generated in the creation / editing / display means;
Extraction means for extracting a keyword from a document created, edited and displayed on the screen;
An acquisition means for acquiring attribute information including a file name of a document created, edited and displayed on the screen and a storage position in the first storage means in which the document is stored;
Generating to generate index information including keywords extracted by the extracting unit and attribute information acquired by the acquiring unit for a document created, edited, and displayed on the screen when the registration timing is detected Means,
Second storage means for storing the index information;
A document management apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09389399A JP3673111B2 (en) | 1999-03-31 | 1999-03-31 | Document management method, document management apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09389399A JP3673111B2 (en) | 1999-03-31 | 1999-03-31 | Document management method, document management apparatus, and storage medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000285134A JP2000285134A (en) | 2000-10-13 |
JP3673111B2 true JP3673111B2 (en) | 2005-07-20 |
Family
ID=14095172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09389399A Expired - Fee Related JP3673111B2 (en) | 1999-03-31 | 1999-03-31 | Document management method, document management apparatus, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3673111B2 (en) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2363044A (en) * | 2000-05-16 | 2001-12-05 | Ibm | Method and computer system for selecting and displaying graphic objects |
EP1627284B1 (en) | 2003-05-23 | 2018-10-24 | IP Reservoir, LLC | Intelligent data storage and processing using fpga devices |
US10572824B2 (en) | 2003-05-23 | 2020-02-25 | Ip Reservoir, Llc | System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines |
JP4314074B2 (en) * | 2003-06-20 | 2009-08-12 | 株式会社リコー | Image forming apparatus, image forming system, image forming method, image forming program, and image forming program storage medium |
AU2006221023A1 (en) | 2005-03-03 | 2006-09-14 | Washington University | Method and apparatus for performing biosequence similarity searching |
JP4802672B2 (en) | 2005-11-14 | 2011-10-26 | 株式会社日立製作所 | Electronic document management apparatus, electronic document management program, electronic document management system |
JP4578454B2 (en) * | 2006-09-21 | 2010-11-10 | 株式会社ソニー・コンピュータエンタテインメント | Database generation method and information processing apparatus |
US7660793B2 (en) | 2006-11-13 | 2010-02-09 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
US8326819B2 (en) | 2006-11-13 | 2012-12-04 | Exegy Incorporated | Method and system for high performance data metatagging and data indexing using coprocessors |
WO2008063974A2 (en) * | 2006-11-13 | 2008-05-29 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
JPWO2008102727A1 (en) * | 2007-02-21 | 2010-05-27 | 日本電気株式会社 | Index generation device / system / program / method, search device / system / program / method |
JP4725627B2 (en) | 2008-10-02 | 2011-07-13 | ブラザー工業株式会社 | Communication device |
JP4702434B2 (en) | 2008-11-14 | 2011-06-15 | ブラザー工業株式会社 | Communication apparatus and control program |
JP2013196544A (en) * | 2012-03-22 | 2013-09-30 | Nec Corp | Document management system, document management method, and program therefor |
JP5907624B2 (en) * | 2013-09-13 | 2016-04-26 | シャープ株式会社 | Information processing device |
WO2018119035A1 (en) | 2016-12-22 | 2018-06-28 | Ip Reservoir, Llc | Pipelines for hardware-accelerated machine learning |
KR102345002B1 (en) * | 2018-08-29 | 2021-12-29 | 주식회사 아이팩토리 | Patent document creating device, method, computer program, computer-readable recording medium, server and system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214268A (en) * | 1997-01-29 | 1998-08-11 | Omron Corp | Method and device for retrieving document |
JPH1115854A (en) * | 1997-06-24 | 1999-01-22 | Omron Corp | Document processing method, its device and recording medium |
-
1999
- 1999-03-31 JP JP09389399A patent/JP3673111B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000285134A (en) | 2000-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3673111B2 (en) | Document management method, document management apparatus, and storage medium | |
US5913215A (en) | Browse by prompted keyword phrases with an improved method for obtaining an initial document set | |
US7315848B2 (en) | Web snippets capture, storage and retrieval system and method | |
US6073170A (en) | Information filtering device and information filtering method | |
US6226655B1 (en) | Method and apparatus for retrieving data from a network using linked location identifiers | |
US5721897A (en) | Browse by prompted keyword phrases with an improved user interface | |
US20040205514A1 (en) | Hyperlink preview utility and method | |
US10423697B2 (en) | User interface with navigation controls for the display or concealment of adjacent content | |
US8584009B2 (en) | Automatically propagating changes in document access rights for subordinate document components to superordinate document components | |
US20050203935A1 (en) | Clipboard content and document metadata collection | |
US20060167861A1 (en) | Methods and systems for managing data | |
US20060101102A1 (en) | Method for organizing a plurality of documents and apparatus for displaying a plurality of documents | |
US20050216452A1 (en) | Search capture | |
US20050216837A1 (en) | Unread-state management | |
US20050216886A1 (en) | Editing multi-layer documents | |
US20050240489A1 (en) | Retaining custom item order | |
US20050216528A1 (en) | Sharing collection-file contents | |
Jayawardana et al. | A personalized information environment for digital libraries | |
US20110252313A1 (en) | Document information selection method and computer program product | |
JP4469432B2 (en) | INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD | |
JP2004192355A (en) | Informational searching method, its device and computer program for information search | |
WO2004031956A1 (en) | Related information management method, program, and apparatus | |
JP3429225B2 (en) | Storage medium storing data search program | |
JP3707912B2 (en) | Graphical user interface | |
JP2007073072A (en) | Related document display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050421 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080428 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110428 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130428 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |