JP3673111B2 - Document management method, document management apparatus, and storage medium - Google Patents

Document management method, document management apparatus, and storage medium Download PDF

Info

Publication number
JP3673111B2
JP3673111B2 JP09389399A JP9389399A JP3673111B2 JP 3673111 B2 JP3673111 B2 JP 3673111B2 JP 09389399 A JP09389399 A JP 09389399A JP 9389399 A JP9389399 A JP 9389399A JP 3673111 B2 JP3673111 B2 JP 3673111B2
Authority
JP
Japan
Prior art keywords
document
displayed
index information
screen
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09389399A
Other languages
Japanese (ja)
Other versions
JP2000285134A (en
Inventor
保 長谷川
博史 杉山
達 上林
善啓 大盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP09389399A priority Critical patent/JP3673111B2/en
Publication of JP2000285134A publication Critical patent/JP2000285134A/en
Application granted granted Critical
Publication of JP3673111B2 publication Critical patent/JP3673111B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えば、WWWブラウザで閲覧されるWWWページや、ワードプロセッサ、エディタ、表計算ソフトその他のアプリケーションで作成される文書などを記憶・管理する文書管理装置に関する。
【0002】
【従来の技術】
近年のPCやワードプロセッサの普及によりオフィス内での文書の電子化が進んでいる。加えてインターネットやイントラネットの発達で電子メールの利用が急増し上記電子化をいっそう加速している。この結果多くのオフィスが大量の電子化されたデータで溢れかえるようになり、これらを効率良く整理し管理することの重要性が高まってきている。
【0003】
このためこれら電子化された文書を効率良く管理する様々な文書管理装置が開発されてきた。ある装置では文書の登録方法に特徴があり、デスクトップ上のアイコンに対してファイルをドラッグ&ドロップするだけでデータベースに登録することができる。またある装置では文書の検索方法に特徴があり、例えば「昨日の会議で配布された資料」の様に日常使っている自然言語で文書を検索することができる。また電子メイルに特化したある装置では、受け取った電子メールを自動的に取り込み、差出人ごとのフォルダに仕分けてくれる他、後から全文検索などで検索を行うことができる。また最近はこれらの特徴を兼ね備えた装置も出てきている。
【0004】
このように従来、文書管理装置として様々な装置が開発されてきたが、その登録機能はユーザが直接登録操作をしなければならないか、電子メールのように特定の文書だけを対象として自動登録できるシステムであった。
【0005】
また、インターネットとWWW(World Wide Web)の発達により、WWWブラウザを通して情報を入手する割合が増大しており、WWWページを管理することの重要性が高まっている。予め登録しておいたURLに従ってWEBサイトを自動巡回し、WWWページのコピーを収集するソフトが開発されている。しかし自分が見たページを対象として登録するものではない。
【0006】
また、WWWブラウザがディスク上に残しているWWWページのキャッシュを登録する機能を備えた装置がある。この機能を用いれば自分が見たページだけをデータベースに登録できるが、キャッシュがクリアされてしまうと登録できない問題がある。またキャッシュは短時間のうちに膨大な数になるため、登録前に適切なフィルタリングを行う必要があるが、今までにこのようなフィルタリング機能を備えた装置は登場していない。
【0007】
【発明が解決しようとする課題】
このように従来の文書管理装置の登録機能は、ユーザ自身が作成、編集、閲覧したもの、即ち自分が直接操作したもの全てを対象とした自動登録機能を備えたものではなく、ユーザ自身が直接登録操作をしなければならないか、あるいは前記メールのように特定の文書だけを対象としていた。
【0008】
またWWWブラウザを通して得られる膨大な情報に対し、実際に自分が見たページの中からフィルタリングで絞り込んだ物を自動的に登録する機能を備えた装置は存在しなかった。
【0009】
そこで、本発明は、上記問題点に鑑み、ユーザ自身が実際に作成、編集、あるいは閲覧した文書を後に検索可能にするインデックス情報を自動的に作成することにより、文書管理が容易に行える文書管理方法およびそれを用いた文書管理装置を提供することを目的とする。
【0010】
また本発明は、WWWブラウザを通して得られる膨大な文書の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的にローカルマシン上にコピーし、さらにこのコピーしたデータに対するインデックス情報を自動的に作成することにより、文書管理が容易に行える文書管理方法およびそれを用いた文書管理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明の文書管理方法は、記憶されている文書を検索するためのインデックス情報を作成するタイミングを設定して、その設定されたタイミングに従って該文書に関する属性情報を抽出してインデックス情報を作成して該文書に対応付けて記憶することにより、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて文書を容易に検索できる。
【0012】
また、本発明の文書管理方法は、閲覧された文書から抽出した属性情報と、選択すべき文書の属性を定めたプロファイル情報とに基づき、閲覧された文書のうち該文書を検索するためのインデックス情報を作成する文書を選択し、この選択された文書から抽出された属性情報から前記インデックス情報を作成して、前記選択された文書と前記インデックス情報とを対応付けて記憶することにより、WWWブラウザを通して得られる膨大な文書(WWWページ)の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的に記憶し、さらにこの記憶したデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて記憶したWWWページを容易に検索できる。
【0013】
本発明の文書管理装置は、記憶された文書を検索するためのインデックス情報を作成するタイミングを設定するタイミング設定手段と、前記設定されたタイミングで前記文書に関する属性情報を抽出してインデックス情報を作成する作成手段と、前記インデックス情報を該文書に対応付けて記憶する記憶手段とを具備したことにより、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて文書を容易に検索できる。
【0014】
好ましくは、前記インデックス情報に基づき文書を検索する検索手段と、この検索手段での検索結果を少なくとも前記インデックス情報とともに呈示する呈示手段とを具備する。
【0015】
また、本発明の文書管理装置は、閲覧された文書から属性情報を抽出する抽出手段と、前記抽出された属性情報と、選択すべき文書の属性を定めたプロファイル情報とに基づき、閲覧された文書のうち該文書を検索するためのインデックス情報を作成する文書を選択する選択手段と、前記選択された文書から抽出された属性情報から前記インデックス情報を作成する作成手段と、前記選択された文書と前記インデックス情報とを対応付けて記憶する記憶手段とを具備したことにより、WWWブラウザを通して得られる膨大な文書(WWWページ)の中から、予め設定したプロファイル情報にヒットするものだけを閲覧時に自動的に記憶し、さらにこの記憶したデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて記憶したWWWページを容易に検索できる。また、WWWページのように日々更新される情報に対しても有効なインデックス情報を生成することが可能になる。
【0016】
好ましくは、前記インデックス情報に基づき文書を検索する検索手段と、この検索手段での検索結果を少なくとも前記インデックス情報とともに呈示する呈示手段とを具備する。例えば、ツリー形式と表形式とで呈示して、双方が互いに連携し合って表示することにより、検索結果から所望の文書を見つける場合など、ユーザにとって使い勝手がよくなる。
【0017】
好ましくは、前記プロファイル情報に基づき指定された属性情報を有する文書を検索する検索手段をさらに具備する。また、前記記憶手段で記憶された文書およびインデックス情報のうち、前記プロファイル情報に基づき指定された属性情報を有する文書およびそのインデックス情報を削除する削除手段をさらに具備する。これにより、文書の検索、削除がより合理的に行え、文書管理の上で利便性が向上する。
【0018】
なお、上記各手段は、コンピュータに実行させるプログラムとして、フロッピーディスク、CD−ROM等の記憶媒体に記録して頒布することができる。例えば、図1、図11のユーザインタフェース部15、ファイル記憶部8、インデックスデータベース9はコンピュータの持つハードウエア資源を利用して構成し、その他の構成部はコンピュータに実行させるプログラムで実現可能である。
【0019】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して説明する。
【0020】
(第1の実施形態)
図1は本発明の第1の実施形態にかかる文書管理装置の構成例を示したものである。
【0021】
閲覧部1は、ファイル記憶部8に保存されている例えば、テキスト文書、HTML文書等の電子化された文書を閲覧あるいは作成、編集するものである。閲覧部1は、この文書管理装置専用に作られたものの他、エディタやワープロなどの既存のアプリケーションなどによって構成される。
【0022】
登録動作設定部2は、閲覧部1で作成、編集、閲覧された文書に対するインデックス情報の作成を開始するタイミングとなる閲覧部1の動作を設定するものである。
【0023】
登録動作定義テーブル3は登録動作設定部2での設定内容を記録保管するためのもので、登録制御部4は、この登録動作定義テーブル3を参照しながら登録制御を行うようになっている。登録動作定義テーブル3は例えば、MS−Windowsの場合、レジストリやINIファイルなどを利用する。他のシステム、例えばUNIXやMacOSなどにおいても同様のものを用いる。
【0024】
登録制御部4は登録動作定義テーブル3の設定値を元に閲覧部1の動作を検知したら、キーワード抽出部5、属性取得部6、インデックス情報作成部7を制御してインデックス情報の作成、登録を実行する。
【0025】
キーワード抽出部5は閲覧部1で閲覧、作成、編集されている文書からキーワードを抽出するものである。キーワードの抽出方法、既存のものでよく、例えば、文書中のテキスト部分を形態素解析して、名詞等の単語を抽出し、その名詞の出現頻度を求めて、出現頻度の高いいくつかの名詞をキーワードとしてもよい。また、予め各分野毎にキーワードとなり得る単語が登録されている辞書を用いて、文書とこの辞書とのマッチングを行って、一致した単語を当該文書のキーワードとしてもよい。
【0026】
属性取得部6は、閲覧部1で閲覧、作成、編集されている文書のキーワード以外の属性を取得するものである。
【0027】
インデックス情報作成部7は、キーワード抽出部5および属性取得部6で得られたキーワードと各種属性値を基に、閲覧部1で閲覧あるいは作成編集された文書に対するインデックス情報を生成する。
【0028】
ファイル記憶部8は、文書の各種ファイルを保存するもので、ハードディスクや各種リムーバブルメディアで構成される。
【0029】
インデックスデータベース9はインデックス情報作成部7で作られたインデックス情報を保存管理するものであり、検索部10はこのインデックス情報により検索を行う。
【0030】
検索部10はユーザからの検索要求を基にインデックスデータベース9に対して検索を行い、その結果を検索結果呈示部14に伝える。
【0031】
検索結果呈示部14は、表形式呈示部11、ツリー形式呈示部12、連携制御部13の3つで構成され、検索部10での検索結果をユーザに呈示するものである。
【0032】
表形式呈示部11は、検索結果を1件につき1行の表にして呈示する。類似度やキーワードなどで結果を一覧しやすいように呈示する。
【0033】
ツリー形式呈示部12は、検索された文書ファイルがファイル記憶部8のどこに保存されているかをわかりやすく呈示するためにディレクトリ構造をツリー状に呈示する。
【0034】
連携制御部13は、表形式呈示部11とツリー形式呈示部12に対して行うユーザの文書選択操作に応じて両方の表示を連携させる制御を行う。
【0035】
ユーザインタフェース部15は、ディスプレイ装置等の出力装置、キーボード、マウス等の各種入力装置から構成され、ユーザが各種指示入力を行ったり、検索式を入力したり、また、文書の表示や、文書検索結果の表示等を行うようになっている。
【0036】
次に、図1の文書管理装置による登録タイミングとその設定について説明する。なお、ここで登録とは、ファイル記憶部8に既に記憶されている文書ファイルについてインデックス情報を作成して、そのインデックス情報をインデックスデータベースに登録することで、このことを「文書の登録」と呼ぶこともある。
【0037】
登録タイミングとして設定される閲覧部1の動作としては、例えば、
▲1▼閲覧部1の終了あるいは閲覧ウインドウのクローズ
▲2▼ユーザ操作によるファイルのセーブ
の2つがあり、ユーザは登録動作設定部2を通して、これら2つのいづれか1つ、あるいは両方を選択すればよい。例えば、▲1▼だけを設定すると閲覧、編集等された文書の全てが登録される。▲2▼だけを設定すると編集した文書だけが登録される。なお、閲覧部1が自動セーブの機能を有する場合、自動セーブ時の登録を▲2▼のオプションとして追加することができる。▲1▼と▲2▼の両方を設定すると▲1▼だけの設定と同じく閲覧された文書、編集された文書の全てが登録されるが、編集時の登録のタイミングが▲1▼だけの設定とは異なる。セーブ時の登録が基本になり、セーブ後に編集を行わずに終了した場合、終了時の登録は行われない。
【0038】
設定内容は登録動作定義テーブル3に書き込まれ、登録制御部4から参照される。
【0039】
以上が登録タイミングの設定手順である。
【0040】
図2は、文書管理装置で用いられるインデックス情報の構造を示した図で、文書ファイルに関する属性情報(例えば、ID番号、ファイル名、パス名、ファイルの種類、メディアの種類、作成日時、タイトル、作者等)と、該文書から抽出されたキーワードをから構成されていて、文書1つに対しこのインデックス情報が1つ作成される。
【0041】
ID番号は、インデックス情報の作成順に「1」、「2」、「3」…と順番に発番され、インデックスデータベース9に格納されている全てのインデックス情報においてユニークな整数値データである。
【0042】
ファイル名は、当該文書ファイルのファイル記憶部8上でのファイル名を表す文字列データである。
【0043】
パス名は、同じく当該文書ファイルのファイル記憶部8上でのパス名を表す文字列データである。
【0044】
ファイル名とパス名の表現方法は、この文書管理装置が動作するOSに依存し、例えばMS−Windowsの場合、それぞれ「Document.txt」、「c:¥home¥My Document¥document.txt」などの文字列データとなる。
【0045】
ファイルの種類は、図3に示すように、ファイルの種類を表す予め定義された数値データであり、例えば、この文書管理装置が動作するOSと利用するアプリケーションと対象とするファイルの種類とに依存する。例えばMS−Windows上でMS−Officeの各アプリケーションのファイルとリッチテキストフォーマット(RTF)ファイル、標準テキストファイルを対象とする場合、図3に示す定義値を利用する。
【0046】
メディアの種類は、図4に示すように、ファイルの保存場所の種類を表す予め定義された数値データであり、例えば、この文書管理装置が動作するOSに依存する。例えば、MS−Windowsの場合は図4に示すような定義値を利用する。
【0047】
作成日時は、当該文書ファイルが作成された日時、あるいは最終更新日時を表す日付型のデータである。
【0048】
タイトルは、当該文書ファイルのタイトルを表す文字列データである。
【0049】
作者は、当該文書ファイルを作成した作者を表す文字列データである。
【0050】
キーワードは、キーワード抽出部5で当該文書のテキスト部分から抽出したキーワードを値とするリスト型のデータである。
【0051】
次に、図5に示すフローチャートを参照して、登録制御部4によるインデックス情報の作成および登録の処理動作について説明する。
【0052】
登録制御部4は、閲覧部1で登録動作定義テーブル3に設定された動作、即ちファイルのセーブもしくは閲覧部1の終了動作の実行を監視する(ステップS1)。動作の実行を監視する方法には、システムに常駐するアプリケーションで標準的に用いられている方法を利用する。例えば、MS−Windowsの場合では、当該動作が行われる際に発生するWindowsメッセージを監視し、該メッセージに対してフックをかけることで当該動作の監視が行える。また、他の方法として、閲覧部1に既存のアプリケーションが利用された場合、該アプリケーション自身の機能として該設定された動作を検知し、さらにその動作に応じた処理を実行することも可能である。例えばMS−WindowsのアプリケーションであるMS−Wordや MS−Excelの場合、マクロ言語VBA(Visual Basic for Application)を用いてアプリケーションのコマンド自体を書き換えることによりアプリケーションの動作をカスタマイズすることが可能で、セーブコマンドに手を加えることでセーブ時の一連の登録処理を実行させることができる。また当該動作時に自動的に実行するマクロを作ることもできる。例えば、Auto_Close()マクロで任意のファイルをクローズした際の処理を、Auto_Exit()マクロでWord自体を終了する際の処理をそれぞれ記述することができるため、これらを用いて終了時の一連の登録処理を実行させることができる。
【0053】
予め設定したセーブあるいは終了の動作が検知された場合(ステップS2)、登録制御部4は、キーワード抽出部5を起動し、キーワード抽出部5は、閲覧部1で閲覧、編集、作成等されていた文書からキーワードを抽出する(ステップS3)。
【0054】
続いて、属性取得部6を起動し、閲覧部1よりファイル名、パス名、ファイルの種類、メディア種別、ファイル作成日時、タイトル、作者の各属性値を取得する(ステップS4)。
【0055】
続いてインデックス情報作成部7を起動し、キーワード抽出部5で抽出されたキーワードと属性取得部6で取得された各属性値を元に図2に示したインデックス情報を作成する(ステップS5)。
【0056】
続いてインデックス情報作成部7は、作成したインデックス情報をインデックスデータベース9に登録する(ステップS6)。
【0057】
属性取得部6での各属性値の取得方法、インデックス情報作成部7でのインデックス情報の作成方法、及びインデックス情報作成部でのインデックス情報のインデックスデータベース9への登録方法については後で改めて説明する。
【0058】
続いて、閲覧部1が引き続き動作しているかを調べる(ステップS7)。セーブ時の登録や、ウインドウを閉じての登録などで閲覧部1が引き続き動作中の場合は、再び(ステップS1)の監視状態に戻り、以上の動作が継続して行われる。
【0059】
以上の様に登録制御部4においてインデックス情報の作成および登録が行われる。
【0060】
次に、属性取得部6における各属性値の取得方法について説明する。
【0061】
ファイル名、パス名は閲覧部1から直接取得する。閲覧部1に既存のアプリケーションを利用する場合は、OS及びアプリケーションの機能から属性を取得する。例えばMS−Windows上のアプリケーションの場合、OLEオートメーションなどによって属性を取得することができる。
【0062】
ファイルの種類はファイル名から取得する。例えば MS−Windowsの場合、ファイル名の拡張子部分からファイルの種類を取得することができる。
【0063】
メディア種別はパス名からドライブ名を取り出し、OSの機能からドライブの種類を調べることによって取得する。
【0064】
ファイル作成日時はOSの機能を用いて取得する。例えば MS−Windowsの場合WindowsAPIの各関数を用いて実装する。
【0065】
タイトルは、当該文書ファイルが例えばMS−Wordの文書ファイルのようにファイル自身の属性としてタイトルを持っている場合には、このタイトルをそのまま利用する。当該文書ファイルが属性としてタイトル持っていない場合、あるいは属性の取得方法がわからない文書ファイルである場合には、例えば、当該文書ファイルのテキスト部分の最初の1文をタイトルとして利用する。この1文が文字列フィールドの大きさを越える場合には、その大きさまでをタイトルとして利用する。
【0066】
作者は、当該文書ファイルが自分の属性として作者の情報を持っている場合には、その値をそのまま利用する。当該文書ファイルが属性として作者の情報を持っていない場合、あるいは属性の取得方法がわからない文書ファイルである場合には、この文書管理装置が動作するOSが文書ファイルの作者を取り出すAPIを備えている場合、このAPI関数によって作者を取得する。APIが無い場合、あるいは値の取得に失敗した場合には、空の文字列を値とする。
【0067】
なお、閲覧部1に既存のアプリケーションを適用する場合、アプリケーションの機能として上記したような属性値を取得することが可能な場合にはこの機能によってその属性値を取得する。例えば MS−Windowsのアプリケーションの場合、OLEオートメーションの機能で属性値の多くをアプリケーションから取得することが可能である。
【0068】
以上のように属性取得部6において各属性値を取得する。
【0069】
次に、インデックス情報作成部7におけるインデックス情報の作成方法について説明する。
【0070】
まず、新しいインデックスを1つ生成し、
(ID番号)=(直前に作られたインデックスのID番号)+1
で定まるID番号を設定する。ID番号としては各インデックスにユニークな値が設定できれば上記方法でなくてもかまわない。例えばインデックス先のデータが無くなったような不要なインデックスの削除で欠番となったID番号を小さい物から優先的に割り当てるような方法でも良い。
【0071】
続いて、キーワード抽出部5で抽出された各キーワードを設定する。キーワードが抽出されなかった場合、本フィールドは空のリスト型となる。またキーワードの数が予めリスト型としてサポートしている最大要素数の上限を越える場合には、キーワードとして検出された順番に最大要素数分のリスト型を形成するものとする。
【0072】
最後に、属性取得部6で取得されたファイル名、パス名、ファイルの種類、メディア種別、ファイル作成日時、タイトル、作者の各属性値を設定する。
【0073】
以上のようにインデックス情報作成部7においてインデックス情報を作成する。
【0074】
次に、図6を参照して、インデックス情報作成部7がインデックスデータベース9にインデックス情報を登録する動作についてを説明する。
【0075】
インデックス情報作成部7は、その作成したインデックス情報と同じ文書のインデックス情報がインデックスデータベース9に既にあるかどうかを調べるために、当該インデックス情報にあるパス名と同じパス名を持ったインデックス情報がインデックスデータベース9にあるかを調べる(ステップS11)。
【0076】
同じパス名のインデックス情報が無い場合、当該作成したインデックス情報をインデックスデータベース9に新規登録する(ステップS12)。
【0077】
同じパス名のインデックス情報が既に存在する場合、この既に登録されたインデックス情報と作成したインデックス情報の各属性値を比較し、異なる属性値が1つ以上存在する場合には(ステップS13)、既にあるインデックス情報を今回作成したインデックス情報で更新する(ステップS14)。
【0078】
異なる属性値が1つも存在しない場合には、変更が無いので今回作成したインデックス情報を破棄し(ステップS15)、登録をしないで終了する。
【0079】
以上のようにして、インデックス情報作成部7においてインデックス情報がインデックスデータベース9へ登録される。
【0080】
次に、図7を参照して、検索部10における文書検索処理動作について説明する。
【0081】
ユーザインタフェース部15を介して、検索部10にインデックスデータベース9に対する検索式を入力する(ステップS21)。この検索式の中身はインデックスデータベース9に依存する。例えばインデックスデータベース9がSQL(Structured Query Language)ベースのデータベースの場合にはSQL文での検索式が用いられる。
【0082】
続いて、検索部10では、この検索式を用いてインデックスデータベース9からインデックス情報を検索し(ステップS22)、その検索結果を受け取って検索結果呈示部14に送る(ステップS23)。検索結果呈示部14では、検索されたインデックス情報をユーザインタフェース部15に呈示する。
【0083】
検索結果呈示部14に呈示された検索結果に所望の文書がない場合、ユーザは引き続き現在の検索結果を破棄してステップS21から検索をやり直すことができる。検索結果が多く所望の文書を見つけられない場合、現在の検索結果に対しての追加の検索を実行することができる(ステップS24)。追加の検索を行う場合には、現在の検索結果即ち検索された文書のすべてのインデックス情報のID番号をメモリ上にデータとして蓄えておき(ステップS25)、追加の検索によってインデックスデータベース9からインデックス情報を取得する際に、当該メモリ上のID番号と一致したものだけを取り出すようにすれば良い。また、それぞれの検索での検索結果を保存しておくことで、以前の検索結果に立ち戻ったり、追加の検索を複数平行して行うこともできる。
【0084】
以上のように検索部10において文書検索が実行される。
【0085】
次に、図8を参照して、検索結果呈示部14での検索結果の取得の動作を説明する。
【0086】
まず、ユーザインタフェース部15に呈示されたインデックス情報の中から、ユーザが所望の文書を選択する(ステップS31)。次に、選択された文書のインデックス情報からファイル名とパス名を抽出し(ステップS32)、ファイル名とパス名とが閲覧部1に伝えられる(ステップS33)。閲覧部1は当該ファイル名とパス名とからファイル記憶部8から該当する文書ファイルを読み込んで呈示する(ステップS34)。
【0087】
以上のように検索結果呈示部14における検索結果の取得が実行される。
【0088】
次に、検索結果呈示部14での検索結果の呈示方法について説明する。検索結果呈示部14では、図9に示すように、検索結果をディスプレイ装置の表示画面に、表形式呈示ウインドウとツリー形式呈示ウインドウとにそれぞれ呈示する。表形式呈示ウインドウには、各文書のインデックス情報の内容をその検索スコアの上位から順に表形式の呈示を行う。ツリー形式呈示ウインドウには、検索されたインデックス情報に含まれているパス情報を基にツリー状に呈示する。
【0089】
これら2つの呈示ウインドウは、連携制御部13によって互いに連携して動作し合う。例えば表形式呈示ウインドウに呈示された任意の文書をマウスなどでクリックして選択すると、ツリー形式呈示ウインドウ上の当該文書の部分が選択されハイライト表示などによって一目でわかるようになる。同様にツリー形式呈示ウインドウに呈示された任意の文書を選択すると、表形式呈示ウインドウ上の当該文書が選択されるようになる。
【0090】
このために連携制御部13では、一方の呈示ウインドウで選択された文書に対するインデックス情報のID番号を他方の呈示ウインドウに伝える働きをする。
【0091】
また、ツリー形式呈示ウインドウには、各フォルダ内の検索されなかった文書ファイルも同時に呈示するようにしてもよい(図10参照)。この場合は、検索されたファイルはハイライト表示を行うなどして検索されなかったファイルと一目で区別ができるようにする。
【0092】
以上のように検索結果呈示部14で検索結果の呈示を行う。
【0093】
(第2の実施形態)
本発明の第2の実施形態にかかる文書管理装置は、図1の閲覧部1に、WWWブラウザアプリケーションを適用した例で、管理対象の文書としての、ユーザ自身が閲覧したWWWページ(WWWブラウザ上に表示されているページ)に対し、後に当該WWWページを検索するために必要なインデックス情報を自動的に作成し、そのインデックス情報を用いて所望のWWWページを検索するためのものである。
【0094】
ところで、WWWページの場合、閲覧している実体は通常ローカルマシンの外にある。また、その実体は日々更新されることが多く、実体に対してのインデックス情報をファイリングしても後日の役に立たないケースが多い。このため、第2の実施形態では上記WWWページのコピーをローカルマシン上のファイルシステムに作成する機能を追加し、そのコピーに対するインデックス情報を作成してインデックスデータベースに登録する方式をとっている。
【0095】
また、日常WWWブラウザを通してWWWページを閲覧していると、知らず知らずのうちに膨大な数のページを閲覧していることに気がつく。第1の実施形態のように閲覧した文書(のインデックス情報)全てを登録する方式の場合、登録数が膨大になってしまうという問題が生じる。そこで第2の実施形態では、予めプロファイル情報を登録し、閲覧したWWWページに対して、このプロファイル情報によるフィルタリング処理を行う機能が追加されている。なお、第2の実施形態に係る文書管理装置の閲覧部は、図11に示すように、WWWブラウザ103に限定するものではなく、エディタやワープロなどの既存のアプリケーションを適用してもかまわない。前者のローカルマシン外にある実体をコピーしてインデックスを生成する機能は、エディタやワープロなどのアプリケーションでフロッピーディスクや光磁気ディスクなどの各種リムーバブルメディア上にある文書ファイルに対する閲覧や編集を行う際に適用することができる。また後者のプロファイル情報によるフィルタリング処理は、そのまま文書ファイルに対して適用することが可能である。
【0096】
図11は、第2の実施形態にかかる文書管理装置の構成例を示したものである。なお、図11において、図1と同一部分には同一符号を付し、異なる部分について説明する。すなわち、図11では、図1の閲覧部1をWWWブラウザ103に置き換え、図1の登録動作設定部2、登録動作定義テーブル3が、プロファイル設定部101、プロファイル登録テーブル102、フィルタリング部106、WWWページ取得・保存部117に置き換わり、さらに、プロファイル情報呈示部117が追加されてた構成となっている。
【0097】
WWWブラウザ103は、既存のブラウザアプリケーションで構成されるが、専用に作り込んだ物であっても構わない。
【0098】
プロファイル設定部101は、フィルタリング部106で行われる文書のフィルタリング処理を行う際に用いるプロファイル情報(図12参照)を設定するためのもので、図12に示すように、例えば、複数のキーワードと複数のURL(Uniform Resource Locator)をそれぞれ設定することができる。
【0099】
プロファイル登録テーブル102は、プロファイル設定部101で設定された図12に示したようなプロファイル情報を、設定された時間とともに、図13に示すテーブル形式で保存するものである。
【0100】
フィルタリング部106は、キーワード抽出部5で抽出されたキーワードと属性取得部6で取得された属性値とプロファイル登録テーブル102に設定された最新のプロファイル情報とを比較し、登録を行うか否かを登録制御部4に伝える。閲覧中のWWWページから抽出されたキーワードおよび属性値がプロファイル情報と一致しているときは、登録制御部4は、当該WWWページの登録を行う。
【0101】
WWWページ取得保存部107は、WWWブラウザ103で閲覧されたページを構成している各オブジェクトを1つのフォルダにまとめてファイル記憶部8上にコピーする。
【0102】
プロファイル情報呈示部117は、プロファイル登録テーブル102の内容を時系列でグラフィカルに呈示するためのもので、呈示したプロファイル情報を基にWWWページの検索と削除を行うこともできる(後述)。
【0103】
図14は、インデックス情報の構造を示したもので、ID番号、URL、フォルダ名、先頭ファイル名、タイトル、作成日時、キーワード、フィルタリング種別、ヒットしたキーワードの各項目によって構成され、登録されるWWWページごとに1つ作成される。
【0104】
ID番号はインデックス情報の作成順に「1」、「2」、「3」…と順番に発番され、インデックスデータベース9の全てのインデックス情報においてユニークな整数値データである。
【0105】
URLは、登録するWWWページのURLを表す文字列データである。
【0106】
フォルダ名はファイル記憶部8上にコピーしたWWWページを保存しているフォルダのパス名を表す文字列データである。
【0107】
先頭ファイル名は、フォルダ内の各ファイルの中で、先頭ページのHTML文書をコピーしたファイルのファイル名を表す文字列データである。
【0108】
タイトルは登録するWWWページに付けられたタイトルを表す文字列データである。
【0109】
作成日時は、コピーしたファイルが作成された日時、あるいは最終更新日時を表す日付型のデータである。
【0110】
キーワードは、キーワード抽出部5においてWWWページのテキスト部分に対して抽出したキーワードを値とするリスト型のデータである。キーワードが抽出されなかった場合、本フィールドは空のリスト型となる。またキーワードの数がリスト型として予め定められた最大要素数の上限を越える場合には、キーワードとして検出された順番に最大要素数分のリスト型を形成するものとする。
【0111】
フィルタリング種別は、登録するWWWページに対するフィルタリング処理がプロファイルに定義されたURLで行われたのか、キーワードで行われたのか、その両方で行われたのか、あるいはフィルタリングが行われなかったのかを表す予め定義された数値のデータで、図15に示す各定義値のいずれかの値を取る。
ヒットしたキーワードは、登録するWWWページに対するフィルタリング処理がキーワードで行われた際に、そのWWWページから抽出されたキーワードのうち、プロファイル情報のキーワードと一致したキーワードを値とするリスト型のデータである。キーワードによるフィルタリングが行われなかった場合、本フィールドは空のリスト型となる。
【0112】
次に、図16を参照して、登録制御部4におけるインデックス情報の作成および登録の処理動作について説明する。
【0113】
WWWブラウザ103で新たなWWWページが表示されたかを監視する(ステップS41)。この監視方法としては、システムに常駐するアプリケーションで標準的に用いられている方法を利用する。例えば、MS−Windowsの場合では、新たなWWWページが表示された際に発生するWindowsメッセージを監視し、そのメッセージに対してフックをかけることで新たなWWWページの表示されたこと検知する。
【0114】
新たなWWWページの表示が検知された場合(ステップS42)、プロファイル登録テーブル102を参照し、プロファイルとしてURLが登録されているかを調べる(ステップS43)。
【0115】
プロファイルにURLが登録されていない場合、ステップS46へ進む。一方、プロファイルにURLが登録されている場合、ステップS44へ進み、属性取得部6を起動し、属性取得部6がWWWページのURLをWWWブラウザ103から取得する(ステップS44)。
【0116】
次に、フィルタリング部106を起動し、プロファイルとして登録されているURLと、現在のWWWページのURLとを比較し、同じURLがあるかを調べる(ステップS45)。同じURLがある場合は、以下の処理を実行し、同じURLがない場合は登録処理を中断し、ステップS41へ戻り、WWWブラウザの監視を行う。
【0117】
次に、プロファイル登録テーブル102を参照し、プロファイルとしてキーワードが登録されているかを調べる(ステップS46)。プロファイルにキーワードが登録されていない場合、ステップS49へ進む。一方、プロファイルにキーワードが登録されている場合、すて47へ進み、キーワード抽出部5を起動し、WWWページ内のテキスト情報からキーワードを抽出する(ステップS47)。なお、キーワードの抽出は前述したように、通常のファイリングシステムや検索システムにおいて通常使われている方法によって行われるものとする。
【0118】
続いて、フィルタリング部106を起動し、当該WWWページから抽出されたキーワードとプロファイル登録テーブル102にプロファイルとして登録されたキーワードとを比較し照合を行う(ステップS48)。一致するキーワード存在しない場合、すなわち、プロファイルとして登録されたキーワードと同じキーワードが当該WWWページに存在しない場合、そのWWWページの登録を中断し、ステップS41へ戻り、再びWWWブラウザの監視を行う。
【0119】
続いて、インデックスデータベース9に当該WWWページと同じURLを持ったインデックス情報があるか否かを調べる(ステップS49)。同じURLのインデックス情報が無い場合は、ステップS51へ進み、以降の登録処理を実行する。インデックスデータベース9に当該WWWページと同じURLを持ったインデックス情報が存在する場合、そのインデックス情報が指しているフォルダにあるWWWページのコピーと閲覧されている当該WWWページを構成している各ファイルとの間でファイル名及びファイルの中身を比較し、異なるファイルが1つも存在しないときは(ステップS50)、その閲覧されているWWWページと同じものが既に登録されていると判断できるので、現在の登録処理を終了して、ステップS41へ戻り、再び、WWWブラウザの監視を行う。一方、異なるファイルが1つでも存在する場合、ステップS51へ進み、以降の登録処理を実行する。
【0120】
WWWページの登録処理では、まず、WWWページ取得・保存部107を起動し、当該WWWページのコピーをファイル記憶部8に作成する(ステップS51)。コピーの作成は、WWWページの自動巡回機能を持ったアプリケーションなどで一般的に行われている方法を用いて行う。
【0121】
次に、属性取得部6を起動して、当閲覧中のWWWページとそのWWWページのコピーから、フォルダ名、先頭ファイル名、タイトル、作成時間の各属性値を取得する(ステップS52)。このうちタイトルはWWWブラウザ103から直接取得する。フォルダ名と先頭ファイル名はコピーの作成時に情報を残しておき、これを読み出すことで取得する。作成時間はコピー先となるフォルダの作成時間を第1の実施形態の場合と同じ方法で取得する。あるいはOSの時計機能で現在の時間を求めてこれを作成時間としても良い。また、URLは先に処理(ステップS44)で取得してあるものを利用する。
【0122】
続いて、インデックス情報作成部7を起動し、キーワード抽出部5で抽出されたキーワードと、属性取得部6で取得された各属性値を基にインデックス情報を作成する(ステップS53)。インデックス情報の作成方法は第1の実施形態と同様である。作成したインデックス情報は、インデックスデータベース9に新規登録する(ステップS54)。その後、ステップS41へ戻り、WWWブラウザ103の監視を行い、以下ブラウザが終了するまで上記処理を継続して行う。
【0123】
次に、登録されたWWWページの検索処理動作について説明する。図11の文書管理装置には、検索部10に対して入力された検索式によって行う第1の実施形態と同様の検索機能と、プロファイル情報呈示部117からの検索機能の2つの検索機能がある。
【0124】
まず、検索部10に対して入力された検索式によって行う検索処理動作について説明する。ここでは、検索結果呈示部14の動作が第1の実施形態の場合と異なる。検索結果呈示部14は、図17に示すように検索されたWWWページを表形式呈示ウインドウとツリー形式呈示ウインドウとにそれぞれ呈示する。表形式呈示ウインドウでは、各WWWページのインデックス情報内容をその検索スコアの上位から順に表形式で呈示を行う。ツリー形式呈示ウインドウでは、各WWWページの中でURLが同じものを1つの階層にまとめ、図17に示すように、全体で2階層のツリー構造にした呈示を行う。これら2つの呈示ウインドウは連携制御部13によって第1の実施形態と同様に互いに連携して動作し合う。
【0125】
なお、ツリー形式呈示ウインドウでは、URLのドメイン表示部分を右側の要素、すなわち第1ドメインから順番に階層的にまとめた図18に示すようなツリー表示を行うこともできる。
【0126】
次に、プロファイル情報呈示部117からの検索処理動作について、図19と図20を参照して説明する。
【0127】
図19にプロファイル情報呈示部11でディスプレイ装置に表示された表示画面の一例を示す。プロファイル情報呈示部11は、プロファイル登録テーブル102の内容を時間軸201に従ってグラフィック表示したもので、プロファイルとして設定された全てのURLとキーワードを、それぞれの期間(プロファイル情報として設定されている、使われる期間)を表した線分で、URLの表示領域204、キーワードの表示領域205の各領域に表示する。例えば、URL「www.aaa.ddd.edu」は1999年11月中旬から2000年1月末まで、キーワード「ネットワーク」は2000年1月末までそれぞれ有効なプロファイル情報であることが図19の表示から確認できる。また、表示領域204、205は時間軸201の左右に付けられたスクロールボタン202、203をマウスなどのポインティングデバイスでクリックすることで左右に(時間軸で)スクロールさせることができる。
【0128】
以下、図20に示すフローチャートを参照して、プロファイル情報呈示部117からの検索処理動作について説明する。
【0129】
まず、ユーザは、プロファイル情報呈示部117より表示された図19に示した表示画面から任意のURL、キーワードを選択する(ステップS61)。以下、URLとキーワードをともに選択する場合を例にとり説明するが、いずれか一方のみを選択する場合も同様である。選択方法としては、ポインティングデバイスでURL、キーワードを表す線分をそれぞれクリックして選択する方法と、図19に示すように、縦の点線で示す時間を指定する線分206をポインティングデバイスによって左右に移動させ、所望のURL、キーワードの線分に重ねることで選択する方法の2種類の選択方法がある。なお後者では線分206を2本にして、両方の線分で囲んだ矩形領域でURL、キーワードを選択することも可能である。
【0130】
次に、検索ボタン207を押下する(ステップS62)。続いて、選択されたURL、キーワードが検索部10に伝えられると(ステップS63)、URLとキーワードとで行われたフィルタリング処理によって、既に登録されているWWWページのインデックス情報が、フィルタリング種別、URL、ヒットしたキーワードの各フィールドに対するフィールド検索によって検索される(ステップS64)。
【0131】
続いて、検索結果が検索結果呈示部14に伝えられ、図17、図18に示したような、検索結果を検索式での検索結果と同様に呈示する(ステップS65)。
【0132】
以下、第1の実施形態の検索と同様に、検索結果からWWWページを選択し(ステップS66)、対応するインデックス情報からファイル名とパス名を取得する(ステップS67)。続いてファイル名とパス名をWWWブラウザに103通知し(ステップS68)、WWWブラウザ103がファイル記憶部8から対応するWWWページを読み込んで呈示する(ステップS69)。
【0133】
次に、プロファイル情報呈示部117における、インデックス情報、WWWページのコピーファイル、プロファイル情報を削除する処理について説明する。
【0134】
プロファイル情報呈示部117は、先に説明したプロファイル情報からのWWWページの検索機能に加え、検索されたインデックス情報とWWWページのコピーファイルとをそれぞれインデックスデータベース9とファイル記憶部8から、さらにプロファイル情報をプロファイル登録テーブル102からそれぞれ削除する機能を有する。この機能により、既に不要となった過去に設定したプロファイル情報とこれに対応したWWWページのコピーファイルとインデックス情報とを効果的に削除することができる。以下、図21に示すフローチャートを参照して削除処理について説明する。
【0135】
まず、ユーザは、プロファイル情報呈示部117に表示された任意のURL、キーワードを選択する(ステップS71)。以下、URLとキーワードをともに選択する場合を例にとり説明すが、いずれか一方のみを選択する場合も同様である。選択方法としては、ポインティングデバイスでURL、キーワードを表す線分をクリックして選択する方法と、図19に示すように縦の点線で示す時間を指定する線分206をポインティングデバイスによって左右に移動させ、所望のURL、キーワードを表す線分に重ねることで選択する方法の2種類の選択方法がある。なお、後者においては、指定時間より以前に有効であった、即ち時間を示指定する線分206よりも左側の領域にのみ存在するURL、キーワードを表す線分を選択することや、あるいは、時間を指定する線分206を2本にして、両方の線分で囲んだ矩形領域でURL、キーワードを選択することもできる。
【0136】
次に、削除ボタン208を押下する(ステップS72)。このとき、選択されたURL、キーワードと同じものが、選択されたもの以外に存在しないかをチェックする(ステップS73)。存在する場合、これらのURL、キーワードは選択から外される(ステップS74)。そして、選択されたURL、キーワードが残っているかを調べる(ステップS75)。残っている場合には、ステップS76に進み、残っていない場合には削除を行わずに処理を終了する。
【0137】
続いて、URLとキーワードが検索部10に伝えられ(ステップS76)、URLとキーワードで行われたフィルタリング処理によって、登録されたWWWページのインデックス情報が、フィルタリング種別、URL、ヒットしたキーワードの各フィールドに対するフィールド検索によって検索される(ステップS77)。
【0138】
次に、プロファイル情報呈示部117では、この検索された全てのインデックス情報のそれぞれについて、フィルタリング種別、URL、ヒットしたキーワードの各フィールド値から、そのインデックス情報が選択した以外のURL、キーワードでフィルタリングされているか調べる(ステップS78)。他のURL、キーワードでフィルタリングされている場合、そのインデックス情報を削除対象から外す(ステップS79)。以上の処理の結果、削除対処となるインデックス情報が残っている場合は(ステップS80)、ステップS81へ進み、残っていない場合にはステップS84へ進む。
【0139】
プロファイル情報呈示部117は、削除対象のインデックス情報からファイル名とパス名を取得する(ステップS81)。プロファイル情報呈示部117では、ファイル記憶部8から対応するWWWページのコピーファイルを削除し(ステップS82)、続いて、インデックスデータベース9から対応するインデックス情報を削除し(ステップS83)、最後にプロファイル登録テーブル102から削除されたWWWページのファイルのプロファイル情報であるURL、キーワードを削除する(ステップS84)。
【0140】
なお、上記実施形態のみ限定されず、要旨を変更しない範囲で、例えば、第1の実施形態と第2の実施形態とを組み合わせる等して、適宜変形して実施できる。
【0141】
以上説明したように、上記実施形態によれば、閲覧部1での動作を検知して、予め設定した動作時に自動的にインデックス情報を作成することで、ユーザ自身が実際に作成、編集、あるいは閲覧した文書に対するインデックス情報を自動的に作成し、このインデックス情報を用いて後に簡単に文書を検索して呼び出すことが可能になる。
【0142】
また、予め設定したプロファイルを基に閲覧した文書(例えば、WWWページ)をフィルタリングし、閲覧した文書ファイルをコピーすることで、例えば、WWWブラウザを通して得られる膨大な文書のうち、予め設定したプロファイル情報にマッチするものだけを閲覧時に自動的にファイル記憶部8上にコピーし、さらにこのコピーしたデータに対するインデックス情報を自動的に作成し、後に、このインデックス情報を用いて簡単に文書を検索して呼び出すことが可能になる。
【0143】
【発明の効果】
以上説明したように、本発明によれば、ユーザ自身が実際に作成、編集、あるいは閲覧した文書を後に容易に検索可能にして、文書管理が容易に行える。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る文書管理装置の構成例を示した図。
【図2】インデックス情報の構造を示した図。
【図3】ファイルの種類を示す値の具体例を示した図。
【図4】メディアの種類を示す値の具体例を示した図。
【図5】インデックス情報作成処理動作を説明するためのフローチャート。
【図6】インデックス情報のインデックスデータベースへの登録処理動作を説明するためのフローチャート。
【図7】検索処理動作を説明するためのフローチャート。
【図8】検索結果呈示部の検索結果取得処理動作を説明するためのフローチャート。
【図9】検索結果の呈示例を示した図。
【図10】検索結果の他の呈示例を示した図。
【図11】本発明の第2の実施形態にかかる文書管理装置の構成例を示した図。
【図12】プロファイル情報の構造を示した図。
【図13】プロファイル登録テーブルの構造を示した図。
【図14】インデックス情報の構造を示した図。
【図15】フィルタリング種別を表す値の具体例を示した図。
【図16】インデックス情報の作成処理動作を説明するためのフローチャート。
【図17】検索結果の呈示例を示した図。
【図18】検索結果の他の呈示例を示した図。
【図19】プロファイル情報呈示部の処理動作を説明するためのもので、プロファイル登録テーブルの内容を時間軸に従ってグラフィック表示したもので、プロファイルとして設定された全てのURLとキーワードを、それぞれの有効期間を表した線分で表示する様子を示した図。
【図20】図19に示した表示内容から文書の検索を行う場合の処理動作を説明するためのフローチャート。
【図21】図19に示した表示内容から文書、インデックス情報の削除を行う場合の処理動作を説明するためのフローチャート。
【符号の説明】
1…閲覧部
2…登録動作設定部
3…登録動作定義テーブル
4…登録制御部
5…キーワード抽出部
6…属性取得部
7…インデックス情報作成部
8…ファイル記憶部
9…インデックスデータベース
10…検索部
11…表形式呈示部
12…ツリー形式呈示部
13…連携制御部
14…検索結果呈示部
15…ユーザインタフェース部
101…プロファイル設定部
102…プロファイル登録テーブル
103…WWWブラウザ
106…フィルタリング部
107…WWWページ取得・保存部
117…プロファイル情報呈示部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a document management apparatus that stores and manages, for example, a WWW page browsed by a WWW browser, a document created by a word processor, an editor, spreadsheet software, or other applications.
[0002]
[Prior art]
With the spread of PCs and word processors in recent years, digitization of documents in offices is progressing. In addition, with the development of the Internet and intranet, the use of e-mail has increased rapidly, and the above digitization has been accelerated further. As a result, many offices are overflowing with a large amount of electronic data, and the importance of efficiently organizing and managing them is increasing.
[0003]
For this reason, various document management apparatuses for efficiently managing these digitized documents have been developed. A certain apparatus has a feature in a document registration method, and can be registered in a database simply by dragging and dropping a file with respect to an icon on a desktop. In addition, a certain apparatus has a feature in a document search method. For example, a document can be searched in a natural language used everyday such as “material distributed at a meeting yesterday”. In addition, a certain apparatus specialized for electronic mail automatically retrieves received electronic mails and sorts them into folders for each sender, and can also perform searches by full-text search later. Recently, devices having these features have also appeared.
[0004]
As described above, various devices have been developed as document management devices. However, the registration function can be automatically registered only for a specific document such as an e-mail or the user has to perform a direct registration operation. It was a system.
[0005]
In addition, with the development of the Internet and WWW (World Wide Web), the rate of obtaining information through a WWW browser is increasing, and the importance of managing WWW pages is increasing. Software that automatically circulates a WEB site according to a URL registered in advance and collects a copy of a WWW page has been developed. However, it is not intended to register the page that you have seen.
[0006]
In addition, there is an apparatus having a function of registering a cache of a WWW page left on a disk by a WWW browser. If you use this function, you can register only the pages you see in the database, but there is a problem that you cannot register if the cache is cleared. In addition, since the cache becomes enormous in a short time, it is necessary to perform appropriate filtering before registration, but no device having such a filtering function has appeared so far.
[0007]
[Problems to be solved by the invention]
As described above, the registration function of the conventional document management apparatus is not provided with an automatic registration function for all items created, edited, and browsed by the user, that is, directly operated by the user. Either a registration operation has to be performed, or only a specific document such as the mail is targeted.
[0008]
In addition, there has been no device that has a function of automatically registering a large amount of information obtained through the WWW browser by filtering out the pages actually viewed by filtering.
[0009]
In view of the above problems, the present invention provides document management that facilitates document management by automatically creating index information that allows a user to search for documents that are actually created, edited, or viewed later. It is an object to provide a method and a document management apparatus using the method.
[0010]
In addition, the present invention automatically copies only documents that hit preset profile information from a vast number of documents obtained through a WWW browser to a local machine at the time of browsing, and further automatically creates index information for the copied data. It is an object of the present invention to provide a document management method and a document management apparatus using the document management method, which can easily manage documents by creating them manually.
[0011]
[Means for Solving the Problems]
The document management method of the present invention sets the timing for creating index information for searching stored documents, extracts attribute information about the document according to the set timing, and creates index information. By storing in association with the document, index information for a document actually created, edited, or viewed by the user can be automatically created, and the document can be easily searched later using the index information.
[0012]
Further, the document management method of the present invention provides an index for searching a document among the browsed documents based on the attribute information extracted from the browsed document and the profile information defining the attribute of the document to be selected. By selecting a document for which information is to be created, creating the index information from attribute information extracted from the selected document, and storing the selected document and the index information in association with each other, a WWW browser Of the enormous amount of documents (WWW pages) obtained through the process, only those that hit the preset profile information are automatically stored at the time of browsing, and index information for the stored data is automatically created. The stored WWW page can be easily searched using this index information.
[0013]
The document management apparatus of the present invention creates timing information by setting timing for creating index information for searching stored documents, and extracts attribute information about the document at the set timing to create index information And a storage means for storing the index information in association with the document, thereby automatically creating index information for a document actually created, edited, or viewed by the user, The document can be easily searched using this index information.
[0014]
Preferably, a search means for searching for a document based on the index information and a presentation means for presenting a search result by the search means together with at least the index information are provided.
[0015]
Further, the document management apparatus of the present invention is browsed based on extraction means for extracting attribute information from the browsed document, the extracted attribute information, and profile information defining attributes of the document to be selected. Selection means for selecting a document for creating index information for searching the document among documents, creation means for creating the index information from attribute information extracted from the selected document, and the selected document And storage means for storing the index information in association with each other, so that only documents that hit preset profile information from among a huge number of documents (WWW pages) obtained through a WWW browser are automatically viewed. And automatically create index information for this stored data, and later on this index information You can easily search for WWW pages stored using. Also, it is possible to generate effective index information for information that is updated daily such as a WWW page.
[0016]
Preferably, a search means for searching for a document based on the index information and a presentation means for presenting a search result by the search means together with at least the index information are provided. For example, by presenting in a tree format and a table format and displaying both in cooperation with each other, it is convenient for the user to find a desired document from the search result.
[0017]
Preferably, the image processing apparatus further includes search means for searching for a document having attribute information designated based on the profile information. Further, the apparatus further includes a deletion unit that deletes the document having the attribute information designated based on the profile information and the index information among the document and the index information stored in the storage unit. This makes it possible to search and delete documents more rationally and improve convenience in document management.
[0018]
Each of the above means can be recorded and distributed as a program to be executed by a computer on a storage medium such as a floppy disk or a CD-ROM. For example, the user interface unit 15, the file storage unit 8, and the index database 9 in FIGS. 1 and 11 are configured using hardware resources of the computer, and the other configuration units can be realized by programs executed by the computer. .
[0019]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0020]
(First embodiment)
FIG. 1 shows an example of the configuration of a document management apparatus according to the first embodiment of the present invention.
[0021]
The browsing unit 1 is for browsing, creating, or editing a digitized document such as a text document or an HTML document stored in the file storage unit 8. The browsing unit 1 is configured by an existing application such as an editor or a word processor in addition to the one created exclusively for the document management apparatus.
[0022]
The registration operation setting unit 2 sets an operation of the browsing unit 1 that is a timing for starting creation of index information for a document created, edited, and browsed by the browsing unit 1.
[0023]
The registered operation definition table 3 is for recording and storing the setting contents in the registered operation setting unit 2, and the registration control unit 4 performs registration control with reference to the registered operation definition table 3. For example, in the case of MS-Windows, the registration operation definition table 3 uses a registry or an INI file. The same system is used in other systems such as UNIX and MacOS.
[0024]
When the registration control unit 4 detects the operation of the browsing unit 1 based on the setting value of the registered operation definition table 3, the registration control unit 4 controls the keyword extraction unit 5, the attribute acquisition unit 6, and the index information creation unit 7 to create and register index information. Execute.
[0025]
The keyword extraction unit 5 extracts keywords from a document that has been browsed, created, and edited by the browsing unit 1. A keyword extraction method may be used, for example, a morphological analysis of a text part in a document, a word such as a noun is extracted, an appearance frequency of the noun is obtained, and some nouns with high appearance frequency are obtained. It may be a keyword. In addition, using a dictionary in which words that can be keywords for each field are registered in advance, matching may be performed between the document and the dictionary, and the matched word may be used as the keyword of the document.
[0026]
The attribute acquisition unit 6 acquires attributes other than keywords of the document being browsed, created, and edited by the browsing unit 1.
[0027]
The index information creation unit 7 generates index information for a document viewed or created and edited by the browsing unit 1 based on the keywords and various attribute values obtained by the keyword extraction unit 5 and the attribute acquisition unit 6.
[0028]
The file storage unit 8 stores various files of a document, and includes a hard disk and various removable media.
[0029]
The index database 9 stores and manages the index information created by the index information creation unit 7, and the search unit 10 performs a search using this index information.
[0030]
The search unit 10 searches the index database 9 based on a search request from the user, and informs the search result presentation unit 14 of the search result.
[0031]
The search result presenting unit 14 is composed of a table format presenting unit 11, a tree format presenting unit 12, and a cooperation control unit 13, and presents the search results in the search unit 10 to the user.
[0032]
The tabular form presentation unit 11 presents the search results as a one-line table. Present the results in a way that makes it easy to list results based on similarities and keywords.
[0033]
The tree form presenting unit 12 presents the directory structure in a tree shape in order to easily show where the retrieved document file is stored in the file storage unit 8.
[0034]
The cooperation control unit 13 performs control for linking both displays in accordance with a user's document selection operation performed on the table format presentation unit 11 and the tree format presentation unit 12.
[0035]
The user interface unit 15 includes an output device such as a display device, and various input devices such as a keyboard and a mouse. The user inputs various instructions, inputs a search expression, displays a document, and searches a document. The result is displayed.
[0036]
Next, registration timing and its setting by the document management apparatus of FIG. 1 will be described. Here, registration refers to creating index information for a document file already stored in the file storage unit 8 and registering the index information in the index database, which is called “document registration”. Sometimes.
[0037]
As an operation of the browsing unit 1 set as the registration timing, for example,
(1) Termination of browsing part 1 or closing of the browsing window
(2) File saving by user operation
The user only has to select one or both of these two through the registration operation setting unit 2. For example, if only (1) is set, all the documents that have been viewed or edited are registered. If only (2) is set, only the edited document is registered. When the browsing unit 1 has an automatic saving function, registration at the time of automatic saving can be added as an option (2). If both (1) and (2) are set, all the viewed and edited documents will be registered in the same way as setting only for (1), but the registration timing during editing is set only for (1). Is different. Registration at the time of saving is basic, and if you quit without editing after saving, registration at the end is not performed.
[0038]
The setting contents are written in the registration operation definition table 3 and referred to by the registration control unit 4.
[0039]
The above is the registration timing setting procedure.
[0040]
FIG. 2 is a diagram showing the structure of index information used in the document management apparatus. The attribute information about the document file (for example, ID number, file name, path name, file type, media type, creation date, title, Author) and a keyword extracted from the document, and one index information is created for each document.
[0041]
The ID number is an integer value data that is unique in all index information stored in the index database 9 in the order of creation of index information in the order of “1”, “2”, “3”.
[0042]
The file name is character string data representing the file name of the document file on the file storage unit 8.
[0043]
Similarly, the path name is character string data representing the path name of the document file on the file storage unit 8.
[0044]
The method of expressing the file name and path name depends on the OS on which the document management apparatus operates. For example, in the case of MS-Windows, “Document.txt”, “c: \ home \ My Document \ document.txt”, etc. It becomes the character string data.
[0045]
As shown in FIG. 3, the file type is predefined numerical data representing the file type. For example, the file type depends on the OS on which the document management apparatus operates, the application to be used, and the target file type. To do. For example, when a file of each application of MS-Office, a rich text format (RTF) file, and a standard text file are targeted on MS-Windows, the definition values shown in FIG. 3 are used.
[0046]
As shown in FIG. 4, the media type is predefined numerical data representing the type of file storage location, and depends on, for example, the OS on which the document management apparatus operates. For example, in the case of MS-Windows, a definition value as shown in FIG. 4 is used.
[0047]
The creation date / time is date-type data representing the date / time when the document file was created or the last update date / time.
[0048]
The title is character string data representing the title of the document file.
[0049]
The author is character string data representing the author who created the document file.
[0050]
The keyword is list-type data whose value is the keyword extracted from the text portion of the document by the keyword extraction unit 5.
[0051]
Next, processing operations for creating and registering index information by the registration control unit 4 will be described with reference to the flowchart shown in FIG.
[0052]
The registration control unit 4 monitors the operation set in the registered operation definition table 3 by the browsing unit 1, that is, the execution of the file saving or the ending operation of the browsing unit 1 (step S1). As a method for monitoring the execution of the operation, a method that is standardly used by an application that is resident in the system is used. For example, in the case of MS-Windows, a Windows message generated when the operation is performed is monitored, and the operation can be monitored by hooking the message. As another method, when an existing application is used in the browsing unit 1, it is possible to detect the set operation as a function of the application itself and to execute processing corresponding to the operation. . For example, in the case of MS-Word and MS-Excel, which are MS-Windows applications, it is possible to customize the operation of the application by rewriting the application command itself using the macro language VBA (Visual Basic for Application). A series of registration processing at the time of saving can be executed by modifying the command. It is also possible to create a macro that is automatically executed during the operation. For example, the process when an arbitrary file is closed with the Auto_Close () macro and the process when the Word itself is terminated with the Auto_Exit () macro can be described. Processing can be executed.
[0053]
When a preset save or end operation is detected (step S2), the registration control unit 4 activates the keyword extraction unit 5, and the keyword extraction unit 5 is browsed, edited, created, etc. A keyword is extracted from the selected document (step S3).
[0054]
Subsequently, the attribute acquisition unit 6 is activated, and each attribute value of the file name, path name, file type, media type, file creation date, title, and author is acquired from the browsing unit 1 (step S4).
[0055]
Subsequently, the index information creating unit 7 is activated, and the index information shown in FIG. 2 is created based on the keyword extracted by the keyword extracting unit 5 and each attribute value acquired by the attribute acquiring unit 6 (step S5).
[0056]
Subsequently, the index information creation unit 7 registers the created index information in the index database 9 (step S6).
[0057]
A method for acquiring each attribute value in the attribute acquisition unit 6, a method for creating index information in the index information creation unit 7, and a method for registering index information in the index database 9 in the index information creation unit will be described later. .
[0058]
Subsequently, it is checked whether or not the browsing unit 1 continues to operate (step S7). If the browsing unit 1 is still in operation due to registration at the time of saving or registration with the window closed, the operation returns to the monitoring state (step S1) again, and the above operations are continued.
[0059]
As described above, the registration control unit 4 creates and registers index information.
[0060]
Next, a method for acquiring each attribute value in the attribute acquisition unit 6 will be described.
[0061]
The file name and path name are obtained directly from the browsing unit 1. When an existing application is used in the browsing unit 1, attributes are acquired from the OS and application functions. For example, in the case of an application on MS-Windows, the attribute can be acquired by OLE automation or the like.
[0062]
The file type is obtained from the file name. For example, in the case of MS-Windows, the file type can be acquired from the extension portion of the file name.
[0063]
The media type is obtained by extracting the drive name from the path name and examining the drive type from the OS function.
[0064]
The file creation date and time is acquired using the OS function. For example, in the case of MS-Windows, it implements using each function of WindowsAPI.
[0065]
If the document file has a title as an attribute of the file itself, such as an MS-Word document file, the title is used as it is. If the document file does not have a title as an attribute, or if it is a document file whose attribute acquisition method is unknown, for example, the first sentence of the text portion of the document file is used as the title. When this one sentence exceeds the size of the character string field, up to that size is used as a title.
[0066]
The author uses the value as it is when the document file has the author's information as its own attribute. If the document file does not have the author information as an attribute or is a document file whose attribute acquisition method is unknown, the OS on which the document management apparatus operates has an API for retrieving the author of the document file. In this case, the author is acquired by this API function. When there is no API or when acquisition of a value fails, an empty character string is set as the value.
[0067]
When an existing application is applied to the browsing unit 1, if an attribute value as described above can be acquired as a function of the application, the attribute value is acquired by this function. For example, in the case of an MS-Windows application, it is possible to acquire many attribute values from the application using the OLE automation function.
[0068]
As described above, the attribute acquisition unit 6 acquires each attribute value.
[0069]
Next, a method for creating index information in the index information creating unit 7 will be described.
[0070]
First, create a new index,
(ID number) = (ID number of the index created immediately before) +1
The ID number determined by is set. The ID number may not be the above method as long as a unique value can be set for each index. For example, a method may be used in which an ID number that is missing due to deletion of an unnecessary index that has lost data at the index destination is preferentially assigned from a small number.
[0071]
Subsequently, each keyword extracted by the keyword extraction unit 5 is set. If no keyword is extracted, this field is an empty list type. When the number of keywords exceeds the upper limit of the maximum number of elements supported in advance as a list type, list types corresponding to the maximum number of elements are formed in the order detected as keywords.
[0072]
Finally, the attribute value of the file name, path name, file type, media type, file creation date / time, title, and author acquired by the attribute acquisition unit 6 is set.
[0073]
As described above, the index information creating unit 7 creates index information.
[0074]
Next, with reference to FIG. 6, an operation in which the index information creating unit 7 registers index information in the index database 9 will be described.
[0075]
In order to check whether the index information of the same document as the created index information already exists in the index database 9, the index information creation unit 7 uses the index information having the same path name as the index name in the index information. It is checked whether it exists in the database 9 (step S11).
[0076]
If there is no index information with the same path name, the created index information is newly registered in the index database 9 (step S12).
[0077]
When index information with the same path name already exists, the attribute values of the already registered index information and the created index information are compared, and when one or more different attribute values exist (step S13), Certain index information is updated with the index information created this time (step S14).
[0078]
If no different attribute value exists, the index information created this time is discarded because there is no change (step S15), and the process ends without registration.
[0079]
As described above, the index information creating unit 7 registers the index information in the index database 9.
[0080]
Next, a document search processing operation in the search unit 10 will be described with reference to FIG.
[0081]
A search expression for the index database 9 is input to the search unit 10 via the user interface unit 15 (step S21). The contents of this search expression depend on the index database 9. For example, when the index database 9 is a SQL (Structured Query Language) -based database, a search expression in an SQL sentence is used.
[0082]
Subsequently, the search unit 10 searches the index database 9 for index information using this search formula (step S22), receives the search result, and sends it to the search result presenting unit 14 (step S23). The search result presentation unit 14 presents the searched index information to the user interface unit 15.
[0083]
If there is no desired document in the search result presented in the search result presentation unit 14, the user can continue to discard the current search result and start the search again from step S21. If there are many search results and a desired document cannot be found, an additional search for the current search results can be performed (step S24). When performing an additional search, the current search results, that is, ID numbers of all index information of the searched document are stored as data in the memory (step S25), and the index information is retrieved from the index database 9 by the additional search. When acquiring the ID, only the one that matches the ID number on the memory may be taken out. In addition, by saving the search results of each search, it is possible to return to the previous search results or to perform a plurality of additional searches in parallel.
[0084]
As described above, the document search is executed in the search unit 10.
[0085]
Next, with reference to FIG. 8, the search result acquisition operation in the search result presentation unit 14 will be described.
[0086]
First, the user selects a desired document from the index information presented on the user interface unit 15 (step S31). Next, the file name and path name are extracted from the index information of the selected document (step S32), and the file name and path name are transmitted to the browsing unit 1 (step S33). The browsing unit 1 reads the corresponding document file from the file storage unit 8 from the file name and path name and presents it (step S34).
[0087]
As described above, the retrieval result presenting unit 14 obtains the retrieval result.
[0088]
Next, a method for presenting search results in the search result presentation unit 14 will be described. As shown in FIG. 9, the search result presentation unit 14 presents the search results on the display screen of the display device, in a tabular presentation window and a tree presentation window. In the tabular presentation window, the contents of the index information of each document are presented in tabular order from the top of the search score. The tree form presentation window presents the tree form based on the path information included in the retrieved index information.
[0089]
These two presentation windows operate in cooperation with each other by the cooperation control unit 13. For example, when an arbitrary document presented in the tabular presentation window is selected by clicking with the mouse or the like, the portion of the document on the tree presentation window is selected and can be recognized at a glance by highlighting or the like. Similarly, when an arbitrary document presented in the tree form presentation window is selected, the document on the table form presentation window is selected.
[0090]
For this purpose, the linkage control unit 13 serves to transmit the ID number of the index information for the document selected in one presentation window to the other presentation window.
[0091]
Further, the document file that has not been searched in each folder may be presented at the same time in the tree form presentation window (see FIG. 10). In this case, the searched file is highlighted so that it can be distinguished from the unsearched file at a glance.
[0092]
As described above, the search result presentation unit 14 presents the search result.
[0093]
(Second Embodiment)
The document management apparatus according to the second embodiment of the present invention is an example in which a WWW browser application is applied to the browsing unit 1 in FIG. 1, and a WWW page (on the WWW browser) browsed by a user as a document to be managed. Index information necessary for searching for the WWW page later is automatically created, and the desired WWW page is searched using the index information.
[0094]
By the way, in the case of a WWW page, the browsing entity is usually outside the local machine. In addition, the entity is often updated every day, and filing index information for the entity is often useless at a later date. For this reason, in the second embodiment, a function of creating a copy of the WWW page in the file system on the local machine is added, and index information for the copy is created and registered in the index database.
[0095]
In addition, when browsing WWW pages through a daily WWW browser, it is noticed that a huge number of pages are being browsed without knowing it. In the case of the method of registering all the documents (index information) viewed as in the first embodiment, there is a problem that the number of registrations becomes enormous. Therefore, in the second embodiment, a function is added in which profile information is registered in advance and filtering processing based on the profile information is performed on the browsed WWW page. Note that the browsing unit of the document management apparatus according to the second embodiment is not limited to the WWW browser 103 as shown in FIG. 11, and an existing application such as an editor or a word processor may be applied. The former function that creates an index by copying entities outside the local machine is used when viewing and editing document files on various removable media such as floppy disks and magneto-optical disks with applications such as editors and word processors. Can be applied. Further, the latter filtering process using profile information can be applied to a document file as it is.
[0096]
FIG. 11 shows a configuration example of the document management apparatus according to the second embodiment. In FIG. 11, the same parts as those in FIG. 1 are denoted by the same reference numerals, and different parts will be described. That is, in FIG. 11, the browsing unit 1 in FIG. 1 is replaced with the WWW browser 103, and the registration operation setting unit 2 and the registration operation definition table 3 in FIG. 1 are profile setting unit 101, profile registration table 102, filtering unit 106, WWW. The page acquisition / storage unit 117 is replaced with a profile information presentation unit 117.
[0097]
The WWW browser 103 is configured by an existing browser application, but may be a dedicated one.
[0098]
The profile setting unit 101 is for setting profile information (see FIG. 12) used when the document filtering process performed by the filtering unit 106 is performed. As shown in FIG. 12, for example, a plurality of keywords and a plurality of keywords are set. URLs (Uniform Resource Locators) can be set.
[0099]
The profile registration table 102 stores the profile information set in the profile setting unit 101 as shown in FIG. 12 together with the set time in the table format shown in FIG.
[0100]
The filtering unit 106 compares the keyword extracted by the keyword extracting unit 5, the attribute value acquired by the attribute acquiring unit 6 with the latest profile information set in the profile registration table 102, and determines whether or not to perform registration. Tell the registration control unit 4. When the keyword and the attribute value extracted from the browsing WWW page match the profile information, the registration control unit 4 registers the WWW page.
[0101]
The WWW page acquisition / save unit 107 copies each object constituting the page browsed by the WWW browser 103 into a single folder onto the file storage unit 8.
[0102]
The profile information presentation unit 117 is for graphically presenting the contents of the profile registration table 102 in time series, and can also search and delete a WWW page based on the presented profile information (described later).
[0103]
FIG. 14 shows the structure of index information, which is composed of items of ID number, URL, folder name, head file name, title, creation date, keyword, filtering type, and hit keyword, and is registered. One is created for each page.
[0104]
The ID numbers are numbered in the order of creation of index information in the order of “1”, “2”, “3”... And are unique integer data in all index information in the index database 9.
[0105]
The URL is character string data representing the URL of the WWW page to be registered.
[0106]
The folder name is character string data representing the path name of the folder storing the WWW page copied on the file storage unit 8.
[0107]
The first file name is character string data representing the file name of the file in which the HTML document of the first page is copied among the files in the folder.
[0108]
The title is character string data representing the title attached to the WWW page to be registered.
[0109]
The creation date / time is date-type data representing the date / time when the copied file was created or the last update date / time.
[0110]
The keyword is list-type data whose value is the keyword extracted from the text portion of the WWW page by the keyword extraction unit 5. If no keyword is extracted, this field is an empty list type. When the number of keywords exceeds the upper limit of the maximum number of elements predetermined as a list type, list types corresponding to the maximum number of elements are formed in the order detected as keywords.
[0111]
The filtering type indicates in advance whether the filtering process for the WWW page to be registered was performed with a URL defined in the profile, with a keyword, with both, or with no filtering. The defined numeric data takes one of the defined values shown in FIG.
The hit keyword is list-type data whose value is a keyword that matches the keyword of the profile information among the keywords extracted from the WWW page when the filtering process is performed on the WWW page to be registered. . If filtering by keyword is not performed, this field will be an empty list type.
[0112]
Next, with reference to FIG. 16, processing for creating and registering index information in the registration control unit 4 will be described.
[0113]
It is monitored whether a new WWW page is displayed on the WWW browser 103 (step S41). As this monitoring method, a method that is standardly used by an application resident in the system is used. For example, in the case of MS-Windows, a Windows message generated when a new WWW page is displayed is monitored, and it is detected that a new WWW page is displayed by hooking the message.
[0114]
When the display of a new WWW page is detected (step S42), the profile registration table 102 is referenced to check whether a URL is registered as a profile (step S43).
[0115]
If the URL is not registered in the profile, the process proceeds to step S46. On the other hand, if the URL is registered in the profile, the process proceeds to step S44, where the attribute acquisition unit 6 is activated, and the attribute acquisition unit 6 acquires the URL of the WWW page from the WWW browser 103 (step S44).
[0116]
Next, the filtering unit 106 is activated, and the URL registered as a profile is compared with the URL of the current WWW page to check whether there is the same URL (step S45). If there is the same URL, the following process is executed. If there is no same URL, the registration process is interrupted, and the process returns to step S41 to monitor the WWW browser.
[0117]
Next, referring to the profile registration table 102, it is checked whether or not a keyword is registered as a profile (step S46). If no keyword is registered in the profile, the process proceeds to step S49. On the other hand, if the keyword is registered in the profile, the process proceeds to 47, where the keyword extraction unit 5 is activated to extract the keyword from the text information in the WWW page (step S47). Note that, as described above, the keyword extraction is performed by a method normally used in a normal filing system or search system.
[0118]
Subsequently, the filtering unit 106 is activated, and the keyword extracted from the WWW page is compared with the keyword registered as a profile in the profile registration table 102 and collated (step S48). When there is no matching keyword, that is, when the same keyword as the keyword registered as a profile does not exist in the WWW page, the registration of the WWW page is interrupted, the process returns to step S41, and the WWW browser is monitored again.
[0119]
Subsequently, it is checked whether or not there is index information having the same URL as the WWW page in the index database 9 (step S49). If there is no index information of the same URL, the process proceeds to step S51 and the subsequent registration process is executed. When index information having the same URL as the WWW page exists in the index database 9, a copy of the WWW page in the folder pointed to by the index information and each file constituting the browsed WWW page If no different file exists (Step S50), it can be determined that the same WWW page as that being browsed has already been registered. After completing the registration process, the process returns to step S41 to monitor the WWW browser again. On the other hand, if even one different file exists, the process proceeds to step S51, and the subsequent registration process is executed.
[0120]
In the WWW page registration process, first, the WWW page acquisition / save unit 107 is activated to create a copy of the WWW page in the file storage unit 8 (step S51). The copy is created using a method generally performed by an application having an automatic patrol function for WWW pages.
[0121]
Next, the attribute acquisition unit 6 is activated to acquire each attribute value of the folder name, the first file name, the title, and the creation time from the currently viewed WWW page and a copy of the WWW page (step S52). Of these, the title is acquired directly from the WWW browser 103. The folder name and the head file name are obtained by leaving information at the time of making a copy and reading it out. As the creation time, the creation time of the folder to be copied is acquired by the same method as in the first embodiment. Alternatively, the current time may be obtained using the clock function of the OS, and this may be used as the creation time. Also, the URL used in the process (step S44) is used.
[0122]
Subsequently, the index information creating unit 7 is activated, and index information is created based on the keyword extracted by the keyword extracting unit 5 and each attribute value acquired by the attribute acquiring unit 6 (step S53). The method for creating index information is the same as that in the first embodiment. The created index information is newly registered in the index database 9 (step S54). Thereafter, the process returns to step S41, the WWW browser 103 is monitored, and the above processing is continued until the browser is terminated.
[0123]
Next, the search processing operation for the registered WWW page will be described. The document management apparatus shown in FIG. 11 has two search functions, that is, a search function similar to that of the first embodiment performed by a search expression input to the search unit 10 and a search function from the profile information presenting unit 117. .
[0124]
First, the search processing operation performed by the search expression input to the search unit 10 will be described. Here, the operation of the search result presentation unit 14 is different from that of the first embodiment. The search result presenting unit 14 presents the retrieved WWW pages in a tabular format presentation window and a tree format presentation window as shown in FIG. In the tabular presentation window, the index information content of each WWW page is presented in tabular order from the top of the search score. In the tree format presentation window, the WWW pages having the same URL are grouped into one hierarchy and presented as a two-level tree structure as shown in FIG. These two presentation windows operate in cooperation with each other as in the first embodiment by the cooperation control unit 13.
[0125]
In the tree form presentation window, the tree display as shown in FIG. 18 in which the domain display portion of the URL is hierarchically arranged in order from the right element, that is, the first domain, can also be performed.
[0126]
Next, the search processing operation from the profile information presentation unit 117 will be described with reference to FIGS. 19 and 20.
[0127]
FIG. 19 shows an example of a display screen displayed on the display device by the profile information presentation unit 11. The profile information presentation unit 11 is a graphic display of the contents of the profile registration table 102 according to the time axis 201, and all URLs and keywords set as profiles are used for their respective periods (set as profile information. (Period) are displayed in the URL display area 204 and the keyword display area 205. For example, it is confirmed from the display in FIG. 19 that the URL “www.aaa.ddd.edu” is valid profile information from mid-November 1999 to the end of January 2000, and the keyword “network” is valid from the end of January 2000. it can. The display areas 204 and 205 can be scrolled left and right (in the time axis) by clicking the scroll buttons 202 and 203 attached to the left and right of the time axis 201 with a pointing device such as a mouse.
[0128]
Hereinafter, the search processing operation from the profile information presentation unit 117 will be described with reference to the flowchart shown in FIG.
[0129]
First, the user selects an arbitrary URL and keyword from the display screen shown in FIG. 19 displayed by the profile information presentation unit 117 (step S61). Hereinafter, a case where both a URL and a keyword are selected will be described as an example, but the same applies to the case where only one of them is selected. As a selection method, a method of clicking and selecting a line segment representing a URL and a keyword with a pointing device and a line segment 206 for designating a time indicated by a vertical dotted line as shown in FIG. There are two types of selection methods: a method of selecting by moving and overlaying on a desired URL and keyword line segment. In the latter case, it is also possible to select two URLs and keywords in a rectangular area surrounded by both line segments 206.
[0130]
Next, the search button 207 is pressed (step S62). Subsequently, when the selected URL and keyword are transmitted to the search unit 10 (step S63), the index information of the already registered WWW page is obtained by filtering type and URL by the filtering process performed on the URL and the keyword. The field search is performed for each field of the hit keyword (step S64).
[0131]
Subsequently, the search result is transmitted to the search result presentation unit 14, and the search result as shown in FIGS. 17 and 18 is presented in the same manner as the search result using the search formula (step S65).
[0132]
Thereafter, similarly to the search of the first embodiment, a WWW page is selected from the search result (step S66), and the file name and path name are acquired from the corresponding index information (step S67). Subsequently, the file name and path name are notified to the WWW browser 103 (step S68), and the WWW browser 103 reads the corresponding WWW page from the file storage unit 8 and presents it (step S69).
[0133]
Next, processing for deleting index information, a WWW page copy file, and profile information in the profile information presentation unit 117 will be described.
[0134]
In addition to the WWW page search function from the profile information described above, the profile information presenting unit 117 further stores the searched index information and a copy file of the WWW page from the index database 9 and the file storage unit 8, respectively. Are deleted from the profile registration table 102 respectively. With this function, it is possible to effectively delete the profile information set in the past that has become unnecessary, and the copy file and index information of the corresponding WWW page. The deletion process will be described below with reference to the flowchart shown in FIG.
[0135]
First, the user selects an arbitrary URL and keyword displayed on the profile information presentation unit 117 (step S71). Hereinafter, a case where both a URL and a keyword are selected will be described as an example, but the same applies to the case where only one of them is selected. As a selection method, a method of selecting by clicking a line segment representing a URL or a keyword with a pointing device, and a line segment 206 for designating a time indicated by a vertical dotted line as shown in FIG. 19 are moved left and right by the pointing device. There are two types of selection methods: a method of selecting by overlaying on a line segment representing a desired URL and keyword. In the latter case, it is effective to select a line segment representing a URL or keyword that was valid before the specified time, that is, only in the area on the left side of the line segment 206 indicating the time, or the time. It is also possible to select two URLs and keywords in a rectangular area surrounded by both line segments 206.
[0136]
Next, the delete button 208 is pressed (step S72). At this time, it is checked whether or not the same URL and keyword as the selected one exist other than the selected one (step S73). If they exist, these URLs and keywords are removed from the selection (step S74). Then, it is checked whether the selected URL or keyword remains (step S75). When it remains, it progresses to step S76, and when it does not remain, a process is complete | finished without deleting.
[0137]
Subsequently, the URL and the keyword are transmitted to the search unit 10 (step S76), and the index information of the registered WWW page by filtering processing performed with the URL and the keyword includes the filtering type, URL, and hit keyword fields. Is searched by field search for (step S77).
[0138]
Next, in the profile information presenting unit 117, all of the searched index information is filtered by the URL and keywords other than the index information selected from the field values of the filtering type, URL, and hit keyword. (Step S78). If it is filtered by another URL or keyword, the index information is removed from the deletion target (step S79). As a result of the above processing, if there remains index information to be deleted (step S80), the process proceeds to step S81, and if not, the process proceeds to step S84.
[0139]
The profile information presentation unit 117 acquires a file name and a path name from the index information to be deleted (Step S81). The profile information presentation unit 117 deletes the copy file of the corresponding WWW page from the file storage unit 8 (step S82), subsequently deletes the corresponding index information from the index database 9 (step S83), and finally registers the profile. The URL and the keyword, which are the profile information of the file of the WWW page deleted from the table 102, are deleted (step S84).
[0140]
Note that the present invention is not limited to the above-described embodiment, and can be implemented with appropriate modifications, for example, by combining the first embodiment and the second embodiment within a range that does not change the gist.
[0141]
As described above, according to the above-described embodiment, the user himself / herself actually creates, edits, or creates index information by detecting an operation in the browsing unit 1 and automatically during a preset operation. Index information for the browsed document is automatically created, and it is possible to easily retrieve and call the document later using this index information.
[0142]
Further, by filtering a document (for example, a WWW page) viewed based on a preset profile and copying the browsed document file, for example, preset profile information in a huge document obtained through a WWW browser Are automatically copied onto the file storage unit 8 at the time of browsing, and index information for the copied data is automatically created, and a document can be easily searched later using the index information. It becomes possible to call.
[0143]
【The invention's effect】
As described above, according to the present invention, documents actually created, edited, or viewed by the user can be easily retrieved later, and document management can be easily performed.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration example of a document management apparatus according to a first embodiment of the present invention.
FIG. 2 is a diagram showing the structure of index information.
FIG. 3 is a diagram showing a specific example of a value indicating a file type.
FIG. 4 is a diagram showing a specific example of a value indicating the type of media.
FIG. 5 is a flowchart for explaining an index information creation processing operation;
FIG. 6 is a flowchart for explaining an operation of registering index information in an index database.
FIG. 7 is a flowchart for explaining a search processing operation;
FIG. 8 is a flowchart for explaining the search result acquisition processing operation of the search result presentation unit.
FIG. 9 is a diagram showing an example of presenting search results.
FIG. 10 is a diagram showing another example of presentation of search results.
FIG. 11 is a diagram showing a configuration example of a document management apparatus according to a second embodiment of the present invention.
FIG. 12 is a diagram showing the structure of profile information.
FIG. 13 is a diagram showing the structure of a profile registration table.
FIG. 14 is a diagram showing the structure of index information.
FIG. 15 is a diagram showing a specific example of a value indicating a filtering type.
FIG. 16 is a flowchart for explaining an index information creation processing operation;
FIG. 17 is a diagram showing an example of presenting search results.
FIG. 18 is a diagram showing another example of presentation of search results.
FIG. 19 is a diagram for explaining the processing operation of the profile information presentation unit, in which the contents of the profile registration table are graphically displayed according to the time axis, and all the URLs and keywords set as profiles are displayed for each valid period. The figure which showed a mode that it displayed with the line segment showing.
20 is a flowchart for explaining a processing operation when searching for a document from the display content shown in FIG.
FIG. 21 is a flowchart for explaining a processing operation when deleting document and index information from the display content shown in FIG. 19;
[Explanation of symbols]
1 ... Browsing part
2. Registration operation setting part
3 ... Registered action definition table
4. Registration control unit
5 ... Keyword extraction unit
6 ... Attribute acquisition unit
7 ... Index information creation part
8 ... File storage
9 ... Index database
10 ... Search section
11 ... Tabular presentation section
12 ... Tree format presentation section
13 ... Cooperation control unit
14 ... Search result presentation section
15. User interface section
101 ... Profile setting section
102 ... Profile registration table
103 ... WWW browser
106: Filtering unit
107 ... WWW page acquisition / storage unit
117 ... Profile information presentation part

Claims (16)

文書を作成、編集、表示するための画面を表示して、文書の作成、編集、表示を行う作成・編集・表示手段と、
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えた文書管理装置における文書管理方法であって、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を含むことを特徴とする文書管理方法。
A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
A document management method in a document management apparatus comprising:
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A document management method comprising:
キーワード及びURL(Uniform Resource Locator)のうちの少なくとも1つを含むプロファイル情報を入力する入力ステップと、
前記文書管理装置が具備する第3の記憶手段に、入力された前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶するステップと、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択ステップと、
をさらに含み、
前記第5のステップは、前記登録タイミングが検知されたとき、前記選択ステップで選択された文書について、前記第3のステップで抽出されたキーワード及び前記第4のステップで取得された属性情報を含むインデックス情報を生成することを特徴とする請求項1記載の文書管理方法。
An input step of inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Storing the inputted profile information together with a time when the profile information is inputted in a third storage means provided in the document management apparatus;
A selection step of selecting a document having a URL included in the profile information and an extracted document having the same keyword as the keyword included in the profile information from among the documents created, edited, and displayed on the screen;
Further including
The fifth step includes the keyword extracted in the third step and the attribute information acquired in the fourth step for the document selected in the selection step when the registration timing is detected. 2. The document management method according to claim 1, wherein index information is generated.
所望の文書を検索するための検索式を入力する入力ステップと、
前記検索式と前記第2の記憶手段に記憶されているインデックス情報を用いて、前記第1の記憶手段から文書を検索する検索ステップと、
検索された各文書のインデックス情報と、前記第1の記憶手段での当該検索された文書の記憶位置を示す階層構造とを前記文書管理装置が具備する表示手段で表示するステップと、
前記表示手段で表示されたインデックス情報のうちの1つが選択されると、前記表示手段で表示された階層構造上の当該選択されたインデックス情報に対応する文書の記憶位置をハイライト表示するステップと、
をさらに含むことを特徴とする請求項1記載の文書管理方法。
An input step for inputting a search expression for searching for a desired document;
A search step of searching for a document from the first storage means using the search formula and the index information stored in the second storage means;
Displaying the index information of each searched document and the hierarchical structure indicating the storage position of the searched document in the first storage means on the display means provided in the document management device;
When one of the index information displayed on the display means is selected, the step of highlighting the storage position of the document corresponding to the selected index information on the hierarchical structure displayed on the display means; ,
The document management method according to claim 1, further comprising:
前記第3の記憶手段には、前記入力手段で時系列に入力された複数のプロファイル情報を各プロファイル情報が入力された時刻とともに記憶され、
前記選択ステップは、前記第3の記憶手段に記憶された複数のプロファイル情報のうち前記時刻が最新のプロファイル情報を用いて文書を選択することを特徴とする請求項2記載の文書管理方法。
The third storage means stores a plurality of profile information input in time series by the input means together with the time when each profile information was input,
3. The document management method according to claim 2, wherein the selecting step selects a document by using profile information with the latest time among a plurality of profile information stored in the third storage unit.
前記第3の記憶手段に記憶された各プロファイル情報に含まれる各キーワード及び各URLと、各プロファイル情報の入力された時刻を基に各キーワード及び各URLがプロファイル情報として用いられていた期間とを前記文書管理装置が具備する表示手段で表示するステップと、
前記表示手段で表示されたキーワード及びURLのうちの少なくとも1つを選択するステップと、
をさらに含み、
前記検索ステップは、選択されたキーワード及びURLのうちの少なくとも1つ含む検索式を用いて、前記第2の記憶手段からインデックス情報を検索し、前記第1の記憶手段から当該検索されたインデックス情報に対応する文書を検索することを特徴とする請求項4記載の文書管理方法。
Each keyword and each URL included in each profile information stored in the third storage means, and a period during which each keyword and each URL was used as profile information based on the input time of each profile information Displaying on the display means provided in the document management apparatus;
Selecting at least one of the keyword and URL displayed on the display means;
Further including
The search step searches for index information from the second storage means using a search expression including at least one of the selected keyword and URL, and the searched index information from the first storage means. The document management method according to claim 4, wherein a document corresponding to is searched.
前記検索ステップで検索されたインデックス情報及び当該インデックス情報に対応する文書を前記第1及び第2の記憶手段から削除するステップをさらに含むことを特徴とする請求項5記載の文書管理方法。  6. The document management method according to claim 5, further comprising the step of deleting the index information searched in the search step and the document corresponding to the index information from the first and second storage means. 文書を作成、編集、表示するための画面を表示して、文書の作成、編集、表示を行う作成・編集・表示手段と、
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する設定手段と、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する検知手段と、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する抽出手段と、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する取得手段と、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成する生成手段と、
前記インデックス情報を記憶する第2の記憶手段と、
を具備したことを特徴とする文書管理装置。
A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. Setting means for setting;
Detection means for detecting the registration timing generated in the creation / editing / display means;
Extraction means for extracting a keyword from a document created, edited and displayed on the screen;
An acquisition means for acquiring attribute information including a file name of a document created, edited and displayed on the screen and a storage position in the first storage means in which the document is stored;
Generating to generate index information including keywords extracted by the extracting unit and attribute information acquired by the acquiring unit for a document created, edited, and displayed on the screen when the registration timing is detected Means,
Second storage means for storing the index information;
A document management apparatus comprising:
キーワード及びURL(Uniform Resource Locator)のうちの少なくとも1つを含むプロファイル情報を入力する手段と、
前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶する第3の記憶手段と、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択手段と、
をさらに具備し、
前記生成手段は、前記登録タイミングが検知されたとき、前記選択手段で選択された文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成することを特徴とする請求項7記載の文書管理装置。
Means for inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Third storage means for storing the profile information together with the time when the profile information was input;
A selection unit that selects a document having a URL included in the profile information and a document extracted with the same keyword as the keyword included in the profile information, among documents created, edited, and displayed on the screen;
Further comprising
The generating unit generates index information including a keyword extracted by the extracting unit and attribute information acquired by the acquiring unit for the document selected by the selecting unit when the registration timing is detected. The document management apparatus according to claim 7.
所望の文書を検索するための検索式を入力する入力手段と、
前記検索式と前記第2の記憶手段に記憶されているインデックス情報を用いて、前記第1の記憶手段から文書を検索する検索手段と、
検索された各文書のインデックス情報と、前記第1の記憶手段での当該検索された文書の記憶位置を示す階層構造とを表示手段で表示する第1の表示制御手段と、
前記表示手段で表示されたインデックス情報のうちの1つが選択されると、前記表示手段で表示された階層構造上の当該選択されたインデックス情報に対応する文書の記憶位置をハイライト表示することを特徴とする請求項7記載の文書管理装置。
An input means for inputting a search expression for searching for a desired document;
Search means for searching for a document from the first storage means using the search formula and index information stored in the second storage means;
First display control means for displaying index information of each searched document and a hierarchical structure indicating a storage position of the searched document in the first storage means on the display means;
When one of the index information displayed on the display means is selected, the storage position of the document corresponding to the selected index information on the hierarchical structure displayed on the display means is highlighted. The document management apparatus according to claim 7, wherein:
前記第3の記憶手段は、前記入力手段で時系列に入力された複数のプロファイル情報を各プロファイル情報が入力された時刻とともに記憶し、
前記選択手段は、前記第3の記憶手段で記憶された複数のプロファイル情報のうち前記時刻が最新のプロファイル情報を用いて文書を選択することを特徴とする請求項8記載の文書管理装置。
The third storage means stores a plurality of profile information input in time series by the input means together with the time when each profile information is input,
9. The document management apparatus according to claim 8, wherein the selection unit selects a document using profile information with the latest time among a plurality of profile information stored in the third storage unit.
前記第3の記憶手段で記憶された各プロファイル情報に含まれる各キーワード及び各URLと、各プロファイル情報の入力された時刻を基に各キーワード及び各URLがプロファイル情報として用いられていた期間とを表示手段で表示する第2の表示制御手段と、
前記表示手段で表示されたキーワード及びURLのうちの少なくとも1つを選択する手段と、
をさらに具備し、
前記検索手段は、選択されたキーワード及びURLのうちの少なくとも1つ含む検索式を用いて、前記第2の記憶手段からインデックス情報を検索し、前記第1の記憶手段から検索されたインデックス情報に対応する文書を検索することを特徴とする請求項10記載の文書管理装置。
Each keyword and each URL included in each profile information stored in the third storage means, and a period during which each keyword and each URL was used as profile information based on the input time of each profile information Second display control means for displaying on the display means;
Means for selecting at least one of the keyword and URL displayed by the display means;
Further comprising
The search means searches for index information from the second storage means using a search expression including at least one of the selected keyword and URL, and sets the index information searched from the first storage means. The document management apparatus according to claim 10, wherein a corresponding document is searched.
前記検索手段で検索されたインデックス情報のうち、前記プロファイル情報に含まれるキーワード及びURLのうち、前記検索式に含まれるキーワード及びURLのみを含むインデックス情報と、当該インデックス情報に対応する文書を前記第1及び第2の記憶手段から削除する手段をさらに具備したことを特徴とする請求項11記載の文書管理装置。  Of the index information searched by the search means, out of the keywords and URLs included in the profile information, the index information including only the keywords and URLs included in the search formula, and the document corresponding to the index information 12. The document management apparatus according to claim 11, further comprising means for deleting from the first and second storage means. 文書を作成、編集、表示するための画面を表示して、文書の作成、編集、表示を行う作成・編集・表示手段と、
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えたコンピュータに、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を実行させるためのプログラムを記録した機械読み取り可能な記録媒体。
A creation / editing / display means for creating, editing, and displaying a document by displaying a screen for creating, editing, and displaying a document;
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
On a computer with
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A machine-readable recording medium on which a program for executing the program is recorded.
前記プログラムは、
キーワード及びURL(Uniform Resource Locator)のうちの少なくとも1つを含むプロファイル情報を入力する入力ステップと、
前記コンピュータが備える第3の記憶手段に、入力された前記プロファイル情報を当該プロファイル情報が入力された時刻とともに記憶するステップと、
前記画面上で作成・編集・表示されている文書のうち、前記プロファイル情報に含まれるURLを有する文書及び前記プロファイル情報に含まれるキーワードと同一のキーワードの抽出された文書を選択する選択ステップと、
をさらに含み、
前記第5のステップは、前記登録タイミングが検知されたとき、前記選択ステップで選択された文書について、前記第3のステップで抽出されたキーワード及び前記第4のステップで取得された属性情報を含むインデックス情報を生成することを特徴とする請求項13記載の記録媒体。
The program is
An input step of inputting profile information including at least one of a keyword and a URL (Uniform Resource Locator);
Storing the input profile information together with the time at which the profile information was input in a third storage means provided in the computer;
A selection step of selecting a document having a URL included in the profile information and an extracted document having the same keyword as the keyword included in the profile information from among the documents created, edited, and displayed on the screen;
Further including
The fifth step includes the keyword extracted in the third step and the attribute information acquired in the fourth step for the document selected in the selection step when the registration timing is detected. 14. The recording medium according to claim 13, wherein index information is generated.
文書を作成、編集、表示するための画面を表示して、文書の作成、編集、表示を検出する作成・編集・表示手段と、
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記画面上で作成・編集・表示されている文書について生成されたインデックス情報を記憶する第2の記憶手段と、
を備えた文書管理装置における文書管理方法であって、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する第1のステップと、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する第2のステップと、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する第3のステップと、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する第4のステップと、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記第3のステップで抽出されたキーワード及び前第4のステップで取得された属性情報を含むインデックス情報を生成する第5のステップと、
前記インデックス情報を前記第2の記憶手段に記憶する第6のステップと、
を含むことを特徴とする文書管理方法。
A screen for creating, editing, and displaying a document, and a creation / edit / display means for detecting creation, editing, and display of the document,
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
Second storage means for storing index information generated for a document created / edited / displayed on the screen;
A document management method in a document management apparatus comprising:
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. A first step to set,
A second step of detecting the registration timing generated by the creating / editing / displaying unit;
A third step of extracting a keyword from the document created / edited / displayed on the screen;
A fourth step of acquiring attribute information including a file name of a document created / edited / displayed on the screen and a storage position in the first storage unit in which the document is stored;
Index information including keywords extracted in the third step and attribute information acquired in the previous fourth step with respect to the document created, edited, and displayed on the screen when the registration timing is detected A fifth step of generating
A sixth step of storing the index information in the second storage means;
A document management method comprising:
文書を作成、編集、表示するための画面を表示して、文書の作成、編集、表示を検出する作成・編集・表示手段と、
前記作成・編集・表示手段で作成・編集・表示された文書を記憶する第1の記憶手段と、
前記作成・編集・表示手段が前記画面を閉じるときと、前記作成・編集・表示手段が前記画面上で作成・編集・表示されている文書を前記第1の記憶手段に記憶するときと、前記作成・編集・表示手段が新たな文書を表示するときとを含む複数のタイミングのうちの少なくとも1つを、前記画面上で作成、編集、表示されている文書のインデックス情報を登録する登録タイミングとして設定する設定手段と、
前記作成・編集・表示手段で発生した前記登録タイミングを検知する検知手段と、
前記画面上で作成・編集・表示されている文書からキーワードを抽出する抽出手段と、
前記画面上で作成・編集・表示されている文書のファイル名及び当該文書が記憶される前記第1の記憶手段での記憶位置を含む属性情報を取得する取得手段と、
前記登録タイミングが検知されたとき、前記画面上で作成・編集・表示されている文書について、前記抽出手段で抽出されたキーワード及び前記取得手段で取得された属性情報を含むインデックス情報を生成する生成手段と、
前記インデックス情報を記憶する第2の記憶手段と、
を具備したことを特徴とする文書管理装置。
A screen for creating, editing, and displaying a document, and a creation / edit / display means for detecting creation, editing, and display of the document,
First storage means for storing a document created / edited / displayed by the creation / editing / display means;
When the creation / editing / display means closes the screen, and when the creation / editing / display means stores the document created / edited / displayed on the screen in the first storage means, At least one of a plurality of timings including when the creation / editing / display unit displays a new document is used as a registration timing for registering index information of the document created, edited, and displayed on the screen. Setting means for setting;
Detection means for detecting the registration timing generated in the creation / editing / display means;
Extraction means for extracting a keyword from a document created, edited and displayed on the screen;
An acquisition means for acquiring attribute information including a file name of a document created, edited and displayed on the screen and a storage position in the first storage means in which the document is stored;
Generating to generate index information including keywords extracted by the extracting unit and attribute information acquired by the acquiring unit for a document created, edited, and displayed on the screen when the registration timing is detected Means,
Second storage means for storing the index information;
A document management apparatus comprising:
JP09389399A 1999-03-31 1999-03-31 Document management method, document management apparatus, and storage medium Expired - Fee Related JP3673111B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09389399A JP3673111B2 (en) 1999-03-31 1999-03-31 Document management method, document management apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09389399A JP3673111B2 (en) 1999-03-31 1999-03-31 Document management method, document management apparatus, and storage medium

Publications (2)

Publication Number Publication Date
JP2000285134A JP2000285134A (en) 2000-10-13
JP3673111B2 true JP3673111B2 (en) 2005-07-20

Family

ID=14095172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09389399A Expired - Fee Related JP3673111B2 (en) 1999-03-31 1999-03-31 Document management method, document management apparatus, and storage medium

Country Status (1)

Country Link
JP (1) JP3673111B2 (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2363044A (en) * 2000-05-16 2001-12-05 Ibm Method and computer system for selecting and displaying graphic objects
EP1627284B1 (en) 2003-05-23 2018-10-24 IP Reservoir, LLC Intelligent data storage and processing using fpga devices
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
JP4314074B2 (en) * 2003-06-20 2009-08-12 株式会社リコー Image forming apparatus, image forming system, image forming method, image forming program, and image forming program storage medium
AU2006221023A1 (en) 2005-03-03 2006-09-14 Washington University Method and apparatus for performing biosequence similarity searching
JP4802672B2 (en) 2005-11-14 2011-10-26 株式会社日立製作所 Electronic document management apparatus, electronic document management program, electronic document management system
JP4578454B2 (en) * 2006-09-21 2010-11-10 株式会社ソニー・コンピュータエンタテインメント Database generation method and information processing apparatus
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
WO2008063974A2 (en) * 2006-11-13 2008-05-29 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
JPWO2008102727A1 (en) * 2007-02-21 2010-05-27 日本電気株式会社 Index generation device / system / program / method, search device / system / program / method
JP4725627B2 (en) 2008-10-02 2011-07-13 ブラザー工業株式会社 Communication device
JP4702434B2 (en) 2008-11-14 2011-06-15 ブラザー工業株式会社 Communication apparatus and control program
JP2013196544A (en) * 2012-03-22 2013-09-30 Nec Corp Document management system, document management method, and program therefor
JP5907624B2 (en) * 2013-09-13 2016-04-26 シャープ株式会社 Information processing device
WO2018119035A1 (en) 2016-12-22 2018-06-28 Ip Reservoir, Llc Pipelines for hardware-accelerated machine learning
KR102345002B1 (en) * 2018-08-29 2021-12-29 주식회사 아이팩토리 Patent document creating device, method, computer program, computer-readable recording medium, server and system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10214268A (en) * 1997-01-29 1998-08-11 Omron Corp Method and device for retrieving document
JPH1115854A (en) * 1997-06-24 1999-01-22 Omron Corp Document processing method, its device and recording medium

Also Published As

Publication number Publication date
JP2000285134A (en) 2000-10-13

Similar Documents

Publication Publication Date Title
JP3673111B2 (en) Document management method, document management apparatus, and storage medium
US5913215A (en) Browse by prompted keyword phrases with an improved method for obtaining an initial document set
US7315848B2 (en) Web snippets capture, storage and retrieval system and method
US6073170A (en) Information filtering device and information filtering method
US6226655B1 (en) Method and apparatus for retrieving data from a network using linked location identifiers
US5721897A (en) Browse by prompted keyword phrases with an improved user interface
US20040205514A1 (en) Hyperlink preview utility and method
US10423697B2 (en) User interface with navigation controls for the display or concealment of adjacent content
US8584009B2 (en) Automatically propagating changes in document access rights for subordinate document components to superordinate document components
US20050203935A1 (en) Clipboard content and document metadata collection
US20060167861A1 (en) Methods and systems for managing data
US20060101102A1 (en) Method for organizing a plurality of documents and apparatus for displaying a plurality of documents
US20050216452A1 (en) Search capture
US20050216837A1 (en) Unread-state management
US20050216886A1 (en) Editing multi-layer documents
US20050240489A1 (en) Retaining custom item order
US20050216528A1 (en) Sharing collection-file contents
Jayawardana et al. A personalized information environment for digital libraries
US20110252313A1 (en) Document information selection method and computer program product
JP4469432B2 (en) INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP2004192355A (en) Informational searching method, its device and computer program for information search
WO2004031956A1 (en) Related information management method, program, and apparatus
JP3429225B2 (en) Storage medium storing data search program
JP3707912B2 (en) Graphical user interface
JP2007073072A (en) Related document display device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050421

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees