JP2003157264A - 文章管理システム、その管理方法及びそのプログラム - Google Patents
文章管理システム、その管理方法及びそのプログラムInfo
- Publication number
- JP2003157264A JP2003157264A JP2001356585A JP2001356585A JP2003157264A JP 2003157264 A JP2003157264 A JP 2003157264A JP 2001356585 A JP2001356585 A JP 2001356585A JP 2001356585 A JP2001356585 A JP 2001356585A JP 2003157264 A JP2003157264 A JP 2003157264A
- Authority
- JP
- Japan
- Prior art keywords
- document
- classification map
- data
- storage unit
- search index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
するための分類マップを自動生成し、当該分類マップを
用いて文書データを管理する文書管理システム、その管
理方法及びそのプログラムを提供する。 【解決手段】 文書入力装置3から入力された文書デー
タは、文書登録部11により文書記憶部21に登録され
る。文書検索用インデックス生成部12は、新規に登録
された文書データの内容を解析し、タグ単位で検索する
ための文書検索用インデックスを生成し、文書検索用イ
ンデックス記憶部22に記憶する。分類マップ生成部1
3は、分類マップ記憶部23に定義される分類マップを
参照し、文書検索部14により文書検索用インデックス
記憶部22を検索し、分類マップの各リーフを生成し、
新たに登録された文書データの分類マップを生成する。
よって、不要リーフが生成されず、分類マップのための
記憶容量を削減でき、分類マップを表示する際に、必要
なリーフのみ表示するので視認性、操作性を向上する。
Description
ム、その管理方法及びそのプログラムに関し、特にタグ
付き構造で表現された文書データを分類マップに基づい
て管理する文書管理システム、その管理方法及びそのプ
ログラムに関する。
タの分類や検索を行う方法として、階層構造から成る分
類マップを定義(作成)し、その末端のリーフに検索条
件を与えておき、利用者により当該リーフが選択された
場合、予め設定された検索条件に該当する文書集合の一
覧を表示装置に表示する方式を採用されている。
来の文書管理システムにおいて、以下に示すような問題
点があった。
定されているため、あらかじめ全てのリーフの値と検索
条件とを記述しておかなければならないので、不要なリ
ーフが多く存在し、画面に分類マップを表示した場合に
表示項目が多くなり、操作性と視認性の両方に欠けると
いう問題点があった。
定されているため、これまで分類マップに存在していな
い値が文書中に出現する度に分類マップを変更する必要
があるので、運用性が損なわれるという問題点があっ
た。
のであり、タグ付き構造で表現された文書データを管理
する文書管理システムにおいて、文書データを分類する
ための分類マップを自動的に生成することにより、当該
分類マップを用いて文書データを管理し、当該分類マッ
プを用いて検索を行う文書管理システム、その管理方法
及びそのプログラムを提供することを目的とする。
に、請求項1記載の発明は、タグ付き構造で表現された
文書データを分類マップに基づいて管理する文書管理シ
ステムにおいて、タグ付き構造で表現された文書データ
を入力する入力装置と、入力装置により入力された文書
データを記憶する記憶装置と、プログラム制御によりデ
ータ処理を実行するデータ処理装置と、記憶装置に記憶
された文書データを表示する表示装置と、を備え、デー
タ処理装置は、入力装置により入力されたタグ付き構造
の文書データを記憶装置に登録する文書登録手段と、文
書登録手段により登録された文書データを解析して、タ
グ単位で検索を行うための検索用インデックスを生成す
る文書検索用インデックス生成手段と、文書登録手段に
より記憶装置に一定量の文書データを登録する度に、該
一定量の文書データの夫々のタグ内容をリーフに持つ分
類マップを生成する分類マップ生成手段と、を有するこ
とを特徴とする。
明において、記憶装置は、文書登録手段により登録され
たタグ付き構造の文書データを記憶する文書データ記憶
部と、文書検索用インデックス生成手段により生成され
た検索用インデックスを記憶する検索用インデックス記
憶部と、分類マップ生成手段により生成された分類マッ
プを記憶する分類マップ記憶部と、を有することを特徴
とする。
記載の発明において、分類マップは、複数のノードを備
える木構造により構築され、直下にリーフを備えるノー
ドには、該リーフを展開するための展開条件が与えら
れ、リーフには、検索条件が与えられることを特徴とす
る。
明において、分類マップ生成手段は、文書登録手段によ
り記憶装置に登録された初期文書集合に対して、展開条
件としてのタグパスが与えられた場合、初期文書集合か
ら最初の1文書を選択して、該選択された1文書に対す
るタグパスの値を取得し、選択された1文書に対するタ
グパスの値が含まれていない文書集合を初期文書集合か
ら抽出し、抽出された文書集合を新たな初期文書集合と
し、該新たな初期文書集合から最初の1文書を選択し、
該選択された1文書に対するタグパスの値を取得し、取
得したタグパスの含まれていない文書集合を新たな初期
文書集合から抽出し、初期文書集合が無くなるまで処理
を継続することを特徴とする。
明において、データ処理装置は、文書登録手段により記
憶装置に登録される新たな追加文書データが一定量に達
する毎に、文書検索用インデックス生成手段により追加
文書検索用インデックスを生成し、分類マップ生成手段
により追加文書データに対する差分分類マップを生成
し、記憶装置は、文書検索用インデックス生成手段によ
り生成された追加文書検索用インデックスを記憶する追
加文書検索用インデックス記憶部と、分類マップ生成手
段により生成された差分分類マップを記憶する差分分類
マップ記憶部と、を有し、データ処理装置は、分類マッ
プ記憶部に記憶されている分類マップと、差分分類マッ
プ記憶部に記憶されている差分分類マップとを合成して
新たな分類マップを作成する分類マップ合成手段を有
し、追加文書データが一定量追加登録される毎に、分類
マップ合成手段により作成された新たな分類マップで、
分類マップ記憶部に記憶されている分類マップを更新す
ることを特徴とする。
いずれか1項に記載の発明において、データ処理装置
は、分類マップ記憶部に記憶されている分類マップに基
づいて、所望の文書データを検索する文書検索手段を有
することを特徴とする。
現された文書データを入力する入力装置と、入力装置に
より入力された文書データを記憶する記憶装置と、プロ
グラム制御によりデータ処理を実行するデータ処理装置
と、記憶装置に記憶された文書データを表示する表示装
置と、を備える文書管理システムの管理方法であって、
データ処理装置は、入力装置により入力されたタグ付き
構造の文書データを記憶装置に登録する文書登録工程
と、文書登録工程により登録された文書データを解析し
て、タグ単位で検索を行うための検索用インデックスを
生成する文書検索用インデックス生成工程と、文書登録
工程により記憶装置に一定量の文書データを登録する度
に、該一定量の文書データの夫々のタグ内容をリーフに
持つ分類マップを生成する分類マップ生成工程と、を有
することを特徴とする。
明において、記憶装置は、文書登録工程により登録され
たタグ付き構造の文書データを記憶する文書データ記憶
部と、文書検索用インデックス生成工程により生成され
た検索用インデックスを記憶する検索用インデックス記
憶部と、分類マップ生成工程により生成された分類マッ
プを記憶する分類マップ記憶部と、を有することを特徴
とする。
記載の発明において、分類マップは、複数のノードを備
える木構造により構築され、直下にリーフを備えるノー
ドには、該リーフを展開するための展開条件が与えら
れ、リーフには、検索条件が与えられることを特徴とす
る。
発明において、分類マップ生成工程は、文書登録工程に
より記憶装置に登録された初期文書集合に対して、展開
条件としてのタグパスが与えられた場合、初期文書集合
から最初の1文書を選択して、該選択された1文書に対
するタグパスの値を取得し、選択された1文書に対する
タグパスの値が含まれていない文書集合を初期文書集合
から抽出し、抽出された文書集合を新たな初期文書集合
とし、該新たな初期文書集合から最初の1文書を選択
し、該選択された1文書に対するタグパスの値を取得
し、取得したタグパスの含まれていない文書集合を新た
な初期文書集合から抽出し、初期文書集合が無くなるま
で処理を継続することを特徴とする。
の発明において、データ処理装置は、文書登録工程によ
り記憶装置に登録される新たな追加文書データが一定量
に達する毎に、文書検索用インデックス生成工程により
追加文書検索用インデックスを生成する追加文書検索用
インデックス生成工程と、追加文書データに対する差分
分類マップを生成する差分分類マップ生成工程と、を有
し、記憶装置は、文書検索用インデックス生成工程によ
り生成された追加文書検索用インデックスを記憶する追
加文書検索用インデックス記憶部と、分類マップ生成工
程により生成された差分分類マップを記憶する差分分類
マップ記憶部と、を有し、データ処理装置は、分類マッ
プ記憶部に記憶されている分類マップと、差分分類マッ
プ記憶部に記憶されている差分分類マップとを合成して
新たな分類マップを作成する分類マップ合成工程と、追
加文書データが一定量追加登録される毎に、分類マップ
合成工程により作成された新たな分類マップで、分類マ
ップ記憶部に記憶されている分類マップを更新する分類
マップ更新工程と、を有することを特徴とする。
1のいずれか1項に記載の発明において、データ処理装
置は、分類マップ記憶部に記憶されている分類マップに
基づいて、所望の文書データを検索する文書検索工程を
有することを特徴とする。
表現された文書データを入力する入力装置と、入力装置
により入力された文書データを記憶する記憶装置と、プ
ログラム制御によりデータ処理を実行するデータ処理装
置と、記憶装置に記憶された文書データを表示する表示
装置と、を備える文書管理システムのプログラムであっ
て、データ処理装置に、入力装置により入力されたタグ
付き構造の文書データを記憶装置に登録する文書登録処
理と、文書登録処理により登録された文書データを解析
して、タグ単位で検索を行うための検索用インデックス
を生成する文書検索用インデックス生成処理と、文書登
録処理により記憶装置に一定量の文書データを登録する
度に、該一定量の文書データの夫々のタグ内容をリーフ
に持つ分類マップを生成する分類マップ生成処理と、を
実行させることを特徴とする。
の発明において、記憶装置は、文書登録処理により登録
されたタグ付き構造の文書データを記憶する文書データ
記憶部と、文書検索用インデックス生成処理により生成
された検索用インデックスを記憶する検索用インデック
ス記憶部と、分類マップ生成処理により生成された分類
マップを記憶する分類マップ記憶部と、を有することを
特徴とする。
は14記載の発明において、分類マップは、複数のノー
ドを備える木構造により構築され、直下にリーフを備え
るノードには、該リーフを展開するための展開条件が与
えられ、リーフには、検索条件が与えられることを特徴
とする。
の発明において、分類マップ生成処理は、文書登録処理
により記憶装置に登録された初期文書集合に対して、展
開条件としてのタグパスが与えられた場合、初期文書集
合から最初の1文書を選択して、該選択された1文書に
対するタグパスの値を取得し、選択された1文書に対す
るタグパスの値が含まれていない文書集合を初期文書集
合から抽出し、抽出された文書集合を新たな初期文書集
合とし、該新たな初期文書集合から最初の1文書を選択
し、該選択された1文書に対するタグパスの値を取得
し、取得したタグパスの含まれていない文書集合を新た
な初期文書集合から抽出し、初期文書集合が無くなるま
で処理を継続することを特徴とする。
の発明において、データ処理装置に、文書登録処理によ
り記憶装置に登録される新たな追加文書データが一定量
に達する毎に、文書検索用インデックス生成処理により
追加文書検索用インデックスを生成する追加文書検索用
インデックス生成処理と、追加文書データに対する差分
分類マップを生成する差分分類マップ生成処理と、を実
行させ、記憶装置は、文書検索用インデックス生成処理
により生成された追加文書検索用インデックスを記憶す
る追加文書検索用インデックス記憶部と、分類マップ生
成処理により生成された差分分類マップを記憶する差分
分類マップ記憶部と、を有し、データ処理装置に、さら
に、分類マップ記憶部に記憶されている分類マップと、
差分分類マップ記憶部に記憶されている差分分類マップ
とを合成して新たな分類マップを作成する分類マップ合
成処理と、追加文書データが一定量追加登録される毎
に、分類マップ合成処理により作成された新たな分類マ
ップで、分類マップ記憶部に記憶されている分類マップ
を更新する分類マップ更新処理と、を実行させることを
特徴とする。
17のいずれか1項に記載の発明において、データ処理
装置に、分類マップ記憶部に記憶されている分類マップ
に基づいて、所望の文書データを検索する文書検索処理
を実行させることを特徴とする。
発明に係る文書管理システム、その管理方法及びそのプ
ログラムの実施の形態を説明する。図1から図4に、本
発明に係る文書管理システム、その管理方法及びそのプ
ログラムの実施の形態を示す。
の実施形態である文書管理システムの概略構成を示すブ
ロック図である。図1において、本発明の第1の実施形
態である文書管理システムは、プログラム制御により動
作するデータ処理装置1と、文書データなどの情報を記
憶する記憶装置2と、文書データなどを表示するCR
T,LCD,PDP等により構成される表示装置3と、
文書データなどをデータ処理装置1に入力する入力装置
4と、を有して構成される。
文書検索用インデックス生成部12と、分類マップ生成
部13と、文書検索部14と、を備えている。
る文書入力装置4から入力された文書データを記憶する
文書記憶部21と、文書検索用インデックス生成部12
により生成された文書検索用インデックスを記憶する文
書検索用インデックス記憶部22と、分類マップ生成部
13により生成された分類マップを記憶する分類マップ
記憶部23と、を備えている。
入力された文書データを文書記憶部21へ送る。この文
書記憶部21に登録される各文書データは、タグ付きで
表現されており、各タグの中に内容が記述されている。
書登録部11により文書記憶部21に入力された各文書
データが登録されると、当該各文書データの内容を解析
し、各文書データのタグで囲まれた値をタグ単位で検索
可能となるように、文書検索用インデックスを生成し、
この生成した文書検索用インデックスを記憶装置2の文
書検索用インデックス記憶部22へ送る。
により文書記憶部21に一定量の文書データが登録され
ると、これら一定量の文書データから各タグの内容をリ
ーフに持つ分類マップを生成し、当該生成した分類マッ
プを分類マップ記憶部23へ送る。
た分類マップのうち、ユーザにより任意に指定されたリ
ーフに設定された検索条件に基づいて文書検索用インデ
ックス記憶部22を検索し、検索にヒットした文書検索
用インデックスを割り当てられた文書データを文書記憶
部21から読み出し、表示装置3に表示する。
ステムにタグ付き構造の文書データが登録される場合の
動作例を以下に示す。
は、文書登録部11により文書記憶部21に登録され
る。次に、文書検索用インデックス生成部12は、新規
に登録された文書データの内容を解析し、各タグ単位で
の検索を可能とするための文書検索用インデックスを生
成し、文書検索用インデックス記憶部22に記憶する。
分類マップ生成部13は、分類マップ記憶部23に記憶
されている分類マップの定義を参照し、文書検索部14
により文書検索用インデックス記憶部22を検索し、分
類マップの各リーフを生成することにより、新たに登録
された文書データの分類マップを生成する。
た分類マップの実施例を示す。図2に示すように、分類
マップは、木構造により定義され、直下にリーフを持つ
各ノードにはノード配下のリーフを展開するための展開
条件が記述されている。例えば、ノード4の展開条件と
して/AAA/BBB/CCCというタグパスが指定さ
れている場合、文書記憶部21に登録されている各文書
データのタグパス/AAA/BBB/CCCに記述され
ている値(V1、V2、V3)がノード4配下のリーフ
(1〜3)の値として表示装置3に一覧として表示され
る。
の値一覧を自動的に生成し、当該生成された分類マップ
に基づいて文書データの管理や検索を容易に実現するも
のである。
3に示す6つの文書1〜6(初期文書集合)について、
最初の1つの文書1を選択し、そのタグパス/AAA/
BBB/CCCの値を取得する。ここでは、文書1が選
択されるので、V1が取得される。この値V1に基づい
て、ノード4のリーフV1(リーフ1)を1つ生成す
る。
AA/BBB/CCCにV1が含まれていない文書を文
書検索用インデックス記憶部22に格納されている文書
検索用インデックスを検索して求める。図3の場合で
は、文書2、文書3、文書5が選択され、これらが新た
な文書集合42として抽出される。
の文書を選択し、そのタグパス/AAA/BBB/CC
Cの値を取得する。ここでは、文書2が選択されるの
で、V2が取得される。この値V2に基づいて、ノード
4のリーフV2(リーフ2)を1つ生成する。
ス/AAA/BBB/CCCにV2が含まれていない文
書を文書検索用インデックス記憶部22に格納されてい
る文書検索用インデックスを検索して求める。図3の場
合では、文書集合43として文書3が選択される。
を選択し、そのタグパス/AAA/BBB/CCCの値
を取得する。図3の場合では、文書3が選択され、V3
が取得される。この値V3でノード4のリーフV3(リ
ーフ3)を1つ生成する。
/BBB/CCCにV3が含まれていない文書集合を検
索する。図3において、この検索結果は、文書集合が空
となるため、処理を停止する。ここでノード4の配下の
リーフの集合V1、V2、V3を得ることができる。
が与えられた場合に、その文書集合から最初の1文書を
選択して、選択された文書に対してタグパスの値を取得
し、初期文書集合に対してタグパスにその値が含まれて
いない文書集合を求め、新たに求められた文書集合を初
期文書集合とする。この処理を初期文書集合が空になる
まで繰り返し、最終的に取得された値の集合をノードに
設定された展開条件に対して展開されたリーフの一覧と
することができる。
の実施形態である文書管理システムの概略構成を示すブ
ロック図である。図4において、本発明の第2の実施形
態である文書管理システムは、図1に示した本発明の第
1の実施形態におけるデータ処理装置1の構成に分類マ
ップ合成部15を追加し、また、記憶装置5の構成に差
分分類マップ記憶部24及び追加文書検索用インデック
ス記憶部25を追加した点で異なるものである。なお、
本発明の第1の実施形態と同一構成要素に関しては、同
一符号を付してその説明を省略する。
た文書データに対して作成された分類マップ(差分分類
マップ)と、分類マップ記憶部21に記憶されている分
類マップと、を合成する。
された文書データに対して作成された差分分類マップを
記憶する。
は、新たに追加された文書データに対して作成された追
加文書検索用インデックスを記憶する。
ステムにタグ付き構造の文書データが登録される場合の
動作例を以下に示す。
データは、文書登録部11により文書記憶部21に登録
される。次に、文書検索用インデックス生成部12は、
新たに追加された文書データの内容を解析し、各タグ単
位での検索を可能とするための追加文書検索用インデッ
クスを生成し、追加文書検索用インデックス記憶部24
に記憶する。分類マップ生成部13は、追加された文書
データが一定量を超えると作動し、追加された文書デー
タだけに対する検索用インデックスが記憶されている追
加文書検索用インデックス記憶部24を検索し、差分分
類マップを生成して差分分類マップ記憶部24に記憶す
る。ここでは、分類マップ生成部13により差分分類マ
ップが生成された後で、追加文書検索用インデックス記
憶部24に記憶されているインデックス情報は消去され
る。
分分類マップ記憶部24に記憶されている差分分類マッ
プと分類マップ記憶部21に記憶されている分類マップ
とを合成する。分類マップ21と差分分類マップ24の
木構造のルートノードから順にノードを探索し、リーフ
一覧に辿りついた時に、差分分類マップのリーフの値で
分類マップのリーフの値にないリーフだけを追加する。
この動作を全てのノード、リーフに対して行うことによ
り、分類マップを自動的に更新する。
くなった場合でも、追加される文書のみにより差分分類
マップを生成し、分類マップ合成部15により分類マッ
プ記憶部24に記憶されている分類マップと合成し、自
動的に分類マップを更新するので、性能を落とすことな
く分類マップを生成することができる。
によれば、分類マップを生成する際のリーフを文書内容
から自動生成するため、不要なリーフが生成されること
がなく、分類マップのための記憶容量を削減すると共
に、分類マップを表示した場合に必要なリーフのみしか
表示されないため、視認性、操作性を向上することがで
きる。
合に、文書内容から自動的にリーフが生成されるため、
分類マップを手作業で修正する必要がなく、また、性能
を落とすことがないので運用性を向上することができ
る。
システムの概略構成を示すブロック図である。
システムの概略構成を示すブロック図である。
Claims (18)
- 【請求項1】 タグ付き構造で表現された文書データを
分類マップに基づいて管理する文書管理システムにおい
て、 前記タグ付き構造で表現された文書データを入力する入
力装置と、 前記入力装置により入力された文書データを記憶する記
憶装置と、 プログラム制御によりデータ処理を実行するデータ処理
装置と、 前記記憶装置に記憶された文書データを表示する表示装
置と、を備え、 前記データ処理装置は、 前記入力装置により入力されたタグ付き構造の文書デー
タを前記記憶装置に登録する文書登録手段と、 前記文書登録手段により登録された前記文書データを解
析して、タグ単位で検索を行うための検索用インデック
スを生成する文書検索用インデックス生成手段と、 前記文書登録手段により前記記憶装置に一定量の文書デ
ータを登録する度に、該一定量の文書データの夫々のタ
グ内容をリーフに持つ分類マップを生成する分類マップ
生成手段と、 を有することを特徴とする文書管理システム。 - 【請求項2】 前記記憶装置は、 前記文書登録手段により登録された前記タグ付き構造の
文書データを記憶する文書データ記憶部と、 前記文書検索用インデックス生成手段により生成された
検索用インデックスを記憶する検索用インデックス記憶
部と、 前記分類マップ生成手段により生成された分類マップを
記憶する分類マップ記憶部と、 を有することを特徴とする請求項1記載の文書管理シス
テム。 - 【請求項3】 前記分類マップは、 複数のノードを備える木構造により構築され、 直下にリーフを備えるノードには、該リーフを展開する
ための展開条件が与えられ、 前記リーフには、検索条件が与えられることを特徴とす
る請求項1または2記載の文書管理システム。 - 【請求項4】 前記分類マップ生成手段は、 前記文書登録手段により前記記憶装置に登録された初期
文書集合に対して、前記展開条件としてのタグパスが与
えられた場合、 前記初期文書集合から最初の1文書を選択して、該選択
された1文書に対するタグパスの値を取得し、 前記選択された1文書に対するタグパスの値が含まれて
いない文書集合を前記初期文書集合から抽出し、 前記抽出された文書集合を新たな初期文書集合とし、該
新たな初期文書集合から最初の1文書を選択し、該選択
された1文書に対するタグパスの値を取得し、 前記取得したタグパスの含まれていない文書集合を前記
新たな初期文書集合から抽出し、 前記初期文書集合が無くなるまで処理を継続することを
特徴とする請求項3記載の文書管理システム。 - 【請求項5】 前記データ処理装置は、 前記文書登録手段により前記記憶装置に登録される新た
な追加文書データが一定量に達する毎に、前記文書検索
用インデックス生成手段により追加文書検索用インデッ
クスを生成し、 前記分類マップ生成手段により前記追加文書データに対
する差分分類マップを生成し、 前記記憶装置は、 前記文書検索用インデックス生成手段により生成された
前記追加文書検索用インデックスを記憶する追加文書検
索用インデックス記憶部と、 前記分類マップ生成手段により生成された前記差分分類
マップを記憶する差分分類マップ記憶部と、を有し、 前記データ処理装置は、 前記分類マップ記憶部に記憶されている分類マップと、
前記差分分類マップ記憶部に記憶されている差分分類マ
ップとを合成して新たな分類マップを作成する分類マッ
プ合成手段を有し、 前記追加文書データが一定量追加登録される毎に、前記
分類マップ合成手段により作成された前記新たな分類マ
ップで、前記分類マップ記憶部に記憶されている分類マ
ップを更新することを特徴とする請求項4記載の文書管
理システム。 - 【請求項6】 前記データ処理装置は、 前記分類マップ記憶部に記憶されている分類マップに基
づいて、所望の文書データを検索する文書検索手段を有
することを特徴とする請求項2から5のいずれか1項に
記載の文書管理システム。 - 【請求項7】 タグ付き構造で表現された文書データを
入力する入力装置と、 前記入力装置により入力された文書データを記憶する記
憶装置と、 プログラム制御によりデータ処理を実行するデータ処理
装置と、 前記記憶装置に記憶された文書データを表示する表示装
置と、を備える文書管理システムの管理方法であって、 前記データ処理装置は、 前記入力装置により入力されたタグ付き構造の文書デー
タを前記記憶装置に登録する文書登録工程と、 前記文書登録工程により登録された前記文書データを解
析して、タグ単位で検索を行うための検索用インデック
スを生成する文書検索用インデックス生成工程と、 前記文書登録工程により前記記憶装置に一定量の文書デ
ータを登録する度に、該一定量の文書データの夫々のタ
グ内容をリーフに持つ分類マップを生成する分類マップ
生成工程と、 を有することを特徴とする文書管理システムの管理方
法。 - 【請求項8】 前記記憶装置は、 前記文書登録工程により登録された前記タグ付き構造の
文書データを記憶する文書データ記憶部と、 前記文書検索用インデックス生成工程により生成された
検索用インデックスを記憶する検索用インデックス記憶
部と、 前記分類マップ生成工程により生成された分類マップを
記憶する分類マップ記憶部と、 を有することを特徴とする請求項7記載の文書管理シス
テムの管理方法。 - 【請求項9】 前記分類マップは、 複数のノードを備える木構造により構築され、 直下にリーフを備えるノードには、該リーフを展開する
ための展開条件が与えられ、 前記リーフには、検索条件が与えられることを特徴とす
る請求項7または8記載の文書管理システムの管理方
法。 - 【請求項10】 前記分類マップ生成工程は、 前記文書登録工程により前記記憶装置に登録された初期
文書集合に対して、前記展開条件としてのタグパスが与
えられた場合、 前記初期文書集合から最初の1文書を選択して、該選択
された1文書に対するタグパスの値を取得し、 前記選択された1文書に対するタグパスの値が含まれて
いない文書集合を前記初期文書集合から抽出し、 前記抽出された文書集合を新たな初期文書集合とし、該
新たな初期文書集合から最初の1文書を選択し、該選択
された1文書に対するタグパスの値を取得し、 前記取得したタグパスの含まれていない文書集合を前記
新たな初期文書集合から抽出し、 前記初期文書集合が無くなるまで処理を継続することを
特徴とする請求項9記載の文書管理システムの管理方
法。 - 【請求項11】 前記データ処理装置は、 前記文書登録工程により前記記憶装置に登録される新た
な追加文書データが一定量に達する毎に、前記文書検索
用インデックス生成工程により追加文書検索用インデッ
クスを生成する追加文書検索用インデックス生成工程
と、 前記追加文書データに対する差分分類マップを生成する
差分分類マップ生成工程と、を有し、 前記記憶装置は、 前記文書検索用インデックス生成工程により生成された
前記追加文書検索用インデックスを記憶する追加文書検
索用インデックス記憶部と、 前記分類マップ生成工程により生成された前記差分分類
マップを記憶する差分分類マップ記憶部と、を有し、 前記データ処理装置は、 前記分類マップ記憶部に記憶されている分類マップと、
前記差分分類マップ記憶部に記憶されている差分分類マ
ップとを合成して新たな分類マップを作成する分類マッ
プ合成工程と、 前記追加文書データが一定量追加登録される毎に、前記
分類マップ合成工程により作成された前記新たな分類マ
ップで、前記分類マップ記憶部に記憶されている分類マ
ップを更新する分類マップ更新工程と、 を有することを特徴とする請求項10記載の文書管理シ
ステムの管理方法。 - 【請求項12】 前記データ処理装置は、 前記分類マップ記憶部に記憶されている分類マップに基
づいて、所望の文書データを検索する文書検索工程を有
することを特徴とする請求項8から11のいずれか1項
に記載の文書管理システムの管理方法。 - 【請求項13】 タグ付き構造で表現された文書データ
を入力する入力装置と、 前記入力装置により入力された文書データを記憶する記
憶装置と、 プログラム制御によりデータ処理を実行するデータ処理
装置と、 前記記憶装置に記憶された文書データを表示する表示装
置と、を備える文書管理システムのプログラムであっ
て、 前記データ処理装置に、 前記入力装置により入力されたタグ付き構造の文書デー
タを前記記憶装置に登録する文書登録処理と、 前記文書登録処理により登録された前記文書データを解
析して、タグ単位で検索を行うための検索用インデック
スを生成する文書検索用インデックス生成処理と、 前記文書登録処理により前記記憶装置に一定量の文書デ
ータを登録する度に、該一定量の文書データの夫々のタ
グ内容をリーフに持つ分類マップを生成する分類マップ
生成処理と、 を実行させることを特徴とする文書管理システムのプロ
グラム。 - 【請求項14】 前記記憶装置は、 前記文書登録処理により登録された前記タグ付き構造の
文書データを記憶する文書データ記憶部と、 前記文書検索用インデックス生成処理により生成された
検索用インデックスを記憶する検索用インデックス記憶
部と、 前記分類マップ生成処理により生成された分類マップを
記憶する分類マップ記憶部と、 を有することを特徴とする請求項13記載の文書管理シ
ステムのプログラム。 - 【請求項15】 前記分類マップは、 複数のノードを備える木構造により構築され、 直下にリーフを備えるノードには、該リーフを展開する
ための展開条件が与えられ、 前記リーフには、検索条件が与えられることを特徴とす
る請求項13または14記載の文書管理システムのプロ
グラム。 - 【請求項16】 前記分類マップ生成処理は、 前記文書登録処理により前記記憶装置に登録された初期
文書集合に対して、前記展開条件としてのタグパスが与
えられた場合、 前記初期文書集合から最初の1文書を選択して、該選択
された1文書に対するタグパスの値を取得し、 前記選択された1文書に対するタグパスの値が含まれて
いない文書集合を前記初期文書集合から抽出し、 前記抽出された文書集合を新たな初期文書集合とし、該
新たな初期文書集合から最初の1文書を選択し、該選択
された1文書に対するタグパスの値を取得し、 前記取得したタグパスの含まれていない文書集合を前記
新たな初期文書集合から抽出し、 前記初期文書集合が無くなるまで処理を継続することを
特徴とする請求項15記載の文書管理システムのプログ
ラム。 - 【請求項17】 前記データ処理装置に、 前記文書登録処理により前記記憶装置に登録される新た
な追加文書データが一定量に達する毎に、前記文書検索
用インデックス生成処理により追加文書検索用インデッ
クスを生成する追加文書検索用インデックス生成処理
と、 前記追加文書データに対する差分分類マップを生成する
差分分類マップ生成処理と、を実行させ、 前記記憶装置は、 前記文書検索用インデックス生成処理により生成された
前記追加文書検索用インデックスを記憶する追加文書検
索用インデックス記憶部と、 前記分類マップ生成処理により生成された前記差分分類
マップを記憶する差分分類マップ記憶部と、を有し、 前記データ処理装置に、さらに、 前記分類マップ記憶部に記憶されている分類マップと、
前記差分分類マップ記憶部に記憶されている差分分類マ
ップとを合成して新たな分類マップを作成する分類マッ
プ合成処理と、 前記追加文書データが一定量追加登録される毎に、前記
分類マップ合成処理により作成された前記新たな分類マ
ップで、前記分類マップ記憶部に記憶されている分類マ
ップを更新する分類マップ更新処理と、 を実行させることを特徴とする請求項16記載の文書管
理システムのプログラム。 - 【請求項18】 前記データ処理装置に、 前記分類マップ記憶部に記憶されている分類マップに基
づいて、所望の文書データを検索する文書検索処理を実
行させることを特徴とする請求項14から17のいずれ
か1項に記載の文書管理システムのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001356585A JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
US10/291,711 US7069505B2 (en) | 2001-11-21 | 2002-11-12 | Document management system, method thereof, and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001356585A JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003157264A true JP2003157264A (ja) | 2003-05-30 |
JP4215425B2 JP4215425B2 (ja) | 2009-01-28 |
Family
ID=19168081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001356585A Expired - Fee Related JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7069505B2 (ja) |
JP (1) | JP4215425B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100756921B1 (ko) | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
JP2008129985A (ja) * | 2006-11-24 | 2008-06-05 | Seiko Epson Corp | 電子機器およびデータ生成方法 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7165238B2 (en) * | 2003-06-06 | 2007-01-16 | Intentional Software Corporation | Method and system for organizing and manipulating nodes by category in a program tree |
JP2005043966A (ja) * | 2003-07-22 | 2005-02-17 | Pioneer Electronic Corp | データ検索装置及び方法、ナビゲーション装置及び方法、データ検索用のデータセット並びにコンピュータプログラム |
KR100775852B1 (ko) | 2006-01-18 | 2007-11-13 | 포스데이타 주식회사 | 응용 프로그램의 자원 검색 시스템 및 방법 |
JP5211557B2 (ja) * | 2007-06-15 | 2013-06-12 | 富士通株式会社 | Web会議支援プログラム、該プログラムを記録した記録媒体、Web会議支援装置、およびWeb会議支援方法 |
US7941399B2 (en) * | 2007-11-09 | 2011-05-10 | Microsoft Corporation | Collaborative authoring |
US8028229B2 (en) * | 2007-12-06 | 2011-09-27 | Microsoft Corporation | Document merge |
US8825758B2 (en) | 2007-12-14 | 2014-09-02 | Microsoft Corporation | Collaborative authoring modes |
US7818293B2 (en) * | 2008-01-02 | 2010-10-19 | International Business Machines Corporation | Method and system to synchronize updated versions of a document edited on a collaborative site that are under document management control |
US8301588B2 (en) | 2008-03-07 | 2012-10-30 | Microsoft Corporation | Data storage for file updates |
US8352870B2 (en) | 2008-04-28 | 2013-01-08 | Microsoft Corporation | Conflict resolution |
US8429753B2 (en) | 2008-05-08 | 2013-04-23 | Microsoft Corporation | Controlling access to documents using file locks |
US8825594B2 (en) | 2008-05-08 | 2014-09-02 | Microsoft Corporation | Caching infrastructure |
US8417666B2 (en) * | 2008-06-25 | 2013-04-09 | Microsoft Corporation | Structured coauthoring |
US20100131836A1 (en) * | 2008-11-24 | 2010-05-27 | Microsoft Corporation | User-authored notes on shared documents |
US8346768B2 (en) * | 2009-04-30 | 2013-01-01 | Microsoft Corporation | Fast merge support for legacy documents |
US8180814B1 (en) | 2011-02-16 | 2012-05-15 | Docbert, LLC | System and method for file management |
US9646013B2 (en) | 2011-02-16 | 2017-05-09 | Docbert Llc | System and method for file management |
US9262510B2 (en) | 2013-05-10 | 2016-02-16 | International Business Machines Corporation | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries |
US9251136B2 (en) | 2013-10-16 | 2016-02-02 | International Business Machines Corporation | Document tagging and retrieval using entity specifiers |
US9235638B2 (en) | 2013-11-12 | 2016-01-12 | International Business Machines Corporation | Document retrieval using internal dictionary-hierarchies to adjust per-subject match results |
US11126592B2 (en) | 2014-09-02 | 2021-09-21 | Microsoft Technology Licensing, Llc | Rapid indexing of document tags |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0457153A (ja) | 1990-06-27 | 1992-02-24 | Fujitsu Ltd | 構造化文書処理システム |
JP2795317B2 (ja) | 1996-06-24 | 1998-09-10 | 日本電気株式会社 | 多段表処理方式 |
JPH10187680A (ja) | 1996-12-20 | 1998-07-21 | Nec Corp | 単語、文、部分の粒度で管理するドキュメントリポジトリ装置 |
JP3887867B2 (ja) | 1997-02-26 | 2007-02-28 | 株式会社日立製作所 | 構造化文書の登録方法 |
JP3849279B2 (ja) * | 1998-01-23 | 2006-11-22 | 富士ゼロックス株式会社 | インデクス作成方法および検索方法 |
US6266682B1 (en) * | 1998-08-31 | 2001-07-24 | Xerox Corporation | Tagging related files in a document management system |
US6360215B1 (en) * | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
JP2000348038A (ja) | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 半構造データベースのためのデータ格納装置および方法 |
AU5615000A (en) * | 1999-06-14 | 2001-01-02 | Thomson Corporation, The | System for converting data to a markup language |
JP2001005820A (ja) | 1999-06-18 | 2001-01-12 | Nec Corp | 情報検索装置 |
US6886005B2 (en) * | 2000-02-17 | 2005-04-26 | E-Numerate Solutions, Inc. | RDL search engine |
US6738767B1 (en) * | 2000-03-20 | 2004-05-18 | International Business Machines Corporation | System and method for discovering schematic structure in hypertext documents |
US20010051899A1 (en) * | 2000-06-13 | 2001-12-13 | Takahiko Kawashima | Document managing apparatus for managing transaction slip data in electronic commerce |
US6684204B1 (en) * | 2000-06-19 | 2004-01-27 | International Business Machines Corporation | Method for conducting a search on a network which includes documents having a plurality of tags |
US20020107847A1 (en) * | 2000-10-10 | 2002-08-08 | Johnson Carl E. | Method and system for visual internet search engine |
US6947932B2 (en) * | 2001-01-23 | 2005-09-20 | Xpriori, Llc | Method of performing a search of a numerical document object model |
US7581170B2 (en) * | 2001-05-31 | 2009-08-25 | Lixto Software Gmbh | Visual and interactive wrapper generation, automated information extraction from Web pages, and translation into XML |
EP1276056B1 (de) * | 2001-07-10 | 2012-12-26 | Software AG | Verfahren zum Verwalten einer Datenbank |
US7146564B2 (en) * | 2001-12-21 | 2006-12-05 | Xmlcities, Inc. | Extensible stylesheet designs using meta-tag and/or associated meta-tag information |
-
2001
- 2001-11-21 JP JP2001356585A patent/JP4215425B2/ja not_active Expired - Fee Related
-
2002
- 2002-11-12 US US10/291,711 patent/US7069505B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100756921B1 (ko) | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
JP2008129985A (ja) * | 2006-11-24 | 2008-06-05 | Seiko Epson Corp | 電子機器およびデータ生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4215425B2 (ja) | 2009-01-28 |
US7069505B2 (en) | 2006-06-27 |
US20030097638A1 (en) | 2003-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003157264A (ja) | 文章管理システム、その管理方法及びそのプログラム | |
US20020038319A1 (en) | Apparatus converting a structured document having a hierarchy | |
JPH03266039A (ja) | フリーフォーマットデータリンク処理方式 | |
JP2010205257A (ja) | 画像管理装置およびその制御方法およびプログラム | |
US20110153661A1 (en) | Navigation device and database update program | |
CN100399330C (zh) | 管理环球网网页中的环球网媒体的系统及其实现方法 | |
JP2005128872A (ja) | 文書検索システム及び文書検索プログラム | |
JP2006331356A (ja) | 業務処理プログラム、それを記録した記録媒体及び業務処理システム | |
CN114064638B (zh) | 一种信息处理的方法、装置、设备及存储介质 | |
JP2007199987A (ja) | 特許情報検索システム | |
JP2004151957A (ja) | 文献調査支援プログラム | |
JP2003330968A (ja) | 地図表示装置及び地図表示プログラム | |
JPH11296463A (ja) | フレームを使用しているホームページのマーキング・再表示方式 | |
JPH06195386A (ja) | データ検索装置 | |
JP2010191858A (ja) | ソフトウェア開発支援装置 | |
JP2001067366A (ja) | データベース検索結果表示システム、方法及び記録媒体 | |
JP2000222408A (ja) | 情報処理装置 | |
JP2001134596A (ja) | 構造化文書管理装置および構造化文書検索方法 | |
JP4988441B2 (ja) | 検索プログラム、検索方法および検索装置 | |
JPH07141335A (ja) | 文書表示装置 | |
JPH1021260A (ja) | ツリーの動的作成表示方法およびツリー検索表示システム | |
JPH1049540A (ja) | 情報検索システム | |
JPH08314949A (ja) | データ管理装置 | |
JP2009080722A (ja) | ツリー構造データベースの情報管理方法、サーバ、プログラム | |
JP2004206225A (ja) | 入力支援システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060508 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060508 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060614 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20060728 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070118 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111114 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |