JP4215425B2 - 文章管理システム、その管理方法及びそのプログラム - Google Patents

文章管理システム、その管理方法及びそのプログラム Download PDF

Info

Publication number
JP4215425B2
JP4215425B2 JP2001356585A JP2001356585A JP4215425B2 JP 4215425 B2 JP4215425 B2 JP 4215425B2 JP 2001356585 A JP2001356585 A JP 2001356585A JP 2001356585 A JP2001356585 A JP 2001356585A JP 4215425 B2 JP4215425 B2 JP 4215425B2
Authority
JP
Japan
Prior art keywords
document
classification map
storage device
data
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001356585A
Other languages
English (en)
Other versions
JP2003157264A (ja
Inventor
隆一 玉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001356585A priority Critical patent/JP4215425B2/ja
Priority to US10/291,711 priority patent/US7069505B2/en
Publication of JP2003157264A publication Critical patent/JP2003157264A/ja
Application granted granted Critical
Publication of JP4215425B2 publication Critical patent/JP4215425B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Description

【0001】
【発明の属する技術分野】
本発明は、文書管理システム、その管理方法及びそのプログラムに関し、特にタグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システム、その管理方法及びそのプログラムに関する。
【0002】
【従来の技術】
従来の文書管理システムでは、文書データの分類や検索を行う方法として、階層構造から成る分類マップを定義(作成)し、その末端のリーフに検索条件を与えておき、利用者により当該リーフが選択された場合、予め設定された検索条件に該当する文書集合の一覧を表示装置に表示する方式を採用されている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の文書管理システムにおいて、以下に示すような問題点があった。
【0004】
第1に、階層構造から成る分類マップが固定されているため、あらかじめ全てのリーフの値と検索条件とを記述しておかなければならないので、不要なリーフが多く存在し、画面に分類マップを表示した場合に表示項目が多くなり、操作性と視認性の両方に欠けるという問題点があった。
【0005】
第2に、階層構造から成る分類マップが固定されているため、これまで分類マップに存在していない値が文書中に出現する度に分類マップを変更する必要があるので、運用性が損なわれるという問題点があった。
【0006】
本発明は、上記問題点に鑑みて成されたものであり、タグ付き構造で表現された文書データを管理する文書管理システムにおいて、文書データを分類するための分類マップを自動的に生成することにより、当該分類マップを用いて文書データを管理し、当該分類マップを用いて検索を行う文書管理システム、その管理方法及びそのプログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
前記課題を解決するために、請求項1記載の発明は、
タグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システムにおいて、前記タグ付き構造で表現された文書データを入力する入力装置と、前記入力装置により入力された文書データを記憶する記憶装置と、プログラム制御によりデータ処理を実行するデータ処理装置と、前記記憶装置に記憶された文書データを表示する表示装置と、を備え、前記データ処理装置は、前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録手段と、前記文書登録手段により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成手段と、前記文書登録手段により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、
分類マップを生成する分類マップ生成手段と、を有し、前記分類マップは複数のノードを備える木構造により構築され、
直下にリーフを備えるノードには、該リーフを展開するための展開条件としてタグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられており、前記分類マップ生成手段は、前記文書登録手段により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする。
【0008】
請求項2記載の発明は、
請求項1の発明において前記データ処理装置は、前記文書登録手段により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶部と、前記文書検索用インデックス生成手段により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶部と、前記分類マップ生成手段により生成された分類マップを前記記憶装置に記憶する分類マップ記憶部と、を有することを有することを特徴とする。
【0009】
請求項3記載の発明は、請求項2に記載の文書管理システムにおいて
前記データ処理装置が、前記文書登録手段により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成手段により追加文書検索用インデックスを生成し、前記分類マップ生成手段により前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成し、前記文書検索用インデックス生成手段により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶部と、前記分類マップ生成手段により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶部と、を有し、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップと、前記差分分類マップ記憶部により記憶されている差分分類マップとを合成して新たな分類マップを作成する分類マップ合成手段を有し、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成手段により作成された前記新たな分類マップで、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップを更新することを特徴とする。
【0010】
請求項4記載の発明は、請求項2または請求項3のいずれか1項に記載の文書管理システムにおいて、前記データ処理装置が、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップに基づいて、所望の文書データを検索する文書検索手段を有することを特徴とする。
【0011】
請求項5記載の発明は、タグ付き構造で表現された文書データを入力する入力装置と、前記入力装置により入力された文書データを記憶する記憶装置と、プログラム制御によりデータ処理を実行するデータ処理装置と、前記記憶装置に記憶された文書データを表示する表示装置と、を備える文書管理システムの管理方法であって、前記データ処理装置は、前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録工程と、前記文書登録工程により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成工程と、前記文書登録工程により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成する分類マップ生成工程と、を実行し、前記分類マップ生成工程として、前記文書登録工程により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする。

【0012】
請求項6記載の発明は、請求項5記載の文書管理システムの管理方法において、前記データ処理装置が、前記文書登録工程により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶工程と、前記文書検索用インデックス生成工程により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶工程と、前記分類マップ生成工程により生成された分類マップを前記記憶装置に記憶する分類マップ記憶工程と、を実行することを特徴とする。
【0013】
請求項7記載の発明は、請求項6記載の文書管理システムの管理方法において、前記文書登録工程により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成工程により追加文書検索用インデックスを生成する追加文書検索用インデックス生成工程と、前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成工程と、前記文書検索用インデックス生成工程により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶工程と、前記差分分類マップ生成工程により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶工程と、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶工程で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成工程と、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成工程により作成された前記新たな分類マップで、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップを更新する分類マップ更新工程と、
を実行することを特徴とする。
【0014】
請求項8記載の発明は、請求項6または請求項7のいずれか1項に記載の文書管理システムの管理方法において、前記データ処理装置は、前記分類マップ記憶工程で記憶された分類マップに基づいて、所望の文書データを検索する文書検索工程を実行することを特徴とする。
【0015】
請求項9記載の発明は、入力装置から入力されたタグ付き構造の文書データを記憶装置に登録する文書登録処理と、前記文書登録処理により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成処理と、前記文書登録処理により前記記憶装置に登録されたタグ付き構造の文書データである初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して第1のリーフを生成し、前記選択された1文書に対するタグパスの値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続し、前記文書登録処理において前記記憶装置に一定量の文書データから登録される度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成し、表示装置に表示する、分類マップ生成処理とをデータ処理装置に実行させることを特徴とする。
【0016】
請求項10記載の発明は、請求項9記載の発明において、前記データ処理装置に、前記文書登録処理により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶処理と、前記文書検索用インデックス生成処理により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶処理と、前記分類マップ生成処理により生成された分類マップを前記記憶装置に記憶する分類マップ記憶処理と、を実行させることを特徴とする。
【0017】
請求項11記載の発明は、請求項10に記載の発明において、前記データ処理装置に、前記文書登録処理により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成処理により追加文書検索用インデックスを生成する追加文書検索用インデックス生成処理と、前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成処理と、前記文書検索用インデックス生成処理において生成された前記追加文書検索用インデックスを前記記憶装置に記憶させる追加文書検索用インデックス記憶処理と、前記差分分類マップ生成処理において生成された前記差分分類マップを前記記憶装置に記憶させる差分分類マップ記憶処理と、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶処理で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成処理と、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成処理により作成された前記新たな分類マップで、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップを更新する分類マップ更新処理と、を実行させることを特徴とする。
【0018】
請求項12記載の発明は、請求項10または請求項11のいずれか1項に記載の発明において、前記データ処理装置に、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップに基づいて、所望の文書データを検索する文書検索処理を実行させることを特徴とする。
【0025】
【発明の実施の形態】
次に、添付図面を参照しながら本発明に係る文書管理システム、その管理方法及びそのプログラムの実施の形態を説明する。図1から図4に、本発明に係る文書管理システム、その管理方法及びそのプログラムの実施の形態を示す。
【0026】
〈第1の実施形態〉
図1は、本発明の第1の実施形態である文書管理システムの概略構成を示すブロック図である。図1において、本発明の第1の実施形態である文書管理システムは、プログラム制御により動作するデータ処理装置1と、文書データなどの情報を記憶する記憶装置2と、文書データなどを表示するCRT,LCD,PDP等により構成される表示装置3と、文書データなどをデータ処理装置1に入力する文書入力装置4と、を有して構成される。
【0027】
データ処理装置1は、文書登録部11と、文書検索用インデックス生成部12と、分類マップ生成部13と、文書検索部14と、を備えている。
【0028】
記憶装置2は、文書登録部11から送られる文書入力装置4から入力された文書データを記憶する文書記憶部21と、文書検索用インデックス生成部12により生成された文書検索用インデックスを記憶する文書検索用インデックス記憶部22と、分類マップ生成部13により生成された分類マップを記憶する分類マップ記憶部23と、を備えている。
【0029】
文書登録部11は、文書入力装置より入力された文書データを文書記憶部21へ送る。この文書記憶部21に登録される各文書データは、タグ付きで表現されており、各タグの中に内容が記述されている。
【0030】
文書検索用インデックス生成部12は、文書登録部11により文書記憶部21に入力された各文書データが登録されると、当該各文書データの内容を解析し、各文書データのタグで囲まれた値をタグ単位で検索可能となるように、文書検索用インデックスを生成し、この生成した文書検索用インデックスを記憶装置2の文書検索用インデックス記憶部22へ送る。
【0031】
分類マップ生成部13は、文書登録部11により文書記憶部21に一定量の文書データが登録されると、これら一定量の文書データから各タグの内容をリーフに持つ分類マップを生成し、当該生成した分類マップを分類マップ記憶部23へ送る。
【0032】
文書検索部14は、表示装置3に表示された分類マップのうち、ユーザにより任意に指定されたリーフに設定された検索条件に基づいて文書検索用インデックス記憶部22を検索し、検索にヒットした文書検索用インデックスを割り当てられた文書データを文書記憶部21から読み出し、表示装置3に表示する。
【0033】
本発明の第1の実施形態である文書管理システムにタグ付き構造の文書データが登録される場合の動作例を以下に示す。
【0034】
文書入力装置から入力された文書データは、文書登録部11により文書記憶部21に登録される。次に、文書検索用インデックス生成部12は、新規に登録された文書データの内容を解析し、各タグ単位での検索を可能とするための文書検索用インデックスを生成し、文書検索用インデックス記憶部22に記憶する。分類マップ生成部13は、分類マップ記憶部23に記憶されている分類マップの定義を参照し、文書検索部14により文書検索用インデックス記憶部22を検索し、分類マップの各リーフを生成することにより、新たに登録された文書データの分類マップを生成する。
【0035】
図2に、分類マップ生成部により生成された分類マップの実施例を示す。
図2に示すように、分類マップは、木構造により定義され、直下にリーフを持つ各ノードにはノード配下のリーフを展開するための展開条件が記述されている。例えば、ノード4の展開条件として/AAA/BBB/CCCというタグパスが指定されている場合、文書記憶部21に登録されている各文書データのタグパス/AAA/BBB/CCCに記述されている値(V1、V2、V3)がノード4配下のリーフ(1〜3)の値として表示装置3に一覧として表示される。
【0036】
本発明は、この分類マップにおけるリーフの値一覧を自動的に生成し、当該生成された分類マップに基づいて文書データの管理や検索を容易に実現するものである。
【0037】
図3に、リーフ一覧の生成方法を示す。
図3に示す6つの文書1〜6(初期文書集合)について、最初の1つの文書1を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。ここでは、文書1が選択されるので、V1が取得される。この値V1に基づいて、ノード4のリーフV1(リーフ1)を1つ生成する。
【0038】
次に、文書集合41の中で、タグパス/AAA/BBB/CCCにV1が含まれていない文書を文書検索用インデックス記憶部22に格納されている文書検索用インデックスを検索して求める。図3の場合では、文書2、文書3、文書5が選択され、これらが新たな文書集合42として抽出される。
【0039】
次に、新たな文書集合42から最初の1つの文書を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。ここでは、文書2が選択されるので、V2が取得される。この値V2に基づいて、ノード4のリーフV2(リーフ2)を1つ生成する。
【0040】
次に、新たな文書集合42の中で、タグパス/AAA/BBB/CCCにV2が含まれていない文書を文書検索用インデックス記憶部22に格納されている文書検索用インデックスを検索して求める。図3の場合では、文書集合43として文書3が選択される。
【0041】
次に、文書集合43から最初の1つの文書を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。図3の場合では、文書3が選択され、V3が取得される。この値V3でノード4のリーフV3(リーフ3)を1つ生成する。
【0042】
次に、文書集合43からタグパス/AAA/BBB/CCCにV3が含まれていない文書集合を検索する。図3において、この検索結果は、文書集合が空となるため、処理を停止する。ここでノード4の配下のリーフの集合V1、V2、V3を得ることができる。
【0043】
一般的に、初期文書集合に対してタグパスが与えられた場合に、その文書集合から最初の1文書を選択して、選択された文書に対してタグパスの値を取得し、初期文書集合に対してタグパスにその値が含まれていない文書集合を求め、新たに求められた文書集合を初期文書集合とする。この処理を初期文書集合が空になるまで繰り返し、最終的に取得された値の集合をノードに設定された展開条件に対して展開されたリーフの一覧とすることができる。
【0044】
〈第2の実施形態〉
図4は、本発明の第2の実施形態である文書管理システムの概略構成を示すブロック図である。図4において、本発明の第2の実施形態である文書管理システムは、図1に示した本発明の第1の実施形態におけるデータ処理装置1の構成に分類マップ合成部15を追加し、また、記憶装置の構成に差分分類マップ記憶部25及び追加文書検索用インデックス記憶部24を追加した点で異なるものである。なお、本発明の第1の実施形態と同一構成要素に関しては、同一符号を付してその説明を省略する。
【0045】
分類マップ合成部15は、新たに追加された文書データに対して作成された分類マップ(差分分類マップ)と、分類マップ記憶部23に記憶されている分類マップと、を合成する。
【0046】
差分分類マップ記憶部25は、新たに追加された文書データに対して作成された差分分類マップを記憶する。
【0047】
追加文書検索用インデックス記憶部24は、新たに追加された文書データに対して作成された追加文書検索用インデックスを記憶する。
【0048】
本発明の第2の実施形態である文書管理システムにタグ付き構造の文書データが登録される場合の動作例を以下に示す。
【0049】
文書入力装置3から新たに追加された文書データは、文書登録部11により文書記憶部21に登録される。次に、文書検索用インデックス生成部12は、新たに追加された文書データの内容を解析し、各タグ単位での検索を可能とするための追加文書検索用インデックスを生成し、追加文書検索用インデックス記憶部24に記憶する。分類マップ生成部13は、追加された文書データが一定量を超えると作動し、追加された文書データだけに対する検索用インデックスが記憶されている追加文書検索用インデックス記憶部24を検索し、差分分類マップを生成して差分分類マップ記憶部24に記憶する。ここでは、分類マップ生成部13により差分分類マップが生成された後で、追加文書検索用インデックス記憶部24に記憶されているインデックス情報は消去される。
【0050】
次に、分類マップ合成部15が起動し、差分分類マップ記憶部24に記憶されている差分分類マップと分類マップ記憶部21に記憶されている分類マップとを合成する。分類マップ21と差分分類マップ24の木構造のルートノードから順にノードを探索し、リーフ一覧に辿りついた時に、差分分類マップのリーフの値で分類マップのリーフの値にないリーフだけを追加する。この動作を全てのノード、リーフに対して行うことにより、分類マップを自動的に更新する。
【0051】
このようにすることで、全登録文書数が多くなった場合でも、追加される文書のみにより差分分類マップを生成し、分類マップ合成部15により分類マップ記憶部24に記憶されている分類マップと合成し、自動的に分類マップを更新するので、性能を落とすことなく分類マップを生成することができる。
【0052】
【発明の効果】
以上の説明より明らかなように、本発明によれば、分類マップを生成する際のリーフを文書内容から自動生成するため、不要なリーフが生成されることがなく、分類マップのための記憶容量を削減すると共に、分類マップを表示した場合に必要なリーフのみしか表示されないため、視認性、操作性を向上することができる。
【0053】
また、本発明によれば、文書を追加した場合に、文書内容から自動的にリーフが生成されるため、分類マップを手作業で修正する必要がなく、また、性能を落とすことがないので運用性を向上することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態である文書データ管理システムの概略構成を示すブロック図である。
【図2】分布マップの実施例を示す図である。
【図3】リーフ一覧の生成方法を示す図である。
【図4】本発明の第2の実施形態である文書データ管理システムの概略構成を示すブロック図である。
【符号の説明】
1 データ処理装置
2 記憶装置
3 表示装置
4 文書入力装置
11 文書登録部
12 文書検索用インデックス生成部
13 分類マップ生成部
14 文書検索部
15 分類マップ合成部
21 文書記憶部
22 文書検索用インデックス記憶部
23 分類マップ記憶部
24 追加文書検索用インデックス記憶部
25 差分分類マップ記憶部

Claims (12)

  1. タグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システムにおいて、
    前記タグ付き構造で表現された文書データを入力する入力装置と、
    前記入力装置により入力された文書データを記憶する記憶装置と、
    プログラム制御によりデータ処理を実行するデータ処理装置と、
    前記記憶装置に記憶された文書データを表示する表示装置と、を備え、
    前記データ処理装置は、
    前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録手段と、
    前記文書登録手段により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成手段と、
    前記文書登録手段により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、
    分類マップを生成する分類マップ生成手段と、を有し、
    前記分類マップは
    複数のノードを備える木構造により構築され、
    直下にリーフを備えるノードには、該リーフを展開するための展開条件としてタグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられており、
    前記分類マップ生成手段は、
    前記文書登録手段により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、
    前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、
    前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、
    前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする文書管理システム。
  2. 前記データ処理装置は、
    前記文書登録手段により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶部と、
    前記文書検索用インデックス生成手段により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶部と、
    前記分類マップ生成手段により生成された分類マップを前記記憶装置に記憶する分類マップ記憶部と、
    を有することを特徴とする請求項1記載の文書管理システム。
  3. 前記データ処理装置は、
    前記文書登録手段により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成手段により追加文書検索用インデックスを生成し、
    前記分類マップ生成手段により前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成し、
    記文書検索用インデックス生成手段により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶部と、
    前記分類マップ生成手段により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶部と、を有し、
    前記分類マップ記憶部により前記記憶装置に記憶されている分類マップと、前記差分分類マップ記憶部により記憶されている差分分類マップとを合成して新たな分類マップを作成する分類マップ合成手段を有し、
    前記追加文書データが一定量追加登録される毎に、前記分類マップ合成手段により作成された前記新たな分類マップで、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップを更新することを特徴とする請求項2に記載の文書管理システム。
  4. 前記データ処理装置は、
    前記分類マップ記憶部により前記記憶装置に記憶されている分類マップに基づいて、所望の文書データを検索する文書検索手段を有することを特徴とする請求項2または請求項3のいずれか1項に記載の文書管理システム。
  5. タグ付き構造で表現された文書データを入力する入力装置と、
    前記入力装置により入力された文書データを記憶する記憶装置と、
    プログラム制御によりデータ処理を実行するデータ処理装置と、
    前記記憶装置に記憶された文書データを表示する表示装置と、を備える文書管理システムの管理方法であって、
    前記データ処理装置は、
    前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録工程と、
    前記文書登録工程により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成工程と、
    前記文書登録工程により前記記憶装置に一定量の文書データを登録する度に、
    該一定量の文書データの夫々のタグ内容をリーフに持つ
    複数のノードを備える木構造により構築され、
    直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる
    分類マップを生成する分類マップ生成工程と、
    を実行し、
    前記分類マップ生成工程として、
    前記文書登録工程により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、
    前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、
    前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、
    前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、
    前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする文書管理システムの管理方法。
  6. 前記データ処理装置は、
    前記文書登録工程により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶工程と、
    前記文書検索用インデックス生成工程により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶工程と、
    前記分類マップ生成工程により生成された分類マップを前記記憶装置に記憶する分類マップ記憶工程と、
    を実行することを特徴とする請求項記載の文書管理システムの管理方法。
  7. 前記データ処理装置は、
    前記文書登録工程により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成工程により追加文書検索用インデックスを生成する追加文書検索用インデックス生成工程と、
    前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成工程と、
    前記文書検索用インデックス生成工程により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶工程と、
    前記差分分類マップ生成工程により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶工程と
    記分類マップ記憶工程で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶工程で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成工程と、
    前記追加文書データが一定量追加登録される毎に、前記分類マップ合成工程により作成された前記新たな分類マップで、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップを更新する分類マップ更新工程と、
    を実行することを特徴とする請求項6記載の文書管理システムの管理方法。
  8. 前記データ処理装置は、
    前記分類マップ記憶工程で記憶された分類マップに基づいて、所望の文書データを検索する文書検索工程を実行することを特徴とする請求項6または請求項7のいずれか1項に記載の文書管理システムの管理方法。
  9. 入力装置から入力されたタグ付き構造の文書データを記憶装置に登録する文書登録処理と、前記文書登録処理により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成処理と、
    前記文書登録処理により前記記憶装置に登録されたタグ付き構造の文書データである初期文書集合に対して、
    該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して第1のリーフを生成し、前記選択された1文書に対するタグパスの値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続し、前記文書登録処理において前記記憶装置に一定量の文書データから登録される度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成し、表示装置に表示する、
    分類マップ生成処理とを
    データ処理装置に実行させることを特徴とするプログラム。
  10. 前記データ処理装置に、
    前記文書登録処理により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶処理と、
    前記文書検索用インデックス生成処理により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶処理と、
    前記分類マップ生成処理により生成された分類マップを前記記憶装置に記憶する分類マップ記憶処理と、を実行させることを特徴とする請求項記載のプログラム。
  11. 前記データ処理装置に、
    前記文書登録処理により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成処理により追加文書検索用インデックスを生成する追加文書検索用インデックス生成処理と、
    前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成処理と、前記文書検索用インデックス生成処理において生成された前記追加文書検索用インデックスを前記記憶装置に記憶させる追加文書検索用インデックス記憶処理と、
    前記差分分類マップ生成処理において生成された前記差分分類マップを前記記憶装置に記憶させる差分分類マップ記憶処理と
    記分類マップ記憶処理で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶処理で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成処理と、
    前記追加文書データが一定量追加登録される毎に、前記分類マップ合成処理により作成された前記新たな分類マップで、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップを更新する分類マップ更新処理と、
    を実行させることを特徴とする請求項10に記載のプログラム。
  12. 前記データ処理装置に、
    前記分類マップ記憶処理で前記記憶装置に記憶された分類マップに基づいて、所望の文書データを検索する文書検索処理を実行させることを特徴とする請求項10または請求項11のいずれか1項に記載のプログラム。
JP2001356585A 2001-11-21 2001-11-21 文章管理システム、その管理方法及びそのプログラム Expired - Fee Related JP4215425B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001356585A JP4215425B2 (ja) 2001-11-21 2001-11-21 文章管理システム、その管理方法及びそのプログラム
US10/291,711 US7069505B2 (en) 2001-11-21 2002-11-12 Document management system, method thereof, and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001356585A JP4215425B2 (ja) 2001-11-21 2001-11-21 文章管理システム、その管理方法及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2003157264A JP2003157264A (ja) 2003-05-30
JP4215425B2 true JP4215425B2 (ja) 2009-01-28

Family

ID=19168081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001356585A Expired - Fee Related JP4215425B2 (ja) 2001-11-21 2001-11-21 文章管理システム、その管理方法及びそのプログラム

Country Status (2)

Country Link
US (1) US7069505B2 (ja)
JP (1) JP4215425B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7165238B2 (en) * 2003-06-06 2007-01-16 Intentional Software Corporation Method and system for organizing and manipulating nodes by category in a program tree
JP2005043966A (ja) * 2003-07-22 2005-02-17 Pioneer Electronic Corp データ検索装置及び方法、ナビゲーション装置及び方法、データ検索用のデータセット並びにコンピュータプログラム
KR100775852B1 (ko) 2006-01-18 2007-11-13 포스데이타 주식회사 응용 프로그램의 자원 검색 시스템 및 방법
KR100756921B1 (ko) 2006-02-28 2007-09-07 한국과학기술원 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체.
JP4911299B2 (ja) * 2006-11-24 2012-04-04 セイコーエプソン株式会社 電子機器およびデータ生成方法
JP5211557B2 (ja) * 2007-06-15 2013-06-12 富士通株式会社 Web会議支援プログラム、該プログラムを記録した記録媒体、Web会議支援装置、およびWeb会議支援方法
US7941399B2 (en) 2007-11-09 2011-05-10 Microsoft Corporation Collaborative authoring
US8028229B2 (en) * 2007-12-06 2011-09-27 Microsoft Corporation Document merge
US8825758B2 (en) * 2007-12-14 2014-09-02 Microsoft Corporation Collaborative authoring modes
US7818293B2 (en) * 2008-01-02 2010-10-19 International Business Machines Corporation Method and system to synchronize updated versions of a document edited on a collaborative site that are under document management control
US8301588B2 (en) 2008-03-07 2012-10-30 Microsoft Corporation Data storage for file updates
US8352870B2 (en) * 2008-04-28 2013-01-08 Microsoft Corporation Conflict resolution
US8429753B2 (en) 2008-05-08 2013-04-23 Microsoft Corporation Controlling access to documents using file locks
US8825594B2 (en) 2008-05-08 2014-09-02 Microsoft Corporation Caching infrastructure
US8417666B2 (en) * 2008-06-25 2013-04-09 Microsoft Corporation Structured coauthoring
US20100131836A1 (en) * 2008-11-24 2010-05-27 Microsoft Corporation User-authored notes on shared documents
US8346768B2 (en) * 2009-04-30 2013-01-01 Microsoft Corporation Fast merge support for legacy documents
US9646013B2 (en) 2011-02-16 2017-05-09 Docbert Llc System and method for file management
US8180814B1 (en) 2011-02-16 2012-05-15 Docbert, LLC System and method for file management
US9262510B2 (en) 2013-05-10 2016-02-16 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
US9251136B2 (en) 2013-10-16 2016-02-02 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9235638B2 (en) 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US11126592B2 (en) 2014-09-02 2021-09-21 Microsoft Technology Licensing, Llc Rapid indexing of document tags

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0457153A (ja) 1990-06-27 1992-02-24 Fujitsu Ltd 構造化文書処理システム
JP2795317B2 (ja) 1996-06-24 1998-09-10 日本電気株式会社 多段表処理方式
JPH10187680A (ja) 1996-12-20 1998-07-21 Nec Corp 単語、文、部分の粒度で管理するドキュメントリポジトリ装置
JP3887867B2 (ja) 1997-02-26 2007-02-28 株式会社日立製作所 構造化文書の登録方法
JP3849279B2 (ja) * 1998-01-23 2006-11-22 富士ゼロックス株式会社 インデクス作成方法および検索方法
US6266682B1 (en) * 1998-08-31 2001-07-24 Xerox Corporation Tagging related files in a document management system
US6360215B1 (en) * 1998-11-03 2002-03-19 Inktomi Corporation Method and apparatus for retrieving documents based on information other than document content
JP2000348038A (ja) 1999-06-02 2000-12-15 Fujitsu Ltd 半構造データベースのためのデータ格納装置および方法
WO2000077609A1 (en) * 1999-06-14 2000-12-21 The Thomson Corporation System for converting data to a markup language
JP2001005820A (ja) 1999-06-18 2001-01-12 Nec Corp 情報検索装置
AU2001241564A1 (en) * 2000-02-17 2001-08-27 E-Numerate Solutions, Inc. Rdl search engine
US6738767B1 (en) * 2000-03-20 2004-05-18 International Business Machines Corporation System and method for discovering schematic structure in hypertext documents
US20010051899A1 (en) * 2000-06-13 2001-12-13 Takahiko Kawashima Document managing apparatus for managing transaction slip data in electronic commerce
US6684204B1 (en) * 2000-06-19 2004-01-27 International Business Machines Corporation Method for conducting a search on a network which includes documents having a plurality of tags
US20020107847A1 (en) * 2000-10-10 2002-08-08 Johnson Carl E. Method and system for visual internet search engine
US6947932B2 (en) * 2001-01-23 2005-09-20 Xpriori, Llc Method of performing a search of a numerical document object model
EP1430420A2 (en) * 2001-05-31 2004-06-23 Lixto Software GmbH Visual and interactive wrapper generation, automated information extraction from web pages, and translation into xml
EP1276056B1 (de) * 2001-07-10 2012-12-26 Software AG Verfahren zum Verwalten einer Datenbank
US7146564B2 (en) * 2001-12-21 2006-12-05 Xmlcities, Inc. Extensible stylesheet designs using meta-tag and/or associated meta-tag information

Also Published As

Publication number Publication date
US20030097638A1 (en) 2003-05-22
JP2003157264A (ja) 2003-05-30
US7069505B2 (en) 2006-06-27

Similar Documents

Publication Publication Date Title
JP4215425B2 (ja) 文章管理システム、その管理方法及びそのプログラム
US7290222B2 (en) Methods, systems and computer program products for providing tree diagram graphical user interfaces having secondary expansion capabilities
US5953017A (en) Compressed object display
US8549434B2 (en) Method for graphical representation of a content collection
US8762834B2 (en) User interface for defining a text file transformation
US20080288242A1 (en) System And Method Of Presentation of Multilingual Metadata
US20040080531A1 (en) Method, system and program product for automatically modifying a display view during presentation of a web page
JPWO2006098031A1 (ja) キーワード管理装置
JP5489660B2 (ja) 画像管理装置およびその制御方法およびプログラム
KR100853308B1 (ko) 항목 타입별 구조화된 검색
US20080250052A1 (en) Repopulating a database with document content
CN100399330C (zh) 管理环球网网页中的环球网媒体的系统及其实现方法
CN108304291B (zh) 测试输入信息检索装置和方法
JP2001142890A (ja) 画像検索方法及びその装置
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP5230193B2 (ja) データ検索装置、データ検索方法、及びコンピュータプログラム
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
JP2007199987A (ja) 特許情報検索システム
JPH1139327A (ja) リンク情報自動修復方法および装置
JP2002108875A (ja) 電子マニュアル装置及び電子マニュアルの変更方法
JP2001147922A (ja) 文書管理装置、文書管理方法および記憶媒体
JP2002108844A (ja) Xmlデータ分割編集装置
JP3935323B2 (ja) 文書管理装置および文書管理プログラムを記憶したコンピュータ読み取り可能な記録媒体
JP2009245448A (ja) データリストア装置
JPH11212985A (ja) 情報ライブラリ装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060508

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060508

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060614

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060728

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081104

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees