JP4215425B2 - 文章管理システム、その管理方法及びそのプログラム - Google Patents
文章管理システム、その管理方法及びそのプログラム Download PDFInfo
- Publication number
- JP4215425B2 JP4215425B2 JP2001356585A JP2001356585A JP4215425B2 JP 4215425 B2 JP4215425 B2 JP 4215425B2 JP 2001356585 A JP2001356585 A JP 2001356585A JP 2001356585 A JP2001356585 A JP 2001356585A JP 4215425 B2 JP4215425 B2 JP 4215425B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- classification map
- storage device
- data
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
Description
【発明の属する技術分野】
本発明は、文書管理システム、その管理方法及びそのプログラムに関し、特にタグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システム、その管理方法及びそのプログラムに関する。
【0002】
【従来の技術】
従来の文書管理システムでは、文書データの分類や検索を行う方法として、階層構造から成る分類マップを定義(作成)し、その末端のリーフに検索条件を与えておき、利用者により当該リーフが選択された場合、予め設定された検索条件に該当する文書集合の一覧を表示装置に表示する方式を採用されている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の文書管理システムにおいて、以下に示すような問題点があった。
【0004】
第1に、階層構造から成る分類マップが固定されているため、あらかじめ全てのリーフの値と検索条件とを記述しておかなければならないので、不要なリーフが多く存在し、画面に分類マップを表示した場合に表示項目が多くなり、操作性と視認性の両方に欠けるという問題点があった。
【0005】
第2に、階層構造から成る分類マップが固定されているため、これまで分類マップに存在していない値が文書中に出現する度に分類マップを変更する必要があるので、運用性が損なわれるという問題点があった。
【0006】
本発明は、上記問題点に鑑みて成されたものであり、タグ付き構造で表現された文書データを管理する文書管理システムにおいて、文書データを分類するための分類マップを自動的に生成することにより、当該分類マップを用いて文書データを管理し、当該分類マップを用いて検索を行う文書管理システム、その管理方法及びそのプログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
前記課題を解決するために、請求項1記載の発明は、
タグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システムにおいて、前記タグ付き構造で表現された文書データを入力する入力装置と、前記入力装置により入力された文書データを記憶する記憶装置と、プログラム制御によりデータ処理を実行するデータ処理装置と、前記記憶装置に記憶された文書データを表示する表示装置と、を備え、前記データ処理装置は、前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録手段と、前記文書登録手段により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成手段と、前記文書登録手段により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、
分類マップを生成する分類マップ生成手段と、を有し、前記分類マップは複数のノードを備える木構造により構築され、
直下にリーフを備えるノードには、該リーフを展開するための展開条件としてタグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられており、前記分類マップ生成手段は、前記文書登録手段により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする。
【0008】
請求項2記載の発明は、
請求項1の発明において前記データ処理装置は、前記文書登録手段により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶部と、前記文書検索用インデックス生成手段により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶部と、前記分類マップ生成手段により生成された分類マップを前記記憶装置に記憶する分類マップ記憶部と、を有することを有することを特徴とする。
【0009】
請求項3記載の発明は、請求項2に記載の文書管理システムにおいて
前記データ処理装置が、前記文書登録手段により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成手段により追加文書検索用インデックスを生成し、前記分類マップ生成手段により前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成し、前記文書検索用インデックス生成手段により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶部と、前記分類マップ生成手段により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶部と、を有し、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップと、前記差分分類マップ記憶部により記憶されている差分分類マップとを合成して新たな分類マップを作成する分類マップ合成手段を有し、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成手段により作成された前記新たな分類マップで、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップを更新することを特徴とする。
【0010】
請求項4記載の発明は、請求項2または請求項3のいずれか1項に記載の文書管理システムにおいて、前記データ処理装置が、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップに基づいて、所望の文書データを検索する文書検索手段を有することを特徴とする。
【0011】
請求項5記載の発明は、タグ付き構造で表現された文書データを入力する入力装置と、前記入力装置により入力された文書データを記憶する記憶装置と、プログラム制御によりデータ処理を実行するデータ処理装置と、前記記憶装置に記憶された文書データを表示する表示装置と、を備える文書管理システムの管理方法であって、前記データ処理装置は、前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録工程と、前記文書登録工程により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成工程と、前記文書登録工程により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成する分類マップ生成工程と、を実行し、前記分類マップ生成工程として、前記文書登録工程により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする。
【0012】
請求項6記載の発明は、請求項5記載の文書管理システムの管理方法において、前記データ処理装置が、前記文書登録工程により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶工程と、前記文書検索用インデックス生成工程により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶工程と、前記分類マップ生成工程により生成された分類マップを前記記憶装置に記憶する分類マップ記憶工程と、を実行することを特徴とする。
【0013】
請求項7記載の発明は、請求項6記載の文書管理システムの管理方法において、前記文書登録工程により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成工程により追加文書検索用インデックスを生成する追加文書検索用インデックス生成工程と、前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成工程と、前記文書検索用インデックス生成工程により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶工程と、前記差分分類マップ生成工程により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶工程と、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶工程で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成工程と、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成工程により作成された前記新たな分類マップで、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップを更新する分類マップ更新工程と、
を実行することを特徴とする。
【0014】
請求項8記載の発明は、請求項6または請求項7のいずれか1項に記載の文書管理システムの管理方法において、前記データ処理装置は、前記分類マップ記憶工程で記憶された分類マップに基づいて、所望の文書データを検索する文書検索工程を実行することを特徴とする。
【0015】
請求項9記載の発明は、入力装置から入力されたタグ付き構造の文書データを記憶装置に登録する文書登録処理と、前記文書登録処理により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成処理と、前記文書登録処理により前記記憶装置に登録されたタグ付き構造の文書データである初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して第1のリーフを生成し、前記選択された1文書に対するタグパスの値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続し、前記文書登録処理において前記記憶装置に一定量の文書データから登録される度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成し、表示装置に表示する、分類マップ生成処理とをデータ処理装置に実行させることを特徴とする。
【0016】
請求項10記載の発明は、請求項9記載の発明において、前記データ処理装置に、前記文書登録処理により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶処理と、前記文書検索用インデックス生成処理により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶処理と、前記分類マップ生成処理により生成された分類マップを前記記憶装置に記憶する分類マップ記憶処理と、を実行させることを特徴とする。
【0017】
請求項11記載の発明は、請求項10に記載の発明において、前記データ処理装置に、前記文書登録処理により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成処理により追加文書検索用インデックスを生成する追加文書検索用インデックス生成処理と、前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成処理と、前記文書検索用インデックス生成処理において生成された前記追加文書検索用インデックスを前記記憶装置に記憶させる追加文書検索用インデックス記憶処理と、前記差分分類マップ生成処理において生成された前記差分分類マップを前記記憶装置に記憶させる差分分類マップ記憶処理と、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶処理で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成処理と、前記追加文書データが一定量追加登録される毎に、前記分類マップ合成処理により作成された前記新たな分類マップで、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップを更新する分類マップ更新処理と、を実行させることを特徴とする。
【0018】
請求項12記載の発明は、請求項10または請求項11のいずれか1項に記載の発明において、前記データ処理装置に、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップに基づいて、所望の文書データを検索する文書検索処理を実行させることを特徴とする。
【0025】
【発明の実施の形態】
次に、添付図面を参照しながら本発明に係る文書管理システム、その管理方法及びそのプログラムの実施の形態を説明する。図1から図4に、本発明に係る文書管理システム、その管理方法及びそのプログラムの実施の形態を示す。
【0026】
〈第1の実施形態〉
図1は、本発明の第1の実施形態である文書管理システムの概略構成を示すブロック図である。図1において、本発明の第1の実施形態である文書管理システムは、プログラム制御により動作するデータ処理装置1と、文書データなどの情報を記憶する記憶装置2と、文書データなどを表示するCRT,LCD,PDP等により構成される表示装置3と、文書データなどをデータ処理装置1に入力する文書入力装置4と、を有して構成される。
【0027】
データ処理装置1は、文書登録部11と、文書検索用インデックス生成部12と、分類マップ生成部13と、文書検索部14と、を備えている。
【0028】
記憶装置2は、文書登録部11から送られる文書入力装置4から入力された文書データを記憶する文書記憶部21と、文書検索用インデックス生成部12により生成された文書検索用インデックスを記憶する文書検索用インデックス記憶部22と、分類マップ生成部13により生成された分類マップを記憶する分類マップ記憶部23と、を備えている。
【0029】
文書登録部11は、文書入力装置4より入力された文書データを文書記憶部21へ送る。この文書記憶部21に登録される各文書データは、タグ付きで表現されており、各タグの中に内容が記述されている。
【0030】
文書検索用インデックス生成部12は、文書登録部11により文書記憶部21に入力された各文書データが登録されると、当該各文書データの内容を解析し、各文書データのタグで囲まれた値をタグ単位で検索可能となるように、文書検索用インデックスを生成し、この生成した文書検索用インデックスを記憶装置2の文書検索用インデックス記憶部22へ送る。
【0031】
分類マップ生成部13は、文書登録部11により文書記憶部21に一定量の文書データが登録されると、これら一定量の文書データから各タグの内容をリーフに持つ分類マップを生成し、当該生成した分類マップを分類マップ記憶部23へ送る。
【0032】
文書検索部14は、表示装置3に表示された分類マップのうち、ユーザにより任意に指定されたリーフに設定された検索条件に基づいて文書検索用インデックス記憶部22を検索し、検索にヒットした文書検索用インデックスを割り当てられた文書データを文書記憶部21から読み出し、表示装置3に表示する。
【0033】
本発明の第1の実施形態である文書管理システムにタグ付き構造の文書データが登録される場合の動作例を以下に示す。
【0034】
文書入力装置4から入力された文書データは、文書登録部11により文書記憶部21に登録される。次に、文書検索用インデックス生成部12は、新規に登録された文書データの内容を解析し、各タグ単位での検索を可能とするための文書検索用インデックスを生成し、文書検索用インデックス記憶部22に記憶する。分類マップ生成部13は、分類マップ記憶部23に記憶されている分類マップの定義を参照し、文書検索部14により文書検索用インデックス記憶部22を検索し、分類マップの各リーフを生成することにより、新たに登録された文書データの分類マップを生成する。
【0035】
図2に、分類マップ生成部により生成された分類マップの実施例を示す。
図2に示すように、分類マップは、木構造により定義され、直下にリーフを持つ各ノードにはノード配下のリーフを展開するための展開条件が記述されている。例えば、ノード4の展開条件として/AAA/BBB/CCCというタグパスが指定されている場合、文書記憶部21に登録されている各文書データのタグパス/AAA/BBB/CCCに記述されている値(V1、V2、V3)がノード4配下のリーフ(1〜3)の値として表示装置3に一覧として表示される。
【0036】
本発明は、この分類マップにおけるリーフの値一覧を自動的に生成し、当該生成された分類マップに基づいて文書データの管理や検索を容易に実現するものである。
【0037】
図3に、リーフ一覧の生成方法を示す。
図3に示す6つの文書1〜6(初期文書集合)について、最初の1つの文書1を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。ここでは、文書1が選択されるので、V1が取得される。この値V1に基づいて、ノード4のリーフV1(リーフ1)を1つ生成する。
【0038】
次に、文書集合41の中で、タグパス/AAA/BBB/CCCにV1が含まれていない文書を文書検索用インデックス記憶部22に格納されている文書検索用インデックスを検索して求める。図3の場合では、文書2、文書3、文書5が選択され、これらが新たな文書集合42として抽出される。
【0039】
次に、新たな文書集合42から最初の1つの文書を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。ここでは、文書2が選択されるので、V2が取得される。この値V2に基づいて、ノード4のリーフV2(リーフ2)を1つ生成する。
【0040】
次に、新たな文書集合42の中で、タグパス/AAA/BBB/CCCにV2が含まれていない文書を文書検索用インデックス記憶部22に格納されている文書検索用インデックスを検索して求める。図3の場合では、文書集合43として文書3が選択される。
【0041】
次に、文書集合43から最初の1つの文書を選択し、そのタグパス/AAA/BBB/CCCの値を取得する。図3の場合では、文書3が選択され、V3が取得される。この値V3でノード4のリーフV3(リーフ3)を1つ生成する。
【0042】
次に、文書集合43からタグパス/AAA/BBB/CCCにV3が含まれていない文書集合を検索する。図3において、この検索結果は、文書集合が空となるため、処理を停止する。ここでノード4の配下のリーフの集合V1、V2、V3を得ることができる。
【0043】
一般的に、初期文書集合に対してタグパスが与えられた場合に、その文書集合から最初の1文書を選択して、選択された文書に対してタグパスの値を取得し、初期文書集合に対してタグパスにその値が含まれていない文書集合を求め、新たに求められた文書集合を初期文書集合とする。この処理を初期文書集合が空になるまで繰り返し、最終的に取得された値の集合をノードに設定された展開条件に対して展開されたリーフの一覧とすることができる。
【0044】
〈第2の実施形態〉
図4は、本発明の第2の実施形態である文書管理システムの概略構成を示すブロック図である。図4において、本発明の第2の実施形態である文書管理システムは、図1に示した本発明の第1の実施形態におけるデータ処理装置1の構成に分類マップ合成部15を追加し、また、記憶装置2の構成に差分分類マップ記憶部25及び追加文書検索用インデックス記憶部24を追加した点で異なるものである。なお、本発明の第1の実施形態と同一構成要素に関しては、同一符号を付してその説明を省略する。
【0045】
分類マップ合成部15は、新たに追加された文書データに対して作成された分類マップ(差分分類マップ)と、分類マップ記憶部23に記憶されている分類マップと、を合成する。
【0046】
差分分類マップ記憶部25は、新たに追加された文書データに対して作成された差分分類マップを記憶する。
【0047】
追加文書検索用インデックス記憶部24は、新たに追加された文書データに対して作成された追加文書検索用インデックスを記憶する。
【0048】
本発明の第2の実施形態である文書管理システムにタグ付き構造の文書データが登録される場合の動作例を以下に示す。
【0049】
文書入力装置3から新たに追加された文書データは、文書登録部11により文書記憶部21に登録される。次に、文書検索用インデックス生成部12は、新たに追加された文書データの内容を解析し、各タグ単位での検索を可能とするための追加文書検索用インデックスを生成し、追加文書検索用インデックス記憶部24に記憶する。分類マップ生成部13は、追加された文書データが一定量を超えると作動し、追加された文書データだけに対する検索用インデックスが記憶されている追加文書検索用インデックス記憶部24を検索し、差分分類マップを生成して差分分類マップ記憶部24に記憶する。ここでは、分類マップ生成部13により差分分類マップが生成された後で、追加文書検索用インデックス記憶部24に記憶されているインデックス情報は消去される。
【0050】
次に、分類マップ合成部15が起動し、差分分類マップ記憶部24に記憶されている差分分類マップと分類マップ記憶部21に記憶されている分類マップとを合成する。分類マップ21と差分分類マップ24の木構造のルートノードから順にノードを探索し、リーフ一覧に辿りついた時に、差分分類マップのリーフの値で分類マップのリーフの値にないリーフだけを追加する。この動作を全てのノード、リーフに対して行うことにより、分類マップを自動的に更新する。
【0051】
このようにすることで、全登録文書数が多くなった場合でも、追加される文書のみにより差分分類マップを生成し、分類マップ合成部15により分類マップ記憶部24に記憶されている分類マップと合成し、自動的に分類マップを更新するので、性能を落とすことなく分類マップを生成することができる。
【0052】
【発明の効果】
以上の説明より明らかなように、本発明によれば、分類マップを生成する際のリーフを文書内容から自動生成するため、不要なリーフが生成されることがなく、分類マップのための記憶容量を削減すると共に、分類マップを表示した場合に必要なリーフのみしか表示されないため、視認性、操作性を向上することができる。
【0053】
また、本発明によれば、文書を追加した場合に、文書内容から自動的にリーフが生成されるため、分類マップを手作業で修正する必要がなく、また、性能を落とすことがないので運用性を向上することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態である文書データ管理システムの概略構成を示すブロック図である。
【図2】分布マップの実施例を示す図である。
【図3】リーフ一覧の生成方法を示す図である。
【図4】本発明の第2の実施形態である文書データ管理システムの概略構成を示すブロック図である。
【符号の説明】
1 データ処理装置
2 記憶装置
3 表示装置
4 文書入力装置
11 文書登録部
12 文書検索用インデックス生成部
13 分類マップ生成部
14 文書検索部
15 分類マップ合成部
21 文書記憶部
22 文書検索用インデックス記憶部
23 分類マップ記憶部
24 追加文書検索用インデックス記憶部
25 差分分類マップ記憶部
Claims (12)
- タグ付き構造で表現された文書データを分類マップに基づいて管理する文書管理システムにおいて、
前記タグ付き構造で表現された文書データを入力する入力装置と、
前記入力装置により入力された文書データを記憶する記憶装置と、
プログラム制御によりデータ処理を実行するデータ処理装置と、
前記記憶装置に記憶された文書データを表示する表示装置と、を備え、
前記データ処理装置は、
前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録手段と、
前記文書登録手段により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成手段と、
前記文書登録手段により前記記憶装置に一定量の文書データを登録する度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、
分類マップを生成する分類マップ生成手段と、を有し、
前記分類マップは
複数のノードを備える木構造により構築され、
直下にリーフを備えるノードには、該リーフを展開するための展開条件としてタグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられており、
前記分類マップ生成手段は、
前記文書登録手段により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、
前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、
前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、
前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする文書管理システム。 - 前記データ処理装置は、
前記文書登録手段により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶部と、
前記文書検索用インデックス生成手段により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶部と、
前記分類マップ生成手段により生成された分類マップを前記記憶装置に記憶する分類マップ記憶部と、
を有することを特徴とする請求項1記載の文書管理システム。 - 前記データ処理装置は、
前記文書登録手段により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成手段により追加文書検索用インデックスを生成し、
前記分類マップ生成手段により前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成し、
前記文書検索用インデックス生成手段により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶部と、
前記分類マップ生成手段により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶部と、を有し、
前記分類マップ記憶部により前記記憶装置に記憶されている分類マップと、前記差分分類マップ記憶部により記憶されている差分分類マップとを合成して新たな分類マップを作成する分類マップ合成手段を有し、
前記追加文書データが一定量追加登録される毎に、前記分類マップ合成手段により作成された前記新たな分類マップで、前記分類マップ記憶部により前記記憶装置に記憶されている分類マップを更新することを特徴とする請求項2に記載の文書管理システム。 - 前記データ処理装置は、
前記分類マップ記憶部により前記記憶装置に記憶されている分類マップに基づいて、所望の文書データを検索する文書検索手段を有することを特徴とする請求項2または請求項3のいずれか1項に記載の文書管理システム。 - タグ付き構造で表現された文書データを入力する入力装置と、
前記入力装置により入力された文書データを記憶する記憶装置と、
プログラム制御によりデータ処理を実行するデータ処理装置と、
前記記憶装置に記憶された文書データを表示する表示装置と、を備える文書管理システムの管理方法であって、
前記データ処理装置は、
前記入力装置により入力されたタグ付き構造の文書データを前記記憶装置に登録する文書登録工程と、
前記文書登録工程により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成工程と、
前記文書登録工程により前記記憶装置に一定量の文書データを登録する度に、
該一定量の文書データの夫々のタグ内容をリーフに持つ
複数のノードを備える木構造により構築され、
直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる
分類マップを生成する分類マップ生成工程と、
を実行し、
前記分類マップ生成工程として、
前記文書登録工程により前記記憶装置に登録された初期文書集合に対して、該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、
前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して、該第1の値に基づいて第1のリーフを生成し、
前記タグパスの値として前記第1の値が含まれていない文書集合を前記初期文書集合から抽出し、
前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して、該第2の値に基づいて第2のリーフを生成し、
前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続することを特徴とする文書管理システムの管理方法。 - 前記データ処理装置は、
前記文書登録工程により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶工程と、
前記文書検索用インデックス生成工程により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶工程と、
前記分類マップ生成工程により生成された分類マップを前記記憶装置に記憶する分類マップ記憶工程と、
を実行することを特徴とする請求項5記載の文書管理システムの管理方法。 - 前記データ処理装置は、
前記文書登録工程により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成工程により追加文書検索用インデックスを生成する追加文書検索用インデックス生成工程と、
前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成工程と、
前記文書検索用インデックス生成工程により生成された前記追加文書検索用インデックスを前記記憶装置に記憶する追加文書検索用インデックス記憶工程と、
前記差分分類マップ生成工程により生成された前記差分分類マップを前記記憶装置に記憶する差分分類マップ記憶工程と、
前記分類マップ記憶工程で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶工程で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成工程と、
前記追加文書データが一定量追加登録される毎に、前記分類マップ合成工程により作成された前記新たな分類マップで、前記分類マップ記憶工程で前記記憶装置に記憶された分類マップを更新する分類マップ更新工程と、
を実行することを特徴とする請求項6記載の文書管理システムの管理方法。 - 前記データ処理装置は、
前記分類マップ記憶工程で記憶された分類マップに基づいて、所望の文書データを検索する文書検索工程を実行することを特徴とする請求項6または請求項7のいずれか1項に記載の文書管理システムの管理方法。 - 入力装置から入力されたタグ付き構造の文書データを記憶装置に登録する文書登録処理と、前記文書登録処理により登録された前記文書データを解析して、タグ単位で検索を行うための検索用インデックスを生成する文書検索用インデックス生成処理と、
前記文書登録処理により前記記憶装置に登録されたタグ付き構造の文書データである初期文書集合に対して、
該初期文書集合の各文書データについてリーフを展開するための展開条件としてタグパスが与えられた場合、前記初期文書集合から最初の1文書を選択して、該選択された1文書に含まれる前記タグパスの第1の値を取得して第1のリーフを生成し、前記選択された1文書に対するタグパスの値が含まれていない文書集合を前記初期文書集合から抽出し、前記抽出された文書集合を新たな初期文書集合とし、該新たな初期文書集合から最初の1文書を選択し、該選択された1文書に含まれる前記タグパスの第2の値を取得して第2のリーフを生成し、前記タグパスの値として前記第2の値が含まれていない文書集合を前記新たな初期文書集合から抽出し、前記初期文書集合が無くなるまで処理を継続し、前記文書登録処理において前記記憶装置に一定量の文書データから登録される度に、該一定量の文書データの夫々のタグ内容をリーフに持つ、複数のノードを備える木構造により構築され、直下にリーフを備えるノードには、該リーフを展開するための展開条件として前記タグパスが与えられ、前記リーフには、前記タグパスと前記タグパスの値を対応付けた検索条件が与えられる分類マップを生成し、表示装置に表示する、
分類マップ生成処理とを
データ処理装置に実行させることを特徴とするプログラム。 - 前記データ処理装置に、
前記文書登録処理により登録された前記タグ付き構造の文書データを前記記憶装置に記憶する文書データ記憶処理と、
前記文書検索用インデックス生成処理により生成された検索用インデックスを前記記憶装置に記憶する検索用インデックス記憶処理と、
前記分類マップ生成処理により生成された分類マップを前記記憶装置に記憶する分類マップ記憶処理と、を実行させることを特徴とする請求項9記載のプログラム。 - 前記データ処理装置に、
前記文書登録処理により前記記憶装置に登録される新たな追加文書データが一定量に達する毎に、前記文書検索用インデックス生成処理により追加文書検索用インデックスを生成する追加文書検索用インデックス生成処理と、
前記一定量の追加文書データに対して前記分類マップと同一の構造を有する差分分類マップを生成する差分分類マップ生成処理と、前記文書検索用インデックス生成処理において生成された前記追加文書検索用インデックスを前記記憶装置に記憶させる追加文書検索用インデックス記憶処理と、
前記差分分類マップ生成処理において生成された前記差分分類マップを前記記憶装置に記憶させる差分分類マップ記憶処理と、
前記分類マップ記憶処理で前記記憶装置に記憶された分類マップと、前記差分分類マップ記憶処理で前記記憶装置に記憶された差分分類マップとを合成して新たな分類マップを作成する分類マップ合成処理と、
前記追加文書データが一定量追加登録される毎に、前記分類マップ合成処理により作成された前記新たな分類マップで、前記分類マップ記憶処理で前記記憶装置に記憶された分類マップを更新する分類マップ更新処理と、
を実行させることを特徴とする請求項10に記載のプログラム。 - 前記データ処理装置に、
前記分類マップ記憶処理で前記記憶装置に記憶された分類マップに基づいて、所望の文書データを検索する文書検索処理を実行させることを特徴とする請求項10または請求項11のいずれか1項に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001356585A JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
US10/291,711 US7069505B2 (en) | 2001-11-21 | 2002-11-12 | Document management system, method thereof, and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001356585A JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003157264A JP2003157264A (ja) | 2003-05-30 |
JP4215425B2 true JP4215425B2 (ja) | 2009-01-28 |
Family
ID=19168081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001356585A Expired - Fee Related JP4215425B2 (ja) | 2001-11-21 | 2001-11-21 | 文章管理システム、その管理方法及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7069505B2 (ja) |
JP (1) | JP4215425B2 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7165238B2 (en) * | 2003-06-06 | 2007-01-16 | Intentional Software Corporation | Method and system for organizing and manipulating nodes by category in a program tree |
JP2005043966A (ja) * | 2003-07-22 | 2005-02-17 | Pioneer Electronic Corp | データ検索装置及び方法、ナビゲーション装置及び方法、データ検索用のデータセット並びにコンピュータプログラム |
KR100775852B1 (ko) | 2006-01-18 | 2007-11-13 | 포스데이타 주식회사 | 응용 프로그램의 자원 검색 시스템 및 방법 |
KR100756921B1 (ko) | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
JP4911299B2 (ja) * | 2006-11-24 | 2012-04-04 | セイコーエプソン株式会社 | 電子機器およびデータ生成方法 |
JP5211557B2 (ja) * | 2007-06-15 | 2013-06-12 | 富士通株式会社 | Web会議支援プログラム、該プログラムを記録した記録媒体、Web会議支援装置、およびWeb会議支援方法 |
US7941399B2 (en) | 2007-11-09 | 2011-05-10 | Microsoft Corporation | Collaborative authoring |
US8028229B2 (en) * | 2007-12-06 | 2011-09-27 | Microsoft Corporation | Document merge |
US8825758B2 (en) * | 2007-12-14 | 2014-09-02 | Microsoft Corporation | Collaborative authoring modes |
US7818293B2 (en) * | 2008-01-02 | 2010-10-19 | International Business Machines Corporation | Method and system to synchronize updated versions of a document edited on a collaborative site that are under document management control |
US8301588B2 (en) | 2008-03-07 | 2012-10-30 | Microsoft Corporation | Data storage for file updates |
US8352870B2 (en) * | 2008-04-28 | 2013-01-08 | Microsoft Corporation | Conflict resolution |
US8429753B2 (en) | 2008-05-08 | 2013-04-23 | Microsoft Corporation | Controlling access to documents using file locks |
US8825594B2 (en) | 2008-05-08 | 2014-09-02 | Microsoft Corporation | Caching infrastructure |
US8417666B2 (en) * | 2008-06-25 | 2013-04-09 | Microsoft Corporation | Structured coauthoring |
US20100131836A1 (en) * | 2008-11-24 | 2010-05-27 | Microsoft Corporation | User-authored notes on shared documents |
US8346768B2 (en) * | 2009-04-30 | 2013-01-01 | Microsoft Corporation | Fast merge support for legacy documents |
US9646013B2 (en) | 2011-02-16 | 2017-05-09 | Docbert Llc | System and method for file management |
US8180814B1 (en) | 2011-02-16 | 2012-05-15 | Docbert, LLC | System and method for file management |
US9262510B2 (en) | 2013-05-10 | 2016-02-16 | International Business Machines Corporation | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries |
US9251136B2 (en) | 2013-10-16 | 2016-02-02 | International Business Machines Corporation | Document tagging and retrieval using entity specifiers |
US9235638B2 (en) | 2013-11-12 | 2016-01-12 | International Business Machines Corporation | Document retrieval using internal dictionary-hierarchies to adjust per-subject match results |
US11126592B2 (en) | 2014-09-02 | 2021-09-21 | Microsoft Technology Licensing, Llc | Rapid indexing of document tags |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0457153A (ja) | 1990-06-27 | 1992-02-24 | Fujitsu Ltd | 構造化文書処理システム |
JP2795317B2 (ja) | 1996-06-24 | 1998-09-10 | 日本電気株式会社 | 多段表処理方式 |
JPH10187680A (ja) | 1996-12-20 | 1998-07-21 | Nec Corp | 単語、文、部分の粒度で管理するドキュメントリポジトリ装置 |
JP3887867B2 (ja) | 1997-02-26 | 2007-02-28 | 株式会社日立製作所 | 構造化文書の登録方法 |
JP3849279B2 (ja) * | 1998-01-23 | 2006-11-22 | 富士ゼロックス株式会社 | インデクス作成方法および検索方法 |
US6266682B1 (en) * | 1998-08-31 | 2001-07-24 | Xerox Corporation | Tagging related files in a document management system |
US6360215B1 (en) * | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
JP2000348038A (ja) | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 半構造データベースのためのデータ格納装置および方法 |
WO2000077609A1 (en) * | 1999-06-14 | 2000-12-21 | The Thomson Corporation | System for converting data to a markup language |
JP2001005820A (ja) | 1999-06-18 | 2001-01-12 | Nec Corp | 情報検索装置 |
AU2001241564A1 (en) * | 2000-02-17 | 2001-08-27 | E-Numerate Solutions, Inc. | Rdl search engine |
US6738767B1 (en) * | 2000-03-20 | 2004-05-18 | International Business Machines Corporation | System and method for discovering schematic structure in hypertext documents |
US20010051899A1 (en) * | 2000-06-13 | 2001-12-13 | Takahiko Kawashima | Document managing apparatus for managing transaction slip data in electronic commerce |
US6684204B1 (en) * | 2000-06-19 | 2004-01-27 | International Business Machines Corporation | Method for conducting a search on a network which includes documents having a plurality of tags |
US20020107847A1 (en) * | 2000-10-10 | 2002-08-08 | Johnson Carl E. | Method and system for visual internet search engine |
US6947932B2 (en) * | 2001-01-23 | 2005-09-20 | Xpriori, Llc | Method of performing a search of a numerical document object model |
EP1430420A2 (en) * | 2001-05-31 | 2004-06-23 | Lixto Software GmbH | Visual and interactive wrapper generation, automated information extraction from web pages, and translation into xml |
EP1276056B1 (de) * | 2001-07-10 | 2012-12-26 | Software AG | Verfahren zum Verwalten einer Datenbank |
US7146564B2 (en) * | 2001-12-21 | 2006-12-05 | Xmlcities, Inc. | Extensible stylesheet designs using meta-tag and/or associated meta-tag information |
-
2001
- 2001-11-21 JP JP2001356585A patent/JP4215425B2/ja not_active Expired - Fee Related
-
2002
- 2002-11-12 US US10/291,711 patent/US7069505B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20030097638A1 (en) | 2003-05-22 |
JP2003157264A (ja) | 2003-05-30 |
US7069505B2 (en) | 2006-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4215425B2 (ja) | 文章管理システム、その管理方法及びそのプログラム | |
US7290222B2 (en) | Methods, systems and computer program products for providing tree diagram graphical user interfaces having secondary expansion capabilities | |
US5953017A (en) | Compressed object display | |
US8549434B2 (en) | Method for graphical representation of a content collection | |
US8762834B2 (en) | User interface for defining a text file transformation | |
US20080288242A1 (en) | System And Method Of Presentation of Multilingual Metadata | |
US20040080531A1 (en) | Method, system and program product for automatically modifying a display view during presentation of a web page | |
JPWO2006098031A1 (ja) | キーワード管理装置 | |
JP5489660B2 (ja) | 画像管理装置およびその制御方法およびプログラム | |
KR100853308B1 (ko) | 항목 타입별 구조화된 검색 | |
US20080250052A1 (en) | Repopulating a database with document content | |
CN100399330C (zh) | 管理环球网网页中的环球网媒体的系统及其实现方法 | |
CN108304291B (zh) | 测试输入信息检索装置和方法 | |
JP2001142890A (ja) | 画像検索方法及びその装置 | |
JP2005128872A (ja) | 文書検索システム及び文書検索プログラム | |
JP5230193B2 (ja) | データ検索装置、データ検索方法、及びコンピュータプログラム | |
JP3933407B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体 | |
JP2007199987A (ja) | 特許情報検索システム | |
JPH1139327A (ja) | リンク情報自動修復方法および装置 | |
JP2002108875A (ja) | 電子マニュアル装置及び電子マニュアルの変更方法 | |
JP2001147922A (ja) | 文書管理装置、文書管理方法および記憶媒体 | |
JP2002108844A (ja) | Xmlデータ分割編集装置 | |
JP3935323B2 (ja) | 文書管理装置および文書管理プログラムを記憶したコンピュータ読み取り可能な記録媒体 | |
JP2009245448A (ja) | データリストア装置 | |
JPH11212985A (ja) | 情報ライブラリ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060508 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060508 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060614 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20060728 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070118 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111114 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |