JPH06131340A - 構造化文書の文書部品管理装置 - Google Patents

構造化文書の文書部品管理装置

Info

Publication number
JPH06131340A
JPH06131340A JP4281807A JP28180792A JPH06131340A JP H06131340 A JPH06131340 A JP H06131340A JP 4281807 A JP4281807 A JP 4281807A JP 28180792 A JP28180792 A JP 28180792A JP H06131340 A JPH06131340 A JP H06131340A
Authority
JP
Japan
Prior art keywords
document
keyword
processing
index
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4281807A
Other languages
English (en)
Other versions
JP3659595B2 (ja
Inventor
Shigeki Ishino
茂樹 石野
Nobukatsu Yamashita
信勝 山下
Tetsuya Toudou
徹也 東道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP28180792A priority Critical patent/JP3659595B2/ja
Publication of JPH06131340A publication Critical patent/JPH06131340A/ja
Application granted granted Critical
Publication of JP3659595B2 publication Critical patent/JP3659595B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】構造化文書を編集処理する文書処理装置ととも
に利用される文書部品管理装置において、文書の内部構
造による検索を可能とし、かつ文書部品として文書の内
部構造のみを保存できるようにする。 【構成】文書部品受付手段11で受け付けた文書部品を
論理構造特定手段12で解析して論理構造を特定する。
インデックス生成手段14は、文書部品保持手段13に
格納されている文書部品を取り出して、前記特定した論
理構造のインデックスを生成し、インデックス保持手段
15に保持する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、構造化文書を編集処
理する文書処理装置に関し、詳しくは文書処理装置とと
もに利用される文書部品管理装置に関する。
【0002】
【従来の技術】論理構造を持つ構造化文書の代表的なも
のとして、ODA(Office DocumentArchitecture ISO8
613-2)で規定された文書がある。この文書は共通論理
構造、共通割付け構造、特定論理構造、特定割付け構造
の4つの構造から構成されており、論理構造は章・節・
段落といった文書の構成部品の組み合わせで構成されて
いる。ここで、ODAの文書構造を図31に、文書処理
モデルを図32に示す。図32の文書処理モデルによれ
ば、文書の構造は内容の表示処理が不必要な場合、共通
論理構造と特定論理構造でよい。文書の特定論理構造は
共通論理構造に従った形式となる。したがって、文書処
理装置で文書を保存する際に特定論理構造を保存する
と、その保存の構造は共通論理構造に則った形式とな
る。
【0003】
【発明が解決しようとする課題】既存のネットワークシ
ステムに接続されたファイルサーバや、UNIXファイ
ルシステムなどでは、文書のそのものを1単位としてと
らえて文書の保管を行っている。このため、これらのフ
ァイルシステムと組み合わされた文書処理装置では、文
書の内容や構造といった文書内部の構造で検索などを行
うことは不可能であった。したがって、「ある表枠のあ
る文書」というような検索条件を指定して、目的の文書
を見つけ出すということはできなかった。また、文書の
内部構造を不完全なまま保存することができないという
不便さがあった。
【0004】なお、記憶装置に保存されている文書やデ
ータの検索に関する技術として、例えば、文書を分類に
よる階層とインデックスにより管理するようにした文書
保管検索システムが特開昭60−129873号公報
に、また、文書内に設定された検索項目でも検索できる
ようにした文書作成装置が特開昭61−100834号
公報に、さらには多面的なデータ検索を容易にした文書
管理装置が特開平2−96268号公報にそれぞれ提案
されている。しかし、これらの文書処理装置について
も、文書内部の構造での検索については考慮されておら
ず、上述した課題を解決するに至っていない。
【0005】一方、文書処理装置と大規模な保存管理装
置(以下、データベースという)の組み合わせは、例え
ば次のような場面で用いられることが多い。
【0006】(1)一つの文書形式をひな型とし、文書
を構成するグラフ、表データ、図などをデータベースで
参照して、多数の文書を作成する場合。
【0007】(2)グラフ、表データ、図などの文書部
品を用途に応じて様々な組み合わせで用い、多数の文書
を作成する場合。
【0008】(3)コピー・ペースト機能を利用して文
書を作成する場合。
【0009】(4)様々な観点からの検索の要求を満た
すため、文書部品をデータベースに登録するときにキー
ワードを設定する場合。
【0010】しかしながら、上記の使用形態において
は、データベースに文書部品を登録する都度、キーワー
ドを設定しなければならず、また、複数のひな型から取
り出した文書部品を組み合わせて作成した文書では、キ
ーワードの組み合わせを管理する必要があった。さら
に、キーワードの設定は文書の作成者ではなく登録作業
者に依存しているため、同種の内容に対して同じキーワ
ードが設定されている保障がなく、データベースの品質
が低下するという問題点があった。
【0011】さらに、従来の文書処理装置とデータベー
スを組み合わせたシステムでは、外部のデータベースか
らの参照文書部品を、さらに外部のデータベースに登録
する際に、参照状態のまま登録していたが、参照状態の
まま登録すると、同一あるいは異サーバのデータベース
間での参照のネストが生じるため、参照関係がわかりに
くくなるという問題点があった。また、ネストの途中の
データベースが稼動していなかったりした場合など、参
照の更新などにより文書部品の内容に不整合が生じると
いう問題点があった。
【0012】この発明は、文書の内部構造による検索を
可能とし、かつ文書部品として文書の内部構造のみを保
存できるようにした構造化文書の文書部品管理装置を提
供することを目的とする。
【0013】また、この発明は、文書部品作成時におけ
る文書部品個別のキーワード設定、及び文書部品を組み
合わせた場合の適切なキーワード設定を可能とし、かつ
個々の文書のキーワード設定の管理を不要とした構造化
文書の文書部品管理装置を提供することを目的とする。
【0014】さらに、この発明は、参照の多層化による
関係の複雑さを解消するとともに、更新のタイミングに
よる内容の不整合を防ぐことができる構造化文書の文書
部品管理装置を提供することを目的とする。
【0015】
【課題を解決するための手段】上記課題を解決するた
め、第1の発明に係わる構造化文書の文書部品管理装置
では、処理内容とともに文書の少なくとも一部を処理対
象として受け付けて論理的構造を持つ構造化文書を編集
処理する文書処理装置とともに利用される構造化文書の
文書部品管理装置であって、登録要求とともに処理対象
を文書部品として文書処理装置から受け付ける文書部品
受付手段と、前記受け付けた文書部品を解析して論理構
造を特定する論理構造特定手段と、前記文書部品を1以
上保持する文書部品保持手段と、前記特定した論理構造
のインデックスを生成するインデックス生成手段と、前
記生成されたインデックスを1以上保持するインデック
ス保持手段とを具えている。
【0016】第2の発明に係わる構造化文書の文書部品
管理装置では、上記構造化文書の文書部品管理装置に、
前記文書部品にキーワードを対応させて保持するキーワ
ード保持手段と、前記文書部品のキーワードを表示する
キーワード表示手段と、前記文書部品のキーワードを設
定するキーワード設定手段とを具えている。
【0017】第3の発明に係わる構造化文書の文書部品
管理装置では、上記第2または第3の発明に係わる構造
化文書の文書部品管理装置に、前記受け付けた文書部品
に参照があるか否かを判断する参照判断手段と、前記参
照判断手段により参照があると判断された場合に、例外
処理を行う例外処理手段とを具えている。
【0018】
【作用】第1の発明に係わる構造化文書の文書部品管理
装置によれば、ユーザが指定した文書あるいは文書部品
(以下、文書部品と総称する)を解析して、文書部品を
構成する論理構造をすべて特定し、その構造情報および
物理的な位置情報をインデックス内に保管するようにし
ているので、文書の内部構造を文書としては不完全な形
式で保存することができる。また、インデックス内部に
文書構造が保持されているため、文書の内部構造を条件
とした検索ができる。
【0019】第2の発明に係わる構造化文書の文書部品
管理装置によれば、文書部品単位に属性としてキーワー
ドを設定し、また文書部品単位にキーワードを対応させ
て保持するようにしたので、文書部品作成時に文書部品
個別にキーワードを設定することができる。また、文書
部品を組み合わせて用いても、適切なキーワードが自動
的に設定される。また、キーワードの設定が登録作業者
に依存しなくなるため、データベースの品質を向上させ
ることができる。さらに、登録管理者が文書作成者と異
なる場合に、個々の文書のキーワード設定の管理を行わ
なくてすむ。
【0020】第3の発明に係わる構造化文書の文書部品
管理装置によれば、受け付けた文書部品に参照があるか
否かを判断し、参照があると判断された場合には、例え
ば参照を解除するかどうかをユーザに選択させて、登録
を中止または参照情報を削除した文書部品を登録するな
どの例外処理を行うようにしたので、文書部品管理デー
タベース内に参照文書・部品を持つことがない。このた
め、参照の多層化による関係の複雑さが解消され、更新
のタイミングによる内容の不整合を防ぐことができる。
【0021】
【実施例】以下、この発明に係わる構造化文書の文書部
品管理装置(この実施例では、単に文書部品管理装置と
呼ぶ)の実施例1〜3と、その応用例である実施例4を
図面を参照しながら説明する。
【0022】実施例1 図1は、実施例1における文書部品管理装置の機能的な
構成を示すブロック図である。
【0023】この文書部品管理装置10は、処理内容と
ともに文書の少なくとも一部を処理対象として受け付け
て論理的構造を持つ構造化文書を編集処理する文書処理
装置とともに利用される文書部品管理装置であって、登
録要求とともに処理対象を文書部品として文書処理装置
から受け付ける文書部品受付手段11と、前記受け付け
た文書部品を解析して論理構造を特定する論理構造特定
手段12と、前記文書部品を1以上保持するスタックか
らなる文書部品保持手段13と、前記特定した論理構造
のインデックスを生成するインデックス生成手段14
と、前記生成されたインデックスを1以上保持するイン
デックス保持手段15とから構成されている。
【0024】図2は、図1に示した文書部品管理装置1
0を実現するためのハードウェア構成を示したもので、
文書処理装置としての機能を具えた例えばワークステー
ションやパソコンなどのブロック図を示している。
【0025】図において、表示装置1は、CRTなどの
ディスプレイ画面を具え、画面上にデータやリストなど
を表示する。表示装置1での表示は表示制御部2により
制御されている。
【0026】キーボード3は、コマンドや文字列などの
データ入力用の入力装置であり、画面上で指示選択を行
うためのマウス4が接続されている。キーボード3やマ
ウス4から入力された各種のデータや指示は、キーボー
ド/マウス制御部5を通じてCPU9に送られる。
【0027】ディスク装置6は、磁気ディスクなどの2
次記憶装置で構成され、文書データをファイル形式で格
納している。また、文書部品の論理構造を保持するイン
デックスもディスク装置6に格納されている。ディスク
装置6でのデータの入出力はディスク装置制御部7で制
御されている。
【0028】主記憶装置8は、RAMなどのメモリ装置
で構成されるバッファ記憶であり、各種の制御プログラ
ム、キーボード3及びマウス4から入力された各種のデ
ータや指示などを一時的に記憶する。
【0029】CPU(中央処理装置)9は、システム全
体の制御を行うと共に、前記キーボード/マウス制御部
5から出力される各種の命令に基づいて所定のデータに
対する演算処理を行う回路であり、所定の制御プログラ
ムに従って前述の文書部品管理装置10の機能を実現し
ている。
【0030】上記文書部品管理装置10で使用する共通
論理構造を図3〜図5に示す。図3の見出しの論理構
造、図4の本文中の枠の論理構造、並びに図5の入れ子
枠の論理構造は、図31の共通論理構造に対応してい
る。文書データはこれらの論理構造と凡例に示すルール
に従って作成されることになる。
【0031】次に、上述した文書部品管理装置10にお
いて、文書部品の解析とインデックス登録の処理の流れ
を図6〜図9のフローチャートを参照しながら説明す
る。
【0032】最初に、上記処理の全体的な流れを図6の
フローチャートを用いて説明する。図において、文書部
品管理装置10は、ユーザからの文書部品登録要求を受
付け(ステップ101)、登録要求されたのは文書その
ものであるか、文書部品であるかを判断する(ステップ
102)。ここで、登録要求された文書部品が文書その
ものである場合には、文書に付随する文書概要部の処理
が必要となる。このため、「分書名」「ページ数」、文
書が開始される物理位置などの情報をスタックに保管す
る(ステップ103)。この後、図7のフローチャート
に移り、文書部品構造の解析とインデックスの構築を行
う(ステップ104)。
【0033】図7のフローチャートは、上記ステップ1
04における文書部品構造の解析とインデックスの構築
処理の流れを示している。この処理では、最初に、登録
要求された対象体の種別と論理階層の確認を行い(ステ
ップ201)、対象体があるかどうかを判断する(ステ
ップ202)。ここで、対象体があるときは、スタック
の最後に「章・節」の情報が保管されているかどうかを
判断し(ステップ203)、保管されている場合は、ス
タックに保管されている論理階層と対象体の論理階層の
大きさを比較する(ステップ204)。ここで、対象体
の論理階層が同じか小さい場合(直前の見出し構造が終
了したことを意味している)は、スタックの最後に保管
してある見出し構造に関する情報を取り出し(ステップ
205)、取り出した見出し構造に関する情報に、最後
に処理を行った対象体の物理位置を付加してインデック
スに追加する(ステップ206)。
【0034】ステップ203でスタックの最後に「章・
節」の情報が保管されていない場合、ステップ204で
対象体の論理階層が大きい場合、またはステップ206
の処理に続いて、対象体の種別を判断する(ステップ2
07)。ここで、種別が基本論理対象体であるときは、
基本論理対象体の処理(ステップ208)、内容部対象
体の処理(ステップ209)を行い、ステップ201に
戻る。また、ステップ207で種別が複合論理対象体で
あるときは、図8のフローチャートに移り、文書部品論
理対象体の処理を行う(ステップ210)。
【0035】一方、ステップ202で対象体がないとき
は、スタックに情報が保管されているかどうかを判断す
る(ステップ211)。これは、文書部品構造が終了し
ても、階層の異なる見出し構造が存在した場合や、枠構
造で文書部品が終了する場合、さらに登録要求された文
書部品が文書そのものである場合に、スタックに内容が
残っている場合があるからである。ステップ211でス
タックに情報が保管されている場合は、スタックの最上
段にある情報を取り出し、最後に処理を行った対象体の
物理位置を付加してインデックスに追加する(ステップ
212)。この後、再びステップ211に戻り、スタッ
クに残っている内容が無くなるまでループを繰り返す。
【0036】図8のフローチャートは、上記ステップ2
10における文書部品論理対象体の処理の流れを示して
いる。この処理では、最初に、対象体の種別、論理階
層、開始の物理位置をスタックに保管し(ステップ30
1)、対象体の論理内容が「枠」または「章・節」のど
ちらであるかを判断する(ステップ302)。ここで、
論理内容が「章・節」であるときは、見出し文字段落の
内容をスタックの最後の情報に追加する(ステップ30
3)。ここでは、「章・節」の構造は下位に「章・節」
の構造を含むことが可能であるので再帰的な処理を行
う。そのため、文書部品論理対象体の処理では、スタッ
クに情報を積む処理を行う。また、ステップ302で論
理内容が「枠」であるときは、図9のフローチャートに
移り、枠構造の処理を行う(ステップ304)。
【0037】図9のフローチャートは、上記ステップ3
04における枠構造の処理の流れを示している。この処
理では、最初に、次の対象体の論理内容が「枠本体」ま
たは「枠外テキスト域」のどちらであるかを判断する
(ステップ401)。論理内容が「枠外テキスト域」で
あるときは、次の対象体の論理内容が「枠外テキスト域
段落」または「枠見出し」のどちらであるかを判断する
(ステップ402)。論理内容が「枠見出し」であると
きは、枠見出し文字段落の内容をスタックの最後の情報
に追加する(ステップ403)。また、ステップ401
で論理内容が「枠本体」であるときは、枠内容部対象体
の処理を行い(ステップ404)、ステップ402で論
理内容が「枠外テキスト域段落」であるときは、枠外テ
キスト域段落内容部対象体の処理を行う(ステップ40
5)。
【0038】ステップ403、404、405に続い
て、次の対象体の種別と論理階層の確認を行い(ステッ
プ406)、対象体があるかどうかを判断する(ステッ
プ407)。対象体があるときは、スタックに保管され
ている論理階層と対象体の論理階層の大きさを比較する
(ステップ408)。ここで、対象体の論理階層が同じ
か小さい場合(枠構造が終了したことを意味している)
は、スタックの最後に保管してある枠構造に関する情報
を取り出し(ステップ409)、取り出した枠構造に関
する情報に、最後に処理を行った対象体の物理位置を付
加し、インデックスに追加する(ステップ410)。ま
た、ステップ408で対象体の論理階層が大きいとき
は、再びステップ401に戻り、枠構造が終了するまで
処理を上記処理を繰り返す。
【0039】上述した解析と登録処理により、文書部品
の論理情報と物理的な位置情報がインデックスに保管さ
れる。インデックスの構造を図10に示す。図10
(a)はインデックスレコードのフォーマット例を、同
図(b)は部品情報の内容例を、同図(c)は部品種別
による固有情報の具体例をそれぞれ示している。インデ
ックスはユーザが保管を行った文書部品一単位を1レコ
ードとして保持している。文書部品の論理構造は単一の
構造ではなく、その内部に複数の文書部品が包含されて
いたり、また入れ子の構造になっていることがあるた
め、インデックスは可変長とし、不確定な文書部品の要
素数に対応可能にする。
【0040】文書部品の論理構造図とインデックスとの
関係を図11に示す。例えば、左上に示したような文書
について考えてみると、その特定論理構造は下図のよう
になる。本例のような論理構造を持つ文書の場合、イン
デックス内部には、文書全体に関する情報、見出し構造
に関する情報、枠構造に関する情報、見出し構造に関す
る情報、の4つの構造に関する情報が保管される。各情
報の内容は次のようになる。ただし、[ ]内の数字は
論理構造図の番号に対応している。
【0041】1、文書全体に関する情報 文書概要の先頭の物理位置から[30220]で示され
る内容部が終了する物理位置、および文書概要中に記述
されている文書全体の情報。
【0042】2、見出し構造に関する情報 [30]で示される「章・節」構造対象体の先頭の物理
位置から[30220]で示される内容部が終了する物
理位置、および「見出し文字段落」直下の内容部[30
010]の情報。
【0043】3、枠構造に関する情報 [301]で示される「枠」構造対象体の先頭の物理位
置から[30100]で示される内容部が終了する物理
位置等の情報。
【0044】4、見出し構造に関する情報 [302]で示される「章・節」構造対象体の先頭の物
理位置から[30220]で示される内容部が終了する
物理位置、および「見出し文字段落」直下の内容部[3
0210]の情報。
【0045】このように、実際の文書ファイルを恒常的
な2次記憶装置に格納し、インデックスに対してアクセ
スを行うことにより、実際の文書ファイルを取り出すこ
となく、文書の内部構造を条件とした検索が容易とな
り、また、多量の文書群の中から特定の構造を高速に検
索することが可能となる。
【0046】実施例2 図12は、実施例2における文書部品管理装置の機能的
な構成を示すブロック図である。文書部品管理装置21
の基本構成は図1と同じであり、これにデータベース2
2、キーワード選択ユーザインターフェース23、キー
ワード属性付加手段24、文書部品保持手段(文書内部
表現A)25、文書部品保持手段(文書内部表現B)2
6、コピー・ペースト手段27、キーワード集合合成手
段28、文書内部表現変換手段29が付加されている。
なお、この図では説明の都合上、文書部品管理装置21
と他のブロックを区別して表しているが、実際には、2
4〜29で示されるブロックは文書部品管理装置21内
に含まれている。
【0047】キーワード選択ユーザインターフェース2
3は、キーボード、マウス、ディスプレイなどにより構
成されている。ここでは、ユーザからの指示や、文書部
品の登録要求などを受け付けるとともに、文書部品のキ
ーワードなど必要な情報を可視化して表示する。
【0048】キーワード属性付加手段24は、登録要求
のあった文書部品に、属性としてキーワードを設定す
る。なお、このキーワードは複数設定可能であり、以後
の説明ではキーワード集合という。
【0049】文書部品保持手段25は、文書を文書部品
管理装置の中に表現するための形式(文書内部表現A)
を持つ記憶装置であり、各文書部品毎に A−1)文書部品の内容記述 A−2)文書部品固有の属性 A−3)文書部品に与えられたキーワード集合 の形式を持っている。
【0050】文書部品保持手段25は、文書をデータベ
ース22の中に表現するための形式(文書内部表現B)
を持つ記憶装置であり、次の形式からなる。
【0051】B−1)文書内部表現Aによる文書の表現 B−2)B−1)から自動的に合成されたキーワード集
合(各部品に設定されたキーワード集合の集合和) コピー・ペースト手段27は、ユーザにより選択された
領域を指定された位置に挿入するためのコピー・ペース
ト処理を行う手段であり、ここでは、上記A−3)の属
性のコピーも行うように構成されている。
【0052】キーワード集合合成手段28は、文書部品
単位に設定されたキーワード集合を、文書全体のキーワ
ード集合として合成する。
【0053】文書内部表現変換手段29は、文書のデー
タベース登録時に文書内部表現Aからキーワード集合を
合成し、文書内部表現Bに変更する。また、読み込み時
には、文書内部表現Bを文書内部表現Aに変更する。
【0054】なお、データベース上での検索のためのキ
ーワード集合としては、上記B−2)を用いる。
【0055】次に、上述した文書部品管理装置におい
て、キーワード集合を合成する処理の流れを図13のフ
ローチャートを用いて説明する。
【0056】まず、文書部品保持手段25において、文
書内部表現Aをオープンし(ステップ501)、キーワ
ード集合Sを空集合に初期化する(ステップ502)。
続いて、すべての文書部品を一つに読み込んだかどうか
を判断し(ステップ503)、読み込んでないときは、
文書部品を一つ読み込む(ステップ504)。次に、読
み込んだ文書部品から、A−3)のキーワード集合を取
り出し(ステップ505)、取り出したキーワード集合
とSの和集合でSを更新する(ステップ506)。そし
て、SをB−2)として文書の内部表現Bを生成して
(ステップ506)、ステップ503に戻り、すべての
文書部品を一つ読み込むまでループを繰り返す。 図1
4は、グラフや表データを具えた文書に対して、上記処
理を実行したときの例を示している。グラフや表データ
は、文書部品毎に文書内部表現Aの形式でキーワード集
合などが設定される。さらに、これらの文書部品単位に
設定されたキーワード集合は文書全体のキーワード集合
として合成される。文書内部表現Bでは、文書内部表現
Aによる文書と、前記文書全体のキーワード集合という
形式になり、この形式でデータベースに登録されること
になる。
【0057】すなわち、実施例2の文書部品管理装置に
よれば、グラフ、表データ、図などの文書部品(または
そのひな型)作成時に、文書部品毎にキーワードが設定
できるうえ、グラフ、表データ、図などを様々な組み合
わせで用いても、適切なキーワードが自動的に設定され
る。また、運用で文書部品のひな型にキーワードをつけ
て使用することができる。さらに、キーワードの設定が
登録作業者に依存しなくなるため、データベースの品質
が向上する。加えて、データベース管理者が文書作成者
と異なる場合に、個々の文書のキーワード設定の管理を
行わなくてすむという利点がある。
【0058】実施例3 図15は、実施例3における文書部品管理装置の機能的
な構成を示すブロック図である。文書部品管理装置31
の基本構成は図1と同じであり、これに参照判断手段3
2、例外処理手段33が付加されている。なお、この図
では説明の都合上、文書部品管理装置31と他のブロッ
クを区別して表しているが、実際には、32と33で示
されるブロックは文書部品管理装置31内に含まれてい
る。
【0059】参照判断手段32は、文書部品管理装置3
1で受け付けた文書部品に参照があるか否かを判断し、
この結果を例外処理手段33に通知する。
【0060】例外処理手段33は、前記参照判断手段3
2により参照があると判断された場合に、例外処理を行
う。
【0061】図16は、上記参照判断手段32と例外処
理手段33の機能を説明するための説明図である。参照
文書部品は、その内部に参照情報(参照元の場所、登録
名、登録日時等)を持っている。データベースAから文
書部品を参照し、データベースBに登録する時、参照判
断手段32は前記文書部品が参照文書部品であるかどう
かをチェックする。このとき、参照文書部品であるとき
は、そのままの状態で登録を許可せず、「参照を解除し
て登録する」か「登録を中止する」かをユーザに選択さ
せる。「登録する」が選択された場合、例外処理手段3
3は参照情報を削除した文書部品をデータベースBに登
録する。また、「登録を中止する」が選択された場合
は、登録処理を中止する。
【0062】次に、参照文書部品を登録する場合の処理
の流れを図17のフローチャートにより説明する。
【0063】まず、文書部品が外部からの参照物かどう
かをチェックし(ステップ601)、参照文書部品かど
うかを判断する(ステップ602)。ここで、参照文書
部品であるときは、登録中止とするか、参照解除して登
録するかの判断をユーザに促し(ステップ603)、ユ
ーザが「参照解除して登録する」を選択したかどうかを
判断する(ステップ604)。ここで、Noであるとき
は、登録処理を中止する(ステップ605)。また、Y
esであるときは、参照先から部品の実体をコピーし、
参照情報を削除した(ステップ606)後、該当するデ
ータベースに登録する(ステップ607)。
【0064】実施例3の文書部品管理装置によれば、文
書部品の登録時に、参照を解除(参照部品は実体として
取り込む)して登録するか登録を中止するかをユーザに
選択させて、文書部品管理データベース内に参照文書部
品を持つことがないようにしたので、参照の多層化によ
る関係の複雑さが解消され、更新のタイミングによる内
容の不整合を防ぐことができる。
【0065】実施例4 先に述べたように、既存のネットワークシステムに接続
されたファイルサーバや、一般的なUNIXファイルシ
ステムなどでは、文書そのものを1単位としてとらえて
文書の保管を行っているので、枠や見出しのみというよ
うな文書内部の構造(文書部品)により保存や取り出し
を行うことは不可能であった。したがって、文書部品の
単独での保存/取り出しができるようになれば、多数の
利用者による共用が可能となり、文書作成をより効率良
く行うことができるようになる。この実施例では、正し
い文書としての体裁を整えていない文書部品について
も、コピー/ペースト等の手段を用いてサーバに単独で
保存/取り出しが行えるようにした例について説明す
る。
【0066】図18は、実施例4における文書部品管理
システム40の機能的な構成を示すブロック図である。
このシステムは、文書エディタ41、コピーバッファ4
2、保存アプリケーションシステム43、サーバ装置4
4により構成されている。
【0067】文書エディタ41は、入力、フォーマッ
ト、レイアウト及び修正などの文書の作成/編集に必要
な機能を制御している。文書エディタはマウス/キーボ
ード、ディスプレイなどのユーザインターフェースと接
続され、マウス/キーボードにより発生するイベントを
解釈し、その結果に応じて所定のコマンドを実行する。
入力イベントは、キーボードのキーの押下げや、マウス
に付属するボタンの押下げ/解放などにより発生する。
【0068】コピーバッファ42は、ユーザにより選択
された文書の一部の特定論理構造を一時的に保存するバ
ッファ記憶である。
【0069】保存アプリケーションシステム43は、保
存アプリケーションによってコピーバッファ42やサー
バ装置44へのデータの保存、取り出しを制御する。
【0070】サーバ装置44は、論理構造を有する文書
データや前記コピーバッファ42に一時的に保存されて
いた特定論理構造を保管する。
【0071】上記システムで使用する共通論理構造は、
図3〜図5に示したものと同じである。これらの構造に
基づいた文書エディタ41において、エディタの利用者
は文書中のある特定の構造を選択し、「コピー」キーの
押下げ等の手段により、文書の一部の特定論理構造のみ
をコピーバッファ42に保存する。このとき、文書エデ
ィタ41は、保存するものがどのような文書部品である
かの情報を付加する。図19は、コピーバッファ内に格
納されるデータ形式を模式的に示したものである。図に
おいて、内容識別番号51には、内容データが枠構造で
あるとか、章・節構造であるというような情報が格納さ
れている。この内容識別番号51とプロセスID52で
共通部分が構成される。個別情報53には、内容データ
のコピー範囲に関する情報が任意のバイトストリームで
記述されている。内容データ54には、ユーザにより選
択された範囲の論理構造に関する情報が任意のバイトス
トリームで記述されている。
【0072】ユーザはコピーバッファにある文書部品を
サーバ装置に保管しようとするウィンドウ上において、
「ペースト」キーの押下げ等の手段により保存アプリケ
ーションに対して通知を発行する。通知を受けた保存ア
プリケーションは、コピーバッファに保存されている文
書部品を取り出し、それに付加されている部品の情報を
もとに解析を行い、インデックスに登録する。そして、
一時的に保存されていたコピーバッファ上の文書部品を
改めてサーバ装置に保管する。
【0073】図20は、WYSIWYGウィンドウ(文
書を印刷イメージに近い状態で表示したウィンドウ)に
より表示されたコピー元の文書例を示している。図20
の文書において、ユーザがカーソルを使用して枠を選択
したとすると、選択された領域の白黒が反転し、図21
に示すような状態となる。このときの論理構造を模式図
で表すと図22のようになる。図中、斜線の部分が選択
されている領域(この例では枠)を表している。このと
き、コピーバッファに格納されるデータを図23に示
す。このように、枠や見出し、あるいは単一の段落など
の共通論理構造に定義されている構造が選択されている
場合には、共通論理構造で定義される構造がコピーバッ
ファに格納される。
【0074】図24は、図20の文書から章・節を選択
したときの状態を示している。ここでは、ユーザが見出
しウィンドウ上でカーソルを使用して2.1節の見出し
構造を選択した例を示している。このときの論理構造を
図25に、コピーバッファに格納されるデータを図26
に示す。
【0075】サーバ装置に保管される文書部品は特定論
理構造で定義されている構造単体で構成されているとは
限らないので、文書部品の内部を解析し、登録が行われ
る文書部品の構造をすべて特定し、その構造情報及び物
理的な位置情報をインデックス内に保管する。登録が行
われた文書部品は文書としての構造は保持せず、図19
で示したコピーバッファ中の「内容データ」そのままの
形式で保存される。
【0076】次に、文書部品の保存を行うときの処理の
流れを図27のフローチャートにより説明する。
【0077】まず、文書エディタ上でのコピー操作によ
り選択された文書の一部の特定論理構造のデータをコピ
ーバッファに格納し(ステップ701)、保存アプリケ
ーションシステムに対してペーストのイベント発生した
かどうかを判断する(ステップ702)。ここで、ペー
ストのイベント発生したときは、コピーバッファ内の内
容識別情報を取り出し(ステップ703)、保存が可能
な文書部品であるかどうかを判断する(ステップ70
4)。保存が可能でなければ処理を終了し、保存可能で
あるならば、データの付加情報をユーザから受け取る
(ステップ705)。ここでは、名称やキーワード等の
付加情報があれば、それを保存データに付加する。そし
て、コピーバッファ内の内容データと内容識別番号をサ
ーバ装置に保管する(ステップ706)。
【0078】「Copy/Pasteキー」により文書
部品を保管したときの例を図28に示す。ユーザが文書
エディタ上のウィンドウで枠を選択し、Copyキーを
押下すると、文書部品はコピーバッファに一時的に保存
される。ここで、保存アプリケーションのウィンドウを
開いてPasteキーを押下して保存アプリケーション
へのイベントを通知すると、文書部品はサーバ装置に保
管される。
【0079】したがって、インデックスに登録されてい
る文書部品のデータを、保存アプリケーションにより文
書エディタのコピーバッファにそのまま記述することに
より、登録時と逆の手順で登録された文書部品を文書エ
ディタ内にそのまま取り込むことが可能となる。すなわ
ち、ユーザは保存アプリケーションのウィンドウ上にお
いて、リストされている文書部品の項目中から目的とす
る文書部品を選択し、「コピー」キー等を押下すること
により、文書エディタのコピーバッファにその内容を記
述し、文書エディタ上でのペースト処理により保存アプ
リケーションで保存されていた文書部品の内容を取り込
むことができる。
【0080】次に、文書部品の取り出しを行うときの処
理の流れを図29のフローチャートにより説明する。
【0081】まず、保存アプリケーションのウィンドウ
上でコピーイベントの発生を受け付け(ステップ80
1)、サーバ装置から該当する文書部品の内容識別情報
と内容データを取り出す(ステップ802)。そして、
取り出した情報を文書エディタのコピーバッファに書き
込む(ステップ803)。
【0082】「Pasteキー」により文書部品を取り
出したときの例を図30に示す。ユーザが保存アプリケ
ーションのウィンドウ上で枠を選択し、Copyキーを
押下することにより、保存アプリケーションへの取り出
しイベントが通知される。文書エディタのコピーバッフ
ァには、保存アプリケーションで保存していた文書部品
のデータが記入される。ここで、文書エディタのウィン
ドウを開き、ペースト処理により文書部品を文書内に取
り込む。
【0083】このとき、登録されている文書部品には割
り付け構造が保存されていないため、取り込み先の文書
エディタの割付け構造に従った割付け処理が実行される
ことになり、取り込み先に合わせた柔軟な割付け処理が
可能となる。
【0084】実施例4のシステムによれば、正しい文書
としての体裁を整えていない枠や見出しなどの文書部品
を、単独で保存/取り出しすることができる。このた
め、サーバ装置内で統一的に管理されている文書部品を
多数の利用者によって共用することが可能となり、従来
に比べて文書作成をより効率良く行うことができる。
【0085】
【発明の効果】以上説明したように、第1の発明に係わ
る構造化文書の文書部品管理装置によれば、ユーザが指
定した文書あるいは文書部品を解析して、文書部品を構
成する論理構造をすべて特定し、その構造情報および物
理的な位置情報をインデックス内に保管するようにした
ため、文書の内部構造を文書としては不完全な形式で保
存することができる。また、インデックス内部に文書構
造が保持されているため、文書の内部構造を条件とした
検索を行うことができる。
【0086】また、第2の発明に係わる構造化文書の文
書部品管理装置によれば、文書部品単位に属性としてキ
ーワード集合を設定し、また文書部品単位にキーワード
集合を対応させて保持するようにしたので、文書部品作
成時に文書部品個別にキーワード集合を設定することが
できるうえ、文書部品を組み合わせて用いても、適切な
キーワード集合を自動的に設定することができる。ま
た、キーワードの設定が登録作業者に依存しなくなるた
め、データベースの品質を向上させることができる。さ
らに、登録管理者が文書作成者と異なる場合に、個々の
文書のキーワード設定の管理を行わなくてすむという利
点がある。
【0087】さらに、第3の発明に係わる構造化文書の
文書部品管理装置によれば、受け付けた文書部品に参照
があるか否かを判断し、参照があると判断された場合に
は、例外処理を行うようにしたので、文書部品管理デー
タベース内に参照文書・部品を持つことがない。このた
め、参照の多層化による関係の複雑さが解消され、更新
のタイミングによる内容の不整合を防ぐことができる。
【図面の簡単な説明】
【図1】実施例1における文書部品管理装置の機能的な
構成を示すブロック図。
【図2】図1に示した文書部品管理装置を実現するため
のハードウェア構成を示した図。
【図3】文書部品管理装置で使用する共通論理構造(見
出しの論理構造)を示す図。
【図4】文書部品管理装置で使用する共通論理構造(本
文中の枠の論理構造)を示す図。
【図5】文書部品管理装置で使用する共通論理構造(入
れ子枠の論理構造)を示す図。
【図6】文書部品の解析とインデックス登録の処理の流
れを示すフローチャート。
【図7】文書部品構造の解析とインデックスの構築処理
の流れを示すフローチャート。
【図8】文書部品論理対象体の処理の流れを示すフロー
チャート。
【図9】枠構造の処理の流れを示すフローチャート。
【図10】インデックスの構造を示す図。
【図11】文書部品の論理構造図とインデックスとの関
係を示す図。
【図12】実施例2における文書部品管理装置の機能的
な構成を示すブロック図。
【図13】キーワード集合を合成する処理の流れを示す
フローチャート。
【図14】実際の文書に対してキーワード集合の合成処
理を実行したときの例を示す図。
【図15】実施例3における文書部品管理装置の機能的
な構成を示すブロック図。
【図16】参照判断手段と例外処理手段の機能を説明す
る図。
【図17】参照文書部品を登録する場合の処理の流れを
示すフローチャート。
【図18】実施例4における文書部品管理システムの機
能的な構成を示すブロック図。
【図19】コピーバッファ内に格納されるデータ形式を
模式的に示した図。
【図20】WYSIWYGウィンドウにより表示された
コピー元の文書例を示す図。
【図21】領域が選択されたときの表示状態を示す図。
【図22】領域が選択されたときの論理構造を示す模式
図。
【図23】コピーバッファに格納されるデータを示す
図。
【図24】文書から章・節を選択したときの表示状態を
示す図。
【図25】章・節が選択されたときの論理構造を示す
図。
【図26】コピーバッファに格納されるデータを示す
図。
【図27】文書部品の保存を行うときの処理の流れを示
すフローチャート。
【図28】「Copy/Pasteキー」により文書部
品を保管したときの例を示す図。
【図29】文書部品の取り出しを行うときの処理の流れ
を示すフローチャート。
【図30】「Pasteキー」により文書部品を取り出
したときの例を示す図。
【図31】ODAの文書構造を示す図。
【図32】文書処理モデルを示す図。
【符号の説明】
10…文書部品管理装置、11…文書部品受付手段、1
2…論理構造特定手段、13…文書部品保持手段、14
…インデックス生成手段、15…インデックス保持手
段、24…キーワード属性付加手段、28…キーワード
集合合成手段、32…参照判断手段、33…例外処理手
───────────────────────────────────────────────────── フロントページの続き (72)発明者 東道 徹也 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】処理内容とともに文書の少なくとも一部を
    処理対象として受け付けて論理的構造を持つ構造化文書
    を編集処理する文書処理装置とともに利用される構造化
    文書の文書部品管理装置であって、 登録要求とともに処理対象を文書部品として文書処理装
    置から受け付ける文書部品受付手段と、 前記受け付けた文書部品を解析して論理構造を特定する
    論理構造特定手段と、 前記文書部品を1以上保持する文書部品保持手段と、 前記特定した論理構造のインデックスを生成するインデ
    ックス生成手段と、 前記生成されたインデックスを1以上保持するインデッ
    クス保持手段と、 を有する構造化文書の文書部品管理装置。
  2. 【請求項2】前記文書部品にキーワードを対応させて保
    持するキーワード保持手段と、 前記文書部品のキーワードを表示するキーワード表示手
    段と、 前記文書部品のキーワードを設定するキーワード設定手
    段と、 を有する請求項1記載の構造化文書の文書部品管理装
    置。
  3. 【請求項3】前記受け付けた文書部品に参照があるか否
    かを判断する参照判断手段と、 前記参照判断手段により参照があると判断された場合
    に、例外処理を行う例外処理手段と、 を有する請求項1または請求項2記載の構造化文書の文
    書部品管理装置。
JP28180792A 1992-10-20 1992-10-20 構造化文書の文書部品管理装置 Expired - Fee Related JP3659595B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28180792A JP3659595B2 (ja) 1992-10-20 1992-10-20 構造化文書の文書部品管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28180792A JP3659595B2 (ja) 1992-10-20 1992-10-20 構造化文書の文書部品管理装置

Publications (2)

Publication Number Publication Date
JPH06131340A true JPH06131340A (ja) 1994-05-13
JP3659595B2 JP3659595B2 (ja) 2005-06-15

Family

ID=17644266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28180792A Expired - Fee Related JP3659595B2 (ja) 1992-10-20 1992-10-20 構造化文書の文書部品管理装置

Country Status (1)

Country Link
JP (1) JP3659595B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778400A (en) * 1995-03-02 1998-07-07 Fuji Xerox Co., Ltd. Apparatus and method for storing, searching for and retrieving text of a structured document provided with tags

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778400A (en) * 1995-03-02 1998-07-07 Fuji Xerox Co., Ltd. Apparatus and method for storing, searching for and retrieving text of a structured document provided with tags

Also Published As

Publication number Publication date
JP3659595B2 (ja) 2005-06-15

Similar Documents

Publication Publication Date Title
US6169547B1 (en) Method for displaying an icon of media data
JPH01180062A (ja) 文書整形装置
JP2004500645A (ja) ビジュアルデータ形式の記憶と検索
US20070234201A1 (en) Information Management Device
JPH08305616A (ja) データ管理システム
JP2002049907A (ja) デジタルアルバム作成装置およびデジタルアルバム作成方法
JP3356519B2 (ja) 文書情報検索装置
JP3659595B2 (ja) 構造化文書の文書部品管理装置
JP3471389B2 (ja) マルチメディアファイリングシステム
JP2001243248A (ja) 電子ファイリングシステム
JP3183505B2 (ja) 情報処理装置及び情報処理方法
JP4255538B2 (ja) 構造化文書蓄積検索装置
JPH05342265A (ja) マルチメディア管理装置およびそのメディア提示方法
JP2001147922A (ja) 文書管理装置、文書管理方法および記憶媒体
JPS61182131A (ja) 情報検索システム
JP3198941B2 (ja) 情報処理装置及び記録媒体
JP3444620B2 (ja) ファイリングシステム装置
JP3529040B2 (ja) データベース装置、データベース管理方法及びデータベースの管理プログラムを格納する記憶媒体
JP3352709B2 (ja) 文書整形装置および文書整形装置の処理方法
JPH0277872A (ja) 文書処理プログラムを格納した記憶媒体と文書処理装置
JPH0488469A (ja) 経営等管理帳表発行装置
JP2004192221A (ja) 文書検索処理方法及びそれらの装置及びそれらの方法を記録した記録媒体
JPH05282304A (ja) 情報処理装置
JPH0744446A (ja) グループ化情報の関連付け方法
JP2523963B2 (ja) 知識管理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050314

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080325

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090325

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100325

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110325

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees