JPH08190542A - 文書データベース管理装置及び方法 - Google Patents

文書データベース管理装置及び方法

Info

Publication number
JPH08190542A
JPH08190542A JP7000650A JP65095A JPH08190542A JP H08190542 A JPH08190542 A JP H08190542A JP 7000650 A JP7000650 A JP 7000650A JP 65095 A JP65095 A JP 65095A JP H08190542 A JPH08190542 A JP H08190542A
Authority
JP
Japan
Prior art keywords
document
database
rule
class
schema
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7000650A
Other languages
English (en)
Other versions
JP3063555B2 (ja
Inventor
Hisashi Nakatsuyama
恒 中津山
Hitoki Kiyoushima
仁樹 京嶋
Hiroshi Okumura
洋 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP7000650A priority Critical patent/JP3063555B2/ja
Priority to US08/580,688 priority patent/US5802529A/en
Publication of JPH08190542A publication Critical patent/JPH08190542A/ja
Application granted granted Critical
Publication of JP3063555B2 publication Critical patent/JP3063555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文書データの相違に起因する検索漏れ、検索
作業の煩雑化等の問題を解決すること。 【構成】 複数の文書からなるデータベースを管理対象
とする文書データベース管理装置において、データベー
スに格納される文書の論理構造からデータベース中での
文書の論理構造を生成するための規則を保持する生成規
則管理部1−2と、生成規則管理部1−2に保持されて
いる規則に基づいて格納される文書からデータベース中
での文書を生成する文書生成部1−4と、文書生成部1
−4により生成された文書をデータベースに格納する文
書管理部1−3とを具備する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子文書を管理対象と
する文書データベース管理装置に関わる。
【0002】
【従来の技術】ワードプロセッサ等により作成された電
子文書は、デジタルデータとして表現されるので、追
加、削除、変更等の編集を容易に行なうことができ、文
書作成効率を高めることができる。また、複数の電子文
書を大容量の記憶装置に蓄積して文書データベース装置
を構築することにより、キーワード検索等により目的と
する文書を電子的に検索することができる。
【0003】従来の電子文書を管理対象とする文書デー
タベース管理装置では、文書の検索を行なう場合には、
ワードプロセッサ等で作られた文書データそのものを蓄
積し、そのデータを使って検索を行なっていた。
【0004】一方、電子文書の作成や編集作業を容易に
行なえるようにするために、電子文書を構造化すること
が行なわれている。文書の構造は、たとえば、文書を構
成する章、見出し、段落などの要素と、その要素間の関
係についての情報、たとえば、章は、下位構造として見
出しと段落を持つなどについての情報により表される。
【0005】
【発明が解決しようとする課題】本発明が解決しようと
する課題を、文書構造の国際規格であるODA(Off
ice Document Architectur
e)(ISO 8613)とSGML(Standar
d Generalized Markup Lang
uage)(ISO 8879; JIS X415
1)を例にとって説明する。
【0006】先ず、本明細書で使用する用語について説
明する。
【0007】「文書アーキテクチャ」という用語は、文
書を表現する情報構造とする。たとえば、ODAが定め
る情報構造は文書アーキテクチャである。SGMLのサ
ブセッティング(機能の制限)を行ない、使用する文字
コードや図表などに用いる情報構造を定めたものも文書
アーキテクチャである。なお、SGMLについては、た
とえば、Martin Bryan、SGML入門、ア
スキー出版局を参照されたい。
【0008】「文書クラス」という用語は、文書のテン
プレートを示すものとする。文書クラスは、そこから作
られる文書がどのような論理構造をもち得るか、すなわ
ち、論理構造中に現われるノードの種類、各ノードがも
ち得る属性、各ノードがもち得る下位構造を定める。O
DAの共通論理構造(generic logical
structure)や、SGMLをサブセッティン
グした文書アーキテクチャにおけるDTD(Docum
ent Type Definition)は、文書ク
ラスである。
【0009】次に、上述したような、構造化された文書
を検索する場合の問題点について説明する。
【0010】第一の問題は、さまざまな文書アーキテク
チャ、さまざまな文書クラスの電子文書が流通している
現在では、文書データの種類が異なることにより、全文
検索や要素の切り出しができなかったり、効率が低下す
るという不具合が生じることである。
【0011】たとえば、SGMLでは、最小化によって
論理構造の区切りを示すタグが省略されることがある。
このタグが省略された実体参照を含む例をリスト1に示
す。
【0012】 リスト1: 実体参照を含む例 <!doctype doc [ <!element doc − − (p+)> <!element p − O (#PCDATA)> <!entity equal ”=”> ]> <doc> <p>ʸ½ñ &equal ; document.</doc> リスト1中の、 <!doctype doc [ <!element doc − − (p+)> <!element p − O (#PCDATA)> <!entity equal ”=”> ]> という部分がdocという文書型(DTD)の指定で、
角括弧([])で囲まれた部分がDTDである。
【0013】DTDの、 <!element doc − − (p+)> という宣言により、「doc」という構成要素(エンテ
ィティ)が、ひとつ以上の「p」という構成要素の繰り
返しからなる単純な構造をもつことが示される。
【0014】また、 <!element p − O (#PCDATA)> という宣言により、「p」という構成要素がテキストを
内容としてもつことが示される。
【0015】<doc>と</doc>で囲まれた部分
が文書(インスタンス)である。
【0016】リスト1のインスタンスの説明の前に、文
書型docにしたがって生成した別のインスタンスの例
を以下に示す。
【0017】<doc> <p>これは最初の段落です。</p> <p>これは二番めの段落です。</p> <p>これは最後の段落です。</p> </doc> ここで、<doc>、</doc>、<p>、</p>
はタグと呼ばれ、構成要素の区切りを示すために用いら
れる。<doc>、<p>は開始タグと呼ばれ、そこか
ら構成要素の記述がはじまることを示す。</doc
>、</p>は終了タグと呼ばれ、そこで構成要素の記
述が終わることを示す。<doc>と</doc>で囲
まれた部分が「doc」のインスタンスである。また、
<p>と</p>で囲まれた部分が、「p」なる要素で
ある。したがって、この例では3つの段落をもつ文書イ
ンスタンスが記述されていることが分かる。
【0018】ところで、このDTDでは「p」の終了タ
グを省略できるように宣言しているので(<!elem
ent p − O (#PCDATA)>のOで指定
されている)、上記インスタンスは以下のように書くこ
ともできる。
【0019】<doc> <p>これは最初の段落です。
【0020】<p>これは二番めの段落です。
【0021】<p>これは最後の段落です。
【0022】</doc> DTD中の <!entity equal ”=”> により、インスタンスをSGMLパーザ(処理系)で解
析した時に、インスタンス中の &equal; という実体参照が = という文字列に展開されることが宣言される。
【0023】リスト1のインスタンスにある、 ʸ½ñ は文字参照と呼ばれるもので、文字をコードで参照して
いる。&#と;の間の数値が1バイトの文字コードを1
0進で表記したもので、インスタンスをSGMLパーザ
で解析した時に展開される。
【0024】リスト1では、要素pの終了タグが省略さ
れている。論理構造が本来(省略しなかった場合)どの
ようになっているかは自明ではないので、この文書をそ
のまま格納したのでは、この要素を切り出せないことが
ある。省略しなかった場合の例は、後ほどリスト2で示
す。
【0025】また、動的にタグを補完してフルタグ化を
行なうと、検索漏れの恐れはなくなるが、検索にかかる
コストが増大してしまう。
【0026】上記したSGMLには標準の文字コードは
存在せず、文書の構成要素のひとつであるSGML宣言
によって、その文書を記述する文字コードが定まるの
で、文書ごとに文字コードが異なる場合がある。また、
SGML文書の実際の内容である文書インスタンスに
は、実体参照が含まれるので、これらを展開しておかな
いと全文検索時に検索洩れが生じることがある。検索を
行なう時点で、文書の文字コードの変換と、文字参照と
実体参照を展開すれば、検索洩れを防ぎ所望の文書すべ
てを検索することができるが、これでは検索の準備にか
かる時間によって検索効率が低下してしまう。
【0027】リスト1の文書の実体参照を展開し、更に
フルタグ化した例(インスタンスのみ)をリスト2に示
す。
【0028】 リスト2: 実体参照を展開し、フルタグ化した例 <doc> <p>文書 = document.</p> </doc>第二の問題は、文書クラスが表現する文書
構造と、文書クラスを使って文書を書くユーザが意図す
る文書構造には往々にして隔りがあるため、意図する対
象を正しく検索する式を指定するのが難しいことであ
る。この検索の際の問題をリスト3及びリスト4を参照
して説明する。
【0029】 リスト3: DTDの例 <!doctype art1 [ <!element art1 − − (section+)> <!element section − O (para+)> <!element para − O (#PCDATA)> ]> リスト4: DTDの例 <!doctype art2 [ <!element art2 − − (section+)> <!element section − O (title,para+)> <!element title − O (#PCDATA)> <!element para − O (#PCDATA)> ]> リスト3のDTD(Document Type De
finition)は、節(section)からなる
文書である。節は、段落(para)からなる。リスト
4のDTDはやはり節(section)からなるが、
リスト4の節は見出し(title)と段落(par
a)からなっている。このため、リスト4では見出しの
内容に関して検索条件が指定できるが、リスト3で同様
の検索を行なうには、節の先頭の段落に関して検索条件
を指定しなければならない。
【0030】第三の問題は、さまざまな文書クラスの文
書をそのまま使うと、それらが本来はほぼ同じ構造と意
味を持つものであっても、検索対象の文書クラスと同じ
だけ検索式を書く必要があるので、ユーザの意図する文
書を検索するまでに余計な手間と時間がかかることであ
る。以下、この問題をリスト5及びリスト6を参照して
説明する。
【0031】 リスト5: DTDの例 <!doctype base [ <!element base − − (title,author,sec tion+)><!element title − O (#PCDATA) > <!element author − O (#PCDATA)> <!element section − O (secttl,para+) ><!element secttl − O (#PCDATA)> <!element para − O (#PCDATA)> ]> リスト6: DTDの例 <!doctype derived [ <!element derived − − (front,body,ba ck)><!element front − − (title,autho r)> <!element title − O (#PCDATA)> <!element author − O (#PCDATA)> <!element body − O (section+)> <!element section − O (secttl,para+) ><!element secttl − O (#PCDATA)> <!element para − O (#PCDATA)> <!element back − O (ack)> <!element ack − O (#PCDATA)> ]> リスト5のDTDは、題名(title)、著者(au
thor)、節(section)からなる構造を持つ
文書クラスである。リスト6のDTDは、前付(fro
nt)、本文(body)、後付(back)からなる
構造を持つ文書クラスである。前付は題名(titl
e)と著者(author)、本文は節(sectio
n)、後付は謝辞(ack)からなる。このふたつのD
TDは、ともに一般的な記事を表わす文書クラスであ
り、たとえば、著者が特定の人物である、という条件な
らば同時に検索できるはずのものであるが、従来の文書
データベース管理装置では別々に検索することになる。
【0032】以上のように、従来の文書データベース管
理装置では、格納される文書のデータそのものを格納
し、その文書データ自体が持つ情報を使って検索してい
たため、検索漏れがある、意図する対象を正しく検索す
る式を指定するのが難しい、ユーザの意図する文書を検
索するまでに余計な手間と時間がかかる等の不都合があ
った。
【0033】そこで本発明は、文書データを検索するに
際し、煩雑な検索作業を行なうことなく、目的とする文
書データを漏れなく検索することができる文書データベ
ース管理装置及び方法を提供することを目的とする。
【0034】
【課題を解決するための手段】前述の問題を解決するた
め、本発明では、複数の文書からなるデータベースを管
理対象とする文書データベース管理装置において、デー
タベースに格納される文書の論理構造からデータベース
中での文書の論理構造を生成するための規則を保持する
規則保持手段と、前記規則保持手段に保持されている規
則に基づいて格納される文書からデータベース中での文
書を生成する文書生成手段と、前記文書生成手段により
生成された文書をデータベースに格納する文書格納手段
とを具備することを特徴とする。
【0035】
【作用】前述の問題を解決するため、本発明では、文書
スキーマの格納および検索を行なう文書スキーマ管理手
段、文書の格納、検索、取り出しを行なう文書管理手
段、ユーザが検索式を指定する検索式指定手段、文書ク
ラスの格納と検索を行なう文書クラス管理手段、文書ス
キーマと文書クラスを用いて記述される生成規則の格納
と検索を行なう生成規則管理手段、生成規則にしたがっ
て入力となる文書から出力となる文書を生成する文書生
成手段とを備える。
【0036】ユーザが文書をデータベースに格納する際
には、文書管理手段が用いられる。文書管理手段は、文
書生成手段によって、格納される文書から所望の文書ス
キーマの文書を生成し、データベースに格納する。
【0037】文書生成手段は、生成規則管理手段によっ
て検索された生成規則を評価し、格納される文書から所
望の文書スキーマの文書を生成する。
【0038】生成規則は、格納される文書の文書クラス
と文書スキーマとをキーとして検索され、生成規則管理
手段によってそこに保持されている規則群から検索され
る。
【0039】ユーザがデータベースから文書を検索する
際は、検索式指定手段により検索式を指定する。文書管
理手段は、検索式手段より与えらた検索式を評価し、そ
こに格納されている文書から検索式で指定された条件を
満たす文書群を検索する。どの文書クラスで取り出すか
が指定されている場合には、それらの文書から文書生成
手段を用いて所望の文書クラスの文書を生成し、生成さ
れた文書を取り出す。文書クラスが指定されていない場
合には、格納時の文書がそのまま取り出される。
【0040】
【実施例】以下、図面を参照しながら実施例に基づいて
本発明の特徴を具体的に説明する。
【0041】図1は、本発明の第1の実施例である文書
データベース管理装置の構成図である。
【0042】本実施例の文書データベース管理装置は、
複数の文書アーキテクチャの文書を管理対象とする文書
データベース管理装置である。
【0043】先ず、本実施例の文書データベース管理装
置の機能についてその概略を説明する。
【0044】本文書データベース管理装置では、文書の
格納/検索/取り出しができる。また、本文書データベ
ース管理装置では、ユーザが文書の論理構造の生成規則
を定義/登録でき、生成された論理構造にしたがって文
書の検索ができる。
【0045】文書の格納の際は、登録する文書(以降、
外部文書と呼ぶ)から文書(以降、内部文書と呼ぶ)を
生成し、その結果を外部文書、および文書データベース
管理装置内で一意な識別子とともに格納する。以降、本
文書データベース管理装置で文書という場合は、外部文
書とこの外部文書から生成された内部文書のペアを指
す。
【0046】本文書データベース管理装置では、外部文
書から内部文書を生成するための生成規則定義できる。
【0047】文書の検索の時には、内部文書を使って検
索する。検索の結果、検索条件にマッチした文書の識別
子の集合が得られる。
【0048】ユーザは、検索の結果得られた識別子を持
つ文書の内部文書をブラウズすることができる。
【0049】また、検索の結果得られた識別子を持つ文
書の外部文書を取り出すこともできる。
【0050】本実施例においては、内部文書の形式はテ
キストとする。生成規則の定義によっては、生成された
テキストがSGMLのインスタンスになる場合もある。
【0051】図1は、第1の実施例における文書データ
ベース管理装置の構成を示すブロック図である。図1に
おいて、1−1は、ユーザと本文書データベース管理装
置の対話を行うための入出力制御部である。入出力制御
部1−1は、生成規則を定義するための生成規則定義ユ
ーザインターフェース(図中、u/iで示す)1−1
a、生成規則を格納するための生成規則格納ユーザイン
ターフェース1−1b、文書を格納するための文書格納
ユーザインターフェース1−1e、検索式の定義と検索
を行うための検索ユーザインターフェース1−1c、ユ
ーザが検索結果を見るための検索結果ブラウズユーザイ
ンターフェース1−1d、検索結果の文書の外部文書を
取り出す文書取り出しユーザインターフェース1−1f
からなる。
【0052】1−2は、生成規則を管理する生成規則管
理部である。生成規則管理部1−2には、生成規則が、
その規則が適用される文書アーキテクチャ名とともに格
納されている。生成規則管理部1−2は、生成規則の格
納のための格納部1−2a、生成規則の検索を行うため
の検索部1−2bからなる。
【0053】1−3は、文書を管理する文書管理部であ
る。文書管理部1−3は、文書の格納を行う格納部1−
3a、文書の検索を行う検索部1−3b、文書の取り出
しを行う取出部1−3cからなる。
【0054】1−4は、外部文書から内部文書の生成を
行う文書生成部である。
【0055】〔文書の格納〕次に、上述したデータベー
ス管理装置における文書の格納時の動作を説明する。
【0056】文書の格納時には、ユーザが入出力制御部
1−1から、格納する外部文書、外部文書の文書アーキ
テクチャ名、文書生成に用いる生成規則名を指定する
(この指定を格納指定と呼ぶ)。
【0057】格納指定は、文書管理部1−3に送られ、
文書管理部1−3では、格納指定を文書生成部1−4に
送る。
【0058】文書生成部1−4では、格納指定から内部
文書の作成処理を行う。内部文書の作成処理の詳細を、
図2および図3のフローチャートにしたがって説明す
る。
【0059】格納指定で指定された生成規則が存在する
かどうかを確認する(ステップ2−1,2−2)。これ
は、名前で生成規則を検索して確認する。確認の結果、
生成規則が存在しなければ、文書の格納は失敗であり、
この場合はエラー処理を行なって(ステップ2−8)処
理を終了する。
【0060】生成規則が存在すれば、その生成規則を生
成規則管理部1−2から取り出し、内部文書の生成を行
う(ステップ2−3)。内部文書の生成に失敗したら、
文書の格納は失敗であり、この場合はエラー処理を行な
って(ステップ2−8)処理を終了する。
【0061】図4は、生成規則の例である。この規則は
共通論理構造を有する任意のODA文書の特定論理構造
に適用可能である。タグ名は、特定論理構造のノードで
ある論理オブジェクトの属性”object clas
s”から、共通論理構造のノードである論理オブジェク
トクラスを特定し、その論理オブジェクトクラスの属
性”user−visible name”の値を用い
るよう記述されている。また、タグは省略せず、開始タ
グと終了タグを生成するよう記述されている。
【0062】つぎに、外部文書のルートノードを選択し
(ステップ2−5)、ノードの処理を行なう(ステップ
2−6)。
【0063】ノードの処理は、図3のように、左深さ優
先で論理構造の木をたどりながら行なう。
【0064】まず、現在選択されているノードについ
て、開始タグの処理を行なう(ステップ3−1)。開始
タグを生成するよう生成規則に書かれている場合には、
指定された方法でタグ名を決定し、開始タグを生成す
る。開始タグを生成しないよう書かれていれば、ここで
は何もしない。現在選択されているノードがテキスト内
容を持っていれば(ステップ3−2)、内部文書のテキ
スト内容としてコピーする(ステップ3−3)。
【0065】現在選択されているノードが子ノードを持
っていれば(ステップ3−4)、長子を選択し(ステッ
プ3−5)、再帰的にそのノードの処理を行なう(ステ
ップ3−6)。子ノードなければ、終了タグを生成する
よう生成規則に書かれている場合には終了タグを生成し
(ステップ3−9)、制御をこのルーチンを呼び出した
ところに戻す(ステップ3−10)。
【0066】現在選択されているノードに弟ノードがあ
れば(ステップ3−7)、それを選択し(ステップ3−
8)、再びノードの処理を呼び出す(ステップ3−
6)。弟ノードがなければ、終了タグを生成するよう生
成規則に書かれている場合には終了タグを生成し(ステ
ップ3−9)、制御をこのルーチンを呼び出したところ
に戻す。
【0067】図5は、ODA文書の例である。ノードは
論理オブジェクトで、ノードの中の文字列はそのノード
が指す論理オブジェクトクラスの属性”user−vi
sible name”の値である。ODA文書の場
合、基本論理オブジェクトに付随する内容部の内容体系
が文字内容であれば、テキスト内容を持つ。ノードの傍
にある文字列は、そのノードのテキスト内容である。
【0068】この文書では、ルート(art)が2つの
ノード(frontおよびbody)を持っている。前
付(front)は、題名(title)と著者(au
th)を持っている。著者はさらに、名前(name)
と所属(aff)からなる。本文(body)は、ひと
つの節(sec)を持つ。節(sec)は、節見出し
(secttl)と段落(para)を持っている。
【0069】図2および図3のフローチャートにしたが
って、つまり左深さ優先でこの文書をたどると、訪れる
ノードの順は、art,front,title,au
th,name,aff,body,sec,sect
tl,paraとなる。実際にテキスト内容を持ってい
るのは、リーフノードであるtitle,name,a
ff,secttl,paraで、内容は順に、’da
tabase’,’anonymous’,’unkn
own’,’Abstract’,’We first
describe...’である。
【0070】したがって、図4の規則にしたがって図2
および図3の手順で処理すると、以下のようなSGML
文書が生成される。
【0071】 リスト7: 図5の外部文書(ODA文書)から生成された内部文書 <art> <front> <title>database</title> <auth> <name>anonymous</name> <aff>unknown</aff> </auth> </front> <body> <sec> <secttl>Abstract</secttl > <para>We first describe ...</para> </sec> </body> </art> 図6は、生成規則のもうひとつの例である。この生成規
則は、外部文書のテキスト内容だけを取り出して内部文
書を生成するものである。この生成規則を図5の外部文
書に適用して得られる内部文書をリスト8に示す。
【0072】リスト8: 図5の外部文書(ODA文
書)から生成された内部文書 database anonymous unknown Abstract We first describe... 〔文書の取り出し〕次に、本文書データベース管理装置
における文書の取り出し時の動作を説明する。
【0073】文書の取り出し時には、ユーザが、入出力
制御部1−1から、取り出す文書の識別子と、内部文書
と外部文書のいずれを一方、または両方を取り出すか指
定する(これを取り出し指定と呼ぶ)。
【0074】取り出し指定は文書管理部1−3に送ら
れ、文書管理部1−3が内部文書と外部文書の一方また
は両方を取り出す。
【0075】図7は、本発明の第2の実施例である文書
データベース管理装置の構成図である。
【0076】第2の実施例の文書データベース管理装置
の機能の概略について説明する。
【0077】第2の実施例の文書データベース管理装置
では、文書の取り得る論理構造の枠組が定義された文書
クラスを持つ文書の格納/検索/取り出しができる。ま
た、第2の文書データベース管理装置では、ユーザが文
書の論理構造の枠組を文書スキーマとして定義/登録で
き、登録された文書スキーマにしたがって文書の検索が
できる。
【0078】文書の格納の際は、登録する文書(以降、
外部文書と呼ぶ)からいずれかの文書スキーマにしたが
った文書(以降、内部文書と呼ぶ)を生成し、その結果
を外部文書、および文書データベース管理装置内で一意
な識別子とともに格納する。以降、第2の文書データベ
ース管理装置で文書という場合は、外部文書と外部文書
から生成された内部文書のペアを指す。
【0079】外部文書から内部文書を生成するために、
外部文書の文書クラスを登録できる。また、特定の文書
クラスの外部文書から、特定の文書スキーマの内部文書
を生成するための規則(生成規則と呼ぶ)を定義/登録
できる。
【0080】文書の検索の時には、内部文書を使って検
索する。検索の結果、検索条件にマッチした文書の識別
子の集合が得られる。
【0081】ユーザは、検索の結果得られた識別子に対
応する内部文書をブラウズすることができる。また、検
索の結果得られた識別子に対応する外部文書を取り出す
こともできる。また、内部文書から登録済み文書クラス
の外部文書を生成し、その結果を取り出すこともでき
る。特定の文書スキーマの内部文書から特定の文書クラ
スの外部文書を生成するための生成規則が定義/登録で
きる。
【0082】図7において、7−1は、ユーザと本文書
データベース管理装置の対話を行うための入出力制御部
である。入出力制御部7−1は、文書スキーマを定義す
るための文書スキーマ定義ユーザインターフェース(図
中、u/iで示す)7−1a、文書スキーマを格納する
ための文書スキーマ格納ユーザインターフェース7−1
b、文書クラスを格納するための文書クラス格納ユーザ
インターフェース7−1c、生成規則を定義するための
生成規則定義ユーザインターフェース7−1d、生成規
則を格納するための生成規則格納ユーザインターフェー
ス7−1e、文書を格納するための文書格納ユーザイン
ターフェース7−1h、検索式の定義と検索を行うため
の検索ユーザインターフェース7−1f、ユーザが検索
結果を見るための検索結果ブラウズユーザインターフェ
ース7−1g、検索結果の文書の外部文書を取り出す文
書取り出しユーザインターフェース7−1iからなる。
【0083】7−2は、文書スキーマを管理する文書ス
キーマ管理部である。文書スキーマ管理部7−2には、
文書スキーマがその名前とともに格納されている。文書
スキーマ管理部7−2は、文書スキーマの格納のための
格納部7−2a、文書スキーマの検索を行うための検索
部7−2bからなる。
【0084】7−3は、文書クラスを管理する文書クラ
ス管理部である。文書クラス管理部7−3には、文書ク
ラスがその名前とともに格納されている。文書クラス管
理部7−3は、文書クラスの格納のための格納部7−3
a、文書クラスの検索を行うための検索部7−3bから
なる。
【0085】7−4は、生成規則を管理する生成規則管
理部である。生成規則管理部7−4には、生成規則が、
その規則が適用される文書クラスの名前と、文書スキー
マの名前、および該生成規則が格納用か取り出し用かの
指定とともに格納されている。生成規則管理部7−4
は、生成規則の格納のための格納部7−4a、生成規則
の検索を行うための検索部7−4bからなる。
【0086】7−5は、文書を管理する文書管理部であ
る。文書管理部7−5は、文書の格納を行う格納部7−
5a、文書の検索を行う検索部7−5b、文書の取り出
しを行う取出部7−5cからなる。
【0087】7−6は、外部文書から内部文書の生成、
あるいは内部文書から外部文書の生成を行う文書生成部
である。文書生成部7−6は、外部文書の文書構造を解
析して内部文書と同じ形式(内部形式と呼ぶ)の文書に
する外部文書解析部7−6a、内部形式の文書から外部
文書を作成する外部文書作成部7−6b、生成規則に従
って既存の内部形式の文書から新しい内部形式の文書を
作成する内部形式文書変換部7−6cからなる。
【0088】〔文書の格納〕次に、上述した第2の実施
例のデータベース管理装置における文書の格納時の動作
を説明する。
【0089】文書の格納時には、ユーザが入出力制御部
7−1から、格納する外部文書、該外部文書の文書クラ
ス名、該外部文書から生成される内部文書の文書スキー
マ名が指定(これを格納指定と呼ぶ)される。
【0090】格納指定は、文書管理部7−5に送られ、
文書管理部7−5では、格納指定を文書生成部7−6に
送る。
【0091】文書生成部7−6では、格納指定に従って
内部文書の作成処理を行う。内部文書の作成処理の詳細
を、図8のフローチャートにしたがって説明する。
【0092】まず、格納指定で指定された文書スキーマ
名を持つ文書スキーマが存在するかどうかを確認する
(ステップ8−1,8−2)。文書スキーマの存在は、
文書スキーマ管理部7−2で、格納指定で指定された文
書スキーマ名を持つ文書スキーマを検索して確認する。
確認の結果、文書スキーマが存在しなければ、文書の格
納は失敗であり、この場合はエラー処理を行なって(ス
テップ8−10)処理を終了する。
【0093】文書スキーマの存在が確認できた後(ステ
ップ8−2)、格納指定で指定された文書クラスが存在
するかどうかを確認する(ステップ8−3,8−4)。
文書クラスの存在は、文書クラス管理部7−3で、格納
指定で指定された文書クラス名を持つ文書クラスを検索
して確認する。
【0094】確認の結果、文書クラスが存在しなけれ
ば、文書の格納は失敗であり、この場合はエラー処理を
行なって(ステップ8−10)処理を終了する。
【0095】文書クラスの存在が確認できた後(ステッ
プ8−4)、格納指定で指定された文書クラス名と文書
スキーマ名を持つ格納用の生成規則が存在するかどうか
を確認する(ステップ8−5)。生成規則の存在は、生
成規則管理部7−4で、格納指定で指定された文書クラ
ス名と文書スキーマ名を持つ格納用の生成規則を検索し
て確認する。確認の結果、生成規則が存在しなければ、
文書の格納は失敗であり、この場合はエラー処理を行な
って(ステップ8−10)処理を終了する。
【0096】生成規則が存在すれば、その生成規則を生
成規則管理部から取り出し(ステップ8−7)、内部文
書の生成を行う(ステップ8−8)。
【0097】内部文書の生成に失敗したら(ステップ8
−9)、文書の格納は失敗であり、この場合はエラー処
理を行なって(ステップ8−10)処理を終了する。
【0098】内部文書は、外部文書解析部7−6aで外
部文書を解析して内部形式の文書を作成した後、内部形
式文書変換部7−6cによって該内部形式の文書から生
成される。
【0099】外部文書解析部7−6aは、外部文書の形
式に応じて適当な既存技術で構成すればよい。たとえ
ば、外部文書の形式がLL(1)文法の範疇のものであ
れば、佐々正孝著,”岩波講座ソフトウェア科学5 プ
ログラミング言語処理系”,岩波書店,1989の p
p.137−144に記載されている再帰降下構文解析
の技術を使えばよい。
【0100】内部形式文書変換部7−6cでは、外部文
書解析部7−6aで作成された内部形式の文書のルート
の要素から要素の変換の処理を再帰的に実行することに
よって内部形式文書全体の変換が行われる。要素の変換
の処理の詳細を図21のフローチャートにしたがって説
明する。
【0101】要素の処理は生成中の内部形式の文書の既
に生成済みのどれかの要素をParent Nodeと
して処理が始まる。ただし、処理する要素がルートの場
合は、Parent Nodeは未定として処理が始ま
る。生成規則に従って、処理する要素の変換後の要素種
を決定する(ステップ21−1)。要素種が決定できな
い場合(ステップ21−2)、処理中の要素がルートな
らば(ステップ21−7)、文書構造の生成はエラーと
なる(ステップ21−8)。処理中の要素がルートでな
ければ、該要素の子供の要素についての処理に移る(ス
テップ21−9)。
【0102】要素種が決定できたら(ステップ21−
2)、該種類の要素を生成する(ステップ21−3)。
新しい要素の生成後、処理中の要素がルートでなければ
(ステップ21−4)、生成された要素をParent
Nodeに末子として連結する(ステップ21−
5)。処理中の要素がルートの場合は(ステップ21−
4)、連結は行わない。その後、生成された要素を新し
いParent Nodeにする(ステップ21−
6)。
【0103】ここで、処理中の要素が子供の要素をもた
なければ(ステップ21−9)、制御をこのルーチンを
呼び出したところに戻す(ステップ21−14)。処理
中の要素が子供の要素を持つ場合には(ステップ21−
9)、処理中の要素の長子を選択し(ステップ21−1
0)、選択された要素に対して再帰的に処理を行う(ス
テップ21−11)。この呼び出された処理のPare
nt Nodeは、呼び出した処理の呼び出した時点で
のParent Nodeである。その後、処理中の要
素が弟の要素を持たなければ(ステップ21−12)、
制御をこのルーチンを呼び出したところに戻す(ステッ
プ21−14)。処理中の要素が弟の要素を持つ場合に
は(ステップ21−12)、処理中の要素の直後の弟を
選択し(ステップ21−13)、選択された要素に対し
て再帰的に処理を行う(ステップ21−11)。この呼
び出された処理のParent Nodeは、呼び出し
た処理の呼び出した時点でのParent Nodeで
ある。
【0104】図9は、本文書データベース管理装置の文
書クラス管理部に「文書クラスC1」という名前で格納
されている文書クラスの例である。矩形で囲まれている
のは、文書構造中に出現する要素の種類である。要素種
間を結んでいるリンクとOPT、REP、CHO、SE
Qは、文書構造がとりえる木構造を制約している。その
意味は、”ISO/IS 8613, Informa
tion Processing − Text an
d Office System − Office
Document Architecture (OD
A) andInterchange Format,
Part 2, Annex B”に記載されている
ものと同じである。概略を説明すると、OPTは下位の
構造が0回又は1回出現することを示し、REPは下位
の構造が1回以上出現することを示し、CHOは直下に
示される構造のどれか一つが出現することを示し、SE
Qは直下に示される構造の全てが示された順に出現する
ことを示す。
【0105】図10は、本文書データベース管理装置の
文書スキーマ管理部7−2に「文書スキーマS」という
名前で格納されている文書スキーマの例である。図の内
容の意味は、図9と同じである。
【0106】図11は、生成規則の例である。該生成規
則は、図9の文書クラスの外部文書から、図10の文書
スキーマの内部文書を生成するためのものであり、生成
規則管理部7−4に、「文書クラスC1」という文書ク
ラス名と「文書スキーマS」という文書スキーマ名、お
よび該生成規則が格納用であることを示す情報とともに
格納されている。
【0107】生成規則は、既存の内部形式の文書の要素
についての条件を示した条件部と、該条件に適合した要
素が新しく生成される内部形式の文書においてどのよう
な種類の要素になるかを指定した要素種部からなる規則
の列である。図11の生成規則の規則1では、既存の内
部形式の文書の要素の内、要素種がrootであるもの
は、新しく生成される内部形式の文書において、要素種
がROOTである要素になることを示している。生成規
則は、図21のステップ21−1で要素種を決定する際
に利用される。要素種の決定では、生成規則の最初の規
則から順に、規則の条件が処理中の要素にマッチするか
どうかを調べ、最初にマッチした規則の要素種を、変換
後の要素種とする。
【0108】図12は、本文書データベース管理装置の
文書クラス管理部7−3に「文書クラスC2」という名
前で格納されている文書クラスのもうひとつの例であ
る。図の内容の意味は、図9と同じである。
【0109】図13は、生成規則のもうひとつの例であ
る。該生成規則は、図12の文書クラスの外部文書か
ら、図10の文書スキーマの内部文書を生成するための
ものであり、生成規則管理部7−4に、「文書クラスC
2」という文書クラス名と「文書スキーマS」という文
書スキーマ名、および該生成規則が格納用であることを
示す情報とともに格納されている。
【0110】図14は、図9の文書クラスの外部文書の
例である。図14において、文書構造の各要素は、その
要素種と識別のための数字の連結で示されている。
【0111】本文書データベース管理装置において、図
14の外部文書の格納を、「文書クラスC1」とい文書
クラス名と「文書スキーマS」という文書スキーマ名と
ともに指定すると、文書生成部7−6において、図11
の生成規則に基づいて、図15の内部文書が生成され、
文書管理部7−5の格納部7−5aで、図14の外部文
書と図15の内部文書がペアで格納される。
【0112】図15において、内部文書の各要素は、そ
の要素種と識別のための数字の連結で示されている。ま
た、丸括弧で囲んで示しているのは、その要素がペアの
外部文書のどの要素に対応するかを示している。
【0113】図16は、図12の文書クラスの外部文書
の例である。図の内容の意味は、図14と同じである。
【0114】本文書データベース管理装置において、図
16の外部文書の格納を、「文書クラスC2」とい文書
クラス名と「文書スキーマS」という文書スキーマ名と
ともに指定すると、文書生成部7−6において、図13
の生成規則に基づいて、図18の内部文書が生成され、
文書管理部7−5の格納部7−5aで、図16の外部文
書と図17の内部文書がペアで格納される。
【0115】図17において、内部文書の各要素は、そ
の要素種と識別のための数字の連結で示されている。図
の内容の意味は、図15と同じである。
【0116】本文書データベース管理装置では、外部文
書の文書クラスは違っても、内部文書の文書スキーマは
同一にすることができる。たとえば、図14と図16の
外部文書は、その文書クラスは違うが、ともに「文書ス
キーマS」の内部文書とともに格納される。
【0117】この機能によって、文書クラスが表現可能
な文書構造と、文書クラスを使って文書を書くユーザの
意図が違っている場合に、文書をユーザの意図にマッチ
した文書スキーマに登録することができる。文書の検索
の際には、内部文書を対象に検索が行われる。したがっ
て、文書クラスの違う文書でも同じ文書スキーマの文書
として検索式が定義でき、文書クラス毎の検索式の書き
わけは不要になる。
【0118】〔文書の取り出し〕次に、上述した第2の
実施例のデータベース管理装置における文書の取り出し
時の動作を説明する。
【0119】文書の取り出し時には、ユーザが入出力制
御部7−1から、取り出す文書の識別子、該識別子を持
つ文書の文書スキーマ名が指定される。もし、識別子に
対応する外部文書とは別の外部文書として取り出したい
場合には、取り出したい外部文書の文書クラス名がさら
に指定される。これらの指定を取り出し指定と呼ぶ。取
り出し指定は、文書管理部7−5に送られる。
【0120】文書管理部7−5では、取り出し指定で文
書クラスが指定されていない場合、その取り出し指定で
指定された識別子に対応する外部文書を入出力制御部7
−1に送る。取り出し指定で文書クラスが指定されてい
る場合には、取り出し指定を文書生成部7−6に送る。
【0121】文書生成部7−6では、取り出し指定に従
って、取り出し指定で指定された識別子に対応する内部
文書から外部文書の作成処理を行う。
【0122】外部文書の作成処理は、格納指定に従った
内部文書の作成処理とほぼ同様である。外部文書の作成
処理の詳細を図8のフローチャートにしたがって説明す
る。
【0123】まず、取り出し指定で指定された文書スキ
ーマ名を持つ文書スキーマが存在するかどうかを確認す
る(ステップ8−1,8−2)。文書スキーマの存在
は、文書スキーマ管理部7−2で、取り出し指定で指定
された文書スキーマ名を持つ文書スキーマを検索して確
認する。 確認の結果、文書スキーマが存在しなけれ
ば、文書の取り出しは失敗であり、この場合はエラー処
理を行なって(ステップ8−10)処理を終了する。
【0124】文書スキーマの存在が確認できた後、取り
出し指定で指定された文書クラスが存在するかどうかを
確認する(ステップ8−3,8−4)。文書クラスの存
在は、文書クラス管理部7−3で、取り出し指定で指定
された文書クラス名を持つ文書クラスを検索して確認す
る。
【0125】確認の結果、文書クラスが存在しなけれ
ば、文書の取り出しは失敗であり、この場合はエラー処
理を行なって(ステップ8−10)処理を終了する。
【0126】文書クラスの存在が確認できた後、取り出
し指定で指定された文書クラス名と文書スキーマ名を持
つ取り出し用の生成規則が存在するかどうかを確認する
(ステップ8−5)。生成規則の存在は、生成規則管理
部7−4で、取り出し指定で指定された文書クラス名と
文書スキーマ名を持つ取り出し用の生成規則を検索して
確認する(ステップ8−6)。確認の結果、生成規則が
存在しなければ、文書の取り出しは失敗であり、この場
合はエラー処理を行なって(ステップ8−10)処理を
終了する。
【0127】生成規則が存在すれば、その生成規則を生
成規則管理部から取り出し(ステップ8−7)、外部文
書の生成を行う(ステップ8−8)。
【0128】外部文書の生成に失敗したら(ステップ8
−9)、文書の取り出しは失敗であり、この場合はエラ
ー処理を行なって(ステップ8−10)処理を終了す
る。
【0129】外部文書は、内部形式文書変換部7−6c
によって内部文書から新たな内部形式の文書を生成した
後、外部文書作成部7−6bによって該内部形式の文書
から作成すればよい。
【0130】内部形式文書変換部7−6cにおける内部
形式の文書の生成処理は、図21のフローチャートに示
したものと同じである。
【0131】外部文書作成部における内部形式の文書か
らの外部文書の作成は、本発明の第1の実施例に記載さ
れた技術が利用できる。内部形式の文書を外部形式の文
書に変換するための図4のような生成規則を用意してお
き、内部形式の文書に対して、図3のフローチャートに
示す処理を施せば、外部文書を生成することができる。
【0132】図18は、本文書データベース管理装置の
文書クラス管理部7−3に「文書クラスC3」という名
前で格納されている文書クラスのもうひとつの例であ
る。図の内容の意味は、図9と同じである。
【0133】図19は、生成規則のもうひとつの例であ
る。該生成規則は、図10の文書スキーマの内部文書か
ら、図18の文書クラスの外部文書を生成するためのも
のであり、生成規則管理部7−4に、「文書クラスC
3」という文書クラス名と「文書スキーマS」という文
書スキーマ名、および該生成規則が取り出し用であるこ
とを示す情報とともに格納されている。
【0134】本文書データベース管理装置において、図
17の内部文書を持つ文書の取り出しを、「文書クラス
C3」とい文書クラス名と「文書スキーマS」という文
書スキーマ名とともに指定すると、文書生成部におい
て、図19の生成規則に基づいて、図20の外部文書が
生成され、入出力制御部に送られる。図20において、
外部文書の各要素は、その要素種と識別のための数字の
連結で示されている。また、丸括弧で囲んで示している
のは、その要素がもとの内部文書のどの要素に対応する
かを示している。
【0135】このように、本文書データベース管理装置
では、格納された文書を、その外部文書の文書クラスと
は別の文書クラスの外部文書として取り出すことができ
る。
【0136】本文書データベース管理装置では、文書の
取り出しの際に内部文書とともに格納されている外部文
書を取り出すことがあるので、文書の登録の際に外部文
書と内部文書をペアで格納した。もし文書の取り出しを
行わない、あるいは、外部文書の取り出しの際は必ず内
部文書から外部文書を作成するのであれば、内部文書の
み格納するように構成してもよい。
【0137】
【発明の効果】以上のように、本発明では、データベー
スに格納される文書データと、その文書から生成した文
書データを二重化して管理することにより、文書データ
の相違に起因する問題を解決することができる。具体的
には、検索漏れ防止することができ、意図する対象を正
しく検索する式を容易に指定することができ、また、ユ
ーザの意図する文書を検索するまでの手間と時間を削減
することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施例である文書データベー
ス管理装置の構成図である。
【図2】 内部文書の作成処理を示すフローチャートで
ある。
【図3】 内部文書の作成処理の中のノードの処理を示
すフローチャートである。
【図4】 生成規則の例を示す説明図である。
【図5】 ODA文書の例を示す説明図である。
【図6】 生成規則のもうひとつの例を示す説明図であ
る。
【図7】 本発明の第2の実施例である文書データベー
ス管理装置の構成図である。
【図8】 内部文書の作成処理を示すフローチャートで
ある。
【図9】 文書クラスの例を示す説明図である。
【図10】 文書スキーマの例を示す説明図である。
【図11】 生成規則の例を示す説明図である。
【図12】 文書クラスのもうひとつの例を示す説明図
である。
【図13】 生成規則のもうひとつの例を示す説明図で
ある。
【図14】 図9の文書クラスの外部文書の例を示す説
明図である。
【図15】 内部文書の例を示す説明図である。
【図16】 図12の文書クラスの外部文書の例を示す
説明図である。
【図17】 内部文書の例を示す説明図である。
【図18】 内部文書の例を示す説明図である。
【図19】 生成規則のもうひとつの例を示す説明図で
ある。
【図20】 外部文書の例を示す説明図である。
【図21】 内部形式の文書の変換における要素の処理
を示すフローチャートである。
【符号の説明】
1−1…入出力制御部、1−1a…生成規則定義ユーザ
インターフェース、1−1b…生成規則格納ユーザイン
ターフェース、1−1c…検索ユーザインターフェー
ス、1−1d…検索結果ブラウズユーザインターフェー
ス、1−1e…文書格納ユーザインターフェース、1−
1f…文書取り出しユーザインターフェース、1−2…
生成規則管理部、1−2a…格納部、1−2b…検索
部、1−3a格納部、1−3b…検索部、1−3c…取
出部、1−4…文書生成部、7−1…入出力制御部、7
−1a…スキーマ定義ユーザインターフェース、7−1
b…スキーマ格納ユーザインターフェース、7−1c…
文書クラス格納ユーザインターフェース、7−1d…生
成規則定義ユーザインターフェース、7−1e…生成規
則格納ユーザインターフェース、7−1f…検索ユーザ
インターフェース、7−1g…検索結果ブラウズユーザ
インターフェース、7−1h…文書格納ユーザインター
フェース、7−1i…文書取り出しユーザインターフェ
ース、7−2…スキーマ管理部、7−2a…格納部、7
−2b…検索部、7−3…文書クラス管理部、7−3a
…格納部、7−3b…検索部、7−4…生成規則管理
部、7−4a…格納部、7−4b…検索部、7−5…文
書管理部、7−5a…格納部、7−5b…検索部、7−
5c…取出部、7−6…文書生成部
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 9288−5L G06F 15/20 580 L 9194−5L 15/413 310 A (72)発明者 奥村 洋 神奈川県横浜市保土ヶ谷区神戸町134YB Pイーストタワー13F 富士ゼロックス株 式会社内

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】複数の文書からなるデータベースを管理対
    象とする文書データベース管理装置において、 データベースに格納される文書の論理構造からデータベ
    ース中での文書の論理構造を生成するための規則を保持
    する規則保持手段と、 前記規則保持手段に保持されている規則に基づいて、格
    納される文書からデータベース中での文書を生成する文
    書生成手段と、 前記文書生成手段により生成された文書をデータベース
    に格納する文書格納手段とを具備することを特徴とする
    文書データベース管理装置。
  2. 【請求項2】複数の文書からなるデータベースを管理対
    象とする文書データベース管理装置において、 データベースに格納される文書の論理構造がとり得る構
    造を規定する文書クラスを格納する文書クラス格納手段
    と、 データベース中の文書の論理構造が取り得る構造を規定
    する文書スキーマを格納する文書スキーマ格納手段と、 文書クラスと文書スキーマの情報を用いてデータベース
    中での文書の論理構造を生成する規則を格納する生成規
    則格納手段と、 指定された文書クラス及び文書スキーマに基づいて、前
    記生成規則格納手段に格納されている規則を検索する規
    則検索手段と、 指定された文書スキーマに基づいて、前記文書スキーマ
    格納手段に格納されている文書スキーマを検索する文書
    スキーマ検索手段と、 指定された文書クラスに基づいて、前記文書クラス格納
    手段に格納されている文書クラスを検索する文書クラス
    検索手段と、 前記規則検索手段により検索された規則、前記文書スキ
    ーマ検索手段により検索された文書スキーマ及び前記文
    書クラス検索手段により検索された文書クラスに基づい
    て、格納される文書からデータベース中での文書を生成
    する文書生成手段と、 前記文書生成手段により生成された文書をデータベース
    に格納する文書格納手段とを具備することを特徴とする
    文書データベース管理装置。
  3. 【請求項3】データベース中の文書の検索を指定する検
    索指定手段と、 前記検索指定手段の指定に従って、データベースに格納
    されている文書を検索する文書検索手段と、 文書クラスと文書スキーマの情報を用いて文書の論理構
    造を生成する規則を格納する第2の生成規則格納手段
    と、 前記文書検索手段により検索された文書に基づいて、前
    記第2の生成規則格納手段に格納されている規則を検索
    する第2の規則検索手段と、 前記第2の規則検索手段により検索された規則、前記文
    書スキーマ検索手段により検索された文書スキーマ及び
    前記文書クラス検索手段により検索された文書クラスに
    基づいて、前記文書検索手段により検索された文書から
    出力する文書を生成する第2の文書生成手段とを具備す
    ることを特徴とする請求項2記載の文書データベース管
    理装置。
  4. 【請求項4】前記データベースに格納される複数の文書
    は、情報構造を定義する、複数の異なる文書アーキテチ
    ャにより表現されていることを特徴とする請求項1ない
    し請求項3に記載の文書データベース管理装置。
  5. 【請求項5】前記データベースに格納される複数の文書
    は、複数の異なる文書クラスにより表現されていること
    を特徴とする請求項1ないし請求項3に記載の文書デー
    タベース管理装置。
  6. 【請求項6】データベースに格納される文書の論理構造
    からデータベース中での文書の論理構造を生成するため
    の規則を保持する規則保持手段を具備し、複数の文書か
    らなるデータベースを管理対象とする文書データベース
    管理装置における文書データベース管理方法であって、 前記規則保持手段に保持されている規則に基づいて格納
    される文書からデータベース中での文書を生成し、 生成された文書をデータベースに格納することを特徴と
    する文書データベース管理方法。
  7. 【請求項7】データベースに格納される文書の論理構造
    がとり得る構造を規定する文書クラスを格納する文書ク
    ラス格納手段と、 データベース中の文書の論理構造が取り得る構造を規定
    する文書スキーマを格納する文書スキーマ格納手段と、 文書クラスと文書スキーマの情報を用いてデータベース
    中での文書の論理構造を生成する規則を格納する生成規
    則格納手段とを具備し、 複数の文書からなるデータベースを管理対象とする文書
    データベース管理装置における文書データベース管理方
    法であって、 指定された文書クラス及び文書スキーマに基づいて、前
    記生成規則格納手段に格納されている規則を検索する第
    1のステップと、 指定された文書スキーマに基づいて、前記文書スキーマ
    格納手段に格納されている文書スキーマを検索する第2
    のステップと、 指定された文書クラスに基づいて、前記文書クラス格納
    手段に格納されている文書クラスを検索する第3のステ
    ップと、 前記第1のステップにより検索された規則、前記第2の
    ステップにより検索された文書スキーマ及び前記第3の
    ステップにより検索された文書クラスに基づいて、格納
    される文書からデータベース中での文書を生成する第4
    のステップと、 前記第4のステップにより生成された文書をデータベー
    スに格納する第5のステップとよりなることを特徴とす
    る文書データベース管理方法。
  8. 【請求項8】データベース中の文書の検索を指定する検
    索指定手段の指定に従って、データベースに格納されて
    いる文書を検索する第7のステップと、 前記第7のステップにより検索された文書から文書クラ
    スと文書スキーマの情報を用いて、出力する文書の論理
    構造を生成する規則を格納する第2の生成規則格納手段
    に格納されている規則を検索する第8のステップと、 指定された文書スキーマに基づいて、文書スキーマ格納
    手段に格納されている文書スキーマを検索する第9のス
    テップと、 指定された文書クラスに基づいて、文書クラス格納手段
    に格納されている文書クラスを検索する第10のステッ
    プと、 前記第8のステップにより検索された規則、前記第9の
    ステップにより検索された文書スキーマ及び前記第10
    のステップにより検索された文書クラスに基づいて、前
    記第7のステップにより検索された文書から出力する文
    書を生成する第11のステップとよりなることを特徴と
    する請求項7記載の文書データベース管理方法。
  9. 【請求項9】前記データベースに格納されている複数の
    文書は、情報構造を定義する、複数の異なる文書アーキ
    テクチャにより表現されていることを特徴とする請求項
    6ないし請求項8記載の文書データベース管理方法。
  10. 【請求項10】前記データベースに格納される複数の文
    書は、複数の異なる文書クラスにより表現されているこ
    とを特徴とする請求項6ないし請求項8記載の文書デー
    タベース管理方法。
JP7000650A 1995-01-06 1995-01-06 文書データベース管理装置及び方法 Expired - Fee Related JP3063555B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7000650A JP3063555B2 (ja) 1995-01-06 1995-01-06 文書データベース管理装置及び方法
US08/580,688 US5802529A (en) 1995-01-06 1995-12-29 Apparatus and method for document database management of documents having a plurality of document structures

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7000650A JP3063555B2 (ja) 1995-01-06 1995-01-06 文書データベース管理装置及び方法

Publications (2)

Publication Number Publication Date
JPH08190542A true JPH08190542A (ja) 1996-07-23
JP3063555B2 JP3063555B2 (ja) 2000-07-12

Family

ID=11479595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7000650A Expired - Fee Related JP3063555B2 (ja) 1995-01-06 1995-01-06 文書データベース管理装置及び方法

Country Status (2)

Country Link
US (1) US5802529A (ja)
JP (1) JP3063555B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08339370A (ja) * 1995-06-14 1996-12-24 Fuji Xerox Co Ltd 文書表示装置および文書表示方法
US6108676A (en) * 1996-10-28 2000-08-22 Fuji Xerox Co., Ltd. Document processing apparatus, document type determining method, and hierarchical regular expression determining method

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3063555B2 (ja) 1995-01-06 2000-07-12 富士ゼロックス株式会社 文書データベース管理装置及び方法
ATE208515T1 (de) * 1996-02-05 2001-11-15 Decamps Viviane Renee Verfahren zur verwendung eines computers zum verwalten des informationsaustausches zum erstellen von formularen
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
JPH10307816A (ja) * 1997-05-08 1998-11-17 Just Syst Corp 構造化文書処理装置、構造化文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CA2242158C (en) * 1997-07-01 2004-06-01 Hitachi, Ltd. Method and apparatus for searching and displaying structured document
US6182092B1 (en) * 1997-07-14 2001-01-30 Microsoft Corporation Method and system for converting between structured language elements and objects embeddable in a document
US6569207B1 (en) * 1998-10-05 2003-05-27 International Business Machines Corporation Converting schemas to component models
JP2000194589A (ja) * 1998-12-28 2000-07-14 Hitachi Ltd 複合デジタルコンテンツの管理方法および複合デジタルコンテンツシステム
JP2000339312A (ja) * 1999-05-31 2000-12-08 Toshiba Corp 文書編集システム及びタグ情報管理テーブル作成方法
US7475334B1 (en) * 2000-01-19 2009-01-06 Alcatel-Lucent Usa Inc. Method and system for abstracting electronic documents
EP1259901A1 (en) * 2000-01-27 2002-11-27 Synquiry Technologies, Ltd Software composition using graph types, graphs, and agents
JP3983961B2 (ja) * 2000-07-18 2007-09-26 株式会社東芝 ディレクトリ情報管理装置及びプログラムを記録したコンピュータ読み取り可能な記録媒体
US20030225853A1 (en) * 2001-10-18 2003-12-04 Wang John Y. Method and system for constructing a database-driven website
US7613994B2 (en) * 2002-05-29 2009-11-03 International Business Machines Corporation Document handling in a web application
GB2390445B (en) * 2002-07-02 2005-08-31 Hewlett Packard Co Improvements in and relating to document storage
US7797626B2 (en) * 2003-02-12 2010-09-14 Sap Ag Managing different representations of information
US20070027828A1 (en) * 2005-03-10 2007-02-01 Kabushiki Kaisha Toshiba File management apparatus
WO2007126320A1 (en) * 2006-04-27 2007-11-08 Ebizdocz Limited Content management system
JP4998237B2 (ja) * 2007-12-06 2012-08-15 富士通株式会社 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
US11475320B2 (en) 2016-11-04 2022-10-18 Microsoft Technology Licensing, Llc Contextual analysis of isolated collections based on differential ontologies
US10885114B2 (en) * 2016-11-04 2021-01-05 Microsoft Technology Licensing, Llc Dynamic entity model generation from graph data
US10614057B2 (en) 2016-11-04 2020-04-07 Microsoft Technology Licensing, Llc Shared processing of rulesets for isolated collections of resources and relationships

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528154A (ja) * 1991-07-24 1993-02-05 Matsushita Electric Ind Co Ltd 文書管理システム構築装置
JPH05225240A (ja) * 1991-09-25 1993-09-03 Fuji Xerox Co Ltd 文書データベース装置
JPH06314278A (ja) * 1993-04-30 1994-11-08 Toppan Printing Co Ltd 文書データ処理システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776958B2 (ja) * 1988-01-11 1995-08-16 株式会社東芝 文書整形装置
US5434962A (en) * 1990-09-07 1995-07-18 Fuji Xerox Co., Ltd. Method and system for automatically generating logical structures of electronic documents
US5513323A (en) * 1991-06-14 1996-04-30 International Business Machines Corporation Method and apparatus for multistage document format transformation in a data processing system
US5438657A (en) * 1992-04-24 1995-08-01 Casio Computer Co., Ltd. Document processing apparatus for extracting a format from one document and using the extracted format to automatically edit another document
FR2698977B1 (fr) * 1992-12-03 1994-12-30 Alsthom Cge Alcatel Système d'information multimédia.
JP3063555B2 (ja) 1995-01-06 2000-07-12 富士ゼロックス株式会社 文書データベース管理装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528154A (ja) * 1991-07-24 1993-02-05 Matsushita Electric Ind Co Ltd 文書管理システム構築装置
JPH05225240A (ja) * 1991-09-25 1993-09-03 Fuji Xerox Co Ltd 文書データベース装置
JPH06314278A (ja) * 1993-04-30 1994-11-08 Toppan Printing Co Ltd 文書データ処理システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08339370A (ja) * 1995-06-14 1996-12-24 Fuji Xerox Co Ltd 文書表示装置および文書表示方法
US6108676A (en) * 1996-10-28 2000-08-22 Fuji Xerox Co., Ltd. Document processing apparatus, document type determining method, and hierarchical regular expression determining method

Also Published As

Publication number Publication date
JP3063555B2 (ja) 2000-07-12
US5802529A (en) 1998-09-01

Similar Documents

Publication Publication Date Title
JPH08190542A (ja) 文書データベース管理装置及び方法
US5752021A (en) Document database management apparatus capable of conversion between retrieval formulae for different schemata
US7797336B2 (en) System, method, and computer program product for knowledge management
JP4189416B2 (ja) 構造化文書管理システム及びプログラム
US5293473A (en) System and method for editing a structured document to modify emphasis characteristics, including emphasis menu feature
US20030074636A1 (en) Enabling easy generation of XML documents from XML specifications
US20020103835A1 (en) Methods and apparatus for constructing semantic models for document authoring
US20050192983A1 (en) Structured data storage method, structured data storage apparatus, and retrieval method
JPH0830620A (ja) 構造検索装置
US7275066B2 (en) Link management of document structures
JPH11242676A (ja) 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体
US20060053169A1 (en) System and method for management of data repositories
JPH01180062A (ja) 文書整形装置
JP3028738B2 (ja) 文書共通論理情報編集装置
JP4247108B2 (ja) 構造化文書検索方法、構造化文書検索装置、及びプログラム
JPH07319918A (ja) 文書検索対象指示装置
JPH06259420A (ja) 文章編集支援装置
JP2006127229A (ja) 構造化文書検索システム、構造化文書検索方法及びプログラム
JP2003281149A (ja) アクセス権限設定方法および構造化文書管理システム
JP3842576B2 (ja) 構造化文書編集方法及び構造化文書編集システム
JP3842572B2 (ja) 構造化文書管理方法および構造化文書管理装置およびプログラム
JP2003288332A (ja) 構造化文書作成支援方法及び構造化文書作成支援システム
JP3156613B2 (ja) 文書編集方式
JP3842574B2 (ja) 情報抽出方法および構造化文書管理装置およびプログラム
JP2004118543A (ja) 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees