JPH0744579A - 論理構造文書検索方式 - Google Patents

論理構造文書検索方式

Info

Publication number
JPH0744579A
JPH0744579A JP6110690A JP11069094A JPH0744579A JP H0744579 A JPH0744579 A JP H0744579A JP 6110690 A JP6110690 A JP 6110690A JP 11069094 A JP11069094 A JP 11069094A JP H0744579 A JPH0744579 A JP H0744579A
Authority
JP
Japan
Prior art keywords
document
logical structure
search
data
access right
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6110690A
Other languages
English (en)
Inventor
Masajirou Iwasaki
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6110690A priority Critical patent/JPH0744579A/ja
Publication of JPH0744579A publication Critical patent/JPH0744579A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Storage Device Security (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 論理構造をもった文書を、自動的に各論理構
造に分解して登録ができ、組織データを組み合わせるこ
とできめ細かなアクセス権の設定を可能とする。 【構成】 入出力部1に入力された文書登録要求は、処
理部2の文書登録処理4で処理され、アクセス権管理5
を介してデータ部6の文書データ7に登録される。ま
た、入出力部1で入力された検索要求は、文書検索処理
部3で処理され、組織データ8のデータを基にアクセス
権管理5でアクセス権をチェックし、文書データ7から
データを検索し、入出力部1に出力する。このような構
成により、論理構造を有する文書を登録する時に、自動
的に論理構造単位に分割し、構造情報と共にデータベー
スに登録し、個々の論理構造単位に構造情報に依存する
検索ができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、論理構造文書検索方式
に関し、より詳細には、文書が各章から構成され、各章
が段落から構成されるというような論理的な構造を有す
る文書を管理する文書検索システムにおける検索及びア
クセス権に係る論理構造文書検索方式に関する。
【0002】
【従来の技術】文書の記憶及び管理を行う文書データベ
ース管理システムにおけるアクセス権管理方式は、例え
ば、特開平2−266445号公報に提案されている。
この公報のものは、データベース管理手段が文書データ
格納手段へのアクセス権を得るための条件を記憶したア
クセス権管理手段を有し、該アクセス権管理手段に記憶
された条件を満たした場合は、前記文書データ格納手段
へのアクセスを許可するようにしたものである。すなわ
ち、あらかじめ文書の論理構造の各構造単位にデータが
分割されているデータを記憶し、各構造単位にアクセス
権を設定する方式である。
【0003】
【発明が解決しようとする課題】このような従来の方法
では、文書単位のデータ、または既に文書の構造単位に
分割されているデータを個別にデータベースに記憶する
ことは可能であるが、文書自体が文書構造情報を含む文
書を自動的に論理構造に分割して、登録することができ
ない。また、登録した文書についての論理構造に依存す
る検索を十分ではなく、アクセス権の対象ユーザ及びパ
ーミッションについても細かな設定ができないという問
題点があった。さらに、登録した文書についての論理構
造に依存する検索や文書中で利用されているイメージデ
ータの検索機能が不十分であるという問題点があった。
【0004】本発明は、上述のごとき実情に鑑みなされ
たもので、論理構造をもった文書を自動的に各論理構造
に分解して登録ができ、組織データと組み合わせること
により、きめ細かなアクセス権の設定が可能であるよう
にすること、また、論理構造をもった文書を自動的に各
論理構造に分解し登録ができ、新たに文書タイプを追加
する場合でもスキーマ自体を変更する必要がなく、ま
た、論理構造に関連する検索やイメージの検索を高速に
かつ適切に処理することができるようにした論理構造文
書検索方式を提供することを目的としてなされたもので
ある。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、(1)論理構造(文書は各章から構成さ
れ各章は段落から構成されるというような論理的な構
造)を有する文書を保管検索するデータベースにおい
て、論理構造を有する文書を登録する時に、自動的に論
理構造単位に分割し、構造情報と共にデータベースに登
録し、個々の論理構造単位に構造情報に依存する検索が
できるようにすること、更には、(2)前記文書の論理
構造である木構造での位置情報を各論理構造に付与する
ことにより、該論理構造の木構造に依存する検索を処理
できること、更には、(3)前記論理構造単位にアクセ
ス権情報を設定してアクセス権管理を行なうこと、更に
は、(4)前記(3)において、組織データ(ユーザ、
組織、グループなどの利用者の様々な情報)を管理する
データベースと連動し、該組織データを利用してアクセ
ス権の対象ユーザを設定でき、該対象ユーザを自由に変
更できるようにし、前記組織データの構成が変更されて
もエレメント単位のアクセス権情報形式を変更すること
なく対応すること、更には、(5)前記(4)におい
て、前記アクセス権の対象ユーザが木構造を有する場合
に、該木構造上のあるユーザより上位に位置するユーザ
すべてをアクセス権の対象とするような木構造に依存す
るユーザ指定ができること、更には、(6)前記(3)
において、前記アクセス権の変更をする権限を分離する
ことによりセキュリティを高めること、更には、(7)
前記(3)において、前記各論理構造に付与されている
アクセス権が実際に効力のある実効アクセス権として使
われるのではなく、該実効アクセスの決定ルールが論理
構造単位に設定でき、該決定ルールによって実効アクセ
ス権を決定すること、更には、(8)前記(1)におい
て、前記各論理構造に設定されたアクセス権及び木構造
における他の論理構造のアクセス権との関係により実効
アクセス権が決定されること、(9)論理構造(文書は
各章から構成され各章は段落から構成されるというよう
な論理的な構造)を有する文書(構造化文書)やその文
書から利用されるイメージデータのような文書以外のデ
ータも保管検索できる構造化文書データベースにおい
て、文書論理構造のタイプ(文書タイプ)ごとにスキー
マを作成するのではなく、データベース側では文書論理
構造のタイプを意識せず文書論理構造のタイプの変更及
び拡張に対して柔軟に対応できるように、論理構造の最
小単位である論理構造単位を共通のスキーマとして利用
すること、更には、(10)前記(9)において、構造
化文書の文字データのみを抽出し、文字列検索データベ
ースに抽出した文字データを登録し、検索時に文字列検
索データベースを利用することにより論理構造単位の文
字列検索を可能とすること、更には、(11)前記
(9)において、ある特定の論理構造に包含されるすべ
ての論理構造のデータを対象とした検索を高速化するた
めに、予めシステムに登録した論理構造名が文書中に現
れた場合には、該論理構造及び包含されるすべての論理
構造から文字データを抽出して文字列検索データベース
に登録し、特定の論理構造のデータを検索する時には前
記文字列検索データベースを利用すること、更には、
(12)前記(9)において、イメージデータなどの検
索において、該イメージデータを利用している文書中の
図題及び図の意味を表す文字データを検索することによ
り、前記イメージデータを適切に検索すること、更に
は、(13)前記(9)又は(10)において、文書中
でそのイメージデータに付与されている図題などの文字
データを文書登録時に抽出し、イメージデータの検索用
のインデックスとして登録することにより、イメージデ
ータを高速に検索すること、更には、(14)前記
(9)又は(10)において、イメージデータが複数の
文書から参照されている場合には、参照するすべての文
書中の図題を抽出し、イメージデータの検索用インデッ
クスに付与することにより、イメージデータの検索洩れ
を減らすこと、更には、(15)前記(9)において、
文書(イメージデータなどを含む)が複数の文書から参
照されている場合には、参照数が多いほど重要度(参照
数)が高いと想定し、文書(イメージ)検索時に検索結
果とともに重要度を検索者に提示することで適切な検索
を可能とすることを特徴としたものである。
【0006】
【作用】入出力部に入力された文書登録要求は、処理部
の文書登録処理で処理され、アクセス権管理を介してデ
ータ部の文書データに登録される。また、入出力部で入
力された検索要求は、文書検索処理部で処理され、組織
データのデータを基にアクセス権管理でアクセス権をチ
ェックし、文書データからデータを検索し、入出力部に
出力する。このような構成により、論理構造を有する文
書を登録する時に、自動的に論理構造単位に分割し、構
造情報と共にデータベースに登録し、個々の論理構造単
位に構造情報に依存する検索ができる。
【0007】また、入出力部に入力された文書登録要求
は、処理部の文書登録処理で処理され、アクセス権管理
を介しデータ部の構造化文書データに登録される。ま
た、入出力部で入力された検索要求は、文書検索処理部
で処理され、組織データのデータを基にアクセス権管理
でアクセス権をチェックし、文書データからデータを検
索し、入出力部に出力する。文書登録処理部及び文書検
索処理部は文字列検索データベースを論理構造検索のた
めに利用する。このような構成により、論理構造をもっ
た文書を自動的に各論理構造に分解し登録ができ、新た
に文書タイプを追加する場合でもスキーマ自体を変更す
る必要がなく、また、論理構造に関連する検索やイメー
ジの検索を高速にかつ適切に処理することができる。
【0008】
【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による論理構造文書検索方式の一
実施例を説明するための構成図で、図中、1は入出力
部、2は処理部、3は文書検索処理部、4は文書登録処
理部、5はアクセス権管理部、6はデータ部、7は文書
データ部、8は組織データ部である。
【0009】入出力部1に入力された文書登録要求は、
処理部2の文書登録処理4で処理され、アクセス権管理
5を介してデータ部6の文書データ7に登録される。ま
た、入出力部1で入力された検索要求は、文書検索処理
部3で処理され、組織データ8のデータを基にアクセス
権管理5でアクセス権をチェックし、文書データ7から
データを検索し、入出力部1に出力する。
【0010】以下に、本発明による論理構造文書検索方
式の各機能について順次説明する。 登録 SGMLなどの文書記述言語では、図2で示すように、
会議開催通知は件名、作成者、記事から構成され、さら
に、記事は日時、場所、主催から構成されるというよう
な文書の論理構造を記述できる。このような論理構造を
もつ文書を登録する時に、自動的に論理構造単位(エレ
メント)に分解し、それぞれをデータベースに登録す
る。登録時に各エレメントに付与される情報には次のよ
うなものがある。
【0011】・エレメントの名前:件名、作成者など ・エレメントの内容:件名の内容、作成者の名前など ・エレメントのID ・パーミッション(アクセス権情報) ・親エレメントの名前 ・親エレメントID ・エレメントパス したがって、これらの情報により、エレメント単位に検
索が可能である。
【0012】検索 前述のエレメントごとに付与されている情報により、例
えば、作成者がXXXさんの文書を検索したい場合に
は、エレメントの名前が“作成者”で、エレメントの内
容が“XXX”であるエレメントを検索することができ
る。また、各エレメントは木構造を構成することができ
るように親エレメントのIDをもつので、親エレメント
のIDを辿ることによって木構造に依存する検索が可能
であるが、検索速度は遅い。そこで本発明は木構造に依
存する検索を高速に処理できるように、各エレメントは
エレメントパスを有する。エレメントパスとは木構造の
ルートのエレメントから辿ったパスである。エレメント
パスは、UNIXのディレクトリ指定と同様に“/”で
各エレメントが区切られている。例えば、図2の“場
所”のエレメントパスは“/会議開催通知/記事/場
所”となる。このエレメントパスを利用して高速に検索
ができる。
【0013】アクセス権情報 各エレメント(論理構造単位)はアクセス権情報(パー
ミッション)を有し、エレメント単位にアクセス権の管
理が可能である。アクセス権情報は次のような情報から
なり、各エレメントに複数のアクセス権情報を設定でき
る。 ・パーミッション対象ユーザ指定 −オブジェクトID:組織データのオブジェクトを示す
ID。 −メンバID:オブジェクト内での個々のメンバを示す
ID。 −対象ユーザ集合決定ルール:パーミッション対象ユー
ザの集合を決定するルール
【0014】・パーミッション:エレメントに与えられ
るパーミッション。次のようなパーミッションがある。 −読出し −更新 −パーミッション読出し −パーミッションの更新 −挿入 −削除 実際に有効なパーミッションは、次の実効アクセス権決
定ルールに従い決定する。 ・実効アクセス権決定ルール:実効アクセス権決定ルー
ルに従い、実際に有効なアクセス権が決定される。 それぞれについて以下に詳細に述べる。
【0015】パーミッション対象ユーザ指定 組織データは、図3のような構成を有する。組織データ
で管理されるデータのオブジェクトIDをユーザ=1、
組織=2、グループ=3、部屋=4とする。また、メン
バIDをユーザB=2、A事業部=10とすると、ユー
ザBはオブジェクトID=1、メンバID=2で示され
る。また、A事業部はオブジェクトID=2、メンバI
D=10で示される。
【0016】さらに、対象ユーザ集合決定ルールには次
のようなものがあり、これに従って、最終的な対象ユー
ザが決められる。 オブジェクトID及びメンバIDで指定されたメンバ
に含まれるユーザを対象ユーザ集合とする。 オブジェクトID及びメンバIDで指定されたメンバ
の上位のすべてのメンバに含まれるユーザをすべて対象
ユーザ集合とする。 オブジェクトID及びメンバIDで指定されたメンバ
の下位のすべてのメンバに含まれるユーザをすべて対象
ユーザ集合とする。
【0017】この対象ユーザ集合決定ルールの中からい
ずれかを選択する。例えば、前述のオブジェクトID及
びメンバIDで指定された組織(メンバ)がB事業部
で、メンバ決定ルールがの場合には、A事業部の下の
組織であるB部及びC部も含まれる。したがって、ユー
ザA、ユーザB、ユーザCはアクセス権対象ユーザとな
る(図3)。
【0018】従来のアクセス権管理では対象ユーザが固
定である。例えば、UNIXのファイルシステムではユ
ーザとグループのパーミッションの指定フィールドが固
定になっており、パーミッションの指定に組織を加えよ
うとすることは不可能である。これに対し、対象ユーザ
の指定が前述のパーミッション対象ユーザ指定で自由に
設定できる。また、組織データを利用してアクセス権を
管理することができるので、極めて細かいアクセス権の
設定が可能である。
【0019】パーミッション パーミッションの読み出し、書き込みの権利を文書デー
タの読み出し書き込みの権利と独立し、セキュリティの
向上を図っている。したがって、データの書き込みはで
きるが、パーミッションは変更できないという設定も可
能である。
【0020】実効アクセス権決定ルール 前述のように、各エレメントにはアクセス権が設定され
ているが、実際のアクセス権(実効アクセス権)は木構
造における他のエレメントに付与されているアクセス権
及び各エレメントに付与されている実効アクセス権決定
ルールによって生成される。実行アクセス権決定ルール
には次のようなものがある。 他のエレメントのアクセス権の影響を受けない。 親エレメントのアクセス権が優先される。 子エレメントのアクセス権が優先される。 ルートエレメントのアクセス権が優先される。 実効アクセス権決定ルールが、前記やのような場合
には、エレメントに設定されたアクセス権とは異なり、
木構造での他のエレメントに設定されたアクセス権が実
効アクセス権となることがある。
【0021】このように、エレメント単位に実行アクセ
ス権決定ルールが設定できることにより、例えば、文書
全体のアクセス権を書き込み不可にした場合に、あるエ
レメントは、文書全体のアクセス権の変更に伴い書き込
み不可になるが、あるエレメントは文書全体のアクセス
権に関わらず書き込み可にするという指定が可能であ
る。
【0022】各エレメントには複数のアクセス権情報が
付与でき、パーミッションを決定するために、各アクセ
ス権情報について次のような処理をする。 対象ユーザ決定ルールを基にオブジェクトID及びメ
ンバIDにより組織データベースのデータを検索し、ユ
ーザが含まれているかどうかを調べる。含まれていない
ならば、次のアクセス権情報を調べ、ユーザが含まれる
アクセス権情報が見つかるまで繰り返す。すべてのアク
セス権情報を調べて、ユーザが該当するアクセス権情報
がないならパーミッションがないとする。 エレメントに付与されているパーミッション及びパー
ミッション決定ルールに伴いパーミッションを決定す
る。
【0023】図4は、本発明による論理構造文書検索方
式の他の実施例を説明するための構成図で、図中、11
は入出力部、12は処理部、13は文書検索処理部、1
4は文書登録処理部、15はアクセス権管理部、16は
データ部、17は構造化文書データ、18は組織デー
タ、19は文字列検索データベース、20は非構造化文
書データ、21は論理構造ポインタテーブルである。
【0024】入出力部11に入力された文書登録要求
は、処理部12の文書登録処理部14で処理され、アク
セス権管理部15を介してデータ部16の構造化文書デ
ータ17に登録される。また、入出力部11で入力され
た検索要求は文書検索処理部13で処理され、組織デー
タ18のデータ11を基にアクセス権管理部15でアク
セス権をチェックし、文書データ17からデータを検索
し、入出力部11に出力する。文書登録処理部14及び
文書検索処理部13は文字列検索データベース19を論
理構造検索のために利用する。
【0025】SGMLなどの文書記述言語では、図5に
示すように、会議開催通知は件名、作成者、記事から構
成され、さらに、記事は日時、場所、主催から構成され
るというような文書の論理構造を記述できる。このよう
な論理構造をもつ文書を登録する時に、自動的に論理構
造単位に分解してそれぞれをデータベースに登録する。
各論理構造単位は、図のように包含関係及び順序関係を
示すために相互にポインタをもち、このポインタによっ
て論理構造を構成することができる。また、各論理構造
単位にアクセス権管理のためのパーミッション情報をも
つ。
【0026】文書タイプごとにスキーマを生成するので
はなく、論理構造単位に共通のスキーマ構造を定義する
ことにより、文書のタイプが異なる場合にも新たにスキ
ーマを定義する必要がなく柔軟な構造化文書データベー
スを可能とする。また、論理構造の内容に関する検索を
高速にするために、文書登録時に論理構造単位のデータ
を文字列検索データベースに登録し、検索時には文字列
検索データベースによって高速な検索を実現する。
【0027】しかし、実際には、論理構造単位は包含関
係をもち、論理構造名の本来の文字データは包含されて
いる下位の論理構造単位に含まれている場合が多い。し
たがって、前述の検索だけでは高速な検索ができない。
例えば、論理構造に依存した検索の例として「章」の論
理構造単位に文字列検索を行ないたい場合がある。つま
り「構造化文書」という言葉について検索する時に、ど
の章に出現するかを知りたい場合がある。このような場
合にはすべての論理構造単位のデータをサーチして「構
造化文書」というキーワードがあるか否かを調べなけれ
ばならず、さらに「章」の論理構造は複雑な論理構造単
位から成り立っているので、処理が極めて複雑になり、
検索速度が遅い。
【0028】そこで、検索対象とする論理構造単位を予
めシステムに登録し、文書登録時にその論理構造単位及
び包含される論理構造単位のすべての文字データを文字
列検索データベースにも登録することにより、包含され
る論理構造単位も含め高速に検索することを可能とす
る。
【0029】構造化文書データベースでは構造化文書だ
けでなく、文書中で使われるイメージデータを保管検索
する。これは非構造化文書として、図6に示すように、
構造化文書データベースに蓄えられる。イメージデータ
のみを対象としたデータベースの場合には、通常イメー
ジデータにキーワードを予め付与し、そのキーワードを
基に検索する。しかし、イメージデータにキーワードを
付与する作業を必要とするだけでなく、適切なキーワー
ドが付与されていなければ結局適切な検索ができない。
【0030】構造化文書中で使われるイメージデータ
は、文書中で通常図題などの形でタイトルが付けられて
おり、イメージデータの内容を適切に表現している。し
かも、構造化文書の場合、そのタイトルのデータを抽出
することが容易である。そこで、キーワードを付与する
代わりにタイトルの文字列データをキーワードとして利
用する。
【0031】登録 構造化文書は文書構造の解析を行ない、各論理構造単位
に、図7に示すように文書データベースの論理構造内容
検索データに一文書として登録する。登録したデータベ
ース上の文書IDと論理構造へのポインタのペアを論理
構造ポインタに登録する。そして、文字列検索システム
における文書IDを設定する。さらに、予めシステムに
設定された論理構造単位の高速検索を可能とするため
に、システムに登録されている論理構造名ならばその論
理構造単位に含まれるすべての論理構造単位の文字列を
すべて抽出し、文字列検索システムの特定論理構造内容
検索データに一文書として登録する。登録したデータベ
ース上の文書IDと論理構造へのポインタのペアを論理
構造ポインタテーブルに登録する。そして論理構造デー
タに文字列検索システムにおける文書IDを設定する。
【0032】また、文書中に使われる図などのイメージ
データは、予め構造化文書データベースに登録してお
き、登録時に参照しているイメージデータが存在するな
らそのイメージデータに付与されている図題を抽出す
る。図6に示すように、抽出したデータをイメージデー
タのタイトルデータテーブルに登録する。イメージデー
タが複数の文書から参照される場合には、複数のタイト
ルデータが登録できるようにテーブル形式となってい
る。複数のデータを登録することによって適切な検索を
可能とする。なお、タイトルデータのデータ量が多い場
合には、文字列検索システムに登録することにより、検
索を高速化することができる。
【0033】検索 (1)論理構造名検索 論理構造単位の検索を行なう場合には、論理構造単位名
と論理構造単位データを検索することによって実現でき
る。例えば、作成者が×××さんの文書を検索したい場
合には、論理構造単位の名前が“作成者”で、論理構造
単位の内容が“×××”である論理構造単位を検索すれ
ば良い。
【0034】(2)構造依存検索 また、文書内での構造検索は、前述の包含関係及び順序
関係を示すポインタを辿ることにより、様々な構造依存
の検索が可能である。例えば、章単位に作成者が異な
り、第1章の作成者を検索したい場合には、前述の論理
構造名検索ではすべての作成者が検索されてしまう。そ
こで、ルートの論理構造単位からポインタを辿り1番目
の章の論理構造単位を求め、そこから作成者を辿り検索
する。
【0035】(3)論理構造内容検索 論理構造単位の内容検索としては、例えば、「構造化文
書」という文字列を検索する場合には、文字列検索デー
タベースの論理構造内容検索データにより、「構造化文
書」という文字列を検索して文書IDを得る。この文書
IDにより論理構造ポインタテーブルを引き、結果とし
て「構造化文書」という文字列を含む論理構造が得られ
る。
【0036】(4)特定論理構造内容検索 予めシステムに登録されている論理構造については、特
定論理構造内容検索が可能である。この場合、前述の論
理構造内容検索とは異なり、包含されるすべての論理構
造の文字データが対象となる。論理構造内容検索と処理
は同じである。ただし、文字列検索データベースの特定
論理構造内容検索データを用いる点が異なる。
【0037】(5)イメージデータ検索 イメージデータの検索は任意の文字列を検索語とする。
タイトルデータをサーチし、入力された検索語を含むイ
メージデータを検索結果とする。また、検索結果を表示
する時にイメージデータに付与されているタイトルデー
タの個数(参照する文書数)を重要度とし、重要度の高
い順に検索者に提示する。こうすることによって、検索
者は重要度の高いデータを効率良く検索できる。
【0038】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。 (1)論理構造(文書は各章から構成され各章は段落か
ら構成されるというような論理的な構造)を有する文書
を保管検索するデータベースにおいて、論理構造を有す
る文書を登録する時に、論理構造をもった文書を自動的
に各論理構造に分解して登録ができ、組織データと組み
合わせることによりきめ細かなアクセス権の設定が可能
となる。 (2)論理構造をもった文書を自動的に各論理構造に分
解して登録ができ、新たに文書タイプを追加する場合で
もスキーマ自体を変更する必要がない。また、論理構造
に関連する検索やイメージの検索を高速にかつ適切に処
理することができる。
【図面の簡単な説明】
【図1】 本発明による論理構造文書検索方式の一実施
例を説明するための構成図である。
【図2】 本発明におけるSGML文書の例を示す図で
ある。
【図3】 本発明における組織データの例を示す図であ
る。
【図4】 本発明による論理構造文書検索方式の他の実
施例を説明するための構成図である。
【図5】 本発明におけるSGML文書の他の例を示す
図である。
【図6】 本発明における非構造化文書を示す図であ
る。
【図7】 本発明における論理構造単位検索のためのデ
ータ構造を示す図である。
【符号の説明】
1…入出力部、2…処理部、3…文書検索処理部、4…
文書登録処理部、5…アクセス権管理部、6…データ
部、7…文書データ部、8…組織データ部、11…入出
力部、12…処理部、13…文書検索処理部、14…文
書登録処理部、15…アクセス権管理部、16…データ
部、17…構造化文書データ、18…組織データ、19
…文字列検索データベース、20…非構造化文書デー
タ、21…論理構造ポインタテーブル。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 9194−5L G06F 15/40 320 B

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 論理構造を有する文書を保管検索するデ
    ータベースにおいて、論理構造を有する文書を登録する
    時に、自動的に論理構造単位に分割し、構造情報と共に
    データベースに登録し、個々の論理構造単位に構造情報
    に依存する検索ができるようにしたことを特徴とする論
    理構造文書検索方式。
  2. 【請求項2】 前記文書の論理構造である木構造での位
    置情報を各論理構造に付与することにより、該論理構造
    の木構造に依存する検索を処理できることを特徴とする
    請求項1記載の論理構造文書検索方式。
  3. 【請求項3】 前記論理構造単位にアクセス権情報を設
    定してアクセス権管理を行なうことを特徴とする請求項
    1記載の論理構造文書検索方式。
  4. 【請求項4】 組織データを管理するデータベースと連
    動し、該組織データを利用してアクセス権の対象ユーザ
    を設定でき、該対象ユーザを自由に変更できるように
    し、前記組織データの構成が変更されてもエレメント単
    位のアクセス権情報形式を変更することなく対応するこ
    とを特徴とする請求項3記載の論理構造文書検索方式。
  5. 【請求項5】 前記アクセス権の対象ユーザが木構造を
    有する場合に、該木構造上のあるユーザより上位に位置
    するユーザすべてをアクセス権の対象とするような木構
    造に依存するユーザ指定ができることを特徴とする請求
    項4記載の論理構造文書検索方式。
  6. 【請求項6】 前記アクセス権の変更をする権限を分離
    することによりセキュリティを高めることを特徴とする
    請求項3記載の論理構造文書検索方式。
  7. 【請求項7】 前記各論理構造に付与されているアクセ
    ス権が実際に効力のある実効アクセス権として使われる
    のではなく、該実効アクセスの決定ルールが論理構造単
    位に設定でき、該決定ルールによって実効アクセス権を
    決定することを特徴とする請求項3記載の論理構造文書
    検索方式。
  8. 【請求項8】 前記各論理構造に設定されたアクセス権
    及び木構造における他の論理構造のアクセス権との関係
    により実効アクセス権が決定されることを特徴とする請
    求項1記載の論理構造文書検索方式。
  9. 【請求項9】 論理構造を有する文書やその文書から利
    用されるイメージデータのような文書以外のデータも保
    管検索できる構造化文書データベースにおいて、文書論
    理構造のタイプごとにスキーマを作成するのではなく、
    データベース側では文書論理構造のタイプを意識せず文
    書論理構造のタイプの変更及び拡張に対して柔軟に対応
    できるように、論理構造の最小単位である論理構造単位
    を共通のスキーマとして利用することを特徴とする論理
    構造文書検索方式。
  10. 【請求項10】 構造化文書の文字データのみを抽出
    し、文字列検索データベースに抽出した文字データを登
    録し、検索時に文字列検索データベースを利用すること
    により論理構造単位の文字列検索を可能とすることを特
    徴とする請求項9記載の論理構造文書検索方式。
  11. 【請求項11】 ある特定の論理構造に包含されるすべ
    ての論理構造のデータを対象とした検索を高速化するた
    めに、予めシステムに登録した論理構造名が文書中に現
    れた場合には、該論理構造及び包含されるすべての論理
    構造から文字データを抽出して文字列検索データベース
    に登録し、特定の論理構造のデータを検索する時には前
    記文字列検索データベースを利用することを特徴とする
    請求項9記載の論理構造文書検索方式。
  12. 【請求項12】 イメージデータなどの検索において、
    該イメージデータを利用している文書中の図題及び図の
    意味を表す文字データを検索することにより、前記イメ
    ージデータを適切に検索することを特徴とする請求項9
    記載の論理構造文書検索方式。
  13. 【請求項13】 文書中でそのイメージデータに付与さ
    れている図題などの文字データを文書登録時に抽出し、
    イメージデータの検索用のインデックスとして登録する
    ことにより、イメージデータを高速に検索することを特
    徴とする請求項9又は10記載の論理構造文書検索方
    式。
  14. 【請求項14】 イメージデータが複数の文書から参照
    されている場合には、参照するすべての文書中の図題を
    抽出し、イメージデータの検索用インデックスに付与す
    ることにより、イメージデータの検索洩れを減らすこと
    を特徴とする請求項9又は10記載の論理構造文書検索
    方式。
  15. 【請求項15】 文書が複数の文書から参照されている
    場合には、参照数が多いほど重要度が高いと想定し、文
    書検索時に検索結果とともに重要度を検索者に提示する
    ことで適切な検索を可能とすることを特徴とする請求項
    9記載の論理構造文書検索方式。
JP6110690A 1993-05-25 1994-05-25 論理構造文書検索方式 Pending JPH0744579A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6110690A JPH0744579A (ja) 1993-05-25 1994-05-25 論理構造文書検索方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-146909 1993-05-25
JP14690993 1993-05-25
JP6110690A JPH0744579A (ja) 1993-05-25 1994-05-25 論理構造文書検索方式

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003189518A Division JP2004005714A (ja) 1993-05-25 2003-07-01 論理構造文書検索方式

Publications (1)

Publication Number Publication Date
JPH0744579A true JPH0744579A (ja) 1995-02-14

Family

ID=26450260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6110690A Pending JPH0744579A (ja) 1993-05-25 1994-05-25 論理構造文書検索方式

Country Status (1)

Country Link
JP (1) JPH0744579A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10289143A (ja) * 1997-04-11 1998-10-27 Nekusuto:Kk データベースの情報入力、検索処理方法および格納情報共有方法
US5875441A (en) * 1996-05-07 1999-02-23 Fuji Xerox Co., Ltd. Document database management system and document database retrieving method
JP2000010988A (ja) * 1998-06-19 2000-01-14 Nec Corp 構造化文書検索システム、構造化文書検索方法および構造化文書検索用プログラムを記録した記録媒体
US6838810B1 (en) 1997-03-21 2005-01-04 Chunghwa Picture Tubes, Ltd. Flat-panel display mounting system for portable computer
US7009609B2 (en) 2000-12-22 2006-03-07 Bsp Inc. Method, system, and software for automated generation of graphs from report data
JP2006092022A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd データ管理用コンピュータプログラムならびにデータ管理装置およびそのアクセス制御方法
WO2006051905A1 (ja) * 2004-11-12 2006-05-18 Justsystems Corporation データ処理装置およびデータ処理方法
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
WO2016162961A1 (ja) * 2015-04-08 2016-10-13 株式会社日立製作所 文章検索装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04260945A (ja) * 1991-01-11 1992-09-16 Mitsubishi Electric Corp ファイル・アクセス装置及びファイル・アクセス方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04260945A (ja) * 1991-01-11 1992-09-16 Mitsubishi Electric Corp ファイル・アクセス装置及びファイル・アクセス方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5875441A (en) * 1996-05-07 1999-02-23 Fuji Xerox Co., Ltd. Document database management system and document database retrieving method
US6838810B1 (en) 1997-03-21 2005-01-04 Chunghwa Picture Tubes, Ltd. Flat-panel display mounting system for portable computer
JPH10289143A (ja) * 1997-04-11 1998-10-27 Nekusuto:Kk データベースの情報入力、検索処理方法および格納情報共有方法
JP2000010988A (ja) * 1998-06-19 2000-01-14 Nec Corp 構造化文書検索システム、構造化文書検索方法および構造化文書検索用プログラムを記録した記録媒体
US7009609B2 (en) 2000-12-22 2006-03-07 Bsp Inc. Method, system, and software for automated generation of graphs from report data
JP2006092022A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd データ管理用コンピュータプログラムならびにデータ管理装置およびそのアクセス制御方法
WO2006051905A1 (ja) * 2004-11-12 2006-05-18 Justsystems Corporation データ処理装置およびデータ処理方法
JPWO2006051905A1 (ja) * 2004-11-12 2008-05-29 株式会社ジャストシステム データ処理装置およびデータ処理方法
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
WO2016162961A1 (ja) * 2015-04-08 2016-10-13 株式会社日立製作所 文章検索装置

Similar Documents

Publication Publication Date Title
US5893087A (en) Method and apparatus for improved information storage and retrieval system
JP2896634B2 (ja) 全文登録語検索装置および全文登録語検索方法
US7685136B2 (en) Method, system and program product for managing document summary information
Zloof Office-by-Example: A business language that unifies data and word processing and electronic mail
US6073170A (en) Information filtering device and information filtering method
US6182121B1 (en) Method and apparatus for a physical storage architecture having an improved information storage and retrieval system for a shared file environment
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
US5812995A (en) Electronic document filing system for registering and retrieving a plurality of documents
JP3836928B2 (ja) データベース処理方法
US20060129538A1 (en) Text search quality by exploiting organizational information
US20030101416A1 (en) Creating XML documents
JP2001075969A (ja) 画像管理検索装置、画像管理検索方法及び記憶媒体
JPH0628403A (ja) 文書検索装置
JPH04124774A (ja) 関係データベースにおける階層構造のデータ蓄積方法
JPH0484271A (ja) 文書内情報検索装置
JPH0744579A (ja) 論理構造文書検索方式
EP1383055A2 (en) Map and data location provider
JPH0550774B2 (ja)
JPH0944523A (ja) 関連語提示装置
Bowers et al. Superimposed schematics: Introducing ER structure for in-situ information selections
JP2503333B2 (ja) 全文インデックス検索方法
EP1304630A2 (en) Report generating system
JP4056622B2 (ja) データベース管理装置
JP2004005714A (ja) 論理構造文書検索方式
JP3239845B2 (ja) 全文検索装置および方法