JP2003281149A - アクセス権限設定方法および構造化文書管理システム - Google Patents

アクセス権限設定方法および構造化文書管理システム

Info

Publication number
JP2003281149A
JP2003281149A JP2002087071A JP2002087071A JP2003281149A JP 2003281149 A JP2003281149 A JP 2003281149A JP 2002087071 A JP2002087071 A JP 2002087071A JP 2002087071 A JP2002087071 A JP 2002087071A JP 2003281149 A JP2003281149 A JP 2003281149A
Authority
JP
Japan
Prior art keywords
document
structured
search
structured document
access authority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002087071A
Other languages
English (en)
Other versions
JP3914081B2 (ja
Inventor
Takuya Kanewa
拓也 金輪
Katsuhiko Nonomura
克彦 野々村
Hiroshi Niina
博 新名
Shozo Isobe
庄三 磯部
Masakazu Hattori
雅一 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002087071A priority Critical patent/JP3914081B2/ja
Publication of JP2003281149A publication Critical patent/JP2003281149A/ja
Application granted granted Critical
Publication of JP3914081B2 publication Critical patent/JP3914081B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Storage Device Security (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】アクセス権限を構造化文書の構成要素毎にきめ
細かく設定することが容易に行えるアクセス権限設定方
法およびそれを用いた構造化文書管理システムを提供す
る。 【解決手段】構造化文書データベースからその論理構造
に基づき所望の構成要素を検索するための検索要求文を
用いて検索した結果得られた複数の構成要素を含む検索
結果文書を表示した表示画面上の任意の表示領域が指定
されたとき、その指定された表示領域に表示されている
データに対応する検索結果文書中の第1の構成要素を特
定し、この第1の構成要素に関連付けられた検索要求文
中の第2の記述部分の記述に基づき、構造化文書データ
ベース中の第1の構成要素に対応する第2の構成要素を
検索して、この第2の構成要素に対し、少なくとも該第
2の構成要素にアクセスが制限されるユーザの範囲を定
めてアクセス権限を設定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、異なる文書構造の
複数の構造化文書を、階層化された論理構造を持つ構造
化文書データベースに対するアクセス権限の設定方法に
関する。
【0002】
【従来の技術】XML(eXtensible Mar
kup Language)は、組織内データや、企業
間の交換フォーマットの世界標準として現在注目を浴び
ている。これらXMLで記述された文書(以下、XML
文書と呼ぶ)に構造情報を付加することが可能であり、
構造化文書と呼ばれる。これら構造化文書を格納、検索
を行うためのデータベースの開発が現在進んでいる。構
造化文書をデータベース化することで、データ問合せ言
語(以後、クエリと呼ぶ)によって、データベースから
所望の構造化文書を検索して、それらを合成した新たな
構造化文書(加工された構造化文書)を生成することが
可能となる。例えば、クエリによって、論文データベー
スと従業員データベースの内容から、1つの加工された
構造化文書を作成する、といったことが可能となる。
【0003】構造化文書をブラウザ等に表示するためも
のが、XSL(eXtensible Stylesh
eet Language)に代表されるスタイルシー
トである。XSLはW3Cによって勧告になっているも
ので、これ自体がXMLで記述されている。これは、表
示を規定する言語から成り、主にパターンマッチングに
より表示形式を決定するものである。
【0004】アプリケーションからデータベースを利用
する形式としては以下の手順が一般的である。
【0005】 構造化文書をデータベースに格納する クエリによりこれらデータベースから所望のデータ
を取得する スタイルによりブラウザなどの画面にこれらデータ
を表示させる ここで、クエリとは格納したデータを取得する、という
操作も含む。よって、データベースに格納した文書をそ
のまま表示させたい場合もクエリが発行されていること
になる。
【0006】アプリケーションによっては、構造化文書
の階層構造に応じてアクセス権限を設定できるようにし
たいといった要求が多く発生してくる。例えば、ある構
造化文書中のある1つの要素に対するアクセス権限はユ
ーザA,ユーザBで、他の1つの要素に対してはユーザ
Aだけである、といった文書構造に応じた指定を行いた
いといったことである。
【0007】このようなアクセス権限の設定は、RDB
のようなテーブルとレコード単位でのアクセス権限の設
定でなく、木構造に対するアクセス権限の設定となり、
そのための手法が幾つか提案されている。
【0008】例えば、階層構造に応じたアクセス権限の
設定方法として、PH07−44579がある。これ
は、構造化文書の階層構造ごとにアクセス権限を設定可
能とするもので、アクセス権限の継承等も可能とするも
のである。いわばオブジェクト指向型データに対するア
クセス権限に近い実現方法を示している。アクセス権限
の設定は文書に対して行うことから、格納されている文
書全てに対してアクセス権限を設定しなければならな
い。XMLはスキーマがない場合も許容されるので、ス
キーマに対してアクセス権限を設定するという場合だけ
では不十分である。よって、膨大な数の文書それぞれに
アクセス権限を設定するのは非常に手間が掛かる作業で
ある。また、これは、XML文書に対して直接アクセス
権限を設定するものであるが、XML文書はあくまでデ
ータであり、このデータをどのように使うかはアプリケ
ーション側に依存する場合が多い。
【0009】アプリケーションによっては、同じアクセ
ス権限を持つユーザでも、ある画面ではある要素に対す
る表示を認めず、ある画面では表示を許す、などといっ
た設定を行いたいという要求がある。また、アクセス権
限は同じでも、XML文書そのものの表示は認めない
が、クエリによる集計結果として加工された場合には表
示は可能とするといった設定を行いたい場合もあるであ
ろう。つまり、格納されているXML文書というより
は、前者は表示に対するアクセス権限、後者はクエリに
対するアクセス権限の設定である。
【0010】このように、アプリケーション側にとって
は、表示形式(スタイル)によって表示されたデータに
対する権限をアクセス権限とする場合が多い。スタイル
ごとにアクセス権限を設定しようとしているものとし
て、P2001−22749がある。これは、単に、ユ
ーザIDとスタイルIDを関連付けて管理し、ユーザ毎
にアクセス可能なスタイルを指定するものであり、XM
L文書そのものが持つ文書構造は全く考慮していない。
【0011】また、PH11−25076においては、
構造化文書のアクセス権限設定において、表示部とデー
タ管理部を別に管理し、ユーザに対してアクセス権限の
ある情報だけを提示し、更新を行いたい場合にはその部
分だけの更新を許す構成をとっている。しかし、これも
文書毎にアクセス権限を設定しなければならず、やはり
設定に対する負荷に関する問題が残る。
【0012】RDBのようにスキーマが必須の場合は、
そのスキーマにアクセス権限を設定することなども考え
られるが、XMLはスキーマはあっても良いし、なくて
も良い、などといった特徴や、同じ名前を持つ要素が同
一レベルに複数存在しても良い、などといった特徴があ
り、構造が曖昧になる場合が多い。これらを考えると、
構造化文書の構成要素毎にアクセス権限を設定する必要
性がある。
【0013】また、実際にアクセス権限を設定するの
は、アプリケーションレベルになってからであり、デー
タを作成した段階ではない場合が多い。例えば、同じデ
ータを用いたとしても、ある用途(検索条件)あるいは
スタイル(表示形式)では、ユーザAにはある要素xに
対してアクセス権限を与えるが、別のある用途あるいは
スタイル(表示形式)ではアクセス権限を無くすといっ
た柔軟な処理を行うことも十分考えられる。つまり、ア
プリケーション作成の段階になってアクセス権限を設定
することが多く、その段階でアクセス権限の設定が容易
に行えるような機能が必要となってくる。
【0014】さらに、アプリケーション面から捕らえた
場合、スタイルごと、或いは、用途ごとにアクセス権限
を設定できる機能が望まれる。例えば、スタイルに関し
ていえば、ユーザAに対しては、ある要素xのグラフを
見せるが、ユーザBに対しては、グラフ表示は不可能
で、例えばモザイクをかけて表示する、などといった制
限などである。ただ、ユーザBはグラフとしての表示は
不可能であるが、XMLデータとしてその値を取得する
ことは可能、などといった場合もある。また、クエリに
よって集計された結果はアクセスできるが、それ以外の
個々の文書にはアクセスできない、といったアクセス権
限を設定する場合も考えられる。これらは、データベー
スに格納されている文書に対してのみアクセス権限を持
たせる方法では実現できない。
【0015】
【発明が解決しようとする課題】以上説明したように、
従来からある構造化文書へのアクセス権限の設定方法
は、アクセス権限を構造化文書の構成要素毎に設定する
ことは可能であるが、その設定に手間がかかるという問
題点があった。特に、論理空間を有する構造化文書デー
タベースにおける膨大な量の構造化文書に対して、その
個々の構成要素に対してアクセス権限を設定する手間と
コストは相当大きなものとなる。
【0016】また、構造化文書データベースに格納され
ている構造化文書の構成要素にアクセス権限を設定する
だけでなく、表示形式や用途に応じて(すなわち、スタ
イルシートやクエリに応じて)、構造化文書の構成要素
に対し、異なるアクセス権限を設定するといったきめ細
かなアクセス権限の設定が行えないという問題点があっ
た。
【0017】そこで、本発明は、上記問題点に鑑み、ア
クセス権限を構造化文書の構成要素毎にきめ細かく設定
することが容易に行えるアクセス権限設定方法および構
造化文書管理装置を提供することを目的とする。
【0018】また、構造化文書データベースに格納され
ている構造化文書の構成要素の用途や表示形式(検索結
果として表示する際の表示形式)に応じて、異なる内容
のアクセス権限を設定することが容易に行えるアクセス
権限設定方法および構造化文書管理装置を提供すること
を目的とする。
【0019】
【課題を解決するための手段】本発明は、複数の構造化
文書を格納した階層化された論理構造を持つ構造化文書
データベースの前記論理構造を構成する前記構造化文書
の構成要素に対し、アクセス権限を設定するためのもの
であって、前記構造化文書データベースから前記論理構
造に基づき所望の構成要素を検索するための検索要求文
(クエリ)を用いて検索した結果得られた複数の構成要
素からなる検索結果文書を表示した表示画面上の任意の
表示領域が指定されたとき、その指定された表示領域に
表示されているデータに対応する前記検索結果文書中の
第1の構成要素を特定し、この第1の構成要素に関連付
けられた前記検索要求文中の第2の記述部分の記述に基
づき、前記構造化文書データベース中の前記第1の構成
要素に対応する第2の構成要素を検索して、この第2の
構成要素に対し、少なくとも該第2の構成要素にアクセ
スが制限されるユーザの範囲を定めてアクセス権限を設
定することを特徴とする。
【0020】本発明によれば、ユーザは、検索結果の表
示画面上で、少なくとも所望の表示領域を指定するだけ
で、当該指定された表示領域に表示されているデータに
対応する構造化文書データベース中の所望の構成要素に
アクセス権限の設定が容易に行える。
【0021】また、本発明は、複数の構造化文書を格納
した階層化された論理構造を持つ構造化文書データベー
スの前記論理構造を構成する前記構造化文書の構成要素
に対し、アクセス権限を設定するものであって、前記構
造化文書データベースから前記論理構造に基づき所望の
構成要素を検索するための検索要求文(クエリ)を用い
て検索した結果得られた複数の構成要素からなる検索結
果文書を表示した表示画面上の任意の表示領域が指定さ
れたとき、この指定された表示領域に表示されているデ
ータに関連付けられた、前記検索結果文書を所定の表示
形式で表示するために用いた前記検索結果文書の文書構
造の変換規則(スタイルシート)中の第1の記述部分
と、この第1の記述部分に関連付けられた前記検索結果
文書中の第1の構成要素を抽出し、少なくとも、前記変
換規則中の前記第1の記述部分にアクセス権限を設定す
る第1のレベル(スタイルレベル)と、前記検索要求文
中の、前記第1の構成要素に対応する第2の記述部分に
アクセス権限を設定する第2のレベルと(クエリレベ
ル)、前記第2の記述部分に関連付けられた前記検索要
求文中の第3の記述部分の記述に基づき特定される前記
構造化文書データベース中の前記第1の構成要素に対応
する第2の構成要素にアクセス権限を設定する第3のレ
ベル(データレベル)を含む複数のレベルのうち、ユー
ザにより指定されたレベルに、少なくとも、そのレベル
についてアクセスが制限されるユーザの範囲を定めてア
クセス権限を設定することを特徴とする。
【0022】本発明によれば、ユーザにより所望の表示
領域が指定されると、ユーザにより指定されたレベルに
応じて、該指定された表示領域に対応するスタイルシー
トの記述部分、さらに、それに関連付けられた検索結果
文書中の構成要素、さらに、それに対応するクエリ中の
記述部分、さらにそれに関連付けられた構造化文書デー
タベース中の要素と、順次特定していくことにより、指
定されたレベルにアクセス権限を設定することが容易に
行える。ユーザは、検索結果の表示画面上で、少なくと
も所望の表示領域と、アクセスレベルを指定するだけ
で、構造化文書データベース中の構成要素にアクセス権
限の設定が行える。
【0023】アクセス権限をスタイルシート、クエリと
いったレベルに設定することにより、あるスタイルシー
トを用いていたときには表示されなかったデータが他の
異なるスタイルシートを用いれば表示される、あるクエ
リを用いた検索結果では表示されなかったデータが他の
異なるクエリを用いたときには表示されるといった、柔
軟なアクセス権限の設定が可能になる。また、アクセス
権限をあるクエリレベルで設定すると、このクエリに用
いた結果得られた検索結果文書を表示するためにどのス
タイルシートに利用しても、このアクセス権限が適用さ
れる。また、アクセス権限をデータレベルで設定する
と、このアクセス権限の設定された構成要素を利用する
ためにどのクエリ、どのスタイルシートを用いても、こ
のアクセス権限が適用される。
【0024】クエリレベルでアクセス権限を設定する
と、構造化文書データベース中の構成要素に対し、その
用途に応じてアクセス権限を設定することができる。ま
た、スタイルレベルでアクセス権限を設定すると、構造
化文書データベース中の構成要素に対し、その表示形式
に応じてアクセス権限を設定することができる。
【0025】さらに、前記複数のレベルは、前記構造化
文書データベースに格納されている前記第2の構成要素
を含む構造化文書と同じ文書構造を持つ他の構造化文書
に含まれる前記第2の構成要素の要素名と同じである全
ての構成要素にアクセス権限を設定する第4のレベルを
含むことにより、スタイルシートの記述部分、クエリ中
の記述部分、構造化文書データベース中の前記第2の構
成要素の他に、さらに、当該第2の構成要素を含む構造
化文書と同じ文書構造を持つ他の構造化文書中の当該第
2の構成要素と同じ要素名の要素に対しても、それ対応
のレベル(第4のレベル)を指定するだけで一括してア
クセス権限を容易に設定することができる。
【0026】特に、ユーザにより前記第4のレベルが指
定されたとき、前記第2の構成要素を含む構造化文書と
同じ文書構造を持つ複数の構造化文書が格納されている
前記論理構造に従って指定される前記構造化データベー
スの論理的なエリアに、そのエリア内に格納される構造
化文書が従うべき文書構造を定義した文書構造定義文書
(スキーマ)が存在するときは、当該文書構造定義文書
中の前記第2の構成要素と同じ要素名の構成要素に関す
る記述部分に、前記第2の構成要素と同じ要素名の構成
要素に対する前記アクセス権限を設定するようにしても
よい。
【0027】さらに、前記変換規則(スタイルシート)
は、前記検索結果文書を該検索結果文書の各構成要素の
少なくとも要素値をそれぞれ1つの表示領域で表示する
表示用文書(HTML文書)に変換するためのものであ
って、前記変換規則を用いて前記検索結果文書を表示用
文書に変換する際には、該表示用文書の記述部分と、該
記述部分に関連する前記変換規則中の記述部分との対応
関係を抽出し、前記表示画面上の任意の表示領域が指定
されたとき、該指定された表示領域に表示されているデ
ータに対応する前記表示用文書中の第4の記述部分に対
応する前記変換規則中の前記第1の記述部分を前記対応
関係に基づき抽出することにより、指定された表示領域
に表示されているデータに関連付けられた変換規則中の
第1の記述部分が容易に抽出できる。
【0028】
【発明の実施形態】以下、本発明の実施形態について図
面を参照して説明する。
【0029】構造化文書として、XMLやSGMLなど
で記述した文書が挙げられる。SGML(Standa
rd Generalized Markup Lan
guage)とは、ISO(国際標準化機構)で定めら
れた規格である。XML(eXtensible Ma
rkup Language)とは、W3C(Worl
d Wide Web Consortium)にて定
められた規格である。それぞれ文書を構造化することを
可能とする構造化文書規約である。
【0030】以下、構造化文書として、XMLにて記述
された文書を例に説明を進める。構造化文書の文書構造
を定義したデータ(文書構造定義データ)をスキーマと
呼ぶ。XMLではそのスキーマを定義するためにXML
−SchemaやXDR(XML Data Redu
ced)などのスキーマ言語が提案されている。ここで
は、例えば、XDRでのスキーマを記述する場合を例に
とり説明する。
【0031】スキーマも、本発明の構造化文書管理シス
テムの管理対象の構造化文書であり、従って、スキーマ
文書と呼ぶことがある。スキーマ文書と区別するため
に、特許明細書やメール、週報、広告などの種々雑多な
内容を有す文書をコンテンツ文書と呼ぶこともある。
【0032】本発明の構造化文書管理システムでは、上
記スキーマ文書、上記コンテンツ文書、さらに、後述す
るようなユーザからの検索要求内容を記述したクエリ、
すなわち、クエリ文書も管理対象とし、これらを総称し
て「文書」と呼ぶ。
【0033】以下、特にことわりがない場合、「文書」
と呼ぶときは、コンテンツ文書、スキーマ文書、クエリ
文書を全て指すものとする。
【0034】まず、実施形態の説明を前に、XMLにつ
いて簡単に説明する。
【0035】図3は、XMLで記述された構造化文書の
一例として、「特許」情報の例を示したものである。X
MLやSGMLは、文書の構造の表現にタグが用いられ
る。タグには、開始タグと終了タグがあり、文書構造情
報の構成要素を開始タグと終了タグで囲むことにより、
文書中の文字列(テキスト)区切りと、そのテキストが
構造上どの構成要素に属するのかを明確に記述すること
ができる。
【0036】ここで開始タグとは要素名称を記号
「<」、「>」で閉じたものであり、終了タグとは要素
名称を記号「</」と「>」で閉じたものである。タグ
に続く構成要素の内容が、テキスト(文字列)または子
供の構成要素の繰り返しである。また開始タグには「<
要素名称 属性=“属性値”>」などのように属性情報
を設定することができる。「<特許DB></特許DB
>」のようにテキストを含まない構成要素は、簡易記法
として「<特許DB/>」のように表わすこともでき
る。
【0037】図3に示した文書は、「特許」タグから始
まる要素をルート(根)とし、その子要素として「タイト
ル」、「出願日」、「出願者」、「要約」タグから始ま
る要素集合が存在する。また、例えば、「タイトル」タ
グから始まる要素には「XMLデータベース」といっ
た、1つのテキスト(文字列)が存在する。
【0038】XMLなどの構造化文書は、任意の構成要
素を繰り返し含んでいたり、さらには文書構造があらか
じめ決まっていない(RDB(リレーショナルデータベ
ース)やOODB(オブジェクト指向データベース)の
スキーマでは定義できない)のが普通である。
【0039】図3に示したような構造化文書を論理的に
表現するために、図4に示すようなツリー表現が用いら
れる。ツリーは、ノード(番号が付され、円形で示され
たもの)とアーク(ノードを表す円形間をつなぐデータ
付き線)と四角形で囲まれたテキストから構成されてい
る。
【0040】ノードは文書オブジェクトに対応し、ノー
ドからタグ名や属性名に相当するラベルが付与された複
数のアークが出てきている。そのアークの先は、ノード
または要素値としての文字列(テキスト)である。ノー
ドの中に記載されている英数字(#0、#49)などは
オブジェクトIDである。
【0041】図4に示したツリー構造を図3に示した構
造化文書の文書オブジェクトツリーと呼ぶ。
【0042】図1は、本実施形態に係る構造化文書管理
システムの構成例を示したものである。図1において、
構造化文書管理システムは、大きく分けて、要求制御部
1、アクセス要求処理部2、検索要求処理部3、データ
アクセス部4、文書記憶部5、インデックス記憶部6、
アクセス権限設定管理部201から構成されている。文
書記憶部5、インデックス記憶部6は例えば、外部記憶
装置を用いて構成される。
【0043】図1のシステム構成は、ソフトウエアを用
いて実現可能である。
【0044】なお、アクセス権限設定管理部201につ
いては、後述する(「アクセス権限の設定」参照)。
【0045】要求制御部1は、要求受付部11と結果処
理部12から構成されている。要求受付部11は、ユー
ザからの文書格納や文書取得、文書検索などの要求を受
け付けて、アクセス要求処理部2を呼び出す。結果処理
部12は、アクセス要求処理部2が処理した結果を要求
元のユーザに返す処理を行う。
【0046】アクセス要求処理部2は、ユーザからの文
書格納や文書取得などの要求に対応した複数の処理部か
ら構成されている。つまり、文書格納部21、文書取得
部22、文書削除部23から構成されている。
【0047】文書格納部21は、文書記憶部5中の論理
的な指定エリアに文書を格納する処理を行う。
【0048】文書取得部22は、文書記憶部5中の論理
的なエリアが指定されたときに、その指定エリアに存在
する文書を取得する処理を行う。
【0049】文書削除部23は、文書記憶部5中の論理
的な指定エリアに存在する文書を削除する処理を行う。
【0050】文書記憶部5は、構造化文書データベース
であり、例えば、図8に示すように、文書をUNIX
(登録商標)のディレクトリ構造のように階層的にツリ
ー構造状に格納している。
【0051】図8に示すように、構造化文書データベー
スは、図4に示したような1つの構造化文書のツリー構
造と同様に表現できる。すなわち、任意のノード以下の
部分階層木(部分ツリー)は、構造化文書データベース
から切り出された構造化文書であり、ここでは、これを
文書オブジェクトツリーと呼ぶ。各ノードにはオブジェ
クトIDが割り当てられている。オブジェクトIDは、
構造化文書データベース内ではユニークな数値を持つも
のとする。
【0052】階層木のルートとなるノードには、それが
ルートノードであることを特定するためのオブジェクト
ID「#0」が割り当てられるものとする。
【0053】ルートノード、すなわち、「#0」のノー
ドからは「root」タグを先頭に持つ「#1」のノー
ドへリンクが張られている。「#1」のノードからは、
「特許DB」タグを先頭にもつ「#2」ノードへのリン
クが張られている。「#2」ノードからは、「特許」タ
グを先頭に持つ「#42」ノード、「#52」ノード、
「#62」ノードへのリンクがそれぞれ張られている。
【0054】図3に示した「特許」情報は、「#42」
ノード以下の部分ツリーに対応している。このノードか
らは「タイトル」タグ、「出願者」タグ、「要約」タグ
などを先頭にもつノードへリンクが張られ、末端のノー
ドからは、「XMLデータベース」、「T社」。「XM
Lを統一的に管理するデータベースを提供する…」など
の文字列(要素値)へのリンクが張られている。
【0055】「#52」ノード以下の部分ツリー、「#
62」ノード以下の部分ノードも1つの「特許」情報に
対応する部分である。
【0056】ところで、例えば、「#43」ノードにリ
ンクされた「XMLデータベース」という要素値は、
「#43」ノードと「#value」という特殊なタグ
名で接続されている。このタグ名は、「#」で始まるた
めXML規格においては標準的なタグ名として利用する
ことはできない。
【0057】このような構造化文書データベースの特定
ノードを指定するために構造化文書パスを用いる。構造
化文書パスは「uix://root」から始まる文字
列である。uix(Universal Identi
fier for XML)は構造化文書パスであるこ
とを示す前置文字列である。
【0058】例えば、「uix://root/特許D
B」は、「#1」ノードから「特許DB」が付与された
アークが指し示すノード、つまり「#2」ノードに対応
する。このように「root」から「/」で区切られた
部分文字列をタグ名とみなすことで「#0」ノードから
タグ名の並びに沿って対応するアークを下っていき、そ
の最後のアークが指すノードが、パスの場所を指し示
す。
【0059】例えば、「uix://root/特許D
B/特許」は、「#42」ノード、「uix://ro
ot/特許DB/出願日/年」は、「#45」ノードを
指し示す。
【0060】「#2」ノード以下に、すなわち、「特許
DB」に、複数の「特許」情報を格納する場合には、個
々の「特許」情報を識別するために、構造化文書パスに
インデックス表現が可能である。
【0061】「特許DB」の最初の「特許」情報であれ
ば、「uix://root/特許DB/特許[0]」
となるが、これは「uix://root/特許DB/
特許」と同じとみなす。
【0062】「特許DB」の2番目の「特許」情報であ
れば、「uix://root/特許DB/特許[1]
DB」の5番目の「特許」情報であれば、「uix:/
/root/特許DB/特許[4]」となる。
【0063】インデックス記憶部6には検索時に用い
る、要素名称生起インデックスとデータ生起インデック
スが記憶されている。
【0064】要素名生起インデックスとは構造化文書デ
ータベースに格納されている要素名称のリストと、各要
素名称が先頭にある構造化文書(文書オブジェクトツリ
ー)の位置とを関連付けてインデックスファイル化した
ものである。例えば、図8の構造化文書データベースの
ように、(「特許」情報に対応する)「特許」という要
素名称が「#42」ノード以下の構造化文書、「#5
2」ノード以下の構造化文書、「#62」ノード以下の
構造化文書に存在する場合、これらをインデックス化す
ると、図9に示すように、それらの親ノード、「#2」
ノードが、要素名称生起インデックスファイルに「特
許」キーからのチェーンで格納される。
【0065】このように、親ノードでインデックス化す
ると、インデックスファイルを圧縮することができる。
すなわち、親ノードでインデックス化すれば、子ノード
が増大しようとも、親ノードで代用しているので、チェ
ーンサイズは増大しない。これに対し、実ノードをイン
デックス化すれば「特許」情報の格納数の増大とともに
チェーンサイズはそれに比例して増加してしまう。
【0066】データ生起インデックスとは、構造化文書
データベースに格納されている文字列データのリストと
各文字列データがある構造化文書(文書オブジェクトツ
リー)の位置とを関連付けてインデックスファイル化し
たものである。例えば、図8の構造化文書データベース
のように、「XML」という文字列データ(および、
「XML」という文字列を含む文字列)が「#43」ノ
ード以下の構造化文書、「#49」ノード以下の構造化
文書に存在する場合、これらをインデックス化すると、
図10に示すように、「#43」ノード、「#49」ノ
ードが、データ生起インデックスファイルに「XML」
キーからのチェーンで格納される。
【0067】なお、逆階層インデックスなど、その他の
インデックスファイルを用いてもよい。逆階層インデッ
クスとは、あるノードとその親ノードとの対応を格納し
たものである(あるノードからその親ノードを求めるこ
とができる)。
【0068】文書記憶部5中の論理的な指定エリアと
は、ユーザにより構造化文書パスを用いて指定された文
書の格納場所を指す。構造化文書パス(簡単にパスと呼
ぶことがある)は、ユーザにとって認識可能な表現であ
る。
【0069】図1の説明に戻る。
【0070】データアクセス部4は、文書記憶部5をア
クセスする基本インターフェイスの集合である。データ
アクセス部4は、文書オブジェクトツリー格納部47、
文書オブジェクトツリー削除部48、文書オブジェクト
ツリー取得部49、文書文字列取得部44、パスから文
書オブジェクトツリー取得部45、文書パーサ部46、
合成文書作成部47、インデックス更新部48から構成
される。
【0071】文書オブジェクトツリー格納部41は、文
書記憶部5中の物理的な指定エリアに文書オブジェクト
ツリーを格納する処理を行う。
【0072】文書オブジェクトツリー削除部42は、文
書記憶部5中の物理的な指定エリアに存在する文書オブ
ジェクトツリーを削除する処理を行う。
【0073】文書オブジェクトツリー取得部43は、文
書記憶部5中の物理的な指定エリアに存在する文書オブ
ジェクトツリーを取得する処理を行う。
【0074】文書文字列取得部44は、文書オブジェク
トツリーを構造化文書(XML文書)に変換する処理を
行う。
【0075】パスから文書オブジェクトツリー取得部4
5は、構造化文書パスを解析して文書記憶部5中の物理
的なエリアを特定して、そのエリアに存在する文書オブ
ジェクトツリーを取り出す処理を行う。
【0076】文書パーサ部46は、ユーザにより入力さ
れた構造化文書を読み込んで構文解析して整合性の検査
を行い、さらに文書構造定義データであるスキーマが存
在すれば構造的に妥当かどうかの検証を行う。出力結果
は文書オブジェクトツリーとなる。文書パーサは、通
常、lex(lexical analyzer ge
nerator)といったレキシカルアナライザ(字句
解析を行い,トークンに分解する)とyacc(yet
another compiler compile
r)といったパーサジェネレータを組み合わせて構築す
ることができる。
【0077】合成文書作成部47は、文書格納や文書削
除などをする際に、スキーマに合致しているかどうか検
査しなければならないが、この検査時に必要となるデー
タを作成して出力する。
【0078】インデックス更新部48は、文書格納や文
書削除などにより、構造化文書データベースの格納内容
が更新されるたびに、図9、図10に示した要素名称生
起インデックスとデータ生起インデックスを更新する。
【0079】文書記憶部5中の物理的な指定エリアと
は、ファイルオフセットやオブジェクトIDなどの構造
化文書データベース内ではユニークな文書データの存在
場所を指し示す内部データである。ユーザにとっては認
識不能なデータである。
【0080】文書記憶部5中に格納された文書を検索す
る処理を行う。要求制御部1の要求受付部11でユーザ
からの文書検索の要求が受け付けられると、検索要求処
理部3には、要求受付部11からクエリ言語で記述され
たクエリ文書が入力する。そしてデータアクセス部4を
通してインデックス記憶部6,文書記憶部5にアクセス
し、検索要求に合致する文書集合を取得して、その結果
を結果処理部12を介して出力する。
【0081】図2は、図1に示した構造化文書管理シス
テムの一利用形態を示したもので、図2では、WWW
(World Wide Web)のバックエンドで、
図1に示した構成の構造化文書管理システム100が動
作している場合を示している。
【0082】複数(ここでは、例えば3つ)のクライア
ント端末(例えばパーソナルコンピュータ、携帯通信端
末など)102のそれぞれでWWWブラウザ103が動
作している。ユーザは、各クライアント端末からWWW
サーバ101にアクセスすることにより、構造化文書管
理システム100にアクセスすることができる。WWW
ブラウザ103とWWWサーバ101とは、HTTP
(Hyper TextTransfer Proto
col)で通信している。また、WWWサーバ101と
構造化文書管理システム100とは、CGI(Comm
on Gateway Interface)またはC
OM(Component Object Mode
l)などで通信している。
【0083】ユーザからの文書格納、文書取得、文書検
索などの要求は、WWWブラウザ103から送信され
て、WWWサーバ101を通して構造化文書管理システ
ム100にて受け付けられ、処理された結果は、WWW
サーバ101を通して要求元のWWWブラウザ103へ
返信される。
【0084】以下、図1の構造化文書管理システムの
(1)格納機能、(2)検索機能について詳細に説明す
る。そして、(3)適用例では、概念検索を用いた特許
調査の場合を例にとり説明する。
【0085】(1) 格納機能 図1の構造化文書管理システムにおける格納系のコマン
ドには以下のものがある。
【0086】 insertXML(パス、N番目、XML):文書格納 appendXML(パス、XML) :文書格納 getXML(パス) :文書取得 removeXML(パス) :文書削除 setSchema(パス、スキーマ) :スキーマ格納 getSchema(パス) :スキーマ取得 「insertXML」は、( )内に指定した構造化
文書パス以下のN番目に文書を挿入するコマンド(以
下、簡単に挿入コマンドと呼ぶ)である。
【0087】「appendXML」は、( )内に指
定した構造化文書パス以下の最後に文書を挿入するコマ
ンド(以下、簡単に追加コマンドと呼ぶ)である。
【0088】「getXML」は、( )内に指定した
構造化文書パス以下の文書を取り出すコマンド(以下、
簡単に取得コマンドと呼ぶ)である。
【0089】「removeXML」は、( )内に指
定した構造化文書パス以下の文書(スキーマ文書以外の
文書で、主に、コンテンツ文書)を削除するコマンド
(以下、簡単に削除コマンドと呼ぶ)である。
【0090】「setSchema」は、( )内に指
定した構造化文書パスにスキーマを設定するコマンド
(以下、簡単にスキーマ格納コマンドと呼ぶ)である。
【0091】「getSchema」は、( )内に指
定した構造化文書パスに設定されているスキーマを取り
出すコマンド(以下、簡単にスキーマ取得コマンドと呼
ぶ)である。
【0092】上記コマンドのうち、挿入コマンド、追加
コマンド、スキーマ格納コマンドについての処理はアク
セス要求処理部2の文書格納部21で実行され、取得コ
マンド、スキーマ取得コマンドについての処理は文書取
得部22で実行され、削除コマンドについての処理は文
書削除部23で実行される。
【0093】図5を参照して、構造化文書データベース
の初期状態(図5(a)参照)において、追加コマンド
を実行する場合について説明する。
【0094】図5(a)に示すように、「#0」ノード
と「#1」ノードが「root」アークで接続されてい
る初期状態に対して、 「appendXML(“uix://root”,
“<特許DB/>”)」 を実行した結果、図5(b)に示すように、「#2」ノ
ードと「特許DB」アークが作成される。
【0095】図5(b)に示した状態の構造化文書デー
タベースに対して、取得コマンドを実行する場合につい
て説明する。
【0096】例えば、「getXML(“uix://
root”)」を実行すると、図5(b)の「roo
t」アークが示す「#0」ノード以下の文書オブジェク
トツリーが取り出され、それをXMLの文字列表現に変
換する。その結果、図6に示すように、「<root>
<特許DB/></root>」なる文字列が取り出さ
れる。取得コマンドの処理は、アクセス要求処理部2の
文書取得部22にて実行される。
【0097】次に、図5(b)に示した状態の構造化文
書データベースに対して、図3に示すようなコンテンツ
文書(XML文書)としての「特許」情報を格納するた
めの追加コマンドを実行する場合について説明する。す
なわち、この場合、「appendXML(“uix:
//root/特許DB”,“<特許>…</特許
>”)」を実行する。このコマンド中「“<特許>…<
/特許>”」が、図3に示した「特許」情報に対応す
る。
【0098】上記追加コマンドの処理が実行されると、
図7に示すように、「#2」ノード以下に「#42」ノ
ードをトップとする文書オブジェクトツリー(図4に対
応)が追加される。
【0099】図5(b)に示した状態の構造化文書デー
タベースに対して、次に示すような追加コマンドを3回
繰り返して実行したとする。
【0100】「appendXML(“uix://r
oot/特許DB”,“<特許>…</特許>”)」 上記コマンド中、「<特許>…</特許>」は、図3に
示した文書構造のコンテンツ文書に対応する。
【0101】すると、図8に示すように、「#2」ノー
ド以下に「#42」ノード、「#52」ノード、「#6
2」ノードをトップとする文書オブジェクトツリーが追
加される。
【0102】次に、図8に示した状態の構造化文書デー
タベースに対して、3つの「特許」情報を取り出すため
の取得コマンドを実行した場合について説明する。この
場合、「getXML(“uix://root/特許
DB”)」を実行する。すると、「特許DB」アークが
示す「#2」ノード以下の文書オブジェクトツリーが取
り出され、それをXMLの文字列表現(XML文書)に
変換する。その結果、図11に示すように、「<特許D
B><特許>…</特許><特許>…</特許><特許
>…</特許></特許DB>」なる文字列が取り出さ
れる。
【0103】構造化文書データベースでは、上記の「特
許」情報などのコンテンツ文書(XML文書)の文書構
造を定義したデータ、すなわち、スキーマも管理対象と
する。
【0104】図12は、XML文書の文書構造を定義す
るスキーマの一例を示したものである。ここでは、XM
Lの文書構造定義言語の一つであるXDR(XML−D
ata Reduced)を取り上げる。もちろん、X
ML−Schemaなど他の文書構造定義言語を用いて
もかまわない。
【0105】図12に示したスキーマは、図3に示した
「特許」情報の文書構造をXDRで定義したものであ
る。図12からも容易に分かるとおり、スキーマもXM
L形式の構造化文書である。「Schema」タグから
始まる構成要素から始まり、その子要素として、「El
ementType」タグから始まる要素集合が存在す
る。
【0106】図12に示したスキーマにおいて、例え
ば、最初の「ElementType」タグから始まる
子要素は以下の情報を意味している。
【0107】・「特許」タグを持つ要素の文書構造定義
(「ElementType name=”特許”」)
である。
【0108】・子要素は要素だけ(「content
=”eltOnly”」)である。
【0109】・「タイトル」、「出願日」、「要約」タ
グから始まる子要素から構成される(「element
type=”タイトル”、…」)。さらに、その順番
は一意に決まっている(「order=”se
q”」)。
【0110】・上記「特許」タグから始まる要素の文書
構造定義の他に、「タイトル」「出願者」「要約」
「年」「月」「日」「出願日」の文書構造定義を記述し
ている。すなわち、「出願日」を除く、「タイトル」
「出願者」「要約」「年」「月」「日」タグから始まる
構成要素の子要素はテキストだけと定義されている
(「content=”textOnly”」)。
【0111】・「出願日」タグから始まる構成要素の子
要素は、「年」、「月」、「日」の並びである。
【0112】図8に示した状態の構造化文書データベー
スに対して、図12に示したスキーマ文書を格納するた
めのスキーマ格納コマンドを実行する場合について説明
する。この場合、「setSchema(“uix:/
/root/特許DB”,“<Schema>…</S
chema>”)」を実行する。このコマンド中、
「“<Schema>…</Schema>”」」が図
12に示したスキーマ文書に対応する。
【0113】上記コマンドの実行により、図13に示す
ように、「#2」ノード以下に「#schema」アー
クが追加され、その先には、「#3」ノードをトップノ
ードとする文書オブジェクトツリーが追加される。スキ
ーマ自身がXML文書表現になっているため、前述した
「特許」情報のようなコンテンツ文書格納のケースと同
様にツリー展開可能である。
【0114】図13において、「@name」など
「@」で始まるアークは属性に対応する。タグ名「#s
chema」も「#」、「@」で始まるためXML規格
においては標準的なタグ名として利用することはできな
い。
【0115】「#2」ノード下に図12に示したスキー
マ文書が格納されたことにより、以後、「#2」ノード
以下にこれから格納される文書の文書構造は、図12に
示したスキーマ文書により定義された文書構造に適合す
ることが要求される。すなわち、「#2」ノード以下に
図12に示したスキーマが設定されることになる。
【0116】「#2」ノード以下に図12に示したスキ
ーマが設定されると、図14に示すように、「#2」ノ
ードの文書オブジェクトのファイルには、「#2」ノー
ド以下の文書オブジェクトツリーには、当該スキーマが
存在する旨の属性値がセットされる。
【0117】「#2」ノード以下に図12に示したスキ
ーマが設定された後に、このスキーマで定義された文書
構造に一致する図3に示したような「特許」情報を、図
14に示したように、文書オブジェクトツリーとして構
造化文書データベースに格納したとき、この文書の文書
構造には図12に示したスキーマが存在する旨の属性値
が、当該文書オブジェクトツリーを構成する各文書オブ
ジェクトにセットされる。例えば、当該文書オブジェク
トツリーを構成する各文書オブジェクトのファイルに対
して、スキーマが存在している旨の属性値((例えば、
「スキーマ適合有無」)に「1」がセットされる。図1
4では、スキーマに適合している各文書オブジェクト
(ノード)は2重丸で示している。2重丸で示した各文
書オブジェクトには、その文書オブジェクトに対応した
文書構造定義が存在することになる。
【0118】図15は、各文書オブジェクトのファイル
の内容を概念的に示したもので、例えば、オブジェクト
IDが「#42」の文書オブジェクトのファイルには、
その文書オブジェクトにリンクされている他の文書オブ
ジェクトに関する情報(例えば、アークや、リンク先の
文書オブジェクトへのポインタ値など)とともに、上記
属性値が記述されている。なお、当該文書オブジェクト
に適用するスキーマが存在しないときは、「スキーマ適
合有無」の値は「0」となる。
【0119】図16、図17は、図1の構造化文書管理
システムで、必要に応じて検索で使用される概念階層を
構造化文書で表現した例を示す。図16、図17に示す
「概念」情報はXMLで記述したコンテンツ文書であ
る。
【0120】図16に示した「概念」情報の例は、いわ
ゆる特許調査における特許文書の内容を分類するための
1つの分類軸として用いる「情報モデル」を概念階層で
表現している。「概念」タグで囲まれた「概念」情報
は、入れ子構造を持った文書構造をもっている。つま
り、図16の例では、概念「情報モデル」の子供概念と
して、概念「ドキュメント」、概念「リレーション」、
概念「オブジェクト」が存在している。また、概念「ド
キュメント」の子供概念として、概念「構造化訴求メン
ト」、概念「非構造化ドキュメント」が存在し、さら
に、概念「構造化ドキュメント」の子供概念として、概
念「XML」、概念「SGML」が存在している。
【0121】図17に示す「概念」情報の記述例は、図
16とは異なる分類軸「情報操作」を概念階層で表現し
ている。図17の例では、概念「情報操作」の子供概念
として、概念「検索」、概念「格納」、概念「加工」、
概念「流通」が存在している。
【0122】図16,図17に示したような「概念」情
報も、前述の「特許」情報と同様にして、構造化文書デ
ータベース内に格納することができる。すなわち、例え
ば、まず、図8に示した状態の構造化文書データベース
に対して、「appendXML(“uix://ro
ot”,“<概念DB/>”)」を実行して、図18に
示すように、「#201」ノードと「概念DB」アーク
が作成される。この状態において、図16に示した「概
念」情報を格納する場合には、「appendXML
(“uix://root/概念DB”,“<概念名前
>…</概念>”)」を実行する。このコマンド中
「“<概念名前>…</概念>”」が、図16に示した
「概念」情報に対応する。
【0123】上記追加コマンドの処理が実行されると、
図19に示すように、「#201」ノード以下に「#2
02」ノードをトップとする文書オブジェクトツリーが
追加される。
【0124】以上説明したように、図1の構造化文書管
理システムでは、構造化文書データベース上に登録され
る文書構造が異なる膨大な数のXML文書群(コンテン
ツ文書、スキーマ文書、クエリ文書など)を、図18,
図19に示すように、「root」タグを先頭に持つツ
リー状の1つの巨大なXML文書として取り扱う。その
ため、部分的なXML文書をアクセスするには巨大なX
ML文書に対するパスという文書構造に依存しない統一
的なアクセス手段を用いることにより、幅広くXML文
書を検索したり加工したりすることが可能になる。
【0125】また、構造化文書データベース上の一部に
スキーマを設定することで、格納しようとする文書の文
書構造がそのスキーマにより定義されている文書構造に
一致するか否かの妥当性のチェックが自動的に行なえる
(後述)。
【0126】(1−1)文書格納処理 次に、図1の構造化文書管理システムの文書格納処理動
作について、図20に示すフローチャートを参照して説
明する。
【0127】クライアント端末から構造化文書管理シス
テムに対し、文書格納要求として、挿入コマンド、追加
コマンド、スキーマ格納コマンドのうちのいずれかが送
信されて、要求受付部11にて受け付けられたとき、図
20に示した処理動作を行う。
【0128】クライアント端末の所定の表示装置には、
構造化文書管理システム100(の例えば、要求制御部
1)から提供された、例えば、図31に示すようなユー
ザインターフェイスとしての画面が表示されている。
【0129】図31に示す画面には、構造化文書管理シ
ステム100への操作項目の一覧(メニュー)が表示さ
れている。操作項目として、「XML登録/削除」、
「スキーマ設定」、「XML検索」とがある。
【0130】ユーザが例えば、この画面上で「XML登
録/削除」をマウス等のポインティングデバイスなどを
用いて選択すると、図32に示したような文書の格納/
削除を行うためのユーザインタフェースとしての画面が
表示される。
【0131】図32において、領域W1には、文書構造
化文書データベースの現在のツリー構造の要素名(タグ
名)がユーザが理解可能なように簡略的に表示されてい
る。なお、図32では、上位階層の要素名のみを表示し
ているが、末端の要素名まで表示可能である。また、領
域W2は、構造化文書パスの入力領域であり、領域W1
の表示内容に従って、構造化文書パスを入力するように
なっている。また、領域W3は、格納する文書を入力し
たり、取得した文書を表示するようになっている。
【0132】例えば、構造化文書パスとして「roo
t」を入力する場合には、領域W1の「root」をマ
ウス等で選択すればよい。すると、図32に示すよう
に、領域W2の構造化文書パスの入力領域に「uix:
//root」と表示される。また、新たに、「特許D
B」という要素を追加する場合は、図32に示すよう
に、領域W3に、「特許DB」を入力する。そして、
「登録」ボタンB1を選択すると、クライアント端末か
らappendXML(“uix://root”,
“<特許DB/>”)」なる追加コマンドが構造化文書
管理システムへ送信される。構造化文書管理システムで
は、上記追加コマンドを受け、後述するような処理を実
行した結果、例えば、図5(b)に示すように、「#
2」ノードと「特許DB」アークが作成される。また、
領域W1には、図33に示すように、「root」の下
に「特許DB」が追加表示される。
【0133】さて、ユーザが図34に示したような文書
の格納/削除画面上の領域W3に、例えば、文書「<A
>データ</A>」を入力し(あるいはCD−ROM等
の所定の記録媒体等から読み込むことにより入力し)、
領域W1の「特許[0]」をマウス等で選択すると、構
造化文書パスの入力領域W2に、「uix://roo
t/特許DB/特許[0]」と表示される。そして、
「登録」ボタンB1を選択すると、クライアント端末か
らappendXML(“uix://root”,
“<特許DB/>”)」なる追加コマンドが構造化文書
管理システムへ送信される。
【0134】ここでは、例えば、構造化文書データベー
スが、図14に示した状態のときに、「appendX
ML(“uix://root/特許DB/特許
[0]”,“<A>データ</A>”)」なる追加コマ
ンドを受け付けた場合を例にとり説明する。
【0135】要求受付部11は、上記追加コマンドを受
け付けると、上記追加コマンド中の2つのパラメータで
ある構造化文書パス「uix://root/特許DB
/特許[0]」と文書「<A>データ</A>」(以
下、格納文書と呼ぶ)とを文書格納部21へ渡す(ステ
ップS1)。
【0136】まず、文書格納部21は、文書パーサ部4
6に格納文書を渡す。文書パーサ部46は、格納文書を
読み込んで、構文解析を行い、当該格納文書の文書構造
がXMLにて規定された正しい形式であるか否かの整合
性の検査を行う(ステップS2)。
【0137】この整合性の検査でエラーが見つかれば
(ステップS3)、文書格納部21,結果処理部12を
介して、クライアント端末に「文書格納失敗」の旨のメ
ッセージを返す(ステップS4)。
【0138】整合性の検査でエラーが見つからなけれ
ば、次に、文書格納部21は、パスから文書オブジェク
トツリー取得部45へ構造化文書パスを渡す。パスから
文書オブジェクトツリー取得部45は、構造化文書パス
から文書記憶部5中の物理的なエリアを特定することに
より、そのエリアに存在する構造化文書パスにて表され
たノード(文書オブジェクトOx0)を含む文書オブジ
ェクトツリーを取り出す(ステップS5)。構造化文書
パスの指定が正しければ、文書オブジェクトOx0のオ
ブジェクトIDを取得することができるので(ステップ
S6)、その場合は、ステップS8へ進む。
【0139】例えば、上記追加コマンドの場合、「#4
2」ノードが文書オブジェクトOx0となるので、その
オブジェクトIDとして、「#42」を取得するととも
に、この「#42」ノードを含む文書オブジェクトツリ
ー(例えば、「#42」ノードの全ての子孫ノードと
「#42」ノードと同じ階層にある全ての(兄弟)ノー
ドと、「#42」ノードの親ノードである「#2」ノー
ドとからなる文書オブジェクトツリー)を取得する。
【0140】指定された構造化文書パスからそれに対応
する文書オブジェクトOx0が見つからなければ、エラ
ーとなり(ステップS6)、文書格納部21,結果処理
部12を介して、クライアント端末に「文書格納失敗」
の旨のメッセージを返す(ステップS7)。
【0141】例えば、構造化文書データベースが、図1
8に示した状態のときに、追加コマンドのパラメータと
して、構造化文書パスが「uix://root/その
他」と表されていたとき、これに対応する文書オブジェ
クトは存在しないので、ステップS6でエラーとなり、
ステップS7へ進む。
【0142】次に、ステップS8では、文書オブジェク
トOx0にスキーマが存在するか否かを検査する。この
検査は、前述したように、各文書オブジェクトのファイ
ルに属性値が記述されているので、この値をチェックす
ればよい。文書オブジェクトOx0のもつ「スキーマ適
合有無」の値が「1」のときは、ステップS9へ進む。
【0143】以下、図20のステップS9の処理(合成
文書作成部47の処理)について、図21に示すフロー
チャートを参照して詳細に説明する。
【0144】文書格納部21は、ステップS5で取得し
た文書オブジェクトツリーを合成文書作成部47へ渡
す。
【0145】合成文書作成部47は、この文書オブジェ
クトツリーを文書オブジェクトOx0から遡り、「Sc
hema」タグを子要素として持つ文書オブジェクトO
x1を検索する(ステップS21)。
【0146】例えば、図14に示した構造化文書データ
ベースでは、文書オブジェクトOx0としての「#4
2」ノードの親ノードである「#2」ノードから「Sc
hema」タグをトップ(先頭)にもつノード(「#
3」ノード)へのリンクが張られているので(「Sch
ema」タグを子要素として持つので)、この「#2」
ノードが文書オブジェクトOx1となる。よって、ステ
ップS22をスキップして、ステップS23へ進む。
【0147】この文書オブジェクトOx1から文書オブ
ジェクトOx0、さらに文書オブジェクトOx0からア
ークを辿って、その下流にある、文書オブジェクトの属
性値の値が「1」である全ての子ノードからなる文書オ
ブジェクトツリーOt1を取り出す(ステップS2
3)。
【0148】例えば、上記追加コマンド中のパラメータ
の構造化文書パスが「uix://root/特許DB
/特許[0]」と指定されているとき、文書オブジェク
トツリーOt1は、「#42」ノード〜「#49」ノー
ドから構成されたものとなる(図14参照)。
【0149】次に、ステップS25へ進む。
【0150】ステップS25では、文書オブジェクトツ
リーOt1に格納文書の文書オブジェクトツリーを文書
オブジェクトOx0の子ノードとして挿入する。その結
果得られた新たな文書オブジェクトツリーを文書オブジ
ェクトツリーOt2とする。
【0151】この文書オブジェクトツリーOt2をXM
L文書に変換し、それをテンポラリファイルAに出力す
る(ステップS27)。
【0152】例えば、上記追加コマンド中のパラメータ
の格納文書「<A>データ</A>」の文書オブジェク
トツリー(この場合は、1つの文書オブジェクト)を
「#42」ノード〜「#49」ノードで構成された文書
オブジェクトツリーOt1に「#42」ノードの子ノー
ドとして挿入して得られた合成文書の文書オブジェクト
ツリーOt2をXML文書に変換した結果を図22に示
す。この合成文書は、もともとある「特許」情報に「<
A>データ</A>」というデータを追加したものとな
っている。
【0153】図22に示したXML文書、すなわち、合
成文書がテンポラリファイルAに出力され、テンポラリ
ファイルAに一時格納される。
【0154】一方、スキーマタグ以下の文書オブジェク
トツリーOt3をXML文書に変換して、それをテンポ
ラリファイルBに出力する(ステップS28)。すなわ
ち、テンポラリファイルBには、スキーマ文書が一時格
納されることになる。
【0155】例えば、文書オブジェクトツリーOt3で
ある「#3」ノードをトップノードとする文書オブジェ
クトツリーをXML文書に変換した結果を図23に示
す。図23に示したXML文書がテンポラリファイルB
に出力され、テンポラリファイルBに一時格納される。
【0156】図22に示すように、テンポラリファイル
A(「tmp000.xml」)には、もともとある
「特許」情報の要素の他に、格納文書、すなわち、ここ
では、例えば、「<A>データ</A>」が挿入されて
いる。また、「xmlns=”x−schema:tm
p001.xml”」という、テンポラリファイルB
(「tmp001.xml」)へのリンク情報の記述が
ある。この記述は、「特許」情報に適用されるスキーマ
が出力されているテンポラリファイルBを指定してい
る。
【0157】次に、図20の説明に戻る。
【0158】ステップS10では、文書格納部21は文
書パーサ部46に、合成文書のテンポラリファイルAと
スキーマのテンポラリファイルBとを与えて、合成文書
の文書構造の妥当性をチェックする。すなわち、文書パ
ーサ部46は、合成文書のテンポラリファイルAとスキ
ーマのテンポラリファイルBとを読み込み、合成文書の
文書構造が、スキーマにより定義されている文書構造に
一致するか否かをチェックする。
【0159】例えば、図22に示した合成文書と、図2
3に示したスキーマとで妥当性のチェックを行った場
合、合成文書には、スキーマにより定義されていない
「A」という要素が存在するため、図23の合成文書
は、妥当性のチェックでエラーとなる(ステップS1
1)。この場合、文書格納部21,結果処理部12を介
して、クライアント端末に「文書格納失敗」の旨のメッ
セージを返す(ステップS12)。
【0160】例えば、クライアント端末の所定の表示装
置には、図35に示すようなメッセージが表示される。
【0161】次に、構造化文書データベースが、図14
に示した状態のときに、「appendXML(“ui
x://root/特許DB”,“<特許>…</特許
>”)」なる追加コマンドを受け付けた場合について、
図20を参照して説明する。前述同様にして、文書オブ
ジェクトOx0のオブジェクトID「#2」を取得する
(ステップS5)、この文書オブジェクトには、スキー
マが存在するので(ステップS8)、ステップS9にお
いて合成文書を作成する。
【0162】この場合、文書オブジェクトOx0である
「#2」ノード自体から「Schema」タグをトップ
(先頭)にもつノード(「#3」ノード)へのリンクが
張られているので、この「#2」ノードが文書オブジェ
クトOx1となる(図21のステップS21)。すなわ
ち、文書オブジェクトOx0と文書オブジェクトOx1
が同じなので(ステップS22)、ステップS29へ進
み、格納文書「<特許>…</特許>」の文書オブジェ
クトツリーをXML文書に変換し、テンポラリファイル
Aに出力する(ステップS29)。
【0163】例えば、図24に示すように、テンポラリ
ファイルA(「tmp000.xml」)には、格納文
書である「特許」情報、すなわち、ここでは、「<特許
>…</特許>」が出力されている。また、「xmln
s=”x−schema:tmp001.xml”」と
いう、テンポラリファイルB(「tmp001.xm
l」)へのリンク情報の記述がある。
【0164】次に、ステップS28へ進む。図25に示
すように、テンポラリファイルBには、「#3」ノード
をトップノードとするスキーマの文書オブジェクトツリ
ーをXML文書に変換した結果が出力されている。
【0165】図20のステップS10で、図24に示し
た合成文書と、図25に示したスキーマとで妥当性のチ
ェックを行ったとき、合成文書の文書構造と、スキーマ
により定義されている文書構造とは一致する、この場
合、ステップS11からステップS13へ進む。
【0166】ステップS13では、格納文書の文書オブ
ジェクトツリーが、文書オブジェクトOx0下に追加さ
れる。すなわち、文書格納部21により、格納文書の文
書オブジェクトツリーを構成する各文書オブジェクト
(のファイル)にオブジェクトIDが与えられ、文書オ
ブジェクトOx0から格納文書の文書オブジェクトツリ
ーの先頭の文書オブジェクトへリンクが張られる。そし
て、文書オブジェクトツリー格納部41により、格納文
書の文書オブジェクトツリーを構成する各文書オブジェ
クト(のファイル)が文書記憶部5に格納される。
【0167】次に、ステップS14へ進み、インデック
ス記憶部6のインデックスを更新する。
【0168】なお、ステップS8で、文書オブジェクト
Ox0のもつ属性値の値が「0」のときは、上述したス
キーマを用いた合成文書の文書構造の妥当性のチェック
を行わずに、そのままマステップS13へ進み、格納文
書の文書オブジェクトツリーを、文書オブジェクトOx
0下に追加し(ステップS13)、それに伴い、インデ
ックス記憶部6のインデックスを更新する(ステップS
14)。
【0169】(1−2)文書取得処理 次に、図1の構造化文書管理システムの文書取得処理動
作について、図26に示すフローチャートを参照して説
明する。
【0170】クライアント端末から構造化文書管理シス
テムに対し、文書取得要求として、取得コマンド、スキ
ーマ取得コマンドのうちのいずれかが送信されて、要求
受付部11にて受け付けられたとき、図26に示した処
理動作を行う。
【0171】例えば、ユーザが図36に示したような文
書の格納/削除画面上の領域W1の「特許DB」をマウ
ス等で選択すると(クリックすると)、構造化文書パス
の入力領域W2に、「uix://root/特許D
B」と表示されとともに、「getXML(“uix:
//root/特許DB”)」なる取得コマンドが構造
化文書管理システムへ送信される。
【0172】ここでは、例えば、構造化文書データベー
スが、図8に示した状態のときに、「getXML
(“uix://root/特許DB”)」なる取得コ
マンドを受け付けた場合を例にとり説明する。
【0173】要求受付部11は、上記取得コマンドを受
け付けると、上記取得コマンド中のパラメータである構
造化文書パス「uix://root/特許DB」を文
書取得部22へ渡す(ステップS31)。
【0174】文書取得部22は、パスから文書オブジェ
クトツリー取得部45へ構造化文書パスを渡す。パスか
ら文書オブジェクトツリー取得部45は、構造化文書パ
スから文書記憶部5中の物理的なエリアを特定すること
により、そのエリアに存在する構造化文書パスにて表さ
れたノード(文書オブジェクトOx5)を取り出す(ス
テップS32)。構造化文書パスの指定が正しければ、
文書オブジェクトOx5のオブジェクトIDを取得する
ことができるので(ステップS33)、その場合は、ス
テップS35へ進む。
【0175】例えば、上記取得コマンドの場合、「#
2」ノードが文書オブジェクトOx5となるので、その
オブジェクトIDとして、「#2」を取得するととも
に、この「#2」ノード以下の文書オブジェクトツリー
Ot5(「#2」ノード、「#42」ノード〜「#4
9」ノード、「#52」ノード以下、「#62」ノード
以下)を取得する(ステップS35)。
【0176】ステップS32において、指定された構造
化文書パスからそれに対応する文書オブジェクトOx5
が見つからなければ、エラーとなり(ステップS3
3)、文書取得部22,結果処理部12を介して、クラ
イアント端末に「文書取得失敗」の旨のメッセージを返
す(ステップS34)。
【0177】ステップS35で取得した文書オブジェク
トツリーOt5は、文書文字列取得部44でXML文書
に変換される。例えば、上記取得コマンドの場合、取得
したXML文書は、図11に示すような3つの「特許」
情報のXML文書となる。
【0178】文書取得部22は、結果処理部12を介し
て、図11に示したようなXML文書を(例えば、XS
L(eXtensible Style Langua
ge)といった所定のスタイルシートとともに)、クラ
イアント端末へ返す(ステップS37)。
【0179】クライアント端末では、図11に示したX
ML文書を、スタイルシートを用いてHTMLデータに
変換して、例えば、図36に示すように、領域W2に表
示する。
【0180】XSLを利用すると、XML文書を様々な
形に変換することが出来る。違う構文書造のXML文書
に変換することも出来るし、XML文書からHTMLペ
ージを生成することも出来る。
【0181】(1−3)文書削除処理 次に、図1の構造化文書管理システムの文書削除処理動
作について、図27に示すフローチャートを参照して説
明する。
【0182】クライアント端末から構造化文書管理シス
テムに対し、文書削除要求として、削除コマンドが送信
されて、要求受付部11にて受け付けられたとき、図2
7に示した処理動作を行う。
【0183】例えば、ユーザが図36に示したような文
書の格納/削除画面上の領域W1の「特許DB」をマウ
ス等で選択すると(クリックすると)、構造化文書パス
の入力領域W2に、「uix://root/特許D
B」と表示され、さらに、「削除」ボタンB2を選択す
ると「removeXML(“uix://root/
特許DB”)」なる削除コマンドが構造化文書管理シス
テムへ送信される。
【0184】ここでは、例えば、構造化文書データベー
スが、図14に示した状態のときに、「removeX
ML(“uix://root/特許DB/特許[0]
/出願日”)」なる削除コマンドを受け付けた場合を例
にとり説明する。
【0185】要求受付部11は、上記削除コマンドを受
け付けると、上記削除コマンド中のパラメータである構
造化文書パス「uix://root/特許DB/特許
[0]/出願日」を文書削除部23へ渡す(ステップS
41)。
【0186】次に、文書削除部23は、パスから文書オ
ブジェクトツリー取得部45へ構造化文書パスを渡す。
パスから文書オブジェクトツリー取得部45は、構造化
文書パスから文書記憶部5中の物理的なエリアを特定す
ることにより、そのエリアに存在する構造化文書パスに
て表されたノード(文書オブジェクトOx0)を含む文
書オブジェクトツリーを取り出す(ステップS42)。
構造化文書パスの指定が正しければ、文書オブジェクト
Ox0のオブジェクトIDを取得することができるので
(ステップS43)、その場合は、ステップS45へ進
む。
【0187】例えば、上記削除コマンドの場合、「#4
4」ノードが文書オブジェクトOx0となるので、その
オブジェクトIDとして、「#44」を取得するととも
に、この「#44」ノードを含む文書オブジェクトツリ
ー(例えば、「#44」ノードの全ての子孫ノードと
「#44」ノードと同じ階層にある全ての(兄弟)ノー
ドと、「#44」ノードの親ノードである「#42」ノ
ード、その親ノードである「#2」ノードとからなる文
書オブジェクトツリー)を取得する。
【0188】指定された構造化文書パスからそれに対応
する文書オブジェクトOx0が見つからなければ、エラ
ーとなり(ステップS43)、文書格納部21,結果処
理部12を介して、クライアント端末に「文書削除失
敗」の旨のメッセージを返す(ステップS44)。
【0189】次に、ステップS45では、文書オブジェ
クトOx0にスキーマが存在するか否かを検査する。こ
の検査は、前述したように、各文書オブジェクトのファ
イルに属性値が記述されているので、この値をチェック
すればよい。文書オブジェクトOx0のもつ属性値の値
が「1」のときは、ステップS46へ進む。
【0190】以下、図27のステップS46の処理(合
成文書作成部47の処理(削除コマンド用))につい
て、図28に示すフローチャートを参照して詳細に説明
する。
【0191】なお、図28において、図21と同一部分
は同一符号を付している。
【0192】文書格納部21は、ステップS42で取得
した文書オブジェクトツリーを合成文書作成部47へ渡
す。
【0193】合成文書作成部47は、この文書オブジェ
クトツリーを文書オブジェクトOx0から遡り、「Sc
hema」タグを子要素として持つ文書オブジェクトO
x1を検索する(ステップS21)。
【0194】例えば、図14に示した構造化文書データ
ベースでは、文書オブジェクトOx0としての「#4
4」ノードの上流にある「#2」ノードから「Sche
ma」タグをトップ(先頭)にもつノード(「#3」ノ
ード)へのリンクが張られているので(「Schem
a」タグを子要素として持つので)、この「#2」ノー
ドが文書オブジェクトOx1となる。
【0195】この文書オブジェクトOx1から文書オブ
ジェクトOx0、さらに文書オブジェクトOx0からア
ークを辿って、その下流にある、文書オブジェクトの属
性値の値が「1」である全ての子ノードからなる文書オ
ブジェクトツリーOt1を取り出す(ステップS2
3)。
【0196】例えば、上記追加コマンド中のパラメータ
の構造化文書パスが「uix://root/特許DB
/特許[0]/出願日」と指定されているとき、文書オ
ブジェクトツリーOt1は、「#42」ノード〜「#4
9」ノードから構成されたものとなる(図14参照)。
【0197】次に、ステップS26ヘ進み、文書オブジ
ェクトツリーOt1から文書オブジェクトOx0以下の
文書オブジェクトツリーを削除する。その結果得られた
新たな文書オブジェクトツリーを文書オブジェクトツリ
ーOt2とする。
【0198】この文書オブジェクトツリーOt2をXM
L文書に変換し、それをテンポラリファイルAに出力す
る(ステップS27)。
【0199】例えば、上記削除コマンド中のパラメータ
の構造化文書パス「uix://root/特許DB/
特許[0]/出願日」が指し示す「#44」ノード以下
の文書オブジェクトツリーを「#42」ノード〜「#4
9」ノードで構成された文書オブジェクトツリーOt1
から削除することにより得られた合成文書の文書オブジ
ェクトツリーOt2をXML文書に変換した結果を図2
9に示す。この合成文書は、もともとある「特許」情報
から「<出願日>…</出願日>」というデータを削除
したものとなっている。
【0200】図29に示したXML文書、すなわち、合
成文書がテンポラリファイルAに出力され、テンポラリ
ファイルAに一時格納される。
【0201】一方、スキーマタグ以下の文書オブジェク
トツリーOt3をXML文書に変換して、それをテンポ
ラリファイルBに出力する(ステップS28)。すなわ
ち、テンポラリファイルBには、スキーマ文書が一時格
納されることになる。
【0202】例えば、文書オブジェクトツリーOt3で
ある「#3」ノードをトップノードとする文書オブジェ
クトツリーをXML文書に変換した結果を図30に示
す。図30に示したXML文書がテンポラリファイルB
に出力され、テンポラリファイルBに一時格納される。
【0203】次に、図27の説明に戻る。
【0204】ステップS47では、文書削除部21は文
書パーサ部46に、合成文書のテンポラリファイルAと
スキーマのテンポラリファイルBとを与えて、文書格納
処理の場合と同様にして、合成文書の文書構造の妥当性
をチェックする。
【0205】例えば、図29に示した合成文書と、図3
0に示したスキーマとで妥当性のチェックを行った場
合、合成文書には、スキーマにより定義されている「出
願日」という要素が存在しないため、図29の合成文書
は、妥当性のチェックでエラーとなる(ステップS4
8)。この場合、文書削除部21,結果処理部12を介
して、クライアント端末に「文書削除失敗」の旨のメッ
セージを返す(ステップS49)。
【0206】なお、構造化文書データベースが、図14
に示した状態のときに、「removeXML(“ui
x://root/特許DB/特許[0]”)」なる削
除コマンドを、図27に従って処理を行うと、図28の
ステップS27において、図24に示したような合成文
書がテンポラリファイルAに出力される。テンポラリフ
ァイルBは、図30と同様である。
【0207】このとき、図24に示した合成文書と、図
30に示したスキーマとで妥当性のチェックを行った場
合、合成文書の文書構造と、スキーマにより定義されて
いる文書構造とは一致するので、ステップS48からス
テップS50へ進む。
【0208】ステップS50では、文書オブジェクトO
x0以下の文書オブジェクトツリーを削除する。すなわ
ち、文書オブジェクトツリー削除部42により、文書オ
ブジェクトOx0以下の文書オブジェクトツリーを構成
する各文書オブジェクト(のファイル)が文書記憶部5
から削除される。例えば、「#2」ノードから「#4
2」ノード以下の文書オブジェクトのファイルが削除さ
れる。
【0209】次に、ステップS51へ進み、インデック
ス記憶部6のインデックスを更新する。また、クライア
ント端末の図36に示したような表示画面の領域W1に
は、「特許[0]」が表示さなくなる。
【0210】なお、ステップS45で、文書オブジェク
トOx0のもつ属性値の値が「0」のときは、上述した
スキーマを用いた合成文書の文書構造の妥当性のチェッ
クを行わずに、そのままマステップS50へ進み、文書
オブジェクトOx0以下の文書オブジェクトツリーを削
除し(ステップS50)、それに伴う、インデックス記
憶部6のインデックスを更新する(ステップS51)。
【0211】(1−4)スキーマの設定、スキーマを用
いた文書格納 図31に示した画面上で、ユーザが「Schema設定
Win」をマウス等のポインティングデバイスなどを用
いて選択すると、図37に示したようなスキーマの設定
を行うためのユーザインタフェースとしての画面が表示
される。
【0212】ユーザが、領域W3に、例えば、図12に
示したような「特許」情報のスキーマを入力し、この入
力したスキーマを「特許DB」以下のノードに設定する
場合には、領域W1から「特許DB」をマウス等でクリ
ックして選択した後(領域W2には、「uix://r
oot/特許DB」が表示される)、「スキーマ設定」
ボタンB3を選択する。すると、「setSchema
(“uix://root/特許DB”,“<Sche
ma>…</Schema>”)」なるスキーマ格納コ
マンドが構造化文書管理システムへ送信される。このコ
マンドの処理は前述した文書格納処理動作と同様であ
る。
【0213】次に、「uix://root/特許D
B」の下に「特許」情報を格納しようとするとき、「特
許DB」以下のノードに既に設定されているスキーマを
用いて「特許」情報を入力する場合について説明する。
【0214】まず、スキーマを取得する。例えば、図3
8に示すような文書の格納/削除を行うための画面の領
域W1から「スキーマ」をマウス等を用いて選択する
と、文書パスの入力領域W2に、「uix://roo
t/特許DB/#Schema」と表示されとともに、
「getXML(“uix://root/特許DB/
Schema”)」なるスキーマ取得コマンドが構造化
文書管理システムへ送信される。
【0215】このコマンドの処理は、前述した文書取得
処理と同様である。構造化文書管理システムから返され
るXML文書は、図38の画面の領域W3に表示され
る。
【0216】図38に示すように、領域R3には、「特
許」情報のデータ入力領域が各要素毎に設定されて表示
されている。この表示に従って、ユーザは、データを入
力すればよい。例えば、「タイトル」、「年」などのデ
ータ入力領域が階層的に配置され、表示されている。ユ
ーザは、このデータ入力領域にデータを入力すること
で、スキーマにより定義された文書構造の格納文書が容
易に作成することができる。
【0217】また、領域W3に入力した「特許」情報の
格納先として、領域W1で「特許DB」をマウス等を用
いて選択すると、領域W2に構造化文書パスとして、
「uix://root/特許DB」が表示される。そ
の後、「登録」ボタンB1を選択すると、「appen
dXML(“uix://root/特許DB”,“<
特許>…</特許>”)」なる追加コマンドが構造化文
書管理システムへ送信される。
【0218】この場合、格納文書は、予めスキーマに従
って入力されたものなので、図20のステップS10の
妥当性チェックでエラーとなることはない。
【0219】(2)検索機能 図1の構造化文書管理システムにおける検索系のコマン
ドには以下のものがある。
【0220】query(ql) 「query」は、パラメータとして( )内のクエリ
qlを実行し、その結果のXML文書を取得するコマン
ド(以下、検索コマンドと呼ぶ)である。
【0221】クエリは、図39に示すように、SQL
(Structured QueryLanguag
e)に似た形式の言語により、検索位置、検索条件、情
報抽出部分などを記述した、構造化されたXML文書で
ある。クエリ文書も本発明の構造化文書管理システムの
管理対象である。
【0222】「kf:from」タグから始まる要素に
は、検索位置の指定と文書要素の値に変数を対応付ける
記述があり、「kf:where」タグのから始める要
素には、変数に関する条件づけの記述があり、「kf:
select」タグから始まる要素には、検索結果の出
力形式が記述される。
【0223】検索には、単純検索と概念検索とがある。
単純検索とは、クエリ中に指定された検索条件を満たす
情報を検索・抽出するものであり、概念検索とは、クエ
リ中に指定された概念情報を利用して、クエリ中に指定
された検索条件を満たす情報を検索・抽出するものであ
る。
【0224】図40は、単純検索のクエリの例を示した
ものである。図40のクエリは、例えば、図14に示し
たような状態の構造化文書データベースに対し、「特許
DB」アークが示すノード以下に格納されている「特
許」情報の文書群において、「1999年でかつ、「P
C」のような内容の「要約」という要素をもつ文書
(「特許」情報)の「タイトル」を列挙せよ」という検
索要求を意味している。
【0225】「kf:from」タグから始まる要素の
記述により、変数「$t」、「$y」、「$s」に、そ
れぞれ「特許」情報の「タイトル」、「年」、「要約」
という文書要素の値が代入される。
【0226】「kf:where」タグから始める要素
の記述により、変数「$y」=「1999」という比較
がなされる。また、コンポーネント「MyLike」は
変数「$s」と「PC」を引数として、「PC」と類似
する値の変数「$s」を検知するための関数である。
【0227】「kf:from」タグから始まる要素の
記述により、変数「$t」が出力値として利用される。
【0228】なお、「kf:star」タグは構造の曖
昧表現であり、例えば「<特許><kf:star><
年>」は「タグ名が「特許」である要素の子孫の要素と
していずれかに存在し、タグ名が「年」である要素」を
意味する。
【0229】図41に図40の単純検索のクエリを用い
た検索結果を示す。この検索結果(検索結果文書)もX
ML文書である。この検索結果文書は、「kf:sel
ect」タグから始まる要素に記述されている、検索結
果の出力形式に従った文書構造の文書であり、クエリ中
に指定された検索条件を満たす構造化文書データベース
中の構成要素を合成して生成される場合もある。
【0230】図42は、概念検索のクエリの例を示した
ものである。図42のクエリは、例えば図18,図19
に示すような状態の構造化文書データベースに対し、
「特許DB」アークが示すノード以下に格納されている
「特許」情報の文書群に対し、「概念DB」アークが示
すノード以下に格納されている「概念」情報を利用して
検索するための検索要求である。ここで、概念「周辺装
置」の値をもつタグの子要素の値には、概念「SCS
I」、「メモリ」、「HDD」などがあるものとする。
また、図18には示していないが、各「特許」情報の構
成要素には、「キーワード」タグから始める要素も存在
するものとする。
【0231】すなわち、図42のクエリは、「概念「周
辺装置」以下の概念のいずれかを「キーワード」という
要素の値にもつ文書(「特許」情報)の「タイトル」を
列挙せよ」という検索要求を意味している。
【0232】「kf:from」タグから始まる要素の
記述により、変数「$t」、変数「$k」に、それぞ
れ、「特許」情報の「タイトル」、「キーワード」とい
う要素の値が代入される。また、変数「$x」は「概
念」情報として「周辺装置」の値をもつタグの子要素の
値(「SCSI」、「メモリ」、「HDD」など)が代
入される。
【0233】「kf:where」タグから始める要素
の記述により、「$k」=「周辺装置」もしくは「$
k」=「$x」という比較がなされる。
【0234】次に、図1の構造化文書管理システムの文
書検索処理動作について、図43に示すフローチャート
を参照して説明する。
【0235】図31に示した画面上で、ユーザが「XM
L検索Win」をマウス等のポインティングデバイスな
どを用いて選択すると、図44に示すような文書検索を
行うためのユーザインタフェースとしての画面が表示さ
れる。
【0236】図44の検索画面において、領域W1に
は、前述同様、構造化文書データベースの現在のツリー
構造の要素名(タグ名)がユーザが理解可能なように簡
略的に表示されている。
【0237】領域W2は、検索対象の範囲(ツリー構造
上の検索範囲)や、検索条件などを入力するための領域
である。領域W3には、検索結果が表示される。
【0238】例えば、「「uix://root」以下
の「特許」を先頭タグに持つ文書の中から、「タイト
ル」タグに「文書」という文字列を含み、「1998」
年以降に作成された文書を検索せよ」という検索要求の
場合には、領域W1から「root」をマウス等で選択
して検索対象の範囲として、構造化文書パスを入力す
る。そして、トップノードとして、「特許」を入力する
(この場合、領域W1から「特許」をマウス等で選択す
ることにより入力してもよい)。また、検索条件とし
て、「「タイトル」という要素の値に「文書」という文
字列を含む」「「年」という要素の値が「1998」以
上である」という内容を予め設定されたデータ入力領域
に入力すればよい。
【0239】その後、「検索」ボタンB21を選択する
ことにより、例えば、図45に示すようなクエリが、当
該クエリを構造化文書データベース上に格納するための
追加コマンドとともに構造化文書管理システムへ送信さ
れる。クエリの格納場所は、予め定められており、シス
テム側が自動的に、この追加コマンドのパラメータを設
定することとなる。例えば、構造化文書データベースが
図18に示した状態のとき、当該クエリの格納場所を表
すパラメータとしての構造化文書パスは、「uix:/
/root/クエリDB」となる。また、追加コマンド
のもう一方のパラメータは、当該クエリ文書である。
【0240】要求受付部11は、上記クエリを受け付け
ると(ステップS101)、当該クエリを検索要求処理
部3へ渡す。そして、当該クエリ文書を格納するための
追加コマンドのパラメータを文書格納部21へ渡す。こ
の追加コマンドの処理を、前述同様に行って、当該クエ
リは、文書記憶部5に格納される。
【0241】例えば、図42に示すようなクエリの場
合、構造化文書データベースには、図46に示すように
展開されて、構造化文書パス「uix://root/
クエリDB」の示す「#301」ノード以下にリンクさ
れる。
【0242】一方、検索要求処理部3では、受け取った
クエリを基に、データアクセス部4を通してインデック
ス記憶部6,文書記憶部5にアクセスし、検索要求に合
致する文書集合などを取得して、クエリの中で要求され
た情報を抽出して結果処理部12を介して出力する。
【0243】例えば、上記クエリの場合、まず、「「タ
イトル」タグに「文書」という文字列を含む」という条
件に合致するものを検索することが検索対象を絞り込む
上で効率がよい。そこで、図10に示したようなデータ
生起インデックスを用いて、「文書」という文字列にリ
ンクされているノード(文書オブジェクト)のオブジェ
クトIDを得る。そして、そのそれぞれについて、文書
オブジェクトツリーを上流側に1つ遡り、「タイトル」
というタグ名にたどり着いたときは、更に上流に辿って
いき、「特許」というタグ名にたどり着いたときは、そ
のノード以下の文書オブジェクトツリーOt11を抽出
する。
【0244】次に、この抽出された複数の文書オブジェ
クトツリーOt11の中から、さらに、「年」という要
素の値が「1998」年以上の文書オブジェクトツリー
Ot12を抽出する。
【0245】この文書オブジェクトツリーOt12が上
記クエリの内容に適合する文書となる。さらに上記クエ
リの要求内容に従えば、各文書オブジェクトツリーOt
12のトップノードへの構造化文書パスを求める(ステ
ップS102)。
【0246】なお、上記検索処理は、上記した方法に限
るものではなく、インデックス情報を用いた様々な効率
のよい検索方法が可能である。
【0247】検索要求処理部3は、ステップS102で
得られた結果を統合して、検索結果としてのXML文書
を作成する(ステップS103)。
【0248】例えば、検索結果のXML文書は、 となる。
【0249】検索要求処理部3は、検索結果処理部12
を介して、上記XML文書をスタイルシートとともに、
要求元のクライアント端末に返す(ステップS10
4)。
【0250】クライアント端末では、図11に示したX
ML文書を、スタイルシートを用いてHTMLデータに
変換して、例えば、図44に示すように、領域W12に
表示する。
【0251】同様にして、スキーマの検索も行える。
【0252】例えば、「「uix://root」以下
の「schema」を先頭タグに持つ文書の中から、
「特許」と「要約」というタグ名を持つスキーマを検索
せよ」という検索要求の場合には、図47に示すよう
に、領域W1から「root」をマウス等で選択して検
索対象の範囲として、構造化文書パスを入力する。そし
て、トップノードとして、「#schema」を入力す
る。また、検索条件として、「要素の属性名に「特許」
という文字列を含む」「要素の属性名に「要約」という
文字列を含む」という内容を予め設定されたデータ入力
領域に入力すればよい。
【0253】その後、「検索」ボタンB21を選択する
ことにより、上記検索要求を記述したクエリ(図48参
照)が、当該クエリを構造化文書データベース上に格納
するための追加コマンドとともに構造化文書管理システ
ムへ送信される。
【0254】さて、上記クエリの場合、例えば、「「#
schema」を先頭タグに持つ」という条件に合致す
るものを検索する。そこで、図9に示したような要素名
称生起インデックスを用いて、「#schema」とい
う要素にリンクされているノードの(文書オブジェク
ト)のオブジェクトIDを得る。そして、そのそれぞれ
について、文書オブジェクトツリーを下流側にアークを
辿っていき、属性名が「特許」と「要約」という要素に
たどり着いたときは、当該「#schema」を先頭タ
グにもつ文書オブジェクトツリーOt21を抽出する。
この文書オブジェクトツリーOt21が上記クエリの内
容に適合する文書となる。さらに、図48に示したクエ
リの要求内容に従えば、各文書オブジェクトツリーOt
21のトップノードへの構造化文書パスを求める。
【0255】検索要求処理部3は、文書オブジェクトツ
リーOt21が複数あれば、それぞれのトップノードへ
の構造化文書パスをまとめて、検索結果としてのXML
文書を作成し、検索結果処理部12を介して、上記XM
L文書をスタイルシートとともに、要求元のクライアン
ト端末に返す。
【0256】クライアント端末では、検索結果として受
け取ったXML文書を、スタイルシートを用いてHTM
Lデータに変換して、例えば、図44に示すように、領
域W12に表示する。
【0257】クライアント端末では、検索結果の中の1
つのスキーマを選択して、表示させると、例えば、図3
8に示すような文書の格納/削除を行うための画面とと
もに、その領域W3に、「特許」情報のデータ入力領域
が各要素毎に設定されて表示される。
【0258】ユーザは、このデータ入力領域にデータを
入力することで、スキーマにより定義された文書構造の
格納文書が容易に作成することができる。
【0259】例えば、図38の領域W3に入力した「特
許」情報の格納先として、領域W1で「特許DB」をマ
ウス等を用いて選択すると、領域W2に構造化文書パス
として、「uix://root/特許DB」が表示さ
れる。その後、「登録」ボタンB1を選択すると、「a
ppendXML(“uix://root/特許D
B”,“<特許>…</特許>”)」なる追加コマンド
が構造化文書管理システムへ送信される。
【0260】この場合、格納文書は、予めスキーマに従
って入力されたものなので、図20のステップS10の
妥当性チェックでエラーとなることはない。
【0261】同様にして、クエリの検索も行える。クエ
リを検索して、検索結果として得られた既存のクエリを
加工して、再利用することもできる(クエリの再利
用)。
【0262】クエリの検索は、前述したような構造化文
書の検索と同様にして行われ、その検索範囲は、クエリ
群の格納されている構造化データベース上の一部の文書
オブジェクトツリーとなる。
【0263】例えば、図18に示したような状態の構造
化文書データベースから、「kf:from」タグに
「特許DB」を含むクエリを検索する場合について説明
する。そのような検索要求を記述したクエリを図49に
示す。
【0264】図49に示すクエリは、「「uix://
root/クエリDB」の示す「#301」ノード以下
に存在するクエリの中から「kf:from」タグに
「特許DB」を含むクエリを検索し、その内容(タグ名
が「query」である要素以下の文書オブジェクトツ
リーの文書)を列挙せよ」を意味するものである。
【0265】なお、「kf:as」タグの内容で変数
「$elt」に、「kf:from」タグに「特許D
B」を含むクエリのタグ名が「query」である要素
以下の文書オブジェクトツリーが代入される。
【0266】このクエリを検索要求処理部3が処理する
際には、前述同様にして、例えば、図9に示したような
要素名称生起インデックスを用いて、「kf:fro
m」という要素にリンクされているノードの(文書オブ
ジェクト)のオブジェクトIDを得る。そして、そのそ
れぞれについて、文書オブジェクトツリーを下流側にア
ークを辿っていき、「特許」というタグ名にたどり着い
たときは、さらに、上流側にアークを辿って「quer
y」というタグ名に辿りついたとき、当該「quer
y」を先頭タグにもつ文書オブジェクトツリーOt31
を抽出する。この文書オブジェクトツリーOt31が上
記クエリの内容に適合する文書となる。
【0267】複数の文書オブジェクトツリーOt31が
検索されたら、それらを統合して、XML文書を作成し
て、それをスタイルシートとともにクライアント端末へ
返す。
【0268】クライアント端末では、検索結果の中の1
つのクエリを選択して、表示させると、例えば、図44
に示した検索画面の領域W11に、各データ入力領域に
データの入力された状態で、当該クエリに記述された検
索要求の内容が表示される。
【0269】ユーザは、この状態から、「「uix:/
/root」以下の「特許」を先頭タグに持つ文書の中
から、「タイトル」タグに「文書」という文字列を含
み、「1998」年以降に作成された文書を検索せよ」
という当該クエリに記述された検索要求中の「文書」を
「XML」に変更して、「検索」ボタンB21を選択す
れば、「「uix://root」以下の「特許」を先
頭タグに持つ文書の中から、「タイトル」タグに「XM
L」という文字列を含み、「1998」年以降に作成さ
れた文書を検索せよ」という意味のクエリが構造化文書
管理システムへ送信される。
【0270】以上説明したように、図1の構造化文書管
理システムでは、構造化文書データベース上に登録され
る文書構造が異なる膨大な数のXML文書群(コンテン
ツ文書、スキーマ文書、クエリ文書など)を、図18,
図19に示すように、「root」タグを先頭に持つツ
リー状の1つの巨大なXML文書として取り扱う。従っ
て、文書構造が異なる、様々なスキーマを持つ膨大な数
の文書の中から検索条件に合致する文書を容易に検索で
きる。
【0271】また、検索に用いるクエリも構造化文書で
あるので、構造化文書データベースにログとして格納す
ることにより、過去のクエリを再利用するようなアプリ
ケーションも容易に構築することができる。
【0272】(3)適用例 次に、上記概念検索の特許調査への適用例について説明
する。
【0273】図50は、特許調査における構造化文書デ
ータベースの一例であり、「特許」情報の他に、「概
念」情報も格納している。
【0274】特許調査において、最も重要となってくる
作業は、関連する「特許」情報を収集し、「特許」情報
を様々な観点から分析し、特許マップ(図54参照)を
作成することである。特許マップを作成するために、従
来、特許マップにおける縦軸、横軸を予め決定し、それ
に従い、縦軸に並ぶ任意の項目と横軸に並ぶ任意の項目
とを検索条件とした検索を逐次行うという方法がとら
れ、この部分に非常に莫大なコストがかかっていた。し
かし、本発明の構造化文書管理システムを用いること
で、この部分のコストを大幅に減少させることが可能と
なる。
【0275】なお、ここで、マップとは、縦軸(y軸)
に並ぶ任意の項目と横軸(x軸)に並ぶ任意の項目とを
検索条件とした検索結果をx軸とy軸とを分類軸として
分類整理するものである。
【0276】本発明の構造化文書管理システムで、クラ
イアント端末のユーザが図54に示すような特許マップ
を作成しようとする場合、ユーザは、クライアント端末
上の表示装置に表示される図50に示すような構造化文
書データベースの現在のツリー構造を参照して、図51
に示すような検索画面上に、分析対象の範囲とする「特
許」情報のパスと、分析の軸(例えば、x軸、y軸)と
なる要素を、それぞれ領域W21、W22に入力する。
分析の軸となる要素は、構造化文書データベース内の
「特許」情報の要素、「概念」情報の要素のいずれであ
ってもよい。
【0277】例えば、図51では、x軸に「機能」、y
軸に「技術」という「概念」情報の要素を入力してい
る。
【0278】その後、ユーザは、「実行」ボタンB31
を選択すると、クライアント端末から図1の構造化文書
管理システムへ、図52に示したようなクエリが送出さ
れる。
【0279】この場合のクエリには、「「特許DB」ア
ークが示すノード以下に格納されている「特許」情報の
文書群の中から、「概念DB」アークが示すノード以下
に格納されている、概念「機能」の子要素のいずれかと
概念「技術」の子要素のいずれかとを、「キーワード」
や「要約」などの要素の値に含む「特許」情報を検索せ
よ。検索結果として、「機能」の子要素と「技術」の子
要素と、それらに対応する「特許」情報の「公開番号」
との組を列挙せよ。」という意味の検索要求である。
【0280】概念「機能」には、「検索」「格納」…
「分析支援」という子要素があり、概念「技術」には、
「実装データベース」「反構造データベース」「自然言
語処理」…という子要素があるものとする。
【0281】上記クエリを受けた構造化文書検索システ
ムの検索要求処理部3では、例えば、図10に示したよ
うなデータ生起インデックスを用いて、概念「機能」の
各子要素(文字列)にリンクされているノード(文書オ
ブジェクト)のオブジェクトIDを得る。そして、その
それぞれについて、文書オブジェクトツリーを上流側に
遡り、「特許」というタグにたどり着いたときは、さら
に、そのノード以下の文書オブジェクトツリーを下流側
に辿って概念「技術」の子要素(文字列)のいずれかに
リンクされているタグ名にたどり着いたときは、当該文
書オブジェクトツリーと、その「公開番号」タグにリン
クされている文字列(要素値)を抽出する。このように
して、抽出された「特許」情報のそれぞれについて、対
応の「機能」の子要素と「技術」の子要素と「公開番
号」との組を統合して、図53に示すような検索結果と
してのXML文書を作成、要求元のクライアント端末
へ、所定のスタイルシートとともに返す。
【0282】これらを受け取ったクライアント端末の表
示装置には、図54に示したような表形式の特許マップ
が表示されることになる。
【0283】このように、所望の概念を「軸」として指
定するだけで、構造化文書データベースに蓄積された情
報を「軸」として指定された概念に基づき集計・分類し
て、マップ表示することが容易に行える。すなわち、構
造化文書データベースに蓄積された情報を、「概念」情
報を用いて様々な観点で集計・分類することが容易に行
える。
【0284】(アクセス権限の設定)ここでは、図2に
示した利用形態(WWWのバックエンドで、図1に示し
た構成の構造化文書管理システム100が動作する利用
形態)の場合を例にとり説明する。すなわち、図2に示
すように、複数(ここでは、例えば3つ)のクライアン
ト端末102のそれぞれでWWWブラウザ103が動作
しており、ユーザは、各クライアント端末からWWWサ
ーバ101にアクセスすることにより、構造化文書管理
システム100にアクセスすることができる。
【0285】ユーザからの文書格納、文書取得、文書検
索などの要求は、WWWブラウザ103から送信され
て、WWWサーバ101を通して構造化文書管理システ
ム100にて受け付けられ、処理された結果は、WWW
サーバ101を通して要求元のWWWブラウザ103へ
返信される。
【0286】クライアント端末装置102の要部の構成
例を図55に示す。
【0287】クエリの実行結果としてのXML文書は、
スタイルシートとともに、構造化文書管理システム10
0からクライアント端末装置102に送られてくるもの
とする。以下、図56、図57に示すフローチャートを
参照して、図55の各構成部の処理動作について説明す
る。
【0288】クエリは、前述したように、検索位置、検
索条件、情報抽出部分などを記述した、構造化されたX
ML文書である。クエリ文書も本発明の構造化文書管理
システムの管理対象である。ここで、構造化文書データ
ベースに対しその論理構造に基づき所望の構成要素を検
索するクエリを例にとり説明する。
【0289】XML文書受信部111で、構造化文書管
理システム100から送られてきた検索結果文書である
表示対象のXML文書と、スタイルシートとを受信する
と(図56のステップS201)、XML/HTML変
換部112では、受信したスタイルシートを用いて、受
信した表示対象のXML文書をHTML文書に変換する
(ステップS202)。その変換処理中、テーブル作成
部113は、HTML文書中の記述部分と、その記述部
分を生成したスタイルシート中の記述部分との対応関係
を示したテーブル、すなわち、対応テーブル114を作
成する(ステップS203、ステップS204)。
【0290】構造化文書管理システム100から送られ
てくるスタイルシートの各記述部分には予め識別子SI
Dが与えられているものとする。例えば、この識別子S
IDは、コメント文(コメント文でなくとも、ブラウザ
では表示されない記述形式の文)として、予めスタイル
シートに書き込まれていてもよい。
【0291】テーブル作成部113は、まず、XML/
HTML変換部112での変換作業中に、得られたHT
ML文書の各記述部分のそれぞれに識別子HIDを与え
る。そして、HTML文書中の記述部分と、その記述部
分を生成したスタイルシート中の記述部分との対応関係
をSIDとHIDを用いて表した対応テーブル114を
作成する。
【0292】描画部115では、XML/HTML変換
部112で生成されたHTML文書を基に表示データを
作成し、その表示データは、ディスプレイ装置121に
表示される(ステップS205)。その際、描画部11
5は、HTML文書中の記述部分とその記述部分に与え
られた識別子HIDとの対応を記憶しておいてもよい。
【0293】アクセス権限の設定は、ディスプレイ装置
121の表示画面を基に行う。
【0294】例えば、ユーザがアクセス権限の設定開始
の所定の指示操作を入力部116で行うと、アクセス権
限設定部117が起動される。まず、表示画面上でアク
セス権限を設定する領域の選択が行われる(ステップS
111)。すなわち、マウス等の入力装置122を用い
て、表示対象の文書が表示されたディスプレイ装置12
1の表示画面上で、アクセス権限を設定したい文字列
(テキスト)や画像などの表示領域の選択を行う。
【0295】アクセス権限を設定したい表示領域がマウ
ス等で選択されれば、描画部115でその指定された領
域に文字列や画像などを表示するHTML文書中の記述
部分を検知することができる。この検知されたHTML
文書中の記述部分に対応する識別子HIDがアクセス権
限設定部116に渡される(ステップS112)。
【0296】アクセス権限設定部116は、描画部11
5で検知されたHTML文書中の記述部分の識別子HI
Dから、対応テーブル114を参照して、当該識別子H
IDに対応するスタイルシートの記述部分の識別子SI
Dを得る(ステップS113)。
【0297】さらに、クライアント端末装置102のア
クセス権限設定部117では、アクセス権限の設定され
るユーザの範囲や、アクセスレベルや、アクセスタイプ
などをユーザに入力してもらうための入力画面を表示し
て、アクセス権限の設定のために必要な上記各情報を収
集する(ステップS114〜ステップS116)。上記
各情報の入力が終了すると、それらは、識別子SIDと
ともに、送信部118を介して構造化文書管理システム
100へ送信される(ステップS117)。
【0298】なお、図55に示した構成部のうち、テー
ブル作成部113,対応テーブル114,アクセス権限
設定部116以外は、ほぼ従来技術に属するものであ
る。
【0299】次に、図1のアクセス権限設定管理部20
1について、図58を参照して説明する。図58は、ア
クセス権限設定管理部201の機能ブロック図である。
【0300】アクセス権限設定管理部201は、アクセ
ス権限設定部202とアクセス権限管理部201とから
構成され、アクセス権限設定管理部201は、スキーマ
アクセス権限管理部211と、データアクセス権限管理
部212と、クエリアクセス権限管理部213と、スタ
イルアクセス権限管理部214と、パスアクセス権限管
理部215とから構成されている。
【0301】アクセス権限設定部202は、クライアン
ト端末装置102から送信されてきた、上記SIDや、
アクセス権限の設定されるユーザの範囲や、アクセスレ
ベルや、アクセスタイプなどの情報を基に、実際に、ア
クセス権限の設定を行うようになっている。
【0302】アクセス権限管理部201では、上記アク
セス権限設定部202で設定された、各レベル(スキー
マ、データ、クエリ、スタイル、パス)のアクセス権限
の管理を行うためのものである。
【0303】図59は、構造化文書データベースの論理
構造の一部を模式的に示したものである。構造化文書デ
ータベースに新たにXML文書を登録していくと、それ
ら各XML文書は、「root」という1つの大きなX
ML文書の部分文書として参照できる構成になってい
る。図59に示した構造化文書データベースでは、XM
L文書としての「報告書」情報は、「報告書DB」ノー
ド以下に格納され、同じくXML文書としての「従業
員」情報は、「従業員DB」ノード以下に格納され、同
じくXML文書としての「特許」情報は、「特許DB」
ノード以下に格納されている。
【0304】図60は、XMLで記述された構造化文書
の一例として、「報告書DB」ノード以下の上記「報告
書」情報に対応する1つの部分文書を示したものであ
り、図61は、「従業員DB」ノード以下の上記「従業
員」情報に対応する3つの部分文書を示したものであ
る。
【0305】図62は、クライアント端末装置102の
ディスプレイ装置121の画面表示例を示したもので、
クライアント端末装置102から入力されたクエリを実
行した結果得られたXML文書(検索結果文書)の表示
例を示している。
【0306】前述したように、クエリの「kf:fro
m」タグから始まる要素には、検索位置の指定と文書要
素の値に変数を対応付ける記述があり、「kf:whe
re」タグから始める要素には、変数に関する条件づけ
の記述があり、「kf:select」タグから始まる
要素には、検索結果の出力形式が記述される。クエリを
実行することより、単純検索の場合には、クエリ中に指
定された検索条件を満たす情報を検索・抽出し、概念検
索の場合には、クエリ中に指定された概念情報を利用し
て、クエリ中に指定された検索条件を満たす情報を検索
・抽出する。そして、検索要求処理部3では、抽出され
た情報(構成要素)を、「kf:select」タグか
ら始まる要素の記述に従った形式の情報に合成・加工
し、その結果得られたXML文書を結果処理部12を介
して、要求元のクライアント端末装置102に所定のス
タイルシートとともに送信する。要求元のクライアント
端末装置102では、構造化文書管理システム100か
ら送られてきたクエリの実行結果としてのXML文書
(検索結果文書)を図56のフローチャートに従って、
図62に示すように表示する。なお、検索結果文書は、
クエリ中の検索条件の記述によっては、上記のように、
構造化文書データベース中の複数の構造化文書から生成
された加工された文書である場合も、構造化文書データ
ベース中の構造化文書そのものである場合もあり得る。
【0307】この状態において、クライアント端末装置
102では、アクセス権限の設定が行える。
【0308】クライアント端末装置102上でのアクセ
ス権限の設定を行うための操作手順の概略を説明する。
【0309】(a)表示画面からアクセス権限の設定を
行いたい文字列や画像などの表示されている領域を指定
(選択)する。ここで、指定される文字列や画像など
は、構造化文書データベース中のXML文書を構成する
要素の要素名や要素値に対応するものである。
【0310】(b)アクセス権限を設定するユーザの範
囲を指定(選択)する。アクセス権限は、ユーザ1人1
人に対し設定することも、複数のユーザからなる特定の
グループ単位に(例えば、会社組織上の所属部署単位
に)設定することも可能であるとする。前者を個人に対
するアクセス権限の設定と呼び、後者をグループに対す
るアクセス権限の設定と呼ぶ。
【0311】(c)アクセスレベルを指定(選択)す
る。アクセスレベルには、ここでは、スタイル、クエ
リ、データ、スキーマ、パスがある。スタイルレベル
は、スタイルシート毎にアクセス権限を設定するもの
で、表示形式が異なれば、同じ構成要素であっても表示
されたりされなかったりすることがあり得る。また、ク
エリレベルは、クエリ文書毎にアクセス権限を設定する
もので、クエリレベルでアクセス権限を設定すると、こ
のレベルでアクセスが制限されたユーザに対しては、同
じ構成要素であっても、その構成要素を得るために用い
たクエリに応じて(すなわち、当該構成要素の用途が異
なれば)、表示されたりされなかったりすることがあり
得る。また、データレベルは、構造化文書データベース
に格納されている検索対象のXML文書中の構成要素に
対しアクセス権限を設定するもので、このレベルでアク
セスが制限されたユーザからは、その構成要素に対して
は、たとえ、クエリやスタイルが異なっても、アクセス
不可能である(見ることはできない)。さらに、スキー
マレベル、パスレベルは、構造化文書データベース中の
同じ文書構造を持つ構造化文書中の同じ要素名の構成要
素に対しアクセス権限を設定するもので、このレベルで
アクセスが制限されたユーザからは、そのような構成要
素に対しては、たとえ、クエリやスタイルが異なって
も、アクセス不可能である(見ることはできない)。
【0312】(d)上記(a)で指定した領域に表示さ
れるデータの表示方法(ここでは、アクセス態様あるい
はアクセスタイプと呼ぶ)を指定(選択)する。アクセ
スタイプとして、大きく分けると、その表示領域に何も
表示しなかったり、黒く塗り潰して表示したりと、そこ
に表示されているデータがあるのかないのかもわからな
いようにする非表示にする場合と、特殊な表示を行う場
合(特殊表示)とが設定可能である。特殊表示とは、そ
の表示領域には、何らかのデータが表示されているが、
それが何であるかが判別できないように表示を行うもの
で、例えば、上記(a)で指定した領域に表示される文
字列や画像などを伏せ字で表示したり、モザイクをかけ
て表示したりすることである。伏せ字で表示するのか、
モザイクなどをかけて表示するのかなどは選択可能であ
り、また、伏せ字を選択した場合は、どのような伏せ字
を用いるかも(例えば「○」「×」など)選択可能であ
る。
【0313】さて、図62に示すように、クライアント
端末装置102の表示画面には、上記のようにして、表
示対象のXML文書が表示されている。すなわち、「報
告書」情報の構成要素である「報告番号」、「タイト
ル」、「報告者」、「報告日」、「要約」、「代表図」
と、本文へのリンクが表示され、さらに、「従業員」情
報の構成要素である「報告者プロフィール」などの情報
が表示されている。このように、ここで表示されている
XML文書は、構造化文書データベースに格納されてい
る検索対象の複数のXML文書のそれぞれに含まれる構
成要素を合成したものである。
【0314】表示画面に表示されているデータは、あく
までも表示データであって(例えば、上記の例の場合、
複数のXML文書から抽出された構成要素を合成したも
の)、構造化文書データベースには、表示画面通りの構
造のXML文書が存在しているわけではない。そこで、
構造化文書管理システム100のアクセス権限設定管理
部201では、ユーザにより、アクセスレベルとして、
例えば、「データ」が指定されたときには、表示形式を
基に逆に遡り構造化文書データベース中の元のデータを
特定し、アクセス権限の設定を行うようになっている。
【0315】では、実際に、図62の表示からアクセス
権限を設定する方法について述べる。図62の表示は、
構造化文書データベース中の複数のXML文書の構成要
素をクエリにより合成した(加工した)結果得られたX
ML文書を、スタイルシートを通して、HTML形式に
変換したものをブラウザで表示したものである。表示対
象のXML文書を図63に示す。また、適用しているス
タイルシートを図64に示す。
【0316】図63に示したXML文書をHTML文書
に変換する際には、前述したように、HTML文書の各
記述部分(例えば、表示対象の文字列などを所定のタグ
で囲んだもの)のそれぞれに識別子HIDが与えられる
が、図65に、その様子を示す。図65には、HTML
文書そのものではなく、説明の簡単のため、HTML文
書中のどのような記述部分にどのような識別子HIDが
与えられたかを、そのHTML文書を表示した図62と
同じ表示画面上で示したものであって、各記述部分に対
し識別子HID(ここでは、例えば、HID1〜HID
18)を符号として示している。ここでは、識別子HI
Dの与えられたHTML文書中の1つの記述部分は、1
つの表示領域に対応する。すなわち、図65に示すよう
に、1つの表示窓(テキストボックス)に対し1つの記
述部分が対応し、HIDが与えられているものとする。
【0317】クライアント端末装置102のXML/H
TML変換部112では、図56のステップS102に
おいて、図63に示したXML文書に、図64に示した
スタイルシートを適用して、図65に示したように表示
されるHTML文書を作成するようになっている。その
際、図56のステップS203に示したように、テーブ
ル作成部113は、図66に示すような対応テーブル1
14を作成する。
【0318】例えば、図65において、識別子「HID
6」の与えられているHTML文書中の記述部分は、
「報告者」という文字列を表示領域306(図62参
照)に表示するものであって、識別子「HID7」の与
えられているHTML文書中の記述部分は、「山田太
郎」という文字列を表示領域307(図62参照)に表
示するものである。この2つの記述部分は、図64に示
したスタイルシートの識別子「SID4」の与えられて
いる記述部分の記述に従って図63のXML文書の6行
目に記述されている要素から生成されたものである。従
って、クライアント端末装置102のテーブル作成部1
13は、図66に示したように、HID6,HID7に
は、それぞれSID4が対応付けられている。なお、図
66の対応テーブルでは、HIDのそれぞれに対し、
「type」という項目によって、その要素は、変換前
のXML文書中では、要素名であったものか、要素値で
あったものかを区別している。
【0319】図88は、図65に示した表示画面に対応
するHTML文書の一部を示したものである。例えば、
図65に示した、識別子「HID1」「HID2」「H
ID3」「HID6」「HID7」の与えらた記述部分
の一例を示している。これら記述部分には、それらの符
号として識別子「HID1」「HID2」「HID3」
「HID6」「HID7」を示している。
【0320】例えば、表示領域307に「山田太郎」と
いう文字列を表示するための、図88に示したHTML
文書の記述部分(識別子「HID7」の与えられている
記述部分)のように、「報告書」「報告番号」「報告
者」などの項目名(要素名である場合もある)以外のX
ML文書の要素値が表示される表示領域(例えば、表示
領域307など)に対応する記述部分には、そのような
記述部分がマウス等により指示(選択)されたとき、描
画部115に、当該表示領域が指示された旨を通知する
ためのイベント関数「func()」が埋め込まれてい
るものとする。
【0321】このような関数の埋め込みは、図64に示
したスタイルシートにて指示することができる。すなわ
ち、例えば、識別子「HID7」の与えられているHT
ML文書の記述部分に上記関数を埋め込むための指示
は、図64に示したスタイルシートの記述部分401に
は記述されている。
【0322】このように、公知のスタイルシートを用い
ることにより、表示対象のXML文書をHTML文書に
変換する際に、識別子HIDの与えられたHTML文書
中の1つの記述部分に、1つの表示領域を対応させ、そ
の表示領域がマウス等で指示されたとき、描画部115
に、当該表示領域が指示(選択)された旨を通知するた
めのイベント関数「func()」を埋め込むことがで
きる。
【0323】描画部115は、イベント関数により、ユ
ーザにより指示(選択)された表示領域がどれである
か、また、その表示領域のHIDは何であるかを検知す
ることができる。
【0324】さて、図62に示したような表示が行われ
ている状態で、ユーザが、アクセス権限の設定開始の所
定の指示操作を入力部116を介して行うと、アクセス
権限設定部117が起動される。まず、図57のステッ
プS111に示したように、アクセス権限を設定する領
域の選択を行う。
【0325】例えば、図62の表示画面上の、「山田太
郎」という文字列の表示されている、その文字列を表示
するために予め定められた表示領域(テキストボック
ス)307が、マウス等を用いて選択されたとする。こ
の選択されたテキストボックスを表示するためのHTM
L文書中の記述部分の識別子は、「HID7」である。
描画部115は、これを検知すると、当該識別子「HI
D7」をアクセス権限設定部116へ渡す(図57のス
テップS112)。
【0326】アクセス権限設定部116は、対応テーブ
ル114を参照して、「HID7」に対応するスタイル
シート中の記述部分の識別子を取得する(図57のステ
ップS113)。この場合、図66から「SID4」が
得られる。
【0327】次に、アクセス権限を設定するユーザの範
囲の選択を行う(図57のステップS114)が、その
際、アクセス権限設定部116は、図67に示したよう
なウインドウを表示してもよい。このウインドウ上で、
ユーザは、個人あるいはグループを選択し、個人を選択
した場合には、さらに、その個人を特定するユーザ名を
選択すればよい。ここでは、ユーザの範囲として、例え
ば「山田太郎」という個人が選択されたとする。
【0328】次に、アクセスレベルの選択を行う(図5
7のステップS115)が、その際、アクセス権限設定
部116は、図68に示したようなウインドウを表示し
てもよい。このウインドウ上で、ユーザは、スタイル、
クエリ、データ、スキーマ、パスのいずれかを選択すれ
ばよい。
【0329】さらにアクセスタイプの選択を行う(図5
7のステップS116)が、その際、アクセス権限設定
部116は、図69に示したようなウインドウを表示し
てもよい。このウインドウ上で、ユーザは、「非表示」
か「特殊表示」のいずれかを選択すればよい。「特殊表
示」を選択した場合には、さらに、伏せ字、モザイクの
うちのいずれかを選択すればよい。
【0330】最後に、ユーザによりアクセス権限設定完
了を指示する所定の操作が行われると、上記のようにし
て収集された情報は、アクセス権限設定要求とともに、
クライアント端末装置102から、構造化文書管理シス
テムへ送信される(図57のステップS117)。構造
化文書管理システムでは、要求制御部1で上記アクセス
権限設定要求を受け取ると、それをアクセス権限設定管
理部201に出力する。
【0331】アクセス権限設定要求には、例えば、クラ
イアント端末装置102でアクセス権限の設定対象とな
った(表示対象の)XML文書、そのXML文書を画面
表示する際に用いたスタイルシート、さらに、そのXM
L文書を得るために用いたクエリを特定するための情報
が含まれていることが望ましい。
【0332】次に、図70〜図71に示すフローチャー
トを参照して、アクセス権限設定管理部201の処理動
作について説明する。
【0333】アクセス権限設定管理部201に、アクセ
ス権限設定要求とともに、クライアント端末装置102
から送られてきた、SID、ユーザの範囲、アクセスレ
ベル、アクセスタイプが入力されると(ステップS12
1)、まず、アクセス権限設定要求を基に、そのアクセ
ス権限設定要求にて特定しているスタイルシート中の当
該SID対応の記述部分に関連付けられた、表示対象の
XML文書中の要素のパスを取得する(ステップS12
2)。例えば、図57のステップS111において、識
別子「HID7」の付されたHTML文書中の記述部分
に対応する表示領域が選択されて、識別子「HID7」
に対応する図64に示したスタイルシート中の記述部分
の識別子「SID4」が、図70のステップS121で
入力したとする。このとき、図64に示したスタイルシ
ート中の識別子「SID4」の付された記述部分は、
「<xsl:value−of select=“/報
告者/名前”/>」である。この記述部分において、
「“/報告者/名前”/」は、表示対象のXML文書
(検索結果文書)中の当該要素のパスの一部を表したも
のである。また、当該スタイルシートを「SID4」の
付された記述部分から上の行に辿っていくと、「SID
1」の付された記述部分には、「“/報告者/名前”
/」の上流のパスとして、「”/報告書リスト/報告書
/“」が記述されている。従って、当該スタイルシート
の「SID4」対応の記述部分に関連付けられた、表示
対象のXML文書中の当該要素の全体としてのパス
は「”/報告書リスト/報告書/報告者/名前”」であ
ることがわかる。また、上記例の場合、識別子「HID
7」の付されたHTML文書中の記述部分に対応する表
示領域には、「山田太郎」が表示されていた。従って、
「”/報告書リスト/報告書/報告者/名前”」という
パスにて特定される要素であって、その要素値が「山田
太郎」である要素が、検索結果文書中のアクセス権限を
設定する箇所(構成要素)である。これをもとに、以
後、指定されたアクセスレベルに応じて、構造化文書デ
ータベースを探索していく。
【0334】アクセスレベルがスタイルと指定されてい
た場合(ステップS123)、アクセス権限設定部20
2は、アクセス権限設定管理部203のスタイルアクセ
ス権限管理部214に格納されている、図72に示すよ
うなスタイルアクセス権限テーブルに、指定されたアク
セス権限を登録する(ステップS124)。スタイルア
クセス権限テーブルは、図72に示すように、複数種類
あるスタイルシートのうちのどれであるかを識別するた
めのスタイルシートの識別子毎に、そのスタイルシート
中のアクセス権限の設定された記述部分を示すSIDと
ユーザ範囲とアクセスタイプとが登録されるようになっ
ている。例えば、アクセス権限を設定しようとしている
スタイルシートの識別子が「SSID1」であるとする
と、スタイルシート中の識別子「SID4」の付された
記述部分に対し、ユーザ範囲として「グループB」とい
うグループに、アクセスタイプとして「非表示」がアク
セス権限として設定されたことになる。
【0335】アクセスレベルがスタイルでないときは、
次に、ステップS125へ進む。
【0336】上記ステップS122において、表示対象
のXML文書(検索結果文書)中の「”/報告書リスト
/報告書/報告者/名前”」というパスで特定され、し
かも要素値が「山田太郎」である要素が取得された。す
なわち、これは、図63に示した表示対象のXML文書
中において、第6行目に記述されている要素が特定され
たことになる(ステップS125)。
【0337】図63に示したXML文書は、図77に示
すようなクエリを実行することにより得られたXML文
書である。なお、図77に示したクエリの識別子を「Q
RY1」であるとする。そこで、このクエリを基に、構
造化文書データベース中のリソースを検索する。
【0338】次に、クエリを解析して、当該クエリから
上記ステップS125で得た要素のパスに対応する記述
部分を取得する(ステップS126)。例えば、図77
に示したクエリと、このクエリを実行することにより得
られた図63に示したXML文書とを参照して、クエリ
の解析方法について説明する。なお、構造化文書データ
ベースに格納されている全てのクエリの各記述部分には
予め識別子QIDが与えられているものとする。
【0339】まず、図63の6行目に記述されている要
素「<名前>山田太郎</名前>」の当該XML文書中
でのパスは、「報告書/報告者/名前」であることがわ
かっているので、クエリにおいて、この要素を作り出し
ている部分に着目する。これはクエリの出力形式の記述
部、すなわち、<kf:select>タグで囲まれた
記述部を調べることでわかる。この場合、図77におい
て、当該<kf:select>タグで囲まれた記述部
で定めた記述形式(文書構造)から、先ほどの「<名前
>山田太郎</名前>」という要素を作り出した記述部
分は、識別子「QID5」の付された「<名前>$na
me</名前>」であることが容易に判別できる。
【0340】アクセスレベルがクエリと指定されていた
場合(ステップS127)、アクセス権限設定部202
は、アクセス権限設定管理部203のクエリアクセス権
限管理部213に格納されている、図73に示すような
クエリアクセス権限テーブルに、指定されたアクセス権
限を登録する(ステップS128)。クエリアクセス権
限テーブルは、図73に示すように、複数種類あるクエ
リのうちのどれであるかを識別するためのクエリの識別
子毎に、そのクエリ中のアクセス権限の設定された記述
部分を示すQIDとユーザ範囲とアクセスタイプとが登
録されるようになっている。例えば、上記例の場合、ア
クセス権限を設定しようとしているクエリの識別子が
「QRY1」であるとすると、当該クエリ中の識別子
「QID5」の付された記述部分に対し、ユーザ範囲と
して「グループB」というグループに、アクセスタイプ
として「非表示」がアクセス権限として設定されたこと
になる。
【0341】さて、次に、当該クエリの記述に基づき、
構造化文書データベース中から、ステップS125で得
られた要素、すなわち、「<名前>山田太郎</名前
>」の格納されている箇所(パス)を探索する(ステッ
プS129)。ここでは、まず、当該クエリ中の<k
f:from>タグで囲まれた記述部から、変数「$n
ame」が要素の値として関連付けられている記述部分
を探索する。この場合、16行目と22行目の記述部分
において、変数「$name」が要素「報告者」「名
前」のそれぞれの要素値に関連付けられている。すなわ
ち、「QID5」の付された記述部分「<名前>$na
me</名前>」は、<kf:from>タグで囲まれ
た記述部において、「”uix://root/報告書
DB”」以下にある「<報告者>$name</報告者
>」および「”uix://root/従業員DB”」
以下にある「<名前>$name</名前>」を出力結
果として出力するための記述であることがわかる。ま
た、変数「$name」はテキストであり、「山田太
郎」が指定されているので、これを条件として更にデー
タベース中のパスを検索する。
【0342】そこで、アクセス権限設定部202は、図
78に示すような、構造化文書データベースの「”ui
x://root/報告書DB”」以下から、「山田太
郎」という値を持つ「報告者」という構成要素のパスを
検索するためのクエリと、図79に示すような、構造化
文書データベースの「”uix://root/従業員
DB”」以下から、「山田太郎」という値を持つ「名
前」という要素名の構成要素へのパスを検索するための
クエリとを生成して(発行して)、それを検索要求処理
部3へ送る。
【0343】なお、上記例の場合、図65の表示画面上
の、HID7の「山田太郎」という文字列の表示されて
いるテキストボックスがアクセス権限を設定する領域と
して指定されたので、これに対応するように、図78,
図79に示したクエリでは要素値「山田太郎」をもつ構
成要素を検索条件としているが、もし、HID6の「報
告者」という文字列の表示されているテキストボックス
が指定されているのであれば、要素値「山田太郎」をも
つ構成要素を検索条件とする必要がない。すなわち、<
kf:where>タグで囲まれた記述部は必要ない。
【0344】検索要求処理部3では、前述したようにし
て、各クエリに記述された検索条件に基づき、構造化文
書データベースを検索する。すると、図80に示すよう
に、「”uix://root/報告書DB”」以下に
ある「山田太郎」という値を持つ「報告者」という要素
名の構成要素301へのパスと、「”uix://ro
ot/従業員DB”」以下から、「山田太郎」という値
を持つ「名前」という要素名の構成要素302へのパス
を取得することができる。
【0345】例えば、構成要素301のパスが、「ui
x://root/報告書DB/報告書[0]/報告
者」であり、構成要素302のパスが、「uix://
root/従業員DB/従業員[3]/名前」であると
する。パスは必ずしも1つだけ検索されるのでなく、場
合によっては複数検索される場合がある。
【0346】アクセスレベルがデータと指定されていた
場合(図71のステップS131)、アクセス権限設定
部202は、アクセス権限設定管理部203のデータア
クセス権限管理部212に格納されている、図74に示
すようなデータアクセス権限テーブルに、指定されたア
クセス権限を登録する(ステップS132)。データア
クセス権限テーブルは、図74に示すように、ステップ
S130で取得したパスとユーザ範囲とアクセスタイプ
とが登録されるようになっている。例えば、上記例の場
合、アクセス権限を設定しようとしているパスが「ui
x://root/報告書DB/報告書[0]/報告
者」であり、このパスにより表された格納エリアに格納
されている要素(要素値が「山田太郎」で要素名「報告
者」の構成要素)に対し、ユーザ範囲として「グループ
B」というグループに、アクセスタイプとして「伏せ字
(○)」がアクセス権限として設定されたことになる。
【0347】一方、アクセスレベルがスキーマと指定さ
れていた場合(ステップS133)、ステップS134
へ進み、ステップS130で取得したパスにスキーマが
設定されているかをチェックする。例えば、ステップS
130で、「uix://root/報告書DB/報告
書[0]/報告者」というパスを取得したとき、このパ
スにて特定される「報告者」という構成要素(ノード)
301に、スキーマが存在する旨の属性値がセットされ
ているときは(ステップS134)、当該スキーマ文書
の「報告者」という構成要素に対応する記述部分に対
し、アクセス権限を設定する。すなわち、アクセス権限
設定部202は、アクセス権限設定管理部203のスキ
ーマ権限管理部211に格納されている、図75に示す
ようなスキーマアクセス権限テーブルに、指定されたア
クセス権限を登録する(ステップS135)。
【0348】例えば、上記の例の場合、「報告者」とい
う構成要素(ノード)301を含む、「報告書DB」ノ
ード以下に、図81に示すスキーマ文書が格納されてい
るとする。図81に示すスキーマ文書において、構成要
素301に対応する記述部分は、実線で囲まれた部分で
ある。構造化文書データベース中で、この記述部分を特
定するパスは、例えば、「uix://root/sc
hema/elementType[4]/name」
であるとする。この場合、スキーマアクセス権限テーブ
ルには、図75に示すように、スキーマ文書の「報告
者」という構成要素に対応する記述部分を特定するパ
ス、すなわち、「uix://root/schema
/elementType[4]/name」とユーザ
範囲とアクセスタイプとが登録されるようになってい
る。例えば、上記例の場合、アクセス権限を設定しよう
としているスキーマ文書の記述部分(構成要素)のパス
は「uix://root/schema/eleme
ntType[4]/name」であり、このパスによ
り特定された記述部分に対し、ユーザ範囲として「グル
ープA」というグループに、アクセスタイプとして「モ
ザイク」がアクセス権限として設定されたことになる。
【0349】このように、スキーマにアクセス権限を設
定することにより、以後、このスキーマの設定された構
造化文書データベース中の格納領域(例えば、上記例の
場合、「報告書DB」ノード以下の格納領域)に格納さ
れた、このスキーマが適用される全ての構造化文書に対
して、スキーマアクセス権限テーブルに登録されたのと
同一のアクセス権限が適用される。
【0350】さて、アクセスレベルがパスに対しても設
定可能である。例えば、図82に示すように、「報告書
DB」ノード以下には、複数の「報告書」情報(構造化
文書)が格納されている。この複数の「報告書」情報の
それぞれは、「報告者」という要素名の構成要素(ノー
ド)を持つ。そこで、この複数の「報告書」情報中の1
つに含まれる「報告者」ノードが図70のステップS1
30で特定されたとき、他の全ての「報告書」情報中の
「報告者」ノードについても、アクセス権限を設定する
ことも可能である。アクセスレベルがパスと指定された
ときは、この他の全ての「報告書」情報中の「報告者」
ノードに対し、同一のアクセス権限を設定する。この効
果は、「報告書DB」ノード以下にスキーマが設定され
ている場合に、スキーマに対しアクセス権限を設定する
場合(図71のステップS135)と同じである。従っ
て、ステップS133でアクセスレベルがスキーマと設
定されている場合に、ステップS134で、当該スキー
マが存在しないときは、ステップS137へ進むように
してもよい。また、図71には示していないが、ステッ
プS136でアクセスレベルがパスと設定されている場
合に、例えば、「uix://root/報告書DB/
報告書[0]/報告者」というパスにて特定される「報
告者」という構成要素(ノード)301にスキーマが設
定されているときは、ステップS135に進みようにし
てもよい。
【0351】アクセスレベルがパスと指定されていた場
合(ステップS136)、ステップS137へ進み、ア
クセス権限設定部202は、構造化文書データベースの
「”uix://root/報告書DB”」以下から、
「報告者」という構成要素のパスを検索するためのクエ
リ生成して(発行して)、それを検索要求処理部3へ送
る。
【0352】検索要求処理部3では、前述したようにし
て、クエリに記述された検索条件に基づき、構造化文書
データベースを検索する。すると、「”uix://r
oot/報告書DB”」以下にある全ての「報告者」と
いう要素名の構成要素へのパスを取得することができ
る。このときのクエリ中の要素値を検索条件とする「記
述はない。
【0353】アクセス権限設定部202は、アクセス権
限設定管理部203のパスアクセス権限管理部215に
格納されている、図76に示すようなパスアクセス権限
テーブルに、指定されたアクセス権限を登録する(ステ
ップS138)。パスアクセス権限テーブルは、図76
に示すように、ステップS137で取得したパスとユー
ザ範囲とアクセスタイプとが登録されるようになってい
る。例えば、上記例の場合、アクセス権限を設定しよう
としているパスが「uix://root/報告書DB
/報告書[1]/報告者」、「uix://root/
報告書DB/報告書[2]/報告者」、…であり、これ
らパスにより特定された格納エリアに格納されている要
素(要素名「報告者」の構成要素)に対し、ユーザ範囲
として「グループB」というグループに、アクセスタイ
プとして「伏せ字(○)」がアクセス権限として設定さ
れたことになる。
【0354】このように、上記実施形態では、構造化文
書データベースを検索した結果得られた表示対象のXM
L文書(検索結果文書)は、クライアント端末装置10
2で所定のスタイルシート(検索結果文書を所定の表示
形式で表示するために用いた検索結果文書の文書構造の
変換規則)を適用してHTML文書に変換された後、表
示画面上に表示される。変換の際には、HTML文書の
1つの記述部分を1つの表示領域(テキストボックス)
で表示するようなスタイルシートをXML文書に適用す
る。この表示画面上で、所望の表示領域(テキストボッ
クス)を指定することにより、クライアント端末装置1
02の描画部115は、(a)このテキストボックスに
表示されているHTML文書の記述部分を特定すること
ができるので、さらに、クライアント端末装置102の
アクセス権限設定部116は、対応テーブル114を参
照して、当該HTML文書の記述部分に対応するスタイ
ルシート中の記述部分を特定する。次に、(b)スタイ
ルシート中の当該記述部分に関連付けられた検索結果文
書中の要素のパスを特定した後、(c)当該検索結果文
書を得るために用いたクエリ中の出力形式の記述部から
当該パスに対応する記述部分を特定する。そして、
(d)構造化文書データベースにアクセスして(クエリ
を発行して)、当該記述部分に関連付けられた構造化文
書データベース中の要素のパス(パスリスト)を取得す
る。以上のように、ユーザにより所望の表示領域が指定
されると、ユーザにより指定されたレベルに応じて、該
指定された表示領域に対応するスタイルシートの記述部
分、さらに、それに対応するクエリ中の記述部分、さら
にそれに関連付けられた構造化文書データベース中の要
素を順次特定していくことにより、指定されたレベルに
アクセス権限を設定することが容易に行える。ユーザ
は、検索結果の表示画面上で、少なくとも所望の表示領
域と、アクセスレベルを指定するだけで、構造化文書デ
ータベース中の構成要素にアクセス権限の設定が行え
る。さらに、スタイルシートの記述部分、クエリ中の記
述部分、当該要素を含む構造化文書と同じ文書構造を持
つ他の構造化文書中の当該要素と同じ要素名の要素に対
しても、それ対応のレベルを指定するだけでアクセス権
限を設定することができるので、各種アプリケーション
に柔軟に対処できる。
【0355】なお、上記アクセス権限の設定は、1つの
表示領域を選択して、その表示領域に対応する、スタイ
ルシート、クエリ、構造化文書データベース中の要素
(データ)、スキーマ、パスのうちの1つレベルにアク
セス権限を設定する場合について説明したが、一度に複
数の表示領域を選択して、それらに対応する上記複数の
レベルのうちの1つのレベルに一括して(ユーザ範囲、
アクセスタイプを同じくした)アクセス権限を設定する
ことも上記同様にして容易に行える。
【0356】また、スタイルに対しアクセス権限を設定
した場合、スタイル権限テーブルに登録された内容に基
づき、スタイルシート自体に、指定されたユーザ範囲や
アクセスタイプを登録するようにしてもよい。この場
合、例えば、図83の実線で囲まれた部分に示すよう
に、スタイルシート中のアクセス権限を設定する記述部
分(SIDにて特定される記述部分)に、ユーザ範囲と
アクセスタイプを書き込み、クライアント端末装置10
2が、当該スタイルシートを適用する段階で、このアク
セス権限の記述を解釈できる機能があればよい。
【0357】また、クエリに対しアクセス権限を設定し
た場合、クエリ権限テーブルに登録された内容に基づ
き、クエリ文書自体に、指定されたユーザ範囲やアクセ
スタイプを登録するようにしてもよい。この場合も例え
ば、図84の実線で囲まれた部分に示すように、クエリ
文書中のアクセス権限を設定する記述部分(QIDにて
特定される記述部分)に、ユーザ範囲とアクセスタイプ
を書き込み、検索要求処理部3が、当該クエリを実行す
る際に、このアクセス権限の記述を解釈できる機能があ
ればよい。
【0358】次に、上記のようにしてアクセス権限が設
定された後、クエリを用いた検索実行結果の表示例につ
いて説明する。
【0359】ここでは、例えば、図62の中、「HID
7」という識別子を持つ記述部分に対応する表示領域3
07と、「HID11」という識別子を持つ記述部分に
対応する表示領域311と、「HID13」という識別
子を持つ記述部分に対応する表示領域313とが指定さ
れて、「山田太郎」という個人をユーザ範囲としたアク
セス権限が設定されたとする。表示領域307、311
には、アクセスタイプとして「伏せ字」が指定され、表
示領域313にはアクセスタイプとして「モザイク」が
指定されたとする。
【0360】さらに、上記3つの表示領域に、アクセス
レベルが「データ」と指定されてアクセス権限が設定さ
れたとする。この場合、「山田太郎」というユーザが、
クライアント端末装置102から、所定の操作を行っ
て、図1に示した構造化文書管理システムにアクセスし
て、図77に示したクエリを用いて検索を行ったとす
る。なお、ユーザ名「山田太郎」は、構造化文書管理シ
ステムにアクセスする際に、クライアント端末装置10
2を介して、構造化文書管理システムの要求制御部1,
アクセス権限設定管理部201にも入力するようになっ
ている。
【0361】すると、検索結果として得られた検索結果
文書(XML文書)は、クライアント端末装置102の
表示画面には、図85に示すように表示される。すなわ
ち、表示領域307、311に表示されるデータは、伏
せ字「×」や「○」で表示されている。また、表示領域
313は、モザイクがかけられて表示されている。さら
に、表示領域307に表示されるデータと同じデータを
表示している表示領域315にも、表示領域307と同
様の伏せ字「×」が表示されている。これは、表示領域
307に表示されているデータ(この場合、テキスト)
は、そのデータを要素値とする構造化文書データベース
中の構成要素、すなわち、例えば、「uix://ro
ot/報告書DB/報告書[0]/報告者」というパス
にて表現される論理的な格納エリアに格納されている構
成要素と、「uix://root/従業員DB/従業
員[3]/名前」というパスにて表現される論理的な格
納エリアに格納されている構成要素とに対しアクセス権
限が設定されているからである。
【0362】検索要求処理部3では、例えば、図77に
示したクエリを実行して、検索条件を満たす構成要素を
構造化文書データベースから取り出す際に、アクセス権
限設定管理部201と通信を行い、アクセス権限設定管
理部201にて管理されている図74に示したようなア
クセス権限テーブルに基づき、「uix://root
/報告書DB/報告書[0]/報告者」というパスにて
特定される構成要素と、「uix://root/従業
員DB/従業員[3]/名前」というパスにて特定され
る構成要素とに、アクセス権限が設定されていることを
知る。
【0363】このアクセス権限の設定された、「ui
x://root/報告書DB/報告書[0]/報告
者」というパスにて特定される構成要素と、「uix:
//root/従業員DB/従業員[3]/名前」とい
うパスにて特定される構成要素は、図77に示したクエ
リにより、検索結果文書中の「報告書/報告者/名前」
というパスで特定される検索結果文書の構成要素として
用いられる(バインドされている)。この段階で、当該
検索結果文書中に当該構成要素のアクセスタイプなどを
クライアント端末装置102の所定の機能により解釈可
能なように書き込むようにしてもよい。
【0364】あるいは、検索要求処理部3で検索結果文
書を作成した段階で、アクセス権限設定管理部201
が、この検索結果文書中の構成要素にアクセス権限が設
定されているか否かをアクセス権限テーブルを参照する
ことによりチェックして、当該検索結果文書中のアクセ
ス権限の設定された構成要素にアクセスタイプなどをク
ライアント端末装置102の所定の機能により解釈可能
なように書き込むようにしてもよい。
【0365】この検索結果文書は、図64に示すような
スタイルシートとともに、検索要求元のクライアント端
末装置102に送信される。
【0366】図64に示すようなスタイルシートによ
り、「報告書/報告者/名前」というパスで特定される
検索結果文書の構成要素は、図85に示すように、表示
領域307と315の両方に表示されるように、当該検
索結果文書としてのXML文書をHTML文書に変換す
るようになっている。なお、図64に図示していない
が、図64のスタイルシートには、「報告書/報告者/
名前」というパスで特定される検索結果文書の構成要素
を、図85に示すように、表示領域307と315の両
方に表示するようなHTML文書に変換するための変換
規則が記述されている。
【0367】表示領域307にアクセスレベルが「スタ
イル」と指定されてアクセス権限が設定されたとする。
この場合、スタイルシートには、図83に示すように、
アクセス権限が書き込まれているものとする。また、ク
ライアント端末装置102で検索結果文書をHTML文
書に変換する際に、当該スタイルシート中のアクセス権
限に関する記述を解釈する機能が必要である。スタイル
シートには、「報告書/報告者/名前」というパスで特
定される検索結果文書の構成要素を表示領域307に表
示するようなHTML文書に変換するための記述部分に
は、例えばユーザ範囲とアクセスタイプとが書き込まれ
ているが、表示領域315に表示するようなHTML文
書に変換するための記述部分には、そのようなアクセス
権限に関する記述は書き込まれていない。従って、図8
6に示すように、表示領域315には、伏せ字ではな
く、実際のデータが表示される。
【0368】「山田太郎」というユーザが、クライアン
ト端末装置102から、所定の操作を行って、図1に示
した構造化文書管理システムにアクセスして、図77に
示したクエリとは異なるクエリを用いて検索を行ったと
する。このクエリは、例えば、構造化文書データベース
中の「従業員DB」ノード以下に格納されている情報か
ら所定の条件を満たす「従業員」情報を検索するもので
あるとする。この検索の結果得られる検索結果文書は、
上記所定の条件を満たす複数の「従業員」情報を合成し
たものであるとする。
【0369】この検索結果文書には、上記のようにして
アクセス権限の設定された「uix://root/従
業員DB/従業員[3]/名前」というパスにて特定さ
れる構成要素が含まれているとする。すると、上記同様
にして、図87に示すように、この構成要素を表示する
表示領域321には伏せ字「x」による表示がなされて
いる。
【0370】しかし、表示領域307にアクセスレベル
が「クエリ」と指定されてアクセス権限が設定されたと
する。すなわち、表示領域307に表示されるデータに
対応する検索結果文書中の構成要素に対応する図77に
示したクエリ中の記述部分に、(検索結果文書中の構成
要素に対する)アクセス権限が設定されていた場合に
は、今回のクエリは図77に示したクエリとは異なるも
のであるから、図87に示した表示領域321には伏せ
字「x」ではなく、実際のデータ、すなわち、「山田太
郎」が表示される。
【0371】このように、アクセス権限をスタイルシー
ト、クエリといったレベルに設定することにより、ある
スタイルシートを用いていたときには表示されなかった
データが他の異なるスタイルシートを用いれば表示され
る、あるクエリを用いた検索結果では表示されなかった
データが他の異なるクエリを用いたときには表示される
といった、柔軟なアクセス権限の設定が可能になる。
【0372】以上説明したように、上記実施形態は、1
つの表示領域(テキストボックス)には、1つの構成要
素の要素名あるいは要素値が表示されていて、クエリに
よって検索した結果得られた検索結果文書を表示した表
示画面上の複数の表示領域のうちの1つが選択された
ら、その選択された表示領域に表示されているデータ
(要素名あるいは要素値)を起点にして、スタイルシー
ト、検索結果文書、クエリ、構造化文書データベース中
の構造化文書とレベルを掘り下げていく過程に存在す
る、ユーザにより指定されたレベルのアクセス権限の設
定対象にアクセス権限を設定するものであり、ユーザ
は、検索結果の表示画面上で、少なくとも所望の表示領
域と、アクセスレベルを指定するだけで、構造化文書デ
ータベース中の構成要素にアクセス権限の設定が行え
る。さらに、スタイルシートの記述部分、クエリ中の記
述部分、当該要素を含む構造化文書と同じ文書構造を持
つ他の構造化文書中の当該要素と同じ要素名の要素に対
しても、それ対応のレベルを指定するだけでアクセス権
限を設定することができるので、構造化文書データベー
スに格納されている構造化文書の構成要素の用途や表示
形式(検索結果として表示する際の表示形式)に応じ
て、異なる内容のアクセス権限を容易に設定することが
できる。
【0373】なお、上記実施形態では、アクセス権限の
設定は、クエリを用いて、構造化文書データベースを検
索した結果得られた文書を表示した表示画面上で行った
が、この場合に限らず、例えば、前述した取得コマンド
「getXML」を実行する際においても、そのコマン
ドにて指定されたパス以下の文書(を構成する全ての構
成要素)に、あるいは、当該指定されたパス以下の文書
の一部の構成要素に、上記したようなアクセス権限が設
定されている場合には、当該指定されたパス以下の文書
を表示する際には、そのアクセス権限の設定された構成
要素を非表示にしたり、特殊表示にしたりすればよい。
【0374】また、上記実施形態では、アクセスタイプ
として、非表示にするか、特殊表示にするかのいずれか
を選択するようになっているが、アクセスタイプとして
は、これ以外に、削除禁止、編集禁止などがあってもよ
い。削除禁止、編集禁止といいた構造化文書データベー
ス中の構成要素自体に対する操作を制限するようなアク
セスタイプを設定するときは、このアクセスタイプとと
ともに設定されるアクセスレベルはデータレベルであ
る。
【0375】例えば、アクセスタイプとして削除禁止が
構造化文書データベース中のある構成要素に設定される
と、当該構成要素あるいは、そのような構成要素を含む
構造化文書データベース中の論理的なエリア(パス)を
指定した領域削除コマンドが実行されても、少なくとも
当該アクセス権限の設定された構成要素は削除されるこ
とはない。また、アクセスタイプとして編集禁止が構造
化文書データベース中のある構成要素に設定されると、
当該構成要素の要素値を書き換えることはできない。
【0376】なお、本発明の実施の形態に記載した本発
明の手法は、コンピュータに実行させることのできるプ
ログラムとして、磁気ディスク(フロッピー(登録商
標)ディスク、ハードディスクなど)、光ディスク(C
D−ROM、DVDなど)、半導体メモリなどの記録媒
体に格納して頒布することもできる。
【0377】また、本発明は、上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。さらに、上記実
施形態には種々の段階の発明は含まれており、開示され
る複数の構成用件における適宜な組み合わせにより、種
々の発明が抽出され得る。例えば、実施形態に示される
全構成要件から幾つかの構成要件が削除されても、発明
が解決しようとする課題の欄で述べた課題(の少なくと
も1つ)が解決でき、発明の効果の欄で述べられている
効果(のなくとも1つ)が得られる場合には、この構成
要件が削除された構成が発明として抽出され得る。
【0378】
【発明の効果】以上説明したように、本発明によれば、
検索結果の表示画面上で、少なくとも所望の表示領域と
アクセスレベルを指定するだけで、構造化文書データベ
ース中の所望の構成要素に、用途や表示形式などに応じ
た所望のアクセス権限を容易にしかもきめ細かく設定す
ることができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る構造化文書管理システ
ムの構成例を示した図。
【図2】図1に示した構造化文書管理システムの一利用
形態を示したもので、WWWのバックエンドで、構造化
文書管理システムが動作している場合を示した図。
【図3】XMLで記述された構造化文書の一例を示した
図。
【図4】図3の構造化文書の文書構造を模式的に示した
図。
【図5】追加コマンドの機能を説明するための図で、構
造化文書データベースの初期状態に追加コマンドを実行
した場合について示している。
【図6】図5(b)に示した状態の構造化文書データベ
ースに対し、取得コマンドを実行した場合の処理結果を
示した図。
【図7】図5(b)に示した状態の構造化文書データベ
ースに対し、追加コマンドを実行して1つの「特許」情
報の文書オブジェクトツリーを追加した場合を示してい
る。
【図8】図5(b)に示した状態の構造化文書データベ
ースに対し、追加コマンドを実行して3つの「特許」情
報の文書オブジェクトツリーを追加した場合を示してい
る。
【図9】要素名生起インデックスの格納例を示した図。
【図10】データ生起インデックスの格納例を示した
図。
【図11】図8に示した状態の構造化文書データベース
に対して、3つの「特許」情報を取り出すための取得コ
マンドを実行した場合の実行結果を示した図。
【図12】XML文書の文書構造を定義するスキーマの
一例を示した図。
【図13】図8に示した状態の構造化文書データベース
に、スキーマ格納コマンドを実行して、図12に示した
スキーマを追加格納(設定)した場合を示した図。
【図14】スキーマが設定されて、スキーマが存在して
いる旨の属性値のセットされた文書オブジェクトツリー
を示した図。
【図15】各オブジェクトファイルに、スキーマが存在
している旨の属性値が格納されている様子を概念的に示
した図。
【図16】必要に応じて検索で使用される概念階層を構
造化文書で表現した例を示した図。
【図17】必要に応じて検索で使用される概念階層を構
造化文書で表現した例を示した図。
【図18】図8に示した状態の構造化文書データベース
に対し、追加コマンドを実行して、図16,図17に示
した「概念」情報の文書オブジェクトツリーを追加した
場合を示した図。
【図19】図8に示した状態の構造化文書データベース
に対し、追加コマンドを実行して、図16,図17に示
した「概念」情報の文書オブジェクトツリーを追加した
場合を示した図。
【図20】図1の構造化文書管理システムの文書格納処
理動作について説明するためのフローチャート。
【図21】図20のステップS9の処理(合成文書作成
部の処理)について説明するためのフローチャート
【図22】追加コマンド中のパラメータの格納文書の文
書オブジェクトツリーを構造化文書データベースから取
得した文書オブジェクトツリーに挿入して得られた合成
文書の文書オブジェクトツリーをXML文書に変換した
結果であって、テンポラリファイルAに格納される合成
文書の一例を示した図。
【図23】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。
【図24】テンポラリファイルAに格納される合成文書
の他の例を示した図。
【図25】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。
【図26】図1の構造化文書管理システムの文書取得処
理動作について説明するためのフローチャート。
【図27】図1の構造化文書管理システムの文書削除処
理動作について説明するためのフローチャート。
【図28】図27のステップS46の処理(合成文書作
成部の処理(削除コマンド用))について説明するため
のフローチャート。
【図29】テンポラリファイルAに格納される合成文書
のさらに他の例であって、削除コマンドの実行時に作成
される合成文書の一例を示した図。
【図30】テンポラリファイルBに格納される、構造化
文書データベースから取得されたスキーマ文書の一例を
示した図。
【図31】ユーザインタフェースとしての画面の表示例
を示した図。
【図32】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。
【図33】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。
【図34】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示した図。
【図35】妥当性のチェックでエラーとなっときにクラ
イアント端末へ返すメッセージの表示例を表示例を示し
た図。
【図36】文書の格納/削除を行うためのユーザインタ
フェースとしての画面の表示例を示したもので、文書取
得動作を説明するための図。
【図37】スキーマの設定を行うためのユーザインタフ
ェースとしての画面の表示例を示したもので、スキーマ
の設定動作を説明するための図。
【図38】スキーマの取得するためのユーザインタフェ
ースとしての画面の表示例を示したもので、取得された
スキーマの表示例を示している。
【図39】クエリ(XML文書)の一例を示した図。
【図40】単純検索のクエリ(XML文書)の一例を示
した図。
【図41】図40の単純検索のクエリを用いた検索結果
(XML文書)を示した図。
【図42】概念検索のクエリ(XML文書)の一例を示
した図。
【図43】図1の構造化文書管理システムの文書検索処
理動作について説明するためのフローチャート。
【図44】文書検索を行うためのユーザインタフェース
としての画面の表示例を示した図。
【図45】図44に示した画面上から入力された情報に
基づき作成されるクエリを示した図。
【図46】図42に示したクエリの構造化文書データベ
ース内における格納例を示した図。
【図47】文書検索を行うためのユーザインタフェース
としての画面の表示例であって、スキーマの検索処理動
作を説明するための図。
【図48】スキーマ検索のクエリの一例を示した図。
【図49】クエリを検索するためのクエリの一例を示し
た図。
【図50】特許調査における構造化文書データベースの
一例を示した図。
【図51】概念検索のための入力画面の表示例を示した
図。
【図52】図51に示した入力画面上の入力情報に対応
するクエリを示した図。
【図53】図52に示したクエリに対応する検索結果と
してのXML文書を示した図。
【図54】特許マップの一例を示した図。
【図55】クライアント端末装置の要部の構成例を示し
た図。
【図56】クライアント端末装置で構造化文書管理シス
テムから送信されてきたXML文書を表示する際の処理
動作を説明するためのフローチャート。
【図57】アクセス権限の設定のためのクライアント端
末装置における処理動作を説明するためのフローチャー
ト。
【図58】アクセス権限設定管理部の機能ブロック図。
【図59】構造化文書データベースの論理構造の一部を
模式的に示した図。
【図60】XMLで記述された構造化文書の一例とし
て、「報告書DB」ノード以下の論理的な格納エリアに
格納されている「報告書」情報を示した図。
【図61】XMLで記述された構造化文書の一例とし
て、「従業員DB」ノード以下の論理的な格納エリアに
格納されている複数の「報告書」情報を示した図。
【図62】クライアント端末装置のディスプレイ装置の
画面表示例を示したもので、クライアント端末装置から
入力されたクエリを実行した結果得られたXML文書
(検索結果文書)の表示例を示した図。
【図63】図62に対応する検索結果文書を示した図。
【図64】図63に示した検索結果文書を図62に示し
たような表示形式で表示するためのHTML文書に変換
するためのスタイルシートの一例を示した図。
【図65】HTML文書の各記述部分と各記述部分に与
えられている識別子HIDとの対応を説明するための
図。
【図66】HTML文書中の記述部分と、スタイルシー
ト中の記述部分との対応関係を示した対応テーブルの一
例を示した図。
【図67】ユーザの範囲を入力するためのGUI画面の
一例を示した図。
【図68】アクセスレベルを入力するためのGUI画面
の一例を示した図。
【図69】アクセスタイプを入力するためのGUI画面
の一例を示した図。
【図70】アクセス権限設定管理部で、アクセス権限を
設定するための処理動作を説明するためのフローチャー
ト。
【図71】アクセス権限設定管理部で、アクセス権限を
設定するための処理動作を説明するためのフローチャー
ト。
【図72】スタイルアクセス権限管理部に格納されてい
るスタイルアクセス権限テーブルの一例を示した図。
【図73】クエリアクセス権限管理部に格納されている
クエリアクセス権限テーブルの一例を示した図。
【図74】データアクセス権限管理部に格納されている
データアクセス権限テーブルの一例を示した図。
【図75】スキーマアクセス権限管理部に格納されてい
るスキーマアクセス権限テーブルの一例を示した図。
【図76】パスアクセス権限管理部に格納されているパ
スアクセス権限テーブルの一例を示した図。
【図77】図63に示したXML文書を得るために用い
たクエリ文書を示した図。
【図78】図77に示したクエリの記述を基に、アクセ
ス権限の設定対象の構成要素を構造化文書データベース
から検索するために発行するクエリの一例を示した図。
【図79】図77に示したクエリの記述を基に、アクセ
ス権限の設定対象の構成要素を構造化文書データベース
から検索するために発行するクエリの一例を示した図。
【図80】図78、79に示したクエリを実行したこと
により得られた構造化文書データベース中の構成要素の
論理的な格納位置(パス)を示した図。
【図81】図62の表示領域307が指定され、しかも
アクセスレベルがスキーマと指定されたときに、アクセ
ス権限が設定されるスキーマ中の記述部分を示した図。
【図82】図62の表示領域307が指定され、しかも
アクセスレベルがパスと指定されたときに、アクセス権
限が設定される構成要素を示した図。
【図83】アクセス権限の内容が書き込まれたスタイル
シートの一例を示した図。
【図84】アクセス権限の内容が書き込まれたクエリの
一例を示した図。
【図85】データレベルでアクセス権限が設定された後
に、図77に示したクエリを実行した際に得られた検索
結果文書の表示例を示した図。
【図86】スタイルレベルでアクセス権限が設定された
後に、図77に示したクエリを実行した際に得られた検
索結果文書の表示例を示した図。
【図87】データレベルでアクセス権限が設定された後
に、図77に示したクエリとは異なるクエリを実行した
際に得られた検索結果文書の表示例を示した図。
【図88】図65に示した表示画面に対応するHTML
文書の一部を示した図。
【符号の説明】
1…要求制御部 2…アクセス要求処理部 3…検索要求処理部 4…データアクセス部 5…文書記憶部 6…インデックス記憶部 11…受付要求部 12…結果処理部 21…文書格納部 22…文書取得部 23…文書削除部 41…文書オブジェクトツリー格納部 42…文書オブジェクトツリー削除部 43…文書オブジェクトツリー取得部 44…文書文字列取得部 45…パスから文書オブジェクトツリー取得部 46…文書パーサ 47…合成文書作成部 48…インデックス更新部 100…構造化文書管理システム 101…WWWサーバ 102…クライアント端末 103…WWWブラウザ 111…XML文書受信部 112…XML/HTML変換部 113…テーブル作成部 114…対応テーブル 115…描画部 116…アクセス権限設定部 117…送信部 121…ディスプレイ装置 122…入力装置 201…アクセス権限設定管理部 202…アクセス権限設定部 203…アクセス権限管理部 211…スキーマアクセス権限管理部 212…データアクセス権限管理部 213…クエリアクセス権限管理部 214…スタイルアクセス権限管理部 215…パスアクセス権限管理部
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/14 310 G06F 12/14 310K 17/21 501 17/21 501Z 570 570M (72)発明者 新名 博 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 磯部 庄三 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 服部 雅一 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B009 NA05 RB31 TB13 5B017 AA07 BA06 CA16 5B075 KK07 KK43 KK63 ND03 ND04 ND36 NK02 PP30 PQ02 PQ15 PQ62 UU06 5B082 EA11

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の構造化文書を格納した階層化され
    た論理構造を持つ構造化文書データベースの前記論理構
    造を構成する前記構造化文書の構成要素に対するアクセ
    ス権限設定方法であって、 前記構造化文書データベースに対し前記論理構造に基づ
    き所望の構成要素を検索する検索要求文を用いて検索し
    た結果得られた複数の構成要素からなる検索結果文書を
    表示した表示画面上の任意の表示領域が指定されたと
    き、その指定された表示領域に表示されているデータに
    対応する前記検索結果文書中の第1の構成要素を特定
    し、この第1の構成要素に関連付けられた前記検索要求
    文中の第2の記述部分の記述に基づき、前記第1の構成
    要素に対応する前記構造化文書データベース中の第2の
    構成要素を検索し、この第2の構成要素に対して、少な
    くとも該第2の構成要素にアクセスが制限されるユーザ
    の範囲を定めてアクセス権限を設定することを特徴とす
    るアクセス権限設定方法。
  2. 【請求項2】 複数の構造化文書を格納した階層化され
    た論理構造を持つ構造化文書データベースの前記論理構
    造を構成する前記構造化文書の構成要素に対するアクセ
    ス権限設定方法であって、 前記構造化文書データベースから前記論理構造に基づき
    所望の構成要素を検索するための検索要求文を用いて検
    索した結果得られた複数の構成要素からなる検索結果文
    書を表示した表示画面上の任意の表示領域が指定された
    とき、この指定された表示領域に表示されているデータ
    に関連付けられた、前記検索結果文書を所定の表示形式
    で表示するために用いた前記検索結果文書の文書構造の
    変換規則中の第1の記述部分と、この第1の記述部分に
    関連付けられた前記検索結果文書中の第1の構成要素と
    を抽出し、 少なくとも、前記変換規則中の前記第1の記述部分にア
    クセス権限を設定する第1のレベルと、前記第1の構成
    要素に対応する、前記検索要求文中の第2の記述部分に
    アクセス権限を設定する第2のレベルと、前記検索要求
    文中の前記第2の記述部分に関連付けられた第3の記述
    部分の記述に基づき特定される前記構造化文書データベ
    ース中の前記第1の構成要素に対応する第2の構成要素
    にアクセス権限を設定する第3のレベルを含む複数のレ
    ベルのうち、ユーザにより指定されたレベルに、少なく
    とも、そのレベルについてアクセスが制限されるユーザ
    の範囲を定めてアクセス権限を設定することを特徴とす
    るアクセス権限設定方法。
  3. 【請求項3】前記複数のレベルには、前記構造化文書デ
    ータベースに格納されている前記第2の構成要素を含む
    構造化文書と同じ文書構造を持つ他の構造化文書に含ま
    れる前記第2の構成要素の要素名と同じ要素名の構成要
    素にアクセス権限を設定する第4のレベルを含むことを
    特徴とする請求項2記載のアクセス権限設定方法。
  4. 【請求項4】ユーザにより前記第4のレベルが指定され
    たとき、前記第2の構成要素を含む構造化文書と同じ文
    書構造を持つ複数の構造化文書が格納されている前記論
    理構造に従って指定される前記構造化データベースの論
    理的なエリアに、そのエリア内に格納される構造化文書
    が従うべき文書構造を定義した文書構造定義文書が存在
    するときは、当該文書構造定義文書中の前記第2の構成
    要素と同じ要素名の構成要素に関する記述部分に、前記
    第2の構成要素と同じ要素名の構成要素に対する前記ア
    クセス権限を設定することを特徴とする請求項3記載の
    アクセス権限設定方法。
  5. 【請求項5】 前記変換規則は、前記検索結果文書を該
    検索結果文書の各構成要素の少なくとも要素値をそれぞ
    れ1つの表示領域で表示する表示用文書に変換するため
    のものであって、 前記変換規則を用いて前記検索結果文書を表示用文書に
    変換する際には、該表示用文書の記述部分と、該記述部
    分に関連する前記変換規則中の記述部分との対応関係を
    抽出し、 前記表示画面上の任意の表示領域が指定されたとき、該
    指定された表示領域に表示されているデータに対応する
    前記表示用文書中の第4の記述部分に対応する前記変換
    規則中の前記第1の記述部分を前記対応関係に基づき抽
    出することを特徴とする請求項2記載のアクセス権限設
    定方法。
  6. 【請求項6】異なる文書構造の複数の構造化文書を、階
    層化された論理構造を持つ構造化文書データベースで管
    理する構造化文書管理システムにおいて、 前記構造化文書データベースから前記論理構造に基づき
    所望の構成要素を検索するための検索要求文を用いて検
    索する第1の検索手段と、 この第1の検索手段で検索した結果得られた複数の構成
    要素からなる検索結果文書を表示した表示画面上の任意
    の表示領域が指定されたとき、前記検索結果文書中の、
    前記指定された表示領域に表示されているデータに対応
    する第1の構成要素を特定し、この第1の構成要素に関
    連付けられた前記検索要求文中の第2の記述部分の記述
    に基づき、前記構造化文書データベース中の前記第1の
    構成要素に対応する第2の構成要素を検索する第2の検
    索手段と、 前記第2の構成要素に対し、少なくとも該第2の構成要
    素にアクセスが制限されるユーザの範囲を定めてアクセ
    ス権限を設定するアクセス権限設定手段と、 を具備したことを特徴とする構造化文書管理システム。
  7. 【請求項7】異なる文書構造の複数の構造化文書を、階
    層化された論理構造を持つ構造化文書データベースで管
    理する構造化文書管理システムにおいて、 前記構造化文書データベースから前記論理構造に基づき
    所望の構成要素を検索するための検索要求文を用いて検
    索する検索手段と、 この検索手段で検索した結果得られた複数の構成要素か
    らなる検索結果文書を表示した表示画面上の任意の表示
    領域が指定されたとき、この指定された表示領域に表示
    されているデータに関連付けられた、前記検索結果文書
    を所定の表示形式で表示するために用いた前記検索結果
    文書の文書構造の変換規則中の第1の記述部分を抽出す
    る手段と、 前記第1の記述部分に関連付けられた前記検索結果文書
    中の第1の構成要素を抽出する手段と、 少なくとも、前記変換規則中の前記第1の記述部分にア
    クセス権限を設定する第1のレベルと、前記第1の構成
    要素に対応する、前記検索要求文中の第2の記述部分に
    アクセス権限を設定する第2のレベルと、前記検索要求
    文中の前記第2の記述部分に関連付けられた第3の記述
    部分の記述に基づき特定される前記構造化文書データベ
    ース中の前記第1の構成要素に対応する第2の構成要素
    にアクセス権限を設定する第3のレベルを含む複数のレ
    ベルのうち、ユーザにより指定されたレベルに、少なく
    とも、そのレベルについてアクセスが制限されるユーザ
    の範囲を定めてアクセス権限を設定するアクセス権限設
    定手段と、 を具備したことを特徴とする構造化文書管理システム。
  8. 【請求項8】前記複数のレベルには、前記構造化文書デ
    ータベースに格納されている前記第2の構成要素を含む
    構造化文書と同じ文書構造を持つ他の構造化文書に含ま
    れる前記第2の構成要素の要素名と同じ要素名の構成要
    素にアクセス権限を設定する第4のレベルを含むことを
    特徴とする請求項6記載の構造化文書管理システム。
  9. 【請求項9】ユーザにより前記第4のレベルが指定され
    たとき、前記第2の構成要素を含む構造化文書と同じ文
    書構造を持つ複数の構造化文書が格納されている前記論
    理構造に従って指定される前記構造化データベースの論
    理的なエリアに、そのエリア内に格納される構造化文書
    が従うべき文書構造を定義した文書構造定義文書が存在
    するときは、当該文書構造定義文書中の前記第2の構成
    要素と同じ要素名の構成要素に関する記述部分に、前記
    第2の構成要素と同じ要素名の構成要素に対する前記ア
    クセス権限を設定することを特徴とする請求項8記載の
    構造化文書管理システム。
  10. 【請求項10】 前記変換規則は、前記検索結果文書を
    該検索結果文書の各構成要素の少なくとも要素値をそれ
    ぞれ1つの表示領域で表示する表示用文書に変換するた
    めのものであって、 前記変換規則を用いて前記検索結果文書を表示用文書に
    変換する際には、該表示用文書の記述部分と、該記述部
    分に関連する前記変換規則中の記述部分との対応関係を
    抽出する手段をさらに具備し、 前記表示画面上の任意の表示領域が指定されたとき、該
    指定された表示領域に表示されているデータに対応する
    前記表示用文書中の第4の記述部分に対応する前記変換
    規則中の前記第1の記述部分を前記対応関係に基づき抽
    出することを特徴とする請求項7記載の構造化文書管理
    システム。
JP2002087071A 2002-03-26 2002-03-26 アクセス権限設定方法および構造化文書管理システム Expired - Fee Related JP3914081B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002087071A JP3914081B2 (ja) 2002-03-26 2002-03-26 アクセス権限設定方法および構造化文書管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002087071A JP3914081B2 (ja) 2002-03-26 2002-03-26 アクセス権限設定方法および構造化文書管理システム

Publications (2)

Publication Number Publication Date
JP2003281149A true JP2003281149A (ja) 2003-10-03
JP3914081B2 JP3914081B2 (ja) 2007-05-16

Family

ID=29233434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002087071A Expired - Fee Related JP3914081B2 (ja) 2002-03-26 2002-03-26 アクセス権限設定方法および構造化文書管理システム

Country Status (1)

Country Link
JP (1) JP3914081B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135373A (ja) * 2003-10-08 2005-05-26 Seiko Epson Corp 使用権認証機能付き出力システム、素材出力装置、データ認証装置、素材出力プログラムおよびデータ認証プログラム、並びに使用権認証出力方法
JP2005224376A (ja) * 2004-02-12 2005-08-25 Olympia:Kk 遊技機
JP2006040277A (ja) * 2004-07-22 2006-02-09 Internatl Business Mach Corp <Ibm> クエリへの複数ユーザによるアクセス管理
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
US7716308B2 (en) 2006-06-20 2010-05-11 Ricoh Company, Ltd. Server, client, and method of storing shared text data
JP5073494B2 (ja) * 2005-05-09 2012-11-14 株式会社MetaMoJi 文書処理装置および文書処理方法
US8448217B2 (en) 2006-11-01 2013-05-21 Fujitsu Limited Computer program, method, and system for access control
JP2019016072A (ja) * 2017-07-05 2019-01-31 富士ゼロックス株式会社 情報処理装置及びプログラム
JPWO2022130635A1 (ja) * 2020-12-18 2022-06-23
CN117521658A (zh) * 2024-01-03 2024-02-06 安徽思高智能科技有限公司 一种基于篇章级事件抽取的rpa流程挖掘方法及系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4622347B2 (ja) * 2003-10-08 2011-02-02 セイコーエプソン株式会社 使用権認証機能付き出力システム、素材出力装置および使用権認証出力方法
JP2005135373A (ja) * 2003-10-08 2005-05-26 Seiko Epson Corp 使用権認証機能付き出力システム、素材出力装置、データ認証装置、素材出力プログラムおよびデータ認証プログラム、並びに使用権認証出力方法
JP2005224376A (ja) * 2004-02-12 2005-08-25 Olympia:Kk 遊技機
US9607099B2 (en) 2004-07-22 2017-03-28 International Business Machines Corporation Query conditions-based security
JP2006040277A (ja) * 2004-07-22 2006-02-09 Internatl Business Mach Corp <Ibm> クエリへの複数ユーザによるアクセス管理
US10108813B2 (en) 2004-07-22 2018-10-23 International Business Machines Corporation Query conditions-based security
JP4726563B2 (ja) * 2004-07-22 2011-07-20 インターナショナル・ビジネス・マシーンズ・コーポレーション データベース内のデータに対する既定のクエリへの複数ユーザによるアクセスを管理する方法
JP5073494B2 (ja) * 2005-05-09 2012-11-14 株式会社MetaMoJi 文書処理装置および文書処理方法
US7716308B2 (en) 2006-06-20 2010-05-11 Ricoh Company, Ltd. Server, client, and method of storing shared text data
US8448217B2 (en) 2006-11-01 2013-05-21 Fujitsu Limited Computer program, method, and system for access control
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
JP2019016072A (ja) * 2017-07-05 2019-01-31 富士ゼロックス株式会社 情報処理装置及びプログラム
JPWO2022130635A1 (ja) * 2020-12-18 2022-06-23
WO2022130635A1 (ja) * 2020-12-18 2022-06-23 三菱電機株式会社 グラフ表示装置、グラフ表示方法、および、グラフ表示プログラム
JP7258251B2 (ja) 2020-12-18 2023-04-14 三菱電機株式会社 グラフ表示装置、グラフ表示方法、および、グラフ表示プログラム
CN117521658A (zh) * 2024-01-03 2024-02-06 安徽思高智能科技有限公司 一种基于篇章级事件抽取的rpa流程挖掘方法及系统
CN117521658B (zh) * 2024-01-03 2024-03-26 安徽思高智能科技有限公司 一种基于篇章级事件抽取的rpa流程挖掘方法及系统

Also Published As

Publication number Publication date
JP3914081B2 (ja) 2007-05-16

Similar Documents

Publication Publication Date Title
JP3842573B2 (ja) 構造化文書検索方法、構造化文書管理装置及びプログラム
JP3842577B2 (ja) 構造化文書検索方法および構造化文書検索装置およびプログラム
CN100565521C (zh) 用于从数据库生成xml文档的动态方法
US20070219959A1 (en) Computer product, database integration reference method, and database integration reference apparatus
US20080183689A1 (en) Search method and apparatus for plural databases
US20090024384A1 (en) Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
KR19990013482A (ko) 구조화 문서 검색 표시 방법 및 장치
US20170262539A1 (en) Method of retrieving attributes from at least two data sources
KR20090028758A (ko) 정보 재사용 방법, 정보 제공 방법, 편집 가능한 문서, 및 문서 편집 시스템
JP4042830B2 (ja) コンテンツ属性情報正規化方法、情報収集・サービス提供システム、並びにプログラム格納記録媒体
JP3914081B2 (ja) アクセス権限設定方法および構造化文書管理システム
JP3832693B2 (ja) 構造化文書検索表示方法及び装置
JP3842572B2 (ja) 構造化文書管理方法および構造化文書管理装置およびプログラム
JP3842576B2 (ja) 構造化文書編集方法及び構造化文書編集システム
Yu et al. Metadata management system: design and implementation
JPH10187680A (ja) 単語、文、部分の粒度で管理するドキュメントリポジトリ装置
EP1014283A1 (en) Intranet-based cataloguing and publishing system and method
JP3842574B2 (ja) 情報抽出方法および構造化文書管理装置およびプログラム
JP3842575B2 (ja) 構造化文書検索方法、構造化文書管理装置及びプログラム
JP2004118543A (ja) 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
JP2003288365A (ja) 付加情報管理方法及び付加情報管理システム
JP4352840B2 (ja) プログラム、データ処理方法およびデータ処理システム
JP3910901B2 (ja) 文書構造検索方法、文書構造検索装置および文書構造検索プログラム
Liu et al. Towards building logical views of websites
Škrbić et al. Bibliographic records editor in XML native environment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070201

LAPS Cancellation because of no payment of annual fees