JP2000181917A - 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体 - Google Patents

構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体

Info

Publication number
JP2000181917A
JP2000181917A JP10360110A JP36011098A JP2000181917A JP 2000181917 A JP2000181917 A JP 2000181917A JP 10360110 A JP10360110 A JP 10360110A JP 36011098 A JP36011098 A JP 36011098A JP 2000181917 A JP2000181917 A JP 2000181917A
Authority
JP
Japan
Prior art keywords
document
data
file
entity
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10360110A
Other languages
English (en)
Other versions
JP4141556B2 (ja
Inventor
Toru Takahashi
亨 高橋
Noriyuki Yamazaki
山崎  紀之
Yoshifumi Sato
佳史 里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP36011098A priority Critical patent/JP4141556B2/ja
Priority to CA2292223A priority patent/CA2292223C/en
Publication of JP2000181917A publication Critical patent/JP2000181917A/ja
Priority to US10/834,044 priority patent/US7107527B2/en
Application granted granted Critical
Publication of JP4141556B2 publication Critical patent/JP4141556B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 登録文書の持つ論理構造と実体構造とを相互
に変換可能な形で対応付けて管理することが可能な技術
を提供する。 【解決手段】 文書記述言語を用いて記述された構造化
文書を管理する構造化文書管理方法において、登録済み
文書の実体構造及び論理構造を示す対応関係データから
登録済み文書を構成する任意のファイルを更新対象とし
て選択して更新対象ファイルの内容データを更新する内
容データ更新ステップと、更新後の更新対象ファイルの
実体構造及び論理構造を示す部分的な対応関係データを
生成する部分的対応関係データ生成ステップと、前記部
分的な対応関係データによって登録済み文書の対応関係
データを更新する対応関係データ更新ステップとを有す
るものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はコンピュータ装置を
用いた電子化文書データを管理する構造化文書管理シス
テムに関し、特に文書の論理的構造とそのエンティティ
構成とを対応付けて管理する構造化文書管理システムに
適用して有効な技術に関するものである。
【0002】
【従来の技術】情報化社会の本格的進展に伴い、ワード
プロセッサ、パーソナルコンピュータ等を用いて作成さ
れた電子化文書データが爆発的な勢いで増加しつつあ
る。単に雑多な文書をコンピュータ上で作成して表示や
印刷に用いるだけでなく、組織体の業務上重要な役割を
果たす文書(ミッションクリティカル文書)を電子的に
作成し、それらの文書を取り扱う業務全体を電子化する
ことによって、業務効率の大幅な向上を実現することが
望まれている。
【0003】この様なミッションクリティカル文書は、
単に表示・印刷のみを目的とするものではなく、文書内
部からのデータの抽出、派生文書の作成や表示体裁を変
えての再利用等、さまざまな処理の対象となる為、多く
の場合SGML(Standard Generalized Markup Language)、
XML(eXtensible Markup Language)、HTML(Hyper TextMa
rkup Language)等の文書記述言語を用いて、容易に機械
処理可能な構造化文書データとして作成される。従っ
て、これらのミッションクリティカル文書を扱う文書管
理システムは、構造化文書を格納・管理し、構造情報の
参照、文書内容の編集・改訂、バージョン履歴の管理等
を行う機能を備える必要がある。
【0004】前記文書記述言語によって記述された構造
化文書は、実体構造と論理構造との二重の構造を持つ。
ここで論理構造とは、文書を構成する個々の論理的な要
素(章、節、段落その他)の並び順や相互の包含関係か
らなる構造であり、前記文書記述言語では、その要素の
種別(要素型)を示す文字列である「タグ」を各論理要
素の先頭と末尾に配置することによって文書の論理構造
を表現する。また実体構造とは、文書データを「エンテ
ィティ」と呼ぶ単位に分割し、内容テキスト中に他のエ
ンティティへの参照を記述することによって表現される
構造であり、エンティティ間の呼び出し関係からなる。
【0005】一般に、文書が長大になり、単一の連続し
たテキストとして文書を維持するのが不適切になった場
合、文書を複数のエンティティに分割し、各エンティテ
ィ毎に担当者を割り当てて個別に執筆・編集する等の管
理が行なわれる。また、図表データの様に各種の処理プ
ログラム固有のデータ形式で記述され、内容文字列やタ
グからなるテキストと混在させることができないデータ
も、それぞれ別のエンティティとして扱われる。文書が
複数個のエンティティから構成される場合、通常は各エ
ンティティをそれぞれ1個のファイルに格納する。な
お、構造化文書中で要素を識別する為に用いられるタ
グ、エンティティへの参照を記述するエンティティ参
照、及びコメント等を記述した文字列を総称してマーク
と呼ぶ。
【0006】図15は従来の文書記述言語SGMLによって
記述された構造化文書の一例を示す図である。1個のSG
ML文書の実体構造は、文書本体に対応する1個のエンテ
ィティ(文書エンティティ)と、ここから直接間接に参
照される0個以上の外部エンティティから構成される。
外部エンティティには、文書エンティティと同様にSGML
テキストとして記述されるテキストエンティティと、図
表等の非SGMLデータエンティティとがある(本明細書で
は、文書エンティティと外部エンティティとを総称して
単にエンティティと呼ぶ)。図15に例示する文書の場
合、文書エンティティ101からテキストエンティティ
102及び103並びに非SGMLデータエンティティ10
4が参照されている。またテキストエンティティ102
中にもテキストエンティティ103への参照がある。そ
の結果、テキストエンティティ103は文書エンティテ
ィ101とテキストエンティティ102の両方から参照
され、両者の間で共有されている。
【0007】図16は従来の図15のSGML文書を解析し
て得られる論理構造の例を示す図である。図16に示す
様にSGML文書の持つ論理構造は、要素と内容データをノ
ードとする木構造として表現することができる。図16
において楕円形のノードが要素、矩形のノードが内容デ
ータ(解析済み文字列データまたは非SGMLデータ)を表
している。また図中で点線で囲った範囲はそれぞれノー
ドの集合を表している。ここでノード集合201は前記
の文書エンティティ101に対応しており、ノード集合
202はテキストエンティティ102、ノード集合20
3及び204はテキストエンティティ103、ノード集
合205はデータエンティティ104に対応している。
エンティティとノード集合との対応関係が示す通り、エ
ンティティ参照によって呼び出した被参照エンティティ
の内容をその呼び出し位置に展開し、結果として得られ
る展開済みテキストを構文解析することにより、SGML文
書の論理構造が得られる。
【0008】従来、文書データはファイルに格納され、
ファイルシステム上で管理されてきた。特開平9-223054
号公報に示される発明(以後、これを公知例1と呼ぶ)
は、複数のファイルからなるファイル集合を単位とし
て、記憶手段からのファイルの読み出し及び記憶手段へ
のファイルの格納、またファイル集合を単位とするバー
ジョン管理を実現している。公知例1は本来コンピュー
タプログラムを構成するファイル群の管理を目的とした
発明であるが、そのファイル管理機能は大規模な文書を
構成するファイル群を管理する目的にも使用することが
できる。しかし、公知例1の発明は、構造を持たないデ
ータとして個々のファイルを扱うので、文書管理に適用
した場合に文書の構造を意識した操作を行うことはでき
ない。
【0009】これに対して構造化文書を直接管理できる
従来技術として、例えば特開平8-44718号公報に示され
た発明(以後、これを公知例2と呼ぶ)がある。公知例
2に示される文書処理装置は、登録された文書の構造を
解析し、章、節等の論理要素をノードとする木構造デー
タを生成してこれを格納・管理する手段を備えている。
また文書構造の一部を構成する部分木を複数文書間で共
有する手段や、部分木に対して論理要素の追加/削除/更
新等が行われた場合に、そのバージョンを管理する手段
を備えている。
【0010】
【発明が解決しようとする課題】前記公知例1に示す従
来技術では、文書を構成する個々のファイル及びそれら
のファイルの集合としての文書の状態を管理することは
できるが、文書の持つ論理的構造を認識し、構造に沿っ
た操作を行う手段を持たないので、構造化文書を扱う文
書管理システムとしては適していない。これに対して前
記公知例2に示す従来技術では、登録された文書の持つ
論理的構造を表現する木構造データを直接格納・管理す
るので、格納されている構造化文書データに対して構造
情報の参照や編集、部分構造(部分木)単位の共有制
御、部分構造のバージョンの管理等が可能となる。しか
し、SGMLやXML等の文書記述言語を用いて記述された構
造化文書を管理しようとした場合、前記公知例2に示す
従来技術によっても以下に説明する様な課題が解決され
ずに残る。
【0011】すなわち前記公知例2に示す従来技術は、
文書の論理構造を格納・管理する手段は備えているもの
の、実体構造と論理構造とを対応付けて管理する手段
や、木構造形式で表現された対応関係データと文書記述
言語を用いてテキスト形式で記述されたエンティティデ
ータとの間で随時相互変換を行う手段は備えていない。
前記公知例2に示す従来技術を適用した文書管理システ
ムにSGML文書を登録した場合、登録前にそのSGML文書が
持っていたエンティティ構成に関する情報は失われてし
まう。
【0012】この為、前記公知例2に示す従来技術を適
用した文書管理システムに複数個のエンティティから構
成されるSGML文書を登録して論理構造データを生成する
場合、登録対象文書の持つエンティティ構成に対応した
ノード集合を設定し、各ノード集合毎に、対応するエン
ティティの持つ属性を継承してその属性(所有者名、ア
クセス権等)を付与することはできない。登録した文書
に関して分担執筆や部分構造の共有を行う場合、分担や
共有の単位となるノード集合の設定と該ノード集合に対
する属性設定が必要になるが、前記公知例2に示す従来
技術を適用した文書管理システムではこれをユーザが手
作業で行わなければならず、作業が極めて煩雑になる。
【0013】また、前記公知例2に示す従来技術を適用
した文書管理システムから登録済み文書を再びテキスト
形式のSGML文書として外部に取り出そうとした場合、登
録時に存在していたエンティティ構成に対応する複数の
ファイルに分割して文書データを取り出すことはでき
ず、文書内容全体を含む単一の文書エンティティとして
取り出すことしかできない。従って、前記公知例2に示
す従来技術を適用した文書管理システムを文書サーバと
して使用し、該文書サーバにネットワークを介して接続
したクライアントコンピュータで文書内容の表示や再利
用を行うシステム構成をとった場合、クライアント側で
必要とする部分的なテキストをエンティティ単位で取り
出して処理することができず、毎回文書データ全体を取
り出すことになるので、クライアントとサーバ間での転
送データ量が増大し、処理効率が低下する。
【0014】また、クライアント側で文書内容の編集・
更新を行うシステム構成をとった場合、登録済みSGML文
書から特定のエンティティ部分だけを取り出して編集
し、更新後のエンティティを再登録することにより文書
論理構造を部分的に更新することができないので、複数
人の担当者による大規模文書の共同管理・分担執筆が困
難になる。
【0015】更に、文書を構成するエンティティ毎に、
その内容と作成者を保証する為に電子署名データを付加
して管理しようとした場合、前記公知例2に示す従来技
術を適用した文書管理システムでは文書を登録した段階
でエンティティ単位のテキストデータは論理構造データ
に展開されて失われてしまう為、この様な厳密な文書管
理が不可能であるという問題がある。
【0016】本発明の目的は上記問題を解決し、登録文
書の持つ論理構造と実体構造とを相互に変換可能な形で
対応付けて管理することが可能な技術を提供することに
ある。
【0017】本発明の他の目的は属性設定を手作業で行
うことなく登録前の構造化文書の各エンティティが持っ
ていた属性に従って登録済み文書の各エンティティのア
クセス制御を行うことが可能な技術を提供することにあ
る。
【0018】本発明の他の目的はエンティティ取り出し
時の転送データ量を減少させて処理効率を向上させるこ
とが可能な技術を提供することにある。
【0019】本発明の他の目的は複数人の担当者による
大規模文書の共同管理・分担執筆を容易に行うことが可
能な技術を提供することにある。
【0020】本発明の他の目的はその内容と作成者を保
証する為に文書を構成するエンティティ毎に電子署名デ
ータを付加して厳密な文書管理を行うことが可能な技術
を提供することにある。
【0021】
【課題を解決するための手段】本発明は、文書記述言語
を用いて記述された構造化文書を管理する構造化文書管
理システムにおいて、構造化文書の実体構成及び論理構
造を示す対応関係データを使用して複数のエンティティ
から成る構造化文書を管理するものである。
【0022】本発明では、SGML等の文書記述言語で記載
された構造化文書を登録する際に登録対象文書の構文解
析を行い、その実体構造を示すエンティティ構成表と、
論理構造を示す解析済みインスタンスデータとを有する
構文解析結果データを生成する。そして前記生成した構
文解析結果データを参照し、登録対象文書を構成するエ
ンティティのリソース名を当該エンティティのエンティ
ティ識別子に対応付けて前記エンティティ構成表に設定
する。すなわち登録対象文書を構成する全てのエンティ
ティについて、そのエンティティ種別、エンティティ
名、エンティティ識別子及びリソース名を表形式で前記
エンティティ構成表にまとめ、登録対象文書の文書イン
スタンスを構文解析していく過程で検出したタグ等の記
号で表されるイベントを、その出現順に従ってイベント
種別とパラメタとの対応表の形で解析済みインスタンス
データにまとめておく。
【0023】次に前記生成した構文解析結果データを参
照して登録対象文書が持つ実体構造と論理構造との対応
関係を抽出し、前記エンティティ識別子と解析済みイン
スタンスデータにより得られる論理構造部分とを対応付
けて登録対象文書の実体構造及び論理構造を示す対応関
係データを生成する。
【0024】前記対応関係データは、登録対象文書の要
素、内容データ及びエンティティ遷移をノードとして接
続した木構造で表される。この対応関係データでは、あ
るエンティティ遷移ノードを根とする部分木から、下位
のエンティティ遷移ノードを根とする全ての部分木を除
いた部分が、そのエンティティ遷移ノードに対応するエ
ンティティに内容として含まれる部分になる。すなわち
本発明の対応関係データは、実体構造(エンティティ構
成)と論理構造との対応関係をエンティティ遷移ノード
という形でその内部に含んでいる。
【0025】前記の様に本発明では登録対象文書が元々
持っていた複数のエンティティの実体構造とそれらの論
理構造を保持したまま登録を行っているので、登録した
文書を更新する場合には登録済み文書の特定のエンティ
ティまたは特定の論理構造部分を選択した部分的な更新
処理を行うことができる。
【0026】登録済み文書のエンティティを更新する場
合には登録済み文書の任意のエンティティを更新対象と
して選択し、前記更新対象の内容データを更新する。そ
して前記更新対象エンティティの実体構成及び論理構造
を示す部分的な対応関係データを生成する。次に登録済
み文書の対応関係データ中で前記更新対象エンティティ
に対応する部分範囲を求め、前記求めた部分範囲の対応
関係データを前記更新対象エンティティの部分的な対応
関係データによって置換して登録済み文書の対応関係デ
ータを更新する。
【0027】登録済み文書の論理構造を更新する場合に
は登録済み文書の任意の論理構造を更新対象として選択
し、前記更新対象の論理構造を編集する。そして前記編
集の行われた論理構造の範囲内にあるエンティティの部
分的な対応関係データを文字列化して記述した編集結果
エンティティデータを生成し、前記生成した編集結果エ
ンティティデータによって前記編集の行われた論理構造
の範囲内のエンティティの内容データを置換する。次に
登録済み文書の対応関係データ中で前記エンティティに
対応する部分範囲を求め、前記求めた部分範囲の対応関
係データを前記エンティティの部分的な対応関係データ
によって置換して登録済み文書の対応関係データを更新
する。
【0028】前記の様に本発明では、実体構造と論理構
造とを対応付けて管理しており、木構造で表現された対
応関係データと、文書記述言語を用いてテキスト形式で
記述されたエンティティデータとの間で随時相互変換を
行う。前記従来技術を適用した文書管理システムにSGML
文書を登録した場合、複数のファイルから成るエンティ
ティを文書内容全体が含まれた単一の文書エンティティ
としてしまうので、登録前にそのSGML文書が持っていた
エンティティ構成に関する情報は失われてしまうが、本
発明では登録対象文書のエンティティ構成に関する情報
が保持される。
【0029】よって本発明で複数個のエンティティから
構成されるSGML文書を登録して対応関係データを生成す
る場合、登録対象文書の持つエンティティ構成に対応し
たノード集合を設定し、対応するエンティティの持つ属
性を継承してその所有者名やアクセス権等の属性を各ノ
ード集合毎に付与することができる。登録した文書に関
して分担執筆や部分構造の共有を行う場合、分担や共有
の単位となるノード集合の設定と該ノード集合に対する
属性設定が必要になるが、本発明では対応するエンティ
ティの持つ属性を継承するので、前記属性設定をユーザ
が手作業で行う必要がない。
【0030】また登録済み文書を再びテキスト形式のSG
ML文書として外部に取り出そうとした場合、前記従来技
術では登録時に存在していたエンティティ構成に対応す
る複数のファイルに分割して文書データを取り出すこと
はできないが、本発明では登録時に存在していたエンテ
ィティ構成をそのまま保持しているので、そのエンティ
ティ構成に対応する複数のファイルに分割して文書デー
タを取り出すことができる。
【0031】従って本発明の文書管理システムを文書サ
ーバとして使用し、該文書サーバにネットワークを介し
て接続したクライアントコンピュータで文書内容の表示
や再利用を行うシステム構成をとった場合、クライアン
ト側で必要とする部分的なテキストをエンティティ単位
で取り出して処理することが可能で、毎回文書データ全
体を取り出すことがないのでクライアント−サーバ間で
の転送データ量が減少して処理効率が向上する。
【0032】またクライアント側で文書内容の編集・更
新を行うシステム構成をとった場合、登録済みSGML文書
から特定のエンティティ部分だけを取り出して編集し、
更新後のエンティティを再登録することにより文書論理
構造を部分的に更新することができるので、複数人の担
当者による大規模文書の共同管理・分担執筆が容易に行
える。
【0033】更にエンティティ単位のテキストデータが
失われてしまうことがないので、その内容と作成者を保
証する為に文書を構成するエンティティ毎に電子署名デ
ータを付加して厳密な文書管理を行うことが可能であ
る。
【0034】以上の様に本発明の構造化文書管理システ
ムによれば、登録対象文書を構成する各エンティティと
当該エンティティに対応する論理構造部分とを示す対応
関係データを生成して複数のエンティティを管理するの
で、登録文書の持つ論理構造と実体構造とを相互に変換
可能な形で対応付けて管理することが可能である。
【0035】
【発明の実施の形態】以下に構造化文書の実体構造と論
理構造とを対応付けて管理する一実施形態の構造化文書
管理システムについて説明する。図1は本実施形態の文
書管理サーバの概略構成を示す図である。図1に示す様
に本実施形態の文書管理サーバは、文書構文解析処理部
421と、内容データ抽出処理部422と、対応関係デ
ータ抽出処理部423と、内容データ更新処理部424
と、部分的対応関係データ生成処理部425と、対応部
分範囲決定処理部426と、論理構造編集処理部427
と、編集結果データ生成処理部428と、対応内容デー
タ更新処理部429と、更新対象検出処理部430と、
対応関係データ更新処理部431とを有している。
【0036】文書構文解析処理部421は、登録対象文
書の構文解析を行い、登録対象文書の実体構造を示すエ
ンティティ構成表と、登録対象文書の論理構造を示す解
析済みインスタンスデータとを有する構文解析結果デー
タを生成する処理部である。
【0037】内容データ抽出処理部422は、前記生成
した構文解析結果データを参照し、登録対象文書を構成
するエンティティの内容データを読み出して文書空間デ
ータベース格納領域418に格納し、前記格納したエン
ティティのリソース名を当該エンティティのエンティテ
ィ識別子に対応付けて前記エンティティ構成表に設定す
る処理部である。
【0038】対応関係データ抽出処理部423は、登録
対象文書を構成するエンティティと解析済みインスタン
スデータにより得られる論理構造部分とを対応付けて登
録対象文書の実体構造及び論理構造を示す対応関係デー
タを生成する処理部である。
【0039】内容データ更新処理部424は、登録済み
文書の実体構造及び論理構造を示す対応関係データから
登録済み文書を構成する任意のエンティティを更新対象
として選択して更新対象エンティティの内容データを更
新する処理部である。
【0040】部分的対応関係データ生成処理部425
は、前記更新対象エンティティの実体構造及び論理構造
を示す部分的な対応関係データを生成する処理部であ
る。対応部分範囲決定処理部426は、登録済み文書の
対応関係データ中で前記更新対象エンティティに対応す
る部分範囲を求める処理部である。
【0041】論理構造編集処理部427は、登録済み文
書の実体構造及び論理構造を示す対応関係データから登
録済み文書の任意の論理構造を更新対象として選択して
編集する処理部である。編集結果データ生成処理部42
8は、前記編集した論理構造の範囲内にあるエンティテ
ィの実体構造及び論理構造を示す部分的な対応関係デー
タを文字列化して記述した編集結果エンティティデータ
を生成する処理部である。
【0042】対応内容データ更新処理部429は、前記
生成した編集結果エンティティデータによって前記エン
ティティの内容データを置換する処理部である。更新対
象検出処理部430は、登録済み文書の対応関係データ
中で前記エンティティに対応する部分範囲を求める処理
部である。対応関係データ更新処理部431は、前記求
めた部分範囲の対応関係データを前記部分的な対応関係
データによって置換して登録済み文書の対応関係データ
を更新する処理部である。
【0043】文書管理サーバを文書構文解析処理部42
1、内容データ抽出処理部422、対応関係データ抽出
処理部423、内容データ更新処理部424、部分的対
応関係データ生成処理部425、対応部分範囲決定処理
部426、論理構造編集処理部427、編集結果データ
生成処理部428、対応内容データ更新処理部429、
更新対象検出処理部430及び対応関係データ更新処理
部431として機能させる為のプログラムは、CD−R
OM等の記録媒体に記録され磁気ディスク等に格納され
た後、メモリにロードされて実行されるものとする。な
お前記プログラムを記録する媒体はCD−ROM以外の
他の媒体でも良い。
【0044】なお文書登録制御プログラム410は、文
書登録処理全体を制御すると共に、登録対象文書の持つ
エンティティ構成に対応したノード集合を設定し、対応
するエンティティの持つ属性を継承してその属性を各ノ
ード集合毎に付与したり、登録対象文書を構成するエン
ティティに付加された電子署名を当該エンティティの内
容データと共に登録する処理を行う。
【0045】また文書更新制御プログラム412は、登
録済み文書の持つエンティティ構成に対応して設定され
たノード集合の所有者名やアクセス権等の属性に応じて
ノード集合毎に更新対象へのアクセス制御を行い、登録
済み文書を構成するエンティティ単位で編集対象を取り
出して更新する処理や、複数の編集対象を別々に取り出
して編集することにより構造化文書の編集を編集対象毎
に並列に行う処理を制御し、更新後の編集対象を構成す
るエンティティに電子署名を付加する処理を行う。
【0046】図2は本実施形態の文書管理システムの全
体構成を示す図である。図2に示す通り本実施形態の文
書管理システムは、文書管理サーバ301、文書管理ク
ライアント302、文書業務処理システム303、及び
ネットワーク304から構成される。
【0047】文書管理サーバ301は、管理対象文書の
登録・格納、登録済み文書の構造及び内容データに対す
る参照及び更新、特定の属性または内容文字列を持つ文
書の検索、登録済み文書の削除等、文書管理に関する主
要な処理を実行する。
【0048】文書管理クライアント302は、文書管理
サーバ301が管理する文書群を操作する為のGUI(Grap
hical User Interface)を提供し、ユーザからの指示に
従って文書の登録、参照、更新、検索等の処理を行う為
の指令及びデータをネットワーク304を介して文書管
理サーバ301に転送して前記指令を実行させる。
【0049】業務処理システム303は、文書管理クラ
イアント302と同様にユーザからの指示に従って指令
及びデータを文書管理サーバ301に転送して該指令を
実行させるが、一般的な文書管理用GUIではなく、特定
の業務を実行する為の専用GUIをユーザに提供する。ネ
ットワーク304は、局所ネットワーク(LAN:Local Ar
ea Network)または広域ネットワーク(WAN:Wide Area N
etwork)であって、複数のコンピュータ装置を接続し、
相互に指令及びデータを転送する手段を提供する。
【0050】なお図2には文書管理クライアント302
及び業務処理システム303の2台のコンピュータを文
書管理サーバ301に対するクライアントとして使用す
る構成例を示したが、クライアントは1台のみの構成と
することも、3台以上とする構成をとることもできる。
またクライアントは文書管理クライアントだけであって
も良く、業務処理システムだけであっても良い。
【0051】図2では文書管理クライアント302及び
業務処理システム303から文書管理サーバ301に指
令及びデータを転送する手段としてネットワーク304
を使用するものとしたが、代わりにフロッピーディス
ク、光磁気ディスク、追記型光ディスク等の可搬型媒体
を使用する構成をとることもでき、可搬型媒体とネット
ワーク304を併用する構成をとることもできる。或い
はクライアントを文書管理サーバ301と同一のコンピ
ュータ上で実行し、データ転送を行わない構成をとるこ
ともできる。
【0052】以下、本実施形態の主要な構成要素である
文書管理サーバ301について説明する。図1に示す文
書管理サーバ301は、ディスプレイ401、キーボー
ド402、中央処理装置403、フロッピーディスクド
ライブ404、フロッピーディスク405、通信制御装
置406、主メモリ407、磁気ディスク装置408、
システムバス409から構成される。
【0053】ディスプレイ401は、本サーバにおける
処理の実行状況等を表示する為に用いられる。キーボー
ド402は、文書管理サーバ301の起動・終了等を指
示するコマンドを入力する為に用いられる。中央処理装
置403は、本サーバを構成する各種プログラムを実行
する。フロッピーディスクドライブ404は、フロッピ
ーディスク405に対するデータの読み書きの為に用い
られる。
【0054】フロッピーディスク405は、登録対象文
書等、他のシステムとの間でデータ交換を行う為に用い
られる。通信制御装置406は、ネットワーク304を
介して文書管理クライアント302及び業務処理システ
ム303と通信し、指令及びデータの交換を行う為に用
いられる。
【0055】主メモリ407は、本サーバにおける処理
を実行する為の各種プログラム及び一時的なデータを保
持する。磁気ディスク装置408は、登録された文書デ
ータ及び本サーバが文書管理用に使用する各種データを
記憶する手段として用いられる。システムバス409
は、これらの各種装置を相互に接続する。
【0056】主メモリ407中には、文書登録制御プロ
グラム410、文書参照制御プログラム411、文書更
新制御プログラム412、文書出力制御プログラム41
3、文書検索制御プログラム414、文書空間管理プロ
グラム415、データベース管理システム416及びオ
ペレーティングシステム417が保持される。磁気ディ
スク装置408中には、文書空間データベース格納領域
418、プログラム格納領域419及びデータファイル
格納領域420が確保される。
【0057】文書登録制御プログラム410は、文書記
述言語SGMLを用いて記述された登録対象文書を、フロッ
ピーディスク405、データファイル格納領域420、
またはネットワーク304から読み込み、その構文解析
を行い、登録対象文書の持つエンティティデータ、論理
構造データ及びその両者の対応関係を文書空間データベ
ース格納領域418に格納する。
【0058】文書参照制御プログラム411は、文書空
間データベース格納領域418に格納された登録済み文
書のエンティティデータ、論理構造データまたはその両
方を読み出し、それらのデータを構成する情報の一部を
抽出して要求元クライアントに転送する。
【0059】文書更新制御プログラム412は、文書空
間データベース格納領域418に格納された登録済み文
書のエンティティデータ、論理構造データまたはその両
方に対して、そのデータ内容を更新する処理を行う。
【0060】文書出力制御プログラム413は、文書空
間データベース格納領域418から登録済み文書のエン
ティティデータを読み出し、該文書を構成するエンティ
ティを、フロッピーディスク405またはデータファイ
ル格納領域420に出力するか、或いはネットワーク3
04を介して要求元クライアント(文書管理クライアン
ト302または業務処理システム303)に転送する。
【0061】文書検索制御プログラム414は、要求元
クライアントから受け取った検索条件式に従って文書空
間データベース格納領域418に格納された登録済み文
書群の検索を行い、検索結果データを要求元クライアン
トに転送する。
【0062】文書空間管理プログラム415は、ネット
ワーク304を介して要求元クライアントからの指令を
受信し、該指令の種別に対応して文書登録制御プログラ
ム410、文書参照制御プログラム411、文書更新制
御プログラム412、文書出力制御プログラム413、
または文書検索制御プログラム414を起動し、該指令
の内容に従った処理を実行させる。また、登録済み文書
群を分類整理する為のフォルダオブジェクトを生成して
文書空間データベース格納領域418に格納する処理
や、登録済み文書の一部を文書空間データベース格納領
域418から削除する処理等、一部の処理については文
書空間管理プログラム415自身が実行する。
【0063】データベース管理システム416は、文書
空間データベース格納領域418に対するデータの格
納、更新、削除、検索に関する全ての処理を制御する。
文書空間データベース格納領域418にアクセスする全
てのプログラムは、その全ての処理をデータベース管理
システム416を介して行う。オペレーティングシステ
ム417は、システムの起動・初期化、各種周辺装置と
の間のデータ転送等、コンピュータ上で本サーバを構成
する各プログラムを実行する為の基本機能を提供する。
【0064】文書空間データベース格納領域418は、
本サーバに登録された全ての文書に関するデータ、及び
本サーバが文書管理を行う為に必要とする全ての関連デ
ータを格納するデータベースである。プログラム格納領
域419は、本サーバを構成する全てのプログラムを格
納しており、これらのプログラムはシステム起動時にオ
ペレーティングシステム417によって読み出され、主
メモリ407に転送される。データファイル格納領域4
20は、オペレーティングシステム417または本サー
バ上で実行される各種ユーティリティプログラムが使用
するデータファイルを格納する。
【0065】なお本実施形態ではデータ交換の為の可搬
型媒体としてフロッピーディスク405を使用する構成
としたが、光磁気ディスクや追記型光ディスク等の他種
の可搬型媒体を利用する構成をとることもできる。また
本実施形態では文書データ及び文書管理用データをデー
タベース中に格納する構成としたが、データベース管理
システムを使用せず、これらのデータをファイルとして
データファイル格納領域420に格納する構成をとるこ
ともできる。
【0066】次に本実施形態における文書管理サーバ3
01の基本動作手順についてPAD(Problem Analysis Di
agram)を用いて説明する。図3は本実施形態の文書管
理サーバ301全体の動作を制御する文書空間管理プロ
グラム415の概略処理手順を示すPAD図である。キー
ボード402からのサーバ起動コマンド等により文書空
間管理プログラム415が起動されると、本プログラム
はサーバとしてクライアントから指令を受信してはその
処理を行うループに入る(ステップ501)。このルー
プは、キーボード402からサーバの停止を指示するコ
マンドが入力されるまで継続する。
【0067】ステップ501のループは、クライアント
からの指令を受信する処理(ステップ502)と、受信
した指令の種別を判定し、該種別に対応する処理に分岐
する処理(ステップ503)を繰り返す。
【0068】ステップ503では、受信した指令の種別
を判定し、該指令の種別に応じてステップ504からス
テップ511までのいずれかの処理を選択して実行す
る。ここで、前記指令が新たな文書の登録を求める指令
であった場合、文書登録制御プログラム410を実行し
て指定された文書を文書空間データベース格納領域41
8に格納する(ステップ504)。
【0069】また前記指令が特定の登録済み文書の持つ
内容データへの参照を求める指令であった場合、文書参
照制御プログラム411を実行して要求されたデータを
文書空間データベース格納領域418から読み出し、該
データを要求元クライアントに返信する(ステップ50
5)。
【0070】また前記指令が特定の登録済み文書の持つ
内容データの更新を求める指令であった場合、文書更新
制御プログラム412を実行して文書空間データベース
格納領域418に格納された登録済み文書の内容データ
を更新する(ステップ506)。
【0071】また前記指令が特定の登録済み文書の一部
または全体を外部に出力することを求める指令であった
場合、文書出力制御プログラム413を実行して文書空
間データベース格納領域418から登録済み文書の内容
データを読み出し、前記指令中の指示に従って、該デー
タをフロッピーディスク405またはデータファイル格
納領域420に出力するか或いはネットワーク304を
介して要求元クライアントに転送する(ステップ50
7)。
【0072】また前記指令が特定の検索条件式を満たす
文書の集合を求める指令であった場合、文書検索制御プ
ログラム414を実行して文書空間データベース格納領
域418に格納された登録済み文書群の検索を行い、検
索結果データを要求元クライアントに転送する(ステッ
プ508)。
【0073】また前記指令が登録済み文書群を分類整理
する為のフォルダオブジェクトの生成を求める指令であ
った場合、新たなフォルダオブジェクトを生成して文書
空間データベース格納領域418に格納する(ステップ
509)。
【0074】また前記指令が特定の文書の特定のフォル
ダオブジェクトへの関連付け、または特定の関連付けの
削除を求める指令であった場合、要求された関連付けの
追加または削除を行う(ステップ510)。
【0075】また前記指令が特定の登録済み文書または
特定のフォルダオブジェクトを削除することを求める指
令だった場合、文書空間データベース格納領域418か
ら指定された文書またはフォルダオブジェクトを削除す
る(ステップ511)。
【0076】図4は本実施形態の文書登録制御プログラ
ム410の概略処理手順を示すPAD図である。本プログ
ラムは、文書の登録を求めるクライアントからの指令に
対応して文書空間管理プログラム415によって呼び出
される。以下に本実施形態における文書登録制御プログ
ラム410の動作手順を説明する。
【0077】本プログラムは、文書空間管理プログラム
415によって呼び出されると、まず登録対象文書を構
成するエンティティの一覧を呼び出してパラメタとして
入手する(ステップ601)。ここで該一覧には、登録
対象文書を構成する各エンティティの内容データを保持
しているリソースのリソース名と、登録対象文書が複数
のエンティティから構成される場合にそのいずれが文書
エンティティであるかを識別する情報を含んでいる。
【0078】エンティティの内容データの入手元となる
リソースとしては、フロッピーディスク405またはデ
ータファイル格納領域420上に格納されたデータファ
イル、ネットワーク304を介してアクセスできるネッ
トワークリソース及び文書空間データベース格納領域4
18中に格納されている登録済みエンティティが使用で
きる。リソース名としては、リソースがデータファイル
である場合にはそのパス名、ネットワーク上のリソース
である場合にはそのネットワークアドレス、登録済みエ
ンティティである場合には該エンティティを他の登録済
みエンティティから区別して一意に識別するエンティテ
ィ識別子を指定する。
【0079】次に登録対象文書に対して該文書を全ての
登録済み文書から区別して一意に識別する文書識別子を
割り当て(ステップ602)、文書構文解析処理部42
1により登録対象文書の文書エンティティから出発して
その構文解析を行い、構文解析結果データを生成する
(ステップ603)。なおこの構文解析の過程で、登録
対象文書を構成するエンティティの内、登録済みエンテ
ィティを除く全てのエンティティに対して、該エンティ
ティを全ての登録済みエンティティから区別して一意に
識別するエンティティ識別子を割り当てる。
【0080】次に内容データ抽出処理部422は、前記
生成した構文解析結果データを参照して、登録対象文書
を構成するエンティティの内、登録済みエンティティを
除く全てのエンティティについて、ステップ605及び
ステップ606を繰り返し実行する(ステップ60
4)。ここでステップ605では処理対象となるエンテ
ィティの内容データを対応するリソースから読み出す。
ステップ606では処理対象となるエンティティのエン
ティティ識別子とその内容データとの組を文書空間デー
タベース格納領域418に格納してエンティティの登録
を行う。
【0081】次にステップ607で対応関係データ抽出
処理部423は、前記構文解析結果データを参照し、登
録対象文書が持つ実体構造と論理構造との対応関係を抽
出し、登録対象文書を構成する各エンティティと当該エ
ンティティに対応する論理構造部分とを示す対応関係デ
ータを生成する。ステップ608では、登録対象文書に
割り当てた文書識別子と前記対応関係データとの組を文
書空間データベース格納領域418に格納して文書の登
録を行い、処理を終了する。
【0082】図5は本実施形態の構文解析結果データの
データ構造を示す図である。図5において文書登録制御
プログラム410が前記ステップ603で生成する構文
解析結果データ701は、二つの主要な部分、すなわち
エンティティ構成表702と解析済みインスタンスデー
タ703とからなる。
【0083】エンティティ構成表702は、登録対象文
書を構成する全てのエンティティについて、そのエンテ
ィティ種別、エンティティ名、エンティティ識別子及び
リソース名を表形式でまとめたデータである。ここで項
目「エンティティ種別」は、そのエンティティが文書エ
ンティティ(DOC)、テキストエンティティ(TEXT)または
非SGMLデータエンティティ(NDATA)のいずれであるかを
記号によって示している。項目「エンティティ名」は、
登録対象文書中でそのエンティティを参照する為に用い
られているエンティティ名を文字列として示している。
但し、そのエンティティが文書エンティティであった場
合、本項目は空欄となる。項目「エンティティ識別子」
は、そのエンティティに割り当てられたエンティティ識
別子を示している。項目「リソース名」は、そのエンテ
ィティの内容データを保持するリソースのリソース名を
文字列として示している。但し、そのエンティティが登
録済みエンティティであった場合、本項目は空欄とな
る。
【0084】解析済みインスタンスデータ703は、登
録対象文書の文書インスタンスを構文解析していく過程
で検出したイベントを、その出現順に従ってイベント種
別とパラメタとの対応表の形でまとめたデータである。
ここで、項目「イベント種別」は、そのイベントが要素
の開始タグ(STAG)、終了タグ(ETAG)、内容を持たない要
素の開始と終了を兼ねるタグ(ITAG)、解析済み文字列デ
ータ(PCDATA)、エンティティ参照(EREF)、エンティティ
終了(EE)のいずれであるかを記号によって示している。
項目「パラメタ」は、イベント種別に応じて決まる付加
的なデータを示している。イベント種別が開始タグであ
る場合、その開始タグを先頭位置とする要素の要素型
名、及び該開始タグ内で指定された属性値(オプショ
ン)がパラメタとして示される。イベント種別が終了タ
グである場合、その終了タグを末尾位置とする要素の要
素型名がパラメタとして示される。イベント種別が解析
済み文字列データである場合、該文字列の内容がパラメ
タとして示される。イベント種別がエンティティ参照で
ある場合、被参照エンティティのエンティティ名がパラ
メタとして示される。エンティティ終了イベントはパラ
メタを持たない。
【0085】図6は本実施形態のエンティティ構成表7
02の具体例を示す図である。図6では図15に示した
SGML文書を構文解析した結果として生成されるエンティ
ティ構成表702の例を表している。図6における行8
01〜804が、それぞれ図15に示した文書エンティ
ティ101〜データエンティティ104に対応する。
【0086】図7は本実施形態の解析済みインスタンス
データ703の具体例を示す図である。図7では図15
に示したSGML文書を構文解析した結果として生成される
解析済みインスタンスデータ703の例を表している。
図7に示す通り、文書記述言語SGMLの構文に従って記述
されたSGML文書は、前記ステップ603により、タグ、
解析済み文字列データ、エンティティ参照等の出現を示
すイベントの列に変換される。
【0087】文書登録制御プログラム410の対応関係
データ抽出処理部423は、前記構文解析結果データの
解析済みインスタンスデータ703を参照して登録対象
文書が持つ論理構造を抽出すると共に、解析済みインス
タンスデータ703中のエンティティ参照(EREF)とエン
ティティ構成表702中のエンティティ識別子とを対応
付け、登録対象文書を構成する各エンティティのエンテ
ィティ識別子と当該エンティティに対応する論理構造部
分とを木構造で表した対応関係データを生成する。
【0088】図8は本実施形態の対応関係データのデー
タ構造を示す図である。図8では文書登録制御プログラ
ム410の対応関係データ抽出処理部423が生成する
対応関係データのデータ構造を表している。この図で
は、図15に示すSGML文書を登録対象文書として処理し
た場合に生成される対応関係データを例として示してい
る。
【0089】図8に示す通り、対応関係データ1001
は木構造として表現される。図8において楕円形のノー
ドは要素を表しており、ノード中の文字列はその要素の
要素型を示している。また矩形のノードは内容データを
表しており、ノード中の文字列は内容データの種別(解
析済み文字列データPCDATA、または非SGMLデータNDAT
A)を示している。菱形のノードはエンティティ遷移を
表しており、ノード中の文字列はエンティティ識別子を
示している。
【0090】ここで、あるエンティティ遷移ノードを根
とする部分木から、下位のエンティティ遷移ノードを根
とする全ての部分木を除いた部分が、そのエンティティ
遷移ノードに対応するエンティティに内容として含まれ
る部分になる。すなわち本実施形態の文書登録制御プロ
グラム410が生成する対応関係データは、論理構造と
実体構造(エンティティ構成)との対応関係を、エンテ
ィティ遷移ノードという形でその内部に含んでいる。図
8の例では、鎖線で囲った部分範囲1002が、エンテ
ィティE0002(図6に示すテキストエンティティ80
2)の内容に対応することになる。
【0091】図9は本実施形態の文書更新制御プログラ
ム412の概略処理手順を示すPAD図である。本プログ
ラムは、文書の更新を求めるクライアントからの指令に
対応して、文書空間管理プログラム415によって呼び
出される。以下に本実施形態における文書更新制御プロ
グラム412の動作手順を説明する。本プログラムは、
文書空間管理プログラム415によって呼び出される
と、まず更新対象として登録済み文書を構成するいずれ
かのエンティティの内容が指定されているのか、或いは
登録済み文書の論理構造が指定されているのかを判定す
る(ステップ1101)。ここで更新対象としてエンテ
ィティが指定されている場合、ステップ1102及びス
テップ1103からなる処理に分岐する。また更新対象
として論理構造が指定されている場合、ステップ110
4及びステップ1105からなる処理に分岐し、分岐先
から復帰した時点で処理を終了する。ステップ1102
では、呼び出し時に与えられたパラメタ(エンティティ
識別子)を用いて、更新対象となる登録済みエンティテ
ィを選択する。次にステップ1103において、前記選
択されたエンティティの内容データを更新する処理を行
う。ステップ1104では、呼び出し時に与えられたパ
ラメタ(文書識別子)を用いて、更新対象となる論理構
造を保持する登録済み文書を選択する。次にステップ1
105において、前記選択された文書の持つ論理構造を
更新する処理を行う。
【0092】図10は本実施形態の選択されたエンティ
ティの内容を更新する処理の手順を示すPAD図である。
以下に図9におけるステップ1103、すなわち選択さ
れたエンティティの内容を更新する処理について、その
詳細を説明する。
【0093】図10に示す様に被選択エンティティの更
新を行う内容データ更新処理部424では、複数のユー
ザによって1個のエンティティが同時に更新されること
を防ぐ為、まず更新対象エンティティに対してロックを
設定する(ステップ1201)。次にロックの設定に成
功したかどうかをチェックし(ステップ1202)、成
功した場合にはステップ1203からステップ1211
までの更新処理を実行する。失敗した場合には、既にロ
ックが設定されていて更新ができない旨のエラーコード
を返却して処理を終了する(ステップ1213)。
【0094】ステップ1203では、更新対象エンティ
ティの内容データを文書空間データベース格納領域41
8から読み出す。次にステップ1204では、読み出し
た内容データを、外部プログラムを用いて編集可能な外
部領域(フロッピーディスク405、データファイル格
納領域420、またはネットワーク304を介して接続
されたクライアント側のワーク領域等)に出力する。そ
して一旦処理を中断し、出力した内容データの外部プロ
グラム(例えばSGMLエディタ)による編集の終了を待
つ。外部プログラムによる編集処理が終了した旨の通知
を受けると処理を再開し、ステップ1205に進む。ス
テップ1205では、更新後の内容データを外部領域か
ら読み込み、該読み込んだ内容データによって更新対象
エンティティの内容データを置換して文書空間データベ
ース格納領域418に格納する。
【0095】次にステップ1206で部分的対応関係デ
ータ生成処理部425は、更新対象エンティティの種別
を判定する。更新対象エンティティが文書エンティティ
またはテキストエンティティである場合にはステップ1
207及びステップ1208を実行し、それ以外の非SG
MLデータエンティティである場合にはステップ1209
を実行する。
【0096】ここでステップ1207では、更新対象エ
ンティティの更新された内容データの構文解析を行い、
前記更新対象エンティティのエンティティ構成及び解析
済みインスタンスデータを示す構文解析結果データを生
成する。ステップ1208では、該構文解析結果データ
を参照して前記更新対象エンティティを構成する各エン
ティティと解析済みインスタンスデータにより得られる
論理構造部分とを対応付けて部分的な対応関係データを
生成する。またステップ1209では、更新された内容
データそのものを前記の部分的な対応関係データとして
設定する。
【0097】次にステップ1210で対応部分範囲決定
処理部426は、全ての登録済み文書の対応関係データ
に対する検索を行い、更新対象エンティティに対応する
(更新対象エンティティのエンティティ識別子を保持す
る)全てのエンティティ遷移ノードを検出する。そして
検出された全てのエンティティ遷移ノードに関して、ス
テップ1211を繰り返し実行する。ここでステップ1
211で対応関係データ更新処理部431は、選択され
たエンティティ遷移ノードの下位にある部分的な対応関
係データをステップ1208またはステップ1209で
設定された部分的な対応関係データによって置換し、こ
れを文書空間データベース格納領域中に格納することに
よって、更新されたエンティティに対応する登録済み文
書の対応関係データを更新する。最後にステップ121
2において更新対象エンティティに設定したロックを解
除して処理を終了する。
【0098】図11は本実施形態の選択されたエンティ
ティの内容を更新する処理の経過例を示す図である。図
11では図10にその手順を示した選択されたエンティ
ティの内容を更新する処理についてその具体的な経過の
例を表しており、図11では図15に示したテキストエ
ンティティ103の内容を外部領域に出力し、外部プロ
グラムによって編集する場合について示している。
【0099】ここではテキストエンティティ103中の
要素 note に含まれる内容文字列の一部をタグ<em>及び
</em>で囲み、独立した要素 em に変更したものとす
る。この編集処理によってテキストエンティティ103
の内容は編集結果エンティティデータ1301の様に更
新される。このエンティティはテキストエンティティで
あるから、前記ステップ1207において構文解析が行
われ、ステップ1208において部分的な対応関係デー
タが生成される。この例の場合、生成される対応関係デ
ータは対応関係データ1302に示す構造を持つことに
なる。
【0100】次にステップ1210において、更新対象
エンティティに対応するエンティティ遷移ノードが検索
される。図11に示す例の場合、登録された文書は図8
に示した対応関係データ1001を持つので、この木構
造上では前記更新されたテキストエンティティ103
(エンティティ識別子E0003)に対応するエンティティ
遷移ノード2個(対応関係データ1001中の着色部分
の上端)が検出される。従ってステップ1211におい
て、これらのエンティティ遷移ノードを根とする部分構
造の置き換えが行われ、この文書の対応関係データは最
終的に対応関係データ1303に示す様に更新される。
【0101】図12は本実施形態の選択された文書の論
理構造を更新する処理の手順を示すPAD図である。以下
に図9におけるステップ1105、すなわち選択された
文書の対応関係データを更新する処理について、その詳
細を説明する。
【0102】図12に示す様に被選択文書の論理構造の
更新を行う論理構造編集処理部427では、まず編集範
囲の選択を行う(ステップ1401)。編集範囲の選択
は、編集しようとする文書の対応関係データの論理構造
上で、任意のノードを指定することによって行う。指定
されたノードを根とする部分木が編集可能な範囲とな
る。
【0103】次にステップ1402からステップ140
6までの処理では、選択された編集範囲に対応する全て
のエンティティについて、複数ユーザによる重複更新を
防ぐ為にロックを設定する。ここで選択範囲の内部に含
まれるエンティティ遷移ノード、及び選択範囲より上位
でかつ最も近い位置にあるエンティティ遷移ノードに対
応するエンティティが、その選択範囲に対応するエンテ
ィティとなる。
【0104】ステップ1403では、現在注目している
特定のエンティティについて更新ロックを設定する。次
にロックの設定に成功したかどうかをチェックし(ステ
ップ1404)、失敗した場合には設定済みのロックを
全て解除した上で(ステップ1405)、既にロックが
設定されていて更新ができない旨のエラーコードを返却
して処理を終了する(ステップ1406)。
【0105】対応エンティティ全てへのロックの設定が
成功した場合にはステップ1407に進む。ステップ1
407ではGUI等を介したユーザからの指示に従い、対
応関係データの論理構造に対する編集操作(下位ノード
の追加、削除、文字列データの変更等)を行う。このと
き、変更を加えた位置を含むエンティティには内容を変
更したことを示すマークを付加しておく。
【0106】編集操作の終了が指示されるとステップ1
408に進む。ステップ1408では、編集操作の過程
で更新マークが付加された全てのエンティティについて
ステップ1409からステップ1414までの処理を繰
り返す。
【0107】ステップ1409で編集結果データ生成処
理部428は、現在注目しているエンティティに対応す
る範囲の部分的な対応関係データを入手し、これを一時
記憶に格納する。ステップ1410では、ステップ14
09で入手した部分的な対応関係データをSGMLの構文に
従って文字列化して記述した編集結果エンティティデー
タの生成を行う。次にステップ1411で対応内容デー
タ更新処理部429は、この編集結果エンティティデー
タによって注目エンティティの内容データを置換して文
書空間データベース格納領域418に格納する。
【0108】ステップ1412で更新対象検出処理部4
30は、全ての登録済み文書の対応関係データに対する
検索を行い、更新された注目エンティティに対応する
(注目エンティティのエンティティ識別子を保持する)
全てのエンティティ遷移ノードを検出する。そして検出
された全てのエンティティ遷移ノードに関してステップ
1413及びステップ1414の処理を繰り返し実行す
る。
【0109】ステップ1413で対応関係データ更新処
理部431は、注目するエンティティ遷移ノードが、ス
テップ1407で論理構造の編集を行った範囲に対応す
るものであるかどうかを判定し、編集済みのものでない
場合には、ステップ1409で入手した更新後の部分的
な対応関係データのコピーを生成して、これによって注
目するエンティティ遷移ノードを根とする部分木を置換
する(ステップ1414)。
【0110】ステップ1408における繰り返しが終了
するとステップ1415に進み、変更が加えられた全て
の文書について、その対応関係データを文書空間データ
ベース格納領域418に格納する。最後に、エンティテ
ィ群に設定していたロックを全て解除し(ステップ14
16)、処理を終了する。
【0111】図13は本実施形態の選択された文書の対
応関係データを更新する処理の経過例を示す図である。
図13では図12にその手順を示した選択された文書の
対応関係データを更新する処理についてその具体的な経
過の例を表しており、図15に示したSGML文書の対応関
係データを編集する場合を示している。
【0112】対応関係データ1001は、編集を行う前
の論理構造であり、図8における対応関係データ100
1と同一である。ここでsec型要素1501を指定して
編集範囲の選択を行ったとすると、本図に示す様にsec
型要素1501を根とする部分木が編集可能範囲とな
る。その結果、編集範囲に含まれるエンティティ遷移ノ
ードに対応するエンティティE0003、及び編集範囲の上
位に位置し、かつ最も近い位置にあるエンティティ遷移
ノードに対応するエンティティE0002では、編集範囲に
対応するエンティティとしてロックが設定される。
【0113】ロックの設定後編集操作が行われるが、こ
こではnote型要素1502の下位にある解析済み文字列
データを分割し、その一部をem型要素とする構造編集が
行われたものとする。この場合、更新後における文書全
体の論理構造は、対応関係データ1503の様になる。
編集操作が最終的にこれだけだったとすると、内容を変
更したとしてマークを付加されるエンティティは、E000
3だけとなる。そして、更新後の部分的な対応関係デー
タから、該データをSGMLの構文に従って文字列化した編
集結果エンティティデータが生成される。本図に示す例
では、図11に示す編集結果エンティティデータ130
1と同一の文字列が編集結果エンティティデータとして
得られたものとする。
【0114】エンティティE0003の内容データが編集結
果エンティティデータ1301によって置換され、該エ
ンティティが更新された後、該エンティティに対応する
全てのエンティティ遷移ノード(但し、構造編集を行っ
た範囲に対応するものを除く)の下位構造が、構造編集
後の部分的な対応関係データのコピーによって置換され
る。本図の例では、エンティティE0003に対応するエン
ティティ遷移ノードが文書中にもう一箇所含まれている
為、この部分の構造の置換が行われ、最終的な更新後の
対応関係データは図11に示した対応関係データ130
3と同一になる。
【0115】以上に示した様に本実施形態における文書
の更新処理では、文書を構成するエンティティをテキス
トとして編集した場合でも、文書の論理構造を直接構造
編集した場合でも、実質的な編集内容が等価であれば最
終的に論理構造とエンティティの内容データの間で整合
性のとられた同一の結果が残される。なお本実施形態で
はSGMLを用いて記述された構造化文書を登録対象文書と
して処理する構成をとったが、XMLやHTML等、他の文書
記述言語を用いて記述された構造化文書を管理対象とす
る様に構成することもできる。
【0116】図14は本実施形態の文書登録制御プログ
ラム410が生成する対応関係データの他のデータ構造
を示す図である。この図では図15に示すSGML文書を登
録対象文書として処理した場合に生成される対応関係デ
ータを例として示している。以下に本実施形態の対応関
係データの他の例について図面を用いて説明する。
【0117】図14に示す様に対応関係データ1601
は、図8に示した対応関係データ1001とは異なり、
木構造中にエンティティ遷移ノードを含んでいない。独
立したノードとしてエンティティ遷移ノードを保持する
代わりに、対応関係データ1601では論理構造を構成
する個々の要素ノード及び内容データノードが、それぞ
れ対応するエンティティのエンティティ識別子をプロパ
ティとして保持している。
【0118】全ての要素ノード及び内容データノードに
エンティティ識別子を持たせる為、対応関係データ16
01のデータ量は、前記の対応関係データ1001の場
合に比べて大きくなる。その代わり、図12に示した選
択された文書の論理構造を更新する処理において編集範
囲に対応するエンティティを求める際に、ノードの木構
造を上方に辿ってエンティティ遷移ノードを検索する必
要がなく、編集範囲に含まれるノードがプロパティとし
て持つエンティティ識別子の集合を得るだけで良いので
処理が簡略化され、処理効率も向上する。なお対応関係
データ1601を用いた場合と対応関係データ1001
を用いた場合との間で機能的な差異は生じない。
【0119】以上説明した様に本実施形態の構造化文書
管理システムによれば、登録対象文書を構成する各エン
ティティと当該エンティティに対応する論理構造部分と
を示す対応関係データを生成して複数のエンティティを
管理するので、登録文書の持つ論理構造と実体構造とを
相互に変換可能な形で対応付けて管理することが可能で
ある。
【0120】また本実施形態の構造化文書管理システム
によれば、登録済み文書を構成するエンティティが元々
持っていた属性を継承するので、属性設定を手作業で行
うことなく登録前の構造化文書の各エンティティが持っ
ていた属性に従って登録済み文書の各エンティティのア
クセス制御を行うことが可能である。
【0121】また本実施形態の構造化文書管理システム
によれば、登録済み文書をエンティティ単位で部分的に
取り出して処理するので、エンティティ取り出し時の転
送データ量を減少させて処理効率を向上させることが可
能である。
【0122】また本実施形態の構造化文書管理システム
によれば、登録済み文書から複数の編集対象をエンティ
ティ単位で別々に取り出して編集を行うので、複数人の
担当者による大規模文書の共同管理・分担執筆を容易に
行うことが可能である。
【0123】また本実施形態の構造化文書管理システム
によれば、エンティティ単位のテキストデータが失われ
てしまうことがないので、その内容と作成者を保証する
為に文書を構成するエンティティ毎に電子署名データを
付加して厳密な文書管理を行うことが可能である。
【0124】
【発明の効果】本発明によれば登録対象文書を構成する
各エンティティと当該エンティティに対応する論理構造
部分とを示す対応関係データを生成して複数のエンティ
ティを管理するので、登録文書の持つ論理構造と実体構
造とを相互に変換可能な形で対応付けて管理することが
可能である。
【図面の簡単な説明】
【図1】本実施形態の文書管理サーバの概略構成を示す
図である。
【図2】本実施形態の文書管理システムの全体構成を示
す図である。
【図3】本実施形態の文書管理サーバ301全体の動作
を制御する文書空間管理プログラム415の概略処理手
順を示すPAD図である。
【図4】本実施形態の文書登録制御プログラム410の
概略処理手順を示すPAD図である。
【図5】本実施形態の構文解析結果データのデータ構造
を示す図である。
【図6】本実施形態のエンティティ構成表702の具体
例を示す図である。
【図7】本実施形態の解析済みインスタンスデータ70
3の具体例を示す図である。
【図8】本実施形態の対応関係データのデータ構造を示
す図である。
【図9】本実施形態の文書更新制御プログラム412の
概略処理手順を示すPAD図である。
【図10】本実施形態の選択されたエンティティの内容
を更新する処理の手順を示すPAD図である。
【図11】本実施形態の選択されたエンティティの内容
を更新する処理の経過例を示す図である。
【図12】本実施形態の選択された文書の論理構造を更
新する処理の手順を示すPAD図である。
【図13】本実施形態の選択された文書の対応関係デー
タを更新する処理の経過例を示す図である。
【図14】本実施形態の文書登録制御プログラム410
が生成する対応関係データの他のデータ構造を示す図で
ある。
【図15】従来の文書記述言語SGMLによって記述された
構造化文書の一例を示す図である。
【図16】従来の図15のSGML文書を解析して得られる
論理構造の例を示す図である。
【符号の説明】
401…ディスプレイ、402…キーボード、403…
中央処理装置、404…フロッピーディスクドライブ、
405…フロッピーディスク、406…通信制御装置、
407…主メモリ、408…磁気ディスク装置、409
…システムバス、410…文書登録制御プログラム、4
11…文書参照制御プログラム、412…文書更新制御
プログラム、413…文書出力制御プログラム、414
…文書検索制御プログラム、415…文書空間管理プロ
グラム、416…データベース管理システム、417…
オペレーティングシステム、418…文書空間データベ
ース格納領域、419…プログラム格納領域、420…
データファイル格納領域、421…文書構文解析処理
部、422…内容データ抽出処理部、423…対応関係
データ抽出処理部、424…内容データ更新処理部、4
25…部分的対応関係データ生成処理部、426…対応
部分範囲決定処理部、427…論理構造編集処理部、4
28…編集結果データ生成処理部、429…対応内容デ
ータ更新処理部、430…更新対象検出処理部、431
…対応関係データ更新処理部、301…文書管理サー
バ、302…文書管理クライアント、303…業務処理
システム、304…ネットワーク、701…構文解析結
果データ、702…エンティティ構成表、703…解析
済みインスタンスデータ、801〜804…行、100
1…対応関係データ、1002…部分範囲、1301…
編集結果エンティティデータ、1302及び1303…
対応関係データ、1501…sec型要素、1502…not
e型要素、1503…対応関係データ、1601…対応
関係データ、101…文書エンティティ、102及び1
03…テキストエンティティ、104…データエンティ
ティ、201…ノード集合、202…ノード集合、20
3及び204…ノード集合、205…ノード集合。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 里 佳史 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所システム開発本部内 Fターム(参考) 5B009 QA01 QA06 QA11 QB05 QB06 QB11 QB14 SA14 TB04 TB13 VA02 VA11 VC03

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 文書記述言語を用いて記述された構造化
    文書を管理する構造化文書管理方法において、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書を構成する任意のファイルを更新
    対象として選択して更新対象ファイルの内容データを更
    新する内容データ更新ステップと、更新後の更新対象フ
    ァイルの実体構造及び論理構造を示す部分的な対応関係
    データを生成する部分的対応関係データ生成ステップ
    と、前記部分的な対応関係データによって登録済み文書
    の対応関係データを更新する対応関係データ更新ステッ
    プとを有することを特徴とする構造化文書管理方法。
  2. 【請求項2】 前記内容データ更新ステップは、外部プ
    ログラムによって編集された更新後の内容データによっ
    て更新対象ファイルの内容データを置換することを特徴
    とする請求項1に記載された構造化文書管理方法。
  3. 【請求項3】 前記部分的対応関係データ生成ステップ
    は、前記更新対象ファイルが文書ファイルまたはテキス
    トファイルである場合に更新後の更新対象ファイルを解
    析して部分的な対応関係データを生成し、そのいずれで
    もない場合に更新後の内容データそのものを設定した部
    分的な対応関係データを生成することを特徴とする請求
    項1または請求項2のいずれかに記載された構造化文書
    管理方法。
  4. 【請求項4】 前記更新対象ファイルのファイル構成及
    び解析済みインスタンスデータを示す構文解析結果デー
    タを生成する文書構文解析ステップと、前記更新対象フ
    ァイルを構成する各ファイルと解析済みインスタンスデ
    ータにより得られる論理構造部分とを対応付けて部分的
    な対応関係データを生成する対応関係データ抽出ステッ
    プとを有することを特徴とする請求項3に記載された構
    造化文書管理方法。
  5. 【請求項5】 登録済み文書の対応関係データ中で前記
    更新対象ファイルに対応する部分範囲を求める対応部分
    範囲決定ステップを有し、 前記対応関係データ更新ステップは、前記求めた部分範
    囲の対応関係データを前記更新対象ファイルの部分的な
    対応関係データによって置換して登録済み文書の対応関
    係データを更新することを特徴とする請求項1乃至請求
    項4のいずれか1項に記載された構造化文書管理方法。
  6. 【請求項6】 前記更新対象ファイルにロックを設定し
    て当該ファイルへの編集処理を排他的に行うことを特徴
    とする請求項1乃至請求項5のいずれか1項に記載され
    た構造化文書管理方法。
  7. 【請求項7】 文書記述言語を用いて記述された構造化
    文書を管理する構造化文書管理方法において、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書の任意の論理構造を更新対象とし
    て選択して編集する論理構造編集ステップと、前記編集
    した論理構造の範囲内にあるファイルの実体構造及び論
    理構造を示す部分的な対応関係データを文字列化して記
    述した編集結果データを生成する編集結果データ生成ス
    テップと、前記生成した編集結果データによって前記フ
    ァイルの内容データを置換する対応内容データ更新ステ
    ップと、前記部分的な対応関係データによって登録済み
    文書の対応関係データを更新する対応関係データ更新ス
    テップとを有することを特徴とする構造化文書管理方
    法。
  8. 【請求項8】 登録済み文書の対応関係データ中で前記
    ファイルに対応する部分範囲を求める更新対象検出ステ
    ップを有し、 前記対応関係データ更新ステップは、前記求めた部分範
    囲の対応関係データを前記ファイルの部分的な対応関係
    データによって置換して登録済み文書の対応関係データ
    を更新することを特徴とする請求項7に記載された構造
    化文書管理方法。
  9. 【請求項9】 前記更新対象の論理構造の範囲内にある
    ファイルにロックを設定して当該ファイルへの編集処理
    を排他的に行うことを特徴とする請求項7または請求項
    8のいずれかに記載された構造化文書管理方法。
  10. 【請求項10】 登録済み文書の持つファイル構成に対
    応して設定されたノード集合の属性に応じてノード集合
    毎に更新対象へのアクセス制御を行うことを特徴とする
    請求項1乃至請求項9のいずれか1項に記載された構造
    化文書管理方法。
  11. 【請求項11】 登録済み文書を構成するファイル単位
    で編集対象を取り出して更新処理を行うことを特徴とす
    る請求項1乃至請求項10のいずれか1項に記載された
    構造化文書管理方法。
  12. 【請求項12】 複数の編集対象を別々に取り出して編
    集し、更新後の編集対象を再登録することにより構造化
    文書の編集を並列に行うことを特徴とする請求項1乃至
    請求項11のいずれか1項に記載された構造化文書管理
    方法。
  13. 【請求項13】 更新後の編集対象を構成するファイル
    に電子署名を付加することを特徴とする請求項1乃至請
    求項12のいずれか1項に記載された構造化文書管理方
    法。
  14. 【請求項14】 登録対象文書のファイル構成及び解析
    済みインスタンスデータを示す構文解析結果データを生
    成する文書構文解析ステップと、登録対象文書を構成す
    る各ファイルと解析済みインスタンスデータにより得ら
    れる論理構造部分とを対応付けて登録対象文書の実体構
    造及び論理構造を示す対応関係データを生成する対応関
    係データ抽出ステップとを有することを特徴とする請求
    項1乃至請求項13のいずれか1項に記載された構造化
    文書管理方法。
  15. 【請求項15】 登録対象文書の持つファイル構成に対
    応したノード集合を設定し、対応するファイルの持つ属
    性を継承してその属性を各ノード集合毎に付与すること
    を特徴とする請求項14に記載された構造化文書管理方
    法。
  16. 【請求項16】 登録対象文書を構成するファイルに付
    加された電子署名を当該ファイルの内容データと共に登
    録することを特徴とする請求項14または請求項15の
    いずれかに記載された構造化文書管理方法。
  17. 【請求項17】 文書記述言語を用いて記述された構造
    化文書を管理する構造化文書管理装置において、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書を構成する任意のファイルを更新
    対象として選択して更新対象ファイルの内容データを更
    新する内容データ更新処理部と、更新後の更新対象ファ
    イルの実体構造及び論理構造を示す部分的な対応関係デ
    ータを生成する部分的対応関係データ生成処理部と、前
    記部分的な対応関係データによって登録済み文書の対応
    関係データを更新する対応関係データ更新処理部とを備
    えることを特徴とする構造化文書管理装置。
  18. 【請求項18】 文書記述言語を用いて記述された構造
    化文書を管理する構造化文書管理装置において、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書の任意の論理構造を更新対象とし
    て選択して編集する論理構造編集処理部と、前記編集し
    た論理構造の範囲内にあるファイルの実体構造及び論理
    構造を示す部分的な対応関係データを文字列化して記述
    した編集結果データを生成する編集結果データ生成処理
    部と、前記生成した編集結果データによって前記ファイ
    ルの内容データを置換する対応内容データ更新処理部
    と、前記部分的な対応関係データによって登録済み文書
    の対応関係データを更新する対応関係データ更新処理部
    とを備えることを特徴とする構造化文書管理装置。
  19. 【請求項19】 文書記述言語を用いて記述された構造
    化文書を管理する構造化文書管理装置としてコンピュー
    タを機能させる為のプログラムを記録した媒体におい
    て、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書を構成する任意のファイルを更新
    対象として選択して更新対象ファイルの内容データを更
    新する内容データ更新処理部と、更新後の更新対象ファ
    イルの実体構造及び論理構造を示す部分的な対応関係デ
    ータを生成する部分的対応関係データ生成処理部と、前
    記部分的な対応関係データによって登録済み文書の対応
    関係データを更新する対応関係データ更新処理部として
    コンピュータを機能させる為のプログラムを記録したこ
    とを特徴とする媒体。
  20. 【請求項20】 文書記述言語を用いて記述された構造
    化文書を管理する構造化文書管理装置としてコンピュー
    タを機能させる為のプログラムを記録した媒体におい
    て、 登録済み文書の実体構造及び論理構造を示す対応関係デ
    ータから登録済み文書の任意の論理構造を更新対象とし
    て選択して編集する論理構造編集処理部と、前記編集し
    た論理構造の範囲内にあるファイルの実体構造及び論理
    構造を示す部分的な対応関係データを文字列化して記述
    した編集結果データを生成する編集結果データ生成処理
    部と、前記生成した編集結果データによって前記ファイ
    ルの内容データを置換する対応内容データ更新処理部
    と、前記部分的な対応関係データによって登録済み文書
    の対応関係データを更新する対応関係データ更新処理部
    としてコンピュータを機能させる為のプログラムを記録
    したことを特徴とする媒体。
JP36011098A 1998-12-18 1998-12-18 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体 Expired - Fee Related JP4141556B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP36011098A JP4141556B2 (ja) 1998-12-18 1998-12-18 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
CA2292223A CA2292223C (en) 1998-12-18 1999-12-15 Method and system for management of structured document and medium having processing program therefor
US10/834,044 US7107527B2 (en) 1998-12-18 2004-04-29 Method and system for management of structured document and medium having processing program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36011098A JP4141556B2 (ja) 1998-12-18 1998-12-18 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体

Publications (2)

Publication Number Publication Date
JP2000181917A true JP2000181917A (ja) 2000-06-30
JP4141556B2 JP4141556B2 (ja) 2008-08-27

Family

ID=18467951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36011098A Expired - Fee Related JP4141556B2 (ja) 1998-12-18 1998-12-18 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体

Country Status (3)

Country Link
US (1) US7107527B2 (ja)
JP (1) JP4141556B2 (ja)
CA (1) CA2292223C (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003248679A (ja) * 2002-02-22 2003-09-05 Toshiba Corp 構造化文書編集システム、構造化文書編集方法及びプログラム
WO2005109241A1 (ja) * 2004-05-11 2005-11-17 Atl Systems, Inc. データ構造、構造化データ管理システム及び構造化データ管理方法並びに構造化データ管理プログラム
JP2008542875A (ja) * 2005-05-25 2008-11-27 マイクロソフト コーポレーション 変更可能文書を複数のクライアントと同期するための方法、システム、およびコンピュータ可読記憶媒体
US7711752B2 (en) 2005-06-10 2010-05-04 Canon Kabushiki Kaisha Information processing apparatus, method of controlling information processing apparatus, computer program, and storage medium
CN111752909A (zh) * 2020-06-11 2020-10-09 厦门网宿有限公司 一种多版本文件的操作方法、系统及装置

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339312A (ja) * 1999-05-31 2000-12-08 Toshiba Corp 文書編集システム及びタグ情報管理テーブル作成方法
FR2818409B1 (fr) * 2000-12-18 2003-03-14 Expaway Procede pour diviser des documents structures en plusieurs parties
US20030014512A1 (en) * 2001-07-10 2003-01-16 Murata Kikai Kabushiki Kaisha Communication apparatus and structured document management apparatus
US8041739B2 (en) * 2001-08-31 2011-10-18 Jinan Glasgow Automated system and method for patent drafting and technology assessment
US7996511B1 (en) * 2003-10-28 2011-08-09 Emc Corporation Enterprise-scalable scanning using grid-based architecture with remote agents
JP2006185408A (ja) * 2004-11-30 2006-07-13 Matsushita Electric Ind Co Ltd データベース構築装置及びデータベース検索装置及びデータベース装置
US8347237B2 (en) * 2006-06-27 2013-01-01 Palo Alto Research Center Incorporated Method, apparatus, and program product for efficiently detecting relationships in a comprehension state of a collection of information
US8010646B2 (en) * 2006-06-27 2011-08-30 Palo Alto Research Center Incorporated Method, apparatus, and program product for efficiently defining relationships in a comprehension state of a collection of information
US8001157B2 (en) * 2006-06-27 2011-08-16 Palo Alto Research Center Incorporated Method, apparatus, and program product for developing and maintaining a comprehension state of a collection of information
US8370853B2 (en) 2006-08-04 2013-02-05 Apple Inc. Event notification management
US8311988B2 (en) 2006-08-04 2012-11-13 Apple Inc. Consistent back up of electronic information
US7853566B2 (en) * 2006-08-04 2010-12-14 Apple Inc. Navigation of electronic backups
US7860839B2 (en) 2006-08-04 2010-12-28 Apple Inc. Application-based backup-restore of electronic information
US9009115B2 (en) 2006-08-04 2015-04-14 Apple Inc. Restoring electronic information
US20080222515A1 (en) * 2007-02-26 2008-09-11 Microsoft Corporation Parameterized types and elements in xml schema
US8745523B2 (en) 2007-06-08 2014-06-03 Apple Inc. Deletion in electronic backups
US8099392B2 (en) * 2007-06-08 2012-01-17 Apple Inc. Electronic backup of applications
US8725965B2 (en) 2007-06-08 2014-05-13 Apple Inc. System setup for electronic backup
US8010900B2 (en) 2007-06-08 2011-08-30 Apple Inc. User interface for electronic backup
US8307004B2 (en) 2007-06-08 2012-11-06 Apple Inc. Manipulating electronic backups
US20080307017A1 (en) 2007-06-08 2008-12-11 Apple Inc. Searching and Restoring of Backups
JP4998220B2 (ja) * 2007-11-09 2012-08-15 富士通株式会社 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
US20100318982A1 (en) * 2009-06-11 2010-12-16 Hewlett-Packard Development Company, L.P. Updating electronic documents
US8943026B2 (en) 2011-01-14 2015-01-27 Apple Inc. Visual representation of a local backup
US8984029B2 (en) 2011-01-14 2015-03-17 Apple Inc. File system management
EP2555144A3 (en) * 2011-08-05 2013-04-17 Document Modelling Pty Ltd Structured document development, management and generation
US9542398B2 (en) * 2013-12-18 2017-01-10 Kabushiki Kaisha Toshiba Electronic apparatus
JP6336323B2 (ja) * 2014-04-25 2018-06-06 キヤノン株式会社 情報処理装置、制御方法およびプログラム
CN113609244B (zh) * 2021-06-08 2023-09-05 中国科学院软件研究所 一种基于可控生成的结构化记录抽取方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5185698A (en) * 1989-02-24 1993-02-09 International Business Machines Corporation Technique for contracting element marks in a structured document
JP3484775B2 (ja) 1994-07-29 2004-01-06 富士ゼロックス株式会社 文書処理装置および方法
US6199082B1 (en) * 1995-07-17 2001-03-06 Microsoft Corporation Method for delivering separate design and content in a multimedia publishing system
JPH09223054A (ja) 1996-02-14 1997-08-26 Nippon Steel Corp ファイル集合管理装置
US5706502A (en) * 1996-03-25 1998-01-06 Sun Microsystems, Inc. Internet-enabled portfolio manager system and method
US5903902A (en) * 1996-09-09 1999-05-11 Design Intelligence, Inc. Design engine with tree and component structure
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
US6321242B1 (en) * 1998-02-06 2001-11-20 Sun Microsystems, Inc. Re-linking technology for a moving web site
US6480206B2 (en) * 1998-02-24 2002-11-12 Sun Microsystems, Inc. Method and apparatus for an extensible editor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003248679A (ja) * 2002-02-22 2003-09-05 Toshiba Corp 構造化文書編集システム、構造化文書編集方法及びプログラム
WO2005109241A1 (ja) * 2004-05-11 2005-11-17 Atl Systems, Inc. データ構造、構造化データ管理システム及び構造化データ管理方法並びに構造化データ管理プログラム
JPWO2005109241A1 (ja) * 2004-05-11 2008-07-31 株式会社エーティーエルシステムズ データ構造、構造化データ管理システム及び構造化データ管理方法並びに構造化データ管理プログラム
JP2008542875A (ja) * 2005-05-25 2008-11-27 マイクロソフト コーポレーション 変更可能文書を複数のクライアントと同期するための方法、システム、およびコンピュータ可読記憶媒体
US7711752B2 (en) 2005-06-10 2010-05-04 Canon Kabushiki Kaisha Information processing apparatus, method of controlling information processing apparatus, computer program, and storage medium
CN111752909A (zh) * 2020-06-11 2020-10-09 厦门网宿有限公司 一种多版本文件的操作方法、系统及装置
CN111752909B (zh) * 2020-06-11 2023-05-16 厦门网宿有限公司 一种多版本文件的操作方法、系统及装置

Also Published As

Publication number Publication date
CA2292223C (en) 2011-02-01
US7107527B2 (en) 2006-09-12
US20040205598A1 (en) 2004-10-14
CA2292223A1 (en) 2001-09-14
JP4141556B2 (ja) 2008-08-27

Similar Documents

Publication Publication Date Title
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
US7069502B2 (en) Structured document management system and structured document management method
US7130867B2 (en) Information component based data storage and management
US6377946B1 (en) Document search method and apparatus and portable medium used therefor
JP4445509B2 (ja) 構造化文書検索システム及びプログラム
JP3887867B2 (ja) 構造化文書の登録方法
JP3939923B2 (ja) 論理的ハイパーリンクを備えた知識供給装置
US20040205615A1 (en) Enhanced mechanism for automatically generating a transformation document
KR20090028758A (ko) 정보 재사용 방법, 정보 제공 방법, 편집 가능한 문서, 및 문서 편집 시스템
JPH0830620A (ja) 構造検索装置
US8082492B2 (en) Structured-document management apparatus, search apparatus, storage method, search method and program
US7159171B2 (en) Structured document management system, structured document management method, search device and search method
JP4247108B2 (ja) 構造化文書検索方法、構造化文書検索装置、及びプログラム
JP3868171B2 (ja) 文書のデジタル署名付き管理方法および文書管理装置
JP5172073B2 (ja) 編集システム、サーバ及びプログラム
JP2000003366A (ja) 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JPH11288412A (ja) 文書作成方法及びシステム及び文書作成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4199916B2 (ja) 文書管理方法および装置
JP2005056085A (ja) データ構造変換プログラム
JP2001060164A (ja) データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体
JPH117445A (ja) 統合化文書管理装置
JP2002297662A (ja) 構造化文書編集方法および構造化文書編集装置および端末装置およびプログラム
JP4334450B2 (ja) 構造化文書検索装置及び構造化文書検索方法
JP2002099453A (ja) 構造化データの履歴管理方法
JP2004348593A (ja) 格納検索装置、格納検索方法、格納検索プログラム、および格納検索プログラム記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040223

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051107

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20051110

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20051209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080516

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080611

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees