WO2006121051A1

WO2006121051A1 - 文書処理装置および文書処理方法

Info

Publication number: WO2006121051A1
Application number: PCT/JP2006/309337
Authority: WO
Inventors: Nobuyuki Otomori; Yusuke Fujimaki; Yasuo Akai; Toshio Ueda
Original assignee: Justsystems Corporation
Priority date: 2005-05-09
Filing date: 2006-05-09
Publication date: 2006-11-16
Also published as: US20090070295A1; JP5073494B2; JPWO2006121051A1

Abstract

　複数の構造化文書ファイルに含まれるデータを扱う上でのユーザの利便性を向上させる。　子文書ファイルは、複数のタグが構造化された親文書ファイルのスキーマを継承したスキーマによって生成される。親文書ファイルに含まれるタグであるモデルタグから継承された子文書ファイルのタグである実体タグの名前は、ユーザによる指示入力に応じて変更可能である。このとき、子文書ファイルに含まれる実体タグの名前と、その実体タグの継承元であるモデルタグの名前を対応づけたタグマッピングテーブルが保持される。モデルタグの名前を検索キーとしてタグマッピングテーブルを参照して対応する実体タグの名前を検出し、その実体タグの名前を新たな検索キーとして子文書ファイルからその実体タグのデータを検出する。

Description

明細書

文書処理装置および文書処理方法

技術分野

[0001] この発明は、データ処理技術に関し、とくに、文書データを構造化して処理する技術に関する。

背景技術

[0002] 近年、コンピュータの普及とネットワーク技術の進展に伴い、ネットワークを介した電子情報の交換が盛んになつている。これにより、従来においては紙ベースで行われていた事務処理の多く力ネットワークベースの処理に置き換えられつつある。

[0003] 企業にぉ、ても、個人の知識や情報を組織全体で活用する、 Vヽゎゆるナレツジマネジメントが、重要な経営手法となってきている。多くの企業においては、社内にデータベースシステムを有し、従業員からの情報を電子ファイルィ匕して蓄積する。その一方で、従業員も、この社内データベースに蓄積されたファイルにネットワークを介してアクセスする。これによつて、組織全体としての業務効率の向上が図られる。

[0004] この社内データベースに蓄積されるファイルの多くは、 HTML (Hyper Text Markup

Language)とよばれる言語によって作成されている。また、近年においては、 XML (e Xtensible Markup Language)とよばれる言語を用いて、これらのファイルが作成される例も多くなつてきている。

[0005] HTMLは、ウェブページを記述するための言語である。すなわち、 HTMLは文書ファイルの表示方法を定義するマークアップ言語の一種である。これに対して、 XML は HTMLの様に、直接的にウェブページを記述することを目的とする言語というよりは、むしろ、文書ファイルに含まれるデータのデータ構造を定義する機能を有する言語といえる。 XMLによって作成された文書ファイルは、別に表示レイアウト情報を与えることによって、ウェブページとして表示される。すなわち、 XML文書においては、データの構造とその表示レイアウトが別々のものとして扱うことができる。 XMLのように、マークアップ言語を生成するための言語はメタ言語ともよばれる。

[0006] XMLは、ネットワークなどを介して他者とデータを共有するのに適した形式として注目されており、 XML文書を作成、表示、編集するためのアプリケーションが開発されている（たとえば、特許文献 1参照)。 XML文書は、文書型定義などにより定義されたボキヤブラリ（タグセット）に基づいて作成されている。

特許文献 1：特開 2001— 290804号公報

発明の開示

発明が解決しょうとする課題

[0007] 企業内の多くの部署では、通常、個人情報を含んだ各種文書ファイルがオリジナルのフォーマット (XMLによる構造ィ匕は行われて、る）で存在して、る。個人情報の流出を防ぐため、セキュリティ管理者は、個人情報データを管理する必要がある。しかし、こうした個人情報データは各部署において通用するローカルな用語で登録されている。たとえば、営業では「顧客情報」として「氏名」や「住所」が、研究開発部門でも「データ入手先」として「氏名」「住所」が登録されている。また、こうした情報を入力するためのブラウザ画面における表示レイアウトは各部署単位で開発されている場合が多い。ここで、もし顧客情報を管理し、社外にこうした情報が流出することを防ごうとした場合に、そのシステム変更として以下の業務が発生する。

[0008] 1.セキュリティ管理者が各部署で扱っている帳票などの文書ファイルに含まれる個人情報をチェックする。

2.社内システムとして、こうした帳票の個人情報に「個人情報注意」を示すァノテ一シヨンを付与するといつた作業と個人情報データベースの構築。

3.各部署で使用している入力画面の変更。

これら業務は非常にコストがかかる。

[0009] 本発明は、複数の構造ィ匕文書ファイルに含まれるデータを扱う上でのユーザの利便性を向上させるための技術を提供することにある。

課題を解決するための手段

[0010] 上記課題を解決するために、本発明のある態様の文書処理装置は、複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルを保持するファイル保持部と、親文書ファイルに含まれるタグであるモデルタグから継承された子文書ファイルのタグである実体タグの名前をユーザによる指示入力に応じて変更するタグリネーム処理部と、子文書ファイルに含まれる実体タグの名前と、その実体タグの継承元であるモデルタグの名前を対応づけたタグマッピングテーブルを保持するタグマッピングテーブル保持部と、モデルタグの名前を検索キーとするユーザによる検索指示入力により、タグマッピングテーブルを参照して対応する実体タグの名前を検出し、その実体タグの名前を新たな検索キーとして子文書ファィルカその実体タグのデータを検出するタグデータ検索部と、を備える。

[0011] また、この装置は、フィルタリング対象となるべきタグの種類を定めたフィルタリング条件にしたがって、文書ファイルに含まれるタグを分類するフィルタリング処理部を備えてもよい。このフィルタリング処理部は、分類抽出の対象となるべきモデルタグをフィルタリング条件にしたがって特定し、そのモデルタグの名前を検索キーとして実体タグのデータを検出するようにタグデータ検索部に指示することにより、フィルタリングすべきタグのデータを分類抽出してもよい。

このような態様においては、たとえば、表示や外部への送信に適さないデータが入力されるタグをフィルタリング条件として定義しておけば、このような特定の属性を持つデータを文書ファイルカゝら抽出しやすくなる。

[0012] この装置は、ユーザにより指定された実体タグの継承元であるモデルタグをタグマツビングテーブルを参照して検出し、タグマッピングテーブル保持部に保持されて、る複数のタグマッピングテーブルを参照することによりそのモデルタグを継承するその他の実体タグを検出する関連タグ検索部を更に備えてもよい。

[0013] 本発明の別の態様もまた、文書処理装置である。

この装置は、複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキ一マによって生成された子文書ファイルを保持するファイル保持部と、親文書フアイルに含まれるァノテーシヨンであるモデルァノテーシヨン力も継承された子文書フアイルのァノテーシヨンである実体ァノテーシヨンの名前をユーザによる指示入力に応じて変更するァノテーシヨンリネーム処理部と、子文書ファイルに含まれる実体ァノテ一シヨンの名前と、その実体ァノテーシヨンの継承元であるモデルァノテーシヨンの名前を対応づけたァノテーシヨンマッピングテーブルを保持するァノテーシヨンマッピングテーブル保持部と、子文書ファイルに含まれるユーザによって指示されたデータに実体ァノテーシヨンを設定するァノテーシヨン設定部と、モデルァノテーシヨンの名前を検索キーとするユーザによる検索指示入力により、ァノテーシヨンマッピングテーブルを参照して対応する実体ァノテーシヨンの名前を検出し、その実体ァノテーシヨンの名前を新たな検索キーとして子文書ファイル力その実体ァノテーシヨンが設定されるデータを検出するァノテーシヨンデータ検索部と、を備える。

[0014] この装置は、子文書ファイルを外部装置に送信するファイル送信部を更に備えてもよい。ァノテーシヨンデータ検索部は、子文書ファイルに含まれるデータのうち外部送信を禁止すべきデータに設定されるモデルァノテーシヨンを検索キーとして子文書フアイルカも該当データを検出し、ファイル送信部は、その検出されたデータの外部装置に対する送信を抑止してもよ、。

[0015] 本発明の別の態様もまた、文書処理装置である。

この装置は、所定のタグセットに属する実体タグによって記述された構造ィ匕文書フアイルを取得する文書取得部と、構造化文書ファイルに含まれる実体タグを検出し、所定のタグセットとは異なるタグセットに属するモデルタグのうち、検出した実体タグと所定の関係にあるモデルタグを検出する対応検出部と、所定の関係にある実体タグとモデルタグを対応づけてタグマッピングテーブルに記録するマッピング記録部と、モデルタグを検索キーとする検索指示入力をユーザ力受け付けると、タグマツピングテーブルにおヽて対応づけられてヽる実体タグの要素データを構造ィ匕文書フアイルから検出するタグ検索部と、を備える。

[0016] この装置は、構造化文書ファイルに含まれるデータを画面表示させるデータ表示部と、

表示対象外となる要素データに対応するモデルタグの指定入力をユーザ力受け付けると、タグマッピングテーブルにおいて対応づけられている実体タグを検出し、構造ィ匕文書ファイルにおいてその実体タグにより特定される要素データを表示対象力除外する表示制御部と、を更に備えてもよい。

[0017] この装置の対応検出部は、類語関係にある単語の組み合わせが定義された類語データテーブルを参照して、構造ィ匕文書ファイル力検出した実体タグの名前と類語関係にある名前のモデルタグを所定の関係にあるモデルタグとして検出してもよ、。 [0018] この装置の対応検出部は、上位概念と下位概念の関係にある単語の組み合わせが定義された概念データテーブルを参照して、構造ィ匕文書ファイルカゝら検出した実体タグの名前に対して上位概念にあたる名前のモデルタグを所定の関係にあるモデルタグとして検出してもよい。

[0019] なお、以上の構成要素の任意の組合せや、本発明の構成要素や表現を方法、装置、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体、データ構造などの間で相互に置換したものもまた、本発明の態様として有効である。発明の効果

[0020] 本発明によれば、複数の構造ィ匕文書ファイルに含まれるデータを扱う上でのユーザの利便性を向上させる上で効果がある。

図面の簡単な説明

[0021] [図 1]前提技術に係る文書処理装置の構成を示す図である。

[図 2]処理対象となる XML文書の例を示す図である。

[図 3]図 2に示した XML文書を HTMLで記述された表にマッピングする例を示す図である。

[図 4(a)]図 2に示した XML文書を図 3に示した表にマッピングするための定義フアイルの例を示す図である。

[図 4(b)]図 2に示した XML文書を図 3に示した表にマッピングするための定義フアイルの例を示す図である。

[図 5]図 2に示した成績管理ボキヤブラリで記述された XML文書を、図 3に示した対応により HTMLにマッピングして表示した画面の例を示す図である。

[図 6]ユーザが定義ファイルを生成するために、定義ファイル生成部がユーザに提示するグラフィカルユーザインタフェースの例を示す図である。

[図 7]定義ファイル生成部により生成された画面レイアウトの他の例を示す図である。

[図 8]文書処理装置による XML文書の編集画面の一例を示す図である。

[図 9]文書処理装置により編集される XML文書の他の例を示す図である。

[図 10]図 9に示した文書を表示した画面の例を示す図である。

[図 11(a)]文書処理システムの基本構成を示す図である。 [図 11(b)]文書処理システム全体のブロック図を示す図である。

[図 11(c)]文書処理システム全体のブロック図を示す図である。

圆 12]文書管理部の詳細を示す図である。

[図 13]ボキヤブラリコネクションサブシステムの詳細を示す図である。

[図 14]プログラム起動部と他の構成の関係の詳細を示す図である。

[図 15]プログラム起動部によりロードされたアプリケーションサービスの構造の詳細を示す図である。

[図 16]コアコンポーネントの詳細を示す図である。

圆 17]文書管理部の詳細を示す図である。

[図 18]アンドゥフレームワークとアンドゥコマンドの詳細を示す図である。

[図 19]文書処理システムにおいて文書がロードされる様子を示す図である。

圆 20]文書とその表現の例を示す図である。

[図 21]モデルとコントローラの関係を示す図である。

[図 22]プラグインサブシステム、ボキヤブラリコネクション、及びコネクタの詳細を示す図である。

[図 23]VCDファイルの例を示す図である。

[図 24]文書処理システムにおいて複合文書をロードする手順を示す図である。

[図 25]文書処理システムにおいて複合文書をロードする手順を示す図である。

[図 26]文書処理システムにおいて複合文書をロードする手順を示す図である。

[図 27]文書処理システムにおいて複合文書をロードする手順を示す図である。

[図 28]文書処理システムにおいて複合文書をロードする手順を示す図である。

[図 29]コマンドの流れを示す図である。

[図 30]セマンティックウェブのレイヤケーキを示す模式図である。

圆 31]個人情報を含んだ各種文書ファイルの一般的な取り扱い形態を示す模式図である。

圆 32]本実施例における個人情報管理支援システムのフローを示す図である。

[図 33]図 32のシーン 1について詳細に説明するための模式図である。

[図 34]研究部門におけるグローバルオントロジ一とローカルオントロジ一の関係を示す図である。

[図 35]営業部門におけるグローバルオントロジ一とローカルオントロジ一の関係を示す図である。

[図 36]子文書ファイルにァノテーシヨンを付与する態様を説明するための模式図である。

[図 37]ァノテーシヨンによるセキュリティ管理を説明するための模式図である。

[図 38]図 34や図 35に関連して説明したタグマッピングテーブルの別例を示す図である。

[図 39]前提技術で説明した文書処理装置の各種機能を利用しつつ、実体タグとモデルタグのマッピング機能を実現する文書処理装置の機能ブロック図である。

[図 40]モデルタグと実体タグのマッピング構造を説明するための模式図である。符号の説明

[0022] 20 文書処理装置、 22 主制御ユニット、 24 編集ユニット、 30 DOMユニット、 3 2 DOM提供部、 34 DOM生成部、 36 出力部、 40 CSSュ-ッ K 42 CSS解析部、 44 CSS提供部、 46 レンダリング部、 50 HTMLユニット、 52, 62 制御部、 54, 64 編集部、 56, 66 表示部、 60 SVGユニット、 80 VCユニット、 82 マツビング部、 84 定義ファイル取得部、 86 定義ファイル生成部、 3000 文書処理装置、 3100 ユーザインタフェース処理部、 3110 入力部、 3112 ァノテーシヨン設定部、 3114 文書取得部、 3120 表示部、 3130 通信部、 3132 文書送信部、 3 134 文書受信部、 3200 データ処理部、 3210 文書編集部、 3212 タグリネーム部、 3214 ァノテーシヨンリネーム部、 3220 検索部、 3222 タグ検索部、 3224 ァノテーシヨン検索部、 3230 マッピング処理部、 3232 対応検出部、 3234 マツビング記録部、 3240 マスク処理部、 3250 データ保持部、 3252 ファイル保持部、 3254 タグマッピングテーブル保持部、 3256 ァノテーシヨンマッピングテーブル保持部。

発明を実施するための最良の形態

[0023] 以下、本実施例における前提技術について述べた後、本発明の特徴を説明する。

[0024] (前提技術）図 1は、前提技術に係る文書処理装置 20の構成を示す。文書処理装置 20は、文書内のデータが階層構造を有する複数の構成要素に分類された構造化文書を処理するが、本前提技術では構造化文書の一例として XML文書を処理する例にっヽて説明する。文書処理装置 20は、主制御ユニット 22、編集ユニット 24、 DOMユニット 3 0、 CSSユニット 40、 HTMLユニット 50、 SVGユニット 60、及び変換部の一例である VCユニット 80を備える。これらの構成は、ハードウェアコンポーネントでいえば、任意のコンピュータの CPU、メモリ、メモリにロードされたプログラムなどによって実現される力ここではそれらの連携によって実現される機能ブロックを描いている。したがつて、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。

[0025] 主制御ユニット 22は、プラグインのロードや、コマンド実行のフレームワークを提供する。編集ユニット 24は、 XML文書を編集するためのフレームワークを提供する。文書処理装置 20における文書の表示及び編集機能は、プラグインにより実現されており、文書の種別に応じて必要なプラグインが主制御ユニット 22又は編集ユニット 24によりロードされる。主制御ユニット 22又は編集ユニット 24は、処理対象となる XML文書の名前空間を参照して、 XML文書が、ずれのボキヤブラリにより記述されて、るかを判別し、そのボキヤブラリに対応した表示又は編集用のプラグインをロードして表示や編集を実行させる。例えば、文書処理装置 20には、 HTML文書の表示及び編集を行う HTMLユニット 50、 SVG文書の表示及び編集を行う SVGユニット 60など、ボキヤブラリ（タグセット)ごとに表示系及び編集系がプラグインとして実装されており、 HTML文書を編集するときは HTMLユニット 50が、 S VG文書を編集するときは S V Gユニット 60が、それぞれロードされる。後述するように、 HTMLと SVGの双方の構成要素を含む複合文書が処理対象となってヽる場合は、 HTMLユニット 50と SVG ユニット 60の双方がロードされる。

[0026] このような構成によれば、ユーザは、必要な機能のみを選択してインストールし、後力適宜機能を追加又は削除することができるので、プログラムを格納するハードデイスクなどの記録媒体の記憶領域を有効に活用することができ、また、プログラム実行時にも、メモリの浪費を防ぐことができる。また、機能拡張性に優れており、開発主体としても、プラグインの形で新たなボキヤブラリに対応することが可能なので開発が容易となり、ユーザとしても、プラグインの追カ卩により容易かつ低コストにて機能を追カロすることができる。

[0027] 編集ユニット 24は、ユーザインターフェースを介してユーザ力も編集指示のイベントを受け付け、そのイベントを適切なプラグインなどに通知するともに、イベントの再実行 (リドウ）又は実行の取消（アンドゥ）などの処理を制御する。

[0028] DOMユニット 30は、 DOM提供部 32、 DOM生成部 34、及び出力部 36を含み、 X ML文書をデータとして扱うときのアクセス方法を提供するために定められた文書ォブジェクトモデル（Document Object Model: DOM)に準拠した機能を実現する。 DO M提供部 32は、編集ユニット 24に定義されているインタフェースを満たす DOMの実装である。 DOM生成部 34は、 XML文書力も DOMツリーを生成する。後述するように、処理対象となる XML文書力 VCユニット 80により他のボキヤブラリにマッピングされる場合は、マッピング元の XML文書に対応するソースツリーと、マッピング先の X ML文書に対応するデスティネーションツリーが生成される。出力部 36は、例えば編集終了時に、 DOMツリーを XML文書として出力する。

[0029] CSSユニット 40は、 CSS解析部 42、 CSS提供部 44、及びレンダリング部 46を含み、 CSSに準拠した表示機能を提供する。 CSS解析部 42は、 CSSの構文を解析するバーサの機能を有する。 CSS提供部 44は、 CSSオブジェクトの実装であり、 DOM ツリーに対して CSSのカスケード処理を行う。レンダリング部 46は、 CSSのレンダリングエンジンであり、 CSSを用いてレイアウトされる HTMLなどのボキヤブラリで記述された文書の表示に用いられる。

[0030] HTMLユニット 50は、 HTMLにより記述された文書を表示又は編集する。 SVGュニット 60は、 SVGにより記述された文書を表示又は編集する。これらの表示 Z編集系は、プラグインの形で実現されており、それぞれ、文書を表示する表示部（Canvas) 56、 66、編集指示を含むイベントを送受信する制御部（Editlet) 52、 62、編集コマンドを受けて DOMに対して編集を行う編集部 (Zone) 54、 64を備える。制御部 52又は 62が外部力も DOMツリーの編集コマンドを受け付けると、編集部 54又は 64が DO Mツリーを変更し、表示部 56又は 66が表示を更新する。これらは、 MVC (Model-Vi ew-Controller)と呼ばれるフレームワークに類似する構成をとつており、概ね、表示部 56及び 66が「View」に、制御部 52及び 62が「Controller」に、編集部 54及び 64と D OMの実体が「Model」に、それぞれ対応する。本前提技術の文書処理装置 20では、 XML文書をツリー表示形式で編集するだけでなく、それぞれのボキヤブラリに応じた編集を可能とする。例えば、 HTMLユニット 50は、 HTML文書をワードプロセッサに類似した方式で編集するためのユーザインターフェースを提供し、 SVGユニット 60は、 SVG文書を画像描画ツールに類似した方式で編集するためのユーザインターフエースを提供する。

[0031] VCユニット 80は、マッピング部 82、定義ファイル取得部 84、及び定義ファイル生成部 86を含み、あるボキヤブラリにより記述された文書を、他のボキヤブラリにマツピングすることにより、マッピング先のボキヤブラリに対応した表示編集用プラグインで文書を表示又は編集するためのフレームワークを提供する。本前提技術では、この機能を、ボキヤブラリコネクション（Vocabulary Connection: VC)と呼ぶ。定義ファイル取得部 84は、マッピングの定義を記述したスクリプトファイルを取得する。この定義ファィルは、ノードごとに、ノード間の対応 (コネクション)を記述する。このとき、各ノードの要素値や属性値の編集の可否を指定してもよい。また、ノードの要素値や属性値を用いた演算式を記述してもよい。これらの機能については、後で詳述する。マツピング部 82は、定義ファイル取得部 84が取得したスクリプトファイルを参照して、 DOM生成部 34にデスティネーションツリーを生成させ、ソースツリーとデスティネーションッリ一の対応関係を管理する。定義ファイル生成部 86は、ユーザが定義ファイルを生成するためのグラフィカルユーザインターフェースを提供する。

[0032] VCユニット 80は、ソースツリーとデスティネーションツリーの間のコネクションを監視し、表示を担当するプラグインにより提供されるユーザインタフェースを介してユーザ力も編集指示を受け付けると、まずソースツリーの該当するノードを変更する。 DOM ユニット 30が、ソースツリーが変更された旨のミューテーシヨンイベントを発行すると、 VCユニット 80は、そのミューテーシヨンイベントを受けて、ソースツリーの変更にデスティネーシヨンツリーを同期させるベぐ変更されたノードに対応するデスティネーションツリーのノードを変更する。デスティネーションツリーを表示/編集するプラグイン、例えば HTMLユニット 50は、デスティネーションツリーが変更された旨のミューテーシヨンイベントを受けて、変更されたデスティネーションツリーを参照して表示を更新する。このような構成により、少数のユーザにより利用されるローカルなボキヤブラリにより記述された文書であっても、他のメジャーなボキヤブラリに変換することで、文書を表示することができるとともに、編集環境が提供される。

[0033] 文書処理装置 20により文書を表示又は編集する動作について説明する。文書処理装置 20が処理対象となる文書を読み込むと、 DOM生成部 34が、その XML文書力も DOMツリーを生成する。また、主制御ユニット 22又は編集ユニット 24は、名前空間を参照して文書を記述しているボキヤブラリを判別する。そのボキヤブラリに対応したプラグインが文書処理装置 20にインストールされて、る場合は、そのプラグインをロードして、文書を表示/編集させる。プラグインカ Sインストールされていない場合は、マッピングの定義ファイルが存在するか否かを確認する。定義ファイルが存在する場合、定義ファイル取得部 84が定義ファイルを取得し、その定義に従って、デスティネーシヨンツリーが生成され、マッピング先のボキヤブラリに対応するプラグインにより文書が表示 Z編集される。複数のボキヤブラリを含む複合文書である場合は、後述するように、それぞれのボキヤブラリに対応したプラグインにより、文書の該当箇所がそれぞれ表示 Z編集される。定義ファイルが存在しない場合は、文書のソース又はッリー構造を表示し、その表示画面にぉ、て編集が行われる。

[0034] 図 2は、処理対象となる XML文書の例を示す。この XML文書は、生徒の成績データを管理するために用いられる。 XML文書のトップノードである構成要素「成績」は、配下に、生徒ごとに設けられた構成要素「生徒」を複数有する。構成要素「生徒」は、属性値「名前」と、子要素「国語」、「数学」、「理科」、「社会」を有する。属性値「名前」は、生徒の名前を格納する。構成要素「国語」、「数学」、「理科」、「社会」は、それぞれ、国語、数学、理科、社会の成績を格納する。例えば、名前カ^ A」である生徒の国語の成績は「90」、数学の成績は「50」、理科の成績は「75」、社会の成績は「60」である。以下、この文書で使用されているボキヤブラリ（タグセット）を、「成績管理ボキヤブラリ」と呼ぶ。

[0035] 本前提技術の文書処理装置 20は、成績管理ボキヤブラリの表示 Z編集に対応したプラグインを有しないので、この文書をソース表示、ツリー表示以外の方法で表示するためには、前述した VC機能が用いられる。すなわち、成績管理ボキヤブラリを、プラグインが用意された別のボキヤブラリ、例えば、 HTMLや SVGなどにマッピングするための定義ファイルを用意する必要がある。ユーザ自身が定義ファイルを作成するためのユーザインターフェースについては後述することにして、ここでは、既に定義ファイルが用意されているとして説明を進める。

[0036] 図 3は、図 2に示した XML文書を HTMLで記述された表にマッピングする例を示す。図 3の例では、成績管理ボキヤブラリの「生徒」ノードを、 HTMLにおける表（「TA BLE」ノード)の行（「TR」ノード）に対応づけ、各行の第 1列には属性値「名前」を、第 2 列には「国語」ノードの要素値を、第 3列には「数学」ノードの要素値を、第 4列には「理科」ノードの要素値を、第 5列には「社会」ノードの要素値を、それぞれ対応付ける。これにより、図 2に示した XML文書を、 HTMLの表形式で表示することができる。また、これらの属性値及び要素値は、編集可能であることが指定されており、ユーザが HTMLによる表示画面上で、 HTMLユニット 50の編集機能により、これらの値を編集することができる。第 6列には、国語、数学、理科、社会の成績の加重平均を算出する演算式が指定されており、生徒の成績の平均点が表示される。このように、定義ファイルに演算式を指定可能とすることにより、より柔軟な表示が可能となり、編集時のユーザの利便性を向上させることができる。なお、第 6列は、編集不可であることが指定されており、平均点のみを個別に編集することができないようにしている。このように、マッピング定義において、編集の可否を指定可能とすることにより、ユーザの誤操作を防ぐことができる。

[0037] 図 4 (a)及び図 4 (b)は、図 2に示した XML文書を図 3に示した表にマッピングするための定義ファイルの例を示す。この定義ファイルは、定義ファイル用に定義されたスクリプト言語により記述される。定義ファイルには、コマンドの定義と、表示のテンプレートが記述されている。図 4 (a) (b)の例では、コマンドとして、「生徒の追加」と「生徒の削除」が定義されており、それぞれ、ソースツリーにノード「生徒」を挿入する操作と、ソースツリーからノード「生徒」を削除する操作が対応付けられている。また、テンプレートとして、表の第 1行に「名前」、「国語」などの見出しが表示され、第 2行以降に、ノード「生徒」の内容が表示されることが記述されている。ノード「生徒」の内容を表示するテンプレート中、「text-of」と記述された項は「編集可能」であることを意味し、「value-of」と記述された項は「編集不可能」であることを意味する。また、ノード「生徒」の内容を表示する行のうち、第 6列には、「(src:国語 + src:数学 + src:理科 + src: 社会） div 4」という計算式が記述されており、生徒の成績の平均が表示されることを意味する。

[0038] 図 5は、図 2に示した成績管理ボキヤブラリで記述された XML文書を、図 3に示した対応により HTMLにマッピングして表示した画面の例を示す。表 90の各行には、左から、各生徒の名前、国語の成績、数学の成績、理科の成績、社会の成績、及び平均点が表示されている。ユーザは、この画面上で、 XML文書を編集することができる。たとえば、第 2行第 3列の値を「70」に変更すると、このノードに対応するソースッリ一の要素値、すなわち、生徒「B」の数学の成績が「70」に変更される。このとき、 VC ユニット 80は、デスティネーションツリーをソースツリーに追従させるベぐデスティネーシヨンツリーの該当箇所を変更し、 HTMLユニット 50力変更されたデスティネーシヨンツリーに基づいて表示を更新する。したがって、画面上の表においても、生徒「 B」の数学の成績が「70」に変更され、更に、平均点が「55」に変更される。

[0039] 図 5に示した画面には、図 4 (a) (b)に示した定義ファイルに定義されたように、「生徒の追加」及び「生徒の削除」のコマンドカ -ユーに表示される。ユーザがこれらのコマンドを選択すると、ソースツリーにおいて、ノード「生徒」が追加又は削除される。このように、本前提技術の文書処理装置 20では、階層構造の末端の構成要素の要素値を編集するのみではなぐ階層構造を編集することも可能である。このようなッリ一構造の編集機能は、コマンドの形でユーザに提供されてもよい。また、例えば、表の行を追加又は削除するコマンドが、ノード「生徒」を追加又は削除する操作に対応づけられてもよい。また、他のボキヤブラリを埋め込むコマンドがユーザに提供されてもよい。この表を入力用テンプレートとして、穴埋め形式で新たな生徒の成績データを追加することもできる。以上のように、 VC機能により、 HTMLユニット 50の表示 Z 編集機能を利用しつつ、成績管理ボキヤブラリで記述された文書を編集することが可能となる。 [0040] 図 6は、ユーザが定義ファイルを生成するために、定義ファイル生成部 86がユーザに提示するグラフィカルユーザインタフェースの例を示す。画面左側の領域 91には、マッピング元の XML文書がツリー表示されている。画面右側の領域 92には、マツピング先の XML文書の画面レイアウトが示されている。この画面レイアウトは、 HTML ユニット 50により編集可能となっており、ユーザは、画面右側の領域 92において、文書を表示するための画面レイアウトを作成する。そして、例えば、マウスなどのポインティングデバイスにより、画面左側の領域 91に表示されたマッピング元の XML文書のノードを、画面右側の領域 92に表示された HTMLによる画面レイアウト中へドラッグ&ドロップ操作を行うことにより、マッピング元のノードと、マッピング先のノードとのコネクションが指定される。例えば、要素「生徒」の子要素である「数学」を、 HTML画面の表 90の第 1行第 3列にドロップすると、「数学」ノードと、 3列目の「TD」ノードの間にコネクションが張られる。各ノードには、編集の可否が指定できるようになつている。また、表示画面中には、演算式を埋め込むこともできる。画面の編集が終わると、定義ファイル生成部 86は、画面レイアウトとノード間のコネクションを記述した定義フアイルを生成する。

[0041] XHTML, MathML、 SVGなどの主要なボキヤブラリに対応したビューヮゃエディタは既に開発されて、るが、図 2に示した文書のようなオリジナルなボキヤブラリで記述された文書に対応したビューヮゃエディタを開発するのは現実的でな、。しかし、上記のように、他のボキヤブラリにマッピングするための定義ファイルを作成すれば、ビューヮゃエディタを開発しなくても、 VC機能を利用して、オリジナルなボキヤブラリで記述された文書を表示 ·編集することができる。

[0042] 図 7は、定義ファイル生成部 86により生成された画面レイアウトの他の例を示す。図 7の例では、成績管理ボキヤブラリで記述された XML文書を表示するための画面に、表 90と、円グラフ 93が作成されている。この円グラフ 93は、 SVGにより記述される。後述するように、本前提技術の文書処理装置 20は、一つの XML文書内に複数のボキヤブラリを含む複合文書を処理することができるので、この例のように、 HTMLで記述された表 90と、 SVGで記述された円グラフ 93とを、一つの画面上に表示することができる。 [0043] 図 8は、文書処理装置 20による XML文書の編集画面の一例を示す。図 8の例では、一つの画面が複数に分割されており、それぞれの領域において、処理対象となる XML文書を異なる複数の表示形式により表示している。領域 94には、文書のソースが表示されており、領域 95には、文書のツリー構造が表示されており、領域 96には、図 5に示した HTMLにより記述された表が表示されている。これらのいずれの画面上においても、文書の編集が可能であり、いずれかの画面上でユーザが編集を行うと、ソースツリーが変更され、それぞれの画面の表示を担当するプラグインカ、ソースツリーの変更を反映すべく画面を更新する。具体的には、ソースツリーの変更を通知するミューテーシヨンイベントのリスナーとして、それぞれの編集画面の表示を担当するプラグインの表示部を登録しておき、いずれかのプラグイン又は VCユニット 80によりソースツリーが変更されたときに、編集画面を表示中の全ての表示部が、発行されたミューテーシヨンイベントを受け取って画面を更新する。このとき、プラグインが V C機能により表示を行っている場合は、 VCユニット 80がソースツリーの変更に追従してデスティネーションツリーを変更した後、変更されたデスティネーションツリーを参照してプラグインの表示部が画面を更新する。

[0044] 例えば、ソース表示及びツリー表示を、専用のプラグインにより実現している場合は、ソース表示用プラグインとツリー表示用プラグインは、デスティネーションツリーを用いず、直接ソースツリーを参照して表示を行う。この場合、いずれかの画面において編集が行われると、ソース表示用プラグインとツリー表示用プラグインは、変更されたソースツリーを参照して画面を更新し、領域 96の画面を担当して!/、る HTMLユニット 50は、ソースツリーの変更に追従して変更されたデスティネーションツリーを参照して画面を更新する。

[0045] ソース表示及びツリー表示は、 VC機能を利用して実現することもできる。すなわち、ソース、ツリー構造を HTMLによりレイアウトし、その HTMLに XML文書をマツピングして、 HTMLユニット 50により表示してもよい。この場合、ソース形式、ツリー形式、表形式の 3つのデスティネーションツリーが生成されることになる。いずれかの画面において編集が行われると、 VCユニット 80は、ソースツリーを変更した後、ソース形式、ツリー形式、表形式の 3つのデスティネーションツリーをそれぞれ変更し、 HTMLュニット 50は、それらのデスティネーションツリーを参照して、 3つの画面を更新する。

[0046] このように、一つの画面上に複数の表示形式で文書を表示することにより、ユーザの利便性を向上させることができる。例えば、ユーザは、ソース表示又はツリー表示により文書の階層構造を把握しつつ、表 90などを用いて視覚的に分力りやすい形式で文書を表示し、編集することができる。上記の例では、一つの画面を分割して複数の表示形式による画面を同時に表示した力一つの画面に一つの表示形式による画面を表示し、表示形式をユーザの指示により切り替え可能としてもよい。この場合、主制御ユニット 22が、ユーザから表示形式の切り替え要求を受け付け、各プラグインに指示して表示を切り替える。

[0047] 図 9は、文書処理装置 20により編集される XML文書の他の例を示す。図 9に示した XML文書では、 SVG文書の「foreignObject」タグの中に XHTML文書が埋め込まれており、さら〖こ、 XHTML文書の中に MathMLで記述された数式が入っている。このような場合、編集ユニット 24が、名前空間を参照して、適切な表示系に描画作業を振り分ける。図 9の例では、編集ユニット 24は、まず、 SVGユニット 60に四角形を描画させ、つづいて、 HTMLユニット 50に XHTML文書を描画させる。さらに、図示しない MathMLユニットに、数式を描画させる。こうして、複数のボキヤブラリを包含する複合文書が適切に表示される。表示結果を図 10に示す。

[0048] 文書編集中、カーソル (キャリッジ）の位置に応じて、表示されるメニューを切り替えてもよい。すなわち、カーソルが、 SVG文書が表示された領域内に存在するときは、 SVGユニット 60が提供するメニュー、又は SVG文書をマッピングするための定義フアイルに定義されたコマンドを表示し、カーソルが、 XHTML文書が表示された領域内に存在するときは、 HTMLユニット 50が提供するメニュー、又は XHTML文書をマッピングするための定義ファイルに定義されたコマンドを表示する。これにより、編集位置に応じて適切なユーザインターフェースを提供することができる。

[0049] 複合文書にお!、て、あるボキヤブラリに対応する適切なプラグイン又はマッピング定義ファイルがな力つた場合は、そのボキヤブラリにより記述された部分は、ソース表示又はツリー表示されてもよい。従来、ある文書に他の文書を埋め込んだ複合文書を開くとき、埋め込まれた文書を表示するアプリケーション力 Sインストールされて、な、と、その内容を表示することができな力つた力本前提技術では、表示用のアプリケーシヨンが存在しなくても、テキストデータにより構成された XML文書をソース表示又はツリー表示することにより内容を把握することができる。これは、テキストベースである XMLなどの文書ならではの特徴と、える。

[0050] データがテキストベースで記述されることの他の利点として、例えば、複合文書中の、あるボキヤブラリにより記述される部分において、同一文書内の他のボキヤブラリで記述された部分のデータを参照してもよい。また、文書内で検索を実行する時に、 S VGなどの図に埋め込まれた文字列も検索対象とすることができる。

[0051] あるボキヤブラリにより記述された文書内に、他のボキヤブラリのタグを用いてもよい。この XML文書は、妥当（valid)ではないが、整形式 (welH rmed)であれば、有効な XML文書として処理可能である。この場合、挿入された他のボキヤブラリのタグは、定義ファイルによりマッピングされてもよい。例えば、 XHTML文書中に、「重要」、「最重要」などのタグを使用し、これらのタグで囲まれた部分を強調表示してもよ、し、重要度の順にソートして表示してもよ、。

[0052] 図 10に示した編集画面において、ユーザにより文書が編集されると、編集された部分を担当するプラグイン又は VCユニット 80がソースツリーを変更する。ソースツリーには、ノードごとにミューテーシヨンイベントのリスナーを登録できるようになっており、通常は、各ノードが属するボキヤブラリに対応したプラグインの表示部又は VCュ-ット 80がリスナーとして登録される。 DOM提供部 32は、ソースツリーが変更されると、変更されたノードから上位の階層へたどって、登録されたリスナーがあれば、そのリスナ一へミューテーシヨンイベントを発行する。例えば、図 9に示した文書において、く html >ノードの下位のノードが変更された場合、く html >ノードにリスナーとして登録された HTMLユニット 50にミューテーシヨンイベントが通知されるとともに、その上位のく svg>ノードにリスナーとして登録された SVGユニット 60にもミューテーシヨンイベントが通知される。このとき、 HTMLユニット 50は、変更されたソースツリーを参照して表示を更新する。 SVGユニット 60は、自身のボキヤブラリに属するノードが変更されて!/、な!/、ので、ミューテーシヨンイベントを無視してもよ！/、。

[0053] 編集の内容によっては、 HTMLユニット 50による表示の更新に伴って、全体のレイアウトが変わる可能性がある。この場合は、画面のレイアウトを管理する構成、例えば最上位のノードの表示を担当するプラグインにより、プラグインごとの表示領域のレイアウトが更新される。例えば、 HTMLユニット 50による表示領域が以前より大きくなつた場合、 HTMLユニット 50は、まず自身の担当する部分を描画して、表示領域の大きさを決定する。そして、画面のレイアウトを管理する構成に、変更後の表示領域の大きさを通知し、レイアウトの更新を依頼する。画面のレイアウトを管理する構成は、通知を受けて、プラグインごとの表示領域を再レイアウトする。こうして、編集された部分の表示が適切に更新されるとともに、画面全体のレイアウトが更新される。

[0054] つづいて、前提技術の文書処理装置 20を実現する機能構成について更に詳細に説明する。以下の説明では、クラス名などを記載する際には、英字をそのまま用いて記載することにする。

[0055] A.概要

インターネットの出現により、ユーザによって処理され管理される文書の数力ほぼ指数関数的に増加してきた。インターネットの核を形成するウェブ (World Wide Web) は、そのような文書データの大きな受け皿となっている。ウェブは、文書にカ卩えて、このような文書の情報検索システムを提供する。これらの文書は、通常、マークアップ言語により記述される。マークアップ言語のシンプルかつポピュラーな例の一つに H TML (HyperText Markup Language)がある。このような文書は、ウェブの他の位置に格納されている他の文書へのリンクをさらに含む。 XML (eXtens¾le Markup Languag e)は、さらに高度でポピュラーなマークアップ言語である。ウェブ文書にアクセスし、閲覧するためのシンプルなブラウザ力 Java (登録商標）のようなオブジェクト指向のプログラミング言語で開発されて、る。

[0056] マークアップ言語により記述された文書は、通常、ブラウザや他のアプリケーションの中では、ツリーデータ構造の形で表現される。この構造は、文書を構文解析した結果のツリーに相当する。 DOM (Document Object Model)は、文書を表現し、操作するために使用される、よく知られたツリーベースのデータ構造モデルである。 DOMは、 HTMLや XML文書などを含む文書を表現するための標準的なオブジェクトのセットを提供する。 DOMは、文書内のコンポーネントを表現するオブジェクトがどのようにつながっているかという標準モデルと、それらのオブジェクトにアクセスしたり操作したりするための標準インタフェイスという、 2つの基本的なコンポーネントを含む。

[0057] アプリケーション開発者は、独自のデータ構造や API (Application Program Interfac e)へのインタフェイスとして DOMをサポートすることができる。他方、文書を作成するアプリケーション開発者は、彼らの APIの独自インタフェイスではなぐ DOMの標準インタフェイスを使用することができる。したがって、標準を提供するというその能力により、 DOMは、様々な環境、特にウェブにおいて、文書の相互利用を促進させるために有効である。 DOMのいくつかのバージョンが定義されており、異なるプログラミング環境及びアプリケーションによって使用されている。

[0058] DOMツリーは、対応する DOMの内容に基づいた文書の階層的表現である。 DO Mツリーは「根 (ルート）」、及びルートから発生する 1つ以上の「節（ノード）」を含む。ルートが文書全体を表す場合もある。中間のノードは、例えば、テーブル及びそのテ一ブル中の行及び列のような要素を表すことができる。 DOMツリーの「葉」は、通常、それ以上分解できな!、テキストや画像のようなデータを表す。 DOMツリーの各ノードは、フォント、サイズ、色、インデントなど、ノードによって表される要素のパラメータを記述する属性に関連付けられてもよい。

[0059] HTMLは、文書を作成するために一般に用いられる言語である力フォーマット及びレイアウト用の言語であり、データ記述のための言語ではない。 HTMLドキュメントを表現する DOMツリーのノードは、 HTMLのフォーマッティングタグとして予め定義されたエレメントであって、通常、 HTMLは、データの詳述や、データのタギング Zラベリングのための機能を提供しな!、ので、 HTMLドキュメント中のデータに対するクエリを定式ィ匕することは多くの場合困難である。

[0060] ネットワーク設計者たちの目指すものは、ウェブ上の文書がソフトウェアアプリケーシヨンによってクエリされたり処理されたりできるようにすることである。表示方法とは無関係で、階層的に構造ィ匕された言語であれば、そのようにクエリされ処理されることができる。 XML (extensible Markup Language)のようなマークアップ言語は、これらの特徴を提供することができる。

[0061] HTMLとは逆に、 XMLのよく知られた利点は、文書の設計者が自由に定義可能な「タグ」を使用して、データ要素にラベルを付けることが可能である点である。このようなデータ要素は、階層的に構造ィ匕することができる。さらに、 XML文書は、文書内で用いられるタグ及びそれらの相互関係の「文法」を記述した文書型定義を含むことができる。構造ィ匕された XML文書の表示方法を定義するために、 CSS (Cascading S tyle Sheet)又は XSL (XML Style Language)が使用される。 DOM、 HTML, XML、 CSS、 XSL及び関連する言語の特徴に関する付加的な情報は、ウェブからも得ることができる。（例えば、 http://www.w3.org/TR/)

[0062] Xpathは、 XML文書の部分の位置を指定するために共通のシンタックス及びセマンテイクスを提供する。機能性の例として、 XML文書に対応する DOMツリーのトラバース (移動）がある。それは、 XML文書の様々な表現に関連した文字列、数、及びブーリアン文字の操作のための基本的な機能を提供する。 Xpathは、 XML文書の見た目のシンタックス、例えば、テキストとしてみたときに何行目であるとか何文字目であるとかと!/、つた文法ではなぐ DOMツリーなどの抽象的 ·論理的な構造にぉ、て動作する。 Xpathを使用することにより、例えば XML文書の DOMツリー内の階層的構造を通じて場所を指定することができる。アドレシングのための使用の他に、 Xpath は、 DOMツリー中のノードがパターンにマッチするか否かをテストするために使用されるようにも設計されている。 XPathに関する更なる詳細は、 http：〃 www. w3.org/TR /xpathで得ることができる。

[0063] XMLの既知の利点及び特徴により、マークアップ言語 (例えば XML)で記述された文書を扱うことができ、文書を作成及び修正するためのユーザフレンドリーなインタフェイスを提供することができる、効果的な文書処理システムが求められる。

[0064] ここで説明されるシステムの構成のうちのいくつかは、 MVC (Modd-View-Controll er)と呼ばれる、よく知られた GUI (Graphical User Interface)パラダイムを用いて説明される。 MVCパラダイムは、アプリケーション又はアプリケーションのインタフェイスの一部を、 3つの部分、すなわち、モデル、ビュー、コントローラに分割する。 MVCは、元は、 GUIの世界に、従来の入力、処理、出力の役割を割り当てるために開発された。

[入力]→ [処理]→ [出力] [コントローラ]→ [モデル]→ [ビュー]

[0065] MVCパラダイムによれば、外界のモデリング、ユーザへの視覚的なフィードバック、及びユーザの入力は、モデル（M)、ビュー（V)、及びコントローラ（C)オブジェクトにより分離されて扱われる。コントローラは、ユーザからのマウスとキーボード入力のような入力を解釈し、これらのユーザアクションを、適切な変更をもたらすためにモデル及び Z又はビューに送られるコマンドにマップするように作用する。モデルは、 1以上のデータ要素を管理するように作用し、その状態に関するクエリに応答し、状態を変更する指示に応答する。ビューは、ディスプレイの長方形の領域を管理するように作用し、グラフィクスとテキストの組合せによりユーザにデータを提示する機能を有する

[0066] B.文書処理システムの全体構成

文書処理システムの実施例は、図 11— 29に関連して明らかにされる。

[0067] 図 11 (a)は、後述するタイプの文書処理システムの基礎として機能する要素の従来の構成例を示す。構成 10は、通信経路 13によりメモリ 12に接続された CPU又はマイク口プロセッサ 11などの形式のプロセッサを含む。メモリ 12は、現在又は将来に利用可能な任意の ROM及び Z又は RAMの形式であってもよい。通信経路 13は、典型的にはバスとして設けられる。マウス、キーボード、音声認識システムなどのユーザ入力装置 14及び表示装置 15 (又は他のユーザインタフェイス）に対する入出力インタフェイス 16も、プロセッサ 11とメモリ 12の通信のためのバスに接続される。この構成は、スタンドアロンであってもよいし、複数の端末及び 1以上のサーバが接続されてネットワーク化された形式であってもよ、し、既知の、かなる方式により構成されてもよい。本発明は、これらのコンポーネントの配置、集中又は分散されたアーキテクチャ一、あるいは様々なコンポーネントの通信方法により制限されない。

[0068] さらに、本システム及びここで議論される実施例は、様々な機能性を提供する、くつかのコンポーネント及びサブコンポーネントを含むものとして議論される。これらのコンポーネント及びサブコンポーネントは、注目された機能性を提供するために、ハ一ドウエアとソフトウェアの組合せだけでなぐハードウェアのみ、ソフトウェアのみによつても実現されうる。さらに、ハードウェア、ソフトウェア、及びそれらの組合せは、汎用の計算装置、専用のハードウェア、又はそれらの組合せにより実現されうる。したがつて、コンポーネント又はサブコンポーネントの構成は、コンポーネント又はサブコンポ一ネントの機能性を提供するための特定のソフトウェアを実行する汎用 Z専用の計算装置を含む。

[0069] 図 11 (b)は、文書処理システムの一例の全体のブロック図を示す。このような文書処理システムにおいて文書が生成され編集される。これらの文書は、例えば XMLなど、マークアップ言語の特徴を有する任意の言語により記述されてもよい。また、便宜上、特定のコンポーネント及びサブコンポーネントの用語及び表題を創造した。しかしながら、これらは、この開示の一般的な教示の範囲を制限するために解釈されるべきではない。

[0070] 文書処理システムは、 2つの基本的な構成を有するものととらえることができる。第 1 の構成は、文書処理システムが動作する環境である「実行環境」 101である。例えば、実行環境は、文書の処理中及び管理中に、ユーザだけでなくシステムも支援する、基本的なユーティリティ及び機能を提供する。第 2の構成は、実行環境において走るアプリケーション力も構成される「アプリケーション」 102である。これらのアプリケーシヨンは、文書自身及び文書の様々な表現を含む。

[0071] 1.実行環境

実行環境 101のキーとなるコンポーネントは Programlnvoker (プログラムインボー力：プログラム起動部） 103である。 Programlnvokerl03は、文書処理システムを起動するためにアクセスされる基本的なプログラムである。例えば、ユーザが文書処理システムにログオンして開始するとき、 Programlnvokerl03が実行される。 Programlnvoker 103は、例えば、文書処理システムにプラグインとしてカ卩えられた機能を読み出して実行させたり、アプリケーションを開始して実行させたり、文書に関連するプロパティを読み出すことができる。 Programlnvokerl03の機能はこれらに限定されない。ユーザが実行環境内で実行されるように意図されたアプリケーションを起動した、とき、 Pr ogramlnvokerl03は、そのアプリケーションを見つけ、それを起動して、アプリケーシヨンを実行する。

[0072] Programlnvoker 103には、プラグインサブシステム 104、コマンドサブシステム 105 、及び Resource (リソース）モジュール 109などのいくつかのコンポーネントがアタッチされている。これらの構成については、以下に詳述する。

[0073] a)プラグインサブシステム

プラグインサブシステム 104は、文書処理システムに機能を追加するための高度に柔軟で効率的な構成として使用される。プラグインサブシステム 104は、また、文書処理システムに存在する機能を修正又は削除するために使用することができる。さらに、種々様々の機能をプラグインサブシステムを使用して追加又は修正することができる。例えば、画面上への文書の描画を支援するように作用する Editlet (エディットレツト:編集部)機能を追加することもできる。 Editletプラグインは、システムに追加されるボキヤブラリの編集も支援する。

[0074] プラグインサブシステム 104は、 ServiceBroker (サービスブローカ：サービス仲介部） 1041を含む。 ServiceBrokerl041は、文書処理システムに加えられるプラグインを管理することにより、文書処理システムに加えられるサービスを仲介する。

[0075] 所望の機能性を実現する個々の機能は、 Service (サービス） 1042の形でシステムに追加される。利用可能な Servicel042のタイプは、 Application (アプリケーション）サ一ビス、 ZoneFactory (ゾーンファクトリ：ゾーン生成部） Service, Editlet (エディットレツト：編集部） Service、 CommandFactory (コマンドファクトリ：コマンド生成部） Serviceゝ C onnectXPath (コネクト XPath:XPath管理部） Service、 CSSComputation (CSSコンビユーテーシヨン： CSS計算部） Serviceなどを含む力これらに限定されない。これらの Service,及びシステムの他の構成とそれらとの関係は、文書処理システムについてのよりよい理解のために、以下に詳述される。

[0076] プラグインと Serviceの関係は以下の通りである。プラグインは、 1以上の ServiceProvi der (サービスプロバイダ：サービス提供部）を含むことができるユニットである。それぞれの ServiceProviderは、それに関連した Serviceの 1以上のクラスを有する。例えば、適切なソフトウェアアプリケーションを有する単一のプラグインを使用することにより、 1 以上の Serviceをシステムに追加することができ、これにより、対応する機能をシステムに追加することができる。

[0077] b)コマンドサブシステムコマンドサブシステム 105は、文書の処理に関連したコマンドの形式の命令を実行するために使用される。ユーザは、一連の命令を実行することにより、文書に対する操作を実行することができる。例えば、ユーザは、コマンドの形で命令を発行することにより、文書処理システム中の XML文書に対応する XMLの DOMツリーを編集し、 XML文書を処理する。これらのコマンドは、キーストローク、マウスクリック、又は他の有効なユーザインタフェイスアクションを使用して入力されてもよい。 1つのコマンドにより 1以上の命令が実行されることもある。この場合、これらの命令が 1つのコマンドにラップ (包含）され、連続して実行される。例えば、ユーザが、誤った単語を正しい単語に置換したいとする。この場合、第 1の命令は、文書中の誤った単語を発見することであり、第 2の命令は、誤った単語を削除することであり、第 3の命令は、正しい単語を挿入することであってもよい。これらの 3つの命令が 1つのコマンドにラップされてもよい。

[0078] コマンドは、関連した機能、例えば、後で詳述する「アンドゥ」機能を有してもょ、。これらの機能は、オブジェクトを生成するために使用されるいくつかの基本クラスにも割り当てられてもよい。

[0079] コマンドサブシステム 105のキーとなるコンポーネントは、選択的にコマンドを与え、実行するように作用する Commandlnvoker (コマンドインボー力：コマンド起動部） 105 1である。図 11 (b)には、 1つの Commandlnvokerのみが示されているが、 1以上の Co mmandlnvokerが使用されてもよぐ 1以上のコマンドが同時に実行されてもよい。 Com mandlnvokerl051は、コマンドを実行するために必要な機能及びクラスを保持する。動作において、実行されるべき Command (コマンド：命令） 1052は、 Queue (キュー） 1 053に積まれる。 Commandlnvokerは、連続的に実行するコマンドスレッドを生成する。 Commandlnvoker内で既に実行中の Commandがなければ、 Commandlnvoker 1051 により実行されるように意図された Commandl052が実行される。 Commandlnvokerが既にコマンドを実行している場合、新しい Commandは、 Queuel053の最後に積まれる。しかしながら、それぞれの Commandlnvokerl051では、一度に 1つの Commandのみが実行される。指定された Commandの実行に失敗した場合、 CommandlnvokerlO 51は例外処理を実行する。 [0080] Commandlnvoker 1051により実行される Commandの型は、 UndoableCommand (取消可能コマンド） 1054、 AsynchronousCommand (非同期コマンド） 1055、及び VCCo mmand (VCコマンド） 1056を含む力これらに限定されない。 UndoableCommand 10 54は、ユーザが望めば、その Commandの結果を取り消すことが可能な Commandである。 UndoableCommandの例として、切り取り、コピー、テキストの挿入、などがある。動作において、ユーザが文書の一部を選択し、その部分に切り取りコマンドを適用するとき、 UndoableCommandを用いることにより、切り取られた部分は、必要であれば、「切り取られてヽな、」ようにすることができる。

[0081] VCCommandl056は、ボキヤブラリコネクション記述子（Vocabulary Connection De scriptor: VCD)スクリプトファイルに格納される。これらは、プログラマにより定義されうるユーザ指定の Commandである。 Commandは、例えば、 XMLフラグメントを追加したり、 XMLフラグメントを削除したり、属性を設定したりするための、より抽象的な Comm andの組合せであってもよい。これらの Commandは、特に、文書の編集に焦点を合わせている。

[0082] AsynchronousCommand 1055 ¾ ,文書のロードや保存など、システムよりの Comman dであり、 UndoableCommandや VCCommandとは別に、非同期的に実行される。 Async hronousCommandは、 UndoableCommandではないので、取り消すことはできない。

[0083] c)リソース

Resourcel09は、様々なクラスに、いくつかの機能を提供するオブジェクトである。例えば、ストリングリソース、アイコン、及びデフォルトキーバインドは、システムで使用される Resourceの例である。

[0084] 2.アプリケーションコンポーネント

文書処理システムの第 2の主要な特徴であるアプリケーションコンポーネント 102は、実行環境 101において実行される。アプリケーションコンポーネント 102は、実際の文書と、システム内における文書の様々な論理的、物理的な表現を含む。さらに、ァプリケーシヨンコンポーネント 102は、文書を管理するために使用されるシステムの構成を含む。アプリケーションコンポーネント 102は、さらに、 UserApplication (ユーザァプリケーシヨン） 106、アプリケーションコア 108、ユーザインタフェイス 107、及び Core Component (コアコンポーネント） 110を含む。

[0085] a)ユーザアプリケーション

UserApplicationl06は、 Programlnvokerl03と共にシステム上にロードされる。 User Applicationl06は、文書と、文書の様々な表現と、文書と対話するために必要なユーザインタフェイスとをつなぐ接着剤となる。例えば、ユーザが、プロジェクトの一部である文書のセットを生成したいとする。これらの文書がロードされると、文書の適切な表現が生成される。ユーザインタフェイス機能は、 UserApplicationl06の一部として追カロされる。言いかえれば、 UserApplicationl06は、ユーザがプロジェクトの一部を形成する文書と対話することを可能とする文書の表現と、文書の様々な態様とを、共に保持する。ー且 UserApplicationl06が生成されると、ユーザがプロジェクトの一部を形成する文書との対話を望むたびに、ユーザは簡単に実行環境上に UserApplicatio nl06をロードすることができる。

[0086] b)コアコンポーネント

CoreComponentl 10は、複数の Pane (ペイン）の間で文書を共有する方法を提供する。後で詳述するように、 Paneは、 DOMツリーを表示し、画面の物理的なレイアウトを扱う。例えば、物理的な画面は、個々の情報の断片を描写する画面内の複数の Pane 力もなる。ユーザから画面上に見える文書は、 1又はそれ以上の Paneに出現しうる。また、 2つの異なる文書が画面上で 2つの異なる Paneに現れてもよ!、。

[0087] 図 11 (c)に示されるように、画面の物理的なレイアウトもツリーの形式になっている。

Paneは、 RootPane (ルートペイン） 1084にもなり得るし、 SubPane (サブペイン） 1085 にもなり得る。 RootPanel084は、 Paneのツリーの根に当たる Paneであり、 SubPane 10 85は、 RootPanel084以外の任意の Paneである。

[0088] CoreComponentl 10は、さらに、フォントを提供し、ツールキットなど、文書のための複数の機能的な操作のソースの役割を果たす。 CoreComponentl 10により実行されるタスクの一例に、複数の Pane間におけるマウスカーソルの移動がある。実行されるタスクの他の例として、ある Pane中の文書の一部をマークし、それを異なる文書を含む別の Pane上にコピーする。

[0089] c)アプリケーションコア上述したように、アプリケーションコンポーネント 102は、システムにより処理され管理される文書から構成される。これは、システム内における文書の様々な論理的及び物理的な表現を含む。アプリケーションコア 108は、アプリケーションコンポーネント 1 02の構成である。その機能は、実際の文書を、それに含まれる全てのデータとともに保持することである。アプリケーションコア 108は、 DocumentManager (ドキュメントマネ一ジャ：文書管理部） 1081及び Document (ドキュメント：文書） 1082自身を含む。

[0090] DocumentManagerl081の様々な態様を以下に詳述する。 DocumentManager 108 1は、 Documentl082を管理する。 DocumentManagerl081は、 RootPanel084、 Sub Pane 1085, ClipBoard (クリップボード）ユーティリティ 1087、及び Snapshot (スナップショット）ユーティリティ 1088にも接続される。 ClipBoardユーティリティ 1087は、ユーザがクリップボードに加えることを決定した文書の部分を保持する方法を提供する。例えば、ユーザが、文書の一部を切り取り、後で再考するために新規文書にそれを保存することを望んだとする。このような場合、切り取られた部分力 SClipBoardに追加される。

[0091] つづいて、 Snapshotユーティリティ 1088についても説明する。 Snapshotユーティリティ 1088は、アプリケーションがある状態力も別の状態まで移行するときに、アプリケーシヨンの現在の状態を記憶することを可能とする。

[0092] d)ユーザインタフェイス

アプリケーションコンポーネント 102の別の構成は、ユーザがシステムと物理的に対話する手段を提供するユーザインタフェイス 107である。例えば、ユーザインタフェイスは、ユーザが文書をアップロードしたり、削除したり、編集したり、管理したりするために使用される。ユーザインタフェイスは、 Frame (フレーム） 1071、 MenuBar (メ -ュ一バー） 1072、 StatusBar (ステータスバー） 1073、及び URLBar(URLバー） 1074 を含む。

[0093] Framel071は、一般に知られているように、物理的な画面のアクティブな領域であるとみなされる。 MenuBarl072は、ユーザに選択を提供するメニューを含む画面領域である。 StatusBarl073は、アプリケーションの実行状態を表示する画面領域である。 URLBarl074は、インターネットをナビゲートするために URLアドレスを入力する領域を提供する。

[0094] C.文書管理及び関連するデータ構造

図 12は、 DocumentManagerl081の詳細を示す。これは、文書処理システム内で文書を表現するために用いられるデータ構造及び構成を含む。分かりやすくするために、このサブセクションで説明される構成は、 MVCパラダイムを用いて説明される

[0095] DocumentManagerl081は、文書処理システム内にある全ての文書を保持しホストする DocumentContainer (ドキュメントコンテナ：文書コンテナ） 203を含む。 Document Managerl081にアタッチされたツールキット 201は、 DocumentManagerl081により使用される様々なツールを提供する。例えば、 DomService (DOMサービス）は、文書に対応する DOMを生成し、保持し、管理するために必要とされる全ての機能を提供するために、ツールキット 201により提供されるツールである。ツールキット 201により提供される別のツールである IOManager (入出力管理部）は、システムへの入力及びシステムからの出力を管理する。同様に、 StreamHandler (ストリームハンドラ）は、ビットストリームによる文書のアップロードを扱うツールである。これらのツールは、図中に特に示さず、参照番号を割り当てないが、ツールキット 201のコンポーネントを形成する。

[0096] MVCパラダイムの表現によれば、モデル（M)は、文書の DOMツリーモデル 202 を含む。前述したように、全ての文書は、文書処理システムにおいて DOMツリーとして表現される。文書は、また、 DocumentContainer203の一部を形成する。

[0097] 1. DOMモデノレ及びゾーン

文書を表現する DOMツリーは、 Node (ノード） 2021を有するツリーである。 DOMッリーの部分集合である Zone (ゾーン） 209は、 DOMツリー内の 1以上の Nodeの関連領域を含む。例えば、画面上で文書の一部のみを表示し得るが、この可視化された文書の一部は Zone209を用いて表示される。 Zoneは、 ZoneFactory (ゾーンファクトリ：ゾーン生成部） 205と呼ばれるプラグインを用いて、生成され、取り扱われ、処理される。 Zoneは DOMの一部を表現する力 1以上の「名前空間」を使用してもよい。よく知られているように、名前空間は、名前空間内でユニークな名前の集合である。換言すれば、名前空間内に同じ名前は存在しない。

[0098] 2. Facet及び Facetと Zoneとの関係

Facet (ファセット） 2022は、 MVCパラダイムのモデル（M)部分内の別の構成である。 Facetは、 Zoneにおいて Nodeを編集するために使用される。 Facet2022は、 Zone 自身の内容に影響を与えずに実行することができる手続 (プロシージャ）を使用して、 DOMへのアクセスを編成する。次に説明するように、これらの手続は、 Nodeに関連した重要で有用な操作を実行する。

[0099] 各 Nodeは、対応する Facetを有する。 DOMの中の Nodeを直接操作する代わりに、操作を実行するために Facetを使用することによって、 DOMの保全性は保護される。操作が Node上で直接実行される場合、いくつかのプラグインが DOMを同時に変更することができ、その結果矛盾を引き起こす。

[0100] W3Cが策定した DOMの標準規格は、 Nodeを操作するための標準的なインタフエイスを定義する力実際には、ボキヤブラリごと又は Nodeごとに特有の操作があるので、これらの操作を APIとして用意しておくのが好都合である。文書処理システムでは、このような各 Nodeに特有の APIを Facetとして用意し、各 Nodeにアタッチする。これにより、 DOMの標準規格に準拠しつつ、有用な APIを付加することができる。また、ボキヤブラリごとに特有の DOMを実装するのではなぐ標準的な DOMの実装に、後から特有の APIを付加するようにすることで、多様なボキヤブラリを統一的に処理することができるともに、複数のボキヤブラリが任意の組合せで混在した文書を適切に処理することができる。

[0101] ボキヤブラリは、名前空間に属するタグ (例えば XMLのタグ）のセットである。上述したように、名前空間は、ユニークな名前 (ここではタグ)のセットを有する。ボキヤブラリは、 XML文書を表現する DOMツリーのサブツリーとして現れる。このサブツリーは Z oneを含む。特定の例においては、タグセットの境界は Zoneによって定義される。 Zon e209は、 ZoneFactory205と呼ばれる Serviceを利用して生成される。上述したように、 Zone209は、文書を表現する DOMツリーの一部の内部表現である。このような文書の一部へのアクセスを提供するために、論理的な表現が要求される。この論理的表現は、文書が画面上で論理的にどのように表現されるかについてコンピュータに通知する。 Canvas (キャンバス） 210は、 Zoneに対応する論理的なレイアウトを提供するように作用する Serviceである。

[0102] 他方、 Pane211は、 Canvas210により提供される論理的なレイアウトに対応する物理的な画面レイアウトである。実際、ユーザは表示画面上で文字や画像によって文書のレンダリングのみを見る。したがって、文書は、画面上に文字や画像を描画するプロセスにより、画面上に描写されなければならない。文書は、 Pane211により提供される物理的なレイアウトに基づいて、 Canvas210により画面上に描写される。

[0103] Zone209に対応する Canvas210は、 Editlet206を使用して生成される。文書の DO Mは、 Editlet206及び Canvas210を使用して編集される。元の文書の完全性を維持するために、 Editlet206及び Canvas210は、 Zone209における 1以上の Nodeに対応する Facetを使用する。これらの Serviceは、 Zone及び DOM内の Nodeを直接操作しない。 Facetは、 Command207を利用して操作される。

[0104] ユーザは、一般に、画面上のカーソルを移動させたり、コマンドをタイプしたりすることによって、画面と対話する。画面上の論理的なレイアウトを提供する Canvas210は、このカーソル操作を受け付ける。 Canvas210は、対応するアクションを Facetに実行させることができる。この関係により、カーソルサブシステム 204は、 DocumentManagerl 081に対して、 MVCパラダイムのコントローラ（C)として機能する。 Canvas210は、ィベントを扱うタスクも有する。例えば、 Canvas210は、マウスクリック、フォーカス移動、及びユーザにより起こされた同様のアクションなどのイベントを扱う。

[0105] 3. Zone, Facet, Canvas及び Paneの間の関係の概要

文書処理システム内の文書は、少なくとも 4つの観点から見ることができる。すなわち、 1)文書処理システムにおいて文書の内容及び構造を保持するために用いられるデータ構造、 2)文書の保全性に影響を与えずに文書の内容を編集する手段、 3)文書の画面上の論理的なレイアウト、 4)文書の画面上の物理的なレイアウト、である。 Z one, Facet, Canvas及び Paneは、前述の 4つの観点に相当する、文書処理システムのコンポーネントをそれぞれ表す。

[0106] 4.アンドゥサブシステム

上述したように、文書に対するいかなる変更 (例えば編集)も取消可能であることが望ましい。例えば、ユーザが編集操作を実行し、次に、その変更の取消を決定したとする。図 12に関連して、アンドゥサブシステム 212は、文書管理部の取消可能なコンポーネントを実現する。 UndoManager (アンドゥマネージャ：アンドゥ管理部） 2121は、ユーザによって取り消される可能性のある全ての文書に対する操作を保持する。

[0107] 例えば、ユーザが、文書中の単語を別の単語に置換するコマンドを実行したとする。その後、ユーザは考え直し、元の単語に戻すことを決定したとする。アンドゥサブシステム 212は、このような操作を支援する。 UndoManager2121は、このような Undoabl eEdit (アンドゥアプルエディット：取消可能な編集） 2122の操作を保持する。

[0108] 5.カーソノレサブシステム

前述したように、 MVCのコントローラ部分は、カーソルサブシステム 204を備えてもよい。カーソルサブシステム 204は、ユーザ力も入力を受け付ける。これらの入力は、一般にコマンド及び Z又は編集操作の性格を有している。したがって、カーソルサブシステム 204は、 DocumentManagerl081に関連した MVCパラダイムのコントローラ（ C)部分であると考えることができる。

[0109] 6.ビュー

前述したように、 Canvas210は、画面上に提示されるべき文書の論理的なレイアウトを表す。 XHTML文書の例では、 Canvas210は、文書が画面上でいかに見えるかを論理的に表現したボックスツリー 208を含んでもよい。このボックスツリー 208は、 Doc umentManager 1081に関連した MVCパラダイムのビュー（V)部分に含まれよう。

[0110] D.ボキヤブラリコネクション

文書処理システムの重要な特徴は、 XML文書を、他の表現にマップして取り扱うことが可能で、かつ、マップした先の表現を編集すると、その編集が元の XML文書に整合性を保ちつつ反映される環境を提供することにある。

[0111] マークアップ言語により記述された文書、例えば XML文書は、文書型定義により定義されたボキヤブラリに基づいて作成されている。ボキヤブラリは、タグのセットである。ボキヤブラリは、任意に定義されてもよいため、無限に多くのボキヤブラリが存在しうる。し力しながら、多数の可能なボキヤブラリのそれぞれに対して専用の処理 Z管理環境を提供するのは現実的ではない。ボキヤブラリコネクションは、この問題を解決する方法を提供する。

[0112] 例えば、文書は 2以上のマークアップ言語により記述されてもよい。文書は、例えば、 XHTML (.extensible HyperText Markup Language)、 ¾ V"G (Scalable Vector Grap hies)、 MathML (Mathematical Markup Language)、その他のマークアップ言語により記述されてもよい。換言すれば、マークアップ言語は、 XMLにおけるボキヤブラリゃタグセットと同様に見なされてもよい。

[0113] ボキヤブラリは、ボキヤブラリプラグインを用いて処理される。文書処理システムにおいてプラグインが利用不可能であるボキヤブラリにより記述された文書は、プラグインが利用可能である別のボキヤブラリの文書にマッピングすることにより表示される。この特徴により、プラグインが用意されていないボキヤブラリの文書も適切に表示することがでさる。

[0114] ボキヤブラリコネクションは、定義ファイルを取得し、取得した定義ファイルに基づいて 2つの異なるボキヤブラリの間でマッピングする能力を含む。あるボキヤブラリで記述された文書は、別のボキヤブラリにマッピングすることができる。このように、ボキヤブラリコネクションは、文書がマッピングされるボキヤブラリに対応した表示 Z編集ブラグィンにより文書を表示し編集することを可能にする。

[0115] 上述したように、各文書は、一般に複数のノードを有する DOMツリーとして文書処理システムにおいて記述される。「定義ファイル」は、それぞれのノードについて、そのノードと他のノードとの対応を記述する。各ノードの要素値及び属性値が編集可能か否かが指定される。ノードの要素値又は属性値を用いた演算式が記述されてもよい。

[0116] マッピングという特徴を利用して、定義ファイルを適用したデスティネーション DOM ツリーが生成される。このように、ソース DOMツリーとデスティネーション DOMツリーの関係が構築され保持される。ボキヤブラリコネクションは、ソース DOMツリーとデスティネーシヨン DOMツリーの対応を監視する。ユーザ力も編集指示を受けると、ボキャブラリコネクションは、ソース DOMツリーの関連したノードを変更する。ソース DOM ツリーが変更されたことを示す「ミューテーシヨンイベント」が発行され、デスティネーシヨン DOMツリーがそれに応じて変更される。 [0117] ボキヤブラリコネクションの使用により、少数のユーザのみに知られていた比較的マイナ一なボキヤブラリを、別のメジャーなボキヤブラリに変換することができる。したがつて、少数のユーザによって利用されるマイナーなボキヤブラリであっても、文書を適切に表示し、望ましい編集環境を提供することができる。

[0118] このように、文書処理システムの一部であるボキヤブラリコネクションサブシステムは、文書の複数の表現を可能にする機能を提供する。

[0119] 図 13は、ボキヤブラリコネクション（VC : Vocabulary Connection)サブシステム 300 を示す。 VCサブシステム 300は、同一の文書の 2つの代替表現の整合性を維持する方法を提供する。例えば、 2つの表現は、同一文書の、 2つの異なるボキヤブラリによる表現であってもよい。前述したように、一方はソース DOMツリーであってもよぐ他方はデスティネーション DOMツリーであってもよい。

[0120] 1.ボキヤブラリコネクションサブシステム

ボキヤブラリコネクションサブシステム 300の機能は、 VocabularyConnection301と呼ばれるプラグインを使用して、文書処理システムにおいて実現される。文書が表現される Vocabulary305ごとに、対応するプラグインが要求される。例えば、文書の一部が HTMLで記述され、残りが SVGで記述されている場合、 HTMLと SVGに対応するボキヤブラリブラグィンが要求される。

[0121] VocabularyConnectionプラグイン 301は、適切な Vocabulary305の文書に対応した、 Zone209又は Pane211のための適切な VCCanvas (ボキヤブラリコネクションキャンバス） 310を生成する。 VocabularyConnection301を用いて、ソース DOMツリー内の Zone209に対する変更は、変換ルールにより、別の DOMツリー 306の対応する Zone に伝達される。変換ルールは、ボキヤブラリコネクション記述子（Vocabulary Connecti on Descriptor: VCD)の形式で記述される。このようなソース DOMとデスティネーション DOMの間の変換に対応するそれぞれの VCDファイルにつ!/、て、対応する VCMa nager (ボキヤブラリコネクションマネージャ） 302が生成される。

[0122] 2. Connector

Connector304は、ソース DOMツリーのソースノードと、デスティネーション DOMッリーのデスティネーションノードとを接続する。 Connector304は、ソース DOMツリー中のソースノード、及びソースノードに対応するソース文書に対する修正 (変更）を見るために作用する。そして、対応するデスティネーション DOMツリーのノードを修正する。 Connector304は、デスティネーション DOMツリーを修正することができる唯一のオブジェクトである。例えば、ユーザは、ソース文書、及び対応するソース DOMッリ一に対してのみ修正を行うことができる。その後、 Connector304がデスティネーション DOMツリーに、対応する修正を行う。

[0123] Connector304は、ツリー構造を形成するために、論理的にリンクされる。 Connector 304により形成されたツリーは、 ConnectorTree (コネクタツリー）と呼ばれる。 Connect or304は、 ConnectorFactory (コネクタファクトリ：コネクタ生成部） 303と呼ばれる Servi ceを用いて生成される。 ConnectorFactory303は、ソース文書から Connector304を生成し、それらをリンクして ConnectorTreeを形成する。 VocabularyConnectionManage r302は、 ConnectorFactory303を保持する。

[0124] 前述したように、ボキヤブラリは名前空間におけるタグのセットである。図示されるように、 Vocabulary305は、 VocabularyConnection301によって文書に対して生成される。これは、文書ファイルを解析し、ソース DOMとデスティネーション DOMの間の写像のための適切な VocabularyConnectionManager302を生成することにより行われる。さらに、 Connectorを生成する ConnectorFactory303と、 Zone209を生成する ZoneF actory205と、 Zone内のノードに対応する Canvasを生成する Editlet206との間の適切な関係が作られる。ユーザがシステム力も文書を処分又は削除するとき、対応する Vo cabularyConnectionManager302が肖 lj除される。

[0125] Vocabulary305は、 VCCanvas310を生成する。さらに、 Connector304及びデステイネーシヨン DOMツリー 306が対応して生成される。

[0126] ソース DOM及び Canvasは、それぞれ、モデル（M)及びビュー（V)に対応する。し力しながら、このような表現は、ターゲットのボキヤブラリが画面上に描写可能である場合に限って意味がある。描写は、ボキヤブラリブラグィンにより行われる。ボキャプラリプラグインは、主要なボキヤブラリ、例えば、 XHTML, SVG, MathMLについて提供される。ボキヤブラリブラグィンは、ターゲットのボキヤブラリに関連して使用される。これらは、ボキヤブラリコネクション記述子を用いてボキヤブラリ間でマッピングする方法を提供する。

[0127] このようなマッピングは、ターゲットのボキヤブラリが、マッピング可能で、画面上に描写される方法が予め定義されたものである場合にのみ意味がある。このようなレンダリング方法は、例えば XHTMLなどのように、 W3Cなどの組織により定義された標準規格となっている。

[0128] ボキヤブラリコネクションが必要であるとき、 VCCanvasが使用される。この場合、ソースのビューを直接生成することができないので、ソースの Canvasは生成されない。この場合、 VCCanvas力 ConnectorTreeを使用して生成される。この VCCanvasは、ィベントの変換のみを扱い、画面上の文書の描写を援助しない。

[0129] 3. DestinationZone、 Pane、及びし anvas

上述したように、ボキヤブラリコネクションサブシステムの目的は、同一の文書の 2つの表現を同時に生成し保持することである。第 2の表現も、 DOMツリーの形式であり、これはデスティネーション DOMツリーとして既に説明した。第 2の表現における文書を見るために、 DestinationZone, Canvas及び Paneが必要である。

[0130] VCCanvasが作成されると、対応する DestinationPane307が生成される。さらに、関連する DestinationCanvas308と、対応する BoxTree309が生成される。同様に、 VCC anvas310も、ソース文書に対する Pane211及び Zone209に関連づけられる。

[0131] DestinationCanvas308は、第 2の表現における文書の論理的なレイアウトを提供する。特に、 DestinationCanvas308は、デスティネーション表現における文書を描写するために、カーソルや選択のようなユーザインタフェイス機能を提供する。 Destination Canvas308に生じたイベントは、 Connectorに供給される。 DestinationCanvas308は、マウスイベント、キーボードイベント、ドラッグアンドドロップイベント、及び文書のデスティネーシヨン（第 2)表現のボキヤブラリに特有なイベントを、 Connector304に通知する。

[0132] 4.ボキヤブラリコネクションコマンドサブシステム

ボキヤブラリコネクション (VC)サブシステム 300の要素として、ボキヤブラリコネクシヨン (VC)コマンドサブシステム 313がある。ボキヤブラリコネクションコマンドサブシステム 313は、ボキヤブラリコネクションサブシステム 300に関連した命令の実行のために使用される VCCommand (ボキヤブラリコネクションコマンド） 315を生成する。 VCCo mmandは、内蔵の CommandTemplate (コマンドテンプレート） 318を使用して、及び Z 又は、スクリプトサブシステム 314においてスクリプト言語を使用してスクラッチカもコマンドを生成することにより、生成することができる。

[0133] コマンドテンプレートには、例えば、「If」コマンドテンプレート、「When」コマンドテンプレート、「挿入（Insert)」コマンドテンプレートなどがある。これらのテンプレートは、 V CCommandを作成するために使用される。

[0134] 5. XPathサブシステム

？&1^サブシステム316は、文書処理システムの重要な構成であり、ボキヤブラリコネクシヨンの実現を支援する。 Connector304は、一般に xpath情報を含む。上述したように、ボキヤブラリコネクションのタスクの 1つは、ソース DOMツリーの変化をデステイネーシヨン DOMツリーに反映させることである。 xpath情報は、変更 Z修正を監視されるべきソース DOMツリーのサブセットを決定するために用いられる 1以上の xpath 表現を含む。

[0135] 6.ソース DOMツリー、デスティネーション DOMツリー、及び ConnectorTreeの概要ソース DOMツリーは、別のボキヤブラリに変換される前のボキヤブラリで文書を表現した DOMツリー又は Zoneである。ソース DOMツリーのノードは、ソースノードと呼ばれる。

[0136] それに対して、デスティネーション DOMツリーは、ボキヤブラリコネクションに関連して前述したように、同一の文書を、マッピングにより変換された後の異なるボキヤブラリで表現した DOMツリー又は Zoneである。デスティネーション DOMツリーのノードは、デスティネーションノードと呼ばれる。

[0137] ConnectorTreeは、ソースノードとデスティネーションノードの対応を表す Connector に基づく階層的表現である。 Connectorは、ソースノードと、ソース文書になされた修正を監視し、デスティネーション DOMツリーを修正する。 Connectorは、デスティネーシヨン DOMツリーを修正することを許された唯一のオブジェクトである。

[0138] E.文書処理システムにおけるイベントフロー

実用のためには、プログラムはユーザ力のコマンドに応答しなければならない。ィベントは、プログラム上で実行されたユーザアクションを記述し実行する方法である。多くの高級言語、例え «Java (登録商標）は、ユーザアクションを記述するイベントに頼っている。従来、プログラムは、ユーザアクションを理解し、それを自身で実行するために、積極的に情報を集める必要があった。これは、例えば、プログラムが自身を初期化した後、ユーザが画面、キーボード、マウスなどでアクションを起こしたときに適切な処理を講じるために、ユーザのアクションを繰り返し確認するループに入ることを意味する。し力しながら、このプロセスは扱いにくい。さらに、それは、ユーザが何かをするのを待つ間、 CPUサイクルを消費してループするプログラムを必要とする。

[0139] 多くの言語が、異なるパラダイムを採用することにより、これらの問題を解決している。そのうちの一つは、現代の全てのウィンドウシステムの基礎となっている、イベントドリブンプログラミングである。このパラダイムでは、全てのユーザアクションは、「ィベント」と呼ばれる抽象的な事象の集合に属する。イベントは、十分詳細に、特定のユーザアクションを記述する。プログラムがユーザにより生成されたイベントを積極的に収集するのではなぐ監視すべきイベントが生じたときに、システムがプログラムに通知する。この方法によりユーザとの対話を扱うプログラムは「イベントドリブン」であると言われる。

[0140] これは、多くの場合、全てのユーザにより生成されたイベントの基本特性を獲得する「Event (イベント）」クラスを使用して扱われる。

[0141] 文書処理システムは、自身のイベント、及びこれらのイベントを扱う方法を定義して使用する。いくつかの型のイベントが使用される。例えば、マウスイベントは、ユーザのマウスアクションから起こるイベントである。マウスを含むユーザアクションは、 Canva s210によって、マウスイベントに渡される。このように、 Canvasは、システムのユーザによる相互作用の最前部にあると言える。必要であれば、最前部にある Canvasは、そのイベントに関連した内容を子へ渡す。

[0142] それに対して、キーストロークイベントは、 Canvas 210から流れる。キーストロークイベントは、即時的なフォーカスを有する。すなわち、それは、いかなる瞬間でも作業に関連する。 Canvas210上に入力されたキーストロークイベントは、その親に渡される。キー入力は、文字列挿入を扱うことが可能な、異なるイベントによって処理される。文字列の挿入を扱うイベントは、キーボードを使用して文字が挿入されたときに発生する。他の「イベント」は、例えば、ドラッグイベント、ドロップイベント、マウスイベントと同様に扱われる他のイベントを含む。

[0143] 1.ボキヤブラリコネクション外のイベントの取り扱い

イベントは、イベントスレッドを用いて渡される。 Canvas210は、イベントを受け取ると、その状態を変更する。必要であれば、 Commandl052力 Canvas210により Comman dQueuel053にポストされる。

[0144] 2.ボキヤブラリコネクション内のイベントの取り扱い

VocabularyConnectionプラグイン 301を用いて、 DestinationCanvasの一例である X HTMLCanvasl l06は、発生したイベント、例えば、マウスイベント、キーボードィベント、ドラッグアンドドロップイベント、及びボキヤブラリに特有のイベントなどを受け取る。これらのイベントは、コネクタ 304に通知される。より詳細には、図 21 (b)に図示されるように、 VocabularyConnectionプラグイン 301内のイベントフローは、 SourcePanel lO 3、 Vし Canvas丄 104、 DestinationPanel lOo、 DestinationCanvasの一 f列で fcoDestin ationCanvasl 106、デスティネーション DOMツリー及び ConnectorTreeを通過する。

[0145] F. Programlnvoker及び Programlnvokerと他の構成との関係

Programlnvokerl03及びそれと他の構成との関係は、図 14 (a)に更に詳細に示される。 Programlnvokerl03は、文書処理システムを開始するために実行される実行環境中の基本的なプログラムである。図 11 (b)及び図 11 (c)に図示されるように、 User Application 106、 ¾erviceBrokerl04l、 Commandlnvokerl051、及び Resourcel09 は、全て Programlnvokerl03に接続される。前述したように、アプリケーション 102は、実行環境中で実行されるコンポーネントである。同様に、 ServiceBrokerl041は、システムに様々な機能をカ卩えるプラグインを管理する。他方、 Commandlnvokerl051は、ユーザにより提供される命令を実行して、コマンドを実行するために使用されるクラス及びファンクションを保持する。

[0146] 1.プラグイン及びサービス

ServiceBrokerl041について、図 14 (b)を参照して更に詳細に説明する。前述したように、 ServiceBrokerl041は、システムに様々な機能を追加するプラグイン (及び関連するサービス）を管理する。 Servicel042は、文書処理システムに特徴を追加又は変更可能な最も下の層である。「Service」は、 ServiceCategory401と ServiceProvider 402の 2つの部分からなる。図 14 (c)に図示されるように、 1つの ServiceCategory401 は、複数の関連する ServiceProvider402を持ちうる。それぞれの ServiceProviderは、特定の ServiceCategoryの一部または全部を実行するように作用する。 ServiceCatego ry401は、他方では、 Serviceの型を定義する。

[0147] Serviceは、 1)文書処理システムに特定の特色を提供する「特色サービス」、 2)文書処理システムにより実行されるアプリケーションである「アプリケーションサービス」、 ₃) 文書処理システムの全体にわたって必要な特色を提供する「環境サービス」、の 3つの型に分類することができる。

[0148] Serviceの例は、図 14 (d)に示される。アプリケーション Serviceの Categoryにおいては、システムユーティリティが対応する ServiceProviderの例である。同様に、 Editlet20 6は Categoryであり、 HTMLEditlet及び SVGEditletは対応する ServiceProviderである。 ZoneFactory205は、 Serviceの別の Categoryであり、対応する ServiceProvider (図示せず)を有する。

[0149] プラグインは、文書処理システムに機能性をカ卩えると既に説明した力いくつかの Se rviceProvider402及びそれらに関連するクラスからなるユニットと見なされてもよい。各プラグインは、宣言ファイルに記述された依存性及び ServiceCategory401を有する。

[0150] 2. Programlnvokerとアプリケーションとの関係

図 14 (e)は、 Programlnvokerl03と UserApplicationl06との関係についての更なる詳細を示す。必要な文書やデータなどは、ストレージからロードされる。必要なプラグインは、全て ServiceBrokerl041上にロードされる。 ServiceBrokerl041は、全てのプラグインを保持し管理する。プラグインは、システムに物理的に追加することができ、又、その機能はストレージカもロードすることができる。プラグインの内容がロードされると、 ServiceBrokerl041は、対応するプラグインを定義する。つづいて、対応する Us erApplicationl06が生成され、実行環境 101にロードされ、 Programlnvokerl03にァタツチされる。 [0151] G.アプリケーションサービスと環境との関係

図 15 (a)は、 Programlnvokerl03上にロードしたアプリケーションサービスの構成についての更なる詳細を示す。コマンドサブシステム 105のコンポーネントである Comm andlnvokerl051は、 Programlnvokerl03内の Commandl052を起動又は実行する。 Commandl052は、文書処理システムにおいて、 XMLなどの文書を処理し、対応する XMLDOMツリーを編集するために用いられる命令である。 Commandlnvokerl05 1は、 Commandl052を実行するために必要なクラス及びファンクションを保持する。

[0152] ServiceBrokerl041も、 Programlnvokerl03内で実行される。 UserApplicationl06 は、ユーザインタフェイス 107及び CoreComponentl lOに接続される。 CoreCompone ntl lOは、全ての Paneの間で文書を共有する方法を提供する。 CoreComponentl lO は、さらにフォントを提供し、 Paneのためのツールキットの役割を果たす。

[0153] 図 15 (b)は、 Framel071、 MenuBarl072、及び StatusBarl073の関係を示す。

[0154] H.アプリケーションコア

図 16 (a)は、全ての文書、及び文書の一部及び文書に属するデータを保持するァプリケーシヨンコア 108についての更なる説明を提供する。 CoreComponentl lOは、文書 1082を管理する DocumentManagerl081にアタッチされる。 DocumentManager 1081は、文書処理システムに関連づけられたメモリに格納される全ての文書 1082 の所有者である。

[0155] 画面上の文書の表示を容易にするために、 DocumentManagerl081は RootPanel 084にも接続される。 ClipBoardl087、 SnapShotl088、 Drag&Drop601、及び Overla y602の機能も、 CoreComponentl 10にアタッチされる。

[0156] SnapShotl088は、アプリケーションの状態を元に戻すために使用される。ユーザが SnapShotl088を起動したとき、アプリケーションの現状が検知され、格納される。その後、アプリケーションの状態が別の状態に変わるとき、格納された状態の内容は保存される。 SnapShotl088は、図 16 (b)に図示される。動作において、アプリケーションがある URL力他へ移動するときに、前に戻る動作及び先に進む動作をシームレスに実行可能とするために、 SnapShotl088は以前の状態を記憶する。

[0157] I. DocumentManager内における文書の構成図 17 (a)は、 DocumentManagerl081の更なる説明と、 DocumentManagerにおいて文書が構成され保持される様子を示す。図 11 (b)に示したように、 DocumentManager 1081は、文書 1082を管理する。図 17 (a)に示される例において、複数の文書のうちの 1つは RootDocument (ルート文書） 701であり、残りの文書は SubDocument (サブ文書） 702である。 DocumentManager 1081は、 RootDocument701に接続され、 Root Document701は、全ての SubDocument702に接続される。

[0158] 図 12及び図 17 (a)に示すように、 DocumentManager 1081は、全ての文書 1082を管理するオブジェクトである DocumentContainer203に結合される。 DOMService703 及び IOManager704を含むツールキット 201 (例えば XMLツールキット）の一部を开成するツールも、 DocumentManager 1081に供給される。再び図 17 (a)を参照して、 DOMService703は、 DocumentManagerl081により管理される文書に基づいた DO Mツリーを生成する。各 Document705は、それが RootDocument701であっても SubD ocument702であっても、対応する DocumentContainer203によって管理される。

[0159] 図 17 (b)は、文書 A— Eが階層的に配置される様子を示す。文書 Aは RootDocume ntである。文書 B— Dは、文書 Aの SubDocumentである。文書 Eは、文書 Dの SubDocu mentである。図 17 (b)の左側は、これと同じ文書の階層が画面上に表示された例を示す。 RootDocumentである文書 Aは、基本フレームとして表示される。文書 Aの SubD ocumentである文書 B— Dは、基本フレーム Aの中のサブフレームとして表示される。文書 Dの SubDocumentである文書 Eは、サブフレーム Dのサブフレームとして画面に表示される。

[0160] 再び図 17 (a)を参照して、 UndoManager (アンドゥマネージャ：アンドゥ管理部） 706 及び UndoWrapper (アンドゥラッパ一） 707は、それぞれの DocumentContainer203に対して生成される。 UndoManager706及び UndoWrapper707は、取消可能なコマンドを実行するために使用される。この特徴を使用することにより、編集操作を使用して文書に対して実行された変更を取り消すことができる。 SubDocumentの変更は、 Root Documentとも密接な関係を有する。アンドゥ操作は、階層内の他の文書に影響する変更を考慮に入れて、例えば、図 17 (b)に示されるような連鎖状の階層における全ての文書の間で整合性が維持されることを保証する。 [0161] UndoWrapper707は、 DocumentContainer203内の SubDocumentに関連するアンドゥオブジェクトをラップし、それらを RootDocumentに関連するアンドゥオブジェクトに結合させる。 UndoWrapper707は、 UndoableEditAcceptor (アンドゥァブルエデイットァクセプタ：アンドゥ可能編集受付部） 709に利用可能なアンドゥオブジェクトの収集を実行する。

[0162] UndoManager706及び UndoWrapper707は、 UndoableEditAcceptor709及び Undo ableEditSource (アンドゥァブルエディットソース） 708〖こ接続される。当業者には理解されるように、 Document705が UndoableEditSource708であってもよぐ取消可能な編集オブジェクトのソースであってもよ、。

[0163] J.アンドゥコマンド及びアンドゥフレームワーク

図 18 (a)及び図 18 (b)は、アンドゥフレームワーク及びアンドゥコマンドについて更なる詳細を提供する。図 18 (a)に示されるように、 UndoCommand801、 RedoComman d802、及び UndoableEditCommand803は、図 11 (b)に示したように Commandlnvoke r 1051に積むことができるコマンドであり、順に実行される。 UndoableEditCommand8 03は、 UndoableEditSource708及び UndoableEditAcceptor709に更にアタッチされる。「foo」 Editし ommand804及び「bar」 Editし ommand805i 、 UndoableEditCommand の例である。

[0164] 1. UndoableEditCommandの実行

図 18 (b)は、 UndoableEditCommandの実行を示す。まず、ユーザが編集コマンドを使用して Document705を編集すると仮定する。第 1ステップ S 1では、 UndoableEditA cceptor709力 Document705の DOMツリーである UndoableEditSource708にァタツチされる。第 2ステップ S2では、ユーザにより発行されたコマンドに基づいて、 Docum ent705が DOMの APIを用いて編集される。第 3ステップ S3では、ミューテーシヨンィベントのリスナー力変更がなされたことを通知される。すなわち、このステップでは、 DOMツリーの全ての変更を監視するリスナーが編集操作を検知する。第 4ステップ S 4では、 UndoableEditが UndoManager706のオブジェクトとして格納される。第 5ステツプ S5では、 UndoableEditAcceptor709が UndoableEditSource708からデタツチされる。 UndoableEditSource708は、 Document705自身であってもよい。 [0165] K.システムへの文書のロードに関する手順

上記のサブセクションでは、システムの様々なコンポーネント及びサブコンポーネントについて説明した。以下、これらのコンポーネントの使用に関する方法論について説明する。図 19 (a)は、文書処理システムに文書がロードされる様子の概要を示す。それぞれのステップは、図 24— 28において、特定の例に関連して詳述される。

[0166] 簡単には、文書処理システムは、文書に含まれるデータ力なるバイナリデータストリームから DOMを生成する。 ApexNode (エイペックスノード：頂点ノード）が、注目対象であり Zoneに属する文書の一部のために生成される。つづいて、対応する Paneが同定される。同定された Paneは、 ApexNode及び物理的な画面表面から Zone及び Ca nvasを生成する。 Zoneは、次に、それぞれのノードに Facetを生成し、それらに必要とされる情報を提供する。 Canvasは、 DOMツリーから、ノードをレンダリングするためのデータ構造を生成する。

[0167] より詳細には、文書はストレージ 901からロードされる。文書の DOMツリー 902が生成される。文書を保持するための、対応する DocumentContainer903が生成される。 DocumentContainer903は、 DocumentManager904にアタッチされる。 DOMツリーは、ルートノードと、ときには複数のセカンダリノードを含む。

[0168] 一般に、このような文書は、テキスト及びグラフィクスの双方を含む。したがって、 D OMツリーは、例えば、 XHTMLサブツリーだけでなく SVGサブツリーを有してもよい。 XHTMLサブツリーは、 XHTMLの ApexNode905を有する。同様に、 SVGサブッリーは、 SVGの ApexNode906を有する。

[0169] ステップ 1では、 ApexNode906力画面の論理的なレイアウトである Pane907にァタツチされる。ステップ 2では、 Pane907は、 PaneOwner (ペインオーナー：ペインの所有者） 908である CoreComponentに、 ApexNode906のための ZoneFactoryを要求する。ステップ 3では、 PaneOwner908は、 ZoneFactoryと、 ApexNode906のための CanvasF actoryである Editletとを返す。

[0170] ステップ 4では、 Pane907力 ¾one909を生成する。 Zone909は Pane907にアタッチされる。ステップ 5では、 Zone909がそれぞれのノードに対して Facetを生成し、対応するノードにアタッチする。ステップ 6では、 Pane907力 Canvas910を生成する。 Canv as910は Pane907にアタッチされる。 Canvas910には様々な Commandが含まれる。ステツプ 7では、 Canvas910が文書を画面にレンダリングするためのデータ構造を構築する。 XHTMLの場合、これはボックスツリー構造を含む。

[0171] 1. Zoneの MVC

図 19 (b)は、 MVCパラダイムを用いて Zoneの構成の概要を示す。この場合、 Zone 及び Facetは文書に関連した入力であるから、モデル（M)は Zone及び Facetを含む。 Canvasと、文書を画面にレンダリングするためのデータ構造体は、ユーザが画面上に見る出力であるから、ビュー（V)は Canvas及びデータ構造体に対応する。 Command は、文書とその様々な関係に対して制御操作を実行するので、コントロールお)は Ca nvasに含まれる Commandを含む。

[0172] L.文書の表現

図 20を用いて、文書及びその様々な表現の例について以下に説明する。この例で使用される文書は、テキストと画像の双方を含む。テキストは、 XHTMLを用いて表され、画像は、 SVGを用いて表される。図 20は、文書のコンポーネント及び対応するォブジエタトの関係の MVC表現を詳細に示す。この例において、 DocumentlOOlは、 Document 1001を保持する DocumentContainer 1002にアタッチされる。文書は DO Mツリー 1003により表現される。 DOMツリーは、 ApexNodel004を含む。

[0173] ApexNodeは、黒丸で表される。頂点でないノードは、白丸で表される。ノードを編集するために用いられる Facetは、三角形で表され、対応するノードにアタッチされる。文書がテキストと画像を有するので、この文書の DOMツリーは、 XHTML部分と SV G部分を含む。 ApexNodel004は、 XHTMLサブツリーの最上のノードである。これは、文書の XHTML部分の物理的な表現のための最上 Paneである XHTMLPanelO 05にアタッチされる。 ApexNodel004は、文書の DOMツリーの一部である XHTMLZ onel006にもアタッチされる。

[0174] Nodel004に対応する Facetも、 XHTMLZonel006にアタッチされる。 XHTMLZone 1006は、 XHTMLPanel005にアタッチされる。 XHTMLEditletは、文書の論理的な表現である XHTMLCanvasl007を生成する。 XHTMLCanvasl007は、 XHTMLPane 1005にアタッチされる。 XHTMLCanvasl007は、 Document 1001の XHTMLコンポ一ネントのための BoxTreel009を生成する。文書の XHTML部分を保持し描画するために必要な様々な Commandl008も、 XHTMLCanvasl007に追加される。

[0175] 同様に、文書の SVGサブツリーの ApexNodelOlOは、文書の SVGコンポーネントを表現する Document 1001の DOMツリーの一部である SVGZone 1011にアタッチされる。 ApexNodelOlOは、文書の SVG部分の物理的な表現の最上の Paneである SV GPanelO 13にアタッチされる。文書の SVG部分の論理的な表現を表す SVGCanvas 1012は、 SVGEditletにより生成され、 SVGPanel013にアタッチされる。画面上に文書の SVG部分をレンダリングするためのデータ構造及びコマンドは、 SVGCanvasにアタッチされる。例えば、このデータ構造は、図示されるように、円、線、長方形などを含んでもよい。

[0176] 図 20に関連して説明された文書例の表現の一部について、図 21 (a)に関連して、前述した MVCパラダイムを用いて更に説明する。図 21 (a)は、文書 1001の XHTM Lコンポーネントにおける MVの関係を簡略化して示す。モデルは、 DocumentlOOl の XHTMLコンポーネントのための XHTMLZone 1101である。 XHTMLZoneのッリ一には、いくつかの Node及びそれらに対応する Facetが含まれる。対応する XHTMLZon e及び Paneは、 MVCパラダイムのモデル（M)部分の一部である。 MVCパラダイムのビュー（V)部分は、 DocumentlOOlの XHTMLコンポーネントの、対応する XHTML Canvasl 102及び BoxTreeである。文書の XHTML部分は、 Canvasと、それに含まれる Commandを使用して画面に描写される。キーボードやマウス入力などのイベントは、図示されるように、逆方向へ進む。

[0177] SourcePaneは、更なる機能、すなわち、 DOMの保有者としての役割を有する。図 2 1 (b)は、図 21 (a)に示した DocumentlOOlのコンポーネントに対するボキヤブラリコネクシヨンを提供する。 DOMホルダーとして機能する SourcePanel l03は、文書のソース DOMツリーを含む。 ConnectorTreeは、 ConnectorFactoryにより生成され、デスティネーシヨン DOMの保有者としても機能する DestinationPanel 105を生成する。 D estinationPanel 105は、 XHTMLDestinationCanvasl 106としてボックスツリーの形式でレイアウトされる。

[0178] M.プラグインサブシステム、ボキヤブラリコネクション、及びコネクタの関係図 22 (a) - (c)は、それぞれ、プラグインサブシステム、ボキヤブラリコネクション、及び Connectorに関連する更なる詳細を示す。プラグインサブシステムは、文書処理システムに機能を追加又は交換するために用いられる。プラグインサブシステムは、 Ser viceBrokerl041を含む。 ServiceBrokerl041にアタッチされる ZoneFactoryServicel 201は、文書の一部に対する Zoneを生成する。 EditletService 1202も、 ServiceBroke rl041にアタッチされる。 EditletServicel202は、 Zone中の Nodeに対応する Canvasを生成する。

[0179] ZoneFactoryの例は、 XHTMLZone及び SVGZoneをそれぞれ生成する XHTMLZone Factoryl211及び SVGZoneFactoryl 212である。文書例に関連して前述したように、文書のテキストコンポーネントは、 XHTMLZoneを生成することにより表現されてもよ!ヽし、画像は SVGZoneを用いて表現されてもよい。 EditletServiceの例は、 XHTMLEditle U221及び SVGEditletl222を含む。

[0180] 図 22 (b)は、ボキヤブラリコネクションに関連する更なる詳細を示す。ボキヤブラリコネクシヨンは、前述したように、文書処理システムの重要な特徴であり、 2つの異なる方法で文書の整合のとれた表現及び表示を可能とする。 ConnectorFactory303を保持する VCManager302は、ボキヤブラリコネクションサブシステムの一部である。 Conn ectorFactory303は、文書の Connector304を生成する。前述したように、 Connector は、ソース DOM中のノードを監視し、 2つの表現の間の整合性を維持するために、デスティネーション DOM中のノードを修正する。

[0181] Template317は、いくつかのノードの変換ノレ一ノレを表す。ボキヤブラリコネクション記述子 (VCD)ファイルは、特定のパス又はルールを満たす要素又は要素の集合を他の要素に変換するいくつかのルールを表す Templateのリストである。 Template317 及び CommandTemplate318は、全て VCManager302にアタッチされる。 VCManager は、 VCDファイル中の全てのセクションを管理するオブジェクトである。 1つの VCDフアイルに対して、 1つの VCManagerオブジェクトが生成される。

[0182] 図 22 (c)は、 Connectorに関連する更なる詳細を提供する。 ConnectorFactory303 は、ノ、 ' ~~ス文善力ら Connectorを生成する。 ConnectorFactory303は、 Vocabulary ^ T emplateゝ及び ElementTemplateにアタッチされ、それぞれ、 VocabularyConnectorゝ T emplateConnector、 ElementConnectorを生成ずる。

[0183] VCManager302は、 ConnectorFactory303を保持する。 Vocabularyを生成するために、対応する VCDファイルが読み込まれる。こうして、 ConnectorFactory303が生成れる。このし onnectorFactory30dは、 Zoneを生成する ZoneFactory及びし anvasを生成する Editletに関連する。

[0184] つづ!/、て、ターゲットボキヤブラリの EditletServiceが、 VCCanvasを生成する。 VCCa nvasも、ソース DOMツリー又は Zoneにおける ApexNodeの Connectorを生成する。必要に応じて、子の Connectorが再帰的に生成される。 ConnectorTreeは、 VCDフアイル中のテンプレートの集合により生成される。

[0185] テンプレートは、マークアップ言語の要素を他の要素に変換するためのルールの集合である。例えば、各テンプレートは、ソース DOMツリー又は Zoneにマッチされる。適切にマッチした場合には、頂点 Connectorが生成される。例えば、テンプレートお/ */D」は、間にどんなノードがあるかに関係なぐノード Aで始まりノード Dで終わる全ての枝に合致する。同様に、「〃B」は、ルートからの全ての「B」ノードに一致する。

[0186] N. ConnectorTreeに関係する VCDファイルの例

特定の文書と関係する処理を説明する例を続ける。ドキュメントタイトルのある「MyS ampleXML」というタイトルの文書が文書処理システムにロードされる。図 23は、「MySa mpleXMLjファイルのための、 VCManager及び ConnectorFactoryTreeを用いた VCD スクリプトの例を示す。スクリプトファイル中のボキヤブラリセクシヨン、テンプレートセクシヨンと、 VCManagerにおける対応するコンポーネントが示される。タグ「vcd:vocabula ry」において、属'性「match_^¾「sample:root」、「label」は「MySampleXML」、「caU— temp late」は sample template となって、る。

[0187] この例では、 Vocabularyは、「MySampleXML」の VCManagerにおいて「sample:root」として頂点要素を含む。対応する UIラベルは、「MySampleXML」である。テンプレートセクションにお、て、タグは「vcd:template」であり、名前は「sample:template」である。

[0188] O.ファイルがシステムにロードされる方法の詳細な例

図 24— 28は、文書「MySampleXML」のロードについての詳細な記述を示す。図 24 (a)に示されるステップ 1では、文書がストレージ 1405からロードされる。 DOMService は、 DOMツリー及び DocumentManagerl406と対応する DocumentContainerl401 を生成する。 DocumentContainerl401は、 DocumentManagerl406にアタッチされる。文書は、 XHTML及び MySampleXMLのサブツリーを含む。 XHTMLの ApexNode 1403は、タグ「xhtml:html」が付された XHTMLの最上のノードである。「MySampleX MLJの ApexNodel404は、タグ「sample:root」が付された「MySampleXML」の最上ノードである。

[0189] 図 24 (b)に示されるステップ 2では、 RootPaneが文書の XHTMLZone、 Facet,及び Canvasを生成する。 Panel407、 XHTMLZonel408、 XHTMLCanvasl409、及び Bo xTreel410力 ApexNode 1403に対応して生成される。

[0190] 図 24 (c)に示されるステップ 3では、 XHTMLZoneが知らないタグ「sample:root」を発見し、 XHTMLCanvasの領域から SubPaneを生成する。

[0191] 図 25に示されるステップ 4では、 SubPaneが「sample:root」を扱うことができ、適切な Zoneを生成 Γ會な ZoneFactory 得る。この ZoneFactoryi；、 ZoneFactory 行 n丁能な Vocabulary内にある。それは、「MySampleXML」の VocabularySectionの内容を含む。

[0192] 図 26に示されるステップ 5では、「MySampleXML」に対応する Vocabularyが Default Zonel601を生成する。対応する Editletが生成され、対応する Canvasを生成するために SubPanel501が提供される。 Editletは、 VCCanvasを生成する。そして、それは T emplate¾ection 呼ふ。 Connectorractory freet a.3；れて、る。し onnectorFactoryTr eeは、 ConnectorTreeとな全飞の Connectorを生成する。

[0193] 図 27に示されるステップ 6では、各 Connectorがデスティネーション DOMオブジェクトを生成する。コネクタのうちのいくつかは xpath情報を含んでいる。 xpath情報は、変更 Z修正を監視する必要のあるソース DOMツリーの部分集合を決定するために使用される 1以上の xpath表現を含む。

[0194] 図 28に示されるステップ 7では、ボキヤブラリは、ソース DOMのペインからデスティネーシヨン DOMツリーの DestinationPaneを作成する。これは、 SourcePaneに基づいてなされる。デスティネーションツリーの ApexNodeは、 DestinationPane及び対応する Zoneにァタツテされる。 DestinationPaneは、 DestinationCanvasを生成し、文書をテスティネーシヨンのフォーマットでレンダリングするためのデータ構造及びコマンドを構築する、自身の Editletを提供される。

[0195] 図 29 (a)は、対応するソースノードを持たず、デスティネーションツリーにのみ存在するノード上でイベントが発生したときのフローを示す。マウスイベント、キーボードィベントなど、 Canvasが取得したイベントは、デスティネーションツリーを通過して、 Elem entTemplateConnectorに izs達れる。 ElementTemplateConnectorは对、す oソ ~~スノードを持たな、ので、伝達されたイベントはソースノードに対する編集操作ではなヽ。 ElementTemplateConnectorは、 1ZS達れたヘントし ommandTemplateに己されたコマンドに合致すれば、それに対応する Actionを実行する。合致するコマンドがなければ、 ElementTemplateConnectorは、伝達されたイベントを無視する。

[0196] 図 29 (b)は、 TextOfConnectorによりソースノードに対応づけられているデステイネーシヨンツリーのノード上でイベントが発生したときのフローを示す。 TextOfConnector は、ソース DOMツリーの XPathで指定されたノード力テキストノードを取得して、デスティネーシヨン DOMツリーのノードにマッピングする。マウスイベント、キーボードィベントなど、 Canvasが取得したイベントは、デスティネーションツリーを通過して、 Text OlConnectorに伝達される。 TextO!Connectorは、伝達されたイベントを、対応するソースノードの編集コマンドにマッピングし、 Queuel053に積む。編集コマンドは、 Face tを介して実行される DOMの APIコールの集合である。キューに積まれたコマンドが実行されると、ソースノードが編集される。ソースノードが編集されると、ミューテーションイベントが発行され、リスナーとして登録された TextOfConnectorにソースノードの変更が通知される。 TextOfConnectorは、ソースノードの変更を、対応するデステイネーシヨンノードに反映させるように、デスティネーションツリーを再構築する。このとき、 TextO!Connectorを含むテンプレートに、「for each」「for loop」などの制御文が含まれている場合、 ConnectorFactoryがこの制御文を再評価し、 TextOfConnectorを再構築した後、デスティネーションツリーが再構築される。

[0197] (実施例）

図 30は、セマンティックウェブのレイヤケーキを示す模式図である。

前提技術において示した文書処理装置 20は、複合ドキュメント、 Webサービスなど各シーンにおける XML文書 (XMLデータ)ハンドリング技術として有効であることは上記した通りである。

1)同図のレイヤケーキで示されるセマンティック Webの進化において、 "XMじ，から" R DF(Resource Description Framework)以上"のデータ構造をシームレスに扱うことは、大きな課題といえる。

2)また、すべての文書が RDFで記述されるということがすぐに実現されることは難しいことが予想される。

3)そこでこれまでの XMLベースのデータと RDF以降のデータとを連結する技術が望まれる。

4)この時、前提技術にて示した XMLハンドリング技術は、「XML」という共通言語によつて、既存の XMLによるデータとセマンティック Webアプリケーションをつなげるキーテクノロジ一となる可能性がある。

[0198] 図 31は、個人情報を含んだ各種文書ファイルの一般的な取り扱い形態を示す模式図である。

こうした各部署で個別に作成している帳票などの文書ファイルやそのための入カブラウザを大きく変更することなく一括管理することが本実施例において目的とするところである。

そのために、社内基準としてグローバルな (モデルとなる）データを定義した後、各部署におけるローカルなデータ定義との関係をオントロジー技術で連携し、既存の X ML構造化された社内文書と文書入力ブラウザに対して XMLハンドリング技術により最小のコストでデータの収集と付加情報の追カ卩が可能としている。

[0199] 図 32は、本実施例における個人情報管理支援システムのフローを示す図である。

<シーン 1 >

セキュリティ管理者が、各部署の文書ファイルに含まれる個人情報を収集する。各部署の文書ファイルで使用されているローカルな用語については、膨大なノリエーシヨンがある。そのため、セキュリティ管理者は、これらのローカルな用語を完全に把握してはいない。

しかし、同図においては、文書の構造や属性についてのオントロジ一が社内基準によって定義されている（以下、このようなオントロジーを「グローバルオントロジー」とよぶ)。各部署では、ローカルオントロジーとしてその部署のローカルな用語をグローバルオントロジ一の用語にリンクさせている。これにより、社内基準としてのグローノレオントロジ一と部署ごとのローカルオントロジ一がシームレスに連係することになる。社内データベースからローカルオントロジーに基づいて作成された文書ファイルを検索するにあたり、社内基準のグローバルオントロジーに基づいて意味的な上位概念での検索を行う。この意味的な上位概念は各部署において実際に使用されている用語に変換される。そして、社内データベース力 XML構造ィ匕文書を検索してその結果が一覧表示される。

[0200] 使用する要素技術：

1.社内全体で基準化されているグローバルオントロジ一と、そのグローバルオントロジ一にマッピングされているローカルオントロジー。

2.グローバルオントロジ一からローカルオントロジ一に展開した上で、社内データベースを検索して一覧表示する機能。

[0201] <シーン 2>

検索結果として一覧された文書ファイルを、各部署に配信する。そして、配信された文書ファイルに対して、各部署の部長は、人名や住所といった個人情報をチェックし、たとえば、「個人情報処理該当」といったァノテーシヨンを付与する。このとき、各部署のローカルな用語を使ってァノテーシヨンが付与される。

[0202] 営業部門と開発部門の文書ファイルをもとにして、外部提出用の新しい文書を作成した場合においても、ァノテーシヨンが設定されたテキストを使っている場合には、「個人情報処理該当」ァノテーシヨンがそのまま利用可能となる。

すなわち、文書ファイルのデータが、 2次的、あるいは、 3次的に利用される場合であっても、このようなァノテーシヨン情報が保持される。

[0203] 図 33は、図 32のシーン 1について詳細に説明するための模式図である。

図 34以降に関連して説明するように、社内基準として利用するタグは、グローバルなオントロジ一として定義されている。つまり、会社全体としては、文書ファイルの種類や、そこに記述される各タグについては抽象的、汎用的な定義がなされている。一例として、「Doc」タグのプロパティとして、「Creater」、「CreateDate」といったタグが含まれるようなスキーマ、いわば、グローバルオントロジ一が定義されているとする。一方、営業部門では、「営業日報」タグのプロパティとして、「報告者」、「報告日」といつたタグが含まれるようなスキーマ、いわば、ローカルオントロジ一が定義される。ここで、「営業日報」タグは「Doc」タグを継承したタグである。同様に「報告者」、「報告日」といったタグは、それぞれ「Creater」タグや「CreateDate」タグを継承している。以下、グローバルオントロジーに基づ、て定義されるタグのことを「モデルタグ」とよぶ。

[0204] さて、住所に関連する「MeetingPlace」タグはグローバルオントロジ一にて定義されているモデルタグであるとする。セキュリティ管理者は、ローカルオントロジ一に基づく文書ファイル内のデータを、この「MeetingPlace」と!、うモデルタグ名で検索する。「Me etingPlaceJというモデルタグは、研究部門では「出張先」タグとしてリネームされている。また、営業部門では「住所」としてリネームされている。

すなわち、グローバノレオントロジ一における「MeetingPlace」というタグは、ロー力ノレオントロジーにおいては、「出張先」であったり「住所」であったりと部署ごとの業務に応じたタグ名となる。以下、ローカルオントロジーに基づいて定義されるタグのことを「実体タグ」とよぶ。

[0205] 図 34は、研究部門におけるグローバルオントロジ一とローカルオントロジ一の関係を示す図である。

ここに示すように、グローバルオントロジ一における「MeetingPlace」タグは、この研究部門においては「出張先」タグとなっている。グローノレオントロジ一においては、「 DocumentEntityJと、うクラスのプロパティとして「MeetingPlace」が定義されて、る。ヽわば、社内基準としてのモデルタグのデータ構造力そのまま各部署の文書ファイルの実体タグのデータ構造として継承されている。以下、社内基準であるグローバルォントロジーに基づいて作成された文書ファイルを「親文書ファイル」、また、そのタグ構造を「親スキーマ」とよぶ。また、親スキーマを継承したスキーマ（以下、「子スキーマ」とよぶ）をもち、ローカルオントロジーに基づいて各部署において生成された文書ファィルを「子文書ファイル」とよぶ。子文書ファイルの表示レイアウトは、各部署ごとに作成されてもよ、し、標準的な表示レイアウトがあら力じめ提供されてもょ、。 [0206] 同図に示すように、実体タグのプロパティは、モデルタグのプロパティをそのまま ϋ 承している。その一方で、実体タグの名前は、各部署の業務に応じてリネーム可能となっている。子文書ファイルは、モデルタグに実体タグをマッピングするためのタグマッビングテーブルとセットで保持されることになる。たとえば、「出張先」タグは、その継承元である「MeetingPlace」タグにマッピングされて!/、る。

[0207] 図 35は、営業部門におけるグローバルオントロジ一とローカルオントロジ一の関係を示す図である。

ここに示すように、グローバルオントロジ一における「MeetingPlace」タグは、この営業部門にお、ては「住所」タグとなって、る。

[0208] セキュリティ管理者は、たとえば、社内の様々な子文書ファイルに対して「MeetingPl acej t ヽぅモデルタグを継承する実体タグに対応して入力されてヽるデータを検索することができる。セキュリティ管理者が「MeetingPlace」タグを検索キーとして社内データベースを検索すると、先述したタグマッピングテーブルによって、子スキーマごとに対応する実体タグ名が特定される。たとえば、研究部門において使用されている子文書ファイルに対して、「MeetingPlace」タグを検索キーとして検索指示した場合、検索キーは「出張先」というタグ名に変換される。そして、「出張先」タグを入力項目とするデータを子文書ファイル力も検出することができる。そのため、セキュリティ管理者は、実体タグ名を知らなくても、モデルタグの名前で一元的に社内文書力所望のデータを検索できる。一方、各部署における子文書ファイルユーザは、グローバルオントロジ一にしたがっている限り、自由に実体タグ名を設定できるため、セキュリティ管理者と各部署のユーザが社内文書を扱うための利便性を向上させることができる。

[0209] 図 36は、子文書ファイルにァノテーシヨンを付与する態様を説明するための模式図である。

1.研究部門で個人情報となる人名や住所などに「個人情報対象データ」を示すァノテーシヨンを設定する。

2.この時、子文書ファイルが 2種類以上の表示レイアウトにて表示されているときには、一方の表示画面に対するァノテーシヨン設定はその他の表示画面に対するァノテーシヨン設定として同時的に反映される。これは、ァノテーシヨンが子文書ファイルの「データ」に設定される力である。前提技術において説明したミューテーシヨンィベントによる技術が応用される。

3.営業部門でも、個人情報となる人名や住所などに「個人情報対象データ」を示すァノテーシヨンを設定する。

4.企画者力 Sこのふたつの文書、すなわち、研究部門の子文書ファイルと営業部門の子文書ファイルを利用してひとつの企画書ファイルを作成しても、それぞれのァノテーシヨン情報は残って、る。

5.外部へ企画書ファイルを送信する場合には、会社のセキュリティシステムがこのァノテーシヨンが設定されて、る部分をマスキングすることで、個人情報にかかわる箇所が外部流出することを防ぐ。

[0210] このようなァノテーシヨンもタグと同じく構造ィ匕文書ファイルの構成要素の一種といえる。親スキーマには、たとえば、「Important」ァノテーシヨンのように、グローバルオントロジ一に基づく複数種類のァノテーシヨンが含まれている。一方、子スキーマには、この「Important」ァノテーシヨンを継承したァノテーシヨンが含まれることになる。ユーザは、この子スキーマにおけるァノテーシヨン（以下、「実体ァノテーシヨン」とよぶ）の名前を、実体タグと同様にリネームできる。たとえば、「Important」ァノテーシヨンを「営業秘密」ァノテーシヨンといった具合に業務に応じたリネームが可能である。

[0211] 子スキーマの各実体ァノテーシヨンのプロパティは、親スキーマにおけるァノテーシヨン（以下、グローバルオントロジ一に基づ、て定義されて、るァノテーシヨンのことを「モデルァノテーシヨン」とよぶ）のプロパティをそのまま継承して、る。子文書ファイルは、この親スキーマによるモデルァノテーシヨンに実体ァノテーシヨンをマッピングするためのァノテーシヨンマッピングテーブルとセットで保持されることになる。

[0212] セキュリティ管理者は、モデルァノテーシヨンを検索キーとして、社内データベースを検索すると、先述したァノテーシヨンマッピングテーブルによって、子スキーマごとに対応する実体ァノテーシヨン名が特定される。たとえば、「Important」ァノテーシヨンを検索キーとして検索指示した場合、営業部門の子文書ファイルについては「営業秘密」ァノテーシヨンに変換される。そして、「営業秘密」ァノテーシヨンが設定されているデータを子文書ファイル力も検出することができる。そのため、セキュリティ管理者は、実体ァノテーシヨン名を知らなくても、モデルァノテーシヨンの名前で一元的に社内文書力も所望のデータを検索できる。一方、各部署における子文書ファイルユーザは、グローバルオントロジーにしたがっている限り、自由にァノテーシヨン名を設定できるため、セキュリティ管理者と各部署のユーザが社内文書を扱うための利便性を向上させることができる。

[0213] ァノテーシヨンの場合、タグというスキーマに必ずしも制約されることがないというメリットがある。たとえば、「\^61 ¾?1&06」と「\^61 ¾じ0 6 」タグに入力される 2種類のデータに 1種類のァノテーシヨンが設定されてもよい。あるいは、「MeetingPlace」タグへの入力データの一部に対してァノテーシヨンが設定されてもよい。

モデルァノテーシヨンとしては、たとえば、個人情報を指定するためのァノテーシヨン、重要情報を指定するためのァノテーシヨンなどさまざまな種類のァノテーシヨンが用意されてもよい。子文書ファイルに対し、個人情報を指定するためのモデルァノテ一シヨンを継承した実体ァノテーシヨン力個人情報に相当するデータ範囲に設定されてもよい。そして、たとえば、個人情報を指定するためのモデルァノテーシヨン力継承された実体ァノテーシヨンが設定されているデータについては、社外に送信されないように処置してもよい。より具体的には、セキュリティシステムが個人情報を指定するためのモデルァノテーシヨンを検索キーとして、子文書ファイルの個人情報を特定し、これらのデータをマスキングすることによって、個人情報が外部に流出しないように処置することができる。

[0214] 図 37は、ァノテーシヨンによるセキュリティ管理を説明するための模式図である。

1.セキュリティ管理者としては、個人情報を指定するためのタグを社内文書フアイルに付与させるため、「SecurityName」というタグ名で管理している。

2.営業部門では、部署内の文書ファイルにおいてわ力りやすいように「非流出顧客情報」として、研究部門では「研究者情報」として独自のァノテーシヨン名にてァノテーシヨンを設定している。同図に示すように、営業部門においては、「A氏」というデータをァノテートするために、「非流出顧客情報」というァノテーシヨンがタグとして設定されている。一方、研究部門においては「B氏」というデータをァノテートするために、「研究者情報」 t 、うァノテーシヨンがタグとして設定されて、る。 3.この関係は VCDにより連結されている。すなわち、個人情報のァノテーシヨン時に利用される各部署のタグは、社内基準である「SecurityName」タグにマッピングする処理が VCDとして提供される。

4.これにより各部署におけるローカルな用語にてァノテーシヨンが設定されても、セキユリティ管理は「SecurityName」により一元的に管理することができる。

[0215] ァノテーシヨンは、子文書ファイルのタグや、タグに対して入力されたデータの全部または一部、あるいは、複数のタグに対して入力されたデータのセットに対して設定されてもよい。

[0216] 次に、タグに基づくデータ処理関数を 2例挙げる。

関数名： ont_searh

引数:ローカルドメイン、実体タグ

返値：指定した実体タグの継承元であるモデルタグ力継承されて、る、全てのドメインにおける実体タグの一覧

説明：指定した実体タグと同じグローノレオントロジ一のクラスに該当する全ての実体タグの一覧を取得する。この関数は、まず、 DOMツリーを取得した後、営業部門の「住所」と、う実体タグの継承元である「MeetingPlace」 t 、うモデルタグを取得する。そして、このモデルタグを継承している研究部門の「出張先」タグを検出する。

これにより、取得したいノードに相当する概念 (オントロジ一のクラス)あるいは、それに相当する他のドメインのタグを指定することで、検索が可能となる。いいかえれば、検索対象のドメインがわ力もなくても検索が可能となる。

サンフノレ：く vcd:for— each select= ¾inction:ont— search(function:aocument、 *.xml / /*/営業部門:住所)"〉

このサンプルの場合、カレントディレクトリの拡張子が xmlである全てのファイルを par seし、その中で営業部門：住所と同じグローバルオントロジ一のクラスに該当するノードの一覧を取得する。

[0217] 関数名： ont_call

引数：ターゲットドメイン、コマンド名

返値：ターゲットドメインの VCDに定義されて、るコマンドを実行する。説明:オントロジ一におけるドメイン変換を行って、表示や編集を行う場合、編集コマンドを記述してあるドメインと編集対象となるドメインが異なるため、編集対象ドキュメントのスキーマを保つことを保証しがたい。そこで、たとえば、個人情報にタグを付けるといった特定の編集コマンドのインタフェースをグローバルオントロジ一で定義する。そして、各ドメインにおけるローカルオントロジ一において、これらの編集コマンドを実装することにより、各ドメインにおけるスキーマにしたがった形で編集コマンドを定義できる。このコマンドは各ドメインを処理するための VCDコマンドとして定義する。サンプノレ：、 vcd: action event= event:mouse— clicked >^instruction:callname= functi on:ont— call(annotate— privacy,$contextNS)7〉く/ vcd:action〉

このサンプルの場合、該当箇所でマウスがクリックされると、 $contextNSドメインで定義された annotate-privacyというコマンドが実行される。

[0218] 図 38として、図 34や図 35に関連して説明したタグマッピングテーブルの別例を示す。

ここでは、「Customer」として定義されたモデルタグ力研究部門においては「出張先」、営業部門では「顧客名」として定義されている。こうした知識があれば、セキユリティ管理者は、個人情報となりえる情報を検索する場合において、

研究部門-〉出張報告書-〉出張先

営業部門-〉営業日報-〉顧客名

t ヽぅローカルなタグ名で該当データを検索する必要はなく、

DocumentEntry―〉し ustomer

だけで、必要な情報を検索できる。

[0219] 以上、本実施例における文書処理技術の特徴をまとめると以下の通りである。

1. XML技術とセマンティック Web技術の融合

文書処理装置 20をプラットフォームとすることで、 RDF、 RDFS(Resource Description Framework Shema)、 OWL(Web Ontology Language)といつァこセマンティック Web技と XML技術がシームレスに結合可能となる。

2.ヒューマンリーダブルからマシーンリーダブルのデータ整合性

セマンティック Webの展望であるヒューマンリーダブルからマシーンリーダブルとともに、現実世界で問題となるデータを扱うブラウザとデータの整合性が文書処理装置 2 0にて統一して扱うことができる。

3.上記 2の各技術を連携した個人情報管理支援システムを文書処理装置 20をプラットフォームとして実現することができる。

以上の実施例に示した処理方法には、企業などの業務組織において取り扱われる文書ファイルのデータ整合性を保持しやすくなるという効果がある。

[0220] 本発明に関連して更に付言する。

これまでに、モデルタグと実体タグのマッピング、およびその利用場面を中心として説明した。たとえば、社内において標準的なモデルタグのセット（以下、「モデルタグセット」とよぶ）を用意しておき、各部署ではモデルタグセットをベースとして業務に即した実体タグを作り、実体タグに基づいて XML文書ファイルを作成してもよい。この場合、開発部とマーケティング部、営業部はそれぞれ別々の実体タグにより XML文書を作成することになる。しかし、実体タグのセット（以下、「実体タグセット」とよぶ）は別々であってもその継承元は同じモデルタグセットであるため、モデルタグに基づく情報検索が可能である。

[0221] たとえば、モデルタグく従業員〉力実体タグく課長〉やくライセンス担当〉が継承されているとし、このような実体タグによって記述されている XML文書ファイルを想定する。より具体的には、この XML文書ファイルにく課長 >加藤く/課長 >、 <ラィセンス担当 >長谷川 < /ライセンス担当 >と、う 2つの要素が含まれて、る場合、モデルタグ <従業員 >を対象としてデータ検出を指示すると、「加藤」、「長谷川」という 2つの要素データを検出できる。これは、モデルタグ <従業員 >と実体タグ <課長 >およびくライセンス担当〉が内部的に対応づけられているためである。モデルタグを継承するかたちで実体タグを作成する限り、モデルタグを検索キーとして実体タグの要素データから求める情報を取得できる。タグに限らず、ァノテーシヨンについても同様である。以下、このようなモデルタグから継承するかたちで実体タグを生成し、モデルタグと実体タグをマッピングするやり方を「トップダウンアプローチ」とよぶことにする。

[0222] これとは別の場面として、 XML文書ファイルにおいて既に使用されているさまざまな実体タグをモデルタグにマッピングしてもよい。以下、このようなマッピングの仕方を「ボトムアップアプローチ」とよぶことにする。ボトムアップアプローチにおいては、実体タグはモデルタグから継承して作成する必要はなぐユーザが任意に定義できる。仮に、ある XML文書ファイルに実体タグく課長 >ゃ<ライセンス担当 >が含まれているとする。これらの実体タグは、モデルタグをベースとして作成されたタグではなぐュ一ザが特段の制約もなく自由に定義したタグであるとする。一方、さきほどのモデルタグく従業員〉には、く社長〉、く課長〉、くライセンス担当〉、く新入社員〉、 < プロジェクトリーダ〉、 · · ·のようにさまざまな下位概念語や類語にあたるタグがあらかじめ定義されて!ヽる。モデルタグの名前と実体タグの名前が上位概念語と下位概念語の関係にあるとき、これらのタグは自動的に対応づけられることになる。 XML文書ファイルの実体タグく課長 >は、モデルタグく従業員 >の下位概念語となって!/、ることから、実体タグく課長 >に対してモデルタグく従業員 >が自動的に対応づけられる。このような方法によれば、既存の XML文書ファイルに含まれているタグを標準的なモデルタグに自動的に結びつけることができる。

[0223] 図 39は、前提技術で説明した文書処理装置 20の各種機能を利用しつつ、実体タグとモデルタグのマッピング機能を実現する文書処理装置 3000の機能ブロック図である。

ここに示す各ブロックは、ハードウェア的には、コンピュータの CPUをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現される力ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組み合わせによっていろいろなかたちで実現できることは、当業者には理解されるところである。

[0224] 文書処理装置 3000は、ユーザインタフェース処理部 3100、通信部 3130、データ処理部 3200およびデータ保持部 3250を含む。

ユーザインタフェース処理部 3100は、ユーザからの入力処理やユーザに対する情報表示のようなユーザインタフェース全般に関する処理を担当する。本実施例においては、ユーザインタフェース処理部 3100により文書処理装置 3000のユーザインタフェースサービスが提供されるものとして説明する。別例として、ユーザはインターネットを介して文書処理装置 3000を操作してもよい。この場合、通信部 3130が、ユーザ端末力の操作指示情報を受信し、またその操作指示に基づ、て実行された処理結果情報をユーザ端末に送信することになる。

[0225] データ処理部 3200は、ユーザインタフェース処理部 3100や通信部 3130から取得されたデータを元にして各種のデータ処理を実行する。データ処理部 3200は、ュ一ザインタフエース処理部 3100とデータ保持部 3250の間のインタフェースの役割も果たす。データ保持部 3250は、あらかじめ用意された設定データや、データ処理部 3200から受け取ったデータなど、さまざまなデータを格納する。

[0226] ユーザインタフェース処理部 3100は、ユーザからの入力を受け付ける入力部 311 0とユーザに対して各種情報を表示する表示部 3120を含む。表示部 3120の機能は、前提技術で説明した文書処理装置 20の表示部 56等により実現される。入力部 31 10は、ァノテーシヨン設定部 3112と文書取得部 3114を含む。ァノテーシヨン設定部 3112は、ユーザからの指示入力に基づき、 XML文書に対してァノテーシヨンを設定する。ァノテーシヨンはタグの属性 (attribute)として設定される。文書取得部 3114は、処理対象となる XML文書ファイルを取得する。

[0227] 通信部 3130は、他の文書処理装置 3000や所定のサーバ装置などの外部装置と通信する。通信部 3130は、文書送信部 3132と文書受信部 3134を含む。文書送信部 3132は、外部装置に XML文書ファイルを送信する。文書受信部 3134は、外部装置から XML文書ファイルを受信する。このように、文書処理装置 3000は文書取得部 3114と文書受信部 3134の、ずれかを介して処理対象となる XML文書ファイルを取得する。

[0228] データ保持部 3250は、ファイル保持部 3252、タグマッピングテーブル保持部 325 4およびァノテーシヨンマッピングテーブル保持部 3256を含む。

ファイル保持部 3252は、 XML文書ファイル、特に、実体タグによって記述された X ML文書ファイルを保持する。タグマッピングテーブル保持部 3254は、実体タグとモデルタグを対応づけたタグマッピングテーブルを保持する。ァノテーシヨンマッピングテーブル保持部 3256は、実体ァノテーシヨンとモデルァノテーシヨンを対応づけたァノテーシヨンマッピングテーブルを保持する。 [0229] データ処理部 3200は、文書編集部 3210、検索部 3220、マッピング処理部 3230 およびマスク処理部 3240を含む。

文書編集部 3210は、ユーザからの入力に応じて XML文書ファイルの編集処理を実行する。文書編集部 3210の主たる機能は、前提技術で説明した文書処理装置 2 0の基本的な機能、特に、編集ユニット 24により実現される。トップダウンアプローチとして、ユーザは、モデルタグセットによって記述されている XML文書ファイルを、実体タグで記述された XML文書ファイルに変換してもよい。また、ボトムアップアプローチとして、はじめから自由に実体タグを定義して XML文書ファイルを作成してもよい。

[0230] 文書編集部 3210は、タグリネーム部 3212とァノテーシヨンリネーム部 3214を含む。トップダウンアプローチを採る場合において、タグリネーム部 3212は、モデルタグ名を変更することにより実体タグを生成する。このとき、マッピング処理部 3230のマツビング記録部 3234は、実体タグと変更元のモデルタグをタグマッピングテーブルに対応づけて記録する。ァノテーシヨンリネーム部 3214も同様であり、モデルァノテ一シヨン名を変更することにより実体ァノテーシヨンを生成する。マッピング記録部 3234 は、実体ァノテーシヨンと変更元のモデルァノテーシヨンをモデルマッピングテーブルに対応づけて記録する。トップダウンアプローチにより実体タグや実体ァノテーシヨンが生成されるときには、マッピング記録部 3234が対応づけを自動的に行う。一方、ボトムアップアプローチの場合においては、マッピング処理部 3230の対応検出部 323 2がモデルタグと実体タグ、モデルァノテーシヨンと実体ァノテーシヨンとの対応関係を自動検出する。検出方法については後述する。

[0231] 検索部 3220は、 XML文書ファイル中力もタグゃァノテーシヨンを検索する。検索部 3220はタグ検索部 3222とァノテーシヨン検索部 3224を含む。

タグ検索部 3222はタグを検索する。たとえば、先ほどの例の場合、モデルタグく従業員〉を検索キーとする場合、タグ検索部 3222は、タグマッピングテーブルを参照してモデルタグく従業員〉と対応づけられている実体タグを検出する。すなわち、 X ML文書ファイル中から実体タグく課長〉やくライセンス担当〉を検出し、それらの要素データを取得する。

[0232] このようなモデルタグ→実体タグという検索方法に限らず、実体タグ→モデルタグ→ 実体タグという検索方法も可能である。たとえば、ある XML文書ファイル Aでは実体タグく課長 >が使用されており、別の XML文書ファイル Bでは実体タグくライセンス担当 >が使用されていたとする。このとき、 XML文書ファイル Aの実体タグく課長 > を検索キーとして、 XML文書ファイル B力実体タグくライセンス担当〉を検索してもよい。この場合、タグ検索部 3222は、 XML文書ファイル Aの実体タグく課長〉とタグマッピングテーブルにおヽて対応づけられてヽるモデルタグく従業員 >を特定する。次に、タグ検索部 3222は、モデルタグく従業員〉とタグマッピングテーブルにおいて対応づけられている実体タグくライセンス担当 >を特定する。このようにして、同じモデルタグにマッピングされて、る別の実体タグを検索することもできる。タグマツビングテーブルは、モデルタグセットと実体タグセットの組み合わせごとに用意される。無論、 XML文書ファイル Aの実体タグを検索キーとして、同じ XML文書ファイル A に含まれ、同じモデルタグとマッピングされて、る別の実体タグを検索することもできる。

[0233] ァノテーシヨン検索部 3224はァノテーシヨンを検索する。ァノテーシヨン検索部 322 4もタグ検索と同様に、モデルァノテーシヨンを検索キーとして、 XML文書ファイル中力も該当する実体ァノテーシヨンを検索する。また、実体ァノテーシヨンを検索キーとして、同じモデルァノテーシヨンにマッピングされて!/、る別の実体ァノテーシヨンを検索することちでさる。

[0234] マッピング処理部 3230は、タグゃァノテーシヨンのマッピングを管理する。基本的な仕組みは、前提技術で説明した VCユニット 80によるボキヤブラリコネクションの仕組みと同様である。マッピング処理部 3230は、対応検出部 3232とマッピング記録部 3234を含む。対応検出部 3232は、ボトムアップアプローチにおいて実体タグとモデルタグ、実体ァノテーシヨンとモデルァノテーシヨンの対応関係を検出する。

[0235] 対応検出部 3232は、あらカゝじめ用意されている類語テーブルや概念語テーブルを参照して、対応関係を検出する。類語テーブルには、類語関係にある単語の組み合わせ記述されている。たとえば、「自動車」という単語に対しては、「電車」、「自転車」などの単語が類語として登録されている。モデルタグく自動車〉が定義されている

、て、ユーザが XML文書ファイル中にく電車 >と、う実体タグを定義したときには、対応検出部 3232は類語テーブルを参照して、モデルタグく自動車〉と実体タグく電車〉の対応関係を検出し、マッピング記録部 3234はタグマッピングテーブルに両タグを対応づけて記録する。

[0236] 概念語テーブルには、上位概念と下位概念の関係にある単語の組み合わせが記述されている。たとえば、「自動車」という単語に対しては、「高級車」、「新型車」などの下位概念にあたる単語が登録されている。モデルタグく自動車〉が定義されている場合にぉ、て、ユーザが XML文書ファイル中にく高級車〉と、う実体タグを定義したときには、対応検出部 3232は類語テーブルを参照して、モデルタグく自動車〉と実体タグく高級車〉の対応関係を検出し、マッピング記録部 3234はタグマツピングテーブルに各タグを対応づけて記録する。

[0237] このように、対応検出部 3232は、類語テーブルおよび概念語テーブルの双方または一方を参照してタグ間の対応関係を検出する。ァノテーシヨンについても同様である。ボトムアップアプローチにおいて、ユーザは実体タグに対して任意のモデルタグセットにおける任意のモデルタグを明示的にマッピングしてもよ、。明示的なマツピングが指示されると、マッピング記録部 3234はタグマッピングテーブルに実体タグとモデルタグの対応関係を記録する。 1つのモデルタグセットに対して複数種類の実体タダセットをそれぞれ対応づけてもょ、し、複数種類のモデルタグセットに対して 1つの実体タグセットを対応づけてもよ、。

[0238] マスク処理部 3240は、ユーザによって指定された情報を非公開化する。たとえば、ファイル保持部 3252に保持されてヽる XML文書ファイルを画面表示させるとき、個人情報保護のために従業員名に関わる情報を表示対象外としたいとする。この場合、ユーザは非表示対象データをモデルタグ <従業員 >により指定する。マスク処理部 3240は、タグマッピングテーブルを参照して、 XML文書ファイル中力対応する実体タグを検出する。そして、対応する実体タグ <課長 >ゃ<ライセンス担当 >の要素データである「加藤」は「長谷川」を表示対象から除外する。具体的には、 XML文書ファイルを XSLスタイルシートにて変換することにより、非表示データが除外された XML文書ファイルを新たに生成する。そして、生成された XML文書ファイルに含まれるデータが実際の表示対象となる。文書送信部 3132によって外部装置に XML文書ファイルを送信するときにも、データのマスクが可能である。この場合には、非表示データが除外された XML文書ファイルが送信対象となる。このような処理方法によれば、モデルタグにより非表示対象データを指定することにより、モデルタグとマツピングされているさまざまな実体タグの要素データを一元的に非公開化できる。また、非公開化以外にも、たとえば、該当データの表示色やフォントを変更してもよい。このようにマスク処理部 3240は、ユーザによって指定された情報の表示態様を変化させることちでさる。

[0239] 図 40は、モデルタグと実体タグのマッピング構造を説明するための模式図である。

ここではモデルタグセット 1、モデルタグセット 2と!、う 2種類のモデルタグセットが提供されて!ヽるとする。モデルタグセット 1とモデルタグセット 2は別々のベンダー (vende r)によって提供されてもよい。 XML文書ファイル 3300や XML文書ファイル 3302に含まれている実体タグは、モデルタグをリネームしたものではなぐユーザが任意に設定したタグである。すなわち、ボトムアップアプローチを前提としている。モデルタグセット 1は、モデルタグく人間〉と、その下位概念語としてのモデルタグく従業員〉を含む。単語「従業員」には、類語として「社員」、下位概念語として「課長」、「社長」、「課長代理」等の単語が類語テーブルや概念語テーブルにお、て対応づけられてヽるものとする。モデルタグセット 2は、モデルタグとしてく重要〉とく不要〉を含む。

[0240] XML文書ファイル 3300には、実体タグく社員〉が含まれている。対応検出部 32 32は、類語テーブルを参照して「社員」と!ヽぅ単語と「従業員」 t ヽぅ単語が類語関係にあることを検出する。このとき、マッピング記録部 3234は、 XML文書ファイル 3300 の実体タグく社員 >とモデルタグセット 1のモデルタグく従業員 >とを対応づけてタグマッピングテーブルに記録する。

[0241] XML文書ファイル 3302は、実体タグく課長 >、く社長 >、く課長代理 >を含む。対応検出部 3232は、概念語テーブルを参照して「課長」という単語が「従業員」という単語の下位概念語であることを検出する。このとき、マッピング記録部 3234は、 X ML文書ファイル 3302の実体タグく課長 >とモデルタグセット 1のモデルタグく従業員 >とを対応づけてタグマッピングテーブルに記録する。 <社長 >やく課長代理 > についても同様である。 [0242] ユーザは、モデルタグセット 2のモデルタグく重要 >に対して実体タグく社長 >を明示的にマッピングしている。このため、マッピング記録部 3234は、 XML文書フアイル 3302の実体タグく社長 >とモデルタグセット 2のモデルタグく重要 >とを対応づけてタグマッピングテーブルに記録する。また、ユーザはモデルタグく不要〉に対して実体タグく課長代理〉を明示的にマッピングしている。このため、これらのタグもタグマッピングテーブルにおいて対応づけられる。

このような実体タグく社長 >とモデルタグく重要 >のマッピングはユーザの判断に基づいている。そのため、同じモデルタグセット 2に対して、実体タグく社長〉にモデルタグく不要 >をマッピングし、く課長 >ゃ<課長代理 >に対してはモデルタグく重要 >をマッピングしてもよい。中間管理職 =重要という観点に立つならば、このようなマッピングも想定し得る。特に、「重要」や「不要」のように評価に関わるモデルタグの場合、ユーザの価値判断や評価基準に応じてマッピングが変化する可能性もある。たとえば、システムの運用中に、実体タグく課長代理 >は<不要 >ではなく <重要〉にマッピングされるべきであるとして状況変化することがある。この場合、タグマツビングテーブルにおける実体タグとモデルタグの対応関係を変更する。このように、実体タグとモデルタグの対応関係は、状況に応じて柔軟に変更可能であることが望ましい。更に、マッピングテーブルは、ユーザごとに設定してもよい。たとえば、ユーザ A はく社長 >に <重要 >をマッピングし、ユーザ Bはく社長 >に <不要 >をマツピングするといつた具合である。この場合、モデルタグセットと実体タグセットの組み合わせは同じでも、ユーザ A用のマッピングテーブルとユーザ B用のマッピングテーブルは另 IJ々となる。

[0243] このような処理モデルによると、既存の XML文書ファイルを 1以上のモデルタグセットにマッピングできる。そのため、さまざまな実体タグセットによって記述された XML 文書ファイルであっても、重要な実体タグをモデルタグ <重要 >とマッピングするだけで重要な要素データを簡単に検索できる。ボトムアップアプローチによれば、ユーザにモデルタグの使用やモデルタグをベースとした実体タグの生成を強いる必要がない。そのため、モデルタグセットを介することによって、別々の実体タグセットを結びつけることができる。たとえば、開発部で使用されている実体タグセットと、マーケティング部で使用されている実体タグセットは別々のものである力もしれないが、共通のモデルタグセットを介することによって両部署の情報を合理的に結びつけることができる。また、さまざまな種類のモデルタグセットを用意しておけば、さまざまな観点から実体タグを検索することができる。

産業上の利用可能性

本発明によれば、複数の構造ィ匕文書ファイルに含まれるデータを扱う上でのユーザの利便性を向上させる上で効果がある。

Claims

請求の範囲

[1] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルを保持するファイル保持部と、

親文書ファイルに含まれるタグであるモデルタグから継承された子文書ファイルのタグである実体タグの名前をユーザによる指示入力に応じて変更するタグリネーム処理部と、

子文書ファイルに含まれる実体タグの名前と、その実体タグの継承元であるモデルタグの名前を対応づけたタグマッピングテーブルを保持するタグマッピングテーブル保持部と、

モデルタグの名前を検索キーとするユーザによる検索指示入力により、前記タグマッビングテーブルを参照して対応する実体タグの名前を検出し、その実体タグの名前を新たな検索キーとして子文書ファイル力その実体タグの要素データを検出するタグデータ検索部と、

を備えることを特徴とする文書処理装置。

[2] ユーザにより指定された実体タグの継承元であるモデルタグを前記タグマッピングテーブルを参照して検出し、前記タグマッピングテーブル保持部に保持されて!ヽる複数のタグマッピングテーブルを参照することによりそのモデルタグを継承するその他の実体タグを検出する関連タグ検索部を更に備えることを特徴とする請求項 1に記載の文書処理装置。

[3] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルを保持するファイル保持部と、

親文書ファイルに含まれるァノテーシヨンであるモデルァノテーシヨンから継承された子文書ファイルのァノテーシヨンである実体ァノテーシヨンの名前をユーザによる指示入力に応じて変更するァノテーシヨンリネーム処理部と、

子文書ファイルに含まれる実体ァノテーシヨンの名前と、その実体ァノテーシヨンの継承元であるモデルァノテーシヨンの名前を対応づけたァノテーシヨンマッピングテ一ブルを保持するァノテーシヨンマッピングテーブル保持部と、

子文書ファイルに含まれるユーザによって指示されたデータに実体ァノテーシヨンを設定するァノテーシヨン設定部と、

モデルァノテーシヨンの名前を検索キーとするユーザによる検索指示入力により、前記ァノテーシヨンマッピングテーブルを参照して対応する実体ァノテーシヨンの名前を検出し、その実体ァノテーシヨンの名前を新たな検索キーとして子文書ファイル力その実体ァノテーシヨンが設定されるデータを検出するァノテーシヨンデータ検索部と、

を備えることを特徴とする文書処理装置。

[4] 子文書ファイルを外部装置に送信するファイル送信部を更に備え、

前記ァノテーシヨンデータ検索部は、子文書ファイルに含まれるデータのうち外部送信を禁止すべきデータに設定されるモデルァノテーシヨンを検索キーとして子文書ファイルカゝら該当データを検出し、

前記ファイル送信部は、その検出されたデータの外部装置に対する送信を抑止することを特徴とする請求項 3に記載の文書処理装置。

[5] 所定のタグセットに属する実体タグによって記述された構造ィ匕文書ファイルを取得する文書取得部と、

前記構造ィ匕文書ファイルに含まれる実体タグを検出し、前記所定のタグセットとは異なるタグセットに属するモデルタグのうち、前記検出した実体タグと所定の関係にあるモデルタグを検出する対応検出部と、

前記所定の関係にある実体タグとモデルタグを対応づけてタグマッピングテーブルに記録するマッピング記録部と、

モデルタグを検索キーとする検索指示入力をユーザ力受け付けると、前記タグマ

、る実体タグの要素データを前記構造ィ匕文書ファイル力検出するタグ検索部と、

を備えることを特徴とする文書処理装置。

[6] 前記構造化文書ファイルに含まれるデータを画面表示させるデータ表示部と、表示対象外となる要素データに対応するモデルタグの指定入力をユーザ力受け付けると、前記タグマッピングテーブルにおヽて対応づけられて!/ヽる実体タグを検出し、前記構造ィ匕文書ファイルにお、てその実体タグにより特定される要素データを表示対象から除外する表示制御部と、

を更に備えることを特徴とする請求項 5に記載の文書処理装置。

[7] 前記対応検出部は、類語関係にある単語の組み合わせが定義された類語データテーブルを参照して、前記構造ィ匕文書ファイル力検出した実体タグの名前と類語関係にある名前のモデルタグを前記所定の関係にあるモデルタグとして検出することを特徴とする請求項 5または 6に記載の文書処理装置。

[8] 前記対応検出部は、上位概念と下位概念の関係にある単語の組み合わせが定義された概念データテーブルを参照して、前記構造ィ匕文書ファイル力検出した実体タグの名前に対して上位概念にあたる名前のモデルタグを前記所定の関係にあるモデルタグとして検出することを特徴とする請求項 5または 6に記載の文書処理装置。

[9] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルにつ、て、親文書ファイルに含まれるタグであるモデルタグから継承された子文書ファイルのタグである実体タグの名前をユーザによる指示入力に応じて変更するステップと、

モデルタグの名前を検索キーとするユーザによる検索指示入力により、子文書ファィルに含まれる実体タグの名前とその実体タグの継承元であるモデルタグの名前を対応づけたタグマッピングテーブルを参照して、対応する実体タグの名前を検出し、その実体タグの名前を新たな検索キーとして子文書ファイル力その実体タグの要素データを検出するステップと、

を備えることを特徴とする文書処理方法。

[10] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルにつ、て、親文書ファイルに含まれるァノテーシヨンであるモデルァノテーシヨン力も継承された子文書ファイルのァノテーシヨンである実体ァノテーシヨンの名前をユーザによる指示入力に応じて変更するステップと、

子文書ファイルに含まれるユーザによって指示されたデータに実体ァノテーシヨンを設定するステップと、

モデルァノテーシヨンの名前を検索キーとするユーザによる検索指示入力により、子文書ファイルに含まれる実体ァノテーシヨンの名前とその実体ァノテーシヨンの継承元であるモデルァノテーシヨンの名前を対応づけたァノテーシヨンマッピングテーブルを参照して対応する実体ァノテーシヨンの名前を検出し、その実体ァノテーションの名前を新たな検索キーとして子文書ファイル力その実体ァノテーシヨンが設定されるデータを検出するステップと、

を備えることを特徴とする文書処理方法。

[11] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルにつ、て、親文書ファイルに含まれるタグであるモデルタグから継承された子文書ファイルのタグである実体タグの名前をユーザによる指示入力に応じて変更する機能と、

モデルタグの名前を検索キーとするユーザによる検索指示入力により、子文書ファィルに含まれる実体タグの名前とその実体タグの継承元であるモデルタグの名前を対応づけたタグマッピングテーブルを参照して、対応する実体タグの名前を検出し、その実体タグの名前を新たな検索キーとして子文書ファイル力その実体タグの要素データを検出する機能と、

をコンピュータに発揮させることを特徴とする文書処理プログラム。

[12] 複数のタグが構造ィ匕された親文書ファイルのスキーマを継承したスキーマによって生成された子文書ファイルにつ、て、親文書ファイルに含まれるァノテーシヨンであるモデルァノテーシヨン力も継承された子文書ファイルのァノテーシヨンである実体ァノテーシヨンの名前をユーザによる指示入力に応じて変更する機能と、

子文書ファイルに含まれるユーザによって指示されたデータに実体ァノテーシヨンを設定する機能と、

モデルァノテーシヨンの名前を検索キーとするユーザによる検索指示入力により、子文書ファイルに含まれる実体ァノテーシヨンの名前とその実体ァノテーシヨンの継承元であるモデルァノテーシヨンの名前を対応づけたァノテーシヨンマッピングテーブルを参照して対応する実体ァノテーシヨンの名前を検出し、その実体ァノテーションの名前を新たな検索キーとして子文書ファイル力その実体ァノテーシヨンが設定されるデータを検出する機能と、

[13] 所定のタグセットに属する実体タグによって記述された構造ィ匕文書ファイルを取得するステップと、

前記構造ィ匕文書ファイルに含まれる実体タグを検出し、前記所定のタグセットとは異なるタグセットに属するモデルタグのうち、前記検出した実体タグと所定の関係にあるモデルタグを検出するステップと、

前記所定の関係にある実体タグとモデルタグを対応づけてタグマッピングテーブルに記録するステップと、

、る実体タグの要素データを前記構造ィ匕文書ファイル力検出するステップと、

を備えることを特徴とする文書処理方法。

[14] 所定のタグセットに属する実体タグによって記述された構造ィ匕文書ファイルを取得する機能と、

前記構造ィ匕文書ファイルに含まれる実体タグを検出し、前記所定のタグセットとは異なるタグセットに属するモデルタグのうち、前記検出した実体タグと所定の関係にあるモデルタグを検出する機能と、

前記所定の関係にある実体タグとモデルタグを対応づけてタグマッピングテーブルに記録する機能と、

、る実体タグの要素データを前記構造ィ匕文書ファイルから検出する機能と、

をコンピュータに発揮させることを特徴とする文書管理プログラム。