JPWO2006085455A1

JPWO2006085455A1 - 文書処理装置および文書処理方法

Info

Publication number: JPWO2006085455A1
Application number: JP2007502566A
Authority: JP
Inventors: 淳高藤
Original assignee: 株式会社ジャストシステム
Priority date: 2005-02-14
Filing date: 2006-02-01
Publication date: 2008-06-26
Also published as: WO2006085455A1; US20090019064A1

Abstract

文書ファイルによる知識伝達を効率化する。文書処理装置は、ソースファイルを取得し、ソースファイルに含まれるテキストデータを所定基準に基づいてコンテキストごとに分類する。こうしてコンテキストに応じて抽出されたデータはデータベースに格納される。このコンテキストから、読み手のメンタルモデルに基づく閲覧ファイルが生成される。閲覧ファイルのコンテンツとなるべきデータや、そのレイアウトは読み手のユーザが任意に設定できる。

Description

この発明は、データ処理技術に関し、とくに、文書データを構造化して処理する技術に関する。

文書は、企業のＩＴ化、インターネットの発展と同期して増加の一途をたどっている。そして大量に生産される文書は、理解を共有し難くするという質の低下を招き、お互いに関連を持ちつつも広域に分散することで、統一的な管理や再利用が困難となっている。

増大する文書を効率的に管理するため、文書データベースや文書管理システムなどが開発され、利用されてきた。しかし、それらのシステムにおいては非定形情報である文書を文書オブジェクトとして全体的に管理するか、利用するためのスキームを予め文書属性という形で規定することで、体系的、形式的な管理を行うものである。そのため、ビジネス環境の変化に迅速に対応するための柔軟性に乏しい、文書検索などの精度が低い、文書の再利用性に欠ける、等の問題を有している。

本発明は、文書ファイルのデータを構造化して適切に処理する技術を提供することにある。

本発明のある態様の文書処理装置は、外部装置から文書ファイルを取得する文書取得部と、所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照して、取得された文書ファイルに含まれるデータから各コンテキストに応じたメタ情報を抽出するメタ情報抽出部と、各コンテキストに対応するメタ情報の集合がその取得された文書ファイルから抽出されたデータであることを示す関連情報を記憶する関連情報記憶部と、を備える。

本発明の別の態様もまた、文書処理装置である。
この装置は、閲覧の対象となる文書ファイルをソースファイルとして取得する文書取得部と、所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照し、各コンテキストに適合するコンテキストデータをソースファイルから抽出するコンテキスト解析部と、閲覧者によって指定される条件であって、閲覧対象となる１以上のコンテキストを特定すると共に各コンテキストに適合するコンテキストデータから新たに生成される文書ファイルの構造を定義するための閲覧条件を参照し、閲覧対象のコンテキストデータを構造化した文書ファイルとして閲覧ファイルを生成する文書生成部と、を備える。

この装置は、文の成分として文章の意味構造を構成する単位にてソースファイルから要素データを抽出する要素解析部を更に備えてもよい。コンテキスト解析部は、一群の要素データによって形成されるコンテキストに基づいて、１以上の要素データを含むコンテキストデータを抽出してもよい。

コンテキスト解析部は、文章中に設けられた項目を単位としてソースファイルからコンテキストデータを抽出してもよい。

このソースファイルには、表示のためのレイアウト情報が付与されていてもよい。そして、コンテキスト解析部は、レイアウト情報に示される表示上の構成単位にてソースファイルからコンテキストデータを抽出してもよい。

この装置は、閲覧対象となるコンテキストデータの表示方法を定義するための表示条件を参照して、閲覧ファイルの表示方法を特定する表示処理部を更に備えてもよい。

文書生成部は、複数種類のソースファイルから抽出されたコンテキストデータから、単一の閲覧ファイルを生成可能であってもよい。

本発明のさらに別の態様は、文書処理方法である。
この方法は、閲覧の対象となる文書ファイルをソースファイルとして取得するステップと、所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照し、各コンテキストに適合するコンテキストデータをソースファイルから抽出するステップと、閲覧者によって指定される条件であって、閲覧対象となる１以上のコンテキストを特定すると共に各コンテキストに適合するコンテキストデータから新たに生成される文書ファイルの構造を定義するための閲覧条件を参照し、閲覧対象のコンテキストデータを構造化した文書ファイルとして閲覧ファイルを生成するステップと、を備える。

なお、以上の構成要素の任意の組合せや、本発明の構成要素や表現を方法、装置、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体、データ構造などの間で相互に置換したものもまた、本発明の態様として有効である。

本発明によれば、文書ファイルのデータを構造化して適切に処理する技術を提供できる。

前提技術に係る文書処理装置の構成を示す図である。文書処理装置により編集されるＸＭＬ文書の例を示す図である。図２に示したＸＭＬ文書をＨＴＭＬで記述された表にマッピングする例を示す図である。図２に示したＸＭＬ文書を図３に示した表にマッピングするための定義ファイルの例を示す図である。図２に示したＸＭＬ文書を図３に示した表にマッピングするための定義ファイルの例を示す図である。図２に示したＸＭＬ文書を、図３に示した対応によりＨＴＭＬにマッピングして表示した画面の例を示す図である。ユーザが定義ファイルを生成するために、定義ファイル生成部がユーザに提示するグラフィカルユーザインターフェースの例を示す図である。定義ファイル生成部により生成された画面レイアウトの他の例を示す図である。文書処理装置によるＸＭＬ文書の編集画面の一例を示す図である。文書処理装置により編集されるＸＭＬ文書の他の例を示す図である。図９に示した文書を表示した画面の例を示す図である。文書処理システムの基本構成を示す図である。文書処理システム全体のブロック図を示す図である。文書処理システム全体のブロック図を示す図である。文書管理部の詳細を示す図である。ボキャブラリコネクションサブシステムの詳細を示す図である。プログラム起動部と他の構成の関係の詳細を示す図である。プログラム起動部によりロードされたアプリケーションサービスの構造の詳細を示す図である。コアコンポーネントの詳細を示す図である。文書管理部の詳細を示す図である。アンドゥフレームワークとアンドゥコマンドの詳細を示す図である。文書処理システムにおいて文書がロードされる様子を示す図である。文書とその表現の例を示す図である。モデルとコントローラの関係を示す図である。プラグインサブシステム、ボキャブラリコネクション、及びコネクタの詳細を示す図である。ＶＣＤファイルの例を示す図である。文書処理システムにおいて複合文書をロードする手順を示す図である。文書処理システムにおいて複合文書をロードする手順を示す図である。文書処理システムにおいて複合文書をロードする手順を示す図である。文書処理システムにおいて複合文書をロードする手順を示す図である。文書処理システムにおいて複合文書をロードする手順を示す図である。コマンドの流れを示す図である。文書の情報構造を示す図である。メタ情報の抽出と区分についての態様を示す模式図である。メタ情報とコンテキストレイヤの関係を示す模式図である。読み手のメンタルモデルに基づく文書生成の態様を示す模式図である。本システムが提供するフレームワークの概念図を次に示す。文書とコンテキストの関係を説明するための模式図である。ソースファイルから閲覧ファイルを生成する原理を説明するための模式図である。本実施例における文書処理装置の機能ブロック図である。閲覧ファイルの構成を設定するための画面図である。

符号の説明

２０文書処理装置、２２主制御ユニット、２４編集ユニット、３０ＤＯＭユニット、３２ＤＯＭ提供部、３４ＤＯＭ生成部、３６出力部、４０ＣＳＳユニット、４２ＣＳＳ解析部、４４ＣＳＳ提供部、４６レンダリング部、５０ＨＴＭＬユニット、５２，６２制御部、５４，６４編集部、５６，６６表示部、６０ＳＶＧユニット、８０ＶＣユニット、８２マッピング部、８４定義ファイル取得部、８６定義ファイル生成部、３０００文書空間、３０１０ソースファイル、３０６０閲覧ファイル、３１００文書処理装置、３１２０文書取得部、３１４０解析部、３１６０要素解析部、３１８０コンテキスト解析部、３２００データ保持部、３２２０条件設定部。

本発明の前提技術：
図１は、前提技術に係る文書処理装置２０の構成を示す。文書処理装置２０は、文書内のデータが階層構造を有する複数の構成要素に分類された構造化文書を処理するが、本前提技術では構造化文書の一例としてＸＭＬ文書を処理する例について説明する。文書処理装置２０は、主制御ユニット２２、編集ユニット２４、ＤＯＭユニット３０、ＣＳＳユニット４０、ＨＴＭＬユニット５０、ＳＶＧユニット６０、及び変換部の一例であるＶＣユニット８０を備える。これらの構成は、ハードウエアコンポーネントでいえば、任意のコンピュータのＣＰＵ、メモリ、メモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。

主制御ユニット２２は、プラグインのロードや、コマンド実行のフレームワークを提供する。編集ユニット２４は、ＸＭＬ文書を編集するためのフレームワークを提供する。文書処理装置２０における文書の表示及び編集機能は、プラグインにより実現されており、文書の種別に応じて必要なプラグインが主制御ユニット２２又は編集ユニット２４によりロードされる。主制御ユニット２２又は編集ユニット２４は、処理対象となるＸＭＬ文書の名前空間を参照して、ＸＭＬ文書がいずれのボキャブラリにより記述されているかを判別し、そのボキャブラリに対応した表示又は編集用のプラグインをロードして表示や編集を実行させる。例えば、文書処理装置２０には、ＨＴＭＬ文書の表示及び編集を行うＨＴＭＬユニット５０、ＳＶＧ文書の表示及び編集を行うＳＶＧユニット６０など、ボキャブラリ（タグセット）ごとに表示系及び編集系がプラグインとして実装されており、ＨＴＭＬ文書を編集するときはＨＴＭＬユニット５０が、ＳＶＧ文書を編集するときはＳＶＧユニット６０が、それぞれロードされる。後述するように、ＨＴＭＬとＳＶＧの双方の構成要素を含む複合文書が処理対象となっている場合は、ＨＴＭＬユニット５０とＳＶＧユニット６０の双方がロードされる。

このような構成によれば、ユーザは、必要な機能のみを選択してインストールし、後から適宜機能を追加又は削除することができるので、プログラムを格納するハードディスクなどの記録媒体の記憶領域を有効に活用することができ、また、プログラム実行時にも、メモリの浪費を防ぐことができる。また、機能拡張性に優れており、開発主体としても、プラグインの形で新たなボキャブラリに対応することが可能なので開発が容易となり、ユーザとしても、プラグインの追加により容易かつ低コストにて機能を追加することができる。

編集ユニット２４は、ユーザインターフェースを介してユーザから編集指示のイベントを受け付け、そのイベントを適切なプラグインなどに通知するともに、イベントの再実行（リドゥ）又は実行の取消（アンドゥ）などの処理を制御する。

ＤＯＭユニット３０は、ＤＯＭ提供部３２、ＤＯＭ生成部３４、及び出力部３６を含み、ＸＭＬ文書をデータとして扱うときのアクセス方法を提供するために定められた文書オブジェクトモデル（Document Object Model：ＤＯＭ）に準拠した機能を実現する。ＤＯＭ提供部３２は、編集ユニット２４に定義されているインタフェースを満たすＤＯＭの実装である。ＤＯＭ生成部３４は、ＸＭＬ文書からＤＯＭツリーを生成する。後述するように、処理対象となるＸＭＬ文書が、ＶＣユニット８０により他のボキャブラリにマッピングされる場合は、マッピング元のＸＭＬ文書に対応するソースツリーと、マッピング先のＸＭＬ文書に対応するデスティネーションツリーが生成される。出力部３６は、例えば編集終了時に、ＤＯＭツリーをＸＭＬ文書として出力する。

ＣＳＳユニット４０は、ＣＳＳ解析部４２、ＣＳＳ提供部４４、及びレンダリング部４６を含み、ＣＳＳに準拠した表示機能を提供する。ＣＳＳ解析部４２は、ＣＳＳの構文を解析するパーサの機能を有する。ＣＳＳ提供部４４は、ＣＳＳオブジェクトの実装であり、ＤＯＭツリーに対してＣＳＳのカスケード処理を行う。レンダリング部４６は、ＣＳＳのレンダリングエンジンであり、ＣＳＳを用いてレイアウトされるＨＴＭＬなどのボキャブラリで記述された文書の表示に用いられる。

ＨＴＭＬユニット５０は、ＨＴＭＬにより記述された文書を表示又は編集する。ＳＶＧユニット６０は、ＳＶＧにより記述された文書を表示又は編集する。これらの表示／編集系は、プラグインの形で実現されており、それぞれ、文書を表示する表示部（Canvas）５６、６６、編集指示を含むイベントを送受信する制御部（Editlet）５２、６２、編集コマンドを受けてＤＯＭに対して編集を行う編集部（Zone）５４、６４を備える。制御部５２又は６２が外部からＤＯＭツリーの編集コマンドを受け付けると、編集部５４又は６４がＤＯＭツリーを変更し、表示部５６又は６６が表示を更新する。これらは、ＭＶＣ（Model-View-Controller）と呼ばれるフレームワークに類似する構成をとっており、概ね、表示部５６及び６６が「View」に、制御部５２及び６２が「Controller」に、編集部５４及び６４とＤＯＭの実体が「Model」に、それぞれ対応する。本前提技術の文書処理装置２０では、ＸＭＬ文書をツリー表示形式で編集するだけでなく、それぞれのボキャブラリに応じた編集を可能とする。例えば、ＨＴＭＬユニット５０は、ＨＴＭＬ文書をワードプロセッサに類似した方式で編集するためのユーザインターフェースを提供し、ＳＶＧユニット６０は、ＳＶＧ文書を画像描画ツールに類似した方式で編集するためのユーザインターフェースを提供する。

ＶＣユニット８０は、マッピング部８２、定義ファイル取得部８４、及び定義ファイル生成部８６を含み、あるボキャブラリにより記述された文書を、他のボキャブラリにマッピングすることにより、マッピング先のボキャブラリに対応した表示編集用プラグインで文書を表示又は編集するためのフレームワークを提供する。本前提技術では、この機能を、ボキャブラリコネクション（Vocabulary Connection：ＶＣ）と呼ぶ。定義ファイル取得部８４は、マッピングの定義を記述したスクリプトファイルを取得する。この定義ファイルは、ノードごとに、ノード間の対応（コネクション）を記述する。このとき、各ノードの要素値や属性値の編集の可否を指定してもよい。また、ノードの要素値や属性値を用いた演算式を記述してもよい。これらの機能については、後で詳述する。マッピング部８２は、定義ファイル取得部８４が取得したスクリプトファイルを参照して、ＤＯＭ生成部３４にデスティネーションツリーを生成させ、ソースツリーとデスティネーションツリーの対応関係を管理する。定義ファイル生成部８６は、ユーザが定義ファイルを生成するためのグラフィカルユーザインターフェースを提供する。

ＶＣユニット８０は、ソースツリーとデスティネーションツリーの間のコネクションを監視し、表示を担当するプラグインにより提供されるユーザインタフェースを介してユーザから編集指示を受け付けると、まずソースツリーの該当するノードを変更する。ＤＯＭユニット３０が、ソースツリーが変更された旨のミューテーションイベントを発行すると、ＶＣユニット８０は、そのミューテーションイベントを受けて、ソースツリーの変更にデスティネーションツリーを同期させるべく、変更されたノードに対応するデスティネーションツリーのノードを変更する。デスティネーションツリーを表示／編集するプラグイン、例えばＨＴＭＬユニット５０は、デスティネーションツリーが変更された旨のミューテーションイベントを受けて、変更されたデスティネーションツリーを参照して表示を更新する。このような構成により、少数のユーザにより利用されるローカルなボキャブラリにより記述された文書であっても、他のメジャーなボキャブラリに変換することで、文書を表示することができるとともに、編集環境が提供される。

文書処理装置２０により文書を表示又は編集する動作について説明する。文書処理装置２０が処理対象となる文書を読み込むと、ＤＯＭ生成部３４が、そのＸＭＬ文書からＤＯＭツリーを生成する。また、主制御ユニット２２又は編集ユニット２４は、名前空間を参照して文書を記述しているボキャブラリを判別する。そのボキャブラリに対応したプラグインが文書処理装置２０にインストールされている場合は、そのプラグインをロードして、文書を表示／編集させる。プラグインがインストールされていない場合は、マッピングの定義ファイルが存在するか否かを確認する。定義ファイルが存在する場合、定義ファイル取得部８４が定義ファイルを取得し、その定義に従って、デスティネーションツリーが生成され、マッピング先のボキャブラリに対応するプラグインにより文書が表示／編集される。複数のボキャブラリを含む複合文書である場合は、後述するように、それぞれのボキャブラリに対応したプラグインにより、文書の該当箇所がそれぞれ表示／編集される。定義ファイルが存在しない場合は、文書のソース又はツリー構造を表示し、その表示画面において編集が行われる。

図２は、処理対象となるＸＭＬ文書の例を示す。このＸＭＬ文書は、生徒の成績データを管理するために用いられる。ＸＭＬ文書のトップノードである構成要素「成績」は、配下に、生徒ごとに設けられた構成要素「生徒」を複数有する。構成要素「生徒」は、属性値「名前」と、子要素「国語」、「数学」、「理科」、「社会」を有する。属性値「名前」は、生徒の名前を格納する。構成要素「国語」、「数学」、「理科」、「社会」は、それぞれ、国語、数学、理科、社会の成績を格納する。例えば、名前が「Ａ」である生徒の国語の成績は「９０」、数学の成績は「５０」、理科の成績は「７５」、社会の成績は「６０」である。以下、この文書で使用されているボキャブラリ（タグセット）を、「成績管理ボキャブラリ」と呼ぶ。

本前提技術の文書処理装置２０は、成績管理ボキャブラリの表示／編集に対応したプラグインを有しないので、この文書をソース表示、ツリー表示以外の方法で表示するためには、前述したＶＣ機能が用いられる。すなわち、成績管理ボキャブラリを、プラグインが用意された別のボキャブラリ、例えば、ＨＴＭＬやＳＶＧなどにマッピングするための定義ファイルを用意する必要がある。ユーザ自身が定義ファイルを作成するためのユーザインターフェースについては後述することにして、ここでは、既に定義ファイルが用意されているとして説明を進める。

図３は、図２に示したＸＭＬ文書をＨＴＭＬで記述された表にマッピングする例を示す。図３の例では、成績管理ボキャブラリの「生徒」ノードを、ＨＴＭＬにおける表（「TABLE」ノード）の行（「TR」ノード）に対応づけ、各行の第１列には属性値「名前」を、第２列には「国語」ノードの要素値を、第３列には「数学」ノードの要素値を、第４列には「理科」ノードの要素値を、第５列には「社会」ノードの要素値を、それぞれ対応付ける。これにより、図２に示したＸＭＬ文書を、ＨＴＭＬの表形式で表示することができる。また、これらの属性値及び要素値は、編集可能であることが指定されており、ユーザがＨＴＭＬによる表示画面上で、ＨＴＭＬユニット５０の編集機能により、これらの値を編集することができる。第６列には、国語、数学、理科、社会の成績の加重平均を算出する演算式が指定されており、生徒の成績の平均点が表示される。このように、定義ファイルに演算式を指定可能とすることにより、より柔軟な表示が可能となり、編集時のユーザの利便性を向上させることができる。なお、第６列は、編集不可であることが指定されており、平均点のみを個別に編集することができないようにしている。このように、マッピング定義において、編集の可否を指定可能とすることにより、ユーザの誤操作を防ぐことができる。

図４（ａ）及び図４（ｂ）は、図２に示したＸＭＬ文書を図３に示した表にマッピングするための定義ファイルの例を示す。この定義ファイルは、定義ファイル用に定義されたスクリプト言語により記述される。定義ファイルには、コマンドの定義と、表示のテンプレートが記述されている。図４（ａ）（ｂ）の例では、コマンドとして、「生徒の追加」と「生徒の削除」が定義されており、それぞれ、ソースツリーにノード「生徒」を挿入する操作と、ソースツリーからノード「生徒」を削除する操作が対応付けられている。また、テンプレートとして、表の第１行に「名前」、「国語」などの見出しが表示され、第２行以降に、ノード「生徒」の内容が表示されることが記述されている。ノード「生徒」の内容を表示するテンプレート中、「text-of」と記述された項は「編集可能」であることを意味し、「value-of」と記述された項は「編集不可能」であることを意味する。また、ノード「生徒」の内容を表示する行のうち、第６列には、「(src:国語 + src:数学 + src:理科 + src:社会) div 4」という計算式が記述されており、生徒の成績の平均が表示されることを意味する。

図５は、図２に示した成績管理ボキャブラリで記述されたＸＭＬ文書を、図３に示した対応によりＨＴＭＬにマッピングして表示した画面の例を示す。表９０の各行には、左から、各生徒の名前、国語の成績、数学の成績、理科の成績、社会の成績、及び平均点が表示されている。ユーザは、この画面上で、ＸＭＬ文書を編集することができる。たとえば、第２行第３列の値を「７０」に変更すると、このノードに対応するソースツリーの要素値、すなわち、生徒「Ｂ」の数学の成績が「７０」に変更される。このとき、ＶＣユニット８０は、デスティネーションツリーをソースツリーに追従させるべく、デスティネーションツリーの該当箇所を変更し、ＨＴＭＬユニット５０が、変更されたデスティネーションツリーに基づいて表示を更新する。したがって、画面上の表においても、生徒「Ｂ」の数学の成績が「７０」に変更され、更に、平均点が「５５」に変更される。

図５に示した画面には、図４（ａ）（ｂ）に示した定義ファイルに定義されたように、「生徒の追加」及び「生徒の削除」のコマンドがメニューに表示される。ユーザがこれらのコマンドを選択すると、ソースツリーにおいて、ノード「生徒」が追加又は削除される。このように、本前提技術の文書処理装置２０では、階層構造の末端の構成要素の要素値を編集するのみではなく、階層構造を編集することも可能である。このようなツリー構造の編集機能は、コマンドの形でユーザに提供されてもよい。また、例えば、表の行を追加又は削除するコマンドが、ノード「生徒」を追加又は削除する操作に対応づけられてもよい。また、他のボキャブラリを埋め込むコマンドがユーザに提供されてもよい。この表を入力用テンプレートとして、穴埋め形式で新たな生徒の成績データを追加することもできる。以上のように、ＶＣ機能により、ＨＴＭＬユニット５０の表示／編集機能を利用しつつ、成績管理ボキャブラリで記述された文書を編集することが可能となる。

図６は、ユーザが定義ファイルを生成するために、定義ファイル生成部８６がユーザに提示するグラフィカルユーザインタフェースの例を示す。画面左側の領域９１には、マッピング元のＸＭＬ文書がツリー表示されている。画面右側の領域９２には、マッピング先のＸＭＬ文書の画面レイアウトが示されている。この画面レイアウトは、ＨＴＭＬユニット５０により編集可能となっており、ユーザは、画面右側の領域９２において、文書を表示するための画面レイアウトを作成する。そして、例えば、マウスなどのポインティングデバイスにより、画面左側の領域９１に表示されたマッピング元のＸＭＬ文書のノードを、画面右側の領域９２に表示されたＨＴＭＬによる画面レイアウト中へドラッグ＆ドロップ操作を行うことにより、マッピング元のノードと、マッピング先のノードとのコネクションが指定される。例えば、要素「生徒」の子要素である「数学」を、ＨＴＭＬ画面の表９０の第１行第３列にドロップすると、「数学」ノードと、３列目の「ＴＤ」ノードの間にコネクションが張られる。各ノードには、編集の可否が指定できるようになっている。また、表示画面中には、演算式を埋め込むこともできる。画面の編集が終わると、定義ファイル生成部８６は、画面レイアウトとノード間のコネクションを記述した定義ファイルを生成する。

ＸＨＴＭＬ、ＭａｔｈＭＬ、ＳＶＧなどの主要なボキャブラリに対応したビューワやエディタは既に開発されているが、図２に示した文書のようなオリジナルなボキャブラリで記述された文書に対応したビューワやエディタを開発するのは現実的でない。しかし、上記のように、他のボキャブラリにマッピングするための定義ファイルを作成すれば、ビューワやエディタを開発しなくても、ＶＣ機能を利用して、オリジナルなボキャブラリで記述された文書を表示・編集することができる。

図７は、定義ファイル生成部８６により生成された画面レイアウトの他の例を示す。図７の例では、成績管理ボキャブラリで記述されたＸＭＬ文書を表示するための画面に、表９０と、円グラフ９３が作成されている。この円グラフ９３は、ＳＶＧにより記述される。後述するように、本前提技術の文書処理装置２０は、一つのＸＭＬ文書内に複数のボキャブラリを含む複合文書を処理することができるので、この例のように、ＨＴＭＬで記述された表９０と、ＳＶＧで記述された円グラフ９３とを、一つの画面上に表示することができる。

図８は、文書処理装置２０によるＸＭＬ文書の編集画面の一例を示す。図８の例では、一つの画面が複数に分割されており、それぞれの領域において、処理対象となるＸＭＬ文書を異なる複数の表示形式により表示している。領域９４には、文書のソースが表示されており、領域９５には、文書のツリー構造が表示されており、領域９６には、図５に示したＨＴＭＬにより記述された表が表示されている。これらのいずれの画面上においても、文書の編集が可能であり、いずれかの画面上でユーザが編集を行うと、ソースツリーが変更され、それぞれの画面の表示を担当するプラグインが、ソースツリーの変更を反映すべく画面を更新する。具体的には、ソースツリーの変更を通知するミューテーションイベントのリスナーとして、それぞれの編集画面の表示を担当するプラグインの表示部を登録しておき、いずれかのプラグイン又はＶＣユニット８０によりソースツリーが変更されたときに、編集画面を表示中の全ての表示部が、発行されたミューテーションイベントを受け取って画面を更新する。このとき、プラグインがＶＣ機能により表示を行っている場合は、ＶＣユニット８０がソースツリーの変更に追従してデスティネーションツリーを変更した後、変更されたデスティネーションツリーを参照してプラグインの表示部が画面を更新する。

例えば、ソース表示及びツリー表示を、専用のプラグインにより実現している場合は、ソース表示用プラグインとツリー表示用プラグインは、デスティネーションツリーを用いず、直接ソースツリーを参照して表示を行う。この場合、いずれかの画面において編集が行われると、ソース表示用プラグインとツリー表示用プラグインは、変更されたソースツリーを参照して画面を更新し、領域９６の画面を担当しているＨＴＭＬユニット５０は、ソースツリーの変更に追従して変更されたデスティネーションツリーを参照して画面を更新する。

ソース表示及びツリー表示は、ＶＣ機能を利用して実現することもできる。すなわち、ソース、ツリー構造をＨＴＭＬによりレイアウトし、そのＨＴＭＬにＸＭＬ文書をマッピングして、ＨＴＭＬユニット５０により表示してもよい。この場合、ソース形式、ツリー形式、表形式の３つのデスティネーションツリーが生成されることになる。いずれかの画面において編集が行われると、ＶＣユニット８０は、ソースツリーを変更した後、ソース形式、ツリー形式、表形式の３つのデスティネーションツリーをそれぞれ変更し、ＨＴＭＬユニット５０は、それらのデスティネーションツリーを参照して、３つの画面を更新する。

このように、一つの画面上に複数の表示形式で文書を表示することにより、ユーザの利便性を向上させることができる。例えば、ユーザは、ソース表示又はツリー表示により文書の階層構造を把握しつつ、表９０などを用いて視覚的に分かりやすい形式で文書を表示し、編集することができる。上記の例では、一つの画面を分割して複数の表示形式による画面を同時に表示したが、一つの画面に一つの表示形式による画面を表示し、表示形式をユーザの指示により切り替え可能としてもよい。この場合、主制御ユニット２２が、ユーザから表示形式の切り替え要求を受け付け、各プラグインに指示して表示を切り替える。

図９は、文書処理装置２０により編集されるＸＭＬ文書の他の例を示す。図９に示したＸＭＬ文書では、ＳＶＧ文書の「foreignObject」タグの中にＸＨＴＭＬ文書が埋め込まれており、さらに、ＸＨＴＭＬ文書の中にＭａｔｈＭＬで記述された数式が入っている。このような場合、編集ユニット２４が、名前空間を参照して、適切な表示系に描画作業を振り分ける。図９の例では、編集ユニット２４は、まず、ＳＶＧユニット６０に四角形を描画させ、つづいて、ＨＴＭＬユニット５０にＸＨＴＭＬ文書を描画させる。さらに、図示しないＭａｔｈＭＬユニットに、数式を描画させる。こうして、複数のボキャブラリを包含する複合文書が適切に表示される。表示結果を図１０に示す。

文書編集中、カーソル（キャリッジ）の位置に応じて、表示されるメニューを切り替えてもよい。すなわち、カーソルが、ＳＶＧ文書が表示された領域内に存在するときは、ＳＶＧユニット６０が提供するメニュー、又はＳＶＧ文書をマッピングするための定義ファイルに定義されたコマンドを表示し、カーソルが、ＸＨＴＭＬ文書が表示された領域内に存在するときは、ＨＴＭＬユニット５０が提供するメニュー、又はＸＨＴＭＬ文書をマッピングするための定義ファイルに定義されたコマンドを表示する。これにより、編集位置に応じて適切なユーザインターフェースを提供することができる。

複合文書において、あるボキャブラリに対応する適切なプラグイン又はマッピング定義ファイルがなかった場合は、そのボキャブラリにより記述された部分は、ソース表示又はツリー表示されてもよい。従来、ある文書に他の文書を埋め込んだ複合文書を開くとき、埋め込まれた文書を表示するアプリケーションがインストールされていないと、その内容を表示することができなかったが、本前提技術では、表示用のアプリケーションが存在しなくても、テキストデータにより構成されたＸＭＬ文書をソース表示又はツリー表示することにより内容を把握することができる。これは、テキストベースであるＸＭＬなどの文書ならではの特徴といえる。

データがテキストベースで記述されることの他の利点として、例えば、複合文書中の、あるボキャブラリにより記述される部分において、同一文書内の他のボキャブラリで記述された部分のデータを参照してもよい。また、文書内で検索を実行する時に、ＳＶＧなどの図に埋め込まれた文字列も検索対象とすることができる。

あるボキャブラリにより記述された文書内に、他のボキャブラリのタグを用いてもよい。このＸＭＬ文書は、妥当（valid）ではないが、整形式（well-formed）であれば、有効なＸＭＬ文書として処理可能である。この場合、挿入された他のボキャブラリのタグは、定義ファイルによりマッピングされてもよい。例えば、ＸＨＴＭＬ文書中に、「重要」、「最重要」などのタグを使用し、これらのタグで囲まれた部分を強調表示してもよいし、重要度の順にソートして表示してもよい。

図１０に示した編集画面において、ユーザにより文書が編集されると、編集された部分を担当するプラグイン又はＶＣユニット８０がソースツリーを変更する。ソースツリーには、ノードごとにミューテーションイベントのリスナーを登録できるようになっており、通常は、各ノードが属するボキャブラリに対応したプラグインの表示部又はＶＣユニット８０がリスナーとして登録される。ＤＯＭ提供部３２は、ソースツリーが変更されると、変更されたノードから上位の階層へたどって、登録されたリスナーがあれば、そのリスナーへミューテーションイベントを発行する。例えば、図９に示した文書において、＜ｈｔｍｌ＞ノードの下位のノードが変更された場合、＜ｈｔｍｌ＞ノードにリスナーとして登録されたＨＴＭＬユニット５０にミューテーションイベントが通知されるとともに、その上位の＜ｓｖｇ＞ノードにリスナーとして登録されたＳＶＧユニット６０にもミューテーションイベントが通知される。このとき、ＨＴＭＬユニット５０は、変更されたソースツリーを参照して表示を更新する。ＳＶＧユニット６０は、自身のボキャブラリに属するノードが変更されていないので、ミューテーションイベントを無視してもよい。

編集の内容によっては、ＨＴＭＬユニット５０による表示の更新に伴って、全体のレイアウトが変わる可能性がある。この場合は、画面のレイアウトを管理する構成、例えば最上位のノードの表示を担当するプラグインにより、プラグインごとの表示領域のレイアウトが更新される。例えば、ＨＴＭＬユニット５０による表示領域が以前より大きくなった場合、ＨＴＭＬユニット５０は、まず自身の担当する部分を描画して、表示領域の大きさを決定する。そして、画面のレイアウトを管理する構成に、変更後の表示領域の大きさを通知し、レイアウトの更新を依頼する。画面のレイアウトを管理する構成は、通知を受けて、プラグインごとの表示領域を再レイアウトする。こうして、編集された部分の表示が適切に更新されるとともに、画面全体のレイアウトが更新される。

つづいて、前提技術の文書処理装置２０を実現する機能構成について更に詳細に説明する。以下の説明では、クラス名などを記載する際には、英字をそのまま用いて記載することにする。

Ａ．概要
インターネットの出現により、ユーザによって処理され管理される文書の数が、ほぼ指数関数的に増加してきた。インターネットの核を形成するウェブ（World Wide Web）は、そのような文書データの大きな受け皿となっている。ウェブは、文書に加えて、このような文書の情報検索システムを提供する。これらの文書は、通常、マークアップ言語により記述される。マークアップ言語のシンプルかつポピュラーな例の一つにＨＴＭＬ（HyperText Markup Language）がある。このような文書は、ウェブの他の位置に格納されている他の文書へのリンクをさらに含む。ＸＭＬ（eXtensible Markup Language）は、さらに高度でポピュラーなマークアップ言語である。ウェブ文書にアクセスし、閲覧するためのシンプルなブラウザが、Ｊａｖａ（登録商標）のようなオブジェクト指向のプログラミング言語で開発されている。

マークアップ言語により記述された文書は、通常、ブラウザや他のアプリケーションの中では、ツリーデータ構造の形で表現される。この構造は、文書を構文解析した結果のツリーに相当する。ＤＯＭ（Document Object Model）は、文書を表現し、操作するために使用される、よく知られたツリーベースのデータ構造モデルである。ＤＯＭは、ＨＴＭＬやＸＭＬ文書などを含む文書を表現するための標準的なオブジェクトのセットを提供する。ＤＯＭは、文書内のコンポーネントを表現するオブジェクトがどのようにつながっているかという標準モデルと、それらのオブジェクトにアクセスしたり操作したりするための標準インタフェイスという、２つの基本的なコンポーネントを含む。

アプリケーション開発者は、独自のデータ構造やＡＰＩ（Application Program Interface）へのインタフェイスとしてＤＯＭをサポートすることができる。他方、文書を作成するアプリケーション開発者は、彼らのＡＰＩの独自インタフェイスではなく、ＤＯＭの標準インタフェイスを使用することができる。したがって、標準を提供するというその能力により、ＤＯＭは、様々な環境、特にウェブにおいて、文書の相互利用を促進させるために有効である。ＤＯＭのいくつかのバージョンが定義されており、異なるプログラミング環境及びアプリケーションによって使用されている。

ＤＯＭツリーは、対応するＤＯＭの内容に基づいた文書の階層的表現である。ＤＯＭツリーは「根（ルート）」、及びルートから発生する１つ以上の「節（ノード）」を含む。ルートが文書全体を表す場合もある。中間のノードは、例えば、テーブル及びそのテーブル中の行及び列のような要素を表すことができる。ＤＯＭツリーの「葉」は、通常、それ以上分解できないテキストや画像のようなデータを表す。ＤＯＭツリーの各ノードは、フォント、サイズ、色、インデントなど、ノードによって表される要素のパラメータを記述する属性に関連付けられてもよい。

ＨＴＭＬは、文書を作成するために一般に用いられる言語であるが、フォーマット及びレイアウト用の言語であり、データ記述のための言語ではない。ＨＴＭＬドキュメントを表現するＤＯＭツリーのノードは、ＨＴＭＬのフォーマッティングタグとして予め定義されたエレメントであって、通常、ＨＴＭＬは、データの詳述や、データのタギング／ラベリングのための機能を提供しないので、ＨＴＭＬドキュメント中のデータに対するクエリを定式化することは多くの場合困難である。

ネットワーク設計者たちの目指すものは、ウェブ上の文書がソフトウェアアプリケーションによってクエリされたり処理されたりできるようにすることである。表示方法とは無関係で、階層的に構造化された言語であれば、そのようにクエリされ処理されることができる。ＸＭＬ（eXtensible Markup Language）のようなマークアップ言語は、これらの特徴を提供することができる。

ＨＴＭＬとは逆に、ＸＭＬのよく知られた利点は、文書の設計者が自由に定義可能な「タグ」を使用して、データ要素にラベルを付けることが可能である点である。このようなデータ要素は、階層的に構造化することができる。さらに、ＸＭＬ文書は、文書内で用いられるタグ及びそれらの相互関係の「文法」を記述した文書型定義を含むことができる。構造化されたＸＭＬ文書の表示方法を定義するために、ＣＳＳ（Cascading Style Sheet）又はＸＳＬ（XML Style Language）が使用される。ＤＯＭ、ＨＴＭＬ、ＸＭＬ、ＣＳＳ、ＸＳＬ及び関連する言語の特徴に関する付加的な情報は、ウェブからも得ることができる。（例えば、http://www.w3.org/TR/）

Ｘｐａｔｈは、ＸＭＬ文書の部分の位置を指定するために共通のシンタックス及びセマンティクスを提供する。機能性の例として、ＸＭＬ文書に対応するＤＯＭツリーのトラバース（移動）がある。それは、ＸＭＬ文書の様々な表現に関連した文字列、数、及びブーリアン文字の操作のための基本的な機能を提供する。Ｘｐａｔｈは、ＸＭＬ文書の見た目のシンタックス、例えば、テキストとしてみたときに何行目であるとか何文字目であるとかといった文法ではなく、ＤＯＭツリーなどの抽象的・論理的な構造において動作する。Ｘｐａｔｈを使用することにより、例えばＸＭＬ文書のＤＯＭツリー内の階層的構造を通じて場所を指定することができる。アドレシングのための使用の他に、Ｘｐａｔｈは、ＤＯＭツリー中のノードがパターンにマッチするか否かをテストするために使用されるようにも設計されている。ＸＰａｔｈに関する更なる詳細は、http://www.w3.org/TR/xpathで得ることができる。

ＸＭＬの既知の利点及び特徴により、マークアップ言語（例えばＸＭＬ）で記述された文書を扱うことができ、文書を作成及び修正するためのユーザフレンドリーなインタフェイスを提供することができる、効果的な文書処理システムが求められる。

ここで説明されるシステムの構成のうちのいくつかは、ＭＶＣ（Model-View-Controller）と呼ばれる、よく知られたＧＵＩ（Graphical User Interface）パラダイムを用いて説明される。ＭＶＣパラダイムは、アプリケーション又はアプリケーションのインタフェイスの一部を、３つの部分、すなわち、モデル、ビュー、コントローラに分割する。ＭＶＣは、元は、ＧＵＩの世界に、従来の入力、処理、出力の役割を割り当てるために開発された。
［入力］ → ［処理］ → ［出力］
［コントローラ］→ ［モデル］ → ［ビュー］

ＭＶＣパラダイムによれば、外界のモデリング、ユーザへの視覚的なフィードバック、及びユーザの入力は、モデル（Ｍ）、ビュー（Ｖ）、及びコントローラ（Ｃ）オブジェクトにより分離されて扱われる。コントローラは、ユーザからのマウスとキーボード入力のような入力を解釈し、これらのユーザアクションを、適切な変更をもたらすためにモデル及び／又はビューに送られるコマンドにマップするように作用する。モデルは、１以上のデータ要素を管理するように作用し、その状態に関するクエリに応答し、状態を変更する指示に応答する。ビューは、ディスプレイの長方形の領域を管理するように作用し、グラフィクスとテキストの組合せによりユーザにデータを提示する機能を有する。

Ｂ．文書処理システムの全体構成
文書処理システムの実施例は、図１１−２９に関連して明らかにされる。

図１１（ａ）は、後述するタイプの文書処理システムの基礎として機能する要素の従来の構成例を示す。構成１０は、通信経路１３によりメモリ１２に接続されたＣＰＵ又はマイクロプロセッサ１１などの形式のプロセッサを含む。メモリ１２は、現在又は将来に利用可能な任意のＲＯＭ及び／又はＲＡＭの形式であってもよい。通信経路１３は、典型的にはバスとして設けられる。マウス、キーボード、音声認識システムなどのユーザ入力装置１４及び表示装置１５（又は他のユーザインタフェイス）に対する入出力インタフェイス１６も、プロセッサ１１とメモリ１２の通信のためのバスに接続される。この構成は、スタンドアロンであってもよいし、複数の端末及び１以上のサーバが接続されてネットワーク化された形式であってもよいし、既知のいかなる方式により構成されてもよい。本発明は、これらのコンポーネントの配置、集中又は分散されたアーキテクチャー、あるいは様々なコンポーネントの通信方法により制限されない。

さらに、本システム及びここで議論される実施例は、様々な機能性を提供するいくつかのコンポーネント及びサブコンポーネントを含むものとして議論される。これらのコンポーネント及びサブコンポーネントは、注目された機能性を提供するために、ハードウェアとソフトウェアの組合せだけでなく、ハードウェアのみ、ソフトウェアのみによっても実現されうる。さらに、ハードウェア、ソフトウェア、及びそれらの組合せは、汎用の計算装置、専用のハードウェア、又はそれらの組合せにより実現されうる。したがって、コンポーネント又はサブコンポーネントの構成は、コンポーネント又はサブコンポーネントの機能性を提供するための特定のソフトウェアを実行する汎用／専用の計算装置を含む。

図１１（ｂ）は、文書処理システムの一例の全体のブロック図を示す。このような文書処理システムにおいて文書が生成され編集される。これらの文書は、例えばＸＭＬなど、マークアップ言語の特徴を有する任意の言語により記述されてもよい。また、便宜上、特定のコンポーネント及びサブコンポーネントの用語及び表題を創造した。しかしながら、これらは、この開示の一般的な教示の範囲を制限するために解釈されるべきではない。

文書処理システムは、２つの基本的な構成を有するものととらえることができる。第１の構成は、文書処理システムが動作する環境である「実行環境」１０１である。例えば、実行環境は、文書の処理中及び管理中に、ユーザだけでなくシステムも支援する、基本的なユーティリティ及び機能を提供する。第２の構成は、実行環境において走るアプリケーションから構成される「アプリケーション」１０２である。これらのアプリケーションは、文書自身及び文書の様々な表現を含む。

１．実行環境
実行環境１０１のキーとなるコンポーネントはProgramInvoker（プログラムインボーカ：プログラム起動部）１０３である。ProgramInvoker１０３は、文書処理システムを起動するためにアクセスされる基本的なプログラムである。例えば、ユーザが文書処理システムにログオンして開始するとき、ProgramInvoker１０３が実行される。ProgramInvoker１０３は、例えば、文書処理システムにプラグインとして加えられた機能を読み出して実行させたり、アプリケーションを開始して実行させたり、文書に関連するプロパティを読み出すことができる。ProgramInvoker１０３の機能はこれらに限定されない。ユーザが実行環境内で実行されるように意図されたアプリケーションを起動したいとき、ProgramInvoker１０３は、そのアプリケーションを見つけ、それを起動して、アプリケーションを実行する。

ProgramInvoker１０３には、プラグインサブシステム１０４、コマンドサブシステム１０５、及びResource（リソース）モジュール１０９などのいくつかのコンポーネントがアタッチされている。これらの構成については、以下に詳述する。

ａ）プラグインサブシステム
プラグインサブシステム１０４は、文書処理システムに機能を追加するための高度に柔軟で効率的な構成として使用される。プラグインサブシステム１０４は、また、文書処理システムに存在する機能を修正又は削除するために使用することができる。さらに、種々様々の機能をプラグインサブシステムを使用して追加又は修正することができる。例えば、画面上への文書の描画を支援するように作用するEditlet（エディットレット：編集部）機能を追加することもできる。Editletプラグインは、システムに追加されるボキャブラリの編集も支援する。

プラグインサブシステム１０４は、ServiceBroker（サービスブローカ：サービス仲介部）１０４１を含む。ServiceBroker１０４１は、文書処理システムに加えられるプラグインを管理することにより、文書処理システムに加えられるサービスを仲介する。

所望の機能性を実現する個々の機能は、Service（サービス）１０４２の形でシステムに追加される。利用可能なService１０４２のタイプは、Application（アプリケーション）サービス、ZoneFactory（ゾーンファクトリ：ゾーン生成部）Service、Editlet（エディットレット：編集部）Service、CommandFactory（コマンドファクトリ：コマンド生成部）Service、ConnectXPath（コネクトＸＰａｔｈ：ＸＰａｔｈ管理部）Service、CSSComputation（ＣＳＳコンピューテーション：ＣＳＳ計算部）Serviceなどを含むが、これらに限定されない。これらのService、及びシステムの他の構成とそれらとの関係は、文書処理システムについてのよりよい理解のために、以下に詳述される。

プラグインとServiceの関係は以下の通りである。プラグインは、１以上のServiceProvider（サービスプロバイダ：サービス提供部）を含むことができるユニットである。それぞれのServiceProviderは、それに関連したServiceの１以上のクラスを有する。例えば、適切なソフトウェアアプリケーションを有する単一のプラグインを使用することにより、１以上のServiceをシステムに追加することができ、これにより、対応する機能をシステムに追加することができる。

ｂ）コマンドサブシステム
コマンドサブシステム１０５は、文書の処理に関連したコマンドの形式の命令を実行するために使用される。ユーザは、一連の命令を実行することにより、文書に対する操作を実行することができる。例えば、ユーザは、コマンドの形で命令を発行することにより、文書処理システム中のＸＭＬ文書に対応するＸＭＬのＤＯＭツリーを編集し、ＸＭＬ文書を処理する。これらのコマンドは、キーストローク、マウスクリック、又は他の有効なユーザインタフェイスアクションを使用して入力されてもよい。１つのコマンドにより１以上の命令が実行されることもある。この場合、これらの命令が１つのコマンドにラップ（包含）され、連続して実行される。例えば、ユーザが、誤った単語を正しい単語に置換したいとする。この場合、第１の命令は、文書中の誤った単語を発見することであり、第２の命令は、誤った単語を削除することであり、第３の命令は、正しい単語を挿入することであってもよい。これらの３つの命令が１つのコマンドにラップされてもよい。

コマンドは、関連した機能、例えば、後で詳述する「アンドゥ」機能を有してもよい。これらの機能は、オブジェクトを生成するために使用されるいくつかの基本クラスにも割り当てられてもよい。

コマンドサブシステム１０５のキーとなるコンポーネントは、選択的にコマンドを与え、実行するように作用するCommandInvoker（コマンドインボーカ：コマンド起動部）１０５１である。図１１（ｂ）には、１つのCommandInvokerのみが示されているが、１以上のCommandInvokerが使用されてもよく、１以上のコマンドが同時に実行されてもよい。CommandInvoker１０５１は、コマンドを実行するために必要な機能及びクラスを保持する。動作において、実行されるべきCommand（コマンド：命令）１０５２は、Queue（キュー）１０５３に積まれる。CommandInvokerは、連続的に実行するコマンドスレッドを生成する。CommandInvoker内で既に実行中のCommandがなければ、CommandInvoker１０５１により実行されるように意図されたCommand１０５２が実行される。CommandInvokerが既にコマンドを実行している場合、新しいCommandは、Queue１０５３の最後に積まれる。しかしながら、それぞれのCommandInvoker１０５１では、一度に１つのCommandのみが実行される。指定されたCommandの実行に失敗した場合、CommandInvoker１０５１は例外処理を実行する。

CommandInvoker１０５１により実行されるCommandの型は、UndoableCommand（取消可能コマンド）１０５４、AsynchronousCommand（非同期コマンド）１０５５、及びVCCommand（ＶＣコマンド）１０５６を含むが、これらに限定されない。UndoableCommand１０５４は、ユーザが望めば、そのCommandの結果を取り消すことが可能なCommandである。UndoableCommandの例として、切り取り、コピー、テキストの挿入、などがある。動作において、ユーザが文書の一部を選択し、その部分に切り取りコマンドを適用するとき、UndoableCommandを用いることにより、切り取られた部分は、必要であれば、「切り取られていない」ようにすることができる。

VCCommand１０５６は、ボキャブラリコネクション記述子（Vocabulary Connection Descriptor：ＶＣＤ）スクリプトファイルに格納される。これらは、プログラマにより定義されうるユーザ指定のCommandである。Commandは、例えば、ＸＭＬフラグメントを追加したり、ＸＭＬフラグメントを削除したり、属性を設定したりするための、より抽象的なCommandの組合せであってもよい。これらのCommandは、特に、文書の編集に焦点を合わせている。

AsynchronousCommand１０５５は、文書のロードや保存など、システムよりのCommandであり、UndoableCommandやVCCommandとは別に、非同期的に実行される。AsynchronousCommandは、UndoableCommandではないので、取り消すことはできない。

ｃ）リソース
Resource１０９は、様々なクラスに、いくつかの機能を提供するオブジェクトである。例えば、ストリングリソース、アイコン、及びデフォルトキーバインドは、システムで使用されるResourceの例である。

２．アプリケーションコンポーネント
文書処理システムの第２の主要な特徴であるアプリケーションコンポーネント１０２は、実行環境１０１において実行される。アプリケーションコンポーネント１０２は、実際の文書と、システム内における文書の様々な論理的、物理的な表現を含む。さらに、アプリケーションコンポーネント１０２は、文書を管理するために使用されるシステムの構成を含む。アプリケーションコンポーネント１０２は、さらに、UserApplication（ユーザアプリケーション）１０６、アプリケーションコア１０８、ユーザインタフェイス１０７、及びCoreComponent（コアコンポーネント）１１０を含む。

ａ）ユーザアプリケーション
UserApplication１０６は、ProgramInvoker１０３と共にシステム上にロードされる。UserApplication１０６は、文書と、文書の様々な表現と、文書と対話するために必要なユーザインタフェイスとをつなぐ接着剤となる。例えば、ユーザが、プロジェクトの一部である文書のセットを生成したいとする。これらの文書がロードされると、文書の適切な表現が生成される。ユーザインタフェイス機能は、UserApplication１０６の一部として追加される。言いかえれば、UserApplication１０６は、ユーザがプロジェクトの一部を形成する文書と対話することを可能とする文書の表現と、文書の様々な態様とを、共に保持する。一旦UserApplication１０６が生成されると、ユーザがプロジェクトの一部を形成する文書との対話を望むたびに、ユーザは簡単に実行環境上にUserApplication１０６をロードすることができる。

ｂ）コアコンポーネント
CoreComponent１１０は、複数のPane（ペイン）の間で文書を共有する方法を提供する。後で詳述するように、Paneは、ＤＯＭツリーを表示し、画面の物理的なレイアウトを扱う。例えば、物理的な画面は、個々の情報の断片を描写する画面内の複数のPaneからなる。ユーザから画面上に見える文書は、１又はそれ以上のPaneに出現しうる。また、２つの異なる文書が画面上で２つの異なるPaneに現れてもよい。

図１１（ｃ）に示されるように、画面の物理的なレイアウトもツリーの形式になっている。Paneは、RootPane（ルートペイン）１０８４にもなり得るし、SubPane（サブペイン）１０８５にもなり得る。RootPane１０８４は、Paneのツリーの根に当たるPaneであり、SubPane１０８５は、RootPane１０８４以外の任意のPaneである。

CoreComponent１１０は、さらに、フォントを提供し、ツールキットなど、文書のための複数の機能的な操作のソースの役割を果たす。CoreComponent１１０により実行されるタスクの一例に、複数のPane間におけるマウスカーソルの移動がある。実行されるタスクの他の例として、あるPane中の文書の一部をマークし、それを異なる文書を含む別のPane上にコピーする。

ｃ）アプリケーションコア
上述したように、アプリケーションコンポーネント１０２は、システムにより処理され管理される文書から構成される。これは、システム内における文書の様々な論理的及び物理的な表現を含む。アプリケーションコア１０８は、アプリケーションコンポーネント１０２の構成である。その機能は、実際の文書を、それに含まれる全てのデータとともに保持することである。アプリケーションコア１０８は、DocumentManager（ドキュメントマネージャ：文書管理部）１０８１及びDocument（ドキュメント：文書）１０８２自身を含む。

DocumentManager１０８１の様々な態様を以下に詳述する。DocumentManager１０８１は、Document１０８２を管理する。DocumentManager１０８１は、RootPane１０８４、SubPane１０８５、ClipBoard（クリップボード）ユーティリティ１０８７、及びSnapShot（スナップショット）ユーティリティ１０８８にも接続される。ClipBoardユーティリティ１０８７は、ユーザがクリップボードに加えることを決定した文書の部分を保持する方法を提供する。例えば、ユーザが、文書の一部を切り取り、後で再考するために新規文書にそれを保存することを望んだとする。このような場合、切り取られた部分がClipBoardに追加される。

つづいて、SnapShotユーティリティ１０８８についても説明する。SnapShotユーティリティ１０８８は、アプリケーションがある状態から別の状態まで移行するときに、アプリケーションの現在の状態を記憶することを可能とする。

ｄ）ユーザインタフェイス
アプリケーションコンポーネント１０２の別の構成は、ユーザがシステムと物理的に対話する手段を提供するユーザインタフェイス１０７である。例えば、ユーザインタフェイスは、ユーザが文書をアップロードしたり、削除したり、編集したり、管理したりするために使用される。ユーザインタフェイスは、Frame（フレーム）１０７１、MenuBar（メニューバー）１０７２、StatusBar（ステータスバー）１０７３、及びURLBar（ＵＲＬバー）１０７４を含む。

Frame１０７１は、一般に知られているように、物理的な画面のアクティブな領域であるとみなされる。MenuBar１０７２は、ユーザに選択を提供するメニューを含む画面領域である。StatusBar１０７３は、アプリケーションの実行状態を表示する画面領域である。URLBar１０７４は、インターネットをナビゲートするためにＵＲＬアドレスを入力する領域を提供する。

Ｃ．文書管理及び関連するデータ構造
図１２は、DocumentManager１０８１の詳細を示す。これは、文書処理システム内で文書を表現するために用いられるデータ構造及び構成を含む。分かりやすくするために、このサブセクションで説明される構成は、ＭＶＣパラダイムを用いて説明される。

DocumentManager１０８１は、文書処理システム内にある全ての文書を保持しホストするDocumentContainer（ドキュメントコンテナ：文書コンテナ）２０３を含む。DocumentManager１０８１にアタッチされたツールキット２０１は、DocumentManager１０８１により使用される様々なツールを提供する。例えば、DomService（ＤＯＭサービス）は、文書に対応するＤＯＭを生成し、保持し、管理するために必要とされる全ての機能を提供するために、ツールキット２０１により提供されるツールである。ツールキット２０１により提供される別のツールであるIOManager（入出力管理部）は、システムへの入力及びシステムからの出力を管理する。同様に、StreamHandler（ストリームハンドラ）は、ビットストリームによる文書のアップロードを扱うツールである。これらのツールは、図中に特に示さず、参照番号を割り当てないが、ツールキット２０１のコンポーネントを形成する。

ＭＶＣパラダイムの表現によれば、モデル（Ｍ）は、文書のＤＯＭツリーモデル２０２を含む。前述したように、全ての文書は、文書処理システムにおいてＤＯＭツリーとして表現される。文書は、また、DocumentContainer２０３の一部を形成する。

１．ＤＯＭモデル及びゾーン
文書を表現するＤＯＭツリーは、Node（ノード）２０２１を有するツリーである。ＤＯＭツリーの部分集合であるZone（ゾーン）２０９は、ＤＯＭツリー内の１以上のNodeの関連領域を含む。例えば、画面上で文書の一部のみを表示し得るが、この可視化された文書の一部はZone２０９を用いて表示される。Zoneは、ZoneFactory（ゾーンファクトリ：ゾーン生成部）２０５と呼ばれるプラグインを用いて、生成され、取り扱われ、処理される。ZoneはＤＯＭの一部を表現するが、１以上の「名前空間」を使用してもよい。よく知られているように、名前空間は、名前空間内でユニークな名前の集合である。換言すれば、名前空間内に同じ名前は存在しない。

２．Facet及びFacetとZoneとの関係
Facet（ファセット）２０２２は、ＭＶＣパラダイムのモデル（Ｍ）部分内の別の構成である。Facetは、ZoneにおいてNodeを編集するために使用される。Facet２０２２は、Zone自身の内容に影響を与えずに実行することができる手続（プロシージャ）を使用して、ＤＯＭへのアクセスを編成する。次に説明するように、これらの手続は、Nodeに関連した重要で有用な操作を実行する。

各Nodeは、対応するFacetを有する。ＤＯＭの中のNodeを直接操作する代わりに、操作を実行するためにFacetを使用することによって、ＤＯＭの保全性は保護される。操作がNode上で直接実行される場合、いくつかのプラグインがＤＯＭを同時に変更することができ、その結果矛盾を引き起こす。

Ｗ３Ｃが策定したＤＯＭの標準規格は、Nodeを操作するための標準的なインタフェイスを定義するが、実際には、ボキャブラリごと又はNodeごとに特有の操作があるので、これらの操作をＡＰＩとして用意しておくのが好都合である。文書処理システムでは、このような各Nodeに特有のＡＰＩをFacetとして用意し、各Nodeにアタッチする。これにより、ＤＯＭの標準規格に準拠しつつ、有用なＡＰＩを付加することができる。また、ボキャブラリごとに特有のＤＯＭを実装するのではなく、標準的なＤＯＭの実装に、後から特有のＡＰＩを付加するようにすることで、多様なボキャブラリを統一的に処理することができるともに、複数のボキャブラリが任意の組合せで混在した文書を適切に処理することができる。

ボキャブラリは、名前空間に属するタグ（例えばＸＭＬのタグ）のセットである。上述したように、名前空間は、ユニークな名前（ここではタグ）のセットを有する。ボキャブラリは、ＸＭＬ文書を表現するＤＯＭツリーのサブツリーとして現れる。このサブツリーはZoneを含む。特定の例においては、タグセットの境界はZoneによって定義される。Zone２０９は、ZoneFactory２０５と呼ばれるServiceを利用して生成される。上述したように、Zone２０９は、文書を表現するＤＯＭツリーの一部の内部表現である。このような文書の一部へのアクセスを提供するために、論理的な表現が要求される。この論理的表現は、文書が画面上で論理的にどのように表現されるかについてコンピュータに通知する。Canvas（キャンバス）２１０は、Zoneに対応する論理的なレイアウトを提供するように作用するServiceである。

他方、Pane２１１は、Canvas２１０により提供される論理的なレイアウトに対応する物理的な画面レイアウトである。実際、ユーザは表示画面上で文字や画像によって文書のレンダリングのみを見る。したがって、文書は、画面上に文字や画像を描画するプロセスにより、画面上に描写されなければならない。文書は、Pane２１１により提供される物理的なレイアウトに基づいて、Canvas２１０により画面上に描写される。

Zone２０９に対応するCanvas２１０は、Editlet２０６を使用して生成される。文書のＤＯＭは、Editlet２０６及びCanvas２１０を使用して編集される。元の文書の完全性を維持するために、Editlet２０６及びCanvas２１０は、Zone２０９における１以上のNodeに対応するFacetを使用する。これらのServiceは、Zone及びＤＯＭ内のNodeを直接操作しない。Facetは、Command２０７を利用して操作される。

ユーザは、一般に、画面上のカーソルを移動させたり、コマンドをタイプしたりすることによって、画面と対話する。画面上の論理的なレイアウトを提供するCanvas２１０は、このカーソル操作を受け付ける。Canvas２１０は、対応するアクションをFacetに実行させることができる。この関係により、カーソルサブシステム２０４は、DocumentManager１０８１に対して、ＭＶＣパラダイムのコントローラ（Ｃ）として機能する。Canvas２１０は、イベントを扱うタスクも有する。例えば、Canvas２１０は、マウスクリック、フォーカス移動、及びユーザにより起こされた同様のアクションなどのイベントを扱う。

３．Zone、Facet、Canvas及びPaneの間の関係の概要
文書処理システム内の文書は、少なくとも４つの観点から見ることができる。すなわち、１）文書処理システムにおいて文書の内容及び構造を保持するために用いられるデータ構造、２）文書の保全性に影響を与えずに文書の内容を編集する手段、３）文書の画面上の論理的なレイアウト、４）文書の画面上の物理的なレイアウト、である。Zone、Facet、Canvas及びPaneは、前述の４つの観点に相当する、文書処理システムのコンポーネントをそれぞれ表す。

４．アンドゥサブシステム
上述したように、文書に対するいかなる変更（例えば編集）も取消可能であることが望ましい。例えば、ユーザが編集操作を実行し、次に、その変更の取消を決定したとする。図１２に関連して、アンドゥサブシステム２１２は、文書管理部の取消可能なコンポーネントを実現する。UndoManager（アンドゥマネージャ：アンドゥ管理部）２１２１は、ユーザによって取り消される可能性のある全ての文書に対する操作を保持する。

例えば、ユーザが、文書中の単語を別の単語に置換するコマンドを実行したとする。その後、ユーザは考え直し、元の単語に戻すことを決定したとする。アンドゥサブシステム２１２は、このような操作を支援する。UndoManager２１２１は、このようなUndoableEdit（アンドゥアブルエディット：取消可能な編集）２１２２の操作を保持する。

５．カーソルサブシステム
前述したように、ＭＶＣのコントローラ部分は、カーソルサブシステム２０４を備えてもよい。カーソルサブシステム２０４は、ユーザから入力を受け付ける。これらの入力は、一般にコマンド及び／又は編集操作の性格を有している。したがって、カーソルサブシステム２０４は、DocumentManager１０８１に関連したＭＶＣパラダイムのコントローラ（Ｃ）部分であると考えることができる。

６．ビュー
前述したように、Canvas２１０は、画面上に提示されるべき文書の論理的なレイアウトを表す。ＸＨＴＭＬ文書の例では、Canvas２１０は、文書が画面上でいかに見えるかを論理的に表現したボックスツリー２０８を含んでもよい。このボックスツリー２０８は、DocumentManager１０８１に関連したＭＶＣパラダイムのビュー（Ｖ）部分に含まれよう。

Ｄ．ボキャブラリコネクション
文書処理システムの重要な特徴は、ＸＭＬ文書を、他の表現にマップして取り扱うことが可能で、かつ、マップした先の表現を編集すると、その編集が元のＸＭＬ文書に整合性を保ちつつ反映される環境を提供することにある。

マークアップ言語により記述された文書、例えばＸＭＬ文書は、文書型定義により定義されたボキャブラリに基づいて作成されている。ボキャブラリは、タグのセットである。ボキャブラリは、任意に定義されてもよいため、無限に多くのボキャブラリが存在しうる。しかしながら、多数の可能なボキャブラリのそれぞれに対して専用の処理／管理環境を提供するのは現実的ではない。ボキャブラリコネクションは、この問題を解決する方法を提供する。

例えば、文書は２以上のマークアップ言語により記述されてもよい。文書は、例えば、ＸＨＴＭＬ（eXtensible HyperText Markup Language）、ＳＶＧ（Scalable Vector Graphics）、ＭａｔｈＭＬ（Mathematical Markup Language）、その他のマークアップ言語により記述されてもよい。換言すれば、マークアップ言語は、ＸＭＬにおけるボキャブラリやタグセットと同様に見なされてもよい。

ボキャブラリは、ボキャブラリプラグインを用いて処理される。文書処理システムにおいてプラグインが利用不可能であるボキャブラリにより記述された文書は、プラグインが利用可能である別のボキャブラリの文書にマッピングすることにより表示される。この特徴により、プラグインが用意されていないボキャブラリの文書も適切に表示することができる。

ボキャブラリコネクションは、定義ファイルを取得し、取得した定義ファイルに基づいて２つの異なるボキャブラリの間でマッピングする能力を含む。あるボキャブラリで記述された文書は、別のボキャブラリにマッピングすることができる。このように、ボキャブラリコネクションは、文書がマッピングされるボキャブラリに対応した表示／編集プラグインにより文書を表示し編集することを可能にする。

上述したように、各文書は、一般に複数のノードを有するＤＯＭツリーとして文書処理システムにおいて記述される。「定義ファイル」は、それぞれのノードについて、そのノードと他のノードとの対応を記述する。各ノードの要素値及び属性値が編集可能か否かが指定される。ノードの要素値又は属性値を用いた演算式が記述されてもよい。

マッピングという特徴を利用して、定義ファイルを適用したデスティネーションＤＯＭツリーが生成される。このように、ソースＤＯＭツリーとデスティネーションＤＯＭツリーの関係が構築され保持される。ボキャブラリコネクションは、ソースＤＯＭツリーとデスティネーションＤＯＭツリーの対応を監視する。ユーザから編集指示を受けると、ボキャブラリコネクションは、ソースＤＯＭツリーの関連したノードを変更する。ソースＤＯＭツリーが変更されたことを示す「ミューテーションイベント」が発行され、デスティネーションＤＯＭツリーがそれに応じて変更される。

ボキャブラリコネクションの使用により、少数のユーザのみに知られていた比較的マイナーなボキャブラリを、別のメジャーなボキャブラリに変換することができる。したがって、少数のユーザによって利用されるマイナーなボキャブラリであっても、文書を適切に表示し、望ましい編集環境を提供することができる。

このように、文書処理システムの一部であるボキャブラリコネクションサブシステムは、文書の複数の表現を可能にする機能を提供する。

図１３は、ボキャブラリコネクション（ＶＣ：Vocabulary Connection）サブシステム３００を示す。ＶＣサブシステム３００は、同一の文書の２つの代替表現の整合性を維持する方法を提供する。例えば、２つの表現は、同一文書の、２つの異なるボキャブラリによる表現であってもよい。前述したように、一方はソースＤＯＭツリーであってもよく、他方はデスティネーションＤＯＭツリーであってもよい。

１．ボキャブラリコネクションサブシステム
ボキャブラリコネクションサブシステム３００の機能は、VocabularyConnection３０１と呼ばれるプラグインを使用して、文書処理システムにおいて実現される。文書が表現されるVocabulary３０５ごとに、対応するプラグインが要求される。例えば、文書の一部がＨＴＭＬで記述され、残りがＳＶＧで記述されている場合、ＨＴＭＬとＳＶＧに対応するボキャブラリプラグインが要求される。

VocabularyConnectionプラグイン３０１は、適切なVocabulary３０５の文書に対応した、Zone２０９又はPane２１１のための適切なVCCanvas（ボキャブラリコネクションキャンバス）３１０を生成する。VocabularyConnection３０１を用いて、ソースＤＯＭツリー内のZone２０９に対する変更は、変換ルールにより、別のＤＯＭツリー３０６の対応するZoneに伝達される。変換ルールは、ボキャブラリコネクション記述子（Vocabulary Connection Descriptor：ＶＣＤ）の形式で記述される。このようなソースＤＯＭとデスティネーションＤＯＭの間の変換に対応するそれぞれのＶＣＤファイルについて、対応するVCManager（ボキャブラリコネクションマネージャ）３０２が生成される。

２．Connector
Connector３０４は、ソースＤＯＭツリーのソースノードと、デスティネーションＤＯＭツリーのデスティネーションノードとを接続する。Connector３０４は、ソースＤＯＭツリー中のソースノード、及びソースノードに対応するソース文書に対する修正（変更）を見るために作用する。そして、対応するデスティネーションＤＯＭツリーのノードを修正する。Connector３０４は、デスティネーションＤＯＭツリーを修正することができる唯一のオブジェクトである。例えば、ユーザは、ソース文書、及び対応するソースＤＯＭツリーに対してのみ修正を行うことができる。その後、Connector３０４がデスティネーションＤＯＭツリーに、対応する修正を行う。

Connector３０４は、ツリー構造を形成するために、論理的にリンクされる。Connector３０４により形成されたツリーは、ConnectorTree（コネクタツリー）と呼ばれる。Connector３０４は、ConnectorFactory（コネクタファクトリ：コネクタ生成部）３０３と呼ばれるServiceを用いて生成される。ConnectorFactory３０３は、ソース文書からConnector３０４を生成し、それらをリンクしてConnectorTreeを形成する。VocabularyConnectionManager３０２は、ConnectorFactory３０３を保持する。

前述したように、ボキャブラリは名前空間におけるタグのセットである。図示されるように、Vocabulary３０５は、VocabularyConnection３０１によって文書に対して生成される。これは、文書ファイルを解析し、ソースＤＯＭとデスティネーションＤＯＭの間の写像のための適切なVocabularyConnectionManager３０２を生成することにより行われる。さらに、Connectorを生成するConnectorFactory３０３と、Zone２０９を生成するZoneFactory２０５と、Zone内のノードに対応するCanvasを生成するEditlet２０６との間の適切な関係が作られる。ユーザがシステムから文書を処分又は削除するとき、対応するVocabularyConnectionManager３０２が削除される。

Vocabulary３０５は、VCCanvas３１０を生成する。さらに、Connector３０４及びデスティネーションＤＯＭツリー３０６が対応して生成される。

ソースＤＯＭ及びCanvasは、それぞれ、モデル（Ｍ）及びビュー（Ｖ）に対応する。しかしながら、このような表現は、ターゲットのボキャブラリが画面上に描写可能である場合に限って意味がある。描写は、ボキャブラリプラグインにより行われる。ボキャブラリプラグインは、主要なボキャブラリ、例えば、ＸＨＴＭＬ、ＳＶＧ、ＭａｔｈＭＬについて提供される。ボキャブラリプラグインは、ターゲットのボキャブラリに関連して使用される。これらは、ボキャブラリコネクション記述子を用いてボキャブラリ間でマッピングする方法を提供する。

このようなマッピングは、ターゲットのボキャブラリが、マッピング可能で、画面上に描写される方法が予め定義されたものである場合にのみ意味がある。このようなレンダリング方法は、例えばＸＨＴＭＬなどのように、Ｗ３Ｃなどの組織により定義された標準規格となっている。

ボキャブラリコネクションが必要であるとき、VCCanvasが使用される。この場合、ソースのビューを直接生成することができないので、ソースのCanvasは生成されない。この場合、VCCanvasが、ConnectorTreeを使用して生成される。このVCCanvasは、イベントの変換のみを扱い、画面上の文書の描写を援助しない。

３．DestinationZone、Pane、及びCanvas
上述したように、ボキャブラリコネクションサブシステムの目的は、同一の文書の２つの表現を同時に生成し保持することである。第２の表現も、ＤＯＭツリーの形式であり、これはデスティネーションＤＯＭツリーとして既に説明した。第２の表現における文書を見るために、DestinationZone、Canvas及びPaneが必要である。

VCCanvasが作成されると、対応するDestinationPane３０７が生成される。さらに、関連するDestinationCanvas３０８と、対応するBoxTree３０９が生成される。同様に、VCCanvas３１０も、ソース文書に対するPane２１１及びZone２０９に関連づけられる。

DestinationCanvas３０８は、第２の表現における文書の論理的なレイアウトを提供する。特に、DestinationCanvas３０８は、デスティネーション表現における文書を描写するために、カーソルや選択のようなユーザインタフェイス機能を提供する。DestinationCanvas３０８に生じたイベントは、Connectorに供給される。DestinationCanvas３０８は、マウスイベント、キーボードイベント、ドラッグアンドドロップイベント、及び文書のデスティネーション（第２）表現のボキャブラリに特有なイベントを、Connector３０４に通知する。

４．ボキャブラリコネクションコマンドサブシステム
ボキャブラリコネクション（ＶＣ）サブシステム３００の要素として、ボキャブラリコネクション（ＶＣ）コマンドサブシステム３１３がある。ボキャブラリコネクションコマンドサブシステム３１３は、ボキャブラリコネクションサブシステム３００に関連した命令の実行のために使用されるVCCommand（ボキャブラリコネクションコマンド）３１５を生成する。VCCommandは、内蔵のCommandTemplate（コマンドテンプレート）３１８を使用して、及び／又は、スクリプトサブシステム３１４においてスクリプト言語を使用してスクラッチからコマンドを生成することにより、生成することができる。

コマンドテンプレートには、例えば、「If」コマンドテンプレート、「When」コマンドテンプレート、「挿入（Insert）」コマンドテンプレートなどがある。これらのテンプレートは、VCCommandを作成するために使用される。

５．ＸＰａｔｈサブシステム
ＸＰａｔｈサブシステム３１６は、文書処理システムの重要な構成であり、ボキャブラリコネクションの実現を支援する。Connector３０４は、一般にxpath情報を含む。上述したように、ボキャブラリコネクションのタスクの１つは、ソースＤＯＭツリーの変化をデスティネーションＤＯＭツリーに反映させることである。xpath情報は、変更／修正を監視されるべきソースＤＯＭツリーのサブセットを決定するために用いられる１以上のxpath表現を含む。

６．ソースＤＯＭツリー、デスティネーションＤＯＭツリー、及びConnectorTreeの概要
ソースＤＯＭツリーは、別のボキャブラリに変換される前のボキャブラリで文書を表現したＤＯＭツリー又はZoneである。ソースＤＯＭツリーのノードは、ソースノードと呼ばれる。

それに対して、デスティネーションＤＯＭツリーは、ボキャブラリコネクションに関連して前述したように、同一の文書を、マッピングにより変換された後の異なるボキャブラリで表現したＤＯＭツリー又はZoneである。デスティネーションＤＯＭツリーのノードは、デスティネーションノードと呼ばれる。

ConnectorTreeは、ソースノードとデスティネーションノードの対応を表すConnectorに基づく階層的表現である。Connectorは、ソースノードと、ソース文書になされた修正を監視し、デスティネーションＤＯＭツリーを修正する。Connectorは、デスティネーションＤＯＭツリーを修正することを許された唯一のオブジェクトである。

Ｅ．文書処理システムにおけるイベントフロー
実用のためには、プログラムはユーザからのコマンドに応答しなければならない。イベントは、プログラム上で実行されたユーザアクションを記述し実行する方法である。多くの高級言語、例えばＪａｖａ（登録商標）は、ユーザアクションを記述するイベントに頼っている。従来、プログラムは、ユーザアクションを理解し、それを自身で実行するために、積極的に情報を集める必要があった。これは、例えば、プログラムが自身を初期化した後、ユーザが画面、キーボード、マウスなどでアクションを起こしたときに適切な処理を講じるために、ユーザのアクションを繰り返し確認するループに入ることを意味する。しかしながら、このプロセスは扱いにくい。さらに、それは、ユーザが何かをするのを待つ間、ＣＰＵサイクルを消費してループするプログラムを必要とする。

多くの言語が、異なるパラダイムを採用することにより、これらの問題を解決している。そのうちの一つは、現代の全てのウィンドウシステムの基礎となっている、イベントドリブンプログラミングである。このパラダイムでは、全てのユーザアクションは、「イベント」と呼ばれる抽象的な事象の集合に属する。イベントは、十分詳細に、特定のユーザアクションを記述する。プログラムがユーザにより生成されたイベントを積極的に収集するのではなく、監視すべきイベントが生じたときに、システムがプログラムに通知する。この方法によりユーザとの対話を扱うプログラムは「イベントドリブン」であると言われる。

これは、多くの場合、全てのユーザにより生成されたイベントの基本特性を獲得する「Event（イベント）」クラスを使用して扱われる。

文書処理システムは、自身のイベント、及びこれらのイベントを扱う方法を定義して使用する。いくつかの型のイベントが使用される。例えば、マウスイベントは、ユーザのマウスアクションから起こるイベントである。マウスを含むユーザアクションは、Canvas２１０によって、マウスイベントに渡される。このように、Canvasは、システムのユーザによる相互作用の最前部にあると言える。必要であれば、最前部にあるCanvasは、そのイベントに関連した内容を子へ渡す。

それに対して、キーストロークイベントは、Canvas２１０から流れる。キーストロークイベントは、即時的なフォーカスを有する。すなわち、それは、いかなる瞬間でも作業に関連する。Canvas２１０上に入力されたキーストロークイベントは、その親に渡される。キー入力は、文字列挿入を扱うことが可能な、異なるイベントによって処理される。文字列の挿入を扱うイベントは、キーボードを使用して文字が挿入されたときに発生する。他の「イベント」は、例えば、ドラッグイベント、ドロップイベント、マウスイベントと同様に扱われる他のイベントを含む。

１．ボキャブラリコネクション外のイベントの取り扱い
イベントは、イベントスレッドを用いて渡される。Canvas２１０は、イベントを受け取ると、その状態を変更する。必要であれば、Command１０５２がCanvas２１０によりCommandQueue１０５３にポストされる。

２．ボキャブラリコネクション内のイベントの取り扱い
VocabularyConnectionプラグイン３０１を用いて、DestinationCanvasの一例であるXHTMLCanvas１１０６は、発生したイベント、例えば、マウスイベント、キーボードイベント、ドラッグアンドドロップイベント、及びボキャブラリに特有のイベントなどを受け取る。これらのイベントは、コネクタ３０４に通知される。より詳細には、図２１（ｂ）に図示されるように、VocabularyConnectionプラグイン３０１内のイベントフローは、SourcePane１１０３、VCCanvas１１０４、DestinationPane１１０５、DestinationCanvasの一例であるDestinationCanvas１１０６、デスティネーションＤＯＭツリー及びConnectorTreeを通過する。

Ｆ．ProgramInvoker及びProgramInvokerと他の構成との関係
ProgramInvoker１０３及びそれと他の構成との関係は、図１４（ａ）に更に詳細に示される。ProgramInvoker１０３は、文書処理システムを開始するために実行される実行環境中の基本的なプログラムである。図１１（ｂ）及び図１１（ｃ）に図示されるように、UserApplication１０６、ServiceBroker１０４１、CommandInvoker１０５１、及びResource１０９は、全てProgramInvoker１０３に接続される。前述したように、アプリケーション１０２は、実行環境中で実行されるコンポーネントである。同様に、ServiceBroker１０４１は、システムに様々な機能を加えるプラグインを管理する。他方、CommandInvoker１０５１は、ユーザにより提供される命令を実行して、コマンドを実行するために使用されるクラス及びファンクションを保持する。

１．プラグイン及びサービス
ServiceBroker１０４１について、図１４（ｂ）を参照して更に詳細に説明する。前述したように、ServiceBroker１０４１は、システムに様々な機能を追加するプラグイン（及び関連するサービス）を管理する。Service１０４２は、文書処理システムに特徴を追加又は変更可能な最も下の層である。「Service」は、ServiceCategory４０１とServiceProvider４０２の２つの部分からなる。図１４（ｃ）に図示されるように、１つのServiceCategory４０１は、複数の関連するServiceProvider４０２を持ちうる。それぞれのServiceProviderは、特定のServiceCategoryの一部または全部を実行するように作用する。ServiceCategory４０１は、他方では、Serviceの型を定義する。

Serviceは、１）文書処理システムに特定の特色を提供する「特色サービス」、２）文書処理システムにより実行されるアプリケーションである「アプリケーションサービス」、３）文書処理システムの全体にわたって必要な特色を提供する「環境サービス」、の３つの型に分類することができる。

Serviceの例は、図１４（ｄ）に示される。アプリケーションServiceのCategoryにおいては、システムユーティリティが対応するServiceProviderの例である。同様に、Editlet２０６はCategoryであり、HTMLEditlet及びSVGEditletは対応するServiceProviderである。ZoneFactory２０５は、Serviceの別のCategoryであり、対応するServiceProvider（図示せず）を有する。

プラグインは、文書処理システムに機能性を加えると既に説明したが、いくつかのServiceProvider４０２及びそれらに関連するクラスからなるユニットと見なされてもよい。各プラグインは、宣言ファイルに記述された依存性及びServiceCategory４０１を有する。

２．ProgramInvokerとアプリケーションとの関係
図１４（ｅ）は、ProgramInvoker１０３とUserApplication１０６との関係についての更なる詳細を示す。必要な文書やデータなどは、ストレージからロードされる。必要なプラグインは、全てServiceBroker１０４１上にロードされる。ServiceBroker１０４１は、全てのプラグインを保持し管理する。プラグインは、システムに物理的に追加することができ、又、その機能はストレージからロードすることができる。プラグインの内容がロードされると、ServiceBroker１０４１は、対応するプラグインを定義する。つづいて、対応するUserApplication１０６が生成され、実行環境１０１にロードされ、ProgramInvoker１０３にアタッチされる。

Ｇ．アプリケーションサービスと環境との関係
図１５（ａ）は、ProgramInvoker１０３上にロードしたアプリケーションサービスの構成についての更なる詳細を示す。コマンドサブシステム１０５のコンポーネントであるCommandInvoker１０５１は、ProgramInvoker１０３内のCommand１０５２を起動又は実行する。Command１０５２は、文書処理システムにおいて、ＸＭＬなどの文書を処理し、対応するＸＭＬＤＯＭツリーを編集するために用いられる命令である。CommandInvoker１０５１は、Command１０５２を実行するために必要なクラス及びファンクションを保持する。

ServiceBroker１０４１も、ProgramInvoker１０３内で実行される。UserApplication１０６は、ユーザインタフェイス１０７及びCoreComponent１１０に接続される。CoreComponent１１０は、全てのPaneの間で文書を共有する方法を提供する。CoreComponent１１０は、さらにフォントを提供し、Paneのためのツールキットの役割を果たす。

図１５（ｂ）は、Frame１０７１、MenuBar１０７２、及びStatusBar１０７３の関係を示す。

Ｈ．アプリケーションコア
図１６（ａ）は、全ての文書、及び文書の一部及び文書に属するデータを保持するアプリケーションコア１０８についての更なる説明を提供する。CoreComponent１１０は、文書１０８２を管理するDocumentManager１０８１にアタッチされる。DocumentManager１０８１は、文書処理システムに関連づけられたメモリに格納される全ての文書１０８２の所有者である。

画面上の文書の表示を容易にするために、DocumentManager１０８１はRootPane１０８４にも接続される。ClipBoard１０８７、SnapShot１０８８、Drag&Drop６０１、及びOverlay６０２の機能も、CoreComponent１１０にアタッチされる。

SnapShot１０８８は、アプリケーションの状態を元に戻すために使用される。ユーザがSnapShot１０８８を起動したとき、アプリケーションの現状が検知され、格納される。その後、アプリケーションの状態が別の状態に変わるとき、格納された状態の内容は保存される。SnapShot１０８８は、図１６（ｂ）に図示される。動作において、アプリケーションがあるＵＲＬから他へ移動するときに、前に戻る動作及び先に進む動作をシームレスに実行可能とするために、SnapShot１０８８は以前の状態を記憶する。

Ｉ．DocumentManager内における文書の構成
図１７（ａ）は、DocumentManager１０８１の更なる説明と、DocumentManagerにおいて文書が構成され保持される様子を示す。図１１（ｂ）に示したように、DocumentManager１０８１は、文書１０８２を管理する。図１７（ａ）に示される例において、複数の文書のうちの１つはRootDocument（ルート文書）７０１であり、残りの文書はSubDocument（サブ文書）７０２である。DocumentManager１０８１は、RootDocument７０１に接続され、RootDocument７０１は、全てのSubDocument７０２に接続される。

図１２及び図１７（ａ）に示すように、DocumentManager１０８１は、全ての文書１０８２を管理するオブジェクトであるDocumentContainer２０３に結合される。DOMService７０３及びIOManager７０４を含むツールキット２０１（例えばＸＭＬツールキット）の一部を形成するツールも、DocumentManager１０８１に供給される。再び図１７（ａ）を参照して、DOMService７０３は、DocumentManager１０８１により管理される文書に基づいたＤＯＭツリーを生成する。各Document７０５は、それがRootDocument７０１であってもSubDocument７０２であっても、対応するDocumentContainer２０３によって管理される。

図１７（ｂ）は、文書Ａ−Ｅが階層的に配置される様子を示す。文書ＡはRootDocumentである。文書Ｂ−Ｄは、文書ＡのSubDocumentである。文書Ｅは、文書ＤのSubDocumentである。図１７（ｂ）の左側は、これと同じ文書の階層が画面上に表示された例を示す。RootDocumentである文書Ａは、基本フレームとして表示される。文書ＡのSubDocumentである文書Ｂ−Ｄは、基本フレームＡの中のサブフレームとして表示される。文書ＤのSubDocumentである文書Ｅは、サブフレームＤのサブフレームとして画面に表示される。

再び図１７（ａ）を参照して、UndoManager（アンドゥマネージャ：アンドゥ管理部）７０６及びUndoWrapper（アンドゥラッパー）７０７は、それぞれのDocumentContainer２０３に対して生成される。UndoManager７０６及びUndoWrapper７０７は、取消可能なコマンドを実行するために使用される。この特徴を使用することにより、編集操作を使用して文書に対して実行された変更を取り消すことができる。SubDocumentの変更は、RootDocumentとも密接な関係を有する。アンドゥ操作は、階層内の他の文書に影響する変更を考慮に入れて、例えば、図１７（ｂ）に示されるような連鎖状の階層における全ての文書の間で整合性が維持されることを保証する。

UndoWrapper７０７は、DocumentContainer２０３内のSubDocumentに関連するアンドゥオブジェクトをラップし、それらをRootDocumentに関連するアンドゥオブジェクトに結合させる。UndoWrapper７０７は、UndoableEditAcceptor（アンドゥアブルエディットアクセプタ：アンドゥ可能編集受付部）７０９に利用可能なアンドゥオブジェクトの収集を実行する。

UndoManager７０６及びUndoWrapper７０７は、UndoableEditAcceptor７０９及びUndoableEditSource（アンドゥアブルエディットソース）７０８に接続される。当業者には理解されるように、Document７０５がUndoableEditSource７０８であってもよく、取消可能な編集オブジェクトのソースであってもよい。

Ｊ．アンドゥコマンド及びアンドゥフレームワーク
図１８（ａ）及び図１８（ｂ）は、アンドゥフレームワーク及びアンドゥコマンドについて更なる詳細を提供する。図１８（ａ）に示されるように、UndoCommand８０１、RedoCommand８０２、及びUndoableEditCommand８０３は、図１１（ｂ）に示したようにCommandInvoker１０５１に積むことができるコマンドであり、順に実行される。UndoableEditCommand８０３は、UndoableEditSource７０８及びUndoableEditAcceptor７０９に更にアタッチされる。「foo」EditCommand８０４及び「bar」EditCommand８０５は、UndoableEditCommandの例である。

１．UndoableEditCommandの実行
図１８（ｂ）は、UndoableEditCommandの実行を示す。まず、ユーザが編集コマンドを使用してDocument７０５を編集すると仮定する。第１ステップＳ１では、UndoableEditAcceptor７０９が、Document７０５のＤＯＭツリーであるUndoableEditSource７０８にアタッチされる。第２ステップＳ２では、ユーザにより発行されたコマンドに基づいて、Document７０５がＤＯＭのＡＰＩを用いて編集される。第３ステップＳ３では、ミューテーションイベントのリスナーが、変更がなされたことを通知される。すなわち、このステップでは、ＤＯＭツリーの全ての変更を監視するリスナーが編集操作を検知する。第４ステップＳ４では、UndoableEditがUndoManager７０６のオブジェクトとして格納される。第５ステップＳ５では、UndoableEditAcceptor７０９がUndoableEditSource７０８からデタッチされる。UndoableEditSource７０８は、Document７０５自身であってもよい。

Ｋ．システムへの文書のロードに関する手順
上記のサブセクションでは、システムの様々なコンポーネント及びサブコンポーネントについて説明した。以下、これらのコンポーネントの使用に関する方法論について説明する。図１９（ａ）は、文書処理システムに文書がロードされる様子の概要を示す。それぞれのステップは、図２４−２８において、特定の例に関連して詳述される。

簡単には、文書処理システムは、文書に含まれるデータからなるバイナリデータストリームからＤＯＭを生成する。ApexNode（エイペックスノード：頂点ノード）が、注目対象でありZoneに属する文書の一部のために生成される。つづいて、対応するPaneが同定される。同定されたPaneは、ApexNode及び物理的な画面表面からZone及びCanvasを生成する。Zoneは、次に、それぞれのノードにFacetを生成し、それらに必要とされる情報を提供する。Canvasは、ＤＯＭツリーから、ノードをレンダリングするためのデータ構造を生成する。

より詳細には、文書はストレージ９０１からロードされる。文書のＤＯＭツリー９０２が生成される。文書を保持するための、対応するDocumentContainer９０３が生成される。DocumentContainer９０３は、DocumentManager９０４にアタッチされる。ＤＯＭツリーは、ルートノードと、ときには複数のセカンダリノードを含む。

一般に、このような文書は、テキスト及びグラフィクスの双方を含む。したがって、ＤＯＭツリーは、例えば、ＸＨＴＭＬサブツリーだけでなくＳＶＧサブツリーを有してもよい。ＸＨＴＭＬサブツリーは、ＸＨＴＭＬのApexNode９０５を有する。同様に、ＳＶＧサブツリーは、ＳＶＧのApexNode９０６を有する。

ステップ１では、ApexNode９０６が、画面の論理的なレイアウトであるPane９０７にアタッチされる。ステップ２では、Pane９０７は、PaneOwner（ペインオーナー：ペインの所有者）９０８であるCoreComponentに、ApexNode９０６のためのZoneFactoryを要求する。ステップ３では、PaneOwner９０８は、ZoneFactoryと、ApexNode９０６のためのCanvasFactoryであるEditletとを返す。

ステップ４では、Pane９０７がZone９０９を生成する。Zone９０９はPane９０７にアタッチされる。ステップ５では、Zone９０９がそれぞれのノードに対してFacetを生成し、対応するノードにアタッチする。ステップ６では、Pane９０７がCanvas９１０を生成する。Canvas９１０はPane９０７にアタッチされる。Canvas９１０には様々なCommandが含まれる。ステップ７では、Canvas９１０が文書を画面にレンダリングするためのデータ構造を構築する。ＸＨＴＭＬの場合、これはボックスツリー構造を含む。

１．ZoneのＭＶＣ
図１９（ｂ）は、ＭＶＣパラダイムを用いてZoneの構成の概要を示す。この場合、Zone及びFacetは文書に関連した入力であるから、モデル（Ｍ）はZone及びFacetを含む。Canvasと、文書を画面にレンダリングするためのデータ構造体は、ユーザが画面上に見る出力であるから、ビュー（Ｖ）はCanvas及びデータ構造体に対応する。Commandは、文書とその様々な関係に対して制御操作を実行するので、コントロール（Ｃ）はCanvasに含まれるCommandを含む。

Ｌ．文書の表現
図２０を用いて、文書及びその様々な表現の例について以下に説明する。この例で使用される文書は、テキストと画像の双方を含む。テキストは、ＸＨＴＭＬを用いて表され、画像は、ＳＶＧを用いて表される。図２０は、文書のコンポーネント及び対応するオブジェクトの関係のＭＶＣ表現を詳細に示す。この例において、Document１００１は、Document１００１を保持するDocumentContainer１００２にアタッチされる。文書はＤＯＭツリー１００３により表現される。ＤＯＭツリーは、ApexNode１００４を含む。

ApexNodeは、黒丸で表される。頂点でないノードは、白丸で表される。ノードを編集するために用いられるFacetは、三角形で表され、対応するノードにアタッチされる。文書がテキストと画像を有するので、この文書のＤＯＭツリーは、ＸＨＴＭＬ部分とＳＶＧ部分を含む。ApexNode１００４は、ＸＨＴＭＬサブツリーの最上のノードである。これは、文書のＸＨＴＭＬ部分の物理的な表現のための最上PaneであるXHTMLPane１００５にアタッチされる。ApexNode１００４は、文書のＤＯＭツリーの一部であるXHTMLZone１００６にもアタッチされる。

Node１００４に対応するFacetも、XHTMLZone１００６にアタッチされる。XHTMLZone１００６は、XHTMLPane１００５にアタッチされる。XHTMLEditletは、文書の論理的な表現であるXHTMLCanvas１００７を生成する。XHTMLCanvas１００７は、XHTMLPane１００５にアタッチされる。XHTMLCanvas１００７は、Document１００１のＸＨＴＭＬコンポーネントのためのBoxTree１００９を生成する。文書のＸＨＴＭＬ部分を保持し描画するために必要な様々なCommand１００８も、XHTMLCanvas１００７に追加される。

同様に、文書のＳＶＧサブツリーのApexNode１０１０は、文書のＳＶＧコンポーネントを表現するDocument１００１のＤＯＭツリーの一部であるSVGZone１０１１にアタッチされる。ApexNode１０１０は、文書のＳＶＧ部分の物理的な表現の最上のPaneであるSVGPane１０１３にアタッチされる。文書のＳＶＧ部分の論理的な表現を表すSVGCanvas１０１２は、SVGEditletにより生成され、SVGPane１０１３にアタッチされる。画面上に文書のＳＶＧ部分をレンダリングするためのデータ構造及びコマンドは、SVGCanvasにアタッチされる。例えば、このデータ構造は、図示されるように、円、線、長方形などを含んでもよい。

図２０に関連して説明された文書例の表現の一部について、図２１（ａ）に関連して、前述したＭＶＣパラダイムを用いて更に説明する。図２１（ａ）は、文書１００１のＸＨＴＭＬコンポーネントにおけるＭＶの関係を簡略化して示す。モデルは、Document１００１のＸＨＴＭＬコンポーネントのためのXHTMLZone１１０１である。XHTMLZoneのツリーには、いくつかのNode及びそれらに対応するFacetが含まれる。対応するXHTMLZone及びPaneは、ＭＶＣパラダイムのモデル（Ｍ）部分の一部である。ＭＶＣパラダイムのビュー（Ｖ）部分は、Document１００１のＸＨＴＭＬコンポーネントの、対応するXHTMLCanvas１１０２及びBoxTreeである。文書のＸＨＴＭＬ部分は、Canvasと、それに含まれるCommandを使用して画面に描写される。キーボードやマウス入力などのイベントは、図示されるように、逆方向へ進む。

SourcePaneは、更なる機能、すなわち、ＤＯＭの保有者としての役割を有する。図２１（ｂ）は、図２１（ａ）に示したDocument１００１のコンポーネントに対するボキャブラリコネクションを提供する。ＤＯＭホルダーとして機能するSourcePane１１０３は、文書のソースＤＯＭツリーを含む。ConnectorTreeは、ConnectorFactoryにより生成され、デスティネーションＤＯＭの保有者としても機能するDestinationPane１１０５を生成する。DestinationPane１１０５は、XHTMLDestinationCanvas１１０６としてボックスツリーの形式でレイアウトされる。

Ｍ．プラグインサブシステム、ボキャブラリコネクション、及びコネクタの関係
図２２（ａ）−（ｃ）は、それぞれ、プラグインサブシステム、ボキャブラリコネクション、及びConnectorに関連する更なる詳細を示す。プラグインサブシステムは、文書処理システムに機能を追加又は交換するために用いられる。プラグインサブシステムは、ServiceBroker１０４１を含む。ServiceBroker１０４１にアタッチされるZoneFactoryService１２０１は、文書の一部に対するZoneを生成する。EditletService１２０２も、ServiceBroker１０４１にアタッチされる。EditletService１２０２は、Zone中のNodeに対応するCanvasを生成する。

ZoneFactoryの例は、XHTMLZone及びSVGZoneをそれぞれ生成するXHTMLZoneFactory１２１１及びSVGZoneFactory１２１２である。文書例に関連して前述したように、文書のテキストコンポーネントは、XHTMLZoneを生成することにより表現されてもよいし、画像はSVGZoneを用いて表現されてもよい。EditletServiceの例は、XHTMLEditlet１２２１及びSVGEditlet１２２２を含む。

図２２（ｂ）は、ボキャブラリコネクションに関連する更なる詳細を示す。ボキャブラリコネクションは、前述したように、文書処理システムの重要な特徴であり、２つの異なる方法で文書の整合のとれた表現及び表示を可能とする。ConnectorFactory３０３を保持するVCManager３０２は、ボキャブラリコネクションサブシステムの一部である。ConnectorFactory３０３は、文書のConnector３０４を生成する。前述したように、Connectorは、ソースＤＯＭ中のノードを監視し、２つの表現の間の整合性を維持するために、デスティネーションＤＯＭ中のノードを修正する。

Template３１７は、いくつかのノードの変換ルールを表す。ボキャブラリコネクション記述子（ＶＣＤ）ファイルは、特定のパス又はルールを満たす要素又は要素の集合を他の要素に変換するいくつかのルールを表すTemplateのリストである。Template３１７及びCommandTemplate３１８は、全てVCManager３０２にアタッチされる。VCManagerは、ＶＣＤファイル中の全てのセクションを管理するオブジェクトである。１つのＶＣＤファイルに対して、１つのVCManagerオブジェクトが生成される。

図２２（ｃ）は、Connectorに関連する更なる詳細を提供する。ConnectorFactory３０３は、ソース文書からConnectorを生成する。ConnectorFactory３０３は、Vocabulary、Template、及びElementTemplateにアタッチされ、それぞれ、VocabularyConnector、TemplateConnector、ElementConnectorを生成ずる。

VCManager３０２は、ConnectorFactory３０３を保持する。Vocabularyを生成するために、対応するＶＣＤファイルが読み込まれる。こうして、ConnectorFactory３０３が生成される。このConnectorFactory３０３は、Zoneを生成するZoneFactory及びCanvasを生成するEditletに関連する。

つづいて、ターゲットボキャブラリのEditletServiceが、VCCanvasを生成する。VCCanvasも、ソースＤＯＭツリー又はZoneにおけるApexNodeのConnectorを生成する。必要に応じて、子のConnectorが再帰的に生成される。ConnectorTreeは、ＶＣＤファイル中のテンプレートの集合により生成される。

テンプレートは、マークアップ言語の要素を他の要素に変換するためのルールの集合である。例えば、各テンプレートは、ソースＤＯＭツリー又はZoneにマッチされる。適切にマッチした場合には、頂点Connectorが生成される。例えば、テンプレート「A/*/D」は、間にどんなノードがあるかに関係なく、ノードＡで始まりノードＤで終わる全ての枝に合致する。同様に、「//B」は、ルートからの全ての「B」ノードに一致する。

Ｎ．ConnectorTreeに関係するＶＣＤファイルの例
特定の文書と関係する処理を説明する例を続ける。ドキュメントタイトルのある「MySampleXML」というタイトルの文書が文書処理システムにロードされる。図２３は、「MySampleXML」ファイルのための、VCManager及びConnectorFactoryTreeを用いたＶＣＤスクリプトの例を示す。スクリプトファイル中のボキャブラリセクション、テンプレートセクションと、VCManagerにおける対応するコンポーネントが示される。タグ「vcd:vocabulary」において、属性「match」は「sample:root」、「label」は「MySampleXML」、「call-template」は「sample template」となっている。

この例では、Vocabularyは、「MySampleXML」のVCManagerにおいて「sample:root」として頂点要素を含む。対応するＵＩラベルは、「MySampleXML」である。テンプレートセクションにおいて、タグは「vcd:template」であり、名前は「sample:template」である。

Ｏ．ファイルがシステムにロードされる方法の詳細な例
図２４−２８は、文書「MySampleXML」のロードについての詳細な記述を示す。図２４（ａ）に示されるステップ１では、文書がストレージ１４０５からロードされる。DOMServiceは、ＤＯＭツリー及びDocumentManager１４０６と対応するDocumentContainer１４０１を生成する。DocumentContainer１４０１は、DocumentManager１４０６にアタッチされる。文書は、ＸＨＴＭＬ及びMySampleXMLのサブツリーを含む。ＸＨＴＭＬのApexNode１４０３は、タグ「xhtml:html」が付されたＸＨＴＭＬの最上のノードである。「MySampleXML」のApexNode１４０４は、タグ「sample:root」が付された「MySampleXML」の最上ノードである。

図２４（ｂ）に示されるステップ２では、RootPaneが文書のXHTMLZone、Facet、及びCanvasを生成する。Pane１４０７、XHTMLZone１４０８、XHTMLCanvas１４０９、及びBoxTree１４１０が、ApexNode１４０３に対応して生成される。

図２４（ｃ）に示されるステップ３では、XHTMLZoneが知らないタグ「sample:root」を発見し、XHTMLCanvasの領域からSubPaneを生成する。

図２５に示されるステップ４では、SubPaneが「sample:root」を扱うことができ、適切なZoneを生成可能なZoneFactoryを得る。このZoneFactoryは、ZoneFactoryを実行可能なVocabulary内にある。それは、「MySampleXML」のVocabularySectionの内容を含む。

図２６に示されるステップ５では、「MySampleXML」に対応するVocabularyがDefaultZone１６０１を生成する。対応するEditletが生成され、対応するCanvasを生成するためにSubPane１５０１が提供される。Editletは、VCCanvasを生成する。そして、それはTemplateSectionを呼ぶ。ConnectorFactoryTreeも含まれている。ConnectorFactoryTreeは、ConnectorTreeとなる全てのConnectorを生成する。

図２７に示されるステップ６では、各ConnectorがデスティネーションＤＯＭオブジェクトを生成する。コネクタのうちのいくつかはxpath情報を含んでいる。xpath情報は、変更／修正を監視する必要のあるソースＤＯＭツリーの部分集合を決定するために使用される１以上のxpath表現を含む。

図２８に示されるステップ７では、ボキャブラリは、ソースＤＯＭのペインからデスティネーションＤＯＭツリーのDestinationPaneを作成する。これは、SourcePaneに基づいてなされる。デスティネーションツリーのApexNodeは、DestinationPane及び対応するZoneにアタッチされる。DestinationPaneは、DestinationCanvasを生成し、文書をデスティネーションのフォーマットでレンダリングするためのデータ構造及びコマンドを構築する、自身のEditletを提供される。

図２９（ａ）は、対応するソースノードを持たず、デスティネーションツリーにのみ存在するノード上でイベントが発生したときのフローを示す。マウスイベント、キーボードイベントなど、Canvasが取得したイベントは、デスティネーションツリーを通過して、ElementTemplateConnectorに伝達される。ElementTemplateConnectorは対応するソースノードを持たないので、伝達されたイベントはソースノードに対する編集操作ではない。ElementTemplateConnectorは、伝達されたイベントがCommandTemplateに記述されたコマンドに合致すれば、それに対応するActionを実行する。合致するコマンドがなければ、ElementTemplateConnectorは、伝達されたイベントを無視する。

図２９（ｂ）は、TextOfConnectorによりソースノードに対応づけられているデスティネーションツリーのノード上でイベントが発生したときのフローを示す。TextOfConnectorは、ソースＤＯＭツリーのＸＰａｔｈで指定されたノードからテキストノードを取得して、デスティネーションＤＯＭツリーのノードにマッピングする。マウスイベント、キーボードイベントなど、Canvasが取得したイベントは、デスティネーションツリーを通過して、TextOfConnectorに伝達される。TextOfConnectorは、伝達されたイベントを、対応するソースノードの編集コマンドにマッピングし、Queue１０５３に積む。編集コマンドは、Facetを介して実行されるＤＯＭのＡＰＩコールの集合である。キューに積まれたコマンドが実行されると、ソースノードが編集される。ソースノードが編集されると、ミューテーションイベントが発行され、リスナーとして登録されたTextOfConnectorにソースノードの変更が通知される。TextOfConnectorは、ソースノードの変更を、対応するデスティネーションノードに反映させるように、デスティネーションツリーを再構築する。このとき、TextOfConnectorを含むテンプレートに、「for each」や「for loop」などの制御文が含まれている場合、ConnectorFactoryがこの制御文を再評価し、TextOfConnectorを再構築した後、デスティネーションツリーが再構築される。

本発明の概要：
本明細書では、セマンティックコンピューティング（Semantic Computing）時代における新世代の文書処理の観点から、ＸＭＬ（eXtensible Markup Language）複合文書処理フレームワークを提供する本システムがいかに新しい文書処理パラダイムを築き得るかについて述べる。旧来の文書処理では、ＷＩＳＹＷＩＧ（What You See Is What You Get）が中心的な概念であり、見た目のよい文書を作成することが主要な目的であった。実際、見た目の分かり易さによって理解を促進する情報伝達機能は重要である。しかし、書き手にとっての分かり易さと読み手にとっての分かり易さは必ずしも一致せず、理解の同一化は読み手の努力に負わされている。また、文書中に含まれる情報を「知識」に昇華し、繰り返し活用することで付加価値を生み出していくことも文書のもう一つの重要な目的である。しかし、現行の文書処理環境では文書が局所的に利用されるに留まることが多く、さまざまな文書の情報が統合されて新たな知識を生むというプロセスに転化しきれているとはいえない。文書による情報伝達機能を高め、文書を再利用して新しい価値に転化するためには、文書中の情報を細粒度で扱えること、自由に複数の文書を統合できること、意味処理を包含できること、等の諸条件を満たす新たな文書処理基盤が必要である。
本発明者は、本システムを前述の条件を満たす新世代の文書処理基盤として構想し、中核機能を実装した。

（背景）
現代の知識社会においては、発展的なナレッジマネジメントが志向されている。ナレッジマネジメントにおいては、知識を中心とした経営革新の方法論を実践と同期するためにＩＴ技術による知識共有、知識活用が主たる課題となっている。ナレッジマネジメントシステムでは、形式知の表現系である文書の再利用、文書中からの知識の発掘など、文書を知識の源泉として知識創造につなげていくことが理想である。具体的な技術としては、情報検索、情報分類、テキストマイニングなどが適用されるが、情報の意味内容に踏み込んで良質の支援を与える水準には至っていない。

一方、ＵＢＬ（Universal Business Language）、ｘＣＢＬ（XML Common Business Library）、ＸＢＲＬ（eXtensible Business Reporting Language）などビジネス文書をＸＭＬで構造的に記述し、相互利用する方向性が提起されている。ＭＰＥＧ−７では画像、音声など全てのマルチメディア情報にメタ情報を付与する規範を提示している。これらの標準規格によって、ビジネスプロトコルの中核的要件の一つであるビジネス文書の構造的情報が明確になり、企業内、企業間の解釈に曖昧性が無くなるとともに、機械処理によるビジネス効率の向上効果が期待されている。

また、ＸＭＬのタグは、意味的内容を含意するものであり、機械に意味を踏まえた処理を行わせることが可能である。例えば、情報検索であればＱＡ検索が可能となるなど、テキスト情報処理の質的問題にも一つの解決の手段を与える。さらに自然言語処理技術の進展により、タグ付けされていない自由記述文章においても、応用によっては実用的なアノテーションを自然言語処理技術で自動的に付与することができる。

ただし、現状では、ＸＭＬボキャブラリ毎に専用のＸＭＬエディタやアプリケーションを開発するか、複数ボキャブラリを固定的に統合した専用ツールを用いる必要があり、期待する効果に反して普及の度合いが低いことも事実である。また、意味処理の観点においても、自然言語処理技術の技術的制約や、事前に全ての利用場面を想定した意味的なタグを完備することは困難であるという側面がある。

本実施例として、本システムが前述のようなＸＭＬ適用上の諸問題を解消し、ＸＭＬの利点を最大限引き出すことによって、新しい文書処理環境を提供できることを、次のような５章構成によって提示する。

まず、第１章［１．ビジネス文書とメタ構造］にて、文書の多層的な情報構造について再考し、文書を構成する部分的な情報単位を独立的に取り扱うことの意義、留意点を書き手と読み手のメンタルモデルの相違という観点から考察する。
次に、第２章［２．メタ情報を利用した意味処理］にて、文書の部分的な構成要素を処理する際にメタ情報が有益である点と、意味処理を加味してメタ情報を動的に構成するためのフレームワークについて述べる。
さらに、第３章［３．本システムのフレームワーク］にて、本システムのコア技術に関して第１章、第２章の訴求点と併せて概説する。
本システムが新世代の文書処理基盤の存立要件を満たし得ることを、第４章［４．結論］で述べる。最後に、第５章［５．付言］にて、本実施例を更に詳細に補足説明する。

［１．ビジネス文書とメタ構造］
１−１．文書の情報構造
図３０は、文書の情報構造を示す図である。
単一の文書の情報構造は、明示的、暗黙的な構造を踏まえて、次のような多層的な構造として捉えることができる。
レイアウト構造は、フォーマットや組版の配置など文書の表現系に関する情報構造である。論理構造は、ＳＧＭＬ（Standard Generalized Mark-up Language）やＸＭＬで規定する文書の論理的な構成要件から規定される構造である。メタ構造は、文書の論理的な構造以外に、文書に付属する情報や文章に内在する意味内容に係わる情報構造である。

複合文書の場合は、論理構造のレイヤで他の文書を複合的に含んだ上で、表現系において単一の文書として認識可能となっている。

ただし、既存のＯＬＥ等の技術を用いた複合文書では、レイアウト・処理・データが密接不可分の文書オブジェクトという単位で統合されるため、個々のオブジェクトに含まれる任意の部分情報単位を自由に操作することは困難であり、メタ構造も固定的である。

これに対して、ＸＭＬは文書要素や属性としてマークアップされている範疇においては、該当粒度で情報を様々に操作することが可能であり、メタ構造に関しても、ＲＤＦ（Resource Description Framework）のような汎用的なメタ構造記述言語を用いて、追加的に補完することが可能である。

１−２．認識のギャップ
文書本来の目的とは、情報や知識を伝達し、伝達者と被伝達者が共通の認識を得ることである。また、共通認識の上にさらに新たな知的価値を創造することである。契約書であれば、関係者が契約内容に合意した上で、契約書を元にビジネスが進展することで価値が生まれる。報告書であれば報告者と報告対象者が正確な情報を共有した上で、報告対象者の正しい判断や行動につながる。

この認識を共通化、合理化する努力としてビジネスプロトコルの標準化やビジネス文書のテンプレートなどが存在する。これらは、有効性は高いが、一方で、認識のギャップを全て解消することはできない。相互理解を妨げる認識のギャップは、表層的には記述内容に依るが、深層的にはメタ構造、特に意味内容に関する構造に多様性があるために生じることが主因である。

メタ構造の多様性は、書き手及び読み手のメンタルモデルが必ずしも一致しないことに帰因する。これは、例えば、書き手が重要と考える情報が、読み手にとって必ずしも重要ではなかったり、専門家が専門用語を用いて記述した文書が、専門外の読み手にとってはその内容を理解し難い、などのケースが示唆している。

書き手と読み手のメンタルモデルは、個別に動的に構成される。従って、書き手が提示する唯一の記述に対して、読み手が努力して自己のメンタルモデルに適合させるという文書コミュニケーションでは、共通認識のギャップを埋めることは困難である。

理想的な文書処理環境とは、書き手のメンタルモデルを読み手のメンタルモデルに整合させるメカニズムを有していることであろう。

１−３．広域に分散する文書における部分情報の関連性
電子化された文書は、広域に分散して存在する。構造的な観点からは、各々の文書がそれぞれ独立に存在する訳ではなく、相互に構造的な関係性を持っている。例えばウェブ情報は、明示的なハイパーリンクによる広域的なグラフ構造によって成り立っているし、明示的なハイパーリンク関係を有していないビジネス文書においても、仮想的には等価な構造性を有していると見なすことが可能である。

ファブレス企業の例を見ると、ファブレス企業は上流工程の仕様設計が主体であるため、仕様書や設計書が主たる文書である。仕様書や設計書の部分情報は、製造メーカーへの発注書にも利用され、販売部門の営業提案書にも引用され得る。また、ファブレス企業内での会計情報と発注書や受注書の会計費目とその値は関係している。

これらは、部分情報をリンクノードと仮定すると、暗黙的なハイパーリンク構造をしていると見ることもできる。すなわち、印刷機械の発明以降、紙媒体においては強束縛な情報体であった文書が、物理的な制約が無い電子化文書に転化しネットワークで共有される状態では、文書の部分を単位とした共参照、相互参照構造が自然発生的に構成されていると見なすことができる。

このような構造を無視して、文書オブジェクトという単位で情報内容を独立的に処理する現行の文書処理パラダイムでは、部分を参照する自由度が損なわれたり、本来同一である情報が異なる内容で散在するなどの不整合が生じ易い。

従って、新しい文書処理パラダイムでは、広域に分散する電子化文書に対して、共参照、相互参照される情報の部分が一貫性を保持しつつ、目的に応じて集約される仮想的な文書空間として捉え、その特性を踏まえて処理することが自然であると考えられる。

１−４．認識の統合と一貫性の保持
書き手と読み手の認識を統合し、相互理解の水準を高めるには、従来の一方的な若しくは画一的な情報伝達フレームワークを改める必要がある。つまり、共通の理解は必ずしも書き手が与える唯一無二の表現構造に一意に従う必要はないということであり、読み手の認識の多様性を吸収し表現構造を可変とするフレームワークを導入することが有効と考えられる。

このフレームワークは、基底表現系、表現系の動的な写像機構、写像表現系の３つの要素で構成される。基底表現系は、単独または複数のＸＭＬボキャブラリとして表現される。表現系の動的な写像機構は、複数のＸＭＬボキャブラリにおける任意の部分要素単位を自由に再構成するメカニズムである。また、写像された結果である再構成されたＸＭＬ文書として捉えることができる。

また、電子化文書の広域分散的状態において、同一の情報の部分単位が一貫して正しいことが重要である。情報の一貫性を保障するためには、情報を部分単位で扱うだけでなく、依存関係や正当性の証明等を同時に管理することが必要となる。

［２．メタ情報を利用した意味処理］
２−１．メタ情報の利用
前章において、ＸＭＬを基盤として、文書を構成する情報の部分単位で、一貫性を保持しつつ、文書を再利用することの有用性を述べた。これは、再利用すべき情報の単位が事前にＸＭＬのタグセットやスキーマとして適切に設計されている場合には、有効に機能すると考えられる。

しかし、実際には、全ての利用者を満足するタグセットを事前に、完全に想定することは不可能であるし、現実のＸＭＬ文書の運用においても自由なテキスト記述の部分は必ず存在する。事前に規定された範囲内では、限られた情報の組合せでしか、情報を再構成することが出来ない。

そこで、意味内容に関するメタ情報を利用することで、より自由度の高い文書の再利用を実現することを考える。

２−２．メタ情報の自動処理
任意の部分情報の抽出・選択や情報検索の精度向上などメタ情報を利用するメリットは多いが、メタ情報を手動で付与することはコストが大きいという問題もある。特に、テキストに対して詳細に情報を付与することは、現実的でないことが多い。

このため、メタ情報自動抽出に関する研究が行われており、各種のアルゴリズムが提案されている。用途によっては、実用化されているものもあり、個体名抽出や係り受け解析などはテキストマイニングシステムに組み込まれている。

「１−１」で文書のメタ構造について述べたが、このうち、書誌情報的な情報は文書作成時に明示的に付与する場合もあるし、論文などでは、論理構造を利用して特定しやすいため自動処理でも比較的容易に抽出できる可能性がある。

一方、タグが付与されていない非定形な文章中に内在する人、時間、場所、及びそれらの関係などは、予め規定しにくく出現状況が不規則であるため、メタ情報自動抽出に係わるコア技術等を利用して、元文書に対するメタ情報セットとして事後に形式化することで明示的に利用が可能となる。
図３１は、メタ情報の抽出と区分についての態様を示す模式図である。

２−３．メタ情報の管理方式
元情報に対して事後的なメタ情報を作成して管理する場合、２つの方式が考えられる。一つは、単一のメタ情報オブジェクトに最も細かい粒度のメタ情報タグを全て付与して一括管理する方式である。もう一つは、一定の区分基準に基づいて分割した複数のメタ情報オブジェクトを個別に管理する方式である。一定の区分基準とは、例えば、研究者−研究テーマなどの人と関係する任意のテーマ、プロジェクト−規模−成否などのビジネス活動に係わる事象である。

２つの方式において、前者は、一つの巨大なＤＯＭが形成される可能性があり、作成前に情報の粒度を慎重に設計しておく必要があること、操作が重くなることなどの問題がある。従って、後者のように複数のメタ情報コンテキストとして管理しておき、必要に応じて追加したり、組み合わせることにで多様性を確保する方式が望ましいと考える。

あるコンテキストに照応したメタ情報集合を一つの管理単位とし、お互いのコンテキストを層として重ね合わせ可能な機能性を有するコンテキストレイヤと呼称すれば、ある文書のメタ情報全体はコンテキストレイヤ集合として表すことができる。
図３２は、メタ情報とコンテキストレイヤの関係を示す模式図である。

２−４．メタ情報を用いた認識統合機構
ある文書とコンテキストレイヤ集合をペアで管理しておくことにより、メタ情報を基にした情報の再構成が容易に行えるようになる。コンテキストレイヤ集合は、例えば、元文書へのリンクと同時にリポジトリに保存しておくことで管理することができる。リポジトリ内の情報アクセスに対しては、アクセス用ＡＰＩ（Application Program Interface）を用意しておく。ＸＭＬ−ＤＢのような専用のストレージに格納することでも構わない。

読み手は、メンタルモデルすなわち自己のコンテキストに基づいた視点を自分で構成し、文書処理系に提示する。具体的には、参照したい情報の範囲、粒度、量などの条件をＧＵＩ上で編集することを意味する。文書処理系はその構成要素に元文書の構造的部分情報やメタ情報を基準に則って当てはめることで、読み手のメンタルモデルに基づいた文書を動的に構成する。図３３は、読み手のメンタルモデルに基づく文書生成の態様を示す模式図である。

このようなフレームワークにより、メタ情報をベースとした任意の粒度での情報の再構成が可能となる。つまり、読み手にとって最も認識が容易である情報表現にマッピングすることができる。

例えば、営業報告書集合を元にして、事業部長が事業計画を策定するために過年度の営業活動サマリーを見たい場合と、人事部がアワードを確定する場合に優れた営業活動の状況を把握したい場合とで、状況に応じた異なる文書を構成することができる。

文書が広域に分散している状況においても、文書、照応するコンテキストレイヤ集合、メタ情報プリミティブの操作を統一することで、文書の意味内容に基づいた透過的な情報の再利用が可能となる。

［３．本システムのフレームワーク］
３−１．本システムの基本思想
本システムにおいては、文書処理を意味的に行うために、いかなるＸＭＬ文書も一つの基盤上で透過的に取り扱うことを基本思想としている。

本システムが文書をＸＭＬの世界観と同期して取り扱う文書処理環境全体を本システムのフレームワークと位置付ける。本システムのフレームワークにおいては、前章までに述べた新世代の文書処理が実行できる機能性を全て包含する。

すなわち、ＸＭＬの意味的・構造的記述性によって体系化された文書群の任意の部分情報を、目的や状況に応じて自由に合成、組み替え、変形することによって、書き手と読み手の認識のギャップを無くし、広域に散らばる部分情報の一貫性を保ちながら、知識の創造を支援する機能性を網羅する環境であることを意味する。

３−２．本システムが提供するフレームワークのデザイン
図３４は、本システムが提供するフレームワークの概念図を次に示す。
同図において、本システムの概念的機能性を中心の矩形に4つのカテゴリーで示した。「認識の分解」、「認識の投影」、「知識の構造的貯蔵」、「認識の再合成」の４つである。また、同図において数字は各機能性が強く関連するフレームワーク中の構成要素との相互作用を示している。

（１）は全てのＸＭＬを受理することを示す。この時、「認識の分解」は、（２）で示されるプロセスによって書き手のメンタルモデルを「分解ルール」に基づく情報の粒度に分解することを表す。この分解ルールは、ＸＭＬボキャブラリ若しくはメタ情報抽出モジュール等を意味する。

再利用を前提とした情報の部分集合は、「知識の構造的貯蔵」における（３）のプロセスによってコンテキスト情報として保存される。

十分な粒度で意味的に体系化された部分情報に対して、ＷＩＳＹＷＩＧによる編集操作を通して、読み手のメンタルモデルを構成し、フレームワークに反映する。この時、新しい認識のモデルを構成するときの構成の仕方を構成ルールとしてプログラム的に組み込むことも可能である。

任意の読み手若しくは情報の利用者は、自己のメンタルモデルに応じた「認識モデル」と「構成ルール」(５)を用いて「認識の再合成」を行い、最も自己に適したビューをＸＭＬ複合文書として構成する。

［４．結論］
実施例において、本システムが、任意の情報粒度で文書の構成要素をハンドリングできること、意味処理を含む任意の処理モジュールを目的に応じて動的に結合できること、ＷＩＳＹＷＩＧによる操作性を提供すること、等の特徴的な機能性によって、従来の文書概念の限界を打破する新しい文書処理基盤に相応しいフレームワークとなり得ることを示した。

［５．付言］
図３５は、文書とコンテキストの関係を説明するための模式図である。
本実施例において処理対象となるのは、１以上のソースファイル３０１０である。ソースファイル３０１０は、各種情報がテキストデータとして表現される文書ファイルである。これら多種多様なソースファイル３０１０に含まれる情報の集合体のことを、本実施例においては「文書空間３０００」と称することにする。文書空間３０００は、たとえば、企業内のデータベースに保存されている文書ファイルによって構成されてもよい。あるいは、文書空間３０００はインターネットを介して取得可能なＨＴＭＬファイルやＸＭＬファイルなどの文書ファイルによって構成されてもよい。

本実施例における文書処理装置の主たる目的は、雑多な情報を含む所定の文書空間３０００から、読み手ユーザが必要とする情報を効率的に検索し、後述する閲覧ファイルとして集約することである。同図において、文書空間３０００を構成するソースファイル３０１０ａ、ソースファイル３０１０ｂ、ソースファイル３０１０ｃ・・・などの各ソースファイル３０１０は、ＸＭＬで記述された構造化文書ファイルであるとして説明する。

各ソースファイル３０１０のタグ構造は、ＤＯＭツリーとして表現可能である。ただし、各ソースファイル３０１０ごとのタグセットは統一されているとは限らない。むしろ、統一されていないことの方が多い。ここでは、ソースファイル３０１０ａとソースファイル３０１０ｂ、ソースファイル３０１０ｃはそれぞれ異なるタグセットであるとして説明する。まず、ソースファイル３０１０ａのノード３０２０に注目してみることにする。

ノード３０２０は、ソースファイル３０１０ａの所定要素（element）に対応する。ＤＯＭツリーにおいては、ノードを単位としてデータ処理することが多い。しかし、このノード３０２０の内容（content）として含まれるテキストデータは、さまざまな意味内容を包含している可能性がある。すなわち、ノード３０２０のテキストデータを更に細分化してみると、内容に応じていくつかのパーツに分類できることがある。同図の場合、ノード３０２０のテキストデータは、コンテキスト（context）Ａ、コンテキストＢ、コンテキストＣという３種類のテキストデータに分類できる。以下、コンテキストに対応するデータのことを「コンテキストデータ」とよぶことにする。

ここでいうコンテキストとは、所定の観点からデータを分類するための基準である。ユーザは、任意にコンテキストを決定できる。このコンテキストを決定するための基準としては、論理構造、レイアウト構造、メタ構造という３種類の情報構造が考えられることは既に述べたとおりである。図３５においては、このうちメタ構造に基づくコンテキストを想定して、コンテキストＡ、コンテキストＢおよびコンテキストＣを規定している。まず、３種類の情報構造に基づくコンテキストについて説明する。

ａ）論理構造
論理構造とは、構造化文書ファイルのタグや属性など、文書構造を規定するために明示的に設定される文書構造である。たとえば、「vehicle」という名前のタグと「car」という名前のタグは、その名前そのものは異なっていても意味としては近い関係にある。このとき、あるソースファイル３０１０において「vehicle」というタグによって特定されるテキストデータＡと、別のソースファイル３０１０において「car」というタグによって特定されるテキストデータＢは、内容に関して類似関係があると考えることもできる。このとき、テキストデータＡとテキストデータＢは、同じコンテキストに属するとしてもよい。また、「rose」というタグと「flower」というタグの間には、前者が後者の下位概念となる親子関係にある。このとき、「rose」というタグによって特定されるテキストデータは、「花（flower）」というコンテキストに含まれると考えてもよい。このように、タグ名の類語関係や親子関係などをあらかじめ定めた辞書テーブルを参照して、コンテキストを規定してもよい。

ｂ）レイアウト構造
レイアウト構造とは、テキストデータの表示フォントや文書中の配置など、ソースファイル３０１０の表示形式を規定するために明示的に設定される構造である。レイアウト構造に基づいてコンテキストを規定する場合、ソースファイル３０１０とセットになっているＣＳＳファイルを参照してコンテキストが決定されてもよい。たとえば、「ボールド体」で記述されるテキストデータのグループは、「強調されている情報群」として同じコンテキストに属するとしてもよい。

ｃ）メタ構造
すでに述べたように、メタ構造は、明示的なメタ構造（以下、「明示メタ構造」とよぶ）と暗黙的なメタ構造（以下、「暗黙メタ構造」とよぶ）に分類できる。
明示メタ構造とは、ソースファイル３０１０のテキストデータ中に明示的に現れる項目によって設定される構造である。たとえば、「第Ｘ章」、「第Ｙ項」などの章立てや、特許明細書の「背景技術」のような定型項目などによってコンテキストが規定されてもよい。
一方、暗黙メタ構造とは、テキストデータによって形成される意味構造である。たとえば、暗黙メタ構造として「肯定的な文章」と「否定的な文章」、「どちらともいえない文章」という３種類のコンテキストを規定してもよい。このような文章の意味内容を判定するための方法としては、ベイジアンフィルタ法などの既知の自然言語処理技術を応用すればよい。

論理構造、レイアウト構造、メタ構造の観点からコンテキストを規定する方法には無限のバリエーションがあり、読み手となるユーザは任意の観点からコンテキストを設定可能である。論理構造、レイアウト構造、メタ構造に基づくコンテキストは任意に組み合わせてもよい。たとえば、「vehicle」というタグによって特定されるテキストデータと、車に関する記述のテキストデータが同じコンテキストに属するとしてもよい。
同図に示すノード３０２０の場合、暗黙メタ構造に基づく所定観点から、コンテキストＡ、コンテキストＢ、コンテキストＣが抽出されているとする。

ノード３０４０は、ソースファイル３０１０ｃの所定要素に対応する。今度は、このノード３０４０に注目してみる。ノード３０４０のテキストデータは、前述の暗黙メタ構造に基づく所定観点からみると、コンテキストＡ、コンテキストＤおよびコンテキストＥという３種類のコンテキストデータを含んでいる。ここで注目すべき点は、本来、別々のソースファイル３０１０であるソースファイル３０１０ａとソースファイル３０１０ｂには、ともに、コンテキストＡに対応するコンテキストデータ（以下、このようなコンテキストデータのことを単に「コンテキストデータＡ」と表記することにする）を含んでいることである。すなわち、コンテキストを中心として文書空間３０００を眺めてみると、コンテキストデータＡは、ソースファイル３０１０ａとソースファイル３０１０ｃに分離された形で文書空間３０００に存在していることになる。複数のソースファイル３０１０同士が、ハイパーリンクなどによって明示的に関連性を有する場合はもちろん、明示的なリンクがなくとも、結果として複数のソースファイル３０１０に関連性の高い情報が分散されていることはよくあることである。
本実施例に示す文書処理装置は、このような複数のソースファイル３０１０を含む文書空間３０００から、目的とするコンテキストに応じたデータを効率よく、かつ、任意の情報単位にて収集できる。

図３６は、ソースファイルから閲覧ファイルを生成する原理を説明するための模式図である。
まず、文書空間３０００の中から、所定のコンテキストに基づいて、複数種類のコンテキストデータが抽出される。これらのコンテキストデータは、コンテキストごとに分類されてデータベースに保持される。このデータベースから、閲覧ファイル３０６０が生成される。閲覧ファイル３０６０は、読み手のユーザが任意に設計できる。同図においては、コンテキストデータＡとコンテキストデータＢが列挙される形式にて閲覧ファイル３０６０が生成されている。閲覧ファイル３０６０もＸＭＬ文書ファイルとして生成される。

この処理プロセスをメンタルモデルの観点から見ると、書き手のメンタルモデルが読み手のメンタルモデルへと変化していることがわかる。ソースファイル３０１０は、当然ながら書き手のメンタルモデルにて作成するファイルである。このソースファイル３０１０に含まれる情報は、所定のコンテキストによってデータベースに抽出・分類・集約される。コンテキストは、読み手のメンタルモデルに基づいて規定されてもよいし、所定の標準的な観点から規定されてもよい。最後に、読み手は、自己のメンタルモデルにて閲覧ファイル３０６０を生成させている。このように、ソースファイル３０１０の情報のコンテキストに基づく細分化と再統合によって、書き手のメンタルモデルと読み手のメンタルモデルの整合が図られている。

図３７は、本実施例における文書処理装置の機能ブロック図である。
ここに示す各ブロックは、ハードウェア的には、コンピュータのＣＰＵをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。

文書処理装置３１００は、前提技術で説明した文書処理装置２０の構成に加えて、文書取得部３１２０、解析部３１４０、データ保持部３２００および条件設定部３２２０を備える。
文書取得部３１２０は、ソースファイル３０１０を取得する。解析部３１４０は、取得されたソースファイル３０１０を解析してコンテキストデータを抽出する。データ保持部３２００は、抽出されたコンテキストデータを保持する。図３６のデータベースに相当するブロックである。条件設定部３２２０は、ユーザからの入力に応じて、閲覧ファイル３０６０に含まれるコンテキストデータを特定するための閲覧条件を設定する。また、閲覧ファイル３０６０のタグ構造も閲覧条件として設定される。閲覧条件は、文書処理装置２０の定義ファイルとして反映される。この閲覧条件にしたがって、文書処理装置２０はデータ保持部３２００のデータから、閲覧ファイル３０６０を生成する。条件設定部３２２０は、閲覧ファイル３０６０の表示条件を設定する。この表示条件にしたがって閲覧ファイル３０６０は画面表示される。条件設定部３２２０は、解析部３１４０におけるコンテキストの規定方法も設定する。これらの条件設定を介して、読み手となるユーザは任意の観点から情報を抽出して、任意の表示形式にて、任意の構造にて表示させることができる。

解析部３１４０は、要素解析部３１６０とコンテキスト解析部３１８０を含む。
要素解析部３１６０は、ソースファイル３０１０において処理対象となる文章を構文解析し、文の成分を要素データとして抽出する。たとえば、「Ａは、２００５年にＢに行った」という文章の場合、主語としての「Ａ」、目的語としての「Ｂ」、述語としての「行った」、日時を示す「２００５年」という４つの構成要素（以下、「要素データ」とよぶ）に分解できる。データ保持部３２００は、ＲＤＦ形式にて各要素データを構造化して保持してもよい。コンテキスト解析部３１８０は各要素データに基づいてその文章のコンテキストを判定する。たとえば、「肯定的な文章」であるか「否定的な文章」であるかという観点からコンテキストを規定する場合、述語にあたる要素データが「よかった」、「できる」などの肯定的な述語であるときには肯定的なコンテキストであると判定してもよい。このように、メタ情報に基づいてコンテキストを規定する場合、コンテキスト解析部３１８０は、要素データから文章の性質を判断し、同じコンテキストに属する一群のテキストデータを、所定のコンテキストに属すると判定する。

図３８は、閲覧ファイルの構成を設定するための画面図である。
この設定画面３３６０の、タグ構造設定領域３２６０は閲覧ファイル３０６０のタグ構造を設計するための領域である。同図においては、データＡ、データＢ、データＣとして、３種類のデータがそれぞれ要素化されている。また、データＢに対応する要素は、データＡに対応する要素の子要素となっている。

ユーザがタグ構造設定領域３２６０のデータＡを選択した状態で所定の操作を実行すると条件設定領域３２４０が表示される。条件設定領域３２４０は、データＡの内容を特定するための閲覧条件とその表示方法を示す表示条件を設定するための領域である。ここでは、データＡとして、「２００５年」の「営業報告」に関し、「営業部員からのレポート」の「アブストラクト」が指定されている。すなわち、この４種類のコンテキストのすべてに当てはまるデータが、データＡの条件である。また、データＡのうち、楽観的なコメントについては青字、悲観的なコメントについては赤字で示されるように設定されている。また、データＢには、「２００５年」の「営業報告」に関し、「営業部員のうち係長からのレポート」の「アブストラクト」が指定されてもよい。また、データＣには、マーケティングの報告書から抽出されるコンテキストデータが指定されてもよい。また、データの表示形式も、グラフ表示やテキスト表示など、読み手が任意に設定できてもよい。
このようにして、文書空間３０００から、その構造および表現形式のいずれにおいても読み手のメンタルモデルに応じた閲覧ファイル３０６０を簡易に設計することができる。

以上、本実施例に示した文書処理装置３１００によれば、書き手のメンタルモデルを読み手のメンタルモデルに整合させるための仕組みを効果的に提供できる。このような仕組みによれば、雑多な情報を含む文書空間３０００から読み手は自由にデータを収集できる。たとえば、定期発行される電子雑誌のバックナンバーを文書空間３０００として、読み手が必要とする情報を集め、ダイジェスト版を容易に作ることができる。また、元のソースファイル３０１０の内容が変更されたときには、文書処理装置３１００はその変更通知をソースファイルの３０１０から受信してもよい。そして、文書処理装置３１００は、この変更通知を受けたときには、変更後のソースファイル３０１０を再取得して、コンテキストデータを再抽出してもよい。

以上、実施の形態をもとに本発明を説明した。なお本発明はこの実施の形態に限定されることなく、そのさまざまな変形例もまた、本発明の態様として有効である。

Claims

外部装置から文書ファイルを取得する文書取得部と、
所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照して、前記取得された文書ファイルに含まれるデータから各コンテキストに応じたメタ情報を抽出するメタ情報抽出部と、
各コンテキストに対応するメタ情報の集合が前記取得された文書ファイルから抽出されたデータであることを示す関連情報を記憶する関連情報記憶部と、
を備えることを特徴とする文書処理装置。
前記コンテキスト情報に応じて、各コンテキストに応じた文書構造を定義した構造定義ファイルを記憶する構造定義ファイル記憶部と、
各コンテキストに対応して分類されたメタ情報の集合から、前記構造定義ファイルにより定義された文書構造にて文書ファイルを生成する文書生成部と、
を更に備えることを特徴とする請求項１に記載の文書処理装置。
前記コンテキスト情報を定義するための入力画面を表示する入力画面表示部と、
入力画面を介してユーザによる前記コンテキスト情報を定義するための入力を受け付ける操作入力部と、を更に備え、
前記メタ情報抽出部は、前記入力画面を介してユーザにより定義されたコンテキスト情報に応じてメタ情報を抽出することを特徴とする請求項１または２に記載の文書処理装置。
閲覧の対象となる文書ファイルをソースファイルとして取得する文書取得部と、
所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照し、各コンテキストに適合するコンテキストデータをソースファイルから抽出するコンテキスト解析部と、
閲覧者によって指定される条件であって、閲覧対象となる１以上のコンテキストを特定すると共に各コンテキストに適合するコンテキストデータから新たに生成される文書ファイルの構造を定義するための閲覧条件を参照し、閲覧対象のコンテキストデータを構造化した文書ファイルとして閲覧ファイルを生成する文書生成部と、
を備えることを特徴とする文書処理装置。
文の成分として文章の意味構造を構成する単位にてソースファイルから要素データを抽出する要素解析部を更に備え、
前記コンテキスト解析部は、一群の要素データによって形成されるコンテキストに基づいて、１以上の要素データを含むコンテキストデータを抽出することを特徴とする請求項４に記載の文書処理装置。
前記コンテキスト解析部は、文章中に設けられた項目を単位としてソースファイルからコンテキストデータを抽出することを特徴とする請求項４または５に記載の文書処理装置。
前記ソースファイルには、表示のためのレイアウト情報が付与されており、
前記コンテキスト解析部は、前記レイアウト情報に示される表示上の構成単位にてソースファイルからコンテキストデータを抽出することを特徴とする請求項４から６のいずれかに記載の文書処理装置。
閲覧対象となるコンテキストデータの表示方法を定義するための表示条件を参照して、前記閲覧ファイルの表示方法を特定する表示処理部を更に備えることを特徴とする請求項４から７のいずれかに記載の文書処理装置。
前記文書生成部は、複数種類のソースファイルから抽出されたコンテキストデータから、単一の閲覧ファイルを生成可能であることを特徴とする請求項４から８のいずれかに記載の文書処理装置。
閲覧の対象となる文書ファイルをソースファイルとして取得するステップと、
所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照し、各コンテキストに適合するコンテキストデータをソースファイルから抽出するステップと、
閲覧者によって指定される条件であって、閲覧対象となる１以上のコンテキストを特定すると共に各コンテキストに適合するコンテキストデータから新たに生成される文書ファイルの構造を定義するための閲覧条件を参照し、閲覧対象のコンテキストデータを構造化した文書ファイルとして閲覧ファイルを生成するステップと、
を備えることを特徴とする文書処理方法。
閲覧の対象となる文書ファイルをソースファイルとして取得する機能と、
所定の基準に応じてデータを分類するための区分として１以上のコンテキストが定義されたコンテキスト情報を参照し、各コンテキストに適合するコンテキストデータをソースファイルから抽出する機能と、
閲覧者によって指定される条件であって、閲覧対象となる１以上のコンテキストを特定すると共に各コンテキストに適合するコンテキストデータから新たに生成される文書ファイルの構造を定義するための閲覧条件を参照し、閲覧対象のコンテキストデータを構造化した文書ファイルとして閲覧ファイルを生成する機能と、
をコンピュータに発揮させることを特徴とする文書処理プログラム。