20 文書処理装置、22 主制御ユニット、24 編集ユニット、30 DOMユニット、32 DOM提供部、34 DOM生成部、36 出力部、40 CSSユニット、42 CSS解析部、44 CSS提供部、46 レンダリング部、50 HTMLユニット、52,62 制御部、54,64 編集部、56,66 表示部、60 SVGユニット、80 VCユニット、82 マッピング部、84 定義ファイル取得部、86 定義ファイル生成部、3000 文書処理装置、3120 アンドゥマネージャ、3140 アンドゥスタック、3020 データ処理部、3040 ユーザインタフェース処理部、3042 表示部、3044 入力部、3060 履歴処理部、3062 状態データ取得部、3064 オブジェクト生成部、3068 圧縮部。
(前提技術)
図1は、前提技術に係る文書処理装置20の構成を示す。文書処理装置20は、文書内のデータが階層構造を有する複数の構成要素に分類された構造化文書を処理するが、本前提技術では構造化文書の一例としてXML文書を処理する例について説明する。文書処理装置20は、主制御ユニット22、編集ユニット24、DOMユニット30、CSSユニット40、HTMLユニット50、SVGユニット60、及び変換部の一例であるVCユニット80を備える。これらの構成は、ハードウエアコンポーネントでいえば、任意のコンピュータのCPU、メモリ、メモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
主制御ユニット22は、プラグインのロードや、コマンド実行のフレームワークを提供する。編集ユニット24は、XML文書を編集するためのフレームワークを提供する。文書処理装置20における文書の表示及び編集機能は、プラグインにより実現されており、文書の種別に応じて必要なプラグインが主制御ユニット22又は編集ユニット24によりロードされる。主制御ユニット22又は編集ユニット24は、処理対象となるXML文書の名前空間を参照して、XML文書がいずれのボキャブラリにより記述されているかを判別し、そのボキャブラリに対応した表示又は編集用のプラグインをロードして表示や編集を実行させる。例えば、文書処理装置20には、HTML文書の表示及び編集を行うHTMLユニット50、SVG文書の表示及び編集を行うSVGユニット60など、ボキャブラリ(タグセット)ごとに表示系及び編集系がプラグインとして実装されており、HTML文書を編集するときはHTMLユニット50が、SVG文書を編集するときはSVGユニット60が、それぞれロードされる。後述するように、HTMLとSVGの双方の構成要素を含む複合文書が処理対象となっている場合は、HTMLユニット50とSVGユニット60の双方がロードされる。
このような構成によれば、ユーザは、必要な機能のみを選択してインストールし、後から適宜機能を追加又は削除することができるので、プログラムを格納するハードディスクなどの記録媒体の記憶領域を有効に活用することができ、また、プログラム実行時にも、メモリの浪費を防ぐことができる。また、機能拡張性に優れており、開発主体としても、プラグインの形で新たなボキャブラリに対応することが可能なので開発が容易となり、ユーザとしても、プラグインの追加により容易かつ低コストにて機能を追加することができる。
編集ユニット24は、ユーザインターフェースを介してユーザから編集指示のイベントを受け付け、そのイベントを適切なプラグインなどに通知するともに、イベントの再実行(リドゥ)又は実行の取消(アンドゥ)などの処理を制御する。
DOMユニット30は、DOM提供部32、DOM生成部34、及び出力部36を含み、XML文書をデータとして扱うときのアクセス方法を提供するために定められた文書オブジェクトモデル(Document Object Model:DOM)に準拠した機能を実現する。DOM提供部32は、編集ユニット24に定義されているインタフェースを満たすDOMの実装である。DOM生成部34は、XML文書からDOMツリーを生成する。後述するように、処理対象となるXML文書が、VCユニット80により他のボキャブラリにマッピングされる場合は、マッピング元のXML文書に対応するソースツリーと、マッピング先のXML文書に対応するデスティネーションツリーが生成される。出力部36は、例えば編集終了時に、DOMツリーをXML文書として出力する。
CSSユニット40は、CSS解析部42、CSS提供部44、及びレンダリング部46を含み、CSSに準拠した表示機能を提供する。CSS解析部42は、CSSの構文を解析するパーサの機能を有する。CSS提供部44は、CSSオブジェクトの実装であり、DOMツリーに対してCSSのカスケード処理を行う。レンダリング部46は、CSSのレンダリングエンジンであり、CSSを用いてレイアウトされるHTMLなどのボキャブラリで記述された文書の表示に用いられる。
HTMLユニット50は、HTMLにより記述された文書を表示又は編集する。SVGユニット60は、SVGにより記述された文書を表示又は編集する。これらの表示/編集系は、プラグインの形で実現されており、それぞれ、文書を表示する表示部(Canvas)56、66、編集指示を含むイベントを送受信する制御部(Editlet)52、62、編集コマンドを受けてDOMに対して編集を行う編集部(Zone)54、64を備える。制御部52又は62が外部からDOMツリーの編集コマンドを受け付けると、編集部54又は64がDOMツリーを変更し、表示部56又は66が表示を更新する。これらは、MVC(Model-View-Controller)と呼ばれるフレームワークに類似する構成をとっており、概ね、表示部56及び66が「View」に、制御部52及び62が「Controller」に、編集部54及び64とDOMの実体が「Model」に、それぞれ対応する。本前提技術の文書処理装置20では、XML文書をツリー表示形式で編集するだけでなく、それぞれのボキャブラリに応じた編集を可能とする。例えば、HTMLユニット50は、HTML文書をワードプロセッサに類似した方式で編集するためのユーザインターフェースを提供し、SVGユニット60は、SVG文書を画像描画ツールに類似した方式で編集するためのユーザインターフェースを提供する。
VCユニット80は、マッピング部82、定義ファイル取得部84、及び定義ファイル生成部86を含み、あるボキャブラリにより記述された文書を、他のボキャブラリにマッピングすることにより、マッピング先のボキャブラリに対応した表示編集用プラグインで文書を表示又は編集するためのフレームワークを提供する。本前提技術では、この機能を、ボキャブラリコネクション(Vocabulary Connection:VC)と呼ぶ。定義ファイル取得部84は、マッピングの定義を記述したスクリプトファイルを取得する。この定義ファイルは、ノードごとに、ノード間の対応(コネクション)を記述する。このとき、各ノードの要素値や属性値の編集の可否を指定してもよい。また、ノードの要素値や属性値を用いた演算式を記述してもよい。これらの機能については、後で詳述する。マッピング部82は、定義ファイル取得部84が取得したスクリプトファイルを参照して、DOM生成部34にデスティネーションツリーを生成させ、ソースツリーとデスティネーションツリーの対応関係を管理する。定義ファイル生成部86は、ユーザが定義ファイルを生成するためのグラフィカルユーザインターフェースを提供する。
VCユニット80は、ソースツリーとデスティネーションツリーの間のコネクションを監視し、表示を担当するプラグインにより提供されるユーザインタフェースを介してユーザから編集指示を受け付けると、まずソースツリーの該当するノードを変更する。DOMユニット30が、ソースツリーが変更された旨のミューテーションイベントを発行すると、VCユニット80は、そのミューテーションイベントを受けて、ソースツリーの変更にデスティネーションツリーを同期させるべく、変更されたノードに対応するデスティネーションツリーのノードを変更する。デスティネーションツリーを表示/編集するプラグイン、例えばHTMLユニット50は、デスティネーションツリーが変更された旨のミューテーションイベントを受けて、変更されたデスティネーションツリーを参照して表示を更新する。このような構成により、少数のユーザにより利用されるローカルなボキャブラリにより記述された文書であっても、他のメジャーなボキャブラリに変換することで、文書を表示することができるとともに、編集環境が提供される。
文書処理装置20により文書を表示又は編集する動作について説明する。文書処理装置20が処理対象となる文書を読み込むと、DOM生成部34が、そのXML文書からDOMツリーを生成する。また、主制御ユニット22又は編集ユニット24は、名前空間を参照して文書を記述しているボキャブラリを判別する。そのボキャブラリに対応したプラグインが文書処理装置20にインストールされている場合は、そのプラグインをロードして、文書を表示/編集させる。プラグインがインストールされていない場合は、マッピングの定義ファイルが存在するか否かを確認する。定義ファイルが存在する場合、定義ファイル取得部84が定義ファイルを取得し、その定義に従って、デスティネーションツリーが生成され、マッピング先のボキャブラリに対応するプラグインにより文書が表示/編集される。複数のボキャブラリを含む複合文書である場合は、後述するように、それぞれのボキャブラリに対応したプラグインにより、文書の該当箇所がそれぞれ表示/編集される。定義ファイルが存在しない場合は、文書のソース又はツリー構造を表示し、その表示画面において編集が行われる。
図2は、処理対象となるXML文書の例を示す。このXML文書は、生徒の成績データを管理するために用いられる。XML文書のトップノードである構成要素「成績」は、配下に、生徒ごとに設けられた構成要素「生徒」を複数有する。構成要素「生徒」は、属性値「名前」と、子要素「国語」、「数学」、「理科」、「社会」を有する。属性値「名前」は、生徒の名前を格納する。構成要素「国語」、「数学」、「理科」、「社会」は、それぞれ、国語、数学、理科、社会の成績を格納する。例えば、名前が「A」である生徒の国語の成績は「90」、数学の成績は「50」、理科の成績は「75」、社会の成績は「60」である。以下、この文書で使用されているボキャブラリ(タグセット)を、「成績管理ボキャブラリ」と呼ぶ。
本前提技術の文書処理装置20は、成績管理ボキャブラリの表示/編集に対応したプラグインを有しないので、この文書をソース表示、ツリー表示以外の方法で表示するためには、前述したVC機能が用いられる。すなわち、成績管理ボキャブラリを、プラグインが用意された別のボキャブラリ、例えば、HTMLやSVGなどにマッピングするための定義ファイルを用意する必要がある。ユーザ自身が定義ファイルを作成するためのユーザインターフェースについては後述することにして、ここでは、既に定義ファイルが用意されているとして説明を進める。
図3は、図2に示したXML文書をHTMLで記述された表にマッピングする例を示す。図3の例では、成績管理ボキャブラリの「生徒」ノードを、HTMLにおける表(「TABLE」ノード)の行(「TR」ノード)に対応づけ、各行の第1列には属性値「名前」を、第2列には「国語」ノードの要素値を、第3列には「数学」ノードの要素値を、第4列には「理科」ノードの要素値を、第5列には「社会」ノードの要素値を、それぞれ対応付ける。これにより、図2に示したXML文書を、HTMLの表形式で表示することができる。また、これらの属性値及び要素値は、編集可能であることが指定されており、ユーザがHTMLによる表示画面上で、HTMLユニット50の編集機能により、これらの値を編集することができる。第6列には、国語、数学、理科、社会の成績の加重平均を算出する演算式が指定されており、生徒の成績の平均点が表示される。このように、定義ファイルに演算式を指定可能とすることにより、より柔軟な表示が可能となり、編集時のユーザの利便性を向上させることができる。なお、第6列は、編集不可であることが指定されており、平均点のみを個別に編集することができないようにしている。このように、マッピング定義において、編集の可否を指定可能とすることにより、ユーザの誤操作を防ぐことができる。
図4(a)及び図4(b)は、図2に示したXML文書を図3に示した表にマッピングするための定義ファイルの例を示す。この定義ファイルは、定義ファイル用に定義されたスクリプト言語により記述される。定義ファイルには、コマンドの定義と、表示のテンプレートが記述されている。図4(a)(b)の例では、コマンドとして、「生徒の追加」と「生徒の削除」が定義されており、それぞれ、ソースツリーにノード「生徒」を挿入する操作と、ソースツリーからノード「生徒」を削除する操作が対応付けられている。また、テンプレートとして、表の第1行に「名前」、「国語」などの見出しが表示され、第2行以降に、ノード「生徒」の内容が表示されることが記述されている。ノード「生徒」の内容を表示するテンプレート中、「text-of」と記述された項は「編集可能」であることを意味し、「value-of」と記述された項は「編集不可能」であることを意味する。また、ノード「生徒」の内容を表示する行のうち、第6列には、「(src:国語 + src:数学 + src:理科 + src:社会) div 4」という計算式が記述されており、生徒の成績の平均が表示されることを意味する。
図5は、図2に示した成績管理ボキャブラリで記述されたXML文書を、図3に示した対応によりHTMLにマッピングして表示した画面の例を示す。表90の各行には、左から、各生徒の名前、国語の成績、数学の成績、理科の成績、社会の成績、及び平均点が表示されている。ユーザは、この画面上で、XML文書を編集することができる。たとえば、第2行第3列の値を「70」に変更すると、このノードに対応するソースツリーの要素値、すなわち、生徒「B」の数学の成績が「70」に変更される。このとき、VCユニット80は、デスティネーションツリーをソースツリーに追従させるべく、デスティネーションツリーの該当箇所を変更し、HTMLユニット50が、変更されたデスティネーションツリーに基づいて表示を更新する。したがって、画面上の表においても、生徒「B」の数学の成績が「70」に変更され、更に、平均点が「55」に変更される。
図5に示した画面には、図4(a)(b)に示した定義ファイルに定義されたように、「生徒の追加」及び「生徒の削除」のコマンドがメニューに表示される。ユーザがこれらのコマンドを選択すると、ソースツリーにおいて、ノード「生徒」が追加又は削除される。このように、本前提技術の文書処理装置20では、階層構造の末端の構成要素の要素値を編集するのみではなく、階層構造を編集することも可能である。このようなツリー構造の編集機能は、コマンドの形でユーザに提供されてもよい。また、例えば、表の行を追加又は削除するコマンドが、ノード「生徒」を追加又は削除する操作に対応づけられてもよい。また、他のボキャブラリを埋め込むコマンドがユーザに提供されてもよい。この表を入力用テンプレートとして、穴埋め形式で新たな生徒の成績データを追加することもできる。以上のように、VC機能により、HTMLユニット50の表示/編集機能を利用しつつ、成績管理ボキャブラリで記述された文書を編集することが可能となる。
図6は、ユーザが定義ファイルを生成するために、定義ファイル生成部86がユーザに提示するグラフィカルユーザインタフェースの例を示す。画面左側の領域91には、マッピング元のXML文書がツリー表示されている。画面右側の領域92には、マッピング先のXML文書の画面レイアウトが示されている。この画面レイアウトは、HTMLユニット50により編集可能となっており、ユーザは、画面右側の領域92において、文書を表示するための画面レイアウトを作成する。そして、例えば、マウスなどのポインティングデバイスにより、画面左側の領域91に表示されたマッピング元のXML文書のノードを、画面右側の領域92に表示されたHTMLによる画面レイアウト中へドラッグ&ドロップ操作を行うことにより、マッピング元のノードと、マッピング先のノードとのコネクションが指定される。例えば、要素「生徒」の子要素である「数学」を、HTML画面の表90の第1行第3列にドロップすると、「数学」ノードと、3列目の「TD」ノードの間にコネクションが張られる。各ノードには、編集の可否が指定できるようになっている。また、表示画面中には、演算式を埋め込むこともできる。画面の編集が終わると、定義ファイル生成部86は、画面レイアウトとノード間のコネクションを記述した定義ファイルを生成する。
XHTML、MathML、SVGなどの主要なボキャブラリに対応したビューワやエディタは既に開発されているが、図2に示した文書のようなオリジナルなボキャブラリで記述された文書に対応したビューワやエディタを開発するのは現実的でない。しかし、上記のように、他のボキャブラリにマッピングするための定義ファイルを作成すれば、ビューワやエディタを開発しなくても、VC機能を利用して、オリジナルなボキャブラリで記述された文書を表示・編集することができる。
図7は、定義ファイル生成部86により生成された画面レイアウトの他の例を示す。図7の例では、成績管理ボキャブラリで記述されたXML文書を表示するための画面に、表90と、円グラフ93が作成されている。この円グラフ93は、SVGにより記述される。後述するように、本前提技術の文書処理装置20は、一つのXML文書内に複数のボキャブラリを含む複合文書を処理することができるので、この例のように、HTMLで記述された表90と、SVGで記述された円グラフ93とを、一つの画面上に表示することができる。
図8は、文書処理装置20によるXML文書の編集画面の一例を示す。図8の例では、一つの画面が複数に分割されており、それぞれの領域において、処理対象となるXML文書を異なる複数の表示形式により表示している。領域94には、文書のソースが表示されており、領域95には、文書のツリー構造が表示されており、領域96には、図5に示したHTMLにより記述された表が表示されている。これらのいずれの画面上においても、文書の編集が可能であり、いずれかの画面上でユーザが編集を行うと、ソースツリーが変更され、それぞれの画面の表示を担当するプラグインが、ソースツリーの変更を反映すべく画面を更新する。具体的には、ソースツリーの変更を通知するミューテーションイベントのリスナーとして、それぞれの編集画面の表示を担当するプラグインの表示部を登録しておき、いずれかのプラグイン又はVCユニット80によりソースツリーが変更されたときに、編集画面を表示中の全ての表示部が、発行されたミューテーションイベントを受け取って画面を更新する。このとき、プラグインがVC機能により表示を行っている場合は、VCユニット80がソースツリーの変更に追従してデスティネーションツリーを変更した後、変更されたデスティネーションツリーを参照してプラグインの表示部が画面を更新する。
例えば、ソース表示及びツリー表示を、専用のプラグインにより実現している場合は、ソース表示用プラグインとツリー表示用プラグインは、デスティネーションツリーを用いず、直接ソースツリーを参照して表示を行う。この場合、いずれかの画面において編集が行われると、ソース表示用プラグインとツリー表示用プラグインは、変更されたソースツリーを参照して画面を更新し、領域96の画面を担当しているHTMLユニット50は、ソースツリーの変更に追従して変更されたデスティネーションツリーを参照して画面を更新する。
ソース表示及びツリー表示は、VC機能を利用して実現することもできる。すなわち、ソース、ツリー構造をHTMLによりレイアウトし、そのHTMLにXML文書をマッピングして、HTMLユニット50により表示してもよい。この場合、ソース形式、ツリー形式、表形式の3つのデスティネーションツリーが生成されることになる。いずれかの画面において編集が行われると、VCユニット80は、ソースツリーを変更した後、ソース形式、ツリー形式、表形式の3つのデスティネーションツリーをそれぞれ変更し、HTMLユニット50は、それらのデスティネーションツリーを参照して、3つの画面を更新する。
このように、一つの画面上に複数の表示形式で文書を表示することにより、ユーザの利便性を向上させることができる。例えば、ユーザは、ソース表示又はツリー表示により文書の階層構造を把握しつつ、表90などを用いて視覚的に分かりやすい形式で文書を表示し、編集することができる。上記の例では、一つの画面を分割して複数の表示形式による画面を同時に表示したが、一つの画面に一つの表示形式による画面を表示し、表示形式をユーザの指示により切り替え可能としてもよい。この場合、主制御ユニット22が、ユーザから表示形式の切り替え要求を受け付け、各プラグインに指示して表示を切り替える。
図9は、文書処理装置20により編集されるXML文書の他の例を示す。図9に示したXML文書では、SVG文書の「foreignObject」タグの中にXHTML文書が埋め込まれており、さらに、XHTML文書の中にMathMLで記述された数式が入っている。このような場合、編集ユニット24が、名前空間を参照して、適切な表示系に描画作業を振り分ける。図9の例では、編集ユニット24は、まず、SVGユニット60に四角形を描画させ、つづいて、HTMLユニット50にXHTML文書を描画させる。さらに、図示しないMathMLユニットに、数式を描画させる。こうして、複数のボキャブラリを包含する複合文書が適切に表示される。表示結果を図10に示す。
文書編集中、カーソル(キャリッジ)の位置に応じて、表示されるメニューを切り替えてもよい。すなわち、カーソルが、SVG文書が表示された領域内に存在するときは、SVGユニット60が提供するメニュー、又はSVG文書をマッピングするための定義ファイルに定義されたコマンドを表示し、カーソルが、XHTML文書が表示された領域内に存在するときは、HTMLユニット50が提供するメニュー、又はXHTML文書をマッピングするための定義ファイルに定義されたコマンドを表示する。これにより、編集位置に応じて適切なユーザインターフェースを提供することができる。
複合文書において、あるボキャブラリに対応する適切なプラグイン又はマッピング定義ファイルがなかった場合は、そのボキャブラリにより記述された部分は、ソース表示又はツリー表示されてもよい。従来、ある文書に他の文書を埋め込んだ複合文書を開くとき、埋め込まれた文書を表示するアプリケーションがインストールされていないと、その内容を表示することができなかったが、本前提技術では、表示用のアプリケーションが存在しなくても、テキストデータにより構成されたXML文書をソース表示又はツリー表示することにより内容を把握することができる。これは、テキストベースであるXMLなどの文書ならではの特徴といえる。
データがテキストベースで記述されることの他の利点として、例えば、複合文書中の、あるボキャブラリにより記述される部分において、同一文書内の他のボキャブラリで記述された部分のデータを参照してもよい。また、文書内で検索を実行する時に、SVGなどの図に埋め込まれた文字列も検索対象とすることができる。
あるボキャブラリにより記述された文書内に、他のボキャブラリのタグを用いてもよい。このXML文書は、妥当(valid)ではないが、整形式(well-formed)であれば、有効なXML文書として処理可能である。この場合、挿入された他のボキャブラリのタグは、定義ファイルによりマッピングされてもよい。例えば、XHTML文書中に、「重要」、「最重要」などのタグを使用し、これらのタグで囲まれた部分を強調表示してもよいし、重要度の順にソートして表示してもよい。
図10に示した編集画面において、ユーザにより文書が編集されると、編集された部分を担当するプラグイン又はVCユニット80がソースツリーを変更する。ソースツリーには、ノードごとにミューテーションイベントのリスナーを登録できるようになっており、通常は、各ノードが属するボキャブラリに対応したプラグインの表示部又はVCユニット80がリスナーとして登録される。DOM提供部32は、ソースツリーが変更されると、変更されたノードから上位の階層へたどって、登録されたリスナーがあれば、そのリスナーへミューテーションイベントを発行する。例えば、図9に示した文書において、<html>ノードの下位のノードが変更された場合、<html>ノードにリスナーとして登録されたHTMLユニット50にミューテーションイベントが通知されるとともに、その上位の<svg>ノードにリスナーとして登録されたSVGユニット60にもミューテーションイベントが通知される。このとき、HTMLユニット50は、変更されたソースツリーを参照して表示を更新する。SVGユニット60は、自身のボキャブラリに属するノードが変更されていないので、ミューテーションイベントを無視してもよい。
編集の内容によっては、HTMLユニット50による表示の更新に伴って、全体のレイアウトが変わる可能性がある。この場合は、画面のレイアウトを管理する構成、例えば最上位のノードの表示を担当するプラグインにより、プラグインごとの表示領域のレイアウトが更新される。例えば、HTMLユニット50による表示領域が以前より大きくなった場合、HTMLユニット50は、まず自身の担当する部分を描画して、表示領域の大きさを決定する。そして、画面のレイアウトを管理する構成に、変更後の表示領域の大きさを通知し、レイアウトの更新を依頼する。画面のレイアウトを管理する構成は、通知を受けて、プラグインごとの表示領域を再レイアウトする。こうして、編集された部分の表示が適切に更新されるとともに、画面全体のレイアウトが更新される。
つづいて、前提技術の文書処理装置20を実現する機能構成について更に詳細に説明する。以下の説明では、クラス名などを記載する際には、英字をそのまま用いて記載することにする。
A.概要
インターネットの出現により、ユーザによって処理され管理される文書の数が、ほぼ指数関数的に増加してきた。インターネットの核を形成するウェブ(World Wide Web)は、そのような文書データの大きな受け皿となっている。ウェブは、文書に加えて、このような文書の情報検索システムを提供する。これらの文書は、通常、マークアップ言語により記述される。マークアップ言語のシンプルかつポピュラーな例の一つにHTML(HyperText Markup Language)がある。このような文書は、ウェブの他の位置に格納されている他の文書へのリンクをさらに含む。XML(eXtensible Markup Language)は、さらに高度でポピュラーなマークアップ言語である。ウェブ文書にアクセスし、閲覧するためのシンプルなブラウザが、Java(登録商標)のようなオブジェクト指向のプログラミング言語で開発されている。
マークアップ言語により記述された文書は、通常、ブラウザや他のアプリケーションの中では、ツリーデータ構造の形で表現される。この構造は、文書を構文解析した結果のツリーに相当する。DOM(Document Object Model)は、文書を表現し、操作するために使用される、よく知られたツリーベースのデータ構造モデルである。DOMは、HTMLやXML文書などを含む文書を表現するための標準的なオブジェクトのセットを提供する。DOMは、文書内のコンポーネントを表現するオブジェクトがどのようにつながっているかという標準モデルと、それらのオブジェクトにアクセスしたり操作したりするための標準インタフェイスという、2つの基本的なコンポーネントを含む。
アプリケーション開発者は、独自のデータ構造やAPI(Application Program Interface)へのインタフェイスとしてDOMをサポートすることができる。他方、文書を作成するアプリケーション開発者は、彼らのAPIの独自インタフェイスではなく、DOMの標準インタフェイスを使用することができる。したがって、標準を提供するというその能力により、DOMは、様々な環境、特にウェブにおいて、文書の相互利用を促進させるために有効である。DOMのいくつかのバージョンが定義されており、異なるプログラミング環境及びアプリケーションによって使用されている。
DOMツリーは、対応するDOMの内容に基づいた文書の階層的表現である。DOMツリーは「根(ルート)」、及びルートから発生する1つ以上の「節(ノード)」を含む。ルートが文書全体を表す場合もある。中間のノードは、例えば、テーブル及びそのテーブル中の行及び列のような要素を表すことができる。DOMツリーの「葉」は、通常、それ以上分解できないテキストや画像のようなデータを表す。DOMツリーの各ノードは、フォント、サイズ、色、インデントなど、ノードによって表される要素のパラメータを記述する属性に関連付けられてもよい。
HTMLは、文書を作成するために一般に用いられる言語であるが、フォーマット及びレイアウト用の言語であり、データ記述のための言語ではない。HTMLドキュメントを表現するDOMツリーのノードは、HTMLのフォーマッティングタグとして予め定義されたエレメントであって、通常、HTMLは、データの詳述や、データのタギング/ラベリングのための機能を提供しないので、HTMLドキュメント中のデータに対するクエリを定式化することは多くの場合困難である。
ネットワーク設計者たちの目指すものは、ウェブ上の文書がソフトウェアアプリケーションによってクエリされたり処理されたりできるようにすることである。表示方法とは無関係で、階層的に構造化された言語であれば、そのようにクエリされ処理されることができる。XML(eXtensible Markup Language)のようなマークアップ言語は、これらの特徴を提供することができる。
HTMLとは逆に、XMLのよく知られた利点は、文書の設計者が自由に定義可能な「タグ」を使用して、データ要素にラベルを付けることが可能である点である。このようなデータ要素は、階層的に構造化することができる。さらに、XML文書は、文書内で用いられるタグ及びそれらの相互関係の「文法」を記述した文書型定義を含むことができる。構造化されたXML文書の表示方法を定義するために、CSS(Cascading Style Sheet)又はXSL(XML Style Language)が使用される。DOM、HTML、XML、CSS、XSL及び関連する言語の特徴に関する付加的な情報は、ウェブからも得ることができる。(例えば、http://www.w3.org/TR/)
Xpathは、XML文書の部分の位置を指定するために共通のシンタックス及びセマンティクスを提供する。機能性の例として、XML文書に対応するDOMツリーのトラバース(移動)がある。それは、XML文書の様々な表現に関連した文字列、数、及びブーリアン文字の操作のための基本的な機能を提供する。Xpathは、XML文書の見た目のシンタックス、例えば、テキストとしてみたときに何行目であるとか何文字目であるとかといった文法ではなく、DOMツリーなどの抽象的・論理的な構造において動作する。Xpathを使用することにより、例えばXML文書のDOMツリー内の階層的構造を通じて場所を指定することができる。アドレシングのための使用の他に、Xpathは、DOMツリー中のノードがパターンにマッチするか否かをテストするために使用されるようにも設計されている。XPathに関する更なる詳細は、http://www.w3.org/TR/xpathで得ることができる。
XMLの既知の利点及び特徴により、マークアップ言語(例えばXML)で記述された文書を扱うことができ、文書を作成及び修正するためのユーザフレンドリーなインタフェイスを提供することができる、効果的な文書処理システムが求められる。
ここで説明されるシステムの構成のうちのいくつかは、MVC(Model-View-Controller)と呼ばれる、よく知られたGUI(Graphical User Interface)パラダイムを用いて説明される。MVCパラダイムは、アプリケーション又はアプリケーションのインタフェイスの一部を、3つの部分、すなわち、モデル、ビュー、コントローラに分割する。MVCは、元は、GUIの世界に、従来の入力、処理、出力の役割を割り当てるために開発された。
[入力] → [処理] → [出力]
[コントローラ]→ [モデル] → [ビュー]
MVCパラダイムによれば、外界のモデリング、ユーザへの視覚的なフィードバック、及びユーザの入力は、モデル(M)、ビュー(V)、及びコントローラ(C)オブジェクトにより分離されて扱われる。コントローラは、ユーザからのマウスとキーボード入力のような入力を解釈し、これらのユーザアクションを、適切な変更をもたらすためにモデル及び/又はビューに送られるコマンドにマップするように作用する。モデルは、1以上のデータ要素を管理するように作用し、その状態に関するクエリに応答し、状態を変更する指示に応答する。ビューは、ディスプレイの長方形の領域を管理するように作用し、グラフィクスとテキストの組合せによりユーザにデータを提示する機能を有する。
B.文書処理システムの全体構成
文書処理システムの実施例は、図11−29に関連して明らかにされる。
図11(a)は、後述するタイプの文書処理システムの基礎として機能する要素の従来の構成例を示す。構成10は、通信経路13によりメモリ12に接続されたCPU又はマイクロプロセッサ11などの形式のプロセッサを含む。メモリ12は、現在又は将来に利用可能な任意のROM及び/又はRAMの形式であってもよい。通信経路13は、典型的にはバスとして設けられる。マウス、キーボード、音声認識システムなどのユーザ入力装置14及び表示装置15(又は他のユーザインタフェイス)に対する入出力インタフェイス16も、プロセッサ11とメモリ12の通信のためのバスに接続される。この構成は、スタンドアロンであってもよいし、複数の端末及び1以上のサーバが接続されてネットワーク化された形式であってもよいし、既知のいかなる方式により構成されてもよい。本発明は、これらのコンポーネントの配置、集中又は分散されたアーキテクチャー、あるいは様々なコンポーネントの通信方法により制限されない。
さらに、本システム及びここで議論される実施例は、様々な機能性を提供するいくつかのコンポーネント及びサブコンポーネントを含むものとして議論される。これらのコンポーネント及びサブコンポーネントは、注目された機能性を提供するために、ハードウェアとソフトウェアの組合せだけでなく、ハードウェアのみ、ソフトウェアのみによっても実現されうる。さらに、ハードウェア、ソフトウェア、及びそれらの組合せは、汎用の計算装置、専用のハードウェア、又はそれらの組合せにより実現されうる。したがって、コンポーネント又はサブコンポーネントの構成は、コンポーネント又はサブコンポーネントの機能性を提供するための特定のソフトウェアを実行する汎用/専用の計算装置を含む。
図11(b)は、文書処理システムの一例の全体のブロック図を示す。このような文書処理システムにおいて文書が生成され編集される。これらの文書は、例えばXMLなど、マークアップ言語の特徴を有する任意の言語により記述されてもよい。また、便宜上、特定のコンポーネント及びサブコンポーネントの用語及び表題を創造した。しかしながら、これらは、この開示の一般的な教示の範囲を制限するために解釈されるべきではない。
文書処理システムは、2つの基本的な構成を有するものととらえることができる。第1の構成は、文書処理システムが動作する環境である「実行環境」101である。例えば、実行環境は、文書の処理中及び管理中に、ユーザだけでなくシステムも支援する、基本的なユーティリティ及び機能を提供する。第2の構成は、実行環境において走るアプリケーションから構成される「アプリケーション」102である。これらのアプリケーションは、文書自身及び文書の様々な表現を含む。
1.実行環境
実行環境101のキーとなるコンポーネントはProgramInvoker(プログラムインボーカ:プログラム起動部)103である。ProgramInvoker103は、文書処理システムを起動するためにアクセスされる基本的なプログラムである。例えば、ユーザが文書処理システムにログオンして開始するとき、ProgramInvoker103が実行される。ProgramInvoker103は、例えば、文書処理システムにプラグインとして加えられた機能を読み出して実行させたり、アプリケーションを開始して実行させたり、文書に関連するプロパティを読み出すことができる。ProgramInvoker103の機能はこれらに限定されない。ユーザが実行環境内で実行されるように意図されたアプリケーションを起動したいとき、ProgramInvoker103は、そのアプリケーションを見つけ、それを起動して、アプリケーションを実行する。
ProgramInvoker103には、プラグインサブシステム104、コマンドサブシステム105、及びResource(リソース)モジュール109などのいくつかのコンポーネントがアタッチされている。これらの構成については、以下に詳述する。
a)プラグインサブシステム
プラグインサブシステム104は、文書処理システムに機能を追加するための高度に柔軟で効率的な構成として使用される。プラグインサブシステム104は、また、文書処理システムに存在する機能を修正又は削除するために使用することができる。さらに、種々様々の機能をプラグインサブシステムを使用して追加又は修正することができる。例えば、画面上への文書の描画を支援するように作用するEditlet(エディットレット:編集部)機能を追加することもできる。Editletプラグインは、システムに追加されるボキャブラリの編集も支援する。
プラグインサブシステム104は、ServiceBroker(サービスブローカ:サービス仲介部)1041を含む。ServiceBroker1041は、文書処理システムに加えられるプラグインを管理することにより、文書処理システムに加えられるサービスを仲介する。
所望の機能性を実現する個々の機能は、Service(サービス)1042の形でシステムに追加される。利用可能なService1042のタイプは、Application(アプリケーション)サービス、ZoneFactory(ゾーンファクトリ:ゾーン生成部)Service、Editlet(エディットレット:編集部)Service、CommandFactory(コマンドファクトリ:コマンド生成部)Service、ConnectXPath(コネクトXPath:XPath管理部)Service、CSSComputation(CSSコンピューテーション:CSS計算部)Serviceなどを含むが、これらに限定されない。これらのService、及びシステムの他の構成とそれらとの関係は、文書処理システムについてのよりよい理解のために、以下に詳述される。
プラグインとServiceの関係は以下の通りである。プラグインは、1以上のServiceProvider(サービスプロバイダ:サービス提供部)を含むことができるユニットである。それぞれのServiceProviderは、それに関連したServiceの1以上のクラスを有する。例えば、適切なソフトウェアアプリケーションを有する単一のプラグインを使用することにより、1以上のServiceをシステムに追加することができ、これにより、対応する機能をシステムに追加することができる。
b)コマンドサブシステム
コマンドサブシステム105は、文書の処理に関連したコマンドの形式の命令を実行するために使用される。ユーザは、一連の命令を実行することにより、文書に対する操作を実行することができる。例えば、ユーザは、コマンドの形で命令を発行することにより、文書処理システム中のXML文書に対応するXMLのDOMツリーを編集し、XML文書を処理する。これらのコマンドは、キーストローク、マウスクリック、又は他の有効なユーザインタフェイスアクションを使用して入力されてもよい。1つのコマンドにより1以上の命令が実行されることもある。この場合、これらの命令が1つのコマンドにラップ(包含)され、連続して実行される。例えば、ユーザが、誤った単語を正しい単語に置換したいとする。この場合、第1の命令は、文書中の誤った単語を発見することであり、第2の命令は、誤った単語を削除することであり、第3の命令は、正しい単語を挿入することであってもよい。これらの3つの命令が1つのコマンドにラップされてもよい。
コマンドは、関連した機能、例えば、後で詳述する「アンドゥ」機能を有してもよい。これらの機能は、オブジェクトを生成するために使用されるいくつかの基本クラスにも割り当てられてもよい。
コマンドサブシステム105のキーとなるコンポーネントは、選択的にコマンドを与え、実行するように作用するCommandInvoker(コマンドインボーカ:コマンド起動部)1051である。図11(b)には、1つのCommandInvokerのみが示されているが、1以上のCommandInvokerが使用されてもよく、1以上のコマンドが同時に実行されてもよい。CommandInvoker1051は、コマンドを実行するために必要な機能及びクラスを保持する。動作において、実行されるべきCommand(コマンド:命令)1052は、Queue(キュー)1053に積まれる。CommandInvokerは、連続的に実行するコマンドスレッドを生成する。CommandInvoker内で既に実行中のCommandがなければ、CommandInvoker1051により実行されるように意図されたCommand1052が実行される。CommandInvokerが既にコマンドを実行している場合、新しいCommandは、Queue1053の最後に積まれる。しかしながら、それぞれのCommandInvoker1051では、一度に1つのCommandのみが実行される。指定されたCommandの実行に失敗した場合、CommandInvoker1051は例外処理を実行する。
CommandInvoker1051により実行されるCommandの型は、UndoableCommand(取消可能コマンド)1054、AsynchronousCommand(非同期コマンド)1055、及びVCCommand(VCコマンド)1056を含むが、これらに限定されない。UndoableCommand1054は、ユーザが望めば、そのCommandの結果を取り消すことが可能なCommandである。UndoableCommandの例として、切り取り、コピー、テキストの挿入、などがある。動作において、ユーザが文書の一部を選択し、その部分に切り取りコマンドを適用するとき、UndoableCommandを用いることにより、切り取られた部分は、必要であれば、「切り取られていない」ようにすることができる。
VCCommand1056は、ボキャブラリコネクション記述子(Vocabulary Connection Descriptor:VCD)スクリプトファイルに格納される。これらは、プログラマにより定義されうるユーザ指定のCommandである。Commandは、例えば、XMLフラグメントを追加したり、XMLフラグメントを削除したり、属性を設定したりするための、より抽象的なCommandの組合せであってもよい。これらのCommandは、特に、文書の編集に焦点を合わせている。
AsynchronousCommand1055は、文書のロードや保存など、システムよりのCommandであり、UndoableCommandやVCCommandとは別に、非同期的に実行される。AsynchronousCommandは、UndoableCommandではないので、取り消すことはできない。
c)リソース
Resource109は、様々なクラスに、いくつかの機能を提供するオブジェクトである。例えば、ストリングリソース、アイコン、及びデフォルトキーバインドは、システムで使用されるResourceの例である。
2.アプリケーションコンポーネント
文書処理システムの第2の主要な特徴であるアプリケーションコンポーネント102は、実行環境101において実行される。アプリケーションコンポーネント102は、実際の文書と、システム内における文書の様々な論理的、物理的な表現を含む。さらに、アプリケーションコンポーネント102は、文書を管理するために使用されるシステムの構成を含む。アプリケーションコンポーネント102は、さらに、UserApplication(ユーザアプリケーション)106、アプリケーションコア108、ユーザインタフェイス107、及びCoreComponent(コアコンポーネント)110を含む。
a)ユーザアプリケーション
UserApplication106は、ProgramInvoker103と共にシステム上にロードされる。UserApplication106は、文書と、文書の様々な表現と、文書と対話するために必要なユーザインタフェイスとをつなぐ接着剤となる。例えば、ユーザが、プロジェクトの一部である文書のセットを生成したいとする。これらの文書がロードされると、文書の適切な表現が生成される。ユーザインタフェイス機能は、UserApplication106の一部として追加される。言いかえれば、UserApplication106は、ユーザがプロジェクトの一部を形成する文書と対話することを可能とする文書の表現と、文書の様々な態様とを、共に保持する。一旦UserApplication106が生成されると、ユーザがプロジェクトの一部を形成する文書との対話を望むたびに、ユーザは簡単に実行環境上にUserApplication106をロードすることができる。
b)コアコンポーネント
CoreComponent110は、複数のPane(ペイン)の間で文書を共有する方法を提供する。後で詳述するように、Paneは、DOMツリーを表示し、画面の物理的なレイアウトを扱う。例えば、物理的な画面は、個々の情報の断片を描写する画面内の複数のPaneからなる。ユーザから画面上に見える文書は、1又はそれ以上のPaneに出現しうる。また、2つの異なる文書が画面上で2つの異なるPaneに現れてもよい。
図11(c)に示されるように、画面の物理的なレイアウトもツリーの形式になっている。Paneは、RootPane(ルートペイン)1084にもなり得るし、SubPane(サブペイン)1085にもなり得る。RootPane1084は、Paneのツリーの根に当たるPaneであり、SubPane1085は、RootPane1084以外の任意のPaneである。
CoreComponent110は、さらに、フォントを提供し、ツールキットなど、文書のための複数の機能的な操作のソースの役割を果たす。CoreComponent110により実行されるタスクの一例に、複数のPane間におけるマウスカーソルの移動がある。実行されるタスクの他の例として、あるPane中の文書の一部をマークし、それを異なる文書を含む別のPane上にコピーする。
c)アプリケーションコア
上述したように、アプリケーションコンポーネント102は、システムにより処理され管理される文書から構成される。これは、システム内における文書の様々な論理的及び物理的な表現を含む。アプリケーションコア108は、アプリケーションコンポーネント102の構成である。その機能は、実際の文書を、それに含まれる全てのデータとともに保持することである。アプリケーションコア108は、DocumentManager(ドキュメントマネージャ:文書管理部)1081及びDocument(ドキュメント:文書)1082自身を含む。
DocumentManager1081の様々な態様を以下に詳述する。DocumentManager1081は、Document1082を管理する。DocumentManager1081は、RootPane1084、SubPane1085、ClipBoard(クリップボード)ユーティリティ1087、及びSnapShot(スナップショット)ユーティリティ1088にも接続される。ClipBoardユーティリティ1087は、ユーザがクリップボードに加えることを決定した文書の部分を保持する方法を提供する。例えば、ユーザが、文書の一部を切り取り、後で再考するために新規文書にそれを保存することを望んだとする。このような場合、切り取られた部分がClipBoardに追加される。
つづいて、SnapShotユーティリティ1088についても説明する。SnapShotユーティリティ1088は、アプリケーションがある状態から別の状態まで移行するときに、アプリケーションの現在の状態を記憶することを可能とする。
d)ユーザインタフェイス
アプリケーションコンポーネント102の別の構成は、ユーザがシステムと物理的に対話する手段を提供するユーザインタフェイス107である。例えば、ユーザインタフェイスは、ユーザが文書をアップロードしたり、削除したり、編集したり、管理したりするために使用される。ユーザインタフェイスは、Frame(フレーム)1071、MenuBar(メニューバー)1072、StatusBar(ステータスバー)1073、及びURLBar(URLバー)1074を含む。
Frame1071は、一般に知られているように、物理的な画面のアクティブな領域であるとみなされる。MenuBar1072は、ユーザに選択を提供するメニューを含む画面領域である。StatusBar1073は、アプリケーションの実行状態を表示する画面領域である。URLBar1074は、インターネットをナビゲートするためにURLアドレスを入力する領域を提供する。
C.文書管理及び関連するデータ構造
図12は、DocumentManager1081の詳細を示す。これは、文書処理システム内で文書を表現するために用いられるデータ構造及び構成を含む。分かりやすくするために、このサブセクションで説明される構成は、MVCパラダイムを用いて説明される。
DocumentManager1081は、文書処理システム内にある全ての文書を保持しホストするDocumentContainer(ドキュメントコンテナ:文書コンテナ)203を含む。DocumentManager1081にアタッチされたツールキット201は、DocumentManager1081により使用される様々なツールを提供する。例えば、DomService(DOMサービス)は、文書に対応するDOMを生成し、保持し、管理するために必要とされる全ての機能を提供するために、ツールキット201により提供されるツールである。ツールキット201により提供される別のツールであるIOManager(入出力管理部)は、システムへの入力及びシステムからの出力を管理する。同様に、StreamHandler(ストリームハンドラ)は、ビットストリームによる文書のアップロードを扱うツールである。これらのツールは、図中に特に示さず、参照番号を割り当てないが、ツールキット201のコンポーネントを形成する。
MVCパラダイムの表現によれば、モデル(M)は、文書のDOMツリーモデル202を含む。前述したように、全ての文書は、文書処理システムにおいてDOMツリーとして表現される。文書は、また、DocumentContainer203の一部を形成する。
1.DOMモデル及びゾーン
文書を表現するDOMツリーは、Node(ノード)2021を有するツリーである。DOMツリーの部分集合であるZone(ゾーン)209は、DOMツリー内の1以上のNodeの関連領域を含む。例えば、画面上で文書の一部のみを表示し得るが、この可視化された文書の一部はZone209を用いて表示される。Zoneは、ZoneFactory(ゾーンファクトリ:ゾーン生成部)205と呼ばれるプラグインを用いて、生成され、取り扱われ、処理される。ZoneはDOMの一部を表現するが、1以上の「名前空間」を使用してもよい。よく知られているように、名前空間は、名前空間内でユニークな名前の集合である。換言すれば、名前空間内に同じ名前は存在しない。
2.Facet及びFacetとZoneとの関係
Facet(ファセット)2022は、MVCパラダイムのモデル(M)部分内の別の構成である。Facetは、ZoneにおいてNodeを編集するために使用される。Facet2022は、Zone自身の内容に影響を与えずに実行することができる手続(プロシージャ)を使用して、DOMへのアクセスを編成する。次に説明するように、これらの手続は、Nodeに関連した重要で有用な操作を実行する。
各Nodeは、対応するFacetを有する。DOMの中のNodeを直接操作する代わりに、操作を実行するためにFacetを使用することによって、DOMの保全性は保護される。操作がNode上で直接実行される場合、いくつかのプラグインがDOMを同時に変更することができ、その結果矛盾を引き起こす。
W3Cが策定したDOMの標準規格は、Nodeを操作するための標準的なインタフェイスを定義するが、実際には、ボキャブラリごと又はNodeごとに特有の操作があるので、これらの操作をAPIとして用意しておくのが好都合である。文書処理システムでは、このような各Nodeに特有のAPIをFacetとして用意し、各Nodeにアタッチする。これにより、DOMの標準規格に準拠しつつ、有用なAPIを付加することができる。また、ボキャブラリごとに特有のDOMを実装するのではなく、標準的なDOMの実装に、後から特有のAPIを付加するようにすることで、多様なボキャブラリを統一的に処理することができるともに、複数のボキャブラリが任意の組合せで混在した文書を適切に処理することができる。
ボキャブラリは、名前空間に属するタグ(例えばXMLのタグ)のセットである。上述したように、名前空間は、ユニークな名前(ここではタグ)のセットを有する。ボキャブラリは、XML文書を表現するDOMツリーのサブツリーとして現れる。このサブツリーはZoneを含む。特定の例においては、タグセットの境界はZoneによって定義される。Zone209は、ZoneFactory205と呼ばれるServiceを利用して生成される。上述したように、Zone209は、文書を表現するDOMツリーの一部の内部表現である。このような文書の一部へのアクセスを提供するために、論理的な表現が要求される。この論理的表現は、文書が画面上で論理的にどのように表現されるかについてコンピュータに通知する。Canvas(キャンバス)210は、Zoneに対応する論理的なレイアウトを提供するように作用するServiceである。
他方、Pane211は、Canvas210により提供される論理的なレイアウトに対応する物理的な画面レイアウトである。実際、ユーザは表示画面上で文字や画像によって文書のレンダリングのみを見る。したがって、文書は、画面上に文字や画像を描画するプロセスにより、画面上に描写されなければならない。文書は、Pane211により提供される物理的なレイアウトに基づいて、Canvas210により画面上に描写される。
Zone209に対応するCanvas210は、Editlet206を使用して生成される。文書のDOMは、Editlet206及びCanvas210を使用して編集される。元の文書の完全性を維持するために、Editlet206及びCanvas210は、Zone209における1以上のNodeに対応するFacetを使用する。これらのServiceは、Zone及びDOM内のNodeを直接操作しない。Facetは、Command207を利用して操作される。
ユーザは、一般に、画面上のカーソルを移動させたり、コマンドをタイプしたりすることによって、画面と対話する。画面上の論理的なレイアウトを提供するCanvas210は、このカーソル操作を受け付ける。Canvas210は、対応するアクションをFacetに実行させることができる。この関係により、カーソルサブシステム204は、DocumentManager1081に対して、MVCパラダイムのコントローラ(C)として機能する。Canvas210は、イベントを扱うタスクも有する。例えば、Canvas210は、マウスクリック、フォーカス移動、及びユーザにより起こされた同様のアクションなどのイベントを扱う。
3.Zone、Facet、Canvas及びPaneの間の関係の概要
文書処理システム内の文書は、少なくとも4つの観点から見ることができる。すなわち、1)文書処理システムにおいて文書の内容及び構造を保持するために用いられるデータ構造、2)文書の保全性に影響を与えずに文書の内容を編集する手段、3)文書の画面上の論理的なレイアウト、4)文書の画面上の物理的なレイアウト、である。Zone、Facet、Canvas及びPaneは、前述の4つの観点に相当する、文書処理システムのコンポーネントをそれぞれ表す。
4.アンドゥサブシステム
上述したように、文書に対するいかなる変更(例えば編集)も取消可能であることが望ましい。例えば、ユーザが編集操作を実行し、次に、その変更の取消を決定したとする。図12に関連して、アンドゥサブシステム212は、文書管理部の取消可能なコンポーネントを実現する。UndoManager(アンドゥマネージャ:アンドゥ管理部)2121は、ユーザによって取り消される可能性のある全ての文書に対する操作を保持する。
例えば、ユーザが、文書中の単語を別の単語に置換するコマンドを実行したとする。その後、ユーザは考え直し、元の単語に戻すことを決定したとする。アンドゥサブシステム212は、このような操作を支援する。UndoManager2121は、このようなUndoableEdit(アンドゥアブルエディット:取消可能な編集)2122の操作を保持する。
5.カーソルサブシステム
前述したように、MVCのコントローラ部分は、カーソルサブシステム204を備えてもよい。カーソルサブシステム204は、ユーザから入力を受け付ける。これらの入力は、一般にコマンド及び/又は編集操作の性格を有している。したがって、カーソルサブシステム204は、DocumentManager1081に関連したMVCパラダイムのコントローラ(C)部分であると考えることができる。
6.ビュー
前述したように、Canvas210は、画面上に提示されるべき文書の論理的なレイアウトを表す。XHTML文書の例では、Canvas210は、文書が画面上でいかに見えるかを論理的に表現したボックスツリー208を含んでもよい。このボックスツリー208は、DocumentManager1081に関連したMVCパラダイムのビュー(V)部分に含まれよう。
D.ボキャブラリコネクション
文書処理システムの重要な特徴は、XML文書を、他の表現にマップして取り扱うことが可能で、かつ、マップした先の表現を編集すると、その編集が元のXML文書に整合性を保ちつつ反映される環境を提供することにある。
マークアップ言語により記述された文書、例えばXML文書は、文書型定義により定義されたボキャブラリに基づいて作成されている。ボキャブラリは、タグのセットである。ボキャブラリは、任意に定義されてもよいため、無限に多くのボキャブラリが存在しうる。しかしながら、多数の可能なボキャブラリのそれぞれに対して専用の処理/管理環境を提供するのは現実的ではない。ボキャブラリコネクションは、この問題を解決する方法を提供する。
例えば、文書は2以上のマークアップ言語により記述されてもよい。文書は、例えば、XHTML(eXtensible HyperText Markup Language)、SVG(Scalable Vector Graphics)、MathML(Mathematical Markup Language)、その他のマークアップ言語により記述されてもよい。換言すれば、マークアップ言語は、XMLにおけるボキャブラリやタグセットと同様に見なされてもよい。
ボキャブラリは、ボキャブラリプラグインを用いて処理される。文書処理システムにおいてプラグインが利用不可能であるボキャブラリにより記述された文書は、プラグインが利用可能である別のボキャブラリの文書にマッピングすることにより表示される。この特徴により、プラグインが用意されていないボキャブラリの文書も適切に表示することができる。
ボキャブラリコネクションは、定義ファイルを取得し、取得した定義ファイルに基づいて2つの異なるボキャブラリの間でマッピングする能力を含む。あるボキャブラリで記述された文書は、別のボキャブラリにマッピングすることができる。このように、ボキャブラリコネクションは、文書がマッピングされるボキャブラリに対応した表示/編集プラグインにより文書を表示し編集することを可能にする。
上述したように、各文書は、一般に複数のノードを有するDOMツリーとして文書処理システムにおいて記述される。「定義ファイル」は、それぞれのノードについて、そのノードと他のノードとの対応を記述する。各ノードの要素値及び属性値が編集可能か否かが指定される。ノードの要素値又は属性値を用いた演算式が記述されてもよい。
マッピングという特徴を利用して、定義ファイルを適用したデスティネーションDOMツリーが生成される。このように、ソースDOMツリーとデスティネーションDOMツリーの関係が構築され保持される。ボキャブラリコネクションは、ソースDOMツリーとデスティネーションDOMツリーの対応を監視する。ユーザから編集指示を受けると、ボキャブラリコネクションは、ソースDOMツリーの関連したノードを変更する。ソースDOMツリーが変更されたことを示す「ミューテーションイベント」が発行され、デスティネーションDOMツリーがそれに応じて変更される。
ボキャブラリコネクションの使用により、少数のユーザのみに知られていた比較的マイナーなボキャブラリを、別のメジャーなボキャブラリに変換することができる。したがって、少数のユーザによって利用されるマイナーなボキャブラリであっても、文書を適切に表示し、望ましい編集環境を提供することができる。
このように、文書処理システムの一部であるボキャブラリコネクションサブシステムは、文書の複数の表現を可能にする機能を提供する。
図13は、ボキャブラリコネクション(VC:Vocabulary Connection)サブシステム300を示す。VCサブシステム300は、同一の文書の2つの代替表現の整合性を維持する方法を提供する。例えば、2つの表現は、同一文書の、2つの異なるボキャブラリによる表現であってもよい。前述したように、一方はソースDOMツリーであってもよく、他方はデスティネーションDOMツリーであってもよい。
1.ボキャブラリコネクションサブシステム
ボキャブラリコネクションサブシステム300の機能は、VocabularyConnection301と呼ばれるプラグインを使用して、文書処理システムにおいて実現される。文書が表現されるVocabulary305ごとに、対応するプラグインが要求される。例えば、文書の一部がHTMLで記述され、残りがSVGで記述されている場合、HTMLとSVGに対応するボキャブラリプラグインが要求される。
VocabularyConnectionプラグイン301は、適切なVocabulary305の文書に対応した、Zone209又はPane211のための適切なVCCanvas(ボキャブラリコネクションキャンバス)310を生成する。VocabularyConnection301を用いて、ソースDOMツリー内のZone209に対する変更は、変換ルールにより、別のDOMツリー306の対応するZoneに伝達される。変換ルールは、ボキャブラリコネクション記述子(Vocabulary Connection Descriptor:VCD)の形式で記述される。このようなソースDOMとデスティネーションDOMの間の変換に対応するそれぞれのVCDファイルについて、対応するVCManager(ボキャブラリコネクションマネージャ)302が生成される。
2.Connector
Connector304は、ソースDOMツリーのソースノードと、デスティネーションDOMツリーのデスティネーションノードとを接続する。Connector304は、ソースDOMツリー中のソースノード、及びソースノードに対応するソース文書に対する修正(変更)を見るために作用する。そして、対応するデスティネーションDOMツリーのノードを修正する。Connector304は、デスティネーションDOMツリーを修正することができる唯一のオブジェクトである。例えば、ユーザは、ソース文書、及び対応するソースDOMツリーに対してのみ修正を行うことができる。その後、Connector304がデスティネーションDOMツリーに、対応する修正を行う。
Connector304は、ツリー構造を形成するために、論理的にリンクされる。Connector304により形成されたツリーは、ConnectorTree(コネクタツリー)と呼ばれる。Connector304は、ConnectorFactory(コネクタファクトリ:コネクタ生成部)303と呼ばれるServiceを用いて生成される。ConnectorFactory303は、ソース文書からConnector304を生成し、それらをリンクしてConnectorTreeを形成する。VocabularyConnectionManager302は、ConnectorFactory303を保持する。
前述したように、ボキャブラリは名前空間におけるタグのセットである。図示されるように、Vocabulary305は、VocabularyConnection301によって文書に対して生成される。これは、文書ファイルを解析し、ソースDOMとデスティネーションDOMの間の写像のための適切なVocabularyConnectionManager302を生成することにより行われる。さらに、Connectorを生成するConnectorFactory303と、Zone209を生成するZoneFactory205と、Zone内のノードに対応するCanvasを生成するEditlet206との間の適切な関係が作られる。ユーザがシステムから文書を処分又は削除するとき、対応するVocabularyConnectionManager302が削除される。
Vocabulary305は、VCCanvas310を生成する。さらに、Connector304及びデスティネーションDOMツリー306が対応して生成される。
ソースDOM及びCanvasは、それぞれ、モデル(M)及びビュー(V)に対応する。しかしながら、このような表現は、ターゲットのボキャブラリが画面上に描写可能である場合に限って意味がある。描写は、ボキャブラリプラグインにより行われる。ボキャブラリプラグインは、主要なボキャブラリ、例えば、XHTML、SVG、MathMLについて提供される。ボキャブラリプラグインは、ターゲットのボキャブラリに関連して使用される。これらは、ボキャブラリコネクション記述子を用いてボキャブラリ間でマッピングする方法を提供する。
このようなマッピングは、ターゲットのボキャブラリが、マッピング可能で、画面上に描写される方法が予め定義されたものである場合にのみ意味がある。このようなレンダリング方法は、例えばXHTMLなどのように、W3Cなどの組織により定義された標準規格となっている。
ボキャブラリコネクションが必要であるとき、VCCanvasが使用される。この場合、ソースのビューを直接生成することができないので、ソースのCanvasは生成されない。この場合、VCCanvasが、ConnectorTreeを使用して生成される。このVCCanvasは、イベントの変換のみを扱い、画面上の文書の描写を援助しない。
3.DestinationZone、Pane、及びCanvas
上述したように、ボキャブラリコネクションサブシステムの目的は、同一の文書の2つの表現を同時に生成し保持することである。第2の表現も、DOMツリーの形式であり、これはデスティネーションDOMツリーとして既に説明した。第2の表現における文書を見るために、DestinationZone、Canvas及びPaneが必要である。
VCCanvasが作成されると、対応するDestinationPane307が生成される。さらに、関連するDestinationCanvas308と、対応するBoxTree309が生成される。同様に、VCCanvas310も、ソース文書に対するPane211及びZone209に関連づけられる。
DestinationCanvas308は、第2の表現における文書の論理的なレイアウトを提供する。特に、DestinationCanvas308は、デスティネーション表現における文書を描写するために、カーソルや選択のようなユーザインタフェイス機能を提供する。DestinationCanvas308に生じたイベントは、Connectorに供給される。DestinationCanvas308は、マウスイベント、キーボードイベント、ドラッグアンドドロップイベント、及び文書のデスティネーション(第2)表現のボキャブラリに特有なイベントを、Connector304に通知する。
4.ボキャブラリコネクションコマンドサブシステム
ボキャブラリコネクション(VC)サブシステム300の要素として、ボキャブラリコネクション(VC)コマンドサブシステム313がある。ボキャブラリコネクションコマンドサブシステム313は、ボキャブラリコネクションサブシステム300に関連した命令の実行のために使用されるVCCommand(ボキャブラリコネクションコマンド)315を生成する。VCCommandは、内蔵のCommandTemplate(コマンドテンプレート)318を使用して、及び/又は、スクリプトサブシステム314においてスクリプト言語を使用してスクラッチからコマンドを生成することにより、生成することができる。
コマンドテンプレートには、例えば、「If」コマンドテンプレート、「When」コマンドテンプレート、「挿入(Insert)」コマンドテンプレートなどがある。これらのテンプレートは、VCCommandを作成するために使用される。
5.XPathサブシステム
XPathサブシステム316は、文書処理システムの重要な構成であり、ボキャブラリコネクションの実現を支援する。Connector304は、一般にxpath情報を含む。上述したように、ボキャブラリコネクションのタスクの1つは、ソースDOMツリーの変化をデスティネーションDOMツリーに反映させることである。xpath情報は、変更/修正を監視されるべきソースDOMツリーのサブセットを決定するために用いられる1以上のxpath表現を含む。
6.ソースDOMツリー、デスティネーションDOMツリー、及びConnectorTreeの概要
ソースDOMツリーは、別のボキャブラリに変換される前のボキャブラリで文書を表現したDOMツリー又はZoneである。ソースDOMツリーのノードは、ソースノードと呼ばれる。
それに対して、デスティネーションDOMツリーは、ボキャブラリコネクションに関連して前述したように、同一の文書を、マッピングにより変換された後の異なるボキャブラリで表現したDOMツリー又はZoneである。デスティネーションDOMツリーのノードは、デスティネーションノードと呼ばれる。
ConnectorTreeは、ソースノードとデスティネーションノードの対応を表すConnectorに基づく階層的表現である。Connectorは、ソースノードと、ソース文書になされた修正を監視し、デスティネーションDOMツリーを修正する。Connectorは、デスティネーションDOMツリーを修正することを許された唯一のオブジェクトである。
E.文書処理システムにおけるイベントフロー
実用のためには、プログラムはユーザからのコマンドに応答しなければならない。イベントは、プログラム上で実行されたユーザアクションを記述し実行する方法である。多くの高級言語、例えばJava(登録商標)は、ユーザアクションを記述するイベントに頼っている。従来、プログラムは、ユーザアクションを理解し、それを自身で実行するために、積極的に情報を集める必要があった。これは、例えば、プログラムが自身を初期化した後、ユーザが画面、キーボード、マウスなどでアクションを起こしたときに適切な処理を講じるために、ユーザのアクションを繰り返し確認するループに入ることを意味する。しかしながら、このプロセスは扱いにくい。さらに、それは、ユーザが何かをするのを待つ間、CPUサイクルを消費してループするプログラムを必要とする。
多くの言語が、異なるパラダイムを採用することにより、これらの問題を解決している。そのうちの一つは、現代の全てのウィンドウシステムの基礎となっている、イベントドリブンプログラミングである。このパラダイムでは、全てのユーザアクションは、「イベント」と呼ばれる抽象的な事象の集合に属する。イベントは、十分詳細に、特定のユーザアクションを記述する。プログラムがユーザにより生成されたイベントを積極的に収集するのではなく、監視すべきイベントが生じたときに、システムがプログラムに通知する。この方法によりユーザとの対話を扱うプログラムは「イベントドリブン」であると言われる。
これは、多くの場合、全てのユーザにより生成されたイベントの基本特性を獲得する「Event(イベント)」クラスを使用して扱われる。
文書処理システムは、自身のイベント、及びこれらのイベントを扱う方法を定義して使用する。いくつかの型のイベントが使用される。例えば、マウスイベントは、ユーザのマウスアクションから起こるイベントである。マウスを含むユーザアクションは、Canvas210によって、マウスイベントに渡される。このように、Canvasは、システムのユーザによる相互作用の最前部にあると言える。必要であれば、最前部にあるCanvasは、そのイベントに関連した内容を子へ渡す。
それに対して、キーストロークイベントは、Canvas210から流れる。キーストロークイベントは、即時的なフォーカスを有する。すなわち、それは、いかなる瞬間でも作業に関連する。Canvas210上に入力されたキーストロークイベントは、その親に渡される。キー入力は、文字列挿入を扱うことが可能な、異なるイベントによって処理される。文字列の挿入を扱うイベントは、キーボードを使用して文字が挿入されたときに発生する。他の「イベント」は、例えば、ドラッグイベント、ドロップイベント、マウスイベントと同様に扱われる他のイベントを含む。
1.ボキャブラリコネクション外のイベントの取り扱い
イベントは、イベントスレッドを用いて渡される。Canvas210は、イベントを受け取ると、その状態を変更する。必要であれば、Command1052がCanvas210によりCommandQueue1053にポストされる。
2.ボキャブラリコネクション内のイベントの取り扱い
VocabularyConnectionプラグイン301を用いて、DestinationCanvasの一例であるXHTMLCanvas1106は、発生したイベント、例えば、マウスイベント、キーボードイベント、ドラッグアンドドロップイベント、及びボキャブラリに特有のイベントなどを受け取る。これらのイベントは、コネクタ1104に通知される。より詳細には、図21(b)に図示されるように、VocabularyConnectionプラグイン301内のイベントフローは、SourcePane1103、VCCanvas1104、DestinationPane1105、DestinationCanvasの一例であるDestinationCanvas1106、デスティネーションDOMツリー及びConnectorTreeを通過する。
F.ProgramInvoker及びProgramInvokerと他の構成との関係
ProgramInvoker103及びそれと他の構成との関係は、図14(a)に更に詳細に示される。ProgramInvoker103は、文書処理システムを開始するために実行される実行環境中の基本的なプログラムである。図11(b)および図11(c)に図示されるように、UserApplication106、ServiceBroker1041、CommandInvoker1051、及びResource109は、全てProgramInvoker103に接続される。前述したように、アプリケーション102は、実行環境中で実行されるコンポーネントである。同様に、ServiceBroker1041は、システムに様々な機能を加えるプラグインを管理する。他方、CommandInvoker1051は、ユーザにより提供される命令を実行して、コマンドを実行するために使用されるクラス及びファンクションを保持する。
1.プラグイン及びサービス
ServiceBroker1041について、図14(b)を参照して更に詳細に説明する。前述したように、CommandInvoker1041は、システムに様々な機能を追加するプラグイン(及び関連するサービス)を管理する。Service1042は、文書処理システムに特徴を追加又は変更可能な最も下の層である。「Service」は、ServiceCategory401とServiceProvider402の2つの部分からなる。図14(c)に図示されるように、1つのServiceCategory401は、複数の関連するServiceProvider402を持ちうる。それぞれのServiceProviderは、特定のServiceCategoryの一部または全部を実行するように作用する。ServiceCategory401は、他方では、Serviceの型を定義する。
Serviceは、1)文書処理システムに特定の特色を提供する「特色サービス」、2)文書処理システムにより実行されるアプリケーションである「アプリケーションサービス」、3)文書処理システムの全体にわたって必要な特色を提供する「環境サービス」、の3つの型に分類することができる。
Serviceの例は、図14(d)に示される。アプリケーションServiceのCategoryにおいては、システムユーティリティが対応するServiceProviderの例である。同様に、Editlet206はCategoryであり、HTMLEditlet及びSVGEditletは対応するServiceProviderである。ZoneFactory205は、Serviceの別のCategoryであり、対応するServiceProvider(図示せず)を有する。
プラグインは、文書処理システムに機能性を加えると既に説明したが、いくつかのServiceProvider402及びそれらに関連するクラスからなるユニットと見なされてもよい。各プラグインは、宣言ファイルに記述された依存性及びServiceCategory401を有する。
2.ProgramInvokerとアプリケーションとの関係
図14(e)は、ProgramInvoker103とUserApplication106との関係についての更なる詳細を示す。必要な文書やデータなどは、ストレージからロードされる。必要なプラグインは、全てServiceBroker1041上にロードされる。ServiceBroker1041は、全てのプラグインを保持し管理する。プラグインは、システムに物理的に追加することができ、又、その機能はストレージからロードすることができる。プラグインの内容がロードされると、ServiceBroker1041は、対応するプラグインを定義する。つづいて、対応するUserApplication106が生成され、実行環境101にロードされ、ProgramInvoker103にアタッチされる。
G.アプリケーションサービスと環境との関係
図15(a)は、ProgramInvoker103上にロードしたアプリケーションサービスの構成についての更なる詳細を示す。コマンドサブシステム105のコンポーネントであるCommandInvoker1051は、ProgramInvoker103内のCommand1052を起動又は実行する。Command1052は、文書処理システムにおいて、XMLなどの文書を処理し、対応するXMLDOMツリーを編集するために用いられる命令である。CommandInvoker1051は、Command1052を実行するために必要なクラス及びファンクションを保持する。
ServiceBroker1041も、ProgramInvoker103内で実行される。UserApplication106は、ユーザインタフェイス107及びCoreComponent110に接続される。CoreComponent110は、全てのPaneの間で文書を共有する方法を提供する。CoreComponent110は、さらにフォントを提供し、Paneのためのツールキットの役割を果たす。
図15(b)は、Frame1071、MenuBar1072、及びStatusBar1073の関係を示す。
H.アプリケーションコア
図16(a)は、全ての文書、及び文書の一部及び文書に属するデータを保持するアプリケーションコア108についての更なる説明を提供する。CoreComponent110は、文書1082を管理するDocumentManager1081にアタッチされる。DocumentManager1081は、文書処理システムに関連づけられたメモリに格納される全ての文書1082の所有者である。
画面上の文書の表示を容易にするために、DocumentManager1081はRootPane1084にも接続される。ClipBoard1087、SnapShot1088、Drag&Drop601、及びOverlay602の機能も、CoreComponent110にアタッチされる。
SnapShot1088は、アプリケーションの状態を元に戻すために使用される。ユーザがSnapShot1088を起動したとき、アプリケーションの現状が検知され、格納される。その後、アプリケーションの状態が別の状態に変わるとき、格納された状態の内容は保存される。SnapShot1088は、図16(b)に図示される。動作において、アプリケーションがあるURLから他へ移動するときに、前に戻る動作及び先に進む動作をシームレスに実行可能とするために、SnapShot1088は以前の状態を記憶する。
I.DocumentManager内における文書の構成
図17(a)は、DocumentManager1081の更なる説明と、DocumentManagerにおいて文書が構成され保持される様子を示す。図11(b)に示したように、DocumentManager1081は、文書1082を管理する。図17(a)に示される例において、複数の文書のうちの1つはRootDocument(ルート文書)701であり、残りの文書はSubDocument(サブ文書)702である。DocumentManager1081は、RootDocument701に接続され、RootDocument701は、全てのSubDocument702に接続される。
図12及び図17(a)に示すように、DocumentManager1081は、全ての文書1082を管理するオブジェクトであるDocumentContainer203に結合される。DOMService703及びIOManager704を含むツールキット201(例えばXMLツールキット)の一部を形成するツールも、DocumentManager1081に供給される。再び図17(a)を参照して、DOMService703は、DocumentManager1081により管理される文書に基づいたDOMツリーを生成する。各Document705は、それがRootDocument701であってもSubDocument702であっても、対応するDocumentContainer203によって管理される。
図17(b)は、文書A−Eが階層的に配置される様子を示す。文書AはRootDocumentである。文書B−Dは、文書AのSubDocumentである。文書Eは、文書DのSubDocumentである。図17(b)の左側は、これと同じ文書の階層が画面上に表示された例を示す。RootDocumentである文書Aは、基本フレームとして表示される。文書AのSubDocumentである文書B−Dは、基本フレームAの中のサブフレームとして表示される。文書DのSubDocumentである文書Eは、サブフレームDのサブフレームとして画面に表示される。
再び図17(a)を参照して、UndoManager(アンドゥマネージャ:アンドゥ管理部)706及びUndoWrapper(アンドゥラッパー)707は、それぞれのDocumentContainer203に対して生成される。UndoManager706及びUndoWrapper707は、取消可能なコマンドを実行するために使用される。この特徴を使用することにより、編集操作を使用して文書に対して実行された変更を取り消すことができる。SubDocumentの変更は、RootDocumentとも密接な関係を有する。アンドゥ操作は、階層内の他の文書に影響する変更を考慮に入れて、例えば、図17(b)に示されるような連鎖状の階層における全ての文書の間で整合性が維持されることを保証する。
UndoWrapper707は、DocumentContainer203内のSubDocumentに関連するアンドゥオブジェクトをラップし、それらをRootDocumentに関連するアンドゥオブジェクトに結合させる。UndoWrapper707は、UndoableEditAcceptor(アンドゥアブルエディットアクセプタ:アンドゥ可能編集受付部)709に利用可能なアンドゥオブジェクトの収集を実行する。
UndoManager706及びUndoWrapper707は、UndoableEditAcceptor709及びUndoableEditSource(アンドゥアブルエディットソース)708に接続される。当業者には理解されるように、Document705がUndoableEditSource708であってもよく、取消可能な編集オブジェクトのソースであってもよい。
J.アンドゥコマンド及びアンドゥフレームワーク
図18(a)及び図18(b)は、アンドゥフレームワーク及びアンドゥコマンドについて更なる詳細を提供する。図18(a)に示されるように、UndoCommand801、RedoCommand802、及びUndoableEditCommand803は、図11(b)に示したようにCommandInvoker1051に積むことができるコマンドであり、順に実行される。UndoableEditCommand803は、UndoableEditSource708及びUndoableEditAcceptor709に更にアタッチされる。「foo」EditCommand804及び「bar」EditCommand805は、UndoableEditCommandの例である。
1.UndoableEditCommandの実行
図18(b)は、UndoableEditCommandの実行を示す。まず、ユーザが編集コマンドを使用してDocument705を編集すると仮定する。第1ステップS1では、UndoableEditAcceptor709が、Document705のDOMツリーであるUndoableEditSource708にアタッチされる。第2ステップS2では、ユーザにより発行されたコマンドに基づいて、Document705がDOMのAPIを用いて編集される。第3ステップS3では、ミューテーションイベントのリスナーが、変更がなされたことを通知される。すなわち、このステップでは、DOMツリーの全ての変更を監視するリスナーが編集操作を検知する。第4ステップS4では、UndoableEditがUndoManager706のオブジェクトとして格納される。第5ステップS5では、UndoableEditAcceptor709がUndoableEditSource708からデタッチされる。UndoableEditSource708は、Document705自身であってもよい。
K.システムへの文書のロードに関する手順
上記のサブセクションでは、システムの様々なコンポーネント及びサブコンポーネントについて説明した。以下、これらのコンポーネントの使用に関する方法論について説明する。図19(a)は、文書処理システムに文書がロードされる様子の概要を示す。それぞれのステップは、図24−28において、特定の例に関連して詳述される。
簡単には、文書処理システムは、文書に含まれるデータからなるバイナリデータストリームからDOMを生成する。ApexNode(エイペックスノード:頂点ノード)が、注目対象でありZoneに属する文書の一部のために生成される。つづいて、対応するPaneが同定される。同定されたPaneは、ApexNode及び物理的な画面表面からZone及びCanvasを生成する。Zoneは、次に、それぞれのノードにFacetを生成し、それらに必要とされる情報を提供する。Canvasは、DOMツリーから、ノードをレンダリングするためのデータ構造を生成する。
より詳細には、文書はストレージ901からロードされる。文書のDOMツリー902が生成される。文書を保持するための、対応するDocumentContainer903が生成される。DocumentContainer903は、DocumentManager904にアタッチされる。DOMツリーは、ルートノードと、ときには複数のセカンダリノードを含む。
一般に、このような文書は、テキスト及びグラフィクスの双方を含む。したがって、DOMツリーは、例えば、XHTMLサブツリーだけでなくSVGサブツリーを有してもよい。XHTMLサブツリーは、XHTMLのApexNode905を有する。同様に、SVGサブツリーは、SVGのApexNode906を有する。
ステップ1では、ApexNode906が、画面の論理的なレイアウトであるPane907にアタッチされる。ステップ2では、Pane907は、PaneOwner(ペインオーナー:ペインの所有者)908であるCoreComponentに、ApexNode906のためのZoneFactoryを要求する。ステップ3では、PaneOwner908は、ZoneFactoryと、ApexNode906のためのCanvasFactoryであるEditletとを返す。
ステップ4では、Pane907がZone909を生成する。Zone909はPane907にアタッチされる。ステップ5では、Zone909がそれぞれのノードに対してFacetを生成し、対応するノードにアタッチする。ステップ6では、Pane907がCanvas910を生成する。Canvas910はPane907にアタッチされる。Canvas910には様々なCommandが含まれる。ステップ7では、Canvas910が文書を画面にレンダリングするためのデータ構造を構築する。XHTMLの場合、これはボックスツリー構造を含む。
1.ZoneのMVC
図19(b)は、MVCパラダイムを用いてZoneの構成の概要を示す。この場合、Zone及びFacetは文書に関連した入力であるから、モデル(M)はZone及びFacetを含む。Canvasと、文書を画面にレンダリングするためのデータ構造体は、ユーザが画面上に見る出力であるから、ビュー(V)はCanvas及びデータ構造体に対応する。Commandは、文書とその様々な関係に対して制御操作を実行するので、コントロール(C)はCanvasに含まれるCommandを含む。
L.文書の表現
図20を用いて、文書及びその様々な表現の例について以下に説明する。この例で使用される文書は、テキストと画像の双方を含む。テキストは、XHTMLを用いて表され、画像は、SVGを用いて表される。図20は、文書のコンポーネント及び対応するオブジェクトの関係のMVC表現を詳細に示す。この例において、Document1001は、Document1001を保持するDocumentContainer1002にアタッチされる。文書はDOMツリー1003により表現される。DOMツリーは、ApexNode1004を含む。
ApexNodeは、黒丸で表される。頂点でないノードは、白丸で表される。ノードを編集するために用いられるFacetは、三角形で表され、対応するノードにアタッチされる。文書がテキストと画像を有するので、この文書のDOMツリーは、XHTML部分とSVG部分を含む。ApexNode1004は、XHTMLサブツリーの最上のノードである。これは、文書のXHTML部分の物理的な表現のための最上PaneであるXHTMLPane1005にアタッチされる。ApexNode1004は、文書のDOMツリーの一部であるXHTMLZone1006にもアタッチされる。
Node1004に対応するFacet1041も、XHTMLZone1006にアタッチされる。XHTMLZone1006は、XHTMLPane1005にアタッチされる。XHTMLEditletは、文書の論理的な表現であるXHTMLCanvas1007を生成する。XHTMLCanvas1007は、XHTMLPane1005にアタッチされる。XHTMLCanvas1007は、Document1001のXHTMLコンポーネントのためのBoxTree1009を生成する。文書のXHTML部分を保持し描画するために必要な様々なCommand1008も、XHTMLCanvas1007に追加される。
同様に、文書のSVGサブツリーのApexNode1010は、文書のSVGコンポーネントを表現するDocument1001のDOMツリーの一部であるSVGZone1011にアタッチされる。ApexNode1010は、文書のSVG部分の物理的な表現の最上のPaneであるSVGPane1013にアタッチされる。文書のSVG部分の論理的な表現を表すSVGCanvas1012は、SVGEditletにより生成され、SVGPane1013にアタッチされる。画面上に文書のSVG部分をレンダリングするためのデータ構造及びコマンドは、SVGCanvasにアタッチされる。例えば、このデータ構造は、図示されるように、円、線、長方形などを含んでもよい。
図20に関連して説明された文書例の表現の一部について、図21(a)に関連して、前述したMVCパラダイムを用いて更に説明する。図21(a)は、文書1001のXHTMLコンポーネントにおけるMVの関係を簡略化して示す。モデルは、Document1001のXHTMLコンポーネントのためのXHTMLZone1101である。XHTMLZoneのツリーには、いくつかのNode及びそれらに対応するFacetが含まれる。対応するXHTMLZone及びPaneは、MVCパラダイムのモデル(M)部分の一部である。MVCパラダイムのビュー(V)部分は、Document1001のXHTMLコンポーネントの、対応するXHTMLCanvas1102及びBoxTreeである。文書のXHTML部分は、Canvasと、それに含まれるCommandを使用して画面に描写される。キーボードやマウス入力などのイベントは、図示されるように、逆方向へ進む。
SourcePaneは、更なる機能、すなわち、DOMの保有者としての役割を有する。図21(b)は、図21(a)に示したDocument1001のコンポーネントに対するボキャブラリコネクションを提供する。DOMホルダーとして機能するSourcePane1103は、文書のソースDOMツリーを含む。ConnectorTree1104は、ConnectorFactoryにより生成され、デスティネーションDOMの保有者としても機能するDestinationPane1105を生成する。DestinationPane1105は、XHTMLDestinationCanvas1106としてボックスツリーの形式でレイアウトされる。
M.プラグインサブシステム、ボキャブラリコネクション、及びコネクタの関係
図22(a)−(c)は、それぞれ、プラグインサブシステム、ボキャブラリコネクション、及びConnectorに関連する更なる詳細を示す。プラグインサブシステムは、文書処理システムに機能を追加又は交換するために用いられる。プラグインサブシステムは、ServiceBroker1041を含む。ServiceBroker1041にアタッチされるZoneFactoryService1201は、文書の一部に対するZoneを生成する。EditletService1202も、ServiceBroker1041にアタッチされる。EditletService1202は、Zone中のNodeに対応するCanvasを生成する。
ZoneFactoryの例は、XHTMLZone及びSVGZoneをそれぞれ生成するXHTMLZoneFactory1211及びSVGZoneFactory1212である。文書例に関連して前述したように、文書のテキストコンポーネントは、XHTMLZoneを生成することにより表現されてもよいし、画像はSVGZoneを用いて表現されてもよい。EditletServiceの例は、XHTMLEditlet1221及びSVGEditlet1222を含む。
図22(b)は、ボキャブラリコネクションに関連する更なる詳細を示す。ボキャブラリコネクションは、前述したように、文書処理システムの重要な特徴であり、2つの異なる方法で文書の整合のとれた表現及び表示を可能とする。ConnectorFactory303を保持するVCManager302は、ボキャブラリコネクションサブシステムの一部である。ConnectorFactory303は、文書のConnector304を生成する。前述したように、Connectorは、ソースDOM中のノードを監視し、2つの表現の間の整合性を維持するために、デスティネーションDOM中のノードを修正する。
Template317は、いくつかのノードの変換ルールを表す。ボキャブラリコネクション記述子(VCD)ファイルは、特定のパス又はルールを満たす要素又は要素の集合を他の要素に変換するいくつかのルールを表すTemplateのリストである。Template317及びCommandTemplate318は、全てVCManager302にアタッチされる。VCManagerは、VCDファイル中の全てのセクションを管理するオブジェクトである。1つのVCDファイルに対して、1つのVCManagerオブジェクトが生成される。
図22(c)は、Connectorに関連する更なる詳細を提供する。ConnectorFactory303は、ソース文書からConnectorを生成する。ConnectorFactory303は、Vocabulary、Template、及びElementTemplateにアタッチされ、それぞれ、VocabularyConnector、TemplateConnector、ElementConnectorを生成ずる。
VCManager302は、ConnectorFactory303を保持する。Vocabularyを生成するために、対応するVCDファイルが読み込まれる。こうして、ConnectorFactory303が生成される。このConnectorFactory303は、Zoneを生成するZoneFactory及びCanvasを生成するEditletに関連する。
つづいて、ターゲットボキャブラリのEditletServiceが、VCCanvasを生成する。VCCanvasも、ソースDOMツリー又はZoneにおけるApexNodeのConnectorを生成する。必要に応じて、子のConnectorが再帰的に生成される。ConnectorTreeは、VCDファイル中のテンプレートの集合により生成される。
テンプレートは、マークアップ言語の要素を他の要素に変換するためのルールの集合である。例えば、各テンプレートは、ソースDOMツリー又はZoneにマッチされる。適切にマッチした場合には、頂点Connectorが生成される。例えば、テンプレート「A/*/D」は、間にどんなノードがあるかに関係なく、ノードAで始まりノードDで終わる全ての枝に合致する。同様に、「//B」は、ルートからの全ての「B」ノードに一致する。
N.ConnectorTreeに関係するVCDファイルの例
特定の文書と関係する処理を説明する例を続ける。ドキュメントタイトルのある「MySampleXML」というタイトルの文書が文書処理システムにロードされる。図23は、「MySampleXML」ファイルのための、VCManager及びConnectorFactoryTreeを用いたVCDスクリプトの例を示す。スクリプトファイル中のボキャブラリセクション、テンプレートセクションと、VCManagerにおける対応するコンポーネントが示される。タグ「vcd:vocabulary」において、属性「match」は「sample:root」、「label」は「MySampleXML」、「call-template」は「sample template」となっている。
この例では、Vocabularyは、「MySampleXML」のVCManagerにおいて「sample:root」として頂点要素を含む。対応するUIラベルは、「MySampleXML」である。テンプレートセクションにおいて、タグは「vcd:template」であり、名前は「sample:template」である。
O.ファイルがシステムにロードされる方法の詳細な例
図24−28は、文書「MySampleXML」のロードについての詳細な記述を示す。図24(a)に示されるステップ1では、文書がストレージ1405からロードされる。DOMServiceは、DOMツリー及びDocumentManager1406と対応するDocumentContainer1401を生成する。DocumentContainer1401は、DocumentManager1406にアタッチされる。文書は、XHTML及びMySampleXMLのサブツリーを含む。XHTMLのApexNode1403は、タグ「xhtml:html」が付されたXHTMLの最上のノードである。「MySampleXML」のApexNode1404は、タグ「sample:root」が付された「MySampleXML」の最上ノードである。
図24(b)に示されるステップ2では、RootPaneが文書のXHTMLZone、Facet、及びCanvasを生成する。Pane1407、XHTMLZone1408、XHTMLCanvas1409、及びBoxTree1410が、ApexNode1403に対応して生成される。
図24(c)に示されるステップ3では、XHTMLZoneが知らないタグ「sample:root」を発見し、XHTMLCanvasの領域からSubPaneを生成する。
図25に示されるステップ4では、SubPaneが「sample:root」を扱うことができ、適切なZoneを生成可能なZoneFactoryを得る。このZoneFactoryは、ZoneFactoryを実行可能なVocabulary内にある。それは、「MySampleXML」のVocabularySectionの内容を含む。
図26に示されるステップ5では、「MySampleXML」に対応するVocabularyがDefaultZone1601を生成する。対応するEditletが生成され、対応するCanvasを生成するためにSubPane1501が提供される。Editletは、VCCanvasを生成する。そして、それはTemplateSectionを呼ぶ。ConnectorFactoryTreeも含まれている。ConnectorFactoryTreeは、ConnectorTreeとなる全てのConnectorを生成する。
図27に示されるステップ6では、各ConnectorがデスティネーションDOMオブジェクトを生成する。コネクタのうちのいくつかはxpath情報を含んでいる。xpath情報は、変更/修正を監視する必要のあるソースDOMツリーの部分集合を決定するために使用される1以上のxpath表現を含む。
図28に示されるステップ7では、ボキャブラリは、ソースDOMのペインからデスティネーションDOMツリーのDestinationPaneを作成する。これは、SourcePaneに基づいてなされる。デスティネーションツリーのApexNodeは、DestinationPane及び対応するZoneにアタッチされる。DestinationPaneは、DestinationCanvasを生成し、文書をデスティネーションのフォーマットでレンダリングするためのデータ構造及びコマンドを構築する、自身のEditletを提供される。
図29(a)は、対応するソースノードを持たず、デスティネーションツリーにのみ存在するノード上でイベントが発生したときのフローを示す。マウスイベント、キーボードイベントなど、Canvasが取得したイベントは、デスティネーションツリーを通過して、ElementTemplateConnectorに伝達される。ElementTemplateConnectorは対応するソースノードを持たないので、伝達されたイベントはソースノードに対する編集操作ではない。ElementTemplateConnectorは、伝達されたイベントがCommandTemplateに記述されたコマンドに合致すれば、それに対応するActionを実行する。合致するコマンドがなければ、ElementTemplateConnectorは、伝達されたイベントを無視する。
図29(b)は、TextOfConnectorによりソースノードに対応づけられているデスティネーションツリーのノード上でイベントが発生したときのフローを示す。TextOfConnectorは、ソースDOMツリーのXPathで指定されたノードからテキストノードを取得して、デスティネーションDOMツリーのノードにマッピングする。マウスイベント、キーボードイベントなど、Canvasが取得したイベントは、デスティネーションツリーを通過して、TextOfConnectorに伝達される。TextOfConnectorは、伝達されたイベントを、対応するソースノードの編集コマンドにマッピングし、Queue1053に積む。編集コマンドは、Facetを介して実行されるDOMのAPIコールの集合である。キューに積まれたコマンドが実行されると、ソースノードが編集される。ソースノードが編集されると、ミューテーションイベントが発行され、リスナーとして登録されたTextOfConnectorにソースノードの変更が通知される。TextOfConnectorは、ソースノードの変更を、対応するデスティネーションノードに反映させるように、デスティネーションツリーを再構築する。このとき、TextOfConnectorを含むテンプレートに、「for each」や「for loop」などの制御文が含まれている場合、ConnectorFactoryがこの制御文を再評価し、TextOfConnectorを再構築した後、デスティネーションツリーが再構築される。
(第1の実施の形態)
実施の形態では、文書に対する作業履歴を保持し、任意の時点の作業状態まで遡ったり、作業経過を再生したりすることを可能とする技術を提案する。
図30は、実施の形態に係る文書処理装置3000の構成を示す。文書処理装置3000は、前提技術で説明した文書処理装置20の構成に加えて、アンドゥマネージャ3120及びアンドゥスタック3140を備える。文書処理装置20における編集コマンドは、文書から生成されたDOMツリーに対する操作の集合である。したがって、DOM操作のそれぞれについて逆操作を用意しておけば、編集コマンドの逆操作を容易に実現することができる。アンドゥマネージャ3120は、HTMLユニット150などの機能ブロックがアンドゥ可能なコマンドを発行したとき、順操作と逆操作の対をアンドゥスタック3140に積む。コマンドを単位として、アンドゥスタック3140に積まれた逆操作を時間軸と逆の方向へ進めばアンドゥが、順操作を時間軸の方向へ進めばリドゥが実現される。これにより、HTMLユニット150などの機能ブロックは、アンドゥの管理を完全にアンドゥマネージャ3120に任せることができる。プラグインを新たに開発する場合も、編集コマンドをDOM操作を単位として作成すればよいだけで、アンドゥを個別に用意する必要がない。
アンドゥマネージャ3120は、文書を保存して閉じるときに、アンドゥスタック3140に積まれている作業履歴をファイルなどに保存する。すなわち、文書に対して実行された操作は全て保存される。したがって、アンドゥマネージャ3120は、任意の時点までアンドゥ操作を実行することにより、その時点まで遡って作業状態を復元することができる。また、アンドゥマネージャ3120は、任意の時点まで遡った後にリドゥ操作を繰り返し実行することにより、その時点から後の作業経過を再生することができる。
ユーザが文書の編集中に、アンドゥを実行してある時点の文書の状態まで戻り、その時点から開始して以前とは別の作業を行った場合、再編集開始の時点を起点として作業履歴に枝分かれが生じる。従来の一般的なアプリケーションでは、ある時点までアンドゥで戻って作業を再開した場合、それまでの作業履歴は破棄されるが、本実施の形態のアンドゥマネージャ3120は、アンドゥを実行した操作も含めて全ての操作を時系列的に保持する。これにより、作業履歴の枝分かれも再現することができる。例えば、前回再編集を開始した時点の文書まで戻ったり、再編集を行う前の文書まで戻ったりすることが容易に実現できる。
図31(a)は、作業履歴が枝分かれする様子を示し、図31(b)は、枝分かれした作業履歴をツリー状に表示した様子を示す。図31(a)において、新規文書を作成した状態(0)から作業を開始して、状態(1)まで作業した後、アンドゥを実行して状態(2)まで戻ったとする。その後、状態(2)から作業を再開し、状態(3)まで作業した後、再びアンドゥを実行して状態(2)まで戻る。その後、図31(a)に示したように作業が行われた場合、アンドゥスタック3140には、時系列に状態(0)から状態(8)へ至る作業が保存される。
アンドゥマネージャ3120は、ユーザから作業履歴を提示するよう要求されたとき、アンドゥスタック3140又はファイルに保存された作業履歴を読み出して、図31(b)に示すように、ツリー状に表示する。図31(b)では、作業開始時点(0)と現在の状態(8)をつなぐ経路を幹として、枝分かれを表現している。このアンドゥツリーには、枝分かれ時点や、文書が保存された時点など、重要な状態を強調表示してもよい。例えば、それらの状態をアイコンで表示してもよいし、その時点で編集された部分の周辺などを簡易表示してもよい。アンドゥスタック3140に、作業が実行された日時を記録しておき、アンドゥツリー上の重要な時点に日時を付記してもよい。
ユーザがアンドゥツリー上の一点をマウスなどにより指定したとき、アンドゥマネージャ3120は、その時点の状態に戻るまでアンドゥを実行し、その状態を再現するようにしてもよい。ユーザがアンドゥツリー上でマウスをシングルクリックすると、その時点の状態を表示し、ダブルクリックすると、その時点までのアンドゥを確定するようにしてもよい。
アンドゥマネージャ3120は、枝分かれの時点を開始点として、枝分かれした複数の作業経路を並行して再生し、ユーザに提示してもよい。例えば、(2)の状態からの再生指示を受け付けたとき、(2)から(1)へ至る作業(1回目)と、(2)から(3)へ至る作業(2回目)と、(2)から(4)へ至る作業(3回目)を並行して再生してもよい。
(第2の実施の形態)
第2の実施の形態では、第1の実施の形態で説明した作業履歴を保存するときに、重要な状態のみを残し、途中のさほど重要ではない作業経路を圧縮する技術を提案する。
例えば、文章を入力しているときに、ユーザがバックスペースキーを10回押下して10文字を削除したとする。この場合、10文字を削除する前後の状態が記録されていれば十分で、途中の1文字ずつが削除される経過はさほど重要ではない。このように、第1の実施の形態で説明した枝分かれしたアンドゥツリーを保存する際に、枝分かれの開始時点(節)の状態と、枝分かれの末端(葉)の状態とを記録し、枝の部分の状態遷移を消去してもよい。これにより、作業履歴の重要度を確保しつつ、データ容量を低減することができる。枝の部分にある途中の作業状態であっても、例えば、文書を保存する作業を行ったときなど、重要な時点における状態は消去せずに保存するのが望ましい。また、節や葉の状態であっても、重要ではないと判断された場合は、消去してもよい。いずれの状態を残して、いずれの状態を消去するのかを判断するための条件を、予め又はユーザ自身が設定してもよい。例えば、印刷や保存を行った時点の状態は必ず残すように条件を定めてもよい。アンドゥマネージャ3120は、この条件に基づいて、アンドゥスタック3140に積まれた作業履歴を圧縮し、ファイルに保存する。このように、細かな粒度の状態を、より粗い粒度の状態に整理することにより、ユーザに作業履歴を提示する際に、分かりやすく、効率のよいUIを提供することができる。
アンドゥマネージャ3120は、文書を保存するときに、アンドゥスタック3140の作業履歴を圧縮して保存してもよいし、文書の編集中であっても、アンドゥスタック3140の残量が所定のしきい値を下回ったときには、作業履歴を圧縮してもよい。
(第3の実施の形態)
第3の実施の形態では、第1の実施の形態で説明した作業履歴を時間軸上に表示するUIを提案する。
アンドゥマネージャ3120は、作業履歴をアンドゥスタック3140に積むときに、作業日時を対応づけて記録する。ユーザから作業履歴を表示するよう指示されると、アンドゥスタック3140又はファイルに保持された作業履歴を読み出して時間軸上に表示する。時間軸は、直線的に表現されてもよいし、曲線的に表現されてもよく、何らかの連続性を有する表示により表現されてもよい。時間軸の全体が表示されてもよいし、時間軸の一部を詳細に表示し、表示されていない軸へ移動する手段が設けられてもよい。例えば、時間軸を巻物として表現し、巻物を巻き取りながら時間軸上を移動するようなUIを提供してもよい。時間軸上の移動手段として、スライダーを設けてスライダーを左右又は上下にスライドすることにより移動させてもよいし、軸上をマウスでドラッグすることにより移動させてもよいし、軸上に節目となるポイントを表示して、そのポイントをクリックすることにより移動させてもよいし、ダイヤルなどを表示してそれを回転させることにより移動させてもよいし、方向キー、ダイヤル、スティック、マウスの移動など、方向を示す情報を入力するための入力手段からの入力を受け付けて移動させてもよい。
アンドゥマネージャ3120は、保存されている全ての作業を時間軸上に表示してもよいし、一部の作業を抽出して表示してもよい。例えば、第2の実施の形態で説明したように、重要な状態のみを表示してもよい。状態を容易に識別できるように、状態をアイコンや図形などで表示し、その近傍に、その状態の日時、文書のバージョン番号、そのときの作業内容、そのときに編集された文字列などを表示してもよい。アンドゥマネージャ3120は、時間軸の長さに、実際の作業日時を反映させてもよいし、それぞれの作業に要する時間を反映させてもよいし、編集したデータの容量、文字数、DOMの変更量などを反映させてもよい。
図32は、文書処理装置3000が表示した画面4000の例を示す。画面4000の下方には、アンドゥマネージャ3120によりアンドゥUI画面4020が表示されている。アンドゥUI画面4020には、時間軸4040が表示されており、時間軸4040上に作業履歴が表示される。時間軸4040上には、スライダー4060が表示されており、ユーザがマウスを用いてスライダー4060を左右に移動させると、それに伴って、あたかも動画を再生しているように、作業経過が画面4000に示される。図32の例では、時間軸に作業日時が反映されているので、枝分かれが表示していない。すなわち、アンドゥにより元の状態に戻る操作も含めて時系列に一列に並べられている。別の例では、アンドゥマネージャ3120は、例えば図31(b)に示すように、時間軸をツリー状に表示してもよい。
アンドゥマネージャ3120は、作業履歴の検索要求を受け付け、検索結果を時間軸上に表示してもよい。例えば、ユーザが印刷した日時を知りたい、または、印刷した時点まで戻りたいときに、アンドゥマネージャ3120は、作業履歴の中から印刷作業を検索し、検索結果を時間軸上に表示する。これにより、分かりやすく、利便性の高いUIを提供することができる。また、例えば、文書の保存履歴を表示することにより、文書の版管理を容易に行うことが可能なUIを提供することができる。
上述の例では、文書処理装置3000における作業履歴を時間軸上に表示するUIについて説明したが、本実施の形態の技術は、一般的なアプリケーションにも適用できる。アプリケーションは、ユーザからの指示などにより行った作業の内容と、作業した日時とを対応づけて保持し、ユーザから要求があったときに、保持した作業履歴を時間軸上に表示する。作業履歴を管理するアプリケーションは、例えば、文書を編集するワードプロセッサなどでもよいし、複数のアプリケーションのプラットフォームとなるOSなどであってもよい。後者の場合、OSが複数のアプリケーションの作業履歴をアプリケーション毎に保持し、複数のアプリケーションの作業履歴を複数のアンドゥUI画面に並列に表示してもよいし、あるアプリケーションの作業履歴を表示するアンドゥUI画面に、別のアプリケーションの作業履歴を付記してもよい。
(第4の実施の形態)
第1から第3の実施の形態で説明した技術を利用して、意志決定の支援環境などを提供する技術を提案する。
XMLによる情報構造化技術は、様々なシーンに適用することができるので、様々な問題解決のための状態遷移をXMLの状態遷移に還元することが可能である。このような状態遷移を保持し、第1から第3の実施の形態で説明した技術でユーザに提示することにより、ユーザが容易に過去の状態遷移を考察したり、過去の状態へ戻ったりする環境を提供し、意志決定を支援することができる。
例えば、ユーザが、パーソナルコンピュータの通販サイトで、自身の好みの部品を選択し、自身の目的に最適な仕様の商品を決定するシーンを想定する。ユーザは、各部品の組合せを試行錯誤し、最終的に好みの組合せを決定して発注する。アンドゥマネージャ3120は、この試行錯誤の過程をアンドゥスタック3140に記録し、適宜、第2の実施の形態で説明したように、重要でない状態遷移を削除して、重要な状態を残す。つまり、枝を切り落として節と葉を残す。例えば、両立できない部品の組合せの候補は、分岐した枝の先の葉に存在するので、それぞれを残しておき、第1又は第3の実施の形態で説明したようにユーザに提示すれば、ユーザは、部品の組合せの候補を見渡して、最終的な組合せを決定することができる。アンドゥマネージャ3120は、重要な状態の指定をユーザから受け付けてもよい。例えば、ユーザが試行錯誤の過程で、部品の組合せの候補を保存したいときに、ユーザから保存する旨の指示を受け付けて保存してもよい。
ユーザが保存した状態に、コメントなどを付記してリストにすることにより、より分かりやすくユーザに提示することができ、意志決定を効果的に支援することができる。また、保存してある状態を次回の意志決定の開始点として利用することができる。また、通販サイトの運営者側から見ると、複数のユーザが保存した状態を統計処理することにより、潜在的な製品仕様などを割り出して、マーケティングなどに利用することができる。さらに、この結果を利用して、ユーザに典型的な仕様を状態の一例として提示するなど、レコメンデーションエンジンとして機能させることができる。
図33は、上述の例を説明するための図である。図33の上部には、ユーザが辿った状態遷移のパスが示されている。図33の左下には、重要な状態(節)をアノーテーションを付けてリストアップした様子が示されている。このような提示により、ユーザの意志決定を支援することができる。図33の右下には、ユーザが辿った状態遷移をもとに、レコメンデーションエンジンが推奨される状態を判断してユーザに提示した様子が示されている。このように、複数のユーザの状態遷移を統合し、別のユーザに対して状態の例を示すことができる。
本実施の形態の技術は、その他、データを処理するアプリケーションや、ウェブブラウザなど、広く一般に適用可能である。テキストエディタや画像作成アプリケーションなど、データを処理するアプリケーションにおいて、ユーザが現在の状態を節として保存するコマンドを用意し、後でユーザが作業履歴を見返すことができるようなUIを提供することができる。また、ウェブブラウザによりハイパーリンクなどを辿ってウェブページをブラウジングする際に、ページの移動経路をツリー状に保持し、サムネイルなどを付加してユーザに提示することにより、以前閲覧したサイトを再度閲覧する場合などに便利なUIを提供することができる。
以下、実施の形態1から4に関連して、さらに付言する。
図34は、図30に示したアンドゥマネージャの詳細な機能ブロック図である。
文書処理装置3000のうち、アンドゥマネージャ3120やアンドゥスタック3140は、ユーザからの編集操作を受け付け、文書ファイルについてのデータ処理履歴を管理する。
アンドゥマネージャ3120は、データ処理部3020、ユーザインタフェース処理部3040および履歴処理部3060を含む。
ユーザインタフェース処理部3040は、ユーザインタフェースに関する処理を全般的に担当する。データ処理部3020は、文書処理装置20、ユーザインタフェース処理部3040および履歴処理部3060が互いにデータを送受するためのインタフェースの役割を果たす。本実施例においては、データ処理部3020は、文書処理装置20に対してデータ処理の内容を指示し、文書処理装置20が実際の処理を実行する。たとえば、ユーザが文字を入力したときには、データ処理部3020は文字の入力がなされた旨を文書処理装置20に通知する。文書処理装置20は、この通知にしたがって先述した各種の処理を実行する。また、処理結果はデータ処理部3020を介してユーザインタフェース処理部3040に通知される。履歴処理部3060は、ユーザインタフェース処理部3040から受け付けられた各種操作に基づくデータ処理の履歴情報を管理する。履歴情報はアンドゥスタック3140に記録される。
ユーザインタフェース処理部3040は、表示部3042と入力部3044を含む。
表示部3042は、データ処理の結果を画面表示する。入力部3044は、キーボードやマウスなどの入力デバイスを介したユーザからの入力を検出する。
履歴処理部3060は、オブジェクト生成部3064、状態データ取得部3062および圧縮部3068を含む。
オブジェクト生成部3064は、ユーザからの入力に基づいて実行されるべきデータ処理の内容を示す処理オブジェクトを生成する。処理オブジェクトは、データ処理の内容を示す情報だけでなく、そのデータ処理が実行されたあとの状態から元の状態に戻すための逆のデータ処理を実行するための情報も含んでいる。また、処理オブジェクトは、データ処理が実行された日時を示す日時情報を含む。処理オブジェクトは、データ処理の内容を示すために定義されたクラス、または、そのクラスを継承したサブクラスのインスタンスとして生成されてもよい。処理オブジェクトは、データ処理の内容を記載したデータシートであってもよい。処理オブジェクトについては、後の図35に関連して更に説明する。
状態データ取得部3062は、データ処理の結果として現出する作業状態を示す状態データを取得する。処理オブジェクトや状態データはアンドゥスタック3140に履歴情報として保持される。圧縮部3068は、アンドゥスタック3140に保持されるべき処理オブジェクトや状態データに要するデータ量を圧縮する。具体的な圧縮方法については、図36等に関連して詳述する。
図35は、文書ファイルに対する履歴情報の管理を説明するための模式図である。
ユーザが文字の入力や削除などの編集操作を実行するごとに、文書編集の状態(State)が変化する。ここでは、S1からS7までの7種類の状態の間で状態遷移する場合について示す。同図に示すS1からS7までの各状態は、以下の通りである。なお、スタート状態のことをS0と表現してもよい。
S1:「E」という1文字分のキャラクタが入力された状態を示す。
S2:「Ex」という2文字分のキャラクタが入力された状態を示す。
S3:「Ext」という3文字分のキャラクタが入力された状態を示す。
S4:「Exta」という4文字分のキャラクタが入力された状態を示す。
S5:「Extan」という5文字分のキャラクタが入力された状態を示す。
S6:「Exte」という4文字分のキャラクタが入力された状態を示す。
S7:「Exten」という5文字分のキャラクタが入力された状態を示す。
S0のスタート状態にあるときに、ユーザは「E」の文字を入力している。ユーザが「E」の文字を入力したとき、状態データ取得部3062はS1についての状態データを取得する。この「E」という文字が入力され、S0からS1に状態遷移した時点のことをT1と表現する。同図に示すT1からT11は、ユーザの編集操作にともなう状態遷移の経過を時系列表現したものである。同図に示すT1からT11までの各時点における状況は、以下の通りである。なお、スタート時点のことをT0と表現してもよい。
T1:スタート状態S0において文字「E」が入力され、S1に状態遷移する。S1が生成される。
T2:S1において文字「x」が入力され、S2に状態遷移する。S2が生成される。
T3:S2において文字「t」が入力され、S3に状態遷移する。S3が生成される。
T4:S3において文字「t」が削除され、S2に状態遷移する。
T5:S2において文字「t」が入力され、S3に状態遷移する。
T6:S3において文字「a」が入力され、S4に状態遷移する。S4が生成される。
T7:S4において文字「n」が入力され、S5に状態遷移する。S5が生成される。
T8:S5において文字「n」が削除され、S4に状態遷移する。
T9:S4において文字「a」が削除され、S3に状態遷移する。
T10:S3において文字「e」が入力され、S6に状態遷移する。S6が生成される。
T11:S6において文字「n」が入力され、S7に状態遷移する。S7が生成される。
状態データ取得部3062は、状態遷移が実行されるごとにS1からS7として示す各状態の内容を示す状態データを取得する。アンドゥスタック3140は、このような状態データを保持する。
ここで、TnからTn+1に移行する順操作のことをCnと表現する(nは0以上の整数)。また、Tn+1からTnに逆行させる逆操作のことを−Cnと表現する。
オブジェクト生成部3064は、これらのC1からC11までの各操作に対応して処理オブジェクトを生成し、アンドゥスタック3140に記録する。以下、表記を簡単にするために、Cnについての処理オブジェクトのことを「第n処理オブジェクト」とよぶ。
たとえば、同図にのC2についての処理オブジェクト、すなわち、第2処理オブジェクトには、データ処理の内容として、以下の内容が含まれる。
1.文字「E」の後ろにカーソルを移動する。
2.文字「x」を入力する。
すなわち、操作の対象となる位置を示す情報と、操作の種類および対象データを示す情報が含まれている。ここで操作の対象となる位置は「文字「E」の後ろ」であり、操作の種類は「文字入力」、入力の対象となるデータは「x」である。操作対象となる位置は、文書ファイルにおける行番号や列番号などによって示されてもよい。また、この処理オブジェクトは、C2が実行され時の日時情報も含んでいる。
なお、−C2についてのデータ処理の内容は、以下の通りである。
1.文字「x」の後ろにカーソルを移動する。
2.手前の文字を削除する。
第2処理オブジェクトは、−C2についてのデータを含んでもよい。
T3においては、アンドゥスタック3140に第1から第3処理オブジェクトが格納されている。ここで、ユーザがアンドゥ操作を指示すると、ユーザインタフェース処理部3040は、履歴処理部3060にアンドゥ操作の実行を指示する。履歴処理部3060は、アンドゥスタック3140からC3についての処理オブジェクトを読み出す。オブジェクト生成部3064は、−C3に相当するC4についての第4処理オブジェクトを生成する。第4処理オブジェクトは第3処理オブジェクトの、ちょうど、逆のデータ処理に対応する処理オブジェクトであるといえる。
オブジェクト生成部3064は、生成された処理オブジェクトがアンドゥ操作についての処理オブジェクトであっても、アンドゥスタック3140に追加する。このため、T4の時点では、アンドゥスタック3140には、第1〜第4処理オブジェクトがその生成順序にて保持されていることになる。
なお、T3においてユーザがアンドゥ操作ではなく、文字「t」の削除を指示したときにも、オブジェクト生成部3064は、C4についての処理オブジェクトを生成する。この場合、オブジェクト生成部3064は、第3処理オブジェクトの逆操作であると判定した上で第4処理オブジェクトを生成してもよい。あるいは、「t」を削除するときのデータ処理として第3処理オブジェクトを参照することなく第4処理オブジェクトを生成してもよい。
アンドゥマネージャ3120は、ユーザの編集操作が実行されるごとにアンドゥスタック3140に処理オブジェクトを追加する。アンドゥスタック3140に積み上げられた処理オブジェクトを参照することにより、ユーザは任意の時点、すなわち、任意のTnにおける作業状態を再現できる。たとえば、Tnにおいて、−Cn−1を実行すれば、Tn−1における状態に遷移するので、過去の作業状態を再現可能である。また、Tn−1において、Cn−1を実行すれば、再びTnにおける状態に遷移するので、リドゥ操作も可能となる。
オブジェクト生成部3064は文字の入力や削除のほかにも、文書ファイルに埋め込まれる図形オブジェクトなどのコンポーネントに対する操作、アクティブウィンドウの変更やメニューの選択など、さまざまな操作に応じて処理オブジェクトを生成してもよい。
図35に示した状態遷移においては、スタート状態S0からはS5とS7の2通りの「葉」にあたる状態に至っている。いいかえれば、S1〜S4およびS6は、S5およびS7のいずれかの状態に至る途中の状態であるといえる。ただし、S3は、S5またはS7への分岐点となるべき状態である。
以下、S3のように複数の状態への分岐点となる状態のことを「節」または「分岐ステート」とよぶ。いいかえれば、分岐ステートは、3以上の既存状態に遷移可能な状態である。同図においてS3からは、S2、S4およびS6の3つの状態に遷移可能である。また、S5やS7のように1つの既存状態だけに遷移可能な状態のことを「葉」または「端点ステート」とよぶ。同図においてS5からはS4にのみ遷移可能であり、S7からはS6にのみ遷移可能である。また、S1やS2、S4、S6のように2つの既存状態に対してだけ遷移可能な状態のことを「枝ステート」とよぶ。
編集操作にともなって新たな端点ステートが生成されたときには、既存の端点ステートは枝ステート扱いに変更される場合もある。
図36は、図35に示した状態遷移を時系列に並べた図である。
文書編集過程における状態遷移は、各編集操作にともなう時間的な面からの状態遷移として捉えることもできる。同図に示すように、Cnを時系列にならべると、C1からC11までの11回の操作により、S1からS7までの7種類の状態の間を状態遷移していることがわかる。ここで、C4の操作は、アンドゥ操作である。すなわち、C4=−C3である。同様に、C8=−C7、C9=−C6である。このような場合、圧縮部3068は、処理オブジェクトの保持に要するデータ量を節減するために、C3とC4の処理オブジェクトのペアをアンドゥスタック3140から削除してもよい。C7とC8、C6とC10についても同様である。このように、圧縮部3068は、あるデータ処理とそのデータ処理の逆のデータ処理についての処理オブジェクトを、アンドゥスタック3140からペアで削除することにより、データ量を節減してもよい。
図35や図36を参照すると、最新の状態はS7である。すなわち、S5は、最新状態でない端点ステートである。このような場合、圧縮部3068は、分岐ステートから最新状態でない端点ステートに至る過程において生成された処理オブジェクトを節減処理の対象としてもよい。この場合、図35においては、C6、C7、C8およびC9についての処理オブジェクトを節減対象となる。
S4についての状態データは、C6、C7、C8およびC9についての処理オブジェクトを特定するための情報を含んでもよい。この場合、圧縮部3068は、最新状態でない端点ステートに至る過程の枝ステートであるS4について、状態データを参照することにより、C6、C7、C8およびC9についての処理オブジェクトを節減対象として特定できる。
図37は、図35や図36において枝ステートのS4が削除された場合における作業履歴管理を説明するための模式図である。
C6、C7、C8およびC9についての処理オブジェクトを節減対象とするとき、すなわち、枝ステートであるS4が削除の対象となるときには、旧S5が新S4として状態を示す番号がアンドゥマネージャ3120により振り直される。この場合、旧S6や旧S7のように、旧S4以降に生成された状態についても同様である。あわせて、アンドゥマネージャ3120は、同図に示すように、時点を示すTnや操作を示すCnについても整理する。
同図においてT1からT9までの各時点における状況は、以下の通りに整理される。
T1:スタート状態において文字「E」が入力され、S1に状態遷移する。S1が生成される。
T2:S1において文字「x」が入力され、S2に状態遷移する。S2が生成される。
T3:S2において文字「t」が入力され、S3に状態遷移する。S3が生成される。
T4:S3において文字「t」が削除され、S2に状態遷移する。
T5:S2において文字「t」が入力され、S3に状態遷移する。
T6:S3において文字「an」が入力され、S4に状態遷移する。S4が生成される。
T7:S4において文字「an」が削除され、S3に状態遷移する。
T8:S3において文字「e」が入力され、S5に状態遷移する。S5が生成される。
T9:S5において文字「n」が入力され、S6に状態遷移する。S6が生成される。
このとき、C6は、文字列「an」を入力する操作に対応する。また、C7=−C6である。こうして、処理オブジェクトの保持に要するデータ量が節減される。
すでに説明したように、C3とC4はペアとなる処理である。そのため、T3、T4、T5においては、新規に状態が生成されることなく、S3からS2を経由して再びS3に回帰している。このような場合、圧縮部3068は、C3とC4についての処理オブジェクトを削除してもよい。このとき、T1からT7までに各時点における情報は以下のように整理される。
T1:スタート状態において文字「E」が入力され、S1に状態遷移する。S1が生成される。
T2:S1において文字「x」が入力され、S2に状態遷移する。S2が生成される。
T3:S2において文字「t」が入力され、S3に状態遷移する。S3が生成される。
T4:S3において文字「an」が入力され、S4に状態遷移する。S4が生成される。
T5:S4において文字「an」が削除され、S3に状態遷移する。
T6:S3において文字「e」が入力され、S5に状態遷移する。S5が生成される。
T7:S5において文字「n」が入力され、S6に状態遷移する。S6が生成される。
このようにして、アンドゥスタック3140のデータ量が節減されてもよい。
アンドゥマネージャ3120は、ユーザにより明示的に指示された、または、明示的に指示されない処理オブジェクトを削除の対象としてもよい。
複数の文字が連続的に入力されたときには、それら各文字の入力により生成された処理オブジェクトを削除の対象としてもよい。また、複数の文字が連続的に削除されたときには、その削除過程において生成された処理オブジェクトを削除の対象としてもよい。たとえば、「extensible」という10文字が連続的に入力されたときには、2文字目のxから9文字目のlが入力された時点において生成される8個の処理オブジェクトが節減の対象とされてもよい。この場合、たとえば、
1.最初の文字「e」を入力するときのデータ処理についての処理オブジェクト
2.文字列「xtensibl」を入力するときのデータ処理についての処理オブジェクト
3.最後の文字「e」を入力するときのデータ処理についての処理オブジェクト
にまとめられてもよい。
また、この10文字がバックスペースキーなどにより削除されたときには、最後の「e」を削除するときの処理オブジェクトと、文字列「xtensibl」を削除するときの処理オブジェクト、最初の「e」を削除するときの処理オブジェクトに集約されてもよい。
また、句読点や特殊記号のように、通常の文字とは異なる文字を入力するときに生成される処理オブジェクトについては、削除対象としないとしてもよい。
図38は、処理オブジェクトを参照して文書編集するための画面図である。
表示部3042は、文書編集時において画面3200を表示する。画面3200は、編集領域3220と状態表示領域3260の2つの領域に分割される。編集領域3220は、文書編集のための領域である。カーソル3240は、入力箇所を示している。状態表示領域3260は、編集文書についての状態遷移を図35や図37にて示したような態様にて示す。同図において黒丸で示される状態における編集内容が編集領域3220に表示されている。ユーザが編集領域3220において編集操作を行うごとに、処理オブジェクトが生成され、状態が遷移する。表示部3042は、状態遷移に応じて状態表示領域3260に表示される内容を更新する。
ユーザが、状態表示領域3260において状態を示すオブジェクトをクリックすると、アンドゥマネージャ3120はその選択された状態に対応する作業状態を編集領域3220に再現させる。アンドゥスタック3140は、図36に示したように、各処理オブジェクトを生成順に保持している。データ処理部3020は、現在の状態からその指定された状態に戻るまで、処理オブジェクトを読み出してアンドゥ操作を繰り返すことにより指定の状態を再現させる。
たとえば、図35においてS4が選択されたときには、−C11、−C10、−C9が実行されることにより、S4の状態が再現される。各処理オブジェクトは、そのデータ処理とは逆のデータ処理の内容を示す情報を保持しているので、履歴処理部3060はアンドゥスタック3140からC11、C10、C10の処理オブジェクトを読み出して、データ処理部3020にその逆のデータ処理を実行させればよい。
アンドゥマネージャ3120は、編集作業中であっても、適宜、先述したような節減処理を実行してもよい。ユーザは、状態表示領域3260において削除すべき状態を選択することもできる。あるいは、状態表示領域3260において複数の状態を含む枝を履歴情報から削除させることもできる。このような指示は、たとえば、「ctrl+d」のような所定のショートカットキーで実行できてもよい。
オブジェクト生成部3064が編集操作に応じて処理オブジェクトを生成しつつ、適宜、それらを節減するのではなく、オブジェクト生成部3064が必要に応じて処理オブジェクトを生成するとしてもよい。たとえば、ユーザが編集領域3220において編集操作を実行しても、オブジェクト生成部3064は処理オブジェクトを生成しない。ユーザが明示的に処理オブジェクト生成を指示すると、オブジェクト生成部3064は、以前の処理オブジェクトが生成されてから現在に至るまでのデータ処理の内容を示す処理オブジェクトを生成する。このような処理オブジェクト生成指示も、所定のショートカットキーで実行できてもよい。
履歴処理部3060は、状態データに基づいて文書ファイルの編集履歴を管理してもよい。次の図39は、そのような場合についても説明するための図である。
図39は、図33に示したパーソナルコンピュータの部品選択に関するユーザインタフェースの画面図である。
ここでは、通販サイトが提供するウェブページにおいて、ユーザが好みの部品構成を選択するための入力を行っている。ウェブブラウザにて表示される画面3300は、さまざまな部品構成についての選択状態を示す。ここでは、文書処理装置3000の機能はウェブブラウザの機能の一部として搭載される。ユーザが部品構成を変更するごとに、状態データ取得部3062は、その変更後の状態、すなわち、部品構成を示す状態データを取得する。
ユーザの選択操作により状態遷移が発生すると、表示部3042は画面3300の表示内容を更新する。ここでは、「4」として示される状態が端点ステートである。ユーザは、「3」として示される状態を削除対象として選択することができる。このとき、圧縮部3068は、アンドゥスタック3140から「3」に相当する状態データを削除することにより、アンドゥスタック3140におけるデータ量を節減してもよい。このように、処理オブジェクトを単位として節減処理を実行するほかにも、状態データを単位として節減処理を実行する方法も可能である。圧縮部3068は、枝分かれを検出して、分岐ステートから端点ステートに至る過程の枝ステートを削除対象として判定してもよい。
ユーザがカーソル3320を所定の状態を示すオブジェクトにあわせると、その状態についての注釈を示すアノテーション領域3340が表示される。ユーザは、各状態についてその状態を選択した意図などをアノテーション領域3340として記録できる。たとえば、表示部3042は、画面3300においていずれかの状態がダブルクリックにより選択されたときには、アノテーション領域3340を入力するための画面を表示させてもよい。ユーザは、この画面にて情報を入力する。履歴処理部3060は、履歴情報の一部として、アノテーション情報を状態データと対応づけてアンドゥスタック3140に記録する。
アノテーション領域3340の表示により、ユーザはその状態を選択した意図を確認できる。アノテーション領域3340は、文書処理装置3000においてユーザがさまざまな状態選択を試す上で、ユーザインタフェースを好適化させる。カーソル3320が状態を示すオブジェクト上におかれたときには、その状態について状態データが表示されてもよい。
同図においてR1として示される状態は、アンドゥスタック3140においてあらかじめ定義される状態である。R1は、図33に関連して説明した推奨される部品構成(以下、「推奨状態」とよぶ)である。表示部3042は、R1に近い状態に遷移したときには、このような推奨状態を画面3300に表示させる。ここでいう「R1に近い状態」とは、所定回数、たとえば、1回の選択操作によってR1に遷移可能な状態のことをいう。
文書処理装置3000は、最終的な選択状態だけではなく、他の端点ステートを通販サイトのサーバに送信してもよい。通販サイトの運営者は、これらの端点ステートに関する情報を受信することにより、ユーザの最終的な選択形態だけではなく、最終選択される可能性があった構成についての情報も取得できる。そのため、より精緻なマーケティングが可能となる。
更に本発明の応用例を示す。
図40は、ウェブブラウザのページ切り替えに関する状態遷移を示す画面図である。
ウェブブラウザにてさまざまなサイトが提供するホームページを表示させるとき、ユーザは、ホームページのデータの一部として埋め込まれているハイパーリンク(Hyperlink)を辿って、別のホームページにジャンプする。ウェブブラウザは、ページの切替履歴を保持している。そして、「戻る」ボタンなどのユーザインタフェースを介して、過去に表示させたホームページを再度表示させることもできる。
ここで、ページAからページBにジャンプした後、ページAに戻り、ページAからページCにジャンプしたとする。このような場合、ページAからの分岐先であるページBの選択履歴は、通常、管理の対象外となってしまう。
本発明者は、ウェブブラウザのページ選択に関しても、上記したような状態遷移の管理方法を適用することが有効であると想到した。
画面3400は、ウェブページの選択履歴を示す。同図に示すP1からP7は、ウェブページを識別するための記号である。P1からはハイパーリンクによりP2にジャンプされている。また、P2からP3にジャンプしている。一方、P2からP4にもジャンプした履歴が残っている。
ユーザがカーソル3420をP3にあわせると、そのウェブページの縮小画像がサムネイル領域3440に表示される。あるいは、ウェブページのタイトルや運営サイト名などが表示されてもよい。
P4からP5に対してはハイパーリンクではない方法で移行している。たとえば、P4において、URL(Uniform Resource Locator)を直接指定してP5に移行した場合が該当する。あるいは、あらかじめ登録されたブックマークからP5を指定した場合も該当する。
このようなウェブブラウザのページ表示履歴管理方法によれば、ページ選択過程によらず過去の表示履歴情報が保持することができる。
オブジェクト生成部3064は、ウェブページの選択操作に応じて処理オブジェクトを生成する。そして、これらの処理オブジェクトを参照したアンドゥ操作やリドゥ操作により、任意の時点における表示内容を再現させることができる。
あるいは、表示対象のウェブページを切り替えたときに取得される状態データを参照して、任意の時点における表示内容を再現させてもよい。
このように、ウェブページの操作についても、文書処理と同様に、処理オブジェクト単位あるいは状態データ単位で管理することができる。
なお、アンドゥマネージャ3120は、各ページにおけるユーザの操作内容を記録してもよい。たとえば、ユーザがサイト運営者に対してデータを送信できる双方向性を有するページの場合、その操作内容が記録されてもよい。このような操作内容は、処理オブジェクトとして管理されてもよい。
図41は、時間ベースにより状態遷移を管理するための画面図である。
画面3500は、編集領域3520と時間軸表示領域3540に分割される。編集領域3520は、文書編集のための領域である。カーソル3240は、入力箇所を示している。時間軸表示領域3540は、編集文書についての時系列の履歴情報を図示する。ここでは、図36にて示したようにTnに基づいて、作業履歴を時系列表示する。
図32においては、スライダーバーにて制御する態様を示した。図41では、時間軸4040の代わりに作業日時そのものが表示される。ここでいう作業日時は、各処理オブジェクトに記録されている日時情報であってもよい。ユーザが、時間軸表示領域3540からいずれかの作業日時を選択すると、表示部3042は、その作業日時に該当する作業内容を編集領域3520に表示させる。
ユーザが時間軸表示領域3540においていずれかの作業日時を選択すると、その作業日時における作業状態にさかのぼるためにアンドゥ操作が繰り返される。たとえば、図36においてC5の実行日時までさかのぼるように指示されたとする。この場合、データ処理部3020は、−C11、−C10、・・・、−C6を実行することにより、C5が実行されたときの作業状態を再現させることができる。
このような態様によれば、ユーザは時間単位で過去の作業履歴を呼び出すことができる。所定の作業日時において複数の文書ファイルが表示されていたときには、編集領域3520には複数の文書ファイルが表示されてもよい。
なお、時間軸表示領域3540には、作業日時そのもののほかに、その作業日時における編集箇所を示すピックアップ画像が表示されてもよい。
以上に示した文書処理装置3000によれば、図39等に示したように状態をベースとして作業履歴を管理できる。また、図41等に示したように時間をベースとして作業履歴を管理することもできる。また、既に説明したように、一般的な文書管理だけでなくウェブブラウザの表示履歴管理にも、本発明は適用可能である。
前提技術として示した文書処理装置20は、XMLのような構造化された文書ファイルをノード単位で管理する。そのため、処理オブジェクトについてもノードに対する操作を単位として管理することができる。
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
実施の形態では、XML文書を処理する例について説明したが、本実施の形態の文書処理装置20は、他のマークアップ言語、例えば、SGML、HTMLなどで記述された文書も同様に処理可能である。