JPH0713966A

JPH0713966A - 文書の編集方法

Info

Publication number: JPH0713966A
Application number: JP6065883A
Authority: JP
Inventors: Jr Allen L Brown; エル．ブラウン、ジュニアアレン; Sidney W Marshall; ダブリュ．マーシャルシドニー
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1993-04-12
Filing date: 1994-04-04
Publication date: 1995-01-17
Also published as: DE69425082D1; EP0620527B1; EP0620527A3; DE69425082T2; EP0620527A2; US5557720A

Abstract

(57)【要約】【目的】ラベルを付けられた順序解析木（パーズ木）
が、有効な木へ拡張されることができるか否かを決定す
るための方法及び装置を提供する。【構成】編集をすると、文法Ｇに対応する解析木Ｔは
解析木Ｔ’になり、解析木Ｔ’は順序ラベル解析木ラベ
ルを付けられるノード（節）を有し、解析木Ｔ’の根
（ルート）のノードはＳでラベル付けされている。編集
される構造化文書は、”ギャップ”が設けられている対
応する解析木を有することが出来る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ラベル付けされ順序付
けられた解析木（パーズ木）が、有効な木へ拡張される
ことができるか否かを決定するための方法及び装置に関
し、また、少なくとも１回の編集（エディティング）ス
テップ後にラベル順序解析木が有効な木へ更に拡張され
ることができるか否かを決定するための方法及び装置に
関する。

【０００２】

【従来の技術及び発明が解決しようとする課題】文書
（ドキュメント）は、計算機言語の変化に従って内部コ
ンピュータ構造で記述され得る。例えば、あるコンピュ
ータで表される文書ではワード・パーフェクト（Word P
erfect) 言語を使用することもあるし、一方、異なるコ
ンピュータで表される文書ではマイクロソフト・ワード
(Microsoft Word)言語を使用することもある。文書処理
を更に効率的にするために、異なる言語を用いて表され
る文書同士間の相互交換を可能にすることがしばしば所
望されている。従って、相互関係のある文書同士間には
整合性が存在すべきである。

【０００３】文書の相互交換を可能にするこのような整
合性を提供するために、ＳＧＭＬ（standard generaliz
ed markup language:ISOで制定されており、標準汎用化
マークアップ言語）は、例えば文書の相互交換を可能に
する外部表現として改良された。

【０００４】編集される対象物が階層構造を有する多数
の編集アプリケーションがある。従って、あらゆる編集
ステップは、許容しうる内容の正式仕様に合わせなけれ
ばならない。ＳＧＭＬ文書タイプの定義に記述される文
書の編集は、構造化文書編集の特定の例である。

【０００５】文法（グラマー）に基づくエディタ（編集
プログラム）が一般的に課する強い順序づけ制約（即
ち、上下の制約、同様に時には左右の制約）のために、
構造化文書編集は多くのユーザに構造化対象物（例えば
プログラム又は文書）の構成を過度に制限する方法だと
考えられていた。従って、構文指向型編集のより柔軟な
バージョンが所望されている。しばしば、興味深い階層
構造のクラス（種）は、特定の文脈自由文法（ルール
（規則）のセット）よりなる不完全な解析木、即ち同じ
文法よりなる解析木のゼロ又はより適切な部分木を削除
した後に残るあらゆる木、と一致するように作られ得
る。

【０００６】例えば、以下の文法が与えらるとすると、
ユーザが階層構造を思いのままに組み立てることが出来
たかどうかを容易且つ効率的に決定することは望まし
い。ドキュメント（文書）→（フロント、ボディ、バッ
ク）、即ちＤｏｃ→（Ｆｒｏｎｔ，Ｂｏｄｙ，Ｂａｃｋ）ボディ→（イントロ、複数のセクション、アペンディク
ッス）即ち、Ｂｏｄｙ→（Ｉｎｔｒｏ，Ｍｎ．Ｓｅｃｔｉｏｎｓ⁺，
Ａｐｐ⁺) 図１にこの文法に対応する解析木を示す。

【０００７】ＳＧＭＬの文書クラスは、文書タイプの定
義又はＤＴＤ（文脈自由文法）によって定義される。Ｓ
ＧＭＬに従って、文書は適所に追加の構造マークアップ
を単に挿入することによって有効に形成されうる場合に
は、文書はわずかに有効であると分類される。例えば図
２に示されているように図１の解析木から”Ｆｒｏｎ
ｔ”が欠けているならば、”Ｆｒｏｎｔ”の単純な挿入
によって解析木は有効になるので、文書は弱有効である
と分類されるであろう。同様に、図３においても、図１
の解析木から”Ｂｏｄｙ”が欠けていたならば、〔Ｉｎ
ｔｒｏ，Ｓｅｃｔｉｏｎｓ⁺，Ａｐｐ⁺〕回りの始まり
及び終わりのタグの挿入によって有効な解析木となるの
で、この文書もわずかに有効であると分類されるであろ
う。構造がＤＴＤで定義される多数の言語であるなら、
そしてその場合のみ、文書は有効となる。

【０００８】従って、例えばユーザがノード（節）”
ｘ”をノード”Ｂｏｄｙ”の下に加えたかったならば、
この動作の有効性を容易にチェックできることは非常に
望ましい。従って、ある動作が取られる時は、その動作
が正当であるか否かを決定する。更に、ユーザが文書セ
グメントに自由に働きかけることができるように、この
ようなチェックを任意に便利な順序で行うことが所望さ
れる。

【０００９】

【課題を解決するための手段と作用】本発明の方法及び
装置は、少なくとも１回の編集ステップ後にＳＧＭＬ文
書が有効であるか否かを決定する。加えて、その編集ス
テップの結果得られた文書が弱有効であるが有効ではな
いならば、文書を有効にするであろう許容文書の完成状
態が示される。本発明に従って、文書は構成成分が構造
の互換性に従って、そこまでの所は正当であるか否かが
分かるようにチェックされる。どの構成成分も正当でな
いことが確認されると、本発明の方法及び解析／編集装
置は障害（欠陥）点を検討して、文書を正当化するため
に成しえることを決定する。

【００１０】本発明の態様は、文書を編集するための方
法であって、文書を編集するステップの性能が、文書の
文法の記号でラベルつけされるノードを備える解析木を
有効にするか否かを決定することを含み、編集ステップ
が、周知の構造互換性に従って正当であるか否かを決定
するステップと、前記編集ステップが正当でないと決定
されるならば、編集ステップの障害点を決定するステッ
プと、一度障害点が決定されると、編集ステップを正当
にするために、どのステップが行われるべきであったか
を決定するステップと、正当な編集ステップを行うステ
ップと、である。

【００１１】

【実施例】文書（ドキュメント）を形成する文書規則の
使用法は、文書規則（文法生成）の記号でラベル付けさ
れるノードを有する解析木の形式で示すことができる。
文書が編集されると、元の解析木のアーク（弧）及びノ
ード（ノード）の位置は変化する。以下に説明されるよ
うに、本発明の方法及び装置は新たに形成される解析木
の迅速な有効性検査を可能にする。

【００１２】文脈自由文法Ｇ＝＜Ｖ、Σ、Ｓ、Ｐ＞に関
して、Ｖが文法の記号（終端記号及び非終端記号）（ノ
ード）の集合、Σが文法の終端記号の集合、Ｓが文法の
出発記号、及びＰがプロダクション（ｐｒｏｄｕｃｔｉ
ｏｎ）の右側を可能にする一般的な正規表現を備える文
法のプロダクションの集合である場合、Ｔは文法Ｇの解
析木であると仮定される。終端記号を有する文法Ｇのプ
ロダクションだけが、ａが終端記号を示すＡ→ａの形式
になるという仮定が更になされる。

【００１３】例えば、文法は、Ｖ＝｛Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ，Ｇ，Ｈ，Ｐ，Ｑ，Ｒ，
Ｓ，Ｔ，Ｕ，Ｖ，Ｗ，Ｘ，Ｙ，Ｚ，ｐ，ｑ，ｒ，ｓ，
ｔ，ｕ，ｖ，ｗ，ｘ，ｙ，ｚ｝ Σ＝｛ｐ，ｑ，ｒ，ｓ，ｔ，ｕ，ｖ，ｗ，ｘ，ｙ，ｚ｝Ｓ＝ＨＰ＝｛Ｈ→ＡＢＣＡ→（ＤＡＥＡＦ）｜ＰＢ→（ＸＧＹ）｜ＱＣ→ＺＤ→ＷＥ→ＶＦ→ＵＧ→（ＴＢＳ）｜ＲＰ→ｐＱ→ｑＲ→ｒＳ→ｓＴ→ｔＵ→ｕＶ→ｖＷ→ｗＸ→ｘＹ→ｙＺ→ｚ｝を備えるＧ＝＜Ｖ，Σ，Ｓ，Ｐ＞であるとする。図５は
この文法に関する一般的な解析木Ｔである。

【００１４】編集をすると、文法Ｇに対応する解析木Ｔ
は解析木Ｔ’になり、解析木Ｔ’は順序ラベル解析木Ｖ
の構成要素でラベルを付けられるノードを有し、解析木
Ｔ’の根（ルート）のノードはＳでラベル付けされてい
る。編集された構造化文書は、”ギャップ（空を作られ
る）”が設けられる対応する解析木を有することが出来
る。ギャップが設けられる解析木は、横型の（水平方向
に）ギャップがもうけられた解析木又は縦型の（垂直方
向に）ギャップが設けられた解析木の形式になりうる。
図６は、横型のギャップ木の一例を示し、ギャップは最
上部”Ａ”に根づく（を根とする）全体の部分木を削除
して形成されている。

【００１５】図７は縦型のギャップ木を示すが、縦型の
ギャップは、最上部”Ａ”を削除してその場所に”Ａ”
の子を配置して形成される。

【００１６】Ｔ’のいづれかの部分木が根に同一ラベル
を有するＴの部分木にマッピング（写像）され、そして
マッピングが木Ｔ’に表されるノードと同様にノードの
水平方向及び垂直方向の順序付けを保持し、ＴがＧの有
効な解析木であるようにＴの部分木へのＴ’の部分木の
一対一のマッピングがあるなら、そしてその場合のみ順
序の付いたラベル木Ｔ’はＧのギャップ木となる。

【００１７】文法Ｇ用に部分毎に構造化されたエディタ
は、Ｇの一個のギャップ木を他のそのようなギャップ木
へ変換することができる。ギャップ木は、Ｇの完全な解
析木ではないが、純粋にそのギャップ木に新たなノード
及びアークを挿入することによって完全な解析木にされ
得る。ゆえにＴ’に於ける様々な”ギャップ”は、有効
な解析木Ｔを生成するために”満たされる”ことができ
る。よって編集は、ユーザがアークやノードの挿入及び
／又は削除によってあらゆるギャップ木Ｔ’を作ること
ができるように部分毎に行われる。部分毎に構造化され
た編集を納得するように作るために、解析木Ｔ’が、Ｇ
のギャップ木であるということを効率的に決定できなく
てはならない。本発明の方法及び装置によってこの決定
がなされる。

【００１８】例えば、文法例を仮定すれば、図５に示さ
れる完全な解析木を得ることができる。

【００１９】以下の定義は、本発明の背景として提供さ
れる。

【００２０】定義１ギャップ文法は、Ｖ−Σ（非終端記号）に含まれるＡ毎
に、Ａ→空がＰに含まれ、そしてその場合、空（ε）は
空列（ストリング）であるような文脈自由文法Ｇ＝＜
Ｖ，Σ，Ｓ，Ｐ＞である。これにより、横型のギャップ
木の概念が得られる。

【００２１】従って、先の文法例の場合、ギャップ文法
を成立させるために以下のプロダクションが加えられな
くてはならない。Ｈ→ε Ａ→ε Ｂ→ε Ｃ→ε Ｄ→ε Ｅ→ε Ｆ→ε Ｇ→ε Ｐ→ε Ｑ→ε Ｒ→ε Ｓ→ε Ｔ→ε Ｕ→ε Ｖ→ε Ｗ→ε Ｘ→ε Ｙ→ε Ｚ→ε

【００２２】定義２正規表現ｙによって定義される言語において可能な列と
してｄを有するＧにおいてプロダクションｘ→ｙがある
ならば、ａｘｂ→ａｄｂとなる。ａ＝ｂである場合、或
いはａ→ｃ及びｃ→＊ｂであるようなａ，ｃが存在する
場合、ａ→＊ｂとなる。

【００２３】定義３文脈自由文法Ｇ＝＜Ｖ，Σ，Ｓ，Ｐ＞の到達可能性グラ
フは、ノードの集合がＶであり、且つアークが、ｘ，ｙ
がＶにありｘ→ａｙｂがＰにあるような全順序付け対＜
ｘ，ｙ＞の集合である有向グラフである。Ｖに於ける記
号ｘ，ｙに関しては、ｘから１つ以上のアークのｙへの
有向パスがある場合、ｙはｘから到達可能であるとされ
る。この定義は、１つのノード（例えばｙ）がもう１つ
のノード（例えばｘ）から到達可能であるかどうかを定
義する。

【００２４】図８には、文法例に関する到達可能性グラ
フを示す。

【００２５】文法例に関する到達可能性の表ＨはＡＢＣＤＥＦＧＰｐＱｑＲｒＳｓＴｔＵｕＶｖＷｗ
ＸｘＹｙＺｚに到達可能である。ＡはＡＤＥＦＰｐＵｕ
ＶｖＷｗに到達可能である。ＢはＢＧＱｑＲｒＳｓＴｔ
ＸｘＹｙに到達可能である。ＣはＺｚに到達可能であ
る。ＤはＷｗに到達可能である。ＥはＶｖに到達可能で
ある。ＦはＵｕに到達可能である。ＧはＢＧＱｑＲｒＳ
ｓＴｔＸｘＹｙに到達可能である。Ｐはｐに到達可能で
ある。Ｑはｑに到達可能である。Ｒはｒに到達可能であ
る。Ｓはｓに到達可能である。Ｔはｔに到達可能であ
る。Ｕはｕに到達可能である。Ｖはｖに到達可能であ
る。Ｗはｗに到達可能である。Ｘはｘに到達可能であ
る。Ｙはｙに到達可能である。Ｚはｚに到達可能であ
る。

【００２６】定義４Ｇ＝＜Ｖ，Σ，Ｓ，Ｐ＞の到達可能性グラフの強連結成
分は、集合中の全部のノードが集合中の残りの全部のノ
ードから到達可能であるという特性を備えるＧの到達可
能性グラフのノードの集合であり、集合のノードから到
達可能である集合に入っていないノードから到達されう
る集合のノードはない。

【００２７】文法例用に図８に示されるように、Ｇ＝＜
Ｖ，Σ，Ｓ，Ｐ＞の到達可能性グラフの強連結成分への
パーティション（区分）を考えよ。図８の領域集合で
は、２つのノードが矢印によって接続される時、一方の
領域に配置されるノードがどのようにもう一方の領域の
ノードに進むかが示されている。

【００２８】出て行く（ラベル付けされ）たアークを有
さない強連結成分はランク０を有する。出て行くアーク
を有する強連結成分Ｕは、Ｕが（Ｕから）出て行くアー
クにより接続される強連結成分のランク内の最大ランク
よりも一ランク大きなランクを有する。Ｖにおけるｘの
ランクは、ｘがある強連結成分のランクである。図８
は、強連結成分のランクにラベル付けもする。

【００２９】定義５文脈自由文法Ｇ＝＜Ｖ，Σ，Ｓ，Ｐ＞のＶにおける記号
ｘは、自分自身から到達可能であるならば、そしてその
場合のみ再帰的である。再帰的な記号Ｓは、Ｓを含む強
連結成分のいづれかの記号の一例よりも多く生成できる
Ｓを含む強連結成分における記号ＲからＰのプロダクシ
ョンが存在すれば、多重再帰的である。多重再帰的でな
い再帰記号は、単再帰的である。

【００３０】文法例において、Ａは多重再帰的であり、
Ｂ及びＧは、単再帰的である。他の全記号は再帰的でな
い。

【００３１】定義６ｘを文脈自由文法Ｇ＝＜Ｖ，Σ，Ｓ，Ｐ＞の記号とす
る。ギャップ（ｘ）と称される正規表現はあらゆる記号
ｘと関連がある。正規表現ギャップ（ｘ）は、下記のよ
うに帰納的に定義される。１．Σのｘが（ランク０の）終端記号であるならば、ギ
ャップ（ｘ）＝（ｘ）となる。２．Ｖ−Σのｘがランク０の非再帰的記号であるなら
ば、ギャップ（ｘ）＝（ε｜ｘ）となる。３．Ｖのｘが０以外（非０）のランクの非再帰的記号で
あるならば、ギャップ（ｘ）＝（ε｜ｘ｜Ｒ１｜Ｒ２・
・・）となり、この場合Ｒ１，Ｒ２・・・はプロダクシ
ョンの各記号ｗの代わりに用いられるギャップ（ｗ）を
有するｘ用のプロダクションの右側にある。４．Ｖのｘが多重再帰的な記号であるならば、ギャップ
（ｘ）＝（ｘ｜Ｓ１｜Ｓ２・・・）＊となり、この場
合Ｓ１，Ｓ２・・・は、ｘから到達可能な記号の完全な
集合である。５．ＶのｘがＧの単再帰的記号であると仮定せよ。以下
のように正規表現Ｌ，Ｍ，及びＲの集合を構成せよ。Ｓ
ＰＬＩＴ（ｅｘｐ）を下記のように定義せよ。もしＳＰ
ＬＩＴ（ｅｘｐ）が既に同じｅｘｐに対して評価されて
いたら、戻れ。そうでなければ、ｅｘｐがｘと同じ強連
結成分において全く記号を含まないならば、ｅｘｐの各
記号ｗの代わりにギャップ（ｗ）を備えるｅｘｐを集合
Ｍへ加えよ。そうでなければ、ｅｘｐが記号であるなら
ば、ｘと同じ強連結成分中になくてはならないので、何
もするな。そうでなければ、ｅｘｐにおいてトップレベ
ルの演算子が＊（スター）であれば、ｘが単再帰的記号
であることはないので、エラー（誤り）がある。そうで
なければ、ｅｘｐにおいてトップレベルの演算子が、｜
（”又は（ｏｒ）”）である場合、ＳＰＬＩＴ（ａｌ
ｔ）を呼び出せ。この場合、ａｌｔは、｜（”又は”）
による２者の間の選択のそれぞれである。そうでなけれ
ば、ｅｘｐにおいてトップレベルの演算子が、ＣＯＮＣ
ＡＴＥＮＡＴＥ（並置）であるならば、ｘを含む強連結
成分にある記号を含むＣＯＮＣＡＴＥＮＡＴＥの一項に
正確にならなくてはならない。この項の左側の項の全記
号を集合Ｌに加えよ。この項の右側の項の全記号を集合
Ｒに加えよ。ｘを含む強連結成分にある記号を含む項を
有するＳＰＬＩＴ（項）を呼び出せ。そうでなければ、
トップレベルの演算子が＋（ＰＬＵＳ（プラス））であ
るならば、ｘは単再帰的ではないので、エラー（誤り）
がある。そうでなければ、トップレベルの演算子が？
（ＯＰＴＩＯＮＡＬ（選択自由））であるならば、ＯＲ
（又は）及びＥＭＰＴＹ（空）を用いて、その表現を書
換えよ（例えば、ｘ？を（ε｜ｘ）へ書き換える）。次
に、得られる表現のＳＰＬＩＴを呼び出せ。ＳＰＬＩＴ
に関する定義の終了。Ｌ，Ｍ，及びＲを空集合になるよ
うに初期化せよ。Ｇのｘに対するプロダクション毎にＳ
ＰＬＩＴ（ＲＨＳ）を呼び出せ。ここでＲＨＳがプロダ
クションの右側にある次に、左（ｘ）＝（Ｌ１｜Ｌ２｜・・・）となる。この
場合、Ｌ１、Ｌ２・・・は、集合Ｌにある又は集合Ｌの
記号から到達可能である全記号の集合である。中央
（ｘ）＝（ε｜Ｓ１｜Ｓ２・・・｜Ｍ１｜Ｍ２｜・・
・）となる。この場合、Ｓ１，Ｓ２は、ｘを含む強連結
成分中の記号であり、Ｍ１，Ｍ２は、集合Ｍの正規表現
の集合である。右（ｘ）＝（Ｒ１｜Ｒ２｜・・・）とな
る。この場合、Ｒ１，Ｒ２・・・は、集合Ｒ中に現れる
又は集合Ｒ中の記号から到達可能である全記号の集合で
ある。次に、ギャップ（ｘ）＝（左（ｘ））＊中央
（ｘ）（右（ｘ））＊となる。

【００３２】文法例の場合、ＳＰＬＥＴ（Ｂ）は以下の
集合を構成する。左＝｛Ｔ，Ｘ｝中央＝｛ギャップ（Ｑ），ギャップ（Ｒ）｝右＝｛Ｓ，Ｙ｝及び左（Ｂ）＝（Ｔ｜ｔ｜Ｘ｜ｘ）中央（Ｂ）＝（ε｜Ｂ｜Ｇ｜ギャップ（Ｑ）｜ギャップ
（Ｒ））＝（ε｜Ｂ｜Ｇ｜Ｑ｜ｑ｜Ｒ｜ｒ）右（Ｂ）＝（Ｓ｜ｓ｜Ｙ｜ｙ）

【００３３】文法例の全部の非終端記号に対するギャッ
プ（ｘ）の値は、ギャップ（Ｈ）＝（ε｜Ｈ｜ギャップ（Ａ）ギャップ
（Ｂ）ギャップ（Ｃ））ギャップ（Ａ）＝（Ａ｜Ｄ｜Ｅ｜Ｆ｜Ｐ｜Ｕ｜Ｖ｜Ｗ｜
ｐ｜ｕ｜ｖ｜ｗ）＊ギャップ（Ｂ）＝（Ｔ｜ｔ｜Ｘ｜ｘ）＊（ε｜Ｂ｜Ｇ｜
ギャップ（Ｑ）｜ギャップ（Ｒ））（Ｓ｜ｓ｜Ｙ｜ｙ）
＊）ギャップ（Ｃ）＝（ε｜Ｃ｜ギャップ（Ｚ））ギャップ（Ｄ）＝（ε｜Ｄ｜ギャップ（Ｗ））ギャップ（Ｅ）＝（ε｜Ｅ｜ギャップ（Ｖ））ギャップ（Ｆ）＝（ε｜Ｆ｜ギャップ（Ｕ））ギャップ（Ｇ）＝（Ｔ｜ｔ｜Ｘ｜ｘ）＊（ε｜Ｂ｜Ｇ｜
ギャップ（Ｑ）｜ギャップ（Ｒ））（Ｓ｜ｓ｜Ｙ｜ｙ）
＊）ギャップ（Ｐ）＝（ε｜Ｐ｜ギャップ（ｐ））ギャップ（Ｑ）＝（ε｜Ｑ｜ギャップ（ｑ））ギャップ（Ｒ）＝（ε｜Ｒ｜ギャップ（ｒ））ギャップ（Ｓ）＝（ε｜Ｓ｜ギャップ（ｓ））ギャップ（Ｔ）＝（ε｜Ｔ｜ギャップ（ｔ））ギャップ（Ｕ）＝（ε｜Ｕ｜ギャップ（ｕ））ギャップ（Ｖ）＝（ε｜Ｖ｜ギャップ（ｖ））ギャップ（Ｗ）＝（ε｜Ｗ｜ギャップ（ｗ））ギャップ（Ｘ）＝（ε｜Ｘ｜ギャップ（ｘ））ギャップ（Ｙ）＝（ε｜Ｙ｜ギャップ（ｙ））ギャップ（Ｚ）＝（ε｜Ｚ｜ギャップ（ｚ））である。

【００３４】拡張され、簡略化されたギャップ（ｘ）の
値は、ギャップ（Ｈ）＝（ε｜Ｈ｜（Ａ｜Ｄ｜Ｅ｜Ｆ｜Ｐ｜Ｕ
｜Ｖ｜Ｗ｜ｐ｜ｕ｜ｖ｜ｗ）＊（Ｔ｜ｔ｜Ｘ｜ｘ）＊
（ε｜Ｂ｜Ｇ｜Ｑ｜ｑ｜Ｒ｜ｒ）（Ｓ｜ｓ｜Ｙ｜ｙ）＊
（ε｜Ｃ｜Ｚ｜ｚ）ギャップ（Ａ）＝（Ａ｜Ｄ｜Ｅ｜Ｆ｜Ｐ｜Ｕ｜Ｖ｜Ｗ｜
ｐ｜ｕ｜ｖ｜ｗ）＊ギャップ（Ｂ）＝（Ｔ｜ｔ｜Ｘ｜ｘ）＊（ε｜Ｂ｜Ｇ｜
Ｑ｜ｑ｜Ｒ｜ｒ）（Ｓ｜ｓ｜Ｙ｜ｙ）＊ギャップ（Ｃ）＝ε｜Ｃ｜Ｚ｜ｚギャップ（Ｄ）＝ε｜Ｄ｜Ｗ｜ｗギャップ（Ｅ）＝ε｜Ｅ｜Ｖ｜ｖギャップ（Ｆ）＝ε｜Ｆ｜Ｕ｜ｕギャップ（Ｇ）＝（Ｔ｜ｔ｜Ｘ｜ｘ）＊（ε｜Ｂ｜Ｇ｜
Ｑ｜ｑ｜Ｒ｜ｒ）（Ｓ｜ｓ｜Ｙ｜ｙ）＊ギャップ（Ｐ）＝ε｜Ｐ｜ｐギャップ（Ｑ）＝ε｜Ｑ｜ｑギャップ（Ｒ）＝ε｜Ｒ｜ｒギャップ（Ｓ）＝ε｜Ｓ｜ｓギャップ（Ｔ）＝ε｜Ｔ｜ｔギャップ（Ｕ）＝ε｜Ｕ｜ｕギャップ（Ｖ）＝ε｜Ｖ｜ｖギャップ（Ｗ）＝ε｜Ｗ｜ｗギャップ（Ｘ）＝ε｜Ｘ｜ｘギャップ（Ｙ）＝ε｜Ｙ｜ｙギャップ（Ｚ）＝ε｜Ｚ｜ｚである。

【００３５】周知であるように、有限状態機械は、所与
の列が正規表現によって定義される言語の一要素（メン
バー）であるか否かを効率的にチェックするあらゆる正
規表現を得るために構成されることができる。〔アー
ル．マックナーグトン（R. McNaughton) 及びエイチ.
ヤマダによる順序機械の" オートマトンのための正規表
現及び状態グラフ" の論文を見よ。選択論文、アディソ
ンウェーズレイ、１９６４〕ギャップ（Ｈ）に対応す
る模範的な有限状態機械は図９に示され、ギャップ
（Ａ）に対応する模範的な有限状態機械は図１０に示さ
れ、ギャップ（Ｂ）に対応する模範的な有限状態機械は
図１１に示され、ギャップ（Ｃ）に対応する模範的な有
限状態機械は図１２に示され、ギャップ（Ｓ）に対応す
る模範的な有限状態機械は図１３に示される。これらの
図において、受け入れ状態は二重円で示され、不履行
（フェール）状態が１重円で示されている。

【００３６】定理（理論）１Ｇ＝＜Ｖ，Σ，Ｓ，Ｐ＞は、Ｖ−Σの状態でＡ及びＶ＊
の状態でａであるギャップ文法になると仮定せよ。もし
ａが、ギャップ（Ａ）にあるならば、そしてその場合の
みＡ→＊ａとなる。本発明に従って、エディタは木Ｔ’
が有効であるか否かを決定できる。第１実施例におい
て、木全体の有効性はエディタによって以下に従ってチ
ェックされる。Ｒを正規規則であると仮定する。周知で
あるように、正規表現によって定義される言語のストリ
ング（列）はストリング長さのオーダの決定時間で認識
されることができる。従って、正規表現Ｒを仮定すれ
ば、Ｓが認識（Ｒ）がオーダ長さ（Ｓ）の決定性時間で
実行するＲ中にあるならば、及びその場合のみ真に戻る
ストリング（Ｖ内で記号が順序ずづけられたリスト）Ｓ
によってパラメータで表される手順認識（Ｒ）はコンパ
イル（編集）される。先の定理の効果によって、下記の
決定手順は、Ｔ’がＧのギャップ木であれば、及びその
場合のみ真へ戻る。更に、決定手順は、（ギャップ木で
あっても、なくても）木のサイズで時間線形に実行され
る。Ｂ１，・・・Ｂｋのラベルを付けられた中間の子
孫ノードを備えるＴ’においてＡのラベルを付けられた
各ノードごとに行う。（Ａ）（Ｂ₁、・・・、Ｂ）を認識するならば、真にな
り、そうでなければ戻る（偽）。戻れ（真）Ａは、例えばＢ１，・・・，Ｂｋ＝ε等の中間の子孫が
なくともよい。

【００３７】本発明によって教示される方法によって構
成される有限状態機械は、入力として有限状態機械にお
くられる文書の部分構造がギャップ文法の解析木のイン
スタンスを構成できるか否かを決定する。各非終端記号
ノードのいずれも子の名前（列としての順序）は、木が
ギャップ文法の解析木のインスタンスになるように、親
ノードによって名付けられる有限状態機械によって受け
入れられなくてはならない。この状況が維持されれば、
解析木は弱有効文書の解析木になるか、さもなければ有
効文書でも弱有効文書でもない解析木になる。

【００３８】本発明のもう１つの実施例に従って、エデ
ィタは木Ｔのノード及びアークの挿入又は削除によって
形成される木Ｔ’のいくらかの部分木のチェックだけを
必要とする。この実施例において、挿入されるノードに
関しては、新しい子供と共に新たに挿入されるノードの
親と、新たに挿入されるノードと、その子だけがチェッ
クされる。削除されたノードに関しては、新しい子と共
に新たに削除されたノードの親だけがチェックされる。
この他の手順は、以下に従ってなされる。親（ノード）
は、ノードをパラメータとして取り、木Ｔ’のその親ノ
ードに戻る。子の名前（ノード）は、ノードをパラメー
タとして取り、木Ｔ’のノードの下の子のラベルの順序
付けリストに戻る。有限状態機械（ｆｓｍ）（ノード）
は、パラメータとしてノードを取り、木Ｔ’中のそのノ
ードのラベルと対応する有限状態機械（正規表現）に戻
る。Ｔ’中の新しいノードごとに行え。（（有限状態機
械（親（ｎ）））（子の名前（親（ｎ）））を認識）し
なければ、偽（フォールス）に戻れ。（（有限状態機械
（ｎ））（子の名前（ｎ））を認識）しなければ、偽に
戻れ。Ｔ’中の削除されるノードの（まだ存在いてい
る）親ノードｎの各々に対して、次の事を行え。（（有
限状態機械（ｎ））（子の名前（ｎ））を認識）しなけ
れば、偽に戻れ。真に戻れ。後者の手順は、挿入される
ノードの古い親の下側のノードの数と、削除されるノー
ドの親の下側のノードの数の総計に比例する時間で実行
される。

【００３９】例えば、図７の木のノード”Ｈ”の下側の
ノードが、弱有効文書の解析木において許容されるか否
かをチェックするために、子”ＤＡＥＡＦＢＣ”のラベ
ルは、列に形成され、図９のＨによってラベルを付けら
れる有限状態機械によって認識されることが試みられ
る。状態１で開始し、有限状態機械は所与の列に対し
て、以下の遷移を行う。状態１はＤを走査し、結果とし
て状態２に帰着し、状態２はＡを走査し、結果として状
態２に帰着し、状態２はＥを走査し、結果として状態２
に帰着し、状態２はＡを走査し、結果として状態２に帰
着し、状態２はＦを走査し、結果として状態２に帰着
し、状態２はＢを走査し、結果として状態４に帰着し、
状態４はＣを走査し、結果として状態５に帰着する。状
態５は、受け入れ状態（二重円として）示される（マー
クされる）ので、子のシーケンスは、弱有効文書の解析
木であることもある。

【００４０】従って、本発明のエディタ及び解析は、ラ
ベル付けされ順序の付いた解析木が所与の文脈自由文法
の解析木になるように拡張されることができるか否かを
効率的に決定できる。エディタ及び解析は、所与の解析
木が有効解析木に至るまで拡張できるか否かを決定する
プログラムされたコンピュータでもあり得る。決定は、
新たに形成される木のノードの数に対して線型になる時
間でなされるか、あるいは解析木の変化部分だけのサイ
ズに対して線型になる時間で決定するように変更され
る。

【００４１】本発明は、特定の実施例を伴って説明され
たが、多数の選択、変更、及びバリエーションが、当業
者にとってはっきりしていることは明白である。例え
ば、方法及び装置は仕様に基づいたＳＧＭＬ文法を伴っ
て説明されたが、本発明は例えば、オープンドキュメン
トアーキテクチャ（ＯＤＡ）等の仕様に基づいた形式的
な文脈自由文法で記述されるあらゆる文書表現に使用さ
れることもできる。

【００４２】

【発明の効果】本発明は、少なくとも１回の編集ステッ
プ後にラベル順序解析木が有効な木へ更に拡張されるこ
とができるか否かを効率的に決定するための方法及び装
置を提供する。

【図面の簡単な説明】

【図１】所与の文法に対応する模範的な解析木である。

【図２】横型のギャップを設けられた解析木の一例を示
す。

【図３】縦型のギャップを設けられた解析木の一例を示
す。

【図４】本発明に従った編集装置のブロック図である。

【図５】文法例に対応する模範的な解析木である。

【図６】文法例に対応する横型のギャップを設けられた
模範的な解析木である。

【図７】文法例に対応する縦型のギャップを設けられた
模範的な解析木である。

【図８】文法例に関して示される強連結成分及びランク
を備える到達可能性グラフである。

【図９】文法例に関して、解析木を弱有効にするために
有用な有限状態機械の例を示す。

【図１０】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。

【図１１】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。

【図１２】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。

【図１３】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。

───────────────────────────────────────────────────── フロントページの続き (72)発明者シドニーダブリュ．マーシャルアメリカ合衆国ニューヨーク州 14526 ペンフィールドニューウィックハムドライヴ７

Claims

【特許請求の範囲】

【請求項１】文書を編集するための方法であって、文
書を編集するステップの性能が、文書の文法の記号でラ
ベルつけされるノードを備える解析木を有効にするか否
かを決定することを含み、編集ステップが、周知の構造互換性に従って正当である
か否かを決定するステップと、前記編集ステップが正当でないと決定されるならば、編
集ステップの障害点を決定するステップと、一度障害点が決定されると、編集ステップを正当にする
ために、どのステップが行われるべきであったかを決定
するステップと、正当な編集ステップを行うステップと、からなる文書の編集方法。