JPH0713966A - 文書の編集方法 - Google Patents
文書の編集方法Info
- Publication number
- JPH0713966A JPH0713966A JP6065883A JP6588394A JPH0713966A JP H0713966 A JPH0713966 A JP H0713966A JP 6065883 A JP6065883 A JP 6065883A JP 6588394 A JP6588394 A JP 6588394A JP H0713966 A JPH0713966 A JP H0713966A
- Authority
- JP
- Japan
- Prior art keywords
- gap
- tree
- document
- grammar
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
Abstract
(57)【要約】
【目的】 ラベルを付けられた順序解析木(パーズ木)
が、有効な木へ拡張されることができるか否かを決定す
るための方法及び装置を提供する。 【構成】 編集をすると、文法Gに対応する解析木Tは
解析木T’になり、解析木T’は順序ラベル解析木ラベ
ルを付けられるノード(節)を有し、解析木T’の根
(ルート)のノードはSでラベル付けされている。編集
される構造化文書は、”ギャップ”が設けられている対
応する解析木を有することが出来る。
が、有効な木へ拡張されることができるか否かを決定す
るための方法及び装置を提供する。 【構成】 編集をすると、文法Gに対応する解析木Tは
解析木T’になり、解析木T’は順序ラベル解析木ラベ
ルを付けられるノード(節)を有し、解析木T’の根
(ルート)のノードはSでラベル付けされている。編集
される構造化文書は、”ギャップ”が設けられている対
応する解析木を有することが出来る。
Description
【0001】
【産業上の利用分野】本発明は、ラベル付けされ順序付
けられた解析木(パーズ木)が、有効な木へ拡張される
ことができるか否かを決定するための方法及び装置に関
し、また、少なくとも1回の編集(エディティング)ス
テップ後にラベル順序解析木が有効な木へ更に拡張され
ることができるか否かを決定するための方法及び装置に
関する。
けられた解析木(パーズ木)が、有効な木へ拡張される
ことができるか否かを決定するための方法及び装置に関
し、また、少なくとも1回の編集(エディティング)ス
テップ後にラベル順序解析木が有効な木へ更に拡張され
ることができるか否かを決定するための方法及び装置に
関する。
【0002】
【従来の技術及び発明が解決しようとする課題】文書
(ドキュメント)は、計算機言語の変化に従って内部コ
ンピュータ構造で記述され得る。例えば、あるコンピュ
ータで表される文書ではワード・パーフェクト(Word P
erfect) 言語を使用することもあるし、一方、異なるコ
ンピュータで表される文書ではマイクロソフト・ワード
(Microsoft Word)言語を使用することもある。文書処理
を更に効率的にするために、異なる言語を用いて表され
る文書同士間の相互交換を可能にすることがしばしば所
望されている。従って、相互関係のある文書同士間には
整合性が存在すべきである。
(ドキュメント)は、計算機言語の変化に従って内部コ
ンピュータ構造で記述され得る。例えば、あるコンピュ
ータで表される文書ではワード・パーフェクト(Word P
erfect) 言語を使用することもあるし、一方、異なるコ
ンピュータで表される文書ではマイクロソフト・ワード
(Microsoft Word)言語を使用することもある。文書処理
を更に効率的にするために、異なる言語を用いて表され
る文書同士間の相互交換を可能にすることがしばしば所
望されている。従って、相互関係のある文書同士間には
整合性が存在すべきである。
【0003】文書の相互交換を可能にするこのような整
合性を提供するために、SGML(standard generaliz
ed markup language:ISOで制定されており、標準汎用化
マークアップ言語)は、例えば文書の相互交換を可能に
する外部表現として改良された。
合性を提供するために、SGML(standard generaliz
ed markup language:ISOで制定されており、標準汎用化
マークアップ言語)は、例えば文書の相互交換を可能に
する外部表現として改良された。
【0004】編集される対象物が階層構造を有する多数
の編集アプリケーションがある。従って、あらゆる編集
ステップは、許容しうる内容の正式仕様に合わせなけれ
ばならない。SGML文書タイプの定義に記述される文
書の編集は、構造化文書編集の特定の例である。
の編集アプリケーションがある。従って、あらゆる編集
ステップは、許容しうる内容の正式仕様に合わせなけれ
ばならない。SGML文書タイプの定義に記述される文
書の編集は、構造化文書編集の特定の例である。
【0005】文法(グラマー)に基づくエディタ(編集
プログラム)が一般的に課する強い順序づけ制約(即
ち、上下の制約、同様に時には左右の制約)のために、
構造化文書編集は多くのユーザに構造化対象物(例えば
プログラム又は文書)の構成を過度に制限する方法だと
考えられていた。従って、構文指向型編集のより柔軟な
バージョンが所望されている。しばしば、興味深い階層
構造のクラス(種)は、特定の文脈自由文法(ルール
(規則)のセット)よりなる不完全な解析木、即ち同じ
文法よりなる解析木のゼロ又はより適切な部分木を削除
した後に残るあらゆる木、と一致するように作られ得
る。
プログラム)が一般的に課する強い順序づけ制約(即
ち、上下の制約、同様に時には左右の制約)のために、
構造化文書編集は多くのユーザに構造化対象物(例えば
プログラム又は文書)の構成を過度に制限する方法だと
考えられていた。従って、構文指向型編集のより柔軟な
バージョンが所望されている。しばしば、興味深い階層
構造のクラス(種)は、特定の文脈自由文法(ルール
(規則)のセット)よりなる不完全な解析木、即ち同じ
文法よりなる解析木のゼロ又はより適切な部分木を削除
した後に残るあらゆる木、と一致するように作られ得
る。
【0006】例えば、以下の文法が与えらるとすると、
ユーザが階層構造を思いのままに組み立てることが出来
たかどうかを容易且つ効率的に決定することは望まし
い。 ドキュメント(文書)→(フロント、ボディ、バッ
ク)、即ち Doc→(Front,Body,Back) ボディ→(イントロ、複数のセクション、アペンディク
ッス)即ち、 Body→(Intro,Mn.Sections+ ,
App+ ) 図1にこの文法に対応する解析木を示す。
ユーザが階層構造を思いのままに組み立てることが出来
たかどうかを容易且つ効率的に決定することは望まし
い。 ドキュメント(文書)→(フロント、ボディ、バッ
ク)、即ち Doc→(Front,Body,Back) ボディ→(イントロ、複数のセクション、アペンディク
ッス)即ち、 Body→(Intro,Mn.Sections+ ,
App+ ) 図1にこの文法に対応する解析木を示す。
【0007】SGMLの文書クラスは、文書タイプの定
義又はDTD(文脈自由文法)によって定義される。S
GMLに従って、文書は適所に追加の構造マークアップ
を単に挿入することによって有効に形成されうる場合に
は、文書はわずかに有効であると分類される。例えば図
2に示されているように図1の解析木から”Fron
t”が欠けているならば、”Front”の単純な挿入
によって解析木は有効になるので、文書は弱有効である
と分類されるであろう。同様に、図3においても、図1
の解析木から”Body”が欠けていたならば、〔In
tro,Sections+ ,App+ 〕回りの始まり
及び終わりのタグの挿入によって有効な解析木となるの
で、この文書もわずかに有効であると分類されるであろ
う。構造がDTDで定義される多数の言語であるなら、
そしてその場合のみ、文書は有効となる。
義又はDTD(文脈自由文法)によって定義される。S
GMLに従って、文書は適所に追加の構造マークアップ
を単に挿入することによって有効に形成されうる場合に
は、文書はわずかに有効であると分類される。例えば図
2に示されているように図1の解析木から”Fron
t”が欠けているならば、”Front”の単純な挿入
によって解析木は有効になるので、文書は弱有効である
と分類されるであろう。同様に、図3においても、図1
の解析木から”Body”が欠けていたならば、〔In
tro,Sections+ ,App+ 〕回りの始まり
及び終わりのタグの挿入によって有効な解析木となるの
で、この文書もわずかに有効であると分類されるであろ
う。構造がDTDで定義される多数の言語であるなら、
そしてその場合のみ、文書は有効となる。
【0008】従って、例えばユーザがノード(節)”
x”をノード”Body”の下に加えたかったならば、
この動作の有効性を容易にチェックできることは非常に
望ましい。従って、ある動作が取られる時は、その動作
が正当であるか否かを決定する。更に、ユーザが文書セ
グメントに自由に働きかけることができるように、この
ようなチェックを任意に便利な順序で行うことが所望さ
れる。
x”をノード”Body”の下に加えたかったならば、
この動作の有効性を容易にチェックできることは非常に
望ましい。従って、ある動作が取られる時は、その動作
が正当であるか否かを決定する。更に、ユーザが文書セ
グメントに自由に働きかけることができるように、この
ようなチェックを任意に便利な順序で行うことが所望さ
れる。
【0009】
【課題を解決するための手段と作用】本発明の方法及び
装置は、少なくとも1回の編集ステップ後にSGML文
書が有効であるか否かを決定する。加えて、その編集ス
テップの結果得られた文書が弱有効であるが有効ではな
いならば、文書を有効にするであろう許容文書の完成状
態が示される。本発明に従って、文書は構成成分が構造
の互換性に従って、そこまでの所は正当であるか否かが
分かるようにチェックされる。どの構成成分も正当でな
いことが確認されると、本発明の方法及び解析/編集装
置は障害(欠陥)点を検討して、文書を正当化するため
に成しえることを決定する。
装置は、少なくとも1回の編集ステップ後にSGML文
書が有効であるか否かを決定する。加えて、その編集ス
テップの結果得られた文書が弱有効であるが有効ではな
いならば、文書を有効にするであろう許容文書の完成状
態が示される。本発明に従って、文書は構成成分が構造
の互換性に従って、そこまでの所は正当であるか否かが
分かるようにチェックされる。どの構成成分も正当でな
いことが確認されると、本発明の方法及び解析/編集装
置は障害(欠陥)点を検討して、文書を正当化するため
に成しえることを決定する。
【0010】本発明の態様は、文書を編集するための方
法であって、文書を編集するステップの性能が、文書の
文法の記号でラベルつけされるノードを備える解析木を
有効にするか否かを決定することを含み、編集ステップ
が、周知の構造互換性に従って正当であるか否かを決定
するステップと、前記編集ステップが正当でないと決定
されるならば、編集ステップの障害点を決定するステッ
プと、一度障害点が決定されると、編集ステップを正当
にするために、どのステップが行われるべきであったか
を決定するステップと、正当な編集ステップを行うステ
ップと、である。
法であって、文書を編集するステップの性能が、文書の
文法の記号でラベルつけされるノードを備える解析木を
有効にするか否かを決定することを含み、編集ステップ
が、周知の構造互換性に従って正当であるか否かを決定
するステップと、前記編集ステップが正当でないと決定
されるならば、編集ステップの障害点を決定するステッ
プと、一度障害点が決定されると、編集ステップを正当
にするために、どのステップが行われるべきであったか
を決定するステップと、正当な編集ステップを行うステ
ップと、である。
【0011】
【実施例】文書(ドキュメント)を形成する文書規則の
使用法は、文書規則(文法生成)の記号でラベル付けさ
れるノードを有する解析木の形式で示すことができる。
文書が編集されると、元の解析木のアーク(弧)及びノ
ード(ノード)の位置は変化する。以下に説明されるよ
うに、本発明の方法及び装置は新たに形成される解析木
の迅速な有効性検査を可能にする。
使用法は、文書規則(文法生成)の記号でラベル付けさ
れるノードを有する解析木の形式で示すことができる。
文書が編集されると、元の解析木のアーク(弧)及びノ
ード(ノード)の位置は変化する。以下に説明されるよ
うに、本発明の方法及び装置は新たに形成される解析木
の迅速な有効性検査を可能にする。
【0012】文脈自由文法G=<V、Σ、S、P>に関
して、Vが文法の記号(終端記号及び非終端記号)(ノ
ード)の集合、Σが文法の終端記号の集合、Sが文法の
出発記号、及びPがプロダクション(producti
on)の右側を可能にする一般的な正規表現を備える文
法のプロダクションの集合である場合、Tは文法Gの解
析木であると仮定される。終端記号を有する文法Gのプ
ロダクションだけが、aが終端記号を示すA→aの形式
になるという仮定が更になされる。
して、Vが文法の記号(終端記号及び非終端記号)(ノ
ード)の集合、Σが文法の終端記号の集合、Sが文法の
出発記号、及びPがプロダクション(producti
on)の右側を可能にする一般的な正規表現を備える文
法のプロダクションの集合である場合、Tは文法Gの解
析木であると仮定される。終端記号を有する文法Gのプ
ロダクションだけが、aが終端記号を示すA→aの形式
になるという仮定が更になされる。
【0013】例えば、文法は、 V={A,B,C,D,E,F,G,H,P,Q,R,
S,T,U,V,W,X,Y,Z,p,q,r,s,
t,u,v,w,x,y,z} Σ={p,q,r,s,t,u,v,w,x,y,z} S=H P= { H→ABC A→(DAEAF)|P B→(XGY)|Q C→Z D→W E→V F→U G→(TBS)|R P→p Q→q R→r S→s T→t U→u V→v W→w X→x Y→y Z→z } を備えるG=<V,Σ,S,P>であるとする。図5は
この文法に関する一般的な解析木Tである。
S,T,U,V,W,X,Y,Z,p,q,r,s,
t,u,v,w,x,y,z} Σ={p,q,r,s,t,u,v,w,x,y,z} S=H P= { H→ABC A→(DAEAF)|P B→(XGY)|Q C→Z D→W E→V F→U G→(TBS)|R P→p Q→q R→r S→s T→t U→u V→v W→w X→x Y→y Z→z } を備えるG=<V,Σ,S,P>であるとする。図5は
この文法に関する一般的な解析木Tである。
【0014】編集をすると、文法Gに対応する解析木T
は解析木T’になり、解析木T’は順序ラベル解析木V
の構成要素でラベルを付けられるノードを有し、解析木
T’の根(ルート)のノードはSでラベル付けされてい
る。編集された構造化文書は、”ギャップ(空を作られ
る)”が設けられる対応する解析木を有することが出来
る。ギャップが設けられる解析木は、横型の(水平方向
に)ギャップがもうけられた解析木又は縦型の(垂直方
向に)ギャップが設けられた解析木の形式になりうる。
図6は、横型のギャップ木の一例を示し、ギャップは最
上部”A”に根づく(を根とする)全体の部分木を削除
して形成されている。
は解析木T’になり、解析木T’は順序ラベル解析木V
の構成要素でラベルを付けられるノードを有し、解析木
T’の根(ルート)のノードはSでラベル付けされてい
る。編集された構造化文書は、”ギャップ(空を作られ
る)”が設けられる対応する解析木を有することが出来
る。ギャップが設けられる解析木は、横型の(水平方向
に)ギャップがもうけられた解析木又は縦型の(垂直方
向に)ギャップが設けられた解析木の形式になりうる。
図6は、横型のギャップ木の一例を示し、ギャップは最
上部”A”に根づく(を根とする)全体の部分木を削除
して形成されている。
【0015】図7は縦型のギャップ木を示すが、縦型の
ギャップは、最上部”A”を削除してその場所に”A”
の子を配置して形成される。
ギャップは、最上部”A”を削除してその場所に”A”
の子を配置して形成される。
【0016】T’のいづれかの部分木が根に同一ラベル
を有するTの部分木にマッピング(写像)され、そして
マッピングが木T’に表されるノードと同様にノードの
水平方向及び垂直方向の順序付けを保持し、TがGの有
効な解析木であるようにTの部分木へのT’の部分木の
一対一のマッピングがあるなら、そしてその場合のみ順
序の付いたラベル木T’はGのギャップ木となる。
を有するTの部分木にマッピング(写像)され、そして
マッピングが木T’に表されるノードと同様にノードの
水平方向及び垂直方向の順序付けを保持し、TがGの有
効な解析木であるようにTの部分木へのT’の部分木の
一対一のマッピングがあるなら、そしてその場合のみ順
序の付いたラベル木T’はGのギャップ木となる。
【0017】文法G用に部分毎に構造化されたエディタ
は、Gの一個のギャップ木を他のそのようなギャップ木
へ変換することができる。ギャップ木は、Gの完全な解
析木ではないが、純粋にそのギャップ木に新たなノード
及びアークを挿入することによって完全な解析木にされ
得る。ゆえにT’に於ける様々な”ギャップ”は、有効
な解析木Tを生成するために”満たされる”ことができ
る。よって編集は、ユーザがアークやノードの挿入及び
/又は削除によってあらゆるギャップ木T’を作ること
ができるように部分毎に行われる。部分毎に構造化され
た編集を納得するように作るために、解析木T’が、G
のギャップ木であるということを効率的に決定できなく
てはならない。本発明の方法及び装置によってこの決定
がなされる。
は、Gの一個のギャップ木を他のそのようなギャップ木
へ変換することができる。ギャップ木は、Gの完全な解
析木ではないが、純粋にそのギャップ木に新たなノード
及びアークを挿入することによって完全な解析木にされ
得る。ゆえにT’に於ける様々な”ギャップ”は、有効
な解析木Tを生成するために”満たされる”ことができ
る。よって編集は、ユーザがアークやノードの挿入及び
/又は削除によってあらゆるギャップ木T’を作ること
ができるように部分毎に行われる。部分毎に構造化され
た編集を納得するように作るために、解析木T’が、G
のギャップ木であるということを効率的に決定できなく
てはならない。本発明の方法及び装置によってこの決定
がなされる。
【0018】例えば、文法例を仮定すれば、図5に示さ
れる完全な解析木を得ることができる。
れる完全な解析木を得ることができる。
【0019】以下の定義は、本発明の背景として提供さ
れる。
れる。
【0020】定義1 ギャップ文法は、V−Σ(非終端記号)に含まれるA毎
に、A→空がPに含まれ、そしてその場合、空(ε)は
空列(ストリング)であるような文脈自由文法G=<
V,Σ,S,P>である。これにより、横型のギャップ
木の概念が得られる。
に、A→空がPに含まれ、そしてその場合、空(ε)は
空列(ストリング)であるような文脈自由文法G=<
V,Σ,S,P>である。これにより、横型のギャップ
木の概念が得られる。
【0021】従って、先の文法例の場合、ギャップ文法
を成立させるために以下のプロダクションが加えられな
くてはならない。 H→ε A→ε B→ε C→ε D→ε E→ε F→ε G→ε P→ε Q→ε R→ε S→ε T→ε U→ε V→ε W→ε X→ε Y→ε Z→ε
を成立させるために以下のプロダクションが加えられな
くてはならない。 H→ε A→ε B→ε C→ε D→ε E→ε F→ε G→ε P→ε Q→ε R→ε S→ε T→ε U→ε V→ε W→ε X→ε Y→ε Z→ε
【0022】定義2 正規表現yによって定義される言語において可能な列と
してdを有するGにおいてプロダクションx→yがある
ならば、axb→adbとなる。a=bである場合、或
いはa→c及びc→*bであるようなa,cが存在する
場合、a→*bとなる。
してdを有するGにおいてプロダクションx→yがある
ならば、axb→adbとなる。a=bである場合、或
いはa→c及びc→*bであるようなa,cが存在する
場合、a→*bとなる。
【0023】定義3 文脈自由文法G=<V,Σ,S,P>の到達可能性グラ
フは、ノードの集合がVであり、且つアークが、x,y
がVにありx→aybがPにあるような全順序付け対<
x,y>の集合である有向グラフである。Vに於ける記
号x,yに関しては、xから1つ以上のアークのyへの
有向パスがある場合、yはxから到達可能であるとされ
る。この定義は、1つのノード(例えばy)がもう1つ
のノード(例えばx)から到達可能であるかどうかを定
義する。
フは、ノードの集合がVであり、且つアークが、x,y
がVにありx→aybがPにあるような全順序付け対<
x,y>の集合である有向グラフである。Vに於ける記
号x,yに関しては、xから1つ以上のアークのyへの
有向パスがある場合、yはxから到達可能であるとされ
る。この定義は、1つのノード(例えばy)がもう1つ
のノード(例えばx)から到達可能であるかどうかを定
義する。
【0024】図8には、文法例に関する到達可能性グラ
フを示す。
フを示す。
【0025】文法例に関する到達可能性の表 HはABCDEFGPpQqRrSsTtUuVvWw
XxYyZzに到達可能である。AはADEFPpUu
VvWwに到達可能である。BはBGQqRrSsTt
XxYyに到達可能である。CはZzに到達可能であ
る。DはWwに到達可能である。EはVvに到達可能で
ある。FはUuに到達可能である。GはBGQqRrS
sTtXxYyに到達可能である。Pはpに到達可能で
ある。Qはqに到達可能である。Rはrに到達可能であ
る。Sはsに到達可能である。Tはtに到達可能であ
る。Uはuに到達可能である。Vはvに到達可能であ
る。Wはwに到達可能である。Xはxに到達可能であ
る。Yはyに到達可能である。Zはzに到達可能であ
る。
XxYyZzに到達可能である。AはADEFPpUu
VvWwに到達可能である。BはBGQqRrSsTt
XxYyに到達可能である。CはZzに到達可能であ
る。DはWwに到達可能である。EはVvに到達可能で
ある。FはUuに到達可能である。GはBGQqRrS
sTtXxYyに到達可能である。Pはpに到達可能で
ある。Qはqに到達可能である。Rはrに到達可能であ
る。Sはsに到達可能である。Tはtに到達可能であ
る。Uはuに到達可能である。Vはvに到達可能であ
る。Wはwに到達可能である。Xはxに到達可能であ
る。Yはyに到達可能である。Zはzに到達可能であ
る。
【0026】定義4 G=<V,Σ,S,P>の到達可能性グラフの強連結成
分は、集合中の全部のノードが集合中の残りの全部のノ
ードから到達可能であるという特性を備えるGの到達可
能性グラフのノードの集合であり、集合のノードから到
達可能である集合に入っていないノードから到達されう
る集合のノードはない。
分は、集合中の全部のノードが集合中の残りの全部のノ
ードから到達可能であるという特性を備えるGの到達可
能性グラフのノードの集合であり、集合のノードから到
達可能である集合に入っていないノードから到達されう
る集合のノードはない。
【0027】文法例用に図8に示されるように、G=<
V,Σ,S,P>の到達可能性グラフの強連結成分への
パーティション(区分)を考えよ。図8の領域集合で
は、2つのノードが矢印によって接続される時、一方の
領域に配置されるノードがどのようにもう一方の領域の
ノードに進むかが示されている。
V,Σ,S,P>の到達可能性グラフの強連結成分への
パーティション(区分)を考えよ。図8の領域集合で
は、2つのノードが矢印によって接続される時、一方の
領域に配置されるノードがどのようにもう一方の領域の
ノードに進むかが示されている。
【0028】出て行く(ラベル付けされ)たアークを有
さない強連結成分はランク0を有する。出て行くアーク
を有する強連結成分Uは、Uが(Uから)出て行くアー
クにより接続される強連結成分のランク内の最大ランク
よりも一ランク大きなランクを有する。Vにおけるxの
ランクは、xがある強連結成分のランクである。図8
は、強連結成分のランクにラベル付けもする。
さない強連結成分はランク0を有する。出て行くアーク
を有する強連結成分Uは、Uが(Uから)出て行くアー
クにより接続される強連結成分のランク内の最大ランク
よりも一ランク大きなランクを有する。Vにおけるxの
ランクは、xがある強連結成分のランクである。図8
は、強連結成分のランクにラベル付けもする。
【0029】定義5 文脈自由文法G=<V,Σ,S,P>のVにおける記号
xは、自分自身から到達可能であるならば、そしてその
場合のみ再帰的である。再帰的な記号Sは、Sを含む強
連結成分のいづれかの記号の一例よりも多く生成できる
Sを含む強連結成分における記号RからPのプロダクシ
ョンが存在すれば、多重再帰的である。多重再帰的でな
い再帰記号は、単再帰的である。
xは、自分自身から到達可能であるならば、そしてその
場合のみ再帰的である。再帰的な記号Sは、Sを含む強
連結成分のいづれかの記号の一例よりも多く生成できる
Sを含む強連結成分における記号RからPのプロダクシ
ョンが存在すれば、多重再帰的である。多重再帰的でな
い再帰記号は、単再帰的である。
【0030】文法例において、Aは多重再帰的であり、
B及びGは、単再帰的である。他の全記号は再帰的でな
い。
B及びGは、単再帰的である。他の全記号は再帰的でな
い。
【0031】定義6 xを文脈自由文法G=<V,Σ,S,P>の記号とす
る。ギャップ(x)と称される正規表現はあらゆる記号
xと関連がある。正規表現ギャップ(x)は、下記のよ
うに帰納的に定義される。 1.Σのxが(ランク0の)終端記号であるならば、ギ
ャップ(x)=(x)となる。 2.V−Σのxがランク0の非再帰的記号であるなら
ば、ギャップ(x)=(ε|x)となる。 3.Vのxが0以外(非0)のランクの非再帰的記号で
あるならば、ギャップ(x)=(ε|x|R1|R2・
・・)となり、この場合R1,R2・・・はプロダクシ
ョンの各記号wの代わりに用いられるギャップ(w)を
有するx用のプロダクションの右側にある。 4.Vのxが多重再帰的な記号であるならば、ギャップ
(x)=(x|S1|S2・・・)* となり、この場
合S1,S2・・・は、xから到達可能な記号の完全な
集合である。 5.VのxがGの単再帰的記号であると仮定せよ。以下
のように正規表現L,M,及びRの集合を構成せよ。S
PLIT(exp)を下記のように定義せよ。もしSP
LIT(exp)が既に同じexpに対して評価されて
いたら、戻れ。そうでなければ、expがxと同じ強連
結成分において全く記号を含まないならば、expの各
記号wの代わりにギャップ(w)を備えるexpを集合
Mへ加えよ。そうでなければ、expが記号であるなら
ば、xと同じ強連結成分中になくてはならないので、何
もするな。そうでなければ、expにおいてトップレベ
ルの演算子が*(スター)であれば、xが単再帰的記号
であることはないので、エラー(誤り)がある。そうで
なければ、expにおいてトップレベルの演算子が、|
(”又は(or)”)である場合、SPLIT(al
t)を呼び出せ。この場合、altは、|(”又は”)
による2者の間の選択のそれぞれである。そうでなけれ
ば、expにおいてトップレベルの演算子が、CONC
ATENATE(並置)であるならば、xを含む強連結
成分にある記号を含むCONCATENATEの一項に
正確にならなくてはならない。この項の左側の項の全記
号を集合Lに加えよ。この項の右側の項の全記号を集合
Rに加えよ。xを含む強連結成分にある記号を含む項を
有するSPLIT(項)を呼び出せ。そうでなければ、
トップレベルの演算子が+(PLUS(プラス))であ
るならば、xは単再帰的ではないので、エラー(誤り)
がある。そうでなければ、トップレベルの演算子が?
(OPTIONAL(選択自由))であるならば、OR
(又は)及びEMPTY(空)を用いて、その表現を書
換えよ(例えば、x?を(ε|x)へ書き換える)。次
に、得られる表現のSPLITを呼び出せ。SPLIT
に関する定義の終了。L,M,及びRを空集合になるよ
うに初期化せよ。Gのxに対するプロダクション毎にS
PLIT(RHS)を呼び出せ。ここでRHSがプロダ
クションの右側にある 次に、左(x)=(L1|L2|・・・)となる。この
場合、L1、L2・・・は、集合Lにある又は集合Lの
記号から到達可能である全記号の集合である。中央
(x)=(ε|S1|S2・・・|M1|M2|・・
・)となる。この場合、S1,S2は、xを含む強連結
成分中の記号であり、M1,M2は、集合Mの正規表現
の集合である。右(x)=(R1|R2|・・・)とな
る。この場合、R1,R2・・・は、集合R中に現れる
又は集合R中の記号から到達可能である全記号の集合で
ある。次に、ギャップ(x)=(左(x))* 中央
(x)(右(x))*となる。
る。ギャップ(x)と称される正規表現はあらゆる記号
xと関連がある。正規表現ギャップ(x)は、下記のよ
うに帰納的に定義される。 1.Σのxが(ランク0の)終端記号であるならば、ギ
ャップ(x)=(x)となる。 2.V−Σのxがランク0の非再帰的記号であるなら
ば、ギャップ(x)=(ε|x)となる。 3.Vのxが0以外(非0)のランクの非再帰的記号で
あるならば、ギャップ(x)=(ε|x|R1|R2・
・・)となり、この場合R1,R2・・・はプロダクシ
ョンの各記号wの代わりに用いられるギャップ(w)を
有するx用のプロダクションの右側にある。 4.Vのxが多重再帰的な記号であるならば、ギャップ
(x)=(x|S1|S2・・・)* となり、この場
合S1,S2・・・は、xから到達可能な記号の完全な
集合である。 5.VのxがGの単再帰的記号であると仮定せよ。以下
のように正規表現L,M,及びRの集合を構成せよ。S
PLIT(exp)を下記のように定義せよ。もしSP
LIT(exp)が既に同じexpに対して評価されて
いたら、戻れ。そうでなければ、expがxと同じ強連
結成分において全く記号を含まないならば、expの各
記号wの代わりにギャップ(w)を備えるexpを集合
Mへ加えよ。そうでなければ、expが記号であるなら
ば、xと同じ強連結成分中になくてはならないので、何
もするな。そうでなければ、expにおいてトップレベ
ルの演算子が*(スター)であれば、xが単再帰的記号
であることはないので、エラー(誤り)がある。そうで
なければ、expにおいてトップレベルの演算子が、|
(”又は(or)”)である場合、SPLIT(al
t)を呼び出せ。この場合、altは、|(”又は”)
による2者の間の選択のそれぞれである。そうでなけれ
ば、expにおいてトップレベルの演算子が、CONC
ATENATE(並置)であるならば、xを含む強連結
成分にある記号を含むCONCATENATEの一項に
正確にならなくてはならない。この項の左側の項の全記
号を集合Lに加えよ。この項の右側の項の全記号を集合
Rに加えよ。xを含む強連結成分にある記号を含む項を
有するSPLIT(項)を呼び出せ。そうでなければ、
トップレベルの演算子が+(PLUS(プラス))であ
るならば、xは単再帰的ではないので、エラー(誤り)
がある。そうでなければ、トップレベルの演算子が?
(OPTIONAL(選択自由))であるならば、OR
(又は)及びEMPTY(空)を用いて、その表現を書
換えよ(例えば、x?を(ε|x)へ書き換える)。次
に、得られる表現のSPLITを呼び出せ。SPLIT
に関する定義の終了。L,M,及びRを空集合になるよ
うに初期化せよ。Gのxに対するプロダクション毎にS
PLIT(RHS)を呼び出せ。ここでRHSがプロダ
クションの右側にある 次に、左(x)=(L1|L2|・・・)となる。この
場合、L1、L2・・・は、集合Lにある又は集合Lの
記号から到達可能である全記号の集合である。中央
(x)=(ε|S1|S2・・・|M1|M2|・・
・)となる。この場合、S1,S2は、xを含む強連結
成分中の記号であり、M1,M2は、集合Mの正規表現
の集合である。右(x)=(R1|R2|・・・)とな
る。この場合、R1,R2・・・は、集合R中に現れる
又は集合R中の記号から到達可能である全記号の集合で
ある。次に、ギャップ(x)=(左(x))* 中央
(x)(右(x))*となる。
【0032】文法例の場合、SPLET(B)は以下の
集合を構成する。 左={T,X} 中央={ギャップ(Q),ギャップ(R)} 右={S,Y} 及び 左(B)=(T|t|X|x) 中央(B)=(ε|B|G|ギャップ(Q)|ギャップ
(R))=(ε|B|G|Q|q|R|r) 右(B)=(S|s|Y|y)
集合を構成する。 左={T,X} 中央={ギャップ(Q),ギャップ(R)} 右={S,Y} 及び 左(B)=(T|t|X|x) 中央(B)=(ε|B|G|ギャップ(Q)|ギャップ
(R))=(ε|B|G|Q|q|R|r) 右(B)=(S|s|Y|y)
【0033】文法例の全部の非終端記号に対するギャッ
プ(x)の値は、 ギャップ(H)=(ε|H|ギャップ(A)ギャップ
(B)ギャップ(C)) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(C)=(ε|C|ギャップ(Z)) ギャップ(D)=(ε|D|ギャップ(W)) ギャップ(E)=(ε|E|ギャップ(V)) ギャップ(F)=(ε|F|ギャップ(U)) ギャップ(G)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(P)=(ε|P|ギャップ(p)) ギャップ(Q)=(ε|Q|ギャップ(q)) ギャップ(R)=(ε|R|ギャップ(r)) ギャップ(S)=(ε|S|ギャップ(s)) ギャップ(T)=(ε|T|ギャップ(t)) ギャップ(U)=(ε|U|ギャップ(u)) ギャップ(V)=(ε|V|ギャップ(v)) ギャップ(W)=(ε|W|ギャップ(w)) ギャップ(X)=(ε|X|ギャップ(x)) ギャップ(Y)=(ε|Y|ギャップ(y)) ギャップ(Z)=(ε|Z|ギャップ(z)) である。
プ(x)の値は、 ギャップ(H)=(ε|H|ギャップ(A)ギャップ
(B)ギャップ(C)) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(C)=(ε|C|ギャップ(Z)) ギャップ(D)=(ε|D|ギャップ(W)) ギャップ(E)=(ε|E|ギャップ(V)) ギャップ(F)=(ε|F|ギャップ(U)) ギャップ(G)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(P)=(ε|P|ギャップ(p)) ギャップ(Q)=(ε|Q|ギャップ(q)) ギャップ(R)=(ε|R|ギャップ(r)) ギャップ(S)=(ε|S|ギャップ(s)) ギャップ(T)=(ε|T|ギャップ(t)) ギャップ(U)=(ε|U|ギャップ(u)) ギャップ(V)=(ε|V|ギャップ(v)) ギャップ(W)=(ε|W|ギャップ(w)) ギャップ(X)=(ε|X|ギャップ(x)) ギャップ(Y)=(ε|Y|ギャップ(y)) ギャップ(Z)=(ε|Z|ギャップ(z)) である。
【0034】拡張され、簡略化されたギャップ(x)の
値は、 ギャップ(H)=(ε|H|(A|D|E|F|P|U
|V|W|p|u|v|w)*(T|t|X|x)*
(ε|B|G|Q|q|R|r)(S|s|Y|y)*
(ε|C|Z|z) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(C)=ε|C|Z|z ギャップ(D)=ε|D|W|w ギャップ(E)=ε|E|V|v ギャップ(F)=ε|F|U|u ギャップ(G)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(P)=ε|P|p ギャップ(Q)=ε|Q|q ギャップ(R)=ε|R|r ギャップ(S)=ε|S|s ギャップ(T)=ε|T|t ギャップ(U)=ε|U|u ギャップ(V)=ε|V|v ギャップ(W)=ε|W|w ギャップ(X)=ε|X|x ギャップ(Y)=ε|Y|y ギャップ(Z)=ε|Z|z である。
値は、 ギャップ(H)=(ε|H|(A|D|E|F|P|U
|V|W|p|u|v|w)*(T|t|X|x)*
(ε|B|G|Q|q|R|r)(S|s|Y|y)*
(ε|C|Z|z) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(C)=ε|C|Z|z ギャップ(D)=ε|D|W|w ギャップ(E)=ε|E|V|v ギャップ(F)=ε|F|U|u ギャップ(G)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(P)=ε|P|p ギャップ(Q)=ε|Q|q ギャップ(R)=ε|R|r ギャップ(S)=ε|S|s ギャップ(T)=ε|T|t ギャップ(U)=ε|U|u ギャップ(V)=ε|V|v ギャップ(W)=ε|W|w ギャップ(X)=ε|X|x ギャップ(Y)=ε|Y|y ギャップ(Z)=ε|Z|z である。
【0035】周知であるように、有限状態機械は、所与
の列が正規表現によって定義される言語の一要素(メン
バー)であるか否かを効率的にチェックするあらゆる正
規表現を得るために構成されることができる。〔アー
ル.マックナーグトン(R. McNaughton) 及びエイチ.
ヤマダによる順序機械の" オートマトンのための正規表
現及び状態グラフ" の論文を見よ。選択論文、アディソ
ン ウェーズレイ、1964〕ギャップ(H)に対応す
る模範的な有限状態機械は図9に示され、ギャップ
(A)に対応する模範的な有限状態機械は図10に示さ
れ、ギャップ(B)に対応する模範的な有限状態機械は
図11に示され、ギャップ(C)に対応する模範的な有
限状態機械は図12に示され、ギャップ(S)に対応す
る模範的な有限状態機械は図13に示される。これらの
図において、受け入れ状態は二重円で示され、不履行
(フェール)状態が1重円で示されている。
の列が正規表現によって定義される言語の一要素(メン
バー)であるか否かを効率的にチェックするあらゆる正
規表現を得るために構成されることができる。〔アー
ル.マックナーグトン(R. McNaughton) 及びエイチ.
ヤマダによる順序機械の" オートマトンのための正規表
現及び状態グラフ" の論文を見よ。選択論文、アディソ
ン ウェーズレイ、1964〕ギャップ(H)に対応す
る模範的な有限状態機械は図9に示され、ギャップ
(A)に対応する模範的な有限状態機械は図10に示さ
れ、ギャップ(B)に対応する模範的な有限状態機械は
図11に示され、ギャップ(C)に対応する模範的な有
限状態機械は図12に示され、ギャップ(S)に対応す
る模範的な有限状態機械は図13に示される。これらの
図において、受け入れ状態は二重円で示され、不履行
(フェール)状態が1重円で示されている。
【0036】定理(理論)1 G=<V,Σ,S,P>は、V−Σの状態でA及びV*
の状態でaであるギャップ文法になると仮定せよ。もし
aが、ギャップ(A)にあるならば、そしてその場合の
みA→*aとなる。本発明に従って、エディタは木T’
が有効であるか否かを決定できる。第1実施例におい
て、木全体の有効性はエディタによって以下に従ってチ
ェックされる。Rを正規規則であると仮定する。周知で
あるように、正規表現によって定義される言語のストリ
ング(列)はストリング長さのオーダの決定時間で認識
されることができる。従って、正規表現Rを仮定すれ
ば、Sが認識(R)がオーダ長さ(S)の決定性時間で
実行するR中にあるならば、及びその場合のみ真に戻る
ストリング(V内で記号が順序ずづけられたリスト)S
によってパラメータで表される手順認識(R)はコンパ
イル(編集)される。先の定理の効果によって、下記の
決定手順は、T’がGのギャップ木であれば、及びその
場合のみ真へ戻る。更に、決定手順は、(ギャップ木で
あっても、なくても)木のサイズで時間線形に実行され
る。 B1,・・・Bkのラベルを付けられた中間の子
孫ノードを備えるT’においてAのラベルを付けられた
各ノードごとに行う。 (A)(B1 、・・・、B)を認識するならば、真にな
り、そうでなければ戻る(偽)。 戻れ(真) Aは、例えばB1,・・・,Bk=ε等の中間の子孫が
なくともよい。
の状態でaであるギャップ文法になると仮定せよ。もし
aが、ギャップ(A)にあるならば、そしてその場合の
みA→*aとなる。本発明に従って、エディタは木T’
が有効であるか否かを決定できる。第1実施例におい
て、木全体の有効性はエディタによって以下に従ってチ
ェックされる。Rを正規規則であると仮定する。周知で
あるように、正規表現によって定義される言語のストリ
ング(列)はストリング長さのオーダの決定時間で認識
されることができる。従って、正規表現Rを仮定すれ
ば、Sが認識(R)がオーダ長さ(S)の決定性時間で
実行するR中にあるならば、及びその場合のみ真に戻る
ストリング(V内で記号が順序ずづけられたリスト)S
によってパラメータで表される手順認識(R)はコンパ
イル(編集)される。先の定理の効果によって、下記の
決定手順は、T’がGのギャップ木であれば、及びその
場合のみ真へ戻る。更に、決定手順は、(ギャップ木で
あっても、なくても)木のサイズで時間線形に実行され
る。 B1,・・・Bkのラベルを付けられた中間の子
孫ノードを備えるT’においてAのラベルを付けられた
各ノードごとに行う。 (A)(B1 、・・・、B)を認識するならば、真にな
り、そうでなければ戻る(偽)。 戻れ(真) Aは、例えばB1,・・・,Bk=ε等の中間の子孫が
なくともよい。
【0037】本発明によって教示される方法によって構
成される有限状態機械は、入力として有限状態機械にお
くられる文書の部分構造がギャップ文法の解析木のイン
スタンスを構成できるか否かを決定する。各非終端記号
ノードのいずれも子の名前(列としての順序)は、木が
ギャップ文法の解析木のインスタンスになるように、親
ノードによって名付けられる有限状態機械によって受け
入れられなくてはならない。この状況が維持されれば、
解析木は弱有効文書の解析木になるか、さもなければ有
効文書でも弱有効文書でもない解析木になる。
成される有限状態機械は、入力として有限状態機械にお
くられる文書の部分構造がギャップ文法の解析木のイン
スタンスを構成できるか否かを決定する。各非終端記号
ノードのいずれも子の名前(列としての順序)は、木が
ギャップ文法の解析木のインスタンスになるように、親
ノードによって名付けられる有限状態機械によって受け
入れられなくてはならない。この状況が維持されれば、
解析木は弱有効文書の解析木になるか、さもなければ有
効文書でも弱有効文書でもない解析木になる。
【0038】本発明のもう1つの実施例に従って、エデ
ィタは木Tのノード及びアークの挿入又は削除によって
形成される木T’のいくらかの部分木のチェックだけを
必要とする。この実施例において、挿入されるノードに
関しては、新しい子供と共に新たに挿入されるノードの
親と、新たに挿入されるノードと、その子だけがチェッ
クされる。削除されたノードに関しては、新しい子と共
に新たに削除されたノードの親だけがチェックされる。
この他の手順は、以下に従ってなされる。親(ノード)
は、ノードをパラメータとして取り、木T’のその親ノ
ードに戻る。子の名前(ノード)は、ノードをパラメー
タとして取り、木T’のノードの下の子のラベルの順序
付けリストに戻る。有限状態機械(fsm)(ノード)
は、パラメータとしてノードを取り、木T’中のそのノ
ードのラベルと対応する有限状態機械(正規表現)に戻
る。T’中の新しいノードごとに行え。((有限状態機
械(親(n)))(子の名前(親(n)))を認識)し
なければ、偽(フォールス)に戻れ。((有限状態機械
(n))(子の名前(n))を認識)しなければ、偽に
戻れ。T’中の削除されるノードの(まだ存在いてい
る)親ノードnの各々に対して、次の事を行え。((有
限状態機械(n))(子の名前(n))を認識)しなけ
れば、偽に戻れ。真に戻れ。後者の手順は、挿入される
ノードの古い親の下側のノードの数と、削除されるノー
ドの親の下側のノードの数の総計に比例する時間で実行
される。
ィタは木Tのノード及びアークの挿入又は削除によって
形成される木T’のいくらかの部分木のチェックだけを
必要とする。この実施例において、挿入されるノードに
関しては、新しい子供と共に新たに挿入されるノードの
親と、新たに挿入されるノードと、その子だけがチェッ
クされる。削除されたノードに関しては、新しい子と共
に新たに削除されたノードの親だけがチェックされる。
この他の手順は、以下に従ってなされる。親(ノード)
は、ノードをパラメータとして取り、木T’のその親ノ
ードに戻る。子の名前(ノード)は、ノードをパラメー
タとして取り、木T’のノードの下の子のラベルの順序
付けリストに戻る。有限状態機械(fsm)(ノード)
は、パラメータとしてノードを取り、木T’中のそのノ
ードのラベルと対応する有限状態機械(正規表現)に戻
る。T’中の新しいノードごとに行え。((有限状態機
械(親(n)))(子の名前(親(n)))を認識)し
なければ、偽(フォールス)に戻れ。((有限状態機械
(n))(子の名前(n))を認識)しなければ、偽に
戻れ。T’中の削除されるノードの(まだ存在いてい
る)親ノードnの各々に対して、次の事を行え。((有
限状態機械(n))(子の名前(n))を認識)しなけ
れば、偽に戻れ。真に戻れ。後者の手順は、挿入される
ノードの古い親の下側のノードの数と、削除されるノー
ドの親の下側のノードの数の総計に比例する時間で実行
される。
【0039】例えば、図7の木のノード”H”の下側の
ノードが、弱有効文書の解析木において許容されるか否
かをチェックするために、子”DAEAFBC”のラベ
ルは、列に形成され、図9のHによってラベルを付けら
れる有限状態機械によって認識されることが試みられ
る。状態1で開始し、有限状態機械は所与の列に対し
て、以下の遷移を行う。状態1はDを走査し、結果とし
て状態2に帰着し、状態2はAを走査し、結果として状
態2に帰着し、状態2はEを走査し、結果として状態2
に帰着し、状態2はAを走査し、結果として状態2に帰
着し、状態2はFを走査し、結果として状態2に帰着
し、状態2はBを走査し、結果として状態4に帰着し、
状態4はCを走査し、結果として状態5に帰着する。状
態5は、受け入れ状態(二重円として)示される(マー
クされる)ので、子のシーケンスは、弱有効文書の解析
木であることもある。
ノードが、弱有効文書の解析木において許容されるか否
かをチェックするために、子”DAEAFBC”のラベ
ルは、列に形成され、図9のHによってラベルを付けら
れる有限状態機械によって認識されることが試みられ
る。状態1で開始し、有限状態機械は所与の列に対し
て、以下の遷移を行う。状態1はDを走査し、結果とし
て状態2に帰着し、状態2はAを走査し、結果として状
態2に帰着し、状態2はEを走査し、結果として状態2
に帰着し、状態2はAを走査し、結果として状態2に帰
着し、状態2はFを走査し、結果として状態2に帰着
し、状態2はBを走査し、結果として状態4に帰着し、
状態4はCを走査し、結果として状態5に帰着する。状
態5は、受け入れ状態(二重円として)示される(マー
クされる)ので、子のシーケンスは、弱有効文書の解析
木であることもある。
【0040】従って、本発明のエディタ及び解析は、ラ
ベル付けされ順序の付いた解析木が所与の文脈自由文法
の解析木になるように拡張されることができるか否かを
効率的に決定できる。エディタ及び解析は、所与の解析
木が有効解析木に至るまで拡張できるか否かを決定する
プログラムされたコンピュータでもあり得る。決定は、
新たに形成される木のノードの数に対して線型になる時
間でなされるか、あるいは解析木の変化部分だけのサイ
ズに対して線型になる時間で決定するように変更され
る。
ベル付けされ順序の付いた解析木が所与の文脈自由文法
の解析木になるように拡張されることができるか否かを
効率的に決定できる。エディタ及び解析は、所与の解析
木が有効解析木に至るまで拡張できるか否かを決定する
プログラムされたコンピュータでもあり得る。決定は、
新たに形成される木のノードの数に対して線型になる時
間でなされるか、あるいは解析木の変化部分だけのサイ
ズに対して線型になる時間で決定するように変更され
る。
【0041】本発明は、特定の実施例を伴って説明され
たが、多数の選択、変更、及びバリエーションが、当業
者にとってはっきりしていることは明白である。例え
ば、方法及び装置は仕様に基づいたSGML文法を伴っ
て説明されたが、本発明は例えば、オープンドキュメン
トアーキテクチャ(ODA)等の仕様に基づいた形式的
な文脈自由文法で記述されるあらゆる文書表現に使用さ
れることもできる。
たが、多数の選択、変更、及びバリエーションが、当業
者にとってはっきりしていることは明白である。例え
ば、方法及び装置は仕様に基づいたSGML文法を伴っ
て説明されたが、本発明は例えば、オープンドキュメン
トアーキテクチャ(ODA)等の仕様に基づいた形式的
な文脈自由文法で記述されるあらゆる文書表現に使用さ
れることもできる。
【0042】
【発明の効果】本発明は、少なくとも1回の編集ステッ
プ後にラベル順序解析木が有効な木へ更に拡張されるこ
とができるか否かを効率的に決定するための方法及び装
置を提供する。
プ後にラベル順序解析木が有効な木へ更に拡張されるこ
とができるか否かを効率的に決定するための方法及び装
置を提供する。
【図1】所与の文法に対応する模範的な解析木である。
【図2】横型のギャップを設けられた解析木の一例を示
す。
す。
【図3】縦型のギャップを設けられた解析木の一例を示
す。
す。
【図4】本発明に従った編集装置のブロック図である。
【図5】文法例に対応する模範的な解析木である。
【図6】文法例に対応する横型のギャップを設けられた
模範的な解析木である。
模範的な解析木である。
【図7】文法例に対応する縦型のギャップを設けられた
模範的な解析木である。
模範的な解析木である。
【図8】文法例に関して示される強連結成分及びランク
を備える到達可能性グラフである。
を備える到達可能性グラフである。
【図9】文法例に関して、解析木を弱有効にするために
有用な有限状態機械の例を示す。
有用な有限状態機械の例を示す。
【図10】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
に有用な有限状態機械の例を示す。
【図11】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
に有用な有限状態機械の例を示す。
【図12】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
に有用な有限状態機械の例を示す。
【図13】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
に有用な有限状態機械の例を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シドニー ダブリュ.マーシャル アメリカ合衆国 ニューヨーク州 14526 ペンフィールド ニュー ウィックハム ドライヴ 7
Claims (1)
- 【請求項1】 文書を編集するための方法であって、文
書を編集するステップの性能が、文書の文法の記号でラ
ベルつけされるノードを備える解析木を有効にするか否
かを決定することを含み、 編集ステップが、周知の構造互換性に従って正当である
か否かを決定するステップと、 前記編集ステップが正当でないと決定されるならば、編
集ステップの障害点を決定するステップと、 一度障害点が決定されると、編集ステップを正当にする
ために、どのステップが行われるべきであったかを決定
するステップと、 正当な編集ステップを行うステップと、 からなる文書の編集方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US4479293A | 1993-04-12 | 1993-04-12 | |
US044792 | 1993-04-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0713966A true JPH0713966A (ja) | 1995-01-17 |
Family
ID=21934364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6065883A Pending JPH0713966A (ja) | 1993-04-12 | 1994-04-04 | 文書の編集方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5557720A (ja) |
EP (1) | EP0620527B1 (ja) |
JP (1) | JPH0713966A (ja) |
DE (1) | DE69425082T2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2048039A1 (en) * | 1991-07-19 | 1993-01-20 | Steven Derose | Data processing system and method for generating a representation for and random access rendering of electronic documents |
JP3028738B2 (ja) * | 1994-11-10 | 2000-04-04 | 富士ゼロックス株式会社 | 文書共通論理情報編集装置 |
US5752022A (en) * | 1995-08-07 | 1998-05-12 | International Business Machines Corp. | Method for creating a hypertext language for a distributed computer network |
US6546406B1 (en) | 1995-11-03 | 2003-04-08 | Enigma Information Systems Ltd. | Client-server computer system for large document retrieval on networked computer system |
JPH09146931A (ja) * | 1995-11-24 | 1997-06-06 | Dainippon Screen Mfg Co Ltd | 文書型定義生成装置 |
US6167409A (en) * | 1996-03-01 | 2000-12-26 | Enigma Information Systems Ltd. | Computer system and method for customizing context information sent with document fragments across a computer network |
US5893109A (en) * | 1996-03-15 | 1999-04-06 | Inso Providence Corporation | Generation of chunks of a long document for an electronic book system |
US5915259A (en) * | 1996-03-20 | 1999-06-22 | Xerox Corporation | Document schema transformation by patterns and contextual conditions |
JPH09297768A (ja) * | 1996-05-07 | 1997-11-18 | Fuji Xerox Co Ltd | 文書データベース管理装置及び文書データベース検索方法 |
US6108676A (en) * | 1996-10-28 | 2000-08-22 | Fuji Xerox Co., Ltd. | Document processing apparatus, document type determining method, and hierarchical regular expression determining method |
IE980959A1 (en) | 1998-03-31 | 1999-10-20 | Datapage Ireland Ltd | Document Production |
US6895551B1 (en) | 1999-09-23 | 2005-05-17 | International Business Machines Corporation | Network quality control system for automatic validation of web pages and notification of author |
US6874121B1 (en) * | 1999-11-24 | 2005-03-29 | Xerox Corporation | Document editor for editing structure documents |
JP3368883B2 (ja) * | 2000-02-04 | 2003-01-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
US7073122B1 (en) | 2000-09-08 | 2006-07-04 | Sedghi Ali R | Method and apparatus for extracting structured data from HTML pages |
FI115416B (fi) * | 2001-03-23 | 2005-04-29 | Nokia Corp | Rakenteellisen datan jäsennys |
CN100414502C (zh) * | 2002-10-15 | 2008-08-27 | 国际商业机器公司 | 置标语言模式确认的方法及系统 |
WO2006081428A2 (en) * | 2005-01-27 | 2006-08-03 | Symyx Technologies, Inc. | Parser for generating structure data |
US20080141230A1 (en) * | 2006-12-06 | 2008-06-12 | Microsoft Corporation | Scope-Constrained Specification Of Features In A Programming Language |
US8850414B2 (en) * | 2007-02-02 | 2014-09-30 | Microsoft Corporation | Direct access of language metadata |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4429372A (en) * | 1981-06-16 | 1984-01-31 | International Business Machines Corporation | Method for integrating structured data and string data on a text processing system |
US4723211A (en) * | 1984-08-30 | 1988-02-02 | International Business Machines Corp. | Editing of a superblock data structure |
JPS62159239A (ja) * | 1985-12-30 | 1987-07-15 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 仮想マシンの編集システム |
JPS6324448A (ja) * | 1986-07-17 | 1988-02-01 | Toshiba Corp | 複合文書処理装置 |
GB8618664D0 (en) * | 1986-07-31 | 1986-09-10 | British Telecomm | Computer aided design system |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
US5179650A (en) * | 1988-01-21 | 1993-01-12 | Kabushiki Kaisha Toshiba | Method and apparatus for editing documents |
US5130924A (en) * | 1988-06-30 | 1992-07-14 | International Business Machines Corporation | System for defining relationships among document elements including logical relationships of elements in a multi-dimensional tabular specification |
JPH02159674A (ja) * | 1988-12-13 | 1990-06-19 | Matsushita Electric Ind Co Ltd | 意味解析装置と構文解析装置 |
NL8900247A (nl) * | 1989-02-01 | 1990-09-03 | Bso Buro Voor Systeemontwikkel | Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave. |
US5185698A (en) * | 1989-02-24 | 1993-02-09 | International Business Machines Corporation | Technique for contracting element marks in a structured document |
US5113341A (en) * | 1989-02-24 | 1992-05-12 | International Business Machines Corporation | Technique for creating and expanding element marks in a structured document |
US5079700A (en) * | 1989-04-26 | 1992-01-07 | International Business Machines Corporation | Method for copying a marked portion of a structured document |
US5140521A (en) * | 1989-04-26 | 1992-08-18 | International Business Machines Corporation | Method for deleting a marked portion of a structured document |
CA2036859C (en) * | 1990-04-30 | 1994-04-05 | Eric M. Hesse | System and method for editing a structured document to modify emphasis characteristics |
US5276793A (en) * | 1990-05-14 | 1994-01-04 | International Business Machines Corporation | System and method for editing a structured document to preserve the intended appearance of document elements |
-
1994
- 1994-04-04 JP JP6065883A patent/JPH0713966A/ja active Pending
- 1994-04-07 DE DE69425082T patent/DE69425082T2/de not_active Expired - Fee Related
- 1994-04-07 EP EP94302467A patent/EP0620527B1/en not_active Expired - Lifetime
- 1994-09-08 US US08/303,286 patent/US5557720A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69425082D1 (de) | 2000-08-10 |
EP0620527B1 (en) | 2000-07-05 |
EP0620527A3 (en) | 1996-02-28 |
DE69425082T2 (de) | 2001-03-22 |
EP0620527A2 (en) | 1994-10-19 |
US5557720A (en) | 1996-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0713966A (ja) | 文書の編集方法 | |
US6766330B1 (en) | Universal output constructor for XML queries universal output constructor for XML queries | |
US4686623A (en) | Parser-based attribute analysis | |
US7210096B2 (en) | Methods and apparatus for constructing semantic models for document authoring | |
US7788654B2 (en) | Method for construction of a linear-sized validation-plan of W3C XML schema grammars | |
JPH02121030A (ja) | 接続方法、ノード接続方法、データ処理方法、及び木内にノードを挿入する方法 | |
JP3230467B2 (ja) | Gdmoトランスレータ及びgdmoトランスレーション方法並びにgdmoトランスレータプログラムを記録した記録媒体 | |
US20020035580A1 (en) | Computer readable medium containing HTML document generation program | |
JP2001243219A (ja) | 不完全な形式のhtml文書の記述構造 | |
Bex et al. | Expressiveness of XSDs: from practice to theory, there and back again | |
Vijay-Shanker | The use of shared forests in tree adjoining grammar parsing | |
CN113254023B (zh) | 对象读取方法、装置和电子设备 | |
Kaul | Practical applications of precedence graph grammars | |
Dubé et al. | Efficiently building a parse tree from a regular expression | |
CN112130952A (zh) | 多语言显示方法、装置、设备及产品 | |
CN115576603B (zh) | 一种获取代码片段中的变量值的方法及装置 | |
Cameron | Rex: Xml shallow parsing with regular expressions | |
Møller | Document Structure Description 2.0 | |
KR100519916B1 (ko) | 에스씨에이 기반 시스템의 파일 파싱 장치, 그리고 그의파일 파싱 및 데이터 저장 방법 | |
Farré et al. | A bounded graph-connect construction for LR-regular parsers | |
Johnstone et al. | Generalised reduction modified LR parsing for domain specific language prototyping | |
MacLennan | The Synmac syntax macroprocessor: Introduction and manual, version 5 | |
Meijer | The project on extended affix grammars at Nijmegen | |
Gómez‐Rodríguez et al. | Undirected dependency parsing | |
More | Compiler construction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040518 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041026 |