JPH0713966A - 文書の編集方法 - Google Patents

文書の編集方法

Info

Publication number
JPH0713966A
JPH0713966A JP6065883A JP6588394A JPH0713966A JP H0713966 A JPH0713966 A JP H0713966A JP 6065883 A JP6065883 A JP 6065883A JP 6588394 A JP6588394 A JP 6588394A JP H0713966 A JPH0713966 A JP H0713966A
Authority
JP
Japan
Prior art keywords
gap
tree
document
grammar
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6065883A
Other languages
English (en)
Inventor
Jr Allen L Brown
エル.ブラウン、ジュニア アレン
Sidney W Marshall
ダブリュ.マーシャル シドニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH0713966A publication Critical patent/JPH0713966A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Abstract

(57)【要約】 【目的】 ラベルを付けられた順序解析木(パーズ木)
が、有効な木へ拡張されることができるか否かを決定す
るための方法及び装置を提供する。 【構成】 編集をすると、文法Gに対応する解析木Tは
解析木T’になり、解析木T’は順序ラベル解析木ラベ
ルを付けられるノード(節)を有し、解析木T’の根
(ルート)のノードはSでラベル付けされている。編集
される構造化文書は、”ギャップ”が設けられている対
応する解析木を有することが出来る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ラベル付けされ順序付
けられた解析木(パーズ木)が、有効な木へ拡張される
ことができるか否かを決定するための方法及び装置に関
し、また、少なくとも1回の編集(エディティング)ス
テップ後にラベル順序解析木が有効な木へ更に拡張され
ることができるか否かを決定するための方法及び装置に
関する。
【0002】
【従来の技術及び発明が解決しようとする課題】文書
(ドキュメント)は、計算機言語の変化に従って内部コ
ンピュータ構造で記述され得る。例えば、あるコンピュ
ータで表される文書ではワード・パーフェクト(Word P
erfect) 言語を使用することもあるし、一方、異なるコ
ンピュータで表される文書ではマイクロソフト・ワード
(Microsoft Word)言語を使用することもある。文書処理
を更に効率的にするために、異なる言語を用いて表され
る文書同士間の相互交換を可能にすることがしばしば所
望されている。従って、相互関係のある文書同士間には
整合性が存在すべきである。
【0003】文書の相互交換を可能にするこのような整
合性を提供するために、SGML(standard generaliz
ed markup language:ISOで制定されており、標準汎用化
マークアップ言語)は、例えば文書の相互交換を可能に
する外部表現として改良された。
【0004】編集される対象物が階層構造を有する多数
の編集アプリケーションがある。従って、あらゆる編集
ステップは、許容しうる内容の正式仕様に合わせなけれ
ばならない。SGML文書タイプの定義に記述される文
書の編集は、構造化文書編集の特定の例である。
【0005】文法(グラマー)に基づくエディタ(編集
プログラム)が一般的に課する強い順序づけ制約(即
ち、上下の制約、同様に時には左右の制約)のために、
構造化文書編集は多くのユーザに構造化対象物(例えば
プログラム又は文書)の構成を過度に制限する方法だと
考えられていた。従って、構文指向型編集のより柔軟な
バージョンが所望されている。しばしば、興味深い階層
構造のクラス(種)は、特定の文脈自由文法(ルール
(規則)のセット)よりなる不完全な解析木、即ち同じ
文法よりなる解析木のゼロ又はより適切な部分木を削除
した後に残るあらゆる木、と一致するように作られ得
る。
【0006】例えば、以下の文法が与えらるとすると、
ユーザが階層構造を思いのままに組み立てることが出来
たかどうかを容易且つ効率的に決定することは望まし
い。 ドキュメント(文書)→(フロント、ボディ、バッ
ク)、即ち Doc→(Front,Body,Back) ボディ→(イントロ、複数のセクション、アペンディク
ッス)即ち、 Body→(Intro,Mn.Sections+
App+ ) 図1にこの文法に対応する解析木を示す。
【0007】SGMLの文書クラスは、文書タイプの定
義又はDTD(文脈自由文法)によって定義される。S
GMLに従って、文書は適所に追加の構造マークアップ
を単に挿入することによって有効に形成されうる場合に
は、文書はわずかに有効であると分類される。例えば図
2に示されているように図1の解析木から”Fron
t”が欠けているならば、”Front”の単純な挿入
によって解析木は有効になるので、文書は弱有効である
と分類されるであろう。同様に、図3においても、図1
の解析木から”Body”が欠けていたならば、〔In
tro,Sections+ ,App+ 〕回りの始まり
及び終わりのタグの挿入によって有効な解析木となるの
で、この文書もわずかに有効であると分類されるであろ
う。構造がDTDで定義される多数の言語であるなら、
そしてその場合のみ、文書は有効となる。
【0008】従って、例えばユーザがノード(節)”
x”をノード”Body”の下に加えたかったならば、
この動作の有効性を容易にチェックできることは非常に
望ましい。従って、ある動作が取られる時は、その動作
が正当であるか否かを決定する。更に、ユーザが文書セ
グメントに自由に働きかけることができるように、この
ようなチェックを任意に便利な順序で行うことが所望さ
れる。
【0009】
【課題を解決するための手段と作用】本発明の方法及び
装置は、少なくとも1回の編集ステップ後にSGML文
書が有効であるか否かを決定する。加えて、その編集ス
テップの結果得られた文書が弱有効であるが有効ではな
いならば、文書を有効にするであろう許容文書の完成状
態が示される。本発明に従って、文書は構成成分が構造
の互換性に従って、そこまでの所は正当であるか否かが
分かるようにチェックされる。どの構成成分も正当でな
いことが確認されると、本発明の方法及び解析/編集装
置は障害(欠陥)点を検討して、文書を正当化するため
に成しえることを決定する。
【0010】本発明の態様は、文書を編集するための方
法であって、文書を編集するステップの性能が、文書の
文法の記号でラベルつけされるノードを備える解析木を
有効にするか否かを決定することを含み、編集ステップ
が、周知の構造互換性に従って正当であるか否かを決定
するステップと、前記編集ステップが正当でないと決定
されるならば、編集ステップの障害点を決定するステッ
プと、一度障害点が決定されると、編集ステップを正当
にするために、どのステップが行われるべきであったか
を決定するステップと、正当な編集ステップを行うステ
ップと、である。
【0011】
【実施例】文書(ドキュメント)を形成する文書規則の
使用法は、文書規則(文法生成)の記号でラベル付けさ
れるノードを有する解析木の形式で示すことができる。
文書が編集されると、元の解析木のアーク(弧)及びノ
ード(ノード)の位置は変化する。以下に説明されるよ
うに、本発明の方法及び装置は新たに形成される解析木
の迅速な有効性検査を可能にする。
【0012】文脈自由文法G=<V、Σ、S、P>に関
して、Vが文法の記号(終端記号及び非終端記号)(ノ
ード)の集合、Σが文法の終端記号の集合、Sが文法の
出発記号、及びPがプロダクション(producti
on)の右側を可能にする一般的な正規表現を備える文
法のプロダクションの集合である場合、Tは文法Gの解
析木であると仮定される。終端記号を有する文法Gのプ
ロダクションだけが、aが終端記号を示すA→aの形式
になるという仮定が更になされる。
【0013】例えば、文法は、 V={A,B,C,D,E,F,G,H,P,Q,R,
S,T,U,V,W,X,Y,Z,p,q,r,s,
t,u,v,w,x,y,z} Σ={p,q,r,s,t,u,v,w,x,y,z} S=H P= { H→ABC A→(DAEAF)|P B→(XGY)|Q C→Z D→W E→V F→U G→(TBS)|R P→p Q→q R→r S→s T→t U→u V→v W→w X→x Y→y Z→z } を備えるG=<V,Σ,S,P>であるとする。図5は
この文法に関する一般的な解析木Tである。
【0014】編集をすると、文法Gに対応する解析木T
は解析木T’になり、解析木T’は順序ラベル解析木V
の構成要素でラベルを付けられるノードを有し、解析木
T’の根(ルート)のノードはSでラベル付けされてい
る。編集された構造化文書は、”ギャップ(空を作られ
る)”が設けられる対応する解析木を有することが出来
る。ギャップが設けられる解析木は、横型の(水平方向
に)ギャップがもうけられた解析木又は縦型の(垂直方
向に)ギャップが設けられた解析木の形式になりうる。
図6は、横型のギャップ木の一例を示し、ギャップは最
上部”A”に根づく(を根とする)全体の部分木を削除
して形成されている。
【0015】図7は縦型のギャップ木を示すが、縦型の
ギャップは、最上部”A”を削除してその場所に”A”
の子を配置して形成される。
【0016】T’のいづれかの部分木が根に同一ラベル
を有するTの部分木にマッピング(写像)され、そして
マッピングが木T’に表されるノードと同様にノードの
水平方向及び垂直方向の順序付けを保持し、TがGの有
効な解析木であるようにTの部分木へのT’の部分木の
一対一のマッピングがあるなら、そしてその場合のみ順
序の付いたラベル木T’はGのギャップ木となる。
【0017】文法G用に部分毎に構造化されたエディタ
は、Gの一個のギャップ木を他のそのようなギャップ木
へ変換することができる。ギャップ木は、Gの完全な解
析木ではないが、純粋にそのギャップ木に新たなノード
及びアークを挿入することによって完全な解析木にされ
得る。ゆえにT’に於ける様々な”ギャップ”は、有効
な解析木Tを生成するために”満たされる”ことができ
る。よって編集は、ユーザがアークやノードの挿入及び
/又は削除によってあらゆるギャップ木T’を作ること
ができるように部分毎に行われる。部分毎に構造化され
た編集を納得するように作るために、解析木T’が、G
のギャップ木であるということを効率的に決定できなく
てはならない。本発明の方法及び装置によってこの決定
がなされる。
【0018】例えば、文法例を仮定すれば、図5に示さ
れる完全な解析木を得ることができる。
【0019】以下の定義は、本発明の背景として提供さ
れる。
【0020】定義1 ギャップ文法は、V−Σ(非終端記号)に含まれるA毎
に、A→空がPに含まれ、そしてその場合、空(ε)は
空列(ストリング)であるような文脈自由文法G=<
V,Σ,S,P>である。これにより、横型のギャップ
木の概念が得られる。
【0021】従って、先の文法例の場合、ギャップ文法
を成立させるために以下のプロダクションが加えられな
くてはならない。 H→ε A→ε B→ε C→ε D→ε E→ε F→ε G→ε P→ε Q→ε R→ε S→ε T→ε U→ε V→ε W→ε X→ε Y→ε Z→ε
【0022】定義2 正規表現yによって定義される言語において可能な列と
してdを有するGにおいてプロダクションx→yがある
ならば、axb→adbとなる。a=bである場合、或
いはa→c及びc→*bであるようなa,cが存在する
場合、a→*bとなる。
【0023】定義3 文脈自由文法G=<V,Σ,S,P>の到達可能性グラ
フは、ノードの集合がVであり、且つアークが、x,y
がVにありx→aybがPにあるような全順序付け対<
x,y>の集合である有向グラフである。Vに於ける記
号x,yに関しては、xから1つ以上のアークのyへの
有向パスがある場合、yはxから到達可能であるとされ
る。この定義は、1つのノード(例えばy)がもう1つ
のノード(例えばx)から到達可能であるかどうかを定
義する。
【0024】図8には、文法例に関する到達可能性グラ
フを示す。
【0025】文法例に関する到達可能性の表 HはABCDEFGPpQqRrSsTtUuVvWw
XxYyZzに到達可能である。AはADEFPpUu
VvWwに到達可能である。BはBGQqRrSsTt
XxYyに到達可能である。CはZzに到達可能であ
る。DはWwに到達可能である。EはVvに到達可能で
ある。FはUuに到達可能である。GはBGQqRrS
sTtXxYyに到達可能である。Pはpに到達可能で
ある。Qはqに到達可能である。Rはrに到達可能であ
る。Sはsに到達可能である。Tはtに到達可能であ
る。Uはuに到達可能である。Vはvに到達可能であ
る。Wはwに到達可能である。Xはxに到達可能であ
る。Yはyに到達可能である。Zはzに到達可能であ
る。
【0026】定義4 G=<V,Σ,S,P>の到達可能性グラフの強連結成
分は、集合中の全部のノードが集合中の残りの全部のノ
ードから到達可能であるという特性を備えるGの到達可
能性グラフのノードの集合であり、集合のノードから到
達可能である集合に入っていないノードから到達されう
る集合のノードはない。
【0027】文法例用に図8に示されるように、G=<
V,Σ,S,P>の到達可能性グラフの強連結成分への
パーティション(区分)を考えよ。図8の領域集合で
は、2つのノードが矢印によって接続される時、一方の
領域に配置されるノードがどのようにもう一方の領域の
ノードに進むかが示されている。
【0028】出て行く(ラベル付けされ)たアークを有
さない強連結成分はランク0を有する。出て行くアーク
を有する強連結成分Uは、Uが(Uから)出て行くアー
クにより接続される強連結成分のランク内の最大ランク
よりも一ランク大きなランクを有する。Vにおけるxの
ランクは、xがある強連結成分のランクである。図8
は、強連結成分のランクにラベル付けもする。
【0029】定義5 文脈自由文法G=<V,Σ,S,P>のVにおける記号
xは、自分自身から到達可能であるならば、そしてその
場合のみ再帰的である。再帰的な記号Sは、Sを含む強
連結成分のいづれかの記号の一例よりも多く生成できる
Sを含む強連結成分における記号RからPのプロダクシ
ョンが存在すれば、多重再帰的である。多重再帰的でな
い再帰記号は、単再帰的である。
【0030】文法例において、Aは多重再帰的であり、
B及びGは、単再帰的である。他の全記号は再帰的でな
い。
【0031】定義6 xを文脈自由文法G=<V,Σ,S,P>の記号とす
る。ギャップ(x)と称される正規表現はあらゆる記号
xと関連がある。正規表現ギャップ(x)は、下記のよ
うに帰納的に定義される。 1.Σのxが(ランク0の)終端記号であるならば、ギ
ャップ(x)=(x)となる。 2.V−Σのxがランク0の非再帰的記号であるなら
ば、ギャップ(x)=(ε|x)となる。 3.Vのxが0以外(非0)のランクの非再帰的記号で
あるならば、ギャップ(x)=(ε|x|R1|R2・
・・)となり、この場合R1,R2・・・はプロダクシ
ョンの各記号wの代わりに用いられるギャップ(w)を
有するx用のプロダクションの右側にある。 4.Vのxが多重再帰的な記号であるならば、ギャップ
(x)=(x|S1|S2・・・)* となり、この場
合S1,S2・・・は、xから到達可能な記号の完全な
集合である。 5.VのxがGの単再帰的記号であると仮定せよ。以下
のように正規表現L,M,及びRの集合を構成せよ。S
PLIT(exp)を下記のように定義せよ。もしSP
LIT(exp)が既に同じexpに対して評価されて
いたら、戻れ。そうでなければ、expがxと同じ強連
結成分において全く記号を含まないならば、expの各
記号wの代わりにギャップ(w)を備えるexpを集合
Mへ加えよ。そうでなければ、expが記号であるなら
ば、xと同じ強連結成分中になくてはならないので、何
もするな。そうでなければ、expにおいてトップレベ
ルの演算子が*(スター)であれば、xが単再帰的記号
であることはないので、エラー(誤り)がある。そうで
なければ、expにおいてトップレベルの演算子が、|
(”又は(or)”)である場合、SPLIT(al
t)を呼び出せ。この場合、altは、|(”又は”)
による2者の間の選択のそれぞれである。そうでなけれ
ば、expにおいてトップレベルの演算子が、CONC
ATENATE(並置)であるならば、xを含む強連結
成分にある記号を含むCONCATENATEの一項に
正確にならなくてはならない。この項の左側の項の全記
号を集合Lに加えよ。この項の右側の項の全記号を集合
Rに加えよ。xを含む強連結成分にある記号を含む項を
有するSPLIT(項)を呼び出せ。そうでなければ、
トップレベルの演算子が+(PLUS(プラス))であ
るならば、xは単再帰的ではないので、エラー(誤り)
がある。そうでなければ、トップレベルの演算子が?
(OPTIONAL(選択自由))であるならば、OR
(又は)及びEMPTY(空)を用いて、その表現を書
換えよ(例えば、x?を(ε|x)へ書き換える)。次
に、得られる表現のSPLITを呼び出せ。SPLIT
に関する定義の終了。L,M,及びRを空集合になるよ
うに初期化せよ。Gのxに対するプロダクション毎にS
PLIT(RHS)を呼び出せ。ここでRHSがプロダ
クションの右側にある 次に、左(x)=(L1|L2|・・・)となる。この
場合、L1、L2・・・は、集合Lにある又は集合Lの
記号から到達可能である全記号の集合である。中央
(x)=(ε|S1|S2・・・|M1|M2|・・
・)となる。この場合、S1,S2は、xを含む強連結
成分中の記号であり、M1,M2は、集合Mの正規表現
の集合である。右(x)=(R1|R2|・・・)とな
る。この場合、R1,R2・・・は、集合R中に現れる
又は集合R中の記号から到達可能である全記号の集合で
ある。次に、ギャップ(x)=(左(x))* 中央
(x)(右(x))*となる。
【0032】文法例の場合、SPLET(B)は以下の
集合を構成する。 左={T,X} 中央={ギャップ(Q),ギャップ(R)} 右={S,Y} 及び 左(B)=(T|t|X|x) 中央(B)=(ε|B|G|ギャップ(Q)|ギャップ
(R))=(ε|B|G|Q|q|R|r) 右(B)=(S|s|Y|y)
【0033】文法例の全部の非終端記号に対するギャッ
プ(x)の値は、 ギャップ(H)=(ε|H|ギャップ(A)ギャップ
(B)ギャップ(C)) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(C)=(ε|C|ギャップ(Z)) ギャップ(D)=(ε|D|ギャップ(W)) ギャップ(E)=(ε|E|ギャップ(V)) ギャップ(F)=(ε|F|ギャップ(U)) ギャップ(G)=(T|t|X|x)*(ε|B|G|
ギャップ(Q)|ギャップ(R))(S|s|Y|y)
*) ギャップ(P)=(ε|P|ギャップ(p)) ギャップ(Q)=(ε|Q|ギャップ(q)) ギャップ(R)=(ε|R|ギャップ(r)) ギャップ(S)=(ε|S|ギャップ(s)) ギャップ(T)=(ε|T|ギャップ(t)) ギャップ(U)=(ε|U|ギャップ(u)) ギャップ(V)=(ε|V|ギャップ(v)) ギャップ(W)=(ε|W|ギャップ(w)) ギャップ(X)=(ε|X|ギャップ(x)) ギャップ(Y)=(ε|Y|ギャップ(y)) ギャップ(Z)=(ε|Z|ギャップ(z)) である。
【0034】拡張され、簡略化されたギャップ(x)の
値は、 ギャップ(H)=(ε|H|(A|D|E|F|P|U
|V|W|p|u|v|w)*(T|t|X|x)*
(ε|B|G|Q|q|R|r)(S|s|Y|y)*
(ε|C|Z|z) ギャップ(A)=(A|D|E|F|P|U|V|W|
p|u|v|w)* ギャップ(B)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(C)=ε|C|Z|z ギャップ(D)=ε|D|W|w ギャップ(E)=ε|E|V|v ギャップ(F)=ε|F|U|u ギャップ(G)=(T|t|X|x)*(ε|B|G|
Q|q|R|r)(S|s|Y|y)* ギャップ(P)=ε|P|p ギャップ(Q)=ε|Q|q ギャップ(R)=ε|R|r ギャップ(S)=ε|S|s ギャップ(T)=ε|T|t ギャップ(U)=ε|U|u ギャップ(V)=ε|V|v ギャップ(W)=ε|W|w ギャップ(X)=ε|X|x ギャップ(Y)=ε|Y|y ギャップ(Z)=ε|Z|z である。
【0035】周知であるように、有限状態機械は、所与
の列が正規表現によって定義される言語の一要素(メン
バー)であるか否かを効率的にチェックするあらゆる正
規表現を得るために構成されることができる。〔アー
ル.マックナーグトン(R. McNaughton) 及びエイチ.
ヤマダによる順序機械の" オートマトンのための正規表
現及び状態グラフ" の論文を見よ。選択論文、アディソ
ン ウェーズレイ、1964〕ギャップ(H)に対応す
る模範的な有限状態機械は図9に示され、ギャップ
(A)に対応する模範的な有限状態機械は図10に示さ
れ、ギャップ(B)に対応する模範的な有限状態機械は
図11に示され、ギャップ(C)に対応する模範的な有
限状態機械は図12に示され、ギャップ(S)に対応す
る模範的な有限状態機械は図13に示される。これらの
図において、受け入れ状態は二重円で示され、不履行
(フェール)状態が1重円で示されている。
【0036】定理(理論)1 G=<V,Σ,S,P>は、V−Σの状態でA及びV*
の状態でaであるギャップ文法になると仮定せよ。もし
aが、ギャップ(A)にあるならば、そしてその場合の
みA→*aとなる。本発明に従って、エディタは木T’
が有効であるか否かを決定できる。第1実施例におい
て、木全体の有効性はエディタによって以下に従ってチ
ェックされる。Rを正規規則であると仮定する。周知で
あるように、正規表現によって定義される言語のストリ
ング(列)はストリング長さのオーダの決定時間で認識
されることができる。従って、正規表現Rを仮定すれ
ば、Sが認識(R)がオーダ長さ(S)の決定性時間で
実行するR中にあるならば、及びその場合のみ真に戻る
ストリング(V内で記号が順序ずづけられたリスト)S
によってパラメータで表される手順認識(R)はコンパ
イル(編集)される。先の定理の効果によって、下記の
決定手順は、T’がGのギャップ木であれば、及びその
場合のみ真へ戻る。更に、決定手順は、(ギャップ木で
あっても、なくても)木のサイズで時間線形に実行され
る。 B1,・・・Bkのラベルを付けられた中間の子
孫ノードを備えるT’においてAのラベルを付けられた
各ノードごとに行う。 (A)(B1 、・・・、B)を認識するならば、真にな
り、そうでなければ戻る(偽)。 戻れ(真) Aは、例えばB1,・・・,Bk=ε等の中間の子孫が
なくともよい。
【0037】本発明によって教示される方法によって構
成される有限状態機械は、入力として有限状態機械にお
くられる文書の部分構造がギャップ文法の解析木のイン
スタンスを構成できるか否かを決定する。各非終端記号
ノードのいずれも子の名前(列としての順序)は、木が
ギャップ文法の解析木のインスタンスになるように、親
ノードによって名付けられる有限状態機械によって受け
入れられなくてはならない。この状況が維持されれば、
解析木は弱有効文書の解析木になるか、さもなければ有
効文書でも弱有効文書でもない解析木になる。
【0038】本発明のもう1つの実施例に従って、エデ
ィタは木Tのノード及びアークの挿入又は削除によって
形成される木T’のいくらかの部分木のチェックだけを
必要とする。この実施例において、挿入されるノードに
関しては、新しい子供と共に新たに挿入されるノードの
親と、新たに挿入されるノードと、その子だけがチェッ
クされる。削除されたノードに関しては、新しい子と共
に新たに削除されたノードの親だけがチェックされる。
この他の手順は、以下に従ってなされる。親(ノード)
は、ノードをパラメータとして取り、木T’のその親ノ
ードに戻る。子の名前(ノード)は、ノードをパラメー
タとして取り、木T’のノードの下の子のラベルの順序
付けリストに戻る。有限状態機械(fsm)(ノード)
は、パラメータとしてノードを取り、木T’中のそのノ
ードのラベルと対応する有限状態機械(正規表現)に戻
る。T’中の新しいノードごとに行え。((有限状態機
械(親(n)))(子の名前(親(n)))を認識)し
なければ、偽(フォールス)に戻れ。((有限状態機械
(n))(子の名前(n))を認識)しなければ、偽に
戻れ。T’中の削除されるノードの(まだ存在いてい
る)親ノードnの各々に対して、次の事を行え。((有
限状態機械(n))(子の名前(n))を認識)しなけ
れば、偽に戻れ。真に戻れ。後者の手順は、挿入される
ノードの古い親の下側のノードの数と、削除されるノー
ドの親の下側のノードの数の総計に比例する時間で実行
される。
【0039】例えば、図7の木のノード”H”の下側の
ノードが、弱有効文書の解析木において許容されるか否
かをチェックするために、子”DAEAFBC”のラベ
ルは、列に形成され、図9のHによってラベルを付けら
れる有限状態機械によって認識されることが試みられ
る。状態1で開始し、有限状態機械は所与の列に対し
て、以下の遷移を行う。状態1はDを走査し、結果とし
て状態2に帰着し、状態2はAを走査し、結果として状
態2に帰着し、状態2はEを走査し、結果として状態2
に帰着し、状態2はAを走査し、結果として状態2に帰
着し、状態2はFを走査し、結果として状態2に帰着
し、状態2はBを走査し、結果として状態4に帰着し、
状態4はCを走査し、結果として状態5に帰着する。状
態5は、受け入れ状態(二重円として)示される(マー
クされる)ので、子のシーケンスは、弱有効文書の解析
木であることもある。
【0040】従って、本発明のエディタ及び解析は、ラ
ベル付けされ順序の付いた解析木が所与の文脈自由文法
の解析木になるように拡張されることができるか否かを
効率的に決定できる。エディタ及び解析は、所与の解析
木が有効解析木に至るまで拡張できるか否かを決定する
プログラムされたコンピュータでもあり得る。決定は、
新たに形成される木のノードの数に対して線型になる時
間でなされるか、あるいは解析木の変化部分だけのサイ
ズに対して線型になる時間で決定するように変更され
る。
【0041】本発明は、特定の実施例を伴って説明され
たが、多数の選択、変更、及びバリエーションが、当業
者にとってはっきりしていることは明白である。例え
ば、方法及び装置は仕様に基づいたSGML文法を伴っ
て説明されたが、本発明は例えば、オープンドキュメン
トアーキテクチャ(ODA)等の仕様に基づいた形式的
な文脈自由文法で記述されるあらゆる文書表現に使用さ
れることもできる。
【0042】
【発明の効果】本発明は、少なくとも1回の編集ステッ
プ後にラベル順序解析木が有効な木へ更に拡張されるこ
とができるか否かを効率的に決定するための方法及び装
置を提供する。
【図面の簡単な説明】
【図1】所与の文法に対応する模範的な解析木である。
【図2】横型のギャップを設けられた解析木の一例を示
す。
【図3】縦型のギャップを設けられた解析木の一例を示
す。
【図4】本発明に従った編集装置のブロック図である。
【図5】文法例に対応する模範的な解析木である。
【図6】文法例に対応する横型のギャップを設けられた
模範的な解析木である。
【図7】文法例に対応する縦型のギャップを設けられた
模範的な解析木である。
【図8】文法例に関して示される強連結成分及びランク
を備える到達可能性グラフである。
【図9】文法例に関して、解析木を弱有効にするために
有用な有限状態機械の例を示す。
【図10】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
【図11】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
【図12】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
【図13】文法例に関して、解析木を弱有効にするため
に有用な有限状態機械の例を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シドニー ダブリュ.マーシャル アメリカ合衆国 ニューヨーク州 14526 ペンフィールド ニュー ウィックハム ドライヴ 7

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書を編集するための方法であって、文
    書を編集するステップの性能が、文書の文法の記号でラ
    ベルつけされるノードを備える解析木を有効にするか否
    かを決定することを含み、 編集ステップが、周知の構造互換性に従って正当である
    か否かを決定するステップと、 前記編集ステップが正当でないと決定されるならば、編
    集ステップの障害点を決定するステップと、 一度障害点が決定されると、編集ステップを正当にする
    ために、どのステップが行われるべきであったかを決定
    するステップと、 正当な編集ステップを行うステップと、 からなる文書の編集方法。
JP6065883A 1993-04-12 1994-04-04 文書の編集方法 Pending JPH0713966A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US4479293A 1993-04-12 1993-04-12
US044792 1993-04-12

Publications (1)

Publication Number Publication Date
JPH0713966A true JPH0713966A (ja) 1995-01-17

Family

ID=21934364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6065883A Pending JPH0713966A (ja) 1993-04-12 1994-04-04 文書の編集方法

Country Status (4)

Country Link
US (1) US5557720A (ja)
EP (1) EP0620527B1 (ja)
JP (1) JPH0713966A (ja)
DE (1) DE69425082T2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
JP3028738B2 (ja) * 1994-11-10 2000-04-04 富士ゼロックス株式会社 文書共通論理情報編集装置
US5752022A (en) * 1995-08-07 1998-05-12 International Business Machines Corp. Method for creating a hypertext language for a distributed computer network
US6546406B1 (en) 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
JPH09146931A (ja) * 1995-11-24 1997-06-06 Dainippon Screen Mfg Co Ltd 文書型定義生成装置
US6167409A (en) * 1996-03-01 2000-12-26 Enigma Information Systems Ltd. Computer system and method for customizing context information sent with document fragments across a computer network
US5893109A (en) * 1996-03-15 1999-04-06 Inso Providence Corporation Generation of chunks of a long document for an electronic book system
US5915259A (en) * 1996-03-20 1999-06-22 Xerox Corporation Document schema transformation by patterns and contextual conditions
JPH09297768A (ja) * 1996-05-07 1997-11-18 Fuji Xerox Co Ltd 文書データベース管理装置及び文書データベース検索方法
US6108676A (en) * 1996-10-28 2000-08-22 Fuji Xerox Co., Ltd. Document processing apparatus, document type determining method, and hierarchical regular expression determining method
IE980959A1 (en) 1998-03-31 1999-10-20 Datapage Ireland Ltd Document Production
US6895551B1 (en) 1999-09-23 2005-05-17 International Business Machines Corporation Network quality control system for automatic validation of web pages and notification of author
US6874121B1 (en) * 1999-11-24 2005-03-29 Xerox Corporation Document editor for editing structure documents
JP3368883B2 (ja) * 2000-02-04 2003-01-20 インターナショナル・ビジネス・マシーンズ・コーポレーション データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置
US7073122B1 (en) 2000-09-08 2006-07-04 Sedghi Ali R Method and apparatus for extracting structured data from HTML pages
FI115416B (fi) * 2001-03-23 2005-04-29 Nokia Corp Rakenteellisen datan jäsennys
CN100414502C (zh) * 2002-10-15 2008-08-27 国际商业机器公司 置标语言模式确认的方法及系统
WO2006081428A2 (en) * 2005-01-27 2006-08-03 Symyx Technologies, Inc. Parser for generating structure data
US20080141230A1 (en) * 2006-12-06 2008-06-12 Microsoft Corporation Scope-Constrained Specification Of Features In A Programming Language
US8850414B2 (en) * 2007-02-02 2014-09-30 Microsoft Corporation Direct access of language metadata

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4429372A (en) * 1981-06-16 1984-01-31 International Business Machines Corporation Method for integrating structured data and string data on a text processing system
US4723211A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Editing of a superblock data structure
JPS62159239A (ja) * 1985-12-30 1987-07-15 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 仮想マシンの編集システム
JPS6324448A (ja) * 1986-07-17 1988-02-01 Toshiba Corp 複合文書処理装置
GB8618664D0 (en) * 1986-07-31 1986-09-10 British Telecomm Computer aided design system
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US5179650A (en) * 1988-01-21 1993-01-12 Kabushiki Kaisha Toshiba Method and apparatus for editing documents
US5130924A (en) * 1988-06-30 1992-07-14 International Business Machines Corporation System for defining relationships among document elements including logical relationships of elements in a multi-dimensional tabular specification
JPH02159674A (ja) * 1988-12-13 1990-06-19 Matsushita Electric Ind Co Ltd 意味解析装置と構文解析装置
NL8900247A (nl) * 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
US5185698A (en) * 1989-02-24 1993-02-09 International Business Machines Corporation Technique for contracting element marks in a structured document
US5113341A (en) * 1989-02-24 1992-05-12 International Business Machines Corporation Technique for creating and expanding element marks in a structured document
US5079700A (en) * 1989-04-26 1992-01-07 International Business Machines Corporation Method for copying a marked portion of a structured document
US5140521A (en) * 1989-04-26 1992-08-18 International Business Machines Corporation Method for deleting a marked portion of a structured document
CA2036859C (en) * 1990-04-30 1994-04-05 Eric M. Hesse System and method for editing a structured document to modify emphasis characteristics
US5276793A (en) * 1990-05-14 1994-01-04 International Business Machines Corporation System and method for editing a structured document to preserve the intended appearance of document elements

Also Published As

Publication number Publication date
DE69425082D1 (de) 2000-08-10
EP0620527B1 (en) 2000-07-05
EP0620527A3 (en) 1996-02-28
DE69425082T2 (de) 2001-03-22
EP0620527A2 (en) 1994-10-19
US5557720A (en) 1996-09-17

Similar Documents

Publication Publication Date Title
JPH0713966A (ja) 文書の編集方法
US6766330B1 (en) Universal output constructor for XML queries universal output constructor for XML queries
US4686623A (en) Parser-based attribute analysis
US7210096B2 (en) Methods and apparatus for constructing semantic models for document authoring
US7788654B2 (en) Method for construction of a linear-sized validation-plan of W3C XML schema grammars
JPH02121030A (ja) 接続方法、ノード接続方法、データ処理方法、及び木内にノードを挿入する方法
JP3230467B2 (ja) Gdmoトランスレータ及びgdmoトランスレーション方法並びにgdmoトランスレータプログラムを記録した記録媒体
US20020035580A1 (en) Computer readable medium containing HTML document generation program
JP2001243219A (ja) 不完全な形式のhtml文書の記述構造
Bex et al. Expressiveness of XSDs: from practice to theory, there and back again
Vijay-Shanker The use of shared forests in tree adjoining grammar parsing
CN113254023B (zh) 对象读取方法、装置和电子设备
Kaul Practical applications of precedence graph grammars
Dubé et al. Efficiently building a parse tree from a regular expression
CN112130952A (zh) 多语言显示方法、装置、设备及产品
CN115576603B (zh) 一种获取代码片段中的变量值的方法及装置
Cameron Rex: Xml shallow parsing with regular expressions
Møller Document Structure Description 2.0
KR100519916B1 (ko) 에스씨에이 기반 시스템의 파일 파싱 장치, 그리고 그의파일 파싱 및 데이터 저장 방법
Farré et al. A bounded graph-connect construction for LR-regular parsers
Johnstone et al. Generalised reduction modified LR parsing for domain specific language prototyping
MacLennan The Synmac syntax macroprocessor: Introduction and manual, version 5
Meijer The project on extended affix grammars at Nijmegen
Gómez‐Rodríguez et al. Undirected dependency parsing
More Compiler construction

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041026