JPH0765003A

JPH0765003A - 記号集合の解析方法

Info

Publication number: JPH0765003A
Application number: JP4188871A
Authority: JP
Inventors: Hosagrahar V Jagadish; ヴィスヴェスヴァラヤジャガディシュホサグラハー
Original assignee: American Telephone and Telegraph Co Inc; AT&T Corp
Current assignee: AT&T Corp
Priority date: 1991-06-25
Filing date: 1992-06-24
Publication date: 1995-03-10
Also published as: US5365430A; EP0520684A2; EP0520684A3; CA2071036A1

Abstract

(57)【要約】【目的】記号の半順序集合を解析する。【構成】記号の半順序集合の解析は、最初に与えられ
た終端記号の全順序を形成することによって達成され
る。終端記号間の関係が定式化され、与えられた文法が
生成規則の集合に分解される。生成規則に基づいて、ど
んな種類の記号が与えられた文法に従うために必要かに
ついての判定がなされる。その判定は、発見されるべき
終端記号の型と、その記号が持つべき半順序関係とを含
む。全順序づけされた記号の集合が順に検索され、指定
された基準を満たす最初の記号が選択される。適切な場
合、全順序集合から回復された記号が非終端記号に縮約
される。最終目標は、全順序集合中の全記号が、１つの
縮約された非終端記号に包含されることである。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、像の解析方法に関す
る。

【０００２】

【従来の技術】現在、パーソナルコンピュータ（ＰＣ）
のような小さいコンピュータとインタフェースするため
の一般的手段の１つは、画面、キーボード、および位置
決め装置（例えばマウス）からなる。位置決め装置配置
は、画面上に提示されたアイコン、コンピュータに接続
された移動可能な「マウス」、「マウス」の移動に応答
してアイコンを移動するためのソフトウェア、および、
アイコンの位置を認識するためのソフトウェアからな
る。

【０００３】アイコンマウス配置は、必要な情報量が少
ない場合、例えば、コンピュータコマンドが有効に選択
される場合に、ユーザからの情報を取得するには非常に
有効である。このようなコマンド選択セッションでは、
コンピュータはユーザにさまざまなオプションを提示
し、ユーザは提示されたオプションから選択する。

【０００４】アイコンマウスインタフェースによって、
オプションを提示し、ユーザの選択を識別する方法は、
画面上の指定された領域が特定の選択に対応するような
画面上の像を作成するステップと、画面上のアイコンの
位置を識別するステップと、アイコン位置、指定された
画面領域、および有効なコマンド選択の間の対応関係を
確立するステップからなる。

【０００５】一般的に、画面上のある領域と画面上の他
の領域の間に論理的関係はない。すなわち、単に、アイ
コンがある領域と近接関係にあるという理由によって
は、その領域に対応する作用は生じない。アイコンが領
域の上下左右のどこにあるかは問題とはならず、アイコ
ンがその領域内にあるか否かのみが問題となる。これ
は、領域間に論理的関係は存在し得ないということでは
なく、いくつかのアプリケーションでは実際に存在す
る。しかし、このような論理的関係に対応する制御を認
識し実現するプログラムは特殊なアプリケーションのた
めに「仕立てられた」ものである。

【０００６】コンピュータとユーザの間の対話の「制
御」の側面の他に、表示画面の相異なる領域が論理的関
係を共有する状況がある。例えば、（周知の書式の）ビ
ジネスレターの像が画面上に形成された場合、そのレタ
ーの日付がどこにあるか、日付に対して宛名はどこにあ
るか、宛名に対して書き出しはどこにあるか、などは周
知である。同じことは、しばしば表形式で提示される、
多くのデータベース出力「画面」にも当てはまる。

【０００７】

【発明が解決しようとする課題】問題は、いかにしてこ
れらの論理的関係を認識し解析するようにコンピュータ
をプログラムするか、および、いかにして論理的に強固
な方法でプログラミングの仕事に取り組むかである。こ
の問題の注意深い研究によって、これは、基本的に、文
法の問題であることが明らかとなる。すなわち、この問
題は、像を解析する最善の方法は何か、および、解析さ
れた情報を理解する最善の方法は何かという問題にかか
わるものである。

【０００８】情報の解析およびその解析の結果としての
文脈情報の導出は、形式言語とともに広く研究されてい
る。このような言語は、記号の集まりおよび規則で定義
された記号の操作の集合からなる。記号の集合は、言語
の基本的単位である終端記号（例えば単語）と、終端記
号から構成される非終端記号（例えば節）の両方を含
む。記号操作規則は時に生成規則とも呼ばれ、記号の有
効な写像を定義する。

【０００９】例えば、生成規則Ａ → ｂｃＮ（１）は、入力中に記号の列ｂｃＮが発見された場合、その列
は記号Ａに置換されることを表す。（本明細書では、小
文字は終端記号を表し、大文字は非終端記号を表す。）
明らかに、「後」および「前」の概念が生成規則にとっ
て非常に重要であり、言語の「文」の候補内の記号に厳
格な配列の概念を強制する。記号の配列は、１次元のス
トリングで明確に定義可能である（自然言語もそうであ
る）。しかし、高次元のストリングでは、順序列の概念
はうまく定義されない。これが、多次元ストリングの解
析があまり進展していない理由である。

【００１０】

【課題を解決するための手段】記号の半順序集合の解析
は、最初に与えられた終端記号の全順序を形成すること
によって達成される。終端記号間の関係が定式化され、
与えられた文法が生成規則の集合に分解される。生成規
則に基づいて、どんな種類の記号が与えられた文法に従
うために必要かについての判定がなされる。その判定
は、発見されるべき終端記号の型と、その記号が持つべ
き半順序関係とを含む。全順序づけされた記号の集合が
順に検索され、指定された基準を満たす最初の記号が選
択される。適切な場合、全順序集合から回復された記号
が非終端記号に縮約される。最終目標は、全順序集合中
の全記号が、１つの縮約された非終端記号に包含される
ことである。

【００１１】

【実施例】

［順序づけおよび誘導］以上から推測されるように、多
次元ストリングの解析の前に、そのストリングに対して
合理的な順序づけ方式が開発され、その順序づけ方式と
うまく結合する解析プロセスが作成されなければならな
い。

【００１２】ここで開示されるのは、記号の集合が多次
元空間（α個の次元すなわち方向を有する）において半
順序づけ可能であるような状況で有効に作動する効率的
な解析プロセスである。半順序集合とは、２個の要素間
に関係が存在することが可能であり、存在する場合には
それは推移性（ａ＜ｂおよびｂ＜ｃならばａ＜ｃ）を有
するような要素の集合である。全順序集合では、要素間
には関係が存在し、推移性が成り立つ。

【００１３】半順序づけされた記号の集合が与えられる
と、本発明の実施に必要なことは、記号の全順序づけで
ある。任意の順序づけ方式が可能であるが、以下では、
興味のある広範囲の記号ソースに適用される合理的順序
づけ方法を提示する。

【００１４】この方法によって、半順序集合が全順序づ
けされるのは、与えられた記号の集合において、あらゆ
る記号ｕが少なくとも１次元すなわち１方向で記号ｖよ
りも小さいかまたは大きい場合に限る（「より小さい」
は「先行する」を意味する）。「ｖが１次元方向でｕよ
り小さい（ｕに先行する）」という関係を、ｖ＜₁ｕと
書く。ｖが１次元方向でｕより小さいか、またはその反
対であるかが分からない場合、ｖ＝₁ｕという式を使用
する。

【００１５】より簡潔な数学的用語で全順序づけ方法を
説明すると、記号の任意の対ｕおよびｖに対し、ｕ＜₁ｖならばｕ＜ｖｖ＜₁ｕならばｖ＜ｕｕ＝₁ｖならば：ｕ＜₂ｖならばｕ＜ｖｖ＜₂ｕならばｖ＜ｕ（２）ｕ＝₂ｖならば：・・・ｕ＜_aｖならばｕ＜ｖｖ＜_aｕならばｖ＜ｕｕ＝_aｖならばエラー。ｕ＝ｖの場合にのみ可能。上記の順序づけは、入力記号の明確な全順序づけの方法
を定める。

【００１６】入力の半順序づけの他に、本発明の解析プ
ロセスは「誘導」の概念を使用する。次の条件が満たさ
れるとき、記号「ｕ」が記号「ｖ」の「ｉ−誘導であ
る」という。ｉ．ｕ＜_iｖｉｉ．ｕ＝_jｖすべてのｊ≠ｉｉｉｉ．ｕ＜_i＜ｗ＜_iｖとなるようなｗが存在しないすなわち、ｕが次元ｉ方向でｖより小さく、その次元で
ｕとｖの間にｗが存在せず、ｉ以外のすべての次元ｊで
はｕとｖは比較不可能である場合に、「ｕはｖをｉ−誘
導する」。

【００１７】上記で定義された順序づけおよび誘導の原
理を使用する解析プロセスが以下で定式化される。この
解析プロセスの説明には、考案された２次元の英語の
「実の従兄弟」の簡単な例が援用されるが、まずその言
語の文法を定義しなければならない。

【００１８】［２次元英語の文法］順序づけられた単語
を理解する、すなわち、入力を解析するためには、文法
の規則が提示されなければならない。この説明のため、
考案された２次元言語は以下の文法に従う。規則意味１．ＦＩＮ→Ｘ記号Ｘは、解析プロセスの正常終了を表す記号ＦＩＮに写像される。２．Ｘ→Ｓ＜１Ｐ述節Ｐの左の主節ＳはＸに写像される。３．Ｓ→ａｒｔ＜₁ＳＳの左の冠詞はＳに写像される。４．Ｓ→Ｓ＜₂ａｄｊ形容詞（ａｄｊ）の上のＳはＳに写像される。５．Ｐ→ｖｅｒｂ＜₂Ｏ目的節Ｏの上の動詞（ｖｅｒｂ）はＰに写像される。６．Ｏ→ｎｏｕｎ名詞（ｎｏｕｎ）はＯに写像される。７．Ｓ→ｎｏｕｎ名詞（ｎｏｕｎ）はＳに写像される。

【００１９】［有限状態マシンの状態］以下で詳細に説
明するように、本発明の解析プロセスは、離散的状態に
よって特徴づけられる有限状態マシン（ＦＳＭ）によっ
て実行される。ＦＳＭは、指定された入力が与えられる
と所定の状態に入り、その状態に対して事前に定義され
たある動作を実行し、他の入力が与えられるまでその状
態にとどまる。本発明のＦＳＭパーサの状態は上記の文
法から明らかになる。

【００２０】特に、文法の規則１から、次の状態０を得
る。ＦＩＮ→＊ＸＸの左の＊は、Ｘが「観測される」ためにシークされる
ことを意味する。文法の規則２から、Ｘを観測するため
にシークすることは、変換すなわち項Ｘ→＊ＳＰにおけるように、Ｓを観測するためにシークすることで
もある。

【００２１】規則３、４および７から、Ｓを観測するた
めにシークすることは、ａｒｔ、Ｓ、ｎｏｕｎを観測す
るためにシークすることでもある。すなわち、Ｓ→＊ａｒｔＳＳ→＊ＳａｄｊＳ→＊ａｒｔｎｏｕｎ

【００２２】従って、状態０は、ＦＩＮ→＊ＸＸ→＊ＳＰＳ→＊ａｒｔＳＳ→＊ＳａｄｊＳ→＊ｎｏｕｎに対応する。

【００２３】Ｘが観測されると、ＦＳＭは状態０から状
態１へ移動する。Ｓが観測されると、ＦＳＭは状態２へ
移動する。ａｒｔが観測されると、ＦＳＭは状態３へ移
動する。ｎｏｕｎが観測されると、ＦＳＭは状態４へ移
動する。各状態を展開して、状態の全集合およびそれら
の状態の項が、以下のリストのように明らかとなる。状態０：ＦＩＮ→＊Ｘ（第１シーク）Ｘ→＊ＳＰＳ→＊ａｒｔＳＳ→＊ＳａｄｊＳ→＊ｎｏｕｎ状態１：ＦＩＮ→Ｘ＊Ｒ状態２：Ｘ→Ｓ＊Ｐ（Ｓ，１）Ｓ→Ｓ＊ａｄｊ（Ｓ，２）Ｐ→＊ｖｅｒｂＯ状態３：Ｓ→ａｒｔ＊Ｓ（ａｒｔ，１）Ｓ→＊ａｒｔＳＳ→＊ＳａｄｊＳ→＊ｎｏｕｎ状態４：Ｓ→ｎｏｕｎ＊Ｒ状態５：Ｘ→ＳＰ＊Ｒ状態６：Ｓ→Ｓａｄｊ＊Ｒ状態７：Ｐ→ｖｅｒｂ＊Ｏ（ｖｅｒｂ，２）Ｏ→＊ｎｏｕｎ状態８：Ｐ→ｖｅｒｂＯ＊Ｒ状態９：Ｏ→ｎｏｕｎ＊Ｒ状態１０：Ｓ→ａｒｔＳ＊ＲＳ→Ｓ＊ａｄｊ（Ｓ，２）

【００２４】上記のリストで、いくつかの項の次のＲの
表示は、それらが可約であることを示す。これらは「可
約項」である。「核項」とは、可約でない項のことであ
り、その右辺の＊の左には少なくとも１つの記号が存在
する。核項の誘導関係は重要であるため、核項の右の括
弧内に示してある。項ＦＩＮ→＊Ｘは擬似核項である。
これは、要素の順序リストにおける第１項のシークを指
定する。

【００２５】核項を含むＦＳＭ状態は、新たな情報を要
求する状態である。その情報に応答して、ある時にはＦ
ＳＭは縮約が起こる状態に入り、またある時は、ＦＳＭ
はさらに情報が必要な状態に入る（時に「シフト」と呼
ばれる）。可約項および核項、すなわち、上記のリスト
で右側に括弧のコメントを有する項は、「判断項」であ
る。

【００２６】シフト／縮約衝突があるようなＦＳＭ状態
が存在することがある。状態１０はこのような衝突を有
し、いずれの動作が実行されるかが指定されない。通
常、縮約とシフトの衝突はシフトのほうをとることによ
って解決される。その根拠は、縮約可能な記号の最大の
群を発見するという目的に基づく。また、状態２は、シ
ークまたはシフト衝突を表す２つの核項を有する。

【００２７】第１項によれば、ＦＳＭは、Ｓによって１
−誘導されるものをシークしなければならないが、一方
第２項によれば、ＦＳＭは、Ｓによって２−誘導される
ものをシークしなければならない。このシーク衝突は、
実は、文法がうまく定義されていないことを意味する。
しかし、これは、追加規則を作成することによって、ま
たは、ユーザが単に好きなほうを選択することによっ
て、解決される。今の場合、第２項は、観測されたＳを
他のＳに変換する。従ってこの場合には、このような変
換が第１項の変換に優先するという規則を設定すること
に意味がある。こうして、状態２における動作の順序
は、第２項に従って順序入力リスト中の記号をシーク
し、１つも発見されない場合には第１項に従って順序入
力リスト中の記号をシークする、ということになる。

【００２８】条第２の衝突のために設定された規則は、
衝突を除去するように追加非終端記号および追加文を文
法に加え、特定の所望のシーク／縮約解析順序を強制す
るという従来の方法によっても解決される。

【００２９】表１は、上記の状態の状態遷移行列を表
す。有限状態マシンのいくつかの状態は、表１の遷移行
列の行として現れていない。これは、単一可約項に対応
する状態である。

【００３０】［サンプル文の解析］次の文を考える。Ｔｈｅｄｏｇａｔｅ（３）ｇｏｏｄｂｒｅａｄ第１ステップは、入力記号（単語）の順序づけである。
文の５単語を対の組合せで取り、上記の順序づけ方式を
適用すると、次の結果が得られる。Ｔｈｅ＜₁ｄｏｇＴｈｅ＜₁ｇｏｏｄＴｈｅ＜₂ｇｏｏｄＴｈｅ＜₂ｂｒｅａｄｄｏｇ＜₁ａｔｅｄｏｇ＜₁ｂｒｅａｄ（４）ｄｏｇ＜₂ｇｏｏｄｄｏｇ＜₂ｂｒｅａｄｇｏｏｄ＜₁ａｔｅｇｏｏｄ＜₁ｂｒｅａｄａｔｅ＜₂ｇｏｏｄａｔｅ＜₂ｂｒｅａｄいくつかの組合せは取られていない。その理由は、関係
についての情報がないか、または、関係が「＜」演算子
の推移性から得られるためである。

【００３１】上記の対の組合せのリストでは、語「Ｔｈ
ｅ」は明らかに主記号である。これは、いずれの次元で
も、あらゆる他の記号に先行する。順序づけ手続を開始
すると、次元１方向で記号「Ｔｈｅ」に関係する記号は
「ｇｏｏｄ」および「ｄｏｇ」である。これらは記号
「Ｔｈｅ」に後続することは分かるが、それらの互いの
順序関係は分からない。「ｇｏｏｄ」および「ｄｏｇ」
を順序づける場合、これらは次元１方向では比較不可能
であることが分かる。

【００３２】しかし、次元２方向では、「ｄｏｇ」は
「ｇｏｏｄ」の上にあるため、上記の半順序規則によっ
て、これらは、記号「Ｔｈｅ」の後で次のように並ぶ。
Ｔｈｅ＜ｄｏｇ＜ｇｏｏｄ残りの２単語「ａｔｅ」およ
び「ｂｒｅａｄ」は、次元１方向で「ｄｏｇ」および
「ｇｏｏｄ」に後続するが、この場合も、互いの間で
は、次元２方向の順序が確立されなければならない。

【００３３】（２）に示される手続を適用して、（３）
の全文に対して得られる最終順序は、次の通りである。Ｔｈｅ＜ｄｏｇ＜ｇｏｏｄ＜ａｔｅ＜ｂｒｅａｄ（５）ストリング（５）は英語の妥当文の構造を有しないかも
しれないが、それはまったく重要でない。重要なこと
は、明確で曖昧さのない順序が確立されたことである。
本発明の解析プロセスでは、以下で詳細に説明するよう
に、入力単語はこの順序でアクセスされる。

【００３４】「誘導」関係に関し、（３）で示される文
にリスト（４）の関係を適用して得られる結果は次の通
りである。「Ｔｈｅ」は「ｄｏｇ」を１−誘導する「ｄｏｇ」は「ａｔｅ」を１−誘導する「ｇｏｏｄ」は「ｂｒｅａｄ」を１−誘導する（６）「ｄｏｇ」は「ｇｏｏｄ」を２−誘導する「ａｔｅ」は「ｂｒｅａｄ」を２−誘導するこれは「誘導リスト」であり、下記の解析プロセスで補
充される。関係リスト（４）もまた、下記のように、解
析プロセスで補充される。

【００３５】［関係リストおよび誘導リストの補充］文
法は、解析プロセスで新たに生成される非終端記号とす
でに存在する他の記号の間の半順序関係を決定すること
ができる規則を指定しなければならない。この規則は、
当該非終端記号と当該他の記号の各構成要素間に関係が
存在するときに限り、関係が存在するというものであ
る。縮約が適用されて新たな非終端記号が生成される
と、この規則が、関係リストを補充するために使用され
る。その後、関係リスト中に生じたすべての新たな非終
端記号の構成記号が削除される。

【００３６】関係リストに生じた変化は誘導リストにも
反映されなければならない。新たな非終端記号の構成記
号に関する誘導関係はもはや必要でなく、削除される。
新たな非終端記号に関する新たな誘導関係は、存在すれ
ば、通常の方法で決定され、誘導リストに追加される。

【００３７】［解析プロセス］図１のステップａに示し
たように、解析手続きは、スタック内の状態０から開始
する。順序リスト（５）から取り出されるものに関する
条件は何も課されていないため、第１記号（「Ｔｈ
ｅ」。これはａｒｔである）が取り出される。表１によ
れば、ａｒｔは受容可能入力であるため、組「Ｔｈｅ：
ａｒｔ：３」がスタックに格納され、表１の指定および
図１のステップｂに示されるように、ＦＳＭは状態３に
移動する。記号「Ｔｈｅ」を観測し受容すると、これは
順序リスト（５）から削除される。

【００３８】状態３では、１個の核項が存在する。ａｒ
ｔによって１−誘導されるものがシークされる。スタッ
ク内のａｒｔは「Ｔｈｅ」である。上記の誘導リストを
見ると、「Ｔｈｅ」が１−誘導する第１エントリは「ｄ
ｏｇ」（リストの第１項）であり、これはｎｏｕｎであ
る。表１によれば、ｎｏｕｎは状態３の受容可能入力で
あり、ＦＳＭを状態４へ移動させる。従って、図１のス
テップｃに示すように、組「ｄｏｇ：ｎｏｕｎ：４」が
スタック上にプッシュされ、記号「ｄｏｇ」が順序リス
トから削除される。

【００３９】状態４はｎｏｕｎをＳに縮約する。従っ
て、組「ｄｏｇ：ｎｏｕｎ：４」がスタックからポップ
され、ｎｏｕｎがＳで置換される。同時に、関係リスト
が以下のエントリで補充される。Ｔｈｅ＜₁Ｓ［ｄｏｇ］Ｓ［ｄｏｇ］＜₁ａｔｅＳ［ｄｏｇ］＜₁ｂｒｅａｄＳ［ｄｏｇ］＜₂ｇｏｏｄＳ［ｄｏｇ］＜₂ｂｒｅａｄ

【００４０】また、「誘導リスト」が以下のエントリで
補充される。Ｓ［ｄｏｇ］は「ａｔｅ」を１−誘導するＳ［ｄｏｇ］は「ｇｏｏｄ」を２−誘導するｎｏｕｎをＳで置換した結果、入力ＳがＦＳＭに与えら
れ、ＦＳＭは状態３に入る。表１によれば、状態３でＳ
が観測された場合、ＦＳＭは状態１０へ移動する。従っ
て、図１のステップｄに示すように、ポップされた組は
「ｄｏｇ：Ｓ：１０」に変更されてスタック上にプッシ
ュされる。

【００４１】状態１０では、ＦＳＭはＳによって２−誘
導されるものをシークする。誘導リスト中にそのような
エントリは１つだけ存在し（Ｓ［ｄｏｇ］は「ｇｏｏ
ｄ」を２−誘導する）、「ｇｏｏｄ」は、ａｄｊである
ため、シーク項Ｓ→＊ａｄｊの条件を満たす。従って、
「ｇｏｏｄ」が順序リストから取られ、図１のステップ
ｅに示すように、組「ｇｏｏｄ：ａｄｊ：６」が（表１
を参照して）生成されてスタック上にプッシュされる。
他の受容された記号と同様、「ｇｏｏｄ」は順序リスト
から削除される。

【００４２】状態６は可約状態である。スタック内の２
つの組がポップされ、縮約が実行され、Ｓを生成する。
再びＦＳＭは状態３を認識し、入力記号はＳである。表
１に従って、次の状態は１０であり、図１のステップｆ
に示すように、新たな組「ｇｏｏｄ，ｄｏｇ：Ｓ：１
０」が生成されてスタック上にプッシュされる。関係リ
ストは以下のエントリで補充される。Ｔｈｅ＜₁Ｓ［ｄｏｇ，ｇｏｏｄ］Ｓ［ｄｏｇ，ｇｏｏｄ］＜₁ａｔｅＳ［ｄｏｇ，ｇｏｏｄ］＜₁ｂｒｅａｄまた、誘導リストは以下のエントリで補充される。Ｓ［ｄｏｇ，ｇｏｏｄ］は「ａｔｅ」を１−誘導す
るＳ［ｄｏｇ，ｇｏｏｄ］は「ｂｒｅａｄ」を１−誘導す
る

【００４３】再び状態１０で、Ｓによって２−誘導され
るａｄｊでのシフトが試みられる。しかし、この試みは
失敗する。従って、次の判断項Ｓ→ａｒｔＳ＊が適用
される。これもまたＳを生成し、これは、上位２個の組
をポップした後、再びスタック上にプッシュする。ＦＳ
Ｍは状態０を認識し、Ｓを観測するため、表１に従っ
て、図１のステップｇに示すように、ＦＳＭは状態２に
進む。再び関係リストが補充され、今回のエントリは以
下の通りである。Ｓ［Ｔｈｅ，ｄｏｇ，ｇｏｏｄ］＜₁ａｔｅＳ［Ｔｈｅ，ｄｏｇ，ｇｏｏｄ］＜₁ｂｒｅａｄまた、誘導リストは以下のエントリで補充される。Ｓ［Ｔｈｅ，ｄｏｇ，ｇｏｏｄ］は「ａｔｅ」を１
−誘導するＳ［Ｔｈｅ，ｄｏｇ，ｇｏｏｄ］は「ｂｒｅａｄ」を１
−誘導する

【００４４】状態２では、可能な２つの異なるシークが
存在する。前記のように、Ｓによって２−誘導されるも
のをシークするほうが好ましい。何も発見されない場
合、Ｓによって１−誘導されるものに対するシークが行
われる（項Ｓ→Ｓ＊Ｐによる）。残りのリスト「ａｔｅ
＜ｂｒｅａｄ」中の第１記号「ａｔｅ」はＳ（特に、Ｓ
［Ｔｈｅ，ｄｏｇ，ｇｏｏｄ］）によって１−誘導され
る。これはｖｅｒｂであり、表１によれば、ｖｅｒｂは
受容可能記号であり、ＦＳＭを状態７へ移動させる。組
「ａｔｅ：ｖｅｒｂ：７」が生成され、図１のステップ
ｈに示すように、スタック上にプッシュされる。

【００４５】状態７は、ｖｅｒｂによって２−誘導され
るもののシークを開始する核項を含む。「誘導リスト」
によれば、ｖｅｒｂである記号「ａｔｅ」は記号「ｂｒ
ｅａｄ」を２−誘導し、記号「ｂｒｅａｄ」は順序リス
ト中に発見される（実際、これは順序リストに残る最後
かつ唯一の記号である）。また、記号「ｂｒｅａｄ」は
ｎｏｕｎであり、表１によれば受容可能記号である。従
って、組「ｂｒｅａｄ：ｎｏｕｎ：９」が生成され、図
１のステップｉに示すようにスタック上にプッシュされ
る。

【００４６】状態９は可約状態である。最上の組がポッ
プされ、ｎｏｕｎがＯに縮約され、表１に従って組「ｂ
ｒｅａｄ：Ｏ：８」が生成され、図１のステップｊに示
すようにスタック上にプッシュされる。

【００４７】状態８もまた可約状態である。上位の２つ
の組がポップされ、縮約Ｐ→ｖｅｒｂＯ＊が実行さ
れ、表１に従って新たな組「ｂｒｅａｄ，ａｔｅ：Ｐ：
５」が生成され、図１のステップｋに示すようにスタッ
ク上にプッシュされる。

【００４８】状態５もまた可約状態である。再び上位の
２つの組がポップされ、縮約Ｘ→ＳＰ＊が実行され、表
１に従って新たな組「ｂｒｅａｄ，ａｔｅ，ｇｏｏｄ，
ｄｏｇ，Ｔｈｅ：Ｘ：１」が生成され、図１のステップ
ｌに示すようにスタック上にプッシュされる。

【００４９】関係リストおよび誘導リストは、もちろ
ん、上記の各縮約後に更新される。これらの更新では変
わったことまたは興味あることが生じないので、簡単の
ため説明しない。

【００５０】最後に、状態１では、変換ＦＩＮやＸ＊が
実行され、解析は正常終了する。解析の結論の１つは、
（３）の文が文法に従う妥当文であることである。

【００５１】［像の解析］考案された２次元言語の上記
の例は、本発明の解析プロセスに付随する概念を導入す
るための伝達手段として提示された。以下では、本発明
の解析プロセスおよび装置の実際的使用法を提示する。
特に、図２は、ジャーナル・オヴ・ジ・アソシエーショ
ン・オヴ・コンピューティング・マシネリー(Journal o
f the Association of Computing Machinery)の表紙で
ある。

【００５２】これはテキストのブロックを含み、テキス
トの各ブロックは、ブロック内の単語に含まれる意味
と、他のテキストのブロックの位置に関するそのテキス
トのブロックの位置に埋め込まれた付加的意味を有す
る。図２の電子走査および信号処理によって、走査像に
埋め込まれたテキストおよびその意味の両方が明らかに
なれば有益である。例えば、単語「Ｈｏｖｅｒ」を構成
する文字列が図２の像中に発見される。この単語が像中
にあることを確認することに加えて、この単語が、空中
に浮く（ｈｏｖｅｒ）乗り物に関する記事の題名中の単
語ではなく、著者名であるということが判定されるかも
しれない。走査像要素にカテゴリーを割り当てることが
できることは、コンピュータを基礎とするシステムとの
有効な対話に役立つ。

【００５３】図２を吟味すると、それは、（テキストか
らなる）構造ブロック、すなわち、Ｈｅａｄｉｎｇ（見
出し）、Ｂｏｄｙ（本文）、Ｃａｔｅｇｏｒｙ（カテゴ
リー）、ＧｒｏｕｐＨｅａｄｉｎｇ（群見出し）、Ａ
ｒｔｉｃｌｅ（記事）、ＰａｇｅＮｕｍｂｅｒ（ペー
ジ数）、Ｗｒｉｔｅｒ（著者）、およびＴｉｔｌｅ（題
名）のような要素を含むことが分かる。

【００５４】上記要素はすべて、（以前のように）これ
らが非終端要素であることを示すため、大文字で始ま
る。基本走査要素である終端要素は、題名を構成する大
文字および小文字の集合のようなｌｉｎｅｂｌｏｃｋ
（線ブロック）、群見出しを構成するすべて大文字の集
合のようなｃａｐｓｂｌｏｃｋ（大文字ブロック）、
および、ページ数のようなｎｕｍｂｅｒｂｌｏｃｋ
（数ブロック）である。いくつかの非終端要素は他の非
終端要素に分割されるが、簡単のため、図２の像ではそ
れは行われていない。Ｈｅａｄｉｎｇブロックはその代
表的例であり、３個の基本的サブブロックに分割可能で
あるため、要素Ｈｅａｄｉｎｇは終端要素（ｈｅａｄｉ
ｎｇ）と仮定される。

【００５５】図２の像中の構造の研究により、以下の文
法がその構造中に埋め込まれていることが明らかとな
る。Ｓ→ｈｅａｄｉｎｇＢｏｄｙ（ｈｅａｄｉｎｇ＜
₂Ｂｏｄｙ）Ｂｏｄｙ→ＣａｔｅｇｏｒｙＢｏｄｙ（Ｃａｔｅ
ｇｏｒｙ＜₂Ｂｏｄｙ）Ｂｏｄｙ→ＣａｔｅｇｏｒｙＣａｔｅｇｏｒｙ→ＧｒｏｕｐＨｅａｄＡｒｔｉｃｌ
ｅ（ＧｒｏｕｐＨｅａｄ＜₁Ａｒｔｉｃｌｅ）Ｃａｔｅｇｏｒｙ→ＣａｔｅｇｏｒｙＡｒｔｉｃｌｅ
（Ｃａｔｅｇｏｒｙ＜₂Ａｒｔｉｃｌｅ）Ａｒｔｉｃｌｅ→ＰａｇｅＮｕｍＴｉｔｌｅＷｒｉ
ｔｅｒ（ＰａｇｅＮｕｍ＜₁Ｔｉｔｌｅ，Ｐａｇ
ｅＮｕｍ＜₁Ｗｒｉｔｅｒ，ＰａｇｅＮｕｍ＜₂Ｗｒｉ
ｔｅｒ，ＰａｇｅＮｕｍ＜₂Ｗｒｉｔｅｒ）ＰａｇｅＮｕｍ→ｎｕｍｂｅｒｂｌｏｃｋＴｉｔｌｅ→ｌｉｎｅｂｌｏｃｋＷｒｉｔｅｒ→ｌｉｎｅｂｌｏｃｋＧｒｏｕｐＨｅａｄ→ｃａｐｓｂｌｏｃｋ

【００５６】上記の文法に基づいて有限状態マシンの状
態を導出すると、その結果は次の通りである。状態０：ＦＩＮ→＊Ｓ（第１シーク）Ｓ→＊ｈＢ状態１：ＦＩＮ→Ｓ＊Ｒ状態２：Ｓ→ｈ＊Ｂ（ｈ，２）Ｂ→＊ＣＢ→＊ＣＢＣ→＊ＣＡＣ→＊ＧＡＧ→＊ｃ状態３：Ｓ→ｈＢ＊Ｒ状態４：Ｂ→Ｃ＊ＲＢ→Ｃ＊Ｂ（Ｃ，２）Ｃ→Ｃ＊Ａ（Ｃ，２）Ｂ→＊ＣＢ→＊ＣＢＣ→＊ＣＡＣ→＊ＧＡＧ→＊ｃＡ→＊ＰＴＷＰ→＊ｎ状態５：Ｃ→Ｇ＊Ａ（Ｇ，１）Ａ→＊ＰＴＷＰ→＊ｎ状態６：Ｇ→ｃ＊Ｒ状態７：Ｂ→ＣＢ＊Ｒ状態８：Ｃ→ＣＡ＊Ｒ状態９：Ｃ→ＧＡ＊Ｒ状態１０：Ａ→Ｐ＊ＴＷ（Ｐ，１）Ｔ→＊ｌ状態１１：Ｐ→ｎ＊Ｒ状態１２：Ａ→ＰＴ＊Ｗ（Ｔ，２）Ｗ→＊ｌ状態１３：Ｔ→ｌ＊Ｒ状態１４：Ａ→ＰＴＷ＊Ｒ状態１５：Ｗ→ｌ＊Ｒ

【００５７】上記の状態４は最も複雑な状態である。こ
の状態は、可約項（Ｂ→ｃ＊）および２つの核項（Ｂ→
Ｃ＊ＢおよびＣ→Ｃ＊Ａ）を含む。シフト−縮約衝突
は、シフトをとることにより解決される。２つの異なる
核項は、いずれもＣによって２−誘導されるものを探索
するため、シーク衝突を生じない。状態遷移行列は以下
の表２に示される。入力が受容されない（すなわち、核
項を持たない）状態は、その状態に対応する行がすべて
空であるため、行列には示さない。

【００５８】［解析装置およびプロセスの流れ］図３
は、本発明を実現する解析装置のブロック図である。走
査された入力記号がブロック１７０に挿入され、入力要
素の半順序関係に基づいて関係リストが形成される。ブ
ロック１７０の情報から、プロセッサ１００は、（２）
で定義されたプロセスに従って入力要素の全順序を生成
し、順序要素はブロック１１０に格納される。

【００５９】コントロールブロック１２０は、順序記号
および関係リストにアクセスすることが可能であり、利
用可能な情報および事前に知られている文法に基づい
て、ブロック１２０は誘導リストを生成し、誘導リスト
はブロック１３０に格納される。コントロール１２０
は、スタック１４０および状態遷移行列記憶装置１５０
とも対話する。動作時には、以下で詳細に説明するよう
に、コントロール１２０は、スタック１４０、ブロック
１５０の状態遷移行列、ブロック１７０の関係リストお
よびブロック１３０の誘導リストを使用して、スタック
内の情報を縮約すべきかどうか、または、ブロック１１
０の要素の順序集合中で特定の型の要素を検索すべきか
どうか、判定する。

【００６０】そのような要素が発見された場合、それは
基本的にブロック１１０からスタック１４０へ転送され
る。縮約が実行された場合でも、新たな要素が検索され
て選択された場合でも、その結果、新たな情報の組がス
タック１４０にプッシュされる。プロセスは、エラー
（これは、文法が満たされない場合に発生する）がなけ
れば、ブロック１１０に格納された要素の全集合がブロ
ック１１０からスタック１４０へ転送されてプロセスが
終了するまで、反復する。

【００６１】図４は、解析プロセスの流れ図である。こ
れは、ブロック１９０から開始する。ブロック１９０で
は、文法に基づいて、ＦＳＭの状態が決定される。ま
た、このブロックでは、関係リストおよび誘導リストが
初期状態で設定される。次に、ブロック１８０で、全順
序が、説明した方法に従って、入力記号の与えられた集
合に対して設定される。

【００６２】実際の解析はブロック２００から始まる。
ブロック２００では、有限状態マシン（ブロック１４
０、１５０、１６０および１７０をもつコントロールブ
ロック１２０）は状態０にある。有限状態マシンを状態
０に置く指令は、初めにスタック１４０に組「：：０」
を置くことによって実行される。ＦＳＭの状態を表すの
は、組の第３フィールドの０である（「：：０」は、ス
タック上にプッシュされた最新の組であるため、スタッ
クの最上部にある）。

【００６３】生成項ブロック（１６０）は、状態０のす
べての判断項に対して読み出され、「第１シーク」判断
項が発見される。これは、実際、ブロック１１０の順序
入力中の第１エントリ（主要素）のシークを指定する。
ブロック２０１で、インデックス変数ｉが１にセットさ
れ、解析はブロック２０２に進む。ブロック２０２で
は、現状態の第１判断項（ｉ＝１）が、その状態に対す
るブロック１６０内の他の判断項の中から選択される。

【００６４】これは、核項または縮約を表す項であるこ
とがある。有限状態マシンのいくつかの状態はいくつか
のこのような項を有する。状態がＭ個の判断項を有し、
ｉの値がＭ＋１に達した場合、ブロック２０２はエラー
を宣言する。その他の場合、解析はブロック２０３に進
み、判断項の性質が判定される。判断項が縮約を要求し
ていると判定された場合、解析はブロック２０４に進
む。

【００６５】組がスタック１４０からポップされ、解析
はブロック２０５に進み、ポップされた組が、選択され
た判断項によって期待されるものと比較される。ポップ
された組が妥当である場合、判断ブロック２０６は、さ
らに組をスタックからポップする必要があるかどうかを
判定する。必要がある場合、制御はブロック２０４に戻
る。ブロック２０５で、ポップされた組が妥当でないと
判定された場合、ブロック２０７で、ポップされたすべ
ての組はスタック１４０にプッシュされ、ブロック２０
８でｉの値が１だけ増加され、制御はブロック２０２に
戻る。

【００６６】ブロック２０６で、すべての必要な組がポ
ップされていると判定された場合、解析はブロック２０
９に進み、選択された判断項によって縮約が実行され
る。ブロック２０９はまた、状態遷移行列ブロック１５
０から導出される情報に従って新たな組を生成する。ブ
ロック２１０で、ブロック１７０の関係リストおよびブ
ロック１３０の誘導リストが補充され、制御はブロック
２１１に移る。ブロック２１１は、ブロック２０９で生
成された組を格納し、それによって有限状態マシンは次
の状態に進む。ブロック２１１に続いて、ブロック２１
６は、有限状態マシンが状態１に到達したかどうかを判
定する。到達した場合、プロセスは終了する。到達しな
い場合、制御はブロック２０１に戻る。

【００６７】ブロック２０３で、ブロック２０２で選択
された判断項がシーク項であると判定された場合、ブロ
ック２１２で、誘導リスト１３０が参照され、誘導リス
トから導出される情報に基づいて、ブロック１１０内の
入力情報が順に検索される。検索条件に一致する第１要
素が、ブロック２１３によって判定され、ブロック２１
４によってブロック１１０から削除される。ブロック２
１５で、新たに受容された要素に対する組が、状態遷移
行列ブロック１５０から導出される情報を使用して生成
され、制御はブロック２１１に移る。

【００６８】

【発明の効果】以上述べたごとく、本発明によれば、コ
ンピュータの画面に表示された要素間の論理的関係を解
析するなどの際に有用となる、多次元ストリングを解析
する一般的かつ最善の方法が与えられる。

【図面の簡単な説明】

【図１】有限状態マシンが与えられた文を解析する際
の、マシン内のスタックの内容を例示する図である。

【図２】ＡＣＭジャーナルの表紙の図である。

【図３】本発明の原理によるパーサのブロック図であ
る。

【図４】本発明の解析プロセスを説明する流れ図であ
る。

【符号の説明】１００プロセッサ１１０全順序リスト１２０コントロール１３０誘導リスト１４０スタック１５０状態遷移行列１６０生成項１７０関係リスト

【表１】

【表２】

Claims

【特許請求の範囲】

【請求項１】記号の集合から記号を取得するステップ
（２１２）と、取得した記号を以前に取得した記号と組
み合わせることが文法によって要求されている場合にそ
の組合せをするステップ（２０９、２１５）からなる、
文法に従って記号の集合を解析する方法において、この
方法が、文法に基づいて、プロセステーブルを作成するステップ
（１９０）と、記号の集合が順序づけられていない場合、記号の順序集
合を形成するために記号の集合を順序づけるステップ
（１８０）と、文法に基づいて、受容可能記号の特性を決定するステッ
プ（１９０）と、前記取得ステップの一部として、第１の受容可能記号に
対し、記号の順序集合を検索するステップ（２１２、２
１３）とからなることを特徴とする記号集合の解析方
法。
【請求項２】特性を決定するステップが、順序集合中の記号と、他の記号の関係を生成するステッ
プ（１９０、２１０）と、プロセステーブルから、受容可能記号型の記号との間で
有するべき関係を決定するステップ（２１２）とからな
ることを特徴とする請求項１の方法。
【請求項３】取得ステップの一部である検索ステップ
が、順序集合中を、決定された受容可能記号の関係に一
致する生成された関係によって特徴づけられる記号を順
に検索することを特徴とする請求項２の方法。
【請求項４】組合せステップが、文法に基づき、検索ステップおよび取得ステップの後
に、検索ステップによって発見された記号が以前に格納
された記号と組み合わせられるべきか否かを確認するス
テップ（２０３）と、確認ステップによって要求される場合に、新たな記号を
形成するように、検索ステップによって発見された記号
を以前に格納された記号と組み合わせ、新たな記号を格
納するステップ（２０４、２０５、２０６、２０９、２
１１）と、組合せステップが確認ステップによって要求されない場
合に、検索ステップによって発見された記号を格納する
ステップ（２１１）とからなることを特徴とする請求項
１の方法。
【請求項５】受容可能記号の特性を決定するステッ
プ、記号の順序集合を検索するステップ、取得ステッ
プ、検索された記号が組み合わせられるべきか否かを確
認するステップ、要求された場合に、発見された受容可
能記号を新たな記号を形成するように組み合わせ、新た
な記号を格納するステップ、および、要求されない場合
に組合せなしに発見された受容可能記号を格納するステ
ップが、全順序集合中の全記号が格納されるまで、反復
して実行されることを特徴とする請求項４の方法。
【請求項６】文法に基づいて、プロセス状態の集合を
生成するステップ（１９０）と、前記集合の半順序に基づいて、半順序集合中の各記号
と、半順序集合中の他の記号およびスタック内の記号と
の関係を生成するステップ（１９０）と、前記記号の集合が順序づけられていない場合に、記号の
順序集合を形成するために、半順序づけされた記号の集
合を順序づけるステップ（１８０）と、現プロセス状態に基づいて、受容可能記号の特性を決定
するステップ（２１２）と、記号の順序集合中で、第１の受容可能記号を検索するス
テップ（２１２）と、検索ステップによって発見された記号をスタックに格納
するステップ（２１１）と、スタックに格納された記号に基づいて、新たな現プロセ
ス状態を評価するステップ（２１１）と、受容可能記号の特性を決定するステップに復帰するステ
ップ（２１６）とからなることを特徴とする、文法の指
定に従って半順序記号の集合を解析する方法。
【請求項７】格納ステップが、組合せが文法によって
要求される場合に、検索ステップによって発見された記
号を、スタックに格納された他の記号と組み合わせるス
テップと、前記関係を補充するステップ（２０９、２１
０）からなることを特徴とする請求項６の方法。
【請求項８】文法の指定に従って、半順序づけされた
記号の集合を解析する方法において、前記集合の半順序に基づいて、半順序集合中の各記号
と、半順序集合中の他の記号およびスタック内の記号と
の関係を生成するステップ（１９０）と、文法に基づいて、プロセス状態の集合を生成し、各プロ
セス状態に対し、受容可能記号の特性を定義する項を生
成するステップ（１９０）と、前記記号の集合が順序づけられていない場合に、記号の
順序集合を形成するために、半順序づけされた記号の集
合を順序づけるステップ（１９０）と、現プロセス状態に基づいて、前記プロセス状態に属する
項を選択するステップ（２０２）と、選択された項が「シーク」または「縮約」のいずれを表
すかを判定するステップ（２０３）と、選択された項が「シーク」を表すと判定された場合、ａ）前記関係を参照して、順序集合中で受容可能記号を
検索するステップ（２１３）と、ｂ）検索ステップが失敗した場合、前記プロセス状態に
属する他の項を選択するために、項を選択するステップ
に復帰するステップと、順序集合から、検索ステップによって発見された受容可
能記号を除去するステップ（２１４）と、検索ステップによって発見された記号を、新たなプロセ
ス状態と関係づける組を形成するステップ（２１５）
と、選択された項が「縮約」を表すと判定された場合、スタックに格納された情報に基づいて、縮約が可能か否
かを判定するステップ（２０４、２０５、および２０
６）と、縮約が可能か否かを判定するステップが縮約は不可能で
あると判定した場合、前記プロセス状態に属する他の項
を選択するために、項を選択するステップに復帰するス
テップ（２１７）と、選択された記号をスタックに格納された記号と組み合わ
せるステップと、組合せステップによって作成された組み合わせられた記
号を、新たなプロセス状態と関係づける組を形成するス
テップ（２１５）と、関係の集合を補充するステップと、さらに、スタックに前記組を格納し、前記新たなプロセス状態を
現状態に割り当てるステップ（２１１）と、項を選択するステップに復帰するステップとからなるこ
とを特徴とする記号集合の解析方法。