JPH05189242A

JPH05189242A - パーサ自動生成方法

Info

Publication number: JPH05189242A
Application number: JP275192A
Authority: JP
Inventors: Yoshima Ikeuchi; 義真池内; Noriyasu Mori; 教安森
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-01-10
Filing date: 1992-01-10
Publication date: 1993-07-30

Abstract

(57)【要約】【構成】計算機システム２０１は、システムバス２１０
に接続されたＣＰＵ202,主記憶装置２０３，入出力装置
２０７よりなる。入出力装置２０７は外部記憶装置２１
１に接続され、外部記憶装置には、本システムの入力と
なる文法データ２０８および本システムの出力となるＬ
Ｒパーサ２０９が格納され、主記憶装置には、ＬＲパー
サ生成プログラム２０４が格納され、ＣＰＵはこのＬＲ
パーサ生成プログラムを実行して目的のＬＲパーサを生
成する。主記憶装置内には、文法データ格納テーブル２
０５および作業用データ領域２０６があり、ＬＲパーサ
生成プログラムにより使用される。【効果】文法中にコンフリクトが含まれる場合、コンフ
リクトを解消しないままでも正しくパージングを行うパ
ーサを自動生成することができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はプログラムを自動生成す
る方法に係り、特に、パーサを自動生成する方法に関す
る。

【０００２】

【従来の技術】ユーザが入力したデータを受け取り、そ
のデータに基づいて処理を行うプログラムは、まず、入
力されたデータが所定の形式、即ち、構文に従っている
かを解析しなければならない。例えば、コンパイラは、
入力されたプログラムが、そのプログラミング言語の定
める構文（文法）に従っているかどうかをまず解析す
る。このような解析を構文解析またはパージング(parsi
ng）とよび、これを行うプログラムを構文解析プログラ
ムまたはパーサ（parser）と呼ぶ。

【０００３】一方、入力データの構文を形式的（数学
的）に定義する方法として、バッカス記法（ＢＮＦ）と
いうものが知られている。バッカス記法は、実は文脈自
由文法（context free grammar）と呼ばれる文法の記法
とほとんど等しい。文脈自由文法は、非終端記号の集
合，終端記号の集合，生成規則の集合、および開始記号
と呼ばれる特別な非終端記号、の四組により定義され
る。

【０００４】生成規則（production）はどれもＡ → α の形をしている。Ａは非終端記号、αは非終端記号また
は終端記号の０個以上の列であり、その直感的な意味
は、「Ａは、αという記号列から構成される」というこ
とである。また、Ａ → α Ａ → β Ａ → γ のような、左辺が同一であるような一連の生成規則は、Ａ → α｜β｜γ と略記される。例えば、符号付きの数の構文は次のよう
に定義できる。

【０００５】数 → 符号数字列符号 → ＋｜− 数字列 → 数字数字列数字 → １｜２｜３｜４｜５｜６｜７｜８｜９｜０ここで、数，符号，数字列，数字のように、生成規則の
左辺に現れる記号を非終端記号（nonterminal）、そう
でない記号（＋，−，１，２，…）を終端記号（termin
al）と呼ぶ。また、数のような、その文法で一番大きな
構文要素を表す記号を開始記号（start symbol）と呼
ぶ。

【０００６】入力データの構文を、文脈自由文法を用い
て定義すれば、その入力データに対するパーサを、文法
から自動的に生成することができることが一般に知られ
ている。そのなかで特にＬＬまたはＬＲ構文解析法に基
づくパーサ（以降、単にＬＬパーサ，ＬＲパーサと呼
ぶ）を生成する方法が有名である。ＬＬおよびＬＲ構文
解析法、およびそのパーサを生成する方法についてはエ
イホ，ウルマン共著「コンパイラ」（１９８６年、培風
館発行）第１６３頁から第２１７頁に記載がある。

【０００７】ＬＬまたはＬＲパーサは、決定性のプッシ
ュダウン・オートマトン、即ち、スタックを備えた決定
性有限状態オートマトンとして動作する。オートマトン
については前述の文献の第８０頁から第８６頁に記載が
ある。オートマトンは、現在の状態と次の入力記号によ
って次にとるべきアクションを決定する（状態遷移もア
クションの一つと考える）。例えば、ＬＲパーサであれ
ば、行うアクションは、入力記号をシフト(shift）する
か、ある生成規則でリデュース(reduce、還元)するか、
である。

【０００８】ＬＬまたはＬＲパーサの生成方法は、全て
の文脈自由文法に対して適用できるのではなく、それぞ
れ適用できる文法について制限がある。この制限を越え
た文法に対してパーサを生成しようとした場合は、コン
フリクトという状況が起こる。

【０００９】コンフリクトとは、オートマトンを考えた
ときに、現在の状態と入力記号から次のアクションが一
意に決定できない状況のことをさす。すなわち、行える
アクションが複数存在している状況である。制限を越え
た文法からオートマトンを生成しようとしたときには、
次のアクションが一意に決まらないような、状態と入力
記号の対が存在することになる。

【００１０】プログラミング言語等の構文をＢＮＦすな
わち文脈自由文法を用いて記述した場合、その文法にコ
ンフリクトが生じることがしばしば起こる。しかし、そ
のようなコンフリクトを生じる場合でも、競合している
アクションの中のどれか一つのアクションを行うように
しておけば、そのようにして生成されたパーサは、文法
を記述した人の意図しているのと同じ動作をすることが
多い。

【００１１】そこで、文法を入力とし、パーサの生成を
計算機を用いて自動的に行うシステム（パーサ・ジェネ
レータと呼ばれる）では、文法にコンフリクトがあった
場合にも、競合しているアクションの中からある規則に
よって一つのアクションを選択することによって行うア
クションを一意に決定している（これを、コンフリクト
の解消と呼ぶ）ことが多い。

【００１２】

【発明が解決しようとする課題】従来のパーサ・ジェネ
レータでは、入力された文法にコンフリクトが生じたと
き、それを人手によってコンフリクトの生じない文法に
書き替えてやらなければならなかった。しかし、この作
業は通常多大な労力を必要とする。例えば、次のような
文法が与えられたとする。

【００１３】（ここで、「文字列」が終端記号である。）この時、入
力記号が「今富利久登沖田」であった場合のパーサ
の動作を考える。

【００１４】まず、パーサは「今富」を読み込み「姓」
に還元する。この時点でパーサは、「姓」を「名前」に
還元するべきか、次の入力を待つべきかが判断できな
い。このような二つの合法的な操作がある場合、パーサ
のとるべき道をどちらかに決定する方法はないので、構
文則作成者の意思と違うアクションをとることがよくあ
る。そういう場合の解析結果は、アクション候補のない
状態に来る可能性が高い。この例の場合、「姓」を「名」
として還元せずにシフトすると、入力が「今富利久登」
となったときに、「名前」に還元される。そして次に
「沖田」が入力されると「姓」に還元されるが、次の入
力はないので、「姓」は「名前」に還元される。そし
て、採るべき動作がなくなって、構文に間違いがないに
もかかわらず、曖昧さがあるために構文解析は失敗して
しまう。

【００１５】本発明の目的は曖昧さのある文法であって
も構文解析が正しく行われるパーサ自動生成方法を提供
することにある。

【００１６】

【課題を解決するための手段】本発明では、入出力装置
および記憶装置が接続された計算機を用い、ＬＬもしく
はＬＲパーサのような、現在の内部状態と終端記号に基
づいて次のアクションを決定するオートマトンとして動
作するパーサを生成する方法が与えられる。

【００１７】本方法では、まず入力装置から文法データ
を入力し、これを前記記憶装置に記憶蓄積する。このと
きの文法データには、バックトラックするか否か、及
び、バックトラックする位置を指示する情報を含んでい
る。次に記憶蓄積された文法データをもとにＬＬまたは
ＬＲパーサにおける内部状態集合を生成する。次にその
内部状態と終端記号の各々の対に対して、行われるアク
ションの候補を生成する。そして、アクション候補が複
数ある場合、すなわち、コンフリクトが生じた場合に
は、一定の基準によって次のアクションを決定する。も
し、パージング時に、アクション候補がない状態に来て
しまった場合、一番最近の、アクション候補が複数あっ
て、かつ、バックトラック指定されている状態まで戻っ
て、以前にとられていないアクションの中から、一定の
基準によって次のアクションを決定し、そこからパージ
ングをやり直す。

【００１８】パージング時に、アクション候補がない状
態に来てしまった場合、どの状態からパージングをやり
直すかは、ユーザが、バックトラック位置を文法データ
の一部として記述することにより決定する。

【００１９】なお、ユーザは、入力した文法にコンフリ
クトが含まれているのは最初は分からないのが、普通で
ある。従って、上記の情報（バックトラック位置の指
定）は、一般的には、コンフリクトがあることがわかっ
た後で、文法データにつけ加えればよいようにしてお
く。

【００２０】

【作用】次の文法が与えられたとする。

【００２１】（ここで、「文字列」が終端記号である。）この時、入
力記号が「今富利久登沖田」であった場合の本発明
のパーサの動作を考える。

【００２２】まず、パーサは「今富」を読み込み「姓」
に還元する。この時点でパーサは、「姓」を「名前」に
還元するべきか、次の入力を待つべきかが判断できな
い。そこでシフトしたとすると、入力が「今富利久
登」となったときに、「名前」に還元される。そして次
に「沖田」が入力されると「姓」に還元されるが、次の
入力は無いので、「姓」は「名前」に還元される。そし
て、とるべき動作が無くなってしまう。従来、この時点
で、構文解析は失敗したということになるが、本発明で
は、このアクション候補がない状態に来た時点で、一番
最近コンフリクトが起こった状態（「姓」を「名前」に
還元するか、シフトするか）に戻り、まだ選ばれていな
いアクション（「姓」を「名前」に還元）を選びなおし
てパージングを再開する。その結果、次の入力「利久
登」は、「姓」に還元され、「沖田」は、「名」に還元
される。その結果、「今富利久登沖田」は「名前」
「姓」「名」と解釈されて「名前リスト」に還元され、
パージングは成功する。

【００２３】本発明では、パージング時にアクション候
補がない状態に来た場合、直前のコンフリクトが起こっ
た位置から、パージングをやりなおすようなパーサを生
成することができる。

【００２４】また、バックトラック位置の指定があった
場合は、指定がある位置からだけ、パージングをやり直
すようなパーサを生成することができる。

【００２５】

【実施例】以下、本発明の一実施例を図面を用いて説明
する。

【００２６】図２は、本発明に基づくＬＲパーサ・ジェ
ネレータを実現する計算機システムの構成図である。本
実施例の計算機システム２０１は、システムバス２１０
に接続されたＣＰＵ２０２，主記憶装置２０３，入出力
装置２０７より構成される。また、入出力装置２０７は
外部記憶装置２１１に接続されている。外部記憶装置に
は、本システムの入力となる文法データ２０８および本
システムの出力となるＬＲパーサ２０９が格納される。
主記憶装置には、ＬＲパーサ生成プログラム２０４が格
納されており、ＣＰＵはこのＬＲパーサ生成プログラム
を実行することにより、目的のＬＲパーサを生成する。
主記憶装置内にはまた、文法データ格納テーブル２０
５、および作業用データ領域２０６があり、ＬＲパーサ
生成プログラムにより使用される。

【００２７】図１は、ＬＲパーサ生成プログラムの処理
の大まかな流れの一例を示すフローチャートである。ま
ず、ステップ１０１で文法データ２０８を読み込み、そ
れを文法データ格納テーブル２０５に格納する。次に格
納されたデータをもとにＬＲ状態集合を生成する（ステ
ップ１０２）。次にＬＲ状態と終端記号の対にたいして
アクションの候補を求める（ステップ１０３）。そして
求められたアクションの候補数が１であるかどうかを調
べ（ステップ１０４）、１であればその候補を最終的な
アクションとして登録する（ステップ１０５）。アクシ
ョン候補数が１でなければ、０であるかどうかを調べ
（１０６）、０であれば動的に一番最近登録されたバッ
クトラック位置のアクション候補の中から一つをアクシ
ョンとして登録する（ステップ１０７）。アクション候
補数が複数であれば、バックトラック指示情報があるか
どうかを調べ（１０８）、なければ動的解消をアクショ
ンとして登録し（１１１）、あればそのアクションにバ
ックトラック位置指定情報があるかどうかを調べ（１０
９）、なければ動的解消をアクションとして登録し（１
１１）、あればバックトラック先の位置としてＬＲ状態
と終端記号の対をバックトラック位置格納テーブルに登
録し（ステップ１１０）、次にとるアクションを動的に
決定することをアクションとして登録する（ステップ１
１１）。次に、ステップ１１２で、処理すべきＬＲ状態
と終端記号の対がまだ残っているかどうかを調べ、残っ
ていればステップ１０３から繰り返す。残っていなけれ
ばＬＲパーサとコンフリクト情報を出力し（ステップ１
１３，１１４）、処理を終了する。

【００２８】図３は、本パーサ・ジェネレータへの入力
となる文法データの一例を示したものである。なお、本
実施例の以降の説明はすべてこのデータをもとに行う。
文法データは、バックトラックの指定，バックトラック
する位置の指定，終端記号の指定，開始記号の指定、お
よび生成規則の指定の三つの部分からなる。

【００２９】３０１はバックトラックを行うという指定
である。３０２はバックトラックする位置の指定で、状
態番号５がアクション候補として上がった場合、その位
置へバックトラックを行うことの指定である。この番号
は、パーサ・ジェネレータの出力するコンフリクト情報
を参照して指定する。３０３は終端記号の指定であり、
ＩＤ，ＮＵＭＢＥＲ，‘：＝’，‘（’，‘）’が終端
記号であることを示している。３０４は開始記号の指定
であり、stmtが開始記号であることを示している。３０
５はそれより後の部分（３０６から３１２）に生成規則
が書いてあることを示している。

【００３０】３０６から３１２は生成規則の指定であ
り、３０６はproc_name(非終端記号),‘（’（終端記
号），exp（非終端記号），‘）’(終端記号）の順に来
たときstmtに還元することを示している。３０７はvar
(非終端記号）、‘：＝’（終端記号），exp(非終端記
号）の順に来たときstmtに還元することを示している。

【００３１】３０８はＩＤ(終端記号）が来たときproc_
nameに還元することを示している。

【００３２】３０９はＮＵＭＢＥＲ(終端記号）が来た
ときexpに還元することを示している。３１０はvar（非
終端記号）が来たときexpに還元することを示してい
る。３１１はＩＤ(終端記号）が来たときvarに還元する
ことを示している。３１２はＩＤ（終端記号），‘（’
（終端記号），exp(非終端記号），‘）’（終端記号）
の順に来たときvar に還元することを示している。

【００３３】この構文は曖昧であるので、コンフリクト
情報がファイルに出力される。図４は、コンフリクト情
報を示したものである。終端記号が‘（’で（４０
６）、proc_name −＞ＩＤ．，var −＞ＩＤ
．，var −＞ＩＤ．‘（’ exp ‘）’ の３
つのアクションがアクション候補として上がった状態の
とき（４０３，４０４，４０５）、コンフリクトが起こ
ることを示している。また、４０２のstate ５はこの状
態の状態番号は５であるということを示している。図３
のバックトラック位置指定情報（３０２）は、この状態
番号で指定してある。従来のパーサ・ジェネレータで
は、これを曖昧さのない構文に書き直したものを入力に
しなければならない。

【００３４】図３の文法データを曖昧さのない構文に書
き直したものを図５に示す。この文法データは、一般に
使用されるものと比べてかなり小さいので、コンフリク
トが簡単に解消されているが、一般の言語で使用される
ような大きさの文法では、コンフリクトを解消すること
は大変難しい作業である。

【００３５】図６，図７は、文法データ格納テーブル２
０５の一構成例を示す図である。本テーブルは図１のス
テップ１０１の処理により作成される。文法データ格納
テーブルはシンボルテーブル（図６）と生成規則テーブ
ル（図７）よりなる。シンボルテーブルは文法中に出現
する各記号（終端／非終端記号）について、その綴り６
０１，記号コード６０２，終端／非終端の区別を表す情
報６０３を格納する。記号コードは各記号を一意に識別
するために本システムがつける番号である（文法データ
中の出現順に１からつける）。終端／非終端の区別を表
す情報は、Ｔが終端記号を、Ｎが非終端記号を表してい
る。

【００３６】生成規則テーブルは各生成規則について、
その生成規則コード７０１，生成規則の両辺の記号列７
０２を格納している。生成規則コードは各生成規則を一
意に識別するために本システムが付ける番号である。生
成規則両辺の記号列はその生成規則を構成する記号のコ
ードを左辺から右辺の順に並べたものである。右辺の終
わりは終了コード０によって識別する。

【００３７】図６に示したテーブルには、入力した文法
データにはない記号「Ｓ」と「＄」、および生成規則
「Ｓ −＞ stmt ＄」が含まれている。記号Ｓは拡張開
始記号、＄は終了記号と呼ばれ、また、もとの文法の開
始記号をｓとしたとき、生成規則「Ｓ −＞ｓ＄」は
拡張生成規則と呼ばれている。一般にＬＲ構文解析手法
では、対象となる文法に上記の記号と拡張生成規則を加
えて拡張文法(augmentedgrammar)を作り、その文法をも
とにパーサを生成する。本実施例でも、文法データを入
力した後、テーブルに以上の記号と生成規則をさらにつ
け加えることによって、拡張文法を生成している。

【００３８】次に、図１のステップ１０２で行われる、
ＬＲ状態集合の生成についてさらに詳しく説明する。本
実施例で生成するのは、ＬＲパーサのなかでも、特にＳ
ＬＲ（１）パーサと呼ばれるものである（もちろん本発
明はこれに限定されるものではない）。ＳＬＲ（１）パ
ーサでのＬＲ状態はＬＲ（０）項の集合として定義され
る。ＬＲ（０）項とは、生成規則の右辺のいずれかの位
置にドット（・）を付加したものである。例えば「Ａ
−＞ＸＹＺ」という生成規則からは次の四つのＬ
Ｒ（０）項が得られる（以降、ＬＲ（０）項のことを単
に項と呼ぶ）。

【００３９】Ａ −＞・ＸＹＺＡ −＞Ｘ・ＹＺＡ −＞ＸＹ・ＺＡ −＞ＸＹＺ・項は構文解析のある時点で、生成規則のどの部分までを
既に見たか（ドットの部分まで見た）を示している。

【００４０】項は、計算機内部では、生成規則コード
と、ドットの位置を表わす整数の対として表現できる。
また、項の集合はこれらの対をリスト（ポインタ）でつ
なげることによって表現できる。これを示したのが図
８，図９である。

【００４１】図９に示すような、三つの項（９０１〜９
０３）からなるＬＲ状態があるとき、この項の集合は図
８に示すデータ構造により表現できる。ここで、８０１
は項「proc_name −＞ＩＤ・」を、８０２は項「va
r −＞ＩＤ・」を、803は項「var −＞ＩＤ・
‘（’ exp‘）’」を表している。そして、８０４が生
成規則コードを、８０５がドットの位置を表わしてい
る。また８０６が、その次の項を表わすデータへのポイ
ンタである。ドットの位置は、それが右辺の左端にある
とき０、それから一つ右にずれるごとに１を加えた数値
で表されている。

【００４２】図１０は、拡張文法からＬＲ状態集合を生
成する処理、すなわち図１ステップ１０２の処理をさら
に詳しく説明したフローチャートである。まず、ステッ
プ１００１で状態の集合Ｔを空集合にセットする。次
に、拡張生成規則に基づく項「Ｓ −＞・ｓ＄」の
閉包(closure）を計算し、それを最初のＬＲ状態として
登録する（ステップ１００２）。閉包の定義およびその
計算方法については、前述の文献の１８２頁に記載があ
る。次に、いま登録したＬＲ状態を集合Ｔに加える（ス
テップ１００３）。そしてＴが空集合であるかどうかを
調べ（ステップ１００４）、そうであれば終了する（終
了した時点で登録されているＬＲ状態をすべて集めたも
のが求めるＬＲ状態集合である）。Ｔが空集合でない場
合は、Ｔから状態を一つ取り出し、それをｔとする（ス
テップ１００５）（このときｔはＴからは取り除く）。
そして記号集合Ｘを、拡張文法に現れるすべての記号の
集合にセットする（ステップ１００６）。次にＸが空集
合であるかを調べ（ステップ１００７）、そうであれば
ステップ１００４に進む。そうでなければＸから記号を
一つ取り出し、それをｘとする（ステップ１００７）
（この時ｘはＸからは取り除く）。次に関数ＧＯＴＯ
（ｔ，ｘ）の値を計算する(ステップ１００９)。ＧＯＴ
Ｏ関数の値の計算方法については上記文献の１８３頁に
記載がある。次にいま計算したＧＯＴＯ（ｔ，ｘ）がＴ
に含まれるかを調べ(ステップ１０１０)、含まれている
場合はステップ１００７に進む。含まれていない場合は
それを新たなＬＲ状態として登録する（ステップ１０１
１）とともに、集合Ｔにくわえ（ステップ１０１２）、
そしてステップ１００７に進む。

【００４３】図１１，図１２，図１３，図１４は、図１
０のフローチャートに従って図３の文法のＬＲ状態集合
を求めた結果である。図１１，図１２，図１３，図１４
において、「：」の左側の数字は各状態を一意に識別す
るための番号（状態番号）である。「：」の右側には同
様の状態（ドットの位置まで見た状態）を構成する項の
集合が示されている（項は一行に一つずつ書かれてい
る）。例えば、状態１は、まだ何も見ていない状態で、
「Ｓ −＞・ stmt ＄」以下六つの項からなることが
わかる。状態２は、var まで見た状態で、同様の状態は
他にないので「stmt −＞ var・‘：＝’exp」の一つ
の項からなる。同様に、全ての状態を示した（状態１６
まである）。

【００４４】図１５は、あるＬＲ状態と終端記号の対に
対応するアクションを求める処理、すなわち図１のステ
ップ１０３の処理をさらに詳しく説明したフローチャー
トである。このフローチャートは、状態がｓ，入力（終
端）記号がａであるときのアクションの候補を求めるも
のである。本パーサ・ジェネレータが生成するのはＬＲ
パーサであるので、ここで求められるアクションの候補
は、「シフト」，「リデュースｐ」（ｐは生成規則），
「アクセプト」のいずれかである。これらのアクション
の詳しい意味については、前述の文献の１７６頁から１
７７頁に記載がある。まず、ステップ１５０１で、ｓ中
に「Ａ −＞ α ・ａ β」という項が存在するかを
調べる。ここでＡは任意の非終端記号、αおよびβは空
列を含む任意の記号列である。存在する場合はａが＄で
あるかを調べ(ステップ1502)、そうであれば「アクセプ
ト」をアクション候補の一つとして登録する（ステップ
１５０３）。＄でない場合は「シフト」を登録する（ス
テップ１５０４）。いずれの場合も次にステップ１５０
５に進む。ステップ１５０５では、ｓ中に「Ａ−＞ α
・」という項が存在し、かつａがＡの後続集合（Follo
w（Ａ)）に含まれているかどうかを調べる。後続集合の
定義（算出方法）は前述の文献の166頁から１６７頁に
記載がされている。そうである場合には「リデュース
ｐ」（ｐは「Ａ −＞ α」の生成規則コード、図５参
照）をアクション候補として登録する（ステップ１５０
６）。

【００４５】図１６は、図１５のフローチャートに従っ
て、図３の文法の、各ＬＲ状態と終端記号の対に対して
求められるアクション候補を表の形で示したものであ
る。表の縦軸にはＬＲ状態番号（図１１，図１２，図１
３，図１４の「：」の左に書かれている番号）が、横軸
には終端記号がとられている。例えば、１６０１は、状
態１で入力記号がＩＤであるときのアクションの候補は
「シフト」であることを示している。この図より、状態
番号が５で、入力記号が‘（’であるとき（1602で示さ
れるエントリ）を除いて、アクション候補の数は、１か
０であることがわかる。

【００４６】図１７は、図１のフローチャートのステッ
プ１０４からステップ１０９に従って、各ＬＲ状態と終
端記号の対にたいして得られる最終的なアクションを示
したものであり、図１６の各エントリと一対一に対応し
ている。アクション候補数が１のものは図１のステップ
１０４およびステップ１０５に従って、その候補が最終
的なアクションになっている。アクション候補数が０の
ものは、一番最近バックトラック位置格納テーブルに格
納されたＬＲ状態と終端記号の「まだ選ばれていないア
クションをアクション候補とする」というアクション
（１７０１）をいれる。１７０１のようなアクションを
「ＢＴ（バックトラック）設定」とここでは読んでい
る。一方、［状態５，‘（’］に対応するエントリには
もともと「シフト」と「リデュース３」の二つのアクシ
ョン候補が入っていたが（即ち、コンフリクトが生じて
いる）、ここには、「アクション候補の中から一つを動
的に選んで実行する」というアクション（１７０２）を
いれる。これと同時にこのときのＬＲ状態と終端記号を
バックトラック位置格納テーブルに格納する。１７０２
のようなアクションを「競合解消(conflict resolutio
n）」とここでは呼んでいる。競合解消の次の数字は、
異なる競合解消アクションを識別するためのもの（競合
解消アクション識別コード）である。このコードは１か
ら順につけられている（この例では一つしかない）。

【００４７】図１８は、各競合解消アクションについ
て、さらに詳しい情報を納めたテーブルである。本テー
ブルには、各競合解消アクションについて、競合解消ア
クション識別コード１８０１，競合しているアクション
の数１８０２，その中で未実行のものの数１８０３，そ
の内容１８０４が格納されている。競合しているアクシ
ョンの内容は、アクションと、そのアクションが行われ
たかどうかを示すフラグよりなる。本テーブルではアク
ションが上段に、フラグが下段に記述されている。本テ
ーブルの中味を、生成されるＬＲパーサといっしょに
（パーサの一部として）出力し、パージング時にパーサ
から参照できるようにしておけば、そのパーサはコンフ
リクトがある場合まだ選ばれていないアクションを動的
に選ぶことができるようになる。

【００４８】図１９は、パージング時にアクション候補
が複数あった場合に、そのＬＡ状態番号１９０１と終端
記号１９０２をスタック方法で格納したバックトラック
位置格納テーブルである。パージングにアクション候補
のない状態に来た場合に、このテーブルの一番上にある
状態を次のアクション候補とする。

【００４９】図２０，図２１，図２２は生成されるパー
サプログラムの一例を示したものである。このプログラ
ムはＣ言語で記述されている。Ｃ言語の詳細な説明は、
例えばカーニハン他著「プログラミング言語Ｃ」（１９
８１年、共立出版社）に記載されている。

【００５０】図２０において、（１）〜（９）は定数名
の定義である。本パーサプログラムでは、アクション
は、例えば、シフトは０というように、整数値としてコ
ード化されている。（３）〜（９）はそれらアクション
コードの定義である。（１１）〜（５５）はパーサの本
体となる関数parse（）の定義である。(１３)〜(１５)
は変数の宣言で、それぞれここで初期化されている。do
neはループ制御用の、ｔは入力記号用の、ｓは状態番号
用の変数である。(１４)で使われているgettoken（）は
次の入力記号を取り出す関数である。パーサは次のよう
に動作する。まず（１７）で状態番号を、関数push（）
を用いてスタックにプッシュする。次に、doneがＦＡＬ
ＳＥの間、（１８）〜（５４）のあいだをくりかえす。
（１９）では関数pop（）によりスタックのトップを取
り出しそれをｓに代入する。(２０）では関数actio
n（）により状態ｓ，入力記号ｔのときのアクションコ
ードを求め、その値によって分岐をする。

【００５１】アクションコードがＥＲＲＯＲの時（２
１）は、エラー処理ルーチンerrorhandle（）を呼び出
す。アクションコードがＡＣＣＥＰＴの時（２４）はdo
neをＴＲＵＥにする。

【００５２】アクションコードがＳＨＩＦＴの時（２
７）は関数ＧＯＴＯ（ｓ，ｔ）により次に遷移する状態
番号を求め、これをスタックにプッシュし、さらに次の
入力記号をｔにセットする。アクションコードがＲＥＤ
ＵＣＥ１である時（３１）は、一番の生成規則の右辺の
長さ分、すなわち、四つ分だけスタックをポップし、そ
こでトップになった状態と、左辺の記号コード、すなわ
ち３とから次の状態番号をＧＯＴＯ（）を使って求め、
それをプッシュする。アクションコードが他のリデュー
スの時（３５）〜（４３）も同様である。

【００５３】アクションコードがＣＯＮＦＬＩＣＴ１の
時（４４）は、まず、関数BackTrackInfo（）により、
バックトラック指示情報があるかどうかを調べる（４
５）。あればこの関数はＴＲＵＥを返す。そのときはさ
らに、BackTrackPosiInfo（ｓ，ｔ）により、現在の
状態(入力記号と状態番号）がバックトラック位置とし
て指定されているかどうかを調べる（４６）。指定され
ていれば、現在の状態をバックトラック位置格納テーブ
ル（図１９）に格納する関数setBackTrackTbl（）をコ
ール(４７）した後、コンフリクトを解消する関数confl
ictResolution（）（４８）をコールし次の動作を決め
る。バックトラック指示情報またはバックトラック位置
指定情報がない場合はバックトラック位置格納テーブル
に格納せずにそのまま次の動作を決める。関数conflict
Resolution（）は、現在の状態（入力記号と状態番号）
を受け取り、競合解消アクション情報テーブル（図１
８）を見て、競合しているアクションのうち、未使用の
アクションの中から一つを次のアクションとして返し、
その返したアクションのアクションが行われたかどうか
を示すフラグ（１８０４）をＯＮ（使用）にし、未使用
競合アクションの数（１８０３）を１減らす。

【００５４】アクションコードがSET_BACKTRACK のとき
（５０）は、バックトラック位置格納テーブルのトップ
にある（スタック形式で格納してある）状態（入力記号
（topBtTblS（））と状態番号（topBtTblT（）））から
次の状態番号をconflictResolution（）を使って求め、
それをプッシュする。バックトラック位置格納テーブル
に何も入ってない場合は、topBtTblS（），topBtTbl
T（）ともに−１を返し、conflictResolution（）はそ
れらを引数に取った場合、次の状態をＥＲＲＯＲとして
返す。

【００５５】

【発明の効果】本発明によれば、文法中にコンフリクト
が含まれている場合に、コンフリクトを解消しないまま
でも正しくパージングを行うようなパーサを自動生成す
ることができる。

【図面の簡単な説明】

【図１】ＬＲパーサ生成プログラムの処理の大まかな流
れの一例を示すフローチャート。

【図２】本発明に基づくＬＲパーサ・ジェネレータを実
現する計算機システムのブロック図。

【図３】本パーサ・ジェネレータへの入力となる文法デ
ータの一例を示す説明図。

【図４】図３の入力に対する本パーサ・ジェネレータの
出力するコンフリクト情報を示す説明図。

【図５】図３の文法データを曖昧さのない文法データに
書き換えた説明図。

【図６】文法データ格納テーブル（シンボルテーブル）
の一構成例を示す説明図。

【図７】文法データ格納テーブル（生成規則テーブル）
の一構成例を示す説明図。

【図８】項の集合を計算機内部で表現する場合のデータ
構造の例を示すブロック図。

【図９】項の集合を一例を示す説明図。

【図１０】拡張文法からＬＲ状態集合を生成する処理の
フローチャート。

【図１１】図３の文法のＬＲ状態集合を示す説明図。

【図１２】図３の文法のＬＲ状態集合を示す説明図。

【図１３】図３の文法のＬＲ状態集合を示す説明図。

【図１４】図３の文法のＬＲ状態集合を示す説明図。

【図１５】あるＬＲ状態と終端記号の対に対応するアク
ションの候補を求める処理のフローチャート。

【図１６】図３の文法の、各ＬＲ状態と終端記号の対に
対して求められるアクションの候補を示す説明図。

【図１７】図３の文法の、各ＬＲ状態と終端記号の対に
対して求められる最終的なアクションを示す説明図。

【図１８】各競合解消アクションについての情報を納め
たテーブルの例を示す説明図。

【図１９】バックトラックの戻り先の情報を納めたテー
ブルの例を示す説明図。

【図２０】生成されるパーサプログラムの一例を示す説
明図。

【図２１】生成されるパーサプログラムの一例を示す説
明図。

【図２２】生成されるパーサプログラムの一例を示す説
明図。

【符号の説明】

２０２…ＣＰＵ、２０３…主記憶装置、２０４…ＬＲパ
ーサ生成プログラム、２０５…文法データ格納テーブ
ル、２０７…入出力装置、２０８…文法データ、２０９
…ＬＲパーサ、２１０…システムバス。

Claims

【特許請求の範囲】

【請求項１】構文則上で解析がどこまで進んだかを示す
内部状態と、入力記号とに基づいて次にとるアクション
を決定して動作するパーサを、入出力装置および記憶装
置が接続された計算機を用いて自動生成する方法であっ
て、前記入力装置から文法データを入力し、これを前記記憶
装置に記憶蓄積するステップと、前記内部状態集合を生成するステップと、前記内部状態と終端記号の各々の対に対して、行われる
アクションの候補を生成するステップと、前記アクション候補から次にとるアクションを選択する
ステップとからなり、次にとるアクションを選択するス
テップは、(a）前記アクション候補が複数ある場合に
は、そのときの前記内部状態と前記終端記号の対をバッ
クトラック位置として前記記憶装置に動的に記憶蓄積
し、まだ選ばれていないアクションの中から、次にとる
アクションを動的に決定する(b）前記アクション候補が
一つの場合には、それを次にとるアクションとする(c）
前記アクション候補が無い場合には、一番最近記憶され
た前記バックトラック位置を次のアクション候補とする
ことを特徴とするパーサ自動生成方法。
【請求項２】請求項１において、前記文法データは、バ
ックトラックするか否かを指示するバックトラック指示
情報を含み、前記バックトラック指示情報に基づいて、
バックトラックするパーサを生成するか否かを決定する
パーサ自動生成方法。
【請求項３】請求項１において、前記文法データは、バ
ックトラックする位置を指定するバックトラック位置指
定情報を含み、前記バックトラック位置指定情報に基づ
いて、バックトラックする位置を決定するパーサ自動生
成方法。
【請求項４】請求項２で示した前記バックトラック指示
情報、及び、請求項３で示した前記バックトラック位置
指定情報の両方に基づいて、バックトラックするパーサ
を生成するか否か、及び、バックトラックする位置を決
定するパーサ自動生成方法。
【請求項５】請求項１において、前記アクション候補が
複数ある場合に、まだ選ばれていないアクションがない
場合、その状態から見て一番最近記憶された前記バック
トラック位置を次にとるアクション候補とするステップ
をもったパーサ自動生成方法。
【請求項６】請求項２において、パーサを生成する際
に、前記アクション候補数が複数の状態があった場合、
前記内部状態と終端記号の対すべてを、コンフリクト情
報としてファイルに出力し、それを見てバックトラック
位置を指定するパーサ自動生成方法。
【請求項７】文法Ｌの範囲で構文解析を行うことの出来
るパーサを、自動生成することの出来るパーサ自動生成
方法を使って、バックトラックの機能を付け加えること
によって、文法Ｌを含むことのできるより広い文法Ｌ′
の範囲で構文解析を行うことを特徴とするパーサ自動生
成方法。