JPH0333977A

JPH0333977A - 構文解析装置における文法誤り発見方法

Info

Publication number: JPH0333977A
Application number: JP1168051A
Authority: JP
Inventors: Masaaki Kato; 正明加藤; Yukari Sawayama; 澤山　ゆかり; Mariko Osato; 大里　真理子; Kiyouko Kai; 甲斐　郷子; Hideki Yamamoto; 秀樹山本
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1989-06-29
Filing date: 1989-06-29
Publication date: 1991-02-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野〉本発明は、自然言語で表現された入力文を構文解析した
後、その構文解析処理の出力である構文解析木にアクセ
スして、入力文の文法的な誤りを発見する構文解析装置
における文法誤り発見方法に関するものである。

（従来の技術）従来、このような分野の技術としては、特開昭６０−３
３６６３号公報（文献ｔ）に記載されるものがあった。

自然言語をコンピュータシステムで理解しようとする場
合、まず構文解析装置を用いて構文解析を行い、文の構
造を明らかにし、係り受けの状態を把握する。その後、
例えば構文解析の結果と、それぞれの語の意味情報から
、コンピュータシステムで処理しやすい形の意味表現を
生成する。

従来の構文解析の原理は、解析対象たる文の種類〈例え
ば、英語、日本語等の文の種類〉に応じて、句構造規則
を作成しておき、入力された文の各単語の組合せを旬構
造規則に当てはめることに會より、入力された文を句構造規則の組合せとして表すこ
とにより、入力された文の構造を知るものであった。

ところで、入力された文が文法的に完全に正しい文であ
れば、構文解析の結果をそのまま用いて、コンピュータ
システムで処理することができる。

しかし、入力文に文法的な誤りがある場合、前記の構文
解析の原理を単純に適用するだけでは、構文解析が不可
能となったり、あるいはその構文解析結果の信頼性が低
くなる。そのため、その構文解析の結果をコンピュータ
システムで適確に処理することが困難となる。そこで従
来から、構文解析装置における文法誤り発見方法が種々
提案されており、その−例が前記文献■に記載されてい
る。

前記文献↓の方法では、構文解析にカット（ＣＵｔ）と
称する特殊な状態遷移を導入し、バックトラックを抑制
することにより、文中の文法的な誤りを認識するもので
あった。例えば、入力した文に冠詞が現れた場合、それ
は名詞句の始まりであって、以下には必ず形容詞か名詞
のいずれかが来ると予想できるので、そこにカットをい
れてそれ以上のバックトラック（もう−度前記冠詞の前
に戻ってそこから解析をやり直すこと〉を禁止し、予想
した晶洞が現われなかった場合には、その語は誤りを含
んでいると推定できるというものである。この方法では
、バック１〜ラツクという無駄を省いて解析の効率化が
図れる。

（発明が解決しようとする課題）しかしながら、上記の方法では、文法的な間違いを発見
できるのは、カットを入れることが可能な場所について
だけである。このカットを入れられる場所は、ある条件
により、後続の品詞が決定できる場所に限られるため、
細部の間違いについては発見することができないという
問題があった。

そこでこの問題を解決するため、本願出願人らは、先に
特開平１−４５４９９号明細書く文献２〉において、次
のような提案（１）、（２）を行った。

（１〉　前記文献２に記載された文法誤り発見方法では
、構文解析を行うためのデータである句構造規則の中に
、誤った文法に対応した句構造規則を予めつけ加えてお
く。そして、構文解析を行つた結果、誤った句構造規則
が使われていれば、その句構造規則に対応する部分が誤
っているということがわかる、という方法である。

（２）　また、前記文献２には、構文解析を行いながら
、句構造規則と対で記述されている誤り発見プログラム
を実行して、文法誤りを発見する方法も記載されている
。この方法における文法誤りを発見するのに必要な情報
、及び文法誤りを発見する処理は、次のような内容とな
っている。

構文解析を行う場合、単語辞書及び文法規則を参照し、
構文解析を実行していく。単語辞書中の各単語は、見出
し語、品詞名の他に、文法誤りを発見する際に必要な情
報を持つ。また、文法規則中に設けられる各句構造規則
には、その句構造規則の適用される部分が文法的に正し
いかどうかを調べるためのルールと、その句構造規則が
適用される部分より上でないと調べられない文法誤りを
調べる時に、必要な情報を必要になる時点まで上げてい
く処理とが、プログラムの形で記述されている。そこで
、構文解析を行いながら、文法規則に記述されている処
理を実行することにより、文法誤りの発見が行われる。

ところが、前記（１）、（２＞の方法等においても、次
のような理由（Ａ＞、（Ｂ）により、技術的に十分満足
の行くものが得られなかった。

（Ａ）　　前記（１）の方法では、基本的に、句構造規
則をつけ加えることによって発見できる誤りは、語順を
誤っているものに限られ、その他の誤りについては発見
できないという問題がある。ここで、前記文献ｌと前記
文献２（１）の方法において、旬構造規則に現れる品詞
を細分化し、句構造規則の数を増やせば、それに応じて
間違いを発見できる。しかし、句構造規則の数が増える
ことにより、構文解析の処理速度が遅くなるという問題
が生ずる。

（Ｂ）　　前記文献２（２）の方法では、誤り発見プロ
グラムを実行する際に必要な情報を得るために、構文解
析木の下の方から、必要とするところまで情報を上げて
いくプログラムを、予め記述しておかなければならない
。しかし、下の木を作っている段階では、上でどのよう
に木が成長するがが判然としないため、上で必要とされ
ることが予想される情報をすべて上げることが必要であ
ったり、あるいは、チェック項目の優先順位等によって
、上げる情報を取捨選択する必要が生ずることもある。

そのため、誤りを発見するための情報を記述する人や、
誤り発見のためのルールを記述する人は、対象としてい
る文法体系全体、つまり記述されている句構造規則の一
つ一つについて、どのような文章を解析するためのもの
であるかといったことを知悉しており、さらに規則と規
則の結び付き方についても知悉していなければならない
。

さらに、発見しようとする文法誤りの項目に変更がある
と、文法に記述されている誤り発見プログラムを変更し
なければならないが、プログラム変更時に、他の誤り発
見処理に副作用（悪影響〉をおこしていないか等と、他
との整合性をチェックしながら、変更処理を行わなくて
はならない。

本発明は、前記従来技術が持っていた課題として、誤り
発見に制限を受ける点と、誤り発見プログラムの作成・
変更・修正等が容易に行なえない点について解決した、
構文解析装置における文法誤り発見方法を提供するもの
である。

（課題を解決するための手段）本発明は、前記課題を解決するために、プログラム制御
により、入力文の構文解析を行うと共に、文法誤りを発
見する構文解析装置における文法誤り発見方法において
、文法規則と、文法誤りを発見するための構文情報を含
む単語辞書とを参照して、構文解析プログラムを実行し
、前記入力文の構文を解析して構文解析木を生成し、前
記構文情報を参照して、対象とする文法チェック項目毎
の文法誤り発見プログラムを実行し、前記構文解析木に
アクセスして文法誤りを発見するようにしたものである
。

（作用〉本発明によれば、以上のように構文解析装置における文
法誤り発見方法を構成したので、構文解析処理を行ない
、その構文解析処理結果である構文解析木に基づき、入
力文の文法誤りを発見する処理を行なうことにより、構
文解析処理と文法誤り発見処理とが分離され、それによ
って文法誤り発見プログラムの作成が容易となる。文法
誤りを発見する処理は、一つ一つの文法誤り毎に、構文
解析木にアクセスして文法誤りを発見するプログラムと
して記述され、対象とする文法誤りの項目に着目して誤
り発見プログラムを作成すればよく、それによってその
プログラムの作成・変更・修正等が容易となる。従って
、前記課題を解決できるのである。

（実施例）第１図は、本発明の実施例を示す構文解析装置の要部の
機能ブロック図、及び第２図はその構文解析装置を構成
するためのコンピュータシステムの概略の構成ブロック
図である。

まず第２図のコンピュータシステムの構成を説明する。

このコンピュータシステムは、中央処理装置（以下、Ｃ
ＰＵという〉１を有し、そのＣＰＵＩには、ＣＰＵＩで
実行するプログラム等を一時格納するランダム・アクセ
ス・メモリ（以下、ＲＡＭという）等の主メモリ２と、
入力文その他必要な入力処理を行なうキーボード等の入
力装置３と、入力装設３による入力の内容その他必要な
表示を行なうＣＲＴ等のデイスプレィ４と、磁気ディス
ク５とが、接続されている。

ｃｐｕｉは、主メモリ２、入力装置３、デイスプレィ４
、及び磁気ディスク５を制御して構文解析プログラムや
誤り発見プログラム等を実行するもので、ＬＳＩ等で構
成されている。磁気ディスク５は、語い解析処理プログ
ラム、構文解析プログラム、単語辞書、文法規則、及び
誤り発見プログラム等を格納する装置である。

このコンピュータシステムでは、入力装置３から入力文
が入力されると、ＣＰＵＩは、磁気ディスク５に格納さ
れた語い解析処理プログラム、構文解析プログラム、及
び誤り発見プログラム等を主メモリ２にロードし、その
プログラムに従って、入力文を単語に分解する語い解析
処理、その処理結果に対しての構文解析処理を行なって
構文解析木を生威し、さらにその構文解析木を入力して
文法誤り発見処理を順次行なう。ここで、例えば構文解
析プログラムと誤り発見プログラムは、磁気ディスク５
から主メモリ２にロードされ実行されるが、単語辞書と
文法規則は、主メモリ２に入る場合、ロードされるが、
その主メモリ２の容量が足りない場合は磁気ディスク５
に格納されたまま使用される。このコンピュータシステ
ムで構成される構文解析装置の機能ブロック図が第１図
に示されている。

第１図の構文解析装置は、入力文を単語に分解してその
分解された単語を含む情報を出力する語い解析部１０を
有し、その語い解析部１０の出力側には、構文解析処理
部２０、及び文法誤り発見処理部３０が接続されている
。

横文解析処理部２０は、語い解析処理部１０の出力を入
力し、第２０の磁気ディスク５に格納された構文解析プ
ログラム２１．単語辞書２２及び文法規則２３に基づき
、入力文の構文を解析して）１．＋４文解析木Ｓ２０を
生成する機能を有している。

第２図の磁気ディスク５に格納された単語辞書２２及び
文法規則２３のうち、単語辞書２２には、単品（見出し
語）２２ａ、品詞２２ｂ、及び文法的な性質を表す構文
情報２２ｃが記述され、その−例が第３図に示されてい
る。

文法規則２３には、語の構造に関する句構造規則２３ａ
が記述され、その句構造規則２３ａの一例が第４図に示
されている。

また、構文解析処理部２０から出力される＋１４文解析
木Ｓ２０の一例が第５図に示されている。

第５図は、例えば”Ｉ　ａｍ　ｉｍｐｏｓｓｉｂｌｅ　
ｔｏ　ｃｏｍｅｈｅｒｅ、　”を構文解析してできる構
文解析木Ｓ２０を模式的に表した図である。この構文解
析木に現われるノード、つまり（５ｅｎｔｅｎＣｅ　）
等の品詞のうち、入力文中の各単語に対応しているもの
を終端ノードと呼び、そうでないものを非終端ノードと
呼ぶ。なお、各ノードのそばに付された０〜２０の符号
は、後述する第６図の番号２４ａである。

また、鎖線で囲まれたブロック１００，１０１は、後述
する第７図の処理ステップを表している。このような構
文解析木を表現しているデータ′！Ｒ造の一例を、第６
図に示す。

第６図のデータ構造は、番号２４ａ、品詞２４ｂ、ポイ
ンタ２４ｃ、及び構文情報２４ｄ″′Ｃ′構成され、そ
のデータ構造中の一つの構造が、それぞれ第５図に示す
構文解析水中の一つのノードに対応している。ここでは
、非終端ノードには、下のノードへのポインタ２４ｃが
与えられ、終端ノードには、第３図の単語辞書中の構文
情報２２ｃが与えられていることを示している。

第１図の構文解析処理部２０の出力側に接続された文法
誤り発見処理部３０は、第２図の磁気ディスク５に格納
された誤り発見プログラム３１に従って、構文解析木Ｓ
２０から入力文の誤りを発見する機能を有している。

以上のように構成される構文解析装置における文法誤り
発見方法等について説明する。

第２図の入力装置３を用いて、入力文、例えばｒＩ　ａ
ｍ　１ｍ１）Ｏ３Ｓｉｂｌｅ　ｔｏ　ｃｏｍｅ　ｈｅｒ
ｅ、　Ｊが入力されると、ＣＰＵＩのプログラム制御に
より、次のような処理が実行される。

即ち、第１図の語い解析処理部１０では、第２図の磁気
ディスク５に格納された語い解析処理プログラムに基づ
き、入力文を単語に分解し、その分解した単語を含む情
報を構文解析処理部２０へ送出する。

構文解析処理部２０は、第２図の磁気ディスク５に格納
された構文解析プログラム２１に従って、単語辞書２２
及び文法規則２３を参照して入力文ｒｘ　ａｍ　ｉｍｐ
ｏｓｓｉｂｌｅ　ｔｏ　Ｃｏｍｅ　ｈｅｒｅ、　Ｊの構
文解析を行ない、例えば第５図の構文解析木Ｓ２０を生
成する。この際、構文解析木の各ノードのうち、終端ノ
ードには、第３図に示す単語辞書２２中の構文情報２２
ｃを付加しておく。このようにして、構文解析処理部２
０において、例えば第６図に示すような、構文解析木を
表すデータが生成され、そのデータが文法誤り発見処理
部３０へ送られる。

文法誤り発見処理部３０では、第２図の磁気ディスク５
に格納された誤り発見プログラム３１に従って、次に述
べるような、例えば第７図の手順に従って入力文の文法
誤りを発見する。

第７図は、構文解析木Ｓ２０にアクセスして文法誤りを
発見する処理のフローチャートである。

この例では、ｒｂｅ　ｉｍｐｏｓｓｉｂｌｅ　Ｊという
表現は、主語に人をとらず、仮主語のｉｔをとることか
ら、この文が文法的に誤っているということを発見する
処理を示している。従って、ここでは例として、第５図
の構文解析木Ｓ２０にアクセスし、仮主語のｉｔを用い
るべき文において：を以外の主語が用いられている、と
いう文法上の誤りを発見する手順を、第７図のフローチ
ャートに従って以下説明する。

まず、文法誤り発見処理部３０は、第７図のステップ１
００において、ｒ　５ｅｎｔｅｎｃｅ　（文）の下の述
部に当たるＶＤ（動詞句〉には、ｂｅ（ｂｅ動詞）と人
を主語にとらない形容詞（ａｄｊ）の組み合わせが含ま
れているか？」を判断する。この際、第６図のデータ構
造中の５ｅｎｔｅｎｃｅ　（番号Ｏの文）を探してその
次のノードへのポインタ（１，２）をたどり、ｖｐ（動
詞句）を探す。ここでは、述部に当たるｖｐ（動詞句）
は、第６図の番号２に書かれているデータ（ｖｐ）に相
当する。次に、この番号２のポインタ（４，５）のうち
、ポインタ４に相当する番号４のｖｐ（動詞句〉を探す
。このようにして、探したい情報があるところまで、ポ
インタをたどっていき、必要な判断を行なう。ここでは
、第６図の番号１２と番号１８に別れているデータから
、ｂｅ（ｂｅ動詞）と主語に人をとらない形容詞（ａｄ
ｊ　）の組み合わせを含んでいることが分かる。次に、
第７図のステップ１０１へ進む。

ステップ１０１では、条件ｒ　５ｅｎｔｅｎｃｅ　（文
〉の下の主部に当たるｎｏ　（名詞句）は人であるか？
」を、ステップ１００と同様に、第５図の構文解析木の
データのポインタをたどり、必要な情報を探して判断す
る。ここでは、第６図の番号ｌ、３．６．１１と順番に
たどっていき、番号１１の構文情報から、主語が人であ
ることが分かる。そこで、この文は主語と述語の組み合
わせの点で間違っており、仮主語のｉｔについての知識
がない（あるいは不足している）ことが分かる（ステッ
プ１０２）。

一方、ステップ１００において、判断がノーのときには
、このプログラムで調べるべき文法誤りは含んでいない
という判定となる（ステップ１０３）。またステップ１
０１において、判定がノーのときには、正しいという判
定結果がでる（ステップ１０４）。

第７図の誤り発見処理では、「仮主語の誤りを発見する
。」という意図のもとだけで処理を行なうので、その処
理に必要な情報だけを探して確認すればよく、他の誤り
発見の処理については一切考慮する必要がない。また、
他の誤りについても、第７図に示すように個別の誤り発
見プログラムを必要なだけ記述すればよい。そのため、
この発見プログラムを記述する人は、構文解析木の形を
実際に見ながらプログラムを書けばよいので、文法全体
を知悉している必要もなく、比較的簡単に処理を記述す
ることができる。

以上のように、本実施例では、構文解析処理と文法誤り
発見処理とを完全に分離している。そして、文法誤り発
見処理は、一つ一つの文法誤り毎に、構文解析木Ｓ２０
にアクセスして文法誤りを発見するプログラムとして記
述することによって、入力文中の文法的な誤りを発見し
ている。そのため、次のような利点が得られる。

（ａ）　　従来のように、句構造規則の一つ一つに、構
文解析木の上の方で使われるであろう誤り発見のための
情報を選択して上げていくためのプログラム（情報と誤
りを発見するためのルール）を記述する必要がなくなる
。そのためプログラムの作成が容易になる。

（ｂ）　　従来のように、文法体系全体を知悉した人で
なくては誤り発見プログラムを書くことができない、と
いう制約がなくなり、前記（ａ）と同様にプログラムの
作成が容易になる。

（Ｃ）　　対象とする文法誤りの項目に変更があっても
、必要な文法誤り発見プログラム（例えば、第７図）を
他との整合性を気にすることなく、個別に記述すればよ
く、それによってプログラムの変更・修正が容易となる
。

（ｄ）　　必要な文法誤り発見プログラムを多数用意す
ることにより、様々な誤りを発見できる。ここで、誤り
発見プログラムの数を増やしても、構文解析処理と文法
誤り発見処理とを完全に分離しているため、その構文解
析処理速度の向上により、誤り発見プログラムの数の増
加分の処理時間の遅れを少なくすることが可能となる。

なお、本発明は図示の実施例に限定されず、例えば第１
図の機能ブロックに精度向上のための他のブロックを付
加したり、あるいはその構文解析装置を構成する第２図
のコンピュータシステムに、他の回路を付加する等、種
々の変形が可能である。

（発明の効果）以上詳細に説明したように、本発明によれば、構文解析
処理と文法誤り発見処理とを分離し、その文法誤り発見
処理では、各文法チェック項目毎に、構文解析の結果で
ある構文解析木にアクセスして文法誤りを発見するプロ
グラムとして記述されるので、文法体系全体を知悉して
いなくても、容易に諷り発見プログラムを書くことがで
きる。

しかも、文法誤り発見プログラムは、他の文法チェック
項目とは独立に記述されるため、変更・修正が容易にな
る。さらに、構文解析処理と文法誤り発見処理とを分離
したので、構文解析処理の高速化が可能となると共に、
誤り発見プログラムの数を増やすことによって様々なが
発見できる。誤り発見プログラムの増加による処理時間
の遅延は、構文解析処理の高速化によって減殺され、装
置全体の処理時間の低下を防止できる。従って、少ない
労力で、簡単かつ的確に入力文中の文法誤りを発見でき
る効果がある。

【図面の簡単な説明】

第１図は本発明の実施例を示す構文解析装置の機能ブロ
ック図、第２図は本発明の実施例を示すコンピュータシ
ステムの概略の構成ブロック図、第３図は単語辞書の例
を示す図、第４図は文法規則の例を示す図、第５図は構
文解析木の例を示す図、第６図は構文解析木のデータ構
逍関を示す図、第７図は文法誤り発見処理のフローチャ
ートである。１・・・・・・ＣＰＵ、２・・・・・・主メモリ、３・
・・・・・入力装置、４・・・・・・デイスプレィ、５
・・・・・・磁気ディスク、１０・・・・・・語い解析
処理部、２０・・・・・・構文解析処理部、２１・・・
・・・構文解析プログラム、２２・・・・・・単語辞書
、２２ａ・・・・・・単語、２２ｂ・・・・・・品詞、
２２ｃ・・・・・・構文情報、２３・・・・・・文法規
則、２３ａ・・・・・・旬ｔｌ！逍規則、３０・・・・
・・文法誤り発見処理部、３１・・・・・・誤り発見プ
ログラム、Ｓ２０・・・・・・構文解析木。

Claims

【特許請求の範囲】プログラム制御により、入力文の構文解析を行うと共に
、文法誤りを発見する構文解析装置における文法誤り発
見方法において、文法規則と、文法誤りを発見するための構文情報を含む
単語辞書とを参照して、構文解析プログラムを実行し、
前記入力文の構文を解析して構文解析木を生成し、前記構文情報を参照して、対象とする文法チェック項目
毎の文法誤り発見プログラムを実行し、前記構文解析木
にアクセスして文法誤りを発見する、ことを特徴とする構文解析装置における文法誤り発見方
法。