JP2989823B2

JP2989823B2 - 文型認識方法

Info

Publication number: JP2989823B2
Application number: JP63015124A
Authority: JP
Inventors: 博末松
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1988-01-25
Filing date: 1988-01-25
Publication date: 1999-12-13
Anticipated expiration: 2014-12-13
Also published as: JPH01189767A

Description

【発明の詳細な説明】（産業上の利用分野）本発明は文並列認識方法に関するものである。

（従来の技術）従来の文型認識方式としては以下に述べる２つのもの
が知られている。１つの方式では、入力文における用言
が取り得る文型の中から一つをその用言の文型であると
仮定し、その仮定のもとで、該入力文の解析を進めてい
る。そして現れるべき文型構成要素が出現しないこと等
により解析失敗が検出された段階で、バックトラックし
て他の文型を一つ選び、失敗が検出されない文型が得ら
れるまでこの処理を繰り返し、失敗が検出されなかった
文型を該入力文の用言の文型と認定している。

また別の方式では、入力文における用言の取り得る全
ての文型を行として並列表現し、かつ、その構成文法格
をスロット条件として表現したテーブルを用意する。そ
して該入力文中における文型構成要素の候補の素性を、
ある文型が持つ全スロット条件に対し順に合致するまで
比較してゆき、合致したスロットを埋め、この操作を最
初から最後の文型まで順番に繰り返し、空きスロットの
無い最多一致した文型を該入力文の文型と認定してい
る。

（発明が解決しようとする問題点）上に述べた文型認識方式の前者の方式は、可能な文型
の中から認定される文型が、仮定された順序に依存する
ため、最多要素の文型を優先させようとしてそれから解
析を試ると、最多要素のものが必ずしも頻度の高いもの
ではないのでバックトラックの回数が多くなる。また、
頻度順に解析を試みると、本来文型構成要素と認識され
るべきものが、認識されずに解析がそのまま成功してし
まうという問題があった。

また後者の方式においては、前者における問題は存在
しないが、候補の素性とスロット条件との比較回数が極
めて多いという問題がある。一回のテーブル操作におい
て、その比較回数は、概算すると文型数の数倍になり、
処理工数、時間が極めてかかるという問題があった。

本発明の目的は、このような欠点を除去せしめて、比
較回数を減らし、効率的に文型を認識する方法を提供す
ることにある。

（問題点を解決するための手段）本発明は、文型を認識する自然言語処理システムにお
いて、入力文中の用言に対し、該用言が取り得る全ての文型
が行として並列表現されたテーブルであり、各文型の構
成文法格が、用言との位置関係や表層文法格を基準に列
として設定した有限個のポジションにおけるスロットの
条件として表現されたテーブルをメモリ上に用意し、該入力文中における文型構成要素の各候補に対し、該
テーブルのポジションを該候補の用言との位置関係や表
層文法格に従って一つ選択し、該候補の素性を全ての可能な文型の選択されたポジシ
ョンにおけるスロットの条件と比較し、条件の合うスロットが存在する場合に、そのスロット
を有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする。

（作用）本発明においては、有限個のポジションを設定するこ
とにより、候補の素性との比較が、特定のポジション以
外に対しては不要となり、比較回数が従来技術の数分の
１となり、処理工数の削減、処理速度の向上につなが
る。

（実施例）次に第１図から第３図を参照して本発明の実施例につ
いて説明する。

第１図は、本発明を利用した自然言語解析手法のフロ
ーチャートである。入力文は、形態素解析により、辞書
を用いながら、意味の最小単位である単語に分割され、
各単語に可能な品詞が付与される。用言の可能性のある
単語に対しては、その用言が取り得る文型が全て抽出さ
れる。抽出された文型情報は、スロットテーブルのテン
プレートを使用して、有限個のポジションで表現された
スロットテーブルに変換される。形態素解析結果は、構
文解析において、文型の構成要素に成り得る大きさにま
でまとめ上げられ、その素性が、スロットテーブル操作
関数を用いて、スロットテーブルにおける一つのポジシ
ョンに挿入され、全ての可能な文型のスロット条件と比
較される。合致するものが在れば、候補は文型構成要素
と認定され、合致したスロットを持つ文型のみが適格な
ものとして残され、合致したスロットは埋められる。文
型構成要素候補が現れ得る間は、このプロセスが繰り返
されるが、現れ得ない状態になった場合、空きスロット
の無い文型で、埋まったスロット数の最も多いものが入
力文の用言の文型と認定される。

第２図は用言の文型情報からスロットテーブルへの変
換例を示している。同図（ａ）は英語の例であり、同図
（ｂ）には日本語の例が示されている。英語の例におい
ては、ポジションを用言との相対位置により設定してい
る。主語（SUB）はポジション１に設定され、用言の直
後の補語（COMP）、直接目的語（DOB）、間接目的語（I
OB）はポジション２に設定される。さらに後ろの要素は
順にポジション３、ポジション４に設定される。

日本語の例では、ポジションを表層文法格により設定
している。文型がある種のシフトを受けた後に助詞が
「が」となる文法格はポジションGAに設定され、助詞が
「を」になるものはポジションWOに設定される。

ポジションの選択は、第３図（ａ）に示されるよう
に、英語においてはポジション１から順にポジション
２、ポジション３というように選択される。日本語にお
いては、第３図（ｂ）に示すとおり文型構成要素の候補
の助詞の綴りを見てポジションが選択される。

【図面の簡単な説明】

第１図は、本発明の文並列認識方法を用いた文解析方式
の例を示すフローチャート、第２図（ａ），（ｂ）は、
用言の文型情報からポジションを利用したスロットテー
ブルの変換例、第３図（ａ），（ｂ）は、スロットテー
ブル上のポジションの選択法の例である。

Claims

(57)【特許請求の範囲】

【請求項１】文型を認識する自然言語処理システムにお
いて、入力文中の用言に対し、該用言が取り得る全ての文型が
行として並列表現されたテーブルであり、各文型の構成
文法格が、用言との位置関係や表層文法格を基準に列と
して設定した有限個のポジションにおけるスロットの条
件として表現されたテーブルをメモリ上に用意し、該入力文中における文型構成要素の各候補に対し、該テ
ーブルのポジションを該候補の用言との位置関係や表層
文法格に従って一つ選択し、該候補の素性を全ての可能な文型の選択されたポジショ
ンにおけるスロットの条件と比較し、条件の合うスロットが存在する場合に、そのスロットを
有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする文型
認識方法。