JP2504447B2

JP2504447B2 - 日本語文節間係り受け解析装置

Info

Publication number: JP2504447B2
Application number: JP62052198A
Authority: JP
Inventors: 諭白井
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1987-03-09
Filing date: 1987-03-09
Publication date: 1996-06-05
Anticipated expiration: 2011-06-05
Also published as: JPS63219072A

Description

【発明の詳細な説明】（発明の属する技術分野）本発明は、入力装置から読み込まれた日本文の構造を
解析する日本語構文解析装置に関するものである。

（従来の技術）従来、日本文における係り受け解析としては、いわゆ
る句構造文法に従って、各文節の働きを数種〜数十種に
分割し、この分類に従って、係りの文節は受けの文節より前に置かれる、係りの文節は受けの文節を１つしか持ちえない、係り受けの関係に交叉はない、という係り受けの一般的法則を用いて、係り受けの関係は規則的・意味的に許される限り最も
近い位置にある文節間で成り立つ、という経験的な法則に沿って、各文節間の係り受けを試
行錯誤しながら認定することにより、文全体の係り受け
パターンを決定する態様がよく知られている。

（発明が解決しようとする問題点）上述の従来技術が用いている経験的法則は、格要素
と用言の親和性などの意味的な解析を行ないながら適用
するのでなければ、正しい係り受けを見落としてしまう
場合がある（例えば、「（ａ）彼が、（ｂ）白い、
（ｃ）家に、（ｄ）住む」において、単にを適用すれ
ば（ａ）の係り先は（ｂ）になってしまうため、意味的
な解析を行なって（ａ）が（ｂ）に係りえないことを調
べておく必要がある）。

すなわち、従来の技術では一般に係り受け解析を意味
解析の前段の処理として位置付けているにも拘らず、係
り受け解析を行なうために意味的な解析を行なう必要が
あるという入り組んだ構造を持っているため、処理を構
成する上で見通しが悪くなるという欠点を持っていた。

また、上記技術においては、全ての係り受けパターン
の相対的な優劣を比較することは難しく、１つの係り受
けパターンに対して意味解析などによって妥当性を評価
してみて、それが適当であると判定されればそのまま先
に進むが、不適当であると判定されれば後戻りして別の
係り受けの解を求めるようにする制御が必要で、曖昧さ
がある場合にその曖昧さを残したまま解析を進めるのが
困難であった。

（発明の目的）本発明の目的は、上記技術の欠点を解決し、不適当な
係り受けの発生を防ぎながら曖昧さを解析の多義として
残した形で係り受けの解を得ることにある。

（問題点を解決するための手段）本発明の上記目的は、文節単位に区切られかつ文節が
単語単位に区切られた日本文を入力し，文節間の係り受
けの有意なパターンを出力する日本語文節間係り受け解
析装置において，係り元となる文節の単語構成と係り先となる文節の単
語構成の組に対して成立する係り受け属性を保持してい
る文節対係り受け判定辞書と，前記入力された日本文で係り受けが成立しうる文節対
を抽出し，該抽出した文節対の係り受け属性を求める文
節対係り受け判定処理部と，係り受け属性の種類と前記入力された日本文に複数の
係り受け属性の種類が有る場合の処理優先順位との組に
して保持している係り受けパターン生成辞書と，前記文節対係り受け判定処理部で求められた各文節対
の係り受け属性について前記パターン生成辞書より処理
優先順位を求め，該優先順位が高い係り受け属性で関係
付けられている文節対から順に係り受けを多義として展
開して係り受けパターンを生成する係り受けパターン生
成処理部を有することを特徴とする日本語文節間係り受け解析装置によっ
て達成される。

（作用）本発明においては、従来の態様が１つずつ係り受け解
析結果を求めていた点に鑑みて、総当たり的に係り受け
解析結果を求めることにより曖昧さを解析の多義として
残すようにし、この際、係り受けの強いものを先に認定
することによって、係り受けの弱いものに判う不適当な
解析多義の発生を抑えるようにしている。

（実施例）以下、本発明の一実施例について図面により説明す
る。

第１図は本発明を適用した日本語構文解析システム全
体の基本ブロック図を示したものである。

入力装置１から入力される単語分割された日本文に対
し、文節対係り受け判定辞書５を用いる文節対係り受け
判定処理部２により、文節対の係り受けの有無を、また
係り受けが成立しうる場合は係り受け属性を同時に求め
る。

次に、係り受けの成立する文節対を係り受けパターン
生成処理部３で、係り受けパターン生成辞書６による制
御に従って組み合わせ、文全体の係り受けパターンを求
め、出力装置４から出力する。

第２図は単語分割された入力日本文の例であり、第３図は文節対係り受け判定辞書の構成例、第４図は文節対係り受け判定処理部の動作例、第５図は係り受けパターン生成辞書の構成例、第６図は係り受けパターン生成処理部の動作例、第７図は文節対係り受け判定処理部のフローチャー
ト、第８図は係り受けパターン生成処理部のフローチャー
トである。

以下、第２図の例に対する第１図における２・３の各
処理部の動作を第３図〜第６図を用いて説明する。

まず、文節対係り受け判定処理部２の動作は第７図の
通りであり、その動作例を第３図，第４図を用いて説明
する。

本処理部では、文節を構成する単語の文法情報に対し
て、第３図で与えるような係り受け成立の条件を適用す
ることにより、係り受けの成立しうる文節対を調べ、同
時にその係り受け属性を求める。例えば、文節No.1と文
節No.2の文節対にはルールNo.304のルールが適用できる
ので、係り受け属性は「格関係」となる。

文節No.1と文節No.3の文節対にはルールNo.303のルー
ルが適用できるので、係り受け属性は「名詞名詞修飾」
となる。文節No.1と文節No.4の文節対には適用できるル
ールがないため、係り受けが成立しえない。

以下同様にして、第４図における係り受け属性を得
る。

次に、係り受けパターン生成処理部３の動作は第８図
の通りであり、その動作を第５図、第６図を用いて説明
する。

本処理部では、第５図に示した係り受けパターン生成
辞書のルールを、ルールNo.1のルールから順に１回ずつ
適用することにより係り受けパターンを生成する。

例えば、文番号201の文では、第４図に示したように
“名詞名詞修飾”（文節No.1→文節No.3）、“埋込修
飾”（文節No.2→文節No.3）、“格関係”（文節No.1→
文節No.2、文節No.3→文節No.4）の３種類の係り受けが
成立する可能性があるので、第５図のうちルールNo.1,N
o.5,No.8の格ルールをこの順に１回ずつ適用する。

第６図の状態X0は係り受けパターン生成処理部におけ
る対象文の初期状態である。まず,3種類の係り受けの関
係の強さの順序を第５図に示した係り受けパターン生成
辞書を参考にして判定する。まず，最も係り受け関係の
強いルールNo.1（“名詞名詞修飾”）を適用して，文節
No.1（“屋根の”）から文節No.3（“家に”）への係り
受けを固定した状態X1aを得る。このとき，文節No.3か
らは文節No.2（“白い”）への“格関係”の係り受け
（ルールNo.8）も成立する可能性もあるため（第４図参
照），文節No.1が未処理のままの状態X1bも作成してお
く。状態X1bば状態X0と同じ内容であり，状態X0をコピ
ーして得られる。このようにして入力文における最強の
係り受け関係のルールNo.1についての処理を終える。

次に，先の３種類の係り受けのうち,2番目に係り受け
関係の強いルールNo.5（“埋込修飾”）をルールNo.1の
処理結果，即ち状態X1aとX1bに適用する。入力文（“屋
根の白い家に住む”）では埋め込み修飾は文節No.2から
文節No.3への係り受けとして存在している（第４図参
照）。ルールNo.5の適用により，状態X1aは状態X2aに，
状態X1bは状態X2bが得られる。（第６図）最後に，先の３種類の係り受けのうち，最も係り受け
関係の弱いルールNo.8（‘格関係”）を上記結果に適用
する。“格関係”は，文節No.1（“屋根の”）から文節
No.2（“白い”）及び文節No.3（“家に”）から文節N
o.4（“住む”）に存在している。

文節No.1から文節No.2への格関係係り受け；状態X2a
では，既に，文節No.1からの係り先は，より強い係り受
け関係“名詞名詞修飾”により決定されているので，状
態X2aを状態X3aとする。状態X2bについては文節No.1か
ら文節No.2への係り受けを設定して状態X3bを得る。

文節No.3から文節No.4への格関係係り受け；状態X3a,
状態X3bの文節No.3から文節No.4へのルールNo.8の係り
受け関係を適用し，状態X4a,状態X4bを得る。

以上で入力文の文節間に生じ得る係り受け関係の有意
な組合せパターンが生成されたことになる。

第２図に示す文番号202についても同様に処理して，
第６図の状態Y3a,Y3bが得られる。

このようにして得られた解析の多義は、文番号201の
「屋根の白い家に住む」と「彼の白い家に住む」、文番
号202の「屋根が白い家に住む」と「彼が白い家に住
む」の比較からわかるように、名詞と形容詞または動詞
の親和性を考慮していないために生じるものであり、本
発明に基づく装置による処理の後で意味的な親和性を考
慮することにより容易に正解パターンに絞り込むことが
できる。

（発明の効果）以上説明したように、本発明によると、日本語の表現
に合わない解析多義の発生を抑えながら、日本文の曖昧
さを解析多義として残すことができる。

また、係り受け解析処理の中に意味的な解析を行なう
処理を必要としないため、意味解析を行なうシステムと
組み合わせたとき、全体の制御を見通しよく構成でき
る。

【図面の簡単な説明】

第１図は本発明を適用した日本語構文解析システム全体
の基本ブロック図、第２図は単語分割された入力日本文の例、第３図は文節対係り受け判定辞書の構成例、第４図は文節対係り受け判定処理部の動作例、第５図は係り受けパターン生成辞書の構成例、第６図は係り受けパターン生成処理部の動作例、第７図は文節対係り受け判定処理部のフローチャート、第８図は係り受けパターン生成処理部のフローチャート
である。１……入力装置、２……文節対係り受け判定処理部、３……係り受けパターン生成処理部、４……出力装置、５……文節対係り受け判定辞書、６……係り受けパターン生成辞書。

Claims

(57)【特許請求の範囲】

【請求項１】文節単位に区切られかつ文節が単語単位に
区切られた日本文を入力し，文節間の係り受けの有意な
パターンを出力する日本語文節間係り受け解析装置にお
いて，係り元となる文節の単語構成と係り先となる文節の単語
構成の組に対して成立する係り受け属性を保持している
文節対係り受け判定辞書と，前記入力された日本文で係り受けが成立しうる文節対を
抽出し，該抽出した文節対の係り受け属性を求める文節
対係り受け判定処理部と，係り受け属性の種類と前記入力された日本文に複数の係
り受け属性の種類が有る場合の処理優先順位とを組にし
て保持している係り受けパターン生成辞書と，前記文節対係り受け判定処理部で求められた各文節対の
係り受け属性について前記パターン生成辞書より処理優
先順位を求め，該優先順位が高い係り受け属性で関係付
けられている文節対から順に係り受けを多義として展開
して係り受けパターンを生成する係り受けパターン生成
処理部を有することを特徴とする日本語文節間係り受け解析装置。