JPS61187077A

JPS61187077A - 日本語解析装置

Info

Publication number: JPS61187077A
Application number: JP60025150A
Authority: JP
Inventors: Toshiyuki Funabe; 舟部　敏行
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1985-02-14
Filing date: 1985-02-14
Publication date: 1986-08-20

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分野本発明は、日本語解析装置に関し、特に日本語の構文を
解析するに好適な日本語解析装置に関する。

従来技術斯かる日本語解析装置にｍ−られる構文解析文法は、従
来、解析結果の正確さを期すあまシ、次のような欠点を
有しており、しかも必らずしも正確な解析結果を得られ
ないことがあるという問題があった。

解析文法の構造が複雑であった。たとえば解析文法の量
が多く、メンテナンスが困難であった。−側音あげると
、一部の修正が他のどの部分にどのような影響を及ぼす
かの判断が困難であった。したがって、解析処理システ
ム自体も大規模なものになり、解析処理速度が遅いとい
う欠点がち９２だ。

目的本発明の目的は、構文解析文法を簡単化して解析処理速
度を向上させることができる日本語解析装置を提供する
ことにある。

構成本発明は、上記の目的を達成させるため、文節、および
この文節に付加された形態素情報を含む文節データを格
納する第１．第２および第３の記憶手段と、形態素相互
間の関連性を規定した形態素情報関連表が記憶されてい
る第４の記憶手段と、第１ないし第４の記憶手段を制御
し、入力文の解析を行なう制御手段とを有し、制御手段
は、形態素解析された入力文の文節データを順に第１の
記憶手段に格納し、第１の記憶手段の１つの文節データ
を第２の記憶手段に格納し、形態素関連表を参照して、
第３記憶手段に格納されている１つの文節データと第２
の記憶手段に格納されている文＠ｒ−夕との間の関連性
を抽出し、この抽出の結果、関連性があるときは、第２
および第３の記憶手段に格納されている文節データの形
態素情報をその関連性に従って確定してそれらの文節デ
ータを第３の記憶手段に格納し、関連性がないときは、
第２の記憶手段の文節データを関連性のある文節データ
とは区別して第３の記憶手段に格納し、これらの動作を
第１の記憶手段に格納されている文節データについて順
次行なう日本語解析装置を特徴とするものである。

以下、本発明を実施例に基づいて具体的に説明する。

第１図に本発明の一実施例の主要部機能ブロック図を示
す。制御部１０は、図示されていない形態素確析装置に
よシ解析された入力文を取シ込み、文節ごとにＡスタッ
ク１２に格納するとともに、この人スタック１２に格納
されている文節を先頭文節から順次取シ出してＢスタッ
ク１４に一時格納し、前後文節間の品詞関連性、格関連
性、および意味関連性を抽出すべく、品詞関連抽出部１
６、格関連抽出部１８、および意味関連抽出部２０を起
動制御し、その結果をＣスタック２２に上から順次下に
シフトして格納するようになっている。したがりて、Ｃ
スタック２２には係シ受は関係が未定の文節あるいは解
析処理された文節の構造が順次格納され、最終的には入
力文の構文解析結果となシ、出力文として制御部１０か
ら外部へ出力されるようになっている。一方、各関連抽
出部ｉｏ、ｉｓ。

２０にはそれぞれ対応する品詞関連表２４゜格関連表２
６．意味関連表２８が接続されている。

品詞関連表２４は第２図に示すように、後続文節として
Ｂスタック１４に格納されている文節（以下入力文節と
称する）の品詞種＠を行方向に配列し、先行文節（前文
節、前々文節、・・・）としてＣスタック２４に格納さ
れている文節（以下スタック文節と称する）の品詞種類
を列方向に配列し、それら対応する品詞間の係シ受けの
関連性を規定するマトリックスを構成している。同図中
のコードｒＯＪは関連性なしを、コード「１」は関連性
有シを表わす関連性コードである。なお、品詞中の「何
月」とは、付属語又は連用修飾語を表わしている。

格関連表２６は入力文節が動詞、形容動詞又は形容詞な
どのように格を有する品詞のときに参照されるものであ
シ、第３図に示すように、形態素解析の結果として入力
される入力文節の格・ぐターンＫｌ　　＋　Ｋ３　　Ｈ
Ｋ３　　ｒ・・・を行とし、スタック文節の格（主体、
道具、目的２等々・・・）を列としてマトリックスを形
成し、格パターンに関連する格を規定している。図中の
関連性コードｒＯＪ、ｒｌＪは品詞関連表２４と同様に
定義されている。

意味関連表２８は入力文節の意味とスタック文節の意味
の関連性を規定するものであシ、第４図に示すように、
入力文節の意味（移動、単位、形状１等々・・・）を行
とし、スタック文節の意味（人間、物、場所２等々・・
・）を列としてマトリックスを形成し、それらの間の関
連性を規定している。図中のコードｒｏｊ、ｒｌＪ牡記
２つの関連表２４．２６と同様に定義されている。

このように構成される第１図の実施例の構文解析処理手
順を、第５図に示すフローチャートを参照しながら次に
説明する。なお、具体的な入力文例として「彼は学校へ
行った」という文が入力されたものとして説明する。

まず、上記入力文は形態素解析装置によシ解析され、次
のような文節単位に区分されるとともに、品詞、意味、
格、格ノ４ターンなどの形態素情報と一緒に、制御部１
０を介してＡスタック１２に格納される。

入力文例次に、Ａスタック１２に格納されている入力文の先頭文
節から１文節づつ取シ出してＢスタック１４に格納する
（ステップ１０Ｇ）。Ａスタック１２に格納されている
文節がなければ文区切シと判定し、構文解析処理を終了
する（ステラ７’１０２）。Ｂスタック１４に入力文節
が格納されればステップ１０４に進んで、Ｃスタック２
２に格納されている最上位（前文節）のスタック文節と
の品詞関連性の有無を、品詞関連表２４を検索すること
によシ行なう（ステップ１０４，１０６，１１０）。こ
こで、入力文節が先頭文節のときは、Ｃスタック２２に
はスタック文節が格納されていないので、品詞関連表２
４を行末まで検索しても関連性は「０」であるため、ス
テップ１０６の判定でステップ１０８に進−み、入力文
節をＣスタック２２の最上位に格納してステップ１００
に戻る。そして、Ａスタック１２から後続の文節を取シ
出してＢスタック１４に格納する。このときのＢスタッ
ク１４とＣスタック２２の格納状態を次に示す。

Ｂスタック（入力文節）Ｃスタック（スタック文節）ここで、ステラ７’１０４における品詞関連性を抽出す
る手順について詳しく説明すると、入力文節の自立語の
品詞は「名詞」であシ、スタック文節の付属語の品詞は
「何月」である。そこで第２図の品詞関連表２４の該当
欄を見ると「０」となっておシ、品詞の関連性はないこ
とを示している。したがって、ステラ７’１０ｇからス
テラｆ１０８に移行して、スタック文節「（彼−は（・
・・・・・・・・・・・）」はＣスタック２２の最上位
に格納され、ステラ７’ｌＧＯに戻りて次の文節がＢス
タック１４に格納されて入力文節となる。このときのＢ
、Ｃスタック１４．２２の格納状態は次のようになる。

Ｂスタック（入力文節）Ｃスタック（スタック文節）このようにして入れ替えられたＢスタック１４の入力文
節とＣスタック２２の最上位スタック文節との間で、前
述と同様に品詞の関連性抽出がなされる（ステップ１０
４）。入力文節の品詞は「動詞」であシ、最上位スタッ
ク文節の品詞は「何月」であるから、それらに対応する
第２図の品詞関連表２４の欄を見ると、「１」即ち関連
性有シとなっている。したがって、ステップ１１０の判
定はＹＥＳとなシ、ステップ１１２に進んで入力文節は
格・ぐターンを有しているか否かが判断される。この場
合入力文節の格／４’ターンはに３となっていることか
らステップ１１４に進んで、最上位スタック文節に対し
て格の関連性の有無が検索される。

第３図の格関連表２６のに３の行を検索すると、「主体
」と「場所」が関連性有シとなっているが、スタック文
節は格として「終状態」「場所」「目的」しか有してい
ないので、ナれらが一致する「場所」が関連性有りとし
て確定される（ステップ１１６．１ｉｓ）。そして、次
に意味の関連性抽出がなされる（ステップ１２０〜１２
４）。

入力文節は意味として「移動」を有しているので、第４
図の意味関連表２８の「移動」の行が検索される。その
行では「人間」、「物」。

「場所」が関連性有シとなっているが、スタック文節の
自立語の意味は「組織」と「場所」しか有していないの
で、それらが一致する「場所」が確定される。

そしてステップ１２６に進んでＣスタック２２から最上
位スタック文節を取シ出し、入力文節と最上位スタック
文節との形態素情報を、確定したものに書き換えて、つ
まシ関連性のない属性を削除して、それらをまとめて入
力文節としてＢスタック１４に格納する。このときのＢ
スタック１４の格納状態を次に示す。

Ｂスタック（入力文節）そしてステラｆ１０４に戻って、同様に入力文節と最上
位スタック文節についてステップ１０４〜１２６の処理
がなされ、形態素情報が確定された構文解析の最終結果
はＣスタック２２に格納されたものとなる（ステラ７’
１０８）。

その結果を次に示す。

上述したように、本実施例によれば、構文解析文法を品
詞、格、意味の３つの表にコン／Ｊクトに区分してまと
めたことから、解析処理時間が短縮されるとともに、文
法のメンテナンスが容易になるという効果がある。また
、解析処理システムを小規模化できるうえ、ユーザとの
インタラクティブ処理を可能にすることができる。

なお、上記実施例においては前文節とそれに続く後続文
節との２つの文節相互間についての関連性有無によって
、形態素情報（属性）を確定するようにしていたが、前
文節が例えば接続詞などの場合には、前々文節との関連
性をみて属性を確定することが望ましい場合がある。こ
のような場合の実施例の主要部機能ブロック図を第６図
に示す。第１図の実施例と異なる点は、制御部１０に関
連させて照合パターンスタック３０が設けられているこ
とと、品詞関連表３２の内容が第７図に示すように、先
行するスタック文節の品詞によっては、１つ前のスタッ
ク文節（最上位から２番目のスタック文節）と関連性が
あれば関連性有りとするコード「２」が書き込まれてい
ることにある。その他の構成は第１図の実施例と同様で
よいので説明を省略する。

この第６図の実施例における解析処理手順は基本的に第
１図の実施例と同様でよいが、品詞関連性の検索時に関
連性有無の内容が「１」又は「２」のときは、その「１
」又は「２」を照合ノＥターンスタック３０に格納し、
この照合パターンスタック３０の内容に従って品詞、格
、意味関連性の処理をする点が異なる。即ち、「１」の
場合は第１図の実施例と同一であるが、「２」の場合に
はＣスタック２２の最上位から２番目の文節とＢスタッ
ク１４の入力文節との間について各関連性を検索し、そ
れらの間に関連性があれば最上位スタック文節を含めて
全体的に関連性有シとし、形態素情報を確定する。

したがって、本実施例によれば、注目している２つの文
節の周辺にある文節をも見て解析していることから、前
記第１図の実施例の効果に加えて、一層正確さが向上さ
れるという効果がある。

効果以上説明したように、本発明によれば、構文解析文法が
簡単化されるとともに、解析処理速度が向上するという
効果がある。

【図面の簡単な説明】

第１図は本発明の一実施例による日本語解析装置の機能
ブロック図、第２図ないし第４図は、第１図の実施例のそれぞれ品詞
関連表、格関連表、意味関連表の内容例を！示す図、第５図は第１図の実施例の動作を説明する要部フローチ
ャート、第６図は本発明の他の実施例の機能ブロック図、第７図は第６図の実施例の品詞関連表の内容例を示す図
である。主要部の符号の説明１０・・・制御部１２・・・Ａスタック１４・・・Ｂスタック２２・・・Ｃスタック２４．３２・・・品詞関連表２６・・・格関連表２８・・・意味関連表３０・・・照合／”　ターンスタック第１図第２図第７図

Claims

【特許請求の範囲】１、文節、および該文節に付加された形態素情報を含む
文節データを格納する第１、第２および第３の記憶手段
と、形態素相互間の関連性を規定した形態素情報関連表が記
憶されている第４の記憶手段と、第１ないし第４の記憶
手段を制御し、入力文の解析を行なう制御手段とを有し
、該制御手段は、形態素解析された入力文の前記文節データを順に第１の
記憶手段に格納し、第１の記憶手段の１つの文節データを第２の記憶手段に
格納し、前記形態素関連表を参照して、第３記憶手段に格納され
ている１つの文節データと第２の記憶手段に格納されて
いる文節データとの間の関連性を抽出し、この抽出の結果、関連性があるときは、第２および第３
の記憶手段に格納されている文節データの形態素情報を
該関連性に従って確定してそれらの文節データを第３の
記憶手段に格納し、関連性がないときは、第２の記憶手
段の文節データを前記関連性のある文節データとは区別
して第３の記憶手段に格納し、これらの動作を第１の記憶手段に格納されている文節デ
ータについて順次行なうことを特徴とする日本語解析装
置。２、特許請求の範囲第１項記載の装置において、前記形
態素情報関連表は、文節に含まれる語の品詞、格および
意味のうちの少なくとも１つについての関連性を含むこ
とを特徴とする日本語解析装置。３、特許請求の範囲第２項記載の装置において、第３記
憶手段に格納されている文節データのうち前記関連性抽
出の対象となるものは、前記形態素情報関連表における
品詞についての関連性によって規定されることを特徴と
する日本語解析装置。