JPH03252862A

JPH03252862A - 文章解析装置

Info

Publication number: JPH03252862A
Application number: JP2050922A
Authority: JP
Inventors: Naoyuki Nomura; 直之野村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-03-02
Filing date: 1990-03-02
Publication date: 1991-11-12
Anticipated expiration: 2013-07-02
Also published as: JP2770536B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、知識情報処理分野・ＯＡ分野で広く利用され
る文章解析装置に関する。

〔従来の技術〕

従来、文章要約などの応用を想定した文章解析システム
では、キーワード登録をしない場合、「は」「こそ」等
の副助詞や「なんだ」等の断定の助動詞に頼って文章中
の強調個所を検出する方法が、喜事「説明文を要約する
システム」情報処理学会自然言語研究会６３−６．１９
８７や野村他「機械翻訳システムＰ　ＩＶＯＴにおける
日本語フレームモデル」第３８＠情報処理学会全国大会
予稿集１９８９によって提案されている。

〔発明が解決しようとする課題〕

ところがこの方法では、これらの特徴的な語禦が出現し
た場合にしか、強調置所を構文的に検出できないという
機能限界からくる欠点がある。

〔課題を解決するための手段〕

本発明によれば、用言の従える構文的要素の情報を記述
した辞書をもちいて入力文の形態素、構文意味の解析を
行う文章解析装置において、用言の各要素の標準的な出
現順序を記述した標準語順情報を格納する標準語順格納
手段と、入力文から単語または文節の出現順序の情報を
抽出する語順認識手段と、前記語順認識手段の出力情報
を前記標準語順格納手段の格納する標準語順情報と比較
する語順比較手段と、前記語順比較手段が比較結果の異
なりを検出した際に、入力文中で非標準位置に存在して
いた単語または文節の解析結果に強調されていたことを
示す強調情報を付加する強調情報付加手段とを備える。

〔作用〕

本発明は、文章中の特徴的な語禦が出現する場合に限ら
ず、語の並べ方によって強調された個所を構文的に検出
する。

〔実施例〕

次に、本発明について図面を参照して説明する。

第１図は本発明の一実施例を示すブロック図、第２図は
本発明の詳細な説明するためのフローチャート、第３図
（ａ）（ｂ）は入力文の形態素解析出力に対応する辞書
３の内容、標準語順格納手段３１の内容を示す概念図で
ある。

以下、本発明の文章解析装置が、−例として次に示す二
つの入力文から強調個所を抽出する過程を第２図にそっ
て説明する。

入力文の「ベンチは公園にあった。」入力文■「コンクリート製の床に鉛筆が落ちたんだ、」データ線１０を介して入力文のまたは■を受は取った形
態素解析手段１は、辞書３を用いてこれを単語単位に分
割する。このとき、対応する標準語順格納手段３１の内
容を、データ線３２．１３を介して該当する用言、すな
わち各々「あった」の部分に第３図（ｂ）が示す「に」
　「が」を格納し、「落ちたんだ１の部分に第３図（ａ
）が示す「が」「に」を格納する（ステップ１０１）。

ステップ１０２では構文意味解析手段２が用言を一つ選
ぶ、ここでは入力文■■ともに唯一の用言「あった」　
「落ちたんだ」を選んで処理対象とする。構文意味解析
手段２は、次に、各要素との掛かり受けを決定するがこ
の際に語順認識手段１１を用いてデータ線１２を介して
各要素間の相対語順を逐次判定する（ステップ１０３゜
１０４）、この結果、各要素間の相対語順情報として、
入力文■からは「が」　「に」　（ベンチが公園に）が
、入力文■からは「に」「が」（床に鉛筆が〉が得られ
る。ｌＩられた相対語順情報はそれぞれに用言の上に格
納される。

これら入力文の相対語順情報と、ステップ１０１にて予
じめ標準語順格納手段３１から読み出しておいた標準語
順情報とをデータ１１１４を介して語順比較手段２１に
送って比較し、一致しているか否か判定する（ステップ
１０５，１０６）、入力文■では標準語順が「に」　「
が」であったのに対し入力文中では「が」　「に」であ
り、入力文■では標準語順が「が」　「に」であったの
に対し入力文中では「に」　「が」と、いずれも食い違
っている。そこでステップ１０６の判断でＹｅｓへ進み
、語順比較手段２１において標準語順よりも前（文頭近
く）に出現していた各要素をデータ線２３を介して強調
情報付加手段２２に送り、強調情報を付加する（ステッ
プ１０７）。

強調情報を付加された文節（■「ベンチは」。

■「床に」）は、データ線２４を介して構文意味解析手
段２へ送られ、他の解析結果と共にデータ線３０を介し
て本装置から出力される（ステップ１０８）。

実施例では日本語を用いて説明したが、他の言語でも非
標準語順が強調情報をもち得るならば、例えば、英語で
ｒＴｈｉｓ、　Ｉ　ｐｒｏ＠ｉｓｅ　ｙ　ｏ　ｕ　、　
Ｊ　　の’Ｔｈ１ｓ４のように、本発明は有効である。

また、本発明は、文章要約システムにおける文章中の強
調個所の抽出という応用だけでなく、音声認識装置にお
いて「話題」を同定する等の応用においても有効である
。

〔発明の効果〕

本発明によれば、特徴的な語禦が出現した場合に限らず
、語の並べ方によって強調された置所を構文的に検出す
ることができその効果は多大である。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は
標準語順情報を用いて強調情報を付加した解析結果を求
める過程を示すフローチャート、第３図（ａ）（ｂ）は
辞書情報の内容および、標準語順格納手段の内容を示す
概念図である。 ■・・・形態素解析手段、２・−・構文意味解析手段、
３・−・辞書、１１語順認識手段、２１・・・語順比較
手段、２２・・・強調情報付加手段、３１・・・標準語
順格納手段。

Claims

【特許請求の範囲】

用言の従える構文的要素の情報を記述した辞書をもちい
て入力文の形態素、構文意味の解析を行う文章解析装置
において、用言の各要素の標準的な出現順序を記述した
標準語順情報を格納する標準語順格納手段と、入力文か
ら単語または文節の出現順序の情報を抽出する語順認識
手段と、前記語順認識手段の出力情報を前記標準語順格
納手段の格納する標準語順情報と比較する語順比較手段
と、前記語順比較手段が比較結果の異なりを検出した際
に、入力文中で非標準位置に存在していた単語または文
節の解析結果に強調されていたことを示す強調情報を付
加する強調情報付加手段とを備えることにより単文中ま
たは文章中で強調されていた部分を検出することを特徴
とする文章解析装置。