JPH03252862A - 文章解析装置 - Google Patents
文章解析装置Info
- Publication number
- JPH03252862A JPH03252862A JP2050922A JP5092290A JPH03252862A JP H03252862 A JPH03252862 A JP H03252862A JP 2050922 A JP2050922 A JP 2050922A JP 5092290 A JP5092290 A JP 5092290A JP H03252862 A JPH03252862 A JP H03252862A
- Authority
- JP
- Japan
- Prior art keywords
- word order
- information
- word
- standard
- emphasis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 241000581652 Hagenia abyssinica Species 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、知識情報処理分野・OA分野で広く利用され
る文章解析装置に関する。
る文章解析装置に関する。
従来、文章要約などの応用を想定した文章解析システム
では、キーワード登録をしない場合、「は」「こそ」等
の副助詞や「なんだ」等の断定の助動詞に頼って文章中
の強調個所を検出する方法が、喜事「説明文を要約する
システム」情報処理学会自然言語研究会63−6.19
87や野村他「機械翻訳システムP IVOTにおける
日本語フレームモデル」第38@情報処理学会全国大会
予稿集1989によって提案されている。
では、キーワード登録をしない場合、「は」「こそ」等
の副助詞や「なんだ」等の断定の助動詞に頼って文章中
の強調個所を検出する方法が、喜事「説明文を要約する
システム」情報処理学会自然言語研究会63−6.19
87や野村他「機械翻訳システムP IVOTにおける
日本語フレームモデル」第38@情報処理学会全国大会
予稿集1989によって提案されている。
ところがこの方法では、これらの特徴的な語禦が出現し
た場合にしか、強調置所を構文的に検出できないという
機能限界からくる欠点がある。
た場合にしか、強調置所を構文的に検出できないという
機能限界からくる欠点がある。
本発明によれば、用言の従える構文的要素の情報を記述
した辞書をもちいて入力文の形態素、構文意味の解析を
行う文章解析装置において、用言の各要素の標準的な出
現順序を記述した標準語順情報を格納する標準語順格納
手段と、入力文から単語または文節の出現順序の情報を
抽出する語順認識手段と、前記語順認識手段の出力情報
を前記標準語順格納手段の格納する標準語順情報と比較
する語順比較手段と、前記語順比較手段が比較結果の異
なりを検出した際に、入力文中で非標準位置に存在して
いた単語または文節の解析結果に強調されていたことを
示す強調情報を付加する強調情報付加手段とを備える。
した辞書をもちいて入力文の形態素、構文意味の解析を
行う文章解析装置において、用言の各要素の標準的な出
現順序を記述した標準語順情報を格納する標準語順格納
手段と、入力文から単語または文節の出現順序の情報を
抽出する語順認識手段と、前記語順認識手段の出力情報
を前記標準語順格納手段の格納する標準語順情報と比較
する語順比較手段と、前記語順比較手段が比較結果の異
なりを検出した際に、入力文中で非標準位置に存在して
いた単語または文節の解析結果に強調されていたことを
示す強調情報を付加する強調情報付加手段とを備える。
本発明は、文章中の特徴的な語禦が出現する場合に限ら
ず、語の並べ方によって強調された個所を構文的に検出
する。
ず、語の並べ方によって強調された個所を構文的に検出
する。
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図、第2図は
本発明の詳細な説明するためのフローチャート、第3図
(a)(b)は入力文の形態素解析出力に対応する辞書
3の内容、標準語順格納手段31の内容を示す概念図で
ある。
本発明の詳細な説明するためのフローチャート、第3図
(a)(b)は入力文の形態素解析出力に対応する辞書
3の内容、標準語順格納手段31の内容を示す概念図で
ある。
以下、本発明の文章解析装置が、−例として次に示す二
つの入力文から強調個所を抽出する過程を第2図にそっ
て説明する。
つの入力文から強調個所を抽出する過程を第2図にそっ
て説明する。
入力文の「ベンチは公園にあった。」
入力文■「コンクリート製の床に鉛筆が落ちたんだ、」
データ線10を介して入力文のまたは■を受は取った形
態素解析手段1は、辞書3を用いてこれを単語単位に分
割する。このとき、対応する標準語順格納手段31の内
容を、データ線32.13を介して該当する用言、すな
わち各々「あった」の部分に第3図(b)が示す「に」
「が」を格納し、「落ちたんだ1の部分に第3図(a
)が示す「が」「に」を格納する(ステップ101)。
態素解析手段1は、辞書3を用いてこれを単語単位に分
割する。このとき、対応する標準語順格納手段31の内
容を、データ線32.13を介して該当する用言、すな
わち各々「あった」の部分に第3図(b)が示す「に」
「が」を格納し、「落ちたんだ1の部分に第3図(a
)が示す「が」「に」を格納する(ステップ101)。
ステップ102では構文意味解析手段2が用言を一つ選
ぶ、ここでは入力文■■ともに唯一の用言「あった」
「落ちたんだ」を選んで処理対象とする。構文意味解析
手段2は、次に、各要素との掛かり受けを決定するがこ
の際に語順認識手段11を用いてデータ線12を介して
各要素間の相対語順を逐次判定する(ステップ103゜
104)、この結果、各要素間の相対語順情報として、
入力文■からは「が」 「に」 (ベンチが公園に)が
、入力文■からは「に」「が」(床に鉛筆が〉が得られ
る。lIられた相対語順情報はそれぞれに用言の上に格
納される。
ぶ、ここでは入力文■■ともに唯一の用言「あった」
「落ちたんだ」を選んで処理対象とする。構文意味解析
手段2は、次に、各要素との掛かり受けを決定するがこ
の際に語順認識手段11を用いてデータ線12を介して
各要素間の相対語順を逐次判定する(ステップ103゜
104)、この結果、各要素間の相対語順情報として、
入力文■からは「が」 「に」 (ベンチが公園に)が
、入力文■からは「に」「が」(床に鉛筆が〉が得られ
る。lIられた相対語順情報はそれぞれに用言の上に格
納される。
これら入力文の相対語順情報と、ステップ101にて予
じめ標準語順格納手段31から読み出しておいた標準語
順情報とをデータ1114を介して語順比較手段21に
送って比較し、一致しているか否か判定する(ステップ
105,106)、入力文■では標準語順が「に」 「
が」であったのに対し入力文中では「が」 「に」であ
り、入力文■では標準語順が「が」 「に」であったの
に対し入力文中では「に」 「が」と、いずれも食い違
っている。そこでステップ106の判断でYesへ進み
、語順比較手段21において標準語順よりも前(文頭近
く)に出現していた各要素をデータ線23を介して強調
情報付加手段22に送り、強調情報を付加する(ステッ
プ107)。
じめ標準語順格納手段31から読み出しておいた標準語
順情報とをデータ1114を介して語順比較手段21に
送って比較し、一致しているか否か判定する(ステップ
105,106)、入力文■では標準語順が「に」 「
が」であったのに対し入力文中では「が」 「に」であ
り、入力文■では標準語順が「が」 「に」であったの
に対し入力文中では「に」 「が」と、いずれも食い違
っている。そこでステップ106の判断でYesへ進み
、語順比較手段21において標準語順よりも前(文頭近
く)に出現していた各要素をデータ線23を介して強調
情報付加手段22に送り、強調情報を付加する(ステッ
プ107)。
強調情報を付加された文節(■「ベンチは」。
■「床に」)は、データ線24を介して構文意味解析手
段2へ送られ、他の解析結果と共にデータ線30を介し
て本装置から出力される(ステップ108)。
段2へ送られ、他の解析結果と共にデータ線30を介し
て本装置から出力される(ステップ108)。
実施例では日本語を用いて説明したが、他の言語でも非
標準語順が強調情報をもち得るならば、例えば、英語で
rThis、 I pro@ise y o u 、
J の’Th1s4のように、本発明は有効である。
標準語順が強調情報をもち得るならば、例えば、英語で
rThis、 I pro@ise y o u 、
J の’Th1s4のように、本発明は有効である。
また、本発明は、文章要約システムにおける文章中の強
調個所の抽出という応用だけでなく、音声認識装置にお
いて「話題」を同定する等の応用においても有効である
。
調個所の抽出という応用だけでなく、音声認識装置にお
いて「話題」を同定する等の応用においても有効である
。
本発明によれば、特徴的な語禦が出現した場合に限らず
、語の並べ方によって強調された置所を構文的に検出す
ることができその効果は多大である。
、語の並べ方によって強調された置所を構文的に検出す
ることができその効果は多大である。
第1図は本発明の一実施例を示すブロック図、第2図は
標準語順情報を用いて強調情報を付加した解析結果を求
める過程を示すフローチャート、第3図(a)(b)は
辞書情報の内容および、標準語順格納手段の内容を示す
概念図である。 ■・・・形態素解析手段、2・−・構文意味解析手段、
3・−・辞書、11語順認識手段、21・・・語順比較
手段、22・・・強調情報付加手段、31・・・標準語
順格納手段。
標準語順情報を用いて強調情報を付加した解析結果を求
める過程を示すフローチャート、第3図(a)(b)は
辞書情報の内容および、標準語順格納手段の内容を示す
概念図である。 ■・・・形態素解析手段、2・−・構文意味解析手段、
3・−・辞書、11語順認識手段、21・・・語順比較
手段、22・・・強調情報付加手段、31・・・標準語
順格納手段。
Claims (1)
- 用言の従える構文的要素の情報を記述した辞書をもちい
て入力文の形態素、構文意味の解析を行う文章解析装置
において、用言の各要素の標準的な出現順序を記述した
標準語順情報を格納する標準語順格納手段と、入力文か
ら単語または文節の出現順序の情報を抽出する語順認識
手段と、前記語順認識手段の出力情報を前記標準語順格
納手段の格納する標準語順情報と比較する語順比較手段
と、前記語順比較手段が比較結果の異なりを検出した際
に、入力文中で非標準位置に存在していた単語または文
節の解析結果に強調されていたことを示す強調情報を付
加する強調情報付加手段とを備えることにより単文中ま
たは文章中で強調されていた部分を検出することを特徴
とする文章解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2050922A JP2770536B2 (ja) | 1990-03-02 | 1990-03-02 | 文章解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2050922A JP2770536B2 (ja) | 1990-03-02 | 1990-03-02 | 文章解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03252862A true JPH03252862A (ja) | 1991-11-12 |
JP2770536B2 JP2770536B2 (ja) | 1998-07-02 |
Family
ID=12872293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2050922A Expired - Lifetime JP2770536B2 (ja) | 1990-03-02 | 1990-03-02 | 文章解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2770536B2 (ja) |
-
1990
- 1990-03-02 JP JP2050922A patent/JP2770536B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2770536B2 (ja) | 1998-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20020077806A1 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
JPS61163467A (ja) | 機械翻訳システム | |
KR101906561B1 (ko) | 문장구조 이해가 용이한 영어문장 표시방법 | |
JP4007413B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP4033011B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP3300142B2 (ja) | 自然言語処理装置 | |
Gunawan et al. | Identifying Sentence Structure in Bahasa Indonesia by Using POS Tag and LALR Parser | |
JPH03252862A (ja) | 文章解析装置 | |
JP4033093B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JPH0157826B2 (ja) | ||
KR960018972A (ko) | 어절구조 특성을 이용한 형태소 분석 시스팀 및 분석방법 | |
JP3222173B2 (ja) | 日本語構文解析システム | |
JP3972697B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP2661934B2 (ja) | 日本語処理システム | |
JP2546515B2 (ja) | 情報抽出装置 | |
JPH0287273A (ja) | 自動翻訳装置 | |
JP3050575B2 (ja) | 自然言語自動翻訳装置 | |
KR100413966B1 (ko) | 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법 | |
JPH0795323B2 (ja) | 自然言語処理装置 | |
JP3339006B2 (ja) | 機械翻訳装置における並列名詞句処理装置 | |
JP2504449B2 (ja) | 日本語文節間係り受け解析装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP2912479B2 (ja) | 構文解析制御方式 | |
JP2994539B2 (ja) | 機械翻訳装置 | |
Shimohata et al. | Example-based rough translation for speech-to-speech translation |