JPS6165358A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPS6165358A
JPS6165358A JP59185392A JP18539284A JPS6165358A JP S6165358 A JPS6165358 A JP S6165358A JP 59185392 A JP59185392 A JP 59185392A JP 18539284 A JP18539284 A JP 18539284A JP S6165358 A JPS6165358 A JP S6165358A
Authority
JP
Japan
Prior art keywords
word
relevancy
words
analysis
analyzer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59185392A
Other languages
English (en)
Other versions
JPH0576658B2 (ja
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59185392A priority Critical patent/JPS6165358A/ja
Publication of JPS6165358A publication Critical patent/JPS6165358A/ja
Publication of JPH0576658B2 publication Critical patent/JPH0576658B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は日本語解析装置、とくにワードプロセッサ、翻
訳システムなどに適用可能な構文解析を行なう日本語解
析装置に関する。
従来技術 従来のこの種の日本語解析装置にあっては入力された日
本語文に対し、文単位で、すなわち他の文とけ関係なく
1つの文の中だけで構文解析を行っていたために、解析
結果に曖昧さが生じるという欠点があった。
例えば「太部は犬である。・・・吠えている彼の太部は
・・・。」という日本語文が入力されたとする。上記日
本語文において「吠えている」の係シ受は先で可能性の
あるのは、「彼」と「太部」であるが、「彼」も「太部
」も一般的には人間を相称する。したがって、上記日本
語文において、「太部」が犬を相称していることは、他
の文章からの情報がなければ判らない。したがって文単
位で構文解析したのでは、「吠えている」のが「彼」で
あるか「太部」であるかを判別することは不可能である
このように従来の日本語解析装置では、単なる一文内の
情報に基づいて文単位に構文解析していたので、解析結
果に曖昧さが生じていた。
目的 本発明はこのような従来技術の欠点を解消し、構文解析
結果の曖昧さを減少させることができる日本語解析装置
を提供することにある。
構成 本発明の構成について以下、実施例に基づいて説明する
。本発明によれば、入力された文章に現れる単語の構文
上の関連性を自動的に抽出し、この関連性を示すデータ
を記憶手段に記憶させておき、構文解析時にこれらのデ
ータを参照することにより、解析結果の曖昧さを減少さ
せている。
第1図には本発明に係る日本語解析装置の一実施例の構
成が示されており、同図において入力手段としてのキー
が一ド10は数字を示すテンキー、ひらがな等の文字を
示す文字キー、各種の機能キー等から構成され、ユーザ
はキーH?−ド10のキー操作により構文解析すべき日
本語文データを処理制御装置12に入力する。
処理制御装置12はパスライン30を介して形態素解析
装置14、構文解析装置16及び関連性判定装置20に
接続されている。処理制御装置12はキーボード10に
より入力された日本語文データをパスライン30を介し
て形態素解析装置14に送出し、また形態素解析装置1
4、構文解析装置16の解析結果及び関連性判定装置2
0の判定結果を示すデータを表示装置22に転送する。
形態素解析装置14は処理制御装置12より取り込んだ
日本語文データを形態素解析し、その解析結果を構文解
析装置16に送出する。
構文解析装置16では形態素解析結果に基づいて日本語
文データの構文解析を行う。
一方、関連性判定装置20は構文解析装置16の解析結
果に基づいて文単位に構文上、相互に関連性を有する語
の組を抽出し、これらの語の組及びこれらの語の組の関
連性等を示すデータを関連性スタック18に登録すると
共に、構文解析装置16の解析結果に曖昧さが生じた場
合に対象となる語について関連性スタック18の記憶内
容を検索してその語と関連語との関連性を判定し、該判
定結果と単語辞書ROM22から得られる辞書情報を構
文解析装置16に送出する。
次に」二記構成からなる日本語解析装置の具体的動作を
以下に説明する。まずキーボード10のキー操作により
、たとえば「・・・・美しい山。
・・・・・・美しい1」本の山。・・・・・・」なる文
章の日本語文データが処理制御装置12に入力されると
、処理制御装置12はパスライン30を介して形態素解
析装置14に日本語文データを転送する。
この日本語文データは形態素解析装置14により形態素
解析された後、その解析結果は構文解析装置16に送出
される。そして形態素解析された日本語文データのうち
「美しい山。」が構文解析装置16により第2図(イ)
に示すように解析されたとする。すなわち、第2図(イ
)は単語「美しい」が単語「山」を修飾していることを
意味している。この解析結果は構文解析装置16より関
連性判定装置20に送出され、関連性判定装置20は第
3図に示すように中心語(対象となる語)である「美し
い」と関連語である「山」とをこれらの語の関連性を示
すデータである識別番号、あるいは辞書アドレス(単語
辞書ROM 22に登録されているアドレス)及び文例
その他の辞書情報と共に関連性スタック18に登録する
なお、第3図において文番号は構文解析(あるいは形態
素解析)される際に文単位毎に付される登録番号であり
、また識別番号は例えば「1」は修飾関係、「2」は置
き替え関係、「3」は指示関係、・・・を示している。
次に「美しい日本の山」という日本語文データが形態素
解析された後に構文解析装置16に入力されると、構文
解析装置16では構文解析する際に単語「美しい」が「
日本」にも「山」にも修飾し得るので、解析結果に曖昧
さが生じ、構文解析装置16は関連性判定装置20を起
動する。
起動された関連性判定装置20は単語「美しい」をキー
ワードとして関連性スタック18の記憶内容を検索し、
その関連語及び識別記号を調べる。この結果、単語1山
」と単語「美しい」は修飾関係にあることが判定され、
この判定結果及び辞書情報が構文解析装置16に送出さ
れる。
構文解析装置16ではこれらの情報に基づいて日本語文
データ「美しい日本の山」における単語「美しい」は単
語「日本」よシも単語印旧を修飾する可能性が大きいと
判断し、上記日本語文データは第2図(ロ)に示すよう
に解析される。
すなわち「美しい山」、「日本の」がいずれも1山」を
修飾し、「日本の山が美しい」という意味に構文解析さ
れる。
以上に説明したように本実施例では入力される日本語文
に現れる単語相互の関連性を自動的に抽出し、しかも構
分解析時にその関連性及び関連語を示すデータを参照す
るように構成したので、構文解析結果の曖昧さを減少さ
せることができる。
また本実施例では構文解析と関連性抽出を同時に行うの
で構文解析の処理速度を高速に行うことができる。
次に本発明に係る日本語解析装置の他の実施例の構成を
第4図に示す。本実施例が第1図に示した実施例と構成
上、異なる点は単語と単語との関連性を示す関連性・ぐ
ターンが記憶されている関連性表現辞書ROM 40と
形態素解析された日本語文データを関連性表現辞書RO
M 40の記憶内容を参照して関連性ある語の組を抽出
し、予め関連性スタック118に登録する関連性抽出装
置50とを設けた点であり、他の構成は全く同様である
ので重複する説明は省略する。
本実施例における日本語解析装置の動作を以下に説明す
る。まずキーボード10のキー操作により、たとえば「
犬は太部である。・・・・・・吠えて、 いる彼の太部
は・・・・・・。彼は高校生である。・・・」なる文章
の日本語文データが処理制御装置12に入力され、この
入力動作が完了すると、上記日本語文データは処理制御
装置12より形態素解析装置14に転送される。
そしてこの日本語文データは形態素解析装置14により
形態素解析され、この解析結果は関連性抽出装置50に
送出される。
関連性表現辞書ROM 40には第5図に示すように関
連性パターン、中心語と関連語との関連性を示す識別記
号及び中心語と関連語との一覧が登録されている。ここ
で同図において、関連語及び中心語の欄でA/Bの表示
は「AまたはB」を意味するものとする。
さて、関連性抽出装置50は関連性表現辞書ROM 4
0の記憶内容を参照し、形態素解析装置14から送出さ
れた日本語文データから関連性のある語の組を抽出して
関連性スタック118に書き込む。この場合に上記日本
語文データのうち「犬は太部である。」と「彼は高校生
である。」が関連性表現辞書ROM 40における関連
性パターンの「名詞l十は十名詞2+である」と一致す
るので第6図に示すように関連性スタック18に書き込
む。
一方、形態素解析装置14よりパスライン30を介して
構文解析装置16に日本語文データが送出され、構文解
析装置16で日本語文データ「吠えている彼の太部は・
・・・・・」を構文解析する場合に「吠えている」は「
彼」にも「太部」にも係り得る。ここで構文解析装置1
6には単語「彼」、「太部」についていずれも「名詞」
であり、「人間」を相称するという情報しかないために
構文解析に曖昧さが生じる。このように構文解析に曖昧
さが生じると、構文解析装置16よシ関連性判定装置2
0が起動される。
関連性判定装置20では単語「彼」と「太部」について
関連性スタック118の記憶内容を検索し、その結果「
彼」は「高校生」であり且つ「太部」は「犬」であると
いう単語の関連性についての情報を得る。次にこれらの
単語の辞書アドレスから単語辞書ROM 22の記憶内
容を検索し、各単語についての辞書情報、すなわち「犬
」は「動物」であり、「高校生」は「人間」であるとい
う情報を得る。
関連性判定装置20は単語の関連性情報及び辞書情報を
構文解析装置16に送出する。構文解析装置16では関
連性判定装置20からの前記各情報に基づいて再び構文
解析を行う。ここで単語辞書ROM 22からはすでに
、「吠えている」という語に関して「この状態は人間よ
りも動物である可能性が大きい」という情報が得られて
いる。したがって既に「太部」が「犬」という「動物」
であることが判っているので第2図(ハ)に示すように
、「彼の犬が吠えている」という意味に一意に構文解析
をすることができる。
以上に説明したように本実施例では、入力された日本語
文データ全体に出現する単語の関連性についての情報を
抽出し、該情報を参照して構文解析するように構成した
ので、より正確に構文解析を行うことができる。
効果 本発明では入力された文章に現れる単語の構文上の関連
性を自動的に抽出し、この関連性を示すデータを記憶手
段に記憶させておき、構文解析時にこれらのデータを参
照するように構成したので、構文解析結果の曖昧さを減
少させることができる。
【図面の簡単な説明】
第1図は本発明に係る日本語解析装置の一実施例の構成
を示すブロック図、 第2図は、第1図の実施ρlにおける構文解析装置の解
析結果を示す説明図、 第3図は、第1図の実施例における関連性スタックの記
憶内容を示す説明図、 第4図は本発明に係る日本語解析装置の他の実施例の構
成を示すブロック図、 第5図は、第4図の実施例における関連性表現辞書RO
Mの記憶内容を示す説明図、第6図は、第4図の実施例
における関連性スタックの記憶内容を示す説明図である
。 主要部分の符号の説明 10・・・キーボード 12・・・処理制御装置 14・・・形態素解析装置 16・・・構文解析装置 18・・・関連性スタック 20・・・関連性判定装置 40・・・関連性表現辞書ROM 50・・・関連性抽出装置 118・・・関連性スタック

Claims (1)

  1. 【特許請求の範囲】 構文解析すべき日本語文データを入力するための入力手
    段と、 前記入力手段により入力された日本語文データの形態素
    解析処理を行う形態素解析手段と、形態素解析手段の解
    析結果に基づいて構文解析を行う構文解析手段と、 構文上、関連性を有する語の組及びこれらの語の関連性
    等を示すデータを記憶する記憶手段と、 構文解析手段の解析結果に基づいて文単位に構文上、相
    互に関連性を有する語の組を抽出し、これらの語の組及
    びこれらの語の組の関連性等を示すデータを前記記憶手
    段に記憶させると共に、構文解析手段の解析結果に曖昧
    さが生じた場合に対象となる語について記憶手段の記憶
    内容を検索してその語と関連語との関連性を判定し、そ
    の判定結果を構文解析手段に送出する関連性判定手段と
    を有することを特徴とする日本語解析装置。
JP59185392A 1984-09-06 1984-09-06 日本語解析装置 Granted JPS6165358A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59185392A JPS6165358A (ja) 1984-09-06 1984-09-06 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59185392A JPS6165358A (ja) 1984-09-06 1984-09-06 日本語解析装置

Publications (2)

Publication Number Publication Date
JPS6165358A true JPS6165358A (ja) 1986-04-03
JPH0576658B2 JPH0576658B2 (ja) 1993-10-25

Family

ID=16170004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59185392A Granted JPS6165358A (ja) 1984-09-06 1984-09-06 日本語解析装置

Country Status (1)

Country Link
JP (1) JPS6165358A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS584481A (ja) * 1981-06-30 1983-01-11 Fujitsu Ltd 日本語解析システム
JPS59201182A (ja) * 1983-04-28 1984-11-14 Nec Corp 言語意味解析装置
JPS60157659A (ja) * 1984-01-27 1985-08-17 Hitachi Ltd 日本語解析方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS584481A (ja) * 1981-06-30 1983-01-11 Fujitsu Ltd 日本語解析システム
JPS59201182A (ja) * 1983-04-28 1984-11-14 Nec Corp 言語意味解析装置
JPS60157659A (ja) * 1984-01-27 1985-08-17 Hitachi Ltd 日本語解析方式

Also Published As

Publication number Publication date
JPH0576658B2 (ja) 1993-10-25

Similar Documents

Publication Publication Date Title
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH07282055A (ja) 文解析方法および装置
JP2815714B2 (ja) 翻訳装置
US4860206A (en) Translation system allowing user designation of postpositional words
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH04139580A (ja) 見出し語探索システム
JP2828692B2 (ja) 情報検索装置
JPS6165358A (ja) 日本語解析装置
JPH0715691B2 (ja) 自動翻訳装置
JP2682048B2 (ja) 文章処理装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH0410161A (ja) 省略補完処理装置
JP2954592B2 (ja) 言語解析装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPS61281367A (ja) 英語解析における名詞句決定方式
JPH0340067A (ja) 文章検索方式
JPH0816910B2 (ja) 言語解析装置
JPH05225228A (ja) 指示詞照応装置
JPS63136264A (ja) 機械翻訳装置
JPH05113993A (ja) 辞書登録方式
JPH05233686A (ja) 日本語処理装置
JPH0683809A (ja) 文書処理装置
JPH05282289A (ja) 文書作成装置
JPH0468466A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term