JPS6386072A - 日本文解析制御方式 - Google Patents

日本文解析制御方式

Info

Publication number
JPS6386072A
JPS6386072A JP61232827A JP23282786A JPS6386072A JP S6386072 A JPS6386072 A JP S6386072A JP 61232827 A JP61232827 A JP 61232827A JP 23282786 A JP23282786 A JP 23282786A JP S6386072 A JPS6386072 A JP S6386072A
Authority
JP
Japan
Prior art keywords
analysis
word
results
noun phrase
dependency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61232827A
Other languages
English (en)
Inventor
Yoshihiko Hayashi
良彦 林
Akio Yokoo
昭男 横尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61232827A priority Critical patent/JPS6386072A/ja
Publication of JPS6386072A publication Critical patent/JPS6386072A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は日本文解析制御方式に関し、特に日本文から他
の言語への翻訳を自動的に行う自動翻訳システムや、日
本文で表現された検索要求に従って情報をデータベース
から検索する情報検索システム等において1日本文を解
析する際に、解析多義の状態から絞り込んで、解析を効
率的に行うとともに、解析精度を向上させるに好適な日
本文解析制御方式に関するものである。
〔従来の技術〕
日本文解析における探索方式としては、いわゆる「横型
探索方式」と、「縦型探索方式」とがある。
前者は可能な解釈をすべて求める方式であり、後者は可
能な解釈を一つ求める方式と言える。これらの探索方式
を用いる日本文解析の初期段階は、一般的に、次の如く
行われている。
まず、入力文がどのような語から成るかを解析するため
の単語解析が行われる。単語の認定の仕方には多義が生
ずるのが通常である。従来、多くの場合に、単語解析の
結果は一意に絞られるが。
この段階で一意に絞ってしまうことは、処理を高速化す
るためには効果的であるものの、これは解析の精度を低
下させてしまう恐れがある。
次のステップは、文節間の係り受け関係の解析である。
一般に、この段階でも多くの解析多義が生ずる。ここで
、解析処理全体の精度を高めるために、単語解析の結果
に多義を残した場合、これらの組合せだけの多義が生ず
ることになる。
〔発明が解決しようとする問題点〕
このため、前述の可能な解釈をすべて求める方式(横型
探索形)の解析においては、多くの計算時間を必要とす
るという問題があった。また、可能な解釈を1つ求める
方式(縦型探索形)の解析においては、処理の途中でそ
れまでの解析が誤っていたことが判明した場合に、誤り
の原因となったところまで処理を遡る、いわゆる、バッ
クトラックを行う必要が生じ、これは制御機構を著しく
複雑にするという問題があった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の日本文解析制御方式における上述
の如き問題を解消し、日本文解析において単語の多義お
よび文節間の係り受けの多義を原因として生ずる解析多
義を1日本文中の名詞句部分の妥当性を検定することに
よって減少させ、精度の良い日本文解析を効率良く実現
する日本文解析制御方式を提供することにある。
〔問題点を解決するための手段〕
本発明の上述の目的は、入力日本文の単語解析と、該単
語解析の結果に対する文節間係り受け解析とを行う日本
文解析システムにおいて、前記単語解析の結果の多義お
よびそれぞれの単語解析の結果に対する文節間係り受け
解析の多義が生ずるとき、該単語解析結果および単語解
析結果に対する文節間係り受け解析結果を二次元の配列
に表現し、その各要素に対応する各解析結果中に含まれ
る名詞句の名詞間の意味関係の妥当性を検定し、誤った
解析結果を除去することを特徴とする日本文解析制御方
式によって達成される。
〔作用〕
本発明においては、入力日本文の単語解析結果の多義1
文節の内部構造を考慮せずに文節間の係り受け解析結果
を整理した係り受けパターンの多義を二次元の配列に表
現し、その要素に対応する各解析結果中に含まれる名詞
句部分の妥当性を、上記名詞句内に含まれる名詞間の意
味関係の妥当性を検定することによって検定し、一つで
も妥当でない名詞句を含む場合、その解析結果自体を妥
当でないと判定し、これを配列の要素として表現する。
これにより、従来の解析方式よりも早い段階で妥当でな
い解析結果を排除できるため1本解析制御方式を用いる
ことによって解析精度を高め、解析処理に要する計算量
・時間を減少させることが可能になる。
〔実施例〕
以下、本発明の実施例を図面に基づいて詳細に説明する
第2図は本発明の一実施例である、解析制御装置および
解析制御テーブルを備えた日本文解析装置の構成図であ
る。図において、1は日本文解析装置、2は単語解析装
置、3は文節間係り受け解析装置、4は後述する解析制
御装置、5は同じく後述する解析制御テーブル、6は後
述する名詞句解析装置、7は意味解析装置を示している
第3図は上記解析制御テーブル5の概念図である0本テ
ーブルは、縦方向に上記単語解析装置2による解析結果
(1〜m)を、また、横方向に上記文節間係り咲は解析
装置3による解析結果のパターン(1〜n)を、それぞ
れ配したものであり、その要素c(ipj)として、後
述する値を格納したものである。
なお、上に示した係り受け解析結果のパターンとは、各
単語解析結果対応に生ずる文節間係り受け解析結果を、
後に示す具体例で明らかになる如く、単語の多義を無視
してパターンとして整理したものである。また、解析制
御テーブルにおける要素C(x # J )は次のよう
な値をとる。
解析制御装置4の機能の概要は下記の如きものである。
すなわち、解析制御装置4は上記解析制御テーブル5を
初期生成し、その内容に基づき名詞句解析装置6を起動
する。名詞句解析装置6は名詞句解析の成否によって上
記解析制御テーブル5の内容を修正する。また、解析制
御装置i’Z4は修正された上記解析制御テーブル5の
内容に基づいて、意味解析装置7を起動する。すなわち
、意味解析の対象となるのは単語解析結果と係り受け解
析結果の実際に生じた組合せの中で、名詞句解析結果が
妥当であったもののみである。
上記解析制御装置4を構成する論理を第1図に示した。
まず、単語解析と係り受け解析の組合せから係り受けパ
ターンとしては、どのようなものがいくつあるかを決定
する(ステップ31)0次に、単語解析結果の数(mと
する)および係り受けパターンの数(nとする)から、
前記解析制御テーブル5(mXnの配列)を生成し、後
述する如く初期値を設定する(ステップ32)。
次に、上記解析制御テーブル5の内容に従い、その解析
結果中に含まれる名詞句についてその妥当性を検定する
(ステップ33)、この検定は1例えば1名詞間の意味
関係の成否をチェックするための意味関係検定テーブル
を準備しておき、これとの照合を行う0名詞句中の〔名
詞−名詞〕の二項関係が一つでも妥当でないと判定され
るとき、その名詞句は妥当、でないと判定され、その名
詞句を含む係り受けパターンと単語解析結果の組合せも
妥当でないと判定される。このとき、 C(i、j)=t−DC(i、j)=falseとなり
(ステップ34)、以後の意味解析の対象外となる。
第4〜8図は例文に対する動作例を示すものである。こ
の例は、入力文「私は木の机のひき出しに手紙をしまっ
た。」に関するものである。
単語解析結果(第4図参照)および係り受け解析結果(
第5図参照)によって、以下の4通りの解釈が生ずる。
なお、第4図において、(1)と(2)との違いは、文
節2の「木」の意味マーカが「材木」の意味と、「樹木
」の意味の場合があることを示しているものである。
また、第5図は、第4図に示した2通りの単語解析結果
から、通常の構造解析手法により、単語解析結果(1)
、(2)から、それぞれ、(a)、(b)および(c)
、(d)の4通りの文節間係り受け解析結果が抽出され
ることを示している。そして、意味を考えず、形だけで
見ると、(a)と(Q)、(b)と(d)がそれぞれ同
じであることから、前記係り受けパターンとして、(A
)、(B)の2通りを得る。
第6図は、この状態における前記解析制御テーブル5の
内容、すなわち、初期状態を示すものである。
第7図は、前記名詞句解析装置6の動作による名詞句解
析における意味関係の検定結果を示すものである。この
検定は、名詞の上位概念同志の関係について、予め作成
されたテーブル(これを「意味関係検定テーブル」とい
う)を参照して行われるものである。上述の「木の」、
「机」、「ひき出し」の場合、その上位概念は、それぞ
れ、「樹木」または「材木」、「家具」、「場所」であ
り、意味的に結合筒なものとしては、「材木」としての
「木の」に対して「机」が抽出され、「ひき出し」は破
棄される。
これにより、第5図に示した係り受けパターン(B)を
持つものはすべて妥当でなく、また、「木」を「樹木」
との意味とする解釈も妥当ではないとされる。このため
、第6図に示した解析制御テーブル5の内容は第8図に
示す如く変更され、4通りの解釈が1つに絞られる。
上記実施例によれば、名詞句という部分的構造の解析結
果を文全体の解析制御に利用して、解析精度の向上、解
析処理の効率化を実現することができる。
上記実施例においては、単語解析2文節係り受け解析の
方法については特に説明しなかったが、これには種々の
方法が利用できる。また、名詞句の妥当性の検定は、上
記実施例に示した名詞間の意味関係検定テーブルによら
ず、他の方法によっても良い。
〔発明の効果〕
以上述べた如く、本発明によれば、入力日本文の単語解
析と、該単語解析の結果に対する文節間係り受け解析と
を行う日本文解析システムにおいて、前記単語解析の結
果の多義およびそれぞれの単語解析の結果に対する文節
間係り受け解析の多義が生ずるとき、該単語解析結果お
よび単語解析結果に対する文節間係り受け解析結果を二
次元の配列に表現し、その各要素に対応する各解析結果
中に含まれる名詞句の名詞間の意味関係の妥当性を検定
し、誤った解析結果を除去するようにしたので、単語の
多義および文節間の係り受けの多義を原因として生ずる
解析多義を、当該日本文中の名詞句部分の妥当性を検定
することによって減少させ、精度の良い日本文解析を効
率良く実現する日本文解析制御方式を実現できるという
顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例である日本文解析装置の要部
である解析制御装置の処理フローチャート、第2図は実
施例である日本文解析装置の構成図、第3図は解析制御
テーブルの概念図、第4図は単語解析結果の具体例を示
す図、第5図は係り受け解析結果の具体例を示す図、第
6図は解析制御テーブルの初期状態を示す図、第7図は
名詞句解析におけ′る意味関係の検定結果を示す図、第
8図は解析制御テーブルの更新された状態を示す図であ
る。 1:日本文解析装置、2:単語解析装置、3:文節間係
り受け解析装置、4:解析制御装置、5:解析制御テー
ブル、6:名詞句解析装置、7:意味解析装置。 第   1   図 第  2  図 第   3   図 係り受けパターン− 第6図 第   4   図 〈入力文〉 “私は木の机のひき出しに手紙分しまった。′。 く単語解析結果〉 ■ ■ (5@未マーカー「材木」) ■ (意味マーカー「樹木」) 第   5   図 〈係り受け解析結果〉 第   7   図 第   8   図

Claims (1)

    【特許請求の範囲】
  1. (1)入力日本文の単語解析と、該単語解析の結果に対
    する文節間係り受け解析とを行う日本文解析システムに
    おいて、前記単語解析の結果の多義およびそれぞれの単
    語解析の結果に対する文節間係り受け解析の多義が生ず
    るとき、該単語解析結果および単語解析結果に対する文
    節間係り受け解析結果を二次元の配列に表現し、その各
    要素に対応する各解析結果中に含まれる名詞句の名詞間
    の意味関係の妥当性を検定し、誤った解析結果を除去す
    ることを特徴とする日本文解析制御方式。
JP61232827A 1986-09-30 1986-09-30 日本文解析制御方式 Pending JPS6386072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61232827A JPS6386072A (ja) 1986-09-30 1986-09-30 日本文解析制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61232827A JPS6386072A (ja) 1986-09-30 1986-09-30 日本文解析制御方式

Publications (1)

Publication Number Publication Date
JPS6386072A true JPS6386072A (ja) 1988-04-16

Family

ID=16945404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61232827A Pending JPS6386072A (ja) 1986-09-30 1986-09-30 日本文解析制御方式

Country Status (1)

Country Link
JP (1) JPS6386072A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584481A (ja) * 1981-06-30 1983-01-11 Fujitsu Ltd 日本語解析システム
JPS6224359A (ja) * 1985-07-25 1987-02-02 Ricoh Co Ltd 日本語処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584481A (ja) * 1981-06-30 1983-01-11 Fujitsu Ltd 日本語解析システム
JPS6224359A (ja) * 1985-07-25 1987-02-02 Ricoh Co Ltd 日本語処理装置

Similar Documents

Publication Publication Date Title
US5680628A (en) Method and apparatus for automated search and retrieval process
US4586160A (en) Method and apparatus for analyzing the syntactic structure of a sentence
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JPH0242572A (ja) 共起関係辞書生成保守方法
JPS61163467A (ja) 機械翻訳システム
JPS63305463A (ja) 自然言語処理方式
JPS58192173A (ja) 機械翻訳装置
US20220004708A1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
JPS6386072A (ja) 日本文解析制御方式
JPS59140582A (ja) 自然言語翻訳援助方式
JP2812511B2 (ja) キーワード抽出装置
JP2807236B2 (ja) 形態素解析方法
JPH0287273A (ja) 自動翻訳装置
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH0795323B2 (ja) 自然言語処理装置
JPS63132379A (ja) 自然言語文生成方法
JPS63298476A (ja) 翻訳方式
JP2580336B2 (ja) 言語処理系における名前の属性検査処理方式
JPH0715692B2 (ja) 文脈処理装置
JPH0333977A (ja) 構文解析装置における文法誤り発見方法
JPS63228374A (ja) 翻訳処理装置
Farwell et al. Using Machine Readable Dictionaries for the Creation of Lexicons
JPH0752391B2 (ja) 複数データベース記述を含む原始プログラムの翻訳方式
JPH02226364A (ja) 構文解析装置
JPS6320567A (ja) 翻訳装置