JPS6386072A - 日本文解析制御方式 - Google Patents
日本文解析制御方式Info
- Publication number
- JPS6386072A JPS6386072A JP61232827A JP23282786A JPS6386072A JP S6386072 A JPS6386072 A JP S6386072A JP 61232827 A JP61232827 A JP 61232827A JP 23282786 A JP23282786 A JP 23282786A JP S6386072 A JPS6386072 A JP S6386072A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- word
- results
- noun phrase
- dependency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 150
- 238000000034 method Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は日本文解析制御方式に関し、特に日本文から他
の言語への翻訳を自動的に行う自動翻訳システムや、日
本文で表現された検索要求に従って情報をデータベース
から検索する情報検索システム等において1日本文を解
析する際に、解析多義の状態から絞り込んで、解析を効
率的に行うとともに、解析精度を向上させるに好適な日
本文解析制御方式に関するものである。
の言語への翻訳を自動的に行う自動翻訳システムや、日
本文で表現された検索要求に従って情報をデータベース
から検索する情報検索システム等において1日本文を解
析する際に、解析多義の状態から絞り込んで、解析を効
率的に行うとともに、解析精度を向上させるに好適な日
本文解析制御方式に関するものである。
日本文解析における探索方式としては、いわゆる「横型
探索方式」と、「縦型探索方式」とがある。
探索方式」と、「縦型探索方式」とがある。
前者は可能な解釈をすべて求める方式であり、後者は可
能な解釈を一つ求める方式と言える。これらの探索方式
を用いる日本文解析の初期段階は、一般的に、次の如く
行われている。
能な解釈を一つ求める方式と言える。これらの探索方式
を用いる日本文解析の初期段階は、一般的に、次の如く
行われている。
まず、入力文がどのような語から成るかを解析するため
の単語解析が行われる。単語の認定の仕方には多義が生
ずるのが通常である。従来、多くの場合に、単語解析の
結果は一意に絞られるが。
の単語解析が行われる。単語の認定の仕方には多義が生
ずるのが通常である。従来、多くの場合に、単語解析の
結果は一意に絞られるが。
この段階で一意に絞ってしまうことは、処理を高速化す
るためには効果的であるものの、これは解析の精度を低
下させてしまう恐れがある。
るためには効果的であるものの、これは解析の精度を低
下させてしまう恐れがある。
次のステップは、文節間の係り受け関係の解析である。
一般に、この段階でも多くの解析多義が生ずる。ここで
、解析処理全体の精度を高めるために、単語解析の結果
に多義を残した場合、これらの組合せだけの多義が生ず
ることになる。
、解析処理全体の精度を高めるために、単語解析の結果
に多義を残した場合、これらの組合せだけの多義が生ず
ることになる。
このため、前述の可能な解釈をすべて求める方式(横型
探索形)の解析においては、多くの計算時間を必要とす
るという問題があった。また、可能な解釈を1つ求める
方式(縦型探索形)の解析においては、処理の途中でそ
れまでの解析が誤っていたことが判明した場合に、誤り
の原因となったところまで処理を遡る、いわゆる、バッ
クトラックを行う必要が生じ、これは制御機構を著しく
複雑にするという問題があった。
探索形)の解析においては、多くの計算時間を必要とす
るという問題があった。また、可能な解釈を1つ求める
方式(縦型探索形)の解析においては、処理の途中でそ
れまでの解析が誤っていたことが判明した場合に、誤り
の原因となったところまで処理を遡る、いわゆる、バッ
クトラックを行う必要が生じ、これは制御機構を著しく
複雑にするという問題があった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の日本文解析制御方式における上述
の如き問題を解消し、日本文解析において単語の多義お
よび文節間の係り受けの多義を原因として生ずる解析多
義を1日本文中の名詞句部分の妥当性を検定することに
よって減少させ、精度の良い日本文解析を効率良く実現
する日本文解析制御方式を提供することにある。
するところは、従来の日本文解析制御方式における上述
の如き問題を解消し、日本文解析において単語の多義お
よび文節間の係り受けの多義を原因として生ずる解析多
義を1日本文中の名詞句部分の妥当性を検定することに
よって減少させ、精度の良い日本文解析を効率良く実現
する日本文解析制御方式を提供することにある。
本発明の上述の目的は、入力日本文の単語解析と、該単
語解析の結果に対する文節間係り受け解析とを行う日本
文解析システムにおいて、前記単語解析の結果の多義お
よびそれぞれの単語解析の結果に対する文節間係り受け
解析の多義が生ずるとき、該単語解析結果および単語解
析結果に対する文節間係り受け解析結果を二次元の配列
に表現し、その各要素に対応する各解析結果中に含まれ
る名詞句の名詞間の意味関係の妥当性を検定し、誤った
解析結果を除去することを特徴とする日本文解析制御方
式によって達成される。
語解析の結果に対する文節間係り受け解析とを行う日本
文解析システムにおいて、前記単語解析の結果の多義お
よびそれぞれの単語解析の結果に対する文節間係り受け
解析の多義が生ずるとき、該単語解析結果および単語解
析結果に対する文節間係り受け解析結果を二次元の配列
に表現し、その各要素に対応する各解析結果中に含まれ
る名詞句の名詞間の意味関係の妥当性を検定し、誤った
解析結果を除去することを特徴とする日本文解析制御方
式によって達成される。
本発明においては、入力日本文の単語解析結果の多義1
文節の内部構造を考慮せずに文節間の係り受け解析結果
を整理した係り受けパターンの多義を二次元の配列に表
現し、その要素に対応する各解析結果中に含まれる名詞
句部分の妥当性を、上記名詞句内に含まれる名詞間の意
味関係の妥当性を検定することによって検定し、一つで
も妥当でない名詞句を含む場合、その解析結果自体を妥
当でないと判定し、これを配列の要素として表現する。
文節の内部構造を考慮せずに文節間の係り受け解析結果
を整理した係り受けパターンの多義を二次元の配列に表
現し、その要素に対応する各解析結果中に含まれる名詞
句部分の妥当性を、上記名詞句内に含まれる名詞間の意
味関係の妥当性を検定することによって検定し、一つで
も妥当でない名詞句を含む場合、その解析結果自体を妥
当でないと判定し、これを配列の要素として表現する。
これにより、従来の解析方式よりも早い段階で妥当でな
い解析結果を排除できるため1本解析制御方式を用いる
ことによって解析精度を高め、解析処理に要する計算量
・時間を減少させることが可能になる。
い解析結果を排除できるため1本解析制御方式を用いる
ことによって解析精度を高め、解析処理に要する計算量
・時間を減少させることが可能になる。
以下、本発明の実施例を図面に基づいて詳細に説明する
。
。
第2図は本発明の一実施例である、解析制御装置および
解析制御テーブルを備えた日本文解析装置の構成図であ
る。図において、1は日本文解析装置、2は単語解析装
置、3は文節間係り受け解析装置、4は後述する解析制
御装置、5は同じく後述する解析制御テーブル、6は後
述する名詞句解析装置、7は意味解析装置を示している
。
解析制御テーブルを備えた日本文解析装置の構成図であ
る。図において、1は日本文解析装置、2は単語解析装
置、3は文節間係り受け解析装置、4は後述する解析制
御装置、5は同じく後述する解析制御テーブル、6は後
述する名詞句解析装置、7は意味解析装置を示している
。
第3図は上記解析制御テーブル5の概念図である0本テ
ーブルは、縦方向に上記単語解析装置2による解析結果
(1〜m)を、また、横方向に上記文節間係り咲は解析
装置3による解析結果のパターン(1〜n)を、それぞ
れ配したものであり、その要素c(ipj)として、後
述する値を格納したものである。
ーブルは、縦方向に上記単語解析装置2による解析結果
(1〜m)を、また、横方向に上記文節間係り咲は解析
装置3による解析結果のパターン(1〜n)を、それぞ
れ配したものであり、その要素c(ipj)として、後
述する値を格納したものである。
なお、上に示した係り受け解析結果のパターンとは、各
単語解析結果対応に生ずる文節間係り受け解析結果を、
後に示す具体例で明らかになる如く、単語の多義を無視
してパターンとして整理したものである。また、解析制
御テーブルにおける要素C(x # J )は次のよう
な値をとる。
単語解析結果対応に生ずる文節間係り受け解析結果を、
後に示す具体例で明らかになる如く、単語の多義を無視
してパターンとして整理したものである。また、解析制
御テーブルにおける要素C(x # J )は次のよう
な値をとる。
解析制御装置4の機能の概要は下記の如きものである。
すなわち、解析制御装置4は上記解析制御テーブル5を
初期生成し、その内容に基づき名詞句解析装置6を起動
する。名詞句解析装置6は名詞句解析の成否によって上
記解析制御テーブル5の内容を修正する。また、解析制
御装置i’Z4は修正された上記解析制御テーブル5の
内容に基づいて、意味解析装置7を起動する。すなわち
、意味解析の対象となるのは単語解析結果と係り受け解
析結果の実際に生じた組合せの中で、名詞句解析結果が
妥当であったもののみである。
初期生成し、その内容に基づき名詞句解析装置6を起動
する。名詞句解析装置6は名詞句解析の成否によって上
記解析制御テーブル5の内容を修正する。また、解析制
御装置i’Z4は修正された上記解析制御テーブル5の
内容に基づいて、意味解析装置7を起動する。すなわち
、意味解析の対象となるのは単語解析結果と係り受け解
析結果の実際に生じた組合せの中で、名詞句解析結果が
妥当であったもののみである。
上記解析制御装置4を構成する論理を第1図に示した。
まず、単語解析と係り受け解析の組合せから係り受けパ
ターンとしては、どのようなものがいくつあるかを決定
する(ステップ31)0次に、単語解析結果の数(mと
する)および係り受けパターンの数(nとする)から、
前記解析制御テーブル5(mXnの配列)を生成し、後
述する如く初期値を設定する(ステップ32)。
ターンとしては、どのようなものがいくつあるかを決定
する(ステップ31)0次に、単語解析結果の数(mと
する)および係り受けパターンの数(nとする)から、
前記解析制御テーブル5(mXnの配列)を生成し、後
述する如く初期値を設定する(ステップ32)。
次に、上記解析制御テーブル5の内容に従い、その解析
結果中に含まれる名詞句についてその妥当性を検定する
(ステップ33)、この検定は1例えば1名詞間の意味
関係の成否をチェックするための意味関係検定テーブル
を準備しておき、これとの照合を行う0名詞句中の〔名
詞−名詞〕の二項関係が一つでも妥当でないと判定され
るとき、その名詞句は妥当、でないと判定され、その名
詞句を含む係り受けパターンと単語解析結果の組合せも
妥当でないと判定される。このとき、 C(i、j)=t−DC(i、j)=falseとなり
(ステップ34)、以後の意味解析の対象外となる。
結果中に含まれる名詞句についてその妥当性を検定する
(ステップ33)、この検定は1例えば1名詞間の意味
関係の成否をチェックするための意味関係検定テーブル
を準備しておき、これとの照合を行う0名詞句中の〔名
詞−名詞〕の二項関係が一つでも妥当でないと判定され
るとき、その名詞句は妥当、でないと判定され、その名
詞句を含む係り受けパターンと単語解析結果の組合せも
妥当でないと判定される。このとき、 C(i、j)=t−DC(i、j)=falseとなり
(ステップ34)、以後の意味解析の対象外となる。
第4〜8図は例文に対する動作例を示すものである。こ
の例は、入力文「私は木の机のひき出しに手紙をしまっ
た。」に関するものである。
の例は、入力文「私は木の机のひき出しに手紙をしまっ
た。」に関するものである。
単語解析結果(第4図参照)および係り受け解析結果(
第5図参照)によって、以下の4通りの解釈が生ずる。
第5図参照)によって、以下の4通りの解釈が生ずる。
なお、第4図において、(1)と(2)との違いは、文
節2の「木」の意味マーカが「材木」の意味と、「樹木
」の意味の場合があることを示しているものである。
節2の「木」の意味マーカが「材木」の意味と、「樹木
」の意味の場合があることを示しているものである。
また、第5図は、第4図に示した2通りの単語解析結果
から、通常の構造解析手法により、単語解析結果(1)
、(2)から、それぞれ、(a)、(b)および(c)
、(d)の4通りの文節間係り受け解析結果が抽出され
ることを示している。そして、意味を考えず、形だけで
見ると、(a)と(Q)、(b)と(d)がそれぞれ同
じであることから、前記係り受けパターンとして、(A
)、(B)の2通りを得る。
から、通常の構造解析手法により、単語解析結果(1)
、(2)から、それぞれ、(a)、(b)および(c)
、(d)の4通りの文節間係り受け解析結果が抽出され
ることを示している。そして、意味を考えず、形だけで
見ると、(a)と(Q)、(b)と(d)がそれぞれ同
じであることから、前記係り受けパターンとして、(A
)、(B)の2通りを得る。
第6図は、この状態における前記解析制御テーブル5の
内容、すなわち、初期状態を示すものである。
内容、すなわち、初期状態を示すものである。
第7図は、前記名詞句解析装置6の動作による名詞句解
析における意味関係の検定結果を示すものである。この
検定は、名詞の上位概念同志の関係について、予め作成
されたテーブル(これを「意味関係検定テーブル」とい
う)を参照して行われるものである。上述の「木の」、
「机」、「ひき出し」の場合、その上位概念は、それぞ
れ、「樹木」または「材木」、「家具」、「場所」であ
り、意味的に結合筒なものとしては、「材木」としての
「木の」に対して「机」が抽出され、「ひき出し」は破
棄される。
析における意味関係の検定結果を示すものである。この
検定は、名詞の上位概念同志の関係について、予め作成
されたテーブル(これを「意味関係検定テーブル」とい
う)を参照して行われるものである。上述の「木の」、
「机」、「ひき出し」の場合、その上位概念は、それぞ
れ、「樹木」または「材木」、「家具」、「場所」であ
り、意味的に結合筒なものとしては、「材木」としての
「木の」に対して「机」が抽出され、「ひき出し」は破
棄される。
これにより、第5図に示した係り受けパターン(B)を
持つものはすべて妥当でなく、また、「木」を「樹木」
との意味とする解釈も妥当ではないとされる。このため
、第6図に示した解析制御テーブル5の内容は第8図に
示す如く変更され、4通りの解釈が1つに絞られる。
持つものはすべて妥当でなく、また、「木」を「樹木」
との意味とする解釈も妥当ではないとされる。このため
、第6図に示した解析制御テーブル5の内容は第8図に
示す如く変更され、4通りの解釈が1つに絞られる。
上記実施例によれば、名詞句という部分的構造の解析結
果を文全体の解析制御に利用して、解析精度の向上、解
析処理の効率化を実現することができる。
果を文全体の解析制御に利用して、解析精度の向上、解
析処理の効率化を実現することができる。
上記実施例においては、単語解析2文節係り受け解析の
方法については特に説明しなかったが、これには種々の
方法が利用できる。また、名詞句の妥当性の検定は、上
記実施例に示した名詞間の意味関係検定テーブルによら
ず、他の方法によっても良い。
方法については特に説明しなかったが、これには種々の
方法が利用できる。また、名詞句の妥当性の検定は、上
記実施例に示した名詞間の意味関係検定テーブルによら
ず、他の方法によっても良い。
以上述べた如く、本発明によれば、入力日本文の単語解
析と、該単語解析の結果に対する文節間係り受け解析と
を行う日本文解析システムにおいて、前記単語解析の結
果の多義およびそれぞれの単語解析の結果に対する文節
間係り受け解析の多義が生ずるとき、該単語解析結果お
よび単語解析結果に対する文節間係り受け解析結果を二
次元の配列に表現し、その各要素に対応する各解析結果
中に含まれる名詞句の名詞間の意味関係の妥当性を検定
し、誤った解析結果を除去するようにしたので、単語の
多義および文節間の係り受けの多義を原因として生ずる
解析多義を、当該日本文中の名詞句部分の妥当性を検定
することによって減少させ、精度の良い日本文解析を効
率良く実現する日本文解析制御方式を実現できるという
顕著な効果を奏するものである。
析と、該単語解析の結果に対する文節間係り受け解析と
を行う日本文解析システムにおいて、前記単語解析の結
果の多義およびそれぞれの単語解析の結果に対する文節
間係り受け解析の多義が生ずるとき、該単語解析結果お
よび単語解析結果に対する文節間係り受け解析結果を二
次元の配列に表現し、その各要素に対応する各解析結果
中に含まれる名詞句の名詞間の意味関係の妥当性を検定
し、誤った解析結果を除去するようにしたので、単語の
多義および文節間の係り受けの多義を原因として生ずる
解析多義を、当該日本文中の名詞句部分の妥当性を検定
することによって減少させ、精度の良い日本文解析を効
率良く実現する日本文解析制御方式を実現できるという
顕著な効果を奏するものである。
第1図は本発明の一実施例である日本文解析装置の要部
である解析制御装置の処理フローチャート、第2図は実
施例である日本文解析装置の構成図、第3図は解析制御
テーブルの概念図、第4図は単語解析結果の具体例を示
す図、第5図は係り受け解析結果の具体例を示す図、第
6図は解析制御テーブルの初期状態を示す図、第7図は
名詞句解析におけ′る意味関係の検定結果を示す図、第
8図は解析制御テーブルの更新された状態を示す図であ
る。 1:日本文解析装置、2:単語解析装置、3:文節間係
り受け解析装置、4:解析制御装置、5:解析制御テー
ブル、6:名詞句解析装置、7:意味解析装置。 第 1 図 第 2 図 第 3 図 係り受けパターン− 第6図 第 4 図 〈入力文〉 “私は木の机のひき出しに手紙分しまった。′。 く単語解析結果〉 ■ ■ (5@未マーカー「材木」) ■ (意味マーカー「樹木」) 第 5 図 〈係り受け解析結果〉 第 7 図 第 8 図
である解析制御装置の処理フローチャート、第2図は実
施例である日本文解析装置の構成図、第3図は解析制御
テーブルの概念図、第4図は単語解析結果の具体例を示
す図、第5図は係り受け解析結果の具体例を示す図、第
6図は解析制御テーブルの初期状態を示す図、第7図は
名詞句解析におけ′る意味関係の検定結果を示す図、第
8図は解析制御テーブルの更新された状態を示す図であ
る。 1:日本文解析装置、2:単語解析装置、3:文節間係
り受け解析装置、4:解析制御装置、5:解析制御テー
ブル、6:名詞句解析装置、7:意味解析装置。 第 1 図 第 2 図 第 3 図 係り受けパターン− 第6図 第 4 図 〈入力文〉 “私は木の机のひき出しに手紙分しまった。′。 く単語解析結果〉 ■ ■ (5@未マーカー「材木」) ■ (意味マーカー「樹木」) 第 5 図 〈係り受け解析結果〉 第 7 図 第 8 図
Claims (1)
- (1)入力日本文の単語解析と、該単語解析の結果に対
する文節間係り受け解析とを行う日本文解析システムに
おいて、前記単語解析の結果の多義およびそれぞれの単
語解析の結果に対する文節間係り受け解析の多義が生ず
るとき、該単語解析結果および単語解析結果に対する文
節間係り受け解析結果を二次元の配列に表現し、その各
要素に対応する各解析結果中に含まれる名詞句の名詞間
の意味関係の妥当性を検定し、誤った解析結果を除去す
ることを特徴とする日本文解析制御方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61232827A JPS6386072A (ja) | 1986-09-30 | 1986-09-30 | 日本文解析制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61232827A JPS6386072A (ja) | 1986-09-30 | 1986-09-30 | 日本文解析制御方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6386072A true JPS6386072A (ja) | 1988-04-16 |
Family
ID=16945404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61232827A Pending JPS6386072A (ja) | 1986-09-30 | 1986-09-30 | 日本文解析制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6386072A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS584481A (ja) * | 1981-06-30 | 1983-01-11 | Fujitsu Ltd | 日本語解析システム |
JPS6224359A (ja) * | 1985-07-25 | 1987-02-02 | Ricoh Co Ltd | 日本語処理装置 |
-
1986
- 1986-09-30 JP JP61232827A patent/JPS6386072A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS584481A (ja) * | 1981-06-30 | 1983-01-11 | Fujitsu Ltd | 日本語解析システム |
JPS6224359A (ja) * | 1985-07-25 | 1987-02-02 | Ricoh Co Ltd | 日本語処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5680628A (en) | Method and apparatus for automated search and retrieval process | |
US4586160A (en) | Method and apparatus for analyzing the syntactic structure of a sentence | |
EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
JPH0242572A (ja) | 共起関係辞書生成保守方法 | |
JPS61163467A (ja) | 機械翻訳システム | |
JPS63305463A (ja) | 自然言語処理方式 | |
JPS58192173A (ja) | 機械翻訳装置 | |
US20220004708A1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons | |
JPS6386072A (ja) | 日本文解析制御方式 | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JP2812511B2 (ja) | キーワード抽出装置 | |
JP2807236B2 (ja) | 形態素解析方法 | |
JPH0287273A (ja) | 自動翻訳装置 | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JPH0795323B2 (ja) | 自然言語処理装置 | |
JPS63132379A (ja) | 自然言語文生成方法 | |
JPS63298476A (ja) | 翻訳方式 | |
JP2580336B2 (ja) | 言語処理系における名前の属性検査処理方式 | |
JPH0715692B2 (ja) | 文脈処理装置 | |
JPH0333977A (ja) | 構文解析装置における文法誤り発見方法 | |
JPS63228374A (ja) | 翻訳処理装置 | |
Farwell et al. | Using Machine Readable Dictionaries for the Creation of Lexicons | |
JPH0752391B2 (ja) | 複数データベース記述を含む原始プログラムの翻訳方式 | |
JPH02226364A (ja) | 構文解析装置 | |
JPS6320567A (ja) | 翻訳装置 |