JPH08235188A - 係り受け関係解析用辞書作成装置および係り受け関係解析装置 - Google Patents

係り受け関係解析用辞書作成装置および係り受け関係解析装置

Info

Publication number
JPH08235188A
JPH08235188A JP7041519A JP4151995A JPH08235188A JP H08235188 A JPH08235188 A JP H08235188A JP 7041519 A JP7041519 A JP 7041519A JP 4151995 A JP4151995 A JP 4151995A JP H08235188 A JPH08235188 A JP H08235188A
Authority
JP
Japan
Prior art keywords
dependency
dependency relationship
relation
dictionary
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7041519A
Other languages
English (en)
Inventor
Hitoshi Sakamoto
仁 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7041519A priority Critical patent/JPH08235188A/ja
Publication of JPH08235188A publication Critical patent/JPH08235188A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 係り受け関係の曖昧な表現も、不確定な係り
受け関係を解析するための根拠情報として用いることが
できるようにする。 【構成】 辞書保持部11は、係り受け関係解析用の辞
書を保持する。入力文解析部12は、入力文から係り受
け関係を検出する。係り受け記憶部14は、不確定な係
り受け関係を解析するための根拠情報を検索する。入力
文解析部12は、この検索結果に基づいて、不確定な係
り受け関係を解析する。関係抽出部13は、入力文析部
12からの要求によって、係り受け記憶部14に、確実
な係り受け関係と不確定な係り受け関係の検索と登録を
要求する。係り受け記憶部14は、この要求を実行す
る。この場合、確実な係り受け関係は、出現頻度を示す
情報といっしょに登録される。不確定な係り受け関係
は、類似する係り受け関係が存在する場合は、これと併
合された状態で、存在しない場合は、単独で登録され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、不確定な係り受け関
係を解析するための辞書を作成する係り受け関係解析用
辞書作成装置に関する。また、この発明は、不確定な係
り受け関係を解析する係り受け関係解析装置に関する。
【0002】
【従来の技術】一般に、機械翻訳装置等の自然言語処理
装置においては、形態素解析と構文解析により、入力文
の係り受け構造を解析する。
【0003】しかし、形態素解析や構文解析によって
は、自然言語文の係り受け構造を正確に解析することが
できない場合がある。したがって、上述した自然言語処
理装置においては、構文解析等によって解析することが
できなかった不確定な係り受け関係を解析する機能が別
途必要になる。
【0004】不確定な係り受け関係を解析する場合、通
常、辞書が用いられる。この解析用の辞書としては、各
語ごとに、その性質を記述した辞書が考えられる。しか
し、このような辞書より、複数の語の組合わせごとに、
その性質を記述した辞書の方が解析精度を高めることが
できることが知られている。
【0005】複数の語の組合わせごとに、その性質を記
述した辞書を作成する方法としては、従来、自然言語文
から名詞と動詞の間の係り受け可能な2語間関係を検出
し、これを登録する方法が考えられている。この方法で
は、係り受け関係として、確実な係り受け関係のみを登
録するようになっている。これは、不確定な係り受け関
係はそれ自体曖昧であるため、ほかの不確定な係り受け
関係を解析するための根拠情報として用いることは好ま
しくないからである。
【0006】
【発明が解決しようとする課題】しかしながら、このよ
うな構成では、大量の自然言語文があっても、その一部
しか根拠情報として利用することができないという問題
があった。これは、自然言語文は、通常、計算機による
処理を意識せずに自然に書かれた文章であることが多い
ため、係り受け関係の曖昧な表現が多く含まれることが
多いからである。
【0007】
【課題を解決するための手段】請求項1に係る発明は、
不確定な係り受け関係を解析するための辞書を作成する
装置において、入力文に含まれる不確定な係り受け関係
を検出する手段と、辞書上でこの係り受け関係検出手段
によって検出された係り受け関係と類似する係り受け関
係を検索する手段と、この係り受け関係が検索される
と、この係り受け関係と不確定な係り受け関係を併合し
て登録し、検索されなければ、不確定な係り受け関係を
単独で登録する手段とを設けるようにしたものである。
【0008】請求項2に係る発明は、請求項1に係る発
明に、入力文から確実な係り受け関係を検出し、これを
辞書に登録する手段を設けるようにしたものである。
【0009】請求項3に係る発明は、不確定な係り受け
関係を解析する装置において、請求項2の辞書作成装置
と、この装置により作成された辞書の登録内容を参照し
ながら、不確定な係り受け関係を解析する手段とを設け
るようにしたものである。
【0010】請求項4に係る発明は、請求項2または3
に係る発明において、確実な係り受け関係を登録する
際、その出現頻度を示す情報もいっしょに登録するよう
にしたものである。
【0011】
【作用】請求項1に係る発明においては、まず、入力文
から不確定な係り受け関係が検出される。次に、辞書上
でこの係り受け関係に類似する係り受け関係が検索され
る。この係り受け関係が検索されれば、検出された不確
定な係り受け関係は、検索された類似する係り受け関係
と併合された状態で辞書に登録される。これに対し、検
索されなければ、検出された不確定な係り受け関係は単
独で登録される。以下、同様に、新しい文が入力される
たびに、上述した処理が繰り返される。これにより、帰
納法的な推論によって不確定な係り受け関係を解析する
ことが可能な根拠情報が登録された辞書が形成される。
【0012】請求項2に係る発明においては、入力文か
ら確実な係り受け関係と不確定な係り受け関係が検出さ
れる。確実な係り受け関係はそのまま辞書に登録され
る。これに対し、不確定な係り受け関係は、請求項1に
係る発明と同様にして辞書に登録される。これにより、
根拠情報として、確実な係り受け関係と不確定な係り受
け関係が登録された辞書が作成される。
【0013】請求項3に係る発明においては、請求項2
に係る発明と同様にして、解析用の辞書が作成される。
また、これと並行し、この辞書の登録内容を参照しなが
ら、入力文から検出された不確定な係り受け関係の解析
がなされる。
【0014】請求項4に係る発明においては、請求項2
あるいは請求項3に係る発明によって、確実な係り受け
関係を辞書に登録する際、その出現頻度を示す情報もい
っしょに登録される。これにより、この確実な係り受け
関係の根拠情報として強さ(信頼性の高さ)を示す情報
が登録されることになる。
【0015】
【実施例】以下、図面を参照しながら、この発明の実施
例を詳細に説明する。図1は、この発明の係り受け関係
解析装置の一実施例の構成を示すブロック図である。
【0016】まず、この装置の構成の概略を説明する。
【0017】図示の装置は、辞書保持部11と、入力文
解析部12と、関係抽出部13と、係り受け記憶部14
を有し、入力文の係り受け構造を解析する機能と、解析
用の辞書を作成する機能を有する。この場合、辞書の作
成は、係り受け構造の解析と並行して行われる。
【0018】ここで、辞書保持部11は、係り受け関係
解析用の辞書を保持する。入力文解析部12は、入力文
の係り受け構造を解析する。関係抽出部13は、入力文
解析部12からの要求に基づいて、係り受け記憶部13
に、係り受け関係の検索や登録を要求する。係り受け記
憶部14は、入力文解析部12や関係抽出部13からの
要求に基づいて、係り受け関係の検索や登録を行う。
【0019】なお、この装置は、例えば、計算機システ
ムで構成される。この場合、辞書保持部11は、例え
ば、磁気記憶装置等の外部記憶装置により構成される。
入力文解析部12と、関係抽出部13と、係り受け記憶
部14は、中央処理装置と主記憶装置により構成され
る。
【0020】次に、この装置の構成の詳細を説明する。
【0021】上記辞書には、後述する形態素解析や構文
解析では解析できなかった不確定な係り受け関係を解析
するための根拠情報が登録される。この根拠情報として
は、例えば、自然言語文から抽出された確実な係り受け
関係と不確定な係り受け関係がある。
【0022】確実な係り受け関係は、その出現頻度を示
す情報といっしょに登録される。これは、この確実な係
り受け関係の根拠情報として強さ(信頼性の高さ)を示
すためである。この場合、出現頻度が多いほど、強さは
強くなる。
【0023】不確定な係り受け関係は、この係り受け関
係に類似する係り受け関係がすでに辞書に登録されてい
る場合は、この係り受け関係と併合した状態で登録され
る。これに対し、類似する係り受け関係が登録されてい
ない場合は、単独で登録される。
【0024】ここで、不確定な係り受け関係と類似する
係り受け関係としては、種々の係り受け関係を考えるこ
とができる。この実施例では、例えば、次の3つの要件
を満たす係り受け関係を考えている。
【0025】(a1) 不確定な係り受け関係であるこ
と。 (a2) 係り受けの要素数n(nは3以上の整数)が
当該不確定な係り受け関係の要素数と同じであること。 (a3) (n−1)個の要素が当該不確定な係り受け
関係の(n−1)個の要素と同じであること。
【0026】上記入力文解析部12は、例えば、次の6
つの機能を有する。
【0027】(b1) 形態素解析と構文解析によっ
て、入力文の係り受け構造を解析し、入力文に含まれる
係り受け関係を検出する機能。 (b2) この解析によって不確定な係り受け関係を検
出すると、これを解析するための根拠情報の検索を係り
受け記憶部14に要求する機能。 (b3) 係り受け記憶部14から根拠情報が送られて
くると、これに基づいて、不確定な係り受け関係を解析
する。 (b4) 係り受け記憶部14から根拠情報が送られて
こない場合は、予め定めた規則に基づいて、不確定な係
り受け関係を解析する機能。 (b5) 解析した係り受け構造(係り受け関係)を出
力する機能。 (b6) 検出した係り受け関係の登録を関係抽出部1
3に要求する機能。
【0028】上記関係抽出部13は、例えば、次の6つ
の機能を有する。
【0029】(c1) 入力文解析部12から確実な係
り受け関係の登録要求を受けると、係り受け記憶部14
に、その検索を要求する機能。 (c2) この検索要求に対して、目的とする係り受け
関係が送られてくると、その出現頻度を更新して、その
登録を係り受け記憶部14に要求する機能。 (c3) 上記検索要求に対して、目的とする係り受け
関係が送られてこなければ、その出現頻度を初期値に設
定して、その登録を係り受け記憶部14に要求する機
能。 (c4) 入力文解析部12から不確定な係り受け関係
の登録要求を受けると、係り受け記憶部14に、これに
類似する係り受け関係の検索を要求する機能。 (c
5) この検索要求に対して、目的とする係り受け関係
が送られてくると、2つの係り受け関係を併合して、そ
の登録を係り受け記憶部14に要求する機能。 (c
6) 上記検索要求に対して、目的とする係り受け関係
が送られてこない場合は、この係り受け関係のみの登録
を係り受け記憶部14に要求する機能。
【0030】上記係り受け記憶部14は、例えば、次の
4つの機能を有する。
【0031】(d1) 入力文解析部12から、不確定
な係り受け関係を解析するための根拠情報の検索要求を
受けると、この根拠情報を辞書上で検索し、検索結果を
入力文解析部12に送る機能。 (d2) 関係抽出部13から、確実な係り受け関係の
検索要求を受けると、これを辞書上で検索し、検索結果
を関係抽出部13に送る機能。 (d3) 関係抽出部13から、不確定な係り受け関係
に類似する係り受け関係の検索要求を受けると、これを
辞書上で検索し、検索結果を関係抽出部13に送る機
能。 (d4) 関係抽出部13から、係り受け関係の登録要
求を受けると、これを辞書に登録する機能。
【0032】なお、この実施例では、関係抽出部13か
らの要求による確実な係り受け関係の検索処理と不確定
な係り受け関係の検索処理とを同じにすることによっ
て、係り受け記憶部14の構成を簡単にするために、次
のような構成が採用されている。
【0033】(e1) 確実な係り受け関係を検索する
場合、この係り受け関係の構成要素からなる確実な係り
受け関係だけでなく、この構成要素を構成要素の一部と
する不確定な係り受け関係も検索する。つまり、確実な
係り受け関係の構成要素を含む係り受け関係すべてを検
索する。 (e2) 不確定な係り受け関係に類似する係り受け関
係を検索する場合、係り受け関係の候補の構成要素を構
成要素の一部とする不確定な係り受け関係だけでなく、
この構成要素からなる確実な係り受け関係も検索する。
つまり、係り受け関係の候補の構成要素を含む係り受け
関係すべてを検索する。 (e3) 辞書に、確実な係り受け関係と不確定な係り
受け関係を分けることなく、いっしょに登録する。
【0034】また、この実施例では、入力文解析部12
からの要求による根拠情報の検索処理と関係抽出部13
からの要求による係り受け関係の検索処理とを同じにす
ることによって、係り受け記憶部14の構成を簡単にす
るために、次のような構成がとられている。
【0035】(f) 根拠情報を検索する場合、不確定
な係り受け関係に含まれる係り受け関係の候補の構成要
素を構成要素の一部とする係り受け関係だけでなく、確
実な係り受け関係の構成要素からなる係り受け関係も検
索する構成。
【0036】また、この実施例では、入力文解析部12
からの検索要求による検索と関係抽出部13からの検索
要求による検索との重複検索を防止するために、次よう
な構成が採用されている。
【0037】(g) 根拠情報の検索結果を内部メモリ
(主記憶装置)に一時的に記憶することにより、関係抽
出部13から検索要求があった場合、実際に検索を行わ
ず、記憶しておいた検索結果を送る構成。
【0038】図2は、係り受け関係を辞書に登録するた
めのレコードのフォーマットの一例を示す図である。
【0039】ここで、図2(a)は、確実な係り受け関
係を登録するためのレコードのフォーマットを示す。図
示のレコードは、要素挿入部21と出現頻度挿入部22
を有する。要素挿入部21には、係り受けの要素が挿入
される。出現頻度挿入部22には、係り受け関係の出現
頻度が挿入される。
【0040】要素挿入部21は、修飾語挿入部211と
被修飾語挿入部212を有する。修飾語挿入部211に
は、修飾語が挿入される。被修飾語挿入部212には、
被修飾語が挿入される。
【0041】例えば、係り受けの要素をA(修飾語),
B(被修飾語)とすると、修飾語挿入部211にはAが
挿入される。被修飾語挿入部212には、Bが挿入され
る。また、この係り受け関係の出現頻度が現在のところ
1であれば、出現頻度挿入部22には、例えば、1が挿
入される。
【0042】図2(b)は、単独の不確定な係り受け関
係を登録するためのレコードのフォーマットを示す。な
お、図には、不確定な係り受け関係の要素数nが一般的
な3である場合を代表として示す。
【0043】図示のレコードは、1つの修飾語挿入部3
1と、2つの候補挿入部32,33を有する。修飾語挿
入部31には、修飾語が挿入される。候補挿入部32,
33には、被修飾語の候補が挿入される。
【0044】例えば、係り受けの要素をA(修飾語),
B(被修飾語の候補),C(被修飾語の候補)とする
と、修飾語挿入部31にはAが挿入され、候補挿入部3
2には、被修飾語の一方の候補Bが挿入され、候補挿入
部33には、被修飾語の他方の候補Cが挿入される。
【0045】図2(c)は、類似する複数の係り受け関
係を併合して登録するためのレコードのフォーマットを
示す。
【0046】図示のレコードは、同じ要素は1つにまと
め、異なる要素は併記するフォーマットを有する。図に
は、例えば、A,B,Cを要素とする不確定な係り受け
関係とA,D,Cを要素とする不確定な係り受け関係が
併合された場合を示す。この場合、候補挿入部32に
は、異なる要素B,Dが挿入される。この後、A,E,
Cを要素とする不確定な係り受け関係が検出されば、候
補挿入部32には、さらに、Eが挿入される。
【0047】図3は、図2(c)の具体例を示す。図に
は、例えば、(「会場・に」,「変装する・て」,「入
る・た」)を構成要素とする不確定な係り受け関係と
(「会場・に」,「正装する・て」,「入る・た」)を
構成要素とする不確定な係り受け関係を併合する場合を
代表として示す。
【0048】この場合、修飾語挿入部31には、「会場
・に」が挿入され、候補挿入部32には、「変装する・
て」と「正装する・て」が挿入され、候補挿入部33に
は、「入る・た」が挿入される。
【0049】上記構成において、動作を説明する。ま
ず、動作の概略を説明する。
【0050】入力文解析部12は、形態素解析や構文解
析を用いて、入力文の係り受け構造を解析する(機能b
1)。この解析によって、不確定な係り受け関係を検出
すると、これを解析するための根拠情報の検索を係り受
け記憶部14に要求する(機能b2)。
【0051】係り受け記憶部14は、この検索要求を受
けると、辞書保持部11に保持された辞書上で、根拠情
報を検索し、検索結果を入力文解析部12に送る(機能
d1)。入力文解析部12は、根拠情報が送られてくる
と、これに基づいて、不確定な係り受け関係を解析する
(機能b3)。これに対し、根拠情報が送られてこない
場合は、予め定めた規則に基づいて解析する(機能b
4)。
【0052】この後、入力文解析部12は、解析結果を
出力するとともに(機能b5)、検出した確実な係り受
け関係と不確定な係り受け関係の登録を関係抽出部13
に要求する(機能b6)。関係抽出部13は、この登録
要求を受けると、まず、確実な係り受け関係の検索を係
り受け記憶部14に要求する(機能c1)。
【0053】係り受け記憶部14は、この検索要求を受
けると、その検索を行い、検索結果を関係抽出部13に
送る(機能d2)。但し、実際には、根拠情報の検索時
に、内部メモリに記憶しておいた検索結果を送る(構成
g)。
【0054】関係抽出部13は、確実な係り受け関係が
送られてくると、その出現頻度を更新し、その登録を要
求する(機能c2)。これに対し、確実な係り受け関係
が送られてこないと、その出現頻度を初期値に設定し、
その登録を要求する(機能c3)。係り受け記憶部14
は、この登録要求を受けると、要求のあった係り受け関
係を登録する(機能d4)。
【0055】この後、関係抽出部13は、不確定な係り
受け関係に類似する係り受け関係のの検索を係り受け記
憶部14に要求する(機能c4)。係り受け記憶部14
は、この検索要求を受けると、その検索を行い、検索結
果を関係抽出部13に送る(機能d3)。但し、実際に
は、根拠情報の検索時に、内部メモリに記憶しておいた
検索結果を送る(構成g)。
【0056】関係抽出部13は、類似する係り受け関係
が送られてくると、両者を併合して、その登録を要求す
る(機能c5)。これに対し、類似する係り受け関係が
送られてこないと、当該不確定な係り受け関係の登録の
みを要求する(機能c6)。係り受け記憶部14は、こ
の登録要求を受けると、要求のあった係り受け関係を登
録する(機能d4)。
【0057】次に、動作の詳細を説明する。
【0058】なお、以下の説明では、辞書に全く係り受
け関係が登録されていない状態において、まず、次の3
つの文1,2,3を含む文章1が入力され、その後、文
1を含む文章2が入力された場合を代表として説明す
る。
【0059】文章1:文1:「会場に変装して入った」 文2:「会員に変装して入った」 文3:「会場に正装して入った」 文章2:文1:「会場に変装して入った」 これらの文1,2,3は、いずれも不確定な係り受け関
係を有する。例えば、文1の場合、「会場に」は、「変
装して」に係るのか、「入った」に係るのかが不明であ
る。このような不確定な係り受け関係は、従来、根拠情
報(知識)として利用されていなかった。これに対し、
この実施例では、これらも根拠情報として利用される。
【0060】まず、文章1の文1が入力された場合の動
作を説明する。この場合、入力文1の係り受け構造を解
析する動作と、入力文1から検出された係り受け関係を
辞書に登録する動作が行われる。入力文1の係り受け構
造を解析する動作は次のようにして行われる。
【0061】入力文解析部12は、文1が入力される
と、まず、形態素解析と構文解析を用いて、入力文1の
係り受け構造を解析する(機能b1)。この解析におい
ては、まず、係り受けの要素からなるリストが作成され
る。次に、このリストに基づいて、入力文1に含まれる
係り受け関係が検出される。
【0062】これにより、例えば、「会場・に」と、
「変装する・て」と、「入る・た」の3つの要素からな
るリストが作成される。次に、このリストに基づいて、
入力文1に含まれる係り受け関係が検出される。
【0063】これにより、確実な係り受け関係と不確定
な係り受け関係が検出される。この場合、確実な係り受
け関係としては、「変装する・て」と「入る・た」の2
つの要素からなる対が検出される。また、不確定な係り
受け関係としては、「会場・に」と、「変装する・て」
と、「入る・た」の3つの要素からなる組が検出され
る。
【0064】入力文解析部12は、不確定な係り受け関
係を検出すると、これを係り受け記憶部14に送り、そ
の不確定さを解消するための根拠情報の検索を要求する
(機能b2)。
【0065】係り受け記憶部13は、この検索要求を受
けると、辞書保持部16に保持された辞書上で、この根
拠情報を検索し、検索結果を入力文解析部12に送る
(機能d1)。この検索は次のようにして行われる。
【0066】係り受け記憶部13は、まず、不確定な係
り受け関係の組を構成する3つの要素(「会場・に」,
「変装する・て」,「入る・た」)から2つの要素
(「会場・に」,「変装する・て」)を取り出し、この
2つの要素を含むレコードを検索する。
【0067】すなわち、2つの係り受け関係の候補
(「会場・に」→「変装する・て」),(「会場・に」
→「入る・た」)のうちの一方(「会場・に」→「変装
する・て」)を構成する2つの要素を含むレコードを検
索する。この場合、「変装する・て」は基本形「変装す
る」に変形して検索される。
【0068】なお、この場合の検索対象には、上述した
2つの要素(「会場・に」,「変装する・て」)からな
る対のレコードのみならず、この2つの要素を構成要素
の一部とする組のレコードも含まれる。また、この組の
レコードには、単独の組のレコードと併合された組のレ
コードも含まれる。これは、次に説明する2つの検索に
おいても同様である。
【0069】この検索が終了すると、上記3つの要素か
ら2つの要素「会場・に」,「入る・た」を取り出し、
この2つの要素を含むレコードを検索する。すなわち、
係り受け関係の2つの候補のうちの他方(「会場・に」
→「入る・た」)を構成する2つの要素を含むレコード
を検索する。この場合、「入る・た」は基本形「入る」
に変形して検索される。
【0070】この検索が終了すると、上記3つの要素か
ら2つの要素「変装する・て」,「入る・た」を取り出
し、この2つの要素を含むレコードを検索する。すなわ
ち、確実な係り受け関係(「変装する・て」→「入る・
た」)を構成する2つの要素を含むレコードを検索す
る。この場合、「入る・た」は基本形「入る」に変形し
て検索される。
【0071】確実な係り受け関係を構成する2つの要素
を含むレコードを検索する理由は2つある。1つは、上
記の如く、入力文検索部12からの検索要求による検索
処理と関係抽出部13からの検索要求による検索処理を
同じにし、係り受け記憶部14の構成を同じにするため
である(構成f)。また、他の1つは、不確定な係り受
け関係の解析精度を高めるためである。これについて
は、後述する基準h4で説明する。
【0072】この検索が終了すると、係り受け記憶部1
4は、検索結果を入力文解析部12に送る。この場合、
目的とするレコードが検索できた場合は、これを送る。
これに対し、目的とするレコードを検索できなかった場
合は、空のレコードを送る。
【0073】これと同時に、係り受け記憶部14は、検
索結果を内部メモリに一時的に格納する。これは、上記
の如く、この検索結果を、辞書登録時の検索結果として
利用するためである(構成g)。
【0074】入力文解析部12は、係り受け記憶部14
の検索結果に基づいて、不確定な係り受け関係を解析す
る(機能b3,b4)。この解析基準としては、例え
ば、次の8個の基準が用いられる。
【0075】(h1) 確実な係り受け関係の構成要素
(「変装する・て」,「入る・た」)を構成要素の一部
とする組のレコードは、根拠情報として採用しない。こ
れは、不確定な係り受け関係を解析する場合は、原則と
して、係り受け関係の候補の構成要素を含むレコード
(対または組のレコード)を根拠情報として用いればよ
いからである。
【0076】但し、この実施例では、上記構成要素
(「変装する・て」,「入る・た」)からなる対のレコ
ードは、後述する基準h7に示すように、根拠情報とし
て採用する。
【0077】(h2) 組のレコードに含まれる要素数
が予め定めた閾値より小さい場合は、このレコードは、
根拠情報として採用しない。これは、組のレコードの場
合、それ自体曖昧な情報であるため、要素数が少ない
と、根拠情報としての強さが極めて弱くなるからであ
る。
【0078】なお、組のレコードに含まれる要素数は、
不確定な係り受け関係に含まれる要素数とは、必ずしも
一致しない。例えば、図2(b)の場合、係り受け関係
に含まれる要素数は3であり、レコードに含まれる要素
数も3である。これに対し、図2(c)の場合、係り受
け関係に含まれる要素数は3であるが、レコードに含ま
れる要素数は4である。
【0079】(h3) 係り受け関係の一方の候補の構
成要素からなる対のレコードと他方の候補の構成要素を
構成要素の一部とする組のレコードが競合する場合は、
対のレコードを優先する。これは、対のレコードは確実
な係り受け関係のレコードであるため、組のレコードに
比べ、根拠情報としての強さが強いからである。
【0080】(h4) 係り受け関係の一方の候補の構
成要素からなる対のレコードと他方の候補の構成要素か
らなる対のレコードが競合した場合は、出現頻度が多い
ほうを優先する。これは、一般的には、出現頻度が多い
ほど、根拠情報としての強さが強くなるからである。
【0081】(h5) 係り受け関係の一方の候補の構
成要素を含む組のレコードと他方の候補の構成要素を含
む組のレコードが競合した場合は、要素数が多いほうを
優先する。これは、一般的には、要素数が多いほど、多
様性が高く、根拠情報としての強さが強くなるからであ
る。
【0082】(h6) 組のレコードに基づいて、不確
定な係り受け関係を解析する場合は、帰納法的な推論に
よって解析する。
【0083】例えば、「XXに変装して入る」という文
の不確定な係り受け関係を解析する場合において、「会
員に変装して入る」,「作業員に変装して入る」,「係
りの者に変装して入る」の3つの文の不確定な係り受け
関係が併合されたレコードが検索された場合は、「XX
に変装する」と解析する。
【0084】また、この場合において、「会場に変装し
て入る」,「会場に正装して入る」,「会場に急いで入
る」の3つの文の不確定な係り受け関係が併合されたレ
コードが検索された場合は、「XXに入る」と解析す
る。
【0085】これにより、「会場には変装することがで
きない」といった知識や「会場とは何であるか」「変装
するとはどういうことをするのか」といった知識が一切
なくても、不確定な係り受け関係を高精度で解析するこ
とができる。
【0086】(h7) 基準h4において、確実な係り
受け関係の構成要素(「変装する・て」,「入る・
た」)からなる対のレコードが検索された場合は、これ
も参考にする。これは、この場合は、係り受け関係の候
補の対の出現頻度と確実な係り受け関係の対の出現頻度
を比較することにより、係り受けの解析が可能になるこ
とがあるからである。
【0087】例えば、確実な係り受け関係(「変装する
・て」→「入る・た」)の出現頻度が100、係り受け
関係の一方の候補(「会場・に」→「変装する・て」)
の出現頻度も100なら、他方の候補(「会場・に」→
「入る・た」)の出現頻度が5でも、これを無視するわ
けである。但し、(「変装する・て」→「入る・た」)
の出現頻度が5なら、(「会場・に」→「入る・た」)
を無視しない。
【0088】(h8) 空のレコードが送られてきた場
合は、予め定めた規則に基づいて、係り受け関係を解析
する。この規則としては、例えば、「修飾語の係り先
は、その次の語とする」という規則が用いられる。これ
は、例えば、日本語の「AのBのC」という名詞句の場
合、係り受け関係がA→Bである確率が80%以上であ
るという経験則による。
【0089】今の例の場合、辞書には、図4(a)に示
すように、係り受け関係のレコードは全く登録されてな
い。したがって、この場合は、検索結果として、空のレ
コードが送られる。これにより、不確定な係り受け関係
は、予め定めた規則に基づいて解析される。その結果、
2つの係り受け関係の候補(「会場・に」→「変装す
る」),(「変装する・て」→「入る・た」)のうち、
(「会場・に」→「変装する・て」)が妥当な係り受け
関係として決定される。
【0090】入力文解析部11は、不確定な係り受け関
係の解析が終了すると、入力文1の係り受け構造の解析
結果を出力する(機能b5)。これにより、確実な係り
受け関係(「変装する・て」→「入る」)と妥当な係り
受け関係(「会場・に」→「変装する」)が出力され
る。
【0091】この出力処理が終了すると、入力文解析部
12は、確実な係り受け関係の対と不確定な係り受け関
係の組とからなるリストを関係抽出部13に送り、その
登録を要求する(機能b6)。この後、入力文解析部1
2は、次の文2の入力を待つ。
【0092】これにより、辞書の登録動作が開始され
る。すなわち、関係抽出部12は、この登録要求を受け
ると、まず、確実な係り受け関係の対を係り受け記憶部
13に送り、この対の2つの構成要素(「変装する・
て」,「入る・た」)を含むレコードの検索を要求する
(機能c1)。
【0093】係り受け記憶部13は、この検索要求を受
けると、内部メモリから上記2つの構成要素(「変装す
る・て」,「入る・た」)を含むレコードの検索結果を
読み出し、これを関係抽出部12に送る(構成f)。
【0094】関係抽出部13は、係り受け記憶部14か
ら検索結果を受け取ると、この検索結果が空のレコード
か否かを判定する。空のレコードでなければ、このレコ
ードが2つの構成要素(「変装する・て」,「入る・
た」)からなる対のレコードか否かを判定する。
【0095】2つの構成要素(「変装する・て」,「入
る・た」)からなる対のレコードであれば、まず、この
レコードの出現頻度を更新する。次に、このレコードを
係り受け記憶部14に送り、その登録を要求する(機能
c2)。
【0096】これに対し、対のレコードでなければ、ま
ず、2つの構成要素(「変装する・て」,「入る・
た」)からなる対のレコードを構成し、かつ、その出現
頻度を初期値1に設定する。次に、このレコードを係り
受け記憶部14に送り、その登録を要求する(機能c
3)。
【0097】空のレコードであれば、まず、このレコー
ドに、2つの構成要素(「変装する・て」,「入る・
た」)を挿入し、かつ、その出現頻度を初期値1に設定
する。次に、このレコードを係り受け記憶部14に送
り、その登録を要求する(機能c3)。
【0098】係り受け記憶部14は、対のレコードの登
録要求を受けると、これを辞書保持部11に保持された
辞書に登録する(機能d4)。
【0099】今の例では、図4(a)に示すように、辞
書には、なにも登録されていない。したがって、関係抽
出部13には、空のレコードが送られる。これにより、
関係抽出部13は、このレコードに(「変装する・
て」,「入る・た」)を挿入し、出現頻度を1に設定す
る。次に、このレコードを係り受け記憶部13に送り、
その登録を要求する。これにより、辞書には、(「変装
する・て」,「入る・た」)を構成要素とする対のレコ
ードが登録される。
【0100】次に、関係抽出部13は、不確定な係り受
け関係の組を係り受け記憶部14に送り、係り受け関係
の一方の候補の構成要素(「会場・に」,「変装する・
て」)を含むレコードと他方の候補の構成要素(「会場
・に」,「入る・た」)を含むレコードの検索を要求す
る(機能c4)。
【0101】係り受け記憶部14は、この検索要求を受
けると、まず、内部メモリから2つの要素(「会場・
に」,「変装する・て」)を含むレコードの検索結果と
2つの要素(「会場・に」,「入る・た」)を含むレコ
ードの検索結果を読み出し、これを関係抽出部13に送
る。
【0102】関係抽出部13は、この検索結果を受ける
と、これが空のレコードか否かを判定する。空のレコー
ドでなければ、2つの要素(「会場・に」,「変装する
・て」)を構成要素の一部とする組のレコードか否かを
判定する。
【0103】2つの要素(「会場・に」,「変装する・
て」)を構成要素の一部とする組のレコードであれば、
まず、このレコードに含まれる不確定な係り受け関係
に、入力文解析部12から受け取った不確定な係り受け
関係を併合する。次に、この併合の済んだレコードを係
り受け記憶部14に送り、その登録を要求する(機能c
5)。
【0104】2つの要素(「会場・に」,「変装する・
て」)を構成要素の一部とする組のレコードでなけれ
ば、次の2つの要素(「会場・に」,「入る・た」)を
構成要素の一部とする組のレコードか否かを判定する。
【0105】このレコードであれば、まず、このレコー
ドに含まれる不確定な係り受け関係に、入力文解析部1
2から受け取った不確定な係り受け関係を併合する。次
に、この併合の済んだレコードを係り受け記憶部14に
送り、その登録を要求する(機能c5)。
【0106】2つの要素(「会場・に」,「入る・
た」)を構成要素の一部とする組のレコードでなけれ
ば、入力文解析部12から受け取った不確定な係り受け
関係のレコードを作成する。次に、このレコードを係り
受け記憶部14に送り、その登録を要求する(機能c
6)。
【0107】空のレコードであれば、まず、このレコー
ドに入力文解析部12から受け取った不確定な係り受け
関係を挿入する。次に、このレコードを係り受け記憶部
14に送り、その登録を要求する(機能c6)。以上に
より、関係抽出部13の処理は終了する。この後、関係
抽出部13は、入力文解析部12から次のリストが送ら
れてくるのを待つ。
【0108】係り受け記憶部14は、関係抽出部13か
らレコードの登録要求を受けると、このレコードを辞書
保持部11に保持された辞書に登録する(機能d4)。
以上により、辞書の登録処理が終了する。この後、係り
受け記憶部14は、入力文解析部12から次の根拠情報
の検索要求が送られてくるのを待つ。
【0109】今の例の場合、辞書には、図3(a)に示
す如く、何も登録されていない。したがって、この場
合、関係抽出部13には、空のレコードが送られる。こ
れにより、関係抽出部13は、このレコードに(「会場
・に」,「変装する・て」,「入る・た」)を挿入す
る。次に、このレコードを係り受け記憶部14に送り、
その登録を要求する。これにより、辞書には、(「会場
・に」,「変装する・て」,「入る・た」)を構成要素
とする組のレコードが登録される。
【0110】以上により、辞書には、図3(b)に示す
如く、2つの要素(「変装する・て」,「入る・た」)
からなり、出現頻度が初期値1に設定された対のレコー
ドと、3つの要素(「会場・に」,「変装する・て」,
「入る・た」)からなる組のレコードが登録される。
【0111】この後、入力文解析部12に、文2「会員
に変装して入った」が入力されると、2つの要素(「変
装する・て」,「入る・た」)からなる確実な係り受け
関係の対と、3つの要素(「会員・に」,「変装する・
て」,「入る・た」)からなる不確定な係り受け関係の
組が検出される。
【0112】これにより、3つの要素(「会員・に」,
「変装する・て」,「入る・た」)からなる不確定な係
り受け関係の解析処理が開始される。この段階では、図
3(b)に示すように、辞書には、2つの要素(「変装
する・て」,「入る・た」)からなる対のレコードと、
3つの要素(「会員・に」,「変装する・て」,「入る
・た」)からなる組のレコードが登録されている。
【0113】これにより、この場合は、2つの要素
(「変装する・て」,「入る・た」)を含むレコードの
検索によって、この2つの要素からなる対のレコードが
検索される。
【0114】しかし、このレコードは、不確定な係り受
け関係を解析するための根拠情報としては用いられな
い。これは、この場合、係り受け関係の候補の構成要素
からなる対のレコードが検索されないため、当該レコー
ドを参考にする余地がないからである(基準h7)。
【0115】これにより、この場合は、予め定めた規則
に基づいて、不確定な係り受け関係が解析される。その
結果、不確定な係り受け関係は(「会員・に」→「変装
する・て」)と解析される。これにより、入力文2の係
り受け関係は、(「会員・に」→「入る・た」),
(「変装する・て」→「入る・た」)と解析される。
【0116】この解析結果の出力が終了すると、2つの
要素(「変装する・て」,「入る・た」)からなる確実
な係り受け関係と、3つの要素(「会員・に」,「変装
する・て」,「入る・た」)からなる不確定な係り受け
関係の登録処理が開始される。
【0117】これにより、2つの要素(「変装する・
て」,「入る・た」)からなる対のレコードの出現頻度
が更新される。また、3つの要素(「会員・に」,「変
装する・て」,「入る・た」)からなる組のレコードが
追加される。
【0118】その結果、辞書には、図3(c)に示すよ
うに、2つの要素(「変装する・て」,「入る・た」)
からなり、出現頻度が2の対のレコードと、3つの要素
(「会場・に」,「変装する・て」,「入る・た」)か
らなる組のレコードと、3つの要素(「会員・に」,
「変装する・て」,「入る・た」)からなる組のレコー
ドが登録される。
【0119】この後、入力文解析部12に、文3「会場
に正装して入った」が入力されると、2つの要素(「正
装する・て」,「入る・た」)からなる確実な係り受け
関係の対と、3つの要素(「会場・に」,「正装する・
て」,「入る・た」)からなる不確定な係り受け関係の
組が検出される。
【0120】これにより、3つの要素(「会場・に」,
「正装する・て」,「入る・た」)からなる不確定な係
り受け関係の解析が実行される。この段階では、図3
(c)に示すように、辞書には、2つの要素(「変装す
る・て」,「入る・た」)からなり、出現頻度が2の対
のレコードと、3つの要素(「会場・に」,「変装する
・て」,「入る・た」)からなる組のレコードと、3つ
の要素(「会員・に」,「変装する・て」,「入る・
た」)からなる組のレコードが登録されている。
【0121】これにより、この場合は、2つの要素
(「会場・に」,「入る・た」)を含むレコードの検索
によって、3つの要素(「会場・に」,「変装する・
て」,「入る・た」)からなる組のレコードが検索され
る。
【0122】しかし、このレコードは、不確定な係り受
け関係を解析するための根拠情報としては用いられな
い。これは、このレコードの要素数3が閾値4に達しな
いからである(基準h2)。
【0123】これにより、この場合も、予め定めた規則
に基づいて、不確定な係り受け関係が解析される。その
結果、この不確定な係り受け関係は、(「会場・に」→
「正装する・て」)と解析される。これにより、入力文
2の係り受け関係は、(「会場・に」→「正装する・
て」)、(「変装する・て」→「入る」)と解析され
る。
【0124】この解析結果の出力が終了すると、2つの
要素(「正装する・て」,「入る・た」)からなる確実
な係り受け関係と、3つの要素(「会場・に」,「正装
する・て」,「入る・た」)からなる不確定な係り受け
関係の登録処理が開始される。
【0125】これにより、2つの要素(「正装する・
て」,「入る・た」)からなる対のレコードが追加され
る。また、3つの要素(「会場・に」,「変装する・
て」,「入る・た」)からなる組と3つの要素(「会場
・に」,「正装する・て」,「入る・た」)からなる組
が併合される。
【0126】その結果、辞書には、図3(d)に示すよ
うに、2つの要素(「変装する・て」,「入る・た」)
からなり、出現頻度が2の対のレコードと、2つの要素
(「正装する・て」,「入る・た」)からなり、出現頻
度が1の対のレコードと、4つの要素(「会場・に」,
{「変装する・て」,「正装する・て」},「入る・
た」)からなる組のレコードと、3つの要素(「会員・
に」,「変装する・て」,「入る・た」)からなる組の
レコードが登録される。
【0127】この後、入力文解析部12に、再び、文1
「会場に変装して入った」が入力されると、2つの要素
(「変装する・て」,「入る・た」)からなる確実な係
り受け関係の対と、3つの要素(「会場・に」,「変装
する・て」,「入る・た」)からなる不確定な係り受け
関係の組が検出される。
【0128】これにより、3つの要素(「会場・に」,
「変装する・て」,「入る・た」)からなる不確定な係
り受け関係の解析処理が開始される。
【0129】この段階では、辞書には、図3(d)に示
すように、2つの要素(「変装する・て」,「入る・
た」)からなり、出現頻度が2の対のレコードと、2つ
の要素(「正装する・て」,「入る・た」)からなり、
出現頻度が1の対のレコードと、4つの要素(「会場・
に」,{「変装する・て」,「正装する・て」},「入
る・た」)からなる組のレコードと、3つの要素(「会
員・に」,「変装する・て」,「入る・た」)からなる
組のレコードが登録されるレコードが登録されている。
【0130】これにより、この場合は、2つの要素
(「変装する・て」,「入る・た」)を含むレコードの
検索によって、2つの要素(「変装する・て」,「入る
・た」)からなる対のレコードと、4つの要素(「会場
・に」,{「変装する・て」,「正装する・て」},
「入る・た」)からなる組のレコードが検索される。
【0131】また、2つの要素(「会場・に」,「入る
・た」)を含むレコードの検索によって、4つの要素
(「会場・に」,{「変装する・て」,「正装する・
て」},「入る・た」)からなる組のレコードが検索さ
れる。
【0132】しかし、2つの要素(「変装する・て」,
「入る・た」)からなる対のレコードは、根拠情報とし
て採用されない。これは、係り受け関係の候補の構成要
素からなる対のレコードが検索されていないからである
(基準h7)。
【0133】これに対し、4つの要素(「会場・に」,
{「変装する・て」,「正装する・て」},「入る・
た」)からなる組のレコードは、根拠情報として採用さ
れる。これは、このレコードの要素数4が閾値4以上だ
からである(基準h2)。
【0134】これにより、不確定な係り受け関係は、
(「会場・に」→「入る・た」)と解析される。その結
果、文1の係り受け関係は、(「会場・に」→「入る・
た」)、(「変装する・て」→「入る」)と解析され
る。
【0135】この解析結果の出力が終了すると、2つの
要素(「変装する・て」,「入る・た」)からなる確実
な係り受け関係と、3つの要素(「会場・に」,「変装
する・て」,「入る・た」)からなる不確定な係り受け
関係の登録処理が開始される。
【0136】これにより、2つの要素(「変装する・
て」,「入る・た」)からなる対のレコードの出現頻度
が3に更新される。その結果、辞書には、図3(e)に
示すように、2つの要素(「変装する・て」,「入る・
た」)からなり、出現頻度が3の対のレコードと、2つ
の要素(「正装する・て」,「入る・た」)からなり、
出現頻度が1の対のレコードと、4つの要素(「会場・
に」,{「変装する・て」,「正装する・て」},「入
る・た」)からなる組のレコードと、3つの要素(「会
員・に」,「変装する・て」,「入る・た」)からなる
組のレコードが登録される。
【0137】以上詳述したこの実施例によれば、次のよ
うな効果が得られる。
【0138】(1) まず、この実施例によれば、自然
言語文から不確定な係り受け関係を検出し、類似するも
のどうしを併合して辞書に登録するようにしたので、係
り受け関係の曖昧な表現を不確定な係り受け関係を解析
するための有効な根拠情報として利用することができ
る。
【0139】すなわち、特定のユーザが対象とする自然
言語文には、通常、類似の表現が繰り返し現れる。した
がって、不確定な係り受け関係を上記のように処理する
構成によれば、係り受け関係の曖昧な表現を利用して、
帰納法的推論によって不確定な係り受け関係を解析する
ための根拠情報を形成することができる。これにより、
係り受け関係の曖昧な表現を不確定な係り受け関係を解
析するための有効な情報として用いることができるわけ
である。
【0140】その結果、自然言語文を用いて辞書を作成
する場合、そのほとんどを無駄なく使用することができ
る。また、このような構成によれば、精密な情報が付与
された膨大な語彙が登録された辞書と同じような効果を
有する辞書を簡単に作成することができる。
【0141】(2) また、この実施例によれば、不確
定な係り受け関係のみならず、確実な係り受け関係も辞
書に登録するようにしたので、不確定な係り受け関係の
解析精度を高めることができる。
【0142】(3) また、この実施例によれば、確実
な係り受け関係を登録する際、その出現頻度を示す情報
も登録するようにしたので、確実な係り受け関係を不確
定な係り受け関係を解析するための根拠情報として用い
る際、その強さを知ることができる。
【0143】(4) また、この実施例によれば、類似
する係り受け関係を併合して記憶する際、同じ要素は1
つにまとめ、異なる要素のみ併記して記憶するようにし
たので、記憶容量を節約することができる。
【0144】(5) また、この実施例によれば、不確
定な係り受け関係を解析しながら、辞書を作成すること
ができるので、不確定な係り受け関係の解析とその解析
精度を高めるための学習を同時に行うことができる。
【0145】(6) また、この実施例によれば、不確
定な係り受け関係を根拠情報として利用する場合、レコ
ードの要素数が予め定めた閾値以上のもののみ利用する
ようにしたので、解析の信頼性を高めることができる。
【0146】(7) また、この実施例によれば、不確
定な係り受け関係が競合した場合、根拠情報として、レ
コードの要素数が多いほうを優先するようにしたので、
多様さを考慮して、根拠情報を決定することができる。
これにより、強さの強いものを根拠情報として選択する
ことができる。
【0147】(8) また、この実施例によれば、関係
抽出部13からの要求による確実な係り受け関係の検索
処理と不確定な係り受け関係の検索処理を同じにしたの
で、係り受け記憶部14の構成を簡単にすることができ
る。
【0148】(9) また、この実施例によれば、入力
文解析部12から要求による根拠情報の検索処理と関係
抽出部13からの要求による係り受け関係の検索処理を
同じにしたので、係り受け記憶部14の構成を簡単にす
ることができる。
【0149】(10) また、この実施例によれば、根
拠情報の検索結果を一時的に記憶し、係り受け関係を登
録する際の検索結果として利用するようにしたので、同
じ対象を重複して検索することを防止することができ
る。
【0150】以上、この発明の一実施例を詳細に説明し
たが、この発明は、上述したような実施例に限定される
ものではない。
【0151】(1) 例えば、先の実施例では、不確定
な係り受け関係の解析処理を行った後に、辞書の登録処
理を行う場合を説明した。しかし、この発明は、辞書の
登録処理を行ってから、不確定な係り受け関係の解析処
理を行うようにしてもよい。このような構成によれば、
解析しようとする入力文の情報も、この入力文に含まれ
る不確定な係り受け関係を解析するための根拠情報とし
て利用することができる。
【0152】(2) このほかにも、この発明は、その
要旨を逸脱しない範囲で、種々様々変形実施可能なこと
は勿論である。
【0153】
【発明の効果】請求項1に係る発明によれば、自然言語
文から不確定な係り受け関係を検出し、類似するものど
うしを併合して辞書に登録するようにしたので、係り受
け関係の曖昧な表現を不確定な係り受け関係を解析する
ための有効な情報として利用することができる。これに
より、与えられた自然言語文の一部しか根拠情報として
利用することができないという問題を解決することがで
きる。
【0154】請求項2に係る発明によれば、不確定な係
り受け関係のみならず、確実な係り受け関係も辞書に登
録するようにしたので、不確定な係り受け関係の解析精
度を高めることができる。
【0155】請求項3に係る発明によれば、不確定な係
り受け関係を解析しながら、辞書を作成するようにした
ので、不確定な係り受け関係の解析と同時に、その解析
精度を高めるための学習を行うことができる。
【0156】請求項4に係る発明によれば、確実な係り
受け関係を登録する際、その出現頻度も登録するように
したので、この確実な係り受け関係を不確定な係り受け
関係を解析するための根拠情報として用いる際、その強
さを知ることができる。
【図面の簡単な説明】
【図1】この発明の一実施例の構成を示すブロック図で
ある。
【図2】一実施例の係り受け関係を登録するためのレコ
ードの構成を示す図である。
【図3】併合レコードの具体例を示す図である。
【図4】一実施例の動作を説明するための図である。
【符号の説明】
11…辞書保持部 12…入力文解析部 13…関係抽出部 14…係り受け記憶部 21…要素挿入部 22…出現頻度挿入部 211,31…修飾語挿入部 212…被修飾語挿入部 32,33…候補挿入部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 不確定な係り受け関係を解析するための
    辞書を作成する係り受け関係解析用辞書作成装置におい
    て、 入力文に含まれる不確定な係り受け関係を検出する係り
    受け関係検出手段と、 前記辞書上でこの係り受け関係検出手段によって検出さ
    れた不確定な係り受け関係と類似する係り受け関係を検
    索する係り受け関係検索手段と、 この係り受け関係検索手段により前記類似する係り受け
    関係が検索されると、この係り受け関係と前記不確定な
    係り受け関係を併合して前記辞書に登録し、検索されな
    いと、前記不確定な係り受け関係を単独で登録する係り
    受け関係登録手段とを具備したことを特徴とする係り受
    け関係解析用辞書作成装置。
  2. 【請求項2】 不確定な係り受け関係を解析するための
    辞書を作成する係り受け関係解析用辞書作成装置におい
    て、 入力文に含まれる係り受け関係を検出する係り受け関係
    検出手段と、 この係り受け関係検出手段によって確実な係り受け関係
    が検出されると、これを前記辞書に登録する第1の係り
    受け関係登録手段と、 前記係り受け関係検出手段によって不確定な係り受け関
    係が検出されると、前記辞書上でこの係り受け関係に類
    似する係り受け関係を検索する係り受け関係検索手段
    と、 この係り受け関係検索手段により前記類似する係り受け
    関係が検索されると、この係り受け関係と前記不確定な
    係り受け関係を併合して前記辞書に登録し、検索されな
    いと、前記不確定な係り受け関係を単独で前記辞書に登
    録する第2の係り受け関係登録手段とを具備したことを
    特徴とする係り受け関係解析用辞書作成装置。
  3. 【請求項3】 不確定な係り受け関係を解析する係り受
    け関係解析装置において、 不確定な係り受け関係を解析するための辞書を保持する
    辞書保持手段と、 入力文に含まれる係り受け関係を検出する係り受け関係
    検出手段と、 この係り受け関係検出手段によって確実な係り受け関係
    が検出されると、これを前記辞書に登録する第1の係り
    受け関係登録手段と、 前記係り受け関係検出手段によって不確定な係り受け関
    係が検出されると、前記辞書上でこの係り受け関係に類
    似する係り受け関係を検索する係り受け関係検索手段
    と、 この係り受け関係検索手段により前記類似する係り受け
    関係が検索されると、この係り受け関係と前記不確定な
    係り受け関係を併合して前記辞書に登録し、検索されな
    いと、前記不確定な係り受け関係を単独で前記辞書に登
    録する第2の係り受け関係登録手段と前記係り受け関係
    検出手段によって不確定な係り受け関係が検出される
    と、前記辞書の登録内容を参照しながら、この不確定な
    係り受け関係を解析する係り受け関係解析手段とを具備
    したことを特徴とする係り受け関係解析装置。
  4. 【請求項4】 前記第1の係り受け関係登録手段は、前
    記確実な係り受け関係といっしょにその出現頻度を登録
    するように構成されていることを特徴とする請求項2記
    載の係り受け関係解析用辞書作成装置または請求項3記
    載の係り受け関係解析装置。
JP7041519A 1995-03-01 1995-03-01 係り受け関係解析用辞書作成装置および係り受け関係解析装置 Pending JPH08235188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7041519A JPH08235188A (ja) 1995-03-01 1995-03-01 係り受け関係解析用辞書作成装置および係り受け関係解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7041519A JPH08235188A (ja) 1995-03-01 1995-03-01 係り受け関係解析用辞書作成装置および係り受け関係解析装置

Publications (1)

Publication Number Publication Date
JPH08235188A true JPH08235188A (ja) 1996-09-13

Family

ID=12610636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7041519A Pending JPH08235188A (ja) 1995-03-01 1995-03-01 係り受け関係解析用辞書作成装置および係り受け関係解析装置

Country Status (1)

Country Link
JP (1) JPH08235188A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097208A1 (ja) * 2006-02-27 2007-08-30 Nec Corporation 言語処理装置、言語処理方法および言語処理用プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097208A1 (ja) * 2006-02-27 2007-08-30 Nec Corporation 言語処理装置、言語処理方法および言語処理用プログラム
US8301435B2 (en) 2006-02-27 2012-10-30 Nec Corporation Removing ambiguity when analyzing a sentence with a word having multiple meanings
JP5071373B2 (ja) * 2006-02-27 2012-11-14 日本電気株式会社 言語処理装置、言語処理方法および言語処理用プログラム

Similar Documents

Publication Publication Date Title
Uma et al. Formation of SQL from natural language query using NLP
US5895446A (en) Pattern-based translation method and system
US10296584B2 (en) Semantic textual analysis
Anadiotis et al. Graph integration of structured, semistructured and unstructured data for data journalism
Sedláček et al. A new Czech morphological analyser ajka
KR20070013867A (ko) 카테고리별 검색 로직을 이용한 상품 검색 시스템 및 방법
WO2008043582A1 (en) Systems and methods for building an electronic dictionary of multi-word names and for performing fuzzy searches in said dictionary
KR102292040B1 (ko) 기계 독해 기반 지식 추출을 위한 시스템 및 방법
JP2011118689A (ja) 検索方法及びシステム
JP2022073981A (ja) ソースコード取得
JP2022115815A (ja) 拡張プログラミング言語コーパスに基づく意味コード検索
CN109840255A (zh) 答复文本生成方法、装置、设备及存储介质
CN111859013A (zh) 数据处理方法、装置、终端和存储介质
CN112883736A (zh) 医疗实体关系抽取方法和装置
JPWO2003034279A1 (ja) 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
Wong et al. iSentenizer‐μ: Multilingual Sentence Boundary Detection Model
JP2006227823A (ja) 情報処理装置及びその制御方法
CN117763077A (zh) 数据查询方法及装置
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
US20110106849A1 (en) New case generation device, new case generation method, and new case generation program
JPH08235188A (ja) 係り受け関係解析用辞書作成装置および係り受け関係解析装置
JP3894428B2 (ja) 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム
JP3396734B2 (ja) コーパス誤りの検出・修正処理装置,コーパス誤りの検出・修正処理方法およびそのプログラム記録媒体
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置
US20240046039A1 (en) Method for News Mapping and Apparatus for Performing the Method