JPH09311858A - 文章の照応関係解析装置 - Google Patents

文章の照応関係解析装置

Info

Publication number
JPH09311858A
JPH09311858A JP8128759A JP12875996A JPH09311858A JP H09311858 A JPH09311858 A JP H09311858A JP 8128759 A JP8128759 A JP 8128759A JP 12875996 A JP12875996 A JP 12875996A JP H09311858 A JPH09311858 A JP H09311858A
Authority
JP
Japan
Prior art keywords
noun
verb
clause
storage memory
anaphoric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8128759A
Other languages
English (en)
Inventor
Takehiko Yoshimi
毅彦 吉見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8128759A priority Critical patent/JPH09311858A/ja
Publication of JPH09311858A publication Critical patent/JPH09311858A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 簡単な構成で、節と名詞句が素性構造に関す
る制約を満たすかどうかを調べる。 【解決手段】 形態素・構文解析結果を記憶した形態素
・構文解析結果記憶バッファと、動詞−名詞対応テーブ
ルと、CPUを備え、CPUにより、入力文章中に出現
する節と、それより後方に出現する名詞句との照応関係
を解析するに際し、形態素・構文解析結果記憶バッファ
に記憶されている構文構造から動詞を取り出し、取り出
した動詞を、動詞−名詞対応テーブルに記憶されている
対応に従って名詞化し、形態素・構文解析結果記憶バッ
ファに記憶されている構文構造から、名詞化した名詞を
取り出し、取り出した動詞を主辞とする節の構成要素と
取り出した名詞を主辞とする名詞句の構成要素とを照合
し、その結果を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文章の照応関係
解析装置に関し、さらに詳しくは、入力テキスト(文
章)を構成する要素の間に成り立つ照応関係を解析する
文章の照応関係解析装置に関する。
【0002】
【従来の技術】入力テキストの解釈を一意に決定する問
題は、自然原語処理システムにおいて最も重要であると
同時に、最も解決が困難な問題のひとつでもある。この
問題を解決するために必要不可欠な基本的技術の一つ
は、入力テキストを構成する要素間の照応関係を解析す
ることである。
【0003】例えば、日英機械翻訳システムでは、照応
関係は、名詞句の性、数、定/不定の区別など、日本語
で明示することはまれであるが、英語では明示しなけれ
ばならない言語形式上の必須情報を得るための重要な手
がかりとなる。このようなことから、文献“Jelinek,
J.,Yoshimi,T.,Nishida,O.,Tamura,N.and Murakami,
H.,:Text-Wide MT Grammar,In Proceedings of the 3rd
Natural Language Processing Pacific Rim Symposiu
m,1995.”などにおいて、テキスト構成要素間の照応関
係を解析するための手法が提案されている。
【0004】上記文献においては、テキスト構成要素X
とYが次の三つの制約を満たすとき、YがXを指せるこ
とが示されている。 構文構造に関する制約:XはYの先行文脈中に現れ
る。 素性構造に関する制約:Xの意味とYの意味は矛盾し
ない。 陳述縮約に関する制約:YはXを縮約した言語形式で
ある。
【0005】
【発明が解決しようとする課題】しかしながら、上記文
献では、任意のテキストの構成要素XとYに関して、こ
れらが素性構造に関する制約を満たすかどうかを調べる
手段が示されているわけではない。
【0006】すなわち、XとY共に辞書に登録されてい
る見出し語である場合、つまりテキスト構成要素XとY
を構文解析木上の節点とみなしXとYが共に終端節点で
ある場合には、素性構造に関する制約が満たされるかど
うかは、上位下位関係を記述したシソーラスがあれば調
べることができるのに対し、XとYの少なくともいずれ
か一方が辞書に登録されている見出し語ではなく句や節
である場合、つまりXとYの少なくともいずれか一方が
構文解析木上の非終端節点である場合には、その句や節
を構成する見出し語の意味から句や節の意味を合成する
必要があるが、これについては、上記文献においても具
体的にどのように実現するかは触れられておらず、今後
の課題として残されている。
【0007】この発明は、このような事情を考慮してな
されたもので、構文構造に関する制約と陳述縮約に関す
る制約とを満たすテキスト構成要素XとYのうち、対象
を節と名詞句に限定し、節と名詞句の意味合成を近似的
に行なうことにより、節と名詞句が素性構造に関する制
約を満たすかどうかを調べることが可能な文章の照応関
係解析装置を提供するものである。
【0008】
【課題を解決するための手段】図1はこの発明の構成を
示すブロック図であり、この図に示すように、この発明
は、入力文章中に出現する節と、それより後方に出現す
る名詞句との照応関係を解析する文章の照応関係解析装
置であって、入力文章の形態素解析および構文解析結果
を記憶した形態素・構文解析結果記憶バッファ101
と、動詞とその動詞の名詞形とを対応づけてあらかじめ
記憶した動詞−名詞対応テーブル記憶メモリ102と、
形態素・構文解析結果記憶バッファ101に記憶されて
いる構文構造から動詞を取り出す動詞取り出し部103
と、動詞取り出し部103によって取り出された動詞
を、動詞−名詞対応テーブル記憶メモリ102に記憶さ
れている対応に従って名詞化する名詞化部104と、形
態素・構文解析結果記憶バッファ101に記憶されてい
る構文構造から、名詞化部104によって名詞化された
名詞を取り出す名詞取り出し部105と、動詞取り出し
部103によって取り出された動詞を主辞とする節の構
成要素と、名詞取り出し部105によって取り出された
名詞を主辞とする名詞句の構成要素とを照合し、その結
果を出力する構造照合部106を備えたことを特徴とす
る文章の照応関係解析装置である。
【0009】この発明において、動詞取り出し部10
3、名詞化部104、名詞取り出し部105および構造
照合部106としては、ROM,RAM等を含むマイク
ロプロセッサを用いるのが便利である。
【0010】形態素・構文解析結果記憶バッファ101
としては、RAMのような内部メモリを用いることがで
きる。この発明の文章の照応関係解析装置は、必ずし
も、形態素解析および構文解析を行うことが可能な各種
の文章解析装置と併用して用いる必要はないが、でき得
れば、このような文章解析装置と併用して用いることが
好ましく、この文章解析装置によって解析された形態素
・構文解析結果を、形態素・構文解析結果記憶バッファ
101としてのRAM等に一時記憶しておき、その後、
連続して照応関係を解析するように構成することが望ま
しい。
【0011】動詞−名詞対応テーブル記憶メモリ102
としては、ROMのような内部メモリや、フロッピーデ
ィスク装置、磁気ディスク装置等の外部メモリを用いる
ことができる。
【0012】この発明によれば、入力文章中に出現する
節と、それより後方に出現する名詞句との照応関係を解
析するにあたっては、まず、形態素・構文解析結果記憶
バッファ101に記憶されている構文構造から動詞を取
り出し、取り出した動詞を、動詞−名詞対応テーブルで
名詞化し、その名詞を、形態素・構文解析結果記憶バッ
ファ101に記憶されている構文構造の、先に取り出し
た動詞以降の部分から取り出す。
【0013】そして、取り出した動詞を主辞とする節の
構成要素と、取り出した名詞を主辞とする名詞句の構成
要素とを照合し、その結果を出力し、これにより照応関
係の解析結果を得る。
【0014】具体的には、例えば、構造照合部106
は、照合結果の出力に際しては、構成要素どうしの照合
がとれた場合には“正整数”を、それ以外の場合には
“0”を、それぞれ得点として出力するように構成する
ことが望ましい。
【0015】上記構成においては、構造照合部106
を、節の構成要素と名詞句の構成要素を部分文字列照合
する子節点ペア照合部と、連用助詞から連体助詞への助
詞の変化規則をあらかじめ記憶した助詞変化テーブル記
憶メモリと、節と名詞句における助詞の変化と、助詞変
化テーブル記憶メモリに記憶されている助詞の変化規則
とを照合する助詞変化規則照合部を備えた構成すること
が好ましい。
【0016】また、上記構成においては、語の上位下位
関係と類義関係を記述したシソーラスをあらかじめ記憶
したシソーラス記憶メモリをさらに設けた構成とし、名
詞化部104を、動詞取り出し部103によって取り出
された動詞に基づいてシソーラス記憶メモリに記憶され
ているシソーラスを検索しその検索で得られた上位動詞
または類義動詞を、動詞−名詞対応テーブル記憶メモリ
102に記憶されている対応に従って名詞化するように
構成し、構造照合部106を、節の構成要素と名詞句の
構成要素とに基づいてシソーラス記憶メモリに記憶され
ているシソーラスをそれぞれ検索しその検索で得られた
上位語または類義語どうしを部分文字列照合するように
構成することが好ましい。
【0017】さらに、上記構成においては、節と名詞句
との間に照応関係が成り立つことを否定する語彙をあら
かじめ記憶した前方照応否定語彙記憶メモリをさらに設
けた構成とし、構造照合部106を、節の構成要素と名
詞句の構成要素とを照合することに加え、節の構成要素
と名詞句の構成要素の両方または一方に基づいて前方照
応否定語彙記憶メモリを検索することにより、節の構成
要素と名詞句の構成要素とが照応する、照応しない、不
定のいづれかを判定し、その結果を出力するように構成
することが好ましい。
【0018】具体的には、例えば、構造照合部106
は、照合結果の出力に際しては、前方照応否定語彙記憶
メモリの検索が成功した場合には“負整数”を、前方照
応否定語彙記憶メモリの検索が失敗しかつ構成要素どう
しの照合がとれた場合には“正整数”を、それ以外の場
合には“0”を、それぞれ得点として出力するように構
成することが望ましい。
【0019】その場合、前方照応否定語彙記憶メモリ
に、非前方照応詞テーブルを記憶させておき、構造照合
部106を、この非前方照応詞テーブルを参照し、名詞
句において主辞に直接支配される非前方照応詞が存在す
る場合には、節と名詞句とが照応しないとみなすように
構成することが望ましい。
【0020】あるいは、前方照応否定語彙記憶メモリ
に、固有名詞テーブルを記憶させておき、構造照合部1
06を、この固有名詞テーブルを参照し、節において主
辞に直接支配される固有名詞が存在しかつ名詞句におい
て主辞を直接修飾する固有名詞が存在する場合には、こ
れら二つの固有名詞が完全に文字列一致しなければ節と
名詞句とが照応しないとみなすように構成してもよい。
【0021】この発明によれば、構造照合部106を設
け、この構造照合部106により、入力文章中に出現す
る節の意味と、その節より後方に出現する名詞句の意味
とが矛盾しないという、素性構造に関する制約が成り立
つかどうかを直接調べる代わりに、節を構成する構成要
素の意味と、名詞句を構成する構成要素の意味とが矛盾
しないか否かを調べるようにしている。
【0022】そして、このような節を構成する構成要素
の意味と、名詞句を構成する構成要素の意味とが矛盾し
ないか否かを調べるために、 構成要素同士が文字列として部分一致するかどうかを
調べるために子節点ペア照合部を設けるようにしてい
る。 構成要素同士が直接文字列として部分一致はしない
が、上位下位関係あるいは類義関係にあるかどうかを調
べるためにシソーラス記憶メモリを設けるようにしてい
る。 節を名詞句で言い替える時、節中の連用助詞が名詞句
においてどのような連体助詞で表現されるかを調べるた
めに、連用助詞から連体助詞への助詞の変化規則をあら
かじめ記憶した助詞変化テーブル記憶メモリを設けるよ
うにしている。 たとえ、構成要素同士が文字列として部分一致した
り、上位下位関係あるいは類義関係にあったりしても、
名詞句が節の言い替えではない場合(節と名詞句が照応
関係にない場合)を特定するために、前方照応否定語彙
記憶メモリを設けるようにしている。
【0023】
【発明の実施の形態】以下、図面に示す実施例に基づい
てこの発明を詳述する。なお、これによってこの発明が
限定されるものではない。
【0024】この発明の文章の照応関係解析装置は、例
えば日英機械翻訳システムや日仏、日伊、日独機械翻訳
システムのような各種の機械翻訳システムに組み込んで
用いることができる。
【0025】本実施例では、その中の一例として、日英
機械翻訳システムに組み込んだ例を挙げて説明する。こ
の日英機械翻訳システムは、キーボード、CPU、メモ
リ、表示装置、印字装置等の公知の基本的な装置から構
成されている。したがって、以下においては、それらの
基本的な装置については説明を省略する。また、仮名漢
字変換機能のような日本語ワードプロセッサとしての基
本機能についてはすでに備えているものとして説明を行
う。
【0026】実施例1 図2はこの発明による文章の照応関係解析装置の実施例
1の構成を示すブロック図である。この発明の文章の照
応関係解析装置は、入力テキスト中に出現する節と、そ
れより後方に出現する名詞句との照応関係を解析するも
のである。
【0027】この図において、1はRAMからなる形態
素・構文解析結果記憶バッファ、2はROMからなる動
詞−名詞対応テーブル記憶メモリ、3は動詞取り出し
部、4は名詞化部、5は名詞取り出し部、6は構造照合
部、7はRAMからなる照合結果記憶バッファである。
【0028】動詞取り出し部3、名詞化部4、名詞取り
出し部5および構造照合部6はCPUから構成されてい
る。形態素・構文解析結果記憶バッファ1には、入力テ
キストの形態素解析および構文解析を行った形態素・構
文解析結果が記憶されている。
【0029】動詞−名詞対応テーブル記憶メモリ2に
は、図3に示すような形式で、動詞とその動詞の名詞形
とを対応づけてテーブル化したものをあらかじめ記憶し
ておく。図3中の記号“+”は結合を表し、記
号“{}”は選択する文字を表している。
【0030】動詞取り出し部3は、形態素・構文解析結
果記憶バッファ1に記憶されている構文構造から動詞を
取り出す。名詞化部4は、動詞−名詞対応テーブル記憶
メモリ2に記憶されている対応に従って、動詞取り出し
部3によって取り出された動詞の名詞形を生成する。名
詞取り出し部5は、形態素・構文解析結果記憶バッファ
1に記憶されている構文構造から、名詞化部4によって
名詞化されたものと同じ名詞を取り出す。
【0031】構造照合部6は、動詞取り出し部3によっ
て取り出された動詞を主辞とする節を構成する各構成要
素と、名詞取り出し部5によって取り出された名詞を主
辞とする名詞句を構成する各構成要素とを照合し、その
結果を出力する。この照合結果の出力に際しては、各構
成要素について、構成要素どうしの照合がとれた場合に
は“正整数”を得点として返し、それ以外の場合には
“0”を得点として返す。この構造照合部6によって照
合した結果は、照合結果記憶バッファ7に記憶してお
く。
【0032】図4は構造照合部6の詳細構成を示すブロ
ック図である。この図に示すように、構造照合部6は、
助詞変化テーブル記憶メモリ11、助詞変化規則照合部
12、子節点ペア生成部13、子孫節点記憶バッファ1
4、子節点ペア取り出し部15、および子節点ペア照合
部16から構成されている。
【0033】助詞変化テーブル記憶メモリ11には、図
5に示すような形式で、連用助詞から連体助詞への助詞
の変化規則をテーブル化したものをあらかじめ記憶して
おく。図5の助詞変化テーブルの第1行目は、主格を表
す連用助詞「が」、「は」、「も」が、連体助詞「によ
る」、「の」、「φ」に変化しうることを表している。
このテーブル中、「φ」はゼロ助詞を意味している。
【0034】助詞変化規則照合部12は、助詞変化テー
ブル記憶メモリ11を参照することにより、節と名詞句
における助詞の変化と、助詞変化テーブル記憶メモリ1
1に記憶されている助詞の変化規則とを照合する。
【0035】子節点ペア生成部13は、Xの子節点をx
i(i=1〜m)とし、Yの子節点をyj(j=1〜
n)として、子節点どうしのペア文字列〔xi,yj〕
を生成し、これを子孫節点記憶バッファ14に入れる。
【0036】子節点ペア取り出し部15は、子孫節点記
憶バッファ14から任意の子節点のペア文字列を取り出
す。子節点ペア照合部16は、節の構成要素と名詞句の
構成要素とを部分文字列照合する。すなわち子節点のペ
ア文字列どうしが全体一致したか、あるいは部分一致し
たかを照合する。
【0037】このような構成における動作を図6および
図7に示すフローチャートに従い説明する。図6は実施
例1の文章の照応関係解析装置における解析処理の内容
を示すフローチャートである。
【0038】以下には、図8に示すテキスト番号1の入
力テキストにおける照応関係を解析する場合を例とし
て、処理の流れを追う。入力テキストにおける照応関係
とは、前述したように、入力テキスト中に出現する節
と、それより後方に出現する名詞句との照応関係であ
る。この入力テキストの形態素・構文解析の結果は、形
態素・構文解析結果記憶バッファ1にすでに記憶されて
いるものとする。
【0039】この入力テキストの形態素・構文解析の結
果、テキスト番号1のテキストにおいては、第二文「自
民党は委員会提案に難色を示している」の構文構造は一
意的に定まるが、第一文「社会党は25日の予算委員会
で改正案を採択するよう提案した」には、3通りの構文
構造があるので、テキスト全体としては、図9、図10
および図11に示すような第1から第3の3つの構文構
造を得る。
【0040】図9の第1の構文構造では、「採択する」
が「社会党は」と「予算委員会で」の両方を支配する解
釈である。図10の第2の構文構造では、「採択する」
が「予算委員会で」を支配し、「提案した」が「社会党
は」を支配する解釈である。図11の第3の構文構造で
は、「提案した」が「社会党は」と「予算委員会で」の
両方を支配する解釈である。
【0041】本発明の照応関係解析処理においては、ま
ず、このような、形態素・構文解析結果記憶バッファ1
内に存在する構文構造の総数をNとし、カウンターkの
値を“1”に設定する。この場合、テキスト番号1のテ
キストには3通りの構文構造があるのでNは3である
(ステップS1)。
【0042】その後、形態素・構文解析結果記憶バッフ
ァ1内の全ての構文構造について、処理を終えたか否か
をチェックする(ステップS2)。今、k=1、N=3
であり、k>Nではないので処理を継続する。
【0043】次に、形態素・構文解析結果記憶バッファ
1から、まず、第1の構文構造を取り出す(ステップS
3)。そして、第一文の識別番号に沿って上から下へ
(入力テキストの先頭から末尾に向けて)走査し、ま
ず、識別番号5の動詞「採択する」を発見する(ステッ
プS4)。このステップS3およびステップS4の処理
は、動詞取り出し部3で行う。
【0044】動詞−名詞対応テーブル記憶メモリ2は、
前述したように、図3に示すような形式で動詞とその名
詞形を記憶している。図3中の記号+は結合を、記
号{}は選択を表しており、従って、図3の第1行目の
動詞「動」の記述は、「動か」、「動き」、「動く」、
「動け」、「動こ」、「動い」を意味する。
【0045】動詞−名詞対応テーブル記憶メモリ2の検
索は、取り出した動詞と動詞−名詞対応テーブル記憶メ
モリ2の動詞とが、全体一致あるいは部分一致した場合
に成功する。
【0046】今、動詞取り出し部3で取り出した動詞は
「採択する」であるので、図3の第2行目の「採択す」
との部分文字列一致に成功し、その動詞に対応する名詞
「採択」を検索結果として得、これにより動詞の名詞形
を生成する(ステップS5)。これがいわゆる動詞の名
詞化である。このステップS5の処理は、名詞化部4で
行う。
【0047】名詞取り出し部5は、この名詞化部4で生
成した名詞が、その名詞のもととなった動詞よりも以降
に存在するか否かを調べる。すなわち、第1の構文構造
の走査の結果、識別番号5の動詞「採択する」の出現よ
り下側(入力テキストにおいて「採択する」より末尾
側)には、名詞「採択」は出現しないので(ステップS
6)、ステップS4へ戻る。
【0048】次に、ステップS4で識別番号6の動詞
「提案した」を発見し、ステップS5で名詞化した「提
案」を検索結果として返し、ステップS6で識別番号9
の名詞「提案」を発見する。
【0049】構造照合部6では、ステップS4で発見し
た動詞を主辞とする構造を構成する要素と、ステップS
6で発見した名詞を主辞とする構造を構成する要素との
照合を行なう(ステップS7)。
【0050】このステップS7における構造照合部6の
処理の詳細を図7のフローチャートに示す。構造照合部
6の処理においては、まず、識別番号6の動詞「提案し
た」をXとし、識別番号9の名詞「提案」をYとする
(ステップS11)。第1の構文構造において、Xの子
節点は、識別番号5の動詞「採択する」であり、Yの子
節点は、識別番号8の名詞「委員会」であるので、それ
らの子節点を決定する(ステップS12)。
【0051】子節点ペア生成部13は、上記の例では、
〔採択する、委員会〕という子節点ペアを生成し、子孫
節点記憶バッファ14に入れる(ステップS13)。そ
して、子孫節点記憶バッファ14が空か否かを判定し、
子孫節点記憶バッファ14内のすべてのペアについての
処理を終えたか否かをチェックする(ステップS1
4)。
【0052】今、子孫節点記憶バッファ14は空ではな
いので、子節点ペア取り出し部15は、子孫節点記憶バ
ッファ14から〔採択する、委員会〕という子節点ペア
を取り出す(ステップS15)。
【0053】次に、子節点ペア照合部16は、子節点ペ
アである「採択する」の文字列と「委員会」の文字列の
全体一致あるいは部分一致(以下、全体一致あるいは部
分一致を単に「一致」という)を照合する(ステップS
16)。
【0054】ここで、一致は成功しないので、子節点ペ
ア〔採択する、委員会〕の得点を“0”として、子節点
ペア〔採択する、委員会〕を得点“0”と共に、照合結
果記憶バッファ7に記憶した後(ステップS17)、ス
テップS14へ戻る。そして、今、子孫節点記憶バッフ
ァ14は空となっているので、処理を終え、図6のステ
ップS4へ戻る。
【0055】第1の構文構造においては、未抽出の動詞
は、もはや存在しないので(ステップS4)、カウンタ
ーkの値を2として(ステップS8)、ステップS2へ
戻り、形態素・構文解析結果記憶バッファ1から、第2
の構文構造を取り出す(ステップS3)。
【0056】第2の構文構造では、ステップS4、ステ
ップS5、ステップS6で、前回と同様に処理を行な
い、ステップS7で、動詞を主辞とする構成要素と名詞
を主辞とする構成要素との照合を行なう。
【0057】ステップS7の詳細フローチャートのステ
ップS11では、第2の構文構造の識別番号6の動詞
「提案した」をXとし、識別番号9の名詞「提案」をY
とする。
【0058】第2の構文構造において、Xの子節点は、
識別番号1の名詞「社会党」と、識別番号5の動詞「採
択する」であり、Yの子節点は、識別番号8の名詞「委
員会」であるので(ステップS12)、子節点ペア〔社
会党、委員会〕と子節点ペア〔採択する、委員会〕の二
つのペアを子孫節点記憶バッファ14に入れる(ステッ
プS13)。
【0059】そして、子孫節点記憶バッファ14から、
まず、子節点ペア〔社会党、委員会〕を取り出し(ステ
ップS15)、「社会党」と「委員会」の一致を照合す
る(ステップS16)。
【0060】ここで、「社会党」と「委員会」の文字列
としての一致は成功しないので、子節点ペア〔社会党、
委員会〕の得点を“0”として、照合結果記憶バッファ
7に記憶した後、ステップS14へ戻る。
【0061】そして、子孫節点記憶バッファ14から、
次に、子節点ペア〔採択する、委員会〕を取り出し(ス
テップS15)、「採択する」と「委員会」の一致を照
合する(ステップS16)。
【0062】子節点ペア〔採択する、委員会〕について
も、同じく文字列としての一致には成功しないので、子
節点ペア〔採択する、委員会〕の得点を“0”として、
照合結果記憶バッファ7に記憶した後、ステップS14
へ戻る。ステップS14では、今、子孫節点記憶バッフ
ァ14は空となっているので、処理を終え、図6のステ
ップS4へ戻る。
【0063】第2の構文構造においては、未抽出の動詞
は、もはや存在しないので(ステップS4)、カウンタ
ーkの値を3として(ステップS8)、ステップS2へ
戻り、形態素・構文解析結果記憶バッファ1から、第3
の構文構造を取り出す(ステップS3)。
【0064】第3の構文構造では、ステップS4、ステ
ップS5、ステップS6で、前回と同様に処理を行な
い、ステップS7で、動詞を主辞とする構成要素と名詞
を主辞とする構成要素との照合を行なう。
【0065】ステップS7の詳細フローチャートのステ
ップS11では、第3の構文構造の識別番号6の動詞
「提案した」をXとし、識別番号9の名詞「提案」をY
とする。
【0066】第3の構文構造において、Xの子節点は、
識別番号1の名詞「社会党」、識別番号3の名詞「予算
委員会」、識別番号5の動詞「採択する」であり、Yの
子節点は、識別番号8の名詞「委員会」であるので(ス
テップS12)、子節点ペア〔社会党、委員会〕、〔予
算委員会、委員会〕、〔採択する、委員会〕の三つのペ
アを子孫節点記憶バッファ14に入れる(ステップS1
3)。
【0067】そして、子孫節点記憶バッファ14から、
まず、子節点ペア〔社会党、委員会〕を取り出し(ステ
ップS15)、「社会党」と「委員会」の一致を照合す
る(ステップS16)。
【0068】ここで、「社会党」と「委員会」の文字列
としての一致は成功しないので、子節点ペア〔社会党、
委員会〕の得点を“0”として、照合結果記憶バッファ
7に記憶した後、ステップS14へ戻る。
【0069】そして、子孫節点記憶バッファ14から、
次に、子節点ペア〔予算委員会、委員会〕を取り出し
(ステップS15)、「予算委員会」と「委員会」の文
字列の一致を照合する(ステップS16)。
【0070】「予算委員会」と「委員会」は、文字列と
しての部分一致に成功するので、次に、助詞変化規則照
合部12は、助詞変化テーブル記憶メモリ11に記憶し
ている連用助詞から連体助詞への変化テーブルを用い、
動詞を主辞とする構造と名詞を主辞とする構造における
助詞の変化が、規則に従っているか否かをチェックする
(ステップS18)。
【0071】図11の構文構造の子番号(関係/助詞)
欄によれば、識別番号3の名詞「予算委員会」は、「場
所/で」という関係で、識別番号6の動詞「提案した」
に支配されており、識別番号8の名詞「委員会」は、
「連体修飾/φ」という関係で、識別番号9の名詞「提
案」に支配されている。
【0072】「場所/で」から「連体修飾/φ」への変
化は、図5の助詞変化テーブルの第4行目によって規則
に従う変化であることが示されているので、ステップS
18での助詞変化テーブルとの照合は成功するので、子
節点ペア〔予算委員会(場所/で)、委員会(連体修飾
/φ)〕を正整数の得点(例えば1点)と共に照合結果
記憶バッファ7に記憶する(ステップS19)。
【0073】以下、同様に、処理を継続することによっ
て、次のような解析結果が得られる。 1.第1の構文構造においては、正整数の得点を与えら
れたペアは存在しないので、この構文構造における照応
解析の得点は“0”である。 2.第2の構文構造についても得点は“0”である。 3.第3の構文構造においては、ペア〔予算委員会(場
所/で)、委員会(連体修飾/φ)〕に正整数の得点が
与えられているので、「予算委員会で提案した」という
節と「委員会提案」という複合名詞の間に照応関係が成
り立つ。
【0074】なお、ある構文構造における照応関係の得
点が“0”であるということは、この構文構造において
照応関係にある節と名詞句が存在しないということを意
味するのではなく、この構文構造において照応関係にあ
る節と名詞句が存在するかどうか、わからないというこ
とを意味する。
【0075】実施例2 図12はこの発明の実施例2における構造照合部6の構
成を示すブロック図である。この図に示すように、この
発明の実施例2の構成の特徴は、構造照合部6にシソー
ラス記憶メモリ17が設けられていることであり、その
他の構成は実施例1と同じである。したがって、この実
施例2においては、実施例1と同じ構成要素には同じ参
照番号を付してその説明を省略する。シソーラス記憶メ
モリ17には、図13に示すような形式で、語の上位下
位関係と類義関係を記述したシソーラスをあらかじめ記
憶させておく。
【0076】この実施例2では、構造照合部6は、入力
テキスト中に出現する節と、それより後方に出現する名
詞句との照応関係を解析するにあたって、節の構成要素
と名詞句の構成要素とに基づいてシソーラス記憶メモリ
17に記憶されているシソーラスをそれぞれ検索し、そ
の検索で得られた上位語または類義語どうしを部分文字
列照合する。
【0077】実施例2における構造照合部6の処理の内
容を図14のフローチャートに示す。この実施例2にお
いては、実施例1の図7に示すフローチャートのステッ
プS16に対応するステップS21で、シソーラス記憶
メモリ17に記憶されているシソーラスを検索する、と
いう処理を行っている。その他の処理については実施例
1と同じである。
【0078】例えば、図8で示したテキスト番号2のテ
キストを、文字列照合機能だけを備えた実施例1の照応
関係解析装置で処理すると、「成功」と「達成」が文字
列として一致しないので、節「イラク説得の使命の成功
を期待する」と名詞句「使命達成への期待」の間に照応
関係があるという解析結果は得られない。
【0079】これに対し、この実施例2の照応関係解析
装置では、図14のステップS21で、シソーラス記憶
メモリ17に記憶されているシソーラスを検索すること
により、「成功」と「達成」が上位下位関係にあること
がわかり、節「イラク説得の使命の成功を期待する」と
名詞句「使命達成への期待」との間に照応関係があると
正しく解析できる。
【0080】実施例3 図15はこの発明による文章の照応関係解析装置の実施
例3の構成を示すブロック図である。この図に示すよう
に、この発明の実施例3の構成の特徴は、前方照応否定
語彙記憶メモリ18が設けられていることであり、その
他の構成は実施例1と同じである。前方照応否定語彙記
憶メモリ18には、例えば、図16に示すように、非前
方照応詞テーブルを記憶させておく。
【0081】この実施例3では、構造照合部6は、入力
テキスト中に出現する節と、それより後方に出現する名
詞句との照応関係を解析するにあたって、節の構成要素
と名詞句の構成要素とを照合することに加え、節の構成
要素と名詞句の構成要素の両方または一方に基づいて前
方照応否定語彙記憶メモリ18を検索することにより、
節の構成要素と名詞句の構成要素とが照応する、照応し
ない、不定のいづれかを判定する。
【0082】この場合、構造照合部6は、非前方照応詞
テーブルを参照し、名詞句において主辞に直接支配され
る非前方照応詞が存在する場合には、節と名詞句とが照
応しないとみなす。
【0083】実施例3における解析処理の内容を図17
のフローチャートに示す。この実施例3においては、実
施例1の図7に示すフローチャートのステップS11と
ステップS12の間にステップS22を挿入し、このス
テップS22で、非前方照応詞テーブルを参照し、Yの
子節点に非前方照応詞があるか否かを照合し、非前方照
応詞があれば負正数の得点を与える(ステップS2
3)、という処理を行っている。その他の処理について
は実施例1と同じである。
【0084】例えば、図8で示したテキスト番号3のテ
キストを、実施例1の照応関係解析装置で処理すると、
節「イスラエルはすでに2日続けて攻撃されている。」
と名詞句「次の攻撃」との間に照応関係があると判断さ
れる。
【0085】これに対し、この実施例3の照応関係解析
装置では、図17のステップS22で、前方照応否定語
彙記憶メモリ18に記憶されている非前方照応詞テーブ
ルを検索することにより、ステップS12〜ステップS
20の処理が行われずに、ステップS23で負整数の得
点が与えられ、節「イスラエルはすでに2日続けて攻撃
されている。」と名詞句「次の攻撃」との間に照応関係
はないと正しく解析できる。
【0086】実施例4 この実施例4の構成の特徴は、実施例3と同様に、前方
照応否定語彙記憶メモリ18が設けられている点である
が、実施例3と異なるのは前方照応否定語彙記憶メモリ
18に、図18に示すような固有名詞テーブルを記憶さ
せていることであり、その他の構成は実施例1と同じで
ある。
【0087】この実施例4では、構造照合部6は、入力
テキスト中に出現する節と、それより後方に出現する名
詞句との照応関係を解析するにあたって、実施例3と同
じく、節の構成要素と名詞句の構成要素とを照合するこ
とに加え、節の構成要素と名詞句の構成要素の両方また
は一方に基づいて前方照応否定語彙記憶メモリ18を検
索することにより、節の構成要素と名詞句の構成要素と
が照応する、照応しない、不定のいづれかを判定するの
であるが、この場合、構造照合部6は、固有名詞テーブ
ルを参照し、節において主辞に直接支配される固有名詞
が存在しかつ名詞句において主辞を直接修飾する固有名
詞が存在する場合には、これら二つの固有名詞が完全に
文字列一致しなければ節と名詞句とが照応しないとみな
す。
【0088】実施例4における解析処理の内容を図19
のフローチャートに示す。この実施例4においては、実
施例1の図7に示すフローチャートのステップS15と
ステップS16の間にステップS24を挿入し、このス
テップS24で、子節点どうしが両方とも固有名詞であ
るか否かを判定し、両方とも固有名詞であれば子節点ど
うしの完全文字列一致を調べ(ステップS25)、完全
文字列一致に成功しなければ負正数の得点を与える(ス
テップS26)、という処理を行っている。その他の処
理については実施例1と同じである。
【0089】例えば、図8で示したテキスト番号4のテ
キストを、実施例1の照応関係解析装置で処理すると、
図7のステップS16で、子節点ペア〔フセイン大統
領、ブッシュ大統領〕は部分文字列照合に成功するの
で、このペアには正整数の得点が与えられ、節「デクエ
ヤル国連事務総長はフセイン大統領と会談する」と名詞
句「ブッシュ大統領との会談」との間に照応関係がある
と判断される。
【0090】これに対し、この実施例4の照応関係解析
装置では、図19のステップS24で、前方照応否定語
彙記憶メモリ18に記憶されている固有名詞テーブルを
検索すると、子節点ペア〔フセイン大統領、ブッシュ大
統領〕の「フセイン大統領」と「ブッシュ大統領」の両
方とも固有名詞であることが判明するので、ステップS
25へ進む。
【0091】ステップS25で、固有名詞どうしの完全
文字列照合を行うと、「フセイン大統領」と「ブッシュ
大統領」は完全文字列一致はしないので、ステップS2
6へ進み、子節点ペア〔フセイン大統領、ブッシュ大統
領〕の得点を負整数として、照合結果記憶バッファ7に
記憶する。
【0092】以上の処理により、節「デクエヤル国連事
務総長はフセイン大統領と会談する」と名詞句「ブッシ
ュ大統領との会談」との間に照応関係はないと正しく解
析できる。
【0093】このようにして、文献“Jelinek, J., Yos
himi, T., Nishida, O., Tamura, N. and Murakami,
H.: Text-Wide MT Grammar, In Proceedings of the 3r
d Natural Language Processing Pacific Rim Symposiu
m, 1995.”で提案された照応解析において必要とされて
いる句や節の意味合成を、その句や節を構成する見出し
語の意味どうしの照合によって近似的に実行することが
できる。さらに、照応関係の解析結果に基づき、可能な
構文構造の中から得点の最も高いものを選ぶことで、入
力テキストの曖昧さを解消することができる。
【0094】また、構築に多くのコストを要するシソー
ラスを用いることなく、文字列照合という単純な処理
で、節と名詞句の間で成り立つ照応関係を解析すること
ができる。
【0095】しかしながら、すでに構築されたシソーラ
スが入手可能である場合には、シソーラスを用いること
で、節と名詞句の間で成り立つ照応関係をより正確に解
析することができる。
【0096】さらに、前方照応否定語彙記憶メモリがな
い場合には、ある構文構造において照応関係にある節
と名詞句が存在する(得点が“正整数”の場合)、あ
る構文構造において照応関係にある節と名詞句が存在す
るかどうかわからない(得点が“0”の場合)、のいず
れかの判定しかできないが、前方照応否定語彙記憶メモ
リを設けた場合には、ある構文構造において照応関係
にある節と名詞句が存在する(得点が“正整数”の場
合)、ある構文構造において照応関係にある節と名詞
句が存在するかどうかわからない(得点が“0”の場
合)、ある構文構造において照応関係にない節と名詞
句が存在する(得点が“負整数”の場合)、の3種の判
定を行なうことができる。
【0097】そして、得点が“負整数”の判定では、前
方照応否定語彙記憶メモリに非前方照応詞テーブルを記
憶させておいた場合には、名詞句において主辞を直接修
飾する非前方照応詞が存在する場合、節と名詞句が照応
関係にないという判定を下すことができる。
【0098】また、得点が“負整数”の判定では、前方
照応否定語彙記憶メモリに固有名詞テーブルを記憶させ
ておいた場合には、節において主辞に直接支配される固
有名詞と完全文字列一致しない固有名詞が、名詞句にお
いて主辞を直接修飾している場合、節と名詞句が照応関
係にないという判定を下すことができる。
【0099】
【発明の効果】この発明によれば、入力文章中に出現す
る節と、それより後方に出現する名詞句との照応関係を
解析するにあたっては、入力文章中から取り出した動詞
を主辞とする節の構成要素と、入力文章中から取り出し
たその動詞に対応する名詞を主辞とする名詞句の構成要
素とを照合し、節を構成する構成要素の意味と、名詞句
を構成する構成要素の意味とが矛盾しないか否かを調べ
るようにしたので、簡単な構成で、節と名詞句の意味合
成を近似的に行なうことができ、節と名詞句が素性構造
に関する制約を満たすかどうかを調べることが可能とな
る。
【図面の簡単な説明】
【図1】この発明の構成を示すブロック図である。
【図2】この発明による文章の照応関係解析装置の実施
例1の構成を示すブロック図である。
【図3】実施例1の動詞−名詞対応テーブル記憶メモリ
の記憶内容の一例を示す説明図である。
【図4】実施例1の構造照合部の詳細構成を示すブロッ
ク図である。
【図5】実施例1の助詞変化テーブル記憶メモリの記憶
内容の一例を示す説明図である。
【図6】実施例1の解析処理の内容を示すフローチャー
トである。
【図7】実施例1の構造照合部の処理の詳細を示すフロ
ーチャートである。
【図8】入力テキストの例を示す説明図である。
【図9】形態素、構文解析した構文構造の例を示す説明
図である。
【図10】形態素、構文解析した構文構造の例を示す説
明図である。
【図11】形態素、構文解析した構文構造の例を示す説
明図である。
【図12】実施例2の構造照合部の構成を示すブロック
図である。
【図13】シソーラス記憶メモリの記憶内容の一例を示
す説明図である。
【図14】実施例2の構造照合部の処理の内容を示すフ
ローチャートである。
【図15】実施例3の構成を示すブロック図である。
【図16】非前方照応詞テーブルの記憶内容の一例を示
す説明図である。
【図17】実施例3の解析処理の内容を示すフローチャ
ートである。
【図18】固有名詞テーブルの記憶内容の一例を示す説
明図である。
【図19】実施例4の解析処理の内容を示すフローチャ
ートである。
【符号の説明】
1 形態素・構文解析結果記憶バッファ、 2 動詞−名詞対応テーブル記憶メモリ 3 動詞取り出し部 4 名詞化部 5 名詞取り出し部 6 構造照合部 7 照合結果記憶バッファ 11 助詞変化テーブル記憶メモリ 12 助詞変化規則照合部 13 子節点ペア生成部 14 子孫節点記憶バッファ 15 子節点ペア取り出し部 16 子節点ペア照合部 17 シソーラス記憶メモリ 18 前方照応否定語彙記憶メモリ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力文章中に出現する節と、それより後
    方に出現する名詞句との照応関係を解析する文章の照応
    関係解析装置であって、 入力文章の形態素解析および構文解析結果を記憶した形
    態素・構文解析結果記憶バッファと、 動詞とその動詞の名詞形とを対応づけてあらかじめ記憶
    した動詞−名詞対応テーブル記憶メモリと、 形態素・構文解析結果記憶バッファに記憶されている構
    文構造から動詞を取り出す動詞取り出し部と、 動詞取り出し部によって取り出された動詞を、動詞−名
    詞対応テーブル記憶メモリに記憶されている対応に従っ
    て名詞化する名詞化部と、 形態素・構文解析結果記憶バッファに記憶されている構
    文構造から、名詞化部によって名詞化された名詞を取り
    出す名詞取り出し部と、 動詞取り出し部によって取り出された動詞を主辞とする
    節の構成要素と、名詞取り出し部によって取り出された
    名詞を主辞とする名詞句の構成要素とを照合し、その結
    果を出力する構造照合部を備えたことを特徴とする文章
    の照応関係解析装置。
  2. 【請求項2】 前記構造照合部が、 前記節の構成要素と前記名詞句の構成要素を部分文字列
    照合する子節点ペア照合部と、 連用助詞から連体助詞への助詞の変化規則をあらかじめ
    記憶した助詞変化テーブル記憶メモリと、 前記節と前記名詞句における助詞の変化と、助詞変化テ
    ーブル記憶メモリに記憶されている助詞の変化規則とを
    照合する助詞変化規則照合部を備えたことを特徴とする
    請求項1記載の文章の照応関係解析装置。
  3. 【請求項3】 語の上位下位関係と類義関係を記述した
    シソーラスをあらかじめ記憶したシソーラス記憶メモリ
    をさらに備え、 前記名詞化部が、前記動詞取り出し部によって取り出さ
    れた動詞に基づいてシソーラス記憶メモリに記憶されて
    いるシソーラスを検索しその検索で得られた上位動詞ま
    たは類義動詞を、動詞−名詞対応テーブル記憶メモリに
    記憶されている対応に従って名詞化し、 前記構造照合部が、前記節の構成要素と前記名詞句の構
    成要素とに基づいてシソーラス記憶メモリに記憶されて
    いるシソーラスをそれぞれ検索しその検索で得られた上
    位語または類義語どうしを部分文字列照合することを特
    徴とする請求項1記載の文章の照応関係解析装置。
  4. 【請求項4】 節と名詞句との間に照応関係が成り立つ
    ことを否定する語彙をあらかじめ記憶した前方照応否定
    語彙記憶メモリをさらに備え、 前記構造照合部が、前記節の構成要素と前記名詞句の構
    成要素とを照合することに加え、前記節の構成要素と前
    記名詞句の構成要素の両方または一方に基づいて前方照
    応否定語彙記憶メモリを検索することにより、前記節の
    構成要素と前記名詞句の構成要素とが照応する、照応し
    ない、不定のいづれかを判定し、その結果を出力するこ
    とを特徴とする請求項1記載の文章の照応関係解析装
    置。
  5. 【請求項5】 前記前方照応否定語彙記憶メモリが、非
    前方照応詞テーブルを記憶し、 前記構造照合部が、この非前方照応詞テーブルを参照
    し、前記名詞句において主辞に直接支配される非前方照
    応詞が存在する場合には、前記節と前記名詞句とが照応
    しないとみなすことを特徴とする請求項4記載の文章の
    照応関係解析装置。
  6. 【請求項6】 前記前方照応否定語彙記憶メモリが、固
    有名詞テーブルを記憶し、 前記構造照合部が、この固有名詞テーブルを参照し、前
    記節において主辞に直接支配される固有名詞が存在しか
    つ前記名詞句において主辞を直接修飾する固有名詞が存
    在する場合には、これら二つの固有名詞が完全に文字列
    一致しなければ前記節と前記名詞句とが照応しないとみ
    なすことを特徴とする請求項4記載の文章の照応関係解
    析装置。
JP8128759A 1996-05-23 1996-05-23 文章の照応関係解析装置 Pending JPH09311858A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8128759A JPH09311858A (ja) 1996-05-23 1996-05-23 文章の照応関係解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8128759A JPH09311858A (ja) 1996-05-23 1996-05-23 文章の照応関係解析装置

Publications (1)

Publication Number Publication Date
JPH09311858A true JPH09311858A (ja) 1997-12-02

Family

ID=14992770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8128759A Pending JPH09311858A (ja) 1996-05-23 1996-05-23 文章の照応関係解析装置

Country Status (1)

Country Link
JP (1) JPH09311858A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081542A (ja) * 2009-10-06 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081542A (ja) * 2009-10-06 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
Tiedemann Recycling translations: Extraction of lexical data from parallel corpora and their application in natural language processing
US5083268A (en) System and method for parsing natural language by unifying lexical features of words
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US7734459B2 (en) Automatic extraction of transfer mappings from bilingual corpora
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
Sinha et al. AnglaHindi: an English to Hindi machine-aided translation system
EP1262880A2 (en) Scaleable machine translation system
WO2001029700A1 (en) Method and system for transforming a source language linguistic structure into a target language linguistic structure
JPH0644296A (ja) 機械翻訳装置
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2815714B2 (ja) 翻訳装置
da Silva Shallow processing of Portuguese: From sentence chunking to nominal lemmatization
Stamatatos et al. A practical chunker for unrestricted text
JPH05120324A (ja) 言語処理方式
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
KR950013128B1 (ko) 기계번역장치 및 방법
KR950013129B1 (ko) 기계번역장치 및 방법
JPH09311858A (ja) 文章の照応関係解析装置
Althobaiti Minimally-supervised Methods for Arabic Named Entity Recognition