JP2870278B2 - 語義選択装置 - Google Patents

語義選択装置

Info

Publication number
JP2870278B2
JP2870278B2 JP4003976A JP397692A JP2870278B2 JP 2870278 B2 JP2870278 B2 JP 2870278B2 JP 4003976 A JP4003976 A JP 4003976A JP 397692 A JP397692 A JP 397692A JP 2870278 B2 JP2870278 B2 JP 2870278B2
Authority
JP
Japan
Prior art keywords
expression
meaning
input
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4003976A
Other languages
English (en)
Other versions
JPH05204965A (ja
Inventor
伸一 土井
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP4003976A priority Critical patent/JP2870278B2/ja
Publication of JPH05204965A publication Critical patent/JPH05204965A/ja
Application granted granted Critical
Publication of JP2870278B2 publication Critical patent/JP2870278B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システム・自
然言語インタフェース・推敲支援システムなど、入力さ
れた自然言語の文を解析して対応する意味表現を出力す
る自然言語解析システムにおける語義選択装置に関す
る。
【0002】
【従来の技術】一般に自然言語の単語表現は複数の語義
を有しており、解析の際には、単語表現aに対応する語
義b1〜bnの中から、単語表現aの出現環境に応じて
最も適切なものを選択する必要がある。
【0003】現在の自然言語解析システムでは基本的
に、「ある表現に対する言語構造上の制約を辞書・文法
内にあらかじめ記述しておき、これらを入力表現に適用
することにより語義を選択する」という語義選択方式を
採用している。図4に、この語義選択方式で用いられる
ある見出し語aに対する辞書の構成を示す。自然言語の
部分表現Aが入力され、部分表現A中の単語表現aに対
する語義を決定する際には、見出し語aをキーとしてこ
の辞書が選択され、対応する語義群b1〜bnの中か
ら、付随する制約条件ci1〜cimi を部分表現Aが
充足する語義biが、適切な語義として選択される。
【0004】例えば用言に対する語義選択においては、
この制約条件は主として必須格要素に対する意味制約と
して記述される。図5に例として、日本語の動詞「取
る」に対する辞書の一部分を示す。この辞書を持つ日本
語解析システムに「彼はメガネを取った。」という文が
入力された場合には、「主語が人」「を格が身につける
もの」という条件に合致して「取る」の語義として
「(身につけているものを)ぬぐ・はずす」が選択され
る。
【0005】一方最近、例えば機械翻訳において、あら
かじめ対訳事例を蓄積しておき、シソーラスを用いて入
力と類似した事例を検索してその事例を模倣して翻訳す
ることにより、必ず何らかの翻訳結果が出力されること
を保証する、事例に基づく翻訳という手法も提案されて
いる(隅田・飯田/用例主導型機械翻訳、情報処理学会
自然言語処理研究会、82−5(1991))。
【0006】
【発明が解決しようとする課題】しかしながら、前述の
形式の語義選択方式には、「入力部分表現A中の単語表
現aに対応する語義群b1〜bnの中に、付随する制約
条件を部分表現Aが充足する語義が複数存在する場合に
は、その中のいずれが最も適切かを決定できない」「入
力部分表現A中の単語表現aに対応する語義群b1〜b
nに付随する制約条件を部分表現Aがいずれも充足しな
い場合には、解析がその時点で失敗してしまう」という
問題点が存在する。理想的には、単語表現aに対応する
語義群b1〜bnに付随する制約条件がすべて排他的
で、かつその和集合が単語表現aの出現環境をすべてカ
バーしているならば、単語表現aを含むいかなる入力に
対しても必ず唯一の語義が対応するが、実際にはこのよ
うな形での条件の記述は不可能である。
【0007】また、前述の、事例に基づく翻訳手法で
は、表層語彙ごとの対応で入力表現に対する訳語を直接
決定してしまうため、入力表現に対する語義を決定する
ことはできない。また、この手法を実現するためには大
規模な対訳事例データベースが必要だが、この目的に十
分な量の対訳テキストの収集は困難であり、またたとえ
収集できたとしてもこれを自動的に分析して構造的に対
応付ける手段は存在しないし、人手で行うとすると大き
な時間とコストを要するという欠点を持つ。
【0008】以上説明した通り、制約記述による語義選
択方式には「入力部分表現A中の単語表現aに対応する
語義群b1〜bnの中に、付随する制約条件を部分表現
Aが充足する語義が複数存在する場合には、その中のい
ずれが最も適切かを決定できない」「入力部分表現A中
の単語表現aに対応する語義群b1〜bnに付随する制
約条件を部分表現Aがいずれも充足しない場合には、解
析がその時点で失敗してしまう」という問題点が存在す
る。一方事例に基づく翻訳手法には、対訳事例データベ
ースの作成が困難な上に、そのままの形では語義選択へ
の応用は不可能であるという欠点がある。
【0009】本発明の目的は、辞書中の各語義ごとに制
約条件に加えて用例を付記しておくことにより、制約だ
けでは語義が選択できない際の補償機能として事例に基
づく翻訳手法と同様の類似表現検索機能を用いて最も適
切な語義を選択するという、制約記述による語義選択方
式と事例に基づく解析の両者の長所を活かした語義選択
装置を提供することにある。
【0010】
【課題を解決するための手段】第1の発明の語義選択装
置は、各語義ごとに当該語義を選択するための制約条件
と用例を記述した辞書と、表現の集合からある特定の表
現と最も類似した表現を検索する類似表現検索手段と、
入力表現中のある単語表現に対する語義決定の際、前記
辞書中の当該単語表現に一致する見出し語に対する語義
に記述された制約条件を当該入力表現に適用し、付随す
る制約条件を当該入力表現が充足する語義を最も適切な
語義として選択するとともに、付随する制約条件を当該
入力表現が充足する語義が複数存在する場合に、付随す
る制約条件を当該入力表現が充足する語義にそれぞれ記
述された用例から、当該入力表現中の当該単語表現を含
む適当な部分表現と最も類似した用例を前記類似表現検
索手段により検索し、当該用例が記述された語義を最も
適切な語義として選択する語義選択手段と、入力言語表
現を言語解析して部分表現に分解して部分表現の集合を
生成し、前記語義選択手段に送るとともに、前記語義選
択手段から受けとった語義の集合から意味表現を生成
し、出力する自然言語解析手段を備えることを特徴とす
る。
【0011】第2の発明の語義選択装置は、各語義ごと
に当該語義を選択するための制約条件と用例を記述した
辞書と、表現の集合からある特定の表現と最も類似した
表現を検索する類似表現検索手段と、入力表現中のある
単語表現に対する語義決定の際、前記辞書中の当該単語
表現に一致する見出し語に対する語義に記述された制約
条件を当該入力表現に適用し、付随する制約条件を当該
入力表現が充足する語義を最も適切な語義として選択す
るとともに、当該入力表現がいずれの制約条件も充足し
ない場合に、当該見出し語に対する語義にそれぞれ記述
された用例から、当該入力表現中の当該単語表現を含む
適当な部分表現と最も類似した用例を前記類似表現検索
手段により検索し、当該用例が記述された語義を最も適
切な語義として選択する語義選択手段と、入力言語表現
を言語解析して部分表現に分解して部分表現の集合を生
成し、前記語義選択手段に送るとともに、前記語義選択
手段から受けとった語義の集合から意味表現を生成し、
出力する自然言語解析手段を備えることを特徴とする。
【0012】
【作用】本発明の語義選択装置は、自然言語解析手段が
入力表現を受けとり、入力表現を言語解析して部分表現
に分解して部分表現の集合を生成し、語義選択手段に送
る。語義選択手段は辞書を参照し、必要ならば類似表現
検索手段を使用して受けとった部分表現中の単語表現に
対する語義を決定し、自然言語解析手段に送る。自然言
語解析手段は受けとった語義の集合から意味表現を生成
し、出力する。
【0013】辞書には、辞書作成時に各語義ごとに制約
条件に加えて用例を付記しておく。
【0014】類似表現検索手段は、用例の集合から、あ
る特定の部分表現と最も類似した用例を検索する。最も
類似した用例の決定に用いる入力表現−用例間の距離の
計算法には、従来の事例に基づく翻訳手法と同様のシソ
ーラスを用いる方法の他に、各表現の意味を素性と素性
値のペアの集合として記述しておき、値が一致する素性
の数をカウントする方法など、様々なものがある。
【0015】
【実施例】次に、図1から図3を参照して本発明の実施
例について説明する。
【0016】図1は第1及び第2の本発明の一実施例を
示すブロック図、図2は本発明の語義選択装置で用い
る、ある見出し語aに対する辞書の構成を示す図、図3
は動詞「取る」に対する辞書の例を示した図である。
【0017】図1において、自然言語解析手段1は言語
表現を入力11として受けとり、入力表現を言語解析し
て部分表現に分解して部分表現の集合を生成し、語義選
択手段2に送る。
【0018】語義選択手段2は辞書3を参照して、受け
とった部分表現中の単語表現に対する語義を決定する。
【0019】辞書3には、図2に示すように、見出し語
aに対する語義biに対して、制約条件ci1〜cim
i と用例ei1〜eili を記述しておく。用例の数
は、最低限1例あればよい。記述する用例の例を図3に
示す。
【0020】単語表現aを含む部分表現Aが入力された
場合には、語義選択手段2は、見出し語aをキーとして
図2に示した辞書を参照し、従来の技術で述べた制約記
述による語義選択方式と同様に、単語表現aに対応する
語義群b1〜bnに付随する制約条件を部分表現Aに適
用する。部分表現Aが充足する制約条件がci1〜ci
i のみの場合には、語義biを適切な語義として選択
する。
【0021】第1の発明では、単語表現aに対応する語
義群b1〜bnに付随する制約条件の中に、単語表現a
を含む部分表現Aが充足する制約条件が複数存在する場
合に、語義選択手段2は、類似表現検索手段4を使用し
て、その制約条件を伴う語義群に付記された用例の中か
ら、部分表現Aと最も類似した用例を検索し、その用例
ejkが付記された語義bjを最も適切な語義として選
択する。
【0022】第2の発明では、単語表現aに対応する語
義群b1〜bnに付随する制約条件を、単語表現aを含
む部分表現Aがいずれも充足しない場合に、語義選択手
段2は、類似表現検索手段4を使用して、単語表現aに
対応する語義群b1〜bnに付記された用例の中から、
部分表現Aと最も類似した用例を検索し、その用例ej
kが付記された語義bjを最も適切な語義として選択す
る。
【0023】この決定された語義は語義選択手段2から
自然言語解析手段1に送られ、自然言語解析手段1は受
けとった語義の集合から意味表現を生成し、出力12と
する。
【0024】なお、第1の発明と第2の発明は異なった
場合に適用されるものであり、両者は自由に組み合わせ
て用いことができる。また辞書に付記する用例は両発明
に共通して使用できる。
【0025】
【発明の効果】以上説明した通り、本発明によれば、従
来からの制約記述による語義選択方式と事例に基づく解
析の両者の長所を活用する語義選択装置を実現できる。
すなわち、辞書に用例を付記することによって必ずいず
れかの語義が選択されることを保証して、制約記述によ
る語義選択方式の欠点をカバーすることができる。また
事例に基づく翻訳手法の考え方をそのまま語義選択に活
かせるため、「使用した事例との距離という形で翻訳結
果に信頼度を付与することができる」という事例に基づ
く翻訳手法の長所を組み込むことも可能である。
【0026】一方事例に基づく翻訳には「対訳事例デー
タベースの作成が困難」という欠点があったが、本発明
の語義選択装置においては、辞書作成時に用例を少なく
とも1例付記するだけでよいので、この形での辞書の作
成は困難ではない。特に既存の国語辞典・英英辞典等の
辞書を参考にして辞書を作成する場合には、辞書中の用
例をそのまま利用すれば良い。また、ユーザが辞書に新
しい単語もしくは既存の単語に対する新しい語義を登録
する際に用例を少なくとも1例付記することを義務づけ
たとしても、ユーザは具体例を基に登録すると考えられ
るので、ユーザの負担の増加は大きくはない。これに加
えてこの方式は、辞書中に用例が記述されているため、
辞書が人間にも見やすいという効果も持つ。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】本発明で使用する、ある見出し語aに対する辞
書の構成を示した図である。
【図3】本発明で使用する辞書の構成の例を、動詞「取
る」に対する辞書の形で示した図である。
【図4】従来技術の制約記述による語義選択方式で使用
する、ある見出し語aに対する辞書の構成を示した図で
ある。
【図5】従来技術の制約記述による語義選択方式で使用
する辞書の構成の例を、動詞「取る」に対する辞書の形
で示した図である。
【符号の説明】
1 自然言語解析手段 2 語義選択手段 3 辞書 4 類似表現検索手段 11 入力 12 出力
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−219165(JP,A) 特開 昭63−83868(JP,A) 特開 平3−276367(JP,A) 実開 平1−135567(JP,U) 中村直人,「用例検索翻訳支援システ ム」,情報処理学会第38回全国大会講演 論文集(▲I▼),p.357−p.358 (1989) 土井伸一,村木一至,「辞書に事例を 付記することによる訳語選択・意味選択 機能の強化」,情報処理学会第44回全国 大会講演論文集(▲III▼),p. 3.111−p.3.112(1992.2) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 各語義ごとに当該語義を選択するための
    制約条件と用例を記述した辞書と、 表現の集合からある特定の表現と最も類似した表現を検
    索する類似表現検索手段と、 入力表現中のある単語表現に対する語義決定の際、前記
    辞書中の当該単語表現に一致する見出し語に対する語義
    に記述された制約条件を当該入力表現に適用し、付随す
    る制約条件を当該入力表現が充足する語義を最も適切な
    語義として選択するとともに、付随する制約条件を当該
    入力表現が充足する語義が複数存在する場合に、付随す
    る制約条件を当該入力表現が充足する語義にそれぞれ記
    述された用例から、当該入力表現中の当該単語表現を含
    む適当な部分表現と最も類似した用例を前記類似表現検
    索手段により検索し、当該用例が記述された語義を最も
    適切な語義として選択する語義選択手段と、 入力言語表現を言語解析して部分表現に分解して部分表
    現の集合を生成し、前記語義選択手段に送るとともに、
    前記語義選択手段から受けとった語義の集合から意味表
    現を生成し、出力する自然言語解析手段を備えることを
    特徴とする語義選択装置。
  2. 【請求項2】 各語義ごとに当該語義を選択するための
    制約条件と用例を記述した辞書と、 表現の集合からある特定の表現と最も類似した表現を検
    索する類似表現検索手段と、 入力表現中のある単語表現に対する語義決定の際、前記
    辞書中の当該単語表現に一致する見出し語に対する語義
    に記述された制約条件を当該入力表現に適用し、付随す
    る制約条件を当該入力表現が充足する語義を最も適切な
    語義として選択するとともに、当該入力表現がいずれの
    制約条件も充足しない場合に、当該見出し語に対する語
    義にそれぞれ記述された用例から、当該入力表現中の当
    該単語表現を含む適当な部分表現と最も類似した用例を
    前記類似表現検索手段により検索し、当該用例が記述さ
    れた語義を最も適切な語義として選択する語義選択手段
    と、 入力言語表現を言語解析して部分表現に分解して部分表
    現の集合を生成し、前記語義選択手段に送るとともに、
    前記語義選択手段から受けとった語義の集合から意味表
    現を生成し、出力する自然言語解析手段を備えることを
    特徴とする語義選択装置。
JP4003976A 1992-01-13 1992-01-13 語義選択装置 Expired - Lifetime JP2870278B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4003976A JP2870278B2 (ja) 1992-01-13 1992-01-13 語義選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4003976A JP2870278B2 (ja) 1992-01-13 1992-01-13 語義選択装置

Publications (2)

Publication Number Publication Date
JPH05204965A JPH05204965A (ja) 1993-08-13
JP2870278B2 true JP2870278B2 (ja) 1999-03-17

Family

ID=11572090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4003976A Expired - Lifetime JP2870278B2 (ja) 1992-01-13 1992-01-13 語義選択装置

Country Status (1)

Country Link
JP (1) JP2870278B2 (ja)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村直人,「用例検索翻訳支援システム」,情報処理学会第38回全国大会講演論文集(▲I▼),p.357−p.358(1989)
土井伸一,村木一至,「辞書に事例を付記することによる訳語選択・意味選択機能の強化」,情報処理学会第44回全国大会講演論文集(▲III▼),p.3.111−p.3.112(1992.2)

Also Published As

Publication number Publication date
JPH05204965A (ja) 1993-08-13

Similar Documents

Publication Publication Date Title
US7587389B2 (en) Question answering system, data search method, and computer program
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US7124074B2 (en) Method and apparatus for providing improved HMM POS tagger for multi-word entries and factoids
JPS62163173A (ja) 機械翻訳方法
JPH0782498B2 (ja) 機械翻訳システム
Stratica et al. Using semantic templates for a natural language interface to the CINDI virtual library
JP2609173B2 (ja) 用例主導型機械翻訳方法
JP2870279B2 (ja) 訳語選択装置
JP2870278B2 (ja) 語義選択装置
JP2828692B2 (ja) 情報検索装置
Meng et al. Nchiql: The chinese natural language interface to databases
JP5148583B2 (ja) 機械翻訳装置、方法及びプログラム
Amitay et al. Multi-resolution disambiguation of term occurrences
JP2002189754A (ja) 文書検索装置及び文書検索方法
JP3113257B2 (ja) 機械翻訳装置
JP2830097B2 (ja) 文章検索方式
JPS62191967A (ja) 文脈処理装置
Nijholt Linguistic engineering: a survey
JP2939348B2 (ja) 画像処理装置
Narayan et al. Pre-Neural Approaches
JPH0244462A (ja) 自然言語処理装置
JP2749954B2 (ja) 自然言語解析装置
JP3010450B2 (ja) 画像処理装置
JP2901977B2 (ja) 翻訳装置
JP2915113B2 (ja) 自然言語自動翻訳方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981201