JP2994080B2 - 訳語選択方式 - Google Patents

訳語選択方式

Info

Publication number
JP2994080B2
JP2994080B2 JP3135307A JP13530791A JP2994080B2 JP 2994080 B2 JP2994080 B2 JP 2994080B2 JP 3135307 A JP3135307 A JP 3135307A JP 13530791 A JP13530791 A JP 13530791A JP 2994080 B2 JP2994080 B2 JP 2994080B2
Authority
JP
Japan
Prior art keywords
expression
likelihood
bilingual
language
expressions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3135307A
Other languages
English (en)
Other versions
JPH04336379A (ja
Inventor
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3135307A priority Critical patent/JP2994080B2/ja
Publication of JPH04336379A publication Critical patent/JPH04336379A/ja
Application granted granted Critical
Publication of JP2994080B2 publication Critical patent/JP2994080B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳システムにおけ
る訳語選択方式に関し、特にテキスト機能毎に収集格納
する、源言語テキスト内に固有に存在する各表現間の依
存尤度をなるべく保存するように目的言語テキスト内に
固有に存在する各表現間の依存尤度を総体として最大に
するように入力文章中の表現に対応する対訳表現の組み
合わせを選択する方式に関する。
【0002】
【従来の技術】機械翻訳システムにおける訳語選択やカ
ナ漢字変換システムにおける漢字表記の選択において一
つの表現が複数の対訳をもったり、カナ表記が複数の漢
字表記をもつ時、いつも正しい訳語表現や漢字表記を選
んでくれるような方法は提案されていない。例えば、辞
書に訳語を選ぶための選択条件を論理的に記述する方法
は、その記述がその表現の修飾する被修飾表現やその表
現を修飾する修飾表現の持つ論理的特徴を用いて書かれ
るために、たとえ辞書内ではその表現に対する全ての対
訳候補から周りの修飾が分かったときに選択する選択条
件が記述されていても、その表現が修飾もせず、修飾も
されずに孤立して文章中に現れるときは、対訳語を選択
することが不可能である。また、カナ漢字変換における
或るカナ表現に対する漢字表記をシステムが選べないと
き人間に一度は選ばせ、次回全く同じカナ表記が出現す
るときは前回の人間が指定した漢字表記を人間に指示す
るなどの方法は、必ずしも正しい漢字表記を機械が選ぶ
ところまでは到達していない。また、機械翻訳において
は、例えば言語Aで書かれた文章を言語Bへ翻訳して、
言語Aの各文がその対訳文と対応関係を言語的に厳格に
保持しているとき、その対訳テキスト対を大量に収集す
ることにより、言語Aの各文Sai中の各表現Eajか
らそれに対応する対訳表現Ebiを自動抽出してそれを
保存する対訳文脈を条件に訳語を決定する方法が考えら
れるが、まず、この目的に充分な量の厳密に言語的に対
応する対訳テキストを収集することが困難であり、ま
た、たとえ手にいれてもそれを自動的に分析して構造の
対応をかなりの精度で見つける方法がないことと、それ
を人手で行うときには大きな時間とコストがかかるとい
う欠点をもつ。
【0003】
【発明が解決しようとする課題】従来技術では一つの表
現に複数の対訳があり、辞書内の選択記述だけではその
出現に対して最も確からしい訳表現を選べないとか、訳
語を選ぶメカニズムを実現するために言語的に対応する
大量の対訳テキストを収集することが非常に大きなコス
トを要するとかの問題があった。
【0004】本発明の目的は源言語の大量コーパスと目
的言語の大量コーパスとから抽出する表現依存尤度に基
づき、一つの表現に複数の対訳があり、辞書内の選択記
述だけではその出現に対して最も確からしい訳表現を選
べないときにも、その出現に最も確からしい訳語を決定
する訳語選択方式を提供することにある。
【0005】
【0006】
【0007】
【課題を解決するための手段】 本発明は、 源言語の表現
を目的言語の表現翻訳するために、源言語の表現を目
的言語表現写像する表現対訳辞書を用いて翻訳する機
械翻訳システムの訳語選択方式において、前記源言語の
テキスト中に現れる個々の表現間の依存尤度を前もって
実テキストから抽出し、保持する源言語表現制約知識管
理手段と、前記目的言語のテキスト中に現れる個々の表
現間の依存尤度を前もって実テキストから抽出し、保持
する目的言語表現制約知識管理手段と、与えられた源言
語で記述された前記機械翻訳システムへの入力文章中の
単語、句、節、文を含む個々の要素表現を抽出し、抽出
した前記要素表現の各々をキーとして、前記源言語表現
制約知識管理手段を検索して前記入力文章中に含まれる
要素表現対の前記依存尤度を得て、さらに、抽出した前
記要素表現の各々をキーとして前記表現対訳辞書を検索
して各々の要素表現に対する対訳集合を得て、前記目的
言語表現制約知識管理手段を検索することによって、前
記対訳集合間の依存尤度を得るとともに、前記入力文章
中に含まれる要素表現対の前記依存尤度が最大の値を持
つ要素表現対を優先して、この要素表現対に対応する前
記対訳集合の中で、最大の依存尤度を持つ対訳表現を、
前記要素表現対の対訳表現として選択する訳語選択手段
を有することを特徴とする。
【0008】
【0009】
【実施例】図1は、本発明の一実施例の訳語選択方式を
説明する図である。図2は、本発明による訳語選択方式
の機能を説明する図であり、源言語テキストとそれを言
語解析して得られる要素表現に対する対訳辞書と目的言
語テキストとの関係を説明する。
【0010】図1の訳語選択方式は、機械翻訳手段1
と、源言語の表現を目的言語の表現へ翻訳するために源
言語の表現を目的言語表現へ写像する表現対訳辞書手段
4と、源言語のテキスト中に現れる個々の表現間の依存
尤度を前もって実テキストから抽出し、保持する源言語
表現制約知識管理手段3と、目的言語のテキスト中に現
れる個々の表現間の依存尤度を前もって実テキストから
抽出し、保持する目的言語表現制約知識管理手段5と、
与えられた源言語で記述された機械翻訳システムへの入
力文章中の個々の表現を抽出し、表現対訳辞書手段4を
用いて個々の源言語表現に対応する目的言語対訳候補を
抽出し、源言語表現制約知識管理手段3に格納された各
源言語表現間の依存尤度という表現制約に照らして最も
源言語中での各表現間の依存関係の強さを保存しなが
ら、各表現に対する目的言語表現対訳の組み合わせを目
的言語表現制約知識管理手段5内の表現制約を最も良く
満足する各入力文章中の表現に対する目的言語表現対訳
の組み合わせを選択する訳語選択手段2とを備えてい
る。
【0011】この訳語選択方式において、源言語a入力
文章表現を受け取った機械翻訳手段1は、入力文章を言
語解析して要素表現へ分類して要素表現の集合を生成
し、訳語選択手段2へ送る。訳語選択手段2は、たとえ
ば文章「裁判官はコートとネクタイを買った」に対し
て、少なくとも要素表現「裁判官、コート、ネクタイ、
買う」を含む要素表現集合{Ei}の、たとえば「裁判
官、コート、ネクタイ、買う」の各々をキーとして源言
語表現制約知識管理手段3を検索して{Eik|Eiと
Ekの依存尤度}、たとえば{裁判官とコートの依存尤
度、コートとネクタイの依存尤度50、ネクタイと裁判
官の依存尤度10、裁判官と買うの依存尤度5、コート
と買うの依存尤度5、ネクタイと買うの依存尤度5}を
得、要素表現集合{Ei}をキーとして表現対訳辞書手
段4を検索し、各々の要素表現に対する{Eit|Ei
の対訳集合}、たとえば裁判官の対訳集合{judg
e}、コートの対訳集合{coat,court}、ネ
クタイの対訳集合{tie}、買うの対訳集合{bu
y}を得、{Eit}をキーとして目的言語表現制約知
識管理手段5を検索し、{Eit1|{Eit}間の依
存尤度}、たとえば{judgeとcourtの依存尤
度80、tieとcoatの依存尤度50、coatと
judgeの依存尤度10、judgeとtieの依存
尤度10、courtとtieの依存尤度5、・・・}
を得、入力表現に対する{Eik|EiとEkの依存尤
度}の最大の値を持つ要素表現対、この例では、入力表
現に対する{Eik|EiとEkの依存尤度}の最大の
値を持つ要素表現対は「ネクタイとコート」であるの
で、この要素表現対を優先して、その目的言語空間での
{Eit1|{Ejt}間の依存尤度}を最大にするよ
うな{Eit|Eiの対訳集合}、この例では、ネクタ
イの対訳集合{tie}とコートの対訳集合{coa
t,court}間の最大の依存尤度を持つ「tieと
coatの依存尤度50」を入力要素表現ネクタイ
とコートの対訳表現として選択するこの選択を順次
繰り返すことによって対訳表現の選択を行い、選択され
た対訳表現を機械翻訳手段1送る。
【0012】図1における源言語表現制約知識管理手段
3の管理する源言語表現制約、訳語選択手段2の管理す
る対訳辞書、目的言語表現制約知識管理手段5の管理す
る目的言語制約間の関係を図2に示す。源言語表現制約
{C1・・・Cx}、たとえば{裁判官とコートの依存
尤度10、コートとネクタイの依存尤度50、ネクタイ
と裁判官の依存尤度10、裁判官と買うの依存尤度5、
コートと買うの依存尤度5、ネクタイと買うの依存尤度
5、裁判所とコートの依存尤度80、裁判官と裁判所の
依存尤度80・・・}は、源言語要素表現と、互いの依
存尤度を管理し、翻訳しようとする源言語テキストを構
成する要素表現{E1,E2,E3}、たとえば翻訳す
る原言語テキストである入力文章が「裁判官はコートと
ネクタイを買った」であるとき少なくとも{E1=コー
ト、E2=裁判官、E3=ネクタイ}を含む。また、源
言語要素表現は表現対訳辞書手段4内の対訳辞書内容と
して、入力要素表現Eiの各々にたいして対訳{(E
i,Eitj)}、たとえばE1=コートにたいして
{(コート,coat),(コート,court)}が
定義される。{Eitj}は目的言語表現制約の目的言
語要素であり、目的言語テキスト中の要素表現は、源言
語テキスト中の要素表現に対して対訳辞書が定義する目
的言語の要素表現の集合であり、一般に源言語テキスト
中の一つの要素表現が複数の目的言語要素表現を持つこ
とがある。図2において、図中の弧と添付の数字は2つ
の要素表現とその間の依存尤度(例えば調査したテキス
ト中で同時に出現していた回数と解釈してもよい)を示
す。本実施例の訳語選択方式によれば、源言語テキスト
中の要素表現間の、源言語表現制約中で指定された依存
尤度の大きさを保存するように、目的言語表現制約で指
定された依存尤度に基づき目的テキストの要素表現の集
合を選ぶ。E2t1とE3t2の依存尤度は50と大き
く、表現E2t1が訳語として選ばれるときE3t2を
選ぶことが妥当であると考えられるが、源言語制約で
は、E2,E3間の依存尤度は小さく、E1,E3間の
依存尤度が大きいので、その関係を保存するように{E
1ti}と{E3ti}間の最大の依存尤度40をもつ
対訳のペア(E1t2,E3t1)を選ぶ。図中のEx
とその対訳E3t2は源言語表現制約は登録されている
が現に翻訳しようとする入力テキスト中の要素表現では
ない。しかし、その対訳E3t2は目的言語テキストの
要素表現で有り得る。つまり、訳語を選択する尤度の計
算は、目的言語テキスト(訳語の空間)間に成立する依
存尤度と源言語テキスト間に成立する依存尤度を同時に
考慮する必要がある。
【0013】
【0014】
【発明の効果】本発明は例えば、従来訳語選択に有用で
あると考えられる辞書内に訳語選択条件記述を行う手法
と容易に組み合わせることができるだけでなく、組み合
わせることによってより簡単に訳語選択が高機能に実現
できたり、よりもっともらしい訳語選択を常に行わせる
ことができるという効果を持つ。
【0015】したがって、訳語選択のための訳語選択の
条件記述として明示的な記号化が困難な分野依存性、自
然な言い回しを作る表現統一性、修飾・被修飾構造の上
の条件記述方式における孤立表現に対する訳語選択など
が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例を説明図である。
【図2】源言語表現制約知識管理手段3内の知識と、表
現対訳辞書手段4内の対訳辞書と、目的言語表現制約知
識管理手段5内の知識との関係を説明する図である。
【符号の説明】
1 機械翻訳手段 2 訳語選択手段 3 源言語表現制約知識管理手段 4 表現対訳辞書手段 5 目的言語表現制約知識管理手段

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 源言語の表現を目的言語の表現翻訳す
    るために、源言語の表現を目的言語表現写像する表現
    対訳辞書を用いて翻訳する機械翻訳システムの訳語選択
    方式において、 前記源言語のテキスト中に現れる個々
    の表現間の依存尤度を前もって実テキストから抽出し、
    保持する源言語表現制約知識管理手段と、 前記目的言
    語のテキスト中に現れる個々の表現間の依存尤度を前も
    って実テキストから抽出し、保持する目的言語表現制約
    知識管理手段と、 与えられた源言語で記述された前記機械翻訳システムへ
    の入力文章中の単語、句、節、文を含む個々の要素表現
    を抽出し、抽出した前記要素表現の各々をキーとして、
    前記源言語表現制約知識管理手段を検索して前記入力文
    章中に含まれる要素表現対の前記依存尤度を得て、さら
    に、抽出した前記要素表現の各々をキーとして前記表現
    対訳辞書を検索して各々の要素表現に対する対訳集合を
    得て、前記目的言語表現制約知識管理手段を検索するこ
    とによって、前記対訳集合間の依存尤度を得るととも
    に、前記入力文章中に含まれる要素表現対の前記依存尤
    度が最大の値を持つ要素表現対を優先して、この要素表
    現対に対応する前記対訳集合の中で、最大の依存尤度を
    持つ対訳表現を、前記要素表現対の対訳表現として選択
    する訳語選択手段と を有することを特徴とする訳語選択方式。
JP3135307A 1991-05-13 1991-05-13 訳語選択方式 Expired - Fee Related JP2994080B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3135307A JP2994080B2 (ja) 1991-05-13 1991-05-13 訳語選択方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3135307A JP2994080B2 (ja) 1991-05-13 1991-05-13 訳語選択方式

Publications (2)

Publication Number Publication Date
JPH04336379A JPH04336379A (ja) 1992-11-24
JP2994080B2 true JP2994080B2 (ja) 1999-12-27

Family

ID=15148665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3135307A Expired - Fee Related JP2994080B2 (ja) 1991-05-13 1991-05-13 訳語選択方式

Country Status (1)

Country Link
JP (1) JP2994080B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128397A (ja) * 1995-11-06 1997-05-16 Sharp Corp 通訳機

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「1991年度人工知能学会全国大会(第5回)論文集」p.479〜482

Also Published As

Publication number Publication date
JPH04336379A (ja) 1992-11-24

Similar Documents

Publication Publication Date Title
US5109509A (en) System for processing natural language including identifying grammatical rule and semantic concept of an undefined word
Moussallem et al. Machine translation using semantic web technologies: A survey
US5895446A (en) Pattern-based translation method and system
JP4504555B2 (ja) 翻訳支援システム
KR100453227B1 (ko) 번역 지원 시스템에서의 유사 문장 검색 방법
JPH02308370A (ja) 機械翻訳システム
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2006268375A (ja) 翻訳メモリシステム
JPH03185561A (ja) 欧文単語入力方法
EP1525539A2 (en) Machine translation
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH10312382A (ja) 類似用例翻訳システム
JPS58192173A (ja) 機械翻訳装置
JP2994080B2 (ja) 訳語選択方式
JP2828692B2 (ja) 情報検索装置
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
Rana et al. Example based machine translation using fuzzy logic from English to Hindi
JP4007630B2 (ja) 対訳例文登録装置
Phodong et al. Improving Thai-English word alignment for interrogative sentences in SMT by grammatical knowledge
JPS63228326A (ja) キ−ワ−ド自動抽出方式
Picchi et al. A translator’s workstation
KR100474824B1 (ko) 연어정보를이용한원시언어의목적언어로의언어번역장치및방법
JPH0561902A (ja) 機械翻訳システム
JPH08329059A (ja) 汎用参照装置
CA2471256A1 (en) Multilingual database creation system and method

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19971014

LAPS Cancellation because of no payment of annual fees