JP3236027B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3236027B2
JP3236027B2 JP00323391A JP323391A JP3236027B2 JP 3236027 B2 JP3236027 B2 JP 3236027B2 JP 00323391 A JP00323391 A JP 00323391A JP 323391 A JP323391 A JP 323391A JP 3236027 B2 JP3236027 B2 JP 3236027B2
Authority
JP
Japan
Prior art keywords
translation
word
words
sentence
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00323391A
Other languages
English (en)
Other versions
JPH04313158A (ja
Inventor
正樹 松平
由紀雄 山本
仁 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP00323391A priority Critical patent/JP3236027B2/ja
Publication of JPH04313158A publication Critical patent/JPH04313158A/ja
Application granted granted Critical
Publication of JP3236027B2 publication Critical patent/JP3236027B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、ある言語の文章(原
言語文章)を異なる言語の文章(目的言語文章)に翻訳
する機械翻訳装置に関する。
【0002】
【従来の技術】近年、日本語を英語に、あるいは英語を
日本語に翻訳する機械翻訳装置が商品化されているが、
訳語に不自然な表現が多く、実用的な翻訳に達している
とは言えない状況である。
【0003】不自然な表現を自然な訳語に翻訳するため
には原言語の複数の単語のまとまりを目的の言語で自然
な訳語に翻訳することが重要な対策の一つである。
【0004】例えば“recent years”とい
う英文は一般に用意されている単語辞書の訳語をそのま
ま組み合わせて訳す(これを直訳と呼ぶ)と「近ごろの
年」と訳せ、意味は通じるがもっと自然な訳語、例えば
「近年」というように翻訳することが慣用的である。こ
のような修飾関係を有する単語のまとまり(ここでは
「慣用的表現」と呼ぶことにする)は、直訳すると意味
が通じなくなる一般的なイディオムとは性格が異なる
が、従来の機械翻訳装置ではこのような区別はなく一般
的なイデオムとして対訳のイディオム辞書を構築して
いた。
【0005】
【発明が解決しようとする課題】このように従来は慣用
的表現も一般的イディオムも区別なくイディオム辞書と
して作成していたために、この対訳のイディオム辞書を
構築するために、原言語及び目的の言語の両方の知識が
ある者が膨大な手数と時間を費やさなければ慣用的表現
を使用した翻訳が十分に実現できなかった。
【0006】この発明は、以上の課題に鑑み為されたも
のであり、その目的とするところは、簡単な構成で、文
章中に修飾関係を有する場合に慣用的表現を含む目的言
語文章翻訳する機械翻訳装置を提供することである。
【0007】
【課題を解決するための手段】この発明は、以上の目的
を達成するために、一般的なイディオム辞書とは別に慣
用的表現辞書を用いて慣用的表現文章への変換方法を改
良した。
【0008】すなわち、機会翻訳装置、修飾関係を有
する複数の単語のまとまりを慣用表現とし、訳語として
出力を所望する慣用的表現を目的言語で記述した慣用的
表現辞書を格納する記憶手段と、入力された原言語文章
中の複数の単語間の修飾関係が存在するかを判断して、
原言語の複数の単語間に修飾関係がある場合に、修飾関
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補をそれぞれ組
合せて、複数の組合せ訳語候補を作成し、該複数の組合
せ訳語候補を用いて、前記慣用的表現辞書を検索し、該
複数の組合せ訳語候補について慣用的表現がある場合に
はそれを訳語として用いて、所望の慣用的表現を含む目
的言語文章を得る慣用的表現変換手段とを備えることを
特徴とする。
【0009】また上記複数の組合せ訳語候補は、修飾関
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補の各々を構成
する文字列の全部を用いて又は一部を抽出して、この全
部文字列又は一部文字列をそれぞれ組合せることによっ
て作成したものとすることが適当である。
【0010】
【作用】この発明によれば、入力された原言語文章中の
複数の単語間の修飾関係が存在するかを判断して、原言
語の複数の単語間に修飾関係がある場合に、修飾関係に
あり少なくとも1つの単語が複数の訳語候補を有する原
言語の複数の単語に対応する訳語候補をそれぞれ組合せ
て、複数の組合せ訳語候補を作成すると、当該複数の組
合せ訳語候補を用いて、慣用的表現辞書を検索し、当該
複数の組合せ訳語候補について慣用的表現がある場合に
は、その慣用的表現を訳語として用いることで、自然な
目的言語文章翻訳することができる。
【0011】また上記複数の組合せ訳語候補は、修飾関
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補の各々を構成
する文字列の全部を用いて又は一部を抽出して、この全
部文字列又は一部文字列をそれぞれ組合せることによっ
て作成したものであるので、きめ細かく慣用的表現への
翻訳ができる。
【0012】また一般のイディオム辞書とは別に慣用的
表現の辞書を用いているので、従来に比べ辞書構築が容
易になる。
【0013】
【実施例】次にこの発明に係る機械翻訳装置の好適な実
施例を図面を用いて説明する。
【0014】図1は機械翻訳装置の機能ブロック図であ
る。機械翻訳装置は一般にコンピュータシステムなどの
ワークステーションにおけるハードウエア構成と以下に
示す機械翻訳装置特有の構成要素で実現することができ
る。
【0015】図1において機械翻訳装置特有の構成は、
原文入力部1と、慣用的表現変換部分3を有する翻訳実
行部2と、単語辞書5と、慣用的表現辞書6と、訳文出
力部4である。原文入力部1はデータ入力手段である例
えばキーボード、OCR(Optical Chara
cter Reader)などから読み込んだ文章を保
持して、この文章を翻訳実行部2に供給する。また音声
入力で原文を入力する場合には、原文入力部1に音声/
文字変換部(図示省略)を付加して原文を入力しても良
い。
【0016】翻訳実行部2は、原文入力部1から供給さ
れた文章に対して文法規則や、辞書5を用いて訳文を生
成し、この訳文を慣用的表現変換部分3に供給する。
【0017】単語辞書5は、図3に例を示すように各単
語について原言語の情報及び目的の言語の情報を記述し
たものであり、英語見出し、英語品詞、標準訳語、訳語
候補から構成される。
【0018】慣用的表現変換部分3は、慣用的表現辞書
6を用いて原文の中に慣用的表現に修正すべき単語列が
あるかどうかを判断し、修正すべき訳語があれば訳語を
変更する。このようにして訳語を自然な訳語に変更して
この訳文を訳文出力部4に供給する。慣用的表現辞書6
は、図4に例を示すように目的の言語での慣用的表現の
見出しを記述したものである。
【0019】訳文出力部4は、翻訳実行部2の慣用的表
変換部分3から供給された、訳文を例えば表示部に
給し、訳文を表示したりする。
【0020】以上が各構成部の機能である。ここで処理
の流れを図2の動作フローチャートを用いて詳述する。
英文の例文として“Recent years, ma
chine translation・・・.”の“R
ecent years”が「近年」と翻訳される過程
を説明する。このとき単語辞書5は図3のように記述さ
れており、慣用的表現辞書6は図4のように記述されて
いるものとする。
【0021】最初に原文入力部1は、入力された文章
“Recent years, machine tr
anslation・・・.“を翻訳実行部2に供給す
る(ステップ10)。
【0022】翻訳実行部2は、慣用的表現変換部分3に
おける処理までに、単語辞書5を用いて翻訳する(ステ
ップ20)。つまり“Recent”に対して「近ごろ
の」と訳し、“years”に対して「年」と訳し、
“machine”に対して「機械」と訳し、“tra
nslation”に対して「翻訳」と訳す。このよう
にして「近ごろの年、機械翻訳・・・.」というように
訳文を構成する。このときに翻訳実行部2における慣用
的表現変換処理前の内部状態(英語見出し、英語品詞、
訳語、訳語候補の状態)は図5に示すような状態にされ
ている。
【0023】次に慣用的表現変換部分3は、慣用的表現
辞書6を用いて慣用的表現変換処理を行う(ステップ3
0)。この慣用的表現変換処理は以下に示すステップ
300〜310に示す処理を行う。最初に単語ポインタ
(変換処理する単語群の先頭を示すポンタ)を先頭の単
語“Recent”にセットし、変換処理単語数を2に
セットする。すなわち“recent”及び“year
s”に対して慣用的表現変化処理を行う(ステップ30
0)。
【0024】次に“recent”と“years”の
修飾関係を確認し、修飾関係があれば以下の処理を行
う。しかしながら修飾関係がない場合にはステップ30
8に進む(ステップ301)。
【0025】“recent”と“years”の訳語
の候補を組み合わせると、6種類の文字列が作成される
(ステップ302)。すなわち「近ごろの年」、「近ご
ろの年代」、「近ごろの時代」、「最近の年」、「最近
の年代」、「最近の時代」が作成される。
【0026】次に作成された文字列に対して慣用的表現
辞書6を用いて検索し(ステップ303)、同じ文字列
があればその文字列に訳語を変更し、それぞれの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
【0027】しかしながら前記ステップ303において
慣用的表現辞書6において同じ文字列が無いと判断され
た場合には、それぞれの訳語の候補の文字列から助詞を
削除し、更に動詞及び形容詞などの語尾変化を除く。こ
のとき処理単語の最後の単語はそのままにする。このよ
うにして語尾変化を除いた組み合わせで再び文字列を作
成する(ステップ304)。すなわち「近ごろ年」、
「近ごろ年代」、「近ごろ時代」、「最近年」、「最近
年代」、「最近時代」が作成される。
【0028】次に前記ステップ303と同じ様に、前記
ステップ304において作成された文字列に対して慣用
的表現辞書6を用いて検索し(ステップ305)、同じ
文字列があれば訳語を変更し、それぞれの残りの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
【0029】しかしながら前記ステップ305において
慣用表現辞書6において、同じ文字列が無いと判断され
た場合には、それぞれの訳語の先頭文字(処理単語の最
後の単語は語尾変化部分を残して)を組み合わせて、文
字列を作成する(ステップ306)。この場合には、重
複する文字列があるので、4種類の文字列が作成され
る。すなわち「近年」、「近時」、「最年」、「最時」
が作成される。
【0030】次に再び前記ステップ305と同じ様に、
前記ステップ306において作成された文字列に対して
慣用的表現辞書6を用いて検索し(ステップ307)、
同じ文字列があれば訳語を変更する。この場合には「近
年」という文字列が慣用的表現辞書6にあるので、“r
ecent”の訳語を「近」に変更し、“years”
の訳語を「年」に変更し、それぞれ残りの訳語の候補を
すべて削除する。その後に処理単語数を1だけ増加し、
すなわち2から3に変更し(ステップ309)、前記ス
テップ301に戻り、前記処理を繰り返す。この時に訳
語を変更した後の慣用的表現変換部分3の内部状態(英
語見出し、英語品詞、訳語、訳語候補の状態)は図6に
示すようにされている。
【0031】次にステップ301において、“rece
nt”と“years”と“,”の3語について修飾関
係を確認する。この場合には3語には修飾関係が無いと
判断され、ステップ308に進む。
【0032】また前記ステップ307において、慣用的
表現辞書6に同じ文字列が無い場合にも、ステップ30
8に進み、単語ポインタを次の単語に進め、処理単語数
を2にする。すなわち単語ポインタを“recent”
から“years”に移す。次に処理単語が文章中の最
後の単語であるか否かを確認する(ステップ310)。
最後であると確認されればステップ40に進み、訳文の
出力を行う。しかしながら現在は処理単語は、“yea
rs”と“,”に設定され、慣用的表現変換途中である
ので、最後とは確認されず再びステップ301戻り修
飾関係を確認する。この2つの単語間には修飾関係はな
いのでステップ308に進み、単語ポインタを進め、単
語ポインタの位置を“,”とし、処理単語数を2にし
て、処理単語を“,”と“machine”にする。こ
の後ステップ310においてこの変換はまだ最後ではな
いと判断され、再びステップ301に戻り修飾関係を確
認する。この単語間には修飾関係がないと判断され、ス
テップ308に進み単語ポインタを進め、単語ポインタ
の位置を“machine”とし、処理単語数を2にし
て、処理単語を“machine”と“transla
tion”にする。この後ステップ310においてこの
変換はまだ最後ではないと判断され、再びステップ30
1に戻り修飾関係を確認する。この単語間には修飾関係
があるが、ステップ302〜307において作成された
文字列に対して慣用的表現辞書6に同じ文字列が無いと
判断され、ステップ308に進み単語ポインタを進め、
単語ポインタの位置を“translation”と
し、処理単語数を2にして、処理単語を“transl
ation”と“・”にしてステップ301〜310を
繰り返す。そして“.”の前の単語まで前記処理が完了
すると文末と判断され、慣用的表現変換処理の終了と判
断しステップ40に進む。
【0033】以上のようにして単語間の修飾関係を確認
した。この英文においては修飾関係は、“recen
t”と“years”とにあった。このようにしてステ
ップ40において「近年、機械翻訳・・・。」という訳
文が、慣用的表現変換部分3から訳文出力部4に供給さ
れる。訳文出力部4はこの訳文を出力して表示させたり
記録させたりする。
【0034】以上の実施例によって、英文の単語間の修
飾関係を確認し、修飾関係があると判断された場合に、
個々の英単語に対応する訳語の組み合わせによる、慣用
的表現への変換、更に訳語の組み合わせ文字列から助詞
を削除し、更に動詞及び形容詞などの語尾変化部分を取
り除いて残った語の文字列を作成して、慣用的表現辞書
に該当する単語があればその単語を訳語に変更している
ので、慣用的表現辞書に適切な単語が登録されることに
よって、より自然な訳文を得ることができる。
【0035】以上の実施例においては、英文から日本文
への翻訳を例に挙げて説明したが、他の言語間の翻訳で
あっても適用できる。
【0036】
【発明の効果】以上述べたようにこの発明によれば、慣
用的表現を含む目的言語文章翻訳することができる。
【0037】また組合せ訳語候補を、修飾関係にあり少
なくとも1つの単語が複数の訳語候補を有する原言語の
複数の単語に対応する訳語候補の各々を構成する文字列
の全部を用いて又は一部を抽出して、この全部文字列又
は一部文字列をそれぞれ組合せることによって作成した
場合には、きめ細かく慣用的表現への翻訳ができる。
【0038】したがって辞書構築の時間、コストが低減
され、慣用的な表現で翻訳文章を得ることができるので
翻訳品質を向上させることができる。
【図面の簡単な説明】
【図1】この発明に係る機械翻訳装置の一実施例を示す
機能ブロック図である。
【図2】図1に示す機械翻訳装置の動作フローチャート
である。
【図3】図1に示す単語辞書の例を示す図である。
【図4】図1に示す慣用的表現辞書の例を示す図であ
る。
【図5】図1に示す慣用的表現変換処理前の内部状態図
である。
【図6】図1に示す慣用的表現変換処理後の内部状態図
である。
【符号の説明】
1…原文入力部、2…翻訳実行部、3…慣用的表現変換
部分、4…訳文出力部、5…単語辞書、6…慣用的表現
辞書。
フロントページの続き (56)参考文献 特開 平2−302874(JP,A) 特開 平1−94473(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/27 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 修飾関係を有する複数の単語のまとまり
    を慣用表現とし、訳語として出力を所望する慣用的表現
    を目的言語で記述した慣用的表現辞書を格納する記憶手
    段と、 入力された原言語文章中の複数の単語間の修飾関係が存
    在するかを判断して、原言語の複数の単語間に修飾関係
    がある場合に、修飾関係にあり少なくとも1つの単語が
    複数の訳語候補を有する原言語の複数の単語に対応する
    訳語候補をそれぞれ組合せて、複数の組合せ訳語候補を
    作成し、該複数の組合せ訳語候補を用いて、前記慣用的
    表現辞書を検索し、該複数の組合せ訳語候補について慣
    用的表現がある場合にはそれを訳語として用いて、所望
    の慣用的表現を含む目的言語文章を得る慣用的表現変換
    手段とを有することを特徴とする機械翻訳装置。
  2. 【請求項2】 上記複数の組合せ訳語候補は、修飾関係
    にあり少なくとも1つの単語が複数の訳語候補を有する
    原言語の複数の単語に対応する訳語候補の各々を構成す
    る文字列の全部を用いて又は一部を抽出して、この全部
    文字列又は一部文字列をそれぞれ組合せることによって
    作成したものであることを特徴とする請求項1に記載の
    機械翻訳装置。
JP00323391A 1991-01-16 1991-01-16 機械翻訳装置 Expired - Fee Related JP3236027B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00323391A JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00323391A JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH04313158A JPH04313158A (ja) 1992-11-05
JP3236027B2 true JP3236027B2 (ja) 2001-12-04

Family

ID=11551732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00323391A Expired - Fee Related JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3236027B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms
US10109145B2 (en) * 2008-12-31 2018-10-23 Johnson & Johnson Vision Care, Inc. Apparatus and method for distributing ophthalmic lenses

Also Published As

Publication number Publication date
JPH04313158A (ja) 1992-11-05

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US7319949B2 (en) Unilingual translator
US7487082B2 (en) Apparatus for developing a transfer dictionary used in transfer-based machine translation system
EP1306775A1 (en) Machine translation
JPS62163173A (ja) 機械翻訳方法
JPH02308370A (ja) 機械翻訳システム
JPH10312382A (ja) 類似用例翻訳システム
JPH0351022B2 (ja)
JP3236027B2 (ja) 機械翻訳装置
JPS59140582A (ja) 自然言語翻訳援助方式
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP2002132764A (ja) 機械翻訳前処理装置
JP4087829B2 (ja) 結合価辞書拡張装置、方法、およびプログラム
JP2928246B2 (ja) 翻訳支援装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2001337945A (ja) 自動編集装置及び方法並びにこれに利用される記憶媒体
JP3267168B2 (ja) 自然言語変換システム
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2752025B2 (ja) 機械翻訳装置
JPS6337472A (ja) 冠詞設定方式
JPS6389975A (ja) 言語解析装置
Segal Machine translation of natural languages: the TOVNA MTS solution
EP1306773A1 (en) Machine translation

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070928

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees