JPH04313158A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH04313158A
JPH04313158A JP3003233A JP323391A JPH04313158A JP H04313158 A JPH04313158 A JP H04313158A JP 3003233 A JP3003233 A JP 3003233A JP 323391 A JP323391 A JP 323391A JP H04313158 A JPH04313158 A JP H04313158A
Authority
JP
Japan
Prior art keywords
word
idiomatic
translation
dictionary
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3003233A
Other languages
English (en)
Other versions
JP3236027B2 (ja
Inventor
Masaki Matsudaira
正樹 松平
Yukio Yamamoto
由紀雄 山本
Hitoshi Sakamoto
仁 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP00323391A priority Critical patent/JP3236027B2/ja
Publication of JPH04313158A publication Critical patent/JPH04313158A/ja
Application granted granted Critical
Publication of JP3236027B2 publication Critical patent/JP3236027B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、ある言語の文章(原
言語文章)を異なる言語の文章(目的言語文章)に翻訳
する機械翻訳装置に関する。
【0002】
【従来の技術】近年、日本語を英語に、あるいは英語を
日本語に翻訳する機械翻訳装置が商品化されているが、
訳語に不自然な表現が多く、実用的な翻訳に達している
とは言えない状況である。
【0003】不自然な表現を自然な訳語に翻訳するため
には原言語の複数の単語のまとまりを目的の言語で自然
な訳語に翻訳することが重要な対策の一つである。
【0004】例えば“recent  years”と
いう英文は一般に用意されている単語辞書の訳語をその
まま組み合わせて訳す(これを直訳と呼ぶ)と「近ごろ
の年」と訳せ、意味は通じるがもっと自然な訳語、例え
ば「近年」というように翻訳することが慣用的である。 このような修飾関係を有する単語のまとまり(ここでは
「慣用的表現」と呼ぶことにする)は、直訳すると意味
が通じなくなる一般的なイディオムとは性格が異なるが
、従来の機械翻訳装置ではこのような区別はなく一般的
なイデオムとして対訳のイディオム辞書を構築していた
【0005】
【発明が解決しようとする課題】このように従来は慣用
的表現も一般的イディオムも区別なくイディオム辞書と
して作成していたために、この対訳のイディオム辞書を
構築するために、原言語及び目的の言語の両方の知識が
ある者が膨大な手数と時間を費やさなければ慣用的表現
を使用した翻訳が十分に実現できなかった。
【0006】この発明は、以上の課題に鑑み為されたも
のであり、その目的とするところは、簡単な構成で、文
章中に修飾関係を有する場合に慣用的表現を含む目的言
語文章で翻訳する機械翻訳装置を提供することである。
【0007】
【課題を解決するための手段】この発明は、以上の目的
を達成するために、一般的なイディオム辞書とは別に慣
用的表現辞書を用いて慣用的表現文章への変換方法を改
良した。
【0008】つまり入力された原言語文章を他の目的言
語文章に翻訳する場合に、目的言語で記述され、修飾関
係を有する複数の単語のまとまりを慣用表現として、複
数の慣用的表現を格納した慣用的表現辞書を有し、原言
語文章中の単語間の修飾関係を確認して、修飾関係によ
って慣用的表現辞書を用いて目的言語文章に翻訳する機
械翻訳装置において、原言語単語間に修飾関係がある場
合に、修飾関係にある原言語の各単語に対応する訳語候
補の組み合わせ情報(例えば、組み合わせ文字列)に基
づいて、前記慣用的表現辞書を検索し、上記修飾関係に
ある単語群についての慣用的表現がある場合にはそれを
訳語として用いて、所望の慣用的表現を含む目的言語文
章を得ることを特徴とする。
【0009】また上記組み合わせ情報に、修飾関係にあ
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含むこ
とが適当である。
【0010】
【作用】この発明によれば、原言語単語間に修飾関係が
ある場合に、修飾関係にある原言語の各単語に対応する
訳語候補の組み合わせ情報(例えば、組み合わせ文字列
)に基づいて、前記慣用的表現辞書を検索しているので
、慣用的表現で目的言語文章を翻訳することができる。
【0011】また上記組み合わせ情報に、修飾関係にあ
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含んで
、前記慣用的表現辞書を検索しているので、決め細かく
慣用的表現への翻訳ができる。
【0012】また一般のイディオム辞書とは別に慣用的
表現の辞書を用いているので、従来に比べ辞書構築が容
易になる。
【0013】
【実施例】次にこの発明に係る機械翻訳装置の好適な実
施例を図面を用いて説明する。
【0014】図1は機械翻訳装置の機能ブロック図であ
る。機械翻訳装置は一般にコンピュータシステムなどの
ワークステーションにおけるハードウエア構成と以下に
示す機械翻訳装置特有の構成要素で実現することができ
る。
【0015】図1において機械翻訳装置特有の構成は、
原文入力部1と、慣用的表現変換部分3を有する翻訳実
行部2と、単語辞書5と、慣用的表現辞書6と、訳文出
力部4である。原文入力部1はデータ入力手段である例
えばキーボード、OCR(Optical  Char
acter  Reader)などから読み込んだ文章
を保持して、この文章を翻訳実行部2に供給する。また
音声入力で原文を入力する場合には、原文入力部1に音
声/文字変換部(図示省略)を付加して原文を入力して
も良い。
【0016】翻訳実行部2は、原文入力部1から供給さ
れた文章に対して文法規則や、辞書5を用いて訳文を生
成し、この訳文を慣用的表現変換部分3に供給する。
【0017】単語辞書5は、図3に例を示すように各単
語について原言語の情報及び目的の言語の情報を記述し
たものであり、英語見出し、英語品詞、標準訳語、訳語
候補から構成される。
【0018】慣用的表現変換部分3は、慣用的表現辞書
6を用いて原文の中に慣用的表現に修正すべき単語列が
あるかどうかを判断し、修正すべき訳語があれば訳語を
変更する。このようにして訳語を自然な訳語に変更して
この訳文を訳文出力部4に供給する。慣用的表現辞書6
は、図4に例を示すように目的の言語での慣用的表現の
見出しを記述したものである。
【0019】訳文出力部4は、翻訳実行部2の慣用的表
現実行部分3から供給された、訳文を例えば表示部7に
供給し、訳文を表示したりする。
【0020】以上が各構成部の機能である。ここで処理
の流れを図2の動作フローチャートを用いて詳述する。 英文の例文として“Recent  years,ma
chine  translation・・・.”の“
Recent  years”が「近年」と翻訳される
過程を説明する。このとき単語辞書5は図3のように記
述されており、慣用的表現辞書6は図4のように記述さ
れているものとする。
【0021】最初に原文入力部1は、入力された文章“
Recent  years,machine  tr
anslation・・・.“を翻訳実行部2に供給す
る(ステップ10)。
【0022】翻訳実行部2は、慣用的表現変換部分3に
おける処理までに、単語辞書5を用いて翻訳する(ステ
ップ20)。つまり“Recent”に対して「近ごろ
の」と訳し、“years”に対して「年」と訳し、“
machine”に対して「機械」と訳し、“tran
slation”に対して「翻訳」と訳す。このように
して「近ごろの年、機械翻訳・・・.」というように訳
文を構成する。このときに翻訳実行部2における慣用的
表現変換処理前の内部状態(英語見出し、英語品詞、訳
語、訳語候補の状態)は図5に示すような状態にされて
いる。
【0023】次に慣用的表現変換部分3は、慣用的表現
辞書6を用いて慣用的表現変換処理を行う(ステップ3
0)。この慣用的表現変換処理は以下に示すステップ3
00〜310に示す処理を行う。最初に単語ポインタ(
変換処理する単語群の先頭を示すポンタ)を先頭の単語
“Recent”にセットし、変換処理単語数を2にセ
ットする。すなわち“recent”及び“years
”に対して慣用的表現変化処理を行う(ステップ300
)。
【0024】次に“recent”と“years”の
修飾関係を確認し、修飾関係があれば以下の処理を行う
。しかしながら修飾関係がない場合にはステップ308
に進む(ステップ301)。
【0025】“recent”と“years”の訳語
の候補を組み合わせると、6種類の文字列が作成される
(ステップ302)。すなわち「近ごろの年」、「近ご
ろの年代」、「近ごろの時代」、「最近の年」、「最近
の年代」、「最近の時代」が作成される。
【0026】次に作成された文字列に対して慣用的表現
辞書6を用いて検索し(ステップ303)、同じ文字列
があればその文字列に訳語を変更し、それぞれの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
【0027】しかしながら前記ステップ303において
慣用的表現辞書6において同じ文字列が無いと判断され
た場合には、それぞれの訳語の候補の文字列から助詞を
削除し、更に動詞及び形容詞などの語尾変化を除く。こ
のとき処理単語の最後の単語はそのままにする。このよ
うにして語尾変化を除いた組み合わせで再び文字列を作
成する(ステップ304)。すなわち「近ごろ年」、「
近ごろ年代」、「近ごろ時代」、「最近年」、「最近年
代」、「最近時代」が作成される。
【0028】次に前記ステップ303と同じ様に、前記
ステップ304において作成された文字列に対して慣用
的表現辞書6を用いて検索し(ステップ305)、同じ
文字列があれば訳語を変更し、それぞれの残りの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
【0029】しかしながら前記ステップ305において
慣用表現辞書6において、同じ文字列が無いと判断され
た場合には、それぞれの訳語の先頭文字(処理単語の最
後の単語は語尾変化部分を残して)を組み合わせて、文
字列を作成する(ステップ306)。この場合には、重
複する文字列があるので、4種類の文字列が作成される
。すなわち「近年」、「近時」、「最年」、「最時」が
作成される。
【0030】次に再び前記ステップ305と同じ様に、
前記ステップ306において作成された文字列に対して
慣用的表現辞書6を用いて検索し(ステップ307)、
同じ文字列があれば訳語を変更する。この場合には「近
年」という文字列が慣用的表現辞書6にあるので、“r
ecent”の訳語を「近」に変更し、“years”
の訳語を「年」に変更し、それぞれ残りの訳語の候補を
すべて削除する。その後に処理単語数を1だけ増加し、
すなわち2から3に変更し(ステップ309)、前記ス
テップ301に戻り、前記処理を繰り返す。この時に訳
語を変更した後の慣用的表現変換部分3の内部状態(英
語見出し、英語品詞、訳語、訳語候補の状態)は図6に
示すようにされている。
【0031】次にステップ301において、“rece
nt”と“years”と“,”の3語について修飾関
係を確認する。この場合には3語には修飾関係が無いと
判断され、ステップ308に進む。
【0032】また前記ステップ307において、慣用的
表現辞書6に同じ文字列が無い場合にも、ステップ30
8に進み、単語ポインタを次の単語に進め、処理単語数
を2にする。すなわち単語ポインタを“recent”
から“years”に移す。次に処理単語が文章中の最
後の単語であるか否かを確認する(ステップ310)。 最後であると確認されればステップ40に進み、訳文の
出力を行う。しかしながら現在は処理単語は、“yea
rs”と“,”に設定され、慣用的表現変換途中である
ので、最後とは確認されず再びステップ301戻り修飾
関係を確認する。この2つの単語間には修飾関係はない
のでステップ308に進み、単語ポインタを進め、単語
ポインタの位置を“,”とし、処理単語数を2にして、
処理単語を“,”と“machine”にする。この後
ステップ310においてこの変換はまだ最後ではないと
判断され、再びステップ301に戻り修飾関係を確認す
る。この単語間には修飾関係がないと判断され、ステッ
プ308に進み単語ポインタを進め、単語ポインタの位
置を“machine”とし、処理単語数を2にして、
処理単語を“machine”と“translati
on”にする。この後ステップ310においてこの変換
はまだ最後ではないと判断され、再びステップ301に
戻り修飾関係を確認する。この単語間にも修飾関係がな
いと判断され、ステップ308に進み単語ポインタを進
め、単語ポインタの位置を“translation”
とし、処理単語数を2にして、処理単語を“trans
lation”と“・”にしてステップ301〜310
を繰り返す。そして“.”の前の単語まで前記処理が完
了すると文末と判断され、慣用的表現変換処理の終了と
判断しステップ40に進む。
【0033】以上のようにして単語間の修飾関係を確認
した。この英文においては修飾関係は、“recent
”と“years”の間にあった。このようにしてステ
ップ40において「近年、機械翻訳・・・。」という訳
文が、慣用的表現変換部分3から訳文出力部4に供給さ
れる。訳文出力部4はこの訳文を出力して表示させたり
記録させたりする。
【0034】以上の実施例によって、英文の単語間の修
飾関係を確認し、修飾関係があると判断された場合に、
個々の英単語に対応する訳語の組み合わせによる、慣用
的表現への変換、更に訳語の組み合わせ文字列から助詞
を削除し、更に動詞及び形容詞などの語尾変化部分を取
り除いて残った語の文字列を作成して、慣用的表現辞書
に該当する単語があればその単語を訳語に変更している
ので、慣用的表現辞書に適切な単語が登録されることに
よって、より自然な訳文を得ることができる。以上の実
施例においては、英文から日本文への翻訳を例に挙げて
説明したが、他の言語間の翻訳であっても適用できる。
【0035】
【発明の効果】以上述べたようにこの発明によれば、修
飾関係にある原言語の各単語に対応する訳語候補の組み
合わせ情報(例えば、組み合わせ文字列)に基づいて、
前記慣用的表現辞書を検索しているので、慣用的表現で
目的言語文章を翻訳することができる。
【0036】また上記組み合わせ情報に、修飾関係にあ
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含んで
、前記慣用的表現辞書を検索しているので、決め細かく
慣用的表現への翻訳ができる。
【0037】したがって辞書構築の時間、コストが低減
され、慣用的な表現で翻訳文章を得ることができるので
翻訳品質を向上させることができる。
【図面の簡単な説明】
【図1】この発明に係る機械翻訳装置の一実施例を示す
機能ブロック図である。
【図2】図1に示す機械翻訳装置の動作フローチャート
である。
【図3】図1に示す単語辞書の例を示す図である。
【図4】図1に示す慣用的表現辞書の例を示す図である
【図5】図1に示す慣用的表現変換処理前の内部状態図
である。
【図6】図1に示す慣用的表現変換処理後の内部状態図
である。
【符号の説明】
1…原文入力部、2…翻訳実行部、3…慣用的表現変換
部分、4…訳文出力部、5…単語辞書、6…慣用的表現
辞書。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  入力された原言語文章を他の目的言語
    文章に翻訳する場合に、目的言語で記述され、修飾関係
    を有する複数の単語のまとまりを慣用表現として、複数
    の慣用的表現を格納した慣用的表現辞書を有し、原言語
    文章中の単語間の修飾関係を確認して、修飾関係によっ
    て慣用的表現辞書を用いて目的言語文章に翻訳する機械
    翻訳装置において、原言語単語間に修飾関係がある場合
    に、修飾関係にある原言語の各単語に対応する訳語候補
    の組み合わせ情報に基づいて、前記慣用的表現辞書を検
    索し、上記修飾関係にある単語群についての慣用的表現
    がある場合にはそれを訳語として用いて、所望の慣用的
    表現を含む目的言語文章を得ることを特徴とする機械翻
    訳装置。
  2. 【請求項2】  上記組み合わせ情報に、修飾関係にあ
    る原言語の各単語に対応する訳語候補の全部を用いる又
    は一部を抽出して、この全部文字列又は一部文字列を組
    み合わせて訳語候補文字列を全て作成したものを含むこ
    とを特徴とする請求項1に記載の機械翻訳装置。
JP00323391A 1991-01-16 1991-01-16 機械翻訳装置 Expired - Fee Related JP3236027B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00323391A JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00323391A JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH04313158A true JPH04313158A (ja) 1992-11-05
JP3236027B2 JP3236027B2 (ja) 2001-12-04

Family

ID=11551732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00323391A Expired - Fee Related JP3236027B2 (ja) 1991-01-16 1991-01-16 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3236027B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms
JP2012514235A (ja) * 2008-12-31 2012-06-21 ジョンソン・アンド・ジョンソン・ビジョン・ケア・インコーポレイテッド 眼用レンズの配給装置及びその方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms
JP2012514235A (ja) * 2008-12-31 2012-06-21 ジョンソン・アンド・ジョンソン・ビジョン・ケア・インコーポレイテッド 眼用レンズの配給装置及びその方法

Also Published As

Publication number Publication date
JP3236027B2 (ja) 2001-12-04

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
JPS62163173A (ja) 機械翻訳方法
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR900006671B1 (ko) 언어생성장치
JPS58192173A (ja) 機械翻訳装置
Winiwarter Learning transfer rules for machine translation from parallel corpora
JPH0344764A (ja) 機械翻訳装置
JPH04313158A (ja) 機械翻訳装置
JP7247460B2 (ja) 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム
JPS59140582A (ja) 自然言語翻訳援助方式
JPS6310265A (ja) 翻訳装置
JP2626722B2 (ja) 日本語生成装置
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
Uchida Atlas
JPH0652219A (ja) 機械翻訳方法および例文検索方法
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPS6180360A (ja) 翻訳方式
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPS6190268A (ja) 翻訳方式
JPH01166258A (ja) 機械翻訳装置
JPH0581313A (ja) 辞書作成装置
Segal Machine translation of natural languages: the TOVNA MTS solution
JPH01112368A (ja) 機械翻訳装置
JPS58217081A (ja) 日英機械翻訳処理方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070928

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees