JP3236027B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP3236027B2 JP3236027B2 JP00323391A JP323391A JP3236027B2 JP 3236027 B2 JP3236027 B2 JP 3236027B2 JP 00323391 A JP00323391 A JP 00323391A JP 323391 A JP323391 A JP 323391A JP 3236027 B2 JP3236027 B2 JP 3236027B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- word
- words
- sentence
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
言語文章)を異なる言語の文章(目的言語文章)に翻訳
する機械翻訳装置に関する。
日本語に翻訳する機械翻訳装置が商品化されているが、
訳語に不自然な表現が多く、実用的な翻訳に達している
とは言えない状況である。
には原言語の複数の単語のまとまりを目的の言語で自然
な訳語に翻訳することが重要な対策の一つである。
う英文は一般に用意されている単語辞書の訳語をそのま
ま組み合わせて訳す(これを直訳と呼ぶ)と「近ごろの
年」と訳せ、意味は通じるがもっと自然な訳語、例えば
「近年」というように翻訳することが慣用的である。こ
のような修飾関係を有する単語のまとまり(ここでは
「慣用的表現」と呼ぶことにする)は、直訳すると意味
が通じなくなる一般的なイディオムとは性格が異なる
が、従来の機械翻訳装置ではこのような区別はなく一般
的なイディオムとして対訳のイディオム辞書を構築して
いた。
的表現も一般的イディオムも区別なくイディオム辞書と
して作成していたために、この対訳のイディオム辞書を
構築するために、原言語及び目的の言語の両方の知識が
ある者が膨大な手数と時間を費やさなければ慣用的表現
を使用した翻訳が十分に実現できなかった。
のであり、その目的とするところは、簡単な構成で、文
章中に修飾関係を有する場合に慣用的表現を含む目的言
語文章に翻訳する機械翻訳装置を提供することである。
を達成するために、一般的なイディオム辞書とは別に慣
用的表現辞書を用いて慣用的表現文章への変換方法を改
良した。
する複数の単語のまとまりを慣用表現とし、訳語として
出力を所望する慣用的表現を目的言語で記述した慣用的
表現辞書を格納する記憶手段と、入力された原言語文章
中の複数の単語間の修飾関係が存在するかを判断して、
原言語の複数の単語間に修飾関係がある場合に、修飾関
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補をそれぞれ組
合せて、複数の組合せ訳語候補を作成し、該複数の組合
せ訳語候補を用いて、前記慣用的表現辞書を検索し、該
複数の組合せ訳語候補について慣用的表現がある場合に
はそれを訳語として用いて、所望の慣用的表現を含む目
的言語文章を得る慣用的表現変換手段とを備えることを
特徴とする。
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補の各々を構成
する文字列の全部を用いて又は一部を抽出して、この全
部文字列又は一部文字列をそれぞれ組合せることによっ
て作成したものとすることが適当である。
複数の単語間の修飾関係が存在するかを判断して、原言
語の複数の単語間に修飾関係がある場合に、修飾関係に
あり少なくとも1つの単語が複数の訳語候補を有する原
言語の複数の単語に対応する訳語候補をそれぞれ組合せ
て、複数の組合せ訳語候補を作成すると、当該複数の組
合せ訳語候補を用いて、慣用的表現辞書を検索し、当該
複数の組合せ訳語候補について慣用的表現がある場合に
は、その慣用的表現を訳語として用いることで、自然な
目的言語文章に翻訳することができる。
係にあり少なくとも1つの単語が複数の訳語候補を有す
る原言語の複数の単語に対応する訳語候補の各々を構成
する文字列の全部を用いて又は一部を抽出して、この全
部文字列又は一部文字列をそれぞれ組合せることによっ
て作成したものであるので、きめ細かく慣用的表現への
翻訳ができる。
表現の辞書を用いているので、従来に比べ辞書構築が容
易になる。
施例を図面を用いて説明する。
る。機械翻訳装置は一般にコンピュータシステムなどの
ワークステーションにおけるハードウエア構成と以下に
示す機械翻訳装置特有の構成要素で実現することができ
る。
原文入力部1と、慣用的表現変換部分3を有する翻訳実
行部2と、単語辞書5と、慣用的表現辞書6と、訳文出
力部4である。原文入力部1はデータ入力手段である例
えばキーボード、OCR(Optical Chara
cter Reader)などから読み込んだ文章を保
持して、この文章を翻訳実行部2に供給する。また音声
入力で原文を入力する場合には、原文入力部1に音声/
文字変換部(図示省略)を付加して原文を入力しても良
い。
れた文章に対して文法規則や、辞書5を用いて訳文を生
成し、この訳文を慣用的表現変換部分3に供給する。
語について原言語の情報及び目的の言語の情報を記述し
たものであり、英語見出し、英語品詞、標準訳語、訳語
候補から構成される。
6を用いて原文の中に慣用的表現に修正すべき単語列が
あるかどうかを判断し、修正すべき訳語があれば訳語を
変更する。このようにして訳語を自然な訳語に変更して
この訳文を訳文出力部4に供給する。慣用的表現辞書6
は、図4に例を示すように目的の言語での慣用的表現の
見出しを記述したものである。
現変換部分3から供給された、訳文を例えば表示部に供
給し、訳文を表示したりする。
の流れを図2の動作フローチャートを用いて詳述する。
英文の例文として“Recent years, ma
chine translation・・・.”の“R
ecent years”が「近年」と翻訳される過程
を説明する。このとき単語辞書5は図3のように記述さ
れており、慣用的表現辞書6は図4のように記述されて
いるものとする。
“Recent years, machine tr
anslation・・・.“を翻訳実行部2に供給す
る(ステップ10)。
おける処理までに、単語辞書5を用いて翻訳する(ステ
ップ20)。つまり“Recent”に対して「近ごろ
の」と訳し、“years”に対して「年」と訳し、
“machine”に対して「機械」と訳し、“tra
nslation”に対して「翻訳」と訳す。このよう
にして「近ごろの年、機械翻訳・・・.」というように
訳文を構成する。このときに翻訳実行部2における慣用
的表現変換処理前の内部状態(英語見出し、英語品詞、
訳語、訳語候補の状態)は図5に示すような状態にされ
ている。
辞書6を用いて慣用的表現変換処理を行う(ステップ3
0)。この慣用的表現変換処理では以下に示すステップ
300〜310に示す処理を行う。最初に単語ポインタ
(変換処理する単語群の先頭を示すポンタ)を先頭の単
語“Recent”にセットし、変換処理単語数を2に
セットする。すなわち“recent”及び“year
s”に対して慣用的表現変化処理を行う(ステップ30
0)。
修飾関係を確認し、修飾関係があれば以下の処理を行
う。しかしながら修飾関係がない場合にはステップ30
8に進む(ステップ301)。
の候補を組み合わせると、6種類の文字列が作成される
(ステップ302)。すなわち「近ごろの年」、「近ご
ろの年代」、「近ごろの時代」、「最近の年」、「最近
の年代」、「最近の時代」が作成される。
辞書6を用いて検索し(ステップ303)、同じ文字列
があればその文字列に訳語を変更し、それぞれの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
慣用的表現辞書6において同じ文字列が無いと判断され
た場合には、それぞれの訳語の候補の文字列から助詞を
削除し、更に動詞及び形容詞などの語尾変化を除く。こ
のとき処理単語の最後の単語はそのままにする。このよ
うにして語尾変化を除いた組み合わせで再び文字列を作
成する(ステップ304)。すなわち「近ごろ年」、
「近ごろ年代」、「近ごろ時代」、「最近年」、「最近
年代」、「最近時代」が作成される。
ステップ304において作成された文字列に対して慣用
的表現辞書6を用いて検索し(ステップ305)、同じ
文字列があれば訳語を変更し、それぞれの残りの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
慣用表現辞書6において、同じ文字列が無いと判断され
た場合には、それぞれの訳語の先頭文字(処理単語の最
後の単語は語尾変化部分を残して)を組み合わせて、文
字列を作成する(ステップ306)。この場合には、重
複する文字列があるので、4種類の文字列が作成され
る。すなわち「近年」、「近時」、「最年」、「最時」
が作成される。
前記ステップ306において作成された文字列に対して
慣用的表現辞書6を用いて検索し(ステップ307)、
同じ文字列があれば訳語を変更する。この場合には「近
年」という文字列が慣用的表現辞書6にあるので、“r
ecent”の訳語を「近」に変更し、“years”
の訳語を「年」に変更し、それぞれ残りの訳語の候補を
すべて削除する。その後に処理単語数を1だけ増加し、
すなわち2から3に変更し(ステップ309)、前記ス
テップ301に戻り、前記処理を繰り返す。この時に訳
語を変更した後の慣用的表現変換部分3の内部状態(英
語見出し、英語品詞、訳語、訳語候補の状態)は図6に
示すようにされている。
nt”と“years”と“,”の3語について修飾関
係を確認する。この場合には3語には修飾関係が無いと
判断され、ステップ308に進む。
表現辞書6に同じ文字列が無い場合にも、ステップ30
8に進み、単語ポインタを次の単語に進め、処理単語数
を2にする。すなわち単語ポインタを“recent”
から“years”に移す。次に処理単語が文章中の最
後の単語であるか否かを確認する(ステップ310)。
最後であると確認されればステップ40に進み、訳文の
出力を行う。しかしながら現在は処理単語は、“yea
rs”と“,”に設定され、慣用的表現変換途中である
ので、最後とは確認されず再びステップ301に戻り修
飾関係を確認する。この2つの単語間には修飾関係はな
いのでステップ308に進み、単語ポインタを進め、単
語ポインタの位置を“,”とし、処理単語数を2にし
て、処理単語を“,”と“machine”にする。こ
の後ステップ310においてこの変換はまだ最後ではな
いと判断され、再びステップ301に戻り修飾関係を確
認する。この単語間には修飾関係がないと判断され、ス
テップ308に進み単語ポインタを進め、単語ポインタ
の位置を“machine”とし、処理単語数を2にし
て、処理単語を“machine”と“transla
tion”にする。この後ステップ310においてこの
変換はまだ最後ではないと判断され、再びステップ30
1に戻り修飾関係を確認する。この単語間には修飾関係
があるが、ステップ302〜307において作成された
文字列に対して慣用的表現辞書6に同じ文字列が無いと
判断され、ステップ308に進み単語ポインタを進め、
単語ポインタの位置を“translation”と
し、処理単語数を2にして、処理単語を“transl
ation”と“・”にしてステップ301〜310を
繰り返す。そして“.”の前の単語まで前記処理が完了
すると文末と判断され、慣用的表現変換処理の終了と判
断しステップ40に進む。
した。この英文においては修飾関係は、“recen
t”と“years”とにあった。このようにしてステ
ップ40において「近年、機械翻訳・・・。」という訳
文が、慣用的表現変換部分3から訳文出力部4に供給さ
れる。訳文出力部4はこの訳文を出力して表示させたり
記録させたりする。
飾関係を確認し、修飾関係があると判断された場合に、
個々の英単語に対応する訳語の組み合わせによる、慣用
的表現への変換、更に訳語の組み合わせ文字列から助詞
を削除し、更に動詞及び形容詞などの語尾変化部分を取
り除いて残った語の文字列を作成して、慣用的表現辞書
に該当する単語があればその単語を訳語に変更している
ので、慣用的表現辞書に適切な単語が登録されることに
よって、より自然な訳文を得ることができる。
への翻訳を例に挙げて説明したが、他の言語間の翻訳で
あっても適用できる。
用的表現を含む目的言語文章に翻訳することができる。
なくとも1つの単語が複数の訳語候補を有する原言語の
複数の単語に対応する訳語候補の各々を構成する文字列
の全部を用いて又は一部を抽出して、この全部文字列又
は一部文字列をそれぞれ組合せることによって作成した
場合には、きめ細かく慣用的表現への翻訳ができる。
され、慣用的な表現で翻訳文章を得ることができるので
翻訳品質を向上させることができる。
機能ブロック図である。
である。
る。
である。
である。
部分、4…訳文出力部、5…単語辞書、6…慣用的表現
辞書。
Claims (2)
- 【請求項1】 修飾関係を有する複数の単語のまとまり
を慣用表現とし、訳語として出力を所望する慣用的表現
を目的言語で記述した慣用的表現辞書を格納する記憶手
段と、 入力された原言語文章中の複数の単語間の修飾関係が存
在するかを判断して、原言語の複数の単語間に修飾関係
がある場合に、修飾関係にあり少なくとも1つの単語が
複数の訳語候補を有する原言語の複数の単語に対応する
訳語候補をそれぞれ組合せて、複数の組合せ訳語候補を
作成し、該複数の組合せ訳語候補を用いて、前記慣用的
表現辞書を検索し、該複数の組合せ訳語候補について慣
用的表現がある場合にはそれを訳語として用いて、所望
の慣用的表現を含む目的言語文章を得る慣用的表現変換
手段とを有することを特徴とする機械翻訳装置。 - 【請求項2】 上記複数の組合せ訳語候補は、修飾関係
にあり少なくとも1つの単語が複数の訳語候補を有する
原言語の複数の単語に対応する訳語候補の各々を構成す
る文字列の全部を用いて又は一部を抽出して、この全部
文字列又は一部文字列をそれぞれ組合せることによって
作成したものであることを特徴とする請求項1に記載の
機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00323391A JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00323391A JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04313158A JPH04313158A (ja) | 1992-11-05 |
JP3236027B2 true JP3236027B2 (ja) | 2001-12-04 |
Family
ID=11551732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00323391A Expired - Fee Related JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3236027B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5541838A (en) * | 1992-10-26 | 1996-07-30 | Sharp Kabushiki Kaisha | Translation machine having capability of registering idioms |
US10109145B2 (en) * | 2008-12-31 | 2018-10-23 | Johnson & Johnson Vision Care, Inc. | Apparatus and method for distributing ophthalmic lenses |
-
1991
- 1991-01-16 JP JP00323391A patent/JP3236027B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04313158A (ja) | 1992-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3220560B2 (ja) | 機械翻訳装置 | |
US4962452A (en) | Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence | |
US7319949B2 (en) | Unilingual translator | |
US7487082B2 (en) | Apparatus for developing a transfer dictionary used in transfer-based machine translation system | |
EP1306775A1 (en) | Machine translation | |
JPS62163173A (ja) | 機械翻訳方法 | |
JPH02308370A (ja) | 機械翻訳システム | |
JPH10312382A (ja) | 類似用例翻訳システム | |
JPH0351022B2 (ja) | ||
JP3236027B2 (ja) | 機械翻訳装置 | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JP3131432B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
JP2806352B2 (ja) | 機械翻訳用辞書メンテナンス装置 | |
JP2002132764A (ja) | 機械翻訳前処理装置 | |
JP4087829B2 (ja) | 結合価辞書拡張装置、方法、およびプログラム | |
JP2928246B2 (ja) | 翻訳支援装置 | |
JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
JP2001337945A (ja) | 自動編集装置及び方法並びにこれに利用される記憶媒体 | |
JP3267168B2 (ja) | 自然言語変換システム | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JP2752025B2 (ja) | 機械翻訳装置 | |
JPS6337472A (ja) | 冠詞設定方式 | |
JPS6389975A (ja) | 言語解析装置 | |
Segal | Machine translation of natural languages: the TOVNA MTS solution | |
EP1306773A1 (en) | Machine translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070928 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080928 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080928 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100928 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |