JPH04313158A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH04313158A JPH04313158A JP3003233A JP323391A JPH04313158A JP H04313158 A JPH04313158 A JP H04313158A JP 3003233 A JP3003233 A JP 3003233A JP 323391 A JP323391 A JP 323391A JP H04313158 A JPH04313158 A JP H04313158A
- Authority
- JP
- Japan
- Prior art keywords
- word
- idiomatic
- translation
- dictionary
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 78
- 230000014509 gene expression Effects 0.000 claims abstract description 74
- 230000004048 modification Effects 0.000 claims description 28
- 238000012986 modification Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 abstract 1
- 230000014616 translation Effects 0.000 description 69
- 238000000034 method Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
め要約のデータは記録されません。
Description
言語文章)を異なる言語の文章(目的言語文章)に翻訳
する機械翻訳装置に関する。
日本語に翻訳する機械翻訳装置が商品化されているが、
訳語に不自然な表現が多く、実用的な翻訳に達している
とは言えない状況である。
には原言語の複数の単語のまとまりを目的の言語で自然
な訳語に翻訳することが重要な対策の一つである。
いう英文は一般に用意されている単語辞書の訳語をその
まま組み合わせて訳す(これを直訳と呼ぶ)と「近ごろ
の年」と訳せ、意味は通じるがもっと自然な訳語、例え
ば「近年」というように翻訳することが慣用的である。 このような修飾関係を有する単語のまとまり(ここでは
「慣用的表現」と呼ぶことにする)は、直訳すると意味
が通じなくなる一般的なイディオムとは性格が異なるが
、従来の機械翻訳装置ではこのような区別はなく一般的
なイデオムとして対訳のイディオム辞書を構築していた
。
的表現も一般的イディオムも区別なくイディオム辞書と
して作成していたために、この対訳のイディオム辞書を
構築するために、原言語及び目的の言語の両方の知識が
ある者が膨大な手数と時間を費やさなければ慣用的表現
を使用した翻訳が十分に実現できなかった。
のであり、その目的とするところは、簡単な構成で、文
章中に修飾関係を有する場合に慣用的表現を含む目的言
語文章で翻訳する機械翻訳装置を提供することである。
を達成するために、一般的なイディオム辞書とは別に慣
用的表現辞書を用いて慣用的表現文章への変換方法を改
良した。
語文章に翻訳する場合に、目的言語で記述され、修飾関
係を有する複数の単語のまとまりを慣用表現として、複
数の慣用的表現を格納した慣用的表現辞書を有し、原言
語文章中の単語間の修飾関係を確認して、修飾関係によ
って慣用的表現辞書を用いて目的言語文章に翻訳する機
械翻訳装置において、原言語単語間に修飾関係がある場
合に、修飾関係にある原言語の各単語に対応する訳語候
補の組み合わせ情報(例えば、組み合わせ文字列)に基
づいて、前記慣用的表現辞書を検索し、上記修飾関係に
ある単語群についての慣用的表現がある場合にはそれを
訳語として用いて、所望の慣用的表現を含む目的言語文
章を得ることを特徴とする。
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含むこ
とが適当である。
ある場合に、修飾関係にある原言語の各単語に対応する
訳語候補の組み合わせ情報(例えば、組み合わせ文字列
)に基づいて、前記慣用的表現辞書を検索しているので
、慣用的表現で目的言語文章を翻訳することができる。
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含んで
、前記慣用的表現辞書を検索しているので、決め細かく
慣用的表現への翻訳ができる。
表現の辞書を用いているので、従来に比べ辞書構築が容
易になる。
施例を図面を用いて説明する。
る。機械翻訳装置は一般にコンピュータシステムなどの
ワークステーションにおけるハードウエア構成と以下に
示す機械翻訳装置特有の構成要素で実現することができ
る。
原文入力部1と、慣用的表現変換部分3を有する翻訳実
行部2と、単語辞書5と、慣用的表現辞書6と、訳文出
力部4である。原文入力部1はデータ入力手段である例
えばキーボード、OCR(Optical Char
acter Reader)などから読み込んだ文章
を保持して、この文章を翻訳実行部2に供給する。また
音声入力で原文を入力する場合には、原文入力部1に音
声/文字変換部(図示省略)を付加して原文を入力して
も良い。
れた文章に対して文法規則や、辞書5を用いて訳文を生
成し、この訳文を慣用的表現変換部分3に供給する。
語について原言語の情報及び目的の言語の情報を記述し
たものであり、英語見出し、英語品詞、標準訳語、訳語
候補から構成される。
6を用いて原文の中に慣用的表現に修正すべき単語列が
あるかどうかを判断し、修正すべき訳語があれば訳語を
変更する。このようにして訳語を自然な訳語に変更して
この訳文を訳文出力部4に供給する。慣用的表現辞書6
は、図4に例を示すように目的の言語での慣用的表現の
見出しを記述したものである。
現実行部分3から供給された、訳文を例えば表示部7に
供給し、訳文を表示したりする。
の流れを図2の動作フローチャートを用いて詳述する。 英文の例文として“Recent years,ma
chine translation・・・.”の“
Recent years”が「近年」と翻訳される
過程を説明する。このとき単語辞書5は図3のように記
述されており、慣用的表現辞書6は図4のように記述さ
れているものとする。
Recent years,machine tr
anslation・・・.“を翻訳実行部2に供給す
る(ステップ10)。
おける処理までに、単語辞書5を用いて翻訳する(ステ
ップ20)。つまり“Recent”に対して「近ごろ
の」と訳し、“years”に対して「年」と訳し、“
machine”に対して「機械」と訳し、“tran
slation”に対して「翻訳」と訳す。このように
して「近ごろの年、機械翻訳・・・.」というように訳
文を構成する。このときに翻訳実行部2における慣用的
表現変換処理前の内部状態(英語見出し、英語品詞、訳
語、訳語候補の状態)は図5に示すような状態にされて
いる。
辞書6を用いて慣用的表現変換処理を行う(ステップ3
0)。この慣用的表現変換処理は以下に示すステップ3
00〜310に示す処理を行う。最初に単語ポインタ(
変換処理する単語群の先頭を示すポンタ)を先頭の単語
“Recent”にセットし、変換処理単語数を2にセ
ットする。すなわち“recent”及び“years
”に対して慣用的表現変化処理を行う(ステップ300
)。
修飾関係を確認し、修飾関係があれば以下の処理を行う
。しかしながら修飾関係がない場合にはステップ308
に進む(ステップ301)。
の候補を組み合わせると、6種類の文字列が作成される
(ステップ302)。すなわち「近ごろの年」、「近ご
ろの年代」、「近ごろの時代」、「最近の年」、「最近
の年代」、「最近の時代」が作成される。
辞書6を用いて検索し(ステップ303)、同じ文字列
があればその文字列に訳語を変更し、それぞれの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
慣用的表現辞書6において同じ文字列が無いと判断され
た場合には、それぞれの訳語の候補の文字列から助詞を
削除し、更に動詞及び形容詞などの語尾変化を除く。こ
のとき処理単語の最後の単語はそのままにする。このよ
うにして語尾変化を除いた組み合わせで再び文字列を作
成する(ステップ304)。すなわち「近ごろ年」、「
近ごろ年代」、「近ごろ時代」、「最近年」、「最近年
代」、「最近時代」が作成される。
ステップ304において作成された文字列に対して慣用
的表現辞書6を用いて検索し(ステップ305)、同じ
文字列があれば訳語を変更し、それぞれの残りの訳語の
候補をすべて削除する。その後に処理単語数を1だけ増
加し、2から3に変更し(ステップ309)、すなわち
3個の単語間で修飾関係を確認するために前記ステップ
301に戻り、処理を繰り返す。
慣用表現辞書6において、同じ文字列が無いと判断され
た場合には、それぞれの訳語の先頭文字(処理単語の最
後の単語は語尾変化部分を残して)を組み合わせて、文
字列を作成する(ステップ306)。この場合には、重
複する文字列があるので、4種類の文字列が作成される
。すなわち「近年」、「近時」、「最年」、「最時」が
作成される。
前記ステップ306において作成された文字列に対して
慣用的表現辞書6を用いて検索し(ステップ307)、
同じ文字列があれば訳語を変更する。この場合には「近
年」という文字列が慣用的表現辞書6にあるので、“r
ecent”の訳語を「近」に変更し、“years”
の訳語を「年」に変更し、それぞれ残りの訳語の候補を
すべて削除する。その後に処理単語数を1だけ増加し、
すなわち2から3に変更し(ステップ309)、前記ス
テップ301に戻り、前記処理を繰り返す。この時に訳
語を変更した後の慣用的表現変換部分3の内部状態(英
語見出し、英語品詞、訳語、訳語候補の状態)は図6に
示すようにされている。
nt”と“years”と“,”の3語について修飾関
係を確認する。この場合には3語には修飾関係が無いと
判断され、ステップ308に進む。
表現辞書6に同じ文字列が無い場合にも、ステップ30
8に進み、単語ポインタを次の単語に進め、処理単語数
を2にする。すなわち単語ポインタを“recent”
から“years”に移す。次に処理単語が文章中の最
後の単語であるか否かを確認する(ステップ310)。 最後であると確認されればステップ40に進み、訳文の
出力を行う。しかしながら現在は処理単語は、“yea
rs”と“,”に設定され、慣用的表現変換途中である
ので、最後とは確認されず再びステップ301戻り修飾
関係を確認する。この2つの単語間には修飾関係はない
のでステップ308に進み、単語ポインタを進め、単語
ポインタの位置を“,”とし、処理単語数を2にして、
処理単語を“,”と“machine”にする。この後
ステップ310においてこの変換はまだ最後ではないと
判断され、再びステップ301に戻り修飾関係を確認す
る。この単語間には修飾関係がないと判断され、ステッ
プ308に進み単語ポインタを進め、単語ポインタの位
置を“machine”とし、処理単語数を2にして、
処理単語を“machine”と“translati
on”にする。この後ステップ310においてこの変換
はまだ最後ではないと判断され、再びステップ301に
戻り修飾関係を確認する。この単語間にも修飾関係がな
いと判断され、ステップ308に進み単語ポインタを進
め、単語ポインタの位置を“translation”
とし、処理単語数を2にして、処理単語を“trans
lation”と“・”にしてステップ301〜310
を繰り返す。そして“.”の前の単語まで前記処理が完
了すると文末と判断され、慣用的表現変換処理の終了と
判断しステップ40に進む。
した。この英文においては修飾関係は、“recent
”と“years”の間にあった。このようにしてステ
ップ40において「近年、機械翻訳・・・。」という訳
文が、慣用的表現変換部分3から訳文出力部4に供給さ
れる。訳文出力部4はこの訳文を出力して表示させたり
記録させたりする。
飾関係を確認し、修飾関係があると判断された場合に、
個々の英単語に対応する訳語の組み合わせによる、慣用
的表現への変換、更に訳語の組み合わせ文字列から助詞
を削除し、更に動詞及び形容詞などの語尾変化部分を取
り除いて残った語の文字列を作成して、慣用的表現辞書
に該当する単語があればその単語を訳語に変更している
ので、慣用的表現辞書に適切な単語が登録されることに
よって、より自然な訳文を得ることができる。以上の実
施例においては、英文から日本文への翻訳を例に挙げて
説明したが、他の言語間の翻訳であっても適用できる。
飾関係にある原言語の各単語に対応する訳語候補の組み
合わせ情報(例えば、組み合わせ文字列)に基づいて、
前記慣用的表現辞書を検索しているので、慣用的表現で
目的言語文章を翻訳することができる。
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含んで
、前記慣用的表現辞書を検索しているので、決め細かく
慣用的表現への翻訳ができる。
され、慣用的な表現で翻訳文章を得ることができるので
翻訳品質を向上させることができる。
機能ブロック図である。
である。
。
である。
である。
部分、4…訳文出力部、5…単語辞書、6…慣用的表現
辞書。
Claims (2)
- 【請求項1】 入力された原言語文章を他の目的言語
文章に翻訳する場合に、目的言語で記述され、修飾関係
を有する複数の単語のまとまりを慣用表現として、複数
の慣用的表現を格納した慣用的表現辞書を有し、原言語
文章中の単語間の修飾関係を確認して、修飾関係によっ
て慣用的表現辞書を用いて目的言語文章に翻訳する機械
翻訳装置において、原言語単語間に修飾関係がある場合
に、修飾関係にある原言語の各単語に対応する訳語候補
の組み合わせ情報に基づいて、前記慣用的表現辞書を検
索し、上記修飾関係にある単語群についての慣用的表現
がある場合にはそれを訳語として用いて、所望の慣用的
表現を含む目的言語文章を得ることを特徴とする機械翻
訳装置。 - 【請求項2】 上記組み合わせ情報に、修飾関係にあ
る原言語の各単語に対応する訳語候補の全部を用いる又
は一部を抽出して、この全部文字列又は一部文字列を組
み合わせて訳語候補文字列を全て作成したものを含むこ
とを特徴とする請求項1に記載の機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00323391A JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00323391A JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04313158A true JPH04313158A (ja) | 1992-11-05 |
JP3236027B2 JP3236027B2 (ja) | 2001-12-04 |
Family
ID=11551732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00323391A Expired - Fee Related JP3236027B2 (ja) | 1991-01-16 | 1991-01-16 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3236027B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5541838A (en) * | 1992-10-26 | 1996-07-30 | Sharp Kabushiki Kaisha | Translation machine having capability of registering idioms |
JP2012514235A (ja) * | 2008-12-31 | 2012-06-21 | ジョンソン・アンド・ジョンソン・ビジョン・ケア・インコーポレイテッド | 眼用レンズの配給装置及びその方法 |
-
1991
- 1991-01-16 JP JP00323391A patent/JP3236027B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5541838A (en) * | 1992-10-26 | 1996-07-30 | Sharp Kabushiki Kaisha | Translation machine having capability of registering idioms |
JP2012514235A (ja) * | 2008-12-31 | 2012-06-21 | ジョンソン・アンド・ジョンソン・ビジョン・ケア・インコーポレイテッド | 眼用レンズの配給装置及びその方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3236027B2 (ja) | 2001-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5895446A (en) | Pattern-based translation method and system | |
JPS62163173A (ja) | 機械翻訳方法 | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
KR900006671B1 (ko) | 언어생성장치 | |
JPS58192173A (ja) | 機械翻訳装置 | |
Winiwarter | Learning transfer rules for machine translation from parallel corpora | |
JPH0344764A (ja) | 機械翻訳装置 | |
JPH04313158A (ja) | 機械翻訳装置 | |
JP7247460B2 (ja) | 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JPS6310265A (ja) | 翻訳装置 | |
JP2626722B2 (ja) | 日本語生成装置 | |
KR100204068B1 (ko) | 개념기반 다국어 번역시스템의 문법 자동수정 방법 | |
Uchida | Atlas | |
JPH0652219A (ja) | 機械翻訳方法および例文検索方法 | |
JP2806352B2 (ja) | 機械翻訳用辞書メンテナンス装置 | |
JP3949874B2 (ja) | 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム | |
JPS6180360A (ja) | 翻訳方式 | |
JPS62272357A (ja) | 機械翻訳システムにおける入力文のエラ−表示方式 | |
JPS6190268A (ja) | 翻訳方式 | |
JPH01166258A (ja) | 機械翻訳装置 | |
JPH0581313A (ja) | 辞書作成装置 | |
Segal | Machine translation of natural languages: the TOVNA MTS solution | |
JPH01112368A (ja) | 機械翻訳装置 | |
JPS58217081A (ja) | 日英機械翻訳処理方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070928 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080928 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080928 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100928 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |