JPH07160716A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07160716A
JPH07160716A JP5305107A JP30510793A JPH07160716A JP H07160716 A JPH07160716 A JP H07160716A JP 5305107 A JP5305107 A JP 5305107A JP 30510793 A JP30510793 A JP 30510793A JP H07160716 A JPH07160716 A JP H07160716A
Authority
JP
Japan
Prior art keywords
translated
sentence
translation
word
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5305107A
Other languages
English (en)
Other versions
JP3324241B2 (ja
Inventor
Yasuyuki Numata
泰之 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP30510793A priority Critical patent/JP3324241B2/ja
Publication of JPH07160716A publication Critical patent/JPH07160716A/ja
Application granted granted Critical
Publication of JP3324241B2 publication Critical patent/JP3324241B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 機械翻訳装置において、翻訳結果における訳
語を、高速に、かつ正確に他の訳語と入れ換える編集機
能を提供することを目的とする。 【構成】 原文を記憶する手段(原文記憶手段1)を持
ち、その原文を翻訳する手段(翻訳手段2)を持ち、翻
訳結果である訳文テキストを記憶する手段(訳文記憶手
段3)を持ち、文単位の翻訳の際に得られる原単語とそ
の訳語の対応情報を文単位で管理する対訳情報を記憶す
る手段(翻訳情報記憶手段6)を持ち、翻訳情報に基づ
いて訳文テキスト中の訳語を指定された訳語で置き換え
る手段(編集手段4)を持ち、原文を入力したり、訳文
テキスト修正の指示を出したりするユーザインタフェー
ス5を持つ。 【効果】 翻訳結果を対象として、効率的に訳語の修正
ができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳によって得ら
れた訳文中の不適切な訳語を、効率的に修正する機械翻
訳装置に関するものである。
【0002】
【従来の技術】まず、本発明の背景である機械翻訳にお
ける訳語の問題について述べる。英語は多義語であり、
特に英日翻訳を行う場合、単語単位の訳出は、機械翻訳
における大きな問題の1つとなっている。たとえば、sp
ringという単語は、「バネ、泉、春」といった全く概念
の異なる訳を持つが、現在の機械翻訳の技術レベルにお
いて、自動的に適切な訳語を選択することは非常に難し
い。
【0003】英文We need the spring.に対し、spring
の訳の違いにより、 ・私達は、バネが必要だ。
【0004】・私達は、泉が必要だ。 ・私達は、春が必要だ。 が得られるが、この違いは、ユーザにとって非常に重大
である。人間は、文の持つ全体的な意味や、文脈におけ
る文の位置付け等を考慮しながら適切な訳語を選択して
いるが、機械翻訳は、文単位の翻訳であり、訳語の選択
の問題は、当面、容易には解決されない問題であった。
【0005】よって、機械翻訳の結果に対し、ユーザは
少なくとも訳語の修正という作業が必要となるわけであ
るが、現在の翻訳機が提供する訳語の修正手段は、必ず
しもユーザにとって満足のいくものではない。
【0006】従来、機械翻訳装置によって得られた翻訳
結果における訳語を修正する方法として、 (1).エディタによって修正する(逐次,一括) (2).ユーザ辞書登録後に文章全体を翻訳しなおす (3).一文翻訳時に後編集機能で訳語選択し、学習さ
せた後、文章全体を再翻訳させる といったものがある。(1)のエディタによる修正の中
でも、訳文をエディタ上で読みながら、訳語を随時修正
していく方法は、最も効率が悪い。また、エディタの機
能(検索,置換)にたよる方法があるが、逐次的な方法
は、各単語単位で検索しては確認する必要があり時間が
かかる。更に、バッチ的な置換の場合、文字列ベースに
よる検索のため、以下に述べるように、不要な置き換え
が発生する。
【0007】その不要な置き換えの1つは、「At that
time, the interval is 〜」といった英文に対する「そ
の時間隔が〜(At that time, the interval is 〜)」
といった訳文を含む翻訳結果文書に対して、「時間→タ
イム」という訳語の置き換えが要求された場合、その要
求がtime以外の英単語に基づいたものであったとして
も、訳文テキストに対する字面ベースの置換のために、
「そのタイム隔が〜」という訳になってしまう。
【0008】もう1つの不要な置き換えは、翻訳機の誤
った訳語選択に依存するものである。たとえば、次のよ
うな翻訳結果が同一文書中にあるとする。
【0009】The processes execute the system call. 「進行は、システムコールを実行する。」 The work is going on according to plan. 「仕事は計画通り進行しています。」 ここでは、process,goに対して、それぞれ「進行」
「進行する」という訳が与えられている。ユーザにとっ
て、goに対する「進行する」という訳は適切であるが、
processに対する「進行」という訳は、「プロセス」と
すべきであった場合、字面ベースの一括変換を行うと、
前者は、「プロセスは、システムコールを実行する。」
と適切な結果が得られるが、副作用的に、後者は、「仕
事は計画通りプロセスしています。」という誤った訳と
なってしまう。そして、この一括置換の問題は、この誤
った置換に、ユーザが気付くタイミングが存在しないこ
とである。
【0010】(2)の「ユーザ辞書登録後に文章全体を
翻訳しなおす」という方法は、多くの場合、ユーザ辞書
登録自体が大変であり、しかも、文章全体を翻訳しなお
すという時間的なコストが大き過ぎ、(3)の「1文翻
訳時に後編集機能で訳語選択し、学習させた後、文章全
体を再翻訳させる」というのも、1文翻訳をすること自
体が繁雑であり、文章全体を翻訳しなおすという点は、
(2)と同様である。
【0011】
【発明が解決しようとする課題】「従来の技術」で述べ
たように、機械翻訳による翻訳結果に対する訳語変更は
容易ではなく、再翻訳は多くの時間がかかる。更にユー
ザ辞書登録も、操作が面倒であるという問題が点を有し
ていた。
【0012】
【課題を解決するための手段】本発明は、文単位で各単
語の原単語とその訳語のペアの翻訳情報を保存する手段
と、ユーザが訳語変更のために変更対象となる原単語と
それに対する新たな訳語を指定する手段と、ユーザによ
り指定された原単語をキーとして翻訳情報内の原単語を
検索する検索手段と、上記検索手段による検索の結果、
ユーザが指定した原単語を原文内に含む文の訳文にアク
セスする手段と、上記訳文内の文字列に対してユーザが
指定した新訳語文字列で検索する検索手段と、上記訳文
の部分文字列をユーザが指定した文字列で置換する手段
を備える。
【0013】
【作用】訳文を構成する訳語に対する原単語を記憶して
おき、その情報に基づいて訳語の入れ替えを行うため、
テキストエディタによる検索・置換のような副作用もな
く、適切にかつ効率的に、訳語の入れ替えを行う。
【0014】
【実施例】以下、図面に基づいて、本発明の機械翻訳装
置の一実施例について詳細に説明する。
【0015】図1は、単語単位の訳語が、いかなる原単
語に由来するものであるかを、文単位で記憶・管理する
翻訳情報テーブルである。同図では、文番号10と20
の情報のみを描いているが、実際は、すべての文に対し
て、同様な訳語情報を持つ。各レコード(行)は、3つ
のフィールド(欄)から構成されており、それぞれのフ
ィールドは、文番号,原単語(訳のもととなった英単
語),訳語を記憶している。つまり、各レコードは、
「第○行の○○という単語を○○と訳した」という情報
を表わしている。したがって、同図は、 ・文10では、processを「進行」と訳している ・文10では、executeを「実行する」と訳している ・文10では、system callを「システムコール」と訳
している ・文20では、workを「仕事」と訳している ・文20では、goを「進行する」と訳している ・文20では、planを「計画」と訳している と読む。この翻訳情報テーブルは、ある英単語を他の訳
語に置き換える際に参照される。
【0016】図2は、本発明の一実施例における機械翻
訳装置の機能ブロック図である。1は、キーボードなど
によってシステムに取り込まれた翻訳対象英文をテキス
トとして記憶する原文記憶手段、2は、原文記憶手段1
に記憶された英文を翻訳するための翻訳手段、3は、翻
訳手段2によって翻訳された結果の訳文をテキストとし
て、かつ、1訳文を1レコード形式(1英文に対する訳
文を1レコードとする。文ごとに長さは異なるため可変
長となる。ここでは、1レコードの終端コードとして、
改行コードがあるものとする。)で記憶する訳文記憶手
段、4は、訳文記憶手段3に記憶された訳文テキストを
修正する(指定されたN番目の文テキスト内において、
指定された部分文字列を検索し、指定された部分文字列
で置換する。)ための編集手段、5は、原文入力、翻訳
指示、編集指示操作等を行わせるのに必要となるユーザ
インタフェースである。6は、翻訳手段2が翻訳する過
程で生成した翻訳情報を記憶する翻訳情報記憶手段であ
り、編集手段4は、この情報を参照しながら、訳文記憶
手段3中の訳文テキストを修正する。
【0017】次に、図4を参照して、本実施例の手続き
(アルゴリズム)を説明する。ステップ1Aでは、訳語
変更を希望する原単語と新訳語とを獲得する。まず、訳
語変更フェーズにおいて、ユーザインタフェース5を通
じ、ユーザから、 ・訳語変更を希望する原単語 ・上記原単語に対して新たに希望する訳語(新訳語) の2つのデータを得る。上述の例では、訳語変更を希望
する原単語がprocessであり、(誤った訳語(旧訳語)
が「進行」であり、)新たに希望する訳語(新訳語)が
「プロセス」である。
【0018】ステップ1Bでは、図1の翻訳情報テーブ
ルにおける原単語が検索される。翻訳情報テーブルの原
単語欄の値(文字列)が、ユーザが指定した原単語文字
列(この例では、process)と一致するレコードを求め
る。求めたレコードの文番号欄の値から、その原単語を
含む文番号がわかる。例では、結果として、10番目の
文に、processが含まれていることがわかる。
【0019】ステップ1Cは、訳文における訳語文字列
の検索と置換である。訳文記憶手段3の10番目のレコ
ードであるところの10番目の訳文「進行は、システム
コールを実行する。」にアクセスし、編集手段4によっ
て、その中に含まれる訳語文字列「進行」を求め、その
文字列を、ユーザから得た新訳語「プロセス」に置換す
る。本実施例では、結果として、「プロセスは、システ
ムコールを実行する。」を、新たな訳文として得る。
【0020】本実施例では、20番目の文に、「仕事は
計画通り進行しています。」という「進行」という訳語
を含む訳文が存在するにもかかわらず、その訳文に対す
る原文内での原単語を考慮したロジックとなっているた
め、この訳文は、編集の対象外となり、エディタによる
単純な文字列ベースの検索・置換に見られる誤った置換
(副作用)は、抑制できる。
【0021】次に、本発明の機械翻訳装置の他の実施例
について説明する。図3は、本発明の他の実施例の機械
翻訳装置の機能ブロック図である。1の「原文記憶手
段」、2の「翻訳手段」、5の「ユーザインタフェー
ス」の役割は、前述の実施例と同様である。7は、翻訳
結果記憶手段であり、後で述べるように、テキストデー
タとして、翻訳結果の訳文と、その訳文を構成する各単
語の訳語情報を持っている。8は、訳文文字列生成手段
であり、翻訳結果記憶手段7から、訳文文字列のみを生
成する。9は、翻訳結果記憶手段7の訳語に関する情報
を更新する翻訳結果修正手段である。
【0022】この翻訳情報の記憶方法(データ表現)の
表現は、訳文文字列中において、単語単位で、対応する
原単語を併記するというものであり、具体的には、以下
の通りである。
【0023】翻訳対象原文として、「You like a ca
r.」という英文が、その翻訳結果として、「貴方は自動
車が好きです。」という訳文があったとする。従来的な
方法や前述の実施例では、これらの原文と訳文は、たと
えばファイルにより、また、たとえば、奇数行と偶数行
といった方法で、論理的に分離されており、翻訳情報
は、これらの原文,訳文データとは、明らかに別の表現
手段(テーブル)等により、維持されている。
【0024】本実施例では、上記翻訳結果(訳文テキス
ト)中に、語単位の対訳情報を、「{貴方[you]}は
{自動車[car]}が好きです。」といった形式で保存
する。ここで、{,{,[,]等の記号は、特に、これに
限ったものではない。当然、訳文には現われないと確信
できる符号が使われる。
【0025】以下、このデータに対する訳語修正手続き
を、図5のフローチャートによって説明する。
【0026】あらかじめ、ユーザにより指定された原単
語とその新訳語は、それぞれ、「car」と「車」であっ
たとする。したがって、訳文テキスト中の[]内の文字
列とcarを比較する。一致する文字列が[]内に見つか
った場合には、[]の直前の文字列({XXX[car]}の
XXXの部分)を、「車」に置き換えることになる。
【0027】まず、ステップ2Aにおいて、翻訳結果記
憶手段9から、1文を取り出す。その1文が、「{私
[I]}は{飛行機[airplane]}が好きです。」であ
ったとする。
【0028】ステップ2Bにおいて、原単語carで検索
する。該当なしであるから、残りの翻訳結果の有無を調
べる。残り2文あるとする。したがって、もう一度、ス
テップ2Aにおいて、翻訳結果記憶手段9から、1文を
取り出す。
【0029】次は、「{貴方[you]}は{自動車[ca
r]}が好きです。」再び、ステップ2Bにおいて、原
単語carで検索する。今度は、{自動車[car]}が見つ
かる。そこで、ステップ2Cにおいて、「自動車」を
「車」に置き換える。
【0030】その結果、「{貴方[you]}は{車[ca
r]}が好きです。」が得られる。再度、ステップ2B
において、同一文の翻訳結果中において、原単語carが
検索される。もはや、この文の翻訳結果には、原単語と
してcarは含まれていないので、次の文の翻訳結果を取
り出す。もちろん、この段階で、残りの翻訳結果がなけ
れば、この検索・置換処理は終了する。
【0031】最後に、さらに、ステップ2Aにおいて、
翻訳結果記憶手段9から、1文を取り出す。次は、
「{彼[he]}は{黒い[black]}{自動車[car]}
と{白い[white]}{自動車[car]}が好きです。」
であるとする。最初に、ステップ2Bとステップ2Cに
よって、「黒い自動車」は「黒い車」に置き換えられ
る。再び、ステップ2Bにおいて、「白い自動車」に対
応する{自動車[car]}が見つかるので、この部分を
対象として、ステップ2Cで、{車[car]}に置き換
える。この結果、「{彼[he]}は{黒い[black]}
{車[car]}と{白い[white]}{車[car]}が好
きです。」という翻訳結果に更新される。訳文文字列生
成手段8は、この翻訳結果に対して、記号{と}、及び
[]部分を取り除くことにより、「彼は黒い車と白い車
が好きです。」という訳文テキストを得る。
【0032】
【発明の効果】本発明においては、機械翻訳の結果とし
て得られた訳文における不適切な訳語を、効率的に修正
できる。
【図面の簡単な説明】
【図1】本発明の一実施例における翻訳情報テーブルの
摸式図
【図2】本発明の一実施例における機械翻訳装置の機能
ブロック図
【図3】本発明の他の実施例の機械翻訳装置の機能ブロ
ック図
【図4】本発明の一実施例における実現手続きを説明す
るフローチャート
【図5】本発明の他の実施例における実現手続きを説明
するフローチャート
【符号の説明】
1 原文記憶手段 2 翻訳手段 3 訳文記憶手段 4 編集手段 5 ユーザインタフェース 6 翻訳情報 7 翻訳結果記憶手段 8 訳文文字列生成手段 9 翻訳結果修正手段

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文単位で、各単語の原単語とその訳語のペ
    アの翻訳情報を保存する手段と、ユーザが訳語変更のた
    めに変更対象となる原単語とそれに対する新たな訳語を
    指定する手段と、ユーザにより指定された原単語をキー
    として翻訳情報内の原単語を検索する検索手段と、上記
    検索手段による検索の結果、ユーザが指定した原単語を
    原文内に含む文の訳文にアクセスする手段と、上記訳文
    内の文字列に対してユーザが指定した新訳語文字列で検
    索する検索手段と、上記訳文の部分文字列をユーザが指
    定した文字列で置換する手段を備える機械翻訳装置。
  2. 【請求項2】請求項1記載の機械翻訳装置において、訳
    文文字列中に翻訳情報を備える機械翻訳装置。
JP30510793A 1993-12-06 1993-12-06 機械翻訳装置 Expired - Fee Related JP3324241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30510793A JP3324241B2 (ja) 1993-12-06 1993-12-06 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30510793A JP3324241B2 (ja) 1993-12-06 1993-12-06 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH07160716A true JPH07160716A (ja) 1995-06-23
JP3324241B2 JP3324241B2 (ja) 2002-09-17

Family

ID=17941189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30510793A Expired - Fee Related JP3324241B2 (ja) 1993-12-06 1993-12-06 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3324241B2 (ja)

Also Published As

Publication number Publication date
JP3324241B2 (ja) 2002-09-17

Similar Documents

Publication Publication Date Title
US5826220A (en) Translation word learning scheme for machine translation
EP0366142B1 (en) Method and apparatus of machine translation
EP0370774B1 (en) Machine translation system
EP0685801A1 (en) Process in an information processing system for compaction and replacement of phrases
JPS6244877A (ja) 機械翻訳装置
CN101458681A (zh) 语音翻译方法和语音翻译装置
CN112766000B (zh) 基于预训练模型的机器翻译方法及系统
JPH0442705B2 (ja)
JPS6037509B2 (ja) 英文文章処理装置における綴り誤り処理方式
JPS58192173A (ja) 機械翻訳装置
JPH07160716A (ja) 機械翻訳装置
JPH06266770A (ja) 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置
JPH0433058A (ja) 機械翻訳装置
JPS62163174A (ja) 機械翻訳装置
JPS58151677A (ja) 翻訳文編集方法
JPH04158477A (ja) 機械翻訳装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JPH04313158A (ja) 機械翻訳装置
JPH0550778B2 (ja)
JP2011210194A (ja) 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造
JPS6244876A (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置
JPH04349572A (ja) 機械翻訳装置。
JPH03280159A (ja) 文字列検索方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees