JP2011210193A - 機械翻訳装置および機械翻訳プログラム - Google Patents
機械翻訳装置および機械翻訳プログラム Download PDFInfo
- Publication number
- JP2011210193A JP2011210193A JP2010079762A JP2010079762A JP2011210193A JP 2011210193 A JP2011210193 A JP 2011210193A JP 2010079762 A JP2010079762 A JP 2010079762A JP 2010079762 A JP2010079762 A JP 2010079762A JP 2011210193 A JP2011210193 A JP 2011210193A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- editing
- word
- condition
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】機械翻訳装置は翻訳対象原文の指定見出し語、翻訳文の指定訳語、指定見出し語に対応する翻訳文の訳語および指定訳語に関する対応条件、対応条件を満たす場合に翻訳文の訳語を置換すべき置換訳語の項目を有する編集条件を設定した編集条件ファイルに基づき、翻訳文を構成する各語句と翻訳対象原文との各語句の対応付けが行われた対訳文において、翻訳対象原文に編集条件ファイルの指定見出し語と一致する語句が存在する場合に翻訳文から前記指定見出し語に対応する訳語を抽出し、抽出された訳語と編集条件ファイルの指定訳語とが対応条件を満たす場合に訳語を置換訳語に置換する。
【選択図】図2
Description
う)により記述された原文を、自動的に第2自然言語(以下、単に第2言語という)に翻
訳する機械翻訳装置が実現化されている。しかしながら、自然言語については、いまだに
意味解析技術が十分確立されていないため、高い確率の正確な訳文を得ることは達成でき
ていない。そのため、機械翻訳装置によって得られる翻訳文をそのまま使用せずに、ユー
ザが適切な編集処理を施す必要性がある。
うため、同じ原文語句の訳語は統一される。この点が機械翻訳装置の利点の一つとされて
いる。しかしながら、同じ一文書の翻訳においても、同じ原文語句に対して同じ訳語が得
られないことがある、または、同じ訳語を希望しない場合は、希望する訳文が得られない
という問題がある。その原因の一つ目として、翻訳用例を用いた翻訳が挙げられる。
で表記された文(以下、翻訳文という)が登録された翻訳用例データベース(DB)が用
いられる。そして、翻訳対象である原文が入力されると、その原文に類似する翻訳用例原
文(以下、類似用例原文という)を翻訳用例DBから検索する。検索された類似用例原文
と翻訳対象原文との相違箇所を語句単位で判定する。その差分に対応する類似用例対訳文
の語句を判定し、その語句に対応する訳語で置換することにより翻訳文を作成するもので
ある。この場合、差分に対応する語句は、機械翻訳装置内の翻訳辞書を使用して翻訳され
る。また、差分以外の語句は、翻訳用例DB内の類似用例対訳文の語句を使用して翻訳さ
れる。そのため、上記に述べたように翻訳辞書の訳語と異なることがある。
S認知症複合症」と翻訳される。この時、「AIDS dementia complex」の翻訳用例の訳文
語句では「AIDS痴呆複合症」と登録されているとすると、類似用例を使用して翻訳さ
れる文と、翻訳辞書を使用して翻訳される文の訳文では、「AIDS dementia complex」の
訳語が異なって出力されることになる。
訳者が分担し編集を行う場合が挙げられる。すなわち、翻訳者によって同じ原文語句に対
して採用する訳語が異なるため訳語が不統一になる。
方法が提案されている。
訳文に対して、この原文中の編集対象単語の変更を指示し、その指示された所定単語が存
在するすべての原文を検索し、検索された所定単語の訳語を変更指示された訳語に翻訳す
るという方法がある。
第1単語分割テーブル、第2単語分割テーブルを作成する。作成した結果に対し、翻訳辞
書を利用して原文の単語と翻訳文の単語を対応付けて対応関係決定テーブルを作成する。
作成した対応関係決定テーブルから翻訳文の単語との対応関係が不統一の原文の単語を抽
出し、抽出結果に基づいて警告情報テーブルを作成し警告情報を表示画面に表示するとい
う方法がある。
ユーザが置き換えたい訳語を翻訳辞書登録し、この原文語句の形態素を含むすべての文章
を検索して、訳文中におけるこの原文語句の訳語を上述した翻訳辞書登録に登録した訳語
で置換するという方法がある。
自動的に編集を行うが、編集処理部の処理対象の原文語句が複数ある場合に、一つずつ訳
語を指定登録しなければならないという問題がある。
統一作業はユーザがリストを見ながら一文ごとに手動で行わなければならないという問題
がある。
登録作業を繰り返さなければならないとともに、翻訳辞書を編集するため機械翻訳の質が
変化するという問題がある。
一括して行うことを可能とする機械翻訳装置および機械翻訳プログラムの提供を目的とす
る。
編集を行う機械翻訳装置であって、少なくとも翻訳対象原文の指定見出し語と、前記翻訳
文の指定訳語と、前記指定見出し語に対応する前記翻訳文の訳語および前記指定訳語に関
する対応条件と、前記対応条件を満たす場合に前記翻訳文の訳語を置換すべき置換訳語と
の項目から構成される編集条件を設定した編集条件ファイルを格納する情報記憶部と、前
記翻訳対象原文および前記翻訳文の構文解析を行い、前記翻訳対象原文を構成する各語句
と前記翻訳文を構成する各語句との対応付けを行う構文解析部と、前記翻訳対象原文にお
いて前記編集条件ファイルの前記指定見出し語と一致する語句を検索し、一致する語句が
存在する場合に、前記構文解析部による前記対応付けの結果に基づいて前記翻訳文から前
記指定見出し語に対応する訳語を抽出する検索抽出部と、抽出された前記訳語および前記
指定訳語が前記編集条件ファイルの前記対応条件を満たす場合に前記訳語を前記置換訳語
に置換する訳語編集部とを備えることを特徴とし、
本発明に係る機械翻訳プログラムは、少なくとも翻訳対象原文の指定見出し語と、前記翻
訳文の指定訳語と、前記指定見出し語に対応する前記翻訳文の訳語および前記指定訳語に
関する対応条件と、前記対応条件を満たす場合に前記翻訳文の訳語を置換すべき置換訳語
との項目から構成される編集条件を設定した編集条件ファイルを参照して、第1言語の翻
訳対象原文を第2言語に翻訳した翻訳文の編集を行う機械翻訳装置の機械翻訳プログラム
であって、前記翻訳対象原文と前記翻訳文の構文解析の結果に基づいて前記翻訳対象原文
を構成する各語句と前記翻訳文を構成する各語句とが対応付けられた前記翻訳文に対し前
記編集条件ファイルに基づいて編集処理を行う場合に、前記翻訳対象原文に前記編集条件
ファイルの前記指定見出し語と一致する語句が存在する場合に、前記構文解析の結果に基
づいて前記翻訳文から前記指定見出し語に対応する訳語を抽出し、抽出された前記訳語お
よび前記指定訳語が前記編集条件ファイルの前記対応条件を満たす場合に前記訳語を前記
置換訳語に置換する処理を前記機械翻訳装置に実行させることを特徴とする。
ことを可能とする。
図1は、本実施形態に係る機械翻訳装置10のハードウェア構成を示すブロック図であ
り、図2は、本実施形態に係る機械翻訳装置10の構成を示すブロック図である。まず、
図1を参照して本実施形態に係る機械翻訳装置10のハードウェア構成について説明する
。
ムがインストールされ、その機械翻訳プログラムが演算制御装置11のプロセッサ12に
おいて実行されることにより実現される。
算を行うものである。メモリ13には翻訳に関する機械翻訳プログラム14が記憶され、
プロセッサ12により処理が実行される際には作業エリア15が用いられる。演算制御装
置11の演算結果等は出力装置である表示装置21に表示出力される。演算制御装置11
には、演算制御装置11の演算結果や翻訳に必要な知識・規則を蓄積した翻訳辞書などの
各種データベースを記憶するハードディスクドライブ(HDD)16が設けられている。
ここでは、メモリ13に機械翻訳プログラム14が既に記憶されているとして説明するが
、プログラム起動時にハードディスクドライブ16に格納されている機械翻訳プログラム
14がメモリ13にローディングされるものである。
18、マウス19、ディスクドライブ20から構成される。キーボード18とマウス19
は、表示装置21を介して演算制御装置11に各種指令を入力する。キーボード18と、
ディスクドライブ20は、機械翻訳処理に関連する文書などを入力する。
。
る。すなわち、プロセッサ12が機械翻訳プログラム14を実行することで、演算制御装
置11は各機能ブロックとして動作することになる。また、図2の情報記憶部60は、図
1の演算制御装置11内のメモリ13およびハードディスクドライブ16の記憶領域に対
応する。
条件ファイルを受付け、情報記憶部60に記憶するものである。例えば、ユーザがキーボ
ード18等を用いて直接入力したデータや、ディスクドライブ20を介して入力されたデ
ータを受付け、情報記憶部60に記憶する。
、編集後処理部70による翻訳文の編集を行う際に用いるシステムメニュー画面、および
編集の結果等を出力装置30に出力するものである。例えば、出力装置30としては、図
1の表示装置21が該当する。出力装置30は、表示装置21だけでなく、表示装置21
による出力に代え、あるいは加え、音声による音声出力装置に出力するようにしてもよい
。また、印刷装置に印刷出力するようにしてもよいし、ディスクドライブ20を介して記
憶媒体に出力するようにしてもよい。
例原文と翻訳用例訳文とからなる翻訳用例が予め登録された翻訳用例辞書63を用いて入
力装置17により入力された翻訳対象原文を翻訳し、翻訳文を作成するものである。
、機械翻訳辞書61、機械翻訳規則62、翻訳用例辞書63、編集条件ファイルデータベ
ース(DB)64を制御するものである。
。編集後処理部70は、翻訳された翻訳文の編集処理を行うものである。編集処理につい
ては、後ほど詳しく説明する。
ファイルDB64を有する。機械翻訳辞書61、機械翻訳規則62、翻訳用例辞書63は
、翻訳処理部40が翻訳処理を行う際に用いられるものである。編集条件ファイルDB6
4は、後述する編集条件ファイルを登録するものである。
施形態に係る全体の処理を示すフローチャートである。
0は機械翻訳辞書61、機械翻訳規則62、翻訳用例辞書63を用いて入力された翻訳対
象原文の翻訳処理を実行して翻訳文を作成する(ステップS2)。そして、作成した翻訳
文と入力された翻訳原文とからなる対訳文に対して訳語統一などの編集処理を行う(ステ
ップS3)。訳語統一の編集処理については、後ほど詳しく記載する。
。すなわち、翻訳処理部40は、入力装置17により入力された翻訳対象原文に類似する
類似用例原文を翻訳用例辞書63から検索する。次に、検索された翻訳対象原文と類似用
例原文との相違箇所(以下、差分という)を語句単位で判定する。
語で置換することにより、対訳文を作成する。なお、翻訳処理方法はこれに限定せず、翻
訳対象原文に対して形態素解析を行い機械翻訳辞書61と機械翻訳規則62に沿って翻訳
してもよい。
説明する。図4は、本実施形態に係る編集条件ファイルDB64のデータ構造の一例一例
を示す図であり、ここでは5つの条件を記述した編集条件ファイル81のデータ構造を例
示する。編集条件ファイル81は、編集後処理部70が対訳文に対し訳語統一の編集処理
を行う際の編集条件が設定されるものである。編集条件とは、訳語統一を行う対象の第1
言語の語句「指定見出し語」、指定見出し語に対応する翻訳文の訳語と照合する訳語であ
る「指定訳語」、指定見出し語に対する翻訳文中の訳語と「指定訳語」とに関する条件で
ある「対応条件」、指定見出し語に対応する翻訳文中の訳語と「指定訳語」との対応関係
が「対応条件」を満たす場合に指定見出し語に対応する翻訳文中の訳語と置換する「置換
訳語」とからなる。編集条件ファイルDB64の条件は、翻訳者によって訳語統一に必要
なものが随時登録される。また、不要になったものは削除される。
理対象の語句を指定する「指定見出し語」83と、「「指定訳語」84と、指定訳語と翻
訳文中の指定見出し語に対応する訳語とに関する条件である「対応条件」85と、利用者
が指定見出し語に対する訳語として指定する「置換訳語」86の項目からなる。他の条件
2乃至条件n(nは登録された数)も同じ構成である他の条件2乃至条件n(nは登録さ
れた数)も同じ構成である。すなわち、各条件1乃至条件nは、「翻訳対象原文中に指定
見出し語83に登録される語句が存在する場合、その語句に対応する翻訳文中の訳語と指
定訳語84とを照合し、その結果が対応条件85に登録される対応条件を満たしていれば
、その対応する翻訳文中の訳語を置換訳語86に登録される訳語に変更する」という意味
である。
が「AIDS dementia complex」、指定訳語84が「AIDS認知症複合症」、対応条件8
5が「NOT」、置換訳語86が「AIDS認知症複合症」である。すなわち、指定見出
し語83「AIDS dementia complex」を含む翻訳対象原文の翻訳結果において、指定見出
し語83「AIDS dementia complex」に対応する訳語が指定訳語84の「AIDS認知症
複合症」と訳されていない(「対応条件85:NOT」を満たす)場合、その訳語を置換
訳語86に設定される「AIDS認知症複合症」に置き換えるという編集条件が設定され
ていることを表す。
rporate governance」、指定訳語84が「企業統治」、対応条件85が「YES」、置換
訳語86が「コーポレート・ガバナンス」である。すなわち、指定見出し語83「corpor
ate governance」を含む翻訳対象原文の翻訳結果において、指定見出し語83「corporat
e governance」に対応する訳語が指定訳語84の「企業統治」と訳されている(「対応条
件85:YES」を満たす)場合、その訳語を置換訳語86である「コーポレート・ガバ
ナンス」に置き換えるという編集条件が設定されていることを表す。
rket research」、指定訳語84が「調査」、対応条件85が「INCLUDE」、置換
訳語86が「マーケット・リサーチ」である。すなわち、指定見出し語83「market res
earch」を含む翻訳対象原文の翻訳結果において、指定見出し語83「market research」
に対応する訳語が例えば「**調査」と訳されており、指定訳語84の「調査」の語句を
含む(対応条件85:「INCLUDE」を満たす)場合、その訳語を置換訳語86に設
定される「マーケット・リサーチ」に置き換えるとう編集条件が設定されていることを表
す。
rtual reality」、指定訳語84が「リアリティ」、対応条件85が「EXCLUDE」
、置換訳語86が「バーチャル・リアリティ」である。すなわち、指定見出し語83「vi
rtual reality」を含む翻訳対象原文の翻訳結果において、指定見出し語83「virtual r
eality」の訳語が例えば「バーチャル現実」と訳されており、指定訳語84「リアリティ
」の語句を含んでいない(対応条件85:「EXCLUDE」を満たす)場合、その訳語
を置換訳語86に設定される「バーチャル・リアリティ」に置き換えるという編集条件が
設定されていることを表す。
ndcraft」、指定訳語84が「手工芸品」、対応条件85が「YES」、置換訳語86は
「(なし)」である。この条件5では、置換訳語86に訳語が設定されていないため、編
集処理にて訳語を自由に設定可能とするものである。すなわち、指定見出し語83「hand
craft」を含む翻訳対象原文の翻訳結果において、指定見出し語83「handcraft」に対応
する訳語が指定訳語84の「手工芸品」と訳されている(対応条件85:「YES」を満
たす)ものを検索抽出し、抽出された訳語を編集処理の「条件更新処理」で翻訳者が入力
した訳語に置き換えるという編集条件が設定されていることを表す。「条件更新処理」に
ついては、後述する。
処理部70による訳語統一の編集処理について、図5を用いて説明する。図5は、本実施
形態における訳語統一の編集処理を示すフローチャートである。
集条件ファイルの入力方法は、あらかじめ編集条件ファイルDB64に登録したものを選
択するという方法を用いてもよい。ステップS20に続いて、編集後処理部70の構文解
析部71は、図3のステップ1において入力された翻訳対象原文と、図3のステップ2の
翻訳結果として得られた翻訳文とに対して形態素解析処理、構文解析処理を行う(ステッ
プS21)。
れの文を構成する単語列、各語の品詞・活用の種類、構文に関する情報を取得する。そし
て、この解析結果を用いて翻訳対象原文の各語句と翻訳文における各語句とを対応づけを
行う(ステップS22)。ここでは、編集後処理部70に構文解析部71を設けるとした
が、翻訳処理部40での構文解析、形態素解析をそのまま使用してもよい。
イル81に登録されている指定見出し語(83)に一致する語句を抽出する(ステップS
23)。検索抽出部72は、指定見出し語(83)に一致する語句を抽出した場合(ステ
ップS24のYes)、ステップS22の結果を用いて、抽出した指定見出し語(83)
に一致する語句に対する訳語を翻訳文中から検索する(ステップS25)。
1に登録されている指定訳語(84)とを照合すると共に、対応条件(85)の条件を満
たしているかを判定する。訳語編集部73は、照合の結果が対応条件を満たす場合(ステ
ップS26のYes)、検索した訳語を編集条件ファイル81の指定訳語(86)に登録
されている訳語に置き換える(ステップS27)。
、「条件更新処理」により指定訳語(85)を新たに設定した場合、その編集条件ファイ
ル81を編集条件ファイルDB64に登録し(ステップS28)、編集処理を終了する。
翻訳対象原文中から指定見出し語(83)に一致する語句が抽出されなかった場合(ステ
ップS24のNo)、および指定見出し語に対応する訳語と指定訳語(84)とが対応条
件(85)を満たしていない場合(ステップS26のNo)、編集処理を終了する。
1乃至条件n)毎に行ってもよいし、複数の編集条件を同時に指定して行ってもよい。
の対応関係の情報を持っていないので、その解析が必要である。
辞書63が適用された訳文のステップS21の動作について説明する
図7は、表1に示した類似用例原文と類似用例訳文に対して、図5のステップS21で
の形態素解析処理と構文解析処理を行った解析結果の一例を表すツリー構造図である。丸
い実線で囲まれた語句は、形態素解析処理によって得られた文を構成する各単語を示す。
そして、これらの各単語をつなぐ線によって各単語同士の構文上のつながりを示した図を
ツリー図と呼ぶ。
を行う。これによって、翻訳対象原文、翻訳用例原文、翻訳用例訳文の文を構成する単語
列、各単語の品詞・活用の種類・訳語ほか、翻訳処理に必要な各種情報、そして構文構造
を得る。これらの情報を用いて、翻訳対象原文と翻訳用例原文の差分の対応付けを行い、
翻訳用例原文と翻訳用例訳文の中のどの語句とどの語句が対応しているかの対応付けを行
う。更に、この結果を用いて、翻訳対象原文と翻訳用例原文の差分が、翻訳用例訳文のど
の語句に対応しているかの対応付けを行う。
は、形態素解析、構文解析済みの翻訳用例原文と翻訳用例訳文において実施する。形態素
解析、構文解析済み後の翻訳用例原文と翻訳用例訳文の状態を図7に示す。
言語(日本語)の訳語候補として存在する訳語の候補のリストである。複数あるものは、
コンマで区切って列挙している。上記判定処理を以下に説明する。
中で「TW」属性を含む単語を探し、見出し語に対応する訳語を対応候補として抽出する
。複数存在すれば、複数候補のペアを抽出する。
句と一致するかどうかをチェックし、一致するものがあれば対応候補として抽出する。複
数存在すれば複数候補のペアを抽出する。
語句として確定する。また、片方の構造中の1つの語句が他方の構造では2つ以上の連続
語句に一致する場合等、語句数が一致しないケースでも対応語句として抽出する。
られているような場合は、他の対応語句候補と解析結果中での直接的修飾関係や、修飾関
係の交差の有無や、部分構造中での他の対応語句候補との共存関係をもとに、より可能性
の高い対応関係を選択し、あいまい性を解消する。
文の解析結果構造と第2言語文の解析結果構造との中で、構造的に連続している部分の検
出を行う。
用いて、図5のステップS23以降の訳語統一の編集処理について説明する。
訳文の行番号を示す行番号810と、一文単位の翻訳対象原文820と、その翻訳対象原
文の翻訳である翻訳文830とからなる。この対訳文800は、図5のステップS21、
ステップS22の処理が行われており、翻訳文中の各語句と翻訳対象原文中の各語句は既
に対応付けられている。
)を検索する。そして、翻訳対象原文に指定見出し語(83)と一致する語句が存在する
と、その語句に対する訳語を抽出する。
に示す。図9には、指定見出し語と一致する語句が抽出された対訳文の行番号91と、抽
出された語句(=指定見出し語)92と、その語句に対する翻訳文中の訳語93とが示さ
れている。
指定訳語(84)とを照合し、対応条件(85)を満たしているかを判断する。対応条件
(85)を満たしている場合は、図9の訳語93に代えて図4の置換訳語(86)に設定
された訳語に置換する。 すなわち、図8の行番号21の対訳文800においては、図4
の編集条件ファイル81の条件2の指定見出し語83「corporate governance」に一致す
る語句が抽出されており、その訳語93は「企業統治」である。従って、訳語編集部73
は、行番号21の翻訳文830が図4の編集条件ファイル81の条件2に設定されている
編集条件(対応条件(85):「Yes」)に一致すると判断して、その訳語93「企業
統治」を置換訳語(86)に登録されている「コーポレート・ガバナンス」に置換する。
出し語83「market research」に一致する語句が抽出されており、その訳語93は「市
場調査」である。従って、訳語編集部73は、行番号28の翻訳文830が図4の編集条
件ファイル81の条件3に設定された編集条件(対応条件(85):「INCLUDE」
)を満たすと判断し、その訳語93の「市場調査」を置換訳語(86)に登録されている
「マーケット・リサーチ」に置換する。
出し語83「handcraft」に一致する語句が抽出されており、その訳語93は「手工芸品
」である。この条件5の場合、訳語編集部73は、図4の編集条件ファイル81の条件5
の「置換訳語」86の設定がないことを判断して、翻訳者に置換訳語の入力を促す処理(
「条件更新処理」)を実行するように動作する。即ち、表示装置21に条件5の内容を表
示して、置換訳語の入力を促す。翻訳者は、入力装置17より置換訳語(例えば、「手芸
品」)を入力すると、翻訳文の「手工芸品」は「手芸品」に全て置き換えられる。その後
、条件更新処理を行った条件5の編集条件ファイルを編集条件ファイルDB64に更新登
録し、編集処理を終了する。
れた対訳文における文に対し訳語統一の再編集を行い、訳語統一の再編集により指定した
再指定訳語を編集条件ファイルに更新したものを登録してもよい。その際、制御部59に
より、訳語統一の編集処理が行われた対訳文は情報記憶部60に記憶される。
す対訳文を、更に図4に示す訳語統一の編集条件ファイル81に基づいて訳語統一処理し
た後の対訳文を示す画面である。図11は、編集処理後の対訳文に対し訳語統一の再編集
を行い、再編集内容に基づいて編集条件ファイル81を更新する処理を示すフローチャー
トである。
。図10の画面において、翻訳文830の中で再編集を行いたい訳語を指定して、新たな
訳語を手入力し、「編集完了」ボタン840をクリックする。すると、対訳文の訳語統一
が再実行されると共に訳語編集部73によって、編集条件ファイル81を更新する処理が
行われる。図11は、訳語編集部73による編集条件ファイル処理を示す。
た直後の翻訳文と、「編集完了」ボタン840をクリックした際の翻訳文(再編集を行っ
た訳文)とを比較し(ステップS31)、変更があったかをチェックする。変更が無い場
合(ステップS32のNo)、処理を終了する。変更がある場合(ステップS32のYe
s)、変更箇所を特定する(ステップS33)。特定した変更箇所の語句が編集条件ファ
イル81に記載された指定見出し語(83)に対応する訳語であるかをチェックする。指
定見出し語(83)に対応する訳語であれば(ステップS34のYes)、再編集を行っ
た訳文の変更箇所の語句を、この指定見出し語(83)が登録された編集条件の置換訳語
(85)に登録する(ステップS35)。
」を指定して、入力装置17からの手入力により「市場リサーチ」に変更して、「編集完
了」ボタン840をクリックしたとする。すると、訳語編集部73は、情報記憶部60に
記憶された訳語統一処理が行われた後の翻訳文と、「編集完了」ボタン840をクリック
した時の変更された翻訳文とを比較し、変更語句があるか否かを検索する。本例では、「
マーケット・リサーチ」が変更語句であると特定される。そしてこの「マーケット・リサ
ーチ」は、編集条件ファイル81の条件番号「3」の指定見出し語83“market researc
h ”の訳語であることが判別される。したがって、訳語編集部73は、編集条件ファイル
81の条件「3」における指定訳語を「マーケット・リサーチ」から「市場リサーチ」に
更新する。また、訳語編集部73は、訳語統一処理が行われた翻訳文から「マーケット・
リサーチ」を検索して、「市場リサーチ」に更新して訳語統一の再編集を行ってもよい。
最後に、更新した編集条件ファイル81を編集条件ファイルDB64へ格納する。
用いて訳語統一を一括に行うことができるため、ユーザが一語句ずつ手動で編集を行う必
要がない。また、登録された編集条件ファイルを次回以降の編集の際に流用することも可
能であるため、毎回同じ条件ファイルを作成する必要もない。そのため、作業効率を向上
することができる。
械翻訳辞書に追加もしくは上書き登録するわけではないため、機械翻訳の質を変化させず
に編集を行うことができる。また、編集条件ファイルを更新することや対訳文の再編集を
編集条件ファイルに反映することで、編集条件ファイルを最新の状態に保つことができる
と共に次の同様な処理の際に流用できるため、作業効率が向上する。
0が翻訳処理し作成した対訳文を用いて編集処理を行っている例を示しているが、すでに
作成された対訳文を用いて編集処理を行う構成にしてもよいし、翻訳対象原文とすでに翻
訳された翻訳文を入力装置17から入力し、一文ずつ対応づけて対訳文を作成して編集処
理を行ってもよい。
次に、本発明の第2の実施形態に係る機械翻訳装置について図12乃至図16を参照し
て説明する。本実施形態が第1の実施形態と異なる点は、編集後処理部70に編集条件作
成更新部74を新たに設けた点にある。第1の実施形態の各部と同一部分は同一符号で示
し、重複する説明は省略する。
図である。本実施形態における機械翻訳装置10は、編集後処理部70内に編集条件作成
更新部74を備えている。編集条件作成更新部74は、訳語統一の処理に用いる編集条件
ファイル81を新規に作成する機能を有する。また、入力装置17により入力された編集
条件ファイル81もしくはあらかじめ編集条件ファイルDB64に登録された編集条件フ
ァイル81に対し訳語統一の編集条件を更新する機能を有する。本実施例における機械翻
訳装置10は、編集条件作成更新部74によって作成された編集条件ファイル81を用い
て対訳文の編集処理を行う。編集条件作成更新部74による編集条件作成・更新処理につ
いて、図13乃至図16を用いて説明する。
トである。
は出力処理部31を介して出力装置30の表示装置21にメニュー画面が表示する(ステ
ップS100)。図14には、メニュー画面200を示す。翻訳者は、このメニュー画面
200を用いて編集条件入力指令を入力する。
ーに表示された「訳語編集」ボタン210をクリックする。すると、表示装置21には、
図15に示す編集条件入力画面300が表示される(ステップS110)。翻訳者は入力
装置17のマウスを操作して、編集条件入力画面300を用いて、編集条件の入力を行う
(ステップS120)。
し語」の入力欄310、「指定訳語」の入力欄320、「対応条件」の選択欄330、「
置換訳語」の入力欄340、「編集条件ファイル選択」の欄350、「作成・更新」ボタ
ン360が表示されている。対応条件とは例えば、「NOT」、「Yes」、「INCL
UDE」、「EXCLUDE」である。なお、これらのいずれも対応条件として用いるこ
とができる。また、「NOT」と「Yes」のみから選択するようにしてもよい。
ce」、「指定訳語」の入力欄320に「大蔵省」、「置換訳語」の入力欄340に「財務
省」がそれぞれ入力され、「対応条件」の選択欄330に「YES」が選択された条件が
設定されている。
ァイル選択」の欄350に「新規ファイル」を入力し、編集条件入力画面300中の「作
成・更新」ボタン360をクリックする。すると、新規に作成した編集条件ファイル81
が登録入力され、訳語統一の編集条件ファイルとして利用される(ステップS140)。
1への追加編集を行う場合(ステップS130のNo)、「編集条件ファイル選択」欄3
50を用いて編集条件ファイルDB64から編集条件ファイル81を選択し(ステップS
150)、「作成・更新」ボタン360をクリックする(ステップS160)。すると選
択した編集条件ファイル81に入力された編集条件が追加・更新される。
について、図16を参照して説明する。図16は、本発明の実施形態に係る編集条件作成
更新部74の条件追加・更新処理を示すフローチャートである。
集条件を取得する(ステップS51)。取得した編集条件の指定見出し語がステップS1
50において選択した編集条件ファイル81に存在するか否かを検索する。すなわち、取
得した編集条件の指定見出し語が存在する場合(ステップS52のYes)、取得した編
集条件で編集条件ファイル81に設定された編集条件を上書き更新する(ステップS53
)。取得した編集条件の指定見出し語と条件が存在しない場合(ステップS52のNo)
、取得した編集条件を編集条件ファイル81に追加する(ステップS54)。
成した編集条件ファイル81は、編集条件ファイルDB64に登録される。
作成し作成した編集条件ファイルを用いて対訳文の訳語統一処理を一括に行うことでユー
ザの負担を軽減できる。また、編集条件ファイルDB64に登録されている編集条件ファ
イルに訳語統一条件を追加することによって容易に最適な編集条件ファイルを作成するこ
ともできるため作業効率を向上することができる。
のではなく種目々の変形が可能である。例えば、本実施形態においては入力装置17にお
いて、翻訳対象原文と編集条件ファイルを入力するとしているが、対訳文も入力してよい
。その場合、翻訳処理部において翻訳対象原文の翻訳処理が省略される。また、本実施形
態においては翻訳処理部において翻訳用例を用いて翻訳処理を行っているが、翻訳用例を
使用せずに翻訳を行ってもよい。
るが、翻訳時に行われている場合もあるためその場合は行わなくてもよい。また、機械翻
訳を行う際に翻訳用例を用いる場合は、翻訳用例原文、翻訳用例訳文に対しても形態素解
析と構文解析を行う必要がある。また、本実施形態においては入力された原文を翻訳して
対訳文を生成する構成となっているが、すでにある対訳文を本システムに読み込んで使用
する構成にしてもよい。
械翻訳規則62に沿って翻訳するのもよいし、翻訳用例辞書63を使用して用例翻訳を行
ってもよい。また、編集処理部70による編集処理は翻訳完了後に自動的に行われる構成
にしてもよい。
訳語統一処理が可能となる。分野ごとの編集を行う方法として、編集条件ファイルに記載
する編集条件として「医学」、「科学」、「心理学」などの分野情報の項目を記載しても
よい。この場合、訳語統一処理を行う際、翻訳時に行う翻訳環境設定において選択した翻
訳環境(分野)が一致する場合に、編集条件が使用される。
空欄(なし)の場合は、すべての分野での訳語統一処理にこの条件が使用される。これよ
り、訳語統一処理を行う際に、編集条件にある分野情報と翻訳する際の分野情報との照合
を行い、分野情報が一致した訳語のみの編集を行うことができる、すなわち、異なる訳語
分野ごとの編集処理を行うことが可能となる。
記憶された翻訳環境に関する情報と関連付けて登録してもよい。この場合、翻訳環境と分
野は1対1の関係にある。
・13、プログラム・・・14、作業エリア・・・15、ハードディスクドライブ・・・
16、入力装置・・・17、キーボード・・・18、マウス・・・19、ディスクドライ
ブ・・・20、表示装置・・・21、入力処理部・・・22、出力処理部・・・31、翻
訳処理部・・・40、制御部・・・50、情報記憶部・・・60、機械翻訳辞書・・・6
1、機械翻訳規則・・・62、翻訳用例辞書・・・63、編集条件ファイルデータベース
・・・64、編集後処理部・・・70、構文解析部・・・71、検索抽出部・・・72、
訳語編集部・・・73、編集条件作成更新部・・・74、編集条件ファイル・・・81、
条件番号・・・82、指定見出し語・・・83、指定訳語・・・84、対応条件・・・8
5、置換訳語86、メニュー画面・・・200、訳語編集ボタン・・・210、編集条件
入力画面・・・300、「指定見出し語」入力欄・・・310、「指定訳語」入力欄・・
・320、「対応条件」選択欄・・・330、「指定訳語」入力欄・・・340、「編集
条件ファイル選択」欄・・・350、「作成・更新」ボタン・・・360、対訳文の表・
・・800、行番号・・・810、「翻訳対象原文」欄・・・820、「翻訳文」欄・・
・830
Claims (12)
- 第1言語の翻訳対象原文を第2言語に翻訳した翻訳文の編集を行う機械翻訳装置であっ
て、
少なくとも翻訳対象原文の指定見出し語と、前記翻訳文の指定訳語と、前記指定見出し
語に対応する前記翻訳文の訳語および前記指定訳語に関する対応条件と、前記対応条件を
満たす場合に前記翻訳文の訳語を置換すべき置換訳語との項目から構成される編集条件を
設定した編集条件ファイルを格納する情報記憶部と、
前記翻訳対象原文および前記翻訳文の構文解析を行い、前記翻訳対象原文を構成する各語
句と前記翻訳文を構成する各語句との対応付けを行う構文解析部と、
前記翻訳対象原文において前記編集条件ファイルの前記指定見出し語と一致する語句を
検索し、一致する語句が存在する場合に、前記構文解析部による前記対応付けの結果に基
づいて前記翻訳文から前記指定見出し語に対応する訳語を抽出する検索抽出部と、
抽出された前記訳語および前記指定訳語が前記編集条件ファイルの前記対応条件を満た
す場合に前記訳語を前記置換訳語に置換する訳語編集部と、
を備えることを特徴とする機械翻訳装置。 - 前記訳語編集部は、
前記対応条件として、前記指定訳語と前記訳語が同じであることを指定する第1の条件
を満たす場合、前記訳語を前記置換訳語に置換することを特徴とする請求項1に記載の機
械翻訳装置。 - 前記訳語編集部は、
前記対応条件として、前記指定訳語と前記訳語が異なることを指定する第2の条件を満
たす場合、前記訳語を前記置換訳語に置換することを特徴とする請求項1に記載の機械翻
訳装置。 - 前記訳語編集部は、
前記対応条件として、前記指定訳語が前記訳語に含まれていることを指定する第3の条
件を満たす場合、前記訳語を前記置換訳語に置換することを特徴とする請求項1に記載の
機械翻訳装置。 - 前記訳語編集部は、
前記対応条件として、前記指定訳語が前記訳語に含まれていないことを指定する第4の
条件を満たす場合、前記訳語を前記置換訳語に置換することを特徴とする請求項1に記載
の機械翻訳装置。 - 入力部を備え、
前記訳語編集部は、
前記編集条件において、前記指定見出し語、前記指定訳語、前記対応条件が設定されて
おり、前記置換訳語が設定されていないことを判定した場合、前記翻訳文から前記指定見
出し語に対応する訳語が抽出された際に前記置換訳語の入力を促し、前記訳語を入力され
た訳語に置換することを特徴とする請求項1に記載の機械翻訳装置。 - 入力部を備え、
前記入力部から入力された編集条件に基づき前記編集条件ファイルを作成又は更新する
編集条件作成更新部を備えることを特徴とする請求項1に記載の機械翻訳装置。 - 前記編集条件作成更新部は
前記入力部から入力された前記編集条件を前記記憶部に記憶された前記編集条件ファイ
ルに追加または上書き更新して前記情報記憶部に登録することを特徴とする請求項7に記
載の機械翻訳装置。 - 前記編集条件を構成する項目には分野情報を含むことを特徴とする請求項1に記載の機
械翻訳装置。 - 前記分野情報と前記指定見出し語に対応する前記訳語の分野情報が一致する編集条件の
みを用いて編集を行うことを特徴とする請求項9に記載の機械翻訳装置。 - 入力部を備え、
前記訳語編集部は、
前記編集条件ファイルを用いて編集を行なった前記翻訳文の訳語の再指定訳語が入力さ
れた場合、前記編集条件ファイルの前記置換訳語を前記再指定訳語に更新する
ことを特徴とする請求項1に記載の機械翻訳装置。 - 少なくとも翻訳対象原文の指定見出し語と、前記翻訳文の指定訳語と、前記指定見出し
語に対応する前記翻訳文の訳語および前記指定訳語に関する対応条件と、前記対応条件を
満たす場合に前記翻訳文の訳語を置換すべき置換訳語との項目から構成される編集条件を
設定した編集条件ファイルを参照して、第1言語の翻訳対象原文を第2言語に翻訳した翻
訳文の編集を行う機械翻訳装置の機械翻訳プログラムであって、
前記翻訳対象原文と前記翻訳文の構文解析の結果に基づいて前記翻訳対象原文を構成す
る各語句と前記翻訳文を構成する各語句とが対応付けられた前記翻訳文に対し前記編集条
件ファイルに基づいて編集処理を行う場合に、
前記翻訳対象原文に前記編集条件ファイルの前記指定見出し語と一致する語句が存在す
る場合に、前記構文解析の結果に基づいて前記翻訳文から前記指定見出し語に対応する訳
語を抽出し、
抽出された前記訳語および前記指定訳語が前記編集条件ファイルの前記対応条件を満た
す場合に前記訳語を前記置換訳語に置換する処理を前記機械翻訳装置に実行させるための
機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010079762A JP2011210193A (ja) | 2010-03-30 | 2010-03-30 | 機械翻訳装置および機械翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010079762A JP2011210193A (ja) | 2010-03-30 | 2010-03-30 | 機械翻訳装置および機械翻訳プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011210193A true JP2011210193A (ja) | 2011-10-20 |
Family
ID=44941142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010079762A Pending JP2011210193A (ja) | 2010-03-30 | 2010-03-30 | 機械翻訳装置および機械翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011210193A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016194822A (ja) * | 2015-03-31 | 2016-11-17 | 株式会社エクシング | サーバシステム及びそのプログラム、並びにエラーチェック方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143591A (ja) * | 1991-11-18 | 1993-06-11 | Ricoh Co Ltd | 文書作成装置 |
JPH06176059A (ja) * | 1992-12-02 | 1994-06-24 | Fujitsu Ltd | 機械翻訳における後編集装置 |
JPH08161338A (ja) * | 1994-12-05 | 1996-06-21 | Fujitsu Ltd | 機械翻訳装置 |
JP2008226115A (ja) * | 2007-03-15 | 2008-09-25 | Toshiba Corp | 機械翻訳装置 |
-
2010
- 2010-03-30 JP JP2010079762A patent/JP2011210193A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143591A (ja) * | 1991-11-18 | 1993-06-11 | Ricoh Co Ltd | 文書作成装置 |
JPH06176059A (ja) * | 1992-12-02 | 1994-06-24 | Fujitsu Ltd | 機械翻訳における後編集装置 |
JPH08161338A (ja) * | 1994-12-05 | 1996-06-21 | Fujitsu Ltd | 機械翻訳装置 |
JP2008226115A (ja) * | 2007-03-15 | 2008-09-25 | Toshiba Corp | 機械翻訳装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016194822A (ja) * | 2015-03-31 | 2016-11-17 | 株式会社エクシング | サーバシステム及びそのプログラム、並びにエラーチェック方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3969628B2 (ja) | 翻訳支援装置、方法及び翻訳支援プログラム | |
JP4504555B2 (ja) | 翻訳支援システム | |
JP2006268375A (ja) | 翻訳メモリシステム | |
JP4113235B2 (ja) | 翻訳支援装置 | |
US20070203691A1 (en) | Translator support program, translator support device and translator support method | |
JP2011210193A (ja) | 機械翻訳装置および機械翻訳プログラム | |
JP2011210194A (ja) | 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造 | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5148583B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP5016333B2 (ja) | 文書作成支援装置及び文書作成支援プログラム | |
JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP3999771B2 (ja) | 翻訳支援プログラム、翻訳支援装置、翻訳支援方法 | |
JP3294966B2 (ja) | 機械翻訳装置 | |
JP4087829B2 (ja) | 結合価辞書拡張装置、方法、およびプログラム | |
JP4081109B2 (ja) | 機械翻訳装置 | |
JPH11282844A (ja) | 文書作成方法および情報処理装置および記録媒体 | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JPH0785243B2 (ja) | 文編集処理装置 | |
JP2006268621A (ja) | 機械翻訳プログラム、機械翻訳装置 | |
JPH04158477A (ja) | 機械翻訳装置 | |
JPH05342253A (ja) | 辞書構築支援装置及び辞書構築支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111128 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121109 |