JP2006178682A - 機械翻訳装置、機械翻訳プログラム及びその機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

機械翻訳装置、機械翻訳プログラム及びその機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2006178682A
JP2006178682A JP2004370148A JP2004370148A JP2006178682A JP 2006178682 A JP2006178682 A JP 2006178682A JP 2004370148 A JP2004370148 A JP 2004370148A JP 2004370148 A JP2004370148 A JP 2004370148A JP 2006178682 A JP2006178682 A JP 2006178682A
Authority
JP
Japan
Prior art keywords
corrected
text
translated
translation
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004370148A
Other languages
English (en)
Other versions
JP4134983B2 (ja
Inventor
Hiroko Nozawa
裕子 野沢
Hanayo Imagawa
華代 今川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2004370148A priority Critical patent/JP4134983B2/ja
Publication of JP2006178682A publication Critical patent/JP2006178682A/ja
Application granted granted Critical
Publication of JP4134983B2 publication Critical patent/JP4134983B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 翻訳作業効率を向上させる。
【解決手段】 S20で、原文A1に続いて訂正原文A2が入力され、訂正原文A2についてS21で翻訳命令がされると、S22で翻訳され、表示部に訂正訳文B2が表示される。S23では、訂正原文A2より前に原文A1があるか否かが判別され、原文A1があれば、S24で、原文A1の訳文B1があるか否かが判別される。ここで訳文B1があれば、S25で、訂正原文A2が原文A1の手直しか否かが判別され、手直しであれば、S26で、原文A1と訂正原文A2とに手直しフラグを付与し、S27で訳文B1と訂正訳文B2とに互いの差分を識別表示する。
【選択図】 図5

Description

本発明は、入力された第一言語による原文を所定の第二言語による訳文に翻訳する機械翻訳装置と機械翻訳プログラム、そして、その機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
機械翻訳装置は、入力された第一言語(例えば日本語)の原文を、第二言語(例えば英語)による訳文に自動的に翻訳するものであるが、多くの場合、翻訳結果をそのまま使用することなく、ユーザが翻訳結果をチェックして、適切な訳文でなければこれを人手で修正する作業が必要となっている。具体的には、訳文を直接修正するか、或いは第一言語の原文を手直しして再度翻訳させるかして、適切な訳文を得るようにしている。
以下、本明細書では、先に入力された第一言語文を原文、その翻訳文を訳文、原文を訂正した第一言語文を訂正原文、その翻訳文を訂正訳文と言う。
こうした訂正原文から訂正訳文を得る再翻訳作業は、どのような原文を入力すればどのような訳文が得られるかという機械翻訳装置のいわゆる癖がユーザに理解できる上、この再翻訳作業を機械翻訳装置に学習保存することで、次回に同じような原文を翻訳する際に最初から適切な訳文を得やすくなるというメリットがあるため、よく行われる。しかし、比較する原文と訂正原文とが長いのに相違箇所が少ないような場合には、原文と訂正原文との相違箇所がわかりにくくなり、再翻訳のチェックに要する作業時間が長くなってしまう。
そこで、特許文献1には、原文と訂正原文との相違する部分を抽出して差分情報を生成し、表示された差分情報の内容に基づいて、差分が閾値よりも大きい場合には訂正原文を機械翻訳し、閾値よりも小さい場合には、原文と訂正原文及びその差分情報と訳文とを表示して、訂正訳文の入力を受け付けることで、翻訳チェックを効率良く行おうとする翻訳支援装置の発明が開示されている。
特開平8−297675号公報
しかし、特許文献1の翻訳支援装置においては、原文と訂正原文との相違は認識しやすくなるものの、差分が小さい場合は、訳文を参考にしてユーザ自らが訂正原文に対応する訂正訳文を改めて入力し直す必要が生じる。また、訂正原文を機械翻訳しても、原文の手直しによって得られた訂正訳文が訳文からどう変わったかが依然としてわかりにくく、再翻訳を利用した翻訳チェック作業には不向きであった。
そこで、本発明は、このような再翻訳を利用した翻訳チェック作業を行う場合に、訳文と訂正訳文との相違を容易に認識可能として、翻訳作業の効率を向上させ得る機械翻訳装置、機械翻訳プログラム及び、そのプログラムを記録させたコンピュータ読み取り可能な記録媒体を提供することを目的としたものである。
上記目的を達成するために、請求項1に記載の発明は、少なくとも第一言語による原文を入力する入力手段と、前記入力手段により入力された原文を辞書を用いて第二言語による訳文に翻訳する翻訳手段と、少なくとも前記入力手段により入力された原文と前記翻訳手段により翻訳された訳文とを表示する表示手段とを備えた機械翻訳装置であって、前記表示手段に原文と訳文とが表示されている場合に、前記入力手段により前記原文が訂正された訂正原文が入力された際に、前記訂正原文と原文とを比較して、前記訂正原文が前記原文の手直しに該当するか否かを判別する判別手段と、前記判別手段により前記原文の手直しに該当すると判断された際には、前記翻訳手段により前記訂正原文が翻訳された訂正訳文と、前記原文が翻訳された訳文とを比較して、両者の差分を識別表示する識別表示手段とを備えたことを特徴とする。
請求項2に記載の発明は、請求項1の目的に加えて、前記翻訳手段により翻訳された第二言語による訳文を第一言語に逆翻訳する逆翻訳手段を備えたものにおいても同様に翻訳作業の効率向上を図るために、前記判別手段は、前記入力手段により前記訳文が訂正された訂正訳文が入力された際に、前記訳文と訂正訳文とを比較して、前記訂正訳文が前記訳文の手直しに該当するか否かを判別し、前記識別表示手段は、前記判別手段により前記訳文の手直しに該当すると判断された際には、前記逆翻訳手段により前記訂正訳文が逆翻訳された再訂正原文と前記訳文が逆翻訳された再原文とを比較して、両者の差分を識別表示する構成としたものである。
請求項3に記載の発明は、請求項1又は2の目的に加えて、前記判別手段による手直しの判断を適切に行うために、前記判別手段は、前記原文と訂正原文、又は訳文と訂正訳文とが以下のうち少なくとも1の関係を有する場合に、手直しと判別する構成としたものである。
(1)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字の数が所定数以下である。
(2)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字が表記の相違のみである。
(3)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、その順序のみが相違する。
(4)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語同士が同義語として辞書に記憶されている関係にある。
(5)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語の数が所定数以下である。
請求項4に記載の発明は、請求項1乃至3の何れかの目的に加えて、翻訳チェックの終了後には識別表示を確実に消去するために、前記識別表示手段は、前記原文及び訳文の文章対と前記訂正原文及び訂正訳文の文章対との何れか一方が選択されて他方が削除される際、或いは前記訳文及び再原文の文章対と前記訂正訳文及び再訂正原文の文章対との何れか一方が選択されて他方が削除される際には、前記差分の識別表示を解除する構成としたものである。
上記目的を達成するために、請求項5に記載の発明は、入力手段によって入力された第一言語による原文を、辞書を用いて翻訳手段により第二言語による訳文に翻訳し、前記原文及び訳文を表示手段に表示しながら翻訳処理をコンピュータに実行させるための機械翻訳プログラムであって、前記表示手順の実行後、訂正された訂正原文が入力された際には、先に入力された原文と訂正原文とを比較して、前記訂正原文が前記原文の手直しに該当するか否かを判別する判別手順と、前記判別手順において前記原文の手直しに該当すると判断された際には、前記翻訳手段により前記訂正原文が翻訳された訂正訳文と前記原文が翻訳された訳文とを比較して、両者の差分を識別表示する識別表示手順とを備えたことを特徴とする。
請求項6に記載の発明は、請求項5の目的に加えて、前記翻訳手段により翻訳された第二言語による訳文を前記辞書を用いて第一言語に逆翻訳する逆翻訳手順を備える機械翻訳プログラムにおいても同様に翻訳作業の効率向上を図るために、前記判別手順では、前記入力手段により前記訳文が訂正された訂正訳文が入力された際に、前記訳文と訂正訳文とを比較して、前記訂正訳文が訳文の手直しに該当するか否かを判別し、前記識別表示手順では、前記判別手順により前記訳文の手直しに該当すると判断された際には、前記逆翻訳手順により前記訂正訳文が逆翻訳された再訂正原文と前記訳文が逆翻訳された再原文とを比較して、両者の差分を識別表示する構成としたものである。
請求項7に記載の発明は、請求項5又は6の目的に加えて、前記判別手順における手直しの判断を適切に行うために、前記判別手順では、前記原文と訂正原文、又は訳文と訂正訳文とが以下のうち少なくとも1の関係を有する場合に、手直しと判別するものである。
(1)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字の数が所定数以下である。
(2)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字が表記の相違のみである。
(3)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、その順序のみが相違する。
(4)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語同士が同義語として辞書に記憶されている関係にある。
(5)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語の数が所定数以下である。
請求項8に記載の発明は、請求項5乃至7の何れかの目的に加えて、翻訳チェックの終了後には識別表示を確実に消去するために、前記識別表示手順の実行後、前記原文及び訳文の文章対と前記訂正原文及び訂正訳文の文章対との何れか一方が選択されて他方が削除される際、或いは前記訳文及び再原文の文章対と前記訂正訳文及び再訂正原文の文章対との何れか一方が選択されて他方が削除される際には、差分の識別表示を解除する識別表示解除手順をコンピュータに実行させる構成としたものである。
そして、上記目的を達成する請求項9に記載の発明は、請求項5乃至8の何れかに記載の機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体である。
請求項1及び5に記載の発明によれば、原文を手直しした訂正原文を翻訳した場合、訳文と訂正訳文とに夫々差分が識別表示されるため、ユーザは、手直しによって翻訳結果がどう変わるかを一目で知ることができ、適切な翻訳チェックを迅速に行うことが可能となって翻訳作業効率が向上する。
特に、訳文と訂正訳文とを同時に比較できることで、原文をどう変更するとどのように翻訳されるかという機械翻訳の特性(癖)をユーザが把握しやすくなるため、使い勝手が良くなり、以後の翻訳作業の質の向上も期待できる。
請求項2及び6に記載の発明によれば、上記効果に加えて、逆翻訳を行って翻訳チェックを行う場合も、ユーザは、手直しによって逆翻訳結果がどう変わるかを一目で知ることができるため、同様に翻訳作業効率の向上に繋がる。
請求項3及び7に記載の発明によれば、上記効果に加えて、手直しの判断を適切に行うことができる。
請求項4及び8に記載の発明によれば、上記効果に加えて、翻訳チェックを終了して適切な文章対を選択する際には、識別表示を確実に消去することができ、識別表示の消去忘れがなくなる。
そして、請求項9に記載の発明によれば、前記記録媒体を読み込むことで本発明を容易に実現して上記効果を奏することができる。
以下、本発明の実施の形態を図面に基づいて説明する。
[機械翻訳装置の構成]
図1は、本発明の機械翻訳装置の一例を示す機能ブロック図で、機械翻訳装置1は、CPUやROM、RAM、HDD等を備え、翻訳等の処理を行うデータ処理部2と、キーボードやマウス等を備え、データ処理部に翻訳対象の原文や各種動作指令等を入力する入力部3と、CRT等を備え、入力された原文や翻訳後の訳文等を表示する表示部4と、レーザープリンタ等を備え、表示部に表示された文章等を印刷出力する印刷部5とを備えている。
データ処理部2では、入力文や翻訳結果文の誤字や脱字等をチェックし必要に応じて編集する編集部6と、編集部6で編集された入力文を翻訳処理する翻訳部7とがROMに格納したプログラムによって構成されると共に、翻訳処理に利用される辞書(翻訳辞書やユーザ辞書等)8が、HDDに格納されて備えられている。翻訳部7では、入力文を形態素に分割する形態素解析部9、入力文の構文的な構造を明らかにする構文解析部10、入力文を目標言語文に変換する変換部11、目標言語文の構造を生成する構文生成部12、目標言語文を形態的に整える形態素生成部13が夫々構成されている。
また、データ処理部2では、翻訳部7で得られた翻訳結果を後述するように翻訳チェック処理可能な翻訳チェック部14が、ROMに格納したプログラムによって構成されている。
ここで、入力部3は入力手段を構成する。また、表示部4は表示手段を構成し、後述する翻訳処理では表示手順の実行に伴って動作する。さらに、データ処理部2内の翻訳部7は、翻訳手段及び逆翻訳手段を構成し、後述する翻訳処理では翻訳手順及び逆翻訳手順を実行する。そして、翻訳チェック部14は、判別手段及び識別表示手段を構成し、後述する翻訳チェック処理では判別手順及び識別表示手順、さらには識別表示解除手順を実行する。
[通常の翻訳処理の説明]
このように構成された機械翻訳装置1において、例えば「向日葵が太陽に向かって咲いている。」と入力部から入力すると、図2(A)に示すように、表示部4の予め設定された表示エリアに当該日本語文(原文A1)が表示される。ここで、表示部4に表示された図示しない翻訳ボタンをクリック等して翻訳命令を入力すると、翻訳部7が原文A1を翻訳し、原文A1に対応して設定された訳文の表示エリアに、「A sunflower goes to the sun,and it is blooming.」と翻訳文(訳文B1)が表示されることになる。
この翻訳は、図3に示す手順で行われる。この手順を説明すると、ステップ1(単に「S1」と略記する。他のステップも同じ。)でまず原文A1が入力され、S2で翻訳命令がされると、形態素解析部9で形態素解析がスタートする(S3)。これは、入力された原文A1について、見出し語として登録可能な所定文字数の文字列を文頭から切り出し、それを検索キーワードとして辞書8を検索して該当する単語があるか否かを調べるものである。ここでは、S4で先にユーザ辞書を検索し、S5の判別で該当する単語がない場合は、S6で翻訳辞書を検索する。S7の判別で翻訳辞書にも該当する単語がない場合は、S8で未知語として処理し、S11以降の処理を行う。
図4は、この形態素解析で使用される情報が格納されている状態の模式図で、(A)が各見出し語の辞書情報、(B)が活用形の情報で、その他、接続情報(例えば格助詞は名詞の直後にくる、接続助詞は活用語の直後にくる等の単語の接続ルールに係る情報)等も格納される。例えば、「向日葵」は、「ヒマワリ」を見出し語(代表単語)として、異形語「ひまわり」及び「向日葵」が格納されていることから、この異形語の「ひまわり」「向日葵」の何れがあっても同じ単語とみなされる。同じく異形語がある「居る」「刈り取る」についても見出し語で比較される。形態素解析では、これらの情報を使用して、品詞等の属性を対応づけた単語(形態素)に夫々区切るものである。
ユーザ辞書と基本辞書との何れかに該当する単語がある場合(S5,S7の何れかでYES)は、S9において前後の単語との接続チェックを行う。S10の判別で接続チェックがOKであれば、S11で入力文を単語に分割して、検索した単語の辞書情報を各単語に付与し、形態素解析を終了する(S12)。S10で接続チェックが不可(例えば助詞が連続している等)であれば、S8で未知語として処理した後、S11以降の処理を行う。
次に、S13では構文解析部10において、形態素解析によって得られた単語の並びを解析プログラムによって解析し、単語を句にまとめたり、主語や目的語の係り先を決める等して、入力文のツリー構造を作成する。その後、S14では変換部11において、解析結果に基づき、ユーザ辞書及び翻訳辞書を参照しながら各単語に英訳を施す。そして、英訳された文は、S15で構文生成部12において、辞書を参照しながらS13で作成されたツリー構造に基づいて訳文のツリー構造を作成し、正しい構文を生成する。次にS16では、形態素生成部13で語尾変化等の調整を行って翻訳を終了し、訳文B1を表示部4において表示する(S17)。
[翻訳チェック処理の説明]
こうして翻訳が終了した後、ユーザは得られた訳文B1が適切か否かをチェックする。訳文B1が適切でない場合、ユーザは、訳文B1を直接修正する他、原文A1を手直しした文(訂正原文)を再度翻訳し、得られた新たな訳文(訂正訳文)を訳文B1と比較して所望の訳文を採用する作業を行うことがある。この場合、翻訳チェック部14においては、原文と訂正原文とを比較して、訂正原文が原文の手直しに該当するか否かを判別し、手直しに該当すると判断された訂正原文が再翻訳された際には、訳文と訂正訳文とを比較して両者の差分を識別表示する翻訳チェック処理を実行する。以下、この翻訳チェック処理の手順を図5のフローチャートで説明する。
まず、S20で、図2(B)に示すように、原文A1に続いて「太陽に向かって向日葵が咲いている。」という訂正原文A2が入力されたとする。この訂正原文A2についてS21で翻訳命令がされると、S22で翻訳部7において図3と同様の手順で翻訳され、表示部4において、「A sunflower is blooming toward the sun.」と訂正訳文B2が表示される。
そして、S23では、翻訳された訂正原文A2より前に入力文(原文A1)があるか否かが判別される。ここで原文A1がなければ翻訳チェックは終了するが、原文A1があるので、S24で、原文A1の翻訳結果(訳文B1)があるか否かが判別される。ここで訳文B1がなければ翻訳チェックは終了するが、訳文B1があるので、S25で、訂正原文A2が原文A1の手直しか否かが判別され(判別手順)、手直しであれば、S26で、原文A1と訂正原文A2とに手直しフラグを付与し、S27で訳文B1と訂正訳文B2とに互いの差分を夫々識別表示する(識別表示手順)。この識別表示は、図2(B)に示すように、訳文B1の差分「goes to the sun,and it is blooming」と、訂正訳文B2の差分「is blooming toward the sun」とを他の部分と異なる色(例えば白)の四角枠内で抜き表示する反転表示Sである。
S25における訂正原文A2が原文A1の手直しか否かの判断は、図6のフローチャートに示す手順で行われる。
まず、S30で、原文A1と訂正原文A2とを比較して、訂正原文A2が原文A1と異なる文字数をカウントして変数Cに保存する。この文字数のカウントは、diff等の差分プログラムを用いた周知の差分抽出技術によって行えば良い。ここでは単純に異なる文字数をカウントする他、ひらがなとカタカナ等の表記違いを変換マトリックスで認識することでカウントしないようにすることもできる。
次に、S31において、比較終了後の変数が10を下回るか否かを判別する。ここで10を下回る数であれば、S32で手直しと判断される。また、S31の判別において、変数が10以上であれば、S33で原文A1と訂正原文A2とを形態素解析して、存在する単語(形態素)を比較する。存在する単語が同じであれば(S34でYES)、S32で手直しと判断され、存在する単語が同じでなくても、S35で形態素解析において異なる単語の数をカウントし、S36の判別でカウントされた変数Wが3を下回ると、S32で手直しと判断され、変数Wが3以上であれば、原文A1と訂正原文A2とは非類似(手直しでない)と判断される。
S33〜S35における原文A1と訂正原文A2との形態素解析による比較は、図7のフローチャートに示す手順で行われる。
まず、S40で原文A1を形態素解析し、S41でその形態素解析の結果から単語ごとに切り出して保存する。次にS42で訂正原文A2を形態素解析して、S43で異なる単語数を0にリセットする。S44では、訂正原文A2の形態素解析の結果から単語を1つずつ取り出して、原文A1の形態素解析結果の単語と比較していく。
よって、S45の判別で一致する単語があれば、S46でまだ単語があるか否かが判別され、S45の判別で一致する単語がなければ、S47で異なる単語としてカウントされる。このS44からS47までの処理が、全ての単語で行われ(S46の判別で単語がなくなれば終了)、その比較結果が図6のS34,S36で判別されることになる。従って、形態素解析によれば、語順の違いだけであれば全ての単語が一致するため、手直し文となる。この場合、形態素解析辞書で吸収できる異形語や表記の相違(例えば図4で示した「ヒマワリ」と「向日葵」、「刈り取る」と「刈りとる」等)も同じ単語と判断される。
このようにして手直しと判断された原文A1と訂正原文A2との夫々の翻訳結果である訳文B1と訂正訳文B2との差分を図5のS27で識別表示した後、ユーザは、表示された訳文B1と訂正訳文B2とを比較して、何れか一方の原文とその訳文との文章対を選択し、他方の文章対を削除することになる。よって、S28で削除する文章対が選択されると、S29では、削除される原文に手直しフラグがあるか否かが判別される。当該原文に手直しフラグがあれば、次のS30では、削除される原文の前後に手直しフラグのある原文があるか否かが判別される。つまり、手直し文が入力されて差分が識別表示されている文章対が二組あることが確認される。そして、この確認後、S31では、手直しフラグのある原文A1及び訂正原文A2に対する訳文B1及び訂正訳文B2の識別表示を通常表示に戻した後、S32で削除命令がされた文章対が削除される。図2(C)は、訂正原文A2と訂正訳文B2との文章対を残したものであるが、その後、続いて新たな訂正原文A3「黄色い大きな花だ。」を入力した場合も同様に訂正原文A2(今度はこれが原文となる)との間で手直しか否かの判断がなされ、手直しと判断されない場合は、訂正訳文B3「It is a big yellow flower.」と、これの訳文となる訂正訳文B2「A sunflower is blooming toward the sun.」とは通常表示となる。
[機械翻訳装置の効果]
このように、上記形態の機械翻訳装置1によれば、表示部4に原文と訳文とが表示されている場合に、入力部3により訂正原文が入力された際には、原文と訂正原文とを比較して、訂正原文が原文の手直しに該当するか否かを判別する判別手段と、その判別手段により原文の手直しに該当すると判断された際には、訳文と訂正訳文とを比較して、両者の差分を識別表示する識別表示手段とを備えたことで、ユーザは、手直しによって翻訳結果がどう変わるかを一目で知ることができ、適切な翻訳チェックを迅速に行うことが可能となって翻訳作業効率が向上する。
特に、訳文と訂正訳文とを同時に比較できることで、原文をどう変更するとどのように翻訳されるかという機械翻訳プログラムの特性(癖)をユーザが把握しやすくなるため、使い勝手が良くなり、以後の翻訳作業の質の向上も期待できる。
また、識別表示手段では、原文及び訳文の文章対と訂正原文及び訂正訳文の文章対との何れか一方が選択されて他方が削除される際には、差分の識別表示を解除する構成としているため、文章対の選択の際には識別表示を確実に消去でき、識別表示の消去忘れがなくなる。
[変更例の説明]
なお、本発明は上記実施の形態に限定するものではなく、本発明の趣旨を逸脱しない範囲で種々の形態での実施が可能である。以下、主な変更例について説明する。
まず、上記形態では、原文を翻訳して訳文を得た際に、訂正原文を翻訳してその訂正訳文を訳文と比較して翻訳の適否をチェックするものとなっているが、機械翻訳装置が、例えば原文である日本語文を英文に翻訳した後、その英文を再び日本語文へ逆翻訳できる逆翻訳手段を有する場合がある。
例えば、図8(A)に示すように、「私は昨日彼女が出かけたことを知った。」との原文A1に対して、「I knew that she went out yesterday.」との訳文B1が出力され、この訳文B1のチェックのためにこれを逆翻訳して、「私は彼女が昨日出かけたことを知った。」という再原文A2を得たとする(同図(B))。この訳文B1では、「昨日」の係りについて、原文A1が「私が昨日知ったこと」を意図していても、再原文A2のように「彼女が昨日出かけたこと」ととられる可能性があり、訳文B1が適正ではないことになる。
そこで、訳文B1を手直しして、「Yesterday I knew that she went out.」と訂正訳文B2を入力し、これを逆翻訳すると、「昨日私は彼女が出かけたことを知った。」と再訂正原文A3が得られる(同図(C))。よって、原文A1と同趣旨の文であることが確認され、訂正訳文B2が選択されることになる。
このような逆翻訳手段の実行の際にも、本発明が適用できる。すなわち、図9に示すように、S50で訂正訳文B2が入力されてS51で逆翻訳命令がされ、S52で翻訳がされて再訂正原文A3が表示されると、訂正訳文B2より前に訳文B1とその逆翻訳文である再原文A2とがあることを確認した後(S53,54の判別でYES)、S55で訂正訳文B2が訳文B1の手直しか否かが判別され、手直しであれば、S56で両訳文に手直しフラグを付与した後、S57で訂正訳文B2を逆翻訳した再訂正原文A3と再原文A2とに互いの差分を識別表示(図8(C)の反転表示S)するものである。S58以下の文章対を選択して削除する場合の処理は、訳文の手直しフラグを確認する以外は図5のS28以下の処理と同じで、手直しか否かの判断も、図6,7のように異なる文字数や形態素数を比較して判断することができる。
よって、このような逆翻訳を利用した場合にも、差分が識別表示された再訂正原文A3と再原文A2とを比較することで翻訳の適否を容易に判断でき、翻訳チェックを迅速に行うことができる。特に、訳文をどう変更するとどのように逆翻訳されるかをユーザが把握しやすくなるため、使い勝手が良くなる。
また、上記形態の機械翻訳装置では、訂正原文の入力とその翻訳(逆翻訳の場合は訂正訳文の入力とその逆翻訳)とに伴って自動的に手直しか否かの判断と識別表示とがされるようになっているが、キーボードやマウスでの所定の入力操作によってユーザの所望するタイミングで手直しか否かの判断と識別表示とを行うようにして、翻訳チェック処理の選択を可能としても良い。
さらに、識別表示は、上記形態のような反転表示によるものに限らず、点滅表示、アンダーライン、文字の大きさや字体の変更、枠や括弧で囲む、印を付記する等、目視できる態様であれば種々選択可能で、複数種の識別表示を併用して差分の長さ等によって使い分けることもできる。
一方、原文と訂正原文(逆翻訳の場合は訳文と訂正訳文)との間の手直しの判断において、異なる文字数や単語数の閾値は、上記形態に限らず適宜増減可能である。具体的な手直しの判断方法も、上記形態に限らず、原文と訂正原文、又は訳文と訂正訳文とが、相違する文字の数が所定数以下の関係、相違する文字が表記の相違のみの関係、単語で分割した場合にその順序のみが相違する関係、単語で分割した場合に相違する単語同士が同義語として辞書に記憶されている関係、単語で分割した場合に相違する単語の数が所定数以下である関係、のうちの少なくとも1を選択して採用すれば、適切な手直しの判断は可能である。
但し、相違する文字の数の比較による差分抽出は、先の文に比べて後の文が短いと、全く異なる文でも手直しと判断されるおそれがあるため、少なくとも異なる単語で分割した形態素数の比較は採用するのが望ましい。
また、手直しの判断には、このような相違する文字数や形態素数のカウントによる他、文章全体の文字数や形態素数に占める異なる文字数や形態素数の割合を演算し、その差分率を閾値と比較して手直しか否かを判断する手法も考えられる。但し、異なる文字数のカウントのみによる場合と同様に、文章が短い場合は、差分率が大きくなって手直しと判断されにくくなるため、この差分率の比較によるものに、異なる文字数のカウントによるものと形態素数のカウントによるものとの少なくとも一方を組み合わせて、実数による比較を併用する方が好ましい。
そして、上記形態では、翻訳チェック処理に係る翻訳プログラムはROMに格納して読み込むようにしているが、HDD等の外部記憶装置に格納し、必要時にRAMに読み込んで使用するようにしても良い。その他、光ディスク(CD−ROM、CD−R/RW、DVD−ROM等)や磁気ディスク(MOやFD等)といったコンピュータ読み取り可能な記録媒体に記録して、対応するドライバで読み込んで使用することもできる。また、外部ネットワークとの通信手段を備えた機械翻訳装置であれば、機械翻訳プログラムをインターネット等のネットワーク上からダウンロードすることによって同様の翻訳チェック処理を行うことも可能である。勿論得られる効果は上記形態と同様である。
その他、本発明の機械翻訳装置は、上記形態のような専用品に限らず、例えば汎用のパーソナルコンピュータシステムにおいても、上記記録媒体やネットワーク上から本発明に係る機械翻訳プログラムを得ることによって同様に実現可能である。
機械翻訳装置の機能ブロック図である。 表示部での表示状態を示す説明図である。 通常の翻訳処理のフローチャートである。 辞書情報の模式図である。 翻訳チェック処理のフローチャートである。 原文の手直し判断のフローチャートである。 形態素解析を利用して単語を比較する手順のフローチャートである。 逆翻訳の場合の表示部での表示状態を示す説明図である。 逆翻訳の場合の翻訳チェック処理のフローチャートである。
符号の説明
1‥機械翻訳装置、2‥データ処理部、3‥入力部、4‥表示部、6‥編集部、7‥翻訳部、8‥辞書、9‥形態素解析部、10‥構文解析部、11‥変換部、12‥構文生成部、13‥形態素生成部、14‥翻訳チェック部。

Claims (9)

  1. 少なくとも第一言語による原文を入力する入力手段と、
    前記入力手段により入力された原文を辞書を用いて第二言語による訳文に翻訳する翻訳手段と、
    少なくとも前記入力手段により入力された原文と前記翻訳手段により翻訳された訳文とを表示する表示手段とを備えた機械翻訳装置であって、
    前記表示手段に原文と訳文とが表示されている場合に、前記入力手段により前記原文が訂正された訂正原文が入力された際に、前記訂正原文と原文とを比較して、前記訂正原文が前記原文の手直しに該当するか否かを判別する判別手段と、
    前記判別手段により前記原文の手直しに該当すると判断された際には、前記翻訳手段により前記訂正原文が翻訳された訂正訳文と、前記原文が翻訳された訳文とを比較して、両者の差分を識別表示する識別表示手段と
    を備えたことを特徴とする機械翻訳装置。
  2. 前記翻訳手段により翻訳された第二言語による訳文を第一言語に逆翻訳する逆翻訳手段を備え、
    前記判別手段は、前記入力手段により前記訳文が訂正された訂正訳文が入力された際に、前記訳文と訂正訳文とを比較して、前記訂正訳文が前記訳文の手直しに該当するか否かを判別し、
    前記識別表示手段は、前記判別手段により前記訳文の手直しに該当すると判断された際には、前記逆翻訳手段により前記訂正訳文が逆翻訳された再訂正原文と前記訳文が逆翻訳された再原文とを比較して、両者の差分を識別表示する請求項1に記載の機械翻訳装置。
  3. 前記判別手段は、前記原文と訂正原文、又は訳文と訂正訳文とが以下のうち少なくとも1の関係を有する場合に、手直しと判別する請求項1又は2に記載の機械翻訳装置。
    (1)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字の数が所定数以下である。
    (2)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字が表記の相違のみである。
    (3)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、その順序のみが相違する。
    (4)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語同士が同義語として辞書に記憶されている関係にある。
    (5)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語の数が所定数以下である。
  4. 前記識別表示手段は、前記原文及び訳文の文章対と前記訂正原文及び訂正訳文の文章対との何れか一方が選択されて他方が削除される際、或いは前記訳文及び再原文の文章対と前記訂正訳文及び再訂正原文の文章対との何れか一方が選択されて他方が削除される際には、前記差分の識別表示を解除する請求項1乃至3の何れかに記載の機械翻訳装置。
  5. 入力手段によって入力された第一言語による原文を、辞書を用いて翻訳手段により第二言語による訳文に翻訳し、前記原文及び訳文を表示手段に表示しながら翻訳処理をコンピュータに実行させるための機械翻訳プログラムであって、
    前記表示手順の実行後、訂正された訂正原文が入力された際には、先に入力された原文と訂正原文とを比較して、前記訂正原文が前記原文の手直しに該当するか否かを判別する判別手順と、
    前記判別手順において前記原文の手直しに該当すると判断された際には、前記翻訳手段により前記訂正原文が翻訳された訂正訳文と前記原文が翻訳された訳文とを比較して、両者の差分を識別表示する識別表示手順と
    を備えたことを特徴とする機械翻訳プログラム。
  6. 前記翻訳手段により翻訳された第二言語による訳文を前記辞書を用いて第一言語に逆翻訳する逆翻訳手順を備え、
    前記判別手順では、前記入力手段により前記訳文が訂正された訂正訳文が入力された際に、前記訳文と訂正訳文とを比較して、前記訂正訳文が訳文の手直しに該当するか否かを判別し、
    前記識別表示手順では、前記判別手順により前記訳文の手直しに該当すると判断された際には、前記逆翻訳手順により前記訂正訳文が逆翻訳された再訂正原文と前記訳文が逆翻訳された再原文とを比較して、両者の差分を識別表示する請求項5に記載の機械翻訳プログラム。
  7. 前記判別手順では、前記原文と訂正原文、又は訳文と訂正訳文とが以下のうち少なくとも1の関係を有する場合に、手直しと判別する請求項5又は6に記載の機械翻訳プログラム。
    (1)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字の数が所定数以下である。
    (2)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字が表記の相違のみである。
    (3)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、その順序のみが相違する。
    (4)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語同士が同義語として辞書に記憶されている関係にある。
    (5)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語の数が所定数以下である。
  8. 前記識別表示手順の実行後、前記原文及び訳文の文章対と前記訂正原文及び訂正訳文の文章対との何れか一方が選択されて他方が削除される際、或いは前記訳文及び再原文の文章対と前記訂正訳文及び再訂正原文の文章対との何れか一方が選択されて他方が削除される際には、差分の識別表示を解除する識別表示解除手順をコンピュータに実行させる請求項5乃至7の何れかに記載の機械翻訳プログラム。
  9. 請求項5乃至8の何れかに記載の機械翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004370148A 2004-12-21 2004-12-21 機械翻訳装置 Expired - Fee Related JP4134983B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004370148A JP4134983B2 (ja) 2004-12-21 2004-12-21 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004370148A JP4134983B2 (ja) 2004-12-21 2004-12-21 機械翻訳装置

Publications (2)

Publication Number Publication Date
JP2006178682A true JP2006178682A (ja) 2006-07-06
JP4134983B2 JP4134983B2 (ja) 2008-08-20

Family

ID=36732749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004370148A Expired - Fee Related JP4134983B2 (ja) 2004-12-21 2004-12-21 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP4134983B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205518A (ja) * 2008-02-28 2009-09-10 Toshiba Corp 機械翻訳する装置および方法
JP2018195248A (ja) * 2017-05-22 2018-12-06 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末及び翻訳表示方法
JP2020187777A (ja) * 2020-07-14 2020-11-19 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末、翻訳表示方法及びプログラム
CN116956946A (zh) * 2023-07-14 2023-10-27 上海一者信息科技有限公司 一种机翻译文细粒度错误类型识别和定位方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
JPH0467265A (ja) * 1990-07-06 1992-03-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH0467264A (ja) * 1990-07-06 1992-03-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH08297675A (ja) * 1995-02-28 1996-11-12 Oki Electric Ind Co Ltd 翻訳支援装置
JP2002041516A (ja) * 2000-07-31 2002-02-08 Brother Ind Ltd 機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを記憶したコンピュータ読み取り可能な記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
JPH0467265A (ja) * 1990-07-06 1992-03-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH0467264A (ja) * 1990-07-06 1992-03-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH08297675A (ja) * 1995-02-28 1996-11-12 Oki Electric Ind Co Ltd 翻訳支援装置
JP2002041516A (ja) * 2000-07-31 2002-02-08 Brother Ind Ltd 機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを記憶したコンピュータ読み取り可能な記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205518A (ja) * 2008-02-28 2009-09-10 Toshiba Corp 機械翻訳する装置および方法
JP2018195248A (ja) * 2017-05-22 2018-12-06 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末及び翻訳表示方法
JP2020187777A (ja) * 2020-07-14 2020-11-19 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末、翻訳表示方法及びプログラム
CN116956946A (zh) * 2023-07-14 2023-10-27 上海一者信息科技有限公司 一种机翻译文细粒度错误类型识别和定位方法

Also Published As

Publication number Publication date
JP4134983B2 (ja) 2008-08-20

Similar Documents

Publication Publication Date Title
US20080133444A1 (en) Web-based collocation error proofing
EP1482414A1 (en) TRANSLATING METHOD, TRANSLATED SENTENCE OUTPUTTING METHOD, RECORDING MEDIUM, PROGRAM, AND COMPUTER DEVICE
JP4134983B2 (ja) 機械翻訳装置
Janssen et al. Improving POS tagging in Old Spanish using TEITOK
JP2011154590A (ja) プログラムおよび情報処理装置
JP6766384B2 (ja) 情報処理装置及びプログラム
JP6565012B2 (ja) 翻訳支援システム
JP2009140056A (ja) 言語知識獲得装置および言語知識獲得プログラム
JPH052605A (ja) 機械翻訳方式
Csernel et al. Critical edition of Sanskrit texts
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2570681B2 (ja) ワード・プロセッサ
JP5337516B2 (ja) 文書処理装置及びプログラム
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JP3692711B2 (ja) 機械翻訳装置
JP2011186507A (ja) 翻訳前換言規則生成システム、翻訳前換言規則生成方法および翻訳前換言規則生成用プログラム
JP4087829B2 (ja) 結合価辞書拡張装置、方法、およびプログラム
JP2005250540A (ja) 換言規則選別装置及び方法、そのためのコンピュータプログラム、並びに当該コンピュータプログラムによりプログラムされたコンピュータ
JPH11265381A (ja) 言語変換方法ならびに装置及び同方法がプログラムされ記録される記録媒体
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JP2007317140A (ja) 文一致度分析装置および方法、ならびに言語変換装置および方法
JP3353873B2 (ja) 機械翻訳装置
JP2004046669A (ja) 自然言語パターン登録装置、自然言語パターン登録方法、自然言語処理装置及び記録媒体
JP2005165652A (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP2009211691A (ja) 翻訳支援システム及びその方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080219

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080507

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080520

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees