JP2009116585A - 機械翻訳装置及び機械翻訳プログラム - Google Patents

機械翻訳装置及び機械翻訳プログラム Download PDF

Info

Publication number
JP2009116585A
JP2009116585A JP2007288571A JP2007288571A JP2009116585A JP 2009116585 A JP2009116585 A JP 2009116585A JP 2007288571 A JP2007288571 A JP 2007288571A JP 2007288571 A JP2007288571 A JP 2007288571A JP 2009116585 A JP2009116585 A JP 2009116585A
Authority
JP
Japan
Prior art keywords
translation
dictionary
language
registered
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007288571A
Other languages
English (en)
Other versions
JP4843596B2 (ja
Inventor
Yasuko Sawada
泰子 澤田
Etsuo Ito
悦雄 伊藤
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2007288571A priority Critical patent/JP4843596B2/ja
Publication of JP2009116585A publication Critical patent/JP2009116585A/ja
Application granted granted Critical
Publication of JP4843596B2 publication Critical patent/JP4843596B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】用例辞書の翻訳用例が適用された訳文であっても、ユーザ辞書に登録された訳語を反映できるようにすることである。
【解決手段】第一の言語と第二の言語の文とを対にした翻訳用例を記録する用例辞書30と、システム辞書に登録されていない語句を第一の言語及び第二の言語で記録するユーザ辞書31と、入力部16で指定された原文を用例辞書30から翻訳用例を検索する用例辞書検索部25と、用例辞書検索部25で検索された翻訳用例の原文中からユーザ辞書の登録語を検索するユーザ辞書検索部26と、翻訳用例の訳文中にユーザ辞書の登録訳語が使用されているか否かを判定しユーザ辞書の登録訳語が使用されていないときは原文及び訳文の該当語句に識別情報を付けて表示部17に表示する翻訳部23とを備える。
【選択図】 図1

Description

本発明は、自然言語による第一言語の文書を他の自然言語の第二言語の文書に変換する機械翻訳装置及び機械翻訳プログラムに関する。
国際化の進行によって、外国語を用いた迅速な情報交換へのニーズが高まっており、情報交換のためのツールとして機械翻訳装置が期待されている。第一言語の文章を第二言語の文章に翻訳する機械翻訳装置においては、原文と訳文とを文の単位で用例辞書に記録し、新たに翻訳する際に、原文を検索キーとして用例辞書を検索し、同一の原文が有った場合には、検索された文と対になっている訳文を翻訳結果として訳出する翻訳用例が利用されている。利用者は、多様化している原文を翻訳するために、ユーザ辞書に第一言語と第二言語との対応する語句を登録したり、用例辞書に翻訳用例を登録して翻訳時に使用している。
ここで、用例辞書を用いて翻訳を行う場合に、訳文の一部として翻訳用例が適用された場合にも、文全体の整合性が保たれるように、人称や時制などを考慮して用例適用文を変形させ翻訳精度を向上させたものがある(特願2006−142448)。また、第一言語例文と第二言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶しておき、翻訳すべき第一言語の原文に類似する第一言語例文を複数組の対訳例文から検索し、原文と検索された対訳例文の第一言語例文との相違箇所を語句単位で判定し、第一言語例文中の相違箇所に対応する第二言語例文の語句を判定し当該語句を原文中の相違箇所の語句に置き換えた合成文を作成し、合成文に含まれる原文中の語句を当該語句に対応する訳語で置換した訳文を作成し、原文、原文に類似する第一言語例文、第一言語例文に対応する第二言語例文、合成文および訳文の少なくともいずれか一つを出力するようにし、用例データベースに基づいて自然で質のよい翻訳を行うことができるようにしたものがある(例えば、特許文献1参照)。
特開2006−11842号公報
しかしながら、翻訳用例の訳文中に、ユーザ辞書に登録されている語句と異なる使い方があった場合であっても、ユーザ辞書の登録語については考慮されず、翻訳用例の訳文がそのまま訳出されている。このため、同一文書中に同じ語句が複数ある場合に訳文の語句が統一されないケースが起こりえる。従って、利用者は訳出された訳文を確認し、ユーザ辞書の登録された語句がある場合には、その都度、訳文の該当箇所の修正を行っている。
このように、ユーザ辞書に登録されている語句と異なる使い方がある場合に、翻訳用例を用いて訳出する場合には、見出し語が同じであってもユーザ辞書の登録語を考慮して訳文を生成していないので、その都度、訳文の該当箇所の修正が必要であった。
本発明の目的は、用例辞書の翻訳用例が適用された訳文であっても、ユーザ辞書に登録された訳語を反映させることができる機械翻訳装置及び機械翻訳プログラムを提供することである。
本発明の機械翻訳装置は、機械翻訳プログラム及び辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力部と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示部と、前記機械翻訳プログラムを演算実行するCPUとを備えた機械翻訳装置において、第一の言語と第二の言語の文とを対にした翻訳用例を記録する用例辞書と、システム辞書に登録されていない語句を第一の言語及び第二の言語で記録するユーザ辞書と、前記入力部で指定された原文を前記用例辞書から前記翻訳用例を検索する用例辞書検索部と、前記用例辞書検索部で検索された前記翻訳用例の原文中から前記ユーザ辞書の登録語を検索するユーザ辞書検索部と、前記翻訳用例の訳文中に前記ユーザ辞書検索部で検索された前記ユーザ辞書の登録訳語が使用されているか否かを判定し前記ユーザ辞書の登録訳語が使用されていないときは原文及び訳文の該当語句に識別情報を付けて前記表示部に表示する翻訳部とを備えたことを特徴とする。
本発明によれば、用例辞書の翻訳用例が適用された訳文であっても、ユーザ辞書に登録された訳語を反映させることができる。従って、翻訳用例を使った翻訳結果と、翻訳用例を使わずにユーザ辞書の訳語だけを使って翻訳した結果とが同一文書にある場合に、同じ用語に対して訳語が不統一になることを回避することができる。
図1は、本発明の実施の形態に係わる機械翻訳装置の構成図である。機械翻訳装置11は、第一言語を第二言語に翻訳して出力するものであり、例えば一般的なコンピュータに機械翻訳プログラムなどのソフトウェアプログラムがインストールされ、そのソフトウェアプログラムがCPU12において実行されることにより実現される。機械翻訳装置11は、CPU12、ROM(Read Only Memory)13及びRAM(Random Access Memory)14がバス15を介して接続されている。バス15には、入力部16、表示部17及び記憶装置19が接続されている。
記憶装置19には、機械翻訳プログラム20が記憶されるとともに辞書部21が記憶される。機械翻訳プログラム20は、制御部22、翻訳部23、用例辞書検索部25、ユーザ辞書検索部26、用例辞書登録部27、ユーザ辞書登録部28を有し、辞書部21には、システム辞書29、用例辞書30、ユーザ辞書31、学習辞書32などが格納されている。
CPU12は、入力部16からの入力信号に基づいてROM13から機械翻訳装置11を起動するためのブートプログラムを読み出して実行し、さらに記憶装置19に記憶された図示省略のオペレーティングシステムを読み出す。CPU12は、入力部16の入力信号に基づいて、各装置の制御を行い、記憶装置19などに記憶された機械翻訳プログラム20及び辞書部21のデータを読み出してRAM14にロードするとともに、RAM14から読み出されたプログラムのコマンドに基づいて、データの計算又は加工など、後述する一連の処理を実現する。
入力部16は、第一言語の原文の文字データやファイルデータ等のデータやコマンドを入力する入力手段であり、通常、キーボードやマウス・タッチパネルなどのポインティングデバイス、音声認識や文字認識機能、あるいは、CDドライブなどの外部記憶媒体読取装置、ネットワーク入力装置などによって実現される。
表示部17は、入力部16から入力されたデータや翻訳結果の出力手段であり、画面や翻訳結果等をCRTや液晶ディスプレイなどの表示装置に表示する場合などがある。
翻訳部23は、辞書部21に格納された自然言語文を解析・翻訳するための知識・情報を用いて、入力部16より入力された自然言語文の形態素解析や構文解析、また第一言語の自然言語文から第二言語の自然言語文への変換などを行う。
システム辞書29は翻訳部23が標準的に使用する辞書であり、基本的な知識・情報が含まれる辞書である。システム辞書29には、語彙部29a、形態素解析規則29b、構文解析規則29c、変換規則29d、構文生成規則29e、形態素生成規則29fなどが格納されている。また、ユーザ辞書31は、語句の見出し語と訳語とを品詞情報などと共に記録するものであり、語彙部31aが格納されている。語彙部29a、31aには、入力原語の見出し語、品詞をはじめとする各種文法属性、見出し語に対応する訳語、訳語の文法属性が定義されている。
用例辞書30には、翻訳用例として使用される原文と訳文との対を記録するものである。学習辞書32は見出し語に対して複数存在する訳語のうち、利用者が訳語を選択した場合などにその情報を記録するものである。
翻訳部23は、辞書部21を使用して原文や訳文を言語解析し翻訳を処理を行うものである。翻訳部23の用例辞書検索部25は、入力部16から検索キーとして指定された原文を用例辞書30から検索し、発見された原文に対応する訳文を取得する。ユーザ辞書検索部26は、指定された原文に含まれる語句をユーザ辞書31から検索し、発見された見出し語に対する訳語を取得する。
そして、翻訳部23は用例辞書検索部25で検出された原文に対応する訳文があった場合には、原文・訳文をそれぞれ言語解析し、原文と訳文との語句の対応関係を取得する。また、解析結果の構成要素をキーとしてユーザ辞書検索部26によりユーザ辞書31から見出し語が検索されると、翻訳部23は、発見された見出し語に対してユーザ辞書31に登録されている訳語と、翻訳用例原文中の当該語句に対応する翻訳用例訳文中の訳語とを比較し、2つの訳語が異なる場合には、異なっている訳語と当該訳語に対応する原文中の語句に識別情報を付与する。
制御部22は、機械翻訳装置11の全体の制御を司るものであり、機械翻訳プログラム20全体の制御や入力部16及び出力部17とのデータの転送を行うものである。すなわち、制御部22は、入力部16からの文章データや入力部16から入力されたコマンドの指示に基づいて翻訳すべき文書を翻訳部23に送ったり、表示部17を呼び出して画面の更新などを行う。
用例辞書登録部27は、翻訳用例を用例辞書30に登録するものであり、ユーザ辞書登録部28は、原文及び訳文を対にして語句をユーザ辞書31に登録するものである。
図2は、本発明の実施の形態に係わる機械翻訳装置の動作を示すフローチャートである。利用者により入力部16から翻訳する文が入力されると、制御部22は入力文を読み込む(S1)。そして、用例辞書検索部25は用例辞書30に原文に対する該当の翻訳用例が格納されているかどうかを検索する(S2)。すなわち、用例辞書検索部25は用例辞書30に原文に対する該当の翻訳用例が格納されているか否かを判定し(S3)、格納されていない場合は、翻訳部23はそのまま通常の翻訳処理を行う(S4)。
一方、用例辞書30に該当する翻訳用例が格納されている場合は、翻訳部23は翻訳用例の原文及び訳文をそれぞれを言語解析する(S5)。そして、ユーザ辞書検索部26は言語解析された原文中の各構成要素についてユーザ辞書31を検索する(S6)。すなわち、翻訳用例の原文中の語句がユーザ辞書31に登録されている語句であるか否かを判定し(S7)、ユーザ辞書31に登録されている語句があれば、その訳語がユーザ辞書31に登録されている訳語と異なる訳語かどうかを判断する(S8)。ユーザ辞書31に登録されている訳語と異なる訳語である場合は、その構成要素番号をRAM14に記録しておく(S9)。
そして、最後の構成要素かどうか判定し(S10)、最後の構成要素でない場合にはステップS6に戻り、ステップS6〜ステップS10の処理を繰り返し行う。このようにして、ユーザ辞書検索部26は、すべての構成要素についてユーザ辞書31の検索を行う。
次に、ユーザ辞書検索部26は、ユーザ辞書31に登録されている訳語と異なる訳語であると記憶された構成要素が一つ以上あるかどうかを判定し(S11)、ユーザ辞書31に登録されている訳語と異なる訳語があった場合には、その語句に識別標識(例えば色情報)を付与し、制御部22は該当語句に識別標識を付けて翻訳結果として表示部17に表示する(S12)。異なる訳語があると記憶された構成要素がなかった場合は、制御部22は翻訳用例の訳文をそのまま表示部17に表示する(S13)。そして、同一文書内のすべての文の最後かどうかを判定し(S14)、最後でない場合にはステップS1に戻り、最後となるまで処理を行う。
次に、翻訳部23に翻訳対象原文が入力されてから、目的言語の訳文を生成するまでの処理の流れを説明する。図3は、翻訳部23の処理内容を示すフローチャートである。
辞書部21は、翻訳処理の各ステップを実行する際に参照される各種情報・知識から構成されている。翻訳部23は、辞書部21中の知識・情報と用例辞書30中の翻訳用例を基に、入力文に対する訳文を生成し表示部17に表示してユーザへの提示を行う。全体の流れとしては、用例辞書30の中に翻訳に使用できる翻訳用例があればそれを元に訳文を生成し、翻訳に使用できる翻訳用例がなければ、辞書部21の知識・情報のみを用いて訳文の生成を行う。
まず、翻訳部23に翻訳対象原文である入力文が送られてくると、翻訳部23は、その入力文に対してシステム辞書部29中の語彙部29aと形態素解析規則29bとを用いて、辞書引き処理・形態素解析を行い、その品詞・活用の種類、訳語ほか、翻訳処理に必要な各種情報を求める(S31)。この結果、入力文を構成する単語の品詞、活用の候補が出力される。
続いて、用例辞書検索部25は、用例辞書30に対して入力文と同じ原文を持つ翻訳用例が蓄積されているかを検出する(S32)。この段階では、形態素解析結果や原文中の各語に対する各種情報が取得されているため、カタカナや送り仮名の表記の揺れや、漢字表記とひらがな表記の揺れ、送り仮名の有無の揺れの情報も取得されている。これらの情報により、完全に入力文と1文字違わず一致した翻訳用例でなくとも、これらの表記の揺れに関する違いについては違いとしては認識しないような揺れの吸収処理が可能である。一方、表記の揺れは吸収しない完全一致の翻訳用例があるときのみ検索成功とする構成も可能である。また、文字・単語上の違いがあっても同値とみなす差異文字数ないしは差異単語数の割合の下限値を設けて検索の可否を制御する構成であってもよい。このような場合は、用例検索のタイミングを形態素解析・辞書引き処理の後にする必要もなく、処理の最初に行う構成でもよい。ステップS32の用例検索の結果が成功であれば(S33)、検索された翻訳用例の訳文を入力文の訳文として生成して処理を終了する。
一方、用例検索の結果が不成功のとき、すなわち、そのまま訳文に利用できる翻訳用例がない場合は、引き続き構文解析処理を行う(S34)。この構文解析処理では、単語、品詞、活用の並びに対して、構文解析規則29cを使って、入力文の構造を解析し原言語の構文構造を構築する。
入力文の構文構造が得られると、変換規則29dを使って原言語の構文構造から目的言語構造への変換処理を行う(S35)。この段階で、目的言語の文としてどのような構文で訳出するか、どのような訳語を出力するかが判定される。続いて、構文生成規則29e、形態素生成規則29fを用いて、目的言語の文の最終的な生成が行われ(S36)、一入力文に対する翻訳処理を終了する。
ステップS36での訳文の生成を終えた状態では、その訳文を構成する単語列の品詞、活用、属性情報などが得られており、また、原文中の構成要素にどの訳文中の語句が対応しているかの情報も得られている。
いま、第一言語が日本語で第二言語が英語であるとし、原文が「車内では携帯電話をお切りください。」であるとする。そして、システム辞書29(日英システム辞書)には、表1に示すように、見出し語である「携帯電話」、「車」、「内」、「切る」に対して、品詞、訳語等が登録されているとする。
Figure 2009116585
表1において、見出し語「車」には、「car」、「train」、「bus」の3つの訳語がある。見出し語「内」には変換規則があり、変換パターンは、構文解析結果である日本語概念構造を英語概念構造へ変換するパターンを定義している。この例では、「〜内で」を前置詞句(advp)に変換することを示している。「1」は自分自身の語を指し、他の数字は周辺の語(数字の宛方は任意)を示す。特定の条件があてはまったときに特定の訳語を定義するときには「アクション」に記述する。
見出し語「切る」についても変換規則があり、「〜が〜を切る」という表現に対し「〜が」は主語(subject)に、「〜を」は目的語(object)に変換することを示す。「電源を切る」ないし「スイッチを切る」という表現であることを条件としている。その際の訳語を「turn off」にすることを示している。括弧の中は活用情報である。「変換パターン」から「アクション」までが1組の変換規則であり、順番に適用にトライして、当てはまるものが1つ見つかれば、変換規則の適用は終了する。
また、日英ユーザ辞書には、表2に示すように、見出し語である「携帯電話」に対して、見出し語品詞、訳語等が登録されているとする。
Figure 2009116585
また、英日システム辞書には表3に示すように、見出し語である「cellular phone」、「switch」に対応する見出し語品詞、訳語等が登録されているとする。
Figure 2009116585
英日システム辞書の場合は英日システム辞書と同様であり、例えば、見出し語「switch」は変換規則を有し、例えば、「switch off〜」を「〜のスイッチを切る」と訳すための規則や、「switch on〜」を「〜のスイッチを入れる」と訳すための規則が定義されている。
さらに、日英翻訳の翻訳用例として用例辞書30には、表4に示すような原文と訳文とが登録されているとする。
Figure 2009116585
従来の機械翻訳装置では、ユーザ辞書31に表2に示すような語句の登録があっても、「車内では携帯電話をお切りください。」という翻訳原文の場合には、翻訳用例がそのまま適用され、その訳文である「Please switch off all cellular phones while on the train.」がそのまま訳出されている。
本発明の実施の形態では、翻訳用例の原文と訳文とのそれぞれに対し、翻訳部23により言語解析し、文の構成要素として対応関係を判定する。
図4は翻訳原文である「車内では携帯電話をお切りください。」を翻訳部23で構文解析まで行った結果に対して、変換規則29dを使って、原文を構成する個々の構成語に対応する訳語情報を付与した結果の一例を示す説明図である。図中、「TW」で示しているのは、原文中の個々の構成語に対応する英語訳語の候補のリストである。複数あるものは、コンマで区切って列挙している。
図5は翻訳用例の訳文である「Please switch off all cellular phones while on the train.」を翻訳部23で解析まで行った結果に対して、変換規則29dを使って、当該訳文を構成する個々の構成語に対応する日本語の訳語情報を付与した結果の一例の説明図である。すなわち、翻訳部23は、第二言語の英語文を構文解析した結果に対して、第一言語文に完全に変換せずに、英語構造のまま対応する日本語訳語を「TW」情報として付与した結果の一例の説明図である。
翻訳用例の原文(第一言語文)、訳文(第二言語文)のそれぞれの解析と構成要素の対応する訳語情報をもとに、対応する要素候補を抽出する処理の流れの概要を以下に示す。
[1]以下の処理を第一言語文の解析結果の各構成要素ごとに行う。
[1-1] 翻訳部23は、第一言語文の見出し語を、第二言語文の解析結果(図5相当)の中でTW候補に含む要素を探し、対応候補として抽出する。複数存在すれば、複数候補のペアを抽出する。対応判定においては、それぞれの見出し語、訳語が完全一致している場合だけでなく、部分的に共通部分を含む箇所を対応する語句としてとらえる。
[1-2] 翻訳部23は、第一言語文の訳語候補の一つが第二言語文の解析結果中の構成要素と一致するかどうかをチェックし、一致するものがあれば対応候補として抽出する。複数存在すれば複数候補のペアを抽出する。
[2]上記[1]の結果、対応関係に重複がなく、ユニークに対応が決まるものは、対応語句として確定する。また、片方の構造中の1つの要素が他方の構造では2つ以上の連続要素に一致する場合など、要素数が一致しないケースでも対応語句として抽出する。
[3]上記[1]の結果、対応関係にあいまい性がある場合、例えば、同じ語が2回用いられているような場合は、他の対応語句候補と解析結果中での直接的修飾関係や、修飾関係の交差の有無や、部分構造中での他の対応語句候補との共存関係をもとに、より可能性の高い対応関係を選択し、あいまい性を解消する。
[4]上記[3]までに対応語句候補が抽出されると、これらの対応語句候補の第一言語文の解析結果構造(図4相当)と第二言語文の解析結果構造(図5相当)との中で、構造的に連続している部分の検出を行う。
図4、図5の例では、[2][3]の結果以下のような語句が対応すると判定される。
(日)車=(英)train
(日)内=(英)on
(日)携帯電話=(英)cellular phone
(日)切る=(英)switch off
次に、ユーザ辞書検索部26は、「車」「携帯電話」「切る」を見出し語とする辞書登録語があるかどうかユーザ辞書31の検索を行う。ユーザ辞書31には「携帯電話」の訳語が「mobile phone」となっているため、訳文の「Please switch off all cellular phones while on the train.」において、「携帯電話」に対応している「cellular phones」の部分に、翻訳部23は識別情報(例えば、色情報)を付けて翻訳結果として表示する。これにより、利用者は、「cellular phones」と異なる訳語がユーザ辞書31に登録されているということを認知できる。
さらに、識別情報(例えば、色情報)の付いた該当語句をユーザがクリックすると、翻訳部23は、辞書登録されている訳語を表示部17に列挙して表示するようにして、入力部16からその表示された訳語のいずれかを選択すると、訳文の該当訳語をユーザ辞書31の登録訳語に置き換える。
以上の説明では、訳文の該当語句に識別情報(例えば、色情報)を付けるようにしたが、訳文の該当語句ではなく、翻訳原文の該当語句に識別情報(例えば、色情報)を付けて利用者に認知させるようにしてもよい。この場合には、適用された翻訳用例の原文を通常の翻訳処理で翻訳し、ユーザ辞書登録語が適用された場合に、その見出し語となった語句に識別情報(例えば、色情報)を付けるものであるので、訳文の形態素解析をする必要がなく処理が簡便となる。つまり、翻訳用例の原文と訳文の対応関係を解析する必要がないので、処理が簡便となる。
また、原文もしくは訳文の該当語句に識別標識(例えば、色情報)を付けて表示するようにしたが、当該語句に対してユーザ辞書登録語を自動で訳文に適用することもできる。この場合は、例えば、ユーザ辞書31からの今までの適用状況(同じ文章中で当該語句に対してユーザ辞書登録語を適用した回数)をRAM14に記録しておき、その回数が一定回数以上の場合には自動適用するように構成してもよい。
さらに、翻訳用例の訳文の信頼度として訳文固定度を翻訳用例に設け、その固定度により、該当訳語をユーザ辞書31の登録訳語に置き換えないようにしてもよい。翻訳用例の訳文の固定度としては、ユーザ自身が設定できるようにしておく。例えば、用例辞書に原文として「That car is a lemon.」、訳文として「あの車は欠陥品だ。」と登録されており、ユーザ辞書31に見出し語として「lemon」、訳語として「れもん」と登録してある場合を考える。この場合、「欠陥品」がユーザ辞書登録語と異なる使い方をしているため置き換えの候補となるが、用例辞書30に対してこの言い回しは変更しないという固定度を設定しておくと、「れもん」は適用されない。
図6は、固定度を含む翻訳用例の一例の説明図である。図6に示すように、翻訳用例に固定度を持たせておき、例えば、この固定度が「0」であるときは、ユーザ辞書31の見出し語に対する訳語への入れ替えを行い、固定度が「1」であるときは、ユーザ辞書31の見出し語に対する訳語への入れ替えを行わないようにする。
また、辞書部21の用例辞書30やユーザ辞書31への翻訳用例や語句の登録の際に、同じ語句が異なる訳語で翻訳されることを認知させるようにしてもよい。すなわち、用例辞書30に翻訳用例を登録する際に、ユーザ辞書31に登録されている語句が含まれている翻訳用例の場合に当該語句を明示したり、ユーザ辞書31への語句の登録時に、用例辞書30の翻訳用例の中に含まれている語句の見出し語を明示する。
例えば、用例辞書30に原文として「車内では携帯電話をお切りください。」、訳文として「Please switch off all cellular phones while on the train.」を登録する際には、用例辞書登録部27は、原文及び訳文それぞれを言語解析し、「携帯電話」と「cellular phones」とを関連付け、「携帯電話」をユーザ辞書31の見出し語から検索し、見出し語である「携帯電話」に「mobile phone」が登録されていれば、ユーザ辞書31の登録内容を示すダイアログを出すなどして利用者に明示するものである。これにより、翻訳用例の訳文として、ユーザ辞書登録語と同じ訳語「mobile phone」を予め登録することができ、翻訳後の訳文修正の負荷を軽減することができる。
また、ユーザ辞書31に見出し語として「携帯電話」、訳語として「mobile phone」を登録する際には、ユーザ辞書登録部28は、見出し語である「携帯電話」を用例辞書30から検索し、「携帯電話」が翻訳用例に含まれている場合には、用例辞書の登録内容を示すダイアログを出すなどして利用者に明示するものである。これにより、「携帯電話」の登録時に、登録済みの翻訳用例の訳文に「携帯電話」があるものについては、「mobile phone」で登録し直すことができ、翻訳後の訳文修正の負荷を軽減することができる。
さらに、ユーザ辞書31へ見出し語を登録する際に、その見出し語が用例辞書30に登録されている翻訳用例に含まれている場合には、その見出し語が含まれる翻訳用例を抽出し、各翻訳用例の原文と訳文との対応関係を判定し、登録しようとしている見出し語に対する訳語を、その頻度と共に表示することも可能である。これにより、見出し語を登録する際に、翻訳用例に登録されている訳語を考慮して、ユーザ辞書31へ好みの訳語を登録することができ、翻訳後の訳文修正の負荷を軽減することができる。
また、以上の説明では、日本語から英語に翻訳する場合について説明したが、逆に英語から日本語に翻訳する場合にも同様に適用できる。さらに、日本語と英語に限定せず、他の言語においても同様に適用できる。また、ユーザ辞書31への登録語として説明したが、見出し語に対して複数存在する訳語のうち、利用者が訳語を選択した場合などにその情報を記録する学習辞書32の場合も同様に適用できる。
本発明の実施の形態によれば、用例辞書30の翻訳用例が適用された訳文に、ユーザ辞書31に登録されている語句と異なる使い方があった場合には、該当語句に識別情報を付けて利用者に明示するので、その後の訳文の修正の負荷を軽減させることができる。また、場合によって、該当語句をユーザ辞書31に登録された訳語で置き換えることができるので、その後の訳文修正を不要とすることができる。
用例辞書30の翻訳用例にユーザ辞書31の登録語と異なる使い方があるかについては、翻訳用例の原文と訳文とのそれぞれに対して言語解析し、原文に含まれる語句と訳文に含まれる語句との対応について関連付けるので、その原語に対する訳語がユーザ辞書31に登録された見出し語と訳語に一致しているかどうかの判定が容易に行える。
用例辞書30への翻訳用例の登録の際に、ユーザ辞書31に登録されている語句が含まれている翻訳用例の場合に該当語句を明示し、また、ユーザ辞書31への語句の登録時に、用例辞書30の翻訳用例の中に含まれている見出し語を登録する場合に該当語句を明示するので、より適切な用例辞書30を作成することができ、翻訳用例が適用された場合の訳文の修正の負荷を軽減させることができる。
本発明の実施の形態に係わる機械翻訳装置の構成図。 本発明の実施の形態に係わる機械翻訳装置の動作を表すフローチャート。 本発明の実施の形態における翻訳部の処理内容を示すフローチャート。 本発明の実施の形態における翻訳部での原文の解析結果に対して、原文の構成語に対応する訳語情報を付与した結果の一例を示す説明図。 本発明の実施の形態における翻訳部で翻訳用例の訳文を解析した結果に対して、個々の構成語に対応する日本語の訳語を付与した結果の一例の説明図。 本発明の実施の形態における固定度を含む翻訳用例の一例の説明図。
符号の説明
11…機械翻訳装置、12…CPU、13…ROM、14…RAM、15…バス、16…入力部、17…表示部、19…記憶装置、20…機械翻訳プログラム、21…辞書部、22…制御部、23…翻訳部、25…用例辞書検索部、26…ユーザ辞書検索部、27…用例辞書登録部、28…ユーザ辞書登録部、29…システム辞書、30…用例辞書、31…ユーザ辞書、32…学習辞書

Claims (9)

  1. 機械翻訳プログラム及び辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力部と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示部と、前記機械翻訳プログラムを演算実行するCPUとを備えた機械翻訳装置において、第一の言語と第二の言語の文とを対にした翻訳用例を記録する用例辞書と、ユーザが独自の用語を第一の言語及び第二の言語の語句の対で記録するユーザ辞書と、前記入力部で指定された原文を検索キーとして前記用例辞書から前記翻訳用例を検索する用例辞書検索部と、前記用例辞書検索部で検索された前記翻訳用例の原文中から前記ユーザ辞書の登録語を検索するユーザ辞書検索部と、前記翻訳用例の訳文中に前記ユーザ辞書検索部で検索された前記ユーザ辞書の登録訳語が使用されているか否かを判定し前記ユーザ辞書の登録訳語が使用されていないときは原文及び訳文の該当語句に識別情報を付けて前記表示部に表示する翻訳部とを備えたことを特徴とする機械翻訳装置。
  2. 前記翻訳部は、前記表示部に表示された識別情報付の語句が前記入力部により指定されたとき、その訳語の候補一覧を前記表示部に表示することを特徴とする請求項1に記載の機械翻訳装置。
  3. 機械翻訳プログラム及び辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力部と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示部と、前記機械翻訳プログラムを演算実行するCPUとを備えた機械翻訳装置において、第一の言語と第二の言語の文とを対にした翻訳用例を記録する用例辞書と、ユーザが独自の用語を第一の言語及び第二の言語の語句の対で記録するユーザ辞書と、前記入力部で指定された原文を検索キーとして前記用例辞書から前記翻訳用例を検索する用例辞書検索部と、前記用例辞書検索部で検索された前記翻訳用例の原文中から前記ユーザ辞書の登録語を検索し原文中に前記ユーザ辞書の登録語がある場合には前記翻訳用例の原文の該当語句に識別情報を付けて前記表示部に表示するユーザ辞書検索部を備えたことを特徴とする請求項1に記載の機械翻訳装置。
  4. 前記翻訳部は、前記翻訳用例の訳文中に前記ユーザ辞書の登録訳語が使用されていない場合に、前記入力部の指示により、該当訳語を前記ユーザ辞書の登録訳語に置き換えることを特徴とする請求項1ないし3のいずれか1項に記載の機械翻訳装置。
  5. 前記翻訳部は、前記翻訳用例の訳文中の訳語が前記ユーザ辞書の登録訳語に置き換えられた回数を記録しておき、その適用回数が所定値を越えたときは該当語句を前記ユーザ辞書の登録訳語に変換して訳出することを特徴とする請求項4に記載の機械翻訳装置。
  6. 前記翻訳部は、前記翻訳用例の訳文中に前記ユーザ辞書の登録訳語が使用されていない場合には、前記翻訳用例の訳文固定度により該当訳語を前記ユーザ辞書の登録訳語に置き換えることを特徴とする請求項1ないし3のいずれか1項に記載の機械翻訳装置。
  7. 前記ユーザ辞書に登録されている語句を含む翻訳用例を前記用例辞書に登録する際に、その語句を前記ユーザ辞書に登録されている訳語と共に前記表示部の画面に表示する用例辞書登録部を設けたことを特徴とする請求項1ないし6のいずれか1項に記載の機械翻訳装置。
  8. 前記用例辞書の前記翻訳用例に含まれている語句を前記ユーザ辞書に登録する際に、その語句と関連づけて当該語句を含む翻訳用例を前記表示部の画面に表示するユーザ辞書登録部を設けたことを特徴とする請求項1ないし6のいずれか1項に記載の機械翻訳装置。
  9. 機械翻訳プログラム及び辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力部と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示部と、前記機械翻訳プログラムを演算実行するCPUとを備えた機械翻訳装置において、コンピュータに、第一の言語と第二の言語の文とを対にした翻訳用例を用例辞書として前記記憶装置に記録する機能と、システム辞書に登録されていない語句を第一の言語及び第二の言語でユーザ辞書として前記記憶装置に記録する機能と、前記入力部で指定された原文を前記用例辞書から前記翻訳用例を検索する機能と、検索された前記翻訳用例の原文中から前記ユーザ辞書の登録語を検索する機能と、前記翻訳用例の訳文中に前記ユーザ辞書の登録訳語が使用されているか否かを判定し前記ユーザ辞書の登録訳語が使用されていないときは原文及び訳文の該当語句に識別情報を付けて前記表示部に表示する機能とを実現させるための機械翻訳プログラム。
JP2007288571A 2007-11-06 2007-11-06 機械翻訳装置及び機械翻訳プログラム Active JP4843596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007288571A JP4843596B2 (ja) 2007-11-06 2007-11-06 機械翻訳装置及び機械翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007288571A JP4843596B2 (ja) 2007-11-06 2007-11-06 機械翻訳装置及び機械翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2009116585A true JP2009116585A (ja) 2009-05-28
JP4843596B2 JP4843596B2 (ja) 2011-12-21

Family

ID=40783674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007288571A Active JP4843596B2 (ja) 2007-11-06 2007-11-06 機械翻訳装置及び機械翻訳プログラム

Country Status (1)

Country Link
JP (1) JP4843596B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011210194A (ja) * 2010-03-30 2011-10-20 Toshiba Corp 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造
JP7107609B1 (ja) 2021-10-28 2022-07-27 株式会社川村インターナショナル 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721187A (ja) * 1993-07-05 1995-01-24 Brother Ind Ltd 機械翻訳装置
JPH09114832A (ja) * 1995-10-23 1997-05-02 Oki Electric Ind Co Ltd 機械翻訳通信システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721187A (ja) * 1993-07-05 1995-01-24 Brother Ind Ltd 機械翻訳装置
JPH09114832A (ja) * 1995-10-23 1997-05-02 Oki Electric Ind Co Ltd 機械翻訳通信システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011210194A (ja) * 2010-03-30 2011-10-20 Toshiba Corp 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造
JP7107609B1 (ja) 2021-10-28 2022-07-27 株式会社川村インターナショナル 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム
JP2023066183A (ja) * 2021-10-28 2023-05-15 株式会社川村インターナショナル 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム

Also Published As

Publication number Publication date
JP4843596B2 (ja) 2011-12-21

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
JPH03185561A (ja) 欧文単語入力方法
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
JPH05314166A (ja) 電子化辞書および辞書検索装置
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR20080061307A (ko) 문자입력장치
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
KR950013129B1 (ko) 기계번역장치 및 방법
JP4016037B2 (ja) 機械翻訳プログラム、機械翻訳装置
JP2012053858A (ja) 機械翻訳装置及び機械翻訳プログラム
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP4198737B2 (ja) 機械翻訳プログラム、機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム
JP2938897B2 (ja) 文書作成処理装置
JPH0350668A (ja) 文字処理装置
JP6221339B2 (ja) 翻訳装置及び翻訳方法
JP5338482B2 (ja) 漢文例文検索装置およびプログラム
Hicks Welsh proofing tools: Making a little nlp go a long way
JPS63136264A (ja) 機械翻訳装置
JP2002032369A (ja) 辞書作成装置
JP2005293069A (ja) 電子辞書

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101020

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110705

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111007

R150 Certificate of patent or registration of utility model

Ref document number: 4843596

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350