JP5915326B2 - 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム - Google Patents

機械翻訳装置、機械翻訳方法及び機械翻訳プログラム Download PDF

Info

Publication number
JP5915326B2
JP5915326B2 JP2012077857A JP2012077857A JP5915326B2 JP 5915326 B2 JP5915326 B2 JP 5915326B2 JP 2012077857 A JP2012077857 A JP 2012077857A JP 2012077857 A JP2012077857 A JP 2012077857A JP 5915326 B2 JP5915326 B2 JP 5915326B2
Authority
JP
Japan
Prior art keywords
language
sentence
translation
unit
language sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012077857A
Other languages
English (en)
Other versions
JP2013206397A (ja
Inventor
富士 秀
秀 富士
友樹 長瀬
友樹 長瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012077857A priority Critical patent/JP5915326B2/ja
Priority to US13/733,340 priority patent/US9298701B2/en
Publication of JP2013206397A publication Critical patent/JP2013206397A/ja
Application granted granted Critical
Publication of JP5915326B2 publication Critical patent/JP5915326B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、第1言語文を第2言語文に翻訳する機械翻訳装置、機械翻訳方法及び機械翻訳プログラムに関する。
従来から、第1言語で入力された入力単語に対して対訳辞書を検索し、第2言語の訳文を出力する機械翻訳が知られている。従来の機械翻訳では、例えば第2言語の訳文として複数の候補が存在する場合、第2言語側の情報を活用して適切な訳文を選択する。
適切な訳文を選択するための技術として、例えば第1言語文に含まれる単語と第2言語文に含まれる単語との組合せ(単語対)の出現頻度を計数し、出現頻度が規定値より多ければ単語対の第1言語の単語を第2言語による訳語と判定する手法が知られている。また例えば、ユーザによる訳語修正の結果を意味関係辞書に蓄積し、意味関係辞書を訳語選択に用いる手法が知られている。またさらに、例えば第1言語単文データと第2言語単文データとが関連付けられた対訳データと、第2言語単文データと第3言語単文データとが関連付けられた対訳データとを利用して第1言語文を第3言語文へ翻訳する手法等が既に知られている。
特開平5−298359号公報 特開平4−372061号公報 特開2008−269413号公報
開示の技術における機械翻訳では、例えば単語対の出現頻度が低い場合や、意味関係辞書に蓄積された訳語や対訳データが不十分である場合には、翻訳の精度が低下する可能性がある。また意味関係辞書や対訳データを整備するためには、単語間の共起関係のチェック等の煩雑な作業が要求される。
本発明の一実施例では、簡易な手順で翻訳の精度を向上させることが可能な機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを提供することを目的としている。
開示の技術は、第1言語文を第2言語文に翻訳する第1翻訳部と、前記第1翻訳部において前記第1言語文から翻訳された第2言語文が複数であった場合、前記第2言語文を第3言語文に翻訳する第2翻訳部と、翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索して一又は複数の第3言語の例文を取得する検索部と、前記検索キーと前記第3言語の例文毎の一致度を計算し、前記検索キー毎に一致度の平均値を計算し、前記一致度の平均値を前記検索キーに対応した一致度とする平均値計算部と、前記一致度の平均値が最も高い検索キーである第3言語文に対応した第2言語文を選択する第2言語文選択部と、前記第2言語文選択部で選択された第2言語文を、前記第1言語文に対応した第2言語文として出力する第2言語訳文出力部と、を有する。
上記各部を実行する方法、上記各部を機能としてコンピュータに実行させるためのプログラムとすることもできる。
簡易な手順で翻訳の精度を向上させることができる。
第1の実施例に係る機械翻訳装置のハードウェア構成を示す図である。 第1の実施例の機械翻訳装置の機能構成の例を説明する図である。 第1の実施例の機械翻訳装置の動作を説明するフローチャートである。 第1の実施例の第1機械翻訳部の処理の具体例を示す図である。 第1の実施例の第2機械翻訳部の処理の具体例を示す第一の図である。 第1の実施例の検索要求部と第3言語検索部の処理の具体例を示す第一の図である。 第1の実施例の検索結果集計部の処理の具体例を示す第一の図である。 第1の実施例の第2機械翻訳部の処理の具体例を示す第二の図である。 第1の実施例の検索要求部と第3言語検索部の処理の具体例を示す第二の図である。 第1の実施例の検索結果集計部の処理の具体例を示す第二の図である。 第1の実施例の第2言語訳文選択部の処理の具体例を示す図である。 第1の実施例の機械翻訳装置の機能構成の別の例を説明する図である。 第1の実施例の機械翻訳装置において第3言語コーパスの規模を判定する場合の動作を説明するフローチャートである。 第1の実施例の効果を説明するための第1参考例を示す図である。 第1の実施例の効果を説明するための第2参考例を示す図である。 第2の実施例の機械翻訳装置の機能構成の例を説明する図である。 第2の実施例の機械翻訳装置の動作を説明するフローチャートである。 第2の実施例の第1機械翻訳部の処理の具体例を示す図である。 第2の実施例の第3機械翻訳部の処理の具体例を示す図である。 第2の実施例の検索要求部と第3言語検索部の処理の具体例を示す第一の図である。 第2の実施例の検索結果集計部の処理の具体例を示す第一の図である。 第2の実施例の検索要求部と第3言語検索部の処理の具体例を示す第二の図である。 第2の実施例の検索結果集計部の処理の具体例を示す第二の図である。 第2の実施例の第3言語訳文選択部の処理の具体例を示す図である。 第2の実施例の第3言語差分特定部と第2言語置換箇所特定部の処理の具体例を示す図である。 第2の実施例の第4機械翻訳部の処理の具体例を示す図である。 第2の実施例の第2言語置換部の処理の具体例を示す図である。
本実施例では、第1言語文を第2言語文に機械翻訳する際に、例文が第1言語及び第2言語よりも多く存在する第3言語のコーパスを用いることで機械翻訳の精度を改善する形態について説明する。
(第1の実施例)
第1の実施例は、第1言語文を機械翻訳した第2言語文で第3言語のコーパスを検索し、検索結果から第2言語の訳文を選択する例であり、機械翻訳により第1言語の入力文から得られる第2言語の訳文が複数ある場合を例として説明する。
以下に図面を参照して第1の実施例について説明する。図1は、第1の実施例に係る機械翻訳装置のハードウェア構成を示す図である。
図1において、機械翻訳装置100は、コンピュータによって制御される装置であって、CPU(Central Processing Unit)11と、メモリユニット12と、表示ユニット13と、入力ユニット14と、記憶装置15と、ドライバ装置16と、通信ユニット17とを含む。機械翻訳装置100において、CPU11と各ユニット、各装置は、システムバスBにより接続される。
CPU11は、メモリユニット12に格納されたプログラムに従って機械翻訳装置100を制御する。メモリユニット12は、RAM(Random Access Memory)及びROM(Read-Only Memory)等を有し、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を格納する。またメモリユニット12の一部の領域は、CPU11での処理に利用されるワークエリアとして割り付けられている。
表示ユニット13は、CPU11の制御のもとに必要な各種情報を表示する。入力ユニット14は、マウス、キーボード等を有し、利用者が機械翻訳装置100が処理を行なうための必要な各種情報を入力するために用いられる。
記憶装置15は、例えば、ハードディスクユニットにより実現され、各種処理を実行するプログラム等のデータを格納する。
機械翻訳装置100によって行われる方法での処理を実現するプログラムは、例えば、CD−ROM(Compact Disk Read-Only Memory)等の記憶媒体18によって機械翻訳装置100に提供される。即ち、プログラムが保存された記憶媒体18がドライバ装置16にセットされると、ドライバ装置16が記憶媒体18からプログラムを読み出し、その読み出されたプログラムがシステムバスBを介して記憶装置15にインストールされる。そして、プログラムが起動されると、記憶装置15にインストールされたプログラムに従ってCPU11が処理を開始する。
尚、プログラムを格納する媒体としてCD−ROMに限定するものではなく、コンピュータが読み取り可能な媒体であればよい。機械翻訳装置100が外部とのネットワーク通信を行う場合には、機械翻訳装置100による処理を実現するプログラムを通信ユニット17によってネットワークを介してダウンロードし、記憶装置15にインストールするようにしても良い。また、機械翻訳装置100が外部記憶装置との接続を行うUSB(Universal Serial Bus)等のインタフェースを有する場合には、USB接続によって外部記憶媒体からプログラムを読み込んでもよい。
図2は、第1の実施例の機械翻訳装置の機能構成の例を説明する図である。
本実施例の機械翻訳装置100は、第1言語入力部110、第1機械翻訳部120、第2機械翻訳部130、検索要求部140、検索一致度集計部150、第2言語訳文選択部160、第3言語検索部170、第2言語訳文出力部175を有する。また本実施例の機械翻訳装置100は、対訳辞書データベース180、190を有する。本実施例の機械翻訳装置100は、例えばネットワーク等によりデータベース装置200と接続されている。データベース装置200には、第3言語コーパス210が格納された記憶装置220が含まれる。第3言語コーパス210は、第3言語の文章(例文)を構造化し大規模に集積したものである。
本実施例の第1言語入力部110は、第1言語の入力文を受け付ける。第1機械翻訳部120には、第1言語入力部110が受け付けた第1言語の入力文が入力される。第1機械翻訳部120は、対訳辞書データベース180を参照し、第1言語の入力文を第2言語の訳文へ翻訳し、第2言語の訳文として第2機械翻訳部130に出力する。対訳辞書データベース180は、第1言語と第2言語の対応関係を示す辞書が格納されたデータベースである。
第2機械翻訳部130には、第1機械翻訳部120から出力された第2言語の訳文が入力される。第2機械翻訳部130は、対訳辞書データベース190を参照して第2言語の訳文を第3言語の訳文に翻訳し、第2言語の訳文と、第2言語の訳文と対応した第3言語の訳文を検索要求部140に出力する。対訳辞書データベース190は、第2言語と第3言語の対応関係を示す辞書が格納されたデータベースである。尚本実施例の第1機械翻訳部120と第2機械翻訳部130は、多言語の翻訳機能を有する翻訳部に含まれるものとしても良い。
検索要求部140は、第3言語検索部170に対し、第2言語の訳文と第3言語の訳文とを出力する。検索要求部140は、第3言語の訳文による第3言語コーパス210の検索要求を行う。
第3言語検索部170は、第3言語の訳文を検索キーとしてデータベース装置200の記憶装置220に格納された第3言語コーパス210を検索する。第3言語検索部170は、第3言語コーパス210に対して、曖昧検索を行う。曖昧検索とは、例えば検索キーとなる訳文と完全に一致していなくても、表記の異なりや同義語も含め、柔軟に解釈して検索することである。
したがって第3言語検索部170の検索結果として、複数の第3言語の例文が得られることが考えられる。第3言語検索部170は、検索要求部140から出力された第2言語の訳文と、第2言語に対応した第3言語の訳文と、検索結果として得られた複数の第3言語の例文とを対にして、検索一致度集計部150へ渡す。
検索一致度集計部150は、一致度計算部151と、平均値計算部152と、を有し、検索要求部140が取得した検索結果と検索キーとの一致度を集計し、平均値を計算する。検索キーとは、第3言語の訳文である。検索結果とは、複数の第3言語の例文とである。検索一致度集計部150は、第2言語の訳文と、対応する第3言語の訳文と、対応する第3言語の例文とを計算結果と共に第2言語訳文選択部160へ出力する。
第2言語訳文選択部160は、検索一致度集計部150による計算結果に基づき、第1機械翻訳部120で得られた複数の第2言語の訳文から1文を選択し、第2言語の訳文出力部175へ出力する。検索一致度集計部150の処理と、第2言語訳文選択部160の処理の詳細は後述する。第2言語訳文出力部175は、第2言語訳文選択部160から出力された第2言語の訳文を、第1言語の入力文に対する第2言語の訳文として出力する。
尚機械翻訳装置100における第1機械翻訳部120と第2機械翻訳部130における機械翻訳とは、ある自然言語を別の自然言語へ機械的に変換する技術であり、従来から知られた手法である。
本実施例のデータベース装置200は、例えば機械翻訳装置100と同様のハードウェア構成を有していても良い。本実施例のデータベース装置200の有する記憶装置220に格納された第3言語コーパス210は、第1言語及び第2言語のコーパスと比較して、例文がより多く存在するコーパスである。本実施例の第3言語コーパス210は、例文が多く存在するもの程好ましい。
また本実施例では機械翻訳装置100が第3言語検索部170を有するものとしたが、これに限定されない。本実施例は、例えば第3言語検索部170や対訳辞書データベース180、190がデータベース装置200に含まれる機械翻訳システムとしても適用できる。また本実施例は、例えば機械翻訳装置100とデータベース装置200とを含む一つの装置としても適用できる。
次に図3を参照して本実施例の機械翻訳装置100の動作を説明する。図3は、第1の実施例の機械翻訳装置の動作を説明するフローチャートである。
本実施例の機械翻訳装置100は、第1言語入力部110が第1言語の入力文を受け付けると、第1機械翻訳部120により、第1言語の入力文を第2言語の訳文へ翻訳し、翻訳結果である複数の訳文を第2機械翻訳部130へ渡す(ステップS301)。
第2機械翻訳部130は、第1機械翻訳部120から渡された複数の第2言語の訳文から、1つの訳文を取り出す(ステップS302)。続いて第2機械翻訳部130は、取り出した訳文を第3言語の訳文へ翻訳し、翻訳結果を検索要求部140へ渡す(ステップS303)。
検索要求部140は、第3言語検索部170に対し、受け取った第3言語の訳文を検索キーとした第3言語コーパス210の検索要求を行う(ステップS304)。第3言語検索部170は、検索要求を受けて、データベース装置200へアクセスし、ステップS304で受け取った第3言語の訳文を検索キーとして第3言語コーパス210を検索する(ステップS305)。検索結果は、例えば複数の例文として取得される。取得された検索結果の例文は検索一致度集計部150へ渡される。
検索一致度集計部150は、検索結果の例文から1つの例文を取り出す(ステップS306)。続いて検索一致度集計部150は、一致度計算部151により、取り出した例文と、検索キーである第3言語の訳文との一致度を計算する(ステップS307)。本実施例の一致度計算部151は、2つの文の総単語数において一致する単語の割当を一致度として計算する。計算された一致度は、例えばメモリユニット12の有する所定の記憶領域に一時的に記憶される。
続いて検索一致度集計部150は、検索結果の全ての例文について一致度を計算したか否かを判断する(ステップS308)。ステップS308において全ての検索結果の例文について計算していない場合は、ステップS306へ戻る。ステップS308において全ての検索結果の例文について計算した場合、検索一致度集計部150は、平均値計算部152により、検索結果の各例文と検索キーの訳文との一致度の平均値を計算する(ステップS309)。計算された平均値は、例えばメモリユニット12の有する所定の記憶領域に一時的に記憶される。
続いて検索一致度集計部150は、ステップS302で第1機械翻訳部120から渡された全ての第2言語の訳文について、ステップS303からステップS309までの処理が行われたか否かを判断する(ステップS310)。ステップS310において全ての訳文に処理が行われていない場合、ステップS302へ戻る。
ステップS310において全ての第2言語の訳文に対して処理が行われていた場合、第2言語訳文選択部160は、一致度の平均値が最も高い第3言語の訳文に対応した第2言語の訳文を、第1言語の入力文に対する第2言語の訳文として選択する(ステップS311)。そして第2言語訳文出力部175は、選択された第2言語の訳文を出力する(ステップS312)。本実施例の出力の形態としては、例えば選択した第2言語の訳文を表示ユニット13に表示する形態等であっても良い。
以下に図4乃至図11を参照して本実施例の機械翻訳装置100の有する各部の処理について具体的に説明する。尚図4乃至図11では、第1言語を中国語、第2言語を日本語、第3言語を英語とした。
図4は、第1の実施例の第1機械翻訳部の処理の具体例を示す図である。本実施例の第1機械翻訳部120は、第1言語の入力文41が入力されると、対訳辞書データベース180を参照して入力文41を第2言語の訳文へ翻訳する。図4の例では、入力文41に対応する訳文として、2つの訳文42と訳文43が得られる。この訳文42と訳文43は、第2機械翻訳部130へ渡される。
図5は、第1の実施例の第2機械翻訳部の処理の具体例を示す第一の図である。第2機械翻訳部130は、訳文42を取り出し、対訳辞書データベース190を参照して訳文42を第3言語の訳文52へ翻訳する。第3言語の訳文52は、第3言語コーパス210の検索キーとすべく、検索要求部140へ渡される。
図6は、第1の実施例の検索要求部と第3言語検索部の処理の具体例を示す第一の図である。検索要求部140は、第3言語の訳文52を受け取ると、訳文52を検索キーとした検索要求を第3言語検索部170へ行う。第3言語検索部170は、訳文52を検索キーとして第3言語コーパス210を曖昧検索し、検索結果を取得する。図6の例では、検索結果として、検索結果文521、522、523、524の4つの文が取得される。この4つの検索結果部521〜524は、検索一致度集計部150へ渡される。
図7は、第1の実施例の検索結果集計部の処理の具体例を示す第一の図である。検索一致度集計部150において、一度計算部151は検索結果文521を取り出し、検索キーとなった訳文52との一致度を計算する。
図7の例では、訳文52に含まれる単語数は8個、検索結果文521に含まれる単語数は7個である。また訳文52と検索結果文521とにおいて一致する単語数は6個である。したがって一致度計算部151は、訳文51と検索結果文521との総単語数における一致する単語の割当として、2×6÷(8+7)=0.80を訳文52と検索結果文521との一致度として算出する。一致度計算部151は、検索結果文522、523、524に対しても同様の計算を行い、訳文52と各検索結果文521〜524との一致度をそれぞれ計算する。
続いて平均値計算部152は、訳文52と各検索結果文521〜524との一致度の平均値を計算する。図7の例では、訳文52と検索結果文521〜524のそれぞれの一致度は、0.80、0.71、0.67、0.56であるため、平均値計算部152はこの4つの一致度の平均値55を計算する。図7の例では、平均値55=0.685である。平均値55は、第2言語の訳文42に対応して計算された値である。
訳文52と検索結果文521〜524との一致度の平均値を計算すると、機械翻訳装置100は、2つ目の第2言語の訳文43についても同様の処理を行う。尚本実施例の一致度及び一致度の平均値の計算では、小数点第三位の値を四捨五入するものとした。
図8は、第1の実施例の第2機械翻訳部の処理の具体例を示す第二の図である。図8の例では第2機械翻訳部130は、第2言語の訳文43を取り出し、第3言語の訳文53に翻訳する。
図9は、第1の実施例の検索要求部と第3言語検索部の処理の具体例を示す第二の図である。検索要求部140は、第3言語の訳文53を受け取ると、訳文53を検索キーとした検索要求を第3言語検索部170へ行う。第3言語検索部170は、訳文53を検索キーとして第3言語コーパス210を曖昧検索し、検索結果を取得する。図9の例では、検索結果として、検索結果文531、532、533、534の4つの文が取得され、検索一致度集計部150へ渡される。
図10は、第1の実施例の検索結果集計部の処理の具体例を示す第二の図である。検索一致度集計部150において一度計算部151は、訳文53と検索結果文531〜534とのそれぞれの一致度を計算する。
訳文53に含まれる単語数は7個、検索結果文531に含まれる単語数は12個である。また訳文53と検索結果文531とにおいて一致する単語数は3個である。したがって一致度計算部151は、訳文53と検索結果文531との総単語数における一致する単語の割当として、2×3÷(7+12)=0.32を訳文53と検索結果文531との一致度として算出する。一致度計算部151は、検索結果文532、533、534に対しても同様の計算を行い、訳文53と各検索結果文531〜534との一致度をそれぞれ計算する。
続いて平均値計算部152は、訳文53と各検索結果文531〜534との一致度の平均値を計算する。図10の例では、訳文53と検索結果文531〜534のそれぞれの一致度は、0.32、0.27、0.38、0.44であるため、平均値計算部152はこの4つの一致度の平均値56を計算する。図10の例では、平均値=0.352である。この平均値56は、訳文43に対応して計算された値である。
検索一致度集計部150は、第1機械翻訳部120による翻訳で得られた全ての第2言語の訳文について、対応する平均値が計算されたか否かを判断する。図4において得られた第2言語の訳文は、訳文42と訳文43の2つであるから、機械翻訳装置100は次の処理へ進む。
図11は、第1の実施例の第2言語訳文選択部の処理の具体例を示す図である。第2言語訳文選択部160は、第1機械翻訳部120で得られた訳文42と訳文43において、対応する平均値が大きいほうの訳文を入力文41の第2言語の訳文として選択する。
図11の例では、訳文42に対応した平均値55が0.685であり、訳文43に対応した平均値56が0.352である。したがって第2言語訳文選択部160は、訳文42を入力文41の第2言語の訳文に選択する。選択された訳文42は、第2言語訳文出力部175により出力される。
以上のように本実施例では、第1言語の入力文を第2言語に翻訳した際に第2言語の訳文が複数得られた場合に、第2言語の訳文を例文が豊富な第3言語に翻訳する。そして第3言語コーパス210を第3言語の訳文で検索し、検索結果との一致度が高い第3言語の訳文に対応した第2言語の訳文を入力文に対応した第2言語の訳文とする。
本実施例ではこのように例文が豊富な第3言語コーパス210を用いることで、例えば第2言語の訳文が複数得られた場合に生じる翻訳の曖昧性を解消することができる。また本実施例では、例文が豊富な第3言語コーパス210を用いることで、第1言語の入力文に対して複数の第2言語の訳文が得られた場合に、的確な第2言語の訳文を選択し、第2言語の訳文の候補を絞ることができる。よって本実施例によれば、翻訳の精度を向上させることができる。
また本実施例では、第3言語コーパス210が十分に例文が豊富な規模であるか否かを判断してから、第2言語の訳文を第3言語の訳文に翻訳しても良い。
以下に第3言語コーパス210の規模を判定する場合する例について説明する。図12は、第1の実施例の機械翻訳装置の機能構成の別の例を説明する図である。
本実施例の機械翻訳装置100Aは、第1言語入力部110、第1機械翻訳部120、第2機械翻訳部130、検索要求部140、検索一致度集計部150、第2言語訳文選択部160、第3言語検索部170、第2言語訳文出力部175を有する。また機械翻訳装置100Aは、コーパス規模判定部125を有する。
コーパス規模判定部125は、第3言語コーパス210の規模を判定する。具体的にはコーパス規模判定部125は、第3言語コーパス210に格納された例文数を取得し、例文数が所定の閾値より大きいか否かを判断する。第3言語コーパス210は、例文数が閾値よりも大きい場合に例文が豊富なコーパスと判断される。尚閾値は、予め機械翻訳装置100Aのメモリユニット12等に格納されていても良い。
図13は、第1の実施例の機械翻訳装置において第3言語コーパスの規模を判定する場合の動作を説明するフローチャートである。
機械翻訳装置100Aは、第1言語入力部110が第1言語の入力文を受け付けると、第1機械翻訳部120により、第1言語の入力文を第2言語の訳文へ翻訳し、翻訳結果である複数の訳文を第2機械翻訳部130へ渡す(ステップS1301)。
続いてコーパス規模判定部125は、第3言語コーパス210の規模を取得する(ステップS1302)。具体的にはコーパス規模判定部125は、第3言語コーパス210に格納された例文の数を取得する。
続いてコーパス規模判定部125は、第3言語コーパス210の規模が閾値より大きいか否かを判断する(ステップS1303)。具体的にはコーパス規模判定部125は、ステップS1302で取得した例文数が閾値より大きいか否かを判断する。
ステップS1303において第3言語コーパス210の規模が閾値より大きい場合、第2機械翻訳部130は、第1機械翻訳部120から渡された複数の第2言語の訳文から、1つの訳文を取り出す(ステップS1304)。
ステップS1304〜ステップS1314までの処理は、図3のステップS302からステップS312までの処理と同様であるから説明を省略する。
ステップS1304において第3言語コーパス210の規模が閾値以下の場合、機械翻訳装置100Aは、ステップS1301で得られた第2言語の訳文を翻訳結果として出力する(ステップS1315)。尚ステップS1301において複数の第2言語の訳文が得られた場合には、得られた第2言語の訳文を全て出力しても良いし、任意の1文を選択して出力しても良い。
このように本実施例では、第2言語の訳文を第3言語に翻訳する前に、第3言語コーパス210の規模を確認することで、例文の少ない言語のコーパスを用いて不適切な翻訳結果を出力することを防止できる。
以下に図14と図15を参照して本実施例の効果について説明する。図14は、第1の実施例の効果を説明するための第1参考例を示す図である。
図14では、第1言語の入力文に対して第2言語の訳文が複数出力され、翻訳に曖昧性が発生したした場合に、入力文に含まれる単語と訳文に含まれる単語との組合せ(単語対)の出現頻度を用いて訳文を選択する例を示している。
図14では、第2言語の訳文121を検索キーとした第2言語のコーパスの検索結果として23件のヒットが得られているが、訳文122を検索キーとした第2言語のコーパスの検索結果としては2件のヒットしか得られていない。このことから訳文121のほうが第2言語において出現しやすい訳文であると推定され、訳文121が選択される。
図14に示す手法では、第2言語のコーパスを検索したときに十分な検索頻度が得られ、各候補文の頻度の間での比較ができることを前提としている。しかし、例えば第2言語のコーパスの大きさが不十分である場合、訳文121と訳文122の両方に対して十分な検索結果が得られない。よって図14に示す手法は翻訳の曖昧性を解消して翻訳の精度を高めるために有効とは言えない。
本実施例では、第1言語及び第2言語よりも多くの例文が存在する十分な大きさの第3言語のコーパスを用いることで、十分な検索結果を得る。このため例えば出力言語である第2言語のコーパスが不十分であったとしても、翻訳の曖昧性を解消でき、翻訳の精度を向上させることができる。
図15は、第1の実施例の効果を説明するための第2参考例を示す図である。図15では、第1言語の入力文を第2言語に翻訳した際に曖昧性が発生した場合、意味関係辞書を訳語選択に用いる例を示している。
図15では、「握る」と「とらえる」の2者が訳語候補となっている。これによって、「握る」を含む訳文131と、「とらえる」を含む訳文132の2文が生成されている。ここで意味関係辞書には、「握る」という動詞が目的語として「ハンドル」という名詞をとるということが記述されている。これに対して、「とらえる」と「ハンドル」の関係は記述されていない。このことから訳文131のほうが確信度の高いと判断され、訳文131が入力文の訳文として選択される。
しかし図15に示す手法では、例えば意味関係辞書に記述されないような出現頻度の低い単語の組合せでは、翻訳の曖昧性の解消には利用できない。
本実施例では、十分な大きさの第3言語のコーパスを用いることで、意味関係辞書に記述されないような単語の組合せでも十分な検索結果を得ることができるため、翻訳の曖昧性を解消でき、翻訳の精度を向上させることができる。
また本実施例では、十分な大きさの第3言語のコーパスを用いることで、意味関係辞書や対訳データを整備するための単語間の共起関係のチェック等の煩雑な作業が不要となり、簡易な手順で翻訳の精度を向上させることができる。
尚本実施例では、第1言語を中国語、第2言語を日本語、第3言語を英語としたが、これに限定されない。第1言語と第2言語は任意の言語であって良い。第3言語は、第1言語及び第2言語よりも多くの例文が存在する言語であれば良い。
(第2の実施例)
第2の実施例は、第1言語文で第3言語のコーパスを検索し、検索結果から第2言語の訳文を得る例であり、機械翻訳により第1言語の入力文から得られる第2言語の訳文が単数ある場合を例として説明する。また以下の第2の実施例の説明では、第1の実施例と同様の機能を有するものには第1の実施例の説明で用いた符号を付与し、その説明を省略する。
尚本実施例は、第1の実施例と組み合わせることもできる。具体的には例えば、第1機械翻訳部120において第1言語の入力文に対して複数の第2言語の訳文が得られた場合、第1の実施例で説明した処理が実行される。そして第1機械翻訳部120において第1言語の入力文に対して単数の第2言語の訳文が得られた場合は、以下の本実施例で説明する処理が実行されても良い。
図16は、第2の実施例の機械翻訳装置の機能構成の例を説明する図である。
本実施例の機械翻訳装置100Bは、第1言語入力部110、第1機械翻訳部120、第3機械翻訳部130A、検索要求部140、検索一致度集計部150、第3言語検索部170、第2言語訳文出力部175を有する。また本実施例の機械翻訳装置100Bは、対訳辞書データベース180、対訳辞書データベース190A、190B、第3言語訳文選択部161、第3言語差分特定部162、第2言語置換箇所特定部163、第4機械翻訳部164、第2言語置換部165を有する。
本実施例の機械翻訳装置100Bは、例えばネットワーク等を介してデータベース装置200と接続されている。
本実施例において第1言語入力部110から入力された第1言語の入力文は、第1機械翻訳部120と、第3機械翻訳部130Aとに出力される。
本実施例の第1機械翻訳部120は、第1言語入力部110から入力された第1言語の入力文を第2言語の訳文に翻訳し、第2言語置換箇所特定部163に出力する。
本実施例の第3機械翻訳部130Aは、対訳辞書データベース190Aを参照し、第1言語入力部110が受け付けた第1言語の入力文を第3言語の訳文へ翻訳する。第3機械翻訳部130Aは、第3言語の訳文を検索要求部140と第3言語訳文選択部161と第3言語差分特定部162とに出力する。対訳辞書データベース190Aは、第1言語と第3言語の対応関係を示す辞書が格納されたデータベースである。尚本実施例の第1機械翻訳部120、第3機械翻訳部130A、第4機械翻訳部164は、多言語の翻訳機能を有する翻訳部に含まれるものとしても良い。
第3言語訳文選択部161は、第3機械翻訳部130Aから出力された第3言語の訳文が複数である場合に、検索一致度集計部150による計算結果に基づき第3言語の訳文を選択し、選択した第3言語の訳文を第4機械翻訳部164へ出力する。
第3言語差分特定部162は、第3機械翻訳部130Aで得られた複数の第3言語の訳文間において訳語が異なる箇所(差分)を特定する。第3言語差分特定部162は、特定した箇所の単語を第2言語置換箇所特定部163へ出力する。
第2言語置換箇所特定部163は、第1機械翻訳部120で得られた第2言語の訳文において、第3言語差分特定部162で特定された箇所に対応する箇所の単語を特定し、特定した箇所の単語を第2言語置換部165へ出力する。
第4機械翻訳部164は、対訳辞書データベース190Bを参照し、第3言語訳文選択部161により選択された第3言語の訳文を第2言語の訳文に翻訳する。そして第4機械翻訳部164は、第2言語の訳文を第2言語置換部165へ出力する。対訳辞書データベース190Bは、第2言語と第3言語の対応関係を示す辞書が格納されたデータベースである。
第2言語置換部165は、第4機械翻訳部164で得られた第2言語の訳文において対応する箇所の単語を第2言語置換箇所特定部163で特定された箇所の単語と置き換えた第2言語の訳文を第2言語訳文出力部175へ出力する。第2言語訳文出力部175は、第2言語置換部165から出力された第2言語の訳文を第1言語の訳文として出力する。
以下に図17を参照して本実施例の機械翻訳装置100Bの動作を説明する。図17は第2の実施例の機械翻訳装置の動作を説明するフローチャートである。
本実施例の機械翻訳装置100Bにおいて、第1言語入力部110が第1言語の入力文を受け付けると、第1機械翻訳部120は、対訳辞書データベース180を参照して入力文を第2言語の訳文へ翻訳する(ステップS1701)。続いて第3機械翻訳部130Aは、対訳辞書データベース190Aを参照し、第1言語の入力文を第3言語の訳文へ翻訳する(ステップS1702)。本実施例では、第3機械翻訳部130Aにより、複数の第3言語の訳文が得られたものとする。第3機械翻訳部130Aで得られた複数の訳文は、検索要求部140へ渡される。
検索要求部140は、複数の第3言語の訳文から1つの訳文を取り出す(ステップS1703)。続いて検索要求部140は、第3言語検索部170に対して取り出した訳文を検索キーとする検索要求を行う(ステップS1704)。
ステップS1705からステップS1709までの処理は、図3のステップS305からステップS309までの処理と同様であるから説明を省略する。
検索一致度集計部150は、ステップS1702で得られた全ての第3言語の訳文について、一致度の平均値を計算したか否かを判断する(ステップS1710)。ステップS1710において、全ての第3言語の訳文について平均値を計算していない場合、ステップS1703へ戻る。ステップS1710において、全ての第3言語の訳文について平均値を計算した場合、後述するステップS1711へ進む。
第3言語訳文選択部161は、一致度の平均値が最も高い第3言語の訳文を、第1言語の入力文に対する第3言語の訳文として選択する(ステップS1711)。
続いて第3言語差分特定部162は、ステップS1711で選択された第3言語の訳文と、ステップS1702で得られた他の第3言語の訳文との間で異なる箇所を特定する(ステップS1712)。続いて第2言語置換箇所特定部163は、対訳辞書データベース190Bを参照し、ステップS1701で得られた第2言語の訳文において、ステップS1712で特定された箇所に対応する箇所を特定する(ステップS1713)。
次に第4機械翻訳部164は、対訳辞書データベース190Bを参照し、ステップS1711で選択された第3言語の訳文を第2言語の訳文へ翻訳する(ステップS1714)。
続いて第2言語置換部165は、ステップS1713で特定した第2言語の訳文の箇所を、
ステップS1714で得られた第2言語の訳文における対応する箇所の訳語に置き変える(ステップS1715)。続いて第2言語訳文出力部175は、ステップS1715の結果を第1言語の入力文の第2言語の訳文として出力する(ステップS1716)。
以下に図18乃至図27を参照して本実施例の機械翻訳装置100Bの有する各部の処理について具体的に説明する。尚図18乃至図27では、第1言語を中国語、第2言語を日本語、第3言語を英語とした。
図18は、第2の実施例の第1機械翻訳部の処理の具体例を示す図である。本実施例の第1機械翻訳部120は、第1言語の入力文41の入力を受け付けると、対訳辞書データベース180を参照して入力文41を第2言語の訳文へ翻訳する。図4の例では、入力文41に対応する訳文として訳文43が得られる。本実施例では、入力文41が第3機械翻訳部130Aへ渡される。
図19は、第2の実施例の第3機械翻訳部の処理の具体例を示す図である。第3機械翻訳部130Aは、対訳辞書データベース190Aを参照して入力文41を第3言語の訳文へ翻訳する。図19では、入力文41に対する第3言語の訳文として、訳文71と訳文72とが得られるものとした。訳文71と訳文72は、それぞれを第3言語コーパス210の検索キーとすべく、検索要求部140へ渡される。
図20は、第2の実施例の検索要求部と第3言語検索部の処理の具体例を示す第一の図である。検索要求部140は、第3言語の訳文71を受け取ると、訳文71を検索キーとした検索要求を第3言語検索部170へ行う。第3言語検索部170は、訳文71を検索キーとして第3言語コーパス210を曖昧検索し、検索結果を取得する。図20の例では、検索結果として、検索結果文711、712、713、714の4つの文が取得される。この4つの検索結果部711〜714は、検索一致度集計部150へ渡される。
図21は、第2の実施例の検索結果集計部の処理の具体例を示す第一の図である。検索一致度集計部150において、一致度計算部151は検索結果文711を取り出し、検索キーとなった訳文71との一致度を計算する。
図21の例では、訳文71に含まれる単語数は8個、検索結果文711に含まれる単語数は7個である。また訳文71と検索結果文711とにおいて一致する単語数は6個である。したがって一致度計算部151は、訳文71と検索結果文711との総単語数における一致する単語の割当として、2×6÷(8+7)=0.80を訳文71と検索結果文711との一致度として算出する。一致度計算部151は、検索結果文712、713、714に対しても同様の計算を行い、訳文71と各検索結果文711〜714との一致度をそれぞれ計算する。
続いて平均値計算部152は、訳文71と各検索結果文711〜714との一致度の平均値を計算する。図21の例では、訳文71と検索結果文711〜714のそれぞれの一致度は、0.80、0.71、0.67、0.56であるため、平均値計算部152はこの4つの一致度の平均値75を計算する。図21の例では、平均値75=0.685である。平均値75は、第3言語の訳文71に対応して計算された値である。
訳文71と検索結果文711〜714との一致度の平均値を計算すると、機械翻訳装置100Bは、2つ目の第3言語の訳文72についても同様の処理を行う。
図22は、第2の実施例の検索要求部と第3言語検索部の処理の具体例を示す第二の図である。検索要求部140は、第3言語の訳文72を受け取ると、訳文72を検索キーとした検索要求を第3言語検索部170へ行う。第3言語検索部170は、訳文72を検索キーとして第3言語コーパス210を曖昧検索し、検索結果を取得する。図22の例では、検索結果として、検索結果文721、722、723、724の4つの文が取得される。この4つの検索結果部721〜724は、検索一致度集計部150へ渡される。
図23は、第2の実施例の検索結果集計部の処理の具体例を示す第二の図である。検索一致度集計部150において、一致度計算部151は検索結果文721を取り出し、検索キーとなった訳文72との一致度を計算する。
図23の例では、訳文72に含まれる単語数は7個、検索結果文721に含まれる単語数は12個である。また訳文72と検索結果文721とにおいて一致する単語数は3個である。したがって一致度計算部151は、訳文72と検索結果文721との総単語数における一致する単語の割当として、2×3÷(7+12)=0.32を訳文72と検索結果文721との一致度として算出する。一致度計算部151は、検索結果文722、723、724に対しても同様の計算を行い、訳文72と各検索結果文721〜724との一致度をそれぞれ計算する。
続いて平均値計算部152は、訳文72と各検索結果文721〜724との一致度の平均値を計算する。図23の例では、訳文72と検索結果文721〜724のそれぞれの一致度は、0.32、0.27、0.38、0.44であるため、平均値計算部152はこの4つの一致度の平均値76を計算する。図23の例では、平均値76=0.352である。平均値76は、第3言語の訳文72に対応して計算された値である。
検索一致度集計部150は、第3機械翻訳部130Aによる翻訳で得られた全ての第3言語の訳文について、対応する平均値が計算されたか否かを判断する。図19において得られた第3言語の訳文は、訳文71と訳文72の2つであるから、機械翻訳装置100Bは次の処理へ進む。
図24は、第2の実施例の第3言語訳文選択部の処理の具体例を示す図である。第3言語訳文選択部161は、第3機械翻訳部130Aで得られた訳文71と訳文72において、それぞれに対応した平均値が大きいほうの訳文を入力文41の第3言語の訳文として選択する。
図24の例では、訳文71に対応した平均値75が0.685であり、訳文72に対応した平均値76が0.352である。したがって第3言語訳文選択部161は、入力文41の第3言語の訳文として、訳文71を選択する。
図25は、第2の実施例の第3言語差分特定部と第2言語置換箇所特定部の処理の具体例を示す図である。
第3言語差分特定部162は、訳文71において訳文72と異なる箇所を特定する。図25では、訳文71の「am committed」が訳文72の「store」と異なる箇所80として特定される。
箇所80が特定されると、第2言語置換箇所特定部163は、対訳辞書データベース190Bを参照し、図18で得られた第2言語の訳文43において箇所80と対応する箇所の訳語81を特定する。訳語81は、単語の置換対象となる訳語である。図25では、箇所80である「am committed」に対応する訳語81は「保管」となる。
図26は、第2の実施例の第4機械翻訳部の処理の具体例を示す図である。第4機械翻訳部164は、図24で選択された第3言語の訳文71を第2言語の訳文725へ翻訳する。
図27は、第2の実施例の第2言語置換部の処理の具体例を示す図である。第2言語置換部165は、訳文43において特定された訳語81を、第2言語の訳文725において訳語81に対応する単語に置き換える。
図27では、訳文725において訳語81に対応する単語は「約束」である。そこで第2言語置換部165は、訳語81「保管」を単語「約束」へ置き換える。その結果、「保管」が「約束」に置き換えられた置換後訳語81Aを含む第2言語の訳文43Aが得られる。
本実施例の第2言語訳文出力部175は、第2言語の訳文43Aを入力文41の第2言語の訳文として出力する。
訳文43は、入力文41から直接翻訳した第2言語の訳文であるため、訳文全体としては適切である。本実施例は、例えば訳文43に適切でない訳語が含まれた場合等に、多くの例文が存在する十分な大きさのコーパスを有する第3言語を用いて適切な訳語を得ることができる。また本実施例では、例えば第1機械翻訳部120で得られた第2言語の訳文が適切であるか否かを第3言語の訳文を用いて確認することができ、第2言語の訳文が不適切であった場合には適切な訳語に修正することができる。
以上のように本実施例では、第1言語の入力文を、多くの例文が存在する十分な大きさのコーパスを有する第3言語の訳文に翻訳することで、入力文に対応した第2言語の訳文に不適切な訳語が含まれていた場合に適切な訳語に置き換えることができる。よって本実施例では、簡易な手順で翻訳の精度を向上させることができる。
また本実施例の機械翻訳装置100Bは、例えば第1機械翻訳部120による翻訳結果を一度表示ユニット13に表示させても良い。そして例えば機械翻訳装置100Bの利用者から再翻訳の指示を受けたときに、図17の処理を実行しても良い。
本発明の実施例は、以下に記載する付記が考えられる。
(付記1)
第1言語文を第2言語文に翻訳する機械翻訳装置であって、
前記第1言語文又は前記第2言語文を第3言語文に翻訳する翻訳部と、
翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索した結果を用いて前記第1言語文に対応した第2言語文を出力する第2言語訳文出力部と、を有する機械翻訳装置。
(付記2)
前記検索キーと、前記データベースの検索結果に含まれる前記第3言語の例文との一致度を計算する検索一致度集計部を有し、
前記検索一致度集計部は、
前記検索キーと前記例文毎の一致度を計算する一致度計算部と、
前記検索キーと前記例文毎の一致度の平均値を計算する平均値計算部と、を有し、
前記一致度の平均値を前記検索キーに対応した一致度とする付記1記載の機械翻訳装置。
(付記3)
前記第2言語訳文出力部は、
前記一致度の平均値が最も高い前記検索キーである前記第3言語文に対応した前記第2言語文を、前記第1言語文に対応した第2言語文として出力する付記2記載の機械翻訳装置。
(付記4)
前記翻訳部は、
前記第1言語文を前記第2言語文へ翻訳する第1機械翻訳部と、
前記第1言語文に対する前記第2言語文が複数存在した場合、複数の前記第2言語文をそれぞれ前記第3言語文に翻訳する第2機械翻訳部と、を有する付記1乃至3の何れか一項に記載の機械翻訳装置。
(付記5)
前記複数の前記第2言語文において、前記検索一致度集計部により計算された前記検索キーに対応した一致度の平均値が最も高い前記第3言語文に対応した前記第2言語文を、前記第1言語文に対応する第2言語文に選択する第2言語訳文選択部を有する付記4記載の機械翻訳装置。
(付記6)
前記翻訳部は、
前記第1言語文に対する前記第2言語文が単数であった場合、前記第1言語文を前記第3言語文に翻訳する第3機械翻訳部を有する付記1乃至5の何れか一項に記載の機械翻訳装置。
(付記7)
前記第1言語文から翻訳された前記第3言語文において、前記一致度の前記平均値が最も高い前記検索キーである前記第3言語文を選択する第3言語訳文選択部を有する付記6記載の機械翻訳装置。
(付記8)
前記第3言語訳文選択部により選択された前記第3言語文と、前記第1言語文から翻訳された他の前記第3言語文との間で訳語が異なる箇所を特定する第3言語差分特定部と、
前記第1言語文に対応した前記第2言語文において、前記第3言語差分特定部により特定された箇所と対応する訳語を特定する第2言語置換箇所特定部と、を有する付記7記載の機械翻訳装置。
(付記9)
前記翻訳部は、
前記第3言語訳文選択部により選択された前記第3言語文を前記第2言語文に翻訳する第4機械翻訳部を有し、
前記第2言語置換箇所特定部により特定された箇所を、前記第4機械翻訳部の翻訳により得られた前記第2言語文において前記特定された訳語に対応する訳語に置き換える第2言語置換部を有する付記8記載の機械翻訳装置。
(付記10)
前記第3言語文を前記検索キーとして前記データベースの検索要求を行う検索要求部と、
前記検索要求を受けて、前記検索キーで前記データベースの曖昧検索を実行する第3言語検索部と、を有する付記1乃至9の何れか一項に記載の機械翻訳装置。
(付記11)
コンピュータが第1言語文を第2言語文に翻訳する機械翻訳方法であって、該コンピュータが、
前記第1言語文又は前記第2言語文を第3言語文に翻訳し、
翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索した結果を用いて前記第1言語文に対応した第2言語文を出力する機械翻訳方法。
(付記12)
第1言語文又は第2言語文を第3言語文に翻訳する処理と、
翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索した結果を用いて前記第1言語文に対応した第2言語文を出力する処理と、をコンピュータに実行させる機械翻訳プログラム。
100、100A、100B 機械翻訳装置
110 第1言語入力部
120 第1機械翻訳部
130 第2機械翻訳文
130A 第3機械翻訳部
140 検索要求部
150 検索結果集計部
160 第2言語訳文選択部
161 第3言語訳文選択部
162 第3言語差分特定部
163 第2言語置換箇所特定部
164 第4機械翻訳部
165 第2言語置換部
170 第3言語検索部
180、190、190A、190B 対訳辞書データベース
200 データベース装置
210 第3言語コーパス

Claims (4)

  1. 第1言語文を第2言語文に翻訳する第1翻訳部と、
    前記第1翻訳部において前記第1言語文から翻訳された第2言語文が複数であった場合、前記第2言語文を第3言語文に翻訳する第2翻訳部と、
    翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索して一又は複数の第3言語の例文を取得する検索部と、
    前記検索キーと前記第3言語の例文毎の一致度を計算し、前記検索キー毎に一致度の平均値を計算し、前記一致度の平均値を前記検索キーに対応した一致度とする平均値計算部と、
    前記一致度の平均値が最も高い検索キーである第3言語文に対応した第2言語文を選択する第2言語文選択部と、
    前記第2言語文選択部で選択された第2言語文を、前記第1言語文に対応した第2言語文として出力する第2言語訳文出力部と、
    を有する機械翻訳装置。
  2. 前記第1翻訳部において前記第1言語文から翻訳された第2言語文が単数であった場合、前記第2翻訳部は、前記第1言語文を第3言語文に翻訳し、
    前記第1言語文から翻訳された第3言語文について前記平均値計算部にて計算された一致度の平均値が最も高い検索キーである第3言語文を選択する第3言語訳文選択部と、
    前記第3言語訳文選択部により選択された第3言語文と、前記第1言語文から翻訳された他の第3言語文との間で訳語が異なる箇所を特定する第3言語差分特定部と、
    前記第1言語文に対応した第2言語文において、前記第3言語差分特定部により特定された箇所と対応する訳語を特定する第2言語置換箇所特定部と、
    前記第3言語訳文選択部により選択された第3言語文を前記第2言語文に翻訳する第4機械翻訳部と、
    前記第2言語置換箇所特定部により特定された箇所を、前記第4機械翻訳部の翻訳により得られた第2言語文において特定された訳語に対応する訳語に置き換える第2言語置換部と、を有し、
    前記第2言語訳文出力部は、前記第2言語文選択部で選択された第2言語文の代わりに、前記第2言語置換部で置き換えた第2言語文を前記第1言語文に対応した第2言語文として出力する請求項1記載の機械翻訳装置。
  3. 第1言語文を第2言語文に翻訳し、
    前記第1言語文から翻訳された第2言語文が複数であった場合、前記第2言語文を第3言語文に翻訳し、
    翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索して一又は複数の第3言語の例文を取得し、
    前記検索キーと前記第3言語の例文毎の一致度を計算し、前記検索キー毎に一致度の平均値を計算し、前記一致度の平均値を前記検索キーに対応した一致度とし、
    前記一致度の平均値が最も高い検索キーである第3言語文に対応した第2言語文を選択し、
    前記第2言語文の選択で選択された第2言語文を、前記第1言語文に対応した第2言語文として出力する処理、をコンピュータが実行する機械翻訳方法。
  4. 第1言語文を第2言語文に翻訳し、
    前記第1言語文から翻訳された第2言語文が複数であった場合、前記第2言語文を第3言語文に翻訳し、
    翻訳された前記第3言語文を検索キーとして、第1言語及び第2言語の例文よりも多数の第3言語の例文が蓄積されたデータベースを検索して一又は複数の第3言語の例文を取得し、
    前記検索キーと前記第3言語の例文毎の一致度を計算し、前記検索キー毎に一致度の平均値を計算し、前記一致度の平均値を前記検索キーに対応した一致度とし、
    前記一致度の平均値が最も高い検索キーである第3言語文に対応した第2言語文を選択し、
    前記第2言語文の選択で選択された第2言語文を、前記第1言語文に対応した第2言語文として出力する処理と、をコンピュータに実行させる機械翻訳プログラム。
JP2012077857A 2012-03-29 2012-03-29 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム Active JP5915326B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012077857A JP5915326B2 (ja) 2012-03-29 2012-03-29 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
US13/733,340 US9298701B2 (en) 2012-03-29 2013-01-03 Machine translation device, machine translation method, and recording medium storing machine translation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012077857A JP5915326B2 (ja) 2012-03-29 2012-03-29 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2013206397A JP2013206397A (ja) 2013-10-07
JP5915326B2 true JP5915326B2 (ja) 2016-05-11

Family

ID=49236194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012077857A Active JP5915326B2 (ja) 2012-03-29 2012-03-29 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Country Status (2)

Country Link
US (1) US9298701B2 (ja)
JP (1) JP5915326B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015060458A (ja) * 2013-09-19 2015-03-30 株式会社東芝 機械翻訳装置、方法、及びプログラム
US10990362B1 (en) * 2014-01-17 2021-04-27 Tg Llc Converting programs to visual representation with reading complied binary
US10191899B2 (en) 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
JP6705318B2 (ja) * 2016-07-14 2020-06-03 富士通株式会社 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム
CN107179837B (zh) * 2017-05-11 2020-11-06 北京小米移动软件有限公司 输入方法及装置
KR102516363B1 (ko) 2018-01-26 2023-03-31 삼성전자주식회사 기계 번역 방법 및 장치
KR102637340B1 (ko) * 2018-08-31 2024-02-16 삼성전자주식회사 문장 매핑 방법 및 장치
JP7115187B2 (ja) * 2018-09-27 2022-08-09 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム
JPWO2021009972A1 (ja) * 2019-07-18 2021-09-13 株式会社モールサービス 自然言語処理方法、自然言語処理システム、及び、自然言語処理プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03212764A (ja) * 1990-01-18 1991-09-18 Canon Inc 電子機器
JP3015509B2 (ja) 1991-06-21 2000-03-06 富士通株式会社 機械翻訳用自動学習装置
JPH05298359A (ja) 1992-04-16 1993-11-12 Ricoh Co Ltd 機械翻訳装置
JPH05298360A (ja) * 1992-04-17 1993-11-12 Hitachi Ltd 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
JP3919771B2 (ja) * 2003-09-09 2007-05-30 株式会社国際電気通信基礎技術研究所 機械翻訳システム、その制御装置、及びコンピュータプログラム
CN1894688A (zh) * 2003-12-15 2007-01-10 有限会社言语技术研究所 对译判断装置、方法及程序
JP2008077601A (ja) * 2006-09-25 2008-04-03 Toshiba Corp 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
JP4256891B2 (ja) * 2006-10-27 2009-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳の精度を向上させる技術
JP5280642B2 (ja) 2007-04-23 2013-09-04 株式会社船井電機新応用技術研究所 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法
US8515731B1 (en) * 2009-09-28 2013-08-20 Google Inc. Synonym verification

Also Published As

Publication number Publication date
US20130262077A1 (en) 2013-10-03
JP2013206397A (ja) 2013-10-07
US9298701B2 (en) 2016-03-29

Similar Documents

Publication Publication Date Title
JP5915326B2 (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
US6535842B1 (en) Automatic bilingual translation memory system
JP4911028B2 (ja) 単語翻訳装置、翻訳方法および翻訳プログラム
JP6671027B2 (ja) 換言文生成方法、該装置および該プログラム
US5895446A (en) Pattern-based translation method and system
JP5280642B2 (ja) 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法
EP0562818A2 (en) System for pattern based text translation
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
US20030200079A1 (en) Cross-language information retrieval apparatus and method
JP6404511B2 (ja) 翻訳支援システム、翻訳支援方法、および翻訳支援プログラム
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP4875040B2 (ja) 機械翻訳システム及び機械翻訳プログラム
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP5439776B2 (ja) 単語アライメント装置及び単語アライメントプログラム
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP6934621B2 (ja) 方法、装置、及びプログラム
JP2018055620A (ja) 情報処理装置及びプログラム
JP6221339B2 (ja) 翻訳装置及び翻訳方法
JP2014164739A (ja) 対訳辞書生成装置及び方法、並びにそのためのコンピュータプログラム
WO2012127805A1 (ja) 訳語選択条件抽出システム、訳語選択条件抽出方法および訳語選択条件抽出プログラム
JP3884001B2 (ja) 言語解析システムおよび方法
Zhou et al. A new framework to deal with OOV words in SLT system
JP2006134051A (ja) 翻訳装置、翻訳方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150106

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160321

R150 Certificate of patent or registration of utility model

Ref document number: 5915326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150