JP6334084B2 - 翻訳支援装置、翻訳支援方法および翻訳支援プログラム - Google Patents

翻訳支援装置、翻訳支援方法および翻訳支援プログラム Download PDF

Info

Publication number
JP6334084B2
JP6334084B2 JP2012201747A JP2012201747A JP6334084B2 JP 6334084 B2 JP6334084 B2 JP 6334084B2 JP 2012201747 A JP2012201747 A JP 2012201747A JP 2012201747 A JP2012201747 A JP 2012201747A JP 6334084 B2 JP6334084 B2 JP 6334084B2
Authority
JP
Japan
Prior art keywords
translation
data
sentence
parallel
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012201747A
Other languages
English (en)
Other versions
JP2014056492A (ja
Inventor
貢 三浦
貢 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012201747A priority Critical patent/JP6334084B2/ja
Publication of JP2014056492A publication Critical patent/JP2014056492A/ja
Application granted granted Critical
Publication of JP6334084B2 publication Critical patent/JP6334084B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、翻訳支援装置、翻訳支援方法および翻訳支援プログラムに関する。
過去に翻訳者が翻訳した結果を再利用することにより、翻訳作業を効率化する翻訳支援装置がある。翻訳支援装置は、翻訳者が翻訳した結果を利用するので、機械翻訳と比較して、品質の高い翻訳を実施することが可能である。一方、翻訳者が翻訳した文が事前に翻訳支援装置に登録されていない場合は、翻訳ができないという問題がある。
上記問題に対処するために、翻訳メモリ、すなわち原文とその翻訳文とを一対とする対訳データを広範囲に収集し、その対訳データの集まりを翻訳支援装置において利用することが考えられる。しかしながら、当該対処法では、対訳データが広範囲に収集されるものであるため、その対訳データに含まれる翻訳文が、原文の翻訳文として適切であるか否かの判断が困難になるという問題がある。適切な判断なしに収集された対訳データを利用することは、翻訳の質の低下につながるという問題がある。
さらに上記問題に対処する技術として、例えば、特許文献1は、機械翻訳装置を開示する。この機械翻訳装置は、各種の分野の文章が混在する原文を翻訳する際に、原文を指定した範囲に分け、その範囲の分野を推定することにより、分野に適した精度の高い翻訳を実施している。
また、特許文献2は、複数の辞書データベースを用いる機械翻訳装置を開示する。この機械翻訳装置は、対訳が記述され、対訳の内容に応じた分類コードが付与された対訳文書を用いて訳語対を分類し、その訳語対を分類ごとに辞書データベースに格納する。この構成により、該機械翻訳装置は、分類に沿った訳語を利用することで、翻訳の精度を向上している。
特開平5−257966号公報 特開2008−083849号公報
特許文献1に開示される機械翻訳装置では、使用する辞書に含まれる訳語のうち、翻訳対象文に関わる分野に適した訳語を使用することにより翻訳の精度を向上することはできる。しかしながら、該機械翻訳装置は、収集された対訳データから利用する対訳データを選択する際の精度を向上することはできないという課題がある。
また、特許文献2に開示される機械翻訳装置では、対訳文書に基づいて辞書を分類することにより、使用する辞書に含まれる訳語の精度を向上することはできる。しかしながら、該機械翻訳装置は、上記と同様に、収集された対訳データから利用する対訳データを選択する際の精度を向上することはできないという課題がある。
本願発明は、上記課題を鑑みてなされたものであり、収集された対訳データから利用する対訳データを選択する際の精度を向上することができる翻訳支援装置、翻訳支援方法および翻訳支援プログラムを提供することを主要な目的とする。
本発明に係る第1の翻訳支援装置は、原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリと、翻訳対象文の翻訳に利用される候補となる前記対訳データを前記翻訳メモリから抽出する類似文抽出部と、前記類似文抽出部により抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する対訳データ登録部とを備え、前記類似文抽出部は、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける。
本発明に係る第1の翻訳支援方法は、原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出し、前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録し、前記対訳データを抽出するに際し、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける。
本発明に係る第1の翻訳支援プログラムは、原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出する処理と、前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する処理と、前記対訳データを抽出するに際し、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける処理とを、コンピュータに実行させる。
なお同目的は、上記の各構成を有する翻訳支援装置および翻訳支援方法を、コンピュータによって実現するコンピュータ・プログラム、およびそのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記憶媒体によっても達成される。
本願発明によれば、収集された対訳データから利用する対訳データを選択する際の精度を向上することができる効果が得られる。
本発明の第1の実施形態に係る翻訳支援装置の構成を示すブロック図である。 本発明の第1の実施形態に係る翻訳支援装置のハードウエア構成を示す図である。 本発明の第1の実施形態に係る翻訳支援装置の分野設定部が利用者に提示する分野設定の画面の一例を示す図である。 本発明の第1の実施形態に係る翻訳支援装置の分野辞書に格納される辞書データの一例を示す図である。 本発明の第1の実施形態に係る翻訳支援装置の翻訳メモリに格納される対訳データの一例を示す図である。 本発明の第1の実施形態に係る翻訳支援装置の翻訳メモリに格納される対訳データの他の例を示す図である。 本発明の第1の実施形態に係る翻訳支援装置の翻訳制御部の動作を説明するフローチャートである。 本発明の第2の実施形態に係る翻訳支援装置の構成を示すブロック図である。
第1の実施形態
本発明の実施形態について図面を参照して詳細に説明する。
図1は、本発明の第1の実施形態に係る翻訳支援装置100の構成を示すブロック図である。図1に示すように、翻訳支援装置100は、入出力制御部10、翻訳制御部20、機械翻訳部30、分野設定部40、分野情報記憶部41、翻訳データ記憶部50、翻訳メモリ60および分野辞書70を備える。翻訳制御部20は、翻訳文読み出し部21、類似文抽出部22、対訳データ登録部23を備える。
各構成要素の概略について説明する(詳細は後述する)。
入出力制御部10は、利用者からデータの入力を受け付けたり、利用者に対してデータを提示したりする。翻訳制御部20は、翻訳文読み出し部21、類似文抽出部22および対訳データ登録部23において、過去に翻訳された結果を用いながら、翻訳データ記憶部50に格納される翻訳対象文書の翻訳を実施する。
翻訳データ記憶部50は、翻訳の対象となる翻訳対象文書を格納する。翻訳メモリ60は、過去に翻訳された結果である対訳データを多数格納する。分野辞書70は、見出し語(単語)と、その語の分野ごとに適した訳語とを含む辞書データを格納する。
機械翻訳部30は、利用者からの指示に応答して、翻訳対象文の機械翻訳を実施する。分野設定部40は、利用者から翻訳文の分野の設定を受け付けると共に、受け付けた分野を表す情報を分野情報記憶部41に格納する。翻訳支援装置100の利用者は、機械翻訳を実施する際にその精度を上げるために、翻訳文の分野を分野設定部40を介して予め設定しておく。
図1の翻訳支援装置100の入出力制御部10、翻訳制御部20、機械翻訳部30、分野設定部40は、コンピュータにより実現した場合、図2に例示するハードウエア構成を有する。図2に示す構成は、CPU(Central Processing Unit)200、メモリ等の記憶媒体201および記憶媒体201に含まれるプログラム202を備える。CPU200は、各種ソフトウエア・プログラム(コンピュータ・プログラム)を実行することにより、翻訳支援装置100の全体的な動作を司る。本実施形態および以下に示す他の実施形態において、CPU200が、メモリ等の記憶媒体201を適宜参照しながら、以下に示す翻訳支援装置100が備える各機能(各部)のソフトウエア・プログラムを実行する。
より具体的には、CPU200は、メモリ等の記憶媒体201を適宜参照しながら、翻訳支援装置100が備える機能を実施するソフトウエア・プログラムを実行することにより、入出力制御部10、翻訳制御部20、機械翻訳部30および分野設定部40等のソフトウエア・プログラムを実行する。
次に、翻訳の手順について具体的に説明する。
翻訳支援装置100の利用者は、まず、入出力制御部10を介して分野設定部40に対し、翻訳文の分野を設定する。ここで分野を設定するのは、機械翻訳部30が機械翻訳を実施する際に使用する分野辞書70の分野を設定するためである。図3は、分野設定部40が入出力制御部10を介して利用者に提示する分野設定の画面の一例を示す図である。図3に示すように、各種分野の一覧を表示するとともにいずれかの分野の選択を受け付けるようにしてもよい。利用者は、入出力制御部10を介して分野を選択すると、分野設定部40は選択された分野を分野情報記憶部41に格納しておく。
図4は、分野辞書70に格納される辞書データの一例を示す図である。図4に示すように、辞書データは、見出し語(単語)と、その語の分野ごとに適した訳語とを有する。例えば、「operation」という単語は、医学分野の翻訳で使用される場合は「手術」という訳語が用いられ、経済分野の翻訳で使用される場合は「操作」という訳語が用いられる。
機械翻訳部30は、翻訳対象文の機械翻訳を実施する指示を受けると、分野情報記憶部41に格納された分野に関連付けられた分野辞書70の訳語を用いて、機械翻訳を実施する。このように、機械翻訳部30は機械翻訳の際に分野辞書70を用いることにより、機械翻訳の精度を向上する。
図5は、翻訳メモリ60に格納される対訳データの一例を示す図である。図5に示すように、対訳データは、原文と、その原文を過去に翻訳者が翻訳したり、機械翻訳の結果を翻訳者が修正等したりした結果である翻訳文との、一対の組み合わせである。ここでは、日本語の原文と、それを英語に翻訳した翻訳文との組み合わせである対訳データを格納することを示す。翻訳メモリ60は、広範囲に収集された対訳データを多数格納している。
図6は、翻訳メモリ60に格納される対訳データの他の例を示す図である。図6に示す対訳データには、原文とその翻訳文に加えて、該対訳データに含まれる翻訳文が過去の翻訳において利用された分野を表す情報が関連付けられている。ここでは、分野を表す情報として、例えば、各対訳データが過去の翻訳において利用された分野の回数を関連付けることを示す。例えば、対訳データ1は、過去に、医学分野で1回、経済分野で5回、化学分野で2回利用されたことを示す。対訳データに分野を表す情報を関連付けることについて、詳細は後述する。
図7は、翻訳制御部20による翻訳の動作を説明するフローチャートである。図7を参照して、翻訳制御部20による翻訳の動作について説明する。
翻訳支援装置100の利用者は、上述のように分野を設定した後、入出力制御部10を介して翻訳を実施する指示を出す。入出力制御部10は、上記指示に応答して、翻訳文読み出し部21に翻訳開始を指示する。翻訳文読み出し部21は、上記指示に応答して、翻訳データ記憶部50から翻訳の対象となる翻訳文書を読み出すとともに、そのうちの1文を翻訳対象文として類似文抽出部22に通知する(STステップ101)。
類似文抽出部22は、受け取った翻訳対象文の翻訳に利用される候補となる対訳データを、翻訳メモリ60から抽出する(STステップ102)。すなわち、類似文抽出部22は、翻訳対象文と一致または類似する原文を含む1または複数の対訳データを、候補として翻訳メモリ60から抽出すると共に、類似する順に順位付ける。翻訳対象文と一致または類似する原文を含む対訳データを抽出することは、例えば、特開平7−160720号公報に開示されるため、その詳細な説明は省略する。
類似文抽出部22は、抽出した各対訳データに、分野情報が関連付けられているかどうかを判断する(STステップ103)。いずれの対訳データにも分野情報が関連付けられていない場合、類似文抽出部22は、翻訳対象文と最も類似すると順位付けた原文の翻訳文を、入出力制御部10を介して利用者に表示する(STステップ104)。
一方、類似文抽出部22は、抽出した対訳データのいずれかに分野情報が関連付けられている場合は、対訳データの順位付けを変更する。すなわち、抽出した対訳データに関連付けられた分野を表す情報のうち、分野情報記憶部41に記憶される分野を表す情報と一致するものがあれば、その対訳データを最も類似する対訳データとして順位付ける。例えば図6に示すように、過去の翻訳に利用された分野の回数が分野情報として各対訳データに関連付けられている場合、類似文抽出部22は、分野情報記憶部41に記憶される分野の回数が最も多い対訳データを最も類似する対訳データとして順位付けてもよい。また、抽出した対訳データに関連付けられた分野を表す情報のうち、分野情報記憶部41に格納される分野を表す情報と一致するものがない場合、類似文抽出部22は、STステップ104と同様に最も類似すると判断した原文の翻訳文を表示してもよい。
類似文抽出部22は、最も類似すると判断した対訳データに含まれる翻訳文を入出力制御部10を介して利用者に表示する(STステップ105)。利用者は、表示された翻訳文を見て、それが対訳として利用できるか否かを判断し(STステップ106)、その判断の結果を入出力制御部10に指示する。入出力制御部10は、利用者からの指示が、対訳として利用できない旨の指示であった場合、翻訳対象文を機械翻訳部30に通知する。機械翻訳部30は、受け取った翻訳対象文を、分野辞書70に格納される辞書データのうち分野情報記憶部41に記憶される分野の訳語を参照しながら、翻訳する(STステップ107)。機械翻訳部30は、機械翻訳の結果を対訳データ登録部23に通知する。
一方、STステップ106における利用者からの指示が、対訳として利用できる旨の指示であった場合、入出力制御部10は、対訳データ登録部23に対して当該対訳データの登録を指示する。
対訳データ登録部23は、ステップST107における機械翻訳の結果を受け取ると、その結果を翻訳メモリ60に登録する。このとき、対訳データ登録部23は、原文と、機械翻訳により取得された翻訳文とを含む対訳データと、分野情報記憶部41に記憶される分野の利用回数「1」とを、関連付けて、翻訳メモリ60に登録する(STステップ108)。
一方、対訳データ登録部23は、ステップST106における対訳データを対訳として利用できる旨の指示を受けたときは、当該対訳データに、分野情報記憶部41に記憶される分野の利用回数を現在の値に「1」加算したものを翻訳メモリ60に格納する(STステップ108)。このように、対訳データ登録部23は、対訳データが当該分野において過去に利用された回数を対訳データに関連付けて保存し、類似文抽出部22は、過去に当該分野で使用された回数の多い対訳データを最も類似する翻訳文として選択するので、精度の高い翻訳文を利用者に提示することができる。
対訳データ登録部23は、翻訳メモリ60に対して上記対訳データの登録が終了すると、その旨を翻訳文読み出し部21に通知する。翻訳文読み出し部21は、次の翻訳対象文が存在するか否かを判断する(STステップ109)。次の翻訳対象文が存在する場合、翻訳文読み出し部21は、ステップST101に処理を戻す。翻訳制御部20は、以降同様に、翻訳対象文がすべて翻訳されるまで、上記動作を繰り返す。一方、翻訳対象文が存在しない場合、翻訳文読み出し部21は、翻訳の終了を入出力制御部10を介して利用者に通知する。
なお、利用者は、入出力制御部10を介して提示された翻訳文を適宜修正し、修正後の翻訳文と原文とを対訳データとして、対訳データ登録部23が翻訳メモリ60に登録してもよい。また、対訳データ登録部23は、上述のように翻訳が実施されたタイミングで一文ずつ翻訳メモリ60に登録してもよいし、全文の翻訳が終了したタイミングで一括して翻訳メモリ60に登録してもよい。
以上のように、第1の実施形態1では、分野設定部40が利用者から設定された翻訳文の分野を表す情報を分野情報記憶部41に格納し、翻訳文読み出し部21は、翻訳データ記憶部50から翻訳対象文を読み出す。類似文抽出部22は、読み出された翻訳対象文の翻訳に利用される候補となる対訳データを翻訳メモリ60から抽出すると共に、翻訳対象文と原文とが類似する順に順位付ける。類似文抽出部22は、抽出した対訳データのうち、分野情報が関連付けられ、かつその分野が分野情報記憶部41に記憶される分野と一致するものを、最も類似する対訳データとして順位づける。対訳データ登録部23は、最も類似する対訳データを翻訳に利用すると判断された場合、当該対訳データに、分野情報記憶部41に記憶される分野を表す情報を関連付けて、翻訳メモリ60に格納する。この構成により、第1の実施形態によれば、翻訳に利用された分野を表す情報が対訳データに関連付けられると共に、今回の翻訳と分野が一致する対訳データが候補として提示されるので、収集された対訳データから利用する対訳データを選択する際の精度を向上することができる効果が得られる。
また、抽出されたいずれの対訳データも翻訳に利用しない翻訳対象文の機械翻訳を、機械翻訳部30が実施する。そして、対訳データ登録部23は、機械翻訳部30による翻訳文と原文との組み合わせに、分野情報記憶部41に記憶される分野を関連付けた対訳データを翻訳メモリ60に登録する。この構成により、新たな対訳データに分野を関連付けて登録することができるので、次回以降の対訳データを選択する際の精度をさらに向上することができる効果が得られる。
また、対訳データ登録部23は、分野を表す情報として、当該対訳データが過去の翻訳において利用された分野の回数を関連付け、類似文抽出部22は、分野情報記憶部41に記憶される分野で過去に利用された回数が最も多い対訳データを、最も類似する対訳データとして順位付けるので、対訳データを選択する際の精度をさらに向上することができる効果が得られる。
第2の実施形態
図8は、本発明の第2の実施形態に係る翻訳支援装置300の構成を示すブロック図である。図8に示すように、翻訳支援装置300は、翻訳メモリ301、類似文抽出部302および対訳データ登録部303を備える。
翻訳メモリ301は、原文と当該原文の翻訳文との組み合わせである対訳データを格納する。類似文抽出部302は、翻訳対象文の翻訳に利用される候補となる対訳データを翻訳メモリ301から抽出する。対訳データ登録部303は、類似文抽出部302により抽出された対訳データのうち、翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを翻訳メモリ301に登録する。また、類似文抽出部302は、抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、予め設定された分野と一致する対訳データを、翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける。
翻訳メモリ301は、上記実施形態の翻訳メモリ60に相当する。類似文抽出部302および対訳データ登録部303は、それぞれ上記実施形態の類似文抽出部22および対訳データ登録部23に相当する。
以上のように、第2の実施形態によれば、翻訳支援装置300は、上記構成を有するので、収集された対訳データから利用する対訳データを選択する際の精度を向上することができる効果が得られる。
なお、上述した各実施形態では、図1に示す翻訳支援装置100の入出力制御部10、翻訳制御部20、機械翻訳部30、分野設定部40を、図2に示すCPU200が実行する一例として、ソフトウエア・プログラムによって実現する場合について説明した。しかしながら、図1に示す各ブロックに示す機能は、一部または全部を、ハードウエアとして実現してもよい。
また、上述した各実施形態を例に説明した本発明は、上述した翻訳支援装置に対して、その説明において参照したフローチャート(図7)の機能を実現可能なコンピュータ・プログラムを供給した後、そのコンピュータ・プログラムを、CPU200に読み出して実行することによって達成される。
また、係る供給されたコンピュータ・プログラムは、読み書き可能なメモリ(一時記憶媒体)またはハードディスク装置等のコンピュータ読み取り可能な記憶デバイスに格納すればよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムを表すコード或いは係るコンピュータ・プログラムを格納した記憶媒体によって構成されると捉えることができる。
本発明は、例えば翻訳メモリを備えた翻訳支援装置に適用できる。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリと、
翻訳対象文の翻訳に利用される候補となる前記対訳データを前記翻訳メモリから抽出する類似文抽出部と、
前記類似文抽出部により抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する対訳データ登録部とを備え、
前記類似文抽出部は、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
翻訳支援装置。
(付記2)
前記対訳データ登録部は、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける
付記1記載の翻訳支援装置。
(付記3)
前記類似文抽出部により抽出された対訳データのいずれも翻訳に利用しない前記翻訳対象文の機械翻訳を行う機械翻訳部をさらに備え、
前記対訳データ登録部は、前記翻訳対象文と、前記機械翻訳部により取得された当該翻訳対象文の翻訳文との組み合わせに、前記予め設定された分野を表す情報を関連付けて、前記翻訳メモリに登録する
付記1または付記2記載の翻訳支援装置。
(付記4)
前記対訳データ登録部は、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付け、
前記類似文抽出部は、前記抽出した対訳データのうち、前記予め設定された分野の翻訳に利用された回数が最も多い対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
付記3記載の翻訳支援装置。
(付記5)
原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出し、
前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録し、
前記対訳データを抽出するに際し、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
翻訳支援方法。
(付記6)
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける
付記5記載の翻訳支援方法。
(付記7)
前記抽出された対訳データのいずれも翻訳に利用しない前記翻訳対象文の機械翻訳を行い、
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文と、前記機械翻訳により取得された当該翻訳対象文の翻訳文との組み合わせに、前記予め設定された分野を表す情報を関連付けて、前記翻訳メモリに登録する
付記5または付記6記載の翻訳支援方法。
(付記8)
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付け、
前記対訳データを抽出するに際し、前記抽出した対訳データのうち、前記予め設定された分野の翻訳に利用された回数が最も多い対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
付記7記載の翻訳支援方法。
(付記9)
原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出する処理と、
前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する処理と、
前記対訳データを抽出するに際し、前記抽出した対訳データのうち、当該対訳データに関連付けられた分野が、前記予め設定された分野と一致する対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける処理とを、
コンピュータに実行させる翻訳支援プログラム。
(付記10)
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける処理を、
コンピュータに実行させる付記9記載の翻訳支援プログラム。
(付記11)
前記抽出された対訳データのいずれも翻訳に利用しない前記翻訳対象文の機械翻訳を行う処理と、
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文と、前記機械翻訳により取得された当該翻訳対象文の翻訳文との組み合わせに、前記予め設定された分野を表す情報を関連付けて、前記翻訳メモリに登録する処理とを、
コンピュータに実行させる付記9または付記10記載の翻訳支援プログラム。
(付記12)
前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける処理と、
前記対訳データを抽出するに際し、前記抽出した対訳データのうち、前記予め設定された分野の翻訳に利用された回数が最も多い対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける処理とを、
コンピュータに実行させる付記11記載の翻訳支援プログラム。
10 入出力制御部
20 翻訳制御部
21 翻訳文読み出し部
22 類似文抽出部
23 対訳データ登録部
30 機械翻訳部
40 分野設定部
41 分野情報記憶部
50 翻訳データ記憶部
60 翻訳メモリ
70 分野辞書

Claims (10)

  1. 原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリと、
    翻訳対象文の翻訳に利用される候補となる前記対訳データを前記翻訳メモリから抽出すると共に、類似する順に順位付ける類似文抽出部と、
    前記類似文抽出部により抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する対訳データ登録部とを備え、
    前記類似文抽出部は、前記類似する順に順位付けられた対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データ、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付けを変更す
    翻訳支援装置。
  2. 前記対訳データ登録部は、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける 請求項1記載の翻訳支援装置。
  3. 前記類似文抽出部により抽出された対訳データのいずれも翻訳に利用しない前記翻訳対象文の機械翻訳を行う機械翻訳部をさらに備え、
    前記対訳データ登録部は、前記翻訳対象文と、前記機械翻訳部により取得された当該翻訳対象文の翻訳文との組み合わせに、前記予め設定された分野を表す情報を関連付けて、前記翻訳メモリに登録する
    請求項1または請求項2記載の翻訳支援装置。
  4. 前記対訳データ登録部は、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付け、
    前記類似文抽出部は、前記抽出した対訳データのうち、前記予め設定された分野の翻訳に利用された回数が最も多い対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
    請求項3記載の翻訳支援装置。
  5. 原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出すると共に、類似する順に順位付け
    前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録し、
    前記対訳データを抽出するに際し、前記類似する順に順位付けられた対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データ、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付けを変更す
    翻訳支援方法。
  6. 前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける
    請求項5記載の翻訳支援方法。
  7. 前記抽出された対訳データのいずれも翻訳に利用しない前記翻訳対象文の機械翻訳を行い、
    前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文と、前記機械翻訳により取得された当該翻訳対象文の翻訳文との組み合わせに、前記予め設定された分野を表す情報を関連付けて、前記翻訳メモリに登録する
    請求項5または請求項6記載の翻訳支援方法。
  8. 前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付け、
    前記対訳データを抽出するに際し、前記抽出した対訳データのうち、前記予め設定された分野の翻訳に利用された回数が最も多い対訳データを、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付ける
    請求項7記載の翻訳支援方法。
  9. 原文と当該原文の翻訳文との組み合わせである対訳データを格納する翻訳メモリから、翻訳対象文の翻訳に利用される候補となる前記対訳データを抽出すると共に、類似する順に順位付ける処理と、
    前記抽出された対訳データのうち、前記翻訳対象文の翻訳に利用された対訳データに対して、予め設定された分野を表す情報を関連付けると共に、当該分野を表す情報を関連付けた対訳データを前記翻訳メモリに登録する処理と、
    前記対訳データを抽出するに際し、前記類似する順に順位付けられた対訳データのうち、当該対訳データに関連付けられた分野を表す情報が、前記予め設定された分野と一致する対訳データ、前記翻訳対象文の翻訳に利用することに適した対訳データとして順位付けを変更する処理とを、
    コンピュータに実行させる翻訳支援プログラム。
  10. 前記対訳データを前記翻訳メモリに登録するに際し、前記翻訳対象文の翻訳に利用された対訳データに対して、前記予め設定された分野の翻訳に利用された回数を、前記分野を表す情報として関連付ける処理を、
    コンピュータに実行させる請求項9記載の翻訳支援プログラム。
JP2012201747A 2012-09-13 2012-09-13 翻訳支援装置、翻訳支援方法および翻訳支援プログラム Active JP6334084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012201747A JP6334084B2 (ja) 2012-09-13 2012-09-13 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012201747A JP6334084B2 (ja) 2012-09-13 2012-09-13 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Publications (2)

Publication Number Publication Date
JP2014056492A JP2014056492A (ja) 2014-03-27
JP6334084B2 true JP6334084B2 (ja) 2018-05-30

Family

ID=50613739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012201747A Active JP6334084B2 (ja) 2012-09-13 2012-09-13 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Country Status (1)

Country Link
JP (1) JP6334084B2 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0442348A (ja) * 1990-06-08 1992-02-12 Canon Inc 文字処理装置
JP3470975B2 (ja) * 1992-08-31 2003-11-25 オムロン株式会社 文書入力装置のかな漢字変換方法および装置
JPH10312382A (ja) * 1997-05-13 1998-11-24 Keiichi Shinoda 類似用例翻訳システム
JP2002366543A (ja) * 2001-06-06 2002-12-20 Matsushita Electric Ind Co Ltd 文書作成システム
JP4050950B2 (ja) * 2002-07-26 2008-02-20 富士通株式会社 対訳候補表示装置および対訳候補表示プログラム
JP2005275676A (ja) * 2004-03-24 2005-10-06 Nec Corp コンテンツ提供システム、コンテンツ提供方法、サーバおよびそのプログラム
JP2011180980A (ja) * 2010-03-03 2011-09-15 Ricoh Co Ltd 翻訳支援装置及び翻訳支援プログラム

Also Published As

Publication number Publication date
JP2014056492A (ja) 2014-03-27

Similar Documents

Publication Publication Date Title
US8990066B2 (en) Resolving out-of-vocabulary words during machine translation
JP2007226729A (ja) 訳語情報出力処理プログラム,処理方法および処理装置
JP5915326B2 (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
US20200302124A1 (en) Translation device, translation method, and program
JPWO2014087703A1 (ja) 単語分割装置、単語分割方法、及び単語分割プログラム
CN108701126B (zh) 主题推定装置、主题推定方法以及存储介质
KR101083455B1 (ko) 통계 데이터에 기초한 사용자 질의 교정 시스템 및 방법
CN107977454A (zh) 双语语料清洗的方法、装置及计算机可读存储介质
JP6160438B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP2011238159A (ja) 計算機システム
JP6334084B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JP2011191834A (ja) 文書分類方法、文書分類装置、およびプログラム
JP4734400B2 (ja) 文書検索装置およびプログラム
JP2006309377A (ja) 文書検索装置および文書検索方法ならびにそのプログラムと記録媒体
JP6259599B2 (ja) 対訳評価装置、翻訳装置、対訳評価方法、及びプログラム
US10936816B2 (en) Non-transitory computer-readable storage medium, analysis method, and analysis device
JP2010092108A (ja) 類似文章抽出プログラム、方法、装置
KR100831037B1 (ko) 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
JP2013077084A (ja) 文例辞書生成プログラム及び文例辞書生成装置
JP2007156932A (ja) 学習方法、学習装置、および検索方法、検索装置
Aransa et al. Semi-supervised transliteration mining from parallel and comparable corpora
JP6221339B2 (ja) 翻訳装置及び翻訳方法
JP4983397B2 (ja) 文書検索装置、および文書検索方法、並びにコンピュータ・プログラム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
JP2018055620A (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170522

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170530

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20170804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180426

R150 Certificate of patent or registration of utility model

Ref document number: 6334084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150