JP7160327B2 - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP7160327B2
JP7160327B2 JP2018175745A JP2018175745A JP7160327B2 JP 7160327 B2 JP7160327 B2 JP 7160327B2 JP 2018175745 A JP2018175745 A JP 2018175745A JP 2018175745 A JP2018175745 A JP 2018175745A JP 7160327 B2 JP7160327 B2 JP 7160327B2
Authority
JP
Japan
Prior art keywords
translated
machine
original
text
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018175745A
Other languages
English (en)
Other versions
JP2019087233A (ja
Inventor
正人 藤澤
博志 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IB Research KK
Original Assignee
IB Research KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IB Research KK filed Critical IB Research KK
Publication of JP2019087233A publication Critical patent/JP2019087233A/ja
Application granted granted Critical
Publication of JP7160327B2 publication Critical patent/JP7160327B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、翻訳作業を支援する情報処理装置、情報処理方法及び情報処理プログラムに関する。
従来、翻訳者による翻訳作業を支援する翻訳支援装置が知られている(例えば、特許文献1を参照)。
特開平6-282567号公報
翻訳作業では、翻訳者が文書に含まれる原文を翻訳文に翻訳した後に、翻訳文に誤訳や訳抜けが発生していないかを確認することが求められている。しかしながら、従来の翻訳支援装置では、翻訳文における誤訳や訳抜けの発生を特定するための機能を有しておらず、効率的に誤訳及び訳抜けの発生を確認することができないという問題があった。
そこで、本発明はこれらの点に鑑みてなされたものであり、翻訳文における誤訳及び訳抜けの発生の確認を支援することができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
本発明の第1の態様に係る情報処理装置は、第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部と、前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させる表示制御部と、を備える。
前記取得部は、前記第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第2言語に対応する複数の翻訳文とを取得し、前記生成部は、前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成し、前記抽出部は、前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出し、前記情報処理装置は、前記複数の機械翻訳文のそれぞれに含まれる前記特徴情報と、前記複数の原文のそれぞれに含まれる前記特徴情報との合致率を算出する算出部と、算出された合致率に基づいて、前記複数の機械翻訳文のそれぞれに対応する原文を特定する特定部とをさらに備え、前記表示制御部は、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記合致率とを関連付けて前記表示部に表示させてもよい。
前記算出部は、前記複数の原文及び前記複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、前記複数の機械翻訳文のそれぞれに含まれる特徴情報の、前記複数の原文のそれぞれにおける含有率である第1含有率を前記合致率として算出し、前記特定部は、前記複数の機械翻訳文のそれぞれに対して、複数の原文のうち前記第1含有率が相対的に高い原文を特定し、前記表示制御部は、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記第1含有率とを関連付けて表示部に表示させてもよい。
前記表示制御部は、前記第1含有率が低い順に、前記原文と、前記翻訳文と、前記第1含有率とを前記表示部に表示させてもよい。
前記算出部は、前記複数の機械翻訳文のそれぞれに対して特定された原文に含まれる特徴情報の、当該原文が特定された機械翻訳文における含有率である第2含有率を算出し、前記表示制御部は、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記第1含有率と、当該原文に対応する第2含有率とを関連付けて前記表示部に表示させてもよい。
前記表示制御部は、前記第1含有率及び前記第2含有率に基づく順に、前記原文と、前記翻訳文と、前記第1含有率と、前記第2含有率とを前記表示部に表示させてもよい。
前記表示制御部は、前記第1含有率と前記第2含有率との乗算値が低い順に、前記原文と、前記翻訳文と、前記第1含有率と、前記第2含有率とを前記表示部に表示させてもよい。
前記算出部は、前記複数の原文及び前記複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、前記複数の原文のそれぞれに含まれる特徴情報の、前記複数の機械翻訳文のそれぞれにおける含有率である第2含有率を前記合致率として算出し、前記特定部は、前記複数の原文のそれぞれに対して、複数の機械翻訳文のうち前記第2含有率が相対的に高い機械翻訳文を特定し、前記表示制御部は、前記複数の原文と、当該複数の原文のそれぞれに対して特定された機械翻訳文に対応する翻訳文と、当該機械翻訳文に対応する前記第2含有率とを関連付けて前記表示部に表示させてもよい。
前記算出部は、前記複数の原文のそれぞれに対して特定された機械翻訳文に含まれる特徴情報の、当該機械翻訳文に対応する原文における含有率である第1含有率を算出し、前記表示制御部は、前記複数の原文と、当該複数の原文のそれぞれに対して特定された機械翻訳文に対応する翻訳文と、当該機械翻訳文に対応する前記第2含有率と、当該機械翻訳文に対応する第1含有率とを関連付けて前記表示部に表示させてもよい。
前記取得部は、前記第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第2言語に対応する複数の翻訳文とを取得し、前記生成部は、前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成し、前記抽出部は、前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出し、前記情報処理装置は、前記複数の原文から抽出された1以上の特徴情報のうち、前記複数の機械翻訳文のいずれにも含まれていない特徴情報を特定する特定部をさらに備え、前記表示制御部は、前記複数の原文を前記表示部に表示させるとともに、当該原文に含まれる特定された前記特徴情報を、当該原文に含まれる当該特徴情報とは異なる文字列と異なる表示態様で表示させてもよい。
前記表示制御部は、前記原文に含まれる前記特徴情報の数と、前記機械翻訳文に含まれる前記特徴情報の数との比較結果に対応する情報を前記表示部に表示させてもよい。
前記表示制御部は、前記原文に含まれる前記特徴情報の数に対する、前記機械翻訳文に含まれる前記特徴情報の数の割合が所定の割合以下である場合に、前記翻訳文に訳抜けが発生している可能性が高いことを示す情報を前記表示部に表示させてもよい。
前記特徴情報は、単語であり、前記表示制御部は、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第1閾値未満である場合に、前記翻訳文に誤訳が発生している可能性が高いことを示す情報を前記表示部に表示させてもよい。
前記特徴情報は、数値、符号及び記号の少なくともいずれかであり、前記表示制御部は、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第2閾値未満である場合に、前記翻訳文に誤記が含まれている可能性が高いことを示す情報を前記表示部に表示させてもよい。
前記生成部は、前記取得部が前記原文と前記翻訳文とを取得すると、前記第1言語の機械翻訳文を生成し、前記抽出部は、前記生成部が前記第1言語の機械翻訳文を生成すると、前記原文から1以上の特徴情報を抽出するとともに、前記機械翻訳文から1以上の特徴情報を抽出し、前記表示制御部は、前記抽出部が特徴情報を抽出すると、前記比較結果を前記表示部に表示させてもよい。
前記取得部は、前記第1言語に対応する原文を取得すると、前記原文に対する前記第2言語の機械翻訳文を生成して前記表示部に表示させ、前記翻訳者により当該第2言語の機械翻訳文の編集を受け付け、当該第2言語の機械翻訳文の編集完了操作を受け付けると、編集された当該第2言語の機械翻訳文を、前記第2言語の翻訳文として取得してもよい。
本発明の第2の態様に係る情報処理方法は、コンピュータが実行する、第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得するステップと、前記翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、を備える。
本発明の第3の態様に係る情報処理プログラムは、コンピュータを、第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部、前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、及び、前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させる表示制御部、として機能させる。
本発明によれば、複数の翻訳文における誤訳及び訳抜けの発生の確認を支援することができるという効果を奏する。
第1実施形態に係る情報処理装置の概要を示す図である。 第1実施形態に係る情報処理装置の構成を示す図である。 複数の機械翻訳文のそれぞれに対応する原文を特定する例を示す図である。 複数の機械翻訳文のそれぞれに対応する原文を特定する別の例を示す図である。 比較結果を含む画面の一例を示す図である。 比較結果を含む画面の別の一例を示す図である。 第1実施形態に係る情報処理装置における処理の流れを示すフローチャートである。 第2実施形態に係る情報処理装置の構成を示す図である。 第2実施形態に係る表示部に表示される入力画面の一例を示す図である。
<第1実施形態>
[情報処理装置1の概要]
図1は、第1実施形態に係る情報処理装置1の概要を示す図である。情報処理装置1は、ユーザが使用するパーソナルコンピュータやタブレットコンピュータ等のコンピュータである。情報処理装置1は、ユーザによる複数の翻訳文中の誤訳や訳抜けの確認を支援する。
情報処理装置1は、文書に含まれる第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する(図1の(1))。ここで、第1言語は日本語であり、第2言語は英語であるものとするが、機械翻訳が可能な言語の組み合わせであれば、どのような言語の組み合わせであってもよい。
情報処理装置1は、取得した複数の翻訳文の機械翻訳を行い、第1言語の機械翻訳文を生成する(図1の(2))。情報処理装置1は、取得した複数の原文のそれぞれと、生成した複数の機械翻訳文のそれぞれから、文の特徴を示す文字列である1以上の特徴情報を抽出する(図1の(3))。
情報処理装置1は、複数の機械翻訳文のそれぞれから抽出した特徴情報と、複数の原文のそれぞれから抽出した特徴情報との合致率を算出する(図1の(4))。情報処理装置1は、算出した合致率に基づいて、複数の機械翻訳文のそれぞれに対応する原文を特定する(図1の(5))。情報処理装置1は、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する合致率とを関連付けて表示部に表示させる。
特定された原文と特徴情報の合致率が低い機械翻訳文は、多くの特徴情報が原文と一致していない。このため、特定された原文に対して誤訳や訳抜けが発生している可能性が高い。したがって、情報処理装置1が表示部12に翻訳文と原文と合致率とを表示させることにより、ユーザは、合致率が相対的に低い原文を特定し、誤訳や訳抜けが発生していないかを効率的に確認することができる。
以下、情報処理装置1の構成について説明する。
[情報処理装置1の構成例]
図2は、第2実施形態に係る情報処理装置1の構成を示す図である。
情報処理装置1は、入力部11と、表示部12と、記憶部13と、制御部14とを備える。
入力部11は、例えば、マウスやキーボード等である。入力部11は、情報処理装置1のユーザから操作入力を受け付ける。
表示部12は、例えば、液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等である。表示部12は、制御部14の制御に応じて各種情報を表示する。
記憶部13は、例えば、ROM、RAM及びハードディスク等である。記憶部13は、情報処理装置1を機能させるための各種プログラムを記憶する。記憶部13は、制御部14を、取得部141、生成部142、抽出部143、算出部144、特定部145、及び表示制御部146として機能させる情報処理プログラムを記憶する。記憶部13は、外部メモリ等の記憶媒体に記憶されたプログラムを読み取って記憶してもよく、通信ネットワークを介して外部機器から取得したプログラムを記憶してもよい。また、記憶部13は、複数の原文を含む文書を示す文書ファイルと、複数の原文のそれぞれに対応する複数の翻訳文を含む翻訳文書ファイルとを記憶する。
制御部14は、例えばCPUである。制御部14は、記憶部13に記憶されている各種プログラムを実行することにより、情報処理装置1に係る機能を制御する。制御部14は、情報処理プログラムを実行することにより、取得部141、生成部142、抽出部143、算出部144、特定部145、及び表示制御部146として機能する。
取得部141は、第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する。例えば、取得部141は、表示部12に、複数の原文の入力を受け付ける原文入力領域と、複数の翻訳文の入力を受け付ける翻訳文入力領域と、合致率の算出に係る処理の開始を受け付ける開始ボタンとを表示させる。取得部141は、開始ボタンを押下する操作を受け付けると、原文入力領域に入力されているテキスト情報を複数の原文として取得するとともに、翻訳文入力領域に入力されているテキスト情報を複数の翻訳文として取得する。
なお、取得部141は、複数の原文を含む文書に対応する文書ファイルの選択を受け付けることにより、当該文書に含まれる複数の原文を取得してもよい。また、取得部141は、複数の翻訳文を含む文書に対応する文書ファイルの選択を受け付けることにより、当該文書に含まれる複数の翻訳文を取得してもよい。
生成部142は、取得部141により取得された複数の翻訳文に対する第1言語の機械翻訳文を生成する。例えば、情報処理プログラムには、第2言語の文を第1言語の文に翻訳する翻訳モジュールが設けられており、生成部142は、取得された複数の翻訳文を翻訳モジュールに入力する。翻訳モジュールは、複数の翻訳文が入力されると機械翻訳を行い、第1言語の1以上の機械翻訳文を生成する。生成部142は、翻訳モジュールにより生成された機械翻訳文を取得する。なお、生成部142は、情報処理プログラムとは異なる翻訳プログラムに複数の翻訳文を入力し、当該翻訳プログラムから1以上の機械翻訳文を取得してもよい。
抽出部143は、複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する。ここで、特徴情報は、例えば、原文又は機械翻訳文に含まれているキーワード、記号、数字等である。例えば、抽出部143は、複数の原文のそれぞれの形態素解析を行い、原文に含まれている特徴情報を抽出する。同様に、抽出部143は、複数の機械翻訳文のそれぞれの形態素解析を行い、機械翻訳文に含まれている特徴情報を抽出する。
なお、記憶部13に、原文に含まれているキーワードを示すキーワードリストを記憶させておいてもよい。そして、抽出部143は、原文及び機械翻訳文から、当該キーワードリストに含まれるキーワードを特徴情報として抽出してもよい。
算出部144は、複数の機械翻訳文のそれぞれに含まれる特徴情報と、複数の原文のそれぞれに含まれる特徴情報との合致率を算出する。特定部145は、算出された合致率に基づいて、複数の機械翻訳文のそれぞれに対応する原文を特定する。
図3は、複数の機械翻訳文のそれぞれに対応する原文を特定する例を示す図である。まず、算出部144は、複数の原文及び複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、複数の機械翻訳文のそれぞれに含まれる特徴情報の、複数の原文のそれぞれにおける含有率である第1含有率を合致率として算出する。図3に示すように、機械翻訳文αにおいて特徴情報として「地球」、「周回」、「軌道」が抽出され、原文Aにおいて特徴情報として「地球」、「周回」、「軌道」、「飛行」が抽出されている場合、機械翻訳文αの特徴情報の全てが原文Aに含まれていることから、第1含有率は100%となる。
続いて、特定部145は、複数の機械翻訳文のそれぞれに対して、複数の原文のうち第1含有率が相対的に高い原文を特定する。図3に示す例では、特定部145は、機械翻訳文αに対して、複数の原文のうち第1含有率が相対的に高い原文として原文Aを特定し、機械翻訳文βに対して、複数の原文のうち第1含有率が相対的に高い原文として原文Bを特定する。ここで、特定部145は、既に機械翻訳文に関連付けられている原文を、当該機械翻訳文とは異なる他の機械翻訳文に関連付けないようにしてもよい。このようにすることで、機械翻訳文と、原文とを一対一で対応付けることができる。
また、特定部145は、機械翻訳文に対応する原文を特定する際に、複数の原文を含む文書(第1文書)における複数の原文のそれぞれの出現位置と、当該機械翻訳文を含む文書(第2文書)における当該機械翻訳文の出現位置とに基づいて、複数の原文の少なくともいずれかの第1含有率を補正してもよい。例えば、特定部145は、原文を特定しようとしている機械翻訳文に対応する翻訳文が、第2文書において前半に出現している場合、第1文書において前半に出現している原文の第1含有率に、1よりも高い係数を乗算することにより当該第1含有率を補正してもよい。複数の原文のそれぞれに対応する複数の翻訳文の第2文書における並び順は、第1文書における当該複数の原文の並び順に従っていることが多い。これに対して、情報処理装置1は、上述のように第1含有率を補正することにより、機械翻訳文に対応する翻訳文の第2文書における出現位置に対応する第1文書上の位置に出現する原文が、当該機械翻訳文に対応する原文として特定されやすくできる。
続いて、算出部144は、複数の機械翻訳文のそれぞれに対して特定された原文に含まれる特徴情報の、当該原文が特定された機械翻訳文における含有率である第2含有率を算出する。図3に示すように、機械翻訳文αにおいて特徴情報として「地球」、「周回」、「軌道」が抽出され、原文Aにおいて特徴情報として「地球」、「周回」、「軌道」、「飛行」が抽出されている場合、第2含有率は75%となる。
なお、上述の例では、算出部144は、複数の機械翻訳文のそれぞれに含まれる特徴情報の、複数の原文のそれぞれにおける含有率である第1含有率を算出し、その後、相対的に第1含有率が高い原文に対応する第2含有率を算出したが、これに限らない。算出部144は、第2含有率を先に算出した後に第1含有率を算出してもよい。
図4は、複数の機械翻訳文のそれぞれに対応する原文を特定する別の例を示す図である。図4に示す例では、算出部144は、まず、複数の原文及び複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、複数の原文のそれぞれに含まれる特徴情報の、複数の機械翻訳文のそれぞれにおける含有率である第2含有率を合致率として算出する。
続いて、特定部145は、複数の原文のそれぞれに対して、複数の機械翻訳文のうち第2含有率が相対的に高い機械翻訳文を特定する。図4に示す例では、特定部145は、原文Aに対して、複数の原文のうち第2含有率が相対的に高い原文として原文Aを特定し、機械翻訳文βに対して、複数の原文のうち第2含有率が相対的に高い原文として原文Bを特定する。ここで、特定部145は、一の機械翻訳文が、複数の原文に関連付けられないようにしてもよい。
続いて、算出部144は、複数の原文のそれぞれに対して特定された機械翻訳文に含まれる特徴情報の、当該機械翻訳文に対応する原文における含有率である第1含有率を算出する。図4に示す例では、算出部144は、機械翻訳文αに含まれている特徴情報の原文Aにおける含有率である第1含有率を100%と算出する。このようにすることで、情報処理装置1は、第1含有率を先に算出する場合と同様に機械翻訳文と原文とを対応付けることができる。
また、特定部145は、合致率を用いずに、原文に含まれている特徴情報のうち、訳抜けしている可能性が高い特徴情報を特定してもよい。具体的には、特定部145は、複数の原文から抽出された1以上の特徴情報のうち、複数の機械翻訳文のいずれにも含まれていない特徴情報を特定する。以下の説明では、複数の原文から抽出された1以上の特徴情報のうち、複数の機械翻訳文のいずれにも含まれていない特徴情報を訳抜け特徴情報ともいう。
表示制御部146は、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する合致率とを関連付けて比較結果として表示部12に表示させる。
具体的には、表示制御部146は、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する第1含有率と、第2含有率とを関連付けて比較結果として表示部12に表示させる。
図5は、比較結果を含む画面の一例を示す図である。図5に示されるように、表示制御部146は、第1表示領域121に比較結果を表示させる。また、表示制御部146は、第2表示領域122に複数の翻訳文を表示させ、第3表示領域123に複数の原文を表示させ、第4表示領域124に機械翻訳文を表示させる。
表示制御部146は、第1表示領域121において、比較結果に対応する一つの行の選択を受け付ける。表示制御部146は、一つの行の選択を受け付けると、選択された行を強調表示させるとともに、選択された行に対応する翻訳文と原文とを第2表示領域122及び第3表示領域123において強調表示させる。また、表示制御部146は、選択された行に対応する翻訳文に対応する機械翻訳文を第4表示領域124に表示させる。
表示制御部146は、第1含有率及び第2含有率の少なくともいずれかに基づく順に、比較結果を表示部12に表示させる。例えば、表示制御部146は、第1含有率と第2含有率との乗算値が低い順に比較結果を表示部12に表示させる。
第1含有率が低い場合、機械翻訳文から抽出された特徴情報の中に、原文から抽出されていない特徴情報が多く含まれている可能性が高く、機械翻訳文に対応する翻訳文に誤訳が含まれている可能性が高い。他方、特定された原文に対応する第2含有率が低い場合、原文から抽出された特徴情報の中に、機械翻訳文から抽出されていない特徴情報が多く含まれている可能性が高く、機械翻訳文に対応する翻訳文に誤訳又は訳抜けが発生している可能性が高い。
したがって、第1含有率と第2含有率とを乗算することにより、第1含有率と第2含有率のうち低い値の重みづけを行うことができる。よって、情報処理装置1は、第1含有率と第2含有率との乗算値が低い順に比較結果を表示部12に表示させることにより、誤訳や訳抜けが発生している可能性が高い翻訳文を優先的に表示部12に表示させることができる。
なお、表示制御部146は、第1含有率と第2含有率との合計値が低い順に比較結果を表示部12に表示させてもよい。また、表示制御部146は、第1含有率及び第2含有率のいずれか一方を比較結果に表示させないようにしてもよい。表示制御部146は、第2含有率を表示させない場合には、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する第1含有率とを関連付けた比較結果を、第1含有率の低い順に表示部12に表示させる。また、表示制御部146は、第1含有率を表示させない場合には、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する第2含有率とを関連付けた比較結果を、第2含有率の低い順に表示部12に表示させる。第2含有率が著しく低い場合、原文に対応する機械翻訳文がなく、当該原文の全ての訳抜けが発生している可能性が高い。したがって、情報処理装置1は、第2含有率の低い順に比較結果を表示することにより、原文の全ての訳抜けが発生しているかをユーザに効率的に確認させることができる。
また、表示制御部146は、複数の原文を表示部12に表示させる場合に、当該原文に含まれる特徴情報のうち、特定部145により特定された訳抜け特徴情報を、当該原文に含まれる当該特徴情報とは異なる文字列と異なる表示態様で表示させる。このようにすることで、ユーザは、訳抜け特徴情報を把握し、当該訳抜け特徴情報が実際に訳抜けしているかを効率的に確認することができる。
また、表示制御部146は、訳抜け特徴情報のリストを、表示部12に表示させるようにしてもよい。そして、表示制御部146は、訳抜け特徴情報のリストにおいて一つの訳抜け特徴情報の選択を受け付けてもよい。表示制御部146は、選択された訳抜け特徴情報を含む原文を第3表示領域123に表示させるようにしてもよい。
また、表示制御部146は、比較結果として、翻訳文、原文、第1含有率及び第2含有率を関連付けて表示部12に表示したが、別の表示態様で比較結果を表示するようにしてもよい。
また、表示制御部146は、第1含有率が第2含有率に比べて高い比較結果を優先して表示部12に表示させてもよい。例えば、表示制御部146は、第1含有率から第2含有率を減算して得られる値が高い順に比較結果を表示部12に表示させてもよい。第2含有率に比べて第1含有率が高い場合、機械翻訳文に原文の特徴情報が多く含まれている一方で、当該原文に当該機械翻訳文の特徴情報が多く含まれておらず、原文の訳抜けが発生していることを示している可能性が高い。したがって、情報処理装置1は、第1含有率から第2含有率を減算して得られる値が高い順に比較結果を表示部12に表示させることにより、ユーザに、訳抜けが発生しているかを効率的に確認させることができる。
図6は、比較結果を含む画面の別の一例を示す図である。例えば、図5及び図6に示される画面の上部には、表示態様として、「合致率」、「リンク線」と表示されている。ユーザは、「合致率」、「リンク線」の選択を切り替えることにより、表示態様を切り替えることができる。図5は、「合致率」を選択したときの表示態様に対応している。また、図6は、「リンク線」を選択したときの表示態様に対応している。
表示制御部146は、図6に示すように、複数の原文を、複数の原文を含む文書における原文の並び順に表示させるとともに、複数の翻訳文を、複数の翻訳文を含む文書における翻訳文の並び順に表示させる。
そして、表示制御部146は、図6に示すように、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文とを、リンク線で結びつけて表示させる。また、表示制御部146は、リンク線を移動させる操作を受け付けることにより、原文と翻訳文との対応関係の変更を受け付ける。
複数の原文に対する複数の翻訳文の並び順は、複数の原文の並び順に従っていることが多い。よって、ユーザは、図6に示すようにリンク線で原文と翻訳文との結び付きを確認することにより、原文と翻訳文との対応関係が正しいか否かを容易に確認することができる。また、ユーザは、図6に示すリンク線を移動させることにより、対応関係を容易に修正することができる。
その後、表示制御部146は、図5に示す比較結果を含む画面の表示要求を受け付けたことに応じて、対応関係が変更された後の原文と、翻訳文との対応関係に基づく比較結果を表示部12に表示させるようにしてもよい。このようにすることで、ユーザは、対応関係が変更された後の比較結果に基づいて、誤訳や訳抜けが発生しているかを確認することができる。
[情報処理装置1における処理の流れ]
続いて、情報処理装置1における処理の流れについて説明する。図7は、第1実施形態に係る情報処理装置1における処理の流れを示すフローチャートである。
まず、取得部141は、第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した第2言語に対応する複数の翻訳文とを取得する(S10)。
続いて、生成部142は、S10において取得された複数の翻訳文に対する第1言語の機械翻訳文を生成する(S20)。
続いて、抽出部143は、複数の原文のそれぞれから特徴情報を抽出するとともに、複数の機械翻訳文のそれぞれから特徴情報を抽出する(S30)。
続いて、算出部144は、複数の機械翻訳文のそれぞれに含まれる特徴情報と、複数の原文のそれぞれに含まれる特徴情報との合致率を算出する(S40)。
続いて、特定部145は、S40において算出された合致率に基づいて、複数の機械翻訳文のそれぞれに対応する原文を特定する(S50)。
続いて、表示制御部146は、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する合致率とを関連付けて比較結果として表示部12に表示させる(S60)。
[第1実施形態における効果]
以上のとおり、第1実施形態に係る情報処理装置1は、複数の機械翻訳文のそれぞれに含まれる特徴情報と、複数の原文のそれぞれに含まれる特徴情報との合致率を算出し、算出された合致率に基づいて、複数の機械翻訳文のそれぞれに対応する原文を特定する。そして、情報処理装置1は、複数の機械翻訳文のそれぞれに対応する翻訳文と、複数の機械翻訳文のそれぞれに対して特定された原文と、当該原文に対応する合致率とを関連付けて表示部12に表示させる。
特定された原文の合致率が低い機械翻訳文は、特徴情報が原文と一致していないことから、特定された原文に対して誤訳や訳抜けが発生している可能性が高い。したがって、情報処理装置1が表示部12に翻訳文と原文と合致率とを表示させることにより、ユーザは、合致率が相対的に低い原文を特定し、誤訳や訳抜けが発生していないかを効率的に確認することができる。これにより、情報処理装置1は、複数の翻訳文における誤訳及び訳抜けの発生の確認を支援することができる。
<第2実施形態>
続いて、第2実施形態について説明する。第1実施形態において、情報処理装置1は、第1言語に対応する複数の原文のそれぞれに関連する翻訳文を特定し、原文と、当該原文に関連付けられている翻訳文との合致率を表示した。これに対して、第2実施形態に係る情報処理装置1は、原文と、当該原文の翻訳文とが予め関連付けられており、当該原文に対して、当該翻訳文が問題なく原文を翻訳したものであるか否かを示す情報を表示する点で第1実施形態と異なる。以下に、第2実施形態に係る情報処理装置1について説明する。なお、第1実施形態と同じ部分については適宜説明を省略する。
図8は、第2実施形態に係る情報処理装置1の構成を示す図である。図8に示すように、情報処理装置1の制御部14は、第1実施形態に係る算出部144及び特定部145を備えていない点で、第1実施形態に係る情報処理装置1と異なる。
第2実施形態に係る取得部141は、第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した第1言語とは異なる第2言語に対応する翻訳文とを取得する。例えば、取得部141は、表示部12に、複数の原文の入力を受け付ける原文入力領域と、複数の翻訳文の入力を受け付ける翻訳文入力領域とを含む入力画面を表示させる。
図9は、第2実施形態に係る表示部12に表示される入力画面の一例を示す図である。図9に示す例では、原文入力領域AA~AEと、翻訳文入力領域Aa~Aeとが表示されている。原文入力領域AAに入力される原文は、翻訳文入力領域Aaに入力される翻訳文に対応するものとする。同様に、原文入力領域AB~AEのそれぞれに入力される原文は、翻訳文入力領域Ab~Aeに入力される翻訳文に対応するものとする。取得部141は、原文入力領域に入力された原文と、翻訳文入力領域に入力された翻訳文とを取得する。
取得部141は、第1言語に対応する原文を取得すると、当該原文に対応する第2言語の機械翻訳文を生成し、表示部12の翻訳文入力領域に表示させてもよい。そして、取得部141は、翻訳者により、翻訳文入力領域に表示されている第2言語の機械翻訳文の編集を受け付け、当該第2言語の機械翻訳文の編集完了操作を受け付けてもよい。ここで、編集完了操作は、例えば、エンターキーを押下する操作である。取得部141は、編集完了操作を受け付けると、翻訳者により編集された第2言語の機械翻訳文を、第2言語の翻訳文として取得してもよい。
生成部142は、取得部141が取得した翻訳文に対する第1言語の機械翻訳文を生成する。例えば、生成部142は、取得部141が第1言語に対応する原文と、第2言語に対応する翻訳文とを取得すると、当該翻訳文に対する第1言語の機械翻訳文を生成する。なお、入力画面には、比較開始ボタンが設けられており、生成部142が、当該比較開始ボタンが押下されたことに応じて、取得部141が取得した翻訳文に対する第1言語の機械翻訳文を生成してもよい。
抽出部143は、取得部141が取得した原文と、生成部142が生成した機械翻訳文とのそれぞれから特徴情報を抽出する。具体的には、抽出部143は、生成部142が機械翻訳文を生成すると、取得された原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、当該原文に対応して生成された機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する。ここで、特徴情報は、例えば、単語、数値、符号、及び記号である。
表示制御部146は、抽出部143が特徴情報を抽出すると、原文から抽出された1以上の特徴情報と、当該原文に対応する翻訳文から抽出された1以上の特徴情報との比較結果を示す情報を表示部12に表示させる。
具体的には、表示制御部146は、原文に含まれる特徴情報の数と、当該原文に対応する機械翻訳文に含まれる特徴情報の数との比較結果に対応する情報を表示部12に表示させる。例えば、表示制御部146は、原文に含まれる特徴情報の数に対する、当該原文に対応する機械翻訳文に含まれる特徴情報の数の割合が所定の割合以下である場合に、翻訳文に訳抜けが発生している可能性が高いことを示す情報を表示部12に表示させる。
図9に示す例では、原文入力領域AAに入力された原文に含まれる特徴情報の数に対する、翻訳文入力領域Aaに入力された翻訳文に対応する機械翻訳文に含まれる特徴情報の数が所定の割合以下であるものとする。表示制御部146は、原文入力領域AAと、翻訳文入力領域Aaとを、訳抜けが発生している可能性が高いことを示す破線で繋げる表示を行うことにより、翻訳文aに訳抜けが発生している可能性が高いことを示す情報を表示部12に表示させる。これにより、ユーザは、翻訳文aに訳抜けが発生している可能性が高いことを把握することができる。
また、表示制御部146は、原文に含まれる1以上の特徴情報としての単語のそれぞれの、当該原文に対応する機械翻訳文における含有率を算出する。表示制御部146は、算出した含有率が第1閾値未満である場合に、原文に対応する翻訳文に誤訳が発生している可能性が高いことを示す情報を表示部12に表示させる。
図9に示す例では、原文入力領域ACに入力された原文に含まれる単語が、翻訳文入力領域Acに入力された翻訳文に対応する機械翻訳文にほとんど含まれておらず、当該単語の機械翻訳文における含有率が第1閾値未満であるものとする。表示制御部146は、原文入力領域ACと、翻訳文入力領域Acとを、誤訳が発生している可能性が高いことを示す一点鎖線で繋げる表示を行うことにより、翻訳文cに誤訳が発生している可能性が高いことを示す情報を表示部12に表示させる。これにより、ユーザは、翻訳文cに誤訳が発生している可能性が高いことを把握することができる。
また、表示制御部146は、原文に含まれる1以上の特徴情報としての数値、符号、及び記号のそれぞれの、当該原文に対応する機械翻訳文における含有率を算出する。表示制御部146は、算出した含有率が第2閾値未満である場合に、原文に対応する翻訳文に誤記が発生している可能性が高いことを示す情報を表示部12に表示させる。ここで、第2閾値は、第1閾値と同じ値であるものとするが、これに限らず、第2閾値と第1閾値とが異なる値であってもよい。
図9に示す例では、原文入力領域ADに入力された原文に含まれる数値、符号、及び記号のそれぞれの、翻訳文入力領域Adに入力された翻訳文に対応する機械翻訳文における含有率を算出した結果、当該含有率が第2閾値未満であったものとする。表示制御部146は、原文入力領域ADと、翻訳文入力領域Adとを、誤記が発生している可能性が高いことを示す点線で繋げる表示を行うことにより、翻訳文dに誤記が発生している可能性が高いことを示す情報を表示部12に表示させる。これにより、ユーザは、翻訳文dに誤記が発生している可能性が高いことを把握することができる。
また、表示制御部146は、原文に含まれる1以上の特徴情報と、当該原文に対応する機械翻訳文に含まれる1以上の特徴情報とを比較した結果、翻訳文に、訳抜け、誤訳及び誤記が発生していないと判定すると、原文に対応する翻訳文に問題が発生していない可能性が高いことを示す情報を表示部12に表示させる。例えば、表示制御部146は、原文入力領域と、翻訳文入力領域とを実線で繋げる表示を行うことにより、翻訳文に問題が発生していないことを示す情報を表示部12に表示させる。図9に示す例では、原文入力領域ABと翻訳文入力領域Abとが実線で繋がっているとともに、原文入力領域AEと翻訳文入力領域Aeとが実線で繋がっている。したがって、ユーザは、翻訳文b及び翻訳文eに問題がない可能性が高いことが確認できる。
なお、表示制御部146は、翻訳文に訳抜け、誤訳又は誤記が発生していることを、原文入力領域と、翻訳文入力領域とを繋げる線の種類を変化させることにより表示することとしたが、これに限らない。表示制御部146は、翻訳文に訳抜け、誤訳又は誤記が発生していることを、原文入力領域と、翻訳文入力領域とを繋げる線の色を変化させる等、表示態様を変化させることにより表示してもよい。また、表示制御部146は、翻訳文に訳抜け、誤訳又は誤記が発生していることを示すメッセージを、原文入力領域と、翻訳文入力領域とに関連付けて表示してもよい。
[第2実施形態における効果]
以上のとおり、第2実施形態に係る情報処理装置1は、原文から抽出された1以上の特徴情報と、機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させる。このようにすることで、情報処理装置1は、複数の翻訳文における誤訳及び訳抜けの発生の確認を支援することができる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
例えば、上述の実施形態では、情報処理装置1は、ユーザが使用するパーソナルコンピュータやタブレットコンピュータ等のコンピュータであることとしたが、これに限らず、サーバであってもよい。この場合において、情報処理装置1は、ユーザが使用する端末から、複数の原文及び複数の翻訳文を取得し、当該複数の原文及び複数の翻訳文の比較結果をユーザが使用する端末に出力してもよい。
また、第1実施形態において、情報処理装置1は、複数の原文に含まれる所定の文字に基づいて複数の原文を複数のブロックに分けてもよい。同様に、複数の翻訳文に含まれる所定の文字列に対応する翻訳文に基づいて複数の翻訳文を複数のブロックに分けてもよい。ここで、複数の原文が、特許明細書に対応している場合、所定の文字列は、例えば、「課題を解決するための手段」や「発明を実施するための形態」といった、明細書に含まれる各構成を区分するための文字列である。そして、情報処理装置1は、原文に対応する複数のブロックと、翻訳文に対応する複数のブロックとのうち、対応するブロックごとに、原文と翻訳文とを対応付けるようにしてもよい。
また、第1実施形態において、情報処理装置1は、第2言語の翻訳文に基づいて第1言語の機械翻訳文を生成し、原文に含まれる特徴情報と機械翻訳文に含まれる特徴情報との合致率に基づいて原文と翻訳文とを関連付けたがこれに限らない。例えば、情報処理装置1は、第1言語の原文に基づいて第2言語の機械翻訳文を生成してもよい。そして、情報処理装置1は、翻訳文に含まれる特徴情報と機械翻訳文に含まれる特徴情報との合致率に基づいて原文と翻訳文とを関連付けるようにしてもよい。
1・・・情報処理装置、11・・・入力部、12・・・表示部、13・・・記憶部、14・・・制御部、141・・・取得部、142・・・生成部、143・・・抽出部、144・・・算出部、145・・・特定部、146・・・表示制御部

Claims (24)

  1. 第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する取得部と、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、
    前記複数の機械翻訳文のそれぞれに含まれる前記特徴情報と、前記複数の原文のそれぞれに含まれる前記特徴情報との合致率を算出する算出部と、
    算出された合致率に基づいて、前記複数の機械翻訳文のそれぞれに対応する原文を特定する特定部と、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記合致率とを関連付けて前記表示部に表示させる表示制御部と、
    を備える情報処理装置。
  2. 第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する取得部と、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、
    前記複数の原文から抽出された1以上の特徴情報のうち、前記複数の機械翻訳文のいずれにも含まれていない特徴情報を特定する特定部と、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記複数の原文を前記表示部に表示させるとともに、当該原文に含まれる特定された前記特徴情報を、当該原文に含まれる当該特徴情報とは異なる文字列と異なる表示態様で表示させる表示制御部と、
    を備える情報処理装置。
  3. 第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部と、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、
    前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる前記特徴情報の数に対する、前記機械翻訳文に含まれる前記特徴情報の数の割合が所定の割合以下である場合に、前記翻訳文に訳抜けが発生している可能性が高いことを示す情報を前記表示部に表示させる表示制御部と、
    を備える情報処理装置。
  4. 第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部と、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、
    前記原文から、当該原文の特徴を示す文字列である1以上の単語である特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第1閾値未満である場合に、前記翻訳文に誤訳が発生している可能性が高いことを示す情報を前記表示部に表示させる表示制御部と、
    を備える情報処理装置。
  5. 第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部と、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部と、
    前記原文から、当該原文の特徴を示す文字列である1以上の数値、符号及び記号の少なくともいずれかである特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部と、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第2閾値未満である場合に、前記翻訳文に誤記が含まれている可能性が高いことを示す情報を前記表示部に表示させる表示制御部と、
    を備える情報処理装置。
  6. 前記算出部は、前記複数の原文及び前記複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、前記複数の機械翻訳文のそれぞれに含まれる特徴情報の、前記複数の原文のそれぞれにおける含有率である第1含有率を前記合致率として算出し、
    前記特定部は、前記複数の機械翻訳文のそれぞれに対して、複数の原文のうち前記第1含有率が相対的に高い原文を特定し、
    前記表示制御部は、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記第1含有率とを関連付けて表示部に表示させる、
    請求項に記載の情報処理装置。
  7. 前記表示制御部は、前記第1含有率が低い順に、前記原文と、前記翻訳文と、前記第1含有率とを前記表示部に表示させる、
    請求項に記載の情報処理装置。
  8. 前記算出部は、前記複数の機械翻訳文のそれぞれに対して特定された原文に含まれる特徴情報の、当該原文が特定された機械翻訳文における含有率である第2含有率を算出し、
    前記表示制御部は、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記第1含有率と、当該原文に対応する第2含有率とを関連付けて前記表示部に表示させる、
    請求項に記載の情報処理装置。
  9. 前記表示制御部は、前記第1含有率及び前記第2含有率に基づく順に、前記原文と、前記翻訳文と、前記第1含有率と、前記第2含有率とを前記表示部に表示させる、
    請求項に記載の情報処理装置。
  10. 前記表示制御部は、前記第1含有率と前記第2含有率との乗算値が低い順に、前記原文と、前記翻訳文と、前記第1含有率と、前記第2含有率とを前記表示部に表示させる、
    請求項8に記載の情報処理装置。
  11. 前記算出部は、前記複数の原文及び前記複数の機械翻訳文のそれぞれから抽出された特徴情報に基づいて、前記複数の原文のそれぞれに含まれる特徴情報の、前記複数の機械翻訳文のそれぞれにおける含有率である第2含有率を前記合致率として算出し、
    前記特定部は、前記複数の原文のそれぞれに対して、複数の機械翻訳文のうち前記第2含有率が相対的に高い機械翻訳文を特定し、
    前記表示制御部は、前記複数の原文と、当該複数の原文のそれぞれに対して特定された機械翻訳文に対応する翻訳文と、当該機械翻訳文に対応する前記第2含有率とを関連付けて前記表示部に表示させる、
    請求項に記載の情報処理装置。
  12. 前記算出部は、前記複数の原文のそれぞれに対して特定された機械翻訳文に含まれる特徴情報の、当該機械翻訳文に対応する原文における含有率である第1含有率を算出し、
    前記表示制御部は、前記複数の原文と、当該複数の原文のそれぞれに対して特定された機械翻訳文に対応する翻訳文と、当該機械翻訳文に対応する前記第2含有率と、当該機械翻訳文に対応する第1含有率とを関連付けて前記表示部に表示させる、
    請求項11に記載の情報処理装置。
  13. 前記生成部は、前記取得部が前記原文と前記翻訳文とを取得すると、前記第1言語の機械翻訳文を生成し、
    前記抽出部は、前記生成部が前記第1言語の機械翻訳文を生成すると、前記原文から1以上の特徴情報を抽出するとともに、前記機械翻訳文から1以上の特徴情報を抽出し、
    前記表示制御部は、前記抽出部が特徴情報を抽出すると、前記比較結果を前記表示部に表示させる、
    請求項1から5のいずれか一項に記載の情報処理装置。
  14. 前記取得部は、前記第1言語に対応する原文を取得すると、前記原文に対する前記第2言語の機械翻訳文を生成して前記表示部に表示させ、前記翻訳者により当該第2言語の機械翻訳文の編集を受け付け、当該第2言語の機械翻訳文の編集完了操作を受け付けると、編集された当該第2言語の機械翻訳文を、前記第2言語の翻訳文として取得する、
    請求項13に記載の情報処理装置。
  15. コンピュータが実行する、
    第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得するステップと、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、
    前記複数の機械翻訳文のそれぞれに含まれる前記特徴情報と、前記複数の原文のそれぞれに含まれる前記特徴情報との合致率を算出するステップと、
    算出された合致率に基づいて、前記複数の機械翻訳文のそれぞれに対応する原文を特定するステップと、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、
    前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記合致率とを関連付けて前記表示部に表示させるステップと、
    を備える情報処理方法。
  16. コンピュータが実行する、
    第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得するステップと、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文のそれぞれから、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、
    前記複数の原文から抽出された1以上の特徴情報のうち、前記複数の機械翻訳文のいずれにも含まれていない特徴情報を特定するステップと、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、
    前記複数の原文を前記表示部に表示させるとともに、当該原文に含まれる特定された前記特徴情報を、当該原文に含まれる当該特徴情報とは異なる文字列と異なる表示態様で表示させるステップと、
    を備える情報処理方法。
  17. コンピュータが実行する、
    第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得するステップと、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、
    前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、
    前記原文に含まれる前記特徴情報の数に対する、前記機械翻訳文に含まれる前記特徴情報の数の割合が所定の割合以下である場合に、前記翻訳文に訳抜けが発生している可能性が高いことを示す情報を前記表示部に表示させるステップと、
    を備える情報処理方法。
  18. コンピュータが実行する、
    第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得するステップと、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、
    前記原文から、当該原文の特徴を示す文字列である1以上の単語である特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、
    前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第1閾値未満である場合に、前記翻訳文に誤訳が発生している可能性が高いことを示す情報を前記表示部に表示させるステップと、
    を備える情報処理方法。
  19. コンピュータが実行する、
    第1言語に対応する原文と、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得するステップと、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成するステップと、
    前記原文から、当該原文の特徴を示す文字列である1以上の数値、符号及び記号の少なくともいずれかである特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出するステップと、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させるステップと、
    前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第2閾値未満である場合に、前記翻訳文に誤記が含まれている可能性が高いことを示す情報を前記表示部に表示させるステップと、
    を備える情報処理方法。
  20. コンピュータを、
    第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する取得部、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、
    前記複数の機械翻訳文のそれぞれに含まれる前記特徴情報と、前記複数の原文のそれぞれに含まれる前記特徴情報との合致率を算出する算出部、
    算出された合致率に基づいて、前記複数の機械翻訳文のそれぞれに対応する原文を特定する特定部、及び、
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記複数の機械翻訳文のそれぞれに対応する前記翻訳文と、前記複数の機械翻訳文のそれぞれに対して特定された前記原文と、当該原文に対応する前記合致率とを関連付けて前記表示部に表示させる表示制御部、
    として機能させる情報処理プログラム。
  21. コンピュータを、
    第1言語に対応する複数の原文と、当該複数の原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する複数の翻訳文とを取得する取得部、
    前記複数の翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、
    前記複数の原文のそれぞれから、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記複数の機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、
    前記複数の原文から抽出された1以上の特徴情報のうち、前記複数の機械翻訳文のいずれにも含まれていない特徴情報を特定する特定部、及び
    前記原文から抽出された1以上の前記特徴情報と、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記複数の原文を前記表示部に表示させるとともに、当該原文に含まれる特定された前記特徴情報を、当該原文に含まれる当該特徴情報とは異なる文字列と異なる表示態様で表示させる表示制御部、
    として機能させる情報処理プログラム。
  22. コンピュータを、
    第1言語に対応する原文、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、
    前記原文から、当該原文の特徴を示す文字列である1以上の特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、及び
    前記原文から抽出された1以上の前記特徴情報、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる前記特徴情報の数に対する、前記機械翻訳文に含まれる前記特徴情報の数の割合が所定の割合以下である場合に、前記翻訳文に訳抜けが発生している可能性が高いことを示す情報を前記表示部に表示させる表示制御部、
    として機能させる情報処理プログラム。
  23. コンピュータを、
    第1言語に対応する原文、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、
    前記原文から、当該原文の特徴を示す文字列である1以上の単語である特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、及び
    前記原文から抽出された1以上の前記特徴情報、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第1閾値未満である場合に、前記翻訳文に誤訳が発生している可能性が高いことを示す情報を前記表示部に表示させる表示制御部、
    として機能させる情報処理プログラム。
  24. コンピュータを、
    第1言語に対応する原文、当該原文に対して翻訳者が翻訳した前記第1言語とは異なる第2言語に対応する翻訳文とを取得する取得部、
    前記翻訳文に対する前記第1言語の機械翻訳文を生成する生成部、
    前記原文から、当該原文の特徴を示す文字列である1以上の数値、符号及び記号の少なくともいずれかである特徴情報を抽出するとともに、前記機械翻訳文から、当該機械翻訳文の特徴を示す文字列である1以上の特徴情報を抽出する抽出部、及び
    前記原文から抽出された1以上の前記特徴情報、前記機械翻訳文から抽出された1以上の前記特徴情報との比較結果を示す情報を表示部に表示させ、前記原文に含まれる1以上の前記特徴情報のそれぞれの、前記機械翻訳文における含有率が第2閾値未満である場合に、前記翻訳文に誤記が含まれている可能性が高いことを示す情報を前記表示部に表示させる表示制御部、
    として機能させる情報処理プログラム。
JP2018175745A 2017-11-07 2018-09-20 情報処理装置、情報処理方法及び情報処理プログラム Active JP7160327B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017214530 2017-11-07
JP2017214530 2017-11-07

Publications (2)

Publication Number Publication Date
JP2019087233A JP2019087233A (ja) 2019-06-06
JP7160327B2 true JP7160327B2 (ja) 2022-10-25

Family

ID=66763223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018175745A Active JP7160327B2 (ja) 2017-11-07 2018-09-20 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP7160327B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023148889A1 (ja) * 2022-02-03 2023-08-10 日本電信電話株式会社 推定装置、学習装置、推定方法、学習方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078318A (ja) 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 機械翻訳文の評価方法、および機械翻訳文の評価装置
JP2013014877A (ja) 2011-06-30 2013-01-24 Mitsui Kinzoku Act Corp 自動車用ドアロック装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078318A (ja) 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 機械翻訳文の評価方法、および機械翻訳文の評価装置
JP2013014877A (ja) 2011-06-30 2013-01-24 Mitsui Kinzoku Act Corp 自動車用ドアロック装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山本里美 他1名,クラウドソーシング上の単言語話者による用例対訳作成手法への折り返し翻訳利用の提案,情報処理学会 グループウェアとネットワークサービスワークショップ2015(GN Workshop 2015)論文集[online],日本,情報処理学会,2015年11月20日

Also Published As

Publication number Publication date
JP2019087233A (ja) 2019-06-06

Similar Documents

Publication Publication Date Title
US8935148B2 (en) Computer-assisted natural language translation
US8976118B2 (en) Method for character correction
US20080172219A1 (en) Foreign language translator in a document editor
JP6417791B2 (ja) アプリケーションテスト支援装置、そのデータ処理方法、およびプログラム
JP7160327B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5451696B2 (ja) 字幕付加装置、コンテンツデータ、字幕付加方法及びプログラム
JP5091549B2 (ja) 文書データ処理装置
JP6723726B2 (ja) 入力支援装置
KR20230104492A (ko) 적응적 이미지 텍스트 변환 방법, 장치 및 시스템
CN114237560A (zh) 一种数据的存储方法、存储装置、电子设备及存储介质
JP7098897B2 (ja) 画像処理装置、プログラム及び画像データ
JP2015191430A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP2017151786A (ja) 翻訳プログラム及び情報処理装置
JP2009104520A (ja) 商標検索システム及び商標検索サーバ
JP2019096173A (ja) 和文字変換プログラム及び和文字変換装置
CN104850237A (zh) 输入法衍生候选项生成与处理方法
JP7083473B2 (ja) 入力支援装置
KR20230104424A (ko) 상품 정보 생성 방법, 장치 및 시스템
JP2010134766A (ja) 文書データ処理装置およびそのプログラム
KR20230104435A (ko) 웹 페이지 번역 방법, 장치 및 시스템
JP2018005367A (ja) 編集支援システム、編集支援装置、データ置換装置及び編集支援方法
KR20230104431A (ko) 상품 정보를 다국어로 표시하는 방법, 장치 및 시스템
KR20230104434A (ko) 웹 기반의 이미지 텍스트 번역 방법, 장치 및 시스템
JP2013077084A (ja) 文例辞書生成プログラム及び文例辞書生成装置
JP5628485B2 (ja) 翻訳支援システム及びその方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221005

R150 Certificate of patent or registration of utility model

Ref document number: 7160327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150