JP6811970B1

JP6811970B1 - 情報処理装置、情報処理プログラム及び情報処理方法

Info

Publication number: JP6811970B1
Application number: JP2019171561A
Authority: JP
Inventors: 裕司大庭
Original assignee: 株式会社ルーティングシステムズ
Priority date: 2019-09-20
Filing date: 2019-09-20
Publication date: 2021-01-13
Anticipated expiration: 2039-09-20
Also published as: JP2021047807A

Abstract

【課題】翻訳文だけでなく、原語による文も受け付け、原語による文を複数の翻訳手段を用いて翻訳することによって、１つの翻訳手段を用いた場合よりも、翻訳文を的確に修正できるようにした情報処理装置を提供する。【解決手段】情報処理装置の第１受付手段は、第１言語で記載された文を受け付け、第２受付手段は、第２言語で記載された、前記第１受付手段が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付け、翻訳制御手段は、前記第１受付手段が受け付けた文を、複数の翻訳手段に翻訳させる制御を行い、抽出手段は、複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文から、前記第１翻訳文を修正するための情報を抽出し、出力手段は、前記抽出手段によって抽出された情報を用いて、前記第１翻訳文を修正した結果を出力する。【選択図】図１

Description

本発明は、情報処理装置、情報処理プログラム及び情報処理方法に関する。

特許文献１には、サービス提供者やサービス利用者、サービス作業間でサービス対象となる情報を転送する際に要する時間を短縮し、かつ、伝達すべき内容を、情報を受領する側にわかりやすく伝達するマルチメディア情報通信サービスを提供することを目的とし、サービス提供者とサービス利用者とサービス作業者間でサービス対象となる情報を転送するようなサービスにおいて、転送する情報はディジタル化したマルチメディア情報であり、このマルチメディア情報をマルチメディア情報処理サービス装置とサービス利用端末とサービス支援端末とが通信網を介して受渡しすることが開示されている。

特許文献２には、外国語などをオンライン学習する通信添削システムにおいて、自分で問題を作成したいと考える自主的な学習者の要望に応え、各学習者の学力向上に応じて個別対応することを課題とし、受講生クライアント側で、問題とその解答を作成して問題データおよび解答データをサーバーに送信し、サーバー側で、これらの問題データおよび解答データを所定の添削サイトにアップロードし、添削者クライアントに添削依頼メールを送信し、添削者クライアント側で、この解答データを添削して添削データをサーバーに送信し、サーバー側で、この添削データを添削サイトにアップロードし、受講生クライアントに添削終了メールを送信し、受講生クライアント側で、この添削データを閲覧し、これにより、受講生は自ら問題を作成し、その問題について解答すれば、それに対して添削してもらえることが開示されている。

特許文献３には、複雑なハード構成を必要とすることなく、文書に記載された文章を校閲してその結果及び正解を当該文書に示した画像を簡単に作成可能にすることを課題とし、画像処理装置としての画像形成装置は、データ取得部としての画像読取部と、校閲処理部と、画像作成部とを備え、画像読取部は、文章校閲の対象とする校閲対象データを取得し、校閲処理部は、画像読取部によって取得された校閲対象データに対して校閲処理を行い、誤りである誤り表記と、当該誤り表記について本来の正しい意味を示す正規表記とを検出し、画像作成部は、校閲処理部による校閲処理で検出された誤り表記及び正規表記を示す画像を、校閲対象データに合成して校閲結果画像を作成することが開示されている。

特開平０７−１８２４１８号公報特開２００１−３１８５８０号公報特開２０１８−０６７１５９号公報

翻訳文を修正するにあたって、その翻訳文だけを対象とした場合、その修正には限界がある。例えば、文法的知識を用いて翻訳文を修正したとしても、そもそも単語を勘違いしている場合は、修正することができない。
そこで、本発明は、翻訳文だけでなく、原語による文も受け付け、原語による文を複数の翻訳手段を用いて翻訳することによって、１つの翻訳手段を用いた場合よりも、翻訳文を的確に修正できるようにした情報処理装置、情報処理プログラム及び情報処理方法を提供することを目的としている。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項１の発明は、第１言語で記載された文を受け付ける第１受付手段と、第２言語で記載された、前記第１受付手段が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付手段と、前記第１受付手段が受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御手段と、複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付手段が受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理手段と、前記第１翻訳文と前記言語処理手段によって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力手段を有する情報処理装置である。

請求項２の発明は、前記第１受付手段が受け付けた文のカテゴリを抽出する第２抽出手段をさらに有し、前記翻訳手段は、カテゴリ毎にランク付けされており、前記翻訳制御手段は、前記第２抽出手段によって抽出されたカテゴリに対応するランクに応じて翻訳を行わせる翻訳手段を選択する請求項１に記載の情報処理装置である。

請求項３の発明は、前記第１受付手段と前記第２受付手段が、同じ翻訳手段から前記文と前記第１翻訳文を受け付けた場合は、前記翻訳制御手段は、該翻訳手段に対して翻訳をさせないように制御する請求項１又は２に記載の情報処理装置である。

請求項４の発明は、コンピュータを、第１言語で記載された文を受け付ける第１受付手段と、第２言語で記載された、前記第１受付手段が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付手段と、前記第１受付手段が受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御手段と、複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付手段が受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理手段と、前記第１翻訳文と前記言語処理手段によって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力手段として機能させる情報処理プログラムである。

請求項５の発明は、第１言語で記載された文を受け付ける第１受付ステップと、第２言語で記載された、前記第１受付ステップが受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付ステップと、前記第１受付ステップが受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御ステップと、複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付ステップが受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理ステップと、前記第１翻訳文と前記言語処理ステップによって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力ステップを有する情報処理方法である。

請求項１の情報処理装置によれば、翻訳文だけでなく、原語による文も受け付け、原語による文を複数の翻訳手段を用いて翻訳することによって、１つの翻訳手段を用いた場合よりも、翻訳文を的確に修正することができる。

請求項２の情報処理装置によれば、カテゴリに適した翻訳手段を用いて翻訳を行わせることができる。

請求項３の情報処理装置によれば、翻訳手段から翻訳対象とする文と第１翻訳文を受け付けた場合は、その翻訳手段による翻訳結果を用いずに修正することができる。

請求項４の情報処理プログラムによれば、翻訳文だけでなく、原語による文も受け付け、原語による文を複数の翻訳手段を用いて翻訳することによって、１つの翻訳手段を用いた場合よりも、翻訳文を的確に修正することができる。

請求項５の情報処理方法によれば、翻訳文だけでなく、原語による文も受け付け、原語による文を複数の翻訳手段を用いて翻訳することによって、１つの翻訳手段を用いた場合よりも、翻訳文を的確に修正することができる。

本実施の形態の構成例についての概念的なモジュール構成図である。本実施の形態を利用したシステム構成例を示す説明図である。本実施の形態による処理例を示すフローチャートである。翻訳文管理テーブルのデータ構造例を示す説明図である。本実施の形態による処理例を示すフローチャートである。本実施の形態による処理例を示すフローチャートである。本実施の形態による処理例を示すフローチャートである。本実施の形態によるユーザーインタフェース例を示す説明図である。本実施の形態によるユーザーインタフェース例を示す説明図である。翻訳文のみを対象とした場合の処理例と本実施の形態による処理例との比較を示す説明図である。翻訳文のみを対象とした場合の処理例と本実施の形態による処理例との比較を示す説明図である。翻訳文のみを対象とした場合の処理例と本実施の形態による処理例との比較を示す説明図である。本実施の形態による処理例を示す説明図である。本実施の形態による処理例を示す説明図である。本実施の形態による処理例を示す説明図である。本実施の形態による処理例を示すフローチャートである。翻訳システム・カテゴリテーブルのデータ構造例を示す説明図である。本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図１は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア（「ソフトウェア」の解釈として、コンピュータ・プログラムを含む）、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム（例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム）、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。なお、１つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（例えば、データの授受、指示、データ間の参照関係、ログイン等）の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、２以上の値（「２以上の値」には、もちろんのことながら、全ての値も含む）が同じであってもよい。また、「Ａである場合、Ｂをする」という記載は、「Ａであるか否かを判断し、Ａであると判断した場合はＢをする」の意味で用いる。ただし、Ａであるか否かの判断が不要である場合を除く。また、「Ａ、Ｂ、Ｃ」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その１つのみを選んでいる場合（例えば、Ａのみ）を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク（「ネットワーク」には、一対一対応の通信接続を含む）等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」（つまり、社会システム）にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスクドライブ、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙの略）、外部記憶媒体、通信回線を介した記憶装置、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略）内のレジスタ等を含んでいてもよい。

本実施の形態である言語処理装置１００は、翻訳文の修正機能を有しており、図１の例に示すように、受付モジュール１０５、翻訳制御モジュール１２０、言語処理モジュール１３０、修正モジュール１３５、出力モジュール１４０を有している。
外国語を習得するため、又は、自分の思いを相手に伝える等のために、翻訳システムを用いた単なる翻訳ではなく、自分で翻訳することが行われている。その場合、母国語以外の外国語であるため、その外国語で違和感のない文であるか否かの判別がつきにくい。そこで、翻訳文を添削してもらうことが行われている。例えば、翻訳文の添削の内容として、文法のチェック、スペルチェック、表現チェック等が行われている。また、翻訳文の言語を用いる者によるチェック（いわゆるネイティブチェック）も行われている。

受付モジュール１０５は、第１言語文受付モジュール１１０、第２言語文受付モジュール１１５を有している。受付モジュール１０５は、第１言語で記載された原文と第２言語で記載された翻訳文を受け付ける。
第１言語文受付モジュール１１０は、翻訳制御モジュール１２０と接続されている。第１言語文受付モジュール１１０は、第１言語で記載された文を受け付ける。
第２言語文受付モジュール１１５は、修正モジュール１３５と接続されている。第２言語文受付モジュール１１５は、第２言語で記載された、第１言語文受付モジュール１１０が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける。
第１言語文受付モジュール１１０と第２言語文受付モジュール１１５が受け付ける文又は翻訳文は、同じユーザー又は翻訳システムによって入力されたものである。ここでの文又は翻訳文を入力するユーザーは、翻訳文の添削依頼者である。また、ここでの文又は翻訳文を入力する翻訳システムは、その翻訳システムの管理者が翻訳の実力を知りたい、又は、翻訳精度を向上させたい場合に利用される。例えば、翻訳システムによる翻訳文の添削された量が多い場合は、翻訳の実力は低いと判断でき得る。また、添削結果を利用して、翻訳システムにおける翻訳プログラム、辞書等を調整して、翻訳精度を向上させることができる。
「文」は、１文であってもよいし、複数の文（いわゆる文章）であってもよい。
第１言語は、翻訳対象の言語であり、一般的にはユーザーの母国語である。なお、母国語として２カ国語以上の言語を扱える人（いわゆるマルチリンガル）に対応するために、第１言語文受付モジュール１１０は、複数の言語で記載された文を受け付けるようにしてもよい。原文に関する情報が増えるので、より的確な修正を行うことができる。例えば、日本語と英語を用いることができるバイリンガルのユーザーが、中国語で手紙を書くために利用する場合が該当する。なお、「修正」という用語は、校正、添削、訂正、加筆、補正等の概念を含む用語として用いる。
第２言語は、第１翻訳文に用いられている言語であり、第１言語とは異なる言語である。以下の説明で、例示する場合は、第１言語として日本語、第２言語として英語の場合を示す。
第１翻訳文は、添削対象の文である。つまり、第１言語で記載された文を、ユーザー又は翻訳システムが第２言語に翻訳した文である。

翻訳制御モジュール１２０は、第１翻訳処理モジュール１２５Ａ、第２翻訳処理モジュール１２５Ｂ、第３翻訳処理モジュール１２５Ｃ等を有しており、受付モジュール１０５の第１言語文受付モジュール１１０、言語処理モジュール１３０と接続されている。翻訳制御モジュール１２０は、第１言語文受付モジュール１１０が受け付けた文を、複数の翻訳処理モジュール１２５に翻訳させる制御を行う。
複数の翻訳処理モジュール１２５（図１では、第１翻訳処理モジュール１２５Ａ、第２翻訳処理モジュール１２５Ｂ、第３翻訳処理モジュール１２５Ｃ等）は、第１言語文受付モジュール１１０が受け付けた文を翻訳して、第２翻訳文を生成する。ここでの翻訳は、言語処理装置１００が有している翻訳モジュールが行ってもよいし、外部にある翻訳システムに行わせてもよいし、また、翻訳担当者に行わせてもよい。外部にある翻訳システムに行わせる場合は、その翻訳システムと通信を行い、翻訳の依頼、翻訳対象である文の入力、第２翻訳文を受け付ける。翻訳担当者に行わせる場合は、その翻訳担当者に対してのユーザーインタフェース処理を行う。具体的には、その翻訳担当者が用いている端末に、電子メール等を用いて翻訳依頼の通知を行い、翻訳対象である文を提示し、第２翻訳文の入力を促して、第２翻訳文を受け付ける。もちろんのことながら、この翻訳処理モジュール１２５による翻訳は、第１言語の文を第２言語の文に翻訳することである。

言語処理モジュール１３０は、翻訳制御モジュール１２０、修正モジュール１３５と接続されている。言語処理モジュール１３０は、複数の翻訳処理モジュール１２５によって翻訳された結果である複数の第２翻訳文から、第２言語文受付モジュール１１５が受け付けた第１翻訳文を修正するための情報を抽出する。
言語処理モジュール１３０は、例えば、複数の第２翻訳文を構成している単語又はフレーズの統計的処理を行い、翻訳文を生成してもよい。統計的処理として、品詞も含めた単語の出現順の統計処理があり、例えば、単語又はフレーズの出現回数を計数し、最も多い出現回数である単語又はフレーズを用いて、翻訳文を生成してもよい。また、言語処理モジュール１３０は、予め機械学習を行った学習モデルを用いて、複数の第２翻訳文から翻訳文を生成するようにしてもよい。なお、フレーズは、複数語よりなる単語の集まりをいい、例えば、句、成句、慣用句、決まり文句等が該当する。
さらに、言語処理モジュール１３０は、複数の第２翻訳文から生成した翻訳文に対して、自然言語処理を行い、第２言語として通用する文であるように修正することを行ってもよい。例えば、形態素解析等を行い、第２言語の文法的に適合する文に修正してもよいし、第２言語のコーパスを用いて機械学習を行った学習モデルを用いて、文を修正するようにしてもよい。

修正モジュール１３５は、受付モジュール１０５の第２言語文受付モジュール１１５、言語処理モジュール１３０、出力モジュール１４０と接続されている。修正モジュール１３５は、言語処理モジュール１３０によって抽出された情報を用いて、第１翻訳文を修正する。
修正モジュール１３５は、例えば、言語処理モジュール１３０が翻訳文を生成した場合は、その翻訳文と第１翻訳文を比較して、異なっている部分を抽出してもよい。

出力モジュール１４０は、修正モジュール１３５と接続されている。出力モジュール１４０は、修正モジュール１３５によって修正された第１翻訳文を出力する。出力モジュール１４０は、例えば、修正モジュール１３５によって抽出された異なっている部分を他の部分（その翻訳文と第１翻訳文とが同じ部分）とは異なる形態で表示するようにしてもよい。ここで「異なる形態」として、文字の色を赤色等に変更させること、文字の大きさ、書体等を変更させること、下線等を付加すること、動的に変化させること（例えば、フラッシュ、アニメーション等）、点滅させること（点滅における変更対象は、点滅を行うか否か、点滅を行っている期間、点滅の間隔等がある）、又は、これらの組み合わせであってもよい。
なお、出力モジュール１４０による出力先は、第１言語文受付モジュール１１０と第２言語文受付モジュール１１５に対して入力を行ったユーザー又は翻訳システムであってもよいし、添削担当者であってもよい。ユーザー又は翻訳担当者である場合は、その者が用いている端末の表示装置に出力する。添削担当者は、修正モジュール１３５による修正結果を見て、その修正のコメントを入力したり、さらに、修正を行ったりしてもよい。そして、その結果を第１言語文受付モジュール１１０と第２言語文受付モジュール１１５に対して入力を行ったユーザーに提示する。

また、出力モジュール１４０は、第２言語文受付モジュール１１５が受け付けた第１翻訳文内の単語又はフレーズを採用する度合いに応じて、修正結果を出力するようにしてもよい。また、複数の修正結果を出力するようにしてもよい。
ここで「フレーズ」とは、複数の単語からなるものをいい、その単語群を１つのかたまりとして文を構成する単位となるものである。
また「度合い」として、例えば、（１）原文尊重型の校正、（２）大幅変更を希望の校正、のように２段階以上あればよい。２段階の場合は、２つの修正結果を出力可能である。もちろんのことながら、３段階以上であってもよい。また、ユーザーの指示に応じて、いずれかの度合いの修正結果を１つ出力してもよいし、複数の修正結果を出力してもよい。
（１）の「原文尊重型の校正」とは、第２言語として通用する限りにおいて、第１言語文受付モジュール１１０が受け付けた文内の単語又はフレーズを残存するように修正するものである。もちろんのことながら、３つ以上の修正結果の文を出力するようにしてもよい。

また、翻訳制御モジュール１２０は、第１言語文受付モジュール１１０が受け付けた文のカテゴリを抽出するようにしてもよい。
ここで「カテゴリ」とは、文の分類のことであり、例えば、論文、契約書、ラブレター、日記、小説等がある。
このカテゴリの抽出は、第１言語文受付モジュール１１０が受け付けた文から自動的に決定してもよいし、第１言語文受付モジュール１１０が受け付けた文を入力したユーザー又は翻訳システムが指定したものを利用してもよい。前者として、例えば、予め定められた単語又はフレーズとカテゴリの組み合わせのテーブル（例えば、「愛している」とカテゴリ「ラブレター」を組み合わせたテーブル）を用意しておき、文内にある単語又はフレーズがそのテーブルにある場合は、その単語又はフレーズに対応するカテゴリであると判断してもよいし、文とカテゴリの組み合わせによって機械学習を行った学習モデルを用いて、判断するようにしてもよい。後者として、ユーザー又は翻訳システムに対象となる文とともにカテゴリを入力させるようにしてもよい。後者として、例えば、予め定められた複数のカテゴリから選択させるようにしてもよい。
翻訳処理モジュール１２５は、それぞれ得意とするカテゴリを有している。つまり、翻訳処理モジュール１２５は、カテゴリ毎にランク付け（順位付け）されている。例えば、論文用にカスタマイズされた翻訳処理モジュール１２５は、カテゴリ「論文」のランクは高いが、「ラブレター」のランクは低い。
このランク付けは、過去の言語処理装置１００による処理によって、度合いが高い場合に採用された翻訳処理モジュール１２５を高くランク付けするようにしてもよい。「度合いが高い場合」とは、第２言語文受付モジュール１１５が受け付けた第１翻訳文内の単語又はフレーズをできるだけ採用し、修正箇所を少なくするものであり、例えば、前述の（１）原文尊重型の校正、が該当する。つまり、そのような場合であっても、修正する単語又はフレーズとして採用された翻訳を行った翻訳処理モジュール１２５を用いるべきだからである。
そして、翻訳制御モジュール１２０は、抽出したカテゴリに対応するランクに応じて翻訳を行わせる翻訳処理モジュール１２５を選択する。ただし、選択する翻訳処理モジュール１２５の数は複数である。例えば、受付モジュール１０５がカテゴリＡの文を受け付けた場合、カテゴリＡにおいてランクが高い翻訳処理モジュール１２５を選択して、翻訳処理を行わせるようにする（逆に、カテゴリＡにおいてランクが低い翻訳処理モジュール１２５を除外して、その他の翻訳処理モジュール１２５に翻訳処理を行わせるようにする）。具体的には、翻訳処理モジュール１２５を選択するのに、予め定められたランク（閾値）より高位又は以上である翻訳処理モジュール１２５を選択すればよい。これによって、そもそも採用される可能性の低い翻訳処理モジュール１２５に翻訳処理をさせずに済むこと、そして、質の悪い翻訳文による悪影響を排除することができる。

また、第１言語文受付モジュール１１０と第２言語文受付モジュール１１５が、同じ翻訳処理モジュール１２５から文と第１翻訳文を受け付けた場合は、翻訳制御モジュール１２０は、その翻訳処理モジュール１２５に対して翻訳をさせないよう制御するようにしてもよい。
前述したように、翻訳システムＡの精度を向上させるために利用する場合は、翻訳依頼先である複数の翻訳システムに、その翻訳システムＡを含めないようにしている。翻訳システムＡの翻訳精度を向上させることを目的としているのに、その翻訳システムＡによる翻訳結果を含めてしまうことは、自らが教師になっているのに等しく、翻訳精度の向上に寄与しないからである。

図２は、本実施の形態を利用したシステム構成例を示す説明図である。
言語処理装置１００、ユーザー端末２１０、翻訳システム２２０Ａ、翻訳システム２２０Ｂ、翻訳システム２２０Ｃ、翻訳者端末２３０Ａ、翻訳者端末２３０Ｂは、通信回線２９０を介してそれぞれ接続されている。通信回線２９０は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、言語処理装置１００、翻訳システム２２０による機能は、クラウドサービスとして実現してもよい。
例えば、ユーザー端末２１０、翻訳者端末２３０に搭載されているインターネットブラウザを介して、第１言語文受付モジュール１１０、第２言語文受付モジュール１１５による受け付け、出力モジュール１４０による出力を行うようにしてもよい。また、各翻訳処理モジュール１２５が翻訳を依頼する先として、各翻訳システム２２０、各翻訳者端末２３０を有している翻訳者がある。

以下に利用例を説明する。
（１）ユーザー端末２１０のユーザーが、言語処理装置１００にアクセスして、原文と翻訳文を入力し、添削依頼を行う。言語処理装置１００は、複数の翻訳システム２２０を用いて、原文の翻訳を行って、その翻訳結果を受け取り、ユーザーの翻訳文を修正して、ユーザー端末２１０に提示する。
（２）ユーザー端末２１０のユーザーが、言語処理装置１００にアクセスして、原文と翻訳文を入力し、添削依頼を行う。言語処理装置１００は、複数の翻訳システム２２０を用いて、原文の翻訳を行って、その翻訳結果を受け取り、ユーザーの翻訳文を修正して、添削担当者が利用している翻訳者端末２３０に提示する。そして、添削担当者が、言語処理装置１００による翻訳文の修正を確認して、さらなる修正又はコメントを付加して、言語処理装置１００に返送する。言語処理装置１００は、添削担当者による確認結果を、依頼したユーザーのユーザー端末２１０に提示する。
（３）ユーザー端末２１０のユーザーが、言語処理装置１００にアクセスして、原文と翻訳文を入力し、添削依頼を行う。言語処理装置１００は、複数の翻訳担当者の翻訳者端末２３０に対して、原文の翻訳を依頼し、その翻訳結果を受け取り、ユーザーの翻訳文を修正して、ユーザー端末２１０に提示する。
（４）翻訳システム２２０Ａが、言語処理装置１００にアクセスして、原文と翻訳文を入力し、添削依頼を行う。言語処理装置１００は、翻訳システム２２０Ａ以外の複数の翻訳システム２２０を用いて、原文の翻訳を行って、その翻訳結果を受け取り、翻訳システム２２０Ａの翻訳文を修正して、翻訳システム２２０Ａに送信する。

図３は、本実施の形態による処理例を示すフローチャートである。添削依頼をするものは、ユーザー又は翻訳システムである。
ステップＳ３０２では、第１言語文受付モジュール１１０は、原文である母国語文を受け付ける。ユーザー又は翻訳システムから、母国語文が入力される。
ステップＳ３０４では、第２言語文受付モジュール１１５は、添削対象の翻訳文を受け付ける。ユーザー又は翻訳システムから、翻訳文が入力される。

ステップＳ３０６では、翻訳制御モジュール１２０は、全翻訳システム２２０での処理が終了したか否かを判断し、終了した場合はステップＳ３１２へ進み、それ以外の場合はステップＳ３０８へ進む。
ステップＳ３０８では、翻訳制御モジュール１２０は、第Ｎ番目の翻訳システム２２０に、母国語文の翻訳依頼を行う。「Ｎ」は、ステップＳ３０６からステップＳ３１０のループ処理において、１から依頼を行う翻訳システム２２０の数までインクリメントされた値となる。

ステップＳ３１０では、翻訳制御モジュール１２０は、翻訳結果を受け取り、ステップＳ３０６へ戻る。
ステップＳ３１２では、言語処理モジュール１３０は、翻訳結果総括処理を行う。ステップＳ３１２の詳細な処理については、図５〜図７の例に示すフローチャートを用いて後述する。

ステップＳ３１４では、修正モジュール１３５は、前ステップの処理結果と添削対象の翻訳文との整合処理を含む添削処理を行う。例えば、ステップＳ３１２の処理結果としての翻訳文と、ステップＳ３０４で受け付けた翻訳文（添削対象の翻訳文）とを比較して、修正箇所等を指摘する添削を行う。
ステップＳ３１６では、出力モジュール１４０は、添削結果を依頼者に通知する。

図３の例に示した処理によって、例えば、翻訳文管理テーブル４００を生成する。図４は、翻訳文管理テーブル４００のデータ構造例を示す説明図である。翻訳文管理テーブル４００は、文ＩＤ欄４０５、ユーザーＩＤ欄４１０、母国語欄４１５、母国語文欄４２０、翻訳言語欄４２５、翻訳文欄４３０、添削文欄４３５、コメント欄４４０を有している。文ＩＤ欄４０５は、本実施の形態において、文を一意に識別するための情報（具体的には、文ＩＤ：ＩＤｅｎｔｉｆｉｃａｔｉｏｎ）を記憶している。ユーザーＩＤ欄４１０は、本実施の形態において、ユーザーを一意に識別するための情報（具体的には、ユーザーＩＤ）を記憶している。母国語欄４１５は、母国語を記憶している。例えば、日本語等と記載される。母国語文欄４２０は、翻訳対象の母国語文を記憶している。例えば、日本語で記載された文である。翻訳言語欄４２５は、翻訳言語を記憶している。例えば、英語等と記載される。翻訳文欄４３０は、添削対象の翻訳文を記憶している。母国語文欄４２０内の文の翻訳文として作成された文であり、例えば、英語で記載された文である。添削文欄４３５は、添削文を記憶している。コメント欄４４０は、コメントを記憶している。
文ＩＤ欄４０５から翻訳文欄４３０は、ステップＳ３０２、ステップＳ３０４の処理によって記載され、添削文欄４３５、コメント欄４４０は、ステップＳ３１２、ステップＳ３１４の処理によって記載される。

図５は、本実施の形態による処理例を示すフローチャートである。ステップＳ３１２の処理の一例であり、統計的処理を利用したものである。
ステップＳ５０２では、各翻訳システム２２０の翻訳文を、単語又はフレーズに分割する。
ステップＳ５０４では、単語又はフレーズの出現頻度を算出する。

ステップＳ５０６では、出現頻度の最も多い単語又はフレーズで文を構成する。
ステップＳ５０８では、ステップＳ５０６で生成した文は、言語処理により誤りのある文と判断されたか否かを判断し、判断された場合はステップＳ５１０へ進み、それ以外の場合は処理を終了する（ステップＳ５９９）。例えば、第２言語の文法に適合しているか否かの判断を行えばよい。

ステップＳ５１０では、誤りのある部分を次に多い出現頻度の単語又はフレーズに変換して、文を構成し、ステップＳ５０８へ戻る。

また、図７の例に示す処理はステップＳ３１２の機械学習処理の一例であるが、その前に学習モデルを生成する処理として、図６の例に示す処理を行う。
図６は、本実施の形態による処理例を示すフローチャートである。
ステップＳ６０２では、教師データとして、（１）母国語文、（２）複数の翻訳結果、（３）正式翻訳文を入力する。教師データとして、さらに、（４）ユーザーの翻訳文（添削対象の文）、（５）添削結果（例えば、修正結果、添削のコメント等）、を加えてもよい。例えば、翻訳の添削サービスを行っている場合、これらのデータを入手することができる。具体的には、ユーザーから「（１）母国語文」のデータを入手し、現存する複数の翻訳システム２２０から「（２）複数の翻訳結果」のデータを入手し、添削者から「（３）正式翻訳文」のデータを入手し、ユーザーから「（４）ユーザーの翻訳文」のデータを入手し、添削者から「（５）添削結果」のデータを入手することができる。

ステップＳ６０４では、機械学習を行う。例えば、学習アルゴリズムとして、決定木、ＮａｉｖｅＢａｙｅｓモデル、決定リスト、サポートベクターマシン、最大エントロピー法、条件付き確率場、ＥＭアルゴリズム等を用いればよい。
ステップＳ６０６では、学習モデルを出力する。この学習モデルは、図７の例で示すフローチャートで用いられる。

図７は、本実施の形態による処理例を示すフローチャートである。
ステップＳ７０２では、翻訳制御モジュール１２０から、母国語文、複数の翻訳結果を受け付ける。
ステップＳ７０４では、機械学習された学習モデルを用いて翻訳文を生成する。教師データとして、（４）ユーザーの翻訳文、（５）添削結果も用いた場合は、さらに、添削結果を出力するようにしてもよい。

図８は、本実施の形態によるユーザーインタフェース例を示す説明図である。
言語処理装置１００は、ユーザー端末２１０のインターネットブラウザを介して、画面８００を表示させ、依頼者であるユーザーの入力を促す。
画面８００には、タイトル欄８１０、翻訳文欄８２０、翻訳対象文（母国語文）欄８３０、添削依頼ボタン８４０を表示する。
タイトル欄８１０には、ユーザーが任意のタイトルを付す。
翻訳文欄８２０には、添削対象の翻訳文（英文）を記載する。
翻訳対象文（母国語文）欄８３０には、原文（日本語文）を記載する。
添削依頼ボタン８４０が選択されると、タイトル欄８１０、翻訳文欄８２０、翻訳対象文（母国語文）欄８３０の内容が、ユーザー端末２１０から言語処理装置１００に送信され、言語処理装置１００による処理が開始される。

図９は、本実施の形態によるユーザーインタフェース例を示す説明図である。
言語処理装置１００は、ユーザー端末２１０のインターネットブラウザを介して、画面９００を表示させ、依頼者であるユーザーに対して添削結果等の処理結果を提示する。
画面９００には、タイトル欄９１０、あなたの翻訳文欄９２０、翻訳対象文（母国語文）欄９３０、添削後の翻訳文欄９４０、添削コメント欄９５０を表示する。
タイトル欄９１０は、図８の例に示したタイトル欄８１０に対応するものである。
あなたの翻訳文欄９２０は、図８の例に示した翻訳文欄８２０に対応するものである。
翻訳対象文（母国語文）欄９３０は、図８の例に示した翻訳対象文（母国語文）欄８３０に対応するものである。
添削後の翻訳文欄９４０には、言語処理装置１００の処理結果である添削後の翻訳文を提示する。なお、翻訳対象文（母国語文）欄８３０に対しての修正がわかるように、修正箇所の形態を異ならせるようにしてもよい。また、ユーザーの翻訳文内の単語又はフレーズを採用する度合いに応じて、複数の修正結果を出力するようにしてもよい。前述したように、（１）原文尊重型の校正、（２）大幅変更を希望の校正、の２つの添削例を出力するようにしてもよい。
添削コメント欄９５０には、添削のコメントを提示する。添削者がいる場合は、添削者によるコメントを提示し、コメントも機械学習している場合は、学習モデルが出力するコメントを提示してもよい。

図１０から図１２は、翻訳文のみを対象とした場合の処理例と本実施の形態による処理例との比較を示す説明図である。
各図（ａ）の例は、ユーザーから入力される翻訳文（これらの例では英文）のみである場合の添削処理例を示すものである。つまり、既存の校正システム又は添削者（人間）が行った添削処理例である。
各図（ｂ）の例は、言語処理装置１００による処理例を示すものである。

図１０（ａ）に示す例は、あなたの翻訳文欄１０２０ａ内の文のみによって添削を行った例を示すものである。
あなたの翻訳文欄１０２０ａには、ユーザーによって「Ｉｈａｖｅａｄｏｇ．」と入力される。この文のみでは、文法的にも、スペルも誤りはないので、添削結果としても、添削後の翻訳文欄１０４０ａに、添削後の文である「Ｉｈａｖｅａｄｏｇ．」と出力することになる。

図１０（ｂ）に示す例は、あなたの翻訳文欄１０２０ｂと翻訳対象文（母国語文）欄１０３０ｂ内の文を用いて、言語処理装置１００が添削を行った例を示すものである。
あなたの翻訳文欄１０２０ｂには、ユーザーによって「Ｉｈａｖｅａｄｏｇ．」と入力される。
さらに、翻訳対象文（母国語文）欄１０３０ｂには、ユーザーによって「私は猫を飼っています。」と入力される。
添削後の翻訳文欄１０４０ａには、言語処理装置１００による添削後の文である「Ｉｈａｖｅａｃａｔ．」が出力される。ユーザーは、「猫」を「ｄｏｇ」と翻訳してしまったので、添削結果として「ｄｏｇ」を「ｃａｔ」と修正している。

図１１（ａ）に示す例は、あなたの翻訳文欄１１２０ａ内の文のみによって添削を行った例を示すものである。
あなたの翻訳文欄１１２０ａには、ユーザーによって「Ｐｌｅａｓｅｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」と入力される。この文のみでは、文法的にも、スペルも誤りはないので、添削結果としても、添削後の翻訳文欄１１４０ａに、添削後の文である「Ｐｌｅａｓｅｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」と出力することになる。

図１１（ｂ）に示す例は、あなたの翻訳文欄１１２０ｂと翻訳対象文（母国語文）欄１１３０ｂ内の文を用いて、言語処理装置１００が添削を行った例を示すものである。
あなたの翻訳文欄１１２０ｂには、ユーザーによって「Ｐｌｅａｓｅｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」と入力される。
さらに、翻訳対象文（母国語文）欄１１３０ｂには、ユーザーによって「その資料をお送りいただければ助かります。」と入力される。
添削後の翻訳文欄１１４０ａには、言語処理装置１００による添削後の文である「Ｉｔｗｏｕｌｄｂｅｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」が出力される。つまり、母国語によって記載された原文を基に校正を行っている。これによって、英文の表現をより豊かにすることができている。

図１２は、翻訳文のみを対象とした場合の処理例と本実施の形態による処理例との比較を示す説明図である。
図１２（ａ）に示す例は、あなたの翻訳文欄１２２０ａ内の文のみによって添削を行った例を示すものである。
あなたの翻訳文欄１２２０ａには、ユーザーによって「Ｄｉｓｈｔｏｏｇｏｏｄｂｅｃａｕｓｅ，Ｉｂｅｃａｍｅｇｏｔｈａｔｒｅｓｔｏｒａｎｖｅｒｙｍｕｃｈ．」と入力される。この文は、基本的な文構造やスペルに問題があり、原文なしでは添削が困難である。したがって、この文に対して、既存の校正システムでは校正できない。図１２の翻訳文欄１２４０ａ、翻訳文欄１２４５ａ内に示す英文例は、添削者（人間）が行った添削例である。
例えば、添削後の翻訳文欄１２４０ａに、添削後の文である「Ｔｈｅｄｉｓｈｗａｓｖｅｒｙｇｏｏｄ．Ｉｌｉｋｅｔｈａｔｒｅｓｔａｕｒａｎｔｖｅｒｙｍｕｃｈ．」と出力することになる。例えば、翻訳文は「その食事はとてもおいしかったです。私はそのレストランがとても好きです。」であることを記載したかったと添削者が解釈した場合の翻訳文になっている。そもそも翻訳文の繋がりが分からず、接続詞や細かな意味の部分が削除されてしまう。したがって、日本語のニュアンスとは異なる意味に推測して添削されることになってしまう。
又は、例えば、添削後の翻訳文欄１２４５ａに、添削後の文である「Ｂｅｃａｕｓｅｔｈｅｄｉｓｈｗａｓｇｏｏｄ，ｔｏｏ，Ｉｃａｍｅ／ｓｔａｒｔｅｄｔｏｇｏｔｏＲｅｓｔｏｒａｎｖｅｒｙｏｆｔｅｎ．」と出力することになる。例えば、翻訳文は「その料理「も」おいしかったので、Ｒｅｓｔｏｒａｎに頻繁に通うようになりました（通い始めました）。」であることを記載したかったと添削者が解釈した場合の翻訳文になっている。理由として、ユーザーの意図としては「とても」という意味で使用された「ｔｏｏ」であるが、「〜も」と解釈されており、英文の単語が別の意味で使用されてしまっているからである。そして、「ｒｅｓｔａｕｒａｎｔ」を「ｒｅｓｔｏｒａｎ」としたスペルミスにより、固有名詞や別の単語と誤って解釈されてしまっているからである。

図１２（ｂ）に示す例は、あなたの翻訳文欄１２２０ｂと翻訳対象文（母国語文）欄１２３０ｂ内の文を用いて、言語処理装置１００が添削を行った例を示すものである。
あなたの翻訳文欄１２２０ｂには、ユーザーによって「Ｄｉｓｈｔｏｏｇｏｏｄｂｅｃａｕｓｅ，Ｉｂｅｃａｍｅｇｏｔｈａｔｒｅｓｔｏｒａｎｖｅｒｙｍｕｃｈ．」と入力される。
さらに、翻訳対象文（母国語文）欄１２３０ｂには、ユーザーによって「その料理があまりにおいしかったので、私はそのレストランに頻繁に通うようになった。」と入力される。
添削後の翻訳文欄１２４０ａには、言語処理装置１００による添削後の文である「Ｂｅｃａｕｓｅｔｈｅｄｉｓｈｗａｓｓｏｇｏｏｄ，Ｉｃａｍｅ／ｓｔａｒｔｅｄｔｏｇｏｔｏｔｈａｔｒｅｓｔａｕｒａｎｔｖｅｒｙｏｆｔｅｎ．」が出力される。
翻訳対象文（母国語文）欄１２３０ｂ内の文を校正に使用することで、解読不可能な低品質な英文を美しく校正することができている。

図１３は、本実施の形態による処理例を示す説明図である。図１０（ｂ）の例に対応する処理例を示すものである。つまり、誤植を検知する例を示すものである。
ユーザーによって、翻訳対象文１３３０、翻訳文（本人）１３２０が入力される。
翻訳対象文１３３０である「私は猫を飼っています。」を入力し、翻訳エンジンＡ：１３８０Ａは翻訳文１３８５Ａである「Ｉｈａｖｅａｃａｔ．」を出力する。同様に、翻訳エンジンＢ：１３８０Ｂは翻訳文１３８５Ｂである「Ｉｈａｖｅａｃａｔ．」を出力する。翻訳エンジンＣ：１３８０Ｃは翻訳文１３８５Ｃである「Ｉｈａｖｅａｃａｔ．」を出力する。
そして、比較モデル１３９０（言語処理モジュール１３０に相当）は、単語毎の出現頻度を計算する。この例では、「Ｉ」は３回、「ｈａｖｅ」は３回、「ｃａｔ」は３回である。各単語は、出現頻度の最も多い単語であるので、これらから「Ｉｈａｖｅａｃａｔ．」を生成する。
そして、修正モジュール１３５は、この文と翻訳文（本人）１３２０を比較する。そして出力モジュール１４０は、、誤り指摘文１３４０、添削後翻訳文１３４２を出力する。誤り指摘文１３４０では、誤りがある「ｄｏｇ」の部分に下線を施している。なお、文字色で誤り部分を指摘するようにしてもよい。例えば、ブルーは比較モデル１３９０に生成された翻訳文との相違により誤りの可能性は低い部分とし、赤は誤りの可能性が高い部分であると表現してもよい。

図１４は、本実施の形態による処理例を示す説明図である。図１１（ｂ）の例に対応する処理例を示すものである。つまり、表現についての提案の例を示すものである。
ユーザーによって、翻訳対象文１４３０、翻訳文（本人）１４２０が入力される。
翻訳対象文１４３０である「その資料をお送りいただければ助かります。」を入力し、翻訳エンジンＡ：１３８０Ａは翻訳文１４８５Ａである「Ｉｗｏｕｌｄｂｅｖｅｒｙｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄｓｅｎｄｍｅｔｈｅｍａｔｅｒｉａｌｓ．」を出力する。同様に、翻訳エンジンＢ：１３８０Ｂは翻訳文１４８５Ｂである「Ｉｔｗｏｕｌｄｂｅｖｅｒｙｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄｓｅｎｄｍｅｔｈｅｍａｔｅｒｉａｌ．」を出力する。翻訳エンジンＣ：１３８０Ｃは翻訳文１４８５Ｃである「Ｉｔｉｓｓａｖｅｄｉｆｙｏｕｃａｎｓｅｎｄｔｈｅｄｏｃｕｍｅｎｔ．」を出力する。
そして、翻訳結果を学習させた学習モデル（比較モデル１３９０）を用いて、翻訳文（本人）１４２０の文と比較する。ここでの学習モデルは、特に文の丁寧さの特徴を学習したものであってもよい。翻訳対象文１４３０の文に含まれている単語又はフレーズから、用いる学習モデルを選択してもよい。この例では、「助かります」という単語から、「丁寧さ」を学習した学習モデルを選択している。
そして、添削結果として、例えば、添削後翻訳文１４４０、添削後翻訳文１４４２、添削後翻訳文１４４４のいずれか１つ以上を出力する。添削後翻訳文１４４０では、「Ｐｌｅａｓｅｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」の「Ｐｌｅａｓｅ」の部分を修正すべきであることを示している。この例では、「Ｐｌｅａｓｅ」の部分を削除線で消す表示にしている。また、添削後翻訳文１４４２では、「Ｉｔｗｏｕｌｄｂｅｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄｓｅｎｄｍｅｔｈｅｄｏｃｕｍｅｎｔｓ．」とし、「Ｉｔｗｏｕｌｄｂｅｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄ」の部分に下線を施し、この部分が原文から修正したことを示している。また、添削後翻訳文１４４４では、「Ｉｔｗｏｕｌｄｂｅｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄｓｅｎｄｍｅｔｈｅｍａｔｅｒｉａｌｓ．」とし、「Ｉｔｗｏｕｌｄｂｅｈｅｌｐｆｕｌｉｆｙｏｕｃｏｕｌｄ」と「ｍａｔｅｒｉａｌｓ」の部分に下線を施し、この部分が原文から修正したことを示している。前述したように、文字色で修正部分を指摘するようにしてもよい。例えば、グリーンは比較モデル１３９０により修正した方がよいと判定された部分とする。

図１５は、本実施の形態による処理例を示す説明図である。図１２（ｂ）の例に対応する処理例を示すものである。つまり、稚拙な文章の校正の例を示すものである。
ユーザーによって、翻訳対象文１５３０、翻訳文（本人）１５２０が入力される。
翻訳対象文１５３０である「その料理があまりにおいしかったので、私はそのレストランに頻繁に通うようになった。」を入力し、翻訳エンジンＡ：１３８０Ａは翻訳文１５８５Ａである「ＴｈｅｆｏｏｄｗａｓｓｏｔａｓｔｙｔｈａｔＩｗｅｎｔｔｏｔｈｅｒｅｓｔａｕｒａｎｔｆｒｅｑｕｅｎｔｌｙ．」を出力する。同様に、翻訳エンジンＢ：１３８０Ｂは翻訳文１５８５Ｂである「Ｔｈｅｄｉｓｈｗａｓｔｏｏｇｏｏｄ，ｓｏＩｃａｍｅｆｒｅｑｕｅｎｔｌｙｔｏｇｏｔｏｔｈｅｒｅｓｔａｕｒａｎｔ．」を出力する。翻訳エンジンＣ：１３８０Ｃは翻訳文１５８５Ｃである「ＴｈｅｆｏｏｄｗａｓｓｏｇｏｏｄｔｈａｔＩｗｅｎｔｔｏｔｈｅｒｅｓｔａｕｒａｎｔｏｆｔｅｎ．」を出力する。
そして、翻訳結果を学習させた学習モデル（比較モデル１３９０）を用いて、翻訳文（本人）１５２０の文と比較する。ここでの学習モデルは、特に翻訳結果を自然言語処理し、接続詞を用いた文章構造を学習させ、特徴に適した結果を優先的に学習したものであってもよい。前述と同様に、翻訳対象文１５３０の文に含まれている単語又はフレーズから、用いる学習モデルを選択してもよい。この例では、「ので、」という単語から、接続詞を用いた文章構造を学習した学習モデルを選択している。
そして、添削結果として、例えば、ユーザーの要望に応じて、最小限の変更、大幅な変更等のように出力させることが可能である。例えば、最小限の変更が指定された場合は添削後翻訳文１５４０を出力し、大幅な変更が指定された場合は添削後翻訳文１５４２を出力する。なお、添削後翻訳文１５４０として「Ｔｈｅｄｉｓｈｗａｓｔｏｏｇｏｏｄ，ｓｏＩｗｅｎｔｔｏｔｈｅｒｅｓｔａｕｒａｎｔｏｆｔｅｎ．」を出力している。添削後翻訳文１５４２として「ＴｈｅｆｏｏｄｗａｓｓｏｔａｓｔｙｔｈａｔＩｗｅｎｔｔｏｔｈｅｒｅｓｔａｕｒａｎｔｆｒｅｑｕｅｎｔｌｙ．」を出力している。また、両者を出力してもよい。このように、ユーザーの要望に応じて、柔軟に対応可能にする。なお、具体的な処理として、比較モデル１３９０は、複数の翻訳文を出力し、翻訳文（本人）１５２０に対しての修正度合いが少ない翻訳文、多い翻訳文を選択すればよい。

図１６は、本実施の形態による処理例を示すフローチャートである。添削依頼をするものは、ユーザー又は翻訳システムである。
ステップＳ１６０２では、第１言語文受付モジュール１１０は、原文である母国語文を受け付ける。ユーザー又は翻訳システムから、母国語文が入力される。
ステップＳ１６０４では、第２言語文受付モジュール１１５は、添削対象の翻訳文を受け付ける。ユーザー又は翻訳システムから、翻訳文が入力される。

ステップＳ１６０６では、翻訳制御モジュール１２０は、ステップＳ１６０２で受け付けられた母国語文からカテゴリを抽出する。例えば、ユーザー又は翻訳システムがカテゴリを指定する。
ステップＳ１６０８では、翻訳制御モジュール１２０は、カテゴリに応じて、翻訳システムを選択する。例えば、翻訳システム・カテゴリテーブル１７００を用いて選択すればよい。図１７は、翻訳システム・カテゴリテーブル１７００のデータ構造例を示す説明図である。翻訳システム・カテゴリテーブル１７００は、翻訳システムＩＤ欄１７０５、カテゴリ数欄１７１０、カテゴリ欄１７１５、ランク欄１７２０等を有している。翻訳システムＩＤ欄１７０５は、本実施の形態において、翻訳システム２２０を一意に識別するための情報（具体的には、翻訳システムＩＤ）を記憶している。カテゴリ数欄１７１０は、その翻訳システムに付与されているカテゴリ数を記憶している。カテゴリ数欄１７１０内の数だけ、カテゴリ数欄１７１０の後にカテゴリ欄１７１５とランク欄１７２０の組が続く。カテゴリ欄１７１５は、カテゴリを記憶している。ランク欄１７２０は、そのカテゴリにおける、その翻訳システムのランクを記憶している。例えば、ステップＳ１６０６で抽出されたカテゴリにおいて、閾値ランクＴ以上の翻訳システム２２０を選択すればよい。なお、ランク付けは、図１５の例で説明した最小限の変更の際に採用された翻訳文に類似する翻訳を行った翻訳システム２２０のランクを高くするように行う。

ステップＳ１６１０では、添削依頼をするものは、翻訳システムであるか否かを判断する。添削依頼をするものが翻訳システムである場合はステップＳ１６１２へ進み、それ以外の場合はステップＳ１６１４へ進む。
ステップＳ１６１２では、添削依頼をするものである翻訳システムを、ステップＳ１６０８で選択した翻訳システムから除外する。自分自身を添削する側の翻訳システムに含めないようにするためである。もちろんのことながら、ステップＳ１６０８で選択した翻訳システムに、添削依頼をした翻訳システムが含まれていなければ、除外することは不要である。

ステップＳ１６１４では、翻訳制御モジュール１２０は、選択された翻訳システム２２０での処理が終了したか否かを判断し、終了した場合はステップＳ１６２０へ進み、それ以外の場合はステップＳ１６１６へ進む。
ステップＳ１６１６では、翻訳制御モジュール１２０は、第Ｎ番目の翻訳システム２２０に、母国語文の翻訳依頼を行う。「Ｎ」は、ステップＳ１６１４からステップＳ１６１８のループ処理において、１から依頼を行う翻訳システム２２０の数までインクリメントされた値となる。

ステップＳ１６１８では、翻訳制御モジュール１２０は、翻訳結果を受け取り、ステップＳ１６１４へ戻る。
ステップＳ１６２０では、言語処理モジュール１３０は、翻訳結果総括処理を行う。ステップＳ１６２０の詳細な処理については、図５〜図７の例に示すフローチャートを用いて前述した。

ステップＳ１６２２では、修正モジュール１３５は、前ステップの処理結果と添削対象の翻訳文との整合処理を含む添削処理を行う。例えば、ステップＳ１６２０の処理結果としての翻訳文と、ステップＳ１６０４で受け付けた翻訳文（添削対象の翻訳文）とを比較して、修正箇所等を指摘する添削を行う。
ステップＳ１６２４では、出力モジュール１４０は、添削結果を依頼者に通知する。

なお、本実施の形態（言語処理装置１００、ユーザー端末２１０、翻訳システム２２０、翻訳者端末２３０）としてのプログラムが実行されるコンピュータのハードウェア構成は、図１８に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部（演算部）としてＣＰＵ１８０１を用い、記憶装置としてＲＡＭ１８０２、ＲＯＭ１８０３、ＨＤＤ１８０４を用いている。ＨＤＤ１８０４として、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅの略）、フラッシュ・メモリであるＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅの略）等を用いてもよい。受付モジュール１０５、第１言語文受付モジュール１１０、第２言語文受付モジュール１１５、翻訳制御モジュール１２０、翻訳処理モジュール１２５、言語処理モジュール１３０、修正モジュール１３５、出力モジュール１４０等のプログラムを実行するＣＰＵ１８０１と、そのプログラムやデータを記憶するＲＡＭ１８０２と、本コンピュータを起動するためのプログラム等が格納されているＲＯＭ１８０３と、原文、翻訳文等を記憶する機能を有する補助記憶装置であるＨＤＤ１８０４と、キーボード、マウス、タッチスクリーン、マイク、カメラ（視線検知カメラ等を含む）等に対する利用者の操作（動作、音声、視線等を含む）に基づいてデータを受け付ける受付装置１８０６と、液晶ディスプレイ、有機ＥＬディスプレイ、スピーカー等の出力装置１８０５と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース１８０７、そして、それらをつないでデータのやりとりをするためのバス１８０８により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。

前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図１８に示すハードウェア構成は、１つの構成例を示すものであり、本実施の形態は、図１８に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサーとして、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略、ＧＰＧＰＵ（Ｇｅｎｅｒａｌ−ＰｕｒｐｏｓｅｃｏｍｐｕｔｉｎｇｏｎＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓの略）を含む）を用いてもよいし、一部のモジュールを専用のハードウェア（例えば特定用途向け集積回路（具体例として、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔの略）等がある）や再構成可能な集積回路（具体例として、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙの略）等がある）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図１８に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器（携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む）、情報家電、ロボット等に組み込まれていてもよい。

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、ブルーレイ・ディスク（Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ）、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ（登録商標））、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）、ＳＤ（ＳｅｃｕｒｅＤｉｇｉｔａｌの略）メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。

１００…言語処理装置
１０５…受付モジュール
１１０…第１言語文受付モジュール
１１５…第２言語文受付モジュール
１２０…翻訳制御モジュール
１２５…翻訳処理モジュール
１３０…言語処理モジュール
１３５…修正モジュール
１４０…出力モジュール
２１０…ユーザー端末
２２０…翻訳システム
２３０…翻訳者端末
２９０…通信回線

Claims

第１言語で記載された文を受け付ける第１受付手段と、
第２言語で記載された、前記第１受付手段が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付手段と、
前記第１受付手段が受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御手段と、
複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付手段が受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理手段と、
前記第１翻訳文と前記言語処理手段によって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力手段
を有する情報処理装置。
前記第１受付手段が受け付けた文のカテゴリを抽出する第２抽出手段
をさらに有し、
前記翻訳手段は、カテゴリ毎にランク付けされており、
前記翻訳制御手段は、前記第２抽出手段によって抽出されたカテゴリに対応するランクに応じて翻訳を行わせる翻訳手段を選択する
請求項１に記載の情報処理装置。
前記第１受付手段と前記第２受付手段が、同じ翻訳手段から前記文と前記第１翻訳文を受け付けた場合は、前記翻訳制御手段は、該翻訳手段に対して翻訳をさせないように制御する
請求項１又は２に記載の情報処理装置。
コンピュータを、
第１言語で記載された文を受け付ける第１受付手段と、
第２言語で記載された、前記第１受付手段が受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付手段と、
前記第１受付手段が受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御手段と、
複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付手段が受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理手段と、
前記第１翻訳文と前記言語処理手段によって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力手段
として機能させる情報処理プログラム。
第１言語で記載された文を受け付ける第１受付ステップと、
第２言語で記載された、前記第１受付ステップが受け付けた文の翻訳文として作成された文である第１翻訳文を受け付ける第２受付ステップと、
前記第１受付ステップが受け付けた文を、複数の翻訳手段に翻訳させる制御を行う翻訳制御ステップと、
複数の前記翻訳手段によって翻訳された結果である複数の第２翻訳文と前記第１受付ステップが受け付けた文から、母国語文と複数の翻訳結果と正式翻訳文を教師データとし、母国語文と複数の翻訳結果を入力とし、正式翻訳文を出力するように機械学習された学習モデルを用いて、第３翻訳文を生成する言語処理ステップと、
前記第１翻訳文と前記言語処理ステップによって生成された第３翻訳文を比較して、異なっている部分を抽出し、該異なっている部分を他の部分とは異なる形態で出力する出力ステップ
を有する情報処理方法。