JP2019003552A

JP2019003552A - 処理方法、処理装置、及び処理プログラム

Info

Publication number: JP2019003552A
Application number: JP2017119766A
Authority: JP
Inventors: 今出　昌宏; Masahiro Imaide; 昌宏今出; 山内　真樹; Maki Yamauchi; 真樹山内; 菜々美藤原; Nanami Fujiwara
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2017-06-19
Filing date: 2017-06-19
Publication date: 2019-01-10
Anticipated expiration: 2037-06-19
Also published as: CN109145311B; JP6775202B2; CN109145311A; US20180365234A1; US10402497B2

Abstract

【課題】対義語を含む対訳文による誤訳可能性を簡便に且つ適切に評価することができる処理装置等を提示する。
【解決手段】翻訳処理装置１は、第１言語で記述された第１文と、第２言語による第１文の翻訳文である第１翻訳文との組である第１対訳データを取得する取得部１１と、第１文及び第１翻訳文に含まれる語句に基づき、第１対訳データが誤訳可能性のある対訳データであるか否かを評価する評価部１２と、評価の結果に基づく情報を出力する出力部１３とを備え、評価部１２は、（１）第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）第１翻訳文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳データであるか否かを評価する。
【選択図】図１

Description

本開示は、第１言語で記述された入力文と入力文の第２言語への翻訳文とを含む対訳データ（対訳文）を処理する処理方法、処理装置、及び処理プログラムに関し、例えば、機械翻訳において、対義語を含む対訳文の対義誤翻訳の抑制及び該対義誤翻訳の注意喚起を行う技術に関する。

近年、第１言語の文を第１言語と異なる第２言語の文に翻訳する機械翻訳が研究及び開発されており、特に統計的機械翻訳とニューラル機械翻訳とが広く実用化されつつある。統計的機械翻訳とニューラル機械翻訳とは、どちらも第１言語と第２言語の対応する文の組である対訳文の集合（対訳コーパス）を訓練データとして大量に用いる機械学習によって、翻訳に必要な知識を蓄積した機械学習モデルを生成し、そのモデルを通じて翻訳を行う機械翻訳システムである。

上記の機械翻訳に関して、例えば、特許文献１には、原文と翻訳文とを入力する文入力部と、原文からの原文情報の抽出と翻訳文からの翻訳文情報の抽出とを行なう情報抽出部と、原文情報と翻訳文情報とを比較する比較部と、比較部における比較結果をもとに翻訳文の誤り率を計算する誤り率計算部と、誤り率の高い翻訳文の対訳文を利用者に伝える報知部とを備えた対訳文誤り検出装置が開示されている。

また、特許文献２には、対訳を含むテキストコンテンツデータを取得するテキスト取得部と、テキストコンテンツデータを単語ごとに分解する形態素解析部と、対訳を有するチェック用辞書を参照して、テキストコンテンツ中における対訳が適切であるかチェックを行う辞書チェック部と、対訳の対となる単語の少なくとも一方の単語の使用が適切でないと判断した場合に、ネットワークを介して不適切単語の代わりに使用される代用単語を検索する代用単語検索部と、不適切単語と代用単語とを関連付けて提示する提示部とを有するサーバ装置が開示されている。

特開２０００−１４８７５６号公報特開２０１６−１９４８２２号公報

しかしながら、上記の従来技術では、対義語を含む対訳文の処理方法について何ら検討されておらず、対義語を含む対訳文の処理方法については、更なる改善が必要とされていた。

本開示は、上述の事情に鑑みて為されたものであり、対義語を含む対訳文による誤訳可能性を簡便に且つ適切に評価することができる処理方法、処理装置、及び処理プログラムを提供することを目的とする。

本開示の一様態による処理方法は、第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置における処理方法であって、前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、前記評価の結果に基づく情報を出力し、前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき行われる。

本開示によれば、対義語を含む対訳文による誤訳可能性を簡便に且つ適切に評価することができる。

本開示の実施の形態１における翻訳処理装置の構成の一例を示すブロック図である。図１に示す翻訳処理装置による翻訳評価処理の一例を示すフローチャートである。図２に示す誤訳可能性評価処理の一例を示すフローチャートである。図３に示す誤訳可能性評価処理に用いられる判定条件１〜７の具体例を説明するための左右誤翻訳誘発対訳文判定表の一例を示す図である。本開示の実施の形態２における翻訳処理装置の構成の一例を示すブロック図である。図５に示す翻訳処理装置による翻訳評価処理の一例を示すフローチャートである。図６に示す誤訳可能性評価処理の一例を示すフローチャートである。図５に示す翻訳処理装置の表示部に表示されるアラート情報画面の一例を示す図である。

（本開示の基礎となった知見）
従来の機械翻訳システムは、近年目覚しい性能向上を示す一方で、場合によっては論外な翻訳結果を出力することがある。例えば、ごくまれではあるが、「右」の意味を示す第１言語を「左」の意味を示す第２言語に、あるいはその反対に「左」の意味の第１言語を「右」の意味の第２言語に翻訳すること（以下、「左右対義誤翻訳」という）がある。これは、道案内用途や作業指示用途での使用においては、致命的な問題である。

上記の左右対義誤翻訳が発生する理由は２つある。１つ目は、機械学習モデル生成に用いる対訳文の作成は、一般に人手で実施されるため、いかに注意を払おうとも、ヒューマンエラーによる誤訳がわずかに混在してしまうことである。２つ目は、対訳としては正しくとも、機械学習時に「左」又は「右」を誤って対義で学習する恐れのある対訳文、あるいは、「左」又は「右」の意味の語が別の意味の語と結び付けられて学習する恐れのある対訳文が存在することである。

例えば「右に曲がると、左に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」のように１文中に「左」と「右」とを意味する語が同時に存在する対訳文（以下、「左右混在文」という）の場合には、「右」を「ｌｅｆｔ」との関連性を高く学習し、「左」を「ｒｉｇｈｔ」との関連性を高く学習する恐れがある。また、同一言語内に「左」及び「右」が同時に存在しなくとも、「わかった、左に行くよ／Ａｌｌｒｉｇｈｔ，Ｉｗｉｌｌｇｏｌｅｆｔ」に含まれる「ｒｉｇｈｔ」のように、多義性単語を含む対訳文（以下、「左右同形多義語含有文」という）の場合も、「左」と「ｒｉｇｈｔ」を関連性高く学習する確率が０にはならない。

特許文献１及び特許文献２には、対訳文の誤りを検出する方法が開示されており、これらにより、ヒューマンエラーによる誤訳は検出することができる。しかし、左右混在文又は左右同形多義語含有文については、対訳文としては正しい文であるため、特許文献１及び特許文献２の技術では検出することができなかった。

また、他者から機械翻訳システムのうち翻訳機能のみの提供を受けている場合、機械学習モデル生成に用いる対訳文を制御することはできないため、特許文献１及び特許文献２の技術適用による誤翻訳回避は不可能だった。

このため、本開示では、対義語を含む対訳文による誤訳（左右対義誤翻訳等）の発生が従来よりも抑制された機械学習モデルを備えた処理装置等を提供することを第１の目的とする。また、対義語を含む対訳文による誤訳（左右対義誤翻訳等）が含まれる可能性が翻訳結果にある場合には、その事実を注意喚起し、翻訳装置の使用者が正しい翻訳内容へ至るヒントを提示することのできる処理装置等を提供することを第２の目的とする。

上記の目的を達成するため、上記の左右対義誤翻訳等の発生理由に鑑み、本開示においては、例えば、翻訳装置の機械学習モデルの作成時に訓練データとして用いる対訳コーパスにおいて、第１言語の入力文中における対義語（例えば、「右」又は「左」の意味の語）の存在有無と、第２言語の翻訳文中における対義語（例えば、「右」又は「左」の意味の語）の存在有無との組み合わせにより、上述の明らかな対訳誤りや、左右混在文又は左右同形多義語含有文のような、「左」又は「右」を対義で誤学習する恐れのある対訳文（左右誤翻訳誘発対訳文）等をあらかじめ抽出し、削除又は修正を施す。これにより、「左」又は「右」等を誤って対義で学習することを抑制することができ、翻訳装置による翻訳結果における左右対義誤翻訳等の誤訳の発生を従来に比べて抑制することができる。

また、本開示においては、例えば、種々の翻訳装置の使用時には、第１言語の入力文中における対義語（例えば、「右」又は「左」の意味の語）の存在有無と、第２言語の翻訳文中における対義語（例えば、「右」又は「左」の意味の語）の存在有無との組み合わせにより、機械翻訳結果の左右誤翻訳可能性等の誤訳可能性を段階的に判定し、その判定結果に応じたアラート情報を翻訳結果とあわせて提示する。より好ましくは、アラート情報には、入力文に対する類似文（参考例文）とその機械翻訳結果（参考翻訳文）も付加されてもよい。これにより、翻訳装置の使用者は、提示されたアラート情報、参考例文及び参考翻訳文を参照することにより、翻訳結果が左右誤翻訳等の誤訳を含むか否かを総合的に判断し、安易に左右誤翻訳等の誤訳を受け入れることを回避することができる。

上記の知見に基づき、本願発明者らは、対義語を含む対訳文（対訳データ）を如何に処理すべきかについて鋭意検討を行った結果、以下の本開示を完成したものである。

本開示の一態様に係る処理方法は、第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置における処理方法であって、前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、前記評価の結果に基づく情報を出力し、前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき行われる。

このような構成により、第１言語で記述された第１文と、第２言語による第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、（１）第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）第１翻訳文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、この評価の結果に基づく情報を出力しているので、対義語を含む対訳文による誤訳可能性、すなわち、翻訳を行う際に翻訳誤りを誘発する可能性及び翻訳結果が翻訳誤りを含む可能性を簡便に且つ適切に評価することができる。

前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語が存在することの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語が存在することの第２判定、の結果に基づき行われるようにしてもよい。

このような構成により、（１）第１文に、第１の意味を有する単語及びその対義語が存在することの第１判定、及び、（２）第１翻訳文に、前記第１の意味を有する単語及びその対義語が存在することの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳文であるか否かを評価しているので、誤訳を誘発しやすい対訳文を簡便に且つ適切に抽出することができる。

前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し且つ他方の第２の単語が存在しないことの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在せず且つ前記第２の単語の翻訳である第２の翻訳単語が存在することの第２判定、の結果に基づき行われるようにしてもよい。

このような構成により、（１）第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し且つ他方の第２の単語が存在しないことの第１判定、及び、（２）第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在せず且つ第２の単語の翻訳である第２の翻訳単語が存在することの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳文であるか否かを評価しているので、誤訳可能性が非常に高い対訳文を簡便に且つ適切に抽出することができる。

前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在することの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在しないことの第２判定、の結果に基づき行われるようにしてもよい。

このような構成により、（１）第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在することの第１判定、及び、（２）第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在しないことの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳文であるか否かを評価しているので、誤訳可能性が高い対訳文を簡便に且つ適切に抽出することができる。

前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在しないことの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在することの第２判定、の結果に基づき行われるようにしてもよい。

このような構成により、（１）第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在しないことの第１判定、及び、（２）第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在することの第２判定、の結果に基づき、第１対訳データが誤訳可能性のある対訳文であるか否かを評価しているので、誤訳可能性は低いが、誤訳可能性がある対訳文を簡便に且つ適切に抽出することができる。

前記取得は、前記第１対訳データを対訳コーパス記憶部から取得し、前記対訳コーパス記憶部は、前記第１言語で記述された文と、前記第１言語で記述された文の前記第２言語による翻訳文との対を複数含む対訳コーパスを記憶するようにしてもよい。

このような構成により、第１言語で記述された文と、第１言語で記述された文の第２言語による翻訳文との対を複数含む対訳コーパスを記憶する対訳コーパス記憶部から、第１対訳データを取得しているので、対訳コーパス記憶部の複数の対訳データのうち、翻訳を行う際に翻訳誤りを誘発する可能性が高い対訳文を簡便に且つ適切に抽出することができる。

前記出力は、前記評価の結果に基づき、訓練用対訳コーパスを生成するようにしてもよい。

このような構成により、上記の評価の結果に基づき、訓練用対訳コーパスを生成しているので、翻訳を行う際に翻訳誤りを誘発する可能性が高い対訳文を修正又は削除することにより、翻訳を行う際に翻訳誤りを誘発する可能性が高い対訳文を含まない訓練用対訳コーパスを生成することができる。

前記出力は、前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記訓練用対訳コーパスとして採用しないことにより、前記訓練用対訳コーパスを生成するようにしてもよい。

このような構成により、評価の結果に基づき、誤訳可能性のない対訳データを訓練用対訳コーパスとして採用し、誤訳可能性のある対訳データを訓練用対訳コーパスとして採用しないことにより、訓練用対訳コーパスを生成しているので、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳文を含まない訓練用対訳コーパスを生成することができる。

前記出力は、前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記誤訳可能性がないように修正した修正対訳データを前記訓練用対訳コーパスとして採用することにより、前記訓練用対訳コーパスを生成するようにしてもよい。

このような構成により、評価の結果に基づき、誤訳可能性のない対訳データを訓練用対訳コーパスとして採用し、誤訳可能性のある対訳データを誤訳可能性がないように修正した修正対訳データを訓練用対訳コーパスとして採用することにより、訓練用対訳コーパスを生成しているので、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳文を含まないデータ数の多い訓練用対訳コーパスを生成することができる。

前記訓練用対訳コーパスを用いて翻訳モデルを学習するようにしてもよい。

このような構成により、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳データを含まない訓練用対訳コーパスを用いて翻訳モデルを学習しているので、この翻訳モデルを用いた翻訳結果における左右対義誤翻訳等の誤訳の発生を抑制することができる。

前記取得は、前記第１文を前記第１翻訳文に翻訳する翻訳装置から前記第１対訳データを取得するようにしてもよい。

このような構成により、第１文を第１翻訳文に翻訳する翻訳装置から第１対訳データを取得しているので、使用者は翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを総合的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを回避することができる。

前記出力は、前記評価の結果に基づき、アラート情報を生成して表示するようにしてもよい。

このような構成により、上記の評価の結果に基づき、アラート情報を生成して表示しているので、使用者はアラート情報により翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを確実に回避することができる。

前記出力は、前記評価の結果に基づき、前記アラート情報として、前記誤訳可能性として第１の可能性を示す第１アラート情報と、前記誤訳可能性として前記第１の可能性より高い第２の可能性を示す第２アラート情報とを生成するようにしてもよい。

このような構成により、上記の評価の結果に基づき、アラート情報として、誤訳可能性として第１の可能性を示す第１アラート情報と、誤訳可能性として第１の可能性より高い第２の可能性を示す第２アラート情報とを生成しているので、翻訳結果の左右誤翻訳可能性等の誤訳可能性を段階的に表示することができる。したがって、使用者は翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを段階的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを確実に回避することができる。

前記出力は、前記評価の結果に基づき、前記アラート情報に付加して、参考翻訳例を生成して表示するようにしてもよい。

このような構成により、上記の評価の結果に基づき、アラート情報に付加して、参考翻訳例を生成して表示しているので、アラート情報及び参考翻訳例により、使用者は翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを総合的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを確実に回避することができる。

前記第１文又は前記第１翻訳文に含まれる語句は、「右」又「左」であるようにしてもよい。

このような構成により、対訳コーパス記憶部から第１対訳データを取得し、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳データを含まない訓練用対訳コーパスを用いて翻訳モデルを学習する場合は、この翻訳モデルを用いた翻訳結果における左右対義誤翻訳の発生を抑制することができ、また、第１文を第１翻訳文に翻訳する翻訳装置から第１対訳データを取得している場合は、翻訳装置の翻訳結果が左右誤翻訳を含むか否かを総合的に判断し、安易に左右誤翻訳を受け入れることを回避することができる。

また、本開示は、以上のような特徴的な処理を実行する処理方法として実現することができるだけでなく、このような処理方法により実行される特徴的な処理に対応する特徴的な構成を備える処理装置などとして実現することもできる。また、このような処理方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。したがって、以下の他の態様でも、上記の処理方法と同様の効果を奏することができる。

本開示の他の態様に係る処理装置は、第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置であって、前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得する取得部と、前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価する評価部と、前記評価の結果に基づく情報を出力する出力部とを備え、前記評価部は、（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価する。

本開示の他の態様に係る処理プログラムは、第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置として、コンピュータを機能させるための処理プログラムであって、前記コンピュータに、前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、前記評価の結果に基づく情報を出力する、処理を実行させ、前記評価は、（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき行われる。

そして、上記のようなコンピュータプログラムを、ＣＤ−ＲＯＭ等のコンピュータ読み取り可能な非一時的な記録媒体あるいはインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。また、本開示の実施の形態に係る翻訳処理装置の構成要素の一部とそれ以外の構成要素とを複数のコンピュータに分散させたシステムとして構成してもよい。

なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すためのものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、全ての実施の形態において、各々の内容を組み合わせることもできる。

以下、本開示の各実施の形態について、図面を参照しながら説明する。

（実施の形態１）
図１は、本開示の実施の形態１における翻訳処理装置の構成の一例を示すブロック図である。図１に示す翻訳処理装置１は、評価装置１０及び翻訳装置２０を備える。評価装置１０は、取得部１１、評価部１２、及び出力部１３を備える。翻訳装置２０は、対訳コーパス記憶部２１、生成部２２、訓練用対訳コーパス記憶部２３、学習部２４、及び翻訳モデル記憶部２５を備える。

図１に示す翻訳処理装置１は、第１言語で記述された入力文と、入力文の第２言語への翻訳文とを含む対訳データ（対訳文）を処理する。第１言語としては、例えば、日本語、英語、フランス語、ドイツ語というような言語を採用できる。第２言語としては、第１言語とは異なる言語を採用できる。

翻訳処理装置１は、評価装置１０及び翻訳装置２０を用いて、翻訳を行う際に対訳コーパスの対訳データが翻訳誤りを誘発する可能性を評価し、この評価結果に基づいて、翻訳を行う際に翻訳誤りを誘発する可能性が高い対訳データを含まない訓練用対訳コーパスを作成し、この訓練用対訳コーパスを用いて学習した翻訳モデルを作成する。評価装置１０は、上記の機械学習モデル作成過程に使用される評価装置である。翻訳装置２０は、訓練用対訳コーパスを用いて学習した翻訳モデルを用いて翻訳を行う翻訳装置である。

翻訳処理装置１は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）及び補助記憶装置等を備える１台又は複数台のコンピュータで構成される。なお、翻訳処理装置１の翻訳装置２０は、評価装置１０と別体の翻訳装置として構成してもよく、例えば、スマートフォンやタブレット端末等の携帯情報端末で構成されてもよいし、据え置き型のコンピュータで構成されてもよい。或いは、翻訳装置２０は、クラウドサーバで構成されてもよい。この場合、入力文等を入力する入力部（図示省略）や翻訳文等を表示する表示部（図示省略）等は、ユーザが所持する携帯情報端末或いは据え置き型のコンピュータで構成され、これら以外の構成要素がクラウドサーバで構成されてもよい。

翻訳装置２０の対訳コーパス記憶部２１は、補助記憶装置等から構成され、第１言語（例えば、日本語）で記述された文と、第１言語で記述された文の第２言語（例えば、英語）による翻訳文との対（対訳データ）を複数含む対訳コーパスを記憶している。対訳コーパスの対訳データは、第１言語で記述された第１文と、第２言語による第１文の翻訳文である第１翻訳文との組である第１対訳データの一例である。

評価装置１０の取得部１１は、対訳コーパス記憶部２１に保存された対訳データを取得して評価部１２に出力する。評価部１２は、対訳データの第１文及び第１翻訳文に含まれる語句に基づき、対訳データが誤訳可能性のある対訳データであるか否かを評価し、評価結果を対訳データとともに出力部１３に出力する。出力部１３は、評価結果に基づく情報として、対訳データごとに誤訳可能性の評価結果を翻訳装置２０の生成部２２に出力する。

具体的には、評価部１２は、後述する判定条件１として、第１文に、第１の意味を有する単語及びその対義語が存在し、且つ、第１翻訳文に、第１の意味を有する単語及びその対義語が存在するか否かを判定する。

また、評価部１２は、後述する判定条件２、３として、第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し且つ他方の第２の単語が存在せず、且つ、第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在せず且つ第２の単語の翻訳である第２の翻訳単語が存在するか否かを判定する。

また、評価部１２は、後述する判定条件４、５として、第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し、且つ、第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在しないか否かを判定する。

また、評価部１２は、後述する判定条件６、７として、第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在せず、且つ、第１翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在するか否かを判定する。

なお、評価部１２の判定条件は、上記の例に特に限定されず、第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否か、及び、第１翻訳文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かを判定したり、判定条件１〜７の一部を任意に組み合わせたり、他の判定条件を用いたりする等の種々の変更が可能である。

翻訳装置２０の生成部２２は、評価部１２の評価結果に基づき、誤訳可能性のない対訳データを訓練用対訳コーパスとして採用し、誤訳可能性のある対訳データを訓練用対訳コーパスとして採用しないことにより、訓練用対訳コーパスを生成して訓練用対訳コーパス記憶部２３に記憶させる。ここで、本実施の形態では、誤訳可能性は、翻訳を行う際に翻訳誤りを誘発する可能性を意味する。

なお、誤訳可能性のある対訳データの処理方法は、上記の例に特に限定されず、誤訳可能性のある対訳データを誤訳可能性がないように修正した修正対訳データを訓練用対訳コーパスとして採用するようにしてもよい。

例えば、生成部２２は、誤訳可能性のある対訳データとして、「右」又は「左」の意味の第１言語をそれぞれ「左」又は「右」の意味の第２言語へと誤った翻訳を誘発する左右誤翻訳誘発対訳文を抽出し、抽出した左右誤翻訳誘発対訳文の一部又は全てを、左右対義誤翻訳を誘発しにくい形態に修正可能か又は修正不要かを判断する。修正可能と判断した場合、生成部２２は、当該左右誤翻訳誘発対訳文を修正し、修正対訳文を生成して訓練用対訳コーパス記憶部２３に出力し、修正不要と判断した場合、当該左右誤翻訳誘発対訳文を修正不要文として訓練用対訳コーパス記憶部２３に出力する。

学習部２４は、訓練用対訳コーパス記憶部２３に記憶された訓練用対訳コーパスを用いて翻訳モデルを学習し、学習した翻訳モデルを翻訳のための機械学習モデルとして生成して翻訳モデル記憶部２５に記憶させる。

ここで、機械学習モデルは、翻訳装置２０が採用するアルゴリズムによって態様が異なる。例えば、翻訳装置２０が統計的機械翻訳技術を採用した翻訳装置であれば、「意味的な等価性」を学習した翻訳モデルと、「目的言語らしさ」を学習した言語モデルとで表現される。また、翻訳装置２０がニューラル機械翻訳技術を採用した翻訳装置であれば、再帰的ニューラルネットワークを用いたｓｅｑｕｅｎｓｅ−ｔｏ−ｓｅｑｕｅｎｓｅモデルで記述される。

次に、上記のように構成された翻訳処理装置１の翻訳評価処理について説明する。図２は、図１に示す翻訳処理装置１による翻訳評価処理の一例を示すフローチャートである。なお、以下の説明では、より具体的な説明のため、第１言語として日本語を採用し、第２言語として英語を採用するが、これは一例であり、他の言語間においても同様な概念で誤訳可能性を評価することにより、左右誤翻訳誘発対訳文を抽出して削除等することができる。また、下記の評価装置１０の処理は、翻訳装置２０と同じコンピュータ等の構成上で実行されてもよいし、部分的に他のコンピュータ等の構成上で実行されてもよい。また、その一部のステップは、人手作業によって実施されてもよい。

まず、取得部１１は、対訳コーパス記憶部２１に記憶されている対訳データを取得して評価部１２に出力する（ステップＳ１１）。

次に、評価部１２は、対訳データの第１言語の文とその翻訳文それぞれに含まれる単語に基づき対訳文の誤訳可能性を評価する誤訳可能性評価処理を実行し（ステップＳ１２）、誤訳可能性がない場合は、ステップＳ１３に処理を移行し、誤訳可能性がある場合は、ステップＳ１４に処理を移行する。

図３は、図２に示す誤訳可能性評価処理（ステップＳ１２）の一例を示すフローチャートであり、図４は、図３に示す誤訳可能性評価処理に用いられる判定条件１〜７の具体例を説明するための左右誤翻訳誘発対訳文判定表の一例を示す図である。

図３に示すように、評価部１２は、図２に示す誤訳可能性評価処理（ステップＳ１２）として、例えば、左右誤翻訳誘発対訳文該非判定処理（ステップＳ２１〜２７）を実行する。この左右誤翻訳誘発対訳文該非判定処理は、７段階の判定ステップを経て、判定条件１〜７の各条件に応じて、段階的に左右誤翻訳誘発対訳文を抽出する処理である。

まず、評価部１２は、対訳データが判定条件１に該当するか否かを判定し（ステップＳ２１）、対訳データが判定条件１に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件１に該当しない場合は、ステップＳ２２に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件１は、日本語文中に「右」及び「左」を含み、且つ英語文中に「ｒｉｇｈｔ」及び「ｌｅｆｔ」を含むことである。判定条件１に該当する場合の判定結果は、「左右入れ替わり誘発」となり、判定条件１を満たす対訳データに対する推奨対処方法は、対訳データを「右」及び「ｒｉｇｈｔ」のみ又は「左」及び「ｌｅｆｔ」のみに修正すること、又は、対訳データを削除することである。例えば、「右に曲がると、左に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」という対訳文が判定条件１に該当する。

対訳データが判定条件１に該当しない場合、評価部１２は、対訳データが判定条件２に該当するか否かを判定し（ステップＳ２２）、対訳データが判定条件２に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件２に該当しない場合は、ステップＳ２３に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件２は、対訳データの日本語文中に「右」を含んで「左」を含まず、且つ英語文中に「ｒｉｇｈｔ」を含まず「ｌｅｆｔ」を含むことである。判定条件２に該当する場合の判定結果は、「対訳ミス」となり、判定条件２を満たす対訳データに対する推奨対処方法は、対訳データの誤訳を修正すること、又は、対訳データを削除することである。例えば、「階段を正面に見て、右手に曲がります／Ｌｏｏｋｉｎｇａｔｔｈｅｓｔａｉｒｓｉｎｆｒｏｎｔｏｆｙｏｕ，ｔｕｒｎｔｏｔｈｅｌｅｆｔ」という明らかに対訳誤りである対訳文が判定条件２に該当する。

対訳データが判定条件２に該当しない場合、評価部１２は、対訳データが判定条件３に該当するか否かを判定し（ステップＳ２３）、対訳データが判定条件３に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件３に該当しない場合は、ステップＳ２４に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件３は、対訳データの日本語文中に「右」を含まず「左」を含み、且つ英語文中に「ｒｉｇｈｔ」を含んで「ｌｅｆｔ」を含まないことである。判定条件３に該当する場合の判定結果は、「対訳ミス」となり、判定条件３を満たす対訳データに対する推奨対処方法は、対訳データの誤訳を修正すること、又は、対訳データを削除することである。例えば「左のほうに、道沿いに花が植えられています／Ｆｌｏｗｅｒｓａｒｅｐｌａｎｔｅｄａｌｏｎｇｔｈｅｓｔｒｅｅｔｔｏｔｈｅｒｉｇｈｔ」という明らかに対訳誤りである対訳文が判定条件３に該当する。

対訳データが判定条件３に該当しない場合、評価部１２は、対訳データが判定条件４に該当するか否かを判定し（ステップＳ２４）、対訳データが判定条件４に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件４に該当しない場合は、ステップＳ２５に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件４は、対訳データの日本語文中に「右」を含み、且つ英語文中に「ｒｉｇｈｔ」を含まないことであり、このとき、日本語文中の「左」及び英語文中の「ｌｅｆｔ」の有無については判定しない。判定条件４に該当する場合の判定結果は、「意訳」、「慣用句」、又は「対訳ミス」となり、判定条件４を満たす対訳データに対する推奨対処方法は、対訳データを個別に確認し、不適な対訳データを修正又は削除することである。

例えば、「右に曲がると、左に建物があります／Ｔｕｒｎｌｅｆｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」という明らかに対訳誤りである対訳文が判定条件４に該当する。また、「右に回すと、徐々に明るくなります／Ｉｆｔｕｒｎｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｂｒｉｇｈｔｅｎｓ」という対訳文も判定条件４に該当する。後者は、対訳としては正しいが、意訳的な表現である。

対訳データが判定条件４に該当しない場合、評価部１２は、対訳データが判定条件５に該当するか否かを判定し（ステップＳ２５）、対訳データが判定条件５に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件５に該当しない場合は、ステップＳ２６に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件５は、対訳データの日本語文中に「左」を含み、且つ英語文中に「ｌｅｆｔ」を含まないことであり、このとき、日本語文中の「右」及び英語文中の「ｒｉｇｈｔ」の有無については判定しない。判定条件５に該当する場合の判定結果は、「意訳」、「慣用句」、又は「対訳ミス」となり、判定条件５を満たす対訳データに対する推奨対処方法は、対訳データを個別に確認し、不適な対訳データを修正又は削除することである。

例えば、「左に曲がると、右に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｒｉｇｈｔ」という明らかに対訳誤りである対訳文が判定条件５に該当する。また、「左に回すと、徐々に暗くなります／Ｉｆｔｕｒｎｃｏｕｎｔｅｒｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｄａｒｋｅｎｓ」という対訳文も判定条件５に該当する。後者は、対訳としては正しいが、意訳的な表現である。

対訳データが判定条件５に該当しない場合、評価部１２は、対訳データが判定条件６に該当するか否かを判定し（ステップＳ２６）、対訳データが判定条件６に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件６に該当しない場合は、ステップＳ２７に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件６は、対訳データの日本語文中に「右」を含まず、且つ英語文中に「ｒｉｇｈｔ」を含むことであり、このとき、日本語文中の「左」及び英語文中の「ｌｅｆｔ」の有無については判定しない。判定条件６に該当する場合の判定結果は、「ｒｉｇｈｔ」の多義性、又は「対訳ミス」となり、判定条件６を満たす対訳データに対する推奨対処方法は、対訳データを個別に確認し、不適な対訳データを修正若しくは削除すること、又は、不適と判断できない対訳データはそのまま使用することである。

例えば、「このあたりで曲がってください／Ｔｕｒｎｒｉｇｈｔａｒｏｕｎｄｈｅｒｅ」という対訳誤りである対訳文が判定条件６に該当する。また、「すぐに準備します／Ｉｃａｎｐｒｅｐａｒｅｔｈｅｍｒｉｇｈｔａｗａｙ」という対訳文も判定条件６に該当する。後者は、「右」以外の意味で用いられた「ｒｉｇｈｔ」であり（ｒｉｇｈｔの多義性）、対訳としては正しい表現である。

対訳データが判定条件６に該当しない場合、評価部１２は、対訳データが判定条件７に該当するか否かを判定し（ステップＳ２７）、対訳データが判定条件７に該当する場合は、図２に示すステップＳ１４に処理を移行し、対訳データが判定条件７に該当しない場合は、図２に示すステップＳ１３に処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件７は、対訳データの日本語文中に「左」を含まず、且つ英語文中に「ｌｅｆｔ」を含むことであり、このとき、日本語文中の「右」及び英語文中の「ｒｉｇｈｔ」の有無については判定しない。判定条件７に該当する場合の判定結果は、「ｌｅｆｔ」の多義性、又は「対訳ミス」となり、判定条件７を満たす対訳データに対する推奨対処方法は、対訳データを個別に確認し、不適な対訳データを修正若しくは削除すること、又は、不適と判断できない対訳データはそのまま使用することである。

例えば、「このあたりで曲がってください／Ｔｕｒｎｌｅｆｔａｒｏｕｎｄｈｅｒｅ」という対訳誤りである対訳文が判定条件７に該当する。また、「部屋に鍵を置き忘れました／Ｉｌｅｆｔｍｙｋｅｙｉｎｔｈｅｒｏｏｍ」という対訳文も判定条件７に該当する。後者は、「左」以外の意味で用いられた「ｌｅｆｔ」であり（ｌｅｆｔの多義性）、対訳としては正しい表現である。

再び、図２を参照して、誤訳可能性がない場合、すなわち、上記の判定条件１〜７のいずれにも対訳文が該当しない場合、評価部１２は、対訳文が判定条件１〜７のいずれにも該当しないことを示す評価結果を対訳データとともに出力部１３に出力し、出力部１３は、対訳データを生成部２２に出力し（ステップＳ１３）、処理をステップＳ１６に移行する。

一方、誤訳可能性がある場合、すなわち、上記の判定条件１〜７のいずれかに対訳文が該当した場合、評価部１２は、対訳文が該当した判定条件の番号を示す評価結果を対訳データとともに出力部１３に出力し、出力部１３は、対訳文が該当した判定条件の番号を示す付加情報を作成する（ステップＳ１４）。

次に、出力部１３は、上記の判定条件１〜７いずれかの判定条件に該当した対訳文に、該当する判定条件番号１〜７を対訳文の付帯情報として付与し、対訳データと付加情報とを生成部２２に出力し（ステップＳ１５）、処理をステップＳ１６に移行する。

次に、生成部２２は、出力部１３から取得した対訳データに付加情報があるか否かを判断し（ステップＳ１６）、付加情報がない場合は、処理をステップＳ１７に移行し、付加情報がある場合は、処理をステップＳ１８に移行する。

付加情報がない場合、生成部２２は、対訳データを訓練用対訳コーパス記憶部２３に格納する（ステップＳ１７）。一方、付加情報がある場合、生成部２２は、対訳データを破棄し、訓練用対訳コーパス記憶部２３に格納しない（ステップＳ１８）。

最後に、学習部２４は、訓練用対訳コーパス記憶部２３に記憶された訓練用対訳コーパスを用いて翻訳モデルを生成して翻訳モデル記憶部２５に記憶させる（ステップＳ１９）。

上記の処理により、本実施の形態では、対訳コーパス記憶部２１から第１言語で記述された文と第２言語による翻訳文との組である対訳データを取得し、対訳データが判定条件１〜７のいずれに該当するかの判定結果に基づき、対訳データが誤訳可能性のある対訳データであるか否かを評価しているので、翻訳を行う際に翻訳誤りを誘発する可能性が高い対訳文を簡便に且つ適切に抽出することができる。

また、評価結果に基づき、誤訳可能性のない対訳データを訓練用対訳コーパスとして採用し、誤訳可能性のある対訳データを訓練用対訳コーパスとして採用しないことにより、訓練用対訳コーパスを生成しているので、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳文を含まない訓練用対訳コーパスを生成することができる。

さらに、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳データを含まない訓練用対訳コーパスを用いて翻訳モデルを学習しているので、この翻訳モデルを用いた翻訳結果における左右対義誤翻訳等の誤訳の発生を抑制することができる。

したがって、学習部２４は、左右誤翻訳誘発対訳文を含まない、訓練用対訳コーパス記憶部２３に格納された質の良い訓練用対訳コーパスを用いて機械学習することが可能となり、翻訳装置２０は、その結果生成される翻訳モデル記憶部２５の機械学習モデルを使用することで、左右対義誤翻訳の発生が抑制される。

この結果、翻訳装置２０における左右対義誤翻訳等の誤訳の発生を抑制することができるため、本実施の形態の翻訳処理装置１は、左右の誤訳等が致命的になる道案内用途や作業指示用途等の自動翻訳サービスを提供する上で有用である。

なお、本実施の形態では、生成部２２が左右誤訳誘発対訳文抽出削除部として機能し、判定条件１〜７のいずれかに該当する対訳データを抽出した場合、対訳データを削除して廃棄したが、この例に特に限定されず、生成部２２は、左右誤訳翻訳誘発文修正部としても機能し、判定条件１〜７のいずれかに該当する対訳データを修正し、修正した対訳データを訓練用対訳コーパス記憶部２３に格納するようにしてもよい。

この場合、生成部２２は、判定条件１〜７のいずれかに該当する対訳データ（左右誤翻訳誘発対訳文）を、付与された判定条件の番号１〜７に応じて、図４に示す左右誤翻訳誘発対訳文判定表Ｔ１に記載の該当する推奨対処方法に従い、修正可能な対訳データに修正を施す。このとき、修正後の対訳データが新たに別の判定条件１〜７に該当しないように修正を施す。

以下、上記の判定条件１〜７に該当する対訳文を事例に、具体的な修正方法について説明する。

例えば、判定条件１に該当する対訳文が「右に曲がると、左に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」である場合、生成部２２は、「右」及び「ｒｉｇｈｔ」のみ又は「左」及び「ｌｅｆｔ」のみの表現となる対訳文に修正する。すなわち、「右に曲がると、右に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｒｉｇｈｔ」あるいは「左に曲がると、左に建物があります／Ｔｕｒｎｌｅｆｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」のように修正する。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、例えば、判定条件２に該当する対訳文が「階段を正面に見て、右手に曲がります／Ｌｏｏｋｉｎｇａｔｔｈｅｓｔａｉｒｓｉｎｆｒｏｎｔｏｆｙｏｕ，ｔｕｒｎｔｏｔｈｅｌｅｆｔ」である場合、生成部２２は、対訳誤りを修正する。すなわち、「階段を正面に見て、右手に曲がります／Ｌｏｏｋｉｎｇａｔｔｈｅｓｔａｉｒｓｉｎｆｒｏｎｔｏｆｙｏｕ，ｔｕｒｎｔｏｔｈｅｒｉｇｈｔ」のように修正する。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、例えば、判定条件３に該当する対訳文が「左のほうに、道沿いに花が植えられています／Ｆｌｏｗｅｒｓａｒｅｐｌａｎｔｅｄａｌｏｎｇｔｈｅｓｔｒｅｅｔｔｏｔｈｅｒｉｇｈｔ」である場合、生成部２２は、対訳誤りを修正する。すなわち、「左のほうに、道沿いに花が植えられています／Ｆｌｏｗｅｒｓａｒｅｐｌａｎｔｅｄａｌｏｎｇｔｈｅｓｔｒｅｅｔｔｏｔｈｅｌｅｆｔ」のように修正する。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、例えば、判定条件４に該当する１つ目の対訳文が「右に曲がると、左に建物があります／Ｔｕｒｎｌｅｆｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」である場合、対訳誤りを修正すればよいが、英語文側を修正すると、判定条件１に該当する対訳文になってしまう。この場合、生成部２２は、日本語文側を修正して「左に曲がると、左に建物があります／Ｔｕｒｎｌｅｆｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」とする。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、判定条件４に該当する２つ目の対訳文が「右に回すと、徐々に明るくなります／Ｉｆｔｕｒｎｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｂｒｉｇｈｔｅｎｓ」である場合、生成部２２は、意訳的表現を修正し、「右に回すと、徐々に明るくなります／Ｉｆｔｕｒｎｔｏｔｈｅｒｉｇｈｔ，ｉｔｇｒａｄｕａｌｌｙｂｒｉｇｈｔｅｎｓ」あるいは、日本語文側を修正し、「時計回りに回すと、徐々に明るくなります／Ｉｆｔｕｒｎｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｂｒｉｇｈｔｅｎｓ」とする。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、例えば、判定条件５に該当する１つ目の対訳文が「左に曲がると、右に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｒｉｇｈｔ」である場合、対訳誤りを修正すればよいが、英語文側を修正すると、判定条件１に該当する対訳文になってしまう。この場合、生成部２２は、日本語文側を修正し「右に曲がると、右に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｒｉｇｈｔ」とする。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、判定条件５に該当する２つ目の対訳文が「左に回すと、徐々に暗くなります／Ｉｆｔｕｒｎｃｏｕｎｔｅｒｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｄａｒｋｅｎｓ」である場合、生成部２２は、意訳的表現を修正し、「左に回すと、徐々に暗くなります／Ｉｆｔｕｒｎｔｏｔｈｅｌｅｆｔ，ｉｔｇｒａｄｕａｌｌｙｄａｒｋｅｎｓ」あるいは、日本語文側を修正し、「反時計回りに回すと、徐々に暗くなります／Ｉｆｔｕｒｎｃｏｕｎｔｅｒｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｄａｒｋｅｎｓ」とする。これにより、「左」及び「右」を誤った対義での学習を防ぐことができる。

また、例えば、判定条件６に該当する１つ目の対訳文が「このあたりで曲がってください／Ｔｕｒｎｒｉｇｈｔａｒｏｕｎｄｈｅｒｅ」である場合、生成部２２は、対訳誤りを修正する。すなわち、英語文側から「ｒｉｇｈｔ」を削除し「このあたりで曲がってください／Ｔｕｒｎａｒｏｕｎｄｈｅｒｅ」とする。一方、判定条件６に該当する２つ目の対訳文が「すぐに準備します／Ｉｃａｎｐｒｅｐａｒｅｔｈｅｍｒｉｇｈｔａｗａｙ」である場合、対訳文としては正しいため、基本的には修正不要である。

また、例えば、判定条件７に該当する１つ目の対訳文が「このあたりで曲がってください／Ｔｕｒｎｌｅｆｔａｒｏｕｎｄｈｅｒｅ」である場合、生成部２２は、対訳誤りを修正する。すなわち、英語文側から「ｌｅｆｔ」を削除し、「このあたりで曲がってください／Ｔｕｒｎａｒｏｕｎｄｈｅｒｅ」とする。一方、判定条件７に該当する２つ目の対訳文が「部屋に鍵を置き忘れました／Ｉｌｅｆｔｍｙｋｅｙｉｎｔｈｅｒｏｏｍ」である場合、対訳文としては正しいため、基本的には修正不要である。

また、もし、これらの対訳文修正過程において、修正不可能な対訳文、もしくは修正の結果、他の修正対訳文と同一になる場合、この時点でその対訳文を破棄するようにしてもよい。

以上の例のように、左右誤翻訳誘発対訳文を修正して生成された修正対訳文（修正対訳データ）は、生成部２２から訓練用対訳コーパス記憶部２３に出力され、学習部２４に入力される訓練用対訳コーパスに追加される。また、生成部２２において、あらためて修正不要と判断された対訳文（修正不要文）については、修正されずに訓練用対訳コーパス記憶部２３に出力され、修正対訳文と同じく訓練用対訳コーパスに追加する。

上記のように、評価結果に基づき、誤訳可能性のない対訳データを訓練用対訳コーパスとして採用し、誤訳可能性のある対訳データを誤訳可能性がないように修正した修正対訳データを訓練用対訳コーパスとして採用することにより、訓練用対訳コーパスを生成しているので、翻訳を行う際に翻訳誤りを誘発する可能性がある対訳文を含まないデータ数の多い訓練用対訳コーパスを生成することができる。

（実施の形態２）
図５は、本開示の実施の形態２における翻訳処理装置の構成の一例を示すブロック図である。図５に示す翻訳処理装置１ａは、評価装置１０ａ及び翻訳装置２０ａを備える。評価装置１０ａは、取得部１１ａ、評価部１２ａ、及び出力部１３ａを備える。翻訳装置２０ａは、生成部２２ａ、入力部２６、翻訳部２７、及び表示部２８を備える。

図５に示す翻訳処理装置１ａは、第１言語で記述された入力文と、入力文の第２言語への翻訳文とを含む対訳データ（対訳文）を処理する。本実施の形態においても、引き続き第１言語として日本語を採用し、第２言語として英語を採用するが、これは一例である。

翻訳処理装置１ａは、第１言語で記述された入力文を第２言語の翻訳文に翻訳する翻訳装置２０ａから対訳データを取得し、評価装置１０ａにより翻訳結果が翻訳誤りを含む可能性を評価し、この評価結果に基づいて、翻訳結果が翻訳誤りを含む可能性に関する情報を使用者に提示する。評価装置１０ａは、翻訳装置２０ａの翻訳結果が翻訳誤りを含む可能性を評価する評価装置である。翻訳装置２０ａは、翻訳モデルを用いて翻訳を行い、評価装置１０ａの評価結果に基づき、アラート情報等を生成して表示する翻訳装置である。

翻訳処理装置１ａは、例えば、ＣＰＵ、ＲＯＭ、及びＲＡＭ及び補助記憶装置等を備える１台又は複数台のコンピュータで構成される。なお、翻訳処理装置１ａの翻訳装置２０ａは、評価装置１０ａと別体の翻訳装置として構成してもよく、例えば、スマートフォンやタブレット端末等の携帯情報端末で構成されてもよいし、据え置き型のコンピュータで構成されてもよい。或いは、翻訳装置２０ａは、クラウドサーバで構成されてもよい。この場合、入力文等を入力する入力部２６や翻訳文等を表示する表示部２８等は、ユーザが所持する携帯情報端末或いは据え置き型のコンピュータで構成され、これら以外の構成要素がクラウドサーバで構成されてもよい。

翻訳装置２０ａの入力部２６は、例えば、タッチパネル等の入力装置、又はキーボード及びマウス等の入力装置、あるいは音声による文章入力装置等により構成される。入力部２６は、使用者の操作により第１言語で記述された入力文を受け付け、入力文を翻訳部２７及び評価装置１０ａの取得部１１ａに出力する。

翻訳部２７は、入力文を翻訳して第２言語による翻訳文を評価装置１０ａの取得部１１ａに出力する。ここで、翻訳部２７は、例えば、実施の形態１で作成した翻訳モデルを用いて上記の翻訳を行うことができる。この場合、実施の形態１による左右対義誤翻訳の発生自体の抑制に加えて、さらに翻訳結果における左右対義誤翻訳存在可能性の注意喚起が得られるため、より好ましい形態となる。なお、翻訳部２７は、例えば、ＣＰＵ等を備えるコンピュータを翻訳装置として機能させるプログラムを実行することで実現されてもよいし、専用のハードウェア回路により実現されてもよい。

評価装置１０ａの取得部１１ａは、対訳データとして、入力文及び翻訳文を翻訳装置２０ａから取得して評価部１２ａに出力する。評価部１２ａは、対訳データの入力文及び翻訳文に含まれる語句に基づき、対訳データが誤訳可能性のある対訳データであるか否かを評価し、評価結果を対訳データとともに出力部１３ａに出力する。出力部１３ａは、評価結果に基づく情報として、対訳データごとに誤訳可能性の評価結果を翻訳装置２０ａの生成部２２ａに出力する。

なお、取得部１１ａが取得する対訳データは、実施の形態１の翻訳モデルを用いて作成した対訳データに特に限定されず、入力文を伴う翻訳結果を出力する翻訳装置であれば、任意の翻訳装置の対訳データを使用可能である。この場合、任意の翻訳装置のポストプロセスとして、評価装置１０ａを配置することで、任意の対訳コーパスでの機械学習モデル生成の不可能な、既成の翻訳装置しか利用できない状況下においても、翻訳結果における左右対義誤翻訳の存在可能性を注意喚起し、翻訳装置の使用者が正しい翻訳内容へ至ることができる。

具体的には、評価部１２ａは、後述する判定条件１として、入力文に、第１の意味を有する単語及びその対義語が存在し、且つ、翻訳文に、第１の意味を有する単語及びその対義語が存在するか否かを判定する。

また、評価部１２ａは、後述する判定条件２、３として、入力文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し且つ他方の第２の単語が存在せず、且つ、翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在せず且つ第２の単語の翻訳である第２の翻訳単語が存在するか否かを判定する。

また、評価部１２ａは、後述する判定条件４、５として、入力文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し、且つ、翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在しないか否かを判定する。

なお、評価部１２ａの判定は、上記の例に特に限定されず、入力文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否か、及び、翻訳文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かを判定したり、判定条件１〜５の一部を任意に組み合わせたり、他の判定条件を用いたりする等の種々の変更が可能である。また、実施の形態１の判定条件６、７と同様に、入力文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在せず、且つ、翻訳文に、第１の単語の翻訳である第１の翻訳単語が存在するか否かを判定するようにしてもよい。

翻訳装置２０ａの生成部２２ａは、評価部１２ａの評価の結果に基づき、翻訳結果に含まれる左右誤訳可能性等の誤訳可能性を判定し、判定結果に応じたアラート情報を生成して表示部２８に出力する。具体的には、生成部２２ａは、誤訳可能性として第１の可能性を示す第１アラート情報と、誤訳可能性として第１の可能性より高い第２の可能性を示す第２アラート情報とを、アラート情報として生成する。また、生成部２２ａは、アラート情報に付加して、参考翻訳例を生成する。ここで、本実施の形態では、誤訳可能性は、翻訳結果が翻訳誤りを含む可能性を意味する。

表示部２８は、例えば、表示装置等から構成され、生成部２２ａにより生成された情報、例えば、アラート情報及び参考翻訳例を表示して使用者に誤訳の可能性を警告する。なお、表示部２８の構成は、上記の例に特に限定されず、スピーカ等の他の出力機器で構成されてもよい。

次に、上記のように構成された翻訳処理装置１ａの翻訳評価処理について説明する。図６は、図５に示す翻訳処理装置１ａによる翻訳評価処理の一例を示すフローチャートである。なお、以下の説明では、より具体的な説明のため、第１言語として日本語を採用し、第２言語として英語を採用するが、これは一例であり、他の言語間においても同様な概念で誤訳可能性を評価することにより、アラート情報及び参考翻訳例を表示して使用者に誤訳の可能性を警告することができる。また、下記の評価装置１０ａの処理は、翻訳装置２０ａと同じコンピュータ等の構成上で実行されてもよいし、部分的に他のコンピュータ等の構成上で実行されてもよい。また、その一部のステップは、人手作業によって実施されてもよい。

まず、取得部１１ａは、対訳データとして、入力文及び翻訳文を翻訳装置２０ａから取得して評価部１２ａに出力する（ステップＳ１１ａ）。

次に、評価部１２ａは、対訳データの入力文及び翻訳文に含まれる語句に基づき対訳文の誤訳可能性を評価する誤訳可能性評価処理を実行し（ステップＳ１２ａ）、誤訳可能性がない場合は、ステップＳ１３ａに処理を移行し、誤訳可能性がある場合は、ステップＳ１４ａに処理を移行する。

図７は、図６に示す誤訳可能性評価処理（ステップＳ１２ａ）の一例を示すフローチャートである。なお、図６に示す誤訳可能性評価処理に用いられる判定条件１〜５は、推奨対処方法を除き、図４に示す左右誤翻訳誘発対訳文判定表Ｔ１の判定条件１〜５と同様であるので、図４に示す判定条件１〜５を適宜用いて説明する。

図７に示すように、評価部１２ａは、図６に示す誤訳可能性評価処理（ステップＳ１２ａ）として、例えば、左右誤翻訳誘発対訳文該非判定処理（ステップＳ２１ａ〜２５ａ）を実行する。この左右誤翻訳誘発対訳文該非判定処理は、５段階の判定ステップを経て、判定条件１〜５の各条件に応じて、段階的に左右誤翻訳誘発対訳文を抽出する処理であり、判定結果に応じたアラート情報が生成される。

ここで、判定条件１〜５における日本語文と英語文の該当条件は、既出の図４に示す左右誤翻訳誘発対訳文判定表Ｔ１に記載の判定条件１〜５と同一である。なお、本実施の形態では、評価部１２ａの判定処理に図４に示す判定条件６〜７を用いていないが、これらの条件も加えて構成してもよい。

まず、評価部１２ａは、対訳データが判定条件１に該当するか否かを判定し（ステップＳ２１ａ）、対訳データが判定条件１に該当する場合は、図６に示すステップＳ１４ａに処理を移行し、対訳データが判定条件１に該当しない場合は、ステップＳ２２ａに処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件１は、日本語文中に「右」及び「左」を含み、且つ英語文中に「ｒｉｇｈｔ」及び「ｌｅｆｔ」を含むことである。判定条件１に該当する場合の判定結果は、「左右入れ替わり誘発」となる。例えば、「右に曲がると、左に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」という対訳文が判定条件１に該当する。

対訳データが判定条件１に該当しない場合、評価部１２ａは、対訳データが判定条件２に該当するか否かを判定し（ステップＳ２２ａ）、対訳データが判定条件２に該当する場合は、図６に示すステップＳ１４ａに処理を移行し、対訳データが判定条件２に該当しない場合は、ステップＳ２３ａに処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件２は、対訳データの日本語文中に「右」を含んで「左」を含まず、且つ英語文中に「ｒｉｇｈｔ」を含まず「ｌｅｆｔ」を含むことである。判定条件２に該当する場合の判定結果は、「対訳ミス」となる。例えば、「階段を正面に見て、右手に曲がります／Ｌｏｏｋｉｎｇａｔｔｈｅｓｔａｉｒｓｉｎｆｒｏｎｔｏｆｙｏｕ，ｔｕｒｎｔｏｔｈｅｌｅｆｔ」という明らかに対訳誤りである対訳文が判定条件２に該当する。

対訳データが判定条件２に該当しない場合、評価部１２ａは、対訳データが判定条件３に該当するか否かを判定し（ステップＳ２３ａ）、対訳データが判定条件３に該当する場合は、図６に示すステップＳ１４ａに処理を移行し、対訳データが判定条件３に該当しない場合は、ステップＳ２４ａに処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件３は、対訳データの日本語文中に「右」を含まず「左」を含み、且つ英語文中に「ｒｉｇｈｔ」を含んで「ｌｅｆｔ」を含まないことである。判定条件３に該当する場合の判定結果は、「対訳ミス」となる。例えば「左のほうに、道沿いに花が植えられています／Ｆｌｏｗｅｒｓａｒｅｐｌａｎｔｅｄａｌｏｎｇｔｈｅｓｔｒｅｅｔｔｏｔｈｅｒｉｇｈｔ」という明らかに対訳誤りである対訳文が判定条件３に該当する。

対訳データが判定条件３に該当しない場合、評価部１２ａは、対訳データが判定条件４に該当するか否かを判定し（ステップＳ２４ａ）、対訳データが判定条件４に該当する場合は、図６に示すステップＳ１４ａに処理を移行し、対訳データが判定条件４に該当しない場合は、ステップＳ２５ａに処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件４は、対訳データの日本語文中に「右」を含み、且つ英語文中に「ｒｉｇｈｔ」を含まないことであり、このとき、日本語文中の「左」及び英語文中の「ｌｅｆｔ」の有無については判定しない。判定条件４に該当する場合の判定結果は、「意訳」、「慣用句」、又は「対訳ミス」となる。例えば、「右に曲がると、左に建物があります／Ｔｕｒｎｌｅｆｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｌｅｆｔ」という明らかに対訳誤りである対訳文が判定条件４に該当する。また、「右に回すと、徐々に明るくなります／Ｉｆｔｕｒｎｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｂｒｉｇｈｔｅｎｓ」という対訳文も判定条件４に該当する。後者は、対訳としては正しいが、意訳的な表現である。

対訳データが判定条件４に該当しない場合、評価部１２ａは、対訳データが判定条件５に該当するか否かを判定し（ステップＳ２５ａ）、対訳データが判定条件５に該当する場合は、図６に示すステップＳ１４ａに処理を移行し、対訳データが判定条件５に該当しない場合は、図６に示すステップＳ１３ａに処理を移行する。

図４の左右誤翻訳誘発対訳文判定表Ｔ１に示すように、判定条件５は、対訳データの日本語文中に「左」を含み、且つ英語文中に「ｌｅｆｔ」を含まないことであり、このとき、日本語文中の「右」及び英語文中の「ｒｉｇｈｔ」の有無については判定しない。判定条件５に該当する場合の判定結果は、「意訳」、「慣用句」、又は「対訳ミス」となる。例えば、「左に曲がると、右に建物があります／Ｔｕｒｎｒｉｇｈｔ，ａｎｄｔｈｅｒｅｗｉｌｌｂｅａｂｕｉｌｄｉｎｇｏｎｔｈｅｒｉｇｈｔ」という明らかに対訳誤りである対訳文が判定条件５に該当する。また、「左に回すと、徐々に暗くなります／Ｉｆｔｕｒｎｃｏｕｎｔｅｒｃｌｏｃｋｗｉｓｅ，ｉｔｇｒａｄｕａｌｌｙｄａｒｋｅｎｓ」という対訳文も判定条件５に該当する。後者は、対訳としては正しいが、意訳的な表現である。

再び、図６を参照して、誤訳可能性がない場合、すなわち、上記の判定条件１〜５のいずれにも対訳文が該当しない場合、評価部１２ａは、対訳文が判定条件１〜５のいずれにも該当しないことを示す評価結果を対訳データとともに出力部１３ａに出力し、出力部１３ａは、対訳データを生成部２２ａに出力し（ステップＳ１３ａ）、処理をステップＳ１６ａに移行する。

一方、誤訳可能性がある場合、すなわち、上記の判定条件１〜５のいずれかに対訳文が該当した場合、評価部１２ａは、対訳文が該当した判定条件の番号を示す評価結果を対訳データとともに出力部１３ａに出力し、出力部１３ａは、対訳文が該当した判定条件の番号を示す付加情報を作成する（ステップＳ１４ａ）。

次に、出力部１３ａは、上記の判定条件１〜５いずれかの判定条件に該当した対訳文に、該当する判定条件番号１〜５を対訳文の付帯情報として付与し、対訳データと付加情報とを生成部２２ａに出力し（ステップＳ１５ａ）、処理をステップＳ１６ａに移行する。

次に、生成部２２ａは、出力部１３ａから取得した対訳データに付加情報があるか否かを判断し（ステップＳ１６ａ）、付加情報がない場合は、処理をステップＳ３１に移行し、付加情報がある場合は、処理をステップＳ３２に移行する。

付加情報がない場合、生成部２２ａは、対訳データから入力文と翻訳文とを含む画像情報を作成して表示部２８に出力し、表示部２８は、入力文と翻訳結果（翻訳文）とを含む画面を表示し（ステップＳ３１）、処理を終了する。

一方、付加情報がある場合、すなわち、日本語の入力文と英語の翻訳文とが判定条件１〜５に該当する場合、生成部２２ａは、付加情報の内容に応じたアラート情報を生成する（ステップＳ３２）。

具体的には、日本語の入力文と英語の翻訳文とが判定条件１に該当する場合、生成部２２ａは、誤訳可能性として、危険レベルを「１」と判定し、「左及び右を同時に含む入力文では、まれに左右が入れ替わった翻訳結果になる場合がある」こと、及び「左及び右を同時に含まない入力文での翻訳を推奨する」こと等を使用者に通知するアラート情報を生成する。

また、日本語の入力文と英語の翻訳文とが判定条件２〜５に該当する場合、生成部２２ａは、誤訳可能性として、危険レベルをより可能性が高い「２」と判定し、「翻訳結果中の左及び右の意味が逆転している可能性がある」こと等を使用者に通知するアラート情報を生成する。

なお、生成部２２ａが生成するアラート情報は、上記の例に特に限定されず、例えば、日本語の入力文と英語の翻訳文とが判定条件６、７に該当する場合、生成部２２ａは、上記の危険レベル「２」より低い危険レベルと判定し、「誤訳の可能性は非常に低いですが、注意して下さい」等のアラート情報を生成するようにしてもよい。この場合、判定条件２〜５に該当する場合の危険レベルを「３」に変更し、判定条件６、７に該当する場合の危険レベルを「２」で表示してもよく、また、後述する参考翻訳例を表示しないようにしてもよい。

次に、生成部２２ａは、アラート情報を補足するために、参考翻訳例として、参考翻訳文を作成して表示部２８に出力し、表示部２８は、入力文と翻訳結果（翻訳文）とアラート情報（参考翻訳文を含む）とを含む画面を表示し（ステップＳ３３）、処理を終了する。なお、参考翻訳文の作成及び表示処理は、必要に応じて省略してもよい。

上記の参考翻訳文の作成処理としては、種々の方法を用いることができ、例えば、生成部２２ａは、日本語の入力文と類似の別の文章とを参考例文として準備し、参考例文を翻訳部２７で翻訳した機械翻訳結果である参考翻訳文とともに表示部２８に出力する。生成部２２ａは、このような参考例文と参考翻訳文とのペアをいくつか生成し、上記のアラート情報に付加する。左右誤翻訳は、入力文の言い回しを換えると、正しく翻訳される場合もあるため、複数の類似文の翻訳結果を並べて提示することは、使用者が翻訳結果を総合的に判断して、正しい意味の翻訳結果に至るのに役立つ。

また、生成部２２ａは、参考例文を、例えば、日本語の入力文の換言文として作成するようにしてもよい。具体的には、生成部２２ａは、日本語の入力文を複数の素片に分割し、複数の素片のうちの１又は複数を所定の換言ルールを用いて第１言語の他の表現に換言する（置き換える）ことによって、複数の入力換言文を生成する。

ここで、入力文を複数の素片に分割する手法としては、例えば、入力文を単語ごとに区切る手法が採用される。また、換言ルールとしては、例えば、ＡＬＡＧＩＮ言語資源の文脈類似語データベース、単語共起頻度データベース、含意関係データベース、上位語階層データベースなどに登録された単語同士の関係を用いることができる。

例えば、入力文を構成する素片に含まれる第１単語を、文脈類似関係にある第２単語で換言したり、入力文を構成する素片に含まれる第１単語を、共起関係にある第２単語に換言したり、入力文を構成する素片に含まれる第１単語を、含意関係にある第２単語に換言したり、入力文を構成する素片に含まれる第１単語を、上位下位関係にある第２単語に換言したりしてもよい。なお、入力文の分割方法や換言ルールは、上記の例に特に限定されず、他の手法やルールが採用されてもよい。

図８は、図５に示す翻訳処理装置１ａの表示部２８に表示されるアラート情報画面の一例を示す図である。図８に示す表示部２８のアラート情報画面Ｄ１の翻訳結果表示内容Ｄ２は、上記の翻訳評価処理により、判定条件２に該当して表示される基本内容であり、翻訳結果表示内容Ｄ２に加えて、参考翻訳結果表示内容Ｄ３も併せて表示される。

翻訳結果表示内容Ｄ２には、入力文として、「右手にある置物を過ぎると、入り口がございます」、翻訳結果として、「Ｐａｓｓｔｈｅｏｒｎａｍｅｎｔｏｎｔｈｅｌｅｆｔｈａｎｄｓｉｄｅｔｈｅｒｅｉｓｔｈｅｅｎｔｒａｎｃｅ」が、アラート情報として、「危険レベル：２［誤訳可能性あり］」、「翻訳結果中の左・右の意味が逆転している可能性があります。」及び「参考翻訳例も参照のうえご注意ください。」がそれぞれ表示されている。また、ハイライト表示している「ｌｅｆｔ」は、翻訳結果における誤訳可能性箇所である。なお、翻訳結果表示内容Ｄ２において、入力文及び翻訳結果における「左」及び「右」を意味する部位は、太字、アンダーライン、文字色変更、又は、それらの複合適用などでハイライト表示してもよい。

また、参考翻訳結果表示内容Ｄ３には、参考例文１として、「右にある置物の前を通っていくと、入り口がございます」が、参考翻訳文１として、「Ｉｆｙｏｕ’ｒｅｐａｓｓｔｈｒｏｕｇｈｔｈｅｏｒｎａｍｅｎｔｏｎｔｈｅｒｉｇｈｔｓｉｄｅｔｈｅｒｅｉｓｔｈｅｅｎｔｒａｎｃｅ．」が、参考例文２として、「右の置物を通り過ぎます。入り口がございます。」、参考翻訳文２として、「Ｐａｓｓｔｈｅｏｒｎａｍｅｎｔｏｎｔｈｅｒｉｇｈｔ．Ｔｈｅｒｅｉｓｔｈｅｅｎｔｒａｎｃｅ．」がそれぞれ表示されている。なお、参考翻訳結果表示内容Ｄ３において、参考例文及び参考翻訳文における「左」及び「右」を意味する部位は、太字、アンダーライン、文字色変更、又は、それらの複合適用などでハイライト表示してもよい。

上記の処理により、本実施の形態では、翻訳装置２０ａから第１言語で記述された入力文と第２言語による翻訳文との組である対訳データを取得し、対訳データが判定条件１〜５のいずれに該当するかの判定結果に基づき、対訳データが誤訳可能性のある対訳データであるか否かを評価し、この評価結果に基づき、アラート情報を生成して表示しているので、使用者は翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを総合的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを回避することができる。

また、誤訳可能性として第１の可能性を示す第１アラート情報（危険レベル１）と、誤訳可能性として第１の可能性より高い第２の可能性を示す第２アラート情報（危険レベル２）とを、アラート情報として生成しているので、翻訳部２７の翻訳結果の左右誤翻訳可能性等の誤訳可能性を段階的に表示することができる。したがって、使用者は翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを段階的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを確実に回避することができる。

さらに、評価結果に基づき、アラート情報に付加して、参考翻訳例を生成して表示しているので、アラート情報及び参考翻訳例により、使用者は翻訳部２７の翻訳結果が左右誤翻訳等の翻訳誤りを含むか否かを総合的に判断することができ、使用者が安易に左右誤翻訳等の誤訳を受け入れることを確実に回避することができる。

この結果、翻訳装置２０ａの翻訳結果に左右対義誤翻訳等が含まれる可能性がある場合に、その事実を注意喚起することができるため、本実施の形態の翻訳処理装置１ａは、左右の誤訳等が致命的になる道案内用途や作業指示用途等の自動翻訳サービスを提供する上で有用である。

なお、上記の各実施の形態では、対義語として、「右」及び「左」を用いた場合を例にしているが、この例に特に限定されず、「上」及び「下」等の他の対義語に対しても、上記と同様の効果を得ることができる。

本開示は、対義語を含む対訳文による誤訳可能性を簡便に且つ適切に評価することができるので、第１言語で記述された入力文と入力文の第２言語への翻訳文とを含む対訳データ（対訳文）を処理する処理方法、処理装置、及び処理プログラムに有用である。

１、１ａ翻訳処理装置
１０、１０ａ評価装置
２０、２０ａ翻訳装置
１１、１１ａ取得部
１２、１２ａ評価部
１３、１３ａ出力部
２１対訳コーパス記憶部
２２、２２ａ生成部
２３訓練用対訳コーパス記憶部
２４学習部
２５翻訳モデル記憶部
２６入力部
２７翻訳部
２８表示部

Claims

第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置における処理方法であって、
前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、
前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、
前記評価の結果に基づく情報を出力し、
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき行われる、
処理方法。
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語が存在することの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語が存在することの第２判定、の結果に基づき行われる、
請求項１に記載の処理方法。
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在し且つ他方の第２の単語が存在しないことの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在せず且つ前記第２の単語の翻訳である第２の翻訳単語が存在することの第２判定、の結果に基づき行われる、
請求項１に記載の処理方法。
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在することの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在しないことの第２判定、の結果に基づき行われる、
請求項１に記載の処理方法。
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語のうち一方の第１の単語が存在しないことの第１判定、及び、（２）前記第１翻訳文に、前記第１の単語の翻訳である第１の翻訳単語が存在することの第２判定、の結果に基づき行われる、
請求項１に記載の処理方法。
前記取得は、
前記第１対訳データを対訳コーパス記憶部から取得し、前記対訳コーパス記憶部は、前記第１言語で記述された文と、前記第１言語で記述された文の前記第２言語による翻訳文との対を複数含む対訳コーパスを記憶する、
請求項１に記載の処理方法。
前記出力は、
前記評価の結果に基づき、訓練用対訳コーパスを生成する、
請求項６に記載の処理方法。
前記出力は、
前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記訓練用対訳コーパスとして採用しないことにより、前記訓練用対訳コーパスを生成する、
請求項７に記載の処理方法。
前記出力は、
前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記誤訳可能性がないように修正した修正対訳データを前記訓練用対訳コーパスとして採用することにより、前記訓練用対訳コーパスを生成する、
請求項７に記載の処理方法。
前記訓練用対訳コーパスを用いて翻訳モデルを学習する、
請求項７に記載の処理方法。
前記取得は
前記第１文を前記第１翻訳文に翻訳する翻訳装置から前記第１対訳データを取得する、
請求項１に記載の処理方法。
前記出力は、
前記評価の結果に基づき、アラート情報を生成して表示する、
請求項１１に記載の処理方法。
前記出力は、
前記評価の結果に基づき、前記アラート情報として、前記誤訳可能性として第１の可能性を示す第１アラート情報と、前記誤訳可能性として前記第１の可能性より高い第２の可能性を示す第２アラート情報とを生成する、
請求項１２に記載の処理方法。
前記出力は、
前記評価の結果に基づき、前記アラート情報に付加して、参考翻訳例を生成して表示する、
請求項１２に記載の処理方法。
前記第１文又は前記第１翻訳文に含まれる語句は、「右」又「左」である、
請求項１に記載の処理方法。
第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置であって、
前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得する取得部と、
前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価する評価部と、
前記評価の結果に基づく情報を出力する出力部とを備え、
前記評価部は、（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価する、
処理装置。
第１言語で記述された入力文と前記入力文の第２言語への翻訳文とを含む対訳データを処理する処理装置として、コンピュータを機能させるための処理プログラムであって、
前記コンピュータに、
前記第１言語で記述された第１文と、前記第２言語による前記第１文の翻訳文である第１翻訳文との組である第１対訳データを取得し、
前記第１文及び前記第１翻訳文に含まれる語句に基づき、前記第１対訳データが誤訳可能性のある対訳データであるか否かを評価し、
前記評価の結果に基づく情報を出力する、
処理を実行させ、
前記評価は、
（１）前記第１文に、第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第１判定、及び、（２）前記第１翻訳文に、前記第１の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第２判定、の結果に基づき行われる、
処理プログラム。