JP2017162349A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2017162349A
JP2017162349A JP2016048186A JP2016048186A JP2017162349A JP 2017162349 A JP2017162349 A JP 2017162349A JP 2016048186 A JP2016048186 A JP 2016048186A JP 2016048186 A JP2016048186 A JP 2016048186A JP 2017162349 A JP2017162349 A JP 2017162349A
Authority
JP
Japan
Prior art keywords
translation
dictionary
editable
word
edited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016048186A
Other languages
English (en)
Other versions
JP6766384B2 (ja
Inventor
信嗣 島村
Nobutsugu Shimamura
信嗣 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2016048186A priority Critical patent/JP6766384B2/ja
Priority to US15/219,868 priority patent/US20170262427A1/en
Publication of JP2017162349A publication Critical patent/JP2017162349A/ja
Application granted granted Critical
Publication of JP6766384B2 publication Critical patent/JP6766384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation

Abstract

【課題】ユーザーによる原稿の翻訳結果に対する修正内容に基づいて、原稿の翻訳に適合した翻訳辞書又は翻訳辞書の選択変更を提案する。
【解決手段】原文に含まれる原単語と、翻訳文に含まれる当該原単語の翻訳結果とを対訳設定候補として抽出する対訳設定候補抽出部12と、原単語に対して誤訳された原因となる翻訳辞書を特定する対訳辞書対応付け部15と、原単語と当該原単語の誤訳の単語との組の対訳が専門辞書又はユーザー辞書に含まれているかによって、翻訳に利用すべき専門辞書又はユーザー辞書に含まれている対訳の選択変更を提案する提案部16と、を有する。
【選択図】図1

Description

本発明は、情報処理装置及びプログラムに関する。
近年では、コンピュータを利用して原稿を他の言語に翻訳する機械翻訳が広く使用されている。機械翻訳の品質向上のためには、品質のよい辞書、すなわち適切な単語の対訳が辞書に登録されている必要がある。また、ある専門分野の原稿を翻訳するには、その専門分野の専門辞書を選択し利用するのが望ましい。さらに、機械翻訳の結果に適切でない翻訳が含まれていた場合、その翻訳を修正する作業が生じてくる。
従来では、辞書の品質向上のために、ユーザーが実施した翻訳文の修正結果を辞書へ登録することで、それ以降の翻訳には、その修正結果を適用できるようにする技術が提案されている(例えば、特許文献1)。
特開2009−245431号公報 特開平07−006175号公報 特開平07−141375号公報
本発明は、ユーザーによる原稿の翻訳結果に対する修正内容に基づいて、原稿の翻訳に適合した翻訳辞書又は翻訳辞書の選択変更を提案することを目的とする。
本発明に係る情報処理装置は、ユーザーによる編集が可能な編集可翻訳辞書とユーザーによる編集が不可能であり特定の分野に特化した編集不可翻訳辞書を利用して翻訳を行う翻訳エンジンによる翻訳結果に対する編集内容を受け付ける編集受付手段と、翻訳エンジンにより利用された編集不可翻訳辞書と編集可翻訳辞書と、前記編集受付手段が受け付けた編集内容と、に基づいて、前記編集不可翻訳辞書又は前記編集可翻訳辞書における対訳の変更または前記編集不可翻訳辞書又は前記編集可翻訳辞書の選択変更を提案する提案手段と、を有することを特徴とする。
また、編集対象となった原文における単語に対する編集内容を抽出する抽出手段を有することを特徴とする。
また、前記提案手段は、編集対象となった原文に含まれる単語と当該単語に対する翻訳結果とがいずれかの前記編集不可翻訳辞書に登録されている場合、当該編集不可翻訳辞書を前記翻訳エンジンに利用させないことを提案することを特徴とする。
また、前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが翻訳エンジンにより利用されたいずれの翻訳辞書にも登録されていない場合、前記抽出手段により抽出された対訳が登録されている前記編集不可翻訳辞書の利用を提案することを特徴とする。
また、前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが前記編集可翻訳辞書に登録されている場合、前記編集可翻訳辞書に登録されている当該対訳を、前記抽出手段により抽出された編集内容に変更することを提案する。
また、前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが翻訳エンジンにより利用されたいずれの翻訳辞書にも登録されていない場合であって前記抽出手段により抽出された編集内容が登録されている前記編集不可翻訳辞書が存在しない場合、当該編集内容の前記編集可翻訳辞書への登録を提案することを特徴とする。
本発明に係るプログラムは、コンピュータを、ユーザーによる編集が可能な編集可翻訳辞書とユーザーによる編集が不可能であり特定の分野に特化した編集不可翻訳辞書を利用して翻訳を行う翻訳エンジンによる翻訳結果に対する編集内容を受け付ける編集受付手段、翻訳エンジンにより利用された編集不可翻訳辞書と編集可翻訳辞書と、前記編集受付手段が受け付けた編集内容と、に基づいて、前記編集不可翻訳辞書又は前記編集可翻訳辞書における対訳の変更または前記編集不可翻訳辞書又は前記編集可翻訳辞書の選択変更を提案する提案手段、として機能させる。
請求項1に記載の発明によれば、ユーザーによる原稿の翻訳結果に対する修正内容に基づいて、原稿の翻訳に適合した翻訳辞書又は翻訳辞書の選択変更を提案することができる。
請求項2に記載の発明によれば、翻訳の際に利用する翻訳辞書に含まれるべき対訳を抽出することができる。
請求項3に記載の発明によれば、編集対象となった原文に含まれる単語と当該単語に対する翻訳結果との組の対訳が含まれている編集不可翻訳辞書を翻訳エンジンに利用させないことを提案することができる。
請求項4に記載の発明によれば、編集対象となった原文における単語と当該単語に対する翻訳結果との組の対訳が翻訳結果を得たときに翻訳エンジンにより利用されたいずれの翻訳辞書にも含まれていない場合、原文における単語と当該単語に対する編集内容との組の対訳が登録されている編集不可翻訳辞書の利用を提案することができる。
請求項5に記載の発明によれば、編集対象となった原文における単語と当該単語に対する翻訳結果との組の対訳が編集可翻訳辞書に含まれている場合、原文における単語と当該単語に対する編集内容との組の対訳に基づく編集可翻訳辞書への選択変更を提案することができる。
請求項6に記載の発明によれば、編集対象となった原文における単語と当該単語に対する翻訳結果との組の対訳が翻訳結果を得たときに翻訳エンジンにより利用されたいずれの翻訳辞書にも含まれていない場合であって原文における単語と当該単語に対する編集内容との組の対訳が登録されている編集不可翻訳辞書が存在しない場合、当該対訳の編集可翻訳辞書への登録を提案することができる。
請求項7に記載の発明によれば、ユーザーによる原稿の翻訳結果に対する修正内容に基づいて、原稿の翻訳に適合した翻訳辞書又は翻訳辞書の選択変更を提案することができる。
本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。 本実施の形態における情報処理装置を形成するコンピュータのハードウェア構成図である。 本実施の形態における提案処理を示したフローチャートである。 本実施の形態における単語翻訳結果のデータ構成例を示した図である。 本実施の形態において編集内容と単語翻訳結果から作成される対訳設定候補のデータ構成例を示した図である。 本実施の形態における辞書n差分情報、単語翻訳結果及びこれらの情報から作成される対訳辞書対応情報のデータ構成例を示した図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1は、本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。また、図2は、本実施の形態における情報処理装置10を形成するコンピュータのハードウェア構成図である。本実施の形態において情報処理装置10を形成するコンピュータは、パーソナルコンピュータ(PC)などの従前から存在する汎用的なハードウェア構成で実現できる。すなわち、コンピュータは、図2に示したようにCPU31、ROM32、RAM33、ハードディスクドライブ(HDD)34、入力手段として設けられたマウス35とキーボード36、及び表示装置として設けられたディスプレイ37をそれぞれ接続する入出力コントローラ38、通信手段として設けられたネットワークコントローラ39を内部バス40に接続して構成される。
図1に戻り、本実施の形態における情報処理装置10は、翻訳実行部1、編集処理部2、翻訳辞書データベース(DB)3、原文記憶部4及び翻訳文記憶部5を有している。翻訳辞書データベース3には、翻訳辞書が格納される。翻訳実行部1は、翻訳エンジンにより実現され、翻訳辞書データベース3に登録されている翻訳辞書を利用して翻訳、いわゆる機械翻訳を実行する。原文記憶部4には、その翻訳の対象となる原文(原稿)が保存される。翻訳文記憶部5には、翻訳エンジンによる翻訳結果、すなわち翻訳により作成された翻訳文が保存される。本実施の形態では、日本語で作成された原稿(原文)を英語に翻訳する場合を例にして説明するが、原文及び翻訳文それぞれの原語はこの例に限定されない。編集処理部2は、文書作成ソフトウェアにより実現され、ユーザーによる入力に従い翻訳文に対する編集処理を実行する。
ところで、翻訳エンジンは、翻訳の際、一般に基本辞書、ユーザー辞書及び専門辞書という3種類の翻訳辞書を利用する。基本辞書は、翻訳エンジンが予め用意している辞書である。ユーザー辞書は、ユーザーによる編集が可能な編集可翻訳辞書であり、所望の対訳を設定登録できる。もちろん、削除も可能である。なお、本実施の形態において「対訳」というのは、異なる2言語の単語が対応付けされて作成された組のことをいう。一方の単語が他方の単語の訳語となる。専門辞書は、ある特定の専門の分野に特化した訳語の組が登録されている辞書であり、ユーザーが登録内容を編集できない編集不可翻訳辞書である。また、各専門辞書にどのような対訳が登録されているのかは公開されていない。翻訳エンジンは、基本辞書及びユーザー辞書に加えて、利用すると事前に選択された専門辞書を利用して翻訳を実行する。従って、選択する専門辞書の種類によって翻訳結果が異なる場合がある。
本実施の形態における情報処理装置10は、ユーザーが期待する翻訳結果を得ることができるように、翻訳エンジンが翻訳に利用すべき専門辞書又はユーザー辞書への対訳の選択変更を提案することを特徴としている。上記説明した構成要素1〜5は、既存の構成要素であるのに対し、上記特徴を実現するために、本実施の形態では、情報処理装置10に以下に説明する構成要素を設けた。
すなわち、本実施の形態における情報処理装置10は、更に編集受付部11、対訳設定候補抽出部12、翻訳試行部13、差分抽出部14、対訳辞書対応付け部15、提案部16、対訳設定候補記憶部21、辞書無翻訳結果記憶部22、辞書無差分情報記憶部23及び対訳辞書対応情報記憶部24を有している。なお、本実施の形態の説明に用いない構成要素は、図1から省略している。
編集受付部11は、編集処理部2による翻訳文への編集内容を受け付ける編集受付手段である。対訳設定候補抽出部12は、所望する翻訳文が得られるために利用したい対訳を対訳設定候補として抽出する。その対訳は、編集対象となった原文における単語と、編集受付部11が受け付けた当該単語に対する編集内容(編集後単語)との組により形成される。翻訳試行部13は、翻訳エンジンにより実現され、提供する処理機能は翻訳実行部1と同じである。翻訳実行部1が翻訳文を作成したときに利用された基本辞書を除く翻訳辞書を「利用翻訳辞書」と称することにすると、翻訳試行部13は、利用翻訳辞書の中から翻訳辞書を1つ利用しないで翻訳を実行する点が翻訳実行部1と異なる。翻訳試行部13は、翻訳辞書を1つ利用しないで翻訳をしたときの翻訳結果を辞書無翻訳結果記憶部22に保存する。差分抽出部14は、全ての利用翻訳辞書が利用された翻訳実行部1による翻訳結果(翻訳文)と翻訳試行部13により得られた翻訳結果(翻訳文)それぞれとの差分を抽出することで差分情報を生成して辞書無差分情報記憶部23に保存する。対訳辞書対応付け部15は、差分抽出部14により抽出された差分に対応する原文に含まれる単語(以下、「原単語」とも称する)と、当該単語の翻訳結果との組の対訳と、当該対訳を形成した原因となる翻訳辞書とを対応付けることで対訳辞書対応情報を生成して対訳辞書対応情報記憶部24に登録する。提案部16は、翻訳結果を得たときに翻訳実行部1により利用された専門辞書及びユーザー辞書と、編集受付部11が受け付けた編集内容と、に基づいて、翻訳実行部1による翻訳に利用すべき専門辞書又はユーザー辞書への対訳の選択変更を提案する。
なお、各記憶部21〜24に登録される各情報は提案処理の過程において作成されるため、処理の説明と合わせて説明する。
情報処理装置10における構成要素1,2,11〜16は、情報処理装置10を形成するコンピュータと、コンピュータに搭載されたCPU31で動作するプログラムとの協調動作により実現される。また、各記憶手段3〜5、21〜24は、情報処理装置10に搭載されたHDD34にて実現される。あるいは、RAM33又は外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPU31がプログラムを順次実行することで各種処理が実現される。
次に、本実施の形態における提案処理について図3に示したフローチャートを用いて説明する。
まず、翻訳実行部1により原稿(原文)の翻訳文がすでに作成されているとする。なお、情報処理装置10は、翻訳実行部1による翻訳の際に選択されている専門辞書を把握している。
ユーザーは、編集処理部2の編集機能を利用して翻訳文の単語を変更するなどの編集を行う。例えば、原稿が数学に関するレポートだったとすると、その原稿に含まれる「行列」が“matrix”と翻訳されることを期待する。しかしながら、数学辞書が利用対象の専門辞書として選択されていなかったために「行列」が“line”と翻訳されたとする。この場合、ユーザーは編集機能を利用して“line”を削除し、“matrix”と入力する編集を実施する。編集受付部11は、このような編集前後の内容を組にして編集内容として受け付ける(ステップ101)。
ところで、翻訳エンジンによる翻訳結果には、図4に例示したように原文に含まれる各単語(原単語)と、当該単語の翻訳結果(翻訳単語)とが対応付けられた単語翻訳結果が含まれている。また、原文を含めてもよい。対訳設定候補抽出部12は、この単語翻訳結果と、編集受付部11が受け付けた編集内容とを、翻訳文に含まれている単語によって対応付けることで対訳設定候補を抽出する(ステップ102)。この対応付けの例を図5に示すが、上記例の “line”という翻訳単語(編集前単語)によって紐付けることで、原単語と、翻訳が期待される単語(ユーザーによって入力された単語、以下「編集後単語」ともいう)が翻訳単語として対応付けられて対訳設定候補が作成される。
ところで、ユーザーは、「行列」が“matrix”と翻訳されることを期待していた。しかしながら、実際には“line”と翻訳されてしまった。本実施の形態では、続いて「行列」を“line”と翻訳した原因となる翻訳辞書を特定する。
まず、翻訳試行部13は、翻訳実行部1による翻訳の際に利用した全ての翻訳辞書(以下、「利用翻訳辞書」とも称する)を特定する。特定したn個の利用翻訳辞書をそれぞれ辞書1,辞書2,・・・,辞書nとすると、翻訳実行部1は、全ての辞書1〜nを利用して翻訳を実行したことになる。これに対し、翻訳試行部13は、利用翻訳辞書の中から翻訳辞書を1つ利用しないで翻訳を試行する(ステップ103)。これを利用翻訳辞書の数だけ繰り返し実行する。具体的には、翻訳試行部13は、(辞書2〜n)、(辞書1,辞書3〜n)、(辞書1,2,辞書4〜n)という辞書の組で翻訳を実行する。このようにして、翻訳試行部13は、n個の辞書i(i=1〜n)無翻訳結果を作成して辞書無翻訳結果記憶部22に保存する。
続いて、差分抽出部14は、各辞書i無翻訳結果に対応させて、図6に示したようにn個の辞書i(i=1〜n)無差分情報を生成する(ステップ104)。辞書i無差分情報における差分情報に含まれる「辞書i有り」は、辞書iを利用して翻訳されたときの訳語で、翻訳実行部1が翻訳した訳語である。これに対して「辞書i無し」は、辞書iを利用しないで翻訳試行部13により翻訳されたときの訳語である。このように、1つの原単語に対する2つの訳語が異なる場合、差分抽出部14は、これらの訳語を抽出し、差分情報として形成し、これに文章番号を対応付けして辞書n無差分情報として辞書無差分情報記憶部23に保存する。なお、文章番号は、異なる訳語にて翻訳された単語が含まれる原文内の文章の識別番号である。具体例をあげて説明すると、例えば、図6においてi=3の場合、「店員」という原単語は、全利用翻訳辞書を利用した翻訳実行部1による翻訳では“assistant”と翻訳されたが、辞書3を利用しないで翻訳試行部13による翻訳では“clerk”と翻訳されたことを意味する。これにより、辞書3には「店員」と“assistant”との組の対訳が設定されていることから、「店員」が“assistant”と翻訳された原因となる翻訳辞書は辞書3であると特定できる。
このようにして、n個の辞書i無差分情報が作成されると、対訳辞書対応付け部15は、差分情報が作成された原単語とその原単語の適切でない訳語(編集前単語)との組を対訳とし、その対訳が設定されている翻訳辞書の辞書名をその対訳に対応付けして対訳辞書対応情報を作成して対訳辞書対応情報記憶部24に登録する(ステップ105)。このようにして生成される対訳辞書対応情報の例を図6に示す。
続いて、本実施の形態では、原単語とユーザーが望んでいない訳語との対訳(上記例に従うと「行列」と“line”との組の対訳)が対訳辞書対応情報に含まれているかどうかによって、提案部16は、異なる内容の提案を選定して提案する(ステップ106)。なお、ユーザーにとってみれば、原単語「行列」を“matrix”と翻訳してほしかったので、翻訳エンジンによる “line”という翻訳は、説明の便宜上、ここでは「誤訳」と端的に称して説明する。
<提案1>対応辞書対応情報において、誤訳の原因となった「行列」と“line”との組の対訳が含まれている場合において、その対訳に専門辞書が対応付けされていた場合、提案部16は、その専門辞書を操作対象として特定し、その特定した専門辞書に対して翻訳エンジンが利用する辞書から外す、つまり、その専門辞書の選択取消という操作を提案する。「行列」と“line”との組の対訳を含む専門辞書が利用対象として選択されていたから「行列」は“line”と誤訳されたからである。
<提案2>対応辞書対応情報において、誤訳の原因となった「行列」と“line”との組の対訳が含まれている場合において、その対訳にユーザー辞書が対応付けされていた場合、提案部16は、ユーザー辞書を操作対象として特定し、ユーザー辞書の対訳を対訳設定候補に含まれている対訳への選択変更という操作を提案する。つまり、ユーザー辞書に「行列」と“line”とを組にした対訳が登録されているのが原因で誤訳されたため、この誤訳の原因となった対訳を、ユーザーによる編集が反映された対訳設定候補に含まれている対訳(「行列」と“matrix”との組の対訳)に選択変更すればよい。
<提案3>対応辞書対応情報において、誤訳の原因となった「行列」と“line”との組の対訳が含まれていない場合において、対訳設定候補に含まれている対訳、上記例に従うと「行列」と“matrix”との組の対訳がいずれかの専門辞書に登録されている場合、提案部16は、その対訳を含む専門辞書を操作対象として特定し、その特定した専門辞書を翻訳エンジンが利用する辞書に含める、つまり、その専門辞書の選択という操作を提案する。翻訳実行部1は、翻訳辞書データベース3に登録されている全ての専門辞書を利用しているとは限らない。翻訳実行部1が利用した専門辞書だけだと、前述したように「行列」は“line”と誤訳された。そこで、翻訳辞書データベース3に登録されている専門辞書であって翻訳実行部1が利用しなかったいずれかの専門辞書に「行列」と“matrix”との組の対訳が登録されているかどうかを確認する。登録されていれば、その専門辞書を利用することで、「行列」は“line”ではなく“matrix”と翻訳されることになる。
前述したように、専門辞書に登録されている対訳は公開されていない。従って、提案部16は、例えば翻訳試行部13を利用して翻訳エンジンを起動し、原文を翻訳させる。このとき、翻訳実行部1が利用しなかったいずれかの専門辞書を選択する。もし、「行列」が“matrix”と翻訳されれば、その際に利用している専門辞書に「行列」と“matrix”との組の対訳が登録されていることになる。このようにして、提案部16は、「行列」と“matrix”との組の対訳が登録されている専門辞書の探索を行う。
最初に説明したように、本実施の形態では、数学辞書を利用していなかったために「行列」は“line”と誤訳された。従って、本実施の形態における例は提案3に該当し、数学辞書の選択を提案することになると考えられる。
<提案4>対応辞書対応情報において、誤訳の原因となった「行列」と“line”との組の対訳が含まれていない場合において、上記提案3において説明した探索をしたところ、対訳設定候補に含まれている対訳、上記例に従うと「行列」と“matrix”との組の対訳がいずれの専門辞書にも登録されていない場合、提案部16は、ユーザー辞書を操作対象として特定し、ユーザー辞書に対訳設定候補の追加という操作を提案する。つまり、ユーザー辞書を含め、全ての専門辞書に「行列」と“matrix”との組の対訳が登録されていないので、ユーザー辞書に対訳設定候補に含まれている対訳、つまり「行列」と“matrix”との組の対訳を設定登録すればよい。
以上説明したように、提案部16は、操作の対象となる翻訳辞書及び当該翻訳辞書に対する操作の内容を選定して提案を行うことになる。なお、提案先は、通常、原稿を作成したユーザーであるが、これに限る必要はない。提案方法は、ユーザーへの電子メールによる通知等種々考えられるが、通知方法は特に限定する必要はない。
本実施の形態では、提案する内容として上記4つの提案をあげた。提案は、いずれか1つの提案を選定するのではなく複数の提案を適宜組み合わせてもよい。例えば、提案1では、専門辞書の取消操作を提案するが、選択取消に留めず、提案3で説明した専門辞書の探索を行って、選択すべき専門辞書の提案を合わせて行うようにしてもよい。
本実施の形態によれば、以上のようにしてユーザーに利用すべき専門辞書又はユーザー辞書の選択変更を提案する。
なお、上記説明においては、原文に含まれる「行列」という原単語が“line”と誤訳されたことを例にして図3に示した提案処理の流れを説明した。このうち、ステップ103〜105における処理は、最終的に対訳辞書対応情報を得るために実施される。この対訳辞書対応情報は、誤訳された対訳が複数ある場合でも共通した情報なので、翻訳文において複数の単語が編集された場合でも、対訳辞書対応情報記憶部24で保持しておけば、翻訳単語を処理する度に対訳辞書対応情報を得る処理(ステップ103〜105)を繰り返し実行する必要はない。
また、本実施の形態における情報処理装置10は、他のコンピュータで実行された翻訳の結果を取得して処理することも可能である。つまり、構成要素1〜5は、他のコンピュータ上にあってもよい。ただ、この場合は、情報処理装置10に原文及び翻訳文を取得する手段が必要となる。また、他のコンピュータの翻訳辞書データベースと同一構成の翻訳辞書データベースを持つか、翻訳試行部13を実現する翻訳エンジンに他のコンピュータの翻訳辞書データベースをアクセスさせる必要が生じてくる。
1 翻訳実行部、2 編集処理部、3 翻訳辞書データベース(DB)、4 原文記憶部、5 翻訳文記憶部、10 情報処理装置、11 編集受付部、12 対訳設定候補抽出部、13 翻訳試行部、14 差分抽出部、15 対訳辞書対応付け部、16 提案部、21 対訳設定候補記憶部、22 辞書無翻訳結果記憶部、23 辞書無差分情報記憶部、24 対訳辞書対応情報記憶部、31 CPU、32 ROM、33 RAM、34 ハードディスクドライブ(HDD)、35 マウス、36 キーボード、37 ディスプレイ、38 入出力コントローラ、39 ネットワークコントローラ、40 内部バス。

Claims (7)

  1. ユーザーによる編集が可能な編集可翻訳辞書とユーザーによる編集が不可能であり特定の分野に特化した編集不可翻訳辞書を利用して翻訳を行う翻訳エンジンによる翻訳結果に対する編集内容を受け付ける編集受付手段と、
    翻訳エンジンにより利用された編集不可翻訳辞書と編集可翻訳辞書と、前記編集受付手段が受け付けた編集内容と、に基づいて、前記編集不可翻訳辞書又は前記編集可翻訳辞書における対訳の変更または前記編集不可翻訳辞書又は前記編集可翻訳辞書の選択変更を提案する提案手段と、
    を有することを特徴とする情報処理装置。
  2. 編集対象となった原文における単語に対する編集内容を抽出する抽出手段を有することを特徴とする請求項1に記載の情報処理装置。
  3. 前記提案手段は、編集対象となった原文に含まれる単語と当該単語に対する翻訳結果とがいずれかの前記編集不可翻訳辞書に登録されている場合、当該編集不可翻訳辞書を前記翻訳エンジンに利用させないことを提案することを特徴とする請求項1に記載の情報処理装置。
  4. 前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが翻訳エンジンにより利用されたいずれの翻訳辞書にも登録されていない場合、前記抽出手段により抽出された対訳が登録されている前記編集不可翻訳辞書の利用を提案することを特徴とする請求項2に記載の情報処理装置。
  5. 前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが前記編集可翻訳辞書に登録されている場合、前記編集可翻訳辞書に登録されている当該対訳を、前記抽出手段により抽出された編集内容に変更することを提案する請求項2に記載の情報処理装置。
  6. 前記提案手段は、編集対象となった原文における単語と当該単語に対する翻訳結果とが翻訳エンジンにより利用されたいずれの翻訳辞書にも登録されていない場合であって前記抽出手段により抽出された編集内容が登録されている前記編集不可翻訳辞書が存在しない場合、当該編集内容の前記編集可翻訳辞書への登録を提案することを特徴とする請求項2に記載の情報処理装置。
  7. コンピュータを、
    ユーザーによる編集が可能な編集可翻訳辞書とユーザーによる編集が不可能であり特定の分野に特化した編集不可翻訳辞書を利用して翻訳を行う翻訳エンジンによる翻訳結果に対する編集内容を受け付ける編集受付手段、
    翻訳エンジンにより利用された編集不可翻訳辞書と編集可翻訳辞書と、前記編集受付手段が受け付けた編集内容と、に基づいて、前記編集不可翻訳辞書又は前記編集可翻訳辞書における対訳の変更または前記編集不可翻訳辞書又は前記編集可翻訳辞書の選択変更を提案する提案手段、
    として機能させるためのプログラム。
JP2016048186A 2016-03-11 2016-03-11 情報処理装置及びプログラム Active JP6766384B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016048186A JP6766384B2 (ja) 2016-03-11 2016-03-11 情報処理装置及びプログラム
US15/219,868 US20170262427A1 (en) 2016-03-11 2016-07-26 Information processing apparatus, information processing method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016048186A JP6766384B2 (ja) 2016-03-11 2016-03-11 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017162349A true JP2017162349A (ja) 2017-09-14
JP6766384B2 JP6766384B2 (ja) 2020-10-14

Family

ID=59786628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016048186A Active JP6766384B2 (ja) 2016-03-11 2016-03-11 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US20170262427A1 (ja)
JP (1) JP6766384B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7467314B2 (ja) * 2020-11-05 2024-04-15 株式会社東芝 辞書編集装置、辞書編集方法、及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001075662A2 (en) * 2000-03-31 2001-10-11 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
JP2002108858A (ja) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> 機械翻訳方法、機械翻訳装置および記録媒体
AU2003290955A1 (en) * 2002-11-22 2004-06-18 Transclick, Inc. Language translation system and method
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
WO2008108061A1 (ja) * 2007-03-01 2008-09-12 Nec Corporation 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体

Also Published As

Publication number Publication date
US20170262427A1 (en) 2017-09-14
JP6766384B2 (ja) 2020-10-14

Similar Documents

Publication Publication Date Title
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
US8494839B2 (en) Apparatus, method, and recording medium for morphological analysis and registering a new compound word
US20060241934A1 (en) Apparatus and method for translating Japanese into Chinese, and computer program product therefor
JP2004334791A (ja) 機械翻訳装置、データ処理方法及びプログラム
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
JP5204244B2 (ja) 誤訳の検出を支援する装置及び方法
KR101544690B1 (ko) 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램
JP2007241764A (ja) 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP4113235B2 (ja) 翻訳支援装置
JP5647451B2 (ja) 統計データに基づくユーザクエリ校正システムおよび方法
JP2022055305A (ja) テキスト要約を生成するテキスト処理方法、装置、デバイス及び記憶媒体
JP6160438B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP6766384B2 (ja) 情報処理装置及びプログラム
JP2006201873A (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
JP2012043233A (ja) 対訳辞書生成装置、方法及びプログラム
Janssen et al. Improving POS tagging in Old Spanish using TEITOK
US20050154579A1 (en) Apparatus for and method of analyzing chinese
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
JP2017151553A (ja) 機械翻訳装置、機械翻訳方法、及びプログラム
JP4134983B2 (ja) 機械翻訳装置
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP2012230460A (ja) 機械翻訳システム、方法及びプログラム
JPWO2009038209A1 (ja) 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
JP2009146196A (ja) 翻訳支援システム、翻訳支援方法および翻訳支援用プログラム
JP5351879B2 (ja) 情報処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190806

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200831

R150 Certificate of patent or registration of utility model

Ref document number: 6766384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350