JP6702047B2 - 翻訳装置、翻訳システムおよびプログラム - Google Patents

翻訳装置、翻訳システムおよびプログラム Download PDF

Info

Publication number
JP6702047B2
JP6702047B2 JP2016136857A JP2016136857A JP6702047B2 JP 6702047 B2 JP6702047 B2 JP 6702047B2 JP 2016136857 A JP2016136857 A JP 2016136857A JP 2016136857 A JP2016136857 A JP 2016136857A JP 6702047 B2 JP6702047 B2 JP 6702047B2
Authority
JP
Japan
Prior art keywords
word
translation
translated
registration
edited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016136857A
Other languages
English (en)
Other versions
JP2018010352A (ja
Inventor
和哉 田中
和哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016136857A priority Critical patent/JP6702047B2/ja
Publication of JP2018010352A publication Critical patent/JP2018010352A/ja
Application granted granted Critical
Publication of JP6702047B2 publication Critical patent/JP6702047B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、翻訳装置、辞書修正支援装置、翻訳システム、プログラムに関する。
近年、原語で記載された紙文書や電子文書を他言語に翻訳する翻訳サービスが提供されている。この翻訳サービスは、例えば、クラウドサービスとして提供される。これは端末装置等から翻訳サービスを行なうクラウドサーバに原文を送信すると、翻訳された後の訳文が送り返されてくるものである。
特許文献1には、単語辞書と、ユーザー辞書と、翻訳対象となる原文を記憶している原文記憶手段と、原文の各単語について単語辞書およびユーザー辞書を検索することにより原文から未登録語を検出し、その周辺の単語を同時に呼び出す未登録語・周辺語検出手段と、未登録語・周辺語検出手段によって検出された未登録語および周辺の単語を表示する表示手段と、未登録語の訳語を入力するための入力手段と、入力手段より入力された訳語と検出された未登録語とを対応させてユーザー辞書に格納する登録手段とを備えた機械翻訳装置が開示されている。
特開平6−223100号公報
しかしながら翻訳後の訳文が原文と適合しない場合がある。そしてこのときユーザが訳文の編集を行ない、より適合する訳語にする場合がある。このときユーザの編集結果を反映させ以後の翻訳の品質向上を図るため、従来は、翻訳を行なう際に使用する翻訳辞書の訳語を編集結果に応じ置き換えることが行なわれている。ただしこの場合、翻訳辞書における既存の用語体系を乱すことになる。また従来は、原文に翻訳辞書に存在しない単語があった場合、ユーザに訳文を入力されることが行なわれている。ただしこの場合、翻訳辞書に存在しない単語が対象となるので、既に存在する単語に対しては、適用ができない。
本発明は、ユーザの編集結果をより適格に反映させて翻訳辞書を修正する際、ユーザの編集結果を、単に翻訳辞書に対して上書きしていく場合よりも、既存の用語体系を乱さない翻訳装置等を提供することを目的とする。
請求項1に記載の発明は、翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳部と、ユーザから訳文に対する編集結果を受け付ける受付部と、編集された訳文から前記翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成部と、複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録部と、を備え、前記登録候補作成部は、編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とする翻訳装置である。
請求項2に記載の発明は、前記翻訳部は、選択用語を前記翻訳辞書に登録した後に前記原文の再翻訳を行なうことを特徴とする請求項に記載の翻訳装置である。
請求項3に記載の発明は、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳手段と、原語により記された原文を前記翻訳手段に送信する文書送信手段と、を備え、前記翻訳手段は、翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳部と、ユーザから訳文に対する編集結果を受け付ける受付部と、編集された訳文から前記翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成部と、複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録部と、を備え、前記登録候補作成部は、編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とする翻訳システムである。
請求項に記載の発明は、コンピュータに、ユーザから訳文に対する編集結果を受け付ける受付機能と、編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成機能と、複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録機能と、前記翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳機能と、を実現させ、前記登録候補作成機能は、編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とするプログラムである
請求項1の発明によれば、ユーザの編集結果をより適格に反映させて翻訳辞書を修正する際、ユーザの編集結果を、単に翻訳辞書に対して上書きしていく場合よりも、既存の用語体系を乱さない翻訳装置を提供することができる。また、登録候補がより適格なものとなる。さらに、翻訳辞書における既存の用語体系を維持することができる。
請求項2の発明によれば、翻訳の精度がより向上する。
請求項3の発明によれば、ユーザの編集結果をより適格に反映させて翻訳辞書を修正する際、ユーザの編集結果を、単に翻訳辞書に対して上書きしていく場合よりも、既存の用語体系を乱さない翻訳システムを提供することができる。また、登録候補がより適格なものとなる。さらに、翻訳辞書における既存の用語体系を維持することができる。
請求項の発明によれば、既存の用語体系を維持しつつ、ユーザの編集結果を反映させるように翻訳辞書を修正する機能をコンピュータにより実現できる。そして、ユーザの編集結果をより適格に反映させて翻訳辞書を修正する際、ユーザの編集結果を、単に翻訳辞書に対して上書きしていく場合よりも、既存の用語体系を乱さない機能をコンピュータにより実現できる。また、登録候補がより適格なものとなる。さらに、翻訳辞書における既存の用語体系を維持することができる。
本実施の形態が適用される翻訳システムの全体構成例を示したものである。 端末装置のハードウェア構成を示した図である。 画像形成装置のハードウェア構成例を示した図である。 クラウドサーバが原文から訳文に翻訳を行なう処理について示した図である。 クラウドサーバの機能構成例を示したブロック図である。 (a)〜(b)は、訳文の編集結果の一例を示す図である。 (a)は、編集前の訳文と編集後の訳文とを比較した表である。(b)は、原文と編集前の訳文との組み合わせを示した表である。(c)は、抽出した翻訳辞書に登録する単語の候補を示した図である。 (a)〜(b)は、単語の候補と翻訳辞書とを対比した図である。 (a)〜(b)は、登録候補作成部が登録候補を作成する方法について説明した図である。 (a)は、選択結果について示した図である。(b)は、選択用語を翻訳辞書に登録した後の翻訳辞書の内容を示した図である。 翻訳システムの動作について説明したフローチャートである。
<翻訳システムの全体構成の説明>
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
なお以後の説明において、「原語」とは、翻訳される対象となる言語であり、翻訳前の言語である。また「訳語」とは、翻訳後の言語である。さらに「原文」とは、原語で記された1文字以上の文章のことであり、「訳文」とは、訳語で記された1文字以上の文章のことである。
図1は、本実施の形態が適用される翻訳システムの全体構成例を示したものである。
図示するように、この翻訳システム1は、端末装置10と、画像形成装置30とがネットワーク90に接続されることにより構成されている。また、ネットワーク90は、例えば、図示しないゲイトウェイサーバを介して、ネットワーク70に接続されており、ネットワーク70には、クラウドサーバ50が接続されている。
なお図では、1つの端末装置10しか示していないが、複数の端末装置10を設けてもよい。また図では、1つの画像形成装置30しか示していないが、複数の画像形成装置30を設けてもよい。
端末装置10は、クラウドサーバ50に文書の翻訳を要求するコンピュータ装置である。ここで、端末装置10としては、PC(Personal Computer)、携帯端末、携帯電話等を用いるとよい。
画像形成装置30は、紙等の記録媒体に画像を形成し、印刷媒体として出力する装置である。画像形成装置30は、プリンタ機能を備えるが、これに加えて例えば、スキャナ機能、ファクシミリ機能等の他の画像処理機能を備えていてもよい。
また詳しくは後述するが、画像形成装置30からもクラウドサーバ50に文書の翻訳を要求することができる。端末装置10および画像形成装置30は、原語により記された原文をクラウドサーバ50に送信する文書送信手段として機能する。
クラウドサーバ50は、翻訳を行なうクラウドサービスを提供するサーバコンピュータである。クラウドサーバ50は、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳手段(翻訳装置)として機能する。
ネットワーク70は、端末装置10とクラウドサーバ50との間の情報通信や、画像形成装置30とクラウドサーバ50との間の情報通信に用いられる通信手段であり、例えば、インターネットである。
ネットワーク90は、端末装置10と画像形成装置30との間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。
次に、端末装置10のハードウェア構成について説明する。
図2は、端末装置10のハードウェア構成を示した図である。
図示するように、端末装置10は、演算手段であるCPU(Central Processing Unit)11と、記憶手段であるメインメモリ12及びHDD(Hard Disk Drive)13とを備える。ここで、CPU11は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行する。また、メインメモリ12は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD13は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
更に、端末装置10は、外部との通信を行うための通信インターフェース(以下、「通信I/F」と表記する)14と、ビデオメモリやディスプレイ等からなる表示機構15と、キーボードやマウス等の入力デバイス16とを備える。
なお図2は、クラウドサーバ50のハードウェア構成を示した図として捉えることもできる。
図3は、画像形成装置30のハードウェア構成例を示した図である。
図示するように、画像形成装置30は、CPU31と、RAM(Random Access Memory)32と、ROM(Read Only Memory)33と、HDD(Hard Disk Drive)34と、操作パネル35と、画像読み取り部36と、画像形成部37と、通信I/F38とを備える。
CPU31は、ROM33等に記憶された各種プログラムをRAM32にロードして実行することにより、後述する各機能を実現する。
RAM32は、CPU31の作業用メモリ等として用いられるメモリである。
ROM33は、CPU31が実行する各種プログラム等を記憶するメモリである。
HDD34は、画像読み取り部36が読み取った画像データや画像形成部37における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。
操作パネル35は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。
画像読み取り部36は、原稿に記録された画像を読み取る。ここで、画像読み取り部36は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。
画像形成部37は、記録媒体に画像を形成する印刷機構の一例である。ここで、画像形成部37は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
通信I/F38は、ネットワークを介して他の装置との間で各種情報の送受信を行う。
この構成の翻訳システム1において、端末装置10は、翻訳前の原語による文書データをクラウドサーバ50に対し送信する。これは、例えば、端末装置10で動作するWebブラウザ等のソフトウェアを使用することで行なうことができる。具体的には、端末装置10の表示機構15にクラウドサーバ50が提供するクラウドサービスのWebページを表示し、Webページのメニュー等を入力デバイス16を用いて操作することで行なう。そしてクラウドサーバ50では、文書を原語から訳語に翻訳し、翻訳後の文書のデータを端末装置10に送り返す。端末装置10では、送り返された翻訳後の文書がWebページに表示される。なお文書データのフォーマットとしては、例えば、Word形式やPDF形式を使用することができる。
また端末装置10のみならず、画像形成装置30でも原語による文書データをクラウドサーバ50に対し送信することができる。この場合、例えば、画像読み取り部36で原稿をスキャンし、原稿に記録された画像を画像データを取得する。そして、原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。
クラウドサーバ50では、文書を原語から訳語に翻訳した後、翻訳後の文書データを画像形成装置30または端末装置10に対し、送り返す。翻訳後の文書データが画像形成装置30に対し送り返されたときは、画像形成装置30では、例えば、操作パネル35に翻訳後の文書が表示される。あるいはHDD34でこれを記憶してもよい。また端末装置10に対し送り返されたときは、上述した場合と同様に翻訳後の文書がWebページに表示される。
<クラウドサーバ50の説明>
次にクラウドサーバ50について、より詳細な説明を行なう。
図4は、クラウドサーバ50が原文から訳文に翻訳を行なう処理について示した図である。
ここでは、原語を日本語とし、訳語を英語とした場合について説明を行なう。そしてここでは、原語により記された原文である「本章では正則関数について説明します。」が、訳語により記された訳文である「This chapter describes the regular function.」に翻訳された場合を示している。
この場合、クラウドサーバ50は、翻訳処理を行なうにあたり、翻訳辞書を使用する。そして翻訳辞書が複数あり、その中から1つを選択し、使用した場合を示している。この翻訳辞書は、例えば、分野別の専門用語が登録された専門辞書やユーザ固有の用語を登録したユーザ辞書である。クラウドサーバ50が翻訳を行なうのに適した翻訳辞書を選択することで、翻訳の品質が向上する。図4では、翻訳辞書として、数学辞書、化学辞書、およびその他の辞書が用意され、上記原文を翻訳処理するのに数学辞書を選択した場合を示している。なお翻訳辞書の選択は、ユーザからの指示に従い行なうことができる。また原文を解析し自動的に行なうこともできる。
しかしながら言語毎に生まれた背景や思想が異なることから、原語1単語に対する訳文が複数単語存在する場合がある。また学問や技術などの分野では、新しい理論や概念が生み出され、そのため新しい単語や言葉遣いが生まれることがある。例えば、数学の分野において「正則」の訳文として、「regular」が用いられていたが、新たに「holomorphic」を使用する事例が生じたような場合である。
このとき数学辞書に、「正則」の訳文として、「holomorphic」を登録することで、以後、「正則」の訳文は、「holomorphic」となる。しかしこの場合、「正則」の訳文として、「regular」とする翻訳パターンが消失してしまう。その結果、この数学辞書における既存の用語体系を乱すことになる。なおここで「翻訳パターン」とは、原文に対する訳文の組み合わせのことである。
<クラウドサーバ50の説明>
そこで本実施の形態では、クラウドサーバ50の構成を以下のようにし、この問題の抑制を図っている。
図5は、クラウドサーバ50の機能構成例を示したブロック図である。なお図5では、クラウドサーバ50が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
図示するように、クラウドサーバ50は、翻訳前の文書データを取得するデータ取得部501と、翻訳辞書を選択する辞書選択部502と、翻訳辞書を記憶する辞書記憶部503と、原文から訳文への翻訳を行なう翻訳部504と、翻訳後の文書データを出力するデータ出力部505と、ユーザの訳文に対する編集結果を受け付ける受付部506と、編集結果を解析する編集結果解析部507と、翻訳辞書へ登録する用語の候補を作成する登録候補作成部508と、翻訳辞書に新たな用語の登録を行なう登録部509とを備える。
データ取得部501は、端末装置10や画像形成装置30から、原語で記された翻訳前の文書データを取得する。ここでは、データ取得部501は、図4で説明した「本章では正則関数について説明します。」の文書データを取得したとして、以下の説明を行なう。
辞書選択部502は、辞書記憶部503に記憶されている翻訳辞書の中から、翻訳を行なうのに適したものを選択する。ここでは、辞書選択部502は、翻訳辞書として、例えば、数学辞書を選択する。
翻訳部504は、辞書選択部502で選択された翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう。翻訳部504で行なう翻訳処理は、既存の方法を使用することができる。翻訳部504により、例えば、図4で説明したように、原文である「本章では正則関数について説明します。」が、訳文である「This chapter describes the regular function.」に翻訳される。
データ出力部505は、訳文のデータである翻訳後の文書データを端末装置10や画像形成装置30に対し出力する。
受付部506は、ユーザから訳文に対する編集結果を取得する。
ユーザは、訳文について不自然と考えた場合は、受け取った文書を編集したい場合がある。編集の作業は、翻訳後の文書を見たユーザが端末装置10や画像形成装置30を使用して行なう。そして訳文に対する編集結果は、クラウドサーバ50に送られ、受付部506がそれを受け付ける。
図6(a)〜(b)は、訳文の編集結果の一例を示す図である。
このうち図6(a)は、編集前の訳文を示している。図示する例では、原文が「本章では正則関数について説明します。」であり、編集前の訳文が「This chapter describes the regular function.」であったことを示す。
また図6(b)は、編集後の訳文を示している。図示する例では、原文が「本章では正則関数について説明します。」であり、編集後の訳文が「This chapter describes the holomorphic function.」であったことを示す。
即ち、ユーザは、原文の「正則」に対応する訳文を「regular」から「holomorphic」に変更する編集を行なっている。
編集結果解析部507は、ユーザによる編集結果を解析し、翻訳辞書に登録する単語の候補を抽出する。
編集結果解析部507は、編集前の訳文と編集後の訳文の差分をとり、原文と編集前の訳文の組み合わせを差分点で置き換えることで、翻訳辞書に登録する単語の候補を抽出することができる。また原文と編集後の訳文とで単語毎の組を作り、編集前の訳文にはない単語を抽出することで、翻訳辞書に登録する単語の候補を抽出することができる。ここでは、このうち前者の方法について以下に具体的に説明する。
図7(a)は、編集前の訳文と編集後の訳文とを比較した表である。また図7(b)は、原文と編集前の訳文との組み合わせを示した表である。さらに図7(c)は、抽出した翻訳辞書に登録する単語の候補を示した図である。
図7(a)に示すように、編集前の訳文と編集後の訳文とを比較した場合、「regular」と「holomorphic」とが、差分となる。そして図7(b)に示すように、原文と編集前の訳文の組み合わせを見ると、「regular」は、「正則」に対応しているのがわかる。その結果、図7(c)に示すように、原文の「正則」と編集後の訳文の「holomorphic」との組が、翻訳辞書に登録する単語の候補として抽出される。
また編集結果解析部507は、単語の候補が、翻訳辞書に登録可能か否かを判断する。この場合、編集結果解析部507は、編集された単語に対応する原文の単語が、翻訳辞書に存在しない場合は、翻訳辞書に登録可能であると判断する。対して編集された単語に対応する原文の単語が、翻訳辞書に既に存在する場合は、そのままでは翻訳辞書に登録することができないと判断する。
図8(a)〜(b)は、単語の候補と翻訳辞書とを対比した図である。
このうち図8(a)は、単語の候補を示している。また図8(b)は、翻訳辞書である数学辞書の内容を示している。この場合、原文である「正則」が、数学辞書に存在する。よって編集結果解析部507は、単語の候補は、数学辞書に登録することができないと判断する。
登録候補作成部508は、編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する。なお登録候補作成部508は、編集結果解析部507が編集された単語に対応する原文の単語が翻訳辞書に既に存在し、翻訳辞書に登録することができないと判断した場合に、この登録候補を作成する。
登録候補作成部508は、例えば、編集された後の単語(要素)と編集された後の単語の直前に位置する単語とを加えたもの、および編集された後の単語と編集された後の単語の直後に位置する単語とを加えたものを、登録候補とする。なおこの場合、登録候補は、2つとなる。なお登録候補は、2以上の単語(要素)をつなげた連語である。
図9(a)〜(b)は、登録候補作成部508が登録候補を作成する方法について説明した図である。
図9(a)は、編集後の訳文について示している。つまり原文が「本章では正則関数について説明します。」であり、編集後の訳文が「This chapter describes the holomorphic function.」であったことを示す。
図9(b)は、登録候補作成部508が作成した登録候補について示している。
この場合、上側は、原文と訳文のそれぞれについて、編集された後の単語と編集された後の単語の直前に位置する単語とを加えたものを登録候補とした例である。つまり編集された後の単語は、原文については、「正則」であり、訳文については、「holomorphic」である。そして編集された後の単語の直前に位置する単語は、原文については、「では」であり、訳文については、「the」である。よってこの場合、「では正則」と「the holomorphic」の組が登録候補となる。
また下側は、原文と訳文のそれぞれについて、編集された後の単語と編集された後の単語の直後に位置する単語とを加えたものを登録候補とした例である。つまり編集された後の単語は、原文については、「正則」であり、訳文については、「holomorphic」である。そして編集された後の単語の直後に位置する単語は、原文については、「関数」であり、訳文については、「function」である。よってこの場合、「正則関数」と「holomorphic function」の組が登録候補となる。
登録部509は、編集結果解析部507が抽出した単語の候補が、翻訳辞書に登録することが可能であると判断した場合にこの単語の原文および訳文を翻訳辞書に登録する。
また登録部509は、複数の登録候補からユーザが選択した用語である選択用語を翻訳辞書に登録する。
登録候補作成部508が作成した登録候補は、端末装置10や画像形成装置30に送られ、ユーザは、複数の登録候補から翻訳辞書に登録する用語を選択する。そして選択結果は、クラウドサーバ50に送り返される。選択結果は、例えば、受付部506により受け付けられる。そして登録部509は、複数の登録候補からユーザが選択した用語である選択用語の原文および訳文を翻訳辞書に登録する。ユーザを介在させ、ユーザが翻訳辞書に登録する用語を選択することで、登録により適した用語が抽出され、翻訳辞書に登録することができる。
図10(a)は、選択結果について示した図である。
この場合、ユーザは、上記登録候補のうち、「正則関数」と「holomorphic function」の組を選択したことを示している。
図10(b)は、選択用語を翻訳辞書に登録した後の翻訳辞書(この場合、数学辞書)の内容を示した図である。
図8(b)の登録前の数学辞書と比較すると、図10(b)の場合は、数学辞書に原文である「正則関数」と訳文である「holomorphic function」とが新たに登録されていることがわかる。この場合、原文の「正則関数」は、図8(b)の数学辞書には、存在しないため、登録が行なわれる。
<翻訳システム1の動作の説明>
次に翻訳システム1の動作について説明を行なう。
図11は、翻訳システム1の動作について説明したフローチャートである。
まずユーザは、翻訳を行ないたい文書の文書データをクラウドサーバ50に対しアップロードする(ステップ101)。
この作業を端末装置10で行なう場合、ユーザは、端末装置10で動作するWebブラウザ等のソフトウェアを起動し、クラウドサーバ50が提供するサービスのWebページを開く。そしてユーザは、このWebページのメニュー等を操作し、文書データをクラウドサーバ50に送信する。
またこの作業を画像形成装置30で行なう場合、ユーザは、画像読み取り部36において原稿をスキャンし、原稿の画像データを取得する。そして原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。
クラウドサーバ50では、データ取得部501が、送られた文書データを翻訳前の文書データとして取得する(ステップ102)。
次に辞書選択部502が、辞書記憶部503に記憶されている翻訳辞書の中から翻訳を行なうのに適したものを選択する(ステップ103)。
また翻訳部504が、辞書選択部502で選択された翻訳辞書を用いて、翻訳を行なう(ステップ104)。これにより原語により記された原文が訳語により記された訳文に翻訳される。
そしてデータ出力部505が、訳文のデータである翻訳後の文書データを端末装置10や画像形成装置30に対し出力する(ステップ105)。
端末装置10や画像形成装置30では、翻訳後の文書データを受け取る(ステップ106)。そして端末装置10や画像形成装置30では、翻訳後の文書が表示機構15や操作パネル35に表示される。
ユーザは、表示された翻訳後の文書を見て訳文の編集を行なう(ステップ107)。編集結果はクラウドサーバ50に送信される(ステップ108)。
送信された編集結果は、クラウドサーバ50の受付部506が受け付ける(ステップ109)。
次に編集結果解析部507が、ユーザによる編集結果を解析し、翻訳辞書に登録する単語の候補を抽出する(ステップ110)。
また編集結果解析部507は、単語の候補が、翻訳辞書に存在するか否かを判断する(ステップ111)。
そして抽出した単語の候補が、翻訳辞書に既に存在した場合(ステップ111でYes)、編集結果解析部507は、そのままでは翻訳辞書に登録することができないと判断する(ステップ112)。
この場合、登録候補作成部508が、編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する(ステップ113)。
データ出力部505は、登録候補を端末装置10や画像形成装置30に送る(ステップ114)。
ユーザは、複数の登録候補から翻訳辞書に登録する用語を選択する(ステップ115)。そして選択結果は、クラウドサーバ50に送り返される(ステップ116)。
送られた選択結果は、クラウドサーバ50の受付部506が受け付ける(ステップ117)。
そして登録部509が、ユーザが選択した用語である選択用語の原文および訳文を翻訳辞書に登録する(ステップ118)。
なお単語の候補が、翻訳辞書に存在しない場合(ステップ111でNo)、編集結果解析部507は、翻訳辞書に登録することが可能であると判断する(ステップ119)。
そして登録部509が、この単語の原文および訳文を翻訳辞書に登録する(ステップ118)。
以上詳述した形態では、ユーザの編集結果を基に複数の登録候補を作成し、ユーザが選択用語を選択する処理を行なうことで翻訳辞書に新たに登録する用語をより正確に特定することができる。
また例えば、図10(b)に示すように、従来の原文の「正則」と訳文の「regular」との翻訳パターンを維持したまま、原文の「正則関数」と訳文の「holomorphic function」の翻訳パターンを新たな翻訳パターンとして加えることができる。つまり原文が「正則関数」のときは、訳文は「holomorphic function」となり、原文が「正則関数」とはならない「正則」のときは、訳文は「regular」となる。
このように本実施の形態では、ユーザの編集結果をより適格に反映させて翻訳辞書を修正することができる。そして翻訳辞書における既存の用語体系を維持しつつ、新しい理論や概念に対応する訳語に翻訳することができ、原文により適合する訳文に翻訳することができる。
なお上述した形態において、翻訳部504は、選択用語を翻訳辞書に登録した後に原文の再翻訳を行なうようにしてもよい。これにより、より高い精度の翻訳結果を得ることができる。例えば、ユーザが編集を行なうのに見逃した箇所があったとしても、上述した処理により、この箇所に関連する用語が翻訳辞書に登録されていれば、正しい翻訳が行なわれる。
またクラウドサーバ50は、ユーザから訳文に対する編集結果を受け付ける受付部506と、編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成部508と、複数の登録候補からユーザが選択した用語である選択用語を翻訳辞書に登録する登録部509と、を備える辞書修正支援装置を含む翻訳装置であると考えることもできる。この辞書修正支援装置によれば、既存の用語体系を維持しつつ、原文により適合する訳語に翻訳することができるように翻訳辞書を修正することができる。
なお上述した例では、画像形成装置30が、画像データをPDF形式等の文書データに変換していたが、画像データをクラウドサーバ50に送信し、クラウドサーバ50側で文書データとしてもよい。
さらに上述した例では、登録候補作成部508において登録候補は2つ作成していたが、単語の組み合わせを変更し、3つ以上の登録候補を作成してもよい。例えば、上述した例では、登録候補作成部508は、例えば、編集された後の単語(要素)と編集された後の単語の直前に位置する単語とを加えたもの、および直後に位置する単語とを加えたものを、登録候補としていたが、これを隣接する2単語(要素)まで拡張し、登録候補を作成する。
そして上述した例では、クラウドサーバ50は、ネットワーク70に接続されクラウドサービスを行なうものであったが、ネットワーク90に接続し、翻訳サーバとして使用してもよい。即ち、クラウドサーバ50が接続されるネットワークに特に制限はない。さらにクラウドサーバ50の機能を端末装置10や画像形成装置30に入れ込み、端末装置10や画像形成装置30単独で一連の処理を行ってもよい。この場合、端末装置10や画像形成装置30が翻訳装置として機能する。
<プログラムの説明>
なお本実施の形態におけるクラウドサーバ50が行なう処理は、例えば、CPU11が、HDD13等に記憶された各種プログラムをメインメモリ12にロードして実行することにより行なわれる。
よってクラウドサーバ50が行なう処理は、コンピュータに、ユーザから訳文に対する編集結果を受け付ける受付機能と、編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成機能と、複数の登録候補からユーザが選択した用語である選択用語を翻訳辞書に登録する登録機能と、を実現させるプログラムとして捉えることもできる。
尚、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。
1…翻訳システム、10…端末装置、30…画像形成装置、50…クラウドサーバ、501…データ取得部、502…辞書選択部、503…辞書記憶部、504…翻訳部、505…データ出力部、506…受付部、507…編集結果解析部、508…登録候補作成部、509…登録部

Claims (4)

  1. 翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳部と、
    ユーザから訳文に対する編集結果を受け付ける受付部と、
    編集された訳文から前記翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成部と、
    複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録部と、
    を備え
    前記登録候補作成部は、
    編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、
    編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とする翻訳装置。
  2. 前記翻訳部は、選択用語を前記翻訳辞書に登録した後に前記原文の再翻訳を行なうことを特徴とする請求項に記載の翻訳装置。
  3. 原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳手段と、
    原語により記された原文を前記翻訳手段に送信する文書送信手段と、
    を備え、
    前記翻訳手段は、
    翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳部と、
    ユーザから訳文に対する編集結果を受け付ける受付部と、
    編集された訳文から前記翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成部と、
    複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録部と、
    を備え
    前記登録候補作成部は、
    編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、
    編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とする翻訳システム。
  4. コンピュータに、
    ユーザから訳文に対する編集結果を受け付ける受付機能と、
    編集された訳文から翻訳辞書に登録を行なう候補となる用語である登録候補を複数作成する登録候補作成機能と、
    複数の前記登録候補からユーザが選択した用語である選択用語の原文および訳文を前記翻訳辞書に登録する登録機能と、
    前記翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう翻訳機能と、
    を実現させ
    前記登録候補作成機能は、
    編集された単語に対応する原文の単語が前記翻訳辞書に既に存在する場合に、前記登録候補を作成し、
    編集された後の単語と当該編集された後の単語の直前に位置する単語とを加えた連語、および当該編集された後の単語と当該編集された後の単語の直後に位置する単語とを加えた連語を、前記登録候補とするプログラム。
JP2016136857A 2016-07-11 2016-07-11 翻訳装置、翻訳システムおよびプログラム Expired - Fee Related JP6702047B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016136857A JP6702047B2 (ja) 2016-07-11 2016-07-11 翻訳装置、翻訳システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016136857A JP6702047B2 (ja) 2016-07-11 2016-07-11 翻訳装置、翻訳システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2018010352A JP2018010352A (ja) 2018-01-18
JP6702047B2 true JP6702047B2 (ja) 2020-05-27

Family

ID=60994357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016136857A Expired - Fee Related JP6702047B2 (ja) 2016-07-11 2016-07-11 翻訳装置、翻訳システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP6702047B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162071A (ja) * 1992-11-27 1994-06-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH076175A (ja) * 1993-02-19 1995-01-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JP2004341791A (ja) * 2003-05-15 2004-12-02 Nec Corp 辞書登録支援装置および方法ならびにプログラム

Also Published As

Publication number Publication date
JP2018010352A (ja) 2018-01-18

Similar Documents

Publication Publication Date Title
US20060206305A1 (en) Translation system, translation method, and program
US10528679B2 (en) System and method for real time translation
US8630852B2 (en) Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program
JP2012090061A (ja) ワークフロー実行装置、プレビュー作成方法及びプログラム
US20150242371A1 (en) Universal mobile document viewer with high fidelity, efficient architecture and editing
US10810383B2 (en) Image processing apparatus for comparing documents in different languages
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
US9529792B2 (en) Glossary management device, glossary management system, and recording medium for glossary generation
JP2016062452A (ja) 情報処理装置およびプログラム
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JP6809005B2 (ja) 翻訳装置、翻訳システムおよびプログラム
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
US10902223B2 (en) Image processing apparatus
JP6702047B2 (ja) 翻訳装置、翻訳システムおよびプログラム
US10163024B2 (en) Electronic device and electronic device control method
JP2021047792A (ja) 情報処理装置及びプログラム
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP4797507B2 (ja) 翻訳装置、翻訳システムおよびプログラム
US20150261746A1 (en) Translation system, information processing apparatus, information processing method, and computer program product
US20230385358A1 (en) Providing shortened url and information related contents corresponding to original url
US20170371864A1 (en) System and method for device filtered translation
KR102563077B1 (ko) 통신 시스템에서 웹툰의 번역을 지원하기 위한 방법 및 장치
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
US20220179597A1 (en) Modify and output printout including data in predefined format

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6702047

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees