JP2007052613A - Translation device, translation system and translation method - Google Patents
Translation device, translation system and translation method Download PDFInfo
- Publication number
- JP2007052613A JP2007052613A JP2005236980A JP2005236980A JP2007052613A JP 2007052613 A JP2007052613 A JP 2007052613A JP 2005236980 A JP2005236980 A JP 2005236980A JP 2005236980 A JP2005236980 A JP 2005236980A JP 2007052613 A JP2007052613 A JP 2007052613A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- data
- original text
- identification information
- translation data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、高い翻訳精度で翻訳を行うことの出来る翻訳装置、翻訳システムおよび翻訳方法に関する。 The present invention relates to a translation apparatus, a translation system, and a translation method that can perform translation with high translation accuracy.
近年のグローバルな情報流通、経済活動など、国境を越えた活動の広がりにより、ある言語(例えば、日本語)から別の言語(例えば、英語、中国語)へ変換する翻訳の需要が高まっている。しかし、翻訳を業者(翻訳者)に依頼すると、一般に価格が高く、また時間もかかってしまうため、コンピュータなどの機械を用いて自動的に翻訳する自動翻訳の需要が高まっている。 Due to the spread of cross-border activities such as global information distribution and economic activities in recent years, there is an increasing demand for translation from one language (eg Japanese) to another (eg English, Chinese). . However, when a contractor (translator) is requested to translate, it is generally expensive and time-consuming, so that there is an increasing demand for automatic translation using a machine such as a computer.
一般的に、自動翻訳は、文章が印刷された紙をスキャナ装置にかけてイメージ化された画像データを取得し、この画像データを文字認識(例えば、OCR(Optical Character Recognition:光学的文字認識))処理によってテキスト化した文書データに変換し、この文書データを機械翻訳のソフトウェアを用いて第1言語から第2言語に翻訳するものである。
この機械翻訳のソフトウェアは、文書解析によりテキスト化された文書データから単語単位で文字を認識させ、翻訳辞書を参照して単語の意味を導き、係り受けの関係から翻訳文を作成するといった具合で行っている。
In general, automatic translation obtains image data obtained by imaging a paper on which a document is printed with a scanner device, and character recognition (for example, OCR (Optical Character Recognition)) of the image data. The document data is converted into text data by the above-described method, and this document data is translated from the first language into the second language using machine translation software.
This machine translation software recognizes characters in word units from document data that has been converted to text by document analysis, derives the meaning of words by referring to a translation dictionary, and creates a translation sentence from a dependency relationship. Is going.
また、機械翻訳では、その翻訳精度は翻訳辞書に記憶された単語数に依存しているため、記憶容量に対応したデータ数によって機械翻訳の精度が設定されてしまう。さらに、日本語を他の言語に翻訳する場合を考えると、日本語は主語を省略して記載する場合があるため、機械翻訳では省略されている主語を補って翻訳することは困難である。
これに対し、人による翻訳は、辞書に記憶されていない新語に対しても、翻訳者の経験によって対応させて翻訳させることもでき、前後の文章から省略されている主語を補完して翻訳することも可能である。
このように、機械翻訳による翻訳精度は、文字認識による精度と機械翻訳のソフトウェアによる精度によって決まってしまうため、人による翻訳よりも精度が落ちることになる。例えば、第2言語で記載された翻訳データを第1言語に戻す場合、2度翻訳処理を行うため、得られた文書データはかなり難解な文章となってしまい、理解できなくなってしまう虞がある。
In machine translation, since the translation accuracy depends on the number of words stored in the translation dictionary, the accuracy of machine translation is set by the number of data corresponding to the storage capacity. Further, considering the case of translating Japanese into another language, Japanese may be described with the subject omitted, so that it is difficult to translate with the subject omitted in machine translation.
On the other hand, human translation can also translate new words that are not stored in the dictionary according to the experience of the translator, complementing the subject that is omitted from the previous and subsequent sentences. It is also possible.
Thus, since the translation accuracy by machine translation is determined by the accuracy by character recognition and the accuracy by machine translation software, the accuracy is lower than that by human translation. For example, when the translation data described in the second language is returned to the first language, the translation processing is performed twice, so that the obtained document data becomes a rather difficult sentence and may not be understood. .
ここで、翻訳精度を上げる技術としては、文字認識により認識した文字を翻訳する際、翻訳辞書に該当する単語が存在しない場合には、自動的に単語の修正を行う技術(特許文献1、参照)、文字列の一部或いは全部を置換したバーコードを原稿に印刷し、必要に応じて専用のバーコード読取装置を用いて、このバーコードを読取って文字列に変換する技術(特許文献2、参照)がある。 Here, as a technique for improving the translation accuracy, when a word recognized by character recognition is translated, if a corresponding word does not exist in the translation dictionary, a technique for automatically correcting the word (see Patent Document 1, Reference). ), A technique of printing a barcode in which a part or all of a character string is replaced on a document, and reading the barcode and converting it into a character string using a dedicated barcode reader as required (Patent Document 2) , See).
しかし、特許文献1が機械翻訳のソフトウェアの精度を上げるものであり、特許文献2がイメージデータからテキストデータに変換する文字認識の精度を上げるものである。しかし、何れの技術であっても、所詮人による翻訳精度には到達することができない。 However, Patent Document 1 increases the accuracy of machine translation software, and Patent Document 2 increases the accuracy of character recognition for converting image data into text data. However, with any technique, the accuracy of translation by the person concerned cannot be reached.
本発明は、前述した先行技術に鑑みてなされたもので、原文に対応した翻訳データがある場合には、その翻訳データを利用することで、翻訳精度の高い翻訳装置、翻訳システムおよび翻訳方法を提供することを目的とする。 The present invention has been made in view of the above-described prior art. When there is translation data corresponding to the original text, a translation device, a translation system, and a translation method with high translation accuracy can be obtained by using the translation data. The purpose is to provide.
前記目的を達成するために、本発明が採用する翻訳装置は、原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶した記憶手段と、識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備したことを特徴とする。 In order to achieve the above object, a translation apparatus employed by the present invention includes a storage unit that stores translation data obtained by translating an original text in association with identification information of the original text, and original text input data that is input together with the identification information. Extraction means for extracting the identification information, determination means for determining whether or not translation data corresponding to the identification information extracted by the extraction means exists in the storage means, and the determination means includes translation data Translation data output means for outputting translation data in the storage means if determined, and for outputting translation data obtained by performing translation processing on the original input data if the determination means determines that there is no translation data It was characterized by comprising.
この発明によれば、原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳を実現することができる。 According to this invention, when translation data corresponding to the original text exists in advance, it is not necessary to perform translation processing and character recognition processing by using the translation data, and translation from the original text input data to the translation data is possible. Regardless of accuracy, translation with high translation accuracy can be realized.
本発明が採用する別の翻訳装置は、原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶した記憶手段と、識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備したことを特徴とする。 Another translation apparatus employed by the present invention includes: storage means for storing at least one of original text data or translation data obtained by translating the original text in association with identification information of the original text; and identification information And extracting means for extracting the identification information from the original text input data input together with it, and determining whether the storage means has translation data or original text data corresponding to the identification information extracted by the extraction means When the determination means determines that the translation data is present, the translation data in the storage means is output. When the determination means determines that there is no translation data, the original data in the storage means is output. The translation data subjected to the translation processing is output, and if the determination means determines that neither the translation data nor the original text data exists, the original text input data Characterized in that anda translation data output means for outputting the translated data subjected to the translation processing for.
この発明によれば、原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳を実現することができる。さらに、翻訳データが存在せずに、被翻訳文となる原文に対応した原文データが存在する場合には、この原文データを翻訳して翻訳データを得ることで、文字認識処理による文字の誤認識を防止でき、ひいては翻訳精度を高める。 According to this invention, when translation data corresponding to the original text exists in advance, it is not necessary to perform translation processing and character recognition processing by using the translation data, and translation from the original text input data to the translation data is possible. Regardless of accuracy, translation with high translation accuracy can be realized. In addition, if there is original data corresponding to the original text to be translated without the translation data, the original text data is translated to obtain the translation data. Can be prevented, and as a result, the translation accuracy is improved.
上記構成において、前記判定手段により原文の識別情報に対応した翻訳データが前記記憶手段に無い場合には、前記原文データに対して翻訳処理を施した翻訳データを、前記原文の識別情報に対応した翻訳データとして前記記憶手段に更新記憶するデータ更新記憶手段を備えることが望ましい。
上記構成において、操作者の操作に応じて翻訳データを修正する翻訳データ修正手段を備え、前記データ更新記憶手段によって前記記憶手段に更新記憶される翻訳データは、前記翻訳データ修正手段によって修正されたデータであることが望ましい。
上記構成において、前記抽出手段で抽出される識別情報は、特定文字列または特定画像によって現されることが望ましい。
上記構成において、前記翻訳データ出力手段は印刷手段であり、前記印刷手段は、翻訳データの文章を印刷するとともに、翻訳データの識別情報を特定文字列または特定画像として印刷することが望ましい。
上記構成において、画像読み取り手段を備え、前記画像読み取り手段は、原文が印刷された原稿から画像を読み取って識別情報および原文入力データを生成して前記抽出手段に出力することが望ましい。
In the above configuration, when there is no translation data corresponding to the identification information of the original text in the storage means by the determination means, the translation data subjected to translation processing on the original text data corresponds to the identification information of the original text. It is desirable to provide data update storage means for updating and storing the translation data in the storage means.
In the above-described configuration, a translation data correction unit that corrects translation data according to an operation by an operator is provided, and the translation data updated and stored in the storage unit by the data update storage unit is corrected by the translation data correction unit. It is desirable to be data.
In the above configuration, it is desirable that the identification information extracted by the extraction unit is represented by a specific character string or a specific image.
In the above configuration, it is desirable that the translation data output means is a printing means, and the printing means prints the text of the translation data and prints the identification information of the translation data as a specific character string or a specific image.
In the above-described configuration, it is preferable that the image reading unit includes an image reading unit that reads an image from a document on which an original is printed, generates identification information and original text input data, and outputs the identification information and the original text input data to the extraction unit.
本発明に係る翻訳装置によれば、記憶手段に原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳文を得ることができる。しかも、記憶された翻訳データを利用する場合には、変換時間及び翻訳時間が必要ないため、短時間で正確な翻訳データを得ることができる。 According to the translation apparatus according to the present invention, when translation data corresponding to the original text exists in the storage means in advance, it is not necessary to perform translation processing and character recognition processing by using the translation data, and input the original text Regardless of the translation accuracy from data to translation data, a translated sentence with high translation accuracy can be obtained. In addition, when the stored translation data is used, since conversion time and translation time are not required, accurate translation data can be obtained in a short time.
以下、図面を参照してこの発明の実施の形態を説明する。図1は、本実施形態による翻訳システム1の全体構成を示す図である。このシステム1は、ネットワーク300を介して接続された複合機100および翻訳サーバ200を具備している。
複合機100は、コピー、スキャナ、プリンタの機能を備える。複合機100は、ネットワーク300を介して翻訳サーバ200或いはパソコン等のユーザ端末(図示せず)に接続されている。翻訳サーバ200は、翻訳処理を専門に行うサーバ装置であり、複合機100から原文に対応するデータを受信し、受信した原文に対する翻訳データを生成して返信する機能を有する。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing an overall configuration of a translation system 1 according to the present embodiment. The system 1 includes a multifunction peripheral 100 and a
The
<1.複合機100の構成>
図2は、複合機100の機能構成を示すブロック図である。この複合機100は、読み取り部110、画像形成部120、送受信部130、印刷部140およびこれらを制御する制御部150を具備する。制御部150は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
<1. Configuration of
FIG. 2 is a block diagram illustrating a functional configuration of the multifunction peripheral 100. The
送受信部130は、翻訳サーバ200等のネットワーク300に接続された外部機器(図示せず)との間でデータの授受を行う。印刷部140は、画像形成部120で形成された画像データを受けて用紙(記録材)上に画像を印刷する。
The transmission /
そして、複合機100は、読み取り部110が読み取った画像データを、送受信部130を経由して外部の装置に出力することによりスキャナ機として機能する。また、読み取り部110が読み取った画像データに応じた画像を画像印刷部140から出力することによりコピー機として機能する。さらに、複合機100は、外部からデータ送受信部130を経由して受信したデータに応じた画像を画像印刷部140において出力することにより、プリンタ機として機能する。
The
ここで、本実施形態に用いられる原稿Mは、図1に示すように、原文と、その余白の所定位置にこの原文文書IDを示すバーコードBMとが印刷され、複合機100から出力される翻訳原稿Tには、翻訳文と、その余白の所定位置にその翻訳文書IDを示すバーコードBTが印刷される。
Here, as shown in FIG. 1, the original M used in the present embodiment is printed with an original text and a barcode BM indicating the original text document ID at a predetermined position in the margin, and is output from the
本実施形態による複合機100の制御部150は、各部に以下の処理を行わせる。
まず、制御部150は、利用者が図示しない入力指示装置から原稿Mの翻訳対象言語の指示を受ける。次に、読み取り部110が、原稿Mを読み取ることにより、この原稿M上に印刷された原文およびバーコードBMから原文画像データおよび識別情報の画像データを取得し、送受信部130が、この原文画像データおよび翻訳対象言語を外部の翻訳サーバ200に送信する。
一方、後述する処理を経て得られた翻訳データが翻訳サーバ200から送信されると、この翻訳データを送受信部130が受信すると、画像形成部120が、テキスト形式の翻訳データをイメージ形式の翻訳画像データに変換する。この際、翻訳データにバーコードを印刷するための識別情報を現すデータが付加されている場合には、変換したバーコードの画像データを翻訳画像データに付加する。そして、印刷部140が、この翻訳画像データを用紙に印刷して翻訳原稿Tを出力する。これにより、利用者は、翻訳対象語に翻訳された翻訳原稿Tを取得する。
The
First, the
On the other hand, when translation data obtained through the processing described below is transmitted from the
<2.翻訳サーバ200の構成>
図3は、翻訳サーバ200の機能構成を示すブロック図である。翻訳サーバ200は、文書データベース210が接続された文書管理部220,翻訳辞書部230,送受信部240およびこれらを制御する制御部250を具備する。制御部250は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
<2. Configuration of
FIG. 3 is a block diagram illustrating a functional configuration of the
送受信部240は、複合機100等のネットワーク300に接続された外部機器(図示せず)との間でデータの授受を行う。翻訳辞書部230は、制御部250からの指示に基づき、原文データを翻訳対象言語に翻訳する際に用いられるものであり、種々の言語に対する辞書を備えている。
The transmission /
文書データベース210には、テキスト形式の文書データ(ファイル)が文書ID毎に対応付けて格納されている。この文書データの文書データベース210への格納処理は、後述する図5のステップS8における処理のみではなく、複合機100のスキャナ機能、コピー機能、プリンタ機能を動作させた際、或いは利用者の操作処理された際に行われる。原稿の文書データ(原文データ或いは翻訳データ)を文書IDと共に文書データベース210に格納させ、自動的或いは利用者の操作によって文書データ管理部220に翻訳データの文書IDと文書名を記憶更新させる。
In the
文書管理部220は、文書データベース210に格納されている文書データを管理するもので、図4(a)に示すような複数のデータテーブルが基準となる文書ID毎に記憶されている。このデータテーブルには、第1言語版の文書ID,文書名(ファイル名)、第2言語版の文書ID,文書名(ファイル名)、第3言語版の文書ID,文書名(ファイル名)が、文書データベース210に格納されている文書データに対応付けて書き込まれる。例えば、このデータテーブルには、日本語の○○指示書(文書ID;001−1)、英語の○○指示書(文書ID;001−2),中国語の○○指示書(文書ID;001−3)といったように記憶される。この例では、初めの3文字を共通の文字列にして各文書が関連あることを示し、添え字により文書の記載言語形式(第1言語、第2言語、第3言語)を示している。
The
図4(a)のデータテーブルについて説明すると、原文が日本語版の文書であった場合には、この文書の文書IDは“001−1”となり、この文書ID“001−1”に対応した文書は、英語版の文書(文書ID“001−2”)と中国語版の文書(文書ID“001−3”)となる。
また、原文が英語版の文書であった場合には、この文書の文書IDは“001−2”となり、この文書ID“001−2”に対応した文書は、日本語版の文書(文書ID“001−1”)と中国語版の文書(文書ID“001−3”)となる。
さらに、原文が中国語版の文書であった場合には、この文書の文書IDは“001−3”となり、この文書ID“001−3”に対応した文書は、日本語版の文書(文書ID“001−1”)と英語版の文書(文書ID“001−2”)となる。
さらに、図4(a)の場合には、このようなデータテーブルがn個存在する。
The data table of FIG. 4A will be described. When the original text is a Japanese version document, the document ID of this document is “001-1”, which corresponds to this document ID “001-1”. The document is an English version document (document ID “001-2”) and a Chinese version document (document ID “001-3”).
If the original document is an English version document, the document ID of this document is “001-2”, and the document corresponding to this document ID “001-2” is a Japanese version document (document ID). “001-1”) and a Chinese version document (document ID “001-3”).
Further, if the original text is a Chinese version document, the document ID of this document is “001-3”, and the document corresponding to this document ID “001-3” is a Japanese version document (document ID “001-1”) and an English version document (document ID “001-2”).
Further, in the case of FIG. 4A, there are n such data tables.
一方、図4(b)のデータテーブルは、「日本語版」の文書が文書データベース210に格納されていない場合である。この場合であっても、原文の文書IDが“001−1”であれば、共通の基本名を検索語としてこのデータベースを抽出でき、文書データベースに英語版の文書(文書ID“001−2”)と中国語版の文書(文書ID“001−3”)が格納されている。
また、文書管理部220には、1つの基準となる文書(原文)の文書IDに対して1つのデータテーブルが形成されるため、文書管理部220では、複数のデータテーブルを備えることになる。
この図4では、便宜上、日本語版の文書ID“001−1”を原文の文書IDとしているが、抽出された文書IDが“001−2”の場合には、英語版の文書が原文となり、どの文書であっても抽出された文書IDに対応した文書が原文となる。
On the other hand, the data table of FIG. 4B is a case where a “Japanese version” document is not stored in the
Further, since one data table is formed in the
In FIG. 4, for convenience, the Japanese document ID “001-1” is used as the original document ID. However, when the extracted document ID is “001-2”, the English document is the original document. The document corresponding to the extracted document ID is the original text for any document.
本実施形態による翻訳サーバ200の制御部250は、以下に述べる翻訳処理を行う。
以下、図5に示す流れ図に基づき、翻訳サーバ200の動作について説明する。
この翻訳サーバ200は、複合機100から送信された原文画像データおよびバーコードの画像データを送受信部240で受信することによって動作を開始するものである。
The
The operation of the
The
複合機100からの原文画像データが送受信部240で受信されると、制御部250は、イメージ形式の原文画像データを文字認識処理(例えば、OCR処理)してテキスト形式のデータに変換する。この際、原文画像データにバーコードを示す画像データがあるため、このバーコードが文字データに変換され、このバーコードの意味する情報、即ち文書IDを抽出する(ステップS1)。
When the original image data from the
次に、制御部250は、ステップS1の処理により、バーコードによる文書IDが抽出されたか否かを判定する(ステップS2)。制御部250は、文書IDが抽出された場合には(ステップS2;YES)、ステップS3に移行する。
Next, the
制御部250は、抽出された文書IDを検索キーとして、文書データ管理部220の文書IDとを照合させることにより、文書データベース210に格納されている文書データおよび翻訳データを検索して検索結果を得る(ステップS3)。
図4(a)のデータテーブルの例では、抽出された原文文書IDが“001−1”である場合には、初めの3文字を検索キーとして検索することにより、日本語の文書データを始め、英語版の翻訳データ、中国語版の翻訳データが文書データベース210に格納されていることを検索結果として得る。
The
In the example of the data table in FIG. 4A, when the extracted original document ID is “001-1”, the first three characters are searched as a search key to start Japanese document data. As a search result, the English translation data and the Chinese translation data are stored in the
制御部250は、検索結果から文書データベース210に翻訳データが有るか否かを判定する(ステップS4)。翻訳対象語の翻訳データが文書データベース210に格納されていた場合には(ステップS4;YES)、文書IDに対応した翻訳データを読み出し、この翻訳データを記憶エリア(図示せず)に一時的に記憶する(ステップS5)。
翻訳データの有無は、例えば、利用者が要求する翻訳対象言語が英語の場合には、検索結果から、原文文書ID“001−1”に対して英語版の翻訳データの文書ID“001−2”があるため、英語版の翻訳データが文書データベース210に格納されていることが分かる。
The
For example, if the translation target language requested by the user is English, the document ID “001-2” of the English version of the translation data with respect to the original document ID “001-1” is obtained from the search result. Therefore, it can be seen that the English translation data is stored in the
一方、ステップS4で、翻訳データが文書データベース210に格納されていない場合には(ステップS4;NO)、制御部250は検索結果から文書データベース210に原文データが有るか否かを判定する(ステップS6)。原文データが文書データベース210に格納されていた場合には(ステップS6;YES)、文書IDに対応した原文データを読み出し、この原文データに基づいた翻訳処理を翻訳辞書部230を利用して行い、この処理で得られた翻訳データを記憶エリアに一時的に記憶する(ステップS7)。
On the other hand, when the translation data is not stored in the
さらに、制御部250は、ステップS7で得られた翻訳データを文書データベース210に格納すると共に、文書データ管理部220のデータテーブルに原文の文書IDの添え字を変えた文書IDを翻訳文の文書名(ファイル名)に対応付けて加えることによりデータベースを更新する(ステップS8)。
Further, the
また、ステップS2の判定処理において受信した原文画像データから文書IDが抽出されなかった場合(ステップS2;NO)、或いはステップS6の判定処理において文書データベース210に原文データが格納されていない場合には(ステップS6;NO)、制御部250は、原文画像データをテキスト化したデータに対して翻訳処理を行い、この処理で得られた翻訳データを記憶エリアに一時的に記憶する(ステップS9)。
なお、この処理後に、文書データベース210に翻訳前の原文データを文書IDと共に格納し、文書データ管理部220に原文データを文書IDに対応した新たなデータテーブルを作成するようにしてもよい。
Further, when the document ID is not extracted from the received original text image data in the determination process of step S2 (step S2; NO), or when the original text data is not stored in the
After this processing, the original text data before translation may be stored in the
そして、制御部250では、3通りの処理のうち何れかの処理によって得られた翻訳データを送受信部240を介して複合機100に送信する(ステップS10)。この送信される翻訳データには、翻訳文を現すデータと共に、この翻訳文を示す文書IDが含まれている。
Then, the
翻訳データを受信した複合機100では、前述した如く、複合機100の制御部150は、画像形成部120により、テキスト形式の翻訳データを翻訳データの文書IDを示すバーコードBTを含むイメージ形式の翻訳画像データに変換させる。そして、印刷部140で、この翻訳画像データの翻訳文およびバーコードを用紙に印刷させて翻訳原稿Tを出力する(図1、参照)。
In the
このように、本実施形態による翻訳システム1では、予め翻訳サーバ200の文書データベース210に原文に対応した翻訳文を示す翻訳データが格納されている場合には、その翻訳データを複合機100に送信することにより、OCR処理や翻訳処理を省略でき、翻訳精度の高い翻訳文を利用者に提供することができる。しかも、翻訳処理を行わずに済むため、翻訳時間を大幅に短縮することが出来る。
As described above, in the translation system 1 according to the present embodiment, when the translation data indicating the translation corresponding to the original sentence is stored in the
また、翻訳データが文書データベース210に格納されていない場合であっても、原文の文書データが文書データベース210に格納されている場合には、この文書データを翻訳処理することにより、OCR処理を行わずに済むため、OCR処理による文字の誤認識を防止でき、原文をOCR処理および翻訳処理を行って得た翻訳文に比べて誤翻訳を低減することができる。
以上のように、本実施形態による翻訳システム1は、利用者に対して精度の高い翻訳文を提供することが可能となる。
Even if the translation data is not stored in the
As described above, the translation system 1 according to the present embodiment can provide a translated sentence with high accuracy to the user.
以上、本発明の実施形態について説明したが、本発明は上述の実施形態に限定されるものではなく、種々の態様が可能である。
前記実施形態では、複合機100の読み取り部110で、読み取った原文画像データを翻訳サーバ200に送信するようにしたが、本発明は、原稿の所定位置にバーコードが印刷されているのであれば、原稿画像データからバーコードの識別IDのみを読み取り、翻訳サーバ200に送信するようにしても良い。これにより、バーコードのデータ容量に比べて大容量となる原文画像データを送信することがなくなり、ネットワーク300を経由しての送信時間を大幅に短縮できる。
翻訳サーバ200の文書データベース210に翻訳データおよび原文データが格納されていない場合、原文画像データを再度複合機100から翻訳サーバ200に送信すればよい。
また、複合機100の読み取り部110で原稿Mを読み取った段階で、OCR処理を施してイメージ形式の原文画像データからテキスト形式の原文入力データに変換してもよい。但し、この原文入力データと予め文書データベース210に格納されている文書データとは異なったものである。
As mentioned above, although embodiment of this invention was described, this invention is not limited to the above-mentioned embodiment, A various aspect is possible.
In the above-described embodiment, the read original image data is transmitted to the
When translation data and original text data are not stored in the
Alternatively, when the document M is read by the
前記本実施形態では、複合機100と翻訳サーバ200とをネットワーク300で接続する翻訳システムとして説明したが、本発明はこれに限らず、複合機100内に翻訳サーバ200の機能を備え、複合機100を翻訳装置してもよい。このような複合機100は、複合機1台で仕事をサポートできる比較的小さな会社への適用が好適である。この際、文書データベース210に格納される文書データは、図5のステップS8による記憶更新のみでなく、複合機100のスキャナ機能、コピー機能、プリンタ機能を動作させた際に、文書データベース210に格納させてもよい。この際、スキャナ・コピー・プリントされる原稿の文書データを文書IDと共に文書データベース210に格納すると共に、文書データ管理部220に翻訳データの文書IDと文書名を記憶更新するようにすればよい。
In the present embodiment, the translation system in which the multifunction peripheral 100 and the
前記実施形態のデータテーブルでは、図4に示すように、共通の文字列を有する文書IDとして文書データを関連付けたが、本発明はこれに限らず、異なった文書IDであっても、1つのデータテーブルで関連付けられるようにすればよい。
本発明は、翻訳可能な言語は、第1〜第3言語の3つに限らず、2言語,4言語以上の言語に対応できることは勿論である。
In the data table of the embodiment, as shown in FIG. 4, document data is associated as a document ID having a common character string. However, the present invention is not limited to this, and even with different document IDs, What is necessary is just to associate with a data table.
In the present invention, the translatable languages are not limited to three of the first to third languages, and it is needless to say that the present invention can deal with two languages, four languages or more.
前記実施形態では、原文の文書情報を文書IDとしてこの文書IDをバーコード化する構成としたが、本発明はこれに限らず、指定領域に存在する文字列或いは文書IDを書き込んだICタグ等をバーコードの代わりに用いてもよい。例えば、文字列の場合には、用紙に印刷された文章の所定領域の部分に存在する文字列を文書ID或いは文書名とし、この所定領域をOCR処理することにより文書ID或いは文書名を原文の識別情報として抽出するようにしてもよい。 In the above embodiment, the original document information is used as a document ID, and the document ID is converted into a barcode. However, the present invention is not limited to this, and an IC tag or the like in which a character string existing in a designated area or a document ID is written. May be used instead of the barcode. For example, in the case of a character string, a character string existing in a predetermined area portion of a sentence printed on paper is used as a document ID or a document name, and this predetermined area is subjected to OCR processing so that the document ID or document name is converted into the original text. You may make it extract as identification information.
また、原稿に利用者が注釈や付箋等のアノテーションを記載している場合には、読み取り部110で原稿を読み取る際に、アノテーションに記載された文字とその位置情報を算出し、翻訳サーバ200から翻訳データが返信された場合には、この翻訳データ、アノテーションの位置情報に基づき、印刷部140が翻訳文と共に、翻訳されたアノテーションを元の原稿と同じ位置に印刷させる。
In addition, when the user describes annotations such as annotations and sticky notes on the manuscript, when the manuscript is read by the
ステップS8で文書データベース210に記憶更新される翻訳データは、翻訳サーバ200による機械翻訳による翻訳データを格納させるようにしたが、ここでは格納させずに、この翻訳データに基づき翻訳者が補正した翻訳データ、或いは翻訳者が原文の原稿から翻訳した翻訳データを文書データベース210に新たに格納させるようにしてもよい。
The translation data stored and updated in the
前記実施形態では、複合機100および翻訳サーバ200で翻訳システム1を構成するものとして述べたが、個人的なクライアント端末(例えば、パーソナルコンピュータ)と翻訳サーバ200とをネットワーク300を介して接続した翻訳システムとしてもよい。
このシステムでは、クライアント端末の表示部に、テキスト形式の翻訳データ或いは原文データと翻訳データとを比較させながら表示させることも可能となる。さらに、データを表示部に表示し、マウス等の領域指定手段によって文章領域を指定し、この文章領域に対応した翻訳文を表示させる等、種々の使用方法が適用できる。
In the above embodiment, the translation system 1 is composed of the multifunction peripheral 100 and the
In this system, the translation data in the text format or the original text data and the translation data can be displayed on the display unit of the client terminal while being compared. Furthermore, various usage methods such as displaying data on a display unit, designating a text area by an area designating means such as a mouse, and displaying a translation corresponding to the text area can be applied.
なお、図1においては図面が煩雑になるのを防ぐため、複合機100および翻訳サーバ200はそれぞれ1台のみ図示されているが、翻訳システム1は、複合機100および翻訳サーバ200を複数有してもよいことは勿論である。
In FIG. 1, only one
また、上述の実施形態においては、複合機100は制御部150が、翻訳サーバ200は制御部250がそれぞれプログラムを実行することにより実現されたが、この一部または全部をハードウェアで実現する構成としてもよい。
In the above-described embodiment, the
1…翻訳システム、100…複合機、110…読み取り部、120…画像形成部、130…送受信部、140…印刷部、150…制御部、200…翻訳サーバ、210…文書データベース、220…文書データ管理部、230…翻訳辞書部、240…送受信部、250…制御部、300…ネットワーク。
DESCRIPTION OF SYMBOLS 1 ...
Claims (11)
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備した
ことを特徴とする翻訳装置。 Storage means for storing translation data obtained by translating the original text in association with the identification information of the original text;
Extracting means for extracting the identification information from the original text input data input together with the identification information;
A determination unit for determining whether or not the storage unit has translation data corresponding to the identification information extracted by the extraction unit;
When the determination means determines that there is translation data, the translation data in the storage means is output, and when the determination means determines that there is no translation data, the translation processing is performed on the original input data. A translation data output means for outputting data.
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備した
ことを特徴とする翻訳装置。 Storage means for storing at least one of the original text data or the translation data obtained by translating the original text in association with the identification information of the original text;
Extracting means for extracting the identification information from the original text input data input together with the identification information;
Determining means for determining whether translation data or original text data corresponding to the identification information extracted by the extracting means exists in the storage means;
When the determination unit determines that there is translation data, the translation data in the storage unit is output, and when the determination unit determines that there is no translation data, a translation process is performed on the original text data in the storage unit. A translation data output means for outputting the translation data subjected to the translation process, and further, when the judgment means judges that neither the translation data nor the original text data exists, the translation data subjected to translation processing on the original text input data; A translation apparatus comprising:
前記判定手段により原文の識別情報に対応した翻訳データが前記記憶手段に無い場合には、前記原文データに対して翻訳処理を施した翻訳データを、前記原文の識別情報に対応した翻訳データとして前記記憶手段に更新記憶するデータ更新記憶手段を備える
ことを特徴とする翻訳装置。 The translation apparatus according to claim 1 or 2,
When there is no translation data corresponding to the identification information of the original text in the storage means by the determination means, the translation data subjected to translation processing on the original text data is used as the translation data corresponding to the identification information of the original text. A translation apparatus comprising data update storage means for updating and storing in a storage means.
操作者の操作に応じて翻訳データを修正する翻訳データ修正手段を備え、
前記データ更新記憶手段によって前記記憶手段に更新記憶される翻訳データは、前記翻訳データ修正手段によって修正されたデータである
ことを特徴とする翻訳装置。 The translation device according to claim 3, wherein
Translation data correction means for correcting the translation data according to the operation of the operator is provided.
The translation apparatus, wherein the translation data updated and stored in the storage means by the data update storage means is data corrected by the translation data correction means.
前記抽出手段で抽出される識別情報は、特定文字列または特定画像によって現される
ことを特徴とする翻訳装置。 The translation apparatus according to claim 1 or 2,
The identification information extracted by the extraction means is represented by a specific character string or a specific image.
前記翻訳データ出力手段は印刷手段であり、
前記印刷手段は、翻訳データの文章を印刷するとともに、翻訳データの識別情報を特定文字列または特定画像として印刷する
ことを特徴とする翻訳装置。 The translation apparatus according to claim 1 or 2,
The translation data output means is a printing means,
The translation device prints a sentence of translation data and prints identification information of the translation data as a specific character string or a specific image.
画像読み取り手段を備え、
前記画像読み取り手段は、原文が印刷された原稿から画像を読み取って識別情報および原文入力データを生成して前記抽出手段に出力する
ことを特徴とする翻訳装置。 The translation apparatus according to claim 1 or 2,
Image reading means,
The translation apparatus, wherein the image reading unit reads an image from a document on which an original text is printed, generates identification information and original text input data, and outputs the identification information and the original text input data to the extraction unit.
前記サーバ装置が、
原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を備え、
前記端末装置が、
前記原文入力データおよび識別情報を生成する画像読み取り手段と、
前記翻訳データ出力手段によって得られる翻訳データを表示或いは印刷するデータ表示手段と、を備えた
ことを特徴とする翻訳システム。 A terminal device and a server device that communicates with the terminal device via a network;
The server device is
Storage means for storing translation data obtained by translating the original text in association with the identification information of the original text;
Extracting means for extracting the identification information from the original text input data input together with the identification information;
A determination unit for determining whether or not the storage unit has translation data corresponding to the identification information extracted by the extraction unit;
When the determination means determines that there is translation data, the translation data in the storage means is output, and when the determination means determines that there is no translation data, the translation processing is performed on the original input data. Translation data output means for outputting data,
The terminal device is
Image reading means for generating the original text input data and identification information;
A translation system comprising: data display means for displaying or printing translation data obtained by the translation data output means.
前記サーバ装置が、
原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を備え、
前記端末装置が、
前記原文入力データおよび識別情報を生成する画像読み取り手段と、
前記翻訳データ出力手段によって得られる翻訳データを表示或いは印刷するデータ表示手段と、を備えた
ことを特徴とする翻訳システム。 A terminal device and a server device that communicates with the terminal device via a network;
The server device is
Storage means for storing at least one of the original text data or the translation data obtained by translating the original text in association with the identification information of the original text;
Extracting means for extracting the identification information from the original text input data input together with the identification information;
Determining means for determining whether translation data or original text data corresponding to the identification information extracted by the extracting means exists in the storage means;
When the determination unit determines that there is translation data, the translation data in the storage unit is output, and when the determination unit determines that there is no translation data, a translation process is performed on the original text data in the storage unit. A translation data output means for outputting the translation data subjected to the translation process, and further, when the judgment means judges that neither the translation data nor the original text data exists, the translation data subjected to translation processing on the original text input data; With
The terminal device is
Image reading means for generating the original text input data and identification information;
A translation system comprising: data display means for displaying or printing translation data obtained by the translation data output means.
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出ステップと、
前記抽出ステップにより抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定ステップと、
前記判定ステップが翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定ステップが翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力ステップと、を具備した
ことを特徴とする翻訳方法。 A storage step of storing the translation data obtained by translating the original text in the storage means in association with the identification information of the original text;
An extraction step of extracting the identification information from the original text input data input together with the identification information;
A determination step of determining whether or not translation data corresponding to the identification information extracted by the extraction step exists in the storage unit;
When the determination step determines that there is translation data, the translation data in the storage means is output, and when the determination step determines that there is no translation data, the translation processing is performed on the original input data. A translation data output step for outputting data.
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出ステップと、
前記抽出ステップにより抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定ステップと、
前記判定ステップが翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定ステップが翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定ステップが翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力ステップと、を具備した
ことを特徴とする翻訳方法。 A storage step of storing at least one of the original text data or the translation data obtained by translating the original text in the storage means in association with the identification information of the original text;
An extraction step of extracting the identification information from the original text input data input together with the identification information;
A determination step of determining whether translation data or original text data corresponding to the identification information extracted by the extraction step exists in the storage unit;
When the determination step determines that there is translation data, the translation data in the storage means is output, and when the determination step determines that there is no translation data, a translation process is performed on the original text data in the storage means. A translation data output step that outputs the translation data that has been subjected to a translation process when the determination step determines that neither the translation data nor the original text data exists. A translation method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236980A JP2007052613A (en) | 2005-08-17 | 2005-08-17 | Translation device, translation system and translation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236980A JP2007052613A (en) | 2005-08-17 | 2005-08-17 | Translation device, translation system and translation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007052613A true JP2007052613A (en) | 2007-03-01 |
Family
ID=37917023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005236980A Pending JP2007052613A (en) | 2005-08-17 | 2005-08-17 | Translation device, translation system and translation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007052613A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012185741A (en) * | 2011-03-07 | 2012-09-27 | Ricoh Co Ltd | Image formation device, information processor, image processing system, and program |
WO2015045680A1 (en) * | 2013-09-27 | 2015-04-02 | シャープ株式会社 | Translation device and control program therefor |
JP2016143158A (en) * | 2015-01-30 | 2016-08-08 | パナソニックIpマネジメント株式会社 | Information provision system, information provision method, and information acquisition program |
JP2017204236A (en) * | 2016-05-13 | 2017-11-16 | 株式会社東芝 | Translated sentence providing device, user terminal device and program |
-
2005
- 2005-08-17 JP JP2005236980A patent/JP2007052613A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012185741A (en) * | 2011-03-07 | 2012-09-27 | Ricoh Co Ltd | Image formation device, information processor, image processing system, and program |
WO2015045680A1 (en) * | 2013-09-27 | 2015-04-02 | シャープ株式会社 | Translation device and control program therefor |
JP2015069366A (en) * | 2013-09-27 | 2015-04-13 | シャープ株式会社 | Translation device and control program therefor |
JP2016143158A (en) * | 2015-01-30 | 2016-08-08 | パナソニックIpマネジメント株式会社 | Information provision system, information provision method, and information acquisition program |
JP2017204236A (en) * | 2016-05-13 | 2017-11-16 | 株式会社東芝 | Translated sentence providing device, user terminal device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3213197B2 (en) | Image processing apparatus and control method thereof | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
JP2006252049A (en) | Translation system, translation method and program | |
JP2011100356A (en) | Apparatus, method and computer program for creating document image | |
US20070242282A1 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
JP2006276911A (en) | Electronic equipment and program | |
JP2008146605A (en) | Image processor and its control method | |
JP2008059157A (en) | Document confirmation support system, document confirmation support device and program | |
JP2007025980A (en) | Information system, information method, server device, information device, and information designation program | |
US9529792B2 (en) | Glossary management device, glossary management system, and recording medium for glossary generation | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP2006331258A (en) | Translation device, image processor, program, and recording medium | |
JP2007052613A (en) | Translation device, translation system and translation method | |
JP2007233671A (en) | Image processing apparatus, image processing method and image processing program | |
JP4797507B2 (en) | Translation apparatus, translation system, and program | |
JP4576211B2 (en) | Document information retrieval system | |
JP2009223363A (en) | Document processor and document processing program | |
JP2007011683A (en) | Document management support device | |
WO1997004409A1 (en) | File searching device | |
US8031352B2 (en) | Apparatus and method for processing received data | |
JP2006276904A (en) | Facsimile device | |
JP4872285B2 (en) | Document management apparatus, document management system, and document management method | |
JP2001326804A (en) | Image processing unit and image processing system | |
JP2010146143A (en) | Document processing apparatus and program | |
JP2008118489A (en) | Facsimile distribution system and facsimile device |