JP2005011261A - 翻訳装置及び翻訳システム - Google Patents

翻訳装置及び翻訳システム Download PDF

Info

Publication number
JP2005011261A
JP2005011261A JP2003177241A JP2003177241A JP2005011261A JP 2005011261 A JP2005011261 A JP 2005011261A JP 2003177241 A JP2003177241 A JP 2003177241A JP 2003177241 A JP2003177241 A JP 2003177241A JP 2005011261 A JP2005011261 A JP 2005011261A
Authority
JP
Japan
Prior art keywords
translation
image
translated
character string
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003177241A
Other languages
English (en)
Inventor
Takashi Shinozaki
貴史 篠崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003177241A priority Critical patent/JP2005011261A/ja
Publication of JP2005011261A publication Critical patent/JP2005011261A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】元原稿のレイアウトを踏襲したまま文字列のみを翻訳した画像を得る。
【解決手段】翻訳したい元原稿を読み取る読み取り部11と、読み取った画像から文字列を抽出するOCRエンジン部12と、抽出した文字列から特定の言語に翻訳する翻訳エンジン部13と、読み取った画像から文字列以外の画像と翻訳された文字列を合成させる画像処理部14とを備え、翻訳したい元原稿と同じ原稿レイアウトのまま、文字列の部分のみが翻訳された画像を出力する機能を有する翻訳装置1。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、スキャナを使用した翻訳装置及び翻訳システムに関するものである。
【0002】
【従来の技術】
翻訳したい元原稿を読み取る読み取り部(スキャナ)を使用した翻訳装置に関連して、特許文献1〜3に記載された技術がある。
【特許文献1】特開2002−132765公報
【特許文献2】特開平07−044564号公報
【特許文献3】特開平05−266073号公報
【0003】
【発明が解決しようとする課題】
従来のスキャナ機能を持つ翻訳装置は、読み取った画像から文字列を抽出して翻訳するのみであり、元の原稿のレイアウトによっては翻訳後の画像が見にくく(読みにくく)なるおそれがある。
本発明の翻訳装置は、元原稿のレイアウトを踏襲したまま文字列のみを翻訳した画像を得ることを目的とする。また本発明の翻訳システムは、翻訳装置の記憶装置の容量を節約し、また辞書サーバー上の資源をシェアすることができるようにするのを目的とする。
【0004】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、翻訳したい元原稿を読み取る読み取り部と、読み取った画像から文字列を抽出するOCRエンジン部と、抽出した文字列から特定の言語に翻訳する翻訳エンジン部と、読み取った画像から文字列以外の画像と翻訳された文字列を合成させる画像処理部とを備え、翻訳したい元原稿と同じ原稿レイアウトのまま、文字列の部分のみが翻訳された画像を出力する機能を有する翻訳装置を最も主要な特徴とする。
請求項2記載の発明は、請求項1記載の翻訳装置と辞書サーバーがネットワーク接続されている翻訳システムを最も主要な特徴とする。
請求項3記載の発明は、請求項1記載の翻訳装置と端末がネットワーク接続されている翻訳システムを最も主要な特徴とする。
請求項4記載の発明は、請求項1記載の翻訳装置において、翻訳内容(翻訳過程、翻訳結果等)を表示する表示部と、翻訳の補正を行う操作パネルとを備えた翻訳装置を主要な特徴とする。
請求項5記載の発明は、請求項1記載の翻訳装置において、翻訳結果(翻訳過程、翻訳内容)を音声で伝える音声出力部を備えた翻訳装置を最も主要な特徴とする。
【0005】
【発明の実施の形態】
以下、図面により本発明の実施の形態を詳細に説明する。
図1は本発明の実施の形態に係る翻訳装置の機能ブロック図である。翻訳装置1は、翻訳したい原稿を読み取る読み取り部11と、読み取った画像から文字列を抽出するOCRエンジン部12と、抽出した文字列を翻訳する翻訳エンジン部13と、画像から文字列を除いた画像を作成すると共に翻訳された文字列を画像と合成する画像処理部14とで構成されている。
本発明では、例えばユーザーが英語の説明書を日本語で読みたいときに、そのページを読み取り部11から取り込むと、その元の原稿と同じレイアウトのまま英語の文章だけ翻訳されて出力される。
図2は図1に示す翻訳装置における制御動作を示すフローチャートである。読み取り部11で読み取った(S1)画像からOCRエンジン部12で文字列を抜き出し(S2)、文字の色や文字サイズや位置などを抽出して記憶しておく(S3)。一方、元の画像からは文字列の部分だけを切り抜いて白埋め(背景と同色)した画像を画像処理部14が作成する(画像Aとする)(S4)。
抽出された文字列から翻訳エンジン部13が内蔵している辞書を使用して翻訳を行う(S5)。翻訳を行った文字列を、記憶しておいた文字色や文字サイズに変換し(S6)画像Aと元のレイアウトの通りに合成して(S7)、合成画像を出力する(S8)。
図3は図2のフローに基づいて元の原稿から翻訳済みの合成画像が形成される様子を示す図である。Manualが説明書に翻訳されている。
読み取り部11で読み取った画像は、文字列と、文字列を削除した画像に分離され、文字列は翻訳を受けたあとで、文字列を削除した画像と合成されて、元の原稿と同様のレイアウトを備えた翻訳文が完成される。
【0006】
図4は本発明の第1の実施の形態に係る翻訳システムの構成図である。本翻訳システムは、複数の翻訳装置1と辞書サーバー2がネットワーク3で接続されることで構成されている。
翻訳処理を行うためには膨大な辞書データが必要となり、翻訳が可能な言語数が増えれば増えるほど記憶装置の容量も多くなる。そこでネットワーク3などで接続された辞書サーバー2内にその辞書データを保存しておくことによって、翻訳装置1には記憶装置が不要となる。また、この辞書サーバー2には複数台の翻訳装置1が接続されることで、辞書データをシェアすることができる。
膨大な量の辞書データを各翻訳装置1ごとに持つ必要がなくなるため、翻訳装置1自体のコストを削減することも可能となる。また、翻訳を行うことによって辞書を学習させることができ、複数台の翻訳装置1で翻訳することで、その業務に特化した辞書を効率よく学習させることができる。
図5は本発明の第2の実施の形態に係る翻訳システムの構成図である。本翻訳システムは、翻訳装置1とパソコン4がネットワーク3で接続されることで構成されている。翻訳装置1で行った翻訳が間違っていたときに、ユーザーがパソコン4を利用して、翻訳状態をプレビューしながら適切な翻訳に修正していくことができる。そのままユーザーが画像をパソコン4に引き取ると翻訳が修正された画像となっている。
図6は本発明の実施の形態に係る翻訳装置における外観構成の第1の具体例を示す斜視図である。端末(パソコン)がない環境でもユーザーが自由に翻訳の修正をできるように、装置内の翻訳の状況を表示する表示部5と、翻訳を修正するための操作パネル6を翻訳装置1の本体手前面に設ける。この翻訳装置1を使用することで、元原稿と同じレイアウトのまま、文章部分だけをユーザーの指示の元、正しく翻訳された画像が作成できる。
図7は本発明の実施の形態に係る翻訳装置における外観構成の第2の具体例を示す斜視である。翻訳装置1の本体手前面に音声出力部7を設け、翻訳内容を音声出力部7から音声で出力しながら確認することができるようにする。このため、翻訳の間違いを見つけやすくなっている。ユーザーが間違いを見つけた場合には、端末や操作パネルから修正を行うことができる。
【0007】
【発明の効果】
以上説明したように、請求項1では、文字列以外の図や表などを含んだ原稿において、元のレイアウトそのままに文章の部分のみが翻訳されるため、翻訳後の画像が読みやすくなる。また、翻訳したデータと読み取った画像が一緒になっているため、無駄なファイルを作成したり翻訳部分と画像部分を別々に印刷する必要がなくなるため、資源の節約につながる。
請求項2では、翻訳装置それぞれに翻訳用の膨大な辞書データを持つ記憶装置が不要となるため、コストの削減が可能となる。また、辞書サーバーを共有することにより資源の無駄が省ける。さらに、接続している翻訳装置それぞれから辞書を学習させることができ、その使用している場所に特化した辞書の学習を効率よく行うことができる。
請求項3では、画像を引き取るパソコン等の端末から装置の処理内容をプレビューすることによりユーザーが翻訳内容を自由に補正することができる。このため翻訳された画像を再びユーザーが修正する必要がなく一回の操作で翻訳された画像が作成できるので、無駄な作業を減らすことができる。
請求項4では、翻訳装置本体に表示部を持つことにより翻訳結果をユーザーが確認しながら翻訳が可能となる。ユーザーは別途端末を用意する必要がないため、無駄な投資を避けることができる。
請求項5では、翻訳内容を音声で出力するため、翻訳装置が発する翻訳された音声を聞きながらユーザーは翻訳の内容を確認することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る翻訳装置の機能ブロック図。
【図2】図1に示す翻訳装置における制御動作を示すフローチャート。
【図3】図2のフローに基づいて元の原稿から翻訳済みの合成画像が形成される様子を示す図。
【図4】本発明の第1の実施の形態に係る翻訳システムの構成図。
【図5】本発明の第2の実施の形態に係る翻訳システムの構成図。
【図6】本発明の実施の形態に係る翻訳装置における外観構成の第1の具体例を示す斜視図。
【図7】本発明の実施の形態に係る翻訳装置における外観構成の第2の具体例を示す斜視図。
【符号の説明】
1 翻訳装置
11 読み取り部
12 OCRエンジン部
13 翻訳エンジン部
14 画像処理部

Claims (5)

  1. 翻訳したい元原稿を読み取る読み取り部と、読み取った画像データ中から文字列を抽出するOCRエンジン部と、抽出した文字列を特定の言語に翻訳する翻訳エンジン部と、読み取った画像データ中の文字列以外の画像と翻訳された文字列とを合成させる画像処理部とを備え、翻訳したい元原稿と同じ原稿レイアウトのまま、文字列の部分のみが翻訳された画像を出力する機能を有することを特徴とする翻訳装置。
  2. 請求項1記載の翻訳装置と辞書サーバーがネットワーク接続されていることを特徴とする翻訳システム。
  3. 請求項1記載の翻訳装置と端末がネットワーク接続されていることを特徴とする翻訳システム。
  4. 請求項1記載の翻訳装置において、翻訳内容を表示する表示部と、翻訳の補正を行う操作パネルとを備えたことを特徴とする翻訳装置。
  5. 請求項1記載の翻訳装置において、翻訳結果を音声で伝える音声出力部を備えたことを特徴とする翻訳装置。
JP2003177241A 2003-06-20 2003-06-20 翻訳装置及び翻訳システム Pending JP2005011261A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003177241A JP2005011261A (ja) 2003-06-20 2003-06-20 翻訳装置及び翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003177241A JP2005011261A (ja) 2003-06-20 2003-06-20 翻訳装置及び翻訳システム

Publications (1)

Publication Number Publication Date
JP2005011261A true JP2005011261A (ja) 2005-01-13

Family

ID=34099882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003177241A Pending JP2005011261A (ja) 2003-06-20 2003-06-20 翻訳装置及び翻訳システム

Country Status (1)

Country Link
JP (1) JP2005011261A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008101299A1 (en) * 2007-02-22 2008-08-28 Teng Technology Pty Ltd A translation device
US7643986B2 (en) 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
US7865353B2 (en) 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
CN102467499A (zh) * 2010-11-10 2012-05-23 夏普株式会社 翻译显示装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7865353B2 (en) 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
US7643986B2 (en) 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
WO2008101299A1 (en) * 2007-02-22 2008-08-28 Teng Technology Pty Ltd A translation device
CN102467499A (zh) * 2010-11-10 2012-05-23 夏普株式会社 翻译显示装置

Similar Documents

Publication Publication Date Title
JP4948586B2 (ja) 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
US7783472B2 (en) Document translation method and document translation device
US8184908B2 (en) Image processing system, image processing method, and program
US8508787B2 (en) System and method for automatic translation of documents scanned by multifunctional printer machines
US20110071829A1 (en) Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program
JP2005011261A (ja) 翻訳装置及び翻訳システム
JP2012018633A (ja) 語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法
JP2006309443A (ja) 情報処理システム、情報処理装置、情報処理端末、情報処理方法、その方法をコンピュータで実行するプログラム、および記録媒体
JPH05108716A (ja) 機械翻訳装置
JP2003122751A (ja) 翻訳装置
JP2006262152A (ja) 画像形成方法、画像形成装置およびプログラム
JP2008242820A (ja) ドキュメント処理システム
JP2006279886A (ja) 画像合成方法および画像処理装置
JP2001202362A (ja) 文字編集処理装置
JP4549810B2 (ja) ドキュメント処理データ生成可能なスキャンサブシステム
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP2004289357A (ja) 付加情報付加方法及び付加情報付加装置、並びに付加情報付加プログラム
JP2004171178A (ja) 画像処理システム及び可読記憶媒体
JP2006279285A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2002132755A (ja) 文書処理システム
JP2000165651A (ja) 画像読取装置
JP2006260103A (ja) 翻訳方法、翻訳装置およびプログラム
JPH11134229A (ja) 多言語通信端末装置
JP2006093772A (ja) 情報処理装置
JP2008134714A (ja) 情報処理装置及びプログラム