JP4797507B2 - 翻訳装置、翻訳システムおよびプログラム - Google Patents
翻訳装置、翻訳システムおよびプログラム Download PDFInfo
- Publication number
- JP4797507B2 JP4797507B2 JP2005236981A JP2005236981A JP4797507B2 JP 4797507 B2 JP4797507 B2 JP 4797507B2 JP 2005236981 A JP2005236981 A JP 2005236981A JP 2005236981 A JP2005236981 A JP 2005236981A JP 4797507 B2 JP4797507 B2 JP 4797507B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- data
- language
- identification information
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この機械翻訳のソフトウェアは、文書解析によりテキスト化された文書データから単語単位で文字を認識させ、翻訳辞書を参照して単語の意味を導き、係り受けの関係から翻訳文を作成するといった具合で行っている。
これに対し、人による翻訳は、辞書に記憶されていない新語に対しても、翻訳者の経験によって対応させて翻訳させることもでき、前後の文章から省略されている主語を補完して翻訳することも可能である。
このように、機械翻訳による翻訳精度は、文字認識による精度と機械翻訳のソフトウェアによる精度によって決められしまうため、人による翻訳よりも精度が落ちることになる。例えば、第2言語で記載された翻訳データを第1言語に戻す場合、2度翻訳処理を行うため、得られた文書データはかなり難解な文章となってしまい、理解できなくなってしまう虞がある。
例えば、入力される文書データがバージョンの古い文書に対応したものであって、最新の文書データが文書データ格納手段に格納されている場合には、入力される文書データの識別情報をキーにして最新の文書データが出力される。
以下、図面を参照し、本発明に係る第1実施形態を説明する。図1は、本実施形態による翻訳システム1の全体構成を示す図である。このシステム1は、ネットワーク300を介して接続された複合機100および翻訳サーバ200を具備している。
複合機100は、コピー、スキャナ、プリンタの機能を備える。複合機100は、ネットワーク300を介して翻訳サーバ200或いはパソコン等の利用者端末(図示せず)に接続されている。翻訳サーバ200は、翻訳処理を専門に行うサーバ装置であり、複合機100から原文に対応するデータを受信し、受信した原文に対して関連した翻訳データを生成して返信する機能を有する。
図2は、複合機100の機能構成を示すブロック図である。この複合機100は、読み取り部110、画像データ生成部120、指示入力部130、送受信部140、印刷部150およびこれらを制御する制御部160を具備する。制御部160は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
送受信部140は、翻訳サーバ200等のネットワーク300に接続された外部機器(図示せず)との間でデータの授受を行う。印刷部150は、画像データ生成部120で生成された画像データを受けて用紙(記録材)上に画像を印刷する。
図3は、翻訳サーバ200の機能構成を示すブロック図である。翻訳サーバ200は、文書データベース210が接続された文書データ管理部220、翻訳辞書部230、送受信部240およびこれらを制御する制御部250を具備する。制御部250は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
本実施形態では、関連した文書を例えば取扱説明書とし、第1版から第3版までの文書データが存在する場合を例に挙げて示す。
このデータテーブルには、例えば、日本語の文書IDと日本語文書名(ファイル名)、英語の文書IDと英語文書名(ファイル名)、中国語の文書IDと中国語文書名(ファイル名)が、改訂のバージョン毎にそれぞれ記憶されている。つまり、このデータテーブルでは、第1版から第3版までの取扱説明書の文書名が、日本語,英語,中国語の言語形式の文書名として記憶され、さらに、この文書名に対応した文書データが文書データベース210に格納されることになる。
この例の文書IDは、初めの3文字を共通の文字列にして各文書が関連(例えば、取扱説明書)あることを示し、「−」(ハイフン)以下の添え字の十の位が文書の言語形式(第1言語、第2言語、第3言語)、1の位がバージョン(第1版、第2版、第3版)を示している。
例えば、原文が英語の第2版の文書であった場合には、この文書の文書IDは“001−22”となり、この文書ID“001−22”のバージョンの異なった文書IDは、第1版“001−21”、第3版“001−23”となる。さらに、他の言語形式におけるバージョンの対応は、日本語の文書IDは、第1版“001−11”、第2版“001−12”、第3版“001−13”となり、中国語の文書IDは、第1版“001−31”、第2版“001−32”、第3版“001−33”となる。
次に、図5のシーケンスチャートに基づき、翻訳システム1の全体の動作について説明する。
まず、利用者が複合機100の指示入力部130を操作して指示情報を入力することにより、制御部160はこの指示情報を記憶する(ステップS1)。この指示情報は、翻訳対象語となる指示言語、改訂版があった場合に出力する版の種類等である。本実施形態では、指示言語を英語、改訂版の出力を最新版とする。
さらに、複合機100の制御部160は、記憶された指示情報および原文画像データを送受信部140を経由して翻訳サーバ200に送信する(ステップS3)。
さらに、制御部160は、画像データ生成部120で生成された翻訳画像データを印刷部150に転送し、印刷部150がこの翻訳画像データを用紙に印刷して翻訳原稿Tを出力する(ステップS7)。
この翻訳サーバ200は、複合機100から送信された指示情報および原文画像データ(文書IDを含む)を送受信部240で受信することによって動作を開始する。
図4のデータテーブルの例では、抽出された文書IDが“001−11”である場合には、初めの3文字を検索キーとしてデータテーブルが選択され、日本語の第1版の文書データを始め、第2版,第3版の日本語の文書データ、さらに第1〜第3版の英語の翻訳データ、中国語の翻訳データが文書データベース210に格納されていることを検索結果として得る。
制御部250は、最新版の文書データ(この場合、文書ID“001−13”)が文書データベース210に格納されていた場合には(ステップS16;YES)、この最新版の文書データを読み出し、この文書データに基づいた翻訳処理を翻訳辞書部230を利用して行い、この処理で得られた翻訳データを記憶エリアに一時的に記憶する(ステップS17)。
このように、本実施形態による翻訳システム1では、予め翻訳サーバ200の文書データベース210に原文に関連した最新版の翻訳データが格納されている場合には、その翻訳データを複合機100に送信することにより、OCR処理や翻訳処理を省略でき、翻訳精度の高い翻訳文を利用者に提供することができる。しかも、翻訳処理を行わなわずに済むため、翻訳時間を大幅に短縮することができる。
以上のように、本実施形態による翻訳システム1は、利用者に対して精度の高い翻訳文を提供することが可能となる。
以下、図面を参照しつつ、本発明に係る第2実施形態を説明する。なお、第2実施形態の特徴は、原文のバーコードから特定される文書と最新版の文書とを照合するこにより相違点を検出し、この相違点を特徴付けて表現した翻訳データを得る点にある。
本実施形態では、前述した第1実施形態と同一の構成要件に同一の符号を付し、その説明は省略するものとする。
本実施形態による翻訳システムの全体の動作については、前述した第1実施形態で示した図5のシーケンスチャートと同様であるので、その説明は省略する。
次に、図7および図8のフローチャートに基づき、翻訳サーバ200における翻訳処理および相違点検出処理について説明する。
この翻訳サーバ200は、複合機100から送信された指示情報および原文画像データを送受信部240で受信することによって動作を開始する。
図4のデータテーブルの例では、抽出された文書IDが“001−11”である場合には、初めの3文字を検索キーとしてデータテーブルが選択され、日本語の第1版の文書データを始め、第2版,第3版の日本語の文書データ、さらに第1〜第3版の英語の翻訳データ、第1〜第3版の中国語の翻訳データが文書データベース210に格納されていることを検索結果として得る。
制御部250は、検索結果から文書データベース210に原文の翻訳データ(この場合、第1版の英語)が格納されているか否かを判定する(ステップS31)。翻訳対象語となる指示言語(英語)で且つ第1版の翻訳データ(この場合、文書ID“001−21”)が文書データベース210に格納されていた場合には(ステップS31;YES)、この翻訳データを読み出し、この翻訳データを記憶エリア(図示せず)に一時的に記憶する(ステップS35)。
このステップS31〜S35までの処理が、原文に対応した翻訳データを生成する処理である。
このステップS36〜S39までの処理が、最新版の翻訳データを生成する処理である。
制御部250は、ステップS40で抽出された原文の翻訳データと最新版の翻訳データとの相違点を特徴付けた修飾処理を施した翻訳データとして生成する(図7中のステップS22)。ここで、修飾処理としては、追記された箇所にアンダーラインを付し、削除された箇所に取消線を引いて表示したり、文字に色を付けたり、文字網掛け処理をしたり、文字のフォントを変えたり、文字ポイントを変えたり等、利用者に対して識別できる表示による修飾である。
なお、最新版の翻訳データおよび文書データが文書データベース210に格納されていない場合には(ステップS36,37;NO)、最新の文書データがないため、相違点の検出は行われないことになる。
本実施形態による翻訳システムにおいても、第1の実施形態と同様に、利用者に対して精度の高い翻訳文を提供するという効果を奏する。
また、バージョンの古い文書を複合機100で読み込むことにより、最新版の文書を翻訳した翻訳原稿Tが得られ、しかも改訂された部分を特徴付けて表示できるため、利用者に対して改訂部分を印象付けることができる。
第2実施形態では、旧版の文書と新版の文書との相違点を抽出するのに、翻訳後のデータを用いて照合することにより行ったが、本発明はこれに限らず、原文の言語の段階で相違点を抽出しても、翻訳に一般的に用いられる中間言語の段階で相違点を抽出するようにしてもよい。
以上、本発明の実施形態について説明したが、本発明は上述した各実施形態に限定されるものではなく、種々の態様が可能である。
前記各実施形態では、複合機100の読み取り部110で、読み取った原文画像データを翻訳サーバ200に送信するようにしたが、本発明は、原稿の所定位置にバーコードが印刷されていれば、原稿画像データからバーコードの識別IDのみを読み取り、翻訳サーバ200に送信するようにしてもよい。これにより、バーコードのデータ容量に比べて大容量となる原文画像データを送信することがなくなり、ネットワーク300を経由しての送信時間を大幅に短縮できる。
また、複合機100の読み取り部110で原稿Mを読み取った段階で、OCR処理を施してイメージ形式の原文画像データからテキスト形式の原文入力データに変換してもよい。但し、この原文入力データと予め文書データベース210に格納されている文書データとは異なったものである。
さらに、読み取り部110は、スキャナ機構を前提に記載したが、ネットワーク300を介して接続されたユーザ端末(例えば、パーソナルコンピュータ)からの印刷指令信号に重畳された文書データをキーにして異なったバージョンの文書データを出力するようにしてもよい。この際、ユーザ端末に対してその旨を通知してモニタに表示させて、利用者からの指示を促してもよい。
本発明は、翻訳可能な言語は、第1〜第3言語の3つに限らず、2または4以上の言語に対応できることは勿論である。
このシステムでは、クライアント端末の表示部に、テキスト形式の翻訳データ或いは原文データと翻訳データとを比較させながら表示させることも可能となる。さらに、データを表示部に表示し、マウス等の領域指定手段によって文章領域を指定することにより、この文章領域に対応した翻訳文を表示させる等、種々の使用方法が適用できる。
Claims (3)
- 文書を示すテキストデータである文書データと、当該文書を識別する文書識別情報、当該文書データの記述に用いられている言語を識別する言語識別情報及び当該文書データの版を識別する版識別情報から構成される文書IDと、当該文書の最新の版を示す最新版情報とを格納した文書データ格納手段と、
第1言語で記述された文書の画像データと、前記第1言語と異なる翻訳対象言語である第2言語を示す指示情報とを受信する受信手段と、
(1)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されているときは、当該文書データを翻訳データとして読み出し、
(2)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときであって、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第1言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されているときは、当該文書データを前記第2言語に翻訳して翻訳データを生成し、
(3)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときであって、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第1言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときは、前記受信手段により受信された画像データをテキスト化し、前記テキスト化された文書データを前記第2言語に翻訳して翻訳データを生成する制御を行う制御手段と、
前記翻訳データを出力する出力手段と
を有する翻訳装置。 - 請求項1に記載の翻訳装置と、
端末装置と
を有し、
前記端末装置は、
前記第2言語を示す指示情報の入力を受け付ける受付手段と、
原稿から前記第1言語で記述された画像データを読み取る画像読取手段と、
前記指示情報および画像データを前記翻訳装置に送信する送信手段と
を備える翻訳システム。 - 文書を示すテキストデータである文書データと、当該文書を識別する文書識別情報、当該文書データの記述に用いられている言語を識別する言語識別情報及び当該文書データの版を識別する版識別情報から構成される文書IDと、当該文書の最新の版を示す最新版情報とを記憶した記憶手段、制御手段並びに通信手段を有するコンピュータに、
第1言語で記述された文書の画像データと、前記第1言語と異なる翻訳対象言語である第2言語を示す指示情報とを前記通信手段が受信するステップと、
(1)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されているときは、前記制御手段が当該文書データを翻訳データとして読み出し、
(2)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときであって、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第1言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されているときは、前記制御手段が当該文書データを前記第2言語に翻訳して翻訳データを生成し、
(3)前記受信手段により受信された画像データから当該文書の文書IDを抽出できた場合において、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第2言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときであって、前記抽出された文書IDに含まれる文書識別情報に対応する文書識別情報を有し、前記言語識別情報により前記第1言語で記述されたことが示され、かつ、前記版識別情報により最新の版であることが示される文書データが前記文書データ格納手段内に格納されていないときは、前記制御手段が前記受信手段により受信された画像データをテキスト化し、前記テキスト化された文書データを前記第2言語に翻訳して翻訳データを生成する制御を行うステップと、
前記翻訳データを前記通信手段が出力するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236981A JP4797507B2 (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236981A JP4797507B2 (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007052614A JP2007052614A (ja) | 2007-03-01 |
JP4797507B2 true JP4797507B2 (ja) | 2011-10-19 |
Family
ID=37917024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005236981A Expired - Fee Related JP4797507B2 (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4797507B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5927781B2 (ja) * | 2011-05-27 | 2016-06-01 | 沖電気工業株式会社 | 携帯端末、制御方法、およびプログラム |
JP2013255014A (ja) * | 2012-06-05 | 2013-12-19 | Ricoh Co Ltd | 画像処理システム、撮像装置、およびサーバ装置 |
GB201309402D0 (en) * | 2013-05-24 | 2013-07-10 | Rws Group Ltd | Computer systems |
US20230325612A1 (en) | 2022-04-09 | 2023-10-12 | Accenture Global Solutions Limited | Multi-platform voice analysis and translation |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2822385B2 (ja) * | 1988-04-22 | 1998-11-11 | 富士ゼロックス株式会社 | 情報処理装置 |
JPH05113975A (ja) * | 1991-10-22 | 1993-05-07 | Toshiba Corp | 共同文書処理システム |
JPH09128380A (ja) * | 1995-10-30 | 1997-05-16 | Matsushita Electric Ind Co Ltd | 文書蓄積管理システム |
JP3467160B2 (ja) * | 1996-12-13 | 2003-11-17 | ブラザー工業株式会社 | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 |
JP2001005874A (ja) * | 1999-06-23 | 2001-01-12 | Hitachi Ltd | 文書情報管理機能をもつ議事録管理システム |
JP2001109747A (ja) * | 1999-10-07 | 2001-04-20 | Casio Comput Co Ltd | 翻訳装置、翻訳プログラムが記録された記録媒体 |
-
2005
- 2005-08-17 JP JP2005236981A patent/JP4797507B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007052614A (ja) | 2007-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8732570B2 (en) | Non-symbolic data system for the automated completion of forms | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
CN101923541A (zh) | 翻译装置、翻译方法 | |
US20070242282A1 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
JP2006276911A (ja) | 電子機器およびプログラム | |
CN101178725A (zh) | 用于信息检索的设备、方法和计算机程序产品 | |
US10810383B2 (en) | Image processing apparatus for comparing documents in different languages | |
JP2006350664A (ja) | 文書処理装置 | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP2008059157A (ja) | 書類確認支援システム、書類確認支援装置およびプログラム | |
US8854635B2 (en) | Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings | |
US11301675B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2010109420A (ja) | 画像形成装置 | |
JP4797507B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
US10902223B2 (en) | Image processing apparatus | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP2007011683A (ja) | 文書管理支援装置 | |
JP4872285B2 (ja) | 文書管理装置、文書管理システムおよび文書管理方法 | |
WO1997004409A1 (fr) | Dispositif de recherche de fichiers | |
US20050256868A1 (en) | Document search system | |
JP2006276904A (ja) | ファックス装置 | |
US11637937B2 (en) | Information processing apparatus, information processing method, and non-transitory storage medium | |
JP6281739B2 (ja) | 処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110322 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110705 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110718 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4797507 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |