JP3294919B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3294919B2
JP3294919B2 JP26321293A JP26321293A JP3294919B2 JP 3294919 B2 JP3294919 B2 JP 3294919B2 JP 26321293 A JP26321293 A JP 26321293A JP 26321293 A JP26321293 A JP 26321293A JP 3294919 B2 JP3294919 B2 JP 3294919B2
Authority
JP
Japan
Prior art keywords
text
present
flowchart
translation
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26321293A
Other languages
English (en)
Other versions
JPH07121539A (ja
Inventor
文雄 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP26321293A priority Critical patent/JP3294919B2/ja
Publication of JPH07121539A publication Critical patent/JPH07121539A/ja
Application granted granted Critical
Publication of JP3294919B2 publication Critical patent/JP3294919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ある原語の文を異なる
原語の文に変換する機械翻訳装置に関するものである。
【0002】
【従来の技術】近年、機械翻訳装置はある言語を他の言
語に翻訳するための装置として広く用いられている。従
来の機械翻訳装置で文書を翻訳する場合、通常は紙に書
かれた文書を文字認識装置を用いて電子化し、電子化さ
れたテキストを翻訳し、翻訳されたテキストを出力す
る。
【0003】ところが、翻訳する文書には実際に翻訳す
るテキスト以外にも、図や表などの情報が存在する。し
かし、従来の機械翻訳装置で出力されるテキストにはこ
れらの情報が存在しないために、ユーザーは原文書と出
力の訳文テキストを対応付けながら文書を読まなければ
ならなかった。
【0004】
【発明が解決しようとする課題】このように、翻訳結果
テキストで得ても、ユーザーは原文書中に存在する図や
表との対応付けを行いながら、翻訳結果を読まなければ
ならないが、この作業は繁雑である。また、訳文と原文
を対応付けながら、訳文を読む作業も繁雑である。
【0005】本発明は上記問題を解決するもので、翻訳
結果が読み易くなり、翻訳文書を理解しやすくできる機
械翻訳装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記課題を解決するため
に、本発明の機械翻訳装置は、入力された原文書のテキ
ストイメージの行間にテキストの翻訳結果を出力する手
段と、入力された原文書のテキストイメージの行間が狭
い場合、原文書のテキストをフォントサイズを小さくし
て再描画し、訳文を出力するに必要な行間を得る手段と
を有することを特徴とする。
【0007】
【作用】上記構成により、出力結果は原文書中に現われ
る図、表や英文と共存するために、訳文を読む際に原文
書との対応付けを行う必要がなく、訳文を読む作業が簡
単になり、訳文を理解しやすくなる。
【0008】
【実施例】以下、本発明の一実施例を図面を参照しなが
ら説明する。図4は本発明の一実施例における機械翻訳
装置の機能ブロック図である。1は原文書を入力する画
像データ入力手段、2は入力された画像データを記憶す
る画像データ記憶手段、3は画像データ記憶手段2の内
容を表示する表示手段、4は画像データ記憶手段2に記
憶された画像データに対して文字認識を実行する文字認
識手段、5は文字認識結果および翻訳結果を格納するレ
イアウト構造記憶手段、6は翻訳を実行する翻訳手段、
7は翻訳辞書を検索する辞書検索手段、8は翻訳のため
の辞書データを格納する翻訳辞書、9は任意の語を指定
するための語指定手段、10は画像データに翻訳結果な
どテキストを出力するための文字描画手段、11は描画
する文字のフォントデータを格納するフォントデータ記
憶手段である。
【0009】図5は本発明の一実施例の機械翻訳装置に
おける処理の流れを表わすフローチャートである。図6
は、本発明の一実施例の機械翻訳装置における他の処理
の流れを表わすフローチャートである。以下、これらの
フローチャートにしたがい本発明の一実施例における処
理の流れを説明する。
【0010】はじめに、図5に示す処理の流れを表わす
フローチャートの実施例について説明する。まず、図5
のステップ1で、画像データ記憶手段2に格納されてい
る文書のイメージデータに対して文字認識手段4を用い
て文字認識を実行する。ここで、画像データ記憶手段2
には、図16のように画像データが記憶される。このと
き、表示手段3は図17のように表示され、レイアウト
構造記憶手段5には図18のようなデータが格納され
る。ここで、レイアウト構造記憶手段5には原文の情報
を記憶する原文データ(図7)、訳文の情報を記憶する
訳文データ(図8)、原文、訳文の文字列を格納する文
字列バッファ(図9)、複数の文を管理する文管理デー
タ(図10)が格納され、これらのデータは図11のよ
うにリンクを張られる。
【0011】次に、ステップ2で翻訳手段6を用いて翻
訳を実行する。このとき、表示手段3は図19のように
表示され、レイアウト構造記憶手段5には図20のよう
なデータが格納される。次に、ステップ3で文字描画手
段10を用いて行間に訳文を挿入する領域があるか調
べ、領域がなければ、ステップ4で文字描画手段10を
用いて原文をフォントデータ格納手段11に格納されて
いる小さなフォントを用いて再描画する。このとき、表
示手段3は図21のように表示され、レイアウト構造記
憶手段5には図22のようなデータが格納される。最後
にステップ5で文字描画手段10を用いて訳文を画像デ
ータ記憶手段2に描画する。このとき、表示手段3は図
23のように表示され、レイアウト構造記憶手段5には
図24のようなデータが格納される。
【0012】次に、図6に示す他の処理の流れを表わす
フローチャートの実施例について説明する。まず図6の
ステップaで、画像データ記憶手段2に格納されている
文書のイメージデータに対して文字認識手段4を用いて
文字認識を実行する。ここで、画像データ記憶手段2に
は、図16のように画像データが記憶される。このと
き、表示手段3は図25のように表示され、レイアウト
構造記憶手段5には図26のようなデータが格納され
る。ここで、レイアウト構造記憶手段5には原文の単語
の情報を記憶する原文単語データ(図12)、訳文の単
語の情報を記憶する訳文単語データ(図13)、原文、
訳文の単語の文字列を格納する文字列バッファ(図1
4)が格納され、これらのデータは図15のようにリン
クを張られる。
【0013】次に、ステップbで語指定手段9を用いて
ユーザが任意の単語を指定する。このとき、表示手段3
は図27のように表示され、レイアウト構造記憶手段5
には図28のようなデータが格納される。次に、ステッ
プcで辞書検索手段7を用いてユーザーが指定した単語
の辞書引きを行う。このとき、表示手段3は図29のよ
うに表示され、レイアウト構造記憶手段5には図30の
ようなデータが格納される。
【0014】次に、ステップdで文字描画手段10を用
いて行間に訳語を挿入する領域があるか調べ、領域がな
ければ、ステップeで文字描画手段10を用いて原文を
フォントデータ格納手段11に格納されている小さなフ
ォントを用いて再描画する。このとき、表示手段3は図
31のように表示され、レイアウト構造記憶手段5には
図32のようなデータが格納される。最後に、ステップ
fで文字描画手段10を用いて訳語を画像データ記憶手
段2に描画する。このとき、表示手段3は図33のよう
に表示され、レイアウト構造記憶手段5には図34のよ
うなデータが格納される。
【0015】
【発明の効果】以上のように、本発明によれば、出力結
果に原文書中に現われる図、表や英文が存在することに
なり、機械翻訳装置の翻訳結果が読み易くなり、翻訳文
書を理解しやすくなる。
【図面の簡単な説明】
【図1】本発明の入力文書の一例である。
【図2】本発明の出力文書の一例である。
【図3】本発明の他の出力文書の一例である。
【図4】本発明の一実施例の機械翻訳装置の機能ブロッ
ク図である。
【図5】本発明の一実施例の機械翻訳装置におけるフロ
ーチャートである。
【図6】本発明の一実施例の機械翻訳装置における他の
フローチャートである。
【図7】本発明の図5のフローチャートの実施例におけ
る原文の情報を格納する原文データを示す図である。
【図8】本発明の図5のフローチャートの実施例におけ
る訳文の情報を格納する訳文データを示す図である。
【図9】本発明の図5のフローチャートの実施例におけ
る原文、訳文を格納する文字列バッファを示す図であ
る。
【図10】本発明の図5のフローチャートの実施例にお
ける複数の文を管理する文管理データを示す図である。
【図11】本発明の図5のフローチャートの実施例にお
けるレイアウトデータのリンク関係を示す図である。
【図12】本発明の図6のフローチャートの実施例にお
ける原文単語の情報を格納する原文単語データを示す図
である。
【図13】本発明の図6のフローチャートの実施例にお
ける訳文単語の情報を格納する訳文単語データを示す図
である。
【図14】本発明の図6のフローチャートの実施例にお
ける原文単語、訳文単語の文字列を格納する文字列バッ
ファを示す図である。
【図15】本発明の図6のフローチャートの実施例にお
けるレイアウトデータのリンク関係を示す図である。
【図16】本発明の一実施例の機械翻訳装置における画
像データ記憶手段に格納されるデータ構造を示す図であ
る。
【図17】本発明の図5のフローチャートの実施例にお
ける文字認識後の表示手段を示す図である。
【図18】本発明の図5のフローチャートの実施例にお
ける文字認識後のレイアウトデータを示す図である。
【図19】本発明の図5のフローチャートの実施例にお
ける翻訳後の表示手段を示す図である。
【図20】本発明の図5のフローチャートの実施例にお
ける翻訳後のレイアウトデータを示す図である。
【図21】本発明の図5のフローチャートの実施例にお
ける訳文描画領域の認定後の表示手段を示す図である。
(ただし、図に示す座標情報、高さ・長さの情報、領域
の枠は説明のためのものであり、実際には表示されな
い)。
【図22】本発明の図5のフローチャートの実施例にお
ける訳文描画領域の認定後のレイアウトデータを示す図
である。
【図23】本発明の図5のフローチャートの実施例にお
ける訳文の描画後の表示手段を示す図である。
【図24】本発明の図5のフローチャートの実施例にお
ける訳文の描画後のレイアウトデータを示す図である。
【図25】本発明の図6のフローチャートの実施例にお
ける文字認識後の表示手段を示す図である。
【図26】本発明の図6のフローチャートの実施例にお
ける文字認識後のレイアウトデータを示す図である。
【図27】本発明の図6のフローチャートの実施例にお
けるユーザによる語の指定後の表示手段を示す図であ
る。
【図28】本発明の図6のフローチャートの実施例にお
けるユーザによる語の指定後のレイアウトデータを示す
図である。
【図29】本発明の図6のフローチャートの実施例にお
ける辞書検索後の表示手段を示す図である。
【図30】本発明の図6のフローチャートの実施例にお
ける辞書検索後のレイアウトデータを示す図である。
【図31】本発明の図6のフローチャートの実施例にお
ける訳語描画領域の認定後の表示手段を示す図である。
(ただし、図に示す座標情報、高さ・長さの情報、領域
の枠は説明のためのものであり、実際には表示されな
い)。
【図32】本発明の図6のフローチャートの実施例にお
ける訳語描画領域の認定後のレイアウトデータを示す図
である。
【図33】本発明の図6のフローチャートの実施例にお
ける訳語の描画後の表示手段を示す図である。
【図34】本発明の図6のフローチャートの実施例にお
ける訳語の描画後のレイアウトデータを示す図である。
【符号の説明】
1 画像データ入力手段 2 画像データ記憶手段 3 表示手段 4 文字認識手段 5 レイアウト構造記憶手段 6 翻訳手段 7 辞書検索手段 8 翻訳辞書 9 語指定手段 10 文字描画手段 11 フォントデータ記憶手段

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された原文書のテキストイメージの行
    間に、テキストの翻訳結果を出力する手段と、入力され
    た原文書のテキストイメージの行間が狭い場合、原文書
    のテキストをフォントサイズを小さくして再描画し、訳
    文を出力するに必要な行間を得る手段とを有することを
    特徴とする機械翻訳装置。
  2. 【請求項2】入力された原文書のテキストイメージの行
    間に、テキスト中の任意の単語の訳語を出力する手段を
    有することを特徴とする請求項1記載の機械翻訳装置。
  3. 【請求項3】入力された原文書のテキストイメージの行
    間に、テキストの翻訳結果を出力する際に、入力された
    原文書のテキストイメージの行間が狭い場合、原文書の
    テキストをフォントサイズを小さくして再描画し、訳文
    を出力するに必要な行間を得ることを特徴とする機械翻
    訳装置における翻訳結果出力方法。
JP26321293A 1993-10-21 1993-10-21 機械翻訳装置 Expired - Fee Related JP3294919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26321293A JP3294919B2 (ja) 1993-10-21 1993-10-21 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26321293A JP3294919B2 (ja) 1993-10-21 1993-10-21 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH07121539A JPH07121539A (ja) 1995-05-12
JP3294919B2 true JP3294919B2 (ja) 2002-06-24

Family

ID=17386343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26321293A Expired - Fee Related JP3294919B2 (ja) 1993-10-21 1993-10-21 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3294919B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751214B2 (en) 2008-03-14 2014-06-10 Fuji Xerox Co., Ltd. Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082987A (ja) 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体
US7865353B2 (en) 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP4483909B2 (ja) 2007-08-24 2010-06-16 富士ゼロックス株式会社 翻訳装置及びプログラム
JP4998176B2 (ja) * 2007-09-27 2012-08-15 富士ゼロックス株式会社 翻訳装置及びプログラム
JP5126018B2 (ja) * 2008-11-25 2013-01-23 富士ゼロックス株式会社 文書画像処理装置及びプログラム
JP4948586B2 (ja) 2009-11-06 2012-06-06 シャープ株式会社 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
JP5144736B2 (ja) 2010-11-10 2013-02-13 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
JP5211193B2 (ja) * 2010-11-10 2013-06-12 シャープ株式会社 翻訳表示装置
JP5604276B2 (ja) * 2010-12-02 2014-10-08 シャープ株式会社 文書画像生成装置および文書画像生成方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6415869A (en) * 1987-07-09 1989-01-19 Ricoh Kk Translating device
JPH0554188A (ja) * 1991-08-22 1993-03-05 Ricoh Co Ltd 画像処理装置
JPH0554073A (ja) * 1991-08-23 1993-03-05 Ricoh Co Ltd デジタル翻訳装置
JPH05108793A (ja) * 1991-10-18 1993-04-30 Ricoh Co Ltd 文書編集装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751214B2 (en) 2008-03-14 2014-06-10 Fuji Xerox Co., Ltd. Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium

Also Published As

Publication number Publication date
JPH07121539A (ja) 1995-05-12

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
EP0797155A2 (en) Translating machine
JP3038079B2 (ja) 自動翻訳装置
JPH08190563A (ja) 機械翻訳装置
JP3294919B2 (ja) 機械翻訳装置
JP2006236315A (ja) 符号化が利用できないときに外国語テキスト表示を実現する方法および装置
US20240104290A1 (en) Device dependent rendering of pdf content including multiple articles and a table of contents
JPH04311262A (ja) 辞書情報表示装置
JP2003178087A (ja) 外国語電子辞書検索装置および方法
US11842141B2 (en) Device dependent rendering of PDF content
Gribomont OCR with Google Vision API and Tesseract
JP3954520B2 (ja) 翻訳支援システム
JP3353873B2 (ja) 機械翻訳装置
KR20010091682A (ko) 인터넷 학습사이트용 중국어문서에서의 성조 표시방법
JPH0635954A (ja) 機械翻訳機
JPH04137070A (ja) 電子ブック装置
JPH07262194A (ja) 機械翻訳装置
JPH06236399A (ja) 翻訳機能付きワードプロセッサ
JPH11232003A (ja) ドキュメント表示装置,表示方法および記憶媒体
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPH03286253A (ja) 文書処理装置
JPH0194480A (ja) 機械翻訳システム
Singh et al. A Document Reconstruction System for Transferring Bengali Paper Documents into Rich Text Format
JPH06131329A (ja) 日本語文字処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees