JP2003016065A - 対訳画像形成装置 - Google Patents

対訳画像形成装置

Info

Publication number
JP2003016065A
JP2003016065A JP2002099229A JP2002099229A JP2003016065A JP 2003016065 A JP2003016065 A JP 2003016065A JP 2002099229 A JP2002099229 A JP 2002099229A JP 2002099229 A JP2002099229 A JP 2002099229A JP 2003016065 A JP2003016065 A JP 2003016065A
Authority
JP
Japan
Prior art keywords
image
word
character
area
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002099229A
Other languages
English (en)
Inventor
Takako Satou
多加子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002099229A priority Critical patent/JP2003016065A/ja
Publication of JP2003016065A publication Critical patent/JP2003016065A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 原稿の正確な認識と正確な原語出力が可能
で,より低容量のメモリで,作画,訳語検索等の処理速
度を短縮させた対訳画像形成装置を提供することを目的
とする。 【解決手段】 画像読取手段101によって読み取った
画像情報を,読取画像情報圧縮手段により圧縮して画像
記憶手段121に記憶し,画像処理手段103及び11
2においては,読取画像情報から文字認識手段342に
より文字認識し,該認識した文字列から第1言語による
単語を単語抽出手段342により抽出し,抽出単語に対
応する訳語を訳語検索手段343により訳語記憶手段を
検索して獲得し,読取画像情報解凍手段により解凍した
画像記憶手段の画像情報に従って,検索した訳語を対応
する単語と共に出力画像生成手段344により画像記録
手段に出力する。

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は,対訳機能を備えた
デジタル画像データを扱う複写機等の対訳画像形成装置
に係り,特に,原稿の正確な認識と正確な原語出力が可
能で,より低容量のメモリで,作画,訳語検索等の処理
速度を短縮させた対訳画像形成装置に関する。 【0002】 【従来の技術】他国語で記載された文章を読む人にと
り,文章の多くの部分については読解に支障はないが,
単に特定の単語についてのみ適切な訳語を知らないた
め,読み進むことができないといった状況が多々ある。
このような状況において,辞書を用いて特定単語の意味
を知り,読み進むことはよく経験することである。 【0003】そこで,他国語で記載された文章を自動的
に翻訳して出力する対訳機能を備えた複写機等の対訳画
像形成装置として,例えば特開平4−77965号公報
の「デジタル複写装置」や特開平5−314175号公
報の「対訳画像形成装置」等が開示されている。これら
の従来例においては,文字認識された第1の言語の画像
イメージを行単位で切り出し,認識された単語のうち検
索された訳語を認識された単語座標の下に所定フォント
で出力していた。 【0004】これら従来技術には,ページ計算機能とい
う機能が明記されている。即ち,読み込んだ原稿に対し
て何枚の出力が出るかを予め計算し,ユーザーに知らせ
るためのものである。 【0005】 【発明が解決しようとする課題】英文の雑誌,新聞等に
おいては,段組みの1文字目のフォントを他の文字に使
用しているフォントより大きくしたレイアウトを使用し
ているものが多い。上記従来の対訳画像形成装置にあっ
ては,このような原稿を読み込んで,対訳形式の訳語を
挿入して出力する際に,1文字目の文字の大きさが認識
行の大きさに合わないために,正しく単語抽出されない
といった問題や,1文字目の文字が分割して出力されて
しまうという問題点があった。 【0006】また,ページ計算機能を実現するために
は,作画する総文字量を計算する必要があり,上記従来
の対訳画像形成装置にあっては,1度辞書検索をすべて
行っている。つまり,メモリを節約して安価なコストで
装置を実現させるため,検索結果の格納先をメモリに用
意しないで,即ち検索結果を記憶させることなく,作画
の際にもう1度辞書を引く処理を行っており,そのため
処理に時間がかかるという問題点があった。 【0007】更に,上記従来の対訳画像形成装置の出力
には,対象英単語(熟語)の下に訳語を表示する形式
(以下,「対訳形式」という)と,辞書のような内容を
表示する形式(以下,「単語帳形式」という)がある。
これらの形式は,表示形式及び表示量は異なるが,辞書
検索処理においては同等の処理を行うものである。しか
しながら,従来の対訳画像形成装置においては,両方の
形式による出力設定がなされている場合にも,作画の際
に辞書検索を対訳形式用と単語帳形式用の2回について
行っており,そのため処理に時間がかかるという問題点
もあった。 【0008】本発明は,上記従来の問題点に鑑みてなさ
れたものであって,段組みの1文字目に他と異なるフォ
ントが使用されている場合にも,原稿を正確に認識する
と共に正確な原語出力を行い得る対訳画像形成装置を提
供することを目的としている。 【0009】 【課題を解決するための手段】上記課題を解決するため
に,本発明の請求項1に係る対訳画像形成装置は,原稿
画像を光学的に読み取り,画像情報に変換する画像読取
手段と,前記画像読取手段によって読み取った画像情報
を記憶する画像記憶手段と,前記画像情報に対し各種画
像処理を実行する画像処理手段と,前記画像処理手段が
出力する画像信号に基づいて画像を記録媒体上に記録す
る画像記録手段と,を備える対訳画像形成装置におい
て,前記画像処理手段は,前記読取画像情報から文字を
認識する文字認識手段と,前記文字認識手段により認識
した文字列から第1言語による単語を抽出する単語抽出
手段と,前記第1言語による単語に対応する第2言語に
よる訳語を記憶している訳語記憶手段と,前記訳語記憶
手段から前記単語抽出手段により抽出された単語に対応
する訳語を検索する訳語検索手段と,前記訳語検索手段
により検索した訳語を対応する単語と共に前記画像記録
手段に出力する出力画像生成手段と,を具備し,前記文
字認識手段は,前記画像読取手段により読み取った画像
情報から文字領域を認識し,文字領域として認識された
領域の先頭行の先頭文字のフォントを他文字のフォント
と比較し,文字領域として認識された領域の先頭行の先
頭文字のフォントが他文字のフォントよりも大きい場合
には,前記単語抽出手段は,該先頭文字のフォント情報
を考慮して単語抽出を行い,前記出力画像生成手段は,
該先頭文字を含む単語の画像生成においてフォント情報
を考慮するものである。 【0010】 【実施例】以下,本発明の対訳画像形成装置の概要につ
いて,並びに,本発明の対訳画像形成装置の実施例につ
いて,〔実施例1〕,〔実施例2〕,〔実施例3〕,
〔実施例4〕の順に図面を参照して詳細に説明する。 【0011】〔本発明の対訳画像形成装置の概要〕本発
明の請求項1に係る対訳画像形成装置では,図1及び図
3に示す如く,画像処理手段103及び112におい
て,読取画像情報から文字認識手段342により文字認
識し,該認識した文字列から第1言語による単語を単語
抽出手段342により抽出し,抽出単語に対応する訳語
を訳語検索手段343により訳語記憶手段122を検索
して獲得し,検索した訳語を対応する単語と共に出力画
像生成手段344により画像記録手段に出力する。この
時,文字認識手段342が,読取画像情報から文字領域
を認識し,文字領域として認識された領域の先頭行の先
頭文字のフォントを他文字のフォントと比較して,文字
領域として認識された領域の先頭行の先頭文字のフォン
トが他文字のフォントよりも大きいと判断した場合に
は,単語抽出手段342は,該先頭文字のフォント情報
を考慮して単語抽出を行い,出力画像生成手段344
は,該先頭文字を含む単語の画像生成においてフォント
情報を考慮して出力画像を生成するようにしている。 【0012】従って,段組みの1文字目に他と異なるフ
ォントが使用されている場合にも,原稿を正確に認識す
ると共に正確な原語出力を行い得る対訳画像形成装置を
実現できる。 【0013】また,本実施例の対訳画像形成装置では,
図1及び図3に示す如く,画像処理手段103及び11
2において,読取画像情報から文字認識手段342によ
り文字認識し,該認識した文字列から第1言語による単
語を単語抽出手段342により抽出し,抽出単語に対応
する訳語を訳語検索手段343により訳語記憶手段12
2を検索して獲得し,検索した訳語を対応する単語と共
に出力画像生成手段344により画像記録手段に出力す
る。この時,出力画像生成手段344は,訳語検索手段
343による検索結果に基づいて画像記憶手段121に
記憶された読取画像において抽出単語の下方に対応する
訳語を配置する対訳形式による出力を行った後,該検索
結果に基づいて抽出単語と対応する訳語とを対応づけた
単語帳形式による出力を行うようにしている。 【0014】例えば,対訳形式または単語帳形式の一方
の作画に用いた訳語検索結果を使用して,対訳形式また
は単語帳形式の他方の作画を行うので,1回の辞書検索
処理の結果に基づいて,対訳形式,単語帳形式等の複数
の出力形式に対応でき,辞書検索回数の低減により作画
速度を短縮させた対訳画像形成装置を実現できる。 【0015】また,本実施例の対訳画像形成装置では,
図1及び図3に示す如く,画像読取手段101によって
読み取った画像情報を,読取画像情報圧縮手段により圧
縮して画像記憶手段121に記憶し,画像処理手段10
3及び112においては,読取画像情報から文字認識手
段342により文字認識し,該認識した文字列から第1
言語による単語を単語抽出手段342により抽出し,抽
出単語に対応する訳語を訳語検索手段343により訳語
記憶手段122を検索して獲得し,読取画像情報解凍手
段により解凍した画像記憶手段の画像情報に従って,検
索した訳語を対応する単語と共に出力画像生成手段34
4により画像記録手段に出力するようにしている。 【0016】このように,入力画像を圧縮して記憶する
ことによってメモリを節約し,該メモリにおいてより大
きな作業領域を確保することにより,従来と同等のメモ
リ容量でより高速な処理を行うことができる。例えば,
訳語検索結果から共通に得られる単語帳形式,対訳形式
等の異なる出力形式における訳語をリアルタイムで同時
に描画することが可能となり,作画から出力までの時間
を短縮させた対訳画像形成装置を実現できる。 【0017】また,本実施例の対訳画像形成装置では,
図1及び図3に示す如く,画像読取手段101によって
読み取った画像情報を,読取画像情報圧縮手段により圧
縮して画像記憶手段121に記憶し,画像処理手段10
3及び112においては,読取画像情報から文字認識手
段342により文字認識し,該認識した文字列から第1
言語による単語を単語抽出手段342により抽出し,抽
出単語に対応する訳語を訳語検索手段343により訳語
記憶手段を検索して獲得し,該獲得した訳語と対応する
単語とを作業記憶圧縮手段により所定形式で作業記憶手
段に圧縮して記憶し,出力画像生成手段344は,読取
画像情報解凍手段により解凍した画像記憶手段の画像情
報,並びに,作業記憶解凍手段により解凍した作業記憶
手段の情報に基づいて,出力画像を生成し前記画像記録
手段に出力するようにしている。 【0018】このように,入力画像及び作画データを圧
縮して記憶することによってメモリを節約し,該メモリ
においてより大きな作業領域を確保することにより,従
来と同等のメモリ容量でより高速な処理を行うことがで
きる。例えば,訳語検索結果から共通に得られる単語帳
形式,対訳形式等の異なる出力形式における訳語をリア
ルタイムで同時に描画することが可能となり,作画から
出力までの時間を短縮させた対訳画像形成装置を実現で
きる。 【0019】更に,本実施例の対訳画像形成装置では,
図1及び図3に示す如く,作業記憶手段121を訳語記
憶手段122よりも高速にアクセス可能な記憶媒体で実
現するのが望ましく,作業記憶手段121の所定領域
に,訳語記憶手段122の内容の全部または一部を複写
して記録するようにしている。 【0020】このように,入力画像及び作画データを圧
縮することによってメモリを節約し,辞書検索の結果で
ある訳語データを圧縮し,更に訳語記憶手段122の一
部または全部を複写して比較的高速アクセス可能な作業
記憶手段121に保持することにより,作画速度,検索
速度を短縮させた対訳画像形成装置を実現できる。 【0021】〔実施例1〕図1は本発明の実施例1に係
る対訳画像形成装置の概略構成図である。本実施例の対
訳画像形成装置は,原稿をスキャナで読み取り,レーザ
ーダイオード(LD)を駆動して画像信号を用紙上に記
録して書き込む構成である。 【0022】図1において,本実施例の対訳画像形成装
置は,スキャナ部101,前処理部102,画像処理部
103,LD制御部104,LD(レーザーダイオー
ド)105,LED制御部106,LEDA(レーザー
エミッターダイオードアレイ)107,CPU108,
CPU周辺IC109,エンジンユニット110,編集
処理部111及び認識処理部112を備えて構成されて
いる。 【0023】スキャナ部101はCCDイメージセンサ
ーを備え,該CCDイメージセンサーによって原稿画像
が読み取られ,前処理部102に送られる。 【0024】前処理部102では,供給された画像信号
160について増幅,A/D変換,シェーディング補正
の各処理が施される。つまり,画像信号は,増幅器によ
って所定の電圧振幅に増幅され,その後,A/D変換回
路で1画素当たり2のn乗階調(本実施例では256階
調)のデジタルデータに変換される。そして,シェーデ
ィング補正回路で光源の照度ムラ及びCCDイメージセ
ンサーの各素子間の感度ばらつき等が補正され,画像処
理部103に供給される。 【0025】画像処理部103では,編集処理部111
及び認識処理部112と共に,供給された画像信号16
1に対して各種画像処理が施され,処理後の画像信号1
62がLD制御回路104に送られる。LD制御回路1
04は,供給された画像信号162に基づいてレーザー
ダイオードの点灯信号163を生成し,LD105を駆
動する。 【0026】また本実施例の対訳画像形成装置では,2
56階調の画像信号(白黒)の他に,2値の所定色(本
実施例では赤とする)の画像信号をも扱う構成となって
おり,画像処理部103からLED制御回路106に対
して所定の色信号が送られる。LED制御回路106
は,送られた画像信号に基づいてLEDA107を駆動
する。 【0027】また,CPU108は前処理部102,画
像処理部103及びLD制御部104を制御し,CPU
周辺IC109はCPU108周辺のデータ及びアドレ
スの入出力を制御するICである。エンジンユニット1
10は,デジタルコピーのエンジン部であり,CPU1
08とのシリアル通信(172)により動作制御され
る。 【0028】また,編集処理部111は,デジタルコピ
ーにおける様々な画像加工処理を行うものであり,認識
処理部112は,画像処理部103に供給された画像信
号の文字部分について認識処理,対訳処理等を行う。
尚,認識処理部112中の画像メモリ部121には,画
像処理部103に供給されてLD制御回路104に送ら
れる画像信号162と同一の画像信号が記憶される。 【0029】次に,図2は図1に示した本実施例の対訳
画像形成装置における画像処理部103を詳細に説明す
る説明図である。画像処理部103を大きく2つのブロ
ック201,202に分けて示している。画像信号16
1aは,前処理部102においてRGBのデジタル信号
に変換された256階調の画像信号である。またビデオ
信号制御161bは,各回路において画像信号161a
(本実施例では256階調の白黒画像信号とする)のタ
イミング制御を行う信号である。 【0030】先ずブロック201は,2次元リアルタイ
ム変倍を行う変倍回路221と,文字,線字画像等の解
像力を上げるMTF補正や,信号ノイズを除去し,写真
等の再現性を上げる平滑化処理等を行う空間フィルタ回
路222とを備えている。 【0031】またブロック202は,濃度設定機能に応
じたγ補正を行うγ補正回路231と,画質設定機能に
応じて中間調処理等を行う階調処理部232とを備えた
構成である。認識処理が設定された場合には,当該ブロ
ック202からLD制御部104(プリンタ)に送られ
るべき画像信号(本実施例では2値データ)が切り替え
られて認識処理部112に供給される。 【0032】図2におけるブロック202のより詳細な
動作を,図3の構成図及び図4のフローチャートを用い
て説明する。図3は,図2におけるブロック202,編
集処理部111及び認識処理部112についてより詳細
に示した構成図である。また図4は,本実施例の対訳画
像形成装置の概略フローチャートである。 【0033】先ずステップS401において,操作部
(図示せず)から認識処理が指定されると,ステップS
402では,スキャナ部101により原稿が読み取ら
れ,読み取られた画像信号は,前処理部102及び画像
処理部103のブロック201により,256階調の画
像データ261bとして,編集処理部111及び画像処
理部におけるブロック202のγ補正回路231に送ら
れる。 【0034】編集処理部111では,原稿の一部をマー
カーペンで囲むことにより特定して処理したい場合に,
リアルタイムにマーカーペンで囲んだ領域を検知し,マ
ーカーペンで囲まれた画像データを特定する処理がなさ
れる(ステップS403)。 【0035】またγ補正回路231では,256階調の
画像データ261bについて,濃度設定機能に応じたγ
補正が行われ,階調処理部232に送られる。階調処理
部232では,画質機能設定に応じたディザ処理等の中
間調処理が行われる。階調処理部232により中間調処
理が施された画像に対し,更に2値化処理部333にお
いて,所定のしきい値による2値化処理が行われる。 【0036】次に,認識処理を施す設定になっている場
合には,2値化処理部333により2値化された画像信
号は,認識処理部I/F334を介して認識処理部11
2に供給され,認識処理部112内の画像メモリ121
に記憶される(ステップS404)。 【0037】次に認識処理部112では,先ず,領域識
別処理部341により領域識別処理が行われ(ステップ
S405),該領域識別処理で判定された領域情報は,
領域識別結果424として画像メモリ121に格納され
る。 【0038】次に,領域識別処理で判定された文字領域
のデータに対して,OCR処理部342によりスペルチ
ェック辞書122aを参照しながら文字認識及び単語抽
出が行われ(ステップS406),文字認識結果425
として画像メモリ121に格納される。 【0039】次に,文字認識され単語抽出された語につ
いて所定の言語データに対訳するため,辞書検索部34
3による辞書検索が行われ(ステップS407),訳語
検索結果426として画像メモリ121に格納される。 【0040】次にステップS408では,画像メモリ1
21に格納された領域識別結果424,文字認識結果4
25及び訳語検索結果426,並びに,画像メモリ12
1に記憶されている入力画像データを使用し,フォント
メモリ123を参照して,出力結果である対訳形式画像
または単語帳形式画像を所定フォーマットで作画する。
更にステップS409では,作画した対訳形式画像また
は単語帳形式画像を出力する。 【0041】以上説明した処理の概略的な流れは,本実
施例の対訳画像形成装置において通常行われる処理であ
り,従来の対訳画像形成装置においても同等の処理の流
れにより行われるものである。その従来の対訳画像形成
装置における処理結果である対訳形式の出力例を図6に
示す。図6の出力例は,段組みの1文字目が他の文字の
フォントより大きい原稿についてなされたものであり,
このようなレイアウトは,英文の雑誌や新聞等でよく見
受けられる。この場合,1文字目の文字が複数の認識行
に渡るため,図6の文字”T”に示す如く分割されてし
まったり,或いは正確に単語抽出ができなかったりする
こととなる。 【0042】本実施例の対訳画像形成装置では,このよ
うに段組みの1文字目に他と異なるフォントが使用され
ている場合にも,原稿を正確に認識すると共に正確な原
文出力を行うべく,段組みの先頭1文字のフォントの大
きさを認識し,該認識結果を利用して,単語抽出,並び
に,対訳画像形成を行うようにしている。 【0043】図5は,図4のステップS408の作画処
理において,文字領域の先頭行について,先頭文字のフ
ォントが次文字のフォントよりも大きい場合に,別途行
われる処理を説明するフローチャートである。尚,以下
の説明では,第1言語を英語,第2言語を日本語として
処理を行うものとする。 【0044】先ずステップS501では,図4のステッ
プS405において得られた領域識別結果424から,
現在作画処理を行う場所が文字領域の先頭行であること
を判定する。ここで,文字領域の先頭行でなければ,以
下の処理を行うことなく通常の処理を行えばよい。 【0045】ステップS501の判定により,文字領域
の先頭行である場合には,ステップS502に進んで,
図4のステップS406において得られた文字認識結果
425の内,最初の2文字のフォント情報を取得する。
尚,通常の処理においてはフォント情報部分にはアクセ
スしない。 【0046】次にステップS503では,先頭文字のフ
ォントサイズと第2番目のフォントサイズを比較する。
ここで,先頭文字のフォントサイズが第2番目のフォン
トサイズよりも大きい場合以外は,以下の処理は不要で
ある。 【0047】ステップS503の比較の結果,先頭文字
のフォントサイズが第2番目のフォントサイズよりも大
きい場合には,ステップS504で先頭文字のフォント
サイズのX,Yサイズを取得し,ステップS505で,
取得したフォントサイズにより入力イメージを切り出し
て作画する。 【0048】次にステップS506では,該先頭行の切
り出しを2文字目以降について行って作画し,次いでス
テップS507では,図4のステップS407において
得られた訳語検索結果426から,第1行の抽出された
単語に対応する訳語を取り出して作画する。尚,先頭単
語の訳語については,描画開始のX座標を切り出した英
文の2文字目の描画開始X座標として作画する。 【0049】次にステップS508では,第2行の対訳
情報について描画を行う。第2行目には,当然,第1行
の先頭文字が存在しているので,第2行の行切り出し
は,第1行の先頭文字の描画について終了したX座標か
ら行われ,作画されることとなる。このようにすること
によって,作画の際に訳語を挿入する間隔(図7におけ
るLength)を一定にすることができる。 【0050】次にステップS509では,図4のステッ
プS407において得られた訳語検索結果426から,
第2行の抽出単語について対応する訳語を取り出し,作
画する。 【0051】更にステップS510では,ステップS5
09で作画された訳語の終了Y座標が,1行目の先頭文
字の描画終了Y座標を越えているか否かを判定する。越
えている場合は,1行目の先頭文字が次の行にオーバラ
ップしていないことを意味するので通常の作画処理に戻
り,越えていない場合は,1行目の先頭文字が次の行に
まだオーバラップしていることを意味するので,ステッ
プS508からの処理を繰り返し行う。 【0052】図7には,図6において段組みの1文字目
が他の文字のフォントより大きいために文字が分割され
部分について,改善された出力結果を示す。 【0053】〔実施例2〕次に,本発明の実施例2に係
る対訳画像形成装置について説明する。本実施例の対訳
画像形成装置は,画像圧縮を行わずに,対訳形式1ペー
ジ分の第1言語の抽出単語について辞書検索を行い,対
訳形式の出力後に,対訳形式出力で行った辞書検索結果
を用いて単語帳形式の出力を行うものであり,その構成
は,実施例1と同等で図1,図2及び図3に示すもので
ある。 【0054】本実施例の対訳画像形成装置の処理動作に
ついて,図8のフローチャートを参照して説明する。
尚,図8に示す処理に先立って,少なくとも図4におけ
るステップS406までと同等の処理が行われており,
図4におけるステップS404の認識処理及びステップ
S405の領域識別処理により入力イメージが図9
(a)の領域955に,また図4におけるステップS4
06の文字認識(OCR)処理によるOCR結果が図9
(a)の領域954に,それぞれ格納されているものと
する。ここで,図9(a)は,本実施例における画像メ
モリ121のメモリマップである。 【0055】先ずステップS801では,入力イメージ
955の領域識別情報から得られる文字領域の1行を切
り出して,画像メモリ121の作画イメージ951の領
域にコピーする。次にステップS802では,ステップ
S801で切り出された行中に存在するOCR認識結果
である抽出単語について訳語の辞書検索を行い,ステッ
プS803で,辞書検索結果830を画像メモリ121
の領域953に所定フォーマットで格納する。 【0056】次にステップS804では,ステップS8
03による辞書検索結果830を参照して,訳語を対応
する第1言語の単語下に所定フォーマットで対訳形式描
画し,画像メモリ121の作画イメージ領域951に格
納する。 【0057】次いでステップS805では,1ページ分
の描画が終了したか否かを判定する。1ページ分の描画
が終了していない場合には,ステップS801に戻り入
力イメージの次行について処理を繰り返す。またステッ
プS805において1ページ分の描画が終了している場
合には,ステップS806に進んで対訳形式を1枚出力
する。 【0058】次にステップS807では,ステップS8
03による辞書検索結果830を用いて単語帳形式の描
画を行う。次いでステップS808では,1ページ分の
描画が終了したか否かを判定する。1ページ分の描画が
終了していない場合には,ステップS809に進んで,
画像メモリ121の辞書検索結果953に格納されてい
る訳語の最後か否かを判定し,訳語の最後でない場合に
はステップS807に戻って単語帳形式の描画を繰り返
す。またステップS808において1ページ分の描画が
終了している場合,並びに,ステップS809において
訳語の最後である場合には,ステップS810に進んで
単語帳形式を出力する。 【0059】更に,ステップS811では,対訳形式の
描画の終了か否かを判定する。対訳形式の描画の終了で
ない場合には,ステップS801に戻って上記各処理を
繰り返す。 【0060】〔実施例3〕次に,本発明の実施例3に係
る対訳画像形成装置について説明する。本実施例の対訳
画像形成装置は,総ページ数の表示を行わず,また入力
画像及び作画データを圧縮して画像メモリ121に記憶
し,画像メモリ121における領域を節約して作画2枚
分のメモリ領域を確保し,更に,第1言語の抽出単語に
ついて辞書検索を行い,該辞書検索結果から対訳形式と
単語帳形式の出力を同時に行うものであり,その構成
は,実施例1と同等で図1,図2及び図3に示すもので
ある。 【0061】本実施例の対訳画像形成装置の概略の処理
動作について,図10のフローチャートを参照して説明
する。 【0062】図10に示す本実施例の概略フローは,図
4に示した実施例1の概略フローと比較して,ステップ
S1004の入力画像圧縮処理,ステップS1010の
出力画像圧縮処理及びステップS1011の圧縮画像の
解凍処理が付加されている点で異なる。 【0063】つまり,先ずステップS1001におい
て,操作部から認識処理が指定されると,ステップS1
002では,スキャナ部101により原稿が読み取ら
れ,更に,ステップS1003では,マーカー検出処理
がなされる。 【0064】またステップS1004では,例えば認識
処理部112内に具備されている画像データ圧縮/解凍
手段により,認識処理部I/F334を介して供給され
る画像信号を圧縮し,ステップS1005で,画像メモ
リ121に記憶する。即ち,より具体的には,図9
(b)に示す本実施例の画像メモリ121のメモリマッ
プにおいて,入力イメージの領域908に記憶される。 【0065】次にステップS1006では,領域識別処
理部341により領域識別処理が行われ,該領域識別処
理で判定された領域情報は,領域識別結果1024とし
て画像メモリ121に格納される。 【0066】次にステップS1007では,領域識別処
理で判定された文字領域のデータに対して,OCR処理
部342によりスペルチェック辞書122aを参照しな
がら文字認識が行われ,文字認識結果1025として画
像メモリ121のOCR結果領域907に格納される。 【0067】次にステップS1008では,文字認識さ
れた語について所定の言語データに対訳するため,辞書
検索部343による辞書検索が行われ,訳語検索結果1
026として画像メモリ121の辞書検索結果領域90
6に格納される。 【0068】次にステップS1009では,画像メモリ
121に格納された領域識別結果1024,文字認識結
果1025及び訳語検索結果1026,並びに,画像メ
モリ121に記憶されている入力イメージを使用し,フ
ォントメモリ123を参照して,出力結果である対訳形
式画像及びまたは単語帳形式画像を所定フォーマットで
作画する。ここで,対訳形式画像は,画像メモリ121
の第1作画イメージ領域901または第2作画イメージ
領域903の一方に,また単語帳形式画像は他方に,そ
れぞれ前記画像データ圧縮/解凍手段により圧縮して格
納される(ステップS1010)。 【0069】更にステップS1010では,圧縮して格
納されている第1作画イメージ領域901及び第2作画
イメージ領域903内の対訳形式画像及びまたは単語帳
形式画像を解凍し復元して出力する。 【0070】ここで,図9において,実施例1または実
施例2における画像メモリ121のメモリマップ(図9
(a))と,本実施例におけるメモリマップ(図9
(b))とを比較して,本実施例の特徴的な点について
考察する。尚,通常,辞書122は,アクセス速度の比
較的遅い記憶媒体,例えばROMまたはメモリカード等
で実現され,画像メモリ121はアクセス速度の比較的
速い記憶媒体,例えばRAM等で実現されている。 【0071】図9より明らかなように,入力画像及び作
画データを圧縮して画像メモリ121に記憶しているの
で,画像メモリ121における領域を節約でき,フリー
のメモリ領域が増える。本実施例では,その空き領域を
以下のように活用している。 【0072】(1) 訳語データの格納 つまり,辞書検索結果のみを空き領域に格納し,辞書は
従来通り,ROM領域に格納している場合である。この
場合,辞書検索のアクセス速度は改善されないが,一度
辞書検索した結果を文字コードでRAM領域に格納する
ため,作画の際のメモリアクセスが速くなる。通常,辞
書は大容量なので圧縮形式で記憶されており,辞書検索
した際には必ず圧縮データの解凍作業を行う必要がある
が,一度解凍したデータをそのまま領域905に格納す
るので,辞書検索結果をアクセスする際に解凍する処理
を省くことができる。 【0073】(2) 辞書領域905への辞書データの格納 完全に圧縮辞書をRAM領域に格納できるので,辞書検
索におけるメモリアクセスが速くなる。 【0074】次に,図11は,本実施例の対訳画像形成
装置において,第1言語の抽出単語について辞書検索を
行い,該辞書検索結果から対訳形式と単語帳形式の出力
を同時に行う動作を説明するフローチャートである。即
ち,図11のフローチャートは,図10のステップS1
009の作画処理,ステップS1010の出力画像圧縮
処理,及び,ステップS1011の画像復元処理を詳細
に説明するものである。 【0075】先ずステップS1101では,領域識別結
果1024から得られる文字領域の1行を,画像メモリ
121の入力イメージ領域908から切り出して作画用
のメモリ領域(ここでは,第1作画イメージ領域90
1)にコピーする。 【0076】次にステップS1102では,ステップS
1101で切り出された行において,文字認識により抽
出された第1言語による単語について辞書検索を行い,
対応する訳語を得る。ここで得られた訳語は,ステップ
S1103で,辞書検索結果領域906に所定フォーマ
ットで記憶される。 【0077】次にステップS1104では,画像メモリ
121に第1作画テンポラリ領域902を確保し,該領
域に対訳形式による所定フォーマットの描画を行う。同
時にステップS1105でも,画像メモリ121に第2
作画テンポラリ領域904を確保し,該領域に単語帳形
式による所定フォーマットの描画を行う。 【0078】次にステップS1106では,ステップS
1104またはステップS1105による描画が,それ
ぞれ第1作画テンポラリ領域902または第2作画テン
ポラリ領域904を越えるか否かを判定する。描画が各
作画テンポラリ領域を越えない場合には,ステップS1
101に戻り,次の1行を切り出して同様の処理を繰り
返す。 【0079】また,描画が第1作画テンポラリ領域90
2及びまたは第2作画テンポラリ領域904を越える場
合には,ステップS1107に進んで,該作画テンポラ
リ領域のデータについてデータ圧縮を行う。 【0080】第1描画テンポラリ領域902のオーバー
フローの場合には,ステップS1108で,圧縮された
対訳形式のデータを第1作画イメージ領域901に格納
し,ステップS1110で,第1作画テンポラリ領域9
02の内容をクリアする。更にステップS1112で
は,1ページ分の対訳形式の描画が終了したか否かを判
定し,終了していない場合にはステップS1101に戻
って次の1行を切り出して上記処理を繰り返し,また終
了した場合にはステップS1114に進んで対訳形式の
出力を行う。 【0081】また,第2描画テンポラリ領域904のオ
ーバーフローの場合には,ステップS1109で,圧縮
された対訳形式のデータを第2作画イメージ領域903
に格納し,ステップS1111で,第2作画テンポラリ
領域904の内容をクリアする。更にステップS111
3では,1ページ分の単語帳形式の描画が終了したか否
かを判定し,終了していない場合には,ステップS11
01に戻って次の1行を切り出して上記処理を繰り返
し,また終了した場合には,ステップS1114に進ん
で単語帳形式の出力を行う。 【0082】尚,以上の処理の流れによれば,対訳形式
の1枚の出力に対して,単語帳形式の出力は複数回発生
する可能性がある。 【0083】〔実施例4〕次に,本発明の実施例4に係
る対訳画像形成装置について説明する。本実施例の対訳
画像形成装置は,入力画像及び作画データを圧縮して画
像メモリ121に記憶し,画像メモリ121における領
域を節約して作画2枚分のメモリ領域を確保し,また,
第1言語の抽出単語について辞書検索を行い,該辞書検
索結果から対訳形式と単語帳形式の出力を同時に行うも
のであり,その構成は,実施例1と同等で図1,図2及
び図3に示すものである。また,本実施例の概略の処理
動作については,実施例3と同様,図10のフローチャ
ートで示される流れに従う。 【0084】ここで,図12において,実施例1または
実施例2における画像メモリ121のメモリマップ(図
12(a))と,本実施例におけるメモリマップ(図1
2(b)〜図12(e))とを比較して,本実施例の特
徴的な点について考察する。尚,通常,辞書122は,
アクセス速度の比較的遅い記憶媒体,例えばROMまた
はメモリカード等で実現され,画像メモリ121はアク
セス速度の比較的速い記憶媒体,例えばRAM等で実現
されている。 【0085】図12(a)との対比から明らかなよう
に,本実施例では,入力画像及び作画データを圧縮して
画像メモリ121に記憶しているので,画像メモリ12
1における領域を節約でき,フリーのメモリ領域が増え
る。本実施例では,その空き領域を以下のように活用し
ている。 【0086】(1) 訳語データの格納(図12(b)参
照) つまり,辞書検索結果のみを空き領域に格納し,辞書は
従来通り,ROM領域に格納している場合である。この
場合,辞書検索のアクセス速度は改善されないが,一度
辞書検索した結果を文字コードでRAM領域に格納する
ため,作画の際のメモリアクセスが速くなる。通常,辞
書は大容量なので圧縮形式で記憶されており,辞書検索
した際には必ず圧縮データの解凍作業を行う必要がある
が,一度解凍したデータをそのまま領域1204に格納
するので,辞書検索結果をアクセスする際に解凍する処
理を省くことができる。 【0087】(2) 辞書データの格納(図12(c)参
照) 完全に圧縮辞書をRAM領域1214に格納できるの
で,辞書検索におけるメモリアクセスが速くなる。 (3) 辞書データ及び訳語データの格納(図12(d)参
照) 専門辞書等の複数の辞書を同時に使用する場合は,メモ
リ容量が幾らあっても足りない。そこで図12(b)及
び(c)のメモリマップを折衷させた案として,本案が
考えられる。使用頻度の高い辞書をRAM領域1224
に格納し,専門辞書についてはROM領域1229に置
き,更に,辞書検索を行った結果を訳語データとしてR
AM領域1225に記憶させるものである。 【0088】(4) 辞書データの格納,並びに,2枚分の
作画イメージ領域及び作画テンポラリ領域の確保(図1
2(e)参照) 上記(3) において,ページ計算結果の領域1223を削
除して総ページ数の出力を不要のものとし,使用頻度の
高い辞書をRAM領域1224に格納して辞書検索の高
速化を図り,2枚分の作画イメージ領域及び作画テンポ
ラリ領域の確保により,単語帳形式及び対訳形式の描画
出力を同時に行って,処理時間の短縮を図るものであ
る。以下の説明では,本案のメモリマップを採用するも
のとする。 【0089】次に,図13は,本実施例の対訳画像形成
装置において,第1言語の抽出単語について辞書検索を
行い,該辞書検索結果から対訳形式と単語帳形式の出力
を同時に行う動作を説明するフローチャートである。即
ち,図13のフローチャートは,図10のステップS1
009の作画処理,ステップS1010の出力画像圧縮
処理,及び,ステップS1011の画像復元処理を詳細
に説明するものである。 【0090】先ずステップS1301では,文字領域か
ら切り出された行の1単語について辞書検索を行い,対
応する訳語を得て,単語帳形式で描画する文字コードを
取得する。ここで得られた訳語は,辞書検索結果領域1
236に所定フォーマットで記憶される。 【0091】次にステップS1302では,ステップS
1301で得られた文字コードから対訳形式で描画する
文字コードを取得する。 【0092】次にステップS1303では,画像メモリ
121に第1作画テンポラリ領域1232を確保し,該
領域に対訳形式による所定フォーマットの描画を行う。
同時にステップS1304でも,画像メモリ121に第
2作画テンポラリ領域1234を確保し,該領域に単語
帳形式による所定フォーマットの描画を行う。 【0093】次にステップS1305では,ステップS
1303またはステップS1304による描画が,所定
行まで終了したか否かを判定する。所定行の描画が終了
していない場合には,ステップS1301に戻り,次の
1単語について同様の処理を繰り返す。 【0094】またステップS1305において,所定行
の描画が終了した場合には,ステップS1306に進ん
で,該作画テンポラリ領域のデータについてデータ圧縮
を行う。 【0095】対訳形式の描画が所定行となった場合に
は,ステップS1307で,圧縮された対訳形式のデー
タを第1作画イメージ領域1231に格納し,ステップ
S1309で,第1作画テンポラリ領域1232の内容
をクリアする。更にステップS1311では,1ページ
分の対訳形式の描画が終了したか否かを判定し,終了し
ていない場合にはステップS1301に戻って次の1単
語について上記処理を繰り返し,また1ページ分の描画
が終了した場合には,ステップS1313に進んで単語
帳と共通の描画済みの辞書検索結果を領域1236から
消去した後,ステップS1314で対訳形式の出力を行
う。 【0096】また,単語帳形式の描画が所定行となった
場合には,ステップS1308で,圧縮された対訳形式
のデータを第2作画イメージ領域1233に格納し,ス
テップS1310で,第2作画テンポラリ領域1234
の内容をクリアする。更にステップS1312では,1
ページ分の単語帳形式の描画が終了したか否かを判定
し,終了していない場合には,ステップS1301に戻
って次の1単語について上記処理を繰り返し,また1ペ
ージ分の描画が終了した場合には,ステップS1314
に進んで単語帳形式の出力を行う。 【0097】尚,本実施例では,対訳形式及び単語帳形
式の双方に既に描画済みの辞書検索結果情報について,
処理途中で消去することにより,更に画像メモリ121
の空き領域を増加させ,有効利用を図っている。 【0098】 【発明の効果】以上説明したように,本発明の請求項1
に係る対訳画像形成装置によれば,画像処理手段におい
て,読取画像情報から文字認識手段により文字認識し,
該認識した文字列から第1言語による単語を単語抽出手
段により抽出し,抽出単語に対応する訳語を訳語検索手
段により訳語記憶手段を検索して獲得し,検索した訳語
を対応する単語と共に出力画像生成手段により画像記録
手段に出力することとし,文字認識手段が,読取画像情
報から文字領域を認識し,文字領域として認識された領
域の先頭行の先頭文字のフォントを他文字のフォントと
比較して,文字領域として認識された領域の先頭行の先
頭文字のフォントが他文字のフォントよりも大きいと判
断した場合には,単語抽出手段は,該先頭文字のフォン
ト情報を考慮して単語抽出を行い,出力画像生成手段
は,該先頭文字を含む単語の画像生成においてフォント
情報を考慮して出力画像を生成することとしたので,段
組みの1文字目に他と異なるフォントが使用されている
場合にも,原稿を正確に認識すると共に正確な原語出力
を行い得る対訳画像形成装置を提供することができる。
【図面の簡単な説明】 【図1】本発明の実施例1に係る対訳画像形成装置の概
略構成図である。 【図2】実施例の対訳画像形成装置における画像処理部
を詳細に説明する説明図である。 【図3】図2におけるブロック202,編集処理部及び
認識処理部についてより詳細に示した構成図である。 【図4】実施例1の対訳画像形成装置の概略フローチャ
ートである。 【図5】図4のステップS408の作画処理において,
文字領域の先頭行について,先頭文字のフォントが次文
字のフォントよりも大きい場合に,別途行われる処理を
説明するフローチャートである。 【図6】従来の対訳画像形成装置における処理結果であ
る対訳形式の出力例を示す説明図である。 【図7】図6において段組みの1文字目が他の文字のフ
ォントより大きいために文字が分割され部分について,
実施例1により改善された出力結果を示す説明図であ
る。 【図8】実施例2の対訳画像形成装置の処理動作を説明
するフローチャートである。 【図9】図9(a)は実施例1または実施例2の対訳画
像形成装置における画像メモリのメモリマップ,図9
(b)は実施例3の対訳画像形成装置における画像メモ
リのメモリマップである。 【図10】実施例3の対訳画像形成装置の概略の処理動
作を説明するフローチャートである。 【図11】実施例3の対訳画像形成装置において,第1
言語の抽出単語について辞書検索を行い,該辞書検索結
果から対訳形式と単語帳形式の出力を同時に行う動作を
説明するフローチャートである。 【図12】図12(a)は実施例1または実施例2の対
訳画像形成装置における画像メモリのメモリマップ,図
12(b)〜図12(e)は実施例4の対訳画像形成装
置における画像メモリのメモリマップである。 【図13】実施例4の対訳画像形成装置において,第1
言語の抽出単語について辞書検索を行い,該辞書検索結
果から対訳形式と単語帳形式の出力を同時に行う動作を
説明するフローチャートである。 【符号の説明】 101 スキャナ部(CCD)(画像読取手段) 102 前処理部(増幅,A/D変換,シェーディング
補正部) 103 画像処理部(画像処理手段) 104 LD制御部 105 LD 106 LED制御 107 LEDA 108 CPU 109 CPU周辺の集積回路(IC) 110 エンジンユニット 111 編集処理部 112 認識処理部(画像処理手段) 121 画像メモリ(画像記憶手段,作業記憶手段) 122 辞書(訳語記憶手段) 122a スペルチェック辞書 122b 辞書 123 フォントメモリ 160,161,162 画像信号及び制御信号 161a ビデオ制御信号 161b 画像信号 172,173 シリアル信号 221 変倍回路 222 空間フィルタ回路 231 γ補正回路 232 階調処理部 333 2値化処理部 334 認識処理部I/F 341 領域識別処理部 342 OCR処理部(文字認識手段,単語抽出手段) 343 辞書検索部(訳語検索手段) 344 作画部(出力画像生成手段) 345 圧縮解凍部

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 原稿画像を光学的に読み取り,画像情報
    に変換する画像読取手段と,前記画像読取手段によって
    読み取った画像情報を記憶する画像記憶手段と,前記画
    像情報に対し各種画像処理を実行する画像処理手段と,
    前記画像処理手段が出力する画像信号に基づいて画像を
    記録媒体上に記録する画像記録手段と,を有する対訳画
    像形成装置において,前記画像処理手段は,前記読取画
    像情報から文字を認識する文字認識手段と,前記文字認
    識手段により認識した文字列から第1言語による単語を
    抽出する単語抽出手段と,前記第1言語による単語に対
    応する第2言語による訳語を記憶している訳語記憶手段
    と,前記訳語記憶手段から前記単語抽出手段により抽出
    された単語に対応する訳語を検索する訳語検索手段と,
    前記訳語検索手段により検索した訳語を対応する単語と
    共に前記画像記録手段に出力する出力画像生成手段と,
    を有し,前記文字認識手段は,前記画像読取手段により
    読み取った画像情報から文字領域を認識し,文字領域と
    して認識された領域の先頭行の先頭文字のフォントを他
    文字のフォントと比較し,文字領域として認識された領
    域の先頭行の先頭文字のフォントが他文字のフォントよ
    りも大きい場合には,前記単語抽出手段は,該先頭文字
    のフォント情報を考慮して単語抽出を行い,前記出力画
    像生成手段は,該先頭文字を含む単語の画像生成におい
    てフォント情報を考慮することを特徴とする対訳画像形
    成装置。
JP2002099229A 2002-04-01 2002-04-01 対訳画像形成装置 Pending JP2003016065A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002099229A JP2003016065A (ja) 2002-04-01 2002-04-01 対訳画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002099229A JP2003016065A (ja) 2002-04-01 2002-04-01 対訳画像形成装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP8130393A Division JPH09311859A (ja) 1996-05-24 1996-05-24 対訳画像形成装置

Publications (1)

Publication Number Publication Date
JP2003016065A true JP2003016065A (ja) 2003-01-17

Family

ID=19193652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002099229A Pending JP2003016065A (ja) 2002-04-01 2002-04-01 対訳画像形成装置

Country Status (1)

Country Link
JP (1) JP2003016065A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置

Similar Documents

Publication Publication Date Title
EP1027785B1 (en) Storage management system for document image database
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
EP0703524B1 (en) Variable data fields in a page description language
KR101332912B1 (ko) 화상 처리 장치, 화상 처리 방법 및 컴퓨터 판독가능 저장 매체
JP5376795B2 (ja) 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
CN102131020A (zh) 图像处理设备和图像处理方法
CN101600032A (zh) 信息处理装置、信息处理方法、控制程序及记录介质
KR102613255B1 (ko) 화상 처리 방법 및 화상 처리 시스템
JP2000306103A (ja) 情報処理装置及び方法
JP2003016065A (ja) 対訳画像形成装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
Zhou Are your digital documents web friendly?: Making scanned documents web accessible
JPH08180068A (ja) 電子ファイリング装置
JPH05303619A (ja) 電子スクラップブック
JPH09311859A (ja) 対訳画像形成装置
JP3424942B2 (ja) 対訳画像形成装置
JP2800254B2 (ja) 画像一文字処理装置
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
JPS62134765A (ja) 漢和辞書の電子検索方法
JPH0525139B2 (ja)
JPH05135150A (ja) 画像処理装置
JPH0696184A (ja) ドキュメント・データ圧縮管理および検索装置
JPS58223870A (ja) 画像編集装置
JPH06301731A (ja) 画像ファイル装置