JP3265014B2 - 対訳処理機能付き複写装置 - Google Patents

対訳処理機能付き複写装置

Info

Publication number
JP3265014B2
JP3265014B2 JP33361892A JP33361892A JP3265014B2 JP 3265014 B2 JP3265014 B2 JP 3265014B2 JP 33361892 A JP33361892 A JP 33361892A JP 33361892 A JP33361892 A JP 33361892A JP 3265014 B2 JP3265014 B2 JP 3265014B2
Authority
JP
Japan
Prior art keywords
image
character
processing
area
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33361892A
Other languages
English (en)
Other versions
JPH06164793A (ja
Inventor
多加子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP33361892A priority Critical patent/JP3265014B2/ja
Publication of JPH06164793A publication Critical patent/JPH06164793A/ja
Application granted granted Critical
Publication of JP3265014B2 publication Critical patent/JP3265014B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Facsimiles In General (AREA)
  • Combination Of More Than One Step In Electrophotography (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,原稿画像中の単語を認
識して,その単語と対応する訳語を出力する対訳処理機
能付き複写装置に関し,より詳細には,原稿画像の絵柄
領域と文字領域とを分離する像域分離手段と,文字領域
の文字を認識する文字認識手段と,認識した文字の対訳
を行う対訳手段とを備えた対訳処理機能付き複写装置に
関する。
【0002】
【従来の技術】他国語で記載された文章を読む人にと
り,該文章の多くの部分については読解に支障はない
が,単に特定の単語についてのみ適切な訳語を知らない
ため,読み進むことができないといった状況が多々あ
る。このような状況において,辞書を用いて該特定単語
の意味を知り,読み進むことはよく経験するところであ
る。
【0003】そこで,他国語で記載された文章を自動的
に対訳して出力する複写装置として,原稿画像中の単語
を認識して,その単語と対応する訳語を出力する対訳処
理機能付き複写装置も開発されている。この装置では,
原稿画像の絵柄領域と文字領域とを分離し,分離した文
字領域の文字認識(OCR)処理を行った後,認識した
文字の対訳を行い,原稿画像と共に対訳画像を出力する
ように構成されている。従って,上記の技術によれば,
原稿画像と共に文字情報に関する対訳画像が得られるの
で辞書を用いる手間を省くことができる。
【0004】
【発明が解決しようとする課題】しかしながら,上記の
対訳処理機能付き複写装置によれば,対訳処理は,領域
を識別し,その領域が文字領域であれば文字認識(OC
R)処理を行っているため,原稿に黒ベタ部が存在する
とOCR処理にかなり時間がかかるという問題点があっ
た。例えば,ブック物などの厚物や,給紙サイズより小
さい原稿を圧板開放状態で読み取ると,原稿の周囲に黒
ベタ部が発生し,原稿によっては黒ベタ部が多く存在す
ることになり,OCR処理は黒画素情報を見るため,処
理時間が長くなる。
【0005】また,従来の対訳処理機能付き複写装置に
おいて,OCR処理内において黒画素のランレングス情
報等をを用いて黒ベタ部を判断している場合もあるが,
多少処理時間が早くなる程度であり,結果的にはOCR
処理にかなり時間がかかっている。
【0006】
【0007】
【0008】
【0009】本発明は上記に鑑みてなされたものであっ
て,原稿の黒ベタ部に起因する無駄な処理時間の発生を
なくすことを目的とする。
【0010】
【0011】
【0012】
【0013】
【課題を解決するための手段】本発明は上記目的を達成
するために,原稿画像の絵柄領域と文字領域とを分離す
る像域分離手段と,文字領域の文字を認識する文字認識
手段と,認識した文字の対訳を行う対訳手段とから成る
対訳処理機能を備えた対訳処理機能付き複写装置におい
て,原稿画像の黒ベタ部を検出する黒ベタ部検出手段を
備え,像域分離手段は,黒ベタ部検出手段で検出した黒
ベタ部を除く原稿画像を像域分離の対象データとして,
絵柄領域と文字領域とを分離し、前記文字認識手段は、
黒ベタ部検出手段により検出された黒ベタ部を除去した
後の画像の像域分離手段により分離された文字領域に対
して文字認識処理することを特徴とする対訳処理機能付
き複写装置を提供するものである。
【0014】
【0015】
【0016】
【0017】
【作用】本発明の対訳処理機能付き複写装置(請求項
1)は,入力されてくる原稿画像(データ)の黒画素を
カウントし,所定のしきい値と比較して黒ベタ部を検出
し,その座標を記憶し,最初の黒ベタ部終了位置からO
CR処理を行わせる。即ち,全原稿画像内の黒ベタ部の
座標を記憶し,その領域はOCR処理しないようにして
処理時間を短縮させる。
【0018】
【0019】
【0020】
【0021】
【実施例】以下,本発明の対訳処理機能付き複写装置に
ついて,〔実施例1〕,〔実施例2〕,〔実施例3〕の
順に図面を参照して詳細に説明する。
【0022】〔実施例1〕図1は,実施例1の対訳処理
機能付き複写装置のブロック構成図を示し,複写装置全
体を制御するCPU101と,原稿画像を読み取るスキ
ャナ102と,画像処理全般を行う画像処理部103
と,スキャナ102から読み込んだ画像を出力するプリ
ンタ104,各種キー入力及びメッセージの表示等を行
うための操作部105と,対訳処理機能を実行する際の
制御を行う対訳処理用CPU106と,読み込んだ画像
の像域及び領域を認識する像域・領域識別部107と,
像域・領域識別部107で認識した結果を所定のフォー
マットに格納する認識結果作成部108と,認識結果作
成部108の結果データに基づいて後述するRAM10
3上に作画を行うための作画用データを作成する作画用
データ作成部109と,作画用データ作成部109の作
画用データ作成のために出力訳語を検索する辞書検索部
110と,作画用データ作成部109の作画用データに
基づいて後述するRAM103上に作画する作画部11
1と,辞書検索部110が検索する辞書及び使用するフ
ォント,対訳処理のコードが格納されたROM112
と,入出力画像,結果データ,作画データ,対訳処理の
データ等が格納されるRAM113と,画像の黒ベタ部
を検出する黒ベタ部検出部114とから構成される。
【0023】図2は,黒ベタ部検出部114のブロック
図を示す。本実施例では,図1に示したように黒ベタ部
検出部114を独立して設けてあるが,例えば,画像処
理部103の内部に設けて,本体の読取画像データを2
値化した後に黒ベタ部検出を行って良い。
【0024】ここで,黒ベタ部の検出方法としては,例
として以下の2つを示すが黒画素が連続している事に着
目して検出を行うことが,基本概念である。 (1) 処理原稿の1ライン中の黒画素の個数をカウン
トし,その個数が所定のしきい値以上であればそのライ
ンを黒ベタ部の候補とする。この候補ラインが一定ライ
ン続いたらその開始ラインから終了ラインまでを黒ベタ
部として記憶する。 (2) 所定ライン離れたラインの総黒画素数の差分を
とりその差分値が,所定値以上であることが一定回数続
いたらその開始ラインを,黒ベタ部とOCR処理を行わ
せる部分の境界とする。
【0025】図2では,(1)の方法を用いて黒ベタ部
検出部114を構成した場合のブロック図を示し,コン
パレータ201と,DF/F(D型フリップフロップ)
202と,イネーブルカウンタ203と,コンパレータ
204と,ラインカウンタ205と,セレクタ206
と,DF/F207と,DF/F208とで構成され
る。黒ベタ部検出部114では,先ず,コンパレータ2
01でスキャナ102から入力される多値データをTh
reshold1(しきい値)と比較して,対訳処理画
像用に2値化する。DF/F202は,2値化したデー
タを入力し,黒画素が所定画素連続したら出力BからH
ighを出力する。イネーブルカウンタ203は,この
High出力の回数をカウントし,ラインクロックに基
づいて1ライン辺りの黒画素数を出力する。コンパレー
タ204は,1ライン辺りの黒画素数をThresho
ld2(しきい値)と比較して,Threshold2
の値以上であれば,その時のY座標をDF/F207で
ラッチする。この時最初にThreshold2を越え
た値をY1として記憶しておく。その後,ラインカウン
タ205,セレクタ206,DF/F207,DF/F
208によってY1がLowになるまでY座標の値を更
新しYnを得る。即ち,Y1〜Ynの間が黒ベタ部とな
る。従って,OCR処理においてライン(Y座標)がY
1に達した場合,OCR処理を行うY座標をYn+1ま
で進めて,黒ベタ部をスキップすることが可能となる。
【0026】以上の構成において,その動作を説明す
る。図3は,実施例1の対訳処理機能付き複写装置の制
御動作の概要を示すフローチャートである。操作部10
5に於て対訳命令が入力されると,スキャナ102で原
稿画像を読み取り,画像入力を行う(S301)。次
に,黒ベタ部検出部114において,入力された画像の
黒ベタ部を検出して,除去する(S302)。黒ベタ部
除去後の画像を像域・領域識別部107で像域及び領域
の識別を行う(S303)。
【0027】S303で識別された文字領域において,
領域識別された領域内の行数,行の位置,前記行内の文
字数,文字位置の認識を行う(S304)。公知のOC
R技術を用いて認識された文字領域の文字認識を行い
(S305),認識された結果を所定のフォーマットで
RAM113に格納する(S306)。このとき,分割
英単語(例えば,−:ハイフン)のようなのような特殊
記号を含んだ単語の検索を行う構成の場合,S305の
OCR処理において特殊文字の検索,制御を行う(S3
05−1)。これは,辞書検索を行う1単位と見なされ
た文字列中の特殊記号または登録された文字,記号を認
識し,前記記号または文字の前後の文字を1つの辞書検
索単位として見なす。この時,行末に所定記号(一般に
はハイフン)が認識された場合はその前後の文字列を各
々辞書検索単位と見なさず,次の文字列(次の行頭の単
語)と連結させて辞書検索1単位とする動作を行い,S
306のフォーマットは特殊文字を考慮した形式でRA
M113に格納する。
【0028】S305認識された文字の辞書検索を行う
(S307)。S306で格納された認識結果データ,
及び辞書検索結果から所定のフォーマットで作画用デー
タを作成しRAM113に格納する(S308)。S3
08で作成された作画用データ情報に基づいて作画を行
う,即ち,出力画像を作成してRAM113に格納する
(S309)。続いて,プリンタ104で対訳処理が施
された出力画像を出力する(S310)。
【0029】図4は,図3の動作を実行させるための本
体CPU(CPU101)と対訳CPU(対訳処理用C
PU106)との通信プロトコルの概略を示す。ここ
で,図4のA,Bの部分以外で割り込みが発生した場合
は,対訳処理において割り込みフラグをセットし,フラ
グがセットされている間はホールド状態とし,対訳処理
を中断させる。ここで,図4のAはOCR処理,Bは作
画処理の部分であり,通常はユーザーに現在全体の処理
のうち何%処理が終了しているかを知らせるために%値
を対訳CPUから本体に送信している。また,割込みの
入力は,操作部105の割込みキー(複写装置に一般的
に装備されているキー)を用いて入力する。
【0030】図5は,図4のA,Bの部分で割り込みが
発生した場合の通信プロトコルの概略を示す。OCR処
理中に割り込みが発生した場合,他の場合と同じ様に対
訳処理において割り込みフラグをセットする。この場
合,処理はそのまま続行させ,割り込みフラグがセット
されている時は,現時点での終了%値の送信を禁止させ
るようにする。この結果,本体CPUと対訳CPUは互
いに独立状態となり各処理を実行することができる。
【0031】図5の例はOCR処理中に割り込みが解除
されている例であり,割り込み処理を行っている間に処
理が0%から80%まで進行したことを示すものであ
る。ここで,割り込み処理が解除される前にOCR処理
が100%終了した場合は,他の割り込み処理と同じ様
に100%終了した時点においてホールド状態にしてお
く。
【0032】前述したように実施例1では,黒ベタ部を
ハード構成を用いて除去することによりOCR処理時間
が早くなる。即ち,原稿の黒ベタ部に起因する無駄な処
理時間の発生をなくすことができる。また,対訳処理中
に割り込みをかけて,複写動作や他のアプリケーション
を動作させることができると同時に,対訳動作をバック
グランドで走らせているため,対訳処理に長い時間かか
た場合でも複写処理或いは他のアプリケーション処理を
利用可能とし,装置資源の使用効率及び装置の利便性を
向上させることができる。
【0033】〔実施例2〕図6は,実施例2の対訳処理
機能付き複写装置の制御動作の概要を示すフローチャー
トであり,図3のS302の黒ベタ部検出処理に代えて
S601〜S605を行うようにしたものである。尚,
他の構成は実施例1と同様につき図示及び説明を省略す
る。
【0034】実施例2では,先ず,S301で画像入力
を行った後,入力した画像の複数箇所において文字方向
の検出を行う(S601)。これは,1箇所だけ文字方
向検出を行ってもそこに文字データが存在しない場合が
あるためである。具体的には,黒画素検出を行って,黒
画素が検出された座標から,OCR処理の性能の最大ポ
イント数分の領域を目安として,正常方向にOCR(文
字認識)を行う。この時該当文字が存在しなかったら,
その領域を90度回転させて同様にOCR処理を行う。
このようにして,180度,270度についてOCR処
理を行い該当する文字が存在した方向が0度以外であれ
ば(S602),S604で回転角度に基づいて,画像
を回転させ,後続のスッテプで該当方向の画像先端位置
からOCR処理を開始する。
【0035】S604の画像回転処理では,例えば,時
計回りに90度回転していたら,座標(Xmax,0)
を(0,0)と見なすように処理する。これは,実際に
メモリ中の画像を回転させてもよいが時間がかかってし
まうためである。従って,座標の変換(回転処理)に伴
って,OCR処理後(図3のS305)において,認識
結果データを格納する際に,原稿方向が0度以外の場合
は,認識座標位置が回転する前の座標位置に相当するよ
うに中間処理を施す必要がある。但し,メモリ内の画像
回転を行った場合は,前記中間処理は必要ない。
【0036】ここで,情報量が多い場合は処理時間がか
かるため,画像が回転していることを操作部105を用
いて表示して知らせ(S605),ユーザーに原稿を正
しくセットしてもらい再度対訳処理を開始するような設
定にすることも可能である。具体的には,予め,文字が
回転している場合に処理を続行するか否かの設定を操作
部105で行い,該設定に基づいてS603で処理を続
行するか否かの判定を行うことにより,実施される。
【0037】前述したように実施例2では,処理方向に
対して文字方向が回転している場合でも,文字方向の回
転によって無駄になる処理時間をなくし,且つ,確実に
OCR処理を行えるようにすることができる。換言すれ
ば,ユーザーがどの方向に原稿を載置しても対訳処理を
行うことができる。また,予め,処理の中断を選択する
ことにより,原稿方向が間違っていることをユーザーに
知らせて,原稿を置き直してもらい,時間を節約する形
式をとることもできる。
【0038】〔実施例3〕実施例3の対訳処理機能付き
複写装置は,ユーザーの使用する原稿の傾向によって対
訳処理の処理時間に制限時間を設定でき,無駄な処理を
行わず,時間効率をあげることができるようにしたもの
である。基本的な構成は実施例1と同様であるので図示
及び説明を省略する。
【0039】図7は,実施例3の動作を実行させるため
の本体CPU(CPU101)と対訳CPU(対訳処理
用CPU106)との通信プロトコルの概略を示す説明
図である。ここで,複写装置に備わっている時計(なけ
ればクロックをカウントして作成する)を用いて,対訳
処理の実行開始からの経過時間を測定する。
【0040】先ず,操作部105を介して,対訳処理の
制限処理時間を設定する。例えば,分単位で時間の設定
を行う。OCR処理が開始されると(通信プロトコルの
OCR処理0%が本体CPUに送信されてから)本体C
PUはタイマーをセットする。OCR処理100%が,
対訳CPU側から送信されないうちに設定時間(制限処
理時間)が経過したら,図7に示すように時間が経過し
たことを対訳CPUに送信する。これは,通信コードが
異なるだけで割り込み処理と全く同様の概念である。従
って,対訳処理において割り込みフラグをセットする。
但し,実施例1と同様に通信を禁止するのみでOCR処
理は進行させる。
【0041】一方,本体側では前記の時間が経過を対訳
に送信すると同時にユーザーに警告メッセージを表示し
処理を続行するか,終了するかを選択させる。ユーザー
が処理続行を選択した場合は,割り込みフラグを解除し
処理を続ける。この時,本体側では再びタイマーのセッ
トを行う。逆に,ユーザーが処理終了を選択すれば初期
状態にもどる。
【0042】前述したように実施例3によれば,予め設
定した制限時間に基づいて,処理の続行或いは終了を選
択できるので,OCRの仕様からかけ離れた不適当な原
稿等の場合に発生する無駄な処理時間を回避することが
できる。
【0043】
【発明の効果】以上説明したように本発明の対訳処理機
能付き複写装置は,原稿画像の絵柄領域と文字領域とを
分離する像域分離手段と,文字領域の文字を認識する文
字認識手段と,認識した文字の対訳を行う対訳手段とか
ら成る対訳処理機能を備えた対訳処理機能付き複写装置
において,原稿画像の黒ベタ部を検出する黒ベタ部検出
手段を備え,像域分離手段は,黒ベタ部検出手段で検出
した黒ベタ部を除く原稿画像を像域分離の対象データと
して,絵柄領域と文字領域とを分離するため,原稿の黒
ベタ部に起因する無駄な処理時間の発生をなくすことが
できる。
【0044】
【0045】
【0046】
【図面の簡単な説明】
【図1】実施例1の対訳処理機能付き複写装置のブロッ
ク構成図である。
【図2】黒ベタ部検出部のブロック図である。
【図3】実施例1の対訳処理機能付き複写装置の制御動
作の概要を示すフローチャートである。
【図4】図3の動作を実行させるための本体CPUと対
訳CPUとの通信プロトコルの概略を示す説明図であ
る。
【図5】図4のA,Bの部分で割り込みが発生した場合
の通信プロトコルの概略を示す説明図である。
【図6】実施例2の対訳処理機能付き複写装置の制御動
作の概要を示すフローチャートである。
【図7】実施例3の動作を実行させるための本体CPU
と対訳CPUとの通信プロトコルの概略を示す説明図で
ある。
【符号の説明】
101 CPU 102 スキ
ャナ 103 画像処理部 104 プリ
ンタ 105 操作部 106 対訳
処理用CPU 107 像域・領域識別部 108 認識
結果作成部 109 作画用データ作成部 110 辞書
検索部 111 作画部 112 RO
M 113 RAM 114 黒ベ
タ部検出部 201 204 コンパレータ 202 207 208 DF/F(D型フリップフ
ロップ) 203 イネーブルカウンタ 205 ラインカウンタ 206 セレ
クタ

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 原稿画像の絵柄領域と文字領域とを分離
    する像域分離手段と,文字領域の文字を認識する文字認
    識手段と,認識した文字の対訳を行う対訳手段とから成
    る対訳処理機能を備えた対訳処理機能付き複写装置にお
    いて,前記原稿画像の黒ベタ部を検出する黒ベタ部検出
    手段を備え,前記像域分離手段は,前記黒ベタ部検出手
    段で検出した黒ベタ部を除く原稿画像を像域分離の対象
    データとして,絵柄領域と文字領域とを分離し、 前記文字認識手段は、黒ベタ部検出手段により検出され
    た黒ベタ部を除去した後の画像の前記像域分離手段によ
    り分離された文字領域に対して文字認識処理 することを
    特徴とする対訳処理機能付き複写装置。
JP33361892A 1992-11-19 1992-11-19 対訳処理機能付き複写装置 Expired - Fee Related JP3265014B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33361892A JP3265014B2 (ja) 1992-11-19 1992-11-19 対訳処理機能付き複写装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33361892A JP3265014B2 (ja) 1992-11-19 1992-11-19 対訳処理機能付き複写装置

Publications (2)

Publication Number Publication Date
JPH06164793A JPH06164793A (ja) 1994-06-10
JP3265014B2 true JP3265014B2 (ja) 2002-03-11

Family

ID=18268069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33361892A Expired - Fee Related JP3265014B2 (ja) 1992-11-19 1992-11-19 対訳処理機能付き複写装置

Country Status (1)

Country Link
JP (1) JP3265014B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data

Also Published As

Publication number Publication date
JPH06164793A (ja) 1994-06-10

Similar Documents

Publication Publication Date Title
JP4631133B2 (ja) 文字認識処理のための装置、方法及び記録媒体
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP2005073015A (ja) 画像処理装置及び画像処理方法及びコンピュータプログラム
US20130308862A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JPH04195692A (ja) 文書読取装置
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
JPH11341229A (ja) 画像処理装置及び画像処理方法
JP3265014B2 (ja) 対訳処理機能付き複写装置
JP2006279107A (ja) 画像処理装置及び画像処理方法
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JPH06150061A (ja) 文書認識装置
EP3940628A1 (en) Image processing device, image reading device, image processing method, and program
JP7342518B2 (ja) 画像処理装置及び画像処理プログラム
JPH11213089A (ja) 画像処理装置及びその方法
JP4109738B2 (ja) 画像処理方法及び装置及びその記憶媒体
US8736912B2 (en) Image processing apparatus, image processing method and computer readable medium
JPH0981672A (ja) 文書読取装置
JP2023123124A (ja) 文書分割装置および文書分割判定方法とプログラム
JP2001338263A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JPH1011530A (ja) 画像入出力方法及び装置
JP2002262093A (ja) 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体
JP2021189859A (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
JPH10171924A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees