JPH11213089A - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法

Info

Publication number
JPH11213089A
JPH11213089A JP10011765A JP1176598A JPH11213089A JP H11213089 A JPH11213089 A JP H11213089A JP 10011765 A JP10011765 A JP 10011765A JP 1176598 A JP1176598 A JP 1176598A JP H11213089 A JPH11213089 A JP H11213089A
Authority
JP
Japan
Prior art keywords
character
document
recognition
image
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10011765A
Other languages
English (en)
Inventor
Yasuki Nakajima
康喜 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10011765A priority Critical patent/JPH11213089A/ja
Publication of JPH11213089A publication Critical patent/JPH11213089A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来のOCRにより両面原稿における文字及
びその方向を認識する場合、裏写りの発生により、余分
な文字までもが認識されてしまうと同時に、その数によ
っては文書方向も誤判定された。 【解決手段】 文字認識/方向判別部402において文
字認識辞書407を参照して文字認識/方向判別処理を
行なう際に、対象原稿が両面原稿である場合、上下及び
左右対称文字、更にアルファベット文字を文字認識の対
象外とすることにより、両面原稿特有の裏写りによる文
書方向の誤判定を回避することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理装置及びそ
の方法に関し、例えば光学的文字認識を行なう画像処理
装置及びその方法に関する。
【0002】
【従来の技術】従来、デジタル複写機およびスキャナ等
の画像処理装置において、特にCCD等の光電変換素子
により読み取った文書画像内の文字及びその方向を認識
する光学的文字認識(OCR)機能を備えた装置が知ら
れている。このようなOCR機能を備えた画像処理装置
においては、原稿の両面に文字画像が印刷されている両
面原稿であっても、片面原稿と同様の処理を行なうこと
により、それぞれの面毎に記載された文字とその方向を
認識することが可能であった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来のOCR機能を備えた画像処理装置においては、両面
原稿における文字及びその方向を認識する場合、本来読
み取るべき印刷面の文字とともに、裏面の文字まで読み
取ってしまうという、いわゆる裏写りが発生することが
有る。この場合、裏写りした文字の多くは通常の文字の
鏡像文字となるため文字認識は不可能であるが、例えば
アルファベットの「E」及び「A」のような、上下又は
左右が対称である文字は、裏写りした場合にも本来読み
取るべき印刷面の文字として認識されてしまっていた。
従って、読取るべき印刷面において、余分な文字までも
が認識されてしまうと同時に、その数によっては文書方
向も誤判定されてしまう可能性があった。
【0004】本発明は上述した問題を解決するためにな
されたものであり、光学的文字認識機能によって、両面
原稿における文字及びその方向を認識する場合、裏写り
による文書方向の誤判定を回避する画像処理装置及びそ
の方法を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
の一手段として、本発明の画像処理装置は以下の構成を
備える。
【0006】即ち、原稿を光学的に読取って画像データ
を入力する画像入力手段と、前記画像データ中に含まれ
る文字及びその方向を認識する文字認識手段と、を有
し、前記文字認識手段は、前記原稿の両面に画像が印刷
されている場合、所定の文字を認識対象外とすることを
特徴とする。
【0007】例えば、前記文字認識手段は、前記原稿の
両面に画像が印刷されている場合、上下対称の文字を認
識対象外とすることを特徴とする。
【0008】例えば、前記文字認識手段は、前記原稿の
両面に画像が印刷されている場合、更に左右対称の文字
を認識対象外とすることを特徴とする。
【0009】例えば、前記文字認識手段は、前記原稿の
両面に画像が印刷されている場合、更にアルファベット
文字を認識対象外とすることを特徴とする。
【0010】更に、文字認識辞書を保持する保持手段を
有し、前記文字認識手段は、前記文字認識辞書を参照す
ることにより、文字及びその方向を認識することを特徴
とする。
【0011】更に、前記原稿が両面に画像が印刷されて
いる両面原稿であることを指示する指示手段を有し、前
記文字認識手段は、前記指示手段により前記原稿が両面
原稿であることが指示された場合、所定の文字を認識対
象外とすることを特徴とする。
【0012】
【発明の実施の形態】以下、本発明に係る一実施形態に
ついて、図面を参照して詳細に説明する。
【0013】<第1実施形態> ●装置概要 図1は、本実施形態における画像処理装置の側断面図で
ある。同図において、101は原稿台ガラスであり、原
稿自動送り装置142から給送された原稿が順次、所定
位置に載置される。102は例えばハロゲンランプによ
り構成される原稿照明ランプで、原稿台ガラス101に
載置された原稿を露光する。103,104,105は
走査ミラーであり、図示しない光学走査ユニットに収容
され、往復運動しながら、原稿からの反射光をCCDユ
ニット106に導く。CCDユニット106はCCDに
原稿からの反射光を結像させる結像レンズ107、CC
D等により構成される撮像素子108、撮像素子108
を駆動するCCDドライバ109等から構成されてい
る。撮像素子108からの画像信号出力は、例えば8ビ
ットのデジタルデータに変換された後、コントローラ部
139に入力され、後述する文書方向判別処理に供され
る。
【0014】また、110は感光ドラムであり、前露光
ランプ112によって画像形成に備えて除電された後、
1次帯電器113によって一様に帯電される。117は
露光手段であり、例えば半導体レーザ等で構成され、画
像処理や装置全体の制御を行うコントローラ部139で
処理された画像データに基づいて、感光ドラム110を
露光し、静電潜像を形成する。118は現像器であり、
黒色の現像剤(トナー)が収容されている。119は転
写前帯電器であり、感光ドラム110上に現像されたト
ナー像を用紙に転写する前に高圧をかける。120,1
22,124は給紙ユニットであり、各給紙ローラ12
1,123,125の駆動により、転写用紙が装置内へ
給送され、レジストローラ126の配設位置で一旦停止
し、感光ドラム110に形成された画像との書き出しタ
イミングがとられて再給送される。127は転写帯電器
であり、感光ドラム110に現像されたトナー像を給送
される転写用紙に転写する。128は分離帯電器であ
り、転写動作の終了した転写用紙を感光ドラム110よ
り分離する。転写されずに感光ドラム110上に残った
トナーは、クリーナ111によって回収される。
【0015】129は搬送ベルトであり、転写プロセス
の終了した転写用紙を定着器130に搬送し、転写用紙
上のトナー像は例えば熱により定着される。131はフ
ラッパであり、定着プロセスの終了した転写用紙の搬送
パスを、ステイプルソータ132または中間トレイ13
7の配置方向のいずれかに制御する。ステイプルソータ
132に排紙された用紙は各ビンに仕分けされ、コント
ローラ部139からの指示により、ステイプル部141
がステイプル処理を行う。133〜136は給送ローラ
であり、一度定着プロセスの終了した転写用紙を中間ト
レイ137に反転(多重転写時)または非反転(両面転
写時)して給送する。138は再給送ローラであり、中
間トレイ137に載置された転写用紙を再度、レジスト
ローラ126の配設位置まで搬送する。
【0016】コントローラ部139には、後述するマイ
クロコンピュータ、画像処理部等を備えており、操作パ
ネル140からの指示に従って、前述の画像形成動作を
制御する。また、操作パネル140上には図示しない両
面原稿キーがあり、このキーが操作者によって押下され
ることにより、読み取る原稿が両面原稿であるという情
報がコントローラ部139に伝わる。
【0017】図2にコントローラ部139の詳細ブロッ
ク構成を示し、説明する。
【0018】201は画像処理装置全体の制御を行うC
PUであり、装置本体の制御手順(制御プログラム)を
記憶した読み取り専用メモリ(ROM)203からプロ
グラムを順次読み取り、実行する。CPU201のアド
レスバスおよびデータバスは、バスドライバ/アドレス
デコーダ回路202を経て後述する各負荷に接続されて
いる。また、204は入力データの記憶や作業用記憶領
域等として用いる主記憶装置であるところのランダムア
クセスメモリ(RAM)である。205はI/Oインタ
フェースであり、操作者がキー入力を行い、装置の状態
等を液晶、LEDを用いて表示する操作パネル140
や、給紙系、搬送系、光学系の駆動を行うモータ類20
7、クラッチ類208、ソレノイド類209、また、搬
送される用紙を検知するための紙検知センサ類210等
の各負荷に接続される。現像器118には、現像器内の
トナー量を検知するトナー残検センサ211が配置され
ており、その出力信号がI/Oインタフェース205に
入力される。215は高圧制御ユニットであり、CPU
201の指示に従って、図1に示した1次帯電器11
3、現像器118、転写前帯電器119、転写帯電器1
27、分離帯電器128における高圧を制御する。
【0019】206は画像処理部であり、CCDユニッ
ト106から出力された画像信号が入力され、後述する
画像処理を施した画像データに従って、レーザユニット
117の制御信号を出力する。レーザユニット117か
ら出力されるレーザ光は感光ドラム110を照射し露光
するとともに、非画像領域において、受光センサである
ところのビーム検知センサ213によって発光状態が検
知され、その出力信号がI/Oインタフェース205に
入力される。
【0020】図3に、画像処理部206の詳細ブロック
構成を示し、説明する。
【0021】CCD108により電気信号に変換された
画像信号は、まずシェーディング回路301によって画
素間のばらつきの補正を行った後、変倍回路302にお
いて、縮小コピー時はデータの間引き処理を行い、拡大
コピー時はデータの補間を行う。次に、エッジ強調回路
303において、例えば5×5のウインドウによる2次
微分を行い、画像のエッジを強調する。尚、入力される
画像データは輝度データであるため、印刷出力を行なう
ための濃度データに変換するためγ変換回路304でテ
ーブルサーチを行なうことによりデータ変換を行う。濃
度データに変換された画像データは2値化処理部305
へ入力される。ここでは、例えばED法(誤差拡散法)
により多値データを2値データに変換する。2値に変換
された画像データは合成回路307に入力され、入力さ
れた画像データと例えばDRAMやハードディスクによ
り構成される画像用メモリ310内の画像データを選択
的に出力する。この画像用メモリ310に対するリード
ライト制御はメモリ制御部309で行い、画像を回転さ
せる場合はメモリ内の画像データの読み出しアドレスを
制御することで行う。画像合成回路307より出力され
た画像データは、レーザの発光強度の信号に変換するた
めPWM回路308へ入力され、画像の濃度に従ったパ
ルス幅をレーザユニット117に対して出力する。
【0022】次に、図4〜図9、図11を参照して、本
実施形態における文書方向判別処理について説明する。
【0023】図4は、文書方向判別部306の詳細構成
を示すブロック図である。
【0024】撮像素子108から出力された画像データ
は、CPU/メモリ部401に入力され、画像データを
一時的に保存するとともに、後述する各種制御を行う。
例えば、コントローラ部139内のCPU301とは不
図示のデュアルポートRAMによりバス接続されてお
り、データの送受信が可能である。もちろん、シリアル
通信を行なうように構成しても良い。
【0025】文字認識/方向判別部402においては、
予め記憶されている文字認識辞書407を参照すること
により、文字認識処理及び文書方向の判別処理を行な
う。ここでは、文書の方向を一番正確に表しているのは
文字であることに着目し、文書方向を判別する。具体的
には、文書中の数種類の文字領域に対し、0°,90
°,180°,270°の各方向からそれぞれ文字認識
処理を行い、各方向における文字認識の精度(文字認識
の自信度:文字の特徴分布に対する距離)の中で、最高
精度である方向を文書方向であるとして認識する。
【0026】領域分離部403は、文字認識/方向判別
部402による文字認識・方向判別処理を行うための前
処理として、文書画像データより、文字部、図形部、自
然画部、表部などを矩形の領域に分離して、各領域の属
性を付加する処理を行う。
【0027】記憶装置404は、例えばハードディスク
や光磁気ディスクなどにより構成され、各種処理結果
(画像データ、領域分離結果、文字認識結果など)を保
存する。またI/F部405は、SCSIやRS232
Cなどにより構成され、I/F部405を介して接続さ
れた外部コンピュータ203より情報を得たり、また、
光磁気ディスク等の着脱可能な記憶装置の装填によりデ
ータを得る。 ●動作概要 次に、本実施形態における文字認識/方向判別処理の概
要を図5のフローチャートに従って説明する。この処理
は、上述した文字認識/方向判別部402において行わ
れるものである。
【0028】文書認識/方向判別部402に入力された
多値の画像データは、まず領域分離部403により、文
字部、図形部、自然画部、表部などの属性別に、矩形の
領域(ブロック)に分離される(ステップS1,S
2)。この領域分離処理においては、具体的には矩形で
囲まれた領域情報を作成する。
【0029】次に、各属性より文字部、即ち文字領域の
矩形情報を抽出する(ステップS3)。ここで文字領域
とは、文章部、タイトル部、表中の文字、図のキャプシ
ョン部等である。例えば、図6(a),(c)に示す様
な文書の場合、それぞれ図6(b),(d)に示したよ
うな文字領域の矩形情報が抽出される。そして、これら
の中の数ブロックを用いて、文書方向判別を行う(ステ
ップS4)。その判別の結果、文書方向が正方向であれ
ば、引き続き画像中の文字ブロックに対して文字認識処
理を行う。(ステップS7)。
【0030】一方、文書方向が不正方向であれば、画像
データが正方向になるように回転させる(ステップS
5)。そして、回転画像に対して領域分離を行い、領域
分離情報の補正処理を行う(ステップS6)。これは、
回転画像に伴う領域分離情報の相違を補正するもので、
その方法としては、全回転画像データに対して再び領域
分離処理を行う方法がある。また、もう1つの方法とし
て、既に得られている領域分離結果に対してアドレス変
換をかける方法がある。一般に、領域分離処理は画像が
正方向であることを前提としているため、ステップS2
の段階で行った領域分離処理と、ステップS6において
回転画像データに対して行った領域分離処理とでは、そ
の結果が異なることが多い。それゆえ、ステップS6に
おいては前者の再分離方法がとられるのが望ましい。次
にステップS7に進んで、回転画像データ中の文字ブロ
ックは、周知の文字認識処理により、含まれる文字が認
識される。
【0031】従って、上述したように回転なし/回転あ
りのいずれの場合においても、領域分離情報及び文字認
識情報が得られる(ステップS8)。
【0032】この処理結果は、I/F部405を介して
コンピュータ406に伝送され、コンピュータ406上
のファイリングのアプリケーションソフトウェア等で利
用される。また、コントローラ部139内のCPU20
1へ各画像毎に送信される。 ●領域分離、方向判定、文字認識処理の詳細説明 次に、上述したステップS2及びS6における領域分離
処理、ステップS4における文書方向判別処理、ステッ
プS7における文字認識処理のそれぞれについて、詳細
に説明する。 [領域分離処理]本実施形態における領域分離処理は、
まず、文書画像データの黒画素を検出してゆき、輪郭線
追跡、またはラベリング方式により、黒画素ブロックの
矩形枠を作成する。次に、その矩形の中の黒画素密度、
隣接矩形ブロックの有無、矩形の縦横比率などを判断基
準にして、文字領域(タイトル、本文、キャプション
等)、図形領域、自然画領域、表領域などを判別する。 [文字認識処理]文字認識処理の一つの方法として、特
徴ベクトル抽出、比較方式がある。例えば図7(a)に
示すように、「本」という文字を含む文字領域が判別さ
れたとする。第一段階として、この文字領域について文
字切り出し処理を行う。この例を図7(b)に示す。こ
れは、一つの文字の矩形を切り出す処理で、黒画素連続
性の状態を検出していくことにより、求められる。そし
て第二段階として、一文字をm×n(例えば64×6
4)の画素ブロックに切り出す。この例を図7(c)に
示す。そして、その中から3×3画素のウインドウをず
らしてゆき、数十個の方向ベクトル情報を得る。この一
例を図7(d)に示す。このベクトル情報が文字の特徴
として認識され、この特徴ベクトルと文字認識辞書40
7の内容とを比較して、特徴ベクトルに特徴が一番近い
文字から順番に文字を抽出する。この場合、特徴ベクト
ルに対する特徴の近さが、その文字に対する距離の近
さ、すなわち文字認識の自信度(精度)という数値で表
される。 [文書方向判別処理]以上説明したようにして文字認識
の自信度が求められるが、その自信度に基づいた文書方
向判別処理を、図8に示した「本発明の名称」という文
例を用いて説明する。
【0033】図8(a)は正方向の文、図8(b)は図
8(a)を270°回転した文である。ここで、「本」
の文字に注目すると、文字方向を判別する場合は、図8
(c)に示すように、1つの文字「本」について0°,
90°,180°,270°の各回転による4方向のそ
れぞれにおいて文字認識を行ってみる。尚、上記各回転
角度は,文字矩形の領域の読み出し方を変更すればよ
く,特に原稿を回転する必要はない。
【0034】各回転角度における文字認識結果は、図8
(c)に示すように、互いに異なっている。尚、図8
(c)に示した文字認識結果および自信度はあくまでも
一例に過ぎず、実際にこの通りに得られるとは限らな
い。
【0035】図8(c)に示すように、正方向(0°回
転)から文字認識を行った場合は、「本」と正しく認識
され、その自信度も0.90と高い値となる。また、9
0°回転した方向から文字認識を行った場合は、「町」
と誤認識され、自信度も0.40と低下する。このよう
に誤認識が発生し、自信度も低下するのは、回転した方
向から見た場合の特徴ベクトルに基づいて文字認識を行
っているためである。同様に180°,270°回転し
た方向から文字認識を行った場合も、誤認識が発生し、
自信度も低下する。尚、文字認識の方向別の自信度は、
複雑な文字であればあるほど、その差が顕著に現れてく
る。しかしながら、各4方向から文字認識を行った結
果、自信度がいずれも低い場合もある。それは、例えば
文字認識の対象となる文字や記号が、文字認識辞書40
7に含まれていない文字フォントである等が原因であ
る。この場合、全ての方向において誤認識が発生してい
る可能性が高い。このため、4方向から文字認識を行っ
た結果、いずれの自信度も0.60より低い文字に関し
ては、文字認識の対象外として、該認識結果を後述する
文字方向判別の判別材料として認めないこととする。
【0036】図8(c)に示した認識結果においては、
正方向(0°)における自信度が1番高いため、文書方
向は正方向である可能性が高いと判断される。本実施形
態では、更に文字方向判別の精度を向上させるため、同
一ブロック内の複数の文字について、同様に4方向から
文字認識を行ってみる。また、1つのブロックのみで文
書方向を判別すると、特殊な文字列により文字方向を誤
って判別してしまう恐れがあるので、複数のブロックに
ついて同様の文字認識を行なう。そして、各ブロックに
ついて、認識対象文字の自信度の平均値を4方向別に求
め、更に、各ブロック毎の平均自信度の平均値を4方向
別に求める。そして、この平均値が最も高い方向を文字
方向(文書方向)として認定する。
【0037】このように、1文字だけの自信度で文字方
向を認定することなく、同一ブロック内の複数文字、さ
らには複数ブロックの自信度で文字方向を認定すること
により、文字(文書)方向を高精度に判別することが可
能となる。
【0038】尚、本実施形態において文字方向(文書方
向)の判別結果が正方向以外の方向である場合には、図
5のステップS5に示したように、文字方向が正方向に
なるように原画像を回転する。この回転は、図4に示す
CPU/メモリ部401の制御によって、周知の方法に
より簡単に行うことが可能できるため、その詳細な説明
は省略する。 ●領域分離、方向判定、文字認識処理結果 以上のような処理により、図9(a)に示す原画像デー
タ、図9(b)に示す領域分離データ、図9(c)に示
す文字認識情報を得ることができる。これらの情報は、
前述したようにコントローラ部139のCPU201へ
送られ、各種画像処理、各種制御に供される。
【0039】領域分離データは、図9(b)に示す形式
で構成される。まず、領域分離データである旨を示す
「header」と、分離した矩形領域毎の識別子「r
ect1」〜「rectn」を備える。この識別子で区
別された各領域(ブロック)の情報は、ブロック番号を
示す「order」、ブロックの属性(文字部、図形部
等)を示す「att」、ブロックの左上の座標値「x
1」および「y1」、ブロックの幅「w」、ブロックの
高さ「h」、縦書き、または横書きを示す「direc
tion」、予備領域「reserve」により構成さ
れている。また、文字認識情報は、図9(c)に示す様
に、文字認識情報である旨を示す「header」を有
し、また、例えば「本」等の単一の文字に関する文字認
識情報「OCR1」と、当該文字が含まれているブロッ
クを示す上記「rect1」等に相当する「blk−h
eader1」との組み合わせ情報を、「OCRn」及
び「blk−headern」まで備える。そして、
「OCR1」等の各文字認識情報は、文字であるか或い
は空白であるかを示す「type」、前述の文字認識の
自信度に従った第1〜第5候補文字「文字1」〜「文字
5」、当該文字の切り出し位置「x1」および「y
1」、当該文字の幅「w」、当該文字の高さ「h」、予
備領域「reserve」により構成されている。
【0040】尚、図9に示したデータ構成は一例に過ぎ
ず、処理結果の使用目的に応じて、適宜変更が可能であ
ることは言うまでもない。 ●両面原稿における文字認識 次に、本実施形態の特徴である両面原稿における文字認
識について、図10及び図11を参照して詳細に説明す
る。
【0041】図10(a)は、両面原稿のオモテ面を表
した図である。同図によればオモテ面には「本発明の名
称」、「文字認識装置」、大文字の全アルファベットが
正方向で印刷されている。また図10(b)は、前記両
面原稿のウラ面を表した図であり、ウラ面にはオモテ面
を180°回転させた文字が印刷されているとする。こ
のような両面原稿において裏写りが発生すると、図10
(c)に示すようになる。図10(c)において、下部
に位置する灰色文字が裏写りを示す。
【0042】次に、図10(c)に示す裏写りの発生し
た原稿に対する文字認識処理を、図11を参照して詳し
く説明する。図11の各図においては、上段の実線文字
列がオモテ面に描かれている文字列であり、該オモテ面
の文字列と同様の文字列により発生する裏写りを下段の
灰色文字列で示している。例えば、図11(a)は、
「本発明の名称」という文字列が描かれたオモテ面にお
いて、ウラ面に描かれている「本発明の名称」の裏写り
が発生している様子を示す図である。同図から分かるよ
うに、裏写りの文字はオモテ面の文字を鏡に映したもの
(所謂「鏡像」)を、更に上下反対にしたものとなる。
【0043】図11(a)において、文字列「本発明の
名称」のうち、「本」という文字の裏写りはそのまま
「本」として認識できる。つまり、前述した文字認識方
法からすると、上記文字列のうち「発明の名称」の各文
字の裏写りについては、4方向からの文字認識を行った
場合、各方向とも文字認識結果である自信度が低いた
め、文字認識の対象外となる。しかしながら、文字
「本」に関しては、その裏写りも文字として認識され
る。従って、文字「本」の裏写りは、本来読み取るべき
オモテ面の文字の示す方向とは反対の方向を判別する材
料となってしまう。このように、文字認識可能となる裏
写り文字が多ければ、最終的な文書方向判定も逆方向の
判定となってしまうこともある。
【0044】また、図11(b)に示す「文字認識装
置」の文字列において同様に、文字「文」の裏写りだけ
が文字として認識されてしまう。さらに同様に、図11
(c)においては、「A」,「B」,「C」,「D」,
「E」,「H」,「I」,「M」,「O」,「T」,
「U」,「V」,「W」,「X」,「Y」の裏写りが文
字認識可能である。
【0045】以上説明したような「本」や「文」、及び
「A」等の各文字が、その裏写りによる文字認識が可能
であるのは、それらが左右対称もしくは上下対称の文字
であるためである。従って本実施形態においては、裏写
りの発生しうる両面原稿を処理する際に、上述したよう
な左右対称もしくは上下対称の文字を、文字認識の対象
外として設定することを特徴とする。
【0046】以下、操作パネル140上の両面原稿キー
が押されている場合、即ち、コントローラ部139にお
いて処理原稿が両面原稿であると認識された場合の文字
認識処理について説明する。
【0047】図4に示す文字認識/方向判別部402
は、両面原稿キーが押下されている場合、文字認識辞書
407に格納されている左右対称及び上下対称、また、
全大文字アルファベット、全小文字アルファベットを参
照しないように制御される。こうすることにより、図1
1(a)において、裏写りの文字の全て、及びオモテ面
における文字「本」は、文字として認識されることがな
い。従って、「発明の名称」という5文字から、このブ
ロックの文書方向を正しく判定することができる。同様
に図11(b)において、裏写りの文字の全て、及びオ
モテ面における文字「文」は、文字として認識されず、
従って「字認識装置」という5文字からこのブロックの
文書方向も正しく判定できる。また図11(c)におい
ては、全ての文字が文字として認識されず、即ち記号群
等として扱われるため、文書方向の判定には影響しな
い。
【0048】尚、本実施形態においては、複数文字、又
は複数ブロックにおける文字認識結果に基づいて文書方
向判別を行なう例について説明したが、裏写り文字を判
別対象から除外することにより、例えば1文字のみ、又
は同一ブロック内の複数文字の自信度のみにより文字方
向を判別したとしても、高精度な文書方向判別が可能で
ある。
【0049】以上説明したように本実施形態によれば、
両面原稿を読み取る際に、上下及び左右対称、及びアル
ファベット文字を文字認識対象外とすることにより、裏
写りによる文書方向の誤判定を回避することができる。
【0050】
【他の実施形態】なお、本発明は、複数の機器(例えば
ホストコンピュータ,インタフェイス機器,リーダ,プ
リンタなど)から構成されるシステムに適用しても、一
つの機器からなる装置(例えば、複写機,ファクシミリ
装置など)に適用してもよい。
【0051】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0052】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0053】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0054】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0055】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0056】
【発明の効果】以上説明したように本発明によれば、光
学的文字認識機能によって、両面原稿における文字及び
その方向を認識する場合に、上下対称及び左右対称、及
びアルファベット文字を文字認識の対象外とすることに
より、裏写りによる文書方向の誤判定を回避することが
できる。
【0057】
【図面の簡単な説明】
【図1】本発明に係る一実施形態における画像処理装置
の側断面図である。
【図2】本実施形態におけるコントローラ部の詳細構成
を示すブロック図である。
【図3】本実施形態における画像処理部の詳細構成を示
すブロック図である。
【図4】本実施形態における文書方向判別部の詳細構成
を示すブロック図である。
【図5】本実施形態における文字認識/方向判別処理を
示すフローチャートである。
【図6】本実施形態における領域分離の様子を示す図で
ある。
【図7】本実施形態における文字認識処理を説明するた
めの図である。
【図8】本実施形態における文書方向判別処理を説明す
るための図である。
【図9】本実施形態における領域分離及び文字認識情報
のデータ形式を示す図である。
【図10】本実施形態における両面原稿の例を示す図で
ある。
【図11】本実施形態における両面原稿の裏写りを説明
するための図である。
【符号の説明】
401 CPU/メモリ部 402 文字認識/方向判別部 403 領域分部 407 文字認識辞書

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 原稿を光学的に読取って画像データを入
    力する画像入力手段と、 前記画像データ中に含まれる文字及びその方向を認識す
    る文字認識手段と、を有し、 前記文字認識手段は、前記原稿の両面に画像が印刷され
    ている場合、所定の文字を認識対象外とすることを特徴
    とする画像処理装置。
  2. 【請求項2】 前記文字認識手段は、前記原稿の両面に
    画像が印刷されている場合、上下対称の文字を認識対象
    外とすることを特徴とする請求項1記載の画像処理装
    置。
  3. 【請求項3】 前記文字認識手段は、前記原稿の両面に
    画像が印刷されている場合、更に左右対称の文字を認識
    対象外とすることを特徴とする請求項2記載の画像処理
    装置。
  4. 【請求項4】 前記文字認識手段は、前記原稿の両面に
    画像が印刷されている場合、更にアルファベット文字を
    認識対象外とすることを特徴とする請求項3記載の画像
    処理装置。
  5. 【請求項5】 更に、文字認識辞書を保持する保持手段
    を有し、 前記文字認識手段は、前記文字認識辞書を参照すること
    により、文字及びその方向を認識することを特徴とする
    請求項1記載の画像処理装置。
  6. 【請求項6】 更に、前記原稿が両面に画像が印刷され
    ている両面原稿であることを指示する指示手段を有し、 前記文字認識手段は、前記指示手段により前記原稿が両
    面原稿であることが指示された場合、所定の文字を認識
    対象外とすることを特徴とする請求項1記載の画像処理
    装置。
  7. 【請求項7】 前記文字認識手段は、複数方向における
    文字認識の精度に基づいて文書方向判別を行なうことを
    特徴とする請求項1乃至6のいずれかに記載の画像処理
    装置。
  8. 【請求項8】 前記文字認識手段は、前記文字認識の精
    度が最高である方向を文書方向であると判別することを
    特徴とする請求項7記載の画像処理装置。
  9. 【請求項9】 前記文字認識手段は、0°,90°,1
    80°,270°の各方向のうち、文字認識の精度が最
    高である方向を文書方向であると判別することを特徴と
    する請求項8記載の画像処理装置。
  10. 【請求項10】 原稿を光学的に読取って画像データを
    入力する画像入力手工程と、 前記画像データ中に含まれる文字及びその方向を認識す
    る文字認識工程と、を有し、 前記文字認識工程においては、前記原稿の両面に画像が
    印刷されている場合、所定の文字を認識対象外とするこ
    とを特徴とする画像処理方法。
  11. 【請求項11】 前記文字認識工程においては、前記原
    稿の両面に画像が印刷されている場合、上下対称の文字
    を認識対象外とすることを特徴とする請求項10記載の
    画像処理方法。
  12. 【請求項12】 前記文字認識工程においては、前記原
    稿の両面に画像が印刷されている場合、更に左右対称の
    文字を認識対象外とすることを特徴とする請求項11記
    載の画像処理方法。
  13. 【請求項13】 前記文字認識工程においては、前記原
    稿の両面に画像が印刷されている場合、更にアルファベ
    ット文字を認識対象外とすることを特徴とする請求項1
    2記載の画像処理方法。
  14. 【請求項14】 前記文字認識工程においては、文字認
    識辞書を参照することにより、文字及びその方向を認識
    することを特徴とする請求項10記載の画像処理方法。
  15. 【請求項15】 更に、前記原稿が両面に画像が印刷さ
    れている両面原稿であることを指示する指示工程を有
    し、 前記文字認識工程においては、前記指示工程により前記
    原稿が両面原稿であることが指示された場合、所定の文
    字を認識対象外とすることを特徴とする請求項10記載
    の画像処理装置。
  16. 【請求項16】 文書画像処理のプログラムコードが格
    納されたコンピュータ可読メモリであって、 原稿を光学的に読取って画像データを入力する画像入力
    手工程のコードと、 前記画像データ中に含まれる文字及びその方向を認識す
    る文字認識工程のコードと、を有し、 前記文字認識工程においては、前記原稿の両面に画像が
    印刷されている場合、所定の文字を認識対象外とするこ
    とを特徴とするコンピュータ可読メモリ。
JP10011765A 1998-01-23 1998-01-23 画像処理装置及びその方法 Withdrawn JPH11213089A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10011765A JPH11213089A (ja) 1998-01-23 1998-01-23 画像処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10011765A JPH11213089A (ja) 1998-01-23 1998-01-23 画像処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH11213089A true JPH11213089A (ja) 1999-08-06

Family

ID=11787084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10011765A Withdrawn JPH11213089A (ja) 1998-01-23 1998-01-23 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH11213089A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804414B1 (en) 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus
JP2011227661A (ja) * 2010-04-19 2011-11-10 Hitachi Omron Terminal Solutions Corp 光学式文字読み取り装置
JP2013025801A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおけるキャラクタの向きを識別する方法および装置
JP2013025800A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおける文字の方向を認識する方法及び装置
US11153447B2 (en) 2018-01-25 2021-10-19 Fujifilm Business Innovation Corp. Image processing apparatus and non-transitory computer readable medium storing program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804414B1 (en) 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus
JP2011227661A (ja) * 2010-04-19 2011-11-10 Hitachi Omron Terminal Solutions Corp 光学式文字読み取り装置
JP2013025801A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおけるキャラクタの向きを識別する方法および装置
JP2013025800A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおける文字の方向を認識する方法及び装置
US11153447B2 (en) 2018-01-25 2021-10-19 Fujifilm Business Innovation Corp. Image processing apparatus and non-transitory computer readable medium storing program

Similar Documents

Publication Publication Date Title
JP3251959B2 (ja) 画像形成装置
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
US6798905B1 (en) Document orientation recognizing device which recognizes orientation of document image
JP3728040B2 (ja) 画像形成装置及び方法
KR100306063B1 (ko) 화상처리방법및장치
JP3902840B2 (ja) 画像処理装置および画像処理方法
JPH11341229A (ja) 画像処理装置及び画像処理方法
JPH11213089A (ja) 画像処理装置及びその方法
JP3787440B2 (ja) 画像処理装置及び画像処理方法
JPH10191018A (ja) 画像処理方法及び装置
JPH11220557A (ja) 画像処理装置及び方法
JP3684050B2 (ja) 画像処理方法及び装置
JP2001312697A (ja) 画像方向判別方法及び装置
JPH10307460A (ja) 画像形成装置及び画像形成方法並びに記憶媒体
JP2000067156A (ja) 画像処理装置及び方法
JP3629962B2 (ja) 画像認識装置
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JPH10117281A (ja) 画像形成方法及び装置
JPH11213088A (ja) 画像処理装置及び方法
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JP2000099628A (ja) 画像処理装置及び画像処理方法
JP2001030580A (ja) 画像処理装置、印刷制御方法、及び記憶媒体
JP2003316207A (ja) 画像形成装置
JPH11103381A (ja) 画像形成方法及び装置
JPH1115224A (ja) 複写装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405