JPH11272793A - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法

Info

Publication number
JPH11272793A
JPH11272793A JP10072512A JP7251298A JPH11272793A JP H11272793 A JPH11272793 A JP H11272793A JP 10072512 A JP10072512 A JP 10072512A JP 7251298 A JP7251298 A JP 7251298A JP H11272793 A JPH11272793 A JP H11272793A
Authority
JP
Japan
Prior art keywords
image
character
black
document
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10072512A
Other languages
English (en)
Inventor
Akio Ito
秋生 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10072512A priority Critical patent/JPH11272793A/ja
Publication of JPH11272793A publication Critical patent/JPH11272793A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 従来の文字認識処理は白黒原稿を対象とする
ことを前提としていたため、カラー原稿に対する文字認
識においては、原稿の方向判別の精度が白黒原稿の場合
よりも悪くなり、文字認識の誤判定が多かった。 【解決手段】 入力されたカラー画像に対して、黒文字
部であるか否かを判定するデータを判別データ生成部3
02において生成する。文書方向判別部303では、該
黒文字判定データにより黒文字部であるとされた画像デ
ータに基づいて、文書方向判定処理を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理装置及びそ
の方法に関し、特に文字認識処理を行なう画像処理装置
及びその方法に関する。
【0002】
【従来の技術】従来の画像処理装置においては、一般に
スキャナなどの光学的読み取り装置によって読み取られ
た原稿画像データに基づいて、該原稿画像の方向を正し
く認識し、該原稿画像に含まれている文字を認識する、
所謂文字認識処理を可能とすることが知られている。そ
して、近年の画像処理技術の発達に伴い、文字認識処理
における文字認識精度の更なる向上が要求されつつあ
る。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の画像処理装置においては、主に文字を多く含む白黒
原稿を対象とした文字認識処理を行なうことを前提とし
ていた。従って、文字以外のイメージ画像等が多く含ま
れるカラー原稿に対して文字認識処理を行なった場合、
原稿の方向判別の精度が白黒原稿の場合よりも悪くな
り、文字認識の誤判定が多くなってしまっていた。
【0004】本発明は上記問題を解決するために成され
たものであり、カラー原稿に対する文書方向判別の精度
を高めることにより、文字認識精度の向上が可能な画像
処理装置及びその方法を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
の一手段として、本発明の画像処理装置は以下の構成を
備える。
【0006】即ち、画像データを入力する画像入力手段
と、前記画像データから黒エッジ部を検出する黒エッジ
検出手段と、前記黒エッジ検出手段により黒エッジが検
出された前記画像データに基づいて画像の文書方向を判
別する文書方向判別手段と、を有することを特徴とす
る。
【0007】
【発明の実施の形態】以下、本発明に係る一実施形態に
ついて、図面を参照して詳細に説明する。
【0008】<第1実施形態> ●装置概要 図1は、本実施形態における画像処理装置の側断面図で
ある。本実施形態の画像処理装置は、原稿画像のカラー
読取りを行ない、白黒画像として印刷出力するものであ
る。図1において、101は原稿台ガラスであり、原稿
自動送り装置142から給送された原稿が順次、所定位
置に載置される。102は例えばハロゲンランプにより
構成される原稿照明ランプで、原稿台ガラス101に載
置された原稿を露光する。103,104,105は走
査ミラーであり、図示しない光学走査ユニットに収容さ
れ、往復運動しながら、原稿からの反射光をCCDユニ
ット106に導く。CCDユニット106はCCDに原
稿からの反射光を結像させる結像レンズ107、R(レ
ッド),G(グリーン),B(ブルー)のCCD等によ
り構成される撮像素子108、撮像素子108を駆動す
るCCDドライバ109等から構成されている。撮像素
子108からの画像信号出力は、例えばR,G,Bそれ
ぞれ8ビットのデジタルデータに変換された後、コント
ローラ部139に入力される。コントローラ部139に
おいては後述するように、入力されたカラー画像信号に
対して各種の画像処理を施し、白黒の画像データを作成
して出力する。
【0009】また、110は感光ドラムであり、前露光
ランプ112によって画像形成に備えて除電された後、
1次帯電器113によって一様に帯電される。117は
露光手段であるレーザユニットであり、例えば半導体レ
ーザ等で構成され、画像処理や装置全体の制御を行うコ
ントローラ部139で処理された画像データに基づい
て、感光ドラム110を露光し、静電潜像を形成する。
118は現像器であり、黒色の現像剤(トナー)が収容
されている。119は転写前帯電器であり、感光ドラム
110上に現像されたトナー像を用紙に転写する前に高
圧をかける。120,122,124は給紙ユニットで
あり、各給紙ローラ121,123,125の駆動によ
り、転写用紙が装置内へ給送され、レジストローラ12
6の配設位置で一旦停止し、感光ドラム110に形成さ
れた画像との書き出しタイミングがとられて再給送され
る。127は転写帯電器であり、感光ドラム110に現
像されたトナー像を給送される転写用紙に転写する。1
28は分離帯電器であり、転写動作の終了した転写用紙
を感光ドラム110より分離する。転写されずに感光ド
ラム110上に残ったトナーは、クリーナ111によっ
て回収される。
【0010】129は搬送ベルトであり、転写プロセス
の終了した転写用紙を定着器130に搬送し、転写用紙
上のトナー像は例えば熱により定着される。131はフ
ラッパであり、定着プロセスの終了した転写用紙の搬送
パスを、ステイプルソータ132または中間トレイ13
7の配置方向のいずれかに制御する。ステイプルソータ
132に排紙された用紙は各ビンに仕分けされ、コント
ローラ部139からの指示により、ステイプル部141
がステイプル処理を行う。133〜136は給送ローラ
であり、一度定着プロセスの終了した転写用紙を中間ト
レイ137に反転(多重転写時)または非反転(両面転
写時)して給送する。138は再給送ローラであり、中
間トレイ137に載置された転写用紙を再度、レジスト
ローラ126の配設位置まで搬送する。
【0011】コントローラ部139には、後述するマイ
クロコンピュータ、画像処理部等を備えており、操作パ
ネル140からの指示に従って、前述の画像形成動作を
制御する。また、操作パネル140上には図示しない両
面原稿キーがあり、このキーが操作者によって押下され
ることにより、読み取る原稿が両面原稿であるという情
報がコントローラ部139に伝わる。
【0012】図2にコントローラ部139の詳細ブロッ
ク構成を示し、説明する。
【0013】201は画像処理装置全体の制御を行うC
PUであり、装置本体の制御手順(制御プログラム)を
記憶した読み取り専用メモリ(ROM)203からプロ
グラムを順次読み取り、実行する。CPU201のアド
レスバスおよびデータバスは、バスドライバ/アドレス
デコーダ回路202を経て後述する各負荷に接続されて
いる。また、204は入力データの記憶や作業用記憶領
域等として用いる主記憶装置であるところのランダムア
クセスメモリ(RAM)である。205はI/Oインタ
フェースであり、操作者がキー入力を行い、装置の状態
等を液晶、LEDを用いて表示する操作パネル140
や、給紙系、搬送系、光学系の駆動を行うモータ類20
7、クラッチ類208、ソレノイド類209、また、搬
送される用紙を検知するための紙検知センサ類210等
の各負荷に接続される。現像器118には、現像器内の
トナー量を検知するトナー残検センサ211が配置され
ており、その出力信号がI/Oインタフェース205に
入力される。215は高圧制御ユニットであり、CPU
201の指示に従って、図1に示した1次帯電器11
3、現像器118、転写前帯電器119、転写帯電器1
27、分離帯電器128における高圧を制御する。
【0014】206は画像処理部であり、CCDユニッ
ト106から出力された画像信号が入力され、後述する
画像処理を施した画像データに従って、レーザユニット
117の制御信号を出力する。レーザユニット117か
ら出力されるレーザ光は感光ドラム110を照射し露光
するとともに、非画像領域において、受光センサである
ところのビーム検知センサ213によって発光状態が検
知され、その出力信号がI/Oインタフェース205に
入力される。
【0015】図3に、画像処理部206の詳細ブロック
構成を示し、説明する。以下、CCDユニット106で
読取った原稿が文字を含む文書画像であった場合につい
て説明する。
【0016】撮像素子108により電気信号に変換され
たR,G,B各8ビットの画像信号は、まずシェーディ
ング補正部301によって各色毎に画素間のばらつきの
補正を行った後、判別データ生成部302と白黒画像生
成部304に入力される。白黒画像生成部304では、
入力されたR、G、Bのカラー画像データから8ビット
の白黒イメージの画像データを作成する。また判別デー
タ生成部302では、入力されたカラー画像から黒文字
部を抽出し、該黒文字部情報を白黒画像生成部304に
より作成された白黒画像とともに文書方向判別部303
に入力する。文書方向判別部303では、上述した黒文
字部情報及び白黒画像に基づいて、文書画像の方向判別
を行なう。
【0017】また、白黒画像生成部304の出力は、縮
小・拡大部305にも入力され、画像の変倍処理が行わ
れる。例えば縮小コピー時にはデータの間引き処理を行
い、拡大コピー時にはデータの補間処理を行う。次に、
エッジ強調部306において、例えば5×5のウインド
ウによる2次微分を行い、画像のエッジを強調する。
尚、入力される画像データは輝度データであるため、印
刷出力を行なうための濃度データに変換するため輝度濃
度変換部307でテーブルサーチを行なうことによりデ
ータ変換を行う。濃度データに変換された画像データは
2値化処理部308へ入力される。ここでは、例えばE
D法(誤差拡散法)により多値データを2値データに変
換する。2値に変換された画像データは合成部309に
入力され、入力された画像データと例えばDRAMやハ
ードディスクにより構成される画像用メモリ311内の
画像データを選択的に出力する。この画像用メモリ31
1に対するリードライト制御はメモリ制御部310で行
い、画像を回転させる場合はメモリ内の画像データの読
み出しアドレスを制御することで行う。画像合成部30
9より出力された画像データは、レーザユニット117
へ出力される。レーザユニット117内において画像デ
ータはレーザの発光強度を示す信号に変換され、上述し
たプロセスにより画像形成処理がなされる。 ●黒文字抽出処理 以下、図4〜図12を参照して、本実施形態の特徴であ
る黒文字抽出処理について説明する。
【0018】図4に、判別データ生成部302の詳細ブ
ロック構成を示す。まず、白黒画像生成部302におい
て生成された白黒画像信号は、遅延回路1000におい
て黒文字判定結果と同期があうように遅延されて、文書
方向判別部303に入力される。一方、CCDユニット
106において読み込まれたカラー画像のR,G,B信
号は、黒除去回路1114、エッジ検出回路1115、
彩度判定回路1116、孤立点除去処理回路1117、
平滑化処理回路1118、下地判定回路1119、判定
回路1120,1121、セレクタ1122、ANDゲ
ート1123から構成される黒文字判定部1200に入
力される。
【0019】以下、黒文字判定部1200における動作
について説明する。
【0020】図5は、黒除去回路1114の詳細構成を
示すブロック図である。同図において、41は最大値検
出部、42は最小値検出部、43は減算器、44はLU
T(ルック・アップ・テーブル)、45はAND回路を
それぞれ示している。黒除去回路1114においては、
同構成により、前述した様にシェーディング補正された
各色分解信号R,G,Bに対して下色除去(UCR)を
施し、比較的ゆるめのしきい値により黒を検出して除去
する。
【0021】次に、孤立点除去処理回路1117によっ
て、画像中のゴミ(孤立点)を取り除くために、ここで
は任意の画素ブロック中の中央値を取り、注目画素に該
中央値を置き換える処理を施す。その後、平滑化処理回
路1118でデータの平滑化を行うことにより、下地の
パターンの傾向を認識しやすくする。
【0022】図6に、下地判定回路1119の詳細ブロ
ック構成を示す。同図において、601(601−1〜
601−N)はF/F(フリップ・フロップ)群であ
る。602,603は演算器、604はLUTをそれぞ
れ示す。ここでは、RGBのうちの任意の1色分の信号
について説明する。尚、回路規模を小さくするために、
RGB信号を周知のND信号に置き換えても構わない。
この場合、以下の変換式(1)に従う。
【0023】 ND=(R+2G+B)/4・・・・(1) 下地判定回路1119に入力された平滑化された信号
は、下地のパターンを見るために、まず演算器602に
おいてF/F群601による主走査方向のN画素の平均
値(以下「DC成分」と称す)を算出し、演算器603
においてF/F群601による主走査方向のN画素につ
いて|f(MAX)−f(MIN)|で表される、最大
値MAXと最小値MINとの位置の差、即ち、周期(以
下「AC成分」と称す)を算出する。ここで、通常、網
点などの規則的なパターンの大きさが2mm以上である
ことは少ないので、例えば400dpiにおいて32画
素分、つまりN=32程度とすることが適当である。そ
の後LUT604において、直流成分で示される平均輝
度とAC成分で示される規則度により、当該画素が下地
領域に属する可能性を示す下地度を出力する。例えば、
DC成分が高く、かつAC成分が小さければ下地度は低
くなり、即ち下地が均一な白地に近くなる。又、DC成
分が低く、かつAC成分が高ければ下地度は高くなり、
即ち下地が不均一な画像であることになる。ここで、A
C成分、DC成分及び下地度はそれぞれ多値で表現され
る。
【0024】次に、画像中のエッジ成分を検出し、平網
や地図中の文字、細線を検出するエッジ検出回路111
5について説明する。図7に、エッジ検出回路1115
の詳細ブロック構成を示す。同図において、70〜73
はFIFO(先入先出回路)、74はラプラシアン、7
5は絶対値及びノイズ除去回路をそれぞれ示している。
エッジ検出回路1115には、RGB信号より得られた
ND信号が入力される。入力されたND信号は、FIF
O70〜73により5ライン分に拡張され、周知のラプ
ラシアンフィルタ74にかけられる。そして、絶対値及
びノイズ除去回路75においてエッジ量の絶対値がa以
下である画素は除去され、a以上である画素のみが
“1”として出力される。以上の動作を示すタイミング
チャートを図8に示す。同図において、原画(i)に対
するラプラシアン74の出力が(ii)、絶対値及びノ
イズ除去回路75の出力が(iii)である。これによ
り、原画像中のエッジが検出されていることが分かる。
【0025】エッジ検出回路1115の出力は、判定回
路120,121に入力され、画像中または非画像(下
地)中でのエッジ処理が独立に行われる。図9,図10
に、判定回路120,121の詳細ブロック構成をそれ
ぞれ示す。両図において、91−1,91−2はFIF
O、92は遅延回路、93,95はORゲート、94−
1,94−2,97−1,97−2はF/F、96,9
8はANDゲートをそれぞれ示している。この回路構成
によれば、エッジ検出後の信号を3×3のスクリーンに
広げ、判定回路1120では該スクリーン内にエッジ画
素が1個でもあれば強調し、また、判定回路1121で
は連続したエッジ成分が1個もなければエッジを除去し
た出力を行なう。これら判定回路1120,1121の
出力はセレクタ1122に入力され、セレクタ1122
では上述した下地判定回路1119より出力された下地
度をセレクト信号として、いずれかを出力する。これに
より、画像中のエッジはノイズ除去し、非画像中のエッ
ジは強調するように制御することができる。
【0026】次に図11に、彩度判定回路1116の詳
細ブロック構成を示す。同図において、144は最大値
検出部、145は最小値検出部、146は減算器、14
7はLUTをそれぞれ示している。最大値検出部144
と最小値検出部145によって、MAX(R,G,B)
で示されるRGBの最大値信号548と、MIN(R,
G,B)で示されるRGBの最小値信号549がそれぞ
れ検出され、その差ΔCが減算器146によって算出さ
れる。そして、LUT47において、図12に示すよう
な特性に従ってデータ変換が行われ、彩度信号Crが出
力される。図12は彩度信号Crの特性を示す図であ
る。図12においては、ΔCが“0”に近いほど彩度が
低く(無彩色に近く)、ΔCが大きいほど、即ち有彩色
の度合が強いほど彩度信号Crは“0”に近づき、完全
な有彩色ではCr=0になる。ここで、CrのΔCに対
する変化の度合いは図に従う。
【0027】以上説明したように、ANDゲート112
3にはセレクタ1122の出力と彩度判定回路1116
の出力とが入力されるため、画像中において“黒”かつ
“エッジが検出された”場合にのみ、ANDゲート11
23の出力は“1”になる。即ち、黒文字判定部120
0からは、画像中の黒文字部や細線部等において黒文字
判定データが“1”として出力される。
【0028】尚、上述した構成例においては、画像中に
おいて小さいフォントの文字をターゲットとして黒文字
を抽出する例について説明したが、もう少し大きい文字
までを抽出する場合には、図9,図10に示した判定回
路1120,1121の構成を変更すれば良い。例え
ば、3×3の回路によりエッジを検出しているところ
を、回路を構成するFIFOとF/Fを追加し、5×5
や7×7、又はそれ以上のスクリーンに対してエッジを
検出するようにすれば、検出のターゲットとするフォン
トを大きくすることができる。
【0029】判別データ生成部302において上述した
ようにして検出された黒文字判定データは、遅延回路1
000を介した白黒画像データとともに、文書方向判別
部303に入力される。
【0030】本実施形態では以上説明したようにして、
入力されたカラー原稿の画像信号に基づいて、黒文字を
示す可能性の高い画素を検出して黒文字判定データを生
成、出力することにより、後述する文書方向判別処理を
より高精度に行なうことができる。 ●文書方向判別処理 以下、図13〜図18を参照して本実施形態における文
書方向判別処理について説明する。
【0031】図13に、文書方向判別部303の詳細ブ
ロック構成を示す。文書方向判別部303に入力された
白黒画像データ及び黒文字判定データは、まずCPU/
メモリ部401に入力され、画像データを一時的に保存
すると共に、後述する各種制御を行う。尚、CPU/メ
モリ部401は図2に示すコントローラ部139内のC
PU201とは不図示のデュアルポートRAMによりバ
ス接続されており、データの送受信が可能である。もち
ろん、シリアル通信を行なうように構成しても良い。
【0032】文字認識/方向判別部402においては、
予め記憶されている文字認識辞書407を参照すること
により、文字認識処理及び文書方向の判別処理を行な
う。具体的には、文書中の数種類の文字領域に対し、0
°,90°,180°,270°の各方向からそれぞれ
文字認識処理を行い、各方向における文字認識の精度
(文字認識の自信度:文字の特徴分布に対する距離)の
中で、最高精度である方向を文書方向であるとして認識
する。
【0033】領域分離部403は、文字認識/方向判別
部402による文字認識・方向判別処理を行うための前
処理として、文書画像データより、文字部、図形部、自
然画部、表部などを矩形の領域に分離して、各領域の属
性(文字部等)を付加する処理を行う。ここで、本実施
形態の特徴である黒文字判定データを参照することによ
り、黒文字からなる文字部領域の判定を更に高精度に行
なうことができる。
【0034】記憶装置404は、例えばハードディスク
や光磁気ディスクなどにより構成され、各種処理結果
(画像データ、領域分離結果、文字認識結果など)を保
存する。またI/F部405は、SCSIやRS232
Cなどにより構成され、I/F部405を介して接続さ
れた外部コンピュータ203より情報を得たり、また、
光磁気ディスク等の着脱可能な記憶装置の装填によりデ
ータを得る。
【0035】次に、本実施例における文書方向自動判別
・補正、および文字認識処理の概要を図14のフローチ
ャートに従って説明する。
【0036】本実施形態において文書方向を判別するた
めには、まず黒文字領域を正確に抽出する必要がある。
そこで、文書認識/方向判別部402に入力された多値
の画像データは、まず領域分離部403において、判別
データ生成部302から出力された黒文字判定データが
“1”である画像データのみが抽出される(ステップS
1,S2)。しかしながら、黒文字判定データが“1”
である画像データの全てが文字部に属するわけではな
く、例えば細線、表などの領域も含まれる。従って領域
分離部403においては、抽出された画像データを更
に、文字部、図形部、自然画部、表部などの属性別に、
矩形の領域(ブロック)に分離する(ステップS3)。
この領域分離処理においては、具体的には矩形で囲まれ
た領域情報を作成する。
【0037】次に、上記各属性より文字部、即ち文字領
域の矩形情報を抽出する(ステップS4)。ここで文字
領域とは、文章部、タイトル部、表中の文字、図のキャ
プション部等である。例えば、図15(a),(c)に
示す様な文書の場合、それぞれ図15(b),(d)に
示したような文字領域の矩形情報が抽出される。そし
て、これらの中の数ブロックを用いて、後述するような
文書方向判別を行う(ステップS5)。その判別の結
果、文書方向が正方向であれば、引き続き画像中の文字
ブロックに対して文字認識処理を行う。(ステップS
8)。
【0038】一方、文書方向が不正方向であれば、画像
データが正方向になるように回転させる(ステップS
6)。そして、回転画像に対して領域分離を行い、領域
分離情報の補正処理を行う(ステップS7)。これは、
回転画像に伴う領域分離情報の相違を補正するもので、
その方法としては、全回転画像データに対して再び領域
分離処理を行う方法がある。また、もう1つの方法とし
て、既に得られている領域分離結果に対してアドレス変
換をかける方法がある。一般に、領域分離処理は画像が
正方向であることを前提としているため、ステップS3
の段階で行った領域分離処理と、ステップS7において
回転画像データに対して行った領域分離処理とでは、そ
の結果が異なることが多い。それゆえ、ステップS7に
おいては前者の再分離方法がとられるのが望ましい。そ
して、次にステップS8に進んで、回転画像データ中の
文字ブロックは、周知の文字認識処理により、含まれる
文字が認識される。
【0039】従って、上述したように回転なし/回転あ
りのいずれの場合においても、領域分離情報及び文字認
識情報が得られる(ステップS9)。
【0040】この処理結果は、I/F部405を介して
コンピュータ406に伝送され、コンピュータ406上
のファイリングのアプリケーションソフトウェア等で利
用される。また、コントローラ部139内のCPU20
1へ各画像毎に送信される。●領域分離、方向判定、文
字認識処理の詳細説明次に、上述したステップS3及び
S7における領域分離処理、ステップS5における文書
方向判別処理、ステップS8における文字認識処理のそ
れぞれについて、詳細に説明する。 [領域分離処理]本実施形態における領域分離処理は、
まず、文書画像データの黒画素を検出してゆき、輪郭線
追跡、またはラベリング方式により、黒画素ブロックの
矩形枠を作成する。次に、その矩形の中の黒画素密度、
隣接矩形ブロックの有無、矩形の縦横比率などを判断基
準にして、文字領域(タイトル、本文、キャプション
等)、図形領域、自然画領域、表領域などを判別する。
この処理結果により、文書方向認識、及び文字認識のた
めに必要となる文字の矩形領域が判別される。 [文字認識処理]文字認識処理の一つの方法として、特
徴ベクトル抽出、比較方式がある。例えば図16(a)
に示すように、「本」という文字を含む文字領域が判別
されたとする。第一段階として、この文字領域について
文字切り出し処理を行う。この例を図16(b)に示
す。これは、一つの文字の矩形を切り出す処理で、黒画
素連続性の状態を検出していくことにより、求められ
る。そして第二段階として、一文字をm×n(例えば6
4×64)の画素ブロックに切り出す。この例を図16
(c)に示す。そして、その中から3×3画素のウイン
ドウをずらしてゆき、数十個の方向ベクトル情報を得
る。この一例を図16(d)に示す。このベクトル情報
が文字の特徴として認識され、この特徴ベクトルと文字
認識辞書407の内容とを比較して、特徴ベクトルに特
徴が一番近い文字から順番に文字を抽出する。そして、
抽出された文字は、特徴ベクトルに特徴が近い順に、第
1候補、第2候補・・・となる。この場合、特徴ベクト
ルに対する特徴の近さが、その文字に対する距離の近
さ、すなわち文字認識の自信度(精度)という数値で表
される。 [文書方向判別処理]以上説明したようにして文字認識
の自信度が求められるが、その自信度に基づいた文書方
向判別処理を、図17に示した「本発明の名称」という
文例を用いて説明する。
【0041】図17(a)は正方向の文、図17(b)
は図17(a)を270°回転した文である。ここで、
「本」の文字に注目すると、文字方向を判別する場合
は、図17(c)に示すように、1つの文字「本」につ
いて0°,90°,180°,270°の各回転による
4方向のそれぞれにおいて文字認識を行ってみる。尚、
上記各回転角度は,文字矩形の領域の読み出し方を変更
すればよく,特に原稿を回転する必要はない。
【0042】各回転角度における文字認識結果は、図1
7(c)に示すように、互いに異なっている。尚、図1
7(c)に示した文字認識結果および自信度はあくまで
も一例に過ぎず、実際にこの通りに得られるとは限らな
い。
【0043】図17(c)に示すように、正方向(0°
回転)から文字認識を行った場合は、「本」と正しく認
識され、その自信度も0.90と高い値となる。また、
90°回転した方向から文字認識を行った場合は、
「町」と誤認識され、自信度も0.40と低下する。こ
のように誤認識が発生し、自信度も低下するのは、回転
した方向から見た場合の特徴ベクトルに基づいて文字認
識を行っているためである。同様に180°,270°
回転した方向から文字認識を行った場合も、誤認識が発
生し、自信度も低下する。尚、文字認識の方向別の自信
度は、複雑な文字であればあるほど、その差が顕著に現
れてくる。
【0044】図17(c)に示した認識結果において
は、正方向(0°)における自信度が1番高いため、文
書方向は正方向である可能性が高いと判断される。本実
施形態では、更に文字方向判別の精度を向上させるた
め、同一ブロック内の複数の文字について、同様に4方
向から文字認識を行ってみる。また、1つのブロックの
みで文書方向を判別すると、特殊な文字列により文字方
向を誤って判別してしまう恐れがあるので、複数のブロ
ックについて同様の文字認識を行なう。そして、各ブロ
ックについて、認識対象文字の自信度の平均値を4方向
別に求め、更に、各ブロック毎の平均自信度の平均値を
4方向別に求める。そして、この平均値が最も高い方向
を文字方向(文書方向)として認定する。
【0045】このように、1文字だけの自信度で文字方
向を認定することなく、同一ブロック内の複数文字、さ
らには複数ブロックの自信度で文字方向を認定すること
により、文字(文書)方向を高精度に判別することが可
能となる。
【0046】尚、本実施形態において文字方向(文書方
向)の判別結果が正方向以外の方向である場合には、図
14のステップS6に示したように、文字方向が正方向
になるように原画像を回転する。この回転は、図13に
示すCPU/メモリ部401の制御によって、周知の方
法により簡単に行うことが可能できるため、その詳細な
説明は省略する。 ●領域分離、方向判定、文字認識処理結果 以上のような処理により、図18(a)に示す原画像デ
ータ、図18(b)に示す領域分離データ、図18
(c)に示す文字認識情報を得ることができる。これら
の情報は、前述したようにコントローラ部139のCP
U201へ送られ、各種画像処理、各種制御に供され
る。
【0047】領域分離データは、図18(b)に示す形
式で構成される。まず、領域分離データである旨を示す
「header」と、分離した矩形領域毎の識別子「rect1」
〜「rectn」を備える。この識別子で区別された各領域
(ブロック)の情報は、ブロック番号を示す「orde
r」、ブロックの属性(文字部、図形部等)を示す「at
t」、ブロックの左上の座標値「x1」および「y1」、ブ
ロックの幅「w」、ブロックの高さ「h」、縦書き、また
は横書きを示す「direction」、予備領域「reserve」に
より構成されている。
【0048】また、文字認識情報は、図18(c)に示
す様に、文字認識情報である旨を示す「header」を有
し、また、例えば「本」等の単一の文字に関する文字認
識情報「OCR1」と、当該文字が含まれているブロッ
クを示す上記「rect1」等に相当する「blk-header1」と
の組み合わせ情報を、「OCRn」及び「blk-header
n」まで備える。そして、「OCR1」等の各文字認識
情報は、文字であるか或いは空白であるかを示す「typ
e」、前述の文字認識の自信度に従った第1〜第5候補
文字「文字1」〜「文字5」、当該文字の切り出し位置
「x1」および「y1」、当該文字の幅「w」、当該文字の
高さ「h」、予備領域「reserve」により構成されてい
る。
【0049】尚、図18に示したデータ構成は一例に過
ぎず、処理結果の使用目的に応じて、適宜変更が可能で
あることは言うまでもない。
【0050】上記領域分離データや文字認識情報は、画
像処理装置本体を制御するコントローラ部139のCP
U201に通知される。これにより、画像処理部206
において画像メモリ311に一時格納された画像データ
は、メモリ制御部310により画像の回転制御等が施さ
れた後、画像が用紙に印刷されて、排紙される。
【0051】以上説明したように本実施形態によれば、
カラー原稿に対して、その文書方向判定に大きく寄与す
る黒文字を高精度に判定、抽出することにより、白黒原
稿のみでなく、カラー原稿についても文書方向の判別精
度が向上する。
【0052】尚、本実施形態においては、複数文字、又
は複数ブロックにおける文字認識結果に基づいて文書方
向判別を行なう例について説明したが、黒文字判定の精
度を高めたことにより、特にカラー原稿に対しては例え
ば1文字のみ、又は同一ブロック内の複数文字の自信度
のみにより文字方向を判別したとしても、高精度な文書
方向判別が可能である。
【0053】また、画像処理装置として黒単色による印
刷を行なう構成を例として説明を行なったが、もちろん
YMCKのフルカラー印刷が可能な装置に対して本発明
を適用することも可能である。また、文書方向判定を確
実に行なうことが本発明の目的であるから、カラー画像
データを入力して文字認識処理を行なう装置等であれ
ば、例えばネットワークにより接続された他の機器から
転送されてきたカラー画像データに対して文字認識処理
を行なうコンピュータシステム対しても、本発明は適用
可能である。
【0054】<本実施形態の変形例>以下、上述した第
1実施形態の変形例について説明する。
【0055】上述した第1実施形態では、図14のステ
ップS2において黒文字判定データに基づいて黒文字と
判定されたデータのみを抽出し、該黒文字データに対し
て画像の文書方向判定を行なう例について説明した。
【0056】そこで、本変形例においては、第1実施形
態で説明した文書方向判定処理を行なった結果、即ち図
14のステップS9で得られる処理結果における自信度
が所定値よりも低い場合には、原稿中に黒文字部分が少
ないとみなす。そして、その場合には再度原稿を読み取
るか、図13に示すCPU/メモリ部401に蓄積され
た画像を再度読み出して、再度領域分離部403に入力
して、領域分離処理を行なう。この領域分離処理におい
ては、黒文字判定データを参照しない。即ち、図14の
ステップS2の処理をスキップして、ステップS3から
やり直し、以下ステップS9までの、従来通りの処理を
行なう。
【0057】そして、再度得られた処理結果の自信度
と、以前に判定された自信度とを比較し、その高い方を
選択する。
【0058】このように、原稿画像の文書方向判別を行
なう際に、カラー原稿の方向判定に大きく寄与する黒文
字における方向判別結果を優先とし、方向判別の自信度
が小さければ更に従来通りの方向判別処理を行なうこと
により、カラー原稿に対する文書方向判別の精度をより
向上させることができる。
【0059】<他の実施形態>なお、本発明は、複数の
機器(例えばホストコンピュータ,インタフェイス機
器,リーダ,プリンタなど)から構成されるシステムに
適用しても、一つの機器からなる装置(例えば、複写
機,ファクシミリ装置など)に適用してもよい。
【0060】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0061】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0062】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0063】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0064】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0065】
【発明の効果】以上説明したように本発明によれば、原
稿画像の文書方向判別を行なう際に、カラー原稿の方向
判定に大きく寄与する黒文字の方向判別を優先とするこ
とにより、カラー原稿に対する文書方向判別の精度を向
上させることができる。従って、それに伴い文字認識の
精度を向上させることができる。
【0066】
【図面の簡単な説明】
【図1】本発明に係る一実施形態における画像処理装置
の側断面図である。
【図2】コントローラ139の詳細構成を示すブロック
図である。
【図3】画像処理部206の詳細構成を示すブロック図
である。
【図4】判別データ生成部302の詳細構成を示すブロ
ック図である。
【図5】黒除去回路114の詳細構成を示すブロック図
である。
【図6】下地判定回路119の詳細構成を示すブロック
図である。
【図7】エッジ検出回路115の詳細構成を示すブロッ
ク図である。
【図8】エッジ検出回路115における動作を示すタイ
ミングチャートである。
【図9】判定回路120の詳細構成を示すブロック図で
ある。
【図10】判定回路121の詳細構成を示すブロック図
である。
【図11】彩度判定回路116の詳細構成を示すブロッ
ク図である。
【図12】彩度信号Crの特性を示す図である。
【図13】文書方向判別部303の詳細構成を示すブロ
ック図である。
【図14】文書方向判別、文字認識処理を示すフローチ
ャートである。
【図15】文書方向判別における領域分離状態を示す図
である。
【図16】文字認識処理の処理過程を説明するための図
である。
【図17】文書方向判別処理を説明するための図であ
る。
【図18】領域分離および文字認識情報のデータ形式を
示す図である。
【符号の説明】
302 判別データ生成部 303 文書方向判別部 304 白黒画像生成部 401 CPU/メモリ部 402 文字認識/方向判別部 403 領域分部 407 文字認識辞書 1000 遅延回路 1114 黒除去回路 1115 エッジ検出回路 1116 彩度判定回路 1117 孤立点除去処理回路 1118 平滑化処理回路 1119 下地判定回路 1120,1121 エッジ判定回路 1122 セレクタ 1123 ANDゲート
フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 1/40 F

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 画像データを入力する画像入力手段と、 前記画像データから黒エッジ部を検出する黒エッジ検出
    手段と、 前記黒エッジ検出手段により黒エッジが検出された前記
    画像データに基づいて画像の文書方向を判別する文書方
    向判別手段と、を有することを特徴とする画像処理装
    置。
  2. 【請求項2】 前記画像入力手段はカラー画像データを
    入力することを特徴とする請求項1記載の画像処理装
    置。
  3. 【請求項3】 更に、前記カラー画像データから白黒画
    像データを生成する白黒画像生成手段を有し、 前記文書方向判別手段は、前記黒エッジ検出手段による
    検出結果及び前記白黒画像データに基づいて画像の文書
    方向を判別することを特徴とする請求項2記載の画像処
    理装置。
  4. 【請求項4】 前記黒エッジ検出手段は、 前記画像データに対して画像領域であるか否かを判定す
    る画像領域判定手段と、 前記画像データのエッジ部を検出するエッジ検出手段
    と、 前記画像データに対して彩度判定を行なう彩度判定手段
    と、を有し、 前記画像領域判定手段による判定結果及び前記エッジ検
    出手段による検出結果に応じてノイズ除去及び強調され
    たエッジ部を抽出し、該抽出されたエッジ部のうち前記
    彩度判定手段において無彩色であると判定された画像デ
    ータを、黒エッジとして検出することを特徴とする請求
    項3記載の画像処理装置。
  5. 【請求項5】 前記黒エッジ検出手段は、前記エッジ検
    出手段により検出されたエッジ部のうち、前記画像領域
    判定手段により画像領域であると判定されたものについ
    てはノイズ除去を、非画像領域であると判定されたもの
    についてはエッジ強調を行なうことを特徴とする請求項
    4記載の画像処理装置。
  6. 【請求項6】 前記非画像領域は下地領域であることを
    特徴とする請求項5記載の画像処理装置。
  7. 【請求項7】 更に、前記文書方向判別手段により判別
    された文書方向が所定方向でない場合、所定方向になる
    ように画像を回転する回転手段を有することを特徴とす
    る請求項1記載の画像処理装置。
  8. 【請求項8】 更に、前記画像入力手段により入力され
    た画像データを一時保持するメモリを有し、 前記回転手段は、前記画像データの前記メモリからの読
    み出しアドレスを制御することにより、画像を回転する
    ことを特徴とする請求項7記載の画像処理装置。
  9. 【請求項9】 前記文書方向判別手段は、 文字認識辞書を保持する辞書保持手段と、 前記画像データから文字領域を抽出する抽出手段と、 前記抽出された文字領域に対して前記文字認識辞書を参
    照して文字認識を行なうことにより文字方向判定を行な
    う文字方向判定手段と、 を有し、 前記文字方向判定手段において判定された文字方向によ
    り、画像の文書方向を判別することを特徴とする請求項
    1乃至8のいずれかに記載の画像処理装置。
  10. 【請求項10】 前記文書方向判別手段は、複数方向に
    おける文字認識の精度に基づいて文書方向判別を行なう
    ことを特徴とする請求項9記載の画像処理装置。
  11. 【請求項11】 前記文書方向判別手段は、前記文字認
    識の精度が最高である方向を文書方向であると判別する
    ことを特徴とする請求項10記載の画像処理装置。
  12. 【請求項12】 前記文書方向判別手段は、0°,90
    °,180°,270°の各方向のうち、文字認識の精
    度が最高である方向を文書方向であると判別することを
    特徴とする請求項11記載の画像処理装置。
  13. 【請求項13】 画像データを入力する画像入力工程
    と、 前記画像データから黒エッジ部を検出する黒エッジ検出
    工程と、 前記黒エッジ検出工程において黒エッジが検出された前
    記画像データに基づいて画像の文書方向を判別する文書
    方向判別工程と、を有することを特徴とする画像処理方
    法。
  14. 【請求項14】 前記文書方向判別工程は、 前記画像データを属性毎の領域に分離する領域分離工程
    と、 前記分離された領域から文字領域を抽出する抽出工程
    と、 前記抽出された文字領域に対して文字方向判定を行なう
    文字方向判定工程と、 を有し、 前記文字方向判定工程において判定された文字方向によ
    り、画像の文書方向を判別することを特徴とする請求項
    13記載の画像処理方法。
  15. 【請求項15】 更に、前記文書方向判別工程において
    判別された文書方向が所定方向でない場合、所定方向に
    なるように画像を回転する回転工程を有することを特徴
    とする請求項14記載の画像処理方法。
  16. 【請求項16】 前記文書方向判別工程においては、前
    記文字方向判定工程における文字方向判定の自信度が所
    定値以下である場合に、前記画像データの全てに基づい
    て画像の文書方向を判別することを特徴とする請求項1
    4記載の画像処理方法。
  17. 【請求項17】 画像処理のプログラムコードが格納さ
    れたコンピュータ可読メモリであって、 画像データを入力する画像入力工程のコードと、 前記画像データから黒エッジ部を検出する黒エッジ検出
    工程のコードと、 前記黒エッジ検出工程において黒エッジが検出された前
    記画像データに基づいて画像の文書方向を判別する文書
    方向判別工程のコードと、を有することを特徴とするコ
    ンピュータ可読メモリ。
JP10072512A 1998-03-20 1998-03-20 画像処理装置及びその方法 Withdrawn JPH11272793A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10072512A JPH11272793A (ja) 1998-03-20 1998-03-20 画像処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10072512A JPH11272793A (ja) 1998-03-20 1998-03-20 画像処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH11272793A true JPH11272793A (ja) 1999-10-08

Family

ID=13491480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10072512A Withdrawn JPH11272793A (ja) 1998-03-20 1998-03-20 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH11272793A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017108249A (ja) * 2015-12-08 2017-06-15 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017108249A (ja) * 2015-12-08 2017-06-15 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置

Similar Documents

Publication Publication Date Title
US20050047660A1 (en) Image processing apparatus, image processing method, program, and storage medium
JP3728040B2 (ja) 画像形成装置及び方法
JP2000298702A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JPH1127545A (ja) 画像処理装置及び画像処理方法
JP3787440B2 (ja) 画像処理装置及び画像処理方法
JP5023035B2 (ja) 画像処理装置、当該画像処理装置を含む画像形成装置、画像処理方法、画像処理プログラム、及び当該画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JPH10191018A (ja) 画像処理方法及び装置
JPH11272793A (ja) 画像処理装置及びその方法
JP2000278533A (ja) 画像処理装置
JP2006270148A (ja) 画像処理方法および画像処理装置並びに画像形成装置
JPH11213089A (ja) 画像処理装置及びその方法
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JP2004153567A (ja) 画像入出力装置及びその制御方法、画像入出力システム、及び制御プログラム
JPH10307460A (ja) 画像形成装置及び画像形成方法並びに記憶媒体
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JPH11220557A (ja) 画像処理装置及び方法
JP2000067156A (ja) 画像処理装置及び方法
JP2001313830A (ja) 画像処理装置およびその方法
JP2001312697A (ja) 画像方向判別方法及び装置
JP2002142070A (ja) 画像伝送システムおよび画像伝送装置ならびにそれらの方法
JP2000032247A (ja) 画像認識装置
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JP2002063546A (ja) 画像処理装置、画像処理方法および記憶媒体
JPH11331549A (ja) 画像処理装置及び画像処理方法
JPH11195085A (ja) 画像処理方法及び画像処理装置並びに記憶媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050607