JP2003281469A - 文書画像処理方法 - Google Patents

文書画像処理方法

Info

Publication number
JP2003281469A
JP2003281469A JP2003007567A JP2003007567A JP2003281469A JP 2003281469 A JP2003281469 A JP 2003281469A JP 2003007567 A JP2003007567 A JP 2003007567A JP 2003007567 A JP2003007567 A JP 2003007567A JP 2003281469 A JP2003281469 A JP 2003281469A
Authority
JP
Japan
Prior art keywords
image data
image
inversion
lightness
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003007567A
Other languages
English (en)
Other versions
JP4261922B2 (ja
Inventor
Toshifumi Yamaai
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003007567A priority Critical patent/JP4261922B2/ja
Publication of JP2003281469A publication Critical patent/JP2003281469A/ja
Application granted granted Critical
Publication of JP4261922B2 publication Critical patent/JP4261922B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 多値の画像データの画像で暗い背景中に明る
い文字など明度反転状態にかかわらず画像の傾きや文書
方向の判別が可能となり、文字認識処理のための情報と
して有効な情報を出力すること。 【解決手段】 入力される多値の画像からグレー画像を
作成し(ステップS301)、二値画像Aを作成し(ス
テップS302)、画像の傾きの検出や画像の方向の検
出をおこない(ステップS303)、傾きや方向の検出
の成功を判断する(ステップS304)。成功時には画
像を角度補正する(ステップS305)。一方、失敗時
には明度反転したグレー画像を作成し(ステップS30
6)、二値画像Bを作成し(ステップS307)、再
度、角度や方向を検出し(ステップS308)、角度補
正された画像を作成する(ステップS305)。これに
より明度反転の有無にかかわらず画像の傾きや方向を正
確に検出し補正できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字認識処理の
前処理で文書画像に対する画像処理をおこなう、より詳
しくは、文字認識処理の前段階で多値画像の文書の傾き
や方向検出、および反転文字の抽出をおこなうための文
書画像処理方法に関する。
【0002】
【従来の技術】従来、カラーやモノクログレースケール
など多値の画像について文書の傾き検出や文字認識をお
こなう場合は、いったん二値画像データを作成し、その
二値画像データに対して処理をおこなう方法が知られて
いる。たとえば、二値画像データを作成し、その画像デ
ータに対して傾き検出をおこなう方法がある(下記の特
許文献1参照。)。
【0003】さらに、適当なしきい値で二値化をおこな
い、得られた画像データの平均線幅を計算して、その値
が規定外であれば、文字認識処理に不向きであると判断
し、二値化をやり直すような処理も提案されている(下
記の特許文献2参照。)。本出願人は、傾きの検出とし
て、下記の特許文献3に開示された技術を提案し、画像
の方向の検出には下記の特許文献4に開示された技術を
提案している。
【0004】また、反転文字の抽出については、二値化
した場合に画像上での地と文字がどちらになるかを判断
して、文字が黒となるように反転をさせる技術がある
(下記の特許文献5参照。)。また、黒白画素を計数し
て、その黒画素密度特徴の値から反転判別基準値と比較
することで、白黒が反転されているかどうかを調べる技
術がある(下記の特許文献6参照。)。これらの方法を
組み合わせると、白黒反転部分が多い画像が入力された
場合でも、スキュー(傾き)角度の検出や文書方向の判
別が可能になる。
【0005】
【特許文献1】特開平6−068245号公報
【特許文献2】特開平10−143608号公報
【特許文献3】特開平7−105310号公報
【特許文献4】特開2000−113103号公報
【特許文献5】特許第2743378号公報
【特許文献6】特開平8−249421号公報
【特許文献7】特開平11−110482号公報
【特許文献8】特開2001−008032号公報
【0006】
【発明が解決しようとする課題】しかしながら、特許文
献1や、特許文献2に開示された技術による処理では、
多値の画像データが入力された場合に、白黒反転部分
(カラーであれば、背景と文字の明度が反転されている
ような部分)が多い画像が入力された場合、文書画像の
傾き検出や、方向の判別ができなくなるという問題があ
った。
【0007】傾きや方向判別の検出に失敗する理由はい
くつか考えられる。たとえば、傾きを求めるための直線
成分がない場合や、安定して傾きを求められる文字列が
少ない場合や、どの方向から認識しても文字らしい文字
で書かれている場合(記号や数字以外にも工、H、エ、
田、8などさまざまある)などである。また、失敗する
理由の一つとして、白地に黒文字でなく、黒地に白文字
で書かれている場合がある。
【0008】また、特許文献3や、特許文献4に開示さ
れた技術では、白地に黒文字で書かれていることを前提
として、黒ランの外接矩形で文字矩形を抽出するもので
あるため、黒地に白文字であると正常な文字矩形が得ら
れないことから、ほぼ確実に失敗していた。
【0009】また、反転文字が抽出できる特許文献5
や、特許文献6に開示された技術では、新聞の切り抜き
記事をスキャナに載せて圧版を閉めないでスキャンした
ような画像や、デジタルカメラで背景が黒っぽいところ
においた白地に黒文字の画像のようなものを処理したい
場合には、本文相当の画像は白地に黒文字であるにも関
わらず、黒画素の比率や画素数の方が白画素の画素数を
上回るために、反転の判定を誤認するという問題が生じ
た。
【0010】この発明は、上述した従来技術による問題
点を解消するため、多値の画像データの画像で暗い背景
中に明るい文字など明度反転状態にかかわらず画像の傾
きや文書方向の判別が可能となり、文字認識処理のため
の情報として有効な情報を出力できる文書画像処理方法
を提供することを目的とする。
【0011】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明にかかる文書画像
処理方法は、入力された多値の画像データの画像の傾き
や画像方向を検出する文書画像処理方法において、前記
多値の画像データの二値化をおこない、前記二値化され
た画像データの画像の傾きおよび/または画像方向を検
出するものであり、回転検出工程での検出に失敗した場
合には、前記入力された多値の画像データの明度を反転
させた画像データを作成し、前記作成された明度反転の
画像データを二値化し、該明度反転後の二値画像データ
の画像の傾きおよび/または画像方向を検出する各工程
を備えたことを特徴とする。
【0012】この請求項1の発明によれば、明度反転さ
れた画像データが入力されても、これを受け入れて画像
の傾きや画像方向の検出がおこなえるようになる。
【0013】また、請求項2の発明にかかる文書画像処
理方法は、入力された多値の画像データの画像の傾きや
画像方向を検出する文書画像処理方法において、前記多
値の画像データが明度反転されているか否かを判定し、
前記判定が明度反転の場合には、前記入力された多値の
画像データの明度を反転させた画像データを作成し、前
記明度反転された画像データを二値化し、該明度反転後
の二値画像データの画像の傾きおよび/または画像方向
を検出する各工程を備えたことを特徴とする。
【0014】この請求項2の発明によれば、最初に画像
データの明度反転を判定するため、画像データに対する
二値化の回数を減らすことができ、入力された画像デー
タの明度反転の有無にかかわらず、傾きや方向を高精度
に検出できるようになる。
【0015】また、請求項3の発明にかかる文書画像処
理方法は、請求項1または2に記載の発明において、カ
ラーマップを持つ多値の画像データについての明度反転
はカラーマップの反転情報を作り変えておこなうことを
特徴とする。
【0016】この請求項3の発明によれば、データ部分
は書き換えずカラーマップだけを作り変えて画像データ
の明度反転をおこなう画像処理の効率化を図ることがで
きる。
【0017】また、請求項4の発明にかかる文書画像処
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、前記明度反転前後それぞれの二値画像
データにおける黒画素の連結成分からなる外接矩形を抽
出し、抽出された外接矩形のうち、画像上の周辺に接し
ている外接矩形を除く外接矩形を構成する黒画素数を計
数し、前記明度反転前後それぞれの二値画像データを前
記計数された黒画素数に基づき明度反転の有無を判定す
ることを特徴とする。
【0018】この請求項4の発明によれば、ブック原稿
をスキャンする際に出る原稿周辺のベタノイズ等による
カウントをせず、このベタノイズの影響を排除して原稿
のみの明度反転を正確に判定できるようになる。
【0019】また、請求項5の発明にかかる文書画像処
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、前記明度反転前後それぞれの二値画像
データに対し所定の領域分割処理をおこない、前記領域
分割された前記明度反転前後それぞれの二値画像データ
を所定の評価により前記領域分割結果の正当性に基づき
明度反転の有無を判定することを特徴とする。
【0020】この請求項5の発明によれば、領域分割結
果の評価により明度反転の有無を判定できるようにな
る。
【0021】また、請求項6の発明にかかる文書画像処
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、入力された多値の画像データを二値化
し、該二値化された画像データにおける白画素の連結成
分からなる外接矩形を抽出し、該抽出した外接矩形を合
計した面積と画像の面積との比に基づき明度反転の有無
を判定することを特徴とする。
【0022】この請求項6の発明によれば、面積比を用
い適当な値のしきい値を用いて簡単に明度反転の有無が
判定できるようになる。
【0023】また、請求項7の発明にかかる文書画像処
理方法は、請求項6に記載の発明において、前記明度反
転の判定時には、画像上における前記抽出した白画素の
外接矩形全てを含む領域の面積S3を検出し、前記抽出
した白画素の外接矩形のうち面積が大きい上位所定数N
個による外接矩形の面積S2を求め、(S2/S3)<
Th1である場合に明度が反転されていると判定するこ
とを特徴とする。
【0024】この請求項7の発明によれば、ブック原稿
をスキャンする際に生じる原稿周辺のベタノイズ等によ
るカウントをせず、このベタノイズの影響を排除して原
稿のみの明度反転を正確に判定できるようになる。
【0025】また、請求項8の発明にかかる文書画像処
理方法は、請求項6または7に記載の発明において、前
記明度反転の判定時には、前記抽出した外接矩形の面積
が大きい上位所定数N個以内の外接矩形で、外接矩形中
の白画素の面積があらかじめ定めたしきい値Th2以下
である場合、この外接矩形を除いた面積を用いることを
特徴とする。
【0026】この請求項8の発明によれば、誤認の原因
になる白画素の面積比が少ない白矩形を除き、明度反転
の判定精度を向上できるようになる。
【0027】また、請求項9の発明にかかる文書画像処
理方法は、請求項2〜8のいずれか一つに記載の発明に
おいて、前記明度反転の判定時には、入力された多値の
画像データを二値化する際に、該画像データを所定の割
合M1で縮小することを特徴とする。
【0028】この請求項9の発明によれば、縮小された
画像データを用いることにより、データ容量を小さくし
明度反転の判定を高速化できる。また、JPEGなどの
データ劣化が起こる圧縮形式や、印刷に重点をおいた画
像処理で黒ベタ領域の中や周辺に生じる白ぬけノイズの
発生を縮小により回避できるようになる。
【0029】
【発明の実施の形態】以下に添付図面を参照して、この
発明にかかる文書画像処理方法の好適な実施の形態を詳
細に説明する。
【0030】図1は、本発明の文書画像処理方法が適用
される文字認識装置の構成を示すブロック図である。文
字認識装置100は、スキャナ101が読み取った画像
データを文字認識してディスプレイ102、およびプリ
ンタ等の印字装置103にテキスト等の文字データを出
力する。
【0031】文字認識装置100は、スキャナ101の
画像データを格納する画像メモリ104,画像メモリ1
04の画像データを文字認識処理するCPU105,C
PU105の文字認識処理時のデータのワークメモリと
して用いられるRAM107,文字認識処理の前処理を
実行する各機能部108〜112で構成される。
【0032】これら各機能部は、文字認識処理プログラ
ムの一部を構成するものであり、入力される多値画像デ
ータが有する濃淡階調を二値化する二値化部108,二
値化された画像データで画像の傾きおよび文書の方向を
検出する回転検出部109,画像の明度を反転させる明
度反転部110,画像データを回転させる画像回転部1
11,画像データの明度反転を判定する明度反転判定部
112,の各手段(機能別プログラム)で構成されてい
る。これら各手段で検出された情報(データ)は不図示
の文字認識(OCR)部に供給され、文字認識処理時の
情報として利用される。
【0033】(実施の形態1)図2は、上記構成による
文書処理手順を示すフローチャートである。この文書処
理は、文字認識処理の前処理として実行されるものであ
り、文書の傾きや方向を検出して補正し、必要に応じて
画像を反転させて再度文書の傾きや方向を検出して画像
データを補正し、文字認識部(不図示)に渡すものであ
る。
【0034】本発明では、以下の各実施形態においてカ
ラーの多値画像データが入力され、これをグレー化して
用いる。また、グレー画像データに対して固定しきい値
での一様二値化をおこなう。このときのパラメーターに
は比較的濃い目の画像が得られる100を用いて、二値
の画像を作成する。なお、この発明で適応二値化を用い
ない理由は後述する。
【0035】はじめに、二値化部108は、入力された
カラーの多値画像から、二値化をおこない二値の画像デ
ータAを作成する(ステップS201)。二値化には判
別分析をするなどいずれの手法を用いても良い。つぎ
に、生成された二値の画像データAによって画像の傾き
や方向など補正角度Aを検出する(ステップS20
2)。
【0036】このように、多値の画像データを用いて直
接これらの角度や方向を検出するのではなく、一度多値
の画像データを二値化し、二値画像データに対して検出
する方法は、上述した特許文献1に開示されている如く
複数存在している。この発明では、特に画像の傾き検出
や画像の方向検出の手法は特にこだわらない。
【0037】この後、角度検出(傾きや方向の検出)に
失敗したか否か判断する(ステップS203)。成功し
た場合には(ステップS203:No)、検出された角
度や方向に基づき画像データを角度補正した画像データ
を作成する(ステップS204)。この発明では、傾き
や方向の検出に失敗した場合に(ステップS203:Y
es)、失敗した原因が白黒反転にあったかどうかを確
かめるための処理をおこなう。
【0038】すなわち、画像データを明度反転(白黒反
転)させた画像Bを作成し(ステップS205)、その
画像で角度検出を再度試みるものである。ここで、二値
画像を単純に反転しただけでは比較的安定した文字画像
が得られないことがわかっている。一般の文書画像では
暗色の方が文字であることが多いため、細い暗色の文字
がかすれないように設定されている。適応二値化の方式
であっても、パラメーターで濃い部分(黒)を残すよう
に設定されていることが多い。したがって、暗い背景に
明るい細い文字があった場合の二値画像は、かすれ気味
になる傾向がある。
【0039】ここで、上記の適応二値化について簡単に
説明する。本出願人は、特許文献8に開示されている適
応二値化の提案をおこなっている。この方式は、画像を
ブロック単位に分け、そのブロックごとに、しきい値を
決めて二値化をするとともに、隣りのブロックの決定済
みのしきい値と大きく異なったしきい値にならないよう
に補正をして、ブロックの境目に線が出たりしないよう
に二値化するものである。上記方式によらず、部分的に
しきい値を変えながら画像全面を二値化していく方法を
適応二値化と呼称している。適応二値化では、ブロック
ごとにしきい値を決める点が特徴となっている。
【0040】ブロックの中には白と黒が入っていると通
常考え、濃度分布の谷のところをしきい値にすると、白
と黒にはっきり分けることができるという考えを利用し
ている。ところが、仮にブロックの中に黒だけがあった
とする。この場合、背景の一部のブロックでは、ほぼ黒
一色にもかかわらず、白と黒を分けようと計算するた
め、微妙に色の薄い部分が白く二値化されてしまう場合
が発生する。これにより、上記のように、暗い背景に明
るい細い文字があった場合の二値画像は、かすれ気味に
なる傾向が生じる。
【0041】このため、ステップS205では、入力さ
れたカラーの多値の画像データ(元画像)自体を明度反
転した画像データを作成する。この後、この明度反転さ
れた画像データを改めて二値化した二値の画像データB
を得た後(ステップS206)、この画像データBを用
いて再度、傾きと方向を検出し(ステップS207)、
角度補正された画像データを作成する(ステップS20
4)。
【0042】上記処理によれば、従来成功していた画像
が入力されたときには、角度および方向の検出を失敗す
ることなく、従来失敗していた、全面が明度反転されて
いる画像について角度および方向の検出を成功させるこ
とができる。
【0043】なお、上記ステップS203の処理で判断
する、画像の傾きと方向の検出の失敗の有無について
は、傾きと方向の判別をどちらもおこなう場合に、どち
らか一方が失敗したら、それで終了(失敗)という判断
とすることもできるが、片方(たとえば傾き)が失敗し
ても、もう一方(文書方向)を処理して、そちらが成功
した場合は、傾き検出のみ失敗したという結果を出力
し、両方失敗した場合は、両方失敗したという結果を別
途通知等で出力する構成にできる。この場合、ステップ
S203では、傾きあるいは文書方向の検出失敗により
失敗(ステップS203:Yes)と判断する。
【0044】(実施の形態2)つぎに、図3は、他の文
書処理手順を示すフローチャートである。図示の如く実
施の形態1との対比では、入力されたカラーの画像デー
タに対し、彩度を除いた、明度成分のみのグレースケー
ルの画像データAを作成する点が異なる(ステップS3
01)。
【0045】カラーからグレー画像の生成方法には、R
GBからの変換式や最も単純なものでは、近似値という
ことで、G成分のみ使用する方法などがある。そして、
このグレースケールの画像データを保持しておき、この
グレーの画像データを使用して二値の画像データAを作
成する(ステップS302)。この後、この二値の画像
データAによって画像の傾きの検出や、画像の方向の検
出をおこなう(ステップS303)。
【0046】この後、傾きや方向の検出に失敗したか否
か判断する(ステップS304)。成功した場合には
(ステップS304:No)、検出された角度や方向に
基づき画像データを角度補正した画像データを作成する
(ステップS305)。一方、傾きや方向の検出に失敗
した場合には(ステップS304:Yes)、失敗した
原因が白黒反転にあったかどうかを確かめるための処理
をおこなう。
【0047】まず、ステップS301で作成されたグレ
ースケールの画像データAを明度反転したグレースケー
ルの画像データBを作成する(ステップS306)。こ
の後、この明度反転された画像データを改めて二値化し
た二値の画像データBを得た後(ステップS307)、
この画像データBを用いて再度、角度や方向を検出し
(ステップS308)、角度補正された画像データを作
成する(ステップS305)。
【0048】上記処理のように、入力されたカラーの画
像を元に、グレースケールの画像データを作成しておく
ことにより、明度反転用のグレーの画像データの作成、
二値化、反転画像の保持、という各構成は、多値画像を
直接処理するのに比べ処理時間、メモリ容量の点で低コ
スト化できるようになる。
【0049】(実施の形態3)つぎに、図4は、他の文
書処理手順を示すフローチャートである。図示の如く、
この処理手順では、画像の明度反転判定処理を実行する
構成である。まず、入力されたカラーの多値の画像デー
タが明度全面反転されているか判定処理を実行する(ス
テップS401)。この明度全面反転判定処理の内容は
後述する。
【0050】そして、明度反転なしの場合は(ステップ
S402:No)、この画像データの二値の画像データ
Aを作成する(ステップS403)。この後、この二値
の画像データAによって画像の傾きの検出や、画像の方
向の検出をおこない(ステップS404)、検出された
角度や方向に基づき画像データを角度補正した画像デー
タを作成する(ステップS405)。
【0051】一方、明度反転があった場合には(ステッ
プS402:Yes)、元画像であるカラーの画像デー
タの明度を反転した画像データBを作成する(ステップ
S406)。この後、明度反転後の二値の画像データB
を作成する(ステップS407)。この後、この二値の
画像データBによって画像の傾きの検出や、画像の方向
の検出をおこない(ステップS408)、検出された角
度や方向に基づき画像データを角度補正した画像データ
を作成する(ステップS405)。
【0052】上記処理の実行により、二値化の回数を減
らすことができ、また、明度の反転に基づき傾きや方向
の検出の精度向上が図れるようになる。
【0053】(実施の形態4)つぎに、図5は、他の文
書処理手順を示すフローチャートである。図示の如く、
この処理手順では、グレー画像を作成し、また、画像の
明度反転判定処理を実行する構成である。まず、入力さ
れたカラーの多値の画像データを元にグレースケールの
画像データAを作成する(ステップS501)。つぎ
に、この画像データAが明度全面反転されているか判定
処理を実行する(ステップS502)。
【0054】そして、明度反転なしの場合は(ステップ
S503:No)、この画像データの二値の画像データ
Aを作成する(ステップS504)。この後、この二値
の画像データAによって画像の傾きの検出や、画像の方
向の検出をおこない(ステップS505)、検出された
角度や方向に基づき画像データを角度補正した画像デー
タを作成する(ステップS506)。
【0055】一方、明度反転があった場合には(ステッ
プS503:Yes)、先に作成したグレースケールの
画像データAの明度を反転した画像データBを作成する
(ステップS507)。この後、明度反転した画像デー
タBを二値化した画像データBを作成する(ステップS
508)。この後、この二値の画像データBによって画
像の傾きの検出や、画像の方向の検出をおこない(ステ
ップS509)、検出された角度や方向に基づき画像デ
ータを角度補正した画像データを作成する(ステップS
506)。
【0056】上記処理の実行により、二値化の回数を減
らすことができ、また、明度の反転に基づき傾きや方向
の検出の精度向上が図れるようになる。また、ステップ
S501でグレースケール画像を作成しておくので、カ
ラー画像から二値画像の作成、カラー画像の反転、反転
した画像データを保持しておくための各処理時間、使用
メモリ量を低コスト化できるようになる。
【0057】(実施の形態5)実施の形態5は、各実施
の形態1〜4で説明した文書画像処理方法で、多値画像
の明度反転画像を作成するのに、カラーマップだけを作
り変え、データ部分は書き換えない方法で明度反転画像
を作成する方法である。
【0058】この場合24ビットフルカラー画像のよう
にカラーマップを持っていない画像では対応できない
が、パーソナル・コンピューター(PC)で汎用のDI
B形式におけるグレー画像や256色などインデックス
カラーと呼ばれるものは、カラーマップを持っていて、
どのデータがどの色であるかを管理している。
【0059】具体的にカラーマップの作り変えを説明す
る。これは、カラーマップの明度を反転させた、別マッ
プを作ることであり、たとえば順番に、(R,G,B)
=(0,0,0),(1,1,1),(2,2,2),
〜(255,255,255)と並んでいた場合に、
(R,G,B)=(255,255,255),(25
4,254,254),〜(0,0,0)としたカラー
マップを作る。このように、カラーマップの情報だけを
書き換えることで、データ部のデータを変更する必要が
なく、データサイズによらず高速な処理をおこなうこと
ができる。
【0060】(実施の形態6)実施の形態6は、明度反
転処理をおこなう実施の形態3〜5の文書画像処理方法
において、明度反転判定の結果、反転されている、とい
う判定結果の場合に、元画像データが明度反転されてい
るという判定結果を次工程の処理に出力する構成であ
る。
【0061】次工程は、文字認識部による文字認識処理
であり、文字認識部では、元画像データがそのまま入力
されたか、あるいは元画像データが明度反転された画像
データが入力されたかを判断することができるようにな
る。たとえば、文字認識部が明度反転された画像データ
を用いて文字認識処理をおこない何らかの失敗が生じた
場合、元画像データを再度取り込んで文字認識処理を再
度実行することが可能となる。
【0062】(実施の形態7)実施の形態7は、上記実
施の形態1〜5において、全面反転した後の出力の二値
画像データBを用いて画像の傾きや方向判別をおこなっ
た結果が成功した場合に、出力される画像データが元画
像データを明度反転させた画像データであるという結果
を次工程(文字認識部)に出力する構成である。実施の
形態6と比較して、結果出力は傾きや方向判別が成功し
た際に出力されるという点で出力のタイミングが異な
り、文字認識処理前に入力される画像データが明度反転
されたものであるか否かを判断できるようになる。
【0063】(実施の形態8)実施の形態8は、上記実
施の形態1〜7の各文書画像処理方法において、明度反
転をおこなって二値化した際に、画像の傾きまたは方向
判別が失敗した場合の処理である。このような場合に
は、明度反転されていない、もしくは不明であるという
結果を次工程に出力する構成である。これにより、文字
認識部は、入力された結果に応じた文字認識処理を実行
できるようになる。
【0064】(実施の形態9)実施の形態9における処
理は、上記実施の形態1〜7の各文書画像処理方法にお
いて、明度反転をおこなって二値化した際に、画像の傾
きまたは方向判別が失敗した場合、次工程(文字認識
部)に対し、明度反転をした画像データを強制的に使用
しない(出力しない)構成である。すなわち、明度反転
しても失敗した画像データをそのまま次工程以降に用い
ることを禁止することにより、次工程以降での失敗の増
加を防ぎ、元画像データで処理を継続させることによ
り、操作者の意図に沿った処理および処理結果を出力で
きるようになる。
【0065】(実施の形態10)実施の形態10は、上
記実施の形態で説明した明度判定処理の具体的処理内容
である。図6は、明度判定処理内容を示すフローチャー
トである。たとえば、図4のステップS401での判定
処理に相当し、以下に説明する。
【0066】まず、入力されるカラーの多値画像をグレ
ースケール化したグレーの画像データAに基づき、この
グレーの画像データAを明度反転したグレーの画像デー
タBを作成する(ステップS601)、つぎに、グレー
の画像データAから二値化された二値の画像データAを
作成し(ステップS602)、明度反転されたグレーの
画像データBに対しても二値の画像データBを作成する
(ステップS603)。
【0067】そして、二値の画像データAの黒画素数を
計数し(ステップS604)、明度反転された二値画像
データBの黒画素数を計数する(ステップS605)。
この計数は画素数計測部(図示せず)がおこなう。この
後、これら二値の画像データA,Bそれぞれで計数され
た黒画素の総数を比較する(ステップS606)。比較
の結果、二値画像データAの黒画素数の方が少なければ
(ステップS606:Yes)、明度反転なしと判定す
る(ステップS607)。一方、明度反転された二値画
像データBの黒画素数の方が少なければ(ステップS6
06:No)、明度反転(全面反転)と判定する(ステ
ップS608)。このように黒画素数の計数だけで容易
に明度反転の有無を判定できる。
【0068】(実施の形態11)実施の形態11は、実
施の形態10で説明した明度反転判定処理の一部を変更
した構成である。グレーの画像データA,Bからそれぞ
れ二値の画像データA,Bを作成するまでの各処理(ス
テップS601〜S603)までは同様の処理である。
この後、ステップS604,S605で二値の画像デー
タA,Bをそれぞれ黒画素を計数する際に、上下左右の
端から連続する黒画素は計数の対象外とする。
【0069】上記の上下左右の端からの連続とは、画像
の端に接しているものからの連続であり、斜め方向およ
び水平、垂直方向でそれぞれ画像の端から接している黒
画素は計数しない。これにより、ブック原稿をスキャン
する際に生じる原稿周辺のベタノイズ等によるカウント
をせず、このベタノイズの影響を排除して原稿のみの明
度反転を正確に判定できるようになる。
【0070】(実施の形態12)実施の形態12は、明
度判定処理の他の具体的処理内容である。図7は、この
実施形態の明度判定処理内容を示すフローチャートであ
る。ステップS701〜S704までの元画像データに
対する処理と、ステップS705〜S709までの元画
像を反転処理した画像データに対する処理は並行して実
行できる。
【0071】元画像データに対する処理(ステップS7
01〜S704)を説明する。カラーの多値画像データ
がグレースケール化された画像データAが入力される
と、このグレーの画像データAを二値化し二値の画像デ
ータAを作成する(ステップS701)。つぎに、二値
の画像データAにおいて黒画素の連結部分による全ての
外接矩形を抽出する(ステップS702)。つぎに、得
られた外接矩形のうち、外接矩形の座標値が原稿の上下
左右に接触している矩形を無効にする(ステップS70
3)。そして、無効とされた矩形を除く各矩形中の黒画
素を計数する(ステップS704)。
【0072】元画像データを明度反転した側の処理(ス
テップS705〜ステップS709)も他方と同様であ
るが、まず、グレースケール化された画像データAを明
度反転したグレーの画像データBを作成する(ステップ
S705)。つぎに、グレーの画像データBを二値化し
二値画像データBを作成する(ステップS706)。つ
ぎに、二値画像データBにおいて黒画素の連結部分によ
る全ての外接矩形を抽出する(ステップS707)。つ
ぎに、得られた外接矩形のうち、外接矩形の座標値が原
稿の上下左右に接触している矩形を無効にする(ステッ
プS708)。そして、無効とされた矩形を除く各矩形
中の黒画素を計数する(ステップS709)。
【0073】つぎに、これら画像データA,Bで得られ
た各矩形中の黒画素数を対比する(ステップS71
0)。この結果、画像データAの黒画素数の方が少なけ
れば(ステップS710:Yes)、明度反転なしと判
定する(ステップS711)。一方、画像データBの黒
画素数の方が少なければ(ステップS710:No)、
明度反転(全面反転)ありと判定する(ステップS71
2)。これにより、ブック原稿をスキャンする際に生じ
る原稿周辺のベタノイズ等によるカウントをせず、この
ベタノイズの影響を排除して原稿のみの明度反転を正確
に判定できるようになる。
【0074】(実施の形態13)実施の形態13は、明
度判定処理の他の具体的処理内容である。図8は、この
実施形態の明度判定処理内容を示すフローチャートであ
る。ステップS801〜S802の元画像データに対す
る処理と、ステップS803〜S805までの元画像を
反転処理した画像データに対する処理は並行して実行で
きる。
【0075】元画像データに対する処理(ステップS8
01,S802)を説明する。カラーの多値画像データ
をグレースケール化した画像データAが入力されると、
このグレーの画像データAを二値化し、二値の画像デー
タAを作成する(ステップS801)。つぎに、この二
値の画像データAに対して、自動の領域分割処理をおこ
なう(ステップS802)。
【0076】元画像データを明度反転した側の処理(ス
テップS803〜ステップS805)も他方と同様であ
るが、まず、グレースケール化された画像データAを明
度反転したグレーの画像データBを作成する(ステップ
S803)。つぎに、グレーの画像データBを二値化
し、二値画像データBを作成する(ステップS80
4)。つぎに、この二値画像データBに対して、自動の
領域分割処理をおこなう(ステップS805)。
【0077】つぎに、これら画像データA,Bで得られ
た各領域分割結果を対比する(ステップS806)。こ
の結果、画像データAの結果の正当性が高ければ(ステ
ップS807:Yes)、明度反転なしと判定する(ス
テップS808)。一方、画像データBの結果の正当性
が高ければ(ステップS807:No)、明度反転(全
面反転)ありと判定する(ステップS809)。
【0078】上記2つの画像データA,Bにおける領域
分割の処理概要を説明する。この領域分割処理および評
価は、本出願人が先に出願した特許文献7などに開示さ
れた公知技術を用いることができる。図9は、この領域
分割方法を実現する具体的構成を示すブロック図であ
る。第1,第2の領域分割手段901,902は、それ
ぞれ異なる領域分割方法を用いて入力文書画像を文字領
域などの要素に分割する。領域分割結果評価手段903
は、分割された各領域内における行頭の揃い度合い、あ
るいは文字サイズの変動の度合いを基に、それぞれの分
割結果を評価し、評価値の高い分割結果を選択する。こ
のような領域分割結果の評価により明度反転の有無を判
定できるようになる。
【0079】(実施の形態14)実施の形態14は、上
述した実施形態と異なり、明度反転したグレーの画像デ
ータB,二値の画像データBはすぐには作成しない。グ
レーの画像データAと、二値の画像データAを作成す
る。そして、この二値の画像データAについて、白画素
の連結成分からなる外接矩形を抽出し、この外接矩形の
面積と、二値画像データの全面の面積を特徴として、明
度反転の条件を経験的に設定するものである。この明度
判定では、基本的に、白地に黒文字で書かれていると想
定される領域の面積が、全体に対して大きければ、明度
が反転されていないと判断するものである。
【0080】上記面積の特徴の使い方の例を図10のフ
ローチャートを用いて説明する。まず、カラーの多値の
元画像データから作成されたグレースケールの画像デー
タAの入力により、二値化した画像データAを作成する
(ステップS1001)。この二値の画像データAの面
積をS1としておく。
【0081】つぎに、この二値の画像データA内におい
て、白画素により構成される全ての矩形を抽出し(ステ
ップS1002)、得られた全ての白画素矩形を面積の
大きい順にソートする(ステップS1003)。つぎ
に、これら白画素矩形の面積が大きい上位の所定の数N
(例えばN:2〜10)個の矩形を抽出し(ステップS
1004)、これら上位N個の白画素矩形の面積を積算
(加算)する(ステップS1005)。N個全ての白画
素の矩形の面積が積算されるまでは、ステップS100
4に復帰するi回(i=0〜N)のループを実行する
(ステップS1006:No)。N個全ての白画素の矩
形の面積が積算されると(ステップS1006:Ye
s)、面積の総和をS2とする。
【0082】つぎに、画像データAの面積S1における
白画素矩形の面積S2の面積比を求め、あらかじめ設定
された所定のしきい値Th1(0.4〜0.6)と対比
する(ステップS1007)。そして、下記式
【0083】(S2/S1)>Th1 を満たす場合には(ステップS1007:Yes)、明
度の反転なしと判定する(ステップS1008)。上記
を満たさない場合には(ステップS1007:No)、
明度が反転されていると判定する(ステップS100
9)。ここで、白画素矩形の面積S2が大きいほど、上
記S2/S1の比は大きくなる。したがって、適当な値
のしきい値Th1を用いるだけで簡単に明度反転の有無
が判定できる。
【0084】上記説明したしきい値Th1の値について
説明する。背景を囲む面積は、画像の情報を持つ面積の
大半を示すため、白の面積と、黒の面積のいずれが単純
に大きいかの判定に5割(しきい値0.5)の線が通常
の大まかなしきい値となる。しかし、上記処理内容によ
る面積計算では、画像の総面積―白矩形の面積=黒の面
積とはならない。すなわち、白の面積は白画素の外接矩
形の面積であるため、たとえば、斜めの白い線があると
すると、面積は白画素よりもはるかに大きな値に計算さ
れることになる。このため、通常値に対する余裕を見て
しきい値は、0.4〜0.6の範囲とする。このしきい
値は、通常値に対し経験的(統計的)な範囲で設定でき
る。
【0085】また、上記処理回数規定のための所定の数
Nの設定について説明する。所定の数N1を2〜10に
設定した点については、白画素矩形を全て探索するので
は、処理時間がかかるため、処理時間を減らすべく面積
順にして有効そうな数分だけを処理するためである。現
実的には、似たような面積で、しかも白背景である領域
が複数あるものは特殊な事象であり、ここでは少なくと
も一つ以上の数を限定して調べるための値である。この
処理回数規定のためのNの設定により、計算量(処理時
間)を減らすことができる。結果として全ての矩形の面
積を足すことにならないので、あらかじめ設定されるし
きい値Th1には、標準的なしきい値の0.5より小さ
な値をセットしておく方が望ましい。
【0086】(実施の形態15)実施の形態15は、上
記明度反転判定処理の他の例である。この実施の形態1
5は、実施の形態14にて面積比を計算する際に(ステ
ップS1007)、画像データ全面の面積S1を用いな
い。代わりに、白画素矩形全てを含む領域の面積S3を
求めておき、S1の代わりにS3を使用し、白画素矩形
の面積S2との比で白画素面積比を算出する。
【0087】面積S3の算出例は、画像上での白画素矩
形が存在するX,Y座標上での最小点位置(Xs,Y
s)と、最大点位置(Xe,Ye)の2点の座標値によ
り、白画素矩形を全て含む4点の座標値が得られ、これ
ら4点で囲まれた範囲を面積S3として得る。このよう
な処理においても、適当な値のしきい値Th1を用い、
下記式
【0088】(S2/S3)<Th1
【0089】を判断するだけでブック原稿をスキャンす
る際に生じる原稿周辺のベタノイズ等によるカウントを
せず、このベタノイズの影響を排除して原稿のみの明度
反転を正確に判定できるようになる。
【0090】(実施の形態16)実施の形態16は、実
施の形態14,15で説明した明度反転の判定処理につ
いての変形例の構成である。これら実施の形態14,1
5では白画素矩形の面積を用いて明度反転している。こ
れは、白地に黒文字であった場合、背景色は当然白であ
り、背景色の方が文字の黒より多くなるのが通常である
ことに基づく。たとえば、実施の形態14では、このよ
うな、白が背景色となっている部分の面積S2を算出
し、画像全体の面積S1に対する割合であるかを、明度
反転判定に使用している。このため、白画素の面積比が
少ない白矩形は誤認の原因になる可能性が高い。
【0091】このため、この実施形態では、二値の画像
データについて、白画素の連結成分からなる外接矩形を
抽出した後、抽出された矩形の面積上位の所定の数分の
矩形で、矩形中の白画素の面積比があらかじめ定めたし
きい値Th2(0.3〜0.6)以下である場合は、該
当する矩形を除き判定処理(ステップS1007)をお
こなう構成とする。これにより、誤認の原因になる白画
素の面積比が少ない白矩形を除き、明度反転の判定精度
を向上できるようになる。
【0092】上記説明したしきい値Th2の値について
説明する、上記説明したように、白矩形の内部が白の斜
め線などの場合には、面積は大きいが内部の白画素数が
少ないことがあり得る。しきい値Th2は、この対策と
して、矩形中の白画素比率の低いものは白矩形として面
積を足しこまないために設定される。たとえば、白背景
に端まで文字が密に記載されていたとすると、実際の白
画素数は少なくなる。しかし白背景であることには変わ
りはなく、面積としては、白画素数分だけではなく、全
体を白背景領域とする方が最も自然であると判断するこ
とに基づいている。他にも、たとえば黒背景にぎざぎざ
が沢山あるような星型の白背景領域があると、線の谷付
近に黒画素がある影響で全体の白画素比率は下がる。こ
の対策として、背景中に存在する黒画素の占有率を考え
たときに、通常のしきい値(0.5)よりも少ない方向
に多く範囲を取ったしきい値Th2(0.3〜0.6)
の範囲とすることが有効となる。
【0093】(実施の形態17)実施の形態17は、明
度判定処理の他の具体的処理内容である。図11は、こ
の実施形態の明度判定処理内容を示すフローチャートで
ある。縮小した二値の画像データを生成し、この縮小さ
れた画像データを用いて明度反転判定をおこなう構成で
ある。
【0094】カラーの画像データがグレースケール化さ
れ、このグレーの画像データが入力される。はじめに、
このグレーの画像データを所定の倍率(M1)%に縮小
した画像データを作成する(ステップS1101)。倍
率M1としては、たとえば、12.5%,25%,50
%のいずれかの値を使用する。これらの数値は、それぞ
れ画像データを1/8,1/4,1/2に縮小処理する
もので、これらの倍率設定は比較的高速に縮小処理でき
る倍率である。
【0095】また、倍率M1として、入力された画像デ
ータの解像度からあらかじめ定めた所定の解像度R1を
作成するための値を求め設定する構成にもできる。この
場合、解像度R1の画像データを得るための変倍率M1
を算出し設定する。解像度R1としては、50dpi,
72dpi,100dpi,150dpi,200dp
iという値が使用される。これらの数値は、通常、入力
が予想される解像度に対して1/n(nは整数)倍に相
当することが多く、変倍処理を円滑におこなえる値であ
る。
【0096】つぎに、この縮小された画像データを二値
化する(ステップS1102)。そして、この二値の画
像データA内において、白画素により構成される全ての
矩形を抽出し(ステップS1103)、全白画素矩形か
らなる領域の面積(前述した面積S3に相当)を算出す
る(ステップS1104)。つぎに、得られた全ての白
画素矩形を面積の大きい順にソートする(ステップS1
105)。そして、これら白画素矩形の面積が大きい上
位の所定の数N(例えば、N:2〜10)個の矩形を抽
出する(ステップS1106〜S1109のループ)。
このループ処理では、抽出された矩形の面積上位の所定
の数分の矩形で、矩形中の白画素の面積があらかじめ定
めたしきい値Th2(0.3〜0.6)以下である場合
(ステップS1107:No)、何もせずにステップS
1106へ戻ることで該当する矩形が除かれ、しきい値
Th2よりも大きい場合(ステップS1107:Ye
s)にのみ、上位N個の白画素矩形の面積が積算(加
算)される(ステップS1108)。
【0097】N個全ての白画素の矩形の面積が積算され
るまでは、ステップS1106に復帰するi回(i=0
〜N)のループを実行する(ステップS1109:N
o)。N個全ての白画素の矩形の面積が積算されると
(ステップS1109:Yes)、面積の総和を求め
(面積S2に相当)、白画素矩形の範囲面積(S3)に
おける白画素矩形の面積(S2)の面積比を求め、あら
かじめ設定された所定のしきい値Th3(値:1/2)
と対比する(ステップS1110)。
【0098】(S2/S3)>Th3 を満たす場合には(ステップS1110:Yes)、明
度の反転なしと判定する(ステップS1111)。上記
を満たさない場合には(ステップS1110:No)、
明度反転されていると判定する(ステップS111
2)。
【0099】上記処理で縮小された画像データを用いる
ことにより、データ容量を小さくし明度反転の判定を高
速化することができるようになる。また、JPEGなど
のデータ劣化が起こる圧縮形式や、印刷に重点をおいた
画像処理で黒ベタ領域の中や周辺に白ぬけノイズが発生
することがある。このノイズは、矩形抽出を用いる方法
では画素が白黒双方であっても無用な矩形が多数発生し
て明度反転判定の処理に影響が生じる。上記のような画
像データの縮小化によれば、この白ぬけノイズの発生を
回避することができる。なお、上記処理で縮小された二
値の画像データは、そのまま以降の処理画像に用いるこ
とができる他、文字認識時に再度、元画像データを取り
込み処理することもできる。
【0100】なお、本実施の形態で説明した文書画像処
理方法は、あらかじめ用意されたプログラムをパーソナ
ル・コンピュータやワークステーション等のコンピュー
タで実行することにより実現することができる。このプ
ログラムは、ハードディスク、フロッピー(R)ディス
ク、CD−ROM、MO、DVD等のコンピュータで読
み取り可能な記録媒体に記録され、コンピュータによっ
て記録媒体から読み出されることによって実行される。
またこのプログラムは、上記記録媒体を介して、インタ
ーネット等のネットワークを介して配布することができ
る。
【0101】
【発明の効果】以上説明したように、請求項1に記載の
発明によれば、入力された多値の画像データの画像の傾
きや画像方向を検出する文書画像処理方法において、前
記多値の画像データの二値化をおこない、前記二値化さ
れた画像データの画像の傾きおよび/または画像方向を
検出するものであり、回転検出工程での検出に失敗した
場合には、前記入力された多値の画像データの明度を反
転させた画像データを作成し、前記作成された明度反転
の画像データを二値化し、該明度反転後の二値画像デー
タの画像の傾きおよび/または画像方向を検出する各工
程を備えたため、明度反転された画像データが入力され
ても、これを受け入れて画像の傾きや画像方向の検出が
おこなえるという効果を奏する。
【0102】また、請求項2に記載の発明によれば、入
力された多値の画像データの画像の傾きや画像方向を検
出する文書画像処理方法において、前記多値の画像デー
タが明度反転されているか否かを判定し、前記判定が明
度反転の場合には、前記入力された多値の画像データの
明度を反転させた画像データを作成し、前記明度反転さ
れた画像データを二値化し、該明度反転後の二値画像デ
ータの画像の傾きおよび/または画像方向を検出する各
工程を備えたので、最初に画像データの明度反転を判定
するため、画像データに対する二値化の回数を減らすこ
とができ、入力された画像データの明度反転の有無にか
かわらず、傾きや方向を高精度に検出できるという効果
を奏する。
【0103】また、請求項3の発明によれば、請求項1
または2に記載の発明において、カラーマップを持つ多
値の画像データについての明度反転はカラーマップの反
転情報を作り変えておこなうので、データ部分は書き換
えずカラーマップだけを作り変えて画像データの明度反
転をおこなう画像処理の効率化を図ることができるとい
う効果を奏する。
【0104】また、請求項4の発明によれば、請求項2
に記載の発明において、前記明度反転の判定時には、前
記明度反転前後それぞれの二値画像データにおける黒画
素の連結成分からなる外接矩形を抽出し、抽出された外
接矩形のうち、画像上の周辺に接している外接矩形を除
く外接矩形を構成する黒画素数を計数し、前記明度反転
前後それぞれの二値画像データを前記計数された黒画素
数に基づき明度反転の有無を判定することとしたので、
ブック原稿をスキャンする際に出る原稿周辺のベタノイ
ズ等によるカウントをせず、このベタノイズの影響を排
除して原稿のみの明度反転を正確に判定できるという効
果を奏する。
【0105】また、請求項5の発明によれば、請求項2
に記載の発明において、前記明度反転の判定時には、前
記明度反転前後それぞれの二値画像データに対し所定の
領域分割処理をおこない、前記領域分割された前記明度
反転前後それぞれの二値画像データを所定の評価により
前記領域分割結果の正当性に基づき明度反転の有無を判
定するので、領域分割結果の評価により明度反転の有無
を判定できるという効果を奏する。
【0106】また、請求項6の発明によれば、請求項2
に記載の発明において、前記明度反転の判定時には、入
力された多値の画像データを二値化し、該二値化された
画像データにおける白画素の連結成分からなる外接矩形
を抽出し、該抽出した外接矩形を合計した面積と画像の
面積との比に基づき明度反転の有無を判定することとし
たので、面積比を用い適当な値のしきい値を用いて簡単
に明度反転の有無が判定できるという効果を奏する。
【0107】また、請求項7の発明によれば、請求項6
に記載の発明において、前記明度反転の判定時には、画
像上における前記抽出した白画素の外接矩形全てを含む
領域の面積S3を検出し、前記抽出した白画素の外接矩
形のうち面積が大きい上位所定数N個による外接矩形の
面積S2を求め、 (S2/S3)<Th1 である場合に明度が反転されていると判定することとし
たので、ブック原稿をスキャンする際に生じる原稿周辺
のベタノイズ等によるカウントをせず、このベタノイズ
の影響を排除して原稿のみの明度反転を正確に判定でき
るという効果を奏する。
【0108】また、請求項8の発明によれば、請求項6
または7に記載の発明において、前記明度反転の判定時
には、前記抽出した外接矩形の面積が大きい上位所定数
N個以内の外接矩形で、外接矩形中の白画素の面積があ
らかじめ定めたしきい値Th2以下である場合、この外
接矩形を除いた面積を用いることとしたので、誤認の原
因になる白画素の面積比が少ない白矩形を除き、明度反
転の判定精度を向上できるという効果を奏する。
【0109】また、請求項9の発明によれば、請求項2
〜8のいずれか一つに記載の発明において、前記明度反
転の判定時には、入力された多値の画像データを二値化
する際に、該画像データを所定の割合M1で縮小するこ
ととしたので、この縮小された画像データを用いること
により、データ容量を小さくし明度反転の判定を高速化
できるようになる。また、JPEGなどのデータ劣化が
起こる圧縮形式や、印刷に重点をおいた画像処理で黒ベ
タ領域の中や周辺に生じる白ぬけノイズの発生を縮小に
より回避できるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の文書画像処理方法が適用される文字認
識装置の構成を示すブロック図である。
【図2】この発明の実施の形態1にかかる文書画像処理
方法の文書処理手順を示すフローチャートである。
【図3】この発明の実施の形態2にかかる文書画像処理
方法の文書処理手順を示すフローチャートである。
【図4】この発明の実施の形態3にかかる文書画像処理
方法の文書処理手順を示すフローチャートである。
【図5】この発明の実施の形態4にかかる文書画像処理
方法の文書処理手順を示すフローチャートである。
【図6】この発明の実施の形態10にかかる文書画像処
理方法の明度判定処理手順を示すフローチャートであ
る。
【図7】この発明の実施の形態12にかかる文書画像処
理方法の明度判定処理手順を示すフローチャートであ
る。
【図8】この発明の実施の形態13にかかる文書画像処
理方法の明度判定処理手順を示すフローチャートであ
る。
【図9】実施の形態13に用いられる領域分割処理を実
現する具体的構成を示すブロック図である。
【図10】この発明の実施の形態14にかかる文書画像
処理方法の明度判定処理手順を示すフローチャートであ
る。
【図11】この発明の実施の形態17にかかる文書画像
処理方法の明度判定処理手順を示すフローチャートであ
る。
【符号の説明】
100 文字認識装置 101 スキャナ 102 ディスプレイ 103 印字装置 104 画像メモリ 105 CPU 107 RAM 108 二値化部 109 回転検出部 110 明度反転部 111 画像回転部 112 明度反転判定部 901,902 領域分割手段 903 領域分割結果評価手段

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された多値の画像データの画像の傾
    きや画像方向を検出する文書画像処理方法において、 前記多値の画像データの二値化をおこない、 前記二値化された画像データの画像の傾きおよび/また
    は画像方向を検出するものであり、 回転検出工程での検出に失敗した場合には、 前記入力された多値の画像データの明度を反転させた画
    像データを作成し、 前記作成された明度反転の画像データを二値化し、 該明度反転後の二値画像データの画像の傾きおよび/ま
    たは画像方向を検出する、各工程を備えたことを特徴と
    する文書画像処理方法。
  2. 【請求項2】 入力された多値の画像データの画像の傾
    きや画像方向を検出する文書画像処理方法において、 前記多値の画像データが明度反転されているか否かを判
    定し、 前記判定が明度反転の場合には、 前記入力された多値の画像データの明度を反転させた画
    像データを作成し、 前記明度反転された画像データを二値化し、 該明度反転後の二値画像データの画像の傾きおよび/ま
    たは画像方向を検出する、各工程を備えたことを特徴と
    する文書画像処理方法。
  3. 【請求項3】 カラーマップを持つ多値画像データにつ
    いての明度反転はカラーマップの反転情報を作り変えて
    おこなうことを特徴とする請求項1または2に記載の文
    書画像処理方法。
  4. 【請求項4】 前記明度反転の判定時には、 前記明度反転前後それぞれの二値画像データにおける黒
    画素の連結成分からなる外接矩形を抽出し、 抽出された外接矩形のうち、画像上の周辺に接している
    外接矩形を除く外接矩形を構成する黒画素数を計数し、 前記明度反転前後それぞれの二値画像データを前記計数
    された黒画素数に基づき明度反転の有無を判定すること
    を特徴とする請求項2に記載の文書画像処理方法。
  5. 【請求項5】 前記明度反転の判定時には、 前記明度反転前後それぞれの二値画像データに対し所定
    の領域分割処理をおこない、 前記領域分割された前記明度反転前後それぞれの二値画
    像データを所定の評価により前記領域分割結果の正当性
    に基づき明度反転の有無を判定することを特徴とする請
    求項2に記載の文書画像処理方法。
  6. 【請求項6】 前記明度反転の判定時には、 入力された多値の画像データを二値化し、 該二値化された画像データにおける白画素の連結成分か
    らなる外接矩形を抽出し、 該抽出した外接矩形を合計した面積と画像の面積との比
    に基づき明度反転の有無を判定することを特徴とする請
    求項2に記載の文書画像処理方法。
  7. 【請求項7】 前記明度反転の判定時には、 画像上における前記抽出した白画素の外接矩形全てを含
    む領域の面積S3を検出し、 前記抽出した白画素の外接矩形のうち面積が大きい上位
    所定数N個による外接矩形の面積S2を求め、 (S2/S3)<Th1 である場合に明度が反転されていると判定することを特
    徴とする請求項6に記載の文書画像処理方法。
  8. 【請求項8】 前記明度反転の判定時には、 前記抽出した外接矩形の面積が大きい上位所定数N個以
    内の外接矩形で、外接矩形中の白画素の面積があらかじ
    め定めたしきい値Th2以下である場合、この外接矩形
    を除いた面積を用いることを特徴とする請求項6または
    7に記載の文書画像処理方法。
  9. 【請求項9】 前記明度反転の判定時には、 入力された多値の画像データを二値化する際に、該画像
    データを所定の割合M1で縮小することを特徴とする請
    求項2〜8のいずれか一つに記載の文書画像処理方法。
JP2003007567A 2002-01-16 2003-01-15 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 Expired - Fee Related JP4261922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003007567A JP4261922B2 (ja) 2002-01-16 2003-01-15 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002-7933 2002-01-16
JP2002007933 2002-01-16
JP2003007567A JP4261922B2 (ja) 2002-01-16 2003-01-15 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008292520A Division JP4339925B2 (ja) 2002-01-16 2008-11-14 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2003281469A true JP2003281469A (ja) 2003-10-03
JP4261922B2 JP4261922B2 (ja) 2009-05-13

Family

ID=29252941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003007567A Expired - Fee Related JP4261922B2 (ja) 2002-01-16 2003-01-15 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP4261922B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100651309B1 (ko) 2003-09-11 2006-11-29 마츠시타 덴끼 산교 가부시키가이샤 화질 보정 장치 및 화질 보정 방법
JP2007336143A (ja) * 2006-06-14 2007-12-27 Ricoh Co Ltd 画像処理装置
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
CN110389127A (zh) * 2019-07-03 2019-10-29 浙江大学 一种金属陶瓷零件识别及表面缺陷检测系统和方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100651309B1 (ko) 2003-09-11 2006-11-29 마츠시타 덴끼 산교 가부시키가이샤 화질 보정 장치 및 화질 보정 방법
JP2007336143A (ja) * 2006-06-14 2007-12-27 Ricoh Co Ltd 画像処理装置
US8422811B2 (en) 2006-06-14 2013-04-16 Ricoh Company, Limited Image processing apparatus
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
CN110389127A (zh) * 2019-07-03 2019-10-29 浙江大学 一种金属陶瓷零件识别及表面缺陷检测系统和方法
CN110389127B (zh) * 2019-07-03 2020-08-14 浙江大学 一种金属陶瓷零件识别及表面缺陷检测系统和方法

Also Published As

Publication number Publication date
JP4261922B2 (ja) 2009-05-13

Similar Documents

Publication Publication Date Title
JP4339925B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP4628882B2 (ja) 判別器の学習方法、顔判別方法および装置並びにプログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US8594431B2 (en) Adaptive partial character recognition
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
EP1081648B1 (en) Method for processing a digital image
JP3990375B2 (ja) 画像処理装置および画像処理方法
JP2010527190A (ja) スキャンされたドキュメントを含むデジタル画像の圧縮
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
KR100923935B1 (ko) Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템
JP4392907B2 (ja) 文字切出し方法
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP5005732B2 (ja) 画像形成装置及び画像処理方法
JP4261922B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP4132766B2 (ja) 画像処理装置および方法
CN100416597C (zh) 用于文档的自适应二值化的方法和设备
JP2002279345A (ja) 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP4471202B2 (ja) 画像処理装置、画像処理方法及び同方法に用いるプログラム
KR100537827B1 (ko) 경계선 분포를 이용한 스캔 영상의 상역 분리 방법
Boiangiu et al. Bitonal image creation for automatic content conversion
JP4094240B2 (ja) 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2899356B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4261922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140220

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees