JP2003281469A - 文書画像処理方法 - Google Patents
文書画像処理方法Info
- Publication number
- JP2003281469A JP2003281469A JP2003007567A JP2003007567A JP2003281469A JP 2003281469 A JP2003281469 A JP 2003281469A JP 2003007567 A JP2003007567 A JP 2003007567A JP 2003007567 A JP2003007567 A JP 2003007567A JP 2003281469 A JP2003281469 A JP 2003281469A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- inversion
- lightness
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
い文字など明度反転状態にかかわらず画像の傾きや文書
方向の判別が可能となり、文字認識処理のための情報と
して有効な情報を出力すること。 【解決手段】 入力される多値の画像からグレー画像を
作成し(ステップS301)、二値画像Aを作成し(ス
テップS302)、画像の傾きの検出や画像の方向の検
出をおこない(ステップS303)、傾きや方向の検出
の成功を判断する(ステップS304)。成功時には画
像を角度補正する(ステップS305)。一方、失敗時
には明度反転したグレー画像を作成し(ステップS30
6)、二値画像Bを作成し(ステップS307)、再
度、角度や方向を検出し(ステップS308)、角度補
正された画像を作成する(ステップS305)。これに
より明度反転の有無にかかわらず画像の傾きや方向を正
確に検出し補正できる。
Description
前処理で文書画像に対する画像処理をおこなう、より詳
しくは、文字認識処理の前段階で多値画像の文書の傾き
や方向検出、および反転文字の抽出をおこなうための文
書画像処理方法に関する。
など多値の画像について文書の傾き検出や文字認識をお
こなう場合は、いったん二値画像データを作成し、その
二値画像データに対して処理をおこなう方法が知られて
いる。たとえば、二値画像データを作成し、その画像デ
ータに対して傾き検出をおこなう方法がある(下記の特
許文献1参照。)。
い、得られた画像データの平均線幅を計算して、その値
が規定外であれば、文字認識処理に不向きであると判断
し、二値化をやり直すような処理も提案されている(下
記の特許文献2参照。)。本出願人は、傾きの検出とし
て、下記の特許文献3に開示された技術を提案し、画像
の方向の検出には下記の特許文献4に開示された技術を
提案している。
した場合に画像上での地と文字がどちらになるかを判断
して、文字が黒となるように反転をさせる技術がある
(下記の特許文献5参照。)。また、黒白画素を計数し
て、その黒画素密度特徴の値から反転判別基準値と比較
することで、白黒が反転されているかどうかを調べる技
術がある(下記の特許文献6参照。)。これらの方法を
組み合わせると、白黒反転部分が多い画像が入力された
場合でも、スキュー(傾き)角度の検出や文書方向の判
別が可能になる。
献1や、特許文献2に開示された技術による処理では、
多値の画像データが入力された場合に、白黒反転部分
(カラーであれば、背景と文字の明度が反転されている
ような部分)が多い画像が入力された場合、文書画像の
傾き検出や、方向の判別ができなくなるという問題があ
った。
くつか考えられる。たとえば、傾きを求めるための直線
成分がない場合や、安定して傾きを求められる文字列が
少ない場合や、どの方向から認識しても文字らしい文字
で書かれている場合(記号や数字以外にも工、H、エ、
田、8などさまざまある)などである。また、失敗する
理由の一つとして、白地に黒文字でなく、黒地に白文字
で書かれている場合がある。
れた技術では、白地に黒文字で書かれていることを前提
として、黒ランの外接矩形で文字矩形を抽出するもので
あるため、黒地に白文字であると正常な文字矩形が得ら
れないことから、ほぼ確実に失敗していた。
や、特許文献6に開示された技術では、新聞の切り抜き
記事をスキャナに載せて圧版を閉めないでスキャンした
ような画像や、デジタルカメラで背景が黒っぽいところ
においた白地に黒文字の画像のようなものを処理したい
場合には、本文相当の画像は白地に黒文字であるにも関
わらず、黒画素の比率や画素数の方が白画素の画素数を
上回るために、反転の判定を誤認するという問題が生じ
た。
点を解消するため、多値の画像データの画像で暗い背景
中に明るい文字など明度反転状態にかかわらず画像の傾
きや文書方向の判別が可能となり、文字認識処理のため
の情報として有効な情報を出力できる文書画像処理方法
を提供することを目的とする。
目的を達成するため、請求項1の発明にかかる文書画像
処理方法は、入力された多値の画像データの画像の傾き
や画像方向を検出する文書画像処理方法において、前記
多値の画像データの二値化をおこない、前記二値化され
た画像データの画像の傾きおよび/または画像方向を検
出するものであり、回転検出工程での検出に失敗した場
合には、前記入力された多値の画像データの明度を反転
させた画像データを作成し、前記作成された明度反転の
画像データを二値化し、該明度反転後の二値画像データ
の画像の傾きおよび/または画像方向を検出する各工程
を備えたことを特徴とする。
れた画像データが入力されても、これを受け入れて画像
の傾きや画像方向の検出がおこなえるようになる。
理方法は、入力された多値の画像データの画像の傾きや
画像方向を検出する文書画像処理方法において、前記多
値の画像データが明度反転されているか否かを判定し、
前記判定が明度反転の場合には、前記入力された多値の
画像データの明度を反転させた画像データを作成し、前
記明度反転された画像データを二値化し、該明度反転後
の二値画像データの画像の傾きおよび/または画像方向
を検出する各工程を備えたことを特徴とする。
データの明度反転を判定するため、画像データに対する
二値化の回数を減らすことができ、入力された画像デー
タの明度反転の有無にかかわらず、傾きや方向を高精度
に検出できるようになる。
理方法は、請求項1または2に記載の発明において、カ
ラーマップを持つ多値の画像データについての明度反転
はカラーマップの反転情報を作り変えておこなうことを
特徴とする。
は書き換えずカラーマップだけを作り変えて画像データ
の明度反転をおこなう画像処理の効率化を図ることがで
きる。
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、前記明度反転前後それぞれの二値画像
データにおける黒画素の連結成分からなる外接矩形を抽
出し、抽出された外接矩形のうち、画像上の周辺に接し
ている外接矩形を除く外接矩形を構成する黒画素数を計
数し、前記明度反転前後それぞれの二値画像データを前
記計数された黒画素数に基づき明度反転の有無を判定す
ることを特徴とする。
をスキャンする際に出る原稿周辺のベタノイズ等による
カウントをせず、このベタノイズの影響を排除して原稿
のみの明度反転を正確に判定できるようになる。
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、前記明度反転前後それぞれの二値画像
データに対し所定の領域分割処理をおこない、前記領域
分割された前記明度反転前後それぞれの二値画像データ
を所定の評価により前記領域分割結果の正当性に基づき
明度反転の有無を判定することを特徴とする。
果の評価により明度反転の有無を判定できるようにな
る。
理方法は、請求項2に記載の発明において、前記明度反
転の判定時には、入力された多値の画像データを二値化
し、該二値化された画像データにおける白画素の連結成
分からなる外接矩形を抽出し、該抽出した外接矩形を合
計した面積と画像の面積との比に基づき明度反転の有無
を判定することを特徴とする。
い適当な値のしきい値を用いて簡単に明度反転の有無が
判定できるようになる。
理方法は、請求項6に記載の発明において、前記明度反
転の判定時には、画像上における前記抽出した白画素の
外接矩形全てを含む領域の面積S3を検出し、前記抽出
した白画素の外接矩形のうち面積が大きい上位所定数N
個による外接矩形の面積S2を求め、(S2/S3)<
Th1である場合に明度が反転されていると判定するこ
とを特徴とする。
をスキャンする際に生じる原稿周辺のベタノイズ等によ
るカウントをせず、このベタノイズの影響を排除して原
稿のみの明度反転を正確に判定できるようになる。
理方法は、請求項6または7に記載の発明において、前
記明度反転の判定時には、前記抽出した外接矩形の面積
が大きい上位所定数N個以内の外接矩形で、外接矩形中
の白画素の面積があらかじめ定めたしきい値Th2以下
である場合、この外接矩形を除いた面積を用いることを
特徴とする。
になる白画素の面積比が少ない白矩形を除き、明度反転
の判定精度を向上できるようになる。
理方法は、請求項2〜8のいずれか一つに記載の発明に
おいて、前記明度反転の判定時には、入力された多値の
画像データを二値化する際に、該画像データを所定の割
合M1で縮小することを特徴とする。
画像データを用いることにより、データ容量を小さくし
明度反転の判定を高速化できる。また、JPEGなどの
データ劣化が起こる圧縮形式や、印刷に重点をおいた画
像処理で黒ベタ領域の中や周辺に生じる白ぬけノイズの
発生を縮小により回避できるようになる。
発明にかかる文書画像処理方法の好適な実施の形態を詳
細に説明する。
される文字認識装置の構成を示すブロック図である。文
字認識装置100は、スキャナ101が読み取った画像
データを文字認識してディスプレイ102、およびプリ
ンタ等の印字装置103にテキスト等の文字データを出
力する。
画像データを格納する画像メモリ104,画像メモリ1
04の画像データを文字認識処理するCPU105,C
PU105の文字認識処理時のデータのワークメモリと
して用いられるRAM107,文字認識処理の前処理を
実行する各機能部108〜112で構成される。
ムの一部を構成するものであり、入力される多値画像デ
ータが有する濃淡階調を二値化する二値化部108,二
値化された画像データで画像の傾きおよび文書の方向を
検出する回転検出部109,画像の明度を反転させる明
度反転部110,画像データを回転させる画像回転部1
11,画像データの明度反転を判定する明度反転判定部
112,の各手段(機能別プログラム)で構成されてい
る。これら各手段で検出された情報(データ)は不図示
の文字認識(OCR)部に供給され、文字認識処理時の
情報として利用される。
文書処理手順を示すフローチャートである。この文書処
理は、文字認識処理の前処理として実行されるものであ
り、文書の傾きや方向を検出して補正し、必要に応じて
画像を反転させて再度文書の傾きや方向を検出して画像
データを補正し、文字認識部(不図示)に渡すものであ
る。
ラーの多値画像データが入力され、これをグレー化して
用いる。また、グレー画像データに対して固定しきい値
での一様二値化をおこなう。このときのパラメーターに
は比較的濃い目の画像が得られる100を用いて、二値
の画像を作成する。なお、この発明で適応二値化を用い
ない理由は後述する。
カラーの多値画像から、二値化をおこない二値の画像デ
ータAを作成する(ステップS201)。二値化には判
別分析をするなどいずれの手法を用いても良い。つぎ
に、生成された二値の画像データAによって画像の傾き
や方向など補正角度Aを検出する(ステップS20
2)。
接これらの角度や方向を検出するのではなく、一度多値
の画像データを二値化し、二値画像データに対して検出
する方法は、上述した特許文献1に開示されている如く
複数存在している。この発明では、特に画像の傾き検出
や画像の方向検出の手法は特にこだわらない。
失敗したか否か判断する(ステップS203)。成功し
た場合には(ステップS203:No)、検出された角
度や方向に基づき画像データを角度補正した画像データ
を作成する(ステップS204)。この発明では、傾き
や方向の検出に失敗した場合に(ステップS203:Y
es)、失敗した原因が白黒反転にあったかどうかを確
かめるための処理をおこなう。
転)させた画像Bを作成し(ステップS205)、その
画像で角度検出を再度試みるものである。ここで、二値
画像を単純に反転しただけでは比較的安定した文字画像
が得られないことがわかっている。一般の文書画像では
暗色の方が文字であることが多いため、細い暗色の文字
がかすれないように設定されている。適応二値化の方式
であっても、パラメーターで濃い部分(黒)を残すよう
に設定されていることが多い。したがって、暗い背景に
明るい細い文字があった場合の二値画像は、かすれ気味
になる傾向がある。
説明する。本出願人は、特許文献8に開示されている適
応二値化の提案をおこなっている。この方式は、画像を
ブロック単位に分け、そのブロックごとに、しきい値を
決めて二値化をするとともに、隣りのブロックの決定済
みのしきい値と大きく異なったしきい値にならないよう
に補正をして、ブロックの境目に線が出たりしないよう
に二値化するものである。上記方式によらず、部分的に
しきい値を変えながら画像全面を二値化していく方法を
適応二値化と呼称している。適応二値化では、ブロック
ごとにしきい値を決める点が特徴となっている。
常考え、濃度分布の谷のところをしきい値にすると、白
と黒にはっきり分けることができるという考えを利用し
ている。ところが、仮にブロックの中に黒だけがあった
とする。この場合、背景の一部のブロックでは、ほぼ黒
一色にもかかわらず、白と黒を分けようと計算するた
め、微妙に色の薄い部分が白く二値化されてしまう場合
が発生する。これにより、上記のように、暗い背景に明
るい細い文字があった場合の二値画像は、かすれ気味に
なる傾向が生じる。
れたカラーの多値の画像データ(元画像)自体を明度反
転した画像データを作成する。この後、この明度反転さ
れた画像データを改めて二値化した二値の画像データB
を得た後(ステップS206)、この画像データBを用
いて再度、傾きと方向を検出し(ステップS207)、
角度補正された画像データを作成する(ステップS20
4)。
が入力されたときには、角度および方向の検出を失敗す
ることなく、従来失敗していた、全面が明度反転されて
いる画像について角度および方向の検出を成功させるこ
とができる。
する、画像の傾きと方向の検出の失敗の有無について
は、傾きと方向の判別をどちらもおこなう場合に、どち
らか一方が失敗したら、それで終了(失敗)という判断
とすることもできるが、片方(たとえば傾き)が失敗し
ても、もう一方(文書方向)を処理して、そちらが成功
した場合は、傾き検出のみ失敗したという結果を出力
し、両方失敗した場合は、両方失敗したという結果を別
途通知等で出力する構成にできる。この場合、ステップ
S203では、傾きあるいは文書方向の検出失敗により
失敗(ステップS203:Yes)と判断する。
書処理手順を示すフローチャートである。図示の如く実
施の形態1との対比では、入力されたカラーの画像デー
タに対し、彩度を除いた、明度成分のみのグレースケー
ルの画像データAを作成する点が異なる(ステップS3
01)。
GBからの変換式や最も単純なものでは、近似値という
ことで、G成分のみ使用する方法などがある。そして、
このグレースケールの画像データを保持しておき、この
グレーの画像データを使用して二値の画像データAを作
成する(ステップS302)。この後、この二値の画像
データAによって画像の傾きの検出や、画像の方向の検
出をおこなう(ステップS303)。
か判断する(ステップS304)。成功した場合には
(ステップS304:No)、検出された角度や方向に
基づき画像データを角度補正した画像データを作成する
(ステップS305)。一方、傾きや方向の検出に失敗
した場合には(ステップS304:Yes)、失敗した
原因が白黒反転にあったかどうかを確かめるための処理
をおこなう。
ースケールの画像データAを明度反転したグレースケー
ルの画像データBを作成する(ステップS306)。こ
の後、この明度反転された画像データを改めて二値化し
た二値の画像データBを得た後(ステップS307)、
この画像データBを用いて再度、角度や方向を検出し
(ステップS308)、角度補正された画像データを作
成する(ステップS305)。
像を元に、グレースケールの画像データを作成しておく
ことにより、明度反転用のグレーの画像データの作成、
二値化、反転画像の保持、という各構成は、多値画像を
直接処理するのに比べ処理時間、メモリ容量の点で低コ
スト化できるようになる。
書処理手順を示すフローチャートである。図示の如く、
この処理手順では、画像の明度反転判定処理を実行する
構成である。まず、入力されたカラーの多値の画像デー
タが明度全面反転されているか判定処理を実行する(ス
テップS401)。この明度全面反転判定処理の内容は
後述する。
S402:No)、この画像データの二値の画像データ
Aを作成する(ステップS403)。この後、この二値
の画像データAによって画像の傾きの検出や、画像の方
向の検出をおこない(ステップS404)、検出された
角度や方向に基づき画像データを角度補正した画像デー
タを作成する(ステップS405)。
プS402:Yes)、元画像であるカラーの画像デー
タの明度を反転した画像データBを作成する(ステップ
S406)。この後、明度反転後の二値の画像データB
を作成する(ステップS407)。この後、この二値の
画像データBによって画像の傾きの検出や、画像の方向
の検出をおこない(ステップS408)、検出された角
度や方向に基づき画像データを角度補正した画像データ
を作成する(ステップS405)。
らすことができ、また、明度の反転に基づき傾きや方向
の検出の精度向上が図れるようになる。
書処理手順を示すフローチャートである。図示の如く、
この処理手順では、グレー画像を作成し、また、画像の
明度反転判定処理を実行する構成である。まず、入力さ
れたカラーの多値の画像データを元にグレースケールの
画像データAを作成する(ステップS501)。つぎ
に、この画像データAが明度全面反転されているか判定
処理を実行する(ステップS502)。
S503:No)、この画像データの二値の画像データ
Aを作成する(ステップS504)。この後、この二値
の画像データAによって画像の傾きの検出や、画像の方
向の検出をおこない(ステップS505)、検出された
角度や方向に基づき画像データを角度補正した画像デー
タを作成する(ステップS506)。
プS503:Yes)、先に作成したグレースケールの
画像データAの明度を反転した画像データBを作成する
(ステップS507)。この後、明度反転した画像デー
タBを二値化した画像データBを作成する(ステップS
508)。この後、この二値の画像データBによって画
像の傾きの検出や、画像の方向の検出をおこない(ステ
ップS509)、検出された角度や方向に基づき画像デ
ータを角度補正した画像データを作成する(ステップS
506)。
らすことができ、また、明度の反転に基づき傾きや方向
の検出の精度向上が図れるようになる。また、ステップ
S501でグレースケール画像を作成しておくので、カ
ラー画像から二値画像の作成、カラー画像の反転、反転
した画像データを保持しておくための各処理時間、使用
メモリ量を低コスト化できるようになる。
の形態1〜4で説明した文書画像処理方法で、多値画像
の明度反転画像を作成するのに、カラーマップだけを作
り変え、データ部分は書き換えない方法で明度反転画像
を作成する方法である。
にカラーマップを持っていない画像では対応できない
が、パーソナル・コンピューター(PC)で汎用のDI
B形式におけるグレー画像や256色などインデックス
カラーと呼ばれるものは、カラーマップを持っていて、
どのデータがどの色であるかを管理している。
る。これは、カラーマップの明度を反転させた、別マッ
プを作ることであり、たとえば順番に、(R,G,B)
=(0,0,0),(1,1,1),(2,2,2),
〜(255,255,255)と並んでいた場合に、
(R,G,B)=(255,255,255),(25
4,254,254),〜(0,0,0)としたカラー
マップを作る。このように、カラーマップの情報だけを
書き換えることで、データ部のデータを変更する必要が
なく、データサイズによらず高速な処理をおこなうこと
ができる。
転処理をおこなう実施の形態3〜5の文書画像処理方法
において、明度反転判定の結果、反転されている、とい
う判定結果の場合に、元画像データが明度反転されてい
るという判定結果を次工程の処理に出力する構成であ
る。
であり、文字認識部では、元画像データがそのまま入力
されたか、あるいは元画像データが明度反転された画像
データが入力されたかを判断することができるようにな
る。たとえば、文字認識部が明度反転された画像データ
を用いて文字認識処理をおこない何らかの失敗が生じた
場合、元画像データを再度取り込んで文字認識処理を再
度実行することが可能となる。
施の形態1〜5において、全面反転した後の出力の二値
画像データBを用いて画像の傾きや方向判別をおこなっ
た結果が成功した場合に、出力される画像データが元画
像データを明度反転させた画像データであるという結果
を次工程(文字認識部)に出力する構成である。実施の
形態6と比較して、結果出力は傾きや方向判別が成功し
た際に出力されるという点で出力のタイミングが異な
り、文字認識処理前に入力される画像データが明度反転
されたものであるか否かを判断できるようになる。
施の形態1〜7の各文書画像処理方法において、明度反
転をおこなって二値化した際に、画像の傾きまたは方向
判別が失敗した場合の処理である。このような場合に
は、明度反転されていない、もしくは不明であるという
結果を次工程に出力する構成である。これにより、文字
認識部は、入力された結果に応じた文字認識処理を実行
できるようになる。
理は、上記実施の形態1〜7の各文書画像処理方法にお
いて、明度反転をおこなって二値化した際に、画像の傾
きまたは方向判別が失敗した場合、次工程(文字認識
部)に対し、明度反転をした画像データを強制的に使用
しない(出力しない)構成である。すなわち、明度反転
しても失敗した画像データをそのまま次工程以降に用い
ることを禁止することにより、次工程以降での失敗の増
加を防ぎ、元画像データで処理を継続させることによ
り、操作者の意図に沿った処理および処理結果を出力で
きるようになる。
記実施の形態で説明した明度判定処理の具体的処理内容
である。図6は、明度判定処理内容を示すフローチャー
トである。たとえば、図4のステップS401での判定
処理に相当し、以下に説明する。
ースケール化したグレーの画像データAに基づき、この
グレーの画像データAを明度反転したグレーの画像デー
タBを作成する(ステップS601)、つぎに、グレー
の画像データAから二値化された二値の画像データAを
作成し(ステップS602)、明度反転されたグレーの
画像データBに対しても二値の画像データBを作成する
(ステップS603)。
計数し(ステップS604)、明度反転された二値画像
データBの黒画素数を計数する(ステップS605)。
この計数は画素数計測部(図示せず)がおこなう。この
後、これら二値の画像データA,Bそれぞれで計数され
た黒画素の総数を比較する(ステップS606)。比較
の結果、二値画像データAの黒画素数の方が少なければ
(ステップS606:Yes)、明度反転なしと判定す
る(ステップS607)。一方、明度反転された二値画
像データBの黒画素数の方が少なければ(ステップS6
06:No)、明度反転(全面反転)と判定する(ステ
ップS608)。このように黒画素数の計数だけで容易
に明度反転の有無を判定できる。
施の形態10で説明した明度反転判定処理の一部を変更
した構成である。グレーの画像データA,Bからそれぞ
れ二値の画像データA,Bを作成するまでの各処理(ス
テップS601〜S603)までは同様の処理である。
この後、ステップS604,S605で二値の画像デー
タA,Bをそれぞれ黒画素を計数する際に、上下左右の
端から連続する黒画素は計数の対象外とする。
の端に接しているものからの連続であり、斜め方向およ
び水平、垂直方向でそれぞれ画像の端から接している黒
画素は計数しない。これにより、ブック原稿をスキャン
する際に生じる原稿周辺のベタノイズ等によるカウント
をせず、このベタノイズの影響を排除して原稿のみの明
度反転を正確に判定できるようになる。
度判定処理の他の具体的処理内容である。図7は、この
実施形態の明度判定処理内容を示すフローチャートであ
る。ステップS701〜S704までの元画像データに
対する処理と、ステップS705〜S709までの元画
像を反転処理した画像データに対する処理は並行して実
行できる。
01〜S704)を説明する。カラーの多値画像データ
がグレースケール化された画像データAが入力される
と、このグレーの画像データAを二値化し二値の画像デ
ータAを作成する(ステップS701)。つぎに、二値
の画像データAにおいて黒画素の連結部分による全ての
外接矩形を抽出する(ステップS702)。つぎに、得
られた外接矩形のうち、外接矩形の座標値が原稿の上下
左右に接触している矩形を無効にする(ステップS70
3)。そして、無効とされた矩形を除く各矩形中の黒画
素を計数する(ステップS704)。
テップS705〜ステップS709)も他方と同様であ
るが、まず、グレースケール化された画像データAを明
度反転したグレーの画像データBを作成する(ステップ
S705)。つぎに、グレーの画像データBを二値化し
二値画像データBを作成する(ステップS706)。つ
ぎに、二値画像データBにおいて黒画素の連結部分によ
る全ての外接矩形を抽出する(ステップS707)。つ
ぎに、得られた外接矩形のうち、外接矩形の座標値が原
稿の上下左右に接触している矩形を無効にする(ステッ
プS708)。そして、無効とされた矩形を除く各矩形
中の黒画素を計数する(ステップS709)。
た各矩形中の黒画素数を対比する(ステップS71
0)。この結果、画像データAの黒画素数の方が少なけ
れば(ステップS710:Yes)、明度反転なしと判
定する(ステップS711)。一方、画像データBの黒
画素数の方が少なければ(ステップS710:No)、
明度反転(全面反転)ありと判定する(ステップS71
2)。これにより、ブック原稿をスキャンする際に生じ
る原稿周辺のベタノイズ等によるカウントをせず、この
ベタノイズの影響を排除して原稿のみの明度反転を正確
に判定できるようになる。
度判定処理の他の具体的処理内容である。図8は、この
実施形態の明度判定処理内容を示すフローチャートであ
る。ステップS801〜S802の元画像データに対す
る処理と、ステップS803〜S805までの元画像を
反転処理した画像データに対する処理は並行して実行で
きる。
01,S802)を説明する。カラーの多値画像データ
をグレースケール化した画像データAが入力されると、
このグレーの画像データAを二値化し、二値の画像デー
タAを作成する(ステップS801)。つぎに、この二
値の画像データAに対して、自動の領域分割処理をおこ
なう(ステップS802)。
テップS803〜ステップS805)も他方と同様であ
るが、まず、グレースケール化された画像データAを明
度反転したグレーの画像データBを作成する(ステップ
S803)。つぎに、グレーの画像データBを二値化
し、二値画像データBを作成する(ステップS80
4)。つぎに、この二値画像データBに対して、自動の
領域分割処理をおこなう(ステップS805)。
た各領域分割結果を対比する(ステップS806)。こ
の結果、画像データAの結果の正当性が高ければ(ステ
ップS807:Yes)、明度反転なしと判定する(ス
テップS808)。一方、画像データBの結果の正当性
が高ければ(ステップS807:No)、明度反転(全
面反転)ありと判定する(ステップS809)。
分割の処理概要を説明する。この領域分割処理および評
価は、本出願人が先に出願した特許文献7などに開示さ
れた公知技術を用いることができる。図9は、この領域
分割方法を実現する具体的構成を示すブロック図であ
る。第1,第2の領域分割手段901,902は、それ
ぞれ異なる領域分割方法を用いて入力文書画像を文字領
域などの要素に分割する。領域分割結果評価手段903
は、分割された各領域内における行頭の揃い度合い、あ
るいは文字サイズの変動の度合いを基に、それぞれの分
割結果を評価し、評価値の高い分割結果を選択する。こ
のような領域分割結果の評価により明度反転の有無を判
定できるようになる。
述した実施形態と異なり、明度反転したグレーの画像デ
ータB,二値の画像データBはすぐには作成しない。グ
レーの画像データAと、二値の画像データAを作成す
る。そして、この二値の画像データAについて、白画素
の連結成分からなる外接矩形を抽出し、この外接矩形の
面積と、二値画像データの全面の面積を特徴として、明
度反転の条件を経験的に設定するものである。この明度
判定では、基本的に、白地に黒文字で書かれていると想
定される領域の面積が、全体に対して大きければ、明度
が反転されていないと判断するものである。
ローチャートを用いて説明する。まず、カラーの多値の
元画像データから作成されたグレースケールの画像デー
タAの入力により、二値化した画像データAを作成する
(ステップS1001)。この二値の画像データAの面
積をS1としておく。
て、白画素により構成される全ての矩形を抽出し(ステ
ップS1002)、得られた全ての白画素矩形を面積の
大きい順にソートする(ステップS1003)。つぎ
に、これら白画素矩形の面積が大きい上位の所定の数N
(例えばN:2〜10)個の矩形を抽出し(ステップS
1004)、これら上位N個の白画素矩形の面積を積算
(加算)する(ステップS1005)。N個全ての白画
素の矩形の面積が積算されるまでは、ステップS100
4に復帰するi回(i=0〜N)のループを実行する
(ステップS1006:No)。N個全ての白画素の矩
形の面積が積算されると(ステップS1006:Ye
s)、面積の総和をS2とする。
白画素矩形の面積S2の面積比を求め、あらかじめ設定
された所定のしきい値Th1(0.4〜0.6)と対比
する(ステップS1007)。そして、下記式
度の反転なしと判定する(ステップS1008)。上記
を満たさない場合には(ステップS1007:No)、
明度が反転されていると判定する(ステップS100
9)。ここで、白画素矩形の面積S2が大きいほど、上
記S2/S1の比は大きくなる。したがって、適当な値
のしきい値Th1を用いるだけで簡単に明度反転の有無
が判定できる。
説明する。背景を囲む面積は、画像の情報を持つ面積の
大半を示すため、白の面積と、黒の面積のいずれが単純
に大きいかの判定に5割(しきい値0.5)の線が通常
の大まかなしきい値となる。しかし、上記処理内容によ
る面積計算では、画像の総面積―白矩形の面積=黒の面
積とはならない。すなわち、白の面積は白画素の外接矩
形の面積であるため、たとえば、斜めの白い線があると
すると、面積は白画素よりもはるかに大きな値に計算さ
れることになる。このため、通常値に対する余裕を見て
しきい値は、0.4〜0.6の範囲とする。このしきい
値は、通常値に対し経験的(統計的)な範囲で設定でき
る。
Nの設定について説明する。所定の数N1を2〜10に
設定した点については、白画素矩形を全て探索するので
は、処理時間がかかるため、処理時間を減らすべく面積
順にして有効そうな数分だけを処理するためである。現
実的には、似たような面積で、しかも白背景である領域
が複数あるものは特殊な事象であり、ここでは少なくと
も一つ以上の数を限定して調べるための値である。この
処理回数規定のためのNの設定により、計算量(処理時
間)を減らすことができる。結果として全ての矩形の面
積を足すことにならないので、あらかじめ設定されるし
きい値Th1には、標準的なしきい値の0.5より小さ
な値をセットしておく方が望ましい。
記明度反転判定処理の他の例である。この実施の形態1
5は、実施の形態14にて面積比を計算する際に(ステ
ップS1007)、画像データ全面の面積S1を用いな
い。代わりに、白画素矩形全てを含む領域の面積S3を
求めておき、S1の代わりにS3を使用し、白画素矩形
の面積S2との比で白画素面積比を算出する。
形が存在するX,Y座標上での最小点位置(Xs,Y
s)と、最大点位置(Xe,Ye)の2点の座標値によ
り、白画素矩形を全て含む4点の座標値が得られ、これ
ら4点で囲まれた範囲を面積S3として得る。このよう
な処理においても、適当な値のしきい値Th1を用い、
下記式
る際に生じる原稿周辺のベタノイズ等によるカウントを
せず、このベタノイズの影響を排除して原稿のみの明度
反転を正確に判定できるようになる。
施の形態14,15で説明した明度反転の判定処理につ
いての変形例の構成である。これら実施の形態14,1
5では白画素矩形の面積を用いて明度反転している。こ
れは、白地に黒文字であった場合、背景色は当然白であ
り、背景色の方が文字の黒より多くなるのが通常である
ことに基づく。たとえば、実施の形態14では、このよ
うな、白が背景色となっている部分の面積S2を算出
し、画像全体の面積S1に対する割合であるかを、明度
反転判定に使用している。このため、白画素の面積比が
少ない白矩形は誤認の原因になる可能性が高い。
データについて、白画素の連結成分からなる外接矩形を
抽出した後、抽出された矩形の面積上位の所定の数分の
矩形で、矩形中の白画素の面積比があらかじめ定めたし
きい値Th2(0.3〜0.6)以下である場合は、該
当する矩形を除き判定処理(ステップS1007)をお
こなう構成とする。これにより、誤認の原因になる白画
素の面積比が少ない白矩形を除き、明度反転の判定精度
を向上できるようになる。
説明する、上記説明したように、白矩形の内部が白の斜
め線などの場合には、面積は大きいが内部の白画素数が
少ないことがあり得る。しきい値Th2は、この対策と
して、矩形中の白画素比率の低いものは白矩形として面
積を足しこまないために設定される。たとえば、白背景
に端まで文字が密に記載されていたとすると、実際の白
画素数は少なくなる。しかし白背景であることには変わ
りはなく、面積としては、白画素数分だけではなく、全
体を白背景領域とする方が最も自然であると判断するこ
とに基づいている。他にも、たとえば黒背景にぎざぎざ
が沢山あるような星型の白背景領域があると、線の谷付
近に黒画素がある影響で全体の白画素比率は下がる。こ
の対策として、背景中に存在する黒画素の占有率を考え
たときに、通常のしきい値(0.5)よりも少ない方向
に多く範囲を取ったしきい値Th2(0.3〜0.6)
の範囲とすることが有効となる。
度判定処理の他の具体的処理内容である。図11は、こ
の実施形態の明度判定処理内容を示すフローチャートで
ある。縮小した二値の画像データを生成し、この縮小さ
れた画像データを用いて明度反転判定をおこなう構成で
ある。
れ、このグレーの画像データが入力される。はじめに、
このグレーの画像データを所定の倍率(M1)%に縮小
した画像データを作成する(ステップS1101)。倍
率M1としては、たとえば、12.5%,25%,50
%のいずれかの値を使用する。これらの数値は、それぞ
れ画像データを1/8,1/4,1/2に縮小処理する
もので、これらの倍率設定は比較的高速に縮小処理でき
る倍率である。
ータの解像度からあらかじめ定めた所定の解像度R1を
作成するための値を求め設定する構成にもできる。この
場合、解像度R1の画像データを得るための変倍率M1
を算出し設定する。解像度R1としては、50dpi,
72dpi,100dpi,150dpi,200dp
iという値が使用される。これらの数値は、通常、入力
が予想される解像度に対して1/n(nは整数)倍に相
当することが多く、変倍処理を円滑におこなえる値であ
る。
化する(ステップS1102)。そして、この二値の画
像データA内において、白画素により構成される全ての
矩形を抽出し(ステップS1103)、全白画素矩形か
らなる領域の面積(前述した面積S3に相当)を算出す
る(ステップS1104)。つぎに、得られた全ての白
画素矩形を面積の大きい順にソートする(ステップS1
105)。そして、これら白画素矩形の面積が大きい上
位の所定の数N(例えば、N:2〜10)個の矩形を抽
出する(ステップS1106〜S1109のループ)。
このループ処理では、抽出された矩形の面積上位の所定
の数分の矩形で、矩形中の白画素の面積があらかじめ定
めたしきい値Th2(0.3〜0.6)以下である場合
(ステップS1107:No)、何もせずにステップS
1106へ戻ることで該当する矩形が除かれ、しきい値
Th2よりも大きい場合(ステップS1107:Ye
s)にのみ、上位N個の白画素矩形の面積が積算(加
算)される(ステップS1108)。
るまでは、ステップS1106に復帰するi回(i=0
〜N)のループを実行する(ステップS1109:N
o)。N個全ての白画素の矩形の面積が積算されると
(ステップS1109:Yes)、面積の総和を求め
(面積S2に相当)、白画素矩形の範囲面積(S3)に
おける白画素矩形の面積(S2)の面積比を求め、あら
かじめ設定された所定のしきい値Th3(値:1/2)
と対比する(ステップS1110)。
度の反転なしと判定する(ステップS1111)。上記
を満たさない場合には(ステップS1110:No)、
明度反転されていると判定する(ステップS111
2)。
ことにより、データ容量を小さくし明度反転の判定を高
速化することができるようになる。また、JPEGなど
のデータ劣化が起こる圧縮形式や、印刷に重点をおいた
画像処理で黒ベタ領域の中や周辺に白ぬけノイズが発生
することがある。このノイズは、矩形抽出を用いる方法
では画素が白黒双方であっても無用な矩形が多数発生し
て明度反転判定の処理に影響が生じる。上記のような画
像データの縮小化によれば、この白ぬけノイズの発生を
回避することができる。なお、上記処理で縮小された二
値の画像データは、そのまま以降の処理画像に用いるこ
とができる他、文字認識時に再度、元画像データを取り
込み処理することもできる。
理方法は、あらかじめ用意されたプログラムをパーソナ
ル・コンピュータやワークステーション等のコンピュー
タで実行することにより実現することができる。このプ
ログラムは、ハードディスク、フロッピー(R)ディス
ク、CD−ROM、MO、DVD等のコンピュータで読
み取り可能な記録媒体に記録され、コンピュータによっ
て記録媒体から読み出されることによって実行される。
またこのプログラムは、上記記録媒体を介して、インタ
ーネット等のネットワークを介して配布することができ
る。
発明によれば、入力された多値の画像データの画像の傾
きや画像方向を検出する文書画像処理方法において、前
記多値の画像データの二値化をおこない、前記二値化さ
れた画像データの画像の傾きおよび/または画像方向を
検出するものであり、回転検出工程での検出に失敗した
場合には、前記入力された多値の画像データの明度を反
転させた画像データを作成し、前記作成された明度反転
の画像データを二値化し、該明度反転後の二値画像デー
タの画像の傾きおよび/または画像方向を検出する各工
程を備えたため、明度反転された画像データが入力され
ても、これを受け入れて画像の傾きや画像方向の検出が
おこなえるという効果を奏する。
力された多値の画像データの画像の傾きや画像方向を検
出する文書画像処理方法において、前記多値の画像デー
タが明度反転されているか否かを判定し、前記判定が明
度反転の場合には、前記入力された多値の画像データの
明度を反転させた画像データを作成し、前記明度反転さ
れた画像データを二値化し、該明度反転後の二値画像デ
ータの画像の傾きおよび/または画像方向を検出する各
工程を備えたので、最初に画像データの明度反転を判定
するため、画像データに対する二値化の回数を減らすこ
とができ、入力された画像データの明度反転の有無にか
かわらず、傾きや方向を高精度に検出できるという効果
を奏する。
または2に記載の発明において、カラーマップを持つ多
値の画像データについての明度反転はカラーマップの反
転情報を作り変えておこなうので、データ部分は書き換
えずカラーマップだけを作り変えて画像データの明度反
転をおこなう画像処理の効率化を図ることができるとい
う効果を奏する。
に記載の発明において、前記明度反転の判定時には、前
記明度反転前後それぞれの二値画像データにおける黒画
素の連結成分からなる外接矩形を抽出し、抽出された外
接矩形のうち、画像上の周辺に接している外接矩形を除
く外接矩形を構成する黒画素数を計数し、前記明度反転
前後それぞれの二値画像データを前記計数された黒画素
数に基づき明度反転の有無を判定することとしたので、
ブック原稿をスキャンする際に出る原稿周辺のベタノイ
ズ等によるカウントをせず、このベタノイズの影響を排
除して原稿のみの明度反転を正確に判定できるという効
果を奏する。
に記載の発明において、前記明度反転の判定時には、前
記明度反転前後それぞれの二値画像データに対し所定の
領域分割処理をおこない、前記領域分割された前記明度
反転前後それぞれの二値画像データを所定の評価により
前記領域分割結果の正当性に基づき明度反転の有無を判
定するので、領域分割結果の評価により明度反転の有無
を判定できるという効果を奏する。
に記載の発明において、前記明度反転の判定時には、入
力された多値の画像データを二値化し、該二値化された
画像データにおける白画素の連結成分からなる外接矩形
を抽出し、該抽出した外接矩形を合計した面積と画像の
面積との比に基づき明度反転の有無を判定することとし
たので、面積比を用い適当な値のしきい値を用いて簡単
に明度反転の有無が判定できるという効果を奏する。
に記載の発明において、前記明度反転の判定時には、画
像上における前記抽出した白画素の外接矩形全てを含む
領域の面積S3を検出し、前記抽出した白画素の外接矩
形のうち面積が大きい上位所定数N個による外接矩形の
面積S2を求め、 (S2/S3)<Th1 である場合に明度が反転されていると判定することとし
たので、ブック原稿をスキャンする際に生じる原稿周辺
のベタノイズ等によるカウントをせず、このベタノイズ
の影響を排除して原稿のみの明度反転を正確に判定でき
るという効果を奏する。
または7に記載の発明において、前記明度反転の判定時
には、前記抽出した外接矩形の面積が大きい上位所定数
N個以内の外接矩形で、外接矩形中の白画素の面積があ
らかじめ定めたしきい値Th2以下である場合、この外
接矩形を除いた面積を用いることとしたので、誤認の原
因になる白画素の面積比が少ない白矩形を除き、明度反
転の判定精度を向上できるという効果を奏する。
〜8のいずれか一つに記載の発明において、前記明度反
転の判定時には、入力された多値の画像データを二値化
する際に、該画像データを所定の割合M1で縮小するこ
ととしたので、この縮小された画像データを用いること
により、データ容量を小さくし明度反転の判定を高速化
できるようになる。また、JPEGなどのデータ劣化が
起こる圧縮形式や、印刷に重点をおいた画像処理で黒ベ
タ領域の中や周辺に生じる白ぬけノイズの発生を縮小に
より回避できるという効果を奏する。
識装置の構成を示すブロック図である。
方法の文書処理手順を示すフローチャートである。
方法の文書処理手順を示すフローチャートである。
方法の文書処理手順を示すフローチャートである。
方法の文書処理手順を示すフローチャートである。
理方法の明度判定処理手順を示すフローチャートであ
る。
理方法の明度判定処理手順を示すフローチャートであ
る。
理方法の明度判定処理手順を示すフローチャートであ
る。
現する具体的構成を示すブロック図である。
処理方法の明度判定処理手順を示すフローチャートであ
る。
処理方法の明度判定処理手順を示すフローチャートであ
る。
Claims (9)
- 【請求項1】 入力された多値の画像データの画像の傾
きや画像方向を検出する文書画像処理方法において、 前記多値の画像データの二値化をおこない、 前記二値化された画像データの画像の傾きおよび/また
は画像方向を検出するものであり、 回転検出工程での検出に失敗した場合には、 前記入力された多値の画像データの明度を反転させた画
像データを作成し、 前記作成された明度反転の画像データを二値化し、 該明度反転後の二値画像データの画像の傾きおよび/ま
たは画像方向を検出する、各工程を備えたことを特徴と
する文書画像処理方法。 - 【請求項2】 入力された多値の画像データの画像の傾
きや画像方向を検出する文書画像処理方法において、 前記多値の画像データが明度反転されているか否かを判
定し、 前記判定が明度反転の場合には、 前記入力された多値の画像データの明度を反転させた画
像データを作成し、 前記明度反転された画像データを二値化し、 該明度反転後の二値画像データの画像の傾きおよび/ま
たは画像方向を検出する、各工程を備えたことを特徴と
する文書画像処理方法。 - 【請求項3】 カラーマップを持つ多値画像データにつ
いての明度反転はカラーマップの反転情報を作り変えて
おこなうことを特徴とする請求項1または2に記載の文
書画像処理方法。 - 【請求項4】 前記明度反転の判定時には、 前記明度反転前後それぞれの二値画像データにおける黒
画素の連結成分からなる外接矩形を抽出し、 抽出された外接矩形のうち、画像上の周辺に接している
外接矩形を除く外接矩形を構成する黒画素数を計数し、 前記明度反転前後それぞれの二値画像データを前記計数
された黒画素数に基づき明度反転の有無を判定すること
を特徴とする請求項2に記載の文書画像処理方法。 - 【請求項5】 前記明度反転の判定時には、 前記明度反転前後それぞれの二値画像データに対し所定
の領域分割処理をおこない、 前記領域分割された前記明度反転前後それぞれの二値画
像データを所定の評価により前記領域分割結果の正当性
に基づき明度反転の有無を判定することを特徴とする請
求項2に記載の文書画像処理方法。 - 【請求項6】 前記明度反転の判定時には、 入力された多値の画像データを二値化し、 該二値化された画像データにおける白画素の連結成分か
らなる外接矩形を抽出し、 該抽出した外接矩形を合計した面積と画像の面積との比
に基づき明度反転の有無を判定することを特徴とする請
求項2に記載の文書画像処理方法。 - 【請求項7】 前記明度反転の判定時には、 画像上における前記抽出した白画素の外接矩形全てを含
む領域の面積S3を検出し、 前記抽出した白画素の外接矩形のうち面積が大きい上位
所定数N個による外接矩形の面積S2を求め、 (S2/S3)<Th1 である場合に明度が反転されていると判定することを特
徴とする請求項6に記載の文書画像処理方法。 - 【請求項8】 前記明度反転の判定時には、 前記抽出した外接矩形の面積が大きい上位所定数N個以
内の外接矩形で、外接矩形中の白画素の面積があらかじ
め定めたしきい値Th2以下である場合、この外接矩形
を除いた面積を用いることを特徴とする請求項6または
7に記載の文書画像処理方法。 - 【請求項9】 前記明度反転の判定時には、 入力された多値の画像データを二値化する際に、該画像
データを所定の割合M1で縮小することを特徴とする請
求項2〜8のいずれか一つに記載の文書画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003007567A JP4261922B2 (ja) | 2002-01-16 | 2003-01-15 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002-7933 | 2002-01-16 | ||
JP2002007933 | 2002-01-16 | ||
JP2003007567A JP4261922B2 (ja) | 2002-01-16 | 2003-01-15 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008292520A Division JP4339925B2 (ja) | 2002-01-16 | 2008-11-14 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003281469A true JP2003281469A (ja) | 2003-10-03 |
JP4261922B2 JP4261922B2 (ja) | 2009-05-13 |
Family
ID=29252941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003007567A Expired - Fee Related JP4261922B2 (ja) | 2002-01-16 | 2003-01-15 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4261922B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100651309B1 (ko) | 2003-09-11 | 2006-11-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 화질 보정 장치 및 화질 보정 방법 |
JP2007336143A (ja) * | 2006-06-14 | 2007-12-27 | Ricoh Co Ltd | 画像処理装置 |
CN105761219A (zh) * | 2016-02-03 | 2016-07-13 | 北京云江科技有限公司 | 文本图像倾斜矫正方法和系统 |
CN110389127A (zh) * | 2019-07-03 | 2019-10-29 | 浙江大学 | 一种金属陶瓷零件识别及表面缺陷检测系统和方法 |
-
2003
- 2003-01-15 JP JP2003007567A patent/JP4261922B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100651309B1 (ko) | 2003-09-11 | 2006-11-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 화질 보정 장치 및 화질 보정 방법 |
JP2007336143A (ja) * | 2006-06-14 | 2007-12-27 | Ricoh Co Ltd | 画像処理装置 |
US8422811B2 (en) | 2006-06-14 | 2013-04-16 | Ricoh Company, Limited | Image processing apparatus |
CN105761219A (zh) * | 2016-02-03 | 2016-07-13 | 北京云江科技有限公司 | 文本图像倾斜矫正方法和系统 |
CN110389127A (zh) * | 2019-07-03 | 2019-10-29 | 浙江大学 | 一种金属陶瓷零件识别及表面缺陷检测系统和方法 |
CN110389127B (zh) * | 2019-07-03 | 2020-08-14 | 浙江大学 | 一种金属陶瓷零件识别及表面缺陷检测系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4261922B2 (ja) | 2009-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4339925B2 (ja) | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 | |
JP4628882B2 (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US6839466B2 (en) | Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding | |
US8594431B2 (en) | Adaptive partial character recognition | |
JP3950777B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
US6798906B1 (en) | Image processing apparatus and method including line segment data extraction | |
EP1081648B1 (en) | Method for processing a digital image | |
JP3990375B2 (ja) | 画像処理装置および画像処理方法 | |
JP2010527190A (ja) | スキャンされたドキュメントを含むデジタル画像の圧縮 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
KR100923935B1 (ko) | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 | |
JP4392907B2 (ja) | 文字切出し方法 | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
JP4261922B2 (ja) | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 | |
JP4132766B2 (ja) | 画像処理装置および方法 | |
CN100416597C (zh) | 用于文档的自适应二值化的方法和设备 | |
JP2002279345A (ja) | 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP4471202B2 (ja) | 画像処理装置、画像処理方法及び同方法に用いるプログラム | |
KR100537827B1 (ko) | 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 | |
Boiangiu et al. | Bitonal image creation for automatic content conversion | |
JP4094240B2 (ja) | 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP2899356B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4261922 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |