JP2002288589A - 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002288589A
JP2002288589A JP2001086484A JP2001086484A JP2002288589A JP 2002288589 A JP2002288589 A JP 2002288589A JP 2001086484 A JP2001086484 A JP 2001086484A JP 2001086484 A JP2001086484 A JP 2001086484A JP 2002288589 A JP2002288589 A JP 2002288589A
Authority
JP
Japan
Prior art keywords
character
image
image processing
circumscribed
circumscribed rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001086484A
Other languages
English (en)
Other versions
JP4558232B2 (ja
Inventor
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001086484A priority Critical patent/JP4558232B2/ja
Publication of JP2002288589A publication Critical patent/JP2002288589A/ja
Application granted granted Critical
Publication of JP4558232B2 publication Critical patent/JP4558232B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】文字と文字以外の画像を含むカラー文書から正
確に文字領域抽出を行うことができる画像処理方法を提
供すること。 【解決手段】処理対象となる多値画像を文字と文字以外
の画像を含むカラー文書から取得して(ステップS1)、
圧縮画像を生成し(ステップS2)、圧縮画像から同色と
みなせる画素をランとして抽出し(ステップS3)、抽出
したランを統合して連結成分を生成する(ステップS
4)。連結成分のうち不要成分の除去後(ステップS
5)、連結成分の外接矩形を統合し(ステップS6)、統
合した外接矩形から文字らしいものを判定し(ステップ
S7)、得られた結果を出力する(ステップS8)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字以外の画像を
含む処理対象となる画像から入力されたカラー文書画像
を認識する文書画像認識システムなどに利用され、カラ
ー文書画像や、写真、図などを含む文書から文字行の位
置を正しく特定する画像処理方法、画像処理装置および
画像処理方法を実行させるプログラムを記録したコンピ
ュータ読み取り可能な記録媒体に係り、特に、カラー文
書から正確な文字領域抽出を可能とする画像処理方法の
プログラムをコンピュータで実行するようにした画像処
理方法、画像処理装置および画像処理方法をコンピュー
タに実行させるプログラムを記録したコンピュータ読み
取り可能な記録媒体に関する。
【0002】
【従来の技術】文書画像を認識する際、文字の位置を正
しく特定する技術は、高い認識精度を得るために不可欠
である。仮に、文書画像のどこに文字があるのか不明な
状態で文字認識処理を行った場合、文字認識の必要のな
い写真、図などの領域に文字認識処理を行ってしまうこ
とになるため、不要な処理に不要な時間がかかるだけで
なく、文字でない部分を無理に文字とみなして認識した
結果が大量に出力されることになり、認識結果を利用す
る際に大きな困難を伴うことになる。このため、たとえ
ば、特開平2000―67158号公報においては、文
字領域を正しく特定するために、2値画像の黒画素の連
結成分を用いて処理を行っている。すなわち、この公報
には、入力された画像を縮小して黒画素の連結成分の外
接矩形を取得し、この取得した外接矩形から基本となる
要素を抽出する。この抽出した基本要素を文字、表、
図、その他に分類し、文字要素を統合して行を生成し、
この生成した行を統合して文字領域とする。この文字領
域から段組情報を抽出し、その抽出された段の位置を参
照し、過剰に統合された文字領域を修正することが開示
されている。
【0003】
【発明が解決しようとする課題】しかしながら、上記公
報に開示された画像処理方法では、2値画像を対象とす
るものであり、処理対象文書がカラー印刷されている場
合には、カラー情報をどこかで欠落させて2値画像に変
換する必要がある。しかしながら、2値化には決定的な
方法があるわけではなく、処理対象画像によっては、文
字がつぶれてしまったり、背景の色が細かいノイズ状に
なって2値画像に表現されてしまうなどの問題がしばし
ば発生する。このような状態では、縮小画像の黒画素の
連結成分抽出が思うようにできず、精度が低化してしま
うという難点がある。本発明は、上述した事情に鑑みて
なされたもので、従来困難であった文字および文字以外
の画像を含むカラー文書から正確に文字領域抽出を行う
ことができる画像処理処理方法、画像処理装置および画
像処理方法をコンピュータに実行させるプログラムを記
録したコンピュータ読み取り可能な記録媒体を提供する
ことを目的としている。
【0004】本発明の請求項1の目的は、特に、直接カ
ラー画像の画素情報を用いることにより、カラー文書か
ら正確に文字領域の抽出を可能とし、高い認識精度を得
ることができる画像処理方法を提供することにある。本
発明の請求項2の目的は、特に、背景が暗くても、ある
いは明るくても画素値を圧縮画像の画素として使用する
ことができる画像処理方法を提供することにある。本発
明の請求項3の目的は、特に、同色とみなせる画素をラ
ンとして抽出して、1ラインのラン統合を確実に行うこ
とができる画像処理方法を提供することにある。本発明
の請求項4の目的は、特に、互いに接触する2つの連結
成分を正確に生成することができる画像処理方法を提供
することにある。本発明の請求項5の目的は、特に、連
結成分の不要な部分を除去でき、より正確に連結成分を
生成することができる画像処理方法を提供することにあ
る。本発明の請求項6の目的は、特に、連結成分の外接
矩形を確実に統合することができる画像処理方法を提供
することにある。
【0005】本発明の請求項7の目的は、特に、統合さ
れた外接矩形の高さが所定範囲外の場合には、統合され
た外接矩形から文字らしいものを判定せず、必要とする
文字らしい文字の判定精度を向上することができる画像
処理方法を提供することにある。本発明の請求項8の目
的は、特に、抽出対象の文字色の整合が取れない場合に
は、文字でないと判定して統合された外接矩形から文字
らしいもののみをより高精度に判定することができる画
像処理方法を提供することにある。本発明の請求項9の
目的は、特に、外接矩形内のエッジ強度の強い画素数が
少数しか存在しない場合に文字でないと判定して統合さ
れた外接矩形から文字らしいもののみをより高精度に判
定することができる画像処理方法を提供することにあ
る。本発明の請求項10の目的は、特に、2値化された
画像の連結成分の外接矩形中で、文字らしい形状の矩形
数が少ない場合に文字でないと判断して、統合された外
接矩形から文字らしいもののみをより高精度に判定する
ことができる画像処理方法を提供することにある。
【0006】本発明の請求項11の目的は、特に、直接
カラー画像の画素情報を用いることにより、カラー文書
から正確に文字領域の抽出を可能とし、高い認識精度を
得ることができる画像処理装置を提供することにある。
本発明の請求項12の目的は、特に、背景が暗くても、
あるいは明るくても画素値を圧縮画像の画素として使用
することができる画像処理装置を提供することにある。
本発明の請求項13の目的は、特に、同色とみなせる画
素をランとして抽出して、1ラインのラン統合を確実に
行うことができる画像処理装置を提供することにある。
本発明の請求項14の目的は、特に、互いに接触する2
つの連結成分を正確に生成することができる画像処理装
置を提供することにある。本発明の請求項15の目的
は、特に、連結成分の不要な部分を除去でき、より正確
に連結成分を生成することができる画像処理装置を提供
することにある。本発明の請求項16の目的は、特に、
連結成分の外接矩形を確実に統合することができる画像
処理装置を提供することにある。
【0007】本発明の請求項17の目的は、特に、統合
された外接矩形の高さが所定範囲外の場合には、統合さ
れた外接矩形から文字らしいものを判定せず、必要とす
る文字らしい文字の判定精度を向上することができる画
像処理装置を提供することにある。本発明の請求項18
の目的は、特に、抽出対象の文字色の整合が取れない場
合には、文字でないと判定して統合された外接矩形から
文字らしいもののみをより高精度に判定することができ
る画像処理装置を提供することにある。本発明の請求項
19の目的は、特に、外接矩形内のエッジ強度の強い画
素数が少数しか存在しない場合に文字でないと判定して
統合された外接矩形から文字らしいもののみをより高精
度に判定することができる画像処理装置を提供すること
にある。本発明の請求項20の目的は、特に、2値化さ
れた画像の連結成分の外接矩形中で、文字らしい形状の
矩形数が少ない場合に文字でないと判断して、統合され
た外接矩形から文字らしいもののみをより高精度に判定
することができる画像処理装置を提供することにある。
【0008】本発明の請求項21の目的は、特に、直接
カラー画像の画素情報を用いることにより、カラー文書
から正確に文字領域の抽出を可能とし、高い認識精度を
得ることができる画像処理方法を実現するプログラムを
記録したコンピュータ読取可能な記録媒体を提供するこ
とにある。本発明の請求項22の目的は、特に、背景が
暗くても、あるいは明るくても画素値を圧縮画像の画素
として使用することができる画像処理方法を実現するプ
ログラムを記録したコンピュータ読取可能な記録媒体を
提供することにある。本発明の請求項23の目的は、特
に、同色とみなせる画素をランとして抽出して、1ライ
ンのラン統合を確実に行うことができる画像処理方法を
実現するプログラムを記録したコンピュータ読取可能な
記録媒体を提供することにある。本発明の請求項24の
目的は、特に、互いに接触する2つの連結成分を正確に
生成することができる画像処理方法を実現するプログラ
ムを記録したコンピュータ読取可能な記録媒体を提供す
ることにある。
【0009】本発明の請求項25の目的は、特に、連結
成分の不要な部分を除去でき、より正確に連結成分を生
成することができる画像処理方法を実現するプログラム
を記録したコンピュータ読取可能な記録媒体を提供する
ことにある。本発明の請求項26の目的は、特に、連結
成分の外接矩形を確実に統合することができる画像処理
方法を実現するプログラムを記録したコンピュータ読取
可能な記録媒体を提供することにある。本発明の請求項
27の目的は、特に、統合された外接矩形の高さが所定
範囲外の場合には、統合された外接矩形から文字らしい
ものを判定せず、必要とする文字らしい文字の判定精度
を向上することができる画像処理方法を実現するプログ
ラムを記録したコンピュータ読取可能な記録媒体を提供
することにある。本発明の請求項28の目的は、特に、
抽出対象の文字色の整合が取れない場合には、文字でな
いと判定して統合された外接矩形から文字らしいものの
みをより高精度に判定することができる画像処理方法を
実現するプログラムを記録したコンピュータ読取可能な
記録媒体を提供することにある。
【0010】本発明の請求項29の目的は、特に、外接
矩形内のエッジ強度が強い画素数が少数しか存在しない
場合に文字でないと判定して統合された外接矩形から文
字らしいもののみをより高精度に判定することができる
画像処理方法を実現するプログラムを記録したコンピュ
ータ読取可能な記録媒体を提供することにある。本発明
の請求項30の目的は、特に、2値化された画像の連結
成分の外接矩形中で、文字らしい形状の矩形数が少ない
場合に文字でないと判断して、統合された外接矩形から
文字らしいもののみをより高精度に判定することができ
る画像処理方法を実現するプログラムを記録したコンピ
ュータ読取可能な記録媒体を提供することにある。
【0011】
【課題を解決するための手段】請求項1に記載した発明
に係る画像処理方法は、上述した目的を達成するため
に、文字および文字以外の画像を含む処理対象となる画
像から多値画像を取得する第1ステップと、上記多値画
像から圧縮画像を生成する第2ステップと、上記圧縮画
像から同色とみなせる画素をランとして抽出する第3ス
テップと、上記ランを統合して連結成分を生成する第4
ステップと、上記連結成分のうち不要なものを排除する
第5ステップと、上記連結成分の外接矩形を統合する第
6ステップと、上記統合された外接矩形から文字らしい
ものを判定する第7ステップと、上記文字らしい情報か
ら文字領域を出力する第8ステップとを備えることを特
徴としている。請求項2に記載した発明に係る画像処理
方法は、上記第2ステップが、圧縮するブロックサイズ
を決定するステップと、ブロック内の全画素の明度値を
求めるステップと、背景に対して暗い文字を抽出する場
合は最も明度の低い画素値を選択するステップと、上記
背景に対して明るい文字を抽出する場合には、最も明度
の高い画素値を選択するステップと、上記選択された画
素値を圧縮画素値として使用するステップとを備えるこ
とを特徴としている。
【0012】請求項3に記載した発明に係る画像処理方
法は、上記第3ステップが、各画素をランデータとして
登録するステップと、隣接するランを選択するステップ
と、上記隣接するランの色差を求めるステップと、上記
色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップとを備えること
を特徴としている。請求項4に記載した発明に係る画像
処理方法は、上記第4ステップが、上記ランデータを連
結成分データとして登録するステップと、互いに接触す
る2つの連結成分を抽出するステップと、上記2つの連
結成分の色差を算出するステップと、上記色差があらか
じめ定めた値より小さい場合には、連結成分を統合する
ステップと、連結成分の統合を繰り返すステップとを備
えることを特徴としている。請求項5に記載した発明に
係る画像処理方法は、上記第5ステップが、上記連結成
分の大きさがあらかじめ定めた値より小さい場合に連結
成分データから不要な成分を削除するステップと、上記
連結成分の明度と周囲の画素の明度とを比較するステッ
プと、上記比較の結果を用いて不要な連結成分データを
削除するステップとを備えることを特徴としている。
【0013】請求項6に記載した発明に係る画像処理方
法は、上記第6ステップが、各連結矩形の外接矩形を求
めるステップと、上記外接矩形を2つ選択するステップ
と、上記選択された外接矩形の高さ方向の座標値の差異
を求めるステップと、上記外接矩形の高さから幅方向の
距離限界値を求めるステップと、上記外接矩形間の幅方
向の座標値の差異と上記距離限界値を比較するステップ
と、上記外接矩形間の色差を算出するステップと、上記
高さ方向の座標値の差異、幅方向の座標値の差異、距離
限界値、色差を用いて上記外接矩形の統合の可否を決定
するステップと、上記外接矩形を統合する場合には双方
の外接矩形に外接する矩形を新たな外接矩形として一つ
に登録し直すステップとを備えることを特徴としてい
る。請求項7に記載した発明に係る画像処理方法は、上
記第7ステップが、上記外接矩形の高さが所定範囲外の
場合には、文字でないと判断するステップを備えること
を特徴としている。
【0014】請求項8に記載した発明に係る画像処理方
法は、上記第7ステップが、外接矩形の色情報と周囲の
画素の色情報を比較し、抽出対象の文字色との整合がと
れない場合には、文字でないと判断するステップを備え
ることを特徴としている。請求項9に記載した発明に係
る画像処理方法は、上記第7ステップが、外接矩形内の
エッジ強度を測定するステップと、エッジ強度が強い画
素数が少ししか存在しない場合には、文字でないと判断
するステップを備えることを特徴としている。請求項1
0に記載した発明に係る画像処理方法は、上記第7ステ
ップが、外接矩形内の画像を2値化するステップと、上
記2値化された画像の連結成分を求めるステップと、上
記連結成分の外接矩形を求めるステップと、上記求めら
れた外接矩形のうちで文字らしい形状の矩形数が少ない
場合には、文字でないと判断するステップとを備えるこ
とを特徴としている。
【0015】請求項11に記載した発明に係る画像処理
装置は、文字および文字以外の画像を含む処理対象とな
る画像から多値画像を取得する手段と、上記多値画像か
ら圧縮画像を生成する手段と、上記圧縮画像から同色と
みなせる画素をランとして抽出する手段と、上記ランを
統合して連結成分を生成する手段と、上記連結成分のう
ち不要なものを排除する手段と、上記連結成分の外接矩
形を統合する手段と、上記統合された外接矩形から文字
らしいものを判定する手段と、上記文字らしい情報から
文字領域を出力する手段とを備えることを特徴としてい
る。請求項12に記載した発明に係る画像処理装置は、
上記圧縮画像を生成するが、圧縮するブロックサイズを
決定する手段と、ブロック内の全画素の明度値を求める
手段と、背景に対して暗い文字を抽出する場合は最も明
度の低い画素値を選択する手段と、背景に対して明るい
文字を抽出する場合は最も明度の高い画素値を選択する
手段と、上記選択された画素値を圧縮画像の画素値とし
て使用する手段とを備えることを特徴としている。
【0016】請求項13に記載した発明に係る画像処理
装置は、上記同色とみなせる画素をランとして抽出する
手段が、各画素をランデータとして登録する手段と、隣
接するランを選択する手段と、隣接するランの色差を求
める手段と、上記色差が小さい場合は上記ランを統合す
る手段と、1ラインのラン統合を繰り返す手段とを備え
ることを特徴としている。請求項14に記載した発明に
係る画像処理装置は、上記連結成分を生成する手段が、
上記ランデータを連結成分データとして登録する手段
と、互いに接触する2つの連結成分を抽出する手段と、
色差があらかじめ定めた値より小さい場合には、連結成
分を統合する手段と、上記連結成分の統合を繰り返す手
段とを備えることを特徴としている。請求項15に記載
した発明に係る画像処理装置は、上記連結成分のうち不
要なものを排除する手段が、上記連結成分の大きさが予
め定めた値より小さい場合に連結成分データから削除す
る手段と、連結成分の明度と周囲の画素の明度とを比較
する手段と、上記比較の結果を用いて不要な連結成分デ
ータを削除する手段とを備えることを特徴としている。
【0017】請求項16に記載した発明に係る画像処理
装置は、上記連結成分の外接矩形を統合する手段が、各
連結矩形の外接矩形を求める手段と、上記外接矩形を2
つ選択する手段と、上記選択された外接矩形の高さ方向
の座標値の差異を求める手段と、上記外接矩形の高さか
ら幅方向の距離限界値を求める手段と、外接矩形間の幅
方向の座標値の差異と上記距離限界値とを比較する手段
と、上記外接矩形間の色差を算出する手段と、上記高さ
方向の座標値の差異、幅方向の座標値の差異、上記距離
限界値、上記色差を用いて上記外接矩形の統合の可否を
決定する手段と、上記外接矩形の統合を決定する場合に
は、双方の外接矩形に外接する矩形を新たな外接矩形と
して一つに登録し直す手段とを備えることを特徴として
いる。請求項17に記載した発明に係る画像処理装置
は、上記統合された外接矩形から文字らしいものを判定
する手段が、外接矩形の高さが所定範囲外の場合は文字
でないと判断する手段を備えることを特徴としている。
【0018】請求項18に記載した発明に係る画像処理
装置は、上記統合された外接矩形から文字らしいものを
判定する手段が、外接矩形の色情報と、周囲の画素の色
情報とを比較し、抽出対象の文字色との整合がとれない
場合には文字でないと判断する手段を備えることを特徴
としている。請求項19に記載した発明に係る画像処理
装置は、上記統合された外接矩形から文字らしいものを
判定する手段が、外接矩形内のエッジ強度を測定する手
段と、エッジ強度の強い画素数が少数しか存在しない場
合に文字でないと判断する手段とを備えることを特徴と
している。請求項20に記載した発明に係る画像処理装
置は、上記統合された外接矩形から文字らしいものを判
定する手段が、上記矩形内の画像を2値化する手段と、
上記2値化された画像の連結成分を求める手段と、上記
連結成分の外接矩形を求める手段と、求めた外接矩形の
うちで文字らしい形状の矩形数が少ない場合には文字で
ないと判断する手段とを備えることを特徴としている。
【0019】請求項21に記載した発明に係る画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体は、文字および文字以外の画像を含
む処理対象となる画像から多値画像を取得する第1ステ
ップと、上記多値画像から圧縮画像を生成する第2ステ
ップと、上記圧縮画像から同色とみなせる画素をランと
して抽出する第3ステップと、上記ランを統合して連結
成分を生成する第4ステップと、上記連結成分のうち不
要なものを排除する第5ステップと、上記連結成分の外
接矩形を統合する第6ステップと、上記統合された外接
矩形から文字らしいものを判定する第7ステップと、上
記文字らしい情報から文字領域を出力する第8ステップ
とを備えることを特徴としている。請求項22に記載し
た発明に係る画像処理方法を実現するプログラムを記録
したコンピュータ読み取り可能な記録媒体は、上記第2
ステップが、圧縮するブロックサイズを決定するステッ
プと、ブロック内の全画素の明度値を求めるステップ
と、背景に対して明るい文字を抽出する場合は最も明度
の低い画素値を選択するステップと、上記背景に対して
明るい文字を抽出する場合には、最も明度の高い画素値
を選択するステップと、上記選択された画素値を圧縮画
素値として使用するステップとを備えることを特徴とし
ている。
【0020】請求項23に記載した発明に係る画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体は、上記第3ステップが、各画素を
ランデータとして登録するステップと、隣接するランを
選択するステップと、上記隣接するランの色差を求める
ステップと、上記色差が小さい場合には上記ランを統合
するステップと、1ラインのラン統合を繰り返すステッ
プとを備えることを特徴としている。請求項24に記載
した発明に係る画像処理方法を実現するプログラムを記
録したコンピュータ読み取り可能な記録媒体は、上記第
4ステップが、上記ランデータを連結成分データとして
登録するステップと、互いに接触する2つの連結成分を
抽出するステップと、上記2つの連結成分の色差を算出
するステップと、上記色差があらかじめ定めた値より小
さい場合には、連結成分を統合するステップと、連結成
分の統合を繰り返すステップとを備えることを特徴とし
ている。
【0021】請求項25に記載した発明に係る画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体は、上記第5ステップが、上記連結
成分の大きさがあらかじめ定めた値より小さい場合に連
結成分データから削除するステップと、上記連結成分の
明度と周囲の画素の明度とを比較するステップと、上記
比較の結果を用いて不要な連結成分データを削除するス
テップとを備えることを特徴としている。請求項26に
記載した発明に係る画像処理方法を実現するプログラム
を記録したコンピュータ読み取り可能な記録媒体は、上
記第6ステップが、各連結矩形の外接矩形を求めるステ
ップと、上記外接矩形を2つ選択するステップと、上記
選択された外接矩形の高さ方向の座標値の差異を求める
ステップと、上記外接矩形の高さから幅方向の距離限界
値を求めるステップと、上記外接矩形間の幅方向の座標
値の差異と上記距離限界値を比較するステップと、上記
外接矩形間の色差を算出するステップと、上記高さ方向
の座標値の差異、幅方向の座標値の差異、距離限界値、
色差を用いて上記外接矩形の統合の可否を決定するステ
ップと、上記外接矩形を統合する場合には双方の外接矩
形に外接する矩形を新たな外接矩形として一つに登録し
直すステップとを備えることを特徴としている。
【0022】請求項27に記載した発明に係る画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体は、上記第7ステップが、上記外接
矩形の高さが所定範囲外の場合には、文字でないと判断
するステップを備えることを特徴としている。請求項2
8に記載した発明に係る画像処理方法を実現するプログ
ラムを記録したコンピュータ読み取り可能な記録媒体
は、上記第7ステップが、外接矩形の色情報と周囲の画
素の色情報を比較し、抽出対象の文字色との整合がとれ
ない場合には、文字でないと判断するステップを備える
ことを特徴としている。請求項29に記載した発明に係
る画像処理方法を実現するプログラムを記録したコンピ
ュータ読み取り可能な記録媒体は、上記第7ステップ
が、外接矩形内のエッジ強度を測定するステップと、エ
ッジ強度が強い画素数が少ししか存在しない場合には、
文字でないと判断するステップを備えることを特徴とし
ている。請求項30に記載した発明に係る画像処理方法
を実現するプログラムを記録したコンピュータ読み取り
可能な記録媒体は、上記第7ステップが、外接矩形内の
画像を2値化するステップと、上記2値化された画像の
連結成分を求めるステップと、上記連結成分の外接矩形
を求めるステップと、上記求められた外接矩形のうちで
文字らしい形状の矩形数が少ない場合には、文字でない
と判断するステップとを備えることを特徴としている。
【0023】
【作用】すなわち、本発明の請求項1による画像処理方
法は、処理対象の画像から多値画像を取得してその取得
した、多値画像から圧縮画像を生成し、上記圧縮画像か
ら同色とみなせる画素をランとして抽出し、そのランを
統合して連結成分を生成するとともに、不要連結成分の
排除後に連結成分の外接矩形を統合して、外接矩形から
文字らしいものを判定して文字らしい情報から文字領域
を出力することができるので、特に、直接、カラー画像
の画素情報を用いることにより、カラー文書から正確に
文字領域の抽出を可能とし、高い認識精度を得ることが
可能となる。本発明の請求項2による画像処理方法は、
決定した圧縮するブロックサイズ内の全画素の明度値を
求めて背景に対して明るい文字を抽出する場合は最も明
度の低い画素値を選択するとともに、背景に対して暗い
文字を抽出する場合には、最も明度の高い画素値を選択
して、選択された画素値を圧縮画素値として使用するこ
とができるので、特に、背景が暗くても、あるいは明る
くても画素値を圧縮画像の画素として使用することが可
能となる。
【0024】本発明の請求項3による画像処理方法は、
各画素をランデータとして登録後、隣接するランを選択
して、隣接するランの色差が小さい場合にはランを統合
して、1ラインのラン統合を繰り返すことができるの
で、特に、同色とみなせる画素をランとして抽出して、
1ラインのラン統合を確実に行うことが可能となる。本
発明の請求項4による画像処理方法は、各画素をランデ
ータとして登録後、隣接するランを選択して、隣接ラン
の色差が小さい場合にはランを統合して、1ラインのラ
ン統合を繰り返すことができるので、特に、互いに接触
する2つの連結成分を正確に生成することが可能とな
る。本発明の請求項5による画像処理方法は、連結成分
の大きさがあらかじめ定めた値より小さい場合に連結成
分データから不要な成分を削除して連結成分の明度が周
囲の画素の明度との対比から不要な連結成分データを削
除することができるので、特に、連結成分の不要な部分
を除去でき、より正確に連結成分を生成することが可能
となる。
【0025】本発明の請求項6による画像処理方法は、
各連結矩形の外接矩形を2つ選択し、選択された外接矩
形の高さ方向の座標値の差異を求めるとともに、外接矩
形の高さから幅方向の距離限界値を求め、外接矩形間の
幅方向の座標値の差異と距離限界値を比較して外接矩形
間の色差を算出し、高さ方向の座標値の差異、幅方向の
座標値の差異、距離限界値、色差を用いて外接矩形の統
合の可否を決定し、外接矩形を統合する場合には双方の
外接矩形に外接矩形を新たな外接矩形として一つに登録
し直すことができるので、特に、連結成分の外接矩形を
確実に統合することが可能となる。本発明の請求項7に
よる画像処理方法は、外接矩形の高さが所定範囲外の場
合には、文字でないと判断することができるので、特
に、統合された外接矩形の高さが所定範囲外の場合に
は、統合された外接矩形から文字らしいものを判定せ
ず、必要とする文字らしい文字の判定精度を向上するこ
とが可能となる。本発明の請求項8による画像処理方法
は、外接矩形の色情報と周囲の画素の色情報を比較して
抽出対象の文字色との整合がとれない場合には、文字で
ないと判断することができるので、特に、抽出対象の文
字色の整合が取れない場合には、文字でないと判定して
統合された外接矩形から文字らしいもののみをより高精
度に判定することが可能となる。
【0026】本発明の請求項9による画像処理方法は、
外接矩形内のエッジ強度の強い画素数が少数しか存在し
ない場合に文字でないと判定して統合された外接矩形か
ら文字らしいもののみをより高精度に判定することが可
能となる。本発明の請求項10による画像処理方法は、
2値化された画像の連結成分の外接矩形中で、文字らし
い形状の矩形数が少ない場合に文字でないと判断して、
統合された外接矩形から文字らしいもののみをより高精
度に判定することが可能となる。本発明の請求項11に
よる画像処理装置は、文字および文字以外の画像を含む
処理対象となる画像から多値画像を取得し、その多値画
像から圧縮画像を生成し、圧縮画像から同色とみなせる
画素をランとして抽出するとともに、ランを統合して連
結成分を生成し、連結成分のうち不要なものを排除し
て、連結成分の外接矩形を統合した後、外接矩形から文
字らしいものを判定して、文字らしい情報から文字領域
を出力することができるので、特に、直接カラー画像の
画素情報を用いることにより、カラー文書から正確に文
字領域の抽出を可能とし、高い認識精度を得ることが可
能となる。
【0027】本発明の請求項12による画像処理装置
は、圧縮するブロックサイズを決定し、ブロック内の全
画素の明度値を求めることにより、背景に対して暗い文
字を抽出する場合は最も明度の低い画素値を選択し、背
景に対して明るい文字を抽出する場合は最も明度の高い
画素値を選択し、その選択された画素値を圧縮画像の画
素値として使用することができるので、特に、背景が暗
くても、あるいは明るくても画素値を圧縮画像の画素と
して使用することが可能となる。本発明の請求項13に
よる画像処理装置は、各画素をランデータとして登録
後、隣接するランを選択し、その隣接するランの色差を
求めて、色差が小さい場合はランを統合して1ラインの
ラン統合を繰り返すことができるので、特に、同色とみ
なせる画素をランとして抽出して、1ラインのラン統合
を確実に行うことが可能となる。本発明の請求項14に
よる画像処理装置は、ランデータを連結成分データとし
て登録後、互いに接触する2つの連結成分を抽出し、そ
の連結成分の色差があらかじめ定めた値より小さい場合
には、連結成分を統合し、連結成分の統合を繰り返すこ
とができるので、特に、互いに接触する2つの連結成分
を正確に生成することが可能となる。
【0028】本発明の請求項15による画像処理装置
は、連結成分の大きさが予め定めた値より小さい場合に
連結成分データから不要成分を削除し、連結成分の明度
と周囲の画素の明度とを比較し、その比較の結果を用い
て不要な連結成分データを削除することができるので、
特に、連結成分の不要な部分を除去でき、より正確に連
結成分を生成することが可能となる。本発明の請求項1
6による画像処理装置は、各連結矩形の外接矩形を求め
て外接矩形を2つ選択し、選択された外接矩形の高さ方
向の座標値の差異を求め、外接矩形の高さから幅方向の
距離限界値を求め、外接矩形間の幅方向の座標値の差異
と距離限界値とを比較し、外接矩形間の色差を算出し、
高さ方向の座標値の差異、幅方向の座標値の差異、距離
限界値、色差を用いて外接矩形の統合の可否を決定し、
外接矩形の統合を決定する場合には、双方の外接矩形に
外接する矩形を新たな外接矩形として一つに登録し直す
ことができるので、特に、連結成分の外接矩形を確実に
統合することが可能となる。
【0029】本発明の請求項17による画像処理装置
は、外接矩形の高さが所定範囲外の場合は文字でないと
判断することができるので、特に、統合された外接矩形
の高さが所定範囲外の場合には、統合された外接矩形か
ら文字らしいものを判定せず、必要とする文字らしい文
字の判定精度を向上することが可能となる。本発明の請
求項18による画像処理装置は、外接矩形の色情報と、
周囲の画素の色情報とを比較し、抽出対象の文字色との
整合が採れない場合には文字でないと判断することがで
きるので、特に、抽出対象の文字色の整合が取れない場
合には、文字でないと判定して統合された外接矩形から
文字らしいもののみをより高精度に判定することが可能
となる。本発明の請求項19による画像処理装置は、外
接矩形内のエッジ強度を測定し、エッジ強度の強い画素
数が少数しか存在しない場合に文字でないと判断するこ
とができるので、特に、外接矩形内のエッジ強度の強い
画素数が少数しか存在しない場合に文字でないと判定し
て統合された外接矩形から文字らしいもののみをより高
精度に判定することが可能となる。
【0030】本発明の請求項20による画像処理装置
は、矩形内の画像を2値化し、その2値化された画像の
連結成分を求め、その求めた連結成分の外接矩形を求
め、その外接矩形のうちで文字らしい形状の矩形数が少
ない場合には文字でないと判断することができるので、
特に、2値化された画像の連結成分の外接矩形中で、文
字らしい形状の矩形数が少ない場合に文字でないと判断
して、統合された外接矩形から文字らしいもののみをよ
り高精度に判定することが可能となる。本発明の請求項
21による画像処理方法を実現するプログラムを記録し
たコンピュータ読み取り可能な記録媒体は、文字および
文字以外の画像を含む処理対象となる画像から多値画像
を取得した多値画像から圧縮画像を生成し、圧縮画像か
ら同色とみなせる画素をランとして抽出し、ランを統合
して連結成分を生成し、その連結成分のうち不要なもの
を排除し、連結成分の外接矩形を統合し、統合された外
接矩形から文字らしいものを判定し、上記文字らしい情
報から文字領域を出力することができるので、特に、直
接カラー画像の画素情報を用いることにより、カラー文
書から正確に文字領域の抽出を可能とし、高い認識精度
を得ることが可能となる。
【0031】本発明の請求項22による画像処理方法を
実現するプログラムを記録したコンピュータ読み取り可
能な記録媒体は、圧縮するブロックサイズを決定し、そ
の決定されたブロック内の全画素の明度値を求め、背景
に対して暗い文字を抽出する場合は最も明度の低い画素
値を選択し、背景に対して明るい文字を抽出する場合に
は、最も明度の高い画素値を選択し、選択された画素値
を圧縮画素値として使用することができるので、特に、
背景が暗くても、あるいは明るくても画素値を圧縮画像
の画素として使用することができる画像処理方法を実現
すること可能となる。本発明の請求項23による画像処
理方法を実現するプログラムを記録したコンピュータ読
み取り可能な記録媒体は、各画素をランデータとして登
録して、隣接するランを選択し、その隣接するランの色
差を求め、色差が小さい場合にはランを統合し、1ライ
ンのラン統合を繰り返すことができるので、特に、同色
とみなせる画素をランとして抽出して、1ラインのラン
統合を確実に行うことができる画像処理方法を実現する
ことが可能となる。
【0032】本発明の請求項24による画像処理方法を
実現するプログラムを記録したコンピュータ読み取り可
能な記録媒体は、ランデータを連結成分データとして登
録し、互いに接触する2つの連結成分を抽出し、2つの
連結成分の色差を算出してその算出した色差があらかじ
め定めた値より小さい場合には、連結成分を統合すると
ともに、連結成分の統合を繰り返すことができるので、
特に、互いに接触する2つの連結成分を正確に生成する
ことが可能となる。本発明の請求項25による画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体は、連結成分の大きさがあらかじめ
定めた値より小さい場合に連結成分データから削除し、
連結成分の明度と周囲の画素の明度との比較の結果を用
いて不要な連結成分データを削除することができるの
で、特に、連結成分の不要な部分を除去でき、より正確
に連結成分を生成することが可能となる。本発明の請求
項26による画像処理方法を実現するプログラムを記録
したコンピュータ読み取り可能な記録媒体は、各連結矩
形の外接矩形を求めて外接矩形を2つ選択し、その選択
された外接矩形の高さ方向の座標値の差異を求め、外接
矩形の高さから幅方向の距離限界値を求め、外接矩形間
の幅方向の座標値の差異と距離限界値を比較し、外接矩
形間の色差を算出し、高さ方向の座標値の差異、幅方向
の座標値の差異、距離限界値、色差を用いて外接矩形の
統合の可否を決定するとともに、外接矩形を統合する場
合には双方の外接矩形に外接矩形を新たな外接矩形とし
て一つに登録し直すことができるので、特に、連結成分
の不要な部分を除去でき、より正確に連結成分を生成す
ることが可能となる。
【0033】本発明の請求項27による画像処理方法を
実現するプログラムを記録したコンピュータ読み取り可
能な記録媒体は、外接矩形の高さが所定範囲外の場合に
は、文字でないと判断することができるので、特に、統
合された外接矩形の高さが所定範囲外の場合には、統合
された外接矩形から文字らしいものを判定せず、必要と
する文字らしい文字の判定精度を向上することが可能と
なる。本発明の請求項28による画像処理方法を実現す
るプログラムを記録したコンピュータ読み取り可能な記
録媒体は、外接矩形の色情報と周囲の画素の色情報を比
較し、抽出対象の文字色との整合がとれない場合には、
文字でないと判断することができるので、抽出対象の文
字色の整合が取れない場合には、文字でないと判定して
統合された外接矩形から文字らしいもののみをより高精
度に判定することが可能となる。
【0034】本発明の請求項29による画像処理方法を
実現するプログラムを記録したコンピュータ読み取り可
能な記録媒体は、外接矩形内のエッジ強度を測定し、エ
ッジ強度が強い画素数が少ししか存在しない場合には、
文字でないと判断することができるので、特に、外接矩
形内のエッジ強度が強い画素数が少数しか存在しない場
合に文字でないと判定して統合された外接矩形から文字
らしいもののみをより高精度に判定することが可能とな
る。本発明の請求項30による画像処理方法を実現する
プログラムを記録したコンピュータ読み取り可能な記録
媒体は、外接矩形内の画像を2値化して、その2値化さ
れた画像の連結成分を求め、連結成分の外接矩形を求め
るとともに、求められた外接矩形のうちで文字らしい形
状の矩形数が少ない場合には、文字でないと判断するこ
とができるので、特に、2値化された画像の連結成分の
外接矩形中で、文字らしい形状の矩形数が少ない場合に
文字でないと判断して、統合された外接矩形から文字ら
しいもののみをより高精度に判定することができる。
【0035】
【発明の実施の形態】以下、実施の形態に基づき、図面
を参照して本発明の画像処理方法、画像処理装置および
画像処理方法をコンピュータに実行させるプログラムを
記録したコンピュータ読み取り可能な記録媒体を詳細に
説明する。図1は、本発明の1実施の形態の概略的処理
手順を示すフローチャートであり、コンピュータ読取可
能な記録媒体に記録されたプログラムにしたがって本発
明の画像処理方法を実現する処理手順を示すフローチャ
ートである。まず、本発明により処理される処理対象の
原稿は、文字および文字以外の画像を含むものである。
この原稿は図示されていないが、スキャナ、撮像装置な
どの原稿読み取り装置により、処理対象の原画像のデー
タを処理対象画像入力手段により取得して(ステップS
1)、圧縮画像生成手段に入力し、そこで圧縮すること
により、圧縮画像データを生成する(ステップS2)。次
に、この圧縮画像データからラン生成手段に入力するこ
とにより、同色とみなせる画素をランとして抽出する
(ステップS3)。
【0036】ここで、「ラン」とは、周知のように、2
値の文書画像のように、白画素あるいは黒画素がある程
度連続する場合がある(たとえば、フアクシミリなどで
扱う2値の文書画像)。この連続した白画素、あるいは
黒画素を1次元方向に白あるいは黒の連続する画素のか
たまりを符号化の単位とするものである。このようにし
て、上記ステップS3で同色とみなせる画素をランとし
て抽出すると、その抽出したランを連結成分生成手段に
送り、ラン同士で接触していて、色の近いものをまとめ
て、連結成分として抽出する(ステップS4)。次いで、
この抽出された連結成分のうちの不要なものを排除する
ために連結成分選別手段に送り、不要な連結成分を排除
する(ステップS5)。次に、上記の不要な連結成分を除
去されて、必要となる連結成分のみを外接矩形統合手段
に入力して、この必要となる連結成分の外接矩形同士を
統合して(ステップS6)、文字行候補を生成する.次
に、上記文字行候補を文字判定手段により文字判定を行
い(ステップS7)、文字らしい特徴をもたないものを排
除する。この文字らしい特徴をもたないものを排除する
ことにより、文字らしい特徴を有する文字行候補のみを
文字領域出力手段に入れて、ステップS8で文字行の座
標値を出力する(請求項1、請求項11、請求項21に
対応する)。図2は、上記図1のフローチャートにした
がって、本発明による画像処理方法の第1の実施の形態
の処理手順に適用される各手段の構成を示すブロック図
である。この図2において、上記処理対象画像入力手段
101は、原画像を取得して格納しておく手段であり、
この処理対象画像入力手段101で格納された原画像の
データは、上記圧縮画像生成手段102と、上記文字判
定手段107に送出される。圧縮画像生成手段102
は、圧縮画像を生成して格納するとともに、上記ラン生
成手段103に送出する(請求項2、請求項12、請求
項22に対応する)。
【0037】圧縮画像生成手段102は、上記ラン生成
手段103、上記連結成分生成手段104、上記連結成
分選別手段105、上記外接矩形統合手段106、上記
文字判定手段107にそれぞれ出力する。ラン生成手段
103は、圧縮画像からランを生成する手段であり、生
成したランを上記連結成分生成手段104に送出する
(請求項3、請求項13、請求項23に対応する)。上記
連結成分生成手段104は、ランから連結成分を生成す
る手段であり、生成した連結成分は連結成分選別手段1
05に送出する(請求項4、請求項14、請求項24に
対応する)。連結成分選別手段105は、連結成分生成
手段104で得られた連結成分を選別して外接矩形統合
手段106に送出する。外接矩形統合手段106は、連
結成分選別手段105で得られた連結成分の外接矩形を
統合して、文字判定手段107に送出する。
【0038】文字判定手段107は、外接矩形統合手段
106で統合された外接矩形から文字行を判定して、上
記文字領域出力手段108に送出する。文字領域出力手
段108は、文字行と判定された座標を出力する手段で
ある(請求項11に対応)。次に、この図2で示す画像処
理装置の動作について図3以降に示すフローチャートに
沿って説明する。まず、最初に、処理したい原稿を処理
対象画像入力手段101で原画像(カラー)として取得す
る。この取得された元画像のデータは、処理対象画像入
力手段101から圧縮画像生成手段102および文字判
定手段107に送出する。圧縮画像生成手段102は、
図3に示すフローチャートに沿って処理を実行する。こ
の図3に示すフローチャートは、上記圧縮画像生成手段
102の処理手順を示すものである。圧縮画像生成手段
102は、原画像から圧縮画像を生成するが、この圧縮
画像は処理の高速化のため、およびある色が細かい点の
集合で表現されている場合の悪影響を防ぐために生成す
る。
【0039】この原画像を圧縮する際に、まずブロック
サイズを決定する(ステップS102a)。ここでいう
「ブロックサイズ」とは、圧縮画像を作成する際に、1
画素にまとめる原画像上の画素のかたまりのサイズであ
る。ここでは、原画像上の2×2画素を圧縮画像の1画
素にまとめるものとする。次に、ブロック内の画素の明
度を求め(ステップS102b)、次いで、最も暗い画素
値を抽出する(ステップS102c)。この際、ここで
は、背景に対して暗い色の文字を抽出する場合を考え
て、最も暗い画素を抽出した場合を例にしているが、こ
れとは逆に、背景に対して明るい色の文字を抽出する場
合には、ブロック内の最も明るい画素の値を抽出する。
もし、明るい文字も、暗い文字も抽出したい場合は、こ
の実施の形態の一連の処理を、明文字/暗文字の仮定だ
けを変えて再度抽出を行い、結果の論理和を取ることで
実現できる。上記のようにして抽出した暗い画素値を、
圧縮画像の該当画素の画素値として用ることとし(圧縮
画像画素値セット)、圧縮画像にこの値を書き込む(ス
テップS102d)。
【0040】以上のステップS102a〜ステップS1
02dの処理手順を繰り返し実行し、すべての画素に対
して吟味を行って(ステップS102e)、すべての画素
の吟味が終了すると、圧縮画像生成手段102による処
理が終了したことになり、次ぎの処理工程、すなわち、
図2に示したラン生成手段103による処理工程に移行
する。ラン生成手段103による処理工程は、図4に示
すフローチャートに沿って実行される。この図4は、ラ
ン生成手段103の処理手順を示すフローチャートであ
り、まず、ある行(たとえば、先頭行など)を注目行と
し、各画素をランデータとして登録する(ステップS1
03a)。次に、ランの統合を行う。この場合、左端の
ランを参照ランとする(ステップS103b)。次に、
その隣のランを注目ランとし(ステップS103c)、参
照ランと注目ランとを比較する(ステップS103d)。
この場合の比較の方法には、種々考えられるが、ここで
は、色のR(赤)、G(緑)、,B(青)各成分の差の2乗和
を色差として定義し、この色差が小さければ、色が近い
とする。
【0041】色差があらかじめ決められた閾値と比較し
(ステップS103e)、その比較の結果、色差が閾値以
下の場合には、ラン同士を統合して一つの長いランとし
て、登録し、この統合したランを新しい参照ランとする
(ステップS103f)。なお、統合したランの色は、統
合前の各ランの平均値、ランの長さによる加重平均値、
メジアン(median:複数のデータを昇順、または
降順に整列した際の中央に位置する値)などを用いるこ
とが考えられるが、ここでは、メジアンを用ることにす
る。一方、上記ステップS103eでの色差があらかじ
め決められた閾値と比較した結果、色差が閾値以下でな
い場合、すなわち色差が閾値より大きい場合、注目ラン
を新たな参照ランとする(ステップS103g)。上記の
ように、ステップS103fでの新定義による統合した
新しい参照ランと、ステップS103gでの新定義によ
る注目ランの新しい参照ランの右隣にランがあるか、否
かの吟味、すなわち判定をする(ステップS103h)。
【0042】この判定の結果、新しい参照ランの右隣に
ランがある場合には、このランを新しい注目ランとして
ステップS103cの処理に戻り、ランの統合を繰り返
す。
【0043】また、上記判定の結果、新しい参照ランの
右隣にランがない場合には、この行のランの統合が一通
り済んだことになる。ここまでで注目のランの統合は一
応できたことになるが、実際には、統合が不充分である
ことが多い。そこで、同じ行のラン統合を繰り返して行
い、ランがこれ以上統合できなくなるまで統合を繰り返
し、統合を完全なものにする。このために、ラン統合を
再度行うか吟味するために、ステップS103bの左端
のランを参照する処理からステップS103hの右端に
ランがあるか、否かの判定処理に至るまでの一連の処理
を実行した際、注目行のラン統合が1度でも行われた
か、否かを判定する(ステップS103i)。この判定の
結果、ランの統合が行われていないと判定した場合、す
なわち、ステップS103fにおける統合したランを新
しい参照ランとする処理が1度も実行されなかった場合
は、これ以上ランを統合する必要がないことになるので
(ステップS103j)、つまり、すべての行のランを抽
出したことになり、この行のラン統合をこれ以上繰り返
して行わない。
【0044】また、上記とは逆に、上記ステップS10
3iの判定処理において、ランの統合が行われていると
判定した場合には、再度ステップS103bの左端のラ
ンを参照する処理からステップS103iの処理工程を
実行し、再度統合処理を実行する。このようにして、ラ
ンの統合が完全に行われれると、この行のラン抽出が完
成したことになる。すべての行のランの抽出作業を行い
(ステップS103j)、この画像のラン抽出を終了
し、次工程である連結成分生成工程に移行する。なお、
すべての行のランの抽出作業が終了していない場合に
は、ステップS103iの処理工程から注目行を他行に
変更させて(ステップS103k)、再度ステップS1
03aの処理工程に処理手順を戻して、再び上記ステッ
プS103a〜ステップS103jの処理を繰り返し実
行する。次に、連結成分生成工程の説明を行う。図5
は、この連結成分生成工程の処理手順を示すフローチャ
ートである。
【0045】まず、図4のフローチャートにしたがって
実行されたラン生成処理工程により生成されたランデー
タを図2で示した連結成分生成手段104に入力して、
この連結成分生成手段104において、ランデータを連
結成分データとしてそのまま登録する(ステップS10
4a)。次に、この登録された連結成分データの中から
互いに接触する2つの連結成分データを抽出する(ステ
ップS104b)。次に、2つの連結成分データの色を
比較する。ここでは、ラン生成と同じ方法で色差を求
め、この求めた色差を閾値と比較する(ステップS10
4c)。この比較の結果、色差が閾値以下の場合には、
連結成分同士を統合して1つの連結成分とする(ステッ
プS104d)。連結成分にも色情報が必要であるが、
これもランの場合と同様とする(請求項5、請求項1
5、請求項25に対応する)。一方、色差と閾値との比
較の結果、色差が閾値以上の場合には、連結成分同士の
統合を行わず、処理工程をステップS104eに移行す
る。このステップS104eの処理では、すべての連結
成分の組み合せについて吟味し、すべての連結成分の組
み合せが吟味するまで繰り返し処理を実行する。
【0046】すなわち、すべての連結成分の組み合せが
終了するまで、ステップS104bの互いに抽出する2
つの連結成分の抽出処理工程からステップS104eの
すべての連結成分の組み合せを吟味するまでの処理工程
の実行を繰り返す。このようにして、すべての連結成分
の組み合せが完了すると、1回の連結成分統合が終了す
る。ここでも、ランの場合と同様に、1度統合しただけ
では不充分である場合が多いので、繰り返し統合を行う
(ステップS104f)。この場合、ランの場合に習っ
て、これ以上統合できなくなるまで処理を繰り返しても
良いが、ここでは高速化のために、あらかじめ定めてお
いた回数だけ統合を行うこととする。以上で連結成分生
成処理が終了する。次に、図2で示した連結成分選別手
段105による連結成分選別処理手順について図6を参
照して説明する。この図6は、連結成分選別処理手順を
示すフローチャートである。上記連結成分生成手段10
4による連結成分生成処理工程で得られた連結成分を1
つ選択する(ステップS105a)。
【0047】次に、この選択された1つの連結成分の大
きさを所定の大きさ以下であるか、否かの判定を行う。
すなわち吟味する(ステップS105b)。この判定の
結果、連結成分の大きさが所定の大きさ以下である場合
には、ステップS105cでノイズとみなして連結成分
データから削除する(請求項5、請求項15、請求項2
5に対応する)。また、ステップS105bにおける判
定の結果、1つの連結成分の大きさを所定の大きさ以上
であると判定した場合には、連結成分の明度と、周囲を
取り巻く画素の明度を比較する(ステップS105d)。
この際、背景に対して暗い文字を抽出しようとしている
場合は、連結成分が周囲より明るい場合は文字である可
能性が少ないことになる。そこで、連結成分より明るい
画素数を吟味し(ステップS105e)、この吟味の結
果、明るい画素数の割合が所定の割合より少ない場合に
は、文字でないとみなして連結データから削除する(ス
テップS105c)。なお、周囲より明るい文字を抽出
しようとしている場合には、連結成分より画素数をカウ
ントすれば良い。
【0048】このようにして、すべての連結成分の吟味
を終了すると(ステップS105f)、次の工程、すなわ
ち図2で示した外接矩形統合手段106による外接矩形
統合処理工程に移行する。図7は、この外接矩形統合処
理工程の処理手順を示すフローチャートであり、この図
7のフローチャートに沿って以下に外接矩形統合処理手
順について説明する。この外接矩形統合処理は、文字行
を抽出するための処理である。なお、ここでは、行方向
を横と仮定して説明する。まず、各連結成分の外接矩形
を求める(ステップS106a)。次いで、この求めた外
接矩形のうちの2つを選び(ステップS106b)、座
標値のうち、Y方向(縦方向)に重なっている部分の長さ
を調べる(ステップS106c)。この結果、Y方向に重
なっている部分が全くないか、あるいはY方向に重なっ
ている部分が少ない場合には、これらの外接矩形が同一
行を構成する要素とは考えにくいので、外接矩形同士の
統合は行わない。
【0049】また、ステップS106cでの外接矩形の
Y方向に重なっている部分の長さが大きい場合は、外接
矩形の高さ等を参考にしてX方向の統合する矩形間距離
最大値(X距離限界値)を求める(ステップS106
d)。ここでの外接矩形の高さ等を参考にする理由は、
高さの高い文字であれば、隣接する文字との距離も長く
なる傾向であることを考慮したためである。具体的に
は、外接矩形高さをそのままX距離限界値に設定するこ
とが考えられる。注目している2つの外接矩形のX方向
の距離とX距離限界値を比較し(ステップS106e)、
この比較の結果、外接矩形のX方向の距離がX距離限界
値より大きい場合であると判定した場合は、同一行構成
要素でないとみなして統合を行わない。次に、2つの外
接矩形の色差を所定値以上であるか、否かの吟味を行う
(ステップS106f)。この吟味の結果、2つの外接矩
形の色差が所定値以上である場合には、異なる行の文字
とみなして、統合を行わない。
【0050】次に、これらの条件をクリアした外接矩形
は、同一行を構成する要素であるとみなして、2つの外
接矩形を新しい外接矩形として登録する(ステップS1
06g)。矩形情報として色情報も必要になるが、これ
は各外接矩形の色情報を基に決定する。この場合、ラン
の場合と同様に、様々な方法が考えられるが、ここでメ
ジアンを用いることにする。このようにして、次々に外
接矩形を吟味して(ステップS106h)、すべての外
接矩形の吟味が終了すると、今度は図2で示した文字判
定手段107による文字判定処理工程に移行する(請求
項6、請求項16、請求項26に対応する)。次に、こ
の文字判定処理工程について説明する。図8は、この文
字判定処理手順を示すフローチャートであり、この文字
判定処理工程は、上記図7で説明した外接矩形統合処理
手順により得られた文字行候補(すなわち、外接矩形)
の中から、本当に文字行であるものだけを選び出す工程
である。
【0051】次に、この図8のフローチャートに沿って
説明する。まず、外接矩形を一つ選択する(ステップS
107a)。次に選択した外接矩形の矩形の高さを吟味
する(ステップS107b)。この吟味の結果、外接矩形
の矩形の高さが所定以上に高すぎるものは文字でないと
ステップS107cで判定する(請求項7、請求項1
7、請求項27に対応する)。次に、ステップS107
bでの選択した外接矩形の矩形の高さが所定値以下であ
ると判定した場合には、外接部分の色情報と周囲の色情
報を比較し(ステップS107d)、その比較の結果、
上記連結成分選別の場合と同様に、背景より暗い文字を
抽出する場合においては、周囲が外接矩形より暗い場合
には(ステップS107e)、文字行でないとみなす(ス
テップS107c)。また、背景より明るい文字を抽出
する場合は、上記とは逆の条件となる(請求項8、請求
項18、請求項28に対応する)。次に、外接矩形内の
エッジ強度が強い画素数を数える(ステップS107
f)。この実施の形態では、エッジ強度の判定は原画像
上で行う。その方法は、種々考えられるが、一例とし
て、3×3がその形状と図9、図10に示す係数を持つ
空間フィルタをエッジ強度を測りたい画素を中心にして
個別に施し、それらの2乗和をもってエッジ強度とする
方法などが考えられる(請求項9、請求項19、請求項
29に対応する)。
【0052】さて、上記ステップS107fで得られた
エッジ強度の強い画素数の矩形内の全画素数に対する比
率が所定値より小さい場合は(ステップS107g)、文
字でないと判定する。次に、矩形内の画像を2値化する
(ステップS107h)。2値化の方法には、閾値を固定
で決めておく方法、判別分析方法(「コンピュータビジ
ョン」第4章・丸善・谷内田正彦編を参照)などが考え
られる。ここでは、判別分析法{上記著書に記載されて
いる内容の概略を転記すると、「画像の2値化問題は、
画像をパターン領域(クラス1)と背景領域(クラス2)
の2クラスに分けることであるとし、濃度とヒストグラ
ムを用いて最もクラス分離の良い濃度閾値を与えるよう
とするものである。」}を用ることにする。さて、判別
分析法で2値化した画像から連結成分の抽出を行い、そ
の外接矩形を求める(ステップS107i)。ここで求め
た外接矩形のうち、文字らしくない形状の矩形がある
か、否かの判定を行い(ステップS107j)、その判定
の結果、文字らしくない形状の矩形がある場合には、文
字らしくない形状の矩形を排除する(ステップS107
c)。
【0053】ここで、文字らしくない形状の矩形とは、
たとえば、縦横比が極端に横長や、縦長の形状の矩形、
あるいは非常に小さい矩形等が該当する(請求項10、
請求項20、請求項30に対応する)。このような縦横
比の割合が小さい場合は、注目している外接矩形は、文
字行でないとみなす。また、上記ステップS107jで
の安定の結果、文字らしい形状の外接矩形が少なくない
と判定された場合には、この外接矩形は文字であると判
定され(ステップS107k)れる。このようにして、す
べての外接矩形に対して上記ステップS107a〜ステ
ップS107kの処理を繰り返し実行して、すべての外
接矩形が文字であると判定すると(ステップS107
m)、図2で示した文字領域出力手段108に出力して
結果を出力することになる。次に、本発明の第2の実施
の形態について説明する。図11は、この第2の実施の
形態の構成を示すブロック図である。この実施の形態
は、上記請求項21〜請求項30に対応し、画像処理方
法を実現するプログラムを記録媒体に記録および読み取
り可能な汎用の処理装置の構成を示している。
【0054】この図11において、CPU401、メモ
リ402、ハードディスク403、入力装置404、C
D―ROMドライブ405、ディスプレイ406、CD
―ROM等の記録媒体407などから構成され、これら
は相互にデータバス408で接続されている。CD―R
OM等の記録媒体407には、本発明の文字領域抽出の
「処理機能や本発明の画像処理方法を実行するプログラ
ムが記録されている。また、処理対象の原画像は、たと
えば、ハードディスク403などに格納されている。C
PU401は、記録媒体407に記録されている上記処
理機能や処理手順を実現するプログラムを読み出して実
行し、文字領域抽出の結果をディプレイ406などに出
力する(請求項21〜請求項30に対応する)。なお、本
発明は、上述し、かつ図面に示す実施の形態にのみ限定
されることなく、その要旨を変更しない範囲内で種々変
形して実施することができる。
【0055】
【発明の効果】以上述べたように、本発明によれば、文
字および文字以外の画像を含む処理対象となる画像から
多値画像を取得し、上記多値画像から圧縮画像を生成
し、上記圧縮画像から同色とみなせる画素をランとして
抽出し、上記ランを統合して連結成分を生成し、上記連
結成分のうち不要なものを排除し、上記連結成分の外接
矩形を統合し、上記統合された外接矩形から文字らしい
ものを判定し、上記文字らしい情報から文字領域を出力
することにより、カラー文書画像から正確に文字領域を
抽出することができる画像処理方法、画像処理装置およ
び画像処理方法をコンピュータに実行させるプログラム
を記録したコンピュータ読み取り可能な記録媒体を提供
することが可能となり、特に、請求項1に記載の発明に
よれば、直接、カラー画像の画素情報を用いることによ
り、カラー文書から正確に文字領域の抽出を可能とし、
高い認識精度を得ることが可能となる。
【0056】本発明の請求項2の画像処理方法によれ
ば、上記第2ステップが、圧縮するブロックサイズを決
定するステップと、ブロック内の全画素の明度値を求め
るステップと、背景に対して明るい文字を抽出する場合
は最も明度の低い画素値を選択するステップと、上記背
景に対して明るい文字を抽出する場合には、最も明度の
高い画素値を選択するステップと、上記選択された画素
値を圧縮画素値として使用するステップとを備えること
により、決定した圧縮するブロックサイズ内の全画素の
明度値を求めて背景に対して明るい文字を抽出する場合
は最も明度の低い画素値を選択するとともに、背景に対
して明るい文字を抽出する場合には、最も明度の高い画
素値を選択して、選択された画素値を圧縮画素値として
使用することができるので、特に、背景が暗くても、あ
るいは明るくても画素値を圧縮画像の画素として使用す
ることが可能となる。本発明の請求項3の画像処理方法
は、上記第3ステップが、各画素をランデータとして登
録するステップと、隣接するランを選択するステップ
と、上記隣接するランの色差を求めるステップと、上記
色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップとを備えること
により、各画素をランデータとして登録後、隣接するラ
ンを選択して、隣接するランの色差が小さい場合にはラ
ンを統合して、1ラインのラン統合を繰り返すことがで
きるので、特に、同色とみなせる画素をランとして抽出
して、1ラインのラン統合を確実に行うことが可能とな
る。
【0057】本発明の請求項4の画像処理方法によれ
ば、上記第4ステップが、上記ランデータを連結成分デ
ータとして登録するステップと、互いに接触する2つの
連結成分を抽出するステップと、上記2つの連結成分の
色差を算出するステップと、上記色差があらかじめ定め
た値より小さい場合には、連結成分を統合するステップ
と、連結成分の統合を繰り返すステップとを備えること
により、各画素をランデータとして登録後、隣接するラ
ンを選択して、隣接ランの色差が小さい場合にはランを
統合して、1ラインのラン統合を繰り返すことができる
ので、特に、互いに接触する2つの連結成分を正確に生
成することが可能となる。本発明の請求項5の画像処理
方法によれば、上記第5ステップが、上記連結成分の大
きさがあらかじめ定めた値より小さい場合に連結成分デ
ータから削除するステップと、上記連結成分の明度と周
囲の画素の明度とを比較するステップと、上記比較の結
果を用いて不要な連結成分データを削除するステップと
を備えることにより、連結成分の大きさがあらかじめ定
めた値より小さい場合に連結成分データから不要な成分
を削除して連結成分の明度が周囲の画素の明度との対比
から不要な連結成分データを削除することができるの
で、特に、連結成分の不要な部分を除去でき、より正確
に連結成分を生成することが可能となる。
【0058】本発明の請求項6の画像処理方法によれ
ば、上記第6ステップが、各連結矩形の外接矩形を求め
るステップと、上記外接矩形を2つ選択するステップ
と、上記選択された外接矩形の高さ方向の座標値の差異
を求めるステップと、上記外接矩形の高さから幅方向の
距離限界値を求めるステップと、上記外接矩形間の幅方
向の座標値の差異と上記距離限界値を比較するステップ
と、上記外接矩形間の色差を算出するステップと、上記
高さ方向の座標値の差異、幅方向の座標値の差異、距離
限界値、色差を用いて上記外接矩形の統合の可否を決定
するステップと、上記外接矩形を統合する場合には双方
の外接矩形に外接矩形を新たな外接矩形として一つに登
録し直すステップとを備えることにより、各連結矩形の
外接矩形を2つ選択し、選択された外接矩形の高さ方向
の座標値の差異を求めるとともに、外接矩形の高さから
幅方向の距離限界値を求め、外接矩形間の幅方向の座標
値の差異と距離限界値を比較して外接矩形間の色差を算
出し、高さ方向の座標値の差異、幅方向の座標値の差
異、距離限界値、色差を用いて外接矩形の統合の可否を
決定し、外接矩形を統合する場合には双方の外接矩形に
外接矩形を新たな外接矩形として一つに登録し直すこと
ができるので、特に、連結成分の外接矩形を確実に統合
することが可能となる。
【0059】本発明の請求項7の画像処理方法によれ
ば、上記第7ステップが、上記外接矩形の高さが所定範
囲外の場合には、文字でないと判断するステップを備え
ることにより、外接矩形の高さが所定範囲外の場合に
は、文字でないと判断することができるので、特に、統
合された外接矩形の高さが所定範囲外の場合には、統合
された外接矩形から文字らしいものを判定せず、必要と
する文字らしい文字の判定精度を向上することが可能と
なる。本発明の請求項8の画像処理方法によれば、上記
第7ステップが、上記外接矩形の色情報と周囲の画素の
色情報を比較し、抽出対象の文字色との整合がとれない
場合には、文字でないと判断するステップを備えること
により、外接矩形の色情報と周囲の画素の色情報を比較
して抽出対象の文字色との整合がとれない場合には、文
字でないと判断することができるので、特に、抽出対象
の文字色の整合が取れない場合には、文字でないと判定
して統合された外接矩形から文字らしいもののみをより
高精度に判定することが可能となる。
【0060】本発明の請求項9の画像処理方法によれ
ば、上記第7ステップが、外接矩形内のエッジ強度を測
定するステップと、エッジ強度が強い画素数が少ししか
存在しない場合には、文字でないと判断するステップを
備えることにより、外接矩形内のエッジ強度を測定し、
エッジ強度が強い画素数が少ししか存在しない場合に
は、文字でないと判断することができるので、特に、外
接矩形内のエッジ強度の強い画素数が少数しか存在しな
い場合に文字でないと判定して統合された外接矩形から
文字らしいもののみをより高精度に判定することが可能
となる。本発明の請求項10の画像処理方法によれば、
上記第7ステップが、外接矩形内の画像を2値化するス
テップと、上記2値化された画像の連結成分を求めるス
テップと、上記連結成分の外接矩形を求めるステップ
と、上記求められた外接矩形のうちで文字らしい形状の
矩形数が少ない場合には、文字でないと判断するステッ
プとを備えることにより、2値化された外接矩形内の画
像の連結成分を求めて、連結成分の外接矩形を求め、そ
の外接矩形のうちで文字らしい形状の矩形数が少ない場
合には、文字でないと判断することができるので、特
に、2値化された画像の連結成分の外接矩形中で、文字
らしい形状の矩形数が少ない場合に文字でないと判断し
て、統合された外接矩形から文字らしいもののみをより
高精度に判定することが可能となる。
【0061】本発明の請求項11のる画像処理装置によ
れば、文字および文字以外の画像を含む処理対象となる
画像から多値画像を取得する手段と、上記多値画像から
圧縮画像を生成する手段と、上記圧縮画像から同色とみ
なせる画素をランとして抽出する手段と、上記ランを統
合して連結成分を生成する手段と、上記連結成分のうち
不要なものを排除する手段と、上記連結成分の外接矩形
を統合する手段と、上記統合された外接矩形から文字ら
しいものを判定する手段と、上記文字らしい情報から文
字領域を出力する手段とを備えることにより、文字およ
び文字以外の画像を含む処理対象となる画像から多値画
像を取得し、その多値画像から圧縮画像を生成し、圧縮
画像から同色とみなせる画素をランとして抽出するとと
もに、ランを統合して連結成分を生成し、連結成分のう
ち不要なものを排除して、連結成分の外接矩形を統合し
た後、外接矩形から文字らしいものを判定して、文字ら
しい情報から文字領域を出力することができるので、特
に、直接カラー画像の画素情報を用いることにより、カ
ラー文書から正確に文字領域の抽出を可能とし、高い認
識精度を得ることが可能となる。
【0062】本発明の請求項12の画像処理装置によれ
ば、上記圧縮画像を生成する手段が、圧縮するブロック
サイズを決定する手段と、ブロック内の全画素の明度値
を求める手段と、背景に対して暗い文字を抽出する場合
は最も明度の低い画素値を選択する手段と、背景に対し
て明るい文字を抽出する場合は最も明度の高い画素値を
選択する手段と、上記選択された画素値を圧縮画像の画
素値として使用する手段とを備えることにより、圧縮す
るブロックサイズを決定し、ブロック内の全画素の明度
値を求めることにより、背景に対して暗い文字を抽出す
る場合は最も明度の低い画素値を選択し、背景に対して
明るい文字を抽出する場合は最も明度の高い画素値を選
択し、その選択された画素値を圧縮画像の画素値として
使用することができるので、特に、背景が暗くても、あ
るいは明るくても画素値を圧縮画像の画素として使用す
ることが可能となる。本発明の請求項13の画像処理装
置によれば、上記同色とみなせる画素をランとして抽出
する手段が、各画素をランデータとして登録する手段
と、隣接するランを選択する手段と、隣接するランの色
差を求める手段と、上記色差が小さい場合は上記ランを
統合する手段と、1ラインのラン統合を繰り返す手段と
を備えることにより、各画素をランデータとして登録
後、隣接するランを選択し、その隣接するランの色差を
求めて、色差が小さい場合はランを統合して1ラインの
ラン統合を繰り返すことができるので、特に、同色とみ
なせる画素をランとして抽出して、1ラインのラン統合
を確実に行うことが可能となる。
【0063】本発明の請求項14の画像処理装置によれ
ば、上記連結成分を生成する手段が、上記ランデータを
連結成分データとして登録する手段と、互いに接触する
2つの連結成分を抽出する手段と、色差があらかじめ定
めた値より小さい場合には、連結成分を統合する手段
と、上記連結成分の統合を繰り返す手段とを備えるこに
より、ランデータを連結成分データとして登録後、互い
に接触する2つの連結成分を抽出し、その連結成分の色
差があらかじめ定めた値より小さい場合には、連結成分
を統合し、連結成分の統合を繰り返すことができるの
で、特に、互いに接触する2つの連結成分を正確に生成
することが可能となる。本発明の請求項15の画像処理
装置によれば、上記連結成分のうち不要なものを排除す
る手段が、上記連結成分の大きさが予め定めた値より小
さい場合に連結成分データから削除する手段と、連結成
分の明度と周囲の画素の明度とを比較する手段と、上記
比較の結果を用いて不要な連結成分データを削除する手
段とを備えることにより、連結成分の大きさが予め定め
た値より小さい場合に連結成分データから不要成分を削
除し、連結成分の明度と周囲の画素の明度とを比較し、
その比較の結果を用いて不要な連結成分データを削除す
ることができるので、特に、連結成分の不要な部分を除
去でき、より正確に連結成分を生成することが可能とな
る。
【0064】本発明の請求項16の画像処理装置によれ
ば、上記連結成分の外接矩形を統合する手段が、各連結
矩形の外接矩形を求める手段と、上記外接矩形を2つ選
択する手段と、上記選択された外接矩形の高さ方向の座
標値の差異を求める手段と、上記外接矩形の高さから幅
方向の距離限界値を求める手段と、外接矩形間の幅方向
の座標値の差異と上記距離限界値とを比較する手段と、
上記外接矩形間の色差を算出する手段と、上記高さ方向
の座標値の差異、幅方向の座標値の差異、上記距離限界
値、上記色差を用いて上記外接矩形の統合の可否を決定
する手段と、上記外接矩形の統合を決定する場合には、
双方の外接矩形に外接する矩形を新たな外接矩形として
一つに登録し直す手段とを備えることにより、各連結矩
形の外接矩形を求めて外接矩形を2つ選択し、選択され
た外接矩形の高さ方向の座標値の差異を求め、外接矩形
の高さから幅方向の距離限界値を求め、外接矩形間の幅
方向の座標値の差異と距離限界値とを比較し、外接矩形
間の色差を算出し、高さ方向の座標値の差異、幅方向の
座標値の差異、距離限界値、色差を用いて外接矩形の統
合の可否を決定し、外接矩形の統合を決定する場合に
は、双方の外接矩形に外接する矩形を新たな外接矩形と
して一つに登録し直すことができるので、特に、連結成
分の外接矩形を確実に統合することが可能となる。
【0065】本発明の請求項17の画像処理装置によれ
ば、上記統合された外接矩形から文字らしいものを判定
する手段が、外接矩形の高さが所定範囲外の場合は文字
でないと判断する手段を備えることにより、外接矩形の
高さが所定範囲外の場合は文字でないと判断することが
できるので、特に、統合された外接矩形の高さが所定範
囲外の場合には、統合された外接矩形から文字らしいも
のを判定せず、必要とする文字らしい文字の判定精度を
向上することが可能となる。本発明の請求項18の画像
処理装置によれば、上記統合された外接矩形から文字ら
しいものを判定する手段が、外接矩形の色情報と、周囲
の画素の色情報とを比較し、抽出対象の文字色との整合
が採れない場合には文字でないと判断する手段を備える
ことにより、外接矩形の色情報と、周囲の画素の色情報
とを比較し、抽出対象の文字色との整合が採れない場合
には文字でないと判断することができるので、特に、抽
出対象の文字色の整合が取れない場合には、文字でない
と判定して統合された外接矩形から文字らしいもののみ
をより高精度に判定することが可能となる。
【0066】本発明の請求項19のる画像処理装置によ
れば、上記統合された外接矩形から文字らしいものを判
定する手段が、外接矩形内のエッジ強度を測定する手段
と、エッジ強度の強い画素数が少数しか存在しない場合
に文字でないと判断する手段とを備えることにより、外
接矩形内のエッジ強度を測定し、エッジ強度の強い画素
数が少数しか存在しない場合に文字でないと判断するこ
とができるので、特に、外接矩形内のエッジ強度の強い
画素数が少数しか存在しない場合に文字でないと判定し
て統合された外接矩形から文字らしいもののみをより高
精度に判定することが可能となる。本発明の請求項20
による画像処理装置は、上記統合された外接矩形から文
字らしいものを判定する手段は、上記矩形内の画像を2
値化する手段と、上記2値化された画像の連結成分を求
める手段と、上記連結成分の外接矩形を求める手段と、
求めた外接矩形のうちで文字らしい形状の矩形数が少な
い場合には文字でないと判断する手段とを備えることに
より、矩形内の画像を2値化し、その2値化された画像
の連結成分を求め、その求めた連結成分の外接矩形を求
め、その外接矩形のうちで文字らしい形状の矩形数が少
ない場合には文字でないと判断することができるので、
特に、2値化された画像の連結成分の外接矩形中で、文
字らしい形状の矩形数が少ない場合に文字でないと判断
して、統合された外接矩形から文字らしいもののみをよ
り高精度に判定することが可能となる。
【0067】本発明の請求項21の画像処理方法を実現
するプログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、文字および文字以外の画像を含む処
理対象となる画像から多値画像を取得する第1ステップ
と、上記多値画像から圧縮画像を生成する第2ステップ
と、上記圧縮画像から同色とみなせる画素をランとして
抽出する第3ステップと、上記ランを統合して連結成分
を生成する第4ステップと、上記連結成分のうち不要な
ものを排除する第5ステップと、上記連結成分の外接矩
形を統合する第6ステップと、上記統合された外接矩形
から文字らしいものを判定する第7ステップと、上記文
字らしい情報から文字領域を出力する第8ステップとを
備えることにより、文字および文字以外の画像を含む処
理対象となる画像から多値画像を取得した多値画像から
圧縮画像を生成し、圧縮画像から同色とみなせる画素を
ランとして抽出し、ランを統合して連結成分を生成し、
その連結成分のうち不要なものを排除し、連結成分の外
接矩形を統合し、統合された外接矩形から文字らしいも
のを判定し、上記文字らしい情報から文字領域を出力す
ることができるので、特に、直接カラー画像の画素情報
を用いることにより、カラー文書から正確に文字領域の
抽出を可能とし、高い認識精度を得ることが可能とな
る。
【0068】本発明の請求項22の画像処理方法を実現
するプログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、上記第2ステップが、圧縮するブロ
ックサイズを決定するステップと、ブロック内の全画素
の明度値を求めるステップと、背景に対して明るい文字
を抽出する場合は最も明度の低い画素値を選択するステ
ップと、上記背景に対して明るい文字を抽出する場合に
は、最も明度の高い画素値を選択するステップと、上記
選択された画素値を圧縮画素値として使用するステップ
とを備えることにより、圧縮するブロックサイズを決定
し、その決定されたブロック内の全画素の明度値を求
め、背景に対して明るい文字を抽出する場合は最も明度
の低い画素値を選択し、背景に対して明るい文字を抽出
する場合には、最も明度の高い画素値を選択し、選択さ
れた画素値を圧縮画素値として使用することができるの
で、特に、背景が暗くても、あるいは明るくても画素値
を圧縮画像の画素として使用することができる画像処理
方法を実現すること可能となる。
【0069】本発明の請求項23の画像処理方法を実現
するプログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、上記第3ステップが、各画素をラン
データとして登録するステップと、隣接するランを選択
するステップと、上記隣接するランの色差を求めるステ
ップと、上記色差が小さい場合には上記ランを統合する
ステップと、1ラインのラン統合を繰り返すステップと
を備えることにより、各画素をランデータとして登録し
て、隣接するランを選択し、その隣接するランの色差を
求め、色差が小さい場合にはランを統合し、1ラインの
ラン統合を繰り返すことができるので、特に、同色とみ
なせる画素をランとして抽出して、1ラインのラン統合
を確実に行うことができる画像処理方法を実現すること
が可能となる。本発明の請求項24の画像処理方法を実
現するプログラムを記録したコンピュータ読み取り可能
な記録媒体によれば、上記第4ステップが、上記ランデ
ータを連結成分データとして登録するステップと、互い
に接触する2つの連結成分を抽出するステップと、上記
2つの連結成分の色差を算出するステップと、上記色差
があらかじめ定めた値より小さい場合には、連結成分を
統合するステップと、連結成分の統合を繰り返すステッ
プとを備えることにより、ランデータを連結成分データ
として登録し、互いに接触する2つの連結成分を抽出
し、2つの連結成分の色差を算出してその算出した色差
があらかじめ定めた値より小さい場合には、連結成分を
統合するとともに、連結成分の統合を繰り返すことがで
きるので、特に、互いに接触する2つの連結成分を正確
に生成することが可能となる。
【0070】本発明の請求項25の画像処理方法を実現
するプログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、上記第5ステップは、上記連結成分
の大きさがあらかじめ定めた値より小さい場合に連結成
分データから削除するステップと、上記連結成分の明度
と周囲の画素の明度とを比較するステップと、上記比較
の結果を用いて不要な連結成分データを削除するステッ
プとを備えることにより、連結成分の大きさがあらかじ
め定めた値より小さい場合に連結成分データから削除
し、連結成分の明度と周囲の画素の明度との比較の結果
を用いて不要な連結成分データを削除することができる
ので、特に、連結成分の不要な部分を除去でき、より正
確に連結成分を生成することが可能となる。本発明の請
求項26の画像処理方法を実現するプログラムを記録し
たコンピュータ読み取り可能な記録媒体によれば、上記
第6ステップが、各連結矩形の外接矩形を求めるステッ
プと、上記外接矩形を2つ選択するステップと、上記選
択された外接矩形の高さ方向の座標値の差異を求めるス
テップと、上記外接矩形の高さから幅方向の距離限界値
を求めるステップと、上記外接矩形間の幅方向の座標値
の差異と上記距離限界値を比較するステップと、上記外
接矩形間の色差を算出するステップと、上記高さ方向の
座標値の差異、幅方向の座標値の差異、距離限界値、色
差を用いて上記外接矩形の統合の可否を決定するステッ
プと、上記外接矩形を統合する場合には双方の外接矩形
に外接矩形を新たな外接矩形として一つに登録し直すス
テップとを備えることにより、各連結矩形の外接矩形を
求めて外接矩形を2つ選択し、その選択された外接矩形
の高さ方向の座標値の差異を求め、外接矩形の高さから
幅方向の距離限界値を求め、外接矩形間の幅方向の座標
値の差異と距離限界値を比較し、外接矩形間の色差を算
出し、高さ方向の座標値の差異、幅方向の座標値の差
異、距離限界値、色差を用いて外接矩形の統合の可否を
決定するとともに、外接矩形を統合する場合には双方の
外接矩形に外接矩形を新たな外接矩形として一つに登録
し直すことができるので、特に、連結成分の不要な部分
を除去でき、より正確に連結成分を生成することが可能
となる。
【0071】本発明の請求項27の画像処理方法を実現
するプログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、上記第7ステップが、上記外接矩形
の高さが所定範囲外の場合には、文字でないと判断する
ステップを備えることにより、外接矩形の高さが所定範
囲外の場合には、文字でないと判断することができるの
で、特に、統合された外接矩形の高さが所定範囲外の場
合には、統合された外接矩形から文字らしいものを判定
せず、必要とする文字らしい文字の判定精度を向上する
ことが可能となる。本発明の請求項28の画像処理方法
を実現するプログラムを記録したコンピュータ読み取り
可能な記録媒体によれば、上記第7ステップが、外接矩
形の色情報と周囲の画素の色情報を比較し、抽出対象の
文字色との整合がとれない場合には、文字でないと判断
するステップを備えるこにより、外接矩形の色情報と周
囲の画素の色情報を比較し、抽出対象の文字色との整合
がとれない場合には、文字でないと判断することができ
るので、特に、抽出対象の文字色の整合が取れない場合
には、文字でないと判定して統合された外接矩形から文
字らしいもののみをより高精度に判定することが可能と
なる。
【0072】本発明の請求項29のる画像処理方法を実
現するプログラムを記録したコンピュータ読み取り可能
な記録媒体によれば、上記第7ステップが、外接矩形内
のエッジ強度を測定するステップと、エッジ強度が強い
画素数が少ししか存在しない場合には、文字でないと判
断するステップを備えることにより、外接矩形内のエッ
ジ強度を測定し、エッジ強度が強い画素数が少ししか存
在しない場合には、文字でないと判断することができる
ので、特に、外接矩形内のエッジ強度が強い画素数が少
数しか存在しない場合に文字でないと判定して統合され
た外接矩形から文字らしいもののみをより高精度に判定
することが可能となる。本発明の請求項30の画像処理
方法を実現するプログラムを記録したコンピュータ読み
取り可能な記録媒体によれば、上記第7ステップが、外
接矩形内の画像を2値化するステップと、上記2値化さ
れた画像の連結成分を求めるステップと、上記連結成分
の外接矩形を求めるステップと、上記求められた外接矩
形のうちで文字らしい形状の矩形数が少ない場合には、
文字でないと判断するステップとを備えることにより、
外接矩形内の画像を2値化して、その2値化された画像
の連結成分を求め、連結成分の外接矩形を求めるととも
に、求められた外接矩形のうちで文字らしい形状の矩形
数が少ない場合には、文字でないと判断することができ
るので、特に、2値化された画像の連結成分の外接矩形
中で、文字らしい形状の矩形数が少ない場合に文字でな
いと判断して、統合された外接矩形から文字らしいもの
のみをより高精度に判定することができる。
【図面の簡単な説明】
【図1】本発明による画像処理方法の第1実施の形態の
画像処理手順を示すフローチャートである。
【図2】本発明による画像処理装置の第1実施の形態の
構成を示すブロック図である。
【図3】図2の画像処理装置における圧縮画像生成手段
による圧縮画像生成処理手順を説明するためのフローチ
ャートである。
【図4】図2の画像処理装置におけるラン生成手段によ
るラン生成処理手順を説明するためのフローチャートで
ある。
【図5】図2の画像処理装置における連結成分生成手段
による連結成分生成処理手順を説明するためのフローチ
ャートである。
【図6】図2の画像処理装置における連結成分選別手段
による連結成分選別生成処理手順を説明するためのフロ
ーチャートである。
【図7】図2の画像処理装置における外接矩形統合手段
による外接矩形統合処理手順を説明するためのフローチ
ャートである。
【図8】図2の画像処理装置における文字判定手段によ
る文字判定処理手順を説明するためのフローチャートで
ある
【図9】本発明の画像処理方法による外接矩形内のエッ
ジ強度の判定方法に適用される空間フィルタを示す説明
図である。
【図10】本発明の画像処理方法による外接矩形内のエ
ッジ強度の判定方法に適用される空間フィルタを示す説
明図である。
【図11】本発明の画像処理方法を実現するプログラム
を記録したコンピュータ読み取り可能なことを特徴とす
る記録媒体に記録されているプログラムを読み出してプ
ログラムを実行する処理装置の構成を示すブロック図で
ある。
【符号の説明】
101 処理対象画像入力手段 102 圧縮画像生成手段 103 ラン生成手段 104 連結成分生成手段 105 連結成分選別手段 106 外接矩形統合手段 107 文字判定手段 108 文字領域出力手段 401 CPU 402 メモリ 403 ハードディスク 404 入力装置 405 CD−ROMドライブ 406 ディスプレイ 407 CD−ROM 408 データバス
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06T 7/60 180 G06T 7/60 180A 200 200D H04N 1/40 H04N 1/40 F

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 文字および文字以外の画像を含む処理対
    象となる画像から多値画像を取得する第1ステップと、 上記多値画像から圧縮画像を生成する第2ステップと、 上記圧縮画像から同色とみなせる画素をランとして抽出
    する第3ステップと、 上記ランを統合して連結成分を生成する第4ステップ
    と、 上記連結成分のうち不要なものを排除する第5ステップ
    と、 上記連結成分の外接矩形を統合する第6ステップと、 上記統合された外接矩形から文字らしいものを判定する
    第7ステップと、 上記文字らしい情報から文字領域を出力する第8ステッ
    プと、を備えることを特徴とする画像処理方法。
  2. 【請求項2】 上記第2ステップは、 圧縮するブロックサイズを決定するステップと、 ブロック内の全画素の明度値を求めるステップと、 背景に対して暗い文字を抽出する場合は最も明度の低い
    画素値を選択するステップと、 上記背景に対して明るい文字を抽出する場合には、最も
    明度の高い画素値を選択するステップと、 上記選択された画素値を圧縮画像の画素値として使用す
    るステップと、を備えることを特徴とする請求項1記載
    の画像処理方法。
  3. 【請求項3】 上記第3ステップは、 各画素をランデータとして登録するステップと、 隣接するランを選択するステップと、 上記隣接するランの色差を求めるステップと、 上記色差が小さい場合には上記ランを統合するステップ
    と、 1ラインのラン統合を繰り返すステップと、を備えるこ
    とを特徴とする請求項1記載の画像処理方法。
  4. 【請求項4】 上記第4ステップは、 上記ランデータを連結成分データとして登録するステッ
    プと、 互いに接触する2つの連結成分を抽出するステップと、 上記2つの連結成分の色差を算出するステップと、 上記色差があらかじめ定めた値より小さい場合には、連
    結成分を統合するステップと、 連結成分の統合を繰り返すステップと、を備えることを
    特徴とする請求項1記載の画像処理方法。
  5. 【請求項5】 上記第5ステップは、 上記連結成分の大きさがあらかじめ定めた値より小さい
    場合に連結成分データから不要な成分を削除するステッ
    プと、 上記連結成分の明度と周囲の画素の明度とを比較するス
    テップと、 上記比較の結果を用いて不要な連結成分データを削除す
    るステップと、を備えることを特徴とする請求項1記載
    の画像処理方法。
  6. 【請求項6】 上記第6ステップは、 各連結矩形の外接矩形を求めるステップと、 上記外接矩形を2つ選択するステップと、 上記選択された外接矩形の高さ方向の座標値の差異を求
    めるステップと、 上記外接矩形の高さから幅方向の距離限界値を求めるス
    テップと、 上記外接矩形間の幅方向の座標値の差異と上記距離限界
    値を比較するステップと、 上記外接矩形間の色差を算出するステップと、 上記高さ方向の座標値の差異、幅方向の座標値の差異、
    距離限界値、色差を用いて上記外接矩形の統合の可否を
    決定するステップと、 上記外接矩形を統合する場合には双方の外接矩形に外接
    する矩形を新たな外接矩形として一つに登録し直すステ
    ップと、を備えることを特徴とする請求項1記載の画像
    処理方法。
  7. 【請求項7】 上記上記第7ステップは、 上記外接矩形の高さが所定範囲外の場合には、文字でな
    いと判断するステップを備えることを特徴とする請求項
    1記載の画像処理方法。
  8. 【請求項8】 上記第7ステップは、 外接矩形の色情報と周囲の画素の色情報を比較し、抽出
    対象の文字色との整合がとれない場合には、文字でない
    と判断するステップを備えることを特徴とする請求項1
    記載の画像処理方法。
  9. 【請求項9】 上記第7ステップは、 外接矩形内のエッジ強度を測定するステップと、 エッジ強度が強い画素数が少ししか存在しない場合に
    は、文字でないと判断するステップを備えることを特徴
    とする請求項1記載の画像処理方法。
  10. 【請求項10】 上記第7ステップは、 外接矩形内の画像を2値化するステップと、 上記2値化された画像の連結成分を求めるステップと、 上記連結成分の外接矩形を求めるステップと、 上記求められた外接矩形のうちで文字らしい形状の矩形
    数が少ない場合には、文字でないと判断するステップ
    と、を備えることを特徴とする請求項1記載の画像処理
    方法。
  11. 【請求項11】 文字および文字以外の画像を含む処理
    対象となる画像から多値画像を取得する手段と、 上記多値画像から圧縮画像を生成する手段と、 上記圧縮画像から同色とみなせる画素をランとして抽出
    する手段と、 上記ランを統合して連結成分を生成する手段と、 上記連結成分のうち不要なものを排除する手段と、 上記連結成分の外接矩形を統合する手段と、 上記統合された外接矩形から文字らしいものを判定する
    手段と、 上記文字らしい情報から文字領域を出力する手段と、を
    備えることを特徴とする画像処理装置。
  12. 【請求項12】 上記圧縮画像を生成する手段が、圧縮
    するブロックサイズを決定する手段と、 ブロック内の全画素の明度値を求める手段と、 背景に対して暗い文字を抽出する場合は最も明度の低い
    画素値を選択する手段と、 背景に対して明るい文字を抽出する場合は最も明度の高
    い画素値を選択する手段と、 上記選択された画素値を圧縮画像の画素値として使用す
    る手段と、を備えることを特徴とする請求項11記載の
    画像処理装置。
  13. 【請求項13】 上記同色とみなせる画素をランとして
    抽出する手段は、 各画素をランデータとして登録する手段と、 隣接するランを選択する手段と、 隣接するランの色差を求める手段と、 上記色差が小さい場合は上記ランを統合する手段と、 1ラインのラン統合を繰り返す手段と、を備えることを
    特徴とする請求項11記載の画像処理装置。
  14. 【請求項14】 上記連結成分を生成する手段は、 上記ランデータを連結成分データとして登録する手段
    と、 互いに接触する2つの連結成分を抽出する手段と、 色差があらかじめ定めた値より小さい場合には、連結成
    分を統合する手段と、 上記連結成分の統合を繰り返す手段と、を備えることを
    特徴とする請求項11記載の画像処理装置。
  15. 【請求項15】 上記連結成分のうち不要なものを排除
    する手段は、 上記連結成分の大きさが予め定めた値より小さい場合に
    連結成分データから削除する手段と、 連結成分の明度と周囲の画素の明度とを比較する手段
    と、 上記比較の結果を用いて不要な連結成分データを削除す
    る手段と、を備えることを特徴とする請求項11記載の
    画像処理装置。
  16. 【請求項16】 上記連結成分の外接矩形を統合する手
    段は、 各連結矩形の外接矩形を求める手段と、 上記外接矩形を2つ選択する手段と、 上記選択された外接矩形の高さ方向の座標値の差異を求
    める手段と、 上記外接矩形の高さから幅方向の距離限界値を求める手
    段と、 外接矩形間の幅方向の座標値の差異と上記距離限界値と
    を比較する手段と、上記外接矩形間の色差を算出する手
    段と、 上記高さ方向の座標値の差異、幅方向の座標値の差異、
    上記距離限界値、上記色差を用いて上記外接矩形の統合
    の可否を決定する手段と、 上記外接矩形の統合を決定する場合には、双方の外接矩
    形に外接する矩形を新たな外接矩形として一つに登録し
    直す手段と、を備えることを特徴とする請求項11記載
    の画像処理装置。
  17. 【請求項17】 上記統合された外接矩形から文字らし
    いものを判定する手段は、外接矩形の高さが所定範囲外
    の場合は文字でないと判断する手段を備えることを特徴
    とする請求項11記載の画像処理装置。
  18. 【請求項18】 上記統合された外接矩形から文字らし
    いものを判定する手段は、外接矩形の色情報と、周囲の
    画素の色情報とを比較し、抽出対象の文字色との整合が
    とれない場合には文字でないと判断する手段を備えるこ
    とを特徴とする請求項11記載の画像処理装置。
  19. 【請求項19】 上記統合された外接矩形から文字らし
    いものを判定する手段は、外接矩形内のエッジ強度を測
    定する手段と、 エッジ強度の強い画素数が少数しか存在しない場合に文
    字でないと判断する手段を、を備えることを特徴とする
    請求項11記載の画像処理装置。
  20. 【請求項20】 上記統合されたが外接矩形から文字ら
    しいものを判定する手段は、上記矩形内の画像を2値化
    する手段と、 上記2値化された画像の連結成分を求める手段と、 上記連結成分の外接矩形を求める手段と、 求めた外接矩形のうちで文字らしい形状の矩形数が少な
    い場合には文字でないと判断する手段と、を備えること
    を特徴とする請求項11記載の画像処理装置。
  21. 【請求項21】 文字および文字以外の画像を含む処理
    対象となる画像から多値画像を取得する第1ステップ
    と、 上記多値画像から圧縮画像を生成する第2ステップと、 上記圧縮画像から同色とみなせる画素をランとして抽出
    する第3ステップと、 上記ランを統合して連結成分を生成する第4ステップ
    と、 上記連結成分のうち不要なものを排除する第5ステップ
    と、 上記連結成分の外接矩形を統合する第6ステップと、 上記統合された外接矩形から文字らしいものを判定する
    第7ステップと、 上記文字らしい情報から文字領域を出力する第8ステッ
    プと、を備える画像処理方法を実現するプログラムを記
    録したコンピュータ読み取り可能な記録媒体。
  22. 【請求項22】 上記第2ステップは、 圧縮するブロックサイズを決定するステップと、 ブロック内の全画素の明度値を求めるステップと、 背景に対して暗い文字を抽出する場合は最も明度の低い
    画素値を選択するステップと、 上記背景に対して明るい文字を抽出する場合には、最も
    明度の高い画素値を選択するステップと、 上記選択された画素値を圧縮画素値として使用するステ
    ップと、を備える画像処理方法を実現するプログラムを
    記録したコンピュータ読取可能な請求項21記載の記録
    媒体。
  23. 【請求項23】 上記第3ステップは、 各画素をランデータとして登録するステップと、 隣接するランを選択するステップと、 上記隣接するランの色差を求めるステップと、 上記色差が小さい場合には上記ランを統合するステップ
    と、 1ラインのラン統合を繰り返すステップと、を備える画
    像処理方法を実現するプログラムを記録したコンピュー
    タ読取可能な請求項21記載の記録媒体。
  24. 【請求項24】 上記第4ステップは、 上記ランデータを連結成分データとして登録するステッ
    プと、 互いに接触する2つの連結成分を抽出するステップと、 上記2つの連結成分の色差を算出するステップと、 上記色差があらかじめ定めた値より小さい場合には、連
    結成分を統合するステップと、 連結成分の統合を繰り返すステップと、を備える画像処
    理方法を実現するプログラムを記録したコンピュータ読
    取可能な請求項21記載の記録媒体。
  25. 【請求項25】 上記第5ステップは、 上記連結成分の大きさがあらかじめ定めた値より小さい
    場合に連結成分データから削除するステップと、 上記連結成分の明度と周囲の画素の明度とを比較するス
    テップと、 上記比較の結果を用いて不要な連結成分データを削除す
    るステップと、を備える画像処理方法を実現するプログ
    ラムを記録したこコンピュータ読取可能な請求項21記
    載の記録媒体。
  26. 【請求項26】 上記第6ステップは、 各連結矩形の外接矩形を求めるステップと、 上記外接矩形を2つ選択するステップと、 上記選択された外接矩形の高さ方向の座標値の差異を求
    めるステップと、 上記外接矩形の高さから幅方向の距離限界値を求めるス
    テップと、 上記外接矩形間の幅方向の座標値の差異と上記距離限界
    値を比較するステップと、 上記外接矩形間の色差を算出するステップと、 上記高さ方向の座標値の差異、幅方向の座標値の差異、
    距離限界値、色差を用いて上記外接矩形の統合の可否を
    決定するステップと、 上記外接矩形を統合する場合には双方の外接矩形に外接
    する矩形を新たな外接矩形として一つに登録し直すステ
    ップと、を備える画像処理方法を実現するプログラムを
    記録したコンピュータ読取可能な請求項21記載の記録
    媒体。
  27. 【請求項27】 上記第7ステップは、 上記外接矩形の高さが所定範囲外の場合には、文字でな
    いと判断するステップを備える画像処理方法を実現する
    プログラムを記録したコンピュータ読取可能な請求項2
    1記載の記録媒体。
  28. 【請求項28】 上記第7ステップは、 外接矩形の色情報と周囲の画素の色情報を比較し、抽出
    対象の文字色との整合がとれない場合には、文字でない
    と判断するステップを備える画像処理方法を実現するプ
    ログラムを記録したコンピュータ読取可能な請求項21
    記載の記録媒体。
  29. 【請求項29】 上記第7ステップは、 外接矩形内のエッジ強度を測定するステップと、 エッジ強度が強い画素数が少ししか存在しない場合に
    は、文字でないと判断するステップを備える画像処理方
    法を実現するプログラムを記録したコンピュータ読取可
    能な請求項21記載の記録媒体。
  30. 【請求項30】 上記第7ステップは、 外接矩形内の画像を2値化するステップと、 上記2値化された画像の連結成分を求めるステップと、 上記連結成分の外接矩形を求めるステップと、 上記求められた外接矩形のうちで文字らしい形状の矩形
    数が少ない場合には、文字でないと判断するステップ
    と、を備える画像処理方法を実現するプログラムを記録
    したコンピュータ読取可能な請求項21記載の記録媒
    体。
JP2001086484A 2001-03-26 2001-03-26 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4558232B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001086484A JP4558232B2 (ja) 2001-03-26 2001-03-26 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001086484A JP4558232B2 (ja) 2001-03-26 2001-03-26 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002288589A true JP2002288589A (ja) 2002-10-04
JP4558232B2 JP4558232B2 (ja) 2010-10-06

Family

ID=18941853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001086484A Expired - Fee Related JP4558232B2 (ja) 2001-03-26 2001-03-26 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4558232B2 (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267408A (ja) * 2004-03-19 2005-09-29 Canon Inc 帳票認識装置及びその制御方法、プログラム
CN100356768C (zh) * 2004-01-19 2007-12-19 株式会社理光 图像处理设备和图像处理方法
JP2009164897A (ja) * 2008-01-07 2009-07-23 Fuji Xerox Co Ltd 二値化装置及び二値化処理プログラム
US7684648B2 (en) 2005-01-14 2010-03-23 Ricoh Company, Limited Reducing the size of a document image
JP2010218420A (ja) * 2009-03-18 2010-09-30 Fuji Xerox Co Ltd 文字認識装置、画像読取装置、およびプログラム
US8223411B2 (en) 2009-01-20 2012-07-17 Ricoh Company, Ltd. Image processing system, image processing apparatus, image processing method
JP2012212231A (ja) * 2011-03-30 2012-11-01 Toshiba Corp 電子機器、プログラムおよび文字列認識方法
JP2013175887A (ja) * 2012-02-24 2013-09-05 Konica Minolta Inc 画像処理装置、画像処理方法およびコンピュータープログラム
EP2645697A2 (en) 2012-03-30 2013-10-02 Brother Kogyo Kabushiki Kaisha Image processing apparatus and method
US9137418B2 (en) 2012-12-27 2015-09-15 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9386187B2 (en) 2013-09-30 2016-07-05 Brother Kogyo Kabushiki Kaisha Image processing apparatus and operations of selecting compression scheme to generate compressed file
US10044906B2 (en) 2016-02-25 2018-08-07 Brother Kogyo Kabushiki Kaisha Image processing apparatus, medium storing program executable by image processing apparatus, and system
US10200570B2 (en) 2016-06-30 2019-02-05 Brother Kogyo Kabushiki Kaisha Image processing apparatus for performing reduction process to reduce amount of specific color material to be used
US10521686B2 (en) 2016-01-28 2019-12-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus, information processing method and storage medium for generating an image file by extracting character pixels of a target image
US10592766B2 (en) 2016-02-29 2020-03-17 Brother Kogyo Kabushiki Kaisha Image processing apparatus and medium storing program executable by image processing apparatus
US10821722B2 (en) 2018-03-30 2020-11-03 Brother Kogyo Kabushiki Kaisha Control device, storage medium, and printing method
US10899139B2 (en) 2018-03-30 2021-01-26 Brother Kogyo Kabushiki Kaisha Control device and storage medium
WO2022065299A1 (ja) * 2020-09-24 2022-03-31 京セラドキュメントソリューションズ株式会社 画像形成装置
US11325398B2 (en) 2019-02-01 2022-05-10 Brother Kogyo Kabushiki Kaisha Image processing device generating dot data using machine learning model and method for training machine learning model

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348159A (ja) * 1999-06-01 2000-12-15 Ricoh Co Ltd 画像合成処理方法、撮像装置、画像縮小処理方法及び記録媒体
JP2000357230A (ja) * 1999-06-15 2000-12-26 Ricoh Co Ltd 画像処理方法、画像処理装置及び記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348159A (ja) * 1999-06-01 2000-12-15 Ricoh Co Ltd 画像合成処理方法、撮像装置、画像縮小処理方法及び記録媒体
JP2000357230A (ja) * 1999-06-15 2000-12-26 Ricoh Co Ltd 画像処理方法、画像処理装置及び記録媒体

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356768C (zh) * 2004-01-19 2007-12-19 株式会社理光 图像处理设备和图像处理方法
JP2005267408A (ja) * 2004-03-19 2005-09-29 Canon Inc 帳票認識装置及びその制御方法、プログラム
US7684648B2 (en) 2005-01-14 2010-03-23 Ricoh Company, Limited Reducing the size of a document image
JP2009164897A (ja) * 2008-01-07 2009-07-23 Fuji Xerox Co Ltd 二値化装置及び二値化処理プログラム
JP4569785B2 (ja) * 2008-01-07 2010-10-27 富士ゼロックス株式会社 二値化装置及び二値化処理プログラム
US8077966B2 (en) 2008-01-07 2011-12-13 Fuji Xerox Co., Ltd. Binarizing device and computer readable medium
US8223411B2 (en) 2009-01-20 2012-07-17 Ricoh Company, Ltd. Image processing system, image processing apparatus, image processing method
US8385651B2 (en) 2009-03-18 2013-02-26 Fuji Xerox Co., Ltd. Character recognition device, image-reading device, computer readable medium, and character recognition method
JP2010218420A (ja) * 2009-03-18 2010-09-30 Fuji Xerox Co Ltd 文字認識装置、画像読取装置、およびプログラム
US8582894B2 (en) 2011-03-30 2013-11-12 Kabushiki Kaisha Toshiba Electronic apparatus and character string recognizing method
JP2012212231A (ja) * 2011-03-30 2012-11-01 Toshiba Corp 電子機器、プログラムおよび文字列認識方法
JP2013175887A (ja) * 2012-02-24 2013-09-05 Konica Minolta Inc 画像処理装置、画像処理方法およびコンピュータープログラム
EP2645697A2 (en) 2012-03-30 2013-10-02 Brother Kogyo Kabushiki Kaisha Image processing apparatus and method
US9137418B2 (en) 2012-12-27 2015-09-15 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9386187B2 (en) 2013-09-30 2016-07-05 Brother Kogyo Kabushiki Kaisha Image processing apparatus and operations of selecting compression scheme to generate compressed file
US10521686B2 (en) 2016-01-28 2019-12-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus, information processing method and storage medium for generating an image file by extracting character pixels of a target image
US10044906B2 (en) 2016-02-25 2018-08-07 Brother Kogyo Kabushiki Kaisha Image processing apparatus, medium storing program executable by image processing apparatus, and system
US10592766B2 (en) 2016-02-29 2020-03-17 Brother Kogyo Kabushiki Kaisha Image processing apparatus and medium storing program executable by image processing apparatus
US10200570B2 (en) 2016-06-30 2019-02-05 Brother Kogyo Kabushiki Kaisha Image processing apparatus for performing reduction process to reduce amount of specific color material to be used
US10821722B2 (en) 2018-03-30 2020-11-03 Brother Kogyo Kabushiki Kaisha Control device, storage medium, and printing method
US10899139B2 (en) 2018-03-30 2021-01-26 Brother Kogyo Kabushiki Kaisha Control device and storage medium
US11305551B2 (en) 2018-03-30 2022-04-19 Brother Kogyo Kabushiki Kaisha Control device and storage medium
US11325398B2 (en) 2019-02-01 2022-05-10 Brother Kogyo Kabushiki Kaisha Image processing device generating dot data using machine learning model and method for training machine learning model
WO2022065299A1 (ja) * 2020-09-24 2022-03-31 京セラドキュメントソリューションズ株式会社 画像形成装置
JP7510611B2 (ja) 2020-09-24 2024-07-04 京セラドキュメントソリューションズ株式会社 画像形成装置

Also Published As

Publication number Publication date
JP4558232B2 (ja) 2010-10-06

Similar Documents

Publication Publication Date Title
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP5337563B2 (ja) 帳票認識方法および装置
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP2000181992A (ja) カラー文書画像認識装置
JP2004246554A (ja) 道路データ生成方法
CN112818983B (zh) 一种利用图片相识度判断字符倒置的方法
US20050271260A1 (en) Device, method and program for removing pores
JP2001043313A (ja) 文字切出し方法
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JP2003115031A (ja) 画像処理装置および方法
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
CN112785550A (zh) 图像质量值确定方法、装置、存储介质及电子装置
KR100447268B1 (ko) 최적 이진화 임계치 탐색에 의한 얼굴 영상에서 눈 검출방법
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JPH0624014B2 (ja) 濃淡画像の処理方法
JP6613625B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JPH05342412A (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JP7277879B2 (ja) ナンバプレート認識プログラム及びナンバプレート認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080321

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100721

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees