JP4558232B2 - 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP4558232B2 JP4558232B2 JP2001086484A JP2001086484A JP4558232B2 JP 4558232 B2 JP4558232 B2 JP 4558232B2 JP 2001086484 A JP2001086484 A JP 2001086484A JP 2001086484 A JP2001086484 A JP 2001086484A JP 4558232 B2 JP4558232 B2 JP 4558232B2
- Authority
- JP
- Japan
- Prior art keywords
- circumscribed
- circumscribed rectangle
- character
- rectangle
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、文字以外の画像を含む処理対象となる画像から入力されたカラー文書画像を認識する文書画像認識システムなどに利用され、カラー文書画像や、写真、図などを含む文書から文字行の位置を正しく特定する画像処理装置、画像処理方法および画像処理方法を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体に係り、特に、カラー文書から正確な文字領域抽出を可能とする画像処理方法のプログラムをコンピュータで実行するようにした画像処理装置、画像処理方法および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
文書画像を認識する際、文字の位置を正しく特定する技術は、高い認識精度を得るために不可欠である。
仮に、文書画像のどこに文字があるのか不明な状態で文字認識処理を行った場合、文字認識の必要のない写真、図などの領域に文字認識処理を行ってしまうことになるため、不要な処理に不要な時間がかかるだけでなく、文字でない部分を無理に文字とみなして認識した結果が大量に出力されることになり、認識結果を利用する際に大きな困難を伴うことになる。
このため、たとえば、特開平2000―67158号公報においては、文字領域を正しく特定するために、2値画像の黒画素の連結成分を用いて処理を行っている。
すなわち、この公報には、入力された画像を縮小して黒画素の連結成分の外接矩形を取得し、この取得した外接矩形から基本となる要素を抽出する。
この抽出した基本要素を文字、表、図、その他に分類し、文字要素を統合して行を生成し、この生成した行を統合して文字領域とする。
この文字領域から段組情報を抽出し、その抽出された段の位置を参照し、過剰に統合された文字領域を修正することが開示されている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記公報に開示された画像処理方法では、2値画像を対象とするものであり、処理対象文書がカラー印刷されている場合には、カラー情報をどこかで欠落させて2値画像に変換する必要がある。
しかしながら、2値化には決定的な方法があるわけではなく、処理対象画像によっては、文字がつぶれてしまったり、背景の色が細かいノイズ状になって2値画像に表現されてしまうなどの問題がしばしば発生する。
このような状態では、縮小画像の黒画素の連結成分抽出が思うようにできず、精度が低化してしまうという難点がある。
本発明は、上述した事情に鑑みてなされたもので、従来困難であった文字および文字以外の画像を含むカラー文書から正確に文字領域抽出を行うことができる画像処理装置、画像処理方法および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的としている。
【0004】
本発明の請求項1の目的は、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることができる画像処理装置を提供することにある。
本発明の請求項2の目的は、特に、2値化された画像の連結成分の外接矩形中で、文字に近い形状の矩形数が少ない場合に文字でないと判断して、統合された外接矩形から文字としての判定を高精度に行うことができる画像処理装置を提供することにある。
本発明の請求項3の目的は、 2値化された画像の連結部分の外接矩形から文字を精度よく判定し得る画像処理装置を提供することにある。
本発明の請求項4の目的は、特に、より正確に連結成分を生成することができる画像処理装置を提供することにある。
本発明の請求項5の目的は、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことができる画像処理装置を提供することにある。
本発明の請求項6の目的は、特に、互いに接触する2つの連結成分を正確に生成することができる画像処理装置を提供することにある。
【0005】
本発明の請求項7の目的は、特に、連結成分の外接矩形を確実に統合することができる画像処理装置を提供することにある。
本発明の請求項8の目的は、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることができる画像処理方法を提供することにある。
本発明の請求項9の目的は、特に、統合された外接矩形から文字としての判定をより高精度に行うことができる画像処理方法を提供することにある。
本発明の請求項10の目的は、統合された外接矩形から文字としての判定をより高精度に行うことができる画像処理方法を提供することにある。
【0006】
本発明の請求項11の目的は、特に、連結成分の不要な部分を除去でき、より正確に連結成分を生成することができる画像処理方法を提供することにある。
本発明の請求項12の目的は、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことができる画像処理方法を提供することにある。
本発明の請求項13の目的は、特に、互いに接触する2つの連結成分を正確に生成することができる画像処理方法を提供することにある。
本発明の請求項14の目的は、特に、連結成分の外接矩形を確実に統合することができる画像処理方法を提供することにある。
【0008】
本発明の請求項15の目的は、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることができる画像処理方法を実現するプログラムを記録したコンピュータ読取可能な記録媒体を提供することにある。
【0011】
【課題を解決するための手段】
請求項1に記載した発明に係る画像処理装置は、上述した目的を達成するために、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置であって、
処理対象の上記カラー画像から多値の原画像データを取得する処理対象画像入力手段と、
上記原画像データを圧縮した圧縮画像データを生成する圧縮画像生成手段と、
上記圧縮画像データからランを生成するラン生成手段と、
上記圧縮画像データから生成された上記ランを統合して連結成分を生成する連結成分生成手段と、
上記圧縮画像データから生成された上記連結成分を、所定の条件に従って削除する連結成分選別手段と、
上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する外接矩形統合手段と、
上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字を判定する文字判定手段と、
上記文字判定手段の情報から文字領域を出力する文字領域出力手段と、
を備えることを特徴としている。
請求項2に記載した発明に係る画像処理装置は、上記文字判定手段は、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字を判定することを特徴としている。
【0012】
請求項3に記載した発明に係る画像処理装置は、上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記文字判定手段は、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを判定することを特徴としている。
請求項4に記載した発明に係る画像処理装置は、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記連結成分選別手段は、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、該連結成分を削除するか否かを選別することを特徴としている。
請求項5に記載した発明に係る画像処理装置は、上記ラン生成手段は、
各画素をランデータとして登録する手段と、
隣接するランを選択する手段と、
隣接するランの色差を求める手段と、
上記色差が小さい場合は上記ランを統合する手段と、
1ラインのラン統合を繰り返す手段と、
を備えることを特徴としている。
【0013】
請求項6に記載した発明に係る画像処理装置は、上記連結成分生成手段は、
上記ランデータを連結成分データとして登録する手段と、
互いに接触する2つの連結成分を抽出する手段と、
色差があらかじめ定めた値より小さい場合には、連結成分を統合する手段と、
上記連結成分の統合を繰り返す手段と、
を備えることを特徴としている。
請求項7に記載した発明に係る画像処理装置は、上記外接矩形統合手段は、
各連結矩形の外接矩形を求める手段と、
上記外接矩形を2つ選択する手段と、
上記選択された外接矩形の高さ方向の座標値の差異を求める手段と、
上記外接矩形の高さから幅方向の距離限界値を求める手段と、
外接矩形間の幅方向の座標値の差異と上記距離限界値とを比較する手段と、
上記外接矩形間の色差を算出する手段と、
上記高さ方向の座標値の差異、幅方向の座標値の差異、上記距離限界値、上記色差を用いて上記外接矩形の統合の可否を決定する手段と、
上記外接矩形の統合を決定する場合には、双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直す手段と、
を備えることを特徴としている。
【0014】
請求項8に記載した発明に係る画像処理方法は、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備えることを特徴としている。
請求項9に記載した発明に係る画像処理方法は、上記第7ステップは、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字判定手段が文字を判定することを特徴としている。
請求項10に記載した発明に係る画像処理方法は、上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記第7ステップは、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを文字判定手段が判定することを特徴としている。
【0015】
請求項11に記載した発明に係る画像処理方法は、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記第5ステップは、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、上記連結成分選別手段が該連結成分を削除するか否かを選別することを特徴としている。
請求項12に記載した発明に係る画像処理方法は、上記ラン生成手段により処理される上記第3ステップは、
各画素をランデータとして登録するステップと、
隣接するランを選択するステップと、
上記隣接するランの色差を求めるステップと、
上記色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップと、
を備えることを特徴としている。
【0016】
請求項13に記載した発明に係る画像処理方法は、上記連結成分生成手段によって処理される上記第4ステップは、
上記ランデータを連結成分データとして登録するステップと、
互いに接触する2つの連結成分を抽出するステップと、
上記2つの連結成分の色差を算出するステップと、
上記色差があらかじめ定めた値より小さい場合には、連結成分を統合するステップと、
連結成分の統合を繰り返すステップと、
を備えること特徴としている。
請求項14に記載した発明に係る画像処理方法は、上記外部矩形統合手段によって処理される上記第6ステップは、
各連結矩形の外接矩形を求めるステップと、
上記外接矩形を2つ選択するステップと、
上記選択された外接矩形の高さ方向の座標値の差異を求めるステップと、
上記外接矩形の高さから幅方向の距離限界値を求めるステップと、
上記外接矩形間の幅方向の座標値の差異と上記距離限界値を比較するステップと、
上記外接矩形間の色差を算出するステップと、
上記高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて上記外接矩形の統合の可否を決定するステップと、
上記外接矩形を統合する場合には双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直すステップと、
を備えること特徴としている。
請求項15に記載した発明に係る画像処理方法は、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備える画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能なことを特徴としている。
【0023】
【作用】
すなわち、本発明の請求項1による画像処理装置は、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置であって、
処理対象の上記カラー画像から多値の原画像データを取得する処理対象画像入力手段と、
上記原画像データを圧縮した圧縮画像データを生成する圧縮画像生成手段と、
上記圧縮画像データからランを生成するラン生成手段と、
上記圧縮画像データから生成された上記ランを統合して連結成分を生成する連結成分生成手段と、
上記圧縮画像データから生成された上記連結成分を、所定の条件に従って削除する連結成分選別手段と、
上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する外接矩形統合手段と、
上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字を判定する文字判定手段と、
上記文字判定手段の情報から文字領域を出力する文字領域出力手段と、
を備えるので、特に、直接、カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
本発明の請求項2による画像処理装置は、上記文字判定手段は、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字を判定することができるので、統合された外接矩形から文字のみをより高精度に判定することが可能となる。
【0024】
本発明の請求項3による画像処理装置は、上記外接矩形の性質が、
該外接矩形の高さおよび外接部分の色情報であり、
上記文字判定手段は、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを判定することができるので、特に、文字のみをより高精度に判定することが可能となる。
本発明の請求項4による画像処理装置は、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記連結成分選別手段は、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、該連結成分を削除するか否かを選別することができるので、特に、連結成分の不要な部分を除去でき、より正確に連結成分を生成することが可能となる。
本発明の請求項5による画像処理装置は、上記ラン生成手段は、
各画素をランデータとして登録する手段と、
隣接するランを選択する手段と、
隣接するランの色差を求める手段と、
上記色差が小さい場合は上記ランを統合する手段と、
1ラインのラン統合を繰り返す手段と、
を備えることで、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことが可能となる。
【0025】
本発明の請求項6による画像処理装置は、上記連結成分生成手段は、
上記ランデータを連結成分データとして登録する手段と、
互いに接触する2つの連結成分を抽出する手段と、
色差があらかじめ定めた値より小さい場合には、連結成分を統合する手段と、
上記連結成分の統合を繰り返す手段と、
を備えることで、特に、互いに接触する2つの連結成分を正確に生成することが可能となる。
本発明の請求項7による画像処理装置は、上記外接矩形統合手段は、
各連結矩形の外接矩形を求める手段と、
上記外接矩形を2つ選択する手段と、
上記選択された外接矩形の高さ方向の座標値の差異を求める手段と、
上記外接矩形の高さから幅方向の距離限界値を求める手段と、
外接矩形間の幅方向の座標値の差異と上記距離限界値とを比較する手段と、
上記外接矩形間の色差を算出する手段と、
上記高さ方向の座標値の差異、幅方向の座標値の差異、上記距離限界値、上記色差を用いて上記外接矩形の統合の可否を決定する手段と、
上記外接矩形の統合を決定する場合には、双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直す手段と、
を備えることで、特に、連結成分の外接矩形を確実に統合することが可能となる。
本発明の請求項8による画像処理装置は、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備えるので、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
【0026】
本発明の請求項9による画像処理方法は、上記第7ステップは、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字判定手段が文字を判定することにより、特に、2値化された画像の連結成分の外接矩形中で、文字らしい形状の矩形数が少ない場合に文字でないと判断して、統合された外接矩形から文字らしいもののみをより高精度に判定することが可能となる。
本発明の請求項10による画像処理方法は、上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記第7ステップは、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを文字判定手段が判定することにより特に、外接矩形内のエッジ強度の強い画素数が少数しか存在しない場合に文字でないと判定して統合された外接矩形から文字のみをより高精度に判定することが可能となる。
本発明の請求項11による画像処理方法は、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記第5ステップは、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、上記連結成分選別手段が該連結成分を削除するか否かを選別するので、
特に、連結成分の不要な部分を除去でき、より正確に連結成分を生成することが可能となる。
【0027】
本発明の請求項12による画像処理方法は、上記ラン生成手段により処理される上記第3ステップは、
各画素をランデータとして登録するステップと、
隣接するランを選択するステップと、
上記隣接するランの色差を求めるステップと、
上記色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップと、
を備えるので、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことが可能となる。
本発明の請求項13による画像処理方法は、上記連結成分生成手段によって処理される上記第4ステップは、
上記ランデータを連結成分データとして登録するステップと、
互いに接触する2つの連結成分を抽出するステップと、
上記2つの連結成分の色差を算出するステップと、
上記色差があらかじめ定めた値より小さい場合には、連結成分を統合するステップと、
連結成分の統合を繰り返すステップと、
を備えるので、特に、互いに接触する2つの連結成分を正確に生成することが可能となる。
本発明の請求項14による画像処理方法は、上記外部矩形統合手段によって処理される上記第6ステップは、
各連結矩形の外接矩形を求めるステップと、
上記外接矩形を2つ選択するステップと、
上記選択された外接矩形の高さ方向の座標値の差異を求めるステップと、
上記外接矩形の高さから幅方向の距離限界値を求めるステップと、
上記外接矩形間の幅方向の座標値の差異と上記距離限界値を比較するステップと、
上記外接矩形間の色差を算出するステップと、
上記高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて上記外接矩形の統合の可否を決定するステップと、
上記外接矩形を統合する場合には双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直すステップと、
を備えるので、特に、連結成分の外接矩形を確実に統合することが可能となる。
【0028】
本発明の請求項15による画像処理方法は、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備える画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能なので、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
【0035】
【発明の実施の形態】
以下、実施の形態に基づき、図面を参照して本発明の画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を詳細に説明する。
図1は、本発明の1実施の形態の概略的処理手順を示すフローチャートであり、コンピュータ読取可能な記録媒体に記録されたプログラムにしたがって本発明の画像処理方法を実現する処理手順を示すフローチャートである。
まず、本発明により処理される処理対象の原稿は、文字および文字以外の画像を含むものである。
この原稿は図示されていないが、スキャナ、撮像装置などの原稿読み取り装置により、処理対象の原画像のデータを処理対象画像入力手段により取得して(ステップS1)、圧縮画像生成手段に入力し、そこで圧縮することにより、圧縮画像データを生成する(ステップS2)。
次に、この圧縮画像データからラン生成手段に入力することにより、同色とみなせる画素をランとして抽出する(ステップS3)。
【0036】
ここで、「ラン」とは、周知のように、2値の文書画像のように、白画素あるいは黒画素がある程度連続する場合がある(たとえば、フアクシミリなどで扱う2値の文書画像)。
この連続した白画素、あるいは黒画素を1次元方向に白あるいは黒の連続する画素のかたまりを符号化の単位とするものである。
このようにして、上記ステップS3で同色とみなせる画素をランとして抽出すると、その抽出したランを連結成分生成手段に送り、ラン同士で接触していて、色の近いものをまとめて、連結成分として抽出する(ステップS4)。
次いで、この抽出された連結成分のうちの不要なものを排除するために連結成分選別手段に送り、不要な連結成分を排除する(ステップS5)。
次に、上記の不要な連結成分を除去されて、必要となる連結成分のみを外接矩形統合手段に入力して、この必要となる連結成分の外接矩形同士を統合して(ステップS6)、文字行候補を生成する。
次に、上記文字行候補を文字判定手段により文字判定を行い(ステップS7)、文字らしい特徴をもたないものを排除する。
この文字らしい特徴をもたないものを排除することにより、文字らしい特徴を有する文字行候補のみを文字領域出力手段に入れて、ステップS8で文字行の座標値を出力する。
図2は、上記図1のフローチャートにしたがって、本発明による画像処理方法の第1の実施の形態の処理手順に適用される各手段の構成を示すブロック図である。
この図2において、上記処理対象画像入力手段101は、原画像を取得して格納しておく手段であり、この処理対象画像入力手段101で格納された原画像のデータは、上記圧縮画像生成手段102と、上記文字判定手段107に送出される。
圧縮画像生成手段102は、圧縮画像を生成して格納するとともに、上記ラン生成手段103に送出する。
【0037】
圧縮画像生成手段102は、上記ラン生成手段103、上記連結成分生成手段104、上記連結成分選別手段105、上記外接矩形統合手段106、上記文字判定手段107にそれぞれ出力する。
ラン生成手段103は、圧縮画像からランを生成する手段であり、生成したランを上記連結成分生成手段104に送出する。
上記連結成分生成手段104は、ランから連結成分を生成する手段であり、生成した連結成分は連結成分選別手段105に送出する。
連結成分選別手段105は、連結成分生成手段104で得られた連結成分を選別して外接矩形統合手段106に送出する。
外接矩形統合手段106は、連結成分選別手段105で得られた連結成分の外接矩形を統合して、文字判定手段107に送出する。
【0038】
文字判定手段107は、外接矩形統合手段106で統合された外接矩形から文字行を判定して、上記文字領域出力手段108に送出する。
文字領域出力手段108は、文字行と判定された座標を出力する手段である(請求項11に対応)。
次に、この図2で示す画像処理装置の動作について図3以降に示すフローチャートに沿って説明する。
まず、最初に、処理したい原稿を処理対象画像入力手段101で原画像(カラー)として取得する。
この取得された原画像のデータは、処理対象画像入力手段101から圧縮画像生成手段102および文字判定手段107に送出する。
圧縮画像生成手段102は、図3に示すフローチャートに沿って処理を実行する。
この図3に示すフローチャートは、上記圧縮画像生成手段102の処理手順を示すものである。
圧縮画像生成手段102は、原画像から圧縮画像を生成するが、この圧縮画像は処理の高速化のため、およびある色が細かい点の集合で表現されている場合の悪影響を防ぐために生成する。
【0039】
この原画像を圧縮する際に、まずブロックサイズを決定する(ステップS102a)。ここでいう「ブロックサイズ」とは、圧縮画像を作成する際に、1画素にまとめる原画像上の画素のかたまりのサイズである。
ここでは、原画像上の2×2画素を圧縮画像の1画素にまとめるものとする。
次に、ブロック内の画素の明度を求め(ステップS102b)、次いで、最も暗い画素値を抽出する(ステップS102c)。
この際、ここでは、背景に対して暗い色の文字を抽出する場合を考えて、最も暗い画素を抽出した場合を例にしているが、これとは逆に、背景に対して明るい色の文字を抽出する場合には、ブロック内の最も明るい画素の値を抽出する。
もし、明るい文字も、暗い文字も抽出したい場合は、この実施の形態の一連の処理を、明文字/暗文字の仮定だけを変えて再度抽出を行い、結果の論理和を取ることで実現できる。
上記のようにして抽出した暗い画素値を、圧縮画像の該当画素の画素値として用いることとし(圧縮画像画素値セット)、圧縮画像にこの値を書き込む(ステップS102d)。
【0040】
以上のステップS102a〜ステップS102dの処理手順を繰り返し実行し、すべての画素に対して吟味を行って(ステップS102e)、すべての画素の吟味が終了すると、圧縮画像生成手段102による処理が終了したことになり、次ぎの処理工程、すなわち、図2に示したラン生成手段103による処理工程に移行する。
ラン生成手段103による処理工程は、図4に示すフローチャートに沿って実行される。この図4は、ラン生成手段103の処理手順を示すフローチャートであり、まず、ある行(たとえば、先頭行など)を注目行とし、各画素をランデータとして登録する(ステップS103a)。
次に、ランの統合を行う。この場合、左端のランを参照ランとする(ステップS103b)。
次に、その隣のランを注目ランとし(ステップS103c)、参照ランと注目ランとを比較する(ステップS103d)。
この場合の比較の方法には、種々考えられるが、ここでは、色のR(赤)、G(緑)、B(青)各成分の差の2乗和を色差として定義し、この色差が小さければ、色が近いとする。
【0041】
色差があらかじめ決められた閾値と比較し(ステップS103e)、その比較の結果、色差が閾値以下の場合には、ラン同士を統合して一つの長いランとして、登録し、この統合したランを新しい参照ランとする(ステップS103f)。
なお、統合したランの色は、統合前の各ランの平均値、ランの長さによる加重平均値、メジアン(median:複数のデータを昇順、または降順に整列した際の中央に位置する値)などを用いることが考えられるが、ここでは、メジアンを用いることにする。
一方、上記ステップS103eでの色差があらかじめ決められた閾値と比較した結果、色差が閾値以下でない場合、すなわち色差が閾値より大きい場合、注目ランを新たな参照ランとする(ステップS103g)。
上記のように、ステップS103fでの新定義による統合した新しい参照ランと、ステップS103gでの新定義による注目ランの新しい参照ランの右隣にランがあるか、否かの吟味、すなわち判定をする(ステップS103h)。
【0042】
この判定の結果、新しい参照ランの右隣にランがある場合には、このランを新しい注目ランとしてステップS103cの処理に戻り、ランの統合を繰り返す。
【0043】
また、上記判定の結果、新しい参照ランの右隣にランがない場合には、この行のランの統合が一通り済んだことになる。
ここまでで注目のランの統合は一応できたことになるが、実際には、統合が不充分であることが多い。
そこで、同じ行のラン統合を繰り返して行い、ランがこれ以上統合できなくなるまで統合を繰り返し、統合を完全なものにする。
このために、ラン統合を再度行うか吟味するために、ステップS103bの左端のランを参照する処理からステップS103hの右端にランがあるか、否かの判定処理に至るまでの一連の処理を実行した際、注目行のラン統合が1度でも行われたか、否かを判定する(ステップS103i)。
この判定の結果、ランの統合が行われていないと判定した場合、すなわち、ステップS103fにおける統合したランを新しい参照ランとする処理が1度も実行されなかった場合は、これ以上ランを統合する必要がないことになるので(ステップS103j)、つまり、すべての行のランを抽出したことになり、この行のラン統合をこれ以上繰り返して行わない。
【0044】
また、上記とは逆に、上記ステップS103iの判定処理において、ランの統合が行われていると判定した場合には、再度ステップS103bの左端のランを
参照する処理からステップS103iの処理工程を実行し、再度統合処理を実行する。
このようにして、ランの統合が完全に行われると、この行のラン抽出が完成したことになる。すべての行のランの抽出作業を行い(ステップS103j)、この画像のラン抽出を終了し、次工程である連結成分生成工程に移行する。
なお、すべての行のランの抽出作業が終了していない場合には、ステップS103iの処理工程から注目行を他行に変更させて(ステップS103k)、再度ステップS103aの処理工程に処理手順を戻して、再び上記ステップS103a〜ステップS103jの処理を繰り返し実行する。
次に、連結成分生成工程の説明を行う。図5は、この連結成分生成工程の処理手順を示すフローチャートである。
【0045】
まず、図4のフローチャートにしたがって実行されたラン生成処理工程により生成されたランデータを図2で示した連結成分生成手段104に入力して、この連結成分生成手段104において、ランデータを連結成分データとしてそのまま登録する(ステップS104a)。
次に、この登録された連結成分データの中から互いに接触する2つの連結成分データを抽出する(ステップS104b)。
次に、2つの連結成分データの色を比較する。ここでは、ラン生成と同じ方法で色差を求め、この求めた色差を閾値と比較する(ステップS104c)。
この比較の結果、色差が閾値以下の場合には、連結成分同士を統合して1つの連結成分とする(ステップS104d)。
連結成分にも色情報が必要であるが、これもランの場合と同様とする。
一方、色差と閾値との比較の結果、色差が閾値以上の場合には、連結成分同士の統合を行わず、処理工程をステップS104eに移行する。
このステップS104eの処理では、すべての連結成分の組み合せについて吟味し、すべての連結成分の組み合せが吟味するまで繰り返し処理を実行する。
【0046】
すなわち、すべての連結成分の組み合せが終了するまで、ステップS104bの互いに抽出する2つの連結成分の抽出処理工程からステップS104eのすべての連結成分の組み合せを吟味するまでの処理工程の実行を繰り返す。
このようにして、すべての連結成分の組み合せが完了すると、1回の連結成分統合が終了する。
ここでも、ランの場合と同様に、1度統合しただけでは不充分である場合が多いので、繰り返し統合を行う(ステップS104f)。
この場合、ランの場合に習って、これ以上統合できなくなるまで処理を繰り返しても良いが、ここでは高速化のために、あらかじめ定めておいた回数だけ統合を行うこととする。以上で連結成分生成処理が終了する。
次に、図2で示した連結成分選別手段105による連結成分選別処理手順について図6を参照して説明する。
この図6は、連結成分選別処理手順を示すフローチャートである。上記連結成分生成手段104による連結成分生成処理工程で得られた連結成分を1つ選択する(ステップS105a)。
【0047】
次に、この選択された1つの連結成分の大きさを所定の大きさ以下であるか、否かの判定を行う。すなわち吟味する(ステップS105b)。
この判定の結果、連結成分の大きさが所定の大きさ以下である場合には、ステップS105cでノイズとみなして連結成分データから削除する。
また、ステップS105bにおける判定の結果、1つの連結成分の大きさを所定の大きさ以上であると判定した場合には、連結成分の明度と、周囲を取り巻く画素の明度を比較する(ステップS105d)。
この際、背景に対して暗い文字を抽出しようとしている場合は、連結成分が周囲より明るい場合は文字である可能性が少ないことになる。
そこで、連結成分より明るい画素数を吟味し(ステップS105e)、この吟味の結果、明るい画素数の割合が所定の割合より少ない場合には、文字でないとみなして連結データから削除する(ステップS105c)。
なお、周囲より明るい文字を抽出しようとしている場合には、連結成分より画素数をカウントすれば良い。
【0048】
このようにして、すべての連結成分の吟味を終了すると(ステップS105f)、次の工程、すなわち図2で示した外接矩形統合手段106による外接矩形統合処理工程に移行する。
図7は、この外接矩形統合処理工程の処理手順を示すフローチャートであり、この図7のフローチャートに沿って以下に外接矩形統合処理手順について説明する。
この外接矩形統合処理は、文字行を抽出するための処理である。なお、ここでは、行方向を横と仮定して説明する。
まず、各連結成分の外接矩形を求める(ステップS106a)。次いで、この求めた外接矩形のうちの2つを選び(ステップS106b)、座標値のうち、Y方向(縦方向)に重なっている部分の長さを調べる(ステップS106c)。
この結果、Y方向に重なっている部分が全くないか、あるいはY方向に重なっている部分が少ない場合には、これらの外接矩形が同一行を構成する要素とは考えにくいので、外接矩形同士の統合は行わない。
【0049】
また、ステップS106cでの外接矩形のY方向に重なっている部分の長さが大きい場合は、外接矩形の高さ等を参考にしてX方向の統合する矩形間距離最大値(X距離限界値)を求める(ステップS106d)。
ここでの外接矩形の高さ等を参考にする理由は、高さの高い文字であれば、隣接する文字との距離も長くなる傾向であることを考慮したためである。
具体的には、外接矩形高さをそのままX距離限界値に設定することが考えられる。
注目している2つの外接矩形のX方向の距離とX距離限界値を比較し(ステップS106e)、この比較の結果、外接矩形のX方向の距離がX距離限界値より大きい場合であると判定した場合は、同一行構成要素でないとみなして統合を行わない。
次に、2つの外接矩形の色差を所定値以上であるか、否かの吟味を行う(ステップS106f)。この吟味の結果、2つの外接矩形の色差が所定値以上である場合には、異なる行の文字とみなして、統合を行わない。
【0050】
次に、これらの条件をクリアした外接矩形は、同一行を構成する要素であるとみなして、2つの外接矩形を新しい外接矩形として登録する(ステップS106g)。
矩形情報として色情報も必要になるが、これは各外接矩形の色情報を基に決定する。
この場合、ランの場合と同様に、様々な方法が考えられるが、ここでメジアンを用いることにする。
このようにして、次々に外接矩形を吟味して(ステップS106h)、すべての外接矩形の吟味が終了すると、今度は図2で示した文字判定手段107による文字判定処理工程に移行する。
次に、この文字判定処理工程について説明する。図8は、この文字判定処理手順を示すフローチャートであり、この文字判定処理工程は、上記図7で説明した外接矩形統合処理手順により得られた文字行候補(すなわち、外接矩形)の中から、本当に文字行であるものだけを選び出す工程である。
【0051】
次に、この図8のフローチャートに沿って説明する。まず、外接矩形を一つ選択する(ステップS107a)。
次に選択した外接矩形の高さを吟味する(ステップS107b)。この吟味の結果、外接矩形の高さが所定以上に高すぎるものは文字でないとステップS107cで判定する。
次に、ステップS107bでの選択した外接矩形の高さが所定値以下であると判定した場合には、外接部分の色情報と周囲の色情報を比較し(ステップS107d)、その比較の結果、上記連結成分選別の場合と同様に、背景より暗い文字を抽出する場合においては、周囲が外接矩形より暗い場合には(ステップS107e)、文字行でないとみなす(ステップS107c)。
また、背景より明るい文字を抽出する場合は、上記とは逆の条件となる。
次に、外接矩形内のエッジ強度が強い画素数を数える(ステップS107f)。この実施の形態では、エッジ強度の判定は原画像上で行う。その方法は、種々考えられるが、一例として、3×3がその形状と図9、図10に示す係数を持つ空間フィルタをエッジ強度を測りたい画素を中心にして個別に施し、それらの2乗和をもってエッジ強度とする方法などが考えられる。
【0052】
さて、上記ステップS107fで得られたエッジ強度の強い画素数の矩形内の全画素数に対する比率が所定値より小さい場合は(ステップS107g)、文字でないと判定する。
次に、矩形内の画像を2値化する(ステップS107h)。2値化の方法には、閾値を固定で決めておく方法、判別分析方法(「コンピュータビジョン」第4章・丸善・谷内田正彦編を参照)などが考えられる。
ここでは、判別分析法{上記著書に記載されている内容の概略を転記すると、「画像の2値化問題は、画像をパターン領域(クラス1)と背景領域(クラス2)の2クラスに分けることであるとし、濃度とヒストグラムを用いて最もクラス分離の良い濃度閾値を与えるようとするものである。」}を用いることにする。
さて、判別分析法で2値化した画像から連結成分の抽出を行い、その外接矩形を求める(ステップS107i)。
ここで求めた外接矩形のうち、文字らしくない形状の矩形があるか、否かの判定を行い(ステップS107j)、その判定の結果、文字らしくない形状の矩形がある場合には、文字らしくない形状の矩形を排除する(ステップS107c)。
【0053】
ここで、文字らしくない形状の矩形とは、たとえば、縦横比が極端に横長や、縦長の形状の矩形、あるいは非常に小さい矩形等が該当する。
このような縦横比の割合が小さい場合は、注目している外接矩形は、文字行でないとみなす。
また、上記ステップS107jでの判定の結果、文字らしい形状の外接矩形が少なくないと判定された場合には、この外接矩形は文字であると判定され(ステップS107k)れる。
このようにして、すべての外接矩形に対して上記ステップS107a〜ステップS107kの処理を繰り返し実行して、すべての外接矩形が文字であると判定すると(ステップS107m)、図2で示した文字領域出力手段108に出力して結果を出力することになる。
次に、本発明の第2の実施の形態について説明する。図11は、この第2の実施の形態の構成を示すブロック図である。
この実施の形態は、上記請求項15に対応し、画像処理方法を実現するプログラムを記録媒体に記録および読み取り可能な汎用の処理装置の構成を示している。
【0054】
この図11において、CPU401、メモリ402、ハードディスク403、入力装置404、CD―ROMドライブ405、ディスプレイ406、CD―ROM等の記録媒体407などから構成され、これらは相互にデータバス408で接続されている。
CD―ROM等の記録媒体407には、本発明の文字領域抽出の「処理機能や本発明の画像処理方法を実行するプログラムが記録されている。
また、処理対象の原画像は、たとえば、ハードディスク403などに格納されている。
CPU401は、記録媒体407に記録されている上記処理機能や処理手順を実現するプログラムを読み出して実行し、文字領域抽出の結果をディプレイ406などに出力する。
なお、本発明は、上述し、かつ図面に示す実施の形態にのみ限定されることなく、その要旨を変更しない範囲内で種々変形して実施することができる。
【0055】
【発明の効果】
以上述べたように、本発明によれば、カラー文書画像から正確に文字領域を抽出することができる画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することが可能となり、特に、請求項1に記載の発明によれば、
文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置であって、
処理対象の上記カラー画像から多値の原画像データを取得する処理対象画像入力手段と、
上記原画像データを圧縮した圧縮画像データを生成する圧縮画像生成手段と、
上記圧縮画像データからランを生成するラン生成手段と、
上記圧縮画像データから生成された上記ランを統合して連結成分を生成する連結成分生成手段と、
上記圧縮画像データから生成された上記連結成分を、所定の条件に従って削除する連結成分選別手段と、
上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する外接矩形統合手段と、
上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字を判定する文字判定手段と、
上記文字判定手段の情報から文字領域を出力する文字領域出力手段と、
を備えることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
【0056】
本発明の請求項2の画像処理装置によれば、上記文字判定手段は、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字を判定することにより、特に、2値化された画像の連結成分の外接矩形中で、縦横比の割合が小さいような場合に文字でないと判断して、統合された外接矩形から文字のみをより高精度に判定することが可能となる。
本発明の請求項3の画像処理装置は、上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記文字判定手段は、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを判定することにより、外接矩形の高さが所定範囲外の場合には、文字でないと判断することができるので、特に、統合された外接矩形の高さが所定範囲外の場合には、統合された外接矩形から必要とする文字の判定精度を向上することが可能となる。
【0057】
本発明の請求項4の画像処理装置によれば、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記連結成分選別手段は、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、該連結成分を削除するか否かを選別するので、連結成分の大きさがあらかじめ定めた値より小さい場合に連結成分データから不要な成分を削除して連結成分の明度が周囲の画素の明度との対比から一部の連結成分データを削除することができるので、特に、連結成分の不要な部分を除去でき、より正確に連結成分を生成することが可能となる。
本発明の請求項5の画像処理装置によれば、上記ラン生成手段は、
各画素をランデータとして登録する手段と、
隣接するランを選択する手段と、
隣接するランの色差を求める手段と、
上記色差が小さい場合は上記ランを統合する手段と、
1ラインのラン統合を繰り返す手段と、
を備えるので、各画素をランデータとして登録後、隣接するランを選択して、隣接するランの色差が小さい場合にはランを統合して、1ラインのラン統合を繰り返すことができるので、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことが可能となる。
【0058】
本発明の請求項6の画像処理装置によれば、上記連結成分生成手段は、
上記ランデータを連結成分データとして登録する手段と、
互いに接触する2つの連結成分を抽出する手段と、
色差があらかじめ定めた値より小さい場合には、連結成分を統合する手段と、
上記連結成分の統合を繰り返す手段と、
を備えることにより、ランデータを連結成分データとして登録後、互いに接触する2つの連結成分を抽出し、その連結成分の色差があらかじめ定めた値より小さい場合には連結成分を統合して、1ラインのラン統合を繰り返すことができるので、特に、互いに接触する2つの連結成分を正確に生成することが可能となる。
【0059】
本発明の請求項7の画像処理装置によれば、上記外接矩形統合手段は、
各連結矩形の外接矩形を求める手段と、
上記外接矩形を2つ選択する手段と、
上記選択された外接矩形の高さ方向の座標値の差異を求める手段と、
上記外接矩形の高さから幅方向の距離限界値を求める手段と、
外接矩形間の幅方向の座標値の差異と上記距離限界値とを比較する手段と、
上記外接矩形間の色差を算出する手段と、
上記高さ方向の座標値の差異、幅方向の座標値の差異、上記距離限界値、上記色差を用いて上記外接矩形の統合の可否を決定する手段と、
上記外接矩形の統合を決定する場合には、双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直す手段と、
を備えることにより、各連結矩形の外接矩形を2つ選択し、選択された外接矩形の高さ方向の座標値の差異を求めるとともに、外接矩形の高さから幅方向の距離限界値を求め、外接矩形間の幅方向の座標値の差異と距離限界値を比較して外接矩形間の色差を算出し、高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて外接矩形の統合の可否を決定し、外接矩形を統合する場合には双方の外接矩形に外接矩形を新たな外接矩形として一つに登録し直すことができるので、特に、連結成分の外接矩形を確実に統合することが可能となる。
本発明の請求項8の画像処理方法によれば、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備えるので、特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
【0060】
本発明の請求項9の画像処理方法によれば、上記第7ステップは、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字判定手段が文字を判定するので、特に、2値化された画像の連結成分の外接矩形中で、文字らしい形状の矩形数が少ない場合に文字でないと判断して、統合された外接矩形から文字らしいもののみをより高精度に判定することが可能となる。
本発明の請求項10の画像処理方法によれば、上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記第7ステップは、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを文字判定手段が判定するので、文字の判定精度を向上することが可能となる。
【0061】
本発明の請求項11の画像処理方法によれば、上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記第5ステップは、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、上記連結成分選別手段が該連結成分を削除するか否かを選別するため、連結成分の大きさがあらかじめ定めた値より小さい場合に連結成分データから不要な成分を削除して連結成分の明度が周囲の画素の明度との対比から所定の割合から外れる連結成分データを削除することができるので、特に、連結成分の不要な部分を除去でき、より正確に連結成分を生成することが可能となる。
【0062】
本発明の請求項12の画像処理方法によれば、上記ラン生成手段により処理される上記第3ステップは、
各画素をランデータとして登録するステップと、
隣接するランを選択するステップと、
上記隣接するランの色差を求めるステップと、
上記色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップと、
を備えるので、各画素をランデータとして登録後、隣接するランを選択して、隣接するランの色差が小さい場合にはランを統合して、1ラインのラン統合を繰り返すことができるので、特に、同色とみなせる画素をランとして抽出して、1ラインのラン統合を確実に行うことが可能となる。
本発明の請求項13の画像処理方法によれば、上記連結成分生成手段によって処理される上記第4ステップは、
上記ランデータを連結成分データとして登録するステップと、
互いに接触する2つの連結成分を抽出するステップと、
上記2つの連結成分の色差を算出するステップと、
上記色差があらかじめ定めた値より小さい場合には、連結成分を統合するステップと、
連結成分の統合を繰り返すステップと、
を備えることにより、各画素をランデータとして登録後、隣接するランを選択して、隣接ランの色差が小さい場合にはランを統合して、1ラインのラン統合を繰り返すことができるので、特に、互いに接触する2つの連結成分を正確に生成することが可能となる。
【0063】
本発明の請求項14の画像処理方法によれば、上記外部矩形統合手段によって処理される上記第6ステップは、
各連結矩形の外接矩形を求めるステップと、
上記外接矩形を2つ選択するステップと、
上記選択された外接矩形の高さ方向の座標値の差異を求めるステップと、
上記外接矩形の高さから幅方向の距離限界値を求めるステップと、
上記外接矩形間の幅方向の座標値の差異と上記距離限界値を比較するステップと、
上記外接矩形間の色差を算出するステップと、
上記高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて上記外接矩形の統合の可否を決定するステップと、
上記外接矩形を統合する場合には双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直すステップと、
を備えることにより、各連結矩形の外接矩形を2つ選択し、選択された外接矩形の高さ方向の座標値の差異を求めるとともに、外接矩形の高さから幅方向の距離限界値を求め、外接矩形間の幅方向の座標値の差異と距離限界値を比較して外接矩形間の色差を算出し、高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて外接矩形の統合の可否を決定し、外接矩形を統合する場合には双方の外接矩形に外接矩形を新たな外接矩形として一つに登録し直すことができるので、特に、連結成分の外接矩形を確実に統合することが可能となる。
本発明の請求項15の記録媒体によれば、文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備える画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能なので、
特に、直接カラー画像の画素情報を用いることにより、カラー文書から正確に文字領域の抽出を可能とし、高い認識精度を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明による画像処理方法の第1実施の形態の画像処理手順を示すフローチャートである。
【図2】本発明による画像処理装置の第1実施の形態の構成を示すブロック図である。
【図3】図2の画像処理装置における圧縮画像生成手段による圧縮画像生成処理手順を説明するためのフローチャートである。
【図4】図2の画像処理装置におけるラン生成手段によるラン生成処理手順を説明するためのフローチャートである。
【図5】図2の画像処理装置における連結成分生成手段による連結成分生成処理手順を説明するためのフローチャートである。
【図6】図2の画像処理装置における連結成分選別手段による連結成分選別生成処理手順を説明するためのフローチャートである。
【図7】図2の画像処理装置における外接矩形統合手段による外接矩形統合処理手順を説明するためのフローチャートである。
【図8】図2の画像処理装置における文字判定手段による文字判定処理手順を説明するためのフローチャートである
【図9】本発明の画像処理方法による外接矩形内のエッジ強度の判定方法に適用される空間フィルタを示す説明図である。
【図10】本発明の画像処理方法による外接矩形内のエッジ強度の判定方法に適用される空間フィルタを示す説明図である。
【図11】本発明の画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能なことを特徴とする記録媒体に記録されているプログラムを読み出してプログラムを実行する処理装置の構成を示すブロック図である。
【符号の説明】
101 処理対象画像入力手段
102 圧縮画像生成手段
103 ラン生成手段
104 連結成分生成手段
105 連結成分選別手段
106 外接矩形統合手段
107 文字判定手段
108 文字領域出力手段
401 CPU
402 メモリ
403 ハードディスク
404 入力装置
405 CD−ROMドライブ
406 ディスプレイ
407 CD−ROM
408 データバス
Claims (15)
- 文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置であって、
処理対象の上記カラー画像から多値の原画像データを取得する処理対象画像入力手段と、
上記原画像データを圧縮した圧縮画像データを生成する圧縮画像生成手段と、
上記圧縮画像データからランを生成するラン生成手段と、
上記圧縮画像データから生成された上記ランを統合して連結成分を生成する連結成分生成手段と、
上記圧縮画像データから生成された上記連結成分を、所定の条件に従って削除する連結成分選別手段と、
上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する外接矩形統合手段と、
上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字を判定する文字判定手段と、
上記文字判定手段の情報から文字領域を出力する文字領域出力手段と、
を備えることを特徴とする画像処理装置。 - 上記文字判定手段は、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字を判定することを特徴とする請求項1記載の画像処理装置。 - 上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記文字判定手段は、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを判定することを特徴とする請求項1または2に記載の画像処理装置。 - 上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記連結成分選別手段は、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、該連結成分を削除するか否かを選別することを特徴とする請求項1乃至3のいずれか1項記載の画像処理装置。 - 上記ラン生成手段は、
各画素をランデータとして登録する手段と、
隣接するランを選択する手段と、
隣接するランの色差を求める手段と、
上記色差が小さい場合は上記ランを統合する手段と、
1ラインのラン統合を繰り返す手段と、
を備えることを特徴とする請求項1記載の画像処理装置。 - 上記連結成分生成手段は、
上記ランデータを連結成分データとして登録する手段と、
互いに接触する2つの連結成分を抽出する手段と、
色差があらかじめ定めた値より小さい場合には、連結成分を統合する手段と、
上記連結成分の統合を繰り返す手段と、
を備えることを特徴とする請求項1記載の画像処理装置。 - 上記外接矩形統合手段は、
各連結矩形の外接矩形を求める手段と、
上記外接矩形を2つ選択する手段と、
上記選択された外接矩形の高さ方向の座標値の差異を求める手段と、
上記外接矩形の高さから幅方向の距離限界値を求める手段と、
外接矩形間の幅方向の座標値の差異と上記距離限界値とを比較する手段と、
上記外接矩形間の色差を算出する手段と、
上記高さ方向の座標値の差異、幅方向の座標値の差異、上記距離限界値、上記色差を用いて上記外接矩形の統合の可否を決定する手段と、
上記外接矩形の統合を決定する場合には、双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直す手段と、
を備えることを特徴とする請求項1記載の画像処理装置。 - 文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備えることを特徴とする画像処理方法。 - 上記第7ステップは、
上記外接矩形統合手段により求められた外接矩形について、該外接矩形内の画像を2値化し、2値化された上記画像に基づいて文字判定手段が文字を判定することを特徴とする請求項8記載の画像処理方法。 - 上記外接矩形の性質は、
該外接矩形の高さおよび外接部分の色情報であり、
上記第7ステップは、
該外接矩形の高さが所定の値以下である場合に、該外接部分の色情報と該外接矩形の周囲の色情報とを比較した結果に基づいて、該外接矩形が文字か否かを判定し、
上記外接矩形内の全画素に対する、該外接矩形内に対応する上記原画像データのエッジ強度が強い画素数の割合に基づいて該外接矩形が文字か否かを文字判定手段が判定することを特徴とする請求項8または9に記載の画像処理方法。 - 上記所定の条件は、
上記連結成分の大きさおよび明度であり、
上記第5ステップは、
上記連結成分の大きさが所定の値以下である場合に該連結成分を削除し、上記連結成分の大きさが所定の値以上であった場合に、該連結成分の明度と該連結成分の周囲の明度を比較した結果に基づいて、上記連結成分選別手段が該連結成分を削除するか否かを選別することを特徴とする請求項8記載の画像処理方法。 - 上記ラン生成手段により処理される上記第3ステップは、
各画素をランデータとして登録するステップと、
隣接するランを選択するステップと、
上記隣接するランの色差を求めるステップと、
上記色差が小さい場合には上記ランを統合するステップと、
1ラインのラン統合を繰り返すステップと、
を備えることを特徴とする請求項8記載の画像処理方法。 - 上記連結成分生成手段によって処理される上記第4ステップは、
上記ランデータを連結成分データとして登録するステップと、
互いに接触する2つの連結成分を抽出するステップと、
上記2つの連結成分の色差を算出するステップと、
上記色差があらかじめ定めた値より小さい場合には、連結成分を統合するステップと、
連結成分の統合を繰り返すステップと、
を備えることを特徴とする請求項8記載の画像処理方法。 - 上記外部矩形統合手段によって処理される上記第6ステップは、
各連結矩形の外接矩形を求めるステップと、
上記外接矩形を2つ選択するステップと、
上記選択された外接矩形の高さ方向の座標値の差異を求めるステップと、
上記外接矩形の高さから幅方向の距離限界値を求めるステップと、
上記外接矩形間の幅方向の座標値の差異と上記距離限界値を比較するステップと、
上記外接矩形間の色差を算出するステップと、
上記高さ方向の座標値の差異、幅方向の座標値の差異、距離限界値、色差を用いて上記外接矩形の統合の可否を決定するステップと、
上記外接矩形を統合する場合には双方の外接矩形に外接する矩形を新たな外接矩形として一つに登録し直すステップと、
を備えることを特徴とする請求項8記載の画像処理方法。 - 文字および文字以外の画像を含むカラー画像から文字領域を抽出する画像処理装置における画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
処理対象画像入力手段により処理対象の上記カラー画像から多値の原画像データを取得する第1ステップと、
上記原画像データから圧縮した圧縮画像データを圧縮画像生成手段により生成する第2ステップと、
ラン生成手段により、上記圧縮画像データからランデータを生成する第3ステップと、
連結成分生成手段により、上記圧縮画像データから生成された上記ランを統合して連結成分を生成する第4ステップと、
連結成分選別手段により、上記圧縮画素データから生成された連結成分を所定の条件に従って排除する第5ステップと、
外接矩形統合手段により、上記圧縮画像データから生成された複数の上記連結成分の外接矩形を1つの外接矩形として統合する第6ステップと、
文字判定手段により、上記圧縮画像データから統合された上記外接矩形の性質および該外接矩形内に対応する上記原画像データのエッジ強度に基づいて文字であると判定する第7ステップと、
上記文字判定手段からの情報を受けて文字領域出力手段が文字領域を出力する第8ステップと、
を備える画像処理方法を実現するプログラムを記録したコンピュータ読み取り可能なことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001086484A JP4558232B2 (ja) | 2001-03-26 | 2001-03-26 | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001086484A JP4558232B2 (ja) | 2001-03-26 | 2001-03-26 | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002288589A JP2002288589A (ja) | 2002-10-04 |
JP4558232B2 true JP4558232B2 (ja) | 2010-10-06 |
Family
ID=18941853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001086484A Expired - Fee Related JP4558232B2 (ja) | 2001-03-26 | 2001-03-26 | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4558232B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4420443B2 (ja) * | 2004-03-19 | 2010-02-24 | キヤノン株式会社 | 帳票認識装置及びその制御方法、プログラム |
EP1555804A3 (en) * | 2004-01-19 | 2006-08-16 | Ricoh Company, Ltd. | Image processing apparatus, image processing program and storage medium |
US7684648B2 (en) | 2005-01-14 | 2010-03-23 | Ricoh Company, Limited | Reducing the size of a document image |
JP4569785B2 (ja) | 2008-01-07 | 2010-10-27 | 富士ゼロックス株式会社 | 二値化装置及び二値化処理プログラム |
JP5299225B2 (ja) | 2009-01-20 | 2013-09-25 | 株式会社リコー | 情報処理装置、情報処理方法、及びプログラム |
JP4821869B2 (ja) | 2009-03-18 | 2011-11-24 | 富士ゼロックス株式会社 | 文字認識装置、画像読取装置、およびプログラム |
JP5075997B2 (ja) * | 2011-03-30 | 2012-11-21 | 株式会社東芝 | 電子機器、プログラムおよび文字列認識方法 |
JP5825142B2 (ja) * | 2012-02-24 | 2015-12-02 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法およびコンピュータープログラム |
JP5874497B2 (ja) | 2012-03-30 | 2016-03-02 | ブラザー工業株式会社 | 画像処理装置および画像処理プログラム |
JP5939154B2 (ja) | 2012-12-27 | 2016-06-22 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP6056468B2 (ja) | 2012-12-27 | 2017-01-11 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP6229415B2 (ja) | 2013-09-30 | 2017-11-15 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP2017135613A (ja) | 2016-01-28 | 2017-08-03 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP6658078B2 (ja) | 2016-02-25 | 2020-03-04 | ブラザー工業株式会社 | 画像処理装置、コンピュータプログラム、および、システム |
JP6769045B2 (ja) | 2016-02-29 | 2020-10-14 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP6747103B2 (ja) | 2016-06-30 | 2020-08-26 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP7193773B2 (ja) | 2018-03-30 | 2022-12-21 | ブラザー工業株式会社 | 制御装置、および、コンピュータプログラム |
JP6978728B2 (ja) | 2018-03-30 | 2021-12-08 | ブラザー工業株式会社 | 制御装置、および、コンピュータプログラム |
JP7185186B2 (ja) | 2019-02-01 | 2022-12-07 | ブラザー工業株式会社 | 画像処理装置、機械学習モデルをトレーニングする方法、および、コンピュータプログラム |
WO2022065299A1 (ja) * | 2020-09-24 | 2022-03-31 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000348159A (ja) * | 1999-06-01 | 2000-12-15 | Ricoh Co Ltd | 画像合成処理方法、撮像装置、画像縮小処理方法及び記録媒体 |
JP2000357230A (ja) * | 1999-06-15 | 2000-12-26 | Ricoh Co Ltd | 画像処理方法、画像処理装置及び記録媒体 |
-
2001
- 2001-03-26 JP JP2001086484A patent/JP4558232B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000348159A (ja) * | 1999-06-01 | 2000-12-15 | Ricoh Co Ltd | 画像合成処理方法、撮像装置、画像縮小処理方法及び記録媒体 |
JP2000357230A (ja) * | 1999-06-15 | 2000-12-26 | Ricoh Co Ltd | 画像処理方法、画像処理装置及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2002288589A (ja) | 2002-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4558232B2 (ja) | 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4603807B2 (ja) | 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
KR100525692B1 (ko) | 컬러 화상 처리 장치 및 패턴 추출 장치 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US9042649B2 (en) | Color document image segmentation and binarization using automatic inpainting | |
EP2645304B1 (en) | Image processing device determining binarizing threshold value | |
JP2002024836A (ja) | ディジタルイメージから表題を抽出する方法 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
EP2645332B1 (en) | Image processing device that separates image into plural regions | |
JP3830998B2 (ja) | 罫線除去方法及びこれを用いた文字認識装置 | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
JP3753357B2 (ja) | 文字抽出方法および記録媒体 | |
CN113392819B (zh) | 一种批量化学术图像自动分割标注装置和方法 | |
JP3606500B2 (ja) | 矩形分類方法 | |
JPH05166002A (ja) | ソース画像を分析する方法 | |
JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
JP2003168076A (ja) | 画像処理方法およびその装置 | |
JP3636936B2 (ja) | 濃淡画像の2値化方法および濃淡画像の2値化プログラムを記録した記録媒体 | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
US6289123B1 (en) | Character extracting method and its apparatus | |
JP4370950B2 (ja) | 画像処理装置 | |
JP4213357B2 (ja) | 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム | |
JP4825888B2 (ja) | 文書画像処理装置および文書画像処理方法 | |
JPH0624014B2 (ja) | 濃淡画像の処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100720 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100721 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |