JP4571758B2 - Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium - Google Patents
Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium Download PDFInfo
- Publication number
- JP4571758B2 JP4571758B2 JP2001103847A JP2001103847A JP4571758B2 JP 4571758 B2 JP4571758 B2 JP 4571758B2 JP 2001103847 A JP2001103847 A JP 2001103847A JP 2001103847 A JP2001103847 A JP 2001103847A JP 4571758 B2 JP4571758 B2 JP 4571758B2
- Authority
- JP
- Japan
- Prior art keywords
- color
- image
- pixel
- binarization
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
- Character Input (AREA)
- Image Processing (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、カラー文書画像などを入力し、文字を認識する文字認識処理や、画像処理を行なう文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来、文字認識装置で認識対象となる文書は、新聞や雑誌など白黒で印刷されたものが一般的であった。ところが、近年、パーソナルコンピュータの普及などに伴ってカラープリンタも低価格化などと共に普及してきている。このため、文字認識の対象となる原稿がカラー文書画像である場合が多くなってきている。
【0003】
また、パーソナルコンピュータの性能向上により、カラー文書画像をそのまま認識処理することも可能になってきているが、カラー画像はメモリサイズが大きくなるなどの制限があった。そこで、カラー画像を低解像度のカラー画像に変換したり、グレー画像を入力画像とし、内部で解像度変換処理を行い、高解像度の2値画像を作成し、その2値画像を対象に文字認識を行うことにより、入力時のメモリサイズを削減することが考えられる。
【0004】
また、着目画素(当該画素)の周辺の濃度情報や濃度変化の情報を用いて2値化の閾値を可変設定することにより、2値化画像を得る技術が特開平5−225329号公報に開示されている。
【0005】
【発明が解決しようとする課題】
しかしながら、低解像度画像を入力画像としているため、解像度変換をおこなっても文字認識を実行する場合に必ずしも最適な高解像度が得られるとは限らない。このため、最適な高解像度を得るには装置あるいは処理方法を複雑にしなければならないという問題点があった。
【0006】
また、入力されたカラー画像から背景濃度を求める際に、背景濃度が変化した場合について対応する必要がある。さらに、特開平5−225392号公報に開示されている技術にあっては、2値化の閾値を可変設定しているので、閾値を決定した後に当該画素と比較処理する必要があり、処理時間が長くなるという問題点があった。
【0007】
本発明は、上記に鑑みてなされたものであって、カラー文書画像の特徴を利用することにより、より単純な構成あるいは方法でカラー文書画像の文字を認識することを第1の目的とする。
【0008】
また、周辺の色情報を求めることにより背景濃度の変化に対応可能にさせることを第2の目的とする。また、2値化処理における処理効率を向上させることを第3の目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するために、請求項1にかかる文字認識装置にあっては、カラー文書画像を入力し、該カラー文書画像の文字認識を行う文字認識装置において、前記カラー文書画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値としてグレー画像に変換するグレー変換手段と、前記グレー変換手段で変換されたグレー画像を、前記代表値としきい値により2値化する2値化手段と、前記2値化手段の2値データから文字認識をおこなう文字認識手段と、を備えたものである。
【0010】
この発明によれば、文字認識装置の対象原稿であるカラー文書画像は、何らかの印刷装置で印刷されている場合が多いため、白黒以外のカラー部分はカラー信号(RGB,CMY(K))で表現されている場合が多く、しかも、文書の地肌(紙)部分は白または明度が高い場合が多く、地肌と区別するためにも、文字部分の明度値は低くなっていることが一般的である、というカラー文書画像の特徴を利用し、グレー変換手段により、カラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値としてグレー画像に変換した後、2値化し、その2値の代表値(代表色)を用いて文字認識することを単純な構成で実現させることが可能になる。
【0013】
また、請求項2にかかる文字認識装置にあっては、さらに、前記グレー変換手段の変換時に、複数の色成分信号のうちのどの信号を代表値としたかの色情報および文字認識結果を記憶しておく記憶手段を設けたものである。
【0014】
この発明によれば、グレー変換手段の変換時に、複数の色成分信号のうちのどの信号を代表値としたかの色情報および文字認識結果を記憶しておく記憶手段を設けることにより、後処理において、代表値の色が何色であるかを把握することが可能となる。
【0015】
また、請求項3にかかる文字認識装置にあっては、さらに、前記記憶手段に記憶した色情報および文字認識結果を表示する表示手段を設けたものである。
【0016】
この発明によれば、表示手段に、代表値の色情報および文字コード情報を表示することにより、ユーザーの使い勝手を向上させる。
【0017】
また、請求項4にかかる文字認識方法にあっては、カラー文書画像を入力し、該カラー文書画像の文字認識を行う文字認識方法において、前記カラー文書画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値として算出する第1の工程と、前記第1の工程で算出した代表値としきい値によりを2値化する第2の工程と、前記第2の工程で2値化された代表値を用いて文字認識を行う第3の工程と、を含むものである。
【0018】
この発明によれば、請求項1と同様に、カラー文書画像の特徴を利用し、カラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値としてグレー画像に変換した後、2値化し、その2値の代表値(代表色)を用いて文字認識することを単純な方法で実現させることが可能になる。
【0021】
また、請求項5にかかるコンピュータ読み取り可能な記録媒体にあっては、前記請求項4に記載の文字認識方法を、コンピュータに実行させるプログラムを記録したものである。
【0022】
この発明によれば、請求項4に記載の文字認識方法を、コンピュータに実行させるプログラムを記録したことにより、請求項4に記載の文字認識動作をコンピュータによって実現することが可能になる。
【0023】
また、請求項6にかかる画像処理装置にあっては、カラー画像を入力し、2値化する画像処理装置において、前記カラー画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を注目画素の代表値として算出する代表値算出手段と、注目画素の周辺の色成分から注目画素の周辺の色情報を求める色情報算出手段と、前記代表値算出手段で算出された代表値と前記カラー画像の注目画素の色成分信号、および前記注目画素の周辺の色情報によって算出される背景濃度に基づいて2値化する2値化手段と、を備えたものである。
【0024】
この発明によれば、カラー画像の各画素におけるカラー信号の複数の色成分信号の最大値または最小値を求めてその値を代表値とし、この代表値と入力されたカラー画像の当該画素(注目画素)の色成分信号、当該画素の周辺の色成分信号から求めた周辺の色情報(背景画素)をもとに、2値化処理することにより、カラー画像における背景濃度の変化に対応することが可能になる。
【0027】
また、請求項7にかかる画像処理装置にあっては、前記2値化手段で2値化する際に用いる入力されたカラー画像の当該画素の色成分信号は、前記代表値を求める際に用いた色成分信号以外の信号とするものである。
【0028】
この発明によれば、請求項6の画像処理装置において、2値化する際に用いるカラー画像の当該画素の色成分信号を、代表値を求める際に用いた色成分信号以外の信号とすることにより、高精度の2値化が可能になる。
【0029】
また、請求項8にかかる画像処理装置にあっては、前記代表値を求める色成分信号は、赤と緑の色成分信号の最大値とするものである。
【0030】
この発明によれば、請求項6の画像処理装置において、代表値を求める色成分信号は、赤と緑の色成分信号の最大値とすることにより、たとえば白地の場合、R(赤),G(緑),B(黒)のいずれの値も8ビットデータの場合、255に近い値になるのに対し、黄色で非背景画素が描かれているとRとGの値は255に近く、Bの値はゼロに近くなり、Rの値が大きく、GとBの値が小さい場合の色、Gの値が大きく、RとBの値が小さい色の3色を同時に検出することが可能になる。
【0031】
また、請求項9にかかる画像処理装置にあっては、前記2値化手段で2値化する際に用いる入力されたカラー画像の当該画素の色成分信号は、青の色成分信号とするものである。
【0032】
この発明によれば、請求項6の画像処理装置において、2値化する際に用いる入力されたカラー画像の当該画素の色成分信号を、青の色成分信号とすることにより、正確な2値化処理が可能になる。
【0035】
また、請求項10にかかる画像処理装置にあっては、前記2値化処理手段による2値化処理の結果から背景画素と非背景画素とを分離するものである。
【0036】
この発明によれば、請求項6の画像処理装置において、2値化処理の結果から背景画素と非背景画素とを分離することにより、対象物(非背景画素)に対する後処理の簡素化が実現可能になる。
【0039】
また、請求項11にかかる画像処理装置にあっては、前記色情報算出手段は、前記背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出するものである。
【0040】
この発明によれば、請求項6の画像処理装置において、背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出することにより、連続して非背景画素が続く画像において周辺の色情報が得られなくなる事態が回避される。
【0041】
また、請求項12にかかる画像処理装置にあっては、さらに、前記代表値、入力されたカラー画像の注目画素の色成分信号、周辺の色情報、からなる3次元の2値化テーブルを備え、前記2値化手段は前記2値化テーブルの3つの特徴量を用いて2値化処理を行なうものである。
【0042】
この発明によれば、請求項6の画像処理装置において、代表値、入力されたカラー画像の注目画素の色成分信号、周辺の色情報、の3つの特徴量を3次元の2値化テーブルとして用意してくことにより、2値化処理時における処理が迅速に行なえる。
【0043】
また、請求項13にかかる画像処理装置にあっては、入力されたカラー画像のビット数を少なくした後に、前記代表値を算出し、2値化テーブルを作成するものである。
【0044】
この発明によれば、請求項6の画像処理装置において、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、代表値の算出処理を行なうことにより、その処理の迅速化が可能になると共に、2値化テーブルを作成することによりデータ量の削減が可能になる。
【0049】
また、請求項14にかかる画像処理方法にあっては、カラー画像を入力し、2値化する画像処理方法において、前記カラー画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を注目画素の代表値として算出する代表値算出工程と、注目画素の周辺の色成分から注目画素の周辺の色情報を求める色情報算出工程と、前記代表値と前記カラー画像の注目画素の色成分信号、および前記注目画素の周辺の色情報によって算出される背景濃度に基づいて2値化する2値化工程と、を含むものである。
【0050】
この発明によれば、カラー画像の各画素におけるカラー信号の複数の色成分信号の最大値または最小値を求めてその値を代表値とし、この代表値と入力されたカラー画像の当該画素(注目画素)の色成分信号、当該画素の周辺の色成分信号から求めた周辺の色情報(背景画素)をもとに、2値化処理することにより、カラー画像における背景濃度の変化に対応することが可能になる。
【0053】
また、請求項15にかかる画像処理方法にあっては、前記2値化工程で2値化する際に用いる入力されたカラー画像の注目画素の色成分信号は、前記代表値を求める際に用いた色成分信号以外の信号とするものである。
【0054】
この発明によれば、請求項14の画像処理方法において、2値化する際に用いるカラー画像の注目画素の色成分信号を、代表値を求める際に用いた色成分信号以外の信号とすることにより、高精度の2値化が可能になる。
【0055】
また、請求項16にかかる画像処理方法にあっては、前記代表値を求める色成分信号は、赤と緑の色成分信号の最大値とするものである。
【0056】
この発明によれば、請求項14の画像処理方法において、代表値を求める色成分信号は、赤と緑の色成分信号の最大値とすることにより、たとえば白地の場合、R(赤),G(緑),B(黒)のいずれの値も8ビットデータの場合、255に近い値になるのに対し、黄色で非背景画素が描かれているとRとGの値は255に近く、Bの値はゼロに近くなり、Rの値が大きく、GとBの値が小さい場合の色、Gの値が大きく、RとBの値が小さい色の3色を同時に検出することが可能になる。
【0057】
また、請求項17にかかる画像処理方法にあっては、前記2値化工程で2値化する際に用いる入力されたカラー画像の注目画素の色成分信号は、青の色成分信号とするものである。
【0058】
この発明によれば、請求項14の画像処理方法において、2値化する際に用いる入力されたカラー画像の注目画素の色成分信号を、青の色成分信号とすることにより、正確な2値化処理が可能になる。
【0061】
また、請求項18にかかる画像処理方法にあっては、前記2値化処理工程による2値化処理の結果から背景画素と非背景画素とを分離するものである。
【0062】
この発明によれば、請求項14の画像処理方法において、2値化処理の結果から背景画素と非背景画素とを分離することにより、対象物(非背景画素)に対する後処理の簡素化が実現可能になる。
【0065】
また、請求項19にかかる画像処理方法にあっては、前記色情報算出工程は、前記背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出するものである。
【0066】
この発明によれば、請求項14の画像処理方法において、背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出することにより、連続して非背景画素が続く画像において周辺の色情報が得られなくなる事態が回避される。
【0067】
また、請求項20にかかる画像処理方法にあっては、さらに、前記代表値、入力されたカラー画像の注目画素の色成分信号、周辺の色情報、からなる3次元の2値化テーブルを用意する工程を含み、前記2値化工程は前記2値化テーブルの3つの特徴量を用いて2値化処理を行なうものである。
【0068】
この発明によれば、請求項14の画像処理方法において、代表値、入力されたカラー画像の注目画素の色成分信号、周辺の色情報、の3つの特徴量を3次元の2値化テーブルとして用意してくことにより、2値化処理時における処理が迅速に行なえる。
【0069】
また、請求項21にかかる画像処理方法にあっては、入力されたカラー画像のビット数を少なくした後に、前記代表値を算出し、2値化テーブルを作成するものである。
【0070】
この発明によれば、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、代表値の算出処理を行なうことにより、その処理の迅速化が可能になると共に、2値化テーブルを作成することによりデータ量の削減が可能になる。
【0073】
また、請求項22にかかる画像処理方法にあっては、前記2値化工程の処理結果を用い、入力されたカラー画像中の特定パターンを認識するものである。
【0074】
この発明によれば、請求項14〜21のいずれか1つに記載の画像処理を行なうことにより、背景色と対象物との分離が実現され、文字などの特定パターンの認識が可能になる。
【0075】
また、請求項23にかかるコンピュータ読み取り可能な記録媒体にあっては、前記請求項14〜22のいずれか1つに記載の画像処理方法を、コンピュータに実行させるものである。
【0076】
この発明によれば、前記請求項14〜22のいずれか1つの画像処理方法を、コンピュータに実行させるプログラムを記録したことにより、請求項14〜22のいずれか1つに記載の画像処理動作をコンピュータによって実現することが可能になる。
【0077】
【発明の実施の形態】
以下、本発明にかかる文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体の好適な実施の形態について添付図面を参照し、詳細に説明する。なお、本発明はこの実施の形態に限定されるものではない。
【0078】
(実施の形態1)
まず、この実施の形態で取り扱うカラー画像について説明する。カラースキャナなどのカラー画像入力装置から入力されるカラー画像をデジタル化するには、まず、各点の色をR(赤),G(緑),B(青)の成分に分解する。これにより、R,G,Bの濃淡の分布として3つのモノクロ画像が得られる。これらRチャンネル,Gチャンネル,Bチャンネルの各チャンネルに対し、共通の画素への分割、同じ量子化の階調数をとり、A/D変換を行う。
【0079】
デジタル化されたカラー画像は、R,G,B3つのモノクロデジタル画像の重ね合わせである。R,G,Bチャンネルでの画素への分解を共通にとってあれば、デジタルのカラー画像は、各画素に対してR.G,Bの明るさを表す3つの数値の組み(R.G,B)が決まっていると考えられる。たとえば、各チャンネル毎に階調数256で量子化を行った場合、R.G,Bそれぞれは、R=0〜255,G=0〜255,B=0〜255の整数値をとる。なお、256階調は8ビットの情報量であるので、各画素あたりの情報量は8ビット×3=24ビットとなる。このようにRGBそれぞれ8ビット、合計24ビットで表現することをRGB24ビットカラー表現という。
【0080】
さて、一般に使われているカラー文書画像は、100色とか200色とか多くの色を用いて印刷されるのはまれである。たとえば、白黒の文字の中に部分的にカラーの文字情報があったり、ページ全体が数色の色文字となっている場合が大半である。また、その色は、印刷時に用いられるインクの原色であるシアン,マゼンタ,イエロー(以下、C,M,Yという)や、赤,青,緑(以下、R,B,Gという)であることが多い。
【0081】
また、これらの文書画像を読み取るスキャナやファクシミリ装置、デジタルスチルカメラなどの光学的読取装置は、R,B,GのCCD(固体撮像素子)を用いていることが多く、これら装置からの出力は、R,B,Gの色成分信号であることが多い。
【0082】
さらに、印刷時に用いるインクの原色である、C,M,Yと、上記装置から出力される赤,青,緑は、補色関係にあり、所定の変換式で簡単に計算することが可能である。したがって、本発明はこれらのカラー文書画像の特徴を積極的に活用することにより、より単純な装置構成でカラー画像を認識し、再現することを可能にするものである。
【0083】
つぎに、装置の構成について説明する。図1は、本発明の実施の形態にかかる文字認識装置の構成を示すブロック図である。図において、符号1は、スキャナやファクシミリ装置、デジタルスチルカメラなどのカラー画像入力装置から入力されるカラー文書画像からグレー画像を作成するグレー変換回路、符号2はグレー変換回路1でグレー変換されたグレー画像を白/黒の2値データに変換する2値化回路、符号3は2値化回路2で2値化された2値データの文字を認識する文字認識回路である。
【0084】
図2は、図1におけるグレー変換回路1および2値化回路2の構成を示すブロック図である。グレー変換回路1は、入力されたカラー文書画像を構成するR(赤),G(緑),B(青)、あるいはC(シアン),M(マゼンタ),Y(イレロー),K(黒)の各画素のカラー信号の複数の色成分信号の最大値または最小値を、当該画素の代表値としてグレー画像を作成する。2値化回路2は、代表値の8ビット画像から、固定しきい値あるいは判別分析法などによって白画素データと黒画素データとに2値化する。
【0085】
図3は、図1における文字認識回路3の構成を示すブロック図である。図において、符号10は2値化回路2の2値データから、たとえば水平射影(横書き文書では横方向の射影)をとり行画像(文字列画像)を切り出す行切り出し部、符号11は切り出された行画像(文字列画像)に対し、垂直射影をとったり黒画素の連結を追跡することにより文字塊(文字素)を切り出す文字切り出し部、符号12は文字塊(文字素)から文字の大きさ、位置情報などを抽出する特徴抽出部、符号13は標準文字パターン情報が格納されているパターンメモリ、符号14は特徴抽出部12で抽出された情報とパターンメモリ13に格納された情報とから文字を認識し、文字コード情報を出力する文字認識部である。
【0086】
つぎに、以上のように構成された文字認識装置の動作について説明する。図4は、本発明の実施の形態にかかる第1の動作手順例を示すフローチャートである。まず、スキャナなどからカラー文書画像を入力する(ステップS11)。なお、カラー文書画像に用いられる色成分として代表的なものとしては、R,G,BとC,M,Yに黒(以下、Kという)を含めたC,M,Y,Kが用いられることが多い。これらR,G,BとC,M,Yの間には、「Y=255−B」、「C=255=R」、「M=225−G」の関係が存在し、簡単な変換式で変換することができる。
【0087】
また、変換式は、上述の変換式に限らず、一般的には、
C = k1×R + k2×G + k3×B
M = k4×R + k5×G + k6×B
Y = k7×R + k8×G + k9×B
に示すような式で表される。なお、k1〜k9は係数である。
【0088】
一般に、R,G,BまたはC,M,Y,(K)が用いられるのは、スキャナやファクシミリ装置、デジタルスチルカメラなどの光学的読取装置で用いられているCCDがR,G,Bの色成分信号を出力することにより、また、プリンタなどの印刷装置で用いられるインクの原色がC,M,Y,(K)であることによる。
【0089】
一方、文字認識装置の対象原稿であるカラー文書画像は、何らかの印刷装置で印刷されている場合が多い。そのため、白黒以外のカラー部分はR,G,BまたはC,M,Yで表現されている場合が多い。また、文書の地肌(紙)部分は白または明度が高い場合が多く、地肌と区別するためにも、文字部分の明度値は低くなっていることが一般的である。
【0090】
さて、図4のステップS11を実行した後、R,G,B(C,M,Y,(K))の最小値(または最大値)を代表値として算出する(ステップS12)。ここで、R,G,B各8ビット256階調(合計24ビット)から代表値の8ビット画像を作成する例について説明する。
【0091】
たとえば、R,G,Bの色信号で、赤色(R)の文字は、R,G,B値(255,0,0)のようになり、緑色(G)の文字のR,G,B値は(0,255,0)のように、青色(B)のR,G,B値は(0,0,255)のようになる。
また、黒文字の場合は(0,0,0)となり、地肌(紙)の部分は(255,255,255)となる。これらをまとめたものを図5に示す。
【0092】
図5に示すように、文字部分では、R,G,B値のいずれかの値が小さく(この例では0になる)なることを利用し、R,G,B値の最小値を代表値として用いることにより、色によらず文字部分と地肌部分とを分けることが可能になる。
【0093】
つぎに、図4のステップS12において代表値を算出すると、続いて、2値化処理を実行する(ステップS13)。すなわち、上記代表値の段階では、図5の場合、R,G,Bそれぞれ8ビット(256階調)の24ビットが1画素あたり8ビットになっているだけで、2値されているわけではない。代表値の8ビット画像から2値化する方法は、固定のしきい値で2値化してよいし、判別分析法など様々なところで用いられている公知の手法を採用してもよい。
【0094】
続いて、ステップS13で2値化処理された2値データを文字認識回路3に入力し、文字認識処理を実行する(ステップS14)。すなわち、行切り出し部10によって文字列が切り出される。さらに、文字切り出し部11によって切り出された行画像(文字列画像)から、垂直射影をとったり黒画素の連結を追跡することにより文字塊を切り出し、特徴抽出部12により文字の大きさや位置などを抽出する。その後、文字認識部14がパターンメモリ13の辞書を参照し、文字認識をおこない、文字コード情報を出力する。
【0095】
続いて、上述の文字認識結果(文字コード情報)と、代表値としてR,G,B値のどの値を用いたかにより、その文字の色が何色であったかの色情報を併せて装置に備えているメモリあるいは外部メモリに保存するかまたはディスプレイなどに表示する(ステップS15)。
【0096】
図7は、他の文字認識装置の構成を示すブロック図であり、図1に示した文字認識装置の構成に対し、文字認識回路3の後段に文字コード情報および色情報を格納するためのメモリ4を設けたものである。また、図8は、図7の文字認識装置の動作手順を示すフローチャートであり、第2の動作手順例を示すフローチャートである。この動作手順では、前述した図4のフローチャートに対し、ステップS23およびステップS26を付加したものである。
【0097】
すなわち、ステップS22でR,G,B(C,M,Y,(K))の最小値(または最大値)を代表値として算出した後、R,G,B(C,M,Y,(K))のどの値を代表値として用いたかをメモリ4に記憶する(ステップS23)。また、ステップS26では、ステップS25において認識した文字の文字コード情報をメモリ4に記憶する。なお、他の処理は図4と同じであるので省略する。
【0098】
このように、代表値としてR,G,B値のどの値を用いたかを記憶することにより、文字認識結果と併せて、その文字の何色で書かれていたかの情報を得ることができる。
【0099】
ところで、上述した実施の形態による手法を用いずに、従来よく用いられている「カラーからグレー」への変換方式として、G成分のみを抜き出すと図6に示すようになってしまい、緑文字の場合、地肌との区別ができなくなる。
【0100】
なお、この実施の形態では、R,G,Bを用いて説明をおこなったが、C,M,Y,(K)でもR,G,Bと同様である。また、この実施の形態では、黒文字のR,G,B値を(0,0,0)としたが、画像フォーマットによっては、黒文字を(255,255,255)と白黒反転して保持する場合もあるので、このような場合には、代表値は、R,G,B値の最大値を用いる。
【0101】
(実施の形態2)
図9は、本発明の実施の形態2にかかる画像処理装置の構成を示すブロック図である。この画像処理装置は、R,G,Bのカラー画像信号を入力するカラー画像入力部100と、R,G,Bのカラー画像信号の各8ビットの画像信号を各5ビットに変換するガンマ変換部101と、R,Gの画像信号の最大値を求める最大値算出部102と、R,G,Bのカラー画像信号から背景濃度を求める背景濃度算出部103と、上記最大値および背景濃度を2値化する2値化処理部104と、3次元の特徴がテーブル化されている2値化テーブル105と、を備えている。
【0102】
つぎに以上のように構成された画像処理装置について説明する。まず、カラー画像入力部100は、デジタル複写機あるいはカラーイメージスキャナなどのカラー入力装置、あるいはコンピュータなどからR,G,Bのカラー画像信号を入力する。ガンマ変換部101はこのR,G,Bのカラー画像信号に対し、それぞれ8ビットの画像を5ビットの画像に変換する。さらに、最大値算出部102によりRとGの値の最大値を求め、代表値とする。
【0103】
また、背景濃度算出部103により、後述するように、R,G,Bのカラー画像信号5ビットから前32画素を参照し、背景濃度を求める。この背景濃度、上記代表値、代表値の算出に用いなかったBの画素値を2値化処理部104に送る。2値化処理部104は、代表値MAX(R、G)5ビット、背景濃度(5ビット)、B(5ビット)を、2値化テーブル105を用いて2値化処理する。なお、2値化テーブル105は、後述するような3次元の特徴量をもっている。
【0104】
ところで、ここではカラー画像信号をR,G,Bとしているが、C,M,YあるいはC,M,Y,Kなどの値であってもよい。また、最大値算出部102により代表値を求める際、ここではRとGとを用いたが、GとBあるいはRとBであってもよいし、さらにはC,M,Y,Kのいずれの組み合わせであってもよい。
さらに、これら2つの信号の比較ではなく、3つ以上を比較して代表値を求めてもよい。
【0105】
つぎに、当該画素の周辺の色情報として、背景濃度を求める動作について説明する。デジタルカラー複写機やデジタルカラースキャナなどの場合、主走査方向に1ラインずつデータを読み込むことになる。読み込んだデータを逐次的に処理を行なわない場合、前ラインのデータなどをラインメモリに保存しておく必要がある。そこで、1ライン内のデータのみ、それも注目画素よりも以前に入力されたデータのみを用いて当該画素の周辺の色情報(=背景濃度)を算出する。この背景濃度の算出について以下に詳述する。
【0106】
図10は、本発明の実施の形態2にかかる背景濃度の算出方法を示す説明図である。この図10では、注目画素51の前方32画素の値をみて背景濃度算出する例について示している。ここで、周辺の色情報(=背景濃度)として、「RとGの最大値と、Bの値の差」を1つの特徴量としている。
【0107】
すなわち、図10(a)では注目画素51の前方32画素で、2値化処理によって背景画素52であると判定された画素において、
(intens(=Max(R,B)−B)
を背景濃度とする。
【0108】
一方、図10(b)に示す画像パターンのように、前方32画素のうち、注目画素51の直前の18画素がすべて非背景画素53aの場合には、2値化結果によらず注目画素51の前方32画素すべての(intensの和/32)を背景濃度とする。
【0109】
したがって、上記特徴量「RとGの最大値と、Bの値の差」を用いることによって白地に書かれた3色の非背景画素(対象物)を同時に検出することが可能になる。すなわち、白地の場合、R,G,Bのいずれの値も8ビットデータの場合、255に近い値になるのに対し、黄色で非背景画素が描かれているとRとGの値は255に近く、Bの値はゼロに近くなる。同様に、Rの値が大きく、GとBの値が小さい場合の色、Gの値が大きく、RとBの値が小さい色の3色を同時に検出することができる。
【0110】
また、上述した処理において、背景画素52であると判断された画素のカラー情報のみを用いて周辺の色情報(=背景濃度)を求めることにより、非背景画素に影響されることなく周辺の色情報を求めることができる。
【0111】
ただし、連続して非背景画素が続いた(図10(b))場合、周辺の色情報が求まらなくなる不具合が生じる。そこで、抽出を行ないたい対象物の大きさを考慮し、たとえば、抽出対象物の最大画素数が16画素だった場合、16画素以上対象物が続くことがありえないので、これより若干大きめの18画素連続して非背景画素が続けば、注目画素51の直前のすべての画素値から背景濃度の算出を行なう。
【0112】
この背景濃度の算出方法を図11のフローチャートに示す。まず、各パラメータを初期化する(ステップS31)。すなわち、mean1(注目画素の前方32画素)、mean(注目画素の前方32画素のうち、背景画素と判断されたもの)、flagを0に初期化する。続いて、2値化処理を実行する(ステップS32)。
【0113】
すなわち、
rst(x)=binTable(max(x),blue(x),mean)
rst(x)=0 白画素(背景)
rst(x)=1 黒画素(非背景)
の2値化処理を実行する。続いて、背景濃度を図示のアルゴリズムにしたがって求める(ステップS33)。
【0114】
なお、図11において、
max(x)=Max(red(x),green(x))
intens(x)=Max(red(x),green(x))−blue(x)
mean1=Σintens(x),mean=Σintens(x)
とする。
【0115】
ところで、これまで説明してきた文字認識方法、および画像処理方法を、プログラム化し、コンピュータ読み取り可能な記録媒体に記録し、コンピュータ上で実行することもできる。また、文字認識方法、画像処理方法の一部をネットワーク上に有し、通信回線を通して実現することもできる。
【0116】
すなわち、この実施の形態で説明した文字認識方法、画像処理方法は、図12に示すように、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータ(CPU20)で実行することにより実現される。このプログラムは、キーボード25の操作などにより、メモリ21、ハードディスク24、フロッピーディスク27、CD−ROM26、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータ(CPU20)によって記録媒体から読み出されることによって実行される。また、必要に応じてこの文字認識、あるいは画像処理のデータを通信装置22から外部装置に送受信することも可能である。
【0117】
また、このプログラムは、図13に示すように、上記記録媒体を介して、インターネット30などのネットワークによってパーソナルコンピュータなどの装置31〜33に配布することができる。
【0118】
【発明の効果】
以上説明したように、本発明にかかる文字認識装置(請求項1)によれば、文字認識装置の対象原稿であるカラー文書画像は、文字部分では、R,G,B値のいずれかの値が小さく(この例では0になる)なることを利用し、R,G,B値の最小値を代表値として用いることにより、色によらず文字部分と地肌部分とを分けることが可能になる、というカラー文書画像の特徴を利用し、グレー変換手段により、カラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値としてグレー画像に変換した後、2値化し、その2値の代表値(代表色)を用いて文字認識するため、より単純な構成の装置でカラー文書画像の文字を認識することができる。
【0120】
また、本発明にかかる文字認識装置(請求項2)によれば、グレー変換手段の変換時に、複数の色成分信号のうちのどの信号を代表値としたかの色情報および文字認識結果を記憶しておく記憶手段を設けることにより、認識結果を利用する際などの後処理において、代表値の色が何色であるかを迅速に確認することができる。
【0121】
また、本発明にかかる文字認識装置(請求項3)によれば、表示手段に、代表値の色情報および文字コード情報を表示するため、認識結果の文字コード情報およびその色情報がディスプレイなどの表示部でユーザーが即座に確認することができる。
【0122】
また、本発明にかかる文字認識方法(請求項4)によれば、請求項1と同様に、カラー文書画像の特徴を利用し、カラー信号における複数の色成分信号の最大値または最小値を注目画素の代表値としてグレー画像に変換した後、2値化し、その2値の代表値(代表色)を用いて文字認識するため、より単純な方法でカラー文書画像の文字を認識することができる。
【0124】
また、本発明にかかるコンピュータ読み取り可能な記録媒体(請求項5)によれば、請求項4に記載の文字認識方法を、コンピュータに実行させるプログラムを記録したので、請求項4に記載の文字認識動作をコンピュータによって実現することができる。
【0125】
また、本発明にかかる画像処理装置(請求項6)によれば、カラー画像の各画素におけるカラー信号の複数の色成分信号の最大値または最小値を求めてその値を代表値とし、この代表値と入力されたカラー画像の当該画素(注目画素)の色成分信号、当該画素の周辺の色成分信号から求めた周辺の色情報(背景画素)をもとに2値化処理するため、入力されたカラー画像の背景濃度が変化しても対象物画像の2値化データを高精度に得ることができる。
【0127】
また、本発明にかかる画像処理装置(請求項7)によれば、請求項6の画像処理装置において、2値化する際に用いるカラー画像の当該画素の色成分信号を、代表値を求める際に用いた色成分信号以外の信号とするので、高精度の2値化が可能になる。
【0128】
また、本発明にかかる画像処理装置(請求項8)によれば、請求項6の画像処理装置において、代表値を求める色成分信号は、赤と緑の色成分信号の最大値とするので、白地に書かれた3色の非背景画素(対象物)を同時に検出することができる。
【0129】
また、本発明にかかる画像処理装置(請求項9)によれば、請求項6の画像処理装置において、2値化する際に用いる入力されたカラー画像の注目画素の色成分信号を、青の色成分信号とすることにより、正確な2値化処理が可能になる。
【0131】
また、本発明にかかる画像処理装置(請求項10)によれば、請求項6の画像処理装置において、2値化処理の結果から背景画素と非背景画素とを分離するため、対象物(非背景画素)に対する後処理を簡単に行なうことができる。
【0133】
また、本発明にかかる画像処理装置(請求項11)によれば、請求項6の画像処理装置において、背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出するため、連続して非背景画素が続く画像において周辺の色情報が得られなくなる事態が回避され、正しい背景濃度を得ることができる。
【0134】
また、本発明にかかる画像処理装置(請求項12)によれば、請求項6の画像処理装置において、代表値、入力されたカラー画像の注目画素の色成分信号、周辺の色情報、の3つの特徴量を3次元の2値化テーブルとして用意してくことにより、2値化処理時における処理が迅速に行なえるので、処理効率が向上する。
【0135】
また、本発明にかかる画像処理装置(請求項13)によれば、請求項12の画像処理装置において、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、代表値の算出処理を行なうため、代表値算出を効率よく行なうことができる。また、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、2値化テーブルを作成するため、データ量の削減が可能になり、メモリの有効活用および容量の低減が実現する。
【0138】
また、本発明にかかる画像処理方法(請求項14)によれば、カラー画像の各画素におけるカラー信号の複数の色成分信号の最大値または最小値を求めてその値を代表値とし、この代表値と入力されたカラー画像の当該画素(注目画素)の色成分信号、当該画素の周辺の色成分信号から求めた周辺の色情報(背景画素)をもとに2値化処理するため、入力されたカラー画像の背景濃度が変化しても対象物画像の2値化データを高精度に得ることができる。
【0140】
また、本発明にかかる画像処理方法(請求項15)によれば、請求項14の画像処理方法において、2値化する際に用いるカラー画像の当該画素の色成分信号を、代表値を求める際に用いた色成分信号以外の信号とするので、高精度の2値化処理を行なうことができる。
【0141】
また、本発明にかかる画像処理方法(請求項16)によれば、請求項14の画像処理方法において、代表値を求める色成分信号は、赤と緑の色成分信号の最大値とするので、白地に書かれた3色の非背景画素(対象物)を同時に検出することができる。
【0142】
また、本発明にかかる画像処理方法(請求項17)によれば、請求項14の画像処理方法において、2値化する際に用いる入力されたカラー画像の当該画素の色成分信号を、青の色成分信号とするため、正確な2値化処理を行なうことができる。
【0144】
また、本発明にかかる画像処理方法(請求項18)によれば、請求項14の画像処理方法において、2値化処理の結果から背景画素と非背景画素とを分離するので、カラー画像における対象物(非背景画素)に対する後処理を簡単におこなうことができる。
【0146】
また、本発明にかかる画像処理方法(請求項19)によれば、請求項14の画像処理方法において、背景画素が所定の閾値に対して多く連続した場合、背景画素、非背景画素の区別なく、周辺の色成分信号を用いて周辺の色情報を算出するため、連続して非背景画素が続く画像において周辺の色情報が得られなくなる事態が回避され、正しい周辺の色情報が得られる。
【0147】
また、本発明にかかる画像処理方法(請求項20)によれば、請求項14の画像処理方法において、代表値、入力されたカラー画像の当該画素の色成分信号、周辺の色情報、の3つの特徴量を3次元の2値化テーブルとして用意して2値化時に用いるので、2値化処理時における処理を効率よく行なうことができる。
【0148】
また、本発明にかかる画像処理方法(請求項21)によれば、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、代表値の算出処理を行なことにより、少ないデータでの処理となるので、代表値算出の処理効率が向上する。また、入力されたカラー画像が、たとえば各8ビット構成であった場合に、各5ビットに変換した後、2値化テーブルを作成するので、データ量の削減が実現し、メモリ容量の有効活用および小型化を図ることができる。
【0150】
また、本発明にかかる画像処理方法(請求項22)によれば、請求項14〜21のいずれか1つに記載の画像処理を行なうことにより、背景色と対象物との分離がより確実になるので、文字などの特定パターンをより正確に認識することができる。
【0151】
また、本発明にかかるコンピュータ読み取り可能な記録媒体(請求項23)によれば、請求項14〜22のいずれか1つの画像処理方法を、コンピュータに実行させるプログラムを記録したことにより、請求項14〜22のいずれか1つに記載の画像処理動作をコンピュータによって実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかる文字認識装置の構成を示すブロック図である。
【図2】図1におけるグレー変換回路および2値化回路の構成を示すブロック図である。
【図3】図1における文字認識回路の構成を示すブロック図である。
【図4】本発明の実施の形態1にかかる第1の動作手順例を示すフローチャートである。
【図5】本発明の実施の形態1にかかるRGB値から代表値を決定する例を示す説明図である。
【図6】RGB値からG成分のみを抜き出した場合を示す説明図である。
【図7】本発明の実施の形態1にかかる他の文字認識装置の構成を示すブロック図である。
【図8】本発明の実施の形態1にかかる第2の動作手順例を示すフローチャートである。
【図9】本発明の実施の形態2にかかる画像処理装置の構成を示すブロック図である。
【図10】本発明の実施の形態2にかかる背景濃度の算出例を示す説明図である。
【図11】本発明の実施の形態2にかかる背景濃度の算出処理を示すフローチャートである。
【図12】本発明にかかる文字認識方法および画像処理方法をソフトウェアによって実現するコンピュータシステム例を示すブロック図である。
【図13】本発明にかかる文字認識方法および画像処理方法をネットワーク上で実現するシステム例を示すブロック図である。
【符号の説明】
1 グレー変換回路
2 2値化回路
3 文字認識回路
4 メモリ
10 行切り出し部
11 文字切り出し部
12 特徴抽出部
14 文字認識部
100 カラー画像入力部
101 ガンマ変換部
102 最大値算出部
103 背景濃度算出部
104 2値化処理部
105 2値化テーブル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition process for recognizing characters by inputting a color document image or the like, a character recognition device for performing image processing, a character recognition method, an image processing device, an image processing method, and a computer-readable recording medium.
[0002]
[Prior art]
Conventionally, a document to be recognized by a character recognition device is generally printed in black and white such as a newspaper or a magazine. However, in recent years, with the spread of personal computers, color printers have also become popular with lower prices. For this reason, there are many cases where a document to be subjected to character recognition is a color document image.
[0003]
In addition, it has become possible to recognize a color document image as it is due to an improvement in the performance of a personal computer, but the color image has a limitation such as an increase in memory size. Therefore, a color image is converted to a low-resolution color image, or a gray image is used as an input image, and resolution conversion processing is internally performed to create a high-resolution binary image, and character recognition is performed on the binary image. By doing so, it is conceivable to reduce the memory size at the time of input.
[0004]
Japanese Patent Laid-Open No. 5-225329 discloses a technique for obtaining a binarized image by variably setting a binarization threshold value using density information and density change information around the pixel of interest (the pixel concerned). Has been.
[0005]
[Problems to be solved by the invention]
However, since a low-resolution image is used as an input image, even when resolution conversion is performed, an optimum high resolution is not always obtained when character recognition is executed. For this reason, there has been a problem that the apparatus or the processing method has to be complicated in order to obtain the optimum high resolution.
[0006]
Further, when the background density is obtained from the input color image, it is necessary to cope with the case where the background density changes. Further, in the technique disclosed in Japanese Patent Laid-Open No. 5-225392, the threshold value for binarization is variably set. Therefore, it is necessary to perform comparison processing with the pixel after determining the threshold value, and the processing time There was a problem that was long.
[0007]
The present invention has been made in view of the above, and a first object thereof is to recognize characters of a color document image with a simpler configuration or method by utilizing the characteristics of the color document image.
[0008]
A second object is to make it possible to cope with changes in background density by obtaining peripheral color information. A third object is to improve the processing efficiency in the binarization process.
[0009]
[Means for Solving the Problems]
In order to achieve the above object, in the character recognition device according to
[0010]
According to the present invention, since a color document image that is a target original of a character recognition device is often printed by some printing device, color portions other than black and white are expressed by color signals (RGB, CMY (K)). In many cases, the background (paper) portion of the document is white or light, and the lightness value of the character portion is generally low in order to distinguish it from the background. The gray document is converted into a gray image using the maximum or minimum value of a plurality of color component signals in the color signal as a representative value of the pixel, and binarized. Character recognition using a representative value (representative color) of values can be realized with a simple configuration.
[0013]
Claims2In the character recognition device according to the present invention, storage means for storing color information indicating which signal of the plurality of color component signals is a representative value and a character recognition result at the time of conversion by the gray conversion means. Is provided.
[0014]
According to the present invention, the post-processing is provided by storing the color information indicating which signal of the plurality of color component signals is the representative value and the character recognition result at the time of the conversion by the gray conversion unit. Thus, it is possible to grasp the color of the representative value.
[0015]
Claims3The character recognition apparatus according to the above further includes display means for displaying the color information and the character recognition result stored in the storage means.
[0016]
According to the present invention, user-friendliness is improved by displaying representative value color information and character code information on the display means.
[0017]
Claims4In the character recognition method according to the above, in the character recognition method for inputting a color document image and performing character recognition of the color document image, a plurality of color component signals in the color signal of each pixel constituting the color document image are obtained. A first step of calculating a maximum value or a minimum value as a representative value of the pixel, and a representative value calculated in the first step;And thresholdAnd a third step of performing character recognition using the representative value binarized in the second step.
[0018]
According to the present invention, as in
[0021]
Claims5A computer-readable recording medium according to claim 14A program for causing a computer to execute the character recognition method described in (1) is recorded.
[0022]
According to the invention, the claims4A program for causing a computer to execute the character recognition method according to
[0023]
Claims6In the image processing apparatus according to the above, in the image processing apparatus that inputs and binarizes a color image, the maximum value or the minimum value of a plurality of color component signals in the color signal of each pixel constituting the color image is obtained.AttentionRepresentative value calculating means for calculating as a representative value of a pixel;AttentionFrom the color components around the pixelAttentionColor information calculation means for obtaining color information around the pixel, representative values calculated by the representative value calculation means, and the color imageAttentionPixel color component signal, andBeforeRecordAttentionCalculated based on color information around the pixelBased on background densityBinarization means for binarization.
[0024]
According to the present invention, a maximum value or a minimum value of a plurality of color component signals of a color signal in each pixel of a color image is obtained, and the value is used as a representative value. Responding to changes in background density in a color image by performing binarization processing based on the color component signal of the pixel) and peripheral color information (background pixel) obtained from the peripheral color component signal of the pixel Is possible.
[0027]
Claims7In the image processing apparatus, the color component signal of the pixel of the input color image used for binarization by the binarization unit is other than the color component signal used for obtaining the representative value. This signal is used.
[0028]
According to the invention, the claims6In this image processing apparatus, by using the color component signal of the pixel of the color image used for binarization as a signal other than the color component signal used when obtaining the representative value, high-precision binarization can be achieved. It becomes possible.
[0029]
Claims8In the image processing apparatus, the color component signal for obtaining the representative value is a maximum value of the red and green color component signals.
[0030]
According to the invention, the claims6In the image processing apparatus, the color component signal for obtaining the representative value is set to the maximum value of the red and green color component signals. For example, in the case of a white background, R (red), G (green), and B (black) In the case of 8-bit data, both values are close to 255, but when non-background pixels are drawn in yellow, the values of R and G are close to 255, and the value of B is close to zero. It is possible to simultaneously detect three colors, a color when the value of R is large and the values of G and B are small, and a color where the value of G is large and the values of R and B are small.
[0031]
Claims9In this image processing apparatus, the color component signal of the pixel of the input color image used when binarizing by the binarizing means is a blue color component signal.
[0032]
According to the invention, the claims6In this image processing apparatus, the color component signal of the pixel of the input color image used for binarization is the blue color component signal, thereby enabling accurate binarization processing.
[0035]
Claims10In the image processing apparatus according to the above, background pixels and non-background pixels are separated from the result of the binarization processing by the binarization processing means.
[0036]
According to the invention, the claims6In this image processing apparatus, by separating the background pixel and the non-background pixel from the result of the binarization process, the post-processing for the object (non-background pixel) can be simplified.
[0039]
Claims11In the image processing apparatus according to the first aspect, the color information calculation unit uses a surrounding color component signal without distinguishing between a background pixel and a non-background pixel when the background pixels are continuous with respect to a predetermined threshold. The peripheral color information is calculated.
[0040]
According to the invention, the claims6In this image processing apparatus, when a large number of background pixels are continuous with respect to a predetermined threshold, the surrounding color information is calculated using the surrounding color component signals without distinguishing between the background pixels and the non-background pixels. Thus, a situation in which peripheral color information cannot be obtained in an image having non-background pixels continues can be avoided.
[0041]
Claims12In the image processing apparatus according to the present invention, the representative value and the input color imageAttentionA three-dimensional binarization table comprising pixel color component signals and peripheral color information is provided, and the binarization means performs binarization processing using the three feature values of the binarization table. is there.
[0042]
According to the invention, the claims6In the image processing apparatus, the representative value of the input color imageAttentionBy preparing the three feature amounts of the pixel color component signal and the surrounding color information as a three-dimensional binarization table, the processing at the time of binarization processing can be performed quickly.
[0043]
Claims13In the image processing apparatus according toAfter reducing the number of bits of the input color image, calculate the representative value and create a binarization tableTo do.
[0044]
According to the invention, the claims6In the image processing apparatus, when the input color image has, for example, an 8-bit configuration, it is possible to speed up the processing by converting the data to 5 bits and then performing a representative value calculation process. BecomeIn both cases, the amount of data can be reduced by creating a binary table..
[0049]
Claims14In the image processing method according to the above, in the image processing method for inputting and binarizing a color image, the maximum value or the minimum value of a plurality of color component signals in the color signal of each pixel constituting the color image is obtained.AttentionA representative value calculating step of calculating as a representative value of a pixel;AttentionFrom the color components around the pixelAttentionA color information calculation step for obtaining color information around the pixel, the representative value and the color imageAttentionPixel color component signal, andBeforeRecordAttentionCalculated based on color information around the pixelBased on background densityAnd a binarization step for binarization.
[0050]
According to the present invention, a maximum value or a minimum value of a plurality of color component signals of a color signal in each pixel of a color image is obtained, and the value is used as a representative value. Responding to changes in background density in a color image by performing binarization processing based on the color component signal of the pixel) and peripheral color information (background pixel) obtained from the peripheral color component signal of the pixel Is possible.
[0053]
Claims15In the image processing method according to the above, an input color image used for binarization in the binarization step is processed.AttentionThe color component signal of the pixel is a signal other than the color component signal used when obtaining the representative value.
[0054]
According to the invention, the claims14In the image processing method, color images used for binarizationAttentionBy making the color component signal of the pixel a signal other than the color component signal used when obtaining the representative value, binarization with high accuracy becomes possible.
[0055]
Claims16In the image processing method, the color component signal for obtaining the representative value is the maximum value of the red and green color component signals.
[0056]
According to the invention, the claims14In the image processing method, the color component signal for obtaining the representative value is set to the maximum value of the red and green color component signals. For example, in the case of a white background, R (red), G (green), and B (black) In the case of 8-bit data, both values are close to 255, but when non-background pixels are drawn in yellow, the values of R and G are close to 255, and the value of B is close to zero. It is possible to simultaneously detect three colors, a color when the value of R is large and the values of G and B are small, and a color where the value of G is large and the values of R and B are small.
[0057]
Claims17In the image processing method according to the above, an input color image used for binarization in the binarization step is processed.AttentionThe color component signal of the pixel is a blue color component signal.
[0058]
According to the invention, the claims14In the image processing method of, the input color image used for binarizationAttentionBy making the color component signal of the pixel a blue color component signal, accurate binarization processing becomes possible.
[0061]
Claims18In this image processing method, the background pixel and the non-background pixel are separated from the result of the binarization process by the binarization process.
[0062]
According to the invention, the claims14In this image processing method, by separating the background pixel and the non-background pixel from the result of the binarization process, the post-processing for the object (non-background pixel) can be simplified.
[0065]
Claims19In the image processing method according to the above, the color information calculation step uses a surrounding color component signal without distinguishing between the background pixel and the non-background pixel when the background pixels are many consecutive with respect to a predetermined threshold. The peripheral color information is calculated.
[0066]
According to the invention, the claims14In this image processing method, when a large number of background pixels are continuous with respect to a predetermined threshold, the surrounding color information is calculated using the surrounding color component signals without distinguishing between the background pixels and the non-background pixels. Thus, a situation in which peripheral color information cannot be obtained in an image having non-background pixels continues can be avoided.
[0067]
Claims20In the image processing method according to the present invention, the representative value and the input color imageAttentionIncluding a step of preparing a three-dimensional binarization table composed of pixel color component signals and peripheral color information, wherein the binarization step uses binarization processing using three feature values of the binarization table. Is to do.
[0068]
According to the invention, the claims14In the image processing method, the representative value of the input color imageAttentionBy preparing the three feature amounts of the pixel color component signal and the surrounding color information as a three-dimensional binarization table, the processing at the time of binarization processing can be performed quickly.
[0069]
Claims21In the image processing method related toAfter reducing the number of bits of the input color image, the representative value is calculated and a binarization table is created.Is.
[0070]
According to the present invention, when an input color image has, for example, an 8-bit configuration, it is possible to speed up the processing by converting the data into 5 bits and then performing a representative value calculation process. BecomeAt the same time, the data volume can be reduced by creating a binarized table.
[0073]
Claims22In this image processing method, the specific pattern in the input color image is recognized using the processing result of the binarization step.
[0074]
According to the invention, the claims14~Any one of 21By performing the image processing described in (1), the background color and the object are separated, and a specific pattern such as a character can be recognized.
[0075]
Claims23A computer-readable recording medium according to claim 114~22The computer executes the image processing method described in any one of the above.
[0076]
According to this invention, the claim14~22A program that causes a computer to execute any one of the image processing methods is recorded.14~22The image processing operation described in any one of the above can be realized by a computer.
[0077]
DETAILED DESCRIPTION OF THE INVENTION
Preferred embodiments of a character recognition device, a character recognition method, an image processing device, an image processing method, and a computer-readable recording medium according to the present invention will be described below in detail with reference to the accompanying drawings. The present invention is not limited to this embodiment.
[0078]
(Embodiment 1)
First, a color image handled in this embodiment will be described. In order to digitize a color image input from a color image input device such as a color scanner, first, the color of each point is decomposed into R (red), G (green), and B (blue) components. As a result, three monochrome images are obtained as the distribution of R, G, and B shades. Each of the R channel, G channel, and B channel is divided into common pixels and the same quantization gradation number is taken and A / D conversion is performed.
[0079]
The digitized color image is an overlay of three monochrome digital images, R, G and B. If the separation into pixels in the R, G, B channels is common, the digital color image will be R.D. It is considered that a set of three numerical values (RG, B) representing the brightness of G, B is determined. For example, when quantization is performed with 256 gradations for each channel, R.P. Each of G and B takes an integer value of R = 0 to 255, G = 0 to 255, and B = 0 to 255. Since 256 gradations have an 8-bit information amount, the information amount per pixel is 8 bits × 3 = 24 bits. Such expression with 8 bits for each of RGB and a total of 24 bits is called RGB 24-bit color expression.
[0080]
A commonly used color document image is rarely printed using 100 colors or 200 colors. For example, in most cases, black and white characters have color character information partially, or the entire page is colored characters of several colors. Also, the colors are cyan, magenta, yellow (hereinafter referred to as C, M, Y) and red, blue, green (hereinafter referred to as R, B, G), which are primary colors of ink used at the time of printing. There are many.
[0081]
In addition, optical readers such as scanners, facsimile machines, and digital still cameras that read these document images often use R, B, and G CCDs (solid-state imaging devices), and the output from these devices is , R, B, and G color component signals in many cases.
[0082]
Furthermore, C, M, and Y, which are primary colors of ink used at the time of printing, and red, blue, and green output from the above apparatus have a complementary color relationship, and can be easily calculated using a predetermined conversion formula. . Therefore, the present invention makes it possible to recognize and reproduce a color image with a simpler apparatus configuration by actively utilizing the characteristics of these color document images.
[0083]
Next, the configuration of the apparatus will be described. FIG. 1 is a block diagram showing a configuration of a character recognition apparatus according to an embodiment of the present invention. In the figure,
[0084]
FIG. 2 is a block diagram showing the configuration of the
[0085]
FIG. 3 is a block diagram showing a configuration of the character recognition circuit 3 in FIG. In the figure,
[0086]
Next, the operation of the character recognition device configured as described above will be described. FIG. 4 is a flowchart showing a first operation procedure example according to the embodiment of the present invention. First, a color document image is input from a scanner or the like (step S11). As typical color components used in a color document image, C, M, Y, and K including black (hereinafter referred to as K) in R, G, B, C, M, and Y are used. There are many cases. Between these R, G, B and C, M, Y, there are relationships of “Y = 255-B”, “C = 255 = R”, “M = 225-G”, and a simple conversion formula Can be converted.
[0087]
Further, the conversion formula is not limited to the above-described conversion formula, and in general,
C = k1 * R + k2 * G + k3 * B
M = k4 × R + k5 × G + k6 × B
Y = k7 × R + k8 × G + k9 × B
It is expressed by the following formula. Note that k1 to k9 are coefficients.
[0088]
In general, R, G, B or C, M, Y, (K) are used because CCDs used in optical readers such as scanners, facsimile machines, and digital still cameras are R, G, B. By outputting the color component signal, the primary colors of the ink used in the printing apparatus such as a printer are C, M, Y, (K).
[0089]
On the other hand, a color document image that is a target document of a character recognition device is often printed by some printing device. Therefore, color parts other than black and white are often expressed in R, G, B or C, M, Y. Further, the background (paper) portion of a document is often white or has a high brightness, and the brightness value of the character portion is generally low in order to distinguish it from the background.
[0090]
Now, after performing step S11 of FIG. 4, the minimum value (or maximum value) of R, G, B (C, M, Y, (K)) is calculated as a representative value (step S12). Here, an example will be described in which an 8-bit image of a representative value is created from each of R, G, B 8-bit 256 gradations (24 bits in total).
[0091]
For example, in a color signal of R, G, B, a red (R) character becomes an R, G, B value (255, 0, 0), and a green (G) character R, G, B The value is (0, 255, 0), and the blue, blue (B) R, G, B values are (0, 0, 255).
Further, in the case of a black character, it becomes (0, 0, 0), and the background (paper) portion becomes (255, 255, 255). A summary of these is shown in FIG.
[0092]
As shown in FIG. 5, in the character portion, the minimum value of the R, G, and B values is set as the representative value by utilizing the fact that any one of the R, G, and B values is small (in this example, 0). By using as, it becomes possible to separate a character part and a background part irrespective of a color.
[0093]
Next, when the representative value is calculated in step S12 of FIG. 4, a binarization process is subsequently executed (step S13). That is, in the above representative value stage, in the case of FIG. 5, only 24 bits of 8 bits (256 gradations) for each of R, G, and B are 8 bits per pixel and are not binarized. Absent. As a method of binarizing from an 8-bit image of a representative value, binarization may be performed with a fixed threshold value, or a known method used in various places such as a discriminant analysis method may be adopted.
[0094]
Subsequently, the binary data binarized in step S13 is input to the character recognition circuit 3, and the character recognition process is executed (step S14). That is, a character string is cut out by the
[0095]
Subsequently, the apparatus is provided with color information indicating the color of the character according to the character recognition result (character code information) described above and which value of the R, G, and B values is used as the representative value. Or stored in the external memory or displayed on a display (step S15).
[0096]
FIG. 7 is a block diagram showing the configuration of another character recognition device. Compared to the configuration of the character recognition device shown in FIG. 1, a memory for storing character code information and color information in the subsequent stage of the character recognition circuit 3. 4 is provided. FIG. 8 is a flowchart showing an operation procedure of the character recognition device of FIG. 7, and is a flowchart showing a second operation procedure example. In this operation procedure, Step S23 and Step S26 are added to the flowchart of FIG. 4 described above.
[0097]
That is, after calculating the minimum value (or maximum value) of R, G, B (C, M, Y, (K)) as a representative value in step S22, R, G, B (C, M, Y, ( Which value of K)) is used as the representative value is stored in the memory 4 (step S23). In step S26, the character code information of the character recognized in step S25 is stored in the memory 4. Other processes are the same as those in FIG.
[0098]
In this way, by storing which value of the R, G, and B values is used as the representative value, it is possible to obtain information on what color of the character is written together with the character recognition result.
[0099]
By the way, if only the G component is extracted as a conventionally used “color to gray” conversion method without using the method according to the above-described embodiment, the result becomes as shown in FIG. In this case, it becomes impossible to distinguish from the background.
[0100]
In this embodiment, R, G, and B are used for explanation, but C, M, Y, and (K) are the same as R, G, and B. In this embodiment, the R, G, B values of black characters are set to (0, 0, 0). However, depending on the image format, the black characters are held in black and white (255, 255, 255). In such a case, the maximum value of the R, G, and B values is used as the representative value.
[0101]
(Embodiment 2)
FIG. 9 is a block diagram showing the configuration of the image processing apparatus according to the second embodiment of the present invention. The image processing apparatus includes a color
[0102]
Next, the image processing apparatus configured as described above will be described. First, the color
[0103]
Further, the background density calculation unit 103 obtains the background density by referring to the previous 32 pixels from 5 bits of the R, G, B color image signals as will be described later. The background density, the representative value, and the B pixel value not used for calculating the representative value are sent to the
[0104]
By the way, although the color image signals are R, G, and B here, values such as C, M, Y, C, M, Y, and K may be used. Further, when the representative value is obtained by the maximum value calculation unit 102, R and G are used here. However, G and B or R and B may be used, and any of C, M, Y, and K may be used. A combination of these may be used.
Furthermore, instead of comparing these two signals, three or more may be compared to determine the representative value.
[0105]
Next, an operation for obtaining a background density as color information around the pixel will be described. In the case of a digital color copying machine or digital color scanner, data is read line by line in the main scanning direction. When the read data is not sequentially processed, it is necessary to store the data of the previous line in the line memory. Therefore, color information (= background density) around the pixel is calculated using only data within one line, or only data input before the pixel of interest. This background density calculation will be described in detail below.
[0106]
FIG. 10 is an explanatory diagram of a background density calculation method according to the second embodiment of the present invention. FIG. 10 shows an example in which the background density is calculated by looking at the value of the 32 pixels ahead of the
[0107]
That is, in FIG. 10A, in the pixels that are 32 pixels ahead of the
(Intens (= Max (R, B) -B)
Is the background density.
[0108]
On the other hand, as shown in the image pattern of FIG. 10B, when all the 18 pixels immediately before the
[0109]
Therefore, by using the feature amount “difference between the maximum value of R and G and the value of B”, it is possible to simultaneously detect non-background pixels (objects) of three colors written on a white background. That is, in the case of a white background, all the values of R, G, and B are values close to 255 in the case of 8-bit data, whereas the values of R and G are 255 when a non-background pixel is drawn in yellow. And the value of B is close to zero. Similarly, it is possible to simultaneously detect three colors: a color when the value of R is large and the values of G and B are small, and a color where the value of G is large and the values of R and B are small.
[0110]
In the above-described processing, the peripheral color information (= background density) is obtained by using only the color information of the pixel determined to be the
[0111]
However, when non-background pixels continue (FIG. 10B), there is a problem that surrounding color information cannot be obtained. Therefore, in consideration of the size of the object to be extracted, for example, when the maximum number of pixels of the extraction object is 16 pixels, the object cannot continue 16 pixels or more, so 18 pixels slightly larger than this If non-background pixels continue, background density is calculated from all pixel values immediately before the
[0112]
The background density calculation method is shown in the flowchart of FIG. First, each parameter is initialized (step S31). That is, mean1 (32 pixels ahead of the pixel of interest), mean (a pixel determined as a background pixel among the 32 pixels ahead of the pixel of interest), and flag are initialized to 0. Subsequently, binarization processing is executed (step S32).
[0113]
That is,
rst (x) = binTable (max (x), blue (x), mean)
rst (x) = 0 white pixel (background)
rst (x) = 1 Black pixel (non-background)
The binarization process is executed. Subsequently, the background density is obtained according to the illustrated algorithm (step S33).
[0114]
In FIG. 11,
max (x) = Max (red (x), green (x))
intens (x) = Max (red (x), green (x))-blue (x)
mean1 = Σintens (x), mean = Σintens (x)
And
[0115]
By the way, the character recognition method and the image processing method described so far can be programmed, recorded on a computer-readable recording medium, and executed on the computer. Further, a part of the character recognition method and the image processing method can be provided on a network and realized through a communication line.
[0116]
That is, the character recognition method and the image processing method described in this embodiment are realized by executing a program prepared in advance on a computer (CPU 20) such as a personal computer or a workstation as shown in FIG. . This program is recorded on a computer-readable recording medium such as the
[0117]
Further, as shown in FIG. 13, this program can be distributed to
[0118]
【The invention's effect】
As described above, according to the character recognition device of the present invention (Claim 1), the color document image that is the target document of the character recognition device has one of R, G, and B values in the character portion. Is made small (becomes 0 in this example), and the minimum value of the R, G, B values is used as the representative value, so that the character portion and the background portion can be separated regardless of the color. The gray document is converted into a gray image using the maximum or minimum value of a plurality of color component signals in the color signal as a representative value of the pixel, and binarized. Character recognition is performed using a representative value (representative color) of values, so that characters in a color document image can be recognized with a simpler apparatus.
[0120]
A character recognition device according to the present invention (claims)2), By providing storage means for storing color information indicating which signal among the plurality of color component signals is a representative value and character recognition result at the time of conversion by the gray conversion means, the recognition result is obtained. In post-processing such as use, it is possible to quickly confirm the color of the representative value.
[0121]
A character recognition device according to the present invention (claims)3), Since the color information and the character code information of the representative value are displayed on the display means, the user can immediately confirm the character code information and the color information of the recognition result on a display unit such as a display.
[0122]
A character recognition method according to the present invention (claims)4In the same manner as in
[0124]
A computer-readable recording medium according to the present invention (claims)5)4Since a program for causing a computer to execute the character recognition method according to
[0125]
An image processing apparatus according to the present invention (claims)6), A maximum value or a minimum value of a plurality of color component signals of the color signal in each pixel of the color image is obtained and the value is used as a representative value, and the representative value and the corresponding pixel of the input color image (target pixel) ) And the surrounding color information (background pixel) obtained from the surrounding color component signal of the pixel in question, so that even if the background density of the input color image changes Binarized data of an object image can be obtained with high accuracy.
[0127]
An image processing apparatus according to the present invention (claims)7)6In this image processing apparatus, since the color component signal of the pixel of the color image used for binarization is a signal other than the color component signal used for obtaining the representative value, high-precision binarization is possible. become.
[0128]
An image processing apparatus according to the present invention (claims)8)6In the image processing apparatus, since the color component signal for obtaining the representative value is the maximum value of the red and green color component signals, it is possible to simultaneously detect non-background pixels (objects) of three colors written on a white background. it can.
[0129]
An image processing apparatus according to the present invention (claims)9)6In the image processing apparatus, an input color image used for binarizationAttentionBy making the color component signal of the pixel a blue color component signal, accurate binarization processing becomes possible.
[0131]
An image processing apparatus according to the present invention (claims)10)6In this image processing apparatus, the background pixel and the non-background pixel are separated from the result of the binarization process, so that the post-processing for the object (non-background pixel) can be easily performed.
[0133]
An image processing apparatus according to the present invention (claims)11)6In the image processing apparatus, when a large number of background pixels are continuous with respect to a predetermined threshold, the surrounding color information is calculated using the surrounding color component signals without distinguishing between the background pixels and the non-background pixels. A situation in which peripheral color information cannot be obtained in an image having non-background pixels is avoided, and a correct background density can be obtained.
[0134]
An image processing apparatus according to the present invention (claims)12)6In the image processing apparatus, the representative value of the input color imageAttentionBy preparing the three feature quantities of the pixel color component signal and the surrounding color information as a three-dimensional binarization table, the processing at the time of binarization processing can be performed quickly, so that the processing efficiency is improved. .
[0135]
An image processing apparatus according to the present invention (claims)13)12In this image processing apparatus, when the input color image has, for example, an 8-bit configuration, the representative value is calculated after being converted to 5 bits, so that the representative value can be calculated efficiently. it can.In addition, if the input color image has, for example, an 8-bit configuration, a binarization table is created after conversion to 5-bit each, so the amount of data can be reduced and the memory can be used effectively. And a reduction in capacity is realized.
[0138]
An image processing method according to the present invention (claims)14), A maximum value or a minimum value of a plurality of color component signals of the color signal in each pixel of the color image is obtained and the value is used as a representative value, and the representative value and the corresponding pixel of the input color image (target pixel) ) And the surrounding color information (background pixel) obtained from the surrounding color component signal of the pixel in question, so that even if the background density of the input color image changes Binarized data of an object image can be obtained with high accuracy.
[0140]
An image processing method according to the present invention (claims)15)14In this image processing method, since the color component signal of the pixel of the color image used for binarization is a signal other than the color component signal used for obtaining the representative value, high-precision binarization processing is performed. Can be done.
[0141]
An image processing method according to the present invention (claims)16)14In this image processing method, since the color component signal for obtaining the representative value is the maximum value of the red and green color component signals, it is possible to simultaneously detect three non-background pixels (objects) written on a white background. it can.
[0142]
An image processing method according to the present invention (claims)17)14In this image processing method, since the color component signal of the pixel of the input color image used for binarization is a blue color component signal, accurate binarization processing can be performed.
[0144]
An image processing method according to the present invention (claims)18)14In this image processing method, since the background pixel and the non-background pixel are separated from the result of the binarization process, the post-processing for the object (non-background pixel) in the color image can be easily performed.
[0146]
An image processing method according to the present invention (claims)19)14In this image processing method, when many background pixels are continuous with respect to a predetermined threshold, the surrounding color information is calculated using the surrounding color component signals without distinguishing between the background pixels and the non-background pixels. A situation in which peripheral color information cannot be obtained in an image including non-background pixels can be avoided, and correct peripheral color information can be obtained.
[0147]
An image processing method according to the present invention (claims)20)14In this image processing method, the three characteristic quantities of the representative value, the color component signal of the pixel of the input color image, and the surrounding color information are prepared as a three-dimensional binarization table and used for binarization. Processing in the binarization processing can be performed efficiently.
[0148]
An image processing method according to the present invention (claims)21According to the above, if the input color image has, for example, an 8-bit configuration, the representative value is calculated after being converted to 5 bits. Therefore, the processing efficiency of representative value calculation is improved.In addition, if the input color image has, for example, an 8-bit configuration, a binarization table is created after conversion to 5-bit each, so the data amount can be reduced and the memory capacity can be effectively used. And size reduction can be achieved.
[0150]
An image processing method according to the present invention (claims)22)14~Any one of 21By performing the image processing described in (2), the background color and the object can be more reliably separated, so that a specific pattern such as a character can be recognized more accurately.
[0151]
A computer-readable recording medium according to the present invention (claims)23)14~22A program that causes a computer to execute any one of the image processing methods is recorded.14~22The image processing operation described in any one of the above can be realized by a computer.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a character recognition device according to a first exemplary embodiment of the present invention.
2 is a block diagram showing a configuration of a gray conversion circuit and a binarization circuit in FIG. 1. FIG.
FIG. 3 is a block diagram showing a configuration of a character recognition circuit in FIG. 1;
FIG. 4 is a flowchart showing a first operation procedure example according to the first embodiment of the present invention;
FIG. 5 is an explanatory diagram showing an example of determining a representative value from RGB values according to the first embodiment of the present invention;
FIG. 6 is an explanatory diagram showing a case where only the G component is extracted from the RGB values.
FIG. 7 is a block diagram showing a configuration of another character recognition device according to the first exemplary embodiment of the present invention;
FIG. 8 is a flowchart showing a second operation procedure example according to the first embodiment of the present invention;
FIG. 9 is a block diagram showing a configuration of an image processing apparatus according to a second embodiment of the present invention.
FIG. 10 is an explanatory diagram of an example of calculating background density according to the second embodiment of the present invention.
FIG. 11 is a flowchart showing a background density calculation process according to the second embodiment of the present invention;
FIG. 12 is a block diagram showing an example of a computer system that implements the character recognition method and the image processing method according to the present invention by software.
FIG. 13 is a block diagram showing an example of a system for realizing a character recognition method and an image processing method according to the present invention on a network.
[Explanation of symbols]
1 Gray conversion circuit
2 Binarization circuit
3 Character recognition circuit
4 memory
10 line segment
11 Character cutout
12 Feature extraction unit
14 Character recognition part
100 color image input unit
101 Gamma converter
102 Maximum value calculator
103 Background density calculator
104 Binarization processing unit
105 Binary table
Claims (23)
前記カラー文書画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値としてグレー画像に変換するグレー変換手段と、
前記グレー変換手段で変換されたグレー画像を、前記代表値としきい値により2値化する2値化手段と、
前記2値化手段の2値データから文字認識をおこなう文字認識手段と、
を備えたことを特徴とする文字認識装置。In a character recognition device that inputs a color document image and performs character recognition of the color document image,
Gray conversion means for converting a maximum value or a minimum value of a plurality of color component signals in a color signal of each pixel constituting the color document image into a gray image as a representative value of the pixel;
Binarization means for binarizing the gray image converted by the gray conversion means using the representative value and a threshold value ;
Character recognition means for performing character recognition from the binary data of the binarization means;
A character recognition device comprising:
前記カラー文書画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を当該画素の代表値として算出する第1の工程と、
前記第1の工程で算出した代表値としきい値によりを2値化する第2の工程と、
前記第2の工程で2値化された代表値を用いて文字認識を行う第3の工程と、
を含むことを特徴とする文字認識方法。In a character recognition method for inputting a color document image and performing character recognition of the color document image,
A first step of calculating a maximum value or a minimum value of a plurality of color component signals in a color signal of each pixel constituting the color document image as a representative value of the pixel;
A second step of binarizing the representative value and threshold value calculated in the first step;
A third step of performing character recognition using the representative value binarized in the second step;
A character recognition method comprising:
前記カラー画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を注目画素の代表値として算出する代表値算出手段と、
注目画素の周辺の色成分から注目画素の周辺の色情報を求める色情報算出手段と、
前記代表値算出手段で算出された代表値と前記カラー画像の注目画素の色成分信号、および前記注目画素の周辺の色情報によって算出される背景濃度に基づいて2値化する2値化手段と、
を備えたことを特徴とする画像処理装置。In an image processing apparatus that inputs a color image and binarizes it,
A representative value calculating means for calculating a maximum or minimum value of a plurality of color component signals as the representative value of the pixel of interest in the color signal of each pixel constituting the color image,
Color information calculation means for obtaining color information around the pixel of interest from color components around the pixel of interest ;
The color component signals of the target pixel of the color image and the representative value calculated by the representative value calculation means, and before Symbol binary binarized based on the background density calculated by the color information around the pixel of interest And
An image processing apparatus comprising:
前記2値化手段は前記2値化テーブルの3つの特徴量を用いて2値化処理を行なうことを特徴とする請求項6に記載の画像処理装置。And a three-dimensional binarization table comprising the representative value, the color component signal of the pixel of interest of the input color image, and peripheral color information.
The image processing apparatus according to claim 6 , wherein the binarization unit performs binarization processing using three feature amounts of the binarization table.
前記カラー画像を構成する各画素のカラー信号における複数の色成分信号の最大値または最小値を注目画素の代表値として算出する代表値算出工程と、
注目画素の周辺の色成分から注目画素の周辺の色情報を求める色情報算出工程と、
前記代表値と前記カラー画像の注目画素の色成分信号、および前記注目画素の周辺の色情報によって算出される背景濃度に基づいて2値化する2値化工程と、
を含むことを特徴とする画像処理方法。In an image processing method for inputting and binarizing a color image,
A representative value calculation step of calculating the maximum value or the minimum value of the plurality of color component signals as the representative value of the pixel of interest in the color signal of each pixel constituting the color image,
A color information calculation step for obtaining color information around the pixel of interest from the color components around the pixel of interest ;
Binarization step of binarizing based on the background concentration calculated by the color information around the representative value and the color component signals of the target pixel in the color image, and before Symbol pixel of interest,
An image processing method comprising:
前記2値化工程は前記2値化テーブルの3つの特徴量を用いて2値化処理を行なうことを特徴とする請求項14に記載の画像処理方法。And a step of preparing a three-dimensional binarization table including the representative value, a color component signal of a pixel of interest of the input color image, and surrounding color information,
The image processing method according to claim 14 , wherein the binarization step performs binarization processing using three feature amounts of the binarization table.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001103847A JP4571758B2 (en) | 2000-04-03 | 2001-04-02 | Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-101526 | 2000-04-03 | ||
JP2000101526 | 2000-04-03 | ||
JP2001103847A JP4571758B2 (en) | 2000-04-03 | 2001-04-02 | Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001351068A JP2001351068A (en) | 2001-12-21 |
JP4571758B2 true JP4571758B2 (en) | 2010-10-27 |
Family
ID=26589385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001103847A Expired - Fee Related JP4571758B2 (en) | 2000-04-03 | 2001-04-02 | Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4571758B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4242796B2 (en) * | 2004-03-12 | 2009-03-25 | パナソニック株式会社 | Image recognition method and image recognition apparatus |
JP2019128602A (en) * | 2018-01-19 | 2019-08-01 | 富士通フロンテック株式会社 | Optical character recognition apparatus, and program |
CN113205633B (en) * | 2020-01-16 | 2023-01-13 | 深圳怡化电脑股份有限公司 | Method and device for detecting red and blue fibers of bill, electronic equipment and storage medium |
CN112699886B (en) * | 2020-12-30 | 2024-06-11 | 广东德诚科教有限公司 | Character recognition method and device and electronic equipment |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000155804A (en) * | 1998-11-19 | 2000-06-06 | Canon Inc | Information processor and its method, and computer- readable memory |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07325045A (en) * | 1994-05-30 | 1995-12-12 | Nec Corp | Inspection and recognition apparatus for black print on color background |
JP3756660B2 (en) * | 1998-04-03 | 2006-03-15 | 株式会社リコー | Image recognition method, apparatus and recording medium |
JP3345350B2 (en) * | 1998-05-27 | 2002-11-18 | 富士通株式会社 | Document image recognition apparatus, method thereof, and recording medium |
-
2001
- 2001-04-02 JP JP2001103847A patent/JP4571758B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000155804A (en) * | 1998-11-19 | 2000-06-06 | Canon Inc | Information processor and its method, and computer- readable memory |
Also Published As
Publication number | Publication date |
---|---|
JP2001351068A (en) | 2001-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7133559B2 (en) | Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded | |
US20140337008A1 (en) | Image processing apparatus, image forming apparatus, program and storage medium | |
JP2008005317A (en) | Image processor and image processing method, and computer program and recording medium | |
US10373030B2 (en) | Image processing apparatus that executes halftone process on target image data including edge pixel | |
JP2008099149A (en) | Image processor, image processing method and image processing program | |
JP2011008549A (en) | Image processor, image reader, multifunctional machine, image processing method, program, and recording medium | |
US7365880B2 (en) | Image processing apparatus and image processing method | |
JPH11238130A (en) | Removal of non-text information from color image | |
JP2004021765A (en) | Image recognition method | |
US6661921B2 (en) | Image process apparatus, image process method and storage medium | |
JP4571758B2 (en) | Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium | |
JP3899872B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
JP4453979B2 (en) | Image reproducing apparatus, image reproducing method, program, and recording medium | |
JP4710672B2 (en) | Character color discrimination device, character color discrimination method, and computer program | |
JP3838981B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP2010287178A (en) | Image processing device, image reading apparatus, multifunction machine, image processing method, program and recording medium | |
JP2006109482A (en) | Image processing method, image processing apparatus and image processing program | |
JPH11136505A (en) | Picture processor and picture processing method | |
US11831834B2 (en) | Information processing apparatus, method, and product performing multiplexing processing by different methods with respect to printing and non-printing areas | |
JP2871570B2 (en) | Character recognition apparatus and method | |
JP7185451B2 (en) | Image processing device, image processing method, and program | |
JP2001118032A (en) | Device and method for character recognition, and computer-readable recording medium with recorded program making computer implement character recognizing method | |
JP4973603B2 (en) | Image processing apparatus and image processing program | |
JP6759914B2 (en) | Image processing equipment, image forming equipment and programs | |
JPH11127353A (en) | Image processor and image processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100810 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100813 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |