JP2004021765A - 画像認識方法 - Google Patents
画像認識方法 Download PDFInfo
- Publication number
- JP2004021765A JP2004021765A JP2002177988A JP2002177988A JP2004021765A JP 2004021765 A JP2004021765 A JP 2004021765A JP 2002177988 A JP2002177988 A JP 2002177988A JP 2002177988 A JP2002177988 A JP 2002177988A JP 2004021765 A JP2004021765 A JP 2004021765A
- Authority
- JP
- Japan
- Prior art keywords
- color
- image
- image data
- recognition
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【課題】本発明は、画像認識方法に関し、種々の色を含むカラー原稿から種々の色の画像を正確に認識することを目的とする。
【解決手段】カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、セパレーション部13がカラーイメージデータをこれに含まれる色毎に複数のイメージデータ(画像レイヤー)に分離処理し、レイアウト認識部14及び文字認識部15が複数のイメージデータ毎にレイアウト認識処理及び文字認識処理を行なう。
【選択図】 図1
【解決手段】カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、セパレーション部13がカラーイメージデータをこれに含まれる色毎に複数のイメージデータ(画像レイヤー)に分離処理し、レイアウト認識部14及び文字認識部15が複数のイメージデータ毎にレイアウト認識処理及び文字認識処理を行なう。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、画像認識方法に関し、特に、種々の色を含むカラー原稿から種々の色の画像のレイアウトや文字を正確に認識することができる画像認識方法に関する。
【0002】
【従来の技術】
スキャナ装置等の画像読取装置で原稿から読み取った画像のイメージデータについて文字認識処理(又はOCR処理)を実行して、画像から文字データを抽出することが行われている。従来、この文字認識処理の対象となる原稿は文書などのモノクロ原稿であったが、近年では、例えばカタログのようなカラー画像の描かれた原稿(カラー原稿)からも文字認識処理により文字データを抽出することが行われる場合も増えている。
【0003】
このようなカラー原稿の文字認識処理は、従来の文字認識処理がモノクロの2値画像を処理する形式であったため、カラー画像を何らかの方法で2値化処理してモノクロの2値画像とした後に、この2値画像についてレイアウト認識処理及び文字認識処理を行って、文字データを抽出している。
【0004】
【発明が解決しようとする課題】
前述のように、従来のカラー原稿の文字認識処理は、カラー画像を2値画像とした後に行っているので、以下のような問題があった。
【0005】
即ち、原稿がカラーであるにもかかわらず、当該カラー情報は何ら生かされていない。即ち、グレー画像を用いるのと何ら差異がなく、カラー画像を対象とした意義がないに等しい。
【0006】
また、カラー原稿においては文字(の色)とその背景色とが異なるにもかかわらず、2値化処理をした結果、文字及び背景色が共に黒(又は白)に変換されてしまう場合がある。この場合、2値画像においては文字が失われてしまい、文字認識ができなくなる。
【0007】
更に、前述のように、2値化処理をした結果、文字及び背景色が共に黒(又は白)に変換されてしまうと、レイアウト認識ができなくなってしまう。文字認識処理においては、通常、文字がどのようなレイアウト(配置)で配列されているかを把握した後に、文字認識処理を実行する。従って、レイアウト認識に失敗すると、文字認識処理に移行することができなくなる。
【0008】
本発明は、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる画像認識方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の画像認識方法は、カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、カラーイメージデータをこれに含まれる色毎に複数のイメージデータに分離処理し、複数のイメージデータ毎に認識処理を行なう。
【0010】
本発明の画像認識方法によれば、カラー画像を2値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なれば、これらが共に黒(又は白)に変換され文字(文字情報)が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含む多くの既存のカラー原稿から種々の色の画像を正確に認識して抽出することができる。
【0011】
【発明の実施の形態】
図1及び図2は、画像認識装置構成図であり、特に、図1は本発明の画像認識方法の構成を示し、図2は本発明の画像認識方法を搭載するスキャナ装置のような画像処理装置の構成を示す。
【0012】
本発明の画像認識装置は、画像読取部11、画像処理部12、セパレーション部13、レイアウト認識部14、文字認識部15を備える。画像読取部11と画像処理部12とで画像データ読取装置16を構成し、セパレーション部13、レイアウト認識部14、文字認識部15とで画像データ認識装置17を構成する。この例では、図2(A)に示すように、画像データ読取装置16及び画像データ認識装置17がスキャナ(スキャナ装置)20に設けられる。スキャナ20は、LAN(Local Area Network)のようなネットワーク又は周知のインタフェース(以下、ネットワーク)40を介して、パーソナルコンピュータ30に接続される。
【0013】
画像読取部11は、例えば周知のCCD(電荷結合デバイス)等からなり、例えば自動原稿給紙装置により自動的に読取台に載置された両面原稿又は片面原稿の画像面から画像(原画像)を光学的に読み取って増幅することにより、R(レッド)、G(グリーン)、B(ブルー)の各色の読取信号(アナログ信号)を画像処理部12に出力する。この例では、画像読取部11は、操作パネル(図示せず)からの読取モードの入力指示に従って、原稿画像からカラー画像の読取を行うように設定される。なお、画像読取部11は、前記入力指示に従って、グレー画像、モノクロ画像の読取も可能である。
【0014】
画像処理部12は、画像読取部11から送られてきたRGBの各色の読取信号をアナログ(A)/デジタル(D)変換して、例えばRGBの各色毎に8bitで表される計24bitの(フル)カラーイメージデータを生成する。画像処理部12は、このカラーイメージデータを、画像認識処理のために、画像データ認識装置17(のセパレーション部13)に送る。
【0015】
画像データ認識装置17は、画像認識処理、即ち、レイアウト認識処理及び文字認識処理(OCR処理)を行う。この例では、画像データ認識装置17は、画像認識処理に先立って、カラーイメージデータを複数の単色イメージデータに分離する分離処理を行う。従って、画像認識処理は、分離処理された複数の単色イメージデータについて行われる。
【0016】
セパレーション部13は、画像処理部12からのカラーイメージデータを、ピクセル単位でL* a* b* 色空間の座標に変換し、これに基づいて各ピクセルの色を判定することにより、原稿画像(原画像)を各色毎に分離した画像(以下、画像レイヤー)を作成し、また、原稿に含まれる色の数Kを決定する。即ち、フルカラーの原稿の画像(のデータ)を、各色毎の画像(のデータ)に分離する(図5以下参照)。この例では、分離後の各色の画像レイヤーは、当該色ではなく例えば黒色で表示(又は出力)される。なお、各色の画像レイヤーを当該色で表示(又は出力)してもよい。
【0017】
具体的には、セパレーション部13は、カラーイメージデータのL* a* b* 色空間の座標内における間隔(ユークリッド距離)を求め、これが予め設定された所定の距離(閾値)内にあるときには同一色と判定する。この閾値は、経験的にほぼ正確に定めることができる。即ち、人による色の認識にほぼ正確に従うように、色を分離することができる。これにより、カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離する。カラーイメージデータから分離する画像レイヤーの数Kは、カラー原稿により異なり、通常、分離前は不明であり、分離してみて始めて判る(定まる)。なお、予めカラー原稿に含まれる色の数が判っている場合、又は、多く使用される色を分離すればよい場合等においては、分離する色即ち画像レイヤーの数を制限するようにしてもよい。例えば、赤、緑、青、黒、白等の画像レイヤーのみを抽出するように制限する。これにより、処理の負担を軽減することができる。
【0018】
ここで、L* a* b* 色空間とは、国際照明委員会(Commission Internationale De L’eclairage)が1976年に推奨したXYZ表色系を基礎とする均等色空間であり、RGB色空間よりも人による色の認識に近い座標表示をすることができる。セパレーション部13において、画像レイヤーの分離のために、人の認識に近いL* a* b* 色空間を採用する方が、実際の原画像との誤差を少なくすることができ好適である。
【0019】
なお、セパレーション部13が、イメージデータのRGBデータをそのまま用いて画像レイヤーを生成するようにしてもよく、又は、印刷データにおいて用いられるC(シアン)、M(マゼンダ)、Y(イエロー)、B(黒)を用いて画像レイヤーを生成するようにしてもよい。
【0020】
更に、セパレーション部13は、カラーイメージデータを2値化処理して、当該イメージデータとは別に、2値データ(モノクロ画像)を生成して、これをレイアウト認識部14に送る。この例において、セパレーション部13は、画像処理部12から受け取ったカラーイメージデータを、先に求めた原稿に含まれるK色の色ごとに2値化処理することにより、原稿に含まれる色の数(画像レイヤーの数)であるK個の2値画像に分離する。即ち、ある1個の色について、前記受け取ったカラーイメージデータにおける注目ピクセルが該当色の場合には「1」又は「黒」に変換し、当該色以外の色の場合には「0」又は「白」に変換する。そして、これを当該K個の色について繰り返す。これにより、K個の2値画像(K色の画像レイヤー)が得られる。
【0021】
この例では、カラーイメージデータを人の認識に近いL* a* b* 色空間に投影した上で2値化処理している。従って、人による色の認識にほぼ正確に従うように、色を分離することができる。即ち、当該色以外の色の画像は、当該色に多少近い色でも「0」又は白とされ、当該色で描かれた文字等の画像は「1」又は黒とされる。例えば、赤とオレンジとを正確に分離することができる。そして、これに基づいて、当該カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離することができる。
【0022】
レイアウト認識部14は、各色の画像レイヤー(のイメージデータ)毎に画像のレイアウト認識処理を行う。例えば、周知のヒストグラムによるレイアウト認識やラベリングによるレイアウト認識処理を行う。
【0023】
文字認識部15は、各色の画像レイヤー(のイメージデータ)毎に文字認識処理を行って、文字情報(認識した文字及びその位置のデータ)を出力する。例えば、周知のパターンマッチング等による文字認識処理(OCR処理)を行う。
【0024】
図3は、画像認識処理フローであり、本発明の画像認識装置の行なうカラーイメージデータの画像認識処理について示す。
【0025】
画像読取部11が1ページ分の原画像を読み取ったRGBの各色毎の読取信号を画像処理部12に送ると、画像処理部12がA/D変換してカラーイメージデータを生成し、セパレーション部13に送る。これにより、セパレーション部13がカラーイメージデータを取得する(ステップS11)。
【0026】
セパレーション部13は、取得したカラーイメージデータについて、ピクセル単位での色判定を行って、カラー原稿画像に含まれる色毎に分離した複数の画像レイヤーを生成する(ステップS12)。これについては、図4を参照して後述する。次に、セパレーション部13は、生成した各色の画像レイヤーについて、各々、注目ピクセルが該当色の場合には「1」に変換するとともに当該色以外の色の場合には「0」に変換する2値化処理を行って2値画像を作成し、レイアウト認識部14に送る(ステップS13)。即ち、2値画像からなる各色の画像レイヤーが送られる。
【0027】
この後、レイアウト認識部14が、2値画像からなる各色の画像レイヤーについて、各々、周知のレイアウト認識処理を行い、その結果及び2値画像からなる各色の画像レイヤーを文字認識部15に送る(ステップS14)。例えば、黒ピクセルを原稿の主走査方向や副走査方向に集積したヒストグラム、又は、黒ピクセルが連続する断片画像を抽出してラベルを付加するラベリングにより、画像が描かれている領域を特定するレイアウト認識処理を行う。
【0028】
次に、文字認識部15が、2値画像からなる各色の画像レイヤーについて、レイアウト認識処理の結果に基づいて、各々、周知の文字認識処理を行い(ステップS15)、その結果である画像及び文字情報(画像及び文字及びその位置を示す認識データ)を出力する(ステップS16)。即ち、認識された画像及び文字のデータを例えば外部装置に出力するか、又は、画面表示又は印刷出力する。
【0029】
図4は、画像認識処理フローであり、図3のステップS12及びS13においてセパレーション部13の行なう画像レイヤーの分離処理及び2値化処理について示す。
【0030】
セパレーション部13は、カラーイメージデータを受け取ると、各々のピクセルについて、そのカラーイメージデータをRGB色空間からL* a* b* (均等)色空間へ座標変換する(ステップS21)。即ち、各々のピクセルについてのRGBの24bitのデータ(RGB色空間の座標)を、ピクセル単位で、例えば、明度L* (0〜100階調)、色相a* (−127〜+127階調)、彩度b* (−127〜+127階調)で表すL* a* b* 色空間の座標に変換する。更に、明度L* 、色相a* 及び彩度b* を、各々、X1、X2及びX3階調に単純化する。例えば、X1=10、X2=10、X3=10であるとする。この場合、ピクセルは、以下の処理により、1000通りに分類(クラスタリング)されることになる。これにより、前述の階調のままでクラスタリングをおこなうよりも、処理を簡単なものにすることができる。
【0031】
この結果に基づいて、セパレーション部13は、L* a* b* 色空間上における各々のピクセルをクラスタリングし、この結果に従って、K平均クラスタリンに用いる当該カラーイメージデータにおける色の数K(=n、nは自然数)を決定する(ステップS22)。即ち、L* a* b* 色空間上における各々のピクセルについてのユークリッド距離を求め、当該距離により各ピクセルを色分けする単純クラスタリングを行い、全てのピクセルをいずれかの色(のクラスタ又はパレット)に分類する。これによって、当該カラーイメージデータを色毎の画像レイヤー、即ち、複数のイメージデータに分離する。分離された当該カラーイメージデータにおける色数Kは、クラスタの数に一致し、画像レイヤーの数Kに一致する。
【0032】
このとき、セパレーション部13は、具体的には、以下のように処理を行なう。即ち、ピクセルを分類するパレットとして、一般的に多いと考えられる白(平均色:L=0、a* =0、b* =0)のパレットと、黒(平均色:L=100、a* =0、b* =0)のパレットとを、ステップS22の初期処理により予め用意する。そして、注目ピクセルについて、その時点で存在するパレットの各々(の色)とのユークリッド距離を求める。最も近いパレットとのユークリッド距離が予め設定されている範囲内の色差(距離)である場合、当該最も近いパレットにその注目ピクセルを分類する。一方、最も近いパレットとのユークリッド距離が当該設定範囲を超える色差である場合、当該色の新たなパレットを作成し、これに当該注目ピクセルを分類する。この時点での当該新たなパレットの色(平均色)は、当該注目ピクセルの色に等しい。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、いずれかの色のパレット(クラスタ)に分類される。この結果、パレット数が当該カラーイメージデータに存在する色数Kとなり、カラーイメージデータを分類すべき色数がK色に決定される。
【0033】
なお、この決定された色数Kが多い場合、色数についての閾値を設定するようにしてもよい。即ち、色数Kが当該閾値を超える場合、例えば所定の個数以下のパレットを統合又は廃棄して、その数を減らすようにしてもよい。又は、分類されたピクセルの数が所定の個数より多いパレットのみを残して使用するようにしてもよい。この場合、残されるパレットからのユークリッド距離が所定の範囲以下のパレットを、当該残されるパレットに統合し、それ以外のパレットは廃棄するようにしてもよい。
【0034】
また、ステップS22の初期処理において、生成したい色(の画像レイヤー)の全てのパレットを用意し、新たなパレットを作成することなく、用意したパレットに分離できないピクセルは無視(廃棄)するか、又は、白のパレットに分類するようにしてもよい。この時、前記設定範囲は多少大きくすることが望ましい。用意するパレットとしては、例えば赤、緑、青、黒、白が望ましい。即ち、色の3原色、通常の文字の色である黒、原稿の背景である白である。
【0035】
次に、セパレーション部13は、K個のパレットの各々について、その時点での構成要素であるピクセルに従って、パレットの平均色を更新する(ステップS23)。即ち、当該パレットにその時点で分類されているピクセルの色を平均することにより、当該パレットの特性(又は、L* a* b* 色空間における中心点)を表す色(平均色)を求める。平均値は、各ピクセルのL、a* 、b* の各々の値の平均を求めることにより算出する。
【0036】
次に、セパレーション部13は、K色(K個)のパレットについて、周知のK平均クラスタリングを行う(ステップS24)。即ち、注目ピクセルについて、K個のパレットの各々の平均色(ステップS23において更新した値)とのユークリッド距離を求め、最も近いパレットにその注目ピクセルを分類し直す。従って、注目ピクセルは、ステップS22において分類された(元の)パレットに分類される場合と、これ以外のパレットに分類(以下、移動と言う)される場合とがある。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、K個のパレットに分類し直される。
【0037】
そこで、セパレーション部13は、パレットを移動したピクセルの数を求め、当該ピクセル数が予め設定した所定の値よりも多いか否かを調べる(ステップS25)。ピクセル数が所定値よりも多い場合、クラスタリングが安定していない(収束していない)ので、ステップS23以下を繰り返す。これにより、移動するピクセル数を所定値以下として収束させる。
【0038】
ピクセル数が所定値以下の場合、クラスタリングが安定した(収束した)ので、セパレーション部13は、K個のパレットを用いて、当該カラーイメージデータの2値化処理を行って各色毎の(K個の)2値画像即ち画像レイヤーを作成する(ステップS26)。即ち、当該カラーイメージデータにおいて、ある1個のパレットに分類されたピクセルを黒又は「1」に変換し、当該色以外のピクセルを白又は「0」に変換することにより、当該パレット又は色についての2値画像を作成する。即ち、当該色についての(1個の)画像レイヤーを得る。そして、これをK個のパレットについて繰り返すことにより、K色についての(K個の)画像レイヤーを得る。従って、画像レイヤーの各々は、当該対応する色のピクセルを黒で表した2値画像である。
【0039】
例えば、図5(A)に示すカラー原稿100があるとする。カラー原稿100において、白色の地色(背景色)に、文字Rは赤、文字Gは緑、文字Bは青、文字Kは黒で印刷されている。
【0040】
この場合、初期設定で用意される白及び黒のパレットに加えて、赤、緑、青のパレットが生成され、K=5とされる(ステップS22)。従って、K平均クラスタリングが収束したら(ステップS25)、白、黒、赤、緑、青の5個のパレットを用いて当該5色の画像レイヤーが生成される(ステップS26)。即ち、赤の画像レイヤー101においては、図5(B)に示すように、赤で印刷されていた文字Rが(黒で)表示される。同様に、緑、青及び黒の画像レイヤー101においては、各々、図6(A)、図6(B)及び図7(A)に示すように、緑、青及び黒で印刷されていた文字G、B及びKが(黒で)表示される。白の画像レイヤー101においては、図7(B)に示すように、原稿100の地色の部分(網かけで示す)が(黒で)表示され、文字R、G、B及びKが白抜き(図では黒で示す)で表示される。
【0041】
これにより、図5(A)のカラーイメージデータが、図5(B)〜図7(B)の各色のイメージデータに分離された画像レイヤーとされる。そこで、各々の画像レイヤーについて、レイアウト認識処理及び文字認識処理を実行する。従って、図5(B)の画像レイヤーからは、文字Rが文字認識により抽出される。同様に、図6(A)、図6(B)及び図7(A)の画像レイヤーからは、各々、文字G、B及びKが文字認識により抽出される。一方、図7(B)の画像レイヤーからは、白抜きの文字R、G、B及びKが文字認識により抽出される。これにより、カラーのカタログ等のように、黒字に白抜き文字や赤色の文字が描かれていたり、種々の背景色に種々の色の文字が描かれていたりしても、色が異なりさえすれば、当該色の文字を正確に抽出することができる。また、カラーのポスターのように、種々の色の種々の模様が描かれていても、これをレイアウト認識により抽出することができる。このように、例えば、図5(B)の文字と図6(A)の文字とが混同されて黒または白に変換され、文字認識できなくなることはなく、カラー原稿100でも正確にレイアウト認識及び文字認識することができる。
【0042】
なお、従来の文字認識処理によれば、1色のみ、例えば黒で印刷された文字Kのみが抽出され文字認識処理の対象とされて文字Kが出力され、一方、他の色の文字R、G、Bは抽出されず、認識されない。
【0043】
以上、本発明をその実施の態様に従って説明したが、本発明はその主旨に従って、種々の変形が可能である。
【0044】
例えば、以上の説明においては、図2(A)に示すように、本発明の画像処理装置をスキャナ装置20内に設ける場合について説明したが、本発明の画像処理装置の構成はこれに限られない。即ち、例えば、図2(B)に示すように、画像データ読取装置16のみをスキャナ装置20に設け、画像データ認識装置17をパーソナルコンピュータ30(又は、プリンタ装置やファクシミリ装置等)に設けてもよい。この場合、画像データ読取装置16から送出されたカラーイメージデータは、ネットワーク40を介して、パーソナルコンピュータ30における画像データ認識装置17が受信する。
【0045】
【発明の効果】
以上説明したように、本発明によれば、画像認識方法において、カラー画像を2値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なりさえすれば、これらが共に黒に変換され文字が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる。
【図面の簡単な説明】
【図1】画像認識装置構成図である。
【図2】画像認識装置構成図である。
【図3】画像認識処理フローである。
【図4】画像認識処理フローである。
【図5】画像認識処理説明図である。
【図6】画像認識処理説明図である。
【図7】画像認識処理説明図である。
【符号の説明】
11 画像読取部
12 画像処理部
13 セパレーション部
14 レイアウト認識部
15 文字認識部
【発明の属する技術分野】
本発明は、画像認識方法に関し、特に、種々の色を含むカラー原稿から種々の色の画像のレイアウトや文字を正確に認識することができる画像認識方法に関する。
【0002】
【従来の技術】
スキャナ装置等の画像読取装置で原稿から読み取った画像のイメージデータについて文字認識処理(又はOCR処理)を実行して、画像から文字データを抽出することが行われている。従来、この文字認識処理の対象となる原稿は文書などのモノクロ原稿であったが、近年では、例えばカタログのようなカラー画像の描かれた原稿(カラー原稿)からも文字認識処理により文字データを抽出することが行われる場合も増えている。
【0003】
このようなカラー原稿の文字認識処理は、従来の文字認識処理がモノクロの2値画像を処理する形式であったため、カラー画像を何らかの方法で2値化処理してモノクロの2値画像とした後に、この2値画像についてレイアウト認識処理及び文字認識処理を行って、文字データを抽出している。
【0004】
【発明が解決しようとする課題】
前述のように、従来のカラー原稿の文字認識処理は、カラー画像を2値画像とした後に行っているので、以下のような問題があった。
【0005】
即ち、原稿がカラーであるにもかかわらず、当該カラー情報は何ら生かされていない。即ち、グレー画像を用いるのと何ら差異がなく、カラー画像を対象とした意義がないに等しい。
【0006】
また、カラー原稿においては文字(の色)とその背景色とが異なるにもかかわらず、2値化処理をした結果、文字及び背景色が共に黒(又は白)に変換されてしまう場合がある。この場合、2値画像においては文字が失われてしまい、文字認識ができなくなる。
【0007】
更に、前述のように、2値化処理をした結果、文字及び背景色が共に黒(又は白)に変換されてしまうと、レイアウト認識ができなくなってしまう。文字認識処理においては、通常、文字がどのようなレイアウト(配置)で配列されているかを把握した後に、文字認識処理を実行する。従って、レイアウト認識に失敗すると、文字認識処理に移行することができなくなる。
【0008】
本発明は、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる画像認識方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の画像認識方法は、カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、カラーイメージデータをこれに含まれる色毎に複数のイメージデータに分離処理し、複数のイメージデータ毎に認識処理を行なう。
【0010】
本発明の画像認識方法によれば、カラー画像を2値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なれば、これらが共に黒(又は白)に変換され文字(文字情報)が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含む多くの既存のカラー原稿から種々の色の画像を正確に認識して抽出することができる。
【0011】
【発明の実施の形態】
図1及び図2は、画像認識装置構成図であり、特に、図1は本発明の画像認識方法の構成を示し、図2は本発明の画像認識方法を搭載するスキャナ装置のような画像処理装置の構成を示す。
【0012】
本発明の画像認識装置は、画像読取部11、画像処理部12、セパレーション部13、レイアウト認識部14、文字認識部15を備える。画像読取部11と画像処理部12とで画像データ読取装置16を構成し、セパレーション部13、レイアウト認識部14、文字認識部15とで画像データ認識装置17を構成する。この例では、図2(A)に示すように、画像データ読取装置16及び画像データ認識装置17がスキャナ(スキャナ装置)20に設けられる。スキャナ20は、LAN(Local Area Network)のようなネットワーク又は周知のインタフェース(以下、ネットワーク)40を介して、パーソナルコンピュータ30に接続される。
【0013】
画像読取部11は、例えば周知のCCD(電荷結合デバイス)等からなり、例えば自動原稿給紙装置により自動的に読取台に載置された両面原稿又は片面原稿の画像面から画像(原画像)を光学的に読み取って増幅することにより、R(レッド)、G(グリーン)、B(ブルー)の各色の読取信号(アナログ信号)を画像処理部12に出力する。この例では、画像読取部11は、操作パネル(図示せず)からの読取モードの入力指示に従って、原稿画像からカラー画像の読取を行うように設定される。なお、画像読取部11は、前記入力指示に従って、グレー画像、モノクロ画像の読取も可能である。
【0014】
画像処理部12は、画像読取部11から送られてきたRGBの各色の読取信号をアナログ(A)/デジタル(D)変換して、例えばRGBの各色毎に8bitで表される計24bitの(フル)カラーイメージデータを生成する。画像処理部12は、このカラーイメージデータを、画像認識処理のために、画像データ認識装置17(のセパレーション部13)に送る。
【0015】
画像データ認識装置17は、画像認識処理、即ち、レイアウト認識処理及び文字認識処理(OCR処理)を行う。この例では、画像データ認識装置17は、画像認識処理に先立って、カラーイメージデータを複数の単色イメージデータに分離する分離処理を行う。従って、画像認識処理は、分離処理された複数の単色イメージデータについて行われる。
【0016】
セパレーション部13は、画像処理部12からのカラーイメージデータを、ピクセル単位でL* a* b* 色空間の座標に変換し、これに基づいて各ピクセルの色を判定することにより、原稿画像(原画像)を各色毎に分離した画像(以下、画像レイヤー)を作成し、また、原稿に含まれる色の数Kを決定する。即ち、フルカラーの原稿の画像(のデータ)を、各色毎の画像(のデータ)に分離する(図5以下参照)。この例では、分離後の各色の画像レイヤーは、当該色ではなく例えば黒色で表示(又は出力)される。なお、各色の画像レイヤーを当該色で表示(又は出力)してもよい。
【0017】
具体的には、セパレーション部13は、カラーイメージデータのL* a* b* 色空間の座標内における間隔(ユークリッド距離)を求め、これが予め設定された所定の距離(閾値)内にあるときには同一色と判定する。この閾値は、経験的にほぼ正確に定めることができる。即ち、人による色の認識にほぼ正確に従うように、色を分離することができる。これにより、カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離する。カラーイメージデータから分離する画像レイヤーの数Kは、カラー原稿により異なり、通常、分離前は不明であり、分離してみて始めて判る(定まる)。なお、予めカラー原稿に含まれる色の数が判っている場合、又は、多く使用される色を分離すればよい場合等においては、分離する色即ち画像レイヤーの数を制限するようにしてもよい。例えば、赤、緑、青、黒、白等の画像レイヤーのみを抽出するように制限する。これにより、処理の負担を軽減することができる。
【0018】
ここで、L* a* b* 色空間とは、国際照明委員会(Commission Internationale De L’eclairage)が1976年に推奨したXYZ表色系を基礎とする均等色空間であり、RGB色空間よりも人による色の認識に近い座標表示をすることができる。セパレーション部13において、画像レイヤーの分離のために、人の認識に近いL* a* b* 色空間を採用する方が、実際の原画像との誤差を少なくすることができ好適である。
【0019】
なお、セパレーション部13が、イメージデータのRGBデータをそのまま用いて画像レイヤーを生成するようにしてもよく、又は、印刷データにおいて用いられるC(シアン)、M(マゼンダ)、Y(イエロー)、B(黒)を用いて画像レイヤーを生成するようにしてもよい。
【0020】
更に、セパレーション部13は、カラーイメージデータを2値化処理して、当該イメージデータとは別に、2値データ(モノクロ画像)を生成して、これをレイアウト認識部14に送る。この例において、セパレーション部13は、画像処理部12から受け取ったカラーイメージデータを、先に求めた原稿に含まれるK色の色ごとに2値化処理することにより、原稿に含まれる色の数(画像レイヤーの数)であるK個の2値画像に分離する。即ち、ある1個の色について、前記受け取ったカラーイメージデータにおける注目ピクセルが該当色の場合には「1」又は「黒」に変換し、当該色以外の色の場合には「0」又は「白」に変換する。そして、これを当該K個の色について繰り返す。これにより、K個の2値画像(K色の画像レイヤー)が得られる。
【0021】
この例では、カラーイメージデータを人の認識に近いL* a* b* 色空間に投影した上で2値化処理している。従って、人による色の認識にほぼ正確に従うように、色を分離することができる。即ち、当該色以外の色の画像は、当該色に多少近い色でも「0」又は白とされ、当該色で描かれた文字等の画像は「1」又は黒とされる。例えば、赤とオレンジとを正確に分離することができる。そして、これに基づいて、当該カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離することができる。
【0022】
レイアウト認識部14は、各色の画像レイヤー(のイメージデータ)毎に画像のレイアウト認識処理を行う。例えば、周知のヒストグラムによるレイアウト認識やラベリングによるレイアウト認識処理を行う。
【0023】
文字認識部15は、各色の画像レイヤー(のイメージデータ)毎に文字認識処理を行って、文字情報(認識した文字及びその位置のデータ)を出力する。例えば、周知のパターンマッチング等による文字認識処理(OCR処理)を行う。
【0024】
図3は、画像認識処理フローであり、本発明の画像認識装置の行なうカラーイメージデータの画像認識処理について示す。
【0025】
画像読取部11が1ページ分の原画像を読み取ったRGBの各色毎の読取信号を画像処理部12に送ると、画像処理部12がA/D変換してカラーイメージデータを生成し、セパレーション部13に送る。これにより、セパレーション部13がカラーイメージデータを取得する(ステップS11)。
【0026】
セパレーション部13は、取得したカラーイメージデータについて、ピクセル単位での色判定を行って、カラー原稿画像に含まれる色毎に分離した複数の画像レイヤーを生成する(ステップS12)。これについては、図4を参照して後述する。次に、セパレーション部13は、生成した各色の画像レイヤーについて、各々、注目ピクセルが該当色の場合には「1」に変換するとともに当該色以外の色の場合には「0」に変換する2値化処理を行って2値画像を作成し、レイアウト認識部14に送る(ステップS13)。即ち、2値画像からなる各色の画像レイヤーが送られる。
【0027】
この後、レイアウト認識部14が、2値画像からなる各色の画像レイヤーについて、各々、周知のレイアウト認識処理を行い、その結果及び2値画像からなる各色の画像レイヤーを文字認識部15に送る(ステップS14)。例えば、黒ピクセルを原稿の主走査方向や副走査方向に集積したヒストグラム、又は、黒ピクセルが連続する断片画像を抽出してラベルを付加するラベリングにより、画像が描かれている領域を特定するレイアウト認識処理を行う。
【0028】
次に、文字認識部15が、2値画像からなる各色の画像レイヤーについて、レイアウト認識処理の結果に基づいて、各々、周知の文字認識処理を行い(ステップS15)、その結果である画像及び文字情報(画像及び文字及びその位置を示す認識データ)を出力する(ステップS16)。即ち、認識された画像及び文字のデータを例えば外部装置に出力するか、又は、画面表示又は印刷出力する。
【0029】
図4は、画像認識処理フローであり、図3のステップS12及びS13においてセパレーション部13の行なう画像レイヤーの分離処理及び2値化処理について示す。
【0030】
セパレーション部13は、カラーイメージデータを受け取ると、各々のピクセルについて、そのカラーイメージデータをRGB色空間からL* a* b* (均等)色空間へ座標変換する(ステップS21)。即ち、各々のピクセルについてのRGBの24bitのデータ(RGB色空間の座標)を、ピクセル単位で、例えば、明度L* (0〜100階調)、色相a* (−127〜+127階調)、彩度b* (−127〜+127階調)で表すL* a* b* 色空間の座標に変換する。更に、明度L* 、色相a* 及び彩度b* を、各々、X1、X2及びX3階調に単純化する。例えば、X1=10、X2=10、X3=10であるとする。この場合、ピクセルは、以下の処理により、1000通りに分類(クラスタリング)されることになる。これにより、前述の階調のままでクラスタリングをおこなうよりも、処理を簡単なものにすることができる。
【0031】
この結果に基づいて、セパレーション部13は、L* a* b* 色空間上における各々のピクセルをクラスタリングし、この結果に従って、K平均クラスタリンに用いる当該カラーイメージデータにおける色の数K(=n、nは自然数)を決定する(ステップS22)。即ち、L* a* b* 色空間上における各々のピクセルについてのユークリッド距離を求め、当該距離により各ピクセルを色分けする単純クラスタリングを行い、全てのピクセルをいずれかの色(のクラスタ又はパレット)に分類する。これによって、当該カラーイメージデータを色毎の画像レイヤー、即ち、複数のイメージデータに分離する。分離された当該カラーイメージデータにおける色数Kは、クラスタの数に一致し、画像レイヤーの数Kに一致する。
【0032】
このとき、セパレーション部13は、具体的には、以下のように処理を行なう。即ち、ピクセルを分類するパレットとして、一般的に多いと考えられる白(平均色:L=0、a* =0、b* =0)のパレットと、黒(平均色:L=100、a* =0、b* =0)のパレットとを、ステップS22の初期処理により予め用意する。そして、注目ピクセルについて、その時点で存在するパレットの各々(の色)とのユークリッド距離を求める。最も近いパレットとのユークリッド距離が予め設定されている範囲内の色差(距離)である場合、当該最も近いパレットにその注目ピクセルを分類する。一方、最も近いパレットとのユークリッド距離が当該設定範囲を超える色差である場合、当該色の新たなパレットを作成し、これに当該注目ピクセルを分類する。この時点での当該新たなパレットの色(平均色)は、当該注目ピクセルの色に等しい。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、いずれかの色のパレット(クラスタ)に分類される。この結果、パレット数が当該カラーイメージデータに存在する色数Kとなり、カラーイメージデータを分類すべき色数がK色に決定される。
【0033】
なお、この決定された色数Kが多い場合、色数についての閾値を設定するようにしてもよい。即ち、色数Kが当該閾値を超える場合、例えば所定の個数以下のパレットを統合又は廃棄して、その数を減らすようにしてもよい。又は、分類されたピクセルの数が所定の個数より多いパレットのみを残して使用するようにしてもよい。この場合、残されるパレットからのユークリッド距離が所定の範囲以下のパレットを、当該残されるパレットに統合し、それ以外のパレットは廃棄するようにしてもよい。
【0034】
また、ステップS22の初期処理において、生成したい色(の画像レイヤー)の全てのパレットを用意し、新たなパレットを作成することなく、用意したパレットに分離できないピクセルは無視(廃棄)するか、又は、白のパレットに分類するようにしてもよい。この時、前記設定範囲は多少大きくすることが望ましい。用意するパレットとしては、例えば赤、緑、青、黒、白が望ましい。即ち、色の3原色、通常の文字の色である黒、原稿の背景である白である。
【0035】
次に、セパレーション部13は、K個のパレットの各々について、その時点での構成要素であるピクセルに従って、パレットの平均色を更新する(ステップS23)。即ち、当該パレットにその時点で分類されているピクセルの色を平均することにより、当該パレットの特性(又は、L* a* b* 色空間における中心点)を表す色(平均色)を求める。平均値は、各ピクセルのL、a* 、b* の各々の値の平均を求めることにより算出する。
【0036】
次に、セパレーション部13は、K色(K個)のパレットについて、周知のK平均クラスタリングを行う(ステップS24)。即ち、注目ピクセルについて、K個のパレットの各々の平均色(ステップS23において更新した値)とのユークリッド距離を求め、最も近いパレットにその注目ピクセルを分類し直す。従って、注目ピクセルは、ステップS22において分類された(元の)パレットに分類される場合と、これ以外のパレットに分類(以下、移動と言う)される場合とがある。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、K個のパレットに分類し直される。
【0037】
そこで、セパレーション部13は、パレットを移動したピクセルの数を求め、当該ピクセル数が予め設定した所定の値よりも多いか否かを調べる(ステップS25)。ピクセル数が所定値よりも多い場合、クラスタリングが安定していない(収束していない)ので、ステップS23以下を繰り返す。これにより、移動するピクセル数を所定値以下として収束させる。
【0038】
ピクセル数が所定値以下の場合、クラスタリングが安定した(収束した)ので、セパレーション部13は、K個のパレットを用いて、当該カラーイメージデータの2値化処理を行って各色毎の(K個の)2値画像即ち画像レイヤーを作成する(ステップS26)。即ち、当該カラーイメージデータにおいて、ある1個のパレットに分類されたピクセルを黒又は「1」に変換し、当該色以外のピクセルを白又は「0」に変換することにより、当該パレット又は色についての2値画像を作成する。即ち、当該色についての(1個の)画像レイヤーを得る。そして、これをK個のパレットについて繰り返すことにより、K色についての(K個の)画像レイヤーを得る。従って、画像レイヤーの各々は、当該対応する色のピクセルを黒で表した2値画像である。
【0039】
例えば、図5(A)に示すカラー原稿100があるとする。カラー原稿100において、白色の地色(背景色)に、文字Rは赤、文字Gは緑、文字Bは青、文字Kは黒で印刷されている。
【0040】
この場合、初期設定で用意される白及び黒のパレットに加えて、赤、緑、青のパレットが生成され、K=5とされる(ステップS22)。従って、K平均クラスタリングが収束したら(ステップS25)、白、黒、赤、緑、青の5個のパレットを用いて当該5色の画像レイヤーが生成される(ステップS26)。即ち、赤の画像レイヤー101においては、図5(B)に示すように、赤で印刷されていた文字Rが(黒で)表示される。同様に、緑、青及び黒の画像レイヤー101においては、各々、図6(A)、図6(B)及び図7(A)に示すように、緑、青及び黒で印刷されていた文字G、B及びKが(黒で)表示される。白の画像レイヤー101においては、図7(B)に示すように、原稿100の地色の部分(網かけで示す)が(黒で)表示され、文字R、G、B及びKが白抜き(図では黒で示す)で表示される。
【0041】
これにより、図5(A)のカラーイメージデータが、図5(B)〜図7(B)の各色のイメージデータに分離された画像レイヤーとされる。そこで、各々の画像レイヤーについて、レイアウト認識処理及び文字認識処理を実行する。従って、図5(B)の画像レイヤーからは、文字Rが文字認識により抽出される。同様に、図6(A)、図6(B)及び図7(A)の画像レイヤーからは、各々、文字G、B及びKが文字認識により抽出される。一方、図7(B)の画像レイヤーからは、白抜きの文字R、G、B及びKが文字認識により抽出される。これにより、カラーのカタログ等のように、黒字に白抜き文字や赤色の文字が描かれていたり、種々の背景色に種々の色の文字が描かれていたりしても、色が異なりさえすれば、当該色の文字を正確に抽出することができる。また、カラーのポスターのように、種々の色の種々の模様が描かれていても、これをレイアウト認識により抽出することができる。このように、例えば、図5(B)の文字と図6(A)の文字とが混同されて黒または白に変換され、文字認識できなくなることはなく、カラー原稿100でも正確にレイアウト認識及び文字認識することができる。
【0042】
なお、従来の文字認識処理によれば、1色のみ、例えば黒で印刷された文字Kのみが抽出され文字認識処理の対象とされて文字Kが出力され、一方、他の色の文字R、G、Bは抽出されず、認識されない。
【0043】
以上、本発明をその実施の態様に従って説明したが、本発明はその主旨に従って、種々の変形が可能である。
【0044】
例えば、以上の説明においては、図2(A)に示すように、本発明の画像処理装置をスキャナ装置20内に設ける場合について説明したが、本発明の画像処理装置の構成はこれに限られない。即ち、例えば、図2(B)に示すように、画像データ読取装置16のみをスキャナ装置20に設け、画像データ認識装置17をパーソナルコンピュータ30(又は、プリンタ装置やファクシミリ装置等)に設けてもよい。この場合、画像データ読取装置16から送出されたカラーイメージデータは、ネットワーク40を介して、パーソナルコンピュータ30における画像データ認識装置17が受信する。
【0045】
【発明の効果】
以上説明したように、本発明によれば、画像認識方法において、カラー画像を2値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なりさえすれば、これらが共に黒に変換され文字が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる。
【図面の簡単な説明】
【図1】画像認識装置構成図である。
【図2】画像認識装置構成図である。
【図3】画像認識処理フローである。
【図4】画像認識処理フローである。
【図5】画像認識処理説明図である。
【図6】画像認識処理説明図である。
【図7】画像認識処理説明図である。
【符号の説明】
11 画像読取部
12 画像処理部
13 セパレーション部
14 レイアウト認識部
15 文字認識部
Claims (5)
- カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、
カラーイメージデータを、これに含まれる色毎に複数のイメージデータに分離処理し、
前記複数のイメージデータ毎に認識処理を行なう
ことを特徴とする画像認識方法。 - 前記分離処理において、前記カラーイメージデータを、ピクセル単位でL* a* b* 色空間の座標に変換してこれに基づいて各ピクセルの色を判定することにより、前記複数のイメージデータに分離する
ことを特徴とする請求項1に記載の画像認識方法。 - 前記カラーイメージデータのピクセルの各々について単純クラスタリングにより色数Kを求め、当該色数KについてのK平均クラスタリングにより前記ピクセルの各々をいずれかの色に分離する
ことを特徴とする請求項2に記載の画像認識方法。 - 前記分離処理において、更に、分離した前記複数のイメージデータを、各々、当該複数のイメージデータ毎に該当色のピクセルを「黒」とし当該色以外の色のピクセルを「白」とすることにより、2値画像とする
ことを特徴とする請求項1に記載の画像認識方法。 - 前記認識処理において、前記複数のイメージデータ毎にレイアウト認識及びその後の文字認識を行う
ことを特徴とする請求項1に記載の画像認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002177988A JP2004021765A (ja) | 2002-06-19 | 2002-06-19 | 画像認識方法 |
US10/462,796 US20030235334A1 (en) | 2002-06-19 | 2003-06-17 | Method for recognizing image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002177988A JP2004021765A (ja) | 2002-06-19 | 2002-06-19 | 画像認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004021765A true JP2004021765A (ja) | 2004-01-22 |
Family
ID=29728182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002177988A Pending JP2004021765A (ja) | 2002-06-19 | 2002-06-19 | 画像認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20030235334A1 (ja) |
JP (1) | JP2004021765A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225112A (ja) * | 2009-03-25 | 2010-10-07 | Toppan Printing Co Ltd | データ生成装置およびデータ生成方法 |
JP2012174163A (ja) * | 2011-02-24 | 2012-09-10 | Fujitsu Ltd | 文字認識処理装置および方法並びに文字認識処理プログラム |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4686595B2 (ja) * | 2005-03-17 | 2011-05-25 | 本田技研工業株式会社 | クリティカルポイント解析に基づくポーズ推定 |
US7880925B2 (en) * | 2005-08-02 | 2011-02-01 | Kabushiki Kaisha Toshiba | Apparatus and method for generating an image file with a color layer and a monochrome layer |
US8351646B2 (en) * | 2006-12-21 | 2013-01-08 | Honda Motor Co., Ltd. | Human pose estimation and tracking using label assignment |
US7679796B2 (en) * | 2007-02-02 | 2010-03-16 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
US20100124372A1 (en) * | 2008-11-12 | 2010-05-20 | Lockheed Martin Corporation | Methods and systems for identifying/accessing color related information |
US8214742B2 (en) * | 2008-12-23 | 2012-07-03 | International Business Machines Corporation | Method of rapidly creating visual aids for presentation without technical knowledge |
US8755569B2 (en) * | 2009-05-29 | 2014-06-17 | University Of Central Florida Research Foundation, Inc. | Methods for recognizing pose and action of articulated objects with collection of planes in motion |
CN104899586B (zh) * | 2014-03-03 | 2018-10-12 | 阿里巴巴集团控股有限公司 | 对图像中包含的文字内容进行识别方法及装置 |
CN104881626B (zh) * | 2015-01-19 | 2017-12-29 | 新疆农业大学 | 果树果实的识别方法 |
RU2603495C1 (ru) * | 2015-06-16 | 2016-11-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Классификация изображений документов на основе параметров цветовых слоев |
CN105894084A (zh) * | 2015-11-23 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 影院票房人数统计方法、装置和系统 |
US10796199B1 (en) | 2019-05-29 | 2020-10-06 | Alibaba Group Holding Limited | Image recognition and authentication |
CN110263775B (zh) * | 2019-05-29 | 2021-03-05 | 创新先进技术有限公司 | 图像识别方法、装置、设备和认证方法、装置、设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3753357B2 (ja) * | 1999-01-19 | 2006-03-08 | 株式会社リコー | 文字抽出方法および記録媒体 |
US6987879B1 (en) * | 1999-05-26 | 2006-01-17 | Ricoh Co., Ltd. | Method and system for extracting information from images in similar surrounding color |
JP2001297303A (ja) * | 2000-02-09 | 2001-10-26 | Ricoh Co Ltd | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 |
US7020329B2 (en) * | 2001-08-31 | 2006-03-28 | Massachusetts Institute Of Technology | Color image segmentation in an object recognition system |
-
2002
- 2002-06-19 JP JP2002177988A patent/JP2004021765A/ja active Pending
-
2003
- 2003-06-17 US US10/462,796 patent/US20030235334A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225112A (ja) * | 2009-03-25 | 2010-10-07 | Toppan Printing Co Ltd | データ生成装置およびデータ生成方法 |
JP2012174163A (ja) * | 2011-02-24 | 2012-09-10 | Fujitsu Ltd | 文字認識処理装置および方法並びに文字認識処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20030235334A1 (en) | 2003-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4772888B2 (ja) | 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 | |
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
JP2004021765A (ja) | 画像認識方法 | |
US8565531B2 (en) | Edge detection for mixed raster content (MRC) images for improved compression and image quality | |
JP2010146185A (ja) | 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体 | |
JP2008099149A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
WO2014045788A1 (ja) | 画像処理装置、画像形成装置、および記録媒体 | |
US8670623B2 (en) | Image processing apparatus, image conversion method, and computer-readable storage medium for computer program based on calculated degree of complexity | |
US6125200A (en) | Removing non-text information from a color image | |
US11588954B2 (en) | Image processing device, control method, and non-transitory recording medium | |
JP6607490B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
JP2012074852A (ja) | 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体 | |
JP4213112B2 (ja) | 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体 | |
JP2004229261A (ja) | 画像圧縮方法、画像圧縮装置及びプログラム並びに記録媒体 | |
JP3899872B2 (ja) | 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 | |
JP4050220B2 (ja) | 画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体 | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP4571758B2 (ja) | 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体 | |
JP2008172677A (ja) | 画像処理装置および地色検出方法 | |
JP2006270148A (ja) | 画像処理方法および画像処理装置並びに画像形成装置 | |
JP2019135878A (ja) | 画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体 | |
JP4375106B2 (ja) | 画像処理装置 | |
JP4179998B2 (ja) | 画像処理方法、画像処理装置、画像形成装置、及びコンピュータプログラム | |
JP2003298853A (ja) | 画像処理装置 | |
JP2004023413A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070612 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071106 |