JP2004021765A

JP2004021765A - 画像認識方法

Info

Publication number: JP2004021765A
Application number: JP2002177988A
Authority: JP
Inventors: Nobuyuki Okubo; 大窪　伸幸
Original assignee: PFU Ltd
Current assignee: PFU Ltd
Priority date: 2002-06-19
Filing date: 2002-06-19
Publication date: 2004-01-22
Also published as: US20030235334A1

Abstract

【課題】本発明は、画像認識方法に関し、種々の色を含むカラー原稿から種々の色の画像を正確に認識することを目的とする。
【解決手段】カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、セパレーション部１３がカラーイメージデータをこれに含まれる色毎に複数のイメージデータ（画像レイヤー）に分離処理し、レイアウト認識部１４及び文字認識部１５が複数のイメージデータ毎にレイアウト認識処理及び文字認識処理を行なう。
【選択図】　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、画像認識方法に関し、特に、種々の色を含むカラー原稿から種々の色の画像のレイアウトや文字を正確に認識することができる画像認識方法に関する。
【０００２】
【従来の技術】
スキャナ装置等の画像読取装置で原稿から読み取った画像のイメージデータについて文字認識処理（又はＯＣＲ処理）を実行して、画像から文字データを抽出することが行われている。従来、この文字認識処理の対象となる原稿は文書などのモノクロ原稿であったが、近年では、例えばカタログのようなカラー画像の描かれた原稿（カラー原稿）からも文字認識処理により文字データを抽出することが行われる場合も増えている。
【０００３】
このようなカラー原稿の文字認識処理は、従来の文字認識処理がモノクロの２値画像を処理する形式であったため、カラー画像を何らかの方法で２値化処理してモノクロの２値画像とした後に、この２値画像についてレイアウト認識処理及び文字認識処理を行って、文字データを抽出している。
【０００４】
【発明が解決しようとする課題】
前述のように、従来のカラー原稿の文字認識処理は、カラー画像を２値画像とした後に行っているので、以下のような問題があった。
【０００５】
即ち、原稿がカラーであるにもかかわらず、当該カラー情報は何ら生かされていない。即ち、グレー画像を用いるのと何ら差異がなく、カラー画像を対象とした意義がないに等しい。
【０００６】
また、カラー原稿においては文字（の色）とその背景色とが異なるにもかかわらず、２値化処理をした結果、文字及び背景色が共に黒（又は白）に変換されてしまう場合がある。この場合、２値画像においては文字が失われてしまい、文字認識ができなくなる。
【０００７】
更に、前述のように、２値化処理をした結果、文字及び背景色が共に黒（又は白）に変換されてしまうと、レイアウト認識ができなくなってしまう。文字認識処理においては、通常、文字がどのようなレイアウト（配置）で配列されているかを把握した後に、文字認識処理を実行する。従って、レイアウト認識に失敗すると、文字認識処理に移行することができなくなる。
【０００８】
本発明は、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる画像認識方法を提供することを目的とする。
【０００９】
【課題を解決するための手段】
本発明の画像認識方法は、カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、カラーイメージデータをこれに含まれる色毎に複数のイメージデータに分離処理し、複数のイメージデータ毎に認識処理を行なう。
【００１０】
本発明の画像認識方法によれば、カラー画像を２値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なれば、これらが共に黒（又は白）に変換され文字（文字情報）が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含む多くの既存のカラー原稿から種々の色の画像を正確に認識して抽出することができる。
【００１１】
【発明の実施の形態】
図１及び図２は、画像認識装置構成図であり、特に、図１は本発明の画像認識方法の構成を示し、図２は本発明の画像認識方法を搭載するスキャナ装置のような画像処理装置の構成を示す。
【００１２】
本発明の画像認識装置は、画像読取部１１、画像処理部１２、セパレーション部１３、レイアウト認識部１４、文字認識部１５を備える。画像読取部１１と画像処理部１２とで画像データ読取装置１６を構成し、セパレーション部１３、レイアウト認識部１４、文字認識部１５とで画像データ認識装置１７を構成する。この例では、図２（Ａ）に示すように、画像データ読取装置１６及び画像データ認識装置１７がスキャナ（スキャナ装置）２０に設けられる。スキャナ２０は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）のようなネットワーク又は周知のインタフェース（以下、ネットワーク）４０を介して、パーソナルコンピュータ３０に接続される。
【００１３】
画像読取部１１は、例えば周知のＣＣＤ（電荷結合デバイス）等からなり、例えば自動原稿給紙装置により自動的に読取台に載置された両面原稿又は片面原稿の画像面から画像（原画像）を光学的に読み取って増幅することにより、Ｒ（レッド）、Ｇ（グリーン）、Ｂ（ブルー）の各色の読取信号（アナログ信号）を画像処理部１２に出力する。この例では、画像読取部１１は、操作パネル（図示せず）からの読取モードの入力指示に従って、原稿画像からカラー画像の読取を行うように設定される。なお、画像読取部１１は、前記入力指示に従って、グレー画像、モノクロ画像の読取も可能である。
【００１４】
画像処理部１２は、画像読取部１１から送られてきたＲＧＢの各色の読取信号をアナログ（Ａ）／デジタル（Ｄ）変換して、例えばＲＧＢの各色毎に８ｂｉｔで表される計２４ｂｉｔの（フル）カラーイメージデータを生成する。画像処理部１２は、このカラーイメージデータを、画像認識処理のために、画像データ認識装置１７（のセパレーション部１３）に送る。
【００１５】
画像データ認識装置１７は、画像認識処理、即ち、レイアウト認識処理及び文字認識処理（ＯＣＲ処理）を行う。この例では、画像データ認識装置１７は、画像認識処理に先立って、カラーイメージデータを複数の単色イメージデータに分離する分離処理を行う。従って、画像認識処理は、分離処理された複数の単色イメージデータについて行われる。
【００１６】
セパレーション部１３は、画像処理部１２からのカラーイメージデータを、ピクセル単位でＬ^＊ａ^＊ｂ^＊色空間の座標に変換し、これに基づいて各ピクセルの色を判定することにより、原稿画像（原画像）を各色毎に分離した画像（以下、画像レイヤー）を作成し、また、原稿に含まれる色の数Ｋを決定する。即ち、フルカラーの原稿の画像（のデータ）を、各色毎の画像（のデータ）に分離する（図５以下参照）。この例では、分離後の各色の画像レイヤーは、当該色ではなく例えば黒色で表示（又は出力）される。なお、各色の画像レイヤーを当該色で表示（又は出力）してもよい。
【００１７】
具体的には、セパレーション部１３は、カラーイメージデータのＬ^＊ａ^＊ｂ^＊色空間の座標内における間隔（ユークリッド距離）を求め、これが予め設定された所定の距離（閾値）内にあるときには同一色と判定する。この閾値は、経験的にほぼ正確に定めることができる。即ち、人による色の認識にほぼ正確に従うように、色を分離することができる。これにより、カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離する。カラーイメージデータから分離する画像レイヤーの数Ｋは、カラー原稿により異なり、通常、分離前は不明であり、分離してみて始めて判る（定まる）。なお、予めカラー原稿に含まれる色の数が判っている場合、又は、多く使用される色を分離すればよい場合等においては、分離する色即ち画像レイヤーの数を制限するようにしてもよい。例えば、赤、緑、青、黒、白等の画像レイヤーのみを抽出するように制限する。これにより、処理の負担を軽減することができる。
【００１８】
ここで、Ｌ^＊ａ^＊ｂ^＊色空間とは、国際照明委員会（Ｃｏｍｍｉｓｓｉｏｎ　Ｉｎｔｅｒｎａｔｉｏｎａｌｅ　Ｄｅ　Ｌ’ｅｃｌａｉｒａｇｅ）が１９７６年に推奨したＸＹＺ表色系を基礎とする均等色空間であり、ＲＧＢ色空間よりも人による色の認識に近い座標表示をすることができる。セパレーション部１３において、画像レイヤーの分離のために、人の認識に近いＬ^＊ａ^＊ｂ^＊色空間を採用する方が、実際の原画像との誤差を少なくすることができ好適である。
【００１９】
なお、セパレーション部１３が、イメージデータのＲＧＢデータをそのまま用いて画像レイヤーを生成するようにしてもよく、又は、印刷データにおいて用いられるＣ（シアン）、Ｍ（マゼンダ）、Ｙ（イエロー）、Ｂ（黒）を用いて画像レイヤーを生成するようにしてもよい。
【００２０】
更に、セパレーション部１３は、カラーイメージデータを２値化処理して、当該イメージデータとは別に、２値データ（モノクロ画像）を生成して、これをレイアウト認識部１４に送る。この例において、セパレーション部１３は、画像処理部１２から受け取ったカラーイメージデータを、先に求めた原稿に含まれるＫ色の色ごとに２値化処理することにより、原稿に含まれる色の数（画像レイヤーの数）であるＫ個の２値画像に分離する。即ち、ある１個の色について、前記受け取ったカラーイメージデータにおける注目ピクセルが該当色の場合には「１」又は「黒」に変換し、当該色以外の色の場合には「０」又は「白」に変換する。そして、これを当該Ｋ個の色について繰り返す。これにより、Ｋ個の２値画像（Ｋ色の画像レイヤー）が得られる。
【００２１】
この例では、カラーイメージデータを人の認識に近いＬ^＊ａ^＊ｂ^＊色空間に投影した上で２値化処理している。従って、人による色の認識にほぼ正確に従うように、色を分離することができる。即ち、当該色以外の色の画像は、当該色に多少近い色でも「０」又は白とされ、当該色で描かれた文字等の画像は「１」又は黒とされる。例えば、赤とオレンジとを正確に分離することができる。そして、これに基づいて、当該カラーイメージデータの画像を、その中に存在する色毎の複数の画像に分離することができる。
【００２２】
レイアウト認識部１４は、各色の画像レイヤー（のイメージデータ）毎に画像のレイアウト認識処理を行う。例えば、周知のヒストグラムによるレイアウト認識やラベリングによるレイアウト認識処理を行う。
【００２３】
文字認識部１５は、各色の画像レイヤー（のイメージデータ）毎に文字認識処理を行って、文字情報（認識した文字及びその位置のデータ）を出力する。例えば、周知のパターンマッチング等による文字認識処理（ＯＣＲ処理）を行う。
【００２４】
図３は、画像認識処理フローであり、本発明の画像認識装置の行なうカラーイメージデータの画像認識処理について示す。
【００２５】
画像読取部１１が１ページ分の原画像を読み取ったＲＧＢの各色毎の読取信号を画像処理部１２に送ると、画像処理部１２がＡ／Ｄ変換してカラーイメージデータを生成し、セパレーション部１３に送る。これにより、セパレーション部１３がカラーイメージデータを取得する（ステップＳ１１）。
【００２６】
セパレーション部１３は、取得したカラーイメージデータについて、ピクセル単位での色判定を行って、カラー原稿画像に含まれる色毎に分離した複数の画像レイヤーを生成する（ステップＳ１２）。これについては、図４を参照して後述する。次に、セパレーション部１３は、生成した各色の画像レイヤーについて、各々、注目ピクセルが該当色の場合には「１」に変換するとともに当該色以外の色の場合には「０」に変換する２値化処理を行って２値画像を作成し、レイアウト認識部１４に送る（ステップＳ１３）。即ち、２値画像からなる各色の画像レイヤーが送られる。
【００２７】
この後、レイアウト認識部１４が、２値画像からなる各色の画像レイヤーについて、各々、周知のレイアウト認識処理を行い、その結果及び２値画像からなる各色の画像レイヤーを文字認識部１５に送る（ステップＳ１４）。例えば、黒ピクセルを原稿の主走査方向や副走査方向に集積したヒストグラム、又は、黒ピクセルが連続する断片画像を抽出してラベルを付加するラベリングにより、画像が描かれている領域を特定するレイアウト認識処理を行う。
【００２８】
次に、文字認識部１５が、２値画像からなる各色の画像レイヤーについて、レイアウト認識処理の結果に基づいて、各々、周知の文字認識処理を行い（ステップＳ１５）、その結果である画像及び文字情報（画像及び文字及びその位置を示す認識データ）を出力する（ステップＳ１６）。即ち、認識された画像及び文字のデータを例えば外部装置に出力するか、又は、画面表示又は印刷出力する。
【００２９】
図４は、画像認識処理フローであり、図３のステップＳ１２及びＳ１３においてセパレーション部１３の行なう画像レイヤーの分離処理及び２値化処理について示す。
【００３０】
セパレーション部１３は、カラーイメージデータを受け取ると、各々のピクセルについて、そのカラーイメージデータをＲＧＢ色空間からＬ^＊ａ^＊ｂ^＊（均等）色空間へ座標変換する（ステップＳ２１）。即ち、各々のピクセルについてのＲＧＢの２４ｂｉｔのデータ（ＲＧＢ色空間の座標）を、ピクセル単位で、例えば、明度Ｌ^＊（０〜１００階調）、色相ａ^＊（−１２７〜＋１２７階調）、彩度ｂ^＊（−１２７〜＋１２７階調）で表すＬ^＊ａ^＊ｂ^＊色空間の座標に変換する。更に、明度Ｌ^＊、色相ａ^＊及び彩度ｂ^＊を、各々、Ｘ１、Ｘ２及びＸ３階調に単純化する。例えば、Ｘ１＝１０、Ｘ２＝１０、Ｘ３＝１０であるとする。この場合、ピクセルは、以下の処理により、１０００通りに分類（クラスタリング）されることになる。これにより、前述の階調のままでクラスタリングをおこなうよりも、処理を簡単なものにすることができる。
【００３１】
この結果に基づいて、セパレーション部１３は、Ｌ^＊ａ^＊ｂ^＊色空間上における各々のピクセルをクラスタリングし、この結果に従って、Ｋ平均クラスタリンに用いる当該カラーイメージデータにおける色の数Ｋ（＝ｎ、ｎは自然数）を決定する（ステップＳ２２）。即ち、Ｌ^＊ａ^＊ｂ^＊色空間上における各々のピクセルについてのユークリッド距離を求め、当該距離により各ピクセルを色分けする単純クラスタリングを行い、全てのピクセルをいずれかの色（のクラスタ又はパレット）に分類する。これによって、当該カラーイメージデータを色毎の画像レイヤー、即ち、複数のイメージデータに分離する。分離された当該カラーイメージデータにおける色数Ｋは、クラスタの数に一致し、画像レイヤーの数Ｋに一致する。
【００３２】
このとき、セパレーション部１３は、具体的には、以下のように処理を行なう。即ち、ピクセルを分類するパレットとして、一般的に多いと考えられる白（平均色：Ｌ＝０、ａ^＊＝０、ｂ^＊＝０）のパレットと、黒（平均色：Ｌ＝１００、ａ^＊＝０、ｂ^＊＝０）のパレットとを、ステップＳ２２の初期処理により予め用意する。そして、注目ピクセルについて、その時点で存在するパレットの各々（の色）とのユークリッド距離を求める。最も近いパレットとのユークリッド距離が予め設定されている範囲内の色差（距離）である場合、当該最も近いパレットにその注目ピクセルを分類する。一方、最も近いパレットとのユークリッド距離が当該設定範囲を超える色差である場合、当該色の新たなパレットを作成し、これに当該注目ピクセルを分類する。この時点での当該新たなパレットの色（平均色）は、当該注目ピクセルの色に等しい。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、いずれかの色のパレット（クラスタ）に分類される。この結果、パレット数が当該カラーイメージデータに存在する色数Ｋとなり、カラーイメージデータを分類すべき色数がＫ色に決定される。
【００３３】
なお、この決定された色数Ｋが多い場合、色数についての閾値を設定するようにしてもよい。即ち、色数Ｋが当該閾値を超える場合、例えば所定の個数以下のパレットを統合又は廃棄して、その数を減らすようにしてもよい。又は、分類されたピクセルの数が所定の個数より多いパレットのみを残して使用するようにしてもよい。この場合、残されるパレットからのユークリッド距離が所定の範囲以下のパレットを、当該残されるパレットに統合し、それ以外のパレットは廃棄するようにしてもよい。
【００３４】
また、ステップＳ２２の初期処理において、生成したい色（の画像レイヤー）の全てのパレットを用意し、新たなパレットを作成することなく、用意したパレットに分離できないピクセルは無視（廃棄）するか、又は、白のパレットに分類するようにしてもよい。この時、前記設定範囲は多少大きくすることが望ましい。用意するパレットとしては、例えば赤、緑、青、黒、白が望ましい。即ち、色の３原色、通常の文字の色である黒、原稿の背景である白である。
【００３５】
次に、セパレーション部１３は、Ｋ個のパレットの各々について、その時点での構成要素であるピクセルに従って、パレットの平均色を更新する（ステップＳ２３）。即ち、当該パレットにその時点で分類されているピクセルの色を平均することにより、当該パレットの特性（又は、Ｌ^＊ａ^＊ｂ^＊色空間における中心点）を表す色（平均色）を求める。平均値は、各ピクセルのＬ、ａ^＊、ｂ^＊の各々の値の平均を求めることにより算出する。
【００３６】
次に、セパレーション部１３は、Ｋ色（Ｋ個）のパレットについて、周知のＫ平均クラスタリングを行う（ステップＳ２４）。即ち、注目ピクセルについて、Ｋ個のパレットの各々の平均色（ステップＳ２３において更新した値）とのユークリッド距離を求め、最も近いパレットにその注目ピクセルを分類し直す。従って、注目ピクセルは、ステップＳ２２において分類された（元の）パレットに分類される場合と、これ以外のパレットに分類（以下、移動と言う）される場合とがある。以上の処理を全てのピクセルについて実行することにより、当該カラーイメージデータの全てのピクセルが、Ｋ個のパレットに分類し直される。
【００３７】
そこで、セパレーション部１３は、パレットを移動したピクセルの数を求め、当該ピクセル数が予め設定した所定の値よりも多いか否かを調べる（ステップＳ２５）。ピクセル数が所定値よりも多い場合、クラスタリングが安定していない（収束していない）ので、ステップＳ２３以下を繰り返す。これにより、移動するピクセル数を所定値以下として収束させる。
【００３８】
ピクセル数が所定値以下の場合、クラスタリングが安定した（収束した）ので、セパレーション部１３は、Ｋ個のパレットを用いて、当該カラーイメージデータの２値化処理を行って各色毎の（Ｋ個の）２値画像即ち画像レイヤーを作成する（ステップＳ２６）。即ち、当該カラーイメージデータにおいて、ある１個のパレットに分類されたピクセルを黒又は「１」に変換し、当該色以外のピクセルを白又は「０」に変換することにより、当該パレット又は色についての２値画像を作成する。即ち、当該色についての（１個の）画像レイヤーを得る。そして、これをＫ個のパレットについて繰り返すことにより、Ｋ色についての（Ｋ個の）画像レイヤーを得る。従って、画像レイヤーの各々は、当該対応する色のピクセルを黒で表した２値画像である。
【００３９】
例えば、図５（Ａ）に示すカラー原稿１００があるとする。カラー原稿１００において、白色の地色（背景色）に、文字Ｒは赤、文字Ｇは緑、文字Ｂは青、文字Ｋは黒で印刷されている。
【００４０】
この場合、初期設定で用意される白及び黒のパレットに加えて、赤、緑、青のパレットが生成され、Ｋ＝５とされる（ステップＳ２２）。従って、Ｋ平均クラスタリングが収束したら（ステップＳ２５）、白、黒、赤、緑、青の５個のパレットを用いて当該５色の画像レイヤーが生成される（ステップＳ２６）。即ち、赤の画像レイヤー１０１においては、図５（Ｂ）に示すように、赤で印刷されていた文字Ｒが（黒で）表示される。同様に、緑、青及び黒の画像レイヤー１０１においては、各々、図６（Ａ）、図６（Ｂ）及び図７（Ａ）に示すように、緑、青及び黒で印刷されていた文字Ｇ、Ｂ及びＫが（黒で）表示される。白の画像レイヤー１０１においては、図７（Ｂ）に示すように、原稿１００の地色の部分（網かけで示す）が（黒で）表示され、文字Ｒ、Ｇ、Ｂ及びＫが白抜き（図では黒で示す）で表示される。
【００４１】
これにより、図５（Ａ）のカラーイメージデータが、図５（Ｂ）〜図７（Ｂ）の各色のイメージデータに分離された画像レイヤーとされる。そこで、各々の画像レイヤーについて、レイアウト認識処理及び文字認識処理を実行する。従って、図５（Ｂ）の画像レイヤーからは、文字Ｒが文字認識により抽出される。同様に、図６（Ａ）、図６（Ｂ）及び図７（Ａ）の画像レイヤーからは、各々、文字Ｇ、Ｂ及びＫが文字認識により抽出される。一方、図７（Ｂ）の画像レイヤーからは、白抜きの文字Ｒ、Ｇ、Ｂ及びＫが文字認識により抽出される。これにより、カラーのカタログ等のように、黒字に白抜き文字や赤色の文字が描かれていたり、種々の背景色に種々の色の文字が描かれていたりしても、色が異なりさえすれば、当該色の文字を正確に抽出することができる。また、カラーのポスターのように、種々の色の種々の模様が描かれていても、これをレイアウト認識により抽出することができる。このように、例えば、図５（Ｂ）の文字と図６（Ａ）の文字とが混同されて黒または白に変換され、文字認識できなくなることはなく、カラー原稿１００でも正確にレイアウト認識及び文字認識することができる。
【００４２】
なお、従来の文字認識処理によれば、１色のみ、例えば黒で印刷された文字Ｋのみが抽出され文字認識処理の対象とされて文字Ｋが出力され、一方、他の色の文字Ｒ、Ｇ、Ｂは抽出されず、認識されない。
【００４３】
以上、本発明をその実施の態様に従って説明したが、本発明はその主旨に従って、種々の変形が可能である。
【００４４】
例えば、以上の説明においては、図２（Ａ）に示すように、本発明の画像処理装置をスキャナ装置２０内に設ける場合について説明したが、本発明の画像処理装置の構成はこれに限られない。即ち、例えば、図２（Ｂ）に示すように、画像データ読取装置１６のみをスキャナ装置２０に設け、画像データ認識装置１７をパーソナルコンピュータ３０（又は、プリンタ装置やファクシミリ装置等）に設けてもよい。この場合、画像データ読取装置１６から送出されたカラーイメージデータは、ネットワーク４０を介して、パーソナルコンピュータ３０における画像データ認識装置１７が受信する。
【００４５】
【発明の効果】
以上説明したように、本発明によれば、画像認識方法において、カラー画像を２値画像とすることなく、カラーイメージデータを各色毎に分離した複数のイメージデータ毎に認識処理を行なう。従って、例えばカラー原稿において各色毎に異なる文字を表して、原稿がカラーであることを生かすことができる。また、カラー原稿において文字の色とその背景色とが異なりさえすれば、これらが共に黒に変換され文字が失われることを防止することができ、レイアウト認識ができなくなることを防止して、円滑に文字認識処理に移行し、文字認識を行うことができる。これにより、種々の色を含むカラー原稿から種々の色の画像を正確に認識することができる。
【図面の簡単な説明】
【図１】画像認識装置構成図である。
【図２】画像認識装置構成図である。
【図３】画像認識処理フローである。
【図４】画像認識処理フローである。
【図５】画像認識処理説明図である。
【図６】画像認識処理説明図である。
【図７】画像認識処理説明図である。
【符号の説明】
１１　　　　画像読取部
１２　　　　画像処理部
１３　　　　セパレーション部
１４　　　　レイアウト認識部
１５　　文字認識部

Claims

カラーイメージデータの画像認識を行う画像認識装置における画像認識方法であって、
カラーイメージデータを、これに含まれる色毎に複数のイメージデータに分離処理し、
前記複数のイメージデータ毎に認識処理を行なう
ことを特徴とする画像認識方法。
前記分離処理において、前記カラーイメージデータを、ピクセル単位でＬ^＊ａ^＊ｂ^＊色空間の座標に変換してこれに基づいて各ピクセルの色を判定することにより、前記複数のイメージデータに分離する
ことを特徴とする請求項１に記載の画像認識方法。
前記カラーイメージデータのピクセルの各々について単純クラスタリングにより色数Ｋを求め、当該色数ＫについてのＫ平均クラスタリングにより前記ピクセルの各々をいずれかの色に分離する
ことを特徴とする請求項２に記載の画像認識方法。
前記分離処理において、更に、分離した前記複数のイメージデータを、各々、当該複数のイメージデータ毎に該当色のピクセルを「黒」とし当該色以外の色のピクセルを「白」とすることにより、２値画像とする
ことを特徴とする請求項１に記載の画像認識方法。
前記認識処理において、前記複数のイメージデータ毎にレイアウト認識及びその後の文字認識を行う
ことを特徴とする請求項１に記載の画像認識方法。