JP2004094644A

JP2004094644A - 画像処理装置、画像処理方法、記憶媒体及びプログラム

Info

Publication number: JP2004094644A
Application number: JP2002255491A
Authority: JP
Inventors: Masakazu Yagi; 八木　雅和; Sunao Shibata; 柴田　直
Original assignee: Rohm Co Ltd
Current assignee: Rohm Co Ltd
Priority date: 2002-08-30
Filing date: 2002-08-30
Publication date: 2004-03-25
Also published as: EP1394726A3; US20040197023A1; EP1394726A2

Abstract

【課題】類似する画像を画像処理した際には、類似した画像データとして認識することを可能とし、比較的複雑な画像でも正確に認識する。
【解決手段】入力画像内の所定の位置に対応して定義された領域の画像データが取り出され、この画像データをベクトル表記するベクトル生成部１と、所定のクラスに属する参照パターンを少なくとも１つ含むパターングループを複数有する記憶部２と、ベクトル化された画像データと各参照パターンとを照合し、各参照パターン毎についての画像データとの類似度を評価する類似度演算部３と、類似度の各評価値に所定の演算を施して少なくとも１つの評価値を決定するＷＴＡ回路４とを含み、決定された評価値に対応した参照パターンのクラスを特定し、当該参照パターンの評価値及び特定されたクラスを所定の位置に対応させる。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、画像処理方法、画像処理方法を言己憶した記憶媒体及び画像処理装置に関し、特に画像の特徴を抽出する画像処理に用いて好適なものである。
【０００２】
【従来の技術】
ＣＣＤイメージセンサ等から認識した画像の情報を記録する方法として、例えば図３７に示す方法がある。図３７は漢字の「三」という文字を２次元のＣＣＤイメージセンサによって光電変換し、ＣＣＤイメージセンサの上端から下端までのそれぞれの画素列毎の輝度情報を１列に並べて１次元データとして認識したものである。
【０００３】
【発明が解決しようとする課題】
しかしながら、図３７に示す方法で漢字の「三」を１次元データ化した場合、人間の眼には同じ「三」と認識される文字であっても、１次元化されたデータは図３７（ａ）〜（ｃ）に示す各場合において大きく異なる
【０００４】
すなわち、図３７に示す方法で漢字の・三・を１次元データ化すると、文字の位置が図３７（ｂ）のように上側へずれているだけで、図３７（ａ）と全く異なるデータが認識されることになる。また、図３７（ｃ）に示すように線が曲がっているだけで、線が真っ直ぐな図３７（ａ）に示す「三」と全く異なるデータが認識される。
【０００５】
このように、公知の方法で画像を認識した場合、人間の眼には同じ画像として認識される画像であっても、画像の位置、画像の大きさ等の要因により、全く異なる画像データが認識されてしまう。
【０００６】
本発明は、このような問題を解決するために成されたものであり、類似する画像を画像処理した際には、類似した画像データとして認識することを可能とし、比較的複雑な画像でも正確に認識することができる画像処理装置方法及び画像処理方法、プログラム及び記録媒体を提供することを目的とする。
【０００７】
【課題を解決するための手段】
本発明の画像処理装置は、入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出する画像処理装置であって、所定のクラスに属する参照パターンを少なくとも１つ含むパターングループを複数有する第１の手段と、前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出し、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２の手段と、前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３の手段とを含む。
【０００８】
本発明の画像処理装置の一態様では、前記入力画像の複数の前記所定の位置毎に前記評価値及び前記クラスを特定し、各々を複数の前記所定の位置に対応させて分布図を作成する。
【０００９】
本発明の画像処理装置の一態様では、前記分布図から１次元のデータ列を作成する第４の手段を含み、前記第４の手段は、同一の前記クラスに属する前記所定の位置の数を所定の方向に加算する処理を行う。
【００１０】
本発明の画像処理装置の一態様では、前記分布図から１次元のデータ列を作成する第５の手段を含み、前記第５の手段は、同一の前記クラスに属する前記所定の位置に対応する前記評価値を所定の方向に加算する処理を行う。
【００１１】
本発明の画像処理装置の一態様では、複数の前記パターングループが少なくとも２つのカテゴリーに分類されており、第１のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置における前記評価値及び前記クラスの特定に供され、第２のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置に対応して選択された場合、当該位置に対して前記参照パターンが存在しないという意味付けが付与されるものである。
【００１２】
本発明の画像処理装置の一態様では、前記入力画像内の所定の位置に対応して定義された領域の前記画像データをベクトル表記する第６の手段を含み、前記第２の手段は、前記各参照パターンをベクトルとして保持しており、前記画像データのベクトルと照合して前記類似度を評価する。
【００１３】
本発明の画像処理方法は、入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出する画像処理方法であって、前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出す第１のステップと、所定のクラスに属する参照パターンを少なくとも１つ含む複数のパターングループを記憶しておき、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２のステップと、前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３のステップとを含む。
【００１４】
本発明の画像処理方法の一態様では、前記入力画像の複数の前記所定の位置毎に前記評価値及び前記クラスを特定し、各々を複数の前記所定の位置に対応させて分布図を作成する。
【００１５】
本発明の画像処理方法の一態様では、前記分布図から１次元のデータ列を作成する第４のステップを含み、同一の前記クラスに属する前記所定の位置の数を所定の方向に加算する処理を行う。
【００１６】
本発明の画像処理方法の一態様では、前記分布図から１次元のデータ列を作成する第５のステップを含み、同一の前記クラスに属する前記所定の位置に対応する前記評価値を所定の方向に加算する処理を行う。
【００１７】
本発明の画像処理方法の一態様では、複数の前記パターングループが少なくとも２つのカテゴリーに分類されており、第１のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置における前記評価値及び前記クラスの特定に供され、第２のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置に対応して選択された場合、当該位置に対して前記参照パターンが存在しないという意味付けが付与されるものである。
【００１８】
本発明の画像処理方法の一態様では、前記入力画像内の所定の位置に対応して定義された領域の前記画像データをベクトル表記する第６のステップを含み、前記第２のステップでは、前記各参照パターンがベクトルとして保持されており、前記画像データのベクトルと照合して前記類似度を評価する。
【００１９】
本発明のプログラムは、入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出するに際して、前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出す第１のステップと、所定のクラスに属する参照パターンを少なくとも１つ含む複数のパターングループを記憶しておき、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２のステップと、前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３のステップとをコンピュータに実行させるためのものである。
【００２０】
本発明の記録媒体は、前記プログラムを記録したことを特徴とするコンピュータ読み取り可能なものである。
【００２１】
【発明の実施の形態】
以下、本発明を適用した好適な諸実施形態について図面を参照しながら詳細に説明する。
【００２２】
（第１の実施形態）
図１は、第１の実施形態の画像処理装置の概略構成を示す模式図である。
この画像処理装置は、図１（ａ）に示すように、入力画像内の所定の位置に対応して定義された領域（ｘ，ｙ）の画像データが取り出され、この画像データをベクトル表記するベクトル生成部１と、所定のクラスに属する参照パターンを少なくとも１つ含むパターングループを複数有する記憶部２と、ベクトル化された画像データと各パターングループに含まれる各参照パターンとを照合し、各参照パターン毎についての画像データとの類似度を評価する類似度演算部３と、類似度の各評価値に所定の演算を施して少なくとも１つの評価値を決定するウィナー・テーク・オール（Ｗｉｎｎｅｒ　Ｔａｋｅ　Ａｌｌ）回路４とを含む。但し、ここで必ずしもウィナー・テーク・オール回路を利用するとは限らない。また、必ずしも１つの評価値だけを取り出すとは限らず、場合によっては複数個決定することもあり得る。
【００２３】
この画像処理装置は、決定された評価値に対応した参照パターンのクラスを特定し、当該参照パターンの評価値及び特定されたクラスを所定の位置に対応させる（例えば、ｆ（ｘ，ｙ）＝クラス９）ものであり、入力画像の複数の所定の位置毎に評価値及びクラスを特定し、各々を複数の所定の位置に対応させて２次元分布図を作成し、更には後述するように当該分布図から１次元のデータ列を作成する変換部５を有する。
【００２４】
記憶部２は、パターングループとして例えば１０個のテンプレートグループを持つ。但し、テンプレート数は１０個に限定されず、１００でも１０００でも良い。また、数多くのサンプル群に対して学習アルゴリズムを適用し、テンプレート数を減少させるということも可能である。それぞれのテンプレートグループは、後述するＰＡＰ（Ｐｒｉｎｃｉｐａｌ　Ａｘｉｓ　Ｐｒｏｊｅｃｔｉｏｎ）手法（特許出願［１］参照）によって生成されたベクトル表現を１つずつ持つ。本実施形態では、図２に示すようなＴｉｍｅｓ　Ｎｅｗ　Ｒｏｍａｎフォント７２ｐｔの０〜９の数字画像からＰＡＰ手法によってそれぞれベクトル表現に変換したものを、別々の１０個のテンプレートグループにその数字のパターンクラスという意味付けと共に保持させた。ここで、テンプレートが保持するベクトル表現は必ずしもこのような文字フォントから生成されたものであるとは限らず、また、ベクトル表現への変換手法はＰＡＰ手法である必要はない。また、１つのパターングループが持つベクトル表現（参照パターン）の数はここでは１つの場合を例示するが、必ずしも１つであるとは限らない。例えば、図１（ｂ）に示すように、相異なる複数（ここでは６つ）の参照パターンを用いても良い。
【００２５】
この画像処理装置では、先ず、与えられた入力画像における（ｘ，ｙ）を中心とした６４×６４の部分画像を切り出す（ステップ１）。ここで、部分画像における（ｘ，ｙ）の位置は必ずしも中心であるとは限らない。また、切り出す大きさも必ずしも６４×６４であるとは限らない。
【００２６】
そして、その部分画像をベクトル生成部２に入力し　、ＰＡＰ手法（論文［１−４］参照）によりベクトル表現に変換する（ステップ２）。ここで、２次元の部分画像からベクトル表現に変換する際に必ずしもＰＡＰ手法を利用するとは限らない（２次元画像からのベクトル表現生成手法）。
【００２７】
［特許出願［１］　］特願平１０−３２６２５３号
［１］　Ｍａｓａｋａｚｕ　Ｙａｇｉ，　Ｍａｓａｙｏｓｈｉ　Ａｄａｃｈｉ，　ａｎｄ　Ｔａｄａｓｈｉ　Ｓｈｉｂａｔａ，　”Ａ　Ｈａｒｄｗａｒｅ−Ｆｒｉｅｎｄｌｙ　Ｓｏｆｔ−Ｃｏｍｐｕｔｉｎｇ　Ａｌｇｏｒｉｔｈｍ　ｆｏｒ　Ｉｍａｇｅ　Ｒｅｃｏｇｎｉｔｉｏｎ，”　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　１０^ｔｈ　Ｅｕｒｏｐｅａｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｃｏｎｆｅｒｅｎｃｅ　（ＥＵＳＩＰＣＯ　２０００），　ｐｐ．　７２９−７３２，　Ｔａｍｐｅｒｅ，　Ｆｉｎｌａｎｄ，　Ｓｅｐｔ．　４−８，　２０００．
［２］　Ｍａｓａｋａｚｕ　Ｙａｇｉ　ａｎｄ　Ｔａｄａｓｈｉ　Ｓｈｉｂａｔａ，　”Ａ　Ｈｕｍａｎ−Ｐｅｒｃｅｐｔｉｏｎ−ｌｉｋｅ　Ｉｍａｇｅ　Ｒｅｃｏｇｎｉｔｉｏｎ　Ｓｙｓｔｅｍ　ｂａｓｅｄ　ｏｎ　ＰＡＰ　Ｖｅｃｔｏｒ　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ　ｗｉｔｈ　Ｍｕｌｔｉ　Ｒｅｓｏｌｕｔｉｏｎ　Ｃｏｎｃｅｐｔ，”　ｉｎ　ｔｈｅ　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　２００２　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏｕｓｔｉｃｓ，　Ｓｐｅｅｃｈ，　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　（ＩＣＡＳＳＰ　２００２），　Ｖｏｌ．　Ｉ，　ｐｐ．１０４１−１０４８，　Ｆｌｏｒｉｄａ，　Ｍａｙ　１３−１７，　２００２．
［３］　Ｍａｓａｋａｚｕ　Ｙａｇｉ，　Ｔａｄａｓｈｉ　Ｓｈｉｂａｔａ　ａｎｄ　Ｋｅｎｊｉ　Ｔａｋａｄａ，　”Ｏｐｔｉｍｉｚｉｎｇ　Ｆｅａｔｕｒｅ−Ｖｅｃｔｏｒ　Ｅｘｔｒａｃｔｉｏｎ　Ａｌｇｏｒｉｔｈｍ　ｆｒｏｍ　Ｇｒａｙｓｃａｌｅ　Ｉｍａｇｅｓ　ｆｏｒ　Ｒｏｂｕｓｔ　Ｍｅｄｉｃａｌ　Ｒａｄｉｏｇｒａｐｈ　Ａｎａｌｙｓｉｓ，”　ｉｎ　ｐｒｅｓｓ　ｉｎ　Ｔｈｅ　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　Ｆｏｕｒｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｍｕｌｔｉｍｅｄｉａ　ａｎｄ　Ｉｍａｇｅ　Ｐｒｏｃｅｓｓｉｎｇ　（ＩＦＭＩＰ　２００２），　Ｏｒｌａｎｄ，　Ｊｕｎｅ
９−１３，　２００２．
［４］Ｍａｓａｋａｚｕ　ＹＡＧＩ，　Ｔａｄａｓｈｉ　ＳＨＩＢＡＴＡ，　ａｎｄ　Ｋｅｎｊｉ　ＴＡＫＡＤＡ，　”Ｈｕｍａｎ−Ｐｅｒｃｅｐｔｉｏｎ−Ｌｉｋｅ　Ｉｍａｇｅ　Ｒｅｃｏｇｎｉｔｉｏｎ　Ｓｙｓｔｅｍ　Ｂａｓｅｄ　ｏｎ　ｔｈｅ　Ａｓｓｏｃｉａｔｉｖｅ　Ｐｒｏｃｅｓｓｏｒ　Ａｒｃｈｉｔｅｃｔｕｒｅ，”　ｔｏ　ｂｅ　ｐｕｂｌｉｓｈｅｄ　ｉｎ　ｔｈｅ　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ＸＩ　Ｅｕｒｏｐｅａｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｃｏｎｆｅｒｅｎｃｅ，　Ｓｅｐ．　３−６，　２００２　Ｔｏｕｌｏｕｓｅ，　Ｆｒａｎｃｅ　（２００２）．
【００２８】
入力画像から切り出された部分画像から生成されたベクトル表現と、システムに記憶された全てのパターングループ内に存在する全てのベクトル表現とされた参照パターンとの類似度の評価値を、類似度演算部３によりマンハッタン距離演算を用いて生成する（ステップ３）。ここで、類似度の評価値の演算は必ずしも全てのパターングループに対して行われるとは限らない。例えば、類似度を演算するパターングループがその一部であることもありうる。また、類似度の演算はマンハッタン距離演算を必ず利用するとは限らない。ユークリッド距離演算やヒストグラムインターセクション、カルバック距離などを利用することもあり得る（ベクトル間の距離演算手法）。
【００２９】
そして、上記のベクトル間の距離演算手法で演算された類似度の評価値の中で最も類似度が高いパターングループを決定し、その類似度の評価値を持つパターングループを同定する（ステップ４）。そして、２次元上の分布図において位置情報（ｘ，ｙ）にそのパターン情報を保持する。ここで、そのパターン情報と同時に類似度情報もシステムは保持する。ここで、決定されるパターングループは１つとしたが必ず１つとは限らない。また決定する方法は、類似度評価値の中で最も類似度が高いパターングループを選ぶとしたが、必ずしもこの手法に従うとは限らない。例えば、テンプレートグループ全体の評価値を用いてグループとして評価をする場合もあれば、それぞれのテンプレートグループの上位複数個の評価値の平均を利用する場合もある。また、全体の上位複数個に入っているパターンクラスの数が多いものを選ぶという場合もあり得る。
【００３０】
図３に示すＥｕｃｌｉｄフォント７２ｐｔのうち、数字”０”を含む１５０×１５０ｐｅｌ画像に対して上記方法をした例を図４に示す。ここではこの画像サイズは必ずしも１５０×１５０ｐｅｌでなくとも良い。加えて、数字”４”を含む同様の画像に対して上記方法を適用した例を図５に示す。このような表現を用いることにより、対象となる文字をさまざまな構成要素に分解して情報を抽出することを実現した。
【００３１】
−ベクトル生成部の構成−
ここで、図１におけるベクトル生成部１のＶＬＳＩ技術における実装を行った（論文［５］参照）。その回路構成図を図６に示す。
ＰＡＰ（Ｐｒｉｎｃｉｐａｌ　Ａｘｉｓ　Ｐｒｏｊｅｃｔｉｏｎ）　変換ＶＬＳＩは大きく二つのブロックに分かれている。まず、入力される２次元画像データからエッジ特徴を抽出し特徴表現フラグを生成するエッジ特徴抽出器１１が設けられ、その特徴表現フラグを入力とするベクトル生成器１２が設けられている。このような構成でＰＡＰ変換ＶＬＳＩを構成した。チップ写真を図７に示す。
【００３２】
この回路の測定結果を図８に示す。
図８に示したように、６４×６４ピクセルの画像から６４次元のベクトル列に変換するのに、ワークステーションであれば数分かかるが、３４０ｍｓｅｃ．で演算する機能を実現した。
【００３３】
［５］　Ｍａｓａｋａｚｕ　Ｙａｇｉ　ａｎｄ　Ｔａｄａｓｈｉ　Ｓｈｉｂａｔａ，　”Ａｎ　Ａｓｓｏｃｉａｔｉｖｅ−Ｐｒｏｃｅｓｓｏｒ−Ｂａｓｅｄ　Ｍｉｘｅｄ　Ｓｉｇｎａｌ　Ｓｙｓｔｅｍ　ｆｏｒ　Ｒｏｂｕｓｔ　Ｉｍａｇｅ　Ｒｅｃｏｇｎｉｔｉｏｎ，”　ｉｎ　ｔｈｅ　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　２００２　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｃｉｒｃｕｉｔｓ　ａｎｄ　Ｓｙｓｔｅｍｓ　（ＩＳＣＡＳ　２００２），　ｐｐ．　Ｖ−１３７−Ｖ−１４０，　Ａｒｉｚｏｎａ，　Ｍａｙ　２６−２９，　２００２．
【００３４】
−記憶部及び類似度評価部の構成−
ベクトルの１要素に対してデータを保持し類似度演算を行う基本回路を図９に示す（特許出願［２］及び論文［６−８］参照）。
この基本回路は、図９に示すように、入力電圧Ｖ_ＧＧを変化させることによって消費電力を減少させる機能と、入力電圧Ａ，Ｂ，Ｃを変化させることによって柔軟に類似度演算器の演算評価方法を変化させる機能を持つ。この特性を図１０に示す。Ｖ_ＧＧを低下させることによってピークの電流値が下がっており、また、入力電圧Ａ，Ｂ，Ｃを変化させることで、さまざまな鋭さを持った評価関数が実現されていることが判る。
【００３５】
この基本回路では、最初のリセット動作の時に記憶させるテンプレートベクトルの１要素を電圧で入力する。そして、その後に類似度評価を行うベクトルの１要素を電圧で入力する。類似度情報は電流に変換され、Ｉ_ＯＵＴから出力される。類似度が高いほど多くの電流が出力される。このＩ_ＯＵＴをテンプレート情報と入力されたベクトル情報の類似度評価値として利用する。
【００３６】
この基本回路は図１１のような機能を実現している。
先ず、最初に知識の断片を電圧として記憶させ、その後電圧として入力されたベクトルの１要素との類似度を電流値として出力する。類似度が高ければ高いほど、多くの電流が流れる。
【００３７】
この基本回路の機能はベクトルの１要素の類似度演算のみであるが、図１２のように出力電流の合計をとることで、先に記憶させた知識であるテンプレートベクトルＭと入力ベクトルＸの類似度を出力する回路を容易に実現できる。例えば、ＰＡＰ手法によって生成されたベクトルであれば、ベクトルの次元数は６４次元であるので６４個の出力を繋げば良い。但し、この数は必ずしも６４個である必要はなく、利用するベクトルの次元数に応じて数は変化する。
【００３８】
記憶及び類似度演算機能を持つ機能ブロックとしては、図１３のようにして実現する。
図１２の回路を並列に並べ、入力ベクトルＸを同時に全ての回路に入力する。このような構成にすることで、入力ベクトルと複数のパターングループ群内のテンプレートベクトルの全ての類似度を同時に高速に演算を行うことが可能である。
【００３９】
このような処理を実現した例を図１４に示す。
このシステムではベクトルの次元数は４とした。図１４の上部にこの回路に記憶させたパターンを示す。下側には提示されたパターン群を示している。グラフは、記憶させたパターンと提示されたパターンの類似度を示す。青線は理論値、赤線は測定値を示す。全く同じパターン７が入力された場合大きい電流が流れ高い類似度を示している。また、パターン７と類似したパターン１を入力した場合も非常に高い類似度を示している。しかし、類似していないパターン６に対しては低い類似度を示している。また、消費電力に関しても、類似度が高く最も電流が流れる場合でも１６０μＡ程度であり、非常に低い消費電力で実現されている。ここでは、次元数が４つの例に関して示したが、必ずしも４つとは限らない。ＰＡＰによって生成されたベクトルであれば６４になるし、それ以外のベクトル生成手法を利用した場合はそのベクトルの次元数に応じて変化するものである。
【００４０】
［特許出願［２］］特願２０００−３２６１５８号
［６］　Ｔ．　Ｙａｍａｓａｋｉ　ａｎｄ　Ｔ．　Ｓｈｉｂａｔａ，　”Ａｎ　Ａｎａｌｏｇ　Ｓｉｍｉｌａｒｉｔｙ　Ｅｖａｌｕａｔｉｏｎ　ＣｉｒｃｕｉｔＦｅａｔｕｒｉｎｇ　Ｖａｒｉａｂｌｅ　Ｆｕｎｃｔｉｏｎａｌ　Ｆｏｒｍｓ，”　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　Ｔｈｅ　２００１　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｃｉｒｃｕｉｔｓ　ａｎｄ　Ｓｙｓｔｅｍｓ　（ＩＳＣＡＳ　２００１），　ｐｐ．　ＩＩＩ−５６１−５６４，　Ｓｙｄｎｅｙ，　Ａｕｓｔｒａｌｉａ，　Ｍａｙ．　６−９，　２００１．［７］　Ｔｏｓｈｉｈｉｋｏ　Ｙａｍａｓａｋｉ，　Ｋｅｎ　Ｙａｍａｍｏｔｏ，　ａｎｄ　Ｔａｄａｓｈｉ　Ｓｈｉｂａｔａ，　”Ａｎａｌｏｇ　Ｐａｔｔｅｒｎ　Ｃｌａｓｓｉｆｉｅｒ　ｗｉｔｈ　Ｆｌｅｘｉｂｌｅ　Ｍａｔｃｈｉｎｇ　Ｃｉｒｃｕｉｔｒｙ　Ｂａｓｅｄ　ｏｎ　Ｐｒｉｎｃｉｐａｌ−Ａｘｉｓ−Ｐｒｏｊｅｃｔｉｏｎ　Ｖｅｃｔｏｒ　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ，”　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２７^ｔｈ　Ｅｕｒｏｐｅａｎ　Ｓｏｌｉｄ−Ｓｔａｔｅ　Ｃｉｒｃｕｉｔｓ　Ｃｏｎｆｅｒｅｎｃｅ　（ＥＳＳＣＩＲＣ　２００１），　Ｅｄ．　ｂｙ　Ｆ．　Ｄｉｅｌａｃｈｅｒ　ａｎｄ　Ｈ．　Ｇｒｕｎｂａｃｈｅｒ，　ｐｐ．　２１２−２１５　（Ｆｒｏｎｔｉｅｒ　Ｇｒｏｕｐ），　Ｖｉｌｌａｃｈ，　Ａｕｓｔｒｉａ，　Ｓｅｐｔｅｍｂｅｒ　１８−２０，　２００１．
［８］　Ｔ．　Ｙａｍａｓａｋｉ　ａｎｄ　Ｔ．　Ｓｈｉｂａｔａ，　”Ａｎａｌｏｇ　Ｓｏｆｔ−Ｐａｔｔｅｒｎ−Ｍａｔｃｈｉｎｇ　ＣｌａｓｓｉｆｉｅｒＵｓｉｎｇ　Ｆｌｏａｔｉｎｇ−Ｇａｔｅ　ＭＯＳ　Ｔｅｃｈｎｏｌｏｇｙ，”　Ｎｅｕｒａｌ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｐｒｏｃｅｓｓｉｎｇ　Ｓｙｓｔｅｍｓ　１４，　ｉｎ　ｐｒｅｓｓ．
【００４１】
（第２の実施形態）
図１５は、第２の実施形態の画像処理装置の概略構成を示す模式図である。
この画像処理装置は、第１の実施形態の画像処理装置とほぼ同様の構成を有するが、記憶部２におけるパターンクラスが異なる点で相違する。具体的には、以下のように２つのカテゴリーを持つパターングループ群を保持している。第１のカテゴリーのパターングループは第１の実施形態で記憶されたパターングループと同じものである。第２のカテゴリーのパターングループは、そこにパターンが存在しないという意味付けを持つパターングループである。本実施例では何もＩｎｔｅｎｓｉｔｙを持たないＮｕｌｌパターンを用いた。この場合、第２のカテゴリーに含まれるパターングループは必ずしもＮｕｌｌパターンのみとは限らず、認識対象から除外したい画像や背景画像群などを用いても良い。その他は第１の実施形態と同様の構成であり、パターンクラスの同定を行う。この際に、仮に“パターンクラスが存在しない”パターングループであると同定された場合、２次元分布図で記憶されるのは、第１の実施形態の場合とは異なり、“パターンはない”という情報を保持する。
【００４２】
このような手法を図３に示したＥｕｃｌｉｄフォント７２ｐｔの文字”０”，　”４”，　”Ｂ”を含む１５０×１５０ｐｅｌの画像に適用した例を図１６、図１７、図１８に示す。対象は必ずしも文字フォントを利用するとは限らず、画像サイズも１５０×１５０ｐｅｌであるとは限らない。
【００４３】
このように、上記のような２つのカテゴリーをシステムに持たせることで第１の実施形態と比較して非常に効率的な特徴抽出が実現された。
【００４４】
【実施例】
以下、第２の実施形態を画像処理に適用した具体例について説明する。
【００４５】
（実施例１）
第２の実施形態の手法をＡｔｈｌｅｔｉｃフォント７２ｐｔの文字”０”，”Ｂ”を含む１５０ｘ１５０ｐｅｌ画像に適用した例を図１９に示す。第２の実施形態で示したＥｕｃｌｉｄフォントと非常に形の異なるフォントであるが、ほぼ同じような特徴をロバストに（対象におけるノイズ等の悪影響に対して強く柔軟に）抽出する機能を実現していることが判る。
【００４６】
（実施例２）
第２の実施形態の手法を用いて対象画像を２０％拡大したＥｕｃｌｉｄフォント８６ｐｔの”４”を含む１５０×１５０ｐｅｌ画像に適用した例を、７２ｐｔに適用した分布図と同時に図２０に示す。
スケールが変化したにも関わらず得られた特徴は７２ｐｔのものとそれほど変化がなく非常にロバストな特徴抽出が実現されていることが判る。これは必ずしも拡大した場合のみではなく縮小された場合も実現される。
【００４７】
（実施例３）
第２の実施形態の手法を用いて手書き文字”４”，”Ｂ”を含む１５０ｘ１５０ｐｅｌ画像に適用した例を図２１に示す。
手書きの文字はフォントの文字に比べ、線の太さが同じで文字にゆがみが存在するが、第２の実施形態で示されたＥｕｃｌｉｄフォントの分布図と類似しており、ロバストに特徴が抽出されている。
【００４８】
（実施例４）
第２の実施形態の手法を一部が欠けた手書き文字”４”画像に適用した例を図２２に示す。
手書きでしかも、従来のソフトウェアによる認識に用いられるようなクロスやコーナーを示す構成要素などの特徴が除かれているが、本手法では第２の実施形態におけるＥｕｃｌｉｄの”４”を適用した結果と類似したロバストな特徴抽出を行っていることが判る。
【００４９】
（実施例５）
第２の実施形態の手法を用いて生成した２次元分布図から１次元の数値列（ベクトル）に変換する手法（ステップ５）を図２３に示す。
図２３（ａ）は、第２の実施形態と同様の手法をＥｕｃｌｉｄフォント７２ｐｔの１５０×１５０ｐｅｌ画像に適用して２次元分布図を作成したものである。この画像のサイズは必ずしもこの大きさである必要はない。このようにして作成された２次元分布図から図２３（ｂ）に示すように６４×６４の大きさで切り出す。但し、この大きさは必ずしも６４×６４とは限らない。
【００５０】
そして、パターンクラス”０”からパターンクラス”９”にそれぞれ対応する位置情報の数を縦及び横の２方向に投影を行い、１６要素を１つにする平滑化処理を行う。ここで、位置情報の数の投影を全てのパターンクラスに対して行っているが、必ずしも全てのパターンクラスに適用する必要はない。必要に応じて選択的に位置情報の投影を行う。また、必ずしもこの平滑化手法は１６要素を１つにするとは限らない。例えば８でも３２でもよい。それぞれの場合によって異なる。
【００５１】
図２３（ｂ）では、パターンクラス”１”に対応した位置の数の投影を行っている。そして、パターンクラス”０”からパターンクラス”９”まで順にそれぞれ水平方向の投影情報、垂直方向の投影情報の順に並べ１次元の数値列、ベクトル表現を生成する。ここで、全てのパターンクラスに対する位置情報の投影情報を利用しているが、必ずしも全てのパターンクラスに適用する必要はない。必要に応じて選択的に投影情報を利用する。また、投影情報の並べる順は必ずしも前述した並べ方である必要はない。利用するパターンクラスによっても異なり、水平・垂直の投影情報も必ずしもこの順に従う必要はない。また、前記した処理でベクトル表現を生成するだけでなく、この処理の後に重みをつけてベクトル表現の平滑化を行うようなこともある。
【００５２】
このような手法をＥｕｃｌｉｄフォント　７２ｐｔ　文字“Ａ”，”Ｂ”，”Ｃ”，”Ｄ”，”Ｅ”を含む１５０×１５０ｐｅｌ画像に適用した例を図２４に示す。
但し、画像のサイズは必ずこのサイズである必要はない。このように数字のパターンクラスで表現した２次元分布図から生成した１次元の数値列はそれぞれのアルファベット文字の特徴を抽出してそれぞれ異なる表現になっていることが判る。この手法を利用しアルファベットの文字認識をロバストに行うことが実現された。
【００５３】
（実施例６）
実施例５の手法を、手書き文字”４”　，”Ｂ”を含む１５０×１５０ｐｅｌの画像に対して適用した例を、Ｅｕｃｌｉｄフォント同じ文字を含む同サイズの画像に適用した例と共に図２５に示す。
線の太さや傾きなど非常に異なるが、ベクトルとしては非常に高い類似度が実現されロバストな特徴抽出が実現されている。
【００５４】
（実施例７）
実施例５の手法を、部分的に欠けた手書き文字”４”を含む１５０ｘ１５０ｐｅｌの画像に対して適用した例を、Ｅｕｃｌｉｄフォント７２ｐｔの”４”を含む同サイズの画像に適用した例と共に図２６に示す。
従来のアルゴリズムでは特徴として利用されるクロスやコーナー部が欠けているが、ベクトルとしては非常に高い類似度が表れておりロバストに特徴抽出が実現されている。
【００５５】
（実施例８）
第２の実施形態の手法を用いて生成した２次元分布図から１次元の数値列（ベクトル）に変換する他の手法（ステップ６）を図２７に示す。
２次元分布図のデータを切り出し、投影を行う方法は実施例５と同様である。但し本例では、投影の際に加算されるデータは位置情報の数ではなく、その位置におけるそのパターンクラスの類似度を加算する。また、この類似度の加算は必ずしもそのまま加算を行うとは限らず、ロバストな認識のために何らかの数値の演算処理を加えることもある。図２７の例では図に示している位置のパターンクラスは１、類似度は１２４であるので、この位置で加算を行う場合は１２４を投影データに加える。このような処理を行うことでよりロバストで柔軟なベクトル表現を実現した。本例により生成されたベクトルを図２８に示す。
【００５６】
このように、類似度評価値を投影することで２次元分布図を非常にロバストに１次元の数値列（ベクトル表現）に変換することが実現できた。
【００５７】
（実施例９）
実施例８で示した方法を、部分的に欠けた手書き文字”４”を含む１５０ｘ１５０ｐｅｌの画像に対して適用した例を、Ｅｕｃｌｉｄフォント７２ｐｔの”４”を含む同サイズの画像に適用した例と共に図２９に示す。
従来のアルゴリズムでは特徴として利用されるクロスやコーナー部が欠けているが、ベクトルとしては非常に高い類似度が表れておりロバストに特徴抽出が実現されている。
【００５８】
（実施例１０）
第２の実施形態の手法を、図３０に示すＥｕｃｌｉｄフォントの７２ｐｔの数字を持つ１８０ｘ３５０ｐｅｌの画像に適用した例を図３１に示す。
このように、存在する数字の数が分からない場合でも、２次元分布図を生成することで、ロバストに特徴を抽出する機能を実現した。また、２次元分布図を１次元の数値列に変換する手法として実施例５の手法を用いても実施例１２の手法を用いても正しくロバストにこのような対象画像を認識することができた。但し、２次元の分布図を１次元に変換する手法はこの２つには限定されない。
【００５９】
（実施例１１）
第２の実施形態の手法を、図３２に示すＥｕｃｌｉｄフォントの７２ｐｔの”４”と”７”の重なり数字を持つ１５０×１５０ｐｅｌの画像に適用した例を図３３に示す。
このような問題は非常に解決が困難であるが、２次元分布図上でみるとロバストに”４”と”７”の特徴がそれぞれ抽出されていることが判る。また、２次元分布図を１次元の数値列に変換する手法として実施例５の手法を用いても実施例８の手法を用いても正しくロバストにこのような重なり画像を分離して認識することができた。但し、２次元分布図を１次元に変換する手法はこの２つには限定されない。
【００６０】
（実施例１２）
第２の実施形態の手法を、図３４に示す一部が欠落した手書き数字画像に適用した例を図３５に示す。
このように手書き文字で且つ一部が欠落している画像に対してもロバストに対象の特徴を抽出していることが判る。また、２次元分布図を１次元の数値列に変換する手法として実施例５の手法を用いても実施例８の手法を用いても正しくロバストにこのような対象画像を認識することができた。但し、２次元分布図を１次元に変換する手法はこの２つには限定されない。
【００６１】
（本発明の他の実施形態）
上述した第１及び第２の実施形態、諸実施例による画像処理装置を構成する各手段、並びに画像処理方法の各ステップ（ステップ１〜６など）は、コンピュータのＲＡＭやＲＯＭなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び当該プログラムを記録したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
【００６２】
具体的に、前記プログラムは、例えばＣＤ−ＲＯＭのような記録媒体に記録し、或いは各種伝送媒体を介し、コンピュータに提供される。前記プログラムを記録する記録媒体としては、ＣＤ−ＲＯＭ以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。他方、前記プログラムの伝送媒体としては、プログラム情報を搬送波として伝搬させて供給するためのコンピュータネットワーク（ＬＡＮ、インターネットの等のＷＡＮ、無線通信ネットワーク等）システムにおける通信媒体（光ファイバ等の有線回線や無線回線等）を用いることができる。
【００６３】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているＯＳ（オペレーティングシステム）或いは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全て或いは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明に含まれる。
【００６４】
例えば、図３６は、一般的なパーソナルユーザ端末装置の内部構成を示す模式図である。この図３６において、１２００はコンピュータＰＣである。ＰＣ１２００は、ＣＰＵ１２０１を備え、ＲＯＭ１２０２又はハードディスク（ＨＤ）１２１１に記憶された、或いはフレキシブルディスクドライブ（ＦＤ）１２１２より供給されるデバイス制御ソフトウェアを実行し、システムバス１２０４に接続される各デバイスを総括的に制御する。
【００６５】
【発明の効果】
本発明によれば、類似する画像を画像処理した際には、類似した画像データとして認識することを可能とし、比較的複雑な画像でも正確に認識することができる画像処理装置方法及び画像処理方法、プログラム及び記憶媒体が実現する。
【図面の簡単な説明】
【図１】第１の実施形態による画像処理装置の概略構成を示す模式図である。
【図２】第１の実施形態で用いるＴｉｍｅｓ　Ｎｅｗ　Ｒｏｍａｎフォント７２ｐｔの０〜９の数字画像及びパターングループ９の各参照パターンを示す模式図である。
【図３】Ｅｕｃｌｉｄフォント７２ｐｔを示す模式図である。
【図４】図３に示すＥｕｃｌｉｄフォント７２ｐｔのうち、数字”０”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図５】図３に示すＥｕｃｌｉｄフォント７２ｐｔのうち、数字”４”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図６】図１におけるベクトル生成部の回路構成図である。
【図７】ＰＡＰ変換ＶＬＳＩのチップの表面の顕微鏡写真である。
【図８】ベクトル生成部の回路の測定結果を示す模式図である。
【図９】ベクトルの１要素に対してデータを保持し類似度演算を行う基本回路を示す回路図である。
【図１０】図９の基本回路の機能特性を示す特性図である。
【図１１】図９の基本回路の機能特性を説明するための模式図である。
【図１２】テンプレートベクトルを記憶し類似度を演算する際の概念図である。
【図１３】複数のテンプレートベクトルを記憶し類似度を演算する際の概念図である。
【図１４】複数のテンプレートベクトルを記憶し類似度を演算した結果を示す特性図である。
【図１５】第２の実施形態による画像処理装置の概略構成を示す模式図である。
【図１６】Ｅｕｃｌｉｄフォント７２ｐｔのうち、数字”０”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図１７】Ｅｕｃｌｉｄフォント７２ｐｔのうち、数字”４”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図１８】Ｅｕｃｌｉｄフォント７２ｐｔのうち、数字”Ｂ”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図１９】Ａｔｈｌｅｔｉｃフォント７２ｐｔの文字”０”，”Ｂ”を含む１５０ｘ１５０ｐｅｌ画像に対する２次元分布図である。
【図２０】対象画像を２０％拡大したＥｕｃｌｉｄフォント８６ｐｔの”４”を含む１５０×１５０ｐｅｌ画像に対する２次元分布図である。
【図２１】手書き文字”４”，”Ｂ”を含む１５０ｘ１５０ｐｅｌ画像に対する２次元分布図である。
【図２２】一部が欠けた手書き文字”４”画像に対する２次元分布図である。
【図２３】第２の実施形態の手法を用いて生成した２次元分布図から１次元の数値列（ベクトル）に変換する手法を示す模式図である。
【図２４】Ｅｕｃｌｉｄフォント　７２ｐｔ　文字“Ａ”，”Ｂ”，”Ｃ”，”Ｄ”，”Ｅ”を含む１５０×１５０ｐｅｌ画像に対する１次元数値列を示す模式図である。
【図２５】手書き文字”４”　，”Ｂ”を含む１５０×１５０ｐｅｌの画像に対する１次元数値列を示す模式図である。
【図２６】部分的に欠けた手書き文字”４”を含む１５０ｘ１５０ｐｅｌの画像に対する１次元数値列を示す模式図である。
【図２７】第２の実施形態の手法を用いて生成した２次元分布図から１次元の数値列（ベクトル）に変換する他の手法を示す模式図である。
【図２８】手書き文字”４”　，”Ｂ”を含む１５０×１５０ｐｅｌの画像に対する１次元数値列を示す模式図である。
【図２９】部分的に欠けた手書き文字”４”を含む１５０ｘ１５０ｐｅｌの画像に対する１次元数値列を示す模式図である。
【図３０】Ｅｕｃｌｉｄフォントの７２ｐｔの数字群を示す模式図である。
【図３１】図３０に示すＥｕｃｌｉｄフォントの７２ｐｔの数字を持つ１８０ｘ３５０ｐｅｌの画像に対する２次元分布図である。
【図３２】Ｅｕｃｌｉｄフォントの７２ｐｔの”４”と”７”の重なり数字画像を示す模式図である。
【図３３】図３２に示す重なり数字を持つ１５０×１５０ｐｅｌの画像に対する２次元分布図である。
【図３４】一部が欠落した手書き数字画像を示す模式図である。
【図３５】図３２に示す手書き数字画像に対する２次元分布図である。
【図３６】一般的なパーソナルユーザ端末装置の内部構成を示す模式図である。
【図３７】従来の画像の認識方法を示す模式図である。
【符号の説明】
１　ベクトル生成部
２　記憶部
３　類似度評価部
４　ウィナー・テーク・オール（Ｗｉｎｎｅｒ　Ｔａｋｅ　Ａｌｌ）回路
５　変換部

Claims

入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出する画像処理装置であって、
所定のクラスに属する参照パターンを少なくとも１つ含むパターングループを複数有する第１の手段と、
前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出し、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２の手段と、
前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３の手段と
を含むことを特徴とする画像処理装置。
前記入力画像の複数の前記所定の位置毎に前記評価値及び前記クラスを特定し、各々を複数の前記所定の位置に対応させて分布図を作成することを特徴とする請求項１に記載の画像処理装置。
前記分布図から１次元のデータ列を作成する第４の手段を含み、
前記第４の手段は、同一の前記クラスに属する前記所定の位置の数を所定の方向に加算する処理を行うことを特徴とする請求項２に記載の画像処理装置。
前記分布図から１次元のデータ列を作成する第５の手段を含み、
前記第５の手段は、同一の前記クラスに属する前記所定の位置に対応する前記評価値を所定の方向に加算する処理を行うことを特徴とする請求項２に記載の画像処理装置。
複数の前記パターングループが少なくとも２つのカテゴリーに分類されており、
第１のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置における前記評価値及び前記クラスの特定に供され、
第２のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置に対応して選択された場合、当該位置に対して前記参照パターンが存在しないという意味付けが付与されるものであることを特徴とする請求項１〜４のいずれか１項に記載の画像処理装置。
前記入力画像内の所定の位置に対応して定義された領域の前記画像データをベクトル表記する第６の手段を含み、
前記第２の手段は、前記各参照パターンをベクトルとして保持しており、前記画像データのベクトルと照合して前記類似度を評価することを特徴とする請求項１〜５のいずれか１項に記載の画像処理装置。
入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出する画像処理方法であって、
前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出す第１のステップと、
所定のクラスに属する参照パターンを少なくとも１つ含む複数のパターングループを記憶しておき、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２のステップと、
前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３のステップと
を含むことを特徴とする画像処理方法。
前記入力画像の複数の前記所定の位置毎に前記評価値及び前記クラスを特定し、各々を複数の前記所定の位置に対応させて分布図を作成することを特徴とする請求項７に記載の画像処理方法。
前記分布図から１次元のデータ列を作成する第４のステップを含み、同一の前記クラスに属する前記所定の位置の数を所定の方向に加算する処理を行うことを特徴とする請求項８に記載の画像処理方法。
前記分布図から１次元のデータ列を作成する第５のステップを含み、同一の前記クラスに属する前記所定の位置に対応する前記評価値を所定の方向に加算する処理を行うことを特徴とする請求項８に記載の画像処理方法。
複数の前記パターングループが少なくとも２つのカテゴリーに分類されており、
第１のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置における前記評価値及び前記クラスの特定に供され、
第２のカテゴリーに属する前記各パターングループは、前記入力画像の前記所定の位置に対応して選択された場合、当該位置に対して前記参照パターンが存在しないという意味付けが付与されるものであることを特徴とする請求項７〜１０のいずれか１項に記載の画像処理方法。
前記入力画像内の所定の位置に対応して定義された領域の前記画像データをベクトル表記する第６のステップを含み、
前記第２のステップでは、前記各参照パターンがベクトルとして保持されており、前記画像データのベクトルと照合して前記類似度を評価することを特徴とする請求項７〜１１のいずれか１項に記載の画像処理方法。
入力画像の画像データを処理し、前記画像データに含まれる意味情報を抽出するに際して、
前記入力画像内の所定の位置に対応して定義された領域の前記画像データを取り出す第１のステップと、
所定のクラスに属する参照パターンを少なくとも１つ含む複数のパターングループを記憶しておき、前記画像データと前記各パターングループに含まれる前記各参照パターンとを照合し、前記各参照パターン毎についての前記画像データとの類似度を評価する第２のステップと、
前記類似度の各評価値に所定の演算を施して少なくとも１つの前記評価値を決定するとともに、決定された前記評価値に対応した前記参照パターンの前記クラスを特定し、当該参照パターンの前記評価値及び特定された前記クラスを前記所定の位置に対応させる第３のステップと
をコンピュータに実行させるためのプログラム。
請求項１３に記載のプログラムを記録したことを特徴とするコンピュータ読み取り可能な記憶媒体。