JP4729601B2 - 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 - Google Patents

画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4729601B2
JP4729601B2 JP2008176386A JP2008176386A JP4729601B2 JP 4729601 B2 JP4729601 B2 JP 4729601B2 JP 2008176386 A JP2008176386 A JP 2008176386A JP 2008176386 A JP2008176386 A JP 2008176386A JP 4729601 B2 JP4729601 B2 JP 4729601B2
Authority
JP
Japan
Prior art keywords
image data
image
data
search
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008176386A
Other languages
English (en)
Other versions
JP2009266189A (ja
Inventor
季▲りん▼ 李
志剛 范
亜棟 呉
波 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2009266189A publication Critical patent/JP2009266189A/ja
Application granted granted Critical
Publication of JP4729601B2 publication Critical patent/JP4729601B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/273Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/431Frequency domain transformation; Autocorrelation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、入力された画像データに特定形状を有する画像部分が含まれているかどうかを判別する画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体に関する。
複写機、ファクシミリ装置、プリンターおよびこれらの機能を複数併せ持つ複合機などの画像形成装置では、入力された原稿画像などの画像データを大容量の記憶装置に記憶しておき、1度入力され、登録された画像データであればいつでも読み出して再出力することができる機能が備えられているものがある。
再出力できる機能は便利ではあるが、登録されるデータ量が多くなると再出力したいデータを探すことが困難になるため、複数の画像データの中から所望の画像データを検索する画像検索技術が重要となる。
検索の目的となる画像データとしては、特定形状を有する画像部分が含まれているものがあり、特定形状はたとえば円形状、三角形状、四角形状など特定のマークである。特に円形状は、印章画像として検索の目的となる場合が多くあり、従来より円形状を有する画像部分が含まれているかどうかを判別する技術が開発されている。
円形状の検出は、主に2つのステップからなり、まず円周を構成するエッジを検出し、検出したエッジに基づいて中心座標などを求めて円を検出している。
円形状の検出には、ハフ(Hough)変換がよく用いられる。
円形状を検出するにあたって、検出すべきは、中心座標と半径である。したがって、変数空間は座標(x、y)と半径rの3次元となり多大な演算量および記憶容量が必要となる。
これらの問題を解決するためにハフ変換を改良した検出方法が種々開発されているが、たとえば円形画像の背景に複雑な画像を含むような場合の検出精度は十分に得られていない。
さらに、他の検出方法としては、エッジを検出することなく、円形状を非線形の曲線として検出する方法や、印鑑部分の色と、それ以外の部分の色との違いにより印鑑部分を検出する方法などがある。
しかしながら、非線形の曲線として検出する場合には、依然として多大な演算量および記憶容量を必要とし、色の違いに基づいて検出する場合には、印鑑部分の色は一定ではなく実使用には問題がある。
このように、従来の円形状の検出方法では、多大な演算量および記憶容量を必要とし、さらには、検出に用いる画像データとして汚れなどがなく背景画像が無地である画像データが要求されるという問題がある。
特開昭62−137680号公報
本発明の目的は、判別処理に要する演算量を削減するとともに判別精度を向上させることが可能な画像判別装置を提供することであり、他の目的は、検索処理に要する時間を短縮するとともに検索精度を向上させることが可能な画像検索装置、画像検索プログラムおよび記録媒体を提供することである。
本発明は、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別装置であって、
入力された画像データを2値化して2値画像データに変換する2値化処理部と、
前記2値画像データ中に含まれる、同じ色の画素が連結して集合した画素群である結合要素を検出し、この結合要素に外接する外接矩形を検出し、外接矩形の大きさと、外接矩形内の黒画素数とに基づいて、全ての結合要素から形状の検出に寄与しない外接矩形を有する結合要素を除去し、残余の結合要素を候補結合要素として抽出する特徴抽出部と、
抽出された候補結合要素に対してエッジ検出を行い、前記2値画像データに含まれるエッジ画素の分布データを生成するとともに、生成された分布データに対して2次元高速フーリエ変換を施して入力画像データに対するスペクトルデータを生成する一方、大きさがそれぞれ異なり相似関係にある形状を有するテンプレート画像データを複数生成するとともに、生成された複数のテンプレート画像データに対して2次元高速フーリエ変換を施してテンプレート画像データに対するスペクトルデータを複数生成し、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとに基づいて、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別部とを備えることを特徴とする画像判別装置である。
また本発明は、前記判別部は、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとを重畳し、重畳されたスペクトルデータに対して2次元高速フーリエ変換の逆変換を施して入力画像データとテンプレート画像データとの相関係数を算出し、算出された相関係数に基づいて入力された画像データに特定形状を有する画像部分が含まれているかどうかを判別することを特徴とする。
また本発明は、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索装置であって、
入力された画像データを2値化して2値画像データに変換する2値化処理部と、
前記2値画像データ中に含まれる、同じ色の画素が連結して集合した画素群である結合要素を検出し、この結合要素に外接する外接矩形を検出し、外接矩形の大きさと、外接矩形内の黒画素数とに基づいて、全ての結合要素から形状の検出に寄与しない外接矩形を有する結合要素を除去し、残余の結合要素を候補結合要素として抽出する特徴抽出部と、
抽出された候補結合要素に対してエッジ検出を行い、前記2値画像データに含まれるエッジ画素の分布データを生成するとともに、生成された分布データに対して2次元高速フーリエ変換を施して入力画像データに対するスペクトルデータを生成する一方、大きさがそれぞれ異なり相似関係にある形状を有するテンプレート画像データを複数生成するとともに、生成された複数のテンプレート画像データに対して2次元高速フーリエ変換を施してテンプレート画像データに対するスペクトルデータを複数生成し、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとに基づいて、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別部と
前記画像判別部の判別結果に基づいて、入力された画像データに含まれる形状の画像部分と類似の画像部分を有する画像データを検索する検索部と、
検索部による検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示部とを備えることを特徴とする画像検索装置である。
また本発明は、予め登録された画像データは、登録時に、形状の画像部分を有するかどうかが判別され、入力画像データに含まれる形状を示すテンプレート画像データが決定され、
前記画像判別部は、入力画像データに含まれる形状を示すテンプレート画像データに関する情報を出力し、
前記検索部は、前記画像判別部の判別結果に含まれるテンプレート画像データに関する情報と、登録画像データに対して予め決定されたテンプレート画像データに関する情報とに基づいて検索することを特徴とする。
また本発明は、コンピュータを上記の画像検索装置として機能させるための画像検索プログラムである。
また本発明は、コンピュータを上記の画像検索装置として機能させるための画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、まず2値化処理部によって、入力された画像データを2値化する。
特徴抽出部では、前記2値画像データ中に含まれる、結合要素を検出し、この結合要素に外接する外接矩形を検出する。検出された外接矩形に対しては、外接矩形の大きさと、黒画素数とに基づいて、全ての結合要素から形状の検出に寄与しない外接矩形を有する結合要素を除去する。不要の結合要素が除去された残余の結合要素を候補結合要素として抽出する。
画像判別部は、2次元高速フーリエ変換によって入力画像データに対するスペクトルデータを生成する一方で、2次元高速フーリエ変換によって形状を有するテンプレート画像データに対するスペクトルデータを生成する。生成されたこれらのスペクトルデータに基づいて、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する。
特徴抽出部で結合要素の選別を行うことにより、不要な要素を予め除去し、判別処理における演算量を減少させ、判別処理に要する時間を短縮することができる。さらに、誤判別の原因となるような結合要素を予め除去することで、判別精度を向上させることができる。
また、2次元高速フーリエ変換によるスペクトルデータを用いて判別を行うので、複雑な背景画像を伴う入力画像データであっても高精度に判別を行うことができる。
また、たとえば、印章に代表されるように、判別すべき形状としては、円形状が重要であり、本発明によって、円形状を高精度に判別することができる。
本発明によれば、2つのスペクトルデータとを重畳し、その逆変換結果を用いて判別を行うので、より判別精度を向上することができる。
本発明によれば、上記の画像判別部の判別結果に基づいて、検索部が、入力された画像データに含まれる形状の画像部分と類似の画像部分を有する画像データを検索し、表示部に検索結果を表示する。
画像判別部によって、判別処理の演算量が削減され、判別精度が向上されることにより、検索処理に要する演算量の削減と、検索処理の向上が実現できる。
本発明によれば、予め登録画像データに対して、形状を示すテンプレート画像データに関する情報が決定されているので、画像判別部が、入力画像データのテンプレート画像データに関する情報を出力することで、これらを比較することで容易に検索することができる。
また本発明によれば、画像検索プログラム、画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体として提供することができる。
以下図面を参考にして本発明の好適な実施形態を詳細に説明する。
図1は、画像検索装置10の機械的構成を示すブロック図である。画像検索装置10は、プロセッサ4と、プロセッサ4が実際の処理を行うためのソフトウェアなどを格納する外部記憶装置5とを含む。
プロセッサ4は、入力された画像データ(以下では「入力画像データ」という)に、円形状などの特定形状を有する画像部分(特定画像部分)が含まれているかどうかを判別する判別処理を行い、さらにその判別結果に基づいて、予め登録されている複数の画像データ(以下では「登録画像データ」という)から特定画像部分を有する画像データを検索して表示する画像検索処理などを実際に行う。プロセッサ4における実際の処理は、外部記憶装置5に格納されるソフトウェアによって実行される。プロセッサ4は、たとえば通常のコンピュータ本体などで構成される。
外部記憶装置5は、たとえば高速アクセスが可能なハードディスクなどで構成することができる。外部記憶装置5は、登録画像データを大量に保持するために光ディスクなどの大容量デバイスを用いるような構成であっても構わない。また、判別処理中および検索処理中に各処理ステップの段階で作成された一時的なデータなどは、外部記憶装置5に記憶してもよいし、プロセッサ4に内蔵される半導体メモリに記憶してもよい。
プロセッサ4には、キーボード1が接続されるとともに、表示装置3が接続される。キーボード1は、各種ソフトウェアを実行するための指示の入力などに用いられる。
表示装置3は、入力画像データおよび登録画像データに基づく画像の表示、検索結果の表示などを行う。
プロセッサ4には、イメージスキャナ2がさらに接続される。イメージスキャナ2は、画像が印刷された原稿を読み取り、入力画像データを取り込むために用いられる。
入力画像データの取得は、イメージスキャナ2からの入力の他に通信I/F(インターフェイス)6を介して、ネットワーク上の他の装置からデータ通信により取得することもできる。通信I/F6は、LAN(Local Area Network)に接続するためのLANカードや、公衆交換電話網に接続してデータ通信を行うためのモデムカードなどで実現される。
図2は、画像検索装置10の機能的構成を示すブロック図である。
画像検索装置10は、入力部11、画像判別部12、検索部13、表示部14および登録画像記憶部15を含んで構成される。
入力部11は、入力画像データ、登録画像データを入力する。図1に示したハードウェア構成のうち、イメージスキャナ2、通信I/F6などが機能的に入力部11に相当する。登録画像データは、入力画像データが入力されるより前に予め入力されていた画像データであり、登録画像記憶部15に記憶されている。
図3は、図2に示す画像判別部12の機能的構成を示すブロック図である。以下では、特定形状として円形状を有する特定画像部分が含まれているかどうかを判別する場合について説明する。
画像判別部12は、前処理部120、特徴抽出部121、判別部122を含んで構成される。
画像判別部12は、入力部11によって入力された画像データに、円形状を有する特定画像部分が含まれているかどうかを判別し、その判別結果を後段の検索部13に出力する。検索部13では、登録画像データの中から、入力画像データに含まれていた特定画像部分と類似の特定画像部分を含む画像データを検索する。
図4は、画像判別部12による判別処理を示すフローチャートである。ステップA1では、前処理部120が、入力された画像データに対する前処理として2値化処理やゆがみ補正などを施す。ステップA2では、2値化された画像データに基づいて、特徴抽出部121が、結合画素の外接矩形の検出、外接矩形の選別を行い、円形状の候補となる結合画素を選択する。ステップA3では、判別部122が、入力画像データに円形状が含まれるかどうかを判別し、ステップA4で、判別結果を検索部13に出力する。
以下では、各ステップについて詳細に説明する。
前処理部120によるステップA1の前処理は、たとえば図5のフローチャートに示される。
画像データが入力されると、ステップB1で、入力された画像データがカラー画像データかどうかを判断する。カラー画像データであれば、ステップB2に進み、明度成分に基づくグレイ化を行い濃淡画像データに変換する。カラー画像でなければ、ステップB3に進み、濃淡画像データであるかどうかを判断する。濃淡画像データであれば、ステップB4に進み、予め定める閾値を用いて2値化し、濃淡画像データを2値画像データに変換する。濃淡画像データでなければ、すなわち2値画像データであるので、ステップB5に進む。
ステップB5では、変換された2値画像データにゆがみ補正処理を施す。ゆがみ補正処理は、画像処理分野で用いられる公知の補正処理を用いることができる。
ステップB6では、直線成分の除去を行う。後段の特徴抽出において、結合画素を検出する際に長い直線成分の影響を防ぐために、前処理時点で予め直線成分を除去しておく。
図6は、ステップB6に示す直線成分の除去処理を説明するための図である。
2値画像データは、画像データを構成する各画素の画素値を0か1(白画素か黒画素)のいずれかとする、いわゆる白黒画像データであり、濃淡画像データの各画素の濃淡度(濃度)を閾値処理して、全画素を黒画素と白画素とに分類されたものである。
このような2値画像データをラインスキャンすることで図6(a)に示すような白画素と黒画素の連結部分であるラインのスキャン結果が得られる。ここでは、黒画素の連結部分を直線成分であるとする。
したがって、白画素の部分は、ラインの隔たりであると考え、まず、この隔たり部分の長さが予め定める長さdよりも短い場合は、隔たり部分の両側にある連結部分を結合し、すなわち隔たり部分の白画素を黒画素に変換し、図6(b)に示すように新たにラインを生成する。そののち、図6(c)に示すように、予め定める長さLよりも長いラインを除去する。
このようにして得られた、直線成分を除去した2値化画像データを出力する。
特徴抽出部121によるステップA2の特徴抽出処理は、たとえば図7のフローチャートに示される。
ステップC1で、前処理部120によって2値化処理された2値画像データが入力されると、ステップC2では、2値画像データ中の全ての結合要素を検出する。
結合要素とは、連結した同じ色の画素が集合した画素群である。黒画素の結合要素を検出するか、白画素の結合要素を検出するかは、入力された画像データの下地が黒画素であるか白画素であるかに依存する。一般的には下地が白画素である場合が多く、文字画像や図形画像が黒画素で描画されているので、本実施形態では、黒画素の結合要素を検出するとして説明する。下地が黒画素の場合は、文字画像や図形画像が白画素で描画される、白抜き文字や白抜き図形であり、この場合は、白画素の結合要素を検出することになる。
なお、下地が黒画素であるか白画素であるかは、公知の下地判別処理で判別することができ、たとえば、上記の全体黒画素割合が所定の割合よりも小さいと下地が白画素と判別し、所定の割合よりも大きいと下地が黒画素と判別する。
結合要素の検出は、公知の検出方法で検出することができる。たとえば、1ラインについて、そのライン中で互いに隣接する黒画素の連続部分(黒ラン)を検出し、黒ランのランレングスと、黒ランの両端の黒画素の座標とを、ラインごとに記憶しておく。座標は、たとえば、ラインに平行な方向をx軸とし、ラインに直交する方向をy軸として予め決定される。
1つの注目ラインをy方向に挟む上下ラインの黒ランについて、その両端の黒
画素のx座標が、注目ラインの各黒ランにおける両端の黒画素座標のx座標の範囲内にあれば注目ラインの当該黒ランと、x座標が範囲内となる黒画素を端部画素とする黒ランとはy方向に連結されているものとみなすことができる。
このようにして、注目ラインを順次ずらしながら全ての画像データに対して、x方向の連結部分とy方向の連結部分を検出し、黒画素の結合要素を検出する。
黒画素の結合要素を検出すると、検出した全ての結合要素に外接する外接矩形を生成する。外接矩形は、x方向に平行な辺とy方向に平行な辺とで構成される矩形であって、x方向の辺の長さを矩形幅とし、y方向の辺の長さを矩形高さとする。
外接矩形の生成は、公知の生成方法で生成することができる。たとえば、結合要素を検出した際に、各黒ランの両端の黒画素の座標は既に検出されているので、全ての黒ランを対象として、x座標の最小値と最大値とを抽出し、最大値と最小値との差が矩形幅w(画素数)として算出する。また、結合要素を構成する全ての黒ランを対象として、y座標の最小値と最大値とを抽出し、最大値と最小値との差が矩形高さh(画素数)として算出する。
矩形幅wと矩形高さhとに基づいて、全ての外接矩形の面積を算出し、面積の平均値Sを算出する。
本発明ではさらに、全ての結合要素について、外接矩形内の画素のうち黒画素数Pを算出する。黒画素数Pは、結合要素を構成する全ての黒ランのランレングスの総和から算出できる。
以上のようにして、ステップC2では、2値画像データ中の全ての結合要素に対し、結合要素を構成する黒画素の位置(座標)、外接矩形の位置(座標)、それぞれの外接矩形の矩形幅w、矩形高さh、黒画素数Pおよび全外接矩形の平均面積Sを、各結合要素に関連付けて所定の記憶領域に記憶する。
次にステップC3では、除去する結合要素の選別を行う。ここでの選別は、円形状の検出に寄与しない結合要素を除去することを目的とする。ステップC3における選別、すなわち結合要素の除去は、以下の5つの条件のうち少なくとも1つの条件を満たす外接矩形を有する結合要素に対して行われる。
(条件1)
max(w,h)/min(w,h)>α1となる外接矩形を有する結合要素を除去する。α1としては、ユーザが適宜設定可能であるが、一例としてはα1=5である。
(条件2)
P>α2×w×hとなる外接矩形を有する結合要素を除去する。α2としては、ユーザが適宜設定可能であるが、一例としてはα=0.8である。
(条件3)
P<α3×(w+h)となる外接矩形を有する結合要素を除去する。α3としては、ユーザが適宜設定可能であるが、一例としてはα3=3である。
(条件4)
min(w,h)<max(α4,α5×S)となる外接矩形を有する結合要素を除去する。α4,α5としては、ユーザが適宜設定可能であるが、一例としてはα4=50であり、α5=3である。
以上のようにして、後段の円形状検出に不要な結合要素を選別して除去し、残余の結合要素を円形状検出の候補結合要素として選択する。
円形状検出に不要な結合要素を除去することで、後段の判別処理における演算量を抑えるとともに、判別精度を向上させることができる。
ステップC4では、候補結合要素の出力を行う。特徴抽出部121は、得られた候補結合要素を判別部122に対して出力する。
判別部122は、候補結合要素に基づいて、入力画像データに円形状が含まれているかどうかを判断する。
特徴抽出部121から判別部122へ出力される候補結合要素に関連する情報としては、エッジマップ生成のために必要な結合要素を構成する黒画素の位置(座標)、外接矩形の位置(座標)などである。
判別部122によるステップA3の判別処理は、たとえば図8のフローチャートに示される。判別処理では、候補接合要素に基づいて高速フーリエ変換を行い、周波数領域に変換されたスペクトルデータと、別途生成した円形状のテンプレート画像に対して高速フーリエ変換を行い、得られたスペクトルデータを用いて円形状の判別を行う。
ステップD1〜D3は、候補結合要素に対する処理であり、ステップD4〜D6は、テンプレートに対する処理である。
ステップD1では、候補結合要素に対してエッジ抽出を行い、ステップD2では、抽出されたエッジ画素によるエッジマップを生成する。
エッジ抽出、エッジマップは、公知の方法を用いることができる。注目画素を中心とする所定の大きさの画素ブロックに対してエッジ検出オペレータを適用し、閾値処理によって注目画素がエッジ画素であるかどうかを判断する。
本実施形態では、たとえばエッジ検出オペレータとして安全な最適オペレータを用いてエッジ画素を検出する。
検出されたエッジ画素に基づいて、候補結合要素を組み合わせ、エッジ画素をマッピングしたエッジマップを生成する。
ステップD3では、ステップD2で得られたエッジマップに対して2次元の高速フーリエ変換処理(2D−FFT)を行い、スペクトルデータを算出する。
FFTは、1次元の信号をその周波数成分に分解してスペクトルデータを算出する手法であり、画像処理分野においては、画素の並び、濃淡の周期変化を解析するために用いられる。2D−FFTは、2次元画像に対してFFTを行うものであり、縦横方向(x方向およびy方向)にそれぞれFFTを施す。
2D−FFT処理により、エッジマップに対する2次元スペクトルデータが得られる。なお、2D−FFT処理を行う際は、エッジマップの大きさを所定のサイズ(N画素×N画素)に変換して行う。
一方、ステップD4では、円形状のテンプレート画像データを生成する。
サイズがN画素×N画素で、全ての画素が白画素からなる画像データを生成し、半径がr、中心座標が(r,r)の円を描画する。このときrをR1〜Rnまで変化させ、n個のテンプレート画像を生成する。
ステップD5では、生成したn個のテンプレート画像に対して、2D−FFT処理を行い、ステップD6で円形状の大きさが異なるそれぞれのテンプレートに対する2次元スペクトルデータを得る。
エッジマップのスペクトルデータおよびテンプレートのスペクトルデータは、それぞれ所定の記憶領域に記憶する。
ステップD7では、エッジマップのスペクトルデータと、n個のテンプレートのスペクトルデータとを重畳し、ステップD8では、重畳されたスペクトルデータに対してFFTの逆変換(Inverse FFT)を行う。
逆変換によって得られた、重畳後の関数に基づいてテンプレートと、候補結合要素との相関係数が得られる。
ステップD9では、得られた相関係数に対して閾値処理を行い、相関係数が閾値を越える場合は、重畳したテンプレートに含まれていた円形状が、エッジマップにも同様に含まれていたものと判別することができる。すなわち、入力された画像データに、重畳したテンプレートに含まれていた円形状と同様の円形状が含まれているものと判別できる。
重畳したテンプレートに基づいて、入力画像データが含む円の半径および中心座標を決定する。
判別部122によるステップA4の出力処理は、ステップA3での判別結果を検索部13に出力する。
検索部13では、入力画像データに含まれていると判別された円形状に基づいて、登録画像データのうち、この円形状に類似の円形状を有する特定画像部分を含む画像データを検索する。
登録画像データについては、登録時に特定画像部分を含むかどうかの判別と含む場合には、特定画像部分のテンプレートとを関連付けて記憶しておく。
判別部122からは、入力画像データに含まれる特定画像部分のテンプレートに関する情報が出力され、検索部13は、入力画像データに関連付けられたテンプレートと、登録画像データに関連付けられたテンプレートとを比較し、同じかまたは類似のテンプレートに関連付けられた登録画像データを検索結果として出力する。
検索結果としては、最も類似度が高い登録画像データのみではなく、類似度の高い方から所定数の登録画像データを選択してこれを検索結果としてもよい。
検索部13によって検索結果が出力されると、表示部14が検索結果として選択された登録画像データを可視化した画像を表示する。
本発明によれば以下のような効果が得られる。
結合要素の選別を行うことにより、不要な要素を予め除去し、判別処理における演算量を減少させ、判別処理、検索処理に要する時間を短縮することができる。さらに、誤判別の原因となるような結合要素を予め除去することで、判別精度を向上させることができる。
また、2D−FFTによるスペクトルデータを用いて判別を行うので、複雑な背景画像を伴う入力画像データであっても高精度に判別を行うことができる。
なお、画像検索装置10の各ブロック、特に、入力部11、画像判別部12、検索部13、表示部14および登録画像記憶部15等は、ハードウエアロジックによって構成してもよいし、次のようにCPUを用いてソフトウエアによって実現してもよい。
すなわち、画像検索装置10は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only
memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリなどの記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウエアである画像検索装置10の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記画像検索装置10に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープなどのテープ系、フロッピー(登録商標)ディスク/ハードディスクなどの磁気ディスクやCD−ROM/MO/MD/DVD/CD−Rなどの光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カードなどのカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROMなどの半導体メモリ系などを用いることができる。
また、画像検索装置10を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網などが利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線などの有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、その精神または主要な特徴から逸脱することなく、他のいろいろな形態で実施できる。したがって、前述の実施形態はあらゆる点で単なる例示に過ぎず、本発明の範囲は特許請求の範囲に示すものであって、明細書本文には何ら拘束されない。さらに、特許請求の範囲に属する変形や変更は全て本発明の範囲内のものである。
画像検索装置10の機械的構成を示すブロック図である。 画像検索装置10の機能的構成を示すブロック図である。 図2に示す画像判別部12の機能的構成を示すブロック図である。 画像判別部12による判別処理を示すフローチャートである。 図3に示す前処理部120による前処理を示すフローチャートである。 図5のフローチャートのステップB6に示す直線成分の除去処理を説明するための図である。 図3に示す特徴抽出部121による特徴抽出処理を示すフローチャートである。 図3に示す判別部122による判別処理を示すフローチャートである。
符号の説明
1 キーボード
2 イメージスキャナ
3 表示装置
4 プロセッサ
5 外部記憶装置
10 画像検索装置
11 入力部
12 画像判別部
13 検索部
14 表示部
15 登録画像記憶部
120 前処理部
121 特徴抽出部
122 判別部

Claims (6)

  1. 入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別装置であって、
    入力された画像データを2値化して2値画像データに変換する2値化処理部と、
    前記2値画像データ中に含まれる、同じ色の画素が連結して集合した画素群である結合要素を検出し、この結合要素に外接する外接矩形を検出し、外接矩形の大きさと、外接矩形内の黒画素数とに基づいて、全ての結合要素から形状の検出に寄与しない外接矩形を有する結合要素を除去し、残余の結合要素を候補結合要素として抽出する特徴抽出部と、
    抽出された候補結合要素に対してエッジ検出を行い、前記2値画像データに含まれるエッジ画素の分布データを生成するとともに、生成された分布データに対して2次元高速フーリエ変換を施して入力画像データに対するスペクトルデータを生成する一方、大きさがそれぞれ異なり相似関係にある形状を有するテンプレート画像データを複数生成するとともに、生成された複数のテンプレート画像データに対して2次元高速フーリエ変換を施してテンプレート画像データに対するスペクトルデータを複数生成し、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとに基づいて、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別部とを備えることを特徴とする画像判別装置。
  2. 前記画像判別部は、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとを重畳し、重畳されたスペクトルデータに対して2次元高速フーリエ変換の逆変換を施して入力画像データとテンプレート画像データとの相関係数を算出し、算出された相関係数に基づいて入力された画像データに形状を有する画像部分が含まれているかどうかを判別することを特徴とする請求項1記載の画像判別装置。
  3. 予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索装置であって、
    入力された画像データを2値化して2値画像データに変換する2値化処理部と、
    前記2値画像データ中に含まれる、同じ色の画素が連結して集合した画素群である結合要素を検出し、この結合要素に外接する外接矩形を検出し、外接矩形の大きさと、外接矩形内の黒画素数とに基づいて、全ての結合要素から形状の検出に寄与しない外接矩形を有する結合要素を除去し、残余の結合要素を候補結合要素として抽出する特徴抽出部と、
    抽出された候補結合要素に対してエッジ検出を行い、前記2値画像データに含まれるエッジ画素の分布データを生成するとともに、生成された分布データに対して2次元高速フーリエ変換を施して入力画像データに対するスペクトルデータを生成する一方、大きさがそれぞれ異なり相似関係にある形状を有するテンプレート画像データを複数生成するとともに、生成された複数のテンプレート画像データに対して2次元高速フーリエ変換を施してテンプレート画像データに対するスペクトルデータを複数生成し、入力画像データに対するスペクトルデータと各テンプレート画像データに対するスペクトルデータとに基づいて、入力された画像データに形状を有する画像部分が含まれているかどうかを判別する画像判別部と、
    前記画像判別部の判別結果に基づいて、入力された画像データに含まれる形状の画像部分と類似の画像部分を有する画像データを検索する検索部と、
    検索部による検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示部とを備えることを特徴とする画像検索装置。
  4. 予め登録された画像データは、登録時に、形状の画像部分を有するかどうかが判別され、入力画像データに含まれる形状を示すテンプレート画像データが決定され、
    前記画像判別部は、入力画像データに含まれる形状を示すテンプレート画像データに関する情報を出力し、
    前記検索部は、前記画像判別部の判別結果に含まれるテンプレート画像データに関する情報と、登録画像データに対して予め決定されたテンプレート画像データに関する情報とに基づいて検索することを特徴とする請求項記載の画像検索装置。
  5. コンピュータを請求項記載の画像検索装置として機能させるための画像検索プログラム。
  6. コンピュータを請求項記載の画像検索装置として機能させるための画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008176386A 2008-04-21 2008-07-04 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 Active JP4729601B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2008100904918A CN101567048B (zh) 2008-04-21 2008-04-21 图像辨别装置及图像检索装置
CN200810090491.8 2008-04-21

Publications (2)

Publication Number Publication Date
JP2009266189A JP2009266189A (ja) 2009-11-12
JP4729601B2 true JP4729601B2 (ja) 2011-07-20

Family

ID=41201152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008176386A Active JP4729601B2 (ja) 2008-04-21 2008-07-04 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体

Country Status (3)

Country Link
US (1) US8200012B2 (ja)
JP (1) JP4729601B2 (ja)
CN (1) CN101567048B (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930461A (zh) * 2010-08-20 2010-12-29 郑茂 通信网络的数字图像可视化管理和检索
CN102455305B (zh) * 2010-11-01 2014-06-18 北京中盾安民分析技术有限公司 双能量x射线人体藏物检查设备中所使用的图像处理方法
JP5830338B2 (ja) * 2011-10-07 2015-12-09 株式会社日立情報通信エンジニアリング 帳票認識方法および帳票認識装置
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US20130257885A1 (en) * 2012-03-28 2013-10-03 Intel Corporation Low Power Centroid Determination and Texture Footprint Optimization For Decoupled Sampling Based Rendering Pipelines
CN103425641A (zh) * 2012-05-14 2013-12-04 富泰华工业(深圳)有限公司 电子装置及该电子装置的图像管理方法
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
CN104182722B (zh) * 2013-05-24 2018-05-18 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
CN104951549A (zh) * 2015-06-24 2015-09-30 努比亚技术有限公司 一种移动终端及其照片/视频分类管理方法
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) * 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
KR101717371B1 (ko) * 2015-08-31 2017-03-16 왕용진 실시간 또는 기저장된 초고속 후두내시경 영상을 이용한 평면 스캔 비디오카이모그래피 영상 생성 방법, 이를 수행하는 평면 스캔 비디오카이모그래피 영상 생성 서버, 및 이를 저장하는 기록매체
CN106022142B (zh) * 2016-05-04 2019-12-10 泰康保险集团股份有限公司 图像隐私信息处理方法及装置
CN106503143B (zh) * 2016-10-21 2020-02-07 广东工业大学 一种图像检索方法及装置
CN106650615B (zh) * 2016-11-07 2018-03-27 深圳云天励飞技术有限公司 一种图像处理方法及终端
CN106649851A (zh) * 2016-12-30 2017-05-10 徐庆 近似商标查询结果排序方法、装置及其商标服务器
US10438089B2 (en) * 2017-01-11 2019-10-08 Hendricks Corp. Pte. Ltd. Logo detection video analytics
JP6884597B2 (ja) * 2017-03-01 2021-06-09 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN107563384B (zh) * 2017-08-31 2020-02-21 江苏大学 基于广义Hough聚类的粘连猪的头尾识别方法
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN111801703A (zh) * 2018-04-17 2020-10-20 赫尔实验室有限公司 用于图像处理管线的边界框生成的硬件和系统
CN109816675A (zh) 2018-12-28 2019-05-28 歌尔股份有限公司 物体的检测方法、检测装置及存储介质
JP7342364B2 (ja) * 2019-01-21 2023-09-12 コニカミノルタ株式会社 画像検査装置、画像形成システム、画像検査方法及びプログラム
CN111062982B (zh) * 2019-12-10 2021-03-19 长江存储科技有限责任公司 一种图形分析方法、系统及存储介质
JP2021096652A (ja) * 2019-12-17 2021-06-24 富士通株式会社 画像識別装置、方法、及びプログラム
CN113610090B (zh) * 2021-07-29 2023-12-26 深圳广电银通金融电子科技有限公司 印章图像识别分类方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62137680A (ja) * 1985-12-11 1987-06-20 Oki Electric Ind Co Ltd 印鑑照合装置
JP2919284B2 (ja) * 1994-02-23 1999-07-12 松下電工株式会社 物体認識方法
JP3098704B2 (ja) * 1996-03-08 2000-10-16 グローリー工業株式会社 画像照合方法及び装置
JP2002051316A (ja) * 2000-05-22 2002-02-15 Matsushita Electric Ind Co Ltd 画像通信端末
JP3694911B2 (ja) * 1995-01-23 2005-09-14 マツダ株式会社 円ないし楕円の検出方法およびその装置
JP2005301722A (ja) * 2004-04-13 2005-10-27 Matsushita Electric Ind Co Ltd 顔領域検出装置
JP2007006064A (ja) * 2005-06-23 2007-01-11 Seiko Epson Corp 画像処理方法及び装置
JP2007336000A (ja) * 2006-06-12 2007-12-27 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法及び画像処理プログラム
JP2008011135A (ja) * 2006-06-29 2008-01-17 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1445696A (zh) * 2002-03-18 2003-10-01 朗迅科技公司 自动检索图像数据库中相似图象的方法
JP2006038779A (ja) * 2004-07-30 2006-02-09 Hitachi High-Technologies Corp パターン形状評価方法、評価装置、及び半導体装置の製造方法
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62137680A (ja) * 1985-12-11 1987-06-20 Oki Electric Ind Co Ltd 印鑑照合装置
JP2919284B2 (ja) * 1994-02-23 1999-07-12 松下電工株式会社 物体認識方法
JP3694911B2 (ja) * 1995-01-23 2005-09-14 マツダ株式会社 円ないし楕円の検出方法およびその装置
JP3098704B2 (ja) * 1996-03-08 2000-10-16 グローリー工業株式会社 画像照合方法及び装置
JP2002051316A (ja) * 2000-05-22 2002-02-15 Matsushita Electric Ind Co Ltd 画像通信端末
JP2005301722A (ja) * 2004-04-13 2005-10-27 Matsushita Electric Ind Co Ltd 顔領域検出装置
JP2007006064A (ja) * 2005-06-23 2007-01-11 Seiko Epson Corp 画像処理方法及び装置
JP2007336000A (ja) * 2006-06-12 2007-12-27 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法及び画像処理プログラム
JP2008011135A (ja) * 2006-06-29 2008-01-17 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
CN101567048B (zh) 2012-06-06
JP2009266189A (ja) 2009-11-12
US20090263025A1 (en) 2009-10-22
CN101567048A (zh) 2009-10-28
US8200012B2 (en) 2012-06-12

Similar Documents

Publication Publication Date Title
JP4729601B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP5844783B2 (ja) テキスト領域を含むグレースケール文書画像を処理する方法、グレースケール文書画像の少なくともテキスト領域を二値化する方法、グレースケール文書画像においてグリッドを形成するテーブルの抽出方法及びプログラム
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
JP4029412B2 (ja) 指紋掌紋画像処理システムおよび指紋掌紋画像処理方法
JP4469873B2 (ja) 画像文書の検索装置、プログラム、及び記録媒体
JP2014531097A (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
JP2007183742A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JP2009530975A (ja) 以前に圧縮された画像における合成の検出
JP2009032299A (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP2009169925A (ja) 画像検索装置および画像検索方法
CN110060260B (zh) 一种图像处理方法及系统
JP5042917B2 (ja) 画像処理装置およびプログラム
JP4595014B2 (ja) 電子透かし埋め込み装置および検出装置
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4132766B2 (ja) 画像処理装置および方法
JP4804382B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP4873554B2 (ja) 画像配信装置および画像配信方法
Boiangiu et al. Methods of bitonal image conversion for modern and classic documents
JP5521449B2 (ja) 画像判別装置
JP2008225654A (ja) 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体
Boiangiu et al. Bitonal image creation for automatic content conversion
Vu Building extraction from high-resolution satellite image for tsunami early damage estimation
JP4718527B2 (ja) 物体検出装置、物体検出方法、物体検出プログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110418

R150 Certificate of patent or registration of utility model

Ref document number: 4729601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3