JP4772819B2 - 画像検索装置および画像検索方法 - Google Patents

画像検索装置および画像検索方法 Download PDF

Info

Publication number
JP4772819B2
JP4772819B2 JP2008079366A JP2008079366A JP4772819B2 JP 4772819 B2 JP4772819 B2 JP 4772819B2 JP 2008079366 A JP2008079366 A JP 2008079366A JP 2008079366 A JP2008079366 A JP 2008079366A JP 4772819 B2 JP4772819 B2 JP 4772819B2
Authority
JP
Japan
Prior art keywords
image data
pixel
histogram
registered
gray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008079366A
Other languages
English (en)
Other versions
JP2009169925A (ja
Inventor
志▲がん▼ 范
季▲りん▼ 李
亜棟 呉
波 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2009169925A publication Critical patent/JP2009169925A/ja
Application granted granted Critical
Publication of JP4772819B2 publication Critical patent/JP4772819B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索装置および画像検索方法に関する。
複写機、ファクシミリ装置、プリンターおよびこれらの機能を複数併せ持つ複合機などの画像形成装置では、入力された原稿画像などの画像データを大容量の記憶装置に記憶しておき、1度入力され、登録された画像データであればいつでも読み出して再出力することができる機能が備えられているものがある。
再出力できる機能は便利ではあるが、登録されるデータ量が多くなると再出力したいデータを探すことが困難になるため、複数の画像データの中から所望の画像データを検索する画像検索技術が重要となる。
従来の画像検索技術には、たとえばカラーヒストグラムおよびテクスチャに基づく画像検索方法、エッジ特徴を用いた画像検索方法などがある。
たとえば、特許文献1には、カラーとテクスチャとを組み合わせた画像検索方法が記載されており、画像データのカラー情報およびテクスチャ情報を用いて画像を描写している。特許文献2記載の画像検索装置および方法は、カラー情報および高さの割合などの基本的な幾何学的情報を用いて画像を描写している。
また、特許文献3には、顕著なエッジを用いた画像検索方法が記載されており、まず最初にエッジの検出および細線化を行い、その後最も強いエッジを選択し、選択したそれぞれのエッジに対して枝分かれ(フォーク)の比率、回転の頻度、コーナーの比率からなる3つの特徴量を抽出して特徴ベクトルを生成する。生成した特徴ベクトルを用いてマッチングを行い、入力画像と登録画像との類似性を算出している。
従来の画像検索方法では、カラーヒストグラムおよびテクスチャを使用して検索しており、特徴の大部分はカラー分布に依存している。カラー情報の特徴は、回転不変性(原稿読取時に原稿が原稿読取装置に傾斜して載置され読取られることにより生じる画像の回転が発生するが、回転した画像に対する画像検索の精度が維持できること)、スケール不変性(変倍や解像度変換された画像に対する画像検索の精度が維持できること)、軽度のオクリュージョン(カメラにより被写体を撮影して画像データを生成する際に、被写体に対する撮影角度により生じる隠れ領域)に対するロバスト(頑強性)を備えるが、カラー分布では、人間の視覚による概念上の特性を十分に反映することができない。したがって、実際には異なる画像であってもカラー分布のみを考慮すれば類似した画像というのは存在するので、カラー分布のみによる検索では不十分な可能性が高い。特に濃淡画像を対象にした場合、検索精度およびロバスト性を大きく低減および低下させることになる。その一方で、カラー分布が示す特徴は、検索速度に与える影響は大きい。
また、濃淡情報を用いた従来の画像検索方法では、回転およびオクリュージョンには対応しておらず、検索精度は低くなる。
中国特許第02100946.5号明細書 中国特許第200510067394.3号明細書 中国特許第03134425.9号明細書
本発明の目的は、回転およびオクリュージョンなどに対してロバスト性を高くすることができる画像検索装置および画像検索方法を提供することである。
本発明は、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索装置であって、
入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換するグレイ処理部と、
グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む8つの周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいて前記グレイ画像データの画素数分布を示すヒストグラムを生成するヒストグラム生成部と、
予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する検索部と、
検索部による検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示部とを備え、
前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータであり、
前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムであることを特徴とする画像検索装置である。
また本発明は、前記検索部は、前記ヒストグラム生成部が生成したヒストグラムを特徴ベクトルとし、予め登録された画像データの特徴ベクトルと、入力された画像データの特徴ベクトルとの相対的距離を算出し、算出された相対的距離に基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索することを特徴とする。
また本発明は、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索方法であって、
入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換するグレイ処理工程と、
グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む8つの周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいて前記グレイ画像データの画素数分布を示すヒストグラムを生成するヒストグラム生成工程と、
予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する検索工程と、
検索工程での検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示工程とを備え、
前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータであり、
前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムであることを特徴とする画像検索方法である。
本発明によれば、グレイ処理部が、入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換すると、ヒストグラム生成部が、前記グレイ画像データの画素数分布を示すヒストグラムを生成する。
詳細には、グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む複数の周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいてヒストグラムを生成する。
検索部が、予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索すると、表示部が、予め登録された画像データのうち入力された画像データに類似した画像データを表示する。
上記のように、局所パターンに基づいてヒストグラムを生成するので、回転不変、スケール不変の特徴量を用いることができ、回転および光オクリュージョンなどに対してロバスト性を高くすることができる。
また、前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータである。
これにより、容易に回転不変の特徴量を算出することが可能で、特徴量をバイトデータとして扱うことにより演算速度を高めることができる。
また、前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムである。
画像データ全体のヒストグラムを、画素群ごとの小領域のヒストグラムの結合によって生成するので、容易に画像データ全体のヒストグラムを生成することが可能で、小領域に分割したことにより演算速度を高めることができる。
また本発明によれば、前記検索部は、前記ヒストグラム生成部が生成したヒストグラムを特徴ベクトルとし、予め登録された画像データの特徴ベクトルと、入力された画像データの特徴ベクトルとの相対的距離を算出し、算出された相対的距離に基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する。
相対的距離を用いることで、容易に類似性を算出することが可能で、さらに検索精度を高めることができる。
本発明によれば、グレイ処理工程で、入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換すると、ヒストグラム生成工程で、前記グレイ画像データの画素数分布を示すヒストグラムを生成する。
詳細には、グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む複数の周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいてヒストグラムを生成する。
検索工程では、予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索すると、表示工程で、予め登録された画像データのうち入力された画像データに類似した画像データを表示する。
上記のように、局所パターンに基づいてヒストグラムを生成するので、回転不変、スケール不変の特徴量を用いることができ、回転および光オクリュージョンなどに対してロバスト性を高くすることができる。
また、前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータである。
これにより、容易に回転不変の特徴量を算出することが可能で、特徴量をバイトデータとして扱うことにより演算速度を高めることができる。
また、前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムである。
画像データ全体のヒストグラムを、画素群ごとの小領域のヒストグラムの結合によって生成するので、容易に画像データ全体のヒストグラムを生成することが可能で、小領域に分割したことにより演算速度を高めることができる。
以下図面を参考にして本発明の好適な実施形態を詳細に説明する。
図1は、画像検索装置10の機械的構成を示すブロック図である。画像検索装置10は、プロセッサ4と、プロセッサ4が実際の処理を行うためのソフトウェアなどを格納する外部記憶装置5とを含む。
プロセッサ4は、入力された画像データ(以下では「入力画像データ」という)と、予め登録されている複数の画像データ(以下では「登録画像データ」という)との照合を行い、入力画像データに類似の登録画像データを検索して表示する画像検索処理などを実際に行う。プロセッサ4における実際の処理は、外部記憶装置5に格納されるソフトウェアによって実行される。プロセッサ4は、たとえば通常のコンピュータ本体などで構成される。
外部記憶装置5は、たとえば高速アクセスが可能なハードディスクなどで構成することができる。外部記憶装置5は、登録画像データを大量に保持するために光ディスクなどの大容量デバイスを用いるような構成であっても構わない。また、画像照合中に各処理ステップの段階で作成された一時的なデータなどは、外部記憶装置5に記憶してもよいし、プロセッサ4に内蔵される半導体メモリに記憶してもよい。
画像検索装置10には、キーボード1が接続されるとともに、表示装置3が接続される。キーボード1は、各種ソフトウェアを実行するための指示の入力などに用いられる。
表示装置3は、入力画像データおよび登録画像データに基づく画像の表示、検索結果の表示などを行う。
画像検索装置10には、イメージスキャナ2がさらに接続される。イメージスキャナ2は、画像が印刷された原稿を読み取り、入力画像データを取り込むために用いられる。
入力画像データの取得は、イメージスキャナ2からの入力の他に通信I/F(インターフェイス)6を介して、ネットワーク上の他の装置からデータ通信により取得することもできる。通信I/F6は、LAN(Local Area Network)に接続するためのLANカードや、公衆交換電話網に接続してデータ通信を行うためのモデムカードなどで実現される。
図2は、画像検索装置10の機能的構成を示すブロック図である。
画像検索装置10は、入力部11、グレイ処理部12、ヒストグラム生成部13、距離算出部14、検索部15、表示部16および登録画像記憶部17を含んで構成される。
入力部11は、入力画像データ、登録画像データを入力する。図1に示したハードウェア構成のうち、イメージスキャナ2、通信I/F6などが機能的に入力部11に相当する。登録画像データは、入力画像データが入力されるより前に予め入力されていた画像データであり、登録画像記憶部17に記憶されている。
グレイ処理部12は、入力部11によって入力された入力画像データが、カラー画像データであった場合は、明度成分に基づくグレイ化を行い濃淡画像データに変換する。
図3は、グレイ処理部12による濃淡画像化処理を示すフローチャートである。
入力画像データが入力されると、ステップa1で入力された画像データがカラー画像データかどうかを判断する。カラー画像データであればステップa2に進み、カラー画像データでなければ、すなわち濃淡画像データであればステップa3に進む。ステップa2では、明度成分に基づいてグレイ化を行い濃淡画像データに変換する。
ステップa3では、濃淡画像データの階調数が多すぎるかどうかを判断する。濃淡画像データの階調数を所定の閾値と比較し、閾値以上であれば階調数が多すぎると判断してステップa4に進み、閾値未満であれば処理を終了する。
閾値となる階調数としては、画像データの大きさやプロセッサ4の処理能力などによるが、たとえば4階調程度に設定する。
ステップa4では、所定の階調数以下に階調数を低減する。グレイスケールの階調数を低減する方法として、画像の情報量の多くは画像の中間階調に存在するため、中間階調の階調値については階調数をわずかに低減させ、そうでない階調値については階調数を大幅に低減させることにより、階調数の低減による画像情報量の低下を抑えることができる。たとえば16階調画像を4階調画像に変換する場合、元階調値が0〜4のとき新たな階調値0に変換し、元階調値が5〜7のとき新たな階調値1に変換し、元階調値が8〜9のとき新たな階調値2に変換し、元階調値が10〜15のとき新たな階調値3に変換する。
グレイ処理部12によって所定の階調数よりも低階調のグレイ画像データが作成されると、ヒストグラム生成部13がグレイ画像データに基づいてヒストグラムを生成する。
まず、グレイ画像データに対して局所パターンの分析を行う。局所パターンとは、画像に含まれる局所的なテクスチャの分布を表すテクスチャオペレータ(演算子)である。
具体的な分析では、注目画素とその周辺の8つの周辺画素の画素値に基づいて分析を行う。図4に示すように8つの周辺画素N1〜N8は、注目画素Cを中心とする半径rの円周上に位置し、中心角を45度として円周を均等に8分割した位置にある画素である。なお、注目画素に対して、このような位置に周辺画素が存在しない場合は、双直線補間によって補間することが好ましい。
注目画素Cの画素値と周辺画素N1〜N8の画素値とをそれぞれ比較し、周辺画素の画素値が注目画素の画素値よりも大きい場合はレベル1が得られ、周辺画素の画素値が注目画素の画素値以下の場合はレベル0が得られる。このようにして、1つの注目画素に対して8つのレベル値が得られる。8つのレベル値はそれぞれ0か1の値を有するので、各レベル値をそれぞれ1ビットする8ビットからなる1バイトデータを作成する。
作成した1バイトデータに対して、注目画素を中心としたサークルシフトによるビットシフトを行い、以下の条件に合うようなデータに変更する。なお、サークルシフトは、最上位ビットの値と最下位ビットの値とが隣接した値であるものとするビットシフトで、最上位ビットの値をさらに上位にシフトすると、その値は最下位ビットにシフトし、最下位ビットの値をさらに下位にシフトすると、その値は最上位ビットにシフトする。
サークルシフトによって、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを左側に(上位側に)配置するとともに、最右端(最下位)ビットが1となるようにビットの並び替えを行う。
1バイトデータは、注目画素を中心とする円周上の周辺画素の特徴であり、局所的なテクスチャの情報を示す。そして、このような1バイトデータを所定の条件に整合するようにサークルシフトすることで、シフト後のデータは回転不変のテクスチャ情報を示すことになる。
注目画素を1画素ずつずらしながら上記のような分析を繰り返し、画像データを構成する全ての画素に対して1バイトデータが作成される。
さらに、シフト後のデータに対して、ビットの並びパターンに応じてそのパターンを示す特定の番号が割り当てられる。たとえば「00000001」の並びパターンには特定番号1が割り当てられ、「00000011」の並びパターンには特定番号2が割り当てられる。このような割り当てを行い、注目画素ごとに対応する1バイトデータと、1バイトデータのビット並びパターンに割り当てられた特定番号とから、注目画素に対して特定番号が付与される。
並びパターンに割り当てられる特定番号としては、上記のように並びパターンを8桁の数値であるとみなし、数値が小さい順に特定番号1,2,3・・・と割り当ててもよいし、特定番号を並びパターンと同じ数値として割り当ててもよい。
画像データを構成する全ての画素に対して特定番号が付与されると、画素ごとの特定番号に基づいて画像分割を行い、同じ特定番号を有する画素群である分割領域を複数作成する。
続いて複数作成された分割領域ごとに濃淡度のヒストグラムを作成する。画像分割された画像データは、グレイ画像データであるので、全ての画素は画素値として濃淡度(明度)を有する。1つの分割領域において、これに含まれる全ての画素の濃淡度を用いて濃淡度のヒストグラムを作成する。
ここで作成する分割領域ヒストグラムは、階級を濃淡度とし、度数を階級に含まれる画素数として作成する。階級は濃淡度の値をそのまま用いてもよいが、扱う画像データや階調数の設定によって階級が変化することになるので、階級を示す番号(階級番号)を設定し、階級番号に対して階級に含まれる濃淡度の範囲を予め設定する。階級番号に対する度数は、階級番号に設定された濃淡度の範囲内に含まれる画素数をカウントすればよい。
作成したヒストグラムをグラフとして可視化すると、たとえば図5に示すように横軸が階級番号であり、縦軸が画素数の度数分布グラフとなる。
なお本発明では、必ずしもヒストグラムをグラフ化して表示しなくとも後段の処理は可能であるが、表示部16でグラフ化したヒストグラムを表示するように構成してもよい。
全ての分割領域に対して分割領域ヒストグラムを作成し、各分割領域ヒストグラムが識別可能となるようにヒストグラム番号を付与し、全ての分割領域ヒストグラムを結合して1つのヒストグラムを作成する。ここで作成されるヒストグラムは、全ての分割領域の特徴を含むので、画像データ全体の特徴を示す全体ヒストグラムとして作成される。
各ヒストグラムは、特定番号に対応して作成されるので、ヒストグラム番号は、特定番号と同じ値を割り当ててもよく、ヒストグラム番号が重複しないようにすればよい。
図6は、全体ヒストグラム20のデータ構造を示す図である。
全体ヒストグラム20は、分割領域ヒストグラムごとに付与されたヒストグラム番号21、階級番号22、画素数23からなる。図6に示した例では、ヒストグラム番号が「1」の分割領域ヒストグラムのデータが、階級番号22の小さい順に上から記載され、ヒストグラム番号が「1」の分割領域ヒストグラムのデータが全て記載されると続いてヒストグラム番号が「2」の分割領域ヒストグラムのデータを全て記載し、このような記載を繰り返して、全ての分割領域のヒストグラムデータを記載する。
生成した全体ヒストグラム20を、入力された画像データの特徴ベクトルとして外部記憶装置5の所定の記憶領域に、画像データと関連付けて記憶する。
上記では、入力画像データに対するヒストグラムの生成および特徴ベクトルの算出について説明したが、登録画像記憶部17に記憶されている登録画像データについても、予め登録時に上記と同様の処理を行い、特徴ベクトルを算出し、各登録画像データと関連付けて記憶しておく。
距離算出部14は、予め登録画像記憶部17に記憶されている登録画像データに関連付けられた特徴ベクトル(登録特徴ベクトル)と、入力画像データに関連付けられた特徴ベクトル(入力特徴ベクトル)との相対的距離を算出する。2つの特徴ベクトルの相対的距離は、それぞれに関連付けられた画像データ同士の類似性を示す。2つの特徴ベクトルの相対的距離が小さければ画像データ同士の類似性が高く、相対的距離が大きければ類似性が低いものとみなすことができる。
2つの特徴ベクトルの相対的距離を算出する方法は、既存の方法を用いることができる。たとえば、入力特徴ベクトルをX、登録特徴ベクトルをYで表したとき、XとYの相対的距離Dは、以下に示す(1)式で算出できる。
Xi,Yiは、それぞれの特徴ベクトルのi番目の要素である。
(1)式による相対的距離Dの算出をさらに詳細に説明すると、図7に示すようなフローチャートで説明できる。
ステップb1では、算出の対象となる入力特徴ベクトルおよび登録特徴ベクトルを、外部記憶装置5から読み出し、それぞれの特徴ベクトルから対応する要素である画素数を取り出し、取り出した画素数の差の絶対値を算出する。対応する要素とは、図6に示したデータ構造に基づいて、一番上に記載された要素を1番目の要素とし、それぞれの特徴ベクトルから同じi番目の要素を取り出して、i番目の要素同士の差の絶対値を算出する。これを上から順に繰り返し、全ての要素について差の絶対値を算出する。
ステップb2では、算出した差の絶対値を、差を算出した要素同士の和で除算する。すなわち、i番目の要素同士の差の絶対値を、i番目の要素同士の和で割る。このような除算を全ての要素に対して行い、ステップb3で全ての除算値の総和を算出する。算出された総和が、入力特徴ベクトルと登録特徴ベクトルとの相対的距離となる。
次に、新たな登録特徴ベクトルを登録画像記憶部17から読み出して、上記と同様に入力特徴ベクトルと新たな登録特徴ベクトルとの相対的距離を算出する。登録されている全ての登録画像データに対する登録特徴ベクトルと、入力特徴ベクトルとの相対的距離が算出されると、検索部15で入力画像データに類似の登録画像データを検索する。
検索部15は、算出された全ての相対的距離を小さい順に並び替え、入力特徴ベクトルとの相対的距離が最も小さかった登録特徴ベクトルを決定し、決定した登録特徴ベクトルに関連付けられた登録画像データを最も類似度が高い登録画像データであるとし、検索結果とする。
入力特徴ベクトルとの距離が同距離の登録特徴ベクトルがあった場合は、利用者がいずれかの登録画像データを選択できるように、同距離となる複数の登録特徴ベクトルにそれぞれ関連づけられた複数の登録画像データを全て表示させることが好ましい。
検索結果としては、最も類似度が高い登録画像データのみではなく、相対的距離の小さい方から所定数の登録画像データを選択してこれを検索結果としてもよい。このように複数の登録画像データを検索結果とする場合は、選択した登録画像データと、これらの登録画像データ内での相対的距離に基づく類似度の順位とを検索結果に含む必要がある。
検索部15によって検索結果が出力されると、表示部16が検索結果を可視化した画像を表示する。
可視化した画像とは、たとえば図8の表示例に示すように、入力画像データに基づく画像30を画面左側に表示し、画面右側に検索結果表示領域31を設けて、検索結果表示領域31内に、検索結果として選択した登録画像データに基づく登録画像32を表示する。検索結果に複数の登録画像データが含まれるときは、類似度の順位に応じて登録画像を表示することが好ましい。
図8に示した例では、入力画像が回転して斜めに傾いた状態で入力されているにもかかわらず、検索結果としては、回転していない登録画像が検索されている。
また、カメラで撮影された画像を検索する場合に、登録画像における被写体を、異なる角度から撮影して得た画像を入力画像とした場合であっても、検索結果としては、同一の被写体が撮影された画像が検索されている。
本発明によれば以下のような効果が得られる。
グレイ処理した画像データに基づいて検索を行うので、カラーに関する情報が不要で、より適用範囲を広くすることができる。
局所パターンに基づいてヒストグラムを生成するので、回転不変、スケール不変の特徴量を用いることができ、回転および光オクリュージョンに対してロバスト性を高くすることができる。
局所パターンが、注目画素とその周辺画素とを含む微小な領域に基づいて算出されるので、高速処理が可能でありリアルタイム処理への適応に効果的である。
人間の視覚特性に応じた検索を行うことができるので、より精度の高い検索結果をえることができる。
本発明は、その精神または主要な特徴から逸脱することなく、他のいろいろな形態で実施できる。したがって、前述の実施形態はあらゆる点で単なる例示に過ぎず、本発明の範囲は特許請求の範囲に示すものであって、明細書本文には何ら拘束されない。さらに、特許請求の範囲に属する変形や変更は全て本発明の範囲内のものである。
画像検索装置10の機械的構成を示すブロック図である。 画像検索装置10の機能的構成を示すブロック図である。 グレイ処理部12による濃淡画像化処理を示すフローチャートである。 注目画素Cと8つの周辺画素N1〜N8の位置関係を示す図である。 作成したヒストグラムを可視化したグラフの例を示す図である。 全体ヒストグラム20のデータ構造を示す図である。 相対的距離Dの算出処理を示すフローチャートである。 検索結果の表示例を示す図である。
符号の説明
1 キーボード
2 イメージスキャナ
3 表示装置
4 プロセッサ
5 外部記憶装置
10 画像検索装置
11 入力部
12 グレイ処理部
13 ヒストグラム生成部
14 距離算出部
15 検索部
16 表示部
17 登録画像記憶部

Claims (3)

  1. 予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索装置であって、
    入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換するグレイ処理部と、
    グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む8つの周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいて前記グレイ画像データの画素数分布を示すヒストグラムを生成するヒストグラム生成部と、
    予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する検索部と、
    検索部による検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示部とを備え、
    前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータであり、
    前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムであることを特徴とする画像検索装置。
  2. 前記検索部は、前記ヒストグラム生成部が生成したヒストグラムを特徴ベクトルとし、予め登録された画像データの特徴ベクトルと、入力された画像データの特徴ベクトルとの相対的距離を算出し、算出された相対的距離に基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索することを特徴とする請求項1記載の画像検索装置。
  3. 予め登録された画像データの中から、入力された画像データに類似した画像データを検索する画像検索方法であって、
    入力された画像データおよび予め登録された画像データの濃淡度に基づいてグレイ画像データに変換するグレイ処理工程と、
    グレイ画像データを構成する各画素の1つを注目画素とし、注目画素の濃淡度と、注目画素を略円周状に取り囲む8つの周辺画素の濃淡度とに基づいて、注目画素を中心とする局所的なテクスチャの特徴を示す回転不変の特徴量を、各画素に対して算出し、算出した特徴量に基づいて前記グレイ画像データの画素数分布を示すヒストグラムを生成するヒストグラム生成工程と、
    予め登録された画像データのヒストグラムと、入力された画像データのヒストグラムとに基づいて、予め登録された画像データの中から、入力された画像データに類似した画像データを検索する検索工程と、
    検索工程での検索結果に基づいて、予め登録された画像データのうち入力された画像データに類似した画像データを表示する表示工程とを備え、
    前記回転不変の特徴量は、注目画素の濃淡度と8つの周辺画素の濃淡度とをそれぞれ比較して周辺画素ごとの比較結果を2値の論理値で表すとともに8つの周辺画素の並び順に応じて比較結果の論理値をビットとして並べることで得られるバイトデータの各ビット値を、1バイトデータ中で、連続する0の長さのうち最も長いものを検出し、これを上位側に配置するとともに、最下位ビットが1となるようにサークルシフトを行ったデータであり、
    前記ヒストグラムは、前記回転不変の特徴量におけるビット値の並びパターンを画素ごとに特定し、前記グレイ画像データを同じ並びパターンである画素からなる画素群に分割し、画素群ごとに、画素群に含まれる画素の濃淡度を階級とし階級に含まれる画素数を度数とするヒストグラムを作成し、画素群ごとに作成したヒストグラムを結合することで生成されるヒストグラムであることを特徴とする画像検索方法。
JP2008079366A 2008-01-14 2008-03-25 画像検索装置および画像検索方法 Active JP4772819B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2008100007077A CN101488129B (zh) 2008-01-14 2008-01-14 图像检索装置及图像检索方法
CN200810000707.7 2008-01-14

Publications (2)

Publication Number Publication Date
JP2009169925A JP2009169925A (ja) 2009-07-30
JP4772819B2 true JP4772819B2 (ja) 2011-09-14

Family

ID=40891025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008079366A Active JP4772819B2 (ja) 2008-01-14 2008-03-25 画像検索装置および画像検索方法

Country Status (3)

Country Link
US (1) US20090180690A1 (ja)
JP (1) JP4772819B2 (ja)
CN (1) CN101488129B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085802A (ja) * 2012-10-23 2014-05-12 Pioneer Electronic Corp 特徴量抽出装置、特徴量抽出方法及びプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324759B (zh) * 2013-07-05 2016-05-18 易翔 一种瓷砖智能识别设备
CN103324753B (zh) * 2013-07-08 2016-03-23 刘广海 基于共生稀疏直方图的图像检索方法
CN103530406B (zh) * 2013-10-25 2017-07-28 武汉泰迪智慧科技有限公司 基于纹理内容的旋转图像搜索方法
CN104504679A (zh) * 2014-11-19 2015-04-08 国家电网公司 基于典型缺陷图谱的红外缺陷在线分析方法
CN105512175B (zh) * 2015-11-23 2019-01-29 东莞市凡豆信息科技有限公司 一种基于颜色特征和纹理特征的快速图像检索方法
WO2017139151A1 (en) 2016-02-11 2017-08-17 Carrier Corporation Video searching using multiple query terms
CN111080665B (zh) * 2019-12-31 2023-06-09 歌尔光学科技有限公司 图像边框识别方法、装置、设备和计算机存储介质
CN113537392B (zh) * 2021-08-06 2023-10-03 数贸科技(北京)有限公司 相似图像的识别方法、装置、计算设备及计算机存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4267573A (en) * 1978-06-14 1981-05-12 Old Dominion University Research Foundation Image processing system
JPH06261210A (ja) * 1993-03-05 1994-09-16 Mitsubishi Electric Corp しきい値決定方法
JP4127730B2 (ja) * 1998-06-29 2008-07-30 株式会社東芝 パターン認識装置及び方法
US6788818B1 (en) * 2000-04-15 2004-09-07 Microsoft Corporation System and process for optimizing false alarm probability for histogram matching
KR100788643B1 (ko) * 2001-01-09 2007-12-26 삼성전자주식회사 색과 질감의 조합을 기반으로 하는 영상 검색 방법
WO2004051575A1 (ja) * 2002-12-05 2004-06-17 Seiko Epson Corporation 特徴領域抽出装置、特徴領域抽出方法および特徴領域抽出プログラム
JP2004192307A (ja) * 2002-12-11 2004-07-08 Seiko Epson Corp 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム
US20050234896A1 (en) * 2004-04-16 2005-10-20 Nobuyuki Shima Image retrieving apparatus, image retrieving method and image retrieving program
JP2005352543A (ja) * 2004-06-08 2005-12-22 Nikon Corp テンプレートマッチング装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085802A (ja) * 2012-10-23 2014-05-12 Pioneer Electronic Corp 特徴量抽出装置、特徴量抽出方法及びプログラム

Also Published As

Publication number Publication date
CN101488129B (zh) 2011-04-13
US20090180690A1 (en) 2009-07-16
CN101488129A (zh) 2009-07-22
JP2009169925A (ja) 2009-07-30

Similar Documents

Publication Publication Date Title
JP4772819B2 (ja) 画像検索装置および画像検索方法
JP2776295B2 (ja) 画像インデックス生成方法及び画像インデックス生成装置
JP4729601B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP5188334B2 (ja) 画像処理装置、画像処理方法およびプログラム
US8805077B2 (en) Subject region detecting apparatus
JP2001109895A (ja) 複数のディジタル画像の処理方法
JP4535584B2 (ja) ディジタル画像処理方法
AU2011250827B2 (en) Image processing apparatus, image processing method, and program
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP4993615B2 (ja) 画像認識方法および装置
JP5747733B2 (ja) 対象検出装置、対象検出方法、分類器作成装置及び分類器作成方法
EP2782065A1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
JP2018206252A (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
JP4867620B2 (ja) 画像処理装置及び画像処理プログラム
JP2011199871A (ja) 原稿傾き判定装置、原稿傾き判定方法、プログラムおよびその記録媒体
EP2966613A1 (en) Method and apparatus for generating a super-resolved image from an input image
JP4756436B2 (ja) パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2018206260A (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
JP6006675B2 (ja) マーカ検出装置、マーカ検出方法、及びプログラム
JP6478301B2 (ja) 画像判別装置、画像判別方法、及びプログラム
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
JP5157848B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体
JP2018156544A (ja) 情報処理装置及びプログラム
CN111597375A (zh) 基于相似图片组代表特征向量的图片检索方法及相关设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110622

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4772819

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150