JPWO2009031297A1 - 画像検索装置、画像分類装置及び方法並びにプログラム - Google Patents

画像検索装置、画像分類装置及び方法並びにプログラム Download PDF

Info

Publication number
JPWO2009031297A1
JPWO2009031297A1 JP2009531120A JP2009531120A JPWO2009031297A1 JP WO2009031297 A1 JPWO2009031297 A1 JP WO2009031297A1 JP 2009531120 A JP2009531120 A JP 2009531120A JP 2009531120 A JP2009531120 A JP 2009531120A JP WO2009031297 A1 JPWO2009031297 A1 JP WO2009031297A1
Authority
JP
Japan
Prior art keywords
image
feature amount
search
classification
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009531120A
Other languages
English (en)
Other versions
JP4948607B2 (ja
Inventor
大樹 工藤
大樹 工藤
嘉明 加藤
嘉明 加藤
西川 博文
博文 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2009531120A priority Critical patent/JP4948607B2/ja
Publication of JPWO2009031297A1 publication Critical patent/JPWO2009031297A1/ja
Application granted granted Critical
Publication of JP4948607B2 publication Critical patent/JP4948607B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

検索キー画像から特徴量を抽出する特徴量抽出部106と、検索対象の画像の特徴量と検索キー画像の特徴量との距離を算出する距離算出部107と、距離算出部107で算出された距離を解析して、検索キー画像に類似した特徴を与える特徴量を画像検索に有効な特徴量として選別する距離解析部108と、画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に検索対象の画像を配置し、この特徴量空間内から検索キー画像に類似する画像を検索する検索実行部109とを備える。

Description

この発明は、画像検索装置、画像分類装置、これら装置による画像検索方法、画像分類方法及び上記装置としてコンピュータを機能させるプログラムに関するものである。
従来では、画像の検索や分類を行うにあたり、画像毎に関連付けたキーワードを用いる方法が一般的であった。しかしながら、この方法は、検索や分類対象となる画像データが大量にある場合、その全ての画像にキーワードを設定しなければならない。このため、画像の検索や分類を行えるまでに膨大な時間や労力を必要としていた。また、検索キーワードに一致するキーワードに関連付けられた画像が一覧として抽出されるだけであるので、所望の画像がどれであるのかを判別しにくいという欠点もあった。
このような従来の不具合を解消する技術として、例えば特許文献1に開示される方法がある。この方法では、画像データの特徴量に対するクラスタリングの結果を基に画像を分類する。このようにすることで、キーワードのような外的基準を設定することなく、関連性の高い画像データ同士が同一のクラスタに分類される。なお、画像から抽出される特徴量としては、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態などが挙げられている。
また、特許文献2では、画像から抽出した特徴量を主成分分析し、2次元の特徴量を2軸とした距離空間内の点とみなして各画像を複数個のクラスタ群にクラスタリングして、このクラスタリング情報を用いて検索結果の画像に関する表示位置や表示サイズを決定する。これにより、キーワードのような外的基準を設定することなく、検索画像を表示装置の画面上に一覧表としてユーザに提示することができる。この方法によれば、対象画像に類似する画像の検索要求があった場合、対象画像から特徴量を抽出して主成分分析を行い、この特徴量を2軸とした距離空間内に配置することで類似画像を提示できる。
特開2001−256244号公報 特開2005−235041号公報
従来の方法では、画像の特徴量に対するクラスタリングが行われるが、その特徴量が真にユーザが所望する画像に対応するものであるか否かが不明であり、ユーザが意図する検索又は分類結果が的確に得られない可能性があるという課題があった。
例えば、特許文献1では、画像から抽出した特徴量をどのように用いてクラスタリングするのか詳細に開示されていない。また、ある画像に類似する画像を探索するユーザ要求があった場合、分類結果の画像をどのように用いて、どのクラスタの画像をユーザに提示するのか、という方法が述べられていない。このため、必ずしも有効な検索又は分類結果が得られるとは限らない。
また、特許文献2では、画像から様々な種類の特徴量が抽出されるところ、主成分分析を行った結果の特徴量の次元軸がどのような意味を持つのか、またこれを用いた分類がユーザにとって有効なものであるか明確に記載されていない。このため、必ずしも有効な検索又は分類結果が得られるとは限らない。
この発明は、上記のような課題を解決するためになされたもので、画像の検索や分類に有効な特徴量を選別してユーザの意図する分類又は検索結果を的確かつ迅速に得ることができる画像検索装置、画像分類装置、これら装置による画像検索方法、画像分類方法及び上記装置としてコンピュータを機能させるプログラムを得ることを目的とする。
この発明に係る画像検索装置は、検索対象の画像を蓄積する画像蓄積部と、検索対象の画像の特徴量を蓄積する特徴量蓄積部と、検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部と、検索キーとなる画像から特徴量を抽出する特徴量抽出部と、特徴量蓄積部に蓄積された検索対象の画像の特徴量と検索キーとなる画像の特徴量との距離を算出する距離算出部と、距離算出部で算出された距離を解析して、検索キーとなる画像に類似した特徴を与える検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部と、画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に検索対象の画像を配置し、この特徴量空間内から検索キーとなる画像に類似する画像を検索する検索実行部とを備えるものである。
この発明によれば、検索対象の画像を蓄積する画像蓄積部と、検索対象の画像の特徴量を蓄積する特徴量蓄積部と、検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部と、検索キーとなる画像から特徴量を抽出する特徴量抽出部と、特徴量蓄積部に蓄積された検索対象の画像の特徴量と検索キーとなる画像の特徴量との距離を算出する距離算出部と、距離算出部で算出された距離を解析して、検索キーとなる画像に類似した特徴を与える検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部と、画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に検索対象の画像を配置し、この特徴量空間内から検索キーとなる画像に類似する画像を検索する検索実行部とを備えるので、検索対象の画像から抽出した特徴量から画像検索に有効な特徴量を選別し、この特徴量の主成分分析結果を用いて構築された特徴量空間で画像検索を実行することから、ユーザの意図する検索結果を的確かつ迅速に得ることができるという効果がある。
この発明で用いる検索用画像データを作成する検索用データ作成装置の構成を示すブロック図である。 図1中の検索用データ作成装置による処理の流れを示すフローチャートである。 この発明の実施の形態1による画像検索装置の構成を示すブロック図である。 図3中の画像検索装置による画像検索処理の流れを示すフローチャートである。 検索キー画像特徴量と蓄積特徴量との距離の一例を示す図である。 特徴量の主成分データを用いた2次元の特徴量空間で画像検索した結果を示す図である。 特徴量の主成分データを用いた2次元の特徴量空間で画像検索した他の例を示す図である。 この発明の実施の形態2による画像検索装置の構成を示すブロック図である。 図8中の画像検索装置による検索処理の流れを示すフローチャートである。 この発明の実施の形態3による画像分類装置の構成を示すブロック図である。 図10中の画像分類装置による画像分類処理の流れを示すフローチャートである。 特徴量の主成分データを用いた2次元の特徴量空間で画像分類した結果を示す図である。 この発明の実施の形態4による画像分類装置の構成を示すブロック図である。 図13中の画像分類装置による画像分類処理の流れを示すフローチャートである。
以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について添付した図に従って説明する。
実施の形態1.
図1は、この発明で用いる検索用画像データを作成する検索用データ作成装置の構成を示すブロック図である。図1において、この検索用データ作成装置は、画像蓄積部101、特徴量蓄積部102、主成分蓄積部103、特徴量抽出部104及び特徴量分析部105を備える。画像蓄積部101は、画像データを蓄積する記憶部である。特徴量蓄積部102は、上記画像データの特徴量を蓄積する記憶部である。主成分蓄積部103は、上記画像データの特徴量の主成分分析の結果を蓄積する記憶部である。
特徴量抽出部104は、上記検索対象の画像データの特徴量を抽出する。ここで抽出される画像の特徴量としては、例えば色ヒストグラム、色の大まかな配置、周波数成分、テクスチャ及びその配置、画像内のオブジェクトの形状などが挙げられる。なお、特徴量の具体例としては、参考文献1に記載されるEdge Histogramが挙げられる。これは、ローカルエッジ情報をヒストグラム化したものであり、テクスチャの配置とその量に関する特徴量に相当する。
参考文献1;映像情報メディア学会誌 Vol.56,No.11,pp.1711-1714(2002)
特徴量分析部105は、上記検索対象の画像データの特徴量の主成分分析を行う。主成分分析は多変量解析手法の一種であり、多変量の測定値が得られたとき、線形変換によって変量間の相関をなくし、より少ない変量によって対象の特徴を記述しようとする手法である。
上述した特徴量抽出部104及び特徴量分析部105は、本発明の趣旨に従う特徴量抽出/分析用プログラムを、コンピュータに読み込ませてその動作を制御することにより、当該コンピュータ上にソフトウエアとハードウェアが協働した具体的な手段として実現することができる。
また、画像蓄積部101、特徴量蓄積部102及び主成分蓄積部103は、上記コンピュータに搭載された記憶装置の記憶領域上に構築してもよく、特徴量抽出部104及び特徴量分析部105からデータ通信可能な外部データサーバの記憶装置の記憶領域上に構築してもよい。
次に検索用画像データを作成する処理について説明する。
図2は、図1中の検索用データ作成装置による処理の流れを示すフローチャートであり、この図に沿って検索用画像データを作成する処理の詳細を説明する。
先ず、装置外部から入力された検索対象の画像データは、画像蓄積部101に入力される。ここでは、例えばm枚の画像のデータが入力されたものとする。このとき、同時に、特徴量抽出部104は、画像蓄積部101に蓄積される画像データを入力し(ステップST1)、これら画像データの特徴量を抽出する(ステップST2)。
特徴量抽出部104は、上記画像データから抽出した特徴量を特徴量蓄積部102に蓄積する。なお、上記検索対象の画像データとその特徴量とが関連付けられて特徴量蓄積部102に蓄積される。また、以降では、画像蓄積部101に蓄積された画像データを蓄積画像と呼び、特徴量蓄積部102に蓄積された上記蓄積画像の特徴量を蓄積特徴量と適宜呼ぶこととする。
ステップST2において、特徴量抽出部104は、様々なユーザの意図に対応するために、上記蓄積画像から複数の特徴量を算出する。ここでは、n個の特徴量を抽出することとする。次に、特徴量分析部105は、特徴量抽出部104によってm枚の蓄積画像から抽出されたn個の特徴量を入力し、n個の特徴量それぞれについて主成分分析を行う(ステップST3)。なお、上記特徴量は、複数個の変量を持つことが多い。
例えば、Edge Histogramは、80個の変量を持つ。ある特徴量がk個の変量を持つとし、この変量をxi(i=1,2,3,・・・,k)とする。このxiについて主成分分析を行う。主成分Zi(i=1,2,3,・・・,k)は、下記式(1)に示す連立方程式で表すことができる。k個の変量x1,x2,・・・,xkが全て同じ単位であるとき、この連立方程式は、分散共分散行列を利用して固有値を求めることで解くことができる。単位が異なる場合は相関行列を用いればよい。
Figure 2009031297
また、主成分分析は、複数の特徴量を用いて行うことも可能である。例えば、k1個とk2個の変量を持つ特徴量を用いて、主成分Zi(i=1,2,3,・・・,k1+k2)を算出することも可能である。n個の特徴量からi個選ぶ組み合わせは、下記式(2)で示すようにA個あるため、主成分分析の結果の数は最大でB個である。実際に複数個の特徴量から主成分分析を行うか否かは、適用するアプリケーションを考慮して決める。特徴量分析部105は、上述のようにして求めた各特徴量若しくは複数の特徴量の主成分分析の結果である主成分Ziを、その特徴量及び上記検索対象の画像データに関連付けてそれぞれ主成分蓄積部103に蓄積する。
Figure 2009031297
図3は、この発明の実施の形態1による画像検索装置の構成を示すブロック図である。以降では、実施の形態1の画像検索装置によって検索キーとなる画像(以下、検索キー画像と呼ぶ)に類似する画像を検索する場合を示す。図3において、この実施の形態1による画像検索装置は、画像蓄積部101、特徴量蓄積部102、主成分蓄積部103、特徴量抽出部106、距離算出部107、距離解析部108、検索実行部109及び検索結果表示部110を備える。
特徴量抽出部106は、装置外部から入力された検索キー画像の特徴量(以下、検索キー画像特徴量と呼ぶ)を抽出する。この特徴量抽出部106により抽出される特徴量は、図1に示す検索用データ作成装置の特徴量抽出部104によって抽出された特徴量と同一の特徴量を抽出する。例えば、特徴量抽出部104によって蓄積画像から特徴量として色ヒストグラム、色の大まかな配置、周波数成分、テクスチャ及びその配置、画像内のオブジェクトの形状が抽出されていた場合、特徴量抽出部106も検索キー画像から色ヒストグラム、色の大まかな配置、周波数成分、テクスチャ及びその配置、画像内のオブジェクトの形状が抽出される。
距離算出部107は、検索キー画像特徴量と特徴量蓄積部102に蓄積される蓄積特徴量との距離(以下、キー間特徴量距離と呼ぶ)を算出する。ここで、キー間特徴量距離が小さくなるにつれて、その蓄積画像は検索キー画像に類似し、キー間特徴量距離が大きくなるにつれて、その蓄積画像は検索キー画像に類似しなくなる。
距離解析部108は、キー間特徴量距離を解析し画像検索に有効な特徴量を選択する。ここで、画像検索に有効な特徴量とは、大量の画像から検索キー画像に類似しない画像を多く振るい落とせる特徴量であり、検索キー画像に類似した特徴を与える特徴量である。例えば、キー間特徴量距離の分布関数を特徴量毎に求め、これら分布関数の特性を示す解析値をそれぞれ算出し、これら解析値をそれぞれ比較してキー間特徴量距離が最も小さい場合に対応する解析値が得られた分布関数の特徴量を画像検索に最も有効な特徴量として選択する。
また、距離解析部108は、最も有効な特徴量の次にキー間特徴量距離が小さい場合に対応する解析値が得られた分布関数の特徴量を2番目に有効な特徴量(次点の特徴量)とし、その次に小さい場合に対応する解析値が得られた分布関数の特徴量を3番目に有効な特徴量とする。このように、画像検索に有効な特徴量として選別された特徴量に対し、検索キー画像との類似度合いに応じて有効な順に順位を付けて距離解析結果とする。
検索実行部109は、距離解析部108で選択された有効な特徴量の主成分データを利用して検索キー画像に類似する画像を検索する。検索結果表示部110は、検索実行部109による検索結果の画像データや画像蓄積部101から読み出された蓄積画像データを表示画面上に表示する。
上述した特徴量抽出部106、距離算出部107、距離解析部108、検索実行部109及び検索結果表示部110は、本発明の趣旨に従う画像検索用プログラムを、コンピュータに読み込ませてその動作を制御することにより、当該コンピュータ上にソフトウエアとハードウェアが協働した具体的な手段として実現することができる。
また、画像蓄積部101、特徴量蓄積部102及び主成分蓄積部103は、上記コンピュータに搭載された記憶装置の記憶領域上に構築してもよく、距離算出部107、検索実行部109及び検索結果表示部110からデータ通信可能な外部データサーバの記憶装置の記憶領域上に構築してもよい。なお、図3において、図1と同一の構成要素には同一符号を付して説明を省略する。
次に画像検索処理について説明する。
図4は、図3中の画像検索装置による画像検索処理の流れを示すフローチャートであり、図3及び図4を用いて処理の詳細を説明する。
先ず、特徴量抽出部106は、装置外部から検索キー画像を入力(ステップST1a)し、この検索キー画像から特徴量を抽出する(ステップST2a)。ここで抽出される特徴量は、図1に示す検索用データ作成装置の特徴量抽出部104によって抽出され、特徴量蓄積部102に蓄積された特徴量と同一の特徴量を抽出する。
次に、距離算出部107は、特徴量抽出部106から検索キー画像特徴量を入力すると、この特徴量の種別に対応する蓄積特徴量を特徴量蓄積部102に要求する。続いて、距離算出部107は、上記要求に応じて特徴量蓄積部102から読み出された蓄積特徴量と検索キー画像特徴量とのキー間特徴量距離を算出する(ステップST3a)。ここでは、m枚の蓄積画像とn個の特徴量があるため、(m×n)個のキー間特徴量距離が算出される。
図5は、特徴量毎の蓄積画像とキー間特徴量距離の一例を示す図であり、特徴量がA,B,C,Dのn=4である場合を示している。図5において、例えば蓄積画像1の特徴量Aと検索キー画像の特徴量Aとのキー間特徴量距離は、0.436026であり、蓄積画像2の特徴量Bと検索キー画像の特徴量Bとのキー間特徴量距離は、0.112947である。このような特徴量間の距離算出方法は、特徴量ごと(特徴量の種別ごと)に様々ある。前述のEdge Histogramでは、参考文献1に記載されるように各ヒストグラムビンの差分絶対値和を用いて特徴量距離を算出する。
続いて、距離解析部108は、距離算出部107で算出されたキー間特徴量距離を解析して、画像検索に有効な特徴量を選択する(ステップST4a)。特徴量距離の解析方法としては、例えば特徴量距離毎に分布関数を求め、この分布関数の特性を示す解析値として平均と分散を用いる方法が挙げられる。図5の場合、特徴量A〜Dについて、各蓄積画像1,2,・・・,mに対するそのキー間特徴量距離の分布関数がそれぞれ求められる。
検索キー画像とそれ以外の大量の蓄積画像とのそれぞれの特徴量距離が正の値(前述のテクスチャ記述子のEdge Histogramでは、各変量のL1ノルム和を用いることが多く、必ず正の値になる)である場合、キー間特徴量距離は対数正規分布になると考えられる。この対数正規分布での平均値が高いということは、キー間特徴量距離が大きいことを意味するので、検索キー画像に類似する画像が少ないということになる。
一方、平均値が低い場合、キー間特徴量距離が小さいので、検索キー画像に類似する画像が多いということになる。また、キー間特徴量距離の対数正規分布における分散値が低い場合、対数正規分布関数の平均値付近で多くのデータ(ここでは、キー間特徴量距離)が集中していることを意味する。
従って、ある特徴量の対数正規分布においてキー間特徴量距離の平均値が非常に高くかつ分散値も高い場合、この対数正規分布に対応する特徴量は、検索キー画像に類似しない画像の特徴に対応するものであり、画像検索に有効でない。反対に、ある特徴量の対数正規分布においてキー間特徴量距離の平均値が低くかつ分散値も低い場合、この対数正規分布に対応する特徴量は、検索キー画像に類似する画像の特徴に対応する。この特徴量は、大量の蓄積画像から検索キー画像に類似しない蓄積画像をより多く振るい落とす特徴量であると考えられ、画像検索に有効な特徴量であると言える。
距離解析部108では、キー間特徴量距離の対数正規分布関数を特徴量毎に求め、これら分布関数の特性を示す解析値である平均値及び分散値をそれぞれ算出する。そして、分布関数ごとの平均値及び分散値をそれぞれ比較して、キー間特徴量距離が最も小さい場合に対応する平均値及び分散値の最小値が得られた分布関数の特徴量を、画像検索に最も有効な特徴量として選択する。
また、距離解析部108は、最も有効な特徴量が得られた分布関数の平均値及び分散値の次に低い平均値及び分散値が得られた分布関数の特徴量を2番目に有効な特徴量とし、この次に低い平均値及び分散値が得られた分布関数の特徴量を3番目に有効な特徴量とする。このようにして、距離解析部108は、画像検索に有効な特徴量として選択された特徴量に対して有効な順に順位を付けて距離解析結果とする。
なお、距離解析部108による特徴量距離解析(有効な特徴量の選別)については、上述した分布関数を使う以外の方法を用いても構わない。
検索実行部109は、距離解析部108から距離解析結果として選別された画像検索に有効な特徴量を指定する情報を入力すると、この画像検索に有効な特徴量の主成分データを主成分蓄積部103に要求すると共に、この画像検索に有効な特徴量を特徴量蓄積部102に要求する。続いて、検索実行部109は、上記要求に応じて主成分蓄積部103から読み出された画像検索に有効な特徴量の主成分データを入力し、上記要求に応じて特徴量蓄積部102から読み出された画像検索に有効な特徴量を入力して、これらデータを利用して実際に検索キー画像に類似する画像を検索する(ステップST5a)。
図6は、特徴量の主成分データを用いた2次元の特徴量空間で画像検索した結果を示す図であり、特徴量の第1主成分Z1を横軸、第2主成分Z2を縦軸としている。また、図6において、白丸記号は、検索キー画像の特徴量の主成分値を示しており、黒丸記号は、主成分蓄積部103から読み出した画像検索に有効な特徴量の主成分値を示している。
検索実行部109は、図6に示すように、画像検索に有効な特徴量の第1主成分Z1及び第2主成分Z2を用いた2次元の特徴量空間において、蓄積画像の特徴量と、検索キー画像のマッピングを行う。このようにして得られた2次元の検索空間において、検索実行部109は、検索キー画像のポイントから距離dthの範囲内の画像を検索キー画像に類似する画像と判定し、検索結果として検索結果表示部110に出力する。図6の例では、5つの蓄積画像が検索キー画像に類似する画像と判定されている。
また、図6では、予め設定されたdthで規定される範囲内の画像を検索したが、検索キー画像に類似する画像として抽出する画像の枚数jを予め決めておくことで、dthで規定される抽出範囲を徐々に変更してもよい。
さらに、特徴量の主成分データを用いた特徴量空間は、下記のように構築してもよい。
図7は、特徴量の主成分データを用いた2次元の特徴量空間で画像検索した結果を示す図であり、最も有効な特徴量の第1主成分を横軸、次点(2番目)に有効な特徴量の第1主成分を縦軸としている。また、図7において、白丸記号は、検索キー画像の特徴量の主成分値を示しており、黒丸記号は、主成分蓄積部103から読み出した画像検索に有効な特徴量の主成分値を示している。
検索実行部109は、図7に示すように画像検索に最も有効な特徴量の第1主成分及び2番目に有効な特徴量の第1主成分を用いた2次元の特徴量空間において、蓄積画像の特徴量と、検索キー画像のマッピングを行う。このようにして得られた2次元の特徴量空間で、検索実行部109は、図6と同様に、検索キー画像のポイントから距離dthの範囲内の画像を検索キー画像に類似する画像と判定してもよく、枚数を決めて検索キー画像に類似する画像を判定してもよい。
また、検索実行部109は、予め複数個の特徴量の主成分分析を行っている場合、それを利用しても良い。
さらに、検索実行部109は、画像検索に有効な特徴量の主成分を用いた3次元空間あるいは多次元空間の検索空間を構築して画像検索を行ってもよい。
検索結果表示部110は、検索実行部109から検索結果の画像を指定する情報を入力すると、この情報で指定された画像を画像蓄積部101に要求する。次に、検索結果表示部110は、上記要求に応じて画像蓄積部101から読み出された画像データを入力し、表示画面上に表示する(ステップST6a)。検索結果の画像を表示する場合、検索に使用した特徴量空間とともに表示するようにしてもよい。
例えば、図6に示した2次元の特徴量空間に検索キー画像及びこれに類似する画像の各特徴量の主成分に相当するポイントに画像のサムネイルを配置する。また、蓄積画像の特徴量と検索キー画像をマッピングした特徴量空間が3次元であれば、3次元の特徴量空間に画像をサムネイル表示してもよい。
以上のように、この実施の形態1によれば、検索対象の画像を蓄積する画像蓄積部101と、検索対象の画像の特徴量を蓄積する特徴量蓄積部102と、検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部103と、検索キー画像から特徴量を抽出する特徴量抽出部106と、特徴量蓄積部102に蓄積された検索対象の画像の特徴量と検索キー画像の特徴量との距離を算出する距離算出部107と、距離算出部107で算出された距離を解析して、検索キー画像に類似した特徴を与える検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部108と、画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に検索対象の画像を配置し、この特徴量空間内から検索キー画像に類似する画像を検索する検索実行部109とを備えるので、画像検索に有効な特徴量が選別されることから、画像検索の精度を高めることができる。
また、この実施の形態1によれば、検索実行部109の検索結果を特徴量空間内に配置して表示画面上に表示する検索結果表示部110を備えたので、検索キー画像に類似した画像を整理された形で閲覧することが可能である。
さらに、この実施の形態1によれば、距離解析部108が、検索キー画像に類似する度合いに応じて画像検索に有効な特徴量に対して有効さの順位付けを行い、検索実行部109が、距離解析部108により順位付けられた画像検索に有効な特徴量を用いて検索キー画像に類似する画像を検索するので、有効さの順位に応じて様々な画像検索結果を得ることができる。
実施の形態2.
図8は、この発明の実施の形態2による画像検索装置の構成を示すブロック図である。図8において、実施の形態2による画像検索装置は、上記実施の形態1の図3で示した画像蓄積部101、特徴量蓄積部102、主成分蓄積部103、特徴量抽出部106、距離算出部107、距離解析部108及び検索結果表示部110に加え、検索実行部111及びユーザ入力部112を備える。検索実行部111は、距離解析部108で選択された有効な特徴量の主成分データを利用して検索キー画像に類似する画像を検索するとともに、ユーザ入力部112を通じて入力されたユーザ要求に応じた画像検索を実行する。
ユーザ入力部112は、ユーザが装置外部から情報の入力や選択設定を行うための構成要素であり、実施の形態2による画像検索装置として機能するコンピュータが実行するソフトウエアとディスプレイやマイク等のハードウェアとが協働した具体的な手段として実現される。例えば、リモコン操作に連動する設定画面をディスプレイに表示して情報の入力や選択等の操作のためのGUI(Graphical User Interface)を提供する。なお、図8において、図3と同一構成要素には同一符号を付して説明を省略する。
次に動作について説明する。
図9は、図8中の画像検索装置による検索処理の流れを示すフローチャートであり、図8及び図9を用いて処理の詳細を説明する。
先ず、検索キー画像を入力して検索結果を最初に表示画面上に表示する、ステップST1bからステップST6bまでの処理は、上記実施の形態1で示した図4のステップST1aからステップST6aまでの処理と同様である。ステップST6bの処理で検索結果が表示されている間、検索実行部111は、ユーザ入力部112を介してユーザ要求の受け付け状態に移行する。
ユーザは、ステップST6bで検索結果表示部110によって表示画面上に表示された検索結果を確認する。このとき、意図する結果であれば、ユーザは、ユーザ入力部112を用いて意図する結果である旨をユーザ要求として入力し、意図するものと異なる場合、その旨をユーザ入力部112を用いてユーザ要求として入力する。
検索実行部111は、ユーザ入力部112を介して入力されたユーザ要求が、検索結果が意図するものであることを示しているか、意図とは異なるものであることを示しているかを判定する(ステップST7b)。ここで、ユーザ要求が、検索結果が意図するものであることを示している場合、意図する画像検索が実行されたものとして処理を終了する。
一方、意図とは異なるものであることを示している場合、検索実行部111は、前回の画像検索で利用した特徴量の次に有効な特徴量(次点の特徴量)の主成分データを主成分蓄積部103に要求すると共に、この特徴量を特徴量蓄積部102に要求する。この後、検索実行部111は、上記要求に応じて主成分蓄積部103から読み出された次点の特徴量の主成分データを入力し、上記要求に応じて特徴量蓄積部102から読み出された上記次点の特徴量を入力する(ステップST8b)。
続いて、検索実行部111は、ステップST5bに戻り、ステップST8bで入力した次点の特徴量及びその主成分データを利用して実際に検索キー画像に類似する画像を検索する。検索の実行手順は、利用するデータが次点の特徴量及びその主成分データである場合を除き、上記実施の形態1と同様である。このようにして、この実施の形態2では、ユーザが意図する検索結果が得られるまで、上記処理が繰り返される。
なお、ユーザ要求としては、どの程度意図と異なるか、あるいはどのような意図かを具体的に入力してもよい。例えば、検索結果がユーザの意図と全く異なる場合、その旨をユーザ要求として入力することで、検索実行部111は、最も有効である特徴量が色に関するものであり、次点も色に関する特徴量である場合、同一の特徴量で次点のものでは同様の検索結果が得られるであろうことを考慮して次点の特徴量を飛ばし、3番目に有効な特徴量を利用するようにしてもよい。
ユーザの意図とどの程度異なるのかを、例えば大中小のように設定することにより、検索実行部111は、特徴量を有効な順で利用して画像検索を実行する。また、ユーザ要求でどのような意図であるかを示す場合としては、ユーザ要求で特定の特徴量を指定することが考えられる。例えば、検索キー画像に類似する画像のうち、色に関する特徴量が類似する画像を検索したい場合、ユーザ要求で色に関する特徴量を指定する。これにより、検索実行部111は、色に関する特徴量を有効な順で利用して画像を検索する。
また、画像検索に用いる特徴量空間の各座標軸にそれぞれ異なる種別の特徴量が設定されている場合、ユーザ要求によって上記座標軸のいずれかの座標軸に設定している特徴量を変更(例えば、いずれかの座標軸の主成分データを変更する若しくは特徴量の種別自体を変更する等)するようにしてもよい。
以上のように、この実施の形態2によれば、装置外部から情報を入力するためのユーザ入力部112を備え、検索実行部111が、ユーザ入力部112から入力された情報に応じて画像検索に有効な特徴量を変更するので、ユーザの意図をフィードバックした特徴量を用いて画像検索することができ、よりユーザの意図に即した検索結果の提示が可能となる。
実施の形態3.
図10は、この発明の実施の形態3による画像分類装置の構成を示すブロック図である。以降では、実施の形態3の画像分類装置によって大量の画像データを自動的に分類する場合を示す。この実施の形態3による画像分類装置は、画像蓄積部101、特徴量蓄積部102、特徴量抽出部106、距離算出部113、距離解析部114、特徴量分析部115、クラスタリング実行部116及び分類結果表示部117を備える。画像蓄積部101及び特徴量蓄積部102については上記実施の形態1と同様であるので説明を省略する。
特徴量抽出部106は、装置外部から入力された画像データの特徴量を抽出する。この特徴量としては、例えば色ヒストグラム、色の大まかな配置、周波数成分、テクスチャ及びその配置、画像内のオブジェクトの形状などがある。また、特徴量の例としては、前述したEdge Histogramが挙げられる。
距離算出部113は、特徴量抽出部106で抽出された各画像の特徴量間の距離(以下、特徴量距離と呼ぶ)を算出する。ここで、特徴量距離が小さくなるにつれて、その特徴量を与える蓄積画像は互いに類似し、特徴量距離が大きくなるにつれて、その蓄積画像は互いに類似しなくなる。
距離解析部114は、装置内に入力された蓄積画像間の特徴量距離をそれぞれ解析して画像分類に有効な特徴量を選択する。画像分類に有効な特徴量とは、複数の蓄積画像においてより多くの画像を分類できる特徴量であり、複数の蓄積画像間で類似した特徴を与える特徴量である。例えば、蓄積画像間の特徴量距離の分布関数を特徴量毎に求め、これら分布関数の特性を示す解析値をそれぞれ算出し、これら解析値をそれぞれ比較して特徴量距離が最も小さい場合に対応する解析値が得られた分布関数の特徴量を画像分類に最も有効な特徴量として選択する。
また、距離解析部114は、最も有効な特徴量の次に特徴量距離が小さい場合に対応する解析値が得られた分布関数の特徴量を2番目に有効な特徴量とし、その次に小さい場合に対応する解析値が得られた分布関数の特徴量を3番目に有効な特徴量とする。このように、画像分類に有効な特徴量として選別された特徴量に対し、蓄積画像間での類似度合いに応じて有効な順に順位を付けて距離解析結果とする。
特徴量分析部115は、距離解析の結果で画像分類に有効と判断された特徴量の主成分分析を行う。なお、主成分分析は、上記実施の形態1と同様に、多変量の測定値が得られたとき、線形変換によって変量間の相関をなくし、より少ない変量によって対象の特徴を記述しようとする手法である。
クラスタリング実行部116は、画像分類に有効な特徴量及びその主成分データを利用して画像を分類する。分類結果表示部117は、クラスタリング実行部116による分類結果や画像蓄積部101から読み出された蓄積画像データを表示画面上に表示する。
上述した特徴量抽出部106、距離算出部113、距離解析部114、特徴量分析部115、クラスタリング実行部116及び分類結果表示部117は、本発明の趣旨に従う画像分類用プログラムを、コンピュータに読み込ませてその動作を制御することにより、当該コンピュータ上にソフトウエアとハードウェアが協働した具体的な手段として実現することができる。
また、画像蓄積部101及び特徴量蓄積部102は、上記コンピュータに搭載された記憶装置の記憶領域上に構築してもよく、特徴量抽出部106、距離算出部113、特徴量分析部115及び分類結果表示部117からデータ通信可能な外部データサーバの記憶装置の記憶領域上に構築してもよい。
次に動作について説明する。
図11は、図10中の画像分類装置による画像分類処理の流れを示すフローチャートであり、図10及び図11を用いて処理の詳細を説明する。
先ず、装置外部から入力された分類対象の画像データは、画像蓄積部101に入力される。ここでは、例えばm枚の画像のデータが入力されたものとする。このとき、同時に、特徴量抽出部106は、画像蓄積部101に蓄積される画像データを入力し(ステップST1c)、これら画像データの特徴量を抽出する(ステップST2c)。
特徴量抽出部106は、上記画像データから抽出した特徴量を特徴量蓄積部102に蓄積する。なお、上記分類対象の画像データとその特徴量とが関連付けられて特徴量蓄積部102に蓄積される。また、以降では、画像蓄積部101に蓄積された分類対象の画像データを蓄積画像と呼び、特徴量蓄積部102に蓄積された上記蓄積画像の特徴量を蓄積特徴量と適宜呼ぶこととする。
ステップST2cにおいて、特徴量抽出部106は、様々なユーザの意図に対応するために、上記蓄積画像から複数の特徴量を算出する。ここでは、n個の特徴量を抽出することとする。ここで抽出された特徴量は、画像蓄積部101の蓄積画像データと関連付けられて特徴量蓄積部102に蓄積される。
次に、距離算出部113は、特徴量抽出部106により抽出された蓄積画像間の特徴量を特徴量蓄積部102に要求する。続いて、距離算出部113は、上記要求に応じて特徴量蓄積部102から読み出された蓄積画像間の特徴量距離を算出する(ステップST3c)。ここでは、m枚の蓄積画像とn個の特徴量があるため、下記式(3)に示すC個の距離が算出される。
Figure 2009031297
続いて、距離解析部114は、距離算出部113で算出された各蓄積画像間の特徴量距離をそれぞれ解析して、画像分類に有効な特徴量を選択する(ステップST4c)。特徴量距離の解析方法としては、上記実施の形態1と同様に特徴量距離毎に分布関数を求め、この分布関数の特性を示す解析値として平均と分散を用いる方法が挙げられる。
例えば、ある蓄積画像とその他の蓄積画像との特徴量距離の対数正規分布関数を特徴量毎に求め、これら分布関数の特性を示す解析値である平均値及び分散値をそれぞれ算出する。そして、分布関数ごとの平均値及び分散値をそれぞれ比較して、特徴量距離が最も小さい場合に対応する平均値及び分散値の最小値が得られた分布関数の特徴量を、上記ある蓄積画像において画像分類に最も有効な特徴量として選択する。
距離解析部114は、ステップST3c及びステップST4cの画像分類に最も有効な特徴量を得る作業を蓄積画像の枚数分、つまりm枚の画像であればm回繰り返す(ステップST5c)。このようしてm枚の蓄積画像それぞれについて画像分類に最も有効な特徴量が得られる。
全ての蓄積画像について距離解析が完了すると、画像分類に有効な特徴量として何度も選ばれている特徴量と、そうでない特徴量とが選別される。例えば、色ヒストグラムの特徴量は最も有効な特徴量に何度も選ばれているが、テクスチャの配置に関する特徴量は全く選ばれない場合が発生する。この場合、色ヒストグラムは、全ての蓄積画像データから所定の蓄積画像を分類するのに有効であるが、テクスチャの配置に関する特徴量は画像分類に有効でない。
そこで、距離解析部114は、例えば画像分類に最も有効な特徴量として選ばれている頻度に応じてどの特徴量が有効であるかの順位付けを行い、その順位ごとに重みをつけて足すことにより画像分類に有効な特徴量を決定する。このようにして選択された画像分類に有効な特徴量を指定する情報は、距離解析結果として距離解析部114から特徴量分析部115へ出力される。なお、距離解析結果として指定される有効な特徴量は、一つでも複数でも良い。
特徴量分析部115では、距離解析部114から距離解析結果として選別された画像分類に有効な特徴量を指定する情報を入力すると、この特徴量を特徴量蓄積部102に要求する。この後、特徴量分析部115は、上記要求に応じて特徴量蓄積部102から読み出された画像分類に有効な特徴量を入力し、この特徴量を主成分分析する(ステップST6c)。主成分分析の結果は、特徴量分析部115からクラスタリング実行部116へ出力される。
特に、画像分類に有効な特徴量が2つ若しくは3つ指定されている場合、それぞれの特徴量毎に主成分分析を行い、それぞれの第1主成分を後にクラスタリングを行う際の次元軸に用いてもよい。また、複数の有効な特徴量の全てを利用して、主成分分析を行ってもよい。
クラスタリング実行部116は、画像分類に有効な特徴量の主成分分析結果を入力すると、特徴量分析部115に対して特徴量蓄積部102に蓄積される全蓄積画像の特徴量の主成分分析を実行させ、その結果を取得する。この後、クラスタリング実行部116は、画像分類に有効な特徴量の主成分を座標軸とする特徴量空間を構築し、この特徴量空間で蓄積画像の主成分のクラスタリングを実行する(ステップST7c)。クラスタリング方法としては、k平均法などを利用する。なお、クラスタリング方法は、上述のk平均法を利用してもよく、他の方法を利用してもよい。
図12は、画像分類に有効な特徴量の主成分データを用いた2次元の特徴量空間で画像分類した結果を示す図であり、特徴量の第1主成分Z1を横軸、第2主成分Z2を縦軸としている。また、黒丸記号は、分類された蓄積画像の特徴量の主成分値を示している。図12の例では、5つのクラスタに画像が分類されている。
分類結果表示部117は、クラスタリング実行部116からクラスタリング結果を入力すると、これにより分類された画像を画像蓄積部101に要求する。次に、分類結果表示部117は、上記要求に応じて画像蓄積部101から読み出された画像データを入力し、表示画面上に表示する(ステップST8c)。分類結果の画像を表示する場合、分類に使用した特徴量空間とともに表示するようにしてもよい。
例えば、図12に示した2次元の特徴量空間上の各蓄積画像の特徴量の主成分に相当するポイントに当該画像のサムネイルを配置する。また、分類に利用した特徴量空間が3次元であれば、3次元の特徴量空間上に画像をサムネイル表示してもよい。
以上のように、この実施の形態3によれば、複数の分類対象の画像から特徴量を抽出する特徴量抽出部106と、複数の分類対象の画像間の特徴量の距離を算出する距離算出部113と、距離算出部113で算出された距離を解析して、複数の分類対象の画像間で類似した特徴を与える特徴量を画像分類に有効な特徴量として選別する距離解析部114と、画像分類に有効な特徴量の主成分分析を行う特徴量分析部115と、画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に分類対象の画像を配置し、この特徴量空間内で分類対象の画像をクラスタリングして分類するクラスタリング実行部116とを備えるので、蓄積画像データ中から画像分類に有効な特徴量を取得し、この有効な特徴量を用いて構築した特徴量空間で蓄積画像をクラスタリングすることから、画像の分類を効果的に行うことが可能となる。
また、この実施の形態3によれば、クラスタリング実行部116の分類結果を特徴量空間内に配置して表示画面上に表示する分類結果表示部117を備えたので、蓄積画像の分類結果を整理された形で閲覧することが可能である。
さらに、この実施の形態3によれば、距離解析部114が、複数の分類対象の画像間で類似する度合いに応じて画像分類に有効な特徴量に対して有効さの順位付けを行い、クラスタリング実行部116が、距離解析部114により順位付けられた画像分類に有効な特徴量を用いて分類対象の画像を分類するので、有効さの順位に応じて様々な画像分類結果を得ることができる。
実施の形態4.
図13は、この発明の実施の形態4による画像分類装置の構成を示すブロック図である。図13において、実施の形態4による画像分類装置は、画像蓄積部101、特徴量抽出部106、分類データ蓄積部118、画像分類部119及び分類結果表示部120を備える。画像蓄積部101は、既に分類された画像データを蓄積する記憶部である。分類データ蓄積部118は、画像蓄積部101に蓄積される蓄積画像の分類データを記憶する記憶部である。ここで、分類データとは、蓄積画像の分類先を規定するデータであり、例えば実施の形態3で示した図12中の特徴量空間の次元軸を特定する数値データなどが考えられる。
特徴量抽出部106は、装置外部から入力された画像データの特徴量を抽出する。この特徴量としては、例えば色ヒストグラム、色の大まかな配置、周波数成分、テクスチャ及びその配置、画像内のオブジェクトの形状などがある。また、特徴量の例としては、前述したEdge Histogramが挙げられる。
画像分類部119は、装置外部から新たに入力された画像データを、その特徴量及び分類データを用いて、いずれかの分類先へ分類する。分類結果表示部120は、画像分類部119による分類結果や画像蓄積部101から読み出された蓄積画像データを表示画面上に表示する。
上述した特徴量抽出部106、画像分類部119及び分類結果表示部120は、本発明の趣旨に従う画像分類用プログラムを、コンピュータに読み込ませてその動作を制御することにより、当該コンピュータ上にソフトウエアとハードウェアが協働した具体的な手段として実現することができる。
また、画像蓄積部101及び分類データ蓄積部118は、上記コンピュータに搭載された記憶装置の記憶領域上に構築してもよく、画像分類部119及び分類結果表示部120からデータ通信可能な外部データサーバの記憶装置の記憶領域上に構築してもよい。
次に動作について説明する。
図14は、図13中の画像分類装置による画像分類処理の流れを示すフローチャートであり、図13及び図14を用いて詳細に説明する。なお、以降では、画像蓄積部101の蓄積画像が上記実施の形態3の画像分類装置によって予め分類されており、その分類データが分類データ蓄積部118に蓄積されているものとする。また、分類データとしては、上記実施の形態3で示した画像分類に有効な特徴量の主成分を用いた特徴量空間の次元軸を特定する数値データである。
先ず、特徴量抽出部106は、装置外部から画像データを入力(ステップST1d)し、この画像データから特徴量を抽出する(ステップST2d)。抽出された特徴量及びその画像データに関する情報は、特徴量抽出部106から画像分類部119へ出力される。画像分類部119は、新たに入力された画像データの特徴量を取得すると、分類データ蓄積部118に対して上記画像データの特徴量に対応する分類データを要求する。
この後、画像分類部119は、上記要求に応じて分類データ蓄積部118から読み出された分類データを取得すると、この分類データで特定される次元軸を有する特徴量空間を構築し、新たに入力された画像データの特徴量に基づいて、この画像データが上記特徴量空間のどこに位置するのかを算出する。画像分類部119は、このようにして算出された画像の位置から、新たに入力された画像がどのクラスタに属するかを判定し、分類を実行する(ステップST3d)。
分類結果表示部120は、画像分類部119から分類結果を入力すると、新たに入力された画像データと同じ分類先の蓄積画像を画像蓄積部101に要求する。次に、分類結果表示部120は、上記要求に応じて画像蓄積部101から読み出された画像データを入力し、新たに入力された画像とともに表示画面上に表示する(ステップST4d)。なお、分類結果の画像を表示する場合、分類データを用いて分類に使用した特徴量空間とともに表示するようにしてもよい。
以上のように、この実施の形態4によれば、入力画像から特徴量を抽出する特徴量抽出部106と、上記実施の形態3で示した画像分類装置の画像分類で得られる、画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間を規定する分類データを蓄積する分類データ蓄積部118と、入力画像の特徴量を用いて分類データで規定される特徴量空間内の入力画像の位置を判定し、この判定結果に応じて入力画像を分類する画像分類部119とを備えるので、新たに入力された画像を、予め分類されたデータを用いて簡単に分類することができる。
また、この実施の形態4によれば、画像分類部119の分類結果を、分類データで規定される特徴量空間内に配置して表示画面上に表示する分類結果表示部120を備えるので、入力画像の分類結果を整理された形で閲覧することが可能である。
なお、上記実施の形態1〜4で示した本発明の検索分類による結果は、例えばWebページの有効性の判定などにも利用可能である。具体的には、何らかの統計データを調べたい場合に、そのページ内の画像にグラフが含まれているかどうかを、本発明を用いて判定する。これにより、ユーザが、所望のWebページをより容易に検索することができる。
以上のように、この発明に係る画像検索装置は、検索対象の画像を蓄積する画像蓄積部と、検索対象の画像の特徴量を蓄積する特徴量蓄積部と、検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部と、検索キーとなる画像から特徴量を抽出する特徴量抽出部と、特徴量蓄積部に蓄積された検索対象の画像の特徴量と検索キーとなる画像の特徴量との距離を算出する距離算出部と、距離算出部で算出された距離を解析して、検索キーとなる画像に類似した特徴を与える検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部と、画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に検索対象の画像を配置し、この特徴量空間内から検索キーとなる画像に類似する画像を検索する検索実行部とを備えるように構成したので、検索対象の画像から抽出した特徴量から画像検索に有効な特徴量を選別し、この特徴量の主成分分析結果を用いて構築された特徴量空間で画像検索を実行することから、ユーザの意図する検索結果を的確かつ迅速に得ることができ、画像検索装置として機能するコンピュータなどに用いるのに適している。

Claims (18)

  1. 検索対象の画像を蓄積する画像蓄積部と、
    前記検索対象の画像の特徴量を蓄積する特徴量蓄積部と、
    前記検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部と、
    検索キーとなる画像から特徴量を抽出する特徴量抽出部と、
    前記特徴量蓄積部に蓄積された前記検索対象の画像の特徴量と前記検索キーとなる画像の特徴量との距離を算出する距離算出部と、
    前記距離算出部で算出された距離を解析して、前記検索キーとなる画像に類似した特徴を与える前記検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部と、
    前記画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記検索対象の画像を配置し、この特徴量空間内から前記検索キーとなる画像に類似する画像を検索する検索実行部とを備えた画像検索装置。
  2. 検索実行部の検索結果を特徴量空間内に配置して表示画面上に表示する検索結果表示部を備えたことを特徴とする請求項1記載の画像検索装置。
  3. 距離解析部は、検索キーとなる画像に類似する度合いに応じて画像検索に有効な特徴量に対して有効さの順位付けを行い、
    検索実行部は、前記距離解析部により順位付けられた画像検索に有効な特徴量を用いて前記検索キーとなる画像に類似する画像を検索することを特徴とする請求項1記載の画像検索装置。
  4. 装置外部から情報を入力するための入力部を備え、
    検索実行部は、前記入力部から入力された情報に応じて画像検索に有効な特徴量を変更することを特徴とする請求項1記載の画像検索装置。
  5. 検索実行部は、画像検索に有効な特徴量の主成分分析結果のうちの第1主成分を座標軸に設定した特徴量空間を用いて画像検索することを特徴とする請求項1記載の画像検索装置。
  6. 複数の分類対象の画像から特徴量を抽出する特徴量抽出部と、
    前記複数の分類対象の画像間の特徴量の距離を算出する距離算出部と、
    前記距離算出部で算出された距離を解析して、前記複数の分類対象の画像間で類似した特徴を与える特徴量を画像分類に有効な特徴量として選別する距離解析部と、
    前記画像分類に有効な特徴量の主成分分析を行う特徴量分析部と、
    前記画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記分類対象の画像を配置し、この特徴量空間内で前記分類対象の画像をクラスタリングして分類するクラスタリング実行部とを備えた画像分類装置。
  7. クラスタリング実行部の分類結果を特徴量空間内に配置して表示画面上に表示する分類結果表示部を備えたことを特徴とする請求項6記載の画像分類装置。
  8. 距離解析部は、複数の分類対象の画像間で類似する度合いに応じて画像分類に有効な特徴量に対して有効さの順位付けを行い、
    クラスタリング実行部は、前記距離解析部により順位付けられた画像分類に有効な特徴量を用いて前記分類対象の画像を分類することを特徴とする請求項6記載の画像分類装置。
  9. クラスタリング実行部は、画像分類に有効な特徴量の主成分分析結果のうちの第1主成分を座標軸に設定した特徴量空間を用いて画像分類することを特徴とする請求項6記載の画像分類装置。
  10. 入力画像から特徴量を抽出する特徴量抽出部と、
    請求項6記載の画像分類装置の画像分類で得られる、画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間を規定する分類データを蓄積する分類データ蓄積部と、
    前記入力画像の特徴量を用いて前記分類データで規定される特徴量空間内の前記入力画像の位置を判定し、この判定結果に応じて前記入力画像を分類する画像分類部とを備えた画像分類装置。
  11. 画像分類部の分類結果を特徴量空間内に配置して表示画面上に表示する分類結果表示部を備えたことを特徴とする請求項10記載の画像分類装置。
  12. 請求項1記載の画像検索装置による画像検索方法において、
    特徴量抽出部が、検索キーとなる画像から特徴量を抽出するステップと、
    距離算出部が、検索対象の画像の特徴量と前記検索キーとなる画像の特徴量との距離を算出するステップと、
    距離解析部が、前記距離算出部で算出された距離を解析して前記検索キーとなる画像に類似した特徴を与える前記検索対象の画像の特徴量を画像検索に有効な特徴量として選別するステップと、
    検索実行部が、前記画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記検索対象の画像を配置し、この特徴量空間内から前記検索キーとなる画像に類似する画像を検索するステップとを備えたことを特徴とする画像検索方法。
  13. 検索結果表示部が、検索実行部の検索結果を特徴量空間内に配置して表示画面上に表示するステップを備えたことを特徴とする請求項12記載の画像検索方法。
  14. 請求項6記載の画像分類装置による画像分類方法において、
    特徴量抽出部が、複数の分類対象の画像から特徴量を抽出するステップと、
    距離算出部が、前記複数の分類対象の画像間の特徴量の距離を算出するステップと、
    距離解析部が、前記距離算出部で算出された距離を解析して前記複数の分類対象の画像間で類似した特徴を与える特徴量を画像分類に有効な特徴量として選別するステップと、
    特徴量分析部が、前記画像分類に有効な特徴量の主成分分析を行うステップと、
    クラスタリング実行部が、前記画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記分類対象の画像を配置し、この特徴量空間内で前記分類対象の画像をクラスタリングして分類するステップとを備えたことを特徴とする画像分類方法。
  15. 分類結果表示部が、クラスタリング実行部の分類結果を特徴量空間内に配置して表示画面上に表示するステップを備えたことを特徴とする請求項14記載の画像分類方法。
  16. 検索対象の画像を蓄積する画像蓄積部、
    前記検索対象の画像の特徴量を蓄積する特徴量蓄積部、
    前記検索対象の画像の特徴量の主成分分析結果を蓄積する主成分蓄積部、
    検索キーとなる画像の特徴量を抽出する特徴量抽出部、
    前記特徴量蓄積部に蓄積された前記検索対象の画像の特徴量と前記検索キーとなる画像の特徴量との距離を算出する距離算出部、
    前記距離算出部で算出された距離を解析して、前記検索キーとなる画像に類似した特徴を与える前記検索対象の画像の特徴量を画像検索に有効な特徴量として選別する距離解析部、
    前記画像検索に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記検索対象の画像を配置し、この特徴量空間内から前記検索キーとなる画像に類似する画像を検索する検索実行部としてコンピュータを機能させるプログラム。
  17. 複数の分類対象の画像から特徴量を抽出する特徴量抽出部、
    前記複数の分類対象の画像間の特徴量の距離を算出する距離算出部、
    前記距離算出部で算出された距離を解析して、前記複数の分類対象の画像間で類似した特徴を与える特徴量を画像分類に有効な特徴量として選別する距離解析部、
    前記画像分類に有効な特徴量の主成分分析を行う特徴量分析部、
    前記画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間に前記分類対象の画像を配置し、この特徴量空間内で前記分類対象の画像をクラスタリングして分類するクラスタリング実行部としてコンピュータを機能させるプログラム。
  18. 入力画像から特徴量を抽出する特徴量抽出部、
    請求項6記載の画像分類装置の画像分類で得られる、画像分類に有効な特徴量の主成分分析結果を座標軸に設定した特徴量空間を規定する分類データを蓄積する分類データ蓄積部、
    前記入力画像の特徴量を用いて前記分類データで規定される特徴量空間内の前記入力画像の位置を判定し、この判定結果に応じて前記入力画像を分類する画像分類部としてコンピュータを機能させるプログラム。
JP2009531120A 2007-09-07 2008-09-03 画像検索装置、画像分類装置及び方法並びにプログラム Expired - Fee Related JP4948607B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009531120A JP4948607B2 (ja) 2007-09-07 2008-09-03 画像検索装置、画像分類装置及び方法並びにプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007232973 2007-09-07
JP2007232973 2007-09-07
JP2009531120A JP4948607B2 (ja) 2007-09-07 2008-09-03 画像検索装置、画像分類装置及び方法並びにプログラム
PCT/JP2008/002415 WO2009031297A1 (ja) 2007-09-07 2008-09-03 画像検索装置、画像分類装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JPWO2009031297A1 true JPWO2009031297A1 (ja) 2010-12-09
JP4948607B2 JP4948607B2 (ja) 2012-06-06

Family

ID=40428621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009531120A Expired - Fee Related JP4948607B2 (ja) 2007-09-07 2008-09-03 画像検索装置、画像分類装置及び方法並びにプログラム

Country Status (3)

Country Link
US (1) US20100174707A1 (ja)
JP (1) JP4948607B2 (ja)
WO (1) WO2009031297A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010250636A (ja) * 2009-04-17 2010-11-04 Seiko Epson Corp 画像検索端末装置および画像検索要求方法
CN102622366B (zh) * 2011-01-28 2014-07-30 阿里巴巴集团控股有限公司 相似图像的识别方法和装置
JP5873764B2 (ja) * 2012-06-06 2016-03-01 株式会社Screenホールディングス 欠陥画像の提示方法
US20140032583A1 (en) * 2012-07-27 2014-01-30 Sergey Ioffe Multi-Resolution Exploration of Large Image Datasets
US9092697B2 (en) * 2013-02-07 2015-07-28 Raytheon Company Image recognition system and method for identifying similarities in different images
WO2014167880A1 (ja) * 2013-04-09 2014-10-16 株式会社日立国際電気 画像検索装置、画像検索方法、および記録媒体
JP6190887B2 (ja) * 2013-10-02 2017-08-30 株式会社日立製作所 画像検索システムおよび情報記録媒体
JP6674581B1 (ja) * 2019-07-16 2020-04-01 株式会社ジャパン・カレント 画像分類システム及び画像分類方法
US11875133B2 (en) * 2021-02-02 2024-01-16 Rovi Guides, Inc. Methods and systems for providing subtitles

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6381365B2 (en) * 1997-08-22 2002-04-30 Minolta Co., Ltd. Image data processing apparatus and image data processing method
WO2006018886A1 (ja) * 2004-08-19 2006-02-23 Mitsubishi Denki Kabushiki Kaisha 画像検索方法及び画像検索装置
JP4591215B2 (ja) * 2005-06-07 2010-12-01 株式会社日立製作所 顔画像データベース作成方法及び装置

Also Published As

Publication number Publication date
WO2009031297A1 (ja) 2009-03-12
JP4948607B2 (ja) 2012-06-06
US20100174707A1 (en) 2010-07-08

Similar Documents

Publication Publication Date Title
JP4948607B2 (ja) 画像検索装置、画像分類装置及び方法並びにプログラム
JP5229744B2 (ja) 画像分類装置および画像分類プログラム
JP5241954B2 (ja) 形状に基づく画像検索
JP5033580B2 (ja) 画像処理装置及び画像処理方法
JP4902499B2 (ja) 画像表示装置、画像表示方法、および画像表示システム
KR101457284B1 (ko) 콘텐츠 기반 이미지 검색을 가능하게 하는 방법 및 장치
JP5934653B2 (ja) 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置
JP5062819B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
WO2001031502A1 (fr) Dispositif et procede de classement et de rangement d'informations multimedia
CN108377351A (zh) 用于在模板上布局图像的图像处理装置和图像处理方法
JP2007317034A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
Stober et al. Musicgalaxy: A multi-focus zoomable interface for multi-facet exploration of music collections
JP2011053781A (ja) 画像データベース作成装置、画像検索装置、画像データベース作成方法および画像検索方法
WO2023221790A1 (zh) 图像编码器的训练方法、装置、设备及介质
JP2021086438A (ja) 画像検索装置、画像検索方法、及びプログラム
CN110717806A (zh) 产品信息推送方法、装置、设备及存储介质
JP5337673B2 (ja) 画像検索システム
JP5356289B2 (ja) 画像検索システム
JP6684777B2 (ja) 製造物良・不良判定システムおよび製造物良・不良判定方法
US8566706B2 (en) User-friendly display of data
JP2010073194A (ja) 画像処理装置、画像処理方法およびプログラム
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム
US8606494B2 (en) Map generation apparatus, map generation method and computer readable medium
JP4692784B2 (ja) 画像記述システムにおける特徴量選択プログラム、特徴量選択方法および装置
JP4336813B2 (ja) 画像記述システムおよび方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4948607

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees