JP5866064B2 - 画像検索装置、画像検索方法、および記録媒体 - Google Patents

画像検索装置、画像検索方法、および記録媒体 Download PDF

Info

Publication number
JP5866064B2
JP5866064B2 JP2015511122A JP2015511122A JP5866064B2 JP 5866064 B2 JP5866064 B2 JP 5866064B2 JP 2015511122 A JP2015511122 A JP 2015511122A JP 2015511122 A JP2015511122 A JP 2015511122A JP 5866064 B2 JP5866064 B2 JP 5866064B2
Authority
JP
Japan
Prior art keywords
image feature
image
feature amount
search
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015511122A
Other languages
English (en)
Other versions
JPWO2014167880A1 (ja
Inventor
洋登 永吉
洋登 永吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2015511122A priority Critical patent/JP5866064B2/ja
Application granted granted Critical
Publication of JP5866064B2 publication Critical patent/JP5866064B2/ja
Publication of JPWO2014167880A1 publication Critical patent/JPWO2014167880A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Library & Information Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

参照による取り込み
本出願は、平成25年(2013年)4月9日に出願された日本出願である特願2013−081088の優先権を主張し、その内容を参照することにより、本出願に取り込む。
本発明は、画像を検索する画像検索装置、画像検索方法、および記録媒体に関する。
同一被写体について異なる向きや異なる照明条件で撮影された画像では、得られる画像特徴量が異なる。このような画像特徴量のばらつきは,被写体の形状に依存するため、被写体によって様相が異なる。たとえば、ガウス分布で近似するならば、主軸が被写体によって異なると言い換えることもできる。このような被写体によって主軸の方向が異なるばらつきに影響されづらい部分ベクトル空間を抽出する場合、被写体によって主軸の異なるばらつきをそれぞれ補正し、可能な限り等方的な分布となるような部分空間を抽出する必要がある。
特表2005−512201号公報の顔画像認識システムおよび方法は、入力顔画像および基準顔画像の組を入力スペースから高次元特徴スペースに投影し、前記顔画像のより典型的な特徴を得る。入力顔画像および基準顔画像のカーネルフィッシャーフェイスが算出される。入力顔画像および基準顔画像は、顔画像スペースにおけるポイントとして表され、入力された顔のポイントと各基準顔画像のポイントとの間の距離を使用して、入力顔画像が基準顔画像の特定の顔画像に似ているか否かが判定される。
しかしながら、上述した特表2005−512201号公報では、非線形変換を適用するため、処理に時間を要するという問題がある。たとえば、得られた画像をデータベースに順次記録する場合、毎回非線形変換を行うことになり、登録に時間がかかり単位時間あたりの登録数が制限される。また、得らえた画像に対し線形変換をする場合、画像間の類似度を表現するための画像特徴量が得られないという問題がある。
本発明は、画像特徴量の変換処理の高速化を図ることを目的とする。
本願において開示される発明の一側面となる画像検索装置、画像検索方法、および記録媒体は、検索目標画像に関する第1の画像特徴量を取得し、複数の画像特徴量の中から、取得された前記第1の画像特徴量に類似する画像特徴量を検索し、同一の被写体について複数の条件により得られた複数の被写体画像に関する複数の画像特徴量に基づく線形変換パラメータの集合の中から、前記第1の画像特徴量と前記被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定し、決定された線形変換パラメータにより、前記第1の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索部による検索結果である画像特徴量を変換し、変換された変換結果を出力する。
本発明の代表的な実施の形態によれば、画像特徴量の変換処理の高速化を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
特徴量空間を示す説明図1である。 特徴量空間を示す説明図2である。 画像検索装置のハードウェア構成例を示すブロック図である。 実施例1にかかる画像特徴量データベースの記憶内容例を示す説明図である。 実施例1にかかるクラスタデータベースの記憶内容例を示す説明図である。 実施例1にかかる第1の線形変換パラメータ辞書の記憶内容例を示す説明図である。 実施例1にかかる第2の線形変換パラメータ辞書の記憶内容例を示す説明図である。 実施例1にかかる画像検索装置の機能的構成例を示すブロック図である。 実施例1にかかる決定部による警告の出力例を示す説明図である。 実施例1にかかる画像検索装置による画像検索処理手順例を示すフローチャートである。 図10に示した線形変換処理(ステップS1002)の詳細な処理手順例を示すフローチャートである。 図11に示した決定処理(ステップS1103)の詳細な処理手順例を示すフローチャートである。 実施例2にかかる画像特徴量データベースの記憶内容例を示す説明図である。 実施例2にかかる画像検索装置の機能的構成例を示すブロック図である。 実施例2にかかる線形変換処理(ステップS1002)の詳細な処理手順例を示すフローチャートである。 実施例3にかかる画像検索装置の機能的構成例を示すブロック図である。 実施例3にかかる画像特徴量の更新処理手順例を示すフローチャートである。 実施例4にかかるネットワークシステムの構成例を示す説明図である。 実施例4にかかるネットワークシステムの機能的構成例を示すブロック図である。 クラウドによる画像検索処理手順例を示すフローチャートである。
本発明にかかる画像特徴量の変換処理は、線形変換を利用しつつも非線形変換と同等の精度を得る変換処理である。以下、図面を用いて説明する。
図1は、特徴量空間を示す説明図1である。画像が持つ画像特徴量は複数存在するが、ここでは説明を単純化するため、ある2種類の画像特徴量(画像特徴量1と画像特徴量2)による分布を用いて説明する。画像特徴量は一般に数値ベクトルとして表される。この数値ベクトルの各要素には、たとえば、画像の色を数値化した値や画像の勾配の強度、方向の値、またはそれらの値を頻度分布とした値がある。画像特徴量がより類似していれば画像が類似していると判断できる。たとえば、ベクトル間のユークリッド距離やマハラノビス距離、Bhattacharyya距離が、類似性を評価する指標として用いられる。したがって、距離が小さいほど画像同士が類似していると判断することができる。
(A)は、変換前の特徴量分布が存在する特徴量空間であり、(B)変換後の特徴量分布が存在する特徴量空間である。(A)において、各個人の顔画像のばらつきを画像特徴量1および画像特徴量2で決まる楕円の特徴量分布101により模式的に示す。画像特徴量のベクトル空間上で異なる場所に位置する画像特徴量の特徴量分布101は、異なる人物の顔のばらつきを意味する。ばらつきの大きい方向(ここでは、楕円の長軸方向)は、人それぞれ異なる顔の造作をしているためにそれぞれ異なる。
特徴量分布101から変換により、(B)のような等方的な特徴量分布102を得るのが目的である。特徴量分布102の場合、等方的であるため、ユークリッド距離を用いることにより、容易に二体間の類似度を表現することができる。
ここで、(A)から(B)に変換する場合、特徴空間上異なる位置において非等方的な変換が必要となる。すなわち、非線形変換が必要である。しかしながら、非線形変換はパラメータを多数要するため、非線形変換処理には時間を要し、変換速度、ひいては、検索速度が低下する。
図2は、特徴量空間を示す説明図2である。図2では、図1と異なり、ある局所領域に着目することにする。局所領域には、画像特徴量が類似している画像が集まる。たとえば、顔画像の場合、二次元の顔画像から得られた特徴量が類似していれば、一般に顔の三次元構造も類似することがわかっている。このことから、顔の向きや照明に起因する分布も同様に類似するといえる。すなわち、図2のように特徴量分布201が揃った状態となる。したがって、(A)の特徴量分布201を(B)の等方的な特徴量分布202へと変換する場合、線形変換により実現できる。
このように、(A)の特徴量分布201のように、ばらつきが同一方向に揃った画像特徴量に基づく線形変換パラメータをデータベース化し、その線形変換パラメータの集合の中から検索目標画像に最適な線形変換パラメータを選択する。このように、線形変換を利用することにより、画像特徴量の変換処理の高速化を図ることができるとともに、線形変換でありながら非線形変換と同等の変換精度を維持することができる。
図3は、画像検索装置のハードウェア構成例を示すブロック図である。画像検索装置300は、プロセッサ301と、記憶デバイス302と、入力デバイス303と、出力デバイス304と、通信インターフェース(通信IF305)と、を有する。プロセッサ301、記憶デバイス302、入力デバイス303、出力デバイス304、および通信IF305は、バスにより接続される。プロセッサ301は、画像検索装置300を制御する。記憶デバイス302は、プロセッサ301の作業エリアとなる。また、記憶デバイス302は、各種プログラムやデータを記憶する。記憶デバイス302としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス303は、データを入力する。入力デバイス303としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス304は、データを出力する。出力デバイス304としては、たとえば、ディスプレイ、プリンタがある。通信IF305は、ネットワークと接続され、データを送受信する。以下、本発明にかかる実施例について説明する。
(実施例1)
<データベース>
図4は、実施例1にかかる画像特徴量データベースの記憶内容例を示す説明図である。画像特徴量データベース400は、クラスタIDごとに、データIDと、当該データIDに対応する画像特徴量と、を記憶する。クラスタIDとは、クラスタを一意に特定する識別情報である。クラスタとは、互いに類似した画像特徴量を持つデータIDをグループ化したデータ群である。データIDとは、データを一意に特定する識別情報である。データとは、たとえば、画像である。データである画像は、記憶デバイス302に記憶される。画像特徴量は、上述したように、データである画像の特徴を示す数値ベクトルである。したがって、同一クラスタ内の画像特徴量は類似しあうことになる。
図5は、実施例1にかかるクラスタデータベースの記憶内容例を示す説明図である。クラスタデータベース500は、図4に示したクラスタIDと、代表特徴量と、を関連付けて記憶する。代表特徴量とは、クラスタIDで特定されるクラスタ内の画像特徴量群を代表する画像特徴量である。たとえば、代表特徴量は、クラスタ内の画像特徴量群の各々を後述する第1の線形変換パラメータにより線形変換したあとの画像特徴量群の各ベクトル要素を平均化した画像特徴量である。画像検索の際には、図4に示した画像特徴量データベース400に直接アクセスしてもよいが、クラスタデータベース500により代表特徴量で検索することにより、クラスタの絞り込みをおこなうことができる。したがって、検索速度の高速化を実現することができる。
図6は、実施例1にかかる第1の線形変換パラメータ辞書の記憶内容例を示す説明図である。第1の線形変換パラメータ辞書600は、第1の線形変換パラメータを記憶する。第1の線形変換パラメータとは、主成分分析や判別分析といった既知の統計解析の結果得られる行列である。第1の線形変換パラメータが主成分分析に関する行列であれば、場合によっては数千次元に及ぶ画像特徴量を、高速検索に適するように次元削減することができる。第1の線形変換パラメータが判別分析に関する行列であれば、変換後の画像特徴量において各人の分離が容易になる。
図7は、実施例1にかかる第2の線形変換パラメータ辞書700の記憶内容例を示す説明図である。第2の線形変換パラメータ辞書700は、第2の線形変換パラメータ候補と、パラメータ算出用の画像特徴量と、を関連付けて記憶する。第2の線形変換パラメータ候補とは、図2に示した線形変換に用いられる線形変換パラメータの候補である。第2の線形変換パラメータ候補は、以下の方法により求められる。ここでは、人間の顔画像を例に挙げて説明するが、人間以外の生物でもよく、生物に限らず車などの物体でもよい。
第1の方法について説明する。まず、ある人物iの向きや照明の変動が含まれた複数の顔画像に関する画像特徴量から分散共分散行列が得られる。人物iの分散共分散行列をΣとし、下記式(1)の固有値問題を解いて、人物iの分散共分散行列Σに関する固有値λと固有ベクトルeが得られる。
Σx=λx・・・(1)
そして、下記式(2)に示すように、得られた固有値λと当該固有値λと対応する固有ベクトルeとについて、固有値の大きい順にN番目まで配列した変換行列Aが得られる。
Figure 0005866064
式(2)は、主成分分析において各軸の重みをその軸上のデータの標準偏差によって規格化したことになる。
第2の方法について説明する。まず、人物iの複数の顔画像から得られる複数の画像特徴量の平均と、当該複数の画像特徴量の平均との距離が一定の範囲内にある人物jの集合の画像特徴量と、から、クラス内分散共分散行列ΣW,i、クラス間分散共分散行列ΣB,iが得られる。ここで、各人物が1クラスをなすと考える。下記式(3)の固有値問題を解くことにより、固有値λおよび固有ベクトルeが得られる。
ΣB,ix=λΣW,ix・・・(3)
そして、下記式(4)に示すように、固有ベクトルeを、それと対応する固有値の大きい順にN番目まで配列した変換行列Aが得られる。
Figure 0005866064
第2の方法は線形判別の手法となる。人物群kの数が十分にある場合、主成分分析による手法よりも線形判別の手法がより適する。
第3の方法について説明する。まず、人物iの複数の顔画像から得られる複数の画像特徴量の平均と、当該複数の画像特徴量の平均との距離が一定の範囲内にある人物jの画像特徴量と、から、クラス内分散共分散行列ΣW,iが得られる。ここで、各人物が1クラスをなすと考える。下記式(5)の固有値問題を解くことにより、固有値λおよび固有ベクトルeが得られる。
ΣB,ix=λx・・・(5)
そして、下記式(6)に示すように、固有ベクトルeについて、固有値の大きい順にN番目まで配列した変換行列Aが得られる。
Figure 0005866064
上記第1〜第3の方法のいずれかの方法により求められた変換行列Aが、ある人物iについての第2の線形変換パラメータ候補となる。
また、図7において、パラメータ算出用の画像特徴量とは、第2の線形変換パラメータ候補に対応する画像特徴量である。たとえば、ある人物iについて得られた第2の線形変換パラメータ候補に対応するパラメータ算出用の画像特徴量は、人物iの複数の画像に関する各画像特徴量を、第1の線形変換パラメータにより線形変換し、当該線形変換後の各画像特徴量を平均化した画像特徴量である。
なお、図4〜図7に示した各データベース400〜700は、図3に示した記憶デバイス302に記憶される。また、通信IF305を介して各データベース400〜700内のデータを取得することとしてもよい。また、データIDに対応する画像についても同様である。
<画像検索装置300の機能的構成例>
図8は、実施例1にかかる画像検索装置300の機能的構成例を示すブロック図である。画像検索装置300は、画像特徴量データベース400と、クラスタデータベース500と、第1の線形変換パラメータ辞書600と、第2の線形変換パラメータ辞書700と、取得部801と、生成部802と、画像特徴量検索部803と、決定部804と、変換部805と、画像検索部806と、出力部807と、を有する。取得部801〜出力部807は、具体的には、たとえば、図3に示したプロセッサ301にプログラムを実行させることによりその機能を実現する。
取得部801は、検索目標画像に関する画像特徴量を取得する。取得部801は、検索目標画像を取得した場合、検索目標画像からその画像特徴量を算出する。画像特徴量は、上述したように、数値ベクトルとして表される。この数値ベクトルの各要素には、たとえば、画像の色を数値化した値や画像の勾配の強度、方向の値、またはそれらの値を頻度分布とした値がある。また、取得部801は、検索目標画像に関する画像特徴量、すなわち、算出済みの画像特徴量を取得することとしてもよい。
生成部802は、第1の線形変換パラメータ辞書600内の第1の線形変換パラメータにより、取得部801によって取得された検索目標画像に関する画像特徴量を変換して、検索目標画像に関する線形変換後の画像特徴量を生成する。これにより、第1の線形変換パラメータが主成分分析に関する行列である場合、検索目標画像に関する画像特徴量は、たとえば、数千次元に及ぶ画像特徴量を、高速検索に適するように次元削減することができる。第1の線形変換パラメータが判別分析に関する行列であれば、検索目標画像に関する画像特徴量は、変換後の画像特徴量において各人の分離が容易な画像特徴量に変換される。このように、第1の線形変換パラメータによる変換を、「第1の線形変換」と称す。
画像特徴量検索部803は、取得部801によって取得された検索目標画像に関する画像特徴量に基づいて、画像特徴量群の中から、検索目標画像に類似する画像を特定する画像特徴量を検索する。画像特徴量検索部803は、具体的には、たとえば、生成部802によって生成された検索目標に関する変換後の画像特徴量に基づいて、画像特徴量群の中から、検索目標画像に類似する画像に関する画像特徴量を検索する。
画像特徴量検索部803での検索は、たとえば、ベクトル間のユークリッド距離やマハラノビス距離、Bhattacharyya距離により、検索目標画像に関する画像特徴量に類似する画像特徴量を検索する。距離が小さいほど画像同士が類似する。
ここで、画像特徴量群とは、クラスタデータベース500を利用しない場合は、画像特徴量データベース400に記憶された画像特徴量の集合であり、クラスタデータベース500を利用する場合は、クラスタデータベース500に記憶された代表特徴量の集合である。クラスタデータベース500を利用する場合は、検索対象となる画像特徴量の数を低減させることができ、検索速度の向上を図ることができる。
決定部804は、同一の被写体について複数の条件により得らえた複数の被写体画像に関する複数の画像特徴量に基づく線形変換パラメータの集合の中から、検索目標画像に関する画像特徴量と被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定する。被写体とは、たとえば、上述した人物iである。複数の条件とは、被写体が人物iの場合、たとえば、異なる向きや異なる照明条件である。線形変換パラメータの集合とは、上述した第2の線形変換パラメータ辞書700である。
決定部804は、たとえば、下記式(7)により、第2の線形変換パラメータ候補の中から、検索目標画像に関する画像特徴量の線形変換に適用される第2の線形変換パラメータを決定する。
Figure 0005866064
ここで、yinは、検索目標画像の第1の線形変換後の画像特徴量であり、yは,人物iについての第2の線形変換パラメータ候補に対応する、パラメータ算出用の画像特徴量である。d(x,y)は,x,yの距離を表し,例えばユークリッド距離が採用される。式(7)により、検索目標画像に関する第1の線形変換後の画像特徴量yinとの距離dが最小となるパラメータ算出用の画像特徴量に対応する第2の線形パラメータ候補Aiが、第2の線形パラメータAに決定される。なお,得られたd(y,yin)が所定の閾値より大きい場合、適切な線形変換パラメータでない可能性がある。その場合は精度低下の恐れがあるため、決定部804は出力部807を介して警告を出力する。
変換部805は、決定部804によって決定された線形変換パラメータにより、検索目標画像に関する画像特徴量を変換する。具体的には、たとえば、変換部805は、決定部804にとって決定された第2の線形変換パラメータにより、第1の線形変換パラメータにより変換される前の検索目標画像に関する画像特徴量を線形変換する。
また、変換部805は、第2の線形変換パラメータにより、画像特徴量検索部803による検索結果である画像特徴量を変換する。具体的には、決定部804にとって決定された第2の線形変換パラメータを用いる画像特徴量検索部803では、代表特徴量が検索されるため、変換部805は、検索された代表特徴量に対応するクラスタIDを参照することによりクラスタを特定し、特定したクラスタ内の各画像特徴量を変換する。このように、第2の線形変換パラメータによる変換を、「第2の線形変換」と称す。
画像検索部806は、変換部805によって検索目標画像に関する画像特徴量から変換された第1の変換結果と、変換部805によって検索部による検索結果である画像特徴量から変換された第2の変換結果と、に基づいて、検索結果である各画像特徴量の抽出元の画像群の中から検索目標画像に類似する画像を検索する。第1の変換結果とは、変換部805において、検索目標画像に関する画像特徴量を第2の線形変換パラメータにより変換した画像特徴量である。同様に、第2の変換結果とは、変換部805において、代表特徴量のクラスタ内の各画像特徴量を第2の線形変換パラメータにより変換した画像特徴量である。
画像検索部806での検索についても、たとえば、ベクトル間のユークリッド距離やマハラノビス距離、Bhattacharyya距離により、第1の変換結果に類似する画像特徴量を検索する。距離が小さいほど画像同士が類似する。
出力部807は、画像検索部806によって検索された検索結果を出力する。また、出力部807は、上述した決定部804による警告を出力してもよい。出力形式としては、出力部807は、ディスプレイやプリンタである出力デバイス304から出力してもよい。また、出力部807は、通信IF305から外部装置に送信してもよい。また、出力部807は、記憶デバイス302に格納してもよい。
図9は、実施例1にかかる決定部804による警告の出力例を示す説明図である。図9では、ディスプレイに警告画面900が表示される。
<画像検索処理手順>
図10は、実施例1にかかる画像検索装置300による画像検索処理手順例を示すフローチャートである。画像検索装置300は、まず、取得部801により検索目標画像に関する画像特徴量を取得し(ステップS1001)、線形変換処理を実行する(ステップS1002)。線形変換処理(ステップS1002)の詳細については図11で後述するが、線形変換処理(ステップS1002)により、変換部805からの第1および第2の変換結果が得られる。
線形変換処理(ステップS1002)のあと、画像検索装置300は、画像検索部806による画像検索処理を実行し(ステップS1003)、出力部807により、検索結果を出力する(ステップS1004)。これにより、一連の画像検索処理を終了する。
図11は、図10に示した線形変換処理(ステップS1002)の詳細な処理手順例を示すフローチャートである。画像検索装置300は、まず、生成部802により検索目標画像に関する画像特徴量を、第1の線形変換パラメータにより変換することにより、線形変換後の画像特徴量を生成する(ステップS1101)。
つぎに、画像検索装置300は、ステップS1101で得られた画像特徴量に類似する代表画像特徴量を検索する画像特徴量検索処理を実行する(ステップS1102)。そして、画像検索装置300は、決定部804による決定処理を実行する(ステップS1103)。決定処理(ステップS1103)の詳細については後述する。
ステップS1103のあと、画像検索装置300は、変換部805により、第2の線形変換パラメータで、ステップS101で生成された画像特徴量を線形変換する(ステップS1104)。この線形変換により得られるのが第1の変換結果である。また、画像検索装置300は、変換部805により、ステップS1102で検索された代表特徴量が所属するクラスタ内の各 画像特徴量を、第2の線形変換パラメータで線形変換する(ステップS1105)。この線形変換により得られるのが第2の変換結果である。このあと、図10のステップS1003に移行する。
図12は、図11に示した決定処理(ステップS1103)の詳細な処理手順例を示すフローチャートである。ここでは、第2の線形変換パラメータ候補をP2iと表記し、パラメータ算出用の画像特徴量をC(P2i)と表記する。iはインデックス(iは1以上の整数とする)である。
まず、第2の線形変換パラメータ候補のインデックスiをi=1とし(ステップS1201)、第2の線形変換パラメータ候補P2iに対応するパラメータ算出用の画像特徴量C(P2i)を第2の線形変換パラメータ辞書700から抽出する(ステップS1202)。つぎに、画像検索装置300は、第1の線形変換後における検索目標画像に関する画像特徴量と画像特徴量C(P2i)との距離dを算出する(ステップS1203)。画像検索装置300は、算出した距離dがしきい値D以上であるか否か判断する(ステップS1204)。しきい値D以上でない場合(ステップS1204:No)、画像特徴量C(P2i)に対応する第2の線形変換パラメータ候補P2iを第2の線形変換パラメータ辞書700から抽出し(ステップS1205)、ステップS1206に移行する。
一方、しきい値D以上である場合(ステップS1204:Yes)、画像特徴量C(P2i)に対応する第2の線形変換パラメータ候補P2iを第2の線形変換パラメータ辞書700から抽出せずに、ステップS1206に移行する。ステップS1206では、画像検索装置300は、インデックスiをインクリメントし(ステップS1206)、インクリメント後のインデックスiがnより大きいか否かを判断する(ステップS1207)。nは第2の線形変換パラメータ候補の総数である。インデックスiがn以下である場合(ステップS1207:No)、ステップS1202に戻る。
一方、インデックスiがnより大きい場合(ステップS1207:Yes)、画像検索装置300は、ステップS1205において抽出された第2の線形変換パラメータ候補があるか否かを判断する(ステップS1208)。抽出された第2の線形変換パラメータ候補がない場合(ステップS1208:No)、画像検索装置300は、出力部807を介して警告を出力する(ステップS1209)。一方、第2の線形変換パラメータ候補がある場合(ステップS1208:Yes)、画像検索装置300は、抽出された中で距離dが最小となる第2の線形変換パラメータ候補P2iを、第2の線形変換パラメータに決定する(ステップS1210)。このあと、ステップS1104に移行する。
このように、実施例1によれば、ばらつきが等方的な画像特徴量を持つ局所的な画像群ごとに第2の線形変換パラメータ候補をデータベース化しておくことにより、非線形変換を適用することなく線形変換により画像特徴量を変換することができる。したがって、画像特徴量の変換処理の高速化を図ることができるとともに、線形変換でありながら非線形変換と同等の変換精度を維持することができる。
また、クラスタデータベース500を用いることにより、検索対象を代表特徴量群に絞り込むことができるため、検索処理の高速化を実現することができる。また、事前に検索目標画像を第1の線形変換により線形変換することにより、検索目標画像に関する画像特徴量を圧縮することができ、画像特徴量検索部803による検索の高速化を実現することができる。
(実施例2)
つぎに、実施例2について説明する。実施例1では、変換部805による第2の線形変換において、検索目標画像に関する画像特徴量については、第1の線形変換パラメータにより線形変換されていない画像特徴量を用いた。これに対し、実施例2では、変換部805による第2の線形変換において、検索目標画像に関する画像特徴量については、第1の線形変換パラメータにより線形変換された画像特徴量を用いる。第1の線形変換後の画像特徴量は、元の画像特徴量に対して低次元化することができるため、実施例1と比較して第2の線形変換の高速化を図ることができる。
図13は、実施例2にかかる画像特徴量データベース1300の記憶内容例を示す説明図である。実施例1の画像特徴量データベース00との相違は、データIDに関連付けられている画像特徴量が、第1の線形変換後の画像特徴量である点である。実施例2では、変換部805に与えられる検索目標画像に関する画像特徴量が、第1の線形変換後の画像特徴量であるため、検索対象となる画像特徴量データベース1300内の画像特徴量も、対応して第1の線形変換パラメータにより変換される。
<画像検索装置300の機能的構成例>
図14は、実施例2にかかる画像検索装置300の機能的構成例を示すブロック図である。実施例1と同一構成には同一符号を付し、その説明を省略する。実施例2にかかる画像検索装置300は、変換部805に与えられる検索目標画像に関する画像特徴量が、第1の線形変換後の画像特徴量であるため、取得部801によって取得された検索目標画像に関する画像特徴量が変換部805に与えられるのではなく、生成部802により第1の線形変換がされた検索目標画像に関する画像特徴量が変換部805に与えられる。また、変換部805は、図4の画像特徴量データベース400ではなく、図13の画像特徴量データベース1300を参照する。
<画像検索処理手順>
つぎに、実施例2にかかる画像検索装置300による画像検索処理手順例について説明する。画像検索処理手順は、図10に示した処理手順と同一処理手順であるため、説明を省略する。
図15は、実施例2にかかる線形変換処理(ステップS1002)の詳細な処理手順例を示すフローチャートである。実施例1と同一処理には同一ステップ番号を付し、その説明を省略する。
図15において、画像検索装置300は、決定処理(ステップS1103)のあと、決定処理(ステップS1103)で得られた第2の線形変換パラメータにより、第1の線形変換がされた検索目標画像に関する画像特徴量を変換する(ステップS1504)。この変換された画像特徴量が第1の変換結果となる。
このように、実施例2によれば、変換部805による第2の線形変換において、検索目標画像に関する画像特徴量については、第1の線形変換パラメータにより線形変換された画像特徴量を用いる。したがって、第1の線形変換後の画像特徴量は、元の画像特徴量に対して低次元化することができるため、実施例1と比較して第2の線形変換の高速化を図ることができる。
(実施例3)
つぎに、実施例3について説明する。実施例3は、実施例1および実施例2において、クラスタデータベース500および画像特徴量データベース400、1300を更新する例である。実施例1及び実施例2との共通部分については、同一符号を付し、その説明を省略する。
<画像検索装置300の機能的構成例>
図16は、実施例3にかかる画像検索装置300の機能的構成例を示すブロック図である。画像検索装置300は、第1の線形変換パラメータ辞書600と、クラスタデータベース500と、画像特徴量データベース400、1300と、取得部801と、生成部802と、更新部1601と、格納部1602と、を有する。更新部1601および格納部1602は、具体的には、たとえば、図3に示したプロセッサ301にプログラムを実行させることによりその機能を実現する。
取得部801は、登録対象となる画像(登録対象画像)に関する画像特徴量を取得する。取得方法は、上述した検索目標画像と同様である。生成部802は、登録対象画像に関する画像特徴量を、第1の線形変換パラメータにより線形変換し、第1の線形変換後の画像特徴量を生成する。生成方法は、上述した検索目標画像と同様である。
更新部1601は、登録対象となる画像を含んでクラスタに属する画像の更新、クラスタデータベース500の代表特徴量の更新を行う。
実施例1においては、格納部1602は、取得部801から取得した登録対象となる画像に関する第1の線形変換前の画像特徴量を、画像特徴量データベース1300に登録する。これに対し実施例2においては、格納部1602は、生成部802から取得した登録対象となる画像に関する第1の線形変換後の画像特徴量を、画像特徴量データベース1300に登録する。
<画像特徴量の更新処理手順例>
図17は、実施例3にかかる画像特徴量の更新処理手順例を示すフローチャートである。まず、画像検索装置300は、取得部801により登録対象画像に関する画像特徴量を取得する(ステップS1701)。つぎに、画像検索装置300は、取得された画像特徴量について第1の線形変換処理を実行する(ステップS1702)。つぎに、画像検索装置300は、更新部1601により上述した更新処理を実行し(ステップS1703)、格納部1602により上述した格納処理を実行する(ステップS1704)。
このように、更新部1601および格納部1602により、登録対象画像が与えられた場合、クラスタデータベース500および画像特徴量データベース400、1300を最新の状態することができ、線形変換の信頼度の向上を図ることができる。
(実施例4)
つぎに、実施例4について説明する。実施例4では、実施例1および実施例2にかかる画像検索装置300をネットワークシステムに適用した例である。
図18は、実施例4にかかるネットワークシステムの構成例を示す説明図である。ネットワークシステム1800は、画像検索装置300と検索装置1802と記憶装置1803と端末1804とが、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワーク1805により通信可能に接続される。ネットワークシステム1800は、たとえば、画像検索装置300と検索装置1802と記憶装置1803によりクラウド1910を実現する。
実施例1および実施例2にかかる画像検索装置300は、第2の線形変換された画像特徴量を用いて画像検索を実行したが、実施例4では、画像検索装置300は、第2の線形変換された画像特徴量を用いた画像検索を実行しない。第2の線形変換された画像特徴量を用いた画像検索については、画像検索部806を有する検索装置1802が実行する。また、クラスタデータベース500、および画像特徴量データベース400、1300については、記憶装置1803が記憶する。また、記憶装置1803は、データIDにより指定される画像も記憶する。端末1804は、クラウド1910に対し検索目標画像を送信すると、クラウド1910から検索目標画像に類似する画像を受信することになる。端末1804は、クラウド1910に対し検索目標画像に関する画像特徴量を送信してもよい。
19は、実施例4にかかるネットワークシステム1800の機能的構成例を示すブロック図である。画像検索装置300は、実施例1および実施例2の機能的構成において、画像検索部806および出力部807に替えて、通信部1900を有する。通信部1900は、変換部805によって第2の線形変換された画像特徴量を検索装置1802に送信する。また、画像検索装置300は、記憶装置1803内のクラスタデータベース500および画像特徴量データベース400、1300にアクセスし、実施例1および実施例2と同様の処理を実行する。なお、画像検索部806による検索結果については、検索目標画像を送信した端末1804に対し、検索装置1802が送信してもよく、検索装置1802から検索結果を受信した画像検索装置300が送信してもよい。
<画像検索処理手順>
図2は、クラウド1910による画像検索処理手順例を示すフローチャートである。図2において、左側のフローが画像検索装置300のフローであり、右側のフローが検索装置1802のフローである。まず、画像検索装置300のフローについて説明する。
画像検索装置300は、まず、取得部801により検索目標画像に関する画像特徴量をある端末1804から取得し(ステップS2001)、線形変換処理を実行する(ステップS2002)。線形変換処理(ステップS2002)は、線形変換処理(ステップS1002)と同一処理である。
線形変換処理(ステップS2002)のあと、画像検索装置300は、線形変換処理(ステップS2002)による第1および第2の変換結果を検索装置1802に送信する(ステップS2003)。そして、画像検索装置300は、検索装置1802から検索結果を受信すると、検索目標画像を送信した端末1804に対し、検索結果を送信する(ステップS2005)。
つぎに、検索装置1802のフローについて説明する。検索装置1802は、画像検索装置300から第1および第2の変換結果(ステップS2003)を受信すると(ステップS2111)、画像検索部806により画像検索を実行する(ステップS2112)。そして、検索装置1802は、検索結果を画像検索装置300に送信する(ステップS2113)。これによりクラウド1910による一連の画像検索処理が終了する。
このように、上述した画像検索装置300およびネットワークシステム1800によれば、ばらつきが同一方向に揃った画像特徴量に基づく線形変換パラメータをデータベース化し、その線形変換パラメータの集合の中から検索目標画像に最適な線形変換パラメータを選択する。したがって、線形変換を利用することにより、画像特徴量の変換処理の高速化を図ることができるとともに、線形変換でありながら非線形変換と同等の変換精度を維持することができる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、ICカード、SDカード、DVD等の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

Claims (9)

  1. 複数の画像特徴量を蓄積する記憶部と、
    検索目標画像に関する第1の画像特徴量を取得する取得部と、
    前記取得部によって取得された前記第1の画像特徴量に基づいて、前記記憶部に蓄積された複数の画像特徴量の中から、前記第1の画像特徴量と類似する画像特徴量を検索する検索部と、
    同一の被写体について複数の条件により得られた複数の被写体画像に関する複数の画像特徴量に基づく線形変換パラメータの集合の中から、前記第1の画像特徴量と前記被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定する決定部と、
    前記決定部によって決定された線形変換パラメータにより、前記第1の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索部による検索結果である画像特徴量を変換する変換部と、
    前記変換部によって変換された変換結果を出力する出力部と、
    を有することを特徴とする画像検索装置。
  2. 前記複数の画像特徴量は、類似しあう画像特徴量の集合を複数有する画像特徴量集合群の各々の集合の代表的な画像特徴量であることを特徴とする請求項1に記載の画像検索装置。
  3. 前記変換部は、前記線形変換パラメータにより、前記第1の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索部による検索結果である代表的な画像特徴量が所属する集合内の各画像特徴量を変換することを特徴とする請求項2に記載の画像検索装置。
  4. 前記線形変換パラメータとは異なる他の線形変換パラメータにより、前記取得部によって取得された前記第1の画像特徴量を変換して、前記検索目標画像に関する第2の画像特徴量を生成する生成部、をさらに有し、
    前記検索部は、前記複数の画像特徴量の中から、前記生成部によって生成された前記第2の画像特徴量に類似する画像特徴量を検索し、
    前記決定部は、前記線形変換パラメータの集合の中から、前記第2の画像特徴量と前記被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定することを特徴とする請求項1に記載の画像検索装置。
  5. 前記決定部は、前記第1の画像特徴量と前記被写体に関する画像特徴量とに基づいて、前記変換部に適用すべき線形変換パラメータが存在するか否かを判断し、存在する場合には当該線形変換パラメータを前記変換部に出力し、存在しない場合には存在しないことを示す情報を出力することを特徴とすることを特徴とする請求項1に記載の画像検索装置。
  6. 前記線形変換パラメータとは異なる他の線形変換パラメータにより、前記取得部によって取得された前記第1の画像特徴量を変換して、前記検索目標画像に関する第2の画像特徴量を生成する生成部、をさらに有し、
    前記複数の画像特徴量の各々の画像特徴量は、前記他の線形変換パラメータにより変換された画像特徴量であり、
    前記検索部は、前記複数の画像特徴量の中から、前記生成部によって生成された前記第2の画像特徴量に類似する画像特徴量を検索し、
    前記決定部は、前記線形変換パラメータの集合の中から、前記第2の画像特徴量と前記被写体に関する画像特徴量とに基づいて、前記線形変換パラメータを決定し、
    前記変換部は、前記線形変換パラメータにより、前記第2の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索部による検索結果である画像特徴量を変換することを特徴とする請求項1に記載の画像検索装置。
  7. 前記変換部によって前記第1の画像特徴量から変換された第1の変換結果と、前記変換部によって前記検索部による検索結果である画像特徴量から変換された第2の変換結果と、に基づいて、前記検索結果である各画像特徴量の抽出元の画像群の中から前記検索目標画像に類似する画像を検索する画像検索部、をさらに有し、
    前記出力部は、前記画像検索部によって検索された画像を出力することを特徴とする請求項1に記載の画像検索装置。
  8. 検索目標画像に関する第1の画像特徴量を取得する取得手順と、
    複数の画像特徴量の中から、前記取得手順によって取得された前記第1の画像特徴量に類似する画像特徴量を検索する検索手順と、
    同一の被写体について複数の条件により得らえた複数の被写体画像に関する複数の画像特徴量に基づく線形変換パラメータの集合の中から、前記第1の画像特徴量と前記被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定する決定手順と、
    前記決定手順によって決定された線形変換パラメータにより、前記第1の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索手順による検索結果である画像特徴量を変換する変換手順と、
    前記変換手順によって変換された変換結果を出力する出力手順と、
    を有することを特徴とする画像検索方法。
  9. プロセッサが実行するプログラムを格納する前記プロセッサにより読み取り可能な非一時的な記録媒体であって、
    前記プロセッサに、
    検索目標画像に関する第1の画像特徴量を取得する取得手順と、
    複数の画像特徴量の中から、前記取得手順によって取得された前記第1の画像特徴量に類似する画像特徴量を検索する検索手順と、
    同一の被写体について複数の条件により得らえた複数の被写体画像に関する複数の画像特徴量に基づく線形変換パラメータの集合の中から、前記第1の画像特徴量と前記被写体に関する画像特徴量とに基づいて、線形変換に用いる線形変換パラメータを決定する決定手順と、
    前記決定手順によって決定された線形変換パラメータにより、前記第1の画像特徴量を変換するとともに、前記線形変換パラメータにより、前記検索手順による検索結果である画像特徴量を変換する変換手順と、
    前記変換手順によって変換された変換結果を出力する出力手順と、
    を実行させることを特徴とする画像検索プログラムを記録した非一時的な記録媒体。
JP2015511122A 2013-04-09 2014-01-29 画像検索装置、画像検索方法、および記録媒体 Active JP5866064B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015511122A JP5866064B2 (ja) 2013-04-09 2014-01-29 画像検索装置、画像検索方法、および記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2013081088 2013-04-09
JP2013081088 2013-04-09
JP2015511122A JP5866064B2 (ja) 2013-04-09 2014-01-29 画像検索装置、画像検索方法、および記録媒体
PCT/JP2014/051937 WO2014167880A1 (ja) 2013-04-09 2014-01-29 画像検索装置、画像検索方法、および記録媒体

Publications (2)

Publication Number Publication Date
JP5866064B2 true JP5866064B2 (ja) 2016-02-17
JPWO2014167880A1 JPWO2014167880A1 (ja) 2017-02-16

Family

ID=51689298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015511122A Active JP5866064B2 (ja) 2013-04-09 2014-01-29 画像検索装置、画像検索方法、および記録媒体

Country Status (3)

Country Link
US (1) US9576222B2 (ja)
JP (1) JP5866064B2 (ja)
WO (1) WO2014167880A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445545A (zh) * 2020-02-27 2020-07-24 北京大米未来科技有限公司 一种文本转贴图方法、装置、存储介质及电子设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803054B (zh) * 2015-11-26 2019-04-23 腾讯科技(深圳)有限公司 人脸模型矩阵训练方法和装置
US11514642B2 (en) * 2016-10-08 2022-11-29 Purdue Research Foundation Method and apparatus for generating two-dimensional image data describing a three-dimensional image
CN109410212B (zh) * 2018-10-11 2021-06-22 陕西师范大学 一种交互式图像分割方法
WO2024079864A1 (en) * 2022-10-14 2024-04-18 Mitsubishi Electric Corporation Image retrieval apparatus

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
JP2005512201A (ja) * 2001-12-03 2005-04-28 本田技研工業株式会社 カーネルフィッシャーフェイスを使用した顔認識
JP2008090612A (ja) * 2006-10-02 2008-04-17 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
JP2009140513A (ja) * 2002-07-16 2009-06-25 Nec Corp パターン特徴抽出方法及びその装置
WO2012102018A1 (ja) * 2011-01-25 2012-08-02 三菱電機株式会社 画像検索装置及び方法、画像処理装置及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4292837B2 (ja) 2002-07-16 2009-07-08 日本電気株式会社 パターン特徴抽出方法及びその装置
BRPI0712728A2 (pt) * 2006-05-29 2013-01-08 Univ Wollongong recuperaÇço de imagem baseado em conteédo
KR100886557B1 (ko) * 2007-05-03 2009-03-02 삼성전자주식회사 적응형 학습에 기반한 얼굴 인식 시스템 및 방법
US8280196B2 (en) * 2009-05-12 2012-10-02 Canon Kabushiki Kaisha Image retrieval apparatus, control method for the same, and storage medium
US9346982B2 (en) * 2010-08-16 2016-05-24 Convatec Technologies Inc. Amphiphilic pressure sensitive adhesives for human skin adhesion
KR101191223B1 (ko) * 2011-11-16 2012-10-15 (주)올라웍스 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
JP2005512201A (ja) * 2001-12-03 2005-04-28 本田技研工業株式会社 カーネルフィッシャーフェイスを使用した顔認識
JP2009140513A (ja) * 2002-07-16 2009-06-25 Nec Corp パターン特徴抽出方法及びその装置
JP2008090612A (ja) * 2006-10-02 2008-04-17 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
WO2012102018A1 (ja) * 2011-01-25 2012-08-02 三菱電機株式会社 画像検索装置及び方法、画像処理装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111445545A (zh) * 2020-02-27 2020-07-24 北京大米未来科技有限公司 一种文本转贴图方法、装置、存储介质及电子设备
CN111445545B (zh) * 2020-02-27 2023-08-18 北京大米未来科技有限公司 一种文本转贴图方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
JPWO2014167880A1 (ja) 2017-02-16
US9576222B2 (en) 2017-02-21
WO2014167880A1 (ja) 2014-10-16
US20160078314A1 (en) 2016-03-17

Similar Documents

Publication Publication Date Title
CN106575365B (zh) 对象识别特点分析系统和方法
Lindner et al. Robust and accurate shape model matching using random forest regression-voting
JP5866064B2 (ja) 画像検索装置、画像検索方法、および記録媒体
Chauhan et al. An efficient data mining classification approach for detecting lung cancer disease
US11301509B2 (en) Image search system, image search method, and program
JP5424819B2 (ja) 画像処理装置、画像処理方法
JP5565190B2 (ja) 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置
US20190065913A1 (en) Search method and information processing apparatus
JP6070956B2 (ja) 類似性検出装置及び指向性近傍検出方法
JP6270182B2 (ja) 属性要因分析方法、装置、およびプログラム
JP2014041560A (ja) 画像処理装置、画像処理方法
JPWO2016147260A1 (ja) 画像検索装置、及び画像を検索する方法
Cholewa et al. Estimation of the number of states for gesture recognition with Hidden Markov Models based on the number of critical points in time sequence
JPWO2020050413A1 (ja) 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体
JP2022037955A (ja) 学習モデルを選択するシステム
CN110910325B (zh) 一种基于人工蝴蝶优化算法的医疗影像处理方法及装置
JP2012159885A (ja) 情報照合装置、情報照合システム、情報照合方法および情報照合プログラム
Sisodia et al. Fast and accurate face recognition using SVM and DCT
JP5569698B2 (ja) 類型化装置、類型化方法及び類型化プログラム
JP2011141866A (ja) データ分類装置、データ分類システムおよびプログラム
JPWO2015068417A1 (ja) 画像照合システム、画像照合方法およびプログラム
WO2021145030A1 (ja) 映像検索システム、映像検索方法、及びコンピュータプログラム
US20240013357A1 (en) Recognition system, recognition method, program, learning method, trained model, distillation model and training data set generation method
Okuwobi et al. Three-dimensional (3D) facial recognition and prediction
WO2022172445A1 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent or registration of utility model

Ref document number: 5866064

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250