JP6017277B2 - 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 - Google Patents
特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 Download PDFInfo
- Publication number
- JP6017277B2 JP6017277B2 JP2012255899A JP2012255899A JP6017277B2 JP 6017277 B2 JP6017277 B2 JP 6017277B2 JP 2012255899 A JP2012255899 A JP 2012255899A JP 2012255899 A JP2012255899 A JP 2012255899A JP 6017277 B2 JP6017277 B2 JP 6017277B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- query
- feature vector
- feature vectors
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、リファレンス特徴ベクトル蓄積手段からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索するリファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する対象リファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出するスコア算出手段と、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする類似度算出手段と
してコンピュータを機能させることを特徴とする。
スコア算出手段は、上位N件の各リファレンス特徴ベクトルとの間の距離に対する、最も類似する対象リファレンス特徴ベクトルとの間の距離の順位が、
上位N件以内にある場合、スコア1とし、
上位N件以内にない場合、スコア0とする
ようにコンピュータを機能させることも好ましい。
スコア算出手段は、上位N件の各リファレンス特徴ベクトルとの間の距離に対する、最も類似する対象リファレンス特徴ベクトルとの間の距離の順位が、K位に相当する場合、スコアを以下の式によって算出する
si=log{λ/(1-λ)・|Rall|/(K・|R|)+1}
λ:調整可能パラメータ
|R|:対象リファレンスコンテンツの中の特徴ベクトルの数
|Rall|:リファレンス特徴ベクトル蓄積手段に蓄積された
リファレンス特徴ベクトルの数
ようにコンピュータを機能させることも好ましい。
類似度算出手段は、クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似した対象リファレンス特徴ベクトルとの対応関係を求め、その対応関係の集合からクエリコンテンツと対象リファレンスコンテンツとの間のHomography行列を算出し、そのHomogprahy行列を満たす対応関係を持つクエリコンテンツの特徴ベクトルについてのスコアのみを合計するようにコンピュータを機能させることも好ましい。
類似度算出手段は、Homography行列を、クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルとの対応関係のうち、スコアが大きい対応関係から順に用いて算出するようにコンピュータを機能させることも好ましい。
リファレンス特徴ベクトル蓄積手段は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルをM(>1)個探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
を有し、
類似度算出プログラムが、投票手段によって出力された各リファレンスコンテンツツRjについて、クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出することによって再度順位を並び替える
ようにコンピュータを機能させることを特徴とする。
投票手段は、クエリコンテンツの特徴ベクトルqiに対するリファレンスコンテンツjのスコアsjを、以下の式によって算出する
sj=log{λ/(1-λ)・|Rall|/(a・|Rj|)+1}
a: リファレンスコンテンツjの特徴ベクトルが上位M件の中で
初めて出現する番号
|Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
|Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
λ、1-λ: 混合パラメータ
ようにコンピュータを機能させることも好ましい。
クエリコンテンツ及びリファレンスコンテンツは、画像であって、
リファレンスコンテンツとしての画像には、同一の物体又は同一カテゴリに属する少なくとも1つのインスタンス(対象物、オブジェクト)が写っている
ことも好ましい。
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、リファレンス特徴ベクトル蓄積手段からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索するリファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する対象リファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出するスコア算出手段と、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする類似度算出手段と
を有することを特徴とする。
リファレンス特徴ベクトル蓄積手段は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
を有し、
類似度算出プログラムが、投票手段によって出力された各リファレンスコンテンツツRjについて、クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出することによって再度順位を並び替える
ことを特徴とする。
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積部を有し、
クエリコンテンツの各クエリ特徴ベクトルについて、リファレンス特徴ベクトル蓄積部からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索する第1のステップと、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する第2のステップと、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出する第3のステップと、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする第4のステップと
を有することを特徴とする。
リファレンス特徴ベクトル蓄積部は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
第1のステップの前段として、
リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルの集合Dを、少なくとも1つ以上探索する第01のステップと、
混合パラメータλを用いて、クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する第02のステップと
を更に有し、
第1から第4のステップを実行することによって、第02のステップによって出力された各リファレンスコンテンツツRjについて、クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出し、再度順位を並び替える
ことを特徴とする。
<クエリコンテンツと対象リファレンスコンテンツとの間の類似度の算出>
<クエリコンテンツに類似するリファレンスコンテンツの検索>
本発明は、基本的に、特徴ベクトルの集合で表されるクエリコンテンツと対象リファレンスコンテンツとの間の類似度を算出するプログラム、装置及び方法に関する。
リファレンス特徴ベクトル蓄積部10は、多数のリファレンスコンテンツから抽出された各特徴ベクトルを記憶する。
特徴ベクトル集合抽出部11は、1つのマルチメディアコンテンツから、特徴ベクトルの集合を抽出する。例えばマルチメディアコンテンツが画像である場合、その特徴ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルである。
また、特徴ベクトル集合抽出部11は、対象リファレンスコンテンツから対象リファレンス特徴ベクトルの集合R(={Rj})を抽出し、それらリファレンス特徴ベクトルの集合Rは、対象リファレンス特徴ベクトル検索部13へ出力される。尚、クエリコンテンツのクエリ特徴ベクトルと、対象リファレンスコンテンツの対象リファレンス特徴ベクトルとは、同じ次元数である。
リファレンス特徴ベクトル検索部12は、クエリコンテンツの各クエリ特徴ベクトルについて、リファレンス特徴ベクトル蓄積部10を参照し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索する。検索されたN件のリファレンス特徴ベクトルは、スコア算出部14へ出力される。
対象リファレンス特徴ベクトル検索部13は、クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する。図3によれば、クエリ特徴ベクトルqiに最も類似する対象リファレンス特徴ベクトルrjが、×によって表されている。検索された最も類似する対象リファレンス特徴ベクトルは、スコア算出部14へ出力される。
スコア算出部14は、クエリコンテンツの各クエリ特徴ベクトルqiについて、最も類似する対象リファレンス特徴ベクトルrjとの間の距離dが、上位N件の各リファレンス特徴ベクトルとの間の距離d1〜dNにおける上位から何位(=K)に相当するかの順位に基づいてスコアsiを算出する。
上位N件以内にある場合(d1≦d≦dN)->スコアsi=1
上位N件以内にない場合(dN<d) ->スコアsi=0
si=log{λ/(1-λ)・|Rall|/(K・|R|)+1}
λ:調整可能パラメータ
|R|:対象リファレンスコンテンツの中の特徴ベクトルの数
|Rall|:リファレンス特徴ベクトル蓄積部に蓄積された
リファレンス特徴ベクトルの数
但し、dN<dである場合、スコアsi=0とする。
第1の方法:si=1
第2の方法:si=log{λ/(1-λ)・|Rall|/(1・|R|)+1}
第1の方法:si=1
第2の方法:si=log{λ/(1-λ)・|Rall|/(4・|R|)+1}
第1の方法:si=0
第2の方法:si=0
類似度算出部15は、クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする。
(1)マッチング結果となるリファレンス特徴ベクトルに対して所定閾値以下の近くに射影されれば、inlierと判定する。
(2)逆に、所定閾値よりも遠くに射影されれば、outlierと判定する。
この処理を複数回実行した後、inlierの数が最も多かったHomography行列のみを採用する。
本発明は、前述した類似度算出機能を用いて、大量のリファレンスコンテンツの中から、クエリコンテンツに類似するリファレンスコンテンツを検索するプログラム、装置及び方法を実現することもできる。
特徴ベクトル集合抽出部11は、リファレンスコンテンツ毎に特徴ベクトルの集合を抽出し、それら特徴ベクトルの集合をリファレンス特徴ベクトル蓄積部10へ出力する。また、特徴ベクトル集合抽出部11は、クエリコンテンツから特徴ベクトルの集合Q(={qi})を抽出し、それら特徴ベクトルの集合を類似ベクトル探索部21へ出力する。尚、リファレンスコンテンツの特徴ベクトルと、クエリコンテンツの特徴ベクトルとは、同じ次元数である。
リファレンス特徴ベクトル蓄積部10は、複数のリファレンスコンテンツRjから抽出された各特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶する。
類似ベクトル探索部21は、リファレンス特徴ベクトル蓄積部10を用いて、クエリコンテンツの各特徴ベクトルqiについて、類似した特徴ベクトルを持つリファレンスコンテンツの特徴ベクトルの上位A(≧1)件を探索する。クエリコンテンツの特徴ベクトルqiと、リファレンスコンテンツの特徴ベクトルとの間の距離が短いほど、類似度が高いことを意味する。具体的には、最近傍探索(Approximate Nearest Neighbor)アルゴリズムの1つである直積量子化を用いた方法(例えば非特許文献5参照)やHamming Embeddingを用いた方法(例えば非特許文献2参照)、LSH(Locality-Sensitive Hashing)を用いることも好ましい。探索された1つ以上の特徴ベクトルの集合Dに基づくリファレンスコンテンツIDは、投票部22へ出力される。
投票部22は、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する。投票部22は、従来技術によればIDFによって投票していたのに対し、本発明によれば、以下に詳述する算出式によって投票される。
j’=argmaxjp(Rj|Q)
Q:クエリコンテンツの特徴ベクトルの集合
Rj:j番目のリファレンスコンテンツの特徴ベクトルの集合
p(Rj|Q):クエリコンテンツの特徴ベクトルの集合Qから、
リファレンスコンテンツの特徴ベクトルの集合Rjが生成される事後確率
argmaxj:右項の事後確率を最大とするjを導出することを意味する
j’=argmaxjp(Rj|Q)=argmaxj p(Q|Rj)p(Rj)
p(Q|Rj):リファレンスコンテンツの特徴ベクトルの集合Rjから、
クエリコンテンツの特徴ベクトルの集合Qが生成される尤度確率
p(Rj) :リファレンスコンテンツの特徴ベクトルの集合Rjが検索される
事前確率
(p(Rj)が高いほど、検索される確率が高いことを意味する)
j’=argmaxjp(Q|Rj)
j’=argmaxjΠi=1 n p(qi|Rj)
j’=argmaxjΠi=1 n p(qi|Rj)=argmaxjΣi=1 n logp(qi|Rj)
j’=argmaxjΣi=1 n logp(qi|Rj)
=argmaxjΣi=1 n log(λp(qi|Rj)+(1-λ)・p(qi))
=argmaxjΣi=1 n (log(λp(qi|Rj)+(1-λ)・p(qi))−log(1-λ)・p(qi))
=argmaxjΣi=1 n log{λ/(1-λ)・p(qi|Rj)/p(qi)+1}
i:クエリコンテンツの特徴ベクトルのID
λ:線形結合の混合パラメータ
p(qi):リファレンスコンテンツとは無関係な背景モデルから生成された確率
(クエリコンテンツにおける対象物と無関係な背景画像に基づく)
λp(qi|Rj)+(1-λ)・p(qi):
λにおけるp(qi|Rj)の確率と、(1-λ)におけるp(qi)の確率との和は、
全体の確率を意味する
−log(1-λ)・p(qi):
変形のため全体的なペナルティを引いても、順番は変わらない。
後述する式の変形のためのもの。
λ/(1-λ)・p(qi|Rj)/p(qi)+1:
"loga−logb=loga/b"に基づいて、式を変形したもの
sij=log{λ/(1-λ)・p(qi|Rj)/p(qi)+1}
i:クエリコンテンツの特徴ベクトルのID
j:リファンレンスコンテンツのID
qi:クエリコンテンツの特徴ベクトル
Rj:リファンレンスコンテンツ
sijとは、クエリコンテンツ特徴ベクトルqiが観測された際に、qiそれぞれが、リファンレンスコンテンツjが得られるスコアを意味する。即ち、qiが観測された時点で、それぞれが、リファレンスコンテンツjから生成された尤もらしさを意味する。
それ以外のRjについては、p(qi|Rj)=0とする
このとき、sij=log(1)=0となるために、上位A件に対応する特徴ベクトルが含まれないリファレンスコンテンツのスコアは増減しない。
p(qi|Rj)=1/(|Rj|・Va)
p(qi)=a/(|Rall|・Va)
Rall:リファレンスコンテンツ全ての特徴ベクトル集合
a:リファレンスコンテンツjの特徴ベクトルが上位A件の中で
初めて出現する番号
Va:qiとa番目の特徴ベクトルとの距離を半径とする超球(3次元以上)
の体積(尚、2次元であれば面積、1次元であれば長さを表す)
ここで、p(qi)は、|Rall|個(k近傍密度推定法におけるN)のうち、a個(k近傍密度推定法におけるk)が落ちる確率を、体積Vaで割ったものであることを表す。
sij=log{λ/(1-λ)・(|Rall|/a・|Rj|)+1}
sj=log{λ/(1-λ)・(|Rall|/a・|Rj|)+1)}
a:リファレンスコンテンツjの特徴ベクトルが上位A件の中で
初めて出現する番号
|Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
|Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
λ、1-λ: 混合パラメータ
以下では、本発明における類似ベクトル探索部21及び投票部22における具体的な処理内容について詳述する。
リファレンスコンテンツID=1:
score1=score1+log{λ/(1-λ)・(|Rall|/1|R1|)+1}
(第2の特徴ベクトル、a=2番目)
リファレンスコンテンツID=4:
score4=score4+log{λ/(1-λ)・(|Rall|/2|R1|)+1}
(第3の特徴ベクトル、a=3番目)
リファレンスコンテンツID=1:
×score1=score1+log{λ/(1-λ)・(|Rall|/3|R1|)+1}
★リファレンスコンテンツID=1について、最初に出現した特徴ベクトルではない
ために、スコアに採用しない。
(第4の特徴ベクトル、a=4番目)
リファレンスコンテンツID=5:
score5=score5+log{λ/(1-λ)・(|Rall|/4|R1|)+1}
(第5の特徴ベクトル、a=5番目)
リファレンスコンテンツID=4:
score4=score4+log{λ/(1-λ)・(|Rall|/5|R1|)+1}
★リファレンスコンテンツID=4について、最初に出現した特徴ベクトルではない
ために、スコアに採用しない。
(第6の特徴ベクトル、a=6番目)
リファレンスコンテンツID=1:
score1=score1+log{λ/(1-λ)・(|Rall|/6|R1|)+1}
★リファレンスコンテンツID=1について、最初に出現した特徴ベクトルではない
ために、スコアに採用しない。
(第7の特徴ベクトル、a=7番目)
リファレンスコンテンツID=6:
score6=score6+log{λ/(1-λ)・(|Rall|/7|R1|)+1}
(第8の特徴ベクトル、a=8番目)
リファレンスコンテンツID=6:
score6=score6+log{λ/(1-λ)・(|Rall|/8|R1|)+1}
★リファレンスコンテンツID=6について、最初に出現した特徴ベクトルではない
ために、スコアに採用しない。
10 リファレンス特徴ベクトル蓄積部
11 特徴ベクトル集合抽出部
12 リファレンス特徴ベクトル検索部
13 対象リファレンス特徴ベクトル検索部
14 スコア算出部
15 類似度算出部
2 検索装置
21 類似ベクトル探索部
22 投票部
Claims (12)
- 特徴ベクトルの集合で表されるクエリコンテンツと対象リファレンスコンテンツRとの間の類似度を算出するべく、装置に搭載されたコンピュータを機能させる類似度算出プログラムであって、
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、前記リファレンス特徴ベクトル蓄積手段からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索するリファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する対象リファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出するスコア算出手段と、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする類似度算出手段と
してコンピュータを機能させることを特徴とする類似度算出プログラム。 - 前記スコア算出手段は、上位N件の各リファレンス特徴ベクトルとの間の距離に対する、最も類似する対象リファレンス特徴ベクトルとの間の距離の前記順位が、
上位N件以内にある場合、スコア1とし、
上位N件以内にない場合、スコア0とする
ようにコンピュータを機能させることを特徴とする請求項1に記載の類似度算出プログラム。 - 前記スコア算出手段は、上位N件の各リファレンス特徴ベクトルとの間の距離に対する、最も類似する対象リファレンス特徴ベクトルとの間の距離の前記順位が、K位に相当する場合、スコアを以下の式によって算出する
si=log{λ/(1-λ)・|Rall|/(K・|R|)+1}
λ:調整可能パラメータ
|R|:対象リファレンスコンテンツの中の特徴ベクトルの数
|Rall|:前記リファレンス特徴ベクトル蓄積手段に蓄積された
リファレンス特徴ベクトルの数
ようにコンピュータを機能させることを特徴とする請求項1に記載の類似度算出プログラム。 - 前記類似度算出手段は、クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似した対象リファレンス特徴ベクトルとの対応関係を求め、その対応関係の集合からクエリコンテンツと対象リファレンスコンテンツとの間のHomography行列を算出し、そのHomogprahy行列を満たす対応関係を持つクエリコンテンツの特徴ベクトルについてのスコアのみを合計するようにコンピュータを機能させることを特徴とする請求項3に記載の類似度算出プログラム。
- 前記類似度算出手段は、前記Homography行列を、クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルとの対応関係のうち、前記スコアが大きい対応関係から順に用いて算出するようにコンピュータを機能させることを特徴とする請求項4に記載の類似度算出プログラム。
- 請求項1から5のいずれか1項に記載の類似度算出プログラムを用いて、リファレンスコンテンツの集合から、クエリコンテンツに類似したリファレンスコンテンツを検索するように、装置に搭載されたコンピュータを機能させる検索プログラムであって、
前記リファレンス特徴ベクトル蓄積手段は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
前記リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルをM(>1)個探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
を有し、
前記類似度算出プログラムが、前記投票手段によって出力された各リファレンスコンテンツツRjについて、前記クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出することによって再度順位を並び替える
ようにコンピュータを機能させることを特徴とする検索プログラム。 - 前記投票手段は、クエリコンテンツの特徴ベクトルqiに対するリファレンスコンテンツjのスコアsjを、以下の式によって算出する
sj=log{λ/(1-λ)・|Rall|/(a・|Rj|)+1}
a: リファレンスコンテンツjの特徴ベクトルが上位M件の中で
初めて出現する番号
|Rall|: 全リファレンスコンテンツにおける全特徴ベクトルの数
|Rj|: 当該リファレンスコンテンツjにおける全特徴ベクトルの数
λ、1-λ: 混合パラメータ
ようにコンピュータを機能させることを特徴とする請求項6に記載の検索プログラム。 - クエリコンテンツ及びリファレンスコンテンツは、画像であって、
リファレンスコンテンツとしての画像には、同一の物体又は同一カテゴリに属する少なくとも1つのインスタンス(対象物、オブジェクト)が写っている
ことを特徴とする請求項1から5のいずれか1項に記載の類似度算出プログラム。
- 特徴ベクトルの集合で表されるクエリコンテンツと対象リファレンスコンテンツRとの間の類似度を算出する類似度算出装置であって、
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、前記リファレンス特徴ベクトル蓄積手段からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索するリファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する対象リファレンス特徴ベクトル検索手段と、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出するスコア算出手段と、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする類似度算出手段と
を有することを特徴とする類似度算出装置。 - 請求項9に記載の類似度算出装置の全ての機能を含み、リファレンスコンテンツの集合から、前記クエリコンテンツに類似したリファレンスコンテンツを検索する検索装置であって、
前記リファレンス特徴ベクトル蓄積手段は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
前記リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルの集合Dを、少なくとも1つ以上探索する類似ベクトル探索手段と、
混合パラメータλを用いて、クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する投票手段と
を有し、
前記類似度算出プログラムが、前記投票手段によって出力された各リファレンスコンテンツツRjについて、前記クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出することによって再度順位を並び替える
ことを特徴とする検索装置。 - 特徴ベクトルの集合で表されるクエリコンテンツと対象リファレンスコンテンツRとの間の類似度を算出する装置における類似度算出方法であって、
多数のリファレンスコンテンツRjから抽出された各特徴ベクトルを記憶したリファレンス特徴ベクトル蓄積部を有し、
クエリコンテンツの各クエリ特徴ベクトルについて、前記リファレンス特徴ベクトル蓄積部からリファレンス特徴ベクトルの集合を取得し、最も類似するものから順に上位N(>1)件のリファレンス特徴ベクトルを検索する第1のステップと、
クエリコンテンツの各クエリ特徴ベクトルについて、対象リファレンスコンテンツにおける最も類似する対象リファレンス特徴ベクトルを検索する第2のステップと、
クエリコンテンツの各クエリ特徴ベクトルについて、最も類似する対象リファレンス特徴ベクトルとの間の距離が、上位N件の各リファレンス特徴ベクトルとの間の距離における上位から何位に相当するかの順位に基づいてスコアを算出する第3のステップと、
クエリコンテンツにおける全てのクエリ特徴ベクトルのスコアの合計を、類似度とする第4のステップと
を有することを特徴とする類似度算出方法。 - 請求項11に記載の類似度算出方法の全てのステップを含み、リファレンスコンテンツの集合から、前記クエリコンテンツに類似したリファレンスコンテンツを検索する装置における検索方法であって、
前記リファレンス特徴ベクトル蓄積部は、複数のリファレンスコンテンツRjから抽出された各リファレンス特徴ベクトルに対応付けて、リファレンスコンテンツ識別子を記憶しており、
第1のステップの前段として、
前記リファレンス特徴ベクトル蓄積手段を用いて、クエリコンテンツの各クエリ特徴ベクトルqiについて、類似したリファレンス特徴ベクトルの集合Dを、少なくとも1つ以上探索する第01のステップと、
混合パラメータλを用いて、前記クエリコンテンツの各クエリ特徴ベクトルqiが、探索された各リファレンスコンテンツから生成される確率λ・p(qi|Rj)と、当該リファレンスコンテンツと無関係な背景モデルから生成される確率(1-λ)・p(qi)との確率比に基づいて、リファレンスコンテンツRj毎にスコアを加算することを、当該クエリコンテンツの全ての特徴ベクトルqiについて実行し、最終的に、所定閾値以上の上位のスコアを得たリファレンスコンテンツRjを、検索結果として出力する第02のステップと
を更に有し、
第1から第4のステップを実行することによって、第02のステップによって出力された各リファレンスコンテンツツRjについて、前記クエリコンテンツの各クエリ特徴ベクトルとの間の類似度を算出し、再度順位を並び替える
ことを特徴とする検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012255899A JP6017277B2 (ja) | 2012-11-22 | 2012-11-22 | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012255899A JP6017277B2 (ja) | 2012-11-22 | 2012-11-22 | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014102772A JP2014102772A (ja) | 2014-06-05 |
JP6017277B2 true JP6017277B2 (ja) | 2016-10-26 |
Family
ID=51025207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012255899A Active JP6017277B2 (ja) | 2012-11-22 | 2012-11-22 | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6017277B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210312237A1 (en) * | 2020-04-02 | 2021-10-07 | Microsoft Technology Licensing, Llc | Click intention machine learned models |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750658B (zh) * | 2019-09-18 | 2022-12-09 | 平安科技(深圳)有限公司 | 一种媒体资源的推荐方法、服务器及计算机可读存储介质 |
CN110942061A (zh) * | 2019-10-24 | 2020-03-31 | 泰康保险集团股份有限公司 | 文字识别方法、装置、设备和计算机可读介质 |
CN113407751B (zh) * | 2021-05-21 | 2022-07-15 | 深圳市广电信义科技有限公司 | 一种图像检索结果重排序方法、装置、设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004192555A (ja) * | 2002-12-13 | 2004-07-08 | Fuji Xerox Co Ltd | 情報管理方法、情報管理装置及び情報管理プログラム |
JP5249088B2 (ja) * | 2009-03-03 | 2013-07-31 | Kddi株式会社 | 画像検索システム |
JP5385105B2 (ja) * | 2009-11-25 | 2014-01-08 | Kddi株式会社 | 画像検索方法およびシステム |
JP5121917B2 (ja) * | 2010-12-21 | 2013-01-16 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
-
2012
- 2012-11-22 JP JP2012255899A patent/JP6017277B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210312237A1 (en) * | 2020-04-02 | 2021-10-07 | Microsoft Technology Licensing, Llc | Click intention machine learned models |
US11797619B2 (en) * | 2020-04-02 | 2023-10-24 | Microsoft Technology Licensing, Llc | Click intention machine learned models |
Also Published As
Publication number | Publication date |
---|---|
JP2014102772A (ja) | 2014-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zheng et al. | SIFT meets CNN: A decade survey of instance retrieval | |
US10394878B2 (en) | Associating still images and videos | |
Jégou et al. | On the burstiness of visual elements | |
Tolias et al. | Visual query expansion with or without geometry: refining local descriptors by feature aggregation | |
Zheng et al. | Coupled binary embedding for large-scale image retrieval | |
Zheng et al. | $\mathcal {L} _p $-Norm IDF for Scalable Image Retrieval | |
WO2013129580A1 (ja) | 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム | |
CN103473327A (zh) | 图像检索方法与系统 | |
Moran et al. | Sparse kernel learning for image annotation | |
Yasmin et al. | Content based image retrieval by shape, color and relevance feedback | |
Meng et al. | Interactive visual object search through mutual information maximization | |
Dharani et al. | Content based image retrieval system using feature classification with modified KNN algorithm | |
JP2011128773A (ja) | 画像検索装置、画像検索方法及びプログラム | |
Cao et al. | Learning to match images in large-scale collections | |
Vieux et al. | Content based image retrieval using bag-of-regions | |
Wang et al. | Beauty product image retrieval based on multi-feature fusion and feature aggregation | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
Pedronette et al. | Unsupervised distance learning by reciprocal kNN distance for image retrieval | |
JP5833499B2 (ja) | 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム | |
Sun et al. | Search by detection: Object-level feature for image retrieval | |
Aly et al. | Towards automated large scale discovery of image families | |
Imran et al. | Event recognition from photo collections via pagerank | |
JP5959446B2 (ja) | コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法 | |
Aly et al. | Scaling object recognition: Benchmark of current state of the art techniques | |
Chou et al. | Multimodal video-to-near-scene annotation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160818 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6017277 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |