JP3571162B2 - Similar object search method and apparatus - Google Patents

Similar object search method and apparatus Download PDF

Info

Publication number
JP3571162B2
JP3571162B2 JP04757997A JP4757997A JP3571162B2 JP 3571162 B2 JP3571162 B2 JP 3571162B2 JP 04757997 A JP04757997 A JP 04757997A JP 4757997 A JP4757997 A JP 4757997A JP 3571162 B2 JP3571162 B2 JP 3571162B2
Authority
JP
Japan
Prior art keywords
objects
feature amount
distance
type
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04757997A
Other languages
Japanese (ja)
Other versions
JPH10240765A (en
Inventor
雅司 山室
純一 中川
展郎 谷口
カーティス キャサリン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04757997A priority Critical patent/JP3571162B2/en
Publication of JPH10240765A publication Critical patent/JPH10240765A/en
Application granted granted Critical
Publication of JP3571162B2 publication Critical patent/JP3571162B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、電子博物館や電子カタログなどのディジタル化されたオブジェクト(画像、音声、音楽、テキストなど)を多数蓄積したものから、利用者が何らかの手段で入力したオブジェクト(参照オブジェクト)と類似したオブジェクトを類似していると判定された順に上位幾つかを検索結果として提示する類似オブジェクト検索装置に関する。
【0002】
【従来の技術】
従来、利用者が指定した参照オブジェクトに類似したオブジェクトを検索して表示する類似オブジェクト検索装置では、オブジェクトについて、いくつかの特徴量を計算し、オブジェクト間でその特徴量の近さ(距離)を計算することで、類似度を求め、類似度により順位付けをしている。この際、オブジェクトを数量化するのに用いる特徴量の種類には、例えばオブジェクトが画像であれば色調、明度、彩度や、画中の線の方向などさまざまなものが用いられている。
【0003】
距離の計算は、個々の特徴量の種類毎に多次元ベクトルで表された特徴量間のユークリッド距離等として計算され、さらに、同一のオブジェクトの組み合わせに対して複数の種類の特徴量の距離に重み付けをすることで類似性に対する利用者の観点(例えば、色が似ているという観点で類似の画像オブジェクトを検索したい)を加味して、最終的な類似性を判断するようになっている。この際、特徴量の距離の重みは、利用者が、検索条件入力手段から入力するようになっている。
【0004】
この方法では、上記特徴量の種類毎の距離計算は、蓄積された全オブジェクトに対して行われ、各オブジェクトに対して、特徴量の種類毎の距離評価値をもとに重み付けした最終的な類似度を計算して、順位付けを行い上位のオブジェクトを返すということを行っていた。
【0005】
または、特徴量の種類毎に距離計算を分けずに、全ての種類の特徴量をまとめたひとつの多次元ベクトル空間として扱い、そこでの距離計算を行う方法をとるものもある。この場合、利用者の検索観点である重みの反映は、利用者が指定する重みのパターンをあらかじめ限定しておき、そのパターンに従って、多次元ベクトルの個々のベクトル成分についてその重みを加味しておくという方法で行う。
【0006】
この方法では、検索の高速化のため、重みをあらかじめ加味した多次元ベクトル空間に対して、インデクスを計算しておき、検索時には、そのインデクスを利用して、候補を絞り込むことができる。
【0007】
【発明が解決しようとする課題】
上記のような従来の、類似度計算による類似オブジェクト検索装置では、全オブジェクトに対して特徴量の種類毎に距離計算を行わなければならないため、計算コストがかかるという問題があった。
【0008】
また、決められたパターンに対して特徴量の多次元ベクトル空間に重みをあらかじめ加味しておくという方法では、インデクスを付与して候補の絞り込みを行うため、計算コストは押さえることができるが、決められたパターンの重み全てに対してインデクスを持っていなければならないことと、それでも限られたパターンにだけしか重みを指定できないという問題があった。
【0009】
本発明の目的は、従来の技術における上述した問題を解消し、全てのオブジェクトに対して距離計算を行う手間を省き、かつ任意の重みで類似オブジェクトを検索することを可能にする類似オブジェクト検索方法および装置を提供することである。
【0010】
【課題を解決するための手段】
本発明の類似オブジェクト検索方法は、
蓄積されたオブジェクトの各種類の特徴量を計算して、個々の特徴量種類毎に多次元ベクトル空間のポイントとして蓄積しておき、かつ、各特徴量種類の多次元ベクトル空間では、データ検索に必要なインデクスを計算しておく段階と、
検索観点である特徴量の種類の間の重みを取得する段階と、
前記参照オブジェクトの特徴量を種類毎に算出する段階と、
特徴量の種類毎に、参照オブジェクトと蓄積された各オブジェクトとの間の多次元ベクトル空間における距離に関して、前記インデクスを利用して参照オブジェクトに対する近傍のオブジェクトを特定の数だけ求める近傍オブジェクト検索段階と、
特徴量の種類毎に求められた近傍オブジェクトを全ての特徴量種類についてまとめることで類似オブジェクトの候補を作り、その候補について前記重みを加味して類似度を求める類似度計算段階と、
前記類似度に従候補オブジェクトを順序付けして、利用者が指定した数に合わせて最終結果を求める段階と、
最終結果を利用者に提示する段階とを有する。
【0011】
本発明は、特徴量種類毎の計算の分割と、個々の特徴量多次元ベクトル空間でのインデクスを利用した近傍オブジェクトの絞り込みと、全ての種類の特徴量多次元ベクトル空間からあがってきた近傍オブジェクトをまとめた候補に対する距離計算と、重みによる類似度計算を行う処理を行う。
【0012】
本発明の請求項2によれば、近傍オブジェクト検索段階および類似度計算段階では、近傍オブジェクトのその特徴量種類の多次元ベクトル空間での距離を計算し、全ての特徴量種類から求められた近傍オブジェクトをまとめて候補オブジェクトを求めた時点で、各候補オブジェクトについて距離の求まっていない特徴量種類について、その特徴量種類の多次元ベクトル空間での距離を計算し、その後、全候補オブジェクトについて重みを加味して類似度を計算する。
【0013】
本発明の請求項3によれば、近傍オブジェクト検索段階および類似度計算段階では、近傍オブジェクトのその特徴量種類の多次元ベクトル空間での距離を計算せず、全ての特徴量種類から求められた近傍オブジェクトをまとめて候補オブジェクトを求めた時点で、各候補オブジェクトについて各特徴量種類の多次元ベクトル空間での距離を計算し、その後、全候補オブジェクトについて重みを加味して類似度を計算する。
【0014】
本発明の請求項4によれば、近傍オブジェクト検索段階で、各特徴量種類の多次元ベクトル空間での検索された近傍オブジェクトについて、その段階で着目している種類の特徴量での参照オブジェクトからの距離のみでなく、全ての種類の特徴量について参照オブジェクトからの距離を計算し、しかし、各オブジェクトついて、一度距離計算したものは印をつけて距離計算が重複しないようにする。
【0015】
オブジェクトが画像オブジェクトである場合を例に簡単に説明する。特徴量の種類として色相、明度、彩度を用いるとする。今、色相の特徴量多次元ベクトル空間から近傍オブジェクトA,B,Cが、明度の空間から近傍オブジェクトB,C,Dが、彩度の空間から近傍オブジェクトC,D,Eが各々得られたとする。これらをまとめた候補オブジェクトはA,B,C,D,Eとなる。これらの各々について、色相の空間、明度の空間、彩度の空間の3種類の距離を求め、これを重み付けして、最終的な類似度を計算するわけであるが、請求項2の場合は、近傍オブジェクトA,B,Cについては、色相の距離は近傍オブジェクトを求める段階で計算しておくということである。他も同様である。「各候補オブジェクトについて距離の求まっていない特徴量種類について、・・・距離を計算し」というのは、近傍オブジェクトAについては明度、彩度の距離が求まっておらず、近傍オブジェクトBについては、彩度の距離が求まっていないわけで、これを求める。近傍オブジェクトCについては全ての距離が求まっている。このような求まっていない距離を求めるものである。
【0016】
請求項3では、候補オブジェクトA,B,C,D,Eを求めた段階で、距離を全て求めていないということである。請求項2では、部分的には求まっていて、欠けている部分の距離を後から求めるわけであるが、請求項3では、後から距離を全部求める。
【0017】
請求項4では、色相の空間から近傍オブジェクトA,B,Cを求めた段階で、近傍オブジェクトA,B,Cについて、色相、明度、彩度全ての距離を求める。こうすると、候補オブジェクトA,B,C,D,Eを求めた段階で、5つのオブジェクト全てについて、3種類の特徴空間の距離が求まっていることになる。
【0018】
本発明の類似オブジェクト検索装置は、
オブジェクトデータを蓄積するオブジェクトデータ蓄積手段と、
利用者が前記参照オブジェクトを入力するための参照オブジェクト入力手段と、
結果として欲しい類似オブジェクトの数を利用者が指定するオブジェクト数指定手段と、
検索観点である特徴量の種類の間の重みを取得する手段と、
蓄積された各オブジェクト及び参照オブジェクトについて、各種類毎の特徴量を算出する特徴量算出手段と、
前記算出された特徴量のうち、あらかじめ蓄積されたオブジェクトの特徴量について、個々の特徴量種類毎に多次元ベクトル空間のポイントとして格納しておくための特徴量格納手段と、
前記算出された特徴量のうち、あらかじめ蓄積されたオブジェクトの特徴量について、各特徴量種類の多次元ベクトル空間では、データ検索に必要なインデクスを計算して、そのインデクスを格納しておくためのインデクス生成・格納手段と、
特徴量の種類毎に、参照オブジェクトと蓄積された各オブジェクトとの間の多次元ベクトル空間における距離に関して、前記インデクスを利用して参照オブジェクトに対する近傍のオブジェクトを特定の数だけ求める近傍オブジェクト検索手段と、
特徴量の種類毎に求められた近傍オブジェクトを全ての特徴量種類についてまとめ、類似オブジェクトの候補を作り、その候補について前記重みを加味して類似度を求める類似度計算手段と、
前記類似度に従い、候補オブジェクトを順序付けして、利用者が指定した数に合わせて最終結果を求める手段と、
最終結果を利用者に提示するオブジェクト提示手段とを有する。
【0019】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【0020】
図1は本発明の一実施形態の類似オブジェクト検索装置の構成図、図2はその動作を示す流れ図である。
【0021】
本実施形態の類似オブジェクト検索装置は、デジタル化されたオブジェクトデータOb1〜Obmを蓄積するオブジェクトデータ蓄積部10と、オブジェクトOb1〜Obmの特徴量を計算する特徴量算出部11と、その特徴量と別途生成されるインデクスを格納する特徴量・インデクス格納部12と、利用者が、参照オブジェクトを新たに外部から入力するための参照オブジェクト入力部131、利用者が、オブジェクト間の類似度をはかるための観点である重みを指定する重み指定部132、利用者が、結果として得られるオブジェクトの数を指定するオブジェクト数指定部133、オブジェクトを利用者に提示するためのオブジェクト提示部134を含む、利用者とのインタフェース部13と、特徴量の種類毎に多次元ベクトル空間のインデクスを生成するインデクス生成部14と、特徴量の種類毎に、多次元ベクトル空間において、参照オブジェクトに対して、その多次元ベクトル空間での距離で近傍であるオブジェクトを求める近傍オブジェクト検索部15と、利用者からの検索要求を受けて、参照オブジェクトの特徴量を特徴量種類に分けて、特徴量種類毎に近傍オブジェクト検索部15に検索要求を引渡し、返って来た結果をまとめて候補オブジェクトとし、各候補オブジェクトについて、必要ならば不足している参照オブジェクトからの特徴量種類毎の距離を求めて、重みを加味して類似度を計算し、上位のオブジェクトから指定された数だけ類似オブジェクトとして結果を返すコーディネータ部16と、中間結果を一時的に蓄積しておく一時データ蓄積部17とで構成されている。
【0022】
なお、インデクスは、多次元空間で特定の位置にあるポイントを検索したり、指定した位置の近傍にあるポイントを高速に検索するための補助データ構造である。代表的にはR−treeやk−dtreeがある。これらのインデクスは、ポイントの位置によって階層的なデータ構造を作り、それを元(ルートノード)から手操ることで、検索を行う。身近な例では、道路地図(2次元空間)などにある縦横でメッシュがきってあり、この観光スポットは縦D横3にある、というように検索する時に使うものも一種のインデクスといえる。
【0023】
次に、本実施形態の動作を図2の流れ図により説明する。
【0024】
オブジェクトOb1の特徴量Ob11,Ob12,...,Ob1n,オブジェクトOb2の特徴量Ob21,Ob22,...,Ob2n,...,オブジェクトObmの特徴量Obm1,Obm2,...,Obmn(nは特徴量の種類の数)が特徴量算出部11によりあらかじめ算出され、特徴量・インデクス格納部12に格納されている。各オブジェクトOb1〜Obm自体はオブジェクトデータ蓄積部10に格納されている。また、各特徴量種類の多次元ベクトル空間において、検索のためインデクスがインデクス生成部14により生成される。このインデクスは特徴量・インデクス格納部12に格納される。
【0025】
まず、利用者は参照オブジェクト入力部131から参照オブジェクトを、重み指定部132から重みw1,...,wnを、オブジェクト数指定部133からオブジェクト数Kを入力する。重みw1〜wnとオブジェクト数Kは、利用者からの入力がない場合はデフォルトの値を用いる(ステップ21)。次に、参照オブジェクトの特徴量VR1,...,VRnを特徴量算出部11により計算する(ステップ22)。
【0026】
次に、コーディネータ部16は、特徴量種類毎に特徴量の種類iと参照オブジェクトのi番目の種類の特徴量VRiと、近傍オブジェクト数を指定する数(Kの関数)f(K)(ただしK以上の数)を指定して、近傍オブジェクト検索部15に近傍オブジェクト検索を要求する(ステップ23)。
【0027】
要求を受けた近傍オブジェクト検索部15は各特徴量種類i毎に、その多次元ベクトル空間内で、参照オブジェクトに対応するポイントにその空間の距離で近いものf(K)個を、インデクスを用いて求め、コーディネータ部16に返却する(ステップ24)。
【0028】
近傍オブジェクトを返されたコーディネータ部16は、全ての特徴量種類について返却された近傍オブジェクトをまとめて、候補オブジェクト群を作る(ステップ25)。候補オブジェクト群は例えば近傍オブジェクトの和集合として求められる。この場合、候補オブジェクトの数は最大f(K)×n(各特徴量種類についての近傍オブジェクトに全く重複がない場合)、最小f(K)(各特徴量種類について近傍オブジェクトが全く同じ場合)になる。
【0029】
次に、候補オブジェクトObkについて、特徴量種類毎の参照オブジェクトに対応するポイントVRiとObkiとの距離dki(iは特徴量の種類)が求まっていない場合は、不足分を計算する(ステップ26)。
【0030】
各候補オブジェクトObkについて、VR1とObk1との距離dk1,...,VRnとObknとの距離dknが求まったところで、重みw1,...,wnを加味して類似度を計算する(ステップ27)。例えばw1/dk1+・・・+wn/dknのように類似度を計算する。
【0031】
次に、求まった類似度の大きい順に候補オブジェクトを並べて、上位K個を結果として返す(ステップ28)。
【0032】
コーディネータ部16から結果が返されると、オブジェクト提示部134が結果を利用者に提示する(ステップ29)。
【0033】
なお、以上で、重みが0と指定された特徴量種類については、近傍オブジェクト検索や距離計算は省略することができる。また、重みは、必ずしも、利用者が指定したものを直接用いるだけでなく、指定されたものから、何らかの方法で求めた重みを利用することも考えられる。また、ステップ24,26はそれぞれ特徴量種類に関して並列に処理を行うことができる。
【0034】
本発明の他の実施態様によれば、上記ステップ26での距離計算を、ステップ24での近傍オブジェクトを求める段階で合わせて行う。この場合は、ステップ26は不要である。
【0035】
【発明の効果】
以上説明したように、本発明は、特徴量の種類毎に、インデクスを利用して、参照オブジェクトの近傍オブジェクトを絞り込み、これら近傍オブジェクトから類似オブジェクトの候補を作り、これら候補に対する距離計算と、重みによる類似度の計算を行うので、全てのオブジェクトに対して距離計算を行う手間を省き、かつ任意の重みで類似オブジェクトを検索することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施形態の類似オブジェクト検索装置の構成図である。
【図2】図1の類似オブジェクト検索装置の動作を示す流れ図である。
【符号の説明】
10 オブジェクトデータ蓄積部
11 特徴量算出部
12 特徴量・インデクス格納部
13 インタフェース部
131 参照オブジェクト入力部
132 重み指定部
133 提示オブジェクト数指定部
134 オブジェクト提示部
14 インデクス生成部
15 近傍オブジェクト検索部
16 コーディネータ部
17 一時データ蓄積部
21〜29 ステップ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an object similar to an object (reference object) input by a user through some means from a large number of digitized objects (images, sounds, music, texts, etc.) such as an electronic museum or an electronic catalog. And a similar object search device that presents some of the top ranks as search results in the order in which they are determined to be similar.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, a similar object search device that searches for and displays an object similar to a reference object specified by a user calculates some feature amounts of the objects, and determines the closeness (distance) of the feature amounts between the objects. The similarity is obtained by the calculation, and the similarity is ranked. At this time, as the types of feature amounts used to quantify the object, for example, if the object is an image, various types such as color tone, lightness, saturation, and the direction of a line in the image are used.
[0003]
The distance is calculated as a Euclidean distance between the feature values represented by a multidimensional vector for each type of the feature value, and further, the distance between a plurality of types of feature values for the same object combination is calculated. By performing weighting, the final similarity is determined in consideration of the user's viewpoint on similarity (for example, searching for a similar image object from the viewpoint of similar colors). At this time, the weight of the distance of the feature amount is input by the user from the search condition input unit.
[0004]
In this method, the distance calculation for each type of the feature amount is performed for all the stored objects, and the final weighting is performed on each object based on the distance evaluation value for each type of the feature amount. Calculating the degree of similarity, ranking, and returning the top object.
[0005]
Alternatively, there is a method in which all types of feature amounts are handled as one multidimensional vector space and distance calculation is performed there without dividing distance calculation for each type of feature amount. In this case, the reflection of the weight, which is the user's search viewpoint, preliminarily limits the weight pattern specified by the user, and takes into account the weight of each vector component of the multidimensional vector according to the pattern. It is done in such a way.
[0006]
In this method, in order to speed up the search, an index is calculated for a multidimensional vector space in which weights are added in advance, and at the time of search, candidates can be narrowed down using the index.
[0007]
[Problems to be solved by the invention]
In the conventional similar object search apparatus based on the similarity calculation as described above, there is a problem that the calculation cost is high because the distance calculation has to be performed for every type of the feature amount for all the objects.
[0008]
Also, in the method of adding a weight to the multidimensional vector space of the feature amount in advance with respect to the determined pattern, since the index is assigned and the candidates are narrowed down, the calculation cost can be suppressed, but There is a problem that an index must be provided for all of the weights of the given pattern, and the weight can be specified only for a limited number of patterns.
[0009]
SUMMARY OF THE INVENTION An object of the present invention is to solve the above-described problem in the prior art, eliminate the trouble of performing distance calculation for all objects, and search for similar objects with an arbitrary weight. And equipment.
[0010]
[Means for Solving the Problems]
The similar object search method of the present invention includes:
The feature amount of each type of the accumulated object is calculated and stored as a point in the multidimensional vector space for each individual feature amount type. Calculating the required index,
Obtaining a weight between the types of feature amounts that are search viewpoints;
Calculating the feature amount of the reference object for each type;
For each type of feature amount, with respect to the distance between the reference object and each of the stored objects in the multidimensional vector space, a neighborhood object search step of obtaining a specific number of objects in the vicinity of the reference object using the index. ,
A similarity calculation step of creating similar object candidates by grouping the neighboring objects obtained for each type of feature amount for all types of feature amounts, and calculating the similarity by adding the weight to the candidates,
And ordering the slave have candidate object to the similarity, and determining a final result to match the number specified by the user,
Presenting the final result to the user.
[0011]
The present invention provides a method of dividing a calculation for each feature amount type, narrowing down a nearby object by using an index in each feature amount multidimensional vector space, and a method of dividing a nearby object from all types of feature amount multidimensional vector space. Is performed for the distance calculation for the candidates that have been combined and the similarity calculation using the weights.
[0012]
According to the second aspect of the present invention, in the neighborhood object search step and the similarity calculation step, the distance of the feature type of the neighborhood object in the multidimensional vector space is calculated, and the neighborhood obtained from all the feature quantity types is calculated. At the time when the objects are combined and the candidate objects are obtained, the distance in the multidimensional vector space of the characteristic amount type is calculated for the feature amount for which the distance has not been obtained for each candidate object. The similarity is calculated by taking into account the similarity.
[0013]
According to the third aspect of the present invention, in the neighborhood object search stage and the similarity calculation stage, the distance of the feature type of the neighbor object in the multidimensional vector space is not calculated, and the distance is obtained from all feature types. At the time when the candidate objects are obtained by grouping the neighboring objects, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and then the similarity is calculated by adding the weight to all the candidate objects.
[0014]
According to the fourth aspect of the present invention, in the neighborhood object search step, the neighborhood objects searched for in the multidimensional vector space of each feature amount type from the reference object with the feature amount of the type of interest at that stage. The distance from the reference object is calculated for all types of feature amounts, not only the distance of the object, but the distance calculated once for each object is marked so that the distance calculation does not overlap.
[0015]
The case where the object is an image object will be briefly described as an example. It is assumed that hue, lightness, and saturation are used as the types of the feature amounts. Now, it is assumed that neighboring objects A, B, and C are obtained from the hue feature quantity multidimensional vector space, neighboring objects B, C, and D are obtained from the brightness space, and neighboring objects C, D, and E are obtained from the saturation space. I do. Candidate objects that combine these are A, B, C, D, and E. For each of these, three types of distances of a hue space, a lightness space, and a saturation space are obtained, weighted, and the final similarity is calculated. For the neighboring objects A, B, and C, the hue distance is calculated at the stage of obtaining the neighboring objects. Others are the same. "For the feature amount types for which the distance has not been determined for each candidate object,... Calculate the distance" means that the brightness and saturation distances have not been determined for the neighboring object A, and This is because the saturation distance has not been determined. All distances have been determined for the nearby object C. Such an undetermined distance is obtained.
[0016]
According to the third aspect, all the distances have not been obtained at the stage when the candidate objects A, B, C, D, and E have been obtained. According to the second aspect, the distance is partially obtained, and the distance of the missing portion is obtained later. In the third aspect, the entire distance is obtained later.
[0017]
According to the fourth aspect, at the stage where the nearby objects A, B, and C are obtained from the hue space, the distances of all the hues, lightness, and saturation are obtained for the nearby objects A, B, and C. Thus, at the stage when the candidate objects A, B, C, D, and E have been obtained, the distances of the three types of feature spaces have been obtained for all five objects.
[0018]
The similar object search device of the present invention
Object data storage means for storing object data;
Reference object input means for a user to input the reference object;
Means for specifying the number of similar objects desired by the user by the user;
Means for obtaining a weight between the types of feature amounts that are search viewpoints;
A feature value calculating unit that calculates a feature value of each type for each of the stored objects and reference objects;
A feature amount storage unit for storing, in the calculated feature amounts, feature amounts of an object stored in advance as points in a multidimensional vector space for each feature amount type;
Of the calculated feature amounts, for a feature amount of an object stored in advance, in a multidimensional vector space of each feature amount type, an index required for data search is calculated and the index is stored. Index generation and storage means,
For each type of feature amount, with respect to the distance in the multidimensional vector space between the reference object and each of the stored objects, a neighborhood object search means for determining a specific number of objects in the vicinity of the reference object using the index. ,
Similarity calculating means for summarizing neighboring objects obtained for each type of feature amount for all types of feature amounts, creating candidates for similar objects, and calculating the similarity by adding the weight to the candidates;
Means for ordering the candidate objects according to the similarity and obtaining a final result according to the number specified by the user;
Object presenting means for presenting the final result to the user.
[0019]
BEST MODE FOR CARRYING OUT THE INVENTION
Next, embodiments of the present invention will be described with reference to the drawings.
[0020]
FIG. 1 is a configuration diagram of a similar object search device according to an embodiment of the present invention, and FIG. 2 is a flowchart showing the operation thereof.
[0021]
The similar object search device according to the present embodiment includes an object data storage unit 10 that stores digitized object data Ob1 to Obm, a feature amount calculation unit 11 that calculates feature amounts of the objects Ob1 to Obm, A feature quantity / index storage unit 12 for storing separately generated indexes, a reference object input unit 131 for a user to newly input a reference object from outside, and a user for measuring similarity between objects A weight specifying unit 132 for specifying a weight, which is a viewpoint of the above, an object number specifying unit 133 for specifying the number of objects obtained as a result by the user, and an object presenting unit 134 for presenting the object to the user. Interface 13 with the user, and a multi-dimensional vector space An index generation unit 14 for generating an index; and a neighbor object search unit 15 for obtaining, for each type of feature quantity, an object that is close to a reference object in a multidimensional vector space by a distance in the multidimensional vector space. Upon receiving a search request from the user, the feature amount of the reference object is divided into feature amount types, the search request is delivered to the neighboring object search unit 15 for each feature amount type, and the returned results are grouped into a candidate object. For each candidate object, if necessary, determine the distance for each feature type from the missing reference object, calculate the similarity by taking into account the weight, and calculate the number of similar objects by the specified number from the upper object. A coordinator unit 16 that returns a result as a temporary data storage unit 17 that temporarily stores an intermediate result. It is configured.
[0022]
Note that the index is an auxiliary data structure for searching for a point at a specific position in a multidimensional space or for searching for a point near a specified position at high speed. Typically, there are R-tree and k-dtree. These indexes are searched by creating a hierarchical data structure depending on the position of the point and manipulating it from the source (root node). In a familiar example, meshes are cut in the vertical and horizontal directions on a road map (two-dimensional space) or the like, and this sightseeing spot is located in the vertical and horizontal directions of 3 and can be used as a kind of index.
[0023]
Next, the operation of this embodiment will be described with reference to the flowchart of FIG.
[0024]
The feature amounts Ob11, Ob12,. . . , Ob1n, the feature amounts Ob21, Ob22,. . . , Ob2n,. . . , Obm1, Obm2,. . . , Obmn (n is the number of types of feature amounts) are calculated in advance by the feature amount calculation unit 11 and stored in the feature amount / index storage unit 12. Each object Ob1 to Obm itself is stored in the object data storage unit 10. In addition, in the multidimensional vector space of each feature amount type, an index is generated by the index generation unit 14 for search. The index is stored in the feature / index storage unit 12.
[0025]
First, the user inputs a reference object from the reference object input unit 131 and weights w1,. . . , Wn, and the number K of objects from the number-of-objects specifying unit 133. If there is no input from the user, default values are used for the weights w1 to wn and the number K of objects (step 21). Next, the feature amounts VR1,. . . , VRn are calculated by the feature value calculator 11 (step 22).
[0026]
Next, the coordinator unit 16 determines the type i of the feature quantity, the feature quantity VRi of the i-th type of the reference object for each feature quantity type, and the number (a function of K) f (K) (the function of K) specifying the number of neighboring objects. K or more) and requests the nearby object search unit 15 to search for nearby objects (step 23).
[0027]
The neighboring object search unit 15 that has received the request uses, for each feature amount type i, f (K) points that are close to the point corresponding to the reference object in the multidimensional vector space at a distance in the space using an index. And returns it to the coordinator 16 (step 24).
[0028]
The coordinator unit 16 that has returned the neighboring objects collects the returned neighboring objects for all feature types and creates a candidate object group (step 25). The candidate object group is obtained, for example, as a union of neighboring objects. In this case, the number of candidate objects is a maximum of f (K) × n (when there is no overlap between neighboring objects for each feature amount type), and a minimum f (K) (when the neighboring objects are exactly the same for each feature amount type). become.
[0029]
Next, for the candidate object Obk, if the distance dki (i is the type of the feature amount) between the point VRi and the Obki corresponding to the reference object for each feature amount type is not determined, the shortage is calculated (step 26). .
[0030]
For each candidate object Obk, the distances dk1,. . . , VRn and Obkn are found, and weights w1,. . . , Wn are taken into account to calculate the similarity (step 27). For example, the similarity is calculated as w1 / dk1 +... + Wn / dkn.
[0031]
Next, the candidate objects are arranged in descending order of the obtained similarity, and the top K objects are returned as a result (step 28).
[0032]
When the result is returned from the coordinator unit 16, the object presenting unit 134 presents the result to the user (step 29).
[0033]
Note that, for the feature amount type designated as having a weight of 0, the neighboring object search and the distance calculation can be omitted. Further, as the weights, not only those directly specified by the user but also those obtained by some method from the specified ones may be used. Steps 24 and 26 can be performed in parallel with respect to the feature type.
[0034]
According to another embodiment of the present invention, the distance calculation in step 26 is performed together with the step of obtaining a nearby object in step 24. In this case, step 26 is unnecessary.
[0035]
【The invention's effect】
As described above, according to the present invention, for each type of feature amount, an index is used to narrow down the nearby objects of the reference object, create similar object candidates from these nearby objects, calculate the distance to these candidates, Since the calculation of the similarity is performed by the formula (1), the trouble of performing the distance calculation for all the objects can be omitted, and the similar object can be searched with an arbitrary weight.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a similar object search device according to an embodiment of the present invention.
FIG. 2 is a flowchart showing an operation of the similar object search device of FIG. 1;
[Explanation of symbols]
Reference Signs List 10 Object data storage unit 11 Feature amount calculation unit 12 Feature amount / index storage unit 13 Interface unit 131 Reference object input unit 132 Weight designation unit 133 Presented object number designation unit 134 Object presentation unit 14 Index generation unit 15 Nearby object search unit 16 Coordinator Unit 17 temporary data storage units 21 to 29 step

Claims (5)

蓄積された多数のオブジェクトの中から、利用者が指定したオブジェクトである参照オブジェクトに類似したオブジェクトを、類似度の高い順にある数だけ取り出して利用者に提示する類似オブジェクト検索方法であって、
蓄積されたオブジェクトの各種類の特徴量を計算して、個々の特徴量種類毎に多次元ベクトル空間のポイントとして蓄積しておき、かつ、各特徴量種類の多次元ベクトル空間では、データ検索に必要なインデクスを計算しておく段階と、
検索観点である特徴量の種類の間の重みを取得する段階と、
前記参照オブジェクトの特徴量を種類毎に算出する段階と、
特徴量の種類毎に、参照オブジェクトと蓄積された各オブジェクトとの間の多次元ベクトル空間における距離に関して、前記インデクスを利用して参照オブジェクトに対する近傍のオブジェクトを特定の数だけ求める近傍オブジェクト検索段階と、
特徴量の種類毎に求められた近傍オブジェクトを全ての特徴量種類についてまとめることで類似オブジェクトの候補を作り、その候補について参照オブジェクトとの距離に前記重みを加味して類似度を求める類似度計算段階と、
前記類似度に従い前記候補オブジェクトを順序付けして、利用者が指定した数に合わせて最終結果を求める段階と、
前記最終結果を利用者に提示する段階
とを有する類似オブジェクト検索方法。
A similar object search method in which objects similar to a reference object, which is an object designated by a user, are extracted from a large number of accumulated objects in a descending order of similarity and presented to the user,
The feature amount of each type of the accumulated object is calculated and stored as a point in the multidimensional vector space for each individual feature amount type. Calculating the required index,
Obtaining a weight between the types of feature amounts that are search viewpoints;
Calculating the feature amount of the reference object for each type;
For each type of feature amount, with respect to the distance between the reference object and each of the stored objects in the multidimensional vector space, a neighborhood object search step of obtaining a specific number of objects in the vicinity of the reference object using the index. ,
A similarity calculation is performed by grouping the neighboring objects obtained for each type of feature amount for all types of feature amounts to create similar object candidates, and calculating the similarity by adding the weight to the distance between the candidate and the reference object. Stages and
Ordering the candidate objects according to the similarity and obtaining a final result according to a number specified by a user;
Presenting the final result to a user.
前記近傍オブジェクト検索段階および前記類似度計算段階では、近傍オブジェクトの各特徴量種類の多次元ベクトル空間での参照オブジェクトからの距離を計算し、全ての特徴量種類から求められた近傍オブジェクトをまとめて候補オブジェクトを求めた時点で、各候補オブジェクトについて距離が求まっていない特徴量種類について、その特徴量種類の多次元ベクトル空間での参照オブジェクトからの距離を計算し、その後、全候補オブジェクトについて参照オブジェクトとの距離に重みを加味して類似度を計算する、請求項1記載の類似オブジェクト検索方法。In the neighborhood object search step and the similarity calculation step, the distance of each feature amount type of the neighborhood object from the reference object in the multidimensional vector space is calculated, and the neighborhood objects obtained from all the feature amount types are collectively collected. At the time when the candidate object is obtained, the distance from the reference object in the multi-dimensional vector space is calculated for the feature type for which the distance has not been obtained for each candidate object. 2. The similar object search method according to claim 1, wherein the similarity is calculated by adding a weight to the distance to the object. 前記近傍オブジェクト検索段階および前記類似度計算段階では、近傍オブジェクトの各特徴量種類の多次元ベクトル空間での参照オブジェクトからの距離を計算せず、全ての特徴量種類から求められた近傍オブジェクトをまとめて候補オブジェクトを求めた時点で、各候補オブジェクトについて各特徴量種類の多次元ベクトル空間での距離を計算し、その後、全候補オブジェクトについて参照オブジェクトとの距離に重みを加味して類似度を計算する、請求項1記載の類似オブジェクト検索方法。In the neighborhood object search step and the similarity calculation step, the distance of each feature amount type of the neighborhood object from the reference object in the multidimensional vector space is not calculated, and the neighborhood objects obtained from all the feature amount types are collected. At the time when the candidate object is obtained by the calculation, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and then the similarity is calculated for all the candidate objects by adding a weight to the distance to the reference object. 2. The similar object search method according to claim 1, wherein: 前記近傍オブジェクト検索段階では、各特徴量種類の多次元ベクトル空間での検索された近傍オブジェクトについて、その段階で着目している種類の特徴量での参照オブジェクトからの距離のみでなく、全ての種類の特徴量について参照オブジェクトからの距離を計算し、しかし、各オブジェクトついて、一度距離計算したものは印をつけて距離計算が重複しないようにする、請求項1記載の類似オブジェクト検索方法。In the neighborhood object search step, not only the distance from the reference object in the feature amount of the type of interest in the stage but also all types of the neighborhood object searched in the multidimensional vector space of each feature amount type 2. A similar object search method according to claim 1, wherein the distance from the reference object is calculated for the characteristic amount of the object, but for each object, the distance calculated once is marked so that the distance calculation does not overlap. 蓄積された多数のオブジェクトの中から、利用者が指定したオブジェクトである参照オブジェクトに類似したオブジェクトを、類似度の高い順にある数だけ取り出して利用者に提示する類似オブジェクト検索装置であって、
オブジェクトデータを蓄積するオブジェクトデータ蓄積手段と、
利用者が前記参照オブジェクトを入力するための参照オブジェクト入力手段と、
結果として欲しい類似オブジェクトの数を利用者が指定するオブジェクト数指定手段と、
検索観点である特徴量の種類の間の重みを取得する手段と、
蓄積された各オブジェクトおよび参照オブジェクトについて、各種類毎の特徴量を算出する特徴量算出手段と、
前記算出された特徴量のうち、あらかじめ蓄積されたオブジェクトの特徴量について、個々の特徴量種類毎に多次元ベクトル空間のポイントとして格納しておくための特徴量格納手段と、
前記算出された特徴量のうち、あらかじめ蓄積されたオブジェクトの特徴量について、各特徴量種類の多次元ベクトル空間では、データ検索に必要なインデクスを計算して、そのインデクスを格納しておくためのインデクス生成・格納手段と、
特徴量の種類毎に、参照オブジェクトと蓄積された各オブジェクトとの間の多次元ベクトル空間における距離に関して、前記インデクスを利用して参照オブジェクトに対する近傍のオブジェクトを特定の数だけ求める近傍オブジェクト検索手段と、
特徴量の種類毎に求められた近傍オブジェクトを全ての特徴量種類についてまとめることで類似オブジェクトの候補を作り、その候補について前記重みを加味して類似度を求める類似度計算手段と、
前記類似度に従い前記候補オブジェクトを順序付けして、利用者が指定した数に合わせて最終結果を求める手段と、
最終結果を利用者に提示するオブジェクト提示手段
とを有する類似オブジェクト検索装置。
A similar object search device that extracts objects similar to a reference object, which is an object designated by a user, from a large number of accumulated objects in a descending order of similarity and presents them to the user,
Object data storage means for storing object data;
Reference object input means for a user to input the reference object;
Means for specifying the number of similar objects desired by the user by the user;
Means for obtaining a weight between the types of feature amounts that are search viewpoints;
A feature value calculating unit that calculates a feature value of each type with respect to each of the stored objects and the reference object;
A feature amount storage unit for storing, in the calculated feature amounts, feature amounts of an object stored in advance as points in a multidimensional vector space for each feature amount type;
Of the calculated feature amounts, for a feature amount of an object stored in advance, in a multidimensional vector space of each feature amount type, an index required for data search is calculated and the index is stored. Index generation and storage means,
For each type of feature amount, with respect to the distance in the multidimensional vector space between the reference object and each of the stored objects, a neighborhood object search means for determining a specific number of objects in the vicinity of the reference object using the index. ,
Creating candidate similar object be summarized for all of the feature types near objects found for the types of features, and similarity calculation means for calculating the similarity in consideration of the weight for that candidate,
And ordering the candidate object in accordance with the degree of similarity, and means for obtaining the final result according to the number specified by the user,
A similar object search device having object presentation means for presenting a final result to a user.
JP04757997A 1997-03-03 1997-03-03 Similar object search method and apparatus Expired - Lifetime JP3571162B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04757997A JP3571162B2 (en) 1997-03-03 1997-03-03 Similar object search method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04757997A JP3571162B2 (en) 1997-03-03 1997-03-03 Similar object search method and apparatus

Publications (2)

Publication Number Publication Date
JPH10240765A JPH10240765A (en) 1998-09-11
JP3571162B2 true JP3571162B2 (en) 2004-09-29

Family

ID=12779170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04757997A Expired - Lifetime JP3571162B2 (en) 1997-03-03 1997-03-03 Similar object search method and apparatus

Country Status (1)

Country Link
JP (1) JP3571162B2 (en)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4340367B2 (en) * 1999-01-27 2009-10-07 株式会社リコー Image classification apparatus and computer-readable recording medium storing a program for causing a computer to function as the apparatus
JP4674257B2 (en) * 1999-01-27 2011-04-20 株式会社リコー Image classification apparatus and computer-readable recording medium storing a program for causing a computer to function as the apparatus
KR100753272B1 (en) * 1999-08-31 2007-08-29 주식회사 팬택앤큐리텔 Multimedia Search Apparatus and Method therefor using Binary Shape Information Feature of Foreground Region and Background Region
KR100350788B1 (en) * 1999-10-19 2002-08-28 엘지전자 주식회사 Multimedia data having weight information and method of display multimedia
JP3574603B2 (en) * 2000-03-21 2004-10-06 日本電信電話株式会社 Music processing device and music processing program recording medium
JP4363792B2 (en) * 2001-03-23 2009-11-11 富士通株式会社 Information retrieval system and method
JP4082043B2 (en) * 2002-02-27 2008-04-30 富士ゼロックス株式会社 Image search device
JP2007531933A (en) * 2004-03-26 2007-11-08 ノキア コーポレイション Interface configured to extract features from mobile stations and input media samples
US7221902B2 (en) 2004-04-07 2007-05-22 Nokia Corporation Mobile station and interface adapted for feature extraction from an input media sample
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US8144921B2 (en) * 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
JP4556120B2 (en) * 2005-01-07 2010-10-06 ソニー株式会社 Information processing apparatus and method, and program
JP5139716B2 (en) * 2007-05-16 2013-02-06 キヤノン株式会社 Image search apparatus and image search method
JP5708317B2 (en) * 2011-07-06 2015-04-30 ヤマハ株式会社 Sound waveform search support device and program
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
CN110555114A (en) 2018-03-29 2019-12-10 北京字节跳动网络技术有限公司 Media retrieval method and device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH083816B2 (en) * 1986-05-28 1996-01-17 三菱電機株式会社 Image retrieval device
JPH0248772A (en) * 1988-08-11 1990-02-19 Nippon Telegr & Teleph Corp <Ntt> Analogous picture retrieving system
JPH04333168A (en) * 1991-05-08 1992-11-20 Mitsubishi Electric Corp Device for retrieving graphic
JP2609196B2 (en) * 1993-03-22 1997-05-14 株式会社エイ・ティ・アール自動翻訳電話研究所 Similarity calculator

Also Published As

Publication number Publication date
JPH10240765A (en) 1998-09-11

Similar Documents

Publication Publication Date Title
JP3571162B2 (en) Similar object search method and apparatus
JP5121972B2 (en) Method for expressing color image, device for expressing color image, system for expressing color image, program comprising computer executable instructions, and computer readable medium
JP2776295B2 (en) Image index generation method and image index generation device
US6564206B1 (en) Information search apparatus and method, and storage medium
JP2010055651A (en) Method and apparatus for representing and searching for object using shape
US20080235184A1 (en) Image Search Method, Image Search Apparatus, and Recording Medium Having Image Search Program Code Thereon
JP2003036273A (en) Image retrieval device, image retrieval method, and program for retrieving image
JP2005339556A (en) User interface for full-text document retrieval
JP4173246B2 (en) Similar image display method and recording medium storing similar image display processing program
CN109409612A (en) A kind of paths planning method, server and computer storage medium
CN108733803A (en) A kind of Multi-User Dimension keyword query method under road network
US6029112A (en) Postal route system and method for fast algorithm of the shortest path in the same
JP3952592B2 (en) Image search apparatus and method
CN109544387A (en) A kind of building Seismic Economic Losses fining appraisal procedure of component rank
JP3505393B2 (en) Similar object search method and apparatus, and recording medium storing similar object search program
JPH10301937A (en) Neighborhood retrieval method inside multi-dimensional vector space and recording medium for the program
JP4059970B2 (en) Information source recommendation device
US20210192812A1 (en) Improved geographic indexing
CN106776993A (en) Recommend method and system in a kind of path based on temporal constraint activity purpose
JPH08263522A (en) Image retrieving method
JP3615439B2 (en) Similarity Feature Retrieval Method, Retrieval Device, and Retrieval Program Recording Medium
JP2003150635A (en) Retrieval device, image retrieval device, sound retrieval device, word and phrase retrieval device and retrieval program, and retrieval method
JPH05266085A (en) Method and device for similar retrieval using dynamic concept dictionary
KR20100117986A (en) Method for measuring the location similarity of spatial object on digital maps and map matching using the same
CN110688492B (en) Knowledge graph query method based on lightweight index

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040506

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040506

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040623

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110702

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120702

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term