JP2000010989A - Similar object retrieval method/device and recording medium recording similar object retrieval program - Google Patents

Similar object retrieval method/device and recording medium recording similar object retrieval program

Info

Publication number
JP2000010989A
JP2000010989A JP10173249A JP17324998A JP2000010989A JP 2000010989 A JP2000010989 A JP 2000010989A JP 10173249 A JP10173249 A JP 10173249A JP 17324998 A JP17324998 A JP 17324998A JP 2000010989 A JP2000010989 A JP 2000010989A
Authority
JP
Japan
Prior art keywords
type
feature
objects
distance
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10173249A
Other languages
Japanese (ja)
Other versions
JP3505393B2 (en
Inventor
Noburo Taniguchi
展郎 谷口
Masashi Yamamuro
雅司 山室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP17324998A priority Critical patent/JP3505393B2/en
Publication of JP2000010989A publication Critical patent/JP2000010989A/en
Application granted granted Critical
Publication of JP3505393B2 publication Critical patent/JP3505393B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To eliminate troubles for calculating distances to all objects and to retrieve a similar object with arbitrary weight. SOLUTION: A coordinator part 16 designates the feature quantity VRi of the i-th type of a reference object, a number (f) (K, w1,... wn) designating the number of nearby objects and retrieval precision (e) on the feature quantity of i-th type and requests the retrieval of the nearby object to a nearby object retrieval part 15. The nearby object retrieval part 15 obtains (f) (K) pieces of objects, each of which is nearest to a point corresponding to a reference object in the distance of the space by using an index in the multidimensional vector space at every feature quantity type (i), and they are returned to the coordinator part 16. The coordinator part 16 gathers the returned nearby objects on all the feature quantity type and generates a candidate object group.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、電子博物館や電子
カタログなどのディジタル化されたオブジェクト(画
像、音声、音楽、テキストなど)を多数蓄積したものか
ら、利用者が何らかの手段で入力したオブジェクト(参
照オブジェクト)と類似したオブジェクトを類似してい
ると判定された順に上位幾つかを検索結果として提示す
る類似オブジェクト検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an object (such as an electronic museum or an electronic catalog) stored in a large number of digitized objects (images, voices, music, texts, etc.) from an object (e.g., The present invention relates to a similar object search apparatus that presents some of the top objects as search results in the order in which objects similar to the reference object) are determined to be similar.

【0002】[0002]

【従来の技術】従来、利用者が指定した参照オブジェク
トに類似したオブジェクトを検索して表示する類似オブ
ジェクト検索装置では、オブジェクトについて、いくつ
かの特徴量を計算し、オブジェクト間でその特徴量の近
さ(距離)を計算することで、類似度を求め、類似度に
より順位付けをしている。この際、オブジェクトを数量
化するのに用いる特徴量の種類には、例えばオブジェク
トが画像であれば色調、明度、彩度や、画中の線の方向
などさまざまなものが用いられている。
2. Description of the Related Art Conventionally, in a similar object search apparatus that searches for and displays an object similar to a reference object specified by a user, some feature quantities are calculated for the objects, and the similarity between the objects is calculated. The degree of similarity is calculated by calculating the distance (the distance), and the similarity is ranked. At this time, as the type of feature amount used to quantify the object, for example, when the object is an image, various types such as color tone, lightness, saturation, and the direction of a line in an image are used.

【0003】距離の計算は、個々の特徴量の種類毎に多
次元ベクトルで表された特徴量間のユークリッド距離等
として計算され、さらに、同一のオブジェクトの組み合
わせに対して複数の種類の特徴量の距離に重み付けをす
ることで類似性に対する利用者の観点(例えば、色が似
ているという観点で類似の画像オブジェクトを検索した
い)を加味して、最終的な類似性を判断するようになっ
ている。この際、特徴量の距離の重みは、利用者が検索
条件入力手段から入力するようになっている。
[0003] The distance is calculated as a Euclidean distance or the like between features represented by a multidimensional vector for each type of feature, and furthermore, a plurality of types of features are calculated for the same combination of objects. , The final similarity is determined in consideration of the user's viewpoint of similarity (for example, searching for similar image objects from the viewpoint of similar colors). ing. At this time, the weight of the distance of the feature amount is input by the user from the search condition input means.

【0004】この方法では、上記特徴量の種類毎の距離
計算は、蓄積された全オブジェクトに対して行われ、各
オブジェクトに対して、特徴量の種類毎の距離評価値を
もとに重み付けした最終的な類似度を計算して、順位付
けを行い上位のオブジェクトを返すということを行って
いた。
In this method, the distance calculation for each type of feature is performed on all the stored objects, and each object is weighted based on the distance evaluation value for each type of feature. They used to calculate the final similarity, rank, and return the top objects.

【0005】または、特徴量の種類毎に距離計算を分け
ずに、全ての種類の特徴量をまとめたひとつの多次元ベ
クトル空間として扱い、そこでの距離計算を行う方法を
とるものもある。この場合、利用者の検索観点である重
みの反映は、利用者が指定する重みのパターンをあらか
じめ限定しておき、そのパターンに従って、多次元ベク
トルの個々のベクトル成分についてその重みを加味して
おくという方法で行う。
[0005] Alternatively, there is a method in which all types of feature amounts are handled as one multidimensional vector space without dividing distance calculation for each type of feature amount, and distance calculation is performed there. In this case, the reflection of the weight, which is the user's search viewpoint, is performed by limiting the weight pattern specified by the user in advance, and taking the weight into account for each vector component of the multidimensional vector according to the pattern. It is done in such a way.

【0006】この方法では、検索の高速化のため、重み
をあらかじめ加味した多次元ベクトル空間に対して、イ
ンデクスを計算しておき、検索時には、そのインデクス
を利用して、候補を絞り込むことができる。
In this method, in order to speed up the search, an index is calculated in a multidimensional vector space in which weights are added in advance, and at the time of search, candidates can be narrowed down by using the index. .

【0007】[0007]

【発明が解決しようとする課題】上記のような従来の、
類似度計算による類似オブジェクト検索装置では、全オ
ブジェクトに対して特徴量の種類毎に距離計算を行わな
ければならないため、計算コストがかかるという問題が
あった。
SUMMARY OF THE INVENTION The prior art as described above,
In the similar object search device based on the similarity calculation, the distance calculation has to be performed for each type of the feature amount for all the objects, so that there is a problem that the calculation cost is high.

【0008】また、決められたパターンに対して特徴量
の多次元ベクトル空間に重みをあらかじめ加味しておく
という方法では、インデクスを付与して候補の絞り込み
を行うため、計算コストは押さえることができるが、決
められたパターンの重み全てに対してインデクスを持っ
ていなければならないことと、それでも限られたパター
ンにだけしか重みを指定できないという問題があった。
In a method in which a predetermined pattern is weighted in advance in a multidimensional vector space of a feature value, candidates are narrowed down by adding an index, so that the calculation cost can be suppressed. However, there is a problem that an index must be provided for all the weights of the determined pattern, and the weight can be specified only for a limited number of patterns.

【0009】本発明の目的は、従来の技術における上述
した問題を解消し、全てのオブジェクトに対して距離計
算を行う手間を省き、かつ任意の重みで類似オブジェク
トを検索することを可能にする類似オブジェクト検索方
法および装置を提供することである。
An object of the present invention is to solve the above-mentioned problem in the prior art, eliminate the trouble of performing distance calculation for all objects, and search for similar objects with arbitrary weights. An object search method and apparatus are provided.

【0010】[0010]

【課題を解決するための手段】本発明の類似オブジェク
ト検索方法は、蓄積されたオブジェクトの各種類の特徴
量を計算して、個々の特徴量種類毎に多次元ベクトル空
間のポイントとして蓄積しておき、かつ、各特徴量種類
の多次元ベクトル空間では、データ検索に必要なインデ
クスを計算しておく段階と、参照オブジェクトを利用者
が入力する段階と、結果として欲しい類似オブジェクト
の数を利用者が指定する段階と、検索観点である特徴量
の種類の間の重みを取得する段階と、前記参照オブジェ
クトの特徴量を種類毎に算出する段階と、特徴量の種類
毎に、参照オブジェクトと蓄積された各オブジェクトと
の間の多次元ベクトル空間における距離に関して、前記
インデクスを利用して参照オブジェクトに対する近傍の
オブジェクトを求める数を、その特徴量種類間の重みを
用いて特徴量種類毎に決定し、決定された数だけ近傍の
オブジェクトを求める近傍オブジェクト検索段階と、特
徴量の種類毎に求められた近傍オブジェクトを全ての特
徴量種類についてまとめることで類似オブジェクトの候
補を作り、その候補について前記重みを加味して類似度
を求める類似度計算段階と、前記類似度に従い、候補オ
ブジェクトを順序付けして、利用者が指定した数に合わ
せて最終結果を求める段階と、最終結果を利用者に提示
する段階とを有する。
According to the similar object search method of the present invention, a feature amount of each type of stored object is calculated, and each feature amount type is stored as a point in a multidimensional vector space. In a multidimensional vector space of each feature amount type, a step of calculating an index necessary for data retrieval, a step of inputting a reference object by a user, and a step of calculating a number of similar objects desired by the user. , The step of obtaining a weight between the types of feature amounts that are search viewpoints, the step of calculating the feature amounts of the reference object for each type, the step of With respect to the distance in the multi-dimensional vector space between each of the extracted objects, a nearby object with respect to the reference object is obtained using the index. Object number is determined for each feature amount type using the weight between the feature amount types, and a neighboring object search step of obtaining objects in the vicinity by the determined number is performed. A similarity object candidate is created by summarizing all the feature amount types, and a similarity calculation step of obtaining a similarity by adding the weight to the candidate, and ordering the candidate objects according to the similarity, the user There is a step of obtaining a final result according to the designated number, and a step of presenting the final result to the user.

【0011】本発明は、特徴量種類毎の計算の分割と、
個々の特徴量多次元ベクトル空間でのインデクスを利用
した近傍オブジェクトの絞り込みと、全ての種類の特徴
量多次元ベクトル空間からあがってきた近傍オブジェク
トをまとめた候補に対する距離計算と、重みによる類似
度計算を行う処理を行う。
According to the present invention, the calculation is divided for each type of feature quantity;
Narrowing down neighboring objects using indexes in individual feature multi-dimensional vector space, distance calculation for candidates that combine nearby objects from all types of feature multi-dimensional vector space, and similarity calculation by weight Is performed.

【0012】文献K.Curtis, N. Taniguchi, J. Nakagaw
a, M. Yamamuro,“A ComprehensiveImage Similarity R
etrieval System that utilizes Multiple Feature Vec
tors in High Dimensional Space," 情報処理学会デー
タベースシステム研究会113-28, 1997.7にあるように複
数種類の特徴量での近傍検索の結果を統合して全体の類
似度によって類似オブジェクトを探索する場合、各特徴
量種類での検索で上位何件まで検索するかは全体的な検
索精度を左右する。この文献に報告されているように個
々の特徴量種類での検索件数が大きいほど全体の検索精
度は高くなる。他方、近傍検索において上位何件までの
近傍を検索で得るかは、検索に要する時間に影響する。
一般に要求件数が多いほど時間がかかることが知られて
いる。そこで、本発明は、近傍のオブジェクトを求める
数を、特徴量種類間の重みを用いて各特徴量種類毎に決
定する。
References K. Curtis, N. Taniguchi, J. Nakagaw
a, M. Yamamuro, “A ComprehensiveImage Similarity R
etrieval System that utilizes Multiple Feature Vec
Tors in High Dimensional Space, "When searching for similar objects based on overall similarity by integrating the results of neighborhood search with multiple types of features as described in IPSJ Database System Workshop 113-28, 1997.7, The number of top searches in each feature type determines the overall search accuracy.As reported in this document, the larger the number of searches for each feature type, the higher the overall search accuracy On the other hand, how many neighbors are obtained by a search in the neighborhood search affects the time required for the search.
It is generally known that the longer the number of requests, the longer it takes. Therefore, the present invention determines the number of nearby objects to be obtained for each feature type using the weight between the feature types.

【0013】本発明の請求項2によれば、近傍オブジェ
クト検索段階では、各特徴量種類毎に近傍オブジェクト
を求める際の検索精度を、その特徴量種類間の重みを用
いて特徴量種類毎に設定する。ここで、検索精度とは類
似度の高い順に上位k件を求める近傍検索において、得
られたk件が、正確に計算して求めた真の上位k件を基
準にした場合とどれくらい正しいかを示す尺度である。
According to the second aspect of the present invention, in the neighborhood object search step, the search accuracy when finding the neighborhood object for each feature type is determined for each feature type using the weight between the feature types. Set. Here, the search accuracy refers to how close the obtained k cases are in the neighborhood search for the top k cases in descending order of similarity, and how correct the obtained k cases are based on the true top k cases calculated and obtained. It is a scale to show.

【0014】文献S. Arya, D. M. Mount, N. S. Netany
ahu, R. Silverman, and A. Y. Wu,“An optimal algor
ithm for approximate nearest neighbor searching,
“5th Ann. ACM-SIAM Symposium on Discrete Algorith
ms, 1994, pp.573-582. にも報告があるとおり、一般に
検索精度を下げる(この文献ではεの値を大きくする)
と、検索にかかる時間が減少する。
Reference S. Arya, DM Mount, NS Netany
ahu, R. Silverman, and AY Wu, “An optimal algor
ithm for approximate nearest neighbor searching,
“5th Ann. ACM-SIAM Symposium on Discrete Algorith
ms, 1994, pp.573-582. In general, reduce search accuracy (increase the value of ε in this document).
The search time is reduced.

【0015】そこで、重みの小さい特徴量種類について
は、検索精度を下げることで、全体の検索精度を損なう
ことなく計算にかかる時間を全体的に低減することがで
きる。
Therefore, for a feature amount type having a small weight, the time required for calculation can be reduced as a whole without lowering the search accuracy by lowering the search accuracy.

【0016】本発明の請求項5によれば、近傍オブジェ
クト検索段階では、近傍オブジェクトのその特徴量種類
の多次元ベクトル空間での距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離の求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での距離を計算し、その
後、類似度計算段階では全候補オブジェクトについて重
みを加味して類似度を計算する。
According to a fifth aspect of the present invention, in the neighborhood object search step, the distance of the feature type of the neighborhood object in the multidimensional vector space is calculated, and the neighborhood object obtained from all the feature types is calculated. At the time when the candidate objects are collectively obtained, the distance in the multidimensional vector space of the characteristic amount type is calculated for the characteristic amount type for which the distance has not been obtained for each candidate object. Is calculated by taking the weights into consideration.

【0017】本発明の請求項6によれば、近傍オブジェ
クト検索段階では、近傍オブジェクトのその特徴量種類
の多次元ベクトル空間での距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、類似度計算段階では全候補オブジェクトに
ついて重みを加味して類似度を計算する。
According to the sixth aspect of the present invention, in the neighborhood object search step, the distance of the feature type of the neighborhood object in the multidimensional vector space is not calculated, and the neighborhood object obtained from all the feature types is not calculated. At the same time, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and then, in the similarity calculation stage, the similarity is calculated by adding weights to all the candidate objects. calculate.

【0018】本発明の請求項7によれば、近傍オブジェ
クト検索段階では、各特徴量種類の多次元ベクトル空間
での検索された近傍オブジェクトについて、その段階で
着目している種類の特徴量での参照オブジェクトからの
距離のみでなく、全ての種類の特徴量について参照オブ
ジェクトからの距離を計算し、しかし、各オブジェクト
ついて、一度距離計算したものは印をつけて距離計算が
重複しないようにする。
According to the seventh aspect of the present invention, in the neighborhood object search step, the neighborhood object searched for in the multidimensional vector space of each feature amount type is searched for in the feature amount of the type of interest at that stage. Not only the distance from the reference object but also the distance from the reference object is calculated for all types of feature amounts. However, for each object, the distance calculated once is marked so that the distance calculation does not overlap.

【0019】オブジェクトが画像オブジェクトである場
合を例に簡単に説明する。特徴量の種類として色相、明
度、彩度を用いるとする。今、色相の特徴量多次元ベク
トル空間から近傍オブジェクトA,B,Cが、明度の空
間から近傍オブジェクトB,C,Dが、彩度の空間から
近傍オブジェクトC,D,Eが各々得られたとする。こ
れらをまとめた候補オブジェクトはA,B,C,D,E
となる。これらの各々について、色相の空間、明度の空
間、彩度の空間の3種類の距離を求め、これを重み付け
して、最終的な類似度を計算するわけであるが、請求項
5の場合は、近傍オブジェクトA,B,Cについては、
色相の距離は近傍オブジェクトを求める段階で計算して
おくということである。他も同様である。「各候補オブ
ジェクトについて距離の求まっていない特徴量種類につ
いて、・・・距離を計算し」というのは、近傍オブジェ
クトAについては明度、彩度の距離が求まっておらず、
近傍オブジェクトBについては、彩度の距離が求まって
いないわけで、これを求める。近傍オブジェクトCにつ
いては全ての距離が求まっている。このような求まって
いない距離を求めるものである。
The case where the object is an image object will be briefly described as an example. It is assumed that hue, lightness, and saturation are used as the types of the feature amounts. Now, it is assumed that neighboring objects A, B, and C are obtained from the hue feature quantity multidimensional vector space, neighboring objects B, C, and D are obtained from the brightness space, and neighboring objects C, D, and E are obtained from the saturation space. I do. Candidate objects that summarize these are A, B, C, D, E
Becomes For each of these, three types of distances of a hue space, a lightness space, and a saturation space are obtained, and these are weighted to calculate a final similarity. , Neighboring objects A, B, and C
This means that the hue distance is calculated at the stage of obtaining a nearby object. Others are the same. “For the feature amount types for which the distance has not been determined for each candidate object,... Calculate the distance” means that for the neighboring object A, the distances of brightness and saturation have not been determined.
As for the neighboring object B, the saturation distance has not been determined yet, so this is determined. All distances have been determined for the nearby object C. Such an undetermined distance is obtained.

【0020】請求項6では、候補オブジェクトA,B,
C,D,Eを求めた段階で、距離を全て求めていないと
いうことである。請求項2では、部分的には求まってい
て、欠けている部分の距離を後から求めるわけである
が、請求項3では、後から距離を全部求める。
In claim 6, the candidate objects A, B,
That is, at the stage where C, D, and E have been obtained, all the distances have not been obtained. According to the second aspect, the distance is partially obtained, and the distance of the missing portion is obtained later. In the third aspect, the entire distance is obtained later.

【0021】請求項7では、色相の空間から近傍オブジ
ェクトA,B,Cを求めた段階で、近傍オブジェクト
A,B,Cについて、色相、明度、彩度全ての距離を求
める。こうすると、候補オブジェクトA,B,C,D,
Eを求めた段階で、5つのオブジェクト全てについて、
3種類の特徴空間の距離が求まっていることになる。
In the seventh aspect, when the neighboring objects A, B, and C are determined from the hue space, the distances of all of the hues, lightness, and saturation of the neighboring objects A, B, and C are determined. Then, the candidate objects A, B, C, D,
At the stage of finding E, for all five objects,
This means that the distances of the three types of feature spaces have been determined.

【0022】本発明の類似オブジェクト検索装置は、オ
ブジェクトデータを蓄積するオブジェクトデータ蓄積手
段と、利用者が前記参照オブジェクトを入力するための
参照オブジェクト入力手段と、結果として欲しい類似オ
ブジェクトの数を利用者が指定するオブジェクト数指定
手段と、検索観点である特徴量の種類の間の重みを取得
する手段と、蓄積された各オブジェクト及び参照オブジ
ェクトについて、各種類毎の特徴量を算出する特徴量算
出手段と、前記算出された特徴量のうち、あらかじめ蓄
積されたオブジェクトの特徴量について、個々の特徴量
種類毎に多次元ベクトル空間のポイントとして格納して
おくための特徴量格納手段と、前記算出された特徴量の
うち、あらかじめ蓄積されたオブジェクトの特徴量につ
いて、各特徴量種類の多次元ベクトル空間では、データ
検索に必要なインデクスを計算して、そのインデクスを
格納しておくためのインデクス生成・格納手段と、特徴
量の種類毎に、参照オブジェクトと蓄積された各オブジ
ェクトとの間の多次元ベクトル空間における距離に関し
て、前記インデクスを利用して参照オブジェクトに対す
る近傍のオブジェクトを求める数を、その特徴量種類間
の重みを用いて特徴量種類毎に決定し、決定された数だ
け近傍のオブジェクトを求める近傍オブジェクト検索手
段と、特徴量の種類毎に求められた近傍オブジェクトを
全ての特徴量種類についてまとめ、類似オブジェクトの
候補を作り、その候補について前記重みを加味して類似
度を求める類似度計算手段と、前記類似度に従い、候補
オブジェクトを順序付けして、利用者が指定した数に合
わせて最終結果を求める手段と、最終結果を利用者に提
示するオブジェクト提示手段とを有する。
A similar object search apparatus according to the present invention comprises: object data storage means for storing object data; reference object input means for allowing a user to input the reference object; Means for specifying the number of objects specified by the user, means for obtaining the weight between the types of feature amounts that are search viewpoints, and feature amount calculating means for calculating the feature amount of each type for each of the stored objects and reference objects And a feature amount storage unit for storing, among the calculated feature amounts, the feature amounts of the object stored in advance as points in a multidimensional vector space for each feature amount type; Of the feature quantities that were stored in advance, In the multidimensional vector space, an index necessary for data retrieval is calculated, an index generation / storage means for storing the index, and a reference object and each stored object are stored for each type of feature amount. With respect to the distance in the multidimensional vector space between, the number of obtaining objects in the vicinity of the reference object using the index is determined for each feature type using the weight between the feature types. A nearby object search means for obtaining only nearby objects; a group of similar objects obtained for each type of feature amount for all types of feature amounts; a candidate for a similar object; Means for calculating the similarity, and ordering and using the candidate objects according to the similarity. There has means for determining the final result to fit the specified number, and object presenting means for presenting the final results to the user.

【0023】[0023]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0024】図1は本発明の一実施形態の類似オブジェ
クト検索装置の構成図、図2はその動作を示す流れ図で
ある。
FIG. 1 is a block diagram of a similar object search apparatus according to an embodiment of the present invention, and FIG. 2 is a flowchart showing the operation thereof.

【0025】本実施形態の類似オブジェクト検索装置
は、デジタル化されたオブジェクトデータOb1〜Ob
mを蓄積するオブジェクトデータ蓄積部10と、オブジ
ェクトOb1〜Obmの特徴量を計算する特徴量算出部
11と、その特徴量と別途生成されるインデクスを格納
する特徴量・インデクス格納部12と、利用者が、参照
オブジェクトを新たに外部から入力するための参照オブ
ジェクト入力部131、利用者が、オブジェクト間の類
似度をはかるための観点である重みを指定する重み指定
部132、利用者が、結果として得られるオブジェクト
の数を指定するオブジェクト数指定部133、オブジェ
クトを利用者に提示するためのオブジェクト提示部13
4を含む、利用者とのインタフェース部13と、特徴量
の種類毎に多次元ベクトル空間のインデクスを生成する
インデクス生成部14と、特徴量の種類毎に、多次元ベ
クトル空間において、参照オブジェクトに対して、その
多次元ベクトル空間での距離で近傍であるオブジェクト
を求める近傍オブジェクト検索部15と、利用者からの
検索要求を受けて、参照オブジェクトの特徴量を特徴量
種類に分けて、特徴量種類毎に近傍オブジェクト検索部
15に検索要求を引渡し、返って来た結果をまとめて候
補オブジェクトとし、各候補オブジェクトについて、必
要ならば不足している参照オブジェクトからの特徴量種
類毎の距離を求めて、重みを加味して類似度を計算し、
上位のオブジェクトから指定された数だけ類似オブジェ
クトとして結果を返すコーディネータ部16と、中間結
果を一時的に蓄積しておく一時データ蓄積部17とで構
成されている。
The similar object search apparatus according to the present embodiment uses digitized object data Ob1 to Ob
m, an object data accumulating unit 10 for accumulating m, a characteristic amount calculating unit 11 for calculating characteristic amounts of the objects Ob1 to Obm, a characteristic amount / index storage unit 12 for storing the characteristic amount and an index separately generated, A reference object input unit 131 for a user to newly input a reference object from outside, a weight specification unit 132 for the user to specify a weight which is a viewpoint for measuring the similarity between objects, and a user Object number specifying unit 133 for specifying the number of objects obtained as an object, an object presenting unit 13 for presenting an object to a user
4, an interface unit 13 with the user, an index generation unit 14 for generating an index in the multidimensional vector space for each type of feature amount, and a reference object in the multidimensional vector space for each type of feature amount. On the other hand, a neighboring object search unit 15 for finding an object that is nearby at a distance in the multidimensional vector space, and upon receiving a search request from a user, divides the feature amounts of the reference object into feature amount types, The search request is delivered to the nearby object search unit 15 for each type, and the returned results are collectively referred to as candidate objects. If necessary, the distance for each feature type from the lacking reference object is obtained for each candidate object. , Calculate the similarity by taking the weight into account,
It comprises a coordinator unit 16 that returns results as similar objects by the number specified from the higher-level objects, and a temporary data storage unit 17 that temporarily stores intermediate results.

【0026】なお、インデクスは、多次元空間で特定の
位置にあるポイントを検索したり、指定した位置の近傍
にあるポイントを高速に検索するための補助データ構造
である。代表的にはR−treeやk−dtreeがあ
る。これらのインデクスは、ポイントの位置によって階
層的なデータ構造を作り、それを元(ルートノード)か
ら手操ることで、検索を行う。身近な例では、道路地図
(2次元空間)などにある縦横でメッシュがきってあ
り、この観光スポットは縦D横3にある、というように
検索する時に使うものも一種のインデクスといえる。
The index is an auxiliary data structure for retrieving a point at a specific position in a multidimensional space or for retrieving a point near a specified position at a high speed. Typically, there are R-tree and k-dtree. These indexes are searched by creating a hierarchical data structure depending on the position of the point and manipulating it from the source (root node). In a familiar example, meshes are cut vertically and horizontally on a road map (two-dimensional space) or the like, and this sightseeing spot is located vertically and horizontally three times.

【0027】次に、本実施形態の動作を図2の流れ図に
より説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG.

【0028】オブジェクトOb1の特徴量Ob11,O
b12,...,Ob1n,オブジェクトOb2の特徴
量Ob21,Ob22,...,Ob2n,...,オ
ブジェクトObmの特徴量Obm1,Obm
2,...,Obmn(nは特徴量の種類の数)が特徴
量算出部11によりあらかじめ算出され、特徴量・イン
デクス格納部12に格納されている。各オブジェクトO
b1〜Obm自体はオブジェクトデータ蓄積部10に格
納されている。また、各特徴量種類の多次元ベクトル空
間において、検索のためインデクスがインデクス生成部
14により生成される。このインデクスは特徴量・イン
デクス格納部12に格納される。
The feature values Ob11, O of the object Ob1
b12,. . . , Ob1n, the feature amounts Ob21, Ob22,. . . , Ob2n,. . . , Object Obm feature amount Obm1, Obm
2,. . . , Obmn (n is the number of types of feature amounts) is calculated in advance by the feature amount calculation unit 11 and stored in the feature amount / index storage unit 12. Each object O
b1 to Obm themselves are stored in the object data storage unit 10. Further, in the multidimensional vector space of each feature amount type, the index generation unit 14 generates an index for search. This index is stored in the feature / index storage unit 12.

【0029】まず、利用者は参照オブジェクト入力部1
31から参照オブジェクトを、重み指定部132から重
みw1,...,wnを、オブジェクト数指定部133
からオブジェクト数Kを入力する。重みw1〜wnとオ
ブジェクト数Kは、利用者からの入力がない場合はデフ
ォルトの値を用いる(ステップ21)。次に、参照オブ
ジェクトの特徴量VR1,...,VRnを特徴量算出
部11により計算する(ステップ22)。
First, the user enters the reference object input unit 1
31 and weights w1,. . . , Wn to the object number designation unit 133
Input the number K of objects. If there is no input from the user, default values are used for the weights w1 to wn and the number K of objects (step 21). Next, the feature amounts VR1,. . . , VRn are calculated by the feature value calculation unit 11 (step 22).

【0030】次に、コーディネータ部16は、i番目の
種類の特徴量について、参照オブジェクトのi番目の種
類の特徴量VRiと、近傍オブジェクト数を指定する数
(Kおよびw1,w2,・・・,wnの関数)f(K,
w1,w2,・・・,wn)(ただしK以上の数)と、
検索精度eを指定して、近傍オブジェクト検索部15に
近傍オブジェクト検索を要求する(ステップ23)。こ
のとき、f(K,w1,w2,・・・,wn)として
は、例えばwi×f(K)などが考えられる。
Next, the coordinator unit 16 calculates the i-th type feature amount VRi of the reference object and the numbers (K and w1, w2,...) Specifying the number of neighboring objects for the i-th type feature amount. , Wn) f (K,
w1, w2,..., wn) (however, a number greater than or equal to K);
A search precision e is designated, and a request for a nearby object search is made to the nearby object search unit 15 (step 23). At this time, for example, wi × f (K) can be considered as f (K, w1, w2,..., Wn).

【0031】このとき、検索精度eは使用するインデク
スによって異なるが、例えば、先に挙げた文献S. Arya,
D. M. Mount, N. S. Netanyasu, R. Silverman, and
A. Y.Wu, “An Optimal algorithm for approximate ne
arest neighbor searching,“5th Ann. ACM-SIAM Sympo
sium on Discrete Algorithms, 1994, pp.573-582.にあ
るεが考えられる。本発明は重みの小さい特徴量種類に
ついては、検索精度を下げて近傍を検索する。つまり、
この精度eの値を0〜1の値として、1の時、真の近傍
と全く同一になるとする。この場合、eの決定方法とし
ては、重みwiが大きいほどeが大きくなる(1に近く
なる)ように決めることになる。例えばwiを重みw
l,・・・,wnの全体で正規化した場合、wiは0〜
1の値をとることになるが、eの値として0.5+wi/2やsq
r(wi)(ここで、sqr(x)はxの平方根)の値などを用いる
ことが考えられる。
At this time, the search precision e differs depending on the index used. For example, the reference S. Arya,
DM Mount, NS Netanyasu, R. Silverman, and
AYWu, “An Optimal algorithm for approximate ne
arest neighbor searching, “5th Ann. ACM-SIAM Sympo
ε in sium on Discrete Algorithms, 1994, pp. 573-582. According to the present invention, for a feature amount type having a small weight, a neighborhood is searched for with reduced search accuracy. That is,
It is assumed that the value of the precision e is a value of 0 to 1, and when it is 1, it is exactly the same as the true neighborhood. In this case, e is determined in such a manner that the larger the weight wi, the larger e (closer to 1). For example, wi is weight w
When normalization is performed on the whole of l,.
It takes the value of 1, but the value of e is 0.5 + wi / 2 or sq
It is conceivable to use the value of r (wi) (where sqr (x) is the square root of x).

【0032】要求を受けた近傍オブジェクト検索部15
は各特徴量種類i毎に、その多次元ベクトル空間内で、
参照オブジェクトに対応するポイントにその空間の距離
で近いものf(K)個を、インデクスを用いて求め、コ
ーディネータ部16に返却する(ステップ24)。
Neighboring object search unit 15 receiving the request
For each feature amount type i in its multidimensional vector space,
F (K) points that are close to the point corresponding to the reference object by the distance in the space are obtained using the index, and are returned to the coordinator 16 (step 24).

【0033】近傍オブジェクトを返されたコーディネー
タ部16は、全ての特徴量種類について返却された近傍
オブジェクトをまとめて、候補オブジェクト群を作る
(ステップ25)。候補オブジェクト群は例えば近傍オ
ブジェクトの和集合として求められる。この場合、候補
オブジェクトの数は最大f(K)×n(各特徴量種類に
ついての近傍オブジェクトに全く重複がない場合)、最
小f(K)(各特徴量種類について近傍オブジェクトが
全く同じ場合)になる。
The coordinator unit 16 that has returned the neighboring objects collects the returned neighboring objects for all feature types and creates a candidate object group (step 25). The candidate object group is obtained, for example, as a union of neighboring objects. In this case, the number of candidate objects is maximum f (K) × n (when there is no overlap between neighboring objects for each feature amount type), and minimum f (K) (when the neighboring objects are exactly the same for each feature amount type). become.

【0034】次に、候補オブジェクトObkについて、
特徴量種類毎の参照オブジェクトに対応するポイントV
RiとObkiとの距離dki(iは特徴量の種類)が
求まっていない場合は、不足分を計算する(ステップ2
6)。
Next, regarding the candidate object Obk,
Point V corresponding to reference object for each feature type
If the distance dki between Ri and Obki (i is the type of feature amount) has not been determined, the shortage is calculated (step 2).
6).

【0035】各候補オブジェクトObkについて、VR
1とObk1との距離dk1,...,VRnとObk
nとの距離dknが求まったところで、重みw
1,...,wnを加味して類似度を計算する(ステッ
プ27)。例えばw1/dk1+・・・+wn/dkn
のように類似度を計算する。
For each candidate object Obk, VR
1 and Obk1 are distances dk1,. . . , VRn and Obk
Once the distance dkn to n has been determined, the weight w
1,. . . , Wn are calculated to calculate the similarity (step 27). For example, w1 / dk1 + ... + wn / dkn
The similarity is calculated as follows.

【0036】次に、求まった類似度の大きい順に候補オ
ブジェクトを並べて、上位K個を結果として返す(ステ
ップ28)。
Next, the candidate objects are arranged in descending order of the obtained similarity, and the top K objects are returned as a result (step 28).

【0037】コーディネータ部16から結果が返される
と、オブジェクト提示部134が結果を利用者に提示す
る(ステップ29)。
When the result is returned from the coordinator section 16, the object presenting section 134 presents the result to the user (step 29).

【0038】なお、以上で、重みが0と指定された特徴
量種類については、近傍オブジェクト検索や距離計算は
省略することができる。また、重みは、必ずしも、利用
者が指定したものを直接用いるだけでなく、指定された
ものから、何らかの方法で求めた重みを利用することも
考えられる。また、ステップ24,26はそれぞれ特徴
量種類に関して並列に処理を行うことができる。
As described above, for the feature amount type designated as having a weight of 0, the neighboring object search and the distance calculation can be omitted. Further, as the weight, not only the one specified by the user is necessarily used directly, but also a weight obtained by some method from the specified one may be used. Steps 24 and 26 can be performed in parallel with respect to the types of feature amounts.

【0039】本発明の他の実施態様によれば、上記ステ
ップ26での距離計算を、ステップ24での近傍オブジ
ェクトを求める段階で合わせて行う。この場合は、ステ
ップ26は不要である。
According to another embodiment of the present invention, the distance calculation in step 26 is performed together with the step of obtaining a nearby object in step 24. In this case, step 26 is unnecessary.

【0040】図3を参照すると、本発明の他の実施形態
の類似オブジェクト検索装置は入力装置31と記憶装置
32〜34と出力装置35と記録媒体36とデータ処理
装置37で構成されている。
Referring to FIG. 3, a similar object retrieval apparatus according to another embodiment of the present invention includes an input device 31, storage devices 32-34, an output device 35, a recording medium 36, and a data processing device 37.

【0041】入力装置31は図1中の参照オブジェクト
入力部131と重み指定部132と提示オブジェクト数
指定部133に相当する。記憶装置32,33,34は
それぞれ図1中のオブジェクトデータ蓄積部10,特徴
量・インデクス格納部12,一時データ蓄積部17に相
当する。出力装置35は図1中のオブジェクト提示部1
34に相当する。記録媒体36はフロッピィ・ディス
ク,CD−ROM,光磁気ディスク,半導体メモリ等の
記録媒体で、図2中に示した処理を類似オブジェクト検
索プログラムとして記録している。データ処理装置37
はコンピュータのCPUで、記録媒体36から類似オブ
ジェクト検索プログラムを読み込んで、これを実行す
る。
The input device 31 corresponds to the reference object input unit 131, the weight specifying unit 132, and the number-of-presented-objects specifying unit 133 in FIG. The storage devices 32, 33, and 34 correspond to the object data storage unit 10, feature quantity / index storage unit 12, and temporary data storage unit 17 in FIG. 1, respectively. The output device 35 is the object presentation unit 1 in FIG.
34. The recording medium 36 is a recording medium such as a floppy disk, CD-ROM, magneto-optical disk, or semiconductor memory, and records the processing shown in FIG. 2 as a similar object search program. Data processing device 37
Is a CPU of the computer, reads a similar object search program from the recording medium 36, and executes it.

【0042】[0042]

【発明の効果】以上説明したように、本発明は、特徴量
の種類毎に、インデクスを利用して、参照オブジェクト
の近傍オブジェクトを絞り込み、これら近傍オブジェク
トから類似オブジェクトの候補を作り、これら候補に対
する距離計算と、重みによる類似度の計算を行うので、
全てのオブジェクトに対して距離計算を行う手間を省
き、かつ任意の重みで類似オブジェクトを検索すること
が可能になり、また全体の精度にあまり影響しない特徴
量種類については検索件数を小さくし、全体の精度に影
響が大きい特徴種類については検索件数を大きくするこ
とにより、全体の精度を下げないで、全体の検索にかか
る時間を低減することができる。
As described above, according to the present invention, for each type of feature amount, objects near the reference object are narrowed down using the index, similar object candidates are created from these nearby objects, and the candidate Since distance calculation and calculation of similarity by weight are performed,
It is possible to search for similar objects with arbitrary weights without having to perform the distance calculation for all objects, and to reduce the number of searches for feature types that do not significantly affect the overall accuracy. By increasing the number of searches for a feature type that greatly affects the accuracy of the search, the time required for the entire search can be reduced without lowering the overall accuracy.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態の類似オブジェクト検索装
置の構成図である。
FIG. 1 is a configuration diagram of a similar object search device according to an embodiment of the present invention.

【図2】図1の類似オブジェクト検索装置の動作を示す
流れ図である。
FIG. 2 is a flowchart showing an operation of the similar object search device of FIG. 1;

【図3】本発明の他の実施形態の類似オブジェクト検索
装置の構成図である。
FIG. 3 is a configuration diagram of a similar object search device according to another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10 オブジェクトデータ蓄積部 11 特徴量算出部 12 特徴量・インデクス格納部 13 インタフェース部 131 参照オブジェクト入力部 132 重み指定部 133 提示オブジェクト数指定部 134 オブジェクト提示部 14 インデクス生成部 15 近傍オブジェクト検索部 16 コーディネータ部 17 一時データ蓄積部 21〜29 ステップ 31 入力装置 32〜34 記憶装置 35 出力装置 36 記録媒体 37 データ処理装置 Reference Signs List 10 object data storage unit 11 feature amount calculation unit 12 feature amount / index storage unit 13 interface unit 131 reference object input unit 132 weight designation unit 133 weighted object number designation unit 134 object presentation unit 14 index generation unit 15 neighboring object search unit 16 coordinator Unit 17 Temporary data storage unit 21 to 29 Step 31 Input device 32 to 34 Storage device 35 Output device 36 Recording medium 37 Data processing device

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND08 ND20 ND40 NK10 NK14 NK24 NK43 PP30 PQ00 PQ46 PR06 PR10 QM08 QP10 QT03 UU40 5L096 AA02 DA01 EA23 EA31 EA39 FA15 FA69 FA76 FA81 GA08 ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B075 ND08 ND20 ND40 NK10 NK14 NK24 NK43 PP30 PQ00 PQ46 PR06 PR10 QM08 QP10 QT03 UU40 5L096 AA02 DA01 EA23 EA31 EA39 FA15 FA69 FA76 FA81 GA08

Claims (21)

【特許請求の範囲】[Claims] 【請求項1】 蓄積された多数のオブジェクトの中か
ら、利用者が指定したオブジェクトである参照オブジェ
クトに類似したオブジェクトを、類似度の高い順にある
数だけ取り出して利用者に提示する類似オブジェクト検
索方法であって、 蓄積されたオブジェクトの各種類の特徴量を計算して、
個々の特徴量種類毎に多次元ベクトル空間のポイントと
して蓄積しておき、かつ、各特徴量種類の多次元ベクト
ル空間では、データ検索に必要なインデクスを計算して
おく段階と、 参照オブジェクトを利用者が入力する段階と、 結果として欲しい類似オブジェクトの数を利用者が指定
する段階と、 検索観点である特徴量の種類の間の重みを取得する段階
と、 前記参照オブジェクトの特徴量を種類毎に算出する段階
と、 特徴量の種類毎に、参照オブジェクトと蓄積された各オ
ブジェクトとの間の多次元ベクトル空間における距離に
関して、前記インデクスを利用して参照オブジェクトに
対する近傍のオブジェクトを求める数を、その特徴量種
類間の重みを用いて特徴量種類毎に決定し、決定された
数だけ前記近傍のオブジェクトを求める近傍オブジェク
ト検索段階と、 特徴量の種類毎に求められた近傍オブジェクトを全ての
特徴量種類についてまとめることで類似オブジェクトの
候補を作り、その候補について参照オブジェクトとの距
離に前記重みを加味して類似度を求める類似度計算段階
と、 前記類似度に従い前記候補オブジェクトを順序付けし
て、利用者が指定した数に合わせて最終結果を求める段
階と、 前記最終結果を利用者に提示する段階とを有する類似オ
ブジェクト検索方法。
1. A similar object search method for extracting an object similar to a reference object, which is an object designated by a user, from a large number of accumulated objects in a descending order of similarity and presenting the same to a user. It calculates the amount of feature of each type of the accumulated object,
A stage in which each feature type is accumulated as a point in the multidimensional vector space, and in the multidimensional vector space of each feature type, an index required for data retrieval is calculated, and a reference object is used. The user inputs the number of similar objects desired as a result, the user specifies the number of similar objects desired as a result, the step of obtaining a weight between the types of feature amounts that are search viewpoints, and the feature amount of the reference object for each type. And calculating, for each type of feature amount, the distance in the multidimensional vector space between the reference object and each of the stored objects, the number of objects to be used for obtaining a nearby object with respect to the reference object using the index, A determination is made for each type of feature using the weight between the types of feature, and the determined number of nearby objects for obtaining the nearby objects is determined. A similar object candidate is created by retrieving the similar object by combining the neighboring objects obtained for each type of feature amount with respect to all feature amount types, and the similarity is calculated by adding the weight to the distance between the candidate and the reference object. A similarity calculation step of: ordering the candidate objects according to the similarity degree to obtain a final result according to a number specified by a user; and presenting the final result to a user. Object search method.
【請求項2】 前記近傍オブジェクト検索段階では、各
特徴量種類毎に近傍オブジェクトを求める際の検索精度
を、その特徴量種類間の重みを用いて特徴量種類毎に決
定する、請求項1記載の類似オブジェクト検索方法。
2. The method according to claim 1, wherein in the neighborhood object search step, a search accuracy for finding a neighborhood object for each feature amount type is determined for each feature amount type using a weight between the feature amount types. Similar object search method.
【請求項3】 前記近傍のオブジェクトを求める数を、
前記重みが小さい特徴量種類については少なくし、前記
重みが大きい特徴量種類については多くする、請求項1
記載の方法。
3. The number for finding the nearby object is:
2. The method according to claim 1, wherein the number of the feature amounts having the small weight is reduced, and the number of the feature amounts having the large weight is increased.
The described method.
【請求項4】 前記重みの小さい特徴量種類については
検索精度を下げる、請求項2記載の方法。
4. The method according to claim 2, wherein the retrieval accuracy is reduced for the feature type having a small weight.
【請求項5】 前記近傍オブジェクト検索段階では、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離が求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での参照オブジェクトから
の距離を計算し、その後、前記類似度計算段階では全候
補オブジェクトについて参照オブジェクトとの距離に重
みを加味して類似度を計算する、請求項1から4のいず
れか1項記載の類似オブジェクト検索方法。
5. In the neighborhood object search step, a distance of each feature amount type of the neighborhood object from a reference object in a multidimensional vector space is calculated, and the neighborhood objects obtained from all feature amount types are collectively determined as candidates. At the time when the object is obtained, the distance from the reference object in the multidimensional vector space of the characteristic amount for which the distance has not been determined for each candidate object is calculated. The similar object search method according to claim 1, wherein the similarity is calculated by adding a weight to a distance between the candidate object and the reference object.
【請求項6】 前記近傍オブジェクト検索段階では、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、前記類似度計算段階では全候補オブジェク
トについて参照オブジェクトとの距離に重みを加味して
類似度を計算する、請求項1から4のいずれか1項記載
の類似オブジェクト検索方法。
6. The neighborhood object search step does not calculate the distance of each feature amount type of the neighborhood object from the reference object in the multidimensional vector space, and collects the neighborhood objects obtained from all the feature amount types. At the time when the candidate object is obtained, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and then, in the similarity calculation step, the weights are added to the distances from all the candidate objects to the reference object. The similar object search method according to any one of claims 1 to 4, wherein the similarity is calculated by using:
【請求項7】 前記近傍オブジェクト検索段階では、各
特徴量種類の多次元ベクトル空間での検索された近傍オ
ブジェクトについて、その段階で着目している種類の特
徴量での参照オブジェクトからの距離のみでなく、全て
の種類の特徴量について参照オブジェクトからの距離を
計算し、しかし、各オブジェクトついて、一度距離計算
したものは印をつけて距離計算が重複しないようにす
る、請求項1から4のいずれか1項記載の類似オブジェ
クト検索方法。
7. In the neighborhood object search step, for the neighborhood object searched in the multidimensional vector space of each feature amount type, only the distance from the reference object in the feature amount of the type of interest at that stage. 5. The method according to claim 1, wherein distances from the reference object are calculated for all types of feature amounts, but, for each object, the distance calculated once is marked so that the distance calculation does not overlap. 2. The similar object search method according to claim 1.
【請求項8】 蓄積された多数のオブジェクトの中か
ら、利用者が指定したオブジェクトである参照オブジェ
クトに類似したオブジェクトを、類似度の高い順にある
数だけ取り出して利用者に提示する類似オブジェクト検
索装置であって、 オブジェクトデータを蓄積するオブ
ジェクトデータ蓄積手段と、 利用者が前記参照オブジェクトを入力するための参照オ
ブジェクト入力手段と、 結果として欲しい類似オブジェクトの数を利用者が指定
するオブジェクト数指定手段と、 検索観点である特徴量の種類の間の重みを取得する手段
と、 蓄積された各オブジェクトおよび参照オブジェクトにつ
いて、各種類毎の特徴量を算出する特徴量算出手段と、 前記算出された特徴量のうち、あらかじめ蓄積されたオ
ブジェクトの特徴量について、個々の特徴量種類毎に多
次元ベクトル空間のポイントとして格納しておくための
特徴量格納手段と、 前記算出された特徴量のうち、あらかじめ蓄積されたオ
ブジェクトの特徴量について、各特徴量種類の多次元ベ
クトル空間では、データ検索に必要なインデクスを計算
して、そのインデクスを格納しておくためのインデクス
生成・格納手段と、 特徴量の種類毎に、参照オブジェクトと蓄積された各オ
ブジェクトとの間の多次元ベクトル空間における距離に
関して、前記インデクスを利用して参照オブジェクトに
対する近傍のオブジェクトを求める数を、その特徴量種
類間の重みを用いて特徴量種類毎に決定し、決定された
数だけ求める近傍オブジェクト検索手段と、 特徴量の種類毎に求められた近傍オブジェクトを全ての
特徴量種類についてまとめ、類似オブジェクトの候補を
作り、その候補について前記重みを加味して類似度を求
める類似度計算手段と、 前記類似度に従い、候補オブジェクトを順序付けして、
利用者が指定した数に合わせて最終結果を求める手段
と、 最終結果を利用者に提示するオブジェクト提示手段とを
有する類似オブジェクト検索装置。
8. A similar object search apparatus that extracts objects similar to a reference object, which is an object designated by a user, from a large number of accumulated objects in a descending order of similarity and presents them to the user. Object data storage means for storing object data; reference object input means for a user to input the reference object; and object number specification means for the user to specify the number of similar objects desired as a result. A means for acquiring a weight between types of feature amounts that are search viewpoints; a feature amount calculating unit for calculating a feature amount for each type for each of the stored objects and reference objects; and the calculated feature amounts. Of the features of the objects stored in advance, A feature amount storage unit for storing as a point in a multidimensional vector space for each feature type, and a multidimensional feature of each feature type for a feature amount of an object stored in advance among the calculated feature amounts. In the vector space, an index necessary for data retrieval is calculated, an index generation / storage means for storing the index, and, for each type of feature amount, an index between the reference object and each stored object. With respect to the distance in the multidimensional vector space, the number of objects to be searched for in the vicinity of the reference object using the index is determined for each feature type using the weight between the feature types. Object retrieving means, summarizes nearby objects obtained for each feature type for all feature types Make candidates of similar objects, the similarity calculation means for calculating the similarity in consideration of the weight for that candidate, in accordance with the degree of similarity, and orders the candidate object,
A similar object search device comprising: means for obtaining a final result according to a number designated by a user; and object presenting means for presenting the final result to a user.
【請求項9】 前記近傍オブジェクト検索手段は、各特
徴量種類毎に近傍オブジェクトを求める際の検索精度
を、その特徴量種類間の重みを用いて特徴量種類毎に決
定する、請求項8記載の類似オブジェクト検索装置。
9. The method according to claim 8, wherein the neighborhood object search unit determines the search accuracy when finding a neighborhood object for each feature amount type by using a weight between the feature amount types. Similar object search device.
【請求項10】 前記近傍オブジェクト検索手段は、前
記近傍のオブジェクトを求める数を、前記重みが小さい
特徴量種類については少なくし、前記重みが大きい特徴
量種類については多くする、請求項8記載の装置。
10. The method according to claim 8, wherein the neighboring object search unit decreases the number of the objects to be searched for the feature type having the small weight and increases the feature number for the feature type having the large weight. apparatus.
【請求項11】 前記近傍オブジェクト検索手段は、前
記重みの小さい特徴量種類については検索精度を下げ
る、請求項9記載の装置。
11. The apparatus according to claim 9, wherein said neighborhood object search means lowers search accuracy for the feature amount type having the smaller weight.
【請求項12】 前記近傍オブジェクト検索手段は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離が求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での参照オブジェクトから
の距離を計算し、その後、前記類似度計算手段は全候補
オブジェクトについて参照オブジェクトとの距離に重み
を加味して類似度を計算する、請求項8から11のいず
れか1項記載の類似オブジェクト検索装置。
12. The neighborhood object search means calculates a distance of each feature amount type of the neighborhood object from a reference object in a multidimensional vector space, and collectively determines a neighborhood object obtained from all feature amount types as a candidate. At the time when the object is obtained, the distance from the reference object in the multi-dimensional vector space of the characteristic amount type for which the distance has not been determined for each candidate object is calculated. The similar object search device according to any one of claims 8 to 11, wherein the similarity is calculated by adding a weight to a distance between the candidate object and the reference object.
【請求項13】 前記近傍オブジェクト検索手段は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、前記類似度計算手段は全候補オブジェクト
について参照オブジェクトとの距離に重みを加味して類
似度を計算する、請求項8から11のいずれか1項記載
の類似オブジェクト検索装置。
13. The neighborhood object search means does not calculate the distance of each feature type of the neighborhood object from the reference object in the multidimensional vector space, and collects the neighborhood objects obtained from all the feature types. At the time when the candidate object is obtained, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and thereafter, the similarity calculating means takes into account the weight of the distance to the reference object for all the candidate objects. The similar object search device according to any one of claims 8 to 11, wherein the similarity is calculated by using:
【請求項14】 前記近傍オブジェクト手段は、各特徴
量種類の多次元ベクトル空間での検索された近傍オブジ
ェクトについて、その段階で着目している種類の特徴量
での参照オブジェクトからの距離のみでなく、全ての種
類の特徴量について参照オブジェクトからの距離を計算
し、しかし、各オブジェクトについて、一度距離計算し
たものは印をつけて距離計算が重複しないようにする、
請求項8から11のいずれか1項記載の類似オブジェク
ト検索装置。
14. The neighborhood object means may determine not only the distance from a reference object in a feature amount of a type of interest at that stage, but also the distance of a searched neighborhood object in a multidimensional vector space of each feature amount type. , Calculate the distance from the reference object for all kinds of features, but mark the distance calculation once for each object so that the distance calculation does not overlap,
A similar object search device according to any one of claims 8 to 11.
【請求項15】 蓄積された多数のオブジェクトの中か
ら、利用者が指定したオブジェクトである参照オブジェ
クトに類似したオブジェクトを、類似度の高い順にある
数だけ取り出して利用者に提示する類似オブジェクト検
索プログラムであって、 蓄積されたオブジェクトの各種類の特徴量を計算して、
個々の特徴量種類毎に多次元ベクトル空間のポイントと
して蓄積しておき、かつ、各特徴量種類の多次元ベクト
ル空間では、データ検索に必要なインデクスを計算して
おく処理と、 利用者が入力した参照オブジェクトの特徴量を種類毎に
算出する段階と、 特徴量の種類毎に、参照オブジェクトと蓄積された各オ
ブジェクトとの間の多次元ベクトル空間における距離に
関して、前記インデクスを利用して参照オブジェクトに
対する近傍のオブジェクトを求める数を、その特徴量種
類間の重みを用いて特徴量種類毎に決定し、決定された
数だけ前記近傍のオブジェクトを求める近傍オブジェク
ト検索処理と、 特徴量の種類毎に求められた近傍オブジェクトを全ての
特徴量種類についてまとめることで類似オブジェクトの
候補を作り、その候補について参照オブジェクトとの距
離に重みを加味して類似度を求める類似度計算処理と、 前記類似度に従い前記候補オブジェクトを順序付けし
て、利用者が指定した数に合わせて最終結果を求める処
理と、 前記最終結果を利用者に提示する処理とをコンピュータ
に実行させるための類似オブジェクト検索プログラムを
記録した記録媒体。
15. A similar object search program for extracting an object similar to a reference object, which is an object designated by a user, from a large number of stored objects in descending order of similarity and presenting the object to a user. It calculates the amount of feature of each type of the accumulated object,
A process for storing the points required in the multidimensional vector space for each feature type and calculating the indexes required for data search in the multidimensional vector space for each feature type, Calculating the feature amount of the reference object obtained for each type, and for each type of feature amount, regarding the distance in the multidimensional vector space between the reference object and each of the stored objects, the reference object using the index. The number of nearby objects to be obtained is determined for each feature amount type using the weight between the feature amount types, and a nearby object search process for obtaining the determined number of nearby objects by the determined number is performed. A candidate for a similar object is created by combining the obtained neighboring objects for all feature types, and the candidate A similarity calculation process of calculating a similarity by adding a weight to a distance to a reference object, and a process of ordering the candidate objects according to the similarity and obtaining a final result according to a number specified by a user; A recording medium recording a similar object search program for causing a computer to execute the process of presenting the final result to a user.
【請求項16】 前記近傍オブジェクト検索処理は、各
特徴量種類毎に近傍オブジェクトを求める際の検索精度
を、その特徴量種類間の重みを用いて特徴量種類毎に決
定する、請求項15記載の記録媒体。
16. The method according to claim 15, wherein in the nearby object search processing, a search accuracy for obtaining a nearby object for each feature amount type is determined for each feature amount type using a weight between the feature amount types. Recording medium.
【請求項17】 前記近傍オブジェクト検索処理は、前
記近傍のオブジェクトを求める数を、前記重みが小さい
特徴量種類については少なくし、前記重みが大きい特徴
量種類については多くする、請求項15記載の記録媒
体。
17. The neighborhood object search process according to claim 15, wherein the number of the neighborhood objects to be obtained is reduced for the feature amount type with the small weight and increased for the feature amount type with the large weight. recoding media.
【請求項18】 前記近傍オブジェクト検索処理は、前
記重みの小さい特徴量種類については検索精度を下げ
る、請求項16記載の記録媒体。
18. The recording medium according to claim 16, wherein said neighborhood object search processing lowers search accuracy for the feature amount type having the smaller weight.
【請求項19】 前記近傍オブジェクト検索処理は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離が求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での参照オブジェクトから
の距離を計算し、その後、前記類似度計算処理は全候補
オブジェクトについて参照オブジェクトとの距離に重み
を加味して類似度を計算する、請求項15から18のい
ずれか1項記載の記録媒体。
19. The neighborhood object search processing calculates a distance of each feature amount type of the neighborhood object from a reference object in a multidimensional vector space, and collectively determines a neighborhood object obtained from all feature amount types as a candidate. At the time when the object is obtained, the distance from the reference object in the multidimensional vector space of the type of the characteristic amount for which the distance has not been obtained for each candidate object is calculated. 19. The recording medium according to claim 15, wherein the similarity is calculated by adding a weight to a distance between the candidate object and the reference object.
【請求項20】 前記近傍オブジェクト検索処理は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、前記類似度計算処理は前記類似度計算段階
では全候補オブジェクトについて参照オブジェクトとの
距離に重みを加味して類似度を計算する、請求項15か
ら18のいずれか1項記載の記録媒体。
20. The neighborhood object search processing does not calculate the distance of each feature type of the neighborhood object from the reference object in the multidimensional vector space, but collects the neighborhood objects obtained from all the feature types. At the time when the candidate object is obtained, the distance in the multidimensional vector space of each feature amount type is calculated for each candidate object, and then, in the similarity calculation step, in the similarity calculation step, all the candidate objects are compared with the reference object. 19. The recording medium according to claim 15, wherein a similarity is calculated by adding a weight to the distance.
【請求項21】 前記近傍オブジェクト検索処理は、各
特徴量種類の多次元ベクトル空間での検索された近傍オ
ブジェクトについて、その段階で着目している種類の特
徴量での参照オブジェクトからの距離のみでなく、全て
の種類の特徴量について参照オブジェクトからの距離を
計算し、しかし、各オブジェクトついて、一度距離計算
したものは印をつけて距離計算が重複しないようにす
る、請求項15から18のいずれか1項記載の類似オブ
ジェクト検索方法。
21. The neighborhood object search processing is performed on the neighborhood object searched for in the multidimensional vector space of each feature amount type by using only the distance from the reference object by the feature amount of the type of interest at that stage. 19. The method according to claim 15, wherein distances from the reference object are calculated for all types of feature amounts, but, for each object, the distance calculated once is marked so that the distance calculation does not overlap. 2. The similar object search method according to claim 1.
JP17324998A 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program Expired - Fee Related JP3505393B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17324998A JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17324998A JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Publications (2)

Publication Number Publication Date
JP2000010989A true JP2000010989A (en) 2000-01-14
JP3505393B2 JP3505393B2 (en) 2004-03-08

Family

ID=15956940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17324998A Expired - Fee Related JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Country Status (1)

Country Link
JP (1) JP3505393B2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243247A (en) * 2000-03-02 2001-09-07 Satake Corp Distributed processing information retrieving device and its method
JP2001337991A (en) * 2000-05-26 2001-12-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for retrieving information, and storage medium with information retrieval program recorded therein
JP2002041569A (en) * 2000-05-19 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing retrieval service, method and device for retrieving information, information retrieving server, retrieval service providing method, program therefor, and recording medium the program recorded thereon
JP2005025770A (en) * 2000-05-19 2005-01-27 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing search service, method and apparatus for searching information, information search server, method for providing search service, its program, and recording medium with program recorded thereon
JP2006190192A (en) * 2005-01-07 2006-07-20 Sony Corp Information processing device and method, and program
US7490107B2 (en) 2000-05-19 2009-02-10 Nippon Telegraph & Telephone Corporation Information search method and apparatus of time-series data using multi-dimensional time-series feature vector and program storage medium
JP2012078930A (en) * 2010-09-30 2012-04-19 Ntt Docomo Inc Content retrieval device and content retrieval method
JP2014006613A (en) * 2012-06-22 2014-01-16 Dainippon Screen Mfg Co Ltd Neighborhood search method and similar image search method
CN107004025A (en) * 2015-03-13 2017-08-01 株式会社日立制作所 Image retrieving apparatus and the method for retrieving image

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154149A (en) * 1996-11-25 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> Similar object retrieval method and device therefor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154149A (en) * 1996-11-25 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> Similar object retrieval method and device therefor

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243247A (en) * 2000-03-02 2001-09-07 Satake Corp Distributed processing information retrieving device and its method
JP2002041569A (en) * 2000-05-19 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing retrieval service, method and device for retrieving information, information retrieving server, retrieval service providing method, program therefor, and recording medium the program recorded thereon
JP2005025770A (en) * 2000-05-19 2005-01-27 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing search service, method and apparatus for searching information, information search server, method for providing search service, its program, and recording medium with program recorded thereon
US7490107B2 (en) 2000-05-19 2009-02-10 Nippon Telegraph & Telephone Corporation Information search method and apparatus of time-series data using multi-dimensional time-series feature vector and program storage medium
JP2001337991A (en) * 2000-05-26 2001-12-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for retrieving information, and storage medium with information retrieval program recorded therein
JP2006190192A (en) * 2005-01-07 2006-07-20 Sony Corp Information processing device and method, and program
JP4556121B2 (en) * 2005-01-07 2010-10-06 ソニー株式会社 Information processing apparatus and method, and program
JP2012078930A (en) * 2010-09-30 2012-04-19 Ntt Docomo Inc Content retrieval device and content retrieval method
JP2014006613A (en) * 2012-06-22 2014-01-16 Dainippon Screen Mfg Co Ltd Neighborhood search method and similar image search method
CN107004025A (en) * 2015-03-13 2017-08-01 株式会社日立制作所 Image retrieving apparatus and the method for retrieving image
CN107004025B (en) * 2015-03-13 2020-07-14 株式会社日立制作所 Image search device and method for searching image

Also Published As

Publication number Publication date
JP3505393B2 (en) 2004-03-08

Similar Documents

Publication Publication Date Title
EP0947937B1 (en) Image search apparatus and method
JP3571162B2 (en) Similar object search method and apparatus
KR101266358B1 (en) A distributed index system based on multi-length signature files and method thereof
JPH11316846A (en) Image inquring method utilizing area information and edge information of image, and image inquiring device
KR20010053788A (en) System for content-based image retrieval and method using for same
Luo et al. Distributed Spatial Keyword Querying on Road Networks.
EP0497960A1 (en) Adaptive ranking system for information retrieval
KR20050004044A (en) Method and device for measuring visual similarity
US7822700B2 (en) Method for using lengths of data paths in assessing the morphological similarity of sets of data by using equivalence signatures
KR20090065130A (en) Indexing and searching method for high-demensional data using signature file and the system thereof
JP3505393B2 (en) Similar object search method and apparatus, and recording medium storing similar object search program
US6910030B2 (en) Adaptive search method in feature vector space
JPH11120180A (en) Data retrieval device and storage medium recording data retrieval program
JP2004118290A (en) Device and method for generating index for moving locus data retrieval, device and method for retrieving moving locus data, index generating program for moving locus data retrieval, recording medium recording the same, moving locus data retrieval program and recording medium recording the same
CN1352432A (en) Index and method for searching characteristic vector space
JPH10301937A (en) Neighborhood retrieval method inside multi-dimensional vector space and recording medium for the program
US7849038B2 (en) Method for using the second homotopy group in assessing the similarity of sets of data
JP2003316819A (en) Object classification researching device and program for executing it
JP2001319232A (en) Device and method for retrieving similar image
JP3938815B2 (en) Node creation method, image search method, and recording medium
Egas et al. Adapting kd trees to visual retrieval
JP2001022621A (en) Multidimensional database management system
JP2000035965A (en) Method and device for retrieving similar feature quantity and storage medium storing retrieval program of similar feature quantity
CN111460325B (en) POI searching method, device and equipment
US20030109940A1 (en) Device, storage medium and a method for detecting objects strongly resembling a given object

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees