JP3505393B2 - Similar object search method and apparatus, and recording medium storing similar object search program - Google Patents

Similar object search method and apparatus, and recording medium storing similar object search program

Info

Publication number
JP3505393B2
JP3505393B2 JP17324998A JP17324998A JP3505393B2 JP 3505393 B2 JP3505393 B2 JP 3505393B2 JP 17324998 A JP17324998 A JP 17324998A JP 17324998 A JP17324998 A JP 17324998A JP 3505393 B2 JP3505393 B2 JP 3505393B2
Authority
JP
Japan
Prior art keywords
feature
type
objects
feature quantity
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17324998A
Other languages
Japanese (ja)
Other versions
JP2000010989A (en
Inventor
展郎 谷口
雅司 山室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP17324998A priority Critical patent/JP3505393B2/en
Publication of JP2000010989A publication Critical patent/JP2000010989A/en
Application granted granted Critical
Publication of JP3505393B2 publication Critical patent/JP3505393B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、電子博物館や電子
カタログなどのディジタル化されたオブジェクト(画
像、音声、音楽、テキストなど)を多数蓄積したものか
ら、利用者が何らかの手段で入力したオブジェクト(参
照オブジェクト)と類似したオブジェクトを類似してい
ると判定された順に上位幾つかを検索結果として提示す
る類似オブジェクト検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an object (user input by some means) from a large number of digitized objects (images, sounds, music, texts, etc.) such as electronic museums and electronic catalogs. The present invention relates to a similar object search device that presents, as a search result, some of the higher order objects that are similar to a reference object).

【0002】[0002]

【従来の技術】従来、利用者が指定した参照オブジェク
トに類似したオブジェクトを検索して表示する類似オブ
ジェクト検索装置では、オブジェクトについて、いくつ
かの特徴量を計算し、オブジェクト間でその特徴量の近
さ(距離)を計算することで、類似度を求め、類似度に
より順位付けをしている。この際、オブジェクトを数量
化するのに用いる特徴量の種類には、例えばオブジェク
トが画像であれば色調、明度、彩度や、画中の線の方向
などさまざまなものが用いられている。
2. Description of the Related Art Conventionally, in a similar object search apparatus which searches for and displays an object similar to a reference object designated by a user, some feature quantities are calculated for each object, and the feature quantities are approximated to each other. The degree of similarity is calculated by calculating the distance (distance), and ranking is performed according to the degree of similarity. At this time, various types of feature quantities used for quantifying the object include, for example, if the object is an image, color tone, lightness, saturation, and direction of lines in the image.

【0003】距離の計算は、個々の特徴量の種類毎に多
次元ベクトルで表された特徴量間のユークリッド距離等
として計算され、さらに、同一のオブジェクトの組み合
わせに対して複数の種類の特徴量の距離に重み付けをす
ることで類似性に対する利用者の観点(例えば、色が似
ているという観点で類似の画像オブジェクトを検索した
い)を加味して、最終的な類似性を判断するようになっ
ている。この際、特徴量の距離の重みは、利用者が検索
条件入力手段から入力するようになっている。
The distance is calculated as a Euclidean distance between feature amounts represented by a multidimensional vector for each type of feature amount, and further, a plurality of types of feature amounts for the same combination of objects. By weighting the distance of, the final similarity can be determined by taking into consideration the user's viewpoint of similarity (for example, wanting to search for similar image objects from the viewpoint of similar colors). ing. At this time, the user inputs the distance weight of the feature amount from the search condition input means.

【0004】この方法では、上記特徴量の種類毎の距離
計算は、蓄積された全オブジェクトに対して行われ、各
オブジェクトに対して、特徴量の種類毎の距離評価値を
もとに重み付けした最終的な類似度を計算して、順位付
けを行い上位のオブジェクトを返すということを行って
いた。
In this method, the distance calculation for each type of feature amount is performed for all accumulated objects, and each object is weighted based on the distance evaluation value for each type of feature amount. The final similarity was calculated, ranking was performed, and the higher-ranking objects were returned.

【0005】または、特徴量の種類毎に距離計算を分け
ずに、全ての種類の特徴量をまとめたひとつの多次元ベ
クトル空間として扱い、そこでの距離計算を行う方法を
とるものもある。この場合、利用者の検索観点である重
みの反映は、利用者が指定する重みのパターンをあらか
じめ限定しておき、そのパターンに従って、多次元ベク
トルの個々のベクトル成分についてその重みを加味して
おくという方法で行う。
Alternatively, there is a method in which the distance calculation is not divided for each type of the feature amount but treated as one multidimensional vector space in which the feature amounts of all types are collected and the distance calculation is performed there. In this case, in the reflection of the weight, which is the user's search viewpoint, the weight pattern specified by the user is limited in advance, and the weight is added to each vector component of the multidimensional vector according to the pattern. Method.

【0006】この方法では、検索の高速化のため、重み
をあらかじめ加味した多次元ベクトル空間に対して、イ
ンデクスを計算しておき、検索時には、そのインデクス
を利用して、候補を絞り込むことができる。
In this method, in order to speed up the search, an index is calculated for a multidimensional vector space in which weights are added in advance, and at the time of search, the index can be used to narrow down the candidates. .

【0007】[0007]

【発明が解決しようとする課題】上記のような従来の、
類似度計算による類似オブジェクト検索装置では、全オ
ブジェクトに対して特徴量の種類毎に距離計算を行わな
ければならないため、計算コストがかかるという問題が
あった。
DISCLOSURE OF THE INVENTION Problems to be Solved by the Invention
In the similar object search device based on the similarity calculation, the distance calculation must be performed for all the objects for each type of feature amount, which causes a problem of high calculation cost.

【0008】また、決められたパターンに対して特徴量
の多次元ベクトル空間に重みをあらかじめ加味しておく
という方法では、インデクスを付与して候補の絞り込み
を行うため、計算コストは押さえることができるが、決
められたパターンの重み全てに対してインデクスを持っ
ていなければならないことと、それでも限られたパター
ンにだけしか重みを指定できないという問題があった。
Further, in the method in which the weight is added to the multidimensional vector space of the feature quantity in advance for the determined pattern, the index is added to narrow down the candidates, so that the calculation cost can be suppressed. However, there was a problem that it had to have an index for all the weights of the determined pattern, and that the weights could still be specified only for a limited pattern.

【0009】本発明の目的は、従来の技術における上述
した問題を解消し、全てのオブジェクトに対して距離計
算を行う手間を省き、かつ任意の重みで類似オブジェク
トを検索することを可能にする類似オブジェクト検索方
法および装置を提供することである。
The object of the present invention is to solve the above-mentioned problems in the prior art, to save the trouble of calculating the distance for all objects, and to search for similar objects with arbitrary weights. An object search method and apparatus are provided.

【0010】[0010]

【課題を解決するための手段】本発明の類似オブジェク
ト検索方法は、蓄積されたオブジェクトの各種類の特徴
量を計算して、個々の特徴量種類毎に多次元ベクトル空
間のポイントとして蓄積しておき、かつ、各特徴量種類
の多次元ベクトル空間では、データ検索に必要なインデ
クスを計算しておく段階と、検索観点である特徴量の種
類の間の重みを取得する段階と、利用者が入力した参照
オブジェクトの特徴量を種類毎に算出する段階と、特徴
量の種類毎に、参照オブジェクトと蓄積された各オブジ
ェクトとの間の多次元ベクトル空間における距離に関し
て、前記インデクスを利用して参照オブジェクトに対す
る近傍のオブジェクトを求める数を、その特徴量種類間
の重みを用いて特徴量種類毎に決定し、決定された数だ
け近傍のオブジェクトを求める近傍オブジェクト検索段
階と、特徴量の種類毎に求められた近傍オブジェクトを
全ての特徴量種類についてまとめることで類似オブジェ
クトの候補を作り、その候補について前記重みを加味し
て類似度を求める類似度計算段階と、前記類似度に従
い、候補オブジェクトを順序付けして、利用者が指定し
た数または既定値に合わせて最終結果を求める段階と、
最終結果を利用者に提示する段階とを有する。
According to the similar object search method of the present invention, the feature amount of each type of accumulated objects is calculated and accumulated as points of the multidimensional vector space for each feature amount type. In addition, in the multidimensional vector space of each feature type, a step of calculating an index required for data retrieval, a step of obtaining a weight between the types of feature amounts which is a search viewpoint, and a user A step of calculating the feature amount of the input reference object for each type, and referring to the distance in the multidimensional vector space between the reference object and each accumulated object for each type of feature amount using the index The number of objects in the neighborhood of the object is determined for each feature type using the weights between the feature types, and the determined number of objects in the neighborhood is determined. And a neighboring object search step for finding the target, and a similar object candidate is created by summarizing the neighboring objects found for each feature amount type for all feature amount types, and the similarity is obtained by adding the weight to the candidate. A degree of similarity calculation step, a step of ordering candidate objects according to the degree of similarity, and obtaining a final result in accordance with the number specified by the user or a default value ,
Presenting the final result to the user.

【0011】本発明は、特徴量種類毎の計算の分割と、
個々の特徴量多次元ベクトル空間でのインデクスを利用
した近傍オブジェクトの絞り込みと、全ての種類の特徴
量多次元ベクトル空間からあがってきた近傍オブジェク
トをまとめた候補に対する距離計算と、重みによる類似
度計算を行う処理を行う。
The present invention divides the calculation for each feature quantity type, and
Narrowing down neighboring objects using the index in each feature multidimensional vector space, distance calculation for candidates summarizing neighboring objects coming from all types of feature multidimensional vector space, and similarity calculation by weight Perform processing to perform.

【0012】文献K.Curtis, N. Taniguchi, J. Nakagaw
a, M. Yamamuro,“A ComprehensiveImage Similarity R
etrieval System that utilizes Multiple Feature Vec
tors in High Dimensional Space," 情報処理学会デー
タベースシステム研究会113-28, 1997.7にあるように複
数種類の特徴量での近傍検索の結果を統合して全体の類
似度によって類似オブジェクトを探索する場合、各特徴
量種類での検索で上位何件まで検索するかは全体的な検
索精度を左右する。この文献に報告されているように個
々の特徴量種類での検索件数が大きいほど全体の検索精
度は高くなる。他方、近傍検索において上位何件までの
近傍を検索で得るかは、検索に要する時間に影響する。
一般に要求件数が多いほど時間がかかることが知られて
いる。そこで、本発明は、近傍のオブジェクトを求める
数を、特徴量種類間の重みを用いて各特徴量種類毎に決
定する。
References K. Curtis, N. Taniguchi, J. Nakagaw
a, M. Yamamuro, “A ComprehensiveImage Similarity R
etrieval System that recover Multiple Feature Vec
tors in High Dimensional Space, "In the Information Processing Society of Japan Database System Study Group 113-28, 1997.7, when the results of neighborhood search with multiple types of features are integrated and a similar object is searched by the overall similarity, The overall search accuracy depends on the number of top searches in each feature type.As reported in this document, the larger the number of searches in each feature type, the higher the overall search accuracy. On the other hand, in the neighborhood search, the number of top neighborhoods obtained by the search affects the time required for the search.
It is generally known that the larger the number of requests, the longer it takes. Therefore, according to the present invention, the number of objects in the vicinity to be obtained is determined for each feature amount type by using the weight between the feature amount types.

【0013】本発明の請求項2によれば、近傍オブジェ
クト検索段階では、各特徴量種類毎に近傍オブジェクト
を求める際の検索精度を、その特徴量種類間の重みを用
いて特徴量種類毎に設定する。ここで、検索精度とは類
似度の高い順に上位k件を求める近傍検索において、得
られたk件が、正確に計算して求めた真の上位k件を基
準にした場合とどれくらい正しいかを示す尺度である。
According to claim 2 of the present invention, in the neighborhood object searching step, the search accuracy when finding the neighborhood object for each feature quantity type is determined for each feature quantity type by using the weight between the feature quantity types. Set. Here, the search accuracy refers to how accurate the obtained k items are in the neighborhood search that determines the top k items in descending order of similarity, and how accurately the obtained k items are based on the true top k items that are calculated accurately. It is a measure to show.

【0014】文献S. Arya, D. M. Mount, N. S. Netany
ahu, R. Silverman, and A. Y. Wu,“An optimal algor
ithm for approximate nearest neighbor searching,
“5th Ann. ACM-SIAM Symposium on Discrete Algorith
ms, 1994, pp.573-582. にも報告があるとおり、一般に
検索精度を下げる(この文献ではεの値を大きくする)
と、検索にかかる時間が減少する。
References S. Arya, DM Mount, NS Netany
ahu, R. Silverman, and AY Wu, “An optimal algor
ithm for approximate nearest neighbor searching,
“5th Ann. ACM-SIAM Symposium on Discrete Algorith
As reported in ms, 1994, pp.573-582., the search accuracy is generally lowered (in this document, the value of ε is increased).
And, the search time will be reduced.

【0015】そこで、重みの小さい特徴量種類について
は、検索精度を下げることで、全体の検索精度を損なう
ことなく計算にかかる時間を全体的に低減することがで
きる。
Therefore, with respect to the feature quantity type having a small weight, by lowering the search accuracy, it is possible to reduce the time required for calculation as a whole without impairing the overall search accuracy.

【0016】本発明の請求項5によれば、近傍オブジェ
クト検索段階では、近傍オブジェクトのその特徴量種類
の多次元ベクトル空間での距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離の求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での距離を計算し、その
後、類似度計算段階では全候補オブジェクトについて重
みを加味して類似度を計算する。
According to the fifth aspect of the present invention, in the neighborhood object searching step, the distance of the feature type of the neighborhood object in the multidimensional vector space is calculated, and the neighborhood objects obtained from all the feature types are calculated. At the time when the candidate objects are collectively obtained, the distance in the multidimensional vector space of the feature amount type for which the distance has not been obtained for each candidate object is calculated, and then at the similarity calculation stage, all candidate objects are calculated. Is added to calculate the degree of similarity.

【0017】本発明の請求項6によれば、近傍オブジェ
クト検索段階では、近傍オブジェクトのその特徴量種類
の多次元ベクトル空間での距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、類似度計算段階では全候補オブジェクトに
ついて重みを加味して類似度を計算する。
According to the sixth aspect of the present invention, in the neighborhood object searching step, the distance of the neighborhood object in the multidimensional vector space of the feature quantity type is not calculated, and the neighborhood object obtained from all the feature quantity types is calculated. When the candidate objects are collectively obtained, the distance in the multidimensional vector space of each feature type is calculated for each candidate object, and then the similarity is calculated by adding weights to all candidate objects in the similarity calculation step. calculate.

【0018】本発明の請求項7によれば、近傍オブジェ
クト検索段階では、各特徴量種類の多次元ベクトル空間
での検索された近傍オブジェクトについて、その段階で
着目している種類の特徴量での参照オブジェクトからの
距離のみでなく、全ての種類の特徴量について参照オブ
ジェクトからの距離を計算し、しかし、各オブジェクト
ついて、一度距離計算したものは印をつけて距離計算が
重複しないようにする。
According to claim 7 of the present invention, in the neighborhood object search step, for the searched neighborhood objects in the multidimensional vector space of each feature quantity type, the feature quantity of the type of interest at that stage Not only the distance from the reference object but also the distance from the reference object is calculated for all types of feature values, but for each object, once the distance calculation is made, a mark is added so that the distance calculation does not overlap.

【0019】オブジェクトが画像オブジェクトである場
合を例に簡単に説明する。特徴量の種類として色相、明
度、彩度を用いるとする。今、色相の特徴量多次元ベク
トル空間から近傍オブジェクトA,B,Cが、明度の空
間から近傍オブジェクトB,C,Dが、彩度の空間から
近傍オブジェクトC,D,Eが各々得られたとする。こ
れらをまとめた候補オブジェクトはA,B,C,D,E
となる。これらの各々について、色相の空間、明度の空
間、彩度の空間の3種類の距離を求め、これを重み付け
して、最終的な類似度を計算するわけであるが、請求項
5の場合は、近傍オブジェクトA,B,Cについては、
色相の距離は近傍オブジェクトを求める段階で計算して
おくということである。他も同様である。「各候補オブ
ジェクトについて距離の求まっていない特徴量種類につ
いて、・・・距離を計算し」というのは、近傍オブジェ
クトAについては明度、彩度の距離が求まっておらず、
近傍オブジェクトBについては、彩度の距離が求まって
いないわけで、これを求める。近傍オブジェクトCにつ
いては全ての距離が求まっている。このような求まって
いない距離を求めるものである。
The case where the object is an image object will be briefly described as an example. It is assumed that hue, lightness, and saturation are used as the types of feature quantities. Now, it is assumed that neighboring objects A, B, and C are obtained from the hue feature multidimensional vector space, neighboring objects B, C, and D are obtained from the lightness space, and neighboring objects C, D, and E are obtained from the saturation space. To do. Candidate objects that combine these are A, B, C, D, and E.
Becomes For each of these, three types of distances of a hue space, a lightness space, and a saturation space are obtained and weighted to calculate the final similarity. However, in the case of claim 5, , For neighboring objects A, B, C,
It means that the distance of hue is calculated at the stage of obtaining a neighboring object. Others are the same. "For a feature amount type for which the distance has not been obtained for each candidate object ... Calculate the distance" means that the lightness and saturation distances have not been obtained for the neighboring object A,
For the neighboring object B, the saturation distance has not been obtained, so this is obtained. All the distances have been obtained for the neighborhood object C. This is to calculate such an undetermined distance.

【0020】請求項6では、候補オブジェクトA,B,
C,D,Eを求めた段階で、距離を全て求めていないと
いうことである。請求項2では、部分的には求まってい
て、欠けている部分の距離を後から求めるわけである
が、請求項3では、後から距離を全部求める。
In claim 6, the candidate objects A, B,
This means that when C, D, and E are obtained, all distances are not obtained. In claim 2, the distance is calculated partially, and the distance of the missing portion is calculated later. In claim 3, the distance is calculated later.

【0021】請求項7では、色相の空間から近傍オブジ
ェクトA,B,Cを求めた段階で、近傍オブジェクト
A,B,Cについて、色相、明度、彩度全ての距離を求
める。こうすると、候補オブジェクトA,B,C,D,
Eを求めた段階で、5つのオブジェクト全てについて、
3種類の特徴空間の距離が求まっていることになる。
In the seventh aspect, when the neighboring objects A, B and C are obtained from the hue space, the distances of all the hues, lightnesses and saturations of the neighboring objects A, B and C are obtained. In this way, the candidate objects A, B, C, D,
At the stage of obtaining E, for all five objects,
This means that the distances of the three types of feature spaces have been obtained.

【0022】本発明の類似オブジェクト検索装置は、オ
ブジェクトデータを蓄積するオブジェクトデータ蓄積手
段と、利用者が前記参照オブジェクトを入力するための
参照オブジェクト入力手段と、結果として欲しい類似オ
ブジェクトの数を利用者が指定するオブジェクト数指定
手段と、検索観点である特徴量の種類の間の重みを取得
する手段と、蓄積された各オブジェクト及び参照オブジ
ェクトについて、各種類毎の特徴量を算出する特徴量算
出手段と、前記算出された特徴量のうち、あらかじめ蓄
積されたオブジェクトの特徴量について、個々の特徴量
種類毎に多次元ベクトル空間のポイントとして格納して
おくための特徴量格納手段と、前記算出された特徴量の
うち、あらかじめ蓄積されたオブジェクトの特徴量につ
いて、各特徴量種類の多次元ベクトル空間では、データ
検索に必要なインデクスを計算して、そのインデクスを
格納しておくためのインデクス生成・格納手段と、特徴
量の種類毎に、参照オブジェクトと蓄積された各オブジ
ェクトとの間の多次元ベクトル空間における距離に関し
て、前記インデクスを利用して参照オブジェクトに対す
る近傍のオブジェクトを求める数を、その特徴量種類間
の重みを用いて特徴量種類毎に決定し、決定された数だ
け近傍のオブジェクトを求める近傍オブジェクト検索手
段と、特徴量の種類毎に求められた近傍オブジェクトを
全ての特徴量種類についてまとめ、類似オブジェクトの
候補を作り、その候補について前記重みを加味して類似
度を求める類似度計算手段と、前記類似度に従い、候補
オブジェクトを順序付けして、利用者が指定した数に合
わせて最終結果を求める手段と、最終結果を利用者に提
示するオブジェクト提示手段とを有する。
The similar object search device according to the present invention includes object data storage means for storing object data, reference object input means for the user to input the reference object, and the number of similar objects desired by the user. Object number designating means, a means for obtaining a weight between types of feature quantities which are search viewpoints, and a feature quantity calculating means for calculating feature quantities for each type of accumulated objects and reference objects And a feature quantity storage unit for storing, as the points of the multi-dimensional vector space for each feature quantity type, the feature quantity of the object accumulated in advance among the calculated feature quantities, The feature quantity of the object that has been accumulated in advance In the multidimensional vector space of, the index generation / storage means for calculating the index required for data retrieval and storing the index, the reference object and each accumulated object for each type of feature Regarding the distance in the multi-dimensional vector space between the numbers, the number of the objects in the vicinity of the reference object obtained by using the index is determined for each feature amount type by using the weight between the feature amount types, and the determined number A neighbor object search means for finding nearby objects and a neighbor object found for each feature quantity type are combined for all feature quantity types, candidates for similar objects are created, and the weight is added to the candidates to determine the degree of similarity. A similarity calculation unit that obtains the candidate objects, and uses the candidate objects in order according to the similarity. There has means for determining the final result to fit the specified number, and object presenting means for presenting the final results to the user.

【0023】[0023]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the present invention will be described with reference to the drawings.

【0024】図1は本発明の一実施形態の類似オブジェ
クト検索装置の構成図、図2はその動作を示す流れ図で
ある。
FIG. 1 is a block diagram of a similar object retrieval apparatus according to an embodiment of the present invention, and FIG. 2 is a flow chart showing its operation.

【0025】本実施形態の類似オブジェクト検索装置
は、デジタル化されたオブジェクトデータOb1〜Ob
mを蓄積するオブジェクトデータ蓄積部10と、オブジ
ェクトOb1〜Obmの特徴量を計算する特徴量算出部
11と、その特徴量と別途生成されるインデクスを格納
する特徴量・インデクス格納部12と、利用者が、参照
オブジェクトを新たに外部から入力するための参照オブ
ジェクト入力部131、利用者が、オブジェクト間の類
似度をはかるための観点である重みを指定する重み指定
部132、利用者が、結果として得られるオブジェクト
の数を指定するオブジェクト数指定部133、オブジェ
クトを利用者に提示するためのオブジェクト提示部13
4を含む、利用者とのインタフェース部13と、特徴量
の種類毎に多次元ベクトル空間のインデクスを生成する
インデクス生成部14と、特徴量の種類毎に、多次元ベ
クトル空間において、参照オブジェクトに対して、その
多次元ベクトル空間での距離で近傍であるオブジェクト
を求める近傍オブジェクト検索部15と、利用者からの
検索要求を受けて、参照オブジェクトの特徴量を特徴量
種類に分けて、特徴量種類毎に近傍オブジェクト検索部
15に検索要求を引渡し、返って来た結果をまとめて候
補オブジェクトとし、各候補オブジェクトについて、必
要ならば不足している参照オブジェクトからの特徴量種
類毎の距離を求めて、重みを加味して類似度を計算し、
上位のオブジェクトから指定された数だけ類似オブジェ
クトとして結果を返すコーディネータ部16と、中間結
果を一時的に蓄積しておく一時データ蓄積部17とで構
成されている。
The similar object search apparatus according to the present embodiment uses digitized object data Ob1 to Ob.
an object data storage unit 10 for storing m, a feature amount calculation unit 11 for calculating the feature amounts of the objects Ob1 to Obm, a feature amount / index storage unit 12 for storing the feature amount and an index separately generated, A reference object input unit 131 for a person to newly input a reference object from the outside, a weight designation unit 132 for a user to designate a weight that is a viewpoint for measuring the similarity between objects, and a user Object number designating section 133 for designating the number of objects obtained as
4 including an interface unit 13 with the user, an index generation unit 14 that generates an index of the multidimensional vector space for each type of feature amount, and a reference object in the multidimensional vector space for each type of feature amount. On the other hand, in response to a search request from a nearby object search unit 15 that finds a nearby object at a distance in the multidimensional vector space, the feature quantity of the reference object is divided into feature quantity types, and A search request is passed to the neighboring object search unit 15 for each type, and the returned results are collectively set as a candidate object. For each candidate object, if necessary, a distance from the missing reference object for each feature type is calculated. And add the weight to calculate the similarity,
It is composed of a coordinator unit 16 that returns the results as similar objects from a specified number of upper objects, and a temporary data storage unit 17 that temporarily stores intermediate results.

【0026】なお、インデクスは、多次元空間で特定の
位置にあるポイントを検索したり、指定した位置の近傍
にあるポイントを高速に検索するための補助データ構造
である。代表的にはR−treeやk−dtreeがあ
る。これらのインデクスは、ポイントの位置によって階
層的なデータ構造を作り、それを元(ルートノード)か
ら手操ることで、検索を行う。身近な例では、道路地図
(2次元空間)などにある縦横でメッシュがきってあ
り、この観光スポットは縦D横3にある、というように
検索する時に使うものも一種のインデクスといえる。
The index is an auxiliary data structure for searching for a point at a specific position in the multidimensional space or for searching for a point near the specified position at high speed. Typically, there are R-tree and k-dtree. These indexes are searched by creating a hierarchical data structure according to the position of the point and manually manipulating it from the original (root node). In a familiar example, the mesh is cut vertically and horizontally on a road map (two-dimensional space), and this tourist attraction is vertically D horizontally 3, so it can be said that this index is also a kind of index.

【0027】次に、本実施形態の動作を図2の流れ図に
より説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG.

【0028】オブジェクトOb1の特徴量Ob11,O
b12,...,Ob1n,オブジェクトOb2の特徴
量Ob21,Ob22,...,Ob2n,...,オ
ブジェクトObmの特徴量Obm1,Obm
2,...,Obmn(nは特徴量の種類の数)が特徴
量算出部11によりあらかじめ算出され、特徴量・イン
デクス格納部12に格納されている。各オブジェクトO
b1〜Obm自体はオブジェクトデータ蓄積部10に格
納されている。また、各特徴量種類の多次元ベクトル空
間において、検索のためインデクスがインデクス生成部
14により生成される。このインデクスは特徴量・イン
デクス格納部12に格納される。
Characteristic quantities Ob11, O of the object Ob1
b12 ,. . . , Ob1n, feature quantities Ob21, Ob22 ,. . . , Ob2n ,. . . , Obm1, Obm, which are the feature quantities of the object Obm
2 ,. . . , Obmn (n is the number of types of feature quantity) are calculated in advance by the feature quantity calculation unit 11 and stored in the feature quantity / index storage unit 12. Each object O
b1 to Obm themselves are stored in the object data storage unit 10. Further, in the multidimensional vector space of each feature type, an index is generated by the index generation unit 14 for searching. This index is stored in the feature quantity / index storage unit 12.

【0029】まず、利用者は参照オブジェクト入力部1
31から参照オブジェクトを、重み指定部132から重
みw1,...,wnを、オブジェクト数指定部133
からオブジェクト数Kを入力する。重みw1〜wnとオ
ブジェクト数Kは、利用者からの入力がない場合はデフ
ォルトの値を用いる(ステップ21)。次に、参照オブ
ジェクトの特徴量VR1,...,VRnを特徴量算出
部11により計算する(ステップ22)。
First, the user uses the reference object input unit 1
31 from the weight designation unit 132 to the weights w1 ,. . . , Wn to the object number designation unit 133
Enter the number K of objects. The weights w1 to wn and the number of objects K use default values when there is no input from the user (step 21). Next, the feature quantities VR1 ,. . . , VRn are calculated by the feature amount calculation unit 11 (step 22).

【0030】次に、コーディネータ部16は、i番目の
種類の特徴量について、参照オブジェクトのi番目の種
類の特徴量VRiと、近傍オブジェクト数を指定する数
(Kおよびw1,w2,・・・,wnの関数)f(K,
w1,w2,・・・,wn)(ただしK以上の数)と、
検索精度eを指定して、近傍オブジェクト検索部15に
近傍オブジェクト検索を要求する(ステップ23)。こ
のとき、f(K,w1,w2,・・・,wn)として
は、例えばwi×f(K)などが考えられる。
Next, the coordinator unit 16 specifies the i-th type feature quantity VRi of the reference object and the number (K and w1, w2, ... , Wn) f (K,
w1, w2, ..., wn) (however, the number is K or more),
The search precision e is specified, and the near object search unit 15 is requested to search for near objects (step 23). At this time, as f (K, w1, w2, ..., Wn), for example, wi × f (K) can be considered.

【0031】このとき、検索精度eは使用するインデク
スによって異なるが、例えば、先に挙げた文献S. Arya,
D. M. Mount, N. S. Netanyasu, R. Silverman, and
A. Y.Wu, “An Optimal algorithm for approximate ne
arest neighbor searching,“5th Ann. ACM-SIAM Sympo
sium on Discrete Algorithms, 1994, pp.573-582.にあ
るεが考えられる。本発明は重みの小さい特徴量種類に
ついては、検索精度を下げて近傍を検索する。つまり、
この精度eの値を0〜1の値として、1の時、真の近傍
と全く同一になるとする。この場合、eの決定方法とし
ては、重みwiが大きいほどeが大きくなる(1に近く
なる)ように決めることになる。例えばwiを重みw
l,・・・,wnの全体で正規化した場合、wiは0〜
1の値をとることになるが、eの値として0.5+wi/2やsq
r(wi)(ここで、sqr(x)はxの平方根)の値などを用いる
ことが考えられる。
At this time, although the retrieval accuracy e varies depending on the index used, for example, the reference S. Arya,
DM Mount, NS Netanyasu, R. Silverman, and
AYWu, “An Optimal algorithm for approximate ne
arest neighbor searching, “5th Ann. ACM-SIAM Sympo
ε in sium on Discrete Algorithms, 1994, pp.573-582. The present invention lowers the search accuracy for a feature amount type having a small weight and searches the neighborhood. That is,
The value of the precision e is set to a value of 0 to 1, and when it is 1, it is completely the same as the true neighborhood. In this case, as a method of determining e, the e is larger (closer to 1) as the weight wi is larger. For example, wi is weight w
When normalized as a whole of 1, ..., Wn, wi is 0 to
It takes a value of 1, but the value of e is 0.5 + wi / 2 or sq.
It is possible to use a value of r (wi) (where sqr (x) is the square root of x).

【0032】要求を受けた近傍オブジェクト検索部15
は各特徴量種類i毎に、その多次元ベクトル空間内で、
参照オブジェクトに対応するポイントにその空間の距離
で近いものf(K)個を、インデクスを用いて求め、コ
ーディネータ部16に返却する(ステップ24)。
Neighboring object retrieval unit 15 that has received the request
Is in the multidimensional vector space for each feature type i,
F (K) objects that are close in space to the point corresponding to the reference object are obtained using the index and returned to the coordinator unit 16 (step 24).

【0033】近傍オブジェクトを返されたコーディネー
タ部16は、全ての特徴量種類について返却された近傍
オブジェクトをまとめて、候補オブジェクト群を作る
(ステップ25)。候補オブジェクト群は例えば近傍オ
ブジェクトの和集合として求められる。この場合、候補
オブジェクトの数は最大f(K)×n(各特徴量種類に
ついての近傍オブジェクトに全く重複がない場合)、最
小f(K)(各特徴量種類について近傍オブジェクトが
全く同じ場合)になる。
The coordinator unit 16 that has returned the neighboring objects collects the returned neighboring objects for all the feature quantity types and creates a candidate object group (step 25). The candidate object group is obtained, for example, as a union of neighboring objects. In this case, the number of candidate objects is maximum f (K) × n (when there is no overlap between neighboring objects for each feature amount type) and minimum f (K) (when the neighboring objects are exactly the same for each feature amount type). become.

【0034】次に、候補オブジェクトObkについて、
特徴量種類毎の参照オブジェクトに対応するポイントV
RiとObkiとの距離dki(iは特徴量の種類)が
求まっていない場合は、不足分を計算する(ステップ2
6)。
Next, regarding the candidate object Obk,
Point V corresponding to the reference object for each feature type
If the distance dki between Ri and Obki (i is the type of feature quantity) is not found, the shortfall is calculated (step 2
6).

【0035】各候補オブジェクトObkについて、VR
1とObk1との距離dk1,...,VRnとObk
nとの距離dknが求まったところで、重みw
1,...,wnを加味して類似度を計算する(ステッ
プ27)。例えばw1/dk1+・・・+wn/dkn
のように類似度を計算する。
For each candidate object Obk, VR
1 and Obk1 have a distance dk1 ,. . . , VRn and Obk
When the distance dkn from n is obtained, the weight w
1 ,. . . , Wn are added to calculate the similarity (step 27). For example, w1 / dk1 + ... + wn / dkn
To calculate the similarity.

【0036】次に、求まった類似度の大きい順に候補オ
ブジェクトを並べて、上位K個を結果として返す(ステ
ップ28)。
Next, the candidate objects are arranged in descending order of similarity, and the top K pieces are returned as a result (step 28).

【0037】コーディネータ部16から結果が返される
と、オブジェクト提示部134が結果を利用者に提示す
る(ステップ29)。
When the result is returned from the coordinator unit 16, the object presenting unit 134 presents the result to the user (step 29).

【0038】なお、以上で、重みが0と指定された特徴
量種類については、近傍オブジェクト検索や距離計算は
省略することができる。また、重みは、必ずしも、利用
者が指定したものを直接用いるだけでなく、指定された
ものから、何らかの方法で求めた重みを利用することも
考えられる。また、ステップ24,26はそれぞれ特徴
量種類に関して並列に処理を行うことができる。
In the above, for the feature quantity type for which the weight is designated as 0, the neighborhood object search and distance calculation can be omitted. Further, as the weight, not only the weight designated by the user is directly used, but also the weight obtained by some method from the designated weight may be used. Further, steps 24 and 26 can perform processing in parallel for each type of feature quantity.

【0039】本発明の他の実施態様によれば、上記ステ
ップ26での距離計算を、ステップ24での近傍オブジ
ェクトを求める段階で合わせて行う。この場合は、ステ
ップ26は不要である。
According to another embodiment of the present invention, the distance calculation in step 26 is also performed in the step of obtaining the neighboring object in step 24. In this case, step 26 is unnecessary.

【0040】図3を参照すると、本発明の他の実施形態
の類似オブジェクト検索装置は入力装置31と記憶装置
32〜34と出力装置35と記録媒体36とデータ処理
装置37で構成されている。
Referring to FIG. 3, a similar object retrieval apparatus according to another embodiment of the present invention comprises an input device 31, storage devices 32 to 34, an output device 35, a recording medium 36 and a data processing device 37.

【0041】入力装置31は図1中の参照オブジェクト
入力部131と重み指定部132と提示オブジェクト数
指定部133に相当する。記憶装置32,33,34は
それぞれ図1中のオブジェクトデータ蓄積部10,特徴
量・インデクス格納部12,一時データ蓄積部17に相
当する。出力装置35は図1中のオブジェクト提示部1
34に相当する。記録媒体36はフロッピィ・ディス
ク,CD−ROM,光磁気ディスク,半導体メモリ等の
記録媒体で、図2中に示した処理を類似オブジェクト検
索プログラムとして記録している。データ処理装置37
はコンピュータのCPUで、記録媒体36から類似オブ
ジェクト検索プログラムを読み込んで、これを実行す
る。
The input device 31 corresponds to the reference object input unit 131, the weight designation unit 132, and the presentation object number designation unit 133 in FIG. The storage devices 32, 33, and 34 correspond to the object data storage unit 10, the feature quantity / index storage unit 12, and the temporary data storage unit 17 in FIG. 1, respectively. The output device 35 is the object presenting unit 1 in FIG.
Equivalent to 34. The recording medium 36 is a recording medium such as a floppy disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, etc., and records the processing shown in FIG. 2 as a similar object search program. Data processing device 37
Is a CPU of a computer, which reads a similar object search program from the recording medium 36 and executes it.

【0042】[0042]

【発明の効果】以上説明したように、本発明は、特徴量
の種類毎に、インデクスを利用して、参照オブジェクト
の近傍オブジェクトを絞り込み、これら近傍オブジェク
トから類似オブジェクトの候補を作り、これら候補に対
する距離計算と、重みによる類似度の計算を行うので、
全てのオブジェクトに対して距離計算を行う手間を省
き、かつ任意の重みで類似オブジェクトを検索すること
が可能になり、また全体の精度にあまり影響しない特徴
量種類については検索件数を小さくし、全体の精度に影
響が大きい特徴種類については検索件数を大きくするこ
とにより、全体の精度を下げないで、全体の検索にかか
る時間を低減することができる。
As described above, according to the present invention, the neighboring objects of the reference object are narrowed down by using the index for each kind of the feature amount, candidates of the similar objects are made from these neighboring objects, and the candidates for the similar objects are obtained. Since distance calculation and similarity calculation by weight are performed,
It is possible to search for similar objects with arbitrary weights without having to calculate distances for all objects, and reduce the number of searches for feature types that do not significantly affect the overall accuracy. By increasing the number of searches for the feature type that greatly affects the accuracy of, it is possible to reduce the time required for the entire search without lowering the overall accuracy.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態の類似オブジェクト検索装
置の構成図である。
FIG. 1 is a configuration diagram of a similar object search device according to an embodiment of the present invention.

【図2】図1の類似オブジェクト検索装置の動作を示す
流れ図である。
FIG. 2 is a flowchart showing an operation of the similar object search device of FIG.

【図3】本発明の他の実施形態の類似オブジェクト検索
装置の構成図である。
FIG. 3 is a configuration diagram of a similar object search device according to another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10 オブジェクトデータ蓄積部 11 特徴量算出部 12 特徴量・インデクス格納部 13 インタフェース部 131 参照オブジェクト入力部 132 重み指定部 133 提示オブジェクト数指定部 134 オブジェクト提示部 14 インデクス生成部 15 近傍オブジェクト検索部 16 コーディネータ部 17 一時データ蓄積部 21〜29 ステップ 31 入力装置 32〜34 記憶装置 35 出力装置 36 記録媒体 37 データ処理装置 10 Object data storage 11 Feature calculation unit 12 Feature quantity / index storage 13 Interface part 131 Reference Object Input Section 132 Weight designation section 133 presentation object number designation part 134 Object presentation unit 14 Index generator 15 Neighborhood object search section 16 Coordinator section 17 Temporary data storage 21-29 steps 31 Input device 32-34 storage device 35 Output device 36 recording media 37 Data processing device

フロントページの続き (56)参考文献 特開 平10−154149(JP,A) K.Curtis 他,A Comp rehensive Image Si milarity Retrieval System that utili zes Multiple Feart ure Vectors in,情報処 理学会研究報告(97−DBS−113), 日本,社団法人情報処理学会,1997年 7月16日,第97巻第64号,第167頁乃至 第172頁,論文名の続き High D imensional Space Suil Arya 他,An op timal algorithm fo r approximate near est neighbor searc hing,5th ann.,ACM− SIAM Symposium on Discrete Algorithm s,米国,Society for I ndustrial and Appl ied Mathematics,1994 年,第573頁乃至第582頁 串間和彦 他,大量画像からの高速検 索技術を確立,NTT技術ジャーナル, 日本,社団法人電気通信協会,1998年 2月1日,VOL.10 NO.2,第78 頁乃至第80頁 梅田昌義 他,画像検索処理における 問い合わせ言語への要求,情報処理学会 研究報告(データベースシステム),日 本,社団法人情報処理学会,1998年 1 月20日,VOL.98 No.2,第1頁 乃至第5頁 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-10-154149 (JP, A) K. Curtis et al., A Comp rehensive Image Simility Retrieval System system theattributes multiple Multiple Vectors in, Information Processing Society of Japan, Research Report (97-DBS-113), March 16, 1997, Japan Society for Society, 1997, Japan Society for Incorporated. Vol. 97, No. 64, pp. 167 to 172, Continuation of article titles, High Dimensional Space Sail Arya et al., An optimal algorithm near east neighbor learning, 5th. , ACM-SIAM Symposium on Discrete Algorithms, USA, Society for Industrial and Applied Mathematics, 1994, pages 573 to 582, Kazuhiko Kushima et al. Japan Telecommunications Association, February 1, 1998, VOL. 10 NO. 2, Pages 78 to 80 Masayoshi Umeda et al., Request for query language in image retrieval processing, IPSJ research report (database system), Japan, Information Processing Society of Japan, January 20, 1998, VOL . 98 No. 2, pages 1 to 5 (58) Fields surveyed (Int.Cl. 7 , DB name) G06F 17/30 JISST file (JOIS)

Claims (15)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 蓄積された多数のオブジェクトの中か
ら、利用者が指定したオブジェクトである参照オブジェ
クトに類似したオブジェクトを、類似度の高い順にある
数だけ取り出して利用者に提示する類似オブジェクト検
索方法であって、 蓄積されたオブジェクトの各種類の特徴量を計算して、
個々の特徴量種類毎に多次元ベクトル空間のポイントと
して蓄積しておき、かつ、各特徴量種類の多次元ベクト
ル空間では、データ検索に必要なインデクスを計算して
おく段階と、 検索観点である特徴量の種類の間の重みを取得する段階
と、利用者が入力した 参照オブジェクトの特徴量を種類毎に
算出する段階と、 特徴量の種類毎に、参照オブジェクトと蓄積された各オ
ブジェクトとの間の多次元ベクトル空間における距離に
関して、前記インデクスを利用して参照オブジェクトに
対する近傍のオブジェクトを求める数を、その特徴量種
類間の重みを用いて特徴量種類毎に決定し、決定された
数だけ前記近傍のオブジェクトを求める近傍オブジェク
ト検索段階と、 特徴量の種類毎に求められた近傍オブジェクトを全ての
特徴量種類についてまとめることで類似オブジェクトの
候補を作り、その候補について参照オブジェクトとの距
離に前記重みを加味して類似度を求める類似度計算段階
と、 前記類似度に従い前記候補オブジェクトを順序付けし
て、利用者が指定した数または既定値に合わせて最終結
果を求める段階と、 前記最終結果を利用者に提示する段階とを有する類似オ
ブジェクト検索方法。
1. A similar object retrieval method for presenting to a user a similar number to a reference object, which is an object designated by a user, out of a large number of accumulated objects and presenting the same to the user. And calculate the features of each type of accumulated object,
It is the stage of storing the points of the multi-dimensional vector space for each feature type and calculating the index required for data retrieval in the multi-dimensional vector space of each feature type, and the search viewpoint. The steps of obtaining the weights among the types of feature quantities, the steps of calculating the feature quantities of the reference object input by the user for each type, and the steps of comparing the reference object and each accumulated object for each type of feature quantity Regarding the distance in the multi-dimensional vector space between, the number of objects that are close to the reference object using the index is determined for each feature type using the weights between the feature types, and only the determined number is determined. The neighborhood object search step for finding the neighboring objects, and the neighborhood object found for each feature quantity type for all feature quantity types. A similar object candidate is created by summarizing, the similarity calculation step of calculating the similarity by adding the weight to the distance between the candidate and the reference object, and the candidate objects are ordered according to the similarity, and the user A similar object search method comprising: obtaining a final result in accordance with a designated number or a default value; and presenting the final result to a user.
【請求項2】 前記近傍オブジェクト検索段階では、各
特徴量種類毎に近傍オブジェクトを求める際の検索精度
を、その特徴量種類間の重みを用いて特徴量種類毎に決
定する、請求項1記載の類似オブジェクト検索方法。
2. The method of claim 1, wherein in the neighborhood object searching step, a search accuracy for obtaining a neighborhood object for each feature quantity type is determined for each feature quantity type by using a weight between the feature quantity types. Similar object search method.
【請求項3】 前記近傍のオブジェクトを求める数を、
前記重みが小さい特徴量種類については少なくし、前記
重みが大きい特徴量種類については多くする、請求項1
記載の方法。
3. The number of objects in the neighborhood is calculated as
The feature quantity type with a small weight is reduced, and the feature quantity type with a large weight is increased.
The method described.
【請求項4】 前記重みの小さい特徴量種類については
検索精度を下げる、請求項2記載の方法。
4. The method according to claim 2, wherein the search accuracy is lowered for the feature quantity type having the smaller weight.
【請求項5】 前記近傍オブジェクト検索段階では、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離が求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での参照オブジェクトから
の距離を計算し、その後、前記類似度計算段階では全候
補オブジェクトについて参照オブジェクトとの距離に重
みを加味して類似度を計算する、請求項1から4のいず
れか1項記載の類似オブジェクト検索方法。
5. The neighborhood object searching step calculates a distance of each feature type of a neighborhood object from a reference object in a multidimensional vector space, and collects the neighborhood objects obtained from all the feature types as candidates. At the time when the object is obtained, the distance from the reference object in the multidimensional vector space of the feature type for which the distance has not been obtained for each candidate object is calculated. The similar object search method according to claim 1, wherein the similarity is calculated by adding a weight to the distance from the reference object for the candidate object.
【請求項6】 前記近傍オブジェクト検索段階では、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、前記類似度計算段階では全候補オブジェク
トについて参照オブジェクトとの距離に重みを加味して
類似度を計算する、請求項1から4のいずれか1項記載
の類似オブジェクト検索方法。
6. The neighborhood object search step does not calculate the distance of each feature type of the neighborhood object from the reference object in the multidimensional vector space, but collects the neighborhood objects obtained from all the feature types. At the time of obtaining the candidate objects, the distance in the multidimensional vector space of each feature type is calculated for each candidate object, and then, in the similarity calculation step, weights are added to the distances from the reference object for all candidate objects. 5. The similar object search method according to claim 1, wherein the degree of similarity is calculated by calculating the similarity.
【請求項7】 前記近傍オブジェクト検索段階では、各
特徴量種類の多次元ベクトル空間での検索された近傍オ
ブジェクトについて、その段階で着目している種類の特
徴量での参照オブジェクトからの距離のみでなく、全て
の種類の特徴量について参照オブジェクトからの距離を
計算し、しかし、各オブジェクトついて、一度距離計算
したものは印をつけて距離計算が重複しないようにす
る、請求項1から4のいずれか1項記載の類似オブジェ
クト検索方法。
7. In the neighboring object searching step, for the searched neighboring objects in the multidimensional vector space of each feature amount type, only the distance from the reference object in the feature amount of the type of interest at that stage is used. 5. The distance from the reference object is calculated for all types of feature amounts, but the distance calculation is marked once for each object so that the distance calculation does not overlap. The similar object search method according to item 1.
【請求項8】 蓄積された多数のオブジェクトの中か
ら、利用者が指定したオブジェクトである参照オブジェ
クトに類似したオブジェクトを、類似度の高い順にある
数だけ取り出して利用者に提示する類似オブジェクト検
索装置であって、オブジェクトデータを蓄積するオブジ
ェクトデータ蓄積手段と、 利用者が前記参照オブジェクトを入力するための参照オ
ブジェクト入力手段と、 結果として欲しい類似オブジェクトの数を利用者が指定
するオブジェクト数指定手段と、 検索観点である特徴量の種類の間の重みを取得する手段
と、 蓄積された各オブジェクトおよび参照オブジェクトにつ
いて、各種類毎の特徴量を算出する特徴量算出手段と、 前記算出された特徴量のうち、あらかじめ蓄積されたオ
ブジェクトの特徴量について、個々の特徴量種類毎に多
次元ベクトル空間のポイントとして格納しておくための
特徴量格納手段と、 前記算出された特徴量のうち、あらかじめ蓄積されたオ
ブジェクトの特徴量について、各特徴量種類の多次元ベ
クトル空間では、データ検索に必要なインデクスを計算
して、そのインデクスを格納しておくためのインデクス
生成・格納手段と、 特徴量の種類毎に、参照オブジェクトと蓄積された各オ
ブジェクトとの間の多次元ベクトル空間における距離に
関して、前記インデクスを利用して参照オブジェクトに
対する近傍のオブジェクトを求める数を、その特徴量種
類間の重みを用いて特徴量種類毎に決定し、決定された
数だけ求める近傍オブジェクト検索手段と、 特徴量の種類毎に求められた近傍オブジェクトを全ての
特徴量種類についてまとめ、類似オブジェクトの候補を
作り、その候補について前記重みを加味して類似度を求
める類似度計算手段と、 前記類似度に従い、候補オブジェクトを順序付けして、
利用者が指定した数または既定値に合わせて最終結果を
求める手段と、 最終結果を利用者に提示するオブジェクト提示手段とを
有する類似オブジェクト検索装置。
8. A similar object retrieval apparatus for extracting, from a large number of accumulated objects, objects similar to a reference object, which is an object designated by a user, in a descending order of similarity and presenting them to the user. And object data storage means for storing object data, reference object input means for the user to input the reference object, and object number designating means for the user to specify the number of similar objects desired as a result. A means for obtaining a weight between types of feature quantities which is a search point of view, a feature quantity calculating means for calculating a feature quantity for each accumulated object and reference object, and the calculated feature quantity Among the features, the features A feature quantity storage unit for storing as a point of a multidimensional vector space for each quantity type, and a multidimensional vector of each feature quantity type for a feature quantity of an object accumulated in advance among the calculated feature quantities In the space, index generation / storing means for calculating the index required for data retrieval and storing the index, and a large number of objects between the reference object and each accumulated object for each type of feature With respect to the distance in the dimensional vector space, the number of neighbor objects to the reference object using the index is determined for each feature quantity type using the weights between the feature quantity types, and the determined number of neighbor objects are obtained. Summarizes the search object and the neighboring objects found for each feature type for all feature types. Make candidates of similar objects, the similarity calculation means for calculating the similarity in consideration of the weight for that candidate, in accordance with the degree of similarity, and orders the candidate object,
A similar object search device having means for obtaining a final result in accordance with a number designated by a user or a default value , and object presenting means for presenting the final result to the user.
【請求項9】 前記近傍オブジェクト検索手段は、各特
徴量種類毎に近傍オブジェクトを求める際の検索精度
を、その特徴量種類間の重みを用いて特徴量種類毎に決
定する、請求項8記載の類似オブジェクト検索装置。
9. The neighborhood object search means determines the search accuracy when obtaining the neighborhood object for each feature quantity type, for each feature quantity type using weights between the feature quantity types. Similar object retrieval device.
【請求項10】 前記近傍オブジェクト検索手段は、前
記近傍のオブジェクトを求める数を、前記重みが小さい
特徴量種類については少なくし、前記重みが大きい特徴
量種類については多くする、請求項8記載の装置。
10. The neighborhood object search means according to claim 8, wherein the number of objects in the neighborhood is calculated to be small for the feature quantity type with the small weight and large for the feature quantity type with the large weight. apparatus.
【請求項11】 前記近傍オブジェクト検索手段は、前
記重みの小さい特徴量種類については検索精度を下げ
る、請求項9記載の装置。
11. The apparatus according to claim 9, wherein the neighboring object search means reduces the search accuracy for the feature quantity type with the smaller weight.
【請求項12】 前記近傍オブジェクト検索手段は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算し、全ての特徴量
種類から求められた近傍オブジェクトをまとめて候補オ
ブジェクトを求めた時点で、各候補オブジェクトについ
て距離が求まっていない特徴量種類について、その特徴
量種類の多次元ベクトル空間での参照オブジェクトから
の距離を計算し、その後、前記類似度計算手段は全候補
オブジェクトについて参照オブジェクトとの距離に重み
を加味して類似度を計算する、請求項8から11のいず
れか1項記載の類似オブジェクト検索装置。
12. The neighborhood object search means calculates a distance from a reference object in a multidimensional vector space of each feature quantity type of the neighborhood object, and collects the neighborhood objects obtained from all the feature quantity types as candidates. At the time of obtaining the object, the distance from the reference object in the multidimensional vector space of the feature amount type for which the distance has not been obtained for each candidate object is calculated, and then the similarity calculating means The similar object search device according to claim 8, wherein the similarity is calculated by adding a weight to a distance between the candidate object and the reference object.
【請求項13】 前記近傍オブジェクト検索手段は、近
傍オブジェクトの各特徴量種類の多次元ベクトル空間で
の参照オブジェクトからの距離を計算せず、全ての特徴
量種類から求められた近傍オブジェクトをまとめて候補
オブジェクトを求めた時点で、各候補オブジェクトにつ
いて各特徴量種類の多次元ベクトル空間での距離を計算
し、その後、前記類似度計算手段は全候補オブジェクト
について参照オブジェクトとの距離に重みを加味して類
似度を計算する、請求項8から11のいずれか1項記載
の類似オブジェクト検索装置。
13. The neighborhood object search means collects the neighborhood objects obtained from all the feature quantity types without calculating the distance of each feature quantity type of the neighborhood object from the reference object in the multidimensional vector space. At the time of obtaining the candidate objects, the distance in the multidimensional vector space of each feature type is calculated for each candidate object, and then the similarity calculation means weights the distances with respect to the reference object for all candidate objects. The similar object search device according to claim 8, wherein the similarity is calculated by calculating the similarity.
【請求項14】 前記近傍オブジェクト手段は、各特徴
量種類の多次元ベクトル空間での検索された近傍オブジ
ェクトについて、その段階で着目している種類の特徴量
での参照オブジェクトからの距離のみでなく、全ての種
類の特徴量について参照オブジェクトからの距離を計算
し、しかし、各オブジェクトについて、一度距離計算し
たものは印をつけて距離計算が重複しないようにする、
請求項8から11のいずれか1項記載の類似オブジェク
ト検索装置。
14. The neighborhood object means not only measures the distance from the reference object in the feature quantity of the type of interest at that stage for the searched neighborhood objects in the multidimensional vector space of each feature quantity type. , Calculate the distance from the reference object for all types of features, but mark each object once it has been calculated so that the distance calculations do not overlap,
The similar object search device according to any one of claims 8 to 11.
【請求項15】 請求項1から7のいずれか1項に記載
の類似オブジェクト検出方法をコンピュータに実行させ
るための類似オブジェクト検索プログラムを記録した
コンピュータ読取り可能な記録媒体。
15. The method according to any one of claims 1 to 7.
The similar object search program for causing the computer to execute the similar object detection method of is recorded ,
Computer-readable recording medium.
JP17324998A 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program Expired - Fee Related JP3505393B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17324998A JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17324998A JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Publications (2)

Publication Number Publication Date
JP2000010989A JP2000010989A (en) 2000-01-14
JP3505393B2 true JP3505393B2 (en) 2004-03-08

Family

ID=15956940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17324998A Expired - Fee Related JP3505393B2 (en) 1998-06-19 1998-06-19 Similar object search method and apparatus, and recording medium storing similar object search program

Country Status (1)

Country Link
JP (1) JP3505393B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243247A (en) * 2000-03-02 2001-09-07 Satake Corp Distributed processing information retrieving device and its method
JP2005025770A (en) * 2000-05-19 2005-01-27 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing search service, method and apparatus for searching information, information search server, method for providing search service, its program, and recording medium with program recorded thereon
US7490107B2 (en) 2000-05-19 2009-02-10 Nippon Telegraph & Telephone Corporation Information search method and apparatus of time-series data using multi-dimensional time-series feature vector and program storage medium
JP2002041569A (en) * 2000-05-19 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> Method and system for distributing retrieval service, method and device for retrieving information, information retrieving server, retrieval service providing method, program therefor, and recording medium the program recorded thereon
JP3627622B2 (en) * 2000-05-26 2005-03-09 日本電信電話株式会社 Information search method and apparatus, and storage medium storing information search program
JP4556121B2 (en) * 2005-01-07 2010-10-06 ソニー株式会社 Information processing apparatus and method, and program
JP2012078930A (en) * 2010-09-30 2012-04-19 Ntt Docomo Inc Content retrieval device and content retrieval method
JP2014006613A (en) * 2012-06-22 2014-01-16 Dainippon Screen Mfg Co Ltd Neighborhood search method and similar image search method
WO2016147260A1 (en) * 2015-03-13 2016-09-22 株式会社日立製作所 Image retrieval device and method for retrieving image

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3609225B2 (en) * 1996-11-25 2005-01-12 日本電信電話株式会社 Similar object retrieval device

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
K.Curtis 他,A Comprehensive Image Similarity Retrieval System that utilizes Multiple Fearture Vectors in,情報処理学会研究報告(97−DBS−113),日本,社団法人情報処理学会,1997年 7月16日,第97巻第64号,第167頁乃至第172頁,論文名の続き High Dimensional Space
Suil Arya 他,An optimal algorithm for approximate nearest neighbor searching,5th ann.,ACM−SIAM Symposium on Discrete Algorithms,米国,Society for Industrial and Applied Mathematics,1994年,第573頁乃至第582頁
串間和彦 他,大量画像からの高速検索技術を確立,NTT技術ジャーナル,日本,社団法人電気通信協会,1998年 2月1日,VOL.10 NO.2,第78頁乃至第80頁
梅田昌義 他,画像検索処理における問い合わせ言語への要求,情報処理学会研究報告(データベースシステム),日本,社団法人情報処理学会,1998年 1月20日,VOL.98 No.2,第1頁乃至第5頁

Also Published As

Publication number Publication date
JP2000010989A (en) 2000-01-14

Similar Documents

Publication Publication Date Title
US6084595A (en) Indexing method for image search engine
EP0947937B1 (en) Image search apparatus and method
US7516129B2 (en) Method of indexing digitized entities in a data collection to facilitate searching
US6738678B1 (en) Method for ranking hyperlinked pages using content and connectivity analysis
JP3489615B2 (en) Image classification method, image inquiry method, image classification device, image inquiry device
JP3571162B2 (en) Similar object search method and apparatus
JPH11316846A (en) Image inquring method utilizing area information and edge information of image, and image inquiring device
US20020184212A1 (en) Information use frequency prediction program, information use frequency prediction method, and information use frequency prediction apparatus
Luo et al. Distributed Spatial Keyword Querying on Road Networks.
EP0497960A1 (en) Adaptive ranking system for information retrieval
JP2007249981A (en) Image search using distance measurement method
US6757686B1 (en) Method and apparatus for representing database and query information using interval hash tree
JP2009539152A (en) Content-based image readout
JP2005025746A (en) Method and device of measuring visual similarity
US20080215529A1 (en) Method for using lengths of data paths in assessing the similarity of sets of data
JPWO2013051619A1 (en) Similarity detection apparatus and directivity vicinity detection method
JP3505393B2 (en) Similar object search method and apparatus, and recording medium storing similar object search program
JPH11120180A (en) Data retrieval device and storage medium recording data retrieval program
JP2004118290A (en) Device and method for generating index for moving locus data retrieval, device and method for retrieving moving locus data, index generating program for moving locus data retrieval, recording medium recording the same, moving locus data retrieval program and recording medium recording the same
US20020059194A1 (en) Adaptive search method in feature vector space
JPH10301937A (en) Neighborhood retrieval method inside multi-dimensional vector space and recording medium for the program
JP4059970B2 (en) Information source recommendation device
Egas et al. Adapting kd trees to visual retrieval
JP3938815B2 (en) Node creation method, image search method, and recording medium
US20080162421A1 (en) Method for using the second homotopy group in assessing the similarity of sets of data

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees