JP6997656B2 - Search device, search method and search program - Google Patents
Search device, search method and search program Download PDFInfo
- Publication number
- JP6997656B2 JP6997656B2 JP2018047701A JP2018047701A JP6997656B2 JP 6997656 B2 JP6997656 B2 JP 6997656B2 JP 2018047701 A JP2018047701 A JP 2018047701A JP 2018047701 A JP2018047701 A JP 2018047701A JP 6997656 B2 JP6997656 B2 JP 6997656B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- feature amount
- similar
- extracted
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 100
- 239000000284 extract Substances 0.000 claims description 75
- 238000000605 extraction Methods 0.000 claims description 75
- 230000008569 process Effects 0.000 claims description 54
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 238000003384 imaging method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
本発明は、検索装置、検索方法および検索プログラムに関する。 The present invention relates to a search device, a search method, and a search program.
従来、検索クエリとなる情報が有する特徴量と、検索対象となる情報が有する特徴量とを比較することで、検索クエリと類似する情報を検索する技術が知られている。このような技術の一例として、検索クエリとなる画像から抽出した複数の局所的な特徴量と、検索対象となる画像が有する複数の特徴量との類似度に加え、特徴量を抽出した範囲の座標関係の類似度に基づいて、検索クエリとなる画像と類似する画像を検索する技術が知られている。 Conventionally, there has been known a technique for searching information similar to a search query by comparing the feature amount of the information to be a search query with the feature amount of the information to be searched. As an example of such a technique, in addition to the similarity between a plurality of local features extracted from an image to be a search query and a plurality of features of the image to be searched, the range in which the features are extracted. A technique for searching an image similar to an image used as a search query based on the degree of similarity of coordinate relationships is known.
しかしながら、上述した従来技術では、情報検索を効率的に行っているとは言えない場合がある。 However, in the above-mentioned conventional technique, it may not be possible to say that information retrieval is performed efficiently.
例えば、検索対象となる複数の画像が、取引対象と背景とにより構成される場合がある。このような場合において、背景部分から抽出された特徴量同士を比較した結果を用いて、類似画像検索を行った場合には、異なる取引対象が撮像された画像同士を類似すると判定してしまう恐れがある。また、検索クエリや検索対象から抽出される特徴量の数が増大するに従い、情報検索に要する検索コストが増大してしまう。 For example, a plurality of images to be searched may be composed of a transaction target and a background. In such a case, if a similar image search is performed using the results of comparing the feature quantities extracted from the background portion, it may be determined that the images captured by different transaction targets are similar to each other. There is. In addition, as the number of feature quantities extracted from search queries and search targets increases, the search cost required for information retrieval increases.
本願は、上記に鑑みてなされたものであって、情報検索の効率を改善することを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the efficiency of information retrieval.
本願に係る検索装置は、クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部とを有することを特徴とする。 The search device according to the present application is extracted by an extraction unit that extracts non-useful feature amounts that are not useful for searching similar information among the feature amounts extracted from query information or information to be searched, and the extraction unit. It is characterized by having a search unit for searching information similar to query information by using a feature amount other than the non-useful feature amount.
実施形態の一態様によれば、情報検索の効率を改善できる。 According to one aspect of the embodiment, the efficiency of information retrieval can be improved.
以下に、本願に係る検索装置、検索方法および検索プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索方法および検索プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, a search device, a search method, and a mode for carrying out the search program (hereinafter, referred to as “embodiment”) according to the present application will be described in detail with reference to the drawings. Note that this embodiment does not limit the search device, search method, and search program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.
[実施形態]
〔1-1.情報提供装置の一例について〕
まず、図1を用いて、検索装置の一例である情報提供装置が実行する検索処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する検索処理の一例を示す図である。
[Embodiment]
[1-1. About an example of information providing device]
First, with reference to FIG. 1, an example of a search process executed by an information providing device, which is an example of a search device, will be described. FIG. 1 is a diagram showing an example of a search process executed by the information providing device according to the embodiment.
図1では、インターネット等の所定のネットワークN(例えば、図3参照)を介して、各利用者が使用する端末装置100と情報提供装置10は、相互に通信可能である。また、情報提供装置10は、端末装置100以外にも、各種の外部サーバと相互に通信可能であるものとする。また、情報提供装置10は、任意の数の端末装置100と通信可能であってもよい。
In FIG. 1, the
端末装置100は、スマートフォンやタブレット等のスマートデバイスであり、3G(3rd Generation)やLTE(Long Term Evolution)等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置100は、スマートデバイスのみならず、デスクトップPC(Personal Computer)やノートPC等の情報処理装置であってもよい。
The
情報提供装置10は、検索処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報提供装置10は、端末装置100から検索クエリとなる画像を受信すると、受信したクエリ画像と類似する内容の画像を検索し、検索した画像や、検索した画像を示す情報(例えば、URL(Uniform Resource Locator)やサムネイル等)を検索結果として端末装置100に提供する検索処理を実行する。
The
より具体的な例を挙げると、情報提供装置10は、電子商店街において取引対象を示す画像を保持する。例えば、端末装置100は、取引対象となる商品が撮像された画像や、取引対象となる役務と関連する画像(以下、「取引対象の画像」と総称する。)を保持する。このような取引対象の画像は、例えば、電子商店街に取引対象を出品する出品者により登録された画像である。
To give a more specific example, the
例えば、情報提供装置10は、電子商店街に出品された取引対象を検索するための検索クエリとして、クエリ画像を端末装置100から受信すると、受信したクエリ画像と類似する取引対象の画像を検索する。そして、情報提供装置10は、検索した画像と対応する取引対象(すなわち、画像に撮像された取引対象)を説明するコンテンツや取引対象を購入するコンテンツへのリンクをまとめた検索結果を端末装置100へと送信する。
For example, when the
〔1-2.特徴量を用いた検索について〕
以下、情報提供装置10が実行する検索処理として、取引対象の画像のうち、クエリ画像と類似する画像を検索する処理の流れについて説明する。なお、以下の説明では、検索対象となる取引対象の画像を検索対象画像と総称する。なお、以下の説明では、特徴量を用いて、クエリ画像に類似する検索対象画像を検索する処理の一例について説明するが、実施形態は、これに限定されるものではない。後述する説明で明らかとなるように、情報提供装置10は、特徴量同士を比較することで、クエリ画像に類似する検索対象画像を検索するのであれば、任意の検索手法により、クエリ画像に類似する検索対象画像を検索してよい。
[1-2. Search using features]
Hereinafter, as the search process executed by the
例えば、特徴点を用いた検索においては、処理の処理により、検索対象画像の中から特徴的な複数の点が特徴点として選択され、各特徴点ごとに、特徴量の算出を行う範囲が設定される。例えば、このような特徴量が算出される範囲は、各種のアフィン変換等が行われた場合にも、特徴量があまり変化しないように設定される。この結果、各特徴点は、不規則な位置となり、特徴量が算出される範囲(半径)も様々な大きさのものが採用されることとなる。なお、図1では、特徴量が算出される範囲を点線の円形で疑似的に示したが、実際には、特徴量が算出される範囲は、楕円や矩形等、任意の形状が採用される。 For example, in a search using feature points, a plurality of characteristic points are selected as feature points from the search target image by the processing, and a range for calculating the feature amount is set for each feature point. Will be done. For example, the range in which such a feature amount is calculated is set so that the feature amount does not change so much even when various affine transformations are performed. As a result, each feature point becomes an irregular position, and the range (radius) in which the feature amount is calculated is also various. In FIG. 1, the range in which the feature amount is calculated is simulated by a dotted circle, but in reality, an arbitrary shape such as an ellipse or a rectangle is adopted as the range in which the feature amount is calculated. ..
なお、以下の説明では、検索対象画像から算出した各特徴量を「検索対象画像の特徴量」と記載する。続いて、情報提供装置10は、クエリ画像についても同様に、自動的に選択された特徴的な点及び範囲(半径)及び方向に基づいて、その範囲における特徴量を算出する。なお、以下の説明では、クエリ画像から算出した各特徴量を「クエリ画像の特徴量」と記載する。
In the following description, each feature amount calculated from the search target image is described as "feature amount of the search target image". Subsequently, the
なお、上述した検索対象画像およびクエリ画像の特徴量は、GIST(http://ilab.usc.edu/siagian/Research/Gist/Gist.html)、カラーヒストグラム、色分布などの広域特徴量やSIFT(Scale-Invariant Feature Transform)、SURF(Speed-Up Robust Features)、特徴量等、画像が有する特徴量を取得する任意の技術が採用可能である。なお、ニューラルネットで生成される特徴量も利用可能である。 The features of the above-mentioned search target image and query image include wide-area features such as GIST (http://ilab.usc.edu/siagian/Research/Gist/Gist.html), color histogram, and color distribution, and SIFT. (Scale-Invariant Feature Transform), SURF (Speed-Up Robust Features), feature amount, and any other technique for acquiring the feature amount of the image can be adopted. The features generated by the neural network can also be used.
そして、情報提供装置10は、クエリ画像の特徴量と検索対象画像の特徴量とをそれぞれ比較することで、検索対象画像の特徴量のうち、クエリ画像の特徴量と類似する特徴量を特定する。例えば、情報提供装置10は、クエリ画像の特徴量ごとに、NGT(Neighborhood Graph and Tree)等といった技術を用いて、各検索対象画像の特徴量と類似するか否かを判定する。そして、情報提供装置10は、クエリ画像の特徴量と、各検索対象画像の特徴量のうち、クエリ画像の特徴量と最も類似すると判定された特徴量とを対応付ける。
Then, the
そして、情報提供装置10は、検索対象画像のうち、クエリ画像の特徴量と対応付けられた特徴量の数が所定の閾値を超える検索対象画像を、クエリ画像の類似候補として選択する。すなわち、情報提供装置10は、特徴量同士の類似性に基づく投票形式で、クエリ画像と類似する検索対象画像を類似画像の候補として選択する。なお、以下の説明では、上述した特徴量同士が類似するか否かを判定する処理を「特徴量照合処理」と記載する場合がある。
Then, the
ここで、類似画像の候補をそのまま検索結果として出力する手法も考えられるが、情報提供装置10は、さらに精度を高めるため、以下に説明する座標照合処理を実行する。例えば、情報提供装置10は、類似画像の候補となった画像(以下、「候補画像」と記載する。)の特徴量とクエリ画像の特徴量のうち、相互に対応付けられた特徴量を特定する。
Here, a method of outputting a candidate of a similar image as a search result as it is can be considered, but the
続いて、情報提供装置10は、クエリ画像から特定した各特徴量の特徴点の座標をアフィン変換(例えば、回転、平行移動、拡大もしくは縮小)した際に、候補画像から特定した各特徴量の座標と類似するか否かを判定する。そして、情報提供装置10は、クエリ画像の特徴点の座標と、候補画像の特徴点の座標とが類似すると判定した場合は、クエリ画像とその候補画像とが類似すると判定する。
Subsequently, the
すなわち、情報提供装置10は、上述した特徴量照合処理において、検索対象画像の特徴量とクエリ画像が有する特徴量とが類似するか否かを判定し、判定結果に基づく投票により、クエリ画像が有する一部の特徴点を、複数の検索対象画像のうち一部の特徴点と対応付ける。そして、情報提供装置10は、上述した座標照合処理において対応付けされた一部の特徴点を用いて、座標照合処理を実行することで、対応付けされた特徴点同士の座標の照合を行う。すなわち、情報提供装置10は、クエリ画像の各特徴点の座標をアフィン変換した際に、検索対象画像の特徴点の座標と一致(若しくは類似)するかを判定し、座標が一致した特徴点の数が所定の数を超えるか否か等に基づいて、対応する特徴量同士の座標関係が類似するか否かを判定する。
That is, in the feature amount matching process described above, the
なお、情報提供装置10は、座標照合処理において、クエリ画像の全ての特徴量と、候補画像の全ての特徴量とを比較し直し、相互に類似するクエリ画像の特徴量と候補画像の特徴量との対応付けをやり直してもよい。そして、情報提供装置10は、新たに対応付けられた特徴量同士の位置関係に基づいて、クエリ画像と候補画像とが類似するか否かを判定してもよい。このような処理の結果、情報提供装置10は、類似画像の検索精度を向上させることができる。
In the coordinate matching process, the
〔1-3.検索処理の概要について〕
しかしながら、上述した特徴量照合処理や座標照合処理では、情報検索を適切に行っているとは言えない場合がある。例えば、同一の撮像対象が含まれる複数の画像から特徴量を抽出する処理について説明する。例えば、同一の撮像対象が含まれる複数の画像から特徴点を抽出した場合、撮像対象が有する特徴的な場所以外にも、背景が有する特徴的な場所が特徴点として選択されうる。この結果、例えば、クエリ画像と検索対象画像とに異なる撮像対象が含まれていたとしても、背景が共通若しくは類似する場合には、クエリ画像と検索対象画像とを類似する画像として判定してしまう恐れがある。
[1-3. About the outline of the search process]
However, in the feature amount matching process and the coordinate matching process described above, it may not be possible to say that the information retrieval is properly performed. For example, a process of extracting a feature amount from a plurality of images including the same image pickup target will be described. For example, when a feature point is extracted from a plurality of images including the same image pickup target, a feature point having a background can be selected as a feature point in addition to the characteristic place having the image pickup target. As a result, for example, even if the query image and the search target image include different imaging targets, if the backgrounds are common or similar, the query image and the search target image are determined to be similar images. There is a fear.
また、例えば、ある撮像対象が含まれる画像から特徴点を抽出した場合、撮像対象と背景との境界、すなわち、撮像対象の形状を示す位置が特徴点として選択される場合がある。例えば、撮像対象が有する角や直線部分等が特徴点として選択される。このような特徴点からは、撮像対象の角や直線部分を示す特徴量が算出されるが、このような角や直線部分は、多くの撮像対象が有する。このため、このような角や直線部分等、多くの撮像対象が共通して有する特徴を比較対象としても、類似画像検索に有用であるとは言えない。 Further, for example, when a feature point is extracted from an image including a certain image pickup target, a boundary between the image pickup target and the background, that is, a position indicating the shape of the image pickup target may be selected as the feature point. For example, a corner or a straight line portion of the image pickup target is selected as a feature point. From such feature points, a feature amount indicating an angle or a straight line portion of an imaging target is calculated, and many imaging targets have such an angle or a straight line portion. Therefore, it cannot be said that it is useful for similar image search even if features commonly possessed by many imaging targets such as corners and straight lines are used as comparison targets.
すなわち、画像から抽出される特徴量には、取引対象の特徴であって、その取引対象が独自に有する特長を示す特徴量とは異なり、多くの取引対象が共通して有する特徴を示す特徴量(以下、「頻出特徴量」と記載する。)が存在する。このような頻出特徴量を用いて類似画像検索を行った場合、撮像された取引対象が異なる画像同士が、類似する画像と判定される恐れがある。 That is, the feature amount extracted from the image is a feature amount that is a feature of the transaction target and that shows the feature that many transaction targets have in common, unlike the feature amount that shows the feature that the transaction target has uniquely. (Hereinafter, referred to as "frequent feature amount") exists. When a similar image search is performed using such a frequent feature amount, there is a possibility that images with different transaction targets captured may be determined to be similar images.
また、クエリ画像や各検索対象画像からは、複数の特徴点が選択される。このため、画像から抽出された全ての特徴量同士を比較した場合、検索に要する時間や計算コストが増大してしまう。 In addition, a plurality of feature points are selected from the query image and each search target image. Therefore, when all the feature quantities extracted from the image are compared with each other, the time required for the search and the calculation cost increase.
そこで、情報提供装置10は、以下の検索処理を実行する。まず、情報提供装置10は、クエリ画像または検索対象画像から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する。そして、情報提供装置10は、抽出された非有用特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。
Therefore, the
例えば、情報提供装置10は、検索対象画像から抽出された特徴量から非有用特徴量を抽出する。より具体的には、情報提供装置10は、検索対象画像から抽出された特徴量のうち、相互に類似する複数の特徴量、すなわち、頻出特徴量を非有用特徴量として抽出する。そして、情報提供装置10は、検索対象画像から抽出された特徴量が登録されたデータベースから、抽出された頻出特徴量を削除する。
For example, the
このような処理の結果、情報提供装置10は、頻出特徴量以外の特徴量、すなわち、検索対象画像やクエリ画像が独自に有する特徴を示す特徴量同士を比較することとなる。この結果、情報提供装置10は、類似する背景を有する画像同士を類似するといった誤判定を削減することができるので、検索精度を向上させることができる。また、情報提供装置10は、比較対象となる特徴量の数を削減するので、検索に要する時間や計算コストを削減することができる。
As a result of such processing, the
〔1-4.頻出特徴量の抽出について〕
ここで、情報提供装置10は、頻出特徴量等、類似画像の検索に有用ではない特徴量を抽出することができるのであれば、任意の条件を満たす特徴量を非有用特徴量として抽出してよい。
[1-4. Extraction of frequent features]
Here, if the
例えば、それぞれ異なる取引対象が撮像された検索対象画像#Aと検索対象画像#Bが存在する場合を考える。このような場合、検索対象画像#Aと検索対象画像#Bとから抽出された特徴量のうち、相互に類似する特徴量は、背景や一般的な形状等、意味的な類似画像検索にとってあまり有用ではない特徴量であると考えられる。そこで、情報提供装置10は、複数の検索対象画像から抽出された特徴量同士が類似するか否かを判定し、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量(すなわち、非有用特徴量)として抽出する。
For example, consider the case where there are a search target image # A and a search target image # B in which different transaction targets are captured. In such a case, among the feature quantities extracted from the search target image # A and the search target image # B, the feature quantities that are similar to each other are not so much for the semantic similar image search such as the background and the general shape. It is considered to be a feature quantity that is not useful. Therefore, the
例えば、情報提供装置10は、検索対象画像から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定し、検索対象画像から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。また、情報提供装置10は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。
For example, the
例えば、情報提供装置10は、検索対象画像から任意の画像を1つ選択し、選択した検索対象の特徴量と他の検索対象画像の特徴量とが類似するか否かを判定する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。
For example, the
また、情報提供装置10は、ネットワーク上に存在する各種の画像等、任意の画像を取得し、取得した画像から特徴量を抽出する。そして、情報提供装置10は、検索対象画像の特徴量と取得した画像の特徴量とを比較し、検索対象画像の特徴量のうち、取得した画像の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を抽出特徴量として抽出してもよい。
Further, the
また、例えば、情報提供装置10は、所定の期間内に受け付けたクエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、情報提供装置10は、検索対象画像の特徴量のうちクエリ画像の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。
Further, for example, the
また、例えば、情報提供装置10は、所定のアルゴリズム若しくはランダムに疑似的な特徴量(以下、「疑似特徴量」と記載する。)を複数生成し、生成した疑似特徴量を検索対象の特徴量とが類似するか否かを判定する。そして、情報提供装置10は、検索対象画像の特徴量のうち疑似特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。
Further, for example, the
すなわち、情報提供装置10は、類似画像検索において比較対象となる特徴量のうち、検索対象画像が示す撮像対象(すなわち、取引対象)が独自に有する特徴を示す特徴量以外の特徴量を頻出特徴量とすることができるのであれば、任意の画像から抽出された特徴量や任意の手段により生成された特徴量と、検索対象画像の特徴量との比較結果に基づいて、頻出特徴量を抽出してよい。
That is, among the feature quantities to be compared in the similar image search, the
このように、情報提供装置10は、類似画像検索において比較対象となる特徴量の中で頻出する特徴量をあまり重要ではない特徴量、すなわち、あまり特徴的ではない特徴を示す特徴量として抽出する。そして、情報提供装置10は、抽出した特徴量以外の特徴量を用いて、類似画像検索を行う。この結果、情報提供装置10は、類似画像検索の効率を改善できる。
As described above, the
〔1-5.カテゴリの考慮について〕
ここで、情報提供装置10は、カテゴリを考慮した頻出特徴量の抽出を行ってもよい。例えば、情報提供装置10は、検索対象画像のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、非有用特徴量を抽出してもよい。例えば、情報提供装置10は、第1取引対象と関連する情報から抽出された特徴量と、第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、非有用特徴量を抽出してもよい。すなわち、情報提供装置10は、検索対象画像から任意の画像を1つ選択し、選択した検索対象の特徴量と、選択した検索対象画像とは異なるカテゴリに属する他の検索対象画像の特徴量とが類似するか否かを判定してもよい。
[1-5. About category consideration]
Here, the
例えば、情報提供装置10は、カテゴリ#Aに属する取引対象の画像を選択した場合、カテゴリ#Bに属する取引対象の画像を比較対象として抽出する。そして、情報提供装置10は、カテゴリ#Aに属する取引対象の画像から抽出した特徴量と、カテゴリ#Bに属する取引対象の画像から抽出した特徴量とが類似するか否かを判定し、カテゴリ#Bに属する取引対象の画像から抽出した特徴量のうち、カテゴリ#Aに属する取引対象の画像から抽出した特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量としてもよい。
For example, when the
ここで、カテゴリ#Aおよびカテゴリ#Bは、任意の関係性が採用可能である。例えば、情報提供装置10は、電子商店街においてカテゴリ#Aに属する取引対象が撮像された検索対象画像と、カテゴリ#Aとは異なるカテゴリであって、1段階上位のカテゴリが共通するカテゴリ#Bに属する取引対象が撮像された検索対象画像との特徴量同士を比較してもよい。また、情報提供装置10は、電子商店街においてカテゴリ#Aに属する取引対象が撮像された検索対象画像と、カテゴリ#Aとは異なるカテゴリであって、2段階以上上位のカテゴリが共通するカテゴリ#Bに属する取引対象が撮像された検索対象画像との特徴量同士を比較してもよい。
Here, any relationship can be adopted for category # A and category # B. For example, the
また、情報提供装置10は、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量同士を比較し、他の特徴量と類似すると判定された回数を特徴量ごとに計数する。このような処理を行った場合、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量は、そのカテゴリに属する取引対象が共通して有する特徴量であると言える。そこで、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を下回る特徴量を頻出特徴量としてもよい。
Further, the
また、情報提供装置10は、各検索対象画像の特徴量同士を比較し、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数と、異なるカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数とをそれぞれ計数する。そして、情報提供装置10は、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数が所定の閾値を下回り、異なるカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数が所定の閾値を上回る特徴量を頻出特徴量として抽出してもよい。
Further, the
〔1-6.類似画像を用いた処理について〕
また、情報提供装置10は、検索対象画像やクエリ画像等、任意の画像から類似画像を生成し、生成した類似情報から抽出された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。
[1-6. Processing using similar images]
Further, the
例えば、図2は、実施形態に係る情報提供装置が類似画像を用いて頻出特徴量を抽出する処理の一例を示す図である。例えば、情報提供装置10は、検索対象画像が登録されたデータベースから、検索対象画像T1を処理対象として選択する。そして、情報提供装置10は、抽出した検索対象画像T1と類似する画像、すなわち、類似画像TV1~TV3の生成を行う。
For example, FIG. 2 is a diagram showing an example of a process in which an information providing device according to an embodiment extracts a frequent feature amount using a similar image. For example, the
例えば、情報提供装置10は、選択した検索対象画像の画像解析を行い、背景が撮像された範囲と主な撮像対象が撮像された範囲とを特定し、背景が撮像された範囲を削除した類似画像TV1を生成する。なお、情報提供装置10は、異なる背景の合成を行った類似画像を生成してもよい。また、情報提供装置10は、撮像対象を回転、拡大、縮小若しくは変形させた画像等、撮像対象が撮像された範囲をアフィン変換した類似画像TV2を生成してもよい。また、情報提供装置10は、撮像対象の色を変換した類似画像TV3を生成してもよい。
For example, the
また、情報提供装置10は、検索対象画像全体に対して各種のアフィン変換を適用した画像を生成してもよい。また、情報提供装置10は、各範囲や画像全体にぼかしを加えた画像を生成してもよい。また、情報提供装置10は、解像度の変更等、任意の画像変換手法により、類似画像の生成を行えばよい。
Further, the
なお、どの程度まで変化させた画像を類似画像とするかについては、情報提供装置10が実行する類似画像検索の目的に応じて任意の設定が採用可能である。すなわち、情報提供装置10は、類似画像として生成した画像がクエリ画像として入力された際に、元となる検索対象画像をクエリ画像に類似する画像として選択することができる程度に類似するのであれば、任意の画像変換を行った画像を類似画像として採用してよい。また、このような類似画像の生成は、各種の画像解析技術や画像生成技術により実現可能である。
As for how much the changed image is to be a similar image, any setting can be adopted according to the purpose of the similar image search executed by the
続いて、情報提供装置10は、生成した類似画像TV1~TV3の特徴量を抽出する。例えば、情報提供装置10は、類似画像TV1~TV3から特徴量群TV1~TV3を抽出する。また、情報提供装置10は、元の検索対象画像T1の特徴量群T1を取得する。続いて、情報提供装置10は、検索対象画像T1とは異なるカテゴリの取引対象が撮像された検索対象画像T2を選択し、選択した検索対象画像T2の特徴量群T2を抽出する。そして、情報提供装置10は、特徴量群T1、T2、TV1~TV3に含まれる各特徴量を相互に比較し、特徴量群T2に含まれる特徴量のうち、特徴量群T1、TV1~TV3に含まれる特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する。
Subsequently, the
〔1-7.カテゴリ考慮の必要性について〕
なお、上述した各種の処理においてカテゴリを考慮する必要は必ずしも存在しない。例えば、情報提供装置10は、実際の処理においては、様々なカテゴリに属する検索対象画像の特徴量同士を比較し、他の特徴量と類似すると判定された回数を計数する処理を繰り返し実行する。このような処理十分な回数行った場合や、検索対象画像と対応するカテゴリや取引対象の数が十分に多ければ、あるカテゴリに属する取引対象が共通して有する特徴であって、検索に有用な特徴を示す特徴量が他の特徴量と類似すると判定された回数よりも、検索に有用ではない特徴量を示す特徴量(多くの画像が共通して有する特徴を示す特徴量)が他の特徴量と類似すると判定される回数の方が多くなると考えられる。
[1-7. Necessity of category consideration]
It is not always necessary to consider the category in the various processes described above. For example, in the actual processing, the
そこで、情報提供装置10は、上述した処理を各種任意の組み合わせで繰り返し実行することで、他の特徴量と類似すると判定された回数を計数し、計数した回数が所定の閾値を超える特長量を頻出特徴量として抽出すればよい。
Therefore, the
〔1-8.閾値について〕
また、情報提供装置10は、頻出特徴量を抽出する際の閾値として、任意の閾値を採用してもよい。例えば、情報提供装置10は、全ての検索対象画像の全ての特徴量のうち、他の特徴量と類似すると判定された回数が多い順に所定の数の特徴量を選択し、選択した特徴量を頻出特徴量として抽出してもよい。また、情報提供装置10は、他の特徴量と類似すると判定された回数が、所定の閾値以上となる特徴量を全て頻出特徴量としてもよい。
[1-8. About the threshold]
Further, the
一方、検索対象画像から抽出された特徴量から多くの特徴量を削除した場合、検索精度が低下してしまう恐れがある。そこで、情報提供装置10は、削除する頻出特徴量の数に上限を設けてもよい。例えば、情報提供装置10は、クエリ画像または検索対象画像から抽出された特徴量から、所定の数以下の非有用特徴量を抽出してもよい。より具体的には、情報提供装置10は、検索対象画像1つ当たりの特徴量のうち、頻出特徴量以外の特徴量の数が所定の閾値を下回らないように、頻出特徴量の抽出を行ってもよい。また、情報提供装置10は、検索対象画像の全特徴量のうち、頻出特徴量とする特徴量の割合の下限値や上限値を設定してもよい。
On the other hand, if a large number of features are deleted from the features extracted from the search target image, the search accuracy may decrease. Therefore, the
〔1-9.検索処理の一例〕
以下、図1を用いて、情報提供装置10が実行する検索処理の一例を説明する。例えば、情報提供装置10は、検索対象となる各検索対象画像の特徴量をあらかじめ抽出する(ステップS1)。例えば、情報提供装置10は、検索対象画像T1の中から複数の特徴点PT1-1、PT1-2・・・を所定のアルゴリズムで選択し、選択した特徴点ごとに特徴量FT1-1、FT1-2・・・を抽出する。また、情報提供装置10は、検索対象画像T2の中から複数の特徴点PT2-1、PT2-2・・・を所定のアルゴリズムで選択し、選択した特徴点ごとに特徴量FT2-1、FT2-2・・・を抽出する。
[1-9. An example of search processing]
Hereinafter, an example of the search process executed by the
続いて、情報提供装置10は、抽出した特徴量同士、すなわち、検索対象画像として登録された画像の特徴量同士を比較し、特徴量ごとに他の特徴量と類似すると判定された回数を計数する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する(ステップS2)。例えば、情報提供装置10は、特徴量FT1-1と他の特徴量FT1-2、FT2-1、FR2-2・・・とを比較し、特徴量FT1-1との類似度が所定の閾値以下となる特徴量の数を類似特徴量数として計数する。また、情報提供装置10は、他の特徴量についても同様に、類似特徴量数の計数を行う。そして、情報提供装置10は、計数した類似特徴量数の値が高い方から順に所定の数の特徴量を頻出特徴量として抽出する。
Subsequently, the
続いて、情報提供装置10は、抽出した頻出特徴量を削除する(ステップS3)。例えば、情報提供装置10は、各検索対象画像の特徴量が登録されたデータベースから、類似特徴量数が所定の閾値を超えた特徴量FT1-1やFT2-2等を削除する。
Subsequently, the
ここで、情報提供装置10は、クエリ画像を端末装置100から取得した場合は(ステップS4)、クエリ画像の特徴量と頻出特徴量以外の特徴量との比較結果に基づいて、クエリ画像と類似する画像を検索する(ステップS6)。例えば、情報提供装置10は、データベースに登録された特徴量と、クエリ画像から抽出された特徴量との比較結果に基づいて、クエリ画像と類似する画像を検索する。
Here, when the query image is acquired from the terminal device 100 (step S4), the
そして、情報提供装置10は、検索結果を端末装置100に送信する(ステップS6)。例えば、情報提供装置10は、類似すると判定された画像のデータやサムネイル等を端末装置100に送信する。なお、情報提供装置10は、例えば、特徴量照合処理や座標照合処理の結果に応じたランキング形式で、検索した検索対象画像の情報を配信してもよい。例えば、情報提供装置10は、各照合処理の結果に基づいて、各検索対象画像とクエリ画像と類似する確度を算出し、算出した確度に応じたランキング形式で、検索した検索対象画像の情報を配信してもよい。
Then, the
〔1-10.検索処理の結果を用いた処理〕
なお、情報提供装置10は、上述した特徴量照合処理により受付けたクエリ画像と検索対象画像の特徴量とが類似するか否かを比較することとなる。そこで、情報提供装置10は、例えば、検索対象画像の特徴量ごとに、特徴量照合処理によりクエリ画像の特徴量と類似すると判定された回数の計数を行ってもよい。例えば、情報提供装置10は、場合は、検索対象画像から抽出されたある特徴量が、特徴量照合処理によりクエリ画像の特徴量と類似すると判定された場合は、その特徴量の類似特徴量数に1を加算してもよい。
[1-10. Processing using the results of search processing]
The
〔1-11.頻出特徴量の特徴について〕
ここで、頻出特徴量として抽出される特徴量には、所定の特徴が現れる可能性がある。そこで、情報提供装置10は、頻出特徴量が有する特徴をモデルに学習させてもよい。例えば、情報提供装置10は、DNN(Deep Neural Network)やSVM(Support Vector Machine)等、任意のモデルに対して、頻出特徴量が有する特徴をモデルに学習させてもよい。
[1-11. About the features of frequent features]
Here, a predetermined feature may appear in the feature amount extracted as the frequent feature amount. Therefore, the
また、情報提供装置10は、頻出特徴量以外の特徴量の特徴をモデルに学習させてもよい。例えば、情報提供装置10は、類似特徴量数が所定の閾値を下回る特徴量を非頻出特徴量として抽出する。そして、情報提供装置10は、頻出特徴量が有する特徴と、非頻出特徴量が有する特徴との差をモデルに学習させることで、頻出特徴量が独自に有する特徴を精度良く学習させてもよい。
Further, the
このような学習が行われた学習モデルは、特徴量から頻出特徴量を抽出することができると推定される。そこで、情報提供装置10は、学習モデルを用いて、検索対象画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、情報提供装置10は、検索対象画像から抽出された特徴量を学習モデルに入力することで、頻出特徴量であるか否かを判定し、頻出特徴量ではないと判定された特徴量のみをデータベースに登録してもよい。
It is presumed that the learning model in which such learning is performed can extract the frequent features from the features. Therefore, the
また、情報提供装置10は、学習モデルを用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出し、抽出した頻出特徴量以外の特徴量と、検索対象画像から抽出された特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。例えば、情報提供装置10は、運用時に、学習モデルを用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出する。そして、情報提供装置10は、抽出した頻出特徴量外の特徴量と、検索対象画像から抽出した全ての特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。
Further, the
また、情報提供装置10は、クエリ画像の特徴量から学習モデルを用いて抽出された頻出特徴量以外の特徴量と、検索対象画像の特徴量から上述した各種の手法で抽出した頻出特徴量以外の特徴量、もしくは、検索対象画像の特徴量から学習モデルを用いて抽出した頻出特徴量以外の特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。
Further, the
なお、情報提供装置10は、画像検索に用いる頻出特徴量と、モデルの学習に用いる有用特徴量とを異なるものとしてもよい。例えば、モデルに頻出特徴量が有する特徴を精度良く学習させるためには、モデルの学習に用いる頻出特徴量が実際に有用ではない確度がより高い方が良いと考えられる。そこで、情報提供装置10は、異なる閾値を用いて、画像検索の際に考慮する頻出特徴量と、モデルの学習に用いる頻出特徴量とをそれぞれ個別に抽出してもよい。
The
例えば、情報提供装置10は、検索対象画像から抽出された特徴量と、各種の特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象画像から抽出された特徴量ごとに、各種の特徴量と類似すると判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出するとともに、計数された回数が第1閾値よりも大きい第2閾値以上となる特徴量を第2頻出特徴量として抽出する。その後、情報提供装置10は、第1頻出特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。一方、情報提供装置10は、第2頻出特徴量が有する特徴をモデルに学習させてもよい。この結果、情報提供装置10は、画像から抽出された特徴量が画像検索に有用ではない頻出特徴量であるか否かを精度良く判定する学習モデルを生成することができる。
For example, the
〔1-12.処理の対象について〕
ここで、上述した例では、情報提供装置10は、クエリ画像と類似する検索対象画像の検索を行った。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、文章や音楽等、任意のコンテンツについて、上述した検索処理を適用可能である。
[1-12. About the target of processing]
Here, in the above-mentioned example, the
例えば、情報提供装置10は、検索対象が文章である場合、クエリ文章や検索対象となる文章の中から特徴点としていくつかの単語を選択し、選択した単語の前後に存在する複数の単語を抽出する。また、情報提供装置10は、抽出した単語の特徴量を、特徴量として算出するとともに、単語の相対的な出現位置(例えば、特徴点として選択した単語から次の単語までの間に存在する単語の数等)を座標とみなす。そして、情報提供装置10は、特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。
For example, when the search target is a sentence, the
また例えば、情報提供装置10は、検索対象が音声である場合、クエリ音声や検索対象となる音声の中から特徴点としていくつかの再生位置を選択し、選択した再生位置の前後に存在する音声の周波数特性から特徴量を算出する、また、情報提供装置10は、再生位置を座標とみなす。そして、情報提供装置10は、特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。
Further, for example, when the search target is voice, the
なお、情報提供装置10は、異種間の情報検索を行ってもよい。例えば、情報提供装置10は、クエリ文章と類似する対象音声の検索を行ってもよく、クエリ音声と類似する対象文章の検索を行ってもよい。また、このような異種間の情報検索において頻出特徴量を抽出し、抽出した頻出特徴量以外の特徴量を用いて、類似する情報の検索を行えばよい。すなわち、情報提供装置10は、局所的な特徴を示す多次元量を特徴量として設定することができるコンテンツであれば、任意のコンテンツについて、上述した検索処理を適用し、有用特徴量の抽出を行ってよい。
The
〔2.情報提供装置の構成〕
以下、上記した検索処理を実現する情報提供装置10が有する機能構成の一例について説明する。図3は、実施形態に係る情報提供装置の構成例を示す図である。図3に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of information providing device]
Hereinafter, an example of the functional configuration of the
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100との間で情報の送受信を行う。
The communication unit 20 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 20 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、検索対象データベース31および学習モデル32を記憶する。
The
検索対象データベース31には、検索対象となる対象情報が登録されている。例えば、図4は、実施形態に係る検索対象データベースに登録される情報の一例を示す図である。図4に示す例では、検索対象データベース31には、「検索対象ID(Identifier)」、「検索対象データ」、「カテゴリ」、「特徴量」、「類似特徴量数」、および「種別」といった情報が登録されている。
Target information to be searched is registered in the
ここで、「検索対象ID」とは、検索対象画像を識別する識別子である。また、「検索対象データ」とは、検索対象画像のデータである。また、「カテゴリ」とは、対応付けられた検索対象画像に関連する取引対象が属するカテゴリであり、例えば、電子商店街において撮像された取引対象が属するカテゴリを示す情報である。また、「特徴量」とは、特徴量である。また、「類似特徴量数」とは、上述した各種の処理により、他の特徴量と類似すると判定された回数である。また、「種別」とは、対応付けられた特徴量が頻出特徴量であるかその他の通常特徴量であるかを示す情報である。 Here, the "search target ID" is an identifier that identifies the search target image. Further, the "search target data" is the data of the search target image. Further, the "category" is a category to which the transaction target related to the associated search target image belongs, and is, for example, information indicating a category to which the transaction target imaged in the electronic shopping district belongs. The "feature amount" is a feature amount. The "number of similar feature quantities" is the number of times determined to be similar to other feature quantities by the various processes described above. Further, the "type" is information indicating whether the associated feature amount is a frequent feature amount or another normal feature amount.
例えば、図4に示す例では、検索対象データベース31には、検索対象ID「T1」、検索対象データ「TD#1」、カテゴリ「飲料」、類似特徴量数「230」および種別「頻出」が対応付けて登録されている。このような情報は、検索対象ID「T1」が示す検索対象画像のデータが「TD#1」であり、カテゴリ「飲料」に関する取引対象が撮像された画像であり、特徴量が「FT1-1」である旨を示す。また、このような情報は、特徴量「FT1-1」の類似特徴量数、すなわち、特徴量「FT1-1」と類似する他の特徴量の数が「230」であり、種別が「頻出」、すなわち頻出特徴量である旨を示す。
For example, in the example shown in FIG. 4, the
なお、図4に示した各種の値は、概念的なものであり、実際には、検索対象データベース31には、各特徴量等を示す数値が登録されるものとする。また、検索対象データベース31には、図4に示す情報以外にも、特徴量と対応する特徴点や、検索対象画像と対応する取引対象に関する各種の情報等、任意の情報が登録されていてよい。
It should be noted that the various values shown in FIG. 4 are conceptual, and in reality, numerical values indicating each feature amount and the like are registered in the
図3に戻り、説明を続ける。学習モデル32は、頻出特徴量の特徴を学習した学習モデルである。例えば、学習モデルは、DNNやSVM等、頻出特徴量の特徴を学習した学習モデルの各種パラメータである。
Returning to FIG. 3, the explanation will be continued. The
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
The
図4に示すように、制御部40は、抽出部41、判定部42、計数部43、検索部44、生成部45、および学習部46を有する。
As shown in FIG. 4, the
抽出部41は、クエリ画像または検索対象画像から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量、すなわち、頻出特徴量を抽出する。例えば、抽出部41は、検索対象画像から抽出された特徴量から頻出特徴量を抽出する。
The
また、抽出部41は、検索対象画像から抽出された特徴量のうち、相互に類似する複数の特徴量を頻出特徴量として抽出する。例えば、抽出部41は、検索対象画像のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。より具体的な例を挙げると、抽出部41は、第1取引対象と関連する情報から抽出された特徴量と、第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、頻出特徴量を抽出してもよい。
Further, the
例えば、抽出部41は、所定の情報処理装置(図示は、省略)から検索対象画像を受付けた場合は、検索対象画像の特徴量を抽出し、検索対象画像と各特徴量とを検索対象データベース31に登録する。また、抽出部41は、所定の時間間隔で、検索対象データベース31を参照し、各特徴量の類似特徴量数を参照し、参照した類似特徴量数に基づいて、各特徴量が頻出特徴量であるか否かを判定する。例えば、抽出部41は、類似特徴量数が所定の閾値を超える特徴量や、類似特徴量数が高い方から順に所定の数の特徴量を頻出特徴量として選択する。そして、抽出部41は、頻出特徴量として選択した特徴量に対し、種別「頻出」を対応付け、他の特徴量に対して種別「通常」を対応付ける。すなわち、抽出部41は、計数部43により計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出することとなる。
For example, when the
なお、抽出部41は、学習モデル32の学習に用いる頻出特徴量を抽出する場合、類似画像検索を行う際とは異なる閾値で頻出特徴量を抽出してもよい。例えば、抽出部41は、計数部43により計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出し、抽出した特徴量に対し、種別「頻出」を対応付ける。また、抽出部41は、検索対象データベース31に登録された頻出特徴量のうち、計数部43により計数された回数が第1閾値よりも大きい第2閾値以上となる頻出特徴量を第2頻出特徴量として抽出する。そして、抽出部41は、抽出した第2頻出特徴量を学習データとして学習部46に通知する。
In addition, when extracting the frequent feature amount used for learning of the
なお、抽出部41は、学習部により学習されたモデルを用いて、検索対象画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、抽出部41は、学習モデル32に検索対象画像の各特徴量を入力し、各特徴量が頻出特徴量であるか否かを判定してもよい。また、抽出部41は、学習モデル32を用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、抽出部41は、クエリ画像を受付けると、クエリ画像から特徴量を抽出する。そして、抽出部41は、抽出した特徴量を学習モデル32に入力し、頻出特徴量であると判定された特徴量以外の特徴量を判定部42に提供してもよい。
The
また、抽出部41は、クエリ画像または検索対象画像から抽出された特徴量から、所定の数以下の頻出特徴量を抽出してもよい。例えば、抽出部41は、1つの画像から抽出される特徴量のうち、頻出特徴量以外の特徴量の数が所定の閾値以上となるように、頻出特徴量の抽出を行ってよい。例えば、抽出部41は、類似特徴量数の数がより多い特徴量や、学習モデル32により頻出特徴量である確度がより高いと推定された特徴量を優先的に頻出特徴量としてもよい。また、抽出部41は、検索対象画像から抽出された特徴量が登録された検索対象データベース31から、抽出された頻出特徴量を削除してもよい。
Further, the
判定部42は、検索対象画像から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する。例えば、判定部42は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象画像から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。
The
例えば、判定部42は、所定のアルゴリズムまたはランダムに特徴量を生成し、生成した特徴量と検索対象データベース31に登録された各特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象データベース31に登録された各特徴量のうち、生成した特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。
For example, the
また、判定部42は、検索対象データベース31に登録された各特徴量同士が類似するか否かを判定してもよい。例えば、判定部42は、検索対象データベース31に登録された特徴量のうち、いずれかの特徴量を選択し、選択した特徴量と他の特徴量とが類似するか否かを判定する。そして、計数部43は、選択した特徴量と類似すると判定された他の特徴量の類似特徴量数に1を加算する。
Further, the
また、判定部42は、生成部45により生成された類似情報から抽出された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。例えば、判定部42は、生成部45により生成された類似情報から抽出された特徴量と、検索対象画像のうち、類似情報を生成した画像とは異なるカテゴリに属する情報から抽出された特徴量とが類似するか否かを判定する。例えば、判定部42は、生成部45により生成された類似画像を取得すると、類似画像の特徴量を抽出する。なお、このような特徴量の抽出は、抽出部41により実現されてもよい。
Further, the
続いて、判定部42は、検索対象データベース31を参照し、類似画像の元となった検索対象画像のカテゴリを特定する。そして、判定部42は、特定したカテゴリとは異なるカテゴリと対応付けられた検索対象画像の特徴量と、類似画像から抽出した特徴量とが類似するか否かを判定してもよい。このような場合において、計数部43は、類似画像から抽出した特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。
Subsequently, the
また、判定部42は、所定の特徴量として、クエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。例えば、判定部42は、クエリ画像から抽出された特徴量と検索対象データベース31に登録された特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象データベース31に登録された特徴量のうち、クエリ画像から抽出された特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。
Further, the
なお、判定部42は、類似画像検索の運用時において受付けたクエリ画像を記憶部30に保持し、所定のタイミングで記憶部30に保持したクエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。また、判定部42は、類似画像検索の運用時において受付けたクエリ画像と類似する検索対象画像を検索する際に、上述した処理を実行してもよい。
The
例えば、判定部42は、類似画像検索の運用時においては、抽出部41により抽出されたクエリ画像の特徴量を受付ける。ここで、抽出部41から受付けた特徴量は、クエリ画像から抽出される全ての特徴量であってもよく、抽出部41によって抽出された頻出特徴量以外の特徴量であってもよい。このような場合、判定部42は、クエリ画像の各特徴量に対して、検索対象データベース31に登録された頻出特徴量以外の特徴量のうち最も類似すると判定された特徴量を対応付ける。この際、計数部43は、クエリ画像の各特徴量に対応付けられた特徴量の類似特徴量数に1を加算する。
For example, the
そして、判定部42は、対応付けた特徴量同士の座標関係が類似するか否かを判定する。すなわち、判定部42は、上述した特徴量照合処理と座標照合処理とを実行する。
Then, the
検索部44は、頻出特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。例えば、検索部44は、判定部42による判定結果に基づいて、クエリ画像と類似する検索対象画像を検索する。例えば、検索部44は、類似画像検索の運用時において、判定部42による特徴量照合処理や座標照合処理の結果を取得する。そして、検索部44は、座標照合処理の結果、類似する特徴量同士の位置関係が類似すると判定された検索対象画像を、クエリ画像と類似する画像として選択する。なお、抽出部41によって類似特徴量数が第1閾値以上となる特徴量が頻出特徴量として抽出されるため、検索部44は、類似特徴量数が第1閾値以上となる特徴量以外の特徴量を用いて、クエリ画像と類似する検索対象画像を検索することとなる。
The
また、検索部44は、クエリ画像と類似する画像のサムネイル等、各種の情報を配置した検索結果を生成する。そして、検索部44は、クエリ画像の送信元となる端末装置100に対し、生成した検索結果を提供する。
Further, the
生成部45は、検索対象画像から、類似画像を生成する。例えば、生成部45は、類似画像を用いて頻出特徴量の抽出を行う場合、検索対象データベース31からいずれかの検索対象画像を選択し、各種の画像変換技術を用いて、選択した検索対象画像の類似画像を生成する。そして、生成部45は、生成した類似画像を判定部42に提供する。
The
学習部46は、頻出特徴量が有する特徴をモデルに学習させる。例えば、学習部46は、第2頻出特徴量が有する特徴をモデルに学習させる。例えば、学習部46は、抽出部41により抽出された頻出特徴量の通知を受付けると、通知された頻出特徴量が有する特徴を学習モデル32に学習させる。なお、学習部46は、例えば、頻出特徴量が有する特徴と他の特徴量が有する特徴と差を学習モデル12に学習させてもよい。
The
〔3.情報提供装置が実行する処理の流れの一例〕
続いて、図5を用いて、情報提供装置10が実行する処理の流れの一例を説明する。図5は、実施形態に係る情報提供装置が実行する検索処理の流れの一例を示すフローチャートである。
[3. An example of the flow of processing executed by the information providing device]
Subsequently, an example of the flow of processing executed by the
例えば、情報提供装置10は、検索対象画像の特徴量と所定の特徴量とを比較し(ステップS101)、特徴量ごとに他の特徴量と類似する数を計数する(ステップS102)。そして、情報提供装置10は、計数した数が所定の閾値を超える特徴量を頻出特徴量として抽出する(ステップS103)。
For example, the
ここで、情報提供装置10は、クエリ画像を端末装置100から取得したか否かを判定し(ステップS104)、取得していない場合は(ステップS104:No)、取得するまで待機する。そして、情報提供装置10は、クエリ画像を端末装置100から取得した場合は(ステップS105:Yes)、クエリ画像の特徴量と頻出特徴量以外の特徴量とを比較し(ステップS105)、比較結果に基づいて、クエリ画像に類似する画像を検索対象画像から検索し(ステップS106)、処理を終了する。
Here, the
〔4.変形例〕
上記では、情報提供装置10による検索処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、検索処理のバリエーションについて説明する。
[4. Modification example]
In the above, an example of the search process by the
〔4-1.特徴量の比較について〕
上述した例では、情報提供装置10は、クエリ情報の特徴量と、検索対象となる情報(以下、「対象情報」と記載する場合がある。)のクエリ特徴量とを比較した。ここで、情報提供装置10は、任意の情報が有する特徴量を特徴量としてもよい。例えば、情報提供装置10は、検索対象が画像である場合、特徴点の周囲の画素の彩度や明度の平均値等を特徴量としてもよく、検索対象が音声である場合、特徴点の周囲数秒の周囲の周波数特性を特徴量としてもよい。また、上述した処理以外にも、情報提供装置10は、任意の特徴量比較技術を併用してもよい。
[4-1. Comparison of features]
In the above-mentioned example, the
〔4-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-2. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, and conversely, the processes described as being manually performed. It is also possible to automatically perform all or part of the above by a known method. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.
〔4-3.プログラム〕
また、上述した実施形態に係る情報提供装置10および端末装置100は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-3. program〕
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF 1080 receives data from another device via the network N and sends it to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。また、例えば、コンピュータ1000が端末装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
For example, when the
〔5.効果〕
上述したように、情報提供装置10は、クエリ画像等のクエリ情報または検索対象画像等の検索対象となる情報から抽出された特徴量のうち、頻出特徴量等、類似する情報の検索に有用ではない非有用特徴量を抽出する。そして、情報提供装置10は、抽出された頻出特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する。この結果、情報提供装置10は、類似情報の検索精度を向上させるとともに、類似情報の検索に要する時間が検索コストを削減するので、情報検索における効率を改善できる。
[5. effect〕
As described above, the
また、情報提供装置10は、検索対象となる情報から抽出された特徴量から頻出特徴量を抽出する。また、情報提供装置10は、検索対象となる情報から抽出された特徴量のうち、相互に類似する複数の特徴量を頻出特徴量として抽出する。例えば、情報提供装置10は、検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する。このため、情報提供装置10は、情報検索に有用ではない頻出特徴量を適切に抽出できる。
Further, the
また、情報提供装置10は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象となる情報から抽出された特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象となる情報から、その情報と類似する類似情報を生成し、生成された類似情報から抽出された特徴量と、検索対象となる情報から抽出された特徴量とが類似するか否かを判定する。ここで、情報提供装置10は、生成された類似情報から抽出された特徴量と、検索対象となる情報のうち、類似情報を生成した情報とは異なるカテゴリに属する情報から抽出された特徴量とが類似するか否かを判定してもよい。また、情報提供装置10は、複数の検索対象となる情報から抽出された特徴量同士が類似するか否かを判定してもよい。また、情報提供装置10は、所定の特徴量として、クエリ情報から抽出された特徴量と検索対象となる情報から抽出された特徴量とが類似するか否かを判定してもよい。このような処理を実行することで、情報提供装置10は、情報検索に有用ではない頻出特徴量を適切に抽出できるので、情報検索の効率を改善できる。
Further, the
また、情報提供装置10は、索対象となる情報から抽出された特徴量が登録された記憶装置から、抽出部により抽出された頻出特徴量を削除する。この結果、情報提供装置10は、情報検索における効率を改善できる。
Further, the
また、情報提供装置10は、クエリ情報または検索対象となる情報から抽出された特徴量から、所定の数以下の頻出特徴量を抽出する。このため、情報提供装置10は、情報検索における精度の悪化を防ぎつつ、情報検索の効率を改善できる。
Further, the
また、情報提供装置10は、抽出された頻出特徴量が有する特徴をモデルに学習させる。そして、情報提供装置10は、学習されたモデルを用いて、クエリ情報から抽出された特徴量から頻出特徴量を抽出する。また、情報提供装置10は、学習されたモデルを用いて、検索対象となる情報から抽出された特徴量から頻出特徴量を抽出する。このため、情報提供装置10は、情報検索の効率を改善できる。
Further, the
また、情報提供装置10は、検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定し、検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似すると判定された回数を計数し、計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出するとともに、計数された回数が第1閾値よりも大きい第2閾値以上となる特徴量を第2頻出特徴量として抽出する。そして、情報提供装置10は、第1頻出特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索し、第2頻出特徴量が有する特徴をモデルに学習させる。このため、情報提供装置10は、精度良く頻出特徴量を抽出可能なモデルを学習することができる。
Further, the
また、情報提供装置10は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、頻出特徴量を抽出する。例えば、情報提供装置10は、第1取引対象と関連する情報から抽出された特徴量と、その第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、頻出特徴量を抽出する。このため、情報提供装置10は、情報検索に有用な特徴量を保持しつつ、有用ではない特徴量を頻出特徴量とすることができるので、情報検索の効率を改善できる。
Further, the
また、情報提供装置10は、クエリ画像、または、検索対象となる画像から抽出された特徴量のうち、類似する画像の検索に有用ではない頻出特徴量を抽出する。このため、情報提供装置10は、類似画像検索の効率を改善できる。
Further, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、抽出部は、抽出手段や抽出回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the extraction unit can be read as an extraction means or an extraction circuit.
10 情報提供装置
20 通信部
30 記憶部
31 検索対象データベース
32 学習モデル
40 制御部
41 抽出部
42 判定部
43 計数部
44 検索部
45 生成部
46 学習部
100 端末装置
10 Information providing device 20
Claims (23)
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有し、
前記抽出部は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索装置。 Of the feature quantities extracted from the query information or the information to be searched, the extraction unit that extracts the non-useful feature quantities that are not useful for searching similar information, and the extraction unit.
It has a search unit that searches for information similar to query information by using a feature amount other than the non-useful feature amount extracted by the extraction unit.
The extraction unit extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search device characterized by that.
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有し、
前記抽出部は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索装置。 Of the feature quantities extracted from the query information or the information to be searched, the extraction unit that extracts the non-useful feature quantities that are not useful for searching similar information, and the extraction unit.
A search unit that searches for information similar to query information using features other than the non-useful features extracted by the extraction unit.
Have,
The extraction unit is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
A search device characterized by that.
ことを特徴とする請求項1または2に記載の検索装置。 The search device according to claim 1 or 2 , wherein the extraction unit extracts the non-useful feature amount from the feature amount extracted from the information to be searched.
ことを特徴とする請求項3に記載の検索装置。 The search device according to claim 3 , wherein the extraction unit extracts a plurality of feature quantities similar to each other as the non-useful feature quantities among the feature quantities extracted from the information to be searched. ..
前記検索対象となる情報から抽出された特徴量ごとに、前記所定の特徴量と類似する判定された回数を計数する計数部と
を有し、
前記抽出部は、前記計数部により計数された回数が所定の閾値を超える特徴量を前記非有用特徴量として抽出する
ことを特徴とする請求項3または4に記載の検索装置。 A determination unit for determining whether or not the feature amount extracted from the information to be searched is similar to a plurality of predetermined feature amounts.
For each feature amount extracted from the information to be searched, it has a counting unit for counting a determined number of times similar to the predetermined feature amount.
The search device according to claim 3 or 4 , wherein the extraction unit extracts a feature amount whose number of times counted by the counting unit exceeds a predetermined threshold value as the non-useful feature amount.
ことを特徴とする請求項5に記載の検索装置。 The determination unit is a plurality of predetermined feature quantities, which are a predetermined number or more of the feature quantities and are generated by a predetermined method and the feature quantities extracted from the information to be searched. The search device according to claim 5 , wherein it is determined whether or not the two are similar to each other.
を有し、
前記判定部は、前記生成部により生成された類似情報から抽出された特徴量と、前記検索対象となる情報から抽出された特徴量とが類似するか否かを判定する
ことを特徴とする請求項5または6に記載の検索装置。 It has a generator that generates similar information similar to the information from the information to be searched.
The determination unit is characterized in that it determines whether or not the feature amount extracted from the similar information generated by the generation unit is similar to the feature amount extracted from the information to be searched. Item 5. The search device according to item 5 or 6 .
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定部と、
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数部と、
前記検索対象となる情報から抽出された特徴量のうち、前記計数部により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有することを特徴とする検索装置。 A generator that generates similar information similar to the information from the information to be searched,
A determination unit for determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
For each feature amount extracted from the information to be searched, a counting unit for counting the number of times determined to be similar to other feature amounts, and a counting unit.
Of the features extracted from the information to be searched, the features whose number of times counted by the counting unit exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Department and
A search unit that searches for information similar to query information using features other than the non-useful features extracted by the extraction unit.
A search device characterized by having .
ことを特徴とする請求項5~8のうちいずれか1つに記載の検索装置。 The search device according to any one of claims 5 to 8 , wherein the determination unit determines whether or not the feature amounts extracted from the plurality of search target information are similar to each other. ..
ことを特徴とする請求項5~9のうちいずれか1つに記載の検索装置。 Any of claims 5 to 9 , wherein the determination unit determines whether or not the feature amount extracted from the query information is similar to the feature amount extracted from the information to be searched. The search device described in one.
を有することを特徴とする請求項3~10のうちいずれか1つに記載の検索装置。 Any of claims 3 to 10 , wherein the storage device has a deletion unit for deleting the non-useful feature amount extracted by the extraction unit from the storage device in which the feature amount extracted from the information to be searched is registered. The search device described in one.
ことを特徴とする請求項1~11のうちいずれか1つに記載の検索装置。 One of claims 1 to 1 is characterized in that the extraction unit extracts the non-useful feature amount of a predetermined number or less from the feature amount extracted from the query information or the information to be searched. The search device described in one.
を有することを特徴とする請求項1~12のうちいずれか1つに記載の検索装置。 The search device according to any one of claims 1 to 12, wherein the search device has a learning unit that allows a model to learn the characteristics of the non-useful feature amount extracted by the extraction unit.
ことを特徴とする請求項13に記載の検索装置。 The search device according to claim 13 , wherein the extraction unit extracts the non-useful feature amount from the feature amount extracted from the query information by using the model learned by the learning unit.
ことを特徴とする請求項13または14に記載の検索装置。 Claim 1 3 or 14 characterized in that the extraction unit extracts the non-useful feature amount from the feature amount extracted from the information to be searched by using the model learned by the learning unit. The search device described in.
前記検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似すると判定された回数を計数する計数部と
を有し、
前記抽出部は、前記計数部により計数された回数が所定の第1閾値以上となる特徴量を第1非有用特徴量として抽出するとともに、前記計数部により計数された回数が前記第1閾値よりも大きい第2閾値以上となる特徴量を第2非有用特徴量として抽出し、
前記検索部は、前記第1非有用特徴量以外の特徴量を用いて、前記クエリ情報と類似する情報を検索し、
前記学習部は、前記第2非有用特徴量が有する特徴を前記モデルに学習させる
ことを特徴とする請求項13~15のうちいずれか1つに記載の検索装置。 A determination unit for determining whether or not the feature amount extracted from the information to be searched and a plurality of predetermined feature amounts are similar, and
For each feature amount extracted from the information to be searched, it has a counting unit for counting the number of times determined to be similar to the predetermined feature amount.
The extraction unit extracts a feature amount whose number of times counted by the counting unit is equal to or greater than a predetermined first threshold value as a first non-useful feature amount, and the number of times counted by the counting unit is from the first threshold value. A feature amount having a large second threshold value or more is extracted as a second non-useful feature amount.
The search unit searches for information similar to the query information using a feature amount other than the first non-useful feature amount.
The search device according to any one of claims 1 to 15 , wherein the learning unit causes the model to learn the features of the second non-useful feature amount.
ことを特徴とする請求項1~16のうちいずれか1つに記載の検索装置。 Claims 1 to 1 are characterized in that the extraction unit extracts a non-useful feature amount that is not useful for searching a similar image from the feature amounts extracted from the query image or the image to be searched. The search device according to any one of 6 .
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と
を含み、
前記抽出工程は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索方法。 It is a search method executed by the search device.
Of the feature quantities extracted from the query information or the information to be searched, the extraction process for extracting non-useful feature quantities that are not useful for searching similar information, and
Including a search step of searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
The extraction step extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search method characterized by that.
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と
をコンピュータに実行させるための検索プログラムであって、
前記抽出手順は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索プログラム。 Extraction procedure for extracting non-useful features that are not useful for searching similar information from the features extracted from query information or information to be searched, and
It is a search program for causing a computer to execute a search procedure for searching information similar to query information by using a feature amount other than the non-useful feature amount extracted by the extraction procedure .
The extraction procedure extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search program that features that .
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、 Of the feature quantities extracted from the query information or the information to be searched, the extraction process for extracting non-useful feature quantities that are not useful for searching similar information, and
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と A search step for searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
を含み、 Including
前記抽出工程は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する The extraction step is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
ことを特徴とする検索方法。 A search method characterized by that.
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と A search procedure for searching for information similar to query information using features other than the non-useful features extracted by the extraction procedure.
をコンピュータに実行させるための検索プログラムであって、 Is a search program that allows a computer to run
前記抽出手順は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する The extraction procedure is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
ことを特徴とする検索プログラム。 A search program that features that.
検索対象となる情報から、当該情報と類似する類似情報を生成する生成工程と、 A generation process that generates similar information similar to the information from the information to be searched,
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定工程と、 A determination step of determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数工程と、 For each feature amount extracted from the information to be searched, a counting step for counting the number of times determined to be similar to other feature amounts, and
前記検索対象となる情報から抽出された特徴量のうち、前記計数工程により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、 Of the features extracted from the information to be searched, the features whose number of times counted by the counting step exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Process and
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と A search step for searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
を含むことを特徴とする検索方法。 A search method characterized by including.
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定手順と、 A determination procedure for determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数手順と、 For each feature amount extracted from the information to be searched, a counting procedure for counting the number of times determined to be similar to other feature amounts, and a counting procedure.
前記検索対象となる情報から抽出された特徴量のうち、前記計数手順により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出手順と、 Of the features extracted from the information to be searched, the features whose number of times counted by the counting procedure exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Procedure and
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と A search procedure for searching for information similar to query information using features other than the non-useful features extracted by the extraction procedure.
をコンピュータに実行させるための検索プログラム。 A search program that lets your computer run.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018047701A JP6997656B2 (en) | 2018-03-15 | 2018-03-15 | Search device, search method and search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018047701A JP6997656B2 (en) | 2018-03-15 | 2018-03-15 | Search device, search method and search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019160000A JP2019160000A (en) | 2019-09-19 |
JP6997656B2 true JP6997656B2 (en) | 2022-01-17 |
Family
ID=67992616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018047701A Active JP6997656B2 (en) | 2018-03-15 | 2018-03-15 | Search device, search method and search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6997656B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7298952B1 (en) | 2022-02-28 | 2023-06-27 | Necプラットフォームズ株式会社 | Image determination device, traffic management device, and image determination method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084713A1 (en) | 2009-01-23 | 2010-07-29 | 日本電気株式会社 | Image identifier extracting apparatus |
US20140193077A1 (en) | 2013-01-08 | 2014-07-10 | Canon Kabushiki Kaisha | Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program |
JP2014134860A (en) | 2013-01-08 | 2014-07-24 | Canon Inc | Image retrieval device, image retrieval method, retrieval original image providing device, retrieval original image providing method and program |
JP2014215929A (en) | 2013-04-29 | 2014-11-17 | 株式会社AppReSearch | Commodity information server, user terminal, commodity information providing method, and program for commodity information server |
JP2015143951A (en) | 2014-01-31 | 2015-08-06 | オムロン株式会社 | Object discrimination device, image sensor and object discrimination method |
-
2018
- 2018-03-15 JP JP2018047701A patent/JP6997656B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084713A1 (en) | 2009-01-23 | 2010-07-29 | 日本電気株式会社 | Image identifier extracting apparatus |
US20140193077A1 (en) | 2013-01-08 | 2014-07-10 | Canon Kabushiki Kaisha | Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program |
JP2014134860A (en) | 2013-01-08 | 2014-07-24 | Canon Inc | Image retrieval device, image retrieval method, retrieval original image providing device, retrieval original image providing method and program |
JP2014215929A (en) | 2013-04-29 | 2014-11-17 | 株式会社AppReSearch | Commodity information server, user terminal, commodity information providing method, and program for commodity information server |
JP2015143951A (en) | 2014-01-31 | 2015-08-06 | オムロン株式会社 | Object discrimination device, image sensor and object discrimination method |
Also Published As
Publication number | Publication date |
---|---|
JP2019160000A (en) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6141305B2 (en) | Image search | |
US9940552B1 (en) | Sublinear time classification via feature padding and hashing | |
US20170091308A1 (en) | Object indexing method, object searching method, and object indexing system | |
US9691004B2 (en) | Device and method for service provision according to prepared reference images to detect target object | |
JP6767342B2 (en) | Search device, search method and search program | |
JP6491262B2 (en) | model | |
CN111062426A (en) | Method, device, electronic equipment and medium for establishing training set | |
US9734434B2 (en) | Feature interpolation | |
JP7354014B2 (en) | Information processing device, information processing method, and information processing program | |
CN107577943B (en) | Sample prediction method and device based on machine learning and server | |
JP6997656B2 (en) | Search device, search method and search program | |
CN111488479B (en) | Hypergraph construction method and device, computer system and medium | |
US10509986B2 (en) | Image similarity determination apparatus and image similarity determination method | |
JP6974222B2 (en) | Search device, search method and search program | |
JP6705763B2 (en) | Generation device, generation method, and generation program | |
CN113343033B (en) | Video searching method and device, computer equipment and storage medium | |
JP7088665B2 (en) | Search device, search method and search program | |
JP7091055B2 (en) | Search device, search method and search program | |
JP6756648B2 (en) | Generator, generation method and generation program | |
JP7017478B2 (en) | Output device, output method and output program | |
JP7044677B2 (en) | Judgment device, judgment method and judgment program | |
JP7161002B1 (en) | Information processing device, information processing method and information processing program | |
JP7212728B1 (en) | Information processing device, information processing method and information processing program | |
JP7179705B2 (en) | Information processing device, information processing method and information processing program | |
JP6485072B2 (en) | Image search apparatus, image search method, and image search program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6997656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |