JP6997656B2 - Search device, search method and search program - Google Patents

Search device, search method and search program Download PDF

Info

Publication number
JP6997656B2
JP6997656B2 JP2018047701A JP2018047701A JP6997656B2 JP 6997656 B2 JP6997656 B2 JP 6997656B2 JP 2018047701 A JP2018047701 A JP 2018047701A JP 2018047701 A JP2018047701 A JP 2018047701A JP 6997656 B2 JP6997656 B2 JP 6997656B2
Authority
JP
Japan
Prior art keywords
information
feature amount
similar
extracted
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018047701A
Other languages
Japanese (ja)
Other versions
JP2019160000A (en
Inventor
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018047701A priority Critical patent/JP6997656B2/en
Publication of JP2019160000A publication Critical patent/JP2019160000A/en
Application granted granted Critical
Publication of JP6997656B2 publication Critical patent/JP6997656B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、検索装置、検索方法および検索プログラムに関する。 The present invention relates to a search device, a search method, and a search program.

従来、検索クエリとなる情報が有する特徴量と、検索対象となる情報が有する特徴量とを比較することで、検索クエリと類似する情報を検索する技術が知られている。このような技術の一例として、検索クエリとなる画像から抽出した複数の局所的な特徴量と、検索対象となる画像が有する複数の特徴量との類似度に加え、特徴量を抽出した範囲の座標関係の類似度に基づいて、検索クエリとなる画像と類似する画像を検索する技術が知られている。 Conventionally, there has been known a technique for searching information similar to a search query by comparing the feature amount of the information to be a search query with the feature amount of the information to be searched. As an example of such a technique, in addition to the similarity between a plurality of local features extracted from an image to be a search query and a plurality of features of the image to be searched, the range in which the features are extracted. A technique for searching an image similar to an image used as a search query based on the degree of similarity of coordinate relationships is known.

特開2014-157443号公報Japanese Unexamined Patent Publication No. 2014-157443

しかしながら、上述した従来技術では、情報検索を効率的に行っているとは言えない場合がある。 However, in the above-mentioned conventional technique, it may not be possible to say that information retrieval is performed efficiently.

例えば、検索対象となる複数の画像が、取引対象と背景とにより構成される場合がある。このような場合において、背景部分から抽出された特徴量同士を比較した結果を用いて、類似画像検索を行った場合には、異なる取引対象が撮像された画像同士を類似すると判定してしまう恐れがある。また、検索クエリや検索対象から抽出される特徴量の数が増大するに従い、情報検索に要する検索コストが増大してしまう。 For example, a plurality of images to be searched may be composed of a transaction target and a background. In such a case, if a similar image search is performed using the results of comparing the feature quantities extracted from the background portion, it may be determined that the images captured by different transaction targets are similar to each other. There is. In addition, as the number of feature quantities extracted from search queries and search targets increases, the search cost required for information retrieval increases.

本願は、上記に鑑みてなされたものであって、情報検索の効率を改善することを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the efficiency of information retrieval.

本願に係る検索装置は、クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部とを有することを特徴とする。 The search device according to the present application is extracted by an extraction unit that extracts non-useful feature amounts that are not useful for searching similar information among the feature amounts extracted from query information or information to be searched, and the extraction unit. It is characterized by having a search unit for searching information similar to query information by using a feature amount other than the non-useful feature amount.

実施形態の一態様によれば、情報検索の効率を改善できる。 According to one aspect of the embodiment, the efficiency of information retrieval can be improved.

図1は、実施形態に係る情報提供装置が実行する検索処理の一例を示す図である。FIG. 1 is a diagram showing an example of a search process executed by the information providing device according to the embodiment. 図2は、実施形態に係る情報提供装置が類似画像を用いて頻出特徴量を抽出する処理の一例を示す図である。FIG. 2 is a diagram showing an example of a process in which the information providing device according to the embodiment extracts frequently-appearing feature quantities using similar images. 図3は、実施形態に係る情報提供装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the information providing device according to the embodiment. 図4は、実施形態に係る検索対象データベースに登録される情報の一例を示す図である。FIG. 4 is a diagram showing an example of information registered in the search target database according to the embodiment. 図5は、実施形態に係る情報提供装置が実行する検索処理の流れの一例を示すフローチャートである。FIG. 5 is a flowchart showing an example of the flow of the search process executed by the information providing apparatus according to the embodiment. 図6は、ハードウェア構成の一例を示す図である。FIG. 6 is a diagram showing an example of a hardware configuration.

以下に、本願に係る検索装置、検索方法および検索プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索方法および検索プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, a search device, a search method, and a mode for carrying out the search program (hereinafter, referred to as “embodiment”) according to the present application will be described in detail with reference to the drawings. Note that this embodiment does not limit the search device, search method, and search program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.

[実施形態]
〔1-1.情報提供装置の一例について〕
まず、図1を用いて、検索装置の一例である情報提供装置が実行する検索処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する検索処理の一例を示す図である。
[Embodiment]
[1-1. About an example of information providing device]
First, with reference to FIG. 1, an example of a search process executed by an information providing device, which is an example of a search device, will be described. FIG. 1 is a diagram showing an example of a search process executed by the information providing device according to the embodiment.

図1では、インターネット等の所定のネットワークN(例えば、図3参照)を介して、各利用者が使用する端末装置100と情報提供装置10は、相互に通信可能である。また、情報提供装置10は、端末装置100以外にも、各種の外部サーバと相互に通信可能であるものとする。また、情報提供装置10は、任意の数の端末装置100と通信可能であってもよい。 In FIG. 1, the terminal device 100 and the information providing device 10 used by each user can communicate with each other via a predetermined network N (see, for example, FIG. 3) such as the Internet. Further, it is assumed that the information providing device 10 can communicate with various external servers other than the terminal device 100. Further, the information providing device 10 may be able to communicate with any number of terminal devices 100.

端末装置100は、スマートフォンやタブレット等のスマートデバイスであり、3G(3rd Generation)やLTE(Long Term Evolution)等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置100は、スマートデバイスのみならず、デスクトップPC(Personal Computer)やノートPC等の情報処理装置であってもよい。 The terminal device 100 is a smart device such as a smartphone or tablet, and is a mobile terminal device capable of communicating with an arbitrary server device via a wireless communication network such as 3G (3rd Generation) or LTE (Long Term Evolution). be. The terminal device 100 may be not only a smart device but also an information processing device such as a desktop PC (Personal Computer) or a notebook PC.

情報提供装置10は、検索処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報提供装置10は、端末装置100から検索クエリとなる画像を受信すると、受信したクエリ画像と類似する内容の画像を検索し、検索した画像や、検索した画像を示す情報(例えば、URL(Uniform Resource Locator)やサムネイル等)を検索結果として端末装置100に提供する検索処理を実行する。 The information providing device 10 is an information processing device that executes a search process, and is realized by, for example, a server device, a cloud system, or the like. For example, when the information providing device 10 receives an image to be a search query from the terminal device 100, the information providing device 10 searches for an image having contents similar to the received query image, and the searched image or information indicating the searched image (for example, a URL). (Uniform Resource Locator), thumbnails, etc.) are provided as search results to the terminal device 100, and a search process is executed.

より具体的な例を挙げると、情報提供装置10は、電子商店街において取引対象を示す画像を保持する。例えば、端末装置100は、取引対象となる商品が撮像された画像や、取引対象となる役務と関連する画像(以下、「取引対象の画像」と総称する。)を保持する。このような取引対象の画像は、例えば、電子商店街に取引対象を出品する出品者により登録された画像である。 To give a more specific example, the information providing device 10 holds an image showing a transaction target in an electronic shopping district. For example, the terminal device 100 holds an image of a product to be traded and an image related to a service to be traded (hereinafter, collectively referred to as “image of transaction target”). Such an image of a transaction target is, for example, an image registered by a seller who sells the transaction target in an electronic shopping district.

例えば、情報提供装置10は、電子商店街に出品された取引対象を検索するための検索クエリとして、クエリ画像を端末装置100から受信すると、受信したクエリ画像と類似する取引対象の画像を検索する。そして、情報提供装置10は、検索した画像と対応する取引対象(すなわち、画像に撮像された取引対象)を説明するコンテンツや取引対象を購入するコンテンツへのリンクをまとめた検索結果を端末装置100へと送信する。 For example, when the information providing device 10 receives the query image from the terminal device 100 as a search query for searching the transaction target exhibited in the electronic shopping district, the information providing device 10 searches for an image of the transaction target similar to the received query image. .. Then, the information providing device 10 uses the terminal device 100 as a search result that summarizes the content explaining the transaction target corresponding to the searched image (that is, the transaction target captured in the image) and the link to the content for purchasing the transaction target. Send to.

〔1-2.特徴量を用いた検索について〕
以下、情報提供装置10が実行する検索処理として、取引対象の画像のうち、クエリ画像と類似する画像を検索する処理の流れについて説明する。なお、以下の説明では、検索対象となる取引対象の画像を検索対象画像と総称する。なお、以下の説明では、特徴量を用いて、クエリ画像に類似する検索対象画像を検索する処理の一例について説明するが、実施形態は、これに限定されるものではない。後述する説明で明らかとなるように、情報提供装置10は、特徴量同士を比較することで、クエリ画像に類似する検索対象画像を検索するのであれば、任意の検索手法により、クエリ画像に類似する検索対象画像を検索してよい。
[1-2. Search using features]
Hereinafter, as the search process executed by the information providing device 10, the flow of the process of searching for an image similar to the query image among the images to be traded will be described. In the following description, the images of the transaction target to be searched are collectively referred to as the search target images. In the following description, an example of a process of searching for a search target image similar to a query image using a feature amount will be described, but the embodiment is not limited to this. As will be clarified in the explanation described later, if the information providing device 10 searches for a search target image similar to the query image by comparing the feature quantities with each other, the information providing device 10 is similar to the query image by any search method. You may search for the image to be searched.

例えば、特徴点を用いた検索においては、処理の処理により、検索対象画像の中から特徴的な複数の点が特徴点として選択され、各特徴点ごとに、特徴量の算出を行う範囲が設定される。例えば、このような特徴量が算出される範囲は、各種のアフィン変換等が行われた場合にも、特徴量があまり変化しないように設定される。この結果、各特徴点は、不規則な位置となり、特徴量が算出される範囲(半径)も様々な大きさのものが採用されることとなる。なお、図1では、特徴量が算出される範囲を点線の円形で疑似的に示したが、実際には、特徴量が算出される範囲は、楕円や矩形等、任意の形状が採用される。 For example, in a search using feature points, a plurality of characteristic points are selected as feature points from the search target image by the processing, and a range for calculating the feature amount is set for each feature point. Will be done. For example, the range in which such a feature amount is calculated is set so that the feature amount does not change so much even when various affine transformations are performed. As a result, each feature point becomes an irregular position, and the range (radius) in which the feature amount is calculated is also various. In FIG. 1, the range in which the feature amount is calculated is simulated by a dotted circle, but in reality, an arbitrary shape such as an ellipse or a rectangle is adopted as the range in which the feature amount is calculated. ..

なお、以下の説明では、検索対象画像から算出した各特徴量を「検索対象画像の特徴量」と記載する。続いて、情報提供装置10は、クエリ画像についても同様に、自動的に選択された特徴的な点及び範囲(半径)及び方向に基づいて、その範囲における特徴量を算出する。なお、以下の説明では、クエリ画像から算出した各特徴量を「クエリ画像の特徴量」と記載する。 In the following description, each feature amount calculated from the search target image is described as "feature amount of the search target image". Subsequently, the information providing device 10 similarly calculates the feature amount in the range based on the automatically selected characteristic point, range (radius), and direction for the query image. In the following description, each feature amount calculated from the query image is described as "feature amount of the query image".

なお、上述した検索対象画像およびクエリ画像の特徴量は、GIST(http://ilab.usc.edu/siagian/Research/Gist/Gist.html)、カラーヒストグラム、色分布などの広域特徴量やSIFT(Scale-Invariant Feature Transform)、SURF(Speed-Up Robust Features)、特徴量等、画像が有する特徴量を取得する任意の技術が採用可能である。なお、ニューラルネットで生成される特徴量も利用可能である。 The features of the above-mentioned search target image and query image include wide-area features such as GIST (http://ilab.usc.edu/siagian/Research/Gist/Gist.html), color histogram, and color distribution, and SIFT. (Scale-Invariant Feature Transform), SURF (Speed-Up Robust Features), feature amount, and any other technique for acquiring the feature amount of the image can be adopted. The features generated by the neural network can also be used.

そして、情報提供装置10は、クエリ画像の特徴量と検索対象画像の特徴量とをそれぞれ比較することで、検索対象画像の特徴量のうち、クエリ画像の特徴量と類似する特徴量を特定する。例えば、情報提供装置10は、クエリ画像の特徴量ごとに、NGT(Neighborhood Graph and Tree)等といった技術を用いて、各検索対象画像の特徴量と類似するか否かを判定する。そして、情報提供装置10は、クエリ画像の特徴量と、各検索対象画像の特徴量のうち、クエリ画像の特徴量と最も類似すると判定された特徴量とを対応付ける。 Then, the information providing device 10 specifies a feature amount similar to the feature amount of the query image among the feature amounts of the search target image by comparing the feature amount of the query image and the feature amount of the search target image. .. For example, the information providing device 10 uses a technique such as NGT (Neighborhood Graph and Tree) for each feature amount of the query image to determine whether or not it is similar to the feature amount of each search target image. Then, the information providing device 10 associates the feature amount of the query image with the feature amount determined to be most similar to the feature amount of the query image among the feature amounts of each search target image.

そして、情報提供装置10は、検索対象画像のうち、クエリ画像の特徴量と対応付けられた特徴量の数が所定の閾値を超える検索対象画像を、クエリ画像の類似候補として選択する。すなわち、情報提供装置10は、特徴量同士の類似性に基づく投票形式で、クエリ画像と類似する検索対象画像を類似画像の候補として選択する。なお、以下の説明では、上述した特徴量同士が類似するか否かを判定する処理を「特徴量照合処理」と記載する場合がある。 Then, the information providing device 10 selects, among the search target images, a search target image in which the number of feature amounts associated with the feature amount of the query image exceeds a predetermined threshold value as a similar candidate for the query image. That is, the information providing device 10 selects a search target image similar to the query image as a candidate for the similar image in a voting format based on the similarity between the feature quantities. In the following description, the process of determining whether or not the above-mentioned feature amounts are similar to each other may be described as "feature amount collation process".

ここで、類似画像の候補をそのまま検索結果として出力する手法も考えられるが、情報提供装置10は、さらに精度を高めるため、以下に説明する座標照合処理を実行する。例えば、情報提供装置10は、類似画像の候補となった画像(以下、「候補画像」と記載する。)の特徴量とクエリ画像の特徴量のうち、相互に対応付けられた特徴量を特定する。 Here, a method of outputting a candidate of a similar image as a search result as it is can be considered, but the information providing device 10 executes the coordinate matching process described below in order to further improve the accuracy. For example, the information providing device 10 specifies a feature amount associated with each other among the feature amount of an image that is a candidate for a similar image (hereinafter, referred to as “candidate image”) and the feature amount of the query image. do.

続いて、情報提供装置10は、クエリ画像から特定した各特徴量の特徴点の座標をアフィン変換(例えば、回転、平行移動、拡大もしくは縮小)した際に、候補画像から特定した各特徴量の座標と類似するか否かを判定する。そして、情報提供装置10は、クエリ画像の特徴点の座標と、候補画像の特徴点の座標とが類似すると判定した場合は、クエリ画像とその候補画像とが類似すると判定する。 Subsequently, the information providing device 10 performs an affine transformation (for example, rotation, translation, enlargement or reduction) of the coordinates of the feature points of each feature amount specified from the query image, and the information providing device 10 of each feature amount specified from the candidate image. Determine if it is similar to the coordinates. Then, when the information providing device 10 determines that the coordinates of the feature points of the query image and the coordinates of the feature points of the candidate image are similar, the information providing device 10 determines that the query image and the candidate image are similar.

すなわち、情報提供装置10は、上述した特徴量照合処理において、検索対象画像の特徴量とクエリ画像が有する特徴量とが類似するか否かを判定し、判定結果に基づく投票により、クエリ画像が有する一部の特徴点を、複数の検索対象画像のうち一部の特徴点と対応付ける。そして、情報提供装置10は、上述した座標照合処理において対応付けされた一部の特徴点を用いて、座標照合処理を実行することで、対応付けされた特徴点同士の座標の照合を行う。すなわち、情報提供装置10は、クエリ画像の各特徴点の座標をアフィン変換した際に、検索対象画像の特徴点の座標と一致(若しくは類似)するかを判定し、座標が一致した特徴点の数が所定の数を超えるか否か等に基づいて、対応する特徴量同士の座標関係が類似するか否かを判定する。 That is, in the feature amount matching process described above, the information providing device 10 determines whether or not the feature amount of the search target image and the feature amount of the query image are similar, and the query image is obtained by voting based on the determination result. Some of the feature points possessed are associated with some of the feature points of the plurality of search target images. Then, the information providing device 10 collates the coordinates of the associated feature points by executing the coordinate matching process using some of the feature points associated with each other in the coordinate matching process described above. That is, the information providing device 10 determines whether or not the coordinates of the feature points of the query image match (or are similar to) the coordinates of the feature points of the search target image when the coordinates of each feature point of the query image are affine-transformed. It is determined whether or not the coordinate relationships between the corresponding feature quantities are similar based on whether or not the number exceeds a predetermined number.

なお、情報提供装置10は、座標照合処理において、クエリ画像の全ての特徴量と、候補画像の全ての特徴量とを比較し直し、相互に類似するクエリ画像の特徴量と候補画像の特徴量との対応付けをやり直してもよい。そして、情報提供装置10は、新たに対応付けられた特徴量同士の位置関係に基づいて、クエリ画像と候補画像とが類似するか否かを判定してもよい。このような処理の結果、情報提供装置10は、類似画像の検索精度を向上させることができる。 In the coordinate matching process, the information providing device 10 re-compares all the feature amounts of the query image with all the feature amounts of the candidate images, and the feature amounts of the query images and the feature amounts of the candidate images that are similar to each other are re-compared. You may redo the correspondence with. Then, the information providing device 10 may determine whether or not the query image and the candidate image are similar based on the positional relationship between the newly associated feature quantities. As a result of such processing, the information providing device 10 can improve the search accuracy of similar images.

〔1-3.検索処理の概要について〕
しかしながら、上述した特徴量照合処理や座標照合処理では、情報検索を適切に行っているとは言えない場合がある。例えば、同一の撮像対象が含まれる複数の画像から特徴量を抽出する処理について説明する。例えば、同一の撮像対象が含まれる複数の画像から特徴点を抽出した場合、撮像対象が有する特徴的な場所以外にも、背景が有する特徴的な場所が特徴点として選択されうる。この結果、例えば、クエリ画像と検索対象画像とに異なる撮像対象が含まれていたとしても、背景が共通若しくは類似する場合には、クエリ画像と検索対象画像とを類似する画像として判定してしまう恐れがある。
[1-3. About the outline of the search process]
However, in the feature amount matching process and the coordinate matching process described above, it may not be possible to say that the information retrieval is properly performed. For example, a process of extracting a feature amount from a plurality of images including the same image pickup target will be described. For example, when a feature point is extracted from a plurality of images including the same image pickup target, a feature point having a background can be selected as a feature point in addition to the characteristic place having the image pickup target. As a result, for example, even if the query image and the search target image include different imaging targets, if the backgrounds are common or similar, the query image and the search target image are determined to be similar images. There is a fear.

また、例えば、ある撮像対象が含まれる画像から特徴点を抽出した場合、撮像対象と背景との境界、すなわち、撮像対象の形状を示す位置が特徴点として選択される場合がある。例えば、撮像対象が有する角や直線部分等が特徴点として選択される。このような特徴点からは、撮像対象の角や直線部分を示す特徴量が算出されるが、このような角や直線部分は、多くの撮像対象が有する。このため、このような角や直線部分等、多くの撮像対象が共通して有する特徴を比較対象としても、類似画像検索に有用であるとは言えない。 Further, for example, when a feature point is extracted from an image including a certain image pickup target, a boundary between the image pickup target and the background, that is, a position indicating the shape of the image pickup target may be selected as the feature point. For example, a corner or a straight line portion of the image pickup target is selected as a feature point. From such feature points, a feature amount indicating an angle or a straight line portion of an imaging target is calculated, and many imaging targets have such an angle or a straight line portion. Therefore, it cannot be said that it is useful for similar image search even if features commonly possessed by many imaging targets such as corners and straight lines are used as comparison targets.

すなわち、画像から抽出される特徴量には、取引対象の特徴であって、その取引対象が独自に有する特長を示す特徴量とは異なり、多くの取引対象が共通して有する特徴を示す特徴量(以下、「頻出特徴量」と記載する。)が存在する。このような頻出特徴量を用いて類似画像検索を行った場合、撮像された取引対象が異なる画像同士が、類似する画像と判定される恐れがある。 That is, the feature amount extracted from the image is a feature amount that is a feature of the transaction target and that shows the feature that many transaction targets have in common, unlike the feature amount that shows the feature that the transaction target has uniquely. (Hereinafter, referred to as "frequent feature amount") exists. When a similar image search is performed using such a frequent feature amount, there is a possibility that images with different transaction targets captured may be determined to be similar images.

また、クエリ画像や各検索対象画像からは、複数の特徴点が選択される。このため、画像から抽出された全ての特徴量同士を比較した場合、検索に要する時間や計算コストが増大してしまう。 In addition, a plurality of feature points are selected from the query image and each search target image. Therefore, when all the feature quantities extracted from the image are compared with each other, the time required for the search and the calculation cost increase.

そこで、情報提供装置10は、以下の検索処理を実行する。まず、情報提供装置10は、クエリ画像または検索対象画像から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する。そして、情報提供装置10は、抽出された非有用特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。 Therefore, the information providing device 10 executes the following search process. First, the information providing device 10 extracts a non-useful feature amount that is not useful for searching for similar information from the feature amounts extracted from the query image or the search target image. Then, the information providing device 10 searches for information similar to the query image by using the feature amount other than the extracted non-useful feature amount.

例えば、情報提供装置10は、検索対象画像から抽出された特徴量から非有用特徴量を抽出する。より具体的には、情報提供装置10は、検索対象画像から抽出された特徴量のうち、相互に類似する複数の特徴量、すなわち、頻出特徴量を非有用特徴量として抽出する。そして、情報提供装置10は、検索対象画像から抽出された特徴量が登録されたデータベースから、抽出された頻出特徴量を削除する。 For example, the information providing device 10 extracts a non-useful feature amount from the feature amount extracted from the search target image. More specifically, the information providing device 10 extracts a plurality of features that are similar to each other, that is, frequently appearing features, as non-useful features, among the features extracted from the search target image. Then, the information providing device 10 deletes the extracted frequent feature amount from the database in which the feature amount extracted from the search target image is registered.

このような処理の結果、情報提供装置10は、頻出特徴量以外の特徴量、すなわち、検索対象画像やクエリ画像が独自に有する特徴を示す特徴量同士を比較することとなる。この結果、情報提供装置10は、類似する背景を有する画像同士を類似するといった誤判定を削減することができるので、検索精度を向上させることができる。また、情報提供装置10は、比較対象となる特徴量の数を削減するので、検索に要する時間や計算コストを削減することができる。 As a result of such processing, the information providing device 10 compares the feature quantities other than the frequently-appearing feature quantities, that is, the feature quantities showing the features uniquely possessed by the search target image and the query image. As a result, the information providing device 10 can reduce erroneous determinations such as similar images having similar backgrounds, so that the search accuracy can be improved. Further, since the information providing device 10 reduces the number of feature quantities to be compared, it is possible to reduce the time required for searching and the calculation cost.

〔1-4.頻出特徴量の抽出について〕
ここで、情報提供装置10は、頻出特徴量等、類似画像の検索に有用ではない特徴量を抽出することができるのであれば、任意の条件を満たす特徴量を非有用特徴量として抽出してよい。
[1-4. Extraction of frequent features]
Here, if the information providing device 10 can extract a feature amount that is not useful for searching for similar images, such as a frequently-appearing feature amount, the feature amount satisfying an arbitrary condition is extracted as a non-useful feature amount. good.

例えば、それぞれ異なる取引対象が撮像された検索対象画像#Aと検索対象画像#Bが存在する場合を考える。このような場合、検索対象画像#Aと検索対象画像#Bとから抽出された特徴量のうち、相互に類似する特徴量は、背景や一般的な形状等、意味的な類似画像検索にとってあまり有用ではない特徴量であると考えられる。そこで、情報提供装置10は、複数の検索対象画像から抽出された特徴量同士が類似するか否かを判定し、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量(すなわち、非有用特徴量)として抽出する。 For example, consider the case where there are a search target image # A and a search target image # B in which different transaction targets are captured. In such a case, among the feature quantities extracted from the search target image # A and the search target image # B, the feature quantities that are similar to each other are not so much for the semantic similar image search such as the background and the general shape. It is considered to be a feature quantity that is not useful. Therefore, the information providing device 10 determines whether or not the feature amounts extracted from the plurality of search target images are similar to each other, and determines the number of times that the feature amounts determined to be similar to the other feature amounts exceed a predetermined threshold value. Extract as frequent features (ie, non-useful features).

例えば、情報提供装置10は、検索対象画像から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定し、検索対象画像から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。また、情報提供装置10は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。 For example, the information providing device 10 determines whether or not the feature amount extracted from the search target image is similar to a plurality of predetermined feature amounts, and a predetermined feature amount is determined for each feature amount extracted from the search target image. The determined number of times similar to the feature amount is counted. Then, the information providing device 10 may extract a feature amount in which the number of times counted exceeds a predetermined threshold value as a frequent feature amount. Further, the information providing device 10 has a plurality of predetermined feature amounts, which are a predetermined number or more, a feature amount generated by a predetermined method, and a feature amount extracted from the search target image. May be determined whether or not they are similar.

例えば、情報提供装置10は、検索対象画像から任意の画像を1つ選択し、選択した検索対象の特徴量と他の検索対象画像の特徴量とが類似するか否かを判定する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。 For example, the information providing device 10 selects an arbitrary image from the search target image, and determines whether or not the feature amount of the selected search target and the feature amount of the other search target image are similar. Then, the information providing device 10 may extract a feature amount whose number of times determined to be similar to other feature amounts exceeds a predetermined threshold value as a frequent feature amount.

また、情報提供装置10は、ネットワーク上に存在する各種の画像等、任意の画像を取得し、取得した画像から特徴量を抽出する。そして、情報提供装置10は、検索対象画像の特徴量と取得した画像の特徴量とを比較し、検索対象画像の特徴量のうち、取得した画像の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を抽出特徴量として抽出してもよい。 Further, the information providing device 10 acquires an arbitrary image such as various images existing on the network, and extracts a feature amount from the acquired image. Then, the information providing device 10 compares the feature amount of the search target image with the feature amount of the acquired image, and among the feature amounts of the search target image, the number of times determined to be similar to the feature amount of the acquired image is predetermined. A feature amount exceeding the threshold value of may be extracted as an extraction feature amount.

また、例えば、情報提供装置10は、所定の期間内に受け付けたクエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、情報提供装置10は、検索対象画像の特徴量のうちクエリ画像の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。 Further, for example, the information providing device 10 determines whether or not the feature amount extracted from the query image received within a predetermined period is similar to the feature amount extracted from the search target image. Then, the information providing device 10 may extract a feature amount having a number of times determined to be similar to the feature amount of the query image among the feature amounts of the search target image exceeds a predetermined threshold value as a frequent feature amount.

また、例えば、情報提供装置10は、所定のアルゴリズム若しくはランダムに疑似的な特徴量(以下、「疑似特徴量」と記載する。)を複数生成し、生成した疑似特徴量を検索対象の特徴量とが類似するか否かを判定する。そして、情報提供装置10は、検索対象画像の特徴量のうち疑似特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。 Further, for example, the information providing device 10 generates a plurality of pseudo-features (hereinafter, referred to as "pseudo-features") by a predetermined algorithm or randomly, and the generated pseudo-features are the feature quantities to be searched. Determine if and are similar. Then, the information providing device 10 may extract a feature amount having a number of times determined to be similar to the pseudo feature amount among the feature amounts of the search target image to exceed a predetermined threshold value as a frequent feature amount.

すなわち、情報提供装置10は、類似画像検索において比較対象となる特徴量のうち、検索対象画像が示す撮像対象(すなわち、取引対象)が独自に有する特徴を示す特徴量以外の特徴量を頻出特徴量とすることができるのであれば、任意の画像から抽出された特徴量や任意の手段により生成された特徴量と、検索対象画像の特徴量との比較結果に基づいて、頻出特徴量を抽出してよい。 That is, among the feature quantities to be compared in the similar image search, the information providing device 10 frequently features feature quantities other than the feature quantities that indicate the characteristics unique to the imaging target (that is, the transaction target) indicated by the search target image. If it can be an amount, the frequently-appearing feature amount is extracted based on the comparison result between the feature amount extracted from an arbitrary image or the feature amount generated by an arbitrary means and the feature amount of the search target image. You can do it.

このように、情報提供装置10は、類似画像検索において比較対象となる特徴量の中で頻出する特徴量をあまり重要ではない特徴量、すなわち、あまり特徴的ではない特徴を示す特徴量として抽出する。そして、情報提供装置10は、抽出した特徴量以外の特徴量を用いて、類似画像検索を行う。この結果、情報提供装置10は、類似画像検索の効率を改善できる。 As described above, the information providing device 10 extracts the feature amount that frequently appears among the feature amounts to be compared in the similar image search as a feature amount that is not so important, that is, a feature amount that indicates a feature that is not so characteristic. .. Then, the information providing device 10 performs a similar image search using a feature amount other than the extracted feature amount. As a result, the information providing device 10 can improve the efficiency of similar image retrieval.

〔1-5.カテゴリの考慮について〕
ここで、情報提供装置10は、カテゴリを考慮した頻出特徴量の抽出を行ってもよい。例えば、情報提供装置10は、検索対象画像のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、非有用特徴量を抽出してもよい。例えば、情報提供装置10は、第1取引対象と関連する情報から抽出された特徴量と、第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、非有用特徴量を抽出してもよい。すなわち、情報提供装置10は、検索対象画像から任意の画像を1つ選択し、選択した検索対象の特徴量と、選択した検索対象画像とは異なるカテゴリに属する他の検索対象画像の特徴量とが類似するか否かを判定してもよい。
[1-5. About category consideration]
Here, the information providing device 10 may extract the frequently-appearing feature amount in consideration of the category. For example, the information providing device 10 may extract a non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories in the search target image. For example, the information providing device 10 compares a feature amount extracted from information related to the first transaction target with a feature amount extracted from information related to a second transaction target of a type different from the first transaction target. Based on the results, non-useful features may be extracted. That is, the information providing device 10 selects an arbitrary image from the search target images, and the feature amount of the selected search target and the feature amount of another search target image belonging to a category different from the selected search target image. May be determined whether or not they are similar.

例えば、情報提供装置10は、カテゴリ#Aに属する取引対象の画像を選択した場合、カテゴリ#Bに属する取引対象の画像を比較対象として抽出する。そして、情報提供装置10は、カテゴリ#Aに属する取引対象の画像から抽出した特徴量と、カテゴリ#Bに属する取引対象の画像から抽出した特徴量とが類似するか否かを判定し、カテゴリ#Bに属する取引対象の画像から抽出した特徴量のうち、カテゴリ#Aに属する取引対象の画像から抽出した特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量としてもよい。 For example, when the information providing device 10 selects an image of a transaction target belonging to category # A, the information providing device 10 extracts the image of the transaction target belonging to category # B as a comparison target. Then, the information providing device 10 determines whether or not the feature amount extracted from the image of the transaction target belonging to the category #A and the feature amount extracted from the image of the transaction target belonging to the category #B are similar to each other, and determines whether or not the feature amount is similar to the category. Of the feature quantities extracted from the image of the transaction target belonging to # B, the feature quantity in which the number of times determined to be similar to the feature quantity extracted from the image of the transaction target belonging to category #A exceeds a predetermined threshold is defined as the frequent feature quantity. May be good.

ここで、カテゴリ#Aおよびカテゴリ#Bは、任意の関係性が採用可能である。例えば、情報提供装置10は、電子商店街においてカテゴリ#Aに属する取引対象が撮像された検索対象画像と、カテゴリ#Aとは異なるカテゴリであって、1段階上位のカテゴリが共通するカテゴリ#Bに属する取引対象が撮像された検索対象画像との特徴量同士を比較してもよい。また、情報提供装置10は、電子商店街においてカテゴリ#Aに属する取引対象が撮像された検索対象画像と、カテゴリ#Aとは異なるカテゴリであって、2段階以上上位のカテゴリが共通するカテゴリ#Bに属する取引対象が撮像された検索対象画像との特徴量同士を比較してもよい。 Here, any relationship can be adopted for category # A and category # B. For example, the information providing device 10 is a category different from the search target image in which the transaction target belonging to the category # A is captured in the electronic shopping district and the category # A, and the category # B in which the category one step higher is common. The feature amounts may be compared with the search target image in which the transaction target belonging to the category is captured. Further, the information providing device 10 is a category different from the search target image in which the transaction target belonging to the category # A is captured in the electronic shopping district and the category # A, and the category # in which the categories higher than two levels are common. The feature amounts may be compared with the search target image in which the transaction target belonging to B is captured.

また、情報提供装置10は、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量同士を比較し、他の特徴量と類似すると判定された回数を特徴量ごとに計数する。このような処理を行った場合、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量は、そのカテゴリに属する取引対象が共通して有する特徴量であると言える。そこで、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を下回る特徴量を頻出特徴量としてもよい。 Further, the information providing device 10 compares the feature amounts of the search target images in which the transaction targets belonging to the same category are captured, and counts the number of times determined to be similar to the other feature amounts for each feature amount. When such processing is performed, a feature amount whose number of times determined to be similar to other feature amounts exceeds a predetermined threshold can be said to be a feature amount commonly possessed by transaction targets belonging to the category. Therefore, the information providing device 10 may set a feature amount in which the number of times determined to be similar to other feature amounts is less than a predetermined threshold value as a frequent feature amount.

また、情報提供装置10は、各検索対象画像の特徴量同士を比較し、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数と、異なるカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数とをそれぞれ計数する。そして、情報提供装置10は、同じカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数が所定の閾値を下回り、異なるカテゴリに属する取引対象が撮像された検索対象画像の特徴量と類似すると判定された回数が所定の閾値を上回る特徴量を頻出特徴量として抽出してもよい。 Further, the information providing device 10 compares the feature amounts of the search target images with each other, and determines that the transaction target belonging to the same category is similar to the feature amount of the captured search target image, and the number of transactions belonging to different categories. The number of times that the target is determined to be similar to the feature amount of the image to be searched is counted. Then, in the information providing device 10, the number of times that the transaction target belonging to the same category is determined to be similar to the feature amount of the captured search target image falls below a predetermined threshold value, and the transaction target belonging to a different category is captured. A feature amount in which the number of times determined to be similar to the feature amount of the image exceeds a predetermined threshold may be extracted as a frequent feature amount.

〔1-6.類似画像を用いた処理について〕
また、情報提供装置10は、検索対象画像やクエリ画像等、任意の画像から類似画像を生成し、生成した類似情報から抽出された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出してもよい。
[1-6. Processing using similar images]
Further, the information providing device 10 generates a similar image from an arbitrary image such as a search target image or a query image, and the feature amount extracted from the generated similar information is similar to the feature amount extracted from the search target image. Determine whether or not to do so. Then, the information providing device 10 may extract a feature amount whose number of times determined to be similar to other feature amounts exceeds a predetermined threshold value as a frequent feature amount.

例えば、図2は、実施形態に係る情報提供装置が類似画像を用いて頻出特徴量を抽出する処理の一例を示す図である。例えば、情報提供装置10は、検索対象画像が登録されたデータベースから、検索対象画像T1を処理対象として選択する。そして、情報提供装置10は、抽出した検索対象画像T1と類似する画像、すなわち、類似画像TV1~TV3の生成を行う。 For example, FIG. 2 is a diagram showing an example of a process in which an information providing device according to an embodiment extracts a frequent feature amount using a similar image. For example, the information providing device 10 selects the search target image T1 as the processing target from the database in which the search target image is registered. Then, the information providing device 10 generates an image similar to the extracted search target image T1, that is, similar images TV1 to TV3.

例えば、情報提供装置10は、選択した検索対象画像の画像解析を行い、背景が撮像された範囲と主な撮像対象が撮像された範囲とを特定し、背景が撮像された範囲を削除した類似画像TV1を生成する。なお、情報提供装置10は、異なる背景の合成を行った類似画像を生成してもよい。また、情報提供装置10は、撮像対象を回転、拡大、縮小若しくは変形させた画像等、撮像対象が撮像された範囲をアフィン変換した類似画像TV2を生成してもよい。また、情報提供装置10は、撮像対象の色を変換した類似画像TV3を生成してもよい。 For example, the information providing device 10 performs image analysis of the selected search target image, identifies the range in which the background is captured and the range in which the main imaging target is captured, and deletes the range in which the background is captured. Generate image TV1. The information providing device 10 may generate a similar image obtained by synthesizing different backgrounds. Further, the information providing device 10 may generate a similar image TV 2 in which the range in which the image pickup target is captured is affine-transformed, such as an image in which the image pickup target is rotated, enlarged, reduced, or deformed. Further, the information providing device 10 may generate a similar image TV 3 in which the color to be imaged is converted.

また、情報提供装置10は、検索対象画像全体に対して各種のアフィン変換を適用した画像を生成してもよい。また、情報提供装置10は、各範囲や画像全体にぼかしを加えた画像を生成してもよい。また、情報提供装置10は、解像度の変更等、任意の画像変換手法により、類似画像の生成を行えばよい。 Further, the information providing device 10 may generate an image to which various affine transformations are applied to the entire search target image. Further, the information providing device 10 may generate an image in which each range or the entire image is blurred. Further, the information providing device 10 may generate a similar image by an arbitrary image conversion method such as changing the resolution.

なお、どの程度まで変化させた画像を類似画像とするかについては、情報提供装置10が実行する類似画像検索の目的に応じて任意の設定が採用可能である。すなわち、情報提供装置10は、類似画像として生成した画像がクエリ画像として入力された際に、元となる検索対象画像をクエリ画像に類似する画像として選択することができる程度に類似するのであれば、任意の画像変換を行った画像を類似画像として採用してよい。また、このような類似画像の生成は、各種の画像解析技術や画像生成技術により実現可能である。 As for how much the changed image is to be a similar image, any setting can be adopted according to the purpose of the similar image search executed by the information providing device 10. That is, if the information providing device 10 is similar to the extent that when an image generated as a similar image is input as a query image, the original search target image can be selected as an image similar to the query image. , An image that has undergone arbitrary image conversion may be adopted as a similar image. Further, the generation of such a similar image can be realized by various image analysis techniques and image generation techniques.

続いて、情報提供装置10は、生成した類似画像TV1~TV3の特徴量を抽出する。例えば、情報提供装置10は、類似画像TV1~TV3から特徴量群TV1~TV3を抽出する。また、情報提供装置10は、元の検索対象画像T1の特徴量群T1を取得する。続いて、情報提供装置10は、検索対象画像T1とは異なるカテゴリの取引対象が撮像された検索対象画像T2を選択し、選択した検索対象画像T2の特徴量群T2を抽出する。そして、情報提供装置10は、特徴量群T1、T2、TV1~TV3に含まれる各特徴量を相互に比較し、特徴量群T2に含まれる特徴量のうち、特徴量群T1、TV1~TV3に含まれる特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する。 Subsequently, the information providing device 10 extracts the feature quantities of the generated similar images TV1 to TV3. For example, the information providing device 10 extracts feature quantity groups TV1 to TV3 from similar images TV1 to TV3. Further, the information providing device 10 acquires the feature amount group T1 of the original search target image T1. Subsequently, the information providing device 10 selects the search target image T2 in which the transaction target in a category different from the search target image T1 is captured, and extracts the feature amount group T2 of the selected search target image T2. Then, the information providing device 10 compares each feature amount included in the feature amount groups T1, T2, and TV1 to TV3 with each other, and among the feature amounts included in the feature amount group T2, the feature amount group T1, TV1 to TV3. A feature amount in which the number of times determined to be similar to the feature amount contained in the above exceeds a predetermined threshold is extracted as a frequent feature amount.

〔1-7.カテゴリ考慮の必要性について〕
なお、上述した各種の処理においてカテゴリを考慮する必要は必ずしも存在しない。例えば、情報提供装置10は、実際の処理においては、様々なカテゴリに属する検索対象画像の特徴量同士を比較し、他の特徴量と類似すると判定された回数を計数する処理を繰り返し実行する。このような処理十分な回数行った場合や、検索対象画像と対応するカテゴリや取引対象の数が十分に多ければ、あるカテゴリに属する取引対象が共通して有する特徴であって、検索に有用な特徴を示す特徴量が他の特徴量と類似すると判定された回数よりも、検索に有用ではない特徴量を示す特徴量(多くの画像が共通して有する特徴を示す特徴量)が他の特徴量と類似すると判定される回数の方が多くなると考えられる。
[1-7. Necessity of category consideration]
It is not always necessary to consider the category in the various processes described above. For example, in the actual processing, the information providing device 10 repeatedly executes a process of comparing the feature amounts of the search target images belonging to various categories and counting the number of times determined to be similar to the other feature amounts. If such processing is performed a sufficient number of times, or if the number of categories and transaction targets corresponding to the search target image is sufficiently large, the transaction targets belonging to a certain category have common features and are useful for searching. Other features are features that are not useful for searching (features that show features that many images have in common), rather than the number of times that features that show features are determined to be similar to other features. It is considered that the number of times that it is judged to be similar to the amount is larger.

そこで、情報提供装置10は、上述した処理を各種任意の組み合わせで繰り返し実行することで、他の特徴量と類似すると判定された回数を計数し、計数した回数が所定の閾値を超える特長量を頻出特徴量として抽出すればよい。 Therefore, the information providing device 10 counts the number of times determined to be similar to other feature quantities by repeatedly executing the above-mentioned processes in various arbitrary combinations, and the feature quantity whose counted number exceeds a predetermined threshold value. It may be extracted as a frequent feature amount.

〔1-8.閾値について〕
また、情報提供装置10は、頻出特徴量を抽出する際の閾値として、任意の閾値を採用してもよい。例えば、情報提供装置10は、全ての検索対象画像の全ての特徴量のうち、他の特徴量と類似すると判定された回数が多い順に所定の数の特徴量を選択し、選択した特徴量を頻出特徴量として抽出してもよい。また、情報提供装置10は、他の特徴量と類似すると判定された回数が、所定の閾値以上となる特徴量を全て頻出特徴量としてもよい。
[1-8. About the threshold]
Further, the information providing device 10 may adopt an arbitrary threshold value as a threshold value when extracting the frequently-appearing feature amount. For example, the information providing device 10 selects a predetermined number of feature quantities in descending order of the number of times it is determined to be similar to the other feature quantities among all the feature quantities of all the search target images, and selects the selected feature quantities. It may be extracted as a frequent feature amount. Further, the information providing device 10 may use all the feature quantities in which the number of times determined to be similar to the other feature quantities is equal to or higher than a predetermined threshold value as the frequent feature quantities.

一方、検索対象画像から抽出された特徴量から多くの特徴量を削除した場合、検索精度が低下してしまう恐れがある。そこで、情報提供装置10は、削除する頻出特徴量の数に上限を設けてもよい。例えば、情報提供装置10は、クエリ画像または検索対象画像から抽出された特徴量から、所定の数以下の非有用特徴量を抽出してもよい。より具体的には、情報提供装置10は、検索対象画像1つ当たりの特徴量のうち、頻出特徴量以外の特徴量の数が所定の閾値を下回らないように、頻出特徴量の抽出を行ってもよい。また、情報提供装置10は、検索対象画像の全特徴量のうち、頻出特徴量とする特徴量の割合の下限値や上限値を設定してもよい。 On the other hand, if a large number of features are deleted from the features extracted from the search target image, the search accuracy may decrease. Therefore, the information providing device 10 may set an upper limit on the number of frequently-used feature amounts to be deleted. For example, the information providing device 10 may extract a predetermined number or less of non-useful features from the features extracted from the query image or the search target image. More specifically, the information providing device 10 extracts the frequently appearing feature amount so that the number of the feature amount other than the frequently appearing feature amount does not fall below a predetermined threshold value among the feature amount per search target image. You may. Further, the information providing device 10 may set a lower limit value or an upper limit value of the ratio of the feature amount to be the frequently appearing feature amount among all the feature amounts of the search target image.

〔1-9.検索処理の一例〕
以下、図1を用いて、情報提供装置10が実行する検索処理の一例を説明する。例えば、情報提供装置10は、検索対象となる各検索対象画像の特徴量をあらかじめ抽出する(ステップS1)。例えば、情報提供装置10は、検索対象画像T1の中から複数の特徴点PT1-1、PT1-2・・・を所定のアルゴリズムで選択し、選択した特徴点ごとに特徴量FT1-1、FT1-2・・・を抽出する。また、情報提供装置10は、検索対象画像T2の中から複数の特徴点PT2-1、PT2-2・・・を所定のアルゴリズムで選択し、選択した特徴点ごとに特徴量FT2-1、FT2-2・・・を抽出する。
[1-9. An example of search processing]
Hereinafter, an example of the search process executed by the information providing device 10 will be described with reference to FIG. For example, the information providing device 10 extracts in advance the feature amount of each search target image to be searched (step S1). For example, the information providing device 10 selects a plurality of feature points PT1-1, PT1-2, ... From the search target image T1 by a predetermined algorithm, and features FT1-1, FT1 for each selected feature point. -2 ... is extracted. Further, the information providing device 10 selects a plurality of feature points PT2-1, PT2-2, ... From the search target image T2 by a predetermined algorithm, and the feature quantities FT2-1, FT2 for each selected feature point. -2 ... is extracted.

続いて、情報提供装置10は、抽出した特徴量同士、すなわち、検索対象画像として登録された画像の特徴量同士を比較し、特徴量ごとに他の特徴量と類似すると判定された回数を計数する。そして、情報提供装置10は、他の特徴量と類似すると判定された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する(ステップS2)。例えば、情報提供装置10は、特徴量FT1-1と他の特徴量FT1-2、FT2-1、FR2-2・・・とを比較し、特徴量FT1-1との類似度が所定の閾値以下となる特徴量の数を類似特徴量数として計数する。また、情報提供装置10は、他の特徴量についても同様に、類似特徴量数の計数を行う。そして、情報提供装置10は、計数した類似特徴量数の値が高い方から順に所定の数の特徴量を頻出特徴量として抽出する。 Subsequently, the information providing device 10 compares the extracted feature amounts with each other, that is, the feature amounts of the images registered as the search target images, and counts the number of times for each feature amount to be determined to be similar to the other feature amounts. do. Then, the information providing device 10 extracts a feature amount whose number of times determined to be similar to other feature amounts exceeds a predetermined threshold value as a frequent feature amount (step S2). For example, the information providing device 10 compares the feature amount FT1-1 with the other feature amounts FT1-2, FT2-1, FR2-2, ..., And the degree of similarity with the feature amount FT1-1 is a predetermined threshold value. The following number of features is counted as the number of similar features. Further, the information providing device 10 similarly counts the number of similar feature quantities for other feature quantities. Then, the information providing device 10 extracts a predetermined number of feature quantities as frequent feature quantities in order from the one with the highest value of the counted similar feature quantities.

続いて、情報提供装置10は、抽出した頻出特徴量を削除する(ステップS3)。例えば、情報提供装置10は、各検索対象画像の特徴量が登録されたデータベースから、類似特徴量数が所定の閾値を超えた特徴量FT1-1やFT2-2等を削除する。 Subsequently, the information providing device 10 deletes the extracted frequently-appearing feature amount (step S3). For example, the information providing device 10 deletes the feature amounts FT1-1, FT2-2, and the like in which the number of similar feature amounts exceeds a predetermined threshold value from the database in which the feature amounts of each search target image are registered.

ここで、情報提供装置10は、クエリ画像を端末装置100から取得した場合は(ステップS4)、クエリ画像の特徴量と頻出特徴量以外の特徴量との比較結果に基づいて、クエリ画像と類似する画像を検索する(ステップS6)。例えば、情報提供装置10は、データベースに登録された特徴量と、クエリ画像から抽出された特徴量との比較結果に基づいて、クエリ画像と類似する画像を検索する。 Here, when the query image is acquired from the terminal device 100 (step S4), the information providing device 10 is similar to the query image based on the comparison result between the feature amount of the query image and the feature amount other than the frequent feature amount. Search for the image to be used (step S6). For example, the information providing device 10 searches for an image similar to the query image based on the comparison result between the feature amount registered in the database and the feature amount extracted from the query image.

そして、情報提供装置10は、検索結果を端末装置100に送信する(ステップS6)。例えば、情報提供装置10は、類似すると判定された画像のデータやサムネイル等を端末装置100に送信する。なお、情報提供装置10は、例えば、特徴量照合処理や座標照合処理の結果に応じたランキング形式で、検索した検索対象画像の情報を配信してもよい。例えば、情報提供装置10は、各照合処理の結果に基づいて、各検索対象画像とクエリ画像と類似する確度を算出し、算出した確度に応じたランキング形式で、検索した検索対象画像の情報を配信してもよい。 Then, the information providing device 10 transmits the search result to the terminal device 100 (step S6). For example, the information providing device 10 transmits image data, thumbnails, and the like determined to be similar to the terminal device 100. The information providing device 10 may distribute the information of the searched search target image in a ranking format according to the result of the feature amount matching process or the coordinate matching process, for example. For example, the information providing device 10 calculates the accuracy similar to each search target image and the query image based on the result of each collation process, and obtains the information of the searched search target image in a ranking format according to the calculated accuracy. It may be delivered.

〔1-10.検索処理の結果を用いた処理〕
なお、情報提供装置10は、上述した特徴量照合処理により受付けたクエリ画像と検索対象画像の特徴量とが類似するか否かを比較することとなる。そこで、情報提供装置10は、例えば、検索対象画像の特徴量ごとに、特徴量照合処理によりクエリ画像の特徴量と類似すると判定された回数の計数を行ってもよい。例えば、情報提供装置10は、場合は、検索対象画像から抽出されたある特徴量が、特徴量照合処理によりクエリ画像の特徴量と類似すると判定された場合は、その特徴量の類似特徴量数に1を加算してもよい。
[1-10. Processing using the results of search processing]
The information providing device 10 will compare whether or not the query image received by the feature amount matching process described above and the feature amount of the search target image are similar to each other. Therefore, for example, the information providing device 10 may count the number of times that the feature amount of the search target image is determined to be similar to the feature amount of the query image by the feature amount matching process. For example, in the case of the information providing device 10, if a certain feature amount extracted from the search target image is determined to be similar to the feature amount of the query image by the feature amount matching process, the similar feature amount number of the feature amount is determined. 1 may be added to.

〔1-11.頻出特徴量の特徴について〕
ここで、頻出特徴量として抽出される特徴量には、所定の特徴が現れる可能性がある。そこで、情報提供装置10は、頻出特徴量が有する特徴をモデルに学習させてもよい。例えば、情報提供装置10は、DNN(Deep Neural Network)やSVM(Support Vector Machine)等、任意のモデルに対して、頻出特徴量が有する特徴をモデルに学習させてもよい。
[1-11. About the features of frequent features]
Here, a predetermined feature may appear in the feature amount extracted as the frequent feature amount. Therefore, the information providing device 10 may make the model learn the features of the frequent feature quantities. For example, the information providing device 10 may make an arbitrary model, such as a DNN (Deep Neural Network) or an SVM (Support Vector Machine), learn the features of the frequent features.

また、情報提供装置10は、頻出特徴量以外の特徴量の特徴をモデルに学習させてもよい。例えば、情報提供装置10は、類似特徴量数が所定の閾値を下回る特徴量を非頻出特徴量として抽出する。そして、情報提供装置10は、頻出特徴量が有する特徴と、非頻出特徴量が有する特徴との差をモデルに学習させることで、頻出特徴量が独自に有する特徴を精度良く学習させてもよい。 Further, the information providing device 10 may make the model learn the features of the feature amount other than the frequently appearing feature amount. For example, the information providing device 10 extracts a feature amount in which the number of similar feature amounts is less than a predetermined threshold value as a non-frequent feature amount. Then, the information providing device 10 may learn the feature unique to the frequent feature amount with high accuracy by learning the difference between the feature possessed by the frequent feature amount and the feature possessed by the non-frequent feature amount in the model. ..

このような学習が行われた学習モデルは、特徴量から頻出特徴量を抽出することができると推定される。そこで、情報提供装置10は、学習モデルを用いて、検索対象画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、情報提供装置10は、検索対象画像から抽出された特徴量を学習モデルに入力することで、頻出特徴量であるか否かを判定し、頻出特徴量ではないと判定された特徴量のみをデータベースに登録してもよい。 It is presumed that the learning model in which such learning is performed can extract the frequent features from the features. Therefore, the information providing device 10 may extract the frequently appearing feature amount from the feature amount extracted from the search target image by using the learning model. For example, the information providing device 10 inputs the feature amount extracted from the search target image into the learning model, determines whether or not the feature amount is a frequent feature amount, and only the feature amount determined not to be a frequent feature amount. May be registered in the database.

また、情報提供装置10は、学習モデルを用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出し、抽出した頻出特徴量以外の特徴量と、検索対象画像から抽出された特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。例えば、情報提供装置10は、運用時に、学習モデルを用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出する。そして、情報提供装置10は、抽出した頻出特徴量外の特徴量と、検索対象画像から抽出した全ての特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。 Further, the information providing device 10 uses a learning model to extract a frequent feature amount from the feature amount extracted from the query image, a feature amount other than the extracted frequent feature amount, and a feature amount extracted from the search target image. You may search for an image similar to the query image based on the comparison result with. For example, the information providing device 10 uses a learning model to extract frequently appearing features from the features extracted from the query image during operation. Then, the information providing device 10 may search for an image similar to the query image based on the comparison result between the extracted feature amount other than the frequently-appearing feature amount and all the feature amounts extracted from the search target image. ..

また、情報提供装置10は、クエリ画像の特徴量から学習モデルを用いて抽出された頻出特徴量以外の特徴量と、検索対象画像の特徴量から上述した各種の手法で抽出した頻出特徴量以外の特徴量、もしくは、検索対象画像の特徴量から学習モデルを用いて抽出した頻出特徴量以外の特徴量との比較結果に基づいて、クエリ画像と類似する画像の検索を行ってもよい。 Further, the information providing device 10 has a feature amount other than the frequent feature amount extracted from the feature amount of the query image using the learning model, and a feature amount other than the frequent feature amount extracted from the feature amount of the search target image by the above-mentioned various methods. You may search for an image similar to the query image based on the feature amount of the above or the comparison result with the feature amount other than the frequent feature amount extracted from the feature amount of the search target image by using the learning model.

なお、情報提供装置10は、画像検索に用いる頻出特徴量と、モデルの学習に用いる有用特徴量とを異なるものとしてもよい。例えば、モデルに頻出特徴量が有する特徴を精度良く学習させるためには、モデルの学習に用いる頻出特徴量が実際に有用ではない確度がより高い方が良いと考えられる。そこで、情報提供装置10は、異なる閾値を用いて、画像検索の際に考慮する頻出特徴量と、モデルの学習に用いる頻出特徴量とをそれぞれ個別に抽出してもよい。 The information providing device 10 may have different frequently-used feature quantities used for image retrieval and useful feature quantities used for model learning. For example, in order to make the model learn the features of the frequent features with high accuracy, it is considered that the probability that the frequent features used for learning the model are not actually useful is higher. Therefore, the information providing device 10 may individually extract the frequently-appearing feature amount to be considered in the image search and the frequently-appearing feature amount to be used for model learning by using different threshold values.

例えば、情報提供装置10は、検索対象画像から抽出された特徴量と、各種の特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象画像から抽出された特徴量ごとに、各種の特徴量と類似すると判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出するとともに、計数された回数が第1閾値よりも大きい第2閾値以上となる特徴量を第2頻出特徴量として抽出する。その後、情報提供装置10は、第1頻出特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。一方、情報提供装置10は、第2頻出特徴量が有する特徴をモデルに学習させてもよい。この結果、情報提供装置10は、画像から抽出された特徴量が画像検索に有用ではない頻出特徴量であるか否かを精度良く判定する学習モデルを生成することができる。 For example, the information providing device 10 determines whether or not the feature amount extracted from the search target image is similar to the various feature amounts. Further, the information providing device 10 counts the number of times it is determined that the feature amount is similar to the various feature amounts for each feature amount extracted from the search target image. Then, the information providing device 10 extracts a feature amount whose counted number of times is equal to or more than a predetermined first threshold value as a first frequent feature amount, and sets the number of counted times to a second threshold value or more larger than the first threshold value. The feature amount is extracted as the second frequent feature amount. After that, the information providing device 10 searches for information similar to the query image by using a feature amount other than the first frequent feature amount. On the other hand, the information providing device 10 may make the model learn the features of the second frequent feature amount. As a result, the information providing device 10 can generate a learning model that accurately determines whether or not the feature amount extracted from the image is a frequent feature amount that is not useful for image retrieval.

〔1-12.処理の対象について〕
ここで、上述した例では、情報提供装置10は、クエリ画像と類似する検索対象画像の検索を行った。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、文章や音楽等、任意のコンテンツについて、上述した検索処理を適用可能である。
[1-12. About the target of processing]
Here, in the above-mentioned example, the information providing device 10 searches for a search target image similar to the query image. However, the embodiments are not limited to this. For example, the information providing device 10 can apply the above-mentioned search process to arbitrary contents such as sentences and music.

例えば、情報提供装置10は、検索対象が文章である場合、クエリ文章や検索対象となる文章の中から特徴点としていくつかの単語を選択し、選択した単語の前後に存在する複数の単語を抽出する。また、情報提供装置10は、抽出した単語の特徴量を、特徴量として算出するとともに、単語の相対的な出現位置(例えば、特徴点として選択した単語から次の単語までの間に存在する単語の数等)を座標とみなす。そして、情報提供装置10は、特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。 For example, when the search target is a sentence, the information providing device 10 selects some words as feature points from the query sentence and the sentence to be searched, and selects a plurality of words existing before and after the selected word. Extract. Further, the information providing device 10 calculates the feature amount of the extracted word as the feature amount, and the relative appearance position of the word (for example, a word existing between the word selected as the feature point and the next word). , Etc.) are regarded as coordinates. Then, the information providing device 10 may extract the frequently appearing feature amount based on the comparison result between the feature amounts.

また例えば、情報提供装置10は、検索対象が音声である場合、クエリ音声や検索対象となる音声の中から特徴点としていくつかの再生位置を選択し、選択した再生位置の前後に存在する音声の周波数特性から特徴量を算出する、また、情報提供装置10は、再生位置を座標とみなす。そして、情報提供装置10は、特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。 Further, for example, when the search target is voice, the information providing device 10 selects some playback positions as feature points from the query voice and the voice to be searched, and the voice existing before and after the selected playback position. The feature amount is calculated from the frequency characteristic of the above, and the information providing device 10 regards the reproduction position as a coordinate. Then, the information providing device 10 may extract the frequently appearing feature amount based on the comparison result between the feature amounts.

なお、情報提供装置10は、異種間の情報検索を行ってもよい。例えば、情報提供装置10は、クエリ文章と類似する対象音声の検索を行ってもよく、クエリ音声と類似する対象文章の検索を行ってもよい。また、このような異種間の情報検索において頻出特徴量を抽出し、抽出した頻出特徴量以外の特徴量を用いて、類似する情報の検索を行えばよい。すなわち、情報提供装置10は、局所的な特徴を示す多次元量を特徴量として設定することができるコンテンツであれば、任意のコンテンツについて、上述した検索処理を適用し、有用特徴量の抽出を行ってよい。 The information providing device 10 may perform information retrieval between different types. For example, the information providing device 10 may search for a target voice similar to the query text, or may search for a target text similar to the query text. Further, in such an information retrieval between different species, a frequently-appearing feature amount may be extracted, and similar information may be searched using a feature amount other than the extracted frequently-appearing feature amount. That is, the information providing device 10 applies the above-mentioned search process to any content as long as the content can set a multidimensional amount indicating a local feature as the feature amount, and extracts useful feature amounts. You may go.

〔2.情報提供装置の構成〕
以下、上記した検索処理を実現する情報提供装置10が有する機能構成の一例について説明する。図3は、実施形態に係る情報提供装置の構成例を示す図である。図3に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of information providing device]
Hereinafter, an example of the functional configuration of the information providing device 10 that realizes the above-mentioned search process will be described. FIG. 3 is a diagram showing a configuration example of the information providing device according to the embodiment. As shown in FIG. 3, the information providing device 10 includes a communication unit 20, a storage unit 30, and a control unit 40.

通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100との間で情報の送受信を行う。 The communication unit 20 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 20 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the terminal device 100.

記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、検索対象データベース31および学習モデル32を記憶する。 The storage unit 30 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. Further, the storage unit 30 stores the search target database 31 and the learning model 32.

検索対象データベース31には、検索対象となる対象情報が登録されている。例えば、図4は、実施形態に係る検索対象データベースに登録される情報の一例を示す図である。図4に示す例では、検索対象データベース31には、「検索対象ID(Identifier)」、「検索対象データ」、「カテゴリ」、「特徴量」、「類似特徴量数」、および「種別」といった情報が登録されている。 Target information to be searched is registered in the search target database 31. For example, FIG. 4 is a diagram showing an example of information registered in the search target database according to the embodiment. In the example shown in FIG. 4, the search target database 31 includes "search target ID (Identifier)", "search target data", "category", "feature amount", "similar feature amount number", and "type". Information is registered.

ここで、「検索対象ID」とは、検索対象画像を識別する識別子である。また、「検索対象データ」とは、検索対象画像のデータである。また、「カテゴリ」とは、対応付けられた検索対象画像に関連する取引対象が属するカテゴリであり、例えば、電子商店街において撮像された取引対象が属するカテゴリを示す情報である。また、「特徴量」とは、特徴量である。また、「類似特徴量数」とは、上述した各種の処理により、他の特徴量と類似すると判定された回数である。また、「種別」とは、対応付けられた特徴量が頻出特徴量であるかその他の通常特徴量であるかを示す情報である。 Here, the "search target ID" is an identifier that identifies the search target image. Further, the "search target data" is the data of the search target image. Further, the "category" is a category to which the transaction target related to the associated search target image belongs, and is, for example, information indicating a category to which the transaction target imaged in the electronic shopping district belongs. The "feature amount" is a feature amount. The "number of similar feature quantities" is the number of times determined to be similar to other feature quantities by the various processes described above. Further, the "type" is information indicating whether the associated feature amount is a frequent feature amount or another normal feature amount.

例えば、図4に示す例では、検索対象データベース31には、検索対象ID「T1」、検索対象データ「TD#1」、カテゴリ「飲料」、類似特徴量数「230」および種別「頻出」が対応付けて登録されている。このような情報は、検索対象ID「T1」が示す検索対象画像のデータが「TD#1」であり、カテゴリ「飲料」に関する取引対象が撮像された画像であり、特徴量が「FT1-1」である旨を示す。また、このような情報は、特徴量「FT1-1」の類似特徴量数、すなわち、特徴量「FT1-1」と類似する他の特徴量の数が「230」であり、種別が「頻出」、すなわち頻出特徴量である旨を示す。 For example, in the example shown in FIG. 4, the search target database 31 contains the search target ID “T1”, the search target data “TD # 1”, the category “beverage”, the number of similar feature quantities “230”, and the type “frequent”. It is registered in association with each other. Such information is an image in which the data of the search target image indicated by the search target ID "T1" is "TD # 1", the transaction target related to the category "beverage" is captured, and the feature amount is "FT1-1". ". Further, in such information, the number of similar feature quantities of the feature quantity "FT1-1", that is, the number of other feature quantities similar to the feature quantity "FT1-1" is "230", and the type is "frequently appearing". That is, it indicates that it is a frequent feature amount.

なお、図4に示した各種の値は、概念的なものであり、実際には、検索対象データベース31には、各特徴量等を示す数値が登録されるものとする。また、検索対象データベース31には、図4に示す情報以外にも、特徴量と対応する特徴点や、検索対象画像と対応する取引対象に関する各種の情報等、任意の情報が登録されていてよい。 It should be noted that the various values shown in FIG. 4 are conceptual, and in reality, numerical values indicating each feature amount and the like are registered in the search target database 31. Further, in the search target database 31, in addition to the information shown in FIG. 4, arbitrary information such as feature points corresponding to the feature amount and various information regarding the transaction target corresponding to the search target image may be registered. ..

図3に戻り、説明を続ける。学習モデル32は、頻出特徴量の特徴を学習した学習モデルである。例えば、学習モデルは、DNNやSVM等、頻出特徴量の特徴を学習した学習モデルの各種パラメータである。 Returning to FIG. 3, the explanation will be continued. The learning model 32 is a learning model that learns the features of the frequent features. For example, the learning model is various parameters of the learning model that has learned the features of the frequent feature quantities such as DNN and SVM.

制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。 The control unit 40 is a controller, and for example, various programs stored in a storage device inside the information providing device 10 by a processor such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit) are RAM or the like. Is realized by executing as a work area. Further, the control unit 40 is a controller, and may be realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図4に示すように、制御部40は、抽出部41、判定部42、計数部43、検索部44、生成部45、および学習部46を有する。 As shown in FIG. 4, the control unit 40 includes an extraction unit 41, a determination unit 42, a counting unit 43, a search unit 44, a generation unit 45, and a learning unit 46.

抽出部41は、クエリ画像または検索対象画像から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量、すなわち、頻出特徴量を抽出する。例えば、抽出部41は、検索対象画像から抽出された特徴量から頻出特徴量を抽出する。 The extraction unit 41 extracts a non-useful feature amount that is not useful for searching for similar information, that is, a frequently-appearing feature amount, from the feature amounts extracted from the query image or the search target image. For example, the extraction unit 41 extracts the frequently-appearing feature amount from the feature amount extracted from the search target image.

また、抽出部41は、検索対象画像から抽出された特徴量のうち、相互に類似する複数の特徴量を頻出特徴量として抽出する。例えば、抽出部41は、検索対象画像のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、頻出特徴量を抽出してもよい。より具体的な例を挙げると、抽出部41は、第1取引対象と関連する情報から抽出された特徴量と、第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、頻出特徴量を抽出してもよい。 Further, the extraction unit 41 extracts a plurality of features that are similar to each other as frequently appearing features among the features extracted from the search target image. For example, the extraction unit 41 may extract frequently-appearing feature amounts based on the comparison results of the feature amounts extracted from the information belonging to different categories in the search target image. To give a more specific example, the extraction unit 41 is extracted from the feature amount extracted from the information related to the first transaction target and the information related to the second transaction target of a type different from the first transaction target. Frequent feature quantities may be extracted based on the comparison result with the feature quantities.

例えば、抽出部41は、所定の情報処理装置(図示は、省略)から検索対象画像を受付けた場合は、検索対象画像の特徴量を抽出し、検索対象画像と各特徴量とを検索対象データベース31に登録する。また、抽出部41は、所定の時間間隔で、検索対象データベース31を参照し、各特徴量の類似特徴量数を参照し、参照した類似特徴量数に基づいて、各特徴量が頻出特徴量であるか否かを判定する。例えば、抽出部41は、類似特徴量数が所定の閾値を超える特徴量や、類似特徴量数が高い方から順に所定の数の特徴量を頻出特徴量として選択する。そして、抽出部41は、頻出特徴量として選択した特徴量に対し、種別「頻出」を対応付け、他の特徴量に対して種別「通常」を対応付ける。すなわち、抽出部41は、計数部43により計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出することとなる。 For example, when the extraction unit 41 receives the search target image from a predetermined information processing device (not shown), the extraction unit 41 extracts the feature amount of the search target image and searches the search target image and each feature amount in the search target database. Register at 31. Further, the extraction unit 41 refers to the search target database 31 at predetermined time intervals, refers to the number of similar features of each feature, and based on the number of referenced similar features, each feature frequently appears. It is determined whether or not it is. For example, the extraction unit 41 selects a predetermined number of features as a frequent feature amount in order from a feature amount in which the number of similar feature amounts exceeds a predetermined threshold value or a feature amount having a higher number of similar feature amounts. Then, the extraction unit 41 associates the type "frequent" with the feature amount selected as the frequent feature amount, and associates the type "normal" with the other feature amounts. That is, the extraction unit 41 extracts the feature amount in which the number of times counted by the counting unit 43 exceeds a predetermined threshold value as the frequent feature amount.

なお、抽出部41は、学習モデル32の学習に用いる頻出特徴量を抽出する場合、類似画像検索を行う際とは異なる閾値で頻出特徴量を抽出してもよい。例えば、抽出部41は、計数部43により計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出し、抽出した特徴量に対し、種別「頻出」を対応付ける。また、抽出部41は、検索対象データベース31に登録された頻出特徴量のうち、計数部43により計数された回数が第1閾値よりも大きい第2閾値以上となる頻出特徴量を第2頻出特徴量として抽出する。そして、抽出部41は、抽出した第2頻出特徴量を学習データとして学習部46に通知する。 In addition, when extracting the frequent feature amount used for learning of the learning model 32, the extraction unit 41 may extract the frequent feature amount with a threshold value different from that when performing a similar image search. For example, the extraction unit 41 extracts a feature amount whose number of times counted by the counting unit 43 is equal to or higher than a predetermined first threshold value as a first frequent feature amount, and associates the extracted feature amount with the type “frequent”. Further, the extraction unit 41 uses the frequently-appearing feature amount registered in the search target database 31 as a frequently-appearing feature amount whose number of times counted by the counting unit 43 is greater than or equal to the second threshold value and is equal to or higher than the second threshold value. Extract as a quantity. Then, the extraction unit 41 notifies the learning unit 46 of the extracted second frequent feature amount as learning data.

なお、抽出部41は、学習部により学習されたモデルを用いて、検索対象画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、抽出部41は、学習モデル32に検索対象画像の各特徴量を入力し、各特徴量が頻出特徴量であるか否かを判定してもよい。また、抽出部41は、学習モデル32を用いて、クエリ画像から抽出された特徴量から頻出特徴量を抽出してもよい。例えば、抽出部41は、クエリ画像を受付けると、クエリ画像から特徴量を抽出する。そして、抽出部41は、抽出した特徴量を学習モデル32に入力し、頻出特徴量であると判定された特徴量以外の特徴量を判定部42に提供してもよい。 The extraction unit 41 may extract the frequently-appearing feature amount from the feature amount extracted from the search target image by using the model learned by the learning unit. For example, the extraction unit 41 may input each feature amount of the search target image into the learning model 32 and determine whether or not each feature amount is a frequent feature amount. Further, the extraction unit 41 may use the learning model 32 to extract frequently occurring features from the features extracted from the query image. For example, when the extraction unit 41 receives the query image, the extraction unit 41 extracts the feature amount from the query image. Then, the extraction unit 41 may input the extracted feature amount into the learning model 32 and provide the determination unit 42 with a feature amount other than the feature amount determined to be a frequent feature amount.

また、抽出部41は、クエリ画像または検索対象画像から抽出された特徴量から、所定の数以下の頻出特徴量を抽出してもよい。例えば、抽出部41は、1つの画像から抽出される特徴量のうち、頻出特徴量以外の特徴量の数が所定の閾値以上となるように、頻出特徴量の抽出を行ってよい。例えば、抽出部41は、類似特徴量数の数がより多い特徴量や、学習モデル32により頻出特徴量である確度がより高いと推定された特徴量を優先的に頻出特徴量としてもよい。また、抽出部41は、検索対象画像から抽出された特徴量が登録された検索対象データベース31から、抽出された頻出特徴量を削除してもよい。 Further, the extraction unit 41 may extract a predetermined number or less of frequent feature quantities from the feature quantities extracted from the query image or the search target image. For example, the extraction unit 41 may extract the frequently appearing feature amount so that the number of the feature amounts other than the frequently appearing feature amount among the feature amounts extracted from one image is equal to or more than a predetermined threshold value. For example, the extraction unit 41 may preferentially set a feature amount having a larger number of similar feature amounts or a feature amount estimated by the learning model 32 to have a higher probability of being a frequent feature amount as a frequent feature amount. Further, the extraction unit 41 may delete the extracted frequently-appearing feature amount from the search target database 31 in which the feature amount extracted from the search target image is registered.

判定部42は、検索対象画像から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する。例えば、判定部42は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象画像から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。 The determination unit 42 determines whether or not the feature amount extracted from the search target image is similar to a plurality of predetermined feature amounts. For example, the determination unit 42 has a plurality of predetermined feature amounts, which are a predetermined number or more of the feature amounts and are generated by a predetermined method and the feature amounts extracted from the search target image. Determine if they are similar. Then, the counting unit 43 counts the determined number of times similar to the predetermined feature amount for each feature amount extracted from the search target image.

例えば、判定部42は、所定のアルゴリズムまたはランダムに特徴量を生成し、生成した特徴量と検索対象データベース31に登録された各特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象データベース31に登録された各特徴量のうち、生成した特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。 For example, the determination unit 42 generates a feature amount by a predetermined algorithm or randomly, and determines whether or not the generated feature amount is similar to each feature amount registered in the search target database 31. Then, the counting unit 43 adds 1 to the number of similar feature quantities of the feature quantities determined to be similar to the generated feature quantity among the feature quantities registered in the search target database 31.

また、判定部42は、検索対象データベース31に登録された各特徴量同士が類似するか否かを判定してもよい。例えば、判定部42は、検索対象データベース31に登録された特徴量のうち、いずれかの特徴量を選択し、選択した特徴量と他の特徴量とが類似するか否かを判定する。そして、計数部43は、選択した特徴量と類似すると判定された他の特徴量の類似特徴量数に1を加算する。 Further, the determination unit 42 may determine whether or not the feature quantities registered in the search target database 31 are similar to each other. For example, the determination unit 42 selects one of the feature amounts registered in the search target database 31, and determines whether or not the selected feature amount is similar to the other feature amount. Then, the counting unit 43 adds 1 to the number of similar feature quantities of other feature quantities determined to be similar to the selected feature quantity.

また、判定部42は、生成部45により生成された類似情報から抽出された特徴量と、検索対象画像から抽出された特徴量とが類似するか否かを判定する。例えば、判定部42は、生成部45により生成された類似情報から抽出された特徴量と、検索対象画像のうち、類似情報を生成した画像とは異なるカテゴリに属する情報から抽出された特徴量とが類似するか否かを判定する。例えば、判定部42は、生成部45により生成された類似画像を取得すると、類似画像の特徴量を抽出する。なお、このような特徴量の抽出は、抽出部41により実現されてもよい。 Further, the determination unit 42 determines whether or not the feature amount extracted from the similar information generated by the generation unit 45 is similar to the feature amount extracted from the search target image. For example, the determination unit 42 includes a feature amount extracted from the similar information generated by the generation unit 45, and a feature amount extracted from information belonging to a category different from the image in which the similar information is generated among the search target images. Determine if they are similar. For example, when the determination unit 42 acquires the similar image generated by the generation unit 45, the determination unit 42 extracts the feature amount of the similar image. The extraction of such a feature amount may be realized by the extraction unit 41.

続いて、判定部42は、検索対象データベース31を参照し、類似画像の元となった検索対象画像のカテゴリを特定する。そして、判定部42は、特定したカテゴリとは異なるカテゴリと対応付けられた検索対象画像の特徴量と、類似画像から抽出した特徴量とが類似するか否かを判定してもよい。このような場合において、計数部43は、類似画像から抽出した特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。 Subsequently, the determination unit 42 refers to the search target database 31 and identifies the category of the search target image that is the source of the similar image. Then, the determination unit 42 may determine whether or not the feature amount of the search target image associated with the category different from the specified category is similar to the feature amount extracted from the similar image. In such a case, the counting unit 43 adds 1 to the number of similar feature quantities of the feature quantity determined to be similar to the feature quantity extracted from the similar image.

また、判定部42は、所定の特徴量として、クエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。例えば、判定部42は、クエリ画像から抽出された特徴量と検索対象データベース31に登録された特徴量とが類似するか否かを判定する。そして、計数部43は、検索対象データベース31に登録された特徴量のうち、クエリ画像から抽出された特徴量と類似すると判定された特徴量の類似特徴量数に1を加算する。 Further, the determination unit 42 may determine, as a predetermined feature amount, whether or not the feature amount extracted from the query image and the feature amount extracted from the search target image are similar to each other. For example, the determination unit 42 determines whether or not the feature amount extracted from the query image is similar to the feature amount registered in the search target database 31. Then, the counting unit 43 adds 1 to the number of similar feature quantities of the feature quantity determined to be similar to the feature quantity extracted from the query image among the feature quantities registered in the search target database 31.

なお、判定部42は、類似画像検索の運用時において受付けたクエリ画像を記憶部30に保持し、所定のタイミングで記憶部30に保持したクエリ画像から抽出された特徴量と検索対象画像から抽出された特徴量とが類似するか否かを判定してもよい。また、判定部42は、類似画像検索の運用時において受付けたクエリ画像と類似する検索対象画像を検索する際に、上述した処理を実行してもよい。 The determination unit 42 holds the query image received during the operation of the similar image search in the storage unit 30, and extracts from the feature amount extracted from the query image held in the storage unit 30 at a predetermined timing and the search target image. It may be determined whether or not the feature quantities are similar to each other. Further, the determination unit 42 may execute the above-mentioned process when searching for a search target image similar to the query image received during the operation of the similar image search.

例えば、判定部42は、類似画像検索の運用時においては、抽出部41により抽出されたクエリ画像の特徴量を受付ける。ここで、抽出部41から受付けた特徴量は、クエリ画像から抽出される全ての特徴量であってもよく、抽出部41によって抽出された頻出特徴量以外の特徴量であってもよい。このような場合、判定部42は、クエリ画像の各特徴量に対して、検索対象データベース31に登録された頻出特徴量以外の特徴量のうち最も類似すると判定された特徴量を対応付ける。この際、計数部43は、クエリ画像の各特徴量に対応付けられた特徴量の類似特徴量数に1を加算する。 For example, the determination unit 42 receives the feature amount of the query image extracted by the extraction unit 41 during the operation of the similar image search. Here, the feature amount received from the extraction unit 41 may be all the feature amounts extracted from the query image, or may be a feature amount other than the frequent feature amount extracted by the extraction unit 41. In such a case, the determination unit 42 associates each feature amount of the query image with the feature amount determined to be the most similar among the feature amounts other than the frequently appearing feature amounts registered in the search target database 31. At this time, the counting unit 43 adds 1 to the number of similar feature quantities of the feature quantities associated with each feature quantity of the query image.

そして、判定部42は、対応付けた特徴量同士の座標関係が類似するか否かを判定する。すなわち、判定部42は、上述した特徴量照合処理と座標照合処理とを実行する。 Then, the determination unit 42 determines whether or not the coordinate relationships between the associated feature quantities are similar. That is, the determination unit 42 executes the feature amount matching process and the coordinate matching process described above.

検索部44は、頻出特徴量以外の特徴量を用いて、クエリ画像と類似する情報を検索する。例えば、検索部44は、判定部42による判定結果に基づいて、クエリ画像と類似する検索対象画像を検索する。例えば、検索部44は、類似画像検索の運用時において、判定部42による特徴量照合処理や座標照合処理の結果を取得する。そして、検索部44は、座標照合処理の結果、類似する特徴量同士の位置関係が類似すると判定された検索対象画像を、クエリ画像と類似する画像として選択する。なお、抽出部41によって類似特徴量数が第1閾値以上となる特徴量が頻出特徴量として抽出されるため、検索部44は、類似特徴量数が第1閾値以上となる特徴量以外の特徴量を用いて、クエリ画像と類似する検索対象画像を検索することとなる。 The search unit 44 searches for information similar to the query image by using a feature amount other than the frequently-appearing feature amount. For example, the search unit 44 searches for a search target image similar to the query image based on the determination result by the determination unit 42. For example, the search unit 44 acquires the results of the feature amount matching process and the coordinate matching process by the determination unit 42 during the operation of the similar image search. Then, the search unit 44 selects an image to be searched, which is determined to have a similar positional relationship between similar feature quantities as a result of the coordinate matching process, as an image similar to the query image. Since the extraction unit 41 extracts the feature amount having the number of similar feature amounts equal to or higher than the first threshold value as the frequent feature amount, the search unit 44 uses the search unit 44 for features other than the feature amount having the similar feature amount number equal to or higher than the first threshold value. The amount is used to search for a search target image similar to the query image.

また、検索部44は、クエリ画像と類似する画像のサムネイル等、各種の情報を配置した検索結果を生成する。そして、検索部44は、クエリ画像の送信元となる端末装置100に対し、生成した検索結果を提供する。 Further, the search unit 44 generates a search result in which various information such as thumbnails of images similar to the query image are arranged. Then, the search unit 44 provides the generated search result to the terminal device 100 that is the source of the query image.

生成部45は、検索対象画像から、類似画像を生成する。例えば、生成部45は、類似画像を用いて頻出特徴量の抽出を行う場合、検索対象データベース31からいずれかの検索対象画像を選択し、各種の画像変換技術を用いて、選択した検索対象画像の類似画像を生成する。そして、生成部45は、生成した類似画像を判定部42に提供する。 The generation unit 45 generates a similar image from the search target image. For example, when the generation unit 45 extracts a frequent feature amount using a similar image, the generation unit 45 selects one of the search target images from the search target database 31 and uses various image conversion techniques to select the selected search target image. Generate a similar image of. Then, the generation unit 45 provides the generated similar image to the determination unit 42.

学習部46は、頻出特徴量が有する特徴をモデルに学習させる。例えば、学習部46は、第2頻出特徴量が有する特徴をモデルに学習させる。例えば、学習部46は、抽出部41により抽出された頻出特徴量の通知を受付けると、通知された頻出特徴量が有する特徴を学習モデル32に学習させる。なお、学習部46は、例えば、頻出特徴量が有する特徴と他の特徴量が有する特徴と差を学習モデル12に学習させてもよい。 The learning unit 46 causes the model to learn the features of the frequent features. For example, the learning unit 46 causes the model to learn the features of the second frequent feature amount. For example, when the learning unit 46 receives the notification of the frequently-appearing feature amount extracted by the extraction unit 41, the learning unit 46 causes the learning model 32 to learn the features of the notified frequent-appearing feature amount. The learning unit 46 may, for example, cause the learning model 12 to learn the difference between the feature possessed by the frequently-appearing feature quantity and the feature possessed by the other feature quantity.

〔3.情報提供装置が実行する処理の流れの一例〕
続いて、図5を用いて、情報提供装置10が実行する処理の流れの一例を説明する。図5は、実施形態に係る情報提供装置が実行する検索処理の流れの一例を示すフローチャートである。
[3. An example of the flow of processing executed by the information providing device]
Subsequently, an example of the flow of processing executed by the information providing device 10 will be described with reference to FIG. FIG. 5 is a flowchart showing an example of the flow of the search process executed by the information providing apparatus according to the embodiment.

例えば、情報提供装置10は、検索対象画像の特徴量と所定の特徴量とを比較し(ステップS101)、特徴量ごとに他の特徴量と類似する数を計数する(ステップS102)。そして、情報提供装置10は、計数した数が所定の閾値を超える特徴量を頻出特徴量として抽出する(ステップS103)。 For example, the information providing device 10 compares the feature amount of the search target image with the predetermined feature amount (step S101), and counts a number similar to other feature amounts for each feature amount (step S102). Then, the information providing device 10 extracts a feature amount whose counted number exceeds a predetermined threshold value as a frequent feature amount (step S103).

ここで、情報提供装置10は、クエリ画像を端末装置100から取得したか否かを判定し(ステップS104)、取得していない場合は(ステップS104:No)、取得するまで待機する。そして、情報提供装置10は、クエリ画像を端末装置100から取得した場合は(ステップS105:Yes)、クエリ画像の特徴量と頻出特徴量以外の特徴量とを比較し(ステップS105)、比較結果に基づいて、クエリ画像に類似する画像を検索対象画像から検索し(ステップS106)、処理を終了する。 Here, the information providing device 10 determines whether or not the query image has been acquired from the terminal device 100 (step S104), and if not (step S104: No), waits until the query image is acquired. Then, when the query image is acquired from the terminal device 100 (step S105: Yes), the information providing device 10 compares the feature amount of the query image with the feature amount other than the frequent feature amount (step S105), and the comparison result. Based on the above, an image similar to the query image is searched from the search target image (step S106), and the process is terminated.

〔4.変形例〕
上記では、情報提供装置10による検索処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、検索処理のバリエーションについて説明する。
[4. Modification example]
In the above, an example of the search process by the information providing device 10 has been described. However, the embodiments are not limited to this. Hereinafter, variations of the search process will be described.

〔4-1.特徴量の比較について〕
上述した例では、情報提供装置10は、クエリ情報の特徴量と、検索対象となる情報(以下、「対象情報」と記載する場合がある。)のクエリ特徴量とを比較した。ここで、情報提供装置10は、任意の情報が有する特徴量を特徴量としてもよい。例えば、情報提供装置10は、検索対象が画像である場合、特徴点の周囲の画素の彩度や明度の平均値等を特徴量としてもよく、検索対象が音声である場合、特徴点の周囲数秒の周囲の周波数特性を特徴量としてもよい。また、上述した処理以外にも、情報提供装置10は、任意の特徴量比較技術を併用してもよい。
[4-1. Comparison of features]
In the above-mentioned example, the information providing device 10 compares the feature amount of the query information with the query feature amount of the information to be searched (hereinafter, may be referred to as “target information”). Here, the information providing device 10 may use a feature amount of arbitrary information as a feature amount. For example, when the search target is an image, the information providing device 10 may use the average value of the saturation and brightness of the pixels around the feature point as the feature quantity, and when the search target is voice, the periphery of the feature point. A frequency characteristic around several seconds may be used as a feature quantity. In addition to the above-mentioned processing, the information providing device 10 may also use an arbitrary feature amount comparison technique.

〔4-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-2. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, and conversely, the processes described as being manually performed. It is also possible to automatically perform all or part of the above by a known method. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.

また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.

〔4-3.プログラム〕
また、上述した実施形態に係る情報提供装置10および端末装置100は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-3. program〕
Further, the information providing device 10 and the terminal device 100 according to the above-described embodiment are realized by, for example, a computer 1000 having a configuration as shown in FIG. FIG. 6 is a diagram showing an example of a hardware configuration. The computer 1000 is connected to the output device 1010 and the input device 1020, and the arithmetic unit 1030, the primary storage device 1040, the secondary storage device 1050, the output IF (Interface) 1060, the input IF 1070, and the network IF 1080 are connected by the bus 1090. Have.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。 The arithmetic unit 1030 operates based on a program stored in the primary storage device 1040 or the secondary storage device 1050, a program read from the input device 1020, or the like, and executes various processes. The primary storage device 1040 is a memory device that temporarily stores data used by the arithmetic unit 1030 for various operations such as RAM. Further, the secondary storage device 1050 is a storage device in which data used by the calculation device 1030 for various calculations and various databases are registered, such as a ROM (Read Only Memory), an HDD (Hard Disk Drive), and a flash memory. Is realized by.

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various information such as a monitor and a printer. For example, USB (Universal Serial Bus), DVI (Digital Visual Interface), and the like. It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, a scanner, and the like, and is realized by, for example, USB.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 The input device 1020 is, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), a PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Further, the input device 1020 may be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 The network IF 1080 receives data from another device via the network N and sends it to the arithmetic unit 1030, and also transmits the data generated by the arithmetic unit 1030 to the other device via the network N.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 The arithmetic unit 1030 controls the output device 1010 and the input device 1020 via the output IF 1060 and the input IF 1070. For example, the arithmetic unit 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。また、例えば、コンピュータ1000が端末装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。 For example, when the computer 1000 functions as the information providing device 10, the arithmetic unit 1030 of the computer 1000 realizes the function of the control unit 40 by executing the program loaded on the primary storage device 1040. Further, for example, when the computer 1000 functions as the terminal device 100, the arithmetic unit 1030 of the computer 1000 realizes the function of the control unit 40 by executing the program loaded on the primary storage device 1040.

〔5.効果〕
上述したように、情報提供装置10は、クエリ画像等のクエリ情報または検索対象画像等の検索対象となる情報から抽出された特徴量のうち、頻出特徴量等、類似する情報の検索に有用ではない非有用特徴量を抽出する。そして、情報提供装置10は、抽出された頻出特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する。この結果、情報提供装置10は、類似情報の検索精度を向上させるとともに、類似情報の検索に要する時間が検索コストを削減するので、情報検索における効率を改善できる。
[5. effect〕
As described above, the information providing device 10 is not useful for searching for similar information such as a frequent feature amount among the feature amounts extracted from the query information such as a query image or the information to be searched such as a search target image. Extract no non-useful feature quantities. Then, the information providing device 10 searches for information similar to the query information by using the feature amount other than the extracted frequent feature amount. As a result, the information providing device 10 improves the search accuracy of similar information and reduces the search cost in the time required for searching for similar information, so that the efficiency in information retrieval can be improved.

また、情報提供装置10は、検索対象となる情報から抽出された特徴量から頻出特徴量を抽出する。また、情報提供装置10は、検索対象となる情報から抽出された特徴量のうち、相互に類似する複数の特徴量を頻出特徴量として抽出する。例えば、情報提供装置10は、検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似する判定された回数を計数する。そして、情報提供装置10は、計数された回数が所定の閾値を超える特徴量を頻出特徴量として抽出する。このため、情報提供装置10は、情報検索に有用ではない頻出特徴量を適切に抽出できる。 Further, the information providing device 10 extracts the frequently appearing feature amount from the feature amount extracted from the information to be searched. Further, the information providing device 10 extracts a plurality of features that are similar to each other as frequently appearing features among the features extracted from the information to be searched. For example, the information providing device 10 determines whether or not the feature amount extracted from the information to be searched is similar to a plurality of predetermined feature amounts. Further, the information providing device 10 counts a determined number of times similar to a predetermined feature amount for each feature amount extracted from the information to be searched. Then, the information providing device 10 extracts a feature amount in which the number of times counted exceeds a predetermined threshold value as a frequent feature amount. Therefore, the information providing device 10 can appropriately extract frequently-appearing feature quantities that are not useful for information retrieval.

また、情報提供装置10は、複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、検索対象となる情報から抽出された特徴量とが類似するか否かを判定する。また、情報提供装置10は、検索対象となる情報から、その情報と類似する類似情報を生成し、生成された類似情報から抽出された特徴量と、検索対象となる情報から抽出された特徴量とが類似するか否かを判定する。ここで、情報提供装置10は、生成された類似情報から抽出された特徴量と、検索対象となる情報のうち、類似情報を生成した情報とは異なるカテゴリに属する情報から抽出された特徴量とが類似するか否かを判定してもよい。また、情報提供装置10は、複数の検索対象となる情報から抽出された特徴量同士が類似するか否かを判定してもよい。また、情報提供装置10は、所定の特徴量として、クエリ情報から抽出された特徴量と検索対象となる情報から抽出された特徴量とが類似するか否かを判定してもよい。このような処理を実行することで、情報提供装置10は、情報検索に有用ではない頻出特徴量を適切に抽出できるので、情報検索の効率を改善できる。 Further, the information providing device 10 has a plurality of predetermined feature quantities, which are a predetermined number or more of the feature quantities, and are the feature quantities generated by a predetermined method and the features extracted from the information to be searched. Determine if the quantity is similar. Further, the information providing device 10 generates similar information similar to the information from the information to be searched, and the feature amount extracted from the generated similar information and the feature amount extracted from the information to be searched. Determine if and are similar. Here, the information providing device 10 includes a feature amount extracted from the generated similar information and a feature amount extracted from information belonging to a category different from the information that generated the similar information among the information to be searched. May be determined whether or not they are similar. Further, the information providing device 10 may determine whether or not the feature quantities extracted from the information to be searched are similar to each other. Further, the information providing device 10 may determine whether or not the feature amount extracted from the query information and the feature amount extracted from the information to be searched are similar to each other as a predetermined feature amount. By executing such a process, the information providing device 10 can appropriately extract frequently-appearing feature quantities that are not useful for information retrieval, so that the efficiency of information retrieval can be improved.

また、情報提供装置10は、索対象となる情報から抽出された特徴量が登録された記憶装置から、抽出部により抽出された頻出特徴量を削除する。この結果、情報提供装置10は、情報検索における効率を改善できる。 Further, the information providing device 10 deletes the frequently-appearing feature amount extracted by the extraction unit from the storage device in which the feature amount extracted from the information to be searched is registered. As a result, the information providing device 10 can improve the efficiency in information retrieval.

また、情報提供装置10は、クエリ情報または検索対象となる情報から抽出された特徴量から、所定の数以下の頻出特徴量を抽出する。このため、情報提供装置10は、情報検索における精度の悪化を防ぎつつ、情報検索の効率を改善できる。 Further, the information providing device 10 extracts frequently appearing feature quantities of a predetermined number or less from the feature quantities extracted from the query information or the information to be searched. Therefore, the information providing device 10 can improve the efficiency of information retrieval while preventing deterioration of accuracy in information retrieval.

また、情報提供装置10は、抽出された頻出特徴量が有する特徴をモデルに学習させる。そして、情報提供装置10は、学習されたモデルを用いて、クエリ情報から抽出された特徴量から頻出特徴量を抽出する。また、情報提供装置10は、学習されたモデルを用いて、検索対象となる情報から抽出された特徴量から頻出特徴量を抽出する。このため、情報提供装置10は、情報検索の効率を改善できる。 Further, the information providing device 10 causes the model to learn the features of the extracted frequent feature quantities. Then, the information providing device 10 uses the trained model to extract the frequently-appearing feature amount from the feature amount extracted from the query information. Further, the information providing device 10 uses the learned model to extract the frequently-appearing feature amount from the feature amount extracted from the information to be searched. Therefore, the information providing device 10 can improve the efficiency of information retrieval.

また、情報提供装置10は、検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定し、検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似すると判定された回数を計数し、計数された回数が所定の第1閾値以上となる特徴量を第1頻出特徴量として抽出するとともに、計数された回数が第1閾値よりも大きい第2閾値以上となる特徴量を第2頻出特徴量として抽出する。そして、情報提供装置10は、第1頻出特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索し、第2頻出特徴量が有する特徴をモデルに学習させる。このため、情報提供装置10は、精度良く頻出特徴量を抽出可能なモデルを学習することができる。 Further, the information providing device 10 determines whether or not the feature amount extracted from the information to be searched is similar to a plurality of predetermined feature amounts, and for each feature amount extracted from the information to be searched. In addition, the number of times determined to be similar to the predetermined feature amount is counted, and the feature amount having the counted number of times equal to or higher than the predetermined first threshold value is extracted as the first frequent feature amount, and the counted number of times is the first. A feature amount having a second threshold value larger than the threshold value and equal to or higher than the second threshold value is extracted as a second frequent feature amount. Then, the information providing device 10 searches for information similar to the query information using a feature amount other than the first frequent feature amount, and causes the model to learn the feature of the second frequent feature amount. Therefore, the information providing device 10 can learn a model capable of extracting frequently occurring features with high accuracy.

また、情報提供装置10は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、頻出特徴量を抽出する。例えば、情報提供装置10は、第1取引対象と関連する情報から抽出された特徴量と、その第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、頻出特徴量を抽出する。このため、情報提供装置10は、情報検索に有用な特徴量を保持しつつ、有用ではない特徴量を頻出特徴量とすることができるので、情報検索の効率を改善できる。 Further, the information providing device 10 extracts the frequently-appearing feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories among the information to be searched. For example, the information providing device 10 has a feature amount extracted from information related to the first transaction target and a feature amount extracted from information related to a second transaction target of a type different from the first transaction target. Frequent features are extracted based on the comparison results. Therefore, the information providing device 10 can improve the efficiency of information retrieval because the feature quantity that is not useful can be used as the frequent feature quantity while retaining the feature quantity that is useful for information retrieval.

また、情報提供装置10は、クエリ画像、または、検索対象となる画像から抽出された特徴量のうち、類似する画像の検索に有用ではない頻出特徴量を抽出する。このため、情報提供装置10は、類似画像検索の効率を改善できる。 Further, the information providing device 10 extracts frequently-used feature amounts that are not useful for searching for similar images from the feature amounts extracted from the query image or the image to be searched. Therefore, the information providing device 10 can improve the efficiency of similar image retrieval.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.

また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、抽出部は、抽出手段や抽出回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the extraction unit can be read as an extraction means or an extraction circuit.

10 情報提供装置
20 通信部
30 記憶部
31 検索対象データベース
32 学習モデル
40 制御部
41 抽出部
42 判定部
43 計数部
44 検索部
45 生成部
46 学習部
100 端末装置
10 Information providing device 20 Communication unit 30 Storage unit 31 Search target database 32 Learning model 40 Control unit 41 Extraction unit 42 Judgment unit 43 Counting unit 44 Search unit 45 Generation unit 46 Learning unit 100 Terminal device

Claims (23)

クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有し、
前記抽出部は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索装置。
Of the feature quantities extracted from the query information or the information to be searched, the extraction unit that extracts the non-useful feature quantities that are not useful for searching similar information, and the extraction unit.
It has a search unit that searches for information similar to query information by using a feature amount other than the non-useful feature amount extracted by the extraction unit.
The extraction unit extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search device characterized by that.
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有し、
前記抽出部は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索装置。
Of the feature quantities extracted from the query information or the information to be searched, the extraction unit that extracts the non-useful feature quantities that are not useful for searching similar information, and the extraction unit.
A search unit that searches for information similar to query information using features other than the non-useful features extracted by the extraction unit.
Have,
The extraction unit is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
A search device characterized by that.
前記抽出部は、検索対象となる情報から抽出された特徴量から前記非有用特徴量を抽出する
ことを特徴とする請求項1または2に記載の検索装置。
The search device according to claim 1 or 2 , wherein the extraction unit extracts the non-useful feature amount from the feature amount extracted from the information to be searched.
前記抽出部は、前記検索対象となる情報から抽出された特徴量のうち、相互に類似する複数の特徴量を前記非有用特徴量として抽出する
ことを特徴とする請求項に記載の検索装置。
The search device according to claim 3 , wherein the extraction unit extracts a plurality of feature quantities similar to each other as the non-useful feature quantities among the feature quantities extracted from the information to be searched. ..
前記検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する判定部と、
前記検索対象となる情報から抽出された特徴量ごとに、前記所定の特徴量と類似する判定された回数を計数する計数部と
を有し、
前記抽出部は、前記計数部により計数された回数が所定の閾値を超える特徴量を前記非有用特徴量として抽出する
ことを特徴とする請求項またはに記載の検索装置。
A determination unit for determining whether or not the feature amount extracted from the information to be searched is similar to a plurality of predetermined feature amounts.
For each feature amount extracted from the information to be searched, it has a counting unit for counting a determined number of times similar to the predetermined feature amount.
The search device according to claim 3 or 4 , wherein the extraction unit extracts a feature amount whose number of times counted by the counting unit exceeds a predetermined threshold value as the non-useful feature amount.
前記判定部は、前記複数の所定の特徴量として、所定の数以上の特徴量であって、予め定められた手法により生成された特徴量と、前記検索対象となる情報から抽出された特徴量とが類似するか否かを判定する
ことを特徴とする請求項に記載の検索装置。
The determination unit is a plurality of predetermined feature quantities, which are a predetermined number or more of the feature quantities and are generated by a predetermined method and the feature quantities extracted from the information to be searched. The search device according to claim 5 , wherein it is determined whether or not the two are similar to each other.
前記検索対象となる情報から、当該情報と類似する類似情報を生成する生成部
を有し、
前記判定部は、前記生成部により生成された類似情報から抽出された特徴量と、前記検索対象となる情報から抽出された特徴量とが類似するか否かを判定する
ことを特徴とする請求項またはに記載の検索装置。
It has a generator that generates similar information similar to the information from the information to be searched.
The determination unit is characterized in that it determines whether or not the feature amount extracted from the similar information generated by the generation unit is similar to the feature amount extracted from the information to be searched. Item 5. The search device according to item 5 or 6 .
検索対象となる情報から、当該情報と類似する類似情報を生成する生成部と、
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定部と、
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数部と、
前記検索対象となる情報から抽出された特徴量のうち、前記計数部により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出部と、
前記抽出部により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索部と
を有することを特徴とする検索装置。
A generator that generates similar information similar to the information from the information to be searched,
A determination unit for determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
For each feature amount extracted from the information to be searched, a counting unit for counting the number of times determined to be similar to other feature amounts, and a counting unit.
Of the features extracted from the information to be searched, the features whose number of times counted by the counting unit exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Department and
A search unit that searches for information similar to query information using features other than the non-useful features extracted by the extraction unit.
A search device characterized by having .
前記判定部は、複数の前記検索対象となる情報から抽出された特徴量同士が類似するか否かを判定する
ことを特徴とする請求項のうちいずれか1つに記載の検索装置。
The search device according to any one of claims 5 to 8 , wherein the determination unit determines whether or not the feature amounts extracted from the plurality of search target information are similar to each other. ..
前記判定部は、クエリ情報から抽出された特徴量と前記検索対象となる情報から抽出された特徴量とが類似するか否かを判定する
ことを特徴とする請求項のうちいずれか1つに記載の検索装置。
Any of claims 5 to 9 , wherein the determination unit determines whether or not the feature amount extracted from the query information is similar to the feature amount extracted from the information to be searched. The search device described in one.
検索対象となる情報から抽出された特徴量が登録された記憶装置から、前記抽出部により抽出された非有用特徴量を削除する削除部
を有することを特徴とする請求項10のうちいずれか1つに記載の検索装置。
Any of claims 3 to 10 , wherein the storage device has a deletion unit for deleting the non-useful feature amount extracted by the extraction unit from the storage device in which the feature amount extracted from the information to be searched is registered. The search device described in one.
前記抽出部は、クエリ情報または検索対象となる情報から抽出された特徴量から、所定の数以下の前記非有用特徴量を抽出する
ことを特徴とする請求項1~1のうちいずれか1つに記載の検索装置。
One of claims 1 to 1 is characterized in that the extraction unit extracts the non-useful feature amount of a predetermined number or less from the feature amount extracted from the query information or the information to be searched. The search device described in one.
前記抽出部により抽出された非有用特徴量が有する特徴をモデルに学習させる学習部
を有することを特徴とする請求項1~1のうちいずれか1つに記載の検索装置。
The search device according to any one of claims 1 to 12, wherein the search device has a learning unit that allows a model to learn the characteristics of the non-useful feature amount extracted by the extraction unit.
前記抽出部は、前記学習部により学習されたモデルを用いて、前記クエリ情報から抽出された特徴量から前記非有用特徴量を抽出する
ことを特徴とする請求項1に記載の検索装置。
The search device according to claim 13 , wherein the extraction unit extracts the non-useful feature amount from the feature amount extracted from the query information by using the model learned by the learning unit.
前記抽出部は、前記学習部により学習されたモデルを用いて、前記検索対象となる情報から抽出された特徴量から前記非有用特徴量を抽出する
ことを特徴とする請求項1または1に記載の検索装置。
Claim 1 3 or 14 characterized in that the extraction unit extracts the non-useful feature amount from the feature amount extracted from the information to be searched by using the model learned by the learning unit. The search device described in.
検索対象となる情報から抽出された特徴量と、複数の所定の特徴量とが類似するか否かを判定する判定部と、
前記検索対象となる情報から抽出された特徴量ごとに、所定の特徴量と類似すると判定された回数を計数する計数部と
を有し、
前記抽出部は、前記計数部により計数された回数が所定の第1閾値以上となる特徴量を第1非有用特徴量として抽出するとともに、前記計数部により計数された回数が前記第1閾値よりも大きい第2閾値以上となる特徴量を第2非有用特徴量として抽出し、
前記検索部は、前記第1非有用特徴量以外の特徴量を用いて、前記クエリ情報と類似する情報を検索し、
前記学習部は、前記第2非有用特徴量が有する特徴を前記モデルに学習させる
ことを特徴とする請求項1~1のうちいずれか1つに記載の検索装置。
A determination unit for determining whether or not the feature amount extracted from the information to be searched and a plurality of predetermined feature amounts are similar, and
For each feature amount extracted from the information to be searched, it has a counting unit for counting the number of times determined to be similar to the predetermined feature amount.
The extraction unit extracts a feature amount whose number of times counted by the counting unit is equal to or greater than a predetermined first threshold value as a first non-useful feature amount, and the number of times counted by the counting unit is from the first threshold value. A feature amount having a large second threshold value or more is extracted as a second non-useful feature amount.
The search unit searches for information similar to the query information using a feature amount other than the first non-useful feature amount.
The search device according to any one of claims 1 to 15 , wherein the learning unit causes the model to learn the features of the second non-useful feature amount.
前記抽出部は、クエリ画像、または、検索対象となる画像から抽出された特徴量のうち、類似する画像の検索に有用ではない非有用特徴量を抽出する
ことを特徴とする請求項1~1のうちいずれか1つに記載の検索装置。
Claims 1 to 1 are characterized in that the extraction unit extracts a non-useful feature amount that is not useful for searching a similar image from the feature amounts extracted from the query image or the image to be searched. The search device according to any one of 6 .
検索装置が実行する検索方法であって、
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と
を含み、
前記抽出工程は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索方法。
It is a search method executed by the search device.
Of the feature quantities extracted from the query information or the information to be searched, the extraction process for extracting non-useful feature quantities that are not useful for searching similar information, and
Including a search step of searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
The extraction step extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search method characterized by that.
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出手順と、
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と
をコンピュータに実行させるための検索プログラムであって、
前記抽出手順は、検索対象となる情報のうち、相互に異なるカテゴリに属する情報から抽出された特徴量同士の比較結果に基づいて、前記非有用特徴量を抽出する
ことを特徴とする検索プログラム
Extraction procedure for extracting non-useful features that are not useful for searching similar information from the features extracted from query information or information to be searched, and
It is a search program for causing a computer to execute a search procedure for searching information similar to query information by using a feature amount other than the non-useful feature amount extracted by the extraction procedure .
The extraction procedure extracts the non-useful feature amount based on the comparison result between the feature amounts extracted from the information belonging to different categories from the information to be searched.
A search program that features that .
検索装置が実行する検索方法であって、 It is a search method executed by the search device.
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、 Of the feature quantities extracted from the query information or the information to be searched, the extraction process for extracting non-useful feature quantities that are not useful for searching similar information, and
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と A search step for searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
を含み、 Including
前記抽出工程は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する The extraction step is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
ことを特徴とする検索方法。 A search method characterized by that.
クエリ情報または検索対象となる情報から抽出された特徴量のうち、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出手順と、 Extraction procedure for extracting non-useful features that are not useful for searching similar information from the features extracted from query information or information to be searched, and
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と A search procedure for searching for information similar to query information using features other than the non-useful features extracted by the extraction procedure.
をコンピュータに実行させるための検索プログラムであって、 Is a search program that allows a computer to run
前記抽出手順は、第1取引対象と関連する情報から抽出された特徴量と、当該第1取引対象とは異なる種別の第2取引対象と関連する情報から抽出された特徴量との比較結果に基づいて、前記非有用特徴量を抽出する The extraction procedure is based on the comparison result between the feature amount extracted from the information related to the first transaction target and the feature amount extracted from the information related to the second transaction target of a type different from the first transaction target. Based on this, the non-useful features are extracted.
ことを特徴とする検索プログラム。 A search program that features that.
検索装置が実行する検索方法であって、 It is a search method executed by the search device.
検索対象となる情報から、当該情報と類似する類似情報を生成する生成工程と、 A generation process that generates similar information similar to the information from the information to be searched,
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定工程と、 A determination step of determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数工程と、 For each feature amount extracted from the information to be searched, a counting step for counting the number of times determined to be similar to other feature amounts, and
前記検索対象となる情報から抽出された特徴量のうち、前記計数工程により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出工程と、 Of the features extracted from the information to be searched, the features whose number of times counted by the counting step exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Process and
前記抽出工程により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索工程と A search step for searching for information similar to query information using a feature amount other than the non-useful feature amount extracted by the extraction step.
を含むことを特徴とする検索方法。 A search method characterized by including.
検索対象となる情報から、当該情報と類似する類似情報を生成する生成手順と、 A generation procedure for generating similar information similar to the information to be searched, and a generation procedure.
前記検索対象となる情報から抽出された特徴量と、前記類似情報を生成した情報とは異なるカテゴリに属する複数の情報から抽出された特徴量とが類似するか否かを判定する判定手順と、 A determination procedure for determining whether or not the feature amount extracted from the information to be searched is similar to the feature amount extracted from a plurality of information belonging to a category different from the information that generated the similar information.
前記検索対象となる情報から抽出された特徴量ごとに、他の特徴量と類似すると判定された回数を計数する計数手順と、 For each feature amount extracted from the information to be searched, a counting procedure for counting the number of times determined to be similar to other feature amounts, and a counting procedure.
前記検索対象となる情報から抽出された特徴量のうち、前記計数手順により計数された回数が所定の閾値を超える特徴量を、類似する情報の検索に有用ではない非有用特徴量を抽出する抽出手順と、 Of the features extracted from the information to be searched, the features whose number of times counted by the counting procedure exceeds a predetermined threshold are extracted, and the non-useful features that are not useful for searching similar information are extracted. Procedure and
前記抽出手順により抽出された非有用特徴量以外の特徴量を用いて、クエリ情報と類似する情報を検索する検索手順と A search procedure for searching for information similar to query information using features other than the non-useful features extracted by the extraction procedure.
をコンピュータに実行させるための検索プログラム。 A search program that lets your computer run.
JP2018047701A 2018-03-15 2018-03-15 Search device, search method and search program Active JP6997656B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018047701A JP6997656B2 (en) 2018-03-15 2018-03-15 Search device, search method and search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018047701A JP6997656B2 (en) 2018-03-15 2018-03-15 Search device, search method and search program

Publications (2)

Publication Number Publication Date
JP2019160000A JP2019160000A (en) 2019-09-19
JP6997656B2 true JP6997656B2 (en) 2022-01-17

Family

ID=67992616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018047701A Active JP6997656B2 (en) 2018-03-15 2018-03-15 Search device, search method and search program

Country Status (1)

Country Link
JP (1) JP6997656B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7298952B1 (en) 2022-02-28 2023-06-27 Necプラットフォームズ株式会社 Image determination device, traffic management device, and image determination method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010084713A1 (en) 2009-01-23 2010-07-29 日本電気株式会社 Image identifier extracting apparatus
US20140193077A1 (en) 2013-01-08 2014-07-10 Canon Kabushiki Kaisha Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program
JP2014134860A (en) 2013-01-08 2014-07-24 Canon Inc Image retrieval device, image retrieval method, retrieval original image providing device, retrieval original image providing method and program
JP2014215929A (en) 2013-04-29 2014-11-17 株式会社AppReSearch Commodity information server, user terminal, commodity information providing method, and program for commodity information server
JP2015143951A (en) 2014-01-31 2015-08-06 オムロン株式会社 Object discrimination device, image sensor and object discrimination method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010084713A1 (en) 2009-01-23 2010-07-29 日本電気株式会社 Image identifier extracting apparatus
US20140193077A1 (en) 2013-01-08 2014-07-10 Canon Kabushiki Kaisha Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program
JP2014134860A (en) 2013-01-08 2014-07-24 Canon Inc Image retrieval device, image retrieval method, retrieval original image providing device, retrieval original image providing method and program
JP2014215929A (en) 2013-04-29 2014-11-17 株式会社AppReSearch Commodity information server, user terminal, commodity information providing method, and program for commodity information server
JP2015143951A (en) 2014-01-31 2015-08-06 オムロン株式会社 Object discrimination device, image sensor and object discrimination method

Also Published As

Publication number Publication date
JP2019160000A (en) 2019-09-19

Similar Documents

Publication Publication Date Title
JP6141305B2 (en) Image search
US9940552B1 (en) Sublinear time classification via feature padding and hashing
US20170091308A1 (en) Object indexing method, object searching method, and object indexing system
US9691004B2 (en) Device and method for service provision according to prepared reference images to detect target object
JP6767342B2 (en) Search device, search method and search program
JP6491262B2 (en) model
CN111062426A (en) Method, device, electronic equipment and medium for establishing training set
US9734434B2 (en) Feature interpolation
JP7354014B2 (en) Information processing device, information processing method, and information processing program
CN107577943B (en) Sample prediction method and device based on machine learning and server
JP6997656B2 (en) Search device, search method and search program
CN111488479B (en) Hypergraph construction method and device, computer system and medium
US10509986B2 (en) Image similarity determination apparatus and image similarity determination method
JP6974222B2 (en) Search device, search method and search program
JP6705763B2 (en) Generation device, generation method, and generation program
CN113343033B (en) Video searching method and device, computer equipment and storage medium
JP7088665B2 (en) Search device, search method and search program
JP7091055B2 (en) Search device, search method and search program
JP6756648B2 (en) Generator, generation method and generation program
JP7017478B2 (en) Output device, output method and output program
JP7044677B2 (en) Judgment device, judgment method and judgment program
JP7161002B1 (en) Information processing device, information processing method and information processing program
JP7212728B1 (en) Information processing device, information processing method and information processing program
JP7179705B2 (en) Information processing device, information processing method and information processing program
JP6485072B2 (en) Image search apparatus, image search method, and image search program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211217

R150 Certificate of patent or registration of utility model

Ref document number: 6997656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350