JP5970512B2 - Information processing method, information processing apparatus, and program - Google Patents
Information processing method, information processing apparatus, and program Download PDFInfo
- Publication number
- JP5970512B2 JP5970512B2 JP2014197073A JP2014197073A JP5970512B2 JP 5970512 B2 JP5970512 B2 JP 5970512B2 JP 2014197073 A JP2014197073 A JP 2014197073A JP 2014197073 A JP2014197073 A JP 2014197073A JP 5970512 B2 JP5970512 B2 JP 5970512B2
- Authority
- JP
- Japan
- Prior art keywords
- interest
- point
- points
- sample
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 49
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000001514 detection method Methods 0.000 claims description 53
- 230000007717 exclusion Effects 0.000 claims description 45
- 238000000034 method Methods 0.000 description 31
- 230000004044 response Effects 0.000 description 30
- 238000012545 processing Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 230000001186 cumulative effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
この発明は、情報処理方法、情報処理装置、及びプログラムに関する。 The present invention relates to an information processing method, an information processing apparatus, and a program.
カメラ撮影等で得られた画像(以下、対象画像と称する)に対して、予め用意した複数の候補画像の中から類似した画像を検索するための、映像処理技術が研究開発されている。 A video processing technique for searching for a similar image from a plurality of candidate images prepared in advance for an image obtained by camera photography (hereinafter referred to as a target image) has been researched and developed.
一般的には、予め候補画像に対して画像特徴量を記述しておき、検索時に対象画像に対しても画像特徴量を算出して、それら画像特徴量の類似度を計測することで類似した候補画像を決定することが行われる。画像特徴量の算出においては、画像中の特徴的な箇所を関心点として検出し、関心点近傍における画像信号の変化量を特徴量記述子として得ることが行われる。このとき特徴量記述子は複数の数値により構成され、特徴量空間におけるベクトル量として扱うことができる。 In general, image feature amounts are described in advance for candidate images, image feature amounts are calculated for target images at the time of retrieval, and similarity is measured by measuring the similarity between these image feature amounts. A candidate image is determined. In the calculation of the image feature amount, a characteristic portion in the image is detected as a point of interest, and a change amount of the image signal in the vicinity of the point of interest is obtained as a feature amount descriptor. At this time, the feature descriptor is composed of a plurality of numerical values, and can be handled as a vector quantity in the feature quantity space.
特徴量記述子を得る従来方法としては、画像にあるデジタルフィルタを適用して所定の条件を満たす箇所を関心点として検出し、関心点近傍に他のデジタルフィルタを適用して関心点の方向を決定し、関心点を原点として関心点の方向を軸とした座標空間におけるデジタルフィルタ応答の群を特徴量記述子として算出する方法がある。 As a conventional method for obtaining a feature descriptor, a digital filter in an image is applied to detect a point satisfying a predetermined condition as a point of interest, and another digital filter is applied in the vicinity of the point of interest to determine the direction of the point of interest. There is a method in which a group of digital filter responses in a coordinate space with the point of interest as the origin and the direction of the point of interest as an axis is calculated as a feature descriptor.
また、関心点の検出に関する従来の方法としては、関心点に求められる特徴(対象画像や候補画像それぞれにおいて、同等な点が同等に選択される)に基づいて、画像内のx軸、y軸およびスケール次元で構成する3次元空間から、例えばヘッセの行列式の最小検査によって関心点を検出する方法がある。以下、このような関心点を検出する方法を関心点検出ステップと称して説明する。 In addition, as a conventional method related to interest point detection, an x-axis and a y-axis in an image are based on characteristics required for the interest point (equivalent points are selected equally in each of the target image and the candidate image). In addition, there is a method for detecting a point of interest from a three-dimensional space composed of scale dimensions, for example, by a minimum check of Hessian determinant. Hereinafter, such a method for detecting a point of interest will be described as a point of interest detection step.
関心点の方向を決定する従来の方法としては、関心点を取り囲む領域内に設けられた複数タイルに基づいて関心点の方向を決定する方法がある。なお、複数タイルには、複数の画素が含まれる。この方法では、具体的には、複数タイルに対し、x方向とy方向のデジタルフィルタを適用し、コントラスト関連の応答を生成(つまり各タイルからx方向成分及びy方向成分を持つベクトルを算出)する。そして、各タイルから算出されたベクトルを向き決定ウィンドウ毎に合成する。この合成されたベクトルの中から、最大ベクトルを選択することで関心点の方向を決定する。なお、ここで言うタイルとは、以下で説明する標本点が含まれる方向算出範囲内の画像(の部分領域)に相当する概念である。 As a conventional method for determining the direction of the point of interest, there is a method for determining the direction of the point of interest based on a plurality of tiles provided in a region surrounding the point of interest. A plurality of tiles include a plurality of pixels. Specifically, in this method, digital filters in the x and y directions are applied to a plurality of tiles to generate a contrast-related response (that is, a vector having an x direction component and a y direction component is calculated from each tile). To do. Then, the vector calculated from each tile is synthesized for each orientation determination window. The direction of the point of interest is determined by selecting the maximum vector from the synthesized vectors. In addition, the tile mentioned here is a concept corresponding to an image (partial region) within a direction calculation range including a sample point described below.
そのデジタルフィルタの適用としては、積分画像上の該当するタイルへ、x方向とy方向のボックスフィルタそれぞれを適用する方法がある(特許文献1参照)。 As an application of the digital filter, there is a method in which box filters in the x direction and the y direction are applied to corresponding tiles on the integral image (see Patent Document 1).
従来の方法では、関心点の方向を決定した後において、関心点が周辺に固まって算出される場合があり、さらにそれらの関心点の方向が類似してしまう場合があった。この際、類似した特徴量記述子を持つ複数の関心点が固まって選出される場合(つまり複数の互いに区別できない関心点が選出される場合)がある。このような場合、例えば、対象画像の複数の関心点が、候補画像の一つの関心点と類似することになり、複数の候補画像から対象画像に対応する画像を精度よく検索することができないという問題が発生することがある。 In the conventional method, after the direction of the interest point is determined, the interest point may be calculated around the periphery, and the direction of the interest point may be similar. At this time, there are cases where a plurality of points of interest having similar feature descriptors are selected together (that is, a plurality of points of interest that cannot be distinguished from each other are selected). In such a case, for example, a plurality of points of interest in the target image are similar to a single point of interest in the candidate image, and an image corresponding to the target image cannot be accurately searched from the plurality of candidate images. Problems can occur.
そこで本発明は、上記従来技術の問題に鑑みてなされたものであり、対象画像に対応する画像を精度よく検出することができる情報処理方法、情報処理装置、及びプログラムを提供する。 Therefore, the present invention has been made in view of the above-described problems of the prior art, and provides an information processing method, an information processing apparatus, and a program that can accurately detect an image corresponding to a target image.
(1)本発明の一態様は、画像から検出された1以上の関心点から選択される対象関心点を含む所定範囲内における複数の標本点それぞれに関する特徴を表す方向を算出する標本点方向算出ステップと、前記標本点方向算出ステップにより算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出ステップと、前記クラスター検出ステップによる前記関心点毎の前記標本点のクラスターの検出結果に基づいて記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外ステップと、を有することを特徴とする情報処理方法である。 (1) One aspect of the present invention is a sample point direction calculation that calculates a direction that represents a feature related to each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from an image. And a cluster detection step of detecting a cluster of the sample points for each of the one or more points of interest, based on a direction representing a characteristic regarding each of the plurality of sample points calculated by the sample point direction calculation step; , Determining the points of interest to be excluded from the one or more points of interest based on the detection result of the cluster of the sample points for each of the points of interest by the cluster detection step, and the exclusion according to the determination result A point of interest exclusion step of excluding the target point of interest from the one or more points of interest.
(2)また、本発明の他の態様は、前記関心点除外ステップは、前記クラスター検出ステップにより1以上の前記クラスターが検出された前記関心点を、前記除外対象とする前記関心点であると判定する、ことを特徴とする(1)に記載の情報処理方法である。 ( 2 ) According to another aspect of the present invention, in the point of interest exclusion step, the point of interest in which one or more of the clusters are detected by the cluster detection step is the point of interest as the exclusion target. The information processing method according to ( 1 ), characterized in that a determination is made.
(3)また、本発明の他の態様は、前記関心点除外ステップは、前記クラスター検出ステップにより2以上の前記クラスターが検出された前記関心点に関して、前記2以上の前記クラスターが所定の条件を満たす場合、前記除外対象とする前記関心点であると判定する、ことを特徴とする(1)又は(2)に記載の情報処理方法である。 ( 3 ) According to another aspect of the present invention, in the point-of-interest exclusion step, the two or more clusters satisfy a predetermined condition with respect to the point of interest in which two or more clusters are detected by the cluster detection step. The information processing method according to ( 1 ) or ( 2 ), wherein if satisfied, the point of interest is determined as the exclusion target.
(4)また、本発明の他の態様は、画像から検出された1以上の関心点から選択される対象関心点を含む所定範囲内における複数の標本点それぞれに関する特徴を表す方向を算出する標本点方向算出部と、前記標本点方向算出部により算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出部と、前記クラスター検出部による前記関心点毎の前記標本点のクラスターの検出結果に基づいて前記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外部と、を備えることを特徴とする情報処理装置である。
( 4 ) Further, according to another aspect of the present invention, a sample for calculating a direction representing a feature regarding each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from an image. A cluster that detects a cluster of the sample points for each of the one or more points of interest based on a point direction calculation unit and a direction that represents a feature relating to each of the plurality of sample points calculated by the sample point direction calculation unit a detection unit determines the interest points to be excluded among the
(5)また、本発明の他の態様は、コンピューターに、画像から検出された1以上の関心点から選択される対象関心点を含む所定範囲内における複数の標本点それぞれに関する特徴を表す方向を算出する標本点方向算出ステップと、前記標本点方向算出ステップにより算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出ステップと、前記クラスター検出ステップによる前記関心点毎の前記標本点のクラスターの検出結果に基づいて前記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外ステップと、を実行させるためのプログラムである。
( 5 ) According to another aspect of the present invention, a direction in which a characteristic regarding each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from an image is displayed on a computer. A sample point direction calculating step; and a sample point cluster for each of the one or more points of interest based on a direction representing a characteristic regarding each of the plurality of sample points calculated by the sample point direction calculating step. determining a cluster detection step of detecting, the interest points to be excluded among the
本発明の一態様によれば、対象画像に対応する画像を精度よく検出することができる画像の特徴を示す関心点を記述する情報処理方法、情報処理装置、及びプログラムを提供することができる。 According to one embodiment of the present invention, it is possible to provide an information processing method, an information processing apparatus, and a program that describe a point of interest indicating a feature of an image that can accurately detect an image corresponding to a target image.
<概要>
まず、以下に示す実施形態に係る情報処理装置1の概要を説明し、その後により詳細な実施形態について説明する。本実施形態に係る情報処理装置1は、デジタル画像を構成する複数の点(例えば、画素等)のうち、特徴的な点(関心点)に基づいて、デジタル画像の特徴を判定する。一例として、この情報処理装置1は、複数のデジタル画像のうちのあるデジタル画像(以下、対象画像と称する)と、他の複数のデジタル画像(以下、候補画像と称する)とについて、画像の特徴をデジタル画像間において比較することにより、対象画像に対応する画像を複数の候補画像の中から抽出する。
<Overview>
First, an outline of the
以下では、説明の便宜上、対象となる画像が表示部に表示された場合に表示部に映し出される事物のことを、対象となる画像上の事物と称し、事物が表示されない部分であって所定の許容範囲内で単一色(無地)が映し出される部分を無地背景と称して説明する。なお、無地背景は、所定の許容範囲内で単一色が映し出される部分に代えて、中間色(複数色、例えば白と黒とを細かい市松模様などに配置した合成色で、人間の目的には単一な灰色と錯覚するもの等)が映し出された部分等であってもよい。 In the following, for convenience of explanation, when the target image is displayed on the display unit, the thing that is displayed on the display unit is referred to as the thing on the target image, and is a part where the thing is not displayed and is a predetermined part. A portion where a single color (solid color) is projected within the allowable range will be referred to as a plain background. A plain background is an intermediate color (a composite color in which multiple colors, for example, white and black are arranged in a fine checkered pattern, etc.) instead of a portion where a single color is projected within a predetermined allowable range. It may be a portion in which a single gray color illusion is projected).
この具体例において情報処理装置1は、デジタル画像内のある点を、画像の特徴を示す関心点として検出し、検出した関心点における画像の方向(関心点方向)に基づいて、対象画像に対応する画像を複数の候補画像の中から抽出する。この関心点の選択は、さまざまな条件に基づいて行われ、例えば、関心点検出ステップによって行われる。以下、ある対象画像と複数の候補画像とについて、何らかの条件に基づいて選択された関心点における画像の方向、すなわち関心点方向に基づいて対象画像に対応する画像を複数の候補画像の中から抽出する処理において、ノイズとなる可能性が高い関心点を除去する処理について説明する。このノイズとなる可能性が高い関心点を除去する処理によって、情報処理装置1は、高い精度で対象画像に対応する候補画像を抽出することができる。
In this specific example, the
ノイズとなる可能性が高い関心点を除去する処理についての概要を説明する前に、まず関心点方向に基づいて対象画像に対応する画像を複数の候補画像の中から抽出する処理における基本的な事柄について説明する。情報処理装置1は、対象画像から何らかの条件に基づいて1以上の関心点を検出し、検出された対象画像に係る1以上の関心点から関心点を1つずつ対象関心点として選択する。情報処理装置1は、選択された対象関心点毎に対象関心点の近傍に含まれる複数の標本点それぞれの方向を算出する。
Before explaining the outline of the process for removing the points of interest that are likely to cause noise, first, a basic process for extracting an image corresponding to the target image from a plurality of candidate images based on the direction of the points of interest. Explain the matter. The
ここで、対象画像とは、情報処理装置1がユーザーからの操作を受け付けることによって選択した画像を示す。ユーザーからの操作とは、例えば、複数の画像から1つの画像を選択する操作や、撮像装置により撮像された画像を読み込む操作、インターネット等を介して画像を取得する操作等を示す。また、標本点とは、関心点の近傍を示すある所定範囲内に含まれる複数の点を示す。標本点の一例としては、対象関心点が画素の場合、その対象関心点の近傍に含まれる複数の画素が挙げられるが、これに代えて、対象関心点の近傍に含まれる他の何らかの複数の点等であってもよい。
Here, the target image indicates an image selected by the
これらの標本点は、例えば、対象関心点の近傍におけるx軸方向及びy軸方向に、格子状に配列される。なお、これらの標本点は、格子状に配列される構成に代えて、他の形状に配列される構成であってもよい。格子状に配列された標本点間の間隔は、例えば、関心点毎に予め定められている、1s(sは、スケールを示す)である。なお、これらの関心点と標本点は、画像中の画素位置であることが望ましいが、必ずしも画素位置である必要はなく、画素位置を整数位置とすれば少数精度の位置であってもよい。 These sample points are arranged in a grid in the x-axis direction and the y-axis direction in the vicinity of the target point of interest, for example. Note that these sample points may be arranged in other shapes instead of being arranged in a grid. The interval between the sample points arranged in a grid is, for example, 1 s (s indicates a scale) that is predetermined for each point of interest. Note that these interest points and sample points are preferably pixel positions in the image, but are not necessarily pixel positions. If the pixel positions are integer positions, they may be decimal positions.
これらの標本点が含まれる対象関心点の近傍とは、例えば、対象関心点を中心とした半径6sの円形の範囲を示す。なお、対象関心点の近傍は、これに代えて、対象関心点を中心とした半径6sの円形の範囲よりも小さな半径の円形の範囲を示す構成であってもよく、半径6sの円形の範囲よりも大きな半径の円形の範囲を示す構成であってもよい。また、対象関心点の近傍は、対象関心点を中心とした円形の範囲を示す構成に代えて、対象関心点を含む長方形範囲や正方形範囲、菱形範囲等、他の対象関心点を含む形状の範囲を示す構成であってもよい。 The vicinity of the target interest point including these sample points indicates, for example, a circular range with a radius of 6 s centered on the target interest point. Alternatively, the vicinity of the target interest point may be configured to show a circular range having a radius smaller than the circular range having a radius of 6 s centered on the target interest point, or a circular range having a radius of 6 s. The structure which shows the circular range of a larger radius may be sufficient. Further, in the vicinity of the target interest point, instead of a configuration showing a circular range centered on the target interest point, a shape including other target interest points such as a rectangular range including the target interest point, a square range, a rhombus range, etc. The structure which shows a range may be sufficient.
対象関心点の近傍に含まれる複数の標本点とは、この一例において、対象関心点を中心とした半径6sの円形範囲内に含まれる113の標本点を示す。以下では、説明の便宜上、この複数の標本点をまとめて対象標本点群と称して説明する。また、対象標本点群に含まれるそれぞれの標本点を対象標本点群の標本点と称して説明する。 In this example, the plurality of sample points included in the vicinity of the target interest point indicates 113 sample points included in a circular range having a radius of 6 s centered on the target interest point. Hereinafter, for convenience of explanation, the plurality of sample points will be collectively referred to as a target sample point group. Further, each sample point included in the target sample point group will be described as a sample point of the target sample point group.
対象標本点群の標本点の方向は、それら対象標本点群の標本点毎に対応づけられた所定の方向算出範囲(面積)内の輝度値の勾配等に基づくウェーブレット応答(dx,dy)によって算出される。なお、標本点の方向は、標本点毎に対応付けられた方向算出範囲内の色相の勾配や明度の勾配等、方向算出範囲内における他の何らかの値の勾配に基づくウェーブレット応答(dx,dy)によって算出されてもよい。また、情報処理装置1は、算出した標本点に係るウェーブレット応答(dx,dy)を次に示す式(1)に代入することにより、標本点毎に、標本点についての角度θを標本点の方向として算出する。
The direction of the sample points of the target sample point group is determined by a wavelet response (dx, dy) based on the gradient of the luminance value within a predetermined direction calculation range (area) associated with each sample point of the target sample point group. Calculated. Note that the direction of the sample point is a wavelet response (dx, dy) based on a gradient of some other value in the direction calculation range such as a hue gradient or brightness gradient in the direction calculation range associated with each sample point. May be calculated. In addition, the
θ=tan−1(dy/dx) ・・・(1) θ = tan −1 (dy / dx) (1)
以上のようにして、情報処理装置1は、対象標本点群の標本点それぞれの方向を算出し、算出された方向に基づいて関心点方向を算出することができる。以上で基本的な事柄の説明を終え、次にノイズとなる可能性が高い関心点を除去する処理についての概要を説明する。上記のように算出された対象標本点群の標本点それぞれの方向に基づいて、情報処理装置1は、対象画像に係る1以上の関心点のうち、ノイズとなる可能性が高い関心点を判定する。ここで、ノイズとは、関心点方向を決定した後において、ある関心点の周辺に固まって算出される複数の関心点であって方向が類似する関心点のことを示す。このような複数の関心点は、類似した特徴量記述子を持つ可能性が高いため、それぞれを区別することができない場合がある。
As described above, the
このような場合、例えば、対象画像の複数の関心点が、候補画像の1つの関心点と類似する(すなわち、関心点に基づく画像のマッチングにおいて、誤マッチングを起こす)場合があり、複数の候補画像から対象画像に対応する画像を精度よく検索することができないという問題が発生することがある。それ故、以下では、このような問題を引き起こす複数の関心点をノイズと称して説明する。なお、このようなノイズは、例えば、対象画像に映っている事物と無地背景との境界を示すエッジや、コーナー(角)、ブロブ、T分岐等(以下、エッジ等と称する)の位置上で検出されることが多い。 In such a case, for example, a plurality of points of interest in the target image may be similar to one point of interest in the candidate image (that is, erroneous matching occurs in matching of images based on points of interest). There may be a problem that an image corresponding to the target image cannot be accurately retrieved from the image. Therefore, hereinafter, a plurality of points of interest that cause such a problem will be referred to as noise. Such noise is, for example, on the edge indicating the boundary between the thing reflected in the target image and the plain background, the position of a corner (corner), a blob, a T-branch, etc. (hereinafter referred to as an edge). Often detected.
ここで、これらのエッジ等の位置上で検出される関心点の近傍に含まれる標本点のうち、標本点に対応付けられた方向算出範囲内においてエッジ等が無地背景に囲まれていた場合、その方向算出範囲に含まれる標本点の方向は、所定の角度範囲(例えば、方向を示す角度範囲において±0.1°範囲等)内で同じ方向を向く傾向がある。この傾向を利用することで、情報処理装置1は、標本点の方向に基づいて対象標本点群に係る対象関心点がノイズとなる可能性が高いか否かを判定する。
Here, among the sample points included in the vicinity of the point of interest detected on the position of these edges and the like, if the edge or the like is surrounded by a plain background within the direction calculation range associated with the sample point, The directions of the sample points included in the direction calculation range tend to face the same direction within a predetermined angle range (for example, a ± 0.1 ° range in the angle range indicating the direction). By using this tendency, the
情報処理装置1は、対象関心点がノイズとなる可能性が高いと判定された場合、対象関心点を除外対象として対象画像に係る1以上の関心点から除外する。このように、情報処理装置1は、対象画像に係る1以上の関心点からノイズとなる可能性が高い関心点を除去することができる。
When it is determined that the target interest point is likely to be noise, the
情報処理装置1は、ここまで説明した対象画像に対する処理であってノイズとなる可能性が高い関心点を除去する処理と同様の処理を複数の候補画像のそれぞれに対して行い、候補画像に係る対象関心点の近傍に含まれる複数の標本点それぞれの方向に基づいて候補画像に係る関心点からノイズとなる可能性が高い関心点を除外対象として除外する。そして、情報処理装置1は、除外されずに残った対象画像に係る1以上の関心点と、除外されずに残った候補画像に係る1以上の関心点とに基づいて、対象画像に対応する画像を複数の候補画像(候補画像の群)から検出する。
The
情報処理装置1は、ノイズとなる可能性が高い関心点が除去された後に残った関心点に基づいてこの検出を行うため、複数の候補画像から対象画像に対応する画像を精度よく検出することができる。また、情報処理装置1は、ノイズとなる可能性が高い関心点が除去される結果、ノイズとなる可能性が高い関心点に係る計算量を減らすことができるため、計算コストを抑制することができる。なお、対象画像に対応する画像とは、例えば、対象画像に似た画像を示す。対象画像に似た画像とは、対象画像に映っている複数の事物のうち一部又は全部を含む(映っている)候補画像を示す。例えば、対象画像に似た画像とは、対象画像上の複数の人物のうちの特定の人物Aが映っている候補画像等である。
Since the
このように、情報処理装置1は、対象画像から検出された1以上の関心点から選択される対象関心点の近傍にある複数の標本点それぞれの方向を算出し、算出された1以上の関心点それぞれに係る複数の標本点それぞれの方向に基づいて、1以上の関心点のうちノイズとなる可能性が高い関心点を判定し、判定結果に応じてノイズとなる可能性が高い関心点を対象画像から検出された1以上の関心点から除外する。これにより、情報処理装置1は、対象画像に対応する画像を精度よく検出することができる。
As described above, the
<実施形態>
以下、本発明の実施形態について、図面を参照して説明する。図1は、本実施形態に係る情報処理装置1の機能構成の一例を示す図である。情報処理装置1は、候補画像121を記憶している記憶部12と、入力受付部13と、表示部14と、通信部15と、制御部16を備える。なお、候補画像121は、複数の候補画像の総称である。
<Embodiment>
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating an example of a functional configuration of the
記憶部12は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、EEPROM(Electrically Erasable Programmable Read−Only Memory)、ROM(Read−Only Memory)、RAM(Random Access Memory)などを含み、制御部16が処理する各種情報や画像、プログラム、そして候補画像121を格納する。なお、記憶部12は、情報処理装置1に内蔵されるものに代えて、USB等のデジタル入出力ポート等によって接続された外付け型の記憶装置でもよい。
The
入力受付部13は、例えば、キーボードやマウス、タッチパッド、その他の入力装置である。なお、入力受付部13は、表示部として機能してもよく、さらに、タッチパネルとして構成されてもよい。
表示部14は、情報処理装置1のディスプレイであり、例えば、液晶ディスプレイパネル、あるいは、有機EL(ElectroLuminescence)ディスプレイパネルである。
通信部15は、例えば、USB等のデジタル入出力ポートやイーサネットポート等を含んで構成される。
The
The
The
制御部16は、通信制御部20と、関心点検出部21、標本点方向算出部22と、クラスター検出部23、関心点除外部24、と、記述子算出部25と、画像検索部26と、表示制御部27を備える。制御部16が備えるこれらの機能部のうち一部又は全部は、例えば、図示しないCPUが、記憶部12に記憶された各種プログラムを実行することで実現される。また、これらの機能部のうち一部又は全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)等のハードウェア機能部であってもよい。
The
通信制御部20は、各種の情報や画像等を他の装置から取得するように通信部15を制御する。また、通信制御部20は、各種の情報や画像等を他の装置へ出力するように通信部15を制御する。
関心点検出部21は、入力受付部13から受け付けられたユーザーからの操作に基づいて選択された対象画像から1以上の関心点を検出する。また、関心点検出部21は、記憶部12により記憶された候補画像121に基づいて、候補画像121に含まれる候補画像のそれぞれから1以上の関心点を検出する。なお、本実施形態において、情報処理装置1は、対象画像の候補が予め記憶部12に記憶されているものとして説明するが、これに代えて、例えば、通信部15を介して他の装置(撮像装置やサーバー等)から対象画像を取得してもよい。
The
The interest
標本点方向算出部22は、関心点検出部21により対象画像から検出された1以上の関心点から関心点を1つずつ対象関心点として選択する。そして、標本点方向算出部22は、選択された対象関心点の近傍に含まれる複数の標本点(対象標本点群の標本点)それぞれの方向を、選択された対象関心点毎に繰り返し算出する。以下では、この算出処理を、標本点方向算出処理と称して説明する。また、標本点方向算出部22は、候補画像121から1つずつ候補画像を選択し、選択された候補画像毎に標本点方向算出処理を繰り返し行うことで、候補画像から検出された各関心点それぞれの近傍に含まれる複数の標本点それぞれの方向を、すべての候補画像に関して算出する。
The sample point
クラスター検出部23は、標本点方向算出部22により算出された対象関心点に係る対象標本点群の標本点それぞれの方向に基づいて、標本点のクラスターを検出する。以下では、標本点のクラスターを単にクラスターと称し、クラスターを検出する処理をクラスター検出処理と称して説明する。また、クラスター検出部23は、標本点方向算出部22により選択された候補画像毎にクラスター検出処理を繰り返し行うことで、選択された候補画像において検出された関心点に係る標本点それぞれの方向に基づくクラスターを、すべての候補画像に関して検出する。
The
関心点除外部24は、クラスター検出部23によるクラスターの検出結果に基づいて、対象画像に係る1以上の関心点からノイズとなる可能性が高い関心点を判定し、ノイズとなる可能性が高いと判定された関心点を、対象画像に係る1以上の関心点から除外対象として除外する。以下では、この除外対象を除外する処理を、ノイズ除外処理と称して説明する。また、関心点除外部24は、標本点方向算出部22により選択された候補画像毎にノイズ除外処理を繰り返し行うことで、候補画像に係る除外対象を、すべての候補画像に関して除外する。なお、ノイズとなる可能性が高い関心点は、除外対象の一例である。
The point-of-
記述子算出部25は、関心点検出部21により対象画像から検出された1以上の関心点のうち関心点除外部24により除外されずに残った関心点毎に、関心点の近傍に含まれる標本点それぞれの方向に基づいて関心点方向を算出する。そして、記述子算出部25は、算出された関心点方向に基づいて、関心点の近傍におけるコントラスト情報を用いて特徴量記述子(以下、単に記述子と称する)を算出する。以下では、この記述子を算出する処理を、記述子算出処理と称して説明する。また、記述子算出部25は、候補画像121から1つずつ候補画像を選択し、選択された候補画像毎に記述子算出処理を行うことで、選択された候補画像から検出された関心点であって関心点除外部24により除外されずに残った関心点の近傍における記述子を、すべての候補画像に関して算出する。
The
画像検索部26は、関心点除外部24により除外されずに残った対象画像の関心点毎に記述子算出部25により算出された記述子(以下、対象画像に係る記述子群と称する)と、各候補画像の関心点であって関心点除外部24により除外されずに残った1以上の関心点毎に記述子算出部25により算出された記述子(以下、候補画像に係る記述子群と称する)とに基づいて、対象画像と似た画像を候補画像121から検索する。
The
この検索の際、画像検索部26は、例えば、対象画像に係る記述子群と各候補画像に係る記述子群とのマッチングを行い、マッチング度合いが高いものから順に候補画像121に含まれる候補画像を並べ、最上位の候補画像を対象画像と似た画像として検索する。マッチングの度合いとは、例えば、対象画像に係る記述子群に含まれるそれぞれの記述子と、候補画像に係る記述子群に含まれるそれぞれの記述子とを比較した時、最近傍探索法(Nearest Neighbor Method)等によって記述子間の距離が近い記述子を選択し、その選択された記述子が属する候補画像の記述子の数をカウントアップした得票数によって表される。なお、画像検索部26は、最上位の候補画像を対象画像と似た画像として検索する構成に代えて、例えば、上位から所定順位までの候補画像を対象画像と似た画像として検索する構成等、マッチング度合が高い順に基づいて対象画像と似た画像を検索する構成であってもよい。
In this search, for example, the
表示制御部27は、画像検索部26により検索された対象画像と似た画像を表示するように表示部14を制御する。
The
以下、図2を参照して、制御部16が対象画像に似た画像を候補画像121から検出する処理の流れを説明する。図2は、制御部16が対象画像に似た画像を候補画像121から検出する処理の流れの一例を示すフローチャートである。以下では、制御部16が記憶部12から対象画像を選択するための複数の画像を読み込んだ後の処理について説明する。また、以下では、予め記憶部12に記憶されている複数の候補画像のそれぞれから1以上の関心点が事前に検出されており、さらに、それらの関心点のそれぞれに係る記述子が算出されているとして説明する。なお、制御部16は、対象画像から1以上の関心点を検出する際に、候補画像から1以上の関心点を検出する構成であってもよい。その場合、対象画像から検出された関心点のそれぞれに係る記述子を算出する際、候補画像から検出された関心点のそれぞれに係る記述子も算出する構成であってもよい。
Hereinafter, the flow of processing in which the
まず、制御部16は、入力受付部13により受け付けられたユーザーからの操作に基づいて、記憶部12から読み込まれた複数の画像から対象画像を選択する(ステップS100)。次に、関心点検出部21は、対象画像から1以上の関心点を検出する(ステップS110)。次に、標本点方向算出部22は、ステップS110で検出された対象画像の関心点から1つずつ関心点を対象関心点として選択し、選択された対象関心点毎にステップS130からステップS170までの処理を繰り返し行う(ステップS120)。
First, the
ステップS120で対象関心点が選択された後、標本点方向算出部22は、選択された対象関心点の近傍に含まれる標本点それぞれの方向を算出する(ステップS130)。次に、クラスター検出部23は、ステップS130で算出された対象関心点の近傍に含まれる標本点それぞれの方向に基づいて、所定数以上の標本点が集まっているクラスターを検出する(ステップS140)。このクラスターの検出は、クラスターを検出可能な如何なる方法によって行われてもよい。
After the target point of interest is selected in step S120, the sample point
また、クラスター検出部23は、1以上のクラスターが検出された場合、検出されたクラスター毎に、クラスター情報を生成する。クラスター情報には、例えば、クラスターを識別するID、クラスターの大きさ(例えば、クラスターを形成する標本点の数)を示す情報や、クラスターの方向を示す情報等が含まれる。ここで、クラスター検出部23は、検出されたクラスター毎に、クラスターの方向として、クラスターに含まれる標本点それぞれの方向に基づく統計量を算出する。クラスターに含まれる標本点それぞれの方向に基づく統計量とは、この一例において、クラスターに含まれる標本点それぞれの方向の平均値であるとするが、これに代えて、中央値や最頻値等であってもよい。
Further, when one or more clusters are detected, the
ステップS140でクラスター検出部23によるクラスターの検出が行われた後、関心点除外部24は、ステップS140でのクラスター検出部23によるクラスターの検出結果に基づいて、ステップS120で選択された対象関心点がノイズとなる可能性が高いか否かを判定する(ステップS150)。ここで、図3及び図4を参照して、関心点の方向を算出する処理と、ノイズとなる可能性が高い関心点の近傍に含まれる標本点の方向の特徴について説明することにより、どのような関心点がノイズとなる可能性が高いかについて説明する。
After the
図3は、ノイズが検出される可能性が高い部分を含む対象画像の一部分を例示する図である。図3において、画像Q1は、ノイズとなる可能性が高い部分を含む対象画像の一部分である。画像Q1には、対象画像のうち、無地背景の部分と、ポスター等の絵柄を表す事物の部分との間のコントラスト変化の激しい線分(エッジ、又は境界線)が示されている。 FIG. 3 is a diagram illustrating a portion of the target image including a portion where noise is likely to be detected. In FIG. 3, an image Q <b> 1 is a part of the target image including a portion that is likely to be noise. The image Q1 shows a line segment (edge or boundary line) with a sharp contrast change between a plain background portion and a thing portion representing a picture such as a poster in the target image.
このようなエッジの近傍において検出される関心点は、ノイズとなる可能性が高い。ここで、関心点PCは、ステップS110で検出された関心点のうちの一例である。以下では、この関心点PCを、ステップS120で標本点方向算出部22により選択された対象関心点PCと称して説明する。範囲NAは、対象関心点PCの近傍を示す範囲である。上記のように、範囲NAは、対象関心点を中心とした半径6sの円形の範囲である。すなわち、範囲NAには、対象標本点群として113の標本点が含まれる。図3では、説明の便宜上、これらの対象標本点群の標本点を、範囲NA内の菱形によって表している。
Interest points detected in the vicinity of such edges are likely to be noise. Here, the point of interest PC is an example of the points of interest detected in step S110. Hereinafter, this interest point PC will be referred to as the target interest point PC selected by the sample point
標本点方向算出部22は、対象関心点の近傍に含まれる対象標本点群から1つずつ標本点を選択する。図3において、この選択された標本点が、標本点PSであるとして説明する。標本点方向算出部22は、画像Q1上において選択された標本点PSを中心として、図3に示したような正方形範囲の方向算出範囲BFを設定する。標本点方向算出部22は、方向算出範囲BF(面積)内の輝度値の勾配等に基づくウェーブレット応答(dx,dy)に基づいて標本点PSの方向を算出する。なお、標本点PSの方向は、標本点の特徴を表す方向の一例である。
The sample point
ここで、方向算出範囲BFは、対象関心点の近傍に含まれる対象標本点群の標本点それぞれに係るウェーブレット応答(dx,dy)を算出するために用いられるウェーブレット変換(デジタルフィルタ)を適用する範囲である。図3に示した例において、対象関心点の近傍には、対象標本点群に含まれる113の標本点それぞれに対応する113の方向算出範囲BFが標本点方向算出部22により設定される。標本点方向算出部22は、これらの方向算出範囲BF毎にウェーブレット応答(dx,dy)を算出し、算出されたウェーブレット応答(dx,dy)に基づいて、対象標本点群の標本点それぞれ(標本点PSを含む)の方向を算出する。
Here, the wavelet transform (digital filter) used for calculating the wavelet response (dx, dy) related to each sample point of the target sample point group included in the vicinity of the target interest point is applied to the direction calculation range BF. It is a range. In the example shown in FIG. 3, 113 direction calculation ranges BF corresponding to the 113 sample points included in the target sample point group are set by the sample point
ここで、ノイズとなる可能性が高い関心点に係る標本点の方向であってウェーブレット応答(dx,dy)に基づいて算出される方向には、例えば、以下で説明する(A)〜(D)のような傾向が見られる。
(A)方向算出範囲BF内に無地背景のみが含まれている場合、無地背景の明るさに限らずウェーブレット応答(dx,dy)に基づいて算出される標本点の方向は、0°となる。
Here, in the direction of the sample point related to the interest point that is likely to be noise and calculated based on the wavelet response (dx, dy), for example, (A) to (D) described below are used. ) Is seen.
(A) When only the plain background is included in the direction calculation range BF, the direction of the sample point calculated based on the wavelet response (dx, dy) is not limited to the brightness of the plain background, and is 0 °. .
(B)ここで、説明の便宜上、本実施形態における情報処理装置1が実際に行う処理ではないが、方向算出範囲BFを4つの2sのブロックに分割した場合の値等を用いて説明する。分割されたブロックのうち3ブロックが無地背景、残りの1ブロックが事物と無地背景の混在である場合、ウェーブレット応答(dx,dy)に基づいて算出される標本点PSの方向は、90°の倍数を除く45°の倍数となる。なお、情報処理装置1は、方向算出範囲BFを4つの2sのブロックに分割する処理を行う構成であってもよい。
(B) Here, for convenience of explanation, the processing is not actually performed by the
(C)上端から下端へ抜ける線分が方向算出範囲BF内に映っている場合、ウェーブレット応答(dx,dy)に基づいて算出される標本点の方向は、0°又は180°のいずれかとなる。なお、0°と180°のうちいずれになるかを司る決定要素は、無地背景と線分のうちいずれが明るいかという点と、方向算出範囲BF内において線分が右寄りと左寄りのうちいずれであるかという点とである。 (C) When a line segment extending from the upper end to the lower end appears in the direction calculation range BF, the direction of the sample point calculated based on the wavelet response (dx, dy) is either 0 ° or 180 °. . Note that the determining factor governing which of 0 ° and 180 ° is either a plain background or a bright line segment, and whether the line segment is right or left in the direction calculation range BF. Is there a point?
(D)左端から右端へ抜ける線分が方向算出範囲BF内に映っている場合、ウェーブレット応答(dx,dy)に基づいて算出される標本点の方向は、90°又は270°のいずれかとなる。なお、90°と270°のうちいずれになるかを司る決定要素は、無地背景と線分のうちいずれが明るいかという点と、方向算出範囲BF内において線分が上寄りと下寄りのうちいずれであるかという点とである。 (D) When a line segment extending from the left end to the right end is reflected in the direction calculation range BF, the direction of the sample point calculated based on the wavelet response (dx, dy) is either 90 ° or 270 °. . In addition, the determining factor governing which of 90 ° and 270 ° is selected is that the solid background or the line segment is brighter, and the line segment is on the upper side or lower side in the direction calculation range BF. It is the point of either.
ここで、図4を参照して、ノイズとなる可能性が高い関心点が検出されやすいエッジ上の関心点に係る複数の標本点それぞれの方向を算出した場合、上記の(A)〜(D)に示した傾向がどのように表れるかについて説明する。図4は、複数の標本点に係る方向算出範囲BFそれぞれ毎に算出されたウェーブレット応答(dx,dy)と、そのウェーブレット応答(dx,dy)に基づいて算出された方向算出範囲BFに係る標本点の方向を例示する図である。 Here, with reference to FIG. 4, when the direction of each of a plurality of sample points related to the point of interest on the edge where the point of interest that is likely to be noise is easily detected is calculated, the above (A) to (D) ) Explain how the trend shown in) appears. FIG. 4 shows a wavelet response (dx, dy) calculated for each of the direction calculation ranges BF related to a plurality of sample points, and a sample related to the direction calculation range BF calculated based on the wavelet responses (dx, dy). It is a figure which illustrates the direction of a point.
まず、本実施形態における情報処理装置1によるウェーブレット応答(dx,dy)を算出する処理について説明する。ウェーブレット応答(dx,dy)のうちの応答dxは、図4に示した範囲BFdxのように、方向算出範囲BFを2つのブロックdxm、dxpに分割し、ブロックdxmの範囲に含まれる画像の輝度値の累積値と、ブロックdxpの範囲に含まれる画像の輝度値の累積値とに基づいて算出される。また、ウェーブレット応答(dx,dy)のうちの応答dyは、図4に示した範囲BFdyのように、方向算出範囲BFを2つのブロックdym、dypに分割し、ブロックdymの範囲に含まれる画像の輝度値の累積値と、ブロックdypの範囲に含まれる画像の輝度値の累積値とに基づいて算出される。
First, a process for calculating a wavelet response (dx, dy) by the
より具体的には、応答dxは、ブロックdxmに係る累積値にブロックdxm内に示した「−1」を乗じ、ブロックdxpに係る累積値にブロックdxp内に示した「+1」を乗じ、それらの和を取ることによって算出される。また、応答dyは、ブロックdymに係る累積値にブロックdym内に示した「−1」を乗じ、ブロックdypに係る累積値にブロックdyp内に示した「+1」を乗じ、それらの和を取ることによって算出される。 More specifically, the response dx is obtained by multiplying the cumulative value related to the block dxm by “−1” shown in the block dxm, and multiplying the cumulative value related to the block dxp by “+1” shown in the block dxp. It is calculated by taking the sum of In addition, the response dy multiplies the accumulated value related to the block dym by “−1” shown in the block dym, multiplies the accumulated value related to the block dyp by “+1” shown in the block dyp, and takes the sum thereof. Is calculated by
このような処理によってウェーブレット応答(dx,dy)が算出されることを踏まえて、以下、ノイズとなる可能性が高い関心点が検出されやすいエッジ上の関心点に係る複数の標本点それぞれの方向を算出した場合、上記の(A)〜(D)に示した傾向がどのように表れるかについて説明する。図4において、各方向算出範囲BFには、ノイズとなる可能性が高い関心点が検出されやすいエッジであって無地背景(図4に示した方向算出範囲BF内におけるドットが疎になった領域)と何らかの事物(図4に示した方向算出範囲BF内におけるドットが密になった領域)とのエッジ(境界線)が映っている。 Based on the fact that the wavelet response (dx, dy) is calculated by such processing, the direction of each of a plurality of sample points related to the point of interest on the edge where the point of interest that is likely to be noise is likely to be detected will be described below. The following describes how the tendencies shown in the above (A) to (D) appear. In FIG. 4, each direction calculation range BF is an edge where a point of interest that is likely to be noise is likely to be detected, and a plain background (a region in which dots in the direction calculation range BF shown in FIG. 4 are sparse. ) And some thing (a region where dots are dense in the direction calculation range BF shown in FIG. 4).
ここでも、上記の(B)と同様に、説明の便宜上、本実施形態における情報処理装置1が実際に行う処理ではないが、方向算出範囲BFを4つの2sのブロックに分割した場合の値等を用いて説明する。図4に示した各方向算出範囲BF内の4つの数値は、4つの2sのブロックそれぞれに含まれる画像に係る輝度値の累積値(d1,d2,d3,d4)である。図4に示したように、累積値d1は、方向算出範囲BF内の左上のブロックの累積値であり、累積値d2は、方向算出範囲BF内の右上のブロックの累積値である。また、累積値d3は、方向算出範囲BF内の左下のブロックの累積値であり、累積値d4は、方向算出範囲BF内の右下のブロックの累積値である。なお、これらの累積値は、値を整数値に丸めて表現したものが示されているが、必ずしも整数値になるとは限らない。また、図4では、図を簡略化するため、方向算出範囲BF内のドットの疎密は、事物と無地背景を区別するためだけに描いており、累積値(すなわち輝度値)の多寡を表すものではない。ウェーブレット応答(dx,dy)の算出は、これらの累積値(d1,d2,d3,d4)に、以下の式(2)、式(3)を適用することと等価である。
Here, as in the case of (B) above, for the sake of convenience of explanation, it is not a process actually performed by the
dx=(d2+d4)−(d1+d3) ・・・(2) dx = (d2 + d4) − (d1 + d3) (2)
dy=(d3+d4)−(d1+d2) ・・・(3) dy = (d3 + d4) − (d1 + d2) (3)
上記の式(2)及び式(3)は、ブロックdxm、dxp、dym、dypそれぞれに係る累積値に基づくウェーブレット応答(dx,dy)の算出を簡単に表現したものである。算出されたウェーブレット応答(dx,dy)と、上記の式(1)とに基づいて各標本点の方向を算出した値が、図4に示した各矢印の右側に記載された角度である。図4に示したように、ノイズとなる可能性が高い関心点であってエッジ上に検出された関心点に係る標本点の場合、標本点に係るウェーブレット応答(dx,dy)に基づいて算出された方向には、少なくとも上記(A)〜(D)に示した傾向があると考えられる。これに加えて、ノイズとなる関心点の近傍に含まれる複数の標本点のうちの一部又は全部は、略同じ方向を向く傾向がある。これらのことから、情報処理装置1は、クラスター検出部23により1以上のクラスターが検出された場合(すなわち、対象関心点に係る標本点のうち所定数以上の標本点が略同じ方向を向いている場合)、上記(A)〜(D)に示した傾向に基づいて、対象関心点がノイズとなる可能性が高い関心点であるか否かを判定することができる。
The above equations (2) and (3) simply represent the calculation of the wavelet response (dx, dy) based on the accumulated values relating to the blocks dxm, dxp, dym, and dyp. A value obtained by calculating the direction of each sample point based on the calculated wavelet response (dx, dy) and the above equation (1) is the angle described on the right side of each arrow shown in FIG. As shown in FIG. 4, in the case of a sample point related to a point of interest that is highly likely to be noise and detected on the edge, calculation is performed based on the wavelet response (dx, dy) related to the sample point. It is considered that there is a tendency shown at least in the above (A) to (D) in the direction indicated. In addition, some or all of the plurality of sample points included in the vicinity of the interest point that becomes noise tends to be directed in substantially the same direction. For these reasons, the
図2に戻る。ここで、関心点除外部24による対象関心点がノイズとなる可能性が高い関心点であるか否かを判定する処理について説明する。関心点除外部24は、ステップS140でクラスター検出部23により生成されたクラスター情報に基づいて、1以上のクラスターが検出された場合、且つクラスター情報に含まれるクラスターの方向が上記(A)〜(D)に示した傾向に該当する場合、ステップS120で選択された対象関心点がノイズとなる可能性が高い関心点であると判定する。一方、関心点除外部24は、ステップS140でクラスター検出部23によりクラスターが検出されなかった場合や、1以上のクラスターが検出された場合、且つクラスター情報に含まれるクラスターの方向が上記(A)〜(D)に示した傾向に該当しない場合、ステップS120で選択された対象関心点がノイズとなる可能性が低い関心点であると判定する。
Returning to FIG. Here, a process of determining whether or not the target point of interest by the point of
なお、このような判定は、あくまでも一例であり、例えば、関心点除外部24が、1以上のクラスターが検出された場合、且つクラスター情報に含まれるクラスターの方向が上記(A)〜(D)に示した傾向に該当する場合に加えて、1以上のクラスターが検出された場合、且つクラスター情報に含まれるクラスターの方向が上記(A)〜(D)に示した傾向に該当しない場合に、ステップS120で選択された対象関心点がノイズとなる可能性が高い関心点であると判定する構成であってもよい。また、関心点除外部24は、1以上のクラスターが検出された場合、且つクラスター情報に含まれるクラスターの方向が上記(A)〜(D)に示した傾向に該当しない場合、上記(A)〜(D)とは異なる他の傾向に基づいて、ステップS120で選択された対象関心点がノイズとなる可能性が高い関心点であるか否かを判定してもよい。
Such determination is merely an example. For example, when the interest
ステップS120で選択された対象関心点がノイズとなる可能性が高い関心点であると判定された場合(ステップS150−Yes)、関心点除外部24は、ステップS120で選択された対象関心点を除外対象として除外する除外処理を行う(ステップS160)。一方、ステップS120で選択された対象関心点がノイズとなる可能性が低い関心点であると判定された場合(ステップS150−No)、関心点除外部24は、ステップS120に戻り、次の関心点を対象関心点として選択する。このように、ステップS130からステップS170までの処理によって、制御部16は、対象画像に係る1以上の関心点から除外対象(すなわち、ノイズとなる可能性が高い関心点)を除外する。
If it is determined that the target point of interest selected in step S120 is a point of interest that is likely to be noise (step S150-Yes), the point of
次に、記述子算出部25は、ステップS150で関心点除外部24により除外されずに残った関心点それぞれの近傍に含まれる標本点の方向に基づいて、それら関心点それぞれの関心点方向を算出し、算出された関心点方向に基づいて、それら関心点それぞれについての記述子を算出する(ステップS170)。次に、画像検索部26は、ステップS170で算出された記述子に基づいて、複数の候補画像のそれぞれと、対象画像とをマッチングさせ、マッチングの度合いが最も高い順に候補画像を並べる。そして、画像検索部26は、マッチングの度合いが最も高い候補画像を、対象画像に似た画像として検索する(ステップS180)。次に、表示制御部27は、ステップS180で画像検索部26により対象画像に似た画像として検索された画像を表示するように表示部14を制御する(ステップS190)。
Next, the
なお、関心点除外部24は、クラスター検出部23により標本点の数が所定数以上のクラスターが2以上検出された場合、クラスター情報に基づいて対象関心点がノイズである可能性が高いか否かを判定する構成であってもよい。この場合、例えば、関心点除外部24は、クラスター検出部23により標本点の数が所定数以上のクラスターが2以上検出された場合、且つクラスター情報に基づいてそれらのクラスターが以下に示す複数のパターンのうち少なくとも1つ以上に該当する場合、対象関心点がノイズである可能性が高いと判定する。なお、以下に示したパターンは、一例であり、他のパターンが含まれていてもよい。また、以下に示したパターンは、以下に示したパターンのうちの一部又は全部の任意の組み合わせであってもよく、その組み合わせには、上記の他のパターンが含まれていてもよい。
The interest
パターン1)クラスターの方向が、いずれも90°の倍数を除く45°の倍数(厳密に45°である必要はなく、所定の範囲内において45°と判定可能な角度)の場合
パターン2)2以上のクラスターそれぞれの方向のうちの一部がある方向Kを向き、方向Kを向いていない残りの方向が方向Kとは反対の方向Jを向いている場合
パターン3)2以上のクラスターそれぞれの方向のうちの一部がある方向Kを向き、方向Kを向いていない残りの方向のうちの一部が方向Kとは反対の方向Jを向き、残りの方向が方向K及び方向Jとは異なる方向Iを向いている場合
パターン4)クラスターの方向が、いずれも0°又は180°(厳密に0°又は180°である必要はなく、所定の範囲内において0°又は180°と判定可能な角度)の場合
Pattern 1) When the direction of the cluster is a multiple of 45 ° excluding a multiple of 90 ° (an angle that can be determined to be 45 ° within a predetermined range is not strictly 45 °) 2) 2 When a part of the directions of each cluster is directed in a certain direction K and the remaining directions not directed in the direction K are directed in a direction J opposite to the direction K, pattern 3) each of the two or more clusters Some of the directions are directed in the direction K, some of the remaining directions not directed in the direction K are directed in the direction J opposite to the direction K, and the remaining directions are the directions K and
上記のパターン1の場合は、上記の(A)〜(D)の傾向のうちの少なくともいずれかに当てはまるため、対象関心点がノイズとなる可能性が高い。それ故、関心点除外部24は、このような対象関心点を除外対象として除外する。また、上記のパターン2の場合は、方向算出範囲BF内を、例えば上端から下端へ抜ける太めの線分が斜めに横切る時に起こり易く、やはり対象関心点がノイズとなる関心点である可能性が高い。それ故、関心点除外部24は、このような対象関心点を除外対象として除外する。また、上記のパターン3の場合は、方向算出範囲BF内に単なる直線とは異なる何らかの特徴的な箇所から対象関心点が検出されている可能性が高い。それ故、関心点除外部24は、このような対象関心点を除外対象として除外しない。また、上記のパターン4の場合、パターン1の場合と同様に、上記の(A)〜(D)の傾向のうちの少なくともいずれかに当てはまるため、対象関心点がノイズとなる可能性が高い。それ故、関心点除外部24は、このような対象関心点を除外対象として除外する。上記のパターン1〜4は、所定の条件の一例である。
In the case of the
このように、2以上のクラスターが検出された場合、パターン1〜4のうちの少なくともいずれかのパターンに該当するか否かを判定し、その判定結果に基づいて対象関心点がノイズとなる可能性が高い関心点であるか否かを判定することで、ノイズとはならない特徴的な関心点をノイズとなる可能性が高い関心点として除外してしまうことを抑制することができる。
As described above, when two or more clusters are detected, it is determined whether or not the pattern corresponds to at least one of the
以上説明したように、情報処理装置1は、対象画像から検出された1以上の関心点から選択される対象関心点を含む所定範囲内における複数の標本点それぞれに関する特徴を表す方向を算出し、算出された1以上の関心点それぞれに係る複数の標本点それぞれに関する特徴を表す方向に基づいて、1以上の関心点のうちノイズとなる可能性が高い関心点を判定し、その判定結果に応じてノイズとなる可能性が高い関心点を1以上の関心点から除外する。これにより、情報処理装置1は、対象画像に対応する画像を精度よく検出することができる。
As described above, the
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない限り、変更、置換、削除等されてもよい。 The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and changes, substitutions, deletions, and the like are possible without departing from the gist of the present invention. May be.
なお、以上に説明した装置(例えば、情報処理装置1)における任意の構成部の機能を実現するためのプログラムを、コンピューター読み取り可能な記録媒体に記録し、そのプログラムをコンピューターシステムに読み込ませて実行するようにしてもよい。なお、ここでいう「コンピューターシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD(Compact Disk)−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリー(RAM:Random Access Memory)のように、一定時間プログラムを保持しているものも含むものとする。 It should be noted that a program for realizing the function of an arbitrary component in the above-described apparatus (for example, information processing apparatus 1) is recorded on a computer-readable recording medium, and the program is read into a computer system and executed. You may make it do. Here, the “computer system” includes hardware such as an OS (Operating System) and peripheral devices. “Computer-readable recording medium” means a portable disk such as a flexible disk, a magneto-optical disk, a ROM (Read Only Memory), a CD (Compact Disk) -ROM, or a hard disk built in a computer system. Refers to the device. Further, the “computer-readable recording medium” means a volatile memory (RAM: Random Access) inside a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. Memory that holds a program for a certain period of time, such as Memory).
また、上記のプログラムは、このプログラムを記憶装置等に格納したコンピューターシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピューターシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記のプログラムは、上記の機能の一部を実現するためのものであってもよい。さらに、上記のプログラムは、上記の機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
In addition, the above program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
Further, the above program may be for realizing a part of the above functions. Further, the program may be a so-called difference file (difference program) that can realize the above functions in combination with a program already recorded in the computer system.
1 情報処理装置、12 記憶部、13 入力受付部、14 表示部、15 通信部、16 制御部、20 通信制御部、21 関心点検出部、22 標本点方向算出部、23 クラスター検出部、24 関心点除外部、25 記述子算出部、26 画像検索部、27 表示制御部、121 候補画像
DESCRIPTION OF
Claims (5)
前記標本点方向算出ステップにより算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出ステップと、
前記クラスター検出ステップによる前記関心点毎の前記標本点のクラスターの検出結果に基づいて前記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外ステップと、
を有することを特徴とする情報処理方法。 A sample point direction calculating step for calculating a direction representing a feature relating to each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from the image;
A cluster detection step of detecting a cluster of the sample points for each of the one or more points of interest, based on a direction representing a characteristic regarding each of the plurality of sample points calculated by the sample point direction calculation step;
Determining the interest points to be excluded among the pre SL 1 or more of the point of interest based on a detection result of the cluster of the sample points for each of the interest points by the cluster detection step, the excluded in accordance with the determination result A point of interest exclusion step of excluding the target point of interest from the one or more points of interest;
An information processing method characterized by comprising:
ことを特徴とする請求項1に記載の情報処理方法。 The interest point exclusion step determines that the interest point from which one or more of the clusters are detected by the cluster detection step is the interest point to be excluded.
The information processing method according to claim 1 .
ことを特徴とする請求項1又は2に記載の情報処理方法。 The point of interest exclusion step is the point of interest to be excluded when the two or more clusters satisfy a predetermined condition with respect to the point of interest in which two or more clusters are detected by the cluster detection step. To determine,
The information processing method according to claim 1 or 2 .
前記標本点方向算出部により算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出部と、
前記クラスター検出部による前記関心点毎の前記標本点のクラスターの検出結果に基づいて前記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外部と、
を備えることを特徴とする情報処理装置。 A sample point direction calculation unit that calculates a direction representing a feature relating to each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from an image;
A cluster detection unit that detects a cluster of the sample points for each of the one or more points of interest, based on a direction that represents a characteristic regarding each of the plurality of sample points calculated by the sample point direction calculation unit;
Determining the interest points to be excluded among the pre SL 1 or more of the point of interest based on a detection result of the cluster of the sample points for each of the interest points by the cluster detection unit, the excluded in accordance with the determination result A point of interest exclusion unit that excludes the target point of interest from the one or more points of interest;
An information processing apparatus comprising:
画像から検出された1以上の関心点から選択される対象関心点を含む所定範囲内における複数の標本点それぞれに関する特徴を表す方向を算出する標本点方向算出ステップと、
前記標本点方向算出ステップにより算出された前記複数の前記標本点それぞれに関する特徴を表す方向に基づいて、前記1以上の前記関心点毎に前記標本点のクラスターを検出するクラスター検出ステップと、
前記クラスター検出ステップによる前記関心点毎の前記標本点のクラスターの検出結果に基づいて前記1以上の前記関心点のうち除外対象とする前記関心点を判定し、その判定結果に応じて前記除外対象とする前記関心点を前記1以上の前記関心点から除外する関心点除外ステップと、
を実行させるためのプログラム。 On the computer,
A sample point direction calculating step for calculating a direction representing a feature relating to each of a plurality of sample points within a predetermined range including a target point of interest selected from one or more points of interest detected from the image;
A cluster detection step of detecting a cluster of the sample points for each of the one or more points of interest, based on a direction representing a characteristic regarding each of the plurality of sample points calculated by the sample point direction calculation step;
Determining the interest points to be excluded among the pre SL 1 or more of the point of interest based on a detection result of the cluster of the sample points for each of the interest points by the cluster detection step, the excluded in accordance with the determination result A point of interest exclusion step of excluding the target point of interest from the one or more points of interest;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014197073A JP5970512B2 (en) | 2014-09-26 | 2014-09-26 | Information processing method, information processing apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014197073A JP5970512B2 (en) | 2014-09-26 | 2014-09-26 | Information processing method, information processing apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016071428A JP2016071428A (en) | 2016-05-09 |
JP5970512B2 true JP5970512B2 (en) | 2016-08-17 |
Family
ID=55864703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014197073A Active JP5970512B2 (en) | 2014-09-26 | 2014-09-26 | Information processing method, information processing apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5970512B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230206482A1 (en) * | 2020-05-08 | 2023-06-29 | Nec Corporation | Image selection apparatus, image selection method, and non-transitory computer-readable medium |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE470912T1 (en) * | 2006-04-28 | 2010-06-15 | Toyota Motor Europ Nv | ROBUST DETECTOR AND DESCRIPTOR FOR A POINT OF INTEREST |
-
2014
- 2014-09-26 JP JP2014197073A patent/JP5970512B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016071428A (en) | 2016-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697416B2 (en) | Object detection using cascaded convolutional neural networks | |
TWI729995B (en) | Generating a merged, fused three-dimensional point cloud based on captured images of a scene | |
JP6176388B2 (en) | Image identification device, image sensor, and image identification method | |
US8805077B2 (en) | Subject region detecting apparatus | |
CN108875133A (en) | Determine architectural composition | |
US9576218B2 (en) | Selecting features from image data | |
US20140152776A1 (en) | Stereo Correspondence and Depth Sensors | |
JP5538868B2 (en) | Image processing apparatus, image processing method and program | |
US8923610B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
JP6566768B2 (en) | Information processing apparatus, information processing method, and program | |
US20130170756A1 (en) | Edge detection apparatus, program and method for edge detection | |
US20180211415A1 (en) | Texture Modeling of Image Data | |
WO2016062259A1 (en) | Transparency-based matting method and device | |
CN108369649A (en) | Focus detection | |
US10089764B2 (en) | Variable patch shape synthesis | |
US9740711B2 (en) | Automatic registration | |
JP2014186520A (en) | Image processing apparatus, image processing method, and program | |
JP5970512B2 (en) | Information processing method, information processing apparatus, and program | |
JP6229554B2 (en) | Detection apparatus and detection method | |
JP2017102500A (en) | Area extraction device, area extraction program, and area extraction method | |
CN112233139A (en) | System and method for detecting motion during 3D data reconstruction | |
WO2018092422A1 (en) | Image processing device and image processing method | |
JP7533937B2 (en) | Image processing device, image processing method, and program | |
US20180061079A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP5933675B1 (en) | Information processing apparatus, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5970512 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |