JP7181014B2 - データ抽出装置、データ抽出方法、及びプログラム - Google Patents
データ抽出装置、データ抽出方法、及びプログラム Download PDFInfo
- Publication number
- JP7181014B2 JP7181014B2 JP2018117196A JP2018117196A JP7181014B2 JP 7181014 B2 JP7181014 B2 JP 7181014B2 JP 2018117196 A JP2018117196 A JP 2018117196A JP 2018117196 A JP2018117196 A JP 2018117196A JP 7181014 B2 JP7181014 B2 JP 7181014B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- data
- node
- interest
- spatial index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000013075 data extraction Methods 0.000 title claims description 32
- 238000000605 extraction Methods 0.000 claims description 52
- 239000000284 extract Substances 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 49
- 230000008569 process Effects 0.000 description 44
- 238000004364 calculation method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 230000001737 promoting effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Description
図1は、実施形態に係るデータ抽出装置100の構成および使用環境の一例を示す図である。データ抽出システム1には、例えば、データ抽出装置100と、一以上の端末装置200と、サービスサーバ300とが含まれる。
データ抽出装置100は、例えば、通信部110と、制御部120と、記憶部130とを備える。通信部110は、NICなどのネットワークカード、無線通信モジュールなどを含む。
一般に、ユーグリッド空間において、グラフが以下の条件1を満たす場合、エッジで結合された近傍ノードを検索する(局所検索する)ことによって最近傍検索が可能であるとされている。
グラフZのノード(以下、ノードY)と、グラフZにおけるノードYの近傍ノードの集合(以下、集合W(Z,Y))に属する任意のノードXと、検索対象のノード(以下、
ノードV)との間において、「ノードVとノードYとの間の距離」<「ノードVとノードXとの間の距離」が成り立つならば、グラフZに属する任意のノードXに対して「ノードVとノードYとの間の距離」<「ノードVとノードXとの間の距離」が成り立つ。
図3は、近似k最近傍グラフGの生成処理の流れの一例を示すフローチャートである。図3に示される処理は、データ抽出装置100によって行われてもよく、サービスサーバ300によって行われてもよく、他の装置によって行われてもよい。以下では、図3に示される処理を、データ抽出装置100の制御部120が備える空間インデックス生成部(不図示)が実行し、生成した空間インデックス情報132を記憶部130に記憶させるものとする。
図4は、近似k最近傍検索処理の流れの一例を示すフローチャートである。図4に示されるフローチャートは、図3に示されるステップS106の処理を詳細に示すフローチャートである。まず、空間インデックス生成部は、近似k最近傍グラフGに属する複数のノードの中から、追加ノードqの追加ノード近傍集合Nqの検索起点となる追加ノードq(以下、検索起点ノードs)をランダムに1つ決定する(ステップS202)。次に、空間インデックス生成部は、近似k最近傍グラフGと、追加ノードqと、検索起点ノードsとに基づいて、最近傍ノード特定処理を実行する(ステップS204)。最近傍ノード特定処理の詳細については、後述する。空間インデックス生成部は、最近傍ノード特定処理によって、近似k最近傍グラフGに属する複数のノードの中から、追加ノードqから最も距離が近いノードである最近傍ノードq*を特定する。
図5は、最近傍ノード特定処理の流れの一例を示すフローチャートである。図5に示されるフローチャートは、図4に示されるステップS204の処理を詳細に示すフローチャートである。まず、空間インデックス生成部は、近似k最近傍グラフGに属するノードの中から、検索起点ノードsの近傍のノードの集合である検索起点ノード近傍集合Nsを抽出する(ステップS302)。次に、空間インデックス生成部は、検索起点ノード近傍集合Nsに属するノードの中から、検索起点ノードsを除くノードであり、検索起点ノードsとの距離が最も短いノードである検索起点最近傍ノードs*を特定する(ステップS304)。
図6は、追加ノードqの近傍探索処理の一例を示すフローチャートである。図6に示されるフローチャートは、図4に示されるステップS210の処理を詳細に示すフローチャートである。まず、空間インデックス生成部は、近似k最近傍グラフGに属するノードの中から、最近傍ノードq*の近傍ノードの集合(以下、最近傍ノード近傍集合Nq*)に属する任意のノード(以下、近傍ノードqc)を選択する(ステップS402)。
ε:探索係数
図7は、近似k最近傍グラフGを模式的に示す図である。図7に示される一例において、着目画像は、全部で12[個]であり、それぞれのノード(図示する追加ノードq1~q12)は、無向エッジにより互いに対応付けられる。図7に示される通り、近似k最近傍グラフGでは、ステップS108、及びステップS112の処理により、1ノードずつ無向エッジにより順次対応付けられるため、k値を定めた場合であっても、k本以上のエッジがノードに対応付けられる場合がある。このため、近似k最近傍グラフGは、k最近傍グラフの場合とグラフの形状は異なるが、各ノードの対応付けが十分に行われているため、条件1を満たさないことに伴う検索漏れを許容するインデックスとして十分な検索制度を実現することができる。
空間インデックス生成部は、上述した処理により生成された近似k最近傍グラフGにdvp-Treeを対応付けた空間インデックスを示す空間インデックス情報132を生成する。dvp-Treeは、木構造型インデックスの最上位のノードであるルートノードラベルndRと、最下位のリーフノードラベルndLとルートノードラベルndRとリーフノードラベルndLとの間に位置するインターナルノードラベルndIとの、3つのノードラベルndから構成される。リーフノードラベルndLには、少なくとも1つ以上、且つ最大でk[個]の追加ノードqが対応付けられる。
図10は、分割球によって分割された近似k最近傍グラフGの一例を示す図である。また、図11は、近似k最近傍グラフGに対応付けられたdvp-Treeの一例を示す図である。図10~11に示される通り、上述した処理によって図7に示される追加ノードq1~q12は、5つのリーフノードラベルndL(図示するリーフノードラベルndL1~ndL5)の分割球に分割される。また、リーフノードラベルndL1~ndL5は、3つのインターナルノードラベルndI(図示するインターナルノードラベルndI1~ndI3)の分割球に分割される。また、インターナルノードラベルndI1~ndI3は、ルートノードラベルndRに対応付けられる。
抽出部126は、上述した処理によって生成された空間インデックスを示す空間インデックス情報132に基づいて、類似画像グループを抽出する。抽出部126は、例えば、抽出態様(1)の場合、同一のノードラベルndに分割された追加ノードqの元データである着目画像の画像を類似画像として抽出する。また、抽出部126は、例えば、抽出態様(2)の場合、上述した処理によって生成された空間インデックスを用いて、着目画像の類似画像グループであるノードラベルndを検索し、特定する。
以上説明したように、本実施形態のデータ抽出装置100は、対象データ(この一例では、着目画像)を、距離を定義することが可能であり且つ距離の公理を満たす符号(この一例では、pHash)に変換する変換部(ハッシュ算出部124)と、pHashを照合可能な空間インデックス(この一例ででは、近似k最近傍グラフGに対応付けられたdvp-Tree)を用いて、pHashに空間的に近い順にインデックスが対応付けられた対象データ(この一例では、類似画像)を抽出する抽出部126と、を備え、より効率よく類似データを抽出することができる。
なお、上述では、抽出部126が、抽出態様(1)においては、着目画像と同じリーフノードラベルndLに属する追加ノードqに対応する類似画像を抽出する場合について説明したが、これに限られない。ここで、データ抽出装置100のユーザは、類似画像グループとして所定の数(例えば、100件)の類似画像を取得したい場合がある。この場合に、リーフノードラベルndLに、所定の数の追加ノードqが属していないと、ユーザは、所定の数の類似画像を取得することが困難である場合がある。したがって、抽出部126は、リーフノードラベルndLに所定の数の追加ノードqが属していない場合、更に上位のノードラベルndに属する追加ノードqに対応する類似画像を抽出してもよい。また、抽出部126は、抽出態様(2)において、所定の数の類似画像が抽出できるまでの間、検索距離rqをより長い値に設定し、ステップS702~S726までの処理を繰り返し実行してもよい。
Claims (5)
- 入力データを、距離を定義することが可能であり且つ距離の公理を満たす符号に変換する変換部と、
前記符号を照合可能なデータ構造である空間インデックスを用いて、着目データから変換された符号に空間的に近い符号を抽出し、前記抽出した符号の変換元のデータを、前記着目データに類似するデータとして抽出する抽出部と、
を備え、
前記空間インデックスは、階層構造を有し、各階層において近傍関係にある要素がグループ化されていると共に、前記階層構造における上位の階層のラベルを参照することで、前記符号の属するグループが認識可能なデータ構造であり、
前記抽出部は、指定された数の符号が前記着目データから変換された符号の属する階層に存在しない場合、更に、前記着目データから変換された符号の上位階層に属する符号から、前記着目データから変換された符号に空間的に近い符号を抽出し、
前記上位階層に属する符号から前記着目データから変換された符号に空間的に近い符号を抽出する際に、前記着目データから変換された符号の属する階層における前記符号の抽出範囲を変更しない、
データ抽出装置。 - 前記変換部は、前記着目データのpHashを前記符号として算出する、
請求項1に記載のデータ抽出装置。 - 前記空間インデックスには、近似k最近傍グラフが含まれ、
前記符号は、前記近似k最近傍グラフにおける頂点である、
請求項1または2に記載のデータ抽出装置。 - コンピュータが、
入力データを、距離を定義することが可能であり且つ距離の公理を満たす符号に変換し、
前記符号を照合可能なデータ構造である空間インデックスを用いて、着目データから変換された符号に空間的に近い符号を抽出し、
前記抽出した符号の変換元のデータを、前記着目データに類似するデータとして抽出し、
前記空間インデックスは、階層構造を有し、各階層において近傍関係にある要素がグループ化されていると共に、前記階層構造における上位の階層のラベルを参照することで、前記符号の属するグループが認識可能なデータ構造であり、
前記抽出する際に、指定された数の符号が前記着目データから変換された符号の属する階層に存在しない場合、更に、前記着目データから変換された符号の上位階層に属する符号から、前記着目データから変換された符号に空間的に近い符号を抽出し、
前記上位階層に属する符号から前記着目データから変換された符号に空間的に近い符号を抽出する際に、前記着目データから変換された符号の属する階層における前記符号の抽出範囲を変更しない、
データ抽出方法。 - コンピュータに、
入力データを、距離を定義することが可能であり且つ距離の公理を満たす符号に変換させ、
前記符号を照合可能なデータ構造である空間インデックスを用いて、着目データから変換された符号に空間的に近い符号を抽出させ、
前記抽出した符号の変換元のデータを、前記着目データに類似するデータとして抽出させ、
前記空間インデックスは、階層構造を有し、各階層において近傍関係にある要素がグループ化されていると共に、前記階層構造における上位の階層のラベルを参照することで、前記符号の属するグループが認識可能なデータ構造であり、
前記コンピュータに、前記抽出させる際に、指定された数の符号が前記着目データから変換された符号の属する階層に存在しない場合、更に、前記着目データから変換された符号の上位階層に属する符号から、前記着目データから変換された符号に空間的に近い符号を抽出させ、
前記上位階層に属する符号から前記着目データから変換された符号に空間的に近い符号を抽出する際に、前記着目データから変換された符号の属する階層における前記符号の抽出範囲を変更させない、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117196A JP7181014B2 (ja) | 2018-06-20 | 2018-06-20 | データ抽出装置、データ抽出方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117196A JP7181014B2 (ja) | 2018-06-20 | 2018-06-20 | データ抽出装置、データ抽出方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019219945A JP2019219945A (ja) | 2019-12-26 |
JP7181014B2 true JP7181014B2 (ja) | 2022-11-30 |
Family
ID=69096629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117196A Active JP7181014B2 (ja) | 2018-06-20 | 2018-06-20 | データ抽出装置、データ抽出方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7181014B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005301701A (ja) | 2004-04-12 | 2005-10-27 | Matsushita Electric Ind Co Ltd | コンテンツ受信方法およびコンテンツ配信方法 |
JP2009199151A (ja) | 2008-02-19 | 2009-09-03 | Hitachi Ltd | k最近傍検索方法、k最近傍検索プログラム及びk最近傍検索装置 |
JP2014048916A (ja) | 2012-08-31 | 2014-03-17 | Ntt Docomo Inc | 周辺情報検索装置、周辺情報検索方法、及び周辺情報検索プログラム |
JP2014149713A (ja) | 2013-02-01 | 2014-08-21 | Ntt Docomo Inc | 画像評価装置 |
-
2018
- 2018-06-20 JP JP2018117196A patent/JP7181014B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005301701A (ja) | 2004-04-12 | 2005-10-27 | Matsushita Electric Ind Co Ltd | コンテンツ受信方法およびコンテンツ配信方法 |
JP2009199151A (ja) | 2008-02-19 | 2009-09-03 | Hitachi Ltd | k最近傍検索方法、k最近傍検索プログラム及びk最近傍検索装置 |
JP2014048916A (ja) | 2012-08-31 | 2014-03-17 | Ntt Docomo Inc | 周辺情報検索装置、周辺情報検索方法、及び周辺情報検索プログラム |
JP2014149713A (ja) | 2013-02-01 | 2014-08-21 | Ntt Docomo Inc | 画像評価装置 |
Non-Patent Citations (2)
Title |
---|
岩崎 雅二郎,商品画像検索へのグラフ構造型インデックスの適用,画像電子学会誌,一般社団法人画像電子学会,2013年12月31日,第42巻 第5号,pp.633~641 |
江田 孝治,DCT符号を用いた知覚ハッシュの検討,電気学会論文誌C,一般社団法人電気学会,2017年10月01日,第137巻 第10号,pp.1433~1434 |
Also Published As
Publication number | Publication date |
---|---|
JP2019219945A (ja) | 2019-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20090083275A1 (en) | Method, Apparatus and Computer Program Product for Performing a Visual Search Using Grid-Based Feature Organization | |
US8762390B2 (en) | Query specific fusion for image retrieval | |
CN109189959B (zh) | 一种构建图像数据库的方法及装置 | |
US20140193077A1 (en) | Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program | |
US20180012105A1 (en) | Localization and mapping method | |
WO2019137185A1 (zh) | 一种图片筛选方法及装置、存储介质、计算机设备 | |
US11663282B2 (en) | Taxonomy-based system for discovering and annotating geofences from geo-referenced data | |
WO2008100248A2 (en) | Feature matching method | |
EP2833275B1 (en) | Image search device, image search method, program, and computer-readable storage medium | |
US20210073890A1 (en) | Catalog-based image recommendations | |
CN110083762B (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 | |
JP2013109773A (ja) | 特徴マッチング方法及び商品認識システム | |
JP6767342B2 (ja) | 検索装置、検索方法および検索プログラム | |
CN111310074A (zh) | 兴趣点的标签优化方法、装置、电子设备和计算机可读介质 | |
JP7354014B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN111221982A (zh) | 信息处理方法、装置、计算机可读存储介质和计算机设备 | |
CN111506750B (zh) | 图片检索方法、装置及电子设备 | |
US8885952B1 (en) | Method and system for presenting similar photos based on homographies | |
CN112069412B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
US10318843B2 (en) | Method and apparatus for image processing and comparison based on spatial relationships between image features | |
JP7181014B2 (ja) | データ抽出装置、データ抽出方法、及びプログラム | |
CN115170168A (zh) | 一种广告推送方法、装置、云服务器和存储介质 | |
Phan et al. | Collaborative recommendation of photo-taking geolocations | |
CN109492023B (zh) | 一种汽车信息处理方法及其设备、计算机存储介质 | |
CN113742504A (zh) | 以图搜图方法、装置、计算机程序产品和计算机程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7181014 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |