JP5563494B2 - 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム - Google Patents

対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム Download PDF

Info

Publication number
JP5563494B2
JP5563494B2 JP2011019575A JP2011019575A JP5563494B2 JP 5563494 B2 JP5563494 B2 JP 5563494B2 JP 2011019575 A JP2011019575 A JP 2011019575A JP 2011019575 A JP2011019575 A JP 2011019575A JP 5563494 B2 JP5563494 B2 JP 5563494B2
Authority
JP
Japan
Prior art keywords
content
feature
unit
reference image
feature point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011019575A
Other languages
English (en)
Other versions
JP2012160047A (ja
Inventor
悠一 吉田
満 安倍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2011019575A priority Critical patent/JP5563494B2/ja
Publication of JP2012160047A publication Critical patent/JP2012160047A/ja
Application granted granted Critical
Publication of JP5563494B2 publication Critical patent/JP5563494B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、入力画像に対応する参照画像を検索する対応参照画像検索装置及び方法、並びにそれらを用いて入力画像に対して対応するコンテンツを重畳するコンテンツ重畳装置、システム、及び方法に関し、特に、画像の特徴点を用いて入力画像に対応する参照画像を検索する対応参照画像検索装置及び方法、並びにそれらを用いて入力画像に対して対応するコンテンツを重畳するコンテンツ重畳装置、システム、及び方法に関するものである。
近年、カメラ付き携帯端末の普及により、カメラで対象物体を撮影して入力画像とし、その対象物体に対応するコンテンツ(例えば、対象物体の解説)を入力画像に重畳表示する、AR(Augmented Reality)技術が提案されている。
ARを実現する従来技術として、対象物体に対応するコンテンツを特定するために画像処理を行わないものと画像処理を行うものとがある。画像処理を行わない従来技術としては、GPSレシーバと電子コンパスを併用するものが挙げられる。この従来技術は、あらかじめデータベース上に対象物体の位置を記憶しておき、GPSレシーバによりカメラ付き携帯端末の位置を検出し、電子コンパスによりカメラ付き携帯端末の姿勢を検出し、その位置と姿勢に基づいて、カメラの画角内にある対象物体及びその位置を推定することで、対象物体に対応するコンテンツ及びその重畳箇所を特定する。
対象物体に対応するコンテンツを特定するために画像処理を行わない従来技術は、カメラ付き携帯端末がGPSレシーバ及び電子コンパスを搭載していれば比較的容易に実現できるが、位置と姿勢の検出精度はGPSレシーバ及び電子コンパスの精度に依存するので、対象物体に対して正確にコンテンツを重畳することが困難である。
一方、入力画像に映された対象物体に対応するコンテンツを特定するために画像処理を行う従来技術は、入力画像に映っている対象物体を認識することで、対象物体に対応するコンテンツを特定する。画像処理を行う従来技術として、指標を用いるものと対応点を用いるものが提案されている。
指標を用いる技術は、例えば指標として2次元コードを用い、あらかじめデータベース上にコンテンツとそれに対応する2次元コードとを記憶しておき、また、対象物体又はその付近には2次元コードを付与しておき、カメラ付き携帯端末で2次元コードを含む対象物体を撮影することで、データベース上から撮影された2次元コードに対応するコンテンツを検索する。
この従来技術によれば、2次元コードが付与されている平面に対するカメラ付き携帯端末の姿勢を高速かつ高精細に推定することが可能である。また、2次元コードを採用することで、大量のコードパターンを容易に作成できるため、多様な対象を認識できる。しかしながら、対象物体又はその付近に2次元コードを付与する必要があるため、例えば、屋外のランドマークや大きな看板等にコンテンツを重畳することは非現実的である。また、対象物体又はその付近に2次元コードを付与することで、対象物体の意匠に対する影響が大きくなる。
対応点を用いる技術は、入力画像とデータベース中の参照画像との対応点を求めることで、入力画像に対応する参照画像を検索して、その参照画像に対応付けられたコンテンツを入力画像に重畳する。対応点を用いることで、2次元コードのような指標が不要なマーカレスARを実現できるので、応用範囲が広くなり、対象物体の意匠に影響を与えることもない。
対応点を用いて対応する参照画像を検索する技術では、入力画像複数の特徴点を抽出して、各特徴点の特徴量(局所特徴量)を参照画像の特徴点の特徴量と比較し、対応する特徴点(対応点)を探索し、対応する特徴点を多く含む参照画像を、入力画像に対応する参照画像とする。このような技術として、SIFT(Scale-invariant Feature Transform)や、SIFTを高速化したSURF(Speeded Up Robust Features)といった画像特徴点表現手法が知られている(非特許文献1参照)。これらの画像特徴点表現手法は、認識能力が高く、多様な対象を認識できるという利点がある。また、入力画像と参照画像との間の対応点のリストが得られるので、入力画像へのコンテンツの重畳に必要な計算を容易に実行できる。
David G. Lowe, "Object recognition from local scale-invariant features," International Conference on Computer Vision, Corfu, Greece (September 1999), pp. 1150-1157
しかしながら、特徴点の特徴量を比較することで入力画像に対応する参照画像を検索する上記の従来技術では、以下の問題点がある。まず、上記の従来技術では、特徴量のサイズが大きい。特徴量は、単精度実数で表現された数百次元のベクトルで表現されるので、1つの画像から数百ないし数千の特徴点が抽出されると、特徴量のデータ量は数十キロバイトないし数メガバイトにもなる。よって、携帯端末のようなハードウェア資源が限られた装置では、主記憶領域にデータベースを保持することは困難である。
また、上記の従来技術では、ベクトルで表現された特徴量同士のL2ノルムを計算する必要がある。この高次元のベクトル同士の距離計算は、計算負荷が極めて高い。よって、携帯端末のような計算資源が限られた装置では、実現は困難である。
本発明は、上記の問題点に鑑みてなされたものであり、資源の限られた装置においても有効に、入力画像に対応する参照画像の検索を行うことができる対応参照画像検索装置及び方法、並びにそれらを用いて入力画像に対して対応するコンテンツを重畳するコンテンツ重畳装置、システム、及び方法を提供することを目的とする。
上記従来の課題を解決するために、本発明の対応参照画像検索装置は、入力画像に対応する参照画像を検索する対応参照画像検索装置であって、入力画像から特徴点を抽出して前記特徴点の特徴量を検出する特徴量検出部と、前記特徴量検出部にて検出された特徴量をバイナリコードに変換するバイナリ変換部と、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースと、前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量と、前記特徴点データベースに記憶された前記複数の参照画像のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するマッチング部とを備えた構成を有している。
この構成により、複数の参照画像の特徴量はバイナリデータで記憶されており、対応参照画像の検索においても、バイナリコードの特徴量を比較するので、資源の限られた装置においても有効に、入力画像に対応する参照画像の検索を行うことができる。
また、上記の対応参照画像検索装置において、前記バイナリ変換部は、変換行列を用いて、前記特徴量検出部にて検出された特徴量をバイナリコードに変換してよい。
この構成により、バイナリ変換部における変換の計算コストを軽減できる。
また、上記の対応参照画像検索装置において、前記変換行列は、疎行列であってよい。
この構成により、バイナリ変換部における変換の計算コストをさらに軽減できる。
また、上記の対応参照画像検索装置において、前記バイナリ変換部は、前記変換行列のサイズを変更することで、前記バイナリコードのサイズを変更可能であってよい。
この構成により、バイナリコードのサイズを小さくすることでマッチング部における計算コストを軽減したり、バイナリコードのサイズを大きくすることでマッチング部における検索精度を向上させたりといった調整が可能になる。
また、上記の対応参照画像検索装置において、前記マッチング部は、前記入力画像に対応する複数の参照画像がある場合には、複数の参照画像を検出してよい。
この構成により、入力画像に複数の対象物体が映っている場合には、複数の参照画像が検出される。
また、上記の対応参照画像検索装置は、前記対応参照画像検索装置の実行環境を測定する環境測定部をさらに含んでよく、前記バイナリ変換部は、前記環境測定部による測定結果に応じて前記変換行列のサイズを変更することで、前記バイナリコードのサイズを変更してよい。
この構成により、バイナリ変換部は、特徴量検出部が検出した特徴量を、実行環境(例えば、記憶手段の容量、計算手段の容量、及び計算処理能力など)に応じたサイズのバイナリコードに変更できる。
また、本発明のコンテンツ重畳装置は、上記の対応参照画像検索装置を備え、前記入力画像に対して対応するコンテンツを重畳するコンテンツ重畳装置であって、コンテンツ及び前記参照画像と前記コンテンツとの対応関係を記憶したコンテンツデータベースと、前記マッチング部で検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出するコンテンツ抽出部と、前記コンテンツ抽出部にて抽出されたコンテンツを前記入力画像に重畳する重畳部とを備えた構成を有している。
この構成により、資源の限られた装置においても有効に、入力画像に対して対応するコンテンツを重畳させることができる。
また、上記のコンテンツ重畳装置において、前記特徴量検出部は、前記入力画像中の位置の情報を含む特徴点を抽出してよく、前記特徴点データベースは、複数の参照画像の各々の特徴点の特徴量とともに、前記各特徴点の位置の情報を記憶していてよく、前記コンテンツデータベースは、さらに、前記コンテンツの重畳位置を記憶していてよく、前記コンテンツ重畳装置は、さらに、前記特徴量検出部にて抽出された特徴点の位置と前記特徴点データベースに記憶された特徴点の位置との関係に基づいて、前記コンテンツ抽出部にて抽出されたコンテンツの、前記コンテンツデータベースに記憶された前記重畳位置を変換するコンテンツ変換部を備えていてよく、前記重畳部は、前記入力画像中の前記コンテンツ変換部にて変換された重畳位置に前記コンテンツ抽出部にて抽出されたコンテンツを重畳してよい。
この構成により、入力画像と参照画像とでコンテンツを重畳させる対象の位置が異なっていたとしても、入力画像において適切な位置にコンテンツを重畳させることができる。
また、本発明のコンテンツ重畳システムは、コンテンツ重畳装置と、前記コンテンツ重畳装置と通信可能な外部検索サーバとからなるコンテンツ重畳システムである。前記コンテンツ重畳装置は、入力画像から特徴点を抽出して前記特徴点の特徴量を検出する特徴量検出部と、前記特徴量検出部にて検出された特徴量をバイナリコードに変換するバイナリ変換部と、前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量を前記外部検索サーバに送信するコンテンツ重畳装置側通信部とを備え、前記外部検索サーバは、前記コンテンツ重畳装置側通信部より送信された前記入力画像のバイナリコードの特徴量を受信する外部検索サーバ側通信部と、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した外部検索サーバ側特徴点データベースと、前記外部検索サーバ側通信部にて受信した前記入力画像のバイナリコードの特徴量と、前記外部検索サーバ側特徴点データベースに記憶された前記複数の参照画像のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出する外部検索サーバ側マッチング部とを備えた構成を有している。
この構成により、コンテンツ重畳装置からは、入力画像の特徴量としてバイナリコードが外部検索サーバに送信されるので、単精度実数等のデータ量の多い特徴量をそのまま送信する場合と比較して、送信データ量を軽減できる。また、外部検索サーバにおいても、計算コストや必要なデータベース容量を軽減できる。
また、上記のコンテンツ重畳システムにおいて、前記特徴量検出部は、前記入力画像中の位置の情報を含む特徴点を抽出してよく、前記特徴点データベースは、複数の参照画像の各々の特徴点の特徴量とともに、前記各特徴点の位置の情報を記憶していてよい。そして、前記コンテンツ重畳システムは、前記特徴点データベースに記憶された参照画像と前記コンテンツとの対応関係、及び前記コンテンツの重畳位置を記憶したコンテンツデータベースと、前記外部検索サーバ側マッチング部で検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出して、前記特徴量検出部にて抽出された特徴点の位置と前記特徴点データベースに記憶された特徴点の位置との関係に基づいて、前記コンテンツデータベースから抽出されたコンテンツの、前記コンテンツデータベースに記憶された前記重畳位置を変換するコンテンツ変換部と、前記入力画像中の前記コンテンツ変換部にて変換された重畳位置に前記コンテンツ変換部にて抽出されたコンテンツを重畳する重畳部とをさらに備えていてよい。
この構成により、入力画像に対して対応するコンテンツを重畳させることができるとともに、入力画像と参照画像とでコンテンツを重畳させる対象の位置が異なっていたとしても、入力画像において適切な位置にコンテンツを重畳させることができる。
また、上記のコンテンツ重畳システムにおいて、前記コンテンツ重畳装置は、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶したコンテンツ重畳装置側特徴点データベースと、前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量と、前記コンテンツ重畳装置側特徴点データベースに記憶された前記バイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するコンテンツ重畳装置側マッチング部とを備えていてよく、前記外部検索サーバ側通信部は、外部検索サーバ側特徴点データベースに記憶された特徴量のうち、前記外部検索サーバ側マッチング部にて検出された参照画像及びそれに関連する参照画像の特徴量を前記コンテンツ重畳装置に送信してよく、前記コンテンツ重畳装置側通信部は、前記外部検索サーバ側通信部より送信された前記バイナリコードの特徴量を受信してよく、前記コンテンツ重畳装置側特徴点データベースは、前記コンテンツ重畳装置側通信部にて受信した前記バイナリコードの特徴量を、前記複数の参照画像の各々の特徴点の特徴量としてよい。
この構成により、コンテンツ重畳装置は、大量の参照画像の特徴量のすべてを記憶していなくても、必要なデータのみを外部検索サーバからダウンロードすることができるので、コンテンツ重畳装置に必要とされるデータベースの容量を軽減できる。
また、本発明の対応参照画像検索方法は、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースを備えた対応参照画像検索装置における、入力画像に対応する参照画像を検索する対応参照画像検索方法であって、入力画像から特徴点を抽出する特徴点抽出ステップと、前記特徴点抽出ステップにて抽出された前記特徴点の特徴量を検出する特徴量検出ステップと、前記特徴量検出ステップにて検出された特徴量をバイナリコードに変換するバイナリコード変換ステップと、前記バイナリコード変換ステップにて変換された前記入力画像のバイナリコードの特徴量と、前記特徴点データベースに記憶された前記複数の参照画像の各々のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するマッチングステップとを含んでいる。
この構成によっても、複数の参照画像の特徴量はバイナリデータで記憶されており、対応参照画像の検索においても、バイナリコードの特徴量を比較するので、資源の限られた装置においても有効に、入力画像に対応する参照画像の検索を行うことができる。
また、本発明のコンテンツ重畳方法は、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースを備えた対応参照画像検索装置と、前記特徴点データベースに記憶された参照画像とコンテンツとの対応関係を記憶したコンテンツデータベースとを備えたコンテンツ重畳装置における、入力画像に対して対応するコンテンツを重畳するコンテンツ重畳方法であって、上記の対応参照画像検索方法にて、前記入力画像に対応する参照画像を検出する対応参照画像検索ステップと、前記対応参照画像検索ステップにて検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出するコンテンツ抽出ステップと、前記コンテンツ抽出部にて抽出されたコンテンツを前記入力画像に重畳する重畳ステップとを含んでいる。
この構成によっても、資源の限られた装置においても有効に、入力画像に対して対応するコンテンツを重畳させることができる。
本発明のコンピュータプログラムは、上記の対応参照画像検索方法をコンピュータに実行させるためのコンピュータプログラムである。
本発明の別の態様のコンピュータプログラムは、上記のコンテンツ重畳方法をコンピュータに実行させるためのコンピュータプログラムである。
本発明によれば、複数の参照画像の特徴量はバイナリデータで記憶されており、対応参照画像の検索においても、バイナリコードの特徴量を比較するので、資源の限られた装置においても有効に、入力画像に対応する参照画像の検索を行うことができる。
本発明の実施の形態におけるコンテンツ重畳装置の構成を示すブロック図 本発明の実施の形態における入力画像の例を示す図 本発明の実施の形態における入力画像から抽出された特徴点を示す図 本発明の実施の形態における入力画像から検出された特徴量を示す図 本発明の実施の形態におけるバイナリコードに変換された特徴量を示す図 本発明の実施の形態における特徴点データベースに保存されたデータを示す図 本発明の実施の形態における対応点対を示す図 本発明の実施の形態におけるコンテンツデータベースに保存されたデータを示す図 本発明の実施の形態の変形例2におけるコンテンツ重畳装置の構成を示すブロック図 本発明の実施の形態の変形例3におけるコンテンツ重畳装置の構成を示すブロック図 本発明の実施の形態の変形例4におけるコンテンツ重畳装置の構成を示すブロック図 本発明の実施の形態の変形例4における外部検索サーバの特徴点データベースに保存されたデータの構成を示す図
以下、本発明を実施するための形態について、図面を参照しながら説明する。図1は、本実施の形態のコンテンツ重畳装置の構成を示すブロック図である。コンテンツ重畳装置110は、入力画像に対応する参照画像を検索するための対応参照画像検索装置10を備えており、対応参照画像検索装置10で検索された参照画像を用いて、入力画像に対して関連するコンテンツを重畳するための構成として、対応関係算出部21、コンテンツ変換部22、コンテンツデータベース23、及び重畳部24を備えている。
対応参照画像検索装置10は、画像取得部11、特徴量検出部12、バイナリ変換部13、特徴点データベース14、及びマッチング部15を備えている。画像取得部11は、撮像装置としてのカメラで撮影をすることにより画像を生成し、これを入力画像として取得する。画像取得部11は、外部で生成された画像を通信又は記録媒体を介して画像を入力してもよい。図2は、入力画像の例を示す図である。以下の説明では、この図2の入力画像を用いて各部における処理を説明する。画像取得部11にて取得された入力画像は、特徴量検出部12に出力される。
特徴量検出部12は、入力画像から特徴点を抽出して、抽出した特徴点の特徴量を検出する。図3は、入力画像から抽出された特徴点を示す図である。図3に示すように、一般的には、入力画像から複数の特徴点が検出される。
図4は、特徴量検出部12により検出された特徴量を示す図である。本実施の形態では、特徴量として、局所特徴量を用いる。具体的には、特徴量として、SIFT特徴量が用いられる。実際には、SURF特徴量などの他の局所特徴量が用いられてもよい。図4に示すように、特徴量検出部12において、局所特徴量は、単精度実数のベクトルとして求められる。特徴量検出部12は、各特徴点の位置の情報と、各特徴点について検出された局所特徴量を、バイナリ変換部13に出力する。
バイナリ変換部13は、入力画像から抽出されたすべての特徴点について、それらの特徴量をバイナリコードに変換する。図5は、バイナリコードに変換された特徴量を示す図である。特徴量検出部12にて検出された特徴量を128次元のベクトルv∈R128であるとすると、バイナリ変換部13は、この特徴量を下式(1)でバイナリコードに変換する。
Figure 0005563494
但し、式(1)において、dは、変換後のバイナリコードのサイズ(即ちビット数)であり、sgn関数は、下式(2)で与えられる。
Figure 0005563494
また、ベクトルwkは、128次元における半径1の超球上の点から、一様分布に従ってランダムサンプリングをして得られるベクトルである。wk(k=1,……d)は、128行d列の行列として表現できる。このベクトルwkからなる行列を「w」と表記し、変換行列という。
なお、上記の変換を実行する前に、バイナリ変換部13は、あらかじめ大量の画像から特徴量をサンプリングしておき、そこから求めた平均又は中央値であるmをv∈R128から引き、さらにL2ノルムが1となるようにv∈R128を正規化しておく。本実施の形態では、特徴点データベース14にデータを保存する際に生成される大量の特徴量を用いてmを生成する。また、本実施の形態では、バイナリコードのビット長を128ビットとし、即ちd=128とする。
特徴点データベース14は、複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶している。この参照画像は、ARにおいて認識対象の画像となる。図6は、特徴点データベース14に保存されたデータを示す図である。図6に示すように、特徴点データベース14には、特徴点ごとに、その特徴点が所属する参照画像の画像識別番号、バイナリコードで表現されたその特徴点の特徴量、及びその特徴点の画像内での位置からなるレコードが記憶されている。
特徴点データベース14に保存されるこれらのレコードは、上記で説明した画像取得部11、特徴量検出部12、及びバイナリ変換部13を用いて用意される。即ち、画像取得部11は、撮影を行なうか、又はネットワーク若しくは記録媒体からデータを読み出すことで、参照画像を取得し、特徴量検出部12は、この参照画像から特徴点を抽出して、その特徴量を検出する。特徴量検出部12は、参照画像に画像識別番号を付与し、その画像識別番号とともに、各特徴点の参照画像内での位置の情報、及び検出した特徴量をバイナリ変換部13に出力する。バイナリ変換部13は、特徴量をバイナリ変換してバイナリコードを生成する。
図6に示すように、1つの参照画像からは複数の特徴点が抽出される。図6の例では、1つの参照画像について、数個の特徴点のレコードしか示されていないが、実際には1つの参照画像につき数百ないし数千の特徴点のレコードが保存されてよい。また、図6の例では、2つの参照画像しか示されていないが、特徴点データベース14には、数千又はそれ以上の参照画像について、特徴点のレコードが保存されてよい。さらに、図6の例では、紙面の都合上、バイナリコードは最初の11桁のみを示しているが、上述のように、本実施の形態では、バイナリ変換部13によって128ビットのバイナリコードが生成され、特徴点データベース14にも128ビットのバイナリコードが保存されている。
マッチング部15は、入力画像から抽出された特徴点の特徴量を示すバイナリコードと、特徴点データベース14に保存されている参照画像の特徴点の特徴量を示すバイナリコードの各々とを比較して、最も近いバイナリコードを探索する。本実施の形態では、マッチング部15は、バイナリコードの遠近の評価にはハミング距離を採用する。
なお、バイナリコードのハミング距離は、その極限において、元の入力ベクトル空間におけるコサイン距離と一致する。即ち、任意の二つのベクトルv1及びv2をhk(v)によって変換したとき、それぞれのビットが異なる値になる確率は、ベクトルv1とベクトルv2とがなす角度に比例し、下式(3)が成り立つ。
Figure 0005563494
式(3)の左辺の確率の値は、バイナリコードのハミング距離と見なすことができる。このため、十分に長いビット列を求めれば、元の空間におけるベクトルのコサイン距離と、バイナリコードのハミング距離とは一致する。よって、マッチング部15は、式(3)を用いてバイナリコード同士の遠近を評価してもよい。なお、マッチング部15は、高速化等の目的に応じて、LSH(Locality Sensitive Hashing)などの既存技術を用いて、最も近いバイナリコードの探索を行なってもよい。
マッチング部15は、特徴点データベース14に保存されたすべてのレコードのバイナリコードについて、入力画像から抽出された特徴点の特徴量のバイナリコードとの比較を行い、最も近いバイナリコードを有する特徴点に対して、投票を行う。マッチング部15は、入力画像から抽出されたすべての特徴点について投票を行った結果、最も多くの票を獲得した参照画像を、この入力画像に対応する参照画像(以下、「対応参照画像」という。)であると決定する。
マッチング部15は、対応参照画像であると決定するための獲得票数の下限を設定してもよい。この場合は、最も多く票を獲得した参照画像の獲得票数がこの下限に満たない場合には、特徴点データベース14に対応参照画像は存在しないと判断される。また、マッチング部15は、対応参照画像であると決定するための獲得票数の閾値を設定して、この閾値以上の票を獲得した参照画像をすべて対応参照画像としてもよい。
マッチング部15は、対応参照画像の画像識別番号とともに、対応参照画像において投票を受けた特徴点(この特徴点を「対応参照画像の対応点」という。)の位置の情報、入力画像の特徴点のうち対応参照画像に投票された特徴点(この特徴点を「入力画像の対応点」という。)の位置の情報を対応関係算出部21に出力する。このとき、マッチング部15は、対応参照画像の対応点とそれに対して投票を行なった入力画像の対応点とを対にして出力する。図7は、対応点対を示す図である。
対応関係算出部21は、マッチング部15から入力した複数の対応点対に基づいて、対応参照画像上の任意の点(座標)を入力画像上の点(座標)に写像するホモグラフィ行列を算出する。具体的には、対応関係算出部21は、マッチング部15から入力した対応点対を用いて、以下の式(4)を満たすホモグラフィ行列AをRANSAC(Random Sample Consensus)法で推定する。
Figure 0005563494
このホモグラフィ行列Aを用いると、対応参照画像上の任意の点を入力画像上の点に写像させることができる。対応関係算出部21は、対応参照画像の画像識別番号とホモグラフィ行列Aとをコンテンツ変換部22に出力する。
コンテンツデータベース23は、入力画像上に重畳するコンテンツを記憶している。図8は、コンテンツデータベース23に保存されたデータを示す図である。図8に示すように、コンテンツデータベース23には、コンテンツごとに、コンテンツが対応する参照画像の画像識別番号、コンテンツデータ、コンテンツの形状、サイズ、及び重畳場所からなるレコードが記憶されている。
コンテンツデータは、テキストデータ、画像データ、動画データを含む、入力画像に重畳される各種のデータであってよい。図8の例では、画像識別番号1の参照画像には、コンテンツデータとして、「この写真は・・・」という参照画像に映っている対象物体の説明文(テキストデータ)、「http://www.abcdefg.com」という参考URL(テキストデータ)、及び参考画像の画像データが用意されている。
コンテンツ変換部22は、コンテンツデータベース23から、対応関係算出部21から入力した対応参照画像の画像識別番号に対応するコンテンツを抽出する。このとき、コンテンツ変換部22は、本発明のコンテンツ抽出部として機能する。コンテンツ変換部22は、対応関係算出部22から入力したホモグラフィ行列Aを用いて、抽出したコンテンツの重畳位置を変換して、コンテンツデータとともに重畳部24に出力する。
重畳部24は、画像取得部11から入力画像を取得し、コンテンツ変換部22から得たコンテンツデータを当該入力画像に重畳させて出力する。このとき、重畳部24は、入力画像中の、コンテンツ変換部22から出力された変換後の重畳位置に、コンテンツデータを重畳する。
以上のように、本実施の形態の対応参照画像検索装置10によれば、バイナリコードの特徴量を用いて入力画像と参照画像とのマッチング(対応参照画像の検索)を行なうので、マッチングの計算処理の負担を軽減できる。また、参照画像の特徴点の特徴量を保存したデータベースも、特徴量をバイナリコードの形式で記憶しているので、データベースに必要とされる容量が小さくて済む。従って、対応参照画像検索装置10は、限られた資源の装置において実現でき、また、この対応参照画像検索装置10を含むコンテンツ重畳装置110も、限られた資源の装置において実現できる。
本発明は、上記の実施の形態に限られず、種々の変形が可能である。以下、変形例を説明する。
(変形例1)
上記の実施の形態のバイナリ変換部13は、上式(1)を用いて特徴量をバイナリコードに変換するが、このとき、ベクトルwkに疎性をもたせることができる。また、ベクトルwkを一様分布からサンプリングするのではなく、次式(5)のようにサンプリングしてwを疎行列にしても、式(1)が近似的に成立する。
Figure 0005563494
なお、このような変換は、超疎ランダム写像(Very Sparse Random Projection)と呼ばれる。このときのwは疎行列であり、かつ非ゼロの要素が−1又は+1のみで構成されているので、行列wの計算において乗算が不要であり、また、加減算の回数が非常に少なくて済む。よって、バイナリ変換部13における計算コストを大幅に削減できる。
(変形例2)
図9は、変形例2のコンテンツ重畳装置の構成を示すブロック図である。変形例2のコンテンツ重畳装置120は、上記の実施の形態のコンテンツ重畳装置110と比較して、対応参照画像検索装置20に環境測定部16が追加されている。また、コンテンツ重畳装置120の対応参照画像検索装置20のバイナリ変換部13は、変換によって生成するバイナリコードのサイズを変更可能である。
本発明の対応参照画像検索装置ないしはコンテンツ重畳装置は、携帯電話端末や、ノートパソコン等の様々なデバイスに実装される。よって、デバイスの資源であるCPUの処理速度やデータベース(主記憶装置)の容量は、実行環境ごとに異なる。一方、バイナリ変換部13によって生成されるバイナリコードのサイズ(ビット数)は、それが小さいほど計算コストを軽減でき、必要なデータベースの容量も小さく抑えられるが、その反面、特徴量を表すバイナリコードのサイズが小さいとマッチング(対応参照画像の検索)の精度が低くなる。
そこで、環境測定部16は、対応参照画像検索装置20ないしはコンテンツ重畳装置120が実装されるデバイスのCPUの処理速度やデータベースの容量を測定し、その測定結果に応じてバイナリ変換部13にて生成するバイナリコードのサイズを決定する。そして、バイナリ変換部13は、環境測定部16にて決定されたサイズに基づいて、単精度実数の特徴量をバイナリコードに変換する。
さらに、バイナリ変換部13は、特徴点データベース14に保存するための参照画像の特徴量としてのバイナリコードを生成するときに利用した行列wのサイズを調整することで、生成するバイナリコードのサイズを調整する。
例えば、特徴量検出部12で検出される単精度実数の特徴量のベクトルがD次元であり、特徴点データベース14に保存されるバイナリコードが128ビットである場合は、バイナリ変換部13は、特徴点データベースに保存するための参照画像の特徴点の特徴量を求めるために、128行D列の行列wを用いて単精度実数の特徴量をバイナリコードに変換する。
この場合において、環境測定部16が決定したバイナリコードのサイズが64ビットであるときは、バイナリ変換部13は、128行D列の行列wから、1行目から64行目の部分を切出して、64行D列のサイズの行列w’を生成し、この行列W’を用いて入力画像の特徴点の特徴量をバイナリコードに変換する。この場合には、マッチング部15は、入力画像の特徴点の特徴量であるバイナリコード(64ビット)と、特徴点データベース14に記憶されたバイナリコード(128ビット)の上位64ビットとを比較して、投票をする特徴点を決定することで、マッチングを行なう。
この変形例2の対応参照画像検索装置20及びコンテンツ重畳装置120によれば、環境測定部16が、対応参照画像検索装置20ないしはコンテンツ重畳装置120が実装されるデバイスのCPUの処理速度やデータベースの容量といった実行環境に応じてバイナリ変換部13にて生成するバイナリコードのサイズを決定するので、実行環境に適したバイナリコードを生成できる。
(変形例3)
対応参照画像検索装置ないしはコンテンツ重畳装置は、携帯電話端末のように常に外部ネットワークと通信可能なデバイスに実装されてよい。対応参照画像検索装置ないしはコンテンツ重畳装置が常に外部ネットワークと通信可能である場合には、対応参照画像の検索を外部の装置で行うことも可能である。
図10は、変形例3のコンテンツ重畳システムの構成を示すブロック図である。コンテンツ重畳システム101は、コンテンツ重畳装置130と外部検索サーバ230とからなる。コンテンツ重畳装置130及び外部検索サーバ230にはそれぞれ通信部31、41が設けられており、互いに通信を行なう。
コンテンツ重畳装置130の構成は、通信部31を有しており、かつバイナリ変換部13において生成するバイナリコードのサイズが変更可能である点を除き、上記の実施の形態のコンテンツ重畳装置110と同様である。外部検索サーバ230は、通信部41のほか、マッチング部42、特徴点データベース43、及びコンテンツデータベース44を備えている。
コンテンツ重畳装置130は、上記の実施の形態と同様にして対応参照画像を検索してそのコンテンツデータベース23に記憶されたコンテンツを入力画像に重畳させることができる。コンテンツ重畳装置130は、さらに、入力画像から抽出された特徴点の特徴量を表すバイナリコードを、通信部31を介して外部検索サーバ230に送信することもできる。
外部検索サーバ230は通信部41でバイナリコードの特徴量を受信する。マッチング部42は、このバイナリコードに基づいて、特徴点データベース43に保存された特徴点に投票をすることで、対応参照画像を検索する。通信部41は、対応参照画像の画像識別番号及び対応点対の情報をコンテンツ重畳装置130に送信する。通信部41はまた、コンテンツデータベース44から対応参照画像に対応するコンテンツのレコード(コンテンツデータ及びコンテンツの重畳位置の情報を含む)を抽出してコンテンツ重畳装置130に送信する。
コンテンツ重畳装置130の通信部31は、対応点対の情報、及び対応参照画像に対応するコンテンツのレコードを受信する。対応関係算出部21は、通信部31にて受信した対応点対に基づいて、ホモグラフィ行列を算出する。コンテンツ変更部22は、対応関係算出部21にて算出されたホモグラフィ行列を用いて、通信部31にて受信したコンテンツの重畳位置を変換する。重畳部24は、上記の実施の形態と同様に、コンテンツ変換部22から出力された、重畳位置の変換されたコンテンツを、画像取得部11から得た入力画像に重畳させる。
変形例3では、上記の説明のように対応参照画像の検索を外部検索サーバ230にて行う場合には、バイナリ変換部13は、外部検索サーバ230の計算能力に応じてバイナリコードのサイズを変更する。外部検索サーバ230がコンテンツ重畳装置130よりも高機能であるときは、バイナリ変換部13は、バイナリコードのサイズを大きくする(ビット数を長くする)。
変形例3によれば、携帯電話端末のような計算資源の限られた環境のみで対応参照画像の検索を行うのではなく、より計算の環境が整った外部検索サーバで検索を行うことができる。しかも、バイナリ変換部13は、バイナリコードのサイズを適切な大きさに調節できるので、小規模なリアルタイムマッチング処理には、携帯電話端末であるコンテンツ重畳装置130内で上記の実施の形態のようにして対応参照画像を検索し、大規模なマッチング処理をする場合には、携帯電話端末より処理能力の高い外部検索サーバに、よりサイズの大きいバイナリコードを用いて対応参照画像の検索を行わせることができる。
なお、コンテンツ重畳装置130が単体でコンテンツの重畳を行わない場合には、コンテンツ重畳装置130は、特徴点データベース14、マッチング部15、又はコンテンツデータベース23を備えていなくてもよく、また、対応関係算出部21、又は、対応関係算出部21及びコンテンツ変換部22、又は、対応関係算出部21、コンテンツ変換部22、及び重畳部24が、外部検索サーバ230に備えられていてもよい。逆に、外部検索サーバ230がコンテンツデータベース44を備えず、マッチング部42によるマッチングの結果のみをコンテンツ重畳装置130に送信するようにしてもよい。
(変形例4)
コンテンツ重畳装置が通信部を備えて外部検索サーバと通信をすることにより、以下のようなコンテンツ重畳システムも実現できる。図11は、変形例4のコンテンツ重畳システムの構成を示すブロック図である。コンテンツ重畳システム102は、コンテンツ重畳装置140と外部検索サーバ240とからなる。このコンテンツ重畳システム102は、コンテンツを重畳する対象が書籍の頁の画像である場合に好適に用いられる。以下では、コンテンツを重畳する対象が書籍の頁の画像である場合を例にコンテンツ重畳システム102を説明する。
例えば、参照画像を保存すべき書籍が5000冊存在し、各書籍の頁数が平均300頁であるとすると、特徴点データベースには、150万頁分の特徴点(各頁につき、複数の特徴点がある)のレコードを保存しておく必要がある。しかし、携帯電話端末のような小型ないしは携帯型のデバイスにこのような大量のデータをすべて保存することは、ストレージデバイスの容量の制限により不可能である。また、仮にそのような大量のデータを携帯電話端末に保存できたとしても、検索対象が多すぎて、マッチングの計算コストが膨大になる。さらに、検索対象が多いので、バイナリコードを長くしないと、検索精度が悪化するという問題もある。
そこで、コンテンツ重畳システム102では、すべての書籍のすべての頁についてのすべての特徴点のレコードは、大容量のデータベースを比較的容易に実現でき、物理的な制約も比較的少ない外部検索サーバ240の特徴点データベース43に保存しておく。
図12は、特徴点データベース43に保存されたデータの構成を示す図である。図12に示すように、特徴点データベース43には、特徴点ごとに、書籍番号、頁番号、バイナリコード(128ビットと64ビット)、及び特徴点の位置(座標)からなるレコードが記憶されている。上記の実施の形態と同様に、1つの参照画像(1頁の画像)について、複数の特徴点のレコードが記憶されている。
コンテンツ重畳装置140は、画像取得部11にて入力画像を取得すると、特徴量検出部12にて特徴点の特徴量を検出して、バイナリ変換部13がその特徴量をバイナリコードに変換する。そして、通信部31がそのバイナリコードを外部検索サーバ240に送信する。
外部検索サーバ240は、通信部41にてコンテンツ重畳装置140からバイナリコードを受信する。マッチング部42は、通信部41にて受信したバイナリコード(入力画像から抽出された特徴点の数だけある)を用いて、投票を行い、投票を最も多く獲得した参照画像を対応参照画像として検出する。対応参照画像は、5000冊の書籍の中のある1冊の書籍のある1頁の画像である。
通信部41は、特徴点データベース43に記憶されたレコードのうち、マッチング部42にて検出された対応参照画像が所属する書籍番号のレコード(即ち対応参照画像及び対応参照画像に関連する他の参照画像のレコード)をコンテンツ重畳装置140に送信する。このとき、通信部41は、当該書籍番号のレコードのうち、少なくとも頁番号、バイナリコード(128ビット及び64ビットのいずれか一方)、及び特徴点の位置の情報を送信する。このようにして外部検索サーバ240からコンテンツ重畳装置140にダウンロードされるデータを特徴点データベース更新データという。
128ビット及び64ビットのいずれのバイナリコードを送信するかは、送信先、即ちコンテンツ重畳装置140の計算能力やデータベースの容量による。128ビット及び64ビットのいずれのバイナリコードを送信するかは、外部検索サーバ240が送信先であるコンテンツ重畳装置140の計算能力やデータベースの容量を認識して決定してもよいし、コンテンツ重畳装置140側からバイナリコードのサイズを指定してもよい。
なお、上述のように、外部検索サーバ240にて書籍を特定するために、コンテンツ重畳装置140がまず入力画像の特徴点の特徴量を外部検索サーバ240に送信するが、この特徴量(バイナリデータ)のサイズと、外部検索サーバ240がコンテンツ重畳装置140に送信するバイナリコードのサイズとは必ずしも一致しなくてもよく、特に、前者が大きく、後者が小さくてよい。
外部検索サーバ240の特徴点データベース43中の一部のレコードである特徴点データベース更新データを受信したコンテンツ重畳装置140の通信部31は、これを特徴点データベース14に保存し、あるいは既に特徴点データベース14に何らかのデータが保存されている場合には、特徴点データベース更新データで特徴点データベース14を更新する。そして、それ以降の入力画像については、この特徴点データベース14に保存された特徴点データベース更新データを用いてマッチング(対応参照画像の検索)を行う。このとき、バイナリ変換部13は、特徴点データベース更新データにおけるバイナリコードのサイズと同じサイズになるように、特徴量検出部12にて検出された単精度実数の特徴量をバイナリコードに変換する。
変形例4のコンテンツ重畳システム102によれば、コンテンツ重畳装置140が、例えば5000冊×300頁といった大量の参照画像の特徴点についてデータベースにその特徴量を保存していなくても、必要なデータのみを外部検索サーバ240からダウンロードすることができる。
さらに、必要な特徴点データベース更新データを特定するために(即ち、書籍を特定するために)外部検索サーバ240に入力画像の特徴点のバイナリコードの特徴量を送信する場合には、外部検索サーバ240のマッチング部42における検索の精度を確保するために、バイナリ変換部13がサイズの大きいバイナリコードを生成して、これを外部検索サーバ240に送信するとともに、外部検索サーバ240から特徴点データベース更新データをダウンロードした後には、バイナリ変換部13は、入力画像から検出された特徴量を、その特徴点データベース更新データにおけるバイナリコードのサイズに応じたサイズのバイナリコードに変換することができる。
なお、変形例4において、コンテンツ重畳装置140が外部検索サーバ240からダウンロードする特徴点データベース更新データにおけるバイナリコードは、該当書籍を識別する能力だけを向上させるように構成することもできる。すなわち、変形例4の外部検索サーバ240のように、あらゆる任意の画像から対象を識別する場合と異なり、書籍ごとの頁の画像だけを識別の対象としている場合には、識別対象の数が少なくなるため、バイナリ変換をする際に用いる変換行列wを書籍ごとに機械学習によって生成して、効率的にマッチングを行なえるようにバイナリコードを生成することができる。
このとき、変換行列wは、外部検索サーバ240から、該当書籍の特徴点データベース更新データともにコンテンツ重畳装置140にダウンロードすることができる。そして、コンテンツ重畳装置140のバイナリ変換部13は、該当書籍の特徴点データベース更新データをダウンロードした後は、それとともにダウンロードした変換行列wを用いて入力画像の特徴点の特徴量をバイナリ変換する。この構成により、あらゆる任意の書籍の頁の画像をマッチングの対象とする場合と比較して、特徴点データベース14の容量や対応参照画像検索装置10ないしはコンテンツ重畳装置140の計算コストの削減を期待できる。
なお、ARの対象とする書籍が変更されると、外部検索サーバ240からコンテンツ重畳装置140の特徴点データベース14にダウンロードした特徴点データベース更新データは使用できなくなる。この場合には、マッチング部15で対応参照画像を検出できなくなる。よって、マッチング部15で対応参照画像を検出できなくなった場合には、再度、通信部31を介して外部検索サーバ240に入力画像の特徴点の特徴量のバイナリコードを送信し、外部検索サーバ240でマッチングを行なって新たな書籍を特定して、コンテンツ重畳装置140にて新たな特徴点データベース更新データをダウンロードして、特徴点データベース14を更新すればよい。
なお、上記の実施の形態及び各変形例では、特徴点データベースには、画像識別番号が1つの画像ごとに付与されており、マッチング部は、対応参照画像として検出された1つの画像の中の対応点を対応関係算出部に出力した。しかし、本発明は、これに限られない。本発明は、コンテンツを付与する対象を参照画像として、特徴点データベースにおいて、コンテンツを付与する対象ごとに画像識別番号を付与してもよい。即ち、参照画像は1つの画像でなくてもよく、1つの画像に含まれる特徴点の集合を参照画像としてもよい。
例えば、図2に示す画像があった場合に、この画像中の山形の対象に関連する特徴点の集合(図3参照)を1つの参照画像とし、雲形の対象に関連する特徴点の集合(図3参照)を他の参照画像としてもよい。この場合は、特徴点データベースには、山形の対象に関連する特徴点と雲形の対象に関連する特徴点とで異なる画像識別番号が付与され、マッチング部は、投票を多く受けて対応参照画像として検出された対象に関連する特徴点(同一の画像識別番号が付与された特徴点)のうち、入力画像の特徴点と対応する点を対応参照画像の対応点として対応関係算出部に出力する。この場合には、コンテンツデータベースも対象ごとにコンテンツを記憶している。
以上のように、本発明は、資源の限られた装置においても有効に、入力画像に対応する参照画像の検索を行うことができるという効果を有し、画像の特徴点を用いて入力画像に対応する参照画像を検索する対応参照画像検索装置等として有用である。
10、20 対応参照画像検索装置
11 画像取得部
12 特徴量検出部
13 バイナリ変換部
14 特徴点データベース
15 マッチング部
16 環境測定部
21 対応関係算出部
22 コンテンツ変換部
23 コンテンツデータベース
24 重畳部
31 通信部
41 通信部
42 マッチング部
43 特徴点データベース
44 コンテンツデータベース
101、102 コンテンツ重畳システム
110、120、130、140 コンテンツ重畳装置
230、240 外部検索サーバ

Claims (15)

  1. 入力画像に対応する参照画像を検索する対応参照画像検索装置であって、
    入力画像から特徴点を抽出して前記特徴点の特徴量を検出する特徴量検出部と、
    変換行列を用いて、前記特徴量検出部にて検出された特徴量をバイナリコードに変換するバイナリ変換部と、
    複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースと、
    前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量と、前記特徴点データベースに記憶された前記複数の参照画像のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するマッチング部と、
    を備えたことを特徴とする対応参照画像検索装置。
  2. 前記マッチング部は、前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量と、前記特徴点データベースに記憶された前記複数の参照画像のバイナリコードの特徴量とを、それらのハミング距離によって比較することを特徴とする請求項1に記載の対応参照画像検索装置。
  3. 前記変換行列は、疎行列であることを特徴とする請求項1又は2に記載の対応参照画像検索装置。
  4. 前記バイナリ変換部は、前記変換行列のサイズを変更することで、前記バイナリコードのサイズを変更可能であることを特徴とする請求項1又は2に記載の対応参照画像検索装置。
  5. 前記マッチング部は、前記入力画像に対応する複数の参照画像がある場合には、複数の参照画像を検出することを特徴とする請求項1ないし請求項4のいずれか一項に記載の対応参照画像検索装置。
  6. 前記対応参照画像検索装置の実行環境を測定する環境測定部をさらに含み、
    前記バイナリ変換部は、前記環境測定部による測定結果に応じて前記変換行列のサイズを変更することで、前記バイナリコードのサイズを変更する
    ことを特徴とする請求項1又は2に記載の対応参照画像検索装置。
  7. 請求項1ないし請求項6のいずれか一項に記載の対応参照画像検索装置を備え、前記入力画像に対して対応するコンテンツを重畳するコンテンツ重畳装置であって、
    コンテンツ及び前記参照画像と前記コンテンツとの対応関係を記憶したコンテンツデータベースと、
    前記マッチング部で検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出するコンテンツ抽出部と、
    前記コンテンツ抽出部にて抽出されたコンテンツを前記入力画像に重畳する重畳部と、
    を備えたことを特徴とするコンテンツ重畳装置。
  8. 前記特徴量検出部は、前記入力画像中の位置の情報を含む特徴点を抽出し、
    前記特徴点データベースは、複数の参照画像の各々の特徴点の特徴量とともに、前記各特徴点の位置の情報を記憶しており、
    前記コンテンツデータベースは、さらに、前記コンテンツの重畳位置を記憶しており、
    前記コンテンツ重畳装置は、さらに、前記特徴量検出部にて抽出された特徴点の位置と前記特徴点データベースに記憶された特徴点の位置との関係に基づいて、前記コンテンツ抽出部にて抽出されたコンテンツの、前記コンテンツデータベースに記憶された前記重畳位置を変換するコンテンツ変換部を備え、
    前記重畳部は、前記入力画像中の前記コンテンツ変換部にて変換された重畳位置に前記コンテンツ抽出部にて抽出されたコンテンツを重畳する
    ことを特徴とする請求項7に記載のコンテンツ重畳装置。
  9. コンテンツ重畳装置と、前記コンテンツ重畳装置と通信可能な外部検索サーバとからなるコンテンツ重畳システムであって、
    前記コンテンツ重畳装置は、
    入力画像から特徴点を抽出して前記特徴点の特徴量を検出する特徴量検出部と、
    変換行列を用いて、前記特徴量検出部にて検出された特徴量をバイナリコードに変換するバイナリ変換部と、
    前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量を前記外部検索サーバに送信するコンテンツ重畳装置側通信部と、
    を備え、
    前記外部検索サーバは、
    前記コンテンツ重畳装置側通信部より送信された前記入力画像のバイナリコードの特徴量を受信する外部検索サーバ側通信部と、
    複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した外部検索サーバ側特徴点データベースと、
    前記外部検索サーバ側通信部にて受信した前記入力画像のバイナリコードの特徴量と、前記外部検索サーバ側特徴点データベースに記憶された前記複数の参照画像のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出する外部検索サーバ側マッチング部と、
    を備えたことを特徴とするコンテンツ重畳システム。
  10. 前記特徴量検出部は、前記入力画像中の位置の情報を含む特徴点を抽出し、
    前記特徴点データベースは、複数の参照画像の各々の特徴点の特徴量とともに、前記各特徴点の位置の情報を記憶しており、
    前記コンテンツ重畳システムは、
    前記特徴点データベースに記憶された参照画像と前記コンテンツとの対応関係、及び前記コンテンツの重畳位置を記憶したコンテンツデータベースと、
    前記外部検索サーバ側マッチング部で検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出して、前記特徴量検出部にて抽出された特徴点の位置と前記特徴点データベースに記憶された特徴点の位置との関係に基づいて、前記コンテンツデータベースから抽出されたコンテンツの、前記コンテンツデータベースに記憶された前記重畳位置を変換するコンテンツ変換部と、
    前記入力画像中の前記コンテンツ変換部にて変換された重畳位置に前記コンテンツ変換部にて抽出されたコンテンツを重畳する重畳部と、
    をさらに備えたことを特徴とする請求項9に記載のコンテンツ重畳システム。
  11. 前記コンテンツ重畳装置は、
    複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶したコンテンツ重畳装置側特徴点データベースと、
    前記バイナリ変換部にて変換された前記入力画像のバイナリコードの特徴量と、前記コンテンツ重畳装置側特徴点データベースに記憶された前記バイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するコンテンツ重畳装置側マッチング部と、
    を備え、
    前記外部検索サーバ側通信部は、外部検索サーバ側特徴点データベースに記憶された特徴量のうち、前記外部検索サーバ側マッチング部にて検出された参照画像及びそれに関連する参照画像の特徴量を前記コンテンツ重畳装置に送信し、
    前記コンテンツ重畳装置側通信部は、前記外部検索サーバ側通信部より送信された前記バイナリコードの特徴量を受信し、
    前記コンテンツ重畳装置側特徴点データベースは、前記コンテンツ重畳装置側通信部にて受信した前記バイナリコードの特徴量を、前記複数の参照画像の各々の特徴点の特徴量とする
    ことを特徴とする請求項9に記載のコンテンツ重畳システム。
  12. 複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースを備えた対応参照画像検索装置における、入力画像に対応する参照画像を検索する対応参照画像検索方法であって、
    入力画像から特徴点を抽出する特徴点抽出ステップと、
    前記特徴点抽出ステップにて抽出された前記特徴点の特徴量を検出する特徴量検出ステップと、
    変換行列を用いて、前記特徴量検出ステップにて検出された特徴量をバイナリコードに変換するバイナリコード変換ステップと、
    前記バイナリコード変換ステップにて変換された前記入力画像のバイナリコードの特徴量と、前記特徴点データベースに記憶された前記複数の参照画像の各々のバイナリコードの特徴量とを比較することで、前記複数の参照画像の中から前記入力画像に対応する参照画像を検出するマッチングステップと、
    を含むことを特徴とする対応参照画像検索方法。
  13. 複数の参照画像の各々の特徴点の特徴量をバイナリコードの形式で記憶した特徴点データベースを備えた対応参照画像検索装置と、前記特徴点データベースに記憶された参照画像とコンテンツとの対応関係を記憶したコンテンツデータベースとを備えたコンテンツ重畳装置における、入力画像に対して対応するコンテンツを重畳するコンテンツ重畳方法であって、
    請求項12に記載の対応参照画像検索方法にて、前記入力画像に対応する参照画像を検出する対応参照画像検索ステップと、
    前記対応参照画像検索ステップにて検出された参照画像に対応するコンテンツを前記コンテンツデータベースから抽出するコンテンツ抽出ステップと、
    前記コンテンツ抽出部にて抽出されたコンテンツを前記入力画像に重畳する重畳ステップと、
    を含むことを特徴とするコンテンツ重畳方法。
  14. 請求項12に記載の対応参照画像検索方法をコンピュータに実行させるためのコンピュータプログラム。
  15. 請求項13に記載のコンテンツ重畳方法をコンピュータに実行させるためのコンピュータプログラム。

JP2011019575A 2011-02-01 2011-02-01 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム Active JP5563494B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011019575A JP5563494B2 (ja) 2011-02-01 2011-02-01 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011019575A JP5563494B2 (ja) 2011-02-01 2011-02-01 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2012160047A JP2012160047A (ja) 2012-08-23
JP5563494B2 true JP5563494B2 (ja) 2014-07-30

Family

ID=46840522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011019575A Active JP5563494B2 (ja) 2011-02-01 2011-02-01 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5563494B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5592337B2 (ja) * 2011-11-18 2014-09-17 日本電信電話株式会社 コンテンツ変換方法、コンテンツ変換装置及びコンテンツ変換プログラム
JP2014106618A (ja) * 2012-11-26 2014-06-09 Usac System Kk サーバ装置、端末装置、arコンテンツ提供方法、およびプログラム
JP2014144398A (ja) * 2013-01-28 2014-08-14 Japan Post Co Ltd 配送物区分システム及び配送物区分方法
JP6035173B2 (ja) * 2013-03-14 2016-11-30 株式会社デンソーアイティーラボラトリ 画像検索システム及び画像検索方法
JP6041439B2 (ja) * 2013-09-12 2016-12-07 Kddi株式会社 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法
JP6357676B2 (ja) * 2013-09-19 2018-07-18 株式会社北電子 情報提供システム
JP6393982B2 (ja) 2013-12-17 2018-09-26 富士通株式会社 空間分割方法、空間分割装置および空間分割プログラム
JP6156126B2 (ja) 2013-12-19 2017-07-05 富士通株式会社 検索方法、検索プログラムおよび検索装置
JP6277710B2 (ja) 2013-12-20 2018-02-14 富士通株式会社 空間分割方法、空間分割装置および空間分割プログラム
JP6364387B2 (ja) * 2015-08-17 2018-07-25 日本電信電話株式会社 特徴量生成装置、方法、及びプログラム
KR102002573B1 (ko) * 2015-09-24 2019-07-22 구글 엘엘씨 빠른 직교 투영
US10394777B2 (en) 2015-09-24 2019-08-27 Google Llc Fast orthogonal projection
US10572221B2 (en) * 2016-10-20 2020-02-25 Cortical.Io Ag Methods and systems for identifying a level of similarity between a plurality of data representations
WO2023038273A1 (ko) * 2021-09-08 2023-03-16 고려대학교 산학협력단 바이너리 파일 고정화와 웨이블릿 신호처리를 통한 바이너리 파일 특징 정보 추출

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4242529B2 (ja) * 1999-10-27 2009-03-25 オリンパス株式会社 関連情報呈示装置及び関連情報呈示方法
JP2006301664A (ja) * 2002-05-24 2006-11-02 Olympus Corp 視野一致型情報呈示システム
US8199973B2 (en) * 2006-08-31 2012-06-12 Osaka Prefecture University Public Corporation Image recognition method, image recognition device, and image recognition program
EP2284796A4 (en) * 2008-04-28 2012-10-31 Univ Osaka Prefect Public Corp METHOD FOR CREATING AN IMAGE DATABASE FOR OBJECT RECOGNITION, PROCESSING DEVICE AND PROCESSING PROGRAM
JP5068227B2 (ja) * 2008-08-04 2012-11-07 富士フイルム株式会社 書類管理サーバ、書類閲覧システム、書類管理方法及び書類閲覧方法

Also Published As

Publication number Publication date
JP2012160047A (ja) 2012-08-23

Similar Documents

Publication Publication Date Title
JP5563494B2 (ja) 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム
US8180146B2 (en) Method and apparatus for recognizing and localizing landmarks from an image onto a map
JP6211407B2 (ja) 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム
CN106203242B (zh) 一种相似图像识别方法及设备
WO2017075939A1 (zh) 一种图像内容识别方法及装置
CN111046125A (zh) 一种视觉定位方法、系统及计算机可读存储介质
AU2018202767B2 (en) Data structure and algorithm for tag less search and svg retrieval
US11714921B2 (en) Image processing method with ash code on local feature vectors, image processing device and storage medium
JP2017004252A (ja) 画像情報処理システム
JP2023520625A (ja) 画像特徴マッチング方法及び関連装置、機器並びに記憶媒体
CN111832579B (zh) 地图兴趣点数据处理方法、装置、电子设备以及可读介质
CN110926478A (zh) 一种ar导航路线纠偏方法、系统及计算机可读存储介质
CN111373393B (zh) 图像检索方法和装置以及图像库的生成方法和装置
JP6035173B2 (ja) 画像検索システム及び画像検索方法
JP7430243B2 (ja) 視覚的測位方法及び関連装置
JP5536124B2 (ja) 画像処理システム及び画像処理方法
US20150254527A1 (en) Methods for 3d object recognition and registration
US10853972B2 (en) Apparatus for processing image and method thereof
CN114674328B (zh) 地图生成方法、装置、电子设备、存储介质、及车辆
Chen et al. Context-aware discriminative vocabulary learning for mobile landmark recognition
Casanova et al. SmartVisionApp: A framework for computer vision applications on mobile devices
JP6244887B2 (ja) 情報処理装置、画像探索方法、及びプログラム
JP6218237B2 (ja) 撮影画像を平行化する画像変換プログラム、装置及び方法
Xiong et al. SmartGuide: Towards single-image building localization with smartphone
JP2013073333A (ja) 画像マッチング装置及び画像マッチングプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140612

R150 Certificate of patent or registration of utility model

Ref document number: 5563494

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250