JPWO2013115202A1 - 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム - Google Patents

情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム Download PDF

Info

Publication number
JPWO2013115202A1
JPWO2013115202A1 JP2013556424A JP2013556424A JPWO2013115202A1 JP WO2013115202 A1 JPWO2013115202 A1 JP WO2013115202A1 JP 2013556424 A JP2013556424 A JP 2013556424A JP 2013556424 A JP2013556424 A JP 2013556424A JP WO2013115202 A1 JPWO2013115202 A1 JP WO2013115202A1
Authority
JP
Japan
Prior art keywords
feature
local
local feature
search object
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013556424A
Other languages
English (en)
Other versions
JP6168303B2 (ja
Inventor
野村 俊之
俊之 野村
山田 昭雄
昭雄 山田
岩元 浩太
浩太 岩元
亮太 間瀬
亮太 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013556424A priority Critical patent/JP6168303B2/ja
Publication of JPWO2013115202A1 publication Critical patent/JPWO2013115202A1/ja
Application granted granted Critical
Publication of JP6168303B2 publication Critical patent/JP6168303B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using shape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30112Baggage; Luggage; Suitcase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

リアルタイムで映像中の画像内の捜索物を認識する技術を提供する。捜索物と、捜索物の画像のm個の特徴点の局所領域の、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶しておき、撮像した映像中の画像からn個の特徴点を抽出して、n個の特徴点の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成し、第1局所特徴量の次元数iおよび第2局所特徴量の次元数jのうち、より少ない次元数を選択し、選択次元数までのn個の第2局所特徴量に、選択次元数までのm個の第1局所特徴量の所定割合以上が対応すると判定した場合に、映像中の画像に捜索物が存在すると認識することを特徴とする。

Description

本発明は、局所特徴量を使用して撮像した映像から捜索物を見付けるための技術に関する。
上記技術分野において、特許文献1には、捜索依頼の画像情報と提供された画像情報との一致を捜索して、捜索対象の捜索結果を捜索依頼者に提供する技術が記載されている。また、特許文献2には、あらかじめモデル画像から生成されたモデル辞書を使用して、クエリ画像を認識する場合に、特徴量をクラスタリングすることにより認識速度を向上した技術が記載されている。
特開2005−222250号公報 特開2011−221688号公報
しかしながら、上記文献に記載の技術では、リアルタイムで映像中の画像内の捜索物を認識することができなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係るシステムは、
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
第1撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る方法は、
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムの情報処理方法であって、
第1撮像手段によって撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る装置は、
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信手段と、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る方法は、
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
をコンピュータに実行させることを特徴とする。
上記目的を達成するため、本発明に係る装置は、
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成手段と、
撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信手段と、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
撮像した捜索物が、他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
をコンピュータに実行させることを特徴とする。
上記目的を達成するため、本発明に係る装置は、
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御方法であって、
前記捜索物を捜索する第通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御プログラムであって、
前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
をコンピュータに実行させることを特徴とする。
本発明によれば、リアルタイムで映像中の画像内の捜索物を認識することができる。
本発明の第1実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第2実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第2実施形態に係る情報処理システムの動作を説明する図である。 本発明の第2実施形態に係る情報処理システムの動作手順を示すシーケンス図である。 本発明の第2実施形態に係る捜索依頼用通信端末の機能構成を示すブロック図である。 本発明の第2実施形態に係る捜索用通信端末の機能構成を示すブロック図である。 本発明の第2実施形態に係る捜索サーバの機能構成を示すブロック図である。 本発明の第2実施形態に係る局所特徴量DBの構成を示す図である。 本発明の第2実施形態に係る捜索物DBの構成を示す図である。 本発明の第2実施形態に係る精度調整DBの構成を示す図である。 本発明の第2実施形態に係る局所特徴量生成部の機能構成を示すブロック図である。 本発明の第2実施形態に係る局所特徴量生成の手順を説明する図である。 本発明の第2実施形態に係る局所特徴量生成の手順を説明する図である。 本発明の第2実施形態に係る局所特徴量生成部でのサブ領域の選択順位を示す図である。 本発明の第2実施形態に係る局所特徴量生成部での特徴ベクトルの選択順位を示す図である。 本発明の第2実施形態に係る局所特徴量生成部での特徴ベクトルの階層化を示す図である。 本発明の第2実施形態に係る符号化部の構成を示す図である。 本発明の第2実施形態に係る捜索物認識部の処理を示す図である。 本発明の第2実施形態に係る精度調整部の第1の構成を示すブロック図である。 本発明の第2実施形態に係る精度調整部の第2の構成を示すブロック図である。 本発明の第2実施形態に係る精度調整部の第2の構成による処理を説明する図である。 本発明の第2実施形態に係る精度調整部の第3の構成を示すブロック図である。 本発明の第2実施形態に係る精度調整部の第4の構成を示すブロック図である。 本発明の第2実施形態に係る捜索依頼用通信端末のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る捜索依頼用通信端末における局所特徴量生成テーブルを示す図である。 本発明の第2実施形態に係る捜索依頼用通信端末の処理手順を示すフローチャートである。 本発明の第2実施形態に係る局所特徴量生成処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る符号化処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る差分値の符号化処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る捜索用通信端末のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る精度パラメータの構成を示す図である。 本発明の第2実施形態に係る捜索用通信端末の処理手順を示すフローチャートである。 本発明の第2実施形態に係る捜索サーバのハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る捜索サーバの処理手順を示すフローチャートである。 本発明の第2実施形態に係る捜索物認識処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る照合処理の処理手順を示すフローチャートである。 本発明の第2実施形態に係る捜索物確認処理の処理手順を示すフローチャートである。 本発明の第3実施形態に係る情報処理システムの動作手順を示すシーケンス図である。 本発明の第4実施形態に係る情報処理システムの動作手順を示すシーケンス図である。 本発明の第5実施形態に係る通信端末の機能構成を示すブロック図である。 本発明の第6実施形態に係る情報処理システムの構成を示すブロック図である。 本発明の第6実施形態に係る情報処理システムの動作手順を示すシーケンス図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
[第1実施形態]
本発明の第1実施形態としての情報処理システム100について、図1を用いて説明する。情報処理システム100は、局所特徴量を使用して撮像した映像から捜索物を見付けるためのシステムである。
図1に示すように、情報処理システム100は、第1局所特徴量記憶部110と、第1撮像部120と、第2局所特徴量生成部130と、認識部140と、を含む。第1局所特徴量記憶部110は、捜索物111と、捜索物111の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量112とを、対応付けて記憶する。第2局所特徴量生成部130は、第1撮像部120が撮像した映像中の画像101からn個の特徴点131を抽出する。そして、第2局所特徴量生成部130は、n個の特徴点のそれぞれを含むn個の局所領域132について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量133を生成する。認識部140は、第1局所特徴量112の特徴ベクトルの次元数iおよび第2局所特徴量133の特徴ベクトルの次元数jのうち、より少ない次元数を選択する。そして、認識部140は、選択された次元数までの特徴ベクトルからなるn個の第2局所特徴量133に、選択された次元数までの特徴ベクトルからなるm個の第1局所特徴量112の所定割合以上が対応すると判定した場合に(141)、映像中の画像101に捜索物111が存在すると認識する。
本実施形態によれば、リアルタイムで映像中の画像内の捜索物を認識することができる。
[第2実施形態]
次に、本発明の第2実施形態に係る情報処理システムについて説明する。本実施形態においては、盗難物や遺失物を含む捜索物の依頼を捜索物画像の局所特徴量と共に受ける。そして、様々な通信端末から受信した局所特徴量との照合に基づいて、捜索物を見付けて捜索者に報知する。なお、本実施形態においては、捜索物として盗難物や遺失物を例に説明するが、捜索物は捜索人物であってもよい。
本実施形態によれば、リアルタイムで映像中の画像内の捜索物を見付けることができる。
《情報処理システムの構成》
図2は、本実施形態に係る情報処理システム200の構成を示すブロック図である。
図2の情報処理システム200は、盗難物や遺失物の局所特徴量を、写真を撮って取得し、様々な場所の監視カメラや個人の携帯端末のカメラからの映像、あるいは放送映像や再生映像から盗難物や遺失物を見付ける。情報処理システム200は、ネットワーク240を介してそれぞれ接続される、捜索用通信端末211〜214と、情報処理装置である捜索サーバ220と、捜索依頼用通信端末230と、を含む。
図2の情報処理システム200では、捜索用通信端末211〜214は、カメラ付き携帯端末211と、様々な場所に設置された監視カメラ212および213と、放送再生機器214とを、含む。なお、図2においては、監視カメラ212は空港内の監視カメラであり、監視カメラ213はホテル内の監視カメラである。捜索用通信端末211〜214は、それぞれ局所特徴量生成部211a〜214aを有し、撮像した映像から局所特徴量を生成して、捜索サーバに送信する。なお、捜索用通信端末211〜214は、捜索専用である必要はなく、それぞれの役割を果たすと同時に、並行して常時あるいは捜索サーバ220から指定された期間、局所特徴量を捜索サーバ220に送信する。
また、情報処理システム200は、カメラを有する捜索依頼用通信端末230として含む。捜索依頼用通信端末230は、局所特徴量生成部230aを有し、撮像した映像から局所特徴量を生成する。図2においては、盗難物あるいは遺失物のバッグ231の写真をカメラで撮像して、局所特徴量生成部230aによりバッグ231の局所特徴量を生成する。
また、情報処理システム200は、捜索依頼用通信端末230から捜索依頼をされたバッグ231の局所特徴量を、捜索用通信端末211〜214から受信した局所特徴量と照合して、映像内からバッグ231を捜索する捜索サーバ220を含む。捜索サーバ220は、捜索依頼用通信端末230から捜索依頼された捜索物に対応付けて局所特徴量を記憶する局所特徴量DB221(図8参照)と、捜索物の所有者などを記憶する捜索物DB222(図9参照)とを有する。捜索サーバ220は、局所特徴量DB221に記憶された局所特徴量を、捜索用通信端末211〜214から受信した局所特徴量と照合する。そして、捜索物を見付けると、その結果を捜索依頼用通信端末230に通知する。
(情報処理システムの動作)
図3は、本実施形態に係る情報処理システム200の動作を説明する図である。
捜索依頼用通信端末230で盗難物あるいは遺失物の写真のバッグ231を撮像した画像310には、バッグ231が写っている。この画像310から局所特徴量が生成される。一方、捜索用通信端末211〜214で撮像されたそれぞれの映像311〜314から、それぞれの局所特徴量が生成される。これらの局所特徴量は局所特徴量照合部300で照合されて、画像310から生成された局所特徴量が映像311〜314から生成された局所特徴量の一部に一致すると、捜索用通信端末211〜214で撮像された映像中にバッグ231があると判定する。
例えば、捜索用通信端末212が撮像した空港の映像312中にバッグ231があると判定した場合には、捜索依頼用通信端末230には、空港からの映像中の捜索物候補のバッグ322と捜索結果321とが重畳された画像320が報知される。捜索結果321には、“○○空港、第nゲートに類似品発見”とのコメントが報知されている。
《情報処理システムの動作手順》
図4は、本実施形態に係る情報処理システム200の動作手順を示すシーケンス図である。
まず、必要であれば、ステップS400において、捜索サーバ220から捜索用通信端末211〜241や捜索依頼用通信端末230にアプリケーションおよび/またはデータのダウンロードを行なう。そして、ステップS401において、本実施形態の処理を行なうための、アプリケーションの起動と初期化が行なわれる。
ステップS403において、捜索依頼用通信端末230は、捜索物の画像を撮影する。なお、捜索物の画像は、写真や絵などの実物の特徴を有するものが望ましい。あるいは、捜索物の数が少ない場合は、類似品を撮影してもよい。ステップS405において、捜索物の画像から局所特徴量を生成する。続いて、ステップS407において、局所特徴量と特徴点座標とを符号化する。捜索物に関する情報と局所特徴量とは、ステップS409において、捜索依頼用通信端末230から捜索サーバ220に送信される。
捜索サーバ220は、捜索物に関する情報と局所特徴量とを受信して、捜索物IDに対応付けて局所特徴量を局所特徴量DB221に記憶する。同時に、捜索物IDに対応付けて、捜索物に関する情報を捜索物DB222に記憶する。また、捜索物の特徴を表わすのに適切な局所特徴量の精度があれば、その精度パラメータを精度調整DB410に記憶する。
捜索用通信端末は、ステップS413において、それぞれの画像を撮影する。ステップS415において、それぞれの映像から局所特徴量を生成する。続いて、ステップS417において、それぞれの局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS419において、捜索用通信端末から捜索サーバ220に送信される。
捜索サーバ220では、ステップS421において、局所特徴量DB221を参照して局所特徴量を照合し、それぞれの映像内に捜索物が存在するかを捜索する。捜索物が見付からなければ、局所特徴量の受信を待ってステップS421を繰り返す。捜索物が存在すると判定するとステップS425に進む。ステップS425において、精度調整DB410を参照して、捜索物を詳細に確認するに適切な局所特徴量の精度調整の精度パラメータと、映像中の捜索物がある領域とを取得する。そして、ステップS427において、精度パラメータと領域情報とを捜索物を含む局所特徴量を送信した送信元に指示する。
図4においては、中央の捜索用通信端末からの映像の局所特徴量に捜索物の局所特徴量が含まれていたとしている。送信元の捜索用通信端末は、ステップS429において、指示された精度パラメータを使って映像中の選択領域の高精度の局所特徴量を生成する。続いて、ステップS431において、局所特徴量と特徴点座標とを符号化する。そして、ステップS433において、符号化した局所特徴量を捜索サーバ220に送信する。
捜索サーバ220は、ステップS435において、再度、捜索物同士の高精度の局所特徴量によって照合を行ない、一致すれば捜索物と確認して捜索物DB222から捜索元などの情報を取得する。そして、ステップS437において、捜索物確認情報を捜索元の捜索依頼用通信端末に通知する。
捜索元の捜索依頼用通信端末は、捜索結果を受信して、ステップS439において、捜索物発見を報知する。
なお、図4においては、精度調整と領域選別とを行なって、再度、局所特徴量の生成を行なった。しかし、最初から高精度の局所特徴量を生成して転送する処理が、通信トラフィック、あるいは捜索用通信端末や捜索サーバの負荷に影響が小さければ、高精度の局所特徴量を生成して転送するのみでもよい。
《捜索依頼用通信端末の機能構成》
図5は、本実施形態に係る捜索依頼用通信端末230の機能構成を示すブロック図である。
図5において、撮像部501は、捜索物の画像を入力する。局所特徴量生成部502は、撮像部501からの映像から局所特徴量を生成する。生成された局所特徴量は、特徴点座標と共に、局所特徴量送信部503の符号化部503aにより符号化される。そして、局所特徴量送信部503は、通信制御部504を介して、捜索物情報と局所特徴量とを捜索サーバに送信する。
捜索結果受信部505は、通信制御部504を介して捜索結果を受信する。そして、捜索結果報知部506は、受信した捜索結果をユーザに報知する。捜索結果報知部506は、撮像部501からの映像と捜索結果とを重畳した表示を含む(図3参照)。
《捜索用通信端末の機能構成》
図6は、本実施形態に係る捜索用通信端末211〜214の機能構成を示すブロック図である。
図6において、撮像部601は、クエリ画像を入力する。局所特徴量生成部602は、撮像部601からの映像から局所特徴量を生成する。生成された局所特徴量は、特徴点座標と共に、局所特徴量送信部603の符号化部603aにより符号化される。そして、局所特徴量送信部603は、通信制御部604を介して、捜索物情報と局所特徴量とを捜索サーバに送信する。
精度調整/領域選別受信部605は、通信制御部604を介して、精度調整用の精度パラメータと映像中の捜索物の領域情報とを受信する。精度調整用の精度パラメータは、精度調整部606の精度パラメータ606aに保持される。精度調整部606は、精度パラメータ606aに従って、局所特徴量生成部602の局所特徴量の精度を調整する。一方、捜索物の領域情報は、領域選別部607に送られ、領域選別部607は撮像部601および/または局所特徴量生成部602を制御して、捜索物候補の領域の高精度の局所特徴量を生成させる。なお、領域選別部607の撮像部601の制御は、捜索物候補へのズームイン処理を含んでよい。
また、捜索用通信端末が映像取得として用いられる場合には、撮像部601で撮像された映像は、撮像表示部608に表示されると共に、映像送信部609によって送信される。
《捜索サーバの機能構成》
図7は、本実施形態に係る情報処理装置である捜索サーバ220の機能構成を示すブロック図である。
図7において、局所特徴量受信部702は、通信制御部701を介して通信端末から受信した局所特徴量を復号部702aで復号する。登録/捜索判定部703は、局所特徴量受信部702が受信した局所特徴量の送信元が、捜索依頼用通信端末か捜索用通信端末かを判定する。登録/捜索判定部703の判定は、送信元の通信端末IDやアドレスで行なってもよいし、受信データに捜索物情報が含まれているかによって行なってもよい。
捜索依頼用通信端末からの局所特徴量と判定されると、局所特徴量登録部704は、捜索物IDに対応付けて局所特徴量を局所特徴量DB221に登録する。なお、図示しないが、同時に、捜索物の情報が捜索物DB222に保持され、捜索物に適切な精度パラメータが精度調整DB410に記憶される。
捜索物認識部705は、局所特徴量DB221に登録された捜索物の局所特徴量が、捜索用通信端末からの映像の局所特徴量を照合する。そして、捜索物認識部705は、捜索物の局所特徴量が映像の局所特徴量に含まれていれば、映像中に捜索物在りと認識する。
捜索物認識部705が映像中に捜索物在りと認識すると、精度調整取得部706は、精度調整DB410を参照して、捜索物に適切な精度パラメータを取得する。同時に、捜索物認識部705からは、捜索物の映像中の位置を取得する。これらの情報に基づいて、精度調整/領域選別情報送信部707は、精度調整にための精度パラメータと領域選別のための領域情報とを、通信制御部701を介して、送信元の捜索用通信端末に送信する。
(局所特徴量DB)
図8は、本実施形態に係る局所特徴量DB221の構成を示す図である。なお、かかる構成に限定されない。
局所特徴量DB221は、捜索物ID801と名/種別802に対応付けて、第1番局所特徴量803、第2番局所特徴量804、…、第m番局所特徴量805を記憶する。各局所特徴量は、5×5のサブ領域に対応して、25次元ずつに階層化された1次元から150次元の要素からなる特徴ベクトルを記憶する(図11F参照)。
なお、mは正の整数であり、捜索物IDに対応して異なる数でよい。また、本実施形態においては、それぞれの局所特徴量と共に照合処理に使用される特徴点座標が記憶される。
(捜索物DB)
図9は、本実施形態に係る捜索物DB222の構成を示す図である。なお、捜索物DB222の構成は、図9に限定されない。
捜索物DB222は、捜索物ID901と名/種別902に対応付けて、登録日時903、捜索者904、捜索者の住所905、捜索者の連絡先906などを記憶する。なお、捜索サーバ220は、捜索物に対応して通知先を記憶するのみで、捜索物DB222に内容は捜索依頼用通信端末が保持してもよい。
(精度調整DB)
図10は、本実施形態に係る精度調整DB410の構成を示す図である。精度調整DB410の構成は、図10に限定されない。
精度調整DB410は、捜索物ID1001と名/種別1002とに対応付けて、図6の精度パラメータ606aを生成するための、第1調整値1003や第2調整1004などが記憶される。なお、パラメータの種類によってどの調整値を使用してもよい。これらパラメータは互いに関連しているので、認識および確認する対象の捜索物に適切なパラメータを選択するのが望ましい。したがって、対象の捜索物に応じてパラメータをあらかじめ生成して記憶しておく、あるいは学習して保持しておくこともできる。
《局所特徴量生成部》
図11Aは、本実施形態に係る局所特徴量生成部702の構成を示すブロック図である。
局所特徴量生成部702は、特徴点検出部1111、局所領域取得部1112、サブ領域分割部1113、サブ領域特徴ベクトル生成部1114、および次元選定部1115を含んで構成される。
特徴点検出部1111は、画像データから特徴的な点(特徴点)を多数検出し、各特徴点の座標位置、スケール(大きさ)、および角度を出力する。
局所領域取得部1112は、検出された各特徴点の座標値、スケール、および角度から、特徴量抽出を行う局所領域を取得する。
サブ領域分割部1113は、局所領域をサブ領域に分割する。例えば、サブ領域分割部1113は、局所領域を16ブロック(4×4ブロック)に分割することも、局所領域を25ブロック(5×5ブロック)に分割することもできる。なお、分割数は限定されない。本実施形態においては、以下、局所領域を25ブロック(5×5ブロック)に分割する場合を代表して説明する。
サブ領域特徴ベクトル生成部1114は、局所領域のサブ領域ごとに特徴ベクトルを生成する。サブ領域の特徴ベクトルとしては、例えば、勾配方向ヒストグラムを用いることができる。
次元選定部1115は、サブ領域の位置関係に基づいて、近接するサブ領域の特徴ベクトル間の相関が低くなるように、局所特徴量として出力する次元を選定する(例えば、間引きする)。また、次元選定部1115は、単に次元を選定するだけではなく、選定の優先順位を決定することができる。すなわち、次元選定部1115は、例えば、隣接するサブ領域間では同一の勾配方向の次元が選定されないように、優先順位をつけて次元を選定することができる。そして、次元選定部1115は、選定した次元から構成される特徴ベクトルを、局所特徴量として出力する。なお、次元選定部1115は、優先順位に基づいて次元を並び替えた状態で、局所特徴量を出力することができる。
《局所特徴量生成部の処理》
図11B〜図11Fは、本実施形態に係る局所特徴量生成部502、602の処理を示す図である。
まず、図11Bは、局所特徴量生成部502、602における、特徴点検出/局所領域取得/サブ領域分割/特徴ベクトル生成の一連の処理を示す図である。かかる一連の処理については、米国特許第6711293号明細書や、David G. Lowe著、「Distinctive image features from scale-invariant key points」、(米国)、International Journal of Computer Vision、60(2)、2004年、p. 91-110を参照されたい。
(特徴点検出部)
図11Bの画像1121は、図11Aの特徴点検出部1111において、映像中の画像から特徴点を検出した状態を示す図である。以下、1つの特徴点データ1121aを代表させて局所特徴量の生成を説明する。特徴点データ1121aの矢印の起点が特徴点の座標位置を示し、矢印の長さがスケール(大きさ)を示し、矢印の方向が角度を示す。ここで、スケール(大きさ)や方向は、対象映像にしたがって輝度や彩度、色相などを選択できる。また、図11Bの例では、60度間隔で6方向の場合を説明するが、これに限定されない。
(局所領域取得部)
図11Aの局所領域取得部1112は、例えば、特徴点データ1121aの起点を中心にガウス窓1122aを生成し、このガウス窓1122aをほぼ含む局所領域1122を生成する。図11Bの例では、局所領域取得部1112は正方形の局所領域1122を生成したが、局所領域は円形であっても他の形状であってもよい。この局所領域を各特徴点について取得する。局所領域が円形であれば、撮影方向に対してロバスト性が向上するという効果がある。
(サブ領域分割部)
次に、サブ領域分割部1113において、上記特徴点データ1121aの局所領域1122に含まれる各画素のスケールおよび角度をサブ領域1123に分割した状態が示されている。なお、図11Bでは4×4=16画素をサブ領域とする5×5=25のサブ領域に分割した例を示す。しかし、サブ領域は、4×4=16や他の形状、分割数であってもよい。
(サブ領域特徴ベクトル生成部)
サブ領域特徴ベクトル生成部1114は、サブ領域内の各画素のスケールを6方向の角度単位にヒストグラムを生成して量子化し、サブ領域の特徴ベクトル1124とする。すなわち、特徴点検出部1111が出力する角度に対して正規化された方向である。そして、サブ領域特徴ベクトル生成部1114は、サブ領域ごとに量子化された6方向の頻度を集計し、ヒストグラムを生成する。この場合、サブ領域特徴ベクトル生成部1114は、各特徴点に対して生成される25サブ領域ブロック×6方向=150次元のヒストグラムにより構成される特徴ベクトルを出力する。また、勾配方向を6方向に量子化するだけに限らず、4方向、8方向、10方向など任意の量子化数に量子化してよい。勾配方向をD方向に量子化する場合、量子化前の勾配方向をG(0〜2πラジアン)とすると、勾配方向の量子化値Qq(q=0,…,D−1)は、例えば式(1)や式(2)などで求めることができるが、これに限られない。
Qq=floor(G×D/2π) …(1)
Qq=round(G×D/2π)modD …(2)
ここで、floor()は小数点以下を切り捨てる関数、round()は四捨五入を行う関数、modは剰余を求める演算である。また、サブ領域特徴ベクトル生成部1114は勾配ヒストグラムを生成するときに、単純な頻度を集計するのではなく、勾配の大きさを加算して集計してもよい。また、サブ領域特徴ベクトル生成部1114は勾配ヒストグラムを集計するときに、画素が属するサブ領域だけではなく、サブ領域間の距離に応じて近接するサブ領域(隣接するブロックなど)にも重み値を加算するようにしてもよい。また、サブ領域特徴ベクトル生成部1114は量子化された勾配方向の前後の勾配方向にも重み値を加算するようにしてもよい。なお、サブ領域の特徴ベクトルは勾配方向ヒストグラムに限られず、色情報など、複数の次元(要素)を有するものであればよい。本実施形態においては、サブ領域の特徴ベクトルとして、勾配方向ヒストグラムを用いることとして説明する。
(次元選定部)
次に、図11C〜図11Fにしたがって、局所特徴量生成部502、602における、次元選定部1115に処理を説明する。
次元選定部1115は、サブ領域の位置関係に基づいて、近接するサブ領域の特徴ベクトル間の相関が低くなるように、局所特徴量として出力する次元(要素)を選定する(間引きする)。より具体的には、次元選定部1115は、例えば、隣接するサブ領域間では少なくとも1つの勾配方向が異なるように次元を選定する。なお、本実施形態では、次元選定部1115は近接するサブ領域として主に隣接するサブ領域を用いることとするが、近接するサブ領域は隣接するサブ領域に限られず、例えば、対象のサブ領域から所定距離内にあるサブ領域を近接するサブ領域とすることもできる。
図11Cは、局所領域を5×5ブロックのサブ領域に分割し、勾配方向を6方向1131aに量子化して生成された150次元の勾配ヒストグラムの特徴ベクトル1131から次元を選定する場合の一例を示す図である。図11Cの例では、150次元(5×5=25サブ領域ブロック×6方向)の特徴ベクトルから次元の選定が行なわれている。
(局所領域の次元選定)
図11Cは、局所特徴量生成部502、602における、特徴ベクトルの次元数の選定処理の様子を示す図である。
図11Cに示すように、次元選定部1115は、150次元の勾配ヒストグラムの特徴ベクトル1131から半分の75次元の勾配ヒストグラムの特徴ベクトル1132を選定する。この場合、隣接する左右、上下のサブ領域ブロックでは、同一の勾配方向の次元が選定されないように、次元を選定することができる。
この例では、勾配方向ヒストグラムにおける量子化された勾配方向をq(q=0,1,2,3,4,5)とした場合に、q=0,2,4の要素を選定するブロックと、q=1,3,5の要素を選定するサブ領域ブロックとが交互に並んでいる。そして、図11Cの例では、隣接するサブ領域ブロックで選定された勾配方向を合わせると、全6方向となっている。
また、次元選定部1115は、75次元の勾配ヒストグラムの特徴ベクトル1132から50次元の勾配ヒストグラムの特徴ベクトル1133を選定する。この場合、斜め45度に位置するサブ領域ブロック間で、1つの方向のみが同一になる(残り1つの方向は異なる)ように次元を選定することができる。
また、次元選定部1115は、50次元の勾配ヒストグラムの特徴ベクトル1133から25次元の勾配ヒストグラムの特徴ベクトル1134を選定する場合は、斜め45度に位置するサブ領域ブロック間で、選定される勾配方向が一致しないように次元を選定することができる。図11Cに示す例では、次元選定部1115は、1次元から25次元までは各サブ領域から1つの勾配方向を選定し、26次元から50次元までは2つの勾配方向を選定し、51次元から75次元までは3つの勾配方向を選定している。
このように、隣接するサブ領域ブロック間で勾配方向が重ならないように、また全勾配方向が均等に選定されることが望ましい。また同時に、図11Cに示す例のように、局所領域の全体から均等に次元が選定されることが望ましい。なお、図11Cに示した次元選定方法は一例であり、この選定方法に限らない。
(局所領域の優先順位)
図11Dは、局所特徴量生成部502、602における、サブ領域からの特徴ベクトルの選定順位の一例を示す図である。
次元選定部1115は、単に次元を選定するだけではなく、特徴点の特徴に寄与する次元から順に選定するように、選定の優先順位を決定することができる。すなわち、次元選定部1115は、例えば、隣接するサブ領域ブロック間では同一の勾配方向の次元が選定されないように、優先順位をつけて次元を選定することができる。そして、次元選定部1115は、選定した次元から構成される特徴ベクトルを、局所特徴量として出力する。なお、次元選定部1115は、優先順位に基づいて次元を並び替えた状態で、局所特徴量を出力することができる。
すなわち、次元選定部1115は、1〜25次元、26次元〜50次元、51次元〜75次元の間は、例えば図11Dのマトリクス1141に示すようなサブ領域ブロックの順番で次元を追加するように選定していってもよい。図11Dのマトリクス1141に示す優先順位を用いる場合、次元選定部1115は、中心に近いサブ領域ブロックの優先順位を高くして、勾配方向を選定していくことができる。
図11Eのマトリクス1151は、図11Dの選定順位にしたがって、150次元の特徴ベクトルの要素の番号の一例を示す図である。この例では、5×5=25ブロックをラスタスキャン順に番号p(p=0,1,…,25)で表し、量子化された勾配方向をq(q=0,1,2,3,4,5)とした場合に、特徴ベクトルの要素の番号を6×p+qとしている。
図11Fのマトリクス1161は、図11Eの選定順位による150次元の順位が、25次元単位に階層化されていることを示す図である。すなわち、図11Fのマトリクス1161は、図4Dのマトリクス1141に示した優先順位にしたがって図11Eに示した要素を選定していくことにより得られる局所特徴量の構成例を示す図である。次元選定部1115は、図11Fに示す順序で次元要素を出力することができる。具体的には、次元選定部1115は、例えば150次元の局所特徴量を出力する場合、図11Fに示す順序で全150次元の要素を出力することができる。また、次元選定部1115は、例えば25次元の局所特徴量を出力する場合、図11Fに示す1行目(76番目、45番目、83番目、…、120番目)の要素1171を図11Fに示す順(左から右)に出力することができる。また、次元選定部1115は、例えば50次元の局所特徴量を出力する場合、図11Fに示す1行目に加えて、図11Fに示す2行目の要素1172を図11Fに示す順(左から右)に出力することができる。
ところで、図11Fに示す例では、局所特徴量の次元は階層的な配列構造となっている。すなわち、例えば、25次元の局所特徴量と150次元の局所特徴量とにおいて、先頭の25次元分の局所特徴量における要素1171〜1176の並びは同一となっている。このように、次元選定部1115は、階層的(プログレッシブ)に次元を選定することにより、アプリケーションや通信容量、端末スペックなどに応じて、任意の次元数の局所特徴量、すなわち任意のサイズの局所特徴量を抽出して出力することができる。また、次元選定部1115が、階層的に次元を選定し、優先順位に基づいて次元を並び替えて出力することにより、異なる次元数の局所特徴量を用いて、画像の照合を行うことができる。例えば、75次元の局所特徴量と50次元の局所特徴量を用いて画像の照合が行なわれる場合、先頭の50次元だけを用いることにより、局所特徴量間の距離計算を行うことができる。
なお、図11Dのマトリクス1141から図11Fに示す優先順位は一例であり、次元を選定する際の順序はこれに限られない。例えば、ブロックの順番に関しては、図11Dのマトリクス1141の例の他に、図11Dのマトリクス1142や図11Dのマトリクス1143に示すような順番でもよい。また、例えば、全てのサブ領域からまんべんなく次元が選定されるように優先順位が定められることとしてもよい。また、局所領域の中央付近が重要として、中央付近のサブ領域の選定頻度が高くなるように優先順位が定められることとしてもよい。また、次元の選定順序を示す情報は、例えば、プログラムにおいて規定されていてもよいし、プログラムの実行時に参照されるテーブル等(選定順序記憶部)に記憶されていてもよい。
また、次元選定部1115は、サブ領域ブロックを1つ飛びに選択して、次元の選定を行なってもよい。すなわち、あるサブ領域では6次元が選定され、当該サブ領域に近接する他のサブ領域では0次元が選定される。このような場合においても、近接するサブ領域間の相関が低くなるようにサブ領域ごとに次元が選定されていると言うことができる。
また、局所領域やサブ領域の形状は、正方形に限られず、任意の形状とすることができる。例えば、局所領域取得部1112が、円状の局所領域を取得することとしてもよい。この場合、サブ領域分割部1113は、円状の局所領域を例えば複数の局所領域を有する同心円に9分割や17分割のサブ領域に分割することができる。この場合においても、次元選定部1115は、各サブ領域において、次元を選定することができる。
以上、図11B〜図11Fに示したように、本実施形態の局所特徴量生成部502、602によれば、局所特徴量の情報量を維持しながら生成された特徴ベクトルの次元が階層的に選定される。この処理により、認識精度を維持しながらリアルタイムでの捜索物認識と認識結果の表示が可能となる。なお、局所特徴量生成部502、602の構成および処理は本例に限定されない。認識精度を維持しながらリアルタイムでの捜索物認識と認識結果の表示が可能となる他の処理が当然に適用できる。
(符号化部)
図11Gは、本実施形態に係る符号化部503a、603aを示すブロック図である。なお、符号化部は本例に限定されず、他の符号化処理も適用可能である。
符号化部503a、603aは、局所特徴量生成部502、602の特徴点検出部1111から特徴点の座標を入力して、座標値を走査する座標値走査部1181を有する。座標値走査部1181は、画像をある特定の走査方法にしたがって走査し、特徴点の2次元座標値(X座標値とY座標値)を1次元のインデックス値に変換する。このインデックス値は、走査に従った原点からの走査距離である。なお、走査方向については、制限はない。
また、特徴点のインデックス値をソートし、ソート後の順列の情報を出力するソート部1182を有する。ここでソート部1182は、例えば昇順にソートする。また降順にソートしてもよい。
また、ソートされたインデックス値における、隣接する2つのインデックス値の差分値を算出し、差分値の系列を出力する差分算出部1183を有する。
そして、差分値の系列を系列順に符号化する差分符号化部1184を有する。差分値の系列の符号化は、例えば固定ビット長の符号化でもよい。固定ビット長で符号化する場合、そのビット長はあらかじめ規定されていてもよいが、これでは考えられうる差分値の最大値を表現するのに必要なビット数を要するため、符号化サイズは小さくならない。そこで、差分符号化部1184は、固定ビット長で符号化する場合、入力された差分値の系列に基づいてビット長を決定することができる。具体的には、例えば、差分符号化部1184は、入力された差分値の系列から差分値の最大値を求め、その最大値を表現するのに必要なビット数(表現ビット数)を求め、求められた表現ビット数で差分値の系列を符号化することができる。
一方、ソートされた特徴点のインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する局所特徴量符号化部1185を有する。ソートされたインデックス値と同じ順列で符号化することで、差分符号化部1184で符号化された座標値と、それに対応する局所特徴量とを1対1で対応付けることが可能となる。局所特徴量符号化部1185は、本実施形態においては、1つの特徴点に対する150次元の局所特徴量から次元選定された局所特徴量を、例えば1次元を1バイトで符号化し、次元数のバイトで符号化することができる。
(捜索物認識部)
図11Hは、本実施形態に係る捜索物認識部705の処理を示す図である。
図11Hは、図7の捜索物認識部705の処理を示す図である。図11Hに示す、あらかじめ捜索物の画像などから捜索依頼用通信端末によって本実施形態に従い生成された局所特徴量1191は、局所特徴量DB221に格納されている。一方、図11Hの左図の捜索用通信端末211で撮像された映像311からは、本実施形態に従い局所特徴量が生成される。以下、捜索用通信端末212で撮像された映像312、および、捜索用通信端末213で撮像された映像313から、本実施形態に従い局所特徴量が生成される。そして、局所特徴量DB221に格納された局所特徴量1191が、映像311〜313から生成された局所特徴量中にあるか否かが照合される。
図11Hに示すように、捜索物認識部705は、局所特徴量DB221に格納されている局所特徴量と局所特徴量が合致する映像311〜313中の各特徴点を細線のように関連付ける。なお、捜索物認識部705は、局所特徴量の所定割合以上が一致する場合を特徴点の合致とする。そして、捜索物認識部705は、関連付けられた特徴点の集合間の位置関係が線形関係であれば、捜索物であると認識する。このような認識を行なえば、サイズの大小や向きの違い(視点の違い)、あるいは反転などによっても認識が可能である。また、所定数以上の関連付けられた特徴点があれば認識精度が得られるので、一部が視界から隠れていても捜索物の認識が可能である。
図11Hにおいては、局所特徴量DB221の捜索物(カバン)の局所特徴量1191が、捜索用通信端末212の映像312の局所特徴量に合致する。その場合には、例えば、捜索用通信端末212において、捜索物候補のカバンにズームインした映像1192から、カバン領域の局所特徴量をより高精度に調整して生成する。そして、局所特徴量DB221の捜索物(カバン)の局所特徴量1191とのより精度の高い照合を行なう。このより精度の高い照合により、捜索者の所有物であるか否かを確認する。
《精度調整部》
以下、図12A〜図12C、図13および図14を参照して、精度調整部606の数例の構成を説明する。
(第1の構成)
図12Aは、本実施形態に係る精度調整部606の第1の構成606−1を示すブロック図である。精度調整部606の第1の構成606−1においては、次元数決定部1211で次元数を決定可能である。
次元数決定部1211は、次元選定部1115において選定される次元数を決定することができる。例えば、次元数決定部1211は、次元数を示す情報をユーザから受け付けることにより、次元数を決定することができる。なお、次元数を示す情報は、次元数そのものを示すものである必要はなく、例えば、照合精度や照合速度などを示す情報であってもよい。具体的には、次元数決定部1211は、例えば、局所特徴量生成精度、通信精度および照合精度を高くすることを要求する入力を受け付けた場合には、次元数が多くなるように次元数を決定する。例えば、次元数決定部1211は、局所特徴量生成速度、通信速度および照合速度を速くすることを要求する入力を受け付けた場合には、次元数が少なくなるように次元数を決定する。
なお、次元数決定部1211は、画像から検出される全ての特徴点に対して同じ次元数を決定することとしてもよいし、特徴点ごとに異なる次元数を決定してもよい。例えば、次元数決定部1211は、外部情報によって特徴点の重要度が与えられた場合に、重要度の高い特徴点は次元数を多くし、重要度の低い特徴点は次元数を少なくしてもよい。このようにして、照合精度と、局所特徴量生成速度、通信速度および照合速度とを考慮に入れて、次元数を決定することができる。
本実施形態においては、他の精度に関連する条件が同じであれば、捜索物に適切な次元数を決定したり、適切な次元数の前後で次元数を変化させたりする処理が考えられる。
(第2の構成)
図12Bは、本実施形態に係る精度調整部606の第2の構成606−2を示すブロック図である。精度調整部606の第2の構成606−2においては、特徴ベクトル拡張部1212が複数次元の値をまとめることで、次元数を変更することが可能である。
特徴ベクトル拡張部1212は、サブ領域特徴ベクトル生成部1114から出力された特徴ベクトルを用いて、より大きなスケール(拡張分割領域)における次元を生成することにより、特徴ベクトルを拡張することができる。なお、特徴ベクトル拡張部1212は、サブ領域特徴ベクトル生成部1114から出力される特徴ベクトルのみの情報を用いて特徴ベクトルを拡張することができる。したがって、特徴ベクトルを拡張するために元の画像に戻って特徴抽出を行う必要がないため、元の画像から特徴ベクトルを生成する処理時間と比較すると、特徴ベクトルの拡張にかかる処理時間はごく僅かである。例えば、特徴ベクトル拡張部1212は、隣接するサブ領域の勾配方向ヒストグラムを合成することにより、新たな勾配方向ヒストグラムを生成してもよい。
図12Cは、本実施形態に係る精度調整部606の第2の構成606−2による処理を説明する図である。図12Cでは、2×2=4ブロックの勾配ヒストグラムの総和を拡張した各ブロックとすることにより、精度を向上させながら次元数を変更できる。
図12Cに示すように、特徴ベクトル拡張部1212は、例えば、5×5×6次元(150次元)の勾配方向ヒストグラム1231を拡張することにより、4×4×6次元(96次元)の勾配方向ヒストグラム1241を生成することができる。すなわち、太実線で囲んだ4ブロック1231aが1ブロック1241aにまとめられる。また、太破線で示す4ブロック1231bが1ブロック1241bにまとめられる。
同様に、特徴ベクトル拡張部1212は、5×5×6次元(150次元)の勾配方向ヒストグラム1241から、隣接する3×3ブロックの勾配方向ヒストグラムの総和をとることにより、3×3×6次元(54次元)の勾配方向ヒストグラム1251を生成することも可能である。すなわち、太実線で示す4ブロック1241cが1ブロック1251cにまとめられる。また、太破線で示す4ブロック1241dが1ブロック1251dにまとめられる。
なお、次元選定部1115が、5×5×6次元(150次元)の勾配方向ヒストグラム1231を5×5×3次元(75次元)の勾配方向ヒストグラム1232に次元選定する場合には、4×4×6次元(96次元)の勾配方向ヒストグラム1241は、4×4×6次元(96次元)の勾配方向ヒストグラム1242となる。また、3×3×6次元(54次元)の勾配方向ヒストグラム1251は、3×3×3次元(27次元)の勾配方向ヒストグラム1252となる。
(第3の構成)
図13は、本実施形態に係る精度調整部606の第3の構成606−3を示すブロック図である。精度調整部606の第3の構成606−3においては、特徴点選定部1311が特徴点選定で特徴点数を変更することで、精度を維持しながら局所特徴量のデータ量を変更することが可能である。
特徴点選定部1311は、例えば、選定される特徴点の「指定数」を示す指定数情報をあらかじめ保持しておくことができる。また、指定数情報は、指定数そのものを示す情報であってもよいし、画像における局所特徴量のトータルサイズ(例えばバイト数)を示す情報であってもよい。指定数情報が、画像における局所特徴量のトータルサイズを示す情報である場合、特徴点選定部1311は、例えば、トータルサイズを、1つの特徴点における局所特徴量のサイズで割ることにより、指定数を算出することができる。また、全特徴点に対してランダムに重要度を付与し、重要度が高い順に特徴点を選定することができる。そして、指定数の特徴点を選定した時点で、選定した特徴点に関する情報を選定結果として出力することができる。また、特徴点情報に基づいて、全特徴点のスケールの中で、特定のスケール領域に含まれる特徴点のみを選定することができる。そして、選定された特徴点が指定数よりも多い場合、例えば、重要度に基づいて特徴点を指定数まで削減し、選定した特徴点に関する情報を選定結果として出力することができる。
(第4の構成)
図14は、本実施形態に係る精度調整部606の第4の構成606−4を示すブロック図である。精度調整部606の第4の構成606−4においては、次元数決定部1211と特徴点選定部1311とが協働しながら、精度を維持しながら局所特徴量のデータ量を変更する。
第4の構成606−4における次元数決定部1211と特徴点選定部1311との関係は種々考えられる。例えば、特徴点選定部1311は、次元数決定部1211により決定された特徴点数に基づいて、特徴点を選定することができる。また、次元数決定部1211は、特徴点選定部1311が選定した指定特徴量サイズおよび決定した特徴点数に基づいて、特徴量サイズが指定特徴量サイズになるように、選定次元数を決定することができる。また、特徴点選定部1311は、特徴点検出部1111から出力される特徴点情報に基づいて特徴点の選定を行う。そして、特徴点選定部1311は、選定した各特徴点の重要度を示す重要度情報を次元数決定部1211に出力し、次元数決定部1211は、重要度情報に基づいて、次元選定部1115で選定される次元数を特徴点ごとに決定することができる。
《捜索依頼用通信端末のハードウェア構成》
図15Aは、本実施形態に係る捜索依頼用通信端末230のハードウェア構成を示すブロック図である。
図15Aで、CPU1510は演算制御用のプロセッサであり、プログラムを実行することで捜索依頼用通信端末230の各機能構成部を実現する。ROM1520は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部504は通信制御部であり、本実施形態においては、ネットワークを介して捜索サーバ220と通信する。なお、CPU1510は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPU(Graphics Processing Unit)を含んでもよい。
RAM1540は、CPU1510が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1540には、本実施形態の実現に必要なデータを記憶する領域が確保されている。入力映像1541は、撮像部501が撮像して入力した入力映像を示す。特徴点データ1542は、入力映像1541から検出した特徴点座標、スケール、角度を含む特徴点データを示す。局所特徴量生成テーブル1543は、局所特徴量を生成するまでのデータを保持する局所特徴量生成テーブルを示す(図15B参照)。局所特徴量1544は、局所特徴量生成テーブル1543を使って生成され、通信制御部504を介して捜索サーバ220に送る捜索物の局所特徴量を示す。捜索物登録データ1545は、通信制御部504を介して捜索サーバ220に送る捜索物に関連するデータを示す。捜索物発見情報1546は、捜索サーバ220において依頼した捜索物に一致する物が見付かった場合に、捜索サーバ220から通知された情報を示す。捜索物映像/発見情報重畳データ1547は、捜索物が発見された場合に捜索物の映像と発見情報とを重畳したデータであり、表示部1561に表示される(図3参照)。入出力データ1548は、入出力インタフェース1560を介して入出力される入出力データである。送受信データ1549は、通信制御部504を介して送受信される送受信データを示す。
ストレージ1550には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。発見情報表示フォーマット1551は、表示部1561に捜索物映像/発見情報重畳データ1547をどのように表示するかのフォーマットである。
ストレージ1550には、以下のプログラムが格納される。通信端末制御プログラム1552は、本捜索依頼用通信端末230の全体を制御する通信端末制御プログラムを示す。通信端末制御プログラム1252には、以下のモジュールが含まれている。局所特徴量生成モジュール1553は、通信端末制御プログラム1552において、捜索物の入力映像から図11B〜図11Fにしたがって局所特徴量を生成するモジュールであるす。符号化モジュール1554は、局所特徴量生成モジュール1553により生成された局所特徴量を送信のために符号化するモジュールである。捜索物登録モジュール1555は、捜索物の局所特徴量および捜索物関連情報を捜索サーバ220に登録するモジュールである。捜索物発見報知モジュール1556は、捜索サーバ220からの捜索物発見情報の受信により、捜索物発見を報知するモジュールである。
入出力インタフェース1560は、入出力機器との入出力データをインタフェースする。入出力インタフェース1560には、表示部1561、操作部1562であるタッチパネルやキーボード、スピーカ1563、マイク1564、撮像部501が接続される。入出力機器は上記例に限定されない。また、必要であれば、GPS(Global Positioning System)位置生成部1565が搭載され、GPS衛星からの信号に基づいて現在位置を取得する。
なお、図15Aには、本実施形態に必須なデータやプログラムのみが示されており、本実施形態に関連しないデータやプログラムは図示されていない。
(局所特徴量生成テーブル)
図15Bは、本実施形態に係る捜索依頼用通信端末230における局所特徴量生成テーブル1543を示す図である。 局所特徴量生成テーブル1543には、入力画像ID1501に対応付けて、複数の検出された検出特徴点1502,特徴点座標1503および特徴点に対応する局所領域情報1504が記憶される。そして、各検出特徴点1502,特徴点座標1503および局所領域情報1504に対応付けて、複数のサブ領域ID1505,サブ領域情報1506,各サブ領域に対応する特徴ベクトル1507および優先順位を含む選定次元1508が記憶される。
以上のデータから各検出特徴点1502に対して局所特徴量1509が生成される。
《捜索依頼用通信端末の処理手順》
図16は、本実施形態に係る捜索依頼用通信端末230の処理手順を示すフローチャートである。このフローチャートは、図15AのCPU1510によってRAM1540を用いて実行され、図5の各機能構成部を実現する。
まず、ステップS1611において、捜索物を依頼するための捜索サーバ220への登録か否かが判定される。また、ステップS1621において、捜索サーバ220からの捜索物の発見情報の受信か否かが判定される。いずれでもなければ、ステップS1631においてその他の処理を行なう。
捜索物の登録であればステップS1613に進んで、捜索物の映像を取得する。そして、捜索物の映像から局所特徴量生成処理を実行する(図17A参照)。次に、ステップS1617において、局所特徴量および特徴点座標を符号化する(図17Bおよび図17C参照)。ステップS1619においては、符号化されたデータおよび捜索物関連情報を捜索サーバ220に送信する。
捜索物の発見情報の受信であればステップS1623に進んで、捜索物の発見表示データを生成する。そして、ステップS1625において、捜索物の映像と発見表示データの重畳表示を行なう(図3参照)。なお、音声報知に場合は、音声再生してスピーカ1563から報知する。
(局所特徴量生成処理)
図17Aは、本実施形態に係る局所特徴量生成処理S1615の処理手順を示すフローチャートである。
まず、ステップS1711において、入力映像から特徴点の位置座標、スケール、角度を検出する。ステップS1713において、ステップS1711で検出された特徴点の1つに対して局所領域を取得する。次に、ステップS1715において、局所領域をサブ領域に分割する。ステップS1717においては、各サブ領域の特徴ベクトルを生成して局所領域の特徴ベクトルを生成する。ステップS1711からS1717の処理は図11Bに図示されている。
次に、ステップS1719において、ステップS1717において生成された局所領域の特徴ベクトルに対して次元選定を実行する。次元選定については、図11D〜図11Fに図示されている。
ステップS1721においては、ステップS1711で検出した全特徴点について局所特徴量の生成と次元選定とが終了したかを判定する。終了していない場合はステップS1713に戻って、次の1つの特徴点について処理を繰り返す。
(符号化処理)
図17Bは、本実施形態に係る符号化処理S1617の処理手順を示すフローチャートである。
まず、ステップS1731において、特徴点の座標値を所望の順序で走査する。次に、ステップS1733において、走査した座標値をソートする。ステップS1735において、ソートした順に座標値の差分値を算出する。ステップS1737においては、差分値を符号化する(図17C参照)。そして、ステップS1739において、座標値のソート順に局所特徴量を符号化する。なお、差分値の符号化と局所特徴量の符号化とは並列に行なってもよい。
(差分値の符号化処理)
図17Cは、本実施形態に係る差分値の符号化処理S1737の処理手順を示すフローチャートである。
まず、ステップS1741において、差分値が符号化可能な値域内であるか否かを判定する。符号化可能な値域内であればステップS1747に進んで、差分値を符号化する。そして、ステップS1749へ移行する。符号化可能な値域内でない場合(値域外)はステップS1743に進んで、エスケープコードを符号化する。そしてステップS1745において、ステップS1747の符号化とは異なる符号化方法で差分値を符号化する。そして、ステップS1749へ移行する。ステップS1749では、処理された差分値が差分値の系列の最後の要素であるかを判定する。最後である場合は、処理が終了する。最後でない場合は、再度ステップS1741に戻って、差分値の系列の次の差分値に対する処理が実行される。
《捜索用通信端末のハードウェア構成》
図18Aは、本実施形態に係る捜索用通信端末211〜214のハードウェア構成を示すブロック図である。
図18Aで、CPU1810は演算制御用のプロセッサであり、プログラムを実行することで捜索用通信端末211〜214の各機能構成部を実現する。ROM1820は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部604は通信制御部であり、本実施形態においては、ネットワークを介して捜索サーバ220と通信する。なお、CPU1810は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPU(Graphics Processing Unit)を含んでもよい。
RAM1840は、CPU1810が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1840には、本実施形態の実現に必要なデータを記憶する領域が確保されている。入力映像1841は、撮像部601が撮像して入力した入力映像を示す。特徴点データ1842は、入力映像1841から検出した特徴点座標、スケール、角度を含む特徴点データを示す。局所特徴量生成テーブル1843は、局所特徴量を生成するまでのデータを保持する局所特徴量生成テーブルを示す(図15B参照)。局所特徴量1844は、局所特徴量生成テーブル1843を使って生成され、通信制御部604を介して捜索サーバ220に送る局所特徴量を示す。精度パラメータ606aは、捜索サーバ220から指示された局所特徴量の精度調整用の精度パラメータである。入出力データ1845は、入出力インタフェース1860を介して入出力される入出力データである。送受信データ1846は、通信制御部604を介して送受信される送受信データを示す。
ストレージ1850には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。初期精度パラメータ1851は、捜索用通信端末211〜214が初期設定する精度パラメータを示す。
ストレージ1550には、以下のプログラムが格納される。通信端末制御プログラム1852は、本捜索用通信端末211〜214の全体を制御する通信端末制御プログラムを示す。通信端末制御プログラム1852には、以下のモジュールが含まれている。局所特徴量生成モジュール1853は、通信端末制御プログラム1852において、捜索物の入力映像から図11B〜図11Fにしたがって局所特徴量を生成するモジュールである。符号化モジュール1854は、局所特徴量生成モジュール1853により生成された局所特徴量を送信のために符号化するモジュールである。精度調整モジュール1855は、精度パラメータ606aに従って、局所特徴量の精度を調整するモジュールである。
入出力インタフェース1860は、入出力機器との入出力データをインタフェースする。入出力インタフェース1860に接続される入出力機器は、捜索依頼用通信端末230の入出力インタフェース1560に接続する入出力端末と同ようなので、説明は省略する。
なお、図12Aには、本実施形態に必須なデータやプログラムのみが示されており、本実施形態に関連しないデータやプログラムは図示されていない。
(精度パラメータ)
図18Bは、本実施形態に係る精度パラメータ606aの構成を示す図である。
精度パラメータ606aは、特徴点パラメータ1801として、特徴点数や特徴点とするか否かを選別する特徴点選別閾値などを記憶する。また、局所領域パラメータ1802として、ガウス窓に対応する面積(サイズ)や矩形や円などを示す形状などを記憶する。また、サブ領域パラメータ21803として、局所領域の分割数や形状などを記憶する。また、特徴ベクトルパラメータ1804として、方向数(例えば8方向や6方向など)や次元数、次元の選択方法などを記憶する。
なお、図18Bに示した精度パラメータは一例であって、これに限定されない。
《捜索用通信端末の処理手順》
図19は、本実施形態に係る捜索用通信端末211〜214の処理手順を示すフローチャートである。このフローチャートは、図18AのCPU1810によってRAM1840を用いて実行され、図6の各機能構成部を実現する。
まず、ステップS1911において、撮像部601からの映像入力か否かが判定される。また、ステップS1921において、捜索サーバ220からの精度調整情報の受信か否かが判定される。いずれでもなければ、ステップS1931においてその他の処理を行なう。
映像入力であればステップS1913に進んで、入力された映像から局所特徴量生成処理を実行する(図17A参照)。次に、ステップS1915において、局所特徴量および特徴点座標を符号化する(図17Bおよび図17C参照)。ステップS1917においては、符号化されたデータを捜索サーバ220に送信する。
精度調整情報の受信であればステップS1923に進んで、精度パラメータ606aを設定する。そして、ステップS1925において、領域を選別する。
なお、ステップS1913の局所特徴量生成処理およびステップS1915の符号化処理とは、捜索依頼用通信端末230の図17A乃至図17Cの処理と同様であるので、図示および説明は省略する。
《捜索サーバのハードウェア構成》
図20は、本実施形態に係る情報処理装置である捜索サーバ220のハードウェア構成を示すブロック図である。
図20で、CPU2010は演算制御用のプロセッサであり、プログラムを実行することで捜索サーバ220の各機能構成部を実現する。ROM2020は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部701は通信制御部であり、本実施形態においては、ネットワークを介して捜索依頼用通信端末および捜索用通信端末と通信する。なお、CPU2010は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPUを含んでもよい。
RAM2040は、CPU2010が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM2040には、本実施形態の実現に必要なデータを記憶する領域が確保されている。受信した登録用局所特徴量2041は、捜索依頼用通信端末230から受信した特徴点座標を含む局所特徴量を示す。受信した捜索用局所特徴量2042は、捜索用通信端末211〜214から受信した特徴点座標を含む局所特徴量を示す。DBから読出した局所特徴量2043は、局所特徴量DB221から読み出した特徴点座標を含むと局所特徴量を示す。捜索物認識結果2044は、捜索用通信端末から受信した局所特徴量と、局所特徴量DB221に格納された捜索依頼用通信端末から受信した局所特徴量との照合から認識された、捜索物認識結果を示す。精度調整/領域選別情報2045は、精度調整DB410に従って、捜索用通信端末211〜214の精度調整用の精度パラメータと捜索物候補の映像中の領域情報を示す。捜索物確認フラグ2046は、捜索物候補が高精度の照合により確認されたことを表わすフラグを示す。送受信データ2047は、通信制御部701を介して送受信される送受信データを示す。
ストレージ2050には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。局所特徴量DB221は、図8に示したと同様の局所特徴量DBを示す。捜索物DB222は、図9に示したと同様の捜索物DBを示す。精度調整DB410は、図10に示したと同様の精度調整DBを示す。
ストレージ1550には、以下のプログラムが格納される。捜索サーバ制御プログラム2051は、本捜索サーバの全体を制御する捜索サーバ制御プログラムを示す。局所特徴量登録モジュール2052は、捜索サーバ制御プログラム2051において、捜索依頼用通信端末230から受信した捜索物の局所特徴量を局所特徴量DB221に登録するモジュールである。捜索物認識制御モジュール2053は、捜索サーバ制御プログラム2051において、受信した局所特徴量と局所特徴量DB221に格納された局所特徴量とを照合して捜索物を認識するモジュールである。捜索物確認制御モジュール2054は、捜索サーバ制御プログラム2051において、制度調整/領域選別情報を捜索用通信端末に送信し、捜索用通信端末から受信した局所特徴量と局所特徴量DB221に格納された局所特徴量とを照合して、捜索物を確認するモジュールである。
なお、図20には、本実施形態に必須なデータやプログラムのみが示されており、本実施形態に関連しないデータやプログラムは図示されていない。
《捜索サーバの処理手順》
図21は、本実施形態に係る捜索サーバ220の処理手順を示すフローチャートである。
まず、ステップS2111において、登録用局所特徴量を捜索依頼用通信端末230から受信したか否かを判定する。また、ステップS2121において、捜索用通信端末からの捜索用局所特徴量を受信しかか否かを判定する。いずれでもなければ、ステップS2141において他の処理を行なう。
登録用局所特徴量の受信であればステップS2113に進んで、局所特徴量DB221に捜索物に対応付けて局所特徴量を登録する。なお、同時に、捜索物DB222に捜索物に関連する情報を記憶し、必要であれば精度調整DB410に捜索物に適切な精度パラメータを保持する。
捜索用局所特徴量の受信であればステップS2123に進んで、捜索物認識処理を行なう(図22Aおよび図22B参照)。次に、ステップS2125において、捜索物が捜索用局所特徴量中にあるか否かを判定する。捜索物があると判定された場合はステップS2127に進んで、精度調整/領域選別データを取得して送信元の捜索用通信端末に送信する。
ステップS2129において、送信元の捜索用通信端末からの精度のより高い捜索物候補に対する確認用局所特徴量の受信を待つ。確認用局所特徴量の受信があればステップS2131に進んで、捜索物確認処理を行なう(図22Cおよび図22B参照)。
ステップS2133において、捜索物と一致することが確認されたか否かを判定する。捜索物と一致することが確認されればステップS2135に進んで、捜索依頼元の捜索依頼用通信端末に捜索物の発見情報を送信する。
(捜索物認識処理)
図22Aは、本実施形態に係る捜索物認識処理S2123の処理手順を示すフローチャートである。
まず、ステップS2211において、局所特徴量DB221から1つの捜索物の局所特徴量を取得する。そして、ステップS2213において、捜索物の局所特徴量と通信端末から受信した局所特徴量との照合を行なう(図22B参照)。
ステップS2215において、合致したか否かを判定する。合致していればステップS2221に進んで、合致した捜索物が映像中にあるとして記憶する。
ステップS2217においては、局所特徴量DB221に登録されている全捜索物を照合したかを判定し、残りがあればステップS2211に戻って次の捜索物の照合を繰り返す。なお、かかる照合においては、処理速度の向上によるリルタイム処理あるいは捜索サーバの負荷低減のため、あらかじめ捜索物や捜索範囲の限定を行なってもよい。
(照合処理)
図22Bは、本実施形態に係る照合処理S2213の処理手順を示すフローチャートである。
まず、ステップS2231において、初期化として、パラメータp=1,q=0を設定する。次に、ステップS2233において、局所特徴量DB221の局所特徴量の次元数iと、受信した局所特徴量の次元数jとの、より少ない次元数を選択する。
ステップS2235〜S2245のループにおいて、p>m(m=捜索物の特徴点数)となるまで各局所特徴量の照合を繰り返す。まず、ステップS2235において、局所特徴量DB221に格納された捜索物の第p番局所特徴量の選択された次元数のデータを取得する。すなわち、最初の1次元から選択された次元数を取得する。次に、ステップS2237において、ステップS2235において取得した第p番局所特徴量と入力映像から生成した全特徴点の局所特徴量を順に照合して、類似か否かを判定する。ステップS2239においては、局所特徴量間の照合の結果から類似度が閾値αを超えるか否かを判断し、超える場合はステップS2241において、局所特徴量と、入力映像と捜索物とにおける合致した特徴点の位置関係との組みを記憶する。そして、合致した特徴点数のパラメータであるqを1つカウントアップする。ステップS2243においては、捜索物の特徴点を次の特徴点に進め(p←p+1)、捜索物の全特徴点の照合が終わってない場合には(p≦m)、ステップS2235に戻って合致する局所特徴量の照合を繰り返す。なお、閾値αは、捜索物によって求められる認識精度に対応して変更可能である。ここで、他の捜索物との相関が低い捜索物であれば認識精度を低くしても、正確な認識が可能である。
捜索物の全特徴点との照合が終了すると、ステップS2245からS2247に進んで、ステップS2247〜S2253において、捜索物が入力映像に存在するか否かが判定される。まず、ステップS2247において、捜索物の特徴点数pの内で入力映像の特徴点の局所特徴量と合致した特徴点数qの割合が、閾値βを超えたか否かを判定する。超えていればステップS2249に進んで、捜索物候補として、さらに、入力映像の特徴点と捜索物の特徴点との位置関係が、線形変換が可能な関係を有しているかを判定する。すなわち、ステップS2241において局所特徴量が合致したとして記憶した、入力映像の特徴点と捜索物の特徴点との位置関係が、回転や反転、視点の位置変更などの変化によっても可能な位置関係なのか、変更不可能な位置関係なのかを判定する。かかる判定方法は幾何学的に既知であるので、詳細な説明は省略する。ステップS2251において、線形変換可能か否かの判定結果により、線形変換可能であればステップS2253に進んで、照合した捜索物が入力映像に存在すると判定する。なお、閾値βは、捜索物によって求められる認識精度に対応して変更可能である。ここで、他の捜索物との相関が低い、あるいは一部分からでも特徴が判断可能な捜索物であれば合致した特徴点が少なくても、正確な認識が可能である。すなわち、一部分が隠れて見えなくても、あるいは特徴的な一部分が見えてさえいれば、捜索物の認識が可能である。
ステップS2255においては、局所特徴量DB221に未照合の捜索物が残っているか否かを判定する。まだ捜索物が残っていれば、ステップS2257において次の捜索物を設定して、パラメータp=1,q=0に初期化し、ステップS935に戻って照合を繰り返す。
なお、かかる照合処理の説明からも明らかなように、あらゆる捜索物を局所特徴量DB221に記憶して、全捜索物を照合する処理は、負荷が非常に大きくなる。したがって、例えば、入力映像からの捜索物認識の前にユーザが捜索物の範囲をメニューから選択して、その範囲を局所特徴量DB221から捜索して照合することが考えられる。また、局所特徴量DB221にユーザが使用する範囲の局所特徴量のみを記憶することによっても、負荷を軽減できる。
(捜索物確認処理)
図22Cは、本実施形態に係る捜索物確認処理S2131の処理手順を示すフローチャートである。
まず、ステップS2261において、局所特徴量DB221から捜索物候補の局所特徴量を取得する。そして、ステップS2263において、捜索物の局所特徴量と通信端末から受信した局所特徴量との照合を行なう(図22B参照)。
ステップS2265において、合致したか否かを判定する。合致していればステップS2269に進んで、捜索物が一致したことを記憶する。合致していなければステップS2267に進んで、捜索物が不一致であることを記憶する。
なお、ステップS2263の照合処理は、捜索物候補のみの局所特徴量を照合することが異なるが、図22AのステップS2213と同様であるので、図示および説明は省略する。しかしながら、図22Bにおける閾値αやβは捜索物認識処理と捜索物確認処理とで精度に応じて異なる設定にしてよい。
[第3実施形態]
次に、本発明の第3実施形態に係る情状処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態と比べると、捜索用通信端末と捜索サーバとが捜索物の認識処理を分担する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、捜索用通信端末で捜索物認識の一部処理を実行するので、捜索用通信端末と捜索サーバ間のトラフィックを削減すると共に、捜索サーバの負荷を軽減できる。
なお、本実施形態においては、捜索物の認識処理は捜索用通信端末で行ない、確認処理は捜索サーバ220で行なう例を示すが、役割分担は通信トラフィックや、捜査用通信端末および捜索サーバ220の負荷に基づいて、異なる役割分担も可能である。
《情報処理システムの動作手順》
図23は、本実施形態に係る情報処理システムの動作手順を示すシーケンス図である。なお、図23には、第2実施形態の図4に図示の初期設定処理や捜索依頼処理、あるいは捜索物確認処理については、複雑さを避けるために省略あるいは簡略化している。これらの処理は、図4の処理に準ずるものである。したがって、図23には、アプリケーションのダウンロードや起動処理は省かれている。
図23は、ステップS2300における探索依頼用通信端末からの捜索依頼から図示している。ここでは、捜索物の局所特徴量や捜索物関連情報が捜索サーバ220に送信され、捜索サーバ220の各DBに登録保持される。
ステップS2301においては、捜索サーバ220から捜索用通信端末に捜索物の局所特徴量がダウンロードされる。ここで、ダウンロードする捜索物の局所特徴量は、捜索用通信端末の起動時には局所特徴量DB221に登録された全局所特徴量であってもよい。また、局所特徴量DB221に登録された全局所特徴量の容量が大きい場合は、特徴ベクトルの次元数選定などの精度調整した局所特徴量であってもよい。一方、既に起動中の捜索用通信端末であれば、新たに捜索依頼された捜索物の局所特徴量のみをダウンロードすればよい。
捜索用通信端末は、ステップS2303において、受信した局所特徴量を捜索物に対応付けて通信端末用局所特徴量DB2310に登録する(構成は、図8参照)。捜索用通信端末は、ステップS2305において、撮像部によりそれぞれの映像を取得する。ステップS2307においては、局所特徴量の初期精度を設定する。そして、ステップS2309において、それぞれの映像から局所特徴量を生成する。続いて、ステップS2311において、通信端末用局所特徴量DB2310を参照して、映像中の捜索物を認識する。ステップS2313において、捜索物の有無を判定して、無いと判定すればステップS2305に戻って、次の映像を取得して認識処理を繰り返す。
捜索物があると判定すると、ステップS2315において、局所特徴量の精度を調整する。なお、調整する精度パラメータは、捜索用通信端末がDBとして保持していてもよいし、捜索物の局所特徴量と共にダウンロードされてもよい。また、ステップS2315において、捜索物の領域選別を行なうのが望ましい。ステップS2317において、調整された精度(初期設定よりも高精度)で局所特徴量を生成する。続いて、ステップS2319において、高精度の局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS2321において、捜索用通信端末から捜索サーバ220に送信される。
捜索サーバ220では、ステップS2323において、局所特徴量DB221を参照して高精度の局所特徴量を照合し、一致すれば捜索物と確認して捜索物DB222(図23には不図示)から捜索元などの情報を取得する。そして、ステップS2325において、捜索物確認情報を捜索元の捜索依頼用通信端末に通知する。
捜索元の捜索依頼用通信端末は、捜索結果を受信して、ステップS2327において、捜索物発見を報知する。
なお、図23においては、捜索用通信端末は初期精度で局所特徴量を生成して捜索物の認識を行ない、精度調整と領域選別とを行なって、再度、局所特徴量の生成を行なった。しかし、最初から高精度の局所特徴量を生成して認識処理を行ない、ズームインなどで領域選別処理を行なって局所特徴量を生成してもよい。このようにすれば、通信トラフィックや、あるいは捜索サーバの負荷を削減できる。
[第4実施形態]
次に、本発明の第4実施形態に係る情状処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態および第3実施形態と比べると、捜索サーバが捜索に使用する捜索用通信端末を選択する点で異なる。その他の構成および動作は、第2実施形態および第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、あらかじめ捜索範囲を選別できるので、捜索の迅速化と捜索サーバの負荷低減が可能である。
《情報処理システムの動作手順》
図24は、本実施形態に係る情報処理システムの動作手順を示すシーケンス図である。なお、図24には、第2実施形態の図4に図示の初期設定処理や捜索依頼処理、あるいは捜索物確認処理については、複雑さを避けるために省略あるいは簡略化している。これらの処理は、図4の処理に準ずるものである。なお、図24においては、アプリケーションのダウンロードは、捜索依頼があって捜索対象の捜索物の捜索範囲内にある捜索用通信端末のみにアプリケーショがダウンロードされて、集中捜索が行なわれる。捜索範囲は多段階のレベルに分割され、そのレベルに応じた精度の局所特徴量が選択されたり、認識処理や確認処理の方法が選択されたりしてもよい。
図24は、ステップS2400における探索依頼用通信端末からの捜索依頼から図示している。ここでは、捜索物の局所特徴量や捜索物関連情報が捜索サーバ220に送信され、捜索サーバ220の各DBに登録保持される(不図示)。
捜索サーバ220は、ステップS2401において、捜索依頼の捜索物や関連情報から捜索範囲を決定する。そして、ステップS2403において、捜索範囲内にある捜索用通信端末に対して、本実施形態を処理可能なアプリケーションと捜索物に適切な精度パラメータをダウンロードする。ここで、ダウンロード先の通信端末は、あらかじめ登録された通信端末であっても、捜索範囲の全監視カメラやカメラ付き携帯端末であってもよい。また、あらかじめアプリケーションが搭載された、あるいはダウンロードされた通信端末に対しては、捜索開始を指示するのみであってもよい。図24においては、○印の付された通信端末が捜索用に選択され、×印が付された通信端末は捜索用に選択されない。
選択された捜索用通信端末は、まず、ステップS2405において、ダウンロードされた精度パラメータに精度調整を行なう。そして、捜索用通信端末は、ステップS2407において、撮像部によりそれぞれの映像を取得する。そして、ステップS2409において、それぞれの映像から局所特徴量を生成する。続いて、ステップS2411において、生成された局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS2413において、捜索用通信端末から捜索サーバ220に送信される。
捜索サーバ220では、ステップS2415において、局所特徴量DB221を参照して局所特徴量を照合し、映像中から捜索物を認識し、さらに捜索物を確認して捜索物DB222(図23には不図示)から捜索元などの情報を取得する。そして、ステップS2417において、捜索物確認情報を捜索元の捜索依頼用通信端末に通知する。
捜索元の捜索依頼用通信端末は、捜索結果を受信して、ステップS2419において、捜索物発見を報知する。
なお、図24においては、捜索物の認識および確認を捜索サーバ220で行なったが、第3実施形態のように、認識処理は捜索用通信端末で行ない確認処理は捜索サーバで行なってよい。本実施形態のように探索用通信端末の範囲を選択すれば、通信トラフィックや、あるいは探索用通信端末および捜索サーバの負荷を削減できる。
[第5実施形態]
次に、本発明の第5実施形態に係る情状処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態乃至第4実施形態と比べると、1つの通信端末が、捜索依頼用通信端末と捜索用通信端末と捜索サーバとの処理を全て行なう点で異なる。その他の構成および動作は、第2実施形態乃至第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、1つの通信端末を使用して捜索物を捜索できる。特に、限られた領域、例えば室内や建物内などで探索物を見付けるのに有用である。
《通信端末の機能構成》
図25は、本実施形態に係る通信端末2511の機能構成を示すブロック図である。なお、図25において、第2実施形態の図6と同様の機能構成部には同じ参照番号を付して、説明を省略する。
図示しない操作部により、通信端末は捜索物の登録であるか、捜索物の捜索であるかが選択される。あるいは、捜索物の登録のみが選択され、その他は捜索物の捜索を行なってもよい。
登録/捜索判定部2501は、上記捜索物の登録か捜索かを判定して、局所特徴量生成部602で生成された局所特徴量に対して異なる処理を実行させる。捜索物の登録であれば、生成した局所特徴量は撮像した捜索物の局所特徴量である。したがって、局所特徴量登録部2502によって、捜索物と対応付けて局所特徴量DB2510に登録される。同時に、精度調整DB2520や捜索物DB2530に対応するデータを保持する。
一方、捜索物の捜索であれば、生成した局所特徴量は撮像した映像の局所特徴量である。したがって、捜索物認識部2503において、局所特徴量DB2510に登録された局所特徴量が含まれるかを照合して、捜索物の認識が行なわれる。捜索物が映像内にあることを認識すると、精度調整取得部2504は、精度調整DB2520から捜索物の確認に適切な精度パラメータを取得する。取得した精度パラメータは精度調整部606の精度パラメータ606aに保持され、映像から生成される局所特徴量の精度が調整される。なお、図25には、捜索物へのズームインを含む領域選別は図示しないが、領域選別を行なう方がより正確な捜索物確認が可能となる。
捜索物確認部2506は、精度調整した映像の局所特徴量を局所特徴量DB2510の局所特徴量と照合して、認識した捜索物を確認する。捜索物発見情報報知部2507は、捜索物確認部2506が捜索物を核にすれば、捜索物DB2530を参照して、捜索物発見情報を報知する。また、捜索結果確認の通信端末が別途にある場合は、捜索物発見情報送信部2508により、捜索物発見情報を捜索結果確認の通信端末に送信する。
[第6実施形態]
次に、本発明の第6実施形態に係る情状処理システムについて説明する。本実施形態に係る情報処理システムは、上記第2実施形態乃至第5実施形態と比べると、局所特徴量により捜索する捜索物が映像の不正な複製物である点で異なる。その他の構成および動作は、第2実施形態乃至第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、再生あるいは放送される映像から不正な複製物をリアルタイムに捜索できる。
《情報処理システムの構成》
図26は、本実施形態に係る情報処理システム2600の構成を示すブロック図である。
図26の情報処理システム2600においては、ネットワーク2640により、複数の通信端末2601〜2605と、オリジナルの元映像を登録する元映像登録サーバ2620と、不正複製物の放送や再生を監視する情報処理装置である不正複製物監視サーバ2610と、を含む。
複数の通信端末2601〜2605には、携帯端末2601や2602、モニタ2603、携帯PC2604、デスクトップPC2605などを含む。これらの通信端末2601〜2605は、それぞれ局所特徴量生成部2601a〜2605aを有し、ダウンロードやアップロードする映像、あるいは放送や再生している映像から局所特徴量を生成して、不正複製物監視サーバ2610に送信する。
元映像登録サーバ2620は、映像コンテンツ生成プロバイダや映像コンテンツ提供プロバイダなどを含む。また、元映像登録サーバ2620は、局所特徴量生成部2620aを有する。そして、元映像の特徴あるフレーム(元画像)から生成された局所特徴量、あるいは、元映像に出現する特徴ある物品や人物、背景の景観要素の局所特徴量とその組み合わせの情報、などを不正複製物監視サーバ2610に登録する。
不正複製物監視サーバ2610は、元映像登録サーバ2620から送信された、元映像の局所特徴量を局所特徴量DB2611に登録する。そして、通信端末2601〜2605からリアルタイムに送信されるダウンロードやアップロードする映像、あるいは放送や再生している映像の局所特徴量を、局所特徴量DB2611に登録された局所特徴量と照合する。所定確率で局所特徴量が一致すれば不正複製物であると判定し、送信元には不正複製物であるとの警告を行ない、他の通信端末および関連する元映像登録サーバ2620には、その旨を報知する。
《情報処理システムの動作手順》
図27は、本実施形態に係る情報処理システム2600の動作手順を示すシーケンス図である。なお、図27には、第2実施形態の図4に図示のアプリケーションのダウンロードや起動については、複雑さを避けるために省略している。この処理は、図4の処理に準ずるものである。
図27は、ステップS2701における元映像登録サーバ2620からの元映像の登録から図示している。ここでは、元映像の情報および対応する局所特徴量が不正複製物監視サーバ2610に送信される。不正複製物監視サーバ2610は、ステップS2703において、受信した局所特徴量を元映像IDに対応付けて局所特徴量DB2611に登録する。
通信端末2601〜2605は、それぞれ、ステップS2705において映像を再生する。なお、ステップS2705は、映像のダウンロードやアップロードを含む。ステップS2707において、それぞれの映像から局所特徴量を生成する。続いて、ステップS2709において、生成された局所特徴量を特徴点座標と共に符号化する。符号化された局所特徴量は、ステップS2711において、通信端末2601〜2605から不正複製物監視サーバ2610に送信される。
不正複製物監視サーバ2610では、ステップS2713において、局所特徴量DB2611を参照して局所特徴量を照合し、映像中から元画像との一致を検出する。ステップS2715において、不正複製物の有無を判定し、無ければ次の局所特徴量を受信してステップS2713の不正複製物の検出を繰り返す。不正複製物が検出されればステップS2717に進んで、不正複製物情報を生成する。そして、ステップS2719においては、不正複製物を再生している通信端末には不正複製物の警告を送信し、不正複製物に関連する元映像登録サーバ2620に対しては不正複製物に関する情報を送信する。
不正複製物を再生している通信端末は、ステップS2721において、不正複製物の警告を行なう。一方、不正複製物に関連する元映像登録サーバ2620では、ステップS2733において、不正複製物の情報を報知する。なお、不正複製物を再生してない他の通信端末に対しても、不正複製物の情報を報知してもよい。
[他の実施形態]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する制御プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされる制御プログラム、あるいはその制御プログラムを格納した媒体、その制御プログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
この出願は、2012年1月30日に出願された日本出願特願2012−017384を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
第1撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
を備えることを特徴とする情報処理システム。
(付記2)
前記捜索物の画像からm個の特徴点を抽出し、それぞれ1次元からi次元までの特徴ベクトルからなる前記m個の第1局所特徴量を生成する第1局所特徴量生成手段をさらに備えることを特徴とする付記1に記載の情報処理システム。
(付記3)
前記捜索物の画像を撮像する第2撮像手段をさらに備え、
前記第1局所特徴量生成手段は、前記第2撮像手段が撮像した前記捜索物の画像に基づいて、前記m個の第1局所特徴量を生成することを特徴とする付記2に記載の情報処理システム。
(付記4)
前記認識手段の認識結果を報知する報知手段をさらに備えることを特徴とする付記3に記載の情報処理システム。
(付記5)
前記情報処理システムは、前記捜索物の局所特徴量を生成するための第1通信端末と、局所特徴量に基づいて前記捜索物を捜索するための第2通信端末と、前記第1通信端末および前記第2通信端末と通信する情報処理装置とを有し、
前記第1通信端末が、前記第2撮像手段と前記第1局所特徴量生成手段と前記報知手段とを含んで、前記m個の第1局所特徴量を前記第1通信端末から前記情報処理装置へ送信し、
前記第2通信端末が、前記第1撮像手段と前記第2局所特徴量生成手段とを含んで、前記n個の第2局所特徴量を前記第2通信端末から前記情報処理装置へ送信し、
前記情報処理装置が、前記第1局所特徴量記憶手段と前記認識手段とを含んで、前記認識手段の認識結果を前記情報処理装置から前記第1通信端末へ送信することを特徴とする付記4に記載の情報処理システム。
(付記6)
前記捜索物は遺失物または盗難物であり、
前記第1局所特徴量記憶手段は、捜索する前記遺失物または盗難物の画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記遺失物または盗難物が存在すると認識することを特徴とする付記2に記載の情報処理システム。
(付記7)
前記捜索物は人物であり、
前記第1局所特徴量記憶手段は、捜索する前記人物の画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記人物が存在すると認識することを特徴とする付記2に記載の情報処理システム。
(付記8)
前記捜索物は複製物であり、
前記第1局所特徴量記憶手段は、元画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記元画像が存在すると認識することを特徴とする付記2に記載の情報処理システム。
(付記9)
前記第2局所特徴量生成手段は、前記第2局所特徴量の精度を調整する精度調整手段を有し、
前記認識手段は、精度をより高く調整して前記第2局所特徴量生成手段が生成した第2局所特徴量に基づいて前記捜索物を確認することを特徴とする付記1乃至8のいずれか1つに記載の情報処理システム。
(付記10)
前記第1局所特徴量および前記第2局所特徴量は、画像から抽出した特徴点を含む局所領域を複数のサブ領域に分割し、前記複数のサブ領域内の勾配方向のヒストグラムからなる複数の次元の特徴ベクトルを生成することにより生成されることを特徴とする付記1乃至9のいずれか1つに記載の情報処理システム。
(付記11)
前記第1局所特徴量および前記第2局所特徴量は、前記生成した複数の次元の特徴ベクトルから、隣接するサブ領域間の相関がより大きな次元を削除することにより生成されることを特徴とする付記10に記載の情報処理システム。
(付記12)
前記特徴ベクトルの複数の次元は、前記特徴点の特徴に寄与する次元から順に、かつ、前記局所特徴量に対して求められる精度の向上に応じて第1次元から順に選択できるよう、所定の次元数ごとに前記局所領域をひと回りするよう配列することを特徴とする付記10または11に記載の情報処理システム。
(付記13)
前記第2局所特徴量生成手段は、捜索する前記捜索物の相関に対応して、他の捜索物とより低い前記相関を有する捜索物については次元数のより少ない前記第2局所特徴量を生成することを特徴とする付記12に記載の情報処理システム。
(付記14)
前記第1局所特徴量記憶手段は、捜索する前記捜索物の相関に対応して、他の捜索物とより低い前記相関を有する捜索物については次元数のより少ない前記第1局所特徴量を記憶することを特徴とする付記12または13に記載の情報処理システム。
(付記15)
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムの情報処理方法であって、
第1撮像手段によって撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
を備えることを特徴とする情報処理方法。
(付記16)
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信手段と、
を備えることを特徴とする通信端末。
(付記17)
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
を含むことを特徴とする通信端末の制御方法。
(付記18)
撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
をコンピュータに実行させることを特徴とする制御プログラム。
(付記19)
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成手段と、
撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信手段と、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信手段と、
を備えたことを特徴とする通信端末。
(付記20)
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
を含むことを特徴とする通信端末の制御方法。
(付記21)
撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
撮像した捜索物が、他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
をコンピュータに実行させることを特徴とする通信端末の制御プログラム。
(付記22)
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信手段と、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信手段と、
を備えたことを特徴とする情報処理装置。
(付記23)
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御方法であって、
前記捜索物を捜索する第通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
を含むことを特徴とする情報処理装置の制御方法。
(付記24)
捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御プログラムであって、
前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信ステップと、
前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
をコンピュータに実行させることを特徴とする制御プログラム。

Claims (24)

  1. 捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
    第1撮像手段が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
    を備えることを特徴とする情報処理システム。
  2. 前記捜索物の画像からm個の特徴点を抽出し、それぞれ1次元からi次元までの特徴ベクトルからなる前記m個の第1局所特徴量を生成する第1局所特徴量生成手段をさらに備えることを特徴とする請求項1に記載の情報処理システム。
  3. 前記捜索物の画像を撮像する第2撮像手段をさらに備え、
    前記第1局所特徴量生成手段は、前記第2撮像手段が撮像した前記捜索物の画像に基づいて、前記m個の第1局所特徴量を生成することを特徴とする請求項2に記載の情報処理システム。
  4. 前記認識手段の認識結果を報知する報知手段をさらに備えることを特徴とする請求項3に記載の情報処理システム。
  5. 前記情報処理システムは、前記捜索物の局所特徴量を生成するための第1通信端末と、局所特徴量に基づいて前記捜索物を捜索するための第2通信端末と、前記第1通信端末および前記第2通信端末と通信する情報処理装置とを有し、
    前記第1通信端末が、前記第2撮像手段と前記第1局所特徴量生成手段と前記報知手段とを含んで、前記m個の第1局所特徴量を前記第1通信端末から前記情報処理装置へ送信し、
    前記第2通信端末が、前記第1撮像手段と前記第2局所特徴量生成手段とを含んで、前記n個の第2局所特徴量を前記第2通信端末から前記情報処理装置へ送信し、
    前記情報処理装置が、前記第1局所特徴量記憶手段と前記認識手段とを含んで、前記認識手段の認識結果を前記情報処理装置から前記第1通信端末へ送信することを特徴とする請求項4に記載の情報処理システム。
  6. 前記捜索物は遺失物または盗難物であり、
    前記第1局所特徴量記憶手段は、捜索する前記遺失物または盗難物の画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
    前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記遺失物または盗難物が存在すると認識することを特徴とする請求項2に記載の情報処理システム。
  7. 前記捜索物は人物であり、
    前記第1局所特徴量記憶手段は、捜索する前記人物の画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
    前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記人物が存在すると認識することを特徴とする請求項2に記載の情報処理システム。
  8. 前記捜索物は複製物であり、
    前記第1局所特徴量記憶手段は、元画像から前記第1局所特徴量生成手段が生成した第1局所特徴量を記憶し、
    前記認識手段は、前記n個の第2局所特徴量に、前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記元画像が存在すると認識することを特徴とする請求項2に記載の情報処理システム。
  9. 前記第2局所特徴量生成手段は、前記第2局所特徴量の精度を調整する精度調整手段を有し、
    前記認識手段は、精度をより高く調整して前記第2局所特徴量生成手段が生成した第2局所特徴量に基づいて前記捜索物を確認することを特徴とする請求項1乃至8のいずれか1項に記載の情報処理システム。
  10. 前記第1局所特徴量および前記第2局所特徴量は、画像から抽出した特徴点を含む局所領域を複数のサブ領域に分割し、前記複数のサブ領域内の勾配方向のヒストグラムからなる複数の次元の特徴ベクトルを生成することにより生成されることを特徴とする請求項1乃至9のいずれか1項に記載の情報処理システム。
  11. 前記第1局所特徴量および前記第2局所特徴量は、前記生成した複数の次元の特徴ベクトルから、隣接するサブ領域間の相関がより大きな次元を削除することにより生成されることを特徴とする請求項10に記載の情報処理システム。
  12. 前記特徴ベクトルの複数の次元は、前記特徴点の特徴に寄与する次元から順に、かつ、前記局所特徴量に対して求められる精度の向上に応じて第1次元から順に選択できるよう、所定の次元数ごとに前記局所領域をひと回りするよう配列することを特徴とする請求項10または11に記載の情報処理システム。
  13. 前記第2局所特徴量生成手段は、捜索する前記捜索物の相関に対応して、他の捜索物とより低い前記相関を有する捜索物については次元数のより少ない前記第2局所特徴量を生成することを特徴とする請求項12に記載の情報処理システム。
  14. 前記第1局所特徴量記憶手段は、捜索する前記捜索物の相関に対応して、他の捜索物とより低い前記相関を有する捜索物については次元数のより少ない前記第1局所特徴量を記憶することを特徴とする請求項12または13に記載の情報処理システム。
  15. 捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理システムの情報処理方法であって、
    第1撮像手段によって撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
    を備えることを特徴とする情報処理方法。
  16. 撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成手段と、
    局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信手段と、
    を備えることを特徴とする通信端末。
  17. 撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
    を含むことを特徴とする通信端末の制御方法。
  18. 撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を生成する第2局所特徴量生成ステップと、
    前記n個の第2局所特徴量を、局所特徴量の照合に基づいて撮像した前記画像に含まれる捜索物を認識する情報処理装置に送信する第1送信ステップと、
    をコンピュータに実行させることを特徴とする制御プログラム。
  19. 撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成手段と、
    撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信手段と、
    前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信手段と、
    を備えたことを特徴とする通信端末。
  20. 撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
    撮像した捜索物が他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
    前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
    を含むことを特徴とする通信端末の制御方法。
  21. 撮像した捜索物の画像からm個の特徴点を抽出し、前記m個の特徴点のそれぞれを含むm個の局所領域について、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量を生成する第1局所特徴量生成ステップと、
    撮像した捜索物が、他の画像に含まれるか否かを局所特徴量の照合に基づいて認識する情報処理装置に、前記m個の第1局所特徴量を送信する第2送信ステップと、
    前記情報処理装置から、前記他の画像に含まれる前記撮像した捜索物を示す情報を受信する第1受信ステップと、
    をコンピュータに実行させることを特徴とする通信端末の制御プログラム。
  22. 捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段と、
    前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信手段と、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識手段と、
    認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信手段と、
    を備えたことを特徴とする情報処理装置。
  23. 捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御方法であって、
    前記捜索物を捜索する第通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記通信端末から受信する第2受信ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
    認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
    を含むことを特徴とする情報処理装置の制御方法。
  24. 捜索物と、前記捜索物の画像のm個の特徴点のそれぞれを含むm個の局所領域のそれぞれについて生成された、それぞれ1次元からi次元までの特徴ベクトルからなるm個の第1局所特徴量とを、対応付けて記憶する第1局所特徴量記憶手段を備えた情報処理装置の制御プログラムであって、
    前記捜索物を捜索する第1通信端末が撮像した映像中の画像からn個の特徴点を抽出し、前記n個の特徴点のそれぞれを含むn個の局所領域について、それぞれ1次元からj次元までの特徴ベクトルからなるn個の第2局所特徴量を、前記第1通信端末から受信する第2受信ステップと、
    前記第1局所特徴量の特徴ベクトルの次元数iおよび前記第2局所特徴量の特徴ベクトルの次元数jのうち、より少ない次元数を選択し、選択された前記次元数までの特徴ベクトルからなる前記n個の第2局所特徴量に、選択された前記次元数までの特徴ベクトルからなる前記m個の第1局所特徴量の所定割合以上が対応すると判定した場合に、前記映像中の前記画像に前記捜索物が存在すると認識する認識ステップと、
    認識した前記捜索物を示す情報を、前記捜索物の捜索を依頼した第2通信端末に送信する第2送信ステップと、
    をコンピュータに実行させることを特徴とする制御プログラム。
JP2013556424A 2012-01-30 2013-01-30 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム Active JP6168303B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013556424A JP6168303B2 (ja) 2012-01-30 2013-01-30 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012017384 2012-01-30
JP2012017384 2012-01-30
JP2013556424A JP6168303B2 (ja) 2012-01-30 2013-01-30 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
PCT/JP2013/051953 WO2013115202A1 (ja) 2012-01-30 2013-01-30 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2013115202A1 true JPWO2013115202A1 (ja) 2015-05-11
JP6168303B2 JP6168303B2 (ja) 2017-07-26

Family

ID=48905236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013556424A Active JP6168303B2 (ja) 2012-01-30 2013-01-30 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム

Country Status (3)

Country Link
US (1) US9792528B2 (ja)
JP (1) JP6168303B2 (ja)
WO (1) WO2013115202A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2517944A (en) * 2013-09-05 2015-03-11 Ibm Locating objects using images from portable devices
CN104036281B (zh) * 2014-06-24 2017-05-03 北京奇虎科技有限公司 一种图片的匹配方法、搜索方法及其装置
CN104036009B (zh) * 2014-06-24 2017-08-08 北京奇虎科技有限公司 一种搜索匹配图片的方法、图片搜索方法及装置
WO2015196964A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 搜索匹配图片的方法、图片搜索方法及装置
JP6200451B2 (ja) * 2015-05-26 2017-09-20 株式会社オプティム 識別子記憶サーバ、識別子記憶方法及び識別子記憶サーバ用プログラム
JP6822093B2 (ja) * 2016-11-21 2021-01-27 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
CN107038408A (zh) 2017-01-11 2017-08-11 阿里巴巴集团控股有限公司 基于增强现实的图像识别方法及装置
CN108303435B (zh) * 2017-01-12 2020-09-11 同方威视技术股份有限公司 检查设备和对集装箱进行检查的方法
JP7113217B2 (ja) * 2017-11-17 2022-08-05 パナソニックIpマネジメント株式会社 照合装置、照合方法、及びプログラム
US11281926B2 (en) * 2018-06-04 2022-03-22 Denso Corporation Feature extraction method and apparatus
JP7173597B2 (ja) * 2020-04-06 2022-11-16 日本電気株式会社 通信システム、検索装置および検索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222250A (ja) * 2004-02-04 2005-08-18 Toshiba Corp 捜索装置
JP2005347905A (ja) * 2004-06-01 2005-12-15 Oki Electric Ind Co Ltd 防犯支援システム
JP2008257649A (ja) * 2007-04-09 2008-10-23 Denso Corp 画像認識装置
JP2011242861A (ja) * 2010-05-14 2011-12-01 Ntt Docomo Inc 物体認識装置、物体認識システムおよび物体認識方法

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2004151820A (ja) 2002-10-29 2004-05-27 Hitachi Eng Co Ltd 迷子検索・監視システム
JP2004213087A (ja) * 2002-12-26 2004-07-29 Toshiba Corp 個人認証装置および個人認証方法
SE528068C2 (sv) * 2004-08-19 2006-08-22 Jan Erik Solem Med Jsolutions Igenkänning av 3D föremål
JP4925419B2 (ja) * 2006-06-21 2012-04-25 株式会社日立国際電気 情報収集システム、及び、モバイル端末
US9313359B1 (en) * 2011-04-26 2016-04-12 Gracenote, Inc. Media content identification on mobile devices
US9041508B2 (en) * 2008-08-08 2015-05-26 Snap-On Incorporated Image-based inventory control system and method
JP4547639B2 (ja) * 2008-08-26 2010-09-22 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5185196B2 (ja) 2009-05-27 2013-04-17 高千穂交易株式会社 防犯装置、その制御方法、プログラム、及び防犯システム
JP5164222B2 (ja) 2009-06-25 2013-03-21 Kddi株式会社 画像検索方法およびシステム
WO2011001587A1 (ja) * 2009-07-01 2011-01-06 日本電気株式会社 コンテンツ分類装置、コンテンツ分類方法及びコンテンツ分類プログラム
JP5406705B2 (ja) * 2009-12-28 2014-02-05 キヤノン株式会社 データ補正装置及び方法
JP5521676B2 (ja) 2010-03-19 2014-06-18 富士通株式会社 画像処理装置及び画像処理プログラム
JP2011221688A (ja) 2010-04-07 2011-11-04 Sony Corp 認識装置、認識方法、およびプログラム
US20130208984A1 (en) * 2010-10-25 2013-08-15 Nec Corporation Content scene determination device
JP5991488B2 (ja) * 2011-02-10 2016-09-14 日本電気株式会社 相違領域検出システム及び相違領域検出方法
WO2012108089A1 (ja) * 2011-02-10 2012-08-16 日本電気株式会社 映像間対応関係表示システム及び映像間対応関係表示方法
WO2012108090A1 (ja) * 2011-02-10 2012-08-16 日本電気株式会社 映像間対応関係表示システム及び映像間対応関係表示方法
US8660368B2 (en) * 2011-03-16 2014-02-25 International Business Machines Corporation Anomalous pattern discovery
US8571306B2 (en) * 2011-08-10 2013-10-29 Qualcomm Incorporated Coding of feature location information
US9053371B2 (en) * 2011-09-29 2015-06-09 Texas Instruments Incorporated Method, system and computer program product for identifying a location of an object within a video sequence
WO2013051619A1 (ja) * 2011-10-03 2013-04-11 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
US20130113929A1 (en) * 2011-11-08 2013-05-09 Mary Maitland DeLAND Systems and methods for surgical procedure safety
WO2013073622A1 (ja) * 2011-11-18 2013-05-23 日本電気株式会社 局所特徴量抽出装置、局所特徴量抽出方法、及びプログラム
US9805282B2 (en) * 2011-11-18 2017-10-31 Nec Corporation Local feature descriptor extracting apparatus, method for extracting local feature descriptor, and program
KR101611778B1 (ko) * 2011-11-18 2016-04-15 닛본 덴끼 가부시끼가이샤 국소 특징 기술자 추출 장치, 국소 특징 기술자 추출 방법, 및 프로그램을 기록한 컴퓨터 판독가능 기록 매체
US9239850B2 (en) * 2011-11-18 2016-01-19 Nec Corporation Feature descriptor encoding apparatus, feature descriptor encoding method, and program
US9009149B2 (en) * 2011-12-06 2015-04-14 The Trustees Of Columbia University In The City Of New York Systems and methods for mobile search using Bag of Hash Bits and boundary reranking
JP6153086B2 (ja) * 2011-12-14 2017-06-28 日本電気株式会社 映像処理システム、映像処理方法、携帯端末用またはサーバ用の映像処理装置およびその制御方法と制御プログラム
WO2013089146A1 (ja) * 2011-12-16 2013-06-20 日本電気株式会社 情報処理システム、情報処理方法、通信端末およびその制御方法と制御プログラム
US9986208B2 (en) * 2012-01-27 2018-05-29 Qualcomm Incorporated System and method for determining location of a device using opposing cameras
US9418314B2 (en) * 2012-01-30 2016-08-16 Nec Corporation Information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof
WO2014030400A1 (ja) * 2012-08-23 2014-02-27 日本電気株式会社 物体識別装置、物体識別方法、及びプログラム
CN104584073B (zh) * 2012-08-23 2017-04-05 日本电气株式会社 物体识别装置和物体识别方法
CN103714077B (zh) * 2012-09-29 2017-10-20 日电(中国)有限公司 物体检索的方法、检索校验的方法及装置
TW201437925A (zh) * 2012-12-28 2014-10-01 Nec Corp 物體識別裝置、方法及電腦程式產品
US9025825B2 (en) * 2013-05-10 2015-05-05 Palo Alto Research Center Incorporated System and method for visual motion based object segmentation and tracking

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222250A (ja) * 2004-02-04 2005-08-18 Toshiba Corp 捜索装置
JP2005347905A (ja) * 2004-06-01 2005-12-15 Oki Electric Ind Co Ltd 防犯支援システム
JP2008257649A (ja) * 2007-04-09 2008-10-23 Denso Corp 画像認識装置
JP2011242861A (ja) * 2010-05-14 2011-12-01 Ntt Docomo Inc 物体認識装置、物体認識システムおよび物体認識方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YAN KE, RAHUL SUKTHANKAR: "PCA-SIFT: A More Distinctive Representation for Local Image Descriptors", PROC. OF CVPR2004, VOL.2, JPN6016050055, 27 June 2004 (2004-06-27), US, pages 506 - 513, ISSN: 0003469648 *
向井 良 RYO MUKAI: "TRECVID 2010 Content−Based Copy Detectionタスク参加報告 A", 電子情報通信学会技術研究報告 VOL.110 NO.414 IEICE TECHNICAL REPORT, vol. 第110巻, JPN6016050057, JP, ISSN: 0003469649 *

Also Published As

Publication number Publication date
US20150010237A1 (en) 2015-01-08
WO2013115202A1 (ja) 2013-08-08
JP6168303B2 (ja) 2017-07-26
US9792528B2 (en) 2017-10-17

Similar Documents

Publication Publication Date Title
JP6168303B2 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
US11886489B2 (en) System and method of identifying visual objects
US9697435B2 (en) Local feature descriptor extracting apparatus, local feature descriptor extracting method, and program
US9418314B2 (en) Information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof
Duan et al. Compact descriptors for mobile visual search and MPEG CDVS standardization
JPWO2013089146A1 (ja) 情報処理システム、情報処理方法、通信端末およびその制御方法と制御プログラム
JP6153086B2 (ja) 映像処理システム、映像処理方法、携帯端末用またはサーバ用の映像処理装置およびその制御方法と制御プログラム
WO2013115092A1 (ja) 映像処理システム、映像処理方法、映像処理装置およびその制御方法と制御プログラム
CN103530377B (zh) 一种基于二进制特征码的场景信息搜索方法
JP2005136665A (ja) データ信号の送信方法と受信方法及びその装置、システム、プログラム並びに記録媒体
JP6131859B2 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
CN105069718A (zh) 基于移动物联网的智慧国土不动产自助监测方法和系统
WO2013089004A1 (ja) 映像処理システム、映像処理方法、携帯端末用またはサーバ用の映像処理装置およびその制御方法と制御プログラム
JP2019121176A (ja) 位置特定装置、位置特定方法、位置特定プログラムおよびカメラ装置
Santos et al. RECOGNIZING AND EXPLORING AZULEJOS ON HISTORIC BUILDINGS’FACADES BY COMBINING COMPUTER VISION AND GEOLOCATION IN MOBILE AUGMENTED REALITY APPLICATIONS
JP2023176244A (ja) 画像処理システム、装置、処理方法、およびプログラム
Marez et al. Bandwidth constrained cooperative object detection in images
Jiao et al. An indoor positioning method based on wireless signal and image
Li et al. Learning to Find the Optimal Correspondence Between SAR and Optical Image Patches
WO2013089041A1 (ja) 映像処理システム、映像処理方法、携帯端末用またはサーバ用の映像処理装置およびその制御方法と制御プログラム
Zhang et al. Socio-mobile landmark recognition using local features with adaptive region selection
Lakshmi et al. High-Resolution Data-Driven Approach for Pedestrian Detection Using Deep Learning
Narayanan et al. Smart Vision: Real Time Object Detection
He et al. A method of face mosaic for the target person
Jiao et al. A Hybrid Method for Indoor Positioning Based on Wireless Network and Smartphone Camera

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170613

R150 Certificate of patent or registration of utility model

Ref document number: 6168303

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150