JPWO2013175608A1 - 画像解析装置、画像解析システム、画像解析方法 - Google Patents
画像解析装置、画像解析システム、画像解析方法 Download PDFInfo
- Publication number
- JPWO2013175608A1 JPWO2013175608A1 JP2014516586A JP2014516586A JPWO2013175608A1 JP WO2013175608 A1 JPWO2013175608 A1 JP WO2013175608A1 JP 2014516586 A JP2014516586 A JP 2014516586A JP 2014516586 A JP2014516586 A JP 2014516586A JP WO2013175608 A1 JPWO2013175608 A1 JP WO2013175608A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- metadata
- image data
- bibliographic information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010191 image analysis Methods 0.000 title claims abstract description 94
- 238000003703 image analysis method Methods 0.000 title claims 2
- 238000001514 detection method Methods 0.000 claims abstract description 135
- 238000000034 method Methods 0.000 claims abstract description 69
- 238000012545 processing Methods 0.000 claims description 75
- 238000004458 analytical method Methods 0.000 claims description 41
- 239000000284 extract Substances 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 11
- 230000036961 partial effect Effects 0.000 claims description 5
- 238000003860 storage Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 17
- 238000000605 extraction Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
図1は、本発明の実施形態1に係る画像解析システム100の構成図である。画像解析システム100は、大量の画像中から、ユーザが指定した任意の物体を含む画像を探索することを目的とするシステムである。画像解析システム100は、画像・文書記憶装置101、入力装置102、表示装置103、データ格納装置104、画像データベース105、画像解析装置106を備える。
以上、画像解析システム100の全体構成を説明した。以下では画像解析システム100の動作原理を概説した上で、各機能部の詳細動作を説明する。
画像・文書入力部107は、受け取った画像データと書誌情報を画像データベース105へ登録する。画像データベース105は、画像データから画像特徴量を抽出し、書誌情報と関連付けて登録する。画像特徴量を抽出する処理は、画像・文書入力部107が実施するように構成してもよい。本ステップは、ステップS402以降を実施する前にあらかじめ実施しておけばよく、本フローチャートを実施する毎に実施する必要はない。
画像・文書入力部107は、検出対象物を含むクエリ画像を取得する(S402)。メタデータ生成部108は、クエリ画像のメタデータを生成する(S403)。詳しくは図5を用いて後述する。
解析対象決定部109は、ステップS403でメタデータ生成部108が生成したメタデータの中から、物体検出の対象とする画像データを絞り込むために使用するメタデータを決定する。具体的には、メタデータの信頼度に応じて機械的に判定してもよいし(例えば信頼度の高いほうから順に所定範囲内を自動選択する)、データ出力部111を介してメタデータをユーザに提示してユーザ自身に選択させてもよい。
解析対象決定部109は、ステップS404で選択されたメタデータを検索キーとして用いて、画像データベース105が格納している書誌情報を検索し、検索キーに合致する画像データの集合を取得する。この画像集合が物体検出処理の対象となる。
画像解析装置106は、ステップS405で取得した画像集合に含まれる各画像データに対して、ステップS407を実施する。ステップS407において、物体領域検出部110は、ステップS405で取得した画像集合に含まれる画像中から、クエリ画像に含まれる物体と類似した領域を抽出する。物体領域の抽出方法については、図7を用いて後述する。
データ出力部112は、物体領域検出部110が検出した物体領域の検出結果を出力する。検出結果は処理順に出力してもよいし、検出された物体の数や信頼度を基準としてソーティングしてから出力してもよい。さらには図3の検出結果304に示すように、検出された物体の個数、検出信頼度、検出した物体領域を示す矩形、などの補足情報を合わせて出力してもよい。さらには、表示装置103を介して画面上で出力してもよいし、検出結果および上記各補足情報を記述したデータを出力してもよい。
検出対象である物体がこれ以上なければ(ユーザの指示がなければ)終了し、クエリ画像内に他の物体があるか、またはユーザが新たにクエリ画像を指定した場合等、別の物体を検出する場合は、ステップS402に戻って同様の処理を実施する。
メタデータ生成部108は、クエリ画像301を検索キーとして、画像データベース105からこれに類似する画像を検索する。類似画像検索は、画像自体の持つ色や形状などの情報を高次元ベクトル情報として抽出し、ベクトル間距離に基づき画像間の類似性を評価することにより、類似する画像を検索する方法である。この結果、「見た目」がクエリ画像301と似た画像の集合501が得られる。さらに、画像データベース105は画像と書誌情報を関連付けて保持しているので、類似画像の集合502から、書誌情報の集合502が得られる。
メタデータ生成部108は、書誌情報の集合に含まれる特徴的な単語を抽出する。書誌情報として、画像の分類コードなどの整理されたデータが付与されていれば望ましいが、説明文のような文書が付与されている場合でも、その文書中には画像の意味を表現する特徴的な単語が含まれる可能性が高い。そこで本ステップにおいて、メタデータ生成部108は、各書誌情報をアトミックなデータ(最小構成単位)に分解し(例:文書から単語単位に分解)、それをメタデータと考える。以上により、クエリ画像301のメタデータを生成することができる。
メタデータ生成部108は、手順1で生成したメタデータが書誌情報中で出現する頻度を数える。メタデータ生成部108は、その出現頻度を用いて、手順1で生成した各メタデータのスコアを算出する。単純に、出現頻度をメタデータのスコアとして、スコアの高い順にソーティングしてもよいし、出現頻度に重みをつけた評価指標をスコアとして用いてもよい。
メタデータのスコアとして、TF−IDF(Term Frequency−Inverse Document Frequency)を用いることができる。TF−IDFは、メタデータtの頻度tf(t)と、逆文書頻度idf(t)をかけ合わせた評価指標である。逆文書頻度idf(t)は、データベースのレコード数をN、データベース全体のなかでメタデータtを含む書誌情報の頻度をdf(t)とすると、下記数1により表される。
メタデータのスコアとして、確率的評価指標を用いてもよい。例えば、メタデータtを評価する場合は、データベース全体からランダムに画像を取得したときに、その書誌情報にメタデータtが含まれる確率をq(t)、類似画像検索結果の画像集合からランダムに画像を取得したときに、その書誌情報にメタデータtが含まれる確率をp(t)とすると、数2から数4に示すp(t)とq(t)の確率分布の差の尺度kl(t)を、メタデータのスコアとして用いることができる。
メタデータ生成部108は、クエリ画像301の画像特徴量を計算する(S601)。メタデータ生成部108は、ステップS601で抽出した画像特徴量を検索キーとして、類似画像検索を実施する(S602)。各画像の特徴量ベクトル間の距離が小さいほど画像間の類似度が高いものとし、距離値に応じてソーティングした結果を検索結果として出力する。
メタデータ生成部108は、ステップS602で得られた類似画像それぞれに対して、ステップS604〜S606を実施する。
メタデータ生成部108は、ステップS602で得られた類似画像に関連付けられた書誌情報を画像データベース105から読みだす(S604)。メタデータ生成部108は、ステップS604で取得した書誌情報をアトミックなデータに分解し、これをメタデータとする(S605)。例えば、書誌情報が文書である場合は形態素解析を実施し、単語単位に分解する。書誌情報を分解する処理は、効率化のため、画像データベース105へ文書を登録する際に、あらかじめ実施しておいてもよい。
メタデータ生成部108は、ステップS604で読み出した書誌情報のなかで、ステップS605で生成したメタデータが出現する頻度をカウントする。メタデータ生成部108は、ステップS603〜S607の全体を通して、メタデータ毎に累積頻度を求める。このとき、画像の類似度をメタデータの頻度に反映させるため、類似度に応じて重み付けをした後、累積頻度に加算するようにしてもよい。
メタデータ生成部108は、ステップS603〜S607で求めたメタデータ毎の累積頻度を用いて、メタデータのスコアを算出する。スコアの算出手法については図5で説明した通りである。
メタデータ生成部108は、ステップS608で算出したスコア順にメタデータをソーティングし、閾値以下のメタデータは除外して、出力する。
物体領域検出部110は、テンプレートの特徴量を計算し、テンプレートデータベースに登録する。物体を検出する対象である入力画像701が複数あり、同じテンプレートを用いて検出処理を実施する場合は、本ステップは最初の1回のみ実施すればよい。
物体領域検出部110は、入力画像701内の候補領域703を抽出する。候補領域703は、走査窓をステップ毎に移動し、またはサイズ変更することにより、機械的に抽出される。
物体領域検出部110は、全ての候補領域703について、ステップS802〜ステップS806を実施する。
物体領域検出部110は、候補領域703の信頼度を算出する。信頼度の算出方法としては、例えば図7で述べたように、テンプレートの特徴量と候補領域703の特徴量の間の距離を用いることができる。
ステップS803で求めた候補領域703の信頼度が所定閾値以下であればステップS805に移動し、それ以外であればステップS805をスキップする(S804)。物体領域検出部110は、信頼度が所定閾値である候補領域703を、検出結果リストに追加する(S805)。
物体領域検出部110は、検出結果リストを出力し、本処理フローを終了する。検出結果は、入力画像701内の座標情報(例えば、[矩形の左上隅の水平座標, 矩形の左上隅の垂直座標, 矩形の右下隅の水平座標, 矩形の右下隅の垂直座標])と信頼度の組として出力される。
ユーザは入力装置102を介して、画像データベース105に格納する画像とそれに関連付けられた文書を入力する(S901)。画像と文章の集合は、画像解析装置106を中継して画像データベース105に送られる。画像データベース105は、画像解析装置106から受け取った画像から特徴量を抽出し、文書から得られる書誌情報と関連付けて登録する(S902)。ステップS901〜S902は、図4のステップS401に相当する。
ユーザは入力装置102を介して、検出したい物体の画像(クエリ画像)を入力する(S903)。画像解析装置106は、クエリ画像を検索キーとして、画像データベース105に対して類似画像検索を要求する(S904)。画像データベース105は、クエリ画像から画像特徴量を抽出し、これを用いてクエリ画像に類似する画像を検索し、類似画像とその書誌情報を画像解析装置106に返す(S905)。画像解析装置106は、画像データベース105から受け取った書誌情報を用いてクエリ画像のメタデータを生成し、そのスコアを計算する(S906)。
画像解析装置106は、ステップS906で生成したメタデータとそのスコアを、表示装置103またはデータ格納装置104を介してユーザに提示する(S907)。ユーザは、メタデータ自体とそのスコアを参考に、検索対象とする画像を絞り込むために使用するメタデータを選択する(S908)。ステップS908を省略し、例えばスコアが高いほうから順にメタデータを選択するなどして、画像解析装置106が自動的にメタデータを選択することもできる。
画像解析装置106は、ステップS908でユーザが選択したメタデータを検索キーとして、書誌情報が検索キーに合致する画像を検索するように画像データベース105へ要求する(S909)。画像データベース105は、検索クエリに該当する書誌情報を検索し、それに関連付けられた画像を画像解析装置106に返す(S910)。
画像解析装置106は、ステップS910の結果得られた各画像に対して、クエリ画像に含まれる物体を検出する処理を実施し、クエリ画像に類似した領域を特定する。検出結果は、画像中における物体の矩形領域の座標(例えば、[矩形の左上隅の水平座標, 矩形の左上隅の垂直座標, 矩形の右下隅の水平座標, 矩形の右下隅の垂直座標])と「物体らしさ」を表す信頼度で表される。検出結果は、データ出力部112を介して出力される。
以上のように、本実施形態1に係る画像解析システム100は、クエリ画像のメタデータを書誌情報として含む画像データのみを対象として物体検出を実施する。これにより、大量の画像中から物体検出の対象とするものを効果的に絞り込み、ユーザが指定した物体を含む画像を高速に探すことができる。
実施形態1で説明した画像解析システム100においては、解析対象決定部109が書誌情報検索によって物体検出の対象とする画像を絞り込む。そのため、実際にはユーザが指定した物体を含んでいるにもかかわらず、書誌情報が不十分な画像は、検出処理の対象にならず、解析結果として現れなくなる。以下では、書誌情報を拡張することにより、検出処理対象の漏れを軽減する方法について述べる。その他の構成は実施形態1と概ね同様であるため、以下では差異点を中心に説明する。
メタデータ生成部108は、画像データベース105が保持している既存の書誌情報を用いて、画像データベース105内の画像のメタデータを生成する。メタデータを生成する方法は図6で示した手順と同様であるが、例えば類似度の閾値を図6よりも厳しくしたり、物体のレイアウトが変動しても変化しない画像特徴量を用いたりしてもよい。
メタデータ生成部108は、ステップS1202で生成したメタデータを、追加の書誌情報として画像データベース105に登録する。
以上のように、本実施形態2に係る画像解析システム100は、画像データベース105が格納している画像のメタデータを生成し、これを新たな書誌情報として画像データベース105に追加した上で、実施形態1と同様の処理を実施する。これにより、既存の書誌情報のみを用いた場合では検出漏れとなる画像も処理対象とすることができる。
本発明の実施形態3では、画像解析システム100の処理における中間データを利用することにより、物体検出の精度を上げる方法を説明する。本手法は、物体検出の手法として、図7で説明したテンプレートを複数用いるものである。その他の構成は実施形態1〜2と同様であるため、以下ではクエリ画像のメタデータを生成する際に複数のテンプレートを用いて類似画像を検索する点を中心に説明する。
以上のように、本実施形態3に係る画像解析装置106は、クエリ画像301のメタデータを生成する際に得られる類似画像や、書誌情報を検索する際に得られる画像を、物体検出のための拡張テンプレートとして用いる。これにより、概念が共通でも「見た目」の異なる物体を検出することができる。
本発明の実施形態4では、画像解析システム100をコンテンツクラウドシステムへ組み込んだ構成例について説明する。以下ではまず、コンテンツクラウドシステムの概要を説明し、その後、画像解析システム100を解析モジュールとしてコンテンツクラウドシステムへ組み込む方法について説明する。画像解析システム100の構成は実施形態1〜3と同様である。
以上のように、本発明に係る画像解析システム100は、コンテンツクラウドシステム1600の構成要素として適用することができる。コンテンツクラウドシステム1600は、各メディアデータに共通して利用可能なメタデータを生成することにより、メディア間にまたがって情報を統合することができる。これにより、付加価値がより高い情報をユーザへ提供することが期待される。
Claims (15)
- 検出対象とする物体の画像を含むクエリ画像データを受け取る画像入力部と、
画像データとその書誌情報を対応付けて保持する画像データベースを用いて前記クエリ画像データのメタデータを生成するメタデータ生成部と、
前記画像データベースが保持している前記画像データのうち前記書誌情報が前記メタデータと合致するものを1以上抽出する解析対象決定部と、
前記解析対象決定部が抽出した1以上の前記画像データのうち前記物体の画像を含む領域を検出する物体領域検出部と、
前記物体領域検出部が検出した結果を出力する出力部と、
を備えることを特徴とする画像解析装置。 - 前記メタデータ生成部は、
前記画像データベースが保持している前記画像データのうち前記クエリ画像データと類似するものを検索し、その結果得られた前記画像データの前記書誌情報を用いて前記メタデータを生成する
ことを特徴とする請求項1記載の画像解析装置。 - 前記メタデータ生成部は、
前記検索の結果得られた前記画像データの前記書誌情報のなかに前記メタデータが出現する頻度を用いて前記メタデータのスコアを算出し、
前記解析対象決定部は、
前記スコアを用いて、前記書誌情報と合致するものを抽出する際に検索キーとする前記メタデータを決定する
ことを特徴とする請求項2記載の画像解析装置。 - 前記解析対象決定部は、
前記スコアが高いほうから順に所定範囲以内の前記メタデータを検索キーとして、前記メタデータと合致する前記書誌情報に対応付けられた前記画像データを抽出する
ことを特徴とする請求項3記載の画像解析装置。 - 前記解析対象決定部は、
前記メタデータのうちいずれを用いて前記書誌情報と合致するものを抽出するかを指定するメタデータ指定を受け取り、その指定された前記メタデータと合致する前記書誌情報に対応付けられた前記画像データを抽出する
ことを特徴とする請求項3記載の画像解析装置。 - 前記画像解析装置は、
前記物体領域検出部が前記物体の画像を含む領域を検出する対象とする前記画像データの件数およびその検出処理時間を表示する表示部を備え、
前記解析対象決定部は、
前記メタデータ指定を受け取る毎に、前記件数と前記検出処理時間を再計算して前記表示部上にその再計算の結果を反映する
ことを特徴とする請求項5記載の画像解析装置。 - 前記メタデータ生成部は、
前記検索の結果得られた前記画像データのうち、前記クエリ画像データと合わせて前記メタデータを生成するために用いるものを指定する類似画像指定を受け取り、
前記画像データベースが保持している前記画像データのうち、前記クエリ画像データと類似するものおよび前記類似画像指定により指定された前記画像データと類似するものを検索し、その結果得られた前記画像データの前記書誌情報を用いて前記メタデータを生成する
ことを特徴とする請求項2記載の画像解析装置。 - 前記物体領域検出部は、
前記画像データの部分領域の特徴量ベクトルと、前記クエリ画像データの特徴量ベクトルとの間のベクトル間距離を算出し、
前記ベクトル間距離が所定範囲内にあるか否かにより、前記クエリ画像データ内に含まれる前記物体が前記部分領域内に含まれているか否かを判定する
ことを特徴とする請求項1記載の画像解析装置。 - 前記出力部は、
前記物体領域検出部が前記画像データ内で検出した前記物体の個数を、前記物体領域検出部が検出した結果とともに出力する
ことを特徴とする請求項1記載の画像解析装置。 - 前記出力部は、
前記物体領域検出部が前記画像データ内で検出した前記物体の検出信頼度を、前記物体領域検出部が検出した結果とともに出力する
ことを特徴とする請求項1記載の画像解析装置。 - 前記メタデータ生成部は、
前記画像データベースが保持している前記画像データのメタデータを、前記画像データベースが保持している他の前記画像データを用いて生成し、生成したメタデータを前記書誌情報として追加し、
前記解析対象決定部は、
前記メタデータが追加された前記書誌情報を用いて、前記画像データベースが保持している前記画像データのうち前記書誌情報が前記メタデータと合致するものを1以上抽出する
ことを特徴とする請求項1記載の画像解析装置。 - 前記物体領域検出部は、
前記解析対象決定部が抽出した1以上の前記画像データのうち、
前記物体の画像を含む領域と、前記メタデータ生成部が前記検索を実施した結果得られた前記画像データに含まれる物体の画像を含む領域と、を検出する
ことを特徴とする請求項1記載の画像解析装置。 - 前記物体領域検出部は、
前記メタデータ生成部が前記検索を実施した結果得られた前記画像データのうち、前記クエリ画像データに含まれる前記物体と合わせて検出すべき物体を含むものを指定する検出対象指定を受け取り、
前記解析対象決定部が抽出した1以上の前記画像データのうち、
前記物体の画像を含む領域と、前記検出対象指定により指定された前記画像データに含まれる物体の画像を含む領域と、を検出する
ことを特徴とする請求項12記載の画像解析装置。 - 請求項1記載の画像解析装置と、
画像データとその書誌情報を対応付けて保持する画像データベースと、
を有し、
前記メタデータ生成部は、前記画像データベースを用いて前記クエリ画像データのメタデータを生成する
ことを特徴とする画像解析システム。 - 検出対象とする物体の画像を含むクエリ画像データを受け取る画像入力ステップ、
画像データとその書誌情報を対応付けて保持する画像データベースを用いて前記クエリ画像データのメタデータを生成するメタデータ生成ステップ、
前記画像データベースが保持している前記画像データのうち前記書誌情報が前記メタデータと合致するものを1以上抽出する解析対象決定ステップ、
前記解析対象決定ステップで抽出した1以上の前記画像データのうち前記物体の画像を含む領域を検出する物体領域検出ステップ、
前記物体領域検出ステップで検出した結果を出力する出力ステップ、
を有することを特徴とする画像解析方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/063322 WO2013175608A1 (ja) | 2012-05-24 | 2012-05-24 | 画像解析装置、画像解析システム、画像解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013175608A1 true JPWO2013175608A1 (ja) | 2016-01-12 |
JP5857124B2 JP5857124B2 (ja) | 2016-02-10 |
Family
ID=49623339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014516586A Active JP5857124B2 (ja) | 2012-05-24 | 2012-05-24 | 画像解析装置、画像解析システム、画像解析方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9665798B2 (ja) |
JP (1) | JP5857124B2 (ja) |
CN (1) | CN104321802B (ja) |
SG (1) | SG11201407749TA (ja) |
WO (1) | WO2013175608A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660807B2 (en) | 2005-11-28 | 2010-02-09 | Commvault Systems, Inc. | Systems and methods for cataloging metadata for a metabase |
US20200257596A1 (en) | 2005-12-19 | 2020-08-13 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
US8892523B2 (en) | 2012-06-08 | 2014-11-18 | Commvault Systems, Inc. | Auto summarization of content |
JP2014127011A (ja) * | 2012-12-26 | 2014-07-07 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
KR102155133B1 (ko) * | 2013-07-12 | 2020-09-11 | 삼성전자주식회사 | 이미지 표시 방법 및 장치 |
DE102014113817A1 (de) * | 2013-10-15 | 2015-04-16 | Electronics And Telecommunications Research Institute | Vorrichtung und Verfahren zur Erkennung eines Objekts in Einem Bild |
WO2015122162A1 (ja) * | 2014-02-14 | 2015-08-20 | 日本電気株式会社 | 映像検索装置 |
WO2015153681A1 (en) * | 2014-03-31 | 2015-10-08 | Kofax, Inc. | Scalable business process intelligence and predictive analytics for distributed architectures |
JP6352753B2 (ja) * | 2014-09-29 | 2018-07-04 | 株式会社東芝 | グラフ表示装置、方法、及びプログラム |
EP3213002A4 (en) * | 2014-10-28 | 2018-05-09 | Wwtemplar LLC | Managing building information and resolving building issues |
JP6463095B2 (ja) * | 2014-11-25 | 2019-01-30 | キヤノン株式会社 | 画像検索装置及び方法 |
US10657171B2 (en) * | 2015-03-13 | 2020-05-19 | Hitachi, Ltd. | Image search device and method for searching image |
JP2017004252A (ja) * | 2015-06-10 | 2017-01-05 | 株式会社ウイル・コーポレーション | 画像情報処理システム |
JP6587435B2 (ja) * | 2015-06-29 | 2019-10-09 | キヤノン株式会社 | 画像処理装置、情報処理方法及びプログラム |
JP6533713B2 (ja) * | 2015-07-31 | 2019-06-19 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
CN106028160A (zh) * | 2016-06-03 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 一种图像数据处理方法及其设备 |
US10540516B2 (en) | 2016-10-13 | 2020-01-21 | Commvault Systems, Inc. | Data protection within an unsecured storage environment |
US11120074B2 (en) * | 2016-12-06 | 2021-09-14 | International Business Machines Corporation | Streamlining citations and references |
JP6767342B2 (ja) * | 2017-11-15 | 2020-10-14 | ヤフー株式会社 | 検索装置、検索方法および検索プログラム |
JP7208713B2 (ja) * | 2018-02-13 | 2023-01-19 | キヤノン株式会社 | 画像解析装置および画像解析方法 |
US10642886B2 (en) * | 2018-02-14 | 2020-05-05 | Commvault Systems, Inc. | Targeted search of backup data using facial recognition |
US20190251204A1 (en) | 2018-02-14 | 2019-08-15 | Commvault Systems, Inc. | Targeted search of backup data using calendar event data |
JP7119794B2 (ja) * | 2018-09-05 | 2022-08-17 | トヨタ自動車株式会社 | ログデータの生成方法、プログラム、及びデータ構造 |
US11176403B1 (en) * | 2018-09-06 | 2021-11-16 | Amazon Technologies, Inc. | Filtering detected objects from an object recognition index according to extracted features |
WO2020071216A1 (ja) * | 2018-10-03 | 2020-04-09 | 国立大学法人北海道大学 | 画像検索装置、画像検索方法及び画像検索用プログラム |
US10553085B1 (en) | 2019-01-25 | 2020-02-04 | Lghorizon, Llc | Home emergency guidance and advisement system |
CN113282779A (zh) | 2020-02-19 | 2021-08-20 | 阿里巴巴集团控股有限公司 | 图像搜索方法、装置、设备 |
US11043095B1 (en) | 2020-06-16 | 2021-06-22 | Lghorizon, Llc | Predictive building emergency guidance and advisement system |
KR102449855B1 (ko) * | 2020-12-07 | 2022-10-04 | 서울과학기술대학교 산학협력단 | Vl 알고리즘을 이용한 실내 측위 장치 및 방법 |
US11583770B2 (en) | 2021-03-01 | 2023-02-21 | Lghorizon, Llc | Systems and methods for machine learning-based emergency egress and advisement |
US11893769B2 (en) * | 2021-06-04 | 2024-02-06 | Vade Usa, Incorporated | Data collection for object detectors |
US11626002B2 (en) | 2021-07-15 | 2023-04-11 | Lghorizon, Llc | Building security and emergency detection and advisement system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004362314A (ja) * | 2003-06-05 | 2004-12-24 | Ntt Data Corp | 検索情報登録装置、情報検索装置、検索情報登録方法 |
JP2005275847A (ja) * | 2004-03-25 | 2005-10-06 | Fuji Photo Film Co Ltd | 画像保管方法および画像保管装置 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6175829B1 (en) * | 1998-04-22 | 2001-01-16 | Nec Usa, Inc. | Method and apparatus for facilitating query reformulation |
US7299496B2 (en) * | 2001-08-14 | 2007-11-20 | Illinois Institute Of Technology | Detection of misuse of authorized access in an information retrieval system |
US8495211B2 (en) * | 2002-09-26 | 2013-07-23 | Hewlett-Packard Development Company, L.P. | Network service system and mechanism for searching service registries |
US7657100B2 (en) * | 2005-05-09 | 2010-02-02 | Like.Com | System and method for enabling image recognition and searching of images |
US7945099B2 (en) * | 2005-05-09 | 2011-05-17 | Like.Com | System and method for use of images with recognition analysis |
JP2007058605A (ja) * | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | 文書管理システム |
JP4429241B2 (ja) | 2005-09-05 | 2010-03-10 | キヤノン株式会社 | 画像処理装置及び方法 |
NO20054720L (no) * | 2005-10-13 | 2007-04-16 | Fast Search & Transfer Asa | Informasjonstilgang med bruksdrevet metadatatilbakekobling |
US8843482B2 (en) * | 2005-10-28 | 2014-09-23 | Telecom Italia S.P.A. | Method of providing selected content items to a user |
CN100507917C (zh) * | 2006-02-24 | 2009-07-01 | 佳能株式会社 | 图像处理设备、图像处理方法以及服务器及其控制方法 |
US8024343B2 (en) * | 2006-04-07 | 2011-09-20 | Eastman Kodak Company | Identifying unique objects in multiple image collections |
US20070244925A1 (en) * | 2006-04-12 | 2007-10-18 | Jean-Francois Albouze | Intelligent image searching |
US10042927B2 (en) * | 2006-04-24 | 2018-08-07 | Yeildbot Inc. | Interest keyword identification |
JP4175390B2 (ja) * | 2006-06-09 | 2008-11-05 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
JP5059545B2 (ja) * | 2007-10-23 | 2012-10-24 | 株式会社リコー | 画像処理装置及び画像処理方法 |
US8069173B2 (en) * | 2007-11-12 | 2011-11-29 | Canon Kabushiki Kaisha | Information processing apparatus and method of controlling the same, information processing method, and computer program |
JP4921335B2 (ja) * | 2007-12-10 | 2012-04-25 | キヤノン株式会社 | ドキュメント処理装置及び検索方法 |
JP2009252185A (ja) * | 2008-04-10 | 2009-10-29 | Ricoh Co Ltd | 情報検索装置、情報検索方法、制御プログラム及び記録媒体 |
JP4615038B2 (ja) | 2008-06-23 | 2011-01-19 | 日立オートモティブシステムズ株式会社 | 画像処理装置 |
KR20110118421A (ko) * | 2010-04-23 | 2011-10-31 | 엘지전자 주식회사 | 증강 원격제어장치, 증강 원격제어장치 제어방법 및 그 시스템 |
KR101718891B1 (ko) * | 2010-01-26 | 2017-03-23 | 삼성전자주식회사 | 영상 검색 방법 및 장치 |
US8320644B2 (en) * | 2010-06-15 | 2012-11-27 | Apple Inc. | Object detection metadata |
US9361523B1 (en) * | 2010-07-21 | 2016-06-07 | Hrl Laboratories, Llc | Video content-based retrieval |
EP2418588A1 (en) * | 2010-08-10 | 2012-02-15 | Technische Universität München | Visual localization method |
US20120045132A1 (en) * | 2010-08-23 | 2012-02-23 | Sony Corporation | Method and apparatus for localizing an object within an image |
JP5134664B2 (ja) * | 2010-09-14 | 2013-01-30 | 株式会社東芝 | アノテーション装置 |
KR101192439B1 (ko) * | 2010-11-22 | 2012-10-17 | 고려대학교 산학협력단 | 디지털 콘텐츠 검색 장치 및 방법 |
JP5048852B2 (ja) * | 2011-02-25 | 2012-10-17 | 楽天株式会社 | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 |
US20120254790A1 (en) * | 2011-03-31 | 2012-10-04 | Xerox Corporation | Direct, feature-based and multi-touch dynamic search and manipulation of image sets |
US9075875B1 (en) * | 2011-05-13 | 2015-07-07 | Google Inc. | System and method for recommending television programs based on user search queries |
JP5830784B2 (ja) * | 2011-06-23 | 2015-12-09 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム |
US8577131B1 (en) * | 2011-07-12 | 2013-11-05 | Google Inc. | Systems and methods for visual object matching |
US8625887B2 (en) * | 2011-07-13 | 2014-01-07 | Google Inc. | Systems and methods for matching visual object components |
WO2013036181A1 (en) * | 2011-09-08 | 2013-03-14 | Telefonaktiebolaget L M Ericsson (Publ) | Assigning tags to media files |
US8751422B2 (en) * | 2011-10-11 | 2014-06-10 | International Business Machines Corporation | Using a heuristically-generated policy to dynamically select string analysis algorithms for client queries |
US9256680B2 (en) * | 2012-02-02 | 2016-02-09 | Microsoft Technology Licensing, Llc | Biasing search results toward topics of interest using embedded relevance links |
JP5820320B2 (ja) * | 2012-03-27 | 2015-11-24 | 株式会社東芝 | 情報処理端末及び方法、並びに、情報管理装置及び方法 |
US10685234B2 (en) * | 2012-03-31 | 2020-06-16 | Xerox Corporation | Automatic and semi-automatic metadata generation via inheritance in homogeneous and heterogeneous environments |
US9195717B2 (en) * | 2012-06-26 | 2015-11-24 | Google Inc. | Image result provisioning based on document classification |
KR20140098959A (ko) * | 2013-01-31 | 2014-08-11 | 한국전자통신연구원 | 증거 영상 생성 장치 및 방법 |
EP3044731A4 (en) * | 2013-09-11 | 2017-02-22 | See-Out Pty Ltd. | Image searching method and apparatus |
CA2943513C (en) * | 2014-03-29 | 2020-08-04 | Thomson Reuters Global Resources | Improved method, system and software for searching, identifying, retrieving and presenting electronic documents |
US20160203238A1 (en) * | 2015-01-09 | 2016-07-14 | Facebook, Inc. | Suggested Keywords for Searching News-Related Content on Online Social Networks |
-
2012
- 2012-05-24 SG SG11201407749TA patent/SG11201407749TA/en unknown
- 2012-05-24 CN CN201280073308.8A patent/CN104321802B/zh active Active
- 2012-05-24 WO PCT/JP2012/063322 patent/WO2013175608A1/ja active Application Filing
- 2012-05-24 US US14/402,819 patent/US9665798B2/en active Active
- 2012-05-24 JP JP2014516586A patent/JP5857124B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004362314A (ja) * | 2003-06-05 | 2004-12-24 | Ntt Data Corp | 検索情報登録装置、情報検索装置、検索情報登録方法 |
JP2005275847A (ja) * | 2004-03-25 | 2005-10-06 | Fuji Photo Film Co Ltd | 画像保管方法および画像保管装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104321802A (zh) | 2015-01-28 |
CN104321802B (zh) | 2017-04-26 |
US9665798B2 (en) | 2017-05-30 |
US20150286896A1 (en) | 2015-10-08 |
SG11201407749TA (en) | 2014-12-30 |
JP5857124B2 (ja) | 2016-02-10 |
WO2013175608A1 (ja) | 2013-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5857124B2 (ja) | 画像解析装置、画像解析システム、画像解析方法 | |
JP6005837B2 (ja) | 画像解析装置、画像解析システム、画像解析方法 | |
KR101856120B1 (ko) | 이미지로부터 상가 발견 | |
US12026194B1 (en) | Query modification based on non-textual resource context | |
US11157550B2 (en) | Image search based on feature values | |
CN109918555B (zh) | 用于提供搜索建议的方法、装置、设备和介质 | |
KR20170007747A (ko) | 자연어 이미지 검색 기법 | |
US10282374B2 (en) | System and method for feature recognition and document searching based on feature recognition | |
KR101565759B1 (ko) | 토픽 템플릿과 연관어에 기반한 관련토픽 및 경쟁토픽 탐지 시스템, 탐지 방법 및 탐지 장치 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
US20150206101A1 (en) | System for determining infringement of copyright based on the text reference point and method thereof | |
CN110363206B (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
CN114329069A (zh) | 视觉搜索查询的智能系统和方法 | |
WO2022245469A1 (en) | Rule-based machine learning classifier creation and tracking platform for feedback text analysis | |
CN110737824A (zh) | 内容查询方法和装置 | |
CN107239209B (zh) | 一种拍照搜索方法、装置、终端及存储介质 | |
JP5484113B2 (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
JPH11250106A (ja) | 内容基盤の映像情報を利用した登録商標の自動検索方法 | |
Vinciarelli et al. | Application of information retrieval technologies to presentation slides | |
CN112883218A (zh) | 一种图文联合表征的搜索方法、系统、服务器和存储介质 | |
JP6976537B1 (ja) | 情報検索装置、情報検索方法および情報検索用プログラム | |
WO2021145030A1 (ja) | 映像検索システム、映像検索方法、及びコンピュータプログラム | |
JP3985826B2 (ja) | 画像検索方法及びその装置 | |
CN118506251A (zh) | 目标检测方法、装置、计算机设备以及存储介质 | |
CN114357112A (zh) | 一种文献功效展示方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5857124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |