JP4304368B2 - 画像検索装置、並びに画像検索方法 - Google Patents

画像検索装置、並びに画像検索方法 Download PDF

Info

Publication number
JP4304368B2
JP4304368B2 JP2003124404A JP2003124404A JP4304368B2 JP 4304368 B2 JP4304368 B2 JP 4304368B2 JP 2003124404 A JP2003124404 A JP 2003124404A JP 2003124404 A JP2003124404 A JP 2003124404A JP 4304368 B2 JP4304368 B2 JP 4304368B2
Authority
JP
Japan
Prior art keywords
component
image data
image
feature amount
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003124404A
Other languages
English (en)
Other versions
JP2003323602A (ja
Inventor
英司 粕谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003124404A priority Critical patent/JP4304368B2/ja
Publication of JP2003323602A publication Critical patent/JP2003323602A/ja
Application granted granted Critical
Publication of JP4304368B2 publication Critical patent/JP4304368B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像検索装置、並びに画像検索方法に関する。
【0002】
【従来の技術】
従来、画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法は一般に、蓄積された動画像の中からその一部分を検索するために適用される。
【0003】
従来の参照動画像を利用した圧縮動画像検索方法の一例が、特開平10−13832号公報に記載されている。この公報にて開示された動画像検索方法は、各ブロックのDCT係数の少なくとも1つを各画面の特徴ベクトルとして抽出し、検索キーとなる特定の動画像パターンに含まれる各フレームの特徴ベクトルの確率的な状態遷移を学習によりモデル化し、検索対象である一連の動画像に含まれるフレームから抽出された特徴ベクトルの学習により得られた状態遷移モデルに対する頻度が高い時間領域を検索結果として出力する。
【0004】
また、特開平6−231254号公報は、参照画像の特定領域と類似した領域を含む画像を圧縮動画像データ中から探し出す方法である。参照画像の検索を行う際に、第1段階として符号化情報に含まれる画素値の平均値を用いてパターンマッチングを行い候補画像を選別し、第2段階として参照画面と入力画面において縮小画像の周波数成分との相関値を算出して検索を行っている。
【0005】
【発明が解決しようとする課題】
しかしながら、上述した従来の方法では、次のような問題がある。
第1に特徴量のサイズが大きいため、特徴量の記憶のための記憶装置の規模が大きくなる。第2に特徴量のサイズが大きいことに起因して、検索速度が低下する。第3にデータベース中の検索対象となる動画像データの各時点に対し、入力された動画像特徴量の全体とマッチングを行っているため、マッチング時間が膨大となる。特にデータベースの規模が大きくなるとこの問題点は顕著になる。
【0006】
本発明は、静止画像および動画像データの中から類似した静止画像および動画像を高速に検索し、より少ない記憶容量で静止画像および動画像特徴量を生成する画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
係る目的を達成するために請求項1記載の発明は、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を用いて、当該画像データの特徴量間の相関値を計算することにより類似する画像データを検索することを特徴とする。
【0008】
請求項2記載の発明は、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を画像データと共に記憶する特徴量つき画像記憶部と、入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された画像データの特徴量との相関値を算出する画像相関測定部と、を備えることを特徴とする。
【0009】
請求項3記載の発明は、請求項2に記載の発明において、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、当該算出した周波数成分から直流成分と一部の交流成分とを抽出する直流成分および一部交流成分抽出手段と、を備えることを特徴とする。
【0010】
請求項4記載の発明は、請求項2または3に記載の発明において、画像データから縮小画像を生成する縮小画像生成手段を備えることを特徴とする。
【0011】
請求項5記載の発明は、入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる算出周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を画像データと共に記憶する特徴量つき画像記憶部に記憶された画像データの特徴量と入力画像データの特徴量との相関値を算出する画像相関測定部と、を備えることを特徴とする。
【0012】
請求項6記載の発明は、第1の画像データを代表する色情報の集合を用いて生成される第2の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された第1の画像データの特徴量を第1の画像データと共に記憶する特徴量つき画像記憶部と、入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された第1の画像データの特徴量との相関値を算出する画像相関測定部と、を備えることを特徴とする。
【0013】
請求項7記載は、請求項6に記載の発明において、入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、当該算出した周波数成分から直流成分と一部の交流成分とを抽出し、当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、を備えることを特徴とする。
【0014】
請求項8記載の発明は、請求項6または7に記載の発明において、入力画像データをブロックに分割し、当該分割した各ブロックから各ブロックを代表する色情報を取り出し、当該取り出した代表する色情報を用いて第3の画像データを生成する縮小画像生成手段を備えることを特徴とする。
【0015】
請求項9記載の発明は、入力画像データを代表する色情報の集合を用いて生成される第1の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、第2の画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された第2の画像データの特徴量を第2画像データと共に記憶する特徴量つき画像記憶部に記憶された第2の画像データの特徴量と入力画像データの特徴量との相関値を算出する画像相関測定部と、を備えることを特徴とする。
【0016】
請求項10記載の発明は、請求項3、5、7または9に記載の発明において、直流成分および一部交流成分抽出手段が、輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を抽出し、当該抽出した輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を用いて画像データの特徴量を生成することを特徴とする。
【0017】
請求項11記載の発明は、請求項6〜8に記載の発明において、第2の画像データ及び第3の画像データが、8×8の固定サイズの画像データであることを特徴とする。
【0018】
請求項12記載の発明は、請求項9に記載の発明において、第1の画像データ及び第2の画像データが、8×8の固定サイズの画像データであることを特徴とする。
【0019】
請求項13記載の発明は、画像データを第1の8×8の固定サイズの画像データに変換し、当該変換した第1の8×8の固定サイズの画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された画像データの特徴量を画像データと共に記憶する特徴量つき画像記憶部と、入力画像データを第2の8×8の固定サイズの画像データに変換し、当該変換した第2の8×8の固定サイズの入力画像データデータサイズ全体に対する周波数解析により得られる、輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された画像データの特徴量との相関値を算出する画像相関測定部と、を備えることを特徴とする。
【0020】
請求項14記載の発明は、入力される画像データが静止画像であるか動画像であるかを判定する画像データ判定手段と、画像データ判定手段により静止画像であると判定された画像データから縮小画像を生成する縮小画像生成手段と、生成された縮小画像サイズ全体に対する周波数解析を行う周波数解析手段と、解析の結果得られる直流成分および一部交流成分を静止画像特徴量として取り出す直流成分および一部交流成分抽出手段とを有する静止画像特徴量算出手段と、画像データ判定手段により動画像であると判定された画像データから全部または一部のフレームに相当するデータを取り出し処理対象に選定する特徴量抽出対象フレーム選定手段と、取り出されたフレームそれぞれのデータから縮小画像を生成する縮小画像生成手段と、生成された縮小画像サイズ全体に対する周波数解析を行う周波数解析手段と、解析の結果得られる直流成分および一部交流成分を画像特徴量として取り出す直流成分および一部交流成分抽出手段と、直流成分および一部交流成分抽出手段から出力されるフレーム特徴量を集めて動画像特徴量を生成する動画像特徴量生成手段とを有する動画像特徴量算出手段と、静止画像データに対して静止画像特徴量算出手段により予め算出された静止画像特徴量と、動画像データに対して動画像特徴量算出手段により予め算出された動画像特徴量とを記憶した画像特徴量記憶手段と、静止画像データ及び動画像データを記憶する画像データ記憶手段とからなる画像データベースと、入力された静止画像データにより静止画像特徴量算出手段にて算出された静止画像特徴量と、画像データベースに含まれる画像特徴量との相関値を計算する静止画像特徴量相関測定手段と、入力された動画像データにより動画像特徴量算出手段にて算出された動画像特徴量と、画像データベースに含まれる画像特徴量との相関値を計算する動画像特徴量相関測定手段とを有し、静止画像特徴量相関測定手段は、相関値の高い画像データベース中の静止画像を類似する静止画像の候補として検出し、動画像特徴量相関測定手段は、相関値の高い画像データベース中の動画像区間を類似する動画像区間の候補として検出することを特徴とする。
【0021】
請求項15記載の発明は、請求項14に記載の発明において、動画像特徴量相関測定手段は、入力した動画像データに対して動画像特徴量算出手段により算出された動画像特徴量を分割し、画像データベースに含まれる動画像の動画像特徴量の一部と、分割した各動画像特徴量との部分的相関値を順次算出し、部分的相関値が予め定められた閾値よりも低い時に、その特徴量を持つ画像データベースに含まれる動画像区間を類似する動画像の候補から取り除くことを特徴とする。
【0022】
請求項16記載の発明は、請求項14または15に記載の発明において、動画像特徴量相関測定手段は、入力した動画像データに対して動画像特徴量算出手段により算出された動画像特徴量を分割し、画像データベースに含まれる動画像の動画像特徴量の一部と、分割した部分動画像特徴量との部分的相関値を順次算出し、部分的相関値が予め定められた閾値よりも低い部分動画像特徴量の数が予め定められた閾値以上となった時点で類似する動画像の候補から取り除くことを特徴とする。
【0023】
請求項17記載の発明は、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を用いて、当該画像データの特徴量間の相関値を計算することにより類似する画像データを検索することを特徴とする。
【0024】
請求項18記載の発明は、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を画像データと共に特徴量つき画像記憶部に記憶するステップと、入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された画像データの特徴量との相関値を算出する画像相関測定ステップと、を備えることを特徴とする。
【0025】
請求項19記載の発明は、請求項18に記載の発明において、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、当該算出した周波数成分から直流成分と一部の交流成分とを抽出する直流成分および一部交流成分抽出ステップと、を備えることを特徴とする。
【0026】
請求項20記載の発明は、請求項18または19に記載の発明において、画像データから縮小画像を生成する縮小画像生成ステップを備えることを特徴とする。
【0027】
請求項21記載の発明は、入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる算出周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された画像データの特徴量を画像データと共に記憶する特徴量つき画像記憶部に記憶された画像データの特徴量と入力画像データの特徴量との相関値を算出する画像相関測定ステップと、を備えることを特徴とする。
【0028】
請求項22記載の発明は、第1の画像データを代表する色情報の集合を用いて生成される第2の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された第1の画像データの特徴量を第1の画像データと共に特徴量つき画像記憶部に記憶するステップと、入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された第1の画像データの特徴量との相関値を算出する画像相関測定ステップと、を備えることを特徴とする。
【0029】
請求項23記載の発明は、請求項22記載の発明において、入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、当該算出した周波数成分から直流成分と一部の交流成分とを抽出し、当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、を備えることを特徴とする。
【0030】
請求項24記載の発明は、請求項22または23に記載の発明において、入力画像データをブロックに分割し、当該分割した各ブロックから各ブロックを代表する色情報を取り出し、当該取り出した代表する色情報を用いて第3の画像データを生成する縮小画像生成ステップを備えることを特徴とする。
【0031】
請求項25記載の発明は、入力画像データを代表する色情報の集合を用いて生成される第1の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、第2の画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された第2の画像データの特徴量を第2画像データと共に記憶する特徴量つき画像記憶部に記憶された第2の画像データの特徴量と入力画像データの特徴量との相関値を算出する画像相関測定ステップと、を備えることを特徴とする。
【0032】
請求項26記載の発明は、請求項19、21、23または25に記載の発明において、直流成分および一部交流成分抽出ステップにおいて、輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を抽出し、当該抽出した輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を用いて画像データの特徴量を生成することを特徴とする。
【0033】
請求項27記載の発明は、請求項22〜24に記載の発明において、第2の画像データ及び第3の画像データが、8×8の固定サイズの画像データであることを特徴とする。
【0034】
請求項28記載の発明は、請求項25に記載の発明において、第1の画像データ及び第2の画像データが、8×8の固定サイズの画像データであることを特徴とする。
【0035】
請求項29記載の発明は、画像データを第1の8×8の固定サイズの画像データに変換し、当該変換した第1の8×8の固定サイズの画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された画像データの特徴量を画像データと共に特徴量つき画像記憶部に記憶するステップと、入力画像データを第2の8×8の固定サイズの画像データに変換し、当該変換した第2の8×8の固定サイズの入力画像データサイズ全体に対する周波数解析により得られる、輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された入力画像データの特徴量を入力し、当該入力画像データの特徴量と特徴量つき画像記憶部に記憶された画像データの特徴量との相関値を算出する画像相関測定ステップと、を備えることを特徴とする。
【0036】
【発明の実施の形態】
次に、添付図面を参照して本発明による画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法の実施の形態を詳細に説明する。図1〜図9を参照すると、本発明の画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法の実施形態が示されている。
【0037】
まず、図1を参照ながら本発明の画像特徴量生成装置及び方法に係る第1の実施形態について詳細に説明する。
【0038】
図1に示された第1の実施形態は、静止画像データを入力して、その静止画像データの特徴量を生成する静止画像特徴量生成部22を有する。静止画像特徴量生成部22は、縮小画像生成手段221と周波数解析手段222と直流成分および一部交流成分抽出手段223とを有する。
【0039】
縮小画像生成手段221は、入力された静止画像データ11に対して、縮小画像12の生成を行う、この時の縮小率は任意である。縮小画像の生成方法例としては、画像をブロック分割し、各ブロックの代表する色情報のみを取り出す方法がある。代表する色情報としては、各ブロック内における平均色、最頻色等が利用できる。また、画像データがブロック単位で圧縮されている場合には、各ブロックの直流成分のみを取り出し生成することもできる。
【0040】
周波数解析手段222は、縮小画像12の周波数解析を行い、周波数成分13を算出する。縮小画像12を複数の領域に分割してから周波数解析を行うことも可能である。縮小画像の周波数解析方法としては、DCT変換やウェーブレット変換やフーリエ変換やアダマール変換等が利用できる。
【0041】
直流成分および一部交流成分抽出手段223は、周波数解析手段222より算出された周波数成分13より直流成分および一部交流成分14を抽出する。周波数解析手段222および直流成分および一部交流成分抽出手段223の具体例としては、縮小画像サイズ全体に対する2次元DCTにより周波数解析手段222を実行して、その直流成分およびn個の交流成分を抽出する方法等を用いることができる。また、輝度成分のみの係数、色差成分のみの係数、双方の係数の一部のみを抽出する方法等も用いることができる。
【0042】
この画像特徴量生成装置及び方法では、縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いているため、必要な記憶容量が少ない画像特徴量を生成できる。
【0043】
次に、図2を参照しながら本発明の画像特徴量生成装置及び方法に係る第2の実施形態を詳細に説明する。
【0044】
図2に示された第2の実施形態は、動画像データを入力して、その動画像データの特徴量を生成する動画像特徴量生成部2を有する。動画像特徴量生成部2は、特徴量抽出対象フレーム選定手段21と、静止画像特徴量生成部22と、特徴量生成手段23とを有する。また、静止画像特徴量生成部22は、上述した縮小画像生成手段221と周波数解析手段222と、直流成分および一部交流成分抽出手段223とを有する。なお、動画像とは複数の静止画像からなるものであり、上述した扱う対象が動画像となっても、第1の実施形態で用いた静止画像特徴量生成部22を用いることが出来る。
【0045】
特徴量生成部2の構成部である特徴量抽出対象フレーム選定手段21は、入力された動画像データ1より特徴量抽出の対象となるフレームデータ11を選定する。
【0046】
特徴量抽出対象フレーム選定手段21は、動画像データ中で1フレーム内で圧縮処理が完了しているフレーム内符号化フレームに相当する圧縮データのみを取り出すことができる。全てのフレーム内符号化フレームを選択することも、一部のフレーム内符号化フレームのみを選択することも可能である。また、フレーム内で処理が完結していないフレーム間符号化フレームについても、例えば、文献;Boon-Lock Yeo and Bede Liu:”On the extraction of DC sequence from MPEG Compressed Video ”、IEEE International Conference on Image Processing(1995)記載の方法を用いて、フレーム内符号化フレームを擬似的に生成することができる。このため、擬似的にフレーム内符号化フレームを生成してそれを選択することも可能である。
【0047】
静止画特徴量抽出部22を構成する縮小画像生成手段221は、特徴量抽出対象フレーム選定手段21で選定された静止画像データ11より、縮小画像を生成する。周波数解析手段222は、縮小画像12を周波数成分13に分解する。直流成分および一部交流成分抽出手段223は、周波数解析手段222より生成された周波数成分13より直流成分および一部交流成分14を抽出する。
【0048】
特徴量生成手段23は、静止画特徴量抽出部22から与えられる直流成分および一部交流成分14を、全選択フレームについて抽出することにより特徴量15を生成する。
【0049】
この実施形態においても、縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いているため、必要な記憶容量が少ない特徴量を生成することができる。
【0050】
次に、図3を参照しながら、本発明の画像特徴量生成装置及び方法に係る第3の実施形態について説明する。
【0051】
図3に示された第3の実施形態は、静止画像データを入力して、その静止画像データの特徴量を生成する静止画像特徴量生成部22と、入力した静止画像データを記憶する静止画像データ記憶部61と静止画像特徴量生成部22にて生成された静止画像特徴量を記憶する静止画像特徴量記憶部62とからなる特徴量付き静止画像データベース記憶部6とを有する。静止画像特徴量生成部22は、縮小画像生成手段221と周波数解析手段222と直流成分および一部交流成分抽出手段223とを有する。
【0052】
静止画像特徴量生成部22は、縮小画像生成手段221が入力された静止画像画像データにより縮小画像を生成し、周波数解析手段222が生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を直流成分および一部交流成分抽出手段223が取り出すことにより静止画像特徴量を生成する。
【0053】
生成された静止画像特徴量は静止画像特徴量記憶部62に記憶され、また、静止画像特徴量の生成のために使用された静止画像データは静止画像データ記憶部61に記憶される。
【0054】
この実施形態においても、縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いているため、必要な記憶容量が少ない特徴量を生成することができる。
【0055】
図4に示されるように画像特徴量生成装置及び方法に係る第4の実施形態は、動画像特徴量生成部2と、特徴量付き動画像データベース記憶部3とを有して構成される。なお、動画像特徴量生成部2についての説明は省略する。
【0056】
本実施形態は、動画像データ1から特徴量15を生成し、両者を特徴量付き動画像データベース記憶部3に記憶するものである。
【0057】
特徴量付き動画像データベース記憶部3は、動画像データ記憶部31と、動画像特徴量記憶部32とで構成されており、さまざまな動画像データ1に対して、それぞれ動画像データ1と、動画像データ1から特徴量生成部2により生成された特徴量15とを記憶する。
【0058】
特徴量付き動画像データベース記憶部3の一方の構成部である動画像データ記憶部31は、動画像データ1を保持する。また、動画像データ記憶部31は、動画像データ1から特徴量生成部2により生成された特徴量15を保持する。
【0059】
上記の各部により構成される画像特徴量生成装置は、動画像データからフレームの全部または一部に相当するデータを特徴量抽出対象フレーム選定手段21で取り出し、取り出された各フレームに相当するデータから縮小画像生成手段221が縮小画像を生成し、周波数解析手段222が生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を直流成分および一部交流成分抽出手段223が取り出し、それを特徴量生成手段23が全選択フレームについて実行することにより特徴量を生成する。
【0060】
この動画像特徴量生成装置では、一部のフレームの縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いているため、必要な記憶容量が少ない動画像特徴量を生成できる。
【0061】
次に、図5を参照しながら、本発明の画像特徴量生成装置及び方法に係る第5の実施形態について説明する。
【0062】
図5に示された画像特徴量生成装置に係る第5の実施形態は、画像データ判定部100と、静止画像特徴量生成部22と、動画像特徴量生成部2と、特徴量付き画像データベース記憶部5とを有して構成される。なお、本実施形態が対象とする画像データは動画像データ及び静止画像データを含むものであり、動画像は複数の静止画像からなるものとする。
【0063】
本実施形態に入力される画像データ7は、画像データ判定部100によって静止画像であるか動画像であるかを判定される。画像が静止画像である場合には、静止画像特徴量生成部22に、動画像である場合には動画像特徴量生成部2に入力される。
【0064】
静止画像特徴量生成部22は、縮小画像生成手段221が入力された静止画像画像データにより縮小画像を生成し、周波数解析手段222が生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を直流成分および一部交流成分抽出手段223が取り出し、それを特徴量生成手段23が全選択フレームについて実行することにより特徴量を生成する。
【0065】
動画像特徴量生成部2は、動画像データからフレームの全部または一部に相当するデータを特徴量抽出対象フレーム選定手段21で取り出し、取り出された各フレームに相当するデータから縮小画像生成手段221が縮小画像を生成し、周波数解析手段222が生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を直流成分および一部交流成分抽出手段223が取り出し、それを特徴量生成手段23が全選択フレームについて実行することにより特徴量を生成する。
【0066】
上述した処理により生成された各特徴量14、15は特徴量付き画像データベース記憶部5の画像特徴量記憶部52に記憶される。また、動画像及び静止画像とからなる画像データは、画像データ記憶部51に記憶される。
【0067】
このように静止画像が入力された場合には、縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いて特徴量を生成し、また、動画像が入力された場合には、一部のフレームの縮小画像に対して周波数解析を行い、得られる係数の一部のみを用いて特徴量を生成しているため、必要な記憶容量が少ない静止画像及び動画像特徴量を生成できる。
【0068】
次に、図6を参照しながら本発明の画像検索装置及び方法に係る第1の実施形態について説明する。
【0069】
図6に示されるように本実施形態は、静止画像データを入力して、その静止画像データの特徴量を生成する静止画像特徴量生成部22と、静止画像データに対して静止画像特徴量生成部22で予め生成された静止画像特徴量を記憶した静止画像特徴量記憶部62と静止画像データを記憶した静止画像データ記憶部61とからなる特徴量付き静止画像データベース記憶部6と、入力された静止画像データにより静止画像特徴量生成部22で生成された静止画像特徴量と、特徴量付き静止画像データベース記憶部6に記憶された静止画像特徴量との相関値を算出する静止画像相関測定部41とを有して構成される。
【0070】
静止画像特徴量生成部22は、縮小画像生成手段221が入力された静止画像画像データにより縮小画像を生成し、周波数解析手段222が生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を直流成分および一部交流成分抽出手段223が取り出することにより入力静止画像データ11に対する静止画像特徴量14を生成する。
【0071】
また、特徴量付き静止画像データベース記憶部6には、上述した画像特徴量生成装置に係る第3の実施形態にて説明した手順により静止画像が静止画像データ記憶部61に、静止画像データ記憶部61に記憶された静止画像を用いて静止画像特徴量生成部22に算出された静止画像特徴量が静止画像特徴量記憶部62に記憶されている。
【0072】
静止画像相関測定部41は、入力された静止画像データにより生成された特徴量14と、画像データベースに含まれる画像により生成された特徴量との相関値を計算し、相関値の高いデータベース中の静止画像を類似する静止画像の候補として検出する。
【0073】
次に、図7及び図8を参照しながら本発明の画像検索装置及び方法係る第2の実施形態について説明する。なお、図7は画像検索装置及び方法に係る第1の実施形態の構成を示すブロック図であり、図8は、画像検索方法の相関測定手順を示す流れ図である。
【0074】
図7に示された画像検索装置及び方法に係る第2の実施形態は、特徴量生成部2、特徴量付き動画像データベース記憶部3、動画像データベース中の特徴量17と入力された動画像データ1に対して特徴量生成部2で生成した特徴量15との相関値を計算する相関測定部4を含む。
【0075】
まず、検索に用いる動画像データ1を入力し、特徴量生成部2より特徴量15を生成する。検索を行う際には参照する動画像から特徴量生成部2が生成され、相関測定部4に入力される。
【0076】
動画像データベース中の特徴量17と、入力された動画像データ1に対して特徴量生成部2で生成した特徴量15との相関値の算出を相関測定部4で行い、検索された部分動画像の格納位置情報18を検索結果として出力する。
【0077】
動画像相関測定部4の動作を図8で詳細に説明する。
本発明による画像検索方法は、入力された動画像データより生成された特徴量と、動画像データベースに含まれる動画像より生成された特徴量の一部との相関を求める処理工程として、入力された動画像より生成された特徴量を分割し、分割した各部分ごとに順次部分的相関を算出し、部分的な相関が予め定めた閾値より低ければその特徴量を持つデータベース中の動画像を候補から取り除くステップを有する。このような方法を採用することにより、指定動画像区間全体に対して総当たりでマッチングを行う場合に比べ、検索結果となる候補を少ないマッチング回数で絞ることができ、動画像の検索を行うための処理時間を短縮できる。この処理手順を以下に詳述する。
【0078】
まず、初期設定として、検索対象となる動画像特徴量を呼び出すための識別子番号を初期化しておく(ステップS1)。ここで、識別子とは、動画像データベースを生成する際に、各動画像データに対してユニークに付与されるものとする。また特徴量15も予め取得しておくものとする。
【0079】
次に識別子に対応した検索対象となる動画像特徴量を取得し、検索対象となる部分特徴量(以降、対象部分特徴量と呼ぶ)の取得位置を示すポインタを先頭に合わせておく(ステップS2)。
【0080】
先頭の参照部分特徴量から予め定めた時間幅の特徴量を取得する。このデータを参照部分特徴量と呼ぶ。また、取得位置を示すポインタで示された箇所より対象部分特徴量を取得する(ステップS3)。
【0081】
ステップS3で得られた参照部分特徴量と対象部分特徴量との相関を求める(ステップS4)。
【0082】
予め定めた閾値より相関値が低い場合(以降、ミスマッチ判定と呼ぶ)は、ステップS5で次に取得するための対象部分特徴量の存在の有無を調べ、存在する場合には対象部分特徴量の取得位置ポインタを予め定めた値だけずらし(ステップS6)、ステップS3に戻る。また次の対象部分特徴量が存在しない場合は、識別子を一つ増やし、次の動画像特徴量に対して同様の処理を行う(ステップS13)。ただしデータベース中の動画像特徴全てに対してマッチングを行った場合は、処理を終了する(ステップS12)。
【0083】
ステップS4で相関値が予め定めた閾値より高い場合は、取得位置から時間的に続く次の対象部分特徴量および参照部分特徴量を取得し(ステップS7)、相関を求める(ステップS8)。以降、ミスマッチ判定されるまで同様にマッチングをくり返し、参照部分特徴量を全てマッチングした場合(ステップS9)、検索結果として出力する(ステップS10)。
【0084】
検索結果を含む動画像データ識別子番号と、動画像データ内における開始位置または終了位置等を出力することができる。これに加えて相関値等も出力することができる。
【0085】
ミスマッチと判定された場合、ミスマッチ判定が別途設定された一定の回数もしくは時間を超えたかどうかの判定を行う(ステップS11)。超えていない場合はステップS7に戻る。超えている場合はステップS5に戻る。ステップS11は、フレーム内符号化されるフレームの選択位置の違い、カメラワークの違い、画面ノイズによる特徴量の変化等による一時的なミスマッチを、回数もしくは時間を適切に定めることによりカバーすることができる。また、回数もしくは時間を“0”に定めることはステップS11を省くことと等価であり、回路設計を軽くすることもできる。
【0086】
一方、参照部分特徴量を取得する際の時間幅を参照特徴量全体として、検索部分特徴量との相関を一度に比較することにより検索を行うこともできる。
【0087】
次に図9を参照しながら本発明の画像検索装置及び方法に係る第3の実施形態について詳細に説明する。
【0088】
図9に示された実施形態は、画像特徴量生成部10と、静止画像と動画像とが記憶される画像データ記憶部51と、画像データ記憶部に記憶された画像データに対して画像特徴量生成部10で予め生成された静止画像特徴量及び動画像特徴量が記憶された画像特徴量記憶部52とからなる特徴量付き画像データベース記憶部5と、画像データベース中の特徴量17と入力された動画像データ1に対して特徴量生成部2で生成した特徴量15との相関値を計算する動画像相関値測定部4と、画像データベース中の特徴量17と入力された静止画像データ11に対して画像特徴量生成部10で生成された特徴量との相関値を計算する静止画像相関値測定部41とを含む。
【0089】
まず、検索に用いる画像データ1を入力し、特徴量生成部2より特徴量15を生成する。参照する画像データが動画像である場合には、動画像から特徴量生成部10により特徴量が生成され、動画像特徴量相関測定部4に入力される。また、静止画像である場合には、静止画像から特徴量生成部10により特徴量が生成され、静止画像特徴量相関測定部19に入力される。
【0090】
動画像相関測定部4は、動画像データベース中の特徴量17と、入力された動画像データ1に対して特徴量生成部2で生成した特徴量15との相関値の算出を相関測定部4で行い、検索された部分動画像の格納位置情報18を検索結果として出力する。なお、この処理動作についての説明は、上述した動画像特徴量生成装置に係る第2の実施形態の説明において既に説明しているので省略する。
【0091】
静止画像相関測定部41は、入力された静止画像データにより生成された特徴量14と、画像データベースに含まれる画像により生成された特徴量との相関値を計算し、相関値の高いデータベース中の静止画像を類似する静止画像の候補として検出する。
【0092】
(実施例)
次に、本発明の実施例について説明する。
MPEG−1、2符号化された映像データ約20時間分を利用し、ある特定記事、CM、番組のオープニングに相当する映像区間を指定し、同一と思われる映像区間を検出する実験を行った。
【0093】
検索対象となるこの動画像全体における各フレーム内符号化されたフレームに対してタイムコード、直流成分を抽出する。ここでは直流成分を抽出して生成した縮小画像をさらに8×8の固定サイズに縮小したうえでDCTをかけて得られる輝度成分、色差成分の3つの直流成分(DC_Y、DC_Cb、DC_Crと呼ぶ)、および輝度成分に対する2つの低周波成分(AC1、AC2と呼ぶ)を、[0、255]の範囲に正規化したうえでそれぞれタイムコードとともに保存しておく。各フレーム内符号化フレームにつき特徴量5バイト、タイムコード4バイトの合わせて9バイトで済む。このため、0.5秒間隔でフレーム内符号化フレームが存在する場合には、1日分の映像に相当する特徴量のデータサイズも1.5メガバイト程度に収まることになる。
【0094】
参照動画像の先頭フレームの特徴量を、検索対象動画像の特徴量とフレーム内符号化フレーム単位でマッチングを行う。DC_Y、DC_Cb、DC_Crの差分値(以降、DC差分値と呼ぶ)、AC1、AC2の差分値が、それぞれある指定条件(閾値)以内を満たすものを目的動画像の候補とする。
【0095】
目的動画像候補と見なされた場合、その先のフレームについて時系列に調べる。目的映像候補と見なされない場合は、次のフレームについて同様の手順を繰り返す。以降はDC差分値が指定条件を満たすものをマッチするものとし、順次調べていく。マッチング回数を減らす目的で以降はAC1、AC2は用いなくてもよい。
【0096】
サンプル位置による誤差を考慮し、3フレーム連続してミスマッチの場合は、候補から外す。指定した動画像区間に相当する長さに対して特徴量の差分が指定条件(閾値)を満たした場合には目的動画像とみなし、その開始点および終了点のタイムコードを検索結果として出力する。また、目的動画像区間を検出した場合、次回探索の始点を検出された区間の終点の次のフレームから開始してもよい。
【0097】
この手順により、指定動画像区間全体に対して総当たりでマッチングを行う場合に比べ、処理量を大幅に減らすことが可能となる。
【0098】
11個の同一と思われる動画像区間の組に対して実験を行った結果、11個全てについて片方指定することによりもう一方が得られることが解った。また、目的動画像区間の長さを10秒以上とした場合には、過剰検出も見受けられなかった。
【0099】
尚、上述の実施形態は本発明の好適な実施の一例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施が可能である。さらにいずれの実施例においても、条件に合わないものを候補から取り除くかわりに特徴量間の距離を定義し用いることにより類似動画像検索への拡張も容易である。
【0100】
【発明の効果】
以上の説明より明らかなように、本発明の画像特徴量生成装置及び方法は、画像データから縮小画像を生成し、生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を取り出すことにより特徴量を生成する。また、本発明の画像検索装置及び方法は、画像データからフレームの全部または一部に相当するデータを取り出し、取り出された各フレームに相当するデータから縮小画像を生成する。生成された縮小画像の周波数解析を行い、解析の結果得られる直流分および一部交流分を取り出し、取り出しを全選択フレームについて実行する。
【0101】
本発明の画像検索装置及び方法は相関算出過程で類似映像候補になりえないと判断した時点で候補から取り除くこともできる。よって、指定動画像区間全体に対して総当たりでマッチングを行う場合に比べ、検索結果となる候補を少ないマッチング回数で絞ることができ、処理量を大幅に減らすことが可能となる。このため、動画像の検索を行うための処理時間が短縮できる。
【0102】
また、一部のフレームの縮小画像に対して周波数解析を行うことによって得られる係数のみを用いている。このため、必要な記憶容量が少ない画像特徴量を生成できる。
【0103】
本発明は、コマーシャル映像、ニュースの特定記事、番組のオープニング等、特定の映像の放送回数の調査、放送情報の統計、傾向分析等に広く適用が可能である。
【0104】
本発明は、蓄積された画像の中から参照する動画像と色、周波数分布の類似した一部分を検索する類似映像検索等への適用が可能である。
【図面の簡単な説明】
【図1】本発明の画像特徴量生成装置および方法が適用される実施形態の構成例を示すブロック図である。
【図2】本発明の画像特徴量生成装置および方法が適用される実施形態の構成例を示すブロック図である。
【図3】本発明の画像特徴量生成装置および方法が適用される実施形態の構成例を示すブロック図である。
【図4】本発明の画像特徴量生成装置および方法が適用される実施形態の構成例を示すブロック図である。
【図5】本発明の画像特徴量生成装置および方法が適用される実施形態の構成例を示すブロック図である。
【図6】本発明の画像検索装置および方法が適用される実施形態の構成例を示すブロック図である。
【図7】本発明の画像検索装置および方法が適用される実施形態の構成例を示すブロック図である。
【図8】画像検索方法の処理手順例を示すフローチャートである。
【図9】本発明の画像検索装置および方法が適用される実施形態の構成例を示すブロック図である。
【符号の説明】
1 動画像データ
2 特徴量生成部
3 特徴量付き動画像データベース記憶部
4 相関測定部
5 特徴量付き動画像データベース記憶部
6 特徴量付き静止画像データベース記憶部
7 画像データ
10 画像特徴量生成部
11 静止画像データ
12 縮小画像
13 周波数成分
14 直流成分および一部交流成分
15 特徴量
16 動画像データ識別子
17 検索対象動画像特徴量
18 検索された部分動画像の格納位置情報
19 検索された静止画像の格納位置情報
21 特徴量抽出対象フレーム選定手段
22 静止画像特徴量抽出部
23 特徴量生成手段
31 動画像データ記憶部
32 動画像特徴量記憶部
41 静止画像相関測定部
51 画像データ記憶部
52 動画像特徴量記憶部
61 静止画像データ記憶部
62 静止画像特徴量記憶部
100 画像データ判定部
221 縮小画像生成手段
222 周波数解析手段
223 直流成分および一部交流成分抽出手段

Claims (29)

  1. 画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を用いて、当該画像データの特徴量間の相関値を計算することにより類似する画像データを検索することを特徴とする画像検索装置。
  2. 画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を前記画像データと共に記憶する特徴量つき画像記憶部と、
    入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記画像データの特徴量との相関値を算出する画像相関測定部と、
    を備えることを特徴とする画像検索装置。
  3. 画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出する直流成分および一部交流成分抽出手段と、
    を備えることを特徴とする請求項2に記載の画像検索装置。
  4. 画像データから縮小画像を生成する縮小画像生成手段を備えることを特徴とする請求項2または3に記載の画像検索装置。
  5. 入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、
    画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる算出周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を前記画像データと共に記憶する特徴量つき画像記憶部に記憶された前記画像データの特徴量と前記入力画像データの特徴量との相関値を算出する画像相関測定部と、
    を備えることを特徴とする画像検索装置。
  6. 第1の画像データを代表する色情報の集合を用いて生成される第2の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した前記周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記第1の画像データの特徴量を前記第1の画像データと共に記憶する特徴量つき画像記憶部と、
    入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した前記周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記第1の画像データの特徴量との相関値を算出する画像相関測定部と、
    を備えることを特徴とする画像検索装置。
  7. 前記入力画像データを代表する色情報の集合を用いて生成される前記第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出し、当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、
    を備えることを特徴とする請求項6に記載の画像検索装置。
  8. 前記入力画像データをブロックに分割し、当該分割した各ブロックから各ブロックを代表する色情報を取り出し、当該取り出した代表する色情報を用いて前記第3の画像データを生成する縮小画像生成手段を備えることを特徴とする請求項6または7に記載の画像検索装置。
  9. 入力画像データを代表する色情報の集合を用いて生成される第1の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析手段と、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出手段と、
    第2の画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記第2の画像データの特徴量を前記第2画像データと共に記憶する特徴量つき画像記憶部に記憶された前記第2の画像データの特徴量と前記入力画像データの特徴量との相関値を算出する画像相関測定部と、
    を備えることを特徴とする画像検索装置。
  10. 前記直流成分および一部交流成分抽出手段が、輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を抽出し、
    当該抽出した輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を用いて前記画像データの特徴量を生成することを特徴とする請求項3、5、7または9に記載の画像検索装置。
  11. 前記第2の画像データ及び前記第3の画像データが、8×8の固定サイズの画像データであることを特徴とする請求項6〜8に記載の画像検索装置。
  12. 前記第1の画像データ及び前記第2の画像データが、8×8の固定サイズの画像データであることを特徴とする請求項9に記載の画像検索装置。
  13. 画像データを第1の8×8の固定サイズの画像データに変換し、当該変換した第1の8×8の固定サイズの画像データ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された前記画像データの特徴量を前記画像データと共に記憶する特徴量つき画像記憶部と、
    入力画像データを第2の8×8の固定サイズの画像データに変換し、当該変換した第2の8×8の固定サイズの入力画像データ全体に対する周波数解析により得られる、輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記画像データの特徴量との相関値を算出する画像相関測定部と、
    を備えることを特徴とする画像検索装置。
  14. 入力される画像データが静止画像であるか動画像であるかを判定する画像データ判定手段と、前記画像データ判定手段により静止画像であると判定された画像データから縮小画像を生成する縮小画像生成手段と、生成された前記縮小画像サイズ全体に対する周波数解析を行う周波数解析手段と、解析の結果得られる直流成分および一部交流成分を静止画像特徴量として取り出す直流成分および一部交流成分抽出手段とを有する静止画像特徴量算出手段と、
    前記画像データ判定手段により動画像であると判定された画像データから全部または一部のフレームに相当するデータを取り出し処理対象に選定する特徴量抽出対象フレーム選定手段と、取り出されたフレームそれぞれのデータから縮小画像を生成する縮小画像生成手段と、生成された前記縮小画像サイズ全体に対する周波数解析を行う周波数解析手段と、解析の結果得られる直流成分および一部交流成分を画像特徴量として取り出す直流成分および一部交流成分抽出手段と、前記直流成分および一部交流成分抽出手段から出力されるフレーム特徴量を集めて動画像特徴量を生成する動画像特徴量生成手段とを有する動画像特徴量算出手段と、
    静止画像データに対して前記静止画像特徴量算出手段により予め算出された静止画像特徴量と、動画像データに対して前記動画像特徴量算出手段により予め算出された動画像特徴量とを記憶した画像特徴量記憶手段と、前記静止画像データ及び前記動画像データを記憶する画像データ記憶手段とからなる画像データベースと、
    入力された静止画像データにより前記静止画像特徴量算出手段にて算出された静止画像特徴量と、前記画像データベースに含まれる画像特徴量との相関値を計算する静止画像特徴量相関測定手段と、
    入力された動画像データにより前記動画像特徴量算出手段にて算出された動画像特徴量と、前記画像データベースに含まれる画像特徴量との相関値を計算する動画像特徴量相関測定手段とを有し、
    前記静止画像特徴量相関測定手段は、相関値の高い画像データベース中の静止画像を類似する静止画像の候補として検出し、前記動画像特徴量相関測定手段は、相関値の高い画像データベース中の動画像区間を類似する動画像区間の候補として検出することを特徴とする画像検索装置。
  15. 前記動画像特徴量相関測定手段は、
    前記入力した動画像データに対して前記動画像特徴量算出手段により算出された動画像特徴量を分割し、前記画像データベースに含まれる動画像の動画像特徴量の一部と、分割した各動画像特徴量との部分的相関値を順次算出し、前記部分的相関値が予め定められた閾値よりも低い時に、その特徴量を持つ前記画像データベースに含まれる動画像区間を類似する動画像の候補から取り除くことを特徴とする請求項14に記載の画像検索装置。
  16. 前記動画像特徴量相関測定手段は、
    前記入力した動画像データに対して前記動画像特徴量算出手段により算出された動画像特徴量を分割し、前記画像データベースに含まれる動画像の動画像特徴量の一部と、分割した部分動画像特徴量との部分的相関値を順次算出し、前記部分的相関値が予め定められた閾値よりも低い前記部分動画像特徴量の数が予め定められた閾値以上となった時点で類似する動画像の候補から取り除くことを特徴とする請求項14または15に記載の画像検索装置。
  17. 所定の画像データを検索する装置が行う画像検索方法であって、
    画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を用いて、当該画像データの特徴量間の相関値を計算することにより類似する画像データを検索することを特徴とする画像検索方法。
  18. 所定の画像データを検索する装置が行う画像検索方法であって、
    画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を前記画像データと共に特徴量つき画像記憶部に記憶するステップと、
    入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記画像データの特徴量との相関値を算出する画像相関測定ステップと、
    を備えることを特徴とする画像検索方法。
  19. 画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出する直流成分および一部交流成分抽出ステップと、
    を備えることを特徴とする請求項18に記載の画像検索方法。
  20. 画像データから縮小画像を生成する縮小画像生成ステップを備えることを特徴とする請求項18または19に記載の画像検索方法。
  21. 所定の画像データを検索する装置が行う画像検索方法であって、
    入力画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、
    画像データから生成される縮小画像サイズ全体に対する周波数解析により得られる算出周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記画像データの特徴量を前記画像データと共に記憶する特徴量つき画像記憶部に記憶された前記画像データの特徴量と前記入力画像データの特徴量との相関値を算出する画像相関測定ステップと、
    を備えることを特徴とする画像検索方法。
  22. 第1の画像データを代表する色情報の集合を用いて生成される第2の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した前記周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記第1の画像データの特徴量を前記第1の画像データと共に特徴量つき画像記憶部に記憶するステップと、
    入力画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した前記周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記第1の画像データの特徴量との相関値を算出する画像相関測定ステップと、
    を備えることを特徴とする画像検索方法。
  23. 前記入力画像データを代表する色情報の集合を用いて生成される前記第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出し、当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、
    を備えることを特徴とする請求項22に記載の画像検索方法。
  24. 前記入力画像データをブロックに分割し、当該分割した各ブロックから各ブロックを代表する色情報を取り出し、当該取り出した代表する色情報を用いて前記第3の画像データを生成する縮小画像生成ステップを備えることを特徴とする請求項22または23に記載の画像検索方法。
  25. 入力画像データを代表する色情報の集合を用いて生成される第1の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出する周波数解析ステップと、
    当該算出した周波数成分から直流成分と一部の交流成分とを抽出して、当該当該抽出した直流成分と一部の交流成分とを用いて前記入力画像データの特徴量を生成する直流成分および一部交流成分抽出ステップと、
    第2の画像データを代表する色情報の集合を用いて生成される第3の画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出周波数成分から直流成分と一部の交流成分とを抽出して、当該抽出した直流成分と一部の交流成分とを用いて生成された前記第2の画像データの特徴量を前記第2画像データと共に記憶する特徴量つき画像記憶部に記憶された前記第2の画像データの特徴量と前記入力画像データの特徴量との相関値を算出する画像相関測定ステップと、
    を備えることを特徴とする画像検索方法。
  26. 前記直流成分および一部交流成分抽出ステップにおいて、輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を抽出し、
    当該抽出した輝度成分の係数の一部または色差成分の係数の一部のいずれか一方または双方を用いて前記画像データの特徴量を生成することを特徴とする請求項19、21、23または25に記載の画像検索方法。
  27. 前記第2の画像データ及び前記第3の画像データが、8×8の固定サイズの画像データであることを特徴とする請求項22〜24に記載の画像検索方法。
  28. 前記第1の画像データ及び前記第2の画像データが、8×8の固定サイズの画像データであることを特徴とする請求項25に記載の画像検索方法。
  29. 画像データを第1の8×8の固定サイズの画像データに変換し、当該変換した第1の8×8の固定サイズの画像データサイズ全体に対する周波数解析により得られる周波数成分を算出して、当該算出した周波数成分から輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された前記画像データの特徴量を前記画像データと共に特徴量つき画像記憶部に記憶するステップと、
    入力画像データを第2の8×8の固定サイズの画像データに変換し、当該変換した第2の8×8の固定サイズの入力画像データデータサイズ全体に対する周波数解析により得られる、輝度成分の直流成分と色差成分の直流成分と交流成分の一部とを抽出することにより生成された前記入力画像データの特徴量を入力し、当該入力画像データの特徴量と前記特徴量つき画像記憶部に記憶された前記画像データの特徴量との相関値を算出する画像相関測定ステップと、
    を備えることを特徴とする画像検索方法。
JP2003124404A 1999-01-06 2003-04-28 画像検索装置、並びに画像検索方法 Expired - Fee Related JP4304368B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003124404A JP4304368B2 (ja) 1999-01-06 2003-04-28 画像検索装置、並びに画像検索方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-1507 1999-01-06
JP150799 1999-01-06
JP2003124404A JP4304368B2 (ja) 1999-01-06 2003-04-28 画像検索装置、並びに画像検索方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP05943299A Division JP3496559B2 (ja) 1999-01-06 1999-03-05 画像特徴量生成装置、並びに画像特徴量生成方法

Publications (2)

Publication Number Publication Date
JP2003323602A JP2003323602A (ja) 2003-11-14
JP4304368B2 true JP4304368B2 (ja) 2009-07-29

Family

ID=29551488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003124404A Expired - Fee Related JP4304368B2 (ja) 1999-01-06 2003-04-28 画像検索装置、並びに画像検索方法

Country Status (1)

Country Link
JP (1) JP4304368B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7724944B2 (en) 2004-08-19 2010-05-25 Mitsubishi Electric Corporation Image retrieval method and image retrieval device
JP4632830B2 (ja) * 2004-08-19 2011-02-16 三菱電機株式会社 画像検索方法及び画像検索装置
JP4343120B2 (ja) 2005-01-21 2009-10-14 ソニー株式会社 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体
JP4749139B2 (ja) * 2005-12-05 2011-08-17 株式会社日立製作所 危険映像検出方法、映像相違検出方法及び装置
JP2014238812A (ja) * 2013-05-10 2014-12-18 株式会社リコー 情報処理装置、動作特定方法及び動作特定プログラム

Also Published As

Publication number Publication date
JP2003323602A (ja) 2003-11-14

Similar Documents

Publication Publication Date Title
JP3496559B2 (ja) 画像特徴量生成装置、並びに画像特徴量生成方法
JP5116788B2 (ja) 動画像検索装置
US6600784B1 (en) Descriptor for spatial distribution of motion activity in compressed video
US7676085B2 (en) Method and apparatus for representing a group of images
US7035775B2 (en) Similar time series detection method and apparatus, program and recording medium
US20030112874A1 (en) Apparatus and method for detection of scene changes in motion video
JP2004350283A (ja) 圧縮ビデオから3次元オブジェクトをセグメント化する方法
JP4304368B2 (ja) 画像検索装置、並びに画像検索方法
KR101471204B1 (ko) 이미지에서의 의류 검출 장치와 그 방법
JP4197695B2 (ja) 動画像符号化方法、装置及びプログラム
JPH09510329A (ja) ビデオ信号処理
US20050002569A1 (en) Method and apparatus for processing images
WO2010070128A1 (en) Method for multi-resolution motion estimation
CN102298699A (zh) 图像表示和分析方法
KR0123077B1 (ko) 국부 최소치를 이용한 이동량 측정 방법 및 장치
Furht et al. Fast content-based multimedia retrieval technique using compressed data
KR101311309B1 (ko) 영상 조작 검출방법 및 영상 조작 검출장치
Latecki et al. Extraction of key frames from videos by optimal color composition matching and polygon simplification
JP2000194727A (ja) 動画像検索装置、動画像検索方法、及び動画像検索プログラムを記録した記録媒体
JPH08194714A (ja) 圧縮動画像の検索方法および装置
JP4895315B2 (ja) 動画像のカット点検出装置
JP3983981B2 (ja) デジタル映像処理方法及びその装置
Askari Javaran et al. A No-Reference Blur Metric based on Second-Order Gradients of Image
Zhu et al. Low-complexity global motion estimation based on content analysis
JPH05236449A (ja) 動画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090331

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140515

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees