JP2009022018A - 映像の検索方法および装置 - Google Patents

映像の検索方法および装置 Download PDF

Info

Publication number
JP2009022018A
JP2009022018A JP2008203715A JP2008203715A JP2009022018A JP 2009022018 A JP2009022018 A JP 2009022018A JP 2008203715 A JP2008203715 A JP 2008203715A JP 2008203715 A JP2008203715 A JP 2008203715A JP 2009022018 A JP2009022018 A JP 2009022018A
Authority
JP
Japan
Prior art keywords
video
frame
image
feature
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008203715A
Other languages
English (en)
Other versions
JP4333808B2 (ja
Inventor
Akio Nagasaka
晃朗 長坂
Takafumi Miyatake
孝文 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008203715A priority Critical patent/JP4333808B2/ja
Publication of JP2009022018A publication Critical patent/JP2009022018A/ja
Application granted granted Critical
Publication of JP4333808B2 publication Critical patent/JP4333808B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】放送中のビデオ映像またはデータベース中のビデオ映像を高速に検索する方法、ならびに、映像中の部分映像の同一性に基づき分類整理する映像の自己組織化方法を提供する。
【解決手段】映像を逐次フレーム毎に入力する手段と、入力したフレーム画像から特徴量を抽出する手段と、該特徴量を時間軸方向に圧縮する手段と、該圧縮された特徴量を逐次蓄積する手段と、該蓄積手段内の特徴量と別途入力したフレーム画像の特徴量との間で逐次照合する手段と、暫定的に照合の途中経過を記憶しておく手段を有し、該照合手段では照合の途中経過を更新しながら、一致する映像部分を探す手段とを有する。さらに、一致する映像部分が複数存在した場合には、それらを組にして対応づけて記憶格納する手段とを有する。
【選択図】図2

Description

本発明は放送中のビデオ映像またはデータベース中のビデオ映像の検索方法に関し、特
にビデオ映像の特徴を手掛かりとした検索が高速に行えるビデオ映像の検索方法に関する
近年のマルチメディア情報処理システムではビデオやテキスト等様々な情報を蓄積して
ユーザに提示することが可能であるが、それらを検索する場合、キーワード等の言語によ
る検索方法が主流となっている。この場合はキーワード付けの作業が必要であり、大量の
情報量を持つビデオ映像の1枚1枚のフレームについてキーワード付けを行うことは非常
にコストが大きい。さらにキーワードはデータベース構築者が自由に付けるものであるか
ら、ユーザの視点がデータベース構築者と異なる場合にはこれらのキーワードが役に立た
なくなるという問題がある。このような事情から、キーワード以外に画像独自の特徴から
検索を行いたいという要求があるが、画像の特徴量を手掛かりとして検索するためには膨
大なフレーム数からなるビデオの特徴量とその問い合わせ用ビデオの特徴量との高速照合
技術が必要になる。ビデオ映像に対して適用可能なだけの高速な照合技術としては、これ
まで特開平7−114567号「ビデオの検索方法および装置」が提案されているが、こ
の方法は、すべてのフレームについて照合するのではなく、映像中のカットの変わり目の
画像についてのみ照合することで処理量の低減を図っている。これによって、放送中の映
像に対しても照合を行えるだけの高速性を実現しているが、その反面、1つのカットのみ
で構成されるシーンや、編集等によってカットの変わり目が前後に変動したシーンに対し
て、うまく照合ができないという問題点があった。また、検索の際には、他の一般的なデ
ータベースシステムと同様、検索キーとして指定されたシーン以外は探さないため、シー
ンの検索が必要になるたびに、膨大な量の映像情報についてその最初から最後まで繰り返
し照合を行う必要がある。シーンの照合処理には、特徴量の抽出や読み出しの処理をはじ
め、検索するシーンが違っても共通に行われる処理が多々あり、そのような処理を重複し
て行うことにはまだ無駄がある。
特開平7−114567号公報
本発明が解決しようとする第一の課題は、映像検索のためのキーワード付け作業を行う
ことなく、検索対象映像の特徴量と、問い合わせのために用意するサンプル映像の特徴量
とを高速に照合し、フレーム精度で同一の区間を検出できる映像検索方法を提供すること
にある。また対象映像は放送中およびデータベース中のいずれの映像も対応可能とする。
本発明が解決しようとする第二の課題は、対象映像中に存在する同一シーンを、それが
検索キーとして予め指定されているか否かにかかわらず、一様に対象映像の入力と同時に
検出しておく手法を提供することにある。
本発明の第三の課題は、映像の撮影中に時々刻々と入力されている画像列を録画する際
に、録画済みの画像と照合して、一致する画像と関連づけながら録画するビデオカメラを
提供することにある。
上記課題を解決するために、本発明では、照合したいビデオ映像について、各フレームの
特徴量が互いに特定の範囲内の変動幅で収まる区間単位に分割し、該区間ごとに1つもし
くは複数の特徴量を抽出し、該区間の該映像中における位置を表わすアドレス情報と対応
づけて記憶格納しておき、その上で、検索対象であるビデオ映像から順次1枚ずつフレー
ム画像を入力し、該フレーム画像の特徴量を順に並べた任意の時点の特徴列と、該記憶格
納された映像を構成する各区間の特徴量を区間の長さ分ずつ順に並べた特徴列とが、互い
に同等と判定できる特定の長さ以上の部分を持つ場合に、その部分を同一の映像として検
出する。このとき、区間の先頭から同等の場合は、該区間に対応するアドレス情報を、ま
た、区間の途中から同等と判定された場合には、その区間の先頭からの相対位置を求め、
該区間に対応するアドレス情報を補正した値を検索結果として出力する。また、検索対象
として入力されたフレーム画像列について、フレームの特徴量が互いに特定の範囲内の変
動幅で収まる区間ごとにまとめ、該区間ごとに1つもしくは複数の特徴量を抽出し、該区
間の該対象映像中における位置を表わすアドレス情報と対応づけた情報も記憶格納し、次
回からの照合対象映像の中に追加する。さらに、入力されたある特徴列について、同一と
して検出された映像部分が複数存在した場合には、それらを組にして対応づけて記憶格納
する。
以上の検索方法を実現する装置は、任意のビデオ映像に対して、フレームの特徴量が互
いに特定の範囲内の変動幅で収まる区間単位に分割する手段と、該区間ごとに1つもしく
は複数の特徴量を抽出する手段と、該区間の該映像中における位置を表わすアドレス情報
と対応づけて記憶格納する手段と、検索対象であるビデオ映像から順次1枚ずつフレーム
画像を入力する手段と、該フレーム画像の特徴量を順に並べた任意の時点の特徴列を保持
する手段と、該記憶格納された映像を構成する各区間の特徴量を区間の長さ分ずつ順に並
べた特徴列を生成する手段と、それらの特徴列が互いに同等と判定できる特定の長さ以上
の部分を持つかどうかを判定する手段とから構成される。また、区間の先頭から同等と判
定された場合は、該区間に対応するアドレス情報を、また、区間の途中から同等と判定さ
れた場合には、その区間の先頭からの相対位置を求め、該区間に対応するアドレス情報を
補正した値を検索結果として出力する手段も併せ持つ。また、検索対象として入力された
フレーム画像列について、フレームの特徴量が互いに特定の範囲内の変動幅で収まる区間
ごとにまとめる手段と、該区間ごとに1つもしくは複数の特徴量を抽出する手段と、該区
間の該対象映像中における位置を表わすアドレス情報と対応づけた情報も記憶格納し、次
回からの照合対象映像の中に追加する手段とを有する。さらに、入力されたある特徴列に
ついて、同一として検出されたシーンが複数存在した場合には、それらを組にして対応づ
けて記憶格納する手段も有する。
上記の方法により、本発明では、ほとんど同じ特徴量が続く冗長な区間をひとつにまと
めた単位に照合を行うので、照合を毎フレームについて行う必要がなくなり、大幅に計算
量が削減できる同時に、照合にあたっては、擬似的にフレーム単位の特徴列間で比較する
形になるため、フレーム精度で同一映像区間の特定を行える特徴がある。また、1回のフ
レーム入力があるたびに、その1枚のフレームに関してのみの照合を行うため、1フレー
ム入力あたりの処理量が小さくなり、放送映像をはじめとしたリアルタイム性が要求され
る映像の処理に好適である。また、同時に検出された複数の映像部分は、全く同じ映像で
あるので、それらを1つの組として記憶格納しておくことにより、1つの部分映像を探し
たい要求があった場合には、組になった他の部分映像を提示することで検索は完了し、極
めて高速な応答が期待できる。
以下、本発明の一実施例を図を用いて説明する。
図1は、本発明を実現するためのシステム構成の概略ブロック図の一例である。1はC
RT等のディスプレイ装置であり、コンピュータ2の出力画面を表示する。コンピュータ
の出力が音声である場合には、13のスピーカを通して出力する。コンピュータ2に対する
命令は、ポインティングデバイス3やキーボード4を使って行うことができる。5のビデ
オ再生装置は、光ディスクやビデオデッキ等である。ビデオ再生装置5から出力される映
像信号は、逐次、6のビデオ入力装置によってデジタル画像データに変換され、コンピュ
ータに送られる。また場合によっては放送中の映像を取り込むことも可能であり、放送受
信機7からの映像信号をビデオ入力装置6へ入力する。5のビデオ再生装置の替わりに、
デジタルデータとして映像を記録するビデオサーバやデジタルビデオ等を用いる場合には
、6のビデオ入力装置は不要か、もしくは圧縮記録された画像データを伸張して非圧縮画
像データに変換する機能を司る。放送受信機7についても、放送がデジタル方式の場合に
は同様である。コンピュータ内部では、デジタル画像データは、インタフェース8を介し
てメモリ9に入り、メモリ9に格納されたプログラムに従って、CPU10によって処理
される。10が扱うビデオがビデオ再生装置5から送られている場合は各フレーム画像に
は、ビデオの先頭から順に番号(フレーム番号)が付けられている。フレーム番号を制御
線11によってビデオ再生装置に送ることで、当該場面のビデオが再生するよう制御可能
である。また放送受信機7から送られてくるビデオの場合、フレーム番号はないので必要
に応じて、処理開始時を0とした連番や時刻等を記録してフレーム番号の代わりに使用す
る。コンピュータ内部処理の必要に応じて、各種情報を12の外部情報記憶装置に蓄積す
ることができる。メモリ9には、以下に説明する処理によって作成される各種のデータが
格納され、必要に応じて参照される。
図2は、本発明の映像検索処理の処理概要を示す全体ブロック図である。この処理は、
コンピュータ2の内部で実行される。処理プログラムはメモリ9に格納され、CPU10
において実行される。以下では、各部がCPU10によって実行されるソフトウェア手順と
して記述されることを前提に説明を行うが、本手順と等価な機能をハードウェアによって
実現できることは言うまでもない。なお、以下の説明において、ソフトウエアにより行わ
れる処理が便宜上ブロック化して示した。従って、例えば、図2において問い合わせ用映
像入力部は問い合わせ用映像入力処理を示している。本実施例では、見つけ出したいシー
ンの映像(以下、問合せ映像と呼ぶ)100は、検索に先立って予め、問合せ用映像入力
部102によってフレーム毎に逐次入力され、メモリ9に一時的に格納される。フレーム
特徴量抽出部106は、メモリ9のフレーム画像104から特徴量108を抽出する。特
徴量テーブル作成部110は、特徴量が許容変動範囲内にある一続きの区間ごとに、その
特徴量と、その先頭フレーム番号とを対にして、特徴量テーブル112を作成し、記憶装
置114に記録する。検索対象であるビデオ映像116も、問合せ映像と同様にして照合
対象映像入力部118によってフレーム毎に逐次入力され、メモリ9に一時的に格納され
る。フレーム特徴量抽出部122は、メモリ9のフレーム画像120から特徴量124を
抽出する。ここで、122は106と全く同じ処理を行う。特徴量照合部130は、12
2から次々と送られてくる特徴量124の最新の時系列の並びと、記録された特徴量テー
ブル300(データ内容は112と同一)とが一致するか比較照合する。照合の途中経過
は、記憶装置126に後述する候補リスト400の形で記憶され、新しいフレームの入力
ごとに更新される。もし、特徴量が一致すれば、その特徴量テーブルに対応する映像区間
を、後述する検索結果テーブル600として記憶装置128もしくはその他の処理装置に
出力する。このとき、その検索された映像に何らかの名称や属性等が対応づけられていた
場合、その名称や属性を出力することも当然可能である。
次に、上記各部で行われる処理について、より詳細に説明する。
図3は、問合せ用映像が入力されて特徴量テーブルが作成されるまでの一連の流れ(1
00〜114)を示したものである。この処理の目的は、より多くの種類の問合せ用映像
を記憶しリアルタイムで一度に照合できるように、問合せ用映像を、その特徴を表現しう
る最低限度の情報に圧縮することにある。具体的には、まず次々と入力されるフレーム画
像から特徴量を抽出する。このとき、特徴量は、フレーム画像全体の平均色など数バイト
程度で表現できる情報に限定する。
さらに、得られた特徴量の時系列の並びを、許容変動範囲内にある一続きの区間ごとにま
とめ、それぞれの区間につき1つの特徴量で代表させる。図中、A’、A”と表記したの
は、Aを基準として、その特徴量の値からの差の絶対値が特定閾値以内の特徴量であるこ
とを示している。入力された映像の各フレームには、t1から順にt2、t3、…とフレーム番
号が添えられており、各区間の先頭フレームのフレーム番号ti、tj、tk、…と特徴量A、
B、C、…とを対にしてリストを作り、特徴量テーブルとする。ここで、映像は1秒あた
り30枚ものフレーム画像から構成されるため、探したい映像の種類にも依存するが、平
均区間長が10フレームとして、わずか数秒分のシーンからでも10個以上の特徴量から
なる順列パターンが得られる。これに各区間の長さも制約条件に加えれば、このときの特
徴量テーブルの順列組合せの数はきわめて大きな数になり、多数の映像中にあっても十分
に1つのシーンを特定できるだけの性能が期待できる。
図4は、検索対象のビデオ映像と、予め記憶してある問合せ用映像との間の照合の様子
(特徴照合処理130)を模式的に示したものである。上述のように検索対象映像は、逐
次フレーム画像入力され、特徴量が抽出される(116から124)。一方、特徴量テー
ブルの形で圧縮されていた問合せ用映像は、照合時(130)には、各区間の長さ分ずつ
特徴量がならべられ、ラン単位からフレーム単位の特徴列に戻される。照合にあたっては
、対象映像から入力されたばかりの最新のフレームを最末尾とする特定閾値以上の長さの
特徴列と一致する特徴列を持つ問合せ用映像を検索結果として返す。このとき、完全一致
だけでなく部分的な特徴列の一致も検出し、その一致した部分の長さが同閾値以上の場合
には、それも検索結果として返すようにする。これにより、編集等で長さが微妙に異なっ
ているシーンに対しても正しく検索ができるようになる。
図5は、本発明における照合処理をより詳細に示したものである。上述したような不定
長の特徴列の照合を行う場合、単純に行うと、対象映像からフレーム画像が新しく入力さ
れる都度、図6に示したような、様々なフレーム長を想定した比較照合を繰り返さなけれ
ばならない。このときのフレーム間比較の数は、図から明らかなように極めて膨大であり
、とりわけ1/30秒に一度の割合で続々と新しいフレームが入力されるようなリアルタイム
照合用途には不向きである。これは、フレーム入力のたびごとに以前の照合処理とは全く
独立に照合処理を行っているためであり、直前の処理で、ある程度の長さ分の一致が確認
されたとしても、その情報を次の照合処理に活かすことができない。そこで本発明では、
1回のフレーム入力で行う照合処理を削減し、フレーム入力の都度、直前までの処理を補
足するように照合処理を段階的に行うアプローチをとる。具体的には、次のようにして照
合を行う。
(1)あるフレームが対象映像から入力されたとき、そのフレームの特徴量と同じ特徴量
が問合せ用映像中にあるかどうかを探して、見つかったフレームをすべて候補として一時
的に記憶する。
(2)次のフレームが対象映像から入力されたとき、そのフレームの特徴量が、直前に候補
として記憶したフレームの直後のフレームの特徴量と一致するかどうかを調べる。
(3)一致しなかった場合には候補から外し、また、今回入力されたフレームの特徴量と同
じ特徴量を持つフレームを新たに候補として追加する。このとき、候補から外されたフレ
ームが、それまでに特定閾値以上の長さ分だけ一致し続けていた場合には、そのフレーム
を先頭にした一致区間を検索結果として出力する。
(4)以上を繰り返す。
以下、図5の例に従い、本発明による照合の原理を具体的に説明する。
まず対象映像から新規のフレーム入力があり、特徴量Xが得られたフレーム(1)について
考える。問合せ用映像の中に特徴量Xは存在しないので、何もしない。
フレーム(2)も同様である。フレーム(3)が入力されて特徴量A’が得られると、A’と一
致する特徴量Aが問合せ用映像中に存在するので、特徴量Aを持つ問合せ用映像中のすべ
てのフレームa〜dを候補に入れる。対象映像から今後入力されるフレームの特徴量の現れ
かたによっては、これらの候補フレームのいずれも、そのフレームを先頭とした一続きの
区間が検索シーンとなる可能性を秘めている。図5の下の表において、フレーム(3)の行
に書き込まれている〈1〉〜〈4〉が、この時点で候補に入れられた問合せ用映像中のフ
レームを示している。続くフレーム(4)でも特徴量A’が得られるが、まず前回候補に入
ったすべてのフレームについて、その次のフレームが特徴量が一致するかどうかを調べる
。結果は、〈1〉〜〈3〉のフレームについては一致するが、〈4〉のフレームについて
は、次のフレーム〈5〉で特徴量がBに変わっているので一致しない。表中4行目に×と
表記されている部分がそれで、フレーム(3)で候補に入った〈4〉については、この時点
で候補から外される。また同時に、フレーム(4)における候補として、表中4行目に、(3)
と同じ〈1〉〜〈4〉が新たに加えられる。(3)行目で加えられた〈1〉〜〈4〉と(4)行
目で加えられた〈1〉〜〈4〉とは、同じフレームではあるが、照合の候補としては全く
別物として扱う。さらに、フレーム(5)ではB”が得られ、ここで(3)で候補に入った〈1
〉〈2〉と、(4)で候補に入った〈1〉〜〈3〉が候補が外される。そして、同様にして
〈5〉と〈6〉が、この時点で候補に入れられる。以上の処理を、対象映像からフレーム
を入力するたびに繰り返すと、フレーム(8)の段階まで一致し続けている候補は、(3)で候
補に入った〈3〉と、(4)で候補に入った〈4〉、(5)で候補に入った〈5〉、(6)で候補
に入った〈6〉、(7)で候補に入った〈7〉だけである。そして、フレーム(9)が来て照合
がとれなくなった時点で、対象映像のフレーム(3)〜(8)と,問合せ用映像の〈3〉〜〈8
〉とが最も長く一致する区間であったことがわかる。これらの結果は、先に図6で示した
従来方法を用い、フレーム(8)を基点として順に長さを変えながらシーンの照合を調べた
場合の照合結果と一致する。この場合、問合せ用映像のフレーム数をnとすると、1回の
フレーム入力あたりに行わなければならないフレーム間比較の回数は、図6に示したよう
にn(n+1)(n+2)/6回となり、その計算量のオーダーはO(n3)となる。しかし、本手法によれ
ば、(1) 新たに入力されたフレームの特徴量と、候補フレームの次フレームの特徴量との
一致を調べる回数cと、(2)問合せ用映像の中に、新たに入力されたフレームの特徴量と同
じ特徴量があるかを調べる回数n、の和だけでよく、一般にn>>cとなってオーダーはO(n)
となる。この差は、直前のフレームまでの処理結果をもとにして、現在のフレームを加え
た結果を求める帰納的な手法としたことによる。また、nは、前述した特徴量テーブルの
利用によって、もともとのフレーム数よりも少なくでき、さらに高速な照合が期待できる
。そしてまた、この検索結果は、明らかにフレーム精度で位置決めができている。
以上の説明では、問合せ用映像が一つの場合を想定して説明したが、複数の場合でも問
題なく適用できる。フレーム入力ごとの照合にあたって、問合せ用映像の数だけ上記の処
理を繰り返せばよいだけである。但し、図7に示したように、問合せ用映像のそれぞれに
同じ映像部分が含まれていながら、それらが編集のしかたが異なるなどの影響で微妙に前
後が違っている場合がある。図では、〈1〉、〈2〉、〈3〉の3種類が示されている。
1つの問合せ用映像の中に複数の同一映像部分が含まれている場合も同様である。問合せ
用映像の中に一致する部分があるかどうかだけが必要なときには問題にならないが、検索
の目的によっては、その一致区間の正確な位置と長さに基づいて分類まで行いたいことも
ある。その場合、どの区間がどの区間と一致するかを明確に検索結果として出力できなく
てはならない。また、図中のNo.2とNo.3にあるように、重なりがある場合には、その包含
関係を考慮した上で示せなければならない。本発明の手法では、この課題についても基本
的な照合原理を変更することなく高速処理が可能である。本手法における照合処理では、
対象映像からフレームが入力されて特徴量が得られると、問合せ用映像中から、それと同
じ特徴量を持つ一群のフレームが候補に入れられると述べた。このとき、同時に候補に入
ったフレームを先頭とし、検出閾値以上の長さに達した一致区間の一群は、互いに同一の
映像である。図7の例では、〈2〉の区間は3つの問合せ用映像のいずれにも存在し、各
問合せ用映像における区間先頭フレームはすべて、対象映像から〈2〉の先頭にあたるフ
レームが入力された時点で同時に候補に入る。他にも同時に候補に入るフレームがある可
能性があるが、それらは検出閾値以上の長さに達する前に候補から外れることになる。そ
して、〈2〉の区間の末尾まで到達し、その次のフレームの照合を行った時点で、No.1と
No.3の問合せ用映像における一致区間が候補から外される。対象映像にとっては、まだNo
.2との間では一致しつづけているが、ここでひとまず〈2〉の区間を確定し、問合せ用映
像No.1〜3で〈2〉が見つかったことを検索結果として出力する。しかし、問合せ用映像N
o.2は、区間〈2〉が終わっても、次のフレームもまだ対象映像と一致しているので候補
として残り続け、最終的に区間〈3〉が確定する。また、〈1〉のように、〈2〉より手
前に区間があっても同様に一致区間が検出され確定する。このように、本発明の手法によ
れば、候補に入るときと外れるときに簡単なチェックを行うだけで、フレーム入力ごとの
照合の処理量は少ないまま、微妙に前後が違っている様々なバリエーションのシーンをそ
れぞれ区別して検出することができる。
以上の説明では、問合せ用映像をあらかじめ用意しておき、その上で対象映像から検索
を行うケースについて説明したが、本手法は問合せ用映像が対象映像そのものであっても
適用できる。図8にその概念図を示す。対象映像を入力し、それをすべて記憶しておき、
それをあたかも上述の問合せ用映像であるかのように扱う。これは、図9のブロック図に
よって実現することができる。ほとんど図2のブロック図と変らないが、問合せ用映像と
対象映像とが同一なため、フレーム特徴量の抽出までが共用でき、フレーム特徴量108
が記憶用と照合用にそれぞれ分配される。この機構により、対象映像から入力された最新
の映像部分〈1〉が、過去に入力されたどの部分に現れているかを入力と同時に検出する
ことができる。また、過去に複数回現れたシーンであれば、上述の照合原理から、それら
すべてが同時に検出されるので、検出された同一シーンごとにまとめて分類整理する、い
わば映像の自己組織化がリアルタイムで自動的に成される。たとえば、数週間分のテレビ
番組を録画できる装置に、本発明を数週間分のテレビ番組をすべて記憶できるだけのメモ
リ容量を持たせて適用すれば、一般に番組のオープニングには毎度同じ映像が流れるので
、その映像を検出して前後の映像をまとめることで番組の分類整理が録画と同時にリアル
タイムで行える。同じシーンが複数あることがわかれば、映像そのものは1つだけ残して
おいて、残りについてはポインタだけ残して消してしまえるので、録画するときのメディ
アの利用効率を向上させることができる。また、コマーシャルも繰り返し流される映像の
一つであるが、録画した番組を再生する場合に、必要に応じて自動でスキップさせること
もできる。このとき、コマーシャルの特徴として、長さが15秒もしくは30秒ちょうどであ
ることを利用すれば、コマーシャルかどうかの判定性能が向上する。
以上説明した中で、図9で示したブロック図を実現する処理について、より具体的にフ
ローチャートで表現すると、図10のようになる。図2のブロック図を実現する処理につ
いても、図10より自明となる。また、上記では説明を簡単にするため、問い合わせ用映
像の特徴量を一度ラン単位からフレーム単位に戻して照合したが、ここではより実用に近
い仕様となるよう、ラン単位のままで照合する方法を示す。
まず処理200で装置や各種変数の初期化を行う。変数mcとmmに0が入る。次に、対象
映像からフレーム画像を1枚入力し(202)、そのフレーム画像から特徴量Fを抽出す
る(204)。特徴量Fは、フレーム画像中に存在する全画素の色の平均を用いる。各画
素の色はRGB3つのコンポーネントから表現されているが、各コンポーネントの値につ
いてそれぞれ全画面分の平均をとり、3つの値の組(Ra, Ga, Ba)を得、この組をもって
特徴量Fとなす。もし、初めてのフレーム入力ならば、図11に示した特徴量テーブル構
造体300を新規に作成し、最初の区間(区間番号1)の特徴量として302にFを書き
込む。また、このときのフレーム番号も対にして一緒に304に書き込む。このようにし
て作成された特徴量テーブルが、今後既に述べた問合せ用映像として機能することになる
。このとき、特徴量テーブル300に記憶されている区間の最大値を示す変数mcを1つ増
やし、そのまま202に戻る。一方、2回目以降のフレーム入力ならば、処理206を行
う。206では、特徴量テーブルに記憶された最新の区間(区間番号mc-1の区間)の特徴
量FCと今回の特徴量Fとを比較し、その差異が閾値CTH以下であるかどうかを判定する
。ここで、特徴量は上述のように3つの値の組であるが、3つの値の差がすべて閾値CTH
以下であるときにのみ、差異が閾値CTH以下と表現することにする。もし、差異が閾値CTH
以下であれば、今回入力されたフレームは、直前までのフレームと同じ区間にまとめるこ
とができると判断され、処理208に進む。208ではループカウンタiを0にリセット
する。iは226で1ずつ増やされ、iがmmより大きくなるまで210〜224の処理を繰
り返す。ここでmmは、これまでに入力した全映像(特徴量テーブル300として記憶)の
中で、現在新たに入力されつつある映像と同じ部分である可能性があるとして継続審査の
段階にある候補の数である。すべての候補について、それぞれ審査段階を表わす状態変数
を格納する構造体500が作られており、図12に示すような候補リスト構造体400に
よって管理されている。400には、候補構造体500へのポインタが格納され、追加や
削除が実行中に動的に行われる。図13は、候補構造体500の構造を示しており、候補
として登録されたときの区間番号が照合開始区間番号502として、その区間からスター
トして現在照合の対象となっている区間の番号が照合対象区間番号504として格納され
ている。
また、一致フレーム数カウンタ506は、候補に入ってから一致しつづけた回数、すなわ
ち一致区間の長さである。照合開始フレームオフセット508は、ラン単位で比較しなが
らフレーム精度での位置決めを行うために必要な変数であり、後述する。そして、同時照
合開始候補へのポインタ510は、同時に登録された一群の候補どうしを連接リスト形式
で結んでおり、510を参照していくことで同時に登録された候補を次々に辿ることがで
きる。さて、処理210では、候補i(mm個ある候補の中のi番目の候補という意味で表記
)が、現在照合対象となっている区間の末尾まで照合し終わったのかどうかを調べる。こ
れは照合開始区間番号502で示される区間のフレーム番号に、一致フレーム数カウンタ
506を足したフレーム番号が、現在照合対象となっている区間の次の区間のフレーム番
号に達していれば、末尾に達しているとわかる。もし、達していなければ、候補iの一致
フレーム数カウンタを1増やして(216)、処理226に進む。達していれば、現在照
合対象となっている区間に後続する区間の特徴量を参照し、それとFとの差異が閾値STH
以下かどうかを調べる(212)。もし、差異が閾値STH以下ならば、照合対象の区間を
その後続区間に変更して照合を継続する(214)。これによって、区間が変わる場所が
入力映像と異なっている場合でも安定して照合ができる。これは、映像入力時のノイズや
機器の特性等によって映像信号が変動することがあるため、区間の変化点が、同じ映像を
入力していても必ずしも同一になるとは限らないために必要な処理である。また、区間の
変わり目を決定する閾値CTHと異なる閾値STHをここで用いているのも、同様に映像の変動
を吸収し、安定した照合を行うためである。一方、処理212で、差異が閾値STHより大
きければ、現在照合対象となっている区間の特徴量と、今回の特徴量Fとの差異が閾値ST
H以下かどうかを調べる(218)。もし、差異が閾値STH以下ならば、何もせずに処理2
26に進む。これは、候補に入るのがフレーム単位でなく区間単位であり、必ずしも区間
の先頭から一致するとは限らないために、現在照合対象の区間と同じ特徴量の入力映像が
得られている間は、とりあえず位置合わせしながら待ってみるのである。もし、差異が閾
値STHより大きければ、もう一致しなくなったみなす。このとき、候補iの一致フレーム数
カウンタが閾値FTH以上ならば(220)、検索シーンとして候補iを出力する(222)
。そして、候補iを候補リストから削除し(224)、処理226に進む。
さて、処理206において、差異が閾値CTHより大きければ、今回入力されたフレーム
は、直前までのフレームと同じ区間にまとめることができないと判断され、新規区間を特
徴量テーブル300に追加する(228)。このとき、 mcを1つ増やし、FCにはFを
代入しておく。230ではループカウンタiを0にリセットする。iは248で1ずつ増や
され、iがmmより大きくなるまで232〜246の処理を繰り返す。処理232では、候
補iが、現在照合対象となっている区間の末尾まで照合し終わったのかどうかを調べる。
これは処理210と同様の方法で求められる。もし達していれば、照合対象の区間をその
後続する区間に変更し(234)、そうでなければ何もしない。次に現在照合対象となっ
ている区間の特徴量と、最新の特徴量Fとの差異が閾値STH以下かどうかを調べる(23
6)。もし、差異が閾値STH以下ならば、候補iの一致フレーム数カウンタを1増やし(2
38)、処理248に進む。もし、差異が閾値STHより大きければ、現在照合対象となっ
ている区間の後続区間について直後の1つだけでなく順番に調べていき、今回の特徴量F
と同じ特徴量を持つ区間があるかを調べる(240)。もしあれば、その後続区間を照合
対象の区間に変更し、また、その区間のフレーム番号と当初の照合しようとしていたフレ
ーム番号との差を照合開始フレームオフセット508に代入してから、処理248に進む
。これもまた必ずしも区間の先頭から一致するとは限らないためで、このオフセットを利
用することでフレーム精度の位置合わせができるようになっている。このとき、オフセッ
トの大きさが、候補に入れられたときの区間の長さを超えていたら、一致する後続区間が
見つからなかったと同じ扱いで処理242に進む。さもなければ、最初に候補に入ったと
きの区間の後方の区間から照合開始したと等価であり、そのときは、その後方の区間から
照合開始したものが順調に一致を続けているはずで処理が重複することになる。一致する
後続区間が見つからなかった場合、候補iの一致フレーム数カウンタが閾値FTH以上ならば
(242)、検索シーンとして候補iを出力する(244)。そして、候補iを候補リスト
から削除し(246)、処理248に進む。全部の候補について処理が終わったら、今回
入力されたフレーム画像の特徴量と同じ特徴量を持つ区間を、特徴量テーブルに記憶され
た区間の中からすべて探し出し、それらの区間を照合開始区間とする候補構造体を作成し
て候補リストに追加する(250〜256)。
以上の処理の中の222、244において、見つかったシーンの情報をそのまま出力す
るほかに、図14に示した形式で出力することもできる。600は検索結果テーブルで、
見つかったシーンを同一シーンごとにまとめてグループを作り、各グループのエントリを
管理する。同一シーンのグループは、先に図7で説明したようにして得られる。見つかっ
たシーンの一つ一つは検索区間構造体700で表現され、同一シーンは相互にポインタを
持ち合う連接リスト形式で一つのグループを表現する。連接リストを形成する同一シーン
へのポインタは704に格納され、また、それぞれの区間の先頭フレーム番号が702に
格納される。そして、グループを表わす連接リストの先頭となった検索区間構造体へのポ
インタが、そのグループのエントリとして602に格納される。同一グループでは、グル
ープ内のすべてのシーンの区間長は同じなので、エントリと対にして604に格納する。
以上の処理を繰り返すことで、過去に一度でも現れたことのあるシーンは再び現れた瞬
間に検出され、その区間の先頭と長さがフレーム精度で位置決めされる。区間の先頭は、
候補構造体の照合開始区間番号で示される区間のフレーム番号に、同じく照合開始フレー
ムオフセットを加えたフレームであり、長さは、一致フレーム数カウンタの値そのもので
ある。あとは先に図7を用いて説明したように、同じ区間ごとにまとめることで自動自己
組織化ができる。但し、静止画が長く続くようなシーンの場合、フレーム1枚あたりの特
徴量を減らしている本手法では特徴量の特徴的な時間変化が得られず、他の静止画シーン
と間違って一致する確率が高くなるという問題もある。この場合については、たとえばフ
レーム画像1枚あたりの特徴量を増やすことで対応できるのはいうまでもない。また、同
様に特徴量に変化が少ないシーンの場合には、数フレーム程度のずれがあっても一致しう
る。このような場合、複数の区間が同じ範囲に重なり合って検出される。この典型的な例
として、入力されたばかりの映像が、同じカット(映像を構成する単位の一つ。1台のカ
メラで途切れなく撮影されたひとまとまりの映像区間)内の少しだけ前のほうの区間と一
致する場合がある。映像の冗長性から、同じカット内の各フレームは画像的に良く似てい
るためである。これには、公知のカットの変わり目の検出手法を導入し、同じカット内で
は一致とみなさないといった処理を行うことで問題を回避できる。
図15は、本発明、特に図8に示した手法を利用した、次世代ビデオレコーダシステム
の一実施例を示す概念図である。テレビ番組などの映像を録画すると同時に、本発明の機
能も実行する。録画する映像の各フレームにはフレーム番号等のアドレス情報を付与し、
そのアドレス情報を、本発明で生成する特徴量テーブル300のフレーム番号304とし
て用い、映像データと特徴量テーブルとの1対1の同期をとる。録画終了時には、本発明
で用いる特徴量テーブルや各種変数は不揮発性の記録装置に記録され、次回録画開始時に
読み出されて再開できるようにする。これにより、映像を新しく入力すると同時に、映像
アーカイブの中にすでに記録された映像とリアルタイムで照合し、同一シーンどうしを自
動的に関連づけることができる。そして、例えば、入力された映像と主題歌の部分が照合
する番組がすでに格納されていれば、それらは連続番組であり、同じ分類としてまとめて
整理することが自動的にできる。もし、連続番組の初回を見たときに、その連続番組全般
の共通属性として情報を付与したならば、入力されたばかりの映像にも、その情報を直ち
に共有させることができる。また、繰り返し現れるコマーシャルも同様にして検出でき、
コマーシャルをスキップすることができると先に述べた。しかし、録画格納されている映
像に存在するコマーシャルをもとにしただけでは、限られた数のコマーシャルしか検出で
きない。そこで、映像を録画しないときも24時間映像を調べるようにし、繰り返しシー
ンからコマーシャル部分を検出し、そのコマーシャル部分の映像については、映像の録画
はしないまでも特徴量テーブルだけは作成し記録しておくようにする。これにより、映像
の容量を抑えたまま、より多くのコマーシャルが検出できるようになり、また、コマーシ
ャルのスキップがより確実に行えるようになる。このように、本発明を次世代ビデオレコ
ーダシステムに搭載することで、録画した番組を自動分類整理したり、コマーシャルを自
動スキップしたり、といったことが簡単にでき、非常に使い勝手がよくなる。ここでは放
送映像を対象とできることを強調したが、ファイル等に格納された映像が対象であっても
構わないことはいうまでもない。
図16はユーザとの対話に利用する表示画面の一実施例である。映像のフレーム画像は
コンピュータのディスプレイ上のモニタウインドウ50に再生表示される。同じ画面上に
表示されるウインドウには、50のほか、映像中の代表的なフレーム画像を一覧にして表
示するウインドウ52、映像やシーンの属性を入力するテキストウインドウ55、検索結
果を表示するウインドウ54などがある。検索結果が52に表示される場合もある。これ
らのウインドウは、ポインティングデバイス3の一つであるマウスを使って自由に動かせ
るカーソル53を操作して画面上の任意の位置に移動できる。テキストの入力にはキーボ
ード4などを用いる。ウインドウ52に表示される代表フレームは、例えば、映像をカッ
ト単位に分割した際の各カットの先頭フレームとする。ボタン51は、映像の再生状態を
制御するためのボタンで、マウスでクリックすると、映像の再生や早送り・巻き戻しとい
った制御ができる。また、再生するシーンについては、ウインドウ52に一覧表示されて
いる代表フレーム画像をクリックすることによって連動的に選択を行うこともできる。そ
のとき、再生するビデオは、コンピュータに接続されたビデオ再生装置5が出力する映像
を用いることもできるし、外部情報記憶装置に登録されたデジタル化された映像でもよい
。ビデオ再生装置5の場合には、シーンの先頭のフレーム番号をビデオ再生装置に送り、
そのフレーム番号に対応するシーンから再生を開始する。そして、シーン末尾のフレーム
番号に到達した時点で再生を中断する命令をビデオ再生装置5に送る。デジタル化された
映像の場合も基本的に同様だが、デジタル映像データを読み取った後、計算機向けの描画
データに変換してグラフィックの一種として表示する。1フレーム分の表示処理が終了す
ると、次のフレームの表示処理を連続して行い、これにより動画像の表示とする。表示処
理に要する時間に合わせ、一定時間あたりに表示するフレーム画像の枚数を調節し、映像
が早送り気味になったりスロー気味になったりしないようにする。またモニタウインドウ
50には放送受信機7からの映像の表示も行える。
ユーザが図16の画面を用いて映像検索を行う操作手順を以下のべる。まず問合せ用映
像の指定を行う。最も単純な方法は、51の操作ボタンを用いて早送りや巻戻しを行い、
モニタウインドウ50に映される映像を確認しながら任意のシーンを見つける方法である
。また、ウィンドウ52に並んだ代表フレームの一覧は、本でいうところの目次や索引に
相当するもので、それを参照することで、より手早く所望のシーンを見つけることができ
る。指定する際には、そのシーンの範囲を正確に指定する必要はなく、そのシーンに含ま
れる任意のフレームを指定すればよい。これはモニタウインドウ50に表示中のフレーム
をマウスでクリックして指定するのでもよいし、52の代表フレーム一覧の中に、問合せ
用映像に含まれるフレーム画像が表示されているならば、それをマウスクリックするので
もよい。次にテキストウィンドウ55で、選択したシーンやその映像全体のタイトルや人
名等の属性情報をキーボードから入力し登録する。尚、登録数は任意であり、また、属性
情報を今後再利用する必要がない場合には、属性情報の登録は一切行う必要がない。最後
にユーザは検索開始要求を出す。これは55のOKボタンをクリックすることで行う。こ
れにより、システムは検索処理を開始する。
システムは、指定されたフレームをちょうど中間とする一定の長さの区間を仮想的に作り
、その区間を問合せ用映像として本発明の検索手法にかける。対象映像はビデオ再生装置
から新たに入力してもよいし、すでにデータベースとして登録され特徴量テーブルが作成
されている映像ならば、その特徴量テーブルに対して照合処理を行う。このとき、得られ
た検索結果の区間の中に、最初に指定したフレームが含まれていれば、それが検索結果と
なる。さらに、部分一致なのか、全区間一致なのかを調べて、全区間一致しているときに
は、区間を前方および後方に広げて一致区間を正確に求めることもできる。これは、部分
的に一致する区間も高速に探し出せる本発明の手法のメリットを活かした検索方法となっ
ている。
検索結果はウィンドウ54に表示される。表示内容は属性情報、時間情報等である。あ
るいは検索結果を、図17に示した形でグラフィカルに表示することも可能である。図1
7は、ウインドウ52の拡大図になっており、800が各代表フレームのアイコン画像で
ある。横棒806がアイコン画像の下に添えられることで、そのアイコン画像に対応する
シーンに、検索結果が存在していることがわかるようになっている。検索結果が、アイコ
ン画像の複数のシーンにまたがれば、棒もその分だけ長くなる。また、棒は色もしくはハ
ッチングパターンで分類されており、同じシーンの検索で見つかった複数のシーンはいず
れも同じ色で、一方、あるシーンの検索結果と別のシーンの検索結果とでは違う色で表示
される。
代表フレーム一覧は、前述のように映像の目次や索引として用いることができ、問合せ用
映像を見つけるのに非常に有用であるが、代表フレームは映像に含まれるすべての画像で
はなく、かといって、すべての画像を一覧にすれば、それらの中から所望のものを見つけ
るのが困難になる、というジレンマがある。そのため、映像を解析することで、代表フレ
ームが表わすシーンの典型的な特徴を抽出し、例えば、各アイコン画像800に、特徴を
表現する情報802や時間情報804を合わせて表示することで、代表フレームの画像に
ない部分の映像も探し出せるようにすることが考えられる。このようなシーンの特徴を表
現する情報には、人物の有無やカメラワーク(ズームやパン、チルトなど)、特殊効果(
フェードイン/アウト、デゾルブ、ワイプなど)の有無、字幕の有無、などがある。画像
の検出を行う画像認識手法には、先に本発明者らが特許出願した特願平7-210409号(H7.8
.18出願)を利用すればよい。本発明の手法を適用すれば、また別のアプローチから、代
表フレーム一覧のジレンマの解消に役立てることができる。代表フレーム一覧には、繰り
返しシーンであれば、それらのシーンの全部ではなくても、その幾つかが一覧の中に含ま
れていることがある。例えば、図18において、カーソル53で、繰り返しシーンの一枚
をクリックし検索を行えば、そのシーンと同じ映像部分を持つシーンをすべて見つけて、
ユーザに提示するようにする。検索結果の提示は、たとえば、アイコン画像808に重畳
表示した星印810のように、検索された区間を含むシーンのアイコン画像を強調する形
で行う。
このとき、表示するアイコン画像自体も、検索された区間の中のフレーム画像で置き換え
ると、さらにわかりやすくなる。これによって、代表フレーム一覧の中に、見つけたいシ
ーンと同じシーンの画像が一つでもあれば、それを頼りに所望のシーンを見つけることが
可能になり、代表フレーム一覧の利便性が高まる。同様の手法は、モニタウインドウ50
で表示中の映像についても適用でき、表示中のフレームをクリックするなどして指定して
、そのフレームを含むシーンと同じシーンを検索し、見つかったシーンの一つにジャンプ
させるといったこともできる。このようなことを実現するためには、これまでリンクノー
ドの設定などの面倒な準備が予め必要であったが、本発明の手法を用いれば、非常に高速
に検索ができるので、必要な都度検索を行えばよく、前もって準備しておく必要はない。
尚、図9のブロック図で表わされる自己組織化処理の実行にあたっては、ユーザは検索
のための特別な処理を何ら行う必要はなく、ただ映像を入力しさえすれば計算機が自動的
に処理を実行する。
また、以上の説明では、映像の画像特徴に基づき検索を行う方法について述べたが、音
声特徴を用いてもよく、また、映像に限らず、逐次的に扱うことのできるメディアであれ
ば、いずれにでも本検索手法を適用できることは言うまでもない。
図19に本発明の画像検索技術をビデオカメラに適用した例を示す。処理入力手段1960
に設けられた電源スイッチ1961により電源が投入され、録画ボタン1962により録画が指示
されると、音声・画像入力手段1910は、マイク1911から音声信号を、カメラ1912から画像
信号を入力する処理を行う。音声・画像入力手段における処理には、入力された音声・画
像信号に対してA/D変換処理、圧縮処理が含まれる。特徴抽出手段1970は入力された画像
信号からフレーム単位の特徴を抽出する。処理の内容は、図2、図9の106と同じである
。抽出された特徴は特徴量テーブルとしてメモリ1940に記憶される。メモリ1940は内蔵さ
れた半導体メモリ、着脱式のメモリカードを用いる。メモリ1940には入力された音声・画
像信号が保持され、再生ボタン1963からの再生指示により、メモリ1940から読み出され、
音声・画像出力処理手段において、信号圧縮に対する伸長処理や、D/A変換処理が施され
、画像は表示画面1921に出力され、音声はスピーカ1922から出力される。制御手段1930は
このビデオカメラの信号処理全般を管理し制御する。入力された画像はフレーム毎にその
特徴が抽出されメモリに蓄積されるが、制御手段1930では入力画像の特徴量をメモリ1940
中に保持されている過去のフレームの特徴量と照合する。照合処理は、図2、図9の特徴
量照合処理130と同じようにすればよい。照合した結果、特徴量が類似するシーンの区間
が検索結果テーブル(図2、図9の128)と同様の形式でメモリ1940に保持される。1950
はビデオカメラを駆動するための電源を供給する端子であり、バッテリーを装着するよう
にしてもよい。画像検索メニューボタン1964は、録画された動画像を例えば図16、図1
7、図18のように表示画面上1921に表示された画面で、ボタン1964を複数回押すことに
より、シーンの並び替えや削除等の簡単な編集処理や、所望のシーンを指示して類似のシ
ーンにを検索して再生させるといった処理を指示する。シーンの区分けに用いられる動画
像の変化点検出に関する技術は先に発明者らが特許出願した特願平成7-32027号(H7.2.21
出願)を参照すればよい。シーンの検索は、図2、図9で行った画像の特徴量の照合処理
を用いて行う。このようなビデオカメラは、特徴量の照合処理の条件をゆるめに調整する
必要がある。テレビ番組とは違い、一般にユーザがビデオカメラで映像を撮影するときに
は、全く同じ映像を撮影することはほとんどないからである。従って、同じ様な風景や、
同じ服装の人が同程度の大きさで写ったときには、類似シーンとして検索されるように照
合条件を設定する。録画と同時に撮影された画像が解析され、シーン毎のグループ分けと
類似シーン間でのインデックス付けが完了しており、撮影直後に録画画像の編集が可能に
なり、ユーザの使い勝手が向上する。
本発明の一実施例を実行するシステムのブロック図である。 本発明の一実施例を実行する処理のブロック図である。 本発明の一実施例の特徴量抽出方法を示す概略図である。 本発明の一実施例の特徴量照合方法を示す概略図である。 本発明の一実施例の特徴量照合の流れの一例を示す図である。 従来の照合方法の一例を示す概略図である。 本発明の一実施例の照合方法を説明するための概略図である。 本発明の一実施例の照合方法を説明するための概略図である。 本発明の一実施例を実行する処理のブロック図である。 本発明の一実施例のフローチャートである。 本発明の一実施例で使われる特徴量テーブル構造体を示す図である。 本発明の一実施例で使われる候補リスト構造体を示す図である。 本発明の一実施例で使われる候補構造体を示す図である。 本発明の一実施例で使われる検索結果テーブルと検索区間構造体を示す図である。 本発明の一実施例を応用したビデオレコーダシステムの概略図である。 本発明により自己組織化された映像の映像検索時の表示画面例を示す図である。 本発明により自己組織化された映像の映像検索時の表示画面例を示す図である。 本発明により自己組織化された映像の映像検索時の表示画面例を示す図である。 本発明をビデオカメラに適用したときの構成概略図である。
符号の説明
1…ディスプレィ、2…コンピュータ、3…ポインティングデバイス、4…キーボード、
5…ビデオ再生装置、6…ビデオ入力装置、7…放送受信機、12…外部情報記憶装置。

Claims (4)

  1. 映像を逐次フレーム毎に入力する手段と、
    入力したフレーム画像から特徴量を夫々抽出する手段と、
    該抽出された特徴量を比較して、該特徴量の変動が、1の前記抽出された特徴量を基準とした許容値内にある連続するフレーム間の代表特徴量を上記基準とした特徴量から得て、前記代表特徴量を該代表特徴量によって代表される区間長を示す情報とともに逐次記憶する手段と、
    該記憶された代表特徴量と上記入力されたフレーム画像の特徴量との間で逐次照合する手段と、
    当該照合の結果と、上記入力されたフレーム画像の各々において該照合により一致するフレームの区間長を途中経過として記憶しておく手段を有し、該照合手段では照合の途中経過を更新しながら、一致する映像シーンを探索するようにしたことを特徴とする映像検索装置。
  2. 請求項1記載の映像検索装置において、
    前記映像は放送中の番組であることを特徴とする映像検索装置。
  3. 請求項1記載の映像検索装置において、前記探索される映像シーンを分類することを特徴とする映像検索装置。
  4. 画像を入力するカメラと、
    該画像の入力処理部と、
    該カメラから入力された画像を記憶する記憶部と、
    該記憶部に記憶された画像を再生出力する出力処理部と、
    該画像を表示する表示部とを有する画像録画装置において、
    入力された画像の特徴量をフレーム毎に抽出する特徴抽出部と、
    該抽出された特徴をテーブル化して保持するメモリ領域と、
    入力された画像の特徴量と上記テーブル上の特徴量とを照合する処理と、所定の照合条件に合致する特徴量を有するフレーム同士を類似の画像として関連づける処理を制御する制御部と、
    を有することを特徴とするビデオカメラ。
JP2008203715A 2008-08-07 2008-08-07 映像の検索方法および装置 Expired - Lifetime JP4333808B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008203715A JP4333808B2 (ja) 2008-08-07 2008-08-07 映像の検索方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008203715A JP4333808B2 (ja) 2008-08-07 2008-08-07 映像の検索方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006195056A Division JP4197014B2 (ja) 2006-07-18 2006-07-18 映像の検索方法および装置

Publications (2)

Publication Number Publication Date
JP2009022018A true JP2009022018A (ja) 2009-01-29
JP4333808B2 JP4333808B2 (ja) 2009-09-16

Family

ID=40361180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008203715A Expired - Lifetime JP4333808B2 (ja) 2008-08-07 2008-08-07 映像の検索方法および装置

Country Status (1)

Country Link
JP (1) JP4333808B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010246103A (ja) * 2009-04-01 2010-10-28 Nhn Corp 動画重複検出方法およびシステム
JP2010283542A (ja) * 2009-06-03 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> メタデータ検索装置、メタデータ検索方法、メタデータ検索プログラム、及びメタデータ検索システム
US8594437B2 (en) 2010-05-06 2013-11-26 Hitachi, Ltd. Similar picture search apparatus
JP2018064246A (ja) * 2016-10-14 2018-04-19 学校法人立命館 情報記録装置、時刻特定装置、時刻特定システム、及び時刻特定方法
JP2018156344A (ja) * 2017-03-17 2018-10-04 日本放送協会 映像ストリームの一致判定プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010246103A (ja) * 2009-04-01 2010-10-28 Nhn Corp 動画重複検出方法およびシステム
JP2010283542A (ja) * 2009-06-03 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> メタデータ検索装置、メタデータ検索方法、メタデータ検索プログラム、及びメタデータ検索システム
US8594437B2 (en) 2010-05-06 2013-11-26 Hitachi, Ltd. Similar picture search apparatus
JP2018064246A (ja) * 2016-10-14 2018-04-19 学校法人立命館 情報記録装置、時刻特定装置、時刻特定システム、及び時刻特定方法
JP7030316B2 (ja) 2016-10-14 2022-03-07 学校法人立命館 情報記録装置、時刻特定装置、時刻特定システム、及び時刻特定方法
JP2018156344A (ja) * 2017-03-17 2018-10-04 日本放送協会 映像ストリームの一致判定プログラム

Also Published As

Publication number Publication date
JP4333808B2 (ja) 2009-09-16

Similar Documents

Publication Publication Date Title
JP3780623B2 (ja) 動画像の記述方法
JP4197014B2 (ja) 映像の検索方法および装置
JP4652462B2 (ja) メタデータ処理方法
US6370316B1 (en) Apparatus for retrieving and administrating moving pictures and related network system
US7941031B2 (en) Video processing apparatus, IC circuit for video processing apparatus, video processing method, and video processing program
US7487524B2 (en) Method and apparatus for presenting content of images
JP4285512B2 (ja) 記録装置、記録方法、再生装置、再生方法、記録再生装置、記録再生方法、撮像記録装置及び撮像記録方法
JPH07114567A (ja) ビデオの検索方法および装置
JP2006155384A (ja) 映像コメント入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2008005010A (ja) 動画編集方法
CN101431645B (zh) 节目录像再现装置以及节目录像再现方法
JP4333808B2 (ja) 映像の検索方法および装置
CN101547303B (zh) 成像设备、字符信息关联方法、和字符信息关联系统
JP3997882B2 (ja) 映像の検索方法および装置
JP4732418B2 (ja) メタデータ処理方法
JP3936666B2 (ja) 動画像中の代表画像抽出装置,動画像中の代表画像抽出方法,動画像中の代表画像抽出プログラムおよび動画像中の代表画像抽出プログラムの記録媒体
JP6934402B2 (ja) 編集システム
JP3931890B2 (ja) 映像の検索方法および装置
WO2014103374A1 (ja) 情報管理装置、サーバ及び制御方法
TWI497959B (zh) Scene extraction and playback system, method and its recording media
JP4652389B2 (ja) メタデータ処理方法
JP2009124735A (ja) 記録装置、記録方法、再生装置、再生方法、記録再生装置、記録再生方法、撮像記録装置及び撮像記録方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090615

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

EXPY Cancellation because of completion of term