JP2011015109A - 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 - Google Patents

映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 Download PDF

Info

Publication number
JP2011015109A
JP2011015109A JP2009156501A JP2009156501A JP2011015109A JP 2011015109 A JP2011015109 A JP 2011015109A JP 2009156501 A JP2009156501 A JP 2009156501A JP 2009156501 A JP2009156501 A JP 2009156501A JP 2011015109 A JP2011015109 A JP 2011015109A
Authority
JP
Japan
Prior art keywords
data
frame
video content
identification data
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009156501A
Other languages
English (en)
Other versions
JP4467017B1 (ja
Inventor
Katsumi Inoue
克己 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2009156501A priority Critical patent/JP4467017B1/ja
Application granted granted Critical
Publication of JP4467017B1 publication Critical patent/JP4467017B1/ja
Publication of JP2011015109A publication Critical patent/JP2011015109A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】
付加価値の高い映像装置と映像コンテンツとを提供する。
【解決方法】
検索対象範囲内の映像コンテンツの任意のフレームのフレーム位置とその特徴を識別可能なフレーム検索のデータベースであるインデックス列を用いることにより
(1)コマーシャルメッセージフレーム、画像の特徴、音声の特徴、フレーム変化の特徴など様々なフレームの検出をして映像コンテンツの編集を容易にする。
(2)インデックス列に付与された情報により映像コンテンツのそれぞれのフレームに同期連動して映像装置、マルチメディア、外部機器をコントロールする。
(3)インデックス列に文字情報を付与しフレームアノテーションとしてこれを検索し、検出したフレームをランダムアクセスする、またはインデックス列を統計データとして利用する。
【選択図】図1

Description

本発明は、映像コンテンツのフレーム検索用のデータを作成する作成装置、作成したデータによる映像コンテンツのフレーム検出装置、及びフレーム検索用のデータを作成する方法に関し、例えば、放送番組やビデオなどの映像コンテンツの録画、撮影、再生、視聴、編集に係る映像装置に適用されるものである。
近年の一般家庭用録画装置、再生装置はテレビジョン放送のデジタル化を迎え、その映像コンテンツの質は格段に向上しているものの、これらの映像コンテンツを利用する機能は従来のアナログ式磁気テープ録画装置に搭載されている機能とほとんど変わりない。
本願発明の映像コンテンツのフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置の適用装置の一例として、例えば現在一般家庭で利用されているデジタル放送テレビジョン録画装置は著作権保護にもとづきコピー制限はもとより、一定目的以上の編集や加工が出来ない構造となっているため、特定の通信手段を用いて専用の編集装置等に映像コンテンツを移し換えない限り、映像コンテンツの編集から、再生、操作、視聴、のあらゆる部分で装置に搭載されている機能にもとづく利用以外何も出来ない。
例えば映像コンテンツに関するさまざまなフレームの情報(特徴含む)の抽出、検出は、本願に掲示した非特許文献、特許庁のホームページ内の標準技術、さらにはMPEG7のメタデータ技術として、さまざまな分野で研究され、提案されており専門装置への応用は進んでいるものの、一般家庭の映像装置で利用できるまでには普及していない。
一例として録画された映像コンテンツの編集で特に需要の多いコマーシャルメッセージ(以下CMとも表現する)のカット編集においてさえも番組が一旦黒フレームに変化、音声がサラウンドからステレオにモード変化するなどCMへの切り替え部分の画像、音声の特徴を検出するなど、過去から現在まで多くの提案がなされ録画装置、再生装置に搭載されている場合もある。
しかしながら、黒フレームが存在しない場合やCM時の音声モードが変化しない場合も多く、機能は付随していても実際にはほとんど利用できないのが実情である。
また以下に掲示した特許文献1、特開2004−336808号公報の提案の特徴検出方式ならびに多くのフレーム検出の方式はカットの変わり目の照合や特定フレームの照合(検出)で、本願発明の意図する映像コンテンツ上の全てのフレームを対象とした多目的で任意のフレームのフレーム情報、フレーム特徴抽出、これにもとづく検索や検出とは目的や手法が根本的に異なるものである。
さらに以下に掲示した特許文献2、特許第4139145号の発明は動画像検索装置を目的としたもので、その特徴検出方式はフレーム内の色信号のみを対象とし、フレーム前後の相関も情報抽出の対象としていない。
さらに本願発明は録画装置、再生装置の再生に連動させる高速での検索、検出を目的としており、情報抽出の目的や手法が根本的に異なるものである。
特開2004−336808号公報 特許第4139145号
特許庁ホームページ 資料室 標準技術集、ノンリニア編集1−5 オフライン編集システム1−6 オンライン編集システム4−2−1 カット点、シーン・ショット検出 4−2−4 分類、索引、検索方法
その具体的なテーマの第1は、映像装置の編集、操作機能の拡大である。
本願発明の適用装置の一例である、例えばHDD式録画装置やDVD、BD(ブルーレイ ディスク)等のリムーバルディスク式録画装置、再生装置の編集機能および操作機能を大幅に拡大したい。
現在一般家庭で利用されているデジタル放送テレビジョン録画装置は著作権保護にもとづきコピー制限はもとより、一定目的以上の編集や加工が出来ない構造となっており、現在の機能の大半はアナログ時代の機能と50歩100歩である。
例えば記憶録画された映像コンテンツそのものを加工、編集することなく、映像コンテンツから得られる信号またはデータを利用し、例えば、検索条件で指定する同一のフレームやカット点などの特定フレームを自動的に検出させたい。
これらの編集結果にもとづき複数の映像コンテンツより幾つかのハイライトシーンを効率よく選び出し、ハイライトシーンのみを連続して再生または早送りしながら視聴するなど、映像装置自身または映像装置と映像装置を操作する装置に高度な操作機能を持たせたい。
パソコン等を編集装置とすることによって、映像装置から送られる再生フレーム信号、データまたは専用信号、データで映像コンテンツの再生フレーム位置を認識し、これまでボタン式リモコンでは出来なかった目的のフレームで止める、目的のフレームにジャンプさせるなど高度な操作を可能とさせたい。
以上のようにパソコン等を編集装置とすることによってボタン式リモコンでは苦手であった文字入力を伴う編集機能など新しい編集機能と、その編集結果にもとづく映像コンテンツの再生、視聴を可能にさせたい。
現在一般家庭で利用されている録画装置や再生装置はもとより、今後新しく開発される録画装置、再生装置に直接組み込み利用することにより、編集機能および操作機能において付加価値の高い製品の実現を可能にさせたい。
その具体的なテーマの第2は、映像装置に映像コンテンツのフレームに連動した制御機能の追加である。
例えば上記同様の装置で映画番組を視る時、監督、出演者の詳細情報、クラシック音楽であれば演奏曲、その作曲家や演奏家の詳細情報、紀行番組であれば地域や関連歴史情報、スポーツ番組であれば出場する選手やチームのデータ、写真などその映像コンテンツの任意のフレームで、当該フレームに連動して、これらのインターネット情報を連動し閲覧させたい。
インターネット情報以外でも、対象とする任意のシーン(フレーム)に編集情報やコメントを含むマルチマディアの情報を自由に付与し映像コンテンツの再生にこれらを連動させたい。
例えば映像コンテンツを初回視聴時に、キーとなる任意のフレームに関連するマルチメディア情報、文字情報、画像情報、音声情報、インターネット情報を貼り付けしておき、映像コンテンツの再生に連動してこれらの情報が得られるようにしておけば、次回同一映像コンテンツを視聴する際、極めて便利である、利用者は必要な時間関連する情報を閲覧、視聴し、またもとの映像コンテンツに戻るなど、より高度な映像コンテンツの楽しみ方が可能になる。
例えばホームシアタなどの高度な視聴環境で映画を鑑賞する際、映像コンテンツの特定のフレームに連動して、例えば視聴環境の照明、フラッシュ、音声などの起動、停止、調整、操作等の制御をしたいなどの潜在ニーズにも対応したい。
家庭内の利用にとどまらずこれらの機能で映像コンテンツを教育として利用する場合や映像コンテンツをビジネスとする産業に映像コンテンツの新しい利用方法を与えたい。
さらには放送番組、通信番組、リムーバルメディアの映像コンテンツ事業者そのもの映像コンテンツの利用方法を含め、映像コンテンツのそれぞれのフレームとさまざまな情報、さまざまな機器との連動による映像コンテンツ自体の利用方法を拡大したい。
上記1、2のテーマの技術要素はタイムコードを利用出来ない装置相互の映像コンテンツの全フレームを対象としたフレーム検索とフレーム連動技術であり、映像装置本体自体での映像コンテンツのフレーム検索はもとより、例えばこれに連携する遠隔操作装置や遠隔編集装置などの外部装置で映像装置本体の映像コンテンツのフレームの位置情報や特徴情報の検索を可能にさせたり、さらには映像装置本体が再生しているフレームの位置(時刻)を映像装置本体以外の装置が識別検出可能にさせたりするような、映像装置本体と外部装置が共通で多目的に利用可能なフレームに連動したフレーム検出技術が確立されていないことにある。
上記1、2のテーマを共通に解決する有効な手段の一つは、装置本体と他の装置とが共通に利用出来るコンパクトなデータサイズで識別能力の高い映像コンテンツの1フレームごとのデータを対象としたデータベースの作成手段と、これを検索することにより装置および映像コンテンツ双方の編集性、操作性、視聴性を向上させるに必要十分となり得る多目的で、高精度、高速度の、映像コンテンツのフレーム検出手段と、の開発でありこれを用いた映像コンテンツのフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置の提供である。
上記映像コンテンツのデータベースの技術ポイントはフェードイン、フェードアウトに代表されるディゾルブカットやワイプカット編集で、シーンの切れ目(カット)がはっきりしない場合が多いことや、静止画ではないが、画面変化が著しく遅かったり、画面のごく一部しか変化がない連続したフレームが発生する場合があったり、短時間であるが静止画状態になる場合がある、さらには番組開始直後や終了直前のフレームなどでは短時間であるが無音声で静止画状態が続く場合があるなど、冗長で長大な映像フレームであっても全てのフレームを対象とし、それぞれのフレームを検索対象範囲内で、データ同士の重複がないデータとして識別可能なよう、データまたは特徴を抽出する方法を確立するとともに、多目的で、高速で、高精度なフレーム検索用データとするために、特徴抽出したデータのデータ出現確率を統計確率的手法で判定し最適なフレーム検索用データとするための、フレーム検索用データの作成方法を確立することが不可欠である。
以上のような適用例の映像装置本体と他の外部装置(他の映像装置含む)が以上のデータベースを共通に利用出来ればデータベースのさまざまな利用、応用により装置自体の付加価値も大幅に向上し、映像装置本体内の映像コンテンツの利用の幅と利用価値は格段と拡大される。
上記課題をクリアする映像コンテンツの編集、操作、再生、視聴のあらゆる用途にこの技術を利用した映像コンテンツのフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置及びフレーム検索用データ作成方法の提供である。
また本願発明の主要適用装置である家庭用汎用録画装置、再生装置に広く応用し実現可能なコストを目指すには、特別な装置、部品、組立技術を用いることなく、現在市場に広く流通している装置、部品、組立て技術で実現可能な映像コンテンツのフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置及びフレーム検索用データ作成方法の提供である。
以上の課題を解決するために
請求項1では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の互いのフレーム同士のデータの重複を避け、映像コンテンツ上の任意の1フレームのデータを固有のデータとするよう上記要素データを複数連結し組合せして構成される映像コンテンツの1フレーム当たりの識別データを作成する識別データ作成部と、
この1フレーム当たりの識別データに必要とするデータ検索のための情報を付与し識別データ作成の元になる映像コンテンツの全てのフレームと時系列上相互対照なデータ列として記憶登録し1映像コンテンツ当たりのフレーム検索用のインデックス列を構成するインデックス列登録部と、
を具備することを特徴とする。
請求項2では、
前記インデックス列登録部は、前記インデックス列に映像コンテンツのタイトル情報を付与し、複数のインデックス列を対象としたデータベースとすることを特徴とする。
請求項3では、
前記識別データ作成部は、前記識別データに使用されている全ての前記要素データの量子化ビットのデコードデータであるそれぞれの量子化データの出現頻度と、全ての要素データ同士の出現相関度と、を測定し検索対象範囲内の識別データのデータ同士の最悪の場合の重複の確率である最悪出現確率を1000億分の1以下とするように構成された識別データとすること特徴とする。
請求項4では、
(1)前記音声が利用できる映像コンテンツの場合は静止画で無音声、前記音声が利用できない映像コンテンツの場合は静止画、となることにより発生する前記識別データが重複データとなる区間
(2)コマーシャルメッセージフレームと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、の繰り返し送出されるフレームにより発生する前記識別データの一定区間同士が重複データとなる区間
(3)複製された映像コンテンツにより発生する前記識別データの一定区間同士が完全に同一で重複データとなる区間
(4)偶発的に類似する他のフレームを同一データとして抽出することにより発生する前記識別データが重複データとなるフレーム
以上(1)から(4)のいずれかの要因で識別データのデータが重複するフレームの双方の上記識別データにそれぞれの要因ごとに、重複を回避するための情報を付与する重複データ判定部を更に具備することを特徴とする。
請求項5では、
前記識別データ作成部は、前記要素データの全てまたは一部を、音声が利用できる映像コンテンツの場合は画像特徴情報と音声特徴情報、音声が利用できない映像コンテンツの場合は画像特徴情報、のいずれかの前記フレーム情報から抽出される特徴情報を特徴要素データとして抽出し組合せ構成した前記識別データとすることを特徴とする。
請求項6では、
前記識別データ作成部は、
(1)コンポジット信号(Y/C混合)と、S映像信号(Y/C分離)、コンポーネント映像信号(Y/Cb/Cr)と、D端子信号(Y/Pb/Pr)と、のいずれかのアナログ画像信号
(2)ステレオ信号と、マルチチャンネル信号と、のいずれかのアナログ音声信号
(3)IEEE1394またはHDMI(ハイ-デフィニション マルチメディア インタフェース)のデジタル信号
(4)識別データ専用のデータまたは信号
以上(1)から(4)のいずれかの信号またはデータを前記フレーム情報とし映像コンテンツの再生(オンライン)に合わせ連続して前記識別データを作成することを特徴とする。
請求項7では、
前記識別データ作成部は、
映像コンテンツを記憶した記憶媒体またはリムーバル記憶媒体として搭載された記憶媒体上の映像コンテンツのフレーム圧縮データをもとにしたデータを前記フレーム情報とし非再生(オフライン)で前記識別データを作成することを特徴とする。
請求項8では、
請求項6または請求項7により作成完了した前記インデックス列を、
(1)他の装置から共有ファイルとしてデータの供給を受ける
(2)他の装置から通信手段によりデータの供給を受ける
(3)他の装置からメモリ媒体によるデータ交換手段によりデータの供給を受ける
(4)映像コンテンツ事業者により放送電波または通信回線を通じてデータの供給を受ける
(5)映像コンテンツ事業者により映像コンテンツと同一のリムーバル記憶媒体に記憶されたデータの供給を受ける
以上(1)から(5)記載のいずれかのデータ受給手段である完成されたインデックス列の受給部を更に具備することを特徴とする。
請求項9では、
前記識別データ作成部は、アナログ信号より抽出した前記要素データの場合、当該要素データの最少1bitのみをアナログ誤差吸収のためのデータとする要素データで構成される前記識別データとすることを特徴とする。
請求項10では、
前記識別データ作成部は、前記識別データと、識別データ作成の元になる映像コンテンツのタイムコードデータと、を併用した前記インデックス列とすることを特徴とする。
請求項11では、
前記識別データ作成部は、フレームごとまたは特定の区間ごとに前記要素データの組合せの構成を変化させるように構成される前記識別データによる前記インデックス列とすることを特徴とする。
請求項12では、
前記識別データ作成部は、前記識別データに、他の認識手段から得られる認識情報を付与した前記インデックス列とすることを特徴とする。
請求項13では、
前記識別データ作成部は、前記識別データを一定の割合で間引きして作成された前記インデックス列とすることを特徴とする。
請求項14では、
前記識別データ作成部は、前記インデックス列を、画像における前記フレーム情報のフレーム間変化をもとにして、同一データの範囲をRUNレングス係数、LEVEL係数を用いて圧縮し、検索時はデータを解凍したインデックス列とすることを特徴とする。
請求項15では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成される映像コンテンツの1フレーム当たりの一時データとしての識別データの作成手段を特徴とする。
請求項16では、
請求項1記載の映像コンテンツのフレーム検索用データ作成装置に、
前記インデックス列を検索するための、検索条件データを設定する検索条件設定部と、この検索条件にもとづきインデックス列を検索するインデックス列検索部と、この検索により検索条件データに適合する前記識別データのフレームを検出する識別データ検出部と、を更に具備させることを特徴とする。
請求項17では、
前記検索条件設定部に、検索目的のフレームの前記識別データを検索条件データとして設定して、前記インデックス列を前記インデックス列検索部により検索することにより、検索条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項18では、
前記検索条件設定部に、フレームの特徴検出のためのデータを検索条件データとして設定して、請求項5記載のインデックス列をインデックス列検索部により検索することにより、特徴検出条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項19では、
前記元になる映像コンテンツの任意のフレーム位置を指定し、請求項5記載のインデックス列を前記識別データ検出部で検出することにより、当該フレームの特徴を検出することを特徴とする。
請求項20では、
対象とする前記インデックス列を事前に用意し、このインデックス列の前記識別データ作成の元になる映像コンテンツを再生する際、再生されるフレームから得られる識別データを前記検索条件設定部の検索条件データとし、上記事前に用意されたインデックス列をインデックス列検索部によって検索し、同一データとなる上記映像コンテンツのフレーム位置を識別データ検出部で検出し、
以降の連続して再生されるフレームから得られる識別データは上記インデックス列上の該当するフレーム位置の識別データを前記識別データ検出部で読み取りし、同一データであることを確認することによって、
上記識別データ作成の元になる映像コンテンツの再生フレームのフレーム位置を連続検出することを特徴とする。
請求項21では、
前記インデックス列上の任意のフレームを指定して上記元になる映像コンテンツの任意のフレームをアクセスし、再生されるフレームの識別データを識別データ検出部で連続検出する映像コンテンツアクセス部を更に具備することを特徴とする。
請求項22では、
前記データベースの検索補助データとして、前記識別データを構成する少なくとも1つの前記要素データの量子化データの組合せで構成される量子化データのグループごとに識別データを記憶登録した、要素データの量子化データのグループ別の識別データの検索を併用して映像コンテンツのフレームを検索し検出をする検索補助データ部を更に具備することを特徴とする。
請求項23では、
前記インデックス列検索部は、前記データベース内の1つの前記インデックス列上の複数のフレーム位置の前記識別データを対にしてグループ化した複数フレーム条件を前記指定する検索条件として、同一または他の映像コンテンツのインデックス列を検索しフレームを検出することを特徴とする。
請求項24では、
請求項20記載のフレーム検出装置において、予め前記データベース内の対象とする前記インデックス列の目的とするフレームの前記識別データに映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御するための情報を付与しておき、
前記識別データ作成の元になる映像コンテンツを再生の際、この映像コンテンツの再生に連動し、上記インデックス列を連続検出し、映像装置と、マルチメディア機器と、外部機器と、を連動制御するための情報を検出し、
上記識別データ作成の元になる映像コンテンツの再生フレームに連動して上記、映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御する連動制御部を更に具備することを特徴とする。
請求項25では、
前記データベース内の前記インデックス列がテレビジョン放送番組による映像コンテンツから作成された場合、
前記繰り返し送出される、コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、における前記フレーム識別データの一定区間同士が同一データとなるフレーム検出結果を利用して、
番組局情報、タイトル情報、放送される時刻情報、その期間、繰り返し回数、のいずれかをもとにして、
コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、のいずれかであることを自動判定する繰返しフレーム自動判定部を更に具備することを特徴とする。
請求項26では、
前記データベース内の前記インデックス列が、
前記複製された映像コンテンツと複製した映像コンテンツの互いの識別データが完全に同一データとなるフレーム検出結果を利用して、
映像コンテンツの複製を検出する複製判定部を更に具備することを特徴とする。
請求項27では、
請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置をチャプタマークとするチャプタマーク作成部を更に具備することを特徴とする。
請求項28では、
請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置を時系列表示する検出フレーム時系列表示部を更に具備することを特徴とする。
請求項29では、
請求項5記載の識別データによって作成されたインデックス列に前記識別データ作成の元になる映像コンテンツの任意の1フレームを対象とした、映像コンテンツのフレームのアノテーション情報を付与する手段により付与されたアノテーション情報の検索をするフレームアノテーション検索部と、検出されたフレームのアノテーション情報から映像コンテンツのフレームをアクセスする、フレームアノテーションアクセス部を更に具備することを特徴とする。
請求項30では、
請求項5記載の識別データによって作成されたインデックス列をもとにして
(1)特定シーンの出現回数と、出現時間と、出現比率と、の少なくとも1つ
(2)映像コンテンツの、画像の特徴と、音声の特徴と、変化の特徴と、の少なくとも1つ
以上(1)または(2)いずれかのフレームを前記インデックス列検索部と、前記識別データ検出部で検出し、これを統計データとし使用する統計データ利用部を更に具備することを特徴とする。
請求項31では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成されるフレーム検索のためのデータである映像コンテンツの1フレーム当たりの識別データの、
それぞれの上記要素データの、それぞれの前記量子化データの出現頻度を測定することにより1要素データ当たりのビット数としての平均出現確率ならびに識別データ全体の要素データのビット数としての平均出現確率を判定し、この結果にもとづき適正な要素データのビット数の識別データの作成をすることを特徴とする。
請求項32では、
前記フレーム情報より前記要素データを採取する際のビット数を、実際に前記識別データの要素データとするビット数より多くし、請求項31記載の要素データのそれぞれの前記量子化データの出現頻度を測定することにより、上記要素データを採取した量子化データの出現頻度を均等化して識別データの要素データとすることを特徴とする。
請求項33では、
請求項31記載の識別データを構成する要素データを2組選択し互いの出現相関度を求める手法で、構成される要素データの全ての組合せについての出現相関度を測定することにより上記識別データの組合せ数としての平均出現確率を判定し、この結果にもとづき適正な要素データの組合せ数の識別データの作成をすることを特徴とする。
請求項34では、
請求項31記載の識別データ全体の要素データのビット数としての平均出現確率と、請求項33記載の識別データの組合せ数としての平均出現確率と、
の双方により上記識別データの総合平均出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。
請求項35では、
前記識別データを構成する全ての前記要素データの量子化データの最も出現頻度の高い量子化データによる前記出現頻度の測定と、この量子化データ同士の前記相関度の測定と、の双方により識別データの最悪出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。
本願発明の映像コンテンツのフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置、及びこれに使用される映像コンテンツのフレーム検索用データであるデータベース、識別データ、インデックス列は映像コンテンツの編集、再生、録画、撮影などのさまざまな場面と様々な映像装置に多目的に利用することが可能である。
これらの技術を一貫して利用することにより低コストで付加価値の高い製品の実現と、これらの技術の積み重ねにより、新しい形態の映像コンテンツの利用技術さらには新しい形態の放送番組、通信番組、やDVD、BD等リムーバルメディア等の映像コンテンツが生まれることが期待できる。
図1はデータベースの構成とその利用例の説明図である 図2は映像装置の構成例の説明図である 図3は映像装置ならびに関連機器とデータベースの利用例の説明図である 図4は映像コンテンツとメタデータの関係を示した説明図である(実施例1) 図5は識別データの構成例を示した説明図である(実施例2) 図6は音声あり/なしの識別データを示した説明図である(実施例3) 図7はアナログ信号をもとにした本願発明の実施例である(実施例4) 図8は識別データ抽出部の説明図である(実施例5) 図9は量子化ビット数利用率判定を示した説明図である(実施例6) 図10は量子化データの出現頻度均等化を示した説明図である(実施例7) 図11は要素データ相関度判定を示した説明図である(実施例8) 図12は最悪識別能力指数判定を示した説明図である(実施例9) 図13は連続重複データ判定部の説明図である(実施例10) 図14は連続外重複データ判定部の説明図である(実施例11) 図15は検索用インデックス列のメモリ配列の説明図である(実施例12) 図16はインデックス列検索部、識別データ検出部の説明図である(実施例13) 図17は同一フレームの検出概要を示した説明図である(実施例14) 図18は同一フレーム検出部の説明図である(実施例15) 図19はフレーム特徴データ設定部の説明図である(実施例16) 図20はフレーム特徴検索の場合のインデックス列検索部、識別データ検出部の説明図である(実施例17) 図21は再生高度化支援装置ならびに次世代映像装置の説明図である(実施例18) 図22は連続フレーム検出の説明図である(実施例19) 図23は再生高度化支援装置の操作画面の説明図である(実施例20) 図24は録画装置、再生装置動作時間概要を示した説明図である(実施例21) 図25は録画装置応答時間実測試験を示した説明図である(実施例22) 図26は目的フレームサーチ概要を示した説明図である(実施例23) 図27は複数映像コンテンツにまたがるランダムアクセスの概要を示した説明図である(実施例24) 図28は映像コンテンツフレームアノテーションを示した説明図である(実施例25) 図29はデジタルデータによる要素データの抽出例を示した説明図である(実施例26) 図30はインデックス列のバリエーションを示した説明図である(実施例27) 図31はインデックス列の圧縮例を示した説明図である(実施例28)
本願発明の映像コンテンツとは、標準テレビジョン方式をもとにする放送番組、CATV番組、ビデオオンデマンド番組などの通信番組、DVDディスク、BDディスク、半導体メモリなどの記憶媒体に録画されたビデオコンテンツ、ビデオカメラで撮られたビデオ、ならびに映像コンテンツサーバ、パーソナルコンピュータ(以降パソコン)、インターネットウエブ上に展開される動画像の総称である。
通常映像コンテンツは画像と音声の双方が一体となっているが、例えばソースコンテンツのように画像、音声が分離されて画像だけのもの、インターネットの動画像などで画像だけのものある、従がって本願発明では画像に音声が伴う映像コンテンツと、画像に音声が伴わない双方の映像コンテンツを、音声が利用できる映像コンテンツと音声が利用できない映像コンテンツとして、その双方を対象としている。
以降の説明では、本願発明の映像コンテンツのフレーム検索用データ作成装置は単にフレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出装置は単にフレーム検出装置として説明される。
また以上のフレーム検索用データ作成装置、フレーム検出装置は、映像装置本体(映像コンテンツを記憶またはリムーバル記憶媒体として搭載した映像装置)、連携映像装置(映像装置本体に連携する映像装置)のいずれかに適用され、これにもとづき説明される、この詳細は後述する。
記憶媒体とは、DVD、BD、カードメモリ、USBメモリ等のリムーバルメディア、半導体メモリ、HDDディスク等の固定メディアの総称である。
フレーム情報とは当該フレームの画像情報および音声情報(なしの場合もある)であり、画像情報とはアナログ系としての画像信号と、デジタル系の画像データと、の総称、音声情報とはアナログ系として音声信号と、デジタル系の音声データと、の総称である。
フレーム位置とはタイムコードなどの時刻情報で、映像コンテンツの開始から終了までのフレームの時刻または順序を意味し、一定範囲のフレーム区間も含まれる。
デジタル系の画像データ、音声データは原信号を圧縮したデータとなっており、これらを特徴情報として利用するためには、通常データの伸張(デーコード)が必要である。
これに対しアナログ系をもとにする画像信号、音声信号(デジタル系の圧縮データを伸張したものを含む)はその信号そのものが特徴情報であるためフレームの特徴を抽出するのに都合がよい。
従がって本願発明ではアナログ系の画像信号、音声信号を中心に説明するが、後述するようにデジタルデータを伸張することなく、画像、音声のデジタルデータの一部を利用して、これをフレーム識別のためのデータとして利用することも可能である。
図1(データベースの構成とその利用例)は映像装置にフレーム検索用データ作成装置、フレーム検出装置を適用したもので、この本願発明の趣旨とその概念を説明するものである。
映像コンテンツ1を記憶またはリムーバル記憶媒体として搭載した映像装置(以下映像装置本体42とする)の記憶媒体19にタイトル情報5ごとに記憶された映像コンテンツ1のフレーム情報をもとに、映像コンテンツの1フレームごとに、映像コンテンツ上の任意の1フレームが固有のデータとなるよう構成された映像コンテンツのフレーム検索のための識別データ10を、元になる映像コンテンツのそれぞれのフレームと時系列上相互対照にデータ列として、前記映像装置本体42自身または、この映像装置本体に連携する装置(以下連携映像装置43とする)のいずれかの記憶媒体19に記憶登録されたインデックス列12、またはインデックス列の集合体であるデータベース18を指定する検索条件30で検索54することにより、さまざまな目的の映像コンテンツ1上の目的のフレームを検出55するものである。
図のAの同一フレームの検出25は、映像コンテンツ上の任意の1フレーム(図ではCの映像コンテンツの1フレーム)を指定することによって、指定されたフレームの識別データ10をもとに、前記記憶登録されたデータベース18の検索54を行い、同一データとなるフレーム位置または区間6を検出55するものであり(図では3個所の同一フレーム検出)この検出結果は映像コンテンツそのもののフレーム位置、フレーム区間、その時間や時刻の検出結果と等価(以下同様)であることを意味しており、本願発明の重要なポイントである。
図のBの連続フレームの検出26は、映像コンテンツの再生(図ではCの映像コンテンツ)の際に出力されるフレーム情報を先に説明の記憶登録時の識別データと同一手法で再抽出した識別データを指定する検索条件として上記データベース内の検索目的のデータ列(図ではCのインデックス列)を検索して映像コンテンツの再生されているフレームのフレーム位置、フレーム区間、その時間や時刻の検出を連続ですることを意味している。
図のCのフレーム特徴の検出27では上記データベースの識別データを、映像コンテンツのフレームの特徴を元にした識別データとした場合で、指定する検索条件の検索データでデータベース内の映像コンテンツの指定された検索条件のフレームのフレーム位置、フレーム区間、その時間や時刻の検出をすることを意味している。
図のDの指定フレームの検出28では前記元になる映像コンテンツの任意のフレームを直接指定し、当該フレームの特徴等を検出することを意味している。
図のEのその他の利用29は、このようなデータ構造のインデックス列12そのものをアノテーションデータ、統計データとして利用することを意味している。
ここで更に重要なポイントは、これらのインデックス列12と集合体のデータベース18は先の映像装置本体42内部で利用するのみならず、先の説明の連携映像装置43においても利用可能であって、映像コンテンツ1をもたない外部の映像装置で、映像装置本体42と連携をとり映像装置本体42と同様に映像コンテンツに関連するさまざまな制御、操作、編集を可能にすることを意味している。
また著作権や映像コンテンツの規格に係るような映像コンテンツ1そのものにデータを付与する、加工する、タイムコード4を使用する必要もなく、通常上記映像装置本体42から出力されるアナログまたはデジタル信号またはデータを利用し、上記フレーム検索のための識別データ10ならびにインデックス列12を作成し利用することが出来るので、現行市場の映像装置に簡単なアダプタ装置を取り付けする方式の利用の形態や、映像装置本体に取り込み次世代向けの映像装置41とするなどさまざまな利用方法がある。
図2(映像装置の構成例)は映像装置41にフレーム検索用データ作成装置、フレーム検出装置を適用した場合の主要手段を一覧化したものである。
言うまでもなく映像装置41がこれを全て具備する必要はなく、またその他の手段を具備することも自由であり装置の目的に応じ必要な手段を採用すればよいが、本願発明の意図を明確にするためにその全貌を先に示す。
図の上部がフレーム検索用データ作成装置、図の下部がフレーム検出装置に相当する。
映像装置41は映像装置内にある映像コンテンツ1から識別データ作成部50である、再生信号またはデータよりの識別データ作成部87または非再生データよりの識別データ作成部88のいずれかで識別データ10を作成する。
一方映像コンテンツが外部の映像装置にある場合には先に述べた再生信号またはデータよりの識別データ作成部87または非再生データよりの識別データ作成部88で識別データ10を作成する。
以上で作成された識別データ10はインデックス列登録部56を経由してインデックス列12として記憶登録される。
以上は後述するように他の映像装置のアダプタ90として構成し利用することも可能である。
これらのインデックス列12の集合体がデータベース18である。
また図に示すように識別データ作成部50では応用形態としてさまざまな形態の識別データ10ならびにインデックス列12が作成される。
また映像装置41は上記の方法で作成し完成された他の映像装置などのインデックス列12を、完成されたインデックス列の受給部89でインデックス列12を受け取り、インデックス列登録部56を経由してデータベース18に記憶登録することも可能である。
データベース18には検索補助データ部91が重複データ判定部39として併設されている。
以上がフレーム検索用データ作成装置の基本構成とこれに関連する手段の全貌である。
このようなデータベース18を検索条件設定部30で検索条件を指定しインデックス列検索部54により検索することにより目的の映像コンテンツのフレームが識別データ検出部55で検出される。
この検索条件は図1で示したAからDまでの検出内容にもとづき設定されるもので特定条件設定部57では特定の条件の設定や、フレームの特徴の検出や指定フレームの検出が行われる。
以上の映像コンテンツのフレーム検出結果は以下の手段によりさまざまな利用形態で活用される。
(1)連動制御部92
予めインデックス列の目的とするフレームに装置、機器を連動するための情報を付与しておき、当該映像コンテンツの再生の際、検出された識別データに付与された連動情報をもとに、映像装置41、マルチメディア機器44、外部機器45、との連動制御を行う。
以上は先に説明の本願発明が解決しようとする課題の具体的テーマ2に相当する。
(2)繰返しフレーム自動判定部93
CM、連続放送の定形フレームを放送局情報、タイトル情報、放送される時刻情報、その期間、繰返し回数をもとに、これらを自動判定する。
(3)複製判定部94
複製した映像コンテンツと複製された映像コンテンツのインデックス列が完全に同一データであることにより、複製コンテンツを検出する
(4)チャプタマーク作成部95
検出されたフレームをチャプタマークとする。
(5)検出フレーム時系列表示部96
検出されたフレームを時系列表示する。
(6)フレームアノテーション検索部97
フレームアノテーション情報としてインデックス列に文字情報を付加しこれを検索する。
(7)フレームアノテーションアクセス部98
検索されたアノテーションフレームをもとに映像コンテンツをランダムアクセスする。
(8)統計データ利用部99
インデックス列を統計データとして利用する。
以上(2)から(8)は先に説明の本願発明が解決しようとする課題の具体的テーマ1に相当する。
また映像コンテンツと相互対照なインデックス列上の任意のフレームを指定することにより映像コンテンツそのものの指定されたフレームをアクセスする映像コンテンツアクセス部86を備えている。
この部分がフレーム検出装置の基本構成とこれに関連する手段の全貌である。
以上が本願発明の全体の主要手段の概要でありこれについての詳細は後述する。
図3(映像装置ならびに関連機器とデータベースの利用例)は図1のAからEの具体的な検索対象と本願発明のフレーム検索用データ作成装置、フレーム検出装置を適用可能な映像装置ならびに関連機器をまとめたものである。
映像装置本体42は映像コンテンツを記憶またはリムーバル記憶媒体として搭載した映像装置であり具体的には、映像コンテンツを録画して再生する録画装置(レコーダ)、映像コンテンツを再生する再生装置(プレーヤ)、映像コンテンツを検索し再生する検索装置、映像コンテンツを編集して再生する編集装置、映像を撮影して再生するビデオカメラ、映像を用いた専門機器、映像を用いたゲーム機器、ならびに映像コンテンツを録画して再生する、処理機能を持つコンピュータ、パソコンなどの単体装置または複合された装置の総称であり、連携映像装置43は上記映像装置本体に連携する映像装置で具体的には、テレビジョン、ディスプレイ、スタジオ装置等、映像コンテンツサーバ、遠隔操作装置、遠隔編集装置等、と本願発明の識別データを作成しインデックス列を登録する手段を有する映像装置用アダプタの総称である。
単に映像装置41と表現する場合は上記映像装置本体42と連携映像装置43の双方の総称である。
以上の映像装置41のいずれにも本願発明のフレーム検索用データ作成装置、フレーム検出装置を単独または一体にして適用可能である。
またマルチメディア機器44は映像装置41に接続されるインターネット、画像、文字情報、音声などを出力可能な機器で、コンピュータ(パソコン含む)もこの対象である。
外部機器45は映像装置41に接続される、照明、フラッシュ、カメラ、ビデオカメラなどの総称である。
また縦軸のAからEは先の図1の説明の分類による具体例である。
A(同一フレームの検出25)はデータベース内の同一フレームの検出をはじめ、前記繰り返し送出される、コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、さらには複製された映像コンテンツ、の検出
であり映像装置全般に利用可能である、特にインテリジェントなテレビジョンにこの技術を利用することによりCM期間中は他の番組に切り替えする等の応用が可能になる。
またコンテンツサーバ内等での複製されたコンテンツの検索にも有効である。
B(連続フレームの検出26)は映像コンテンツの再生フレームから得られる識別データを連続して検出することにより、映像コンテンツの再生フレームの検出(連続フレーム検出)と、映像コンテンツの再生フレームに連動した制御(連動制御)と、は映像装置41に接続される、マルチメディア機器44、外部機器45などあらゆる装置、機器と映像コンテンツの特定のフレームの連動を可能にするもので利用形態が極めて広い。
特にインターネット情報47や文字情報46を連動させることにより、映像コンテンツとマルチマディアを融合させることが可能になる。
C(フレーム特徴の検出27)およびD(指定したフレームの検出)は検出したフレームの特徴をもとにした、特徴フレームの時系列表示、検出したフレームのチャプタマーク化、検出したフレームによる各種編集、は特に映像コンテンツの編集用に利用されるものであり遠隔操作装置や、遠隔編集装置に特に有効である。
E(その他の利用28)はインデックス列を映像コンテンツのフレームアノテーション、 または統計データとして利用するものであり、編集装置はもとより、映像を用いた専門機器、ゲーム機器等に有効である。
また識別データを作成しインデックス列を登録する手段を有する映像装置用アダプタ90は、映像装置本体、特にパソコンのアダプタとして装着することによって様々な応用が可能である。
これらの詳細な内容は後述される。
図4(映像コンテンツとメタデータの関係)は以上の本願発明の代表的実施例を示したものであり、映像コンテンツとこれに付随する映像コンテンツのメタデータの関係を現したものである。
図のAは映像コンテンツの基本構成を示すものであり、映像コンテンツ1はフレーム単位で記憶媒体19のフレームアドレス33に、フレーム2ごとに、そのタイムコード4などの時間情報3と映像コンテンツフレームデータ34が記憶され1つの映像コンテンツ1が構成されている。
図のBはこの映像コンテンツ1の各フレーム2ごとにメタデータ36を直接与える場合であるが、この場合、チャプタマークなど、映像コンテンツの規格の範囲のメタデータ36に限定される。
図のCは映像コンテンツ1とは独立してメタデータ36をもつ場合であり、映像コンテンツの再生に合わせタイムコード4を仲介コードとすることによりそれぞれのフレーム同士を相互参照可能としている。
映像装置の内部にこのメタデータ36を置く場合、映像コンテンツ1の規格に関係なく構成することが出来るためよく利用されるが、メタデータ36が外部装置にある場合には、映像装置よりタイムコード4を外部装置に送信する必要がある。
図のDは映像装置に記憶された映像コンテンツ1と外部装置のメタデータ36のように互いにタイムコード4など時間情報3が利用出来ない映像コンテンツ1に映像コンテンツ1と独立したメタデータ36をもたせる方法として、映像コンテンツの任意の1フレームの固有のフレーム情報から、映像コンテンツの任意の1フレームを固有のフレームとして識別するための、識別データ10を抽出して、この識別データ10を、識別データ作成の元になる映像コンテンツのそれぞれのフレームとフレーム位置が相互参照可能なように記憶登録した、映像コンテンツのそれぞれのフレーム検索用のデータベースであるインデックス列12にメタデータ36を付与する場合である。
各フレーム2を固有のデータとして識別することが可能であれば、識別データ作成の元になる映像コンテンツ1の任意の1フレームはメタデータ36の任意の1フレームと相互参照可能である。
従がって、インデックス列12を検索し、目的とする識別データ10を検出することにより、映像コンテンツ上の当該フレームおよびその区間を特定可能であり、インデックス列12に付与されたメタデータ36を利用することが出来る。
またインデックス列12上で指定するフレームから映像コンテンツの当該フレームをアクセスすることも可能となる。
各フレーム固有のデータで構成された、フレーム検索のデータベースであるインデックス列12を利用することにより、さまざまフレームの検出とこれによる高度な編集と、メタデータの活用がさまざまな場面で可能となる。
インデックス列12の具体的な作成方法は後述するが概要を示すと、
映像コンテンツのそれぞれのフレーム情報から抽出される情報単位ごとのデータである要素データ7を、データベース内のフレームのデータ同士が重複する確率を下げるよう上記要素データを複数連結し組合せすることにより、上記1フレーム当たりのデータを映像コンテンツの任意の1フレームが固有のデータとなるよう構成しこれを識別データ10とし、
組合せだけでは識別データのデータ同士の重複が避けられないフレームの識別データ10にはその要因別に重複を回避するための情報およびデータベースとしてデータの検索に必要な情報を付与し、
この識別データ10を、識別データ作成の元になる映像コンテンツ別に、元になる映像コンテンツの全てのフレームと、記憶媒体19のアドレス配列を連続するか、時刻情報3、連番情報など、元になる映像コンテンツのタイムコード4に相当するフレーム位置データ35を付与することにより時系列上相互対照なデータ列として記憶登録して、これを1映像コンテンツ当たりのフレーム検索用データベースのインデックス列12としている。
これによりインデックス列12は、識別データ10作成の元になる映像コンテンツ1の任意の1フレームを相互参照可能にするとともに、検索対象範囲内の単一または複数のこのインデックス列12を目的とするフレームの識別データ10を検索条件として検索することにより、検索条件に適合する映像コンテンツのフレームのフレーム位置もしくはフレーム区間6を検出することを可能にしている。
また映像コンテンツのそれぞれのフレームの特徴をもとにしたフレーム情報から要素データ7を抽出したものとすることにより、このインデックス列12を検索条件を指定して検索することにより、要素データ7ごとの検索条件に適合する、画像の特徴と、音声の特徴と、画像の変化の特徴と、音声の変化の特徴と、のフレームの特徴による、そのフレーム位置もしくはフレーム区間6の検出をすることも可能である。
逆に映像コンテンツの任意のフレームを指定することにより、そのフレームの特徴を検出することも可能である。
さらにこの識別データ10、インデックス列12の識別能力を判定し、適切なデータ量とすることにより、映像コンテンツの再生に合わせたリアルタイム検索やオフラインでの高速検索も可能にすることが出来る。
このような映像コンテンツのフレームのデータベースであるインデックス列はさまざまな応用が可能で、映像装置上に記憶または搭載されている映像コンテンツの利用範囲を格段に拡大させることが出来きる。
図5(識別データの構成例)は先に説明の検索対象範囲内の映像コンテンツの任意の1フレームを識別可能にする識別データ10の構成例である。
図のA、B、C共通して識別データ10には、時刻データまたは連番データ、タイムコードなどの時刻情報3であるフレーム位置データ35があり、識別データ10の基本部分11は、フレーム情報から得られた2つのタイプの要素データ7、通常要素データ8または特徴要素データ9が複数組合せされている。
この通常要素データ8は特徴情報を含まない要素データ7であり、特徴要素データ9は特徴情報を含んだ要素データ7であることを意味している。
また連続重複フレーム14、繰返しフレーム15、複製フレーム16、偶発同一フレーム17が重複データ識別情報13として付与されており、これは識別データ10が映像コンテンツの検索対象範囲内で、識別データ10のデータ同士の重複を検出してこれを識別しこれを回避するための情報であり、これらについての詳細は後述する。
識別データの基本部分11に付随するフレーム関連情報20には相互連動情報21と任意情報22が付与されこれが先に説明の映像コンテンツ1のメタデータ36である。
インデックス列12の識別データ10を介して映像コンテンツ1の任意のフレームにこの相互連動情報21を含むフレーム関連情報20を付与することにより映像コンテンツの任意フレームに連動したさまざまな応用が可能となる。
図のAはこれまで説明のように、識別データ10の基本部分である要素データ7の全てを画像、音声、画像の変化、音声の変化に伴う当該フレームのフレームデータをもとにした通常要素データ8とした場合である。
この場合通常要素データは特徴を示すデータとはならないものの、映像コンテンツフレームデータ4から高速でデータを抽出することが出来、これを利用することが可能である。
図のCは全ての要素データ7をそれぞれのフレームの画像の特徴、音声の特徴、変化の特徴から抽出した特徴要素データ9として識別データ10を構成した場合で、特徴要素データ9がそれぞれの特徴を示すデータであり、これを検索することにより映像コンテンツ上のさまざまな特徴のフレームをも探し出すのに有効なデータとなる、この構成例は後述する。
図のBはAとCの混成によるものである。
図6(音声あり/なしの識別データ)に示すように音声を伴わない映像コンテンツにおいては、対象が画像のみとなるため静止画が連続するフレーム期間では識別データ10のデータの重複が避けられない、これに対し、その比率は大幅に低減されるが音声を伴う映像コンテンツの場合は静止画で無音声のフレームにおいて識別データ10のデータ同士の重複が避けられない。
このいずれにおいてもこれら場合には前述の重複データ識別情報13に連番データ等を付与することにより重複データを識別し、検索対象範囲での識別データ10のデータ同士の重複化を回避している、詳細は後述する。
以上のような目的のために利用される識別データ10を設計するにあたり第1に考慮しなくてはならない事は対象とする映像コンテンツとその検索対象範囲でありこれをもとに、統計確率的な手法を用いて解決する必要がある。
対象とする映像コンテンツが放送番組で、その期間を1年とする場合、例えばテレビジョンチャンネル1局当たりの年間総送信フレーム数は、24時間連続放送として、365日×24時間×60分×60秒×30フレーム=946,080,000フレーム≒10億フレーム/年である。
地上デジタル放送、BS放送、CS放送等の全てのチャンネルを概算100チャンネル分とすれば、放送電波で受信される総フレーム数は合計1000億フレーム/年となる。
さらに他の映像メディア例えば、CATVや市販されるDVDの映像コンテンツ、インターネット上の動画像などを含めると際限なく拡大される。
しかしながら、家庭内の映像装置の映像コンテンツの記憶時間が最大で1000時間の場合、記憶されるフレーム数は、1000時間×60分×60秒×30フレーム≒1億フレーム程度である。
従がって1億フレームの1000倍の1000億通り以上の組合せ確率が保証されれば一般的な利用は可能であるが、例えば10、000倍となる、1兆通り(≒2の40乗)以上の組合せ確率が保証出来れば、家庭内で利用する映像コンテンツのそれぞれのフレームのデータ同士の重複(同一化)は特定なフレームを除き回避され、識別データ10は識別能力の高いデータとして利用することが出来る。
検索対象範囲の映像コンテンツが長大な場合にはさらに組合せ確率組合せ数を高くするなど使用目的によりこの組合せ確率を考慮すればよい、詳細は後述する。
次に重複を避け映像コンテンツ上の任意の1フレームデータを固有のデータとするよう作成される識別データ10の通常要素データ8ならびに特徴要素データ9の要素データ抽出諸元として概ね以下の4つを基本と考えればよい。
(1)サンプリングデータ抽出位置においては、1フレーム画面上で通常100〜200のXYサンプリングポイント(デジタルデータの場合にはマイクロブロック、ブロックでよい)から情報を抽出し、このサンプリングポイントをもとにする画面上の全体平均データ抽出、または部分的な平均データ抽出と、特定のサンプリングポイントのデータ抽出と、の中から選択する少なくても1つ以上をサンプリングデータ抽出位置とする。
特徴検出のためには、当該フレームの特徴を最もよく現す画面全体の平均は必須となる。
(2)画像情報においては、輝度信号情報と、色差信号情報と、色信号情報と、の中から選択する少なくても1つ以上の画像成分、(Y、Cb Cr R、G、Bの1つ以上の成分)とする、特徴検出のためには輝度(Y)および色信号(R、G、B)が望ましい。
(3)音声情報においては、モノラル信号情報と、ステレオ信号情報と、多チャンネル信号情報と、の中から選択する少なくても1つ以上の音声情報(R/L、5.1チャンネル、7.1チャンネルの1つ以上のチャンネル)、画像情報と同期を取って抽出することが不可欠である。
(4)変化情報においては、先行するフレームから変化を比較するための少なくても1つ以上のフレームを選択する。
比較対象のフレーム期間間隔を大きくすることにより、変化の度合いを大きく出来るが、識別データ10の抽出を開始する際、抽出開始から当該期間の識別データ10は不完全なものとなるため、通常は1から10フレーム先行のフレーム範囲とする。
これに更に数秒程度先行するフレームを併用し複数ごとのフレームを対象として比較することは識別の能力を高め、識別の精度を向上させるために有効である。
このような場合に注意することとして、先に説明のように数秒程度先行するフレームとの差分量など比較のデータを用いる場合、再生開始からの再生信号をもとに識別データ10を作る場合、当該範囲は不完全なデータになるため再生、停止などが頻繁に繰り返されるような使用においては、先行するフレームとの差分量をもとに抽出した要素データを除外して検索するなどの必要がある。
図7(アナログ信号をもとにした本願発明の実施例)は以上の説明をもとにして設計されたフレーム検索用データ作成装置、フレーム検出装置の実施例の一例で、本願発明の基本となる映像コンテンツの各フレームの画像もしくは画像と音声のフレーム情報から抽出される画像もしくは画像と音声の要素データを複数組合せして構成される識別データ10そしてこれをインデックス列12、データベース18を作成するための手段、またこれを検索する手段の概要を示すものである。
この実施例の構成は映像装置本体42の入出力に標準装備されているアナログ画像信号、アナログ音声信号をもとにして、映像コンテンツは音声を伴い、要素データは特徴要素データ9としてデータを抽出する場合の例である。
いうまでもなく、映像装置本体42の内部に構成することも可能である。
映像装置本体42からの画像、音声信号51の画像信号は識別データ作成部50において適宜復調されR、G、B信号としてA/D変換部52に入力される。
音声信号はRまたはLのいずれかがA/D変換部52に入力される。
これらの映像、音声信号は後述するA/D変換ポイント信号のタイミングでA/D変換され、識別データ抽出部53に入力され識別データ10を得る。
図7の下段に示すように、フレーム2ごとの識別データ10は、映像コンテンツの全てのフレーム2ごとに、識別データ抽出部53で得られた、識別データの基本部分11、重複データ識別情報13、これらがフレームごとに整列されインデックス列登録部56によりタイトル情報5ごとに記憶登録されインデックス列12、さらにはデータベース18となっている。
また識別データ10には図5で説明のデータ検索に必要な時刻情報3としてのフレーム位置データ35、や相互連動情報21などのフレーム関連情報20も付随情報として付加されて記憶登録されている。
識別データ10を事前に記憶登録する場合、映像装置本体42の再生信号から得られる連続する識別データ10を図7の信号切替SW1をA、SW2をAとし記憶登録されたインデックス列61として順次記憶登録される。
既知の映像コンテンツをもとにして、未知の映像コンテンツから、同一フレームを探す場合、信号切替SW1をB、SW2をBとし、記憶登録されたインデックス列61から選択されたインデックス列検索部54の、もとになるインデックス列63より選択された1つのフレームの識別データ10を検索基準データ60として、上述同様、記憶登録されたインデックス列61から選択された検索対象インデックス列62を識別データ検出機能55によりフレームごとに順次一致または近似検出を行い、検索対象識別データ62の中より、同一フレームを検出し、識別データ検出部55から検出信号ならびに、一致または近似するフレームの、時刻情報3、連番情報、または記憶媒体のアドレス情報等(この例の場合は時刻情報3)から元になる映像コンテンツのフレームのタイムコード4に相当するフレーム位置データ35を得て、フレーム位置またはフレーム区間6を検出する。
再生される映像コンテンツをもとにして、同一映像コンテンツのインデックス列12と同期をとる場合は、信号切替SW1をA、SW2をBとして、映像装置本体42から再生され、得られたた一つのフレームの識別データ10を検索基準データ60として、上述同様検索対象インデックス列62の中から順次同一フレームを検出し、連続して検出信号ならびに一致または近似するフレーム位置データ35を得て、フレーム位置またはフレーム区間6を検出する。
またフレームの特徴を検索する場合などは、SW3をBとして、特定条件設定部57に指定する検索条件データを設定し、目的の検索対象インデックス列62を検索することにより同様に目的のフレームの位置またはフレーム区間6を検出する。
図8(識別データ抽出部)は図2の再生信号またはデータよりの識別データ作成部87の情報抽出の具体的手法を示すものである。
1つのフレーム2をN個のサンプリングポイント58に分割し、それぞれのサンプリングポイントごとに画像信号をR、G、Bと音声R、L信号のいずれかと、フレーム前後の変化を求めるための当該フレームのXフレーム先行する画像、音声信号をもとにして識別データ10が抽出される。
先に説明の通り、サンプリングポイント58の数量については通常の場合100〜200程度で十分であるが精度を必要とする場合などは増やせばよい、またフレームのXは一定の変化を期待するものであり通常1〜10程度でよい、複数フレームとすることも、比較するフレームの間隔を広くすることも可能である。
これらはその応用例に基づき、選択するA/D変換機能の性能、コスト、一時的に利用するワークメモリサイズ、処理速度を勘案し適切に決めればよい、詳細は後述する。
最初に特徴抽出された特徴要素データ9から説明する。
nフレームの画面平均の明暗、色調、音量レベルを示す特徴要素データ9は、R、G、Bならびに音声データの1フレームの平均レベルとしてワークメモリ106に一時記憶されている。
nフレームの画面中心の明暗、色調、音量レベルを示す特徴要素データ9は、R、G、Bならびに音声データの中心サンプリングポイント59のレベルとしてワークメモリ107に一時記憶されている。
Xフレーム先行するn−Xフレームとの明暗、色調、音量レベルの差分量(変化の大きさ)を示す特徴要素データ9は、R、G、Bならびに音声データとしてワークメモリ110に一時記憶されている。
Xフレーム先行するn−Xフレームと比較し画面全体の内、どのぐらいサンプリングポイントが変化しているかを示す特徴要素データ9は、変化範囲としてワークメモリ111に一時記憶されている。
同様にサンプリングポイント平均の動きの速さを示す特徴要素データ9は、変化速度としてワークメモリ112に一時記憶されている。
nフレームの識別データ10の抽出のプロセスは以下の通りである。
先の図7に示す識別データ抽出機能53に基づくプロセスで、画像信号から得られる、水平・垂直同期信号に同期し、1フレーム1をNサンプリングポイント58に分割するためのA/D変換ポイント信号をサンプリング信号として、以下図8にもとづき説明する。
1)nフレームの最初のサンプリングポイントよりR、G、B、音声信号を4bitでA/D変換しワークメモリ104に一時記憶し、さらに合計ワークメモリ105に一時記憶する。
2)同時に事前に記憶されているn−Xフレームの最初のサンプリングポイントのR、G、B、音声信号データをワークメモリ101から読み出しワークメモリ101と104のデータの差の絶対値を108に一時記憶し、さらに合計ワークメモリ109に一時記憶する。
3)次のサンプリングポイント以降Nサンプリングポイントまで同様に順次ワークメモリ104、105にデータを一時記憶するとともに、ワークメモリ105、109にはデータを加算し一時記憶する。
4)最後のNサンプリングポイントのデータが書き込み完了時、ワークメモリ105、109の合計データをサンプリングポイント数Nで割り、ワークメモリ106、110に平均特徴要素データ9として一時記憶する。
5)同時に中心サンプリングポイント9のデータはワークメモリ104より中心近傍の1サンプリングポイントを選択しワークメモリ107に中心特徴要素データ9として一時記憶する。
6)同時に画面上の変化範囲の割合、変化範囲を求めるためにワークメモリ108の中から、データが0以外のサンプリングポイントを探し出し、そのサンプリングポイントの割合をNを最大値とする4bit値でワークメモリ111に変化範囲特徴要素データ9として一時記憶する。
7)同時に変化の度合いの一つである変化速度を求めるためにワークメモリ109の4組のデータを合計(変化の大きさの合計)しワークメモリ111(変化したサンプリングポイント数)で除したデータを実映像コンテンツ再生時に発生する最大値を最大値とする4bitデータでワークメモリ112に変化速度特徴要素データ9として一時記憶する。
以上1)から7)までのプロセスで抽出した特徴要素データ9を組合せしたものが1フレームの識別データの基本部分11であり、これを情報抽出の元になる映像コンテンツのフレームと相互参照可能なようフレームごとに、識別データ10に映像コンテンツの開始時刻を起点とする時刻情報3と、関連する情報を付与し、インデックス列登録部56で記憶登録したものがインデックス列12である。
先に説明のとおりこの時刻情報3は、連番または記憶媒体19のアドレスそのもので、元になる映像コンテンツのそれぞれのフレームと相互対照とする構成であってもよい。
これにより、インデックス列12を検索し目的のフレームを検出することにより元になる映像コンテンツ上のフレームの位置やその区間を特定することが可能になる。
更にこのインデックス列12にタイトル情報5を付与し複数記憶登録することによりデータベース18となる。
この識別データ10ならびにインデックス列12、そしてデータベース18は、フレーム位置検出、同一フレーム検出、特定特徴フレーム検出、フレーム連動、フレーム同期のもとになる、本願発明の基本をなすものである。
本実施例では以上、フレーム前後の変化を含む画像信号、音声信号の特徴情報で、独立した14種の特徴量をそれずれを4bit化しBCD等のコード化を行い識別データ10としているが、特徴の種類ならびに分解能、コードともこれに限るものではない、アナログ系の場合、以下に詳しく説明をするように、アナログ誤差が発生するため分解能を上げる意味はあまりないが、相関をもたない多種の特徴要素データ9を組合せ構成させることが重要である。
一例として、本実施例では、画面全体の平均と、画面の中央部のサンプリングポイントを特徴要素データ9としているが、フレーム対角の上下、左右のサンプリングポイントを特徴要素データ9とする、または変化比較のフレームを複数にする、例えば、静止画で、無音声が頻繁に発生することなどを考慮して、通常は5フレーム先行するフレームとの比較とし、静止画で、無音声が続く場合など、5秒先行のフレームと比較するなどが有効である、これらの要素データの種類数と要素データの量子化ビット数による統計確率に関する詳細は後述する。
教育、医療、防犯、生産、ゲームなどの専門分野によっては、フレーム画面上の特定の部分の特徴を詳しく抽出したいなどのニーズもあり、この場合は当該範囲に複数のサンプリングポイントを設けるなど目的に合わせサンプリングポイントを決めることが出来る。
以上は図2の再生信号またはデータよりの識別データ作成部87としての識別データ作成部50およびインデックス列登録部の一形態である。
図8に示すように、1つのフレームで14種の独立した情報を4bitデータとして持つことは理論的な確率統計上、14種×4bitで、2の56乗となり、72京以上の組合せ数となる。
後に説明する誤差吸収のための丸め込みをした後の4bitデータは3bitと概等価になり、14種×3bitでは、2の42乗で理論的な確率統計上では、4兆以上の組合せ数となる。
先に示したように、家庭内等の通常の使用においては確率組合せ数が1兆(≒2の40乗)以上(確率の場合は1/1兆以下)が保証出来れば、識別データ10のデータ同士の重複(同一化)は回避され、識別データ10は、後に詳しく説明する特定のフレーム以外、唯一無二性をもったデータとすることが出来るが、ここで重要な事は上記のような理論確率ではなく、実際の出現確率によるデータの唯一無二性であり、この唯一無二性を保証する上で大きく3つの重要事項がある。
その第1はそれぞれの、通常要素データ8、特徴要素データ9の要素データの量子化ビットデータのデコードデータである量子化データ(本実施例の場合0から15までのデータ)の出現頻度の偏りである。
図9(量子化ビット数利用率判定)は1つの要素データのそれぞれの量子化データの出現頻度をもとにこの要素データの平均出現確率を数値化するものである。
表Aは大数定理にもとづきそれぞれの量子化データが均等に出現している場合であり、表Bはそれぞれのデータの出現頻度にばらつきがある場合の例である。
表Bのような出現頻度の場合、それぞれの量子化データの出現頻度の差によって要素データは使用している量子化ビット数分の理論分解能をもてない結果となる。
表Cは表Bの出現頻度の大きい量子化データから順番に左から右に並び変えしたものである。
表Cの並べ替えした出現頻度分布の重心位置は、表Aで示される理論重心位置より左側に偏移される。
この重心位置の意味するものは、出やすい量子化データ(重心の左側)と、出にくい量子化データ(重心の右側)の中間にある量子化データ、つまり平均的な出現頻度の量子化データを意味し、平均的な出現頻度の量子化データの出現頻度が理論出現頻度より低下(確率は上昇)する結果、この要素データの使用している量子化ビット数のデータ数(理論量子化ビット数)に見合う分解能が得られない結果となることを意味し、重心位置が左に偏移するほど量子化ビット数が低下するので、要素データのデータ分解能の尺度となる量子化ビット数の利用率とすることが出来る。
この量子化ビット数利用率を利用して当該要素データの等価データ分解能、つまり等価量子化ビット数を判定するにあたり、本例では量子化ビット数利用率係数の最高を1とし、この場合等価量子化ビット数は使用しているデータ数(理論量子化ビット数、この場合4bit)とし、量子化ビット数利用率係数が最低の0の場合は、等価量子化ビット数を1bitと対応付けしている。(表D参照)
以上の量子化ビット数利用率係数は要素データの特徴抽出能力、特徴識別能力を判定する重要な指標になる。
使用しているビット数(理論量子化ビット数)をAとし、量子化ビット数利用率係数をXとすると、1つの要素データの等価量子化ビット数αは次の式で現せる。
(数1)
α=(A−1)×X+1
表Dに示すように仮に4bitからなる要素データの量子化ビット数利用率係数が0.8の場合、3.4bitからなる理論(理想)量子化ビット数と等価であることを意味する。
またN個の要素データのそれぞれの理論量子化ビット数がA1、A2、A3・・・・ANで、それぞれの量子化ビット数利用率係数がX1、X2、X3・・・・XNの場合、この要素データを組合せした識別データの等価量子化ビット数、つまり総合等価量子化ビット数を、総合αとすると、総合αは以下の式で現せる。
(数2)
総合α={(A1−1)×X1+1}+{(A2−1)×X2+1}+{(A3−1)×X3+1}・・・・+{(AN−1)×XN+1}〕/N
要素データの量子化ビット数が同一な場合は単純にそれぞれの要素データの平均等価量子化ビット数を求めることにより、識別データ10の全体の平均等価量子化ビット数を求めることが出来る。
以上の方法を用いることにより要素データのそれぞれの量子化データの出現頻度を一定期間実測することで簡単に、要素データごとのビット数としての平均出現確率や要素データ全体のビット数としての平均出現確率の判定をすることが可能になる。
以上で分かるように、それぞれの要素データの量子化データに出現頻度の偏りがあることによって、確率上、実際に使用している量子化ビット数(理論値)と実際値に大きな差が生じてくる。
図10(量子化データの出現頻度均等化)は要素データの量子化データの出現頻度の偏りを均等化して、量子化データの出現頻度の偏りによる、確率の上昇(悪化)を防止させるものである。
これまで説明の図7による実施例では画像音声とも4bitのA/D変換部52でデータを採取していたが、表Aのように、これを8bit(256の量子化データ)でデータ採取して一定期間のシミュレーション結果による量子化データの出現頻度をもとに、量子化データの出現頻度を均等化するよう表Bのように4bit化してデータとしたものである。
この方法により4bit化されたそれぞれの要素データの量子化データの出現頻度はほぼ均等となるため、先に説明したけ確率悪化の影響を無視することが出来る。
このようにフレーム情報より要素データを直接採取する際のビット数を、実際に前記識別データの要素データとするビット数より多くし、要素データを採取した量子化データの出現頻度を均等化して前記識別データの要素データとする方法は要素データ選択の幅を拡大する。
但しC表のように、出現頻度の最大、最少に大きな差がある場合には、後に説明のアナログ誤差補正などが困難になるので注意が必要である。
その第2は通常要素データ8および特徴要素データ9同士の相関つまり要素データ同士の出現相関度の把握である。
図11(要素データ相関度判定)は要素データ同士の相関度を判定するための手法の一例を示したものである。
2組の要素データX、Yがそれぞれ4bit、16の量子化データで構成される際、Xのデータの0から15まで16種、とYのデータの0から15まで16種、計256通りで、説明上、大数定理にもとづく平均出現頻度を10回とする2560回の試行を行いその組合せの出現頻度をマトリックス上にプロットしたものである。
この相関度判定を求めるためには、先に説明のとおり、1つ1つの要素データの量子化データの出現頻度が均等であることが前提である。
実際に要素データの均等化補正をかけた場合には均等化補正をした要素データのデータ、実際に均等化補正をかけていない場合はデータ上でこの均等化補正を行ったデータとして記載されている。
表AはX、Yデータ間の相関がなく、均等化され、出現頻度がフラットな場合で、表Bはデータ同士が完全に相関(一致)している場合、表Cでは一部のデータ間で相関をもつ場合、を示している。
本例では、X、Y2組の16データが、それぞれ10回ずつ出現することの理論値平均値10と出現頻度の差を偏差として、この二乗を分散とし、16データの分散を分散平均として、この平方根を二乗平均平方根としている(表ではY0のみ代表され示されているがY0からY15まで全て同様)。
したがって、この二乗平均平方根は相関度が全くない表Aの場合には0になり、表Bのように完全に相関する場合には38.73となる。
相関度の係数、相関度係数はこの38.73を最大値1(理論最悪値、完全に相関)として、最低値0(理論最良値、相関なし)としたもので、表Cの場合の相関度係数は0.15である。
以上の説明のように、識別データ10を構成する複数の要素データから2組を取り出し互いのデータ同士の個別相関度係数をもとめ、複数の要素データの全ての組合せ、本例の場合の14種の要素データの場合は14から2つをとる91の組合せ、の個別相関度係数の全体平均をとることにより、組合せした要素データの全体平均相関度の係数、全体相関度係数を求めることが出来る。
この全体相関度係数で、要素データを組合せして構成される識別データの組合せ分解能力、つまり等価組合せ数を判定するにあたり、本例では全体相関度係数の最低(最良で相関なし)を0とし、この場合組合せ数は使用している組合せ数(理論組合せ数、この場合14組)とし、全体相関度係数が最大(最悪で完全に相関)1の場合は、組合せ数を1組として対応付けしている。
例えば要素データが14種で全体相関度係数が0(最良)の場合には、全ての要素データに相関がなく、全ての要素データの14組の分解能が得られることを意味している。
一方要素データが14種で全体相関度係数が1(最悪)の場合には、全ての要素データのデータ同士のデータが全く同一のデータとなり分解能は1組のみの分解能となることを意味している。
使用している要素データの組合せ数(理論組合せ数)をBとし、全体相関度係数をYとすると、識別データ全体の等価組合せ数をβとすると、βは次の式で現せる。
(数3)
β=(B−1)×(1−Y)+1
表Dに示すように仮に要素データが14種で全体相関度係数が0.2の場合には完全に相関度のない11.4組の理論(理想)要素データと等価な組合せ数となることを意味している。
この全体相関度係数はフレームをよりよく識別する能力、つまり識別データ10の識別分解能を判定する重要な指標となる。
従がって要素データは最低限含める必要のある要素データをメインにして、補助的な要素データを選択する際、全体相関度係数が少なくなるよう補助的な要素データを選択し組合せする。
以上説明の方法を用いることにより、要素データの互いの相関度を一定期間実測することにより簡単に識別データの組合せ数としての平均出現確率を判定することが可能となる。
なお、本例では説明のため試行回数を2560回で示しているが、実際には数時間分、必要により数日間の映像コンテンツのフレーム信号をサンプリングして映像コンテンツの内容によるデータの偏りをなくすことが重要である。
以上の説明の2つの、量子化ビット数利用率係数による等価量子化データ数と、全体相関度係数による等価組合せ数により、識別データの全体の総合識別能力指数、平均出現確率を求めることが出来る。
先の説明の通り、
使用しているビット数(理論量子化ビット数)をAとし、量子化ビット数利用率係数をXとすると、1つの要素データの等価量子化ビット数αは次の式で現せた。
α=(A−1)×X+1
またN個の要素データのそれぞれの理論量子化ビット数がA1、A2、A3・・・・ANで、それぞれの量子化ビット数利用率係数がX1、X2、X3・・・・XNの場合、この要素データを組合せした識別データの等価量子化ビット数、つまり総合等価量子化ビット数を、総合αとすると、総合αは以下の式で現せた。
総合α={(A1−1)×X1+1}+{(A2−1)×X2+1}+{(A3−1)×X3+1}・・・・+{(AN−1)×XN+1}〕/N
さらに使用している要素データの組合せ数(理論組合せ数)をBとし、全体相関度係数をYとすると、識別データ全体の等価組合せ数をβとすると、
β=(B−1)×(1−Y)+1で示された。
よって要素データの総合等価量子化データ数を総合αとし、等価組合せ数をβとし、識別データの全体の分解能であり識別能力を示す、総合識別能力指数をγとすると、γは次式で現せる。
(数4)
γ=総合α×β
したがって等価総合分解能=2^γ
以上の識別データの理論出現確率をPとすると
(数5)
P=1/(2^γ)
実例1として要素データの量子化データ利用率係数が平均で0.8の場合には3.4bitと等価な要素データとなり、14種の全体平均相関度係数が0.2の場合には11.4組と等価の要素データの組合せ数となり、このような場合の等価総合分解能は11.4組×3.5bit=39.9bitで、約2の40乗≒1兆通り、出現確率はその逆数となる。
実例2として要素データの量子化データ利用率係数が平均でもし0.5の場合には2.5bitと等価な特徴要素データとなり、もし14種の全体平均相関度係数が0.5の場合には7.5組と等価の要素データの組合せ数となり、このような場合の等価総合分解能は7.5組×2.5bit=18.75bitで、2の18.75乗≒440,871通りとなり、理論値2の56乗とは比較にならない確率まで悪化されたものになる。
実例1と実例2の差で理解出来るように2組の係数は指数的な意味をもつもので、この係数の大小により大幅に出現確率を左右することになる。
またこれがアナログ信号を変換して作成される識別データで誤差の補正が必要となる場合この確率はさらに上昇される。
以上のように量子化データに強い出現頻度の集中がある場合や互いのデータ同士に強い相関がある場合には、要素データのビット数、および組合せ数に相当する組合せ確率とはならず無駄なデータとなり、識別データの識別能力を著しく低下させる結果になる。
当該フレームの特徴を総合的に現す要素データ、例えば画像、音声の平均値データは不可欠の特徴要素データとして、副次的に組合せをする要素データにおいては、先に説明の要素データ抽出諸元と、サンプリング間隔、データ処理方法、を適切に選んで相関度合いを低減させることが必要である。
またこれでも目標とする出現確率とならない場合には要素データを新たに追加する必要もある。
先ほどの実例1の要素データの量子化データ利用率係数が平均で0.8、全体平均相関度係数が0.2の場合で、確率組合せ数を1兆以上とするには、
デジタル情報をもとにする要素データの場合、4bit構成で15組の要素データ(7.5Byte構成)とすると、
等価量子化データ数は(3bit×0.8+1bit)=3.4bit
等価組合せ数は(14組×(1−0.2)+1組)=12.2組
等価総合分解能は3.4bit×12.2組=41.48bitとなる。
先に示した1兆通り(≒2の40乗)を満足させることが出来る。
後述するがアナログ信号をもとにした要素データの場合にはアナログ誤差補正が必要となる、この場合1bitをアナログ補正の対象とする場合、4bit構成で20組の要素データ(10Byte構成)として、上記平均量子化データ利用率係数が0.8、平均全体相関度係数が0.2、で3bit構成の要素データと等価になるので、
等価量子化データ数は(2bit×08+1bit)=2.6bit
等価組合せ数は(19組×(1−0.2)+1組)=16.2組
等価総合分解能は2.6bit×16.2組=42.12bitとなる。
先に示した1兆通り(≒2の40乗)を満足させることが出来る。
以上のように簡単に必要とする要素データのデータ数や組合せ数を逆算することが可能となる。
以上のとおり要素データのそれぞれの量子化データの出現頻度を一定期間実測し要素データごとのビット数としての平均出現確率や要素データ全体のビット数としての平均出現確率を判定する方法と、要素データの互いの相関度を一定期間実測することにより識別データの組合せ数としての平均出現確率を判定する方法と、により簡単に識別データの総合平均出現確率を判定することが可能となる。
これまでは識別データのそれぞれの要素データの量子化データの偏りと、要素データ同士の相関による、1フレームの識別データの平均出現確率をもとにさまざまな実例を示してきた。
最後に、最悪のケースの出現確率を検証して識別データの確率上の重複を究極的に低減するための検証方法を説明する。
要素データが先に説明の量子化データの均等化補正がなされていない場合、統計確率上、全ての要素データが、要素データの量子化データの中の、出現頻度が最も高い量子化データ同士の組合せとなる識別データの出現頻度が最大ものとなる。
従がって、この場合の組合せ確率を検証することにより、確率上最悪となる出現確率を予測して対策することが可能となる。
図12(最悪識別能力指数判定)は以上説明の要素データの最悪量子化データの組合せによる確率の判定例である。
A表は本実施例にもとづく14種類の要素データのそれぞれの量子化データの中で最も出現頻度の高い量子化データ(最悪量子化データ)をそれぞれZとして選択して、それぞれのこの最悪量子化データの、理想出現頻度と実際の出現頻度の比を確率悪化率としてプロットし、この平均(本例の場合0.45)を求めたものである。
従がってこの確率悪化率は、当該最悪量子化データの出現頻度とは反比例の関係にあり、1であれば最良値(理論値、この場合4bit)で、0であれば最悪値(この場合1bit)と対応付けする。
この最悪量子化データ同士のデータで、互いの要素データ同士の相関度はこれまでのデータをそのまま使用することが出来る。
表B、表C、表、Dは先に示した要素データ同士の相関度を、先の図11のシミュレーションによって採取された出現頻度データをもとにこの最悪量子化データのみに適応した場合である。
表Bは図11で採取されたデータの、この量子化データに限定した組合せ、この場合91組、でそれぞれの要素データごとの出現頻度を示している。
表Cは、これまでと同様、10を理論値として偏差とし、表Dでこれを分散しこれを集計して、分散平均、二乗平均平方根とし、相関度係数(本例の場合0.17)を求めたものである。
従がって、この平均確率悪化率をCとし
最悪等価量子化データ数をWαとすると
(数6)
Wα=(A−1)×C
同様に、この最悪の場合の相関度係数、最悪相関度係数をZとし
最悪等価組合せ数をWβとすると
(数7)
Wβ=(B−1)×(1−Z)+1
よって最悪識別能力指数をθとすると、
(数8)
θ=Wα×Wβ
以上の識別データの理論出現確率をPとすると
(数9)
P=1/(2^θ)
以上の式によって、本例の場合図12に示すように、最悪識別能力指数の25.38が求められる、従がってこの場合、識別データの最も出易いデータは確率上、1/(2の25.38乗)の確率で出現することになり、理論値の出現確率を大幅に上回るものとなる。
適切なデータ量で識別能力の高い識別データとするのは要素データの選定と、必要に応じて量子化データの均等化補正等の処置が不可欠であり、出現の確率を一定値以下にする必要がある。
以上のとおり識別データを構成する全ての要素データのそれぞれの量子化データの最も出現頻度の高い量子化データの出現頻度を測定する方法と、要素データの互いの最も出現頻度の高い量子化データ同士の出現相関度を測定する方法と、により簡単に識別データの最悪の場合の重複の確率である最悪出現確率を判定することが可能となる。
通常この最悪出現確率を1000億分の1以下にするよう識別データを設計すれば多くのニーズに対応することが出来る。
通常このような極めて大きな確率を伴うデータの検証は極めて大量のデータの蓄積をまたないとこれらの出現頻度、確率の検証は出来ないが、以上の方式を利用することにより、それぞれの要素データの量子化データの出現頻度と、組合せされる要素データ同士の相関は極めて短時間の数時間分、必要により数日間のシミュレーション期間で求めることが可能になるので、後は簡単な演算式で識別データの識別能力を判定することが出来る。
図9から図12図に示すこの判定方法はゲームの当たり確率分析のシミュレーション等にも応用可能である。
以上のようなシミュレーションによって、目的に応じてデータサイズがコンパクトで、識別能力の高い要素データ、識別データとこれにもとづくインデックス列を短時間で選出することが可能である。
識別データ10を設計する上で、第3に重要なこととして、識別データ10同士のデータの重複が避けられないフレームの対処である。
検索対象範囲内の映像コンテンツの識別データ10をインデックス列12として記憶登録するにあたり、過去に記憶登録された識別データ10と新たに記憶登録する識別データ10を比較してそのフレームまたはそのフレーム区間には、重複データの発生が確認された双方の識別データ10およびその区間に連番データなど、その要因別に識別情報を付与することにより、当該検索対象範囲において識別データ10の重複を回避してデータの唯一無二の保証をすることが出来る。
識別データ10の重複は以下の示す4つの要因により発生する。
本例ではnフレーム先行するフレームとの比較を行い差分量を特徴要素データ9としているので、静止画で無音声(音声が利用できない場合は静止画のみ)のフレームが、このnフレーム以上の期間連続する連続重複フレーム14の場合、この範囲は識別データ10が重複された区間となる。
図13(連続重複データ判定部)に示すように、静止画で無音声が連続する連続重複フレーム14は常に先行する1つ前のフレームのR、G、B、音声信号を比較し、変化するサンプリングポイントが一つもない場合はこれを連続重複フレーム14として認識し、変化が出るまでの区間、連番データ付けを行い、図5に示すように、この連番データを、これらの重複を識別するための情報である重複データ識別情報13の連続重複フレーム14に書き込み、それぞれのフレームが連続重複フレームであることによる重複を識別可能にし、フレーム単位でのフレーム識別を可能としている。
以上のように過去(先行するフレーム)の識別データ10と新規(現在のフレーム)の識別データ10の変化の状態を比較することにより識別データ10の重複を回避している。
また、詳細を図13の下段に示すように、再生が開始されるフレームがこのような連続重複フレーム14である場合、または複数のフレームを対にして検索する場合などの場合には、当該連続重複フレームの連続時間を読み取り、以降の連続重複フレーム14でない識別データ10による検索する際、この連続時間範囲に相当する区間を検索することにより、検索を確実なものとすることが出来る。
以上図13の連続重複データ判定部40は図2の重複データ判定部39の一形態である。
図14(連続外重複データ判定部)は以上の静止画や無音声(音声が利用できない場合は静止画のみ)以外に起こる映像コンテンツ内の識別データ10の重複データを判定しこれを回避させるものである。
先の連続重複フレームの場合は常に1フレーム前(過去)の識別データ10と現在のフレームの比較により判定すればよいので容易に検出が行われるが、不特定な過去のフレームと現在のフレームの重複を検出するには以下のような手段が有効である、もちろんこの手法を先の連続重複フレーム検出に利用することも可能である。
連続外重複データ判定部65は、記憶媒体上にインデックス列12とは別に用意され補助的に利用されるもので、識別データ10の特徴要素データ9の幾つかの要素データの量子化データごと(図14ではR平均、B平均で2組、256グループ)にグループ化されたメモリ構成となっており、特徴要素データ9の量子化データごとにグループ化し、識別データ10を該当するグループに順次書き込むものである。
それぞれの量子化データの出現頻度に大きな偏りがない場合には、このような構成にしておくことにより、識別データ10を検索する際、該当するグループの識別データ10のみの検索とすることが出来るので、概ね検索回数、検索時間とも量子化データの組合せ数(図14では256組)分の1とすることが出来る。
従がって大容量の記憶媒体であってもこのグループを増やし検索の範囲を限定することにより映像コンテンツの再生に追従してフレーム検索をすることが可能である。
以上のようにインデックス列メモリと併用して、検索対象範囲とフレーム検索時間に応じグループ検索可能な連続外重複データ判定部65を用意することにより、フレーム再生時間に連動(リアルタイム)して過去に記憶登録した識別データ10と新しく記憶登録する識別データ10を比較して重複データを検出することが可能である。
図14に示すとおり、識別データ10とそのコンテンツタイトル、とそのフレーム位置を一括して記憶することにより、検索対象範囲内の全ての映像コンテンツの識別データ10をグループごとに一括して検索することが可能になっている。
識別データ10の重複は先に説明の、静止画や無音声(音声が利用できない場合は静止画のみ)のフレームが連続する以外、以下の3つの要因で発生する。
(1)CMフレームと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、の繰り返し送出されるフレームにより発生する識別データ10の一定区間同士が重複データとなる区間
(2)複製(コピー)された映像コンテンツにより発生する識別データ10の一定区間同士が完全に同一で重複データとなる区間
(3)偶発的に類似する他のフレームを同一データとして抽出することにより発生する識別データ10同士が重複データとなるフレーム
により識別データ10のデータ同士が重複する。
以上の重複データは、図14に示すように連続外重複データ判定部65に、識別データ10を生成するたびに、重複フレーム判定メモリ65に識別データ10ならびに必要情報を順次記憶登録するとともに、すでに記憶登録してある過去の識別データ10を検索判定して、複数のインデックス列12上の重複する識別データ10を検出すことができる。
テレビジョン放送番組のCMや再放送フレームなどのフレームは連続して重複フレームが繰り返される繰り返しフレームとして自動検出し、番組局情報、タイトル情報、放送される時刻情報、およびその期間から、それがCMか(通常CMは15秒の整数倍の時間)、再放送か、さらには完全に同一となる複製(コピー)コンテンツか、のいずれかを自動判定させることも可能である。
これらにもとづき、双方のインデックス列12上の識別データ10にこれらの重複を識別するための情報としての重複データ識別情報13の、繰返しフレーム15、または複製フレーム16、偶発同一フレーム17、のいずれかに連番データ等、これを識別しこれを回避するための情報を付与しておき、この情報を重複データ判定部39で参照出来るようにしておくことにより、重複相手先の識別データのコンテンツタイトルやフレーム位置の検出が可能となる。
最近のテレビジョンなどの映像装置には通常2チャンネルのチューナとデコーダが搭載されている、空いているチューナ、デコーダを利用して、先の重複データ判定部39に利用する放送局の一定期間(例えば週間)で放送される番組全体を記憶しておくことによって、全ての番組のCMを事前に探し出しておき、新しく放送される番組から、この区間を自動的に検出し、他の放送に切り替えるなど、映像コンテンツを直接もたない映像装置でもインテリジェンスな映像装置としての応用が可能となる。
以上は図2の繰返しフレーム自動判定部93の一形態である。
以上のように意図的要因により重複するフレーム以外の、組合せ確率要素だけでは避けられない、偶発的に発生する、類似した特徴のフレームを前記説明のとおり重複データと判定した場合には、偶発同一フレーム17に識別情報を付与し、当該検索対象範囲内で重複を回避し唯一無二化を保証したデータとすることが出来る。
このような構成とすることは識別データ10の確率組合せをいたずらに高め、データサイズを肥大化させることなく適切なデータ長とすることが出来るため、映像コンテンツの再生に同期連動させての検索や、高速なデータ検索を可能とするものである。
以上図14の連続外重複データ判定部65は図2の重複データ判定部39の一形態である。
検索時間の詳細に関しては後述するが、以上のように前記データベースの検索補助データとして、前記識別データを構成する少なくても1つの前記要素データの量子化データの組合せで構成される量子化データのグループごとに識別データを記憶登録したメモリを用意し、このメモリを用いて要素データの量子化データのグループ別の識別データを検索する方法を併用して映像コンテンツのフレームの検索をする方法は重複する識別データ10の検索以外にもさまざまな識別データ10を高速で検索するための検索補助データ部91として利用できる。
以上説明してきた通り、識別データ10ならびにインデックス列12はさまざまな検索条件で、検索をかけさまざまなフレームの検出をするものであるが、本例の場合、これらのデータはアナログ信号をもとにしてA/D変換したものであって、データ同士を一致検出する際に避けて通れない、信号レベル誤差、微小ノイズ、最小bitのエラーによるアナログ誤差を考慮する必要がある。
アナログをデジタル化したデータ同士のデータを比較する上で、お互いの元のアナログ量のデータの誤差やノイズを吸収する方法の一つとして、一方のデータに一定の幅を与えて一致をとる事が有効である。
本実施例では、識別データ10のデータ量を低減し高速検索可能にするためアナログ誤差補正を特徴要素データ9のLSB(最少量子化ビット)のみで実現できるよう、全ての特徴要素データ9を4bitで抽出している。
本実施例の場合、R、G、B、音声それぞれを4bitで変換しており、その1bitは1/16、1bit当たり6%程度の重みを有している。
従がって、1bitの丸め込みをすることにより互いのデータのアナログ誤差による数%程度の画像信号、画像信号の誤差は解消できることになる。
図15(検索用インデックス列のメモリ配列)は以上の内容を実現するために、検索対象インデックス列62を検索する際にワークメモリにインデックス列12を事前に+補正、−補正をかけ、補正なしの元データと並列にしてそれぞれのフレームがフレーム位置に対応するよう検索用ワークメモリに補正データを展開して検索対象インデックス列62とすることにより、連続する検索、検出を高速にするものである。
本実施例では図15に示すようにR、G、B、音声それぞれの特徴要素データ9の14種を独立させ、それぞれの4bitデータに最小bitの+補正、−補正をかけた2組のデータと元データを含み並列に配列した3組のデータとして並列に一致検出を行い、アナログ誤算の上限から下限までの誤差補正を最少処理で実現させたものである。
従って本実施例の場合組合せ確率上では4bitデータを3bitデータにコンバートしたデータとほぼ等価である。
図16(インデックス列検索部、識別データ検出部)は図7のインデックス列検索部、識別データ検出部の詳細を示すものであり先に説明の並列に配列した3組のデータを一致または近似検出することにより誤差を含んだデータ同士の検索を行うものである。
検索対象インデックス列62と、比較基準となる識別データ60とお互いの特徴要素データ9同士を並列に計14回一致検出部66で一致検出をさせ、OR論理回路出力が1フレーム区間で14回とも出力されると14進カウンタの桁上げ信号が出力され一致または近似検出がなされる、これによってアナログ誤差は吸収補正され目的のフレームが検出される。
以上は図2のインデックス列検索部54、識別データ検出部55の一形態である。
一方、放送番組やDVDの1つの映像コンテンツは特別なものを除き、最大で2〜3時間程度であり、2時間映像コンテンツを例にすると、2時間×60分×60秒×30フレーム=216,000フレームとなる。
本実施例の識別データ10の特徴要素データ9部分のデータによるデータサイズは一つのフレームで4bit×14組=56bit=7Byteサイズである。
この場合2時間番組は216,000フレームで合計約1.5MByteとなり、その他の重複データ識別情報、フレーム関連情報を含めても2MByte程度のデータサイズで十分に収まる範囲であり、データ圧縮も可能であるのでデータ送受の負担も少ない。
最近普及されてきたBD(ブルーレイディスク)は片面1層で約25GByteのメモリ容量を持ち、デジタルBS放送をMPEG(DR)で約2時間分記憶することが出来る。
1万分の1以下に圧縮されたインデックス列12が、これから説明する映像コンテンツの視聴性、録画装置、再生装置の操作性、編集性に大きな効果をもたらす意義は大きい。
データサイズ、検索時間などに大きな制限がない場合にはデータ数を多くし、さらに
加価値の高いインデックス列とすることが可能である。
先に説明の図16は論理回路を汎用ディスクリート部品を用いたハードウエア回路で一致または近似検出回路を構成させたものであるが、その構成はハードウエアに限定されるものではない。
通常の検索は識別データの基本部分11の特徴要素データ9部分の検索が主体であり、検索条件に適合する場合に、これに続き重複データ識別情報13ならびに相互連動情報21を参照することになるので、基本部分の要素データ、通常要素データ8、特徴要素データ9部分の検索時間について説明する。
14種類の要素データであるので、1フレームごとに2スペース程度のインターバルをおき、0.1μ秒のインターバルで2時間映像コンテンツ全てを検索し、検出する場合、0.1μ秒×16回(14回一致演算+2回インターバル)×216,000フレーム≒350m秒≒10フレーム時間となる。
後述するが、一つの識別データ10をもとに2時間番組の全体をこの程度の検索時間で検出することが出来るのであれば、通常の使用においては十分である。
通常映像装置の映像コンテンツの再生、早送り、巻き戻し、一時停止、停止などの操作において映像コンテンツの停止、一時停止などのフレーム位置はインデックス列に記憶しておくことが出来るので、途中からの再生開始時にはこのフレーム位置周辺の識別データ10を参照することにより、これらの操作による検索時間をほとんど必要としないで再生フレームを見つけることも可能である。
このような環境が利用できない場合も想定して、以降この350m秒(0.35秒)を検索時間の総量(検索時間の最大値)の実例として説明する。
図16で示す論理回路をカスタムロジックで構成し、0.01μ秒程度のインターバルで2時間の映像コンテンツを検索させる場合の検索時間は35m秒である、さらに特殊な用途向けに14組の特徴要素データ9を1クロックで演算できるよう並列処理させることにより、3m秒以内での検索も可能となる。
以上で本願発明の識別データ10とインデックス列12の作成ならびに検索の基本概念の説明を終え以下、これらを利用した応用例を説明する。
先ず、図17、図18をもとに同一フレームを検出するための方法を説明する。
図17(同一フレームの検出概要)で示す通り、もとになるインデックス列63のフレームAならびに、三つのフレームで指定されるフレームB対をもとに、検索対象インデックス列62の中から同一フレームを探し出そうとするものである。
このようにフレームを対にして検出するのは、前述の通りCMなどの場合にCMの開始位置と任意の中間点、そして終了点の3フレームを登録しこれらに名前付けしておけば、一回の登録で他の関連番組のCMの開始位置から終了位置までをまとめて検索し、検出することが出来からである。
また、特殊な映像フレームで、静止画や無音状態が連続するような場合でも、これらの対指定を適切にすることにより、検出の精度を上げ、確実に目的のフレームを選び出すことが出来るからである。
図17をもとに、フレームAの場合の検出方法を説明する。
もとになるインデックス列63の中から指定された識別データ10を検索基準データ60として、検索対象インデックス列62の開始のフレームからフレームごとに一致または近似を検出して、検索対象インデックス列62の中から同一フレームを検索し検出する。
検出されたら、当該フレームのアドレスならびにフレーム位置データ35を読み取り記憶する、また重複データ識別情報13を確認し連続重複フレームの連番データを確認し、連続重複フレームであればその範囲を記憶しておく。
最後のフレームまで一致または近似を検索し検出して完了となる。
従って検出に要する検索時間の総量(検索時間の最大値)は2時間程度の映像コンテンツで前述の通り0.35秒程度である。
フレームのアドレスやフレーム位置データ35が分かれば、当該フレームは映像コンテンツの開始のフレームから起算する時間のどの時刻、何番目のフレームであるかなどのフレーム位置またはフレーム区間6は相互参照可能である。
フレームB対の検出については、T1タイミングのフレームに関しては上述の通り、検索対象インデックス列62の最初のフレームから同一フレームを検索し検出する。
以降T2のタイミングのフレームに関しては、T1で検出した同一フレームからTa時間後に相当するフレーム位置の識別データ10を直接確認し一致または近似検出を行い一致または近似することを検出すればよい、T3タイミングのフレームに関しても同様である。
検出されたフレームが連続重複フレーム14であれば、図13に示す通り、その時間を加味して比較することは云うまでもない。
従って、検出時間は独立した一つのフレームを探すのとほとんど変わらない。
最初の一つの同一フレームの検索、検出に多少の時間がかかっても、フレーム単位の時間で紐付けされる以降のフレームの検出時間が極めて短いのがインデックス列12の特徴である。
言うまでもなく以上の同一フレームの検索は、映像コンテンツ自体のフレームが同一であることを意味している。
図18(同一フレーム検出部)は、複数のフレームを対にして検索することは先に説明の通り、検出の精度を高めるにも極めて有効であり、信頼性の高い検出が可能になる。
以上をもとになる画面を確認しながらT1、T2、T3フレームをそれぞれ設定しフレーム名称を登録し、これら3つのフレーム対を別な映像コンテンツの中から探し出し表示させた例である。
以上図17、図18は図2の同一フレームの検出25の一形態である。
以上のように、いくつかの識別データ10を対にして複数フレーム条件でフレーム検出をする場合、その組合せ確率は天文学的な数字となり、グローバルな映像コンテンツの中から特定の同一フレームを検索、検出することも可能で、たとえば大規模な映像コンテンツサーバと、インターネットサイトの超大な映像コンテンツのデータベースの中から、違法にコピー(複製)された映像コンテンツを探し求めるなどの場合にも利用可能である。
一例として、インデックス列が用意された2時間番組10、000本の映像コンテンツの中から一組のフレームを検出する場合でも、先に述べた検索時間を一本0.35秒で3500秒=1時間、一本3m秒とすれば30秒で検索可能となる。
以上のように、1映像コンテンツ当たり、いくつかの識別データ10を検索して同一のデータがあれば、その映像コンテンツを詳細に検索して完全に複製された映像コンテンツとして判定することが可能である。
以上は図2の複製判定部94の一形態である。
以上の実施例の識別データ10には、当該フレームの画像、音声の特徴と、当該フレーム前後のフレームの画像、音声の特徴が多種含まれており、これらの中からいくつかの特徴要素データ9を選択し基準値を定め、組合せ条件を指定することにより、さまざまな映像コンテンツの中から特定のフレームを探し出すことが可能になる。
一例として、映像コンテンツの中からフレーム変化(カット点)を検索する例を以下に示す。
先に述べたフレームごとの特徴抽出のうち先行するフレームとの画像信号、音声信号の変化にかかわる特徴情報である
1)nフレームのXフレーム先行するn−Xフレームとの明暗、色調、音量レベルの差分量(変化の大きさ)を示す特徴要素データ9
2)nフレームのXフレーム先行するn−Xフレームと比較し画面全体の内、どのぐらいサンプリングポイントが変化しているかを示す変化範囲の特徴要素データ9
3)nフレームのXフレーム間のサンプリングポイント平均の動きの速さを示す変化速度の特徴要素データ9
以上3種の特徴要素データ9はいずれも、フレーム間の変化をとらえたデータであり変化の大きさ、広さ、速さの度合いを示す特徴データである。
図19(フレーム特徴データ設定部)はフレームの特徴検出の例としてフレームの変化点(カット点)を検出する例である。
図19の上段に示すように、本実施例はフレームごとにそのXフレーム先行するフレームと変化の度合いを検出しているので、フレームA群からB群に急激に変化する時など、nフレームからn+Xフレームまでは、上述の特徴要素データ9は3種ともそれまでのフレームと比較し大きな値となる。
本例では差分特徴要素データ9であるR、G、B、音声信号の4種を合計し4で除し4bit化して、以上3種の特徴要素データとも4bitとし、その変化の度合いに応じフレーム変化点(カット点)の検出をする場合の実施例を示したものである。
図19の下段左は3つの特徴要素データ9がいずれも7を超えた場合をフレーム変化点(カット点)とし、これらの3つの要素のAND論理回路により実現させたものである。
図19の下段右は、3種の特徴要素データ9の変化量の閾値と演算式を任意に設定できるようにしたもので、変化の仕方を、大きい/普通/小さい、広い/普通/狭い、速い/普通/遅い、の3段階とし、それぞれの組合せを任意に設定させることにより、変化が少ない、ディゾルブカットやワイプカットや、細かいフレームの変化かから大きなフレームの変化の検出にも対応できるフレーム変化点の検出の例であり、指定した検索条件で一つの映像コンテンツの中で該当するフレーム変化点(カット点)の件数ならびに前後で一番近いフレーム位置を表示させている。
以上変化点を検出する手法を示したが、同様に識別データ10の個別の特徴要素データ9にもとづく、画像特徴検索指定条件、音声特徴検索指定条件、変化特徴検索指定条件、およびこれらの組合せされた条件、により要素データごとのデータレベルの範囲を指定して検索することにより映像コンテンツの中から画像の特徴と、音声の特徴と、変化の特徴、たとえば音の出ていないフレーム、暗い画面のフレーム、黒画面のフレーム、画面全体の動きが激しく、赤っぽく、音声のレベルが高い画面、されにこれが複合されたフレームなど、効率的に目標とするフレームの位置、フレームの区間を検出することができる。
これらの範囲を指定し検索をする特徴検索機能は要素データを特徴要素データ9として構成させることにより実現出来るもので、要素データが通常要素データ8のみで構成される識別データの検索例えば、同一データ、のみを対象としたフレーム検索よりその応用範囲を大幅に拡大するものである。
図20(フレーム特徴検索の場合のインデックス列検索部、識別データ検出部)は先に説明の図16を以上のようなフレーム特徴検出など検索データの範囲を指定して検索するよう拡張したもので、図7に示す特定条件設定部57として複数の検索データを上限値と下限値で指定し、これを検索条件切り替え部68で選択し、補正した検索対象インデックス列の1フレーム当たりのお互いの特徴要素データ9同士を並列に計14回範囲検出部67で検出をさせ、OR論理回路出力が1フレーム区間で14回とも出力されると14進カウンタの桁上げ信号が出力され目的のフレームが検出される。
順次検索条件切り替え部を切り替え同様な検索を行い様々なフレームの特徴を検出することが可能である。
ここで、上限値と下限値を同一のデータとする場合には先の図16による検索内容と同様である。
以上図19、図20は図2のフレーム特徴の検出27の一形態であるとともにインデックス列検索部54、識別データ検出部55の一形態である。
図21(再生高度化支援装置ならびに次世代映像装置)は本願発明のフレーム検索用データ作成装置、フレーム検出装置のさまざまな特徴を、再生高度化支援装置75として汎用の録画装置、再生装置71に適用した例であり、その全体構成は次世代映像装置80の例として新しい録画装置、再生装置71の一例を示すものである。
以下にその概要を示す。
録画装置、再生装置71には表示装置70ならびに必要信号が接続されており、この画像信号、音声信号51を再生高度化支援装置75が利用する構成となっている。
アプリケーションソフトウエア72は、再生高度化支援部75全体を制御するとともに検索、検出された識別データ10の相互連動情報21をもとにさまざまな連動制御を実行するものである。
録画装置、再生装置操作部76は利用者の操作にもとづき、リモコン信号送信器74を通じて、録画装置、再生装置71に必要信号を送るとともに、インデックス列12の相互連動情報21の設定やデータ登録などの編集を行うものである。
インデックス列12をもとにして録画装置、再生装置71とリモコン制御のフィードバックをとるための手法として、録画装置、再生装置71の画像信号、音声信号51をもとに識別データ作成部50で識別データ10を生成し、事前にインデックス列登録部56により記憶登録されたデータベース18内のインデックス列の中から選択された、インデックス列を検索対象インデックス列62をインデックス列検索部54で検索しその画像信号、音声信号のフレームのフレーム位置を検出するものである、この動作は再生に連動して繰返し実行される。
また検出したフレーム位置に付与された相互連動情報21をアプリケーションソフトウエア72で、外部接続機器73、ならびにリモコン信号送信器74で、録画装置、再生装置71を操作するものである。
以上のようにアプリケーションソフトウエア72は常に録画装置、再生装置71の再生フレームのフレーム位置を監視できるので従来のリモコン信号送信器のオープンループ系の制御とは大きく異なる高度なフィードバック制御が可能となる。
通信部84はインターネット回線を通じインターネット情報をブラウザし、さらには後述するインターネット上の映像コンテンツの事業者が提供するインデックス列12をダウンロードするものである。
映像、音声出力部83は操作、設定、編集画面などの表示やインターネット情報や音声をテレビジョンおよびディスプレイに出力するものである。
外部接続機器73は再生高度化支援装置75に接続され再生フレームに連動して制御、操作される、本装置以外の図3に示される映像装置41、マルチメディア機器44、外部機器45のいずれかである。
もちろんこの制御、操作信号で録画装置、再生装置71自体を直接制御、操作するようにすることも可能である。
ランダムアクセス制御信号85は録画装置、再生装置の映像コンテンツを直接ランダムアクセスするための信号である。
この信号が用意されることにより、映像コンテンツの編集、再生、操作のさまざまな場面で連動をとり映像コンテンツを様々な形で利用することが可能になる。
これについては後述する。
以上図21は図2の連動制御部92の一形態である。
本実施例の場合、放送番組を録画する際、自動的にインデックス列12が生成され、すぐに効率的な編集や高度な視聴を可能にしている。
以上の再生高度化支装置75を装備した録画装置、再生装置71が次世代映像装置80であり本願発明の機能を中心に記載したことは言うまでもなく、その他の機能を具備することを妨げるものではない。
再生高度化支援装置75は、映像装置として現在市販されている汎用の録画装置、再生装置71に付属し一連の動作をさせるアダプタとして用意することが可能である。
また汎用パソコンに識別データ作成部50、インデックス列登録部56ならびにインデックス列検索部54をアダプタとして装着し再生高度化支援装置75を実現させることも可能である。
これは先に説明の図3の映像装置本体に連携する映像装置の1つとして、識別データを作成しインデックス列を登録する手段を有する映像装置用アダプタ90の一例である。
このアダプタのインデックス列12は連携する映像装置の完成されたインデックス列の受給部89でインデックス列12を受け取り利用される。
図22(連続フレーム検出)はこの図21の接続構成で録画装置、再生装置71から出力される再生信号をもとに事前に登録されている検索対象インデックス列62を検索するときの連続フレーム検出の概要を示している。
録画装置、再生装置71は再生開始または早送り、巻き戻し、スローサーチなどの動作が完了し再生状況になった場合に正規の画像、音声信号を再生する。
この再生開始された、再生信号をもとにして、識別データ作成の元になる元映像コンテンツのフレーム位置を連続検出する場合、識別データの構成が先行するフレームとの比較を行っている要素データを含む場合、再生開始からXフレームまでの識別データ10は不完全なものとなる。
従がって図22に示すように通常、ステップ1は再生が開始されXフレーム以降のフレームが最初の検索に利用可能となるので、図22に示すT1のタイミングで識別データ10を比較するための検索基準データ60として、検索対象インデックス列62の最初から順次フレームごとに検索し、同一となるデータの識別データを探し出すことによって識別データ作成の元になる映像コンテンツのフレーム位置を検出し、以降は連続して再生されるフレームから抽出される識別データを読み取り、該当するフレーム位置の識別データ10と同一データであることを確認すればよい。
図22のように一定時間Tbをおいて、正確に同期するT2、T3のタイミングで、以降の識別データ10が、所定のフレーム位置の検索対象インデックス列62上の、識別データ10と同一であるかどうかを確認検出することで、フレーム位置の連続検出が可能である。
従ってTaは装置検索処理能力で決定するものの、以降Tbは毎フレームごとに実施させることも可能であるが、隣接するフレームでは連続フレームとなる頻度も多くなることを勘案し、数フレームごとに同期し該当するフレームの一致検出を繰り返せばよく、通常、再生の一時停止や早送り、巻き戻しなどのトリックプレー操作が行われない期間継続することが出来る。
先に述べた先行するフレームとの比較データによる再生開始時の識別データ10の不完全による課題も簡単に補完可能である。
最初に抽出された識別データが不完全な場合、識別データ10の不完全でない要素データ部分のデータによって、対象とするインデックス列を検索して該当するいくつかの識別データを選択しておき、必要な間隔後、新たに得られた完全な識別データ10が与えられた際、先に選択しておいたいくつかの識別データ10のフレーム位置より、必要とした間隔のフレーム時間に相当するフレームのみを検索することにより、この完全な識別データ10の検索時間を極めて短いものとすることが可能である、従がって比較するフレームの間隔が、この検索時間この場合0.35秒≒10フレーム分に相当するので、10フレーム以内の間隔のフレームとの比較により構成される識別データの場合は検索時間をほとんど影響なくすることが出来る。
また、再生、一時停止、早送りが頻繁に繰り返される場合でも、最後の再生信号をもとに再生フレーム位置を記憶しておくことにより、検索の範囲や時間を大幅に削減することも可能である。
このような条件が得られなくても、T1フレームを検索し検出するに当たり、最大0.35秒程度以降、高精度で、高信頼性で、リアルタイム性の高い識別データ作成の元になる映像コンテンツのフレーム位置の同期検索が可能となる。
以上のフレーム位置の連続検出方法を用いることにより、予めインデックス列12の目的とするフレームの識別データ10に先に説明したさまざまな装置例えば、映像装置、マルチメディア機器、外部機器等のいずれかを連動制御するための情報を、相互連動情報21として識別データ10に付与しておき、前記識別データ作成の元になる元映像コンテンツを再生の際、上記映像コンテンツの再生に連動し、このインデックス列を同期検索し、上記映像装置、マルチメディア機器、外部機器等を制御するための情報、相互連動情報21を検出することによって映像コンテンツの再生フレームに連動して対象とする映像装置、マルチメディア機器、外部機器等のいずれかを連動制御させることが可能になる。
以上の図22は図2の連続フレームの検出26の一形態であるとともに連動制御部92の一形態である。
図23(再生高度化支援装置の操作画面)は図21で示す、録画装置、再生装置操作部76の一例を示すものであり、これを利用することにより、さまざまな高機能のリモコン信号送信器74の操作が可能になる。
図23に示す、目的時間設定77は録画装置、再生装置操作部76に目的時間を指定し、リモコン信号送信器74に制御信号を送り録画装置、再生装置71を操作する。
新操作機能ボタン78は早送り、巻き戻しを時間指定し、リモコン信号送信器74に制御信号を送り、録画装置、再生装置71を操作する。
同一フレームサーチ79は現在視ているフレームと同じ、他のフレームを探すよう指定し、リモコン信号送信器74に制御信号を送り、録画装置、再生装置71を操作する。
連動情報81は映像コンテンツに連動するインターネット情報等を視るための操作をする。
詳細検索82は図18に示すフレーム検出の操作を選択する操作機能である。
このような高度な操作が実現できるのも、録画装置、再生装置71とリモコン信号送信器74の制御信号間で同期フィードバックループを構成させ、常に再生されるフレームの位置、時刻を認識することが出来るからである。
次世代の録画装置、再生装置のリモコン機能についてはさまざまなアイデアがあるものの現在市場で利用されているのは赤外線リモコン方式と無線によるリモコン方式である。
無線リモコンは指向性のないリモコンとして最近の一部の装置に装備され始めているものの大半は赤外線リモコンである。
現在定着しているDVDなどのリムーバルディスクの録画装置、再生装置や近年急速に普及してきたHDD録画装置と、上述の赤外線リモコンを用いて、録画同期機能を実現させるための具体的手法を説明する。
図24(録画装置、再生装置動作時間概要)は手動で操作する再生ボタンをもとにリモコン信号が発射され、発射信号を録画装置、再生装置が受信し、再生され、一定時間経時後に再び手動で操作する停止ボタンをもとにリモコン信号が発射され、発射信号を録画装置、再生装置が受信し、再生停止するまでのタイムチャートである。
図中、シーク時間はHDDヘッドのアクセス時間であり、DVD等のリムーバルディスクの場合はキャリッジ移動時間である。
リモコンが赤外線の場合、1リモコン信号は規格で108m秒となっている。
録画装置、再生装置を自動コントロールする上で、遅延時間等が一定なものはこれを見越してコントロールすればよく、重要なのは、繰り返し実行する際の時間のばらつきである。
従って、現在市場で流通している録画装置、再生装置のこれらの実力性能にあった応用方法を検討する必要がある。
図25(録画装置応答時間実測試験)は、パソコンに連動可能な赤外リモコンを用い、現在市場で広く利用されているHDD録画装置の応答時間実測試験結果一覧表である。
当該機の場合、早送りは5段階であり、公称1.3倍、10倍、30倍、70倍、200倍モードを備えている。
再生の場合、再生ボタン信号を発射後0.5秒、1.0秒、2.0秒、5.0秒のインターバルをおいて一時停止ボタン信号を発射した場合の実際の再生時間を計10回、合計40回試験したものである。
結果として、平均して0.27秒実際に再生される時間が指定した時間より短くなっているものの、ばらつきの範囲は0.1秒の範囲である。
このデータは非常に重要であり、0.27秒間圧縮される再生時間と0.1秒間のばらつきを考慮して自動制御を行う必要がある。
同様に高速モードについては、再生ボタン信号発射から順次早送りボタン信号を各1秒ごとに発射し順次高速モードへステップアップして行き、目的の高速モードにおいて1秒、2秒、3秒、10秒の4種のインターバルをおいて一時停止ボタン信号を発射した場合の実際の早送り移動時間を各10回、それぞれ合計40回試験したものである。
試験結果が示すとおり、従来の磁気テープ方式の録画装置、再生装置と比較し送り量の直線性は極めて高精度で保証されていることが分かる。
添付はしないが、巻き戻しにおいても同様の性能であり、リムーバルディスクの動作についてもほぼ同等な性能である。
また幾つかの他機種の録画装置の試験においては、早送りモードや、スローサーチの機能に差異が見られるものの遅延時間やそのばらつきは同程度の性能である。
従って、それぞれの録画装置、再生装置のそれぞれの速度での遅延時間や最大ばらつきを考慮し、そのばらつきを保証する制御を行えばよい。
図26(目的フレームサーチ概要)にもとづき、前述の応答時間を実測したHDD録画装置を使用する場合の操作の代表例として図23の目的時間設定77に示す目的時間のフレームへ移動する場合の自動制御の概要を説明する。
以下の説明および図26中の再生、早送り、巻き戻し、一時停止の表記ならびに記号は説明を省くがリモコンから自動で発射される信号を意味している。
例えば一時停止している現在フレームより15分前の目的時間フレームにフレーム移動する際、アプリケーションソフトウエアは識別データ10をもとにしたフィードバック情報により常に現在フレーム(再生中、一時停止中いずれも)のフレームアドレスを認識しているので、現在フレームと15分前のフレームアドレスを演算し、最高速モード、200倍モードで、約4.5秒(4.5秒×200倍は15分相当)間巻き戻しし目的時間に接近し、実際の時間を確認するため再生時間が圧縮される時間、0.27秒ならびに最大ばらつき時間0.1秒よりやや多めの、約0.5秒間再生にする。
再生にして得られた実際のフレーム位置を確認する。(図26のステップ1参照)
再生にして得られた時間が例えば目的時間に比較し45秒手前であった場合、30倍モードで約1.5秒(1.5秒×30倍は45秒相当)早送りし目的時間に接近し、上記同様、実際の時間を確認するために再生にする。
上記同様再生にして得られた実際のフレーム位置を確認する。(図26のステップ2参照)
再生にして得られたフレーム位置が例えば目標時間に比較し3秒10フレーム(3.33秒)手前であった場合、再生モードのまま、目標位置までの時間(3.33秒)から実際にかかった検索、検出時間(約0.35秒)を差し引き、圧縮補正時間(0.27秒)を加算し結果として3.25秒の演算を行い、この時間経過後一時停止する。(図26のステップ3参照)
これにより、数フレームの精度で目的時間のフレームに到達可能となる。
ステップ1からステップ3までの時間は10秒程度である。
目的時間のフレームが一分以内の近傍であれば5〜6秒の時間で指定する目的時間のフレームに到達可能である。
全ては最終段階のステップ3での演算で精度は決定する、これらの精度は利用する録画装置、再生装置の特性に依存するところであり、学習機能を利用することなどにより最大ばらつき0.1秒精度(3フレーム)でのフレーム検出も可能で実運用上は支障のない精度範囲である。
スローサーチの場合、音声信号は出力されなく、前後のフレームとの時間的相関も崩れるため、先に示す識別データ10そのものでの比較検出はできない、スローサーチなど特徴データが少なく、特徴データの変化が少ない場合に高精度で指定されたフレームを確実に求めるための一例として、スローサーチの場合のデータとして予め検索対象インデックス列62より目的フレームの前後の1、2秒間のデータをピックアップしておき、識別データ10の音声ならびに、差分データを除く、平均と中心のR、G、Bデータの6組のデータで、変化がみられるフレームを事前に把握し、スローサーチ後この識別データ10が来たことをトリガーとして、目的のフレームで一時停止させることにより確実に一致するフレームを探し出すことが可能となる。
以上目的時間フレームを自動で探す例を示したが、先に説明の図23に示す新しい機能ボタンは、直接時間を指定して、早送り、巻き戻し、スローサーチをするもので映像コンテンツを精度よく短時間で編集するために極めて有効である。
以上の図26は図2の映像コンテンツアクセス部86の一形態である。
以上は現在市場に流通している録画装置、再生装置71をリモコン信号送信機74を利用して制御する場合の例を説明したが、本格的な次世代向け汎用録画装置、再生装置を実現する手法として、インデックス列12の相互連動情報21を録画装置、再生装置71の再生、早送り、巻き戻し、一時停止、録画、停止、入力切替、その他一連の操作制御を直接当該装置の制御に直接結びつけることにより、付加されたフレームの相互連動情報21により、録画装置、再生装置内の複数の映像コンテンツを渡り歩くような再生制御や、テレビジョンの入力切替を自動的に行い、複数の録画装置、再生装置を連動させて視聴するなどの、高度な再生制御が可能となる。
先に説明の図21のランダムアクセス制御信号85は、インデックス列12に付与された連動情報21をもとに、録画装置、再生装置71の記憶媒体のFAT(ファイル アロケーション テーブル)を直接アクセスし所定の制御を実現させるものである。
この信号を用いて複数の映像コンテンツの中からハイライトシーンなどを選択し切れ目なく連続的に再生する場合、通常のDVDの場合のランダムアクセスタイムは150m秒程度、高速のHDDの場合10m秒台であるので、録画装置、再生装置はこれらを保証できる操作制御を行えばよい。
図27(複数映像コンテンツにまたがるランダムアクセスの概要)は映像コンテンツD、B、Aの4個所の指定フレーム、n±0からn+Zフレームまでを自動的に連続し再生する場合のタイムシーケンスを示すものであり、図中、それぞれ、n+Zのフレームで他の番組へジャンプする場合、上述のランダムアクセスの必要時間を保証する、n+×フレームのフレームを検出することにより次に指定されたフレームのトラックにアクセスを開始し順次バッファーメモリに記憶しておき最後のフレーム、n+Zのフレームを検出することによりバッファーメモリに記憶された新しいフレーム、n±0フレームの再生を行うものである。
再生系のみならず、テレビジョンの入力切替や、音声を制御させることも可能であり、これらのフレームを後述する映像コンテンツライブラリにプレイリストとしてインデックス列12の相互連動情報21に登録設定することにより、映画のハイライトフレームや、スポーツのハイライトシーン、さらには、自分で撮影したビデオのお好みのシーンを結合させ切れ目なく再生するなどの高度な視聴が可能となる。
このランダムアクセス方法を採用することにより、たとえば一つの映像コンテンツで一度CMフレームを検出することにより、他の映像コンテンツの同一フレームを検索し再生するのに必要な時間は検索時間とアクセス時間を含めても1秒以内で実現でき、以降再生される他の映像コンテンツの同一CMをすべてジャンプして視聴することや、録画時に同一CMを検出して録画を一時中断するなど録画条件の設定にも利用可能になる。
以上のように映像コンテンツをアクセスして、再生されるフレームを連続検出し、識別データを監視する方法は連動制御として幅広く利用可能である。
これまでの説明はHDD記憶媒体、リムーバブル記憶媒体の例で説明をしてきたが近年急速に大容量化、低コスト化されている半導体メモリ記憶媒体においても利用可能である。
以上の図27は図2の映像コンテンツアクセス部86の一形態である。
最近の家庭用HDD方式録画装置においては、記憶容量が1TByteに達するものもありさらに拡大化される傾向である。
記憶される映像コンテンツのボリュームは数百時間、数百タイトルと極めて巨大化している、これらの映像コンテンツを有効に利用するにも映像コンテンツのデータ管理は重要である。
図28(映像コンテンツフレームアノテーション)はインデックス列12の応用例の1つである。
インデックス列12を利用して映像コンテンツのタイトル情報5別にフレーム単位のアノテーション、つまり、必要とするフレームに情報を与えて、フレーム検索、フレーム編集、フレーム再生、フレーム操作、を目的とするデータであり、映像コンテンツごとのインデックス列12に文字情報46としてフレームアノテーション情報48をフレーム関連情報20として付加したものである。
このような構成の映像コンテンツのフレームアノテーションを利用することにより、フレームアノテーション情報48を閲覧し、フレームサーチ79を実行し、視たいところのみダイジェストで視る、フレームに連動してインターネット情報やCMの時間帯での情報提供、あるいは特定のフレームにおいて照明やフラッシュをコントロールする、特定のフレームから別の映像コンテンツの指定フレームにジャンプするなどのフレーム編集、とこの編集にもとづくフレーム操作が実現できる。
また文字情報を含むフレームアノテーション情報48から、特定の文字を検索することにより、当該文字に対応する映像フレームを検索し、その部分のみを視聴することも可能となる。
このように、フレームごとの識別情報をもったデータベース構成のフレームアノテーションはタイムコードをもとにするフレームアノテーションに比べて効率的で確実なフレームの検出と編集を可能にする。
以上は図2のフレームアノテーション検索部98、フレームアノテーションアクセス部99の一形態である。
これまでの実施例ではインデックス列12を、デジタル系、アナログ系いずれの録画装置、再生装置にも標準装備されている通称アナログ信号をもとに、フレーム単位の識別データ10として特徴抽出、検出する方法を示したが、デジタル系の場合の例としてMPEG圧縮データ等から得られる画像データ、音声データをもとにして、フレーム単位の情報抽出ならびに情報検出を行い、本願発明に示した応用例を実現させることが可能である。
デジタルデータはさまざまな圧縮手法を用いてデータの圧縮がなされている。
画像の場合は一般的に、1フレーム内のブロック単位でのフレーム内圧縮(空間圧縮)としてDCT(離散コサイン変換)、フレーム間圧縮(時間圧縮)としてフレーム間予測、さらにはデータの出現頻度にもとづくエントロピー符号化などが代表的なものであり、フレームごとにこれらの圧縮(エンコード)がなされ画像データストリームとして送受される。
また音声の場合には音声帯域をサブバンドに分割して聴覚心理符号化などの圧縮手法により圧縮(エンコード)された音声データストリームが上記画像データと多重化され映像データストリームとして送受される。
通常このエンコードされた画像、音声データはデータの伸張(デコード)をすることにより原信号に復元され表示出力、音声出力される。
これらのデジタル映像コンテンツからインデックス列12を作る場合、再生される信号をもとにして特徴抽出したデータから識別データ10を作りこれを記憶登録するのが一般的であるが、高速でインデックス列12を作成する場合にはこれらの画像データ、音声データを伸張(デーコード)することなく、圧縮データから直接データを抽出してこれを通常要素データ8として利用することも可能である。
通常この場合、通常要素データ8の要素データは特徴を示すデータとはならない。
図29(デジタルデータによる要素データの抽出例)はデジタル放送で使用されているMPEG圧縮データから、デコード(伸張)することなく直接要素データを取得する場合の例を示すものである。
画像データは、1フレームの画像をブロック単位(8ピクセル×8ピクセル)でDCT(離散コサイン変換)によるフレーム内圧縮と、1GOP(グループオブピクチャ=15フレーム)を1組としてフレーム相互のフレーム間圧縮、さらにはハフマン符号化などのエントロピー符号化が施されて、フレームごとに圧縮データとして記憶されている。
これらのフレームごとのデータの複数のブロックから、DCTデータを採取しDCTデータの最初のデータ、つまりDC成分を抽出しハフマン符号化を復号することによって、当該フレームの輝度データ、色差データとすることができる。
Iピクチャはフレーム内圧縮だけのものであるので、これらの輝度データ、色差データは特徴データとして利用することも出来る。
Pピクチャ、Bピクチャはフレーム間圧縮されたデータであり、データの変化があったブロックのみが対象となるため、一定のレベル以上の変化となるブロックの位置(No)とそのレベルを抽出しこれを要素データとする。
これらのPピクチャ、Bピクチャのデータは通常要素データ8とすることは可能であるが特徴要素データ9とするのは困難である。
音声データは、音声帯域をサブバンドで分割しそれぞれを、視聴覚心理符号化にもとづきPCMコード化しこれをMDCT(変形離散コサイン変換)し、さらにハフマン符号化されたものとなっている。
従がって、ハフマン符号化を復号したそれぞれのサブバンドごとのMDCT値の最初のレベルデータ(DC成分)を利用することが出来る。
この音声データは視聴覚心理符号化されたものであるため特徴要素データ9とするのは困難である。
以上のように、特徴検索には不向きであるが、画像データ、音声データから直接、要素データを抽出する方法の一例を説明した、このように圧縮データをデコード(伸張、再生)せずに要素データを得ることは、識別データ10の抽出の時間、インデックス列12の抽出の時間を大幅に短縮することが可能となるからである。
例えばこの方法を使用することにより、既に出来上がっている大量の映像コンテンツのデータを一旦再生(デコード、伸張)させることなく、インデックス列12を作成しフレーム検索をかけることが出来るからである。
以上のような方法で過去の映像アーカイブスのインデックス列12を含めて検索可能なシステムを構築することにより、また新しい映像コンテンツの検索とその応用が期待出来る。
以上は図2に示した非再生データよりの識別データ作成部88の一形態である。
図30(インデックス列のバリエーション)はインデックス列のバリエーションの例であり、図のAは識別データ10の要素データの組合せの変形である、この例では組合せ数を増やす例として、比較用のフレームを差分A、差分B2枚としてそれぞれ独立した変化に関する要素データをもったものである。
図のBはサンプルポイントA点、B点の要素データを追加したものである。
全体のデータ数を増やさないようにA点、B点いずれにおいても一定のルールにもとづき、識別情報が不足するフレームやその範囲、特定なフレームに限定して付与したり、数フレームごとに識別能力の高いデータとするなどその要素データの構成内容を変化させることも可能である。
図のCは識別データに、他の認識機能から得られる、音声認識、文字認識、顔認識、スマイル認識をフレーム関連情報20として付与した例である。
このようにほかの認識機能により当該フレームの音声やテロップさらには人の顔、最近のデジタルカメラで利用されている人の笑顔を認識する機能と本願発明を組合せすることにより、さらにさまざまな効果が生み出される。
これらの機能が先に述べた映像コンテンツのフレームアノテーションに活用出来れば、その応用は図り知れないものとなる。
インデックス列12のデータ量を少なくするために、例えば5フレームごと、またはIピクチャのみ(15フレームごと)を識別データ10とするなど、識別データ10を一定の割合で間引きしてインデックス列12とすることも可能である。
このようにインデックス列12を間引きする場合、最初に比較される識別データ10で該当するフレームがない場合、続くフレームの識別データ10で連続して比較検索することにより該当するフレームを検索すればよい。
フレーム位置検出精度が低下するものの、間引きしたインデックス列12であるため検索データは短いが検索の回数が増えるので検索時間の総量(検索時間の最大値)は変わりない。
反対に検出の精度を高めるために、複数フレーム分の識別データ10をグループ化して検索基準とする方法は先に説明の通りである。
インデックス列12のデータ量を少なくするために、それぞれの要素データごとにフレーム間で比較し、変化のないフレーム期間をRUNレングス係数31として圧縮することが有効である。
図31(インデックス列の圧縮例)は識別データ10の要素データをフレーム間データ圧縮する例である。
フレームにおける信号またはデータは一定期間同一となる場合が多いことを利用して本例では繰返し期間を15フレームとし、その最初のフレームを起点とし同一信号レベルや同一データとなるフレーム期間をRUN31で指定し、その期間のレベルをLEVEL係数32として指定したものである、表の空欄部分は上記RUNレングス31係数の期間同一のデータとなるためデータは不要となる、以上のようにRUNレングス係数とLEVEL係数32を利用することにより、RUNレングス係数31の分データは増えるものの、フレーム間で連続するデータの確率の多い画像に関するフレーム情報から抽出される要素データのデータを効率よく圧縮することが可能となる。
データの記憶、送受の際にはこのように圧縮されたデータとしておき、検索の際はこれを解凍して使用することにより、メモリ数、データ転送の負担を低減することができる。
識別データ10を再生に合わせたオンライン信号またはデータをもとに作成する際、利用出来る信号は以下の入出力を利用することが可能である、
(1)アナログ画像出力信号の場合には、コンポジット信号(Y/C混合)と、S映像信号(Y/C分離)、コンポーネント映像信号(Y/Cb/Cr)と、D端子信号(Y/Pb/Pr)と、のいずれかから得られる、輝度信号、色信号、色差信号の複数の信号
(2)アナログ音声出力信号の場合には、ステレオ信号またはマルチチャンネル信号の少なくても1つ以上の信号
(3)デジタル出力の場合には、IEEE1394(通称アイリンク)またはHDMI(ハイ-デフィニション マルチメディア インタフェース)信号
(4)識別データ専用信号またはデータとして映像装置本体が出力する信号またはデータ。
以上は映像装置本体42自身またはこの装置と通信回線で連携する映像装置43のいずれでも利用可能であり、無線によるデータの送受も可能である。
以上は図2の再生信号またはデータよりの識別データ作成部87の一形態である。
一方識別データ10を非再生、オフラインで作成する場合に利用出来るデータは
映像装置内部に記憶された映像コンテンツデータおよびリムーバルディスクとして搭載されたメディアの映像コンテンツデータである、フレームごとのMPEG、AVI、DivX形式などのフレーム圧縮データである。
以上は図2の非再生データよりの識別データ作成部88の一形態である。
また作成完了したインデックス列12は、
(1)他の装置から共有ファイルとしてデータの供給を受ける
(2)他の装置から通信手段によりデータの供給を受ける
(3)他の装置からUSBメモリやメモリカード等のメモリ媒体によるデータ交換手段によりデータの供給を受ける、ことが出来る。
これらの場合他の装置はインデックス列12を作る手段のみだけで、作成完了したインデックス列12を受け取った装置が検索を行いさまざまな目的に使用する場合も可能である。
以上は図2の完成されたインデックス列の受給部89の一形態である。
また識別データ10ならびにインデックス列12の標準化を行い
(4)映像コンテンツ事業者により放送電波または通信回線を通じてインデックス列データの供給を受ける
(5)映像コンテンツ事業者により映像コンテンツと同一のリムーバル記憶媒体に記憶されたインデックス列データの供給を受ける
以上の手段によって映像装置に取り込みこれを利用することも可能である。
このように映像コンテンツ事業者がインデックス列を供給するような形態が出来れば、例えば野球番組を録画した番組の中からダイジェスト部分のみを視聴してもらう、CMの場面では関連する製品のインターネットホームページを案内するなど、事業者のニーズによる新しいさまざまな応用形態が考えられ、各種のマルチメディアと映像コンテンツが真に融合した新しい映像文化、放送文化の創出が期待できる。
以上は図2の完成されたインデックス列の受給部89の一形態である。
フレーム検索用データ作成装置、フレーム検出装置の機能をパソコンに組み込んだ時の応用例1として映像装置から出力される画像信号、音声信号をパソコンで取り込みパソコンで識別データならびにインデックス列を自動作成しインデックス列を記憶登録しておくか、映像装置内に記憶登録されたインデックス列を映像装置が共有ファイルとしたインデックス列を利用し、このパソコンに赤外線リモコン信号発射機を取り付けることにより、このパソコンを図3に示す連携映像装置43である、録画機、再生機などの映像装置の高度な制御、編集を目的とした、遠隔編集装置や遠隔制御装置(リモコンを含む)とすることが可能であり、専用機とすることも可能である。
このパソコンを遠隔編集装置や遠隔制御装置とすることにより、さまざまなフレームの検索とこの結果にもとづくさまざまな映像コンテンツの編集、操作が容易に実現出来る。
また通常の赤外線ボタン式リモコンでは苦手な文字入力や、複雑な編集や制御をさせることが可能となる。
通常の場合は赤外線ボタン式リモコンを使用し、高度な編集、制御の時のみこのパソコンとすることが出来る。
今後の新しい映像装置においては赤外線による遠隔制御以外、無線、有線での制御も可能である。
以上の応用例はフレーム検索用データ作成装置、フレーム検出装置である本願発明が解決しようとする課題の具体的テーマの1の適用実施例である。
フレーム検索用データ作成装置、フレーム検出装置の機能をパソコンに組み込んだ時の応用例2として上記同様のインデックス列に音声、音楽や画像(写真)や、編集情報などの文字情報45、そしてURL指定したインターネット情報47などのマルチメディアを連動するための情報を付与しておき、映像装置から出力される画像信号、音声信号から得られる識別データを比較基準データとしてこのインデックス列12を連続検出することにより、図3記載のマルチメディア機器44として、映像コンテンツのそれぞれのフレームに、音声、音楽や画像(写真)や、編集情報などの文字情報45、そしてURL指定したインターネット情報47などのマルチメディアを映像コンテンツのフレームに連動させ閲覧する、外部機器45としてパソコンに接続された照明、フラッシュ、カメラ、ビデオカメラ、プリンタ、等あらゆる目的の機器を連動する、ことが可能となる。
以上の応用例はフレーム検索用データ作成装置、フレーム検出装置である本願発明が解決しようとする課題の具体的テーマの2の適用実施例である。
パソコンを以上のように活用する場合の1例として、映像装置本体42はデータベース18を共有ファイルとしてパソコンと共有することにより、インデックス列12を映像装置本体42のみならずパソコン双方で効率的に利用、活用することが可能になる。
これまでいくつかのインデックス列の利用例を説明してきたが、これ以外の応用例を紹介する。
特徴要素データ9を使用した識別データ10を検索し検出された、黒画面、音無し画面、変化点(カット点)などの特徴をもつフレームならびに、自動判定されたCMや再放送フレームの開始位置、や終了位置、のフレームなどから必要なものを選んで、これをチャプタマークとして利用することが出来る。
以上は図2のチャプタマーク作成部95の一形態である。
同様に特徴要素データ9を使用した識別データ10を検索し検出された、黒画面、音無し画面、変化点(カット点)などの特徴をもつフレームならびに、自動判定されたCMや再放送フレームの開始位置、や終了位置、のフレームなどから必要なものを選んで、これを種類別に時系列表示することにより、映像コンテンツの全体から細部に至るまでのフレームの特徴、種類とその位置を視覚的に認識可能となり、これによりフレーム探しに多くの時間と労力を必要とした映像コンテンツのフレーム編集を極めて効率よく高精度で実施することが出来る、
以上は図2の検出フレーム時系列表示部96の一形態である。
以上のような時系列表示を確認し、例えば表示されたフレームの近隣のフレームを指定して、指定したフレームの識別データ10そのものを読み出すことや、特徴として表示することが出来る。
このようなフレーム検索はオフラインで高速に実施することが出来るので映像コンテンツの詳細な編集に有効である
以上は図2の指定フレームの検出28の一形態である。
以上のように、タイムコードとは異なり、さまざまな応用が可能な映像コンテンツのフレームデータベースであるインデックス列を一貫活用することによって映像装置や映像を対象とする専門機器の構成を簡素化し、低コストで、多目的で、付加価値の高い商品を実現させることが可能になる。
映像装置からタイムコードを送受出来る映像装置にあってはフレームの位置検索をさらに短くするために識別データに映像コンテンツのタイムコードを併用することも考えられる、この場合は映像コンテンツのタイムコードと等価なデータを付与すればよい。
また識別データを抽出して目的のフレームを検出した後、インデックス列(データベース)に記憶登録しないテンポラリ(一時的なデータ)な利用方法も考えられる。
本実地例の機能を実現するための、装置、部品、組立て技術は説明する必要もなく汎用映像装置、汎用パソコンで流通している装置、部品、組立て技術であり、さまざまなアプリケーション向けに低コストで応用できるものである。
本願発明の多くは家庭内ニーズに対応して説明したものであるが、最適な識別データ、インデックス列を作るための方法も確立されているので放送局、番組制作企業等のプロ向けニーズと、さらには教育向け、医療向け、防犯向け、生産向け、ゲーム向け、などの映像機器に本願発明の方法、機能、装置を応用することも可能である。
インデックス列をインデックス列検索部と、前記識別データ検出部で検出し統計的なデータとして活用することもできる。
例えば特定シーンの出現回数と、出現時間と、出現比率と、等はいずれの要素データをもとにした識別データのインデックス列により検索し集計し解析可能である。
例えば映像を利用するゲーム機器にインデックス列を利用することにより、どのような画像でどのように遊んだかを記憶するゲームプレイヒストリーを作り、このゲームプレイヒストリーはゲームそのものに利用することも可能であるとともに、このヒストリーを分析してゲーム性を解析するなど多目的な利用が可能である。
これらの場合はいずれの要素データの場合でも可能である。
また識別データの全部または一部が特徴要素データで構成される場合には映像コンテンツ全体または部分の、平均画像特徴と、平均音声特徴と、平均変化特徴と、が解析可能で例えば自作ビデオの編集などで再生される映像コンテンツの全体や一部の画面が暗い場合、色調が狂っている場合、音声が小さい場合など、自動画像補正、自動音声補正をするなどの編集に利用することなども可能である。
以上は図2の統計データ利用部99の一形態である。
本願発明のフレーム検索用データ作成装置、フレーム検出装置は以上のような映像装置そのもの以外にも映像を利用する教育機器や医療機器、防犯機器、生産(FA)機器などの専門分野で、識別データならびにインデックス列を利用し、さまざまなフレームの特徴、フレーム内の部分的な特徴を抽出して、カメラ、ビデオカメラ、ビデオ、ブザーを連動させたりするような応用にも適用可能である。
以上は図3示す本願発明のデータベースの利用例の一形態である。
1 映像コンテンツ
2 フレーム
3 時刻情報
4 タイムコード
5 タイトル情報
6 フレーム位置または区間
7 要素データ
8 通常要素データ
9 特徴要素データ
10 識別データ
11 識別データの基本部分
12 インデックス列
13 重複データ識別情報
14 連続重複フレーム
15 繰返しフレーム
16 複製フレーム
17 偶発同一フレーム
18 データベース
19 記憶媒体
20 フレーム関連情報
21 相互連動情報
22 任意の情報
25 同一フレームの検出
26 連続フレームの検出
27 フレーム特徴の検出
28 指定フレームの検出
29 その他の利用
30 検索条件設定部
31 RUNレングス係数
32 LEVEL係数
33 フレームデータアドレス
34 映像コンテンツフレームデータ
35 フレーム位置データ
36 メタデータ
39 重複データ判定部
40 連続重複データ判定部
41 映像装置
42 映像コンテンツを記憶または搭載した映像装置(映像装置本体)
43 映像装置本体に連携する映像装置(連携映像装置)
44 マルチメディア機器
45 外部機器
46 文字情報
47 インターネット情報
48 フレームアノテーション情報
49 統計データ情報
50 識別データ作成部
51 画像、音声信号
52 A/D変換部
53 識別データ抽出部
54 インデックス列検索部
55 識別データ検出部
56 インデックス列登録部
57 特定条件設定部
58 サンプリングポイント
59 中心サンプリングポイント
60 検索基準データ
61 記憶登録されたインデックス列
62 検索対象インデックス列
63 もとになるインデックス列
65 連続外重複データ判定部
66 一致検出部
67 範囲検出部
68 検索条件切り替え部
70 表示装置
71 録画装置、再生装置
72 アプリケーションソフトウエア
73 外部接続機器
74 リモコン信号送信器
75 再生高度化支援装置
76 録画装置、再生装置操作部
77 目的時間設定
78 新操作機能ボタン
79 フレームサーチ
80 次世代映像装置
81 連動情報
82 詳細検索
83 映像・音声出力部
84 通信部
85 ランダムアクセス制御信号
86 映像コンテンツアクセス部
87 再生信号またはデータよりの識別データ作成部
88 非再生データよりの識別データ作成部
89 完成されたインデックス列の受給部
90 映像装置用アダプタ
91 検索補助データ部
92 連動制御部
93 繰返しフレーム自動判定部
94 複製判定部
95 チャプタマーク作成部
96 検出フレーム時系列表示部
97 フレームアノテーション検索部
98 フレームアノテーションアクセス部
99 統計データ利用部
101 n−×フレームサンプリングポイントデータワークメモリ
102 n−×フレームサンプリングポイント合計データワークメモリ
103 n−×フレームサンプリングポイント平均データワークメモリ
104 nフレームサンプリングポイントデータワークメモリ
105 nフレームサンプリングポイント合計データワークメモリ
106 nフレームサンプリングポイント平均データワークメモリ
107 nフレーム中心サンプリングポイントデータワークメモリ
108 |(n−×)−n|サンプリングポイント差分データワークメモリ
109 |(n−×)−n|サンプリングポイント差分合計データワークメモリ
110 |(n−×)−n|サンプリングポイント差分平均データワークメモリ
111 変化範囲データワークメモリ
112 変化速度データワークメモリ
本発明は、映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法に関し、例えば、放送番組やビデオなどの映像コンテンツの録画、撮影、再生、視聴、編集に係る映像装置に適用されるものである。
本願発明の映像装置の一例として、例えば現在一般家庭で利用されているデジタル放送テレビジョン録画装置は著作権保護にもとづきコピー制限はもとより、一定目的以上の編集や加工が出来ない構造となっているため、特定の通信手段を用いて専用の編集装置等に映像コンテンツを移し換えない限り、映像コンテンツの編集から、再生、操作、視聴、のあらゆる部分で装置に搭載されている機能にもとづく利用以外何も出来ない。
上記1、2のテーマを共通に解決する有効な手段の一つは、装置本体と他の装置とが共通に利用出来るコンパクトなデータサイズで識別能力の高い映像コンテンツの1フレームごとのデータを対象としたデータベースの作成手段と、これを検索することにより装置および映像コンテンツ双方の編集性、操作性、視聴性を向上させるに必要十分となり得る多目的で、高精度、高速度の、映像コンテンツのフレーム検出手段と、の開発でありこれを用いた映像コンテンツのフレーム検索用データ作成手段、このフレーム検索用データを用いた映像コンテンツのフレーム検出手段の提供である。
以上のような適用例の映像装置本体と他の外部装置(他の映像装置含む)が以上のデータベースを共通に利用出来ればデータベースのさまざまな利用、応用により装置自体の付加価値も大幅に向上し、映像装置本体内の映像コンテンツの利用の幅と利用価値は格段と拡大される。
上記課題をクリアする映像コンテンツの編集、操作、再生、視聴のあらゆる用途にこの技術を利用した映像コンテンツのフレーム検索用データ作成手段、このフレーム検索用データを用いた映像コンテンツのフレーム検出手段及びフレーム検索用データ作成方法の提供である。
また本願発明の主要適用装置である家庭用汎用録画装置、再生装置に広く応用し実現可能なコストを目指すには、特別な装置、部品、組立技術を用いることなく、現在市場に広く流通している装置、部品、組立て技術で実現可能な映像コンテンツのフレーム検索用データ作成手段、このフレーム検索用データを用いた映像コンテンツのフレーム検出手段以上による映像装置、の提供である。
以上の課題を解決するために
請求項1では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のいずれかのフレーム情報から抽出される情報単位ごとのデータである複数の要素データを、映像コンテンツ上の互いのフレーム同士のデータの重複を避け、映像コンテンツ上の任意の1フレームのデータを固有のデータとするよう上記要素データを複数連結し組合せして構成される、映像コンテンツの1フレーム当たりの識別データを作成する識別データ作成部と、
この1フレーム当たりの識別データに必要とするデータ検索のための情報を付与し識別データ作成の元になる映像コンテンツの全てのフレームと時系列上相互対照なデータ列として記憶登録し、1映像コンテンツ当たりのフレーム検索用のインデックス列を記憶するインデックス列登録部と、
具備することを特徴とする。
請求項2では、
前記インデックス列登録部は、前記インデックス列に映像コンテンツのタイトル情報を付与し、複数のインデックス列を対象としたデータベースとすることを特徴とする。
請求項3では、
前記識別データ作成部は、前記識別データに使用されている全ての前記要素データの量子化ビットのデコードデータであるそれぞれの量子化データの出現頻度と、全ての要素データ同士の出現相関度と、を測定し検索対象範囲内の識別データのデータ同士の最悪の場合の重複の確率である最悪出現確率を1000億分の1以下とするように構成された識別データとすること特徴とする。
請求項4では、
(1)前記音声が利用できる映像コンテンツの場合は静止画で無音声、前記音声が利用できない映像コンテンツの場合は静止画、となることにより発生する前記識別データが重複データとなる区間
(2)コマーシャルメッセージフレームと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、の繰り返し送出されるフレームにより発生する前記識別データの一定区間同士が重複データとなる区間
(3)複製された映像コンテンツにより発生する前記識別データの一定区間同士が完全に同一で重複データとなる区間
(4)偶発的に類似する他のフレームを同一データとして抽出することにより発生する前記識別データが重複データとなるフレーム
以上(1)から(4)のいずれかの要因で識別データのデータが重複するフレームの双方の上記識別データにそれぞれの要因ごとに、重複を回避するための情報を付与する重複データ判定部を更に具備することを特徴とする。
請求項5では、
前記識別データ作成部は、前記要素データの全てまたは一部を、音声が利用できる映像コンテンツの場合は画像特徴情報と音声特徴情報、音声が利用できない映像コンテンツの場合は画像特徴情報、のいずれかの前記フレーム情報から抽出される特徴情報を特徴要素データとして抽出し組合せ構成した前記識別データとすることを特徴とする。
請求項6では、
前記識別データ作成部は、
(1)コンポジット信号(Y/C混合)と、S映像信号(Y/C分離)、コンポーネント映像信号(Y/Cb/Cr)と、D端子信号(Y/Pb/Pr)と、のいずれかのアナログ画像信号
(2)ステレオ信号と、マルチチャンネル信号と、のいずれかのアナログ音声信号
(3)IEEE1394またはHDMI(ハイ-デフィニション マルチメディア インタフェース)のデジタル信号
(4)識別データ専用のデータまたは信号
以上(1)から(4)のいずれかの信号またはデータを前記フレーム情報とし映像コンテンツの再生(オンライン)に合わせ連続して前記識別データを作成することを特徴とする。
請求項7では、
前記識別データ作成部は、
映像コンテンツを記憶した記憶媒体またはリムーバル記憶媒体として搭載された記憶媒体上の映像コンテンツのフレーム圧縮データをもとにしたデータを前記フレーム情報とし非再生(オフライン)で前記識別データを作成することを特徴とする。
請求項8では、
請求項6または請求項7により作成完了した前記インデックス列を、
(1)他の装置から共有ファイルとしてデータの供給を受ける
(2)他の装置から通信手段によりデータの供給を受ける
(3)他の装置からメモリ媒体によるデータ交換手段によりデータの供給を受ける
(4)映像コンテンツ事業者により放送電波または通信回線を通じてデータの供給を受ける
(5)映像コンテンツ事業者により映像コンテンツと同一のリムーバル記憶媒体に記憶されたデータの供給を受ける
以上(1)から(5)記載のいずれかのデータ受給手段である完成されたインデックス列の受給部を更に具備することを特徴とする。
請求項9では、
前記識別データ作成部は、アナログ信号より抽出した前記要素データの場合、当該要素データの最少1bitのみをアナログ誤差吸収のためのデータとする要素データで構成される前記識別データとすることを特徴とする。
請求項10では、
前記識別データ作成部は、前記識別データと、識別データ作成の元になる映像コンテンツのタイムコードデータと、を併用した前記インデックス列とすることを特徴とする。
請求項11では、
前記識別データ作成部は、フレームごとまたは特定の区間ごとに前記要素データの組合せの構成を変化させるように構成される前記識別データによる前記インデックス列とすることを特徴とする。
請求項12では、
前記識別データ作成部は、前記識別データに、他の認識手段から得られる認識情報を付与した前記インデックス列とすることを特徴とする。
請求項13では、
前記識別データ作成部は、前記識別データを一定の割合で間引きして作成された前記インデックス列とすることを特徴とする。
請求項14では、
前記識別データ作成部は、前記インデックス列を、画像における前記フレーム情報のフレーム間変化をもとにして、同一データの範囲をRUNレングス係数、LEVEL係数を用いて圧縮し、検索時はデータを解凍したインデックス列とすることを特徴とする。
請求項15では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成される映像コンテンツの1フレーム当たりの一時データとしての識別データの作成手段を特徴とする。
請求項16では、
前記インデックス列を検索するための、検索条件データを設定する検索条件設定部と、この検索条件にもとづきインデックス列を検索するインデックス列検索部と、この検索により検索条件データに適合する前記識別データのフレームを検出する識別データ検出部と、を具備することを特徴とする。
請求項17では、
前記検索条件設定部に、検索目的のフレームの前記識別データを検索条件データとして設定して、前記インデックス列を前記インデックス列検索部により検索することにより、検索条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項18では、
前記検索条件設定部に、フレームの特徴検出のためのデータを検索条件データとして設定して、請求項5記載のインデックス列をインデックス列検索部により検索することにより、特徴検出条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項19では、
前記元になる映像コンテンツの任意のフレーム位置を指定し、請求項5記載のインデックス列を前記識別データ検出部で検出することにより、当該フレームの特徴を検出することを特徴とする。
請求項20では、
対象とする前記インデックス列を事前に用意し、このインデックス列の前記識別データ作成の元になる映像コンテンツを再生する際、再生されるフレームから得られる識別データを前記検索条件設定部の検索条件データとし、上記事前に用意されたインデックス列をインデックス列検索部によって検索し、同一データとなる上記映像コンテンツのフレーム位置を識別データ検出部で検出し、
以降の連続して再生されるフレームから得られる識別データは上記インデックス列上の該当するフレーム位置の識別データを前記識別データ検出部で読み取りし、同一データであることを確認することによって、
上記識別データ作成の元になる映像コンテンツの再生フレームのフレーム位置を連続検出することを特徴とする。
請求項21では、
前記インデックス列上の任意のフレームを指定して上記元になる映像コンテンツの任意のフレームをアクセスし、再生されるフレームの識別データを識別データ検出部で連続検出する映像コンテンツアクセス部を更に具備することを特徴とする。
請求項22では、
前記データベースの検索補助データとして、前記識別データを構成する少なくとも1つの前記要素データの量子化データの組合せで構成される量子化データのグループごとに識別データを記憶登録した、要素データの量子化データのグループ別の識別データの検索を併用して映像コンテンツのフレームを検索し検出をする検索補助データ部を更に具備することを特徴とする。
請求項23では、
前記インデックス列検索部は、前記データベース内の1つの前記インデックス列上の複数のフレーム位置の前記識別データを対にしてグループ化した複数フレーム条件を前記指定する検索条件として、同一または他の映像コンテンツのインデックス列を検索しフレームを検出することを特徴とする。
請求項24では、
請求項20記載のフレーム検出装置において、予め前記データベース内の対象とする前記インデックス列の目的とするフレームの前記識別データに映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御するための情報を付与しておき、
前記識別データ作成の元になる映像コンテンツを再生の際、この映像コンテンツの再生に連動し、上記インデックス列を連続検出し、映像装置と、マルチメディア機器と、外部機器と、を連動制御するための情報を検出し、
上記識別データ作成の元になる映像コンテンツの再生フレームに連動して上記、映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御する連動制御部を更に具備することを特徴とする。
請求項25では、
前記データベース内の前記インデックス列がテレビジョン放送番組による映像コンテンツから作成された場合、
前記繰り返し送出される、コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、における前記フレーム識別データの一定区間同士が同一データとなるフレーム検出結果を利用して、
番組局情報、タイトル情報、放送される時刻情報、その期間、繰り返し回数、のいずれかをもとにして、
コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、のいずれかであることを自動判定する繰返しフレーム自動判定部を更に具備することを特徴とする。
請求項26では、
前記データベース内の前記インデックス列が、
前記複製された映像コンテンツと複製した映像コンテンツの互いの識別データが完全に同一データとなるフレーム検出結果を利用して、
映像コンテンツの複製を検出する複製判定部を更に具備することを特徴とする。
請求項27では、
請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置をチャプタマークとするチャプタマーク作成部を更に具備することを特徴とする。
請求項28では、
請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置を時系列表示する検出フレーム時系列表示部を更に具備することを特徴とする。
請求項29では、
請求項5記載の識別データによって作成されたインデックス列に前記識別データ作成の元になる映像コンテンツの任意の1フレームを対象とした、映像コンテンツのフレームのアノテーション情報を付与する手段により付与されたアノテーション情報の検索をするフレームアノテーション検索部と、検出されたフレームのアノテーション情報から映像コンテンツのフレームをアクセスする、フレームアノテーションアクセス部を更に具備することを特徴とする。
請求項30では、
請求項5記載の識別データによって作成されたインデックス列をもとにして
(1)特定シーンの出現回数と、出現時間と、出現比率と、の少なくとも1つ
(2)映像コンテンツの、画像の特徴と、音声の特徴と、変化の特徴と、の少なくとも1つ
以上(1)または(2)いずれかのフレームを前記インデックス列検索部と、前記識別データ検出部で検出し、これを統計データとし使用する統計データ利用部を更に具備することを特徴とする。
請求項31では、
音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のいずれかのフレーム情報から抽出される情報単位ごとのデータである複数の要素データを、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成されるフレーム検索のためのデータである映像コンテンツの1フレーム当たりの識別データの、
それぞれの上記要素データの、それぞれの前記量子化データの出現頻度を測定することにより1要素データ当たりのビット数としての平均出現確率ならびに識別データ全体の要素データのビット数としての平均出現確率を判定し、この結果にもとづき適正な要素データのビット数の識別データの作成をすることを特徴とする。
請求項32では、
前記フレーム情報より前記要素データを採取する際のビット数を、実際に前記識別データの要素データとするビット数より多くし、請求項31記載の要素データのそれぞれの前記量子化データの出現頻度を測定することにより、上記要素データを採取した量子化データの出現頻度を均等化して識別データの要素データとすることを特徴とする。
請求項33では、
請求項31記載の識別データを構成する要素データを2組選択し互いの出現相関度を求める手法で、構成される要素データの全ての組合せについての出現相関度を測定することにより上記識別データの組合せ数としての平均出現確率を判定し、この結果にもとづき適正な要素データの組合せ数の識別データの作成をすることを特徴とする。
請求項34では、
請求項31記載の識別データ全体の要素データのビット数としての平均出現確率と、請求項33記載の識別データの組合せ数としての平均出現確率と、
の双方により上記識別データの総合平均出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。
請求項35では、
前記識別データを構成する全ての前記要素データの量子化データの最も出現頻度の高い量子化データによる前記出現頻度の測定と、この量子化データ同士の前記相関度の測定と、の双方により識別データの最悪出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。
本願発明の映像コンテンツのフレーム検索用データである、データベース、識別データ、インデックス列は映像コンテンツの編集、再生、録画、撮影などのさまざまな場面と様々な映像装置に多目的に利用することが可能である。
これらの技術を一貫して利用することにより低コストで付加価値の高い製品の実現と、これらの技術の積み重ねにより、新しい形態の映像コンテンツの利用技術さらには新しい形態の放送番組、通信番組、やDVD、BD等リムーバルメディア等の映像コンテンツが生まれることが期待できる。
以降の説明では、本願発明の映像コンテンツのフレーム検索用データ作成手段便宜上フレーム検索用データ作成装置、このフレーム検索用データを用いた映像コンテンツのフレーム検出手段便宜上フレーム検出装置として説明される。
また以上のフレーム検索用データ作成装置、フレーム検出装置は、映像装置本体(映像コンテンツを記憶またはリムーバル記憶媒体として搭載した映像装置)、連携映像装置(映像装置本体に連携する映像装置)のいずれかに適用され、これにもとづき説明される、この詳細は後述する。
本願発明の映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、は以上のような映像装置そのもの以外にも映像を利用する教育機器や医療機器、防犯機器、生産(FA)機器などの専門分野で、識別データならびにインデックス列を利用し、さまざまなフレームの特徴、フレーム内の部分的な特徴を抽出して、カメラ、ビデオカメラ、ビデオ、ブザーを連動させたりするような応用にも適用可能である。
以上は図3示す本願発明のデータベースの利用例の一形態である。
以上の課題を解決するために
請求項1では
音声が利用できる映像コンテンツの場合は画像情報と音声情報の双方、音声が利用できない映像コンテンツの場合は画像情報のみ、の前者もしくは後者の映像コンテンツのメタデータの作成において、
上記映像コンテンツの任意の1フレームで、このフレーム上の複数のサンプリングポイントのフレーム情報と、このフレーム前後の変化比較用フレーム上の同一サンプリングポイントのフレーム情報と、の双方から抽出される複数の要素データを、映像コンテンツ上の互いのフレーム同士の上記メタデータの重複を避ける方法による組合せで当該1フレームを構成するとともに、同一の方法で全てのフレームを構成する、つまり映像コンテンツ上の任意の1フレームのメタデータ固有のデータとなるよう上記要素データを複数連結し組合せして構成される、映像コンテンツの1フレーム当たりの識別データを作成する識別データ作成部と、
この1フレーム当たりの識別データに必要とするデータ検索のための情報を付与し識別データ作成の元になる映像コンテンツの全てのフレームと時系列上相互対照なデータ列として記憶登録し、1映像コンテンツ当たりのフレーム検索用のインデックス列を記憶するインデックス列登録部と、
を具備することを特徴とする。
請求項2では
(1)前記音声が利用できる映像コンテンツの場合は静止画で無音声、前記音声が利用できない映像コンテンツの場合は静止画、となることにより発生する前記識別データが重複データとなる区間
(2)コマーシャルメッセージフレームと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、の繰り返し送出されるフレームにより発生する前記識別データの一定区間同士が重複データとなる区間
(3)複製された映像コンテンツにより発生する前記識別データの一定区間同士が完全に同一で重複データとなる区間
(4)偶発的に類似する他のフレームを同一データとして抽出することにより発生する前記識別データが重複データとなるフレーム
以上(1)から(4)のいずれかの要因で識別データのデータが重複するフレームの双方の上記識別データにそれぞれの要因ごとに、重複を回避するための情報を付与する重複データ判定部を更に具備することを特徴とする。
請求項3では
前記識別データ作成部は、前記要素データの全てまたは一部を、音声が利用できる映像コンテンツの場合は画像特徴情報と音声特徴情報の双方、音声が利用できない映像コンテンツの場合は画像特徴情報のみ、の前者もしくは後者の映像コンテンツの前記フレーム情報から抽出される特徴情報を特徴要素データとして抽出し組合せ構成した前記識別データとすることを特徴とする。
請求項4では
前記識別データ作成部は、
(1)コンポジット信号(Y/C混合)と、S映像信号(Y/C分離)、コンポーネント映像信号(Y/Cb/Cr)と、D端子信号(Y/Pb/Pr)と、のいずれかのアナログ画像信号
(2)ステレオ信号と、マルチチャンネル信号と、のいずれかのアナログ音声信号
(3)IEEE1394またはHDMI(ハイ-デフィニション マルチメディア インタフェース)のデジタル信号
(4)識別データ専用のデータまたは信号
以上(1)から(4)のいずれかの信号またはデータを前記フレーム情報とし映像コンテンツの再生(オンライン)に合わせ連続して前記識別データを作成することを特徴とする。
請求項5では
前記識別データ作成部は、
映像コンテンツを記憶した記憶媒体またはリムーバル記憶媒体として搭載された記憶媒体上の映像コンテンツのフレーム圧縮データをもとにしたデータを前記フレーム情報とし非再生(オフライン)で前記識別データを作成することを特徴とする。
請求項6では
請求項4または請求項5により作成完了した前記インデックス列を、
(1)他の装置から共有ファイルとしてデータの供給を受ける
(2)他の装置から通信手段によりデータの供給を受ける
(3)他の装置からメモリ媒体によるデータ交換手段によりデータの供給を受ける
(4)映像コンテンツ事業者により放送電波または通信回線を通じてデータの供給を受ける
(5)映像コンテンツ事業者により映像コンテンツと同一のリムーバル記憶媒体に記憶されたデータの供給を受ける
以上(1)から(5)記載のいずれかのデータ受給手段である完成されたインデックス列の受給部を更に具備することを特徴とする。
請求項7では
前記識別データ作成部は、アナログ信号より抽出した前記要素データの場合、当該要素データの最少1bitのみをアナログ誤差吸収のためのデータとする要素データで構成される前記識別データとすることを特徴とする。
請求項8では
前記識別データ作成部は、前記識別データと、識別データ作成の元になる映像コンテンツのタイムコードデータと、を併用した前記インデックス列とすることを特徴とする。
請求項9では
前記識別データ作成部は、フレームごとまたは特定の区間ごとに前記要素データの組合せの構成を変化させるように構成される前記識別データによる前記インデックス列とすることを特徴とする。
請求項10では
前記識別データ作成部は、前記識別データに、他の認識手段から得られる認識情報を付与した前記インデックス列とすることを特徴とする。
請求項11では
前記識別データ作成部は、前記識別データを一定の割合で間引きして作成された前記インデックス列とすることを特徴とする。
請求項12では
前記識別データ作成部は、前記インデックス列を、画像における前記フレーム情報のフレーム間変化をもとにして、同一データの範囲をRUNレングス係数、LEVEL係数を用いて圧縮し、検索時はデータを解凍したインデックス列とすることを特徴とする。
請求項13では
請求項1記載のインデックス列を検索するための、検索条件データを設定する検索条件設定部と、この検索条件にもとづきインデックス列を検索するインデックス列検索部と、この検索により検索条件データに適合する前記識別データのフレームを検出する識別データ検出部と、を具備することを特徴とする。
請求項14では
前記検索条件設定部に、検索目的のフレームの前記識別データを検索条件データとして設定して、前記インデックス列を前記インデックス列検索部により検索することにより、検索条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項15では
前記検索条件設定部に、フレームの特徴検出のためのデータを検索条件データとして設定して、請求項3記載のインデックス列をインデックス列検索部により検索することにより、特徴検出条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする。
請求項16では
前記元になる映像コンテンツの任意のフレーム位置を指定し、請求項3記載のインデックス列を前記識別データ検出部で検出することにより、当該フレームの特徴を検出することを特徴とする。
請求項17では
対象とする前記インデックス列を事前に用意し、このインデックス列の前記識別データ作成の元になる映像コンテンツを再生する際、再生されるフレームから得られる識別データを前記検索条件設定部の検索条件データとし、上記事前に用意されたインデックス列をインデックス列検索部によって検索し、同一データとなる上記映像コンテンツのフレーム位置を識別データ検出部で検出し、
以降の連続して再生されるフレームから得られる識別データは上記インデックス列上の該当するフレーム位置の識別データを前記識別データ検出部で読み取りし、同一データであることを確認することによって、
上記識別データ作成の元になる映像コンテンツの再生フレームのフレーム位置を連続検出することを特徴とする。
請求項18では
前記インデックス列上の任意のフレームを指定して上記元になる映像コンテンツの任意のフレームをアクセスし、再生されるフレームの識別データを識別データ検出部で連続検出する映像コンテンツアクセス部を更に具備することを特徴とする。
請求項19では
前記インデックス列に映像コンテンツのタイトル情報を付与した複数のインデックス列で構成されるデータベースの検索補助データとして、前記識別データを構成する少なくとも1つの前記要素データの量子化データの組合せで構成される量子化データのグループごとに識別データを記憶登録した、要素データの量子化データのグループ別の識別データの検索を併用して映像コンテンツのフレームを検索し検出をする検索補助データ部を更に具備することを特徴とする。
請求項20では
前記インデックス列検索部は、前記データベース内の1つの前記インデックス列上の複数のフレーム位置の前記識別データを対にしてグループ化した複数フレーム条件を前記指定する検索条件として、同一または他の映像コンテンツのインデックス列を検索しフレームを検出することを特徴とする。
請求項21では
請求項17記載のフレーム検索用データの検索手段を備えた映像装置において、予め前記データベース内の対象とする前記インデックス列の目的とするフレームの前記識別データに映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御するための情報を付与しておき、
前記識別データ作成の元になる映像コンテンツを再生の際、この映像コンテンツの再生に連動し、上記インデックス列を連続検出し、映像装置と、マルチメディア機器と、外部機器と、を連動制御するための情報を検出し、
上記識別データ作成の元になる映像コンテンツの再生フレームに連動して上記、映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御する連動制御部を更に具備することを特徴とする。
請求項22では
前記データベース内の前記インデックス列がテレビジョン放送番組による映像コンテンツから作成された場合、
前記繰り返し送出される、コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、における前記フレーム識別データの一定区間同士が同一データとなるフレーム検出結果を利用して、
番組局情報、タイトル情報、放送される時刻情報、その期間、繰り返し回数、のいずれかをもとにして、
コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、のいずれかであることを自動判定する繰返しフレーム自動判定部を更に具備することを特徴とする。
請求項23では
前記データベース内の前記インデックス列が、
前記複製された映像コンテンツと複製した映像コンテンツの互いの識別データが完全に同一データとなるフレーム検出結果を利用して、
映像コンテンツの複製を検出する複製判定部を更に具備することを特徴とする。
請求項24では
請求項3記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置をチャプタマークとするチャプタマーク作成部を更に具備することを特徴とする。
請求項25では
請求項3記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置を時系列表示する検出フレーム時系列表示部を更に具備することを特徴とする。
請求項26では
請求項3記載の識別データによって作成されたインデックス列に前記識別データ作成の元になる映像コンテンツの任意の1フレームを対象とした、映像コンテンツのフレームのアノテーション情報を付与する手段により付与されたアノテーション情報の検索をするフレームアノテーション検索部と、検出されたフレームのアノテーション情報から映像コンテンツのフレームをアクセスする、フレームアノテーションアクセス部を更に具備することを特徴とする。
請求項27では
請求項3記載の識別データによって作成されたインデックス列をもとにして
(1)特定シーンの出現回数と、出現時間と、出現比率と、の少なくとも1つ
(2)映像コンテンツの、画像の特徴と、音声の特徴と、変化の特徴と、の少なくとも1つ
以上(1)または(2)いずれかのフレームを前記インデックス列検索部と、前記識別データ検出部で検出し、これを統計データとし使用する統計データ利用部を更に具備することを特徴とする。
請求項28では
前記映像コンテンツ上の互いのフレーム同士の前記メタデータの重複を避ける方法として
請求項1記載の識別データの、
それぞれの前記要素データの、それぞれの前記量子化データの出現頻度を測定することにより1要素データ当たりのビット数としての平均出現確率ならびに識別データ全体の要素データのビット数としての平均出現確率を判定し、この結果にもとづき適正な要素データのビット数の識別データの作成をすることを特徴とする。
請求項29では
前記フレーム情報より前記要素データを採取する際のビット数を、実際に前記識別データの要素データとするビット数より多くし、請求項28記載の要素データのそれぞれの前記量子化データの出現頻度を測定することにより、上記要素データを採取した量子化データの出現頻度を均等化して識別データの要素データとすることを特徴とする。
請求項30では
請求項28記載の識別データを構成する要素データを2組選択し互いの出現相関度を求める手法で、構成される要素データの全ての組合せについての出現相関度を測定することにより上記識別データの組合せ数としての平均出現確率を判定し、この結果にもとづき適正な要素データの組合せ数の識別データの作成をすることを特徴とする。
請求項31では
請求項28記載の識別データ全体の要素データのビット数としての平均出現確率と、請求項30記載の識別データの組合せ数としての平均出現確率と、
の双方により上記識別データの総合平均出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。
請求項32では
前記映像コンテンツ上の互いのフレーム同士の前記メタデータの重複を避ける方法として
請求項1記載の識別データを構成する全ての前記要素データの量子化データの最も出現頻度の高い量子化データによる前記出現頻度の測定と、この量子化データ同士の前記相関度の測定と、の双方により識別データの最悪出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする。

Claims (35)

  1. 音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の互いのフレーム同士のデータの重複を避け、映像コンテンツ上の任意の1フレームのデータを固有のデータとするよう上記要素データを複数連結し組合せして構成される映像コンテンツの1フレーム当たりの識別データを作成する識別データ作成部と、
    この1フレーム当たりの識別データに必要とするデータ検索のための情報を付与し識別データ作成の元になる映像コンテンツの全てのフレームと時系列上相互対照なデータ列として記憶登録し1映像コンテンツ当たりのフレーム検索用のインデックス列を構成するインデックス列登録部と、
    を具備することを特徴とする映像コンテンツのフレーム検索用データ作成装置。
  2. 前記インデックス列登録部は、前記インデックス列に映像コンテンツのタイトル情報を付与し、複数のインデックス列を対象としたデータベースとすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  3. 前記識別データ作成部は、前記識別データに使用されている全ての前記要素データの量子化ビットのデコードデータであるそれぞれの量子化データの出現頻度と、全ての要素データ同士の出現相関度と、を測定し検索対象範囲内の識別データのデータ同士の最悪の場合の重複の確率である最悪出現確率を1000億分の1以下とするように構成された識別データとすること特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  4. (1)前記音声が利用できる映像コンテンツの場合は静止画で無音声、前記音声が利用できない映像コンテンツの場合は静止画、となることにより発生する前記識別データが重複データとなる区間
    (2)コマーシャルメッセージフレームと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、の繰り返し送出されるフレームにより発生する前記識別データの一定区間同士が重複データとなる区間
    (3)複製された映像コンテンツにより発生する前記識別データの一定区間同士が完全に同一で重複データとなる区間
    (4)偶発的に類似する他のフレームを同一データとして抽出することにより発生する前記識別データが重複データとなるフレーム
    以上(1)から(4)のいずれかの要因で識別データのデータが重複するフレームの双方の上記識別データにそれぞれの要因ごとに、重複を回避するための情報を付与する重複データ判定部を更に具備することを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  5. 前記識別データ作成部は、前記要素データの全てまたは一部を、音声が利用できる映像コンテンツの場合は画像特徴情報と音声特徴情報、音声が利用できない映像コンテンツの場合は画像特徴情報、のいずれかの前記フレーム情報から抽出される特徴情報を特徴要素データとして抽出し組合せ構成した前記識別データとすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  6. 前記識別データ作成部は、
    (1)コンポジット信号(Y/C混合)と、S映像信号(Y/C分離)、コンポーネント映像信号(Y/Cb/Cr)と、D端子信号(Y/Pb/Pr)と、のいずれかのアナログ画像信号
    (2)ステレオ信号と、マルチチャンネル信号と、のいずれかのアナログ音声信号
    (3)IEEE1394またはHDMI(ハイ-デフィニション マルチメディア インタフェース)のデジタル信号
    (4)識別データ専用のデータまたは信号
    以上(1)から(4)のいずれかの信号またはデータを前記フレーム情報とし映像コンテンツの再生(オンライン)に合わせ連続して前記識別データを作成することを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  7. 前記識別データ作成部は、
    映像コンテンツを記憶した記憶媒体またはリムーバル記憶媒体として搭載された記憶媒体上の映像コンテンツのフレーム圧縮データをもとにしたデータを前記フレーム情報とし非再生(オフライン)で前記識別データを作成することを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  8. 請求項6または請求項7により作成完了した前記インデックス列を、
    (1)他の装置から共有ファイルとしてデータの供給を受ける
    (2)他の装置から通信手段によりデータの供給を受ける
    (3)他の装置からメモリ媒体によるデータ交換手段によりデータの供給を受ける
    (4)映像コンテンツ事業者により放送電波または通信回線を通じてデータの供給を受ける
    (5)映像コンテンツ事業者により映像コンテンツと同一のリムーバル記憶媒体に記憶されたデータの供給を受ける
    以上(1)から(5)記載のいずれかのデータ受給手段である完成されたインデックス列の受給部を更に具備することを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  9. 前記識別データ作成部は、アナログ信号より抽出した前記要素データの場合、当該要素データの最少1bitのみをアナログ誤差吸収のためのデータとする要素データで構成される前記識別データとすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  10. 前記識別データ作成部は、前記識別データと、識別データ作成の元になる映像コンテンツのタイムコードデータと、を併用した前記インデックス列とすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  11. 前記識別データ作成部は、フレームごとまたは特定の区間ごとに前記要素データの組合せの構成を変化させるように構成される前記識別データによる前記インデックス列とすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  12. 前記識別データ作成部は、前記識別データに、他の認識手段から得られる認識情報を付与した前記インデックス列とすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  13. 前記識別データ作成部は、前記識別データを一定の割合で間引きして作成された前記インデックス列とすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  14. 前記識別データ作成部は、前記インデックス列を、画像における前記フレーム情報のフレーム間変化をもとにして、同一データの範囲をRUNレングス係数、LEVEL係数を用いて圧縮し、検索時はデータを解凍したインデックス列とすることを特徴とする請求項1記載の映像コンテンツのフレーム検索用データ作成装置。
  15. 音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成される映像コンテンツの1フレーム当たりの一時データとしての識別データの作成手段を特徴とする映像コンテンツのフレーム検索用データ作成装置。
  16. 請求項1記載の映像コンテンツのフレーム検索用データ作成装置に、
    前記インデックス列を検索するための、検索条件データを設定する検索条件設定部と、この検索条件にもとづきインデックス列を検索するインデックス列検索部と、この検索により検索条件データに適合する前記識別データのフレームを検出する識別データ検出部と、を更に具備させることを特徴とするフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  17. 前記検索条件設定部に、検索目的のフレームの前記識別データを検索条件データとして設定して、前記インデックス列を前記インデックス列検索部により検索することにより、検索条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  18. 前記検索条件設定部に、フレームの特徴検出のためのデータを検索条件データとして設定して、請求項5記載のインデックス列をインデックス列検索部により検索することにより、特徴検出条件に適合する前記識別データ作成の元になる映像コンテンツのフレームのフレーム位置を前記識別データ検出部で検出することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  19. 前記元になる映像コンテンツの任意のフレーム位置を指定し、請求項5記載のインデックス列を前記識別データ検出部で検出することにより、当該フレームの特徴を検出することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  20. 対象とする前記インデックス列を事前に用意し、このインデックス列の前記識別データ作成の元になる映像コンテンツを再生する際、再生されるフレームから得られる識別データを前記検索条件設定部の検索条件データとし、上記事前に用意されたインデックス列をインデックス列検索部によって検索し、同一データとなる上記映像コンテンツのフレーム位置を識別データ検出部で検出し、
    以降の連続して再生されるフレームから得られる識別データは上記インデックス列上の該当するフレーム位置の識別データを前記識別データ検出部で読み取りし、同一データであることを確認することによって、
    上記識別データ作成の元になる映像コンテンツの再生フレームのフレーム位置を連続検出することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  21. 前記インデックス列上の任意のフレームを指定して上記元になる映像コンテンツの任意のフレームをアクセスし、再生されるフレームの識別データを識別データ検出部で連続検出する映像コンテンツアクセス部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  22. 前記データベースの検索補助データとして、前記識別データを構成する少なくとも1つの前記要素データの量子化データの組合せで構成される量子化データのグループごとに識別データを記憶登録した、要素データの量子化データのグループ別の識別データの検索を併用して映像コンテンツのフレームを検索し検出をする検索補助データ部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  23. 前記インデックス列検索部は、前記データベース内の1つの前記インデックス列上の複数のフレーム位置の前記識別データを対にしてグループ化した複数フレーム条件を前記指定する検索条件として、同一または他の映像コンテンツのインデックス列を検索しフレームを検出することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  24. 請求項20記載のフレーム検出装置において、予め前記データベース内の対象とする前記インデックス列の目的とするフレームの前記識別データに映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御するための情報を付与しておき、
    前記識別データ作成の元になる映像コンテンツを再生の際、この映像コンテンツの再生に連動し、上記インデックス列を連続検出し、映像装置と、マルチメディア機器と、外部機器と、を連動制御するための情報を検出し、
    上記識別データ作成の元になる映像コンテンツの再生フレームに連動して上記、映像装置と、マルチメディア機器と、外部機器と、のいずれかを連動制御する連動制御部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  25. 前記データベース内の前記インデックス列がテレビジョン放送番組による映像コンテンツから作成された場合、
    前記繰り返し送出される、コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、における前記フレーム識別データの一定区間同士が同一データとなるフレーム検出結果を利用して、
    番組局情報、タイトル情報、放送される時刻情報、その期間、繰り返し回数、のいずれかをもとにして、
    コマーシャルメッセージと、連続放送番組の開始または終了時の定形フレームと、再放送フレームと、のいずれかであることを自動判定する繰返しフレーム自動判定部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  26. 前記データベース内の前記インデックス列が、
    前記複製された映像コンテンツと複製した映像コンテンツの互いの識別データが完全に同一データとなるフレーム検出結果を利用して、
    映像コンテンツの複製を検出する複製判定部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  27. 請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置をチャプタマークとするチャプタマーク作成部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  28. 請求項5記載の識別データによって作成された前記インデックスを、前記指定する検索条件で検索し検出された前記フレーム位置を時系列表示する検出フレーム時系列表示部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  29. 請求項5記載の識別データによって作成されたインデックス列に前記識別データ作成の元になる映像コンテンツの任意の1フレームを対象とした、映像コンテンツのフレームのアノテーション情報を付与する手段により付与されたアノテーション情報の検索をするフレームアノテーション検索部と、検出されたフレームのアノテーション情報から映像コンテンツのフレームをアクセスする、フレームアノテーションアクセス部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  30. 請求項5記載の識別データによって作成されたインデックス列をもとにして
    (1)特定シーンの出現回数と、出現時間と、出現比率と、の少なくとも1つ
    (2)映像コンテンツの、画像の特徴と、音声の特徴と、変化の特徴と、の少なくとも1つ
    以上(1)または(2)いずれかのフレームを前記インデックス列検索部と、前記識別データ検出部で検出し、これを統計データとし使用する統計データ利用部を更に具備することを特徴とする請求項16記載のフレーム検索用データを用いた映像コンテンツのフレーム検出装置。
  31. 音声が利用できる映像コンテンツの場合は画像情報と音声情報、音声が利用できない映像コンテンツの場合は画像情報、のフレーム情報から抽出される情報単位ごとのデータである複数の要素データを抽出し、映像コンテンツ上の1フレームを固有のデータとするよう上記要素データを複数連結し組合せして構成されるフレーム検索のためのデータである映像コンテンツの1フレーム当たりの識別データの、
    それぞれの上記要素データの、それぞれの前記量子化データの出現頻度を測定することにより1要素データ当たりのビット数としての平均出現確率ならびに識別データ全体の要素データのビット数としての平均出現確率を判定し、この結果にもとづき適正な要素データのビット数の識別データの作成をすることを特徴とする映像コンテンツのフレーム検索用データ作成方法。
  32. 前記フレーム情報より前記要素データを採取する際のビット数を、実際に前記識別データの要素データとするビット数より多くし、請求項31記載の要素データのそれぞれの前記量子化データの出現頻度を測定することにより、上記要素データを採取した量子化データの出現頻度を均等化して識別データの要素データとすることを特徴とする映像コンテンツのフレーム検索用データ作成方法。
  33. 請求項31記載の識別データを構成する要素データを2組選択し互いの出現相関度を求める手法で、構成される要素データの全ての組合せについての出現相関度を測定することにより上記識別データの組合せ数としての平均出現確率を判定し、この結果にもとづき適正な要素データの組合せ数の識別データの作成をすることを特徴とする映像コンテンツのフレーム検索用データ作成方法。
  34. 請求項31記載の識別データ全体の要素データのビット数としての平均出現確率と、請求項33記載の識別データの組合せ数としての平均出現確率と、
    の双方により上記識別データの総合平均出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする映像コンテンツのフレーム検索用データ作成方法。
  35. 前記識別データを構成する全ての前記要素データの量子化データの最も出現頻度の高い量子化データによる前記出現頻度の測定と、この量子化データ同士の前記相関度の測定と、の双方により識別データの最悪出現確率を判定し、この結果にもとづき適正な要素データのビット数と組合せ数の識別データの作成をすることを特徴とする映像コンテンツのフレーム検索用データ作成方法。
JP2009156501A 2009-07-01 2009-07-01 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。 Expired - Fee Related JP4467017B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009156501A JP4467017B1 (ja) 2009-07-01 2009-07-01 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009156501A JP4467017B1 (ja) 2009-07-01 2009-07-01 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。

Publications (2)

Publication Number Publication Date
JP4467017B1 JP4467017B1 (ja) 2010-05-26
JP2011015109A true JP2011015109A (ja) 2011-01-20

Family

ID=42306591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009156501A Expired - Fee Related JP4467017B1 (ja) 2009-07-01 2009-07-01 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。

Country Status (1)

Country Link
JP (1) JP4467017B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014158684A1 (en) * 2013-03-13 2014-10-02 Magnum Semiconductor, Inc. Video synchronization techniques using projection
JP2017123579A (ja) * 2016-01-07 2017-07-13 株式会社見果てぬ夢 ネオメディア生成装置、ネオメディア生成方法、及びネオメディア生成プログラム
WO2019198322A1 (ja) * 2018-04-10 2019-10-17 オリンパス株式会社 医療システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006060796A (ja) * 2004-07-21 2006-03-02 Nippon Telegr & Teleph Corp <Ntt> 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006060796A (ja) * 2004-07-21 2006-03-02 Nippon Telegr & Teleph Corp <Ntt> 映像検索装置,方法及びプログラム並びにプログラムを記録した記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014158684A1 (en) * 2013-03-13 2014-10-02 Magnum Semiconductor, Inc. Video synchronization techniques using projection
JP2017123579A (ja) * 2016-01-07 2017-07-13 株式会社見果てぬ夢 ネオメディア生成装置、ネオメディア生成方法、及びネオメディア生成プログラム
WO2019198322A1 (ja) * 2018-04-10 2019-10-17 オリンパス株式会社 医療システム
US12042339B2 (en) 2018-04-10 2024-07-23 Olympus Corporation Medical system and method of controlling medical system

Also Published As

Publication number Publication date
JP4467017B1 (ja) 2010-05-26

Similar Documents

Publication Publication Date Title
KR100982165B1 (ko) 비디오 프로그램용 비디오마크를 제공하는 시스템 및 방법
CN101878643B (zh) 电子设备和再现方法
CN101364305B (zh) 电子装置、运动向量检测方法和其程序
JP5076892B2 (ja) 同一シーン検出装置およびプログラムを格納した記憶媒体
JP4491979B2 (ja) インデックス配信方法、インデックス配信装置および番組記録装置
JP4467017B1 (ja) 映像コンテンツのフレーム検索用データの作成手段を備えた映像装置、このフレーム検索用データの検索手段を備えた映像装置、及びこのフレーム検索用データ作成方法。
JP5306550B2 (ja) 映像解析情報送信装置、映像解析情報配信システム及び配信方法、映像視聴システム及び映像視聴方法
JP5198643B1 (ja) 映像解析情報アップロード装置及び映像視聴システム及び方法
JP2010170592A (ja) 情報再生装置および情報再生方法
JP4230402B2 (ja) サムネイル画像抽出方法、装置、プログラム
US20040151473A1 (en) Audio/video data recording/reproduction apparatus, system, and method, recording medium recorded by them, audio/video data reproduction apparatus, and data structure
JP4725554B2 (ja) 番組記録再生システム及び番組記録再生方法
JP4978671B2 (ja) 番組記録装置
JP2001320674A (ja) 映像記録再生方法、及び映像記録再生装置
JP2012034022A (ja) 映像音声記録再生装置、および映像音声記録再生方法
KR100631783B1 (ko) 멀티미디어 데이터와 메타데이터를 동기화하는 시스템 및방법
JP6090296B2 (ja) インデックス作成装置
JP5626321B2 (ja) 番組記録装置
JP2007043401A (ja) 情報記録再生装置
JP2005348077A (ja) 記録再生装置、及び再生装置。
JP5937630B2 (ja) 番組記録装置
JP2006217229A (ja) デジタル放送受信装置
JP5187424B2 (ja) 番組記録装置
JP4178400B2 (ja) 番組格納再生システム、番組格納再生方法、プログラム
JP2005217875A (ja) チャプタ情報の管理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100218

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160305

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees