JP2001167099A - 映像・音声オブジェクトを基本としたデータベース装置 - Google Patents

映像・音声オブジェクトを基本としたデータベース装置

Info

Publication number
JP2001167099A
JP2001167099A JP34709499A JP34709499A JP2001167099A JP 2001167099 A JP2001167099 A JP 2001167099A JP 34709499 A JP34709499 A JP 34709499A JP 34709499 A JP34709499 A JP 34709499A JP 2001167099 A JP2001167099 A JP 2001167099A
Authority
JP
Japan
Prior art keywords
data
video
audio
database
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP34709499A
Other languages
English (en)
Inventor
Masahide Naemura
昌秀 苗村
Yoshinori Izumi
和泉▲吉▼則
Takashi Nishi
隆司 西
Atsushi Fukuda
淳 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP34709499A priority Critical patent/JP2001167099A/ja
Publication of JP2001167099A publication Critical patent/JP2001167099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 映像・音声のオブジェクトを基本単位とし
て、映像・音声データを細かく扱えるデータベース装置
を提供する。 【解決手段】 時間的に変化する映像、音声データを映
像・音声のオブェクトデータおよびオブジェクトの特徴
量を表すメタデータを用いて管理するデータベース装置
において、当該装置が、データベースに格納する入力映
像・音声データを前記装置用のデータフォーマットに変
換する前処理部(1)と、該前処理部で変換された映像
・音声データ、オブジェクトデータおよびメタデータを
それぞれ関連付けてデータベースに格納するデータ本体
部(2)と、該データ本体部に格納されたそれぞれのデ
ータをミドルウェアを用いて分散環境でも統合的に取り
扱うことのできる環境を提供するネットワーク部(3)
と、ユーザからのデータベースへの必要データの検索を
行うユーザインターフェース部(4)とを具え、映像・
音声データ、オブジェクトデータおよびメタデータをそ
れぞれ独立のデータベースに蓄え、それぞれのデータを
そのデータ固有の識別子で関連付けるよう構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はデータベースの構
造に係り、特に映像・音声データベースを効率よく扱う
ことの可能な映像・音声オブジェクトを基本としたデー
タベース装置に関するものである。
【0002】
【従来の技術】従来の映像・音声のデータベース技術と
しては、画面全体、音源全体からメタデータを抽出し
て、そのメタデータと映像・音声データを関連付けるの
が一般的であった。このとき、メタデータが映像、音声
を構成するオブジェクトに対して、関連付けられていな
かったので細かい制御が困難であった。
【0003】
【発明が解決しようとする課題】従って本発明の目的
は、前述の課題を解決し、従来の技術で取り扱うことが
できなかった映像・音声データの細かい制御の可能な、
かつ動画における映像・音声データのオブジェクト単位
での効果的な管理も可能な装置を提供せんとするもので
ある。オブジェクト単位での管理によってより細かい映
像・音声データの管理が可能となる。
【0004】
【課題を解決するための手段】前述の目的を達成するた
め、本発明映像・音声オブジェクトを基本としたデータ
ベース装置は、時間的に変化する映像、音声データを映
像・音声のオブジェクトデータおよびオブジェクトの特
徴量を表すメタデータを用いて管理するデータベース装
置において、当該装置が、データベースに格納する入力
映像・音声データを前記装置用のデータフォーマットに
変換する前処理部と、該前処理部で変換された映像・音
声データ、オブジェクトデータおよびメタデータをそれ
ぞれ関連付けてデータベースに格納するデータベース本
体部と、該データベース本体部に格納されたそれぞれの
データをミドルウェアを用いて分散環境でも統合的に取
り扱うことのできる環境を提供するネットワーク部と、
ユーザからのデータベースへの必要データの検索を行う
ユーザインターフェース部とを具え、映像・音声デー
タ、オブジェクトデータおよびメタデータをそれぞれ独
立のデータベースに蓄え、それぞれのデータをそのデー
タ固有の識別子で関連付けることを特徴とするものであ
る。
【0005】また、本発明映像・音声オブジェクトを基
本としたデータベース装置は、前記データフォーマット
が、映像・音声の原データであって番組を表す識別子お
よび番組全体のインデックス情報を含む映像・音声デー
タと、映像シーン毎のデータであって番組識別子、シー
ン識別子およびシーン全体のインデックス情報を含むシ
ーン構造データと、抽出されたオブジェクト画像データ
の他に番組識別子、シーン識別子およびオブジェクト識
別子を含むとともに前記オブジェクトを階層的に管理で
きるオブジェクト構造データおよびメタデータからなる
ことを特徴とするものである。
【0006】
【発明の実施の形態】本発明によれば、映像・音声デー
タ、オブジェクトデータおよびメタデータの関連付け
は、それぞれのデータにオブジェクト毎の識別子を付加
することによって行っているので、データベース内のオ
ブジェクトのメタデータから映像・音声データにアクセ
スすることができるし、メタデータだけを操作してデー
タベース内のデータをオブジェクト単位に扱うこともで
きる。メタデータは映像・音声データより容量が小さい
ので操作性に優れており、オブジェクトを階層的な構造
で管理することにより、任意の大きさのオブジェクトに
対応することもできる。
【0007】以下添付図面を参照し実施例により本発明
の実施の形態を詳細に説明する。本発明に係るデータベ
ース装置実施例構成図を図1に示す。本発明装置は前処
理部1、データベース本体部2、ネットワーク部3およ
びユーザインターフェース部4の4つの部分より構成さ
れる。前処理部1は、データベースに格納する映像デー
タ11および音声データ12を本装置用のデータフォー
マットに変換する部分である。映像・音声データ11,
12は、信号アナライザ13によって構成オブジェクト
に分解される。前処理部で重要なことは分解されたシー
ン、オブジェクトを識別するID(識別子)をつけるこ
とであり、分解作業自体はシーンチェンジ検出器、オブ
ジェクト分解器などを使って簡単化することもできる
し、マニュアル作業でシーンごと、映像、音声のオブジ
ェクトごとにきめ細かく分解することもできる。このと
き、信号アナライザ13は後述するデータベース本体部
2から帰還されるデータをも取り込んだデータ構造・知
識情報メモリ14により制御されるし、シーン、オブジ
ェクトの特徴を表すデータ(メタデータ)をも抽出し、
シーン、オブジェクトを識別するIDと関連付けられ
る。メタデータとしては、オペレータがシーンごと、オ
ブジェクトごとに付加するキーワード、オブジェクトの
色情報、テクスチヤ情報、動き情報などがある。
【0008】データベース本体部2は、映像・音声デー
タ、オブジェクト情報データおよびメタデータそれぞれ
を関連付けてそれぞれのデータベース21,22,23
に格納する部分である。図1では、映像・音声データは
映像・音声DB(データベース)21に、オブジェクト
に関する情報データはオブジェクト情報DB22に、メ
タデータはメタデータDB23にそれぞれ格納される。
DBの管理は図2に示すデータフォーマットに基づいて
行われる。
【0009】ここで、図2のデータフォーマットについ
て詳細な説明をする。 映像・音声データ51とは映像
・音声の原データを意味し、番組を表すIDと番組全体
のインデックス情報を含む。シーン構造データ52とは
シーン毎のデータであり、番組ID、シーンを表すシー
ンID、シーン全体のインデックス情報を含む。オブジ
ェクト構造データ53とは抽出されたオブジェクトに関
するデータのことで、オブジェクトそのものを表すオブ
ジェクト画像データのほかに番組ID、シーンID、オ
ブジェクトを表すオブジェクトIDを含む。オブジェク
トの管理は粗いオブジェクトから細かいオブジェクトま
で階層的にオブジェクトを扱えるように、図3に示す階
層化構造を示す木構造でおこなわれる。
【0010】データベースではシーンごとに図3に示す
ような木構造を記述するデータを有する。これは、図3
の場合、(♯0,(♯1,(♯3,♯4,♯5,♯12)),(♯2,(♯
6,♯7,♯8,♯9,♯10, ♯11,)))のように、括られる括弧
の数でそのオブジェクトの階層位置を表すようなデータ
である。オブジェクトラベル♯Oは常に画面全体を表す
ものとする。なお、オブジェクトの画像は最下層のラベ
ル画像で管理され、木構造との組み合わせで目的のオブ
ジェクトを取り出せるようにしている。
【0011】図2にもどって、メタデータ54とはデー
タについて記述した特徴データのことであり、メタデー
タDBにはオブジェクト毎のメタデータが格納されてい
る。メタデータの種類としてはテキストベースのキーワ
ードと画像・音声ベースの色、テクスチヤ、動き、周波
数スペクトル情報などを含む。映像・音声データ、オブ
ジェクトデータとの関連付けのため番組ID、シーンI
D、オブジェクトIDを含む。各データ間の関連付けは
番組ID、シーンID、オブジェクトIDで行われる。
これらのIDを用いて、音声・映像データをメタデータ
でオブジェクト単位に特定することができる。
【0012】 たとえば、Oracle,IBM、Im
formixなどに代表されるオブジェクトリレーショ
ナルDBで映像・音声DB、オブジェクト情報DB、メ
タDBを管理するときは、表1ー3に示す複数のリレー
ショナルテーブルを用いて行う。表1ー3で示されてい
るテーブル群は、1つの番組に対応するものであり、番
組IDごとにこのようなテーブルが存在する。テーブル
の種類としてはシーンテーブル表1、オブジェクトテー
ブル表2、メタデータテーブル表3の3種類で映像・音
声データ、オブジェクトデータ、メタデータを管理す
る。シーンテーブル表1ではシーンIDとそのシーンの
時間位置を表すタイムコードよりなる。また、オブジェ
クトテーブ表2では分解されたオブジェクトを表すオブ
ジェクトIDが、そのオブジェクトが現れるシーンのI
Dと語述するオブジェクト階層を示すIDの両方に関連
付けられて管理されている。
【0013】
【表1】
【0014】
【表2】
【0015】
【表3】
【0016】 それぞれのオブジェクトは、シーン内で
の登場する時間を表すタイムコードデータと関連付けら
れる。このとき、オブジェクトは1シーンに複数回登場
する場合もあるので(一度消えてからまた現れる場合な
ど)、複数のタイムコードデータを有する。メタデータ
テーブルはオブジェクトの特徴を表すメタデータを管理
するもので、シーンID、オブジェクトIDと関連付け
てメタデータを管理する。メタデータの種類はオブジェ
クトの特徴を表すものであればどんな種類のものでもよ
く、代表的なものとしてはオブジェクトの動きデータ、
形状データ、色データ、キーワードおよび音のスペクト
ル情報などがある。
【0017】図1のネットワーク部3は、CORBAの
ようなミドルウェアを用いてオブジェクト情報DB、メ
タデータDB、映像・音声原DBを分散環境で統合的に
扱う部分である。具体的には、番組単位ごとにDBの名
称をミドルウェアが提供するネーミングサービスに登録
することによって、ネットワークに分散した環境でも、
番組名を指定することによって、目的の番組を管理する
データベースにアクセスできる環境を提供する部分であ
る。
【0018】同じく図1のユーザインターフェース部4
は、ユーザからのデータベースヘの必要データの検索を
行う部分である。オブジェクトベースDBの場合、動画
中でのオブジェクトの指定が必要となる。以下に、オブ
ジェクトを基本としたベースDBを用いた場合の、類似
シーンの検索手順の一例を示す。 ○番組の指定:番組IDの指定 ネットワーク部ミドルウェアが、ネーミングサービスに
登録されたネットワークに接続されている複数のDBの
中から適切なDBを選択する。 ○番組中から任意の1シーンをモニターする:シーンI
Dの指定 ネットワークを通してシーンの映像をユーザインターフ
ェース部にダウンロードする。 ○シーンの中から注目するオブジェクトと検索するメタ
データを選択する:オブジェクト階層ID、オブジェク
トID、メタデータの種類の特定 DBの中から選択されたオブジェクトに関連付けられた
メタデータが選銃される。 ○検索を開始する 選択されたオブジェクトのメタデータと類似している
(類似の定義は、ユーザで定義する)メタデータがメタ
データDBより顛似度の高い順番で検索される。 .○検索されたメタデータに関連付けられているオブジ
ェクト、シーンを類似度の高い順番で表示する。 このように、本発明の映像・音声オブジェクトを基本と
したデータベース装置では、オブジェクト単位に映像・
音声データが管理されているので、細かい検索が可能と
なる。
【0019】
【発明の効果】本発明によれば映像・音声データベース
内の映像・音声データをオブジェクト単位で扱えるよう
になり、大量の映像・音声データの効果的な検索ができ
るようになる。 応用例としては、サッカーなどのスポ
ーツシーンから特定の選手が登場する場面を、その選手
オブジェクトをキーとして検索することにより、高速検
索ができる。また、ユーザが興味あるオブジェクトだけ
を提示することにより、ネットワーク上での効率のよい
QoS(Qality of Service)が実現
でき。
【図面の簡単な説明】
【図1】 本発明を実現する装置のシステム構成図。
【図2】 データフォーマットを詳細に説明するための
図。
【図3】 オブジェクトの階層化データ構造を示す図。
【符号の説明】
1 前処理部 2 データベース本体部 3 ネットワーク部 4 ユーザインタフェース部 11 映像データ 12 音声データ 13 信号アナライザ 14 データ構造、知識情報 21 映像・音声DB 22 メタデータDB 23 オブジェクト情報DB 51 映像・音声データ 52 シーン構造データ 53 オブジェクト構造データ 54 メタデータ 55 オブジェクト情報データ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/081 H04N 5/91 N C 7/08 Z (72)発明者 西 隆司 東京都世田谷区砧1丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 福田 淳 東京都世田谷区砧1丁目10番11号 日本放 送協会 放送技術研究所内 Fターム(参考) 5B075 ND12 ND14 ND35 NK06 NR06 5B082 AA13 EA12 GA03 5C053 FA14 FA23 FA27 GB11 JA21 LA11 5C063 AC01 AC05

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 時間的に変化する映像、音声データを映
    像・音声のオブェクトデータおよびオブジェクトの特徴
    量を表すメタデータを用いて管理するデータベース装置
    において、 当該装置が、データベースに格納する入力映像・音声デ
    ータを前記装置用のデータフォーマットに変換する前処
    理部と、該前処理部で変換された映像・音声データ、オ
    ブジェクトデータおよびメタデータをそれぞれ関連付け
    てデータベースに格納するデータベース本体部と、該デ
    ータベース本体部に格納されたそれぞれのデータをミド
    ルウェアを用いて分散環境でも統合的に取り扱うことの
    できる環境を提供するネットワーク部と、ユーザからの
    データベースへの必要データの検索を行うユーザインタ
    ーフェース部とを具え、映像・音声データ、オブジェク
    トデータおよびメタデータをそれぞれ独立のデータベー
    スに蓄え、それぞれのデータをそのデータ固有の識別子
    で関連付けることを特徴とする映像・音声オブジェクト
    を基本としたデータベース装置。
  2. 【請求項2】 請求項1記載の装置において、前記デー
    タフォーマットが、映像・音声の原データであって番組
    を表す識別子および番組全体のインデックス情報を含む
    映像・音声データと、映像シーン毎のデータであって番
    組識別子、シーン識別子およびシーン全体のインデック
    ス情報を含むシーン構造データと、抽出されたオブジェ
    クト画像データの他に番組識別子、シーン識別子および
    オブジェクト識別子を含むとともに前記オブジェクトを
    階層的に管理できるオブジェクト構造データおよびメタ
    データからなることを特徴とする映像・音声オブジェク
    トを基本としたデータベース装置。
JP34709499A 1999-12-07 1999-12-07 映像・音声オブジェクトを基本としたデータベース装置 Pending JP2001167099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34709499A JP2001167099A (ja) 1999-12-07 1999-12-07 映像・音声オブジェクトを基本としたデータベース装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34709499A JP2001167099A (ja) 1999-12-07 1999-12-07 映像・音声オブジェクトを基本としたデータベース装置

Publications (1)

Publication Number Publication Date
JP2001167099A true JP2001167099A (ja) 2001-06-22

Family

ID=18387878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34709499A Pending JP2001167099A (ja) 1999-12-07 1999-12-07 映像・音声オブジェクトを基本としたデータベース装置

Country Status (1)

Country Link
JP (1) JP2001167099A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003111078A (ja) * 2001-09-27 2003-04-11 Fujitsu Ltd コンテンツ符号化装置、コンテンツ復号化装置、コンテンツ配信装置、コンテンツ再生装置、コンテンツ配信システム、コンテンツ符号化方法、コンテンツ復号化方法、コンテンツ符号化プログラム、およびコンテンツ復号化プログラム
WO2003088665A1 (fr) * 2002-04-12 2003-10-23 Mitsubishi Denki Kabushiki Kaisha Dispositif d'edition de metadonnees, dispositif de reproduction de metadonnees, dispositif de distribution de metadonnees, dispositif de recherche de metadonnees, dispositif d'etablissement de conditions de reproduction de metadonnees, et procede de distribution de metadonnees
JP2005295167A (ja) * 2004-03-31 2005-10-20 Toshiba Corp メタデータ、メタデータ配信装置、動画再生装置、動画再生システム、メタデータ配信方法、動画再生方法、メタデータ配信プログラムおよび動画再生プログラム
JP2015136050A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN107491549A (zh) * 2017-08-29 2017-12-19 云熠信息科技有限公司 一种数据处理方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003111078A (ja) * 2001-09-27 2003-04-11 Fujitsu Ltd コンテンツ符号化装置、コンテンツ復号化装置、コンテンツ配信装置、コンテンツ再生装置、コンテンツ配信システム、コンテンツ符号化方法、コンテンツ復号化方法、コンテンツ符号化プログラム、およびコンテンツ復号化プログラム
WO2003088665A1 (fr) * 2002-04-12 2003-10-23 Mitsubishi Denki Kabushiki Kaisha Dispositif d'edition de metadonnees, dispositif de reproduction de metadonnees, dispositif de distribution de metadonnees, dispositif de recherche de metadonnees, dispositif d'etablissement de conditions de reproduction de metadonnees, et procede de distribution de metadonnees
CN100367794C (zh) * 2002-04-12 2008-02-06 三菱电机株式会社 元数据编辑装置
KR100912984B1 (ko) * 2002-04-12 2009-08-20 미쓰비시덴키 가부시키가이샤 메타데이터 편집 장치, 메타데이터 재생 장치, 메타데이터 배신 장치, 메타데이터 검색 장치, 메타데이터 재생성 조건 설정 장치, 콘텐츠 배신 장치, 메타데이터 배신 방법, 메타데이터 재생성 장치, 메타데이터 재생성 방법
US7826709B2 (en) 2002-04-12 2010-11-02 Mitsubishi Denki Kabushiki Kaisha Metadata editing apparatus, metadata reproduction apparatus, metadata delivery apparatus, metadata search apparatus, metadata re-generation condition setting apparatus, metadata delivery method and hint information description method
US8811800B2 (en) 2002-04-12 2014-08-19 Mitsubishi Electric Corporation Metadata editing apparatus, metadata reproduction apparatus, metadata delivery apparatus, metadata search apparatus, metadata re-generation condition setting apparatus, metadata delivery method and hint information description method
JP2005295167A (ja) * 2004-03-31 2005-10-20 Toshiba Corp メタデータ、メタデータ配信装置、動画再生装置、動画再生システム、メタデータ配信方法、動画再生方法、メタデータ配信プログラムおよび動画再生プログラム
JP2015136050A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN107491549A (zh) * 2017-08-29 2017-12-19 云熠信息科技有限公司 一种数据处理方法及系统

Similar Documents

Publication Publication Date Title
EP1395916B1 (en) Meta-descriptor for multimedia information
US7146349B2 (en) Network for describing multimedia information
CN1044415C (zh) 对储存在计算机系统中的数据库进行检索的一种方法和系统
US7203366B2 (en) Video retrieval method and apparatus
US7793212B2 (en) System and method for annotating multi-modal characteristics in multimedia documents
EP1125245B1 (en) Image description system and method
US7409401B2 (en) Method and system for supporting multivalue attributes in a database system
US7051048B2 (en) Data management system, data management method, and program
US7653635B1 (en) Systems and methods for interoperable multimedia content descriptions
US20020049604A1 (en) Method and apparatus for management of multimedia assets
US20070203942A1 (en) Video Search and Services
JP2001518669A (ja) 情報の検索、編集及び操作のために、画像にオブジェクトベースによるオーディオビジュアルな記述的タグ付けを行うための階層的な方法及びシステム
WO2000034893A1 (en) Method of and apparatus for identifying subsets of interrelated image objects from a set of image objects
JPH08255166A (ja) データ管理方法及びそのシステム
Gupta Visual information retrieval technology: A virage perspective
JPH08115334A (ja) 検索装置
JP2002259410A (ja) オブジェクト分類管理方法、オブジェクト分類管理システム、オブジェクト分類管理プログラム及び記録媒体
JP2001167099A (ja) 映像・音声オブジェクトを基本としたデータベース装置
Swanberg et al. Architecture of a multimedia information system for content-based retrieval
JPH08305718A (ja) 情報処理方法及び装置
Joshi et al. On fuzzy clustering and content based access to networked video databases
WO2002033589A1 (fr) Appareil de gestion d'informations de recherche de contenu d'image dynamique
de Vries et al. The design and implementation of an infrastructure for multimedia digital libraries
Marques et al. Issues in Designing Contemporary Video Database Systems.
JP2002063172A (ja) 画像検索方法および装置と画像検索プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080617