JP2003511801A - 効率的な概観及びブラウジングのためのビデオ要約記述構造と、ビデオ要約記述データ生成の方法及びシステム - Google Patents

効率的な概観及びブラウジングのためのビデオ要約記述構造と、ビデオ要約記述データ生成の方法及びシステム

Info

Publication number
JP2003511801A
JP2003511801A JP2001530817A JP2001530817A JP2003511801A JP 2003511801 A JP2003511801 A JP 2003511801A JP 2001530817 A JP2001530817 A JP 2001530817A JP 2001530817 A JP2001530817 A JP 2001530817A JP 2003511801 A JP2003511801 A JP 2003511801A
Authority
JP
Japan
Prior art keywords
video
highlight
description
segment
description structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001530817A
Other languages
English (en)
Other versions
JP2003511801A5 (ja
JP4733328B2 (ja
Inventor
ゼ ゴン キム
ヒョン ソン ジャン
ムンチョル キム
ジン ウン キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2003511801A publication Critical patent/JP2003511801A/ja
Publication of JP2003511801A5 publication Critical patent/JP2003511801A5/ja
Application granted granted Critical
Publication of JP4733328B2 publication Critical patent/JP4733328B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence

Abstract

(57)【要約】 本発明は要約ビデオをメタデータで記述するためのビデオ要約記述構造に関する。要約ビデオは原ビデオの全体内容が短時間に把握できる概観機能と、所望のビデオ内容を効率的にさがすことができるナビゲーション及びブラウジング機能を提供する。本発明による要約ビデオを記述するための階層的である構造を有する要約記述構造(Hierarchical Summary DS)は、少なくとも一つ以上のハイライトレベル記述構造(Highlihgt Level DS)を含み、要約主題リスト記述構造(Summary Theme List DS)を選択的に含む。前記ハイライトレベル記述構造はハイライトレベル(Highlight Level)について記述し、0個または複数個の下位のハイライトレベル記述構造を有することができる。ハイライトレベル記述構造はそのレベルの要約ビデオを構成する各セグメントの情報を記述する一つ以上のハイライトセグメント記述構造(Highlight Segment DS)を含む。ハイライトセグメント記述構造は該当セグメント区間の時間情報を記述するためのビデオセグメント位置指定記述構造(Video Segment Locator DS)を含む。また、ハイライトセグメント記述構造は該当セグメントの代表映像情報を記述するための映像位置指定記述構造(Image Lacator DS)と代表音響情報を記述するための音響位置指定記述構造(Sound Locator DS)、及びオーディオ要約を構成するオーディオセグメント情報を記述するためのオーディオ位置指定記述構造(Audio SegmentLocator DS)を含むこともできる。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は効率的なビデオ概観(overview)及びブラウジングのためのビデオ要
約記述構造に関する。また、ビデオ要約記述構造によってビデオ要約を記述する
ためのビデオ要約記述生成の方法及びシステムに関する。本発明の属する技術分
野は、内容を基にしたビデオ索引(indexing)及びブラウジング/検索
の分野で、ビデオを内容に基づいて要約し、これを記述する分野である。
【0002】 (発明の背景) ビデオ要約形態は大きく分けて、動的要約と静的要約になる。本発明によるビ
デオ記述構造は動的要約と静的要約とを統一的記述構造で効率的に記述するため
のものである。
【0003】 一般に、既存のビデオ要約及び記述構造はビデオ要約に含まれたビデオ区間に
関する情報を提供するだけなので、現状のビデオ要約と記述構造は要約ビデオの
再現を通じて全体ビデオの内容を伝達するのに限定される。しかし、多くの場合
、要約ビデオを通じて全体内容を概観するだけよりは、全体内容の概観を通じて
関心のある部分を識別し再び呼び出すためのブラウジングが必要である。
【0004】 また、既存のビデオ要約はビデオ要約提供者が定めた基準によって重要である
と判断されるビデオ区間だけを使用者に提供する。したがって、使用者とビデオ
提供者の基準が異なる場合、あるいは使用者が特別な基準を持つ場合、使用者は
所望のビデオ要約を得ることができない。つまり、既存の要約ビデオは、いくつ
かのレベルの要約ビデオを提供して使用者が所望のレベルの要約ビデオを選択で
きるが、要約ビデオの内容による選択ができないので使用者の選択範囲が制限的
である。
【0005】 発明の名称が“method and apparatus for vid
eo browsing based on content and str
ucture”で、登録番号がUS5821945である特許では、ビデオを集
約的に再現し、その再現を通じて所望の内容のビデオに接近する(access)ブラ
ウジング機能を提供する。しかし、この特許では、代表フレームに基づいた静的
な要約であって、既存の静的要約はビデオショットの代表フレームを利用して要
約するが、この特許の代表フレームは単にそのショットを代表する映像情報だけ
を提供するため、要約を利用した情報伝達に限界がある。この特許に比べて、前
記ビデオ記述構造とブラウジング方法はビデオセグメントに基づいた動的要約を
利用する。
【0006】 1999年7月にISO/IEC JTC1/SC29/WG11 MPEG
−7 Output Document No.N2844として発表された“
MPEG−7 Description Scheme(V0.5)”で提案さ
れたビデオ要約記述構造は、動的要約ビデオの各ビデオセグメントの区間情報だ
けを記述する。これは動的要約を記述する基本的な機能は提供するが、次の側面
で問題点を持っている。まず、従来は要約ビデオを構成する要約セグメントから
原ビデオへの接近(access)を提供できないという短所がある。つまり、使用者
は要約ビデオを通じた概観と要約内容(summary contents)に基づいてより詳細
な内容把握のために原ビデオへ接近しようとするが、従来はこれが提供できなか
った。また、オーディオ要約記述機能が十分に提供できない。最後に事件基盤の
要約(event-based summary)を表現しようとする時、重複記述と探索の複雑性
が不回避となる短所を持っている。
【0007】 (発明の概要) したがって、本発明は上記の問題点を改善するために、要約ビデオと共に要約
ビデオに含まれた各ビデオ区間ごとに代表フレーム情報、代表音響情報を含み、
要約ビデオの内容に対する使用者の選択を提供する使用者注文形(user customi
zed)の事件基盤要約(event based summary)と効果的なブラウジングを可能に
する階層的ビデオ要約記述構造と、その記述構造を利用したビデオ要約記述デー
タ生成方法及びシステムを提供するのにその目的がある。
【0008】 このような目的を達成するための本発明の一つの実施例による階層的要約記述
構造は、ハイライトレベルを記述している一つ以上のハイライトレベル記述構造
を含み、前記ハイライトレベル記述構造は、そのハイライトレベルの要約ビデオ
を構成するハイライトセグメント情報を記述している最少限ハイライトセグメン
ト記述構造を含むことを特徴とする。
【0009】 好ましくは、前記ハイライトレベル記述構造は一つ以上の下位レベルのハイラ
イトレベルDS(DS=記述構造)で構成されることを特徴とする。
【0010】 更に好ましくは、前記ハイライトセグメント記述構造は、前記該当ハイライト
セグメントの時間情報又はビデオ自身を記述しているビデオセグメント位置指定
記述構造を含むことを特徴とする。
【0011】 前記ハイライトセグメントDSが、前記該当ハイライトセグメントの代表フレ
ームを記述している映像位置指定DSを、更に含むことが望ましい。
【0012】 前記ハイライトセグメントDSが、前記該当ハイライトセグメントの代表音響
情報を記述している音響位置指定DSを、更に含むことが一層望ましい。
【0013】 前記ハイライトセグメントDSが、前記該当ハイライトセグメントの代表フレ
ームを記述している映像位置指定DS及び前記該当ハイライトセグメントの代表
音響情報を記述している音響位置指定DSを、更に含むことが望ましい。
【0014】 前記映像位置指定DSが、前記該当ハイライトセグメントに対応するビデオ区
間の代表フレームの時間情報又は映像データを、記述することが一層望ましい。
【0015】 前記ハイライトセグメントDSが、前記該当ハイライトセグメントの音響要約
を構成している音響セグメント情報を記述している音響セグメント位置指定DS
を、更に含むことが望ましい。
【0016】 前記音響セグメント位置指定DSが、前記該当ハイライトセグメントの音響区
間の時間情報又は音響データを記述することが一層望ましい。
【0017】 好ましくは、前記階層的要約記述構造は、前記階層的要約記述構造に含まれる
全てのサマリーコンポーネントタイプを列挙し、記述しているサマリーコンポー
ネントリストを含むことを特徴とする。
【0018】 好ましくは、前記階層的要約記述構造は、要約に含まれた事件または主題を列
挙し、そのIDを記述している要約主題リスト記述構造(Summary Theme List D
S)を含み、事件中心の要約を記述し、使用者が要約ビデオを前記要約主題リス
トに記述された主題または事件別にブラウジングできるようにすることを特徴と
する。
【0019】 前記要約主題リストDSが、要素としての要約主題を任意件数含み、前記要約
主題が、該当する事件又は主題を表わすid(識別記号)の属性を含み、この要
約主題が、上位レベルの事件又は主題のidを記述する親IDの属性を更に含む
ことが一層望ましい。
【0020】 共通の事件又は主題の前記id属性を記述している主題Idの属性を、前記ハ
イライトレベルDSが含むと好ましい場合は、該当ハイライトレベルを構成して
いる全てのハイライトセグメント及びハイライトレベルが共通の事件と主題を有
する場合である。
【0021】 前記ハイライトセグメントDSが、前記id属性を記述している主題Idの属
性を含み、該当ハイライトセグメントの事件又は主題を記述することが望ましい
【0022】 また、本発明によると、階層的要約記述構造が保存されたコンピュータで読む
ことができる記録媒体が提供される。 階層的要約記述構造が、ハイライトレベ
ルを記述しているハイライトレベルDSを一つ以上含み、ハイライトレベルDS
が、ハイライトレベルの要約ビデオを構成しているハイライトセグメント情報を
記述しているハイライトセグメントDSを一つ以上含み、ハイライトセグメント
DSが、前記該当ハイライトセグメントの時間情報又はビデオ自身を記述してい
るビデオセグメント位置指定DSを含むことが望ましい。
【0023】 また、本発明によると、原ビデオを入力してビデオ要約記述構造に従ってビデ
オ要約記述データを生成するビデオ要約記述データ生成方法が提供される。これ
は原ビデオを入力して分析し、ビデオ分析結果を出力するビデオ分析段階と;要
約ビデオ区間を選択するための要約規則を定義する要約規則定義段階;前記原ビ
デオ分析結果と前記要約規則とを入力して原ビデオからビデオ内容を要約するこ
とができるビデオ区間を選択して、要約ビデオ区間情報を構成する要約ビデオ区
間選択段階;及び前記要約ビデオ区間選択段階から出力された要約ビデオ区間情
報の入力を受けて、階層的要約記述構造によってビデオ要約記述データを生成す
るビデオ要約記述段階を含んでなることを特徴とする。
【0024】 また、本発明によると、原ビデオを入力してビデオ要約記述構造に従ってビデ
オ要約記述データを生成するビデオ要約記述データ生成システムが提供される。
これは原ビデオを入力して分析し、ビデオ分析結果を出力するビデオ分析手段と
;要約ビデオ区間を選択するための要約規則を定義する要約規則定義手段;前記
原ビデオ分析結果と前記要約規則とを入力して原ビデオからビデオ内容を要約す
ることができるビデオ区間を選択して、要約ビデオ区間情報を構成する要約ビデ
オ区間選択手段;及び前記要約ビデオ区間選択手段で定義された要約ビデオ区間
情報の入力を受けて、階層的要約記述構造を有するビデオ要約記述データを生成
するビデオ要約記述手段を含んでなることを特徴とする。
【0025】 また、本発明によると、上述したようなビデオ要約記述データ生成方法でビデ
オを階層的要約するビデオ要約記述データ生成システムを機能させるためのプロ
グラムを記録したコンピュータで読むことができる記録媒体が提供される。
【0026】 また、本発明によるサーバー/クライアント環境でのビデオブラウジングシス
テムは、原ビデオの入力を受けて階層的要約記述構造に基づいてビデオ要約記述
データを生成し、前記原ビデオとビデオ要約記述データとをリンクするビデオ要
約記述データ生成システムを備えたサーバーと; 前記ビデオ要約記述データを利用して前記原ビデオを概観し、前記サーバーの原
ビデオに接近してビデオをブラウジング及びナビゲーションするクライアントを
備えることを特徴とする。
【0027】 以下、添付した図面を参照して本発明の好ましい一実施例を詳細に説明する。
図中、参照番号は同一部分または同様部分を識別するための用いる。
【0028】 図1は本発明による記述構造(description scheme)によってビデオ要約記述
データを生成するためのシステムを示したブロック図である。図1に示すように
、本発明によるビデオ要約記述データ生成装置は特徴抽出部101、事件検出部
102、エピソード検出部103、要約ビデオ区間選択部104、要約規則定義
部105、代表フレーム抽出部106、代表音響抽出部107、及びビデオ要約
記述部108で構成される。
【0029】 特徴抽出部101は原ビデオを入力して要約ビデオを生成するために必要な特
徴を抽出する。一般的な特徴としてはショット境界、カメラの動き、字幕領域、
顔領域などがある。特徴抽出段階ではこれら特徴を抽出して特徴の種類とこれら
特徴が検出されるビデオ時間区間を(特徴種類、特徴一連番号、時間区間)の形
態で事件検出段階に出力する。例えば、カメラ動きの場合(カメラズーム、1、
100〜150)には第1カメラズームが100〜150番目のフレームで検出
されたという情報を表現する。
【0030】 事件検出部102は原ビデオに含まれたキーになる事件を検出する。これら事
件は原ビデオの内容を代表的によく表現しなければならず、要約ビデオを生成す
るのに基準となるものであるため、一般に原ビデオのジャンルに従って区別する
ように定義される。事件は上位の意味レベルを示すこともあり、上位の意味を直
接類推することができるビジュアル特徴であることもある。例えば、サッカービ
デオの場合、ゴール、シュート、字幕、リプレー(replay)などを事件と
して定義することができる。
【0031】 事件検出部102は検出した事件の種類とその時間区間を(事件種類、事件番
号、時間区間)形態で出力する。例えば、最初のゴールが200〜300フレー
ムの間で発生したという事件情報は(ゴール、1、200〜300)の形態で出
力する。
【0032】 エピソード検出部103は検出された事件に基づいてビデオを話の筋に基づい
た一つの事件よりさらに大きい単位のエピソードに分割する。キー事件を検出し
た後、そのキー事件を中心にその事件による付属事件を含んで一つのエピソード
を検出する。一例として、サッカービデオの場合、ゴールとシュートはキー事件
になり、その事件の付属事件としてゴールやシュートが発生した時のベンチ場面
、観衆席場面、ゴールセレモニー場面、ゴール場面のリプレーなどがその事件の
付属事件を構成する。つまり、ゴールとシュートとを中心にエピソードを検出す
る。
【0033】 エピソード検出情報は(エピソード番号、時間区間、優先順位、特徴ショット
、関連事件情報)の形態で出力する。ここでエピソード番号はエピソードの一連
番号であり、時間区間はそのエピソードの時間区間をショット単位で示す。優先
順位はそのエピソードの重要度を示す。特徴ショットはそのエピソードを構成す
るショットの中で最も重要な情報を含んだショット番号を示し、関連事件情報は
そのエピソードと関係する事件の事件番号を示す。例えば、(エピソード1、4
〜6、1、5、ゴール1、字幕3)のようなエピソード情報を表示する場合、そ
の情報は、第1エピソードが4〜6番目ショットを含み、優先順位が最高(1)
、特徴ショットが5番ショットであり、関連事件が1番ゴールと3番字幕である
ことを示す。
【0034】 要約ビデオ区間選択部104は、検出されたエピソードに基づいて原ビデオ内
容をよく要約することができるビデオ区間を選択する。この区間選択基準は予め
決められた要約規則定義部105の要約規則によって行う。
【0035】 要約規則定義部105は要約区間を選択するための規則を定義して要約区間を
選択するための制御信号を出力する。また、要約規則定義部105は要約ビデオ
区間選択の基盤となる要約事件種類をビデオ要約記述部108に出力する。
【0036】 要約ビデオ区間選択部104は選択された要約ビデオの区間の時間情報をフレ
ーム単位に出力し、ビデオ区間に対応する事件種類を出力する。つまり、(10
0〜200、ゴール)、(500〜700、シュート)等の形態は要約ビデオ区
間として選択されたビデオセグメントが、100〜200フレーム、500〜7
00フレーム等であって、各セグメントの事件はゴールとシュートであることを
示す。または、要約ビデオ区間だけで構成された追加的ビデオに接近できるよう
にファイル名などの情報を出力することも可能である。
【0037】 要約ビデオ区間選択が完了すれば、その要約ビデオ区間情報を利用して、代表
フレームと代表音響を代表フレーム抽出部106と代表音響抽出部107から各
々抽出する。代表フレーム抽出部106はその要約ビデオ区間を代表する映像の
フレーム番号またはその映像データを出力する。代表音響抽出部107はその要
約ビデオ区間を代表する音響データまたは音響時間区間を出力する。
【0038】 ビデオ要約記述部108は、図2に記述された本発明による階層的記述構造に
よって効果的な要約及びブラウジング機能を可能にする関連情報を記述する。階
層的要約DSの主要情報は、要約ビデオの要約事件種類、各要約ビデオ区間を記
述する時間情報、代表フレーム、代表音響、及び各区間の事件種類を含む。
【0039】 ビデオ要約記述部108は図2に示された記述構造によるビデオ要約記述デー
タを出力する。
【0040】 図2は、本発明によるビデオ要約記述データを記述する階層的要約記述構造(
Hierarchical Summary DS)のデータ構造をUML(Unified Modeling Language
)で示した図面である。
【0041】 ビデオ要約を記述する階層的要約記述構造201は一つ以上のハイライトレベ
ル記述構造(Highlight Level DS)202と1個または0個の要約主題リスト記
述構造(Summary Theme List DS)203を含んでいる。要約主題リストDS(S
ummary Theme List DS)は要約を構成する主題または事件の情報を網羅的に記述
することで、事件中心の要約及びブラウジングの機能を提供する。
【0042】 ハイライトレベル記述構造(Highlight Level DS)202は、そのレベルの要
約ビデオを構成するビデオ区間数だけの個数のハイライトセグメント記述構造(
Highlight Segment DS)204と0個または数個のハイライトレベル記述構造(
Highlight Level DS)で構成される。ハイライトセグメント記述構造は各要約ビ
デオ区間に対応する情報を記述する。ハイライトセグメント記述構造は一つのビ
デオセグメント位置指定記述構造(Video Segment Locator DS)205、0個ま
たは数個の映像位置指定記述構造(Image Locator DS)206、そして0個また
は数個の音響位置指定記述構造(Sound Locator DS)207及びオーディオセグ
メント位置指定記述構造(Audio Segment Locator DS)208を含んでいる。
【0043】 以下、この階層的要約記述構造についてより詳細に説明する。
【0044】 階層的要約記述構造(Hierarchical Summary DS)は階層的要約DSにより包
括される要約形態を明確に示すサマリーコンポーネントリスト(Summary Compon
ent List)という属性(attribute)を有する。サマリーコンポーネントリスト
(Summary Component List)は要約タイプ(Summary Component Type)に基づい
て派生し、サマリーコンポーネントタイプを含む全てのものを列挙して記述する
【0045】 サマリーコンポーネントリストにはキーフレーム、キービデオクリップ、キー
オーディオクリップ、キーイベント及びアンコンストレイン(unconstrained)
の5種類がある。キーフレームは代表フレームで構成されたキーフレーム要約を
示す。キービデオクリップは主要ビデオ区間の集合で構成されたキービデオクリ
ップ要約を示し、キーイベントは事件または主題に対応するビデオ区間で構成さ
れた要約を示し、キーオーディオクリップは代表オーディオ区間の集合で構成さ
れたキーオーディオクリップ要約を示す。アンコンストレインは前記要約以外の
、使用者が定義した要約形態を示す。
【0046】 また、事件中心の要約を記述するために階層的要約記述構造は要約に含まれた
事件(または主題)を列挙してそのIDを記述する要約主題リスト記述構造(Su
mmary Theme List DS)を含むこともできる。
【0047】 要約主題リストは任意の数の要約テーマを要素(element)として持つ。要約
テーマはID形のidという属性を有して親IDという属性を選択的に持つ。
【0048】 要約主題リスト記述構造は、要約主題リストに記述された各事件又はいくつか
の主題の観点から、使用者が要約ビデオをブラウジングできるようにする。つま
り、記述データを入力する応用ツールは、要約主題リスト記述構造を解析し、こ
の情報を使用者に提示して、使用者が望む主題を選択させる。この時、このよう
な主題を単純な形態に列挙する場合、主題の数が多ければ使用者が望む主題を探
すのが容易でないことがある。
【0049】 したがって、目次(ToC=Table of Content)と類似したツリー構造として主題
を表現することによって、使用者は、所望の主題を発見した後、主題別ブラウジ
ングが効率的にできる。このために本発明では、要約テーマに親IDの属性を選
択的に使用できるようにする。この親IDとは、ツリー構造における上位の要素
(上位の主題)を意味する。
【0050】 本発明の階層的要約記述構造はハイライトレベル記述構造(Highlight Level
DSs)を含み、各ハイライトレベル記述構造は、要約ビデオを構成するビデオセ
グメント(または区間)に対応する一つ以上のハイライトセグメント記述構造を
含む。
【0051】 ハイライトレベル記述構造はIDREFS形のテーマIdsの属性を有する。
このテーマIdsは、該当ハイライトレベルに含まれた全てのハイライトセグメ
ント記述構造または該当ハイライトレベル記述構造の子ハイライトレベル記述構
造に共通した、主題及び事件idを記述するが、このidは前記要約主題リスト
記述構造に記述されている。テーマIdsは数個の事件を意味することができ、
事件中心の要約をする時、そのレベルを構成する全セグメント内で同一idが不
必要に繰り返される問題点を解決するために、そのレベルを構成するハイライト
セグメント内で共通した主題の形を示すテーマIdsをおく。
【0052】 ハイライトセグメント記述構造は一つのビデオセグメント位置指定記述構造(
Video Segment Locator DS)と、一つ以上の映像位置指定記述構造(Image Loca
tor DS)と、0個または1個の音響位置指定記述構造(Sound Locator DS)と、
0個または1個のオーディオセグメント位置指定記述構造(Audio Segment Loca
tor DS)を含む。
【0053】 ここで、ビデオセグメント位置指定記述構造は、要約ビデオを構成するビデオ
セグメントのビデオ自身または時間情報を記述する。映像位置指定記述構造は、
そのビデオセグメントの代表フレームの映像データ情報を記述する。音響位置指
定記述構造は、該当ビデオセグメント区間を代表する音響情報を記述する。オー
ディオセグメント位置指定記述構造は、オーディオ要約を構成するオーディオセ
グメントの区間時間情報又はオーディオ情報自身を記述する。
【0054】 ハイライトセグメント記述構造はテーマIdsの属性を有する。このテーマI
dsは、該当ハイライトセグメントに関連する前記要約主題リスト記述構造内で
記述された主題又は事件を、要約主題リスト記述構造内で定義されたidを利用
して、記述する。テーマIdsは複数の事件を意味することができ、一つのハイ
ライトセグメントに複数の主題を含ませることができるようにして、事件基盤の
要約をするための既存の方法を使う時、事件(または主題)毎にビデオセグメン
トを記述することにより生ずる不可避な重複記述の問題点を解決するという、本
発明の効率的な記述方法である。
【0055】 要約ビデオを構成するハイライトセグメントを記述する時、単にそのハイライ
トビデオ区間の時間情報だけを記述した既存の階層的要約記述構造とは異なって
、各ハイライトセグメントのビデオ区間情報、代表フレーム情報、代表音響情報
を記述できるように、ビデオセグメント位置指定記述構造、映像セグメント位置
指定記述構造、サウンド位置指定記述構造を設定して、本発明は、ハイライトセ
グメントビデオを通じた概観とそのセグメントの代表フレーム及び代表音響を活
用したナビゲーション及びブラウジングを、要約ビデオを構成するハイライトセ
グメントを記述するためのハイライトセグメント記述構造を導入し、効率的に使
えるようにする。
【0056】 ビデオ区間に該当する代表音響を記述することができるサウンド位置指定記述
構造を設定して、実際に、そのビデオ区間を代表できる特徴的な音響、例えば銃
声、かん声、サッカーでアンカーのコメント(例、ゴール、シュート)、ドラマ
での俳優の名前、特定単語などを通じて、そのビデオ区間を再生してみなくても
短時間に、その区間が使用者が望む内容を含む重要な区間であるかどうか、どん
な内容が含まれた区間であるかを大略的に把握することで効率的なブラウジング
が可能である。
【0057】 図3は、図2と同じ記述構造で記述されたビデオ要約記述データを入力する要
約ビデオの再生及びブラウジングのためのツールの使用者インターフェースの構
成図である。ビデオ再現部301は使用者の制御に従って原ビデオまたは要約ビ
デオを再生する。原ビデオ代表フレーム部305は原ビデオのショットの代表フ
レームを再現する。つまり、一連の縮小映像で構成される。原ビデオのショット
の代表フレームは、本発明の階層的要約記述構造ではなく別途の記述構造で記述
され、この記述データが本発明の階層的要約記述構造で記述された要約記述デー
タと共に提供される時に、活用できる。使用者は、代表フレームをクリックする
ことにより代表フレームに対応する原ビデオのショットに、接近する。要約ビデ
オレベル0代表フレーム部及び代表音響部307と要約ビデオレベル1代表フレ
ーム部及び代表音響部306は、要約ビデオレベル0と要約ビデオレベル1夫々
の各ビデオ区間を代表するフレームと音響情報を与える。つまり、一連の縮小さ
れた映像及び音響を示すアイコン状映像で構成される。使用者が要約ビデオ代表
フレーム部及び代表音響部の代表フレームをクリックすると、その代表フレーム
に対応する原ビデオ区間に接近する。この時、要約ビデオの代表フレームに対応
する代表音響アイコンをクリックすると、そのビデオ区間の代表音響が再生され
る。
【0058】 要約ビデオ制御部302は要約ビデオを再生するために使用者の選択のための
制御を入力する。多階層の要約ビデオが提供される場合、使用者がレベル選択部
303を通じて所望のレベルの要約を選択することにより、概観しブラウジング
する。事件選択部304は要約主題リストによって提供される事件及び主題を列
挙して、使用者は所望の事件を選択することにより概観し、ブラウジングする。
結局、これが使用者注文形の要約を実現する。
【0059】 図4は、本発明の要約ビデオを利用した階層的ブラウジングのためのデータ及
び制御の流れに関する構成図である。ブラウジングは図3の使用者インターフェ
ースを利用して図4の方法でブラウジングのためのデータに接近して行う。ブラ
ウジングのためのデータは要約ビデオと要約ビデオの代表フレーム、原ビデオ4
06と原ビデオ代表フレーム405である。要約ビデオは二つのレベルを有する
ものとする。もちろん要約ビデオが二つ以上のレベルを有することもある。要約
ビデオレベル0(記号401)は要約ビデオレベル1(記号403)より短く要
約されたものである。つまり、要約ビデオレベル1が要約ビデオレベル0より多
くの内容を含んでいる。要約ビデオレベル0代表フレーム402は要約ビデオレ
ベル0の代表フレームであり、要約ビデオレベル1代表フレーム404は要約ビ
デオレベル1の代表フレームである。
【0060】 要約ビデオと原ビデオは、図3のビデオ再現部301を通じて再現される。要
約ビデオレベル0代表フレームは要約ビデオレベル0代表フレーム部及び代表音
響部306で表示され、要約ビデオレベル1代表フレームは要約ビデオレベル1
代表フレーム部及び代表音響部307で表示される。原ビデオ代表フレームは原
ビデオ代表フレーム部305に表示される。
【0061】 図4に示された階層的ブラウジング方法は、次の例のように多様な形態の階層
的経路を有することができる。 場合1)(1)−(2) 場合2)(1)−(3)−(5) 場合3)(1)−(3)−(4)−(6) 場合4)(7)−(5) 場合5)(7)−(4)−(6)
【0062】 全体的なブラウジング技法は次の通りである。まず、原ビデオの要約ビデオを
見て原ビデオの全体内容を把握する。この時、要約ビデオは要約ビデオレベル0
又は要約ビデオレベル1を再現できる。要約ビデオを見た後、要約ビデオでさら
に詳細にブラウジングしようとする時、関心のあるビデオ区間を要約ビデオ代表
フレームを通じて確認する。正確に探そうとする場面が要約ビデオ代表フレーム
で確認できると、その代表フレームを連結された原ビデオのビデオ区間に直ちに
接近して再生する。より詳細な情報が必要な場合、次のレベルの代表フレームを
把握したり、原ビデオの代表フレームの内容を階層的に把握して、所望の原ビデ
オに接近する。このような階層的ブラウジング技法は所望の内容に接近するため
に、原ビデオを再生しながらブラウジングすると多くの時間がかかるが、原ビデ
オの内容を階層化された代表フレームを通じて直接に接近するために、ブラウジ
ング時間を相当減らすことができる。
【0063】 既存の一般的なビデオ索引及びブラウジング技法は、原ビデオをショット単位
に分割し、各ショットを代表する代表フレームを構成して代表フレームから所望
のショットを認識してそのショットに接近する。この場合、原ビデオのショット
の個数が非常に多いので多くの数の代表フレームから所望の内容をブラウジング
するのに多くの時間と努力を要する。本発明では要約ビデオの代表フレームで階
層的代表フレームを構成して速く所望のビデオに接近することができる。
【0064】 場合1)は、要約ビデオレベル0を再現して要約ビデオレベル0代表フレーム
から直ちに原ビデオに接近する場合である。場合2)は、要約ビデオレベル0を
再現して要約ビデオレベル0代表フレームから最も関心のある代表フレームを選
択して原ビデオに接近する前にさらに詳細な情報を把握するために、その代表フ
レームの近くに該当する要約ビデオレベル1の代表フレーム内に所望の場面を確
認して、原ビデオに接近する場合である。場合3)は、場合2)で要約ビデオレ
ベル1代表フレームから直ちに原ビデオに接近するのが難しい場合、さらに詳細
な情報を得るために最も関心のある代表フレームを選択し、その代表フレーム近
くの原ビデオ代表フレームによって所望の場面を確認し、原ビデオの代表フレー
ムを利用して原ビデオに接近する場合である。場合4)と場合5)とは、要約ビ
デオレベル1の再現で開始して経路は上述した場合と類似している。
【0065】 このような本発明をサーバー/クライアント環境に適用すると、複数のクライ
アントが一つのサーバーに接近してビデオを概観及びブラウジングできるシステ
ムを提供することができる。サーバーに原ビデオを受信して階層的要約記述構造
に基づいてビデオ要約記述データを生成し、前記原ビデオとビデオ要約記述デー
タをリンクするビデオ要約記述データ生成システムを設ける。クライアントは通
信網を通じてサーバーに接近し、ビデオ要約記述データを利用してビデオを概観
して原ビデオに接近してビデオをブラウジング及びナビゲーションする。
【0066】 本発明の技術思想は前記の好ましい実施例によって具体的に記述されたが、前
記実施例はその説明のためのものであり、その制限のためのものでないことを注
意するべきである。また、本発明の技術分野の通常の専門家であれば本発明の技
術思想の範囲内で様々な実施例が可能であるが理解できるであろう。
【0067】 以上で説明したように本発明は、要約ビデオの生成と記述構造を通じてビデオ
全体内容を速い時間に把握し、要約ビデオの各ビデオ区間の代表フレーム情報と
代表音響情報を利用して効果的な階層的ブラウジングを可能にする。また、事件
基盤の要約ビデオ記述を通じて事件及び主題による要約ビデオ及びブラウジング
使用者に提供できる使用者注文形の機能も含む。
【図面の簡単な説明】
【図1】 本発明による記述構造(description scheme:DS)によってビデオ要約記述デ
ータを生成するためのシステムを示したブロック図である。
【図2】 本発明による要約ビデオを記述するための階層的記述構造の資料構造をUML
(Unified Modeling Language)で示した図面である。
【図3】 本発明による要約ビデオの再現及びブラウジングツールの使用者インターフェ
ースの一実施例である。
【図4】 本発明によるビデオ要約記述データを利用した階層的ブラウジングのためのデ
ータ及び制御流れに関する構成図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AL,AM,AT,AU, AZ,BA,BB,BG,BR,BY,CA,CH,C N,CR,CU,CZ,DE,DK,DM,EE,ES ,FI,GB,GD,GE,GH,GM,HR,HU, ID,IL,IN,IS,JP,KE,KG,KP,K R,KZ,LC,LK,LR,LS,LT,LU,LV ,MA,MD,MG,MK,MN,MW,MX,NO, NZ,PL,PT,RO,RU,SD,SE,SG,S I,SK,SL,TJ,TM,TR,TT,TZ,UA ,UG,US,UZ,VN,YU,ZA,ZW (72)発明者 ジャン ヒョン ソン 大韓民国 302−741 デゾンシ ソ−グ マンヨン−ドン ガンビョン アパートメ ント 112−506 (72)発明者 キム ムンチョル 大韓民国 302−734 デゾンシ ソ−グ ドゥンサン 2−ドン 912 ドゥンジ アパートメント 110−405 (72)発明者 キム ジン ウン 大韓民国 305−761 デゾンシ ユソン− グ ジョンミン−ドン エキスポ アパー トメント 305−1603 Fターム(参考) 5B075 ND12 NK06 NK39 NK43 NR05 NR20 PQ02 PQ42 5C052 AB02 AC08 DD04 【要約の続き】 記述構造は該当セグメントの代表映像情報を記述するた めの映像位置指定記述構造(Image Lacator DS)と代表 音響情報を記述するための音響位置指定記述構造(Soun d Locator DS)、及びオーディオ要約を構成するオーデ ィオセグメント情報を記述するためのオーディオ位置指 定記述構造(Audio SegmentLocator DS)を含むことも できる。

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】 ビデオ要約を記述するための階層的要約記述構造であって、
    ハイライトレベルを記述している一つ以上のハイライトレベル記述構造を含み、
    前記ハイライトレベル記述構造が、そのハイライトレベルの要約ビデオを構成す
    るハイライトセグメント情報を記述する一つ以上のハイライトセグメント記述構
    造を含むことを特徴とする階層的要約記述構造。
  2. 【請求項2】 前記ハイライトレベル記述構造が一つ以上の下位ハイライト
    レベル記述構造で構成されることを特徴とする、請求項1に記載の階層的要約記
    述構造。
  3. 【請求項3】 前記ハイライトセグメント記述構造が、 前記該当ハイライトセグメントの時間情報又はビデオ自体を記述しているビデオ
    セグメント位置指定記述構造を含むことを特徴とする、請求項1に記載の階層的
    要約記述構造。
  4. 【請求項4】 前記ハイライトセグメント記述構造が、 前記該当ハイライトセグメントの代表フレームを記述している映像位置指定記述
    構造をさらに含むことを特徴とする、請求項3に記載の階層的要約記述構造。
  5. 【請求項5】 前記ハイライトセグメント記述構造が、 前記該当ハイライトセグメントの代表音響情報を記述している音響位置指定記述
    構造をさらに含むことを特徴とする、請求項3に記載の階層的要約記述構造。
  6. 【請求項6】 前記ハイライトセグメント記述構造が、 前記該当ハイライトセグメントの代表フレームを記述している映像位置指定記述
    構造と、前記該当ハイライトセグメントの代表音響情報を記述している音響位置
    指定記述構造とをさらに含むことを特徴とする、請求項3に記載の階層的要約記
    述構造。
  7. 【請求項7】 前記映像位置指定記述構造が、 前記該当ハイライトセグメントに対応するビデオ区間の代表フレームの時間情報
    又は映像データを記述することを特徴とする、請求項4または6に記載の階層的
    要約記述構造。
  8. 【請求項8】 前記ハイライトセグメント記述構造が、 前記該当ハイライトセグメントのオーディオ要約を構成するオーディオセグメン
    ト情報を記述しているオーディオセグメント位置指定記述構造をさらに含むこと
    を特徴とする、請求項3乃至6のいずれか一項に記載の階層的要約記述構造。
  9. 【請求項9】 前記オーディオセグメント位置指定記述構造は、 前記該当ハイライトセグメントのオーディオ区間の時間情報又はオーディオデー
    タを記述することを特徴とする、請求項8に記載の階層的要約記述構造。
  10. 【請求項10】 前記階層的要約記述構造が、 前記階層的要約記述構造に含まれる全てのサマリー コンポーネント タイプを
    列挙して記述しているサマリーコンポーネントリストを含むことを特徴とする、
    請求項1に記載の階層的要約記述構造。
  11. 【請求項11】 前記サマリー コンポーネント タイプは、 代表フレームで構成されたキーフレーム要約を示すキーフレームと、キービデオ
    セグメントの集合で構成されたキービデオクリップ要約を示すキービデオクリッ
    プ、事件(event)または主題に対応するビデオ区間の要約を示すキーイベント
    と、代表オーディオ区間の集合で構成されたキーオーディオクリップ要約を示す
    キーオーディオクリップ及び前記要約以外の使用者が定義した要約の形態を示す
    アンコンストレインを含むことを特徴とする、請求項10に記載の階層的要約記
    述構造。
  12. 【請求項12】 前記階層的要約記述構造は、 要約に含まれた事件(または主題)を列挙し、そのIDを記述する要約主題リス
    ト記述構造を含み、事件中心の要約を記述し、使用者が要約ビデオを、前記要約
    主題リストに記述された主題または事件別に、ブラウジングできるようにするこ
    とを特徴とする、請求項1に記載の階層的要約記述構造。
  13. 【請求項13】 前記要約主題リスト記述構造は任意の数の要約テーマを要
    素として含み、 前記要約テーマが、事件または主題を示すid属性を含むことを特徴とする、請
    求項11に記載の階層的要約記述構造。
  14. 【請求項14】 前記要約テーマは親ID属性をさらに含み、上位レベルの
    事件または主題のidを記述するようにすることを特徴とする、請求項13に記
    載の階層的要約記述構造。
  15. 【請求項15】 前記ハイライトレベル記述構造は、 前記id属性を記述するテーマIdsの属性を含み、 対応ハイライトレベルを構成する全てのハイライトセグメントやハイライトレベ
    ルが共通の事件または主題を有すれば、共通の事件または主題のidの属性を記
    述する主題Idsの属性を含むことを特徴とする、請求項13に記載の階層的要
    約記述構造。
  16. 【請求項16】 前記ハイライトセグメント記述構造は、 前記id属性を記述するテーマIdsの属性として含み、 対応ハイライトセグメントの事件または主題を記述することを特徴とする、請求
    項13に記載の階層的要約記述構造。
  17. 【請求項17】 階層的要約DSが保存されたコンピュータ可読記録媒体で
    あって、 前記階層的要約DSが一つ以上のハイライトレベルDSを含んでいて、 前記ハイライトレベルDSにはハイライトレベルが記述されており、 前記ハイライトレベルDSが一つ以上のハイライトセグメントDSを含んでいて
    、前記ハイライトセグメントDSにはハイライトセグメント情報が記述されてい
    て、 前記ハイライトセグメント情報が前記ハイライトレベルの要約ビデオを構成し、
    前記ハイライトセグメントDSがビデオセグメント位置指定DSを含んでいて 前記ビデオセグメント位置指定DSには前記対応ハイライトセグメントの時間情
    報またはビデオ自身が記述されていることを特徴とするコンピュータ可読記録媒
    体。
  18. 【請求項18】 原ビデオの入力を受けてビデオ要約記述構造に従ってビデ
    オ要約記述データを生成する方法において、 原ビデオの入力を受けて分析し、ビデオ分析結果を出力するビデオ分析段階と;
    要約ビデオ区間を選択するための要約規則を定義する要約規則定義段階; 前記原ビデオ分析結果と前記要約規則との入力を受けて原ビデオからビデオ内容
    を要約することができるビデオ区間を選択して要約ビデオ区間情報を構成する要
    約ビデオ区間選択段階;及び 前記要約ビデオ区間選択段階から出力された要約ビデオ区間情報を受信して階層
    的要約記述構造によってビデオ要約記述データを生成するビデオ要約記述段階 を含んでいることを特徴とするビデオ要約記述データ生成方法。
  19. 【請求項19】 前記階層的要約記述構造は、 ハイライトレベルについて記述する少なくとも一つ以上のレベルを有するハイラ
    イトレベル記述構造を含み、 前記ハイライトレベル記述構造はそのレベルの要約ビデオを構成する各ハイライ
    トセグメントの情報を記述する一つ以上のハイライトセグメント記述構造を含み
    、 前記ハイライトセグメント記述構造は前記対応ハイライトセグメントの時間情報
    又はビデオ自体情報とを記述するビデオセグメント位置指定記述構造を含むこと
    を特徴とする、請求項18に記載のビデオ要約記述データ生成方法。
  20. 【請求項20】 前記ビデオ分析段階は、 原ビデオを入力として受けて特徴を抽出し、検出された特徴の種類と特徴検出ビ
    デオ時間区間を出力する特徴抽出段階と、 前記特徴の種類と特徴が検出ビデオ時間区間の入力を受けて原ビデオに含まれた
    キー事件を検出する事件検出段階と、 前記検出されたキー事件に基づいて原ビデオを筋書き中心に区分してエピソード
    を検出するエピソード検出段階を含んでなることを特徴とする、請求項18に記
    載のビデオ要約記述データ生成方法。
  21. 【請求項21】 前記要約規則定義段階は、要約ビデオ区間を選択するのに
    基盤となる要約事件種類を定義して前記要約ビデオ記述段階に提供することを特
    徴とする、請求項18に記載のビデオ要約記述データ生成方法。
  22. 【請求項22】 前記要約ビデオ区間情報の入力を受けて代表フレームを抽
    出し、前記ビデオ要約記述段階に提供する代表フレーム抽出段階をさらに含むこ
    とを特徴とする、請求項18に記載のビデオ要約記述データ生成方法。
  23. 【請求項23】 前記要約ビデオ区間情報の入力を受けて代表音響を抽出し
    、前記ビデオ要約記述段階に提供する代表音響抽出段階をさらに含むことを特徴
    とする、請求項18に記載のビデオ要約記述データ生成方法。
  24. 【請求項24】 特徴の種類と特徴検出ビデオ時間区間を出力する特徴抽出
    段階と、 前記特徴の種類と前記特徴検出ビデオ時間区間の入力を受けて原ビデオに含まれ
    たキー事件を検出する事件検出段階、 前記検出されたキー事件に基づいて原ビデオを筋書き中心に区分してエピソード
    を検出するエピソード検出段階 要約ビデオ区間を選択するための要約規則を定義する要約規則定義段階; 前記検出されたエピソードと前記要約規則の入力を受けて原ビデオからビデオの
    内容を要約することができるビデオ区間を選択して要約ビデオ区間情報を構成す
    る要約ビデオ区間選択段階;及び 前記要約ビデオ区間選択段階から出力された要約ビデオ区間情報の入力を受けて
    階層的要約記述構造を有するビデオ要約記述データを生成する要約ビデオ記述段
    階 を実行させるためのプログラムを記録したコンピュータ可読記録媒体。
  25. 【請求項25】 原ビデオの入力を受けてビデオ要約記述構造に従ってビデ
    オ要約記述データを生成するシステムにおいて、 原ビデオを受信して分析してビデオ分析結果を出力するビデオ分析手段と; 要約ビデオ区間を選択するための要約規則を定義する要約規則定義手段; 前記原ビデオ分析結果と前記要約規則の入力を受けて原ビデオからビデオ内容を
    要約することができるビデオ区間を選択して要約ビデオ区間情報を構成する要約
    ビデオ区間選択手段;及び 前記要約ビデオ区間選択手段から出力された要約ビデオ区間情報の入力を受けて
    階層的要約記述構造を有するビデオ要約記述データを生成するビデオ要約記述手
    段 を含んでなることを特徴とするビデオ要約記述データ生成システム。
  26. 【請求項26】 前記階層的要約記述構造は、 ハイライトレベルについて記述する少なくとも一つ以上のハイライトレベル記述
    構造を含み、 前記ハイライトレベル記述構造は、そのレベルの要約ビデオを構成する各ハイラ
    イトセグメントの情報を記述する一つ以上のハイライトセグメント記述構造を含
    み、 前記ハイライトセグメント記述構造は、前記対応ハイライトセグメントの時間情
    報又はビデオ自身を記述するビデオセグメント位置指定記述構造を含むことを特
    徴とする、請求項25に記載のビデオ要約記述データ生成システム。
  27. 【請求項27】 前記ビデオ分析手段は、 原ビデオを入力として受けて特徴を抽出し、検出された特徴の種類と特徴検出ビ
    デオ時間区間を出力する特徴抽出手段と、 前記特徴の種類と特徴が検出されるビデオ時間区間の入力を受けて原ビデオに含
    まれたキー事件を検出する事件検出手段、 前記検出されたキー事件に基づいて原ビデオを筋書き中心に区分してエピソード
    を検出するエピソード検出手段を含んでなることを特徴とする、請求項25に記
    載のビデオ要約記述データ生成システム。
  28. 【請求項28】 前記要約規則定義手段は要約ビデオ区間を選択するのに基
    盤となる要約事件種類を定義して前記ビデオ要約記述手段に提供することを特徴
    とする、請求項25に記載のビデオ要約記述データ生成システム。
  29. 【請求項29】 前記要約ビデオ区間選択手段の要約ビデオ区間情報の入力
    を受けて代表フレームを抽出し、前記ビデオ要約記述手段に提供する代表フレー
    ム抽出手段をさらに含むことを特徴とする、請求項25に記載のビデオ要約記述
    データ生成システム。
  30. 【請求項30】 前記要約ビデオ区間選択手段の要約ビデオ区間情報の入力
    を受けて代表音響を抽出し、前記ビデオ要約記述手段に提供する代表音響抽出手
    段をさらに含むことを特徴とする、請求項25に記載のビデオ要約記述データ生
    成システム。
  31. 【請求項31】 特徴の種類と特徴が検出されたビデオ時間区間を出力する
    特徴抽出手段と、 前記特徴の種類と特徴検出ビデオ時間区間の入力を受けて原ビデオに含まれたキ
    ー事件を検出する事件検出手段、 前記検出されたキー事件に基づいて原ビデオを筋書き中心に区分してエピソード
    を検出するエピソード検出手段、 要約ビデオ区間を選択するための要約規則を定義する要約規則定義手段、 前記検出されたエピソードと前記要約規則の入力を受けて原ビデオからビデオ内
    容を要約することができるビデオ区間を選択し、要約ビデオ区間情報を構成する
    要約ビデオ区間選択手段、及び 前記要約ビデオ区間選択段階から出力された要約ビデオ区間情報の入力を受けて
    階層的要約記述構造を有するビデオ要約記述データを生成するビデオ要約記述手
    段 を機能させるためのコンピュータ可読記録媒体。
  32. 【請求項32】 原ビデオの入力を受けて階層的要約記述構造の基盤上にビ
    デオ要約記述データを生成し、前記原ビデオとビデオ要約記述データをリンクす
    るビデオ要約記述データ生成システムを備えたサーバーと; 前記ビデオ要約記述データを利用して前記原ビデオを概観し、前記サーバーの原
    ビデオに接近(access)してビデオをブラウジング及びナビゲーションするクラ
    イアント を備えることを特徴とするサーバー/クライアント環境におけるビデオブラウジ
    ングシステム。
JP2001530817A 1999-10-11 2000-09-29 効率的な概観及びブラウジングのためのビデオ要約記述構造と、ビデオ要約記述データ生成の方法及びシステム Expired - Fee Related JP4733328B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1999/43712 1999-10-11
KR19990043712 1999-10-11
PCT/KR2000/001084 WO2001027876A1 (en) 1999-10-11 2000-09-29 Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing

Publications (3)

Publication Number Publication Date
JP2003511801A true JP2003511801A (ja) 2003-03-25
JP2003511801A5 JP2003511801A5 (ja) 2007-12-06
JP4733328B2 JP4733328B2 (ja) 2011-07-27

Family

ID=19614707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001530817A Expired - Fee Related JP4733328B2 (ja) 1999-10-11 2000-09-29 効率的な概観及びブラウジングのためのビデオ要約記述構造と、ビデオ要約記述データ生成の方法及びシステム

Country Status (7)

Country Link
EP (1) EP1222634A4 (ja)
JP (1) JP4733328B2 (ja)
KR (1) KR100371813B1 (ja)
CN (2) CN100485721C (ja)
AU (1) AU7689200A (ja)
CA (1) CA2387404A1 (ja)
WO (1) WO2001027876A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001333353A (ja) * 2000-03-16 2001-11-30 Matsushita Electric Ind Co Ltd データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム
US7134074B2 (en) 1998-12-25 2006-11-07 Matsushita Electric Industrial Co., Ltd. Data processing method and storage medium, and program for causing computer to execute the data processing method
US20020108112A1 (en) * 2001-02-02 2002-08-08 Ensequence, Inc. System and method for thematically analyzing and annotating an audio-visual sequence
US7432940B2 (en) 2001-10-12 2008-10-07 Canon Kabushiki Kaisha Interactive animation of sprites in a video production
KR100464076B1 (ko) * 2001-12-29 2004-12-30 엘지전자 주식회사 동영상 비디오 브라우징 방법과 장치
JPWO2003088665A1 (ja) 2002-04-12 2005-08-25 三菱電機株式会社 メタデータ編集装置、メタデータ再生装置、メタデータ配信装置、メタデータ検索装置、メタデータ再生成条件設定装置、及びメタデータ配信方法
CN101132528B (zh) * 2002-04-12 2011-08-03 三菱电机株式会社 元数据再生、分发、检索装置、元数据再生成条件设定装置
JP4228662B2 (ja) * 2002-11-19 2009-02-25 日本電気株式会社 映像閲覧システムおよび方法
JP4218319B2 (ja) * 2002-11-19 2009-02-04 日本電気株式会社 映像閲覧システムおよび方法
US8392834B2 (en) 2003-04-09 2013-03-05 Hewlett-Packard Development Company, L.P. Systems and methods of authoring a multimedia file
EP1538536A1 (en) 2003-12-05 2005-06-08 Sony International (Europe) GmbH Visualization and control techniques for multimedia digital content
WO2005069172A1 (ja) * 2004-01-14 2005-07-28 Mitsubishi Denki Kabushiki Kaisha 要約再生装置および要約再生方法
JP4525437B2 (ja) * 2005-04-19 2010-08-18 株式会社日立製作所 動画処理装置
CN100455011C (zh) * 2005-10-11 2009-01-21 华为技术有限公司 一种提供媒体资源预览信息的方法
US8301669B2 (en) 2007-01-31 2012-10-30 Hewlett-Packard Development Company, L.P. Concurrent presentation of video segments enabling rapid video file comprehension
JP5092469B2 (ja) * 2007-03-15 2012-12-05 ソニー株式会社 撮像装置、画像処理装置、および画像表示制御方法、並びにコンピュータ・プログラム
US8238719B2 (en) 2007-05-08 2012-08-07 Cyberlink Corp. Method for processing a sports video and apparatus thereof
CN101753945B (zh) * 2009-12-21 2013-02-06 无锡中星微电子有限公司 一种节目预览的方法和装置
US10679671B2 (en) 2014-06-09 2020-06-09 Pelco, Inc. Smart video digest system and method
US9998799B2 (en) * 2014-08-16 2018-06-12 Sony Corporation Scene-by-scene plot context for cognitively impaired
KR101640317B1 (ko) * 2014-11-20 2016-07-19 소프트온넷(주) 오디오 및 비디오 데이터를 포함하는 영상의 저장 및 검색 장치와 저장 및 검색 방법
CN104391960B (zh) * 2014-11-28 2019-01-25 北京奇艺世纪科技有限公司 一种视频标注方法及系统
KR102350917B1 (ko) * 2015-06-15 2022-01-13 한화테크윈 주식회사 감시 시스템
KR102592904B1 (ko) * 2016-02-19 2023-10-23 삼성전자주식회사 영상 요약 장치 및 방법
US10409279B2 (en) * 2017-01-31 2019-09-10 GM Global Technology Operations LLC Efficient situational awareness by event generation and episodic memory recall for autonomous driving systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1188807A (ja) * 1997-09-10 1999-03-30 Media Rinku Syst:Kk 映像ソフト再生方法、映像ソフト処理方法、映像ソフト再生プログラムを記録した媒体、映像ソフト処理プログラムを記録した媒体、映像ソフト再生装置、映像ソフト処理装置及び映像ソフト記録媒体
WO1999032993A1 (en) * 1997-12-19 1999-07-01 Sharp Kabushiki Kaisha Method for hierarchical summarization and browsing of digital video

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3407840B2 (ja) * 1996-02-13 2003-05-19 日本電信電話株式会社 映像要約方法
JPH1169281A (ja) * 1997-08-15 1999-03-09 Media Rinku Syst:Kk 要約生成装置及び映像表示装置
WO1999041684A1 (en) * 1998-02-13 1999-08-19 Fast Tv Processing and delivery of audio-video information
US6278446B1 (en) * 1998-02-23 2001-08-21 Siemens Corporate Research, Inc. System for interactive organization and browsing of video

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1188807A (ja) * 1997-09-10 1999-03-30 Media Rinku Syst:Kk 映像ソフト再生方法、映像ソフト処理方法、映像ソフト再生プログラムを記録した媒体、映像ソフト処理プログラムを記録した媒体、映像ソフト再生装置、映像ソフト処理装置及び映像ソフト記録媒体
WO1999032993A1 (en) * 1997-12-19 1999-07-01 Sharp Kabushiki Kaisha Method for hierarchical summarization and browsing of digital video

Also Published As

Publication number Publication date
KR20010050596A (ko) 2001-06-15
KR100371813B1 (ko) 2003-02-11
WO2001027876A1 (en) 2001-04-19
JP4733328B2 (ja) 2011-07-27
CN101398843B (zh) 2011-11-30
AU7689200A (en) 2001-04-23
CA2387404A1 (en) 2001-04-19
CN100485721C (zh) 2009-05-06
CN101398843A (zh) 2009-04-01
CN1382288A (zh) 2002-11-27
EP1222634A1 (en) 2002-07-17
EP1222634A4 (en) 2006-07-05

Similar Documents

Publication Publication Date Title
US7181757B1 (en) Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing
JP2003511801A (ja) 効率的な概観及びブラウジングのためのビデオ要約記述構造と、ビデオ要約記述データ生成の方法及びシステム
Money et al. Video summarisation: A conceptual framework and survey of the state of the art
Truong et al. Video abstraction: A systematic review and classification
JP3454764B2 (ja) 内容ベースで映像を検索する検索システム及び検索方法
US8234674B2 (en) Method of constructing information on associate meanings between segments of multimedia stream and method of browsing video using the same
KR100512138B1 (ko) 합성 키프레임을 이용한 비디오 브라우징 시스템
Bolle et al. Video query: Research directions
US20020108112A1 (en) System and method for thematically analyzing and annotating an audio-visual sequence
JP2001028722A (ja) 動画像管理装置及び動画像管理システム
WO2003088665A1 (fr) Dispositif d'edition de metadonnees, dispositif de reproduction de metadonnees, dispositif de distribution de metadonnees, dispositif de recherche de metadonnees, dispositif d'etablissement de conditions de reproduction de metadonnees, et procede de distribution de metadonnees
KR100370247B1 (ko) 등장인물 관계 기반 동영상 검색 방법
JP3574606B2 (ja) 映像の階層的管理方法および階層的管理装置並びに階層的管理プログラムを記録した記録媒体
US20040181545A1 (en) Generating and rendering annotated video files
JP4732418B2 (ja) メタデータ処理方法
KR20000038290A (ko) 사건구간을 기반으로 하는 동영상 검색방법과 검색 데이타 구조
JP3690313B2 (ja) 動画像管理装置、情報入力方法および動画像検索方法
Li et al. Bridging the semantic gap in sports
KR100361499B1 (ko) 멀티미디어 스트림의 세그먼트간 원인/결과 관계 정보 구성 방법과 세그먼트간 원인/결과 관계 정보를 이용한 비디오 브라우징 방법
JP2008136183A (ja) ヒント情報記述方法
Nack The Future of Media Computing: From Ontology-Based Semiosis to Communal Intelligence
Mu Decoupling the information application from the information creation: Video as learning objects in three-tier architecture
Khoja Thematic indexing in video databases
Chung-Wing ADVISE: Advanced Digital Video Information Segmentation Engine
Ghai et al. Intelligent Analyst Digital Video Library Prototype

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070927

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070927

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100720

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101220

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20101221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101221

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110422

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees