JP2003517786A - ビデオ制作システムおよび方法 - Google Patents

ビデオ制作システムおよび方法

Info

Publication number
JP2003517786A
JP2003517786A JP2001546152A JP2001546152A JP2003517786A JP 2003517786 A JP2003517786 A JP 2003517786A JP 2001546152 A JP2001546152 A JP 2001546152A JP 2001546152 A JP2001546152 A JP 2001546152A JP 2003517786 A JP2003517786 A JP 2003517786A
Authority
JP
Japan
Prior art keywords
descriptor
video
moving image
segments
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001546152A
Other languages
English (en)
Other versions
JP2003517786A5 (ja
Inventor
ピーター, ロワン ケロック,
スリクマー, カライクディ スブラマニアム,
ラマナス パッドマナハン,
リアング, キー ゴー,
Original Assignee
ケント・リッジ・デジタル・ラブス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ケント・リッジ・デジタル・ラブス filed Critical ケント・リッジ・デジタル・ラブス
Publication of JP2003517786A publication Critical patent/JP2003517786A/ja
Publication of JP2003517786A5 publication Critical patent/JP2003517786A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 動画像セグメント(108)を処理するシステムを開示する。本システムは記述子(110)を作成し、対応する動画像セグメント(108)に対する少なくとも一つの値をこの記述子に特有のものにする記述子インスタンシエータを含む。本システムは更に、少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの動画像セグメントを選定する手段と少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの動画像セグメントを配列づけする手段とを含み、少なくとも二つの動画像セグメントから出力ビデオ制作を組立てる動画像コンストラクタを含む。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は、一般にビデオ制作に関する。特に、本発明は、ビデオ制作用のビデ
オ再目的化、編集およびファイル保管に関する。
【0002】 (背景技術) 今日のノンリニアビデオエディタは、ビデオプレーヤによるフィルムカッティ
ングと線形ダブ編集のような従来の編集方法から生まれた。これらのツールは、
望む結果が単一で高品質なビデオ制作であるシナリオに好適である。しかし、こ
れらのツールにより素早くビデオ制作の複数の編集代替案を考えることは不可能
であり、これは新しいビデオエディタにとっては支障になる。それゆえ、ビデオ
制作の初心者は、初心者が素早く作成できるものは何でも“使う”か、あるいは
代替案を探すのに多くの時間を費やすかのどちらか一方を強いられる。
【0003】 根本的に異なるビデオ制作ツールを必要とする多くの傾向が見られる。このよ
うな傾向は、被撮影や被記録映像素材、特に非専門家により撮影された映像素材
量の急激な増加の中に見られる。ディジタルビデオ(DV)カメラのような製品
をもたらす技術開発やブレークスルーは、ますます多くのビデオ素材をディジタ
ルフォーマットで専門家の、あるいは専門家に近い技術品質で撮影したり、記録
することを意味する。しかし、従来のツールによるこの種のビデオ素材を編集す
る費用は、多くの場合に法外に高いものである。
【0004】 別の傾向は、周知の放送以外のパラダイムやVCRパラダイムを視聴するビデ
オ素材の拡張に見られる。視聴者は、視聴するビデオ素材に関し、どれぐらい長
く、どの順序で等の制御を増やしたがる。この傾向は、教育および専門家環境の
ノンフィクションビデオ素材に特に当てはまる。更に、この傾向は、例えば、種
々の視聴者デモグラフィを目指して種々の強調を伴う、種々の長さのビデオ制作
において、ビデオ素材の本体を複数形式で利用可能にする必要性が高まることを
意味する。
【0005】 更に別の傾向は、ディジタルフォーマット内やインタネット上で入手可能なビ
デオ素材量の有効性の指数関数的な増加に見られる。この傾向は、記述子による
ビデオ素材の有効な記述が必要であることを促すことになり、その結果、特定目
的に適切なビデオ素材が記述子の使用により役立つビデオ素材の大きな主要部か
ら検索される。MPEG−7規格に関係する動画像エキスパートグループ(MP
EG)の尽力による標準化を推し進める今日のビデオ素材記述の領域に大きな興
味がある。しかし、大きな課題がこのような尽力に直面し、この課題は二つの相
補的事実から生じる。第一に、ビデオ素材の信号分析によりビデオ素材から自動
的に抽出され、且つ、それゆえにこのようなビデオ素材に関連する記述子は、こ
れらの記述子が多くの利用者に理解されるためには、低レベルすぎて有効でなく
、且つ、通常の文脈において意味を持たないので、意味力が不足しがちである。
第二に、意味論的に強力な記述子はビデオ制作ツールにより手動で入力されたビ
デオ素材に関係するけれども、このプロセスは面倒で時間を消費するもので、従
って、このプロセスは多くの用途において投資効果がない。それゆえ、前述の傾
向の少なくとも一つを取扱うビデオ制作ツールの必要性が明らかになる。
【0006】 (概要) ビデオ素材の記述子の作成とビデオ制作プロセスを自動化する記述子の使用を
促進するビデオ制作システムを提供する。
【0007】 本発明の第一態様によれば、動画像セグメントを処理するシステムを提供する
。本システムは、記述子を作成し、動画像セグメントに対応する少なくとも一つ
の値を記述子に特有のものにする手段を含む。本システムはまた、少なくとも二
つの動画像セグメントから出力ビデオ制作物を組立てる手段を含み、この手段は
少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値によ
って少なくとも二つの動画像セグメントを選定する手段および、少なくとも二つ
の動画像セグメントに対応する少なくとも一つの記述子の値によって少なくとも
二つの動画像セグメントを配列する手段を含む。
【0008】 本発明の第二態様によれば、動画像セグメントを処理する方法を提供する。本
方法は、記述子を作成し、動画像セグメントに対応する少なくとも一つの値を記
述子に特有のものにする工程を含む。本方法はまた、少なくとも二つの動画像セ
グメントから出力ビデオ制作物を組立てる工程を含み、この組立工程は、少なく
とも二つの動画像セグメントに対応する少なくとも一つの記述子の値に従って少
なくとも二つの動画像セグメントを選定する工程と、少なくとも二つの動画像セ
グメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの動画
像セグメントを配列する工程を含む。
【0009】 本発明の第三態様によれば、動画像セグメントを処理する計算機プログラム製
品を提供する。本製品は、動画像セグメントを処理する計算機使用可能媒体内に
具現化した計算機読取り可能プログラムコード手段を有する前記媒体を含む。本
製品は、記述子を作成し、動画像セグメントに対応する少なくとも一つの値を記
述子に特有のものにする計算機読取り可能プログラムコード手段を持つ。本製品
はまた、少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる計
算機読取り可能プログラムコード手段を持ち、この手段は少なくとも二つの動画
像セグメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの
動画像セグメントを選定し、且つ、少なくとも二つの動画像セグメントに対応す
る少なくとも一つの記述子の値に従って少なくとも二つの動画像セグメントを配
列する計算機読取り可能プログラムコード手段である。
【0010】 本発明の第四態様によれば、動画像セグメントを記述するシステムを提供する
。本システムは、第一記述子を作成し、第一動画像セグメントに対応する第一の
値を第一記述子に特有のものにする手段を含む。本システムはまた、前記第一動
画像セグメントと前記少なくとも一つの他の動画像セグメントとに対応する少な
くとも一つの他の記述子の値に従って前記第一動画像セグメントを少なくとも一
つの他の動画像セグメントでグループ分けする手段を含む。更に、本発明は、前
記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一記
述子に特有のものにする手段を含む。
【0011】 本発明の第五態様によれば、動画像セグメントを記述する方法を提供する。本
方法は、第一記述子を作成し、第一動画像セグメントに対応する第一の値を第一
記述子に特有のものにする工程を含む。本方法はまた、第一動画像セグメントと
少なくとも一つの他の動画像セグメントとに対応する少なくとも一つの他の記述
子の値に従って第一動画像セグメントを少なくとも一つの他の動画像セグメント
でグループ分けする工程を含む。更に、本方法は、第一の値を少なくとも一つの
他の動画像セグメントに対応する第一記述子に特有のものにする工程を含む。
【0012】 本発明の第六態様によれば、動画像セグメントを記述する計算機プログラム製
品を提供する。本製品は、動画像セグメントを記述する計算機使用可能媒体に具
現化した計算機読取り可能プログラムコード手段を有する前記媒体を含む。この
計算機プログラム製品は、第一記述子を作成し、第一動画像セグメントに対応す
る第一の値を第一記述子に特有のものにする計算機読取り可能プログラムコード
手段を持つ。本製品はまた、第一動画像セグメントと少なくとも一つの他の動画
像セグメントとに対応する少なくとも一つの他の記述子の値に従って第一動画像
セグメントを少なくとも一つの他の動画像セグメントでグループ分けする計算機
読取り可能プログラムコード手段を持つ。
【0013】 (発明の開示) 既存ビデオ素材からビデオ制作とビデオ素材の記述子とを作成するビデオ制作
システムを開示する。このようなビデオ制作システム(今後は本システムと呼ぶ
)は、ビデオ制作に関係してそれに付随する幾つかの傾向と課題のうち少なくと
も一つを取扱う。このような傾向には、撮影ビデオ素材量の増加、ビデオ素材視
聴パラダイムの拡張、およびディジタルフォーマット内とインタネット上で利用
可能なビデオ素材量の利用度を含む。
【0014】 本システムは、スプレッドシート、グラフ化ツール、およびノンリニアビデオ
エディタの特徴を組合せるディスプレイパラダイムを伴う。本システムはまた、
ビデオ素材を領域分割し、種々の組合せと配列に再接続することができ、その間
に、ビデオ素材の動画像セグメントは自動的および/あるいは手動で定義され、
選定され、記述子の値により配列される。
【0015】 本システムは、ビデオ素材の主要部の選定サブセットを種々の配列で視聴する
ことによりビデオ素材の主要部に精通したい利用者を支援する。更に、本システ
ムは、例えば、従来のビデオ編集プロセスの前に、ビデオ素材の主要部を組合せ
てビデオ制作を形成する種々の方式を調べたい利用者を支援できる。本システム
は更に、ビデオ素材の主要部からビデオ制作を作成したい利用者を支援できる。
更に、本システムは、後でビデオ素材の検索および再目的化を可能にするビデオ
素材の主要部の記述を作成したい利用者を支援できる。また、本システムは、ビ
デオ制作と記述に関連した他の作業を実行したい利用者を支援できる。
【0016】 本システムの機能と有効性は、本システムにより利用者がビデオ制作作業にお
いて半自動方式で容易に素早く多くの可能性を試みることができる方法次第であ
る。
【0017】 本システムは、多くのビデオ制作シナリオにおいてビデオ再目的化、編集、フ
ァイル保管するツールとして使用される。このようなシナリオでは、利用者は既
存ビデオ制作からビデオ素材を再使用して新しいビデオ制作を作成する。ビデオ
素材を再使用するプロセスは“再目的化”として知られる。別のシナリオでは、
利用者はビデオ素材の主要部を利用して、例えば異なる期間、異なる対象の視聴
者等の幾つかの異なるが関連したビデオ制作を作成する。更に別のシナリオでは
、利用者は多くの可能な配列を非常に素早く調べ、ビデオ制作の一つ以上の“ラ
フなカット”を作成する。別のシナリオでは、ビデオ編集の専門家ではない利用
者がビデオ制作を作成しながら多くの可能性や代替案を試みることができる。対
照的に、編集の効果を前もって上手く可視化できるビデオ編集の専門家はあまり
に多くの代替案を試す必要はない。更に別のシナリオでは、利用者は時間が“洗
練さ”よりも重要なので、ビデオ制作を非常に速く作成する。
【0018】 本システムはまた、会話型ビデオ素材の作成にも使用される。本システムは、
ビデオ素材を急速に試験する多くの“経路”を可能にする。これは分岐ビデオ技
術を用いるビデオゲームの作成に役立つ。更に、本システムは、他のメディア、
例えば静止画像や音声を編集し、再目的化し、あるいは記録保管するために使用
される。
【0019】 本質的に、本システムは、単一枠組内にビデオ制作ツールの包括的組と新しい
ビデオ制作を作成する能力を備える。ツールの組は、既存の記述子が加速プロセ
スにおいて追加の記述子の作成を支援する幾つかの種類の記述子を定義して入力
するためのものである。新しいビデオ制作はこれらの記述子の一つ以上の値によ
りビデオ素材の動画像セグメントを選定し、配列すること(およびビデオ素材を
任意に再領域分割すること)により作成される。このビデオ素材は動画像および
音声両方のコンテンツから成る。
【0020】 本システムは更に、一方の軸がビデオ素材の領域分割に関係し、且つ、他方の
軸が記述子に関係する二次元(2D)グリッドを特徴とするグラフィックユーザ
インタフェイス(GUI)を備える。2Dグリッドは、ビデオコンテンツ(例え
ばキーフレームにより)および/あるいは音声コンテンツ(例えば波形により)
の表示と複数の記述子(例えば番号やグラフ形態で)の値を同時に示す。GUI
は、ツールの組を支援して相互作動してビデオ素材を記述し、再目的化する。
【0021】 本システムがビデオ素材の主要部(今後は“入力ビデオ素材”として一般に知
られる)を与えられると、本システムは利用者が二つのことを本質的に行う手段
を備える。第一に、利用者は入力ビデオ素材から新しいビデオ制作(“出力ビデ
オ制作”)を作成できる。これは、入力ビデオ素材を領域分割し、動画像セグメ
ントのサブセットを選定し、選択動画像セグメントを配列することにより出力ビ
デオ制作を形成することにより達成される。領域分割、選定、および配列の三つ
のプロセスは記述子の値により本システムで遂行されるか、あるいは利用者によ
り手動で遂行される。
【0022】 領域分割は外部、すなわち本システムの外部で行われる。利用者は、柔軟性よ
く入力ビデオ素材の自動(すなわち記述子の駆動)処理と手動処理を交互に行う
。利用者は、出力ビデオ制作の広い可能性を調べるために自動処理から始め、次
に、その結果を手動で微調整する。このプロセス中に何時でも、利用者は、出力
ビデオ制作の最終形態を決める前の現在の動画像セグメントの選定および配列か
ら生じるビデオ制作の全て、あるいは一部を見ることができる。
【0023】 第二に、利用者は、ビデオ素材の意味論的に強力な記述や注釈を速く作成でき
る。これらの記述はおそらく異なる利用者により、および注釈を作成した利用者
が予知あるいは予想できないやり方により、後のビデオ素材の再利用を可能にす
る。例えば、注釈を用いてビデオファイル保管からビデオ素材を検索したり、あ
るいは自動ビデオコンストラクタによりビデオ素材から新しいビデオ制作を作成
できる。結果として、出力ビデオ制作の多くの可能性を速く試すことができ、こ
の場合の目的は、種々の記述の効果、および任意の記述を適用する種々の方法を
利用者に調べさせることであり、その結果、利用者は注釈をユーザ仕様要求に最
適化させることができる。
【0024】 入力ビデオ素材は、編集済み素材(異なる目的用に最初に作成された一つ以上
の完成されたビデオ制作のような)、あるいは、初めて組立てられる未編集の生
ビデオ素材、あるいは、この二つの任意な組合せからなる。本システムは、この
ような手段をこの後に述べる機能を組合せることにより提供する。
【0025】 (入力ビデオ素材の動画像セグメントへのスライシング) 本システムは主に、任意時間範囲の入力ビデオ素材の隣接片である動画像“セ
グメント”で動作する。自動領域分割は“ショット境界検出”のような周知の技
術により、あるいは、一つ以上の記述子の値の著しい変化を検出するような他の
技術により達成される。領域分割はまた手動で遂行、つまり微調整される。また
、ある場合には、入力ビデオ素材は、さらなる領域分割を必要としない一組の個
別分割、あるいは個々の分割と分割を必要とするビデオ素材の混合とからなる。
それゆえに、領域分割は本システムの重要な態様であるが、本システムによる領
域分割は本システムの全ての変形において必ずしも実行されるものではない。
【0026】 (動画像セグメントに対する記述子の統合と作成) 記述子は一片のデータつまり、動画像セグメントのある特徴を記述するデータ
構造である。記述子は簡単な数値、ベクトル、マトリックス、多次元数値単位、
Boolean値、テキスト記号列等である。記述子は、ビデオ素材に埋め込ま
れた記述子のような初期に作成された記述子の移入;信号分析や映像/音声コン
テンツの他の処理による記述子の抽出;手動入力;および他の記述子の一つ以上
の組からの公式ないしはアルゴリズム的導出を含む方法で生じる。本システムの
重要な特徴は、既存の記述子を足場にして追加記述子を容易に規定し、作成でき
る枠組を備えることである。しかし、本システムは実際の記述子仕様書に依存し
たり、限定されるものではない。
【0027】 (自動動画像セグメント選定) 本システムにより一つ以上の記述子の値が所定基準に整合する(例えば所定の
範囲に入る)かどうかに従って動画像セグメントを選定できる(すなわち、出力
ビデオ制作の一部に含まれる)。この機能は、入力ビデオ素材の動画像セグメン
トの種々のサブセットを選ぶことにより自動的に種々の出力ビデオ制作の定義を
可能にする。
【0028】 (自動動画像セグメントの再配列) 本システムはまた、一つ以上の動画像セグメントの記述子の値により動画像セ
グメントを配列することができる(すなわち、出力ビデオ制作を構成する順番で
順序づける)。例えば、動画像セグメントは低い値から高い値の順に、あるいは
任意の値からの距離の順に配列される。この機能は種々の方法で入力ビデオ制作
の動画像セグメントを配列することにより自動的に種々の出力ビデオ制作の定義
を可能にする。
【0029】 (新しいビデオ制作の自動構築) 利用者はいつでも現配列内の現組の選定動画像セグメントに対応する出力ビデ
オ制作を視聴できる。これは、例えば、図1および図2に示すGUIにおける“
プレイ”トランスポート制御をマウスでクリックすることにより遂行される。し
たがって、種々の出力ビデオ制作を視聴したい利用者は、記述子値と“プレイ”
トランスポート制御のクリックとによりビデオ素材を簡単に再選定や再配列でき
る。このような動作は多くの場合に各出力ビデオ制作に対して二回のマウスクリ
ックを伴う。利用者が自分の仕様要求に見合う出力ビデオ制作形態を見つけたな
ら(一般的に自動領域分割、選定および配列に加えて手動による調整を伴う)、
利用者はこの形態を最終出力ビデオ制作として送出する。本システムのある変形
では、この機能は、動画像セグメント間に画像遷移(例えば溶暗)と音声遷移(
例えばクロス−フェード)を挿入することを可能にする遷移発生器により補足さ
れる。これらの遷移は、出力ビデオ制作をより見易く、心地良く聴けるようにす
るのに役立つ。
【0030】 (発明を実施するための最良の形態) 本発明の代替実施例による本システムの変形と付随動作について図1〜図10
により説明する。
【0031】 (グラフィックユーザインタフェイス(GUI)) 図1a、図1bおよび図2は、本発明の三つの各実施例による三つのシステム
変形のディスプレイの主要構成要素を示す。第一実施例による第一システム10
0のGUIは、図1aに示すようにグリッド画面102、モニタ画面104、お
よびアウトライン画面106を含む。
【0032】 グリッド画面102は第一システム100用の主要作業空間である。グリッド
画面102は入力ビデオ素材(列108当り一つ)の動画像セグメントと記述子
の組(コラム110当り一つ)を示す。更に、特別コラム112を用いて動画像
セグメントの現選定および配列を利用者に見せる画像“早見表”を表示する。こ
れは、例えば、動画像セグメントの音声部の波形表示からなる一組の“音声早見
表”を表示する第二コラム114により補足される。記述子コラム110の各セ
ル116は一つの動画像セグメントに対する一つの値を示す。
【0033】 利用者は、グリッド画面102を用いる場合に四つの主な仕事を行う。第一に
、利用者は、コラム110を付加することで記述子を定義する。この記述子は前
述した四つの種類のどれかである。それゆえ、コラム110を明示して、初期に
作成した記述子の値の移入と表示;信号解析や画像/音声コンテンツの他の処理
により抽出された記述子の値の計算と表示;マニュアル記述子の値の入力と表示
;および公式やアルゴリズムにより他の記述子から得た記述子の値の計算と表示
、のどれかを可能にできる。第一システム100では、コラム110の目的を明
示するためのユーザインタフェイス機構は、利用者がコラムヘッダ上をマウスク
リックする時に現れるダイヤログボックスである。
【0034】 第二に、マニュアル記述子の場合に、利用者は、グリッド画面102のセル内
に手動で値を入力し、記述子と関係する動画像セグメントに伝える。
【0035】 第三に、利用者は、動画像セグメントを一つ以上の記述子の値により出力ビデ
オ制作に含めたり、排除する領域分割選定則を適用する。これはコラム9(“情
報コンテンツ”記述子)に図示され、ここでは動画像セグメント118を排除す
る。理由は、このような記述子に関して動画像セグメント118の値が所定の閾
値以下になり、一方で他の全ての動画像セグメントを選定するからである。この
動作を遂行するためのユーザインタフェイス機構は例えば、特定記述子用の“選
定”列120のセル内の一回のマウスクリックであり、その後にこのような記述
子を作る際に一つないしは、幾つかの制御選定をもたらす。選定則の仕様、例え
ば、閾値と、幾つかの記述子を選定プロセスで共に用いる場合に記述子を他の記
述子と論理的に組合せるべき方法は、利用者が同一セル内で右クリックする際に
ポップアップする一つ以上のダイヤログボックスのようなユーザインタフェイス
機構を通じて制御される。
【0036】 第四に、利用者は、記述子の値により動画像セグメントを再配置する。これは
、簡単な値による選別(例えば図1aのコラム6に示すように最低値から最高値
に)や距離による選別によって行われる。第一システム100では、ユーザイン
タフェイス機構は動画像セグメント選定のために記述したものに非常に類似する
【0037】 モニタ画面104は動画像セグメントの現選定および配列から生じる出力ビデ
オ制作を見るために使用される。モニタ画面104のトランスポート制御122
は標準的な機能の組:最初からの再生;現点からの再生;休止;停止;1フレー
ムだけの前進;1フレームだけの逆転;高速前進;および高速巻戻し、を使用可
能にする。他のシステム変形では、当業者に周知の追加のトランスポートおよび
ブラウジング制御、例えば“スクラブ制御”を組込む。
【0038】 アウトライン画面106は動画像セグメント当り1キーフレームを用いて動画
像セグメントの現選定および配列から生じる出力ビデオ制作のアウトラインを提
供する。システム変形は動画像セグメントをループモードで再生する運動アイコ
ンを使用でき、このような技術は当業者には周知である(付録Dに記述)。
【0039】 ディスプレイの三つの画面の構成要素は相互に密接に動作してビデオ素材の別
の画面を作る。例えば、現選定設定によりフィルタされる動画像セグメントはグ
リッド画面102で灰色にされ、それゆえ、アウトライン画面106には現れな
い。別の事例として、出力ビデオ制作内の現位置はグリッド画面102とアウト
ライン画面106内の小さな三角形124により、且つ、モニタ画面104内の
あるフレーム126の存在により、三つの画面全てに表示される。利用者がプレ
イ制御122をクリックすると、出力ビデオ制作はモニタ画面104に示される
。同時に、小さな三角形124はグリッド画面102の右側下に、且つ、アウト
ライン画面106の上部に沿って動き、再生ビデオ素材の現位置を示す。
【0040】 記述子により動画像セグメントを選定し配列することに加えて、利用者はグリ
ッド画面102とアウトライン画面106の両方において直接に個々の動画像セ
グメントを操作できる。第一システム100により利用者は一つ以上の動画像セ
グメント上で直接に削除、挿入および再配置(例えばドラッグ・アンド・ドロッ
プにより)のような標準作業を遂行できる。再度、三つの画面102、104、
および106が密に相互動作して、ある画面内で実行した変更が他の画面に直ち
に反映される。
【0041】 本発明の第二実施例による第二システム200のGUIが図1bに示される。
このGUIは第一システム100のGUIと多くの点で異なる。このような相違
の一つは、第二システム200のGUI内でグリッド画面202とモニタ画面2
03しか用いないことである。別の相違は、記述子が列204を形成し、動画像
セグメントがコラム206を形成するグリッド画面202と図1aのグリッド画
面102との間でのX軸とY軸の交換である。X軸は、距離の単位が時間の単位
を示す時間軸である。それゆえ、図1bでは、異なる期間の動画像セグメントは
異なる幅のコラム206をもたらし、一方で図1aの動画像セグメントは期間に
関らずに等しい間隔を割当てられる。ある記述子の値はグラフで表示される。更
に、記述子のあるものは単一動画像セグメントに対して多くの連続値を持つ時系
列(すなわち、時間内の種々の点、一般的には等時間間隔での値の組)に表示さ
れる。例えば、“テンポ”記述子208と“音声振幅”記述子210は時系列で
表示され、セグメント当り多くの値を持つ。対照的に、図1aのグリッド画面1
02内の各記述子は動画像セグメント当り単一の値を持つ。
【0042】 グリッド画面202では、“動画像セグメント”コラム212により表示され
た記述子値によりビデオ素材を再領域分割する機能がある。この事例では、“Y
オメガ”が記述子制御領域分割(“動画像セグメント”コラム212内の小さな
円214がこれを示す)として設定され、特にビデオ素材はYオメガの値の変化
に関して領域分割される。この種の動的領域分割を遂行するユーザインタフェイ
ス機構は、所定の記述子制御動画像セグメントを作るための“動画像セグメント
”コラム212内の左クリックと、領域分割則(値、最小動画像セグメント長等
の変更)を規定するためにダイヤログボックスを開くための右クリックとからな
る。
【0043】 グリッド画面202では、間隔を使えるので、画像コンテンツを動画像セグメ
ント当り1以上のキーフレームにより表示する。また、音声コンテンツを一連の
音声早見表ではなく連続波形として表示する。更に、最終列216は出力ビデオ
制作内の各動画像セグメントの始動フレーム番号を示す。
【0044】 図1aのアウトライン画面106は第二システム200のGUIから省かれる
。このような構成は、動画像セグメント当り複数のキーフレームがある水平方向
の一組のキーフレームとして画像をグリッド画面202に表示する場合に重要と
されない。
【0045】 本発明の第三実施例による第三システム(どの図にも示されない)では、第二
システム200のGUIは当業者に周知の別のユーザインタフェイス構成要素に
より補足される。これらの構成要素は幾種類ものソフトウエア・アプリケーショ
ン、例えばメニュ、スクロールバー、およびWindow系表示装置に一般に使
用される他の構成要素から得られる。また、使用される構成要素には、例えば、
時間−符合表示、個々の動画像セグメントの入力/出力点を再生し修正するポッ
プアップ画面、水平および垂直ズーミング、およびノンリニアビデオエディタに
用いる他の構成要素がある。更に、列とコラムを操作して挿入、除去、複写、分
割、カットおよび張付けのような構成要素と、グリッド状やテーブル状インタフ
ェイスによる他のプログラムとスプレッドシートとに用いる他の構成要素を使用
する。
【0046】 本発明の第四実施例による第四システム(どの図にも示されない)では、利用
者は幾つかの表示事例間を素早く切換えることができる。この表示は一組のデー
タで示される。これは、例えば第四システムに関係する一つのプログラムの複数
の事例を同時に運用可能にするか、あるいは図1aに示すグリッド画面102、
モニタ画面104、アウトライン画面106をプログラムの単一事例内で利用で
きるようにするかのどちらかによって支援される。このような場合に、データは
標準的な方法でカットや張付けのような事例間を転送される。これらのデータ転
送方法は、当業者には周知の用途プログラムの標準的な特徴である。
【0047】 (本システムの使用) ここに述べた本発明の実施例によるシステムは、利用者が一般に任意の配列で
使用できる多数の機能を持つ。しかし、利用者が多くの場合に採用する工程の代
表的な順番がある。代表的な簡単なシナリオを図3のフローチャートに示す。利
用者は最初に本システム内にビデオ素材(“入力ビデオ素材”)を移入する(工
程302)。入力ビデオ素材が既に領域分割されていない場合(工程304の検
査のように)、利用者は本システムに入力ビデオ素材を、例えば画像ショット、
あるいは音声情報の形態に対応する動画像セグメントに領域分割させる(工程3
06)。利用者は、本システムにより与えられた(そうでなければ、本システム
から利用可能な)信号解析機能により本システムに記述子を自動的に抽出させる
(工程308)。次に、利用者は、本システムにこれらの記述子の一つ以上の値
を使用させて入力ビデオ素材の多数の動画像セグメントを選定させ、残りをフィ
ルタさせる(工程310)。例えば、利用者は、0.6未満の音声尤度量を持つ
入力ビデオ素材の全ての動画像セグメントをフィルタしたり、あるいは選定動画
像セグメントから20%以上異なる総合輝度を持つ全ての動画像セグメントをフ
ィルタする。
【0048】 その後に、利用者は本システムに一つ以上の記述子の値を使用させて動画像セ
グメントを配列させる(工程312)。例えば、利用者は動画像セグメントの音
声コンテンツのピーク振幅を用いて動画像セグメントを「最も喧しい」から「最
も静か」に順序づける。次に、利用者は、本システムに先の工程から生じる順序
に選定動画像セグメントを再生させて(工程314)、入力ビデオ素材から作成
した新しい出力ビデオ制作を再生する。利用者は、この新しい出力ビオデ制作が
利用者の仕様要求に見合うかを調べ、その結果を視聴する。
【0049】 利用者が検査(工程316)としての結果を好めば、利用者は本システムに、
この結果を新しい画像ファイルとして移入させ(工程318)、利用者の作業は
終了する。しかし、多くの場合、一般に結果が利用者の仕様要求に素早く見合う
ことはない。それゆえ、利用者は追加記述子を組込んだり作成する(工程320
)、あるいはビデオ素材の全てや一部を再領域分割する(工程322)、新しい
記述子値に基づく動画像セグメントを選定/配列する、結果を見る、より多くの
記述子を組込み形成するように循環して戻る等の反復プロセスに入る。追加記述
子は先に述べた任意の種類である。
【0050】 図3に関係して述べた多くの工程は、本システムにより自動的に実行され、工
程当り数個の簡単な利用者の作業(例えば、マウスクリック)を単に必要とする
【0051】 このプロセスの任意の点では、利用者は例えば、グリッド画面102、202
、アウトライン画面106の個々の動画像セグメントの“ドラッギングやドロッ
ピング”により動画像セグメントを手動で選定し配列する。ビデオ素材を手動で
再領域分割する、すなわち、動画像セグメントの“イン”と“アウト”点を直接
に調整することも可能である。一般に、記述子値による選定および配列のプロセ
スが出力ビデオ制作の“ラフカット”を作成した後に、その結果をマニュアル作
業により微調整する。
【0052】 このプロセスの任意の点で、利用者は、自らが変えたくない出力ビデオ制作の
部分を凍結し、他の部分を働かせる。例えば、ある動画像セグメント境界を凍結
し、再領域分割を適用する。選定と配列の両方にも凍結を適用する。ある動画像
セグメントあるいは、全動画像セグメントの領域分割選定状況を凍結するので、
任意数の動画像セグメントを任意長さにサブ配列できる。
【0053】 この凍結工程は図3に示されないが、グリッド画面102や202内の動画像
セグメントに陰影をつけるように特定の色を用いるような機構により利用者に凍
結状態を表示する。例えば、図1aの列108や図1bのコラム206は適切な
色で陰影をつけられる。
【0054】 (記述子) 記述子の導入、明示、利用を伴うプロセスは本システムにとって重要である。
前述した記述子の種類はその根源により四つの種類に分類される。
【0055】 (移入記述子) 本システムは、ビデオ素材に埋め込んだり連結方式で初期に作成した記述子を
移入する。これらの記述子は動画像セグメントに連結されるテキストスクリプト
の動画像セグメントを含み、キーワード記述子として機能する。このような記述
子はまた、カメラ機器により作成した記述子、例えばタイム−オブ−シューティ
ング、焦点距離、カメラに取付けた衛星測位システム(例えばGPS)により作
成した地理的位置等を含む。更に、これらの記述子は本システムにより初期のセ
ッションからセーブされた記述子を含む。ある場合には、これらの記述子は移入
プロセスの一部として判読や変換を必要とする。例えば、重要なキーワードを記
述子に変換し、前置詞や接続詞のような接続語を捨てるためにスクリプトをフィ
ルタすることが望まれる。本システムは一組のこのような移入処理モジュールを
付属する。
【0056】 (抽出記述子) 入力ビデオ素材の画像コンテンツや音声コンテンツに信号解析技術や他の種類
の処理を適用することにより、入力ビデオ素材から記述子を抽出する。代表的な
事例はカラーヒストグラム、オーディオスペクトルグラム、聴覚強度量、物体境
界、動きベクトル、カテゴリ尤度量(例えば動画像セグメントXの音声コンテツ
が演説である確率)等である。このような多くの記述子は当業者には周知であり
、新しい記述子は常に定義される。
【0057】 このような自動抽出記述子は一般に“低レベル”であり、つまり、これらの記
述子は統計と信号の他の一般的特性を表すが、利用者が最も興味を持ちそうな“
高レベル”意味情報の種類でない(付録Bに記述)。このような記述子を更に分
析して高レベルの意味情報を抽出する場合でさえも、結果は一般的に信頼性がな
い。例えば、利用者は入力ビデオ素材からビル・クリントンの全ショットや群集
の波の全ショットを識別したいが、自動的“ビル・クリントン検出器”は現に最
新技術を超えたものである。“人々の波検出器”は一般的に全く信頼性がなく、
つまり、このような検出器は高い割合で人々の波のショットを見失ったり、ある
いは高い割合で偽陽画(例えば、恐らく風の中で波打つ木)を与えたりする。
【0058】 本システムは十分に信号分析記述子を利用するように工夫されているが、任意
の特定信号処理アルゴリズムに限定されるものでなく、あるいはこれに左右され
るものでもない。第一に、本システムにより利用者は記述子値により入力ビデオ
素材のフィルタおよび/あるいは再配列の結果を“一瞥”できる。第二に、本シ
ステムは意味情報のより信頼性のある抽出を得るためにこの種の複数の記述子を
組合せる。それゆえ、本システムは、ソフトウエアモジュール(すなわち、一組
の命令)、ハードウエアモジュール、あるいはファームウエアモジュールとして
実行される任意の信号分析記述子を取込むことのできる枠組みである。信号分析
記述子を適用するプロセスでは、本システムは入力ビデオ素材の各動画像セグメ
ントに対するデータ要素あるいは、一組の要素を作る。ここでは、データ要素は
単一数、ベクトル、アレイ、Boolean値、文字列、構造、あるいは他の任
意データタイプの要素である。
【0059】 これらの記述子をシステムアーキテクチャ用のプラグインとして書込むことに
より、信号分析記述子を作成でき、常に追加のプラグイン記述子を本システムに
付加できる。利用者は、例えば図1bのグリッド画面202の列のヘッダ上をク
リックし、且つ、全利用可能記述子のドロップダウン表から記述子を選定するこ
とにより常にこれらの記述子のどれかを利用できる。
【0060】 信号分析による記述子抽出に加えて、所定の単純であるが強力な記述子を入力
ビデオ素材と入力ビデオ素材の編成とから直接に抽出できる。このような一つの
事例は、動画像セグメントの時間幅を記述子として使用する場合であり、別の事
例は、入力ビデオ素材内の動画像セグメントの配列を順序記述子(すなわち、第
一、第二、第三・・・第n)に変換する場合である。
【0061】 別の事例は、動画像セグメントを選択するかあるいは選択しないかのどちらか
を示すBoolean値である選定状態を各動画像セグメントが持つ場合である
。常に全動画像セグメントに対する選定状態の組を記述子に変換できる。このよ
うな選定状態の任意数の記述子を作成し、それにより利用者は後で初期の組の選
定に戻ることができる。
【0062】 更に別の事例は、現動画像セグメント配列を順序記述子に常に変換し、このよ
うな任意数の配列記述子を作成する場合である。全動画像セグメントに対する一
組の選定記述子と全動画像セグメントに対する一組の配列記述子の組合せは、ビ
デオ素材を再領域分割した場合を除くあらゆる場合に出力ビデオ制作を完全に作
成する。それゆえ、このような一対の記述子が作成されると、利用者は対の記述
子により形成された出力ビデオ制作のバージョンに後で素早く戻れる。これによ
り利用者は、初期バージョン(これらのバージョンが手動による処理を含む場合
に特に重要である)を捨てることなく互いに大きく異なる多くの可能性を利用し
、且つ、種々のバージョンを両者間で遅れを最小にして再生することにより種々
のバージョンを互いに比較できる。
【0063】 更に別の事例は、配列記述子の作成が付随する手動配列プロセスを用いて意味
記述子を作成することである。例えば、利用者は動画像セグメントがどれくらい
“幸せ”か、すなわち“最も幸せ”から“最も悲しい”まで、による配列で動画
像セグメントをドラッグ・アンド・ドロップできる。次に、利用者が配列記述子
を作成すると、記述子は事実上、“幸福”記述子になる(あるものは多くの場合
に全自動プロセスにより抽出できない)。このような記述子は実際に、あらゆる
意味で真の“幸福”記述子でない“幸福順序”を表す一組の値を与えるが、多く
の目的では、このような記述子は全く適切である。
【0064】 (マニュアル記述子) これらは、利用者が自動手段により作成できない、あるいは作成したくない記
述子であり、それゆえに、本システム内に手動で入力する必要のある記述子であ
る。この種の記述子は多くの意味記述子(例えば、図1aの“ジョージ”の存在
を示す記述子)とテキスチャ記述子(例えば、図1aの場所を示す記述子)を含
む。本システムはマニュアル記述子の数と種類を付加できることにより、例えば
、図1bのグリッド画面202内に新しい列を挿入することにより、この種の記
述子に対する入力を支援する。
【0065】 本システムはとりわけ記述子値の関連動画像セグメントへの高速伝搬を支援す
る。高速伝搬は、一つ以上のマニュアル記述子が単一動画像セグメントに対して
割当てられた後に、これらの値を図4aおよび図4bのフローチャートに示すよ
うに関係組の動画像セグメントに素早く複製するプロセスに属する。このプロセ
スは、多数の動画像セグメント(表示により、代表的ムービは1000以上のシ
ョットがある)がある場合に重要であり、もしそうならば多数のマニュアル記述
子を伴う。
【0066】 本システムが高速伝搬を支援するのに使う主要機構は再配列である。この機構
を用いて互いに近接する関係動画像セグメントをディスプレイ内(例えば、関係
するコラムを共に群らせるように、図1bのグリッド画面202内)に取入れ、
マニュアル記述子の値をこれらの関係動画像セグメントに容易に複製できる。
【0067】 一般的な場合に、自動記述子を用いて動画像セグメントを分類するので、その
結果、新しいマニュアル記述子はディスプレイ内の近くにある動画像セグメント
に容易に複製される。この機構の変形では、本システムを操作して、一つ以上の
マニュアル記述子を全動画像セグメントに伝搬するもので、全動画像セグメント
に対してある自動記述子の値は所定の範囲内にある。
【0068】 図4aでは、高速伝搬プロセスに関る工程を説明する。マニュアル記述子が存
在しない(例えば、図1bの列として表れない)場合(工程402の検査)、利
用者は記述子を例示する(工程404)。それから、利用者は1領域分割(ソー
スセグメント)に対するマニュアル記述子に値を割当てる(工程406)。次に
、利用者は一つ以上の他の記述子を選んで再配列を制御する(工程408)。利
用者は主に、利用者が伝搬したいマニュアル記述子と何らかの相関性を持つと思
われる記述子を選ぶ。次に、利用者は他の記述子の値に従って本システムに動画
像セグメント全て、あるいは動画像セグメントのあるサブセットを再配列するよ
うに命令する(工程410)。その目的は類似の動画像セグメントをソースセグ
メント近くに運び、ソースセグメントからのそれらの差(一つ以上の記述子に関
して)により動画像セグメントを順序づけることである。
【0069】 その後に利用者はソースセグメント近くにある一つ以上の動画像セグメントを
選定し、これら近くの動画像セグメントにソースセグメントのマニュアル記述子
の値を複製するように本システムに命令する(工程412)。
【0070】 ソースセグメントの値を割当てられる必要がある残りの動画像セグメントがあ
るが、工程408の再配列作業がこれらの動画像セグメントをソースセグメント
に類似のものと評価しないので近くに存在しない残りの動画像セグメントがある
場合(工程414)、利用者は工程408に戻って制御再配列に対して種々の記
述子を選ぶ。
【0071】 異なるマニュアル記述子の値を割当てられる必要のある動画像セグメントがあ
る場合(工程416で検査)、利用者は工程406に戻る。
【0072】 図4bでは、工程412内の作業をソースセグメントのマニュアル記述子の値
の隣接動画像セグメントへの伝搬に関係して詳しく述べる。マニュアル記述子の
値を検索する(工程420)。次に、マニュアル記述子の値が伝搬される隣接あ
るいは近隣の目標動画像セグメントのリストを得る(工程422)。このリスト
上の第一目標動画像セグメントを選定する(工程424)。ソースセグメントに
対するマニュアル記述子の値をこの目標動画像セグメントに複製する(工程42
6)。このリストの終端に達するかどうかに関して検査を行う(工程428)。
終端に達しない場合、このリスト上の次の目標動画像セグメントを選定し(工程
430)、本システムは工程426に戻る。
【0073】 このような高速伝搬プロセスは、自動記述子が利用者がマニュアル記述子で表
示したい特徴に漠然とのみ相関性のある場合でさえも有効である。類似の動画像
セグメントを集約する傾向のある任意の規則配列は、マニュアル記述子を入れる
場合に、この傾向が全く弱くても有用である。例として、利用者はある動画像セ
グメントを四つの記述子である“都市道路”、“冬”、“晴天”、および“人波
”で表示し、次にこの記述子や、その一部を他の動画像セグメントへの伝搬を望
む。これを達成するために、利用者は自動抽出カラー記述子(例えば、この場合
にカラーコントラスト;晴天、雪の道路画像は非常に高コントラストである故に
)と自動抽出動き記述子(例えば、振れる腕を示すこともある相関性のない運動
の多くの小領域)により動画像セグメントを配列する。利用者の希望は、ラベル
である“都市道路”、“冬”、“晴天”、および“人波”の一部や全てを適用す
る動画像セグメントを相応に高い割合に合成クラスタ化により分類することであ
る。今日の自動抽出記述子の厳しい制限にもかかわらず、多くの場合に、このプ
ロセスはマニュアル記述子入力作業を実質的に容易にするように十分に上手く働
き、必要ならば、利用者が個々の動画像セグメントの記述子を編集することによ
り改良できる第一近似を備える。
【0074】 この種の機構は、動画像セグメントを複数動画像セグメントと任意例動画像セ
グメントとの間の差により順序配列する場合に特に有効である。この差は例えば
、n次元記述子空間内の任意の動画像セグメントからのユークリッド距離により
明示される。
【0075】 (誘導記述子) 本システムはまた、とりわけ、既存記述子の組合せとしてこれらの記述子を定
義することにより新しい記述子の作成に役立つ。この組合せ方法は、変数として
一つ以上の他の記述子を含む公式として新しい記述子を定義する公式に従う。ま
た、この組合せ方法は、一つ以上の他の記述子から新しい記述子がどのように生
成されるかを述べる一組の指令として新しい記述子を定義するアルゴリズムに従
う。
【0076】 例えば、前述の“人波のある晴れた冬の道路”情景では、新しい記述子Xをカ
ラーコントラスト記述子と特定動き記述子の加重和として定義する。一般的に利
用者は図1bに示すグリッド画面202の列のヘッダをクリックし、且つ、ダイ
ヤログボックス内に所要公式を入力することによりXを作成する。利用者が記述
子を定義し、関連ダイヤログボックスを閉じると、本システムはビデオの全動画
像セグメントに対してこの新しい記述子の値を計算し、列のセル内を更新値で満
たす。次に、利用者は本システムにこの新しい記述子の値をフィルタし、分類さ
せる。
【0077】 公式を入力する代りに、利用者は前述のリストから信号分析記述子を選定した
のと同じ方式で定義済み組の公式とアルゴリズムから一つの公式を選定する。本
システムは記述子導出のために一組の最も標準的で有用な公式およびアルゴリズ
ムを提供する。
【0078】 一般に、この時に利用者は新しい記述子を不十分であると見出す。例えば、記
述子Xは雪を背景にしてアシが揺れる情景に対して所望の群集情景と同じ値の範
囲を与える。しかし、次に利用者は、群集情景(恐らく喧しい)と揺れるアシ(
恐らく静粛)の音声レベルには相当な差があることを知り、記述子Xを音声音量
記述子Lと組合せた別の記述子Yを作成することにより、この事実を活用する。
この組合せは公式(例えば、Y=L*X)に従うが、代りにYはアルゴリズムプ
ロセスから得た記号列である。例えば、((L>−15)と(X>1000))
であれば、 Y=“冬の道路における人波の動き”であり、 その他にはY=“ ”である。
【0079】 したがって、複合階層構造内に潜在的に他の記述子の組合せから記述子を構築
することにより、利用者は入力ビデオ素材の意味要素に全く良い相関のある記述
子に到達できる。階層構造では、記述子を誘導型である他の記述子から引出す。
次に、これらの記述子を用いて画像の動画像セグメントを選定し配列し、あるい
は先の使用のためにビデオコンテンツを表示する新記述子を作る。例えば、記述
子“冬の道路における人波の動き”は画像ファイル保管用途に有用である。全て
の自動誘導記述子のように、これらの誘導記述子は完全で全体的に正確な意味を
記述することはめったにない。しかし、これらの誘導記述子は利用者がビデオ素
材や、利用者が改善する最終結果に対して素早く作成した近似の種々の構成配置
を調べるには少なくとも有効な方法になる。
【0080】 (領域分割) 領域分割は幾つかの課題を伴う本システムにとって重要な態様である。本シス
テムでは、動画像セグメントは一時的に一片の入力ビデオ素材において任意時間
Xから後の任意時間Yにまで及ぶ。動画像セグメントは単一フレームから一片の
入力ビデオ素材の全長にまで任意長さで存在する。概して、動画像セグメントは
、ショット、情景等の視覚情報、あるいは画面外ナレーションの文章やパラグラ
フのような聴覚情報に基づく動画像セグメントから得た意味単位である。動画像
セグメントは任意の方法で互いに重複するので、このような重複を避けることが
望ましいけれども、入力ビデオ素材の部分は一つ以上の動画像セグメントに属す
ることになる。
【0081】 領域分割は本システムの外部、あるいは本システムの内部で、あるいは両方で
行われる。外部から遂行されるビデオ素材の領域分割は本システムを使う前に行
われ、ビデオ素材を処理する。言換えれば、入力ビデオ素材は予め領域分割され
、その後で本システムに移入される。対照的に、内部から遂行される領域分割は
動的に行われる。すなわち、所望すれば、入力ビデオ素材は本システムの動作中
に何時でも再領域分割される。
【0082】 (自動領域分割) ビデオ素材を領域分割するための自動化技術が多々あり、そのどれかは外部的
、あるいは内部的に適用される。当業者に周知の共通技術はショット境界検出で
ある(付録Aに記述)。領域分割は音声情報を用いて、例えば、平均音声振幅が
閾値以下になるたびに新しい動画像セグメントを作成することにより、あるいは
演説対音楽を識別することにより(付録Bに記述)、あるいはスピーカの変化可
能性を認識することにより(付録Cに記述)行われる。
【0083】 本システムでは、内部的に遂行される任意の自動領域分割を一つ以上の時系列
記述子上の動作として取扱う。このような場合に、領域分割動作を形成するのに
含まれるプロセスを図5にフローチャートとして示す。
【0084】 記述子を先ず取込み、且つ/あるいは作成する(工程502)。ここでは前述
の方法のどれかにより記述子を移入し、抽出し、手動入力し、あるいは生成する
。その後で、動画像セグメント用の基準として使用すべき一つ以上の有効記述子
を選ぶ(工程504)。この工程は図1bを引用して述べたGUIを通じて利用
者により制御可能である。
【0085】 次に、利用者は領域分割則を定義したり、あるいは本システムにより与えられ
た一組の領域分割則から選ぶ(工程506)。これらは、選択記述子から点の内
外、すなわち、動画像セグメントの始点と終点の時間基準で動画像セグメントの
導出を支配する公式すなわち手続き則である。単一記述子用の一つの共通種類の
規則は記述子のどちらか、あるいは記述子の時間微分の一つの閾値交差である。
多くの場合に、この規則の適用は、明かな事象として計数するために閾値を交差
しなければならない量と期間を支配する規則で補足される必要がある。動画像セ
グメントが複数の記述子に基づく場合では、この規則は記述子の相互作用を含む
もので、例えば、全体の領域分割則は個々の記述子に対する規則に重ね合せたB
oolean AND、ORおよびNOT演算子の関数である。次に、選定ある
いは明示された領域分割則はビデオ素材を領域分割するために適用される(工程
508)。
【0086】 自動領域分割の事例として、音声振幅記述子を作成する。この音声振幅がある
最小時間に対して所定の閾値以下に落ち、その後で閾値を超えてクロスバックす
るたびに新しい動画像セグメントを作成するように領域分割則が定義される。別
の事例では、一組のカラーヒストグラム、動きベクトル、および他の視覚記述子
を明示し、ある公式においてこれらの記述子を組合せて新しい記述子Xを作り、
次にXの第二微分が閾値を超えるたびに新しい動画像セグメントを作成するとい
う規則によりビデオ素材を領域分割する。
【0087】 本システムでは、自動領域分割はスカラー記述子のみでなく、ベクトル、マト
リックスおよび記号列のような複雑な記述子をも用いて実行される。
【0088】 (再領域分割) 多くの場合に、領域分割は入力ビデオ素材を処理する初期段階で行われる。利
用者が選定や配列、マニュアル記述子の作成、時系列記述子の動画像セグメント
当りの単一値(この後に詳述する)への減少のような他の種類の処理に進むと、
利用者は通常は領域分割において小さな変化のみを作る。この理由は、主要な再
領域分割、とりわけ自動領域分割が作成された選定/配列/記述子構造を変造し
がちだからである。それにもかかわらず、時にはプロセス内の後で主要な再領域
分割を行うことが必要になり、したがって、本システムは再領域分割の支援を行
う。再領域分割を支援する際に、二つのグループの内包する課題を検討する。
【0089】 懸念の第一グループの課題は、再領域分割動作がビデオ素材の構成を、ビデオ
素材を初期の選定および配置処置により再構成するシナリオに適用すべきである
。 一般に、領域分割および再領域分割は、利用者が出力ビデオ制作に対してでなく
、入力ビデオ素材(すなわち、元の配列や流れにおける動画像セグメント)に適
用したいプロセスである。
【0090】 事例は利用者が一時的に作業をし、出力ビデオ制作を含む動画像セグメントの
選定/配列を作成するシナリオである。その後で、例えば利用者がショットをベ
ースにするよりもむしろ音声特性に基づくビデオ素材の領域分割を試みたいため
に、利用者はビデオ素材を再領域分割することを決める。実際、この場合に利用
者が望むことは入力ビデオ素材を元の配列に再領域分割することであり、しかし
、現出力ビデオ制作を含む選定/配列を損なうものではない。
【0091】 図6では、この種の再領域分割プロセスを説明する。場合によっては、本シス
テムは再領域分割後に現選定/配列を再適用することができず、あるいは、利用
者の期待する方法でそのようなことができない。それゆえ、利用者に警告をし(
工程602)、利用者に作業を取消させることが望ましい。利用者が先に進むこ
とに決めた場合、本システムは先ず全動画像セグメントの選定状態(SELCUR
)を維持する(工程604)。次に、本システムは現出力ビデオ制作を含む動画
像セグメント(SEQCUR)の組の配列を維持する(工程606)。
【0092】 本システムは、全動画像セグメントを選定し、いかなる再配列をもしないで、
元の選定/配列状態、すなわち入力ビデオ素材の状態に復帰し(工程608)、
次に再領域分割を実行する(工程610)。その後に、本システムはSELCUR
を用いて先の選定状態を新しい組の動画像セグメントに適用し(工程612)、
その後で、SEQCURを用いて再領域分割の前に同じ方法で新しい組の動画像セ
グメントを配列する(工程614)。
【0093】 本システムは工程612と工程614の動作を常にできるものではなく、また
、その結果は必ずしも利用者が期待するものでない。一般に、この技術は、再領
域分割が動画像セグメントの予め既存する組の始点と終点で比較的小さな調整を
伴う場合に成功するが、再領域分割が動画像セグメント位置や動画像セグメント
の総数に大きな変化を引起す場合には部分的にしか有効でない。
【0094】 本発明の第五実施例による第五システム(どの図にも示されない)では、二つ
のグリッド画面がある(例えば、図1および図2それぞれにグリッド画面102
、202)。第一グリッド画面は入力ビデオ素材を元の状態で示し、第二グリッ
ド画面は現出力ビデオ制作を含む動画像セグメントを示す。それゆえに第一グリ
ッド画面を用いてビデオ素材を再領域分割し、第二グリッド画面では選定/配列
状態を操作し、追加記述子を作成/調整する。これらの画面を“同期”させ、第
一グリッド画面の動画像セグメントの変化を第二グリッド画面内に自動的に反映
させる。
【0095】 概して、各グリッド画面は図1bに示すグリッド画面202を少し簡素化した
バージョンである。第一グリッド画面は選定および配列コラムを持たないし、第
二グリッド画面は動画像セグメントコラムを持たない。また、一般的に両方の画
面に記述子の完全な組を示すことは望ましくなく、例えばマニュアル記述子を第
一グリッド画面から省く。利用者はこのような選択肢を好みにより制御する。
【0096】 図2a、図2b、図2cおよび図2dに示すように本発明の第六実施例による
第六システムでは、三つの全ての動作、すなわち、領域分割、選定、および配列
は個々のグリッド画面で行われる。領域分割画面252は動画像セグメント境界
254(点線)を重畳した元の状態で入力ビデオ素材を示し、これらの動画像セ
グメント境界254を明示し調整するのに使用される。選定画面260はこれら
の動画像セグメントの各々の選定状態を示し、利用者にこれらの選定状態を変え
させる。配列画面270は出力ビデオ制作を含む新しい順序で選定動画像セグメ
ントを示し、利用者に配列を変えさせる。三つの画面の各々は特異な記述子の組
を持つことができる。これらの画面を同期させて、領域分割画面252で行う動
画像セグメントの変化を選定画面260と配列画面270内に反映させ、選定画
面260内で行う選定状態の変化を配列画面270内に反映させる。モニタ画面
280は領域分割画面、選定画面や配列画面から画像を再生できる。
【0097】 領域分割画面、選定画面、および配列画面では、トップバー290があり、各
画面の識別を行う。各画面内のスター292を用いて各画面内で行う作業の種類
が基準とする記述子を識別する。各画面内の実線294は各画面内の現在の位置
を示す。画面が利用者に活用されない場合、これはモニタ画面280に示すフレ
ームに対応する。
【0098】 三つの各画面に、“入力セグメント番号”296とスケールコラム298とし
て知られる特別記述子を示す。セグメント番号記述子296は動画像セグメント
の順序数であり、本システムにより計算され自動的に表示される。スケールコラ
ム298は各画面内の最終コラムとして常に現れ、その各画面の各記述子に最大
値と最小値を与える。
【0099】 図2bに示すように、非選定動画像セグメントは選定画面260内で陰影をつ
けられ、これらの非選定動画像セグメントは図2cの配列画面270内に現れな
い。また、図2cの配列画面270では、記述子“D_ファジィG3”299は
その記述子に対する各セルの左下に表示される数字を含む。これらの値は対応動
画像セグメントに対する記述子D_ファジィG3の値を示す。
【0100】 懸念の課題の第二グループは、記述子、特に動画像セグメント当り単一値の記
述子を作成した後にビデオ素材を再領域分割する場合に記述子を取扱う方法であ
る。この課題を説明するために、予め10個の動画像セグメントが存在するとこ
ろで再領域分割により一つの動画像セグメントをもたらす場合を検討する。10
個の動画像セグメントに対する個々の記述子の値、あるいはそれらの時間的範囲
は再領域分割中に失われる。新しい動画像セグメントが古い動画像セグメントを
クロスカットする場合、すなわち、動画像セグメント境界が再領域分割プロセス
において移動される場合にそれほど重大でないが潜在的に不要な事例が発生する
。このような場合に既存組の記述子値が持続されると、記述子値が新しく形成さ
れた動画像セグメントに正しく適用しないという危険性がある。
【0101】 個々に、あるいは共に適用されるこの課題を管理し、利用者が選ぶ点で再領域
分割に適用する方法が幾つかある。例えば、抽出記述子と誘導記述子は、これら
の記述子が生成する定義、すなわち記述子を計算するのに必要な公式、アルゴリ
ズムや手順を含むので、再計算される。抽出記述子の場合に、新しい値は信号分
析により入力ビデオ素材から再計算され、誘導記述子の場合には、新しい値は他
の記述子から再計算される。
【0102】 再計算ができない記述子では、既存の動画像セグメントの値を複製したり、組
合せたりして“最良試み”理念により新しい組の動画像セグメントの値を作る。
例えば、10個の動画像セグメントが一つになる場合に、単一の新しい値は10
個の既存の組から自動的に誘導されなければならない。数値記述子では、これは
10個の平均値や、最大値あるいは最小値である。テキスト記号配列のような非
数値記述子では、これは10個の値の最初のもの、あるいは10個の最も共通の
ものである。この手法には多くの可能な変形があり、利用者が選定する選択肢と
して与えられる。
【0103】 別の事例では、任意のポテンシャルロスやデータのミスアプリケーションがあ
る場合に利用者に警告することが一般に望ましい。これにより利用者は先に進む
かどうかを決めることができ、利用者が先に進むことを決めると、後の検索を可
能にするために現状況をセーブするように利用者に促す。
【0104】 更に別の事例とより精巧な解決策では、本システムは複数の領域分割例を支援
し、すなわち、本システムは一組以上の動画像セグメント点を記述するデータと
これらの複数の動画像セグメントの各々に対する記述子の値を保持する。
【0105】 本発明の第七実施例による第七システム(どの図にも示されない)では、種々
の記述子に対する種々の組の動画像セグメント点を維持する。これは一般的に、
幾つかのマニュアル記述子がある場合に最も有効である。ある事例として、男性
が女性に続いて部屋に入り、男性が離れる前にしばらく二人が話すという配列の
画像ショットを検討する。この画像ショットが三つの記述子、“男性がいる”、
“女性がいる”、および“会話をする”により記述される場合、もし記述子が正
確に適用されるなら、これらの三つの記述子の時間的スパンが重なり合う。この
ようなシステムはこの事例のこれらの三つの記述子の各々に対する動画像セグメ
ント情報を維持する。この機能は動画像セグメント選定/配列と共同で実施され
る。例えば、“男性がいる”記述子が動画像セグメント選定に対して選ばれると
、入力ビデオ素材は自動的に領域分割されるので、“男性がいる”動画像セグメ
ントのインポイントは男性が入る正確な時間に設定されるし、アウトポイントは
男性が去る正確な時間に設定される。次に、“女性がいる”を動画像セグメント
選定において記述子として選ぶなら、この記述子に符合してこの画像ショットは
再領域分割される。
【0106】 (マニュアル領域分割) 上記事例において、“男性がいる”動画像セグメントに対するインおよびアウ
ト点をどのように作成するかという課題が持ちあがる。このような場合の解決策
はマニュアル領域分割、すなわち手動調整による領域分割にある。本システムは
、利用者が動画像セグメントを作成し、ビデオ素材を視聴する一方で、動画像セ
グメント・イン点および動画像セグメント・アウト点をフレーム精度すなわち良
い精度、例えば音声サンプル精度にまで調整するプロセスを行う。このプロセス
は周知のユーザインタフェイス技術により行われる。例えば、多数のノンリニア
ビデオエディタは利用者が“クリップ”を作成し、動画像セグメント・イン点お
よびアウト点を調整するような方法である。このプロセスは動画像セグメント間
にラインを移動することにより図1bのグリッド画面202内で直接に行われる
。例えば、利用者は先ず当該領域にズームし、次にマウスを動画像セグメントを
分離する垂直ライン218の一つに引張る。種々の記述子に対する種々の組の領
域分割点を支援する任意システムでは、このプロセスは個々の記述子に対して実
行される。言換えれば、図1bのグリッド画面202内の垂直ライン全体を移動
する代りに、利用者は本システムのグリッド画面内の特定記述子に対応する垂直
ラインの一部を移動するのみである。このような方法で動画像セグメント境界を
動かすことは一般的に入力ビデオ素材を再配列する前にのみ意味があり、その場
合に、グリッド画面内のラインの両側にある動画像セグメントは入力ビデオ素材
内の単一ショットの隣接部分である。
【0107】 (時系列から動画像セグメント当りの単一値への記述子の削減) 本システムにより利用者は削減プロセスにより、時系列記述子、例えば図1b
の“音声振幅”記述子210をセグメント当り一つの値を持つ記述子、例えば図
1bの“ショット長”記述子220に変換できる。このプロセスは削減の効用に
より支援され、利用者は削減用記述子を選択し、削減規則を選定できる。事例と
して、セグメント当りの単一値はそのセグメントに対する全時系列値の平均、時
系列値の最大値や最小値、あるいはこのような機能の他のものである。このプロ
セスを可能にするユーザインタフェイス機構は、例えば、利用者に列の最左にマ
ウスクリックすることにより図1bの列を選定させる。その後で、利用者は“セ
グメント当りの単一値に削減”の標題のメニュを選定し、ダイヤログボックスに
提示された幾つかの削減規則の一つを選定する。
【0108】 (動画像セグメント階層構造) 動画像セグメントも階層構造内に存在する。例えば、ビデオ制作全体は動画像
セグメントであると同時に、ビデオ制作全体を構成する情景は別の動画像セグメ
ントとして存在し、この情景を構成するショット全体はまだより多数の動画像セ
グメントとして存在する。これらの動画像セグメントは全てディスプレイに同時
に表示され、この選択肢は本システム内で利用者に利用されるが、このことは次
の理由で好ましくはない。それは、階層構造の存在はビデオ素材を出力ビデオ制
作に複製させることになるからである。
【0109】 利用者に動画像セグメントの階層構造を形成させる二つの作業方法があり、こ
れらを図7、図8aおよび図8bを参照して説明する。第一作業方法は図7のフ
ローチャートに示す上下分解プロセスと一致する。利用者は入力ビデオ素材を少
数の長い動画像セグメントに領域分割することにより始める(工程702)。利
用者は記述子をこれらの長い動画像セグメントに適用し(工程704)、工程7
06の検査で必要な場合に、長い動画像セグメントを短い動画像セグメントに細
分割する(工程708)。利用者が動画像セグメントを細分割する場合に、複製
のようなコンフリクトを避けるように“親”動画像セグメントを除去するか隠す
(工程710)。しかし、本システムが工程710の作業を行う前に、本システ
ムは細分割作業中に親動画像セグメントの記述子値を“子供”動画像セグメント
全てに伝搬させることにより細分割を支援する(工程712)。本システムは更
に、抽出記述子と誘導記述子のどれか、あるいは全てを子供セグメントに対して
それぞれ再計算する作業を行う(工程714と工程716)。子供セグメントへ
の細分割は自動あるいはマニュアル領域分割プロセスである。
【0110】 第二作業方法は図8aおよび図8bのフローチャートに示す逆さ分解プロセス
と一致する。このプロセスは、一般に多くの短いセグメントであり、且つ、記述
子を例示し、且つ、ビデオ制作を形成するように選定と配列が施される多数の動
画像セグメントを含むシナリオにより図8aを参照して説明する。この分解プロ
セスの目的は親セグメントを形成するために動画像セグメントのグループを共に
併合し、それにより出力ビデオ制作の描写を簡素化することである。
【0111】 逆さ分解の場合に、利用者は初めにビデオ素材を子供セグメントとして知られ
た一組の動画像セグメントに領域分割する(工程802)。利用者は前述の選定
および配列プロセスにより出力ビデオ制作を作成する(工程804)。その後に
、利用者は被併合の一組の子供セグメントを選ぶ(工程806)。ここで選ばれ
たセグメントは現出力ビデオ制作内に隣接する。続いて、利用者は本システムに
命令して動画像セグメントを併合させ、親セグメントを形成する(工程808)
【0112】 親セグメントが形成されると、利用者は任意に本システムに指令して親セグメ
ントを形成するように併合された前記一組の子供セグメントを除去するか隠す(
工程810)。利用者は必要な場合には種々のグループの隣接動画像セグメント
の併合を継続する(工程812)。
【0113】 工程808で本システムにより行われる動作を図8bを参照して更に詳細に説
明する。本システムは併合される動画像セグメントのリストを作る(工程820
)。その後で、本システムは子供セグメントを連結することにより親セグメント
を作成する(工程822)。特に、本システムは、第一子供セグメントの始動時
間に等しく、且つ、その持続期間は子供セグメント全ての持続期間の和に等しい
出力ビデオ制作始動時間を持つ新しい動画像セグメントを作成する。
【0114】 本システムは各記述子の公式/アルゴリズムにより親セグメントの全抽出記述
子を再計算する(工程824)。次に、移入されたマニュアル記述子の場合には
、本システムは各子供セグメント内の対応記述子の値から親セグメントに対する
各記述子の値を引出す(工程826)。この作業は幾つかのユーザ選択可能方法
の一つにより行われる。例えば、数値記述子の場合には、平均値を用いるし、記
号列記述子の場合には、子供セグメントの組に頻繁に見られる記号列の値を選ぶ
のが好ましい選択肢である。この作業中に情報が若干失われことがあり、利用者
は簡単な描写のために入換えを容認する。
【0115】 全抽出記述子が再計算され、移入およびマニュアル記述子が親セグメントの値
を割当てられると、本システムは親セグメントに対する誘導記述子の組を計算す
る(工程828)。
【0116】 多くの場合、利用者が入力ビデオ素材を分析し、注釈をつけるときに上下分解
プロセスで主に始め、続いて、利用者が出力ビデオ制作を作成するときに逆さ分
解プロセスに進むことにより利用者は両方の作業方法を用いる。
【0117】 本システムはこのシステムのデータ構造内に動画像階層構造を表示する。この
ために動画像セグメントを併合および非併合するような可能性が追加され、それ
で利用者は子供セグメントを単一親セグメントに畳込み、その後で親セグメント
を再び子供セグメントとして解体し、異なるが一般的に関連した記述子は階層構
造の各レベル内に存在する。この種のマルチレベル描写が本システムのデータ構
造内に蓄積されると、利用者が併合図と分解図の間を交互に行き交うときに、デ
ータの紛失もなく、本システムがデータを再計算する必要もなくなる。
【0118】 更に、本システムはまた動画像セグメントの幾つかの種々の階層構造を共存さ
せることができ、ひとつは親セグメントが入力ビデオ素材内で隣接する一組の子
供セグメントからなる入力ビデオ素材の階層と、もう一つは動画像セグメントの
代替階層クラスタ化を示す階層である。例えば、動画像セグメントの代替クラス
タ化は、親セグメントが一つの可能な出力ビデオ制作内に隣接する一組の子供セ
グメントからなる一つ以上の可能な出力ビデオ制作に対応する。
【0119】 (選定) 選定機能は本発明の実施例のどれか一つによるシステムにとって重要な部分で
ある。動画像セグメントが出力ビデオ制作に現れる領域選定を明示する。デフォ
ルトにより、全ての動画像セグメントが選定されるが、これらの動画像セグメン
トが選定されなければ、出力ビデオ制作から動画像セグメントが排除される。
【0120】 選定機能は幾つかのことを領域分割機能と共に共有する。例えば、選定は記述
子値により自動的に、あるいは手動で遂行される。マニュアル選定の場合に、選
択か選択されないかどうかの選定状態は、例えば図1bのグリッド画面202の
動画像セグメントコラムの最上部を右クリックし、“選定動画像セグメント”や
“非選定動画像セグメント”選択肢のどちらかを選ぶことにより制御される。
【0121】 記述子値による選定の自動制御プロセスを図9のフローチャートを参照して説
明する。このプロセスは記述子の組込みや作成、およびこのような記述子の一つ
以上の選択に影響して選定プロセスを制御する(工程902)。次に、記述子値
が選定決定に変換する方法を支配する規則を形成する(工程904)。代表的な
領域分割規則は整合選定則であり、記述子の値が任意目標値に正確に整合する場
合に動画像セグメントを選定するものである。別の代表的規則は近接選定則であ
り、記述子の値が所定の制限量未満だけ任意の目標値と異なる場合にセグメント
を選定するものである。更に、一般的な規則は範囲選定則であり、記述子の値が
任意の範囲内に入る場合にセグメントを選定するものである。
【0122】 領域分割の場合のように、選定機構は単一記述子則をBoolean関係AN
D、ORおよびNOTと組合せることにより複数記述子の値次第で行われる。
【0123】 動画像セグメントに適用する選定則を形成した後に、動画像セグメントを本シ
ステムにより識別し(工程906)、この識別セグメントの記述子値が選定則に
よる基準を満たす場合に検査する(工程908)。識別セグメントの記述子値が
基準を満たすかどうかに依って、識別セグメントを“選定”(工程910)、あ
るいは“未選定”(工程912)と印す。次に、本システムは印付きセグメント
が選定則に対して検査される最終セグメントであるかを調べる(工程914)。
別の未検査セグメントがあれば、本システムはこのセグメントを識別し(工程9
16)、その後で工程908に戻る。
【0124】 自動選定を行うために、本システムはスカラー記述子のみでなく、ベクトル、
マトリックスおよび記号列のようなより複雑な記述子をも用いることができる。
【0125】 (配列づけ) 配列づけ機能は本発明の実施例によるどのシステムにとっても重要な部分であ
る。動画像セグメント配列は出力ビデオ制作内の動画像セグメントの順序である
。何時でも、現出力ビデオ制作は現配列内の選定セグメントの組からなる。現配
列は動画像セグメントが図1bのグリッド画面202および図1aのアウトライ
ン画面106内で左から右に現れる順序である。
【0126】 配列づけは記述子値により自動的に、あるいは手動で行われる。マニュアル配
列づけの場合に、その順序は動画像セグメントをドラッグしたりドロップするよ
うな作業により確定される。例えば、図1bのグリッド画面202内のセグメン
トコラムの最上部をクリックし、このコラムを別の場所に水平にドラッグするこ
とにより、マニュアル配列づけを行う。
【0127】 記述子値による配列づけの自動制御プロセスを図10のフローチャートを参照
して説明する。このプロセスは記述子の組込みや作成に、且つ、一つ以上の記述
子の選択に影響し、配列づけプロセスを制御する(工程950)。記述子値が配
列づけ決定に変換する方法を支配する規則を定義する(工程952)。代表的規
則は値による分類則であり、動画像セグメントを記述子の値、例えば最低値から
最高値にまで、あるいはその逆により選別する。別の代表的規則は距離による分
類則であり、記述子値が任意目標値とどの程度異なるか、例えば単一数値差やユ
ークリッド距離により動画像セグメントを選別する。この規則を用い、動画像セ
グメントの目標セグメントとの類似性により動画像セグメントを選別するときに
、この規則は特に強力である。
【0128】 領域分割機能と選定機能と同様に、配列づけ機能は複数記述子の値に依り行わ
れる。複数記述子配列づけ機能は前述の公式/アルゴリズム方式の記述子を組合
せて行われる。配列づけ機構は、配列づけが先ず一つの記述子の値により確定さ
れる階層的分類を伴い、第一記述子が多くの動画像セグメントに対して同じ値を
持つ場合に他の記述子に頼る。これは語をアルファベットで選別する、すなわち
、語を第一文字に基づいて選別し、次にその範囲内で第二文字に基づいて選別す
るプロセスに類似している。
【0129】 次に配列づけ規則を用いて全選定動画像セグメントの順序を確立する(工程9
54)。この順序にセグメントをつなぎ合わせて出力ビデオ制作を作る(工程9
56)。
【0130】 自動配列づけを行うために、本システムはスカラー記述子のみでなく、ベクト
ル、マトリックスおよび記号列のようなより複雑な記述子をも用いることができ
る。
【0131】 本発明の実施例は計算機、例えば図11に示す汎用計算機により実行される。
特に、図1から図10を参照して説明した本システムの機能性や処理はソフトウ
エアや計算機プログラムとして計算機上で実行される。ビデオ制作のための本シ
ステムと方法は計算機により実行されるソフトウエア内の指令により実行される
。このソフトウエは処理工程を実施する一つ以上のモジュールとして実行される
。モジュールは特定機能や関連機能を通常行う計算機プログラムの一部である。
更に、先に説明したように、モジュールは他の構成要素やモジュール用に使うパ
ッケージ機能性ハードウエアユニットである。
【0132】 特に、ソフトウエアは以下に述べる記憶装置を含む計算機読取り可能媒体内に
記憶される。ソフトウエアは計算機読取り可能媒体から計算機に装填され、次に
計算機により実行される。計算機プログラム製品は計算機読取り可能媒体を含み
、この媒体上に計算機により実行されるソフトウエアや計算機プログラムを記録
する。計算機内で計算機プログラム製品を使用する効果は、本発明の実施例に従
って低データ伝送速度、且つ、理解できる音声通信を備えた装置を提供できるこ
とである。
【0133】 本システム28を具体例を示すために提供するが、本発明の範囲と精神から逸
脱することなく他の構成形態を用いることもできる。実施例を実行する計算機は
IBM−PC/ATs、Macintosh(商標)PCsファミリの一つ、S
un Sparcstation(商標)、ワークステーション等を含む。前述
の計算機は、本発明の実施例を実行する単なる代表的な種類にすぎない。一般的
に、この後に述べる実施例のプロセスは計算機読取り可能媒体としてハードディ
スク駆動装置(図11にブロック29として示した)に記録され、プロセッサ3
0により読取り制御されるソフトウエアすなわちプログラムとして内在する。プ
ログラムおよびデータの中間記憶装置は、おそらくハードディスク駆動装置29
と同調した半導体メモリ31により達成される。
【0134】 ある事例では、CD−ROMやフレキシブルディスク(両方ともブロック29
で一般的に示した)上に符号化されたプログラムを利用者に供給し、あるいは、
例えば、計算機に接続されたモデム装置経由でネットワークから利用者が読取る
ことができる。更に、このソフトウエアは、磁気テープ、ROMや集積回路、光
磁気ディスクを含む他の計算機読取り可能媒体、計算機と別の装置間の無線や赤
外線伝送チャネル、PCMCIAカードのような計算機読取り可能カード、およ
びeメールや、ウェブサイト等に記録された情報を含むインタネットとイントラ
ネットから計算機システム28に装填される。前記媒体は単なる代表的な適切な
計算機読取り可能媒体である。他の計算機読取り可能媒体は本発明の範囲と精神
から逸脱することなく実際に使用される。
【0135】 前述のように、ビデオ制作のために画像を再目的化し、編集し、ファイル保管
する方法、システム、および計算機プログラム製品について開示されている。多
数の実施例が説明されている。しかし、この開示に鑑みて、多数の変化および/
あるいは変更が本発明の範囲と精神から逸脱しないで行われ得ることは当業者に
は明らかである。
【図面の簡単な説明】
【図1a】 本発明の一実施例によるビデオ制作システムの一変形のGUIを示す。
【図1b】 本発明の別の実施例によるビデオ制作システムの別の変形のGUIを示す。
【図2a】 本発明の更なる実施例によるビデオ制作システムの更なる変形のGUIを示す
【図2b】 本発明の更なる実施例によるビデオ制作システムの更なる変形のGUIを示す
【図2c】 本発明の更なる実施例によるビデオ制作システムの更なる変形のGUIを示す
【図2d】 本発明の更なる実施例によるビデオ制作システムの更なる変形のGUIを示す
【図3】 本発明の実施例によるシステムを用いたシナリオを説明するフローチャートで
ある。
【図4a】 図2のシステムのマニュアル記述子の高速伝搬のプロセスを説明するフローチ
ャートである。
【図4b】 図3のシステムの動画像セグメントに記述子値を伝達するプロセスを説明する
フローチャートである。
【図5】 図2のシステムの自動領域分割プロセスを説明するフローチャートである。
【図6】 図2のシステムの入力ビデオ素材の自動領域分割プロセスを説明するフローチ
ャートである。
【図7】 図2のシステムの動画像セグメントの上下分解プロセスを説明するフローチャ
ートである。
【図8a】 図2のシステムの動画像セグメントの逆さ分解プロセスを説明するフローチャ
ートである。
【図8b】 図2のシステムの動画像セグメントを併合するプロセスを説明するフローチャ
ートである。
【図9】 図2のシステムの自動領域分割選択プロセスを説明するフローチャートである
【図10】 記述子値に基づく自動配列プロセスを説明するフローチャートである。
【図11】 本発明の実施例を実行する汎用計算機を示す。
【手続補正書】
【提出日】平成14年6月26日(2002.6.26)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0038
【補正方法】変更
【補正の内容】
【0038】 アウトライン画面106は動画像セグメント当り1キーフレームを用いて動画
像セグメントの現選定および配列から生じる出力ビデオ制作のアウトラインを提
供する。システム変形は動画像セグメントをループモードで再生する運動アイコ
ンを使用でき、このような技術は当業者には周知である。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0057
【補正方法】変更
【補正の内容】
【0057】 このような自動抽出記述子は一般に“低レベル”であり、つまり、これらの記
述子は統計と信号の他の一般的特性を表すが、利用者が最も興味を持ちそうな“
高レベル”意味情報の種類でない。このような記述子を更に分析して高レベルの
意味情報を抽出する場合でさえも、結果は一般的に信頼性がない。例えば、利用
者は入力ビデオ素材からビル・クリントンの全ショットや群集の波の全ショット
を識別したいが、自動的“ビル・クリントン検出器”は現に最新技術を超えたも
のである。“人々の波検出器”は一般的に全く信頼性がなく、つまり、このよう
な検出器は高い割合で人々の波のショットを見失ったり、あるいは高い割合で偽
陽画(例えば、恐らく風の中で波打つ木)を与えたりする。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0082
【補正方法】変更
【補正の内容】
【0082】 (自動領域分割) ビデオ素材を領域分割するための自動化技術が多々あり、そのどれかは外部的
、あるいは内部的に適用される。当業者に周知の共通技術はショット境界検出で
る。領域分割は音声情報を用いて、例えば、平均音声振幅が閾値以下になるた
びに新しい動画像セグメントを作成することにより、あるいは演説対音楽を識別
することにより、あるいはスピーカの変化可能性を認識することにより行われる

───────────────────────────────────────────────────── フロントページの続き (72)発明者 パッドマナハン, ラマナス シンガポール国 120506 ウエスト・コー スト・ドライブ ナンバー08−219、ブロ ック 506 (72)発明者 ゴー, リアング, キー シンガポール国 130022 ドーヴァー・ク レセント ナンバー09−350、ブロック 22 Fターム(参考) 5C053 FA14 GB11 JA01

Claims (99)

    【特許請求の範囲】
  1. 【請求項1】 動画像セグメントを処理するシステムであって、 記述子を作成し、対応する動画像セグメントの少なくとも一つの値をこの記述
    子に特有のものにする手段と、 少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる手段で、
    前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値
    によって前記少なくとも二つの動画像セグメントを選定する手段および前記少な
    くとも二つの動画像セグメントに対応する少なくとも一つの記述子の値によって
    前記少なくとも二つの動画像セグメントを配列する手段を含む手段と、を含むシ
    ステム。
  2. 【請求項2】 更に、少なくとも一つのグリッドを表示する手段を含み、前
    記少なくとも一つのグリッドの各々が基準として第一軸用に前記少なくとも二つ
    の動画像セグメントの表現と第二軸用に前記少なくとも二つの動画像セグメント
    に対応する前記少なくとも一つの記述子とを持ち、前記少なくとも一つのグリッ
    ド内の各セルが前記少なくとも二つの動画像セグメントの一方に対応する前記少
    なくとも一つの記述子の一つに特有の少なくとも一つの値の表現を表示する請求
    項1に記載のシステム。
  3. 【請求項3】 前記少なくとも一つのグリッドが複数の列を含み、前記複数
    の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
    列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
    時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
    一つに示される請求項2に記載のシステム。
  4. 【請求項4】 前記少なくとも一つのグリッドが更に、第一および第二グリ
    ッドを含み、ビデオ素材を前記システムに入力すると、前記第一グリッドが前記
    入力ビデオ素材を実質的に元の状態で表現し、第二グリッドが前記出力ビデオ制
    作物を表現し、且つ、前記第一グリッドへの変化が前記第二グリッドへ対応する
    変化を引起す請求項3に記載のシステム。
  5. 【請求項5】 更に、動画像セグメント間に遷移を作成する手段を含む請求
    項1に記載のシステム。
  6. 【請求項6】 遷移を作成する前記手段が動画像セグメント間で動画像分解
    あるいは音声クロスフェードを作成する手段を含む請求項5に記載のシステム。
  7. 【請求項7】 記述子を作成する前記手段が前記システムへの移入の前に記
    述子とこの記述子に特有の少なくとも一つの値とを移入する手段を含む請求項1
    に記載のシステム。
  8. 【請求項8】 記述子を作成する前記手段が動画像コンテンツあるいは音声
    コンテンツの信号分析を前記動画像セグメントに適用することにより動画像セグ
    メントに対応する記述子の値を抽出する手段を含む請求項1に記載のシステム。
  9. 【請求項9】 記述子を作成する前記手段が前記少なくとも二つの動画像セ
    グメント内のその位置に従って順序数を割当てることにより前記少なくとも二つ
    の動画像セグメントの一方に対応する記述子の値を作成する手段を含む請求項1
    に記載のシステム。
  10. 【請求項10】 少なくとも一つの値を記述子に特有のものにする前記手段
    が少なくとも一つの他の記述子に対する基準を持つ公式ないしはアルゴリズムを
    含む請求項1に記載のシステム。
  11. 【請求項11】 更に、前記システムに入力されたビデオ素材を動画像セグ
    メントに領域分割する手段を含み、前記手段が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
    像セグメントとして表現する手段と、 前記識別手段が基づく少なくとも一つの記述子を選択する手段と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する手段とを含む
    請求項1に記載のシステム。
  12. 【請求項12】 前記領域分割手段が第一組の動画像セグメントを第二組の
    動画像セグメントに再領域分割する手段を含む請求項11に記載のシステム。
  13. 【請求項13】 前記領域分割手段が更に、前記第一組の動画像セグメント
    に対応する記述子の値を選択的に複製したり結合することによって、前記第二組
    の動画像セグメントの各々に対応する前記記述子の値を生成する手段を含む請求
    項12に記載のシステム。
  14. 【請求項14】 前記領域分割手段が前記少なくとも一つの記述子の各々に
    対して種々の組の動画像セグメントを識別し表現する手段を含む請求項11に記
    載のシステム。
  15. 【請求項15】 更に、前記システムに入力されたビデオ素材を、利用者の
    直接操作により動画像セグメントの始点と終点の定義あるいは調整を可能にする
    ことで、動画像セグメントに領域分割する手段を含む請求項1に記載のシステム
  16. 【請求項16】 更に、前記少なくとも二つの動画像セグメントの一方に対
    応する記述子の複数の時間的連続値から単一値を生成する手段を含む請求項1に
    記載のシステム。
  17. 【請求項17】 更に、単一動画像セグメントを複数の動画像セグメントに
    細分割する手段を含み、前記単一動画像セグメントに対応する記述子の値を漸進
    的分解により前記複数の動画像セグメントに対応する記述子に複製する請求項1
    に記載のシステム。
  18. 【請求項18】 更に、複数の動画像セグメントを単一動画像セグメント内
    に集めることにより前記複数の動画像セグメントを併合する手段を含み、前記単
    一動画像セグメントに対応する記述子の値を前記複数の動画像セグメントに対応
    する記述子の値から生成する請求項1に記載のシステム。
  19. 【請求項19】 更に、前記出力ビデオ制作物の再生を行う手段を含む請求
    項1に記載のシステム。
  20. 【請求項20】 前記選定手段が、前記少なくとも一つの記述子の値が目標
    値の範囲内に実質的にあるかどうかによって、前記少なくとも二つの動画像セグ
    メントを選定する請求項1に記載のシステム。
  21. 【請求項21】 前記選定手段が更に、利用者の直接操作により前記少なく
    とも二つの動画像を手動で選定する手段を含む請求項1に記載のシステム。
  22. 【請求項22】 前記配列づけ手段が前記少なくとも一つの記述子の値と目
    標値の間の差に従って前記少なくとも二つの動画像セグメントを順序づける請求
    項1に記載のシステム。
  23. 【請求項23】 前記配列づけ手段が更に、利用者の直接操作により前記少
    なくとも二つの動画像セグメントを手動で配列づけする手段を含む請求項1に記
    載のシステム。
  24. 【請求項24】 動画像セグメントを処理する方法であって、 記述子を作成し、対応する動画像セグメントの少なくとも一つの値をこの記述
    子に特有のものにする工程と、 少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる工程とを
    含み、前記組立工程が、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
    値に従って前記少なくとも二つの動画像セグメントを選定する工程と、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
    値に従って前記少なくとも二つの動画像セグメントを配列づけする工程とを含む
    方法。
  25. 【請求項25】 更に、少なくとも一つのグリッドを表示する工程を含み、
    前記少なくとも一つのグリッドの各々が基準として第一軸用に前記少なくとも二
    つの動画像セグメントの表現と第二軸用に前記少なくとも二つの動画像セグメン
    トに対応する前記少なくとも一つの記述子とを有するもので、前記少なくとも一
    つのグリッド内の各セルが前記少なくとも二つの動画像セグメントの一方に対応
    する前記少なくとも一つの記述子の一つに特有のものにした少なくとも一つの値
    の表現を表示する請求項24に記載の方法。
  26. 【請求項26】 前記少なくとも一つのグリッドを表示する前記工程が複数
    の列を表示する工程を含み、前記複数の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
    列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
    時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
    一つに示される請求項25に記載の方法。
  27. 【請求項27】 前記少なくとも一つのグリッドを表示する前記工程が第一
    および第二グリッドを表示する工程を含み、入力ビデオ素材が与えられると、前
    記第一グリッドが前記入力ビデオ素材を実質的に元の状態で表現し、第二グリッ
    ドが前記出力ビデオ制作物を表現し、前記第一グリッドへの変化が前記第二グリ
    ッドへ対応する変化を引起す請求項26に記載の方法。
  28. 【請求項28】 更に、動画像セグメント間に遷移を作成する工程を含む請
    求項24に記載の方法。
  29. 【請求項29】 遷移を作成する前記工程が動画像セグメント間で動画像分
    解あるいは音声クロスフェードを作成する工程を含む請求項28に記載の方法。
  30. 【請求項30】 記述子を作成する前記工程が前記システムへの移入の前に
    記述子とこの記述子に特有の少なくとも一つの値とを移入する工程を含む請求項
    24に記載の方法。
  31. 【請求項31】 記述子を作成する前記工程が動画像コンテンツあるいは音
    声コンテンツの信号分析を前記動画像セグメントに適用することにより動画像セ
    グメントに対応する記述子の値を抽出する工程を含む請求項24に記載の方法。
  32. 【請求項32】 記述子を作成する前記工程が前記少なくとも二つの動画像
    セグメント内のその位置に従って順序数を割当てることにより前記少なくとも二
    つの動画像セグメントの一方に対応する記述子の値を作成する工程を含む請求項
    24に記載の方法。
  33. 【請求項33】 少なくとも一つの値を記述子に特有のものにする前記工程
    が少なくとも一つの他の記述子に対する基準を持つ公式ないしアルゴリズムによ
    り前記少なくとも一つの値を前記記述子に特有のものにする工程を含む請求項2
    4に記載の方法。
  34. 【請求項34】 更に、入力ビデオ素材を動画像セグメントに領域分割する
    工程を含み、前記工程が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
    像セグメントとして表現する工程と、 前記識別手段が基づく少なくとも一つの記述子を選択する工程と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する工程とを含む
    請求項24に記載の方法。
  35. 【請求項35】 領域分割する前記工程が第一組の動画像セグメントを第二
    組の動画像セグメントに再領域分割する工程を含む請求項34に記載の方法。
  36. 【請求項36】 領域分割する前記工程が更に、前記第一組の動画像セグメ
    ントに対応する前記記述子の値を選択的に複製したり結合することで前記第二組
    の動画像セグメントの各々に対応する記述子の値を引出す工程を含む請求項35
    に記載の方法。
  37. 【請求項37】 領域分割する前記工程が前記少なくとも一つの記述子の各
    々に対して種々の組の動画像セグメントを識別し表現する工程を含む請求項34
    に記載の方法。
  38. 【請求項38】 更に、利用者の直接操作により動画像セグメントの始点と
    終点の定義や調整を可能にすることで入力ビデオ素材を動画像セグメントに領域
    分割する工程を含む請求項24に記載の方法。
  39. 【請求項39】 更に、前記少なくとも二つの動画像セグメントの一方に対
    応する記述子の複数の時間連続値から単一値を引出す工程を含む請求項24に記
    載の方法。
  40. 【請求項40】 更に、単一動画像セグメントを複数の動画像セグメントに
    細分割する工程を含み、前記単一動画像セグメントに対応する記述子の値を漸進
    分解により前記複数の動画像セグメントに対応する記述子に複製する請求項24
    に記載の方法。
  41. 【請求項41】 更に、前記複数の動画像セグメントを単一動画像セグメン
    ト内に集めることにより複数の動画像セグメントを併合する工程を含み、前記単
    一動画像セグメントに対応する記述子の値を前記複数の動画像セグメントに対応
    する記述子の値から引出す請求項24に記載の方法。
  42. 【請求項42】 更に、前記出力ビデオ制作物を再生する工程を含む請求項
    24に記載の方法。
  43. 【請求項43】 前記選定工程が前記少なくとも一つの記述子の値が目標値
    の範囲内に実質的にあるかどうかによって前記少なくとも二つの動画像セグメン
    トを選定する工程を含む請求項24に記載の方法。
  44. 【請求項44】 前記選定工程が利用者の直接操作により前記少なくとも二
    つの動画像セグメントを手動で選定する工程を含む請求項24に記載の方法。
  45. 【請求項45】 前記配列づけ工程が前記少なくとも一つの記述子の値と目
    標値の間の差に従って前記少なくとも二つの動画像セグメントを順序づける工程
    を含む請求項24に記載の方法。
  46. 【請求項46】 前記配列づけ工程が更に、利用者の直接操作により前記少
    なくとも二つの動画像セグメントを手動で配列づけする工程を含む請求項24に
    記載の方法。
  47. 【請求項47】 動画像セグメントを処理する計算機プログラム製品であっ
    て、 動画像セグメントを処理する計算機使用可能媒体に具現化した計算機読取り可
    能プログラムコード手段を有する前記媒体を含み、 記述子を作成し、対応する動画像セグメントに対する少なくとも一つの値をこ
    の記述子に特有のものにする計算機読取り可能プログラムコード手段と、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
    値によって前記少なくとも二つの動画像セグメントを選定する計算機読取り可能
    プログラムコード手段、および前記少なくとも二つの動画像セグメントに対応す
    る少なくとも一つの記述子の値によって前記少なくとも二つの動画像セグメント
    を配列づけする計算機読取り可能プログラムコード手段を含む、少なくとも二つ
    の動画像セグメントから出力ビデオ制作物を組立てる計算機読取り可能プログラ
    ムコード手段と、を有する計算機プログラム製品。
  48. 【請求項48】 更に、少なくとも一つのグリッドを表示する計算機読取り
    可能プログラムコード手段を含み、前記少なくとも一つのグリッドの各々が基準
    として第一軸用に前記少なくとも二つの動画像セグメントの表現と第二軸用に前
    記少なくとも二つの動画像セグメントに対応する前記少なくとも一つの記述子と
    を持ち、前記少なくとも一つのグリッド内の各セルが前記少なくとも二つの動画
    像セグメントの一方に対応する前記少なくとも一つの記述子の一つに特有のもの
    にした少なくとも一つの値の表現を表示する請求項47に記載の製品。
  49. 【請求項49】 前記少なくとも一つのグリッドを表示する前記計算機読取
    り可能プログラムコード手段が複数の列を表示する計算機読取り可能プログラム
    コード手段を含み、前記複数の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
    列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
    時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
    一つに示される請求項47に記載の製品。
  50. 【請求項50】 前記少なくとも一つのグリッドを表示する前記計算機読取
    り可能プログラムコード手段が更に、第一および第二グリッドを表示する計算機
    読取り可能プログラムコード手段を含み、入力ビデオ素材が与えられると、前記
    第一グリッドが前記入力ビデオ素材を実質的に元の状態で表現し、第二グリッド
    が前記出力ビデオ制作物を表現し、前記第一グリッドへの変化が前記第二グリッ
    ドへ対応する変化を引起す請求項49に記載の製品。
  51. 【請求項51】 更に、動画像セグメント間に遷移を作成する計算機読取り
    可能プログラムコード手段を含む請求項47に記載の製品。
  52. 【請求項52】 遷移を作成する前記計算機読取り可能プログラムコード手
    段が動画像セグメント間で動画像分解あるいは音声クロスフェードを作成する計
    算機読取り可能プログラムコード手段を含む請求項51に記載の製品。
  53. 【請求項53】 記述子を作成する前記計算機読取り可能プログラムコード
    手段が前記システムへの移入の前に記述子とこの記述子に特有のものにした少な
    くとも一つの値とを移入する計算機読取り可能プログラムコード手段を含む請求
    項47に記載の製品。
  54. 【請求項54】 記述子を作成する前記計算機読取り可能プログラムコード
    手段が動画像コンテンツあるいは音声コンテンツの信号分析を前記動画像セグメ
    ントに適用することにより動画像セグメントに対応する記述子の値を抽出する計
    算機読取り可能プログラムコード手段を含む請求項47に記載の製品。
  55. 【請求項55】 記述子を作成する前記計算機読取り可能プログラムコード
    手段が前記少なくとも二つの動画像セグメント内のその位置に従って順序数を割
    当てることにより前記少なくとも二つの動画像セグメントの一方に対応する記述
    子の値を作成する計算機読取り可能プログラムコード手段を含む請求項47に記
    載の製品。
  56. 【請求項56】 少なくとも一つの値を記述子に特有のものにする前記計算
    機読取り可能プログラムコード手段が少なくとも一つの他の記述子に対する基準
    を持つ公式ないしはアルゴリズムにより前記少なくとも一つの値を前記記述子に
    特有のものにする計算機読取り可能プログラムコード手段を含む請求項47に記
    載の製品。
  57. 【請求項57】 更に、入力ビデオ素材を動画像セグメントに領域分割する
    計算機読取り可能プログラムコード手段を含み、前記計算機読取り可能プログラ
    ムコード手段が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
    像セグメントとして表現する計算機読取り可能プログラムコード手段と、 前記識別手段が基づく少なくとも一つの記述子を選択する計算機読取り可能プ
    ログラムコード手段と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する前記計算機読
    取り可能プログラムコード手段とを含む請求項47記載の製品。
  58. 【請求項58】 領域分割用の前記計算機読取り可能プログラムコード手段
    が第一組の動画像セグメントを第二組の動画像セグメントに再領域分割する計算
    機読取り可能プログラムコード手段を含む請求項57に記載の製品。
  59. 【請求項59】 領域分割する前記計算機読取り可能プログラムコード手段
    が更に、前記第一組の動画像セグメントに対応する記述子の値を選択的に複製し
    たり結合することによって、前記第二組の動画像セグメントの各々に対応する前
    記記述子の値を引出す計算機読取り可能プログラムコード手段を含む請求項58
    に記載の製品。
  60. 【請求項60】 領域分割する前記計算機読取り可能プログタムコード手段
    が前記少なくとも一つの記述子の各々に対して種々の組の動画像セグメントを識
    別し表現する計算機読取り可能プログラムコード手段を含む請求項47に記載の
    製品。
  61. 【請求項61】 更に、利用者の直接操作により動画像セグメントの始点と
    終点の定義あるいは調整を可能にすることで入力ビデオ素材を動画像セグメント
    に領域分割する計算機読取り可能プログラムコード手段を含む請求項57に記載
    の製品。
  62. 【請求項62】 更に、前記少なくとも二つの動画像セグメントの一方に対
    応する記述子の複数の時間的連続値から単一値を生成する計算機読取り可能プロ
    グラムコード手段を含む請求項47に記載の製品。
  63. 【請求項63】 更に、単一動画像セグメントを複数の動画像セグメントに
    細分割する計算機読取り可能プログラムコード手段を含み、前記単一動画像セグ
    メントに対応する記述子の値を漸進的分解により前記複数の動画像セグメントに
    対応する記述子に複製する請求項47に記載の製品。
  64. 【請求項64】 更に、複数の動画像セグメントを単一動画像セグメント内
    に集めることにより前記複数の動画像セグメントを併合する計算機読取り可能プ
    ログラムコード手段を含み、前記単一動画像セグメントに対応する記述子の値を
    前記複数の動画像セグメントに対応する記述子の値から引出す請求項47に記載
    の製品。
  65. 【請求項65】 更に、前記出力ビデオ制作物の再生を行う計算機読取り可
    能プログラムコード手段を含む請求項47に記載の製品。
  66. 【請求項66】 前記少なくとも二つの動画像セグメントに対応する少なく
    とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを選定す
    る前記計算機読取り可能プログラムコード手段が前記少なくとも一つの記述子が
    目標値の範囲内に実質的にあるかどうかに従って前記少なくとも二つの動画像セ
    グメントを選定する計算機読取り可能プログラムコード手段を含む請求項47に
    記載の製品。
  67. 【請求項67】 前記少なくとも二つの動画像セグメントに対応する少なく
    とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを選定す
    る前記計算機読取り可能プログラムコード手段が利用者の直接操作により前記少
    なくとも二つの動画像セグメントを手動で選定する計算機読取り可能プログラム
    コード手段を含む請求項47に記載の製品。
  68. 【請求項68】 前記少なくとも二つの動画像セグメントに対応する少なく
    とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを配列づ
    けする前記計算機読取り可能プログラムコード手段が前記少なくとも一つの記述
    子の値と目標値の間の差に従って前記少なくとも二つの動画像セグメントを順序
    づける計算機読取り可能プログラムコード手段を含む請求項47に記載の製品。
  69. 【請求項69】 前記少なくとも二つの動画像セグメント手段に対応する少
    なくとも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを配
    列づけする前記計算機読取り可能プログラムコード手段が利用者の直接操作によ
    り前記少なくとも二つの動画像セグメントを手動で配列づけする計算機読取り可
    能プログラムコード手段を含む請求項47に記載の方法。
  70. 【請求項70】 動画像セグメントを記述するシステムであって、 第一記述子を作成し、対応する動画像セグメントに対する第一の値を第一記述
    子に特有のものにする手段と、 前記第一動画像セグメントと前記少なくとも一つの他の動画像セグメントとに
    対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメントを
    少なくとも一つの他の動画像セグメントでグループ分けする手段と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
    一記述子に特有のものにする手段とを含むシステム。
  71. 【請求項71】 更に、前記少なくとも一つの他の記述子を選定する手段を
    含む請求項70に記載のシステム。
  72. 【請求項72】 前記グループ分け手段が前記第一動画像セグメントと前記
    少なくとも一つの他の動画像セグメントとに対応する少なくとも一つの他の記述
    子の前記値を比較する手段を含む請求項71に記載のシステム。
  73. 【請求項73】 前記グループ分け手段が更に、前記第一動画像セグメント
    と前記少なくとも一つの他の動画像セグメントを選別する手段を含む請求項72
    に記載のシステム。
  74. 【請求項74】 前記グループ分け手段が更に、値による選別、距離による
    選別、公式選別、アルゴリズム選別や階層構造選別を含む選別技術により前記第
    一動画像セグメントと前記少なくとも一つの他の動画像セグメントを選別する手
    段を含む請求項73に記載のシステム。
  75. 【請求項75】 前記グループ分け手段が更に、ディスプレイを有するユー
    ザインタフェイスにより前記第一動画像セグメントおよび前記少なくとも一つの
    他の動画像セグメントの表現を視覚検査する手段を含む請求項73に記載のシス
    テム。
  76. 【請求項76】 前記グループ分け手段が更に、前記表現の視覚検査後に、
    前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一
    記述子に特有のものにする前記ユーザインタフェイス手段により作動する手段を
    含む請求項75に記載のシステム。
  77. 【請求項77】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記手段が前記第一の値を前記第一記述子に手動で割当てる手段
    を含む請求項73に記載のシステム。
  78. 【請求項78】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記手段が意味力を有する前記第一の値を前記第一記述子に手動
    で割当てる手段を含む請求項77に記載のシステム。
  79. 【請求項79】 前記第一動画像セグメントおよび前記少なくとも一つの他
    の動画像セグメントに対応する前記少なくとも一つの他の記述子を自動的に抽出
    する請求項78に記載のシステム。
  80. 【請求項80】 動画像セグメントを記述する方法であって、 第一記述子を作成し、対応する動画像セグメントに対する第一の値をこの記述
    子に特有のものにする工程と、 前記第一動画像セグメントおよび前記少なくとも一つの他の動画像セグメント
    に対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメント
    を少なくとも一つの他の動画像セグメントでグループ分けする工程と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
    一記述子に特有のものにする工程とを含む方法。
  81. 【請求項81】 更に、前記少なくとも一つの他の記述子を選定する工程を
    含む請求項80に記載の方法。
  82. 【請求項82】 前記グループ分け工程が前記第一動画像セグメントおよび
    前記少なくとも一つの他の動画像セグメントに対応する少なくとも一つの他の記
    述子の前記値を比較する工程を含む請求項81に記載の方法。
  83. 【請求項83】 前記グループ分け工程が更に、前記第一動画像セグメント
    と前記少なくとも一つの他の動画像セグメントを選別する工程を含む請求項82
    に記載の方法。
  84. 【請求項84】 前記グループ分け工程が更に、値による選別、距離による
    選別、公式選別、アルゴリズム選別や階層構造選別を含む選別技術により前記第
    一動画像セグメントと前記少なくとも一つの他の動画像セグメントを選別する工
    程を含む請求項83に記載の方法。
  85. 【請求項85】 前記グループ分け工程が更に、ディスプレイを有するユー
    ザインタフェイスにより前記第一動画像セグメントおよび前記少なくとも一つの
    他の動画像セグメントの表現を視覚検査する工程を含む請求項83に記載の方法
  86. 【請求項86】 前記グループ分け工程が更に、前記表現の視覚検査後に、
    前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一
    記述子に特有のものにする前記ユーザインタフェイス手段により作動する工程を
    含む請求項85に記載の方法。
  87. 【請求項87】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記工程が前記第一の値を前記第一記述子に手動で割当てる工程
    を含む請求項83に記載の方法。
  88. 【請求項88】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記工程が意味力を有する前記第一の値を前記第一記述子に手動
    で割当てる工程を含む請求項87に記載の方法。
  89. 【請求項89】 前記第一記述子を作成する前記工程が更に、前記第一動画
    像セグメントと前記少なくとも一つの他の動画像セグメントとに対応する少なく
    とも一つの他の記述子を自動的に抽出する工程を含む請求項88に記載の方法。
  90. 【請求項90】 動画像セグメントを記述する計算機プログラム製品であっ
    て、 動画像セグメントを記述する計算機使用可能媒体に具現化した計算機読取り可
    能プログラムコード手段を有する前記媒体を含み、 第一記述子を作成し、対応する動画像セグメントに対する第一の値をこの記述
    子に特有のものにする計算機読取り可能プログラムコード手段と、 前記第一動画像セグメントおよび前記少なくとも一つの他の動画像セグメント
    に対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメント
    を少なくとも一つの他の動画像セグメントでグループ分けする計算機読取り可能
    プログラムコード手段と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
    一記述子に割当てる計算機読取り可能プログラムコード手段とを有する計算機プ
    ログラム製品。
  91. 【請求項91】 更に、前記少なくとも一つの他の記述子を選定する計算機
    読取り可能プログラムコード手段を含む請求項90に記載の製品。
  92. 【請求項92】 グループ分けのための前記計算機読取り可能プログラムコ
    ード手段が前記第一動画像セグメントと前記少なくとも一つの他の動画像セグメ
    ントとに対応する少なくとも一つの他の記述子の前記値を比較する計算機読取り
    可能プログラムコード手段を含む請求項91に記載の製品。
  93. 【請求項93】 グループ分けのための前記計算機読取り可能プログラムコ
    ード手段が更に、前記第一動画像セグメントと前記少なくとも一つの他の動画像
    セグメントを選別する計算機読取り可能プログラムコード手段を含む請求項92
    に記載の製品。
  94. 【請求項94】 グループ分けのための前記計算機読取り可能プログラムコ
    ード手段が更に、値による選別、距離による選別、公式選別、アルゴリズム選別
    や階層構造選別を含む選別技術により前記第一動画像セグメントと前記少なくと
    も一つの他の動画像セグメントを選別する計算機読取り可能プログラムコード手
    段を含む請求項93に記載の製品。
  95. 【請求項95】 グループ分けのための前記計算機読取り可能プログラムコ
    ード手段が更に、ディスプレイを有するユーザインタフェイスにより前記第一動
    画像セグメントおよび前記少なくとも一つの他の動画像セグメントの表現を視覚
    検査する計算機読取り可能プログラムコード手段を含む請求項93に記載の製品
  96. 【請求項96】 グループ分けのための前記計算機読取り可能プログラムコ
    ード手段が更に、前記表現の視覚検査の後に、前記第一の値を前記少なくとも一
    つの他の動画像セグメントに対応する前記第一記述子に特有のものにする前記ユ
    ーザインタフェイス計算機読取り可能プログラムコード手段により作動する手段
    を含む請求項95に記載の製品。
  97. 【請求項97】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記計算機読取り可能プログラムコード手段が前記第一の値を前
    記第一記述子に手動で割当てる計算機読取り可能プログラムコード手段を含む請
    求項93に記載の製品。
  98. 【請求項98】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記計算機読取り可能プログラムコード手段が意味力を有する前
    記第一の値を前記第一記述子に手動で割当てる計算機読取り可能プログラムコー
    ド手段を含む請求項97に記載の製品。
  99. 【請求項99】 前記第一記述子を作成し、前記第一の値をこの記述子に特
    有のものにする前記計算機読取り可能プログラムコード手段が前記第一動画像セ
    グメントと前記少なくとも一つの他の動画像セグメントとに対応する前記少なく
    とも一つの他の記述子を自動的に抽出する計算機読取り可能プログラムコード手
    段を含む請求項98に記載の製品。
JP2001546152A 1999-12-16 1999-12-16 ビデオ制作システムおよび方法 Pending JP2003517786A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG1999/000142 WO2001045391A1 (en) 1999-12-16 1999-12-16 System and method for video production

Publications (2)

Publication Number Publication Date
JP2003517786A true JP2003517786A (ja) 2003-05-27
JP2003517786A5 JP2003517786A5 (ja) 2007-02-22

Family

ID=20430263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001546152A Pending JP2003517786A (ja) 1999-12-16 1999-12-16 ビデオ制作システムおよび方法

Country Status (6)

Country Link
US (1) US7702014B1 (ja)
EP (2) EP1944770A3 (ja)
JP (1) JP2003517786A (ja)
AT (1) ATE398382T1 (ja)
DE (1) DE69938904D1 (ja)
WO (1) WO2001045391A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010130683A (ja) * 2008-11-26 2010-06-10 Puzzlecut Co Ltd 広告動映像提供方法及び装置
JP2011522453A (ja) * 2008-04-11 2011-07-28 トムソン ライセンシング 自動化されたテレビ制作の方法

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9892606B2 (en) * 2001-11-15 2018-02-13 Avigilon Fortress Corporation Video surveillance system employing video primitives
US8564661B2 (en) * 2000-10-24 2013-10-22 Objectvideo, Inc. Video analytic rule detection system and method
WO2002052565A1 (en) * 2000-12-22 2002-07-04 Muvee Technologies Pte Ltd System and method for media production
DE60225060T2 (de) * 2001-12-25 2008-05-21 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung und verfahren zur wiedergabe von inhalten
ATE513415T1 (de) 2001-12-28 2011-07-15 Koninkl Philips Electronics Nv Verfahren zur verarbeitung von multimediainhalt
FR2836567A1 (fr) * 2002-02-26 2003-08-29 Koninkl Philips Electronics Nv Procede de montage video
US20040034869A1 (en) * 2002-07-12 2004-02-19 Wallace Michael W. Method and system for display and manipulation of thematic segmentation in the analysis and presentation of film and video
US7231630B2 (en) 2002-07-12 2007-06-12 Ensequence Inc. Method and system automatic control of graphical computer application appearance and execution
KR100824380B1 (ko) * 2002-08-08 2008-04-22 삼성전자주식회사 영상 기록/재생 장치 및 그 메뉴안내 표시방법
US8290334B2 (en) 2004-01-09 2012-10-16 Cyberlink Corp. Apparatus and method for automated video editing
ITMI20040985A1 (it) * 2004-05-17 2004-08-17 Technicolor S P A Rilevamento automatico di soncronizzazione del suono
US7769189B1 (en) * 2005-04-12 2010-08-03 Apple Inc. Preserving noise during editing of a signal
US8089563B2 (en) * 2005-06-17 2012-01-03 Fuji Xerox Co., Ltd. Method and system for analyzing fixed-camera video via the selection, visualization, and interaction with storyboard keyframes
US8295682B1 (en) * 2005-07-13 2012-10-23 Apple Inc. Selecting previously-selected segments of a signal
US8538761B1 (en) 2005-08-01 2013-09-17 Apple Inc. Stretching/shrinking selected portions of a signal
US8364294B1 (en) 2005-08-01 2013-01-29 Apple Inc. Two-phase editing of signal data
JP4854339B2 (ja) * 2006-03-08 2012-01-18 三洋電機株式会社 映像再生装置
FR2903804B1 (fr) * 2006-07-13 2009-03-20 Mxp4 Procede et dispositif pour la composition automatique ou semi-automatique d'une sequence multimedia.
US20080288869A1 (en) * 2006-12-22 2008-11-20 Apple Inc. Boolean Search User Interface
US9142253B2 (en) * 2006-12-22 2015-09-22 Apple Inc. Associating keywords to media
US8276098B2 (en) 2006-12-22 2012-09-25 Apple Inc. Interactive image thumbnails
US7954065B2 (en) * 2006-12-22 2011-05-31 Apple Inc. Two-dimensional timeline display of media items
US8565228B1 (en) * 2007-03-28 2013-10-22 Control4 Corporation Systems and methods for selecting and ranking video streams
US8650489B1 (en) * 2007-04-20 2014-02-11 Adobe Systems Incorporated Event processing in a content editor
CA2774652A1 (en) * 2008-09-18 2010-03-25 Screen Test Studios, Llc System and method for casting call
US8843375B1 (en) * 2008-09-29 2014-09-23 Apple Inc. User interfaces for editing audio clips
US8639086B2 (en) 2009-01-06 2014-01-28 Adobe Systems Incorporated Rendering of video based on overlaying of bitmapped images
CN101998137B (zh) * 2009-08-21 2016-09-07 华为技术有限公司 视频质量参数获取方法和装置及电子设备
US8988458B2 (en) * 2010-04-13 2015-03-24 At&T Intellectual Property I, L.P. System and method for generating media thumbscapes
JP5625642B2 (ja) 2010-09-06 2014-11-19 ソニー株式会社 情報処理装置、データ分割方法及びデータ分割プログラム
WO2012051585A1 (en) * 2010-10-14 2012-04-19 Fixmaster, Inc. System and method for creating and analyzing interactive experiences
KR101952260B1 (ko) * 2012-04-03 2019-02-26 삼성전자주식회사 다수의 동영상 썸네일을 동시에 표시하기 위한 영상 재생 장치 및 방법
US10165245B2 (en) 2012-07-06 2018-12-25 Kaltura, Inc. Pre-fetching video content
US8942542B1 (en) * 2012-09-12 2015-01-27 Google Inc. Video segment identification and organization based on dynamic characterizations
US9031375B2 (en) 2013-04-18 2015-05-12 Rapt Media, Inc. Video frame still image sequences
US9508385B2 (en) * 2013-11-21 2016-11-29 Microsoft Technology Licensing, Llc Audio-visual project generator
US10303716B2 (en) * 2014-01-31 2019-05-28 Nbcuniversal Media, Llc Fingerprint-defined segment-based content delivery
US9858036B2 (en) 2015-11-10 2018-01-02 Google Llc Automatic audio level adjustment during media item presentation
US10178341B2 (en) * 2016-03-01 2019-01-08 DISH Technologies L.L.C. Network-based event recording
CN117692676A (zh) * 2023-12-08 2024-03-12 广东创意热店互联网科技有限公司 一种基于人工智能技术的视频快速剪辑方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4780709A (en) 1986-02-10 1988-10-25 Intel Corporation Display processor
JP2677312B2 (ja) 1991-03-11 1997-11-17 工業技術院長 カメラワーク検出方法
US5286908A (en) 1991-04-30 1994-02-15 Stanley Jungleib Multi-media system including bi-directional music-to-graphic display interface
US5309228A (en) 1991-05-23 1994-05-03 Fuji Photo Film Co., Ltd. Method of extracting feature image data and method of extracting person's face data
US5262865A (en) 1991-06-14 1993-11-16 Sony Electronics Inc. Virtual control apparatus for automating video editing stations
JP3079719B2 (ja) 1991-11-30 2000-08-21 ソニー株式会社 特殊効果装置
US6208805B1 (en) * 1992-02-07 2001-03-27 Max Abecassis Inhibiting a control function from interfering with a playing of a video
US5434678A (en) * 1993-01-11 1995-07-18 Abecassis; Max Seamless transmission of non-sequential video segments
EP0590759B1 (en) 1992-08-12 1998-12-09 International Business Machines Corporation System and method for locating video segment boundaries
JPH08115338A (ja) 1994-10-14 1996-05-07 Fuji Xerox Co Ltd マルチメディア文書編集装置
US5805733A (en) 1994-12-12 1998-09-08 Apple Computer, Inc. Method and system for detecting scenes and summarizing video sequences
US5642285A (en) * 1995-01-31 1997-06-24 Trimble Navigation Limited Outdoor movie camera GPS-position and time code data-logging for special effects production
US5693902A (en) 1995-09-22 1997-12-02 Sonic Desktop Software Audio block sequence compiler for generating prescribed duration audio sequences
JP2994996B2 (ja) 1995-12-01 1999-12-27 松下電器産業株式会社 マルチメディア編集装置
US5801685A (en) 1996-04-08 1998-09-01 Tektronix, Inc. Automatic editing of recorded video elements sychronized with a script text read or displayed
CA2260932C (en) * 1996-07-29 2003-11-18 Avid Technology, Inc. Motion video processing circuit for capture, playback and manipulation of digital motion video information on a computer
US5969716A (en) 1996-08-06 1999-10-19 Interval Research Corporation Time-based media processing system
JPH1066008A (ja) 1996-08-23 1998-03-06 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像検索編集装置
AU7705498A (en) * 1997-05-29 1998-12-30 Red Hen Systems Llc Gps video mapping system
GB2329812B (en) 1997-09-24 2002-04-10 Sony Pictures Entertainment User interface systems and methods
AUPO960197A0 (en) 1997-10-03 1997-10-30 Canon Information Systems Research Australia Pty Ltd Multi-media editing method and apparatus
JPH11341350A (ja) 1998-05-28 1999-12-10 Yamaha Corp マルチメディア情報編集および再生装置、マルチメディア情報再生プログラムを記録した記録媒体ならびにシーケンス情報を記録した記録媒体
US6163510A (en) 1998-06-30 2000-12-19 International Business Machines Corporation Multimedia search and indexing system and method of operation using audio cues with signal thresholds
JP2002524775A (ja) 1998-09-04 2002-08-06 レゴ エー/エス 電子音楽を作曲しグラフィック情報を生成するための方法およびシステム
AU2217700A (en) 1998-12-30 2000-07-31 Earthnoise.Com Inc. Creating and editing digital video movies
US6549643B1 (en) 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6757027B1 (en) 2000-02-11 2004-06-29 Sony Corporation Automatic video editing
US6697564B1 (en) 2000-03-03 2004-02-24 Siemens Corporate Research, Inc. Method and system for video browsing and editing by employing audio
US6542869B1 (en) 2000-05-11 2003-04-01 Fuji Xerox Co., Ltd. Method for automatic analysis of audio including music and speech
US6697523B1 (en) 2000-08-09 2004-02-24 Mitsubishi Electric Research Laboratories, Inc. Method for summarizing a video using motion and color descriptors
CA2374620C (en) 2002-03-05 2010-08-31 Ferco Architectural Hardware Multipoint locking mechanism for a window sash

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011522453A (ja) * 2008-04-11 2011-07-28 トムソン ライセンシング 自動化されたテレビ制作の方法
US9812170B2 (en) 2008-04-11 2017-11-07 Gvbb Holdings S.A.R.L. Method for automated television production
US10573347B2 (en) 2008-04-11 2020-02-25 Gvbb Holdings S.A.R.L. System for automated television production
JP2010130683A (ja) * 2008-11-26 2010-06-10 Puzzlecut Co Ltd 広告動映像提供方法及び装置

Also Published As

Publication number Publication date
ATE398382T1 (de) 2008-07-15
US7702014B1 (en) 2010-04-20
DE69938904D1 (de) 2008-07-24
EP1944770A2 (en) 2008-07-16
WO2001045391A1 (en) 2001-06-21
EP1247396A1 (en) 2002-10-09
EP1944770A3 (en) 2008-07-23
EP1247396B1 (en) 2008-06-11

Similar Documents

Publication Publication Date Title
JP2003517786A (ja) ビデオ制作システムおよび方法
US7945142B2 (en) Audio/visual editing tool
US5664227A (en) System and method for skimming digital audio/video data
US7362946B1 (en) Automated visual image editing system
US6970639B1 (en) System and method for editing source content to produce an edited content sequence
US6584463B2 (en) Video searching method, apparatus, and program product, producing a group image file from images extracted at predetermined intervals
US8006186B2 (en) System and method for media production
US6571054B1 (en) Method for creating and utilizing electronic image book and recording medium having recorded therein a program for implementing the method
US8751022B2 (en) Multi-take compositing of digital media assets
US6799180B1 (en) Method of processing signals and apparatus for signal processing
KR20070121810A (ko) 복합 뉴스 스토리 합성
JP2003179849A (ja) ビデオコラージュの作成方法および装置、ビデオコラージュ、ビデオコラージュ・ユーザ・インタフェース、ビデオコラージュ作成プログラム
CN100372376C (zh) 信号记录/再现装置和记录/再现方法、信号再现装置和再现方法
JP2008022103A (ja) テレビ番組動画像ハイライト抽出装置及び方法
JP4373466B2 (ja) 編集方法、コンピュータプログラム、編集システム及びメディア・プレーヤ
JP2007336106A (ja) 映像編集支援装置
US20050182503A1 (en) System and method for the automatic and semi-automatic media editing
EP4447047A1 (en) System and method for ai/xi based automatic song finding and adaptation for videos
US20240241905A1 (en) System and method for ai/xi based automatic song finding and adaptation method for videos
JP2005203895A (ja) データ重要度評価装置及び方法
Smith et al. Video Summarization
JP2002100157A (ja) 再生データ編集装置及び記憶媒体
JP2000099520A (ja) マルチメディア編集装置
JP2006048405A (ja) 映像処理方法及び装置及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060425

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060719

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080723

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203