JP2003517786A - ビデオ制作システムおよび方法 - Google Patents
ビデオ制作システムおよび方法Info
- Publication number
- JP2003517786A JP2003517786A JP2001546152A JP2001546152A JP2003517786A JP 2003517786 A JP2003517786 A JP 2003517786A JP 2001546152 A JP2001546152 A JP 2001546152A JP 2001546152 A JP2001546152 A JP 2001546152A JP 2003517786 A JP2003517786 A JP 2003517786A
- Authority
- JP
- Japan
- Prior art keywords
- descriptor
- video
- moving image
- segments
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims description 150
- 238000012545 processing Methods 0.000 claims abstract description 20
- 230000011218 segmentation Effects 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000007704 transition Effects 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000003362 replicative effect Effects 0.000 claims 3
- 238000011179 visual inspection Methods 0.000 claims 3
- 230000000750 progressive effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 61
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 19
- 230000007246 mechanism Effects 0.000 description 13
- 230000033001 locomotion Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 10
- 238000009795 derivation Methods 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000007689 inspection Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
オ再目的化、編集およびファイル保管に関する。
ングと線形ダブ編集のような従来の編集方法から生まれた。これらのツールは、
望む結果が単一で高品質なビデオ制作であるシナリオに好適である。しかし、こ
れらのツールにより素早くビデオ制作の複数の編集代替案を考えることは不可能
であり、これは新しいビデオエディタにとっては支障になる。それゆえ、ビデオ
制作の初心者は、初心者が素早く作成できるものは何でも“使う”か、あるいは
代替案を探すのに多くの時間を費やすかのどちらか一方を強いられる。
うな傾向は、被撮影や被記録映像素材、特に非専門家により撮影された映像素材
量の急激な増加の中に見られる。ディジタルビデオ(DV)カメラのような製品
をもたらす技術開発やブレークスルーは、ますます多くのビデオ素材をディジタ
ルフォーマットで専門家の、あるいは専門家に近い技術品質で撮影したり、記録
することを意味する。しかし、従来のツールによるこの種のビデオ素材を編集す
る費用は、多くの場合に法外に高いものである。
オ素材の拡張に見られる。視聴者は、視聴するビデオ素材に関し、どれぐらい長
く、どの順序で等の制御を増やしたがる。この傾向は、教育および専門家環境の
ノンフィクションビデオ素材に特に当てはまる。更に、この傾向は、例えば、種
々の視聴者デモグラフィを目指して種々の強調を伴う、種々の長さのビデオ制作
において、ビデオ素材の本体を複数形式で利用可能にする必要性が高まることを
意味する。
デオ素材量の有効性の指数関数的な増加に見られる。この傾向は、記述子による
ビデオ素材の有効な記述が必要であることを促すことになり、その結果、特定目
的に適切なビデオ素材が記述子の使用により役立つビデオ素材の大きな主要部か
ら検索される。MPEG−7規格に関係する動画像エキスパートグループ(MP
EG)の尽力による標準化を推し進める今日のビデオ素材記述の領域に大きな興
味がある。しかし、大きな課題がこのような尽力に直面し、この課題は二つの相
補的事実から生じる。第一に、ビデオ素材の信号分析によりビデオ素材から自動
的に抽出され、且つ、それゆえにこのようなビデオ素材に関連する記述子は、こ
れらの記述子が多くの利用者に理解されるためには、低レベルすぎて有効でなく
、且つ、通常の文脈において意味を持たないので、意味力が不足しがちである。
第二に、意味論的に強力な記述子はビデオ制作ツールにより手動で入力されたビ
デオ素材に関係するけれども、このプロセスは面倒で時間を消費するもので、従
って、このプロセスは多くの用途において投資効果がない。それゆえ、前述の傾
向の少なくとも一つを取扱うビデオ制作ツールの必要性が明らかになる。
促進するビデオ制作システムを提供する。
。本システムは、記述子を作成し、動画像セグメントに対応する少なくとも一つ
の値を記述子に特有のものにする手段を含む。本システムはまた、少なくとも二
つの動画像セグメントから出力ビデオ制作物を組立てる手段を含み、この手段は
少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値によ
って少なくとも二つの動画像セグメントを選定する手段および、少なくとも二つ
の動画像セグメントに対応する少なくとも一つの記述子の値によって少なくとも
二つの動画像セグメントを配列する手段を含む。
方法は、記述子を作成し、動画像セグメントに対応する少なくとも一つの値を記
述子に特有のものにする工程を含む。本方法はまた、少なくとも二つの動画像セ
グメントから出力ビデオ制作物を組立てる工程を含み、この組立工程は、少なく
とも二つの動画像セグメントに対応する少なくとも一つの記述子の値に従って少
なくとも二つの動画像セグメントを選定する工程と、少なくとも二つの動画像セ
グメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの動画
像セグメントを配列する工程を含む。
品を提供する。本製品は、動画像セグメントを処理する計算機使用可能媒体内に
具現化した計算機読取り可能プログラムコード手段を有する前記媒体を含む。本
製品は、記述子を作成し、動画像セグメントに対応する少なくとも一つの値を記
述子に特有のものにする計算機読取り可能プログラムコード手段を持つ。本製品
はまた、少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる計
算機読取り可能プログラムコード手段を持ち、この手段は少なくとも二つの動画
像セグメントに対応する少なくとも一つの記述子の値に従って少なくとも二つの
動画像セグメントを選定し、且つ、少なくとも二つの動画像セグメントに対応す
る少なくとも一つの記述子の値に従って少なくとも二つの動画像セグメントを配
列する計算機読取り可能プログラムコード手段である。
。本システムは、第一記述子を作成し、第一動画像セグメントに対応する第一の
値を第一記述子に特有のものにする手段を含む。本システムはまた、前記第一動
画像セグメントと前記少なくとも一つの他の動画像セグメントとに対応する少な
くとも一つの他の記述子の値に従って前記第一動画像セグメントを少なくとも一
つの他の動画像セグメントでグループ分けする手段を含む。更に、本発明は、前
記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一記
述子に特有のものにする手段を含む。
方法は、第一記述子を作成し、第一動画像セグメントに対応する第一の値を第一
記述子に特有のものにする工程を含む。本方法はまた、第一動画像セグメントと
少なくとも一つの他の動画像セグメントとに対応する少なくとも一つの他の記述
子の値に従って第一動画像セグメントを少なくとも一つの他の動画像セグメント
でグループ分けする工程を含む。更に、本方法は、第一の値を少なくとも一つの
他の動画像セグメントに対応する第一記述子に特有のものにする工程を含む。
品を提供する。本製品は、動画像セグメントを記述する計算機使用可能媒体に具
現化した計算機読取り可能プログラムコード手段を有する前記媒体を含む。この
計算機プログラム製品は、第一記述子を作成し、第一動画像セグメントに対応す
る第一の値を第一記述子に特有のものにする計算機読取り可能プログラムコード
手段を持つ。本製品はまた、第一動画像セグメントと少なくとも一つの他の動画
像セグメントとに対応する少なくとも一つの他の記述子の値に従って第一動画像
セグメントを少なくとも一つの他の動画像セグメントでグループ分けする計算機
読取り可能プログラムコード手段を持つ。
システムを開示する。このようなビデオ制作システム(今後は本システムと呼ぶ
)は、ビデオ制作に関係してそれに付随する幾つかの傾向と課題のうち少なくと
も一つを取扱う。このような傾向には、撮影ビデオ素材量の増加、ビデオ素材視
聴パラダイムの拡張、およびディジタルフォーマット内とインタネット上で利用
可能なビデオ素材量の利用度を含む。
エディタの特徴を組合せるディスプレイパラダイムを伴う。本システムはまた、
ビデオ素材を領域分割し、種々の組合せと配列に再接続することができ、その間
に、ビデオ素材の動画像セグメントは自動的および/あるいは手動で定義され、
選定され、記述子の値により配列される。
ことによりビデオ素材の主要部に精通したい利用者を支援する。更に、本システ
ムは、例えば、従来のビデオ編集プロセスの前に、ビデオ素材の主要部を組合せ
てビデオ制作を形成する種々の方式を調べたい利用者を支援できる。本システム
は更に、ビデオ素材の主要部からビデオ制作を作成したい利用者を支援できる。
更に、本システムは、後でビデオ素材の検索および再目的化を可能にするビデオ
素材の主要部の記述を作成したい利用者を支援できる。また、本システムは、ビ
デオ制作と記述に関連した他の作業を実行したい利用者を支援できる。
いて半自動方式で容易に素早く多くの可能性を試みることができる方法次第であ
る。
ァイル保管するツールとして使用される。このようなシナリオでは、利用者は既
存ビデオ制作からビデオ素材を再使用して新しいビデオ制作を作成する。ビデオ
素材を再使用するプロセスは“再目的化”として知られる。別のシナリオでは、
利用者はビデオ素材の主要部を利用して、例えば異なる期間、異なる対象の視聴
者等の幾つかの異なるが関連したビデオ制作を作成する。更に別のシナリオでは
、利用者は多くの可能な配列を非常に素早く調べ、ビデオ制作の一つ以上の“ラ
フなカット”を作成する。別のシナリオでは、ビデオ編集の専門家ではない利用
者がビデオ制作を作成しながら多くの可能性や代替案を試みることができる。対
照的に、編集の効果を前もって上手く可視化できるビデオ編集の専門家はあまり
に多くの代替案を試す必要はない。更に別のシナリオでは、利用者は時間が“洗
練さ”よりも重要なので、ビデオ制作を非常に速く作成する。
ビデオ素材を急速に試験する多くの“経路”を可能にする。これは分岐ビデオ技
術を用いるビデオゲームの作成に役立つ。更に、本システムは、他のメディア、
例えば静止画像や音声を編集し、再目的化し、あるいは記録保管するために使用
される。
ビデオ制作を作成する能力を備える。ツールの組は、既存の記述子が加速プロセ
スにおいて追加の記述子の作成を支援する幾つかの種類の記述子を定義して入力
するためのものである。新しいビデオ制作はこれらの記述子の一つ以上の値によ
りビデオ素材の動画像セグメントを選定し、配列すること(およびビデオ素材を
任意に再領域分割すること)により作成される。このビデオ素材は動画像および
音声両方のコンテンツから成る。
軸が記述子に関係する二次元(2D)グリッドを特徴とするグラフィックユーザ
インタフェイス(GUI)を備える。2Dグリッドは、ビデオコンテンツ(例え
ばキーフレームにより)および/あるいは音声コンテンツ(例えば波形により)
の表示と複数の記述子(例えば番号やグラフ形態で)の値を同時に示す。GUI
は、ツールの組を支援して相互作動してビデオ素材を記述し、再目的化する。
られる)を与えられると、本システムは利用者が二つのことを本質的に行う手段
を備える。第一に、利用者は入力ビデオ素材から新しいビデオ制作(“出力ビデ
オ制作”)を作成できる。これは、入力ビデオ素材を領域分割し、動画像セグメ
ントのサブセットを選定し、選択動画像セグメントを配列することにより出力ビ
デオ制作を形成することにより達成される。領域分割、選定、および配列の三つ
のプロセスは記述子の値により本システムで遂行されるか、あるいは利用者によ
り手動で遂行される。
く入力ビデオ素材の自動(すなわち記述子の駆動)処理と手動処理を交互に行う
。利用者は、出力ビデオ制作の広い可能性を調べるために自動処理から始め、次
に、その結果を手動で微調整する。このプロセス中に何時でも、利用者は、出力
ビデオ制作の最終形態を決める前の現在の動画像セグメントの選定および配列か
ら生じるビデオ制作の全て、あるいは一部を見ることができる。
る。これらの記述はおそらく異なる利用者により、および注釈を作成した利用者
が予知あるいは予想できないやり方により、後のビデオ素材の再利用を可能にす
る。例えば、注釈を用いてビデオファイル保管からビデオ素材を検索したり、あ
るいは自動ビデオコンストラクタによりビデオ素材から新しいビデオ制作を作成
できる。結果として、出力ビデオ制作の多くの可能性を速く試すことができ、こ
の場合の目的は、種々の記述の効果、および任意の記述を適用する種々の方法を
利用者に調べさせることであり、その結果、利用者は注釈をユーザ仕様要求に最
適化させることができる。
の完成されたビデオ制作のような)、あるいは、初めて組立てられる未編集の生
ビデオ素材、あるいは、この二つの任意な組合せからなる。本システムは、この
ような手段をこの後に述べる機能を組合せることにより提供する。
グメント”で動作する。自動領域分割は“ショット境界検出”のような周知の技
術により、あるいは、一つ以上の記述子の値の著しい変化を検出するような他の
技術により達成される。領域分割はまた手動で遂行、つまり微調整される。また
、ある場合には、入力ビデオ素材は、さらなる領域分割を必要としない一組の個
別分割、あるいは個々の分割と分割を必要とするビデオ素材の混合とからなる。
それゆえに、領域分割は本システムの重要な態様であるが、本システムによる領
域分割は本システムの全ての変形において必ずしも実行されるものではない。
構造である。記述子は簡単な数値、ベクトル、マトリックス、多次元数値単位、
Boolean値、テキスト記号列等である。記述子は、ビデオ素材に埋め込ま
れた記述子のような初期に作成された記述子の移入;信号分析や映像/音声コン
テンツの他の処理による記述子の抽出;手動入力;および他の記述子の一つ以上
の組からの公式ないしはアルゴリズム的導出を含む方法で生じる。本システムの
重要な特徴は、既存の記述子を足場にして追加記述子を容易に規定し、作成でき
る枠組を備えることである。しかし、本システムは実際の記述子仕様書に依存し
たり、限定されるものではない。
範囲に入る)かどうかに従って動画像セグメントを選定できる(すなわち、出力
ビデオ制作の一部に含まれる)。この機能は、入力ビデオ素材の動画像セグメン
トの種々のサブセットを選ぶことにより自動的に種々の出力ビデオ制作の定義を
可能にする。
グメントを配列することができる(すなわち、出力ビデオ制作を構成する順番で
順序づける)。例えば、動画像セグメントは低い値から高い値の順に、あるいは
任意の値からの距離の順に配列される。この機能は種々の方法で入力ビデオ制作
の動画像セグメントを配列することにより自動的に種々の出力ビデオ制作の定義
を可能にする。
オ制作を視聴できる。これは、例えば、図1および図2に示すGUIにおける“
プレイ”トランスポート制御をマウスでクリックすることにより遂行される。し
たがって、種々の出力ビデオ制作を視聴したい利用者は、記述子値と“プレイ”
トランスポート制御のクリックとによりビデオ素材を簡単に再選定や再配列でき
る。このような動作は多くの場合に各出力ビデオ制作に対して二回のマウスクリ
ックを伴う。利用者が自分の仕様要求に見合う出力ビデオ制作形態を見つけたな
ら(一般的に自動領域分割、選定および配列に加えて手動による調整を伴う)、
利用者はこの形態を最終出力ビデオ制作として送出する。本システムのある変形
では、この機能は、動画像セグメント間に画像遷移(例えば溶暗)と音声遷移(
例えばクロス−フェード)を挿入することを可能にする遷移発生器により補足さ
れる。これらの遷移は、出力ビデオ制作をより見易く、心地良く聴けるようにす
るのに役立つ。
により説明する。
変形のディスプレイの主要構成要素を示す。第一実施例による第一システム10
0のGUIは、図1aに示すようにグリッド画面102、モニタ画面104、お
よびアウトライン画面106を含む。
画面102は入力ビデオ素材(列108当り一つ)の動画像セグメントと記述子
の組(コラム110当り一つ)を示す。更に、特別コラム112を用いて動画像
セグメントの現選定および配列を利用者に見せる画像“早見表”を表示する。こ
れは、例えば、動画像セグメントの音声部の波形表示からなる一組の“音声早見
表”を表示する第二コラム114により補足される。記述子コラム110の各セ
ル116は一つの動画像セグメントに対する一つの値を示す。
、利用者は、コラム110を付加することで記述子を定義する。この記述子は前
述した四つの種類のどれかである。それゆえ、コラム110を明示して、初期に
作成した記述子の値の移入と表示;信号解析や画像/音声コンテンツの他の処理
により抽出された記述子の値の計算と表示;マニュアル記述子の値の入力と表示
;および公式やアルゴリズムにより他の記述子から得た記述子の値の計算と表示
、のどれかを可能にできる。第一システム100では、コラム110の目的を明
示するためのユーザインタフェイス機構は、利用者がコラムヘッダ上をマウスク
リックする時に現れるダイヤログボックスである。
に手動で値を入力し、記述子と関係する動画像セグメントに伝える。
オ制作に含めたり、排除する領域分割選定則を適用する。これはコラム9(“情
報コンテンツ”記述子)に図示され、ここでは動画像セグメント118を排除す
る。理由は、このような記述子に関して動画像セグメント118の値が所定の閾
値以下になり、一方で他の全ての動画像セグメントを選定するからである。この
動作を遂行するためのユーザインタフェイス機構は例えば、特定記述子用の“選
定”列120のセル内の一回のマウスクリックであり、その後にこのような記述
子を作る際に一つないしは、幾つかの制御選定をもたらす。選定則の仕様、例え
ば、閾値と、幾つかの記述子を選定プロセスで共に用いる場合に記述子を他の記
述子と論理的に組合せるべき方法は、利用者が同一セル内で右クリックする際に
ポップアップする一つ以上のダイヤログボックスのようなユーザインタフェイス
機構を通じて制御される。
、簡単な値による選別(例えば図1aのコラム6に示すように最低値から最高値
に)や距離による選別によって行われる。第一システム100では、ユーザイン
タフェイス機構は動画像セグメント選定のために記述したものに非常に類似する
。
オ制作を見るために使用される。モニタ画面104のトランスポート制御122
は標準的な機能の組:最初からの再生;現点からの再生;休止;停止;1フレー
ムだけの前進;1フレームだけの逆転;高速前進;および高速巻戻し、を使用可
能にする。他のシステム変形では、当業者に周知の追加のトランスポートおよび
ブラウジング制御、例えば“スクラブ制御”を組込む。
像セグメントの現選定および配列から生じる出力ビデオ制作のアウトラインを提
供する。システム変形は動画像セグメントをループモードで再生する運動アイコ
ンを使用でき、このような技術は当業者には周知である(付録Dに記述)。
の画面を作る。例えば、現選定設定によりフィルタされる動画像セグメントはグ
リッド画面102で灰色にされ、それゆえ、アウトライン画面106には現れな
い。別の事例として、出力ビデオ制作内の現位置はグリッド画面102とアウト
ライン画面106内の小さな三角形124により、且つ、モニタ画面104内の
あるフレーム126の存在により、三つの画面全てに表示される。利用者がプレ
イ制御122をクリックすると、出力ビデオ制作はモニタ画面104に示される
。同時に、小さな三角形124はグリッド画面102の右側下に、且つ、アウト
ライン画面106の上部に沿って動き、再生ビデオ素材の現位置を示す。
ッド画面102とアウトライン画面106の両方において直接に個々の動画像セ
グメントを操作できる。第一システム100により利用者は一つ以上の動画像セ
グメント上で直接に削除、挿入および再配置(例えばドラッグ・アンド・ドロッ
プにより)のような標準作業を遂行できる。再度、三つの画面102、104、
および106が密に相互動作して、ある画面内で実行した変更が他の画面に直ち
に反映される。
このGUIは第一システム100のGUIと多くの点で異なる。このような相違
の一つは、第二システム200のGUI内でグリッド画面202とモニタ画面2
03しか用いないことである。別の相違は、記述子が列204を形成し、動画像
セグメントがコラム206を形成するグリッド画面202と図1aのグリッド画
面102との間でのX軸とY軸の交換である。X軸は、距離の単位が時間の単位
を示す時間軸である。それゆえ、図1bでは、異なる期間の動画像セグメントは
異なる幅のコラム206をもたらし、一方で図1aの動画像セグメントは期間に
関らずに等しい間隔を割当てられる。ある記述子の値はグラフで表示される。更
に、記述子のあるものは単一動画像セグメントに対して多くの連続値を持つ時系
列(すなわち、時間内の種々の点、一般的には等時間間隔での値の組)に表示さ
れる。例えば、“テンポ”記述子208と“音声振幅”記述子210は時系列で
表示され、セグメント当り多くの値を持つ。対照的に、図1aのグリッド画面1
02内の各記述子は動画像セグメント当り単一の値を持つ。
た記述子値によりビデオ素材を再領域分割する機能がある。この事例では、“Y
オメガ”が記述子制御領域分割(“動画像セグメント”コラム212内の小さな
円214がこれを示す)として設定され、特にビデオ素材はYオメガの値の変化
に関して領域分割される。この種の動的領域分割を遂行するユーザインタフェイ
ス機構は、所定の記述子制御動画像セグメントを作るための“動画像セグメント
”コラム212内の左クリックと、領域分割則(値、最小動画像セグメント長等
の変更)を規定するためにダイヤログボックスを開くための右クリックとからな
る。
ント当り1以上のキーフレームにより表示する。また、音声コンテンツを一連の
音声早見表ではなく連続波形として表示する。更に、最終列216は出力ビデオ
制作内の各動画像セグメントの始動フレーム番号を示す。
。このような構成は、動画像セグメント当り複数のキーフレームがある水平方向
の一組のキーフレームとして画像をグリッド画面202に表示する場合に重要と
されない。
システム200のGUIは当業者に周知の別のユーザインタフェイス構成要素に
より補足される。これらの構成要素は幾種類ものソフトウエア・アプリケーショ
ン、例えばメニュ、スクロールバー、およびWindow系表示装置に一般に使
用される他の構成要素から得られる。また、使用される構成要素には、例えば、
時間−符合表示、個々の動画像セグメントの入力/出力点を再生し修正するポッ
プアップ画面、水平および垂直ズーミング、およびノンリニアビデオエディタに
用いる他の構成要素がある。更に、列とコラムを操作して挿入、除去、複写、分
割、カットおよび張付けのような構成要素と、グリッド状やテーブル状インタフ
ェイスによる他のプログラムとスプレッドシートとに用いる他の構成要素を使用
する。
者は幾つかの表示事例間を素早く切換えることができる。この表示は一組のデー
タで示される。これは、例えば第四システムに関係する一つのプログラムの複数
の事例を同時に運用可能にするか、あるいは図1aに示すグリッド画面102、
モニタ画面104、アウトライン画面106をプログラムの単一事例内で利用で
きるようにするかのどちらかによって支援される。このような場合に、データは
標準的な方法でカットや張付けのような事例間を転送される。これらのデータ転
送方法は、当業者には周知の用途プログラムの標準的な特徴である。
使用できる多数の機能を持つ。しかし、利用者が多くの場合に採用する工程の代
表的な順番がある。代表的な簡単なシナリオを図3のフローチャートに示す。利
用者は最初に本システム内にビデオ素材(“入力ビデオ素材”)を移入する(工
程302)。入力ビデオ素材が既に領域分割されていない場合(工程304の検
査のように)、利用者は本システムに入力ビデオ素材を、例えば画像ショット、
あるいは音声情報の形態に対応する動画像セグメントに領域分割させる(工程3
06)。利用者は、本システムにより与えられた(そうでなければ、本システム
から利用可能な)信号解析機能により本システムに記述子を自動的に抽出させる
(工程308)。次に、利用者は、本システムにこれらの記述子の一つ以上の値
を使用させて入力ビデオ素材の多数の動画像セグメントを選定させ、残りをフィ
ルタさせる(工程310)。例えば、利用者は、0.6未満の音声尤度量を持つ
入力ビデオ素材の全ての動画像セグメントをフィルタしたり、あるいは選定動画
像セグメントから20%以上異なる総合輝度を持つ全ての動画像セグメントをフ
ィルタする。
グメントを配列させる(工程312)。例えば、利用者は動画像セグメントの音
声コンテンツのピーク振幅を用いて動画像セグメントを「最も喧しい」から「最
も静か」に順序づける。次に、利用者は、本システムに先の工程から生じる順序
に選定動画像セグメントを再生させて(工程314)、入力ビデオ素材から作成
した新しい出力ビデオ制作を再生する。利用者は、この新しい出力ビオデ制作が
利用者の仕様要求に見合うかを調べ、その結果を視聴する。
この結果を新しい画像ファイルとして移入させ(工程318)、利用者の作業は
終了する。しかし、多くの場合、一般に結果が利用者の仕様要求に素早く見合う
ことはない。それゆえ、利用者は追加記述子を組込んだり作成する(工程320
)、あるいはビデオ素材の全てや一部を再領域分割する(工程322)、新しい
記述子値に基づく動画像セグメントを選定/配列する、結果を見る、より多くの
記述子を組込み形成するように循環して戻る等の反復プロセスに入る。追加記述
子は先に述べた任意の種類である。
程当り数個の簡単な利用者の作業(例えば、マウスクリック)を単に必要とする
。
、アウトライン画面106の個々の動画像セグメントの“ドラッギングやドロッ
ピング”により動画像セグメントを手動で選定し配列する。ビデオ素材を手動で
再領域分割する、すなわち、動画像セグメントの“イン”と“アウト”点を直接
に調整することも可能である。一般に、記述子値による選定および配列のプロセ
スが出力ビデオ制作の“ラフカット”を作成した後に、その結果をマニュアル作
業により微調整する。
部分を凍結し、他の部分を働かせる。例えば、ある動画像セグメント境界を凍結
し、再領域分割を適用する。選定と配列の両方にも凍結を適用する。ある動画像
セグメントあるいは、全動画像セグメントの領域分割選定状況を凍結するので、
任意数の動画像セグメントを任意長さにサブ配列できる。
セグメントに陰影をつけるように特定の色を用いるような機構により利用者に凍
結状態を表示する。例えば、図1aの列108や図1bのコラム206は適切な
色で陰影をつけられる。
前述した記述子の種類はその根源により四つの種類に分類される。
移入する。これらの記述子は動画像セグメントに連結されるテキストスクリプト
の動画像セグメントを含み、キーワード記述子として機能する。このような記述
子はまた、カメラ機器により作成した記述子、例えばタイム−オブ−シューティ
ング、焦点距離、カメラに取付けた衛星測位システム(例えばGPS)により作
成した地理的位置等を含む。更に、これらの記述子は本システムにより初期のセ
ッションからセーブされた記述子を含む。ある場合には、これらの記述子は移入
プロセスの一部として判読や変換を必要とする。例えば、重要なキーワードを記
述子に変換し、前置詞や接続詞のような接続語を捨てるためにスクリプトをフィ
ルタすることが望まれる。本システムは一組のこのような移入処理モジュールを
付属する。
の処理を適用することにより、入力ビデオ素材から記述子を抽出する。代表的な
事例はカラーヒストグラム、オーディオスペクトルグラム、聴覚強度量、物体境
界、動きベクトル、カテゴリ尤度量(例えば動画像セグメントXの音声コンテツ
が演説である確率)等である。このような多くの記述子は当業者には周知であり
、新しい記述子は常に定義される。
述子は統計と信号の他の一般的特性を表すが、利用者が最も興味を持ちそうな“
高レベル”意味情報の種類でない(付録Bに記述)。このような記述子を更に分
析して高レベルの意味情報を抽出する場合でさえも、結果は一般的に信頼性がな
い。例えば、利用者は入力ビデオ素材からビル・クリントンの全ショットや群集
の波の全ショットを識別したいが、自動的“ビル・クリントン検出器”は現に最
新技術を超えたものである。“人々の波検出器”は一般的に全く信頼性がなく、
つまり、このような検出器は高い割合で人々の波のショットを見失ったり、ある
いは高い割合で偽陽画(例えば、恐らく風の中で波打つ木)を与えたりする。
の特定信号処理アルゴリズムに限定されるものでなく、あるいはこれに左右され
るものでもない。第一に、本システムにより利用者は記述子値により入力ビデオ
素材のフィルタおよび/あるいは再配列の結果を“一瞥”できる。第二に、本シ
ステムは意味情報のより信頼性のある抽出を得るためにこの種の複数の記述子を
組合せる。それゆえ、本システムは、ソフトウエアモジュール(すなわち、一組
の命令)、ハードウエアモジュール、あるいはファームウエアモジュールとして
実行される任意の信号分析記述子を取込むことのできる枠組みである。信号分析
記述子を適用するプロセスでは、本システムは入力ビデオ素材の各動画像セグメ
ントに対するデータ要素あるいは、一組の要素を作る。ここでは、データ要素は
単一数、ベクトル、アレイ、Boolean値、文字列、構造、あるいは他の任
意データタイプの要素である。
より、信号分析記述子を作成でき、常に追加のプラグイン記述子を本システムに
付加できる。利用者は、例えば図1bのグリッド画面202の列のヘッダ上をク
リックし、且つ、全利用可能記述子のドロップダウン表から記述子を選定するこ
とにより常にこれらの記述子のどれかを利用できる。
ビデオ素材と入力ビデオ素材の編成とから直接に抽出できる。このような一つの
事例は、動画像セグメントの時間幅を記述子として使用する場合であり、別の事
例は、入力ビデオ素材内の動画像セグメントの配列を順序記述子(すなわち、第
一、第二、第三・・・第n)に変換する場合である。
を示すBoolean値である選定状態を各動画像セグメントが持つ場合である
。常に全動画像セグメントに対する選定状態の組を記述子に変換できる。このよ
うな選定状態の任意数の記述子を作成し、それにより利用者は後で初期の組の選
定に戻ることができる。
うな任意数の配列記述子を作成する場合である。全動画像セグメントに対する一
組の選定記述子と全動画像セグメントに対する一組の配列記述子の組合せは、ビ
デオ素材を再領域分割した場合を除くあらゆる場合に出力ビデオ制作を完全に作
成する。それゆえ、このような一対の記述子が作成されると、利用者は対の記述
子により形成された出力ビデオ制作のバージョンに後で素早く戻れる。これによ
り利用者は、初期バージョン(これらのバージョンが手動による処理を含む場合
に特に重要である)を捨てることなく互いに大きく異なる多くの可能性を利用し
、且つ、種々のバージョンを両者間で遅れを最小にして再生することにより種々
のバージョンを互いに比較できる。
記述子を作成することである。例えば、利用者は動画像セグメントがどれくらい
“幸せ”か、すなわち“最も幸せ”から“最も悲しい”まで、による配列で動画
像セグメントをドラッグ・アンド・ドロップできる。次に、利用者が配列記述子
を作成すると、記述子は事実上、“幸福”記述子になる(あるものは多くの場合
に全自動プロセスにより抽出できない)。このような記述子は実際に、あらゆる
意味で真の“幸福”記述子でない“幸福順序”を表す一組の値を与えるが、多く
の目的では、このような記述子は全く適切である。
述子であり、それゆえに、本システム内に手動で入力する必要のある記述子であ
る。この種の記述子は多くの意味記述子(例えば、図1aの“ジョージ”の存在
を示す記述子)とテキスチャ記述子(例えば、図1aの場所を示す記述子)を含
む。本システムはマニュアル記述子の数と種類を付加できることにより、例えば
、図1bのグリッド画面202内に新しい列を挿入することにより、この種の記
述子に対する入力を支援する。
る。高速伝搬は、一つ以上のマニュアル記述子が単一動画像セグメントに対して
割当てられた後に、これらの値を図4aおよび図4bのフローチャートに示すよ
うに関係組の動画像セグメントに素早く複製するプロセスに属する。このプロセ
スは、多数の動画像セグメント(表示により、代表的ムービは1000以上のシ
ョットがある)がある場合に重要であり、もしそうならば多数のマニュアル記述
子を伴う。
を用いて互いに近接する関係動画像セグメントをディスプレイ内(例えば、関係
するコラムを共に群らせるように、図1bのグリッド画面202内)に取入れ、
マニュアル記述子の値をこれらの関係動画像セグメントに容易に複製できる。
結果、新しいマニュアル記述子はディスプレイ内の近くにある動画像セグメント
に容易に複製される。この機構の変形では、本システムを操作して、一つ以上の
マニュアル記述子を全動画像セグメントに伝搬するもので、全動画像セグメント
に対してある自動記述子の値は所定の範囲内にある。
在しない(例えば、図1bの列として表れない)場合(工程402の検査)、利
用者は記述子を例示する(工程404)。それから、利用者は1領域分割(ソー
スセグメント)に対するマニュアル記述子に値を割当てる(工程406)。次に
、利用者は一つ以上の他の記述子を選んで再配列を制御する(工程408)。利
用者は主に、利用者が伝搬したいマニュアル記述子と何らかの相関性を持つと思
われる記述子を選ぶ。次に、利用者は他の記述子の値に従って本システムに動画
像セグメント全て、あるいは動画像セグメントのあるサブセットを再配列するよ
うに命令する(工程410)。その目的は類似の動画像セグメントをソースセグ
メント近くに運び、ソースセグメントからのそれらの差(一つ以上の記述子に関
して)により動画像セグメントを順序づけることである。
選定し、これら近くの動画像セグメントにソースセグメントのマニュアル記述子
の値を複製するように本システムに命令する(工程412)。
るが、工程408の再配列作業がこれらの動画像セグメントをソースセグメント
に類似のものと評価しないので近くに存在しない残りの動画像セグメントがある
場合(工程414)、利用者は工程408に戻って制御再配列に対して種々の記
述子を選ぶ。
る場合(工程416で検査)、利用者は工程406に戻る。
の隣接動画像セグメントへの伝搬に関係して詳しく述べる。マニュアル記述子の
値を検索する(工程420)。次に、マニュアル記述子の値が伝搬される隣接あ
るいは近隣の目標動画像セグメントのリストを得る(工程422)。このリスト
上の第一目標動画像セグメントを選定する(工程424)。ソースセグメントに
対するマニュアル記述子の値をこの目標動画像セグメントに複製する(工程42
6)。このリストの終端に達するかどうかに関して検査を行う(工程428)。
終端に達しない場合、このリスト上の次の目標動画像セグメントを選定し(工程
430)、本システムは工程426に戻る。
示したい特徴に漠然とのみ相関性のある場合でさえも有効である。類似の動画像
セグメントを集約する傾向のある任意の規則配列は、マニュアル記述子を入れる
場合に、この傾向が全く弱くても有用である。例として、利用者はある動画像セ
グメントを四つの記述子である“都市道路”、“冬”、“晴天”、および“人波
”で表示し、次にこの記述子や、その一部を他の動画像セグメントへの伝搬を望
む。これを達成するために、利用者は自動抽出カラー記述子(例えば、この場合
にカラーコントラスト;晴天、雪の道路画像は非常に高コントラストである故に
)と自動抽出動き記述子(例えば、振れる腕を示すこともある相関性のない運動
の多くの小領域)により動画像セグメントを配列する。利用者の希望は、ラベル
である“都市道路”、“冬”、“晴天”、および“人波”の一部や全てを適用す
る動画像セグメントを相応に高い割合に合成クラスタ化により分類することであ
る。今日の自動抽出記述子の厳しい制限にもかかわらず、多くの場合に、このプ
ロセスはマニュアル記述子入力作業を実質的に容易にするように十分に上手く働
き、必要ならば、利用者が個々の動画像セグメントの記述子を編集することによ
り改良できる第一近似を備える。
グメントとの間の差により順序配列する場合に特に有効である。この差は例えば
、n次元記述子空間内の任意の動画像セグメントからのユークリッド距離により
明示される。
義することにより新しい記述子の作成に役立つ。この組合せ方法は、変数として
一つ以上の他の記述子を含む公式として新しい記述子を定義する公式に従う。ま
た、この組合せ方法は、一つ以上の他の記述子から新しい記述子がどのように生
成されるかを述べる一組の指令として新しい記述子を定義するアルゴリズムに従
う。
ラーコントラスト記述子と特定動き記述子の加重和として定義する。一般的に利
用者は図1bに示すグリッド画面202の列のヘッダをクリックし、且つ、ダイ
ヤログボックス内に所要公式を入力することによりXを作成する。利用者が記述
子を定義し、関連ダイヤログボックスを閉じると、本システムはビデオの全動画
像セグメントに対してこの新しい記述子の値を計算し、列のセル内を更新値で満
たす。次に、利用者は本システムにこの新しい記述子の値をフィルタし、分類さ
せる。
のと同じ方式で定義済み組の公式とアルゴリズムから一つの公式を選定する。本
システムは記述子導出のために一組の最も標準的で有用な公式およびアルゴリズ
ムを提供する。
述子Xは雪を背景にしてアシが揺れる情景に対して所望の群集情景と同じ値の範
囲を与える。しかし、次に利用者は、群集情景(恐らく喧しい)と揺れるアシ(
恐らく静粛)の音声レベルには相当な差があることを知り、記述子Xを音声音量
記述子Lと組合せた別の記述子Yを作成することにより、この事実を活用する。
この組合せは公式(例えば、Y=L*X)に従うが、代りにYはアルゴリズムプ
ロセスから得た記号列である。例えば、((L>−15)と(X>1000))
であれば、 Y=“冬の道路における人波の動き”であり、 その他にはY=“ ”である。
することにより、利用者は入力ビデオ素材の意味要素に全く良い相関のある記述
子に到達できる。階層構造では、記述子を誘導型である他の記述子から引出す。
次に、これらの記述子を用いて画像の動画像セグメントを選定し配列し、あるい
は先の使用のためにビデオコンテンツを表示する新記述子を作る。例えば、記述
子“冬の道路における人波の動き”は画像ファイル保管用途に有用である。全て
の自動誘導記述子のように、これらの誘導記述子は完全で全体的に正確な意味を
記述することはめったにない。しかし、これらの誘導記述子は利用者がビデオ素
材や、利用者が改善する最終結果に対して素早く作成した近似の種々の構成配置
を調べるには少なくとも有効な方法になる。
テムでは、動画像セグメントは一時的に一片の入力ビデオ素材において任意時間
Xから後の任意時間Yにまで及ぶ。動画像セグメントは単一フレームから一片の
入力ビデオ素材の全長にまで任意長さで存在する。概して、動画像セグメントは
、ショット、情景等の視覚情報、あるいは画面外ナレーションの文章やパラグラ
フのような聴覚情報に基づく動画像セグメントから得た意味単位である。動画像
セグメントは任意の方法で互いに重複するので、このような重複を避けることが
望ましいけれども、入力ビデオ素材の部分は一つ以上の動画像セグメントに属す
ることになる。
行われる。外部から遂行されるビデオ素材の領域分割は本システムを使う前に行
われ、ビデオ素材を処理する。言換えれば、入力ビデオ素材は予め領域分割され
、その後で本システムに移入される。対照的に、内部から遂行される領域分割は
動的に行われる。すなわち、所望すれば、入力ビデオ素材は本システムの動作中
に何時でも再領域分割される。
、あるいは内部的に適用される。当業者に周知の共通技術はショット境界検出で
ある(付録Aに記述)。領域分割は音声情報を用いて、例えば、平均音声振幅が
閾値以下になるたびに新しい動画像セグメントを作成することにより、あるいは
演説対音楽を識別することにより(付録Bに記述)、あるいはスピーカの変化可
能性を認識することにより(付録Cに記述)行われる。
記述子上の動作として取扱う。このような場合に、領域分割動作を形成するのに
含まれるプロセスを図5にフローチャートとして示す。
の方法のどれかにより記述子を移入し、抽出し、手動入力し、あるいは生成する
。その後で、動画像セグメント用の基準として使用すべき一つ以上の有効記述子
を選ぶ(工程504)。この工程は図1bを引用して述べたGUIを通じて利用
者により制御可能である。
た一組の領域分割則から選ぶ(工程506)。これらは、選択記述子から点の内
外、すなわち、動画像セグメントの始点と終点の時間基準で動画像セグメントの
導出を支配する公式すなわち手続き則である。単一記述子用の一つの共通種類の
規則は記述子のどちらか、あるいは記述子の時間微分の一つの閾値交差である。
多くの場合に、この規則の適用は、明かな事象として計数するために閾値を交差
しなければならない量と期間を支配する規則で補足される必要がある。動画像セ
グメントが複数の記述子に基づく場合では、この規則は記述子の相互作用を含む
もので、例えば、全体の領域分割則は個々の記述子に対する規則に重ね合せたB
oolean AND、ORおよびNOT演算子の関数である。次に、選定ある
いは明示された領域分割則はビデオ素材を領域分割するために適用される(工程
508)。
最小時間に対して所定の閾値以下に落ち、その後で閾値を超えてクロスバックす
るたびに新しい動画像セグメントを作成するように領域分割則が定義される。別
の事例では、一組のカラーヒストグラム、動きベクトル、および他の視覚記述子
を明示し、ある公式においてこれらの記述子を組合せて新しい記述子Xを作り、
次にXの第二微分が閾値を超えるたびに新しい動画像セグメントを作成するとい
う規則によりビデオ素材を領域分割する。
リックスおよび記号列のような複雑な記述子をも用いて実行される。
用者が選定や配列、マニュアル記述子の作成、時系列記述子の動画像セグメント
当りの単一値(この後に詳述する)への減少のような他の種類の処理に進むと、
利用者は通常は領域分割において小さな変化のみを作る。この理由は、主要な再
領域分割、とりわけ自動領域分割が作成された選定/配列/記述子構造を変造し
がちだからである。それにもかかわらず、時にはプロセス内の後で主要な再領域
分割を行うことが必要になり、したがって、本システムは再領域分割の支援を行
う。再領域分割を支援する際に、二つのグループの内包する課題を検討する。
素材を初期の選定および配置処置により再構成するシナリオに適用すべきである
。 一般に、領域分割および再領域分割は、利用者が出力ビデオ制作に対してでなく
、入力ビデオ素材(すなわち、元の配列や流れにおける動画像セグメント)に適
用したいプロセスである。
選定/配列を作成するシナリオである。その後で、例えば利用者がショットをベ
ースにするよりもむしろ音声特性に基づくビデオ素材の領域分割を試みたいため
に、利用者はビデオ素材を再領域分割することを決める。実際、この場合に利用
者が望むことは入力ビデオ素材を元の配列に再領域分割することであり、しかし
、現出力ビデオ制作を含む選定/配列を損なうものではない。
テムは再領域分割後に現選定/配列を再適用することができず、あるいは、利用
者の期待する方法でそのようなことができない。それゆえ、利用者に警告をし(
工程602)、利用者に作業を取消させることが望ましい。利用者が先に進むこ
とに決めた場合、本システムは先ず全動画像セグメントの選定状態(SELCUR
)を維持する(工程604)。次に、本システムは現出力ビデオ制作を含む動画
像セグメント(SEQCUR)の組の配列を維持する(工程606)。
元の選定/配列状態、すなわち入力ビデオ素材の状態に復帰し(工程608)、
次に再領域分割を実行する(工程610)。その後に、本システムはSELCUR
を用いて先の選定状態を新しい組の動画像セグメントに適用し(工程612)、
その後で、SEQCURを用いて再領域分割の前に同じ方法で新しい組の動画像セ
グメントを配列する(工程614)。
、その結果は必ずしも利用者が期待するものでない。一般に、この技術は、再領
域分割が動画像セグメントの予め既存する組の始点と終点で比較的小さな調整を
伴う場合に成功するが、再領域分割が動画像セグメント位置や動画像セグメント
の総数に大きな変化を引起す場合には部分的にしか有効でない。
のグリッド画面がある(例えば、図1および図2それぞれにグリッド画面102
、202)。第一グリッド画面は入力ビデオ素材を元の状態で示し、第二グリッ
ド画面は現出力ビデオ制作を含む動画像セグメントを示す。それゆえに第一グリ
ッド画面を用いてビデオ素材を再領域分割し、第二グリッド画面では選定/配列
状態を操作し、追加記述子を作成/調整する。これらの画面を“同期”させ、第
一グリッド画面の動画像セグメントの変化を第二グリッド画面内に自動的に反映
させる。
バージョンである。第一グリッド画面は選定および配列コラムを持たないし、第
二グリッド画面は動画像セグメントコラムを持たない。また、一般的に両方の画
面に記述子の完全な組を示すことは望ましくなく、例えばマニュアル記述子を第
一グリッド画面から省く。利用者はこのような選択肢を好みにより制御する。
第六システムでは、三つの全ての動作、すなわち、領域分割、選定、および配列
は個々のグリッド画面で行われる。領域分割画面252は動画像セグメント境界
254(点線)を重畳した元の状態で入力ビデオ素材を示し、これらの動画像セ
グメント境界254を明示し調整するのに使用される。選定画面260はこれら
の動画像セグメントの各々の選定状態を示し、利用者にこれらの選定状態を変え
させる。配列画面270は出力ビデオ制作を含む新しい順序で選定動画像セグメ
ントを示し、利用者に配列を変えさせる。三つの画面の各々は特異な記述子の組
を持つことができる。これらの画面を同期させて、領域分割画面252で行う動
画像セグメントの変化を選定画面260と配列画面270内に反映させ、選定画
面260内で行う選定状態の変化を配列画面270内に反映させる。モニタ画面
280は領域分割画面、選定画面や配列画面から画像を再生できる。
画面の識別を行う。各画面内のスター292を用いて各画面内で行う作業の種類
が基準とする記述子を識別する。各画面内の実線294は各画面内の現在の位置
を示す。画面が利用者に活用されない場合、これはモニタ画面280に示すフレ
ームに対応する。
て知られる特別記述子を示す。セグメント番号記述子296は動画像セグメント
の順序数であり、本システムにより計算され自動的に表示される。スケールコラ
ム298は各画面内の最終コラムとして常に現れ、その各画面の各記述子に最大
値と最小値を与える。
けられ、これらの非選定動画像セグメントは図2cの配列画面270内に現れな
い。また、図2cの配列画面270では、記述子“D_ファジィG3”299は
その記述子に対する各セルの左下に表示される数字を含む。これらの値は対応動
画像セグメントに対する記述子D_ファジィG3の値を示す。
述子を作成した後にビデオ素材を再領域分割する場合に記述子を取扱う方法であ
る。この課題を説明するために、予め10個の動画像セグメントが存在するとこ
ろで再領域分割により一つの動画像セグメントをもたらす場合を検討する。10
個の動画像セグメントに対する個々の記述子の値、あるいはそれらの時間的範囲
は再領域分割中に失われる。新しい動画像セグメントが古い動画像セグメントを
クロスカットする場合、すなわち、動画像セグメント境界が再領域分割プロセス
において移動される場合にそれほど重大でないが潜在的に不要な事例が発生する
。このような場合に既存組の記述子値が持続されると、記述子値が新しく形成さ
れた動画像セグメントに正しく適用しないという危険性がある。
分割に適用する方法が幾つかある。例えば、抽出記述子と誘導記述子は、これら
の記述子が生成する定義、すなわち記述子を計算するのに必要な公式、アルゴリ
ズムや手順を含むので、再計算される。抽出記述子の場合に、新しい値は信号分
析により入力ビデオ素材から再計算され、誘導記述子の場合には、新しい値は他
の記述子から再計算される。
合せたりして“最良試み”理念により新しい組の動画像セグメントの値を作る。
例えば、10個の動画像セグメントが一つになる場合に、単一の新しい値は10
個の既存の組から自動的に誘導されなければならない。数値記述子では、これは
10個の平均値や、最大値あるいは最小値である。テキスト記号配列のような非
数値記述子では、これは10個の値の最初のもの、あるいは10個の最も共通の
ものである。この手法には多くの可能な変形があり、利用者が選定する選択肢と
して与えられる。
る場合に利用者に警告することが一般に望ましい。これにより利用者は先に進む
かどうかを決めることができ、利用者が先に進むことを決めると、後の検索を可
能にするために現状況をセーブするように利用者に促す。
し、すなわち、本システムは一組以上の動画像セグメント点を記述するデータと
これらの複数の動画像セグメントの各々に対する記述子の値を保持する。
の記述子に対する種々の組の動画像セグメント点を維持する。これは一般的に、
幾つかのマニュアル記述子がある場合に最も有効である。ある事例として、男性
が女性に続いて部屋に入り、男性が離れる前にしばらく二人が話すという配列の
画像ショットを検討する。この画像ショットが三つの記述子、“男性がいる”、
“女性がいる”、および“会話をする”により記述される場合、もし記述子が正
確に適用されるなら、これらの三つの記述子の時間的スパンが重なり合う。この
ようなシステムはこの事例のこれらの三つの記述子の各々に対する動画像セグメ
ント情報を維持する。この機能は動画像セグメント選定/配列と共同で実施され
る。例えば、“男性がいる”記述子が動画像セグメント選定に対して選ばれると
、入力ビデオ素材は自動的に領域分割されるので、“男性がいる”動画像セグメ
ントのインポイントは男性が入る正確な時間に設定されるし、アウトポイントは
男性が去る正確な時間に設定される。次に、“女性がいる”を動画像セグメント
選定において記述子として選ぶなら、この記述子に符合してこの画像ショットは
再領域分割される。
ト点をどのように作成するかという課題が持ちあがる。このような場合の解決策
はマニュアル領域分割、すなわち手動調整による領域分割にある。本システムは
、利用者が動画像セグメントを作成し、ビデオ素材を視聴する一方で、動画像セ
グメント・イン点および動画像セグメント・アウト点をフレーム精度すなわち良
い精度、例えば音声サンプル精度にまで調整するプロセスを行う。このプロセス
は周知のユーザインタフェイス技術により行われる。例えば、多数のノンリニア
ビデオエディタは利用者が“クリップ”を作成し、動画像セグメント・イン点お
よびアウト点を調整するような方法である。このプロセスは動画像セグメント間
にラインを移動することにより図1bのグリッド画面202内で直接に行われる
。例えば、利用者は先ず当該領域にズームし、次にマウスを動画像セグメントを
分離する垂直ライン218の一つに引張る。種々の記述子に対する種々の組の領
域分割点を支援する任意システムでは、このプロセスは個々の記述子に対して実
行される。言換えれば、図1bのグリッド画面202内の垂直ライン全体を移動
する代りに、利用者は本システムのグリッド画面内の特定記述子に対応する垂直
ラインの一部を移動するのみである。このような方法で動画像セグメント境界を
動かすことは一般的に入力ビデオ素材を再配列する前にのみ意味があり、その場
合に、グリッド画面内のラインの両側にある動画像セグメントは入力ビデオ素材
内の単一ショットの隣接部分である。
の“音声振幅”記述子210をセグメント当り一つの値を持つ記述子、例えば図
1bの“ショット長”記述子220に変換できる。このプロセスは削減の効用に
より支援され、利用者は削減用記述子を選択し、削減規則を選定できる。事例と
して、セグメント当りの単一値はそのセグメントに対する全時系列値の平均、時
系列値の最大値や最小値、あるいはこのような機能の他のものである。このプロ
セスを可能にするユーザインタフェイス機構は、例えば、利用者に列の最左にマ
ウスクリックすることにより図1bの列を選定させる。その後で、利用者は“セ
グメント当りの単一値に削減”の標題のメニュを選定し、ダイヤログボックスに
提示された幾つかの削減規則の一つを選定する。
セグメントであると同時に、ビデオ制作全体を構成する情景は別の動画像セグメ
ントとして存在し、この情景を構成するショット全体はまだより多数の動画像セ
グメントとして存在する。これらの動画像セグメントは全てディスプレイに同時
に表示され、この選択肢は本システム内で利用者に利用されるが、このことは次
の理由で好ましくはない。それは、階層構造の存在はビデオ素材を出力ビデオ制
作に複製させることになるからである。
れらを図7、図8aおよび図8bを参照して説明する。第一作業方法は図7のフ
ローチャートに示す上下分解プロセスと一致する。利用者は入力ビデオ素材を少
数の長い動画像セグメントに領域分割することにより始める(工程702)。利
用者は記述子をこれらの長い動画像セグメントに適用し(工程704)、工程7
06の検査で必要な場合に、長い動画像セグメントを短い動画像セグメントに細
分割する(工程708)。利用者が動画像セグメントを細分割する場合に、複製
のようなコンフリクトを避けるように“親”動画像セグメントを除去するか隠す
(工程710)。しかし、本システムが工程710の作業を行う前に、本システ
ムは細分割作業中に親動画像セグメントの記述子値を“子供”動画像セグメント
全てに伝搬させることにより細分割を支援する(工程712)。本システムは更
に、抽出記述子と誘導記述子のどれか、あるいは全てを子供セグメントに対して
それぞれ再計算する作業を行う(工程714と工程716)。子供セグメントへ
の細分割は自動あるいはマニュアル領域分割プロセスである。
と一致する。このプロセスは、一般に多くの短いセグメントであり、且つ、記述
子を例示し、且つ、ビデオ制作を形成するように選定と配列が施される多数の動
画像セグメントを含むシナリオにより図8aを参照して説明する。この分解プロ
セスの目的は親セグメントを形成するために動画像セグメントのグループを共に
併合し、それにより出力ビデオ制作の描写を簡素化することである。
た一組の動画像セグメントに領域分割する(工程802)。利用者は前述の選定
および配列プロセスにより出力ビデオ制作を作成する(工程804)。その後に
、利用者は被併合の一組の子供セグメントを選ぶ(工程806)。ここで選ばれ
たセグメントは現出力ビデオ制作内に隣接する。続いて、利用者は本システムに
命令して動画像セグメントを併合させ、親セグメントを形成する(工程808)
。
ントを形成するように併合された前記一組の子供セグメントを除去するか隠す(
工程810)。利用者は必要な場合には種々のグループの隣接動画像セグメント
の併合を継続する(工程812)。
明する。本システムは併合される動画像セグメントのリストを作る(工程820
)。その後で、本システムは子供セグメントを連結することにより親セグメント
を作成する(工程822)。特に、本システムは、第一子供セグメントの始動時
間に等しく、且つ、その持続期間は子供セグメント全ての持続期間の和に等しい
出力ビデオ制作始動時間を持つ新しい動画像セグメントを作成する。
子を再計算する(工程824)。次に、移入されたマニュアル記述子の場合には
、本システムは各子供セグメント内の対応記述子の値から親セグメントに対する
各記述子の値を引出す(工程826)。この作業は幾つかのユーザ選択可能方法
の一つにより行われる。例えば、数値記述子の場合には、平均値を用いるし、記
号列記述子の場合には、子供セグメントの組に頻繁に見られる記号列の値を選ぶ
のが好ましい選択肢である。この作業中に情報が若干失われことがあり、利用者
は簡単な描写のために入換えを容認する。
を割当てられると、本システムは親セグメントに対する誘導記述子の組を計算す
る(工程828)。
プロセスで主に始め、続いて、利用者が出力ビデオ制作を作成するときに逆さ分
解プロセスに進むことにより利用者は両方の作業方法を用いる。
ために動画像セグメントを併合および非併合するような可能性が追加され、それ
で利用者は子供セグメントを単一親セグメントに畳込み、その後で親セグメント
を再び子供セグメントとして解体し、異なるが一般的に関連した記述子は階層構
造の各レベル内に存在する。この種のマルチレベル描写が本システムのデータ構
造内に蓄積されると、利用者が併合図と分解図の間を交互に行き交うときに、デ
ータの紛失もなく、本システムがデータを再計算する必要もなくなる。
せることができ、ひとつは親セグメントが入力ビデオ素材内で隣接する一組の子
供セグメントからなる入力ビデオ素材の階層と、もう一つは動画像セグメントの
代替階層クラスタ化を示す階層である。例えば、動画像セグメントの代替クラス
タ化は、親セグメントが一つの可能な出力ビデオ制作内に隣接する一組の子供セ
グメントからなる一つ以上の可能な出力ビデオ制作に対応する。
ある。動画像セグメントが出力ビデオ制作に現れる領域選定を明示する。デフォ
ルトにより、全ての動画像セグメントが選定されるが、これらの動画像セグメン
トが選定されなければ、出力ビデオ制作から動画像セグメントが排除される。
子値により自動的に、あるいは手動で遂行される。マニュアル選定の場合に、選
択か選択されないかどうかの選定状態は、例えば図1bのグリッド画面202の
動画像セグメントコラムの最上部を右クリックし、“選定動画像セグメント”や
“非選定動画像セグメント”選択肢のどちらかを選ぶことにより制御される。
明する。このプロセスは記述子の組込みや作成、およびこのような記述子の一つ
以上の選択に影響して選定プロセスを制御する(工程902)。次に、記述子値
が選定決定に変換する方法を支配する規則を形成する(工程904)。代表的な
領域分割規則は整合選定則であり、記述子の値が任意目標値に正確に整合する場
合に動画像セグメントを選定するものである。別の代表的規則は近接選定則であ
り、記述子の値が所定の制限量未満だけ任意の目標値と異なる場合にセグメント
を選定するものである。更に、一般的な規則は範囲選定則であり、記述子の値が
任意の範囲内に入る場合にセグメントを選定するものである。
D、ORおよびNOTと組合せることにより複数記述子の値次第で行われる。
ステムにより識別し(工程906)、この識別セグメントの記述子値が選定則に
よる基準を満たす場合に検査する(工程908)。識別セグメントの記述子値が
基準を満たすかどうかに依って、識別セグメントを“選定”(工程910)、あ
るいは“未選定”(工程912)と印す。次に、本システムは印付きセグメント
が選定則に対して検査される最終セグメントであるかを調べる(工程914)。
別の未検査セグメントがあれば、本システムはこのセグメントを識別し(工程9
16)、その後で工程908に戻る。
マトリックスおよび記号列のようなより複雑な記述子をも用いることができる。
る。動画像セグメント配列は出力ビデオ制作内の動画像セグメントの順序である
。何時でも、現出力ビデオ制作は現配列内の選定セグメントの組からなる。現配
列は動画像セグメントが図1bのグリッド画面202および図1aのアウトライ
ン画面106内で左から右に現れる順序である。
列づけの場合に、その順序は動画像セグメントをドラッグしたりドロップするよ
うな作業により確定される。例えば、図1bのグリッド画面202内のセグメン
トコラムの最上部をクリックし、このコラムを別の場所に水平にドラッグするこ
とにより、マニュアル配列づけを行う。
して説明する。このプロセスは記述子の組込みや作成に、且つ、一つ以上の記述
子の選択に影響し、配列づけプロセスを制御する(工程950)。記述子値が配
列づけ決定に変換する方法を支配する規則を定義する(工程952)。代表的規
則は値による分類則であり、動画像セグメントを記述子の値、例えば最低値から
最高値にまで、あるいはその逆により選別する。別の代表的規則は距離による分
類則であり、記述子値が任意目標値とどの程度異なるか、例えば単一数値差やユ
ークリッド距離により動画像セグメントを選別する。この規則を用い、動画像セ
グメントの目標セグメントとの類似性により動画像セグメントを選別するときに
、この規則は特に強力である。
れる。複数記述子配列づけ機能は前述の公式/アルゴリズム方式の記述子を組合
せて行われる。配列づけ機構は、配列づけが先ず一つの記述子の値により確定さ
れる階層的分類を伴い、第一記述子が多くの動画像セグメントに対して同じ値を
持つ場合に他の記述子に頼る。これは語をアルファベットで選別する、すなわち
、語を第一文字に基づいて選別し、次にその範囲内で第二文字に基づいて選別す
るプロセスに類似している。
54)。この順序にセグメントをつなぎ合わせて出力ビデオ制作を作る(工程9
56)。
ル、マトリックスおよび記号列のようなより複雑な記述子をも用いることができ
る。
特に、図1から図10を参照して説明した本システムの機能性や処理はソフトウ
エアや計算機プログラムとして計算機上で実行される。ビデオ制作のための本シ
ステムと方法は計算機により実行されるソフトウエア内の指令により実行される
。このソフトウエは処理工程を実施する一つ以上のモジュールとして実行される
。モジュールは特定機能や関連機能を通常行う計算機プログラムの一部である。
更に、先に説明したように、モジュールは他の構成要素やモジュール用に使うパ
ッケージ機能性ハードウエアユニットである。
記憶される。ソフトウエアは計算機読取り可能媒体から計算機に装填され、次に
計算機により実行される。計算機プログラム製品は計算機読取り可能媒体を含み
、この媒体上に計算機により実行されるソフトウエアや計算機プログラムを記録
する。計算機内で計算機プログラム製品を使用する効果は、本発明の実施例に従
って低データ伝送速度、且つ、理解できる音声通信を備えた装置を提供できるこ
とである。
脱することなく他の構成形態を用いることもできる。実施例を実行する計算機は
IBM−PC/ATs、Macintosh(商標)PCsファミリの一つ、S
un Sparcstation(商標)、ワークステーション等を含む。前述
の計算機は、本発明の実施例を実行する単なる代表的な種類にすぎない。一般的
に、この後に述べる実施例のプロセスは計算機読取り可能媒体としてハードディ
スク駆動装置(図11にブロック29として示した)に記録され、プロセッサ3
0により読取り制御されるソフトウエアすなわちプログラムとして内在する。プ
ログラムおよびデータの中間記憶装置は、おそらくハードディスク駆動装置29
と同調した半導体メモリ31により達成される。
で一般的に示した)上に符号化されたプログラムを利用者に供給し、あるいは、
例えば、計算機に接続されたモデム装置経由でネットワークから利用者が読取る
ことができる。更に、このソフトウエアは、磁気テープ、ROMや集積回路、光
磁気ディスクを含む他の計算機読取り可能媒体、計算機と別の装置間の無線や赤
外線伝送チャネル、PCMCIAカードのような計算機読取り可能カード、およ
びeメールや、ウェブサイト等に記録された情報を含むインタネットとイントラ
ネットから計算機システム28に装填される。前記媒体は単なる代表的な適切な
計算機読取り可能媒体である。他の計算機読取り可能媒体は本発明の範囲と精神
から逸脱することなく実際に使用される。
する方法、システム、および計算機プログラム製品について開示されている。多
数の実施例が説明されている。しかし、この開示に鑑みて、多数の変化および/
あるいは変更が本発明の範囲と精神から逸脱しないで行われ得ることは当業者に
は明らかである。
。
。
。
。
ある。
ャートである。
フローチャートである。
ャートである。
ートである。
ートである。
ートである。
。
像セグメントの現選定および配列から生じる出力ビデオ制作のアウトラインを提
供する。システム変形は動画像セグメントをループモードで再生する運動アイコ
ンを使用でき、このような技術は当業者には周知である。
述子は統計と信号の他の一般的特性を表すが、利用者が最も興味を持ちそうな“
高レベル”意味情報の種類でない。このような記述子を更に分析して高レベルの
意味情報を抽出する場合でさえも、結果は一般的に信頼性がない。例えば、利用
者は入力ビデオ素材からビル・クリントンの全ショットや群集の波の全ショット
を識別したいが、自動的“ビル・クリントン検出器”は現に最新技術を超えたも
のである。“人々の波検出器”は一般的に全く信頼性がなく、つまり、このよう
な検出器は高い割合で人々の波のショットを見失ったり、あるいは高い割合で偽
陽画(例えば、恐らく風の中で波打つ木)を与えたりする。
、あるいは内部的に適用される。当業者に周知の共通技術はショット境界検出で
ある。領域分割は音声情報を用いて、例えば、平均音声振幅が閾値以下になるた
びに新しい動画像セグメントを作成することにより、あるいは演説対音楽を識別
することにより、あるいはスピーカの変化可能性を認識することにより行われる
。
Claims (99)
- 【請求項1】 動画像セグメントを処理するシステムであって、 記述子を作成し、対応する動画像セグメントの少なくとも一つの値をこの記述
子に特有のものにする手段と、 少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる手段で、
前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の値
によって前記少なくとも二つの動画像セグメントを選定する手段および前記少な
くとも二つの動画像セグメントに対応する少なくとも一つの記述子の値によって
前記少なくとも二つの動画像セグメントを配列する手段を含む手段と、を含むシ
ステム。 - 【請求項2】 更に、少なくとも一つのグリッドを表示する手段を含み、前
記少なくとも一つのグリッドの各々が基準として第一軸用に前記少なくとも二つ
の動画像セグメントの表現と第二軸用に前記少なくとも二つの動画像セグメント
に対応する前記少なくとも一つの記述子とを持ち、前記少なくとも一つのグリッ
ド内の各セルが前記少なくとも二つの動画像セグメントの一方に対応する前記少
なくとも一つの記述子の一つに特有の少なくとも一つの値の表現を表示する請求
項1に記載のシステム。 - 【請求項3】 前記少なくとも一つのグリッドが複数の列を含み、前記複数
の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
一つに示される請求項2に記載のシステム。 - 【請求項4】 前記少なくとも一つのグリッドが更に、第一および第二グリ
ッドを含み、ビデオ素材を前記システムに入力すると、前記第一グリッドが前記
入力ビデオ素材を実質的に元の状態で表現し、第二グリッドが前記出力ビデオ制
作物を表現し、且つ、前記第一グリッドへの変化が前記第二グリッドへ対応する
変化を引起す請求項3に記載のシステム。 - 【請求項5】 更に、動画像セグメント間に遷移を作成する手段を含む請求
項1に記載のシステム。 - 【請求項6】 遷移を作成する前記手段が動画像セグメント間で動画像分解
あるいは音声クロスフェードを作成する手段を含む請求項5に記載のシステム。 - 【請求項7】 記述子を作成する前記手段が前記システムへの移入の前に記
述子とこの記述子に特有の少なくとも一つの値とを移入する手段を含む請求項1
に記載のシステム。 - 【請求項8】 記述子を作成する前記手段が動画像コンテンツあるいは音声
コンテンツの信号分析を前記動画像セグメントに適用することにより動画像セグ
メントに対応する記述子の値を抽出する手段を含む請求項1に記載のシステム。 - 【請求項9】 記述子を作成する前記手段が前記少なくとも二つの動画像セ
グメント内のその位置に従って順序数を割当てることにより前記少なくとも二つ
の動画像セグメントの一方に対応する記述子の値を作成する手段を含む請求項1
に記載のシステム。 - 【請求項10】 少なくとも一つの値を記述子に特有のものにする前記手段
が少なくとも一つの他の記述子に対する基準を持つ公式ないしはアルゴリズムを
含む請求項1に記載のシステム。 - 【請求項11】 更に、前記システムに入力されたビデオ素材を動画像セグ
メントに領域分割する手段を含み、前記手段が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
像セグメントとして表現する手段と、 前記識別手段が基づく少なくとも一つの記述子を選択する手段と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する手段とを含む
請求項1に記載のシステム。 - 【請求項12】 前記領域分割手段が第一組の動画像セグメントを第二組の
動画像セグメントに再領域分割する手段を含む請求項11に記載のシステム。 - 【請求項13】 前記領域分割手段が更に、前記第一組の動画像セグメント
に対応する記述子の値を選択的に複製したり結合することによって、前記第二組
の動画像セグメントの各々に対応する前記記述子の値を生成する手段を含む請求
項12に記載のシステム。 - 【請求項14】 前記領域分割手段が前記少なくとも一つの記述子の各々に
対して種々の組の動画像セグメントを識別し表現する手段を含む請求項11に記
載のシステム。 - 【請求項15】 更に、前記システムに入力されたビデオ素材を、利用者の
直接操作により動画像セグメントの始点と終点の定義あるいは調整を可能にする
ことで、動画像セグメントに領域分割する手段を含む請求項1に記載のシステム
。 - 【請求項16】 更に、前記少なくとも二つの動画像セグメントの一方に対
応する記述子の複数の時間的連続値から単一値を生成する手段を含む請求項1に
記載のシステム。 - 【請求項17】 更に、単一動画像セグメントを複数の動画像セグメントに
細分割する手段を含み、前記単一動画像セグメントに対応する記述子の値を漸進
的分解により前記複数の動画像セグメントに対応する記述子に複製する請求項1
に記載のシステム。 - 【請求項18】 更に、複数の動画像セグメントを単一動画像セグメント内
に集めることにより前記複数の動画像セグメントを併合する手段を含み、前記単
一動画像セグメントに対応する記述子の値を前記複数の動画像セグメントに対応
する記述子の値から生成する請求項1に記載のシステム。 - 【請求項19】 更に、前記出力ビデオ制作物の再生を行う手段を含む請求
項1に記載のシステム。 - 【請求項20】 前記選定手段が、前記少なくとも一つの記述子の値が目標
値の範囲内に実質的にあるかどうかによって、前記少なくとも二つの動画像セグ
メントを選定する請求項1に記載のシステム。 - 【請求項21】 前記選定手段が更に、利用者の直接操作により前記少なく
とも二つの動画像を手動で選定する手段を含む請求項1に記載のシステム。 - 【請求項22】 前記配列づけ手段が前記少なくとも一つの記述子の値と目
標値の間の差に従って前記少なくとも二つの動画像セグメントを順序づける請求
項1に記載のシステム。 - 【請求項23】 前記配列づけ手段が更に、利用者の直接操作により前記少
なくとも二つの動画像セグメントを手動で配列づけする手段を含む請求項1に記
載のシステム。 - 【請求項24】 動画像セグメントを処理する方法であって、 記述子を作成し、対応する動画像セグメントの少なくとも一つの値をこの記述
子に特有のものにする工程と、 少なくとも二つの動画像セグメントから出力ビデオ制作物を組立てる工程とを
含み、前記組立工程が、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
値に従って前記少なくとも二つの動画像セグメントを選定する工程と、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
値に従って前記少なくとも二つの動画像セグメントを配列づけする工程とを含む
方法。 - 【請求項25】 更に、少なくとも一つのグリッドを表示する工程を含み、
前記少なくとも一つのグリッドの各々が基準として第一軸用に前記少なくとも二
つの動画像セグメントの表現と第二軸用に前記少なくとも二つの動画像セグメン
トに対応する前記少なくとも一つの記述子とを有するもので、前記少なくとも一
つのグリッド内の各セルが前記少なくとも二つの動画像セグメントの一方に対応
する前記少なくとも一つの記述子の一つに特有のものにした少なくとも一つの値
の表現を表示する請求項24に記載の方法。 - 【請求項26】 前記少なくとも一つのグリッドを表示する前記工程が複数
の列を表示する工程を含み、前記複数の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
一つに示される請求項25に記載の方法。 - 【請求項27】 前記少なくとも一つのグリッドを表示する前記工程が第一
および第二グリッドを表示する工程を含み、入力ビデオ素材が与えられると、前
記第一グリッドが前記入力ビデオ素材を実質的に元の状態で表現し、第二グリッ
ドが前記出力ビデオ制作物を表現し、前記第一グリッドへの変化が前記第二グリ
ッドへ対応する変化を引起す請求項26に記載の方法。 - 【請求項28】 更に、動画像セグメント間に遷移を作成する工程を含む請
求項24に記載の方法。 - 【請求項29】 遷移を作成する前記工程が動画像セグメント間で動画像分
解あるいは音声クロスフェードを作成する工程を含む請求項28に記載の方法。 - 【請求項30】 記述子を作成する前記工程が前記システムへの移入の前に
記述子とこの記述子に特有の少なくとも一つの値とを移入する工程を含む請求項
24に記載の方法。 - 【請求項31】 記述子を作成する前記工程が動画像コンテンツあるいは音
声コンテンツの信号分析を前記動画像セグメントに適用することにより動画像セ
グメントに対応する記述子の値を抽出する工程を含む請求項24に記載の方法。 - 【請求項32】 記述子を作成する前記工程が前記少なくとも二つの動画像
セグメント内のその位置に従って順序数を割当てることにより前記少なくとも二
つの動画像セグメントの一方に対応する記述子の値を作成する工程を含む請求項
24に記載の方法。 - 【請求項33】 少なくとも一つの値を記述子に特有のものにする前記工程
が少なくとも一つの他の記述子に対する基準を持つ公式ないしアルゴリズムによ
り前記少なくとも一つの値を前記記述子に特有のものにする工程を含む請求項2
4に記載の方法。 - 【請求項34】 更に、入力ビデオ素材を動画像セグメントに領域分割する
工程を含み、前記工程が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
像セグメントとして表現する工程と、 前記識別手段が基づく少なくとも一つの記述子を選択する工程と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する工程とを含む
請求項24に記載の方法。 - 【請求項35】 領域分割する前記工程が第一組の動画像セグメントを第二
組の動画像セグメントに再領域分割する工程を含む請求項34に記載の方法。 - 【請求項36】 領域分割する前記工程が更に、前記第一組の動画像セグメ
ントに対応する前記記述子の値を選択的に複製したり結合することで前記第二組
の動画像セグメントの各々に対応する記述子の値を引出す工程を含む請求項35
に記載の方法。 - 【請求項37】 領域分割する前記工程が前記少なくとも一つの記述子の各
々に対して種々の組の動画像セグメントを識別し表現する工程を含む請求項34
に記載の方法。 - 【請求項38】 更に、利用者の直接操作により動画像セグメントの始点と
終点の定義や調整を可能にすることで入力ビデオ素材を動画像セグメントに領域
分割する工程を含む請求項24に記載の方法。 - 【請求項39】 更に、前記少なくとも二つの動画像セグメントの一方に対
応する記述子の複数の時間連続値から単一値を引出す工程を含む請求項24に記
載の方法。 - 【請求項40】 更に、単一動画像セグメントを複数の動画像セグメントに
細分割する工程を含み、前記単一動画像セグメントに対応する記述子の値を漸進
分解により前記複数の動画像セグメントに対応する記述子に複製する請求項24
に記載の方法。 - 【請求項41】 更に、前記複数の動画像セグメントを単一動画像セグメン
ト内に集めることにより複数の動画像セグメントを併合する工程を含み、前記単
一動画像セグメントに対応する記述子の値を前記複数の動画像セグメントに対応
する記述子の値から引出す請求項24に記載の方法。 - 【請求項42】 更に、前記出力ビデオ制作物を再生する工程を含む請求項
24に記載の方法。 - 【請求項43】 前記選定工程が前記少なくとも一つの記述子の値が目標値
の範囲内に実質的にあるかどうかによって前記少なくとも二つの動画像セグメン
トを選定する工程を含む請求項24に記載の方法。 - 【請求項44】 前記選定工程が利用者の直接操作により前記少なくとも二
つの動画像セグメントを手動で選定する工程を含む請求項24に記載の方法。 - 【請求項45】 前記配列づけ工程が前記少なくとも一つの記述子の値と目
標値の間の差に従って前記少なくとも二つの動画像セグメントを順序づける工程
を含む請求項24に記載の方法。 - 【請求項46】 前記配列づけ工程が更に、利用者の直接操作により前記少
なくとも二つの動画像セグメントを手動で配列づけする工程を含む請求項24に
記載の方法。 - 【請求項47】 動画像セグメントを処理する計算機プログラム製品であっ
て、 動画像セグメントを処理する計算機使用可能媒体に具現化した計算機読取り可
能プログラムコード手段を有する前記媒体を含み、 記述子を作成し、対応する動画像セグメントに対する少なくとも一つの値をこ
の記述子に特有のものにする計算機読取り可能プログラムコード手段と、 前記少なくとも二つの動画像セグメントに対応する少なくとも一つの記述子の
値によって前記少なくとも二つの動画像セグメントを選定する計算機読取り可能
プログラムコード手段、および前記少なくとも二つの動画像セグメントに対応す
る少なくとも一つの記述子の値によって前記少なくとも二つの動画像セグメント
を配列づけする計算機読取り可能プログラムコード手段を含む、少なくとも二つ
の動画像セグメントから出力ビデオ制作物を組立てる計算機読取り可能プログラ
ムコード手段と、を有する計算機プログラム製品。 - 【請求項48】 更に、少なくとも一つのグリッドを表示する計算機読取り
可能プログラムコード手段を含み、前記少なくとも一つのグリッドの各々が基準
として第一軸用に前記少なくとも二つの動画像セグメントの表現と第二軸用に前
記少なくとも二つの動画像セグメントに対応する前記少なくとも一つの記述子と
を持ち、前記少なくとも一つのグリッド内の各セルが前記少なくとも二つの動画
像セグメントの一方に対応する前記少なくとも一つの記述子の一つに特有のもの
にした少なくとも一つの値の表現を表示する請求項47に記載の製品。 - 【請求項49】 前記少なくとも一つのグリッドを表示する前記計算機読取
り可能プログラムコード手段が複数の列を表示する計算機読取り可能プログラム
コード手段を含み、前記複数の列が、 前記少なくとも二つの動画像セグメントを視覚的に表現する列と、 前記少なくとも二つの動画像セグメントの音声コンテンツを視覚的に表現する
列と、 前記少なくとも二つの動画像セグメントの一方に対応する記述子の複数の値の
時系列グラフ表現を行う列とを含み、 前記少なくとも二つの動画像セグメントの各々の時間存続範囲が前記複数列の
一つに示される請求項47に記載の製品。 - 【請求項50】 前記少なくとも一つのグリッドを表示する前記計算機読取
り可能プログラムコード手段が更に、第一および第二グリッドを表示する計算機
読取り可能プログラムコード手段を含み、入力ビデオ素材が与えられると、前記
第一グリッドが前記入力ビデオ素材を実質的に元の状態で表現し、第二グリッド
が前記出力ビデオ制作物を表現し、前記第一グリッドへの変化が前記第二グリッ
ドへ対応する変化を引起す請求項49に記載の製品。 - 【請求項51】 更に、動画像セグメント間に遷移を作成する計算機読取り
可能プログラムコード手段を含む請求項47に記載の製品。 - 【請求項52】 遷移を作成する前記計算機読取り可能プログラムコード手
段が動画像セグメント間で動画像分解あるいは音声クロスフェードを作成する計
算機読取り可能プログラムコード手段を含む請求項51に記載の製品。 - 【請求項53】 記述子を作成する前記計算機読取り可能プログラムコード
手段が前記システムへの移入の前に記述子とこの記述子に特有のものにした少な
くとも一つの値とを移入する計算機読取り可能プログラムコード手段を含む請求
項47に記載の製品。 - 【請求項54】 記述子を作成する前記計算機読取り可能プログラムコード
手段が動画像コンテンツあるいは音声コンテンツの信号分析を前記動画像セグメ
ントに適用することにより動画像セグメントに対応する記述子の値を抽出する計
算機読取り可能プログラムコード手段を含む請求項47に記載の製品。 - 【請求項55】 記述子を作成する前記計算機読取り可能プログラムコード
手段が前記少なくとも二つの動画像セグメント内のその位置に従って順序数を割
当てることにより前記少なくとも二つの動画像セグメントの一方に対応する記述
子の値を作成する計算機読取り可能プログラムコード手段を含む請求項47に記
載の製品。 - 【請求項56】 少なくとも一つの値を記述子に特有のものにする前記計算
機読取り可能プログラムコード手段が少なくとも一つの他の記述子に対する基準
を持つ公式ないしはアルゴリズムにより前記少なくとも一つの値を前記記述子に
特有のものにする計算機読取り可能プログラムコード手段を含む請求項47に記
載の製品。 - 【請求項57】 更に、入力ビデオ素材を動画像セグメントに領域分割する
計算機読取り可能プログラムコード手段を含み、前記計算機読取り可能プログラ
ムコード手段が、 前記入力ビデオ素材内の少なくとも一つの時間領域を識別し、前記領域を動画
像セグメントとして表現する計算機読取り可能プログラムコード手段と、 前記識別手段が基づく少なくとも一つの記述子を選択する計算機読取り可能プ
ログラムコード手段と、 前記識別手段を支配する少なくとも一つの領域分割則を定義する前記計算機読
取り可能プログラムコード手段とを含む請求項47記載の製品。 - 【請求項58】 領域分割用の前記計算機読取り可能プログラムコード手段
が第一組の動画像セグメントを第二組の動画像セグメントに再領域分割する計算
機読取り可能プログラムコード手段を含む請求項57に記載の製品。 - 【請求項59】 領域分割する前記計算機読取り可能プログラムコード手段
が更に、前記第一組の動画像セグメントに対応する記述子の値を選択的に複製し
たり結合することによって、前記第二組の動画像セグメントの各々に対応する前
記記述子の値を引出す計算機読取り可能プログラムコード手段を含む請求項58
に記載の製品。 - 【請求項60】 領域分割する前記計算機読取り可能プログタムコード手段
が前記少なくとも一つの記述子の各々に対して種々の組の動画像セグメントを識
別し表現する計算機読取り可能プログラムコード手段を含む請求項47に記載の
製品。 - 【請求項61】 更に、利用者の直接操作により動画像セグメントの始点と
終点の定義あるいは調整を可能にすることで入力ビデオ素材を動画像セグメント
に領域分割する計算機読取り可能プログラムコード手段を含む請求項57に記載
の製品。 - 【請求項62】 更に、前記少なくとも二つの動画像セグメントの一方に対
応する記述子の複数の時間的連続値から単一値を生成する計算機読取り可能プロ
グラムコード手段を含む請求項47に記載の製品。 - 【請求項63】 更に、単一動画像セグメントを複数の動画像セグメントに
細分割する計算機読取り可能プログラムコード手段を含み、前記単一動画像セグ
メントに対応する記述子の値を漸進的分解により前記複数の動画像セグメントに
対応する記述子に複製する請求項47に記載の製品。 - 【請求項64】 更に、複数の動画像セグメントを単一動画像セグメント内
に集めることにより前記複数の動画像セグメントを併合する計算機読取り可能プ
ログラムコード手段を含み、前記単一動画像セグメントに対応する記述子の値を
前記複数の動画像セグメントに対応する記述子の値から引出す請求項47に記載
の製品。 - 【請求項65】 更に、前記出力ビデオ制作物の再生を行う計算機読取り可
能プログラムコード手段を含む請求項47に記載の製品。 - 【請求項66】 前記少なくとも二つの動画像セグメントに対応する少なく
とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを選定す
る前記計算機読取り可能プログラムコード手段が前記少なくとも一つの記述子が
目標値の範囲内に実質的にあるかどうかに従って前記少なくとも二つの動画像セ
グメントを選定する計算機読取り可能プログラムコード手段を含む請求項47に
記載の製品。 - 【請求項67】 前記少なくとも二つの動画像セグメントに対応する少なく
とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを選定す
る前記計算機読取り可能プログラムコード手段が利用者の直接操作により前記少
なくとも二つの動画像セグメントを手動で選定する計算機読取り可能プログラム
コード手段を含む請求項47に記載の製品。 - 【請求項68】 前記少なくとも二つの動画像セグメントに対応する少なく
とも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを配列づ
けする前記計算機読取り可能プログラムコード手段が前記少なくとも一つの記述
子の値と目標値の間の差に従って前記少なくとも二つの動画像セグメントを順序
づける計算機読取り可能プログラムコード手段を含む請求項47に記載の製品。 - 【請求項69】 前記少なくとも二つの動画像セグメント手段に対応する少
なくとも一つの記述子の値に従って前記少なくとも二つの動画像セグメントを配
列づけする前記計算機読取り可能プログラムコード手段が利用者の直接操作によ
り前記少なくとも二つの動画像セグメントを手動で配列づけする計算機読取り可
能プログラムコード手段を含む請求項47に記載の方法。 - 【請求項70】 動画像セグメントを記述するシステムであって、 第一記述子を作成し、対応する動画像セグメントに対する第一の値を第一記述
子に特有のものにする手段と、 前記第一動画像セグメントと前記少なくとも一つの他の動画像セグメントとに
対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメントを
少なくとも一つの他の動画像セグメントでグループ分けする手段と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
一記述子に特有のものにする手段とを含むシステム。 - 【請求項71】 更に、前記少なくとも一つの他の記述子を選定する手段を
含む請求項70に記載のシステム。 - 【請求項72】 前記グループ分け手段が前記第一動画像セグメントと前記
少なくとも一つの他の動画像セグメントとに対応する少なくとも一つの他の記述
子の前記値を比較する手段を含む請求項71に記載のシステム。 - 【請求項73】 前記グループ分け手段が更に、前記第一動画像セグメント
と前記少なくとも一つの他の動画像セグメントを選別する手段を含む請求項72
に記載のシステム。 - 【請求項74】 前記グループ分け手段が更に、値による選別、距離による
選別、公式選別、アルゴリズム選別や階層構造選別を含む選別技術により前記第
一動画像セグメントと前記少なくとも一つの他の動画像セグメントを選別する手
段を含む請求項73に記載のシステム。 - 【請求項75】 前記グループ分け手段が更に、ディスプレイを有するユー
ザインタフェイスにより前記第一動画像セグメントおよび前記少なくとも一つの
他の動画像セグメントの表現を視覚検査する手段を含む請求項73に記載のシス
テム。 - 【請求項76】 前記グループ分け手段が更に、前記表現の視覚検査後に、
前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一
記述子に特有のものにする前記ユーザインタフェイス手段により作動する手段を
含む請求項75に記載のシステム。 - 【請求項77】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記手段が前記第一の値を前記第一記述子に手動で割当てる手段
を含む請求項73に記載のシステム。 - 【請求項78】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記手段が意味力を有する前記第一の値を前記第一記述子に手動
で割当てる手段を含む請求項77に記載のシステム。 - 【請求項79】 前記第一動画像セグメントおよび前記少なくとも一つの他
の動画像セグメントに対応する前記少なくとも一つの他の記述子を自動的に抽出
する請求項78に記載のシステム。 - 【請求項80】 動画像セグメントを記述する方法であって、 第一記述子を作成し、対応する動画像セグメントに対する第一の値をこの記述
子に特有のものにする工程と、 前記第一動画像セグメントおよび前記少なくとも一つの他の動画像セグメント
に対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメント
を少なくとも一つの他の動画像セグメントでグループ分けする工程と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
一記述子に特有のものにする工程とを含む方法。 - 【請求項81】 更に、前記少なくとも一つの他の記述子を選定する工程を
含む請求項80に記載の方法。 - 【請求項82】 前記グループ分け工程が前記第一動画像セグメントおよび
前記少なくとも一つの他の動画像セグメントに対応する少なくとも一つの他の記
述子の前記値を比較する工程を含む請求項81に記載の方法。 - 【請求項83】 前記グループ分け工程が更に、前記第一動画像セグメント
と前記少なくとも一つの他の動画像セグメントを選別する工程を含む請求項82
に記載の方法。 - 【請求項84】 前記グループ分け工程が更に、値による選別、距離による
選別、公式選別、アルゴリズム選別や階層構造選別を含む選別技術により前記第
一動画像セグメントと前記少なくとも一つの他の動画像セグメントを選別する工
程を含む請求項83に記載の方法。 - 【請求項85】 前記グループ分け工程が更に、ディスプレイを有するユー
ザインタフェイスにより前記第一動画像セグメントおよび前記少なくとも一つの
他の動画像セグメントの表現を視覚検査する工程を含む請求項83に記載の方法
。 - 【請求項86】 前記グループ分け工程が更に、前記表現の視覚検査後に、
前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第一
記述子に特有のものにする前記ユーザインタフェイス手段により作動する工程を
含む請求項85に記載の方法。 - 【請求項87】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記工程が前記第一の値を前記第一記述子に手動で割当てる工程
を含む請求項83に記載の方法。 - 【請求項88】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記工程が意味力を有する前記第一の値を前記第一記述子に手動
で割当てる工程を含む請求項87に記載の方法。 - 【請求項89】 前記第一記述子を作成する前記工程が更に、前記第一動画
像セグメントと前記少なくとも一つの他の動画像セグメントとに対応する少なく
とも一つの他の記述子を自動的に抽出する工程を含む請求項88に記載の方法。 - 【請求項90】 動画像セグメントを記述する計算機プログラム製品であっ
て、 動画像セグメントを記述する計算機使用可能媒体に具現化した計算機読取り可
能プログラムコード手段を有する前記媒体を含み、 第一記述子を作成し、対応する動画像セグメントに対する第一の値をこの記述
子に特有のものにする計算機読取り可能プログラムコード手段と、 前記第一動画像セグメントおよび前記少なくとも一つの他の動画像セグメント
に対応する少なくとも一つの他の記述子の値に従って前記第一動画像セグメント
を少なくとも一つの他の動画像セグメントでグループ分けする計算機読取り可能
プログラムコード手段と、 前記第一の値を前記少なくとも一つの他の動画像セグメントに対応する前記第
一記述子に割当てる計算機読取り可能プログラムコード手段とを有する計算機プ
ログラム製品。 - 【請求項91】 更に、前記少なくとも一つの他の記述子を選定する計算機
読取り可能プログラムコード手段を含む請求項90に記載の製品。 - 【請求項92】 グループ分けのための前記計算機読取り可能プログラムコ
ード手段が前記第一動画像セグメントと前記少なくとも一つの他の動画像セグメ
ントとに対応する少なくとも一つの他の記述子の前記値を比較する計算機読取り
可能プログラムコード手段を含む請求項91に記載の製品。 - 【請求項93】 グループ分けのための前記計算機読取り可能プログラムコ
ード手段が更に、前記第一動画像セグメントと前記少なくとも一つの他の動画像
セグメントを選別する計算機読取り可能プログラムコード手段を含む請求項92
に記載の製品。 - 【請求項94】 グループ分けのための前記計算機読取り可能プログラムコ
ード手段が更に、値による選別、距離による選別、公式選別、アルゴリズム選別
や階層構造選別を含む選別技術により前記第一動画像セグメントと前記少なくと
も一つの他の動画像セグメントを選別する計算機読取り可能プログラムコード手
段を含む請求項93に記載の製品。 - 【請求項95】 グループ分けのための前記計算機読取り可能プログラムコ
ード手段が更に、ディスプレイを有するユーザインタフェイスにより前記第一動
画像セグメントおよび前記少なくとも一つの他の動画像セグメントの表現を視覚
検査する計算機読取り可能プログラムコード手段を含む請求項93に記載の製品
。 - 【請求項96】 グループ分けのための前記計算機読取り可能プログラムコ
ード手段が更に、前記表現の視覚検査の後に、前記第一の値を前記少なくとも一
つの他の動画像セグメントに対応する前記第一記述子に特有のものにする前記ユ
ーザインタフェイス計算機読取り可能プログラムコード手段により作動する手段
を含む請求項95に記載の製品。 - 【請求項97】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記計算機読取り可能プログラムコード手段が前記第一の値を前
記第一記述子に手動で割当てる計算機読取り可能プログラムコード手段を含む請
求項93に記載の製品。 - 【請求項98】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記計算機読取り可能プログラムコード手段が意味力を有する前
記第一の値を前記第一記述子に手動で割当てる計算機読取り可能プログラムコー
ド手段を含む請求項97に記載の製品。 - 【請求項99】 前記第一記述子を作成し、前記第一の値をこの記述子に特
有のものにする前記計算機読取り可能プログラムコード手段が前記第一動画像セ
グメントと前記少なくとも一つの他の動画像セグメントとに対応する前記少なく
とも一つの他の記述子を自動的に抽出する計算機読取り可能プログラムコード手
段を含む請求項98に記載の製品。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/SG1999/000142 WO2001045391A1 (en) | 1999-12-16 | 1999-12-16 | System and method for video production |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003517786A true JP2003517786A (ja) | 2003-05-27 |
JP2003517786A5 JP2003517786A5 (ja) | 2007-02-22 |
Family
ID=20430263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001546152A Pending JP2003517786A (ja) | 1999-12-16 | 1999-12-16 | ビデオ制作システムおよび方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7702014B1 (ja) |
EP (2) | EP1944770A3 (ja) |
JP (1) | JP2003517786A (ja) |
AT (1) | ATE398382T1 (ja) |
DE (1) | DE69938904D1 (ja) |
WO (1) | WO2001045391A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010130683A (ja) * | 2008-11-26 | 2010-06-10 | Puzzlecut Co Ltd | 広告動映像提供方法及び装置 |
JP2011522453A (ja) * | 2008-04-11 | 2011-07-28 | トムソン ライセンシング | 自動化されたテレビ制作の方法 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9892606B2 (en) * | 2001-11-15 | 2018-02-13 | Avigilon Fortress Corporation | Video surveillance system employing video primitives |
US8564661B2 (en) * | 2000-10-24 | 2013-10-22 | Objectvideo, Inc. | Video analytic rule detection system and method |
WO2002052565A1 (en) * | 2000-12-22 | 2002-07-04 | Muvee Technologies Pte Ltd | System and method for media production |
DE60225060T2 (de) * | 2001-12-25 | 2008-05-21 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung und verfahren zur wiedergabe von inhalten |
ATE513415T1 (de) | 2001-12-28 | 2011-07-15 | Koninkl Philips Electronics Nv | Verfahren zur verarbeitung von multimediainhalt |
FR2836567A1 (fr) * | 2002-02-26 | 2003-08-29 | Koninkl Philips Electronics Nv | Procede de montage video |
US20040034869A1 (en) * | 2002-07-12 | 2004-02-19 | Wallace Michael W. | Method and system for display and manipulation of thematic segmentation in the analysis and presentation of film and video |
US7231630B2 (en) | 2002-07-12 | 2007-06-12 | Ensequence Inc. | Method and system automatic control of graphical computer application appearance and execution |
KR100824380B1 (ko) * | 2002-08-08 | 2008-04-22 | 삼성전자주식회사 | 영상 기록/재생 장치 및 그 메뉴안내 표시방법 |
US8290334B2 (en) | 2004-01-09 | 2012-10-16 | Cyberlink Corp. | Apparatus and method for automated video editing |
ITMI20040985A1 (it) * | 2004-05-17 | 2004-08-17 | Technicolor S P A | Rilevamento automatico di soncronizzazione del suono |
US7769189B1 (en) * | 2005-04-12 | 2010-08-03 | Apple Inc. | Preserving noise during editing of a signal |
US8089563B2 (en) * | 2005-06-17 | 2012-01-03 | Fuji Xerox Co., Ltd. | Method and system for analyzing fixed-camera video via the selection, visualization, and interaction with storyboard keyframes |
US8295682B1 (en) * | 2005-07-13 | 2012-10-23 | Apple Inc. | Selecting previously-selected segments of a signal |
US8538761B1 (en) | 2005-08-01 | 2013-09-17 | Apple Inc. | Stretching/shrinking selected portions of a signal |
US8364294B1 (en) | 2005-08-01 | 2013-01-29 | Apple Inc. | Two-phase editing of signal data |
JP4854339B2 (ja) * | 2006-03-08 | 2012-01-18 | 三洋電機株式会社 | 映像再生装置 |
FR2903804B1 (fr) * | 2006-07-13 | 2009-03-20 | Mxp4 | Procede et dispositif pour la composition automatique ou semi-automatique d'une sequence multimedia. |
US20080288869A1 (en) * | 2006-12-22 | 2008-11-20 | Apple Inc. | Boolean Search User Interface |
US9142253B2 (en) * | 2006-12-22 | 2015-09-22 | Apple Inc. | Associating keywords to media |
US8276098B2 (en) | 2006-12-22 | 2012-09-25 | Apple Inc. | Interactive image thumbnails |
US7954065B2 (en) * | 2006-12-22 | 2011-05-31 | Apple Inc. | Two-dimensional timeline display of media items |
US8565228B1 (en) * | 2007-03-28 | 2013-10-22 | Control4 Corporation | Systems and methods for selecting and ranking video streams |
US8650489B1 (en) * | 2007-04-20 | 2014-02-11 | Adobe Systems Incorporated | Event processing in a content editor |
CA2774652A1 (en) * | 2008-09-18 | 2010-03-25 | Screen Test Studios, Llc | System and method for casting call |
US8843375B1 (en) * | 2008-09-29 | 2014-09-23 | Apple Inc. | User interfaces for editing audio clips |
US8639086B2 (en) | 2009-01-06 | 2014-01-28 | Adobe Systems Incorporated | Rendering of video based on overlaying of bitmapped images |
CN101998137B (zh) * | 2009-08-21 | 2016-09-07 | 华为技术有限公司 | 视频质量参数获取方法和装置及电子设备 |
US8988458B2 (en) * | 2010-04-13 | 2015-03-24 | At&T Intellectual Property I, L.P. | System and method for generating media thumbscapes |
JP5625642B2 (ja) | 2010-09-06 | 2014-11-19 | ソニー株式会社 | 情報処理装置、データ分割方法及びデータ分割プログラム |
WO2012051585A1 (en) * | 2010-10-14 | 2012-04-19 | Fixmaster, Inc. | System and method for creating and analyzing interactive experiences |
KR101952260B1 (ko) * | 2012-04-03 | 2019-02-26 | 삼성전자주식회사 | 다수의 동영상 썸네일을 동시에 표시하기 위한 영상 재생 장치 및 방법 |
US10165245B2 (en) | 2012-07-06 | 2018-12-25 | Kaltura, Inc. | Pre-fetching video content |
US8942542B1 (en) * | 2012-09-12 | 2015-01-27 | Google Inc. | Video segment identification and organization based on dynamic characterizations |
US9031375B2 (en) | 2013-04-18 | 2015-05-12 | Rapt Media, Inc. | Video frame still image sequences |
US9508385B2 (en) * | 2013-11-21 | 2016-11-29 | Microsoft Technology Licensing, Llc | Audio-visual project generator |
US10303716B2 (en) * | 2014-01-31 | 2019-05-28 | Nbcuniversal Media, Llc | Fingerprint-defined segment-based content delivery |
US9858036B2 (en) | 2015-11-10 | 2018-01-02 | Google Llc | Automatic audio level adjustment during media item presentation |
US10178341B2 (en) * | 2016-03-01 | 2019-01-08 | DISH Technologies L.L.C. | Network-based event recording |
CN117692676A (zh) * | 2023-12-08 | 2024-03-12 | 广东创意热店互联网科技有限公司 | 一种基于人工智能技术的视频快速剪辑方法 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4780709A (en) | 1986-02-10 | 1988-10-25 | Intel Corporation | Display processor |
JP2677312B2 (ja) | 1991-03-11 | 1997-11-17 | 工業技術院長 | カメラワーク検出方法 |
US5286908A (en) | 1991-04-30 | 1994-02-15 | Stanley Jungleib | Multi-media system including bi-directional music-to-graphic display interface |
US5309228A (en) | 1991-05-23 | 1994-05-03 | Fuji Photo Film Co., Ltd. | Method of extracting feature image data and method of extracting person's face data |
US5262865A (en) | 1991-06-14 | 1993-11-16 | Sony Electronics Inc. | Virtual control apparatus for automating video editing stations |
JP3079719B2 (ja) | 1991-11-30 | 2000-08-21 | ソニー株式会社 | 特殊効果装置 |
US6208805B1 (en) * | 1992-02-07 | 2001-03-27 | Max Abecassis | Inhibiting a control function from interfering with a playing of a video |
US5434678A (en) * | 1993-01-11 | 1995-07-18 | Abecassis; Max | Seamless transmission of non-sequential video segments |
EP0590759B1 (en) | 1992-08-12 | 1998-12-09 | International Business Machines Corporation | System and method for locating video segment boundaries |
JPH08115338A (ja) | 1994-10-14 | 1996-05-07 | Fuji Xerox Co Ltd | マルチメディア文書編集装置 |
US5805733A (en) | 1994-12-12 | 1998-09-08 | Apple Computer, Inc. | Method and system for detecting scenes and summarizing video sequences |
US5642285A (en) * | 1995-01-31 | 1997-06-24 | Trimble Navigation Limited | Outdoor movie camera GPS-position and time code data-logging for special effects production |
US5693902A (en) | 1995-09-22 | 1997-12-02 | Sonic Desktop Software | Audio block sequence compiler for generating prescribed duration audio sequences |
JP2994996B2 (ja) | 1995-12-01 | 1999-12-27 | 松下電器産業株式会社 | マルチメディア編集装置 |
US5801685A (en) | 1996-04-08 | 1998-09-01 | Tektronix, Inc. | Automatic editing of recorded video elements sychronized with a script text read or displayed |
CA2260932C (en) * | 1996-07-29 | 2003-11-18 | Avid Technology, Inc. | Motion video processing circuit for capture, playback and manipulation of digital motion video information on a computer |
US5969716A (en) | 1996-08-06 | 1999-10-19 | Interval Research Corporation | Time-based media processing system |
JPH1066008A (ja) | 1996-08-23 | 1998-03-06 | Kokusai Denshin Denwa Co Ltd <Kdd> | 動画像検索編集装置 |
AU7705498A (en) * | 1997-05-29 | 1998-12-30 | Red Hen Systems Llc | Gps video mapping system |
GB2329812B (en) | 1997-09-24 | 2002-04-10 | Sony Pictures Entertainment | User interface systems and methods |
AUPO960197A0 (en) | 1997-10-03 | 1997-10-30 | Canon Information Systems Research Australia Pty Ltd | Multi-media editing method and apparatus |
JPH11341350A (ja) | 1998-05-28 | 1999-12-10 | Yamaha Corp | マルチメディア情報編集および再生装置、マルチメディア情報再生プログラムを記録した記録媒体ならびにシーケンス情報を記録した記録媒体 |
US6163510A (en) | 1998-06-30 | 2000-12-19 | International Business Machines Corporation | Multimedia search and indexing system and method of operation using audio cues with signal thresholds |
JP2002524775A (ja) | 1998-09-04 | 2002-08-06 | レゴ エー/エス | 電子音楽を作曲しグラフィック情報を生成するための方法およびシステム |
AU2217700A (en) | 1998-12-30 | 2000-07-31 | Earthnoise.Com Inc. | Creating and editing digital video movies |
US6549643B1 (en) | 1999-11-30 | 2003-04-15 | Siemens Corporate Research, Inc. | System and method for selecting key-frames of video data |
US6757027B1 (en) | 2000-02-11 | 2004-06-29 | Sony Corporation | Automatic video editing |
US6697564B1 (en) | 2000-03-03 | 2004-02-24 | Siemens Corporate Research, Inc. | Method and system for video browsing and editing by employing audio |
US6542869B1 (en) | 2000-05-11 | 2003-04-01 | Fuji Xerox Co., Ltd. | Method for automatic analysis of audio including music and speech |
US6697523B1 (en) | 2000-08-09 | 2004-02-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for summarizing a video using motion and color descriptors |
CA2374620C (en) | 2002-03-05 | 2010-08-31 | Ferco Architectural Hardware | Multipoint locking mechanism for a window sash |
-
1999
- 1999-12-16 EP EP08075262A patent/EP1944770A3/en not_active Withdrawn
- 1999-12-16 DE DE69938904T patent/DE69938904D1/de not_active Expired - Lifetime
- 1999-12-16 AT AT99962635T patent/ATE398382T1/de not_active IP Right Cessation
- 1999-12-16 JP JP2001546152A patent/JP2003517786A/ja active Pending
- 1999-12-16 WO PCT/SG1999/000142 patent/WO2001045391A1/en active Application Filing
- 1999-12-16 US US09/509,280 patent/US7702014B1/en not_active Expired - Fee Related
- 1999-12-16 EP EP99962635A patent/EP1247396B1/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011522453A (ja) * | 2008-04-11 | 2011-07-28 | トムソン ライセンシング | 自動化されたテレビ制作の方法 |
US9812170B2 (en) | 2008-04-11 | 2017-11-07 | Gvbb Holdings S.A.R.L. | Method for automated television production |
US10573347B2 (en) | 2008-04-11 | 2020-02-25 | Gvbb Holdings S.A.R.L. | System for automated television production |
JP2010130683A (ja) * | 2008-11-26 | 2010-06-10 | Puzzlecut Co Ltd | 広告動映像提供方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
ATE398382T1 (de) | 2008-07-15 |
US7702014B1 (en) | 2010-04-20 |
DE69938904D1 (de) | 2008-07-24 |
EP1944770A2 (en) | 2008-07-16 |
WO2001045391A1 (en) | 2001-06-21 |
EP1247396A1 (en) | 2002-10-09 |
EP1944770A3 (en) | 2008-07-23 |
EP1247396B1 (en) | 2008-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003517786A (ja) | ビデオ制作システムおよび方法 | |
US7945142B2 (en) | Audio/visual editing tool | |
US5664227A (en) | System and method for skimming digital audio/video data | |
US7362946B1 (en) | Automated visual image editing system | |
US6970639B1 (en) | System and method for editing source content to produce an edited content sequence | |
US6584463B2 (en) | Video searching method, apparatus, and program product, producing a group image file from images extracted at predetermined intervals | |
US8006186B2 (en) | System and method for media production | |
US6571054B1 (en) | Method for creating and utilizing electronic image book and recording medium having recorded therein a program for implementing the method | |
US8751022B2 (en) | Multi-take compositing of digital media assets | |
US6799180B1 (en) | Method of processing signals and apparatus for signal processing | |
KR20070121810A (ko) | 복합 뉴스 스토리 합성 | |
JP2003179849A (ja) | ビデオコラージュの作成方法および装置、ビデオコラージュ、ビデオコラージュ・ユーザ・インタフェース、ビデオコラージュ作成プログラム | |
CN100372376C (zh) | 信号记录/再现装置和记录/再现方法、信号再现装置和再现方法 | |
JP2008022103A (ja) | テレビ番組動画像ハイライト抽出装置及び方法 | |
JP4373466B2 (ja) | 編集方法、コンピュータプログラム、編集システム及びメディア・プレーヤ | |
JP2007336106A (ja) | 映像編集支援装置 | |
US20050182503A1 (en) | System and method for the automatic and semi-automatic media editing | |
EP4447047A1 (en) | System and method for ai/xi based automatic song finding and adaptation for videos | |
US20240241905A1 (en) | System and method for ai/xi based automatic song finding and adaptation method for videos | |
JP2005203895A (ja) | データ重要度評価装置及び方法 | |
Smith et al. | Video Summarization | |
JP2002100157A (ja) | 再生データ編集装置及び記憶媒体 | |
JP2000099520A (ja) | マルチメディア編集装置 | |
JP2006048405A (ja) | 映像処理方法及び装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060425 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060719 |
|
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A073 Effective date: 20060822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061214 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090203 |