JP2010517426A

JP2010517426A - オブジェクトアーカイブシステムおよび方法

Info

Publication number: JP2010517426A
Application number: JP2009547252A
Authority: JP
Inventors: ペース・チャールズ・ピー
Original assignee: Euclid Discoveries LLC
Current assignee: Euclid Discoveries LLC
Priority date: 2007-01-23
Filing date: 2008-01-04
Publication date: 2010-05-20
Also published as: WO2008091484A3; US20100086062A1; US8553782B2; CA2675957A1; TW200839622A; US20120163446A1; WO2008091484A2; CA2675957C; CN101622874A; US9106977B2; EP2106663A2; US20150181217A1

Abstract

【課題】ビデオを処理して圧縮する個人のオブジェクトに基づくアーカイブシステムを提供する。
【解決手段】ユーザに関連した、顔、家族、およびペットなどのユーザにユニークな特徴を解析することによって、不変なモデルが判定されて、各ユーザに個別のオブジェクトモデルアダプタを作成する。これら個人別のビデオオブジェクトモデルは、幾何学的および概観モデル化の技法を用いて作成される。そして、これらオブジェクトモデルはオブジェクトモデルライブラリに格納される。オブジェクトモデルは、多くのユーザの間でピア・ツー・ピアネットワークにおいて共有されるか、サーバのオブジェクトモデルライブラリに格納される。圧縮された（エンコード化された）ビデオが再現される際に、ビデオオブジェクトモデルがアクセスされて用いられ、ほとんど損失のなり圧縮の品質ビデオを生成する。
【選択図】図３

Description

関連出願

本出願は、2007年1月23日出願の米国仮特許出願第60/881,982号の優先権を主張する。本出願は、2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」の米国仮特許出願第60/991,966号および2006年1月8日出願で発明の名称が「画像データを処理する装置および方法」の米国仮特許出願第60/811,890号に関連する。本出願は、また、2005年7月28日出願の米国特許出願第11/191,562号の部分継続出願である、2005年9月20日出願の米国特許出願第11/230,686号の部分継続出願である、2005年11月16日出願の米国特許出願第11/280,625号の部分継続出願である、2006年1月20日出願の米国特許出願第11/336,366号の部分継続出願である、2006年3月31日出願の米国特許出願第11/396,010号に関連する。上記各出願の全内容は参照により本明細書に引用したものとする。

本発明はビデオデータを処理して圧縮するのに用いられるオブジェクトアーカイブシステム（オブジェクトの保管システム）に関する。

ディジタルビデオの最近の人気によって、ビデオ圧縮の需要が劇的に増加している。ビデオ圧縮はディジタル媒体の格納および転送に必要とされるビット数を低減する。ビデオデータは空間および時間の冗長性（重複）を含み、これら空間および時間の類似性はフレーム（空間）内およびフレーム間（時間）における差分を記録することによってエンコード化される。圧縮を実行するハードウェアまたはソフトウェアは、ＣＯＤＥＣ（コーデック）（符号化器（エンコーダ）／復号化器（デコーダ））と呼ばれる。コーデックは、ディジタル信号に符号化（エンコード化）および復号化（デコード化）を実行できる装置またはソフトウェアである。データを大量に使用するディジタルビデオアプリケーションが広く普及してきているため、信号をエンコード化するのにより効率的な方法が必要とされている。このようにして、ビデオ圧縮は、記憶装置および通信の技術における中心的なコンポーネントとなっている。

残念なことに、従来のビデオ処理方法では、遅いデータ通信速度、大きな記憶容量条件、および妨害となる知覚に影響を及ぼすものの形態で現れる、多くの非効率に苦しんでいる。ビデオデータの品質を維持しながら容易かつ効率的に操作する必要がある様々なユーザにとって、これら障害は重大な問題となる可能性がある。特に、何らかの形式の視覚情報に対して人間が生得的感受性を有することに鑑みれば、特に重要である。

ビデオ圧縮において、複数の重要なファクタが一般的に考慮される。これらファクタには、ビデオ品質およびビットレート、エンコード化およびデコード化のアルゴリズムの計算の複雑さ、データの損失および誤差に対するロバスト性、ならびに待ち時間が含まれる。ビデオデータ量がインターネット上で急増しているため、コンピュータに対するのみでなく、テレビや携帯電話などの手持ち式装置に対しても、輻輳を大幅に緩和して品質を向上させる技術が著しい進展となる。

ビデオを処理するシステムおよび方法が、現在の最新技術に対して計算および分析における利点をもたらす。ビデオ信号が処理されて、ビデオ信号において表現された１つ以上のオブジェクトからオブジェクトモデルを作成する。オブジェクトモデルはアーカイブされる（保管される）。アーカイブされたオブジェクトモデルは、構造、変形、外観および明るさのモデル化のためにオブジェクトモデルのライブラリとして用いられる。１つ以上のアーカイブされたオブジェクトモデルは、圧縮されたビデオファイルを処理する際に用いられる。１つ以上のアーカイブされたオブジェクトモデルおよびコーデックが、圧縮されたビデオファイルを復元するのに用いられる。オブジェクトモデルは、ビデオ信号において表現された１つ以上のオブジェクトの陰的表現を作成するのに用いられる。

アーカイブに格納された実質的に等しいオブジェクトモデルが存在するか否かを判別するように、アーカイブのオブジェクトモデルが比較される。互いに実質的に等しい重複オブジェクトモデルを除外することによって、アーカイブのサイズは低減される。類似するアーカイブのオブジェクトモデルは組み合わされる。

圧縮されたビデオファイルを復元するのにビデオコーデックが用いられる。オブジェクトモデルはビデオコーデックとは別に格納される。オブジェクトモデルは、ビデオコーデックに含まれても、ビデオコーデックとセットにされてもよい。カスタマイズ化されたコーデックは、オブジェクトモデルのいくつかをグループ化することによって作成される。カスタマイズ化されたコーデックは、圧縮されたビデオファイルを復元するために最適化される。

圧縮されたビデオファイルは、類似の特徴を有する他の圧縮されたビデオファイルのグループと関連付けられる。カスタマイズ化されたコーデックは、このグループの任意の圧縮されたビデオファイルを復元するように最適化される。圧縮されたビデオファイルのグループは、ユーザについての個人専用の情報に基づいて判別される。ユーザによって提供された圧縮されていないビデオファイルを解析することによって、ユーザについての個人専用の情報が判別される。ユーザの圧縮されていないビデオファイルが解析されると、ユーザの圧縮されていないビデオファイルにおいて繰り返されているオブジェクトが識別される。繰り返されているオブジェクトは、例えば、ユーザの圧縮されていないビデオファイルにおいて識別された人間の顔または動物である。カスタマイズ化されたオブジェクトモデルが作成されて、これら繰り返されているオブジェクトを復元するように訓練される。圧縮されたビデオファイルを復元する、カスタマイズ化されたコーデックを作成するのに、カスタマイズ化されたオブジェクトが用いられる。

圧縮されたビデオファイルは、あるユーザコンピュータから別のコンピュータに送信される。この圧縮されたビデオファイルが復元されている間、アーカイブされたオブジェクトモデルはサーバからアクセスされる。複数のユーザについてのアーカイブされたオブジェクトモデルを維持してマイニングする（情報を得るために調べる）のに、サーバが用いられる。サーバはオブジェクトモデルライブラリを作成する。このようにして、ビデオ処理サービスが提供される。ここで、サービスのメンバは自己のオブジェクトモデルをサーバに格納でき、自己の圧縮されたビデオファイルを復元するためにサーバから遠隔にオブジェクトモデルにアクセスする。

アーカイブされたオブジェクトモデルは、ピア・ツー・ピアネットワークにおいて複数のユーザコンピュータの間で共有される。ピア・ツー・ピアネットワークにおいて、圧縮されたビデオファイルに対する要求があるコンピュータから受信される。この要求に応答して、アーカイブされたオブジェクトモデルの１つが、ピア・ツー・ピアネットワークにおいて別のユーザコンピュータから送信される。また、この要求に応答して、アーカイブされたオブジェクトモデルの別の１つが、ピア・ツー・ピアネットワークにおいてさらに別のユーザコンピュータから送信される。さらにこの要求に応答して、アーカイブされたオブジェクトモデルの別の１つまたはこれらモデルの小分割（sub-partitioning）が、ピア・ツー・ピアネットワークにおいてさらに別のユーザコンピュータから送信される。このようにして、アーカイブされたオブジェクトモデルは、分散アプローチを用いて維持されて配布される。

圧縮されたビデオストリームに対するアクセスを制御するのに、１つ以上のオブジェクトモデルが用いられる。オブジェクトモデルはコーデックで用いられて、圧縮されたビデオファイルを復元する。ビデオファイルは、１つ以上のオブジェクトモデルを用いることなく、ユーザのコンピュータで復元または解釈されてもよい。オブジェクトモデルへのアクセスを制御することによって、圧縮されたビデオファイルのアクセス（例えば、再生アクセス）が制御される。オブジェクトモデルは、ビデオデータにアクセスするのにキーとして用いられる。コード化されたビデオデータの再生動作は、オブジェクトモデルに依存する。このアプローチによって、圧縮されたビデオデータはオブジェクトモデルにアクセスすることなく読込み可能となる。このようにして、オブジェクトモデルは、暗号化およびディジタル著作権管理に用いられる。異なる品質のオブジェクトモデルが用いられて、同一ビデオファイルから解凍されるビデオについて異なる品質レベルを提供する。これは、共通ビデオファイルの差分デコード化を考慮する。（例えば、用いられるオブジェクトモデルおよび共通のビデオファイルに基づく、ビデオの標準精細度（Standard Definition）および高精細度（High Definition）のバージョン）。

１つ以上のオブジェクトモデルは、再生の際に復元されたビデオストリームに挿入される広告を含む。例えば、コード化ビデオの復元（再生）中に、モデルは、広告を提供するフレームが再生ビデオストリーム内に生成されるようにする。

ビデオを処理するソフトウェアシステムが提供される。エンコーダがビデオ信号を処理して、ビデオ信号内に表現された１つ以上のオブジェクトについてのオブジェクトモデルを作成する。オブジェクトライブラリがオブジェクトモデルを格納する。デコーダが、コード化されたビデオファイルを復元する際に、コーデックおよびオブジェクトライブラリからの１つ以上のアーカイブされたオブジェクトモデルを用いる。

上記の内容は、添付図面に示される本発明の例の実施形態のより詳細な説明から明らかになるであろう。図面では、同一参照符号はそれぞれの図全体を通して同一部分を指す。図面は必ずしも縮尺どおりでなく、本発明の実施形態を説明することに重点が置かれている。

本発明の実施形態において用いられるビデオ圧縮（一般に画像処理）システムのブロック図である。本発明の実施形態において用いられるハイブリッド空間正規化圧縮方法を示すブロック図である。好ましい実施形態においてオブジェクトモデルをアーカイブする処理を示すフローチャートである。クライアント−サーバフレームワークを用いた、本発明の個人ビデオ処理サービスのアーキテクチャの例を示す概略図である。オブジェクトモデルを共有する本発明を示すブロック図である。コンピュータネットワークまたは類似のディジタル処理環境を示し、本発明の実施形態が実現される環境の概略図である図６のネットワークのコンピュータの内部構造のブロック図である。

本発明の例示的な実施形態を以下に記述する。

＜オブジェクトモデルの作成＞
ビデオ信号データでは、画像シーケンスにビデオフレームが組み立てられる。ビデオの対象は、通常カメラの２次元画像表面に射影された３次元シーンである。合成されて生成されたビデオの場合、解釈には「仮想」カメラが用いられる。アニメーション（動画）の場合、アニメ製作者は参考のこのカメラフレームを管理する役割を担う。各フレームすなわち画像は、サンプル信号に対する画像センサ応答を表現する画素（pel）から構成されている。多くの場合、サンプル信号は、２次元センサアレイにおいてカメラのコンポーネントからサンプル化される特定の反射、屈折または放射されたエネルギ（例えば、電磁エネルギ、音響エネルギなど）に相当する。連続的な時系列サンプリングによって、フレーム当たりの空間２次元と、ビデオシーケンスにおけるフレーム順序に対応する時間次元とを備える、時空間データストリームを得ることができる。この処理は、通常「画像」処理と称される。

本発明は、ビデオ信号データが効率的に１つ以上の有用な表現に処理される手段を提供する。本発明は、ビデオ信号において多くの共通に繰り返されるデータセットを処理するのに有効である。ビデオ信号が解析され、そのデータの１つ以上の簡潔な表現が提供されてその処理およびエンコード化を容易にする。新しくてより簡潔なデータ表現によって、計算処理、伝送帯域幅および記憶装置の多くの用途に対する要件が軽減される。処理には、これらに限定されるわけではないが、ビデオ信号のコード化、圧縮、伝送、解析、記憶および表示が含まれる。雑音のような不必要な信号部分は低い優先度に識別されて、さらなる処理はビデオ信号の優先度の高い部分を解析して表現することに重点が置かれる。その結果、ビデオ信号はこれまでよりも、より簡潔に表現される。そして、正確さの損失は、知覚的に重要でないビデオ信号部分に集中される。

2006年1月20日出願の米国特許出願第11/336,366号および2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」である米国特許出願（代理人の管理番号4060.1009-000）（全内容はここで引用されているものとする）に記載のように、ビデオ信号データは解析されて顕著なコンポーネントが識別される。空間時間的なストリームは、たいていは独特なオブジェクトである顕著なコンポーネント（例えば顔）を明らかにする。識別処理は、顕著なコンポーネントの存在および重要度を特定して、特定された顕著なコンポーネントのうちの最も重要な１つ以上を選択する。これは、ここで説明されている処理後または処理と同時に行われる、顕著性がより小さい他の顕著なコンポーネントの識別および処理を制限するわけではない。上述の顕著なコンポーネントはその後さらに解析され、変化するサブコンポーネントおよび不変のサブコンポーネントが識別される。不変サブコンポーネントの識別は、コンポーネントの特定の様相のモデル化処理である。これにより、コンポーネントを所望の正確度に合成できるモデルのパラメータ表現が明らかになる。

一実施形態において、ＰＣＡ／ウェーブレットのエンコード化技法が前処理されたビデオ信号に適用されて、所望の圧縮ビデオ信号を形成する。前処理によってビデオ信号の複雑さを減少させて、主成分分析（ＰＣＡ）／ウェーブレットのエンコード化（圧縮）が向上した作用で適用されるようにする。ＰＣＡ／ウェーブレットのコード化については、同時係属の出願である、2006年1月20日出願の米国特許出願第11/336,366号および2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」である米国特許出願（代理人の管理番号4060.1009-000）に詳細に説明されている。

図１は本発明の原理を採用する例示的な画像処理システム１００のブロック図である。ソースビデオ信号１０１が入力されて前処理プロセッサ１０２によって受信される。前処理プロセッサ１０２は、ソースビデオ信号１０１における対象コンポーネント（顕著なオブジェクト）を判別するために帯域消費を用いるか、または顔／オブジェクト検出器のような他の基準を用いる。特に、前処理プロセッサ１０２は、ビデオ信号１０１において、不均衡な帯域幅を用いる部分のその他の部分に対する比を判別する。この判別を行うセグメンタ（セグメント化器、セグメント化部）１０３に関する方法は、以下の通りである。

セグメンタ１０３が、上述の画素の微分における時間および／または空間の差分を用いて、時間および／空間に渡って画像勾配を分析する。コヒーレンスに監視するために、ビデオ信号の逐次的なフレームに渡って、互いに対応するビデオ信号部分が追跡されて注目される。これらコヒーレントな（一貫した）信号コンポーネントの微分場の有限差分が統合されて、ビデオ信号の判別された部分を生成する。この判別された部分とは、他の部分に対して不均衡な帯域幅を用いる部分である。すなわち、対象コンポーネントを判別する。好ましい実施形態では、後続フレームにおける空間不連続に対応する空間不連続が１つのフレームにおいて発見されると、画像勾配の急激さまたは平滑さが解析されて、一意の対応（時間コヒーレンシ（時間的な一貫性））を生じさせる。さらに、このような対応（相関関係）の集まりも、ビデオフレームの離散的なコンポーネントの時間コヒーレンシに一意に帰するように同一の方法で採用される。急峻な画像勾配についてはエッジが存在すると判別される。このような空間不連続を画定するエッジが２つ存在する場合、コーナーが決定される。これら識別された空間不連続は勾配フローと組み合わされて、ビデオデータの複数のフレームに渡る対応画素間の動きベクトルを生成する。動きベクトルが識別された空間不連続と一致する場合、本発明のセグメンタ１０３は、対象のコンポーネント（顕著なオブジェクト）が存在すると判別する。

他のセグメント化技法がセグメンタ１０３を実現するのに適している。

図１において、前処理プロセッサ１０２（セグメンタ１０３）が、対象のコンポーネント（顕著なオブジェクト）を判別すると（すなわち、ソースビデオ信号１０１から対象のコンポーネントをセグメント化すると）、判別した対象のコンポーネントの複雑さを正規化器（正規化部）１０５が低減する。好ましくは、正規化器１０５は、判別された対象のコンポーネントから、全体の動きおよび姿勢、全体構造、局所変形、外観ならびに明るさの変動を取り除く。これまでに述べた関連出願に記載された前述の正規化技法がこのために利用される。これにより、正規化器１０５は対象のコンポーネントの構造モデル１０７および外観モデル１０８を確立する。

構造モデル１０７は、数学的には以下のように表現される。

ここで、σは、顕著なオブジェクト（判別された対象のコンポーネント）であり、ＳＭ()はそのオブジェクトの構造モデルである。ｖ_x,yは、経時的に位置合せされたオブジェクトにおける、区分（piece-wise）線形正規化メッシュの２次元メッシュ頂点である。Δ_tは、期間ｔにおける頂点の変化であり、複数のビデオフレーム間のオブジェクトの拡大縮小（すなわち局所変形）、回転および並進を経時的に表現する。Ｚは、全体動きである。式１から、全体の固定の構造モデル、全体動き、姿勢および局所的に導出された変形が引き出される。構造部分の候補構造（経時のビデオフレームの対象のコンポーネント）を判定するために、動きから構造を推定する既知の技法が用いられて、動き検出と組み合わされる。これにより、顕著なオブジェクトの空間における位置および方向が決定されて、構造モデル１０７および動きモデル１１１がもたらされる。

外観モデル１０８は、次に、構造モデル１０７および動きモデル１１１によって集合的ではなくモデル化される顕著なオブジェクトの特性および様相を表現する。一実施形態では、外観モデル１０８は経時的な構造変化の線形分解であり、構造モデル１０７から全体動きおよび局所変形を除去することによって決定される。出願人は、各ビデオフレームにおけるオブジェクト外観を取得し、構造モデル１０７を用いて、「正規化された姿勢」に再射影する。「正規化された姿勢」は、また、１以上の「基本的な（cardinal）」姿勢と称される。再射影は、オブジェクトの正規化されたバージョンを表現し、外観における任意の変化を生成する。所与のオブジェクトが複数のビデオフレーム間で回転しているかまたは空間的に並進されているので、外観は単一の基本的な姿勢（すなわち、平均の正規化された表現）に位置付けられる。外観モデル１０８は、また、基本的な姿勢の基本的な変形（例えば、目が開く／閉じられる、口が開く／閉じられるなど）を明らかにする。したがって、外観モデル１０８ＡＭ（σ）は、基本的な姿勢Ｐ_ｃおよび基本的な姿勢Ｐ_ｃの基本的な変形Δ_ｃによって表現される。

外観モデル１０８の画素は、好ましくは、カメラの投影軸に対する距離および入射角度に基づく。バイアスをかけることで、モデルの最終形式に対する各画素の寄与の相対加重を判別する。したがって、好ましくは、この「サンプルバイアス（sampling bias）」が全てのモデルの全ての処理を組み込む。候補構造の（構造モデル１０７からの）経時追跡は、姿勢、動きおよび変形の推定量からの示唆によって、全画素の動きの予測を構成して可能とする。

さらに、外観および明るさのモデル化に関して、画像処理における持続的な挑戦の１つは、変化する明暗条件のもとで、オブジェクトを追跡している。画像処理において、コントラストの正規化は、ピクセル輝度（pixel intensity）値の変化を、明暗／明るさの変化以外の因子に起因するよりもむしろ、明暗／明るさの変化に起因するものとしてモデル化する処理である。好ましい実施形態では、ビデオが取り込まれる際の顕著なオブジェクトの明るさ条件の任意の変化を推定する（すなわち、オブジェクトに当たる明るさをモデル化する）。これは、ランベルト反射の線形部分空間（Lambertian Reflectance Linear Subspace (ＬＲＬＳ)）理論からの原理にオプティカルフローを組み合わせて達成される。ＬＲＬＳ理論によれば、オブジェクトが固定されて好ましくは明るさの変化のみが許容されると、反射画像のセットは最初の９つの球面調和関数の線形な組合せによって近似される。これにより、画像は、周囲「画像」ベクトル空間における９Ｄ線形部分空間に近接する。さらに、画像ピクセル（ｘ，ｙ）の反射輝度は、次のように近似される。

ＬＲＬＳおよびオプティカルフローを用いて、いかに明暗がオブジェクトと相互作用するかを判定するために期待値が計算される。これら期待値は、オプティカルフロー場における変化を説明できるオブジェクトの動きを拘束するのに役立つ。明るさモデル化を用いるオブジェクトの外観を記述するのにＬＲＬＳを用いると、さらに、明るさモデルの予測の範囲から外れる任意の外観変化を処理することを外観モデルに許可する必要がある。

対象のコンポーネントの複雑さが対応する元のビデオ信号から低減されるが対象のコンポーネントの顕著性は維持される限り、外観モデル１０８および構造モデル１０７の他の数学的表現も適切である。図１を参照して、ＰＣＡ／ウェーブレットのエンコード化が、次にアナライザ（分析器、解析器）１１０によって構造オブジェクトモデル１０７および外観オブジェクトモデル１０８に適用される。より詳細には、アナライザ１１０は、対象のコンポーネントに対応するビデオデータを圧縮（エンコード化）するために、幾何学的データ解析を採用する。得られる圧縮された（エンコード化された）ビデオデータは、図２の画像処理システムにおいて用いられることができる。より詳細には、これらオブジェクトモデル１０７，１０８は、図２のエンコード化側２３２およびデコード化側２３６において蓄積されてもよい。構造モデル１０７および外観モデル１０８から、有限状態マシンが生成されてもよい。従来のエンコード化２３２およびデコード化２３６も、従来のウェーブレットビデオコード化デコード化方法として実装されてもよい。

ＰＣＡコード化が両側２３２，２３６において正規化された画素データに適用される。これにより、各側２３２，２３６において同一の基底ベクトルセットを形成する。好ましい実施形態では、ＰＣＡ／ウェーブレットが画像処理中に基底関数に適用されて、所望の圧縮ビデオデータを生成する。ウェーブレット技法（ＤＷＴ）は、全体画像および部分画像を変換し、外観モデル１０８および構造モデル１０７を線形分解する。そして、所望のしきい値目標（ＥZＴ式またはＳＰＩＨＴ式）を満たすように、この分解されたモデルは正常に打ち切られる。これによって、拡大縮小可能なビデオデータ処理が容易になり、これは、ビデオデータの「正規化」性質による従来のシステムや方法とは異なる。

図２に示すように、１つ以上のオブジェクト２３０，２５０についての圧縮されていないビデオストリームの先に検出されたオブジェクトインスタンスが、従来のビデオ圧縮方法２３２の別個のインスタンスでそれぞれ処理される。さらに、オブジェクト２３０，２５０のセグメント化から生じた非オブジェクト２０２も、従来のビデオ圧縮２３２を用いて圧縮される。これら別個の圧縮エンコード化２３２のそれぞれの結果は、各ビデオストリームに別々に対応する従来の方法でエンコード化された別個のストリーム２３４である。おそらくは伝送の後である、ある時点で、これら中間のコード化されたストリーム２３４が、正規化された非オブジェクト２１０および多数の正規化されたオブジェクト２３８，２５８の合成に、デコーダ２３６で解凍される。画素が空間において相対的に正しく位置するように、これら合成された画素は、これらの各非正規化バージョン２２２、２４２および２６２に非正規化２４０されることができる。これにより、合成処理２７０が、オブジェクトおよび非オブジェクトの画素を組み合わせて完全なフレームの合成２７２とすることができる。

＜データマイニングオブジェクトモデル＞
これらオブジェクトモデル（例えば、変形、構造、動き、明るさおよび外観モデル）をアーカイブすることによって、これらオブジェクトモデルの持続的な形式が決定されて他のビデオストリームの処理に再利用される。例えば、ディジタルビデオがカメラからインポートされると、ディジタルビデオはトランスコード（形式変換）されて、任意のオブジェクトモデルがマッチするか否かを判定するために、ビデオオブジェクトのアーカイブがアクセスされる。これはフレームごとに実行されるが、同様のアイテムを共にグループ化してビデオストリームの一部またはビデオストリームの全部がバッチ処理を用いて解析されてもよい。フレームは非逐次的に解析されてもよく、いずれのオブジェクトモデルがコード化に最も適しているかを判定するために統計解析が実行されてもよい。

図３は、オブジェクトモデルのアーカイブ処理３００を示すフローチャートである。ステップ３０２において、オブジェクトモデルが上述のように識別される。ステップ３０４において、オブジェクトモデルはアーカイブすなわちオブジェクトモデルライブラリに統合される。ステップ３０６において、オブジェクトモデルは比較されて、ステップ３０８において類似のオブジェクトモデルが識別される。ステップ３１０において、冗長な（重複する）オブジェクトモデルが除去されて、類似のモデルは統合される。ステップ３１２において、ビデオオブジェクトモデルへのポンタ／識別器が更新される。オブジェクトモデルへのポインタは、コード化されたビデオストリームに用いられ、例えば、ライブラリにおける関連する更新されたオブジェクトモデルを参照するために、オブジェクトモデルへのポインタが更新される。

このようにして、本発明のアーカイブシステム３００はオブジェクトライブラリにおけるこれらオブジェクトモデルをマイニングし（情報を得るために調べ）、類似のオブジェクトモデルを識別するためにオブジェクトモデルを解析する。類似のオブジェクトモデルが識別されると、システム３００は、何度も使用される一般的なオブジェクトモデルを作成することによって、冗長性（重複性）を活用できる。類似性は、同様の構造、変形、動き、明るさ、および／または外観に基づく傾向がある。

オブジェクトモデルは、あらゆる方法で後に続くビデオ処理に使用される。後述するように、モデルはクライアント／サーバのフレームワークにおいて使用でき、オブジェクトモデルはコード化されたビデオファイルをデコードする際に用いるためのビデオコーデックでパッケージにまとめられることができ、モデルは個人のビデオサービスにおいて用いられることができ、さらに、モデルは分配されて分配システム（例えばピア・ツー・ピア）を用いる多くのユーザが利用可能となる。さらに、モデルの処理は、分散コンピュータネットワークにおいて生じてもよい。

＜個人用のビデオ処理サービス＞
オブジェクトモデルがサーバに格納された例において、個人用のビデオ処理サービスが提供できる。図４は、クライアント４１４サーバ４１０のフレームワークを用いた個人のビデオ処理サービス４００のアーキテクチャの例を示す概略図である。この例では、個人のビデオサービスのユーザすなわちメンバは、本発明のソフトウェアを使用し、これにより、オブジェクトに基づくビデオ圧縮を用いて自己のビデオファイル４１８の全てをトランスコードする。トランスコード処理中にオブジェクトモデル４１６が生成される。オブジェクトモデルは、個人用のビデオサービスの一部としてオブジェクトモデルライブラリ４０４にアップロードされる。サービスのメンバがエンコード化されたビデオファイル４１８を別のメンバに転送すると、ファイルサイズは十分に低減される。他のメンバのシステムにおける再生中に、関連するオブジェクトモデル４０４がサーバ４１０からアクセスされ、エンコード化されたビデオストリームを処理して表示する。

システム４００は、特定のメンバからアップロードされたオブジェクトモデルを解析でき、冗長なオブジェクトモデルが存在するか否かを判定する。存在する場合、例えば、メンバは同一の対象（例えば、同一の顔、同一のペットなど）を現わすディジタルビデオを連続的にトランスコードし、同一オブジェクトモデルが何度も繰り返して作成される場合が多い。システム４００は、ユーザ専用であるオブジェクトモデルのキャッシュ（例えば、顔オブジェクトモデルやペットオブジェクトモデルなどのキャッシュ）を作成することによって、この冗長性（重複性）を利用することができる。システムは、さらに、カスタマイズ化されてそのユーザ専用であるコーデック４１７を作成することによって、この冗長性を利用できる。コーデック４１７は、そのユーザに特有なオブジェクトモデル４１６でまとめられる。

サーバ４１０に自己のモデル４１６をアップロードされる十分な数のメンバを有することで、共通または類似のモデルを識別するようにモデルは解析される。最も一般的に用いられ生成されるモデルが追跡される。このようにして、システム４００は、いずれのモデル４１６が最も必要とされそうであるかを学習して判別する。そして、コーデックは最も重要なオブジェクトモデルのみを有するように設計される。

ユーザがエンコード化されたビデオをコーデックで処理しようとし、その特定のモデルがそのコーデッくにまとめられていない場合、システムはサーバ４１０にアクセスして必要なモデルをアーカイブ４０４から取得する。コーデックがサーバ４１０に周期的にアクセスして、新しくアップデートされたオブジェクトモデルでコーデック自体をアップデートしてもよい。

さらなる実施形態として、エンコード化されたビデオは、クライアントノード４１４でアクセス可能な、元の「従来の」ビデオファイルのエンコード化のようなものであってもよい。この場合、より従来的なビデオ処理を容易にするために、より「従来的な」圧縮がハードディスクにビデオを格納するのに用いられながら、この処理の利点がビデオを伝送するのに用いられる。例えば、ビデオ編集アプリケーションが別のフォーマットを使用したい場合、ビデオファイルの伝送中に本発明の方法が主として利用される。

＜コーデックの調整＞
コーデック４１７は、エンコード化されたビデオデータの特定のタイプに調整（チューニング）される。例えば、ビデオストリームが繰り返される特定のオブジェクトを有する場合、オブジェクトモデルよりも、全体にわたる共通のテーマまたは特定のスタイルが、全エンコード化ビデオファイルを再構築する際に使用される。同様に、コーデック４１７は最適化されて、これら繰り返されるオブジェクト（例えば、顔）を取り扱う。それに加えて、ビデオストリームがある特徴を有する映画の場合（例えば、アクションフィルムのような特有のジャンルのフィルム）、フィルムを通して同様のオブジェクトモデル４１６を使用してもよい。ディジタルビデオがフィルムノワールの場合（例えば、目立たず黒と白のビジュアルスタイル）でも、映画の全エンコード化バージョンを再現する際に、特有の明暗および明るさのオブジェクトモデルが適用されることができ、用いられてもよい。このため、エンコード化された映画の一部に適用できる共通のオブジェクトモデル（例えば、構造および明るさのモデル）が存在してもよい。これらモデルは、カスタマイズ化されたコーデックを作成するために、組み合わせてまとめられる。

＜オブジェクトモデルの共有＞
オブジェクトモデルは、複数のユーザ間で共有される。オブジェクトモデルは、サーバまたはデータベースに格納されるので、ビデオファイルをデコード化する際に容易にアクセスされる。オブジェクトモデルは一のユーザコンピュータから他のユーザコンピュータにアクセスされてもよい。図５は、オブジェクトモデルの共有を示すブロック図である。オブジェクトモデルは、サーバ５０４のオブジェクトモデルライブラリ５０２からアクセスされるか、他のクライアントシステム５１０，５２０からアクセスされる。各オブジェクトモデルマネージャ５１２，５２２が、エンコード化されたビデオファイルを処理するのに各クライアント５１０，５２０で必要とされるオブジェクトモデル５１４，５２４を管理する。オブジェクトモデルマネージャは、バージョン制御システムまたはソース制御管理システムに類似する。ここで、システムソフトウェアは、オブジェクトモデル５１４，５２４の進行中の展開を管理する。オブジェクトモデルへの変更は、関連する数字やコード文字（例えば、改訂番号または改定レベル）およびこれまでの関連する変化をインクリメントすることによって、識別される。このようにして、オブジェクトモデル５１４，５２４は追跡されて、オブジェクトモデルへの任意の変更も同様に追跡される。このオブジェクトモデルの電子的な追跡によって、システム５００は、オブジェクトモデルの種々のコピー、バージョンを制御および管理できる。

クライアントサーバフレームワークを用いることに加えて、オブジェクトモデルは、ピア・ツー・ピアネットワークなどの別のフレームワークを用いて共有されて分散される。このようにしてユーザは、ピア・ツー・ピアネットワークにおける他のユーザから圧縮されたビデオファイルおよびオブジェクトモデルをダウンロードする。例えば、映画ハリーポッターのコード化されたバージョンがピア・ツー・ピアネットワークにおけるあるシステムからダウンロード可能であるなら、効率を促進するために、関連のモデル、またはこれらモデルのパーティション（区切り）がネットワークの他のシステムからダウンロード可能である。

＜ディジタル著作権の管理＞
ディジタルビデオへのアクセを保護するために、セキュリティ方法を導入する処理は、長く複雑で高コストである。コンテンツユーザは、煩わしい認証処理を受けることを要求されない、ディジタルコンテンツへの拘束されないアクセスを望む。コンテンツを導入するためにセキュリティモデルを展開する最も複雑な側面は、費用便益分析が全ての参加者、つまりコンテンツユーザ、コンテンツプロバイダーおよびソフトウェア開発者に対応する方法を見つけることである。今のところ、現時点で利用可能な方法は、ディジタルコンテンツへのアクセスを制限ずるために、ユーザフレンドリ、開発者フレンドリ、および財務的に有効な解決をもたらしていない。

エンコード化されたディジタルビデオへのアクセスを制御する方法として、本発明のオブジェクトモデルが用いられる。例えば、関連のオブジェクトモデルなしでは、ユーザはビデオファイルを再生できないであろう。オブジェクトモデルは、ビデオデータにアクセスするためのキーとして用いられる。再生動作において、コード化されたビデオデータは、オブジェクトモデルの補助的な情報に依存する。このアプローチによって、エンコード化されたビデオデータは、オブジェクトモデルにアクセスすることなく、エンコード化されたビデオデータを読み出すことができない。

オブジェクトモデルへのアクセスを制御することによって、コンテンツの再生に対するアクセスが制御される。この方法は、ユーザフレンドリ、開発者フレンドリの解決、およびビデオコンテンツへのアクセスを制限する効率的な解決をもたらす。

さらに、オブジェクトモデルは、コンテンツを段階的にアンロックする。オブジェクトモデルの一定のバージョンを用いて、コード化は、一定レベルをデコードするのみであり、その後、段階的により完全なオブジェクトモデルを用いて、全体ビデオはアンロックされる。最初のアンロックによって、ビデオのサムネイルがアンロックされて、ユーザに、全ビデオが欲しいかを判断する余地を与える。標準画質のバージョンが欲しいユーザは、オブジェクトモデルの次のバージョンを入手するであろう。さらに、高画質または映画の品質が必要なユーザは、オブジェクトモデルのさらに完全なバージョンをこれからダウンロードするであろう。冗長なく、エンコード化サイズおよび品質にふさわしいビデオ品質の段階的な認識を容易にするように、エンコード化およびオブジェクトモデルの両方は、コード化される。

＜処理環境＞
図６は、本発明が実現される、コンピュータネットワークまたは同様のディジタル処理環境を示す。クライアントコンピュータ／装置５０およびサーバコンピュータ６０が、アプリケーションプログラムなどを実行する、処理装置、記憶装置、および入力／出力装置を設ける。クライアントコンピュータ／装置５０は、通信ネットワーク７０を介して、別のクライアント装置／プロセッサ５０およびサーバコンピュータ６０などのその他のコンピュータ装置にリンクされてもよい。通信ネットワーク７０は、リモートアクセスネットワーク、グローバルネットワーク（例えば、インターネット）、コンピュータのワールドワイドの集合形態、ローカルエリアもしくはワイドエリアのネットワーク、およびプロトコル（ＴＣＰ／ＩＰ、Bluetoothなど）を用いるゲートウェイの一部であってもよい。その他の電子的装置／コンピュータネットワークアーキテクチャも適している。

図７は、図６のコンピュータシステムにおけるコンピュータ（例えば、クライアントプロセッサ／装置５０またやサーバコンピュータ６０）の内部構造の図である。各コンピュータ５０，６０は、システムバス７９を含む。ここで、バスはコンピュータまたは処理システムの要素間のデータ転送に用いられるハードウェアラインのセットである。バス７９は、基本的には、コンピュータシステムの異なる要素を接続する共有の電線である。これら要素は、例えば、プロセッサ、ディスクストレージ、メモリ、入力／出力ポート、ネットワークポートなどである。このバスによって、要素間の情報の転送が可能となる。システムバス７９には、入力／出力（Ｉ／Ｏ）装置インタフェース８２が取り付けられており、様々な入力および出力装置をコンピュータ５０，６０に接続する。これら入力および出力装置は、例えば、キーボード、マウス、ディスプレイ、プリンタ、スピーカなどである。ネットワークインタフェース８６によって、コンピュータは、ネットワーク（例えば、図６のネットワーク７０）に取り付けられた様々なその他の装置に接続される。メモリ９０は、本発明の実施形態（例えば、上述のオブジェクトモデル、コーデックおよびオブジェクトモデルライブラリ）を実装するのに用いられる、コンピュータソフトウェア命令９２およびデータ９４用の揮発性ストレージである。ディスクストレージ９５は、本発明の実施形態を実装するのに用いられるコンピュータソフトウェア命令９２およびデータ９４用の不揮発性ストレージである。中央処理装置ユニット８４もシステムバス７９に取り付けられており、コンピュータ命令を実行する。

一実施形態では、プロセッサルーチン９２およびデータ９４は、コンピュータプログラム製品であり、この製品はコンピュータ読み取り可能な媒体（例えば、１つ以上の、ＤＶＤ−ＲＯＭ、ＣＤ−ＲＯＭ、ディスケット、テープ、ハードドライブなどの交換可能ストレージ）を含む。コンピュータプログラム製品は、この分野で周知のように、適切なソフトウェアインストール手続きによってインストールされる。別の実施形態では、少なくとも一部のソフトウェア命令が、ケーブル通信および／または無線通信でダウンロードされてもよい。その他の実施形態では、本発明のプログラムが、伝播媒体（例えば、ラジオ電波、赤外線、レーザ光線、音波、またはインターネットなどのグローバルネットワークを伝播される電磁波）の伝播信号に組み込まれるコンピュータプログラム伝播信号製品１０７である。このようなキャリア媒体または信号は、本発明のルーチン／プログラム９２に、ソフトウェア命令の少なくとも一部を提供する。

別の実施形態では、伝播信号は、アナログキャリア波または伝播媒体で運ばれるディジタル信号である。例えば、伝播信号は、グローバルネットワーク（例えば、インターネット）、電気通信ネットワークなどのネットワークを伝播されるディジタル信号であってもよい。一実施形態では、伝播信号は、ミリ秒、秒、分またはそれ以上の期間にわたってネットワークをパケットで送信されるソフトウェアアプリケーションの命令のような、所定期間に伝播媒体を転送される信号である。別の実施形態では、コンピュータプログラム製品のコンピュータ読み取り可能な媒体は、伝播媒体を受信して、上述のコンピュータプログラム伝播信号製品のような、伝播媒体に組み込まれた伝播信号を特定することによって、受信および読み取りをコンピュータシステムが行う、伝播媒体であってもよい。

一般的に言えば、用語「キャリア媒体」すなわち遷移キャリアは、前述の遷移信号、伝播信号、伝播媒体、記憶媒体などを包含する。

本発明は、本発明の好ましい実施形態に関連して詳細に示され説明されているが、当業者であれば、添付の特許請求の範囲に包含される本発明の範囲から逸脱することなく、形態および細部に様々な変更が可能であることは理解されるであろう。

たとえば、本発明は、様々なコンピュータアーキテクチャにおいて実装される。図４〜７のコンピュータネットワークは、例示のためであり、本発明はこれに限定されるわけではない。

本発明は、完全なハードウェア実施形態、完全なソフトウェア実施形態、またはハードウェア要素およびソフトウェア要素の両方を含む実施形態であってもよい。好ましい実施形態では、本発明はソフトウェアに実装され、このソフトウェアは、これに限定されるわけではないが、ファームウェア、常駐ソフトウェア、マイクロコードなどを含む。

さらに、本発明は、コンピュータまたは任意の命令実行システムによって、またはこれらに組み合わされて使用するためのプログラムコードを提供するコンピュータ使用可能またはコンピュータ読み取り可能な媒体からアクセス可能なコンピュータプログラム製品の形体をとる。この記述のために、コンピュータ使用可能またはコンピュータ読み取り可能な媒体は任意の装置であってもよく、この装置は、命令実行システム、装置または機器によって、またはこれらに組み合わされて使用するためのプログラムを含み、記憶し、通信し、伝播し、または移植する。

媒体は電気、磁気、光、電磁、赤外線、または半導体のシステム（または装置もしくは機器）または伝播システムである。コンピュータ読み取り可能な媒体の例として、半導体もしくは固体メモリ、磁気テープ、取り外し可能なコンピュータディスケット、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ、（ＲＯＭ）、硬質の磁気ディスクおよび光ディスクが挙げられる。光ディスクの例には、コンパクトディスク、つまり読み取り専用（ＣＤ−ＲＯＭ）、読み取り／書き込み（ＣＤ−Ｒ／Ｗ）およびＤＶＤが含まれる。

プログラムコードを格納および／または実行するのに適したデータ処理システムは、メモリ要素にシステムバスを介して直接的または間接的に結合された少なくとも１つのプロセッサを含む。メモリ要素は、プログラムコードの実際の実行中に採用されるローカルメモリ、大容量記憶装置、およびキャッシュメモリを含む。ここで、キャッシュメモリは、実行中に大容量記憶装置から取り出されるコードの回数を低減するために、少なくともプログラムコードの一時的な格納を提供する。

入力／出力すなわちＩ／Ｏ装置（これらに限定されるわけではないが、キーボード、ディスプレイ、ポインティング装置などを含む）が、システムに、直接またはＩ／Ｏコントローラを介して結合される。

ネットワークアダプタがシステムに結合されてもよく、これにより、データ処理システムは他の処理システムまたは遠隔プリンタもしくは記憶装置に、プライベートまたは公共のネットワークを介して結合される。モデム、ケーブルモデムおよびイーサネット（登録商標）カードは、現在利用可能なタイプのネットワークアダプタのほんの一部にすぎない。

さらに、実施形態のいくつかにおいては、以下の広告構成があってもよい。
＜オブジェクトモデルを用いるビデオにおける広告の埋め込み＞
オブジェクトモデルが用いられて、広告を含むフレームが再生中にビデオストリームに挿入される。このため、実際のエンコード化されたビデオコンテンツは広告によって改変される必要がない。しかし、エンコード化されたビデオの再構築（例えば再生）の間、モデルは、広告を提供するフレームが再生ビデオストリーム中に生じるようにさせる。

Claims

コンピュータに実装される各工程であって、
ビデオ信号において表現される１つ以上のオブジェクトについてのオブジェクトモデルを作成するように、複数のビデオ信号を処理する処理工程と、
前記オブジェクトモデルをアーカイブするアーカイブ工程と、
圧縮されたビデオファイルを処理する際に１つ以上のアーカイブされたオブジェクトモデルを用いる使用工程とを備えた、ビデオ処理方法。
請求項１において、前記アーカイブ工程が、さらに、コンピュータに実装される各工程であって、
実質的に等しいオブジェクトモデルが前記アーカイブに格納されているかを判別するように、１つ以上の前記アーカイブされたオブジェクトモデルを比較する比較工程と、
重複する実質的に等しいオブジェクトモデルを除外することによって、前記アーカイブのサイズを低減する低減工程とを有する、ビデオ処理方法。
請求項２において、前記低減工程は、さらに、コンピュータに実装される各工程であって、
１つ以上のオブジェクトモデルを共通のオブジェクトに組み合わせることによって、前記アーカイブのサイズを低減する工程と、
前記共通のオブジェクトを用いて、１つ以上の低減された元のオブジェクトモデルを生成する工程とを有する、ビデオ処理方法。
請求項１において、前記アーカイブ工程が、さらに、コンピュータに実装される工程であって、
類似する１つ以上の前記アーカイブされたオブジェクトモデルを組み合わせる工程を有する、ビデオ処理方法。
請求項１において、前記アーカイブ工程が、さらに、コンピュータに実装される工程であって、
圧縮されたビデオファイルにおけるオブジェクトの再現に最適化しているカスタマイズされたコーデックを作成するように、オブジェクトモデルをグループ分けする工程を有する、ビデオ処理方法。
請求項１において、前記圧縮されたビデオファイルは、類似の特徴を有する他の圧縮されたビデオファイルのグループに関連付けられ、コーデックは前記グループにおける前記圧縮されたビデオファイルの再現に最適化されている、ビデオ処理方法。
請求項６において、圧縮されたビデオファイルの前記グループは、ユーザに関する個人用の情報に基づいて判別される、ビデオ処理方法。
請求項７において、ユーザに関する前記個人用の情報は、ユーザによって提供された他のビデオファイルを解析することによって判別される、ビデオ処理方法。
請求項８において、前記ユーザによって提供された前記ビデオファイルの解析は、さらに、コンピュータに実装される工程であって、
前記ユーザによって提供された前記ビデオファイルに現われる繰り返しのオブジェクトを識別する工程であって、この繰り返しのオブジェクトが、前記ユーザによって提供された前記ビデオファイルにおいて識別された人間の顔および動物を含む、工程を有する、ビデオ処理方法。
請求項８において、前記ユーザによって提供された前記ビデオファイルは、従来のエンコード化処理を用いてエンコード化される、ビデオ処理方法。
請求項１０において、前記従来の方法でエンコード化されたビデオに含まれた情報が、前記ビデオを処理およびエンコード化する方法を判定するために用いられる、ビデオ処理方法。
請求項１０において、前記ユーザによって提供された前記ビデオファイルの処理に追加の制約が課されて、前記ビデオファイルの前記従来のエンコード化が再作成される、ビデオ処理方法。
請求項６において、圧縮されたビデオファイルの前記グループは、前記圧縮されたビデオファイルに現われる繰り返しのオブジェクトに基づいて判別される、ビデオ処理方法。
請求項５において、前記カスタマイズされたコーデックが前記圧縮されたビデオファイルの再現に用いられる、ビデオ処理方法。
請求項１において、圧縮されたビデオファイルを処理する際に、１つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される工程であって、
前記圧縮されたビデオファイルを再現するために、前記１つ以上のアーカイブされたオブジェクトモデルおよびコーデックを用いる工程を備えた、ビデオ処理方法。
請求項１において、圧縮されたビデオファイルを処理する際に、１つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される各工程であって、
ユーザコンピュータにおいて、前記圧縮されたビデオファイルを別のユーザコンピュータから受信する工程と、
１つ以上の前記アーカイブされたオブジェクトモデルをサーバからアクセスする工程とを備えた、ビデオ処理方法。
請求項１６において、前記サーバが、ユーザについてのサーバにおけるアーカイブされたオブジェクトモデルを保持するビデオ処理サービスと組み合わせて使用され、前記ビデオ処理サービスは、他のユーザについての他のアーカイブされたオブジェクトモデルを保持する、ビデオ処理方法。
請求項１において、圧縮されたビデオファイルを処理する際に、１つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される工程であって、
ピア・ツー・ピアネットワークにおいて、複数のユーザコンピュータ間で前記アーカイブされたオブジェクトモデルを共有する共有工程を備えた、ビデオ処理方法。
請求項１８において、前記共有工程は、さらに、コンピュータに実装される各工程であって、
ピア・ツー・ピアネットワークにおいて、第１のユーザコンピュータから前記圧縮されたビデオファイルを受信する工程と、
前記要求に応答して、ピア・ツー・ピアネットワークにおいて、前記アーカイブされたオブジェクトモデルの１つを第２のユーザコンピュータから送信する工程と、
前記要求に応答して、ピア・ツー・ピアネットワークにおいて、前記アーカイブされたオブジェクトモデルの別の１つを第３のユーザコンピュータから送信する工程とを有する、ビデオ処理方法。
請求項１において、１つ以上の前記アーカイブされたオブジェクトモデルが、前記圧縮されたビデオファイルへのアクセスを制御するために用いられる、ビデオ処理方法。
請求項１において、１つ以上の前記アーカイブされたオブジェクトモデルを用いて、前記圧縮されたビデオファイルが処理されて再現される際に、１つ以上の広告が前記再現された前記ビデオファイル内に挿入されるように、１つ以上の前記アーカイブされたオブジェクトモデルがさらに広告を含む、ビデオ処理方法。
請求項１において、圧縮されたビデオファイルを処理する際に、１つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、
１つ以上の前記アーカイブされたオブジェクトモデルに基づいて、１つ以上のオブジェクトの陰的表現を作成する工程を備えた、ビデオ処理方法。
請求項１において、前記オブジェクトモデルが、変形モデル、構造モデルおよび概観モデルを有する、ビデオ処理方法。
ビデオ信号において表現される１つ以上のオブジェクトについてのオブジェクトモデルを作成するように、ビデオ信号を処理するエンコーダと、
前記オブジェクトモデルを格納するオブジェクトライブラリと、
コード化されたビデオファイルを再現する際に、１つ以上の前記アーカイブされたオブジェクトモデルを用いるために、コーデックおよび前記オブジェクトライブラリにアクセスするデコーダとを備えた、ビデオ処理コンピュータシステム。
ビデオ信号において表現される１つ以上のオブジェクトについてのオブジェクトモデルを作成するように、複数のビデオ信号を処理する手段と、
前記オブジェクトモデルをアーカイブする手段と、
圧縮されたビデオファイルを処理する際に１つ以上のアーカイブされたオブジェクトモデルを用いる手段とを備えた、ビデオ処理コンピュータシステム。