JP2010517426A - オブジェクトアーカイブシステムおよび方法 - Google Patents

オブジェクトアーカイブシステムおよび方法 Download PDF

Info

Publication number
JP2010517426A
JP2010517426A JP2009547252A JP2009547252A JP2010517426A JP 2010517426 A JP2010517426 A JP 2010517426A JP 2009547252 A JP2009547252 A JP 2009547252A JP 2009547252 A JP2009547252 A JP 2009547252A JP 2010517426 A JP2010517426 A JP 2010517426A
Authority
JP
Japan
Prior art keywords
video
computer
video file
user
object models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009547252A
Other languages
English (en)
Inventor
ペース・チャールズ・ピー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Euclid Discoveries LLC
Original Assignee
Euclid Discoveries LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Euclid Discoveries LLC filed Critical Euclid Discoveries LLC
Publication of JP2010517426A publication Critical patent/JP2010517426A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8355Generation of protective data, e.g. certificates involving usage data, e.g. number of copies or viewings allowed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23412Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2541Rights Management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25816Management of client data involving client authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4335Housekeeping operations, e.g. prioritizing content for deletion because of storage space restrictions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44012Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4627Rights management associated to the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/632Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing using a connection between clients on a wide area network, e.g. setting up a peer-to-peer communication via Internet for retrieving video segments from the hard-disk of other client devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】ビデオを処理して圧縮する個人のオブジェクトに基づくアーカイブシステムを提供する。
【解決手段】ユーザに関連した、顔、家族、およびペットなどのユーザにユニークな特徴を解析することによって、不変なモデルが判定されて、各ユーザに個別のオブジェクトモデルアダプタを作成する。これら個人別のビデオオブジェクトモデルは、幾何学的および概観モデル化の技法を用いて作成される。そして、これらオブジェクトモデルはオブジェクトモデルライブラリに格納される。オブジェクトモデルは、多くのユーザの間でピア・ツー・ピアネットワークにおいて共有されるか、サーバのオブジェクトモデルライブラリに格納される。圧縮された(エンコード化された)ビデオが再現される際に、ビデオオブジェクトモデルがアクセスされて用いられ、ほとんど損失のなり圧縮の品質ビデオを生成する。
【選択図】図3

Description

関連出願
本出願は、2007年1月23日出願の米国仮特許出願第60/881,982号の優先権を主張する。本出願は、2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」の米国仮特許出願第60/991,966号および2006年1月8日出願で発明の名称が「画像データを処理する装置および方法」の米国仮特許出願第60/811,890号に関連する。本出願は、また、2005年7月28日出願の米国特許出願第11/191,562号の部分継続出願である、2005年9月20日出願の米国特許出願第11/230,686号の部分継続出願である、2005年11月16日出願の米国特許出願第11/280,625号の部分継続出願である、2006年1月20日出願の米国特許出願第11/336,366号の部分継続出願である、2006年3月31日出願の米国特許出願第11/396,010号に関連する。上記各出願の全内容は参照により本明細書に引用したものとする。
本発明はビデオデータを処理して圧縮するのに用いられるオブジェクトアーカイブシステム(オブジェクトの保管システム)に関する。
ディジタルビデオの最近の人気によって、ビデオ圧縮の需要が劇的に増加している。ビデオ圧縮はディジタル媒体の格納および転送に必要とされるビット数を低減する。ビデオデータは空間および時間の冗長性(重複)を含み、これら空間および時間の類似性はフレーム(空間)内およびフレーム間(時間)における差分を記録することによってエンコード化される。圧縮を実行するハードウェアまたはソフトウェアは、CODEC(コーデック)(符号化器(エンコーダ)/復号化器(デコーダ))と呼ばれる。コーデックは、ディジタル信号に符号化(エンコード化)および復号化(デコード化)を実行できる装置またはソフトウェアである。データを大量に使用するディジタルビデオアプリケーションが広く普及してきているため、信号をエンコード化するのにより効率的な方法が必要とされている。このようにして、ビデオ圧縮は、記憶装置および通信の技術における中心的なコンポーネントとなっている。
残念なことに、従来のビデオ処理方法では、遅いデータ通信速度、大きな記憶容量条件、および妨害となる知覚に影響を及ぼすものの形態で現れる、多くの非効率に苦しんでいる。ビデオデータの品質を維持しながら容易かつ効率的に操作する必要がある様々なユーザにとって、これら障害は重大な問題となる可能性がある。特に、何らかの形式の視覚情報に対して人間が生得的感受性を有することに鑑みれば、特に重要である。
ビデオ圧縮において、複数の重要なファクタが一般的に考慮される。これらファクタには、ビデオ品質およびビットレート、エンコード化およびデコード化のアルゴリズムの計算の複雑さ、データの損失および誤差に対するロバスト性、ならびに待ち時間が含まれる。ビデオデータ量がインターネット上で急増しているため、コンピュータに対するのみでなく、テレビや携帯電話などの手持ち式装置に対しても、輻輳を大幅に緩和して品質を向上させる技術が著しい進展となる。
ビデオを処理するシステムおよび方法が、現在の最新技術に対して計算および分析における利点をもたらす。ビデオ信号が処理されて、ビデオ信号において表現された1つ以上のオブジェクトからオブジェクトモデルを作成する。オブジェクトモデルはアーカイブされる(保管される)。アーカイブされたオブジェクトモデルは、構造、変形、外観および明るさのモデル化のためにオブジェクトモデルのライブラリとして用いられる。1つ以上のアーカイブされたオブジェクトモデルは、圧縮されたビデオファイルを処理する際に用いられる。1つ以上のアーカイブされたオブジェクトモデルおよびコーデックが、圧縮されたビデオファイルを復元するのに用いられる。オブジェクトモデルは、ビデオ信号において表現された1つ以上のオブジェクトの陰的表現を作成するのに用いられる。
アーカイブに格納された実質的に等しいオブジェクトモデルが存在するか否かを判別するように、アーカイブのオブジェクトモデルが比較される。互いに実質的に等しい重複オブジェクトモデルを除外することによって、アーカイブのサイズは低減される。類似するアーカイブのオブジェクトモデルは組み合わされる。
圧縮されたビデオファイルを復元するのにビデオコーデックが用いられる。オブジェクトモデルはビデオコーデックとは別に格納される。オブジェクトモデルは、ビデオコーデックに含まれても、ビデオコーデックとセットにされてもよい。カスタマイズ化されたコーデックは、オブジェクトモデルのいくつかをグループ化することによって作成される。カスタマイズ化されたコーデックは、圧縮されたビデオファイルを復元するために最適化される。
圧縮されたビデオファイルは、類似の特徴を有する他の圧縮されたビデオファイルのグループと関連付けられる。カスタマイズ化されたコーデックは、このグループの任意の圧縮されたビデオファイルを復元するように最適化される。圧縮されたビデオファイルのグループは、ユーザについての個人専用の情報に基づいて判別される。ユーザによって提供された圧縮されていないビデオファイルを解析することによって、ユーザについての個人専用の情報が判別される。ユーザの圧縮されていないビデオファイルが解析されると、ユーザの圧縮されていないビデオファイルにおいて繰り返されているオブジェクトが識別される。繰り返されているオブジェクトは、例えば、ユーザの圧縮されていないビデオファイルにおいて識別された人間の顔または動物である。カスタマイズ化されたオブジェクトモデルが作成されて、これら繰り返されているオブジェクトを復元するように訓練される。圧縮されたビデオファイルを復元する、カスタマイズ化されたコーデックを作成するのに、カスタマイズ化されたオブジェクトが用いられる。
圧縮されたビデオファイルは、あるユーザコンピュータから別のコンピュータに送信される。この圧縮されたビデオファイルが復元されている間、アーカイブされたオブジェクトモデルはサーバからアクセスされる。複数のユーザについてのアーカイブされたオブジェクトモデルを維持してマイニングする(情報を得るために調べる)のに、サーバが用いられる。サーバはオブジェクトモデルライブラリを作成する。このようにして、ビデオ処理サービスが提供される。ここで、サービスのメンバは自己のオブジェクトモデルをサーバに格納でき、自己の圧縮されたビデオファイルを復元するためにサーバから遠隔にオブジェクトモデルにアクセスする。
アーカイブされたオブジェクトモデルは、ピア・ツー・ピアネットワークにおいて複数のユーザコンピュータの間で共有される。ピア・ツー・ピアネットワークにおいて、圧縮されたビデオファイルに対する要求があるコンピュータから受信される。この要求に応答して、アーカイブされたオブジェクトモデルの1つが、ピア・ツー・ピアネットワークにおいて別のユーザコンピュータから送信される。また、この要求に応答して、アーカイブされたオブジェクトモデルの別の1つが、ピア・ツー・ピアネットワークにおいてさらに別のユーザコンピュータから送信される。さらにこの要求に応答して、アーカイブされたオブジェクトモデルの別の1つまたはこれらモデルの小分割(sub-partitioning)が、ピア・ツー・ピアネットワークにおいてさらに別のユーザコンピュータから送信される。このようにして、アーカイブされたオブジェクトモデルは、分散アプローチを用いて維持されて配布される。
圧縮されたビデオストリームに対するアクセスを制御するのに、1つ以上のオブジェクトモデルが用いられる。オブジェクトモデルはコーデックで用いられて、圧縮されたビデオファイルを復元する。ビデオファイルは、1つ以上のオブジェクトモデルを用いることなく、ユーザのコンピュータで復元または解釈されてもよい。オブジェクトモデルへのアクセスを制御することによって、圧縮されたビデオファイルのアクセス(例えば、再生アクセス)が制御される。オブジェクトモデルは、ビデオデータにアクセスするのにキーとして用いられる。コード化されたビデオデータの再生動作は、オブジェクトモデルに依存する。このアプローチによって、圧縮されたビデオデータはオブジェクトモデルにアクセスすることなく読込み可能となる。このようにして、オブジェクトモデルは、暗号化およびディジタル著作権管理に用いられる。異なる品質のオブジェクトモデルが用いられて、同一ビデオファイルから解凍されるビデオについて異なる品質レベルを提供する。これは、共通ビデオファイルの差分デコード化を考慮する。(例えば、用いられるオブジェクトモデルおよび共通のビデオファイルに基づく、ビデオの標準精細度(Standard Definition)および高精細度(High Definition)のバージョン)。
1つ以上のオブジェクトモデルは、再生の際に復元されたビデオストリームに挿入される広告を含む。例えば、コード化ビデオの復元(再生)中に、モデルは、広告を提供するフレームが再生ビデオストリーム内に生成されるようにする。
ビデオを処理するソフトウェアシステムが提供される。エンコーダがビデオ信号を処理して、ビデオ信号内に表現された1つ以上のオブジェクトについてのオブジェクトモデルを作成する。オブジェクトライブラリがオブジェクトモデルを格納する。デコーダが、コード化されたビデオファイルを復元する際に、コーデックおよびオブジェクトライブラリからの1つ以上のアーカイブされたオブジェクトモデルを用いる。
上記の内容は、添付図面に示される本発明の例の実施形態のより詳細な説明から明らかになるであろう。図面では、同一参照符号はそれぞれの図全体を通して同一部分を指す。図面は必ずしも縮尺どおりでなく、本発明の実施形態を説明することに重点が置かれている。
本発明の実施形態において用いられるビデオ圧縮(一般に画像処理)システムのブロック図である。 本発明の実施形態において用いられるハイブリッド空間正規化圧縮方法を示すブロック図である。 好ましい実施形態においてオブジェクトモデルをアーカイブする処理を示すフローチャートである。 クライアント−サーバフレームワークを用いた、本発明の個人ビデオ処理サービスのアーキテクチャの例を示す概略図である。 オブジェクトモデルを共有する本発明を示すブロック図である。 コンピュータネットワークまたは類似のディジタル処理環境を示し、本発明の実施形態が実現される環境の概略図である 図6のネットワークのコンピュータの内部構造のブロック図である。
本発明の例示的な実施形態を以下に記述する。
<オブジェクトモデルの作成>
ビデオ信号データでは、画像シーケンスにビデオフレームが組み立てられる。ビデオの対象は、通常カメラの2次元画像表面に射影された3次元シーンである。合成されて生成されたビデオの場合、解釈には「仮想」カメラが用いられる。アニメーション(動画)の場合、アニメ製作者は参考のこのカメラフレームを管理する役割を担う。各フレームすなわち画像は、サンプル信号に対する画像センサ応答を表現する画素(pel)から構成されている。多くの場合、サンプル信号は、2次元センサアレイにおいてカメラのコンポーネントからサンプル化される特定の反射、屈折または放射されたエネルギ(例えば、電磁エネルギ、音響エネルギなど)に相当する。連続的な時系列サンプリングによって、フレーム当たりの空間2次元と、ビデオシーケンスにおけるフレーム順序に対応する時間次元とを備える、時空間データストリームを得ることができる。この処理は、通常「画像」処理と称される。
本発明は、ビデオ信号データが効率的に1つ以上の有用な表現に処理される手段を提供する。本発明は、ビデオ信号において多くの共通に繰り返されるデータセットを処理するのに有効である。ビデオ信号が解析され、そのデータの1つ以上の簡潔な表現が提供されてその処理およびエンコード化を容易にする。新しくてより簡潔なデータ表現によって、計算処理、伝送帯域幅および記憶装置の多くの用途に対する要件が軽減される。処理には、これらに限定されるわけではないが、ビデオ信号のコード化、圧縮、伝送、解析、記憶および表示が含まれる。雑音のような不必要な信号部分は低い優先度に識別されて、さらなる処理はビデオ信号の優先度の高い部分を解析して表現することに重点が置かれる。その結果、ビデオ信号はこれまでよりも、より簡潔に表現される。そして、正確さの損失は、知覚的に重要でないビデオ信号部分に集中される。
2006年1月20日出願の米国特許出願第11/336,366号および2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」である米国特許出願(代理人の管理番号4060.1009-000)(全内容はここで引用されているものとする)に記載のように、ビデオ信号データは解析されて顕著なコンポーネントが識別される。空間時間的なストリームは、たいていは独特なオブジェクトである顕著なコンポーネント(例えば顔)を明らかにする。識別処理は、顕著なコンポーネントの存在および重要度を特定して、特定された顕著なコンポーネントのうちの最も重要な1つ以上を選択する。これは、ここで説明されている処理後または処理と同時に行われる、顕著性がより小さい他の顕著なコンポーネントの識別および処理を制限するわけではない。上述の顕著なコンポーネントはその後さらに解析され、変化するサブコンポーネントおよび不変のサブコンポーネントが識別される。不変サブコンポーネントの識別は、コンポーネントの特定の様相のモデル化処理である。これにより、コンポーネントを所望の正確度に合成できるモデルのパラメータ表現が明らかになる。
一実施形態において、PCA/ウェーブレットのエンコード化技法が前処理されたビデオ信号に適用されて、所望の圧縮ビデオ信号を形成する。前処理によってビデオ信号の複雑さを減少させて、主成分分析(PCA)/ウェーブレットのエンコード化(圧縮)が向上した作用で適用されるようにする。PCA/ウェーブレットのコード化については、同時係属の出願である、2006年1月20日出願の米国特許出願第11/336,366号および2007年1月23日出願で発明の名称が「画像データを処理するコンピュータ方法および装置」である米国特許出願(代理人の管理番号4060.1009-000)に詳細に説明されている。
図1は本発明の原理を採用する例示的な画像処理システム100のブロック図である。ソースビデオ信号101が入力されて前処理プロセッサ102によって受信される。前処理プロセッサ102は、ソースビデオ信号101における対象コンポーネント(顕著なオブジェクト)を判別するために帯域消費を用いるか、または顔/オブジェクト検出器のような他の基準を用いる。特に、前処理プロセッサ102は、ビデオ信号101において、不均衡な帯域幅を用いる部分のその他の部分に対する比を判別する。この判別を行うセグメンタ(セグメント化器、セグメント化部)103に関する方法は、以下の通りである。
セグメンタ103が、上述の画素の微分における時間および/または空間の差分を用いて、時間および/空間に渡って画像勾配を分析する。コヒーレンスに監視するために、ビデオ信号の逐次的なフレームに渡って、互いに対応するビデオ信号部分が追跡されて注目される。これらコヒーレントな(一貫した)信号コンポーネントの微分場の有限差分が統合されて、ビデオ信号の判別された部分を生成する。この判別された部分とは、他の部分に対して不均衡な帯域幅を用いる部分である。すなわち、対象コンポーネントを判別する。好ましい実施形態では、後続フレームにおける空間不連続に対応する空間不連続が1つのフレームにおいて発見されると、画像勾配の急激さまたは平滑さが解析されて、一意の対応(時間コヒーレンシ(時間的な一貫性))を生じさせる。さらに、このような対応(相関関係)の集まりも、ビデオフレームの離散的なコンポーネントの時間コヒーレンシに一意に帰するように同一の方法で採用される。急峻な画像勾配についてはエッジが存在すると判別される。このような空間不連続を画定するエッジが2つ存在する場合、コーナーが決定される。これら識別された空間不連続は勾配フローと組み合わされて、ビデオデータの複数のフレームに渡る対応画素間の動きベクトルを生成する。動きベクトルが識別された空間不連続と一致する場合、本発明のセグメンタ103は、対象のコンポーネント(顕著なオブジェクト)が存在すると判別する。
他のセグメント化技法がセグメンタ103を実現するのに適している。
図1において、前処理プロセッサ102(セグメンタ103)が、対象のコンポーネント(顕著なオブジェクト)を判別すると(すなわち、ソースビデオ信号101から対象のコンポーネントをセグメント化すると)、判別した対象のコンポーネントの複雑さを正規化器(正規化部)105が低減する。好ましくは、正規化器105は、判別された対象のコンポーネントから、全体の動きおよび姿勢、全体構造、局所変形、外観ならびに明るさの変動を取り除く。これまでに述べた関連出願に記載された前述の正規化技法がこのために利用される。これにより、正規化器105は対象のコンポーネントの構造モデル107および外観モデル108を確立する。
構造モデル107は、数学的には以下のように表現される。
Figure 2010517426
ここで、σは、顕著なオブジェクト(判別された対象のコンポーネント)であり、SM()はそのオブジェクトの構造モデルである。vx,yは、経時的に位置合せされたオブジェクトにおける、区分(piece-wise)線形正規化メッシュの2次元メッシュ頂点である。Δtは、期間tにおける頂点の変化であり、複数のビデオフレーム間のオブジェクトの拡大縮小(すなわち局所変形)、回転および並進を経時的に表現する。Zは、全体動きである。式1から、全体の固定の構造モデル、全体動き、姿勢および局所的に導出された変形が引き出される。構造部分の候補構造(経時のビデオフレームの対象のコンポーネント)を判定するために、動きから構造を推定する既知の技法が用いられて、動き検出と組み合わされる。これにより、顕著なオブジェクトの空間における位置および方向が決定されて、構造モデル107および動きモデル111がもたらされる。
外観モデル108は、次に、構造モデル107および動きモデル111によって集合的ではなくモデル化される顕著なオブジェクトの特性および様相を表現する。一実施形態では、外観モデル108は経時的な構造変化の線形分解であり、構造モデル107から全体動きおよび局所変形を除去することによって決定される。出願人は、各ビデオフレームにおけるオブジェクト外観を取得し、構造モデル107を用いて、「正規化された姿勢」に再射影する。「正規化された姿勢」は、また、1以上の「基本的な(cardinal)」姿勢と称される。再射影は、オブジェクトの正規化されたバージョンを表現し、外観における任意の変化を生成する。所与のオブジェクトが複数のビデオフレーム間で回転しているかまたは空間的に並進されているので、外観は単一の基本的な姿勢(すなわち、平均の正規化された表現)に位置付けられる。外観モデル108は、また、基本的な姿勢の基本的な変形(例えば、目が開く/閉じられる、口が開く/閉じられるなど)を明らかにする。したがって、外観モデル108 AM(σ)は、基本的な姿勢Pおよび基本的な姿勢Pの基本的な変形Δによって表現される。
Figure 2010517426
外観モデル108の画素は、好ましくは、カメラの投影軸に対する距離および入射角度に基づく。バイアスをかけることで、モデルの最終形式に対する各画素の寄与の相対加重を判別する。したがって、好ましくは、この「サンプルバイアス(sampling bias)」が全てのモデルの全ての処理を組み込む。候補構造の(構造モデル107からの)経時追跡は、姿勢、動きおよび変形の推定量からの示唆によって、全画素の動きの予測を構成して可能とする。
さらに、外観および明るさのモデル化に関して、画像処理における持続的な挑戦の1つは、変化する明暗条件のもとで、オブジェクトを追跡している。画像処理において、コントラストの正規化は、ピクセル輝度(pixel intensity)値の変化を、明暗/明るさの変化以外の因子に起因するよりもむしろ、明暗/明るさの変化に起因するものとしてモデル化する処理である。好ましい実施形態では、ビデオが取り込まれる際の顕著なオブジェクトの明るさ条件の任意の変化を推定する(すなわち、オブジェクトに当たる明るさをモデル化する)。これは、ランベルト反射の線形部分空間(Lambertian Reflectance Linear Subspace (LRLS))理論からの原理にオプティカルフローを組み合わせて達成される。LRLS理論によれば、オブジェクトが固定されて好ましくは明るさの変化のみが許容されると、反射画像のセットは最初の9つの球面調和関数の線形な組合せによって近似される。これにより、画像は、周囲「画像」ベクトル空間における9D線形部分空間に近接する。さらに、画像ピクセル(x,y)の反射輝度は、次のように近似される。
Figure 2010517426
LRLSおよびオプティカルフローを用いて、いかに明暗がオブジェクトと相互作用するかを判定するために期待値が計算される。これら期待値は、オプティカルフロー場における変化を説明できるオブジェクトの動きを拘束するのに役立つ。明るさモデル化を用いるオブジェクトの外観を記述するのにLRLSを用いると、さらに、明るさモデルの予測の範囲から外れる任意の外観変化を処理することを外観モデルに許可する必要がある。
対象のコンポーネントの複雑さが対応する元のビデオ信号から低減されるが対象のコンポーネントの顕著性は維持される限り、外観モデル108および構造モデル107の他の数学的表現も適切である。図1を参照して、PCA/ウェーブレットのエンコード化が、次にアナライザ(分析器、解析器)110によって構造オブジェクトモデル107および外観オブジェクトモデル108に適用される。より詳細には、アナライザ110は、対象のコンポーネントに対応するビデオデータを圧縮(エンコード化)するために、幾何学的データ解析を採用する。得られる圧縮された(エンコード化された)ビデオデータは、図2の画像処理システムにおいて用いられることができる。より詳細には、これらオブジェクトモデル107,108は、図2のエンコード化側232およびデコード化側236において蓄積されてもよい。構造モデル107および外観モデル108から、有限状態マシンが生成されてもよい。従来のエンコード化232およびデコード化236も、従来のウェーブレットビデオコード化デコード化方法として実装されてもよい。
PCAコード化が両側232,236において正規化された画素データに適用される。これにより、各側232,236において同一の基底ベクトルセットを形成する。好ましい実施形態では、PCA/ウェーブレットが画像処理中に基底関数に適用されて、所望の圧縮ビデオデータを生成する。ウェーブレット技法(DWT)は、全体画像および部分画像を変換し、外観モデル108および構造モデル107を線形分解する。そして、所望のしきい値目標(EZT式またはSPIHT式)を満たすように、この分解されたモデルは正常に打ち切られる。これによって、拡大縮小可能なビデオデータ処理が容易になり、これは、ビデオデータの「正規化」性質による従来のシステムや方法とは異なる。
図2に示すように、1つ以上のオブジェクト230,250についての圧縮されていないビデオストリームの先に検出されたオブジェクトインスタンスが、従来のビデオ圧縮方法232の別個のインスタンスでそれぞれ処理される。さらに、オブジェクト230,250のセグメント化から生じた非オブジェクト202も、従来のビデオ圧縮232を用いて圧縮される。これら別個の圧縮エンコード化232のそれぞれの結果は、各ビデオストリームに別々に対応する従来の方法でエンコード化された別個のストリーム234である。おそらくは伝送の後である、ある時点で、これら中間のコード化されたストリーム234が、正規化された非オブジェクト210および多数の正規化されたオブジェクト238,258の合成に、デコーダ236で解凍される。画素が空間において相対的に正しく位置するように、これら合成された画素は、これらの各非正規化バージョン222、242および262に非正規化240されることができる。これにより、合成処理270が、オブジェクトおよび非オブジェクトの画素を組み合わせて完全なフレームの合成272とすることができる。
<データマイニングオブジェクトモデル>
これらオブジェクトモデル(例えば、変形、構造、動き、明るさおよび外観モデル)をアーカイブすることによって、これらオブジェクトモデルの持続的な形式が決定されて他のビデオストリームの処理に再利用される。例えば、ディジタルビデオがカメラからインポートされると、ディジタルビデオはトランスコード(形式変換)されて、任意のオブジェクトモデルがマッチするか否かを判定するために、ビデオオブジェクトのアーカイブがアクセスされる。これはフレームごとに実行されるが、同様のアイテムを共にグループ化してビデオストリームの一部またはビデオストリームの全部がバッチ処理を用いて解析されてもよい。フレームは非逐次的に解析されてもよく、いずれのオブジェクトモデルがコード化に最も適しているかを判定するために統計解析が実行されてもよい。
図3は、オブジェクトモデルのアーカイブ処理300を示すフローチャートである。ステップ302において、オブジェクトモデルが上述のように識別される。ステップ304において、オブジェクトモデルはアーカイブすなわちオブジェクトモデルライブラリに統合される。ステップ306において、オブジェクトモデルは比較されて、ステップ308において類似のオブジェクトモデルが識別される。ステップ310において、冗長な(重複する)オブジェクトモデルが除去されて、類似のモデルは統合される。ステップ312において、ビデオオブジェクトモデルへのポンタ/識別器が更新される。オブジェクトモデルへのポインタは、コード化されたビデオストリームに用いられ、例えば、ライブラリにおける関連する更新されたオブジェクトモデルを参照するために、オブジェクトモデルへのポインタが更新される。
このようにして、本発明のアーカイブシステム300はオブジェクトライブラリにおけるこれらオブジェクトモデルをマイニングし(情報を得るために調べ)、類似のオブジェクトモデルを識別するためにオブジェクトモデルを解析する。類似のオブジェクトモデルが識別されると、システム300は、何度も使用される一般的なオブジェクトモデルを作成することによって、冗長性(重複性)を活用できる。類似性は、同様の構造、変形、動き、明るさ、および/または外観に基づく傾向がある。
オブジェクトモデルは、あらゆる方法で後に続くビデオ処理に使用される。後述するように、モデルはクライアント/サーバのフレームワークにおいて使用でき、オブジェクトモデルはコード化されたビデオファイルをデコードする際に用いるためのビデオコーデックでパッケージにまとめられることができ、モデルは個人のビデオサービスにおいて用いられることができ、さらに、モデルは分配されて分配システム(例えばピア・ツー・ピア)を用いる多くのユーザが利用可能となる。さらに、モデルの処理は、分散コンピュータネットワークにおいて生じてもよい。
<個人用のビデオ処理サービス>
オブジェクトモデルがサーバに格納された例において、個人用のビデオ処理サービスが提供できる。図4は、クライアント414サーバ410のフレームワークを用いた個人のビデオ処理サービス400のアーキテクチャの例を示す概略図である。この例では、個人のビデオサービスのユーザすなわちメンバは、本発明のソフトウェアを使用し、これにより、オブジェクトに基づくビデオ圧縮を用いて自己のビデオファイル418の全てをトランスコードする。トランスコード処理中にオブジェクトモデル416が生成される。オブジェクトモデルは、個人用のビデオサービスの一部としてオブジェクトモデルライブラリ404にアップロードされる。サービスのメンバがエンコード化されたビデオファイル418を別のメンバに転送すると、ファイルサイズは十分に低減される。他のメンバのシステムにおける再生中に、関連するオブジェクトモデル404がサーバ410からアクセスされ、エンコード化されたビデオストリームを処理して表示する。
システム400は、特定のメンバからアップロードされたオブジェクトモデルを解析でき、冗長なオブジェクトモデルが存在するか否かを判定する。存在する場合、例えば、メンバは同一の対象(例えば、同一の顔、同一のペットなど)を現わすディジタルビデオを連続的にトランスコードし、同一オブジェクトモデルが何度も繰り返して作成される場合が多い。システム400は、ユーザ専用であるオブジェクトモデルのキャッシュ(例えば、顔オブジェクトモデルやペットオブジェクトモデルなどのキャッシュ)を作成することによって、この冗長性(重複性)を利用することができる。システムは、さらに、カスタマイズ化されてそのユーザ専用であるコーデック417を作成することによって、この冗長性を利用できる。コーデック417は、そのユーザに特有なオブジェクトモデル416でまとめられる。
サーバ410に自己のモデル416をアップロードされる十分な数のメンバを有することで、共通または類似のモデルを識別するようにモデルは解析される。最も一般的に用いられ生成されるモデルが追跡される。このようにして、システム400は、いずれのモデル416が最も必要とされそうであるかを学習して判別する。そして、コーデックは最も重要なオブジェクトモデルのみを有するように設計される。
ユーザがエンコード化されたビデオをコーデックで処理しようとし、その特定のモデルがそのコーデッくにまとめられていない場合、システムはサーバ410にアクセスして必要なモデルをアーカイブ404から取得する。コーデックがサーバ410に周期的にアクセスして、新しくアップデートされたオブジェクトモデルでコーデック自体をアップデートしてもよい。
さらなる実施形態として、エンコード化されたビデオは、クライアントノード414でアクセス可能な、元の「従来の」ビデオファイルのエンコード化のようなものであってもよい。この場合、より従来的なビデオ処理を容易にするために、より「従来的な」圧縮がハードディスクにビデオを格納するのに用いられながら、この処理の利点がビデオを伝送するのに用いられる。例えば、ビデオ編集アプリケーションが別のフォーマットを使用したい場合、ビデオファイルの伝送中に本発明の方法が主として利用される。
<コーデックの調整>
コーデック417は、エンコード化されたビデオデータの特定のタイプに調整(チューニング)される。例えば、ビデオストリームが繰り返される特定のオブジェクトを有する場合、オブジェクトモデルよりも、全体にわたる共通のテーマまたは特定のスタイルが、全エンコード化ビデオファイルを再構築する際に使用される。同様に、コーデック417は最適化されて、これら繰り返されるオブジェクト(例えば、顔)を取り扱う。それに加えて、ビデオストリームがある特徴を有する映画の場合(例えば、アクションフィルムのような特有のジャンルのフィルム)、フィルムを通して同様のオブジェクトモデル416を使用してもよい。ディジタルビデオがフィルムノワールの場合(例えば、目立たず黒と白のビジュアルスタイル)でも、映画の全エンコード化バージョンを再現する際に、特有の明暗および明るさのオブジェクトモデルが適用されることができ、用いられてもよい。このため、エンコード化された映画の一部に適用できる共通のオブジェクトモデル(例えば、構造および明るさのモデル)が存在してもよい。これらモデルは、カスタマイズ化されたコーデックを作成するために、組み合わせてまとめられる。
<オブジェクトモデルの共有>
オブジェクトモデルは、複数のユーザ間で共有される。オブジェクトモデルは、サーバまたはデータベースに格納されるので、ビデオファイルをデコード化する際に容易にアクセスされる。オブジェクトモデルは一のユーザコンピュータから他のユーザコンピュータにアクセスされてもよい。図5は、オブジェクトモデルの共有を示すブロック図である。オブジェクトモデルは、サーバ504のオブジェクトモデルライブラリ502からアクセスされるか、他のクライアントシステム510,520からアクセスされる。各オブジェクトモデルマネージャ512,522が、エンコード化されたビデオファイルを処理するのに各クライアント510,520で必要とされるオブジェクトモデル514,524を管理する。オブジェクトモデルマネージャは、バージョン制御システムまたはソース制御管理システムに類似する。ここで、システムソフトウェアは、オブジェクトモデル514,524の進行中の展開を管理する。オブジェクトモデルへの変更は、関連する数字やコード文字(例えば、改訂番号または改定レベル)およびこれまでの関連する変化をインクリメントすることによって、識別される。このようにして、オブジェクトモデル514,524は追跡されて、オブジェクトモデルへの任意の変更も同様に追跡される。このオブジェクトモデルの電子的な追跡によって、システム500は、オブジェクトモデルの種々のコピー、バージョンを制御および管理できる。
クライアントサーバフレームワークを用いることに加えて、オブジェクトモデルは、ピア・ツー・ピアネットワークなどの別のフレームワークを用いて共有されて分散される。このようにしてユーザは、ピア・ツー・ピアネットワークにおける他のユーザから圧縮されたビデオファイルおよびオブジェクトモデルをダウンロードする。例えば、映画ハリーポッターのコード化されたバージョンがピア・ツー・ピアネットワークにおけるあるシステムからダウンロード可能であるなら、効率を促進するために、関連のモデル、またはこれらモデルのパーティション(区切り)がネットワークの他のシステムからダウンロード可能である。
<ディジタル著作権の管理>
ディジタルビデオへのアクセを保護するために、セキュリティ方法を導入する処理は、長く複雑で高コストである。コンテンツユーザは、煩わしい認証処理を受けることを要求されない、ディジタルコンテンツへの拘束されないアクセスを望む。コンテンツを導入するためにセキュリティモデルを展開する最も複雑な側面は、費用便益分析が全ての参加者、つまりコンテンツユーザ、コンテンツプロバイダーおよびソフトウェア開発者に対応する方法を見つけることである。今のところ、現時点で利用可能な方法は、ディジタルコンテンツへのアクセスを制限ずるために、ユーザフレンドリ、開発者フレンドリ、および財務的に有効な解決をもたらしていない。
エンコード化されたディジタルビデオへのアクセスを制御する方法として、本発明のオブジェクトモデルが用いられる。例えば、関連のオブジェクトモデルなしでは、ユーザはビデオファイルを再生できないであろう。オブジェクトモデルは、ビデオデータにアクセスするためのキーとして用いられる。再生動作において、コード化されたビデオデータは、オブジェクトモデルの補助的な情報に依存する。このアプローチによって、エンコード化されたビデオデータは、オブジェクトモデルにアクセスすることなく、エンコード化されたビデオデータを読み出すことができない。
オブジェクトモデルへのアクセスを制御することによって、コンテンツの再生に対するアクセスが制御される。この方法は、ユーザフレンドリ、開発者フレンドリの解決、およびビデオコンテンツへのアクセスを制限する効率的な解決をもたらす。
さらに、オブジェクトモデルは、コンテンツを段階的にアンロックする。オブジェクトモデルの一定のバージョンを用いて、コード化は、一定レベルをデコードするのみであり、その後、段階的により完全なオブジェクトモデルを用いて、全体ビデオはアンロックされる。最初のアンロックによって、ビデオのサムネイルがアンロックされて、ユーザに、全ビデオが欲しいかを判断する余地を与える。標準画質のバージョンが欲しいユーザは、オブジェクトモデルの次のバージョンを入手するであろう。さらに、高画質または映画の品質が必要なユーザは、オブジェクトモデルのさらに完全なバージョンをこれからダウンロードするであろう。冗長なく、エンコード化サイズおよび品質にふさわしいビデオ品質の段階的な認識を容易にするように、エンコード化およびオブジェクトモデルの両方は、コード化される。
<処理環境>
図6は、本発明が実現される、コンピュータネットワークまたは同様のディジタル処理環境を示す。クライアントコンピュータ/装置50およびサーバコンピュータ60が、アプリケーションプログラムなどを実行する、処理装置、記憶装置、および入力/出力装置を設ける。クライアントコンピュータ/装置50は、通信ネットワーク70を介して、別のクライアント装置/プロセッサ50およびサーバコンピュータ60などのその他のコンピュータ装置にリンクされてもよい。通信ネットワーク70は、リモートアクセスネットワーク、グローバルネットワーク(例えば、インターネット)、コンピュータのワールドワイドの集合形態、ローカルエリアもしくはワイドエリアのネットワーク、およびプロトコル(TCP/IP、Bluetoothなど)を用いるゲートウェイの一部であってもよい。その他の電子的装置/コンピュータネットワークアーキテクチャも適している。
図7は、図6のコンピュータシステムにおけるコンピュータ(例えば、クライアントプロセッサ/装置50またやサーバコンピュータ60)の内部構造の図である。各コンピュータ50,60は、システムバス79を含む。ここで、バスはコンピュータまたは処理システムの要素間のデータ転送に用いられるハードウェアラインのセットである。バス79は、基本的には、コンピュータシステムの異なる要素を接続する共有の電線である。これら要素は、例えば、プロセッサ、ディスクストレージ、メモリ、入力/出力ポート、ネットワークポートなどである。このバスによって、要素間の情報の転送が可能となる。システムバス79には、入力/出力(I/O)装置インタフェース82が取り付けられており、様々な入力および出力装置をコンピュータ50,60に接続する。これら入力および出力装置は、例えば、キーボード、マウス、ディスプレイ、プリンタ、スピーカなどである。ネットワークインタフェース86によって、コンピュータは、ネットワーク(例えば、図6のネットワーク70)に取り付けられた様々なその他の装置に接続される。メモリ90は、本発明の実施形態(例えば、上述のオブジェクトモデル、コーデックおよびオブジェクトモデルライブラリ)を実装するのに用いられる、コンピュータソフトウェア命令92およびデータ94用の揮発性ストレージである。ディスクストレージ95は、本発明の実施形態を実装するのに用いられるコンピュータソフトウェア命令92およびデータ94用の不揮発性ストレージである。中央処理装置ユニット84もシステムバス79に取り付けられており、コンピュータ命令を実行する。
一実施形態では、プロセッサルーチン92およびデータ94は、コンピュータプログラム製品であり、この製品はコンピュータ読み取り可能な媒体(例えば、1つ以上の、DVD−ROM、CD−ROM、ディスケット、テープ、ハードドライブなどの交換可能ストレージ)を含む。コンピュータプログラム製品は、この分野で周知のように、適切なソフトウェアインストール手続きによってインストールされる。別の実施形態では、少なくとも一部のソフトウェア命令が、ケーブル通信および/または無線通信でダウンロードされてもよい。その他の実施形態では、本発明のプログラムが、伝播媒体(例えば、ラジオ電波、赤外線、レーザ光線、音波、またはインターネットなどのグローバルネットワークを伝播される電磁波)の伝播信号に組み込まれるコンピュータプログラム伝播信号製品107である。このようなキャリア媒体または信号は、本発明のルーチン/プログラム92に、ソフトウェア命令の少なくとも一部を提供する。
別の実施形態では、伝播信号は、アナログキャリア波または伝播媒体で運ばれるディジタル信号である。例えば、伝播信号は、グローバルネットワーク(例えば、インターネット)、電気通信ネットワークなどのネットワークを伝播されるディジタル信号であってもよい。一実施形態では、伝播信号は、ミリ秒、秒、分またはそれ以上の期間にわたってネットワークをパケットで送信されるソフトウェアアプリケーションの命令のような、所定期間に伝播媒体を転送される信号である。別の実施形態では、コンピュータプログラム製品のコンピュータ読み取り可能な媒体は、伝播媒体を受信して、上述のコンピュータプログラム伝播信号製品のような、伝播媒体に組み込まれた伝播信号を特定することによって、受信および読み取りをコンピュータシステムが行う、伝播媒体であってもよい。
一般的に言えば、用語「キャリア媒体」すなわち遷移キャリアは、前述の遷移信号、伝播信号、伝播媒体、記憶媒体などを包含する。
本発明は、本発明の好ましい実施形態に関連して詳細に示され説明されているが、当業者であれば、添付の特許請求の範囲に包含される本発明の範囲から逸脱することなく、形態および細部に様々な変更が可能であることは理解されるであろう。
たとえば、本発明は、様々なコンピュータアーキテクチャにおいて実装される。図4〜7のコンピュータネットワークは、例示のためであり、本発明はこれに限定されるわけではない。
本発明は、完全なハードウェア実施形態、完全なソフトウェア実施形態、またはハードウェア要素およびソフトウェア要素の両方を含む実施形態であってもよい。好ましい実施形態では、本発明はソフトウェアに実装され、このソフトウェアは、これに限定されるわけではないが、ファームウェア、常駐ソフトウェア、マイクロコードなどを含む。
さらに、本発明は、コンピュータまたは任意の命令実行システムによって、またはこれらに組み合わされて使用するためのプログラムコードを提供するコンピュータ使用可能またはコンピュータ読み取り可能な媒体からアクセス可能なコンピュータプログラム製品の形体をとる。この記述のために、コンピュータ使用可能またはコンピュータ読み取り可能な媒体は任意の装置であってもよく、この装置は、命令実行システム、装置または機器によって、またはこれらに組み合わされて使用するためのプログラムを含み、記憶し、通信し、伝播し、または移植する。
媒体は電気、磁気、光、電磁、赤外線、または半導体のシステム(または装置もしくは機器)または伝播システムである。コンピュータ読み取り可能な媒体の例として、半導体もしくは固体メモリ、磁気テープ、取り外し可能なコンピュータディスケット、ランダムアクセスメモリ(RAM)、読み取り専用メモリ、(ROM)、硬質の磁気ディスクおよび光ディスクが挙げられる。光ディスクの例には、コンパクトディスク、つまり読み取り専用(CD−ROM)、読み取り/書き込み(CD−R/W)およびDVDが含まれる。
プログラムコードを格納および/または実行するのに適したデータ処理システムは、メモリ要素にシステムバスを介して直接的または間接的に結合された少なくとも1つのプロセッサを含む。メモリ要素は、プログラムコードの実際の実行中に採用されるローカルメモリ、大容量記憶装置、およびキャッシュメモリを含む。ここで、キャッシュメモリは、実行中に大容量記憶装置から取り出されるコードの回数を低減するために、少なくともプログラムコードの一時的な格納を提供する。
入力/出力すなわちI/O装置(これらに限定されるわけではないが、キーボード、ディスプレイ、ポインティング装置などを含む)が、システムに、直接またはI/Oコントローラを介して結合される。
ネットワークアダプタがシステムに結合されてもよく、これにより、データ処理システムは他の処理システムまたは遠隔プリンタもしくは記憶装置に、プライベートまたは公共のネットワークを介して結合される。モデム、ケーブルモデムおよびイーサネット(登録商標)カードは、現在利用可能なタイプのネットワークアダプタのほんの一部にすぎない。
さらに、実施形態のいくつかにおいては、以下の広告構成があってもよい。
<オブジェクトモデルを用いるビデオにおける広告の埋め込み>
オブジェクトモデルが用いられて、広告を含むフレームが再生中にビデオストリームに挿入される。このため、実際のエンコード化されたビデオコンテンツは広告によって改変される必要がない。しかし、エンコード化されたビデオの再構築(例えば再生)の間、モデルは、広告を提供するフレームが再生ビデオストリーム中に生じるようにさせる。

Claims (25)

  1. コンピュータに実装される各工程であって、
    ビデオ信号において表現される1つ以上のオブジェクトについてのオブジェクトモデルを作成するように、複数のビデオ信号を処理する処理工程と、
    前記オブジェクトモデルをアーカイブするアーカイブ工程と、
    圧縮されたビデオファイルを処理する際に1つ以上のアーカイブされたオブジェクトモデルを用いる使用工程とを備えた、ビデオ処理方法。
  2. 請求項1において、前記アーカイブ工程が、さらに、コンピュータに実装される各工程であって、
    実質的に等しいオブジェクトモデルが前記アーカイブに格納されているかを判別するように、1つ以上の前記アーカイブされたオブジェクトモデルを比較する比較工程と、
    重複する実質的に等しいオブジェクトモデルを除外することによって、前記アーカイブのサイズを低減する低減工程とを有する、ビデオ処理方法。
  3. 請求項2において、前記低減工程は、さらに、コンピュータに実装される各工程であって、
    1つ以上のオブジェクトモデルを共通のオブジェクトに組み合わせることによって、前記アーカイブのサイズを低減する工程と、
    前記共通のオブジェクトを用いて、1つ以上の低減された元のオブジェクトモデルを生成する工程とを有する、ビデオ処理方法。
  4. 請求項1において、前記アーカイブ工程が、さらに、コンピュータに実装される工程であって、
    類似する1つ以上の前記アーカイブされたオブジェクトモデルを組み合わせる工程を有する、ビデオ処理方法。
  5. 請求項1において、前記アーカイブ工程が、さらに、コンピュータに実装される工程であって、
    圧縮されたビデオファイルにおけるオブジェクトの再現に最適化しているカスタマイズされたコーデックを作成するように、オブジェクトモデルをグループ分けする工程を有する、ビデオ処理方法。
  6. 請求項1において、前記圧縮されたビデオファイルは、類似の特徴を有する他の圧縮されたビデオファイルのグループに関連付けられ、コーデックは前記グループにおける前記圧縮されたビデオファイルの再現に最適化されている、ビデオ処理方法。
  7. 請求項6において、圧縮されたビデオファイルの前記グループは、ユーザに関する個人用の情報に基づいて判別される、ビデオ処理方法。
  8. 請求項7において、ユーザに関する前記個人用の情報は、ユーザによって提供された他のビデオファイルを解析することによって判別される、ビデオ処理方法。
  9. 請求項8において、前記ユーザによって提供された前記ビデオファイルの解析は、さらに、コンピュータに実装される工程であって、
    前記ユーザによって提供された前記ビデオファイルに現われる繰り返しのオブジェクトを識別する工程であって、この繰り返しのオブジェクトが、前記ユーザによって提供された前記ビデオファイルにおいて識別された人間の顔および動物を含む、工程を有する、ビデオ処理方法。
  10. 請求項8において、前記ユーザによって提供された前記ビデオファイルは、従来のエンコード化処理を用いてエンコード化される、ビデオ処理方法。
  11. 請求項10において、前記従来の方法でエンコード化されたビデオに含まれた情報が、前記ビデオを処理およびエンコード化する方法を判定するために用いられる、ビデオ処理方法。
  12. 請求項10において、前記ユーザによって提供された前記ビデオファイルの処理に追加の制約が課されて、前記ビデオファイルの前記従来のエンコード化が再作成される、ビデオ処理方法。
  13. 請求項6において、圧縮されたビデオファイルの前記グループは、前記圧縮されたビデオファイルに現われる繰り返しのオブジェクトに基づいて判別される、ビデオ処理方法。
  14. 請求項5において、前記カスタマイズされたコーデックが前記圧縮されたビデオファイルの再現に用いられる、ビデオ処理方法。
  15. 請求項1において、圧縮されたビデオファイルを処理する際に、1つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される工程であって、
    前記圧縮されたビデオファイルを再現するために、前記1つ以上のアーカイブされたオブジェクトモデルおよびコーデックを用いる工程を備えた、ビデオ処理方法。
  16. 請求項1において、圧縮されたビデオファイルを処理する際に、1つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される各工程であって、
    ユーザコンピュータにおいて、前記圧縮されたビデオファイルを別のユーザコンピュータから受信する工程と、
    1つ以上の前記アーカイブされたオブジェクトモデルをサーバからアクセスする工程とを備えた、ビデオ処理方法。
  17. 請求項16において、前記サーバが、ユーザについてのサーバにおけるアーカイブされたオブジェクトモデルを保持するビデオ処理サービスと組み合わせて使用され、前記ビデオ処理サービスは、他のユーザについての他のアーカイブされたオブジェクトモデルを保持する、ビデオ処理方法。
  18. 請求項1において、圧縮されたビデオファイルを処理する際に、1つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、コンピュータに実装される工程であって、
    ピア・ツー・ピアネットワークにおいて、複数のユーザコンピュータ間で前記アーカイブされたオブジェクトモデルを共有する共有工程を備えた、ビデオ処理方法。
  19. 請求項18において、前記共有工程は、さらに、コンピュータに実装される各工程であって、
    ピア・ツー・ピアネットワークにおいて、第1のユーザコンピュータから前記圧縮されたビデオファイルを受信する工程と、
    前記要求に応答して、ピア・ツー・ピアネットワークにおいて、前記アーカイブされたオブジェクトモデルの1つを第2のユーザコンピュータから送信する工程と、
    前記要求に応答して、ピア・ツー・ピアネットワークにおいて、前記アーカイブされたオブジェクトモデルの別の1つを第3のユーザコンピュータから送信する工程とを有する、ビデオ処理方法。
  20. 請求項1において、1つ以上の前記アーカイブされたオブジェクトモデルが、前記圧縮されたビデオファイルへのアクセスを制御するために用いられる、ビデオ処理方法。
  21. 請求項1において、1つ以上の前記アーカイブされたオブジェクトモデルを用いて、前記圧縮されたビデオファイルが処理されて再現される際に、1つ以上の広告が前記再現された前記ビデオファイル内に挿入されるように、1つ以上の前記アーカイブされたオブジェクトモデルがさらに広告を含む、ビデオ処理方法。
  22. 請求項1において、圧縮されたビデオファイルを処理する際に、1つ以上の前記アーカイブされたオブジェクトモデルを用い、さらに、
    1つ以上の前記アーカイブされたオブジェクトモデルに基づいて、1つ以上のオブジェクトの陰的表現を作成する工程を備えた、ビデオ処理方法。
  23. 請求項1において、前記オブジェクトモデルが、変形モデル、構造モデルおよび概観モデルを有する、ビデオ処理方法。
  24. ビデオ信号において表現される1つ以上のオブジェクトについてのオブジェクトモデルを作成するように、ビデオ信号を処理するエンコーダと、
    前記オブジェクトモデルを格納するオブジェクトライブラリと、
    コード化されたビデオファイルを再現する際に、1つ以上の前記アーカイブされたオブジェクトモデルを用いるために、コーデックおよび前記オブジェクトライブラリにアクセスするデコーダとを備えた、ビデオ処理コンピュータシステム。
  25. ビデオ信号において表現される1つ以上のオブジェクトについてのオブジェクトモデルを作成するように、複数のビデオ信号を処理する手段と、
    前記オブジェクトモデルをアーカイブする手段と、
    圧縮されたビデオファイルを処理する際に1つ以上のアーカイブされたオブジェクトモデルを用いる手段とを備えた、ビデオ処理コンピュータシステム。
JP2009547252A 2007-01-23 2008-01-04 オブジェクトアーカイブシステムおよび方法 Pending JP2010517426A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88198207P 2007-01-23 2007-01-23
PCT/US2008/000091 WO2008091484A2 (en) 2007-01-23 2008-01-04 Object archival systems and methods

Publications (1)

Publication Number Publication Date
JP2010517426A true JP2010517426A (ja) 2010-05-20

Family

ID=39645039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009547252A Pending JP2010517426A (ja) 2007-01-23 2008-01-04 オブジェクトアーカイブシステムおよび方法

Country Status (7)

Country Link
US (3) US8553782B2 (ja)
EP (1) EP2106663A2 (ja)
JP (1) JP2010517426A (ja)
CN (1) CN101622874A (ja)
CA (1) CA2675957C (ja)
TW (1) TW200839622A (ja)
WO (1) WO2008091484A2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015515807A (ja) * 2012-03-27 2015-05-28 ユークリッド・ディスカバリーズ・エルエルシーEuclid Discoveries,Llc 映像圧縮レポジトリおよびモデル再利用
US9621917B2 (en) 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US10091507B2 (en) 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
US9578345B2 (en) 2005-03-31 2017-02-21 Euclid Discoveries, Llc Model-based video encoding and decoding
US9532069B2 (en) 2004-07-30 2016-12-27 Euclid Discoveries, Llc Video compression repository and model reuse
US8902971B2 (en) 2004-07-30 2014-12-02 Euclid Discoveries, Llc Video compression repository and model reuse
US8572642B2 (en) * 2007-01-10 2013-10-29 Steven Schraga Customized program insertion system
EP2106664A2 (en) * 2007-01-23 2009-10-07 Euclid Discoveries, LLC Systems and methods for providing personal video services
CA2676219C (en) 2007-01-23 2017-10-24 Euclid Discoveries, Llc Computer method and apparatus for processing image data
CN101622874A (zh) 2007-01-23 2010-01-06 欧几里得发现有限责任公司 对象存档系统和方法
CN102172026B (zh) 2008-10-07 2015-09-09 欧几里得发现有限责任公司 基于特征的视频压缩
US9053562B1 (en) 2010-06-24 2015-06-09 Gregory S. Rabin Two dimensional to three dimensional moving image converter
US8712930B1 (en) 2010-08-09 2014-04-29 Google Inc. Encoding digital content based on models for predicting similarity between exemplars
US9268996B1 (en) 2011-01-20 2016-02-23 Verint Systems Inc. Evaluation of models generated from objects in video
US8515193B1 (en) 2011-04-08 2013-08-20 Google Inc. Image compression using exemplar dictionary based on hierarchical clustering
CN103501438B (zh) * 2013-09-18 2016-06-29 浙江大学 一种基于主成分分析的内容自适应图像压缩方法
US9332561B1 (en) * 2015-04-08 2016-05-03 Ringcentral, Inc. Hybrid communications system using peer-to-peer and centralized architecture
CN108388564B (zh) * 2017-02-03 2022-11-01 百度在线网络技术(北京)有限公司 查询处理方法、装置及其设备
US10298925B2 (en) 2017-06-22 2019-05-21 International Business Machines Corporation Multiple image storage compression tree
US11109065B2 (en) * 2018-09-26 2021-08-31 Google Llc Video encoding by providing geometric proxies

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162730A (ja) * 2001-09-28 2003-06-06 Canon Inc 個人のモデルを生成する方法及び装置
US20040246336A1 (en) * 2003-06-04 2004-12-09 Model Software Corporation Video surveillance system

Family Cites Families (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH082107B2 (ja) 1990-03-02 1996-01-10 国際電信電話株式会社 動画像のハイブリッド符号化方法及びその装置
JP2606523B2 (ja) 1992-02-28 1997-05-07 日本ビクター株式会社 予測符号化装置及び復号化装置
US5592228A (en) 1993-03-04 1997-01-07 Kabushiki Kaisha Toshiba Video encoder using global motion estimation and polygonal patch motion estimation
JPH0738873U (ja) 1993-12-27 1995-07-14 日本鋼管継手株式会社 自在管継手
JPH07288789A (ja) 1994-04-15 1995-10-31 Hitachi Ltd 知的符号化装置及び画像通信装置
US5710590A (en) 1994-04-15 1998-01-20 Hitachi, Ltd. Image signal encoding and communicating apparatus using means for extracting particular portions of an object image
KR100235343B1 (ko) 1994-12-29 1999-12-15 전주범 영역분할 기법을 이용한 동영상신호 부호화기의 움직임 벡터 측정장치
JP2739444B2 (ja) 1995-03-01 1998-04-15 株式会社エイ・ティ・アール通信システム研究所 3次元モデルによる動き生成装置
KR0171151B1 (ko) 1995-03-20 1999-03-20 배순훈 곡률 계산 기법을 이용한 이미지 윤곽 근사화 장치
JP2727066B2 (ja) 1995-03-20 1998-03-11 株式会社エイ・ティ・アール通信システム研究所 可塑性物体特徴検出装置
WO1997010676A1 (en) 1995-09-12 1997-03-20 Philips Electronics N.V. Hybrid waveform and model-based encoding and decoding of image signals
US5784175A (en) 1995-10-05 1998-07-21 Microsoft Corporation Pixel block correlation process
US5774591A (en) 1995-12-15 1998-06-30 Xerox Corporation Apparatus and method for recognizing facial expressions and facial gestures in a sequence of images
US5969755A (en) 1996-02-05 1999-10-19 Texas Instruments Incorporated Motion based event detection system and method
US6037988A (en) 1996-03-22 2000-03-14 Microsoft Corp Method for generating sprites for object-based coding sytems using masks and rounding average
US6614847B1 (en) 1996-10-25 2003-09-02 Texas Instruments Incorporated Content-based video compression
US6088484A (en) * 1996-11-08 2000-07-11 Hughes Electronics Corporation Downloading of personalization layers for symbolically compressed objects
US6044168A (en) 1996-11-25 2000-03-28 Texas Instruments Incorporated Model based faced coding and decoding using feature detection and eigenface coding
US6047088A (en) 1996-12-16 2000-04-04 Sharp Laboratories Of America, Inc. 2D mesh geometry and motion vector compression
US5826165A (en) 1997-01-21 1998-10-20 Hughes Electronics Corporation Advertisement reconciliation system
US5991447A (en) 1997-03-07 1999-11-23 General Instrument Corporation Prediction and coding of bi-directionally predicted video object planes for interlaced digital video
IL122194A0 (en) * 1997-11-13 1998-06-15 Scidel Technologies Ltd Method and apparatus for personalized images inserted into a video stream
US6061400A (en) 1997-11-20 2000-05-09 Hitachi America Ltd. Methods and apparatus for detecting scene conditions likely to cause prediction errors in reduced resolution video decoders and for using the detected information
US6625316B1 (en) 1998-06-01 2003-09-23 Canon Kabushiki Kaisha Image processing apparatus and method, and image processing system
JP3413720B2 (ja) 1998-06-26 2003-06-09 ソニー株式会社 画像符号化方法及び装置、並びに画像復号方法及び装置
US6711278B1 (en) 1998-09-10 2004-03-23 Microsoft Corporation Tracking semantic objects in vector image sequences
US6256423B1 (en) 1998-09-18 2001-07-03 Sarnoff Corporation Intra-frame quantizer selection for video compression
US7124065B2 (en) 1998-10-26 2006-10-17 Speech Technology And Applied Research Corporation Determining a tangent space and filtering data onto a manifold
US6546117B1 (en) 1999-06-10 2003-04-08 University Of Washington Video object segmentation using active contour modelling with global relaxation
KR20010108159A (ko) 1999-01-29 2001-12-07 다니구찌 이찌로오, 기타오카 다카시 화상 특징 부호화 방법 및 화상 검색 방법
US6774917B1 (en) 1999-03-11 2004-08-10 Fuji Xerox Co., Ltd. Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video
US6751354B2 (en) 1999-03-11 2004-06-15 Fuji Xerox Co., Ltd Methods and apparatuses for video segmentation, classification, and retrieval using image class statistical models
GB9909362D0 (en) 1999-04-23 1999-06-16 Pace Micro Tech Plc Memory database system for encrypted progarmme material
US6307964B1 (en) 1999-06-04 2001-10-23 Mitsubishi Electric Research Laboratories, Inc. Method for ordering image spaces to represent object shapes
US7352386B1 (en) 1999-06-22 2008-04-01 Microsoft Corporation Method and apparatus for recovering a three-dimensional scene from two-dimensional images
US6870843B1 (en) 1999-06-22 2005-03-22 World Multicast.Com, Inc. Self implementing multicast level escalation
KR100611999B1 (ko) 1999-08-27 2006-08-11 삼성전자주식회사 그리디 알고리듬을 이용한 객체 기반 콰드 트리 메쉬 움직임 보상방법
JP2001100731A (ja) 1999-09-28 2001-04-13 Toshiba Corp オブジェクト映像表示装置
US6731813B1 (en) 1999-10-07 2004-05-04 World Multicast.Com, Inc. Self adapting frame intervals
US6792154B1 (en) 1999-10-07 2004-09-14 World Multicast.com, Inc Video compression system and method using time
EP1147669B1 (en) 1999-11-29 2006-12-27 Sony Corporation Video signal processing method and apparatus by feature points extraction in the compressed domain.
JP3694888B2 (ja) 1999-12-03 2005-09-14 ソニー株式会社 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体
US6738424B1 (en) 1999-12-27 2004-05-18 Objectvideo, Inc. Scene model generation from video for use in video processing
US6574353B1 (en) 2000-02-08 2003-06-03 University Of Washington Video object tracking using a hierarchy of deformable templates
EP2538667A3 (en) * 2000-02-09 2014-09-03 Canon Kabushiki Kaisha Method and apparatus for image processing which inhibits reproduction of parts of a recording
US6661004B2 (en) 2000-02-24 2003-12-09 Massachusetts Institute Of Technology Image deconvolution techniques for probe scanning apparatus
JP4443722B2 (ja) * 2000-04-25 2010-03-31 富士通株式会社 画像認識装置及び方法
US6731799B1 (en) 2000-06-01 2004-05-04 University Of Washington Object segmentation with background extraction and moving boundary techniques
US6795875B2 (en) 2000-07-31 2004-09-21 Microsoft Corporation Arbitrating and servicing polychronous data requests in direct memory access
US8005145B2 (en) 2000-08-11 2011-08-23 Nokia Corporation Method and apparatus for transferring video frame in telecommunication system
FR2814312B1 (fr) 2000-09-07 2003-01-24 France Telecom Procede de segmentation d'une surface image video par objets elementaires
GB2367966B (en) 2000-10-09 2003-01-15 Motorola Inc Method and apparatus for determining regions of interest in images and for image transmission
JP4310916B2 (ja) 2000-11-08 2009-08-12 コニカミノルタホールディングス株式会社 映像表示装置
JP2002182961A (ja) 2000-12-13 2002-06-28 Nec Corp データベースの同期化システムとその同期化の方法
EP1518211A2 (en) 2000-12-22 2005-03-30 Anthropics Technology Limited Image processing system
US20020085633A1 (en) 2001-01-03 2002-07-04 Kim Hyun Mun Method of performing video encoding rate control
US7061483B2 (en) 2001-02-08 2006-06-13 California Institute Of Technology Methods for computing barycentric coordinates generalized to irregular n-gons and applications of the same
US6625310B2 (en) 2001-03-23 2003-09-23 Diamondback Vision, Inc. Video segmentation using statistical pixel modeling
US7043058B2 (en) 2001-04-20 2006-05-09 Avid Technology, Inc. Correcting motion vector maps for image processing
US20020164068A1 (en) 2001-05-03 2002-11-07 Koninklijke Philips Electronics N.V. Model switching in a communication system
US6909745B1 (en) 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
US6496217B1 (en) 2001-06-12 2002-12-17 Koninklijke Philips Electronics N.V. Video communication system using model-based coding and prioritzation techniques
US7003039B2 (en) 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression
US7173925B1 (en) 2001-07-18 2007-02-06 Cisco Technology, Inc. Method and system of control signaling for a wireless access network
US7457359B2 (en) 2001-09-26 2008-11-25 Mabey Danny L Systems, devices and methods for securely distributing highly-compressed multimedia content
EP1309181A1 (en) 2001-11-06 2003-05-07 Thomson Licensing S.A. Device, method and system for multimedia content adaption
US7130446B2 (en) 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
US20030122966A1 (en) * 2001-12-06 2003-07-03 Digeo, Inc. System and method for meta data distribution to customize media content playback
US7673136B2 (en) 2002-02-26 2010-03-02 Stewart Ian A Method for secure multicast repeating on the public Internet
JP2003253190A (ja) 2002-03-06 2003-09-10 Kansai Paint Co Ltd 缶内面用水性塗料組成物
US6950123B2 (en) 2002-03-22 2005-09-27 Intel Corporation Method for simultaneous visual tracking of multiple bodies in a closed structured environment
US7136505B2 (en) 2002-04-10 2006-11-14 National Instruments Corporation Generating a curve matching mapping operator by analyzing objects of interest and background information
US7203356B2 (en) 2002-04-11 2007-04-10 Canesta, Inc. Subject segmentation and tracking using 3D sensing technology for video compression in multimedia applications
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
US7505604B2 (en) 2002-05-20 2009-03-17 Simmonds Precision Prodcuts, Inc. Method for detection and recognition of fog presence within an aircraft compartment using video images
US8752197B2 (en) * 2002-06-18 2014-06-10 International Business Machines Corporation Application independent system, method, and architecture for privacy protection, enhancement, control, and accountability in imaging service systems
JP3984191B2 (ja) 2002-07-08 2007-10-03 株式会社東芝 仮想化粧装置及びその方法
US7031499B2 (en) 2002-07-22 2006-04-18 Mitsubishi Electric Research Laboratories, Inc. Object recognition system
US6925122B2 (en) 2002-07-25 2005-08-02 National Research Council Method for video-based nose location tracking and hands-free computer input devices based thereon
JP2004356747A (ja) 2003-05-27 2004-12-16 Kddi Corp 画像のマッチング方法および装置
US7305032B2 (en) 2002-08-02 2007-12-04 Kddi Corporation Image matching device and method for motion pictures
KR100455294B1 (ko) 2002-12-06 2004-11-06 삼성전자주식회사 감시 시스템에서의 사용자 검출 방법, 움직임 검출 방법및 사용자 검출 장치
AU2003303499A1 (en) 2002-12-26 2004-07-29 The Trustees Of Columbia University In The City Of New York Ordered data compression system and methods
US7003117B2 (en) * 2003-02-05 2006-02-21 Voltage Security, Inc. Identity-based encryption system for secure data distribution
US7606305B1 (en) * 2003-02-24 2009-10-20 Vixs Systems, Inc. Method and system for transcoding video data
FR2852773A1 (fr) 2003-03-20 2004-09-24 France Telecom Procedes et dispositifs de codage et de decodage d'une sequence d'images par decomposition mouvement/texture et codage par ondelettes
US7574406B2 (en) 2003-03-31 2009-08-11 Satyam Computer Services Limited Of Mayfair Centre System and method maximizing video license utilization using billboard services
US7184073B2 (en) 2003-04-11 2007-02-27 Satyam Computer Services Limited Of Mayfair Centre System and method for warning drivers based on road curvature
US7424164B2 (en) 2003-04-21 2008-09-09 Hewlett-Packard Development Company, L.P. Processing a detected eye of an image to provide visual enhancement
US7415527B2 (en) 2003-06-13 2008-08-19 Satyam Computer Services Limited Of Mayfair Centre System and method for piecewise streaming of video using a dedicated overlay network
US7603022B2 (en) 2003-07-02 2009-10-13 Macrovision Corporation Networked personal video recording system
US7454431B2 (en) 2003-07-17 2008-11-18 At&T Corp. Method and apparatus for window matching in delta compressors
US7383180B2 (en) 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
KR20050040712A (ko) 2003-10-28 2005-05-03 삼성전자주식회사 명령어 기반 그래픽 출력 가속 기능이 포함된 2차원그래픽 디코더, 그 그래픽 출력 가속 방법 및 영상 재생장치
AU2003304675A1 (en) 2003-12-04 2005-06-24 Telefonaktiebolaget Lm Ericsson (Publ) Video application node
US7535515B2 (en) 2003-12-23 2009-05-19 Ravi Ananthapur Bacche Motion detection in video signals
US8175412B2 (en) 2004-02-17 2012-05-08 Yeda Research & Development Co. Ltd. Method and apparatus for matching portions of input images
US7447331B2 (en) 2004-02-24 2008-11-04 International Business Machines Corporation System and method for generating a viewable video index for low bandwidth applications
WO2006002299A2 (en) 2004-06-22 2006-01-05 Sarnoff Corporation Method and apparatus for recognizing 3-d objects
AU2005269310C1 (en) 2004-07-30 2010-05-20 Euclid Discoveries, Llc Apparatus and method for processing video data
US9578345B2 (en) 2005-03-31 2017-02-21 Euclid Discoveries, Llc Model-based video encoding and decoding
US7436981B2 (en) 2005-01-28 2008-10-14 Euclid Discoveries, Llc Apparatus and method for processing video data
US7508990B2 (en) 2004-07-30 2009-03-24 Euclid Discoveries, Llc Apparatus and method for processing video data
US7457472B2 (en) 2005-03-31 2008-11-25 Euclid Discoveries, Llc Apparatus and method for processing video data
US7457435B2 (en) 2004-11-17 2008-11-25 Euclid Discoveries, Llc Apparatus and method for processing video data
US8902971B2 (en) 2004-07-30 2014-12-02 Euclid Discoveries, Llc Video compression repository and model reuse
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US8724891B2 (en) 2004-08-31 2014-05-13 Ramot At Tel-Aviv University Ltd. Apparatus and methods for the detection of abnormal motion in a video stream
AU2005286786B2 (en) 2004-09-21 2010-02-11 Euclid Discoveries, Llc Apparatus and method for processing video data
JP2008521347A (ja) 2004-11-17 2008-06-19 ユークリッド・ディスカバリーズ・エルエルシー ビデオデータを処理する装置および方法
US7623676B2 (en) 2004-12-21 2009-11-24 Sarnoff Corporation Method and apparatus for tracking objects over a wide area using a network of stereo sensors
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
CN101151640B (zh) 2005-01-28 2010-12-08 欧几里得发现有限责任公司 用来处理视频数据的装置和方法
JP4573895B2 (ja) 2005-03-31 2010-11-04 ユークリッド・ディスカバリーズ・エルエルシー ビデオデータを処理する装置および方法
US20060274949A1 (en) 2005-06-02 2006-12-07 Eastman Kodak Company Using photographer identity to classify images
KR20080031408A (ko) 2005-07-13 2008-04-08 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 시간 업-컨버전을 갖는 프로세싱 방법 및 디바이스
US7672306B2 (en) 2005-07-18 2010-03-02 Stewart Ian A Method for secure reliable point to multi-point bi-directional communications
US8867618B2 (en) 2005-07-22 2014-10-21 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
US7689021B2 (en) 2005-08-30 2010-03-30 University Of Maryland, Baltimore Segmentation of regions in measurements of a body based on a deformable model
WO2007026302A2 (en) 2005-09-01 2007-03-08 Koninklijke Philips Electronics N.V. Method and device for coding and decoding of video error resilience
JP4654864B2 (ja) 2005-09-30 2011-03-23 パナソニック株式会社 プラズマディスプレイパネルの製造方法
US8019170B2 (en) 2005-10-05 2011-09-13 Qualcomm, Incorporated Video frame motion-based automatic region-of-interest detection
US20070153025A1 (en) 2005-12-29 2007-07-05 Mitchell Owen R Method, apparatus, and system for encoding and decoding a signal on a viewable portion of a video
US8150155B2 (en) 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
US7630522B2 (en) 2006-03-08 2009-12-08 Microsoft Corporation Biometric measurement using interactive display systems
EP2044774A2 (en) 2006-06-08 2009-04-08 Euclid Discoveries, LLC Apparatus and method for processing video data
US20080027917A1 (en) 2006-07-31 2008-01-31 Siemens Corporate Research, Inc. Scalable Semantic Image Search
BRPI0622046B1 (pt) 2006-09-30 2020-01-21 Interdigital Vc Holdings Inc método e dispositivo para codificar e decodificar camada de aprimoramento de cor para vídeo
WO2008048499A2 (en) 2006-10-13 2008-04-24 Thomson Licensing Reference picture list management syntax for multiple view video coding
BRPI0719564A2 (pt) 2006-12-15 2014-10-07 Thomson Licensing Avaliação de distorção
CN101622874A (zh) 2007-01-23 2010-01-06 欧几里得发现有限责任公司 对象存档系统和方法
EP2106664A2 (en) 2007-01-23 2009-10-07 Euclid Discoveries, LLC Systems and methods for providing personal video services
CA2676219C (en) 2007-01-23 2017-10-24 Euclid Discoveries, Llc Computer method and apparatus for processing image data
KR101366242B1 (ko) 2007-03-29 2014-02-20 삼성전자주식회사 움직임 모델 파라메터의 부호화, 복호화 방법 및 움직임모델 파라메터를 이용한 영상의 부호화, 복호화 방법 및장치
US8036464B2 (en) 2007-09-07 2011-10-11 Satyam Computer Services Limited System and method for automatic segmentation of ASR transcripts
US8065293B2 (en) 2007-10-24 2011-11-22 Microsoft Corporation Self-compacting pattern indexer: storing, indexing and accessing information in a graph-like data structure
US8091109B2 (en) 2007-12-18 2012-01-03 At&T Intellectual Property I, Lp Set-top box-based TV streaming and redirecting
US8140550B2 (en) 2008-08-20 2012-03-20 Satyam Computer Services Limited Of Mayfair Centre System and method for bounded analysis of multimedia using multiple correlations
US8065302B2 (en) 2008-08-27 2011-11-22 Satyam Computer Services Limited System and method for annotation aggregation
US8086692B2 (en) 2008-08-27 2011-12-27 Satyam Computer Services Limited System and method for efficient delivery in a multi-source, multi destination network
US8259794B2 (en) 2008-08-27 2012-09-04 Alexander Bronstein Method and system for encoding order and frame type selection optimization
US8090670B2 (en) 2008-09-19 2012-01-03 Satyam Computer Services Limited System and method for remote usage modeling
US8392942B2 (en) 2008-10-02 2013-03-05 Sony Corporation Multi-coded content substitution
CN102172026B (zh) 2008-10-07 2015-09-09 欧几里得发现有限责任公司 基于特征的视频压缩
US8386318B2 (en) 2008-12-30 2013-02-26 Satyam Computer Services Ltd. System and method for supporting peer interactions
SG175139A1 (en) 2009-04-08 2011-11-28 Watchitoo Inc System and method for image compression
US8068677B2 (en) 2009-08-25 2011-11-29 Satyam Computer Services Limited System and method for hierarchical image processing
US8848802B2 (en) 2009-09-04 2014-09-30 Stmicroelectronics International N.V. System and method for object based parametric video coding
US20110087703A1 (en) 2009-10-09 2011-04-14 Satyam Computer Services Limited Of Mayfair Center System and method for deep annotation and semantic indexing of videos
US8687891B2 (en) 2009-11-19 2014-04-01 Stanford University Method and apparatus for tracking and recognition with rotation invariant feature descriptors
US8290038B1 (en) 2009-11-30 2012-10-16 Google Inc. Video coding complexity estimation
WO2011156250A1 (en) 2010-06-07 2011-12-15 Thomson Licensing Learned transform and compressive sensing for video coding
WO2012033971A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example - based data pruning using intra- frame patch similarity

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162730A (ja) * 2001-09-28 2003-06-06 Canon Inc 個人のモデルを生成する方法及び装置
US20040246336A1 (en) * 2003-06-04 2004-12-09 Model Software Corporation Video surveillance system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
JP2015515807A (ja) * 2012-03-27 2015-05-28 ユークリッド・ディスカバリーズ・エルエルシーEuclid Discoveries,Llc 映像圧縮レポジトリおよびモデル再利用
US9621917B2 (en) 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US10091507B2 (en) 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding

Also Published As

Publication number Publication date
CA2675957C (en) 2016-02-16
CN101622874A (zh) 2010-01-06
US20100086062A1 (en) 2010-04-08
TW200839622A (en) 2008-10-01
EP2106663A2 (en) 2009-10-07
WO2008091484A2 (en) 2008-07-31
US20120163446A1 (en) 2012-06-28
CA2675957A1 (en) 2008-07-31
WO2008091484A3 (en) 2008-11-13
US9106977B2 (en) 2015-08-11
US20150181217A1 (en) 2015-06-25
US8553782B2 (en) 2013-10-08

Similar Documents

Publication Publication Date Title
JP2010517426A (ja) オブジェクトアーカイブシステムおよび方法
US8243118B2 (en) Systems and methods for providing personal video services
CA2676219C (en) Computer method and apparatus for processing image data
Yu et al. Three-dimensional model analysis and processing
US20030055833A1 (en) Data structure for efficient access to variable-size data
US20200090069A1 (en) Machine learning based video compression
CN116803079A (zh) 视频和相关特征的可分级译码
US20220398692A1 (en) Video conferencing based on adaptive face re-enactment and face restoration
CN114730450A (zh) 基于水印的图像重建
JP2024501738A (ja) 特徴抽出及び画像合成に基づくビデオ符号化
CN114900717A (zh) 视频数据传输方法、装置、介质和计算设备
WO2024093627A1 (zh) 一种视频压缩方法、视频解码方法和相关装置
WO2024078509A1 (en) Methods and non-transitory computer readable storage medium for pre-analysis based resampling compression for machine vision
Boschetti et al. High Dynamic Range Images Coding: Embedded and Multiple Description
Pratapa Efficient Random Access Compression Schemes for Image-Based Representations
Chattopadhyay Content aware multimedia transcoding for resource constrained environments
CN118524238A (zh) 一种视频关键帧的快照系统及方法
Adami et al. High Dynamic Range Images Coding: Embedded and Multiple Description

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130205