JP2007529125A - 異なるコーデックを用いてメディア信号を圧縮するためのシステム及び方法 - Google Patents

異なるコーデックを用いてメディア信号を圧縮するためのシステム及び方法 Download PDF

Info

Publication number
JP2007529125A
JP2007529125A JP2005510822A JP2005510822A JP2007529125A JP 2007529125 A JP2007529125 A JP 2007529125A JP 2005510822 A JP2005510822 A JP 2005510822A JP 2005510822 A JP2005510822 A JP 2005510822A JP 2007529125 A JP2007529125 A JP 2007529125A
Authority
JP
Japan
Prior art keywords
codec
scene
automatically selected
compression
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005510822A
Other languages
English (en)
Other versions
JP4463765B2 (ja
Inventor
レイノルズ ジョディ
イングラハム ロバート
レズニック ローレンス
ウィルキンソン ジョン
プロック ジャック
マベイ ダニー
Original Assignee
インタラクト デヴァイシーズ インコーポレイテッド
ブロードキャスト インターナショナル
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インタラクト デヴァイシーズ インコーポレイテッド, ブロードキャスト インターナショナル filed Critical インタラクト デヴァイシーズ インコーポレイテッド
Publication of JP2007529125A publication Critical patent/JP2007529125A/ja
Application granted granted Critical
Publication of JP4463765B2 publication Critical patent/JP4463765B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1096Supplementary features, e.g. call forwarding or call holding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/611Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for multicast or broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/303Terminal profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25825Management of client data involving client display capabilities, e.g. screen resolution of a mobile phone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25858Management of client data involving client software characteristics, e.g. OS identifier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6131Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • H04N21/6379Control signals issued by the client directed to the server or network components directed to server directed to encoder, e.g. for requesting a lower encoding rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Abstract

入力モジュール(図3の302)は、宛先システム(204)に伝達されるべきメディア信号を得て、その後、識別モジュール(304)は、メディア信号内で複数のシーンを識別する。選択モジュール(306)は、少なくとも2つのシーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択する。コーデックは、自動的に選択され、目標データレートを超えないという基準に応じて、それぞれのシーンに対して最高の圧縮品質を生成する。それから、圧縮モジュール(310)は、自動的に選択されたコーデックを用いて、前記シーンを圧縮し、その後、出力モジュール(312)は、どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、圧縮されたシーンを宛先システム(204)に送出する。

Description

本発明は、概して、データ圧縮の分野に関するものである。特に、本発明は、ビデオ及びオーディオ信号の圧縮を最適化するための技術に関するものである。
通信時代において、バンド幅は金である。ビデオ及びオーディオ信号(以下、「メディア信号」)は、所望の伝送品質に依存して、膨大な量のバンド幅を消費する。その結果、データ圧縮は通信においてますます重要な役割を果たしている。
従来、通信に関連する者は、メディア信号を圧縮及び、解凍するための特定のコーデック(圧縮器/解凍器)を決定する。多種多様なコーデックが利用できる。コーデックの一般的な分類の中には、離散コサイン変換(DCT)あるいは「ブロック」コーデックと、フラクタルコーデックと、ウェーブレットコーデックとがある。
幾つかのコーデックは、「無損失コーデック(可逆コーデック)」、すなわち、圧縮プロセスの間にデータの損失がないというコーデックである。圧縮されたメディア信号は、受信され、可逆コーデックにより解凍されると、元のメディア信号と同一になる。しかし、大部分の商用のコーデックは「不可逆」であり、元のメディア信号の劣化をもたらす。
不可逆コーデックにとって、圧縮「品質」(すなわち、圧縮されたメディア信号が、解凍後に元のメディア信号にどのくらい似ているか)は、コーデックごとに相当異なり、例えば、使用できるバンド幅の量、通信回線の品質、およびメディア信号の特性などに依存し得るものである。別の圧縮測定基準、すなわち、パフォーマンス(性能)は、元の信号ではなく圧縮された信号を伝送するのに必要なバンド幅の量に関係がある。一般的に、不可逆のコーデックは、可逆のコーデックよりよいパフォーマンスをもたらし、それゆえ不可逆のコーデックが、大部分のアプリケーションで好まれている。
コーデックの設計者は、一般的に、幅広いオペレーティングパラメータにわたって高品質の圧縮出力を生成するコーデックを作るように試みる。MPEG−2のようなコーデックは一般的な有用性のために広範囲に受け入れられてきたが、あらゆる目的に完全に適したコーデックはない。各々のコーデックは、個々の強みと弱みを有する。
従来、全通信セッションの間、あるいは、記憶媒体(例えば、DVD)にわたって等しく、同一のコーデックを使用してメディア信号の圧縮と解凍を行う。しかし、メディア信号は固定量ではない。例えば、ビデオ信号は、シーンごとに相当変化し得るものである。同様に、利用できるバンド幅、あるいは回線品質は伝達の過程において変化し得るものである。最初に間違ったコーデックを選択することは、メディア信号を伝送したり、格納するのに必要なバンド幅の観点で手痛い誤りになりうる。
以下、図面を参照するが、同様の参照符号は同様の要素を示す。明確にするために、参照符号の最初の桁は、対応する要素が最初に使われた図面の番号を示している。
以下の説明において、プログラミング、ソフトウェアモジュール、ユーザーセレクション、ネットワークトランザクション、データベースクエリー、あるいはデータベースストラクチャーなどの多数の詳細な説明は、本発明の実施形態の完全な理解のために提供される。しかし、当業者は、本発明が、1つ以上の詳細な説明を用いずとも、その他の方法、構成要素、あるいは機材などを用いて実行できるということを認識するだろう。
いくつかの場合において、公知の構造、機材或いは動作は、本発明の態様を曖昧にするのを避けるため詳しく説明しない。さらに、説明する特徴、構造或いは特性は、何らかの適切な方法で、1つ以上の実施形態上で組み合わせることができる。
図1は、メディア信号をソースシステム102から宛先システム104に伝達(通信)するための従来システム100のブロック図である。ソースシステム102と宛先システム104とは、例えば、パーソナルコンピュータ(PC)、ケーブルか衛星のセットトップボックス(STB)、あるいは個人用携帯情報端末(PDA)や携帯電話のような映像可能の携帯装置として多種多様に具体化できる。
ソースシステム102の内部で、ビデオカメラ106あるいは他の装置は元のメディア信号108を取り込む。コーデック(圧縮器/解凍器)110は、元のメディア信号108を処理し、圧縮されたメディア信号(圧縮メディア信号)112を生成し、その圧縮メディア信号は、ローカルエリアネットワーク(LAN)やインターネットのようなネットワーク114を介して宛先システム104に送出されうる。あるいは、圧縮メディア信号112は、CD、DVD、フラッシュメモリ装置などの記憶媒体に記録されうる。
宛先システム104において、同一のコーデック110はネットワーク114を通じて受信した圧縮メディア信号を処理し、解凍されたメディア信号(解凍メディア信号)116を生成する。その後、宛先システム104は、解凍メディア信号116をテレビやコンピュータモニタのようなディスプレイ装置に提示する。
従来、ソースシステム102は、単一のコーデック110を使用して、通信セッションの間において、あるいは、特定の記憶媒体に対して、全てのメディア信号108を処理する。しかし、上述したように、メディア信号は固定量ではない。ビデオ信号は、シーンごとに相当変化し得るものである。単一のコーデックはある条件下ではよく機能し得るが、異なる状況下ではよく機能しないこともある。使用できるバンド幅、回線状態、あるいはメディア信号自体の特性の変化は、異なるコーデックならより良くできるというくらいまで、圧縮品質を大幅に変え得るものである。コンテンツ開発者は、例えば、あるコーデック110が別のコーデック110よりも優れていることを知っている場合などでは、メディア信号108の途中におけるコーデック110の変更を手動で指定できる場合もある。しかし、このことはかなりの人手を必要とし、リアルタイムでは実行できない。
図2は、本発明の実施例に係る、ソースシステム202から宛先システム204へメディア信号を伝達(通信)するための代替のシステム200のブロック図である。前と同様に、ソースシステム202は、ビデオカメラ106やその他の適切な装置によって取得された元(オリジナル)のメディア信号108を受信する。
しかし、図1のシステム100と異なり、図示したシステム200は、通信セッションの間において、あるいは、特定の記憶媒体に対して、単一のコーデック110を使用することには制限されていない。むしろ、以下により詳細に記載するように、元のメディア信号108の各々のシーン206やセグメントは、複数のコーデック110の中から1つを使用して圧縮されることができる。シーン206は、元のメディア信号108の1つ以上のフレームを含むことができる。ビデオ信号の場合、フレームは、連続するメージ(画像)の中で1つのイメージを指す。しかし、より一般的には、フレームは、通信に使用されるパケット情報を指す。
本明細書で使用するように、シーン206は、メディア信号108の固定のセグメント、例えば、2秒のオーディオ/ビデオフレームや固定数のフレームに対応し得るものである。しかし、他の実施例において、シーン206は元のメディア信号108の特性によって定義され得るものである。すなわち、シーン206は、類似した特性を共有する2以上のフレームを含み得る。元のメディア信号108の1つ以上の特性が現在の閾値を越えて変化する場合、ソースシステム202は新しいシーン206の開始を検出し得るものである。こうして、ビデオカメラ106が静止物に焦点を合わせる間、シーン206は、カメラ106や対象物やそれら両方が動くまで続くだろう。
図示するように、同一のメディア信号108内の2つの隣接したシーン206は、異なるコーデック110を用いて圧縮され得るものである。コーデック110は、例えば、離散コサイン変換(DCT)のような同一の一般的なタイプ、あるいは、異なるタイプでもよい。例えば、あるコーデック110aはDCTコーデックで、一方、別のコーデック110bはフラクタルコーデックで、さらに別のコーデック110cはウェーブレットコーデックでもよい。
従来システム100と異なり、図2のシステム200は、利用できるコーデック110から、各々のシーン206を圧縮するのに最も適した特定のコーデック110を自動的に選択する。選択プロセスの詳細は、以下により詳細に記載する。しかし、簡潔にいうと、システム200は、どのコーデック110が、特定の特性を有するシーン206に使われるのかを「記憶する」。後続のシーン206が、同一の特性を有すると判断した場合は、同一のコーデック110を使う。しかし、シーン206が、以前に観測されたのと実質的に異なる特性を有することがわかった場合は、システム200は様々なコーデック110をシーン206に対してテストし、特定の目標データレートに対して最も高い圧縮品質(すなわち、圧縮メディア信号210が解凍の後、元の信号108にどのくらい似ているか)を生成するコーデック110を選択する。
さらに、ソースシステム202は、宛先システム204に、どのコーデック110を使用して各々のシーン206を圧縮したのかを報告する。図示するように、このことは、結果として生じる圧縮メディア信号210において、コーデック識別子208を各々のシーン206に関連付けることによって達成される。図示するように、コーデック識別子208は、各々のシーン206に先行し、あるいは、伝送中のある時点でブロックとして送信されうる。コーデック識別子208の正確なフォーマットは、本発明にとって重要ではなく、当業者に知られている標準のデータ構造を用いて実施することができる。
宛先システム204は、コーデック識別子208を使用し、それぞれのシーン206を解凍するのに適切なコーデック110を選択する。結果として生じた解凍メディア信号116は、それから、前述したように、ディスプレイ装置118に提示される。
図3は、ソースシステム202のさらなる詳細を説明している。ある実施例において、入力モジュール302は、元のメディア信号108をビデオカメラ106かその他のソースデバイス(供給元装置)から受信する。識別モジュール304は、元のメディア信号108をシーン206に分割し、以下により詳細に記載するように、各々のシーン206の様々な特性(図示せず)を識別する。
その後、各々のシーン206に対して、選択モジュール306は特性(あるいは、シーン206自体)を使用し、最適なコーデック110をコーデックライブラリ308から選択する。本明細書で使用するように、「最適」とは、(コーデックライブラリ308内のコーデック110の中から)特定の目標データレートで、圧縮メディア信号210に対して最も高い圧縮品質を生成するという意味である。
ある実施例では、ユーザが、特定の目標データレート、すなわち、128キロバイト毎秒(kbps)を指定してもよい。あるいは、目標ターゲットレートは使用できるバンド幅やその他の制限から見て決定することもできる。
コーデックライブラリ308は、多種多様のコーデック110を含み得る。考えられるビデオコーデック110の例は、以下の表に与えられる。加えて、MPEGオーディオレイヤー3(MP3)、MPEG−4構造化オーディオ(MP4−SA)、CCITT u−Law、Ogg Vorbis、あるいはAC3のような様々な音声のみのコーデックが与えられる。もちろん、その他の現在使用できる、あるいは、いまだに開発されていないコーデック110も、本発明の範囲内で使用されうる。
Figure 2007529125

Figure 2007529125

Figure 2007529125

Figure 2007529125

Figure 2007529125

Figure 2007529125

Figure 2007529125

Figure 2007529125
当業者は、上述のコーデックの多くが、多種多様なメディア信号と条件に対して高い圧縮品質を達成するという点で、「汎用」コーデックであるとみなされることを認識するだろう。しかし、他のコーデックは、特定のタイプのメディア信号を良く圧縮したり、特定の条件下で多くのタイプのメディア信号を良く圧縮するので、「特化」コーデックとみなされるだろう。異なる種類のコーデックを含み、様々な汎用コーデックと特化コーデックとの両方を含むコーデックライブラリ308を備えることは、一般的に、圧縮メディア信号210に対して最良の総合的な圧縮品質をもたらす。
再び図3を参照すると、コーデック110がシーン206のために選択されると、圧縮モジュール310は選択されたコーデック110を使用して、シーン206を圧縮する。出力モジュール312は結果として生じる圧縮メディア信号210を受信し、ある実施例において、コーデック識別子208を追加し、どのコーデックを使用して各々のシーン206を圧縮したのかを表示する。他の実施例において、コーデック識別子208は圧縮モジュール310によって、あるいは、圧縮プロセスの他の時点で追加されうる。出力モジュール312は、それから、ネットワーク114を介して、圧縮メディア信号210を宛先システム204に送出する。
図3の実施例は、ビデオ会議を含むストリーミングメディアアプリケーションに、主に適用できる。その他の実施例において、図4に示すように、出力モジュール312は、CDかDVDレコーダ、フラッシュカードライタなどのような記憶装置402に結合できる。図示するように、圧縮メディア信号210(およびコーデック識別子208)は、適切な記憶媒体204に格納されることができ、その記憶媒体404は、宛先システム204に物理的に届けられる。このような実施例において、宛先システム204は、記憶媒体404の圧縮メディア信号210を読み出すためのメディアリーダ(図示せず)を含むだろう。
従来のメディア圧縮技術と異なり、元のメディア信号108は、単一のコーデックを使用して(すなわち、DVDにおけるMPEG−2のような)圧縮されるわけではない。むしろ、各々のシーン206は、コーデックライブラリ308からシーン206のために選択された最良のコーデックを使用して自動的に圧縮される。上述した技術を使用して、10〜12時間のDVD品質の映像が1つの記録可能なDVDに格納できるだろう。
図5は、選択モジュール306のさらなる詳細を示す。上述したように、識別モジュール304は、元のメディア信号108を受信し、個々のシーン206と、各々のシーン206の特性502とを識別する。特性502は、例えば、動き特性、色特性、YUV信号特性、色分類特性(カラーグルーピング特性)、色ディザリング、カラーシフト特性、ライティング特性(lighting characteristics)、およびコントラスト特性を含むだろう。当業者は、シーン206の多種多様なその他の特性が本発明の範囲内で識別されうるということを理解するだろう。
動きは、対象物の検出から生じるベクトルからなる。関連する動き特性は、例えば、対象物(オブジェクト)の数、対象物の大きさ、対象物の速度および対象物の動きの方向を含む。
色に関して、各々のピクセルは、一般的に、赤と、緑と、青と、輝度とに対するある範囲の値を有する。関連する色特性は、値の範囲がフレームセットを通じてどのくらい変化するか、ある色が他の色より頻繁に出現するか否か(抽出)、色分類がフレームセット内でシフトするか否か、ある分類と別の分類との相違がフレームセットの全体にわたって大きく異なるか(対比)を含むだろう。
ある実施例において、ニューラルネットワークあるいはエキスパートシステムのような、人工知能(AI)システム504は、シーン206の特性502と、圧縮メディア信号210に対する目標データレート506とを受信する。AIシステム504は、それから、所定の特性502で、目標データレート506で、シーン206を最適に圧縮するということがすでににわかっているコーデック110がライブラリ308に存在するか否かを判断する。以下に説明するように、AIシステム504は、特性502のセットと、最適なコーデック110との間の関連付けを「格納している」として概念的に説明され得る。関連付けを発見した場合は、選択モジュール306は、コーデック110(あるいは、それを示す指標)を「選択された」コーデックとして出力する。
多くの場合において、特定の特性を有するシーン206は、以前に出現したことがないだろう。従って、選択モジュール306は、シーン206のコピーを作成するが、本明細書ではこれを基本(ベースライン)スナップショット508と呼び、その基本スナップショット508は、圧縮品質を判断するための基準点として機能する。
その後、圧縮モジュール510は、そのシーン206に対して、コーデックライブラリ308の異なるコーデック110をテスト(検査)する。ある実施例において、圧縮モジュール510は、図3の圧縮モジュール310でもある。図示するように、圧縮モジュール510は、目標データレート506で異なるコーデック110を使用してシーン206を圧縮し、多数の圧縮されたテストシーン(圧縮テストシーン)512を生成する。
コーデック110は、順次に、無作為に、あるいはその他の方法でテストされるが、ライブラリ中のコーデック110の全てをテストする必要はない。ある実施例において、AIシステム504からの入力によって、ライブラリ308からテストするためにコーデック110の一部(サブセット)を選択するのを支援することができる。リアルタイム圧縮を円滑にするために、コーデックのテストに、制限時間を設けることもできる。従って、制限時間に達した場合は、さらなる圧縮テストシーン512は生成されない。
ある実施例において、比較モジュール514は、基準516に応じて、各々の圧縮テストシーン512の圧縮品質をと基本スナップショット508とを比較する。基準516は、ピーク信号対ノイズ比(PSNR)の比較に基づいており、PSNRはM×Nのフレームに対して次式で計算される。
Figure 2007529125
但し、fは元のフレームで、f’は圧縮されていないフレームである。
あるいは、二乗平均平方根誤差(RMSE)、信号対ノイズ比(SNR)、または、その他の客観的な品質測定法は、当業者に既知のものとして使用されるであろう。
ある実施例において、最小可知差異(JND)の画質測定計算が使用され得る。JNDは、当業者に知られている、ロバストで客観的な画像品質測定方法である。それは、動的で複雑な動きの連続の計算のために、3つの次元、すなわち、空間分析と、時間的解析と、フルカラー解析を含む。画像差異プロセスにおいて、人間の視覚システムのモデルを使用することによって、JNDは、圧縮プロセスと、結果として生じるアーチファクトとは独立した結果を生成する。
ある実施例において、圧縮モジュール514は、圧縮シーン512を生成するのに使用され、基準516に応じて基本スナップショット508と比較するとき最高の圧縮品質を有するようなコーデック110を自動的に選択する。そのコーデック110(あるいは、その指標)は、それから、選択モジュール306により、選択されたコーデック110として出力される。
比較モジュール514は、どのコーデックが、そのシーン206に対して選択されたのかをAIシステム504に伝える。このことにより、AIシステム504は、そのシーン206の識別された特性502と選択されたコーデック110とを関連付けることができる。こうして、今後、AIシステム504は、比較モジュール514による再テストの必要なしに、同様のシーン206に対して、コーデック110を自動的に選択することができる。
図3も併せて参照すると、ある構成において、最高品質の圧縮テストシーン512aは、出力モジュール312(図示せず)に単に渡され、圧縮メディア信号210に含まれる。しかし、圧縮モジュール310は、ある特定の実施例において、選択されたコーデック110を使用して、シーン206を再圧縮できるだろう。
図6は、上述したプロセスの例を提供する。識別モジュール304が、特定の特性502aのセットを有するシーン206aを発見すると仮定する。ある実施例において、AIシステム504は、その特性502aと特定のコーデック110との間の関連602を検索する。AIシステム504が、特性502と、関連602と、コーデック110とを含むように図示してあるが、当業者は、それらの実体がコード、ハッシュ、あるいは様々な実装におけるその他の識別子によって表されるということを認識するだろう。
このような関連602が発見されない場合は、シーン206aの基本スナップショット508が作成される。さらに、圧縮モジュール510は、目標データレート506で、コーデックライブラリ308から多数の異なるコーデック110a〜cを用いて、シーン206aを圧縮し、複数の圧縮テストシーン512a〜cを生成する。これらのテストシーン512a〜cは、それから、基準516、例えばPSNRに応じて、基本スナップショット508と比較される。
1つのコーデック110a(「コーデック1」)により生成された圧縮テストシーン512aが、最高の圧縮品質、例えば最高のPSNRを生成すると仮定する。このような場合、圧縮モジュール514は、AIシステムに報告し、関連(づけ)602は、そのシーン206aの特性502aと選択されたコーデック110aとの間になされる。従って、同一の特性502aを有するシーン206が将来出現した場合は、AIシステム504は、再テストする必要なく、最適なコーデック110aを簡単に識別できるだろう。
図7を参照すると、AIシステム504は、複数の人工ニューロンを具える一般的なフィードフォワードニューラルネットワーク700を使用して実装することができる。ニューロン702は、多数の入力(元のデータから、あるいは、ニューラルネットワーク700上の他のニューロンの出力からのいずれか)を受信する。各々の入力は、強度(あるいは「重み」)を有する接続を経由してくる。これらの重みは、生体ニューロンにおいてシナプス効力に対応する。各々のニューロン702は、単一の閾値も有する。入力の重みづけられた合計が形成され、閾値が引かれ、ニューロン702の「活性化」(ニューロン702のシナプス後電位、すなわちPSPとしても知られている)を構成する。活性化信号は、活性化関数(伝達関数としても知られている)を通過して、ニューロン702の出力を生成する。
図示するように、一般的なニューロンネットワーク700は、区別できる階層トポロジに配置されたニューロン702を有する。「入力」層704は、それ自体はニューロン702から構成されていない。これらのユニットは、入力変化の値(すなわち、シーンの特性502)を取り込む働きをするだけである。隠れ層706と出力層708とにあるニューロン702は、その前の層のユニットの全てに、各々接続される。
ネットワーク700が実行されると、入力変化の値は入力ユニットに置かれ、それから、隠れ層ユニットおよび出力層ユニットは次第に実行される。それらの各々は、前の層の出力の合計の重みをとり、閾値を引き算することにより、それの活性化値を計算する。活性化値は、活性化関数を通って伝達され、ニューロン702の出力を生成する。全ニューラルネットワーク700が実行されると、出力層708の出力は全ネットワーク700の出力(すなわち、選択されたコーデック110)のように作用する。
フィードフォワードニューラルネットワーク700は、図7に図示され、当業者は、フィードバックネットワーク、誤差逆伝播法(BP)あるいは動径基底関数ネットワーク(RBF)のような、その他のタイプのニューラルネットワーク700が使用されうるということを認識するであろう。他の実施例において、エキスパートシステムのような全く異なるタイプのAIシステムを使うこともできる。
さらに他の実施例において、AIシステム504は、特定の特性502のセットに基づいてコーデック110を検索できるような、ルックアップテーブル、データベース、あるいは他のデータ構造で置き換えてもよい。このように、本発明はAIシステム504を必要とするものととして構築されるべきではない。
図8を参照して、本発明は、異なるコーデック110を用いて、元のメディア信号108の異なるシーン206をそれぞれコード化(符号化)するような実施例に制限されるわけではない。図示するように、単一のコーデック110が、ある実施例において使われることができる。しかし、コーデック110に対する異なるセッティング(設定)804(パラメータ)が、前の実施例において異なるコーデック110が選択されたのとほぼ同じ方法で、自動的に選択してもよい。
本明細書で用いるように、コーデックのセッティング804は、動き予測法、GOPサイズ(キーフレームインターバル)、種々の変換(例えば、DCT対ウェーブレット)、輝度や色度のノイズ低減、デコーダデブロッキングレベル、あるいは前処理/後処理フィルタ(シャープニング・ノイズ減少)などのような標準パラメータを指し示す。
前述したように、識別モジュール304が所定の特性502aのセットを有するシーン206aを発見すると仮定する。ある実施例において、AIシステム504は、特性502aとコーデック110に対する1つ以上のセッティング804aとの間の関連802を検索する。
このような関連802が発見されないと仮定する。ある構成において、シーン206aの基本スナップショット508が撮影される。さらに、圧縮モジュール510は、目標データレート506で、同一のコーデック110だが異なるセッティング804a〜cを用いて、シーン206aを圧縮する。結果として生じる圧縮テストシーン512a〜cは、それから、基本スナップショット508に対して、基準516、例えばPSNRに応じて圧縮される。
セッティング804a(セッティング1)の群により生成された圧縮テストシーン512aが、最高の圧縮品質、例えば最高のPSNRをもたらすと仮定する。このような場合、比較モジュール514は、AIシステムに報告し、その結果、関連(付け)802が、シーン206aの特性502aと選択されたセッティング804aの群との間になされる。従って、同一の特性502aを有するシーン206が、将来出現する場合には、AIシステム504は、再テストの必要なしに、最適なセッティング804aを簡単に識別することができるだろう。
さらに別の実施例において、AIシステム504は、所定の特性502のセットに基づいて、異なるコーデック110と異なるコーデックのセッティング804との両方を検索することができる。同様に、圧縮モジュール510は、異なるコーデック110と異なるコーデックのセッティング804の組み合わせに基づいて、圧縮テストシーン512を生成することができる。比較モジュール514は、それから、所定のシーン206に対して、コーデック110とセッティング804の最良の組み合わせを選択することができる。
ある実施例において、図9に示すように、比較モジュール514は、どのコーデック110及び/あるいはセッティング804を特定のシーン206に対して自動的に選択するべきかを判断するときに、圧縮品質に加えて(あるいは、代わりに)他のファクターを考慮することができる。例えば、特定のコーデック110の使用は、特許、その他の知的財産権に基づいて、ライセンシングコスト902を負担することがありうる。ライセンシングコスト902は、コーデック110が使用される回数、そのコーデック110を使用して圧縮されたデータの量、或いは他の方法に関連し得るものである
あるコーデックが、例外的に高い圧縮品質(例えば、PSNR)をもたらす一方、そのライセンシングコスト902は、伝送する価値を超えることもあり、その場合にはコストに見合わなくなるだろう。様々なコーデック110に対するライセンシングコスト902の指標は、コーデックライブラリ308内、あるいは、比較モジュール514がアクセスできるほかの場所に格納することができる。
ある実施例において、ライセンシングコスト902は、多数の上位のコーデック110が、同様の結果を生成したときのみ、例えば、圧縮品質が閾値以下で異なるときにのみ考慮される。図9の例において、最初の3つのコーデックは同様の品質の出力を生成する。しかし、最も高いPSNRスコアを持つコーデックは、次に高いPSNRスコアを持つコーデックより2倍以上高価であり、3番目に高いPSNRスコアを持つコーデック110よりほぼ3倍高価である。ある構成において、比較モジュール510は、ライセンシングコスト902がはるかに安いため、3番目に高いPSNRスコアを持つコーデック110を選択するだろう。
他の実施例において、比較モジュール514は、PSNRスコア、ライセンシングコスト902、或いは他の利用可能なファクターに基づいた合成値(図示せず)を生成する。さらに他の実施例において、比較モジュール514は、全伝送に対する予想されるコスト(図示せず)を計算し、コーデックを選択する判断の全ての中でコストを最小にしようとする。従って、比較モジュール514は、特定シーン206に対して、品質の相当な増加が実現されるので、より高価なコーデック110を選択し、他のシーンに対してはそれほど高価でないコーデック110を選択することができる。
図10を参照すると、ソースシステム202のユーザは、特定の目標データレート506を、例えば、ビデオ通信に対して512kbpsを指定してもよい。しかし、宛先システム204が、データをそれほど迅速に処理できるという保証はない。さらに、ネットワーク114が、常に同量のバンド幅を提供するという保障はない。結果として、ソースシステム202の選択モジュール306内で目標データレート506を定期的に変更する必要がありうる。なぜなら、目標データレート506は、どのコーデック110が様々なシーン206に選択されるのかに影響を与えるからである。
例えば、図10に示すように、宛先システム204は、映像を利用可能な携帯電話機として具体化されることができる。一般的に、携帯電話ネットワーク114のバンド幅は制限されている。同様に、携帯電話の処理能力は、パーソナルコンピュータや専用ビデオ会議システムのそれより相当に少ない。
このように、ソースシステム202のユーザは、目標データレートを512kbpsと指定するが、宛先システム204及び/あるいはネットワーク114は、これを試さなくてもよい。ある実施例において、接続要求の受信に応じて、宛先システム204は、ソースシステム202に、修正した目標データレート1002、例えば128kbpsを提供する。修正されたデータレート1002は、何らかの標準データ構造か技術を使用して、ソースシステム202に伝達される。その後、構成に応じて、目標データレート506は修正されたレート1002に置き換えられるだろう。
特定の実施例において、実際のデータレートは伝えられない。むしろ、メッセージが送られ、宛先システム204かネットワーク114の1つ以上の制限あるいは能力を指定する。その場合において、目標データレート506を適切に修正するかはソースシステム202次第であろう。様々な条件に応じて目標データレート506を変更する技術は、本明細書では「ダイナミックストリーミング」と称する。
ある実施例において、特定のメッセージが宛先システムから送出されない場合に、ダイナミックストリーミングを使用することができる。ソースシステム202は、レイテンシ計算を使用して、失われたパケットなどを再送信するように要求し、コーデック及び/あるいはパラメータ選択のために目標データレート506を動的に決定する。
ある構成例では、図11に示すように、シーン206内のビデオフレーム1102は、複数のサブフレーム1104に分割してもよい。図示したビデオフレーム1102は、同じ大きさのサブフレーム1104a〜dに分割されているが、本発明は、この点に制限されるわけではない。例えば、ビデオフレーム1102を、どんな数のサブフレーム1104に細分することができる。ただし、多すぎるサブフレーム1104は、圧縮品質に悪影響を及ぼしうる。さらに、サブフレーム1104は、同じ大きさである必要はない。例えば、ビデオフレーム1102の中央に近いサブフレーム1104は、このエリアでは比較的大きな量の動きがあるため小さくすることができる。
ある実施例では、サブフレーム1104は、ビデオフレーム1102内で描画されるオブジェクト(対象物)によって定義し得る。例として、人の頭部は、別個のオブジェクトとして定義され、したがって、背景とは異なるサブフレーム104が定義され得る。ビデオフレーム1102内のシーンをオブジェクト化するアルゴリズム(例えば、MPEG−4)は、当該分野では既知である。
シーン206内のサブフレーム1104a〜dのセットは、特性502a〜dを示し、実際上には、完全なビデオフレーム1102のように扱うことができる。従って、上述した技術を使用して、特性502a〜dは、それぞれのサブフレーム1104a〜dを圧縮するために最適なコーデック1104a〜dを決定するのに使用され得る。例えば、AIシステム504(図示せず)は、関連602が、特性502のセットと特定のコーデック110との間に存在する否かを判断するのに使用することができる。関連602が存在しない場合は、それぞれのサブフレーム1104に対して、複数のコーデック110をテストするために、圧縮モジュール510と比較モジュール514とを(図示せず)使用して、最適なコーデック110を決定することができる。
こうして、単一のシーン206の異なるサブフレーム1104a〜dは、異なるコーデック110a〜dを使用して圧縮することができる。図示した実施例においては、4つの異なるコーデック110a〜dが使用されている。
本発明の具体的な実施例と適用例を図示および説明してきたが、本発明は本明細書で記載された構造や構成そのものに限定されないものと理解すべきである。当業者にとって明らかな様々な修正、変更、および変形は、本発明の本質と範囲を逸脱することなく、本明細書に開示した本発明の構成、操作および方法とシステムの詳細に施すことができる。
図1は、データ圧縮を用いる従来の伝達システムのブロック図である。 図2は、本発明の実施形態に係る、メディア信号の部分を圧縮するための多数のコーデックを用いる伝達システムのブロック図である。 図3は、本発明の第1実施形態に係る、ソースシステムの詳細なブロック図である。 図4は、本発明の第2実施形態に係る、ソースシステムの詳細なブロック図である。 図5は、選択モジュールの詳細なブロック図である。 図6は、コーデックを自動的に選ぶプロセスのデータフローダイアグラムである。 図7は、人工知能システムの詳細なブロック図である。 図8は、コーデックの設定を自動的に選ぶプロセスのデータフローダイアグラムである。 図9は、ライセンシングコストファクターの一部を示している比較モジュールのブロック図である。 図10は、目標データレートを修正するプロセスのブロック図である。 図11は、ビデオフレームを分割する構成図である。

Claims (64)

  1. メディア圧縮方法であって、
    宛先システムに伝達されるべきメディア信号を得るステップと、
    前記メディア信号内で複数のシーンを識別するステップと、
    少なくとも2つのシーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するステップであって、目標データレートを超えないという基準に応じて、それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなステップと、
    前記自動的に選択されたコーデックを用いて、前記シーンを圧縮するステップと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するステップと、
    を有することを特徴とするメディア圧縮方法。
  2. 請求項1に記載の方法において、
    前記コーデックが、離散コサイン変換(DCT)コーデックと、フラクタルコーデックと、ウェーブレットコーデックとからなる群から選択される、
    ことを特徴とする方法。
  3. 請求項1に記載の方法において、
    自動的に選択される第1のコーデックが離散コサイン変換(DCT)コーデックを含み、自動的に選択される第2のコーデックがフラクタルコーデックを含む、
    ことを特徴とする方法。
  4. 請求項1に記載の方法において、
    自動的に選択される第1のコーデックが離散コサイン変換(DCT)コーデックを含み、かつ、自動的に選択される第2のコーデックがウェーブレットコーデックを含む、
    ことを特徴とする方法。
  5. 請求項1に記載の方法において、
    前記自動的に選択するステップが、
    シーンの複数の特性を識別するステップと、
    前記シーンの前記識別された特性に関連するコーデックをライブラリ内で検索するステップと、をさらに含む、
    ことを特徴とする方法。
  6. 請求項5に記載の方法において、
    前記特性が、動き特性と色特性とからなる群から選択される、
    ことを特徴とする方法。
  7. 請求項6に記載の方法において、
    前記検索するステップが、
    人工知能(AI)システムを用いて、前記シーンの識別された特性に関連するコーデックを見つけ出すステップを、さらに含む、
    ことを特徴とする方法。
  8. 請求項7に記載の方法において、
    前記AIシステムが、ニューラルネットワークを具える、
    ことを特徴とする方法。
  9. 請求項7に記載の方法において、
    前記AIシステムが、エキスパートシステムを具える、
    ことを特徴とする方法。
  10. 請求項1に記載の方法において、
    前記自動的に選択するステップが、
    シーンにおいて前記コーデックライブラリの前記コーデックの少なくとも一部をテストするステップと、
    目標データレートを超えないという基準に応じて、前記シーンに対する最高の圧縮品質を生成するようなコーデックを自動的に選択するステップと、を含む
    ことを特徴とする方法。
  11. 請求項10に記載の方法において、
    前記テストするステップが、
    前記シーンの基本スナップショットを格納するステップと、
    テストされるべき各々のコーデックに対して、
    前記ライブラリ中の前記コーデックの1つを用いて目標データレート以下で前記シーンを圧縮するステップと、
    同一のコーデックを用いて前記シーンを解凍するステップと、
    前記基準によって、前記基本スナップショットと、前記解凍されたシーンの前記品質とを比較するステップと、をさらに含む、
    ことを特徴とする方法。
  12. 請求項11に記載の方法において、
    前記比較するステップが、
    ピーク信号対ノイズ比(PSNR)によって前記品質を比較するステップをさらに含む、
    ことを特徴とする方法。
  13. 請求項11に記載の方法において、
    前記比較するステップが、
    最小可知差異(JND)値によって前記品質を比較するステップをさらに含む、
    ことを特徴とする方法。
  14. 請求項11に記載の方法において、
    シーンの複数の特性を識別するステップと、
    前記シーンの前記識別された特性を、前記自動的に選択されたコーデックに関連付けるステップと、
    をさらに含むことを特徴とする方法。
  15. 請求項1に記載の方法において、
    前記宛先システムの制限に応じて、前記目標データレートを調整するステップ、
    をさらに含むことを特徴とする方法。
  16. 請求項1に記載の方法において、
    前記宛先システムまでの伝送チャネルの条件に応じて、前記目標データレートを調整するステップ、
    をさらに含むことを特徴とする方法。
  17. 請求項1に記載の方法において、
    前記宛先システムからのメッセージに応じて、前記目標データレートを調整するステップ、
    をさらに含むことを特徴とする方法。
  18. 請求項5に記載の方法において、
    前記検索するステップが、
    前記識別された特性と前記自動的に選択されたコーデックに用いるべきパラメータセットとの関連を検索するステップをさらに含み、
    前記圧縮するステップが、
    前記自動的に選択されたコーデック、および、これに関連するパラメータセットを用いて、前記シーンを圧縮するステップをさらに含み、
    前記送出するステップが、
    どのコーデックと、どのパラメータセットを使用して前記シーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するステップをさらに含む、
    ことを特徴とする方法。
  19. 請求項10に記載の方法において、
    前記テストするステップが、
    異なるパラメータセットを用いて前記シーンに対して前記コーデックライブラリのコーデックをテストするステップと、目標データレートを超えないという基準に応じて、前記シーンに対して最高の圧縮品質を生成する前記コーデックとパラメータセットを自動的に選択するステップをさらに含み、
    前記圧縮するステップが、
    前記自動的に選択されたパラメータを持つ前記自動的に選択されたコーデックを用いて前記シーンを圧縮するステップをさらに含み、
    前記送出するステップが、
    どのコーデックとパラメータセットを使用して前記シーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するステップをさらに含む
    ことを特徴とする方法。
  20. 請求項19に記載の方法において、
    シーンの複数の特性を識別するステップと、
    前記自動的に選択されたコーデックと前記自動的に選択されたパラメータセットとを前記シーンの前記識別された特性に関連付けるステップと
    をさらに含むことを特徴とする方法。
  21. 請求項1に記載の方法において、
    前記識別するステップが、前のフレームと十分に異なる、前記メデイア信号の1フレームに応じてシーンの変化を検出するステップ、
    をさらに含むことを特徴とする方法。
  22. 請求項1に記載の方法において、
    前記識別するステップが、一定期間の経過に応じてシーンの変化を検出するステップをさらに含む、
    ことを特徴とする方法。
  23. 請求項1に記載の方法において、
    前記送出するステップが、各々の圧縮されたシーンを前記宛先システムまでネットワークを通じてストリーミングするステップをさらに含む、
    ことを特徴とする方法。
  24. 請求項1に記載の方法において、
    前記送出するステップが、各々の圧縮されたシーンを記憶媒体に格納するステップをさらに含む、
    ことを特徴とする方法。
  25. 請求項1に記載の方法において、
    前記コーデックライブラリ内の少なくとも1つのコーデックが、
    それに関連付けられたライセンシングコストを有し、
    前記選択するステップが、
    シーンの圧縮出力をほぼ同一の品質で生成する2つ以上のコーデックに対して、最も少ないライセンシングコストを有する前記コーデックを自動的に選択するステップをさらに含む、
    ことを特徴とする方法。
  26. メディア圧縮方法であって、
    宛先システムに伝達されるべきメディア信号を得るステップと、
    前記メディア信号の少なくとも2つのセグメントを圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するステップであって、目標データレートを超えずに、前記それぞれのセグメントに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなステップと、
    前記自動的に選択されたコーデックを用いて、前記セグメントを圧縮するステップと、
    どのコーデックを使用して各々のセグメントを圧縮したのかを示す指標と共に、前記圧縮されたセグメントを前記宛先システムに送出するステップと
    を含むことを特徴とするメディア圧縮方法。
  27. メディア圧縮方法であって、
    ライセンシングコストに関連付けられた少なくとも1つのコーデックからなるコーデックライブラリを提供するステップと、
    宛先システムに伝達されるべきメディア信号を得るステップと、
    前記メディア信号内の複数のシーンを識別するステップと、
    少なくとも2つの前記シーンをそれぞれ圧縮するために前記コーデックライブラリから異なるコーデックを自動的に選択するステップであって、目標データレートを超えないという基準に応じて、それぞれのシーンに対して最も少ないライセンシングコストで最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなステップと、
    前記自動的に選択されたコーデックを用いて、前記シーンを圧縮するステップと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するステップと
    を含むことを特徴とするメディア圧縮方法。
  28. メディア信号を伝達する方法であって、
    コーデックライブラリからの異なるコーデックを用いて、メディア信号の少なくとも2つのシーンを選択的に圧縮するステップであって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなステップと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、各々の圧縮されたシーンを宛先システムに送出するステップと、
    を含むことを特徴とするメディア信号を伝達する方法。
  29. メディア解凍方法であって、
    第1のコーデックを用いて圧縮された第1のシーンと、第2のコーデックを用いて圧縮された第2のシーンとを含むメディア信号を受信するステップであって、目標データレートを超えないという基準に応じて、各々のシーンに対して最高の圧縮品質をどのコーデックが生成するかに基づいて、コーデックライブラリから前記第1と第2のコーデックが自動的に選択されるようなステップと、
    前記第1の識別されたコーデックを用いて前記第1のシーン解凍するステップと、
    前記第2の識別されたコーデックを用いて前記第2のシーン解凍するステップと
    を含むことを特徴とするメディア解凍方法。
  30. 請求項29に記載の方法において、
    前記第1と第2の解凍されたシーンをユーザに提示するステップ、
    をさらに含むことを特徴とする方法。
  31. メディア圧縮システムであって、
    宛先システムに伝達されるべきメディア信号を得る入力モジュールと、
    前記メディア信号内の複数のシーンを識別する識別モジュールと、
    少なくとも2つの前記シーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択する選択モジュールであって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるような選択モジュールと、
    前記自動的に選択されたコーデックを用いて前記シーンを圧縮する圧縮モジュールと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出する出力モジュールと、
    を具えることを特徴とするメディア圧縮システム。
  32. 請求項31に記載のシステムにおいて、
    前記コーデックが、離散コサイン変換(DCT)コーデックと、フラクタルコーデックと、ウェーブレットコーデックとからなる群から自動的に選択される、
    ことを特徴とするシステム。
  33. 請求項31に記載のシステムにおいて、
    自動的に選択される第1のコーデックがブロックコーデックを具え、
    自動的に選択される第2のコーデックがフラクタルコーデックを具える、
    ことを特徴とするシステム。
  34. 請求項31に記載のシステムにおいて、
    自動的に選択される第1のコーデックがブロックコーデックを具え、
    自動的に選択される第2のコーデックがウェーブレットコーデックを具える、
    ことを特徴とするシステム。
  35. 請求項31に記載のシステムにおいて、
    前記識別モジュールが、シーンの複数の特性を識別し、
    前記選択モジュールが、前記ライブラリ内で前記シーンの前記識別された特性に関連するコーデックを検索する、
    ことを特徴とするシステム。
  36. 請求項35に記載のシステムにおいて、
    前記特性が、動き特性と色特性とからなる群から選択される、
    ことを特徴とするシステム。
  37. 請求項36に記載のシステムにおいて、
    前記選択モジュールが、シーンの前記識別された特性に関連するコーデックを見つけ出すための人工知能(AI)システムを具える、
    ことを特徴とするシステム。
  38. 請求項37に記載のシステムにおいて、
    前記AIシステムが、ニューラルネットワークを具える、
    ことを特徴とするシステム。
  39. 請求項37に記載のシステムにおいて、
    前記AIシステムが、エキスパートシステムを具える、
    ことを特徴とするシステム。
  40. 請求項31に記載のシステムにおいて、
    前記選択モジュールが、シーンにおいて前記コーデックライブラリの前記コーデックの少なくとも一部をテストし、目標データレートを超えないという基準に応じて、前記シーンに対する最高の圧縮品質を生成するような前記コーデックを自動的に選択する、
    ことを特徴とするシステム。
  41. 請求項40に記載のシステムにおいて、
    前記選択モジュールが、前記シーンの基本スナップショットを格納し、テストされるべき各々のコーデックに対して、前記ライブラリ中の前記コーデックの1つを用いて目標データレート以下で前記シーンを圧縮させ、同一のコーデックを用いて前記シーンを解凍させ、前記基準によって、前記基本スナップショットと、前記解凍されたシーンの前記品質とを比較する、
    ことを特徴とするシステム。
  42. 請求項41に記載のシステムにおいて、
    前記選択モジュールが、ピーク信号対ノイズ比(PSNR)によって前記品質を比較する、
    ことを特徴とするシステム。
  43. 請求項41に記載のシステムにおいて、
    前記選択モジュールが、最小可知差異(JND)値によって前記品質を比較する、
    ことを特徴とするシステム。
  44. 請求項41に記載のシステムにおいて、
    前記識別モジュールが、シーンの複数の特性を識別し、
    前記選択モジュールが、前記シーンの前記識別された特性を、前記自動的に選択されたコーデックに関連付ける、
    ことを特徴とするシステム。
  45. 請求項31に記載のシステムにおいて、
    前記選択モジュールが、前記宛先システムの制限に応じて前記目標データレートを調整する、
    ことを特徴とするシステム。
  46. 請求項31に記載のシステムにおいて、
    前記選択モジュールが、前記宛先システムまでの伝送チャネルの条件に応じて前記目標データレートを調整する、
    ことを特徴とするシステム。
  47. 請求項31に記載のシステムにおいて、
    前記選択モジュールが、前記宛先システムからのメッセージに応じて前記目標データレートを調整する、
    ことを特徴とするシステム。
  48. 請求項35に記載のシステムにおいて、
    前記選択モジュールが、前記識別された特性と前記自動的に選択されたコーデックに用いるべきパラメータセットとの関連を検索し、
    前記圧縮モジュールが、前記関連するパラメータセットを持ち前記自動的に選択されたコーデックを用いて前記シーンを圧縮し、
    前記出力モジュールが、どのコーデックと、どのパラメータセットとを使用して前記シーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出する、
    ことを特徴とするシステム。
  49. 請求項40に記載のシステムにおいて、
    前記選択モジュールが、異なるパラメータのセットを用いて前記シーンに対して前記コーデックライブラリの前記コーデックをテストし、目標データレートを超えないという基準に応じて、前記シーンに対して最高の圧縮品質を生成する前記コーデックとパラメータセットを自動的に選択し、
    前記圧縮モジュールが、前記自動的に選択されたパラメータを持つ前記自動的に選択されたコーデックを用いて前記シーンを圧縮し、
    前記出力モジュールが、どのコーデックとパラメータセットを使用して前記シーンを圧縮したのかを示す指標とともに、前記圧縮されたシーンを前記宛先システムに送出する、
    ことを特徴とするシステム。
  50. 請求項49に記載のシステムにおいて、
    前記識別モジュールが、シーンの複数の特性を識別し、
    選択モジュールが、前記自動的に選択されたコーデックと、前記自動的に選択されたパラメータセットとを前記シーンの前記識別された特性に関連付ける、
    ことを特徴とするシステム。
  51. 請求項31のシステムにおいて、
    前記識別モジュールが、前のフレームと十分に異なる、前記メディア信号の1フレームに応じてシーンの変化を検出する、
    ことを特徴とするシステム。
  52. 請求項31のシステムにおいて、
    前記識別モジュールが、一定期間の経過に応じてシーンの変化を検出する、
    ことを特徴とするシステム。
  53. 請求項31のシステムにおいて、
    前記出力モジュールが、各々の圧縮されたシーンを前記宛先システムまでネットワークを通じてストリーミングする、
    ことを特徴とするシステム。
  54. 請求項31のシステムにおいて、
    前記出力モジュールが、各々の圧縮されたシーンを記憶媒体に格納する、
    ことを特徴とするシステム。
  55. 請求項31のシステムにおいて、
    前記コーデックライブラリ内の少なくとも1つのコーデックが、ライセンシングコストに関連付けられており、
    前記選択モジュールが、シーンの圧縮出力をほぼ同一の品質で生成する2つ以上のコーデックに対して最も少ないライセンシングコストを有する前記コーデックを自動的に選択するためにあることを特徴とする方法。
  56. メディア圧縮システムであって、
    宛先システムに伝達されるべきメディア信号を得るための入力モジュールと、
    前記メディア信号の少なくとも2つのセグメントをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するための選択モジュールであって、目標データレートを超えずに、前記それぞれのセグメントに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択される選択モジュールと、
    前記自動的に選択されたコーデックを用いて、前記セグメントを圧縮するための圧縮モジュールと、
    どのコーデックを使用して各々のセグメントを圧縮したのかを示す指標と共に、前記圧縮されたセグメントを前記宛先システムに送出するための出力モジュールと
    を具えることを特徴とするメディア圧縮システム。
  57. メディア圧縮システムであって、
    ライセンシングコストが関連付けられた少なくとも1つのコーデックからなるコーデックライブラリと、
    宛先システムに伝達されるべきメディア信号を得る入力モジュールと、
    前記メディア信号内の複数のシーンを識別する識別モジュールと、
    少なくとも2つの前記シーンをそれぞれ圧縮するために前記コーデックライブラリから異なるコーデックを自動的に選択する選択モジュールであって、目標データレートを超えないという基準に応じて、それぞれのシーンに対して最も少ないライセンシングコストで最高の圧縮品質を生成するために前記コーデックが自動的に選択されるような選択モジュールと、
    前記自動的に選択されたコーデックを用いて、前記シーンを圧縮する圧縮モジュールと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出する出力モジュールと
    を具えることを特徴とするメディア圧縮システム。
  58. メディア信号を伝達するためのシステムであって、
    コーデックライブラリからの異なるコーデックを用いて、メディア信号の少なくとも2つのシーンを選択的に圧縮する圧縮モジュールあって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるような圧縮モジュールと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、各々の圧縮されたシーンを宛先システムに送出する出力モジュールと、
    を具えることを特徴とするメディア信号を伝達するシステム。
  59. メディア解凍システムであって、
    第1のコーデックを用いて圧縮された第1のシーンと、第2のコーデックを用いて圧縮された第2のシーンとを含むメディア信号を受信する入力モジュールであって、目標データレートを超えないという基準に応じて、各々のシーンに対して最高の圧縮品質をどのコーデックが生成するかに基づいて、コーデックライブラリから前記第1と第2のコーデックが自動的に選択されるような入力モジュールと、
    前記第1の識別されたコーデックを用いて前記第1のシーン解凍するためであり、前記第2の識別されたコーデックを用いて前記第2のシーン解凍する解凍モジュールと
    を具えることを特徴とするメディア解凍方法。
  60. 請求項59に記載のシステムにおいて、
    前記第1と第2の解凍されたシーンをユーザに提示する提示モジュール、
    をさらに具えることを特徴とするシステム。
  61. コンピュータ可読媒体のコンピュータプログラム製品であって、
    宛先システムに伝達されるべきメディア信号を得るためのプログラムコードと、
    前記メディア信号内の複数のシーンを識別するためのプログラムコードと、
    少なくとも2つの前記シーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するためのプログラムコードであって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなプログラムコードと、
    前記自動的に選択されたコーデックを用いて前記シーンを圧縮するためのプログラムコードと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するためのプログラムコードと
    を含むことを特徴とするコンピュータプログラム製品。
  62. メディア圧縮装置であって、
    宛先システムに伝達されるべきメディア信号を得る手段と、
    前記メディア信号内の複数のシーンを識別する手段と、
    少なくとも2つの前記シーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択する手段であって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるような手段と、
    前記自動的に選択されたコーデックを用いて前記シーンを圧縮する手段と、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出する手段と
    を具えることを特徴とするメディア圧縮装置。
  63. 伝送媒体内のコンピュータデータ信号であって、
    宛先システムに伝達されるべきメディア信号を得るための命令を含むコードセグメントと、
    前記メディア信号内の複数のシーンを識別するための命令を含むコードセグメントと、
    少なくとも2つの前記シーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するための命令を含むコードセグメントであって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるような命令を含むコードセグメントと、
    前記自動的に選択されたコーデックを用いて前記シーンを圧縮するための命令を含むコードセグメントと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するための命令を含むコードセグメントと
    を含むことを特徴とするコンピュータデータ信号。
  64. メディア圧縮方法であって、
    宛先システムに伝達されるべきメディア信号を得るステップと、
    前記メディア信号内の複数のシーンを識別するステップと、
    少なくとも2つの前記シーンをそれぞれ圧縮するためにコーデックライブラリから異なるコーデックを自動的に選択するステップであって、目標データレートを超えないという基準に応じて、前記それぞれのシーンに対して最高の圧縮品質を生成するために、前記コーデックが自動的に選択されるようなステップと、
    前記自動的に選択されたコーデックを用いて前記シーンを圧縮するためのステップと、
    どのコーデックを使用して各々のシーンを圧縮したのかを示す指標と共に、前記圧縮されたシーンを前記宛先システムに送出するステップと
    を含むことを特徴とするメディア圧縮方法。
JP2005510822A 2003-10-23 2003-10-28 異なるコーデックを用いてメディア信号を圧縮するためのシステム及び方法 Expired - Fee Related JP4463765B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/692,106 US7599434B2 (en) 2001-09-26 2003-10-23 System and method for compressing portions of a media signal using different codecs
PCT/US2003/034211 WO2005050988A1 (en) 2003-10-23 2003-10-28 System and method for compressing portions of a media signal using different codecs

Publications (2)

Publication Number Publication Date
JP2007529125A true JP2007529125A (ja) 2007-10-18
JP4463765B2 JP4463765B2 (ja) 2010-05-19

Family

ID=34619769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005510822A Expired - Fee Related JP4463765B2 (ja) 2003-10-23 2003-10-28 異なるコーデックを用いてメディア信号を圧縮するためのシステム及び方法

Country Status (6)

Country Link
US (2) US7599434B2 (ja)
EP (1) EP1680918A4 (ja)
JP (1) JP4463765B2 (ja)
AU (1) AU2003285058A1 (ja)
CA (1) CA2542800C (ja)
WO (1) WO2005050988A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528208A (ja) * 2008-07-14 2011-11-10 ミュジオン アイピー リミテッド ビデオ処理およびテレプレゼンスのシステムおよび方法
JP2016509486A (ja) * 2014-01-09 2016-03-31 株式会社スクウェア・エニックス・ホールディングス ネットワークを介して送信するためのビデオゲーム画面画像の生成及び符号化を行う方法及びシステム
JP2023517349A (ja) * 2020-12-16 2023-04-25 テンセント・アメリカ・エルエルシー ビデオコーディング方法及び装置

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003010963A1 (en) * 2001-07-11 2003-02-06 Daniel Kilbank System and method for compressing data
US7457358B2 (en) 2001-09-26 2008-11-25 Interact Devices, Inc. Polymorphic codec system and method
US7302102B2 (en) * 2001-09-26 2007-11-27 Reynolds Jodie L System and method for dynamically switching quality settings of a codec to maintain a target data rate
US20030229549A1 (en) 2001-10-17 2003-12-11 Automated Media Services, Inc. System and method for providing for out-of-home advertising utilizing a satellite network
US20050075929A1 (en) * 2002-10-17 2005-04-07 Wolinsky Robert I. System and method for partitioning airtime for distribution and display of content
US7614065B2 (en) * 2001-12-17 2009-11-03 Automated Media Services, Inc. System and method for verifying content displayed on an electronic visual display
WO2003075524A1 (en) * 2002-03-04 2003-09-12 Fujitsu Limited Hierarchical encoded data distributor and distributing method
JP2005524260A (ja) * 2002-04-23 2005-08-11 キルバンク ダニエル 通信においてマイクロレッツを使用するためのシステムおよび方法
TWI240560B (en) * 2003-12-03 2005-09-21 Via Tech Inc Control device, system and method for reading multi-pixel
US7502514B2 (en) * 2004-11-15 2009-03-10 Smith Micro Software, Inc. System and method for lossless compression of already compressed files
US7634727B2 (en) * 2005-04-26 2009-12-15 Microsoft Corporation System for abstracting audio-video codecs
US7616821B2 (en) 2005-07-19 2009-11-10 International Business Machines Corporation Methods for transitioning compression levels in a streaming image system
US7506071B2 (en) 2005-07-19 2009-03-17 International Business Machines Corporation Methods for managing an interactive streaming image system
US20070028286A1 (en) 2005-07-28 2007-02-01 Greene David P Systems, methods, and media for detecting content change in a streaming image system
JP2007158553A (ja) * 2005-12-02 2007-06-21 Sony Corp マルチコーデックカメラシステムおよび画像取得プログラム
US20070140116A1 (en) * 2005-12-16 2007-06-21 Microsoft Corporation Interactive Codec Selection
US9294728B2 (en) 2006-01-10 2016-03-22 Imagine Communications Corp. System and method for routing content
US20080008160A1 (en) * 2006-07-06 2008-01-10 Uhler Stephen A Bandwidth management for internet telephony
JP4325657B2 (ja) 2006-10-02 2009-09-02 ソニー株式会社 光ディスク再生装置、信号処理方法、およびプログラム
US8180920B2 (en) * 2006-10-13 2012-05-15 Rgb Networks, Inc. System and method for processing content
JP5025225B2 (ja) * 2006-10-31 2012-09-12 株式会社東芝 通信装置、通信装置の制御方法および制御プログラム
US7656318B2 (en) * 2007-01-29 2010-02-02 Ntt Docomo, Inc. Optimized content-based and royalty-based encoding and distribution of media data
US8627509B2 (en) 2007-07-02 2014-01-07 Rgb Networks, Inc. System and method for monitoring content
EP2213101A4 (en) * 2007-11-20 2011-08-10 Ubstream Ltd METHOD AND SYSTEM FOR COMPRESSING DIGITAL VIDEO TONES
EP2257923A4 (en) * 2008-02-08 2012-10-24 Automated Media Services Inc SYSTEM AND METHOD FOR CREATING AN ENTERPRISE MEDIA NETWORK USING A TRADITIONAL MEDIA METRIC
US8175403B1 (en) * 2008-06-05 2012-05-08 Google Inc. Iterative backward reference selection with reduced entropy for image compression
US9473812B2 (en) * 2008-09-10 2016-10-18 Imagine Communications Corp. System and method for delivering content
US20100086063A1 (en) * 2008-10-02 2010-04-08 Apple Inc. Quality metrics for coded video using just noticeable difference models
CN102246533A (zh) * 2008-10-14 2011-11-16 Rgb网络有限公司 用于代码转换后的媒体内容的渐进递送的系统和方法
US9282131B2 (en) 2009-01-20 2016-03-08 Imagine Communications Corp. System and method for splicing media files
WO2010106670A1 (ja) * 2009-03-19 2010-09-23 富士通株式会社 画像符号化装置、画像符号化制御方法および画像符号化プログラム
US8639369B1 (en) * 2009-09-01 2014-01-28 Adobe Systems Incorporated Audio testing of media player
US8995534B2 (en) 2010-09-20 2015-03-31 Bevara Technologies, Llc Systems and methods for encoding and decoding
JP5864876B2 (ja) * 2011-03-25 2016-02-17 オリンパス株式会社 画像処理装置及び画像処理方法
US10129556B2 (en) 2014-05-16 2018-11-13 Bevara Technologies, Llc Systems and methods for accessing digital data
US10025787B2 (en) 2011-08-17 2018-07-17 Bevara Technologies, Llc Systems and methods for selecting digital data for archival
US8855195B1 (en) 2011-09-09 2014-10-07 Panamorph, Inc. Image processing system and method
US9942580B2 (en) * 2011-11-18 2018-04-10 At&T Intellecutal Property I, L.P. System and method for automatically selecting encoding/decoding for streaming media
EP2807752A4 (en) * 2012-01-25 2015-11-25 Onecodec Ltd SYSTEMS AND METHOD FOR CODING, SHARING AND DECODING MULTIMEDIA
US20140009563A1 (en) * 2012-07-03 2014-01-09 Google Inc. Non-video codecs with video conferencing
GB2512310A (en) * 2013-03-25 2014-10-01 Sony Corp Media Distribution
US9245352B1 (en) 2013-04-12 2016-01-26 Google Inc. Systems and methods for near lossless image compression
US9330101B2 (en) 2013-12-18 2016-05-03 Microsoft Technology Licensing, Llc Using constraints on media file formats to improve performance
US9542953B2 (en) * 2014-01-22 2017-01-10 Comcast Cable Communications, Llc Intelligent data delivery
WO2015176009A1 (en) 2014-05-16 2015-11-19 Bevara Technologies, Llc Systems and methods for selecting digital data for archival
US9729601B2 (en) 2014-12-05 2017-08-08 Facebook, Inc. Decoupled audio and video codecs
US9729287B2 (en) 2014-12-05 2017-08-08 Facebook, Inc. Codec with variable packet size
US10469630B2 (en) 2014-12-05 2019-11-05 Facebook, Inc. Embedded RTCP packets
US10506004B2 (en) 2014-12-05 2019-12-10 Facebook, Inc. Advanced comfort noise techniques
US9729726B2 (en) * 2014-12-05 2017-08-08 Facebook, Inc. Seamless codec switching
US9667801B2 (en) * 2014-12-05 2017-05-30 Facebook, Inc. Codec selection based on offer
US9286313B1 (en) * 2014-12-27 2016-03-15 Ascava, Inc. Efficient lossless reduction of data by deriving data from prime data elements resident in a content-associative sieve
EP3259913B1 (en) 2015-02-19 2021-05-12 Magic Pony Technology Limited Enhancement of visual data
WO2016156864A1 (en) * 2015-03-31 2016-10-06 Magic Pony Technology Limited Training end-to-end video processes
CN104897535A (zh) * 2015-05-20 2015-09-09 安庆师范学院 一种基于物联网和蓝牙技术的工业环境空气质量实时监测系统及其控制方法
GB201607994D0 (en) 2016-05-06 2016-06-22 Magic Pony Technology Ltd Encoder pre-analyser
CN109104610B (zh) 2017-06-20 2023-04-11 微软技术许可有限责任公司 实时屏幕共享
WO2019143808A1 (en) 2018-01-18 2019-07-25 Bevara Technologies, Llc Browser navigation for facilitating data access
US11533063B2 (en) * 2019-08-01 2022-12-20 EMC IP Holding Company LLC Techniques for determining compression tiers and using collected compression hints
US11445252B1 (en) * 2021-07-08 2022-09-13 Meta Platforms, Inc. Prioritizing encoding of video data received by an online system to maximize visual quality while accounting for fixed computing capacity
CN114070471B (zh) * 2021-11-29 2023-11-21 广州禹迹科技有限公司 一种测试数据包传输方法、装置、系统、设备和介质
US20230177011A1 (en) * 2021-12-08 2023-06-08 Cohesity, Inc. Adaptively providing uncompressed and compressed data chunks
US11962482B2 (en) 2022-07-14 2024-04-16 Rovi Guides, Inc. Systems and methods for maintaining video quality using digital twin synthesis
CN115209150B (zh) * 2022-09-16 2022-12-27 沐曦科技(成都)有限公司 一种视频编码参数获取方法、装置及电子设备

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002720A (en) 1991-01-07 1999-12-14 H. Lee Browne, D/B/A Greenwich Information Technologies Llc Audio and video transmission and receiving system
US6870884B1 (en) 1992-01-29 2005-03-22 Mitsubishi Denki Kabushiki Kaisha High-efficiency encoder and video information recording/reproducing apparatus
JPH0614313A (ja) * 1992-06-29 1994-01-21 Canon Inc 画像処理装置
US5596659A (en) 1992-09-01 1997-01-21 Apple Computer, Inc. Preprocessing and postprocessing for vector quantization
EP1139289B1 (en) 1992-09-01 2011-03-09 Apple Inc. Improved vector quantization
US5539908A (en) 1992-11-24 1996-07-23 International Business Machines Corporation Dynamically linked and shared compression/decompression
US5481297A (en) * 1994-02-25 1996-01-02 At&T Corp. Multipoint digital video communication system
US5684714A (en) 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US6754181B1 (en) 1996-11-18 2004-06-22 Mci Communications Corporation System and method for a directory service supporting a hybrid communication system architecture
US6421726B1 (en) 1997-03-14 2002-07-16 Akamai Technologies, Inc. System and method for selection and retrieval of diverse types of video data on a computer network
FR2760872B1 (fr) 1997-03-17 2000-06-09 Alsthom Cge Alcatel Procede d'optimisation de la compression de donnees d'image, a selection automatique de conditions de compression
US6195692B1 (en) 1997-06-02 2001-02-27 Sony Corporation Television/internet system having multiple data stream connections
US6266419B1 (en) 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
US6356545B1 (en) 1997-08-08 2002-03-12 Clarent Corporation Internet telephone system with dynamically varying codec
WO1999018728A1 (en) 1997-10-02 1999-04-15 General Datacomm, Inc. Interconnecting multimedia data streams having different compressed formats
US6085236A (en) 1998-01-06 2000-07-04 Sony Corporation Of Japan Home audio video network with device control modules for incorporating legacy devices
US6252544B1 (en) 1998-01-27 2001-06-26 Steven M. Hoffberg Mobile communication device
US6157965A (en) 1998-02-27 2000-12-05 Intel Corporation System and method for binding a virtual device driver to a network driver interface
US6115755A (en) 1998-04-09 2000-09-05 Novaweb Technologies, Inc. Integrated apparatus for interfacing several computers to the internet through a single connection
US6624761B2 (en) 1998-12-11 2003-09-23 Realtime Data, Llc Content independent data compression method and system
US6243676B1 (en) 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US6356668B1 (en) 1998-12-29 2002-03-12 Eastman Kodak Company Method for efficient rate control
US6212302B1 (en) 1998-12-29 2001-04-03 Eastman Kodak Company Method and apparatus for visually optimized rate control
US6349151B1 (en) 1998-12-29 2002-02-19 Eastman Kodak Company Method and apparatus for visually optimized compression parameters
US6356589B1 (en) * 1999-01-28 2002-03-12 International Business Machines Corporation Sharing reference data between multiple encoders parallel encoding a sequence of video frames
US6587638B1 (en) 1999-08-02 2003-07-01 Hitachi, Ltd. Recording/ reproducing apparatus and input/ output device
US6804401B2 (en) 2000-05-12 2004-10-12 Xerox Corporation Method for compressing digital documents with control of image quality subject to multiple compression rate constraints
US7219364B2 (en) * 2000-11-22 2007-05-15 International Business Machines Corporation System and method for selectable semantic codec pairs for very low data-rate video transmission
US6947598B2 (en) 2001-04-20 2005-09-20 Front Porch Digital Inc. Methods and apparatus for generating, including and using information relating to archived audio/video data
US6968006B1 (en) * 2001-06-05 2005-11-22 At&T Corp. Method of content adaptive video decoding
CA2669171C (en) * 2001-09-26 2012-05-01 Interact Devices System and method for communicating media signals
US7130472B2 (en) 2002-01-21 2006-10-31 Canon Kabushiki Kaisha Image distribution apparatus, communication terminal apparatus, and control method thereof

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528208A (ja) * 2008-07-14 2011-11-10 ミュジオン アイピー リミテッド ビデオ処理およびテレプレゼンスのシステムおよび方法
JP2016509486A (ja) * 2014-01-09 2016-03-31 株式会社スクウェア・エニックス・ホールディングス ネットワークを介して送信するためのビデオゲーム画面画像の生成及び符号化を行う方法及びシステム
JP2023517349A (ja) * 2020-12-16 2023-04-25 テンセント・アメリカ・エルエルシー ビデオコーディング方法及び装置
JP7403747B2 (ja) 2020-12-16 2023-12-25 テンセント・アメリカ・エルエルシー ビデオコーディング方法及び装置

Also Published As

Publication number Publication date
AU2003285058A1 (en) 2005-06-08
US20090310671A1 (en) 2009-12-17
US7599434B2 (en) 2009-10-06
JP4463765B2 (ja) 2010-05-19
CA2542800C (en) 2012-03-20
US8064515B2 (en) 2011-11-22
US20040086039A1 (en) 2004-05-06
CA2542800A1 (en) 2005-06-02
WO2005050988A1 (en) 2005-06-02
EP1680918A1 (en) 2006-07-19
EP1680918A4 (en) 2006-12-06

Similar Documents

Publication Publication Date Title
JP4463765B2 (ja) 異なるコーデックを用いてメディア信号を圧縮するためのシステム及び方法
CA2975904C (en) Method and system for smart adaptive video streaming driven by perceptual quality-of-experience estimations
US8675733B2 (en) Polymorphic codec system and method
JP5606591B2 (ja) ビデオ圧縮方法
US7359004B2 (en) Bi-level and full-color video combination for video communication
WO2005107116A2 (en) Systems, devices and methods for securely distributing highly-compressed multimedia content
US20090290645A1 (en) System and Method for Using Coded Data From a Video Source to Compress a Media Signal
US20060188014A1 (en) Video coding and adaptation by semantics-driven resolution control for transport and storage
JP5164866B2 (ja) ビデオ画像シーケンスの時間的頻度を適合させる方法および装置
US20040028139A1 (en) Video encoding
JP2000224590A (ja) ビデオシ―ケンスの特徴抽出方法
JP6016332B2 (ja) 画像処理装置、画像処理方法
CN113438501A (zh) 视频压缩方法、装置、计算机设备和存储介质
US20050084172A1 (en) Data compression device of digital recording sytem and controlling method thereof
JP2011087090A (ja) 画像処理方法、画像処理装置、及び撮像システム
JP2005124145A (ja) デジタル映像データの復号化方法
WO2023281336A1 (en) Automatic visual media transmission error assessment
CN111818338B (zh) 一种异常显示检测方法、装置、设备及介质
Masala et al. Content-based group-of-picture size control in distributed video coding
WO2022141683A1 (en) Scalable feature stream
JP2001045499A (ja) フレームを識別する方法及びシステム、フレームを表す記述子、並びにフレームを識別する記述子

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140226

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees