JP5069099B2 - 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置 - Google Patents

時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置 Download PDF

Info

Publication number
JP5069099B2
JP5069099B2 JP2007507556A JP2007507556A JP5069099B2 JP 5069099 B2 JP5069099 B2 JP 5069099B2 JP 2007507556 A JP2007507556 A JP 2007507556A JP 2007507556 A JP2007507556 A JP 2007507556A JP 5069099 B2 JP5069099 B2 JP 5069099B2
Authority
JP
Japan
Prior art keywords
frame
scaling
frames
time
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007507556A
Other languages
English (en)
Other versions
JP2007533212A (ja
Inventor
チェン、ペイソン
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2007533212A publication Critical patent/JP2007533212A/ja
Application granted granted Critical
Publication of JP5069099B2 publication Critical patent/JP5069099B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

[関連出願]
米国特許法第119条の下での優先権主張。
本特許出願は、2004年4月7日出願の米国仮出願番号60/560,433 "METHOD AND APPARATUS FOR PREDICTION FRAME IN HYBRID VIDEO COMPRESSION TO ENABLE TEMPORAL SCALABILITY"(時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法と装置)および2004年11月4日出願の米国仮出願番号60/625,700 "METHOD AND APPARATUS FOR PREDICTION FRAME IN HYBRID VIDEO COMPRESSION TO ENABLE TEMPORAL SCALABILITY"(時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法と装置)に対する優先権を主張する。これらはこの文書の譲受人に譲渡され、これによって、ここに参照として明白に組み込まれている。
[発明の分野]
本発明は時間スケーラビリティを提供するように符号化されたディジタルデータを配信するための方法、装置、およびシステムに関する。
インターネットと無線通信の爆発的成長と大きな成功、およびマルチメディアサービスに対する増え続ける需要のために、インターネット並びに移動/無線チャンネル上のストリーミング媒体は非常に大きく注目されてきた。異種のインターネットプロトコル(IP)ネットワークにおいて、映像はサーバにより提供され、1つ以上のクライアントによって送出されるかもしれない。有線接続はダイヤルアップ、統合サービスディジタル通信網(ISDN)、ケーブル、ディジタル加入者線プロトコル(全体としてxDSLと呼ばれる)、ファイバー、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、その他を含む。伝送モードは、ユニキャストまたはマルチキャストのいずれかであるかもしれない。携帯情報端末(PDA)、ラップトップ、デスクトップ、セットトップボックス、テレビ、HDTV、携帯電話その他を含む種々の個別のクライアント機器は、同時に同じ内容に対して異なる帯域幅のビットストリームを要求する。接続帯域幅は、時間と共に急速に変化するかもしれず(9.6kbpsから100Mbps以上)、サーバの反応より速いかもしれない。
移動/無線通信はこれらの異種のIPネットワークと同様である。これらのチャンネルはマルチパスフェージング、シャドウイング、シンボル間干渉、および雑音妨害により、しばしば激しく劣化するため、移動/無線チャンネル上のマルチメディアコンテンツの伝送は非常に難しい。移動性およびトラヒック競合のような他のいくつかの理由も、帯域幅変動の原因となる。チャンネル雑音および利用しているユーザ数はチャネル環境の時変特性を決定する。環境状態に加えて、受信先ネットワークは移動体のローミングと同様に地理的な位置により、第2、第3世代セルラネットワークから広帯域データのみのネットワークに変るかもしれない。利用可能な帯域幅に影響するこれらのすべての変数は、マルチメディアコンテンツ伝送の適応速度調整を、動作中であっても、必要とする。したがって、異種の有線/無線ネットワーク上の映像伝送に成功するには効率的な符号化および、損失には許容力がある一方、ネットワーク状態、機器特性並びにユーザの好みに対する適応性が必要である。
異なるユーザ要求を満たし、チャンネル変動に適応するために、1つのバージョンが、伝送帯域幅、ユーザの表示装置並びに計算機の能力に基づく1つの制約が満足するような、複数の独立したバージョンのビットストリームを発生させるということはあり得る。しかし、これはサーバの記憶装置およびマルチキャストにとって効率的ではない。ハイエンドユーザに対応する単一のマクロビットストリームがサーバで形成されるスケーラブル符号化には、ローエンドの用途のためのビットストリームはマクロビットストリームのサブセットとして埋め込まれているだけである。そのような単一のビットストリームは、選択的に副ビットストリームを送信することによって、種々の用途の環境に対して適合されるかもしれない。スケーラブル符号化がもたらす別の利点は、誤りを発生しやすいチャンネル上のロバスト性のある映像伝送に対するものである。誤り防止および誤り補正を容易に行うことができる。より信頼性のある伝送チャンネルまたはより良い誤り防止は、最も重要な情報を含む基本層ビットに適用されるかもしれない。
MPEG−1、MPEG−2、MPEG−4(全体をMPEG−xと呼ぶ)、H.261、H.262、H.263、およびH.264(全体をH.26xと呼ぶ)のようなハイブリッド符号器には、空間的、時間的およびSN比(SNR)のスケーラビリティがある。ハイブリッド符号化において、動き補償予測(MCP)により時間冗長度が除外される。映像は通常一連の画像群(GOP)に分割され、各GOPはイントラ符号化フレーム(I)(intra-coded frame (I))で始まり、前方予測フレーム(P)(forward predicted frame (P))および双方向予測フレーム(B)(bidirectional predicted frame (B))および双方向予測フレーム(B)の配列が続く。P−フレームおよびB−フレーム共にインターフレームである。BフレームはほとんどのMPEG様符号器において時間スケーラビリティの鍵である。しかし、MPEG−4のシンプルプロファイルおよびH.264のベースラインプロファイルなどのプロファイルは、Bフレームをサポートしていない。
MPEG−4においては、プロファイルおよびレベルが、特定のビットストリームを復号するために必要な復号器の能力に基づいてシンタックスおよびセマンティクスのサブセットを定義する手段を与える。プロファイルはビットストリームのシンタックス全体の定義されたサブセットである。レベルはビットストリーム中のパラメータに課された定義された一組の制約である。任意の与えられたプロファイルに対して、レベルは一般に復号器の処理負荷およびメモリ能力に対応している。したがって、プロファイルとレベルはビットストリームへの制限を指定し、従って、ビットストリームを復号する能力に対して制限を与える。一般に、与えられたレベルで与えられたプロファイルにより指定されるすべてのシンタックス要素のすべての許容された値を適切に復号することができる場合、復号器はそのレベルでそのプロファイルに適合すると考えられるべきである。
本発明の目的は、MPEG−4のシンプルプロファイルおよびH.264のベースラインプロファイルにも適合する、簡易であるが効果的な時間スケーラビリティを提供する方法と装置を提供することである。MPEG−4規格はISO/IEC14496−2に説明されている。H.264規格は[ISO/IEC14496−10]に説明されている。
時間スケーラビリティを、MPEG−xもしくはH.26xのような映像圧縮並びに配信方式に提供するための符号化方式、および、時間スケーラビリティをMPEG−4のシンプルプロファイル並びにH.264ベースラインプロファイル準拠機器に提供するための符号化方式を説明する。
一例において、符号器またはトランス符号器は、複数ユーザに対して可変データレートおよび映像品質を提供するように適応されるかもしれない単一のビットストリームを生成するかもしれない。1つのビットストリームは動作中に生成されるかもしれないし、メモリに格納されているかもしれない。例えば帯域幅要求を満足するか、環境雑音のようなチャンネル状態を満足するか、または品質可変の映像を配信するために、映像ストリームから時間スケーリングフレーム(temporal scaling frame)を除去するかもしれない。
他の例において、復号器は、例えば、電池容量または復号時間を温存するために時間スケーリングフレームの復号を省略する選択をするかもしれない。
いくつかの通信システムにおいて、伝送されるべきデータは、利用可能な帯域幅をより効率的に使用するために圧縮される。例えば、動画像専門家グループ(MPEG)はディジタルデータ配信システムに関連するいくつかの規格を開発した。MPEG−4規格は、通常大きなデータ損失のある、低データレートから高データレートのチャネル用に開発された。類似の規格はISO/IEC MPEGと共にITU−T映像符号化専門家グループ(VCEG)によって開発されたH.264である。
MPEG−xならびにH.26x規格は、固定長または可変長情報源符号化法を用いて映像、音声並びに他の情報の圧縮並びに配信によく適合したデータ処理並びに操作手法を説明している。特に、上で参照した規格および他のハイブリッド符号化規格並びに方法は、イントラフレーム符号化法(例えば、ランレングス符号化、ハフマン符号化およびそれに類似したもの)およびインターフレーム符号化法(例えば、前方並びに後方予測符号化、動き補償およびそれに類似したもの)を用いて映像情報を圧縮するだろう。特に、映像処理システムの場合において、ハイブリッド映像処理システムは、イントラフレームおよび/またはインターフレーム動き補償符号化を用いた映像フレームの予測に基づく圧縮符号化によって特徴づけられる。
イントラ符号化フレーム、前方並びに後方予測フレーム、および一方向予測時間スケーリングフレームを含む映像ストリームを符号化する方法、装置、およびシステムを説明する。時間スケーリングは、映像配信中に、送信機器、中間機器または受信機器で行われるかもしれない。
イントラフレーム符号化は他の画像(フィールドまたはフレーム)を参照することなく画像を符号化することを意味するが、イントラ符号化フレームは他のフレームのための参照として用いられるかもしれない。用語「イントラフレーム」、「イントラ符号化フレーム」、および「Iフレーム」はすべて本出願を通じて用いられるイントラ符号化で形成される映像オブジェクトの例である。
インター、または予測符号化は他の画像(フィールドまたはフレーム)を参照して画像を符号化することを意味する。イントラ符号化フレームに較べ、インター符号化または予測フレームは、より大きい効率で符号化されるかもしれない。本出願を通じて使用されるインターフレームの例は、予測フレーム(前方または後方予測のいずれかであり、「Pフレーム」とも呼ばれる)、双方向の予測フレーム(「Bフレーム」とも呼ばれる)および一方向予測時間スケーリングフレーム(「Pフレーム」とも呼ばれる)である。インター符号化の他の用語は、ハイパス符号化、残差符号化、動き補償内挿および当業者に周知のその他のものを含む。
典型的なMPEG復号器において、予測符号化された画素ブロック(すなわち、1つ以上の動きベクトル(motion vector)および残留誤差成分を含むブロック)は参照フレーム(イントラフレームまたは他の予測フレームが参照フレームとして利用されるかもしれない)に関して復号される。図1AはMPEG−4シンプルプロファイルデータストリームを示す図である。これはGOPに対するフレームの依存関係を示している。GOP10は初期Iフレーム12およびそれに続く複数の予測Pフレーム14から構成される。Pフレームの先行IまたはPフレームへの依存性は、前方予想フレームのみをサポートするシステム(MPEG−4シンプルプロファイルおよびH.264ベースラインプロファイルに準拠するようなシステム)に与えられた時間スケーラビリティを制限するかもしれない。Pフレーム14のいずれかを除外することは、他のPフレームの復号において重大となるかもしれない情報の損失を招くかもしれない。Pフレームの除外は、例えば、映像のジッタを招き、または復号器が次のGOPの開始を示す次のIフレーム16まで復号を続けることを不可能とするかもしれない。
時間スケーラビリティ問題の1つの解は、従来技術で用いられる双方向の予測フレームである。図1Bは時間スケーラビリティを可能にする通常の符号化データストリームを示す図である。これはGOPのフレーム依存関係を示している。GOP20はIフレーム22A、前方予測Pフレーム(forward predicted P frame)24、および双方向予測Bフレーム26で構成される。各Bフレームは、Iフレーム22Aまたは前方予測Pフレーム24(後方予測Pフレームも用いられるかもしれないが本例では示さない)を基準とする前方並びに後方動きベクトルおよび残留誤差を組み合わせるかもしれない。Iフレーム22Bは次のGOPの始まりを示す。図1Bに示すように、ただ1つのBフレーム26がIフレーム22AとPフレーム24の間、または2つのPフレーム24の間に入っている。時間スケーラビリティにおいて、より大きな柔軟性を提供するために、いくつかのBフレームが参照フレーム間に挿入されるかもしれない。他のフレームは参照フレームとしてBフレームに依存しないため、他のフレームの復号に関して情報の損失無しにBフレームを除外できるかもしれない。Bフレーム26のこの特性により、Bフレーム26をビットストリームに挿入することができるかもしれない。ビットストリームにおけるBフレームは、チャネルの状態、帯域幅制限、電池容量、およびその他の考慮すべき事項に適合するために、符号器、トランス符号器または復号器のオプションとして除外されるかもしれない。例えば、参照フレーム間に3つのBフレームがある場合、3つすべてのBフレームを除外して、フレームレートを3/4だけ低減させるかもしれないし、または中央のBフレームを保持して他の2つBフレームを除外することによりフレームレートを1/2だけ低下させるかもしれない。データレートはそれに従って減少するかもしれない。
双方向予測は前方(一方向)予測単独に較べ、圧縮がよりよくなっているが、弊害がある。双方向予測は計算上の要求の増加が必要である。双方向予測フレームは、余分な符号化の複雑さを伴うかもしれない。マクロブロック整合(最も計算的に大きい符号化処理)を各目標マクロブロックに対して2回実行しなければならないかもしれないからである。1回は過去の参照フレームに対して、もう1回は未来の参照フレームに対してである。Bフレームの導入は、計算の複雑さが復号器側で増加し、スケジューリングを複雑にするかもしれない。この複雑さの増加が、MPEG−4シンプルプロファイルおよびH.264ベースラインプロファイルが双方向予測をサポートしない主な理由である。これらのプロファイルは携帯電話、PDA並びに類似物のような電池並びに処理電力の効率的使用が必要な機器のために開発された。本発明は、そのような電力制限のある機器に時間スケーラビリティを提供する効果的な方法を提供する。
本発明は、MPEG−4のシンプルプロファイルとH.264のベースラインプロファイル内のいずれのシンタックスも変更することなく時間スケーラビリティを提供する、一方向予測時間スケーリングフレームを含む。一方向予測時間スケーリングフレームは通常のBフレームが用いるような前方および後方予測の代わりに前方または後方予測だけを用いる。さらに、他の予測フレームは一方向予測時間スケーリングフレームを参照しないかもしれない。他のフレームが時間スケーリングフレームに依存しないかもしれないため、時間スケーリングフレームは、残りのフレームに影響をすることなく、ビットストリームから除外されるかもしれない。その結果、MPEG−4のシンプルプロファイルまたはH.264のベースラインプロファイルに余分なシンタックスを導入する必要がないかもしれない。フレームを、標準的な予測フレームとは対照的に、一方向予測時間スケーリングフレームとして識別するために、単一付加ビットが追加されるかもしれない。
図2は本発明に従う前方予測時間スケーラビリティ方式の例を示す図である。GOP200はIフレーム210A、Pフレーム212、および時間スケーラビリティフレーム214を含む。図2に示すように、連続したPフレーム212の間の一方向予測時間スケーリングPフレーム214として単一の前方予測フレームが用いられるかもしれない。複数の一方向時間スケーリングフレームが1つの参照フレームに依存するかもしれないことを理解するべきである。連続したPフレーム212の間に複数の時間スケーリングフレームを置くことにより、データレート要求を満たすための適応性をより大きくできるかもしれない。Iフレーム210Bは次のGOPの始まりを示す。
図3は本発明に従う後方予測時間スケーラビリティ方式の例を示す図である。GOP300はIフレーム310A、Pフレーム312、および時間スケーリングフレーム314を含む。図3に示すように、連続したPフレーム312の間の一方向予測時間スケーリングPフレーム314として単一の後方予測フレームが用いられるかもしれない。Iフレーム310Bは次のGOPの始まりを示す。後方および前方の両方の場合に見られるように、他のフレームはそれぞれ時間スケーリングフレーム214および314を参照しない。フレームがそれらを参照しないため、時間スケーリングフレームは他のフレームに影響することなく符号化、伝送または復号から除去されるかもしれない。これは、伝送/復号から除外された一方向予測時間スケーリングフレームの数に従って、品質および/またはデータレートのゆるやかな低下をもたらすかもしれない。
一方向予測時間スケーリングフレームがBフレームより必要計算が少ないため、一方向予測時間スケーリングフレームは、電力制限または計算的に制限された機器への使用に対しては有利であるかもしれない。一方向予測時間スケーリングフレームが後続のPフレームを予測するためには用いられないため、Pフレームの符号化効率は、Pフレームだけを用いる時と比べて、落ちるかもしれない。この符号化効率の低下は、時間スケーラビリティを持つことの付加的利点を考えれば、許容されるかもしれない。図2および図3に示す一方向予測時間スケーリングフレームの例は、ただ1つのフレームを参照している。しかし、一方向予測時間スケーリングフレームが2つ以上のフレームを参照するかもしれないことが理解されるかもしれない。2つ以上の先行または後続フレームを参照することは、計算の複雑さを増加させるが、残留誤差の大きさを減少させるかもしれない。
前方予測一方向時間スケーリングフレームを双方向フレームの代わりに用いると、計算上の利点に加え、短い遅延時間が実現されるかもしれない。双方向フレームは、それらが後方予測されるフレームより後側で符号化される。これは、Bフレームが表示される前に付加的遅延があることを意味するかもしれない。図4に本発明の前方予測一方向時間スケーリングフレームを用いた表示および符号化処理のフレーム配列の例を示す。図4に示すように、双方向予測フレームと異なり、本発明の一方向予測時間スケーリングフレームは、リモート機器で表示される順序と同じ順序で符号化され伝送されるかもしれない。前方予測一方向時間スケーリングフレームを順番通りに符号化し伝送することによってBフレームを用いるときに起こる付加的な遅延を避けることができる。これはテレビ会議のような用途に対して付加的利点となるかもしれない。
図5はストリーミング画像を符号化し、復号するための一般的な通信システムのブロックダイアグラムである。システム500は符号機器505および復号機器510を含む。符号機器505はさらにイントラ符号化部品515、予測符号化部品520、時間スケーリング部品525およびメモリ部品530をさらに含む。符号機器505は外部ソース535からのデータにアクセスすることができる。外部ソース535は、例えば、外部メモリ、インターネットまたは生の映像および/またはオーディオフィードであるかもしれない。外部ソース535に含まれるデータは生(符号化されない)または符号化された状態にあるかもしれない。イントラ符号化部品515はイントラ符号化フレームを符号化するために用いられる。予測符号化部品520は、一方向予測時間スケーリングフレームを含むすべての種類の予測フレームを符号化するために用いられる。また、予測符号化部品520は、予測フレームを符号化するために用いられる論理回路を含むことに加えて、参照フレームを選択するために用いられる論理回路、および時間スケーリングフレームを他のフレームによる参照から除外するために用いられる論理回路を含む。予測符号化部品520は符号化のために生のまたは符号化データにアクセスするかもしれない。符号化データは、標準的PフレームまたはIフレームを一方向予測時間スケーリングフレームで置き換えるためにアクセスされるかもしれない。符号化データ(イントラ符号化またはインター符号化されたいずれかのデータ)にアクセスすると、イントラ符号化部品515および予測符号化部品520に含まれる論理回路は符号化データを復号し、その結果再構築した生データを発生させる。この再構築された生データは、つぎに、一方向予測時間スケーリングフレーム(または、任意の他の形式のフレーム)として符号化されるかもしれない。
符号化の後に、符号化フレーム(encoded frame)はメモリ部品530または外部メモリに格納される。外部メモリは外部ソース535または別のメモリ部品(図示しない)と同様のものかもしれない。符号化フレームはネットワーク540を通じて送信(Tx)される。ネットワーク540は、有線または無線であるかもしれない。時間スケーリング部品525は、送信する前に時間スケーリングが求められているどうかを決定するための論理回路を含む。時間スケーリング部品525は、時間スケーリングが求められていると決定された場合、時間スケーリングフレームを識別し、送信からそれらを除去するための論理回路を含むかもしれない。符号機器によって実行される符号化処理は、後段でより完全に説明される。
復号機器510はイントラ復号部品545、予測復号部品550、時間スケーリング部品555および、メモリ部品560を含む符号機器505に類似した部品を含む。復号機器510はネットワーク540を通じて、または外部記憶装置565から伝送された符号化データを受信するかもしれない。イントラ復号部品545は、イントラ符号化データを復号するために用いられる。予測復号部品550は、一方向予測時間スケーリングフレームを含む予測データを復号するために用いられる。時間スケーリング部品555は、復号する前に時間スケーリングが求められているかどうかを決定するための論理回路を含む。本例では、時間スケーリング部品555は、時間スケーリングが求められていると決定された場合、時間スケーリングフレームを識別し、復号からそれらを除去するための論理回路も含むかもしれない。復号後、復号されたフレームは表示部品570上に表示されるか、または内部メモリ560もしくは外部記憶装置565に格納されるかもしれない。表示部品570は、電話またはPDA上の表示画面のような、復号機器の構成部分であるかもしれない。表示部品570は、また、外部周辺機器であるかもしれない。復号機器によって実行される復号処理は、後段でより完全に説明される。
復号機器を一方向予測時間スケーリングフレームをサポートするようにする変更は小さいかもしれない。H.264は複数参照の符号化をサポートしているため、ベースライン復号器が少なくとも2つの参照フレームをサポート可能な場合、復号器を一方向予測時間スケーリングフレームをサポートするように変更する必要はないかもしれない。MPEG−4のシンプルプロファイルに準拠する復号器は、バッファ内に1つの参照フレームしか許容しないかもしれない。そのため、一方向前方予測時間スケーリングフレームの復号後、参照フレーム用バッファ内の参照フレームは、バッファ内の参照フレームを復号直後の時間スケーリングフレームで置き換えられずに、後続のPフレームのために保持されるだろう。
符号機器および復号機器に加え、時間スケーリングがトランス符号器として知られている中間的機器で行われるかもしれない。図6を参照して、トランス符号機器のブロックダイアグラムを示す。トランス符号機器600は第1のネットワーク605と第2のネットワーク620の間に位置している。トランス符号機器600は、図5で示した符号機器505のような機器から符号化データを第1のネットワークを通じて受信する。トランス符号機器600はメモリ部品615内に受信データを格納する。また、トランス符号機器600は時間スケーリング部品610を含む。時間スケーリング部品610は、第2のネットワーク620上で送信する前に時間スケーリングが求められているかを決定するための論理回路を含む。時間スケーリング部品610は、時間スケーリングが求められていると決定された場合、時間スケーリングフレームを識別し、伝送信号からそれらを除去する論理回路を含むかもしれない。トランス符号機器600によって実行されるトランス符号化処理は、後段でより完全に説明される。
図7は本発明に従う時間スケーリングを含む符号化処理の一例を示すフローチャートである。符号化処理は図5に示した機器505のような符号器で行われる。ディジタル映像データ710は複数のフレームで構成されるGOPへ符号化される。GOPは720で符号化されるイントラ符号化フレームで始まるかもしれない。イントラ符号化フレームは、少なくともいくつかの後続する(または、他のGOPからフレームを参照するかもしれないオープンGOPで後方予測する場合は、先行する)インターフレームの参照点として利用される。符号化処理700は前方または後方予測フレームを含むかもしれない予測フレームの符号化730も含む。予測フレームは、前のイントラ符号化されたまたは予測フレームを参照するかもしれない動きベクトルまたは残留誤差のような動き補償データを含むかもしれない。予測フレームは、また他の予測フレーム(標準的および時間スケーリングフレームの双方)に対する参照フレームとして利用されるかもしれない。740で一方向予測時間スケーリングフレームを符号化することにより時間スケーラビリティが可能となる。これらのフレームは、イントラ符号化されたまたは予測フレームを参照する動き補償を含むかもしれない予測フレーム(730)に類似の方法で計算されるかもしれない。しかし、時間スケーリングフレーム自体は、他のフレームによる参照から除外される(すなわち、時間スケーリングフレームが任意の他のフレームを予測するために用いられることはない)。時間スケーリングフレームデータは、そのフレームを時間スケーリングフレームとして識別する付加情報も含むかもしれない。他のフレームは時間スケーリングフレームの存在に依存しないため、他のフレームに悪影響を与えずに、時間スケーリングフレームを除外することができる。750で符号化フレームは後で配信するためにメモリ内に格納されるかもしれない。符号化フレームは、格納ステップ750を使わずに符号化後に配信されるかもしれない。
符号化処理700は、映像データ710がなくなるまで複数のGOPを符号化し続けるかもしれない。複数のGOPは異なる目的を満足するために異なる形式のフレームの異なる数のフレームで構成されるかもしれない。1つのGOP内に多くの時間スケーリングフレームを符号化すること(740)は、そのGOPの配信または復号の品質または複雑さを調整する際により大きい柔軟性を提供する。
図8は本発明に従う時間スケーリングを含む映像配信処理の一例のフローチャートである。図8の左側は、図5に示す符号機器505のような映像送信元における処理に対応する。右側は、図5に示す復号機器510のような受信先機器における処理に対応する。有線/無線ネットワークは、2つの側を接続するかもしれない。また有線または無線ネットワークの組合せであるかもしれない。新しいネットワークへの変換は図6に示したトランス符号機器600のようなトランス符号機器を含むかもしれない。図8の処理800は、メモリからの映像フレームデータ検索810で始まる。このメモリは予め作成された永久メモリであるかもしれない。または、伝送時に計算されるフレームデータを保持するためのダイナミックメモリであるかもしれない。
820で映像データを時間的にスケーリングするかどうかの決定がなされる。この決定において考慮される事項は、例えば、最大値より低いレベルの品質を提供すること、データレートをネットワークの1つの最大容量より低くすること、トラヒックを制御すること、送信元機器もしくは受信先機器の電池容量を保持すること、または符号化並びに/もしくは復号化の時間を制限することであるかもしれない。時間スケーリングが実行される場合、830で時間スケーリングフレームが識別され、選択的にデータストリームから除外される。どのフレームも時間スケーリングフレームを参照しないため、一方向予測時間スケーリングフレームのいずれかを除外することは、いずれの他のフレームにも影響を与えないだろう。識別は、例えば、1に設定したときはそのフレームを時間スケーリングフレームをして識別する単一付加ビットまたはフラグを含む多くの形態を取るかもしれない。この付加ビットまたはフラグは規格準拠のシンタックスまたは固有の方法を用いて符号化されるかもしれない。ビットストリームが規格(およびプロファイル)準拠となる場合、時間スケーリングフレームは相互の先験的符号器−サーバ通信(ネットワーク適応の場合)または相互の先験的符号器−復号器識別子(機器の複雑さ/電力適応の場合)によって識別されるかもしれない。相互の先験的識別子(priori identifier)は、例えば、フレームの位置(例えば奇数フレーム番号または偶数フレーム番号)、復号もしくは表示のタイムスタンプ、またはフレーム順序であるかもしれない。識別の他の形態は、フレームが他のフレームに参照されたかに関するビットストリーム内情報を用いる復号器を含むかもしれない。除外されない映像フレームは有線/無線ネットワークを通じて受信先機器に送信される。マルチキャスト配信の場合には複数受信先機器が、またはユニキャスト配信の場合は単一受信先機器があるかもしれない。
受信先機器、すなわち図5の復号機器510のような復号器において、または中間ネットワーク機器、すなわち図6の機器600のようなルータもしくはトランス符号器において、符号化された映像データがネットワークから取得される(850)。データの取得後、860で受信先機器または中間ネットワーク機器はそれぞれ時間スケーリングを行うか否かを決定するかもしれない。時間スケーリングする理由は、特に中間ネットワークルータに対しては、ネットワーク容量またはネットワーク負荷に関して、映像源での理由と同様であるかもしれない。時間スケーリングする理由は、例えば、特にPDA、携帯電話および類似のもののような資源を制限された機器に対する電池容量の保存も含むかもしれない。時間スケーリングが選ばれた場合、時間スケーリングフレームは識別され、例えばデータレートまたは復号時間のような目標パラメータを満足するために除去される。時間スケーリングフレームを除去した後、残りのフレームは、880でそれらの形式で決定される方法(例えばイントラ符号化の復号、前方予想復号など)で復号されるかもしれない。
上で検討した時間スケーリングの決定と除外処理は、エンコーダ機器505(図5)のような符号器、トランス符号機器600(図6)のようなトランス符号器、または復号機器510(図5)のような復号器で実行されるかもしれない。これらの3つの機器の1つ以上が、同じビットストリーム内の時間スケーリングフレームの除外の決定に関係するかもしれない。
説明が簡単になるように図7−8に示した方法は連続した行為として示し、説明しているが、本発明に従ういくつかの行為がここに示し説明した順序と異なる順序で、および/または他の行為と同時に発生するかもしれないため、本発明は行為の順序に限定されないことが理解される筈である。
本発明を、一方向予測時間スケーリングフレームのための参照フレームとしてイントラフレームおよび前方予測フレームを利用することに関連して完全に説明したが、後方予測フレームのような他のフレームが参照フレームとして同様に利用されるかもしれないことは明白である。
本発明を、MPEG−xおよびH.26x形式の圧縮方法に関連して完全に説明したが、他の映像圧縮方法が本発明の方法を実施するかもしれないことは明白である。
本発明の態様は以下の記述を含むが、それらに限定されない。
除外可能な時間スケーリングフレーム(removable temporal scaling frame)を、その除外可能な時間スケーリングフレームを一方向予測することによって符号化することを含み、その除外可能な時間スケーリングフレームは他のいずれのフレームを予測するためにも用いられない、マルチメディアフレーム符号化方法。
除外可能な時間スケーリングフレームを、その除外可能な時間スケーリングフレームを一方向予測することによって符号化するための手段を含み、その除外可能な時間スケーリングフレームは他のいずれのフレームを予測するためにも用いられない、マルチメディアフレーム符号化装置。
除外可能な時間スケーリングフレームを、その除外可能な時間スケーリングフレームを一方向予測することによって符号化するように構成された電子機器であり、その除外可能な時間スケーリングフレームは他のいずれのフレームを予測するためにも用いられない、マルチメディアフレーム符号化用電子機器。
他のフレームからの予測ではないイントラ符号化フレームを符号化することと、少なくとも1つのイントラ符号化フレームまたは予測フレームから予測された予測フレームを符号化することと、除外可能な時間スケーリングフレームをその除外可能な時間スケーリングフレームを一方向予測することによって符号化することであって、その除外可能な時間スケーリングフレームは他のいずれのフレームを予測するためにも用いられないことを含む、マルチメディアフレーム符号化方法を計算機に実行させるための命令を有する計算機読み出し可能な媒体。
符号化フレームデータを受信することと、他のいずれのフレームを予測するためにも用いられない一方向に予測された除外可能な時間スケーリングフレームを識別することと、受信した符号化フレームデータを少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように復号することとを含む、マルチメディアフレーム復号方法。
符号化フレームデータを受信するための手段と、他のいずれのフレームを予測するためにも用いられない一方向に予測された除外可能な時間スケーリングフレームを識別するための手段と、受信した符号化フレームデータを、少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように、復号するための手段とを含む、マルチメディアフレーム復号のための装置。
マルチメディアフレームを復号するための電子機器であって、符号化フレームデータを受信し、他のいずれのフレームを予測するためにも用いられない一方向に予測された任意の除外可能な時間スケーリングフレームを識別し、受信した符号化フレームデータを、少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように、復号するように構成された電子機器。
符号化フレームデータを受信することと、他のいずれのフレームを予測するためにも用いられない一方向に予測された除外可能な時間スケーリングフレームを識別することと、受信した符号化フレームデータを、少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように、復号することとを含む、マルチメディアフレーム復号方法を計算機に実行させるための命令を有する計算機読み出し可能な媒体。
第1のネットワークを通じて符号化フレームを受信することと、第1のネットワークを通じて除外可能な時間スケーリングフレームを受信することであって、その除外可能な時間スケーリングフレームが少なくとも1つの符号化フレームから一方向に予測され、かつその除外可能な時間スケーリングフレームが他のいずれのフレームを予測するためにも用いられず、受信した符号化フレームを第2のネットワークを通じて送信することと、除外可能な時間スケーリングフレームを送信から除去することとを含む、マルチメディアフレームを時間的にスケーリングする方法。
第1のネットワークを通じて符号化フレームを受信するための手段と、第1のネットワークを通じて除外可能な時間スケーリングフレームを受信するための手段であって、その除外可能な時間スケーリングフレームが少なくとも1つの符号化フレームから一方向に予測され、かつその除外可能な時間スケーリングフレームが他のいずれのフレームを予測するためにも用いられず、受信した符号化フレームを第2のネットワークを通じて送信するための手段と、除外可能な時間スケーリングフレームを送信から除去するための手段とを含む、マルチメディアフレームを時間的にスケーリングするための装置。
当業者は、情報と信号が種々の技術と技法のいずれかを用いて表されるかもしれないことを理解するだろう。例えば、上の説明中に参照されたかもしれないデータ、命令、指示、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁場もしくは磁気粒子、光学場もしくは光学粒子、またはそれらのいずれかの組合せで表されるかもしれない。
当業者は、ここに開示された例に関連して説明された種々の説明的論理ブロック、モジュール、およびアルゴリズムステップが電子的ハードウェア、計算機ソフトウェア、または双方の組合わせとして実施されるかもしれないことをさらに理解するだろう。ハードウェアとソフトウェアのこの互換性を明白に示すために、上では、種々の説明的部品、ブロック、モジュール、回路、およびステップをそれらの機能として一般的に説明した。そのような機能がハードウェアとして実施されるかソフトウェアとして実施されるかは、特定の用途および全体システムに課せられた設計上の制約に依存する。当業者は、説明した機能を各特定用途に対して種々の方法で実施するかもしれないが、そのような実施の決定が本発明の範囲を逸脱する原因になると解釈されるべきではない。
ここに開示された例に関連して説明した種々の説明的論理ブロック、モジュール、および回路は、汎用プロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向IC(ASIC)、プログラマブルゲートアレイ(FPGA)もしくは他のプログラム可能論理回路、個別ゲートもしくはトランジスタ論理回路、個別ハードウェア部品、またはここに説明した機能を実行するために設計されたそれらのいずれかの組み合わせで実施または実行されるかもしれない。汎用プロセッサはマイクロプロセッサであるかもしれないが、代替的には、プロセッサは通常のプロセッサ、コントローラ、マイクロコントローラまたは状態機械であるかもしれない。プロセッサは、また、計算機器の組合せ、例えばDSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと関連した1つ以上のマイクロプロセッサ、またはそのような他のいずれかの構成、として実施されるかもしれない。
ここに開示された例に関連して説明した方法またはアルゴリズムのステップは、ハードウェア、プロセッサで実行されるソフトウェア、またはその2つの組合せで直接具体化されるかもしれない。ソフトウェアモジュールはRAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、可搬型ディスク、CD−ROM、または当業者に周知の他のいずれかの形式の記憶媒体にあるかもしれない。代表的記憶媒体は、プロセッサが記憶媒体から情報を読み出し、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替的には、記憶媒体はプロセッサの一部であるかもしれない。プロセッサおよび記憶媒体は特定用途向IC(ASIC)にあるかもしれない。ASICは無線モデムにあるかもしれない。代替的には、プロセッサおよび記憶媒体は個別部品として無線モデムにあるかもしれない。
開示された例のこれまでの説明は、通常の当業者が本発明を製造しまたは使用することを可能にするように提供されている。これらの例への種々の変更は当業者に容易に明らかになるだろう。また、ここに定義した原理は本発明の精神または範囲から逸脱することなく他の例に適用されるかもしれない。
イントラ符号化フレーム、前方および後方予測フレーム、および一方向予測時間スケーリングフレームを含む映像ストリームを符号化し、トランス符号化し、および復号する方法、装置、およびシステムを説明した。
従来のMPEG−4シンプルプロファイルデータストリームを示す図。 時間スケーラビリティを可能にする従来の符号化データストリームを示す図。 本発明に従う前方予測時間スケーラビリティ方式の例を示す図。 本発明に従う後方予測時間スケーラビリティ方式の例を示す図。 本発明の前方予測一方向時間スケーリングフレームを用いた、表示用および符号化処理のフレーム順序の例を示す図。 ストリーミング画像を符号化し復号する一般的な通信システムのブロックダイアグラム。 トランス符号機器のブロックダイアグラム。 本発明に従う時間スケーリングを含む符号化処理の一例を示すフローチャート。 本発明に従う時間スケーリングを含む映像配信処理の一例のフローチャート。

Claims (27)

  1. マルチメディアフレームを、双方向予測フレームを含まない単一層のビットストリームに符号化する方法であって、
    他のいずれかのフレームを予測するために使用されない、除外可能な時間スケーリングフレームであって、該単一層の該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによって、該除外可能な時間スケーリングフレームを符号化することと、
    該単一層における他のフレームから予測されたものではないイントラ符号化フレームを符号化することと、
    該単一層における少なくとも1つのイントラ符号化または予測フレームから予測された予測フレームを符号化することと、
    該単一層における該符号化されたイントラ符号化フレームおよび該符号化された予測フレームをネットワークを通じて伝送し、該付加データに従って、該符号化された除外可能な時間スケーリングフレームを該伝送から除去することと、を含む方法。
  2. 該予測フレームを符号化することが該予測フレームを前方予測することを含む請求項1に記載の方法。
  3. メモリに該符号化フレームを格納することをさらに含む請求項1に記載の方法。
  4. 動きベクトルおよび残留誤差データを持つ該予測フレームを符号化することと、
    該動きベクトルおよび残留誤差データを持つ該除外可能な時間スケーリングフレームを符号化することと、をさらに含む請求項1に記載の方法。
  5. 該伝送されたフレームを受信することと、
    該受信したフレームを復号することと、をさらに含む請求項1に記載の方法。
  6. 該伝送されたフレームを受信することと、
    該受信したイントラ符号化フレームおよび該受信した予測フレームを復号することと、
    該受信した除外可能な時間スケーリングフレームを除去することと、をさらに含む請求項1に記載の方法。
  7. 該伝送されたフレームを受信することと、
    該受信した除外可能な時間スケーリングフレームを該付加データにより識別することと、をさらに含む請求項1に記載の方法。
  8. マルチメディアフレームを、双方向予測フレームを含まない単一層のビットストリームに符号化する装置であって、
    他のいずれかのフレームを予測するために使用されない除外可能な時間スケーリングフレームであって、該単一層における該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによって、該除外可能な時間スケーリングフレームを符号化する手段と、
    該単一層における他のフレームから予測されたものではないイントラ符号化フレームを符号化する手段と、
    該単一層における少なくとも1つのイントラ符号化または予測フレームから予測された予測フレームを符号化する手段と、
    該単一層における該符号化されたイントラ符号化フレームおよび該符号化された予測フレームをネットワークを通じて伝送し、該付加データに従って、該符号化された除外可能な時間スケーリングフレームを該伝送から除去する手段と、を含む装置。
  9. 該予測フレームを符号化するための手段が、前方予測のための手段を含む請求項に記載の装置。
  10. メモリに符号化フレームを格納するための手段をさらに含む請求項に記載の装置。
  11. 動きベクトルおよび残留誤差データを持つ該予測フレームを符号化するための手段と、
    該動きベクトルおよび残留誤差データを持つ該除外可能な時間スケーリングフレームを符号化するための手段と、をさらに含む請求項に記載の装置。
  12. マルチメディアフレームを、双方向予測フレームを含まない単一層のビットストリームに符号化するための電子機器であって、
    他のいずれかのフレームを予測するために使用されない除外可能な時間スケーリングフレームであって、該単一層における該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによって、該除外可能な時間スケーリングフレームを符号化するように構成され、
    該単一層における他のフレームから予測されたものではないイントラ符号化フレームを符号化するようにさらに構成され、
    該単一層における少なくとも1つのイントラ符号化または予測フレームから予測された予測フレームを符号化するようにさらに構成され、
    該単一層における該符号化されたイントラ符号化フレームおよび該符号化された予測フレームをネットワークを通じて伝送し、該付加データに従って、該符号化された除外可能な時間スケーリングフレームを該伝送から除去するようにさらに構成された電子機器。
  13. 該予測フレームを前方予測を用いて符号化するようにさらに構成された請求項12に記載の電子機器。
  14. メモリに該符号化フレームを格納するようにさらに構成された請求項12に記載の電子機器。
  15. 動きベクトルおよび残留誤差データを持つ該予測フレームを符号化するように、および動きベクトルおよび残留誤差データを持つ該除外可能な時間スケーリングフレームを符号化するようにさらに構成された請求項12に記載の電子機器。
  16. マルチメディアフレームを、双方向予測フレームを含まない単一層のビットストリームに復号する方法であって、
    (a)いずれか他のフレームを予測するために使用されない除外可能な時間スケーリングフレームであって該単一層における該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによる除外可能な時間スケーリングフレーム、(b)該単一層における他のフレームから予測されたものではないイントラ符号化フレーム、および(c)該単一層における少なくとも1つのイントラ符号化フレームまたは予測フレームから予測された予測フレーム、を含む符号化フレームデータを受信することと、
    該単一層における除外可能な時間スケーリングフレームを識別することと、
    該単一層における該受信した符号化フレームデータを、前記付加データに従って、少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように復号することと、を含む方法。
  17. 該受信することは、無線ネットワークを通じて受信することを含む請求項16に記載の方法。
  18. 方予測された該予測フレームを受信することをさらに含む請求項16に記載の方法。
  19. 該受信した除外可能な時間スケーリングフレームを該付加データにより識別することをさらに含む請求項16に記載の方法。
  20. マルチメディアフレームを、双方向予測フレームを含まない単一層のビットストリームに復号するための装置であって、
    (a)いずれか他のフレームを予測するために使用されない除外可能な時間スケーリングフレームであって該単一層における該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによる除外可能な時間スケーリングフレーム、(b)該単一層における他のフレームから予測されたものではないイントラ符号化フレーム、および(c)該単一層における少なくとも1つのイントラ符号化フレームまたは予測フレームから予測された予測フレーム、を含む符号化フレームデータを受信するための手段と、
    該単一層における除外可能な時間スケーリングフレームを識別するための手段と、
    該受信した符号化フレームデータを、該付加データに従って、該単一層における少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように復号するための手段と、を含む装置。
  21. 該受信するための手段が、無線ネットワークを通じて受信するための手段を含む請求項20に記載の装置。
  22. 方予測された該予測フレームを受信するための手段をさらに含む請求項20に記載の装置。
  23. 該受信した除外可能な時間スケーリングフレームを該付加データにより識別するための手段をさらに含む請求項20に記載の装置。
  24. (a)双方向予測フレームを含まない単一層のビットストリームにおける、いずれか他のフレームを予測するために使用されない除外可能な時間スケーリングフレームであって、該除外可能な時間スケーリングフレームとして識別するための付加データを持つ該除外可能な時間スケーリングフレームを表示順序に関して一方向に後方予測することによる除外可能な時間スケーリングフレーム、(b)該単一層における他のフレームから予測されたものではないイントラ符号化フレーム、および(c)該単一層における少なくとも1つのイントラ符号化フレームまたは予測フレームから予測された予測フレーム、を含む符号化フレームデータを受信し、
    該単一層における該時間スケーリングフレームを識別し、
    該受信した符号化フレームデータを、該付加データに従って、該単一層における少なくとも1つの除外可能な時間スケーリングフレームを復号から除去するように、復号するように構成された電子機器。
  25. 該符号化フレームデータを無線ネットワークを通じて受信するようにさらに構成された請求項24に記載の電子機器。
  26. 方予測された該予測フレームを受信するようにさらに構成された請求項24に記載の電子機器。
  27. 該受信した除外可能な時間スケーリングフレームを該付加データにより識別するようにさらに構成された請求項24に記載の電子機器。
JP2007507556A 2004-04-07 2005-04-07 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置 Active JP5069099B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US56043304P 2004-04-07 2004-04-07
US60/560,433 2004-04-07
US62570004P 2004-11-04 2004-11-04
US60/625,700 2004-11-04
US11/093,874 2005-03-29
US11/093,874 US8315307B2 (en) 2004-04-07 2005-03-29 Method and apparatus for frame prediction in hybrid video compression to enable temporal scalability
PCT/US2005/012132 WO2005101851A1 (en) 2004-04-07 2005-04-07 Method and apparatus for frame prediction in hybrid video compression to enable temporal scalability

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010236370A Division JP5108078B2 (ja) 2004-04-07 2010-10-21 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測の方法および装置

Publications (2)

Publication Number Publication Date
JP2007533212A JP2007533212A (ja) 2007-11-15
JP5069099B2 true JP5069099B2 (ja) 2012-11-07

Family

ID=34965145

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007507556A Active JP5069099B2 (ja) 2004-04-07 2005-04-07 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置
JP2010236370A Active JP5108078B2 (ja) 2004-04-07 2010-10-21 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測の方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010236370A Active JP5108078B2 (ja) 2004-04-07 2010-10-21 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測の方法および装置

Country Status (7)

Country Link
US (1) US8315307B2 (ja)
EP (1) EP1733565A1 (ja)
JP (2) JP5069099B2 (ja)
KR (1) KR100799784B1 (ja)
CN (1) CN1965587B (ja)
CA (1) CA2562172C (ja)
WO (1) WO2005101851A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7995656B2 (en) * 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
AU2006236335A1 (en) * 2005-04-18 2006-10-26 Clearplay, Inc. Apparatus, system and method for associating one or more filter files with a particular multimedia presentation
JP2007336263A (ja) * 2006-06-15 2007-12-27 Fujifilm Corp 画像処理方法及び装置並びにプログラム
US7456760B2 (en) * 2006-09-11 2008-11-25 Apple Inc. Complexity-aware encoding
CN100463526C (zh) * 2006-12-11 2009-02-18 陈耀武 视频延时自适应矫正的解码装置
EP2028863B1 (en) * 2007-08-21 2015-07-15 BlackBerry Limited System and method for dynamic video deblocking on a mobile device
US8913670B2 (en) 2007-08-21 2014-12-16 Blackberry Limited System and method for providing dynamic deblocking filtering on a mobile device
US20090060035A1 (en) * 2007-08-28 2009-03-05 Freescale Semiconductor, Inc. Temporal scalability for low delay scalable video coding
KR101087178B1 (ko) * 2007-08-31 2011-11-25 후지쯔 가부시끼가이샤 신호 출력 장치, 신호 출력 방법 및 신호 출력 프로그램을 기록한 기록 매체
US20090304086A1 (en) * 2008-06-06 2009-12-10 Apple Inc. Method and system for video coder and decoder joint optimization
JP5197238B2 (ja) * 2008-08-29 2013-05-15 キヤノン株式会社 映像送信装置、その制御方法、および制御方法を実行するプログラム
US20110211633A1 (en) * 2008-11-12 2011-09-01 Ferran Valldosera Light change coding
JP5774995B2 (ja) * 2008-11-13 2015-09-09 トムソン ライセンシングThomson Licensing Gopマージおよびビット割付けを用いたマルチスレッド・ビデオ符号化
US8687685B2 (en) 2009-04-14 2014-04-01 Qualcomm Incorporated Efficient transcoding of B-frames to P-frames
KR100924309B1 (ko) 2009-06-04 2009-11-02 전자부품연구원 시간확장성과 버퍼상태판단을 통한 품질 적응적 멀티미디어 데이터 스트리밍 방법 및 시스템
US8213506B2 (en) * 2009-09-08 2012-07-03 Skype Video coding
EP2514206A1 (en) * 2009-12-15 2012-10-24 Thomson Licensing Method and apparatus for bi-directional prediction within p-slices
GB2476271B (en) * 2009-12-17 2015-09-02 Skype Coding data streams
US8976856B2 (en) 2010-09-30 2015-03-10 Apple Inc. Optimized deblocking filters
US20130021512A1 (en) * 2011-07-20 2013-01-24 Broadcom Corporation Framing of Images in an Image Capture Device
US9584832B2 (en) * 2011-12-16 2017-02-28 Apple Inc. High quality seamless playback for video decoder clients
KR20130101900A (ko) * 2012-03-06 2013-09-16 삼성전자주식회사 전자 장치 및 인코딩 방법
KR101858695B1 (ko) * 2012-04-09 2018-05-16 엘지전자 주식회사 데이터 관리 방법
JP2014103613A (ja) * 2012-11-22 2014-06-05 Jvc Kenwood Corp 画像処理装置、画像処理方法、画像処理プログラム
US9674522B2 (en) * 2013-04-08 2017-06-06 Qualcomm Incorporated Device and method for scalable coding of video information
CN103957471B (zh) * 2014-05-05 2017-07-14 华为技术有限公司 网络视频播放的方法和装置
CN104796702B (zh) * 2015-04-22 2018-05-08 无锡天脉聚源传媒科技有限公司 一种h264视频帧率的转换方法及装置
JP6312934B2 (ja) * 2015-06-16 2018-04-18 三菱電機株式会社 画像符号化方式変換装置及び画像符号化方式変換方法
DE102015110316B4 (de) * 2015-06-26 2021-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtungen, Zytometer, Verfahren und Computerprogramm zum Bereitstellen von Information über zumindest eine Sequenz
US10505994B2 (en) 2015-10-20 2019-12-10 Intel Corporation Technologies for scalable capability detection for multimedia casting
CN108933762B (zh) * 2017-05-25 2020-12-04 腾讯科技(深圳)有限公司 一种媒体流的播放处理方法及装置
CN110999309A (zh) * 2017-08-07 2020-04-10 夏普株式会社 生成装置、再现装置、生成方法、再现方法、控制程序、记录介质
JP7136458B2 (ja) * 2019-07-26 2022-09-13 サイレックス・テクノロジー株式会社 符号化装置、再生装置、作成装置、再生システム、符号化方法、再生方法、作成方法、および、プログラム
CN112040233B (zh) * 2020-11-04 2021-01-29 北京金山云网络技术有限公司 视频编码、视频解码方法和装置、电子设备及存储介质
EP4203472A1 (en) * 2021-12-21 2023-06-28 Axis AB Method and image processing device for encoding a video

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3318707B2 (ja) 1996-11-08 2002-08-26 ソニー株式会社 画像信号符号化装置および画像信号符号化方法、画像信号復号装置および画像信号復号方法、画像信号伝送方法、並びに画像信号記録媒体
US6173013B1 (en) * 1996-11-08 2001-01-09 Sony Corporation Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal
US7263127B1 (en) * 1998-04-02 2007-08-28 Intel Corporation Method and apparatus for simplifying frame-based motion estimation
JP2000350197A (ja) 1999-06-02 2000-12-15 Hitachi Ltd 映像伝送方法とそれを用いた監視システム
US6639943B1 (en) 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
GB2364842A (en) * 2000-07-11 2002-02-06 Motorola Inc Method and system for improving video quality
JP4337248B2 (ja) * 2000-08-31 2009-09-30 ソニー株式会社 画像情報の伝送装置、伝送システムおよび伝送方法
US7643724B2 (en) * 2001-10-23 2010-01-05 Thomson Licensing Fast motion trick mode using non-progressive dummy predictive pictures
US20030159152A1 (en) * 2001-10-23 2003-08-21 Shu Lin Fast motion trick mode using dummy bidirectional predictive pictures
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
FI114433B (fi) * 2002-01-23 2004-10-15 Nokia Corp Otossiirtymän koodaaminen videokoodauksessa
EP1500002A1 (en) 2002-04-29 2005-01-26 Sony Electronics Inc. Supporting advanced coding formats in media files
GB2391413B (en) 2002-07-31 2004-08-25 Motorola Inc Object-based scalable video transmissions
US7826718B2 (en) * 2002-08-09 2010-11-02 Broadcom Corporation Method and apparatus to facilitate the efficient implementation of trick modes in a personal video recording system
US7606308B2 (en) * 2003-09-07 2009-10-20 Microsoft Corporation Signaling macroblock mode information for macroblocks of interlaced forward-predicted fields
US7599438B2 (en) * 2003-09-07 2009-10-06 Microsoft Corporation Motion vector block pattern coding and decoding
US7889792B2 (en) * 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames

Also Published As

Publication number Publication date
CA2562172C (en) 2013-12-31
CN1965587A (zh) 2007-05-16
KR100799784B1 (ko) 2008-01-31
US8315307B2 (en) 2012-11-20
JP5108078B2 (ja) 2012-12-26
US20050249285A1 (en) 2005-11-10
CN1965587B (zh) 2013-04-24
KR20060133090A (ko) 2006-12-22
CA2562172A1 (en) 2005-10-27
WO2005101851A1 (en) 2005-10-27
JP2011041317A (ja) 2011-02-24
JP2007533212A (ja) 2007-11-15
EP1733565A1 (en) 2006-12-20

Similar Documents

Publication Publication Date Title
JP5069099B2 (ja) 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測のための方法および装置
KR100942395B1 (ko) 다층 비디오 설계를 위한 레이트 제어
US8320464B2 (en) Method and apparatus to construct bi-directional predicted frames for temporal scalability
US8948262B2 (en) Method and apparatus for using frame rate up conversion techniques in scalable video coding
KR100964778B1 (ko) 다중 계층 비디오 인코딩
Zheng et al. Error-resilient coding of H. 264 based on periodic macroblock
Kurceren et al. Synchronization-predictive coding for video compression: The SP frames design for JVT/H. 26L
TWI416962B (zh) 在併合視訊壓縮中用於框架預測以致動暫時可擴充性之方法、裝置、及電腦可讀取媒體
HoangVan et al. Flexible complexity control based on intra frame mode decision in distributed video coding
Goh et al. Real-time software MPEG-2 TO H. 264 video transcoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090925

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091002

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101108

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110114

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120111

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120816

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5069099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250