JP2011505781A - 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張 - Google Patents

高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張 Download PDF

Info

Publication number
JP2011505781A
JP2011505781A JP2010536905A JP2010536905A JP2011505781A JP 2011505781 A JP2011505781 A JP 2011505781A JP 2010536905 A JP2010536905 A JP 2010536905A JP 2010536905 A JP2010536905 A JP 2010536905A JP 2011505781 A JP2011505781 A JP 2011505781A
Authority
JP
Japan
Prior art keywords
still image
video
video stream
encoded
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010536905A
Other languages
English (en)
Inventor
アリ タバタバイ
モハメド ズバイル ヴィシャラム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2011505781A publication Critical patent/JP2011505781A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

並行モードで動作するように構成されたコーデックが、低解像度ビデオのAVC符号化と並行して高解像度静止画像ピクチャの符号化及び記憶をサポートするようにするために現行のAVC規格を拡張する。並行モードコーデックは修正AVC規格に基づいて構成され、AVCビデオストリームを取り込むことができると同時に、高解像度静止画像をビデオストリームに対してランダムな間隔で取り込むことができる。拡張層として記憶される残差情報を使用して、デコーダ側でアップサンプリングされた復号済み低解像度ビデオを使用して1又はそれ以上の高解像度静止画像ピクチャを生成する。基層が低解像度ビデオを搬送する。拡張層及び基層が、多層ストリームとして、送信側のエンコーダから受信側のデコーダへ並行して送信される。拡張情報を搬送するために、SEIメッセージ定義、シーケンスパラメータセット、及び新規のNALユニットのための(単複の)データフィールドを含むようにAVC規格を拡張する。
【選択図】図1

Description

本発明は、ビデオ符号化の分野に関する。より具体的には、本発明は、AVC符号化の分野、及び現行のAVC規格を拡張して、高解像度デジタル静止画像を従来どおりに符号化されたAVCビデオストリームとともに統合並行モードでの符号化及び記憶をサポートすることに関する。
「コーデック」という用語は、「コンプレッサ/デコンプレッサ」、「コーダ/デコーダ」、又は「圧縮/解凍アルゴリズム」のいずれかを意味し、データストリーム又は信号に対して変換を行うことができる装置又はアルゴリズム、或いは専門のコンピュータプログラムを表す。
コーデックは、データストリーム又は信号を送信、記憶、又は暗号化のために符号化し、これを閲覧又は編集のために復号する。例えば、デジタルビデオカメラはアナログ信号をデジタル信号に変換し、次にこの信号がデジタル送信又は記憶のためにビデオコンプレッサを通過する。その後、受信装置が、ビデオデコンプレッサを介して受信信号を解凍し、解凍されたデジタル信号が表示のためにアナログ信号に変換される。オーディオ信号に対しても同様の処理を行うことができる。標準的なコーデックスキームは数多く存在する。中には、主にファイル転送時間を最小化するために使用されるものがあり、インターネット上で利用される。また中には、所定量のディスクスペース又はCD−ROM上に記憶できるようにデータを最小化することを目的とするものもある。個々のコーデックスキームには、異なるプログラム、処理、又はハードウェアによって対処することができる。
デジタル画像は、2次元画像を画素又はピクセルと呼ばれるデジタル値の有限集合として表現したものである。通常、ピクセルは、整数の2次元配列であるラスタ画像又はラスタマップとしてコンピュータメモリに記憶される。これらの値は、多くの場合圧縮形式で送信又は記憶される。
デジタルカメラ及びビデオカメラ、スキャナ、座標測定機、地震観測プロファイリング、航空機搭載レーダー、及びその他などの様々な入力装置及び技術によってデジタル画像を生成することができる。数学関数又は3次元幾何学モデルなどの任意の非画像データからデジタル画像を合成することもでき、後者はコンピュータグラフィックスの主な下位区分である。デジタル画像処理の分野には、デジタル画像に対して画像処理を行うためのアルゴリズムの研究又は使用がある。画像コーデックは、このようなデジタル画像処理を行うためのアルゴリズムを含む。
画像を見るためには、画像フォーマットに応じて異なる画像コーデックを利用する。GIF、JPEG、及びPNG画像は、標準的なインターネット画像フォーマットなので、ウェブブラウザを使用して簡単に見ることができる。現在、ウェブではSVGフォーマットが広く使用されており、これは標準的W3Cフォーマットである。その他のプログラムには、ある順序で順々に自動的に画像を見るためのスライドショーの利用性を提供するものもある。
静止画像は、ビデオとは異なる特性を有する。例えば、アスペクト比及び色が異なる。従って、静止画像はビデオとは異なって処理されるので、静止画像用の静止画像コーデックと、静止画像コーデックとは異なるビデオ用のビデオコーデックとが必要になる。
ビデオコーデックには、デジタルビデオデータに対してデータ圧縮技術を使用できるようにする装置又はソフトウェアモジュールがある。ビデオシーケンスは、一般にフレームと呼ばれる数多くのピクチャ(デジタル画像)から成る。後続するフレームは非常に類似しており、従って1つのフレームから次のフレームにかけて多くの冗長性を含む。ビデオデータは、帯域幅及びメモリの両方を節約するために圧縮されてから、チャネルを介して効率的に送信され、又はメモリに記憶される。ビデオ圧縮の目的は、フレーム内(空間的冗長性)及びフレーム間(時間的冗長性)の両方における冗長性を除去して、より良い圧縮比を得ることである。ビデオ品質、これを表すのに必要なデータ量(ビットレートとしても知られる)、符号化及び復号アルゴリズムの複雑性、データ損失及びエラーに対するこれらのロバスト性、編集し易さ、ランダムアクセス、エンドツーエンド遅延、及び数多くのその他の要因の間には複雑なバランスが存在する。
典型的なデジタルビデオコーデックの設計は、入力ビデオをRGBカラーフォーマットからYCbCrカラーフォーマットに変換することから開始し、その後クロマサブサンプリングを行ってサンプリンググリッドパターンを生成することが多い。YCbCrカラーフォーマットへの変換は、カラー信号を無相関化して、知覚的にあまり重要でないクロマ信号から知覚的により重要な輝度信号を分離することにより、圧縮性を改善するとともに低解像度での表示を行うことができる。
一定量の空間的及び時間的ダウンサンプリングを使用して、基本符号化処理の前に未加工データ量を低減させることができる。ダウンサンプリングとは、信号のサンプリングレートを下げる処理のことである。これは、一般にデータ量又はデータのサイズを低減させるために行われる。通常、ダウンサンプリング係数は1よりも大きな整数又は有理分数である。次に、周波数変換を使用してこのデータを変換し、空間データをさらに無相関化する。1つのこのような変換が離散コサイン変換(DCT)である。次に、変換の出力を量子化して、量子化された値にエントロピー符号化を適用する。エンコーダによっては、例えば2パスなどのnパス符号化と呼ばれる多段処理でビデオを圧縮できるものもあり、これは一般により低速な処理ではあるが、より優れた品質の圧縮をもたらす可能性がある。
復号処理は、基本的に符号化処理の各段階の反転を行うことから成る。厳密に反転できない1つの段階が量子化段階である。ここでは、反転に最大限近似したものが行われる。この処理の部分は「反転量子化」又は「逆量子化」と呼ばれることがあるが、量子化は本質的に非可逆処理である。
様々なコーデックをPC上及び家電機器内で容易に実施することができる。同じ製品内で複数のコーデックを利用できることも多く、互換性の理由から1つの優位なコーデックを選択する必要がないようになっている。
いくつかの広く使用されているビデオコーデックとして、以下に限定されるわけではないが、H.261、MPEG−1 Part2、MPEG−2 Part2、H.263、MPEG−4 Part2、MPEG−4 Part10/AVC、DivX、XviD、3ivx、Sorenson3、及びWindows Media Video(MWV)が挙げられる。
H.261は、主に旧型のテレビ会議及びテレビ電話製品で使用される。H.261は、最初の実用的なデジタルビデオ圧縮規格であった。基本的に、それ以降の全ての標準的なビデオコーデック設計がH.261に基づいている。H.261は、YCbCrカラー表現、4:2:0サンプリングフォーマット、8ビットサンプル精度、16×16マクロブロック、ブロック単位の動き補償、8×8ブロック単位の離散コサイン変換、ジグザグ係数走査、スカラ量子化、run+valueのシンボルマッピング、及び可変長符号化のような十分に確立した概念を含んでいた。H.261は、順次走査ビデオのみをサポートした。
MPEG−1 Part2はビデオCD(VCD)に使用され、オンラインビデオに使用されることもある。品質は、VHSの品質とほぼ同程度である。元となるビデオ品質が良好でビットレートが十分に高い場合、VCDはVHSよりも良好に見えるが、これには高いビットレートが必要となる。世界中のほとんど全てのコンピュータがこのコーデックを再生できるので、VCDは、あらゆるデジタルビデオ/オーディオシステムの最高の互換性を有する。技術設計の面では、MPEG−1のH.261に対する最も大きな強化点は、2分の1画素精度双予測動き補償のサポートであった。MPEG−1は、順次走査ビデオのみをサポートした。
MPEG−2 Part2は、H.262との共通テキスト規格であり、DVD上及びほとんどのデジタルビデオ放送及びケーブル配信システムで使用される。標準的なDVD上で使用した場合、MPEG−2 Part2は良好な画質を提供するとともにワイド画面をサポートする。技術設計の面では、MPEG−2のMPEG−1に対する最も大きな強化点は、インターレースビデオのサポートの追加であった。MPEG−2は古いコーデックと見なされるが、市場で幅広く受け入れられており、実使用数が非常に多い。
H.263は、主にテレビ会議、テレビ電話、及びインターネットビデオに使用される。H.263は、順次走査ビデオのための標準化された圧縮機能において大きな前進を示した。特に、低ビットレートにおいて、H.263は、所定のレベルのフィデリティに達するのに必要なビットレートにおいてかなりの改善をもたらすことができた。
MPEG−4 Part2は、インターネット、ブロードキャストに、及び記憶媒体上で使用できるMPEG規格である。MPEG−4 Part2は、MPEG−2及びH.263の初版に対して改善された品質を提供する。MPEG−4 Part2の先行するコーデック規格を超える主な技術的特徴は、オブジェクト志向の符号化特性で構成されていた。MPEG−4 Part2はまた、H.263で開発された能力を取り入れること、及び4分の1画素精度動き補償などの新しい機能を追加することの両方により、いくつかの圧縮能力の強化を含んでいた。MPEG−4 Part2は、MPEG−2のように順次走査及びインターレースビデオの両方をサポートする。
MPEG−4 Part10は、ITU−TのH.264と技術的に並ぶ規格であり、AVCと呼ばれることが多い。MPEG−4 Part10は、圧縮機能に数多くの大幅な進歩を含み、最近数多くの企業製品に採用されてきた。
DivX、XviD、及び3ivxは、基本的にMPEG−4 Part2ビデオコーデックを使用するビデオコーデックパッケージであり、*.avi、*.mp4、*.ogm、又は*.mkvのファイルコンテナフォーマットを有する。Sorenson3は、一般にApple社のQuickTimeによって使用されるコーデックであり、基本的にはH.264の原型である。ウェブ上で見られるQuickTimeムービーの予告編の多くがこのコーデックを使用する。WMV(Windows Media Video)は、Microsoft社のビデオコーデック設計のファミリであり、WMV7、WMV8、及びWMV9を含む。WMVは、M−PEG4コーデック設計の1つのバージョンと見なすことができる。
MPEGコーデックは、動画及びそれに関連する音声の汎用符号化に使用される。MPEGビデオコーデックは、従来より一連の3種類の符号化データフレームから構成される圧縮ビデオビットストリームを生成する。この3種類のデータフレームは、イントラフレーム(I−フレーム又はI−ピクチャと呼ばれる)、双方向予測フレーム(B−フレーム又はB−ピクチャと呼ばれる)、及び前方予測フレーム(P−フレーム又はP−ピクチャと呼ばれる)と呼ばれる。これらの3種類のフレームは、GOP(Group Of Pictures)と呼ばれる特定の順序で配列することができる。I−フレームは、ピクチャを再構成するのに必要な全ての情報を含む。I−フレームは、動き補償を伴わない標準画像として符号化される。この一方で、P−フレームは前のフレームからの情報を使用して、及びB−フレームは前のフレーム、次のフレーム、又はこれらの両方からの情報を使用してピクチャを再構成する。すなわち、P−フレームは、先行するI−フレーム又は直前のP−フレームから予測される。
フレームを直後のフレームから予測することもできる。後のフレームをこのように使用するためには、予測されるフレームよりも前に後のフレームを符号化する必要がある。従って、符号化の順序は、実際のフレームの表示順とは必ずしも一致しない。このようなフレームは、通常2つの方向から、例えば直前のI−又はP−フレームから、或いは予測されるフレームの直後のP−フレームから予測される。これらの双方向に予測されるフレームはB−フレームと呼ばれる。
多くのGOP構造が可能である。一般的なGOP構造は15フレーム長で、I_BB_P_BB_P_BB_P_BB_P_BB_のシーケンスを有する。同様の12フレームシーケンスも一般的である。I−フレームは空間的冗長性を符号化し、P及びB−フレームは時間的冗長性を符号化する。ビデオストリーム内の隣接フレームは相関性が高いことが多いので、P−フレームはI−フレームのサイズの10%、B−フレームはI−フレームのサイズの2%とすることができる。しかしながら、フレームを圧縮できるサイズと、このような圧縮フレームを符号化するのに要する処理時間及びリソースとの間にはトレードオフが存在する。GOP構造内のI、P、及びB−フレームの割合は、ビデオストリームの性質及び出力ストリームに対する帯域幅の制約によって決まるが、符号化時間が問題となる場合もある。B−フレームを多く含むストリームは、I−フレームのみのファイルよりも符号化にかなり長い時間がかかり得るので、このことは、コンピューティングリソースが限定されたライブ送信及びリアルタイム環境において特に当てはまる。
B−フレーム及びP−フレームは、一般に現在のフレームと、前のフレーム、後のフレーム、又はこれらの両方との間の差分のための差分ビットを含むので、ピクチャデータを記憶するのに必要なビットが少なくて済む。従って、B−フレーム及びP−フレームを使用して、フレームにわたって含まれる冗長情報を低減させる。動作中、デコーダは、符号化されたB−フレーム又は符号化されたP−フレームを受信し、前又は後のフレームを使用してオリジナルフレームを再構築する。この処理は、各々のオリジナルフレームを別々に再構築するよりもかなり容易であり、連続するフレームが実質的に同様のものである場合には、フレーム内の差分が小さいのでシーン遷移がよりスムーズになる。
個々のビデオ画像は、1つの輝度(Y)チャネル及び2つのクロミナンスチャネル(色差信号Cb及びCrとも呼ばれる)に分離される。輝度配列及びクロミナンス配列のブロックは、フレーム内符号化の基本単位である「マクロブロック」に編成される。
I−フレームの場合には、実際の画像データが符号化処理を受ける。しかしながら、P−フレーム及びB−フレームは、最初に「動き補償」の処理を受ける。動き補償とは、前のフレームの個々のマクロブロックがどこに動いたかという観点から、連続するフレーム間の差分を表す方法のことである。多くの場合、このような技術を使用して、ビデオ圧縮のためにビデオシーケンスの時間的冗長性を低減させる。P−フレーム又はB−フレーム内の個々のマクロブロックは、エンコーダにより「動き推定」と呼ばれる処理によって得られる「動きベクトル」を使用して選択された場合、高い相関性を有する前の又は次のフレーム内の領域と関連付けられる。現在のマクロブロックを参照フレーム内の相関領域にマッピングする動きベクトルが符号化され、その後2つの領域間の差分が符号化処理を受ける。
従来のビデオコーデックは、動き補償予測を使用して未加工の入力ビデオストリームを効率的に符号化する。現在のフレーム内のマクロブロックは、前のフレーム内の変位したマクロブロックから予測される。オリジナルのマクロブロックとその予測との間の差分が圧縮され、変位(動き)ベクトルと共に送信される。この技術はインター符号化と呼ばれ、MPEG規格で使用される手法である。
M−PEGエンコーダの出力ビットレートは一定であっても又は可変であってもよく、最大ビットレートは再生メディアによって決まる。一定のビットレートを得るためには、量子化の度合いを繰り返し変更して出力ビットレート要件を達成する。量子化を増加させると、ストリームを復号したときにアーチファクトが目立つようになる。ビットレートが減るにつれて、マクロブロックの端部における不連続性がより目立つようになる。
AVC(H.264)規格は、以前の規格が必要としたと思われるよりも実質的に低いビットレートで高品質ビデオをサポートする。この機能性により、非常に幅広い種類のビデオアプリケーションにこの規格を適用できるとともに、幅広い種類のネットワーク及びシステム上で十分に機能できるようになる。MPEGビデオ符号化規格は、正当なMPEGビデオビットストリームを生成するための一般的な符号化方法及びシンタックスについて規定するが、現行の規格は、符号化したビデオデータと共にランダムに取り込んだ高解像度静止画像の符号化及び記憶をサポートしていない。
並行モードで動作するように構成されたコーデックが、低解像度ビデオのAVC符号化と並行して高解像度静止画像ピクチャの符号化及び記憶をサポートするようにするために現行のAVC規格を拡張する。並行モードコーデックは、修正AVC規格に基づいて構成される。コーデックは、AVCビデオストリームを取り込むことができると同時に、高解像度静止画像をビデオストリームに対してランダムな間隔で取り込むことができる。拡張層として記憶される残差情報を使用して、デコーダ側でアップサンプリングされた復号済み低解像度ビデオを使用して1又はそれ以上の高解像度静止画像ピクチャを生成する。基層が低解像度ビデオを搬送する。拡張層及び基層が、多層ストリームとして、送信側のエンコーダから受信側のデコーダへ並行して送信される。
拡張情報を搬送するために、SEIメッセージ定義、シーケンスパラメータセット、及び新規NALユニットのための(単複の)データフィールドを含むようにAVC規格を拡張する。1つの実施形態では、修正シーケンスパラメータセットが、AVCビデオと並行する高解像度静止画像の存在を知らせる新規プロファイルを定義する。新規NALユニットは、予約されたNALユニットタイプを使用して残差情報を記憶することにより、新規デジタル静止画像モードNALを定義する。
1つの態様では、データを符号化する方法について説明する。この方法は、複数の連続するビデオフレームのデータを含むビデオストリームを取り込むステップと、ビデオストリームデータを符号化して符号化ビデオストリームを形成するステップと、1又はそれ以上の静止画像をビデオストリームに対してランダムな時間間隔で取り込むステップと、個々の取り込み静止画像に関連する残差情報パケットを求めるステップとを含み、第1の残差情報パケットは、第1の取り込みオリジナル静止画像と、第1の取り込み静止画像に対応するビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分であり、個々の取り込み静止画像に関連する残差情報パケットを符号化して符号化残差ストリームを形成するステップと、符号化ビデオストリーム及び符号化残差ストリームを多層伝送として並行して送信するステップとをさらに含む。第1の残差情報パケットを求めるステップは、第1の復号ビデオフレームをアップサンプリングして、第1の取り込みオリジナル静止画像と、復号しアップサンプリングした第1のビデオフレームとの間の差分を求めるステップを含むことができる。方法はまた、新規プロファイルインジケータを含む修正シーケンスパラメータセットを定義するステップを含むこともでき、新規プロファイルインジケータは、真(true)のときに1又はそれ以上の静止画像パラメータを伝える静止画像フラグを含み、さらに、個々の静止画像パラメータは、画像高さ及び画像幅のうちの1又はそれ以上などの静止画像の特性を定義する。方法はまた、個々の取り込み静止画像に関連する残差情報パケットを記憶するための新規NALユニットタイプを定義するステップを含むこともできる。方法はまた、多層伝送を受信するステップと、符号化ビデオストリームを復号して複数の連続するビデオフレームを形成するステップと、符号化残差ストリームを復号して、個々の取り込み静止画像に関連する残差情報パケットを形成するステップと、個々の残差情報パケットに対応する個々の復号ビデオフレームをアップサンプリングするステップと、適当な残差情報パケットを、対応する個々のアップサンプリングした復号ビデオフレームに追加して高解像度静止画像の1又はそれ以上を形成するステップとを含むこともできる。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、残差情報パケットのフレームレートとは無関係とすることができる。残差情報パケットを、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化することができる。
別の態様では、データを符号化するためのシステムについて説明する。システムは、複数の連続するビデオフレームのデータを含むビデオストリームを取り込むためのビデオ取込モジュールと、1又はそれ以上の静止画像をビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、第1の取り込み静止画像と、第1の取り込み静止画像に対応するビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分を求めることにより、個々の取り込み静止画像に関連する残差情報パケットを生成するための処理モジュールと、ビデオストリームデータを符号化して符号化ビデオストリームを形成し、個々の取り込み静止画像に関連する残差情報パケットを符号化して符号化残差ストリームを形成するためのエンコーダと、符号化ビデオストリーム及び符号化残差ストリームを多層伝送として並行して送信するための出力モジュールとを含む。エンコーダは、第1の復号ビデオフレームをアップサンプリングして、残差情報パケットが第1の取り込み静止画像とアップサンプリングした復号した第1のビデオフレームとの差分を含むようにするためのアップサンプリングモジュールを含むことができる。処理モジュールはまた、新規プロファイルインジケータを含む修正シーケンスパラメータセットを定義するように構成することもでき、新規プロファイルインジケータは、真(true)のときに1又はそれ以上の静止画像パラメータを伝える静止画像フラグを含み、さらに、個々の静止画像パラメータは、画像高さ及び画像幅のうちの1又はそれ以上などの静止画像の特性を定義する。処理モジュールはまた、個々の取り込み静止画像に関連する残差情報パケットを記憶するためのNALユニットタイプを定義するように構成することもできる。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、残差情報パケットのフレームレートとは無関係とすることができる。残差情報パケットを、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化することができる。
さらに別の態様では、データを復号するためのシステムについて説明する。システムは、符号化ビデオストリーム及び符号化残差ストリームを多層伝送として並行して受信するための受信機と、符号化ビデオストリームを復号することにより複数の連続するビデオフレームを含むデータのビデオストリームを形成するとともに符号化残差ストリームを復号することにより1又はそれ以上の残差情報パケットを形成するためのデコーダとを含み、第1の残差情報パケットは、ビデオストリームの第1の復号アップサンプリングビデオフレームに関連付けられ、第1の残差情報パケットを第1の復号アップサンプリングビデオフレームに追加して第1の静止画像を形成するための処理モジュールをさらに含み、個々の静止画像はビデオストリームに対してランダムな時間間隔で生成される。デコーダは、第1のビデオフレームをアップサンプリングして、復号しアップサンプリングした第1のビデオフレームに第1の残差情報パケットを追加することにより第1の静止画像が生成されるようにするためのアップサンプリングモジュールを含むことができる。デコーダは、新規プロファイルと、1又はそれ以上の静止画像パラメータを伝える静止画像フラグの存在を修正シーケンスパラメータセットから読み取り、処理モジュールは、1又はそれ以上の静止画像パラメータを読み取るようにさらに構成され、個々の静止画像パラメータは、画像高さ及び画像幅のうちの1又はそれ以上などの静止画像の特性を定義する。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、残差情報パケットのフレームレートとは無関係とすることができる。残差情報パケットを、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化することができる。
さらに別の態様では、データを符号化及び復号するためのシステムについて説明する。システムは、複数の連続するビデオフレームのデータを含む第1のビデオストリームを取り込むためのビデオ取込モジュールと、1又はそれ以上の静止画像を第1のビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、第1の取り込み静止画像と、第1の取り込み静止画像に対応する第1のビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分を求めることにより、個々の取り込み静止画像に関連する残差情報パケットを生成するための処理モジュールと、データの第1のビデオストリームを符号化して第1の符号化ビデオストリームを形成するとともに個々の取り込み静止画像に関連する残差情報パケットを符号化して第1の符号化残差ストリームを形成するためのエンコーダと、第1の符号化ビデオストリーム及び第1の符号化残差ストリームを第1の多層伝送として並行して送信するとともに第2の符号化ビデオストリーム及び第2の符号化残差ストリームを第2の多層伝送として並行して受信するためのトランシーバと、第2の符号化ビデオストリームを復号することにより複数の連続するビデオフレームを含むデータの第2のビデオストリームを形成するとともに、第2の符号化残差ストリームを復号することにより1又はそれ以上の残差情報パケットを形成するためのデコーダとを含み、第2の残差情報パケットは、第2のビデオストリームの第2の復号アップサンプリングビデオフレームに関連付けられ、処理モジュールは、第2の残差情報パケットを第2の復号アップサンプリングビデオフレームに追加して高解像度静止画像を形成するようにさらに構成される。
修正AVC規格を使用して高解像度静止画像を記憶するための並行モードを示す図である。 連続モードで動作するように構成された例示的なイメージングシステムのブロック図である。 図2のエンコーダの例示的な処理フローを示す図である。 図2のデコーダの例示的な処理フローを示す図である。
並行モードコーデックの実施形態について、図面のいくつかの図に関連して説明する。必要に応じて及び同一要素が2以上の図面に開示及び図示されている場合に限り、同じ参照数字を使用してこのような同一要素を示す。
図1は、修正AVC規格を使用して、従来どおりに符号化されたAVCビデオと並行して高解像度静止画像を記憶する並行モードを示している。AVCフォーマット済みのビデオストリーム10が一連のビデオフレームを含む。拡張残差ストリーム20が、ランダム間隔で取り込んだ1又はそれ以上の高解像度静止画像30に対応する残差情報を含む。個々の高解像度静止画像31、32、33、34、及び35ごとに、対応する残差情報21、22、23、24、及び25が拡張残差ストリーム20内に存在する。図1には5つの高解像度静止画像を示しているが、5つよりも多くの又は少ない高解像度静止画像を取り込むことができる点を理解されたい。残差情報とは、オリジナルの高解像度静止画像と、対応する復号アップサンプリング低解像度ビデオフレームとの間の差分のことである。
修正AVC規格は、個々の高解像度静止画像をあらゆるランダム間隔で取り込むことができるようにする。換言すれば、残差情報(残差情報21〜25)のフレームレートは、AVCビデオストリーム10のフレームレートに一致する必要はないが、状況によってはこれらのフレームレートが等しい場合もある。残差情報をビデオストリームに対して一定の割合で生成する必要がある従来のコーデックとは対照的に、修正AVC規格に基づいて構成される並行モードコーデックは、このような要件を担うことはない。並行モードコーデックを使用して送信される残差情報は、ビデオストリームのフレームレートとは無関係なフレームレートに基づく。
図2は、並行モードで動作するように構成された例示的なイメージングシステム40のブロック図を示している。イメージングシステム40は、画像取込モジュール42と、コーデック48と、処理モジュール54と、メモリ56と、入出力(I/O)インターフェイス58とを含む。I/Oインターフェイス58は、データを送受信するためのユーザインターフェイス及びネットワークインターフェイスを含む。メモリ56は、一体型又は取り外し可能のいずれかの従来型のデータ記憶媒体である。コーデック48は、エンコーダ50及びデコーダ52を含む。画像取込モジュール42は、低解像度ビデオを取り込むためのビデオ取込モジュール44、及び高解像度静止画像を取り込むための静止画像取込モジュール46を含む。
図3は、図2のエンコーダの例示的な処理フローを示している。エンコーダは、低解像度ビデオストリームのAVC符号化と並行して高解像度静止画像を符号化する。ビデオストリーム10(図1)のような連続するフレームから成る低解像度入力ビデオストリームが取り込まれる。低解像度ビデオストリームは、AVC規格に基づいて符号化される。いずれかのランダムな時点において、高解像度静止画像31〜35(図1)のうちの1又はそれ以上のような高解像度静止画像が取り込まれる。他の時点において、その他の静止画像を取り込むことができる。高解像度静止画像が取り込まれると、オリジナルの高解像度静止画像と、高解像度静止画像を取り込んだ時点に時間的に対応する低解像度AVCビデオストリーム内のアップサンプリングした復号バージョンの特定のビデオフレームとの間の差分に基づいて、対応する残差情報が決定される。個々の高解像度静止画像に対応する残差情報は、AVCのイントラ符号化ツールを使用する修正版のAVC規格を使用して符号化される。取り込んだ高解像度静止画像に関連する残差情報は、新規NALユニットに含まれる。個々の高解像度静止画像ごとの符号化した残差情報が、拡張残差ストリーム20(図1)のような拡張残差ストリームを形成する。符号化した低解像度ビデオフレームが送信されて、AVCビデオストリーム10(図1)のようなAVCビデオストリームを形成する。拡張残差ストリームのフレームレートは、AVCビデオストリームのフレームレートとは無関係である。拡張残差ストリーム及びAVCビデオストリームが足し合わされて多層符号化データストリームを形成し、これがエンコーダからデコーダへ多層伝送として送信される。
デコーダ側では、実質的に逆の動作が行われ、対応するアップサンプリングした復号ビデオフレームに残差情報が加えられる。図4は、図2のデコーダの例示的な処理フローを示している。デコーダは、エンコーダから送信された多層符号化データストリームを受信する(図4)。AVCビデオストリームから拡張残差ストリームが分離される。基層のAVCビデオストリームがAVC符号化に基づいて復号されることにより、低解像度ビデオストリームを形成する。
拡張残差ストリーム内の個々の高解像度静止画像ごとの残差情報が識別され、個々の高解像度静止画像の存在がNALユニットタイプによって知らされる。個々の高解像度静止画像ごとの符号化残差情報が、イントラ符号化ツールを使用する修正AVC規格に基づいて復号される。復号拡張残差ストリームによって表される個々の高解像度静止画像ごとに、復号ビデオストリーム内の対応するビデオフレームがアップサンプリングされる。アップサンプリングされた基層を対応する復号残差情報に追加して、高解像度静止画像を形成する。
エンコーダ及びデコーダの両方におけるアップサンプリング動作は実質的に同様である。一例として、2のアップサンプリング係数による水平及び垂直解像度では、AVCに規定されるように、2分の1画素精度動き推定のためのアップサンプリングフィルタが候補解決策である。また、アップサンプリング係数は2の累乗に限定されるものではなく、同様に分数であってもよい。
既存のAVC規格を修正してこのような高解像度静止画像のランダムな取り込みをサポートするために、既存のAVC規格が、ランダムな時間間隔の拡張情報を可能にするとともに、この拡張情報をデコーダに知らせるように拡張される。シーケンスパラメータセットが特定の時点におけるビデオストリームの特性を定義する。
修正AVC規格は、修正シーケンスパラメータセット(SPS)RBSPシンタックスを含む。1つの実施形態では、修正シーケンスパラメータセットが、新規プロファイルインジケータを定義することにより、ストリーム内に高解像度静止画像が存在することを知らせる。新規プロファイルが存在することによって対応するフラグが示され、このフラグが真(true)のときには高解像度静止画像の幅及び高さを知らせる。以下は、例示的な修正SPS RBSPシンタックスである。
Figure 2011505781
Figure 2011505781
パラメータ「still_pic_width_in_mbs_minus1」+1は、復号した個々の高解像度静止ピクチャの幅をマクロブロック単位で指定する。パラメータ「still_pic_hight_in_map_units_minus1」+1は、高解像度静止ピクチャの復号フレームのスライスグループマップ単位での高さを指定する。
修正AVC規格はまた、拡張層情報のための修正NALユニットシンタックスも含む。このような修正NALユニットシンタックスをサポートするために、予約されたNALユニットタイプの1つを使用して、高解像度静止画像ピクチャの拡張層情報を記憶する。
修正AVC規格はまた、アクセスユニット内に高解像度静止画像ピクチャの「残差情報」が存在することを知らせるためのSEIメッセージ定義も含む。高解像度静止画像ピクチャの残差情報は、上述したように「拡張層情報」として新規NALユニットタイプに記憶される。
デコーダが、符号化ビデオストリームから高解像度静止画像ピクチャのみを構文解析/表示するように指示された場合、デコーダは、全てのアクセスユニット内の全てのNALユニットヘッダを構文解析して、アクセスユニットが拡張NALユニットタイプを含むかどうかを判定する。これを克服するために、SEIメッセージタイプが定義され、これが、アクセスユニット内に存在する場合には、この特定の静止画像ピクチャの拡張層情報が存在することを知らせる。SEIメッセージは、アクセスユニット内の最初に符号化されるピクチャよりも前に発生するので、デコーダは、アクセスユニット内に高解像度静止画像ピクチャが存在することについて事前に知らされる。
修正AVC規格は、高解像度静止画像ピクチャのSEIメッセージシンタックスを含む。以下は、例示的な高解像度静止画像ピクチャのSEIメッセージシンタックスである。
Figure 2011505781
パラメータ「hiresolution_pisture_present_flag」が1に等しい場合、これが、アクセスユニット内に高解像度静止画像ピクチャが存在することを知らせる。
修正シーケンスパラメータセット及びSEIメッセージ定義を定義するための上記で使用したシンタックスは例示を目的とするものである点、及び代替のシンタックスを使用して修正シーケンスパラメータセット及びSEIメッセージ定義を行うことができる点を理解されたい。
本発明の構成及び動作の原理の理解を容易にするために、詳細を含む特定の実施形態に関連して本発明について説明した。本明細書における、このような特定の実施形態及びこれらの詳細の参照は、添付の特許請求の範囲を限定することを意図するものではない。当業者には、本発明の思想及び範囲から逸脱することなく、例示のために選択した実施形態に修正を加えることができる点が明らかであろう。
10 AVCビデオストリーム
20 拡張残差ストリーム
30 高解像度静止画像
21〜25 残差情報
31〜35 高解像度静止画像

Claims (25)

  1. データを符号化する方法であって、
    a.複数の連続するビデオフレームのデータを含むビデオストリームデータを取り込むステップと、
    b.前記ビデオストリームデータを符号化して符号化ビデオストリームを形成するステップと、
    c.1又はそれ以上の静止画像を前記ビデオストリームに対してランダムな時間間隔で取り込むステップと、
    d.個々の取り込み静止画像に関連する残差情報パケットを求めるステップと、
    を含み、第1の残差情報パケットは、第1の取り込みオリジナル静止画像と、該第1の取り込み静止画像に対応する前記ビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分であり、
    e.個々の取り込み静止画像に関連する前記残差情報パケットを符号化して符号化残差ストリームを形成するステップと、
    f.前記符号化ビデオストリーム及び前記符号化残差ストリームを多層伝送として並行して送信するステップと、
    をさらに含むことを特徴とする方法。
  2. 前記第1の残差情報パケットを求めるステップが、前記第1の復号ビデオフレームをアップサンプリングして、前記第1の取り込みオリジナル静止画像と、復号しアップサンプリングした前記第1のビデオフレームとの間の差分を求めるステップを含む、
    ことを特徴とする請求項1に記載の方法。
  3. 新規プロファイルインジケータを含む修正シーケンスパラメータセットを定義するステップを含み、前記新規プロファイルインジケータは、静止画像フラグを含み,
    当該静止画像フラグが真(true)のときに1又はそれ以上の静止画像パラメータを示し、さらに、個々の静止画像パラメータは、前記静止画像の特性、例えば、画像高さ及び画像幅のうちの1又はそれ以上を定義する、
    ことを特徴とする請求項1に記載の方法。
  4. 個々の取り込み静止画像に関連する前記残差情報パケットを記憶するための新規NALユニットタイプを定義するステップをさらに含む、
    ことを特徴とする請求項1に記載の方法。
  5. a.前記多層伝送を受信するステップと、
    b.前記符号化ビデオストリームを復号して前記複数の連続するビデオフレームを形成するステップと、
    c.前記符号化残差ストリームを復号して、個々の取り込み静止画像に関連する前記残差情報パケットを形成するステップと、
    d.個々の残差情報パケットに対応する個々の復号ビデオフレームをアップサンプリングするステップと、
    d.前記適当な残差情報パケットを、対応する個々のアップサンプリングした復号ビデオフレームに追加して前記高解像度静止画像の1又はそれ以上を形成するステップと、
    をさらに含むことを特徴とする請求項1に記載の方法。
  6. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項1に記載の方法。
  7. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項1に記載の方法。
  8. 前記ビデオストリームのフレームレートが、前記残差情報パケットのフレームレートとは無関係である、
    ことを特徴とする請求項1に記載の方法。
  9. 前記残差情報パケットが、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項1に記載の方法。
  10. データを符号化するためのシステムであって、
    a.複数の連続するビデオフレームデータを含むビデオストリームデータを取り込むためのビデオ取込モジュールと、
    b.1又はそれ以上の静止画像を前記ビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、
    c.第1の取り込み静止画像と、前記第1の取り込み静止画像に対応する前記ビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分を求めることにより、個々の取り込み静止画像に関連する残差情報パケットを生成するための処理モジュールと、
    d.前記ビデオストリームデータを符号化して符号化ビデオストリームを形成し、個々の取り込み静止画像に関連する前記残差情報パケットを符号化して符号化残差ストリームを形成するためのエンコーダと、
    e.前記符号化ビデオストリーム及び前記符号化残差ストリームを多層伝送として並行して送信するための出力モジュールと、
    を含むことを特徴とするシステム。
  11. 前記エンコーダが、前記第1の復号ビデオフレームをアップサンプリングして、前記残差情報パケットが前記第1の取り込み静止画像とアップサンプリングし復号した前記第1のビデオフレームとの前記差分を含むようにするためのアップサンプリングモジュールを含む、
    ことを特徴とする請求項10に記載のシステム。
  12. 前記処理モジュールが、新規プロファイルインジケータを含む修正シーケンスパラメータセットを定義するようにさらに構成され、前記新規のプロファイルインジケータは、静止画像フラグを含み、当該静止画像フラグが真(true)のときに1又はそれ以上の静止画像パラメータを示し、さらに、個々の静止画像パラメータが、前記静止画像の特性、例えば、画像高さ及び画像幅のうちの1又はそれ以上を定義する、
    ことを特徴とする請求項10に記載のシステム。
  13. 前記処理モジュールが、個々の取り込み静止画像に関連する前記残差情報パケットを記憶するためのNALユニットタイプを定義するようにさらに構成される、
    ことを特徴とする請求項10に記載のシステム。
  14. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項10に記載のシステム。
  15. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項10に記載のシステム。
  16. 前記ビデオストリームのフレームレートが、前記残差情報パケットのフレームレートとは無関係である、
    ことを特徴とする請求項10に記載のシステム。
  17. 前記残差情報パケットが、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項10に記載のシステム。
  18. データを復号するためのシステムであって、
    a.符号化ビデオストリーム及び符号化残差ストリームを多層伝送として並行して受信するための受信機と、
    b.前記符号化ビデオストリームを復号することにより複数の連続するビデオフレームを含むビデオストリームデータを形成するとともに前記符号化残差ストリームを復号することにより1又はそれ以上の残差情報パケットを形成するためのデコーダと、
    を含み、第1の残差情報パケットが、前記ビデオストリームの第1の復号アップサンプリングビデオフレームに関連付けられ、
    c.前記第1の残差情報パケットを前記第1の復号アップサンプリングビデオフレームに追加して第1の静止画像を形成するための処理モジュールをさらに含み、個々の静止画像が前記ビデオストリームに対してランダムな時間間隔で生成される、
    ことを特徴とするシステム。
  19. 前記デコーダが、前記第1のビデオフレームをアップサンプリングして、復号しアップサンプリングした前記第1のビデオフレームに前記第1の残差情報パケットを追加することにより前記第1静止画像が生成されるようにするためのアップサンプリングモジュールを含む、
    ことを特徴とする請求項18に記載のシステム。
  20. 前記デコーダが、新規プロファイルと、1又はそれ以上の静止画像パラメータを示す静止画像フラグとの存在を修正シーケンスパラメータセットから読み取り、前記処理モジュールが、前記1又はそれ以上の静止画像パラメータを読み取るようにさらに構成され、個々の静止画像パラメータが、前記静止画像の特性、例えば、画像高さ及び画像幅のうちの1又はそれ以上を定義する、
    ことを特徴とする請求項18に記載のシステム。
  21. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項18に記載のシステム。
  22. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項18に記載のシステム。
  23. 前記ビデオストリームのフレームレートが、前記残差情報パケットのフレームレートとは無関係である、
    ことを特徴とする請求項18に記載のシステム。
  24. 前記残差情報パケットが、AVC規格のイントラ符号化ツールを使用する修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項18に記載のシステム。
  25. データを符号化及び復号するためのシステムであって、
    a.複数の連続するビデオフレームデータを含む第1のビデオストリームデータを取り込むためのビデオ取込モジュールと、
    b.1又はそれ以上の静止画像を前記第1のビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、
    c.第1の取り込み静止画像と、前記第1の取り込み静止画像に対応する前記第1のビデオストリームの第1の復号アップサンプリングビデオフレームとの間の差分を求めることにより、個々の取り込み静止画像に関連する残差情報パケットを生成するための処理モジュールと、
    d.データの前記第1のビデオストリームを符号化して第1の符号化ビデオストリームを形成するとともに個々の取り込み静止画像に関連する前記残差情報パケットを符号化して第1の符号化残差ストリームを形成するためのエンコーダと、
    e.前記第1の符号化ビデオストリーム及び前記第1符号化残差ストリームを第1の多層伝送として並行して送信するとともに第2の符号化ビデオストリーム及び第2の符号化残差ストリームを第2の多層伝送として並行して受信するためのトランシーバと、
    f.前記第2の符号化ビデオストリームを復号することにより複数の連続するビデオフレームを含むデータの第2のビデオストリームデータを形成するとともに、前記第2の符号化残差ストリームを復号することにより1又はそれ以上の残差情報パケットを形成するためのデコーダと、
    を含み、第2の残差情報パケットが、前記第2ビデオストリームの第2の復号アップサンプリングビデオフレームに関連付けられ、
    前記処理モジュールが、前記第2の残差情報パケットを前記第2の復号アップサンプリングビデオフレームに追加して高解像度静止画像を形成するようにさらに構成される、
    ことを特徴とするシステム。
JP2010536905A 2007-12-04 2008-11-07 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張 Withdrawn JP2011505781A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/999,297 US20090141809A1 (en) 2007-12-04 2007-12-04 Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in parallel with video
PCT/US2008/012657 WO2009073077A1 (en) 2007-12-04 2008-11-07 An extension to the avc standard to support the encoding and storage of high resolution digital still pictures in parallel with video

Publications (1)

Publication Number Publication Date
JP2011505781A true JP2011505781A (ja) 2011-02-24

Family

ID=40675685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010536905A Withdrawn JP2011505781A (ja) 2007-12-04 2008-11-07 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張

Country Status (4)

Country Link
US (1) US20090141809A1 (ja)
JP (1) JP2011505781A (ja)
CN (1) CN101878649A (ja)
WO (1) WO2009073077A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090217338A1 (en) * 2008-02-25 2009-08-27 Broadcom Corporation Reception verification/non-reception verification of base/enhancement video layers
US8539092B2 (en) * 2008-07-09 2013-09-17 Apple Inc. Video streaming using multiple channels
US20100008419A1 (en) * 2008-07-10 2010-01-14 Apple Inc. Hierarchical Bi-Directional P Frames
KR20100123075A (ko) * 2009-05-14 2010-11-24 삼성전자주식회사 화상통화 시스템에서 스케일러빌리티 기법을 지원하기 위한 장치 및 방법
US8548062B2 (en) * 2010-07-16 2013-10-01 Sharp Laboratories Of America, Inc. System for low resolution power reduction with deblocking flag
EP2609744A4 (en) * 2010-08-26 2017-07-19 NXP USA, Inc. Video processing system and method for parallel processing of video data
GB2492397A (en) * 2011-06-30 2013-01-02 Canon Kk Encoding and decoding residual image data using probabilistic models
US10944994B2 (en) * 2011-06-30 2021-03-09 Telefonaktiebolaget Lm Ericsson (Publ) Indicating bit stream subsets
US9451284B2 (en) 2011-10-10 2016-09-20 Qualcomm Incorporated Efficient signaling of reference picture sets
US9503497B2 (en) * 2011-12-10 2016-11-22 LogMeln, Inc. Optimizing transfer to a remote access client of a high definition (HD) host screen image
KR102096566B1 (ko) 2012-04-13 2020-04-02 지이 비디오 컴프레션, 엘엘씨 저지연 화상 코딩
EA201492098A1 (ru) * 2012-05-14 2015-04-30 Лука Россато Кодирование и декодирование на основании смешивания последовательностей выборок с течением времени
CA3095638C (en) 2012-06-29 2023-11-14 Ge Video Compression, Llc Video data stream concept
CN102801980B (zh) * 2012-08-09 2016-01-20 芯原微电子(北京)有限公司 一种用于可伸缩视频编码的解码装置和方法
US10063757B2 (en) * 2012-11-21 2018-08-28 Infineon Technologies Ag Dynamic conservation of imaging power
BR112015011914A2 (pt) * 2012-11-30 2017-07-11 Sony Corp dispositivo e método de processamento de imagem
CN105580369B (zh) * 2013-03-11 2019-04-26 杜比实验室特许公司 使用分层编码对多格式高动态范围视频进行编解码的方法、装置及系统
GB2516224A (en) * 2013-07-11 2015-01-21 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
US9094667B1 (en) * 2013-10-31 2015-07-28 Electronic Arts Inc. Encoding of computer-generated video content
CN112887737B (zh) * 2014-01-03 2024-04-02 康普英国有限公司 用于hevc扩展处理的条件解析扩展语法
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
US10616583B2 (en) * 2016-06-30 2020-04-07 Sony Interactive Entertainment Inc. Encoding/decoding digital frames by down-sampling/up-sampling with enhancement information
CA3069106A1 (en) * 2017-07-20 2019-01-24 Sony Corporation Transmission device, transmission method, reception device, and reception method
EP3474550A1 (en) * 2017-10-20 2019-04-24 Thomson Licensing Stereo omnidirectional frame packing
CN117857812A (zh) * 2018-02-20 2024-04-09 弗劳恩霍夫应用研究促进协会 支持变化的分辨率和/或有效地处理区域级打包的图片/视频编码
CN112262581A (zh) 2018-03-21 2021-01-22 华为技术有限公司 视频码流中的约束标志指示
KR102525576B1 (ko) * 2018-10-19 2023-04-26 삼성전자주식회사 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
GB2597860B (en) * 2019-03-20 2023-07-26 V Nova Int Ltd Rate control for a video encoder
CN112073721B (zh) * 2020-10-10 2024-02-27 绍兴文理学院 一种高效率的非i帧图像编解码方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7095783B1 (en) * 1992-06-30 2006-08-22 Discovision Associates Multistandard video decoder and decompression system for processing encoded bit streams including start codes and methods relating thereto
US6937273B1 (en) * 1997-05-28 2005-08-30 Eastman Kodak Company Integrated motion-still capture system with indexing capability
US6665453B2 (en) * 1999-03-16 2003-12-16 Intel Corporation Multi-resolution support for video images
US7383288B2 (en) * 2001-01-11 2008-06-03 Attune Systems, Inc. Metadata based file switch and switched file system
GB2372165A (en) * 2001-02-10 2002-08-14 Hewlett Packard Co A method of selectively storing images
US6961083B2 (en) * 2001-12-21 2005-11-01 Hewlett-Packard Development Company, L.P. Concurrent dual pipeline for acquisition, processing and transmission of digital video and high resolution digital still photographs
AU2003241143A1 (en) * 2002-06-25 2004-01-06 Quix Technologies Ltd. Image processing using probabilistic local behavior assumptions
EP1554883A1 (en) * 2002-10-15 2005-07-20 Koninklijke Philips Electronics N.V. System and method for transmitting scalable coded video over an ip network
US6937723B2 (en) * 2002-10-25 2005-08-30 Avaya Technology Corp. Echo detection and monitoring
JP2005203905A (ja) * 2004-01-13 2005-07-28 Sony Corp 画像符号化装置、画像符号化方法並びに画像符号化プログラム
US20050235047A1 (en) * 2004-04-16 2005-10-20 Qiang Li Method and apparatus for a large scale distributed multimedia streaming system and its media content distribution
US9208824B2 (en) * 2004-05-18 2015-12-08 Broadcom Corporation Index table generation in PVR applications for AVC video streams
US7792190B2 (en) * 2004-09-09 2010-09-07 Media Tek Singapore Pte Ltd. Inserting a high resolution still image into a lower resolution video stream
KR100679031B1 (ko) * 2004-12-03 2007-02-05 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
DE102005001287A1 (de) * 2005-01-11 2006-07-20 Siemens Ag Verfahren und Vorrichtung zur Verarbeitung von skalierbaren Daten
US7876833B2 (en) * 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
US8693538B2 (en) * 2006-03-03 2014-04-08 Vidyo, Inc. System and method for providing error resilience, random access and rate control in scalable video communications
US7705889B2 (en) * 2007-06-15 2010-04-27 Sony Corporation Shutter time compensation

Also Published As

Publication number Publication date
US20090141809A1 (en) 2009-06-04
WO2009073077A1 (en) 2009-06-11
CN101878649A (zh) 2010-11-03

Similar Documents

Publication Publication Date Title
JP2011505781A (ja) 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張
US8170097B2 (en) Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
US7705889B2 (en) Shutter time compensation
US7379501B2 (en) Differential coding of interpolation filters
US7961786B2 (en) Signaling field type information
US8107531B2 (en) Signaling and repeat padding for skip frames
US20150312575A1 (en) Advanced video coding method, system, apparatus, and storage medium
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
US7899121B2 (en) Video encoding method, video encoder, and personal video recorder
US7822123B2 (en) Efficient repeat padding for hybrid video sequence with arbitrary video resolution
US7839933B2 (en) Adaptive vertical macroblock alignment for mixed frame video sequences
US20080152002A1 (en) Methods and apparatus for scalable video bitstreams
Akramullah et al. Video Coding Standards
Igarta A study of MPEG-2 and H. 264 video coding
Akujuobi Application of Wavelets to Video Compression
Arora et al. A Review on Different Video Coding Standards
CN117426092A (zh) 用于在视频编码的帧内预测模式下确定色度样本的系统和方法
JP2008118694A (ja) ディジタル信号変換方法およびディジタル信号変換装置
Premshankar Efficient Video Compression Schemes by applying the DCT approach
Gajjala Efficient HEVC Loss Less Coding Using Sample Based Angular Intra Prediction (SAP)
JP2002536926A (ja) 画像領域を変換する方法および装置
JPH11252561A (ja) 動画像復号化方法
Buchanan et al. Motion Video Compression
MXPA06009733A (es) Metodo y sistema de codificacion digital de imagenes de video 3d estereoscopicas.
JP2008109701A (ja) ディジタル信号変換方法およびディジタル信号変換装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120110