JP2011505780A - 高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張 - Google Patents

高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張 Download PDF

Info

Publication number
JP2011505780A
JP2011505780A JP2010536904A JP2010536904A JP2011505780A JP 2011505780 A JP2011505780 A JP 2011505780A JP 2010536904 A JP2010536904 A JP 2010536904A JP 2010536904 A JP2010536904 A JP 2010536904A JP 2011505780 A JP2011505780 A JP 2011505780A
Authority
JP
Japan
Prior art keywords
video
individual
still images
still image
data stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010536904A
Other languages
English (en)
Inventor
アリ タバタバイ
モハメド ズバイル ヴィシャラム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2011505780A publication Critical patent/JP2011505780A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

コーデックが、低解像度ビデオのAVC符号化内で高解像度静止画像ピクチャの符号化をサポートするようにするためにAVC規格を拡張する。コーデックは、AVCビデオストリームを取り込むことができると同時に、高解像度静止画像をビデオストリームに対してランダムな間隔で取り込むことができる。個々の取り込み高解像度静止画像が、ビデオストリーム内に単層ビットストリームとして埋め込まれる。個々の埋め込み高解像度静止画像は、符号化したビデオシーケンス内における新規GOPの開始を知らせ、又は強制する。AVC規格が、シーケンスパラメータセットのための新しいシンタックスを含むように拡張される。1つの実施形態では、修正シーケンスパラメータセットが、AVCビデオに連なって高解像度静止画像が存在することを知らせる新規プロファイルを定義する。
【選択図】図1

Description

本発明は、ビデオ符号化の分野に関する。より具体的には、本発明は、AVC符号化の分野、及び現行のAVC規格を拡張して、高解像度デジタル静止画像を従来どおりに符号化されたAVCビデオストリームとともに統合連続モードで符号化及び記憶するのをサポートすることに関する。
「コーデック」という用語は、「コンプレッサ/デコンプレッサ」、「コーダ/デコーダ」、又は「圧縮/解凍アルゴリズム」のいずれかを意味し、データストリーム又は信号に対して変換を行うことができる装置又はアルゴリズム、或いは専門のコンピュータプログラムを表す。
コーデックは、データストリーム又は信号を送信、記憶、又は暗号化のために符号化し、これを閲覧又は編集のために復号する。例えば、デジタルビデオカメラはアナログ信号をデジタル信号に変換し、次にこの信号がデジタル送信又は記憶のためにビデオコンプレッサを通過する。その後、受信装置が、ビデオデコンプレッサを介して受信信号を解凍し、解凍されたデジタル信号が表示のためにアナログ信号に変換される。オーディオ信号に対しても同様の処理を行うことができる。標準的なコーデックスキームは数多く存在する。中には、主にファイル転送時間を最小化するために使用されるものがあり、インターネット上で利用される。また中には、所定量のディスクスペース又はCD−ROM上に記憶できるようにデータを最小化することを目的とするものもある。個々のコーデックスキームには、異なるプログラム、処理、又はハードウェアによって対処することができる。
デジタル画像は、2次元画像を画素又はピクセルと呼ばれるデジタル値の有限集合として表現したものである。通常、ピクセルは、整数の2次元配列であるラスタ画像又はラスタマップとしてコンピュータメモリに記憶される。これらの値は、多くの場合圧縮形式で送信又は記憶される。
デジタルカメラ及びビデオカメラ、スキャナ、座標測定機、地震観測プロファイリング、航空機搭載レーダー、及びその他などの様々な入力装置及び技術によってデジタル画像を生成することができる。数学関数又は3次元幾何学モデルなどの任意の非画像データからデジタル画像を合成することもでき、後者はコンピュータグラフィックスの主な下位区分である。デジタル画像処理の分野には、デジタル画像に対して画像処理を行うためのアルゴリズムの研究又は使用がある。画像コーデックは、このようなデジタル画像処理を行うためのアルゴリズムを含む。
画像を見るためには、画像フォーマットに応じて異なる画像コーデックを利用する。GIF、JPEG、及びPNG画像は、標準的なインターネット画像フォーマットなので、ウェブブラウザを使用して簡単に見ることができる。現在、ウェブではSVGフォーマットが広く使用されており、これは標準的W3Cフォーマットである。その他のプログラムには、ある順序で順々に自動的に画像を見るためのスライドショーの利用性を提供するものもある。
静止画像は、ビデオとは異なる特性を有する。例えば、アスペクト比及び色が異なる。従って、静止画像はビデオとは異なって処理されるので、静止画像用の静止画像コーデックと、静止画像コーデックとは異なるビデオ用のビデオコーデックとが必要になる。
ビデオコーデックには、デジタルビデオデータに対してデータ圧縮技術を使用できるようにする装置又はソフトウェアモジュールがある。ビデオシーケンスは、一般にフレームと呼ばれる数多くのピクチャ(デジタル画像)から成る。後続するフレームは非常に類似しており、従って1つのフレームから次のフレームにかけて多くの冗長性を含む。ビデオデータは、帯域幅及びメモリの両方を節約するために圧縮されてから、チャネルを介して効率的に送信され、又はメモリに記憶される。ビデオ圧縮の目的は、フレーム内(空間的冗長性)及びフレーム間(時間的冗長性)の両方における冗長性を除去して、より良い圧縮比を得ることである。ビデオ品質、これを表すのに必要なデータ量(ビットレートとしても知られる)、符号化及び復号アルゴリズムの複雑性、データ損失及びエラーに対するこれらのロバスト性、編集し易さ、ランダムアクセス、エンドツーエンド遅延、及び数多くのその他の要因の間には複雑なバランスが存在する。
典型的なデジタルビデオコーデックの設計は、入力ビデオをRGBカラーフォーマットからYCbCrカラーフォーマットに変換することから開始し、その後クロマサブサンプリングを行ってサンプリンググリッドパターンを生成することが多い。YCbCrカラーフォーマットへの変換は、カラー信号を無相関化して、知覚的にあまり重要でないクロマ信号から知覚的により重要な輝度信号を分離することにより、圧縮性を改善するとともに低解像度での表示を行うことができる。
一定量の空間的及び時間的ダウンサンプリングを使用して、基本符号化処理の前に未加工データ量を低減させることができる。ダウンサンプリングとは、信号のサンプリングレートを下げる処理のことである。これは、一般にデータ量又はデータのサイズを低減させるために行われる。通常、ダウンサンプリング係数は1よりも大きな整数又は有理分数である。次に、周波数変換を使用してこのデータを変換し、空間データをさらに無相関化する。1つのこのような変換が離散コサイン変換(DCT)である。次に、変換の出力を量子化して、量子化された値にエントロピー符号化を適用する。エンコーダによっては、例えば2パスなどのnパス符号化と呼ばれる多段処理でビデオを圧縮できるものもあり、これは一般により低速な処理ではあるが、より優れた品質の圧縮をもたらす可能性がある。
復号処理は、基本的に符号化処理の各段階の反転を行うことから成る。厳密に反転できない1つの段階が量子化段階である。ここでは、反転に最大限近似したものが行われる。この処理の部分は「反転量子化」又は「逆量子化」と呼ばれることがあるが、量子化は本質的に非可逆処理である。
様々なコーデックをPC上及び家電機器内で容易に実施することができる。同じ製品内で複数のコーデックを利用できることも多く、互換性の理由から1つの優位なコーデックを選択する必要がないようになっている。
いくつかの広く使用されているビデオコーデックとして、以下に限定されるわけではないが、H.261、MPEG−1 Part2、MPEG−2 Part2、H.263、MPEG−4 Part2、MPEG−4 Part10/AVC、DivX、XviD、3ivx、Sorenson3、及びWindows Media Video(MWV)が挙げられる。
H.261は、主に旧型のテレビ会議及びテレビ電話製品で使用される。H.261は、最初の実用的なデジタルビデオ圧縮規格であった。基本的に、それ以降の全ての標準的なビデオコーデック設計がH.261に基づいている。H.261は、YCbCrカラー表現、4:2:0サンプリングフォーマット、8ビットサンプル精度、16×16マクロブロック、ブロック単位の動き補償、8×8ブロック単位の離散コサイン変換、ジグザグ係数走査、スカラ量子化、run+valueのシンボルマッピング、及び可変長符号化のような十分に確立した概念を含んでいた。H.261は、順次走査ビデオのみをサポートした。
MPEG−1 Part2はビデオCD(VCD)に使用され、オンラインビデオに使用されることもある。品質は、VHSの品質とほぼ同程度である。元となるビデオ品質が良好でビットレートが十分に高い場合、VCDはVHSよりも良好に見えるが、これには高いビットレートが必要となる。世界中のほとんど全てのコンピュータがこのコーデックを再生できるので、VCDは、あらゆるデジタルビデオ/オーディオシステムの最高の互換性を有する。技術設計の面では、MPEG−1のH.261に対する最も大きな強化点は、2分の1画素精度双予測動き補償のサポートであった。MPEG−1は、順次走査ビデオのみをサポートした。
MPEG−2 Part2は、H.262との共通テキスト規格であり、DVD上及びほとんどのデジタルビデオ放送及びケーブル配信システムで使用される。標準的なDVD上で使用した場合、MPEG−2 Part2は良好な画質を提供するとともにワイド画面をサポートする。技術設計の面では、MPEG−2のMPEG−1に対する最も大きな強化点は、インターレースビデオのサポートの追加であった。MPEG−2は古いコーデックと見なされるが、市場で幅広く受け入れられており、実使用数が非常に多い。
H.263は、主にテレビ会議、テレビ電話、及びインターネットビデオに使用される。H.263は、順次走査ビデオのための標準化された圧縮機能において大きな前進を示した。特に、低ビットレートにおいて、H.263は、所定のレベルのフィデリティに達するのに必要なビットレートにおいてかなりの改善をもたらすことができた。
MPEG−4 Part2は、インターネット、ブロードキャストに、及び記憶媒体上で使用できるMPEG規格である。MPEG−4 Part2は、MPEG−2及びH.263の初版に対して改善された品質を提供する。MPEG−4 Part2の先行するコーデック規格を超える主な技術的特徴は、オブジェクト志向の符号化特性で構成されていた。MPEG−4 Part2はまた、H.263で開発された能力を取り入れること、及び4分の1画素精度動き補償などの新しい機能を追加することの両方により、いくつかの圧縮能力の強化を含んでいた。MPEG−4 Part2は、MPEG−2のように順次走査及びインターレースビデオの両方をサポートする。
MPEG−4 Part10は、ITU−TのH.264と技術的に並ぶ規格であり、AVCと呼ばれることが多い。MPEG−4 Part10は、圧縮機能に数多くの大幅な進歩を含み、最近数多くの企業製品に採用されてきた。
DivX、XviD、及び3ivxは、基本的にMPEG−4 Part2ビデオコーデックを使用するビデオコーデックパッケージであり、*.avi、*.mp4、*.ogm、又は*.mkvのファイルコンテナフォーマットを有する。Sorenson3は、一般にApple社のQuickTimeによって使用されるコーデックであり、基本的にはH.264の原型である。ウェブ上で見られるQuickTimeムービーの予告編の多くがこのコーデックを使用する。WMV(Windows Media Video)は、Microsoft社のビデオコーデック設計のファミリであり、WMV7、WMV8、及びWMV9を含む。WMVは、M−PEG4コーデック設計の1つのバージョンと見なすことができる。
MPEGコーデックは、動画及び関連音声の汎用符号化に使用される。MPEGビデオコーデックは、従来より一連の3種類の符号化データフレームから構成される圧縮ビデオビットストリームを生成する。この3種類のデータフレームは、イントラフレーム(I−フレーム又はI−ピクチャと呼ばれる)、双方向予測フレーム(B−フレーム又はB−ピクチャと呼ばれる)、及び前方予測フレーム(P−フレーム又はP−ピクチャと呼ばれる)と呼ばれる。これらの3種類のフレームは、GOP(Group Of Pictures)と呼ばれる特定の順序で配列することができる。I−フレームは、ピクチャを再構成するのに必要な全ての情報を含む。I−フレームは、動き補償を伴わない標準画像として符号化される。この一方で、P−フレームは前のフレームからの情報を使用して、及びB−フレームは前のフレーム、次のフレーム、又はこれらの両方からの情報を使用してピクチャを再構成する。すなわち、P−フレームは、先行するI−フレーム又は直前のP−フレームから予測される。
フレームを直後のフレームから予測することもできる。後のフレームをこのように使用するためには、予測されるフレームよりも前に後のフレームを符号化する必要がある。従って、符号化の順序は、実際のフレームの表示順とは必ずしも一致しない。このようなフレームは、通常2つの方向から、例えば直前のI−又はP−フレームから、或いは予測されるフレームの直後のP−フレームから予測される。これらの双方向に予測されるフレームはB−フレームと呼ばれる。
多くのGOP構造が可能である。一般的なGOP構造は15フレーム長で、I_BB_P_BB_P_BB_P_BB_P_BB_のシーケンスを有する。同様の12フレームシーケンスも一般的である。I−フレームは空間的冗長性を符号化し、P及びB−フレームは時間的冗長性を符号化する。ビデオストリーム内の隣接フレームは相関性が高いことが多いので、P−フレームはI−フレームのサイズの10%、B−フレームはI−フレームのサイズの2%とすることができる。しかしながら、フレームを圧縮できるサイズと、このような圧縮フレームを符号化するのに要する処理時間及びリソースとの間にはトレードオフが存在する。GOP構造内のI、P、及びB−フレームの割合は、ビデオストリームの性質及び出力ストリームに対する帯域幅の制約によって決まるが、符号化時間が問題となる場合もある。B−フレームを多く含むストリームは、I−フレームのみのファイルよりも符号化にかなり長い時間がかかり得るので、このことは、コンピューティングリソースが限定された生送信及びリアルタイム環境において特に当てはまる。
B−フレーム及びP−フレームは、一般に現在のフレームと、前のフレーム、後のフレーム、又はこれらの両方との間の差分のための差分ビットを含むので、ピクチャデータを記憶するのに必要なビットが少なくて済む。従って、B−フレーム及びP−フレームを使用して、フレームを越えて含まれる冗長情報を低減させる。動作中、デコーダは、符号化されたB−フレーム又は符号化されたP−フレームを受信し、前又は後のフレームを使用してオリジナルフレームを再構築する。この処理は、各々のオリジナルフレームを別々に再構築するよりもかなり容易であり、連続するフレームが実質的に同様のものである場合には、フレーム内の差分が小さいのでシーン遷移がよりスムーズになる。
個々のビデオ画像は、1つの輝度(Y)チャネル及び2つのクロミナンスチャネル(色差信号Cb及びCrとも呼ばれる)に分離される。輝度配列及びクロミナンス配列のブロックは、フレーム内符号化の基本単位である「マクロブロック」に編成される。
I−フレームの場合には、実際の画像データが符号化処理を受ける。しかしながら、P−フレーム及びB−フレームは、最初に「動き補償」の処理を受ける。動き補償とは、前のフレームの個々のマクロブロックがどこに動いたかという観点から、連続するフレーム間の差分を表す方法のことである。多くの場合、このような技術を使用して、ビデオ圧縮のためにビデオシーケンスの時間的冗長性を低減させる。P−フレーム又はB−フレーム内の個々のマクロブロックは、エンコーダにより「動き推定」と呼ばれる処理によって得られる「動きベクトル」を使用して選択された場合、高い相関性を有する前の又は次のフレーム内の領域と関連付けられる。現在のマクロブロックを参照フレーム内の相関領域にマッピングする動きベクトルが符号化され、その後2つの領域間の差分が符号化処理を受ける。
従来のビデオコーデックは、動き補償した予測を使用して未加工の入力ビデオストリームを効率的に符号化する。現在のフレーム内のマクロブロックは、前のフレーム内の変位したマクロブロックから予測される。オリジナルのマクロブロックとその予測との間の差分が圧縮され、変位(動き)ベクトルと共に送信される。この技術はインター符号化と呼ばれ、MPEG規格で使用される手法である。
M−PEGエンコーダの出力ビットレートは一定であっても又は可変であってもよく、最大ビットレートは再生メディアによって決まる。一定のビットレートを得るためには、量子化の度合いを繰り返し変更して出力ビットレート要件を達成する。量子化を増加させると、ストリームを復号したときにアーチファクトが目立つようになる。ビットレートが減るにつれて、マクロブロックの端部における不連続性がより目立つようになる。
AVC(H.264)規格は、以前の規格が必要としたと思われるよりも実質的に低いビットレートで高品質ビデオをサポートする。この機能性により、非常に幅広い種類のビデオアプリケーションにこの規格を適用できるとともに、幅広い種類のネットワーク及びシステム上で十分に機能できるようになる。MPEGビデオ符号化規格は、正当なMPEGビデオビットストリームを生成するための一般的な符号化方法及びシンタックスについて規定するが、現行の規格は、符号化したビデオデータと共にランダムに取り込んだ高解像度静止画像の符号化及び記憶をサポートしていない。
順次モードで動作するように構成されたコーデックが、低解像度ビデオのAVC符号化内で高解像度静止画像ピクチャの符号化をサポートするようにするために現行のAVC規格を拡張する。順次モードコーデックは、修正AVC規格に基づいて構成される。コーデックは、AVCビデオストリームを取り込むことができると同時に、高解像度静止画像をビデオストリームに対してランダムな間隔で取り込むことができる。個々の取り込んだ高解像度静止画像がビデオストリーム内に埋め込まれる。この埋め込み高解像度静止画像を含むビデオストリームが単層ビットストリームとして符号化される。個々の埋め込み高解像度静止画像は、符号化したビデオシーケンス内における新規GOPの開始を知らせ、又は強制する。単層ビットストリームが、送信側のエンコーダから受信側のデコーダへ送信される。
埋め込み高解像度静止画像をビデオストリームに含めるために、シーケンスパラメータセットのための新しいシンタックスを含むようにAVC規格を拡張する。1つの実施形態では、修正シーケンスパラメータセットが、AVCビデオに連なって高解像度静止画像が存在することを知らせる新規プロファイルを定義する。
1つの態様にでは、データを符号化する方法について説明する。この方法は、データの複数の連続するビデオフレームを含むビデオストリームを取り込むステップと、1又はそれ以上の静止画像をビデオストリームに対してランダムな時間間隔で取り込むステップと、個々の静止画像をビデオフレーム内に連続して埋め込むことにより、結合データストリームを形成するステップと、修正シーケンスパラメータセット内で新規プロファイル定義を使用することにより、高解像度静止画像の存在を知らせるステップと、結合データストリームを符号化するステップと、符号化済み結合データストリームを単層伝送として送信するステップとを含む。方法はまた、個々の取り込み高解像度静止画像をダウンサンプリングするステップと、個々の静止画像のダウンサンプリング版を、ビデオストリーム内の後続フレームの参照画像として使用するために記憶するステップとを含むこともできる。方法はまた、個々の取り込み静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像のダウンサンプリング版がビデオの特性にマッチするようにするステップを含むこともできる。結合データストリームを符号化するステップは、個々の静止画像のダウンサンプリング版に基づいてビデオフレームを符号化するステップを含むことができる。個々の埋め込み静止画像は新規GOPを示すことができる。個々の静止画像を結合データストリーム内にランダムに埋め込むことができる。個々のGOPのサイズは可変とすることができる。結合データストリームを修正AVC規格に基づいて符号化することができる。方法はまた、単層伝送を受信するステップと、修正シーケンスパラメータセットの存在により、個々の埋め込み静止画像の存在を検出するステップと、検出された個々の静止画像を復号するステップと、個々のビデオフレームを復号するステップとを含むこともできる。方法はまた、個々の復号静止画像をダウンサンプリングするステップと、個々の静止画像のダウンサンプリング版を記憶するステップとを含むこともできる。方法はまた、個々の復号静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像のダウンサンプリング版がビデオストリームの特性にマッチするようにするステップを含むこともできる。個々のビデオフレームを復号するステップは、静止画像が予測のための参照として使用される場合、個々のビデオフレームを個々の静止画像のダウンサンプリング版に基づいて復号するステップを含むことができる。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、1又はそれ以上の静止画像のフレームレートとは無関係とすることができる。
別の態様では、データを符号化するためのシステムについて説明する。システムは、複数の連続するビデオフレームデータを含むビデオストリームを取り込むためのビデオ取込モジュールと、1又はそれ以上の静止画像をビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、個々の取り込み静止画像をビデオフレーム内に埋め込むとともに、修正シーケンスパラメータセットを設定して個々の静止画像の存在を知らせることにより結合データストリームを生成するための処理モジュールと、結合データストリームを符号化することにより符号化済み結合データストリームを形成するためのエンコーダと、符号化済み結合データストリームを単層伝送として送信するための送信機とを含む。エンコーダは、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含むことができる。エンコーダは、個々の取り込み静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像のダウンサンプリング版をビデオの特性にマッチさせるように構成することができる。エンコーダは、個々の静止画像のダウンサンプリング版に基づいてビデオフレームを符号化することにより、結合データストリームを符号化するように構成することができる。処理モジュールは、修正シーケンスパラメータセットを定義し、ビデオストリーム内に静止画像が存在するごとにこのパラメータセットを追加して、静止画像の存在及び新規GOPの開始を知らせるように構成することができる。処理モジュールを、1又はそれ以上の静止画像パラメータを定義するように構成することもでき、個々の静止画像パラメータは、画像高さ及び画像幅のうちの1又はそれ以上などの静止画像の特性を定義する。個々の埋め込み静止画像は新規のGOPを示すことができる。個々の静止画像を結合データストリーム内にランダムに埋め込むことができる。個々のGOPのサイズは可変とすることができる。結合データストリームを修正AVC規格に基づいて符号化することができる。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、1又はそれ以上の静止画像のフレームレートとは無関係とすることができる。
さらに別の態様では、データを復号するためのシステムについて説明する。システムは、複数のビデオフレーム内に埋め込まれた1又はそれ以上の静止画像を含む符号化データストリームを単層伝送として受信するための受信機と、修正シーケンスパラメータセットの内容を構文解析することにより、埋め込み静止画像の存在を検出するための処理モジュールと、符号化データストリーム内に埋め込まれた個々の静止画像を復号するとともに個々の符号化ビデオフレームを復号してビデオストリームデータを形成するためのデコーダとを含み、個々の静止画像は、ビデオストリームに対してランダムな時間間隔で復号される。デコーダは、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含むことができる。デコーダは、個々の復号静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像のダウンサンプリング版をビデオストリームの特性にマッチさせるように構成することができる。デコーダは、静止画像が参照として使用される場合、個々の静止画像のダウンサンプリング版に基づいて個々の適当なビデオフレームを復号することにより、個々の符号化ビデオフレームを復号するように構成することができる。処理モジュールを、1又はそれ以上の静止画像パラメータを検出するように構成することができ、個々の静止画像パラメータは、画像高さ及び画像幅のうちの1又はそれ以上などの静止画像の特性を定義する。個々の埋め込み静止画像は新規GOPを示すことができる。個々の静止画像を符号化データストリーム内にランダムに埋め込むことができる。個々のGOPのサイズは可変とすることができる。符号化データストリームを修正AVC規格に基づいて符号化することができる。個々の静止画像は高解像度静止画像を含むことができる。個々のビデオフレームは低解像度ビデオフレームを含むことができる。ビデオストリームのフレームレートは、1又はそれ以上の静止画像のフレームレートとは無関係とすることができる。
さらに別の態様では、データを符号化及び復号するためのシステムについて説明する。システムは、複数の連続するビデオフレームデータを含む第1のビデオストリームを取り込むためのビデオ取込モジュールと、1又はそれ以上の静止画像を第1のビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、個々の取り込み静止画像を第1のビデオストリームのビデオフレーム内に埋め込むとともに、シーケンスパラメータセットを設定して静止画像の存在を知らせることにより第1のデータストリームを生成するための処理モジュールと、第1のデータストリームを符号化することにより、第1の符号化データストリームを形成するためのエンコーダと、第1の符号化データストリームを第1の単層伝送として送信するとともに第2の符号化データストリームを第2の単層伝送として受信するためのトランシーバと、第2の符号化データストリーム内に埋め込まれた個々の静止画像を復号するとともに、第2の符号化データストリーム内の個々の符号化ビデオフレームを復号して第2のビデオストリームデータを形成するためのデコーダとを含む。エンコーダは、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含むことができる。デコーダは、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含むことができる。
修正AVC規格を使用してビデオストリーム内に高解像度静止画像を埋め込むための順次モードを示す図である。 順次モードで動作するように構成された例示的なイメージングシステムのブロック図である。 図2のエンコーダの例示的なブロック図である。 低解像度ビデオストリームのAVC符号化と連続して高解像度デジタル静止画像を符号化する方法を示す図である。 単層データストリームを復号して高解像度静止画像を形成する方法を示す図である。
順次モードのコーデックの実施形態について、図面のいくつかの図に関連して説明する。必要に応じて及び同一要素が2以上の図面に開示及び図示されている場合に限り、同じ参照数字を使用してこのような同一要素を示す。
順次モード法は単層法とも呼ばれ、静止画像符号化機能のAVCへの追加をサポートする。AVCフォーマット済みのビデオストリーム内の隣接するP−ピクチャ、B−ピクチャ、又はI−ピクチャと比較した場合、より高い空間解像度での高解像度静止画像の符号化をサポートするようにAVC規格を拡張する。高解像度静止画像をビデオストリーム内に埋め込んで単層を形成する点で、この方法は順次法と呼ばれる。この順次法は、高解像度静止画像をランダムな間隔で取り込み、その後ビデオストリーム内に埋め込むことができるようにする。この意味において、AVCビデオストリーム内にランダムに埋め込まれた1又はそれ以上の高解像度静止画像を含む単層データストリームが一連の可変サイズのGOPになる。
順次モードを使用してビデオを取り込み、AVCで符号化する間、ユーザがより高い解像度の静止画像を所望した場合には、符号化ビデオシーケンス内で新規GOP又はS−I(静止画像)ピクチャの開始が知らされる。この「S−I−ピクチャ」は、通常のビデオシーケンスよりもかなり高い空間解像度を有する。同時に、S−Iピクチャを個別に復号することにより、ランダムアクセス能力を提供することができる。S−I−ピクチャはまた、ビデオ特性の代わりに画像特性も含み、これらの特性はカラーマッピングの違いを意味することができる。静止画像は、異なるアスペクト比及び色などの、ビデオとは異なる特性を有する。従って、通常、S−I−ピクチャは、ビデオストリームに関連するI−ピクチャ、P−ピクチャ、又はB−ピクチャとは異なる特性を含む。高解像度静止画像に関連するS−I−ピクチャは、ビデオストリームに関連するI−ピクチャとは異なる。S−I−ピクチャのランダム性により、結果的に特定のS−I−ピクチャがビデオストリームのGOPと合致することが起きる。この場合の1つの実施形態では、S−I−ピクチャが、単層データストリーム内でIピクチャに取って代わる。高解像度静止画像を取り込むランダム性に起因して、ビデオストリームのGOPに対するS−Iピクチャの合致頻度は様々であり、全く発生しないこともある。
図1は、修正AVC規格を使用して高解像度静止画像を記憶するための順次モードを示している。修正AVCでフォーマットされたデータストリーム10が、AVCフォーマット済みのビデオフレーム内に埋め込まれた高解像度静止画像を含む。AVCフォーマット済みのビデオフレームは、当業者で周知のようなP−ピクチャ、B−ピクチャ、及びI−ピクチャを含む。個々の高解像度静止画像はS−I−ピクチャとして表現され、ビデオフレーム内にランダムに散在する。AVCビデオストリームは決定されたGOPに基づいて構成され、この場合個々のI−ピクチャが新規GOPの開始を示す。修正AVCデータストリームでは、個々のS−I−ピクチャも新規GOPの開始を示す。高解像度静止画像をあらゆるランダムな時点で取り込むことができるので、対応するS−I−ピクチャを、修正AVCビデオストリーム内のあらゆるランダムな位置に埋め込むことができる。従って、修正AVCデータストリーム内の個々のGOPはサイズの上では可変である。
図1の修正AVCデータストリーム10は、I−ピクチャ18及び20を含む例示的な一連のビデオフレーム、及びS−I−ピクチャ12、14、及び16を含む高解像度静止画像を示している。個々のS−I−ピクチャ及び個々のI−ピクチャが新規GOPの開始を示す。修正AVCデータストリーム10を参照すると、GOP22はS−I−ピクチャ12で始まるように合わせられ、GOP24はS−I−ピクチャ14で始まるように合わせられ、GOP26はI−ピクチャ18で始まるように合わせられ、GOP28はS−I−ピクチャ16で始まるように合わせられ、GOP30はI−ピクチャ20で始まるように合わせられる。
高解像度静止画像はランダムな間隔で取り込まれるので、S−I−ピクチャがI−ピクチャと合致することが起きる。この場合の1つの実施形態では、I−ピクチャがS−I−ピクチャに取って代わられる。高解像度静止画像は、S−I−ピクチャとして構成される。S−I−ピクチャは、ビデオストリームのI−ピクチャ、P−ピクチャ、及びB−ピクチャ内に埋め込まれる。AVC規格によれば、P−ピクチャ及びB−ピクチャは、I−ピクチャから予測することができる。しかしながら、I−ピクチャがS−I−ピクチャに取って代わられた場合、或いはS−I−ピクチャが新規GOPの開始を示す場合には、S−I−ピクチャが後続のP−ピクチャ及びB−ピクチャを予測するための起点又は参照として使用される。S−I−ピクチャは、隣接するP及びB−ピクチャよりも解像度が高いので、S−I−ピクチャをビデオの解像度にダウンサンプリングする。また、S−I−ピクチャによって定義される画像特性を適当なビデオ特性に変換してP−ピクチャ及びB−ピクチャの予測に使用する必要がある。基本的に、高解像度静止画像をビデオの符号化において参照として使用する場合には、高解像度静止画像をダウンサンプリングし、画像特性をビデオ特性に変換して、静止画像ではなくビデオに適するようにフォーマットする。
修正AVC規格は、個々の高解像度静止画像をあらゆるランダムな間隔で取り込むことができるようにする。換言すれば、S−I−ピクチャのフレームレートは、AVCビデオストリームのフレームレートに一致したり、或いはその倍数である必要はないが、状況によってはこれらのフレームレートが等しい場合もある。残差情報をビデオストリームに対して一定の割合で生成する必要がある従来のコーデックとは対照的に、修正AVC規格に基づいて構成される順次モードコーデックは、このような要件を担うことはない。順次モードコーデックを使用して送信される高解像度静止画像は、ランダムなフレームレート、又はビデオストリームのフレームレートとは無関係なフレームレートに基づく。
図2は、順次モードで動作するように構成された例示的なイメージングシステム40のブロック図を示している。イメージングシステム40は、画像取込モジュール42と、コーデック48と、処理モジュール54と、メモリ56と、入出力(I/O)インターフェイス58とを含む。I/Oインターフェイス58は、データを送受信するためのユーザインターフェイス及びネットワークインターフェイスを含む。メモリ56は、一体型又は取り外し可能のいずれかの従来型のデータ記憶媒体である。コーデック48は、エンコーダ50及びデコーダ52を含む。画像取込モジュール42は、低解像度ビデオを取り込むためのビデオ取込モジュール44、及び高解像度静止画像を取り込むための静止画像取込モジュール46を含む。
図3は、図2のエンコーダ50の例示的なブロック図を示している。エンコーダ50は、動き推定(ME)モジュール60と、動き補償(MC)モジュール62と、コンパレータ64と、変換モジュール66と、量子化モジュール68と、VLC/CABACモジュール70と、逆量子化モジュール72と、逆変換モジュール74と、ダウンサンプルモジュール76と、高解像度静止画像選択スイッチ78と、フレームバッファ80とを含む。図3に示すように、エンコーダ側では、高解像度静止画像であるS−I−ピクチャの符号化にフラグが立てられ、これが高解像度ビデオのイントラモードでの符号化(I−ピクチャ)と同様に符号化される。決定的な違いは、エンコーダがS−I−ピクチャのダウンサンプリング版をフレームバッファ80に記憶して、後続する解像度のより低いP−ピクチャ及びB−ピクチャのための参照ピクチャとして使用することである。高解像度静止画像が存在する場合、スイッチ78へ信号が送信される。この信号に応答して、スイッチがダウンサンプルモジュール76に接続され、現在のフレームであるS−I−ピクチャのダウンサンプリング版がフレームバッファ80へ送信されるようになる。エンコーダの複雑性を最小化するために、I−ピクチャの符号化は、ビデオ及び静止画像の両方の符号化のリアルタイム要件に対処するように設計される。
デコーダ側では、ビデオカメラなどの画像表示装置がデジタル静止画像モードにある場合、高解像度静止画像S−I−ピクチャがアクセスされ、復号されて表示される。ビデオモードでは、復号された高解像度静止画像のダウンサンプリング版が表示され、P−ピクチャ及びB−ピクチャに対するさらなる参照のためにフレームバッファに記憶される。エンコーダ側と同様に、デコーダは、高解像度のI−ピクチャのリアルタイムな符号化に対処するように設計される。いくつかの実施形態では、デコーダが動き推定モジュールを含まず、GOPがS−I−ピクチャから開始する場合にはGOPの先頭に存在し又は必須である高解像度静止画像の存在が修正シーケンスパラメータセットによって知らされることを除き、デコーダがエンコーダ50と同様に構成される。デコーダの処理フローは、エンコーダの処理フローを逆にしたものである。
図4は、低解像度ビデオストリームのAVC符号化と連続して高解像度デジタル静止画像を符号化する方法を示している。ステップ100において、入力ビデオストリームが取り込まれる。あらゆるランダムな時点で、ステップ110において高解像度静止画像が取り込まれる。他の時点で、その他の静止画像を取り込むことができる。ステップ120において、個々の取り込み高解像度静止画像がビデオストリーム内に埋め込まれることにより、埋め込み高解像度静止画像及び入力ビデオストリームのビデオフレームを含む結合データストリームが形成される。個々の高解像度静止画像は、高解像度静止画像を取り込んだ時点に時間的に対応する時点でビデオストリーム内に埋め込まれる。ステップ130において、修正シーケンスパラメータセットにより、GOPがS−I−ピクチャで開始する場合にはGOPの先頭に存在し又は必須である高解像度静止画像の存在が通知される。
この実施形態では、個々の高解像度静止画像が、ビデオストリーム内のP−ピクチャ及びB−ピクチャを符号化するための予測参照として使用される。しかしながら、この目的のためには高解像度静止画像の解像度が高すぎる。ステップ140において、個々の高解像度静止画像がダウンサンプリングされ、高解像度静止画像のダウンサンプリング版がバッファに記憶される。ステップ150において、結合データストリームが符号化され、高解像度静止画像のダウンサンプリング版が、結合データストリーム内の適当なP−ピクチャ及びB−ピクチャを符号化するための予測参照として使用される。ステップ160において、符号化済みの結合データストリームがエンコーダからデコーダへ単層伝送として送信される。
図5は、単層データストリームを復号して高解像度静止画像を形成する方法を示している。ステップ200において、デコーダが、ステップ160(図4)において送信された単層の符号化済み結合データストリームを受信する。ステップ210において、修正シーケンスパラメータセット(SPS)の存在により、受信した結合データストリーム内にS−I−ピクチャが存在することが新規プロファイル定義を使用して示されることにより、結合データストリーム内に埋め込まれた高解像度静止画像が検出される。このような個々の検出されたSPSごとに、対応する高解像度静止画像がステップ220において復号される。ステップ230において、個々の復号済み高解像度静止画像がダウンサンプリングされる。ステップ240において、高解像度静止画像のダウンサンプリング版がバッファに記憶される。ステップ250において、結合データストリームを含むビデオフレームが復号される。1つの実施形態では、高解像度静止画像のダウンサンプリング版が、適当なP−ピクチャ及びB−ピクチャを符号化するための予測参照として使用される。
既存のAVC規格を、高解像度静止画像のランダムな取り込みをサポートするように修正するために、高解像度静止画像をビデオフレームの連続ストリーム内にランダムな時間間隔で組み込めるようにするとともに、ビデオストリームに高解像度静止画像が含まれていることをデコーダに知らせるように既存のAVC規格を拡張する。シーケンスパラメータセットが、特定の時点におけるビデオストリームの特性を定義する。
修正AVC規格は、修正シーケンスパラメータセット(SPS)RBSPシンタックスを含む。1つの実施形態では、修正シーケンスパラメータセットが、新規プロファイルインジケータを定義することにより、及び対応するフラグをセットして高解像度静止画像の幅及び高さなどの画像特性を知らせることにより、高解像度静止画像が存在することを知らせる。以下は、例示的な修正SPS RBSPシンタックスである。
Figure 2011505780
Figure 2011505780
パラメータ「still_pic_width_in_mbs_minus1」+1は、復号した個々の高解像度静止ピクチャの幅をマクロブロック単位で指定する。パラメータ「still_pic_hight_in_map_units_minus1」+1は、高解像度静止ピクチャの復号フレームのスライスグループマップ単位での高さを指定する。
修正シーケンスパラメータセットを定義するための上記で使用したシンタックスは例示を目的とするものである点、及び代替のシンタックスを使用して修正シーケンスパラメータセットを定義できる点を理解されたい。
本発明の構成及び動作の原理の理解を容易にするために、詳細を含む特定の実施形態に関連して本発明について説明した。本明細書における、このような特定の実施形態及びこれらの詳細の参照は、添付の特許請求の範囲を限定することを意図するものではない。当業者には、本発明の思想及び範囲から逸脱することなく、例示のために選択した実施形態に修正を加えることができる点が明らかであろう。
10 データストリーム
12〜16 SI−ピクチャ「高解像度静止画像」
18、20 I−ピクチャ
22〜30 GOP

Claims (43)

  1. データを符号化する方法であって、
    a.複数の連続するビデオフレームデータを含むビデオストリームデータを取り込むステップと、
    b.1又はそれ以上の静止画像を前記ビデオストリームに対してランダムな時間間隔で取り込むステップと、
    c.個々の静止画像を前記ビデオフレーム内に連続して埋め込むことにより、結合データストリームを形成するステップと、
    d.修正シーケンスパラメータセット内で新規プロファイル定義を使用することにより、高解像度静止画像の存在を知らせるステップと、
    e.前記結合データストリームを符号化するステップと、
    f.前記符号化した結合データストリームを単層伝送として送信するステップと、
    を含むことを特徴とする方法。
  2. 個々の取り込み高解像度静止画像をダウンサンプリングするステップと、個々の静止画像のダウンサンプリング版を、前記ビデオストリーム内の後続フレームの参照画像として使用するために記憶するステップとをさらに含む、
    ことを特徴とする請求項1に記載の方法。
  3. 個々の取り込み静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像の前記ダウンサンプリング版が前記ビデオの前記特性にマッチするようにするステップをさらに含む、
    ことを特徴とする請求項2に記載の方法。
  4. 前記結合データストリームを符号化するステップが、個々の静止画像の前記ダウンサンプリング版に基づいて前記ビデオフレームを符号化するステップを含む、
    ことを特徴とする請求項3に記載の方法。
  5. 個々の埋め込み静止画像が新規GOPを示す、
    ことを特徴とする請求項1に記載の方法。
  6. 個々の静止画像が、前記結合データストリーム内にランダムに埋め込まれる、
    ことを特徴とする請求項5に記載の方法。
  7. 個々のGOPのサイズが可変である、
    ことを特徴とする請求項6に記載の方法。
  8. 前記結合データストリームが修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項1に記載の方法。
  9. a.前記単層伝送を受信するステップと、
    b.修正シーケンスパラメータセットの存在により、個々の埋め込み静止画像の発生を検出するステップと、
    c.検出された個々の静止画像を復号するステップと、
    d.個々のビデオフレームを復号するステップと、
    をさらに含むことを特徴とする請求項1に記載の方法。
  10. 個々の復号静止画像をダウンサンプリングするステップと、個々の静止画像のダウンサンプリング版を記憶するステップとをさらに含む、
    ことを特徴とする請求項9に記載の方法。
  11. 個々の復号静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像の前記ダウンサンプリング版が前記ビデオストリームの前記特性にマッチするようにするステップをさらに含む、
    ことを特徴とする請求項10に記載の方法。
  12. 個々のビデオフレームを復号するステップは、前記静止画像が予測のための参照として使用される場合、個々の静止画像の前記ダウンサンプリング版に基づいて個々のビデオフレームを復号するステップを含む、
    ことを特徴とする請求項11に記載の方法。
  13. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項1に記載の方法。
  14. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項1に記載の方法。
  15. 前記ビデオストリームのフレームレートが、前記1又はそれ以上の静止画像のフレームレートとは無関係である、
    ことを特徴とする請求項1に記載の方法。
  16. データを符号化するためのシステムであって、
    a.複数の連続するビデオフレームデータを含むビデオストリームデータを取り込むためのビデオ取込モジュールと、
    b.1又はそれ以上の静止画像を前記ビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、
    c.個々の取り込み静止画像を前記ビデオフレーム内に埋め込むとともに、修正シーケンスパラメータセットを設定して個々の静止画像の存在を知らせることにより結合データストリームを生成するための処理モジュールと、
    d.前記結合データストリームを符号化することにより符号化済み結合データストリームを形成するためのエンコーダと、
    e.前記符号化済み結合データストリームを単層伝送として送信するための送信機と、
    を含むことを特徴とするシステム。
  17. 前記エンコーダが、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含む、
    ことを特徴とする請求項16に記載のシステム。
  18. 前記エンコーダが、個々の取り込み静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像の前記ダウンサンプリング版を前記ビデオの前記特性にマッチさせるように構成されている、
    ことを特徴とする請求項17に記載のシステム。
  19. 前記エンコーダが、個々の静止画像の前記ダウンサンプリング版に基づいて前記ビデオフレームを符号化することにより、前記結合データストリームを符号化するように構成されている、
    ことを特徴とする請求項18に記載のシステム。
  20. 前記処理モジュールが、修正シーケンスパラメータセットを定義し、前記ビデオストリーム内に前記静止画像が存在するごとに前記パラメータセットを追加して、前記静止画像の存在及び新規GOPの開始を知らせるように構成されている、
    ことを特徴とする請求項16に記載のシステム。
  21. 前記処理モジュールが、1又はそれ以上の静止画像パラメータを定義するようにさらに構成され、個々の静止画像パラメータが、前記静止画像の特性、例えば、画像高さ及び画像幅のうちの1又はそれ以上を定義する、
    ことを特徴とする請求項20に記載のシステム。
  22. 個々の埋め込み静止画像が新規GOPを示す、
    ことを特徴とする請求項16に記載のシステム。
  23. 個々の静止画像が前記結合データストリーム内にランダムに埋め込まれる、
    ことを特徴とする請求項22に記載のシステム。
  24. 個々のGOPのサイズが可変である、
    ことを特徴とする請求項23に記載のシステム。
  25. 前記結合データストリームが修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項16に記載のシステム。
  26. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項16に記載のシステム。
  27. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項16に記載のシステム。
  28. 前記ビデオストリームの前記フレームレートが、前記1又はそれ以上の静止画像の前記フレームレートとは無関係である、
    ことを特徴とする請求項16に記載のシステム。
  29. データを復号するためのシステムであって、
    a.複数のビデオフレーム内に埋め込まれた1又はそれ以上の静止画像を含む符号化データストリームを単層伝送として受信するための受信機と、
    b.修正シーケンスパラメータセットの内容を構文解析することにより、埋め込み静止画像の存在を検出するための処理モジュールと、
    b.前記符号化データストリーム内に埋め込まれた個々の静止画像を復号するとともに個々の符号化ビデオフレームを復号してビデオストリームデータを形成するためのデコーダと、
    を含み、個々の静止画像が、前記ビデオストリームに対してランダムな時間間隔で復号される、
    ことを特徴とするシステム。
  30. 前記デコーダが、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含む、
    ことを特徴とする請求項29に記載のシステム。
  31. 前記デコーダが、個々の復号静止画像に関連する画像特性をビデオ特性に変換して、個々の静止画像の前記ダウンサンプリング版を前記ビデオストリームの特性にマッチさせるように構成されている、
    ことを特徴とする請求項30に記載のシステム。
  32. 前記デコーダが、前記静止画像が参照として使用される場合、個々の静止画像の前記ダウンサンプリング版に基づいて個々の適当なビデオフレームを復号することにより、個々の符号化ビデオフレームを復号するように構成されている、
    ことを特徴とする請求項31に記載のシステム。
  33. 前記処理モジュールが、1又はそれ以上の静止画像パラメータを検出するように構成され、個々の静止画像パラメータが、前記静止画像の特性、例えば、画像高さ及び画像幅のうちの1又はそれ以上を定義する、
    ことを特徴とする請求項29に記載のシステム。
  34. 個々の埋め込み静止画像が新規GOPを示す、
    ことを特徴とする請求項29に記載のシステム。
  35. 個々の静止画像が前記符号化データストリーム内にランダムに埋め込まれる、
    ことを特徴とする請求項34に記載のシステム。
  36. 個々のGOPのサイズが可変である、
    ことを特徴とする請求項35に記載のシステム。
  37. 前記符号化データストリームが修正AVC規格に基づいて符号化される、
    ことを特徴とする請求項29に記載のシステム。
  38. 個々の静止画像が高解像度静止画像を含む、
    ことを特徴とする請求項29に記載のシステム。
  39. 個々のビデオフレームが低解像度ビデオフレームを含む、
    ことを特徴とする請求項29に記載のシステム。
  40. 前記ビデオストリームのフレームレートが、前記1又はそれ以上の静止画像のフレームレートとは無関係である、
    ことを特徴とする請求項29に記載のシステム。
  41. データを符号化及び復号するためのシステムであって、
    a.複数の連続するビデオフレームデータを含む第1のビデオストリームデータを取り込むためのビデオ取込モジュールと、
    b.1又はそれ以上の静止画像を前記第1のビデオストリームに対してランダムな時間間隔で取り込むための静止画像取込モジュールと、
    c.個々の取り込み静止画像を前記第1のビデオストリームの前記ビデオフレーム内に埋め込むとともに、シーケンスパラメータセットを設定して前記静止画像の存在を知らせることにより第1のデータストリームを生成するための処理モジュールと、
    d.前記第1のデータストリームを符号化することにより、第1の符号化データストリームを形成するためのエンコーダと、
    e.前記第1の符号化データストリームを第1の単層伝送として送信するとともに第2の符号化データストリームを第2の単層伝送として受信するためのトランシーバと、
    f.前記第2の符号化データストリーム内に埋め込まれた個々の静止画像を復号するとともに、前記第2の符号化データストリーム内の個々の符号化ビデオフレームを復号してデータの第2のビデオストリームデータを形成するためのデコーダと、
    を含むことを特徴とするシステム。
  42. 前記エンコーダが、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含む、
    ことを特徴とする請求項41に記載のシステム。
  43. 前記デコーダが、個々の静止画像をダウンサンプリングするためのダウンサンプリングモジュールと、個々の静止画像のダウンサンプリング版を記憶するためのバッファとを含む、
    ことを特徴とする請求項41に記載のシステム。
JP2010536904A 2007-12-04 2008-11-07 高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張 Withdrawn JP2011505780A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/999,377 US8170097B2 (en) 2007-12-04 2007-12-04 Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
PCT/US2008/012628 WO2009073075A1 (en) 2007-12-04 2008-11-07 Extension of the avc standard to encode high resolution digital still pictures in series with video

Publications (1)

Publication Number Publication Date
JP2011505780A true JP2011505780A (ja) 2011-02-24

Family

ID=40675686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010536904A Withdrawn JP2011505780A (ja) 2007-12-04 2008-11-07 高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張

Country Status (4)

Country Link
US (1) US8170097B2 (ja)
JP (1) JP2011505780A (ja)
CN (1) CN101889447B (ja)
WO (1) WO2009073075A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014103613A (ja) * 2012-11-22 2014-06-05 Jvc Kenwood Corp 画像処理装置、画像処理方法、画像処理プログラム
WO2016002494A1 (ja) * 2014-06-30 2016-01-07 ソニー株式会社 情報処理装置および方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2188711A4 (en) * 2007-09-14 2012-08-22 Auditude Inc RESTORING PROGRAM INFORMATION FOR CLIPS FROM ONLINE USED BROADCASTING PROGRAMS
US8199813B2 (en) * 2007-12-18 2012-06-12 GE Inspection Technologies Method for embedding frames of high quality image data in a streaming video
US20090316775A1 (en) * 2008-06-20 2009-12-24 Chia-Yun Cheng Video encoding and decoding method and system thereof
US8130278B2 (en) * 2008-08-01 2012-03-06 Omnivision Technologies, Inc. Method for forming an improved image using images with different resolutions
KR101064883B1 (ko) * 2009-10-06 2011-09-16 한국과학기술원 왜곡 측정 방법
EP2553925A4 (en) 2010-04-02 2013-11-13 Ericsson Telefon Ab L M METHODS, APPARATUSES, AND COMPUTER PROGRAM PRODUCTS FOR PASSING TRANSIT VIDEO PLAYBACK CONTENT
CN102223524B (zh) * 2010-04-13 2013-08-07 中兴通讯股份有限公司 一种三维小波视频编码帧分组方法及装置
US8990574B1 (en) 2010-10-06 2015-03-24 Prima Cinema, Inc. Secure device authentication protocol
US8843752B1 (en) 2011-01-24 2014-09-23 Prima Cimema, Inc. Multi-factor device authentication
CN103391472A (zh) * 2012-05-09 2013-11-13 腾讯科技(深圳)有限公司 视频分辨率获取方法及系统
CA2873487A1 (en) * 2012-05-14 2013-11-21 Luca Rossato Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy
EP2670139A1 (en) * 2012-06-01 2013-12-04 Alcatel Lucent Method and apparatus for encoding a video stream having a transparency information channel
US10116966B2 (en) * 2012-09-28 2018-10-30 Sharp Kabushiki Kaisha Image decoding device
RU2663341C2 (ru) * 2012-11-30 2018-08-03 Сони Корпорейшн Устройство обработки изображений и способ
TWI676389B (zh) 2013-07-15 2019-11-01 美商內數位Vc專利控股股份有限公司 至少一種色彩轉換之編碼方法和編碼器、解碼器、顯示裝置、編碼視訊訊號、電腦程式製品及處理器可讀式媒體
WO2015056566A1 (ja) * 2013-10-15 2015-04-23 ソニー株式会社 画像処理装置および方法
US9094667B1 (en) * 2013-10-31 2015-07-28 Electronic Arts Inc. Encoding of computer-generated video content
JP6481457B2 (ja) * 2015-03-26 2019-03-13 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
WO2017079658A1 (en) 2015-11-04 2017-05-11 Screening Room Media, Inc. Digital content delivery system
EP3185556A1 (en) * 2015-12-21 2017-06-28 Thomson Licensing Method and apparatus for combined adaptive resolution and internal bit-depth increase coding
US10452819B2 (en) 2017-03-20 2019-10-22 Screening Room Media, Inc. Digital credential system
US10863088B2 (en) * 2018-06-25 2020-12-08 Canon Kabushiki Kaisha Image capturing apparatus and control method for capturing still images without interrupting video recordings
WO2020028998A1 (en) * 2018-08-06 2020-02-13 Huawei Technologies Co., Ltd. Method and device for coding image data, and method and device for decoding image data
US11418814B2 (en) * 2020-05-22 2022-08-16 Tencent America LLC Constraint on syntax elements for still picture profiles

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7095783B1 (en) * 1992-06-30 2006-08-22 Discovision Associates Multistandard video decoder and decompression system for processing encoded bit streams including start codes and methods relating thereto
US6937273B1 (en) * 1997-05-28 2005-08-30 Eastman Kodak Company Integrated motion-still capture system with indexing capability
US6665453B2 (en) * 1999-03-16 2003-12-16 Intel Corporation Multi-resolution support for video images
US7383288B2 (en) * 2001-01-11 2008-06-03 Attune Systems, Inc. Metadata based file switch and switched file system
GB2372165A (en) * 2001-02-10 2002-08-14 Hewlett Packard Co A method of selectively storing images
US6961083B2 (en) * 2001-12-21 2005-11-01 Hewlett-Packard Development Company, L.P. Concurrent dual pipeline for acquisition, processing and transmission of digital video and high resolution digital still photographs
AU2003241143A1 (en) * 2002-06-25 2004-01-06 Quix Technologies Ltd. Image processing using probabilistic local behavior assumptions
AU2003267699A1 (en) * 2002-10-15 2004-05-04 Koninklijke Philips Electronics N.V. System and method for transmitting scalable coded video over an ip network
US6937723B2 (en) * 2002-10-25 2005-08-30 Avaya Technology Corp. Echo detection and monitoring
JP4002878B2 (ja) * 2003-01-17 2007-11-07 松下電器産業株式会社 画像符号化方法
JP2005203905A (ja) * 2004-01-13 2005-07-28 Sony Corp 画像符号化装置、画像符号化方法並びに画像符号化プログラム
US20050235047A1 (en) * 2004-04-16 2005-10-20 Qiang Li Method and apparatus for a large scale distributed multimedia streaming system and its media content distribution
US9208824B2 (en) * 2004-05-18 2015-12-08 Broadcom Corporation Index table generation in PVR applications for AVC video streams
US7792190B2 (en) * 2004-09-09 2010-09-07 Media Tek Singapore Pte Ltd. Inserting a high resolution still image into a lower resolution video stream
KR100679031B1 (ko) * 2004-12-03 2007-02-05 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
DE102005001287A1 (de) 2005-01-11 2006-07-20 Siemens Ag Verfahren und Vorrichtung zur Verarbeitung von skalierbaren Daten
US7876833B2 (en) * 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
US8693538B2 (en) * 2006-03-03 2014-04-08 Vidyo, Inc. System and method for providing error resilience, random access and rate control in scalable video communications
US7705889B2 (en) * 2007-06-15 2010-04-27 Sony Corporation Shutter time compensation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014103613A (ja) * 2012-11-22 2014-06-05 Jvc Kenwood Corp 画像処理装置、画像処理方法、画像処理プログラム
WO2016002494A1 (ja) * 2014-06-30 2016-01-07 ソニー株式会社 情報処理装置および方法
JPWO2016002494A1 (ja) * 2014-06-30 2017-04-27 ソニー株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
CN101889447A (zh) 2010-11-17
WO2009073075A1 (en) 2009-06-11
US20090141810A1 (en) 2009-06-04
US8170097B2 (en) 2012-05-01
CN101889447B (zh) 2013-01-23

Similar Documents

Publication Publication Date Title
US8170097B2 (en) Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
JP2011505781A (ja) 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張
US7705889B2 (en) Shutter time compensation
US7469011B2 (en) Escape mode code resizing for fields and slices
US6421385B1 (en) Apparatus and method for efficient conversion of DV (digital video) format encoded video data into MPEG format encoded video data by utilizing motion flag information contained in the DV data
US7379501B2 (en) Differential coding of interpolation filters
US7961786B2 (en) Signaling field type information
US7499495B2 (en) Extended range motion vectors
US20150312575A1 (en) Advanced video coding method, system, apparatus, and storage medium
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
US7899121B2 (en) Video encoding method, video encoder, and personal video recorder
US7822123B2 (en) Efficient repeat padding for hybrid video sequence with arbitrary video resolution
US7839933B2 (en) Adaptive vertical macroblock alignment for mixed frame video sequences
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
JP3822821B2 (ja) 画像再生表示装置
Akujuobi Application of Wavelets to Video Compression
KR20230027156A (ko) 서브레이어 레벨 정보에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체
Premshankar Efficient Video Compression Schemes by applying the DCT approach
JP2002536926A (ja) 画像領域を変換する方法および装置
JPH11252561A (ja) 動画像復号化方法
JP2007049520A (ja) 画像信号の高能率符号化装置
Gajjala Efficient HEVC Loss Less Coding Using Sample Based Angular Intra Prediction (SAP)
Miura et al. A simple compression method using movion vector of video encoder in the destributed system
Heising et al. Internet Still Image and Video Formats.
MXPA06009733A (es) Metodo y sistema de codificacion digital de imagenes de video 3d estereoscopicas.

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120110