JP5676637B2 - 符号化ビットストリームのマージ - Google Patents

符号化ビットストリームのマージ Download PDF

Info

Publication number
JP5676637B2
JP5676637B2 JP2012543085A JP2012543085A JP5676637B2 JP 5676637 B2 JP5676637 B2 JP 5676637B2 JP 2012543085 A JP2012543085 A JP 2012543085A JP 2012543085 A JP2012543085 A JP 2012543085A JP 5676637 B2 JP5676637 B2 JP 5676637B2
Authority
JP
Japan
Prior art keywords
avc
encoding
layer
coding
avc encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012543085A
Other languages
English (en)
Other versions
JP2013513999A (ja
JP2013513999A5 (ja
Inventor
ウー,チエンユ
バルドセラ,フエラン
ゴリケリ,アダーシユ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013513999A publication Critical patent/JP2013513999A/ja
Publication of JP2013513999A5 publication Critical patent/JP2013513999A5/ja
Application granted granted Critical
Publication of JP5676637B2 publication Critical patent/JP5676637B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Description

(関連出願の相互参照)
本願は、「2つのAVC/SVC符号化ビットストリームのマージ(Merging Two AVC/SVC Encoded Bitstreams)」と題する2009年12月14日出願の米国仮出願第61/284,150号の出願日の利益を主張するものである。
符号化に関する実施態様について述べる。様々な特定の実施態様は、複数の符号化ストリームのマージに関する。
ユーザは、特定のビデオ・コンテンツを符号化し、ハード・ディスクに保存していることがある。後になって、当該ユーザが、同じビデオ・コンテンツの別の符号化バージョンを取得することがある。しかし、新しいバージョンでは品質が改善されていることがある。こうして、ユーザが、同じコンテンツの異なる2つのバージョンを保存し得る状況が生じる。
一般的な特徴によれば、データ・シーケンスの第1のAVC符号化にアクセスする。当該データ・シーケンスの第2のAVC符号化にアクセスする。第2のAVC符号化は、第1のAVC符号化とは品質が異なっている。第1のAVC符号化を第2のAVC符号化とマージして、AVCのSVC拡張を使用する第3のAVC符号化にする。このマージは、第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、第2のAVC符号化が第3のAVC符号化の少なくとも第2のレイヤを占めるように実行される。第1のレイヤまたは第2のレイヤの少なくとも一方は、第1のレイヤまたは第2のレイヤの他方の参照レイヤである。
1つまたは複数の実施態様の詳細について、添付の図面および以下の記述で説明する。実施態様は、1つの特定の方法で記載されている場合であっても、様々な方法で構成または実施することができることは明らかであろう。例えば、実施態様は、方法として実行することも、例えば1組の動作を実行するように構成された装置や1組の動作を実行する命令を保存した装置などの装置として実施することも、あるいは信号中に実装することもできる。その他の特徴および特性は、以下の詳細な説明を添付の図面および特許請求の範囲と関連付けて考慮すれば明らかになるであろう。
トランスコーディング・システムの第1の実施態様の例を示すブロック図/流れ図である。 トランスコーディング・システムの第2の実施態様の例を示すブロック図/流れ図である。 トランスコーディング・システムの第3の実施態様の例を示すブロック図/流れ図である。 トランスコーディング・システムの第4の実施態様の例を示すブロック図/流れ図である。 トランスコーディング・システムの第5の実施態様の例を示すブロック図/流れ図である。 1つまたは複数の実施態様とともに使用することができる符号化システムの例を示すブロック図/流れ図である。 1つまたは複数の実施態様とともに使用することができるコンテンツ配信システムの例を示すブロック図/流れ図である。 1つまたは複数の実施態様とともに使用することができる復号システムの例を示すブロック図/流れ図である。 1つまたは複数の実施態様とともに使用することができるビデオ伝送システムの例を示すブロック図/流れ図である。 1つまたは複数の実施態様とともに使用することができるビデオ受信システムの例を示すブロック図/流れ図である。 ビットストリームをトランスコーディングするプロセスの一例を示すブロック図/流れ図である。
本願に記載する少なくとも1つの実施態様では、2つの符号化ビデオ・ビットストリーム(一方はAVCで符号化されたビットストリーム、他方はAVCまたはSVCで符号化されたビットストリーム)をマージして、新たなSVCビットストリームにする。前者のAVCビットストリームは、後者のAVCまたはSVCビットストリームよりも高度なビデオ情報を含む。新たなSVCビットストリームは、可能なら後者のAVCまたはSVCビットストリームと同一であるサブ・ビットストリームを含むように、且つ前者のAVCビットストリームの高度な情報が新たなSVCビットストリームの1つまたは複数の増強レイヤとして符号されるように、生成される。本実施態様では、このマージ・プロセスのトランスコーディング図について述べる。この特定の実施態様の利点としては、(i)AVCまたはSVCビットストリームの復号、(ii)AVCまたはSVCビットストリームの動き補償、(iii)前者のAVCビットストリームの復号、または(iv)前者のAVCビットストリームの動き補償のうちの1つまたは複数を回避することができることが挙げられる。
AVCとは、より具体的には、既存のInternational Organization for Standardization/International Electrotechnical Commission(ISO/IEC) Moving Picture Experts Group−4(MPEG−4) Part 10 Advanced Video Coding(AVC)規格/International Telecommunication Union Telecommunication Sector(ITU−T)H.264勧告(以下「H.264/MPEG−4 AVC規格」または「AVC規格」や単なる「AVC」などその変形表現)を指している。SVCとは、より具体的には、AVC規格のスケーラブル・ビデオ・コーディング(「SVC」)拡張(Annex G)を指し、H.264/MPEG−4 AVC、SVC拡張(「SVC拡張」や単なる「SVC」)と呼ぶ。
図7を参照して、背景技術の項で述べた例について引き続き説明すると、図7は、家庭での実施に適したコンテンツ配信システム700を示している。配信システム700は、コンテンツを保存するメディア・ボールト710を含む。メディア・ボールトは、例えば、ハード・ディスクとすることができる。配信システム700は、メディア・ボールト710のコンテンツを表示するための、メディア・ボールト710に接続された複数のディスプレイ・デバイスを含む。ディスプレイ・デバイスは、携帯ディジタル端末(「PDA」)720、携帯電話730、およびテレビジョン(「TV」)740を含む。ユーザは、AVCまたはSVCで符号化された特定のビデオ・コンテンツをメディア・ボールト710に保存している。その後、ユーザは、AVCで符号化された、同じビデオ・コンテンツの別のバージョンを取得する。このバージョンでは、例えばより高い解像度、より高いビット・レート、および/またはより高いフレーム・レートなど、品質が改善されている。別の例としては、このバージョンは、よりよい品質を実現するアスペクト比を有していることもある。ユーザは、例えば、この新たなAVCバージョンをTV740に表示しながら、携帯電話730またはPDA720の何れかに低品質バージョン(以前に保存したAVC/SVCバージョン)を表示する選択肢も残したいと思う可能性がある。実際に、保存領域という視点から言えば、ユーザは、通常は複数のフォーマットを含むSVC符号化を保存することを好む。そうすれば、デバイスの解像度に応じてユーザの異なるディスプレイ・デバイス720から740に異なるフォーマットを供給することができるからである。
その結果、ユーザは、この新たなAVCビットストリームを既存のAVCまたはSVCビットストリームに追加したいと思い、結合したビットストリームをSVC符号化したいと思う。SVCでは、ユーザは、例えば同じビデオ・コンテンツの様々なバージョンを容易に取り出すことができる、ディスク領域のコストが低い、メディア・ライブラリの管理が容易であるなどの利点を得ることができる。ユーザは、このプロセスが限られた量のメモリ/ディスク領域しか必要としないという点において軽く、高速であるという点において効率的であることを望む。この目的を実現する助けとなるように、システム700は、トランスコーダ750も含む。このトランスコーダ750は、様々な実施態様では、以下の図2〜図5に関連して述べるトランスコーダの1つである。トランスコーダ750は、メディア・ボールト710に接続され、例えば、トランスコーディング・プロセスの入力として保存された符号化にアクセスし、トランスコーディングされた出力を保存する。
新たなAVCビットストリームは、既存の(AVCまたはSVC)ビデオ・ビットストリームが有するビデオ・コンテンツ情報を全て含んでいるものと仮定する。さらに、新たなビットストリームは、例えばより高い解像度、より高いフレーム・レート、より高いビット・レートまたはそれらの任意の組合せなど、追加の品質改善情報も含む。さらに、2つのビットストリームの間の対応するアクセス・ユニット(符号化ピクチャ)はそれぞれ、時間的に位置合わせされている。ここでは、時間的な位置合わせとは、時間的解像度の異なる複数のビットストリーム間で、同じビデオ・シーンに対応する符号化ピクチャは、提示時間が同じでなければならないということを意味する。この要件により、より高い時間的解像度を有するビットストリームが、それより低い時間的解像度を有するビットストリームによって符号化された全てのシーンを含むことが保証される。従って、同じシーンに対応するが異なるビットストリームに属する符号化ピクチャ間の相関を活用することが可能になる。
新たなビットストリームを作成する第1の実施態様は、新たなAVCビットストリームを完全に復号して、ピクセル領域(例えばYUV)ビデオ・シーケンスにすることを含む。この実施態様では、次いで、完全なSVC符号化を適用して所望のSVCビットストリームを生成し、この完全なSVC符号化の間は、既存のAVC/SVCビットストリームの同じ符号化パラメータが強制される(enforced)。
新たなビットストリームを作成する第2の実施態様は、新たなAVCビットストリームにトランスコーディング・プロセスを適用することを含む。すなわち、AVCからSVCへのトランスコーディング・プロセスを適用する。このプロセスによって、新たなSVC出力ビットストリームが生成される。この新たなSVC出力ビットストリームは、既存のSVC/SVCビットストリームと同一である可能性があるサブ・ビットストリームを含む。なお、AVC/SVCビットストリームは既に存在しているが、これはサブ・ビットストリームの生成には利用されないことに留意されたい。
図1を参照すると、システム100は、第2の実施態様の一例を示したものである。システム100は、入力として、1080pフォーマットを有する新たなAVCビットストリーム110、ならびに720pおよび480pフォーマットを有する既存のSVCビットストリームの両方を受信する。2つのフォーマットは、それぞれ異なるSVC空間レイヤにある。システム100は、出力として、1080p、720pおよび480pの3つ全てのフォーマットを有する新たなSVCビットストリーム130を生成する。3つのフォーマットはそれぞれ、異なる空間レイヤを占める。新たなSVCビットストリーム130にビットストリーム抽出プロセスを適用することにより、720pおよび480pのフォーマットを有する、この例では入力SVCビットストリーム120と同じであるSVCサブ・ビットストリーム150が抽出される。AVCビットストリームを完全に復号する第1の実施態様と比較して、図1のシステム100は、トランスコーディングを実行するので、復号および符号化のコストを節約する。
次に、第3の実施態様について述べる。第1の実施態様および第2の実施態様はともに効果的であるが、第3の実施態様は、通常はさらに効率的である。効率の向上は、第3の実施態様では、通常は第1および第2の実施態様よりも計算量が少なく、従って時間がかからないためである。さらに、効率の向上は、第3の実施態様では、通常は例えば一時的な符号化の結果を保存するのに必要となるメモリ/ディスク領域が少ないためである。
図2および図3を参照すると、第3の実施態様の2つの例が示してある。図2は、既存のビットストリームがSVCビットストリームである例を示す。図3は、既存のビットストリームがAVCビットストリームである例を示す。
図2を参照すると、システム200は、入力として、新たなAVCビットストリーム110および既存のSVCビットストリーム120の両方を受信する。システム200は、出力として、新たなSVCビットストリーム230を生成するが、これは、図1のSVCビットストリーム130と同じであることがある。出力ビットストリーム230のサブ・ストリームは、入力された既存のSVCビットストリーム120と同一である。出力ビットストリーム230の1つまたは複数の符号化増強レイヤは、新たなAVCビットストリーム110からの追加のビデオ・コンテンツ情報を含む。出力ビットストリーム230は、トランスコーダ240を用いて生成される。図1のトランスコーダ140は入力として1つのビットストリームしか受信しないが、トランスコーダ240は、2つの入力ビットストリームを受信する。
図3を参照すると、システム300は、入力として、新たなAVCビットストリーム110および既存のAVCビットストリーム320の両方を受信する。システム300は、出力として、新たなSVCビットストリーム330を生成する。出力ビットストリーム330のサブ・ストリームは、入力された既存のAVCビットストリーム320と同一である。出力ビットストリーム330の1つまたは複数の符号化増強レイヤは、新たなAVCビットストリーム110からの追加のビデオ・コンテンツ情報を含む。出力ビットストリーム330は、トランスコーダ340を用いて生成される。図1のトランスコーダ140は入力として1つのビットストリームしか受信しないが、トランスコーダ340は、トランスコーダ240と同様に、2つの入力ビットストリームを受信する。
トランスコーダ240、340の1つの特徴は、トランスコーダ240、340が、新たなAVCビットストリーム110および既存のAVC/SVCビットストリーム120、320の両方からの符号化情報を再使用することができることである。この再使用は、新たな出力SVCビットストリーム230、330の1つまたは複数の増強レイヤを得るために行われる。上述のように、トランスコーダ240、340は、通常は、従来のトランスコーダが図1に示すようにその主入力として通常は1つの符号化ビットストリームしかとらないので、従来のトランスコーダとは異なる。
トランスコーダ240、340の実施態様では、入力ビットストリームに含まれる情報を様々な方法で再使用することができる。これらの様々な方法では、例えば実施態様の複雑さと性能の間の兼ね合いを図る。
図4を参照すると、入力ビットストリームの情報を再使用する第1の実施態様が示してある。図4に限らないが、図中の破線で囲まれた部分は、任意選択の動作である。図4は、入力として、新たなAVCビットストリーム110および既存のAVC/SVCビットストリーム420の両方を受信するシステム400を含む。ビットストリーム420は、AVCビットストリームであってもSVCビットストリームであってもよく、例えば、既存のSVCビットストリーム120または既存のAVCビットストリーム320とすることができる。システム400は、出力として、出力SVCビットストリーム430を生成する。SVCビットストリーム430は、例えば、SVCビットストリーム130、230または330の何れかとすることができる。システム400は、トランスコーダ240、340の何れかの実施態様を与える。
システム400は、入力された新たなAVCビットストリーム110を完全に復号してYUVビデオ・シーケンスにするAVCデコーダ445を含む。この出力は、図4では、復号YUVビデオ448と呼ばれる。
システム400は、任意選択のAVC/SVCリエンコーダ450も含む。リエンコーダ450は、入力された既存のAVC/SVCビットストリーム420に対して作用して、既存のビットストリーム中の、参照レイヤとしての1つまたは複数の符号化要件に一致しない任意のピクチャ/スライス/マクロブロック(「MB」)を再符号化する。その例としては、シングル・ループ復号要件を満たすために、最高位の増強レイヤ中のイントラ符号化MBは、必要に応じて、参照レイヤによって「制約付きイントラ」モードに符号化されなければならない、というものが挙げられる。
非参照レイヤと比較して、参照レイヤでは符号化パラメータまたは符号化要件が異なるので、リエンコーダ450が必要となることがある。さらに、AVC/SVCビットストリーム420のレイヤが、ビットストリーム420では参照レイヤではないこともあるが、マージされた出力SVCビットストリーム430ではこのレイヤが参照レイヤとして使用されることもある。従って、このレイヤは、リエンコーダ450によって再符号化されることになる。例えば、入力AVC/SVCビットストリーム420のレイヤが、AVC/SVCビットストリーム420中で既に参照レイヤとして使用されている可能性があるので、リエンコーダ450は、任意選択である。AVC/SVCビットストリーム420から、いくつのレイヤまたはピクチャを、またどのレイヤまたはピクチャを再符号化するかを決定するのは、一般に実施の際に問題になる点である。新たなビットストリームが選択対象となる参照候補をより多く有するように、AVC/SVCビットストリーム420のより多くのレイヤまたはピクチャを「再符号化」することを選ぶ人もいれば、その逆の人もいる。なお、「再符号化」とは、少なくとも1つの実施態様では、AVC/SVCビットストリーム420内のイントラ符号化されたマクロブロックがある場合に、そのイントラ符号化されたマクロブロックを制約付きイントラ符号化マクロブロックに変化させる、一種のトランスコーディングであることに留意されたい。リエンコーダ450の出力は、参照レイヤ・ビットストリーム452と呼ばれる。例えば既存のAVC/SVCビットストリーム420に対して再符号化が必要ない場合には、参照レイヤ・ビットストリーム452は、既存のAVC/SVCビットストリーム420と同じであってもよいことを理解されたい。
システム400は、参照レイヤ・ビットストリーム452を受信するAVC/SVCシンタックス・パーサ455を含む。AVC/SVCシンタックス・パーサ455は、参照レイヤ・ビットストリーム452から、イントラ符号化MB、動きおよび残差信号に関する関連情報を抽出する。参照レイヤからの関連情報は、標準的なSVC増強レイヤ・エンコーダへの入力として周知である。
システム400は、増強レイヤ・エンコーダ460を含む。増強レイヤ・エンコーダ460は、AVC/SVCシンタックス・パーサ455から抽出情報を受信する。増強レイヤ・エンコーダ460は、完全に復号されたYUVビデオ・シーケンス448も受信する。増強レイヤ・エンコーダ460は、通常のSVCエンコーダの通常の増強レイヤ・エンコーダと同じである。詳細には、増強レイヤ・エンコーダ460は、レイヤ間の相関を活用するレイヤ間予測器463と、レイヤ内の相関を活用するレイヤ内予測器464とを含む予測モジュール462を含む。さらに、増強レイヤ・エンコーダ460は、予測モジュール462からの出力を受信して、予測(レイヤ間およびレイヤ内の両方)によって生じる予測残差を処理する変換/スケーリング/量子化モジュール466を含む。変換/スケーリング/量子化モジュール466は、残差ピクチャエネルギーを集中させる変換をいくつかの係数に適用することによって予測残差を処理し、次いで、スケーリングおよび量子化を実行して所望のビット・レートを発生させる。さらに、増強レイヤ・エンコーダ460は、変換/スケーリング/量子化モジュール466からの出力を受信し、符号化された動き情報および量子化された残差信号内における後の統計的冗長性を除去するエントロピ・エンコーダ468を含む。エントロピ・エンコーダ468は、増強レイヤ・エンコーダ460から出力される増強レイヤ・ビットストリーム469を生成する。
システム400は、増強レイヤ・ビットストリーム469および参照レイヤ・ビットストリーム452を受信するレイヤ結合器475も含む。レイヤ結合器475は、符号化された増強レイヤ・ビットストリーム469と、参照レイヤ・ビットストリーム452とをマージする。レイヤ結合器475は、所望の新たなSVCビットストリーム430を出力する。
上記で説明し、図4に示すように、システム400は、SVC増強レイヤ・エンコーダにいかなる変更も加えることなく、SVC増強レイヤ・エンコーダを使用する。これにより、実施態様の複雑さは大幅に低減される。システム400は、効果的且つ効率的である。ただし、システム400は、新たな入力AVCビットストリーム110の完全な復号、および増強レイヤの符号化を実行する。従って、システム400は、新たな入力AVCビットストリーム110の符号化情報は活用していない。
図5を参照すると、入力ビットストリームの情報を再使用する第2の実施態様が示してある。図5は、システム400と同様に、入力として新たなAVCビットストリーム110および既存のAVC/SVCビットストリーム420の両方を受信するシステム500を含む。システム500は、出力として、出力SVCビットストリーム430を生成する。システム500は、トランスコーダ240、340の何れかの実施態様を与える。以下に説明するように、システム500は、システム400とは異なり、入力AVCビットストリーム110の符号化情報を活用する。さらに、図5から分かるように、システム500は、空間領域での動作と比較して複雑さが低減される圧縮領域で動作する。
システム500の下側部分(図5に示される)は、既存のAVC/SVCビットストリーム430に対する動作に概ね対応し、システム400と同じである。すなわち、システム500は、AVC/SVCビットストリーム420をリエンコーダ450に与える。リエンコーダ450は、参照レイヤ・ビットストリーム452を生成し、この参照レイヤ・ビットストリーム452を、AVC/SVCシンタックス・パーサ455およびレイヤ結合器475の両方に与える。
しかし、システム500の上側半分(図5に示される)は、システム400とは異なる。この上側部分は、新たなAVCビットストリーム110に対する動作に概ね対応する。
システム500は、上側半分に、入力された新たなAVCビットストリーム110を受信するAVCシンタックス・パーサ545を含む。AVCシンタックス・パーサ545は、各MBの圧縮領域中の符号化情報を抽出する。符号化情報としては、例えば、符号化モード、動き(例えば動きベクトル)および残差信号(例えば残差信号を符号化するDCT係数)を示す情報が挙げられる。抽出された符号化情報によって、システム500は、元の符号化モード(以下でさらに詳細に説明する)の符号化コストを計算することができる。抽出された符号化情報によって、システム500は、元の符号化モード(以下でさらに詳細に説明する)よりレイヤ間予測モードの方が符号化コストがよい場合には、レイヤ間予測モードを用いてMBを再符号化することもできる。
システム500は、AVCシンタックス・パーサ545から抽出された符号化情報を受信するモード判断モジュール560を含む。モード判断モジュール560は、AVC/SVCシンタックス・パーサ455から、参照レイヤ中の同じ位置にあるMBから抽出したこれに対応する情報も受信する。参照レイヤは、既存のAVC/SVCビットストリーム420のものである。
モード判断モジュール560は、新たなAVCビットストリーム110内の各MBの符号化モードを評価する。モード判断モジュール560は、AVCビットストリーム110中のMBの元の符号化モードに関連する符号化コスト、ならびに当該MBをSVCから利用できるレイヤ間予測モードの1つまたは複数で符号化した場合に生じるであろう符号化コストを計算し、比較する。
システム500は、任意選択のレイヤ間予測モード・リエンコーダ570を含む。モード判断モジュール560が、SVCレイヤ間予測モードのうちの1つが最低の符号化コストを有すると判定した場合には、AVCビットストリーム110の評価中の特定のMBを、選択したレイヤ間予測モードを用いて再符号化する。レイヤ間予測モード・リエンコーダ570は、この再符号化を実行する。
モード判断モジュール560が、所与のMBについて、AVCビットストリーム110からの元の符号化モードが最低の符号化コストを有すると判定した場合には、当該MBの再符号化は不要である。従って、レイヤ間予測モード・リエンコーダ570は迂回される、またはパス・スルーとして扱われる。この場合には、当該の所与のMBは、新たなAVCビットストリーム110からの符号化を保持し、既存のAVC/SVCビットストリーム420に依存しない(すなわち既存のAVC/SVCビットストリーム420を参照として使用しない)。
システム500は、任意選択の残差リエンコーダ580を含む。残差リエンコーダ580は、特定のMBに関連する符号化残差信号があるかどうかを判定する。符号化残差信号がある場合には、残差リエンコーダ580は、SVCレイヤ間残差予測機構を使用することにより、冗長性をさらに低減しようと試みる。これは、当業者には周知の標準的なSVC符号化ステップである。残差リエンコーダ580は、(i)レイヤ間予測モード・リエンコーダ570からの再符号化出力を受信してこれに作用する、または(ii)レイヤ間予測モード・リエンコーダ570が迂回されている場合には、AVCビットストリーム110からのMBの元の符号化を受信してこれに作用する。残差リエンコーダ580の出力は、増強レイヤ・ビットストリーム469と同じであることもある増強レイヤ・ビットストリーム585である。なお、符号化残差信号がない場合には、残差リエンコーダ580は、迂回する、またはパス・スルーとして扱うことができることに留意されたい。
レイヤ結合器475は、増強レイヤ・ビットストリーム585と参照レイヤ・ビットストリーム452を結合する(またはマージするとも呼ばれる)。結合されたビットストリームは、レイヤ結合器475から、出力SVCビットストリーム430として出力される。システム400と比較すると、システム500は、新たなAVCビットストリーム110からの符号化情報を利用して増強レイヤの符号化を補助するので、全体的な複雑さおよびメモリ/ディスク領域要件が通常は軽減される。システム400がピクセル領域トランスコーダと呼ばれるのに対して、システム500は、シンタックス領域トランスコーダと呼ばれる。
上述のように、モード判断モジュール560は、様々なモードのコスト計算を実行する。ここで、一実施態様について述べる。ただし、その他の実施態様、ならびにここで述べる実施態様のその他の詳細が、当業者のレベルの十分範囲内であることは明らかである。AVCビットストリーム110の既存の符号化モードの符号化コストは、考慮中のMBの残差を符号化するのに必要なビットを調べることによって決定することができる。別の実施態様では、コスト計算時に、符号化モードを示すのに必要なビット、動きベクトルを与えるのに必要なビットおよび参照ピクチャを示すのに必要なビットも含めて、全てのビットを考慮する。しかし、符号化コストが利用可能な複数のモードの中で最低であるかどうかは、残差に必要なビットによって決まることが多い。実施態様では、様々な異なる符号化モードを比較できるものであればどのような方法で符号化コストを決定してもよい。圧縮領域で動作する実施態様では、様々な符号化モードの厳密な符号化コストを計算しなくてもそれらのモードの符号化コストを比較することが可能であり、その比較を行えば十分であることが多い。
他のSVCモードの符号化コストも、モード判断モジュール560によって計算される。一実施態様では、以下の解析を実行して、符号化コストを計算する。3つの異なるタイプの増強レイヤ符号化(既存のAVC/SVCビットストリーム420を参照として使用した既存のAVCビットストリーム110のMBの符号化)、すなわちインター符号化、イントラ符号化および残差再符号化を考える。この実施態様は、可能な全ての符号化モードを明確に評価するわけではないという点で、必ずしも最適ではない。しかし、その他の実施態様では、可能な全ての符号化モードを評価するので、最適である。
インター符号化は、増強レイヤの元の符号化モードがインター符号化モードであり、且つベース・レイヤの符号化モードがインター符号化モードである場合に増強レイヤのMBを符号化する際に考慮される。このシナリオでは、増強レイヤは、動きベクトルや参照フレーム・インデックス、パーティション・サイズなどの動き情報を借用しており、ベース・レイヤの完全な再構築は実行しない。これにより、計算の複雑さが軽減されるという利点が得られる。借用した動きベクトルを使用して、増強レイヤの予測子を見つける。その結果として、適当な動きベクトルを見つけるための参照フレーム内の探索は実行されない。動き補償(動きベクトルの探索)は計算負荷の高い動作であることが多いので、これによっても、計算の複雑さが軽減されるという利点が得られる。ベース・レイヤの動き情報によって与えられる予測子を使用し、残差を計算する。このシナリオでは、ベース・レイヤの予測子に基づいて残差を計算できるようにするために、増強レイヤの復号を行う。残差を計算した後で、当該のインター符号化モードの符号化コストを評価することができる。
イントラ符号化は、増強レイヤの元の符号化モードがイントラ符号化モードであり、且つベース・レイヤの符号化モードがイントラ符号化モードである場合に増強レイヤのMBを符号化する際に考慮される。このシナリオでは、同じ位置にあるベース・レイヤのMBを、増強レイヤの予測子(参照)として使用できるように、復号(再構築)する。パーティション・サイズは、ベース・レイヤから借用する。さらに、増強レイヤのMBも復号する。しかし、動き補償は不要である。残差を計算した後で、ベース・レイヤの予測子に対して、当該のイントラ符号化モードの符号化コストを決定することができる。
残差再符号化は、残差を生成する全てのモードについて考慮される。詳細には、同じ位置にあるベース・レイヤのMBの残差を、増強レイヤの残差の予測子として使用する。ベース・レイヤのDCT係数を調べ、ベース・レイヤの残差を再構築し、増強レイヤの解像度までアップサンプリングし、アップサンプリングによって再構築したものを増強レイヤの残差の予測子として使用する。次いで、ベース・レイヤの残差の予測子に基づいて新たな残差を計算する。この新たな残差は、通常は、符号化利得をもたらすので、符号化コストを低減することになる。もちろん、符号化コストが低減されない場合には、残差再符号化をスキップして、以前の符号化結果を使用することができる。
残差再符号化では、増強レイヤの各マクロブロックを、イントラ符号化モードまたはインター符号化モードの何れか(もしくは上述のように新たなAVCビットストリーム110の元の符号化モード)とすることができる選択した符号化モードで最初に符号化することは、明らかであろう。しかし、上述のように、残差再符号化のさらなる動作が実行される。上述のように、「残差再符号化」は、通常は、符号化利得をもたらすので、符号化コストを低下させる。
実際には、残差再符号化は、任意のイントラ符号化モードまたはインター符号化モードに適用することができる。モード判断モジュール560は、一実施態様では、任意のイントラ符号化モードまたはインター符号化モードについて(ならびに新たなAVCビットストリーム110の元の符号化モードについて)2つのコスト計算を実行する。第1のコスト計算では、追加の残差再符号化演算を行わない。第2のコスト計算では、追加の残差再符号化演算を行う。さらに、残差再符号化では、動き補償が不要であることに留意されたい。残差再符号化では、ベース・レイヤの残差を復号する必要がある(また、新たなAVCビットストリーム110の元の符号化モードを考慮している場合には、元の増強レイヤの残差を復号する必要がある)。しかし、残差再符号化では、ベース・レイヤの(または増強レイヤの)完全な再構築が不要である。また、完全な再構築を行うと、通常は、ベース・レイヤ(または増強レイヤ)の予測子を決定し、復号した残差をベース・レイヤ(または増強レイヤ)の予測子に付加することが必要になる。
また、システム400は、同じ位置にあるベース・レイヤのMBから動き情報を借用するインター符号化モードでは動き補償が不要であることに留意されたい。さらに、システム400は、インター符号化モードを使用して増強レイヤのMBを符号化する場合には、ベース・レイヤを復号する必要がない。
図11を参照すると、ビットストリームをトランスコーディングする実施態様の一例であるプロセス1200が示してある。プロセス1200は、データ・シーケンスの第1のAVC符号化にアクセスすること(1210)、および当該データ・シーケンスの第2のAVC符号化にアクセスすること(1220)を含む。第2のAVC符号化は、第1のAVC符号化とは品質が異なる。
プロセス1200は、第1のAVC符号化と第2のAVC符号化をマージして、AVCのSVC拡張を使用する第3のAVC符号化にすること(1230)を含む。このマージは、(i)第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、(ii)第2のAVC符号化が第3のAVC符号化の少なくとも第2のレイヤを占め、(iii)第1のレイヤまたは第2のレイヤの少なくとも一方を第1のレイヤまたは第2のレイヤの他方の参照レイヤとして使用することによって、第1のレイヤと第2のレイヤの間の少なくとも一部の相関が活用されるように、実行される。
プロセス1200は、例えば、システム200、300、400、500または700の何れかのトランスコーダが使用することができる。さらに、プロセス1200を使用して、例えば、(i)メディア・ボールト710に保存され、(ii)以下に述べる図10に示す受信器などの受信器によって出力され、且つ/または(iii)以下に述べる図6または図9に示すエンコーダなどのエンコーダによって符号化されたビットストリームをマージすることができる。さらに、プロセス1200を使用して、例えば、マージされたビットストリームを、(i)メディア・ボールト710への保存に、(ii)以下に述べる図9に示す伝送器などの伝送器による伝送に、且つ/または(iii)以下に述べる図8または図10に示すデコーダなどのデコーダによる復号に提供することができる。従って、様々な実施態様で、トランスコーダ、またはその他の適当に構成された処理デバイスが、(i)図6のエンコーダ600の出力、(ii)図8のデコーダ1100の入力、(iii)図9のエンコーダ4302と伝送器4304の間、および/または(iv)図10の受信器4402とデコーダ4406の間に含まれることは明らかであろう。
図6を参照すると、エンコーダ600は、例えばビデオ画像または奥行き画像などの画像を符号化するために使用することができるエンコーダの実施態様を示している。一実施態様では、エンコーダ600は、新たなAVCビットストリーム110を形成する画像を符号化する。エンコーダ600は、例えば、符号化ビットストリームに関する情報を与えるメタデータなどのデータを符号化するために使用することもできる。エンコーダ600は、例えば図9を参照して以下で述べるようなビデオ伝送システムの一部として実装することができる。入力画像シーケンスは、加算器601ならびに変位補償ブロック620および変位推定ブロック618に到着する。なお、変位とは、例えば動きまたは視差を指すことに留意されたい。加算器601に対するもう1つの入力は、スイッチ623を介して受信される様々な可能な参照ピクチャ情報のうちの1つである。
例えば、スイッチ623と信号通信しているモード判断モジュール624が、符号化モードは、現在符号化しているのと同じブロックまたはスライスを基準とするイントラ予測でなければならないと判定した場合には、加算器は、イントラ予測モジュール622からその入力を受信する。あるいは、モード判断モジュール624が、符号化モードは、現在符号化しているブロックまたはスライスとは異なるブロックまたはスライスを基準とした変位の補償および推定でなければならないと判定した場合には、加算器は、変位補償モジュール620からその入力を受信する。
加算器601は、変換モジュール602に信号を提供し、変換モジュール602は、その入力信号を変換して、変換信号を量子化モジュール604に提供するように構成されている。量子化モジュール604は、その受信信号に対して量子化を実行して、量子化情報をエントロピ・エンコーダ605に出力するように構成されている。エントロピ・エンコーダ605は、その入力信号に対してエントロピ符号化を実行して、ビットストリームを生成するように構成されている。逆量子化モジュール606は、量子化モジュール604から量子化信号を受信して、この量子化信号に対して逆量子化を実行するように構成されている。また、逆変換モジュール608は、この逆量子化信号をモジュール606から受信して、その受信信号に対して逆変換を実行するように構成されている。モジュール606および608は、加算器601から出力された信号を再生または再構築する。
加算器または結合器609は、逆変換モジュール608およびスイッチ623から受信した信号を加算(結合)して、その結果得られた信号を、イントラ予測モジュール622およびループ内フィルタ610に出力する。さらに、イントラ予測モジュール622は、その受信信号を用いて、上述のようにイントラ予測を実行する。同様に、ループ内フィルタ610は、加算器609から受信した信号をフィルタリングして、フィルタリング済み信号を参照バッファ612に提供し、参照バッファ612が、変位推定モジュール618および変位補償モジュール620に画像情報を与える。
符号化メタデータとしてメタデータをエンコーダ600に付加して、エントロピ・エンコーダ605からの出力ビットストリームと結合することができる。あるいは、例えば、未符号化メタデータをエントロピ・エンコーダ605に入力して、量子化画像シーケンスとともにエントロピ符号化することができる。
図8を参照すると、デコーダ1100は、画像を復号して、それらの復号した画像を例えばTV740などのディスプレイ・デバイスに提供するために使用することができるデコーダの実施態様を示している。デコーダ1100は、例えば復号ビットストリームに関する情報を与えるメタデータを復号するために使用することもできる。デコーダ1100は、例えば図10を参照して以下で述べるようなビデオ受信システムの一部として実装することができる。
デコーダ1100は、ビットストリーム受信器1102を用いてビットストリームを受信するように構成することができ、ビットストリーム受信器1102は、ビットストリーム・パーサ1104と信号通信しており、ビットストリームをパーサ1104に提供する。ビットストリーム・パーサ1104は、残差ビットストリームをエントロピ・デコーダ1106に伝送し、制御シンタックス要素をモード選択モジュール1116に伝送し、変位(動き/視差)ベクトル情報を変位補償モジュール1126に伝送するように構成することができる。逆量子化モジュール1108は、エントロピ・デコーダ1106から受信したエントロピ復号信号に対して逆量子化を実行するように構成することができる。さらに、逆変換モジュール1110は、逆量子化モジュール1108から受信した逆量子化信号に対して逆変換を実行し、逆変換信号を加算器または結合器1112に出力するように構成することができる。
加算器1112は、利用する復号モードに応じて、様々なその他の信号のうちの1つを受信することができる。例えば、モード判断モジュール1116は、制御シンタックス要素を構文解析および解析することにより、エンコーダによって現在処理されているブロックに対して実行されたのが変位補償であるのかイントラ予測符号化であるのかを判定することができる。判定されたモードによっては、モード選択制御モジュール1116は、制御シンタックス要素に基づいてスイッチ1117にアクセスしてこれを制御して、加算器1112が変位補償モジュール1126またはイントラ予測モジュール1118から信号を受信できるようにすることができる。
ここで、イントラ予測モジュール1118は、例えば、現在復号されているのと同じブロックまたはスライスを参照してブロックまたはスライスを復号するようにイントラ予測を実行するように構成することができる。また、変位補償モジュール1126は、例えば、現在処理しているのと同じフレームのブロックまたはスライスを参照して、あるいは現在復号しているブロックまたはスライスとは異なる以前に処理された別のフレームのブロックまたはスライスを参照して、ブロックまたはスライスを復号するように変位補償を実行するように構成することができる。
予測情報信号または補償情報信号を受信した後で、加算器1112は、この予測情報信号または補償情報信号を逆変換信号と加算して、例えばデブロッキング・フィルタなどのループ内フィルタ1114に伝送することができる。ループ内フィルタ1114は、その入力信号をフィルタリングして、復号ピクチャを出力するように構成することができる。加算器1112は、加算信号を、イントラ予測に使用できるようにイントラ予測モジュール1118に出力することもできる。さらに、ループ内フィルタ1114は、フィルタリング済み信号を参照バッファ1120に伝送することができる。参照バッファ1120は、その受信信号を構文解析して、要素1126による変位補償復号を可能にし、これを助けるように構成することができる。要素1126に対して、参照バッファ1120は、構文解析済みの信号を提供する。このような構文解析済みの信号は、例えば、様々な画像の全てまたは一部とすることができる。
ビットストリーム受信器1102に提供されるビットストリームに、メタデータを含めることができる。メタデータは、ビットストリーム・パーサ1104が構文解析し、エントロピ・デコーダ1106が復号することができる。復号されたメタデータは、出力(図示せず)を用いたエントロピ復号の後でデコーダ110から抽出することができる。
次に図9を参照すると、上述の特性および原理を適用することができるビデオ伝送システム/装置4300が示してある。ビデオ伝送システム4300は、例えば、例えば衛星、ケーブル、電話回線、または地上波放送などの様々な媒体の何れかを用いて信号を伝送するヘッドエンドまたは伝送システムとすることができる。伝送は、インターネットまたは他の何らかのネットワークを介して行うことができる。ビデオ伝送システム4300は、例えば奥行き値および/または視差値を含む、例えば奥行きの指標など、例えばビデオ・コンテンツおよびその他のコンテンツを生成して配信することができる。
ビデオ伝送システム4300は、エンコーダ4302および符号化信号を伝送することができる伝送器4304を含む。エンコーダ4302は、例えば画像および奥行き指標を含むことができるビデオ情報を受信し、このビデオ情報に基づいて1つまたは複数の符号化信号を生成する。エンコーダ4302は、例えば、上記で詳細に説明したエンコーダのうちの1つとすることができる。エンコーダ4302は、例えば様々な情報を受信して、保存または伝送用の構造化フォーマットにアセンブルするアセンブリ・ユニットなどのサブ・モジュールを含むことができる。これらの様々な情報としては、例えば、符号化または未符号化ビデオ、符号化または未符号化奥行き指標および/または情報、ならびに例えば動きベクトル、符号化モード指標、シンタックス要素などの符号化または未符号化要素が挙げられる。
伝送器4304は、例えば、符号化ピクチャおよび/またはそれに関連する情報を表す1つまたは複数のビットストリームを有するプログラム信号を伝送するようにすることができる。通常の伝送器は、例えば、誤り訂正符号化を行う、信号中のデータのインタリーブを行う、信号中のエネルギーのランダム化を行う、変調器4306を用いて信号を1つまたは複数の搬送波に変調するなどの機能の1つまたは複数を実行する。伝送器4304は、アンテナ(図示せず)を含む、またはこれとインタフェースをとることができる。さらに、伝送器4304のいくつかの実施態様は、変調器を含む、または変調器に限定することができる。
次に図10を参照すると、上述の特性および原理を適用することができるビデオ受信システム/装置4400が示してある。ビデオ受信システム4400は、例えば衛星、ケーブル、電話回線、または地上波放送などの様々な媒体を介して信号を受信するように構成することができる。信号は、インターネットまたは他の何らかのネットワークを介して受信することができる。
ビデオ受信システム4400は、例えば、携帯電話、コンピュータ、セット・トップ・ボックス、テレビジョン、あるいは符号化ビデオを受信して、例えば復号したビデオをユーザに対して表示する、または保存するために提供するその他のデバイスとすることができる。従って、ビデオ受信システム4400は、その出力を、例えばTV740などのテレビジョンのスクリーン、コンピュータ・モニタ、コンピュータ(保存、処理または表示のため)、メディア・ボールト710、あるいはその他の何らかの保存、処理またはディスプレイ・デバイスに与えることができる。
ビデオ受信システム4400は、ビデオ情報を含むビデオ・コンテンツを受信して、処理することができる。ビデオ受信システム4400は、例えば本願の実施態様で説明した信号などの符号化信号を受信することができる受信器4402と、この受信信号を復号することができるデコーダ4406とを含む。
受信器4402は、例えば、符号化ピクチャを表す複数のビットストリームを有するプログラム信号を受信するようにすることができる。通常の受信器は、例えば、変調および符号化データ信号を受信する、復調器4404を用いて1つまたは複数の搬送波からデータ信号を復調する、信号中のエネルギーをランダム化解除する、信号中のデータのインタリーブ解除を行う、信号を誤り訂正復号するなどの機能の1つまたは複数を実行する。受信器4402は、アンテナ(図示せず)を含む、またはこれとインタフェースをとることができる。受信器4402のいくつかの実施態様は、復調器を含む、または復調器に限定することができる。
デコーダ4406は、例えばビデオ情報を含むビデオ信号を出力する。デコーダ4406は、例えば、上記で詳細に説明したデコーダ1100とすることができる。
様々な実施態様で、「画像」、「ビデオ」または「フレーム」について言及している。これらの実施態様は、より一般的には、例えば様々なビデオ構成要素またはそれらの組合せの何れかを含むことができる「ピクチャ」に適用することができる。これらの構成要素またはそれらの組合せとしては、例えば、輝度、クロミナンス、(YUVまたはYCbCrまたはYPbPrの)Y、(YUVの)U、(YUVの)V、(YCbCrの)Cb、(YCbCrの)Cr、(YPbPrの)Pb、(YPbPrの)Pr、(RGBの)赤、(RGBの)緑、(RGBの)青、S−Video、およびこれらの構成要素の何れかのネガティブまたはポジティブが挙げられる。「ピクチャ」は、例えば、フレーム、フィールドまたは画像を指すこともできる。これに加えて、またはこれに代えて、「ピクチャ」という用語は、例えば通常の2次元ビデオ、2Dビデオ・ピクチャの視差マップまたは2Dビデオ・ピクチャに対応する奥行きマップなどの様々な異なるタイプのコンテンツを指すことができる。
本発明の原理の「一実施例」もしくは「実施例」または「一実施態様」もしくは「実施態様」、ならびにその他のそれらの変形例と述べている場合、それは、当該実施例に関連して述べられる特定の特性、構造、特徴などが、本発明の原理の少なくとも1つの実施例に含まれるという意味である。従って、本明細書の様々な箇所に見られる「一実施例において」もしくは「実施例において」または「一実施態様において」もしくは「実施態様において」という表現、ならびにその他の任意の変形例の記載は、その全てが必ずしも同じ実施例を指しているわけではない。
さらに、本願または本願の特許請求の範囲では、様々な情報を「決定する」ことについて言及していることがある。情報を決定するということには、例えば、情報を推定すること、情報を計算すること、情報を予測すること、情報を特定すること、またはメモリから情報を取り出すことなどの1つまたは複数が含まれる可能性がある。
例えば「A/B」、「Aおよび/またはB」ならびに「AおよびBの少なくとも1つ」の場合において、「/」、「および/または」ならびに「の少なくとも1つ」の何れかを使用することは、1番目に挙げた選択肢(A)のみを選択すること、または2番目に挙げた選択肢(B)のみを選択すること、または両方の選択肢(AおよびB)を選択することを含むということであることを理解されたい。さらに別の例として、「A、Bおよび/またはC」、「A、BおよびCの少なくとも1つ」ならびに「A、BまたはCの少なくとも1つ」の場合には、この表現は、1番目に挙げた選択肢(A)のみを選択すること、または2番目に挙げた選択肢(B)のみを選択すること、または3番目に挙げた選択肢(C)のみを選択すること、または1番目と2番目に挙げた選択肢(AおよびB)のみを選択すること、または1番目と3番目に挙げた選択肢(AおよびC)のみを選択すること、または2番目と3番目に挙げた選択肢(BおよびC)のみを選択すること、または3つ全ての選択肢(AおよびBおよびC)を選択することを含むということである。当技術分野および関連技術分野の当業者には容易に分かるように、このことは、列挙されている項目の数の分だけ拡張することができる。
特定の特性および特徴を有する1つまたは複数の実施態様は、それらによって実現される。しかし、これらの実施態様の変形例およびさらなる応用例が考えられ、これらは本開示の範囲であり、記載した実施態様の特性および特徴は、その他の実施態様に適応させることができる。
例えば、これらの実施態様は、3つ以上のビットストリームのグループのマージに拡張することができる。また、これらの実施態様は、例えばマルチビュー符号化(MVC)のH.264/MPEG−4 AVC(AVC)の拡張(AVC規格のAnnex H)、MPEG−2、3D Video Coding(3DV)およびHigh−Performance Video Coding(HVC)の提案するMPEG/JVT規格、ならびにMPEG−C Part 3(International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC)23002−3)など、AVCおよびSVCを超える様々な規格に適用されるように拡張することができる。さらに、(既存のまたは将来の)その他の規格を使用することができる。もちろん、これらの実施態様および特性は、規格で使用されなくてもよい。さらに、本発明の原理は、ビデオを符号化する状況および/または例えば奥行きデータや視差データなどその他のタイプのデータを符号化する状況で使用することもできる。
さらに別の例として、別の実施態様では、新たなAVCビットストリーム110の代わりに新たなSVCビットストリームを使用する。この実施態様では、2つのSVCビットストリームのマージ、または新たなSVCビットストリームと既存のAVCビットストリームのマージが可能となる。
さらに別の実施態様では、新たなビットストリーム(AVCまたはSVC)の品質の方が既存のビットストリーム(AVCまたはSVC)より低い。このような一実施態様では、新たなビットストリームをマージ後のビットストリームのベース・レイヤとして使用する。
上記実施態様の別の変形例では、第1のビットストリームがAVCビットストリームで、第2のビットストリームが2つの品質フォーマットを有するSVCビットストリームである。2つの品質フォーマットのうちの第1のフォーマットは、AVCビットストリームよりも品質が低い。2つの品質フォーマットのうちの第2のフォーマットは、AVCビットストリームよりも品質が高い。マージ後のビットストリームでは、(SVCビットストリームの)2つの品質フォーマットのうちの第1のフォーマットが、第1のビットストリームのベース・レイヤとして使用される。
本明細書に記載する実施態様は、例えば、方法またはプロセス、装置、ソフトウェア・プログラム、データ・ストリーム、あるいは信号において実施することができる。1つの形態の実施態様の状況でしか述べていない(例えば方法としてしか述べていない)場合でも、記載した特性の実施態様は、その他の形態(例えば装置やプログラム)で実施することもできる。装置は、例えば適当なハードウェア、ソフトウェア、およびファームウェアにおいて実施することができる。方法は例えば、例えばコンピュータ、マイクロプロセッサ、集積回路またはプログラマブル論理デバイスなどの処理デバイス一般を指す、例えばプロセッサなどの装置において実施することができる。プロセッサとしては、例えばコンピュータ、携帯電話、携帯情報端末(「PDA」)、およびエンド・ユーザ間での情報の通信を容易にするその他のデバイスなどの通信デバイスも挙げられる。
本明細書に記載した様々なプロセスおよび特性の実施態様は、様々な異なる機器またはアプリケーションで実施することができ、具体的には、例えば、データの符号化および復号に関連する機器またはアプリケーションで実施することができる。このような機器の例としては、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、エンコーダへの入力を提供するプリプロセッサ、ビデオ・コーダ、ビデオ・デコーダ、ビデオ・コーデック、ウェブ・サーバ、セット・トップ・ボックス、ラップトップ、パーソナル・コンピュータ、携帯電話、PDA、およびその他の通信デバイスが挙げられる。機器は、移動機器であっても、移動可能な車両に設置したものであってもよいことは明らかであろう。
さらに、これらの方法は、プロセッサによって命令を実行することによって実施することができ、これらの命令(および/または実施態様により生成されるデータ値)は、例えば集積回路、ソフトウェア・キャリア、あるいは例えばハード・ディスク、コンパクト・ディスク、ランダム・アクセス・メモリ(「RAM」)、または読取り専用メモリ(「ROM」)などその他の記憶デバイスなどのプロセッサ可読媒体に保存することができる。これらの命令は、プロセッサ可読媒体上に有形に実装されるアプリケーション・プログラムを形成することができる。命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、または組合せに含めることができる。命令は、例えば、オペレーティング・システム、別個のアプリケーション、またはその両者の組合せに見ることができる。従って、プロセッサは、例えば、プロセスを実行するように構成されたデバイスおよびプロセスを実行するための命令を有するプロセッサ可読媒体(記憶デバイスなど)を含むデバイスの両方の特徴を有することができる。さらに、プロセッサ可読媒体は、命令に加えて、または命令の代わりに、実施態様によって生成されるデータ値を保存することができる。
実施態様は、例えば保存または伝送することができる情報を担持するようにフォーマット化された様々な信号を生成することができることは、当業者には明らかであろう。このような情報としては、例えば、方法を実行するための命令、または記載した実施態様の1つによって生成されるデータが挙げられる。このような信号は、例えば、(例えばスペクトルの無線周波部分を用いて)電磁波として、またはベースバンド信号として、フォーマット化することができる。フォーマット化は、例えば、データ・ストリームの符号化、および符号化データ・ストリームによる搬送波の変調を含むことができる。信号が担持する情報は、例えば、アナログ情報またはディジタル情報とすることができる。信号は、既知の通り、様々な異なる有線または無線リンクを介して伝送することができる。信号は、プロセッサ可読媒体に保存することができる。
いくつかの実施態様について説明した。しかし、様々な修正を加えることができることを理解されたい。例えば、異なる実施態様の要素を組み合わせて、補足して、修正して、または除去して、その他の実施態様を生み出すことができる。さらに、その他の構造およびプロセスを、開示した構造およびプロセスの代わりに用いることができ、その結果得られる実施態様では、開示した実施態様と少なくとも実質的に同じ1つまたは複数の機能が、少なくとも実質的に同じ1つまた複数の方法で実行されて、少なくとも実質的に同じ1つまた複数の結果が得られることは、当業者なら理解するであろう。従って、本開示は上記の実施態様およびその他の実施態様を企図するものであり、それらの実施態様は、本開示の範囲に含まれる。

Claims (28)

  1. データ・シーケンスの第1のAVC符号化にアクセスするステップと、
    前記第1のAVC符号化とは品質が異なる前記データ・シーケンスの第2のAVC符号化にアクセスするステップと、
    前記第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、前記第2のAVC符号化が前記第3のAVC符号化の少なくとも第2のレイヤを占めるように、前記第1のAVC符号化と前記第2のAVC符号化をマージしてAVCのSVC拡張を使用する前記第3のAVC符号化にする、マージするステップであって、前記第1のレイヤまたは前記第2のレイヤの少なくとも一方が、前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤであるステップと、
    を含む、方法。
  2. 前記第1のAVC符号化または前記第2のAVC符号化の一方のブロックが、前記第1のAVC符号化または前記第2のAVC符号化の他方のブロックを符号化するための参照ブロックとなる、請求項1に記載の方法。
  3. マージするステップが、前記第1のAVC符号化のシンタックスを解析するステップを含む、請求項1に記載の方法。
  4. マージするステップが、前記解析されたシンタックスに対応する前記第1のAVC符号化のマクロブロックを再構築することなく、前記解析されたシンタックスに基づいて所与のマクロブロックのエンハンスメント・レイヤ符号化を実行するステップをさらに含む、請求項に記載の方法。
  5. 前記エンハンスメント・レイヤ符号化が、前記第1のAVC符号化に対して実行され、
    前記所与のマクロブロックの前記エンハンスメント・レイヤ符号化で、前記所与のマクロブロックを再構築せずに、前記所与のマクロブロックの前記第1のAVC符号化の符号化モードを使用する、請求項に記載の方法。
  6. 前記エンハンスメント・レイヤ符号化が、前記第1のAVC符号化をベース・レイヤとして使用して前記第2のAVC符号化に対して実行され、
    前記所与のマクロブロックの前記エンハンスメント・レイヤ符号化で、前記所与のマクロブロックを再構築せずに、前記所与のマクロブロックと同じ位置にあるマクロブロックの前記第1のAVC符号化からの動き情報を使用する、請求項に記載の方法。
  7. マージするステップが、前記第2のAVC符号化のシンタックスを解析するステップをさらに含む、請求項に記載の方法。
  8. 前記エンハンスメント・レイヤ符号化が、前記第1のAVC符号化をベース・レイヤとして使用して前記第2のAVC符号化に対して実行され、
    前記所与のマクロブロックの前記エンハンスメント・レイヤ符号化で、前記所与のマクロブロックを再構築せずに、前記所与のマクロブロックの前記第2のAVC符号化の符号化モードを使用する、請求項に記載の方法。
  9. マージするステップが、
    前記第3のAVC符号化に、前記第1のAVC符号化の少なくとも一部分によって占められるベース・レイヤを形成するステップと、
    前記第3のAVC符号化に、前記第2のAVC符号化の少なくとも一部分によって占められるエンハンスメント・レイヤを形成するステップと、
    を含み、前記エンハンスメント・レイヤを形成するステップが、前記所与のマクロブロックの動き補償を実行することなく、前記ベース・レイヤ中の同じ位置にあるマクロブロックからの動き情報を使用して前記第2のAVC符号化の所与のマクロブロックを符号化するステップを含む、請求項1に記載の方法。
  10. マージするステップが、
    前記第3のAVC符号化にベース・レイヤを形成するステップと、
    前記第3のAVC符号化に、前記第1のAVC符号化の少なくとも一部分によって占められるエンハンスメント・レイヤを形成するステップと、
    を含み、前記エンハンスメント・レイヤを形成するステップが、前記第1のAVC符号化の前記一部分の所与のマクロブロックを符号化してエンハンスメント・レイヤ残差を生成するステップと、前記ベース・レイヤ中の同じ位置にあるマクロブロックの符号化の残差に基づく予測子を使用することによって、前記エンハンスメント・レイヤ残差の残差再符号化を実行するステップと、
    を含む、請求項1に記載の方法。
  11. 残差再符号化を実行するステップが、
    DCT係数から前記ベース・レイヤ残差を再構築するステップと、
    必要に応じて、前記再構築されたベース・レイヤ残差を前記エンハンスメント・レイヤの解像度までアップサンプリングして前記予測子を生成するステップと
    を含む、請求項10に記載の方法。
  12. マージするステップが、
    前記第1のAVC符号化の少なくとも一部分を前記第3のAVC符号化のベース・レイヤとして使用するステップと、
    前記第1のAVC符号化のシンタックスを解析するステップと、
    前記第2のAVC符号化のシンタックスを解析するステップと、
    前記第1のAVC符号化の前記解析されたシンタックスおよび前記第2のAVC符号化の前記解析されたシンタックスを使用して、前記第3のAVC符号化のエンハンスメント・レイヤとして前記第2のAVC符号化の少なくとも一部分を符号化するステップと、
    を含む、請求項1に記載の方法。
  13. マージするステップが、
    前記第2のAVC符号化の前記一部分の所与のマクロブロックの前記解析されたシンタックスを評価するステップと、
    前記第1のAVC符号化の前記一部分の同じ位置にあるマクロブロックの前記解析されたシンタックスを評価するステップと、
    前記所与のマクロブロックの元の符号化モードと前記同じ位置にあるマクロブロックの元の符号化モードがイントラ符号化モードである場合には、前記同じ位置にあるマクロブロックを再構築したものを前記所与のマクロブロックの参照として使用するステップと、
    前記所与のマクロブロックの前記元の符号化モードと前記同じ位置にあるマクロブロックの前記元の符号化モードがインター符号化モードである場合には、前記同じ位置にあるマクロブロックからの動き情報を使用して前記所与のマクロブロックを符号化するステップと、
    前記所与のマクロブロックの前記元の符号化モードと前記同じ位置にあるマクロブロックの前記元の符号化モードの両方がイントラ符号化モードではない、またはインター符号化モードではない場合には、前記所与のマクロブロックの符号化モードを使用して前記所与のマクロブロックを符号化するステップと、
    をさらに含む、請求項12に記載の方法。
  14. マージするステップが、前記所与のマクロブロックの符号化によって生じるエンハンスメント・レイヤ残差の残差再符号化を実行するステップをさらに含む、請求項13に記載の方法。
  15. マージするステップが、
    前記第1のAVC符号化の少なくとも一部分を前記第3のAVC符号化のベース・レイヤとして使用するステップと、
    前記第2のAVC符号化の少なくとも一部分を前記第3のAVC符号化のエンハンスメント・レイヤとして使用するステップと、
    前記第2のAVC符号化の前記一部分の所与のマクロブロックについて、前記ベース・レイヤを参照として使用する1つまたは複数の符号化モードの符号化コストを決定するステップと、
    前記評価に基づいて、前記1つまたは複数の符号化モードから、前記所与のマクロブロックの符号化に使用する符号化モードを選択するステップと、
    を含む、請求項1に記載の方法。
  16. 前記選択するステップが、前記1つまたは複数の符号化モードから、決定された符号化コストが最低である符号化モードを選択するステップを含む、請求項15に記載の方法。
  17. マージするステップが、前記選択された符号化モードを使用して前記所与のマクロブロックを再符号化するステップをさらに含む、請求項15に記載の方法。
  18. マージするステップが、
    前記第1のAVC符号化の少なくとも一部分を前記第3のAVC符号化のベース・レイヤとして使用するステップと、
    前記第2のAVC符号化の少なくとも一部分を前記第3のAVC符号化のエンハンスメント・レイヤとして使用するステップと、
    前記第2のAVC符号化の少なくとも前記一部分を完全に復号して、ピクセル領域データ・シーケンスにするステップと、
    前記第1のAVC符号化の少なくとも前記一部分のシンタックスを解析するステップと、
    前記ピクセル領域データ・シーケンスおよび前記解析したシンタックスをSVCエンハンスメント・レイヤ・エンコーダに提供して、前記エンハンスメント・レイヤを生成するステップと、
    を含む、請求項1に記載の方法。
  19. マージするステップが、
    前記第1のAVC符号化の少なくとも一部分を前記第3のAVC符号化のベース・レイヤとして使用するステップと、
    前記第1のAVC符号化の少なくとも前記一部分を、SVCビットストリームの参照レイヤの要件に一致するように再符号化するステップと、
    を含む、請求項1に記載の方法。
  20. 前記第1のAVC符号化または前記第2のAVC符号化の1つまたは複数が、少なくともベース・レイヤおよび第1のエンハンスメント・レイヤを有するSVC符号化である、請求項1に記載の方法。
  21. マージするステップが、
    前記第1のAVC符号化を復号するステップと、
    前記復号した第1のAVC符号化を再符号化するステップと、
    前記第1のレイヤを、前記再符号化した第1のAVC符号化で占めるステップと、
    を含み、前記第1のAVC符号化が、前記再符号化した第1のAVC符号化の形態で前記第1のレイヤを占める、請求項1に記載の方法。
  22. 前記第1のレイヤまたは前記第2のレイヤの少なくとも一方を前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤとして使用することによって、前記第1のレイヤと前記第2のレイヤの間の少なくとも一部の相関を活用する、請求項1に記載の方法。
  23. データ・シーケンスの第1のAVC符号化にアクセスする手段と、
    前記第1のAVC符号化とは品質が異なる前記データ・シーケンスの第2のAVC符号化にアクセスする手段と、
    前記第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、前記第2のAVC符号化が前記第3のAVC符号化の少なくとも第2のレイヤを占めるように、前記第1のAVC符号化と前記第2のAVC符号化をマージしてAVCのSVC拡張を使用する前記第3のAVC符号化にする手段であって、前記第1のレイヤまたは前記第2のレイヤの少なくとも一方が、前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤである手段と、
    を含む、装置。
  24. 少なくとも、
    データ・シーケンスの第1のAVC符号化にアクセスするステップ、
    前記第1のAVC符号化とは品質が異なる前記データ・シーケンスの第2のAVC符号化にアクセスするステップ、および
    前記第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、前記第2のAVC符号化が前記第3のAVC符号化の少なくとも第2のレイヤを占めるように、前記第1のAVC符号化と前記第2のAVC符号化をマージしてAVCのSVC拡張を使用する前記第3のAVC符号化にするステップであって、前記第1のレイヤまたは前記第2のレイヤの少なくとも一方が、前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤであるステップ
    を実行するように構成されたトランスコーダ。
  25. 前記第1のAVC符号化にアクセスするステップ、
    前記第2のAVC符号化にアクセスするステップ、および
    前記第1のAVC符号化と前記第2のAVC符号化をマージして前記第3のAVC符号化にするステップ
    を実行するように集合的に構成された1つまたは複数のプロセッサまたはエンコーダを含む、請求項24に記載のトランスコーダ。
  26. 少なくとも、
    データ・シーケンスの第1のAVC符号化にアクセスするステップ、
    前記第1のAVC符号化とは品質が異なる前記データ・シーケンスの第2のAVC符号化にアクセスするステップ、および
    前記第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、前記第2のAVC符号化が前記第3のAVC符号化の少なくとも第2のレイヤを占めるように、前記第1のAVC符号化と前記第2のAVC符号化をマージしてAVCのSVC拡張を使用する前記第3のAVC符号化にするステップであって、前記第1のレイヤまたは前記第2のレイヤの少なくとも一方が、前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤであるステップ
    を1つまたは複数のプロセッサに集合的に実行させる命令を保存したプロセッサ可読媒体。
  27. データ・シーケンスの第1のAVC符号化を含む信号を受信するように構成された受信器と、
    少なくとも、
    前記データ・シーケンスの前記第1のAVC符号化にアクセスするステップ、
    前記第1のAVC符号化とは品質が異なる前記データ・シーケンスの第2のAVC符号化にアクセスするステップ、および
    前記第1のAVC符号化が第3のAVC符号化の少なくとも第1のレイヤを占め、前記第2のAVC符号化が前記第3のAVC符号化の少なくとも第2のレイヤを占めるように、前記第1のAVC符号化と前記第2のAVC符号化をマージしてAVCのSVC拡張を使用する前記第3のAVC符号化にするステップであって、前記第1のレイヤまたは前記第2のレイヤの少なくとも一方が、前記第1のレイヤまたは前記第2のレイヤの他方の参照レイヤであるステップ
    を実行するように構成されたトランスコーダと
    を含む、装置。
  28. 前記トランスコーダに接続された、前記第3のAVC符号化を保存する保存デバイスをさらに含む、請求項27に記載の装置。
JP2012543085A 2009-12-14 2010-12-10 符号化ビットストリームのマージ Expired - Fee Related JP5676637B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28415009P 2009-12-14 2009-12-14
US61/284,150 2009-12-14
PCT/US2010/003141 WO2011081643A2 (en) 2009-12-14 2010-12-10 Merging encoded bitstreams

Publications (3)

Publication Number Publication Date
JP2013513999A JP2013513999A (ja) 2013-04-22
JP2013513999A5 JP2013513999A5 (ja) 2014-02-06
JP5676637B2 true JP5676637B2 (ja) 2015-02-25

Family

ID=44168359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012543085A Expired - Fee Related JP5676637B2 (ja) 2009-12-14 2010-12-10 符号化ビットストリームのマージ

Country Status (7)

Country Link
US (1) US20130010863A1 (ja)
EP (1) EP2514208A2 (ja)
JP (1) JP5676637B2 (ja)
KR (1) KR20120093442A (ja)
CN (1) CN102656885B (ja)
BR (1) BR112012014182A2 (ja)
WO (1) WO2011081643A2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9634690B2 (en) * 2010-09-30 2017-04-25 Alcatel Lucent Method and apparatus for arbitrary resolution video coding using compressive sampling measurements
WO2012050758A1 (en) * 2010-10-12 2012-04-19 Dolby Laboratories Licensing Corporation Joint layer optimization for a frame-compatible video delivery
EP3001683A3 (en) 2011-04-15 2016-04-06 SK Planet Co., Ltd. High speed scalable video coding device and method using multi-track video
US9398310B2 (en) 2011-07-14 2016-07-19 Alcatel Lucent Method and apparatus for super-resolution video coding using compressive sampling measurements
EP2865185A4 (en) * 2012-06-26 2016-08-03 Intel Corp LAYER AND CHANNEL SURVEY SAMPLING
WO2014053519A1 (en) * 2012-10-01 2014-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Scalable video coding using inter-layer prediction of spatial intra prediction parameters
KR20140087971A (ko) * 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치
US9609339B2 (en) 2013-04-08 2017-03-28 Arris Enterprises, Inc. Individual buffer management in video coding
US9563806B2 (en) 2013-12-20 2017-02-07 Alcatel Lucent Methods and apparatuses for detecting anomalies using transform based compressed sensing matrices
US9600899B2 (en) 2013-12-20 2017-03-21 Alcatel Lucent Methods and apparatuses for detecting anomalies in the compressed sensing domain
US10250895B2 (en) * 2014-03-14 2019-04-02 Sharp Kabushiki Kaisha DPB capacity limits
EP3146724A1 (en) 2014-05-21 2017-03-29 ARRIS Enterprises LLC Signaling and selection for the enhancement of layers in scalable video
CA3083172C (en) 2014-05-21 2022-01-25 Arris Enterprises Llc Individual buffer management in transport of scalable video
US9894324B2 (en) 2014-07-15 2018-02-13 Alcatel-Lucent Usa Inc. Method and system for modifying compressive sensing block sizes for video monitoring using distance information
JP6932116B2 (ja) * 2014-08-01 2021-09-08 日本化薬株式会社 エポキシ樹脂含有ワニス、エポキシ樹脂組成物含有ワニス、プリプレグ、樹脂シート、プリント配線板、半導体装置
US10805643B2 (en) * 2016-03-30 2020-10-13 Advanced Micro Devices, Inc. Adaptive error-controlled dynamic voltage and frequency scaling for low power video codecs
KR101990098B1 (ko) * 2018-02-23 2019-06-17 에스케이플래닛 주식회사 멀티트랙 비디오를 스케일러블 비디오로 인코딩하는 방법 및 장치

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518342A (ja) * 2001-01-12 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルビデオトランスコーディング方法及び装置
JP2004521583A (ja) * 2001-07-10 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 非スケーラブル符号化ビデオ信号からスケーラブル符号化ビデオ信号を発生する方法及び装置
EP1514423A1 (en) * 2002-05-31 2005-03-16 Koninklijke Philips Electronics N.V. Non-scalable to scalable video conversion method, scalable to non-scalable video conversion method-------------------------------
US7227894B2 (en) * 2004-02-24 2007-06-05 Industrial Technology Research Institute Method and apparatus for MPEG-4 FGS performance enhancement
US8436889B2 (en) * 2005-12-22 2013-05-07 Vidyo, Inc. System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
US8320450B2 (en) * 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
JP2009544176A (ja) * 2006-03-29 2009-12-10 ヴィドヨ,インコーポレーテッド スケーラブルビデオコーデックと非スケーラブルビデオコーデックとの間でトランスコードを行うためのシステム及び方法
US8396134B2 (en) * 2006-07-21 2013-03-12 Vidyo, Inc. System and method for scalable video coding using telescopic mode flags
US8121191B1 (en) * 2007-11-13 2012-02-21 Harmonic Inc. AVC to SVC transcoder
JP2009182776A (ja) * 2008-01-31 2009-08-13 Hitachi Ltd 符号化装置、復号化装置、および、動画像符号化方法、動画像復号化方法
FR2930702A1 (fr) * 2008-04-23 2009-10-30 Thomson Licensing Sas Procede d'insertion, de suppression, support d'enregistrement et codeur
IT1394245B1 (it) * 2008-09-15 2012-06-01 St Microelectronics Pvt Ltd Convertitore per video da tipo non-scalabile a tipo scalabile
WO2010060442A1 (en) * 2008-11-26 2010-06-03 Telefonaktiebolaget Lm Ericsson (Publ) Technique for handling media content to be accessible via multiple media tracks
JP5780582B2 (ja) * 2009-01-08 2015-09-16 日本電気株式会社 配信システムと方法並びに変換装置
US9197677B2 (en) * 2009-03-09 2015-11-24 Arris Canada, Inc. Multi-tiered scalable media streaming systems and methods
JP5504336B2 (ja) * 2009-05-05 2014-05-28 テレフオンアクチーボラゲット エル エム エリクソン(パブル) スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム

Also Published As

Publication number Publication date
EP2514208A2 (en) 2012-10-24
BR112012014182A2 (pt) 2016-05-31
CN102656885B (zh) 2016-01-27
WO2011081643A3 (en) 2011-09-29
US20130010863A1 (en) 2013-01-10
CN102656885A (zh) 2012-09-05
JP2013513999A (ja) 2013-04-22
WO2011081643A2 (en) 2011-07-07
KR20120093442A (ko) 2012-08-22

Similar Documents

Publication Publication Date Title
JP5676637B2 (ja) 符号化ビットストリームのマージ
US10812816B2 (en) Method and arrangement for transcoding a video bitstream
JP6768145B2 (ja) ビデオの符号化および復号
AU2015230740B2 (en) Method and apparatus of scalable video coding
CN104813667B (zh) 用于可伸缩视频编码的帧间层预测方法及装置
KR101055738B1 (ko) 베이스 레이어의 내부모드 블록의 예측정보를 이용하여 영상신호를 엔코딩/디코딩하는 방법 및 장치
CA3073084C (en) Quantization parameter derivation for cross-channel residual encoding and decoding
CN111327893B (zh) 用于视频编码和解码的装置、方法和计算机程序
KR20060105408A (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US20140092977A1 (en) Apparatus, a Method and a Computer Program for Video Coding and Decoding
JP5722349B2 (ja) ブロックに基づくインターリーブ
CA2543947A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
US9819944B2 (en) Multi-layer video coding method for random access and device therefor, and multi-layer video decoding method for random access and device therefor
US20150117514A1 (en) Three-dimensional video encoding method using slice header and method therefor, and three-dimensional video decoding method and device therefor
KR20150054751A (ko) 영상 복호화 방법 및 이를 이용하는 장치
JP5768180B2 (ja) 画像復号方法及び画像復号装置
EP2983362B1 (en) Interlayer video decoding method and apparatus for compensating luminance difference
EP3038366A1 (en) Devices and method for video compression and reconstruction
GB2534591A (en) Video encoding and decoding
KR20140048806A (ko) 공간 해상도에 기반한 계층 간 예측 장치 및 방법
WO2019211514A1 (en) Video encoding and decoding

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141225

R150 Certificate of patent or registration of utility model

Ref document number: 5676637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees