JP6635197B2 - 映像符号化装置、映像符号化方法およびプログラム - Google Patents

映像符号化装置、映像符号化方法およびプログラム Download PDF

Info

Publication number
JP6635197B2
JP6635197B2 JP2018522449A JP2018522449A JP6635197B2 JP 6635197 B2 JP6635197 B2 JP 6635197B2 JP 2018522449 A JP2018522449 A JP 2018522449A JP 2018522449 A JP2018522449 A JP 2018522449A JP 6635197 B2 JP6635197 B2 JP 6635197B2
Authority
JP
Japan
Prior art keywords
image
bit stream
encoder
reconstructed
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018522449A
Other languages
English (en)
Other versions
JPWO2017213033A1 (ja
Inventor
健太 徳満
健太 徳満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2017213033A1 publication Critical patent/JPWO2017213033A1/ja
Application granted granted Critical
Publication of JP6635197B2 publication Critical patent/JP6635197B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本開示は、映像符号化装置、映像符号化方法および記録媒体に関する。
超高精細度テレビジョン放送(スーパーハイビジョン)の映像信号を受け付けて表示する表示装置に関する技術が特許文献1に記載されている。
また、映像信号のエンコーディングまたはデコーディング時に層間動き予測を行う方法が、例えば、特許文献2に記載されている。
特開2014−236241号公報 特表2009−522982号公報 国際公開第2015/190078号
ところで、スケーラブル符号化方式の符号化技術であって、例えば、High efficiency video coding(HEVC)におけるScalable High−efficiency Video Coding(SHVC)を用いた映像符号化方式に関連する技術が特許文献3に記載されている。この映像符号化方式では、入力画像をダウンサンプリングして得られた低解像度画像が低解像度層(最下位レイヤまたはBL:Base Layer)として符号化され、入力画像が高解像度層(上位レイヤまたはEL:Enhancement Layer)として符号化される。
BLに対応する解像度の画像の各フレームおよびELに対応する解像度の画像の各フレームは、符号化ツリーユニット(CTU:Coding Tree Unit)に分割されて符号化される。CTUは、クアッドツリー構造で符号化ユニット(CU:Coding Unit)に分割されて符号化される。各CUは、予測ユニット(PU:Prediction Unit)に分割されて予測される。また、各CUの予測誤差は、クアッドツリー構造で、変換ユニット(TU:Transform Unit)に分割されて周波数変換される。なお、最大サイズのCUおよび最小サイズのCUを、LCU(Largest Coding Unit :最大符号化ユニット)およびとSCU(Smallest Coding Unit:最小符号化ユニット)と呼ぶ。
CUは、イントラ予測/フレーム間予測/レイヤ間予測の符号化単位である。以下、イントラ予測、フレーム間予測およびレイヤ間予測を説明する。
イントラ予測は、符号化対象フレームの再構築画像から予測画像を生成する予測である。
フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築フレーム(参照ピクチャ)の画像に基づく予測である。以下、フレーム間予測をインター予測とも呼ぶ。インター予測では、参照ピクチャの再構築画像ブロックに基づいて(必要であれば画素補間を用いて)、インター予測信号が生成される。
動きベクトルの予測として、AMVP(Advanced Motion Vector Prediction )とマージモードとの2種類がある。AMVPは、参照ピクチャの動きベクトルを用いて、動きベクトルの差分が最小となるように動きベクトルを予測する技術である。AMVPでは、参照ピクチャインデックス、AMVP予測動きベクトルに関連づけられたAMVPインデックス、および、AMVP予測動きベクトルの組が伝送される。マージモードは、参照ピクチャの動きベクトルをそのまま流用する技術である。マージモードでは、マージ予測が有効であることを示すマージフラグと、流用する動きベクトルと関連づけられたマージ候補インデックスとの組が伝送される。
レイヤ間予測は、符号化済みのBLの再構築フレームのアップサンプル画像を用いるインター予測である。レイヤ間予測では、符号化済みBLの再構築フレームを、ELのフレームと同じ解像度にアップサンプルしたアップサンプル画像をフレーム間予測することによって、レイヤ間予測信号が生成される。
以下、イントラ予測を用いるCUをイントラCU、インター予測を用いるCUをインターCU、レイヤ間予測を用いるCUをレイヤ間CUと呼ぶ。
なお、イントラCUのみで符号化されたフレームはIフレーム(またはIピクチャ)と呼ばれる。イントラCUだけでなく、インターCUやレイヤ間CUも含めて符号化されたフレームはPフレーム(またはPピクチャ)と呼ばれる。ブロックのインター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはBフレーム(またはBピクチャ)と呼ばれる。
次に、図13を参照して、特許文献3に関連する技術として、各解像度画像の各フレームの各CTUを入力画像としてビットストリームを出力する映像符号化装置であってスケーラブル符号化方式を用いる映像符号化装置の構成と動作を説明する。
図13に示す映像符号化装置10は、BLを符号化する低解像度層HEVCエンコーダ(BL符号化器)100A、ELを符号化する高解像度層HEVCエンコーダ(EL符号化器)100B、ダウンサンプル器109、およびマルチプレクサ110を備える。ダウンサンプル器109は、入力画像をダウンサンプルして得られた低解像度画像(BL画像)をBL符号化器100Aに供給する。
BL符号化器100Aは、推定器101A、予測器102A、周波数変換器103A、量子化器104A、逆量子化/逆周波数変換器105A、バッファ106A、およびエントロピー符号化器107Aを備える。
BL画像のフレームの各CTUは、クアッドツリー構造に基づいて、可変サイズのCUに分割される。BL画像の各CUの予測誤差は、CTUと同様に、クアッドツリー構造に基づいて、可変サイズのTUに分割される。
具体的には、推定器101Aは、例えば符号化コストを最小にするCU分割形状すなわちCUクアッドツリー構造を決定する。また、推定器101Aは、BL画像のCTU毎に、PUのブロック予測パラメータ(以下、PUブロック予測パラメータと呼ぶ)およびTUクアッドツリー構造を決定する。
予測器102Aは、推定器101Aが決定したCUクアッドツリー構造およびPUブロック予測パラメータに基づいて、BL画像のCUに対する予測信号を生成する。予測信号は、上述したイントラ予測またはインター予測に基づいて生成される。
周波数変換器103Aは、推定器101Aが決定したTUクアッドツリー構造に基づいて、BL画像の画像信号から予測信号を減じた予測誤差信号(以下、予測誤差画像とも呼ぶ)を周波数変換する。
量子化器104Aは、周波数変換された予測誤差画像(直交変換係数)を量子化する。以下、量子化された直交変換係数を係数レベルと呼ぶ。また、0以外の値を持つ係数レベルを有意係数レベルと呼ぶ。
エントロピー符号化器107Aは、CTU単位のCUクアッドツリー構造を示すsplit_cu_flag、PUブロック予測パラメータ、TUクアッドツリー構造を示すsplit_transform_flagおよび係数レベルをエントロピー符号化し、BL画像のビットストリーム(低解像度層(BL)ビットストリーム)を出力する。以後、エンロトピー符号化するパラメータ群を符号化パラメータと呼ぶ。
逆量子化/逆周波数変換器105Aは、係数レベルを逆量子化する。さらに、逆量子化/逆周波数変換器105Aは、逆量子化した直交変換係数を逆周波数変換する。逆周波数変換されたBL画像の再構築予測誤差画像は、予測信号が加えられて、BL画像の再構築画像としてバッファ106Aに供給される。
バッファ106Aは、BL画像の再構築画像を以後の符号化処理のために格納する。バッファ106Aに格納された再構築画像は、推定器101Aおよび予測器102Aによって取得され、CUクアッドツリー構造、PUブロック予測パラメータ、およびTUクアッドツリー構造の決定、予測信号の生成に用いられる。
EL符号化器100Bは、推定器101B、予測器102B、周波数変換器103B、量子化器104B、逆量子化/逆周波数変換器105B、バッファ106B、エントロピー符号化器107Bおよびアップサンプル器108を備える。
EL符号化器100Bに入力される入力画像(EL画像)のフレームの各CTUは、クアッドツリー構造に基づいて、可変サイズのCUに分割される。EL画像の各CUの予測誤差は、CTUと同様に、クアッドツリー構造に基づいて、可変サイズのTUに分割される。
推定器101Bは、EL画像のCTU毎に、CUクアッドツリー構造、PUブロック予測パラメータおよびTUクアッドツリー構造を決定する。
予測器102Bは、推定器101Bが決定したCUクアッドツリー構造およびPUブロック予測パラメータに基づいて、EL画像のCUの画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測、インター予測またはレイヤ間予測に基づいて生成される。
周波数変換器103Bは、推定器101Bが決定したTUクアッドツリー構造に基づいて、EL画像の画像信号から予測信号を減じた予測誤差画像を周波数変換する。
量子化器104Bは、周波数変換された予測誤差画像(直交変換係数)を量子化する。
エントロピー符号化器107Bは、EL画像のCUのクアッドツリー構造を示すsplit_cu_flag、PUのブロック予測パラメータ、TUのクアッドツリー構造を示すsplit_transform_flagおよび係数レベルをエントロピー符号化し、EL画像のビットストリーム(ELビットストリーム)を出力する。
逆量子化/逆周波数変換器105Bは、係数レベルを逆量子化する。さらに、逆量子化/逆周波数変換器105Bは、逆量子化した直交変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、再構築画像としてバッファ106Bに供給される。
アップサンプル器108は、BL画像の再構築画像をアップサンプルする。
バッファ106Bは、EL画像の再構築画像と、アップサンプル器108によってアップサンプルされたBL画像の再構築画像を以後の符号化処理のために格納する。バッファ106Bに格納されたデータは、推定器101Bおよび予測器102Bから取得され、CUクアッドツリー構造、PUブロック予測パラメータ、およびTUクアッドツリー構造の決定、予測信号の生成に用いられる。
マルチプレクサ110は、BLビットストリームとELビットストリームとを多重化してスケーラブルビットストリームを生成する。上述した動作に基づいて、映像符号化装置10は、入力画像からスケーラブルビットストリームを生成する。
このような映像符号化装置10において、入力画像(EL画像)と、該入力画像をダウンサンプルして得られた低解像度画像(BL画像)との構造が異なる場合がある。例えば、EL画像がプログレッシブ方式の画像(以下、プログレッシブ画像と呼ぶ)であり、BL画像がインターレース方式の画像(以下、インターレース画像と呼ぶ)である場合がある。このような場合、アップサンプル器108がバッファ106Aから取得するBL画像の再構築画像は、インターレース方式の画像であるため、時間方向の情報がEL画像の半分になる。したがって、このような再構築画像を用いて生成したELビットストリームを含むスケーラブルビットストリームを、例えば、特許文献1に記載の表示装置等で復号した場合、時間方向の情報が失われている箇所があるため、復号した映像がカクつき、不自然に見えてしまう場合がある。つまり、上記場合では、復号した映像の画質が劣化してしまう可能性がある。
本開示は、上記課題に鑑みてなされたものであり、その目的は、上位レイヤに入力される画像と最下位レイヤに入力される画像との構造が異なる場合であっても高画質なスケーラブルビットストリームを出力することが可能な技術を提供することにある。
本開示の一態様に係る映像符号化装置は、入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像であって、前記入力画像とは異なる構造を有する低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを備え、前記エンハンスメントレイヤ符号化器は、時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理する処理手段と、前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行うアップサンプル手段と、を備え、前記エンハンスメントレイヤ符号化器は、前記アップサンプル処理が行われた画像を用いて符号化処理を行う。
また、本開示の一態様に係る映像符号化方法は、入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを含む映像符号化装置における映像符号化方法であって、前記低解像度画像は、前記入力画像とは異なる構造を有し、前記エンハンスメントレイヤ符号化器が、時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理し、前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行い、前記アップサンプル処理が行われた画像を用いて符号化処理を行う。
なお、上記各装置または方法を、コンピュータによって実現するコンピュータプログラム、およびそのコンピュータプログラムが格納されている、コンピュータ読み取り可能な非一時的記録媒体も、本発明の範疇に含まれる。
上位レイヤに入力される画像と最下位レイヤに入力される画像との構造が異なる場合であっても高画質なスケーラブルビットストリームを出力することができる。
第1の実施の形態に係る映像符号化装置の一例を示すブロック図である。 第1の実施の形態に係る映像符号化装置における適応アップサンプル部の一例を示すブロック図である。 第1の実施の形態に係る映像符号化装置のEL符号化器における符号化処理を説明するための図である。 第1の実施の形態における映像符号化装置における適応アップサンプル部の動作の一例を示すフローチャートである。 第2の実施の形態に係る映像符号化装置における適応アップサンプル部の一例を示すブロック図である。 第2の実施の形態に係る映像符号化装置のEL符号化器における符号化処理を説明するための図である。 第2の実施の形態における映像符号化装置における適応アップサンプル部の動作の一例を示すフローチャートである。 第3の実施の形態に係る映像符号化装置の一例を示すブロック図である。 第3の実施の形態に係る映像符号化装置における適応アップサンプル部の一例を示すブロック図である。 第3の実施の形態における映像符号化装置における適応アップサンプル部および推定器の動作の一例を示すフローチャートである。 本開示による映像符号化装置の機能を実現可能な情報処理システムの構成例を示すブロック図である。 本開示による映像符号化装置の主要部を示すブロック図である。 スケーラブル符号化方式を用いる映像符号化装置の一例を示すブロック図である。 図13の映像符号化装置のEL符号化器における符号化処理を説明するための図である。
<第1の実施の形態>
第1の実施の形態に係る映像符号化装置について、図面を参照して説明する。図1は、本実施の形態に係る映像符号化装置20の一例を示すブロック図である。本実施の形態に係る映像符号化装置20は、BL符号化器100A、EL符号化器200B、ダウンサンプル器109およびマルチプレクサ110を備える。映像符号化装置20のBL符号化器100Aの構成および動作は、図13に示した映像符号化装置10におけるBL符号化器100Aの構成および動作と同じである。また、映像符号化装置20のダウンサンプル器109およびマルチプレクサ110の動作も、図13に示した映像符号化装置10におけるダウンサンプル器109およびマルチプレクサ110の動作と同様である。
本実施の形態において、入力画像は、例えばプログレッシブ方式の画像(例えば、4K60p)であるとする。また、入力画像をダウンサンプルしたBL画像は、インターレース方式の画像である。つまり、ダウンサンプル器109は、入力画像に対し、プログレッシブ・インターレース変換を行うことにより、入力画像のあるフレームのトップフィールドと、該入力画像の次のフレームのボトムフィールドとからなるフレームを、BL画像として出力する。このBL画像は、BL符号化器100Aに入力される。
なお、本実施の形態において、映像符号化装置20は、ダウンサンプル器109を含む構成として説明を行うが、映像符号化装置20は、ダウンサンプル器109を含まなくてもよい。例えば、入力画像と対応し、該入力画像よりも低解像度の画像が他の装置等から取得可能な場合、映像符号化装置20は、該低解像度画像をBL符号化器100Aの入力とし、入力画像をEL符号化器200Bの入力としてもよい。つまり、ダウンサンプル器109は、映像符号化装置20とは異なる装置で実現されてもよい。そして、入力画像と、該入力画像をダウンサンプルしたBL画像とを、映像符号化装置20に入力する構成であってもよい。
EL符号化器200Bは、図1に示す通り、推定器101B、予測器102B、周波数変換器103B、量子化器104B、逆量子化/逆周波数変換器105B、バッファ106B、エントロピー符号化器107Bおよび適応アップサンプル部208を備える。EL符号化器200Bは、図13に示すEL符号化器100Bのアップサンプル器108に代えて適応アップサンプル部208を備える構成である。なお、推定器101B、予測器102B、周波数変換器103B、量子化器104B、逆量子化/逆周波数変換器105B、バッファ106Bおよびエントロピー符号化器107Bの動作は、図13を用いて説明した動作と同様であるため、その説明を省略する。
適応アップサンプル部208は、BL符号化器100Aのバッファ106Aに格納された、BL画像の再構築画像を入力とする。以下では、適応アップサンプル部208の構成および動作について説明する。
図2は、本実施の形態に係る映像符号化装置20のEL符号化器200Bにおける適応アップサンプル部208の構成の一例を示すブロック図である。図2に示す通り、適応アップサンプル部208は、デインターレース部2081と、アップサンプル器2082とを備える。
デインターレース部2081は、時間方向において入力画像に対して対応する画像となるように、BL画像の再構築画像を処理する。具体的には、デインターレース部2081は、BL画像の再構築画像をデインターレースし、デインターレースした画像を、時間方向において入力画像に対して対応する画像とする。そして、デインターレース部2081は、デインターレースした画像をアップサンプル器2082に供給する。
アップサンプル器2082は、デインターレース部2081からデインターレースした画像を受け取る。そして、アップサンプル器2082は、デインターレースした画像をアップサンプルする。アップサンプル器2082の動作は、上述したアップサンプル器108と同様である。
アップサンプル器2082によってアップサンプルされた画像(アップサンプル画像と呼ぶ)は、EL符号化器100Bと同様に、バッファ106Bに格納される。これにより、アップサンプル画像は、以後の符号化処理に用いられることができる。
図3および図14を用いて、EL符号化器200Bの動作についてさらに説明する。まず、図14を用いて、上述した映像符号化装置10のEL符号化器100Bにおける符号化処理を説明する。
上述した通り、EL画像がプログレッシブ画像であり、BL画像がインターレース画像の場合、BL画像の再構築画像(フレーム)は、ある入力画像のフレームから生成されたトップフィールドと上記フレームの次のフレームから生成されたボトムフィールドとからなる。つまり、BL画像の再構築画像の時間方向におけるフレーム数は、元の入力画像に比べ、半分になる。よって、EL符号化器100BがEL画像の符号化を行う場合、図14に示す通り、BL画像の再構築画像のアップサンプル画像を用いて(参照して)生成したフレームと、参照せずに生成したフレーム(図14における網掛けのフレーム)とが生成されることになる。したがって、このような再構築画像を用いて生成したELビットストリームを含むスケーラブルビットストリームを、表示装置等で復号した場合、時間方向の情報が失われている箇所があるため、復号した映像がカクつき、不自然に見えてしまう場合がある。
次に、本実施の形態に係る映像符号化装置20のEL符号化器200Bにおける符号化処理を、図3を用いて説明する。BL画像の再構築画像は、上述したとおり、インターレース画像であるため、トップフィールドとボトムフィールドとからなるフレームとなる。図3では、ボトムフィールドの部分を網掛けで示している。
デインターレース部2081は、このようなBL画像の再構築画像をデインターレースすることにより、再構築画像をトップフィールドとボトムフィールドとに分ける。トップフィールドは、入力画像のあるフレーム(第1フレームと呼ぶ)に対して、ダウンサンプル器109がダウンサンプル処理を行うことにより生成されたものである。そして、ボトムフィールドは、上記第1フレームの次のフレーム(第2フレームと呼ぶ)に対して、ダウンサンプル器109がダウンサンプル処理を行うことにより生成されたものである。したがって、トップフィールドは、第1フレームに対して時間方向において対応する画像であり、ボトムフィールドは、第2フレームに対して時間方向において対応する画像となる。
そして、アップサンプル器2082がトップフィールドをアップサンプルすることにより、EL符号化器200Bは、該アップサンプルされたトップフィールドを参照画像として用いて、第1フレームを符号化する。同様に、EL符号化器200Bは、アップサンプル器2082がアップサンプルしたボトムフィールドを参照画像として用いて、第2フレームを符号化する。
これにより、図3に示す通り、EL符号化器200Bは、時間方向に対する、入力画像に対応する情報を有する画像を参照画像として用いて、符号化処理を行い、符号化されたフレームを生成することができる。
次に、図4を用いて、本実施の形態における映像符号化装置20における適応アップサンプル部208の動作の流れについて説明する。図4は、本実施の形態における映像符号化装置20における適応アップサンプル部208の動作の流れの一例を示すフローチャートである。
図4に示す通り、適応アップサンプル部208のデインターレース部2081は、BL画像の再構築画像をデインターレースする(ステップS41)。そして、適応アップサンプル部208のアップサンプル器2082は、デインターレース部2081がデインターレースした画像に対し、アップサンプル処理を行う(ステップS42)。
アップサンプル処理された画像(アップサンプル画像)は、バッファ106Bに格納され、後の符号化処理に用いられることになる。
以上のように、本実施の形態のEL符号化器200Bは、時間方向に対する、入力画像に対応する情報を有する画像を参照画像として用いて、符号化処理を行い、符号化されたフレームを生成することができる。したがって、本実施の形態に係る映像符号化装置20は、時間方向の情報を有したスケーラブルビットストリームを出力することができる。このようなスケーラブルビットストリームは、図14の場合に比べ、時間方向の情報を有した状態であるため、カクつき等の画質の劣化を防ぐことができる。よって、映像符号化装置20は、EL画像とBL画像との構造が異なる場合であっても高画質なスケーラブルビットストリームを出力することができる。
<第2の実施の形態>
第2の実施の形態に係る映像符号化装置について、図面を参照して説明する。本実施の形態に係る映像符号化装置30は、上述した図1に記載の通り、BL符号化器100A、EL符号化器300B、ダウンサンプル器109およびマルチプレクサ110を備える。EL符号化器300Bは、EL符号化器200Bの適応アップサンプル部208に代えて、適応アップサンプル部308を備える構成である。
図5は、本実施の形態に係る映像符号化装置30のEL符号化器300Bにおける適応アップサンプル部308の構成の一例を示すブロック図である。図5に示す通り、適応アップサンプル部308は、複製部3081と、アップサンプル器3082とを備える。
複製部3081は、時間方向において入力画像に対して対応する画像となるように、BL画像の再構築画像を処理する。具体的には、複製部3081は、BL画像の再構築画像を複製し、該再構築画像と、複製した再構築画像(複製画像)とを、時間方向において入力画像に対して対応する画像とする。そして、複製部3081は、再構築画像と、複製画像とを、アップサンプル器3082に供給する。
アップサンプル器3082は、複製部3081から再構築画像と、複製画像とを受け取る。そして、アップサンプル器3082は、再構築画像と、複製画像とをアップサンプルする。アップサンプル器3082の動作は、上述したアップサンプル器108と同様である。
アップサンプル器3082によってアップサンプルされたアップサンプル画像は、EL符号化器100Bと同様に、バッファ106Bに格納される。これにより、アップサンプル画像は、以後の符号化処理に用いられることができる。
本実施の形態に係る映像符号化装置30のEL符号化器300Bにおける符号化処理を、図6を用いて更に説明する。BL画像の再構築画像は、上述したとおり、インターレース画像であるため、トップフィールドとボトムフィールドとからなるフレームとなる。図6では、ボトムフィールドの部分を網掛けで示している。
複製部3081は、このようなBL画像の再構築画像を複製する。トップフィールドは、入力画像の第1フレームに対して、ダウンサンプル器109がダウンサンプル処理を行うことにより生成されたものである。そして、ボトムフィールドは、上記第1フレームの次のフレームである第2フレームに対して、ダウンサンプル器109がダウンサンプル処理を行うことにより生成されたものである。したがって、複製される再構築画像のトップフィールドは、第1フレームに対して時間方向において対応しており、複製された再構築画像のボトムフィールドは、第2フレームに対して時間方向において対応する。したがって、再構築画像と、この再構築画像を複製した複製画像とは、夫々、入力画像に対して時間方向において対応する画像となる。
そして、アップサンプル器3082が再構築画像をアップサンプルすることにより、EL符号化器300Bは、該アップサンプルされた再構築画像を参照画像として用いて、第1フレームを符号化する。同様に、EL符号化器300Bは、アップサンプル器3082がアップサンプルした複製画像を参照画像として用いて、第2フレームを符号化する。
これにより、図6に示す通り、EL符号化器300Bは、時間方向に対する、入力画像に対応する情報を有する画像を参照画像として用いて、符号化処理を行い、符号化されたフレームを生成することができる。
次に、図7を用いて、本実施の形態における映像符号化装置30における適応アップサンプル部308の動作の流れについて説明する。図7は、本実施の形態における映像符号化装置30における適応アップサンプル部308の動作の流れの一例を示すフローチャートである。
図7に示す通り、適応アップサンプル部308の複製部3081は、BL画像の再構築画像を複製する(ステップS71)。そして、適応アップサンプル部208のアップサンプル器3082は、再構築画像および複製部3081が複製した再構築画像(複製画像)に対し、アップサンプル処理を行う(ステップS72)。
アップサンプル処理された画像(アップサンプル画像)は、バッファ106Bに格納され、後の符号化処理に用いられることになる。
以上のように、本実施の形態のEL符号化器300Bは、時間方向に対する、入力画像に対応する情報を有する画像を参照画像として用いて、符号化処理を行い、符号化されたフレームを生成することができる。したがって、本実施の形態に係る映像符号化装置30は、時間方向の情報を有したスケーラブルビットストリームを出力することができる。このようなスケーラブルビットストリームは、図14の場合に比べ、時間方向の情報を有した状態であるため、カクつき等の画質の劣化を防ぐことができる。
また、EL符号化器300Bのアップサンプル器3082がアップサンプル処理を行う画像は、トップフィールドもボトムフィールドも含むフレームである。したがって、本実施の形態に係る映像符号化装置30のEL符号化器300Bが符号化処理を行う際に参照する画像は、EL符号化器200Bが参照する画像に比べ、空間方向の情報を多く含む。したがって、本実施の形態に係る映像符号化装置30は、映像符号化装置20よりも空間方向の情報をより多く含んだスケーラブルビットストリームを生成することができる。
これにより、映像符号化装置30は、空間方向の画質の劣化を緩和することができるため、EL画像とBL画像との構造が異なる場合であっても更に高画質なスケーラブルビットストリームを出力することができる。
<第3の実施の形態>
第3の実施の形態に係る映像符号化装置について、図面を参照して説明する。図8は、本実施の形態に係る映像符号化装置40の一例を示すブロック図である。本実施の形態に係る映像符号化装置40は、BL符号化器100A、EL符号化器400B、ダウンサンプル器109およびマルチプレクサ110を備える。EL符号化器400Bは、EL符号化器200Bの適応アップサンプル部208またはEL符号化器300Bの適応アップサンプル部308に代えて、適応アップサンプル部408を備える構成である。また、EL符号化器400Bの推定器101Bは、決定したPUブロック予測パラメータを適応アップサンプル部408に供給する構成である。この差分情報については後述する。
図9は、本実施の形態に係る映像符号化装置40のEL符号化器400Bにおける適応アップサンプル部408の構成の一例を示すブロック図である。図9に示す通り、適応アップサンプル部408は、処理選択部4081、アップサンプル器4082および処理部4083を備える。処理部4083は、デインターレース部2081および複製部3081を含む。
処理部4083に含まれるデインターレース部2081および複製部3081の動作は、夫々、上述したデインターレース部2081および複製部3081と同様である。
アップサンプル器4082は、アップサンプル器2082およびアップサンプル器3082と同様に、デインターレース部2081および/または複製部3081から出力された画像に対してアップサンプル処理を施す。アップサンプル器4082から出力されたアップサンプル画像は、バッファ106Bに格納される。
処理選択部4081は、推定器101Bの出力に基づいて、デインターレース部2081によるデインターレースおよび複製部3081による複製の何れの処理を行うかを選択する。
次に、図10を用いて、本実施の形態における映像符号化装置40における適応アップサンプル部408および推定器101Bの動作の流れについて説明する。図10は、本実施の形態における映像符号化装置40における適応アップサンプル部408および推定器101Bの動作の流れの一例を示すフローチャートである。
まず、処理選択部4081が、推定器101Bから判定結果を受け取っているか否かを確認する(ステップS101)。判定結果を受け取っていない場合(ステップS101にてNO)、推定器101Bが処理選択部4081に入力されるBL画像の再構築画像を用いた処理を行っていないため、処理をステップS102に進める。判定結果を受け取っている場合(ステップS101にてYES)、処理はステップS104に進む。
判定結果を受け取っていない場合、処理選択部4081は、入力されたBL画像の再構築画像をデインターレース部2081および複製部3081に供給する。これにより、デインターレース部2081は、図4に示すステップS41を実行する。即ち、デインターレース部2081は、BL画像の再構築画像をデインターレースする。そして、アップサンプル器4082は、ステップS42を実行する。即ち、アップサンプル器4082は、デインターレースした画像に対し、アップサンプル処理を行う(ステップS102)。また、複製部3081は、図7に示すステップS71を実行する。即ち、複製部3081は、BL画像の再構築画像を複製する。そして、アップサンプル器4082は、ステップS72を実行する。即ち、アップサンプル器4082は、再構築画像および複製画像に対し、アップサンプル処理を行う(ステップS103)。なお、ステップS102およびステップS103は同時に行われてもよいし、逆順で行われてもよい。
そして、アップサンプル器4082は、ステップS102でアップサンプルされた画像およびステップS103でアップサンプルされた画像をバッファ106Bに格納する。これにより、推定器101Bは、アップサンプルされた画像を用いて、差分情報を取得することができる。即ち、推定器101Bは、(1)デインターレース後のアップサンプル画像と入力画像との差分を表す第1差分情報と、(2)複製処理後のアップサンプル画像と、入力画像との差分を表す第2差分情報と、のうち、差分情報のサイズが小さい方を、符号化コストが小さいアップサンプル画像であると判定する。そして、推定器101Bは、判定結果を、処理選択部4081に供給する。処理選択部4081は、判定結果を用いて、デインターレース部2081によるデインターレースおよび複製部3081による複製の何れの処理を行うかを選択する。つまり、処理選択部4081は、差分情報のサイズが小さくなる方の処理を選択する(ステップS104)。
そして、処理部4083は、選択結果に基づいて、選択された方の処理を実行する。即ち、ステップS41に示したデインターレース処理またはステップS71に示した複製処理の何れかが実行される(ステップS105)。
その後、アップサンプル器4082は、ステップS105の出力に基づいて、アップサンプル処理を行う。つまり、ステップS42またはステップS72が実行される(ステップS106)。
これにより、推定器101Bは、バッファ106Bに格納されたアップサンプル処理画像を用いて、CTU毎に、CUクアッドツリー構造、PUブロック予測パラメータおよびTUクアッドツリー構造を全探索して、符号化コストが最小となる(最も符号化効率のよい)組み合わせを決定する。このとき、推定器101Bは、例えば、以下に示す方法で、符号化コストが最小となるPUブロック予測パラメータを決定する。
例えば、ある予測(イントラ予測、インター予測、レイヤ間予測)を選択することにより発生する情報量をPredInfo_x(xは、イントラ予測(以下、イントラと呼ぶ)、インター予測(以下、インターと呼ぶ)またはレイヤ間予測(以下、レイヤ間と呼ぶ))とする。入力画像と、予測画像との差分をDiff_xとする。そして、推定器101Bは、以下の(a)〜(c)を比較し、最小となる予測方法を選択する。
(a)PredInfo_イントラ+Diff_イントラ
(b)PredInfo_インター+Diff_インター
(c)PredInfo_レイヤ間+Diff_レイヤ間
なお、レイヤ間予測の場合、上述したステップS106によってアップサンプルされたアップサンプル画像を用いる。つまり、レイヤ間予測の場合、デインターレース処理後のアップサンプル画像または複製処理後のアップサンプル画像の何れかを用いる。
これにより、推定器101Bは、PUブロック予測パラメータを決定することができる。その後の処理は、図13を用いて説明した処理と同様である。
以上のように、本実施の形態に係る映像符号化装置40は、処理選択部4081による選択結果に基づいて、デインターレース処理または複製処理を行い、処理後の画像をアップサンプルする。これにより、映像符号化装置40は、上述した第1および第2の実施の形態に係る映像符号化装置20および映像符号化装置30の効果に加え、符号化コストを抑えることができる。
なお、図10に示す処理では、選択の前に、処理部4083においてデインターレース処理と複製処理との両方の処理を行ったうえで、符号化コストが小さくなる方の処理を選択したが、本実施の形態に係る映像符号化装置40の処理選択部4081の動作はこれに限定されるものではない。処理選択部4081は、例えば、過去の所定分のフレームに対する選択結果に基づいて、デインターレース処理または複製処理の何れの処理を行うかを選択してもよい。このとき、過去にどちらの処理を選択したのかを処理選択部4081は自身の図示しない記憶部等に記憶しておけばよい。これにより、EL符号化器400Bは、一度、デインターレース処理および複製処理を行わなくてもよいため、EL符号化器400Bにおける処理量を削減することができる。
なお、上記の各実施の形態において、EL符号化器(200B、300B、400B)の符号化方法と、BL符号化器100Aとの符号化方法とは、同じであってもよいし、異なる方法を用いてもよい。例えば、EL符号化器(200B、300B、400B)の符号化方法がHEVCである場合、BL符号化器100Aの符号化方法は、HEVC、H.264(MPEG4−AVC(Moving Picture Experts Group phase 4−Advanced Video Coding))またはMPEG−2であってもよい。
また、上記の各実施の形態を、ハードウェア回路で構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図11に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図11に示された情報処理システムにおいて、プログラムメモリ1002には、図1、図2、図5、図8または図9に示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1または図8に示された映像符号化装置の機能を実現する。
図12は、本開示による映像符号化装置の主要部を示すブロック図である。図12に示すように、映像符号化装置は、エンハンスメントレイヤ符号化器500と、ベースレイヤ符号化器510と、マルチプレクサ520と、を備える。
エンハンスメントレイヤ符号化器500は、入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力する。エンハンスメントレイヤ符号化器500は、例えば、図1に示すEL符号化器200B、EL符号化器300Bまたは図8に示すEL符号化器400Bで実現される。
ベースレイヤ符号化器510は、入力画像がダウンサンプルされた低解像度画像であって、入力画像とは異なる構造を有する低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力する。例えば、入力画像がプログレッシブ方式の構造を有し、低解像度画像がインターレース方式の構造を有する。ベースレイヤ符号化器510は、例えば、図1または図8に示すBL符号化器100Aで実現される。
マルチプレクサ520は、ベースレイヤビットストリームとエンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成する。マルチプレクサ520は、例えば、図1または図8に示すマルチプレクサ110で実現される。
エンハンスメントレイヤ符号化器500は、処理部501と、アップサンプル部502とを備える。処理部501は、低解像度画像の再構築画像を、時間方向において入力画像に対して対応する画像となるように処理する。処理部501は、例えば、図2または図9に示すデインターレース部2081または図5または図9に示す複製部3081によって実現される。処理部501は、処理を行った画像(時間方向において、入力画像に対応する画像)をアップサンプル部502に供給する。
アップサンプル部502は、処理部501から処理が行われた画像を受け取る。アップサンプル部502は受け取った画像に対し、アップサンプル処理を行う。アップサンプル部502は、例えば、図2に示すアップサンプル器2082、図5に示すアップサンプル器3082または図9に示すアップサンプル器4082によって実現される。
以上のようにしてアップサンプルされた画像を用いて、エンハンスメントレイヤ符号化器500は、符号化処理を行う。
なお、上述した各実施の形態は、本発明の好適な実施の形態であり、上記各実施の形態にのみ本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において当業者が上記各実施の形態の修正や代用を行い、種々の変更を施した形態を構築することが可能である。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、
前記入力画像がダウンサンプルされた低解像度画像であって、前記入力画像とは異なる構造を有する低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、
前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを備え、
前記エンハンスメントレイヤ符号化器は、時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理する処理手段と、
前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行うアップサンプル手段と、を備え、
前記エンハンスメントレイヤ符号化器は、前記アップサンプル処理が行われた画像を用いて符号化処理を行う、ことを特徴とする映像符号化装置。
(付記2)
前記入力画像は、プログレッシブ方式の画像であり、
前記低解像度画像は、インターレース方式の画像である、
ことを特徴とする付記1に記載の映像符号化装置。
(付記3)
前記処理手段は、前記低解像度画像の再構築画像をデインターレースし、デインターレースした画像を、前記時間方向において前記入力画像に対して対応する画像とし、
前記アップサンプル手段は、デインターレースした画像に対し、アップサンプル処理を行う、ことを特徴とする付記2に記載の映像符号化装置。
(付記4)
前記処理手段は、前記低解像度画像の再構築画像を複製し、該再構築画像と、該再構築画像の複製画像とを、前記時間方向において前記入力画像に対して対応する画像とし、
前記アップサンプル手段は、前記再構築画像または前記再構築画像の複製画像に対し、アップサンプル処理を行う、ことを特徴とする付記2に記載の映像符号化装置。
(付記5)
前記処理手段は、
前記低解像度画像の再構築画像をデインターレースし、デインターレースした画像を、前記時間方向において前記入力画像に対して対応する画像とするデインターレース手段と、
前記低解像度画像の再構築画像を複製し、該再構築画像と、該再構築画像の複製画像とを、前記時間方向において前記入力画像に対して対応する画像とする複製手段と、を含み、
前記エンハンスメントレイヤ符号化器は、前記デインターレース手段によるデインターレースおよび前記複製手段による複製の何れの処理を行うかを選択する処理選択手段を更に備え、
前記処理手段は、前記処理選択手段による選択結果に基づいて、前記デインターレースまたは前記複製の処理を行う、ことを特徴とする付記2に記載の映像符号化装置。
(付記6)
前記処理選択手段は、前記デインターレースした画像に対してアップサンプル処理を行った画像と前記入力画像との差分である第1差分情報と、前記再構築画像または前記再構築画像の複製画像に対してアップサンプル処理を行った画像と前記入力画像との差分である第2差分情報とのうち、差分が小さい方の処理を選択する、ことを特徴とする付記5に記載の映像符号化装置。
(付記7)
前記処理選択手段は、過去の所定分のフレームに対する選択結果に基づいて、前記デインターレース手段によるデインターレースおよび前記複製手段による複製の何れの処理を行うかを選択する、ことを特徴とする付記5に記載の映像符号化装置。
(付記8)
入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを含む映像符号化装置における映像符号化方法であって、
前記低解像度画像は、前記入力画像とは異なる構造を有し、
前記エンハンスメントレイヤ符号化器が、時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理し、
前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行い、
前記アップサンプル処理が行われた画像を用いて符号化処理を行う、ことを特徴とする映像符号化方法。
(付記9)
前記入力画像は、プログレッシブ方式の画像であり、
前記低解像度画像は、インターレース方式の画像である、
ことを特徴とする付記8に記載の映像符号化方法。
(付記10)
入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを含む映像符号化装置を含むコンピュータに、
前記入力画像とは異なる構造を有する前記低解像度画像の再構築画像を、時間方向において前記入力画像に対して対応する画像となるように処理する処理と、
前記時間方向において、前記入力画像に対応する画像に対してアップサンプルする処理と、
前記アップサンプルされた画像を用いて符号化する処理と、を実行させることを特徴とするプログラムを記録する、コンピュータ読み取り可能な非一時的な記録媒体。
(付記11)
前記入力画像は、プログレッシブ方式の画像であり、
前記低解像度画像は、インターレース方式の画像である、
ことを特徴とする付記10に記載の記録媒体。
この出願は、2016年6月6日に出願された日本出願特願2016−112481を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10、20、30、40 映像符号化装置
100A BL符号化器
100B EL符号化器
101A、101B 推定器
102A、102B 予測器
103A、103B 周波数変換器
104A、104B 量子化器
105A、105B 逆量子化/逆周波数変換器
106A、106B バッファ
107A、107B エントロピー符号化器
108 アップサンプル器
109 ダウンサンプル器
110 マルチプレクサ
208、308、408 適応アップサンプル部
200B、300B、400B EL符号化器
2081 デインターレース部
3081 複製部
4081 処理選択部
2082、3082、4082 アップサンプル器
4083 処理部
500 エンハンスメントレイヤ符号化器
501 処理部
502 アップサンプル部
510 ベースレイヤ符号化器
520 マルチプレクサ
1001 プロセッサ
1002 プログラムメモリ
1003、1004 記憶媒体

Claims (6)

  1. プログレッシブ方式の画像である入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、
    前記入力画像がダウンサンプルされた低解像度画像であって、前記入力画像とは異なる構造を有するインターレース方式の画像である低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、
    前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを備え、
    前記エンハンスメントレイヤ符号化器は、
    時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理する処理手段と、
    前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行うアップサンプル手段と、を備え、
    前記エンハンスメントレイヤ符号化器は、前記アップサンプル処理が行われた画像を用いて符号化処理を行
    前記処理手段は、前記低解像度画像の再構築画像を複製し、該再構築画像と該再構築画像の複製画像とを、前記時間方向において前記入力画像に対して対応する画像とする複製手段を含み、
    前記アップサンプル手段は、前記再構築画像と前記再構築画像の複製画像とに対し、前記アップサンプル処理を行うことを特徴とする映像符号化装置。
  2. 前記処理手段は、
    前記低解像度画像の再構築画像をデインターレースし、デインターレースした画像を、前記時間方向において前記入力画像に対して対応する画像とするデインターレース手段をさらに含み
    前記エンハンスメントレイヤ符号化器は、前記デインターレース手段によるデインターレースおよび前記複製手段による複製の何れの処理を行うかを選択する処理選択手段を更に備え、
    前記処理手段は、前記処理選択手段による選択結果に基づいて、前記デインターレースまたは前記複製の処理を行う、ことを特徴とする請求項に記載の映像符号化装置。
  3. 前記処理選択手段は、前記デインターレースした画像に対してアップサンプル処理を行った画像と前記入力画像との差分である第1差分情報と、前記再構築画像または前記再構築画像の複製画像に対してアップサンプル処理を行った画像と前記入力画像との差分である第2差分情報とのうち、差分が小さい方の処理を選択する、ことを特徴とする請求項に記載の映像符号化装置。
  4. 前記処理選択手段は、過去の所定分のフレームに対する選択結果に基づいて、前記デインターレース手段によるデインターレースおよび前記複製手段による複製の何れの処理を行うかを選択する、ことを特徴とする請求項に記載の映像符号化装置。
  5. プログレッシブ方式の画像である入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを含む映像符号化装置における映像符号化方法であって、
    前記低解像度画像は、前記入力画像とは異なる構造を有するインターレース方式の画像であり
    前記エンハンスメントレイヤ符号化器が、時間方向において前記入力画像に対して対応する画像となるように、前記低解像度画像の再構築画像を処理し、
    前記時間方向において、前記入力画像に対応する画像に対し、アップサンプル処理を行い、
    前記アップサンプル処理が行われた画像を用いて符号化処理を行
    前記再構築画像を処理する際に、前記低解像度画像の再構築画像を複製し、該再構築画像と、該再構築画像の複製画像とを、前記時間方向において前記入力画像に対して対応する画像とし、前記再構築画像と前記再構築画像の複製画像とに対し、前記アップサンプル処理を行うことを特徴とする映像符号化方法。
  6. プログレッシブ方式の画像である入力画像をエンハンスメントレイヤとして符号化し、エンハンスメントレイヤビットストリームを出力するエンハンスメントレイヤ符号化器と、前記入力画像がダウンサンプルされた低解像度画像を、ベースレイヤとして符号化し、ベースレイヤビットストリームを出力するベースレイヤ符号化器と、前記ベースレイヤビットストリームと前記エンハンスメントレイヤビットストリームとを多重化したスケーラブルビットストリームを生成するマルチプレクサとを含む映像符号化装置を含むコンピュータに、
    前記入力画像とは異なる構造を有するインターレース画像である前記低解像度画像の再構築画像を、時間方向において前記入力画像に対して対応する画像となるように処理する処理と、
    前記時間方向において、前記入力画像に対応する画像に対してアップサンプルする処理と、
    前記アップサンプルされた画像を用いて符号化する処理と、を実行させ
    さらに前記コンピュータに、
    前記再構築画像を処理させる際に、前記低解像度画像の再構築画像を複製させ、該再構築画像と、該再構築画像の複製画像とを、前記時間方向において前記入力画像に対して対応する画像とさせ、
    前記アップサンプルする処理において、前記再構築画像と前記再構築画像の複製画像とに対し、前記アップサンプル処理を実行させることを特徴とするプログラム。
JP2018522449A 2016-06-06 2017-06-02 映像符号化装置、映像符号化方法およびプログラム Active JP6635197B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016112481 2016-06-06
JP2016112481 2016-06-06
PCT/JP2017/020547 WO2017213033A1 (ja) 2016-06-06 2017-06-02 映像符号化装置、映像符号化方法および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2017213033A1 JPWO2017213033A1 (ja) 2019-03-22
JP6635197B2 true JP6635197B2 (ja) 2020-01-22

Family

ID=60578700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018522449A Active JP6635197B2 (ja) 2016-06-06 2017-06-02 映像符号化装置、映像符号化方法およびプログラム

Country Status (2)

Country Link
JP (1) JP6635197B2 (ja)
WO (1) WO2017213033A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1455534A1 (en) * 2003-03-03 2004-09-08 Thomson Licensing S.A. Scalable encoding and decoding of interlaced digital video data
JP2007053554A (ja) * 2005-08-17 2007-03-01 Sony Corp 符号化装置、符号化方法、復号装置、復号方法およびプログラム
JP5017825B2 (ja) * 2005-09-15 2012-09-05 ソニー株式会社 復号装置および復号方法

Also Published As

Publication number Publication date
JPWO2017213033A1 (ja) 2019-03-22
WO2017213033A1 (ja) 2017-12-14

Similar Documents

Publication Publication Date Title
US8457201B2 (en) Inter-layer prediction method for video signal
US7899115B2 (en) Method for scalably encoding and decoding video signal
US7787540B2 (en) Method for scalably encoding and decoding video signal
KR100888963B1 (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
JP2020114013A (ja) 符号化装置、復号装置、符号化方法、復号方法、及びプログラム
US8755434B2 (en) Method and apparatus for scalably encoding and decoding video signal
US20090060034A1 (en) Method and apparatus for scalably encoding and decoding video signal
US8660180B2 (en) Method and apparatus for scalably encoding and decoding video signal
KR20070075222A (ko) 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
JP2005506815A (ja) 空間拡張可能圧縮のための方法及び装置
KR20240000416A (ko) 인트라 예측 모드 스케일러블 코딩 방법 및 장치
US20140192884A1 (en) Method and device for processing prediction information for encoding or decoding at least part of an image
EP2512138A2 (en) Scalable video codec encoder device and methods thereof
JP2022526726A (ja) 符号化ビデオストリームにおける適応パラメータセット参照および制約のための方法
US20180288417A1 (en) Method and apparatus for image encoding and decoding
KR100880640B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
JP5137119B2 (ja) ビデオ画像の階層符号化法
KR20100010612A (ko) 스케일러블 영상 복호화기 및 그 제어 방법
KR100883604B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR100878824B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR100878825B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
JP6635197B2 (ja) 映像符号化装置、映像符号化方法およびプログラム
RU2384970C1 (ru) Способ межслойного предсказания для видеосигнала
WO2016142977A1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
KR20090066183A (ko) 스케일러블 영상 부/복호화기에서 주변 블록 정보를 이용한바운더리 처리 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R150 Certificate of patent or registration of utility model

Ref document number: 6635197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150