JP6132006B1 - 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム - Google Patents

映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム Download PDF

Info

Publication number
JP6132006B1
JP6132006B1 JP2015235525A JP2015235525A JP6132006B1 JP 6132006 B1 JP6132006 B1 JP 6132006B1 JP 2015235525 A JP2015235525 A JP 2015235525A JP 2015235525 A JP2015235525 A JP 2015235525A JP 6132006 B1 JP6132006 B1 JP 6132006B1
Authority
JP
Japan
Prior art keywords
video
sop
value
sdr
hdr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015235525A
Other languages
English (en)
Other versions
JP2017103622A (ja
Inventor
貴之 石田
貴之 石田
慶一 蝶野
慶一 蝶野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2015235525A priority Critical patent/JP6132006B1/ja
Application filed by NEC Corp filed Critical NEC Corp
Priority to BR112018010465-5A priority patent/BR112018010465B1/pt
Priority to KR1020207037536A priority patent/KR102242880B1/ko
Priority to KR1020187014826A priority patent/KR102198120B1/ko
Priority to EP16870421.1A priority patent/EP3386200A4/en
Priority to PCT/JP2016/083681 priority patent/WO2017094482A1/ja
Priority to CA3138227A priority patent/CA3138227C/en
Priority to CA3006941A priority patent/CA3006941C/en
Priority to CA3077470A priority patent/CA3077470C/en
Priority to US15/777,980 priority patent/US10645421B2/en
Application granted granted Critical
Publication of JP6132006B1 publication Critical patent/JP6132006B1/ja
Publication of JP2017103622A publication Critical patent/JP2017103622A/ja
Priority to US16/824,778 priority patent/US10827201B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

【課題】スライス境界付近において動きベクトルの選択の制約がある符号化方法を使用する場合に、画質劣化を抑制する。【解決手段】解析手段11の解析結果およびSDRとHDRの切り替え情報に基づいて、スライス境界付近で最適な動きベクトルを選択できるか否かを推定する推定手段12と、推定手段12の推定結果に基づいて符号化構造を、Temporal IDが0のピクチャだけで構成されるSOP構造、Temporal IDが0のピクチャおよび1のピクチャで構成されるSOP構造、Temporal IDが0のピクチャ、1のピクチャ、および2のピクチャで構成されるSOP構造、Temporal IDが0のピクチャ、1のピクチャ、2のピクチャおよび3のピクチャで構成されるSOP構造のいずれかに適応的に決定する符号化構造決定手段13と、SDRとHDRの切り替え情報を映像復号側に伝送する伝送手段14とを備える。【選択図】図9

Description

本発明は、像符号化装置、像システム、映像符号化方法、及び映像符号化プログラムに関する。
映像の高精細化の要請に応じて、水平方向1920×垂直方向1080(画素)のフルHD(High Definition )の映像コンテンツが供給されている。また、水平方向3840×垂直方向2160(画素)の高精細映像(以下、4Kという。)の試験放送や商用放送が開始されている。さらに、水平方向7680×垂直方向4320(画素)の高精細映像(以下、8Kという。)の商用放送が計画されている。
映像コンテンツの配信システムにおいて、一般に、伝送側では映像信号はH.264/AVC (Advanced Video Coding )規格やHEVC(High Efficiency Video Coding)規格に基づいて符号化され、受信側では復号処理を経て映像信号が再生されるが、8Kの場合には画素数が多いので、符号化処理及び復号処理における処理負荷が高くなる。
8Kの場合の処理負荷を低減するための方法として、例えば非特許文献1に記載されたスライスを用いた画面4分割符号化がある(図11参照)。図12に示すように、非特許文献1では、ライス境界付近のブロックにおいて、動き補償(MC)のための動きベクトルでは、画面4分割符号化が使用される場合、インター予測が行われるときに、スライスの垂直方向(縦方向)の成分が128画素以下であるという制約が設けられている。なお、スライス境界付近に属さないブロックに対して、スライス境界を跨ぐ垂直方向の動きベクトル範囲の制約(以下、動きベクトル制限という。)はない。
また、4Kや8Kでは、標準ダイナミックレンジ方式(以下、SDR (Standard Dynamic Range)という。)の映像信号だけでなく、ARIB STD-B67規格のハイダイナミックレンジ方式(以下、HDR (High Dynamic Rang )という。)であるHybrid Log Gamma(以下、HLGという。)や、SMPTE ST.2084 規格のHDR であるPerceptual Quantizer(以下、PQという。) などの映像信号も扱うことが検討されている。ゆえに、SDR とHDR の切り替えも考慮する必要がある。
ARIB(Association of Radio Industries and Businesses)標準規格 STD-B32 3.0版 平成26年7月31日 電波産業会
動きベクトル制限がある場合、画面中の物体や画面全体が縦方向に速く動くシーンを符号化するときに、スライス境界では最適な動きベクトルが選択できないことがある。その結果、局所的な画質劣化を発生させる可能性がある。劣化の程度は、速い動きのときにM値が大きいほど大きくなる。M値は、参照ピクチャの間隔である。なお、「最適な動きベクトル」は、映像符号化装置における画面間予測(インター予測)処理を行う予測器で選択された本来の(正規の)動きベクトルを意味する。
図14に、M=4の場合とM=8の場合の参照ピクチャの間隔が例示されている。一般に、M値が小さい場合には、フレーム間距離が小さくなるので、動きベクトルの値は小さくなる傾向がある。しかし、特に定常的なシーンにおいて、時間方向階層が少なくなるため階層(レイヤ)に応じた符号量配分が制約されるため、符号化効率は低下する。一方、M値が大きい場合には、フレーム間距離が大きくなるので、動きベクトルの値は大きくなる傾向がある。しかし、特に定常的なシーンにおいて、時間方向階層が多くなるため階層(レイヤ)に応じた符号量配分の制約が緩和されるため、符号化効率は向上する。一例として、M値を8から4に変えると、動きベクトルの値は1/2になり、M値を4から8に変えると、動きベクトルの値は2倍になる。
なお、非特許文献1においてSOP(Set of Pictures )という概念が導入されている。SOP は、時間方向階層符号化を行う場合に、各AU(Access Unit )の符号化順及び参照関係を記述する単位になる。時間方向階層符号化は、複数フレームの映像の中から、部分的にフレームを取り出せるようにする符号化である。
SOP構造は、L=0の構造、L=1の構造、L=2の構造及びL=3の構造を含む。図15に示すように、Lx(x=0,1,2,3)は、以下のような構造である。
・L=0の構造:Temporal ID が0のピクチャだけで構成されるSOP 構造(つまり、同SOPに含まれるピクチャの段数は1つである。最大Temporal ID を示すLが0であるともいえる。)
・L=1の構造:Temporal ID が0のピクチャおよび1のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は2つである。最大Temporal ID を示すLが1であるともいえる。)
・L=2の構造:Temporal ID が0のピクチャ、1のピクチャ、および、2のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は3つである。最大Temporal ID を示すLが2であるともいえる。)
・L=3の構造:Temporal ID が0のピクチャ、1のピクチャ、2のピクチャ、および3のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は4つである。最大Temporal ID を示すLが3であるともいえる。)
本明細書の記載では、M=1はL=0の構造のSOP に対応し、M=2はN=1の場合のL=1の構造のSOP (図15参照)に対応し、M=3はN=2の場合のL=1の構造のSOP (図15参照)に対応し、M=4はL=2の構造のSOP に対応し、M=8はL=3の構造のSOP に対応する。
定常的なシーン(例えば、画面中の物体や画面全体が速く動かないシーン)については、上述したように参照ピクチャ間隔(M値)が大きいほど符号化効率がよい。よって、8Kなどの高精細映像を低レートで符号化するためには、映像符号化装置が基本的にM=8で動作することが好ましい。
しかし、上述したように、M値を大きくすると動きベクトルの値が大きくなる傾向があるので、特に、画面中の物体や画面全体が縦方向に速く動くシーンにおいて、動きベクトル制限に起因して画質が劣化する。動きベクトル制限によって、スライス境界において、最適な動きベクトルを選択できない場合があるためである。
本発明は、映像の画面を分割してから圧縮する符号化方法であって、スライス境界付近において動きベクトルの選択の制約がある符号化方法を使用する場合に、画質劣化を抑制することを目的とする。加えて、上述したように4Kや8KではSDR とHDR の切り替えも考慮する必要があるため、本発明は、SDR とHDR の切り替えも考慮して、上記画質劣化を抑制することを目的とする。
本発明による映像符号化方法は、ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化方法であって、時間方向で、符号化対象の映像信号がSDR からHDR に切り替わるとき、または、HDR からSDRに切り替わるとき、ダイナミックレンジを切り替えるためのダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定することを特徴とする。
本発明による映像符号化装置は、ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化装置であって、時間方向で、符号化対象の映像信号がSDR からHDR に切り替わるとき、または、HDR からSDRに切り替わるとき、ダイナミックレンジを切り替えるためのダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定する符号化構造制御手段を備えることを特徴とする。
本発明による映像符号化プログラムは、ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化装置におけるコンピュータに、時間方向で、符号化対象の映像信号がSDR からHDR に切り替わるとき、または、HDR からSDRに切り替わるとき、ダイナミックレンジを切り替えるためのダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定する処理を実行させることを特徴とする。
本発明による映像システムは、上記の映像符号化装置と、音声信号を符号化する音声符号化部と、映像符号化装置からのビットストリームと音声符号化部からのビットストリームとを多重化して出力する多重化部とを備える。
本発明によれば、SDR とHDR の切り替えに対応しつつ、画質劣化を抑制することができる。
映像符号化装置の実施形態の構成例を示すブロック図である。 映像復号装置の実施形態の構成例を示すブロック図である。 映像符号化装置の第1の実施形態の動作を示すフローチャートである。 映像符号化装置の第2の実施形態の動作を示すフローチャートである。 映像符号化装置の第3の実施形態の動作を示すフローチャートである。 映像システムの一例を示すブロック図である。 映像システムの他の例を示すブロック図である。 映像符号化装置及び映像復号装置の機能を実現可能な情報処理システムの構成例を示すブロック図である。 映像符号化装置の主要部を示すブロック図である。 映像復号装置の主要部を示すブロック図である。 画面分割の一例を示す説明図である。 動きベクトル制限を説明するための説明図である。 SOP構造を示す説明図である。 参照ピクチャの間隔の一例を示す説明図である。 SOP構造を示す説明図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、映像符号化装置の実施形態の構成例を示すブロック図である。図1に示す映像符号化装置100は、符号化部101、解析部111、判定部112及びM値決定部113を含む。なお、映像符号化装置100は、HEVC規格に基づいて符号化処理を実行するが、他の規格、例えば、H.264/AVC規格に基づいて符号化処理を実行してもよい。また、以下、8Kの映像が入力される場合を例にする。
符号化部101は、入力画像を複数の画面に分割する画面分割器102、周波数変換/量子化器103、逆量子化/逆周波数変換器104,バッファ105、予測器106、及びエントロピー符号化器107を含む。
画面分割器102は、入力映像の画面を4つの画面に分割する(図11参照)。周波数変換/量子化器103は、入力映像信号から予測信号を減じた予測誤差画像を周波数変換する。周波数変換/量子化器103は、さらに、周波数変換された予測誤差画像(周波数変換係数)を量子化する。以下、量子化された周波数変換係数を変換量子化値という。
エントロピー符号化器107は、予測パラメータと変換量子化値をエントロピー符号化して、ビットストリームを出力する。予測パラメータは、予測モード(イントラ予測、インター予測)、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、及び動きベクトルなど、CTU(Coding Tree Unit)及びブロックの予測に関連した情報である。
予測器106は、入力映像信号に対する予測信号を生成する。予測信号は、イントラ予測またはフレーム間予測に基づいて生成される。
逆量子化/逆周波数変換器104は、変換量子化値を逆量子化する。さらに、逆量子化/逆周波数変換器104は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ105に供給される。バッファ105は、再構築画像を格納する。
解析部111は、符号化統計情報を解析する。判定部112は、上述した動きベクトル制限で、スライス境界付近で最適な動きベクトルを選択できるか否かを、解析部111の解析結果に基づいて判定する。なお、符号化統計情報は、過去のフレーム(例えば、現在の符号化対象のフレームの直前のフレーム)の符号化結果の情報であるが、符号化統計情報の具体例については後述する。
なお、スライス境界付近は、最適な動きベクトルを選択できなかった領域になるが、以下の制御を実現する際に、便宜的に、例えば、スライス境界から±128画素の範囲や±256画素の範囲を、スライス境界付近としてもよい。また、以下の制御を実現する際に、「スライス境界付近」の範囲を、映像の状況(動きが大きい/小さいなど)に応じて、適宜変更可能であるようにしてもよい。例えば、値が大きい動きベクトルの発生比率が高い場合に、「スライス境界付近」の範囲を広く設定するようにしてもよい。
M値決定部113は、判定部112の判定結果に基づいて、M値を適応的に決定する。なお、上述したように、M値を決定することは、SOP構造におけるLx(x=0,1,2,3)構造を決定することと等価である。また、符号化統計情報については、後述する。
図2は、映像復号装置の実施形態の構成例を示すブロック図である。図2に示す映像復号装置200は、エントロピー復号器202、逆量子化/逆周波数変換器203、予測器204、及びバッファ205を含む。
エントロピー復号器202は、映像のビットストリームをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆量子化/逆周波数変換器203に供給する。
逆量子化/逆周波数変換器203は、量子化ステップ幅で、輝度及び色差の変換量子化値を逆量子化して周波数変換係数を得る。さらに、逆量子化/逆周波数変換器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する(前記予測は、動き補償予測、または、MC参照とも呼ぶ)。逆量子化/逆周波数変換器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築ピクチャとしてバッファ205に供給される。そして、バッファ205に格納された再構築ピクチャが復号映像として出力される。
次に、映像符号化装置100における解析部111、判定部112及びM値決定部113の動作を説明する。
実施形態1.
図3は、図1に示された映像符号化装置100の第1の実施形態の動作を示すフローチャートである。第1の実施形態では、8Kの映像は4分割され(図11参照)、スライス境界付近において動きベクトル制限があるとする。また、動きベクトル制限として、±128を例にする。8Kの映像は4分割され、かつ、動きベクトル制限があることは、他の実施形態でも同様である。なお、M値の初期値は8(M=8)である。
解析部111は、バッファ105に格納されている過去の符号化結果(例えば、直前フレームの符号化結果)を解析する。具体的には、解析部111は、スライス境界以外のブロックにおける動きベクトルの平均値又は中央値(以下、平均値又は中央値をMavgとする。)を算出する(ステップS101)。なお、第1の実施形態では、符号化統計情報は、動きベクトルの値であり、解析結果は、動きベクトルの平均値又は中央値である。
判定部112は、Mavgが、動きベクトル制限としての±128を基準として、どの程度の大きさになっているかを判定する(ステップS102)。
そして、M値決定部113は、Mavgがどの程度の大きさになっているかの判定結果に基づいて、M値を決定する(ステップS103)。
M値決定部113は、判定結果に基づいて、例えば、以下のようにM値を決定する。
(1)M=8である場合:
|Mavg|≦128 → M=8を維持
128<|Mavg|≦256 → M=4(M=8の1/2)に決定
256<|Mavg|≦512 → M=2(M=8の1/4)に決定
512<|Mavg| → M=1(M=8の1/8)に決定
(2)M=4である場合:
|Mavg|≦64 → M=8に決定
64<|Mavg|≦128 → M=4を維持
128<|Mavg|≦256 → M=2に決定
256<|Mavg| → M=1に決定
M値決定部113は、M値がその他の値であるときにも、上記の(1),(2)の場合と同様に、M値を8にしたときに、動きベクトル制限の下で、スライス境界付近での動きベクトルの値が±128以内に収まると推定できたときには、M値を8に戻す。換言すれば、M値決定部113は、動きベクトル制限の下で、スライス境界付近で最適な動きベクトルを選択できると推定できた場合には、M値を8に戻す。その他の場合にも、Mavgに応じて、スライス境界付近での動きベクトルの値が±128以内に収まるようにM値を決定する。
なお、上記の場合分け(閾値の設定)は一例であって、閾値を変えたり、より細かな場合分けをしてもよい。
第1の実施形態の映像符号化装置の制御は、以下のような考え方に基づく。
映像が、画面全体が速く動くシーンの映像であるときには、発生した全ての動きベクトルに対して、スライス境界付近でもスライス境界付近以外でも、値が大きい動きベクトルの数の比率が高い。しかし、動きベクトル制限があるので、スライス境界付近では、最適な動きベクトルが選択されていない可能性がある。そこで、判定部112は、スライス境界以外の領域において発生した符号化統計情報としての動きベクトル(動きベクトル制限はないので、正規の、換言すれば最適な動きベクトルである。)に基づいて、符号化対象の画面が速く動くシーンの映像の画面であるか否かを推定する。M値決定部113は、速く動くシーンの映像であると判定部112が推定した場合には、スライス境界付近において最適な動きベクトルを選択可能になるようにM値を変える。
なお、速く動くシーンの映像である場合には、スライス境界付近において最適な動きベクトルが選択されていない可能性があるので、速く動くシーンの映像であると推定されたことは、動きベクトル制限の下で、スライス境界付近において最適な動きベクトルが選択されていないと推定されたことと等価である。
また、上述したように、M値とSOP構造とは相関している。よって、M値決定部113がM値を決定することは、SOP構造(すなわち、Lx(x=0,1,2,3)構造)を決定することと等価である。
実施形態2.
図4は、図1に示された映像符号化装置100の第2の実施形態の動作を示すフローチャートである。
解析部111は、バッファ105に格納されている過去の符号化結果(例えば、直前フレームの符号化結果)を解析する。具体的には、解析部111は、スライス境界以外の範囲における全てのブロック(例えば、PU:Prediction Unit )に対して、画面内予測(イントラ予測)が用いられたブロックの割合Pを算出し(ステップS201)、スライス境界付近の全てのブロックに対して、画面内予測が用いられたブロックの割合Pを算出する(ステップS202)。なお、第2の実施形態では、符号化統計情報は、スライス境界付近のブロックの予測モード(具体的には、画面内予測のブロックの数)であり、解析結果は、割合P及び割合Pである。
判定部112は、割合Pと割合Pとを比較し、それらの乖離の程度を判定する。具体的には、割合Pと比較して、割合Pがかなり大きいか否かを判定する。判定部112は、例えば、割合Pと割合Pとの差が所定値を越えているか否か判定する(ステップS203)。
M値決定部113は、割合Pと割合Pとの差が所定値を越えている場合には、M値を小さくする(ステップS204)。なお、複数の所定値を設け、例えば、差が第1の所定値を越えているときにはM値を複数段階小さくし、差が第2の所定値(<第1の所定値)を越えているときにはM値を1段階小さくするようにしてもよい。
また、M値決定部113は、割合Pと割合Pとの差が所定値以下である場合には、M値を維持するか、又は、M値を大きくする(ステップS205)。例えば、M値決定部113は、差が第3の所定値(<第2の所定値)以下であるときにはM値を大きくし、差が第3の所定値を越えているときにはM値を維持する。
第2の実施形態の映像符号化装置の制御は、以下のような考え方に基づく。
符号化部101は、画面内の各ブロックを符号化する際に、予測モードとして画面内予測と画面間予測(インター予測)とのいずれかを使用できる。映像が、画面全体が速く動くシーンの映像であるときには、スライス境界付近においても、画面間予測が使用されるときに値が大きい動きベクトルの数の発生率が高いと考えられる(動きベクトル制限がない場合)。動きベクトル制限があるので、スライス境界付近では、最適な動きベクトル(大きな動きベクトル)を発生することができず、その結果、スライス境界付近では、画面内予測が使用されることが多いと考えられる。スライス境界付近以外では、動きベクトル制限はないので、スライス境界付近に比べて、画面内予測が使用されることは少ないと考えられる。
よって、割合Pと割合Pとが大きく乖離している場合には、速く動くシーンの映像の信号が符号化部101に入力されていると推定される。
なお、速く動くシーンの映像である場合には、スライス境界付近において最適な動きベクトルが選択されていない可能性があるので、速く動くシーンの映像であると推定されたことは、動きベクトル制限の下で、割合Pと割合Pとが大きく乖離していることと等価である。
大きく乖離しているか否か判定するための所定値として、一例として、経験的又は実験的に、そのような値を閾値として使用すれば、スライス境界付近において最適な動きベクトルが選択されていない可能性があることを推定可能な値が選択される。
実施形態3.
図5は、図1に示された映像符号化装置100の第3の実施形態の動作を示すフローチャートである。
解析部111は、バッファ105に格納されている過去の符号化結果(例えば、直前フレームの符号化結果)を解析する。具体的には、解析部111は、以前のフレーム(例えば、現在の符号化対象のフレームの2フレーム前)のスライス境界付近のブロックにおける発生符号量Cを算出する(ステップS301)。また、解析部111は、直前のフレームのスライス境界付近のブロックにおける発生符号量Cを算出する(ステップS302)。なお、第3の実施形態では、符号化統計情報は、スライス境界付近のブロックの発生符号量であり、解析結果は、発生符号量C及び発生符号量Cである。
判定部112は、発生符号量Cと発生符号量Cとを比較し、それらの乖離の程度を判定する。具体的には、発生符号量Cと比較して、発生符号量Cがかなり大きいか否かを判定する。判定部112は、例えば、発生符号量Cと発生符号量Cとの差が所定量を越えているか否か判定する(ステップS303)。
M値決定部113は、発生符号量Cと発生符号量Cとの差が所定量を越えている場合には、M値を小さくする(ステップS304)。なお、複数の所定量を設け、例えば、差が第1の所定量を越えているときにはM値を複数段階小さくし、差が第2の所定量(<第1の所定量)を越えているときにはM値を1段階小さくするようにしてもよい。
また、M値決定部113は、発生符号量Cと発生符号量Cとの差が所定量以下である場合には、M値を維持するか、又は、M値を大きくする(ステップS305)。例えば、M値決定部113は、差が第3の所定量(<第2の所定量)以下であるときにはM値を大きくし、差が第3の所定量を越えているときにはM値を維持する。
第3の実施形態の映像符号化装置の制御は、以下のような考え方に基づく。
上述したように、画面全体が速く動くシーンの映像であるときには、スライス境界付近においても、画面間予測が使用されるときに値が大きい動きベクトルの数の比率が高いと考えられる(動きベクトル制限がない場合)。しかし、動きベクトル制限があるので、スライス境界付近では、最適な動きベクトル(大きな動きベクトル)を発生することができず、その結果、スライス境界付近では、画面内予測が使用されることが多いと考えられる。一般に、画面間予測が使用されるときに比べて、画面内予測が使用されるときには、発生符号量は多くなる。
よって、発生符号量Cと比較して、発生符号量Cがかなり多い場合には、速く動くシーンの映像の信号が符号化部101に入力される状況に変化したと推定される。
なお、速く動くシーンの映像になった場合には、スライス境界付近において最適な動きベクトルが選択されない可能性があるので、速く動くシーンの映像になったと推定されたことは、動きベクトル制限の下で、発生符号量Cが大きく増えたことと等価である。
大きく増えたか否か判定するための所定量として、一例として、経験的又は実験的に、そのような量を閾値として使用すれば、スライス境界付近において最適な動きベクトルが選択されない可能性があることを推定可能な値が選択される。
以上に説明したように、上記の各実施形態では、過去の符号化結果(符号化統計情報)に基づいてM値が適応的に切替えられる。符号化統計情報に基づいて動きベクトル制限の下で、スライス境界付近で最適な動きベクトル(換言すれば、動きベクトル制限を外れる動きベクトル)を選択できるか否かが推定される。選択できないと推定され場合には、M値はより小さな値に変更される。選択できると判定された場合、そのときのM値でも動きベクトル制限の下でスライス境界付近で最適な動きベクトルを選択できると考えられるので、M値は、維持されるか、又は、より大きな値に変更される。
その結果、動きベクトル制限によってスライス境界付近で最適な動きベクトルを選択できない状態になることをでるだけ回避でき、局所的な画質劣化が生ずる可能性を低減できる。すなわち、動きの速さに応じてM値が適応的に切替えられるので、好適な画質を得ることができる。
また、符号化結果(例えば、直前のフレームの符号化結果)に基づいてM値を切り替えることができるので、事前解析(現在のフレームを符号化する際に前処理として実行される解析処理)を行う必要がなく、事前解析を行う場合と比較して、符号化のための処理時間が延びてしまうことが防止される。
なお、映像符号化装置100において、第1〜第3の実施形態のうちの任意の2つ又は全ての形態が組み込まれるように、解析部111、判定部112及びM値決定部113が構成されていてもよい。
さらに、映像符号化装置100において、M値決定部113は外部から設定されるSDR とHDR の切り替え情報も用いて符号化構造を決定し、さらに、エントロピー符号化器107がSDR とHDR の切り替え情報を映像復号装置側に伝送してもよい。
具体的には、M値決定部113は、外部から設定されるSDR とHDR の切り替えの位置(時間位置)で符号化シーケンス(CVS )を終端できるように、M値を制御する。
説明の簡単のため、現在の時間位置のフレームから切り替え時間位置のフレームまでのフレーム数をfNumSwitch、仮決定したM値をMとする。
fNumSwitchが1以上で、かつ、MがfNumSwitchよりも大きな時、M値決定部113は、MをfNumSwitch以下の値に更新する。
その他の場合で、fNumSwitchが0の時、M値決定部は、過去に符号化したフレームでCVS が終端されるように、Mを1とする。つまり、映像符号化装置は、現在のフレームをIDR ピクチャとして圧縮することになる。さらに、エントロピー符号化器107は、SDR とHDR の切り替え情報を映像復号装置側に伝送するために、IDR ピクチャのSPS のVUI のtransfer_characteristicsシンタクスに、切り替わったSDR またはHDR の情報を設定する。例えば、HLG のHDR に切り替わった場合transfer_characteristicsシンタクスに18を設定し、PQのHDR に切り替わった場合transfer_characteristicsシンタクスに16を設定し、Rec. ITU-R BT.2020のSDR に切り替わった場合transfer_characteristicsシンタクスに14を設定し、IEC 61966-2-4 のSDR に切り替わった場合transfer_characteristicsシンタクスに11を設定し、Rec. ITU-R BT.709 のSDR に切り替わった場合transfer_characteristicsシンタクスに1 を設定する。なお、このとき、エントロピー符号化器107は、IDR ピクチャのビットストリームよりも前に、EOS のビットストリームを出力してもよい。
その他の場合、M値決定部113は、Mをそのまま出力する。
なお、上述したSDR やHDR に対応するtransfer_characteristicsシンタクスの値と特性の関係は以下の表の通りである。
Figure 0006132006
また、図2に示された映像復号装置は、第1〜第3の実施形態において例示されたような、動きベクトル制限を満たす範囲で設定されたM値を用いて符号化されたビットストリームを復号する。
さらに、図2に示された映像復号装置は、ビットストリームの復号によって、映像符号化装置側から伝送されたSDR とHDR の切り替え情報を受信することもできる。
具体的には、映像復号装置のエントロピー復号器202は、SPSのVUIのtransfer_characteristicsシンタクスの値を復号することでSDR とHDR の切り替え情報を受信できる。例えば、transfer_characteristicsシンタクスが18の場合HLG のHDR への切り替わりを受信し、transfer_characteristicsシンタクスが16の場合PQのHDR への切り替わりを受信し、transfer_characteristicsシンタクスが14の場合Rec. ITU-R BT.2020のSDR への切り替わりを受信し、transfer_characteristicsシンタクスが11の場合IEC 61966-2-4 のSDR への切り替わりを受信し、transfer_characteristicsシンタクスが1 の場合Rec. ITU-R BT.709 への切り替わりを受信できる。ここで、SDR とHDR の切り替えは、M=1で符号化されたIDR ピクチャのSPS の復号だけで受信(検出)されることはいうまでもない。また、IDR ビットストリームの前にはEOS のビットストリームが受信(検出)されていてもよいことはいうまでもない。
上記の映像復号装置を利用した受信端末は、SDR とHDR の切り替え情報を知ることができ、映像信号の特性に応じた映像表示を調整できる。つまり、SDR とHDR の切り替え表示に対応しつつ、画質劣化が抑制された映像表示ができる。
図6は、映像システムの一例を示すブロック図である。図6に示す映像システムは、上記の各実施形態の映像符号化装置100と図2に示された映像復号装置200とが、無線伝送路又は有線伝送路300で接続されるシステムである。映像符号化装置100は、上記の第1〜第3の実施形態のいずれかの映像符号化装置100であるが、映像符号化装置100において、第1〜第3の実施形態のうちの任意の2つ又は全ての処理を実行するように、解析部111、判定部112及びM値決定部113が構成されていてもよい。
なお、上記の例では、SDR とHDR の切り替え情報を映像復号側に伝送する伝送手段は、エントロピー符号化器107で実現される。また、符号化された映像と映像符号化側から伝送されたSDR とHDR の切り替え情報を復号する復号手段は、エントロピー復号器202で実現される。しかし、エントロピー符号化を行うエントロピー符号化器が、エントロピー符号化器による符号化データとSDR とHDR の切り替え情報とを多重化する多重化器とは分離して構成され、エントロピー復号を行うエントロピー復号器が、多重化ビットストリームからSDR とHDR の切り替え情報と映像とを分離する多重化解除器とは分離して構成されている場合には、映像システムを、多重化器を含まない部分で構成される映像符号化装置と、多重化解除器を含まない部分で構成される映像復号装置とで構成されるシステムとしてもよい。
図7は、映像システムの他の例を示すブロック図である。図7に示す映像システムは、音声符号化部401、映像符号化部402及び多重化部403を含む。
音声符号化部401は、映像と音声とを含むデータ(コンテンツ)のうちの音声信号を、例えばARIB STD-B32規格で規定されるMPEG-4 AAC(Advanced Audio Coding) 規格やMPEG-4 ALS 規格(Audio Lossless Coding) に基づいて符号化することによって音声ビットストリームを作成して出力する。
映像符号化部402は、例えば、図1に示すように構成され、映像ビットストリームを作成して出力する。
多重化部403は、例えばARIB STD-B32規格に基づいて、音声ビットストリーム、映像ビットストリーム及びその他の情報を多重化することによって音声ビットストリームを作成して出力する。
また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図8に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図8に示された情報処理システムにおいて、プログラムメモリ1002には、図1,図2のそれぞれに示された各ブロック(バッファのブロックを除く)の機能を実現するためのプログラム(映像符号化プログラム又は映像復号プログラム)が格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1,図2のそれぞれに示された映像符号化装置または映像復号装置の機能を実現する。
図9は、映像符号化装置の主要部を示すブロック図である。図9に示すように、映像符号化装置10は、符号化統計情報を解析する解析部11(実施形態における解析部111に相当)と、解析部11の解析結果に基づいて、スライス境界付近で最適な動きベクトルを選択できるか否かを推定する推定部12(実施形態では、判定部112で実現される。)と、推定部12の推定結果およびSDR とHDR の切り替え情報に基づいて、符号化構造を、Temporal ID が0のピクチャだけで構成されるSOP 構造、Temporal ID が0のピクチャおよび1のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、および2のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、2のピクチャおよび3のピクチャで構成されるSOP 構造のいずれかに適応的に決定する符号化構造決定部13(実施形態では、M値決定部113で実現される。)と、SDR とHDR の切り替え情報を映像復号側に伝送する伝送手段14(実施形態では、エントロピー符号化器107で実現される。)とを備える。
図10は、映像復号装置の主要部を示すブロック図である。図10に示すように、映像復号装置20は、Temporal ID が0のピクチャだけで構成されるSOP 構造、Temporal ID が0のピクチャおよび1のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、および2のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、2のピクチャ、および3のピクチャで構成されるSOP 構造のいずれかで符号化された映像と映像符号化側から伝送されたSDR とHDR の切り替え情報を復号する復号部21(実施形態では、エントロピー復号器202で実現される。)を備える。
なお、復号部21は、設定された符号化構造としての、Temporal IDが0のピクチャだけで構成されるSOP 構造、Temporal ID が0のピクチャおよび1のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、および、2のピクチャで構成されるSOP 構造、Temporal ID が0のピクチャ、1のピクチャ、2のピクチャ、および3のピクチャで構成されるSOP 構造のいずれかのSOP 構造に基づいて符号化されたビットストリームを復号することができる。
さらに、復号部21は、図11に示すような4個のスライスに分割されて、さらに、図12に示すような、あるスライスのPUが別のスライスを動き補償(MC)参照する場合に、スライス境界を跨ぐ同PUのMC参照はスライス境界から128ライン以内の画素のみを参照するように制限されて、符号化されたビットストリームを復号できる。
なお、実施形態では、120Pの動画像を扱う場合、映像符号化および復号側で図13に示すような、以下のSOP 構造を用いることができる。
・L=0の構造:Temporal ID が0のピクチャだけで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は1つである。最大Temporal ID を示すLが0であるともいえる。)
・L=1の構造:Temporal ID が0のピクチャおよび1(またはM)のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は2つである。最大Temporal ID を示すLが1(またはM)であるともいえる。)
・L=2の構造:Temporal ID が0のピクチャ、1のピクチャ、および、2(またはM)のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は3つである。最大Temporal ID を示すLが2(またはM)であるともいえる。)
・L=3の構造:Temporal ID が0のピクチャ、1のピクチャ、2のピクチャ、および3(またはM)のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は4つである。最大Temporal ID を示すLが3(またはM)であるともいえる。)
・L=4の構造:Temporal ID が0のピクチャ、1のピクチャ、2のピクチャ、3のピクチャ、および、4(またはM)のピクチャで構成されるSOP 構造(つまり、同SOP に含まれるピクチャの段数は4つである。最大Temporal ID を示すLが4(またはM)であるともいえる。)
10 映像符号化装置
11 解析部
12 推定部
13 符号化構造決定部
14 伝送部
20 映像復号装置
21 復号部
100 映像符号化装置
101 符号化部
102 画面分割器
103 周波数変換/量子化器
104 逆量子化/逆周波数変換器
105 バッファ
106 予測器
107 エントロピー符号化器
111 解析部
112 判定部
113 M値決定部
200 映像復号装置
202 エントロピー復号器
203 逆量子化/逆周波数変換器
204 予測器
205 バッファ
401 音声符号化部
402 映像符号化部
403 多重化部
1001 プロセッサ
1002 プログラムメモリ
1003,10004 記憶媒体

Claims (4)

  1. ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化方法であって、
    時間方向で、符号化対象の映像信号がSDR (Standard Dynamic Range)からHDR (High Dynamic Rang )に切り替わるとき、または、HDR からSDR に切り替わるとき、前記ダイナミックレンジを切り替えるための前記ダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定する
    ことを特徴とする映像符号化方法。
  2. ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化装置であって、
    時間方向で、符号化対象の映像信号がSDR (Standard Dynamic Range)からHDR (High Dynamic Rang )に切り替わるとき、または、HDR からSDRに切り替わるとき、前記ダイナミックレンジを切り替えるための前記ダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定する符号化構造制御手段を備える
    ことを特徴とする映像符号化装置。
  3. ダイナミックレンジに関する映像信号の情報を用い、複数のSOP 構造を使用してビットストリームを生成する映像符号化装置におけるコンピュータに、
    時間方向で、符号化対象の映像信号がSDR (Standard Dynamic Range)からHDR (High Dynamic Rang )に切り替わるとき、または、HDR からSDRに切り替わるとき、前記ダイナミックレンジを切り替えるための前記ダイナミックレンジに関する映像信号の情報を伝送可能するために、切り替わり後の先頭のSOP のSOP 構造をTemporal ID が0のピクチャだけで構成されるSOP 構造に設定する処理を実行させるための
    映像符号化プログラム。
  4. 請求項に記載の映像符号化装置と、
    音声信号を符号化する音声符号化部と、
    前記映像符号化装置からのビットストリームと前記音声符号化部からのビットストリームとを多重化して出力する多重化部と
    を備える映像システム。
JP2015235525A 2015-12-02 2015-12-02 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム Active JP6132006B1 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP2015235525A JP6132006B1 (ja) 2015-12-02 2015-12-02 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム
CA3077470A CA3077470C (en) 2015-12-02 2016-11-14 Video encoding method, video encoding device, video decoding method, video decoding device, program, and video system
KR1020187014826A KR102198120B1 (ko) 2015-12-02 2016-11-14 비디오 인코딩 방법, 비디오 인코딩 디바이스, 비디오 디코딩 방법, 비디오 디코딩 디바이스, 프로그램, 및 비디오 시스템
EP16870421.1A EP3386200A4 (en) 2015-12-02 2016-11-14 VIDEO CODING METHOD, VIDEO CODING APPARATUS, VIDEO DECODING METHOD, VIDEO DECODING APPARATUS, PROGRAM, AND VIDEO SYSTEM
PCT/JP2016/083681 WO2017094482A1 (ja) 2015-12-02 2016-11-14 映像符号化方法、映像符号化装置、映像復号方法、映像復号装置、及びプログラム、並びに映像システム
CA3138227A CA3138227C (en) 2015-12-02 2016-11-14 Video encoding method, video encoding device, video decoding method, video decoding device, program, and video system
BR112018010465-5A BR112018010465B1 (pt) 2015-12-02 2016-11-14 Método de codificação de vídeo e dispositivo de codificação de vídeo para gerar um fluxo de bits e sistema de vídeo
KR1020207037536A KR102242880B1 (ko) 2015-12-02 2016-11-14 비디오 인코딩 방법, 비디오 인코딩 디바이스, 비디오 디코딩 방법, 비디오 디코딩 디바이스, 및 컴퓨터 판독가능 정보 기록 매체
US15/777,980 US10645421B2 (en) 2015-12-02 2016-11-14 Video encoding method, video encoding device, video decoding method, video decoding device, program, and video system
CA3006941A CA3006941C (en) 2015-12-02 2016-11-14 Video encoding method, video encoding device, video decoding method, video decoding device, program, and video system
US16/824,778 US10827201B2 (en) 2015-12-02 2020-03-20 Video encoding method, video encoding device, video decoding method, video decoding device, program, and video system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015235525A JP6132006B1 (ja) 2015-12-02 2015-12-02 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017018377A Division JP6241558B2 (ja) 2017-02-03 2017-02-03 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム

Publications (2)

Publication Number Publication Date
JP6132006B1 true JP6132006B1 (ja) 2017-05-24
JP2017103622A JP2017103622A (ja) 2017-06-08

Family

ID=58745672

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015235525A Active JP6132006B1 (ja) 2015-12-02 2015-12-02 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム

Country Status (7)

Country Link
US (2) US10645421B2 (ja)
EP (1) EP3386200A4 (ja)
JP (1) JP6132006B1 (ja)
KR (2) KR102242880B1 (ja)
BR (1) BR112018010465B1 (ja)
CA (3) CA3006941C (ja)
WO (1) WO2017094482A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415634A (zh) * 2018-04-27 2019-11-05 苹果公司 用于高动态范围显示器的标准和高动态范围显示系统和方法
CN111083480A (zh) * 2019-12-10 2020-04-28 四川新视创伟超高清科技有限公司 一种基于cpu的8k超高清视频高速编码方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017235369B2 (en) 2016-03-18 2022-02-03 Koninklijke Philips N.V. Encoding and decoding HDR videos
US10979729B2 (en) * 2016-11-30 2021-04-13 Qualcomm Incorporated Systems and methods for signaling and constraining a high dynamic range (HDR) video system with dynamic metadata
WO2018131986A1 (ko) * 2017-01-16 2018-07-19 세종대학교 산학협력단 영상의 부호화/복호화 방법 및 장치
US11272213B2 (en) * 2017-09-22 2022-03-08 Dolby Laboratories Licensing Corporation Backward compatible display management metadata compression
JP7098475B2 (ja) * 2018-08-07 2022-07-11 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP7067367B2 (ja) * 2018-08-24 2022-05-16 日本電信電話株式会社 映像送信装置及び映像送信方法
CN117063465A (zh) * 2021-03-30 2023-11-14 日本电气株式会社 视频编码设备、视频解码设备、视频编码方法、视频解码方法和视频系统
CN113824914B (zh) * 2021-08-12 2022-06-28 荣耀终端有限公司 视频处理方法、装置、电子设备和存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014445B2 (en) * 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
US8194997B2 (en) * 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
JP2008118221A (ja) * 2006-10-31 2008-05-22 Toshiba Corp 復号装置及び復号方法
US9338389B2 (en) * 2011-10-20 2016-05-10 Dolby Laboratories Licensing Corporation Method and system for video equalization
AR091515A1 (es) 2012-06-29 2015-02-11 Sony Corp Dispositivo y metodo para el procesamiento de imagenes
JP6279220B2 (ja) 2013-03-15 2018-02-14 宮川化成工業株式会社 蒸気量測定装置
EP3926963A3 (en) * 2013-04-30 2022-01-26 Saturn Licensing LLC Transmitting device, transmitting method, receiving device, and receiving method
JP2015008361A (ja) * 2013-06-24 2015-01-15 ソニー株式会社 再生装置、再生方法、および記録媒体
MX367832B (es) * 2014-01-24 2019-09-09 Sony Corp Dispositivo de transmisión, método de transmisión, dispositivo de recepción y método de recepción.
MX366333B (es) * 2014-02-21 2019-07-05 Sony Corp Dispositivo de transmision, metodo de transmision, dispositivo de recepcion, y metodo de recepcion.
US20180070083A1 (en) * 2015-03-24 2018-03-08 Sony Corporation Transmission device, transmission method, reception device, and reception method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415634A (zh) * 2018-04-27 2019-11-05 苹果公司 用于高动态范围显示器的标准和高动态范围显示系统和方法
CN111083480A (zh) * 2019-12-10 2020-04-28 四川新视创伟超高清科技有限公司 一种基于cpu的8k超高清视频高速编码方法
CN111083480B (zh) * 2019-12-10 2022-11-04 四川新视创伟超高清科技有限公司 一种基于cpu的8k超高清视频高速编码方法

Also Published As

Publication number Publication date
US10645421B2 (en) 2020-05-05
EP3386200A4 (en) 2019-09-04
KR102198120B1 (ko) 2021-01-04
JP2017103622A (ja) 2017-06-08
BR112018010465B1 (pt) 2020-03-03
WO2017094482A1 (ja) 2017-06-08
KR20210002124A (ko) 2021-01-06
CA3138227A1 (en) 2017-06-08
CA3077470A1 (en) 2017-06-08
BR112018010465A8 (pt) 2019-02-26
CA3006941A1 (en) 2017-06-08
US20180352260A1 (en) 2018-12-06
KR20180077209A (ko) 2018-07-06
US20200221132A1 (en) 2020-07-09
EP3386200A1 (en) 2018-10-10
CA3138227C (en) 2023-07-04
KR102242880B1 (ko) 2021-04-20
CA3077470C (en) 2021-12-14
CA3006941C (en) 2020-05-05
US10827201B2 (en) 2020-11-03
BR112018010465A2 (ja) 2018-08-28

Similar Documents

Publication Publication Date Title
JP6132006B1 (ja) 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム
KR102435739B1 (ko) 인트라 예측 모드 스케일러블 코딩 방법 및 장치
US20170064323A1 (en) Scalable video coding method and apparatus using intra prediction mode
US11706426B2 (en) Method for decoding image on basis of CCLM prediction in image coding system, and device therefor
US20160127728A1 (en) Video compression apparatus, video playback apparatus and video delivery system
US9762912B2 (en) Gradual updating using transform coefficients for encoding and decoding
US20220337814A1 (en) Image encoding/decoding method and device using reference sample filtering, and method for transmitting bitstream
JP6241565B2 (ja) 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム
JP6677230B2 (ja) 映像符号化装置、映像復号装置、映像システム、映像符号化方法、及び映像符号化プログラム
JP6241558B2 (ja) 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム
JP6489227B2 (ja) 映像符号化装置及び映像符号化方法
KR20230015392A (ko) Gci를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170321

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170403

R150 Certificate of patent or registration of utility model

Ref document number: 6132006

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150