JP6994868B2 - 符号化装置、復号装置、符号化方法、および復号方法 - Google Patents
符号化装置、復号装置、符号化方法、および復号方法 Download PDFInfo
- Publication number
- JP6994868B2 JP6994868B2 JP2017154776A JP2017154776A JP6994868B2 JP 6994868 B2 JP6994868 B2 JP 6994868B2 JP 2017154776 A JP2017154776 A JP 2017154776A JP 2017154776 A JP2017154776 A JP 2017154776A JP 6994868 B2 JP6994868 B2 JP 6994868B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- blocks
- parameter
- identification information
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3068—Precoding preceding compression, e.g. Burrows-Wheeler transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4006—Conversion to or from arithmetic code
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4006—Conversion to or from arithmetic code
- H03M7/4012—Binary arithmetic codes
- H03M7/4018—Context adapative binary arithmetic codes [CABAC]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6035—Handling of unkown probabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Description
[符号化装置の概要]
まず、実施の形態1に係る符号化装置の概要を説明する。図1は、実施の形態1に係る符号化装置100の機能構成を示すブロック図である。符号化装置100は、動画像/画像をブロック単位で符号化する動画像/画像符号化装置である。
分割部102は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部104に出力する。例えば、分割部102は、まず、ピクチャを固定サイズ(例えば128x128)のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット(CTU)と呼ばれることがある。そして、分割部102は、再帰的な四分木(quadtree)及び/又は二分木(binary tree)ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ(例えば64x64以下)のブロックに分割する。この可変サイズのブロックは、符号化ユニット(CU)、予測ユニット(PU)あるいは変換ユニット(TU)と呼ばれることがある。なお、本実施の形態では、CU、PU及びTUは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがCU、PU、TUの処理単位となってもよい。
減算部104は、分割部102によって分割されたブロック単位で原信号(原サンプル)から予測信号(予測サンプル)を減算する。つまり、減算部104は、符号化対象ブロック(以下、カレントブロックという)の予測誤差(残差ともいう)を算出する。そして、減算部104は、算出された予測誤差を変換部106に出力する。
変換部106は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部108に出力する。具体的には、変換部106は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換(DCT)又は離散サイン変換(DST)を行う。
量子化部108は、変換部106から出力された変換係数を量子化する。具体的には、量子化部108は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ(QP)に基づいて当該変換係数を量子化する。そして、量子化部108は、カレントブロックの量子化された変換係数(以下、量子化係数という)をエントロピー符号化部110及び逆量子化部112に出力する。
エントロピー符号化部110は、量子化部108から入力である量子化係数を可変長符号化することにより符号化信号(符号化ビットストリーム)を生成する。具体的には、エントロピー符号化部110は、例えば、量子化係数を二値化し、二値信号を算術符号化する。
逆量子化部112は、量子化部108からの入力である量子化係数を逆量子化する。具体的には、逆量子化部112は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部112は、カレントブロックの逆量子化された変換係数を逆変換部114に出力する。
逆変換部114は、逆量子化部112からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部114は、変換係数に対して、変換部106による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部114は、復元された予測誤差を加算部116に出力する。
加算部116は、逆変換部114からの入力である予測誤差と予測制御部128からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部116は、再構成されたブロックをブロックメモリ118及びループフィルタ部120に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。
ブロックメモリ118は、イントラ予測で参照されるブロックであって符号化対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ118は、加算部116から出力された再構成ブロックを格納する。
ループフィルタ部120は、加算部116によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ122に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ(インループフィルタ)であり、例えば、デブロッキング・フィルタ(DF)、サンプルアダプティブオフセット(SAO)及びアダプティブループフィルタ(ALF)などを含む。
フレームメモリ122は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ122は、ループフィルタ部120によってフィルタされた再構成ブロックを格納する。
イントラ予測部124は、ブロックメモリ118に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測(画面内予測ともいう)を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部124は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部128に出力する。
インター予測部126は、フレームメモリ122に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測(画面間予測ともいう)を行うことで、予測信号(インター予測信号)を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部126は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索(motion estimation)を行う。そして、インター予測部126は、動き探索により得られた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部126は、生成されたインター予測信号を予測制御部128に出力する。
予測制御部128は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部104及び加算部116に出力する。
次に、上記の符号化装置100から出力された符号化信号(符号化ビットストリーム)を復号可能な復号装置の概要について説明する。図10は、実施の形態1に係る復号装置200の機能構成を示すブロック図である。復号装置200は、動画像/画像をブロック単位で復号する動画像/画像復号装置である。
エントロピー復号部202は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部202は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部202は、二値信号を多値化(debinarize)する。これにより、エントロピー復号部202は、ブロック単位で量子化係数を逆量子化部204に出力する。
逆量子化部204は、エントロピー復号部202からの入力である復号対象ブロック(以下、カレントブロックという)の量子化係数を逆量子化する。具体的には、逆量子化部204は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部204は、カレントブロックの逆量子化された量子化係数(つまり変換係数)を逆変換部206に出力する。
逆変換部206は、逆量子化部204からの入力である変換係数を逆変換することにより予測誤差を復元する。
加算部208は、逆変換部206からの入力である予測誤差と予測制御部220からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部208は、再構成されたブロックをブロックメモリ210及びループフィルタ部212に出力する。
ブロックメモリ210は、イントラ予測で参照されるブロックであって復号対象ピクチャ(以下、カレントピクチャという)内のブロックを格納するための記憶部である。具体的には、ブロックメモリ210は、加算部208から出力された再構成ブロックを格納する。
ループフィルタ部212は、加算部208によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ214及び表示装置等に出力する。
フレームメモリ214は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ214は、ループフィルタ部212によってフィルタされた再構成ブロックを格納する。
イントラ予測部216は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ210に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号(イントラ予測信号)を生成する。具体的には、イントラ予測部216は、カレントブロックに隣接するブロックのサンプル(例えば輝度値、色差値)を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部220に出力する。
インター予測部218は、フレームメモリ214に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック(例えば4x4ブロック)の単位で行われる。例えば、インター予測部218は、符号化ビットストリームから読み解かれた動き情報(例えば動きベクトル)を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部220に出力する。
予測制御部220は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部208に出力する。
次に、以上のように構成された符号化装置100及び復号装置200において行われる一部の処理について図面を参照しながら具体的に説明する。なお、本開示の利益をさらに拡大するために、後述の各実施の形態を組み合わせてもよいことは、当業者には明らかであろう。
画像の圧縮符号化技術では、入力画像に含まれるピクチャ(フレームとも言う)を一旦矩形領域のブロックに分割し、ブロック毎にそのピクチャを符号化することが一般的に行われる。各ブロックは、イントラ予測またはインター予測によって符号化される。イントラ予測は、符号化または復号済みの周辺ブロックの画素値を利用してブロックを予測する予測方法であり、インター予測は、符号化または復号済みのピクチャを用いてブロックを予測する予測方法である。さらに、圧縮符号化技術では、量子化パラメータなどの様々なパラメータを使って各ピクチャをブロックごとに符号化する。これらのパラメータを適切に選択することによって、符号量を抑えることができる、あるいは、画質を改善するなどの効果を得ることができる。
本実施の形態における符号化装置100は、処理回路と、その処理回路に接続されたメモリとを備える。メモリは、例えば図1に示すブロックメモリ118およびフレームメモリ122である。また、処理回路は、図1に示す各構成要素のうちのメモリ以外の少なくとも1つの構成要素からなる。例えば、処理回路は、プロセッサ、CPU(Central processing unit)、または集積回路などからなる。
最初に、segment_idと、そのsegment_idに対応する各パラメータの定義について説明する。segment_idに対応する各パラメータの定義において、ブロックの大きさとは無関係に各パラメータを定義してもよい。しかし、ブロックのサイズによって最適なパラメータが異なる場合が多い。したがって、本実施の形態では、分割された後のブロックのサイズを表すサイズ識別情報であるdepthと、segment_idとの組み合わせに対して、各パラメータを定義する。本実施の形態では、例えば、各組み合わせに対する各パラメータの定義付けは、符号化装置100の分割部102によって行われる。また、このような定義付けは、例えばピクチャ、あるいはそれより大きい画像単位、例えばシーケンスまたはビデオレイヤごとに行われる。つまり、ピクチャ、シーケンスあるいはビデオレイヤにおける、ヘッダあるいはパラメータセットの中で、その組み合わせに対応する各パラメータが定義される。例えば、各パラメータは、ピクチャパラメータセットにおいて定義される。
次に、ピクチャ内の各ブロックの分割と、分割されたブロックにsegment_idを割り当てる方法とについて説明する。
次に、depthおよびsegment_idの組み合わせにより定義される各パラメータ以外の、各ブロックに関係するパラメータの符号化について説明する。符号化装置100は、例えば、実施の形態1に示す符号化技術、または通常の画像圧縮技術に準じて各ブロックを符号化する。したがって、ここでは圧縮に使われる各技術の詳細説明については省略し、パラメータの符号化について詳細に説明する。
各ブロックの特性に適した確率情報を使うことで符号化効率の向上が期待できる。以下、どのようにして確率情報を定義するかについて説明する。第1の方法として、予め定められた確率情報の初期値を持つ方法がある。例えば、HEVC規格においては、I、P、およびBピクチャの夫々に対して初期値が予め定義されている。第2の方法として、本実施の形態のように、ピクチャまたはピクチャよりも上位レイヤにおける、ヘッダまたはパラメータセットの中で、適当な値を定義する方法がある。この場合には適切な確率情報を定義することができる。
図19は、本実施の形態における符号化装置100の全体的な処理動作を示すフローチャートである。
本発明の一態様に係る符号化装置は、処理回路と、前記処理回路に接続されたメモリとを備え、前記処理回路は、前記メモリを用いて、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも1つのパラメータを定義付け、
画像を複数のブロックに分割し、前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、前記複数のブロックのそれぞれを符号化し、前記複数のブロックの符号化では、前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、特定された前記セグメント識別情報に対して定義付けられている前記少なくとも1つのパラメータを用いて前記符号化対象ブロックを符号化し、前記少なくとも1つのパラメータは、CABAC(Context-Based Adaptive Binary Arithmetic Coding)のコンテキストに対応する確率情報を特定するためのパラメータを含む。セグメント識別情報は、例えば上述のsegment_idであり、確率情報を特定するためのパラメータは、例えば上述のseg_context_idxである。
以上の各実施の形態において、機能ブロックの各々は、通常、MPU及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ROM等の記録媒体に記録されたソフトウェア(プログラム)を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア(専用回路)によって実現することも、当然、可能である。
図21は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
また、ストリーミングサーバex103は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバex103は、CDN(Contents Delivery Network)により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。CDNでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。
近年では、互いにほぼ同期した複数のカメラex113及び/又はスマートフォンex115などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。
コンテンツの切り替えに関して、図22に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的/空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンex115で視聴していた映像の続きを、帰宅後にインターネットTV等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。
図24は、コンピュータex111等におけるwebページの表示画面例を示す図である。図25は、スマートフォンex115等におけるwebページの表示画面例を示す図である。図24及び図25に示すようにwebページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置(復号装置)は、リンク画像として各コンテンツが有する静止画又はIピクチャを表示したり、複数の静止画又はIピクチャ等でgifアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。
また、車の自動走行又は走行支援のため2次元又は3次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、1以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。
また、コンテンツ供給システムex100では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。
また、これらの符号化又は復号処理は、一般的に各端末が有するLSIex500において処理される。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD-ROM、フレキシブルディスク、又はハードディスクなど)に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンex115がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンex115が有するLSIex500で符号化処理されたデータである。
図26は、スマートフォンex115を示す図である。また、図27は、スマートフォンex115の構成例を示す図である。スマートフォンex115は、基地局ex110との間で電波を送受信するためのアンテナex450と、映像及び静止画を撮ることが可能なカメラ部ex465と、カメラ部ex465で撮像した映像、及びアンテナex450で受信した映像等が復号されたデータを表示する表示部ex458とを備える。スマートフォンex115は、さらに、タッチパネル等である操作部ex466と、音声又は音響を出力するためのスピーカ等である音声出力部ex457と、音声を入力するためのマイク等である音声入力部ex456と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ex467と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのSIMex468とのインタフェース部であるスロット部ex464とを備える。なお、メモリ部ex467の代わりに外付けメモリが用いられてもよい。
102 分割部
104 減算部
106 変換部
108 量子化部
110 エントロピー符号化部
112 逆量子化部
114 逆変換部
116 加算部
118 ブロックメモリ
120 ループフィルタ部
122 フレームメモリ
124 イントラ予測部
126 インター予測部
128 予測制御部
200 復号装置
202 エントロピー復号部
204 逆量子化部
206 逆変換部
208 加算部
210 ブロックメモリ
212 ループフィルタ部
214 フレームメモリ
216 イントラ予測部
218 インター予測部
220 予測制御部
Claims (8)
- 処理回路と、前記処理回路に接続されたメモリとを備え、
前記処理回路は、前記メモリを用いて、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも1つのパラメータを定義付け、
画像を複数のブロックに分割し、
前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、
前記複数のブロックのそれぞれを符号化し、
前記少なくとも1つのパラメータの定義付けでは、
前記複数種のセグメント識別情報のうちの何れか1つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか1つとの組み合わせに対して、前記少なくとも1つのパラメータを定義付け、
前記複数のブロックの符号化では、
前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、
前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも1つのパラメータを用いて前記符号化対象ブロックを符号化し、
前記少なくとも1つのパラメータは、CABAC(Context-Based Adaptive Binary Arithmetic Coding)のコンテキストに対応する確率情報を特定するためのパラメータを含む
符号化装置。 - 前記処理回路は、さらに、
前記画像における分割のパターンを示すブロック分割情報を符号化する
請求項1に記載の符号化装置。 - 前記処理回路は、さらに、
前記複数種のセグメント識別情報のそれぞれに対して定義付けられた前記少なくとも1つのパラメータを、ピクチャパラメータセットに含め、
前記画像の分割では、前記画像であるピクチャを分割する、
請求項1または2に記載の符号化装置。 - 処理回路と、前記処理回路に接続されたメモリとを備え、
前記処理回路は、前記メモリを用いて、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも1つのパラメータを復号し、
画像に含まれている複数のブロックを特定し、
前記複数のブロックのそれぞれに対して割り当てられているセグメント識別情報を復号し、
前記複数のブロックのそれぞれを復号し、
前記少なくとも1つのパラメータの復号では、
前記複数種のセグメント識別情報のうちの何れか1つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか1つとの組み合わせに対して定義付けられている、前記少なくとも1つのパラメータを特定し、
前記複数のブロックの復号では、
前記複数のブロックのうちの復号対象ブロックに割り当てられているセグメント識別情報を特定し、
前記復号対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも1つのパラメータを用いて前記復号対象ブロックを復号し、
前記少なくとも1つのパラメータは、CABAC(Context-Based Adaptive Binary Arithmetic Coding)のコンテキストに対応する確率情報を特定するためのパラメータを含む
復号装置。 - 前記処理回路は、前記複数のブロックの特定では、
前記画像における分割のパターンを示すブロック分割情報を復号し、
前記ブロック分割情報に基づいて、前記画像に含まれている複数のブロックを特定する
請求項4に記載の復号装置。 - 前記処理回路は、
前記少なくとも1つのパラメータの復号では、
前記複数種のセグメント識別情報のそれぞれに対して定義付けられている前記少なくとも1つのパラメータを、ピクチャパラメータセットから抽出して復号し、
前記複数のブロックの特定では、
前記画像であるピクチャに含まれている前記複数のブロックを特定する
請求項4または5に記載の復号装置。 - 画像を符号化する符号化方法であって、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも1つのパラメータを定義付け、
画像を複数のブロックに分割し、
前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、
前記複数のブロックのそれぞれを符号化し、
前記少なくとも1つのパラメータの定義付けでは、
前記複数種のセグメント識別情報のうちの何れか1つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか1つとの組み合わせに対して、前記少なくとも1つのパラメータを定義付け、
前記複数のブロックの符号化では、
前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、
前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも1つのパラメータを用いて前記符号化対象ブロックを符号化し、
前記少なくとも1つのパラメータは、CABAC(Context-Based Adaptive Binary Arithmetic Coding)のコンテキストに対応する確率情報を特定するためのパラメータを含
む
符号化方法。 - 符号化された画像を復号する復号方法であって、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも1つのパラメータを復号し、
画像に含まれている複数のブロックを特定し、
前記複数のブロックのそれぞれに対して割り当てられているセグメント識別情報を復号し、
前記複数のブロックのそれぞれを復号し、
前記少なくとも1つのパラメータの復号では、
前記複数種のセグメント識別情報のうちの何れか1つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか1つとの組み合わせに対して定義付けられている、前記少なくとも1つのパラメータを特定し、
前記複数のブロックの復号では、
前記複数のブロックのうちの復号対象ブロックに割り当てられているセグメント識別情報を特定し、
前記復号対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも1つのパラメータを用いて前記復号対象ブロックを復号し、
前記少なくとも1つのパラメータは、CABAC(Context-Based Adaptive Binary Arithmetic Coding)のコンテキストに対応する確率情報を特定するためのパラメータを含
む
復号方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154776A JP6994868B2 (ja) | 2017-08-09 | 2017-08-09 | 符号化装置、復号装置、符号化方法、および復号方法 |
US16/055,764 US10237558B2 (en) | 2017-08-09 | 2018-08-06 | Encoder, decoder, encoding method, and decoding method |
US16/256,307 US10652544B2 (en) | 2017-08-09 | 2019-01-24 | Encoder, decoder, encoding method, and decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154776A JP6994868B2 (ja) | 2017-08-09 | 2017-08-09 | 符号化装置、復号装置、符号化方法、および復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019033456A JP2019033456A (ja) | 2019-02-28 |
JP6994868B2 true JP6994868B2 (ja) | 2022-01-14 |
Family
ID=65274381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154776A Active JP6994868B2 (ja) | 2017-08-09 | 2017-08-09 | 符号化装置、復号装置、符号化方法、および復号方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US10237558B2 (ja) |
JP (1) | JP6994868B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112019004277T5 (de) * | 2018-08-28 | 2021-06-02 | Sony Corporation | Codiervorrichtung, Codierverfahren, Decodiervorrichtung, Decodierverfahren, und Programm |
KR20210089133A (ko) | 2018-11-06 | 2021-07-15 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 인트라 예측에 대한 단순화된 파라미터 유도 |
KR102622950B1 (ko) * | 2018-11-12 | 2024-01-10 | 삼성전자주식회사 | 디스플레이장치, 그 제어방법 및 기록매체 |
WO2020108591A1 (en) | 2018-12-01 | 2020-06-04 | Beijing Bytedance Network Technology Co., Ltd. | Parameter derivation for intra prediction |
CA3121671A1 (en) | 2018-12-07 | 2020-06-11 | Beijing Bytedance Network Technology Co., Ltd. | Context-based intra prediction |
JP2022521698A (ja) * | 2019-02-22 | 2022-04-12 | 北京字節跳動網絡技術有限公司 | イントラ予測のための隣接サンプル選択 |
CA3128769C (en) | 2019-02-24 | 2023-01-24 | Beijing Bytedance Network Technology Co., Ltd. | Parameter derivation for intra prediction |
WO2020192642A1 (en) | 2019-03-24 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Conditions in parameter derivation for intra prediction |
US11197009B2 (en) * | 2019-05-30 | 2021-12-07 | Hulu, LLC | Processing sub-partitions in parallel using reference pixels |
US11202070B2 (en) * | 2019-05-30 | 2021-12-14 | Hulu, LLC | Parallel bi-directional intra-coding of sub-partitions |
US11134275B2 (en) * | 2019-06-04 | 2021-09-28 | Tencent America LLC | Method and apparatus for performing primary transform based on filtering of blocks |
US11202054B2 (en) * | 2019-07-05 | 2021-12-14 | Tencent America LLC | Method and apparatus for inter-channel prediction and transform for point-cloud attribute coding |
CN110648342B (zh) * | 2019-09-30 | 2022-07-01 | 福州大学 | 基于nsst显著性检测及图割的泡沫红外图像分割方法 |
CN111314687B (zh) * | 2019-11-28 | 2021-06-25 | 歌尔光学科技有限公司 | 一种vr影像处理方法、装置、vr眼镜及可读存储介质 |
JPWO2021193649A1 (ja) * | 2020-03-25 | 2021-09-30 | ||
CN111583285B (zh) * | 2020-05-12 | 2023-08-04 | 武汉科技大学 | 一种基于边缘关注策略的肝脏影像语义分割方法 |
JP2024515174A (ja) * | 2021-04-15 | 2024-04-05 | エルジー エレクトロニクス インコーポレイティド | ポイントクラウドデータ送信方法、ポイントクラウドデータ送信装置、ポイントクラウドデータ受信方法及びポイントクラウドデータ受信装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014017868A (ja) | 2008-09-11 | 2014-01-30 | Google Inc | 適応セグメンテーションを用いた動画符号化システムおよび方法 |
JP2016146556A (ja) | 2015-02-06 | 2016-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2972588A1 (fr) * | 2011-03-07 | 2012-09-14 | France Telecom | Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants |
US9300964B2 (en) * | 2013-01-24 | 2016-03-29 | Sharp Kabushiki Kaisha | Image decoding apparatus and image coding apparatus |
US10200711B2 (en) * | 2015-03-27 | 2019-02-05 | Qualcomm Incorporated | Motion vector derivation in video coding |
-
2017
- 2017-08-09 JP JP2017154776A patent/JP6994868B2/ja active Active
-
2018
- 2018-08-06 US US16/055,764 patent/US10237558B2/en active Active
-
2019
- 2019-01-24 US US16/256,307 patent/US10652544B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014017868A (ja) | 2008-09-11 | 2014-01-30 | Google Inc | 適応セグメンテーションを用いた動画符号化システムおよび方法 |
JP2016146556A (ja) | 2015-02-06 | 2016-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 |
Non-Patent Citations (2)
Title |
---|
Adrian Grange, et al.,VP9 Bitstream & Decoding Process Specification,Version 0.6,2016年03月31日,pp.27-29, 33, 42-43, 67-68 |
Advanced video coding for generic audiovisual services,Recommendation ITU-T H.264,(04/2013),2013年04月,pp.49-50, 89 |
Also Published As
Publication number | Publication date |
---|---|
US10652544B2 (en) | 2020-05-12 |
US20190052883A1 (en) | 2019-02-14 |
JP2019033456A (ja) | 2019-02-28 |
US20190158839A1 (en) | 2019-05-23 |
US10237558B2 (en) | 2019-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6994868B2 (ja) | 符号化装置、復号装置、符号化方法、および復号方法 | |
JP7199221B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7014881B2 (ja) | 符号化装置及び符号化方法 | |
JP7339890B2 (ja) | 符号化装置及び復号装置 | |
JP7087030B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JPWO2018030292A1 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2022008413A (ja) | 復号装置、符号化装置及び記録媒体 | |
JP6998874B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP7001822B2 (ja) | 復号装置及び復号方法 | |
JP7161636B2 (ja) | 符号化装置及び符号化方法 | |
JP7314382B2 (ja) | 復号装置 | |
JP7017580B2 (ja) | 復号装置、画像復号装置及び復号方法 | |
JP2023096081A (ja) | 符号化装置、復号装置、符号化方法および復号方法 | |
JP2022093625A (ja) | 符号化装置、復号装置、符号化方法、及び復号方法 | |
JP2023060057A (ja) | 符号化装置及び符号化方法 | |
JP2023040271A (ja) | 復号装置、及び、復号方法 | |
JP2021114789A (ja) | 符号化装置、復号装置及び記憶媒体 | |
JP2023001298A (ja) | 復号装置及び復号方法 | |
JP2022171983A (ja) | 符号化方法及び復号方法 | |
JP2022168052A (ja) | 復号装置及び符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6994868 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |