JP6952513B2 - Mode information encoder, mode information decoder, and program - Google Patents
Mode information encoder, mode information decoder, and program Download PDFInfo
- Publication number
- JP6952513B2 JP6952513B2 JP2017126358A JP2017126358A JP6952513B2 JP 6952513 B2 JP6952513 B2 JP 6952513B2 JP 2017126358 A JP2017126358 A JP 2017126358A JP 2017126358 A JP2017126358 A JP 2017126358A JP 6952513 B2 JP6952513 B2 JP 6952513B2
- Authority
- JP
- Japan
- Prior art keywords
- mode information
- value
- frequency
- mode
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000000034 method Methods 0.000 description 32
- 230000002776 aggregation Effects 0.000 description 22
- 238000004220 aggregation Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000009826 distribution Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、モード情報符号化装置、モード情報復号装置、およびプログラムに関する。 The present invention relates to a mode information encoding device, a mode information decoding device, and a program.
画像符号化や映像符号化のイントラスライスの処理においては、画面内のすでに符号化済み領域内の情報に基づき、これから符号化すべき対象領域の画素値列を予測する。そして、予測によって得られた対象領域の画素値列と、対象領域の実際の画素値列との差分をとって、エントロピー符号化する。これにより、前記差分が統計的に0付近の値に偏在する傾向を活用して符号化効率の向上を実現している。 In the intra-slice processing of image coding and video coding, the pixel value sequence of the target area to be encoded is predicted based on the information in the already coded area in the screen. Then, the difference between the pixel value sequence of the target region obtained by the prediction and the actual pixel value sequence of the target region is taken and entropy-coded. As a result, the coding efficiency is improved by utilizing the tendency that the difference is statistically unevenly distributed to the value near 0.
例えば、MPEG-H HEVC/H.265(以下、「HEVC」と呼ぶ)においては、方向予測モード(33種類)と、DC予測と、平面予測の計35種類の画面内予測モードが利用可能である。このうち、方向予測モードでは、符号化対象ブロック近傍の参照画素値列を所定方向へ外挿することにより予測ブロックを得る。また、DC予測では、予測ブロック内の全画素を参照画素値列の平均値とする。また、平面予測では、参照画素値列に近似的な双一次補間を適用することで予測ブロックを得る。 For example, in MPEG-H HEVC / H.265 (hereinafter referred to as "HEVC"), a total of 35 types of in-screen prediction modes are available: direction prediction mode (33 types), DC prediction, and plane prediction. be. Of these, in the direction prediction mode, the prediction block is obtained by extrapolating the reference pixel value sequence in the vicinity of the coded block in the predetermined direction. Further, in the DC prediction, all the pixels in the prediction block are set as the average value of the reference pixel value sequence. Further, in the plane prediction, a prediction block is obtained by applying approximate bilinear interpolation to the reference pixel value sequence.
HEVCにおいて、画面内予測はTU(Transform Unit,トランスフォームユニット)と称するブロック単位で実行される。このとき、あるTUにおいて適用した画面内予測モードの情報を、符号化器側から復号器側へ通知する必要がある。HEVCにおいては、注目するTU(以下、「対象TU」と呼ぶ)の左に隣接するTU(左に隣接するTUが複数ある場合には、それらのうち最も上のTU)、および対象TUの上に隣接するTU(上に隣接するTUが複数ある場合には、そのうち最も左のTU)の画面内予測モード番号に応じて対象TUの画面内予測モード番号を符号化する。これにより、画面内予測モードの空間的相関を利用して、伝達する画面内予測モードのエントロピー削減を図っている。 In HEVC, in-screen prediction is executed in block units called TU (Transform Unit). At this time, it is necessary to notify the in-screen prediction mode information applied in a certain TU from the encoder side to the decoder side. In HEVC, the TU adjacent to the left of the TU of interest (hereinafter referred to as "target TU") (if there are multiple TUs adjacent to the left, the top TU among them), and above the target TU. The in-screen prediction mode number of the target TU is encoded according to the in-screen prediction mode number of the TU adjacent to (if there are a plurality of TUs adjacent to the top, the leftmost TU). As a result, the entropy of the transmitted in-screen prediction mode is reduced by utilizing the spatial correlation of the in-screen prediction mode.
また、特許文献1には、対象TUに隣接するTUの画素値のパターンに応じて、対象TUの画面内予測モード(方向予測の方向)を予測する手法が開示されている。
Further,
HEVCにおける画面内予測モードの符号化法では、対象TUの画面内予測モードが、隣接TUの画面内予測モードと一致する可能性が高いという傾向を利用する。このとき、左または上に隣接するTUの画面内予測モードを既定の場合分けルールに当てはめ、対象TUの画面内予測モードに対する3つの候補を画一的に定める。そして、これら3候補内に対象TUの実際の画面内予測モードが含まれればそれら3候補のうち一を特定するインデックスを通知し、含まれなければ当該3候補を除いて数えたときの画面内予測モード番号を通知するよう動作する。 The in-screen prediction mode coding method in HEVC utilizes the tendency that the in-screen prediction mode of the target TU is likely to match the in-screen prediction mode of the adjacent TU. At this time, the in-screen prediction mode of the TU adjacent to the left or above is applied to the default case classification rule, and three candidates for the in-screen prediction mode of the target TU are uniformly determined. Then, if the actual in-screen prediction mode of the target TU is included in these three candidates, the index that identifies one of the three candidates is notified, and if it is not included, the in-screen screen when counting excluding the three candidates. It works to notify the prediction mode number.
例えば、左隣接ブロックが画面内予測モード16(左斜め上、勾配21/32(約33.3度)の方向を参照する方向予測)であり、上隣接ブロックが画面内予測モード18(左斜め上、勾配32/32(45.0度)方向を参照する方向予測)であった場合、HEVCでは、モード16、モード18、およびモード0(平面予測)が前記3候補として設定される。しかしながら、この場合、モード16とモード18の中間の方向を参照するモード17(左斜め上、勾配26/32(約39.1度)の方向を参照する方向予測)が出現する確率も高いと考えられるにもかかわらず、モード17は上記の3候補には含まれない。つまり、モード情報の通知のしかたが非効率となる可能性がある。
For example, the left adjacent block is the in-screen prediction mode 16 (direction prediction referring to the direction of the
また、HEVCにおいては、対象TUの画面内予測モードが前記3候補に含まれれば大幅なビット数削減が期待できる。その反面、3候補から漏れたものについては相対的にビット数が増え、損を余儀なくされる。 Further, in HEVC, if the in-screen prediction mode of the target TU is included in the above three candidates, a significant reduction in the number of bits can be expected. On the other hand, the number of bits for those leaked from the three candidates increases relatively, and a loss is unavoidable.
特許文献1の手法では、隣接TUの画素値パターンの空間周波数に応じて対象TUのイントラ予測モードの候補を決定する。この手法では規則的なパターンを有する画像領域に対しては適切なイントラ予測モード候補を提示することができる。しかしながら、画像パターンの規則性が乏しい場合や画像パターンが平坦な場合には、たとえイントラ予測モードがブロック間で統計的な相関性が強い場合であっても、その相関性を考慮した情報量削減には寄与しないという問題もある。
In the method of
また、HEVCおよび特許文献1のいずれの手法においても、対象TUのイントラ予測モード候補を絞り込む手法は画一的である。つまり、符号化対象の映像に応じてモード候補を変えることは行われていない。つまり、時々刻々の映像の特性に合わせたモード候補の生成を行っていないことにより、未だモード情報の符号化における効率改善の余地がある。
Further, in both the methods of HEVC and
本発明は、上記のような事情を考慮して為されたものであり、画像・映像を符号化する際の符号化対象ブロックのモード情報を、効率よく符号化し、そして復号するためのモード情報符号化装置、モード情報復号装置、およびプログラムを提供しようとするものである。 The present invention has been made in consideration of the above circumstances, and mode information for efficiently encoding and decoding the mode information of the coded target block when encoding an image / video. It is intended to provide a coding device, a mode information decoding device, and a program.
[1]上記の課題を解決するため、本発明の一態様によるモード情報符号化装置は、符号化済みの領域である既符号化領域内の学習用対象領域のモード情報と、前記既符号化領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報を生成する頻度情報生成部と、符号化対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、前記対象領域のモード情報を、前記順序化部が求めた順序の少なくとも一部に基づく符号として符号化する符号化部と、を具備することを特徴とする。 [1] In order to solve the above problem, the mode information coding apparatus according to one aspect of the present invention includes the mode information of the learning target area in the coded area, which is the coded area, and the coded area. A frequency information generator that generates frequency information indicating the frequency of appearance of a set with the mode information of the learning reference area corresponding to the learning target area in the area, and a reference corresponding to the target area that is the coding target area. The ordering unit obtains an ordering unit for ordering the mode information of the target area and the mode information of the target area based on at least a part of the appearance frequency held by the frequency information regarding the mode information of the area. It is characterized by comprising a coding unit for coding as a code based on at least a part of the order.
[2]また、本発明の一態様は、上記のモード情報符号化装置において、前記順序化部は、前記参照領域のモード情報に関して前記頻度情報が保持する出現頻度のすべてを順序付けることによって、前記対象領域のモード情報を順序化し、前記符号化部は、前記対象領域のモード情報を、前記順序化部が求めた順序のすべてに基づく符号として符号化する、ことを特徴とする。 [2] Further, in one aspect of the present invention, in the mode information coding apparatus, the ordering unit orders all the appearance frequencies held by the frequency information with respect to the mode information of the reference region. The mode information of the target area is ordered, and the coding unit encodes the mode information of the target area as a code based on all the orders obtained by the ordering unit.
[3]また、本発明の一態様によるモード情報復号装置は、復号済みの領域である既復号領域内の学習用対象領域のモード情報と、前記既復号領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報を生成する頻度情報生成部と、復号対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、入力された符号値に対応する順序を基に、順序化された前記対象領域のモード情報から選ばれる特定のモード情報を復号する復号部と、を具備することを特徴とする。 [3] Further, the mode information decoding device according to one aspect of the present invention corresponds to the mode information of the learning target area in the already decoded area, which is the decoded area, and the learning target area in the already decoded area. The frequency information holds the frequency information generation unit that generates frequency information indicating the frequency of appearance of a set with the mode information of the learning reference area to be used, and the mode information of the reference area corresponding to the target area that is the decoding target area. Select from the ordering unit that orders the mode information of the target area based on at least a part of the appearance frequency, and the mode information of the target area that is ordered based on the order corresponding to the input code value. It is characterized by including a decoding unit that decodes specific mode information.
[4]また、本発明の一態様は、上記のモード情報復号装置において、前記順序化部は、前記参照領域のモード情報に関して前記頻度情報が保持する出現頻度のすべてを順序付けることによって、前記対象領域のモード情報を順序化する、ことを特徴とする。 [4] Further, in one aspect of the present invention, in the mode information decoding apparatus, the ordering unit orders all the appearance frequencies held by the frequency information with respect to the mode information of the reference region. It is characterized in that the mode information of the target area is ordered.
[5]また、本発明の一態様は、コンピューターを、符号化済みの領域である既符号化領域内の学習用対象領域のモード情報と、前記既符号化領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報を生成する頻度情報生成部と、符号化対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、前記対象領域のモード情報を、前記順序化部が求めた順序に基づく符号として符号化する符号化部と、を具備するモード情報符号化装置として機能させるためのプログラムである。 [5] Further, in one aspect of the present invention, the computer is divided into the mode information of the learning target area in the coded area, which is the coded area, and the learning target area in the coded area. The frequency information is related to the frequency information generation unit that generates frequency information indicating the frequency of appearance of the pair with the mode information of the corresponding learning reference area, and the mode information of the reference area corresponding to the target area that is the area to be encoded. An ordering unit that orders the mode information of the target area based on at least a part of the frequency of occurrence to be held, and the mode information of the target area are encoded as codes based on the order obtained by the ordering unit. It is a program for functioning as a mode information coding device including a coding unit.
[6]また、本発明の一態様は、コンピューターを、復号済みの領域である既復号領域内の学習用対象領域のモード情報と、前記既復号領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報を生成する頻度情報生成部と、復号対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、入力された符号値に対応する順序を基に、順序化された前記対象領域のモード情報から選ばれる特定のモード情報を復号する復号部と、を具備するモード情報復号装置として機能させるためのプログラムである。 [6] Further, in one aspect of the present invention, the computer is subjected to learning corresponding to the mode information of the learning target area in the already decoded area, which is the decoded area, and the learning target area in the already decoded area. Frequency information generation unit that generates frequency information indicating the frequency of appearance of a set with the mode information of the reference area, and the appearance frequency held by the frequency information regarding the mode information of the reference area corresponding to the target area that is the decoding target area. An ordering unit that orders the mode information of the target area based on at least a part of the above, and a specification selected from the mode information of the target area that is ordered based on the order corresponding to the input code value. It is a program for functioning as a mode information decoding device including a decoding unit for decoding the mode information of the above.
本発明によれば、モード情報符号化装置は、モード情報の符号化効率を向上させることができる。また、モード情報復号装置は、モード情報符号化装置によって符号化されたモード情報を復号することができる。また、モード情報復号装置は、頻度情報(ヒストグラムデータ)を外部から(例えば、モード情報符号化装置から)受け取ることなく復号を行えるため、符号化効率を低下させる要因となる情報伝達のオーバヘッドが生じない。 According to the present invention, the mode information coding apparatus can improve the coding efficiency of mode information. Further, the mode information decoding device can decode the mode information encoded by the mode information coding device. Further, since the mode information decoding device can perform decoding without receiving frequency information (histogram data) from the outside (for example, from the mode information coding device), an overhead of information transmission that causes a decrease in coding efficiency occurs. No.
[実施形態]
次に、本発明の実施形態について、図面を参照しながら説明する。
図1は、本実施形態によるモード情報符号化装置およびモード情報復号装置の概略機能構成を説明するためのブロック図である。また、図1は、本実施形態によるモード情報符号化装置およびモード情報復号装置が扱う情報(符号化ブロックのモード情報)をも示す。
[Embodiment]
Next, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram for explaining a schematic functional configuration of a mode information coding device and a mode information decoding device according to the present embodiment. In addition, FIG. 1 also shows information (mode information of the coding block) handled by the mode information coding device and the mode information decoding device according to the present embodiment.
モード情報符号化装置1は、対象ブロック近傍の1個以上の参照ブロックのモード値を参照しながら、対象ブロックのモード値を符号化する。本実施形態によるモード情報符号化装置1は、対象ブロックを符号化する時点より前に既に符号化されたモード情報に基づいて、参照ブロックのモード値と対象ブロックのモード値の間の関連性を学習する。対象ブロックを符号化する時点より前に既に符号化されたモード情報とは、例えば、符号化順序における前フレーム以前のフレームに含まれるブロックのモード情報である。あるいは、対象ブロックと同じフレームに含まれ、既に符号化されているブロック(通常は、対象ブロックよりも上に存在するか、対象ブロックと同じ行の対象ブロックより左にあるブロック)のモード情報である。モード情報符号化装置1は、このような学習に基づきシーンに適応したモード値の変換を実現する点において、HEVCとは性質を異にする符号化を行う。
The mode
図1に示すように、モード情報符号化装置1は、ヒストグラム集計部10(頻度情報生成部)、ソート部11(順序化部)と、符号化部12とを含んで構成される。
ヒストグラム集計部10は、符号化済みの領域である既符号化領域内の学習用対象領域のモード情報と、前記既符号化領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報(ヒストグラムデータ)を集計し、生成する。
ソート部11は、符号化対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報(ヒストグラムデータ)が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する。また、本実施形態によるソート部11は、前記参照領域のモード情報に関して前記頻度情報が保持する出現頻度のすべてをソート処理によって順序付けることによって、前記対象領域のモード情報を順序化する。
符号化部12は、前記対象領域のモード情報を、ソート部11が求めた順序の少なくとも一部に基づく符号として符号化する。また、本実施形態による符号化部12は、前記対象領域のモード情報を、ソート部11が求めた順序のすべてに基づく符号として符号化する。
As shown in FIG. 1, the mode
The
The
The
また、エントロピー符号化部2は、モード情報符号化装置1が出力するモード情報の符号値を、エントロピー符号化する。
また、エントロピー復号部3は、エントロピー符号化部2によって符号化された符号を、モード情報符号化装置1が出力した符号に復号する。
Further, the
Further, the
また、モード情報復号装置4は、ヒストグラム集計部40(頻度情報生成部)と、ソート部41(順序化部)と、復号部42とを含んで構成される。
ヒストグラム集計部40は、復号済みの領域である既復号領域内の学習用対象領域のモード情報と、前記既復号領域内の前記学習用対象領域に対応する学習用参照領域のモード情報との組の出現頻度を表す頻度情報(ヒストグラムデータ)を生成する。
ソート部41は、復号対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する。また、本実施形態のソート部41は、前記参照領域のモード情報に関して前記頻度情報が保持する出現頻度のすべてをソート処理で順序付けることによって、前記対象領域のモード情報を順序化する。
復号部42は、入力された符号値に対応する順序を基に、順序化された前記対象領域のモード情報から選ばれる特定のモード情報を復号する。
Further, the mode
The
The sort unit 41 orders the mode information of the target area based on at least a part of the appearance frequency held by the frequency information with respect to the mode information of the reference area corresponding to the target area which is the area to be decoded. Further, the sort unit 41 of the present embodiment orders the mode information of the target area by ordering all the appearance frequencies held by the frequency information with respect to the mode information of the reference area by the sort process.
The
なお、モード情報符号化装置1およびモード情報復号装置4を構成する各部の機能や、エントロピー符号化部2およびエントロピー復号部3の機能は、例えば、電子回路を用いて構成する。また、各部の機能において、情報を記憶するために、必要に応じて、磁気ハードディスク装置や半導体メモリなどといった記憶手段を用いる。また、これら各部の機能を、コンピューターとプログラムとで実現するようにしてもよい。
The functions of the respective parts constituting the mode
なお、モード情報符号化装置1およびモード情報復号装置4は、モード情報をそれぞれ符号化し復号する装置である。モード情報以外の情報(例えば、画像または映像の内容そのものを表す情報など)は、必要に応じて、別途、符号化され、伝送されあるいは記録媒体等に記録され、そして復号される。
The mode
また、同図において、21は対象領域である。対象領域21は1個のブロック(対象ブロック)を含む。6は、参照領域である。図示する例では、参照領域6は2個のブロック(参照ブロック)を含む。なお、本実施形態では1個の対象ブロックに2個の参照ブロックが対応しており、それらの参照ブロックは対象ブロックの左および上に隣接する。しかしながら、参照ブロックの個数は2以外であってもよい。そして、xは、対象ブロックのモード(対象モード)である。また、y1およびy2は、それぞれ、2個の参照ブロックのモード(参照モード)である。また、5は、学習用対象領域および学習用参照領域をあわせた領域である。第n番目の学習用対象ブロックに、2個の学習用参照ブロック(学習用対象ブロックの左および上に隣接)が対応している。第n番目の学習用対象ブロックのモードが、x(n)である。また、この学習用対象ブロックに対応する2個の学習用参照ブロックのモードは、それぞれ、y1 (n)およびy2 (n)である。
Further, in the figure, 21 is a target area. The
また、22は、モード情報復号装置4側における対象領域である。また、8は、参照領域である。また、7は、学習用対象領域および学習用参照領域をあわせた領域である。対象領域22は、上記の対象領域21に対応する。参照領域8は、上記の参照領域6に対応する。学習用対象領域および学習用参照領域7は、学習用対象領域および学習用参照領域5に対応する。そして、モード情報復号装置4側におけるx,y1,y2,x(n),y1 (n),y2 (n)(ただし、n=1,2,・・・)は、モード情報符号化装置1側におけるそれらと同様のものであり、ここでは説明を省略する。
一般化すると、k番目(kは1以上、且つK以下の整数。Kは1個の対象ブロックに対応する参照ブロックの個数であり、1以上の整数。)の参照ブロックのモード値を参照モードykと呼ぶ。また、対象ブロックのモード値を対象モードxと呼ぶ。即ち、一つの対象ブロックに対し、参照ブロックの個数Kは1以上である。また、対象ブロック、参照ブロックともに、モード値の値域は1以上且つM以下(Mは2以上の整数)である。 In generalization, the mode value of the k-th (k is an integer greater than or equal to 1 and less than or equal to K. K is the number of reference blocks corresponding to one target block and is an integer of 1 or more) is referred to as the reference mode. Called y k. Further, the mode value of the target block is called the target mode x. That is, the number K of reference blocks is 1 or more for one target block. Further, in both the target block and the reference block, the range of the mode value is 1 or more and M or less (M is an integer of 2 or more).
なお、対象ブロックの位置に対する各参照ブロックの相対位置は、モード情報符号化装置1とモード情報復号装置4とで共通の相対位置関係にある。例えば、モード情報符号化装置1とモード情報復号装置4との両者において、第1の参照ブロックは対象ブロックの左に隣接し、第2の参照ブロックは対象ブロックの上に隣接する。
The relative position of each reference block with respect to the position of the target block has a common relative positional relationship between the mode
また、対象ブロックと参照ブロックとの間でブロックサイズが異なっていてもよい。その場合、例えば、第1の参照ブロック(対象ブロックの左に隣接)の右上端画素が、対象ブロックの左上端画素の1画素左隣に位置するようにする。また、その場合、例えば、第2の参照ブロックの左下端画素が対象ブロックの左上端画素の1画素上隣に位置するようにする。 Further, the block size may be different between the target block and the reference block. In that case, for example, the upper right pixel of the first reference block (adjacent to the left of the target block) is located to the left of one pixel of the upper left pixel of the target block. Further, in that case, for example, the lower left pixel of the second reference block is located one pixel above the upper left pixel of the target block.
また、学習用対象ブロック1個あたりの学習用参照ブロックの個数は、対象ブロック1個あたりの参照ブロックの個数と同一とする。また、学習用対象ブロックと学習用参照ブロックの相対位置関係は、対象ブロックと参照ブロックの相対位置関係と同一とする。つまり、図1の、符号5および符号6で示す通りである。学習用対象ブロックおよび学習用参照ブロックは、いずれも、映像領域(または映像部分領域(例えば、イントラ予測が適用される映像領域のみ))のうちすでにモード情報の符号化を終了している部分領域内(つまり、図1においてハッチングして示している領域。以下において、「既符号化領域」と呼ぶ。)に設定する。学習用対象ブロックおよび学習用参照ブロックの組は、既符号化領域内においてN組(Nは1以上の整数。Nは定数であっても変数(例えば、処理対象のブロックが進むごとにNが増加するなど)であっても構わない。)である。これらの学習用対象ブロックおよび学習用参照ブロックの組を、後述のヒストグラム集計部10における学習処理に利用する。
Further, the number of learning reference blocks per learning target block is the same as the number of reference blocks per target block. Further, the relative positional relationship between the learning target block and the learning reference block is the same as the relative positional relationship between the target block and the reference block. That is, as shown by
次に、ヒストグラム集計部10の処理について詳細に説明する。
図2は、ヒストグラム集計部10の処理の要点を説明するための概略図である。同図(A)は、ヒストグラム集計部10が頻度値をカウントするために参照する学習用対象領域および学習用参照領域と、符号化対象である対象領域および関連付けられた参照領域の位置関係を示す概略図である。同図(B)は、時点(n−1)におけるヒストグラムH(n−1)(ヒストグラム50)を、3次元のマトリックスとして示す概略図である。同図(C)は、時点(n)におけるヒストグラムH(n)(ヒストグラム53)を、3次元のマトリックスとして示す概略図である。即ち、同図(B)の状態から同図(C)の状態に移る間に、時間が進んでいる。
Next, the processing of the
FIG. 2 is a schematic diagram for explaining the main points of processing of the
なお、同図(A)における符号51は、学習用対象モード値および学習用参照モード値である。同図(B)における符号52は、ヒストグラム50に含まれる一つの頻度値であり、H(n−1)(1,2,3)である。即ち、時点(n−1)における、x=1,y1=2,y2=3の組の頻度値である。同図(C)における符号54は、ヒストグラム53に含まれる一つの頻度値であり、H(n)(1,2,3)である。即ち、時点(n)における、x=1,y1=2,y2=3の組の頻度値である。
ヒストグラム集計部10は、学習用参照モード値および学習用対象モード値の組に対して、その頻度分布を計数するためのメモリを備える。ヒストグラム集計部10は、このメモリを用いて、学習用参照モード値および学習用対象モード値の組の出現を順次カウントしていく。
The
具体的には、ヒストグラム集計部10は、学習用対象モードX(n)および学習用参照モードY1 (n),Y2 (n),・・・,YK (n)の頻度値であるH(n)(X,Y1,Y2,・・・,YK)を数え上げていく。ここで、右上の(n)は、インデックス値を示す。インデックス値nは整数である。n≧1の場合には、H(n)は、総計n組のモード情報を用いて構築したヒストグラムであることを表す。また、n=0の場合には、H(n)は、ヒストグラムを構築する際の初期値を表す。
Specifically, the
この初期値(n=0の場合)としては所定の値を適宜与えるようにする。n=0の場合に、例えば、すべての(X,Y1,Y2,・・・,YK)の組に対して、H(n)(X,Y1,Y2,・・・,YK)=0としてもよい。あるいは、n=0の場合に、(X,Y1,Y2,・・・,YK)の組のそれぞれの頻度値として、0以外の適切な値を与えるようにしてもよい。例えば、予め様々な映像を用いて計測しておいた典型的な頻度値分布を、H(n)(X,Y1,Y2,・・・,YK)の値として与えるようにしてもよい。非零値のヒストグラムを初期値として与える場合、モード情報の学習に要する時間(言い換えれば、学習データ量)を小さくすることも可能となる。 As this initial value (when n = 0), a predetermined value is appropriately given. When n = 0, for example, for all (X, Y 1 , Y 2 , ..., Y K ) pairs, H (n) (X, Y 1 , Y 2 , ..., Y K ) = 0 may be set. Alternatively, when n = 0, an appropriate value other than 0 may be given as the frequency value of each set of (X, Y 1 , Y 2 , ..., Y K). For example, a typical frequency value distribution measured in advance using various images may be given as a value of H (n) (X, Y 1 , Y 2 , ..., Y K ). good. When a non-zero histogram is given as an initial value, it is possible to reduce the time required for learning the mode information (in other words, the amount of training data).
ヒストグラム集計部10は、既符号化領域内の学習用対象モードおよび参照モードの組を1組以上用いてヒストグラムH(n)を生成する。
例えばある時点において、モード情報符号化装置1が対象モードの符号化処理を行う場合には、ヒストグラム集計部10は、1ブロック前の処理時点における対象ブロックおよび参照ブロックの位置に、学習用対象ブロックおよび学習用参照ブロックを置く。そして、ヒストグラム集計部10は、学習用対象ブロックおよび学習用参照ブロックの組の情報に基づいて、ヒストグラムH(n)を更新する。そして、対象モードの符号化処理の進捗とともに、学習用対象ブロックおよび学習用参照ブロックも移動させて、順次ヒストグラムH(n)を更新していく。
The
For example, when the mode
ヒストグラム集計部10は、学習用対象モードx(n)、および学習用参照モード(y1 (n),y2 (n),・・・,yK (n))の組に基づき、下の式(1)によってヒストグラムをH(n−1)からH(n)に更新する。なお、x(n),y1 (n),y2 (n),・・・,yK (n)のそれぞれにおける右上の(n)は、それらのモード情報が第n番目(n≧1)のモード情報(それぞれ、学習用対象モード及び学習用参照モード)であることを表す。
The
なお、x(n),y1 (n),y2 (n),・・・,yK (n)以外のモードの組については、ヒストグラムの値を更新しない。 The histogram value is not updated for a set of modes other than x (n) , y 1 (n) , y 2 (n) , ..., Y K (n).
図2に示す具体例において、ヒストグラム集計部10の動作は次の通りである。図示するように、ヒストグラムH(n−1)およびH(n)は、それぞれ、モード情報x,y1,y2による3次元のマトリクスとして表される。一般に、学習用対象モード1種類と学習用参照モードK種類の組であるモード情報のヒストグラムは、(K+1)次元のマトリクスとして表される。それらのマトリクスの個々の要素が、各々、学習用対象モードおよび学習用参照モードK種類の組の頻度値である。
In the specific example shown in FIG. 2, the operation of the
同図において、符号50は、時点(n−1)におけるヒストグラムH(n−1)を示す。また、符号53は、時点(n)におけるヒストグラムH(n)を示す。同図における各升目(マトリクスの要素)がヒストグラムのビンを表し、升目内の数字が頻度値を表す。例えば、図2(A)の符号51で示す領域は、に示すように、学習用対象モードx(n)が1であり、学習用参照モードがy1 (n)およびy2 (n)がそれぞれ2および3である。時点(n−1)において当該対象モードおよび当該参照モードのビンに記録された頻度値は、図2(B)の符号52で示すように「2」であった。したがって、時点(n)において当該対象モードおよび当該参照モードのビンに記録される頻度値は、図2(C)の符号54で示すように「3」に更新される。なお、当該ビン以外の頻度値は、ヒストグラム時点(n−1)から時点(n)の間には変わらない。
In the figure,
次に、ソート部11の処理について詳細に説明する。
図3は、ソート部11の処理の要点を説明するための概略図である。同図(A)は、ソート部11がソートしようとする頻度値の選択条件(参照ブロックのモード値による条件)を示す概略図である。同図(B)は、時点(n)におけるヒストグラムH(n)から、選択条件(参照ブロックの値が、y1=3且つy2=4)にしたがって選択される頻度値の集合を示す概略図である。同図(C)は、同図(B)で選択された頻度値をソートした結果(頻度値のソート結果58)を数式で示す概略図である。同図(D)は、ソート結果に基づいて定まった順位dに対応付けたモード値Xd(対象モード値60)を示す概略図である。
Next, the processing of the
FIG. 3 is a schematic view for explaining the main points of the processing of the
ソート部11は、ヒストグラム集計部10がヒストグラムを集計済みであることを前提として、以下の処理を行う。即ち、ソート部11は、その時点における符号化対象である対象領域に対応付けられた参照領域の参照モード値列(y1,y2,・・・,yK)に基づき、ヒストグラムH(n)(X,Y1,Y2,・・・,YK)に含まれる頻度値の一部をソートする。具体的には、ソート部11は、ヒストグラムH(n)(X,Y1,Y2,・・・,YK)に含まれる全ビンのうち、Y1=y1,Y2=y2,・・・,YK=yKであるビンを、頻度値の降順にソートする。ソート部11は、このソート処理により、対象モード値Xを順序付ける。すなわち、ソート部11は、すべてのX∈{1,2,・・・,M}について、頻度値H(n)(X,y1,y2,・・・,yK)を比較し、頻度値の高い方から順にXを並べる。
The
ソート部11によるこのソート処理を数式で表すと、下の式(2)の通りである。
The sort process by the
つまり、ソート部11は、ソート処理により、式(2)を満たす数列(Xm)m=1,2,・・・,Mを求める。ただし、この数列は、同じ値の項を含まない。また、すべてのi∈{1,2,・・・,M}に対し、Xi∈{1,2,・・・,M}である。
That is, the
なお、H(n)(X,Y1,Y2,・・・,YK)が同じになるXが複数存在する場合があり得る。即ち、式(2)における不等号「≦」において、等号「=」が成立する箇所が一箇所以上存在する場合があり得る。そのような場合には、ソート処理の結果として、数列(Xm)m=1,2,・・・,Mが唯一に定まらない。その場合には、ソート部11は、例えば、予め定めたルール等によりソート結果の順序を確定させる。そのようなルールの一例は、「頻度において同順位のモード値のうち、モード値がより小さいほうが(あるいはより大きいほうが)頻度が高かったものとみなす」といったルールである。勿論、他のルール等に依ってソート結果を確定させてもよい。
It should be noted that there may be a plurality of Xs having the same H (n) (X, Y 1 , Y 2 , ..., Y K). That is, in the inequality sign “≦” in the equation (2), there may be one or more places where the equal sign “=” holds. In such a case, as a result of the sorting process, the sequence (X m ) m = 1, 2, ..., M is not uniquely determined. In that case, the
つまり、ソート部11は、式(2)および式(3)を満たす数列(Xm)m=1,2,・・・,Mを求める。
That is, the
図3(A)に示す例において、現時点でモード情報を符号化しようとしている対象領域55に含まれるブロック(対象ブロック)のモード情報(対象モード値)はxである。また、その対象ブロックに関連付けられる参照領域56に含まれる2つのブロック(参照ブロック)のモード情報(参照モード値)は、それぞれ、y1=3、y2=4である。この参照モード値の組に関する各対象モード値xの頻度値は、図3(B)に示すヒストグラムH(n)における射影57である。即ち、x=0,1,2,3,および4のそれぞれに対応する頻度値は、1,4,3,1,および5である。ソート部11がこれらの頻度値を降順にソートした結果、図3(C)に示す頻度値のソート結果58が得られる。即ち、ソート結果58に含まれる頻度値は、次の通りである。
H(n)(4,3,4)=5
H(n)(1,3,4)=4
H(n)(2,3,4)=3
H(n)(0,3,4)=1
H(n)(3,3,4)=1
In the example shown in FIG. 3A, the mode information (target mode value) of the block (target block) included in the
H (n) (4,3,4) = 5
H (n) (1,3,4) = 4
H (n) (2,3,4) = 3
H (n) (0,3,4) = 1
H (n) (3,3,4) = 1
即ち、これらの頻度値の相互の関係は、次の通りである。
H(n)(4,3,4)>H(n)(1,3,4)>H(n)(2,3,4)>H(n)(0,3,4)=H(n)(3,3,4)
That is, the mutual relationship between these frequency values is as follows.
H (n) (4,3,4)> H (n) (1,3,4)> H (n) (2,3,4)> H (n) (0,3,4) = H ( n) (3,3,4)
なお、頻度値が等しいビンを表す等号59が表すように、x=0の場合とx=3の場合の頻度値はそれぞれ1であり、同値である。ここで、上述した式(3)を適用すると、順位d(1≦d≦5)の対象モードXdの値は、図3(D)に示す対象モード値60の通りである。即ち、次の通りに一意に定まる。
x1=4,x2=1,x3=2,x4=0,x5=3
As indicated by the
x 1 = 4, x 2 = 1, x 3 = 2, x 4 = 0, x 5 = 3
次に、符号化部12の処理について詳細に説明する。
図4は、符号化部12の処理の要点を説明するための概略図である。同図は、ソート部11によって求められた数値列Xd(1≦d≦5)と、対象ブロックのモード値および参照ブロックのモード値とに基づいて、符号値cを求める一連の処理の例を示している。
Next, the processing of the
FIG. 4 is a schematic diagram for explaining the main points of the processing of the
符号化部12は、ソート部11が求めた数列(Xm)m=1,2,・・・,Mに基づき、対象モードxを符号化して、符号cを出力する。そのため、符号化部12は、対象モードxの頻度値が、H(n)(X=1,y1,y2,・・・,yK),H(n)(X=2,y1,y2,・・・,yK),・・・,H(n)(X=M,y1,y2,・・・,yK)の中で何番目に高い頻度であったかを求める。つまり、符号化部12は、対象モードxの、頻度値における順位を求める。そして、符号化部12は、この順位に基づいて符号cを定める。
The
例えば、符号化部12は、下の式(4)を満たす順位dに基づいて符号cを定める。
For example, the
符号化部12は、一例として、下の式(5)により符号cを定める。
As an example, the
式(5)においてdから1を減じた値を求めているのは、符号値cが0から始まるように、順位dの値をオフセットしているためである。 In the equation (5), the value obtained by subtracting 1 from d is obtained because the value of the rank d is offset so that the sign value c starts from 0.
図4に示す例において、対象領域61に含まれるブロック(対象ブロック)のモード値は4である。また、参照モード値がそれぞれy1=3、y2=4である点は、図3における状況と同様である。ソート部11が求めた順位ごとの対象モード値62は図示する通りである。符号化部12は、この対象モード値62に照らして、対象モード値「4」の順位を求める。即ち、符号化部12は、順位としてd=1を得る。そして、式(5)で表した符号化を行う場合、符号化部12は、d=1に対応させて、符号値c=0を得る。
In the example shown in FIG. 4, the mode value of the block (target block) included in the
なお、上記の式(5)を適用する場合、符号値cは常に非負整数である。また、符号値cが0寄りの小さな値であるほど、そのモードの発生確率は大きいという傾向がある。つまり、モード情報符号化装置1を用いことで、対象モードの発生確率が大きいほど、符号値cの発生確率分布は0寄りの小さな値になるという傾向が維持される。これは、ヒストグラム集計部10がヒストグラムを集計した画像領域と、ソート部11および符号化部12が各処理を行った画像領域との間で、参照モード値と対象モード値の相関性が維持されているという前提を利用するものである。これにより、符号値cのエントロピーを削減することが可能となる。
When the above equation (5) is applied, the code value c is always a non-negative integer. Further, the smaller the code value c is closer to 0, the higher the probability of occurrence of the mode tends to be. That is, by using the mode
なお、図1に示したエントロピー符号化部2は、符号化部12が出力する符号値cをエントロピー符号化する。これにより、モード情報のより一層の圧縮が可能となる。言い換えれば、エントロピー符号化部2からエントロピー復号部3に伝達されるモード情報を表現するビット数を削減することが可能となる。
The
エントロピー符号化部2が用いる符号化手法として、例えば、ハフマン符号や、算術符号や、これらの派生であるCAVLC(コンテキスト適応型可変長符号化方式)やCABAC(コンテクスト適応型算術符号化方式)を用いることができる。また、前記のように符号値cの発生確率分布が0付近で高くなるようにする場合、ゴロム符号(Golomb coding)やその派生である指数ゴロム符号(Exponential-Golomb coding)との整合性も高く、エントロピー符号化部2がこれらを用いるようにしてもよい。
なお、エントロピー復号部3は、エントロピー符号化部2と対になる手法を用いて、符号化されたモード情報を復号する。
As the coding method used by the
The
エントロピー符号化部2による処理と、エントロピー復号部3による処理とを順次適用したとき、情報の損失がない(ロスレスである)ことが望まれる。
When the processing by the
次に、ヒストグラム集計部40、ソート部41、および復号部42の処理について詳細に説明する。
図5は、復号部42の処理の要点を説明するための概略図である。同図は、ソート部41によって求められた数値列Xd(1≦d≦5)と、符号値cとに基づいて、対象ブロックのモード値(x=4)を求める一連の処理の例を示している。
Next, the processing of the
FIG. 5 is a schematic diagram for explaining the main points of processing of the
ヒストグラム集計部40は、既復号領域内の学習用対象領域のモード値(学習用対象モード)および学習用参照領域のモード値(学習用参照モード)の組を1組以上用いてヒストグラムH(n)を生成する。なお、既復号領域とは、図1において、学習用対象領域および学習用参照領域7を含み、ハッチングで示している領域である。なお、ヒストグラム集計部10とヒストグラム集計部40との間で、学習用対象領域と学習用参照領域の位置を共通に設定する。即ち、ヒストグラム集計部40は、ヒストグラム集計部10が頻度値を求める対象である既符号化領域内の学習用対象領域および学習用参照領域5と、同フレーム且つ同位置の既復号領域内の学習用対象領域と学習用参照領域7を用いてヒストグラムH(n)を構築する。
なお、ヒストグラム集計部40がヒストグラムH(n)を生成する算法は、ヒストグラム集計部10がヒストグラムH(n)を生成する算法と同一であるので、ここでの説明を省略する。
The
Since the calculation method in which the
ソート部41は、復号しようとしている対象領域に対応付けられた参照領域の参照モード値列(y1,y2,・・・,yK)に基づき、対象モード値Xを順序付けする。具体的には、ソート部41は、ヒストグラム集計部40が生成したヒストグラムH(n)(X,Y1,Y2,・・・,YK)の全ビンのうち、Y1=y1,Y2=y2,・・・,YK=yKビンについて、頻度値を降順にソートする。そして、ソート部41は、このソート結果にしたがって対象モード値Xを順序付けする。なお、ソート部41は、ソート部11による処理と同様の算法により、数列(Xm)m=1,2,・・・,Mを求める。
The sort unit 41 orders the target mode values X based on the reference mode value strings (y 1 , y 2 , ..., Y K ) of the reference area associated with the target area to be decoded. Specifically, the sort unit 41 has Y 1 = y 1 , among all the bins of the histogram H (n) (X, Y 1 , Y 2 , ..., Y K) generated by the histogram aggregation unit 40. For Y 2 = y 2 , ..., Y K = y K bins, the frequency values are sorted in descending order. Then, the sort unit 41 orders the target mode values X according to the sort result. The sort unit 41 obtains the sequence (X m ) m = 1, 2, ..., M by the same arithmetic method as the processing by the
復号部42は、ソート部41が求めた数列(Xm)m=1,2,・・・,Mに基づき、受け取った符号cを対象モード値xに復号して、対象モード値xを出力する。
具体的には、モード情報符号化装置1内の符号化部12に対応する方法で、順位dを求める。符号化部12が式(5)によって符号cを求めた場合には、復号部42は、下の式(6)により順位dを求める。
The
Specifically, the rank d is obtained by a method corresponding to the
順位dが得られると、復号部42は、続いて、式(4)と同一の関係を表す下の式(7)により、対象モード値xを求める。
When the rank d is obtained, the
図5に示す例に沿って、上述した、ヒストグラム集計部40と、ソート部41と、復号部42の一連の処理の流れを説明する。
本例では、モード情報復号装置4が受け取る符号値cは0である。この符号値は、モード情報符号化装置1内の符号化部12で求められたものである。c=0であるので、式(6)により、復号部42は、d=1を得る。一方、ソート部41は、頻度値の降順に並べた対象モードの数列を出力する。図示する例では、X1=4,X2=1,X3=2,X4=0,X5=4である。この数列は、参照モード値として、y1=3,y2=4を前提とするものである。そして、復号部42は、ソート部41から出力された数列に照らして、d=1の場合の対象モード値であるX1=4を得る。即ち、復号結果として対象モード値x=4を得る。
A series of processing flows of the
In this example, the code value c received by the mode
以上、モード情報符号化装置1、エントロピー符号化部2、エントロピー復号部3、モード情報復号装置4の機能および処理例等について説明した。なお、モード情報符号化装置1側のヒストグラム集計部10と、モード情報復号装置4側のヒストグラム集計部40とは、何らかの手段で互いに同期しながらヒストグラムのデータを更新する。言い換えれば、ソート部11および符号化部12による一連の処理と、ソート部41および復号部42による一連の処理とは、同一のヒストグラムデータに基づいて行われる。したがって、ヒストグラム集計部10とヒストグラム集計部40は、共通の認識に基づく所定のタイミングで、ヒストグラムのデータを所定の値にリセットする。一例として、GoP(group of pictures)の区切りのタイミングで、ヒストグラムのデータをリセットする。
The functions and processing examples of the mode
また、例えば、ヒストグラム集計部10とヒストグラム集計部40は、ヒストグラムのデータを初期値H(0)にリセットする。前述の通り、ヒストグラムの初期値H(0)は、すべて頻度値0としたものでもよく、また、所定の確率分布に基づき予め定めた非零値を用いたものでもよい。例えば、予めさまざまな映像において計測あるいはモデル化した頻度値の典型的な分布に従って、初期値H(0)を定めておくようにする。
Further, for example, the
なお、リセットする頻度が相対的に低いと、モード情報符号化装置1およびモード情報復号装置4は、充分な量の画像から得られる学習用対象領域のモード情報と学習用参照領域のモード情報を反映したヒストグラムを構築できる。つまり、学習効果をより多く得られる可能性が高い。逆に、リセットする頻度が相対的に高いと、モード情報符号化装置1側とモード情報復号装置4側とでヒストグラムデータが一致しない状態から処理を開始した場合にも、比較的早期に両者のヒストグラムを一致させて、モード情報を伝達できるようになる。なお、モード情報符号化装置1側とモード情報復号装置4側とでヒストグラムデータが一致しない状態は、例えば、モード情報復号装置4側で(映像等の)コンテンツの途中から復号を開始する場合などに生じ得る。
When the frequency of resetting is relatively low, the mode
また、ヒストグラムH(n)に含まれる頻度値が所定の状態になったタイミングで、モード情報符号化装置1側とモード情報復号装置4側とでヒストグラムをリセットするようにしてもよい。一例として、ヒストグラムH(n)に含まれる頻度値(非負値)のうちの最大値が所定の閾値を超えたときに、モード情報符号化装置1側とモード情報復号装置4側とでヒストグラムをリセットするようにしてもよい。これにより、各頻度値のメモリの領域のサイズが固定(例えば、10進数表現における最大桁数固定、あるいは2進数表現におけるビット数固定など)の場合に、頻度値のオーバーフローを防止することができる。この場合、初期化方法の一例として、各頻度値を所定の定数(例えば、2、4など)で除算する(除算の結果の小数部分を切り捨てるか、切り上げるか、予め定める)ようにしてもよい。
Further, the histogram may be reset on the mode
なお、上述した実施形態におけるモード情報符号化装置1、エントロピー符号化部2、エントロピー復号部3、およびモード情報復号装置4の各装置の、少なくとも一部の機能をコンピューターで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM、DVD−ROM、USBメモリ等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Even if at least a part of the functions of the mode
以上、説明した実施形態のモード情報符号化装置によれば、対象ブロックよりも前に符号化済みの画像領域のモード情報に基づいて、モード値の空間的な相関が学習される。学習に用いた画像領域と対象ブロックを含む画像領域とで画像の統計的性質が類似するという前提に基づき、学習の結果を用いることで、出現頻度が高いモードほど小さな符号値(c)にほとんどの場合で変換することができる。前記の統計的性質が類似するほど、出現頻度が高いモード値を小さな符号値に変換することが成功する。変換の結果得られる符号語の出現頻度は、小さな値の符号語ほど高頻度となる。小さな値にエネルギー集中した結果、符号語のエントロピーも減少し、モード符号化の符号化効率を改善することができる。 According to the mode information coding apparatus of the embodiment described above, the spatial correlation of the mode values is learned based on the mode information of the image region encoded before the target block. Based on the premise that the statistical properties of the image are similar between the image area used for learning and the image area including the target block, by using the learning results, the higher the frequency of appearance, the smaller the code value (c). Can be converted in the case of. The more similar the above statistical properties are, the more successful it is to convert a mode value with a high frequency of occurrence to a small code value. The frequency of appearance of codewords obtained as a result of conversion is higher for codewords with smaller values. As a result of concentrating energy on a small value, the entropy of the codeword is also reduced, and the coding efficiency of mode coding can be improved.
また、実施形態のモード情報復号装置によれば、符号化されたモード情報の復号に必要な出現頻度の順位情報を、モード情報符号化装置から受信せずとも、モード情報復号装置側ですでに復号済みのモード情報から前記順位情報を得ることができる。これにより、符号化効率を低下させるオーバヘッドなしでモード情報の復号が可能となる。 Further, according to the mode information decoding device of the embodiment, the mode information decoding device has already received the order information of the appearance frequency required for decoding the encoded mode information from the mode information decoding device. The ranking information can be obtained from the decoded mode information. This makes it possible to decode the mode information without an overhead that lowers the coding efficiency.
以上、実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。
[第1変形例]
上記の実施形態では、頻度値に基づく順位(順序)dと符号値cとの関係を、式(5)および式(6)で表すように定めた。しかしながら、必ずしもこれらの式にしたがって順序(順位)dと符号値cとの関係を決める必要はなく、順位dと符号値cとを他の対応関係としてもよい。ただし、順位dに基づき符号値cが一意に定まるように、且つ、符号値cに基づき順位dが一意に定まるように対応関係を定める。
Although the embodiments have been described above, the present invention can be further implemented in the following modifications.
[First modification]
In the above embodiment, the relationship between the rank (order) d based on the frequency value and the code value c is defined to be represented by the equations (5) and (6). However, it is not always necessary to determine the relationship between the order (rank) d and the code value c according to these equations, and the order d and the code value c may be used as other correspondence relationships. However, the correspondence is determined so that the code value c is uniquely determined based on the order d and the order d is uniquely determined based on the code value c.
一例として、順位dと符号値cとの関係を、下記の式により定める。なお、ここで、dmaxは、順位dの最大値である。この式により、順位dと符号値cとを相互に変換可能である。
c=dmax−d
As an example, the relationship between the rank d and the code value c is determined by the following formula. Here, d max is the maximum value of the rank d. By this equation, the rank d and the code value c can be converted to each other.
c = d max −d
また、頻度値の順位の階層ごとに、符号値cの決め方を変えてもよい。一例としてモードの種類が35種類である場合、順位d(1≦d≦35)に応じて下記のように階層化する。
第1層(1≦d≦8)の場合、前記の式(5)によって符号値cを決定する。
第2層(9≦d≦16)の場合、順位dとは独立の別の所定ルールにしたがって、符号値c(ただし、8≦c≦15)を、第2層に属するモード値候補の各々に付与する。
第3層(17≦d≦24)の場合、順位dとは独立の別の所定ルールにしたがって、符号値c(ただし、16≦c≦23)を、第3層に属するモード値候補の各々に付与する。
第4層(25≦d≦35)の場合、順位dとは独立の別の所定ルールにしたがって、符号値c(ただし、24≦c≦34)を、第4層に属するモード値候補の各々に付与する。
この場合、モード情報符号化装置1から出力される符号値cは、モード値候補の頻度値についての全順序を表さないが、上位(上記の例では第1層)の順序と、下位(上記の例では第2層から第4層まで)の半順序とを表す。つまり、この例による場合の符号値cは、モード情報のエントロピーを減少させる。
なお、モード情報復号装置4側では、上記の順序付けに対応する順序付けを行う。
Further, the method of determining the code value c may be changed for each hierarchy of the frequency value ranking. As an example, when there are 35 types of modes, the layers are layered as follows according to the order d (1 ≦ d ≦ 35).
In the case of the first layer (1 ≦ d ≦ 8), the code value c is determined by the above equation (5).
In the case of the second layer (9 ≦ d ≦ 16), the code value c (however, 8 ≦ c ≦ 15) is set to each of the mode value candidates belonging to the second layer according to another predetermined rule independent of the rank d. Give to.
In the case of the third layer (17 ≦ d ≦ 24), the code value c (however, 16 ≦ c ≦ 23) is set to each of the mode value candidates belonging to the third layer according to another predetermined rule independent of the rank d. Give to.
In the case of the fourth layer (25 ≦ d ≦ 35), the code value c (however, 24 ≦ c ≦ 34) is set to each of the mode value candidates belonging to the fourth layer according to another predetermined rule independent of the rank d. Give to.
In this case, the code value c output from the mode
The mode
つまり、モード情報符号化装置1側の符号化部12は、前記対象領域のモード情報を、ソート部11が求めた順序の少なくとも一部に基づく符号として符号化する。
また、モード情報復号装置4側の復号部42は、符号化部12に対応する方法を用いて、対象領域のモード情報を復号する。
That is, the
Further, the
なお、第1変形例において例示した符号値cの決め方に限らず、順位dと符号値cの関係は任意である。 The relationship between the rank d and the code value c is arbitrary, not limited to the method of determining the code value c illustrated in the first modification.
[第2変形例]
上記の実施形態では、モード情報符号化装置1側のソート部11およびモード情報復号装置4側のソート部41は、それぞれ、次の通り頻度値のソート処理を行った。即ち、ソート部11およびソート部41は、その時点における符号化または復号の対象である対象領域に対応付けられた参照領域の参照モード値列(y1,y2,・・・,yK)に関する、全モード値候補Xの頻度値を降順にソートした。一方、ここで説明する変形例においては、ソート部11およびソート部41は、他の方法でモード値候補Xを順序付ける。
[Second modification]
In the above embodiment, the
例えば、ソート部11およびソート部41は、頻度値の昇順にモード値候補Xをソートする。このように頻度値の昇順にソートした場合も、モード値Xの頻度の順序の情報を同様に得ることができ、モード情報を効率的に符号化することが可能である。
また、例えば、ソート部11およびソート部41は、全てのモード値候補Xに関して頻度値順(降順または昇順)のソートを行う代わりに、所定範囲に属するモード値候補Xに関してのみ頻度値順のソート処理を行う。一例として、ソート部11およびソート部41は、頻度値が所定の閾値よりも高いモード値候補Xについてのみソートを行い、他のモード値候補についてはソート処理を行わない。あるいは別の例として、ソート部11およびソート部41は、頻度値の上位N件(Nは正整数)のモード値候補Xについてのみソートを行い、他のモード値候補についてはソート処理を行わない。これらの場合、ソート部11およびソート部41は、ソート処理の対象とならないモード値候補Xについては、頻度値順以外の方法による順序を与える。これらの場合にも、頻度値が比較的上位のモード値候補Xについて、モード情報のエントロピーを減少させることが可能である。
なお、ここに示したいずれの場合も、ソート部11およびソート部41は、共通の処理を行うことによってモード値候補Xの順序付けを行う。
For example, the
Further, for example, the
In any of the cases shown here, the
つまり、ソート部11およびソート部41は、符号化対象の領域である対象領域に対応する参照領域のモード情報に関して前記ヒストグラムデータが保持する出現頻度の少なくとも一部に基づいて、前記対象領域のモード情報を順序化する。
That is, the
以上、この発明の実施形態および変形例について図面を参照して詳述してきたが、具体的な構成はこの実施形態等に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 Although the embodiments and modifications of the present invention have been described in detail with reference to the drawings, the specific configuration is not limited to the embodiments and the like, and the design and the like within a range not deviating from the gist of the present invention are also included. included.
本発明は、静止画や動画を符号化して、記録媒体に記録したり、伝送媒体で伝送したりするためなどに利用可能である。例えば、放送事業や、通信事業や、コンテンツ配信事業や、コンテンツをパッケージングして販売する事業等で利用可能である。また、それらの技術を応用した各種事業において利用可能である。また、それらの符号化あるいは服後のための機器あるいはプログラムを製造したり、販売したりする事業において利用可能である。なお、本発明の利用可能性は、ここに例示列挙した事業(産業)に限定されない。 INDUSTRIAL APPLICABILITY The present invention can be used for encoding a still image or a moving image and recording it on a recording medium or transmitting it on a transmission medium. For example, it can be used in a broadcasting business, a communication business, a content distribution business, a business of packaging and selling content, and the like. It can also be used in various businesses that apply these technologies. It can also be used in the business of manufacturing and selling equipment or programs for their coding or after-wear. The availability of the present invention is not limited to the businesses (industries) exemplified here.
1 モード情報符号化装置
2 エントロピー符号化部
3 エントロピー復号部
4 モード情報復号装置
5 学習用対象領域および学習用参照領域
6 参照領域
7 学習用対象領域および学習用参照領域
8 参照領域
10 ヒストグラム集計部(頻度情報生成部)
11 ソート部(順序化部)
12 符号化部
21,22 対象領域
40 ヒストグラム集計部(頻度情報生成部)
41 ソート部(順序化部)
42 復号部
50 ヒストグラム(H(n−1))
51 学習用対象モード値および学習用参照モード値
52 頻度値(H(n−1)(1,2,3))
53 ヒストグラム(H(n))
54 頻度値(H(n)(1,2,3))
55 対象領域
56 参照領域
57 射影(参照モード値y1=3且つy2=4の場合に対応する)
58 頻度値のソート結果
59 頻度値が等しいビンを表す等号
60 対象モード値
61 対象領域
62 対象モード値
1 Mode
11 Sorting section (ordering section)
12
41 Sorting section (ordering section)
42
51 Target mode value for learning and reference mode value for learning 52 Mode value (H (n-1) (1, 2, 3))
53 Histogram (H (n) )
54 Frequency value (H (n) (1, 2, 3))
55
58 Mode
Claims (4)
符号化対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、
前記対象領域のモード情報を、前記順序化部が求めた順序の少なくとも一部に基づく符号として符号化する符号化部と、
を具備し、
前記順序化部は、前記頻度情報に基づいて前記出現頻度の順に順序値を定め、前記出現頻度の順序の範囲を複数の階層に分けるものであり、
前記符号化部は、順序値1が属する階層に関しては前記順序値に所定値をオフセットすることによって当該階層に対応する符号を前記対象領域のモード情報に付与し、順序値1が属さない階層のそれぞれについては前記順序値とは独立の別の所定ルールにしたがった符号を前記対象領域のモード情報に付与するものであり、
前記学習用参照領域は、K個(但し、Kは、2以上の整数)の学習用参照ブロックを含み、
前記頻度情報は、前記学習用対象領域のモード情報の次元と前記学習用参照ブロックごとのモード情報の次元とから成る(K+1)次元のマトリックスとして表わされ、
前記順序化部は、前記(K+1)次元のマトリックスに基づいて、前記学習用参照ブロックごとのモード情報に該当する前記出現頻度の値によるソート処理をすることによって前記対象領域のモード情報を順序化する、
ことを特徴とするモード情報符号化装置。 Frequency of appearance of a set of mode information of a learning target area in a coded area which is a coded area and mode information of a learning reference area corresponding to the learning target area in the coded area. Frequency information generator that generates frequency information that represents
An ordering unit that orders the mode information of the target area based on a part of the appearance frequency held by the frequency information with respect to the mode information of the reference area corresponding to the target area which is the target area to be encoded.
A coding unit that encodes the mode information of the target region as a code based on at least a part of the order obtained by the ordering unit.
Equipped with
The ordering unit determines an order value in the order of the appearance frequency based on the frequency information, and divides the range of the order of the appearance frequency into a plurality of layers.
The coding unit assigns a code corresponding to the hierarchy to the mode information of the target area by offsetting a predetermined value to the sequence value with respect to the hierarchy to which the sequence value 1 belongs, and the sequence of the hierarchy to which the sequence value 1 does not belong. from said sequence value for each a shall be given a code in accordance with independent another predetermined rule mode information of the target region,
The learning reference area includes K learning reference blocks (where K is an integer of 2 or more).
The frequency information is represented as a (K + 1) dimensional matrix including the dimension of the mode information of the target area for learning and the dimension of the mode information for each reference block for learning.
The ordering unit orders the mode information of the target area by performing sorting processing according to the occurrence frequency value corresponding to the mode information for each learning reference block based on the (K + 1) dimensional matrix. do,
A mode information encoding device characterized in that.
復号対象の領域である対象領域に対応する参照領域のモード情報に関して前記頻度情報が保持する出現頻度の一部に基づいて、前記対象領域のモード情報を順序化する順序化部と、
入力された符号値を基に、順序化された前記対象領域のモード情報から選ばれる特定のモード情報を復号する復号部と、
を具備し、
前記順序化部は、前記頻度情報に基づいて前記出現頻度の順に順序値を定め、前記出現頻度の順序の範囲を複数の階層に分けるものであり、
前記復号部は、順序値1が属する階層に関しては前記符号値に所定値をオフセットすることによって得られる順序値に対応する、前記対象領域のモード情報を復号し、順序値1が属さない階層のそれぞれについては前記順序値とは独立の別の所定ルールにしたがって前記符号値に対応する前記対象領域のモード情報を復号するものであり、
前記学習用参照領域は、K個(但し、Kは、2以上の整数)の学習用参照ブロックを含み、
前記頻度情報は、前記学習用対象領域のモード情報の次元と前記学習用参照ブロックごとのモード情報の次元とから成る(K+1)次元のマトリックスとして表わされ、
前記順序化部は、前記(K+1)次元のマトリックスに基づいて、前記学習用参照ブロックごとのモード情報に該当する前記出現頻度の値によるソート処理をすることによって前記対象領域のモード情報を順序化する、
ことを特徴とするモード情報復号装置。 Frequency representing the appearance frequency of a set of the mode information of the learning target area in the already decoded area, which is the decoded area, and the mode information of the learning reference area corresponding to the learning target area in the already decoded area. Frequency to generate information Information generation unit and
An ordering unit that orders the mode information of the target area based on a part of the appearance frequency held by the frequency information with respect to the mode information of the reference area corresponding to the target area that is the area to be decoded.
A decoding unit that decodes specific mode information selected from the ordered mode information of the target area based on the input code value, and
Equipped with
The ordering unit determines an order value in the order of the appearance frequency based on the frequency information, and divides the range of the order of the appearance frequency into a plurality of layers.
The decoding unit decodes the mode information of the target area corresponding to the order value obtained by offsetting a predetermined value to the code value with respect to the layer to which the order value 1 belongs, and the layer to which the order value 1 does not belong. are those for respectively for decoding the mode information of the target region corresponding to the code values according to independent another predetermined rule and the order value,
The learning reference area includes K learning reference blocks (where K is an integer of 2 or more).
The frequency information is represented as a (K + 1) dimensional matrix including the dimension of the mode information of the target area for learning and the dimension of the mode information for each reference block for learning.
The ordering unit orders the mode information of the target area by performing sorting processing according to the occurrence frequency value corresponding to the mode information for each learning reference block based on the (K + 1) dimensional matrix. do,
A mode information decoding device characterized by the above.
請求項1に記載のモード情報符号化装置、
として機能させるためのプログラム。 Computer,
The mode information encoding device according to claim 1.
A program to function as.
請求項2に記載のモード情報復号装置、
として機能させるためのプログラム。 Computer,
The mode information decoding device according to claim 2.
A program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017126358A JP6952513B2 (en) | 2017-06-28 | 2017-06-28 | Mode information encoder, mode information decoder, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017126358A JP6952513B2 (en) | 2017-06-28 | 2017-06-28 | Mode information encoder, mode information decoder, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019009727A JP2019009727A (en) | 2019-01-17 |
JP6952513B2 true JP6952513B2 (en) | 2021-10-20 |
Family
ID=65029811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017126358A Active JP6952513B2 (en) | 2017-06-28 | 2017-06-28 | Mode information encoder, mode information decoder, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6952513B2 (en) |
-
2017
- 2017-06-28 JP JP2017126358A patent/JP6952513B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019009727A (en) | 2019-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3560198B1 (en) | Low-complexity sign prediction for video coding | |
US10834410B2 (en) | Context modeling for intra-prediction modes | |
US9699468B2 (en) | Adaptive screen and video coding scheme | |
KR102314801B1 (en) | Selective Blending for Entropy Coding in Video Compression | |
US8401321B2 (en) | Method and apparatus for context adaptive binary arithmetic coding and decoding | |
JP7170669B2 (en) | Coding the last significant coefficient flag | |
US10791341B2 (en) | Binary arithmetic coding with progressive modification of adaptation parameters | |
CN104041040A (en) | Encoding of prediction residuals for lossless video coding | |
US11006133B2 (en) | Image compression technique | |
JP6952513B2 (en) | Mode information encoder, mode information decoder, and program | |
EP3673653B1 (en) | Embedding information about token tree traversal | |
US20240046100A1 (en) | Apparatus, method and computer program for decoding neural network parameters and apparatus, method and computer program for encoding neural network parameters using an update model | |
Seok et al. | Effective Video Compression with two Quantization Parameters | |
CN114556790A (en) | Probability estimation for entropy coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6952513 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |