JP2013183207A - Coding device, decoding device, coding method and decoding method of moving image, and program - Google Patents
Coding device, decoding device, coding method and decoding method of moving image, and program Download PDFInfo
- Publication number
- JP2013183207A JP2013183207A JP2012044167A JP2012044167A JP2013183207A JP 2013183207 A JP2013183207 A JP 2013183207A JP 2012044167 A JP2012044167 A JP 2012044167A JP 2012044167 A JP2012044167 A JP 2012044167A JP 2013183207 A JP2013183207 A JP 2013183207A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional dct
- conversion
- subscript
- decoding
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラムに関する。 The present invention relates to a video encoding device, a video decoding device, a video encoding method, a video decoding method, and a program.
非特許文献1には、動き補償残差に対する変換方式として、1次元DCT(1次元離散コサイン変換)と、2次元DCT(2次元離散コサイン変換)と、が示されている。そして、1次元DCTの概要として、以下の2つが示されている。
Non-Patent
1つ目は、動き補償残差の自己相関についてである。動き補償残差には、オブジェクト境界などに起因するエッジ成分が多く含まれているため、残差信号は、エッジに沿った1次元の自己相関が高いとも言い得る。このため、エッジに沿って1次元DCTを適用した場合には、冗長度を削減できるが、エッジ方向に対して垂直な方向に1次元DCTを適用した場合には、信号が分散して冗長度を増加させることとなる。 The first is about the autocorrelation of the motion compensation residual. Since the motion compensation residual includes many edge components due to object boundaries and the like, it can be said that the residual signal has a high one-dimensional autocorrelation along the edge. Therefore, when the one-dimensional DCT is applied along the edge, the redundancy can be reduced. However, when the one-dimensional DCT is applied in a direction perpendicular to the edge direction, the signal is dispersed and the redundancy is reduced. Will be increased.
2つ目は、エッジに沿った1次元DCTを適用する手法についてである。エッジの方向は一般的には多岐にわたるものであるが、ここでは、変換ブロック内で一方向にのみ存在するものと仮定する。例えば、図6の(a)に示すようにエッジが画素b1〜b4に沿って存在しているものとすると、図6の(b)に示すように画素を並べ替えて、図6の(b)中縦方向に1次元DCTを適用する。 The second is for applying a one-dimensional DCT along the edge. The edge direction is generally diverse, but here it is assumed that it exists in only one direction within the transform block. For example, assuming that edges exist along the pixels b1 to b4 as shown in FIG. 6A, the pixels are rearranged as shown in FIG. ) Apply one-dimensional DCT in the middle and vertical direction.
上述の画素の並べ替えの一例を図7に示す。これら画素の並べ替えは、置換行列を用いることで実現できるため、置換行列を予め複数定義しておく。また、複数の置換行列のそれぞれに、固有の識別子として添字を付与しており、添字を1つ決めると、その添字に一意に対応した置換行列を1つ求めることができるようになっている。 An example of the above-described pixel rearrangement is shown in FIG. Since the rearrangement of these pixels can be realized by using a permutation matrix, a plurality of permutation matrices are defined in advance. Further, a subscript is assigned to each of the plurality of permutation matrices as a unique identifier. When one subscript is determined, one permutation matrix uniquely corresponding to the subscript can be obtained.
非特許文献2には、標準動画像符号化方式が示されており、ピクチャ単位の符号化情報としてPPS(ピクチャーパラメータセット)と、スライス単位の符号化情報としてSH(スライスヘッダ)と、について示されている。
Non-Patent
非特許文献1によれば、符号化装置から復号装置には、サイド情報として、変換ブロックごとに用いられた置換行列を示す添字が伝送される。このため、置換行列そのものを伝送する場合と比べると符号量を削減できるが、置換行列を示す添字を変換ブロックごとに伝送するため、符号量を十分には削減できない場合があった。
According to Non-Patent
また、オブジェクト境界に起因するエッジ成分が動きボケの影響で動き補償残差にほとんど含まれない動画像では、非特許文献1の1次元DCTを適用する前提が成り立たないため、2次元DCTが適用される確率が高くなる。これによれば、サイド情報が増加してしまい、符号量が増加してしまう場合があった。
Further, in a moving image in which the edge component due to the object boundary is hardly included in the motion compensation residual due to the effect of motion blur, the premise of applying the one-dimensional DCT of
そこで、本発明は、上述の課題に鑑みてなされたものであり、動画像符号化装置から動画像復号装置に伝送するサイド情報の増加を抑制して、符号化性能を向上できる動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラムを提供することを目的とする。 Therefore, the present invention has been made in view of the above-described problems, and video coding that can improve coding performance by suppressing an increase in side information transmitted from the video coding device to the video decoding device. An object is to provide an apparatus, a moving picture decoding apparatus, a moving picture encoding method, a moving picture decoding method, and a program.
本発明は、上記の課題を解決するために、以下の事項を提案している。 The present invention proposes the following matters in order to solve the above problems.
(1) 本発明は、動画像(例えば、後述の入力画像に相当)を符号化する動画像符号化装置であって、予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する符号化側記憶手段(例えば、後述の符号化側記憶部に相当)と、前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める適用手段(例えば、図1の変換部3およびコスト算出部6に相当)と、前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する決定手段(例えば、図1のコスト算出部6に相当)と、前記決定手段による決定結果に基づいて、符号化情報(例えば、図1のスライスヘッダに相当)を生成する符号化情報生成手段(例えば、図1のコスト算出部6に相当)と、前記決定手段による決定結果に基づいて、符号化データ(例えば、図1のビットストリームに相当)を生成する符号化手段(例えば、図1のエントロピー符号化部5に相当)と、を備え、前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、前記決定手段は、前記適用手段による適用結果に基づいて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、前記符号化情報生成手段は、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、前記符号化手段は、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成することを特徴とする動画像符号化装置を提案している。
(1) The present invention is a moving image encoding apparatus that encodes a moving image (for example, an input image described later), and can identify a plurality of predetermined bases and each of the plurality of bases. And a plurality of subscripts provided in the encoding side storage means (e.g., corresponding to an encoding side storage unit described later) and each of the plurality of bases is applied to each conversion block to obtain a transform coefficient. Using the application means to be obtained (e.g., equivalent to the
この発明によれば、動画像を符号化する動画像符号化装置に、符号化側記憶手段、適用手段、決定手段、符号化情報生成手段、および符号化手段を設けた。そして、符号化側記憶手段により、予め定められた複数の基底と、これら複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶することとした。また、符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成されるものとした。また、適用手段により、複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求めることとした。また、決定手段により、適用手段による適用結果を用いて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定することとした。また、決定手段により、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定することとした。また、符号化情報生成手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む符号化情報を生成することとした。また、符号化情報生成手段により、2次元DCTのみを適用すると決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む符号化情報を生成することとした。また、符号化手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、決定手段により決定された変換ブロックごとの変換添字候補と、符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると決定手段により決定された場合には、符号化情報を含む符号化データを生成することとした。 According to this invention, the moving image coding apparatus for coding a moving image is provided with the encoding side storage unit, the applying unit, the determining unit, the encoded information generating unit, and the encoding unit. Then, the encoding side storage means stores a plurality of predetermined bases and a plurality of subscripts provided so as to be able to identify each of the plurality of bases. The plurality of bases stored in the encoding-side storage means include a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform), a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform), It shall consist of. In addition, the application means determines the transform coefficient by applying it to each transform block for each of the plurality of bases. Further, the decision means decides whether to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner or to apply only the two-dimensional DCT using the application result of the application means. In addition, when the determination unit determines to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner, an applied one of a plurality of bases is determined for each transform block, and a subscript associated with the determined base Is determined for each conversion block as a conversion subscript candidate, and when it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all the conversion blocks. It was decided. In addition, when the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied in a mixed manner by the encoding information generation unit, information indicating that the one-dimensional DCT and the two-dimensional DCT are applied in combination. It was decided to generate the encoded information including. In addition, when only the two-dimensional DCT is applied by the encoding information generation unit, the determination unit determines that the encoding information including information indicating that only the two-dimensional DCT is applied is generated. In addition, when the encoding unit determines that the one-dimensional DCT and the two-dimensional DCT are mixedly applied by the encoding unit, the conversion index candidate for each conversion block determined by the determination unit, the encoding information, When the determination unit determines that only the two-dimensional DCT is applied, the encoded data including the encoding information is generated.
このため、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定する。そして、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、変換ブロックごとに決定した変換添字候補と、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む符号化情報と、を含む符号化データを生成する。一方、2次元DCTのみを適用すると決定した場合には、2次元DCTのみを適用することを示す情報を含む符号化情報を含む符号化データを生成する。 For this reason, it is determined whether the one-dimensional DCT and the two-dimensional DCT are mixedly applied or only the two-dimensional DCT is applied. When it is determined that the one-dimensional DCT and the two-dimensional DCT are applied together, information indicating that the conversion index candidate determined for each conversion block is applied together with the one-dimensional DCT and the two-dimensional DCT is applied. And encoded data including the encoded information. On the other hand, when it is determined that only the two-dimensional DCT is applied, encoded data including encoded information including information indicating that only the two-dimensional DCT is applied is generated.
このため、2次元DCTのみを適用すると決定した場合には、変換ブロックごとの変換添字候補が符号化データには含まれないことになる。したがって、動画像符号化装置から動画像復号装置に伝送するサイド情報の増加を抑制でき、符号化性能を向上できる。 For this reason, when it is determined that only the two-dimensional DCT is applied, the conversion index candidates for each conversion block are not included in the encoded data. Therefore, an increase in side information transmitted from the video encoding device to the video decoding device can be suppressed, and the encoding performance can be improved.
(2) 本発明は、(1)の動画像符号化装置について、前記決定手段は、変換ブロックごとに、前記複数の基底のそれぞれを適用した場合の符号量(例えば、後述の発生符号量に相当)を求め、求めた符号量を用いて前記変換添字候補を決定することを特徴とする動画像符号化装置を提案している。 (2) The present invention relates to the moving picture coding apparatus according to (1), in which the determining means uses a code amount when each of the plurality of bases is applied for each transform block (for example, a generated code amount described later). And a conversion index candidate is determined using the obtained code amount.
この発明によれば、(1)の動画像符号化装置において、決定手段により、変換ブロックごとに、複数の基底のそれぞれを適用した場合の符号量を求め、求めた符号量を用いて変換添字候補を決定することとした。このため、変換ブロックごとの符号量が少なくなるように、変換ブロックごとに、適用する基底を決定することができる。したがって、符号化性能をさらに向上できる。 According to the present invention, in the moving picture encoding apparatus according to (1), the determining unit obtains the code amount when each of a plurality of bases is applied for each transform block, and uses the obtained code amount to convert the subscript. The candidate was decided. For this reason, the base to be applied can be determined for each transform block so that the code amount for each transform block is reduced. Therefore, the encoding performance can be further improved.
(3) 本発明は、(1)または(2)の動画像符号化装置について、前記決定手段は、変換ブロックごとに、前記複数の基底のそれぞれを適用して符号化した後に復号して復号画像を生成し、当該復号画像と前記動画像との差分(例えば、後述の符号化誤差に相当)を用いて前記変換添字候補を決定することを特徴とする動画像符号化装置を提案している。 (3) The present invention relates to the moving picture encoding apparatus according to (1) or (2), wherein the determining unit performs decoding after applying and encoding each of the plurality of bases for each transform block. Proposing a moving image coding apparatus that generates an image and determines the conversion index candidate using a difference between the decoded image and the moving image (e.g., corresponding to a coding error described later). Yes.
この発明によれば、(1)または(2)の動画像符号化装置において、決定手段により、変換ブロックごとに、複数の基底のそれぞれを適用して符号化した後に復号して復号画像を生成し、復号画像と動画像との差分を用いて変換添字候補を決定することとした。このため、動画像に対する復号画像の変換ブロックごとの劣化が抑制されるように、変換ブロックごとに、適用する基底を決定することができる。したがって、符号化性能をさらに向上できる。 According to the present invention, in the moving image encoding apparatus according to (1) or (2), the determining unit applies each of a plurality of bases for each transform block, and then decodes to generate a decoded image. Thus, the conversion index candidate is determined using the difference between the decoded image and the moving image. For this reason, the base to be applied can be determined for each transform block so that degradation of the decoded image with respect to the moving image for each transform block is suppressed. Therefore, the encoding performance can be further improved.
(4) 本発明は、(1)〜(3)のいずれかの動画像符号化装置について、前記決定手段は、前記1次元DCTに関する複数種類の基底のうち、前記変換添字候補として決定することのできる添字を、予め定め、前記適用手段による適用結果に基づいて、前記1次元DCTに関する複数種類の基底のうち前記変換添字候補として決定することができると予め定めたものと、前記2次元DCTに関する1種類の基底と、中から前記変換添字候補を決定することを特徴とする動画像符号化装置を提案している。 (4) In the moving image encoding device according to any one of (1) to (3), the determination unit determines the conversion subscript candidate among a plurality of types of bases related to the one-dimensional DCT. A subscript that can be determined in advance, based on a result of application by the applying unit, a predetermined one that can be determined as the conversion subscript candidate among a plurality of types of bases related to the one-dimensional DCT, and the two-dimensional DCT Has proposed a moving picture coding apparatus characterized by determining one type of base and a conversion index candidate from among them.
ここで、符号化データを生成する動画像符号化装置と、この符号化データを復号する動画像復号装置とでは、同一の変換ブロックに対して同一の基底を適用する。このため、動画像復号装置は、動画像符号化装置において変換ブロックごとに適用され得る全ての基底を、認識できている必要がある。したがって、動画像符号化装置は、変換ブロックごとに適用することのできる全ての基底についての情報を、予め動画像復号装置に伝送しておく必要がある。 Here, the same base is applied to the same transform block in the video encoding device that generates the encoded data and the video decoding device that decodes the encoded data. For this reason, the video decoding device needs to be able to recognize all bases that can be applied to each transform block in the video encoding device. Therefore, the moving image encoding apparatus needs to transmit in advance information about all bases that can be applied to each transform block to the moving image decoding apparatus.
そこで、この発明によれば、(1)〜(3)のいずれかの動画像符号化装置において、決定手段により、まず、1次元DCTに関する複数種類の基底のうち、変換添字候補として決定することのできる添字を、予め定めることとした。次に、適用手段による適用結果に基づいて、1次元DCTに関する複数種類の基底のうち変換添字候補として決定することができると予め定めたものと、2次元DCTに関する1種類の基底と、中から変換添字候補を決定することとした。これによれば、動画像符号化装置が変換ブロックごとに適用することのできる基底の種類は、限定される。このため、動画像符号化装置から動画像復号装置に伝送する基底についての情報量を、削減できるので、符号化性能をさらに向上できる。 Therefore, according to the present invention, in the moving picture encoding apparatus according to any one of (1) to (3), the determining unit first determines a conversion subscript candidate from a plurality of types of bases related to the one-dimensional DCT. The subscript that can be used is determined in advance. Next, based on the application result of the application means, a predetermined one that can be determined as a conversion index candidate among a plurality of types of bases related to the one-dimensional DCT, one type of bases related to the two-dimensional DCT, The conversion index candidate was decided. According to this, the types of bases that can be applied to each transform block by the video encoding device are limited. For this reason, since the amount of information about the base transmitted from the video encoding device to the video decoding device can be reduced, the encoding performance can be further improved.
(5) 本発明は、(1)〜(4)のいずれかの動画像符号化装置において生成された符号化データを復号する動画像復号装置であって、前記複数の基底および前記複数の添字を記憶する復号側記憶手段(例えば、後述の復号側記憶部に相当)と、前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する復号手段(例えば、図5のエントロピー復号部101に相当)と、前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する添字復号手段(例えば、図5の添字復号部103に相当)と、を備え、前記添字復号手段は、前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得することを特徴とする動画像復号装置を提案している。 (5) The present invention is a moving picture decoding apparatus that decodes encoded data generated by the moving picture encoding apparatus according to any one of (1) to (4), wherein the plurality of bases and the plurality of subscripts are used. Decoding side storage means (for example, corresponding to a decoding side storage unit described later) and decoding means for decoding the encoded data and obtaining the conversion index candidate and the encoding information (for example, FIG. 5) Subscript decoding means (for example, FIG. 5) that obtains conversion subscripts based on the entropy decoding unit 101), conversion subscript candidates acquired by the decoding means, and encoded information acquired by the decoding means. The subscript decoding means includes information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied to the encoded information acquired by the decoding means. The conversion subscript candidate acquired by the decoding unit is acquired as the conversion subscript for each conversion block, and only the two-dimensional DCT is applied to the encoded information acquired by the decoding unit. In the case where information is included, for all transform blocks, among the plurality of subscripts stored in the decoding-side storage means, those associated with one type of base related to the two-dimensional DCT The video decoding device is characterized in that it is acquired as the conversion subscript.
この発明によれば、(1)〜(4)のいずれかの動画像符号化装置において生成された符号化データを復号する動画像復号装置に、復号側記憶手段、復号手段、および添字復号手段を設けた。そして、復号側記憶手段により、複数の基底および複数の添字を記憶することとした。また、復号手段により、符号化データを復号して、変換添字候補および符号化情報を取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、復号手段により取得された変換添字候補を変換添字として取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、復号側記憶手段に記憶されている複数の添字のうち、2次元DCTに関する1種類の基底に対応付けられたものを、変換添字として取得することとした。 According to the present invention, the moving picture decoding apparatus for decoding the encoded data generated by the moving picture encoding apparatus according to any one of (1) to (4) includes the decoding side storage means, the decoding means, and the subscript decoding means. Was provided. The decoding side storage means stores a plurality of bases and a plurality of subscripts. In addition, the encoded data is decoded by the decoding means to obtain conversion subscript candidates and encoding information. Further, when the subscript decoding means includes information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied to the encoded information acquired by the decoding means, the decoding is performed for each transform block. The conversion index candidate acquired by the means is acquired as a conversion index. In addition, when the subscript decoding means includes information indicating that only the two-dimensional DCT is applied to the encoded information acquired by the decoding means, the decoding side storage means for all transform blocks Among the plurality of subscripts stored in the table, one associated with one type of base related to the two-dimensional DCT is acquired as a conversion subscript.
このため、変換ブロックごとに、動画像符号化装置で適用された基底と同一の基底を変換添字として取得して、符号化データの復号に用いることができる。 For this reason, for each transform block, the same base as the base applied by the moving image coding apparatus can be acquired as a transform subscript and used for decoding the encoded data.
(6) 本発明は、(5)の動画像復号装置について、前記復号手段は、前記符号化情報を取得した後に前記動画像復号装置が受信した前記符号化データを復号して、前記変換添字候補を取得することを特徴とする動画像復号装置を提案している。 (6) In the moving picture decoding apparatus according to (5), the decoding unit decodes the encoded data received by the moving picture decoding apparatus after obtaining the encoded information, and converts the converted subscript. A video decoding apparatus characterized by acquiring candidates is proposed.
この発明によれば、(5)の動画像復号装置において、復号手段により、符号化情報を取得した後に動画像復号装置が受信した符号化データを復号して、変換添字候補を取得することとした。これによれば、上述した効果と同様の効果を奏することができる。 According to the present invention, in the moving picture decoding apparatus according to (5), the decoding means obtains the conversion index candidate by decoding the encoded data received by the moving picture decoding apparatus after obtaining the encoded information. did. According to this, an effect similar to the effect mentioned above can be produced.
(7) 本発明は、符号化側記憶手段(例えば、後述の符号化側記憶部に相当)、適用手段(例えば、図1の変換部3およびコスト算出部6に相当)、決定手段(例えば、図1のコスト算出部6に相当)、符号化情報生成手段(例えば、図1のコスト算出部6に相当)、および符号化手段(例えば、図1のエントロピー符号化部5に相当)を備え、動画像(例えば、後述の入力画像に相当)を符号化する動画像符号化装置における動画像復号方法であって、前記符号化側記憶手段が、予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する第1のステップと、前記適用手段が、前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める第2のステップと、前記決定手段が、前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する第3のステップと、前記符号化情報生成手段が、前記決定手段による決定結果に基づいて、符号化情報(例えば、図1のスライスヘッダに相当)を生成する第4のステップと、前記符号化手段が、前記決定手段による決定結果に基づいて、符号化データ(例えば、図1のビットストリームに相当)を生成する第5のステップと、を備え、前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、前記第3のステップでは、前記決定手段が、前記適用手段による適用結果に基づいて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、前記第4のステップでは、符号化情報生成手段が、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、前記第5のステップでは、前記符号化手段が、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成することを特徴とする動画像符号化方法を提案している。
(7) The present invention includes an encoding-side storage unit (for example, equivalent to an encoding-side storage unit described later), an application unit (for example, equivalent to the
この発明によれば、符号化側記憶手段により、予め定められた複数の基底と、これら複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶することとした。また、符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成されるものとした。また、適用手段により、複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求めることとした。また、決定手段により、適用手段による適用結果を用いて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定することとした。また、決定手段により、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定することとした。また、符号化情報生成手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む符号化情報を生成することとした。また、符号化情報生成手段により、2次元DCTのみを適用すると決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む符号化情報を生成することとした。また、符号化手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、決定手段により決定された変換ブロックごとの変換添字候補と、符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると決定手段により決定された場合には、符号化情報を含む符号化データを生成することとした。このため、上述した効果と同様の効果を奏することができる。 According to the present invention, the encoding side storage means stores a plurality of predetermined bases and a plurality of subscripts provided so as to be able to identify each of the plurality of bases. The plurality of bases stored in the encoding-side storage means include a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform), a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform), It shall consist of. In addition, the application means determines the transform coefficient by applying it to each transform block for each of the plurality of bases. Further, the decision means decides whether to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner or to apply only the two-dimensional DCT using the application result of the application means. In addition, when the determination unit determines to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner, an applied one of a plurality of bases is determined for each transform block, and a subscript associated with the determined base Is determined for each conversion block as a conversion subscript candidate, and when it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all the conversion blocks. It was decided. In addition, when the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied in a mixed manner by the encoding information generation unit, information indicating that the one-dimensional DCT and the two-dimensional DCT are applied in combination. It was decided to generate the encoded information including. In addition, when only the two-dimensional DCT is applied by the encoding information generation unit, the determination unit determines that the encoding information including information indicating that only the two-dimensional DCT is applied is generated. In addition, when the encoding unit determines that the one-dimensional DCT and the two-dimensional DCT are mixedly applied by the encoding unit, the conversion index candidate for each conversion block determined by the determination unit, the encoding information, When the determination unit determines that only the two-dimensional DCT is applied, the encoded data including the encoding information is generated. For this reason, the effect similar to the effect mentioned above can be produced.
(8) 本発明は、復号側記憶手段(例えば、後述の復号側記憶部に相当)、復号手段(例えば、図5のエントロピー復号部101に相当)、および添字復号手段(例えば、図5の添字復号部103に相当)を備え、(7)に記載の動画像符号化装置において生成された符号化データを復号する動画像復号装置における動画像復号方法であって、前記復号側記憶手段が、前記複数の基底および前記複数の添字を記憶する第6のステップと、前記復号手段が、前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する第7のステップと、前記添字復号手段が、前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する第8のステップと、を備え、前記第7のステップでは、前記添字復号手段が、前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得することを特徴とする動画像復号方法を提案している。
(8) The present invention provides a decoding-side storage means (for example, equivalent to a later-described decoding-side storage section), a decoding means (for example, equivalent to the
この発明によれば、復号側記憶手段により、複数の基底および複数の添字を記憶することとした。また、復号手段により、符号化データを復号して、変換添字候補および符号化情報を取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、復号手段により取得された変換添字候補を変換添字として取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、復号側記憶手段に記憶されている複数の添字のうち、2次元DCTに関する1種類の基底に対応付けられたものを、変換添字として取得することとした。このため、上述した効果と同様の効果を奏することができる。 According to this invention, the decoding side storage means stores a plurality of bases and a plurality of subscripts. In addition, the encoded data is decoded by the decoding means to obtain conversion subscript candidates and encoding information. Further, when the subscript decoding means includes information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied to the encoded information acquired by the decoding means, the decoding is performed for each transform block. The conversion index candidate acquired by the means is acquired as a conversion index. In addition, when the subscript decoding means includes information indicating that only the two-dimensional DCT is applied to the encoded information acquired by the decoding means, the decoding side storage means for all transform blocks Among the plurality of subscripts stored in the table, one associated with one type of base related to the two-dimensional DCT is acquired as a conversion subscript. For this reason, the effect similar to the effect mentioned above can be produced.
(9) 本発明は、符号化側記憶手段(例えば、後述の符号化側記憶部に相当)、適用手段(例えば、図1の変換部3およびコスト算出部6に相当)、決定手段(例えば、図1のコスト算出部6に相当)、符号化情報生成手段(例えば、図1のコスト算出部6に相当)、および符号化手段(例えば、図1のエントロピー符号化部5に相当)を備え、動画像(例えば、後述の入力画像に相当)を符号化する動画像符号化装置における動画像復号方法を、コンピュータに実行させるためのプログラムであって、前記符号化側記憶手段が、予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する第1のステップと、前記適用手段が、前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める第2のステップと、前記決定手段が、前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する第3のステップと、前記符号化情報生成手段が、前記決定手段による決定結果に基づいて、符号化情報(例えば、図1のスライスヘッダに相当)を生成する第4のステップと、前記符号化手段が、前記決定手段による決定結果に基づいて、符号化データ(例えば、図1のビットストリームに相当)を生成する第5のステップと、をコンピュータに行わせ、前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、前記第3のステップでは、前記決定手段が、前記適用手段による適用結果に基づいて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、前記第4のステップでは、符号化情報生成手段が、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、前記第5のステップでは、前記符号化手段が、1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成するためのプログラムを提案している。
(9) The present invention includes an encoding-side storage unit (for example, equivalent to an encoding-side storage unit described later), an application unit (for example, equivalent to the
この発明によれば、プログラムを実行することで、符号化側記憶手段により、予め定められた複数の基底と、これら複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶することとした。また、符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成されるものとした。また、適用手段により、複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求めることとした。また、決定手段により、適用手段による適用結果を用いて、1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定することとした。また、決定手段により、1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定することとした。また、符号化情報生成手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む符号化情報を生成することとした。また、符号化情報生成手段により、2次元DCTのみを適用すると決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む符号化情報を生成することとした。また、符号化手段により、1次元DCTおよび2次元DCTを混在して適用すると決定手段により決定された場合には、決定手段により決定された変換ブロックごとの変換添字候補と、符号化情報と、を含む符号化データを生成し、2次元DCTのみを適用すると決定手段により決定された場合には、符号化情報を含む符号化データを生成することとした。このため、上述した効果と同様の効果を奏することができる。 According to this invention, by executing the program, the encoding-side storage unit stores a plurality of predetermined bases and a plurality of subscripts provided so as to be able to identify each of the plurality of bases. It was decided. The plurality of bases stored in the encoding-side storage means include a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform), a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform), It shall consist of. In addition, the application means determines the transform coefficient by applying it to each transform block for each of the plurality of bases. Further, the decision means decides whether to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner or to apply only the two-dimensional DCT using the application result of the application means. In addition, when the determination unit determines to apply the one-dimensional DCT and the two-dimensional DCT in a mixed manner, an applied one of a plurality of bases is determined for each transform block, and a subscript associated with the determined base Is determined for each conversion block as a conversion subscript candidate, and when it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all the conversion blocks. It was decided. In addition, when the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied in a mixed manner by the encoding information generation unit, information indicating that the one-dimensional DCT and the two-dimensional DCT are applied in combination. It was decided to generate the encoded information including. In addition, when only the two-dimensional DCT is applied by the encoding information generation unit, the determination unit determines that the encoding information including information indicating that only the two-dimensional DCT is applied is generated. In addition, when the encoding unit determines that the one-dimensional DCT and the two-dimensional DCT are mixedly applied by the encoding unit, the conversion index candidate for each conversion block determined by the determination unit, the encoding information, When the determination unit determines that only the two-dimensional DCT is applied, the encoded data including the encoding information is generated. For this reason, the effect similar to the effect mentioned above can be produced.
(10) 本発明は、復号側記憶手段(例えば、後述の復号側記憶部に相当)、復号手段(例えば、図5のエントロピー復号部101に相当)、および添字復号手段(例えば、図5の添字復号部103に相当)を備え、(9)に記載の動画像符号化装置において生成された符号化データを復号する動画像復号装置における動画像復号方法を、コンピュータに実行させるためのプログラムであって、前記復号側記憶手段が、前記複数の基底および前記複数の添字を記憶する第6のステップと、前記復号手段が、前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する第7のステップと、前記添字復号手段が、前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する第8のステップと、をコンピュータに実行させ、前記第7のステップでは、前記添字復号手段が、前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得するためのプログラムを提案している。
(10) The present invention provides a decoding-side storage means (for example, equivalent to a later-described decoding-side storage section), a decoding means (for example, equivalent to the
この発明によれば、プログラムを実行することで、復号側記憶手段により、複数の基底および複数の添字を記憶することとした。また、復号手段により、符号化データを復号して、変換添字候補および符号化情報を取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、復号手段により取得された変換添字候補を変換添字として取得することとした。また、添字復号手段により、復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、復号側記憶手段に記憶されている複数の添字のうち、2次元DCTに関する1種類の基底に対応付けられたものを、変換添字として取得することとした。このため、上述した効果と同様の効果を奏することができる。 According to the present invention, a plurality of bases and a plurality of subscripts are stored in the decoding-side storage unit by executing the program. In addition, the encoded data is decoded by the decoding means to obtain conversion subscript candidates and encoding information. Further, when the subscript decoding means includes information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied to the encoded information acquired by the decoding means, the decoding is performed for each transform block. The conversion index candidate acquired by the means is acquired as a conversion index. In addition, when the subscript decoding means includes information indicating that only the two-dimensional DCT is applied to the encoded information acquired by the decoding means, the decoding side storage means for all transform blocks Among the plurality of subscripts stored in the table, one associated with one type of base related to the two-dimensional DCT is acquired as a conversion subscript. For this reason, the effect similar to the effect mentioned above can be produced.
本発明によれば、動画像符号化装置から動画像復号装置に伝送するサイド情報の増加を抑制して、符号化性能を向上できる。 ADVANTAGE OF THE INVENTION According to this invention, the increase in the side information transmitted to a moving image decoding apparatus from a moving image encoding apparatus can be suppressed, and encoding performance can be improved.
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. Note that the constituent elements in the following embodiments can be appropriately replaced with existing constituent elements and the like, and various variations including combinations with other existing constituent elements are possible. Accordingly, the description of the following embodiments does not limit the contents of the invention described in the claims.
[動画像符号化装置AAの構成]
図1は、本発明の一実施形態に係る動画像符号化装置AAの構成を示すブロック図である。動画像符号化装置AAは、動き補償部1、添字候補部2、変換部3、逆変換部4、エントロピー符号化部5、コスト算出部6、および図示しない符号化側記憶部を備える。
[Configuration of Moving Image Encoding Device AA]
FIG. 1 is a block diagram showing a configuration of a moving picture coding apparatus AA according to an embodiment of the present invention. The moving image coding apparatus AA includes a
符号化側記憶部は、予め定められた複数の基底と、これら複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶している。ここで、複数の基底は、1次元DCTまたは2次元DCTと、置換行列と、で構成されている。また、置換行列は、図6を用いて上述したようにエッジに沿った画素を一列に並べ替えるために、変換ブロックサイズに応じて予め定められている。すなわち、置換行列は、変換ブロックに含まれるエッジ方向に対応している。また、1次元DCTは、変換ブロックサイズに応じて定められている。なお、1次元DCTは、変換ブロックの大きさ、すなわち係数の個数にのみ依存するため、置換行列が定まれば、これに応じて1次元DCTも定まることとなる。また、2次元DCTは、エッジ方向を考慮しないために置換行列はなく、変換ブロックサイズに応じて1つ定められている。 The encoding side storage unit stores a plurality of predetermined bases and a plurality of subscripts provided so as to identify each of the plurality of bases. Here, the plurality of bases are composed of a one-dimensional DCT or a two-dimensional DCT and a permutation matrix. Further, the permutation matrix is determined in advance according to the transform block size in order to rearrange the pixels along the edge in a line as described above with reference to FIG. That is, the permutation matrix corresponds to the edge direction included in the transform block. The one-dimensional DCT is determined according to the transform block size. Since the one-dimensional DCT depends only on the size of the transform block, that is, the number of coefficients, if the permutation matrix is determined, the one-dimensional DCT is also determined accordingly. In addition, since the two-dimensional DCT does not consider the edge direction, there is no permutation matrix and one is determined according to the transform block size.
動き補償部1には、入力画像およびデコード画像が入力される。ここで、デコード画像とは、デコード済みのフレームのことである。この動き補償部1は、これら入力に基づいて変換ブロックにおける動きベクトルを求め、求めた動きベクトルを用いて動き補償の参照ブロックを決定し、決定した参照ブロックおよび動きベクトルを出力する。
An input image and a decoded image are input to the
添字候補部2には、コスト算出部6から出力された後述の選択信号が入力される。この添字候補部2は、変換ブロックごとに、選択信号に応じて複数の基底の中から最適な1つを決定し、決定した基底に対応付けられた添字を出力する。
The
変換部3には、添字候補部2から出力された添字が入力されるとともに、入力画像と、動き補償部1から出力された参照ブロックと、の差分が入力される。この変換部3は、変換ブロックに対応した基底を用いて、入力画像と参照ブロックとの差分に対して処理を行って、変換係数を出力する。変換部3の具体的な動作については、図2を用いて以下に説明する。
The subscript output from the
図2では、2次元DCTに関する1種類の基底と、1次元DCTに関するN種類の基底(Nは、N≧1を満たす整数)と、が符号化側記憶部に記憶されている場合を示している。変換部3は、まず、添字候補部2から出力された添字に対応付けられた基底を、符号化側記憶部に記憶されている複数の基底の中から選び出す。次に、選び出した基底が2次元DCTに関するものである場合には、この選び出した基底を用いて、入力画像と参照ブロックとの差分に対して2D変換および量子化を適用して、変換係数として出力する。また、選び出した基底が1次元DCTに関するものである場合には、この選び出した基底を用いて、入力画像と参照ブロックとの差分に対して置換、1D変換、量子化を適用して、変換係数として出力する。
FIG. 2 shows a case where one type of base related to the two-dimensional DCT and N types of bases related to the one-dimensional DCT (N is an integer satisfying N ≧ 1) are stored in the encoding side storage unit. Yes. First, the
図1に戻って、逆変換部4には、添字候補部2から出力された添字と、変換部3から出力された変換係数と、が入力される。この逆変換部4は、変換ブロックに対応した基底を用いて、変換部3から出力された変換係数に対して処理を行って、出力する。逆変換部4からの出力と、動き補償部1から出力された参照ブロックと、の和は、デコード画像として動き補償部1およびコスト算出部6に入力される。逆変換部4の具体的な動作については、図3を用いて以下に説明する。
Returning to FIG. 1, the
図3では、図2と同様に、2次元DCTに関する1種類の基底と、1次元DCTに関するN種類の基底と、が符号化側記憶部に記憶されている場合を示している。逆変換部4は、まず、添字候補部2から出力された添字に対応付けられた基底を、符号化側記憶部に記憶されている複数の基底の中から選び出す。次に、選び出した基底が2次元DCTに関するものである場合には、この選び出した基底を用いて、変換部3から出力された変換係数に対して逆量子化および2D逆変換を適用する。また、選び出した基底が1次元DCTに関するものである場合には、この選び出した基底を用いて、変換部3から出力された変換係数に対して逆量子化、1D逆変換、逆置換を適用する。
FIG. 3 shows a case where one type of base related to the two-dimensional DCT and N types of bases related to the one-dimensional DCT are stored in the encoding-side storage unit, as in FIG. The
図1に戻って、コスト算出部6には、動き補償部1に入力されるデコード画像と、入力画像と、エントロピー符号化部5から出力されたビットストリームと、が入力される。このコスト算出部6は、変換ブロックごとに、最適な基底を決定する。
Returning to FIG. 1, the decoded image input to the
具体的には、コスト算出部6は、まず、1次元DCTに関する基底および2次元DCTに関する基底ごとに、各変換ブロックに適用した場合のコスト値を、数式(1)を用いて算出する。そして、変換ブロックごとに、コスト値が最小となる基底を求め、各変換ブロックのコスト値の最小値を、フレーム全体で合算する。これによれば、処理フレームに対して1D変換および2D変換を混在して適用した場合のコスト値が求められることになる。 Specifically, the cost calculation unit 6 first calculates the cost value when applied to each transform block for each basis regarding the one-dimensional DCT and the basis regarding the two-dimensional DCT, using Equation (1). Then, for each transform block, a base that minimizes the cost value is obtained, and the minimum cost value of each transform block is added up for the entire frame. According to this, the cost value when 1D conversion and 2D conversion are mixedly applied to the processing frame is obtained.
なお、数式(1)において、発生符号量とは、ビットストリームの長さのことである。また、λは、予め定められた係数のことである。また、符号化誤差とは、入力画像と復号画像との差分のことである。また、復号画像とは、コスト値を算出する基底を用いて入力画像を符号化した後に、符号化した結果を復号することにより生成されるもののことである。 In Equation (1), the generated code amount is the length of the bit stream. Λ is a predetermined coefficient. The coding error is a difference between the input image and the decoded image. A decoded image is generated by encoding an input image using a basis for calculating a cost value and then decoding the encoded result.
また、コスト算出部6は、2次元DCTに関する基底を変換ブロックごとに適用した場合のコスト値を、数式(1)を用いて算出する。そして、求めたコスト値を、フレーム全体で合算する。これによれば、処理フレームに対して2D変換のみを適用した場合のコスト値が求められることになる。 In addition, the cost calculation unit 6 calculates a cost value in the case where a basis related to the two-dimensional DCT is applied for each transform block, using Expression (1). Then, the obtained cost values are added up for the entire frame. According to this, the cost value when only 2D conversion is applied to the processing frame is obtained.
コスト算出部6は、次に、処理フレームに対して1D変換および2D変換を混在して適用した場合のコスト値と、処理フレームに対して2D変換のみを適用した場合のコスト値と、のうち、コスト値の小さい方を処理フレームに対して適用することとする。具体的には、処理フレームに対して1D変換および2D変換を混在して適用した場合のコスト値の方が小さい場合には、変換ブロックごとにコスト値が最小となる基底を用いて変換を行うものと決定し、決定した基底に対応付けられた添字を、上述の選択信号として出力する。一方、処理フレームに対して2D変換のみを適用した場合のコスト値の方が小さい場合には、処理フレームに対して2次元DCTに関する基底を用いて変換を行うものと決定し、決定した基底に対応付けられた添字を、上述の選択信号として出力する。 Next, the cost calculation unit 6 includes a cost value when 1D conversion and 2D conversion are mixedly applied to the processing frame, and a cost value when only 2D conversion is applied to the processing frame. The one with the smaller cost value is applied to the processing frame. Specifically, when the cost value when the 1D conversion and the 2D conversion are mixedly applied to the processing frame is smaller, the conversion is performed using the basis that minimizes the cost value for each conversion block. The subscript associated with the determined base is output as the selection signal. On the other hand, when the cost value when only 2D conversion is applied to the processing frame is smaller, it is determined that the processing frame is converted using the basis related to the two-dimensional DCT, and the determined base is used. The associated subscript is output as the above-described selection signal.
また、コスト算出部6は、図4に示すSH(スライスヘッダ)のフラグ「trans_dim_type」に、変換種別を示す値を記述する。 In addition, the cost calculation unit 6 describes a value indicating the conversion type in the SH (slice header) flag “trans_dim_type” illustrated in FIG. 4.
図4は、動画像符号化装置AAから出力されるスライスヘッダの一部を示す図である。フラグ「first_mb_in_slice」は、スライス中に存在する最初のマクロブロックが、画面全体では何番目に該当するかを示す。フラグ「slice_type」は、スライスの種類を示すもので、Iスライス、Pスライス、Bスライスのいずれかを示す。フラグ「pic_parameter_set_id」は、PPS(ピクチャーパラメータセット)のうち、このスライスで利用する番号(ID)を示す。フラグ「slice_qp_delta」は、スライス中のマクロブロックに適用する量子化ステップについて、現在の量子化ステップと、このスライスにおける量子化ステップと、の差を示す。 FIG. 4 is a diagram illustrating a part of a slice header output from the video encoding device AA. The flag “first_mb_in_slice” indicates the position of the first macroblock existing in the slice corresponding to the entire screen. The flag “slice_type” indicates the type of slice, and indicates any of an I slice, a P slice, and a B slice. The flag “pic_parameter_set_id” indicates a number (ID) used in this slice in the PPS (Picture Parameter Set). The flag “slice_qp_delta” indicates the difference between the current quantization step and the quantization step in this slice for the quantization step applied to the macroblock in the slice.
フラグ「trans_dim_type」は、変換種別、すなわち1D変換および2D変換を混在して適用するのか、2D変換のみを適用するのか、を示す。具体的には、フラグ「trans_dim_type」が「0」である場合には、2D変換のみを適用することを示す。一方、フラグ「trans_dim_type」が「1」の場合には、1D変換および2D変換を混在して適用することを示す。 The flag “trans_dim_type” indicates a conversion type, that is, whether 1D conversion and 2D conversion are mixedly applied or only 2D conversion is applied. Specifically, when the flag “trans_dim_type” is “0”, it indicates that only 2D conversion is applied. On the other hand, when the flag “trans_dim_type” is “1”, it indicates that 1D conversion and 2D conversion are applied together.
図1に戻って、エントロピー符号化部5には、変換部3から出力された変換係数と、添字候補部2から出力された変換添字と、動き補償部1から出力された動きベクトルと、変換種別を示す値が記述されたスライスヘッダと、が入力される。このエントロピー符号化部5は、入力された信号を符号化して、ビットストリームを出力する。
Returning to FIG. 1, the entropy encoding unit 5 converts the conversion coefficient output from the
ただし、エントロピー符号化部5は、スライスヘッダに記述された変換種別を示す値によっては、添字候補部2から出力された変換添字をビットストリームに含めない。具体的には、エントロピー符号化部5は、スライスヘッダのフラグ「trans_dim_type」が「0」である場合には、符号化する信号の中から変換添字を除外して、ビットストリームを出力する。
However, the entropy encoding unit 5 does not include the conversion subscript output from the
[動画像復号装置BBの構成]
図5は、本発明の一実施形態に係る動画像復号装置BBの構成を示すブロック図である。動画像復号装置BBは、エントロピー復号部101、逆変換部102、添字復号部103、動き補償部104、および図示しない復号側記憶部を備えており、動画像符号化装置AAにおいて生成されたビットストリームを復号する。
[Configuration of Video Decoding Device BB]
FIG. 5 is a block diagram showing a configuration of a video decoding device BB according to an embodiment of the present invention. The video decoding device BB includes an
復号側記憶部は、予め定められた複数の基底と、これら複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶している。復号側記憶部に記憶されている複数の基底および複数の添字は、上述の符号化側記憶部に記憶されている複数の基底および複数の添字と、同一である。 The decoding-side storage unit stores a plurality of predetermined bases and a plurality of subscripts provided so as to identify each of the plurality of bases. The plurality of bases and the plurality of subscripts stored in the decoding-side storage unit are the same as the plurality of bases and the plurality of subscripts stored in the above-described encoding-side storage unit.
エントロピー復号部101には、ビットストリームが入力される。このエントロピー復号部101は、入力されたビットストリームを復号して、変換係数、変換添字候補、スライスヘッダ、および動きベクトルを取得して出力する。なお、エントロピー復号部101は、変換係数および変換添字候補については、スライスヘッダを取得した後に動画像復号装置BBが受信したビットストリームを復号して、取得する。
The
添字復号部103には、エントロピー復号部101から出力された変換添字候補およびスライスヘッダが入力される。この添字復号部103は、スライスヘッダに含まれる変換種別が単一種類の基底である場合、すなわち上述のコスト算出部6において2D変換のみを適用すると決定された場合には、2次元DCTに関する基底に対応付けられた添字を、変換添字候補によらず変換添字として出力する。一方、スライスヘッダに含まれる変換種別が複数種類の基底である場合、すなわち上述のコスト算出部6において1D変換および2D変換を混在して適用すると決定された場合には、変換添字候補を変換添字として出力する。
The
逆変換部102には、エントロピー復号部101から出力された変換係数と、添字復号部103から出力された変換添字と、が入力される。この逆変換部102は、まず、変換添字に対応付けられた基底を、上述の復号側記憶部に記憶されている複数の基底の中から選び出す。次に、選び出した基底が1次元DCTに関するものである場合には、この選び出した基底を用いて、変換係数に対して逆量子化、1D逆変換、および逆置換を適用して、動き補償残差を出力する。また、選び出した基底が2次元DCTに関するものである場合には、この選び出した基底を用いて、変換係数に対して逆量子化および2D逆変換を適用して、動き補償残差を出力する。そして、動き補償残差と、動き補償部104から出力された後述の動き補償信号と、を加算したものが、デコード画像として動画像復号装置BBから出力される。
The
動き補償部104には、エントロピー復号部101から出力された動きベクトルと、デコード画像と、が入力される。この動き補償部104は、デコード画像に対して動きベクトル用いて動き補償を適用して、動き補償信号を出力する。
The
以上の動画像符号化装置AAによれば、変換ブロックごとに、適用する基底を決定する。そして、フレーム内の変換ブロックのうち少なくとも一部で1次元DCTに関する基底を決定した場合には、変換ブロックごとに決定した基底に対応付けられた変換添字候補と、動画像と、決定した基底が変換ブロックごとに異なることを示す情報を含むスライスヘッダと、を符号化してビットストリームを生成する。一方、フレーム内の全ての変換ブロックにおいて2次元DCTに関する基底を決定した場合には、動画像と、決定した基底がフレーム内の全ての変換ブロックにおいて同一であることを示す情報を含むスライスヘッダと、を符号化してビットストリームを生成する。このため、フレーム内の全ての変換ブロックにおいて2次元DCTに関する基底を決定した場合には、変換添字候補がビットストリームに含まれない。したがって、動画像符号化装置AAから動画像復号装置BBに伝送するサイド情報の増加を抑制でき、符号化性能を向上できる。 According to the above moving picture coding apparatus AA, the base to be applied is determined for each transform block. Then, when the basis regarding the one-dimensional DCT is determined in at least a part of the transform blocks in the frame, the transform index candidate associated with the basis determined for each transform block, the moving image, and the determined basis are A bit stream is generated by encoding a slice header including information indicating that each transform block is different. On the other hand, when bases related to the two-dimensional DCT are determined in all transform blocks in the frame, a moving image and a slice header including information indicating that the determined base is the same in all transform blocks in the frame; Are encoded to generate a bitstream. For this reason, when bases relating to the two-dimensional DCT are determined in all transform blocks in the frame, transform subscript candidates are not included in the bitstream. Therefore, an increase in side information transmitted from the moving image encoding device AA to the moving image decoding device BB can be suppressed, and the encoding performance can be improved.
また、動画像符号化装置AAによれば、変換ブロックごとに、複数の基底のそれぞれを適用した場合の発生符号量を求め、数式(1)に示したように、求めた発生符号量を用いて、変換ブロックごとに変換添字候補を決定する。このため、変換ブロックごとの発生符号量が少なくなるように、変換ブロックごとに、適用する基底を決定することができる。したがって、符号化性能をさらに向上できる。 Further, according to the moving picture coding apparatus AA, for each transform block, a generated code amount when each of a plurality of bases is applied is obtained, and the obtained generated code amount is used as shown in Equation (1). Thus, a conversion index candidate is determined for each conversion block. For this reason, the base to be applied can be determined for each transform block so that the generated code amount for each transform block is reduced. Therefore, the encoding performance can be further improved.
また、動画像符号化装置AAによれば、変換ブロックごとに、複数の基底のそれぞれを適用して符号化した後に復号して復号画像を生成し、数式(1)に示したように、復号画像と入力画像との差分を用いて、変換ブロックごとに変換添字候補を決定する。このため、入力画像に対する復号画像の変換ブロックごとの劣化が抑制されるように、変換ブロックごとに、適用する基底を決定することができる。したがって、符号化性能をさらに向上できる。 Also, according to the moving image encoding apparatus AA, for each transform block, each of a plurality of bases is applied and encoded, and then decoded to generate a decoded image. As shown in Equation (1), decoding is performed. Using the difference between the image and the input image, a conversion index candidate is determined for each conversion block. For this reason, the base to be applied can be determined for each transform block so that the degradation of the decoded image with respect to the input image for each transform block is suppressed. Therefore, the encoding performance can be further improved.
また、動画像復号装置BBによれば、ビットストリームを復号してスライスヘッダおよび変換添字候補を取得する。そして、スライスヘッダに含まれる変換種別が単一種類の基底である場合、すなわち上述のコスト算出部6において2D変換のみを適用すると決定された場合には、2次元DCTに関する基底に対応付けられた添字を、変換添字候補によらず変換添字とし、変換ブロックごとに適用する。一方、スライスヘッダに含まれる変換種別が複数種類の基底である場合、すなわち上述のコスト算出部6において1D変換および2D変換を混在して適用すると決定された場合には、変換添字候補を変換添字とし、変換ブロックごとに適用する。このため、変換ブロックごとに、動画像符号化装置AAで適用された基底と同一の基底を適用して、符号化データを復号できる。 Also, according to the video decoding device BB, the bit stream is decoded to obtain the slice header and conversion subscript candidates. When the conversion type included in the slice header is a single type of base, that is, when it is determined that only the 2D conversion is applied in the cost calculation unit 6 described above, the base is associated with the base related to the two-dimensional DCT. Subscripts are converted into subscripts regardless of conversion subscript candidates, and are applied to each conversion block. On the other hand, when the conversion types included in the slice header are a plurality of types of bases, that is, when the cost calculation unit 6 determines to apply 1D conversion and 2D conversion in a mixed manner, conversion subscript candidates are converted into conversion subscripts. And applied to each transform block. For this reason, the encoded data can be decoded by applying the same base as the base applied by the video encoding device AA for each transform block.
なお、本発明の動画像符号化装置AAの処理や動画像復号装置BBの処理を、コンピュータ読み取り可能な記録媒体に記憶し、記録媒体に記録されたプログラムを動画像符号化装置AAや動画像復号装置BBに読み込ませ、実行することによって、本発明を実現できる。 Note that the processing of the moving image encoding device AA and the processing of the moving image decoding device BB of the present invention are stored in a computer-readable recording medium, and the program recorded on the recording medium is stored in the moving image encoding device AA or the moving image. The present invention can be realized by causing the decryption apparatus BB to read and execute it.
また、上述のプログラムは、このプログラムを記憶装置などに格納した動画像符号化装置AAや動画像復号装置BBから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。 In addition, the above-described program is transferred from the video encoding device AA or the video decoding device BB storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. May be transmitted. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置AAや動画像復号装置BBにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 Further, the above-described program may be for realizing a part of the above-described function. Furthermore, what can implement | achieve the above-mentioned function in combination with the program already recorded on the moving image encoder AA and the moving image decoder BB, what is called a difference file (difference program) may be sufficient.
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。 The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design that does not depart from the gist of the present invention.
例えば、上述の実施形態では、1D変換および2D変換を混在して適用するのか、2D変換のみを適用するのか、を示す情報、すなわち変換種別を、スライスヘッダに記述するものとしたが、これに限らず、例えばピクチャーパラメータセットに記述するものとしてもよい。 For example, in the above-described embodiment, information indicating whether 1D conversion and 2D conversion are mixedly applied or only 2D conversion is applied, that is, the conversion type is described in the slice header. For example, it may be described in a picture parameter set.
また、上述の実施形態では、動画像符号化装置AAと動画像復号装置BBとは、同一の変換ブロックに対して同一の基底を適用する。このため、動画像復号装置BBは、動画像符号化装置AAにおいて変換ブロックごとに適用され得る全ての基底を、認識できている必要がある。したがって、動画像符号化装置AAは、変換ブロックごとに適用することのできる全ての基底についての情報を、予め動画像復号装置BBに伝送しておく必要がある。そこで、例えば、コスト算出部6が選択信号として出力することのできる添字を、符号化側記憶部に記憶されている複数の添字の中から予め定めておき、コスト算出部6は、符号化側記憶部に記憶されている複数の添字のうち、選択信号として出力することができると予め定められたものの中から、選択信号として出力する添字を決定することとしてもよい。これによれば、動画像符号化装置AAが変換ブロックごとに適用することのできる基底の種類は、限定される。よって、動画像符号化装置AAから動画像復号装置BBに伝送する基底についての情報量を、削減できるので、符号化性能をさらに向上できる。 In the above-described embodiment, the moving image encoding device AA and the moving image decoding device BB apply the same base to the same transform block. For this reason, the video decoding device BB needs to be able to recognize all bases that can be applied to each transform block in the video encoding device AA. Therefore, the video encoding device AA needs to transmit in advance information about all bases that can be applied to each transform block to the video decoding device BB. Therefore, for example, a subscript that can be output as a selection signal by the cost calculation unit 6 is determined in advance from a plurality of subscripts stored in the encoding side storage unit, and the cost calculation unit 6 Of the plurality of subscripts stored in the storage unit, the subscript output as the selection signal may be determined from those determined in advance as being output as the selection signal. According to this, the types of bases that can be applied to each transform block by the video encoding device AA are limited. Therefore, the amount of information about the base transmitted from the video encoding device AA to the video decoding device BB can be reduced, so that the encoding performance can be further improved.
1・・・動き補償部
2・・・添字候補部
3・・・変換部
4・・・逆変換部
5・・・エントロピー符号化部
6・・・コスト算出部
101・・・エントロピー復号部
102・・・逆変換部
103・・・添字復号部
104・・・動き補償部
AA・・・動画像符号化装置
BB・・・動画像復号装置
DESCRIPTION OF
Claims (10)
予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する符号化側記憶手段と、
前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める適用手段と、
前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する決定手段と、
前記決定手段による決定結果に基づいて、符号化情報を生成する符号化情報生成手段と、
前記決定手段による決定結果に基づいて、符号化データを生成する符号化手段と、を備え、
前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、
前記決定手段は、前記適用手段による適用結果に基づいて、
1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、
1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、
2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、
前記符号化情報生成手段は、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、
前記符号化手段は、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成することを特徴とする動画像符号化装置。 A moving image encoding device for encoding a moving image,
Encoding side storage means for storing a plurality of predetermined bases and a plurality of subscripts provided so as to identify each of the plurality of bases;
For each of the plurality of bases, application means for applying a transform coefficient to each transform block;
A determination unit that determines, for each conversion block, one to be applied among the plurality of bases, using a result of application by the application unit, and determines a subscript associated with the determined base for each conversion block as a conversion subscript candidate; ,
Encoding information generating means for generating encoding information based on the determination result by the determining means;
Encoding means for generating encoded data based on the determination result by the determining means,
The plurality of bases stored in the encoding-side storage means are a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform) and a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform). Configured,
The determining means is based on the application result by the applying means,
Decide whether to apply a mixture of one-dimensional DCT and two-dimensional DCT or only two-dimensional DCT,
When it is determined that the one-dimensional DCT and the two-dimensional DCT are mixedly applied, an applied one of the plurality of bases is determined for each conversion block, and a subscript associated with the determined base is used as a conversion subscript candidate. Decide for each transformation block,
When it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all conversion blocks,
The encoded information generating means includes
When the one-dimensional DCT and the two-dimensional DCT are mixedly applied and determined by the determining means, the encoding information including information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied is generated. ,
If it is determined by the determining means that only two-dimensional DCT is applied, the encoding information including information indicating that only two-dimensional DCT is applied is generated,
The encoding means includes
If the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied together, the encoding includes the conversion index candidate for each conversion block determined by the determination unit and the encoding information Generate data,
A moving picture coding apparatus that generates coded data including the coding information when only the two-dimensional DCT is applied by the decision means.
前記決定手段は、変換ブロックごとに、前記複数の基底のそれぞれを適用した場合の符号量を求め、求めた符号量を用いて前記変換添字候補を決定することを特徴とする動画像符号化装置。 The moving image encoding device according to claim 1,
The determination unit obtains a code amount when each of the plurality of bases is applied for each transform block, and determines the transform index candidate using the obtained code amount. .
前記決定手段は、変換ブロックごとに、前記複数の基底のそれぞれを適用して符号化した後に復号して復号画像を生成し、当該復号画像と前記動画像との差分を用いて前記変換添字候補を決定することを特徴とする動画像符号化装置。 The moving picture encoding apparatus according to claim 1 or 2,
The determining means generates a decoded image by encoding after applying each of the plurality of bases for each conversion block, and using the difference between the decoded image and the moving image, the conversion index candidate A video encoding device characterized by determining
前記決定手段は、
前記1次元DCTに関する複数種類の基底のうち、前記変換添字候補として決定することのできる添字を、予め定め、
前記適用手段による適用結果に基づいて、前記1次元DCTに関する複数種類の基底のうち前記変換添字候補として決定することができると予め定めたものと、前記2次元DCTに関する1種類の基底と、中から前記変換添字候補を決定することを特徴とする動画像符号化装置。 In the moving image encoder according to any one of claims 1 to 3,
The determining means includes
Of a plurality of types of bases related to the one-dimensional DCT, subscripts that can be determined as the conversion subscript candidates are determined in advance,
Based on the result of application by the application means, a predetermined one of a plurality of types of bases related to the one-dimensional DCT can be determined as the conversion index candidate, one type of bases related to the two-dimensional DCT, The conversion encoding candidate is determined from the video encoding device.
前記複数の基底および前記複数の添字を記憶する復号側記憶手段と、
前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する復号手段と、
前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する添字復号手段と、を備え、
前記添字復号手段は、
前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、
前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得することを特徴とする動画像復号装置。 A video decoding device for decoding encoded data generated in the video encoding device according to any one of claims 1 to 4,
Decoding side storage means for storing the plurality of bases and the plurality of subscripts;
Decoding means for decoding the encoded data to obtain the conversion index candidates and the encoding information;
A subscript candidate obtained by the decoding means, and subscript decoding means for obtaining a conversion subscript based on the encoding information obtained by the decoding means,
The subscript decoding means is:
When the encoding information acquired by the decoding means includes information indicating that one-dimensional DCT and two-dimensional DCT are mixedly applied, the information is acquired by the decoding means for each transform block Obtain conversion subscript candidates as the conversion subscript,
When the encoding information acquired by the decoding means includes information indicating that only the two-dimensional DCT is applied, it is stored in the decoding storage means for all transform blocks. A moving picture decoding apparatus, wherein a plurality of subscripts associated with one type of base related to the two-dimensional DCT are acquired as the conversion subscript.
前記復号手段は、前記符号化情報を取得した後に前記動画像復号装置が受信した前記符号化データを復号して、前記変換添字候補を取得することを特徴とする動画像復号装置。 The moving picture decoding apparatus according to claim 5,
The moving picture decoding apparatus characterized in that the decoding means acquires the conversion subscript candidates by decoding the encoded data received by the moving picture decoding apparatus after acquiring the encoded information.
前記符号化側記憶手段が、予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する第1のステップと、
前記適用手段が、前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める第2のステップと、
前記決定手段が、前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する第3のステップと、
前記符号化情報生成手段が、前記決定手段による決定結果に基づいて、符号化情報を生成する第4のステップと、
前記符号化手段が、前記決定手段による決定結果に基づいて、符号化データを生成する第5のステップと、を備え、
前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、
前記第3のステップでは、前記決定手段が、前記適用手段による適用結果に基づいて、
1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、
1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、
2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、
前記第4のステップでは、符号化情報生成手段が、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、
前記第5のステップでは、前記符号化手段が、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成することを特徴とする動画像符号化方法。 A moving picture decoding method in a moving picture coding apparatus for coding a moving picture, comprising coding side storage means, applying means, determining means, coding information generating means, and coding means,
A first step in which the encoding-side storage unit stores a plurality of predetermined bases and a plurality of subscripts provided so as to be able to identify each of the plurality of bases;
A second step in which the applying means applies a transform coefficient to each transform block for each of the plurality of bases;
The determining means determines, for each conversion block, the one to be applied among the plurality of bases using the application result obtained by the applying means, and uses the subscript associated with the determined base as a conversion subscript candidate for each conversion block. A third step of determining;
A fourth step in which the encoded information generating means generates encoded information based on a determination result by the determining means;
The encoding unit includes a fifth step of generating encoded data based on a determination result by the determination unit;
The plurality of bases stored in the encoding-side storage means are a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform) and a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform). Configured,
In the third step, the determining means is based on an application result by the applying means,
Decide whether to apply a mixture of one-dimensional DCT and two-dimensional DCT or only two-dimensional DCT,
When it is determined that the one-dimensional DCT and the two-dimensional DCT are mixedly applied, an applied one of the plurality of bases is determined for each conversion block, and a subscript associated with the determined base is used as a conversion subscript candidate. Decide for each transformation block,
When it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all conversion blocks,
In the fourth step, the encoded information generating means is
When the one-dimensional DCT and the two-dimensional DCT are mixedly applied and determined by the determining means, the encoding information including information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied is generated. ,
If it is determined by the determining means that only two-dimensional DCT is applied, the encoding information including information indicating that only two-dimensional DCT is applied is generated,
In the fifth step, the encoding means includes
If the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied together, the encoding includes the conversion index candidate for each conversion block determined by the determination unit and the encoding information Generate data,
A moving picture coding method characterized in that, when only the two-dimensional DCT is applied, when the decision means decides, coded data including the coding information is generated.
前記復号側記憶手段が、前記複数の基底および前記複数の添字を記憶する第6のステップと、
前記復号手段が、前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する第7のステップと、
前記添字復号手段が、前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する第8のステップと、を備え、
前記第7のステップでは、前記添字復号手段が、
前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、
前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得することを特徴とする動画像復号方法。 A moving picture decoding method in a moving picture decoding apparatus, comprising decoding side storage means, decoding means, and subscript decoding means, for decoding encoded data generated in the moving picture encoding apparatus according to claim 7,
A sixth step in which the decoding side storage means stores the plurality of bases and the plurality of subscripts;
A seventh step in which the decoding means decodes the encoded data to obtain the conversion index candidate and the encoded information;
The subscript decoding means comprises an eighth step of acquiring a conversion subscript based on the conversion subscript candidate acquired by the decoding means and the encoded information acquired by the decoding means;
In the seventh step, the subscript decoding means is
When the encoding information acquired by the decoding means includes information indicating that one-dimensional DCT and two-dimensional DCT are mixedly applied, the information is acquired by the decoding means for each transform block Obtain conversion subscript candidates as the conversion subscript,
When the encoding information acquired by the decoding means includes information indicating that only the two-dimensional DCT is applied, it is stored in the decoding storage means for all transform blocks. A moving picture decoding method, wherein a plurality of subscripts associated with one type of base relating to the two-dimensional DCT are acquired as the conversion subscript.
前記符号化側記憶手段が、予め定められた複数の基底と、当該複数の基底のそれぞれを識別可能に設けられた複数の添字と、を記憶する第1のステップと、
前記適用手段が、前記複数の基底のそれぞれについて、各変換ブロックに適用して変換係数を求める第2のステップと、
前記決定手段が、前記適用手段による適用結果を用いて、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定する第3のステップと、
前記符号化情報生成手段が、前記決定手段による決定結果に基づいて、符号化情報を生成する第4のステップと、
前記符号化手段が、前記決定手段による決定結果に基づいて、符号化データを生成する第5のステップと、をコンピュータに実行させ、
前記符号化側記憶手段に記憶される複数の基底は、1次元DCT(1次元離散コサイン変換)に関する複数種類の基底と、2次元DCT(2次元離散コサイン変換)に関する1種類の基底と、で構成され、
前記第3のステップでは、前記決定手段が、前記適用手段による適用結果に基づいて、
1次元DCTおよび2次元DCTを混在して適用するのか、2次元DCTのみを適用するのか、を決定し、
1次元DCTおよび2次元DCTを混在して適用すると決定した場合には、前記複数の基底のうち適用するものを変換ブロックごとに決定し、決定した基底に対応付けられた添字を変換添字候補として変換ブロックごとに決定し、
2次元DCTのみを適用すると決定した場合には、2次元DCTに関する基底に対応付けられた添字を変換添字候補として全ての変換ブロックに対して決定し、
前記第4のステップでは、符号化情報生成手段が、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、1次元DCTおよび2次元DCTを混在して適用することを示す情報を含む前記符号化情報を生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、2次元DCTのみを適用することを示す情報を含む前記符号化情報を生成し、
前記第5のステップでは、前記符号化手段が、
1次元DCTおよび2次元DCTを混在して適用すると前記決定手段により決定された場合には、前記決定手段により決定された変換ブロックごとの変換添字候補と、前記符号化情報と、を含む符号化データを生成し、
2次元DCTのみを適用すると前記決定手段により決定された場合には、前記符号化情報を含む符号化データを生成するためのプログラム。 A program for causing a computer to execute a moving image decoding method in a moving image encoding apparatus that includes an encoding side storage unit, an applying unit, a determining unit, an encoding information generation unit, and an encoding unit and encodes a moving image Because
A first step in which the encoding-side storage unit stores a plurality of predetermined bases and a plurality of subscripts provided so as to be able to identify each of the plurality of bases;
A second step in which the applying means applies a transform coefficient to each transform block for each of the plurality of bases;
The determining means determines, for each conversion block, the one to be applied among the plurality of bases using the application result obtained by the applying means, and uses the subscript associated with the determined base as a conversion subscript candidate for each conversion block. A third step of determining;
A fourth step in which the encoded information generating means generates encoded information based on a determination result by the determining means;
The encoding means causes the computer to execute a fifth step of generating encoded data based on the determination result by the determining means,
The plurality of bases stored in the encoding-side storage means are a plurality of types of bases related to one-dimensional DCT (one-dimensional discrete cosine transform) and a single type of base related to two-dimensional DCT (two-dimensional discrete cosine transform). Configured,
In the third step, the determining means is based on an application result by the applying means,
Decide whether to apply a mixture of one-dimensional DCT and two-dimensional DCT or only two-dimensional DCT,
When it is determined that the one-dimensional DCT and the two-dimensional DCT are mixedly applied, an applied one of the plurality of bases is determined for each conversion block, and a subscript associated with the determined base is used as a conversion subscript candidate. Decide for each transformation block,
When it is determined that only the two-dimensional DCT is applied, the subscript associated with the base relating to the two-dimensional DCT is determined as a conversion subscript candidate for all conversion blocks,
In the fourth step, the encoded information generating means is
When the one-dimensional DCT and the two-dimensional DCT are mixedly applied and determined by the determining means, the encoding information including information indicating that the one-dimensional DCT and the two-dimensional DCT are mixedly applied is generated. ,
If it is determined by the determining means that only two-dimensional DCT is applied, the encoding information including information indicating that only two-dimensional DCT is applied is generated,
In the fifth step, the encoding means includes
If the determination unit determines that the one-dimensional DCT and the two-dimensional DCT are applied together, the encoding includes the conversion index candidate for each conversion block determined by the determination unit and the encoding information Generate data,
A program for generating encoded data including the encoding information when the determination unit determines that only two-dimensional DCT is applied.
前記復号側記憶手段が、前記複数の基底および前記複数の添字を記憶する第6のステップと、
前記復号手段が、前記符号化データを復号して、前記変換添字候補および前記符号化情報を取得する第7のステップと、
前記添字復号手段が、前記復号手段により取得された変換添字候補と、前記復号手段により取得された符号化情報と、に基づいて変換添字を取得する第8のステップと、をコンピュータに実行させ、
前記第7のステップでは、前記添字復号手段が、
前記復号手段により取得された符号化情報に、1次元DCTおよび2次元DCTを混在して適用することを示す情報が含まれている場合には、変換ブロックごとに、前記復号手段により取得された変換添字候補を前記変換添字として取得し、
前記復号手段により取得された符号化情報に、2次元DCTのみを適用することを示す情報が含まれている場合には、全ての変換ブロックに対して、前記復号側記憶手段に記憶されている複数の添字のうち、前記2次元DCTに関する1種類の基底に対応付けられたものを、前記変換添字として取得するためのプログラム。 10. A moving picture decoding method in a moving picture decoding apparatus for decoding encoded data generated in the moving picture encoding apparatus according to claim 9, comprising a decoding side storage means, a decoding means, and a subscript decoding means. A program for
A sixth step in which the decoding side storage means stores the plurality of bases and the plurality of subscripts;
A seventh step in which the decoding means decodes the encoded data to obtain the conversion index candidate and the encoded information;
The subscript decoding means causes the computer to execute a conversion subscript candidate acquired by the decoding means and an eighth step of acquiring a conversion subscript based on the encoding information acquired by the decoding means;
In the seventh step, the subscript decoding means is
When the encoding information acquired by the decoding means includes information indicating that one-dimensional DCT and two-dimensional DCT are mixedly applied, the information is acquired by the decoding means for each transform block Obtain conversion subscript candidates as the conversion subscript,
When the encoding information acquired by the decoding means includes information indicating that only the two-dimensional DCT is applied, it is stored in the decoding storage means for all transform blocks. A program for acquiring, as a conversion subscript, a plurality of subscripts associated with one type of base related to the two-dimensional DCT.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012044167A JP5878792B2 (en) | 2012-02-29 | 2012-02-29 | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012044167A JP5878792B2 (en) | 2012-02-29 | 2012-02-29 | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013183207A true JP2013183207A (en) | 2013-09-12 |
JP5878792B2 JP5878792B2 (en) | 2016-03-08 |
Family
ID=49273608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012044167A Active JP5878792B2 (en) | 2012-02-29 | 2012-02-29 | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5878792B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11445218B2 (en) | 2017-11-24 | 2022-09-13 | Sony Corporation | Image processing apparatus and method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009272727A (en) * | 2008-04-30 | 2009-11-19 | Toshiba Corp | Transformation method based on directivity of prediction error, image-encoding method and image-decoding method |
-
2012
- 2012-02-29 JP JP2012044167A patent/JP5878792B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009272727A (en) * | 2008-04-30 | 2009-11-19 | Toshiba Corp | Transformation method based on directivity of prediction error, image-encoding method and image-decoding method |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11445218B2 (en) | 2017-11-24 | 2022-09-13 | Sony Corporation | Image processing apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP5878792B2 (en) | 2016-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7051773B2 (en) | Intra prediction method and encoders and decoders using it | |
JP6995952B2 (en) | Inter-prediction method and its device | |
JP6545770B2 (en) | Inter prediction method, decoding apparatus and video decoding method | |
TWI544787B (en) | Intra prediction modes for lossy coding when transform is skipped | |
US8194748B2 (en) | Apparatus for scalable encoding/decoding of moving image and method thereof | |
JP6282646B2 (en) | Video encoding method, decoding method, corresponding encoding and decoding apparatus, and computer program by predicting division of current block | |
JP6706357B2 (en) | Method, coding device and corresponding computer program for coding a current block of a first image component with respect to a reference block of at least one second image component | |
KR101973571B1 (en) | Methods and apparatus for video transform encoding/decoding | |
JP2019050588A (en) | Multi-component image or video coding concept | |
JP6172162B2 (en) | Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and program | |
TWI789668B (en) | Determining a parametrization for context-adaptive binary arithmetic coding | |
KR20100102386A (en) | Method and apparatus for encoding/decoding image based on residual value static adaptive code table selection | |
KR101553514B1 (en) | Image decoding method and apparatus using same | |
KR20160091392A (en) | Method for encoding and decoding images, device for encoding and decoding images and corresponding computer programs | |
JP5878792B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program | |
JP2017073598A (en) | Moving image coding apparatus, moving image coding method, and computer program for moving image coding | |
JP5872929B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method, and program | |
JP6917718B2 (en) | Predictors, encoders, decoders, and programs | |
JP2012191492A (en) | Moving image coder, moving image decoder, moving image coding method, moving image decoding method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140731 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150804 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151104 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20151112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5878792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |