JP2006211304A - Device, method, and program for video image coding and decoding - Google Patents

Device, method, and program for video image coding and decoding Download PDF

Info

Publication number
JP2006211304A
JP2006211304A JP2005020750A JP2005020750A JP2006211304A JP 2006211304 A JP2006211304 A JP 2006211304A JP 2005020750 A JP2005020750 A JP 2005020750A JP 2005020750 A JP2005020750 A JP 2005020750A JP 2006211304 A JP2006211304 A JP 2006211304A
Authority
JP
Japan
Prior art keywords
scan
scan determination
video
unit
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005020750A
Other languages
Japanese (ja)
Inventor
Daijiro Ichimura
大治郎 市村
Yoshimasa Honda
義雅 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005020750A priority Critical patent/JP2006211304A/en
Publication of JP2006211304A publication Critical patent/JP2006211304A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve a problem that, if information showing a scanning order is stored in a video image stream, a code amount increases and coding efficiency worsens. <P>SOLUTION: The device creates a determination formula for determining scanning order from a reference image for coding images, and determines scanning order for each image block using the determination formula. Moreover, it is possible to obtain scanning order for each image block determined by a coding device also in a decoding device by storing the determination formula in the image stream. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、映像を符号化し映像ストリームを生成する映像符号化装置および方法と、映像ストリームを復号化して復号化映像を生成する映像復号化装置および方法に関するものである。   The present invention relates to a video encoding apparatus and method for encoding video and generating a video stream, and a video decoding apparatus and method for generating decoded video by decoding the video stream.

映像は、もはや我々の生活とは切り離せない関係にあり、インターネットや携帯電話網、放送波、蓄積メディアなどの伝送手段を通じ、パソコンや携帯端末、テレビ、ハイビジョンテレビなどの多様な表示端末において、視覚的な情報を享受させてくれる重要な存在となった。伝送手段を通じて伝送される映像は、効率良く情報を伝達するために、映像符号化技術を用いてより少ないデータ量を持つ映像ストリームに圧縮される。   Video is no longer inseparable from our daily lives, and it can be viewed on various display terminals such as personal computers, mobile terminals, TVs, and high-definition TVs through transmission methods such as the Internet, mobile phone networks, broadcast waves, and storage media. It became an important existence to let you enjoy the information. The video transmitted through the transmission means is compressed into a video stream having a smaller amount of data using a video encoding technique in order to efficiently transmit information.

また、1つの映像を異なる速度を持つ伝送手段に接続された複数のユーザに伝送することが求められており、幾つかの階層からなるデータ構造を持ち、符号化後も必要に応じて映像ストリームの伝送量を変更することのできる階層符号化方式の研究開発が進んでいる。階層符号化方式では、映像を、単体で復号化可能な基本レイヤストリームと、基本レイヤストリームの画質を向上させるための拡張レイヤストリームに階層化して符号化する。   Also, it is required to transmit one video to a plurality of users connected to transmission means having different speeds, and it has a data structure consisting of several layers, and a video stream as needed after encoding. Research and development of a hierarchical coding method that can change the transmission amount of the video is progressing. In the hierarchical coding scheme, video is layered and coded into a base layer stream that can be decoded alone and an enhancement layer stream for improving the image quality of the base layer stream.

しかし、近年、カメラや映像ディスプレイの高解像度化による映像の持つ情報は膨大となり、これら映像符号化方式をさらに高効率化する技術が求められている。   However, in recent years, the amount of information held by video due to higher resolution of cameras and video displays has become enormous, and a technology for further increasing the efficiency of these video encoding methods is required.

ここで、映像とは連続した画像、すなわち動画像のことを指す。   Here, the video refers to continuous images, that is, moving images.

映像符号化技術では、入力した画像を例えば8×8画素ごとの画像ブロックに分割してDCT変換(Discrete Cosine Transformation:離散コサイン変換)を行い、周波数を表すDCT係数に変換する。   In the video encoding technique, an input image is divided into, for example, image blocks for every 8 × 8 pixels, and DCT conversion (Discrete Cosine Transformation) is performed to convert the input image into DCT coefficients representing a frequency.

これは映像が統計的に低周波を多く含み高周波をあまり含まないという特性を利用したもので、各係数を適当な数値で除算する量子化により人間の視覚的に重要でない周波数を0にして情報量を減らすことが可能である。   This uses the characteristic that the video statistically contains a lot of low frequencies and does not contain high frequencies, and the frequency that is not visually important to humans is set to 0 by quantization that divides each coefficient by an appropriate value. It is possible to reduce the amount.

図12(a)は量子化する前の8×8画素の画像ブロックのDCT係数を表し、図12(b)は量子化後のDCT係数を表す。図12(b)では高周波ほど大きい値で除算して量子化している。   FIG. 12A shows DCT coefficients of an image block of 8 × 8 pixels before quantization, and FIG. 12B shows DCT coefficients after quantization. In FIG. 12 (b), quantization is performed by dividing by a larger value as the frequency becomes higher.

量子化したDCT係数を並べ替えることをスキャンといい、図13(a)に示すジグザグスキャンの順序で低周波成分から高周波成分にDCT係数を並べ替えることにより、量子化により0になった統計的に小さい絶対値をもつ高周波係数を順序の後半に偏らせることが可能である。   Rearranging the quantized DCT coefficients is referred to as scanning, and the statistical values that are zeroed by quantization by rearranging the DCT coefficients from low frequency components to high frequency components in the zigzag scan order shown in FIG. It is possible to bias the high frequency coefficients having small absolute values to the second half of the order.

さらにスキャンによって並べ替えたDCT係数を「以降の係数は全て0である」ことを表す「End−of−Block信号」すなわちEoBを用いて符号化ことにより、後半の0を効率よく1つの信号で表現することが可能である。スキャン順序の先頭から最後の0以外のDCT係数が現れるまでの順番をスキャン長といい、スキャン長が短くなれば符号量が減り符号化効率が向上する。   Further, the DCT coefficients rearranged by scanning are encoded using an “End-of-Block signal” that indicates that “the subsequent coefficients are all 0”, that is, EoB, so that the latter half of 0 can be efficiently converted into one signal. It is possible to express. The order from the beginning of the scan order until the last DCT coefficient other than 0 appears is called the scan length. If the scan length is shortened, the code amount is reduced and the coding efficiency is improved.

ここで、全く同じ復号化画像を得ることが可能な2つの映像ストリームがある場合、より符号量の少ない映像ストリームを、符号化効率が良いという。また、全く同じ符号量の映像ストリームが2つある場合、復号化画像がより綺麗な映像ストリームを、符号化効率が良いという。   Here, when there are two video streams from which the same decoded image can be obtained, a video stream with a smaller code amount is said to have good coding efficiency. In addition, when there are two video streams with the same code amount, a video stream with a cleaner decoded image is said to have good encoding efficiency.

ここで、より綺麗な画像とは種々の定義があるが、人間が見てより綺麗と感じる画像や、原画像との誤差が少ない画像を言う。   Here, there are various definitions of a cleaner image, but an image that is more beautiful when viewed by humans or an image with less error from the original image.

特許文献1では、画像ブロックのエッジを調べ、スキャン順序を適用的に選択することにより、スキャンしたDCT係数の後半により多くの0を偏らせ符号化効率を向上させる。ここで、エッジとは種々の定義が存在するが、ここでは、水平方向のエッジとは左右に隣接する2画素の差であらわし、垂直方向のエッジとは上下に隣接する2画素の差で表すものとする。   In Patent Document 1, the edge of an image block is examined, and the scan order is appropriately selected, so that more zeros are biased in the latter half of the scanned DCT coefficient to improve the coding efficiency. Here, there are various definitions of the edge. Here, the edge in the horizontal direction is represented by a difference between two pixels adjacent to the left and right, and the edge in the vertical direction is represented by a difference between two pixels adjacent in the vertical direction. Shall.

図14は、特許文献1を適用した符号化装置の構成を示す。エッジ抽出部1401によりDCT変換する前の画像ブロックごとに水平方向と垂直方向のエッジの量を計算する。ブロック分類部1402がそのエッジの量に応じて例えば図13(a)(b)(c)の中から画像ブロックごとに適するスキャン順序を選択する。例えば、画像ブロックが水平方向のエッジを多く含むならば水平周波数が多く含まれているので、水平周波数を優先してスキャンする図13(b)の水平スキャンを選択する。垂直方向のエッジを多く含むならば図13(c)の垂直スキャンを選択する。適応型DCT符号化部1403がDCT変換や画像ブロックごとに選択したスキャン順序に従ったスキャンなどにより符号化する。   FIG. 14 shows a configuration of an encoding apparatus to which Patent Document 1 is applied. The edge extraction unit 1401 calculates the amount of edges in the horizontal and vertical directions for each image block before DCT conversion. The block classification unit 1402 selects a scan order suitable for each image block from FIGS. 13A, 13B, and 13C, for example, according to the amount of the edge. For example, if the image block includes many horizontal edges, the horizontal frequency is included. Therefore, the horizontal scan shown in FIG. If many vertical edges are included, the vertical scan shown in FIG. 13C is selected. The adaptive DCT encoding unit 1403 performs encoding by DCT conversion or scanning according to the scanning order selected for each image block.

ここで、画像ブロックごとにどのスキャン順序を選択したかを示すフラグを映像ストリーム中に格納することにより、復号化装置において画像ブロックごとに異なるスキャン順序を特定することが可能である。   Here, by storing in the video stream a flag indicating which scan order is selected for each image block, it is possible to specify a different scan order for each image block in the decoding apparatus.

特許文献2では、符号化する画像ブロックと時間的・空間的に隣接した画像ブロックのDCT係数の分布を利用し、スキャン順序を適用的に選択することにより、スキャンしたDCT係数の後半により多くの0を偏らせ符号化効率を向上させる。   In Patent Document 2, the distribution of DCT coefficients of an image block temporally and spatially adjacent to an image block to be encoded is used, and the scanning order is appropriately selected, so that the latter half of the scanned DCT coefficient is increased. The encoding efficiency is improved by biasing 0.

図16(a)(b)は画像を8×8画素ごとに区切った画像ブロックを表す。図16(a)は符号化する画像ブロック1601とその周囲の画像ブロック1602を示す。図16(b)は符号化する画像ブロックの1フレーム前の同位置の画像ブロック1603とそれに隣接する画像ブロック1604を示す。特許文献2の方法では、これらの画像ブロック1602、1603、1604のDCT係数の分布を利用する。   FIGS. 16A and 16B show image blocks obtained by dividing an image every 8 × 8 pixels. FIG. 16A shows an image block 1601 to be encoded and an image block 1602 around it. FIG. 16B shows an image block 1603 at the same position one frame before the image block to be encoded and an image block 1604 adjacent thereto. In the method of Patent Document 2, the distribution of DCT coefficients of these image blocks 1602, 1603, and 1604 is used.

図15は、特許文献2を適用した符号化装置の構成を示す。走査方式選択部1504が、符号化する画像ブロックや時間的・空間的に隣接した画像ブロックのDCT係数を最も短いスキャン長になるよう並べ替えることができるスキャン順序を選択する。   FIG. 15 shows a configuration of an encoding apparatus to which Patent Document 2 is applied. The scanning method selection unit 1504 selects a scan order in which the DCT coefficients of image blocks to be encoded and temporally and spatially adjacent image blocks can be rearranged to have the shortest scan length.

ここで、参照する画像ブロックの選択方法を符号化装置と復号化装置で一致させておけば、画像ブロックごとにどのスキャン順序を選択したかを示すフラグを格納することなく、復号化装置において画像ブロックごとに異なるスキャン順序を特定することが可能である。
特開平10−126775号公報 特開2003−250157号公報
Here, if the selection method of the image block to be referenced is matched between the encoding device and the decoding device, the decoding device can store the image without storing a flag indicating which scan order is selected for each image block. It is possible to specify a different scan order for each block.
JP-A-10-126775 JP 2003-250157 A

しかしながら、特許文献1の方法では、スキャン順序を示すフラグの符号量だけ映像ストリームが増大し、符号化効率が悪くなる。   However, in the method of Patent Document 1, the video stream increases by the code amount of the flag indicating the scan order, and the encoding efficiency deteriorates.

特許文献1の方法を階層符号化の拡張レイヤに適用した場合も同様に、画像ブロックごとのスキャン順序を示すフラグを映像ストリームに格納せねばならず、符号化効率が悪くなる。   Similarly, when the method of Patent Document 1 is applied to an enhancement layer of hierarchical encoding, a flag indicating the scan order for each image block must be stored in the video stream, resulting in poor encoding efficiency.

また、特許文献2の方法は、符号化する画像ブロックと周囲の画像ブロックおよび別の画像の同位置の画像ブロックのDCT係数の分布が似ているとは限らず、スキャン長が長くなり符号化効率が悪くなる。   In addition, the method of Patent Document 2 does not necessarily mean that the distribution of DCT coefficients of the image block to be encoded, the surrounding image block, and the image block at the same position in another image are similar, and the scan length becomes long. Inefficiency.

また、符号化画像ブロックが動き予測補償符号化などの予測符号化の場合、不具合が生じる。図16(c)の画像ブロック1605は図16(a)の符号化する画像ブロック1601の参照画像ブロックを表す。一般的に、予測符号化では画像ブロック1601と1605の差分が小さくなるように画像ブロック1605を選択するので、画像ブロック1601のDCT係数の分布は画像ブロック1605に似る。しかしながら、特許文献2では、画像をちょうど8×8画素ごとに区切った位置にある画像ブロックのDCT係数しか利用することはできず、ちょうど8×8画素ごとに区切った位置にない画像ブロック1605の情報は利用できない。画像ブロック1602、1603、1604のDCT係数の分布が画像ブロック1601と似ているとは限らず、符号化効率が向上するとは限らない。   Further, when the encoded image block is predictive encoding such as motion prediction compensation encoding, a problem occurs. An image block 1605 in FIG. 16C represents a reference image block of the image block 1601 to be encoded in FIG. Generally, in the predictive coding, the image block 1605 is selected so that the difference between the image blocks 1601 and 1605 is small, so that the DCT coefficient distribution of the image block 1601 is similar to that of the image block 1605. However, in Patent Document 2, only the DCT coefficient of the image block located at the position where the image is divided every 8 × 8 pixels can be used, and the image block 1605 not located at the position divided every 8 × 8 pixels is used. Information is not available. The DCT coefficient distribution of the image blocks 1602, 1603, and 1604 is not necessarily similar to that of the image block 1601, and the encoding efficiency is not necessarily improved.

特許文献2の方法を階層符号化の拡張レイヤに適用した場合も同様に、拡張レイヤの符号化する画像ブロックの周囲の画像ブロックや時間的に前後するフレームの同位置や周囲の画像ブロックとDCT係数の分布が似ているとは限らず、符号化効率が向上するとは限らない。   Similarly, when the method of Patent Document 2 is applied to an enhancement layer of hierarchical coding, the image block around the image block to be coded in the enhancement layer, the same position of the frame before and after the time, the surrounding image block, and the DCT The coefficient distribution is not always similar, and the coding efficiency is not necessarily improved.

本発明の映像符号化装置は、符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を、符号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン決定手段と、符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成手段と、前記スキャン判定式を映像ストリームに格納するスキャン判定式格納手段を有する構成をとる。   The video encoding apparatus of the present invention refers to a scan order, which is an order in which an encoded image block, which is a set of several pixels in an image to be encoded, is encoded and stored in a video stream. A scan determination unit that determines a scan determination formula for a reference image block to be generated, a scan determination formula generation unit that generates the scan determination formula using a reference image that is referred to during encoding, and the scan determination formula into a video stream A configuration having a scan judgment expression storing means for storing is adopted.

この構成により、画像ブロックごとにスキャン順序を記述する必要がなく、前記スキャン判定式のみで全ての前記符号化画像ブロックの前記スキャン順序を表現でき、また、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is not necessary to describe the scan order for each image block, the scan order of all the encoded image blocks can be expressed only by the scan determination formula, and a short scan length can be used for each encoded image block. The scan order that can be encoded can be given, and the encoding efficiency can be improved.

また、本発明の映像復号化装置は上記の構成において、前記スキャン判定式格納手段が、符号化画像ブロックの符号より前の映像ストリームの位置に前記スキャン判定式の情報を格納することを特徴とする。   Further, the video decoding apparatus according to the present invention is characterized in that, in the above configuration, the scan determination formula storage means stores the information of the scan determination formula at a position of the video stream before the code of the encoded image block. To do.

この構成により、映像ストリームが途中で途切れているときも途中の符号化画像ブロックまでは復号化可能である。   With this configuration, even when the video stream is interrupted, it is possible to decode up to an encoded image block in the middle.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、前記参照画像の水平方向のエッジと垂直方向のエッジを比較して、水平方向のエッジを垂直方向のエッジより多く含めば水平方向を優先し、垂直方向のエッジを水平方向のエッジより多く含めば垂直方向を優先してスキャン順序を前記スキャン決定手段に決定させる前記スキャン判定式を生成する特長を有する。   In the coding order determining apparatus according to the present invention, in the above configuration, the scan determination formula generation unit compares a horizontal edge and a vertical edge of the reference image, and compares the horizontal edge with the vertical edge. It has a feature of generating the scan determination formula that causes the scan determining means to determine the scan order in preference to the horizontal direction if more than the edges are included, and in priority to the vertical direction if more vertical edges are included than the horizontal edges. .

この構成により、符号化画像ブロックと相関の強い参照画像のエッジの強度を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula using the edge strength of the reference image having a strong correlation with the encoded image block, and to give the scan order that can be encoded with a short scan length for each encoded image block. It is possible to improve the encoding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、前記参照画像のDCT係数の水平高周波係数と垂直高周波係数を比較して、水平高周波係数を垂直高周波係数より多く含めば水平方向を優先し、垂直高周波係数を水平高周波係数より多く含めば垂直方向を優先してスキャン順序を前記スキャン決定手段に決定させる前記スキャン判定式を生成する特長を有する。   In the coding order determining apparatus according to the present invention, in the above configuration, the scan determination formula generation unit compares the horizontal high-frequency coefficient of the DCT coefficient of the reference image with the vertical high-frequency coefficient, and converts the horizontal high-frequency coefficient into the vertical high-frequency coefficient. If more are included, the horizontal direction is prioritized, and if more vertical high-frequency coefficients are included than the horizontal high-frequency coefficient, the scan determination formula is generated to cause the scan determination unit to determine the scan order with priority to the vertical direction.

この構成により、エッジを表すDCT係数を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula using DCT coefficients representing edges, and to provide the scan order that can be encoded with a short scan length for each encoded image block, thereby improving encoding efficiency. Is possible.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、前記参照画像ブロックごとの情報の統計から前記符号化画像ブロックの特徴を予測して前記スキャン判定式を生成する特長を有する。   In the coding order determining apparatus according to the present invention, in the above configuration, the scan determination formula generation unit predicts the characteristics of the encoded image block from the statistics of information for each reference image block, and calculates the scan determination formula. It has the feature to generate.

この構成により、前記参照画像ブロックの情報と前記参照画像全体の統計を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula using the information of the reference image block and the statistics of the entire reference image, and to give the scan order that can be encoded with a short scan length for each encoded image block, It is possible to improve the encoding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、複数の前記符号化画像ブロックごとに前記スキャン判定式を生成する特長を有する。   The coding order determining apparatus according to the present invention is characterized in that, in the above-described configuration, the scan determination expression generation unit generates the scan determination expression for each of the plurality of encoded image blocks.

この構成により、画像のフレームごと、または、画像内の領域ごとの特徴に応じた前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula according to the characteristics of each frame of an image or each region in the image, and to give the scan order that can be encoded with a short scan length for each encoded image block. It is possible to improve the encoding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、過去の前記スキャン判定式を用いて前記スキャン判定式に含まれるパラメータの値を変更する特長を有する。   Further, the coding order determining apparatus of the present invention has the feature that, in the above configuration, the scan determination formula generation means changes the value of the parameter included in the scan determination formula using the past scan determination formula.

この構成により、過去の画像や過去の前記参照画像の特長から符号化中の画像の特徴を予測して前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, the scan determination formula is generated by predicting the feature of the image being encoded from the features of the past image and the past reference image, and the scan that can be encoded with a short scan length for each encoded image block An order can be given and encoding efficiency can be improved.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、前記符号化画像ブロックをスキャンした結果を用いて前記スキャン判定式を生成する特長を有する。   The coding order determining apparatus according to the present invention is characterized in that, in the above-described configuration, the scan determination expression generation unit generates the scan determination expression using a result of scanning the encoded image block.

この構成により、前記スキャン判定式によるスキャン順序での符号化効率を調べて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to check the encoding efficiency in the scan order according to the scan determination formula to generate the scan determination formula, and to give the scan order that can be encoded with a short scan length for each encoded image block. It is possible to improve the efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、予め前記スキャン判定式を複数用意しておき切り替える特徴を有する。   Further, the coding order determining apparatus according to the present invention is characterized in that, in the above configuration, the scan determination formula generation means prepares and switches a plurality of the scan determination formulas in advance.

これにより、画像の特長に応じて、よりスキャン長の短くなる前記スキャン判定式に適応的に切り替え、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   Thereby, according to the feature of the image, it is possible to adaptively switch to the scan determination formula that shortens the scan length, and to give the scan order that can be encoded with a short scan length for each encoded image block. Efficiency can be improved.

また、本発明の符号化順序決定装置は上記の構成において、映像を単体で復号化可能な基本レイヤと基本レイヤの復号化画像を画質向上させる拡張レイヤに階層化して符号化する階層符号化において、前記スキャン判定式生成手段が、基本レイヤ復号化画像を前記参照画像として、基本レイヤの前記参照画像ブロックに応じた拡張レイヤの符号化ブロックの前記スキャン順序を決定する前記スキャン判定式を生成することを特徴とする。   The coding order determining apparatus according to the present invention has the above-described configuration, in the hierarchical coding in which the base layer capable of decoding a single video and the decoded image of the base layer are hierarchized into an enhancement layer for improving the image quality. The scan determination formula generation unit generates the scan determination formula for determining the scan order of the encoded blocks of the enhancement layer corresponding to the reference image block of the base layer, using the base layer decoded image as the reference image. It is characterized by that.

この構成により、拡張レイヤと相関の強い基本レイヤの復号化画像を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula using the decoded image of the base layer having a strong correlation with the enhancement layer, and to give the scan order that can be encoded with a short scan length for each encoded image block. It is possible to improve the efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、映像の予測符号化において、前記予測符号化で参照する画像を前記参照画像として、前記スキャン判定式を生成する特長を有する。   The coding order determining apparatus according to the present invention has the above-described configuration, wherein the scan determination formula generation unit uses the image referred to in the predictive coding as the reference image in the predictive coding of the video, and the scan determination formula is It has the feature to generate.

この構成により、符号化画像ブロックと相関の強い予測符号化の前記参照画像を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, the scan determination formula is generated using the reference image of predictive encoding having a strong correlation with the encoded image block, and the scan order that can be encoded with a short scan length is provided for each encoded image block. It is possible to improve the encoding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記予測符号化が、画面間予測符号化である特長を有する。   In addition, the coding order determination apparatus according to the present invention is characterized in that, in the above configuration, the predictive coding is inter-screen predictive coding.

この構成により、符号化画像ブロックと相関の強い画面間予測符号化の前記参照画像を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, the scan determination formula is generated using the reference image of inter-picture predictive coding having a strong correlation with the coded image block, and the scan order that can be coded with a short scan length is provided for each coded image block It is possible to improve the coding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記予測符号化が、画面内予測符号化である特長を有する。   In addition, the coding order determination apparatus of the present invention has the feature that, in the above configuration, the predictive coding is intra-screen predictive coding.

この構成により、符号化画像ブロックと相関の強い画面内予測符号化の前記参照画像を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, the scan determination formula is generated using the reference image of intra prediction encoding having a strong correlation with the encoded image block, and the scan order that can be encoded with a short scan length is provided for each encoded image block It is possible to improve the coding efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記予測符号化が、前記予測符号化の前記参照画像ブロックの候補のうち、前記符号化画像ブロックの符号量が最も小さくなると前記スキャン判定式が予想する前記参照画像ブロックを予測符号化に用いる特徴と有する。   In the coding order determining apparatus according to the present invention, in the above configuration, the predictive coding is performed when the code amount of the coded image block is the smallest among the reference image block candidates of the predictive coding. The reference image block predicted by the determination formula is used for predictive coding.

この構成により、前記スキャン判定式で決定する符号化画像ブロックの前記スキャン順序が与えるスキャン長が短くなり符号化効率が向上するように、予測符号化の参照画像ブロックを選出することができ、符号化効率を向上することが可能である。   With this configuration, a reference image block for predictive coding can be selected so that the scan length given by the scan order of the coded image block determined by the scan determination formula is shortened and coding efficiency is improved. It is possible to improve the efficiency.

また、本発明の符号化順序決定装置は上記の構成において、前記スキャン判定式生成手段が、前記予測符号化が予測に用いた情報を用いて、前記参照画像ブロックに応じた前記スキャン判定式を生成する特長を有する。   In the coding order determining apparatus according to the present invention, in the configuration described above, the scan determination formula generation unit uses the information used for prediction by the prediction encoding to calculate the scan determination formula corresponding to the reference image block. It has the feature to generate.

この構成により、前記参照画像のより詳しい情報を用いて前記スキャン判定式を生成し、符号化画像ブロックごとに短いスキャン長で符号化できる前記スキャン順序を与えることができ、符号化効率を向上することが可能である。   With this configuration, it is possible to generate the scan determination formula using more detailed information of the reference image and to give the scan order that can be encoded with a short scan length for each encoded image block, thereby improving encoding efficiency. It is possible.

本発明の映像復号化装置は、符号化した画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納した順序であるスキャン順序を、復号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン判定手段と、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得手段と、を有する構成をとる。   The video decoding apparatus according to the present invention refers to a scan order, which is an order in which an encoded image block, which is a set of several pixels in an encoded image, is encoded and stored in a video stream. A scan determination unit that determines a scan determination formula for a reference image block to be performed, and a scan determination formula acquisition unit that acquires the scan determination formula from a video stream.

この構成により、画像ブロックごとにスキャン順序を映像ストリームに記述する必要がなく、前記スキャン判定式のみで全ての前記符号化画像ブロックの前記スキャン順序を表現でき、符号化効率の高い映像ストリームを復号化することが可能である。   With this configuration, it is not necessary to describe the scan order for each image block in the video stream, and the scan order of all the encoded image blocks can be expressed only by the scan determination formula, and a video stream with high encoding efficiency is decoded. It is possible to

本発明は、映像の符号化を実行する映像符号化方法であって、映像符号化装置が実行するところの、符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を、符号化の際に参照する他の参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成処理ステップと、前記スキャン判定式を映像ストリームに格納するスキャン判定式格納処理ステップと、を有する。   The present invention relates to a video coding method for performing video coding, which encodes a coded image block, which is a set of several pixels in an image to be coded, executed by a video coding device. A scan determination processing step for determining a scan order, which is an order to be converted into a video stream and stored in a video stream, using a scan determination formula for other reference image blocks to be referred to at the time of encoding, and a reference image to be referred to at the time of encoding A scan determination expression generation processing step for generating the scan determination expression, and a scan determination expression storage processing step for storing the scan determination expression in a video stream.

本発明は、映像ストリームの復号化を実行する映像復号化方法であって、映像復号化装置が実行するところの、符号化した画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納した順序であるスキャン順序を、復号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得処理ステップと、を有する構成をとる。   The present invention is a video decoding method for decoding a video stream, and an encoded image block which is a set of several pixels in an encoded image, which is executed by a video decoding device. A scan determination processing step for determining a scan order, which is an order of encoding and storing in a video stream, by a scan determination formula for a reference image block to be referred to at the time of decoding, and a scan determination for acquiring the scan determination formula from the video stream A formula acquisition processing step.

本発明は、映像の符号化を実行するためにコンピュータを、符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を、符号化の際に参照する他の参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成処理ステップと、前記スキャン判定式を映像ストリームに格納するスキャン判定式格納処理ステップと、として動作させる。   The present invention relates to a scan order, which is an order in which an encoded image block, which is a set of several pixels in an image to be encoded, is encoded and stored in a video stream in order to perform video encoding. A scan determination processing step that determines a scan determination formula for other reference image blocks that are referred to in encoding, and a scan determination formula generation process that generates the scan determination formula using a reference image that is referred to in encoding And a scan determination formula storage processing step for storing the scan determination formula in a video stream.

本発明は、映像ストリームの復号化を実行するためにコンピュータを、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得処理ステップと、前記スキャン判定式と復号化の際に参照する参照画像を用いてスキャン順序を決定するスキャン決定処理ステップと、として動作させる。   The present invention provides a computer for executing decoding of a video stream, a scan determination expression acquisition processing step for acquiring the scan determination expression from a video stream, and a reference image to be referred to when the scan determination expression and decoding are performed. And a scan determination processing step for determining the scan order.

本発明では、映像符号化において符号化効率を向上することが可能である。   In the present invention, it is possible to improve encoding efficiency in video encoding.

以下、本発明の実施の形態について、図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

(実施の形態1)
第1の実施の形態では、映像を基本レイヤと拡張レイヤに階層化して符号化する階層符号化において、拡張レイヤの画像ブロックのDCT係数のスキャン順序を生成するためのスキャン判定式を基本レイヤの復号化画像から生成し、拡張レイヤの画像ブロックのDCT係数を前記スキャン判定式により生成したスキャン順序により符号化する。
(Embodiment 1)
In the first embodiment, in hierarchical coding in which video is hierarchized into a base layer and an enhancement layer and encoded, a scan determination formula for generating the scan order of the DCT coefficients of the image blocks of the enhancement layer is used for the base layer. It is generated from the decoded image, and the DCT coefficients of the enhancement layer image block are encoded by the scan order generated by the scan determination formula.

本実施の形態は、映像すなわち連続する画像の符号化に関して説明するが、静止画像の符号化に用いても構わない。   Although this embodiment will be described with respect to encoding of video, that is, continuous images, it may be used for encoding still images.

図1は、本発明の実施の形態1に関わる映像符号化方法を適用した映像符号化装置100の構成を表す。   FIG. 1 shows a configuration of a video encoding apparatus 100 to which a video encoding method according to Embodiment 1 of the present invention is applied.

図1において、映像符号化装置100は、映像信号入力部101、基本レイヤ符号化部102、基本レイヤ出力部103、拡張レイヤ符号化部110を有する。拡張レイヤ符号化部110は、差分部111、DCT部112、スキャン部113、可変長符号化部114、拡張レイヤ出力部115、スキャン判定式生成部116、スキャン決定部117を有する。   In FIG. 1, the video encoding device 100 includes a video signal input unit 101, a base layer encoding unit 102, a base layer output unit 103, and an enhancement layer encoding unit 110. The enhancement layer coding unit 110 includes a difference unit 111, a DCT unit 112, a scanning unit 113, a variable length coding unit 114, an enhancement layer output unit 115, a scan determination formula generation unit 116, and a scan determination unit 117.

映像信号入力部101は、映像符号化装置110の外部から映像を1フレームずつ原画像として入力し、基本レイヤ符号化部102と拡張レイヤ符号化部110に出力する。また、映像符号化装置110の外部から入力される映像の有無を判定し、映像の入力がなければ処理を終了する。   The video signal input unit 101 inputs a video as an original image frame by frame from the outside of the video encoding device 110 and outputs it to the base layer encoding unit 102 and the enhancement layer encoding unit 110. Also, the presence / absence of a video input from the outside of the video encoding device 110 is determined. If there is no video input, the processing is terminated.

基本レイヤ符号化部102は、映像信号入力部101から入力した原画像を符号化して基本レイヤストリームを生成し、基本レイヤ出力部116に出力する。また、基本レイヤストリームを復号化して基本レイヤ復号化画像を生成し、拡張レイヤ符号化部110に出力する。   The base layer encoding unit 102 encodes the original image input from the video signal input unit 101 to generate a base layer stream, and outputs the base layer stream to the base layer output unit 116. Also, the base layer stream is decoded to generate a base layer decoded image, which is output to the enhancement layer encoding unit 110.

基本レイヤ出力部103は、基本レイヤ符号化部102から入力した基本レイヤストリームを映像符号化装置100の外部に出力する。   Base layer output section 103 outputs the base layer stream input from base layer encoding section 102 to the outside of video encoding apparatus 100.

差分部111は、映像信号入力部101から入力した原画像と基本レイヤ符号化部102から入力した基本レイヤ復号化画像の差分をとって差分画像を生成し、DCT部112に出力する。   The difference unit 111 generates a difference image by taking the difference between the original image input from the video signal input unit 101 and the base layer decoded image input from the base layer encoding unit 102 and outputs the difference image to the DCT unit 112.

なお、基本レイヤ復号化画像と原画像の解像度が異なる場合は、基本レイヤ復号化画像を原画像と同じ解像度に変更する。   When the resolution of the base layer decoded image and the original image are different, the base layer decoded image is changed to the same resolution as the original image.

DCT部112は、差分部111から入力した差分画像を8×8画素ごとの画像ブロックに分割し、画像ブロックごとにDCT変換を施してDCT係数を生成し、スキャン部113に出力する。   The DCT unit 112 divides the difference image input from the difference unit 111 into image blocks of 8 × 8 pixels, performs DCT conversion for each image block, generates a DCT coefficient, and outputs the DCT coefficient to the scan unit 113.

ここで、本実施の形態では説明の簡単のため画像ブロックを8×8画素とするが、特に画像ブロックの大きさに限定はない。   In this embodiment, the image block is 8 × 8 pixels for simplicity of explanation, but the size of the image block is not particularly limited.

スキャン部113は、DCT部112から入力したDCT係数に対してスキャン決定部117から入力したスキャン順序を用いて並べ替えてスキャン済DCT係数を生成し、可変長符号化部114に出力する。   The scan unit 113 rearranges the DCT coefficient input from the DCT unit 112 using the scan order input from the scan determination unit 117 to generate a scanned DCT coefficient, and outputs the generated DCT coefficient to the variable length encoding unit 114.

可変長符号化部114は、スキャン部113から入力したスキャン済DCT係数を可変長符号化して拡張レイヤストリームを生成し、拡張レイヤ出力部115に出力する。   The variable length coding unit 114 performs variable length coding on the scanned DCT coefficient input from the scanning unit 113 to generate an enhancement layer stream, and outputs the enhancement layer stream to the enhancement layer output unit 115.

ここで、可変長符号化部114ではISO/IEC 14496−10に記載のMPEG−4 AVC方式のような量子化を用いた符号化でもよく、ISO/IEC 14496−2 Amendment2に記載のMPEG−4 FGSのようなビットプレーンを用いた符号化でもよい。本発明は、DCT係数をスキャンによって並べ替えスキャン順序の後半に0を偏らせてEoBを用いて符号化する方法をとるあらゆる符号化方式に適用可能である。   Here, the variable length encoding unit 114 may be encoding using quantization such as the MPEG-4 AVC method described in ISO / IEC 14496-10, or MPEG-4 described in ISO / IEC 14496-2 Amendment 2. Encoding using a bit plane such as FGS may be used. The present invention can be applied to any coding scheme in which DCT coefficients are reordered by scanning and coded using EoB with 0 being biased to the second half of the scanning order.

なお、量子化を行う符号化の場合、可変長符号化部114が、可変長符号化を行う前に量子化の処理を行う。   In the case of encoding that performs quantization, the variable length encoding unit 114 performs quantization processing before performing variable length encoding.

また、可変長符号化の方法は、ハフマン符号化や算術符号化など、その方法を問わない。   The variable length coding method may be any method such as Huffman coding or arithmetic coding.

拡張レイヤ出力部115は、可変長符号化部114から入力した拡張レイヤストリームにスキャン判定式生成部116から入力したスキャン判定式を格納し、映像符号化装置100の外部に出力する。   The enhancement layer output unit 115 stores the scan determination formula input from the scan determination formula generation unit 116 in the enhancement layer stream input from the variable length encoding unit 114, and outputs the stored scan determination formula to the outside of the video encoding device 100.

スキャン判定式の格納については後述する。   The storage of the scan determination formula will be described later.

スキャン判定式生成部116は、基本レイヤ符号化部102から入力した基本レイヤ復号化画像を用いてスキャン判定式を生成し、拡張レイヤ出力部115とスキャン決定部117に出力する。   The scan determination formula generation unit 116 generates a scan determination formula using the base layer decoded image input from the base layer encoding unit 102 and outputs the scan determination formula to the enhancement layer output unit 115 and the scan determination unit 117.

なお、本実施の形態では1フレームの拡張レイヤストリームごとにスキャン判定式を格納するものとする。これに基づきスキャン順序を生成することにより、1フレームごとの画像特性に適用した短いスキャン長とすることが可能である。しかしながら、スキャン判定式の格納の頻度は特に限定しない。   In the present embodiment, it is assumed that a scan determination formula is stored for each enhancement layer stream of one frame. By generating the scan order based on this, a short scan length applied to the image characteristics for each frame can be obtained. However, the frequency of storing the scan determination formula is not particularly limited.

スキャン判定式の生成方法については後述する。   A method for generating the scan determination formula will be described later.

スキャン決定部117は、基本レイヤ復号化部102から入力した基本レイヤ復号化画像とスキャン判定式生成部116から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、スキャン部113に出力する。   The scan determination unit 117 generates a scan order for each image block using the base layer decoded image input from the base layer decoding unit 102 and the scan determination formula input from the scan determination formula generation unit 116, and sends it to the scan unit 113. Output.

なお、スキャン判定式生成部116が本発明のスキャン判定式生成手段に相当し、スキャン決定部117がスキャン決定手段に相当し、拡張レイヤ出力部115がスキャン判定式格納手段に総合する。   The scan determination formula generation unit 116 corresponds to the scan determination formula generation unit of the present invention, the scan determination unit 117 corresponds to the scan determination unit, and the enhancement layer output unit 115 is integrated into the scan determination formula storage unit.

以下に、スキャン判定式生成部116が行うスキャン判定式生成処理を詳しく説明する。   The scan determination formula generation process performed by the scan determination formula generation unit 116 will be described in detail below.

拡張レイヤ符号化部110では、基本レイヤ復号化画像では表現しきれない原画像の詳細情報を符号化する。差分画像では絶対値の大きい画素が物体の輪郭周辺に集中しており、差分画像は基本レイヤ復号化画像の輪郭を精細化することを示している。また、基本レイヤ復号化画像の強いエッジは物体の輪郭周辺に集中しており、差分画像と基本レイヤ復号化画像のエッジは強い相関があることが分かる。このことを利用して本実施の形態では、エッジの特性からスキャン順序を生成する方法を生成する。   The enhancement layer encoding unit 110 encodes detailed information of the original image that cannot be expressed in the base layer decoded image. In the difference image, pixels having a large absolute value are concentrated around the contour of the object, and the difference image indicates that the contour of the base layer decoded image is refined. In addition, it can be seen that strong edges of the base layer decoded image are concentrated around the contour of the object, and the difference image and the edges of the base layer decoded image have a strong correlation. In this embodiment, a method for generating the scan order from the edge characteristics is generated by utilizing this fact.

拡張レイヤの符号化画像ブロックに対応する、基本レイヤ復号画像の同位置の画像ブロックを参照画像ブロックとする。   The image block at the same position of the base layer decoded image corresponding to the encoded image block of the enhancement layer is set as a reference image block.

DCT係数は周波数成分の強度を表しており、強いエッジを含んだ画像ブロックをDCT変換すると高周波に絶対値の大きいDCT係数が生じる。また、エッジの種類によってもDCT係数の分布は変化し、水平方向のエッジを多く含んだ符号化画像ブロックは水平高周波DCT係数に大きい絶対値が偏り、垂直方向のエッジを多く含んだ符号化画像ブロックは垂直高周波DCT係数に大きい絶対値が偏る。   The DCT coefficient represents the intensity of the frequency component. When an image block including a strong edge is subjected to DCT conversion, a DCT coefficient having a large absolute value is generated at a high frequency. Also, the distribution of DCT coefficients varies depending on the type of edge, and a coded image block including many horizontal edges has a large absolute value in the horizontal high-frequency DCT coefficient, and a coded image including many vertical edges. The block has a large absolute value biased to the vertical high frequency DCT coefficient.

よって、例えば、水平方向のエッジを多く含む参照画像ブロックに対応する符号化画像ブロックには水平方向を優先した図13(b)の水平スキャンを、垂直方向のエッジを多く含む参照画像ブロックに対応する符号化画像ブロックには垂直方向を優先した図13(c)の垂直スキャンを選択することにより、ジグザグスキャンを適用した場合より短いスキャン長となり符号化効率が向上する。水平方向および垂直方向のどちらのエッジの方が多いともいえない場合は、図13(a)のジグザグスキャンを選択する。   Therefore, for example, for the encoded image block corresponding to the reference image block including many horizontal edges, the horizontal scan in FIG. 13B giving priority to the horizontal direction corresponds to the reference image block including many vertical edges. By selecting the vertical scan of FIG. 13C giving priority to the vertical direction for the encoded image block to be performed, the scan length becomes shorter than when the zigzag scan is applied, and the encoding efficiency is improved. If it cannot be said that there are more edges in either the horizontal direction or the vertical direction, the zigzag scan in FIG. 13A is selected.

なお、説明の簡単のためスキャン順序は図13(a)(b)(c)の何れかを選択するものとするがこれに限らない。   For the sake of simplicity, it is assumed that one of FIGS. 13A, 13B, and 13C is selected as the scan order, but the present invention is not limited to this.

スキャン判定式生成部116は、参照画像ブロックのエッジから符号化画像ブロックを効率良く符号化できるスキャン順序を与えるスキャン判定式を生成する。スキャン判定式の決定いかんによっては、符号化画像ブロックを効率悪く符号化するスキャン順序を与えてしまう。参照画像ブロックから例えば(数式1)〜(数式4)のスキャン判定式を生成する。   The scan determination formula generation unit 116 generates a scan determination formula that gives a scan order in which the encoded image block can be efficiently encoded from the edge of the reference image block. Depending on the determination of the scan determination formula, a scan order for encoding the encoded image block inefficiently is given. For example, the scan determination formulas of (Formula 1) to (Formula 4) are generated from the reference image block.

スキャン判定式の生成方法の前に、スキャン判定式を用いたスキャン順序の生成について説明する。   Prior to the method for generating the scan determination formula, generation of the scan order using the scan determination formula will be described.

スキャン決定部118は、(数式1)と(数式2)により参照画像ブロックのエッジの強度を計算し、参照画像ブロックに対する(数式3)と(数式4)の判定式により符号化画像ブロックのスキャン順序を選択する。(数式3)の判定式が真となれば水平スキャンを選択し、(数式4)の判定式が真となれば垂直スキャンを選択し、どちらも偽であるならばジグザグスキャンを選択する。   The scan determination unit 118 calculates the strength of the edge of the reference image block using (Equation 1) and (Equation 2), and scans the encoded image block using the determination equations (Equation 3) and (Equation 4) for the reference image block. Select the order. If the determination formula (Equation 3) is true, the horizontal scan is selected, if the determination equation (Equation 4) is true, the vertical scan is selected, and if both are false, the zigzag scan is selected.

Figure 2006211304
Figure 2006211304

(数式1)は参照画像ブロックの水平方向のエッジの計算式である。Edgeはエッジの強度を現す値を表し、Edgeの左上の添え字Hは水平方向のエッジであることを現し、Edgeの右下の添え字iは画像ブロックの通し番号を表す。また、pは画素の持つ値を表し、xとyは画像ブロック内での画素の座標を示す。λは0より大きい値である。よって(数式1)は、横隣の画素との差分絶対値のλ乗を8×8画像ブロック内で合計した値の計算式を表す。   (Formula 1) is a formula for calculating the horizontal edge of the reference image block. Edge represents a value representing the strength of the edge, the subscript H at the upper left of Edge represents the edge in the horizontal direction, and the subscript i at the lower right of Edge represents the serial number of the image block. Further, p represents a value of the pixel, and x and y represent the coordinates of the pixel in the image block. λ is a value greater than zero. Therefore, (Formula 1) represents a calculation formula of a value obtained by summing up the λ power of the absolute difference value between the adjacent pixels in the 8 × 8 image block.

Figure 2006211304
Figure 2006211304

(数式2)は参照画像ブロックの垂直方向のエッジの計算式である。Edgeの左上の添え字Vは垂直方向のエッジであることを現す。よって(数式2)は(数式1)と同様に、縦隣の画素との差分絶対値のλ乗を8×8画像ブロック内で合計した値の計算式を表す。   (Formula 2) is a formula for calculating the vertical edge of the reference image block. The subscript V at the upper left of Edge represents a vertical edge. Therefore, (Formula 2) represents a formula for calculating the sum of the λ power of the absolute value of the difference from the vertically adjacent pixels in the 8 × 8 image block, as in (Formula 1).

Figure 2006211304
Figure 2006211304

(数式3)は符号化画像ブロックに対して、水平スキャンを選択する場合の判定式である。α_1、α_2は1以上の適当な値をとる。上線を引いたEdge_Hは、基本レイヤ復号化画像の水平方向のエッジの平均値を現す。よって(数式3)は、参照画像ブロックにおいて、水平方向のエッジの強度が垂直方向のエッジの強度をある程度上回り、かつ、平均の水平方向のエッジの強度を上回ることを表す。   (Formula 3) is a determination formula in the case of selecting the horizontal scan for the encoded image block. α_1 and α_2 take appropriate values of 1 or more. Edge_H with an overline represents an average value of edges in the horizontal direction of the base layer decoded image. Therefore, (Equation 3) represents that in the reference image block, the strength of the edge in the horizontal direction exceeds the strength of the edge in the vertical direction to some extent and exceeds the strength of the edge in the horizontal direction in average.

Figure 2006211304
Figure 2006211304

(数式4)は符号化画像ブロックに対して、垂直スキャンを選択する場合の判定式である。β_1、β_2は1以上の適当な値をとる。上線を引いたEdge_Vは、基本レイヤ復号化画像の垂直方向のエッジの全画像ブロックの平均値を現す。よって(数式3)は、参照画像ブロックにおいて、垂直方向のエッジの強度が垂直方向のエッジの強度をある程度上回り、かつ、平均の垂直方向のエッジの強度を上回ることを表す。   (Formula 4) is a determination formula in the case of selecting the vertical scan for the encoded image block. β_1 and β_2 take appropriate values of 1 or more. Edge_V with an overline represents the average value of all image blocks at the edge in the vertical direction of the base layer decoded image. Therefore, (Equation 3) represents that, in the reference image block, the strength of the vertical edge exceeds the strength of the vertical edge to some extent and exceeds the average vertical edge strength.

次に、スキャン判定式の生成方法について説明する。説明の簡単のため、(数式1)と(数式2)のλは固定値、例えば、2であるとする。   Next, a method for generating a scan determination formula will be described. For simplicity of explanation, it is assumed that λ in (Expression 1) and (Expression 2) is a fixed value, for example, 2.

スキャン判定式生成部116は、(数式1)と(数式2)で計算するエッジの強度を全参照画像ブロックについて計算する。そして、平均や分散などの統計値を求め、(数式3)と(数式4)の中のα_1、α_2、β_1、β_2の値を決定する。エッジの強度の統計値からα_1、α_2、β_1、β_2の値を決定する方法は、予め実験によって得た対応表などを用いる。   The scan determination formula generation unit 116 calculates the edge strength calculated by (Formula 1) and (Formula 2) for all reference image blocks. Then, statistical values such as average and variance are obtained, and the values of α_1, α_2, β_1, and β_2 in (Equation 3) and (Equation 4) are determined. As a method for determining the values of α_1, α_2, β_1, and β_2 from the statistical values of the edge strength, a correspondence table or the like obtained in advance through experiments is used.

例えば、α_1は水平のエッジの強度の平均値を垂直のエッジの強度の平均値で除した数値の2倍と決定する。水平のエッジの強度の平均値が1000以下であるならばα_2は2で、そうでないならα_2は3と決定する。β_1とβ_2に関しても同様に決定する。   For example, α_1 is determined to be twice the value obtained by dividing the average value of the horizontal edge intensity by the average value of the vertical edge intensity. If the average value of the horizontal edge intensity is 1000 or less, α_2 is determined to be 2, and if not, α_2 is determined to be 3. β_1 and β_2 are similarly determined.

上記のように決定したスキャン判定式の情報α_1、α_2、β_1、β_2をスキャン決定部117に出力し、拡張レイヤ出力部115が拡張レイヤストリームに格納する。   The information α_1, α_2, β_1, and β_2 of the scan determination formula determined as described above is output to the scan determination unit 117, and the enhancement layer output unit 115 stores the information in the enhancement layer stream.

図2は、拡張レイヤストリームの構造の例を示す。拡張レイヤストリームの先頭部分の201は、この映像ストリームが拡張レイヤの情報を表すことを示すフラグや、画像の解像度などの情報を含むヘッダである。203の部分は、可変長符号化部114で生成した画像ブロックの符号である。スキャン判定式の情報は202の部分に格納する。例えば、α_1、α_2、β_1、β_2は1〜16までの値だけを取るものとし、それら値を4ビットで表現する。0000は1を表し、1111が16を表す。   FIG. 2 shows an example of the structure of the enhancement layer stream. A head portion 201 of the enhancement layer stream is a header including a flag indicating that this video stream represents enhancement layer information and information such as image resolution. A portion 203 is a code of the image block generated by the variable length encoding unit 114. The information of the scan determination formula is stored in the portion 202. For example, α_1, α_2, β_1, and β_2 only take values from 1 to 16, and these values are expressed by 4 bits. 0000 represents 1 and 1111 represents 16.

スキャン判定式を格納する映像ストリームの中の位置は、画像ブロックの符号よりも前とする。復号化の処理の際にスキャン判定式がなければ画像ブロックのスキャン順序が特定できず、もし画像ブロックの後にスキャン判定式があるならば映像ストリームが途中で途切れたとき全画像ブロックを復号化することができない。スキャン判定式が画像ブロックの符号の前に格納されているならば、映像ストリームが途中で途切れているときも途中の画像ブロックまでは復号化できる。   The position in the video stream in which the scan determination formula is stored is assumed to be before the code of the image block. If there is no scan judgment formula in the decoding process, the scan order of the image blocks cannot be specified. If there is a scan judgment formula after the image block, all the image blocks are decoded when the video stream is interrupted in the middle. I can't. If the scan determination formula is stored before the code of the image block, even when the video stream is interrupted in the middle, the image block in the middle can be decoded.

本発明の特徴は、スキャン生成に必要な計算式やパラメータを映像ストリームに格納して、符号化と復号化の処理で画像ブロックのスキャン順序を一致させることであり、スキャン判定式の決定方法は重要ではなく上記の方法以外でも良い。   A feature of the present invention is that calculation formulas and parameters necessary for scan generation are stored in a video stream, and the scan order of image blocks is matched in the encoding and decoding processes. It is not important and may be other than the above method.

なお、エッジの強度の計算式とスキャン判定式の条件は複数用意しておくことも可能で、その場合、どのエッジの強度の計算式とスキャン判定式の条件を用いたかを示すパラメータを拡張レイヤストリームに格納する。   Note that it is possible to prepare multiple conditions for edge strength calculation formulas and scan judgment formulas, in which case the parameters indicating which edge strength formulas and scan judgment formulas are used are extended layers. Store in stream.

これにより、画像の特長に応じて、よりスキャン長の短くなるスキャン判定式に適応的に切り替えることが可能である。画像の特長に応じた切り替え方法は、予め実験により求めておいても良い。例えば、基本レイヤストリームの符号量に応じて切り替えるなどである。   Accordingly, it is possible to adaptively switch to a scan determination formula that shortens the scan length according to the feature of the image. A switching method according to the feature of the image may be obtained in advance by experiments. For example, switching according to the code amount of the base layer stream.

λの値は固定値でなくても良い。例えば、あるフレームではλの値を2に決定して符号化を行い、そのフレームにおいて水平スキャンまたは垂直スキャンを選択した数が全画像ブロック数の10%以下であれば次のフレームではλを3に決定し直し、そうでなければ2のままとする。   The value of λ may not be a fixed value. For example, in a certain frame, the value of λ is determined to be 2 and encoding is performed. If the number of horizontal scans or vertical scans selected in the frame is 10% or less of the total number of image blocks, λ is set to 3 in the next frame. If not, leave it at 2 otherwise.

これにより、符号化する画像に適したエッジの強度の計算式を選ぶことにより、効率良く符号化できるスキャン順序を与えるスキャン判定式を生成する。   Thus, by selecting an edge strength calculation formula suitable for the image to be encoded, a scan determination formula that gives a scan order that can be encoded efficiently is generated.

エッジの強度の計算式は(数式1)と(数式2)に限らない。   The formula for calculating the edge strength is not limited to (Formula 1) and (Formula 2).

例えば、参照画像ブロックの水平方向のエッジの強度を、水平方向の8画素の分散を垂直方向に8列合計した値としても良い。また、垂直方向のエッジの強度も同様である。   For example, the intensity of the horizontal edge of the reference image block may be a value obtained by totaling 8 columns in the vertical direction for the dispersion of 8 pixels in the horizontal direction. The vertical edge strength is also the same.

例えば、参照画像ブロックをDCT変換して図3に示すようなDCT係数を生成し、水平方向のエッジの強度は破線で囲まれる水平高周波DCT係数301の絶対和、垂直方向のエッジの強度は破線で囲まれる垂直高周波DCT係数302の絶対和で計算しても良い。   For example, DCT conversion is performed on the reference image block to generate DCT coefficients as shown in FIG. 3, and the horizontal edge strength is the absolute sum of horizontal high-frequency DCT coefficients 301 surrounded by a broken line, and the vertical edge strength is a broken line. The absolute sum of the vertical high-frequency DCT coefficients 302 surrounded by

これにより、参照画像ブロックのDCT係数を既に計算している場合、エッジの強度の算出の処理負荷が軽減する。   Thereby, when the DCT coefficient of the reference image block has already been calculated, the processing load for calculating the edge strength is reduced.

スキャン生成の判定式は(数式3)と(数式4)に限らない。   The determination formula for scan generation is not limited to (Equation 3) and (Equation 4).

例えば、(数式3)に垂直方向のエッジの強度が平均値以下であることや、(数式4)に水平方向のエッジの強度が平均値以下であることを条件に追加しても良い。また、(数式3)や(数式4)に閾値での判定条件を追加しても良い。   For example, (Equation 3) may be added on condition that the vertical edge strength is equal to or lower than the average value, and (Equation 4) is added on the condition that the horizontal edge strength is equal to or lower than the average value. Further, a determination condition with a threshold value may be added to (Expression 3) or (Expression 4).

本発明の骨子は、スキャン生成に必要な計算式やパラメータを示すスキャン判定式を映像ストリームに格納して、符号化と復号化の処理で画像ブロックのスキャン順序を一致させることであり、スキャン判定式そのものは上記の方法以外でも良い。   The gist of the present invention is to store a scan judgment formula indicating calculation formulas and parameters necessary for scan generation in a video stream, and to match the scan order of image blocks in encoding and decoding processing. The expression itself may be other than the above method.

スキャン判定式生成部116は、DCT部112から符号化画像ブロックのDCT係数を入力しても良い。   The scan determination formula generation unit 116 may input the DCT coefficient of the encoded image block from the DCT unit 112.

これにより、例えば、幾つかのα_1、α_2、β_1、β_2、λの組合せで得られるスキャン順序で全符号化画像ブロックのDCT係数を実際にスキャンして、最短となるスキャン順序を調べることにより、符号化効率の良いα_1、α_2、β_1、β_2、λを決定することが可能である。   Thereby, for example, by actually scanning the DCT coefficients of all the coded image blocks in the scan order obtained by a combination of several α_1, α_2, β_1, β_2, λ, and examining the shortest scan order, It is possible to determine α_1, α_2, β_1, β_2, and λ with good coding efficiency.

スキャン判定式生成部116は、スキャン判定式を生成する際に生成した中間情報をスキャン決定部117に出力しても良い。   The scan determination formula generation unit 116 may output the intermediate information generated when generating the scan determination formula to the scan determination unit 117.

これにより、スキャン判定式の生成とスキャン順序の選択とで重複する処理を省くことが可能である。   As a result, it is possible to omit duplicate processing between the generation of the scan determination formula and the selection of the scan order.

次に、以上のように構成された映像符号化装置100の動作を説明する。図4は図1に示す第1の実施の形態の映像符号化装置100の動作の一例を示すフローチャートである。なお、図4に示すフローチャートは、図示しない記憶装置(例えばROMやフラッシュメモリなど)に格納された制御プログラムを、同じく図示しないCPUが実行することにより、プログラムの実行によりソフトウエア的に実行されるようにすることも可能である。   Next, the operation of the video encoding apparatus 100 configured as described above will be described. FIG. 4 is a flowchart showing an example of the operation of the video encoding apparatus 100 according to the first embodiment shown in FIG. The flowchart shown in FIG. 4 is executed by software by executing a control program stored in a storage device (not shown) such as a ROM or a flash memory by a CPU (not shown). It is also possible to do so.

まず、ステップS401において、映像信号入力部101が、映像符号化装置110の外部から映像を1フレームずつ原画像として入力し、基本レイヤ符号化部102と拡張レイヤ符号化部110に出力する。   First, in step S <b> 401, the video signal input unit 101 inputs a video as an original image frame by frame from the outside of the video encoding device 110, and outputs it to the base layer encoding unit 102 and the enhancement layer encoding unit 110.

次に、ステップS402において、基本レイヤ符号化部102が、映像信号入力部101から入力した原画像を符号化して基本レイヤストリームを生成し、基本レイヤ出力部116に出力する。また、基本レイヤストリームを復号化して基本レイヤ復号化画像を生成し、拡張レイヤ符号化部110に出力する。   Next, in step S <b> 402, the base layer encoding unit 102 encodes the original image input from the video signal input unit 101 to generate a base layer stream, and outputs the base layer stream to the base layer output unit 116. Also, the base layer stream is decoded to generate a base layer decoded image, which is output to the enhancement layer encoding unit 110.

次に、ステップS403において、差分部111が、映像信号入力部101から入力した原画像と基本レイヤ符号化部102から入力した基本レイヤ復号化画像の差分をとって差分画像を生成し、DCT部112に出力する。   Next, in step S403, the difference unit 111 generates a difference image by taking the difference between the original image input from the video signal input unit 101 and the base layer decoded image input from the base layer encoding unit 102, and a DCT unit. To 112.

次に、ステップS404において、DCT部112が、差分部111から入力した差分画像を8×8画素ごとの画像ブロックに分割し、画像ブロックごとにDCT変換を施してDCT係数を生成し、スキャン部113に出力する。   Next, in step S404, the DCT unit 112 divides the difference image input from the difference unit 111 into image blocks of 8 × 8 pixels, performs DCT conversion for each image block, generates a DCT coefficient, and scan unit It outputs to 113.

次に、ステップS405において、スキャン判定式生成部116が、基本レイヤ符号化部102から入力した基本レイヤ復号化画像を用いてスキャン判定式を生成し、拡張レイヤ出力部115とスキャン決定部117に出力する。   Next, in step S <b> 405, the scan determination formula generation unit 116 generates a scan determination formula using the base layer decoded image input from the base layer encoding unit 102, and sends it to the enhancement layer output unit 115 and the scan determination unit 117. Output.

次に、ステップS406において、スキャン決定部117が、基本レイヤ復号化部102から入力した基本レイヤ復号化画像とスキャン判定式生成部116から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、スキャン部113に出力する。   Next, in step S <b> 406, the scan determination unit 117 uses the base layer decoded image input from the base layer decoding unit 102 and the scan determination formula input from the scan determination formula generation unit 116 to set the scan order for each image block. Generate and output to the scan unit 113.

次に、ステップS407において、スキャン部113が、DCT部112から入力したDCT係数をスキャン決定部117から入力したスキャン順序を用いて並べ替えてスキャン済DCT係数を生成し、可変長符号化部114に出力する。   In step S407, the scan unit 113 rearranges the DCT coefficients input from the DCT unit 112 using the scan order input from the scan determination unit 117 to generate scanned DCT coefficients, and the variable length encoding unit 114 Output to.

次に、ステップS408において、可変長符号化部114が、スキャン部113から入力したスキャン済DCT係数を可変長符号化して拡張レイヤストリームを生成し、拡張レイヤ出力部115に出力する。   Next, in step S <b> 408, the variable length coding unit 114 performs variable length coding on the scanned DCT coefficient input from the scanning unit 113 to generate an enhancement layer stream, and outputs the enhancement layer stream to the enhancement layer output unit 115.

次に、ステップS409において、拡張レイヤ出力部115が、可変長符号化部114から入力した拡張レイヤストリームにスキャン判定式生成部116から入力したスキャン判定式を格納し、映像符号化装置100の外部に出力する。また、基本レイヤ出力部103が、基本レイヤ符号化部102から入力した基本レイヤストリームを映像符号化装置100の外部に出力する。   Next, in step S409, the enhancement layer output unit 115 stores the scan judgment formula input from the scan judgment formula generation unit 116 in the enhancement layer stream input from the variable length coding unit 114, and the video coding apparatus 100 externally. Output to. Also, the base layer output unit 103 outputs the base layer stream input from the base layer encoding unit 102 to the outside of the video encoding device 100.

最後に、ステップS410において、映像信号入力部101が、映像符号化装置110の外部から入力される映像の有無を判定し、映像の入力がなければ処理を終了する。そうでなければ、ステップS401に戻る。   Finally, in step S410, the video signal input unit 101 determines the presence / absence of a video input from the outside of the video encoding device 110. If there is no video input, the processing ends. Otherwise, the process returns to step S401.

なお、ステップS405が本発明のスキャン判定式生成処理ステップに相当し、ステップS406がスキャン決定処理ステップに相当し、ステップS409がスキャン判定式格納処理ステップに相当する。   Note that step S405 corresponds to the scan determination formula generation processing step of the present invention, step S406 corresponds to the scan determination processing step, and step S409 corresponds to the scan determination formula storage processing step.

以上のように、本実施の形態1によれば、映像符号化装置100は、スキャン判定式生成部116が差分画像と相関の高い基本レイヤ復号化画像を用いて、基本レイヤ復号化画像ブロックのエッジから符号化画像ブロックのスキャン順序を特定するスキャン判定式を生成し、スキャン決定部117が基本レイヤ復号化画像に対してスキャン判定式を用いることにより、画像ブロックごとにスキャン順序の情報を映像ストリームに格納することなく、拡張レイヤの画像ブロックに対してスキャン長が短いスキャン順序を特定することができ、階層符号化の符号化効率を向上することが可能である。   As described above, according to the first embodiment, the video encoding apparatus 100 uses the base layer decoded image whose scan determination formula generation unit 116 has a high correlation with the difference image to generate the base layer decoded image block. A scan determination formula for specifying the scan order of the encoded image block is generated from the edge, and the scan determination unit 117 uses the scan determination formula for the base layer decoded image, so that the information on the scan order is displayed for each image block. It is possible to specify a scan order having a short scan length for an enhancement layer image block without storing it in a stream, and to improve the coding efficiency of hierarchical coding.

また、本実施の形態1によれば、映像符号化装置100は、拡張レイヤ符号化部115がスキャン判定式を映像ストリームに格納することにより、画像ブロックごとのスキャン順序の情報を映像ストリームに格納することなく、スキャン判定式のみで全符号化画像ブロックのスキャン順序を表現することができ、符号化効率を向上することが可能である。   Further, according to the first embodiment, the video encoding device 100 stores the scan order information for each image block in the video stream by the enhancement layer encoding unit 115 storing the scan determination formula in the video stream. Without this, the scan order of all the encoded image blocks can be expressed only by the scan determination formula, and the encoding efficiency can be improved.

(実施の形態2)
第2の実施の形態では、第1の実施の形態を適用した映像符号化装置100が出力した映像ストリームの復号化において、拡張レイヤの画像ブロックのDCT係数の逆スキャン順序を生成するためのスキャン判定式を映像ストリームから取得し、拡張レイヤの画像ブロックのDCT係数を前記スキャン判定式により生成したスキャン順序により復号化する。
(Embodiment 2)
In the second embodiment, in decoding of the video stream output from the video encoding apparatus 100 to which the first embodiment is applied, a scan for generating the reverse scan order of the DCT coefficients of the image block of the enhancement layer The determination formula is acquired from the video stream, and the DCT coefficients of the enhancement layer image block are decoded by the scan order generated by the scan determination formula.

図5は、本発明の実施の形態2に関わる映像復号化方法を適用した映像復号化装置500の構成を表す。   FIG. 5 shows a configuration of a video decoding apparatus 500 to which the video decoding method according to Embodiment 2 of the present invention is applied.

図5において、映像復号化装置500は、映像信号出力部501、基本レイヤ復号化部502、基本レイヤ入力部503、拡張レイヤ復号化部510を有する。拡張レイヤ復号化部510は、差分部511、IDCT部512、逆スキャン部513、可変長復号化部514、拡張レイヤ入力部515、スキャン判定式取得部516、スキャン決定部517を有する。   In FIG. 5, the video decoding apparatus 500 includes a video signal output unit 501, a base layer decoding unit 502, a base layer input unit 503, and an enhancement layer decoding unit 510. The enhancement layer decoding unit 510 includes a difference unit 511, an IDCT unit 512, an inverse scan unit 513, a variable length decoding unit 514, an enhancement layer input unit 515, a scan determination formula acquisition unit 516, and a scan determination unit 517.

基本レイヤ入力部503は、映像復号化装置500の外部から入力した基本レイヤストリームを基本レイヤ復号化部502に出力する。また、外部から入力される映像ストリームの有無を判定し、映像ストリームの入力がなければ処理を終了する。   Base layer input section 503 outputs a base layer stream input from the outside of video decoding apparatus 500 to base layer decoding section 502. Also, the presence / absence of a video stream input from the outside is determined. If there is no video stream input, the process ends.

基本レイヤ復号化部502は、基本レイヤ入力部503から入力した基本レイヤストリームを復号化し基本レイヤ復号化画像を生成し、拡張レイヤ復号化部510に出力する。   Base layer decoding section 502 decodes the base layer stream input from base layer input section 503, generates a base layer decoded image, and outputs the base layer decoded image to enhancement layer decoding section 510.

ここで、基本レイヤ復号化画像は映像符号化装置100で生成した基本レイヤ復号化画像に一致する。   Here, the base layer decoded image matches the base layer decoded image generated by the video encoding device 100.

拡張レイヤ入力部515は、映像復号化装置500の外部から入力した拡張レイヤストリームを可変長復号化部514とスキャン判定式取得部516に出力する。   The enhancement layer input unit 515 outputs the enhancement layer stream input from the outside of the video decoding device 500 to the variable length decoding unit 514 and the scan determination formula acquisition unit 516.

可変長復号化部514は、拡張レイヤ入力部515から入力した拡張レイヤストリームを可変長復号化してスキャン済DCT係数を生成し、逆スキャン部513に出力する。   The variable length decoding unit 514 performs variable length decoding on the enhancement layer stream input from the enhancement layer input unit 515 to generate a scanned DCT coefficient, and outputs the generated DCT coefficient to the inverse scanning unit 513.

なお、映像符号化装置100が量子化を行う符号化の場合、可変長復号化部514が、可変長復号化をいった後に逆量子化の処理を行う。逆量子化とはDCT係数を除した数値で乗算する処理である。   Note that in the case of encoding in which the video encoding device 100 performs quantization, the variable length decoding unit 514 performs inverse quantization processing after performing variable length decoding. Inverse quantization is a process of multiplying by a numerical value obtained by dividing the DCT coefficient.

逆スキャン部513は、可変長復号化部514から入力したスキャン済DCT係数を、スキャン決定部517から入力したスキャン順序の逆の順序でスキャンしてDCT係数を生成し、IDCT部512に出力する。   The inverse scan unit 513 generates the DCT coefficient by scanning the scanned DCT coefficient input from the variable length decoding unit 514 in the reverse order of the scan order input from the scan determination unit 517, and outputs the DCT coefficient to the IDCT unit 512. .

IDCT部512は、逆スキャン部512から入力したDCT係数をIDCT変換して復号化画像ブロックを生成する。複数の領域に分割していた復号化画像ブロックを合成し復号化差分画像を生成し、加算部511に出力する。   The IDCT unit 512 performs IDCT conversion on the DCT coefficient input from the inverse scan unit 512 to generate a decoded image block. Decoded image blocks that have been divided into a plurality of regions are combined to generate a decoded difference image, which is output to the adder 511.

ここでIDCT(Inverse Discrete Cosine Transform)変換とはDCT変換した係数をもとに戻す逆の処理である。   Here, the IDCT (Inverse Discrete Cosine Transform) conversion is an inverse process for returning the DCT converted coefficient to the original.

スキャン判定式取得部516は、拡張レイヤ入力部515から入力した拡張レイヤストリームからスキャン判定式を取得し、スキャン決定部517に出力する。   The scan determination formula acquisition unit 516 acquires a scan determination formula from the enhancement layer stream input from the enhancement layer input unit 515 and outputs the scan determination formula to the scan determination unit 517.

スキャン決定部517は、基本レイヤ復号化部502から入力した基本レイヤ復号化画像に対して、スキャン判定式取得部516から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、逆スキャン部513に出力する。   The scan determination unit 517 generates a scan order for each image block with respect to the base layer decoded image input from the base layer decoding unit 502 using the scan determination formula input from the scan determination formula acquisition unit 516, and performs reverse processing. The data is output to the scan unit 513.

加算部511は、基本レイヤ復号化部502から入力した基本レイヤ復号化画像と、IDCT部512から入力した復号化差分画像を加算して復号化画像を生成し、映像信号出力部501に出力する。   The addition unit 511 generates a decoded image by adding the base layer decoded image input from the base layer decoding unit 502 and the decoded differential image input from the IDCT unit 512, and outputs the decoded image to the video signal output unit 501. .

映像信号出力部501は、加算部511から入力した復号化画像を映像復号化装置500の外部に出力する。   The video signal output unit 501 outputs the decoded image input from the adding unit 511 to the outside of the video decoding device 500.

なお、スキャン判定式取得部516が本発明のスキャン判定式取得手段に相当し、スキャン決定部517がスキャン決定手段に相当する。   The scan determination formula acquisition unit 516 corresponds to the scan determination formula acquisition unit of the present invention, and the scan determination unit 517 corresponds to the scan determination unit.

次に、以上のように構成された映像復号化装置500の動作を説明する。図6は図5に示す第2の実施の形態の映像復号化装置500の動作の一例を示すフローチャートである。なお、図6に示すフローチャートは、図示しない記憶装置(例えばROMやフラッシュメモリなど)に格納された制御プログラムを、同じく図示しないCPUが実行することにより、プログラムの実行によりソフトウエア的に実行されるようにすることも可能である。   Next, the operation of the video decoding apparatus 500 configured as described above will be described. FIG. 6 is a flowchart showing an example of the operation of the video decoding apparatus 500 according to the second embodiment shown in FIG. Note that the flowchart shown in FIG. 6 is executed by software by executing a control program stored in a storage device (not shown) such as a ROM or a flash memory by a CPU (not shown). It is also possible to do so.

まず、ステップS601において、基本レイヤ入力部503が、映像復号化装置500の外部から入力した基本レイヤストリームを基本レイヤ復号化部502に出力する。また、拡張レイヤ入力部515が、映像復号化装置500の外部から入力した拡張レイヤストリームを可変長復号化部514とスキャン判定式取得部516に出力する。   First, in step S <b> 601, the base layer input unit 503 outputs the base layer stream input from the outside of the video decoding apparatus 500 to the base layer decoding unit 502. Also, the enhancement layer input unit 515 outputs the enhancement layer stream input from the outside of the video decoding apparatus 500 to the variable length decoding unit 514 and the scan determination formula acquisition unit 516.

次に、ステップS602において、基本レイヤ復号化部502が、基本レイヤ入力部503から入力した基本レイヤストリームを復号化し基本レイヤ復号化画像を生成し、拡張レイヤ復号化部510に出力する。   Next, in step S602, base layer decoding section 502 decodes the base layer stream input from base layer input section 503, generates a base layer decoded image, and outputs the base layer decoded image to enhancement layer decoding section 510.

次に、ステップS603において、可変長復号化部514が、拡張レイヤ入力部515から入力した拡張レイヤストリームを可変長復号化してスキャン済DCT係数を生成し、逆スキャン部513に出力する。   Next, in step S603, the variable length decoding unit 514 performs variable length decoding on the enhancement layer stream input from the enhancement layer input unit 515 to generate a scanned DCT coefficient, and outputs the generated DCT coefficient to the inverse scan unit 513.

次に、ステップS604において、スキャン判定式取得部516が、拡張レイヤ入力部515から入力した拡張レイヤストリームからスキャン判定式を取得し、スキャン決定部517に出力する。   Next, in step S <b> 604, the scan determination formula acquisition unit 516 acquires a scan determination formula from the enhancement layer stream input from the enhancement layer input unit 515 and outputs the scan determination formula to the scan determination unit 517.

次に、ステップS605において、スキャン決定部517が、基本レイヤ復号化部502から入力した基本レイヤ復号化画像に対して、スキャン判定式取得部516から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、逆スキャン部513に出力する。   In step S605, the scan determination unit 517 uses the scan determination formula input from the scan determination formula acquisition unit 516 for the base layer decoded image input from the base layer decoding unit 502 for each image block. A scan order is generated and output to the reverse scan unit 513.

次に、ステップS606において、IDCT部512が、逆スキャン部512から入力したDCT係数をIDCT変換して復号化画像ブロックを生成して、分割していた画像ブロックを合成し復号化差分画像を生成し、加算部511に出力する。   Next, in step S606, the IDCT unit 512 generates a decoded image block by performing IDCT conversion on the DCT coefficient input from the inverse scan unit 512, and generates a decoded differential image by combining the divided image blocks. And output to the adding unit 511.

次に、ステップS607において、逆スキャン部513が、可変長復号化部514から入力したスキャン済DCT係数を、スキャン決定部517から入力したスキャン順序の逆の順序でスキャンしてDCT係数を生成し、IDCT部512に出力する。   Next, in step S <b> 607, the inverse scan unit 513 scans the scanned DCT coefficients input from the variable length decoding unit 514 in the reverse order of the scan order input from the scan determination unit 517 to generate DCT coefficients. , Output to the IDCT unit 512.

次に、ステップS608において、加算部511が、基本レイヤ復号化部502から入力した基本レイヤ復号化画像と、IDCT部512から入力した復号化差分画像を加算して復号化画像を生成し、映像信号出力部501に出力する。   Next, in step S608, the addition unit 511 generates a decoded image by adding the base layer decoded image input from the base layer decoding unit 502 and the decoded differential image input from the IDCT unit 512 to generate a video image. The signal is output to the signal output unit 501.

次に、ステップS609において、映像信号出力部501が、加算部511から入力した復号化画像を映像復号化装置500の外部に出力する。   Next, in step S <b> 609, the video signal output unit 501 outputs the decoded image input from the addition unit 511 to the outside of the video decoding device 500.

最後に、ステップS610において、基本レイヤ復号化部502が、外部から入力される映像ストリームの有無を判定し、映像ストリームの入力がなければ処理を終了する。そうでなければ、ステップS601に戻る。   Finally, in step S610, the base layer decoding unit 502 determines whether or not there is a video stream input from the outside. If there is no video stream input, the process ends. Otherwise, the process returns to step S601.

なお、ステップS604が本発明のスキャン判定式取得処理ステップに相当し、ステップS605がスキャン決定処理ステップに相当する。   Note that step S604 corresponds to the scan determination formula acquisition processing step of the present invention, and step S605 corresponds to the scan determination processing step.

以上のように、本実施の形態2によれば、映像復号化装置500は、拡張レイヤ復号化部515がスキャン判定式を映像ストリームから取得し、スキャン決定部517が基本レイヤ復号化画像に対してスキャン判定式を用いることにより、拡張レイヤの全画像ブロックのスキャン順序を映像ストリームに含めることなくスキャン順序を特定することができ、符号化効率が向上する。   As described above, according to the second embodiment, in video decoding apparatus 500, enhancement layer decoding section 515 acquires a scan determination formula from a video stream, and scan determination section 517 applies to a base layer decoded image. By using the scan determination formula, it is possible to specify the scan order without including the scan order of all the image blocks of the enhancement layer in the video stream, and the encoding efficiency is improved.

(実施の形態3)
第3の実施の形態では、予測を用いた映像符号化において、符号化画像ブロックのDCT係数のスキャン順序を生成するためのスキャン判定式を、符号化画像ブロックの予測符号化に用いる参照画像ブロックから生成し、DCT係数を前記スキャン判定式により生成したスキャン順序により符号化する。
(Embodiment 3)
In the third embodiment, in video coding using prediction, a scan determination formula for generating a scan order of DCT coefficients of a coded image block is used as a reference image block for predictive coding of the coded image block. And the DCT coefficients are encoded according to the scan order generated by the scan determination formula.

本実施の形態は、第1と第2の実施の形態と異なり階層符号化ではない映像ストリームを対象とする。   Unlike the first and second embodiments, this embodiment targets a video stream that is not hierarchically encoded.

また、本実施の形態は、映像すなわち連続する画像の符号化に関して説明するが、静止画像の符号化に用いても構わない。   Further, although the present embodiment will be described with respect to encoding of video, that is, continuous images, it may be used for encoding of still images.

図7は、本発明の実施の形態3に関わる映像符号化方法を適用した映像符号化装置700の構成を表す。   FIG. 7 shows a configuration of a video encoding apparatus 700 to which the video encoding method according to Embodiment 3 of the present invention is applied.

図7において、映像符号化装置700は、映像信号入力部701、予測符号化部702、DCT部703、スキャン部704、可変長符号化部705、ストリーム出力部706、復号化部707、スキャン判定式生成部708、スキャン決定部709を有する。   In FIG. 7, a video encoding apparatus 700 includes a video signal input unit 701, a predictive encoding unit 702, a DCT unit 703, a scanning unit 704, a variable length encoding unit 705, a stream output unit 706, a decoding unit 707, a scan determination. An expression generation unit 708 and a scan determination unit 709 are included.

映像信号入力部701は、映像符号化装置710の外部から映像を1フレームずつ原画像として入力し、予測符号化部702に出力する。また、映像符号化装置710の外部から入力される映像の有無を判定し、映像の入力がなければ処理を終了する。   The video signal input unit 701 inputs video from the outside of the video encoding device 710 frame by frame as an original image and outputs it to the prediction encoding unit 702. Also, the presence / absence of a video input from the outside of the video encoding device 710 is determined. If there is no video input, the process is terminated.

予測符号化部702は、映像信号入力部701から入力した原画像と復号化部707から入力した復号化画像ブロックを用いて予測符号化により差分画像を生成して、DCT部703に出力する。また、予測符号化に用いた参照画像をスキャン判定式生成部708に出力する。また、予測符号化により予測情報を生成し、ストリーム出力部706に出力する。   The prediction encoding unit 702 generates a difference image by prediction encoding using the original image input from the video signal input unit 701 and the decoded image block input from the decoding unit 707, and outputs the difference image to the DCT unit 703. In addition, the reference image used for predictive encoding is output to the scan determination formula generation unit 708. Also, prediction information is generated by predictive encoding and output to the stream output unit 706.

予測符号化については後述する。   Prediction coding will be described later.

DCT部703は、予測符号化部702から入力した差分画像を4×4画素ごとの画像ブロックに分割し、画像ブロックごとにDCT変換と量子化を施して量子化DCT係数を生成し、スキャン部704と復号化部707に出力する。   The DCT unit 703 divides the difference image input from the predictive encoding unit 702 into 4 × 4 pixel image blocks, performs DCT transformation and quantization for each image block, generates quantized DCT coefficients, and scan unit 704 and the decryption unit 707.

ここで、実施の形態1では画像ブロックを8×8画素としていたが、本実施の形態では説明の簡単のため画像ブロックを4×4画素とする。しかしながら、特に画像ブロックの大きさに限定はない。   Here, the image block is 8 × 8 pixels in the first embodiment, but in this embodiment, the image block is 4 × 4 pixels for the sake of simplicity of explanation. However, the size of the image block is not particularly limited.

スキャン部704は、DCT部703から入力したDCT係数をスキャン決定部709から入力したスキャン順序を用いて並べ替えてスキャン済DCT係数を生成し、可変長符号化部705に出力する。   The scan unit 704 rearranges the DCT coefficients input from the DCT unit 703 using the scan order input from the scan determination unit 709 to generate a scanned DCT coefficient, and outputs the generated DCT coefficient to the variable length encoding unit 705.

可変長符号化部705は、スキャン部704から入力したスキャン済DCT係数を可変長符号化して映像ストリームを生成し、ストリーム出力部706に出力する。   The variable length coding unit 705 generates a video stream by variable length coding the scanned DCT coefficient input from the scanning unit 704 and outputs the video stream to the stream output unit 706.

ストリーム出力部706は、可変長符号化部705から入力した映像ストリームに、予測符号化部702から入力した予測情報とスキャン判定式生成部708から入力したスキャン判定式を格納し、映像符号化装置700の外部に出力する。   The stream output unit 706 stores the prediction information input from the prediction encoding unit 702 and the scan determination expression input from the scan determination expression generation unit 708 in the video stream input from the variable length encoding unit 705, and the video encoding device Output outside 700.

復号化部707は、DCT部703から入力した量子化DCT係数をIDCT変換し復号化画像ブロックを生成し、予測符号化部702に出力する。   The decoding unit 707 performs IDCT conversion on the quantized DCT coefficient input from the DCT unit 703 to generate a decoded image block, and outputs the decoded image block to the prediction encoding unit 702.

スキャン判定式生成部708は、予測符号化部702から入力した参照画像を用いてスキャン判定式を生成し、ストリーム出力部706とスキャン決定部709に出力する。   The scan determination formula generation unit 708 generates a scan determination formula using the reference image input from the prediction encoding unit 702 and outputs the scan determination formula to the stream output unit 706 and the scan determination unit 709.

スキャン決定部709は、基本レイヤ復号化部702から入力した参照画像とスキャン判定式生成部708から入力したスキャン判定式を用いて符号化画像ブロックごとのスキャン順序を生成し、スキャン部704に出力する。   The scan determination unit 709 generates a scan order for each encoded image block using the reference image input from the base layer decoding unit 702 and the scan determination formula input from the scan determination formula generation unit 708, and outputs the scan order to the scan unit 704. To do.

なお、スキャン判定式生成部708が本発明のスキャン判定式生成手段に相当し、スキャン決定部709がスキャン決定手段に相当し、ストリーム出力部706がスキャン判定式格納手段に相当する。   The scan determination formula generation unit 708 corresponds to the scan determination formula generation unit of the present invention, the scan determination unit 709 corresponds to the scan determination unit, and the stream output unit 706 corresponds to the scan determination formula storage unit.

以下に、本実施の形態の予測符号化部702が行う予測符号化と、スキャン判定式生成部708が行うスキャン判定式の生成方法について説明する。   The predictive encoding performed by the predictive encoding unit 702 according to the present embodiment and the scan determination formula generation method performed by the scan determination formula generation unit 708 will be described below.

予測符号化部702では、公知の技術であるISO/IEC 14496−10に記載のMPEG−4 AVCに用いられている画面間予測符号化や画面内予測符号化などを行う。   The predictive coding unit 702 performs inter-screen predictive coding and intra-screen predictive coding used in MPEG-4 AVC described in ISO / IEC 14496-10, which is a known technique.

図16を用いて画面間予測符号化を説明する。   The inter-picture prediction encoding will be described with reference to FIG.

図16(a)の符号化画像ブロック1601と類似した領域を既に映像ストリームに格納した過去や未来の復号化画像の中から図16(c)の画像ブロック1605のように選出し、参照画像ブロック1605とする。   An area similar to the encoded image block 1601 in FIG. 16A is selected from past and future decoded images already stored in the video stream as an image block 1605 in FIG. 1605.

特許文献2では図16(a)の画像ブロック1602や図16(b)の画像ブロック1603、1604で表すDCT変換を行う画像ブロック単位でしか参照する画像ブロックを選出することが出来ないが、本発明では図16(c)の画像ブロック1605のように任意の位置の画素を含む画像ブロックを選出することが可能である。   In Patent Document 2, it is possible to select an image block to be referred to only in units of image blocks to be subjected to DCT conversion represented by the image block 1602 in FIG. 16A and the image blocks 1603 and 1604 in FIG. 16B. In the invention, it is possible to select an image block including a pixel at an arbitrary position, such as an image block 1605 in FIG.

映像ストリームに、参照画像ブロック1605を持つ画像や参照画像ブロック1605の位置などを示す予測情報と、参照画像ブロック1605と符号化画像ブロック1602の差分のDCT係数を符号化して格納する。一般に、参照画像ブロック1605は符号化画像ブロック1601との差分が小さくなるように選出するので、画面間予測符号化はそれを用いない場合よりも少ない符号量で符号化画像ブロック1601を映像ストリームに格納することが可能である。   In the video stream, the prediction information indicating the image having the reference image block 1605, the position of the reference image block 1605, and the like, and the DCT coefficient of the difference between the reference image block 1605 and the encoded image block 1602 are encoded and stored. In general, since the reference image block 1605 is selected so that the difference from the encoded image block 1601 is small, inter-picture predictive encoding is performed by using the encoded image block 1601 as a video stream with a smaller code amount than when not using it. Can be stored.

予測符号化部702は、予測符号化に用いるための過去や未来の復号化画像を蓄積するための記憶領域を有するものとする。   The predictive encoding unit 702 has a storage area for storing past and future decoded images for use in predictive encoding.

画面間予測符号化において、参照画像ブロックは符号化画像ブロックとの差分が小さいように選ぶ。例えば、参照画像内において符号化画像ブロックとの画素ごとの差分の絶対2乗和が最小となる参照画像ブロックを選ぶ。よって、それら2つの画像ブロックのエッジの特性は似ており、実施の形態1で述べた判定式の生成方法を同様に用いることが可能である。   In inter-picture predictive encoding, the reference image block is selected so that the difference from the encoded image block is small. For example, in the reference image, a reference image block is selected that minimizes the absolute sum of squares of differences for each pixel from the encoded image block. Therefore, the edge characteristics of the two image blocks are similar, and the determination formula generation method described in the first embodiment can be used in the same manner.

また、予測符号化の参照画像ブロックの選出方法にスキャン判定式に含めても良い。   In addition, the scan determination formula may include a reference image block selection method for predictive coding.

これにより、例えば、参照画像ブロックの水平方向のエッジの強度がある閾値以上であれば、符号化画像ブロックとの差分のDCT係数の水平スキャンが最短スキャンとなる参照画像ブロックの選出をするというルールを作ることにより、参照画像ブロックからスキャン順序を特定することが可能となる。   Thereby, for example, if the intensity of the horizontal edge of the reference image block is equal to or greater than a certain threshold value, the rule is to select a reference image block in which the horizontal scan of the difference DCT coefficient from the encoded image block is the shortest scan. This makes it possible to specify the scan order from the reference image block.

図8を用いて画面内予測符号化を説明する。   The intra prediction encoding will be described with reference to FIG.

図8(a)の801は符号化する4×4画素の画像ブロックを表す。その周りのマスは既に符号化し映像ストリームに格納している画素を復号化したものを表す。画面内予測符号化では、符号化画像ブロックの周りの復号化した画素を図8(b)の予測方向のうちの一つに従って画像ブロック801の位置にコピーしたものを参照画像ブロックとする。   Reference numeral 801 in FIG. 8A denotes an image block of 4 × 4 pixels to be encoded. The surrounding cells represent the decoded pixels that have already been encoded and stored in the video stream. In intra prediction encoding, a reference image block is obtained by copying a decoded pixel around an encoded image block to the position of an image block 801 according to one of the prediction directions in FIG. 8B.

映像ストリームに予測方向を示す予測情報と、画像ブロック801と参照画像ブロックの差分のDCT係数を符号化して格納する。一般に、参照画像ブロックは画像ブロック801との差分が小さくなるように生成するので、画面内予測符号化はそれを用いない場合よりも少ない符号量で符号化画像ブロック1602を映像ストリームに格納することが可能である。   The prediction information indicating the prediction direction and the DCT coefficient of the difference between the image block 801 and the reference image block are encoded and stored in the video stream. In general, since the reference image block is generated so that the difference from the image block 801 is small, the intra-frame predictive coding stores the coded image block 1602 in the video stream with a smaller code amount than when not using it. Is possible.

画面内予測符号化において、参照画像ブロックは符号化画像ブロックとの差分が小さいように選ぶ。例えば、全予測方向から符号化画像ブロックとの画素ごとの差分の絶対2乗和が最小となる予測方向を選ぶ。よって、それら2つの画像ブロックのエッジの特性は似ており、実施の形態1で述べた判定式の生成方法を同様に用いることが可能である。   In the intra prediction encoding, the reference image block is selected so that the difference from the encoded image block is small. For example, a prediction direction in which the absolute sum of squares of differences for each pixel from the encoded image block is selected from all prediction directions is selected. Therefore, the edge characteristics of the two image blocks are similar, and the determination formula generation method described in the first embodiment can be used in the same manner.

また、スキャン判定式の条件の中に、図8(b)に示す画面内予測の予測方向を含めても良い。   Further, the prediction direction of the intra prediction shown in FIG. 8B may be included in the conditions of the scan determination formula.

これにより、例えば、予測方向が真横であるならば水平方向のエッジはなく、水平方向のエッジの強度を計算を省略することにより処理負荷が軽減する。   Thereby, for example, if the prediction direction is just beside, there is no edge in the horizontal direction, and the processing load is reduced by omitting the calculation of the strength of the edge in the horizontal direction.

次に、以上のように構成された映像符号化装置700の動作を説明する。図9は図7に示す第3の実施の形態の映像符号化装置700の動作の一例を示すフローチャートである。なお、図9に示すフローチャートは、図示しない記憶装置(例えばROMやフラッシュメモリなど)に格納された制御プログラムを、同じく図示しないCPUが実行することにより、プログラムの実行によりソフトウエア的に実行されるようにすることも可能である。   Next, the operation of the video encoding apparatus 700 configured as described above will be described. FIG. 9 is a flowchart showing an example of the operation of the video encoding apparatus 700 according to the third embodiment shown in FIG. The flowchart shown in FIG. 9 is executed by software by executing a control program stored in a storage device (not shown) such as a ROM or a flash memory by a CPU (not shown). It is also possible to do so.

まず、ステップS901において、映像信号入力部701が、映像符号化装置710の外部から映像を1フレームずつ原画像として入力し、予測符号化部702に出力する。   First, in step S <b> 901, the video signal input unit 701 inputs a video as an original image frame by frame from the outside of the video encoding device 710 and outputs it to the predictive encoding unit 702.

次に、ステップS902において、予測符号化部702が、映像信号入力部701から入力した原画像と復号化部707から入力した復号化画像ブロックを用いて予測符号化により差分画像を生成して、DCT部703に出力する。また、予測符号化により予測情報を生成し、ストリーム出力部706に出力する。   Next, in step S902, the prediction encoding unit 702 generates a difference image by predictive encoding using the original image input from the video signal input unit 701 and the decoded image block input from the decoding unit 707, and The data is output to the DCT unit 703. Also, prediction information is generated by predictive encoding and output to the stream output unit 706.

次に、ステップS903において、DCT部703が、予測符号化部702から入力した差分画像を4×4画素ごとの画像ブロックに分割し、画像ブロックごとにDCT変換と量子化を施して量子化DCT係数を生成し、スキャン部704と復号化部707に出力する。   Next, in step S903, the DCT unit 703 divides the difference image input from the predictive encoding unit 702 into 4 × 4 pixel image blocks, performs DCT transformation and quantization for each image block, and performs quantization DCT. A coefficient is generated and output to the scanning unit 704 and the decoding unit 707.

次に、ステップS904において、復号化部707が、DCT部703から入力した量子化DCT係数をIDCT変換し復号化画像ブロックを生成し、予測符号化部702に出力する。   Next, in step S904, the decoding unit 707 generates a decoded image block by performing IDCT conversion on the quantized DCT coefficient input from the DCT unit 703, and outputs the decoded image block to the prediction encoding unit 702.

次に、ステップS905において、スキャン判定式生成部708が、予測符号化部702から入力した参照画像を用いてスキャン判定式を生成し、ストリーム出力部706とスキャン決定部709に出力する。   In step S 905, the scan determination formula generation unit 708 generates a scan determination formula using the reference image input from the prediction encoding unit 702 and outputs the scan determination formula to the stream output unit 706 and the scan determination unit 709.

次に、ステップS906において、スキャン決定部709が、基本レイヤ復号化部702から入力した参照画像とスキャン判定式生成部708から入力したスキャン判定式を用いて符号化画像ブロックごとのスキャン順序を生成し、スキャン部704に出力する。   In step S906, the scan determination unit 709 generates a scan order for each encoded image block using the reference image input from the base layer decoding unit 702 and the scan determination formula input from the scan determination formula generation unit 708. And output to the scan unit 704.

次に、ステップS907において、スキャン部704が、DCT部703から入力したDCT係数をスキャン決定部709から入力したスキャン順序を用いて並べ替えてスキャン済DCT係数を生成し、可変長符号化部705に出力する。   Next, in step S907, the scan unit 704 generates a scanned DCT coefficient by rearranging the DCT coefficients input from the DCT unit 703 using the scan order input from the scan determination unit 709, and the variable length encoding unit 705. Output to.

次に、ステップS908において、可変長符号化部705が、スキャン部704から入力したスキャン済DCT係数を可変長符号化して映像ストリームを生成し、ストリーム出力部706に出力する。   In step S <b> 908, the variable length coding unit 705 generates a video stream by variable length coding the scanned DCT coefficient input from the scanning unit 704, and outputs the video stream to the stream output unit 706.

次に、ステップS909において、ストリーム出力部706が、可変長符号化部705から入力した映像ストリームに、予測符号化部702から入力した予測情報とスキャン判定式生成部708から入力したスキャン判定式を格納し、映像符号化装置700の外部に出力する。   Next, in step S909, the stream output unit 706 adds the prediction information input from the prediction encoding unit 702 and the scan determination expression input from the scan determination expression generation unit 708 to the video stream input from the variable length encoding unit 705. Store and output to the outside of the video encoding device 700.

最後に、ステップS910において、映像信号入力部701が、映像符号化装置710の外部から入力される映像の有無を判定し、映像の入力がなければ処理を終了する。そうでなければ、ステップS901に戻る。   Finally, in step S910, the video signal input unit 701 determines whether there is a video input from the outside of the video encoding device 710. If there is no video input, the process ends. Otherwise, the process returns to step S901.

なお、ステップS905が本発明のスキャン判定式生成処理ステップに相当し、ステップS906がスキャン決定処理ステップに相当し、ステップS909がスキャン判定式格納処理ステップに相当する。   Note that step S905 corresponds to the scan determination formula generation processing step of the present invention, step S906 corresponds to the scan determination processing step, and step S909 corresponds to the scan determination formula storage processing step.

以上のように、本実施の形態3によれば、映像符号化装置700は、スキャン判定式生成部708が予測符号化の参照画像を用いてスキャン判定式を生成し、スキャン決定部709が予測符号化の参照画像に対してスキャン判定式を用いることにより、全ての画像ブロックに対してスキャン長が短いスキャン順序を生成することができ、予測符号化の符号化効率を向上することが可能である。   As described above, according to the third embodiment, in video encoding apparatus 700, scan determination expression generation section 708 generates a scan determination expression using a reference image for predictive encoding, and scan determination section 709 predicts. By using the scan determination formula for the reference image for encoding, it is possible to generate a scan order with a short scan length for all image blocks, and to improve the encoding efficiency of predictive encoding. is there.

また、本実施の形態3によれば、映像符号化装置700は、スキャン判定式生成部708が予測情報を用いてスキャン判定式を生成することや、予測符号化部702がスキャン判定式の情報を用いて予測することにより、より短いスキャン長となるスキャン順序が生成でき、符号化効率を向上することが可能である。   Further, according to the third embodiment, in video encoding apparatus 700, scan determination formula generation section 708 generates a scan determination formula using prediction information, and predictive encoding section 702 uses scan determination formula information. By using the prediction, it is possible to generate a scan order having a shorter scan length, and to improve the encoding efficiency.

(実施の形態4)
第4の実施の形態では、第3の実施の形態を適用した映像符号化装置700が出力した映像ストリームの復号化において、復号化する画像ブロックのDCT係数の逆スキャン順序を生成するためのスキャン判定式を映像ストリームから取得し、画像ブロックのDCT係数を前記スキャン判定式により生成したスキャン順序により復号化する。
(Embodiment 4)
In the fourth embodiment, in decoding a video stream output from the video encoding apparatus 700 to which the third embodiment is applied, a scan for generating a reverse scan order of DCT coefficients of an image block to be decoded The determination formula is acquired from the video stream, and the DCT coefficient of the image block is decoded by the scan order generated by the scan determination formula.

図10は、本発明の実施の形態4に関わる映像復号化方法を適用した映像復号化装置1000の構成を表す。   FIG. 10 shows the configuration of a video decoding apparatus 1000 to which the video decoding method according to Embodiment 4 of the present invention is applied.

図10において、映像復号化装置1000は、映像信号出力部1001、予測復号化部1002、IDCT部1003、逆スキャン部1004、可変長復号化部1005、ストリーム入力部1006、スキャン判定式取得部1007、スキャン決定部1008を有する。   In FIG. 10, the video decoding apparatus 1000 includes a video signal output unit 1001, a predictive decoding unit 1002, an IDCT unit 1003, an inverse scan unit 1004, a variable length decoding unit 1005, a stream input unit 1006, and a scan determination formula acquisition unit 1007. And a scan determination unit 1008.

ストリーム入力部1006は、映像復号化装置1000の外部から映像ストリームを入力し可変長復号化部1005と予測復号化部1002とスキャン判定式取得部1007に出力する。また、外部から入力される映像ストリームの有無を判定し、映像ストリームの入力がなければ処理を終了する。   The stream input unit 1006 inputs a video stream from the outside of the video decoding apparatus 1000 and outputs the video stream to the variable length decoding unit 1005, the prediction decoding unit 1002, and the scan determination formula acquisition unit 1007. Also, the presence / absence of a video stream input from the outside is determined. If there is no video stream input, the process ends.

可変長復号化部1005は、ストリーム入力部1006から入力した映像ストリームを可変長復号化してスキャン済DCT係数を生成し、逆スキャン部1004に出力する。   The variable length decoding unit 1005 performs variable length decoding on the video stream input from the stream input unit 1006 to generate a scanned DCT coefficient, and outputs the generated DCT coefficient to the inverse scanning unit 1004.

逆スキャン部1004は、可変長復号化部1005から入力したスキャン済DCT係数を、スキャン決定部1008から入力したスキャン順序の逆の順序でスキャンして量子化DCT係数を生成し、IDCT部5J03に出力する。   The inverse scan unit 1004 scans the scanned DCT coefficients input from the variable length decoding unit 1005 in the reverse order of the scan order input from the scan determination unit 1008 to generate quantized DCT coefficients, and sends them to the IDCT unit 5J03. Output.

IDCT部1003は、逆スキャン部1004から入力した量子化DCT係数を逆量子化とIDCT変換を施して復号化画像ブロックを生成し、予測復号化部1002に出力する。   The IDCT unit 1003 performs inverse quantization and IDCT conversion on the quantized DCT coefficient input from the inverse scan unit 1004 to generate a decoded image block, and outputs the decoded image block to the predictive decoding unit 1002.

スキャン判定式取得部1007は、ストリーム入力部1006から入力した映像ストリームからスキャン判定式を取得し、スキャン決定部1008に出力する。   The scan determination formula acquisition unit 1007 acquires the scan determination formula from the video stream input from the stream input unit 1006 and outputs the scan determination formula to the scan determination unit 1008.

スキャン決定部1008は、予測復号化部1002から入力した参照画像に対して、スキャン判定式取得部1007から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、逆スキャン部1004に出力する。   The scan determination unit 1008 generates a scan order for each image block using the scan determination formula input from the scan determination formula acquisition unit 1007 for the reference image input from the predictive decoding unit 1002, and sends the scan order to the inverse scan unit 1004. Output.

予測復号化部1002は、ストリーム入力部1006から入力した映像ストリームから予測情報を取得し、IDCT部1003から入力した復号化画像ブロックを用いて予測復号化により復号化画像を生成し、映像信号出力部1001に出力する。また、予測復号化に用いた参照画像をスキャン決定部708に出力する。   The predictive decoding unit 1002 acquires prediction information from the video stream input from the stream input unit 1006, generates a decoded image by predictive decoding using the decoded image block input from the IDCT unit 1003, and outputs a video signal. Output to the unit 1001. In addition, the reference image used for predictive decoding is output to the scan determination unit 708.

映像信号出力部1001は、予測復号化部1002から入力した復号化画像を映像復号化装置1000の外部に出力する。   The video signal output unit 1001 outputs the decoded image input from the predictive decoding unit 1002 to the outside of the video decoding apparatus 1000.

なお、スキャン判定式取得部1007が本発明のスキャン判定式取得手段に相当し、スキャン決定部1008がスキャン決定手段に相当する。   The scan determination formula acquisition unit 1007 corresponds to the scan determination formula acquisition unit of the present invention, and the scan determination unit 1008 corresponds to the scan determination unit.

次に、以上のように構成された映像復号化装置1000の動作を説明する。図11は図10に示す第4の実施の形態の映像復号化装置1000の動作の一例を示すフローチャートである。なお、図11に示すフローチャートは、図示しない記憶装置(例えばROMやフラッシュメモリなど)に格納された制御プログラムを、同じく図示しないCPUが実行することにより、プログラムの実行によりソフトウエア的に実行されるようにすることも可能である。   Next, the operation of the video decoding apparatus 1000 configured as described above will be described. FIG. 11 is a flowchart showing an example of the operation of the video decoding apparatus 1000 according to the fourth embodiment shown in FIG. The flowchart shown in FIG. 11 is executed by software by executing a control program stored in a storage device (not shown) such as a ROM or a flash memory by a CPU (not shown). It is also possible to do so.

まず、ステップS1101では、ストリーム入力部1006が、映像復号化装置1000の外部から映像ストリームを入力し可変長復号化部1005と予測復号化部1002とスキャン判定式取得部1007に出力する。   First, in step S1101, the stream input unit 1006 inputs a video stream from the outside of the video decoding apparatus 1000, and outputs the video stream to the variable length decoding unit 1005, the predictive decoding unit 1002, and the scan determination formula acquisition unit 1007.

次に、ステップS1102では、可変長復号化部1005が、ストリーム入力部1006から入力した映像ストリームを可変長復号化してスキャン済DCT係数を生成し、逆スキャン部1004に出力する。   Next, in step S1102, the variable length decoding unit 1005 performs variable length decoding on the video stream input from the stream input unit 1006, generates a scanned DCT coefficient, and outputs the generated DCT coefficient to the inverse scanning unit 1004.

次に、ステップS1103では、スキャン判定式取得部1007が、ストリーム入力部1006から入力した映像ストリームからスキャン判定式を取得し、スキャン決定部1008に出力する。   Next, in step S <b> 1103, the scan determination formula acquisition unit 1007 acquires a scan determination formula from the video stream input from the stream input unit 1006 and outputs the scan determination formula to the scan determination unit 1008.

次に、ステップS1104では、スキャン決定部1008が、予測復号化部1002から入力した参照画像に対して、スキャン判定式取得部1007から入力したスキャン判定式を用いて画像ブロックごとのスキャン順序を生成し、逆スキャン部1004に出力する。   In step S1104, the scan determination unit 1008 generates a scan order for each image block using the scan determination formula input from the scan determination formula acquisition unit 1007 for the reference image input from the predictive decoding unit 1002. And output to the reverse scan unit 1004.

次に、ステップS1105では、逆スキャン部1004が、可変長復号化部1005から入力したスキャン済DCT係数を、スキャン決定部1008から入力したスキャン順序の逆の順序でスキャンして量子化DCT係数を生成し、IDCT部5J03に出力する。   Next, in step S1105, the inverse scan unit 1004 scans the scanned DCT coefficients input from the variable length decoding unit 1005 in the reverse order of the scan order input from the scan determination unit 1008 to obtain the quantized DCT coefficients. Generate and output to the IDCT unit 5J03.

次に、ステップS1106では、IDCT部1003が、逆スキャン部1004から入力した量子化DCT係数を逆量子化とIDCT変換を施して復号化画像ブロックを生成し、予測復号化部1002に出力する。   Next, in step S 1106, the IDCT unit 1003 performs inverse quantization and IDCT transformation on the quantized DCT coefficient input from the inverse scan unit 1004, generates a decoded image block, and outputs the decoded image block to the predictive decoding unit 1002.

次に、ステップS1107では、予測復号化部1002が、ストリーム入力部1006から入力した映像ストリームから予測情報を取得し、IDCT部1003から入力した復号化画像ブロックを用いて予測復号化により復号化画像を生成し、映像信号出力部1001に出力する。また、予測復号化に用いた参照画像をスキャン決定部708に出力する。   Next, in step S1107, the predictive decoding unit 1002 acquires prediction information from the video stream input from the stream input unit 1006, and uses the decoded image block input from the IDCT unit 1003 to decode a decoded image by predictive decoding. Is output to the video signal output unit 1001. In addition, the reference image used for predictive decoding is output to the scan determination unit 708.

次に、ステップS1108では、映像信号出力部1001が、予測復号化部1002から入力した復号化画像を映像復号化装置1000の外部に出力する。   Next, in step S1108, the video signal output unit 1001 outputs the decoded image input from the predictive decoding unit 1002 to the outside of the video decoding apparatus 1000.

最後に、ステップS1109では、ストリーム入力部1006が、外部から入力される映像ストリームの有無を判定し、映像ストリームの入力がなければ処理を終了する。そうでなければ、ステップS1101に戻る。   Finally, in step S1109, the stream input unit 1006 determines whether there is a video stream input from the outside. If there is no video stream input, the process ends. Otherwise, the process returns to step S1101.

なお、ステップS1103が本発明のスキャン判定式取得処理ステップに相当し、ステップS1104がスキャン決定処理ステップに相当する。   Note that step S1103 corresponds to the scan determination formula acquisition processing step of the present invention, and step S1104 corresponds to the scan determination processing step.

以上のように、本実施の形態4によれば、映像復号化装置1000は、スキャン判定式取得部1007がスキャン判定式を映像ストリームから取得し、スキャン決定部517が予測符号化の参照画像に対してスキャン判定式を用いることにより、全画像ブロックのスキャン順序を映像ストリームに含めることなくスキャン順序を特定することができ、符号化効率が向上する。   As described above, according to the fourth embodiment, in the video decoding apparatus 1000, the scan determination formula acquisition unit 1007 acquires the scan determination formula from the video stream, and the scan determination unit 517 converts it into a reference image for prediction encoding. On the other hand, by using the scan determination formula, it is possible to specify the scan order without including the scan order of all image blocks in the video stream, and the encoding efficiency is improved.

本発明は、画像ブロックごとに適したスキャン順序を生成することにより、符号化効率を向上することが可能であり、有用である。   INDUSTRIAL APPLICABILITY The present invention is useful because it is possible to improve encoding efficiency by generating a scan order suitable for each image block.

また、本発明は、特に階層符号化方式に適用することが可能で、拡張レイヤの符号化効率を向上することができ有用である。   In addition, the present invention is particularly applicable to the hierarchical coding scheme, and is useful because it can improve the coding efficiency of the enhancement layer.

よって、映像ストリームを符号化した後、符号量を調整して復号化する用途に適している。   Therefore, after encoding a video stream, it is suitable for the purpose of decoding by adjusting the code amount.

また、本発明は、特に予測符号化方式に適用することが可能で、予測符号化の符号化効率を向上することができ有用である。   In addition, the present invention is particularly applicable to a predictive coding scheme, and is useful because it can improve the coding efficiency of predictive coding.

よって、映像すなわち連続する画像の符号化に適している。すなわち、通信速度の変動するネットワークを介して映像ストリームの量を動的に変化させながら映像を送受信するシステムの映像符号化方式に適している。また、1つの映像コンテンツを通信速度や端末の処理能力の異なる複数のユーザに、それぞれ異なる画質や通信速度で配信するシステムの映像符号化方式に適している。また、映像ストリームを蓄積した後に、復号化して再度符号化することなく、蓄積容量を変更する映像蓄積装置の映像符号化方式に適している。   Therefore, it is suitable for encoding video, that is, continuous images. That is, it is suitable for a video encoding system of a system that transmits and receives video while dynamically changing the amount of the video stream via a network whose communication speed varies. Further, the present invention is suitable for a video encoding system of a system that distributes one video content to a plurality of users having different communication speeds and terminal processing capabilities at different image quality and communication speeds. Further, the present invention is suitable for a video encoding method of a video storage apparatus that changes the storage capacity without decoding and re-encoding after storing the video stream.

本発明の実施の形態1による映像符号化装置の構成を示す図The figure which shows the structure of the video coding apparatus by Embodiment 1 of this invention. 拡張レイヤストリームの構造の例を示す図Diagram showing an example of the structure of the enhancement layer stream DCT係数の水平高周波と垂直高周波の例を示す図The figure which shows the example of the horizontal high frequency of a DCT coefficient, and a vertical high frequency 本発明の実施の形態1による映像符号化装置の動作を示すフローチャートThe flowchart which shows operation | movement of the video coding apparatus by Embodiment 1 of this invention. 本発明の実施の形態2による映像復号化装置の構成を示す図The figure which shows the structure of the video decoding apparatus by Embodiment 2 of this invention. 本発明の実施の形態2による映像復号化装置の動作を示すフローチャートThe flowchart which shows operation | movement of the video decoding apparatus by Embodiment 2 of this invention. 本発明の実施の形態3による映像符号化装置の構成を示す図The figure which shows the structure of the video coding apparatus by Embodiment 3 of this invention. 画面内予測の例を示す図Diagram showing an example of in-screen prediction 本発明の実施の形態3による映像符号化装置の動作を示すフローチャートThe flowchart which shows operation | movement of the video coding apparatus by Embodiment 3 of this invention. 本発明の実施の形態4による映像復号化装置の構成を示す図The figure which shows the structure of the video decoding apparatus by Embodiment 4 of this invention. 本発明の実施の形態4による映像復号化装置の動作を示すフローチャートThe flowchart which shows operation | movement of the video decoding apparatus by Embodiment 4 of this invention. 量子化の例を示す図Diagram showing an example of quantization スキャン順序の例を示す図Diagram showing an example of scan order 特許文献1による映像符号化装置の構成を示す図The figure which shows the structure of the video coding apparatus by patent document 1 特許文献2による映像符号化装置の構成を示す図The figure which shows the structure of the video coding apparatus by patent document 2 特許文献2の概念図Conceptual diagram of Patent Document 2

符号の説明Explanation of symbols

101,701 映像信号入力部
102 基本レイヤ符号化部
103 基本レイヤ出力部
110 拡張レイヤ符号化部
111 差分部
112,703 DCT部
113,704 スキャン部
114,705 可変長符号化部
115 拡張レイヤ出力部
116,516,708,907 スキャン判定式生成部
117,517,709,908 スキャン決定部
501,901 映像信号出力部
502 基本レイヤ復号化部
503 基本レイヤ入力部
510 拡張レイヤ復号化部
511 加算部
512,903 IDCT部
513,904 逆スキャン部
514,905 可変長復号部
515 拡張レイヤ入力部
702 予測符号化部
706 ストリーム出力部
707 復号化部
902 予測復号化部
906 ストリーム入力部
201 拡張レイヤストリームヘッダ
202 スキャン判定式
203 画像ブロックの符号
101, 701 Video signal input unit 102 Base layer encoding unit 103 Base layer output unit 110 Enhancement layer encoding unit 111 Difference unit 112, 703 DCT unit 113, 704 Scan unit 114, 705 Variable length encoding unit 115 Enhancement layer output unit 116, 516, 708, 907 Scan determination formula generation unit 117, 517, 709, 908 Scan determination unit 501, 901 Video signal output unit 502 Base layer decoding unit 503 Base layer input unit 510 Enhancement layer decoding unit 511 Addition unit 512 903 IDCT unit 513 904 Reverse scan unit 514 905 Variable length decoding unit 515 Enhancement layer input unit 702 Predictive coding unit 706 Stream output unit 707 Decoding unit 902 Predictive decoding unit 906 Stream input unit 201 Enhancement layer stream head 202 code scan judgment formula 203 image blocks

Claims (20)

符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を、符号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン決定手段と、符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成手段と、前記スキャン判定式を映像ストリームに格納するスキャン判定式格納手段と、を有する映像符号化装置。 The scan order, which is the order in which an encoded image block, which is a set of several pixels in the image to be encoded, is encoded and stored in the video stream is determined by the scan judgment formula for the reference image block to be referred to at the time of encoding. A scan determination means for determining; a scan determination expression generation means for generating the scan determination expression using a reference image referred to in encoding; a scan determination expression storage means for storing the scan determination expression in a video stream; A video encoding device. 前記スキャン判定式格納手段が、符号化画像ブロックの符号より前の映像ストリームの位置に前記スキャン判定式の情報を格納する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination formula storage unit stores the information of the scan determination formula at a position of the video stream before the code of the encoded image block. 前記スキャン判定式生成手段が、前記参照画像の水平方向のエッジと垂直方向のエッジを比較して、水平方向のエッジを垂直方向のエッジより多く含めば水平方向を優先し、垂直方向のエッジを水平方向のエッジより多く含めば垂直方向を優先してスキャン順序を前記スキャン決定手段に決定させる前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 The scan determination formula generation means compares the horizontal edge and the vertical edge of the reference image, and if the horizontal edge is included more than the vertical edge, the horizontal direction is given priority, and the vertical edge is determined. 2. The video encoding apparatus according to claim 1, wherein if there are more edges than in the horizontal direction, the scan determination formula is generated to cause the scan determination unit to determine the scan order in preference to the vertical direction. 前記スキャン判定式生成手段が、前記参照画像のDCT係数の水平高周波係数と垂直高周波係数を比較して、水平高周波係数を垂直高周波係数より多く含めば水平方向を優先し、垂直高周波係数を水平高周波係数より多く含めば垂直方向を優先してスキャン順序を前記スキャン決定手段に決定させる前記スキャン判定式を生成する、請求項3記載の映像符号化装置。 The scan determination formula generation unit compares the horizontal high-frequency coefficient and the vertical high-frequency coefficient of the DCT coefficient of the reference image, and if the horizontal high-frequency coefficient is included more than the vertical high-frequency coefficient, the horizontal direction is given priority, and the vertical high-frequency coefficient is set as the horizontal high-frequency coefficient. 4. The video encoding apparatus according to claim 3, wherein when the number of coefficients is greater than the number of coefficients, the scan determination formula is generated to cause the scan determination unit to determine a scan order in preference to the vertical direction. 前記スキャン判定式生成手段が、前記参照画像ブロックごとの情報の統計から前記符号化画像ブロックの特徴を予測して前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination formula generation unit generates the scan determination formula by predicting a feature of the encoded image block from statistics of information for each reference image block. 前記スキャン判定式生成手段が、複数の前記符号化画像ブロックごとに前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination formula generation unit generates the scan determination formula for each of the plurality of encoded image blocks. 前記スキャン判定式生成手段が、過去の前記スキャン判定式を用いて前記スキャン判定式に含まれるパラメータの値を変更する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination formula generation unit changes a parameter value included in the scan determination formula using the past scan determination formula. 前記スキャン判定式生成手段が、前記符号化画像ブロックをスキャンした結果を用いて前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination expression generation unit generates the scan determination expression using a result of scanning the encoded image block. 前記スキャン判定式生成手段が、予め前記スキャン判定式を複数用意しておき切り替える、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination formula generation unit prepares and switches a plurality of scan determination formulas in advance. 映像を単体で復号化可能な基本レイヤと基本レイヤの復号化画像を画質向上させる拡張レイヤに階層化して符号化する階層符号化において、前記スキャン判定式生成手段が、基本レイヤ復号化画像を前記参照画像として、基本レイヤの前記参照画像ブロックに応じた拡張レイヤの符号化ブロックの前記スキャン順序を決定する前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 In the hierarchical coding for hierarchizing and encoding a base layer capable of decoding video alone and a decoded image of the basic layer into an enhancement layer for improving the image quality, the scan determination formula generating means converts the base layer decoded image into the base layer decoded image The video encoding apparatus according to claim 1, wherein the scan determination formula for determining the scan order of the encoded block of the enhancement layer corresponding to the reference image block of the base layer is generated as a reference image. 前記スキャン判定式生成手段が、映像の予測符号化において、前記予測符号化で参照する画像を前記参照画像として、前記スキャン判定式を生成する、請求項1記載の映像符号化装置。 The video encoding apparatus according to claim 1, wherein the scan determination expression generation unit generates the scan determination expression using an image referred to in the prediction encoding as the reference image in predictive encoding of a video. 前記予測符号化が、画面間予測符号化である、請求項11記載の映像符号化装置。 The video encoding apparatus according to claim 11, wherein the predictive encoding is inter-picture predictive encoding. 前記予測符号化が、画面内予測符号化である、請求項11記載の映像符号化装置。 The video encoding device according to claim 11, wherein the predictive encoding is intra-screen predictive encoding. 前記予測符号化が、前記予測符号化の前記参照画像ブロックの候補のうち、前記符号化画像ブロックの符号量が最も小さくなると前記スキャン判定式が予想する前記参照画像ブロックを予測符号化に用いる、請求項11記載の映像符号化装置。 The predictive coding uses the reference image block predicted by the scan determination formula for predictive coding when the code amount of the coded image block is the smallest among the reference image block candidates of the predictive coding. The video encoding device according to claim 11. 前記スキャン判定式生成手段が、前記予測符号化が予測に用いた情報を用いて、前記参照画像ブロックに応じた前記スキャン判定式を生成する、請求項11記載の映像符号化装置。 12. The video encoding apparatus according to claim 11, wherein the scan determination formula generation unit generates the scan determination formula corresponding to the reference image block using information used by the prediction encoding for prediction. 符号化した画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納した順序であるスキャン順序を、復号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン判定手段と、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得手段と、を有する構成をとる映像復号化装置。 The scan order, which is the order in which the encoded image block, which is a set of several pixels in the encoded image, is encoded and stored in the video stream is determined by the scan determination formula for the reference image block that is referred to at the time of decoding. A video decoding apparatus configured to include: a scan determination unit that determines; and a scan determination formula acquisition unit that acquires the scan determination formula from a video stream. 映像の符号化を実行する映像符号化方法であって、映像符号化装置が実行するところの、
符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を符号化の際に参照する他の参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、
符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成処理ステップと、
前記スキャン判定式を映像ストリームに格納するスキャン判定式格納処理ステップと、を有する映像符号化方法。
A video encoding method for encoding video, wherein the video encoding device executes
Scan determination formula for other reference image blocks that are referred to when encoding the scan order, which is the order in which an encoded image block that is a set of several pixels in the image to be encoded is encoded and stored in the video stream Scanning determination processing step determined by:
A scan determination expression generation processing step for generating the scan determination expression using a reference image referred to in encoding;
And a scan determination expression storing processing step of storing the scan determination expression in a video stream.
映像ストリームの復号化を実行する映像復号化方法であって、映像復号化装置が実行するところの、
符号化した画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納した順序であるスキャン順序を、復号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得処理ステップと、を有する映像復号化方法。
A video decoding method for decoding a video stream, which is executed by a video decoding device,
The scan order, which is the order in which an encoded image block, which is a set of several pixels in the encoded image, is encoded and stored in the video stream is determined by the scan determination formula for the reference image block that is referred to at the time of decoding. A video decoding method comprising: a scan determination processing step for determining; and a scan determination formula acquisition processing step for acquiring the scan determination formula from a video stream.
映像の符号化を実行するためにコンピュータを、
符号化する画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納する順序であるスキャン順序を符号化の際に参照する他の参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、
符号化の際に参照する参照画像を用いて前記スキャン判定式を生成するスキャン判定式生成処理ステップと、
前記スキャン判定式を映像ストリームに格納するスキャン判定式格納処理ステップと、として動作させる映像符号化プログラム。
Computer to perform video encoding,
Scan determination formula for other reference image blocks that are referred to when encoding the scan order, which is the order in which an encoded image block that is a set of several pixels in the image to be encoded is encoded and stored in the video stream Scanning determination processing step determined by:
A scan determination expression generation processing step for generating the scan determination expression using a reference image referred to in encoding;
A video encoding program that operates as a scan determination formula storage processing step for storing the scan determination formula in a video stream.
映像ストリームの復号化を実行するためにコンピュータを、
符号化した画像の中の幾つかの画素の集合である符号化画像ブロックを符号化して映像ストリームに格納した順序であるスキャン順序を、復号化の際に参照する参照画像ブロックに対するスキャン判定式によって決定するスキャン決定処理ステップと、前記スキャン判定式を映像ストリームから取得するスキャン判定式取得処理ステップと、として動作させる映像復号化プログラム。
A computer to perform the decoding of the video stream,
The scan order, which is the order in which the encoded image block, which is a set of several pixels in the encoded image, is encoded and stored in the video stream is determined by the scan determination formula for the reference image block that is referred to at the time of decoding. A video decoding program that operates as a scan determination processing step to determine and a scan determination formula acquisition processing step to acquire the scan determination formula from a video stream.
JP2005020750A 2005-01-28 2005-01-28 Device, method, and program for video image coding and decoding Pending JP2006211304A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005020750A JP2006211304A (en) 2005-01-28 2005-01-28 Device, method, and program for video image coding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005020750A JP2006211304A (en) 2005-01-28 2005-01-28 Device, method, and program for video image coding and decoding

Publications (1)

Publication Number Publication Date
JP2006211304A true JP2006211304A (en) 2006-08-10

Family

ID=36967664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005020750A Pending JP2006211304A (en) 2005-01-28 2005-01-28 Device, method, and program for video image coding and decoding

Country Status (1)

Country Link
JP (1) JP2006211304A (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011080806A1 (en) * 2009-12-28 2011-07-07 富士通株式会社 Moving picture coding device and moving picture decoding device
JP2011205259A (en) * 2010-03-24 2011-10-13 Nippon Hoso Kyokai <Nhk> Intra prediction device, encoder, decoder and program
JP2013524679A (en) * 2010-04-05 2013-06-17 サムスン エレクトロニクス カンパニー リミテッド Video encoding method, decoding method and apparatus using adaptive coefficient scan order
JP2013545415A (en) * 2010-12-03 2013-12-19 クゥアルコム・インコーポレイテッド Coding the position of the last significant coefficient in a video block based on the block scanning order in video coding
US8976861B2 (en) 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US9042459B1 (en) 2010-04-05 2015-05-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
CN104885464A (en) * 2012-12-26 2015-09-02 索尼公司 Image processing device and method
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
US9197890B2 (en) 2011-03-08 2015-11-24 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
JP2016006983A (en) * 2010-12-03 2016-01-14 クゥアルコム・インコーポレイテッドQualcomm Incorporated Video encoding using function-based scan order for transform coefficients
JP2016502817A (en) * 2012-11-29 2016-01-28 エルジー エレクトロニクス インコーポレイティド Video encoding / decoding method and apparatus supporting multiple layers
US9369736B2 (en) 2010-04-05 2016-06-14 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US11330272B2 (en) 2010-12-22 2022-05-10 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5488612B2 (en) * 2009-12-28 2014-05-14 富士通株式会社 Moving picture encoding apparatus and moving picture decoding apparatus
WO2011080806A1 (en) * 2009-12-28 2011-07-07 富士通株式会社 Moving picture coding device and moving picture decoding device
US9055302B2 (en) 2009-12-28 2015-06-09 Fujitsu Limited Video encoder and video decoder
JP2011205259A (en) * 2010-03-24 2011-10-13 Nippon Hoso Kyokai <Nhk> Intra prediction device, encoder, decoder and program
US9866875B2 (en) 2010-04-05 2018-01-09 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9294781B2 (en) 2010-04-05 2016-03-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US10158890B2 (en) 2010-04-05 2018-12-18 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9042459B1 (en) 2010-04-05 2015-05-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9042460B1 (en) 2010-04-05 2015-05-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049460B1 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
US10027991B2 (en) 2010-04-05 2018-07-17 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
JP2013524679A (en) * 2010-04-05 2013-06-17 サムスン エレクトロニクス カンパニー リミテッド Video encoding method, decoding method and apparatus using adaptive coefficient scan order
US9602845B2 (en) 2010-04-05 2017-03-21 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9369736B2 (en) 2010-04-05 2016-06-14 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9055290B2 (en) 2010-12-03 2015-06-09 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
JP2013545415A (en) * 2010-12-03 2013-12-19 クゥアルコム・インコーポレイテッド Coding the position of the last significant coefficient in a video block based on the block scanning order in video coding
JP2016006983A (en) * 2010-12-03 2016-01-14 クゥアルコム・インコーポレイテッドQualcomm Incorporated Video encoding using function-based scan order for transform coefficients
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US8976861B2 (en) 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US11330272B2 (en) 2010-12-22 2022-05-10 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9338449B2 (en) 2011-03-08 2016-05-10 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US9197890B2 (en) 2011-03-08 2015-11-24 Qualcomm Incorporated Harmonized scan order for coding transform coefficients in video coding
US10397577B2 (en) 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US10499059B2 (en) 2011-03-08 2019-12-03 Velos Media, Llc Coding of transform coefficients for video coding
US11006114B2 (en) 2011-03-08 2021-05-11 Velos Media, Llc Coding of transform coefficients for video coding
US11405616B2 (en) 2011-03-08 2022-08-02 Qualcomm Incorporated Coding of transform coefficients for video coding
US9491469B2 (en) 2011-06-28 2016-11-08 Qualcomm Incorporated Coding of last significant transform coefficient
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
JP2016502817A (en) * 2012-11-29 2016-01-28 エルジー エレクトロニクス インコーポレイティド Video encoding / decoding method and apparatus supporting multiple layers
CN104885464A (en) * 2012-12-26 2015-09-02 索尼公司 Image processing device and method

Similar Documents

Publication Publication Date Title
JP2006211304A (en) Device, method, and program for video image coding and decoding
US11425408B2 (en) Combined motion vector and reference index prediction for video coding
US11876979B2 (en) Image encoding device, image decoding device, image encoding method, image decoding method, and image prediction device
CN110024392B (en) Low complexity symbol prediction for video coding
KR101684207B1 (en) Video decoder, video encoder, video decoding method, and video encoding method
JP6055555B2 (en) Video codec architecture for next generation video
JP5021083B2 (en) Bitstream generation method
KR101906753B1 (en) Encoding method and device, decoding method and device, and computer-readable storage medium
JP7012809B2 (en) Image coding device, moving image decoding device, moving image coding data and recording medium
JP7332703B2 (en) Method and apparatus for affine-based inter-prediction of chroma sub-blocks
JP4908180B2 (en) Video encoding device
JP2023118785A (en) Encoder, decoder and corresponding method for intra prediction
KR102571317B1 (en) Video decoding method and video decoder
JP2010135864A (en) Image encoding method, device, image decoding method, and device
EP1432249A1 (en) Image encoding method and image decoding method
US9521412B2 (en) Method and device for determining residual data for encoding or decoding at least part of an image
KR20140124443A (en) Method for encoding and decoding video using intra prediction, and apparatus thereof
KR20220085836A (en) Video coding method and device
JP2006135376A (en) Moving picture coder, moving picture coding method, moving picture decoder, and moving picture decoding method
JP2006295408A (en) Image coding device and image coding program
Song et al. Unified depth intra coding for 3D video extension of HEVC
JP2017073598A (en) Moving image coding apparatus, moving image coding method, and computer program for moving image coding
JP2008141407A (en) Device and method for converting coding system
RU2821012C2 (en) Encoder, decoder and corresponding methods for intra-prediction
RU2816202C2 (en) Method and apparatus for affine external prediction of chroma subunits