JPWO2013125171A1 - Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program - Google Patents

Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program Download PDF

Info

Publication number
JPWO2013125171A1
JPWO2013125171A1 JP2014500895A JP2014500895A JPWO2013125171A1 JP WO2013125171 A1 JPWO2013125171 A1 JP WO2013125171A1 JP 2014500895 A JP2014500895 A JP 2014500895A JP 2014500895 A JP2014500895 A JP 2014500895A JP WO2013125171 A1 JPWO2013125171 A1 JP WO2013125171A1
Authority
JP
Japan
Prior art keywords
cost
intra prediction
prediction mode
offset
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014500895A
Other languages
Japanese (ja)
Inventor
達治 森吉
達治 森吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014500895A priority Critical patent/JPWO2013125171A1/en
Publication of JPWO2013125171A1 publication Critical patent/JPWO2013125171A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

特定の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題を軽減して、良好な主観画質を実現する。本イントラ予測モード判定装置は、符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードの各々で画素値を予測して、複数の予測画像を生成する予測画像生成部と、符号化対象ブロックと複数の予測画像の各々との誤差量コストを算出する差分画像コスト計算部と、複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコストを決定するオフセットコスト決定部と、誤差量コストとオフセットコストを用いて所定の演算を行って評価コストを算出するコスト算出部と、評価コストに基づいてイントラ予測モードを選択するモード選択部と、を備える。It reduces the problem that a specific coding noise pattern appears as a pattern attached to a specific portion of an image, and realizes a good subjective image quality. The intra-prediction mode determination device predicts a pixel value in each of a plurality of intra-prediction modes using an encoded pixel in a predetermined range from an encoding target block obtained by dividing the encoding target image by a predetermined size. Corresponding to each of a prediction image generation unit that generates a plurality of prediction images, a difference image cost calculation unit that calculates an error amount cost between the encoding target block and each of the plurality of prediction images, and a plurality of intra prediction modes. An offset cost determination unit that determines an offset cost that changes depending on the progress of the image frame, a cost calculation unit that calculates an evaluation cost by performing a predetermined calculation using the error amount cost and the offset cost, and an evaluation cost A mode selection unit that selects an intra prediction mode based on the mode selection unit.

Description

本発明は、符号化結果の主観的な画質を向上できるイントラ予測モード判定装置、イントラ予測モード判定方法、及びイントラ予測モード判定プログラム記憶媒体に関し、特にイントラ予測モードの選択に起因する画質の低下に対応するイントラ予測モード判定装置、イントラ予測モード判定方法、及びイントラ予測モード判定プログラム記憶媒体に関する。  The present invention relates to an intra prediction mode determination device, an intra prediction mode determination method, and an intra prediction mode determination program storage medium that can improve the subjective image quality of an encoding result, and particularly to a decrease in image quality caused by selection of an intra prediction mode. The present invention relates to a corresponding intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program storage medium.

近年、動画像の圧縮符号化技術は、広く普及し、デジタル放送、光学ディスクによる映像コンテンツ頒布、インターネット等を経由した映像配信など、幅広い用途に利用されている。  In recent years, moving image compression coding technology has been widely used, and is used in a wide range of applications such as digital broadcasting, video content distribution using an optical disc, and video distribution via the Internet.

動画像信号を低ビットレート、高圧縮率かつ高画質で符号化して符号化データを生成したり、符号化された動画像を復号化したりする動画像符号化技術は、各種の国際団体によって国際標準規格として標準化され、広く用いられている。例えば、ITU(International Telecommunication Union)は、H.261、H.263などを標準化している。ISO(International Organization for Standardization)は、MPEG−1、MPEG−2、MPEG−4などを標準化している。SMPTE(Society of Motion Picture and Television Engineers)は、VC−1などを標準化している。さらに、ITUとISOは共同で、H.264/MPEG−4AVCを標準化した。H.264/MPEG−4AVCの規格内容は、非特許文献1に記載されている。以降、H.264/MPEG−4AVCを、単に「H.264」という。  Video encoding technology that generates encoded data by encoding video signals with a low bit rate, high compression rate, and high image quality, and that decodes encoded video images, has been developed by various international organizations. It is standardized as a standard and widely used. For example, ITU (International Telecommunication Union) 261, H.H. H.263 is standardized. ISO (International Organization for Standardization) standardizes MPEG-1, MPEG-2, MPEG-4, and the like. SMPTE (Society of Motion Picture and Television Engineers) standardizes VC-1 and the like. Furthermore, ITU and ISO will jointly H.264 / MPEG-4AVC was standardized. H. The standard content of H.264 / MPEG-4AVC is described in Non-Patent Document 1. Hereinafter, H.C. H.264 / MPEG-4AVC is simply referred to as “H.264”.

H.264は、それ以前の動画像符号化技術に比べ、さらなる圧縮効率向上、画質向上を実現できることが知られている。H.264では、それ以前の動画像符号化技術よりも高い圧縮効率を実現するために、符号化の要素技術として、種々の符号化ツールが採用されている。その符号化ツールの一つに「イントラ予測」がある。イントラ予測は、ある画像領域の符号化にあたって、同一画像フレーム内の近傍の画素情報を用いた予測であり、大幅な情報圧縮を行うことができる技術である。すなわち、イントラ予測では、同一画像フレーム内の近傍の画素情報を用いて、符号化対象の画像領域の予測画像が生成される。ここでの「近傍」とは、符号化対象の画像領域からの空間的距離が所定値以内の範囲にあることを意味する。具体的な近傍の画素の位置は、後述のように、複数種類規定されたイントラ予測モードのそれぞれについて規定されている。そして、生成された予測画像と現画像の差分情報が符号化される。イントラ予測は、同一画像フレームの画素情報を用いて予測を行うことから、「画面内予測」、「フレーム内予測」とも呼ばれる。  H. H.264 is known to be able to realize further improvement in compression efficiency and image quality as compared with the previous moving image encoding technology. H. In H.264, various encoding tools are employed as elemental technologies for encoding in order to realize higher compression efficiency than the previous moving image encoding technology. One of the encoding tools is “intra prediction”. Intra-prediction is prediction that uses pixel information in the vicinity of the same image frame when encoding a certain image region, and is a technique that can perform significant information compression. That is, in intra prediction, a prediction image of an image region to be encoded is generated using pixel information in the vicinity of the same image frame. “Neighborhood” here means that the spatial distance from the image region to be encoded is within a predetermined value. As described later, specific pixel positions in the vicinity are defined for each of a plurality of types of intra prediction modes. Then, difference information between the generated predicted image and the current image is encoded. Intra prediction is also referred to as “intra-screen prediction” or “intra-frame prediction” because it performs prediction using pixel information of the same image frame.

図1は、H.264で規定されたイントラ予測方式で符号化を行ってイントラ符号化フレーム(Iフレーム)を生成する動画像符号化装置の構成例を示す。動画像符号化装置に新たな画像が入力されると、マクロブロック(Macro Block(MB))と呼ばれる16×16画素のブロック単位で符号化処理が行われる。  FIG. 2 shows a configuration example of a moving picture encoding apparatus that generates an intra-encoded frame (I frame) by performing encoding using an intra-prediction method defined in H.264. When a new image is input to the moving image encoding apparatus, encoding processing is performed in units of 16 × 16 pixel blocks called macro blocks (Macro Block (MB)).

イントラ予測モード判定装置100は、入力画像と、同一画像内の符号化済みマクロブロックの画像情報を用いて適切なイントラ予測モードを選択し、選択したモードを示すイントラ予測モード情報を出力する。イントラ予測モード判定部100は、一般的には、符号化効率が最も高くなるイントラ予測モードを選択する。  The intra prediction mode determination apparatus 100 selects an appropriate intra prediction mode using the input image and image information of the encoded macroblock in the same image, and outputs intra prediction mode information indicating the selected mode. The intra prediction mode determination unit 100 generally selects an intra prediction mode that provides the highest coding efficiency.

イントラ予測(IP:Intra Prediction)部101では、加算部108から供給される同一画像内の符号化済みマクロブロックの画像情報と、イントラ予測モード判定装置100から供給されるイントラ予測モード情報を用いてイントラ予測処理を行い、イントラ予測画像を出力する。  In an intra prediction (IP) unit 101, image information of an encoded macroblock in the same image supplied from the adder unit 108 and intra prediction mode information supplied from the intra prediction mode determination apparatus 100 are used. An intra prediction process is performed and an intra prediction image is output.

減算部102では、入力画像から、イントラ予測部101から出力されるイントラ予測画像を減算し、予測誤差画像を出力する。この予測誤差画像に対し、整数変換(DIT:Discrete Integer Transform)部103がDCT(Discrete Cosine Transform)と同様な直交変換処理を行い、さらに量子化(Q:Quantize)部104で量子化処理を行い、量子化された直交変換係数列が出力される。  The subtraction unit 102 subtracts the intra prediction image output from the intra prediction unit 101 from the input image, and outputs a prediction error image. An integer transform (DIT: Discrete Integer Transform) unit 103 performs orthogonal transformation processing similar to DCT (Discrete Cosine Transform) on the prediction error image, and further, a quantization (Q: Quantize) unit 104 performs quantization processing. The quantized orthogonal transform coefficient sequence is output.

可変長符号化(VLC::Variable-Length Coding)部105は、量子化された直交変換係数列を所定の規則で符号化し、符号化結果としてビットストリームを出力する。このビットストリームがH.264方式の符号化装置の出力ビットストリームである。  A variable-length coding (VLC :) variable section 105 encodes the quantized orthogonal transform coefficient sequence according to a predetermined rule, and outputs a bit stream as a coding result. This bit stream is H.264. This is an output bit stream of an H.264 encoding device.

また、量子化された直交変換係数列に対して、逆量子化(IQ:Inverse Quantization)部106が逆量子化処理を、逆整数変換(IDIT:Inverse Discrete Integer Transform)部107が逆整数変換処理を行う。逆量子化及び逆整数変換が施された直交変換係数列は、加算部108でイントラ予測部101から出力される予測画像と加算され、前述の同一画像内の符号化済みマクロブロックの画像情報」となる。さらに、デブロックフィルタ部109でデブロックフィルタ処理を行うことで、ローカルデコード画像を生成する。ローカルデコード画像はフレームバッファ110に記憶され、後続フレームの符号化に利用される。具体的な処理内容は、例えば非特許文献2に開示されている。  In addition, an inverse quantization (IQ) unit 106 performs inverse quantization processing and an inverse integer transform (IDIT) unit 107 performs inverse integer conversion processing on the quantized orthogonal transform coefficient sequence. I do. The orthogonal transform coefficient sequence subjected to the inverse quantization and the inverse integer transform is added to the predicted image output from the intra prediction unit 101 by the adding unit 108, and the image information of the coded macroblock in the same image described above. It becomes. Further, the deblock filter unit 109 performs deblock filter processing to generate a local decoded image. The local decoded image is stored in the frame buffer 110 and used for encoding the subsequent frame. Specific processing contents are disclosed in Non-Patent Document 2, for example.

イントラ予測は、同一フレームの画像における空間的に近い位置では絵柄に類似性がある場合が多いという画像の性質を利用して、予測画像を生成するものである。そのため、符号化対象の画像の絵柄のパターンによって適切なイントラ予測の方式は異なる。そこで、H.264ではイントラ予測のモードとして、輝度成分の16×16画素サイズで4モード、8×8画素サイズで9モード、4×4画素サイズで9モード、色差成分で4モードがそれぞれ規定されている。  Intra prediction is a method for generating a predicted image by utilizing the property of an image that there are many similarities in patterns at spatially close positions in an image of the same frame. Therefore, an appropriate intra prediction method varies depending on the pattern of the image to be encoded. Therefore, H.H. In H.264, 4 modes are defined for the 16 × 16 pixel size of the luminance component, 9 modes for the 8 × 8 pixel size, 9 mode for the 4 × 4 pixel size, and 4 modes for the color difference component.

図2は、輝度成分の4×4画素ブロックでのイントラ予測モードにおける、イントラ予測画像の生成動作を示す。例えば、モード0(vertical)では、符号化対象の4×4ブロックの上側に隣接する符号化済みの画素A、B、C、Dが用いられ、これらの画素の輝度成分が縦方向にコピーされイントラ予測画像が生成される。また、例えばモード4(diagonal down right)では、符号化対象の4×4ブロックの上側及び左側に隣接する符号化済みの画素A、B、C、D、I、J、K、L、Mが用いられる。そして、これらの隣接画素に対して平滑化フィルタが適用されながら、右下方向の斜め45度の方向に輝度成分が延長され、イントラ予測画像が生成される。また、モード2(DC)では、符号化対象の4×4ブロックの上側及び左側に隣接する符号化済みの画素の輝度成分の平均値を、イントラ予測画像の輝度成分とする。これらの処理の詳細や他のサイズのブロックでのイントラ予測処理の内容は非特許文献1に開示されている。  FIG. 2 shows an operation for generating an intra-predicted image in the intra-prediction mode with the 4 × 4 pixel block of the luminance component. For example, in mode 0 (vertical), encoded pixels A, B, C, and D adjacent to the upper side of the 4 × 4 block to be encoded are used, and the luminance components of these pixels are copied in the vertical direction. An intra-predicted image is generated. For example, in mode 4 (diagonal down right), encoded pixels A, B, C, D, I, J, K, L, and M adjacent to the upper side and the left side of the 4 × 4 block to be encoded are displayed. Used. Then, while the smoothing filter is applied to these adjacent pixels, the luminance component is extended in a diagonally 45 degree direction in the lower right direction, and an intra predicted image is generated. In mode 2 (DC), the average value of the luminance components of the encoded pixels adjacent on the upper and left sides of the 4 × 4 block to be encoded is used as the luminance component of the intra-predicted image. The details of these processes and the contents of intra prediction processes in blocks of other sizes are disclosed in Non-Patent Document 1.

以上のように、モード0、2、4では、「隣接する画素」が用いられる。その他にも、モード1、5、6でも、予測画像に隣接する画素が用いられる。ところが、図2に示されるように、モード3、7、8では、隣接する画素に加え、「隣接しない画素」も用いられる。例えば、モード3では、画素E、F、G、Hは、予測画像に隣接していない。ただし、これらの画素も、予測画像からある範囲内の距離に位置するという意味で、「近傍の画素」である。予測画像の生成のために、「隣接する画素」のみが用いられるか、「近傍の画素」も用いられるかは、H.264で規定されており、厳密な区別は本発明にとっては重要でない。そのため、本明細書では、特に必要がない限り、「隣接」も含めて、「近傍」と表現する。  As described above, in modes 0, 2, and 4, “adjacent pixels” are used. In addition, in modes 1, 5, and 6, pixels adjacent to the predicted image are used. However, as shown in FIG. 2, in modes 3, 7, and 8, "non-adjacent pixels" are used in addition to adjacent pixels. For example, in mode 3, the pixels E, F, G, and H are not adjacent to the predicted image. However, these pixels are also “neighboring pixels” in the sense that they are located at a distance within a certain range from the predicted image. Whether only “adjacent pixels” or “neighboring pixels” are used to generate a predicted image is described in H.264. The exact distinction is not important to the present invention. Therefore, in this specification, “neighboring” including “adjacent” is expressed unless particularly necessary.

イントラ予測モード判定装置100では、上記のイントラ予測モードの中から適切なモードを選択する。非特許文献2には、レート歪み最適化の考え方に基づいて適切なイントラ予測モードを判定する技術が開示されている。この技術では、それぞれのイントラ予測モードに対して、下記の式(1)で表されるコストが算出され、このコストの値が最小になるイントラ予測モードが選択される。  In the intra prediction mode determination apparatus 100, an appropriate mode is selected from the above intra prediction modes. Non-Patent Document 2 discloses a technique for determining an appropriate intra prediction mode based on the concept of rate distortion optimization. In this technique, the cost represented by the following equation (1) is calculated for each intra prediction mode, and the intra prediction mode that minimizes the cost value is selected.

Cost = D+λR ・・・(1)
ここで、Dは予測誤差画像の誤差量である。予測誤差画像の誤差量としては、SATD(Sum of Absolute Transformed Differences。予測誤差画像のアダマール変換係数の絶対値和)やSSD(Sum of Squared Differences)(予測誤差画像の画素値の2乗和)などが用いられる。
Cost = D + λR (1)
Here, D is the error amount of the prediction error image. As the error amount of the prediction error image, SATD (Sum of Absolute Transformed Differences), SSD (Sum of Squared Differences) (Sum of Squared Differences) (sum of squares of pixel values of prediction error image), etc. Is used.

Rはモード情報の符号化に要するビット数である。H.264では、イントラ予測のモード情報の符号化について、2種類の符号化方法が規定されている。1つは、モード番号をそのまま符号化する方法で、他の1つは、近傍のブロックのイントラ予測モードからイントラ予測モードを予測して予測モード番号との違いの情報を符号化する方法である。そこで、選択されたモードの符号化方法に応じて、それぞれのモード情報の符号化に要するビット数が算出される。  R is the number of bits required for encoding mode information. H. H.264 defines two types of encoding methods for encoding mode information for intra prediction. One is a method of encoding the mode number as it is, and the other is a method of encoding the information of the difference from the prediction mode number by predicting the intra prediction mode from the intra prediction modes of neighboring blocks. . Therefore, the number of bits required to encode each mode information is calculated according to the encoding method of the selected mode.

λは量子化ステップサイズ等によって決まる重み付け係数である。  λ is a weighting coefficient determined by the quantization step size and the like.

Costは、各イントラ予測モードのコストを評価するために用いられる値なので、以降、「評価コスト」と呼ぶ。  Since Cost is a value used for evaluating the cost of each intra prediction mode, it is hereinafter referred to as “evaluation cost”.

図3は、イントラ予測モード判定部100の内部構成例を示す。画像入力部300は符号化対象の画像ブロックを入力する。近傍画像記憶部301は符号化対象ブロックの近傍位置の符号化済み画像を記憶する。近傍予測モード記憶部302は、符号化対象ブロックの近傍位置の画像ブロックでのイントラ予測モード情報を記憶する。  FIG. 3 shows an internal configuration example of the intra prediction mode determination unit 100. The image input unit 300 inputs an image block to be encoded. The neighboring image storage unit 301 stores a coded image at a position near the coding target block. The neighborhood prediction mode storage unit 302 stores intra prediction mode information in an image block near the encoding target block.

予測画像生成部303、差分画像コスト計算部304、モード情報符号化コスト計算部305、コスト算出部306は、選択の対象となる複数のイントラ予測モードのそれぞれに対応した処理を行う。  The prediction image generation unit 303, the difference image cost calculation unit 304, the mode information encoding cost calculation unit 305, and the cost calculation unit 306 perform processing corresponding to each of a plurality of intra prediction modes to be selected.

予測画像生成部303は、近傍画像記憶部301から供給される近傍画像データを用いて、所定のイントラ予測モードによるイントラ予測処理を行って、予測画像を生成する。差分画像コスト計算部304は、画像入力部300から供給される符号化対象画像と、予測画像生成部303から供給される予測画像との差分画像を計算し、式(1)のDである予測誤差画像の誤差量を計算する。  The predicted image generation unit 303 performs intra prediction processing in a predetermined intra prediction mode using the neighboring image data supplied from the neighboring image storage unit 301, and generates a predicted image. The difference image cost calculation unit 304 calculates a difference image between the encoding target image supplied from the image input unit 300 and the prediction image supplied from the prediction image generation unit 303, and the prediction that is D in Expression (1). The error amount of the error image is calculated.

モード情報符号化コスト計算部305は、近傍予測モード記憶部302から供給される近傍のイントラ予測モード情報に基づいて、式(1)のRである、所定のイントラ予測モード情報の符号化に必要なビット数を計算する。  The mode information encoding cost calculation unit 305 is necessary for encoding predetermined intra prediction mode information, which is R in Expression (1), based on the neighboring intra prediction mode information supplied from the neighborhood prediction mode storage unit 302. Calculate the number of bits.

コスト算出部306は式(1)に従ってDとRの重み付け加算を行って、式(1)の評価コストCostを算出する。モード選択部307は、複数のイントラ予測モードのそれぞれに対応する評価コストを比較し、評価コストが最小となるイントラ予測モードを適切なイントラ予測モードとして出力する。  The cost calculation unit 306 calculates the evaluation cost Cost of Expression (1) by performing weighted addition of D and R according to Expression (1). The mode selection unit 307 compares the evaluation costs corresponding to each of the plurality of intra prediction modes, and outputs the intra prediction mode that minimizes the evaluation cost as an appropriate intra prediction mode.

このようなイントラ予測モード判定技術によると、絵柄が類似した入力画像に対しては同じイントラ予測モードが選択されやすくなる。特に、小さいモード番号のイントラ予測モード(0、1、2など)は、式(1)のRが小さくなることが多いため、選択されやすくなる傾向がある。また、式(1)のように、予測誤差画像の誤差量だけではなくRも加味してモードが選択されるため、予測誤差量が最小になるモードが必ずしも選択されるとは限らない。このため、λの大きさによっては、入力画像と予測画像の類似度がそれほど高くないモードであっても、Rがより小さくなるモードが優先的に選択される場合がある。  According to such an intra prediction mode determination technique, the same intra prediction mode is easily selected for input images with similar patterns. In particular, an intra prediction mode (0, 1, 2, etc.) with a small mode number tends to be easily selected because R in Expression (1) is often small. Further, since the mode is selected in consideration of not only the error amount of the prediction error image but also R as in Expression (1), the mode that minimizes the prediction error amount is not necessarily selected. For this reason, depending on the magnitude of λ, even in a mode in which the similarity between the input image and the predicted image is not so high, a mode in which R is smaller may be preferentially selected.

イントラ予測が用いられた場合、符号化結果の画像には特有の性質を持つ符号化ノイズが発生することがある。図2に示すように、イントラ予測を用いて生成された予測画像は、特定の方向に画素情報がコピーされるために、その方向の縞状の画像となる(モード2は除く)。そのため、符号化ビットレートの制約等により予測誤差画像の情報を十分正確に符号化できない場合、符号化結果の画像にも予測画像の縞模様がある程度残留する。  When intra prediction is used, encoding noise having specific properties may be generated in the encoded image. As shown in FIG. 2, since the pixel information is copied in a specific direction, the predicted image generated using intra prediction becomes a striped image in that direction (except for mode 2). For this reason, when the information of the prediction error image cannot be encoded sufficiently accurately due to the restriction of the encoding bit rate, etc., a stripe pattern of the prediction image remains to some extent in the image of the encoding result.

図4は、選択されたイントラ予測モードとイントラ予測により発生する符号化ノイズの傾向の一例を示す。図4中の個々の四角が1つのイントラ予測ブロックを示す。ある画像に対して図4のようなイントラ予測モードが選択された場合、符号化結果の画像には、各ブロックのイントラ予測で適用されたモードに応じた方向の縞状の符号化ノイズが発生する傾向がある。なお、図4ではノイズの傾向を説明するために符号化ノイズが特に強調して示されているが、通常はこのように明らかな符号化ノイズが現れるとは限らない。  FIG. 4 shows an example of the selected intra prediction mode and the tendency of coding noise generated by intra prediction. Each square in FIG. 4 represents one intra prediction block. When an intra prediction mode as shown in FIG. 4 is selected for a certain image, striped coding noise in the direction corresponding to the mode applied in the intra prediction of each block is generated in the image of the coding result. Tend to. In FIG. 4, the coding noise is particularly emphasized in order to explain the tendency of the noise. However, such a clear coding noise does not always appear.

この符号化ノイズは、縞状の人工的なパターンであるため、動画像の視聴時に視聴者の気になりやすい。  Since this coding noise is a striped artificial pattern, it is easy for viewers to worry when watching a moving image.

また、時間的に連続する画像間で異なるノイズパターンが現れる可能性もあり、そのような場合にはちらつき(フリッカ)として見えてしまう。このイントラ予測に起因するフリッカを低減する技術が特許文献1に開示されている。特許文献1の技術では、イントラ予測モード判定において、式(1)に示す評価コストに加え、各イントラ予測を用いた場合のローカルデコード画像と同位置の、過去のローカルデコード画像との差分量も考慮される。すなわち、評価コストと過去のローカルデコード画像との差分量の線形和が最小となるイントラ予測モードが選択される。同一フレームの画面内、すなわち空間方向の予測誤差、及び時間方向の予測誤差が小さくなるイントラ予測モードが選択されることで、時間方向のちらつきであるフリッカが抑制される。  In addition, a different noise pattern may appear between temporally continuous images, and in such a case, it appears as flicker. A technique for reducing flicker caused by the intra prediction is disclosed in Patent Document 1. In the technique of Patent Literature 1, in the intra prediction mode determination, in addition to the evaluation cost shown in Expression (1), the difference amount between the local decoded image and the past local decoded image at the same position as the local decoded image when each intra prediction is used is also calculated. Be considered. That is, the intra prediction mode that minimizes the linear sum of the difference between the evaluation cost and the past local decoded image is selected. Flicker, which is flickering in the time direction, is suppressed by selecting the intra prediction mode in which the prediction error in the spatial direction and the prediction error in the time direction are reduced within the same frame screen.

特許文献2、3、4にも、式(1)を用いて評価コストを算出し、評価コストが最小となる予測モードを選択する技術が開示されている。  Patent Documents 2, 3, and 4 also disclose a technique for calculating an evaluation cost using Expression (1) and selecting a prediction mode that minimizes the evaluation cost.

特許第4383240号公報Japanese Patent No. 4383240 特開2007−81474号公報JP 2007-81474 A 特開2007−243337号公報JP 2007-243337 A 特開2010−251952号公報JP 2010-251952 A

ITU-T Recommendation H.264 "Advanced video coding for generic audiovisual services", 2010年3月ITU-T Recommendation H.264 "Advanced video coding for generic audiovisual services", March 2010 Joint Video Team (JVT) of ISO/IEC MPEG and ITU−T VCEG, Document JVT-O079, "Text Description of Joint Mode Reference Encoding Method and Decoding Concealment Method", 2005年4月Joint Video Team (JVT) of ISO / IEC MPEG and ITU-T VCEG, Document JVT-O079, "Text Description of Joint Mode Reference Encoding Method and Decoding Concealment Method", April 2005

イントラ予測モード判定によって発生する符号化ノイズパターンの時間的な変化の様子の一例を図5に示す。  An example of the temporal change in the coding noise pattern generated by the intra prediction mode determination is shown in FIG.

前述のように、絵柄が類似した入力画像に対しては同じイントラ予測モードが選択されやすくなる傾向がある。そのため、時間方向で連続する複数の入力画像フレームの絵柄が類似している場合には、選択されるイントラ予測モードも、図5のように、時間的に連続して似た予測モードが選択される場合がある。イントラ予測による符号化ノイズパターンは、選択されたイントラ予測モードの予測方向に応じた縞状になる。そのため、連続して似た予測モードが選択された場合の符号化ノイズパターンは、図5の例のように、似たパターンが時間的に連続して発生するものとなる傾向がある。このようなノイズパターンは、全体として、特定の人工的な幾何学的模様を構成して画像中の特定の位置に複数フレームにわたって発生する。そのため、動画像として視聴すると、画像の特定箇所に貼り付いた模様として見えることになり、主観的な画質を大きく低下させてしまう。  As described above, the same intra prediction mode tends to be easily selected for input images with similar patterns. Therefore, when the images of a plurality of input image frames that are continuous in the time direction are similar, the intra prediction mode to be selected is also selected as a temporally similar prediction mode as shown in FIG. There is a case. The encoding noise pattern by intra prediction becomes striped according to the prediction direction of the selected intra prediction mode. Therefore, the encoding noise pattern in the case where similar prediction modes are selected continuously tends to generate similar patterns in time as in the example of FIG. Such a noise pattern forms a specific artificial geometric pattern as a whole and is generated over a plurality of frames at a specific position in the image. Therefore, when viewed as a moving image, it appears as a pattern attached to a specific part of the image, and the subjective image quality is greatly reduced.

この現象は、Iフレームが連続する場合に目立ちやすく、すべてのフレームをIフレームとして符号化する場合などに特に問題となる。例えば、青空や壁など滑らかなグラデーションの絵柄領域を連続してIフレームとして符号化すると、符号化ノイズパターンによって本来滑らかに変化する絵柄が段々状に変化する擬似輪郭が現れる。その擬似輪郭が複数のフレームにわたって連続するため、復号後に画像として再生すると、青空や壁などに擬似輪郭が貼り付いたような画像が再生される結果となる。  This phenomenon is conspicuous when I frames are continuous, and is particularly problematic when all frames are encoded as I frames. For example, when a smooth gradation pattern region such as a blue sky or a wall is continuously encoded as an I frame, a pseudo contour appears in which a pattern that originally changes smoothly due to the encoded noise pattern changes stepwise. Since the pseudo contour is continuous over a plurality of frames, reproduction as an image after decoding results in reproduction of an image in which the pseudo contour is attached to a blue sky or a wall.

また、特許文献1に開示されている技術によってもこの問題を解決することはできない。特許文献1の技術では、(1)式の評価コストを用いて画面内及び時間方向の予測誤差が小さくなるイントラ予測モードが選択される。そのため、時間的に連続するフレーム間では予測画像の差が小さくなるイントラ予測モード、すなわち同じイントラ予測モードを連続して選択する傾向が強くなる。  Further, this technique cannot be solved even by the technique disclosed in Patent Document 1. In the technique of Patent Document 1, an intra prediction mode in which the prediction error in the screen and in the time direction is reduced is selected using the evaluation cost of equation (1). For this reason, the intra prediction mode in which the difference in the predicted image is small between temporally consecutive frames, that is, the same intra prediction mode is more likely to be continuously selected.

特許文献2の技術でも、同様に(1)式の評価コストを用いて予測モードが決定される。しかし、時間的に連続するフレームに、同じ符号化モードが適用される可能性が高いという問題に関しては、考慮されていない。そのため、縞状のノイズパターンが発生する可能性が高い。  In the technique of Patent Document 2, the prediction mode is similarly determined using the evaluation cost of equation (1). However, the problem that the same coding mode is likely to be applied to temporally consecutive frames is not taken into consideration. Therefore, there is a high possibility that a striped noise pattern is generated.

特許文献3の技術では、評価コストの算出に重み付けが導入されている(特許文献3の(2)式参照)。しかし、その重み付けは、予測誤差画像の誤差量Dが評価コストに与える影響度を変化させるものではなく、入力画像の画素のみを用いた係数DIFFについての重み付けである。このように、時間的に連続するフレームに、同じ符号化モードが適用される可能性が高いという問題に関しては、考慮されていない。そのため、縞状のノイズパターンが発生する可能性が高い。(2)式で求められる評価コストは、(1)式の評価コストとは意味が異なる。従って、そもそも、予測画像の誤差を小さくするという効果は期待することはできない。  In the technique of Patent Document 3, weighting is introduced to calculate the evaluation cost (see Expression (2) of Patent Document 3). However, the weighting does not change the degree of influence of the error amount D of the prediction error image on the evaluation cost, but is a weighting for the coefficient DIFF using only the pixels of the input image. Thus, the problem that the same coding mode is likely to be applied to temporally continuous frames is not taken into consideration. Therefore, there is a high possibility that a striped noise pattern is generated. The evaluation cost obtained by equation (2) has a different meaning from the evaluation cost of equation (1). Therefore, in the first place, the effect of reducing the error of the predicted image cannot be expected.

特許文献4の技術では、(1)式の評価コストを用いて予測モードが決定され、さらに、D(特許文献4では「SA(T)D」)に対するオフセット(特許文献4では「SA(T)D0」)も導入される。しかし、時間的に連続するフレームに、同じ符号化モードが適用される可能性が高いという問題に関しては、考慮されていない。そのため、縞状のノイズパターンが発生する可能性が高い。  In the technique of Patent Document 4, the prediction mode is determined using the evaluation cost of the expression (1), and further, an offset with respect to D ("SA (T) D" in Patent Document 4) is "SA (T ) D0 ") is also introduced. However, the problem that the same coding mode is likely to be applied to temporally consecutive frames is not taken into consideration. Therefore, there is a high possibility that a striped noise pattern is generated.

以上のように、特許文献1−4の技術では、時間的に連続するフレームに、同じ符号化モードが適用される可能性が高いため、縞状のノイズパターンが発生する可能性が高いという課題がある。
(発明の目的)
本発明の目的は、特定の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題を軽減して、良好な主観画質を実現するイントラ予測モード判定装置、イントラ予測モード判定方法及びイントラ予測モード判定プログラム記憶媒体を提供することにある。
As described above, in the techniques of Patent Literatures 1-4, since the same encoding mode is likely to be applied to temporally continuous frames, there is a high possibility that a striped noise pattern is generated. There is.
(Object of invention)
An object of the present invention is to reduce the problem that a specific coding noise pattern appears as a pattern attached to a specific portion of an image, and to achieve an excellent prediction image quality, an intra prediction mode determination device, an intra prediction mode determination method, and an intra To provide a prediction mode determination program storage medium.

本発明のイントラ予測モード判定装置は、符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードの各々で画素値を予測して、複数の予測画像を生成する予測画像生成部と、符号化対象ブロックと複数の予測画像の各々との誤差量コストを算出する差分画像コスト計算部と、複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコストを決定するオフセットコスト決定部と、誤差量コストとオフセットコストを用いて所定の演算を行って評価コストを算出するコスト算出部と、評価コストに基づいてイントラ予測モードを選択するモード選択部と、を備えることを特徴とする。  The intra prediction mode determination apparatus according to the present invention predicts a pixel value in each of a plurality of intra prediction modes using a predetermined range of encoded pixels from an encoding target block obtained by dividing an encoding target image by a predetermined size. A prediction image generation unit that generates a plurality of prediction images, a difference image cost calculation unit that calculates an error amount cost between the encoding target block and each of the plurality of prediction images, and a plurality of intra prediction modes. Corresponding offset cost determination unit that determines an offset cost that changes depending on the progress of the image frame, a cost calculation unit that calculates an evaluation cost by performing a predetermined calculation using the error amount cost and the offset cost, and an evaluation A mode selection unit that selects an intra prediction mode based on cost.

本発明のイントラ予測モード判定方法は、符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードで符号化対象ブロックの画素値を予測して、予測画像を生成し、符号化対象ブロックと予測画像の誤差量コストを算出し、複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコスト及び誤差量コストとを用いて所定の演算を行って評価コストを算出し、モードコストに基づいてイントラ予測モードを選択することを特徴とする。  In the intra prediction mode determination method of the present invention, a pixel of an encoding target block in a plurality of intra prediction modes using an encoded pixel in a predetermined range from an encoding target block obtained by dividing the encoding target image by a predetermined size. Offset value that predicts the value, generates a predicted image, calculates the error amount cost between the encoding target block and the predicted image, and corresponds to each of a plurality of intra prediction modes, and changes depending on the progress of the image frame In addition, the evaluation cost is calculated by performing a predetermined calculation using the error amount cost and the intra prediction mode is selected based on the mode cost.

本発明のイントラ予測モード判定プログラム記憶媒体は、イントラ予測モード判定装置が備えるコンピュータを、符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードで符号化対象ブロックの画素値を予測して、予測画像を生成する予測画像生成手段と、符号化対象ブロックと予測画像の誤差量コストを算出する差分画像コスト計算手段と、複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコスト及び誤差量コストとを用いて所定の演算を行って評価コストを算出する評価コスト算出手段と、モードコストに基づいてイントラ予測モードを選択するモード選択手段、として機能させるためプログラムを格納する。  The intra prediction mode determination program storage medium of the present invention uses a computer included in an intra prediction mode determination apparatus using encoded pixels in a predetermined range from an encoding target block obtained by dividing an encoding target image by a predetermined size, A prediction image generation unit that predicts the pixel value of the encoding target block in a plurality of intra prediction modes and generates a prediction image; a differential image cost calculation unit that calculates an error amount cost between the encoding target block and the prediction image; An evaluation cost calculating means for calculating an evaluation cost by performing a predetermined calculation using an offset cost and an error amount cost corresponding to each of a plurality of intra prediction modes and changing depending on the progress of an image frame; and a mode cost A program is stored for functioning as mode selection means for selecting an intra prediction mode based on the above.

本発明のイントラ予測モード判定装置、イントラ予測モード判定方法、イントラ予測モード判定プログラム記憶媒体は、特定の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題を軽減し、符号化結果の主観的な画質を向上させることができる。  The intra prediction mode determination apparatus, the intra prediction mode determination method, and the intra prediction mode determination program storage medium of the present invention reduce the problem that a specific coding noise pattern appears as a pattern attached to a specific portion of an image, and result of encoding Can improve the subjective image quality.

その理由は、過去フレームのイントラ予測モードと同じ予測モードに対してはイントラ予測モード判定時のコストにオフセットコストを設定することにより、時間的に連続して同じイントラ予測モードが選択される頻度を低くできるためである。  The reason is that for the same prediction mode as the intra prediction mode of the past frame, by setting an offset cost to the cost at the time of determining the intra prediction mode, the frequency of selecting the same intra prediction mode continuously in time is set. This is because it can be lowered.

H.264方式のイントラ符号化フレーム(Iフレーム)を生成する動画像符号化装置の構成例を示すブロック図である。H. 1 is a block diagram illustrating a configuration example of a moving image encoding apparatus that generates an H.264 intra-coded frame (I frame). 輝度成分の4×4画素ブロックでのイントラ予測モードのイントラ予測画像の生成動作を示す図である。It is a figure which shows the production | generation operation | movement of the intra estimated image of the intra prediction mode in the 4 * 4 pixel block of a luminance component. イントラ予測モード判定部の構成の構成例を示すブロック図である。It is a block diagram which shows the structural example of a structure of an intra prediction mode determination part. イントラ予測により発生する符号化ノイズの傾向の一例を示す図である。It is a figure which shows an example of the tendency of the encoding noise which generate | occur | produces by intra prediction. イントラ予測モード判定によって発生する符号化ノイズパターンの時間的な変化の様子の一例を示す図である。It is a figure which shows an example of the mode of the time change of the encoding noise pattern which generate | occur | produces by intra prediction mode determination. 第1の実施形態におけるイントラ予測モード判定部の構成を示すブロック図である。It is a block diagram which shows the structure of the intra prediction mode determination part in 1st Embodiment. 第1の実施形態におけるオフセットコスト設定の例を示す図である。It is a figure which shows the example of the offset cost setting in 1st Embodiment. 第1の実施形態のイントラ予測モード判定によって発生する符号化ノイズパターンの時間的な変化の様子の一例を示す図である。It is a figure which shows an example of the mode of the time change of the encoding noise pattern generate | occur | produced by the intra prediction mode determination of 1st Embodiment. 第1の実施形態におけるイントラ予測モード判定部の最小の構成を示すブロック図である。It is a block diagram which shows the minimum structure of the intra prediction mode determination part in 1st Embodiment. 4×4画素サイズのイントラ予測の予測方向を示す図である。It is a figure which shows the prediction direction of 4 * 4 pixel size intra prediction. 第2の実施形態におけるオフセットコスト設定の例を示す図である。It is a figure which shows the example of the offset cost setting in 2nd Embodiment. 第3の実施形態におけるイントラ予測モード判定部の構成を示すブロック図である。It is a block diagram which shows the structure of the intra prediction mode determination part in 3rd Embodiment. 第3の実施形態におけるオフセットコスト設定の例を示す図である。It is a figure which shows the example of the offset cost setting in 3rd Embodiment. 第3の実施形態におけるオフセットコスト設定の別の例を示す図である。It is a figure which shows another example of the offset cost setting in 3rd Embodiment. 第4の実施形態におけるイントラ予測モード判定部の構成を示すブロック図である。It is a block diagram which shows the structure of the intra prediction mode determination part in 4th Embodiment. 本発明のイントラ予測モード判定プログラムの処理を示すフローチャートである。It is a flowchart which shows the process of the intra prediction mode determination program of this invention. 本発明のイントラ予測モード判定を行う動画像符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the moving image encoder which performs intra prediction mode determination of this invention.

(第1の実施形態)
次に、発明を実施するための最良の形態について図面を参照して詳細に説明する。
(First embodiment)
Next, the best mode for carrying out the invention will be described in detail with reference to the drawings.

本発明の第1の実施の形態について、図6から図8を参照して説明する。本発明の第1の実施の形態では、イントラ予測モード選択に用いるコスト関数として、式(1)ではなく下記の式(2)を用いる。  A first embodiment of the present invention will be described with reference to FIGS. In the first embodiment of the present invention, the following equation (2) is used instead of equation (1) as the cost function used for intra prediction mode selection.

Cost=D+D_offset+λ(R+R_offset) ・・・(2)
ここで、D_offset及びR_offsetは、イントラ予測モードごとに異なる所定のオフセットコストである。
Cost = D + D_offset + λ (R + R_offset) (2)
Here, D_offset and R_offset are predetermined offset costs that differ for each intra prediction mode.

D_offset及びR_offsetは、時間的に近接するブロックのイントラ予測モードに対して0以上の値に設定される。ただし、D_offset及びR_offsetの一方が0に設定された場合は、他方は0より大きい値に設定される。D_offset及びR_offsetの値は、現在の予測モードに対応付けて、例えば、テーブル形式のデータとして所定の記憶装置(図示なし)に記憶される。そして、後述のオフセットコスト決定部602から読み出されてコストの決定に使用される。この記憶装置は、オフセットコスト決定部602の内部に備えられてもよい。  D_offset and R_offset are set to a value of 0 or more for the intra prediction modes of blocks that are temporally adjacent. However, when one of D_offset and R_offset is set to 0, the other is set to a value larger than 0. The values of D_offset and R_offset are stored in a predetermined storage device (not shown) as table format data in association with the current prediction mode, for example. And it reads from the below-mentioned offset cost determination part 602, and is used for cost determination. This storage device may be provided in the offset cost determination unit 602.

図6は、第1の実施形態のイントラ予測モード判定部の構成図である。図3のイントラ予測モード判定部と共通な構成要素には、図3と同じ符号が付与されている。  FIG. 6 is a configuration diagram of the intra prediction mode determination unit of the first embodiment. Constituent elements common to the intra prediction mode determination unit in FIG. 3 are assigned the same reference numerals as in FIG.

図6のイントラ予測モード判定部は、図3の構成に対して、新たに、過去予測モード記憶部601、オフセットコスト決定部602、コスト算出部603を備える。  The intra prediction mode determination unit in FIG. 6 newly includes a past prediction mode storage unit 601, an offset cost determination unit 602, and a cost calculation unit 603 in addition to the configuration in FIG.

過去予測モード記憶部601は、符号化が完了したフレームの各画像ブロックのイントラ予測モード情報を記憶する。すなわち、過去フレームのイントラ予測モードのモード情報、すなわち、過去予測モードのモード情報を記憶する。  The past prediction mode storage unit 601 stores the intra prediction mode information of each image block of a frame that has been encoded. That is, the mode information of the intra prediction mode of the past frame, that is, the mode information of the past prediction mode is stored.

オフセットコスト決定部602は、過去予測モード記憶部601から供給される過去フレームのイントラ予測モード情報に基づいて、式(2)のD_offset及びR_offsetであるオフセットコストを決定する。  The offset cost determination unit 602 determines offset costs that are D_offset and R_offset in Expression (2) based on the intra prediction mode information of the past frame supplied from the past prediction mode storage unit 601.

コスト算出部603は、式(2)に従って、D、R、D_offset、R_offsetの重み付け加算を行って、式(2)のCostを算出する。そして、モード選択部307は、複数のイントラ予測モードのそれぞれに対応するCostを比較し、それが最小となるイントラ予測モードを適切なイントラ予測モードとして出力する。  The cost calculation unit 603 performs weighted addition of D, R, D_offset, and R_offset according to Equation (2) to calculate Cost of Equation (2). And the mode selection part 307 compares Cost corresponding to each of several intra prediction mode, and outputs the intra prediction mode in which it becomes the minimum as an appropriate intra prediction mode.

図7は、符号化対象画像のイントラ予測モード判定の際に与えるD_offset及びR_offset設定の例を示す。図7は、直前の画像フレーム、すなわち、時間的に最も近接する過去フレーム(以降、単に「過去フレーム」という。)の同位置の画像ブロックのイントラ予測モードが1であった場合の例である。このように、過去フレームのイントラ予測モードと同じ予測モードに対しては、正のD_offset及びR_offsetが設定される。過去フレームで選択されたイントラ予測モードを、以降、単に「過去予測モード」という。  FIG. 7 shows an example of D_offset and R_offset settings given when determining the intra prediction mode of the encoding target image. FIG. 7 shows an example in which the intra prediction mode of the image block at the same position of the immediately preceding image frame, that is, the past frame closest in time (hereinafter simply referred to as “past frame”) is 1. . Thus, positive D_offset and R_offset are set for the same prediction mode as the intra prediction mode of the past frame. Hereinafter, the intra prediction mode selected in the past frame is simply referred to as “past prediction mode”.

図8は、第1の実施形態でのイントラ予測モード選択と、それに伴うノイズパターンの例を示す。左の列に示されたイントラ予測モードを示す矢印のうち、図5に示した例と異なるものが太線の矢印で示されている。本実施形態では、過去予測モードと同じ予測モードに対しては正のオフセットコストが設定されるので、同じ予測モードに対しては式(2)で算出されるコストが大きくなる。そのため、時間的に連続して同じイントラ予測モードが選択される頻度が低くなる。この結果、入力画像の絵柄が類似していた場合でも異なるイントラ予測モードが選択されやすくなる。その結果、符号化結果の画像に発生する符号化ノイズのパターンも、図8のように、時間的に変化するものとなる。これにより、特定の符号化ノイズパターンが時間的に連続する問題が発生しにくくなる。  FIG. 8 shows an example of intra prediction mode selection in the first embodiment and a noise pattern associated therewith. Of the arrows indicating the intra prediction modes shown in the left column, the arrows different from the example shown in FIG. 5 are indicated by thick arrows. In the present embodiment, since a positive offset cost is set for the same prediction mode as the past prediction mode, the cost calculated by Expression (2) is large for the same prediction mode. Therefore, the frequency with which the same intra prediction mode is selected continuously in time decreases. As a result, even when the patterns of the input images are similar, different intra prediction modes are easily selected. As a result, the pattern of encoding noise generated in the image of the encoding result also changes with time as shown in FIG. Thereby, the problem that a specific encoding noise pattern continues temporally becomes difficult to occur.

図6では、イントラ予測モードごとの評価コストの算出を、個別に、平行して行う。しかし、全イントラ予測モードの評価コストの算出を、時分割で処理する等の方法によって、共通の装置を用いて行うこともできる。従って、本実施形態において必須のブロックのみを備えるイントラ予測モード判定部は、図9のブロック図の通りである。  In FIG. 6, calculation of the evaluation cost for each intra prediction mode is performed individually and in parallel. However, the calculation of the evaluation cost in all intra prediction modes can be performed using a common apparatus by a method such as processing in a time division manner. Therefore, the intra prediction mode determination unit including only essential blocks in the present embodiment is as illustrated in the block diagram of FIG.

なお、過去フレームは、直前のフレームのみでなく、さらにその過去の、所定の期間内のフレームまで遡ってオフセットコストが設定されてもよい。例えば、過去の2フレームについて、連続して同じイントラ予測モードが選択された場合には大きなオフセットコストが設定され、異なるイントラ予測モードが選択された場合には小さなオフセットコストが設定されてもよい。  Note that the offset cost may be set not only for the immediately preceding frame but also for the past frame within a predetermined period. For example, for the past two frames, a large offset cost may be set when the same intra prediction mode is selected continuously, and a small offset cost may be set when a different intra prediction mode is selected.

以上のように、第1の実施形態によると、時間的に連続して同じイントラ予測モードが選択される頻度が低くなる。従って、第1の実施形態のイントラ予測判定方法によると、人工的な幾何学的模様の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題が軽減され、符号化結果の主観的な画質を向上することができる。  As described above, according to the first embodiment, the frequency of selecting the same intra prediction mode continuously in time decreases. Therefore, according to the intra prediction determination method of the first embodiment, the problem that the coding noise pattern of an artificial geometric pattern appears as a pattern attached to a specific portion of the image is reduced, and the subjective result of the coding result is reduced. Image quality can be improved.

以上の説明から理解されるように、本実施形態で用いられるオフセットコストは、連続して同じイントラ予測モードが選択される頻度を下げるために導入される。従って、オフセットコストは、過去予測モードに依存したものには限定されない。すなわち、オフセットコストは、画像フレームの進行に依存して変化するものであれば使用可能である。ただし、毎フレームごとに、常にオフセットコストが変化することまでは要求されない。以降の実施形態において、各種のオフセットコストの設定例を示す。
(第2の実施形態)
次に、本発明の第2の実施形態について、図10、図11を参照して説明する。第2の実施の形態のイントラ予測モード判定部の構成は、図6に示された第1の実施形態のものと同じである。図10は4×4画素サイズのイントラ予測の予測方向を示す。
As understood from the above description, the offset cost used in the present embodiment is introduced in order to reduce the frequency with which the same intra prediction mode is continuously selected. Therefore, the offset cost is not limited to that depending on the past prediction mode. That is, the offset cost can be used as long as it varies depending on the progress of the image frame. However, it is not required until the offset cost always changes for each frame. In the following embodiments, examples of setting various offset costs will be shown.
(Second Embodiment)
Next, a second embodiment of the present invention will be described with reference to FIGS. The configuration of the intra prediction mode determination unit of the second embodiment is the same as that of the first embodiment shown in FIG. FIG. 10 shows the prediction direction of 4 × 4 pixel size intra prediction.

このように、モード2(DC)を除く8つの予測モードは、22.5度ずつ異なる8方向に沿った予測画像の生成を行うモードである。ここで、予測方向の近いモード、例えば1(horizontal)と6(horizontal down)又は1(horizontal)と8(horizontal up)などでは、異なる予測モードであっても、符号化結果に現れる符号化ノイズのパターンは比較的類似したものになる場合がある。  As described above, the eight prediction modes except mode 2 (DC) are modes for generating predicted images along eight directions that are different by 22.5 degrees. Here, coding noises appearing in the coding result even in different prediction modes in modes with close prediction directions, for example, 1 (horizontal) and 6 (horizontal down) or 1 (horizontal) and 8 (horizontal up). The pattern may be relatively similar.

そこで、第2の実施形態では、過去予測モードと同じ予測モードに加え、過去予測モードと予測方向が近い予測モードに対しても正のオフセットコストD_offset、R_offsetが設定される。  Therefore, in the second embodiment, positive offset costs D_offset and R_offset are set for a prediction mode having a prediction direction similar to the past prediction mode in addition to the same prediction mode as the past prediction mode.

図11は過去予測モードが1の場合及び3の場合のD_offset及びR_offset設定の例を示す。このように、過去予測モードと同じ予測モードに加え、過去予測モードにおける予測方向に隣接する方向を用いる予測モードにも、正のオフセットコストが設定される。このような設定により、比較的類似した符号化ノイズのパターンが連続して現れる現象の発生頻度を低減することができる。  FIG. 11 shows examples of D_offset and R_offset settings when the past prediction mode is 1 and 3. Thus, in addition to the same prediction mode as the past prediction mode, a positive offset cost is set for a prediction mode that uses a direction adjacent to the prediction direction in the past prediction mode. With such a setting, it is possible to reduce the frequency of occurrence of a phenomenon in which relatively similar coding noise patterns appear continuously.

なお、D_offset及びR_offsetの値は、過去予測モードと現在の予測モードとに対応付けて設定され、所定の記憶装置(図示なし)に記憶される。そして、後述のオフセットコスト決定部602から読み出されてコストの決定に使用される。この記憶装置は、オフセットコスト決定部602の内部に備えられてもよい。  Note that the values of D_offset and R_offset are set in association with the past prediction mode and the current prediction mode, and stored in a predetermined storage device (not shown). And it reads from the below-mentioned offset cost determination part 602, and is used for cost determination. This storage device may be provided in the offset cost determination unit 602.

なお、図11の例では、過去予測モードと同じ予測モードに加え、過去予測モードにおける予測方向に隣接する方向を用いる予測モードのみに正のオフセットを設定した。さらに、隣接する方向の、過去予測モードにおける予測方向とは反対の側に隣接する方向にも、正のオフセットが設定されてもよい。つまり、過去予測モードにおける予測方向に隣接する方向から順に、複数の予測方向にオフセットが設定されてもよい。このとき、予測方向が過去予測モードにおける予測方向から離れるほど、設定されるオフセット値が小さくなるように設定されてもよい。  In the example of FIG. 11, in addition to the same prediction mode as the past prediction mode, a positive offset is set only for the prediction mode that uses a direction adjacent to the prediction direction in the past prediction mode. Furthermore, a positive offset may also be set in a direction adjacent to the side opposite to the prediction direction in the past prediction mode. That is, offsets may be set in a plurality of prediction directions in order from the direction adjacent to the prediction direction in the past prediction mode. At this time, the set offset value may be set to be smaller as the prediction direction is away from the prediction direction in the past prediction mode.

以上のように、第2の実施形態によると、過去予測モードと同じ予測モード及び過去予測モードにおける予測方向に隣接する方向を用いる予測モードに対して、正のオフセットコストが設定される。そのため、類似した符号化ノイズのパターンが現れる現象が減少する。従って、人工的な幾何学的模様の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題がさらに軽減され、符号化結果の主観的な画質を向上することができる。
(第3の実施形態)
次に、本発明の第3の実施形態について、図12から図14を参照して説明する。図12は第3の実施形態のイントラ予測モード判定部の構成図である。図6の第1の実施形態のイントラ予測モード判定部と共通な構成要素には、図6と同じ符号が付与されている。
As described above, according to the second embodiment, a positive offset cost is set for a prediction mode that uses the same prediction mode as the past prediction mode and a direction adjacent to the prediction direction in the past prediction mode. As a result, a phenomenon in which a similar coding noise pattern appears is reduced. Therefore, the problem that the coding noise pattern of the artificial geometric pattern is seen as a pattern stuck on a specific portion of the image is further reduced, and the subjective image quality of the coding result can be improved.
(Third embodiment)
Next, a third embodiment of the present invention will be described with reference to FIGS. FIG. 12 is a configuration diagram of an intra prediction mode determination unit according to the third embodiment. Constituent elements common to the intra prediction mode determination unit of the first embodiment in FIG. 6 are assigned the same reference numerals as in FIG.

図12の構成では、図6のイントラ予測モード判定部に対して、新たにフレーム番号入力部1201、オフセットコスト決定部1202を備える。フレーム番号入力部1201は時間的に連続するフレームごとに1ずつ増加するフレーム番号を入力する。オフセットコスト決定部1202は、フレーム番号入力部1201から供給されるフレーム番号に基づいて、式(2)のD_offset及びR_offsetであるオフセットコストを決定する。  In the configuration of FIG. 12, a frame number input unit 1201 and an offset cost determination unit 1202 are newly added to the intra prediction mode determination unit of FIG. The frame number input unit 1201 inputs a frame number that increases by 1 for each temporally continuous frame. The offset cost determination unit 1202 determines offset costs that are D_offset and R_offset in Expression (2) based on the frame number supplied from the frame number input unit 1201.

第3の実施形態では、フレーム番号に基づいて、連続するフレームに対して、それぞれ異なるD_offset及びR_offsetが設定される。  In the third embodiment, different D_offset and R_offset are set for consecutive frames based on the frame number.

図13はD_offset及びR_offset設定の例を示す。図13は、フレーム番号が偶数の場合と奇数の場合で異なるオフセットコストを設定する場合の例を示す。  FIG. 13 shows an example of D_offset and R_offset settings. FIG. 13 shows an example in which different offset costs are set depending on whether the frame number is even or odd.

このように、8つの予測方向から、偶数のフレーム番号のフレームにおいてオフセットコストが設定される4つの予測方向が、1つおきに選択される。そして、他の4つの予測方向が、奇数のフレーム番号のフレームのオフセットコストが設定される予測方向として選択される。つまり、あるフレームでオフセットコストが大きく設定された予測モードは、次のフレームではオフセットコストが小さく設定されるため、選択される可能性が高い。逆に、あるフレームでオフセットコストが小さく設定された予測モードは、次のフレームではオフセットコストが大きく設定されるため、選択される可能性が低い。  As described above, every other four prediction directions in which the offset cost is set in the frames having the even frame numbers are selected from the eight prediction directions. Then, the other four prediction directions are selected as the prediction directions in which the offset costs of the frames with odd frame numbers are set. That is, the prediction mode in which the offset cost is set large in a certain frame is likely to be selected because the offset cost is set small in the next frame. Conversely, a prediction mode in which the offset cost is set to be small in a certain frame is unlikely to be selected because the offset cost is set to be large in the next frame.

このように、連続するフレームで異なるオフセットコストが設定されることにより、同じイントラ予測モードが時間的に連続して選択される頻度を下げることができる。そのため、特定の符号化ノイズパターンが時間的に連続して発生するという問題が発生しにくくなる。  In this way, by setting different offset costs in consecutive frames, it is possible to reduce the frequency with which the same intra prediction mode is continuously selected in time. Therefore, the problem that a specific encoding noise pattern occurs continuously in time is less likely to occur.

また、図14は、D_offset及びR_offset設定の別の例を示す。図13では、フレーム番号が偶数の場合に予測モード番号の小さいものにオフセットコストが設定されているためにこれらの予測モードが選択されにくくなる。その際、小さいモード番号の予測モードは符号化効率が高い場合が多いため、これらの予測モードを選択されにくくすることで、結果として全般的な符号化効率が低下する可能性がある。  FIG. 14 shows another example of D_offset and R_offset settings. In FIG. 13, when the frame number is an even number, since the offset cost is set to the one with the smaller prediction mode number, it becomes difficult to select these prediction modes. At that time, since prediction modes with a small mode number often have high encoding efficiency, making these prediction modes difficult to select may result in a decrease in overall encoding efficiency.

これに対して、図14の例では、モード番号が分散するように、オフセットコスト設定されているため、フレーム番号によって符号化効率に違いが発生しにくくできる。  On the other hand, in the example of FIG. 14, since the offset cost is set so that the mode numbers are dispersed, it is difficult to cause a difference in encoding efficiency depending on the frame number.

なお、D_offset及びR_offsetの値は、フレーム番号と現在の予測モードとに対応付けて設定され、所定の記憶装置(図示なし)に記憶される。そして、後述のオフセットコスト算出部1202から読み出されてコストの決定に使用される。この記憶装置は、オフセットコスト算出部1202の内部に備えられてもよい。  Note that the values of D_offset and R_offset are set in association with the frame number and the current prediction mode, and are stored in a predetermined storage device (not shown). And it reads from the below-mentioned offset cost calculation part 1202, and is used for determination of cost. This storage device may be provided inside the offset cost calculation unit 1202.

当然ながら、オフセットコスト設定の方式は、本実施形態で示した例、すなわち、偶数フレームと奇数フレームとを区別して設定する方式に限るものではない。例えば、フレーム番号の10の剰余の値によって、それぞれ異なるオフセットコストが設定されてもよい。また、あるフレーム全体に対して同じオフセットコストが設定されるのではなく、符号化対象ブロックの位置によって異なるオフセットコストが設定されてもよい。  Of course, the offset cost setting method is not limited to the example shown in the present embodiment, that is, the method of setting the even frame and the odd frame separately. For example, different offset costs may be set depending on the remainder value of 10 of the frame number. Also, the same offset cost may not be set for an entire frame, but different offset costs may be set depending on the position of the encoding target block.

以上のように、第3の実施形態によると、連続したフレームでは、異なる予測方向を用いる予測モードに、正のオフセットコストが設定される。そのため、時間的に連続するフレームで、同じイントラ予測モードが選択される頻度を下げることができる。従って、過去フレームの予測モード情報、すなわち、過去予測モードのモード情報を記憶する必要がない。そして、人工的な幾何学的模様の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題を軽減して符号化結果の主観的な画質を向上することができる。また、過去フレームの符号化結果の情報を利用しないため、各フレームを独立して符号化処理することもできる。
(第4の実施形態)
次に、本発明の第4の実施形態について、図15を参照して説明する。図15は第4の実施形態のイントラ予測モード判定部の構成図である。図12の第3の実施形態のイントラ予測モード判定部と共通な構成要素には図12と同じ符号が付与されている。
As described above, according to the third embodiment, a positive offset cost is set in a prediction mode using different prediction directions in consecutive frames. Therefore, the frequency with which the same intra prediction mode is selected in temporally continuous frames can be reduced. Therefore, it is not necessary to store the prediction mode information of the past frame, that is, the mode information of the past prediction mode. Then, it is possible to improve the subjective image quality of the encoding result by reducing the problem that the encoding noise pattern of the artificial geometric pattern appears as a pattern attached to a specific portion of the image. In addition, since the information on the encoding result of the past frame is not used, each frame can be encoded independently.
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described with reference to FIG. FIG. 15 is a configuration diagram of an intra prediction mode determination unit according to the fourth embodiment. Constituent elements common to the intra prediction mode determination unit of the third embodiment in FIG. 12 are assigned the same reference numerals as in FIG.

図15の構成では、図6のイントラ予測モード判定部に対して、新たに乱数オフセットコスト決定部1502を備える。乱数オフセットコスト決定部1502は、擬似乱数に基づいて式(2)のD_offset及びR_offsetであるオフセットコストを決定する。  In the configuration of FIG. 15, a random number offset cost determination unit 1502 is newly provided for the intra prediction mode determination unit of FIG. 6. The random number offset cost determination unit 1502 determines offset costs that are D_offset and R_offset in Expression (2) based on the pseudo random number.

例えば、乱数オフセットコスト決定部1502は、各イントラ予測モードごとに0〜99の範囲の擬似乱数を生成する。そして、この擬似乱数が70〜89であった場合にはD_offset=16、R_offset=2、90〜99であった場合にはD_offset=32、R_offset=2、それ以外の場合はD_offset=0、R_offset=0とする。  For example, the random number offset cost determination unit 1502 generates a pseudo random number in the range of 0 to 99 for each intra prediction mode. If this pseudorandom number is 70 to 89, D_offset = 16, R_offset = 2, 90 to 99, D_offset = 32, R_offset = 2, otherwise D_offset = 0, R_offset = 0.

このように、各イントラ予測モードごとに、確率的にオフセットコストが設定されるので、連続するフレームの同じ予測モードに対して、異なるオフセットコストが設定される可能性が高い。例えば、あるフレームでオフセットコストが大きく設定された予測モードは、次のフレームでもオフセットコストが大きく設定される可能性は低い。逆に、あるフレームでオフセットコストが小さく設定された予測モードは、次のフレームでもオフセットコストが小さく設定される可能性は低い。従って、時間的に連続したフレームで、同じ予測モードが選択される可能性が低くなる。  Thus, since the offset cost is set stochastically for each intra prediction mode, there is a high possibility that a different offset cost is set for the same prediction mode of consecutive frames. For example, a prediction mode in which an offset cost is set to be large in a certain frame is unlikely to be set to a large offset cost in the next frame. Conversely, a prediction mode in which an offset cost is set to be small in a certain frame is unlikely to be set to a small offset cost in the next frame. Therefore, it is less likely that the same prediction mode is selected in temporally continuous frames.

以上のように、第4の実施形態によると、各イントラ予測モードごとに、確率的にオフセットコストが設定される。そのため、時間的に連続したフレームで、同じ予測モードが選択される可能性が低くなる。従って、第1乃至第3の実施形態のように、オフセットコストが設定されたテーブルなどを使用せずに、人工的な幾何学的模様の符号化ノイズパターンが画像の特定箇所に貼り付いた模様として見える問題を軽減して符号化結果の主観的な画質を向上することができる。また、過去フレームの符号化結果の情報を利用しないため、各フレームを独立して符号化処理することもできる。  As described above, according to the fourth embodiment, an offset cost is set probabilistically for each intra prediction mode. Therefore, it is less likely that the same prediction mode is selected in temporally continuous frames. Therefore, a pattern in which an encoded noise pattern of an artificial geometric pattern is attached to a specific portion of an image without using a table in which an offset cost is set as in the first to third embodiments. The subjective image quality of the encoding result can be improved. In addition, since the information on the encoding result of the past frame is not used, each frame can be encoded independently.

以上、本発明の実施形態について説明した。上記の実施形態では、H.264方式に則った実施の例について述べたが、本発明はH.264方式での応用のみに限定されない。H.264のイントラ予測と類似の技術を備える異なる符号化方式や、あるいは国際標準の動画像符号化方式等に含まれない符号化方式に対して適用することも可能である。  The embodiment of the present invention has been described above. In the above embodiment, the H.264. An example of implementation in accordance with the H.264 system has been described. The present invention is not limited only to applications using the H.264 system. H. The present invention can also be applied to a different encoding method having a technique similar to H.264 intra prediction, or an encoding method not included in the international standard moving image encoding method.

画像のサイズに関しては、実施形態では主に輝度成分の4×4サイズのイントラ予測処理に適用する場合の例について述べたが、輝度成分の16×16サイズ、8×8サイズや色差成分のイントラ予測処理に対しても当然適用できる。  Regarding the size of the image, the embodiment mainly describes an example of application to the 4 × 4 size intra prediction process of the luminance component, but the luminance component 16 × 16 size, 8 × 8 size, and the color difference component intra are described. Of course, it can also be applied to prediction processing.

オフセットコストの設定値は、上記の実施形態で例示したものに限定されるものではない。具体的なオフセットコストの値は、例えば多数の動画像に対して符号化実験を実施して、最適値を探索した結果を用いればよい。  The set value of the offset cost is not limited to that exemplified in the above embodiment. As a specific offset cost value, for example, a result of searching an optimum value by performing an encoding experiment on a large number of moving images may be used.

符号化済み情報の使い方に関しては、時間的に近い符号済みの1フレームのイントラ予測モード情報に基づいてオフセットコストを設定する例について述べたが、符号化済み情報の使い方はこれに限定されない。例えば、符号化済みのN枚(Nは2以上の整数)のフレームで選択されたイントラ予測モードの分布、すなわち予測モードごとの選択された頻度に応じて正のオフセットコストが設定されてもよい。あるいは、符号化済みの2フレームで同じイントラ予測モードが連続して選択されていた場合は、次のフレームに対しては、さらに大きなオフセットコストが設定されてもよい。  With respect to the usage of the encoded information, an example has been described in which the offset cost is set based on intra-prediction mode information of one encoded frame that is close in time, but the usage of the encoded information is not limited to this. For example, a positive offset cost may be set according to the distribution of intra prediction modes selected in N encoded frames (N is an integer of 2 or more), that is, the frequency selected for each prediction mode. . Alternatively, when the same intra prediction mode is continuously selected in two encoded frames, a larger offset cost may be set for the next frame.

また、コスト関数は、式(1)、(2)で示したような、DとR及びオフセットコストを重み付け加算して求めた評価コストを最小とするイントラ予測モードを選択する例に沿って説明したが、コスト関数はこのようなものに限定されない。  Further, the cost function is explained along with an example of selecting an intra prediction mode that minimizes the evaluation cost obtained by weighted addition of D, R, and offset cost as shown in the equations (1) and (2). However, the cost function is not limited to this.

例えば、コスト関数は、モード情報の符号化に要するビット数Rを常に0、すなわち、Rが評価コストには反映されない関数であってもよい。あるいは、コスト関数は、オフセットを含めたDとRの加算結果を評価コストとするのではなく、DとRの乗算結果を評価コストとする関数であってもよい。つまり、コスト関数は、
Cost=(D+D_offset)×λ(R+R_offset) ・・・(3)
であってもよい。
For example, the cost function may be a function in which the number of bits R required for encoding the mode information is always 0, that is, R is not reflected in the evaluation cost. Alternatively, the cost function may be a function that uses the addition result of D and R including the offset as the evaluation cost, and uses the multiplication result of D and R as the evaluation cost. In other words, the cost function is
Cost = (D + D_offset) × λ (R + R_offset) (3)
It may be.

さらに、コスト関数における、オフセットコストの反映方法に関しても、オフセットコストを加算することによって反映させる方法のみでなく、乗算によって反映させてもよい。要するに、算出される評価コストがオフセットコストの大小に依存するように、コスト関数においてオフセットコストが使用されればよい。つまり、コスト関数は以下の(4)式、(5)式でもよい。  Furthermore, the offset cost reflection method in the cost function may be reflected not only by adding the offset cost but also by multiplication. In short, the offset cost may be used in the cost function so that the calculated evaluation cost depends on the magnitude of the offset cost. That is, the cost function may be the following formulas (4) and (5).

Cost=(D×D_offset)+λ(R×R_offset) ・・・(4)
Cost=(D×D_offset)×λ(R×R_offset) ・・・(5)
モードコストは、時間的に連続するフレームで、同じ予測モードが選択される可能性を低下させるための判断に使用される。そのため、コスト関数は、少なくとも、予測誤差画像の誤差量Dと1つのオフセットコストとに依存した評価コストが算出されるものであればよい。従って、様々なコスト関数が、利用されるイントラモード判定に対して適用できる。
Cost = (D × D_offset) + λ (R × R_offset) (4)
Cost = (D × D_offset) × λ (R × R_offset) (5)
The mode cost is used for judgment to reduce the possibility that the same prediction mode is selected in temporally continuous frames. Therefore, the cost function only needs to calculate an evaluation cost depending on at least the error amount D of the prediction error image and one offset cost. Therefore, various cost functions can be applied to the intra mode determination to be used.

なお、コスト関数が異なる場合は、当然ながらオフセットコストとして適切な値は異なる。また、上述の各実施形態では、オフセットコストは正の値であるものとされている。しかし、オフセットコストは、評価コストの大小に影響を与えるものであればよいので、負の値であってもよい。ただし、D_offsetとR_offsetの符号は、D_offset及びR_offsetが評価コストを増減させる方向、すなわち、評価コストを増加又は減少させる効果が同じになるように設定される必要がある。  Note that when the cost function is different, the appropriate value for the offset cost is naturally different. Further, in each of the embodiments described above, the offset cost is assumed to be a positive value. However, since the offset cost only needs to affect the evaluation cost, it may be a negative value. However, the signs of D_offset and R_offset need to be set so that D_offset and R_offset have the same effect of increasing or decreasing the evaluation cost, that is, the effect of increasing or decreasing the evaluation cost.

また、それぞれの実施の形態で個々に説明した技術を適宜組み合わせて実施することも当然可能である。また、以上で説明した方法は、コンピュータがプログラムを記録媒体から読み込んで実行することによっても実現することができる。  In addition, it is naturally possible to combine the techniques individually described in each embodiment as appropriate. The method described above can also be realized by a computer reading a program from a recording medium and executing it.

図16は、本発明のイントラ予測モード判定プログラムの処理を示すフローチャートを示す。  FIG. 16 shows a flowchart showing the processing of the intra prediction mode determination program of the present invention.

本プログラムは、イントラ予測モードの判定を行うイントラ予測モード判定装置が備えるコンピュータに読み込まれて、実行される。  This program is read and executed by a computer included in an intra prediction mode determination device that determines an intra prediction mode.

まず初めに、近傍の画像の画素情報を用いて、複数あるイントラ予測モードの各々を適用した予測画像が生成される(ステップS1)。イントラ予測モードとしては、例えば、図2に示されたものが適用される。予測画像は、各イントラ予測モードに対応する画像が、イントラ予測モードの種類と同じ個数だけ生成される。  First, a prediction image to which each of a plurality of intra prediction modes is applied is generated using pixel information of neighboring images (step S1). As the intra prediction mode, for example, the one shown in FIG. 2 is applied. As many prediction images as the number of images corresponding to each intra prediction mode are generated as the types of intra prediction modes.

次に、符号化対象の画像ブロックと、複数の予測画像の各々との差分コストが計算される(ステップS2)。従って、差分コストも、各イントラ予測モードに対応する差分コストが、イントラ予測モードの種類と同じ個数だけ生成される。  Next, the difference cost between the image block to be encoded and each of the plurality of predicted images is calculated (step S2). Therefore, the same number of differential costs as the types of intra prediction modes are generated as the differential costs corresponding to each intra prediction mode.

そして、複数の差分コストとオフセットコストを用いて、例えば式(2)の評価コストが算出される(ステップS3)。オフセットコストは、各イントラ予測モードごとに予め設定される。従って、複数の差分コストの各々と、それに対応するオフセットコストを用いて、評価コストが算出される。  Then, for example, the evaluation cost of Expression (2) is calculated using a plurality of differential costs and offset costs (step S3). The offset cost is set in advance for each intra prediction mode. Therefore, the evaluation cost is calculated using each of the plurality of differential costs and the offset cost corresponding thereto.

最後に、評価コストの値に基づいて、イントラ予測モードが選択される(ステップS4)。  Finally, the intra prediction mode is selected based on the evaluation cost value (step S4).

なお、本プログラムは、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体に格納されてもよい。  The program may be stored in a non-transitory medium such as a semiconductor storage device such as a ROM (Read Only Memory) or a RAM (Random Access Memory), an optical disk, a magnetic disk, or a magneto-optical disk.

なお、以上の実施形態は各々他の実施形態と組み合わせることができる。例えば、第2の実施形態のように、過去予測モードでの予測角度との差に依存させたオフセットの設定を、他の実施形態にも適用することができる。  Each of the above embodiments can be combined with other embodiments. For example, as in the second embodiment, the setting of the offset depending on the difference from the prediction angle in the past prediction mode can be applied to other embodiments.

動画像を符号化する符号化部312を備える動画像符号化装置310が、上記の各実施形態のイントラ予測モード判定部と同じ構成のイントラ予測モード判定部311を備えてもよい。図17に、本発明のイントラ予測モード判定を行う動画像符号化装置の構成を示す。  A moving image encoding apparatus 310 including an encoding unit 312 that encodes a moving image may include an intra prediction mode determination unit 311 having the same configuration as the intra prediction mode determination unit of each of the above embodiments. FIG. 17 shows the configuration of a moving picture encoding apparatus that performs intra prediction mode determination according to the present invention.

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。  While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

この出願は、2012年2月20日に出願された日本出願特願2012−033997を基礎とする優先権を主張し、その開示の全てをここに取り込む。  This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2012-033997 for which it applied on February 20, 2012, and takes in those the indications of all here.

100 イントラ予測モード判定部
101 イントラ予測部
102 減算部
103 整数変換部
104 量子化部
105 可変長符号化部
106 逆量子化部
107 逆整数変換部
108 加算部
109 デブロックフィルタ部
110 フレームバッファ
300 画像入力部
301 近傍画像記憶部
302 近傍予測モード記憶部
303 予測画像生成部
304 差分画像コスト計算部
305 モード情報符号化コスト計算部
306 コスト算出部
307 モード選択部
310 動画像符号化装置
311 イントラ予測モード判定部
312 符号化部
601 過去予測モード記憶部
602 オフセットコスト決定部
603 コスト算出部
1201 フレーム番号入力部
1202 オフセットコスト決定部
1502 乱数オフセットコスト決定部
DESCRIPTION OF SYMBOLS 100 Intra prediction mode determination part 101 Intra prediction part 102 Subtraction part 103 Integer conversion part 104 Quantization part 105 Variable length encoding part 106 Inverse quantization part 107 Inverse integer conversion part 108 Addition part 109 Deblock filter part 110 Frame buffer 300 Image Input unit 301 Neighborhood image storage unit 302 Neighborhood prediction mode storage unit 303 Prediction image generation unit 304 Difference image cost calculation unit 305 Mode information encoding cost calculation unit 306 Cost calculation unit 307 Mode selection unit 310 Video encoding device 311 Intra prediction mode Determination unit 312 Encoding unit 601 Past prediction mode storage unit 602 Offset cost determination unit 603 Cost calculation unit 1201 Frame number input unit 1202 Offset cost determination unit 1502 Random number offset cost determination unit

Claims (10)

符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードの各々で画素値を予測して、複数の予測画像を生成する予測画像生成部と、
前記符号化対象ブロックと前記複数の予測画像の各々との誤差量コストを算出する差分画像コスト計算部と、
前記複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコストを決定するオフセットコスト決定部と、
前記誤差量コストと前記オフセットコストを用いて所定の演算を行って評価コストを算出するコスト算出部と、
前記評価コストに基づいてイントラ予測モードを選択するモード選択部と、
を備える
ことを特徴とするイントラ予測モード判定装置。
A plurality of predicted images are generated by predicting pixel values in each of a plurality of intra prediction modes using encoded pixels in a predetermined range from an encoding target block obtained by dividing the encoding target image by a predetermined size. A predicted image generation unit;
A difference image cost calculation unit for calculating an error amount cost between the encoding target block and each of the plurality of predicted images;
An offset cost determining unit that determines an offset cost corresponding to each of the plurality of intra prediction modes and changes depending on the progress of the image frame;
A cost calculation unit for calculating an evaluation cost by performing a predetermined calculation using the error amount cost and the offset cost;
A mode selection unit that selects an intra prediction mode based on the evaluation cost;
An intra prediction mode determination apparatus comprising:
前記複数のイントラ予測モードの各々のモード情報を符号化するのに必要なビット量に対応するモード情報符号化コストを出力するモード情報符号化コスト出力部、
をさらに備え、
前記コスト算出部は、前記誤差量コスト、前記モード情報符号化コスト及び前記オフセットコストによる重み付けを用いた前記演算を行って評価コストを算出する、
ことを特徴とする請求項1に記載のイントラ予測モード判定装置。
A mode information encoding cost output unit that outputs a mode information encoding cost corresponding to a bit amount necessary to encode each mode information of the plurality of intra prediction modes;
Further comprising
The cost calculation unit calculates an evaluation cost by performing the calculation using weighting based on the error amount cost, the mode information encoding cost, and the offset cost.
The intra prediction mode determination apparatus according to claim 1.
過去の画像フレームのイントラ予測モード情報である過去フレーム予測モード情報を記憶する過去フレーム予測モード情報記憶部、
をさらに備え、
前記オフセットコスト決定部は、前記過去フレーム予測モード情報に基づいて前記過去の画像フレームから所定の期間以内の複数のフレームの、前記符号化対象ブロックと同位置で用いたイントラ予測モードに対して前記オフセットコストを設定する、
ことを特徴とする請求項1又は2記載のイントラ予測モード判定装置。
A past frame prediction mode information storage unit that stores past frame prediction mode information that is intra prediction mode information of a past image frame;
Further comprising
The offset cost determination unit, based on the past frame prediction mode information, for the intra prediction mode used at the same position as the encoding target block of a plurality of frames within a predetermined period from the past image frame Set the offset cost,
The intra prediction mode determination apparatus according to claim 1 or 2.
前記符号化対象画像の時間的順序を示すフレーム番号を入力するフレーム番号入力部、
をさらに備え、
前記オフセットコスト算出部は前記フレーム番号に基づいて前記過去の画像フレームから所定の期間以内の複数のフレームに対してそれぞれ異なる前記オフセットコストを設定する、
ことを特徴とする請求項1乃至3のいずれかに記載のイントラ予測モード判定装置。
A frame number input unit for inputting a frame number indicating a temporal order of the encoding target images;
Further comprising
The offset cost calculation unit sets the different offset costs for a plurality of frames within a predetermined period from the past image frame based on the frame number,
The intra prediction mode determination apparatus according to any one of claims 1 to 3.
前記オフセットコスト算出部は前記複数のイントラ予測モードの各々に対応させて擬似乱数を発生し、前記擬似乱数に基づいて前記オフセットコストを設定する、
ことを特徴とする請求項1乃至4のいずれかに記載のイントラ予測モード判定装置。
The offset cost calculation unit generates a pseudo-random number corresponding to each of the plurality of intra prediction modes, and sets the offset cost based on the pseudo-random number;
The intra prediction mode determination apparatus according to any one of claims 1 to 4.
前記オフセットコスト出力部は、過去の予測モードにおける方向との角度の差に応じて前記オフセットコストを出力する
ことを特徴とする請求項1乃至5のいずれか一項に記載のイントラ予測モード判定装置。
The intra-prediction mode determination device according to any one of claims 1 to 5, wherein the offset cost output unit outputs the offset cost according to a difference in angle with a direction in a past prediction mode. .
前記オフセットコスト出力部は、前記誤差量コストと前記オフセットコストを加算又は乗算して前記モードコストを算出する
ことを特徴とする請求項1乃至6のいずれか一項に記載のイントラ予測モード判定装置。
The intra-prediction mode determination device according to any one of claims 1 to 6, wherein the offset cost output unit calculates the mode cost by adding or multiplying the error amount cost and the offset cost. .
請求項1乃至7のいずれか一項に記載のイントラ予測モード判定装置と、
前記イントラ予測モード判定装置で選択された前記イントラ予測モードに基づいて前記符号化対象画像を符号化する符号化部、
を備えることを特徴とする動画像符号化装置。
The intra prediction mode determination device according to any one of claims 1 to 7,
An encoding unit that encodes the encoding target image based on the intra prediction mode selected by the intra prediction mode determination device;
A moving picture encoding apparatus comprising:
符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードで前記符号化対象ブロックの画素値を予測して、予測画像を生成し、
前記符号化対象ブロックと前記予測画像の誤差量コストを算出し、
前記複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコスト及び前記誤差量コストとを用いて所定の演算を行って評価コストを算出し、
前記モードコストに基づいてイントラ予測モードを選択する
ことを特徴とするイントラ予測モード判定方法。
A prediction image is obtained by predicting a pixel value of the encoding target block in a plurality of intra prediction modes by using encoded pixels in a predetermined range from an encoding target block obtained by dividing the encoding target image by a predetermined size. Generate
Calculating an error amount cost between the encoding target block and the predicted image;
Corresponding to each of the plurality of intra prediction modes, calculating the evaluation cost by performing a predetermined calculation using the offset cost and the error amount cost that change depending on the progress of the image frame,
An intra prediction mode determination method, wherein an intra prediction mode is selected based on the mode cost.
イントラ予測モード判定装置が備えるコンピュータを、
符号化対象画像を所定のサイズで分割した符号化対象ブロックから所定の範囲の符号化済み画素を用いて、複数のイントラ予測モードで前記符号化対象ブロックの画素値を予測して、予測画像を生成する予測画像生成手段と、
前記符号化対象ブロックと前記予測画像の誤差量コストを算出する差分画像コスト計算手段と、
前記複数のイントラ予測モードの各々に対応し、画像フレームの進行に依存して変化するオフセットコスト及び前記誤差量コストとを用いて所定の演算を行って評価コストを算出する評価コスト算出手段と、
前記モードコストに基づいてイントラ予測モードを選択するモード選択手段、
として機能させるためのイントラ予測モード判定プログラムを格納した非一時的な記憶媒体。
A computer included in the intra prediction mode determination device,
A prediction image is obtained by predicting a pixel value of the encoding target block in a plurality of intra prediction modes by using encoded pixels in a predetermined range from an encoding target block obtained by dividing the encoding target image by a predetermined size. Predicted image generation means for generating,
Differential image cost calculating means for calculating an error amount cost between the encoding target block and the predicted image;
An evaluation cost calculating unit that corresponds to each of the plurality of intra prediction modes and calculates an evaluation cost by performing a predetermined calculation using an offset cost that changes depending on the progress of an image frame and the error amount cost;
Mode selection means for selecting an intra prediction mode based on the mode cost;
A non-transitory storage medium storing an intra prediction mode determination program for functioning as a storage medium.
JP2014500895A 2012-02-20 2013-02-13 Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program Pending JPWO2013125171A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014500895A JPWO2013125171A1 (en) 2012-02-20 2013-02-13 Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012033997 2012-02-20
JP2012033997 2012-02-20
JP2014500895A JPWO2013125171A1 (en) 2012-02-20 2013-02-13 Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program

Publications (1)

Publication Number Publication Date
JPWO2013125171A1 true JPWO2013125171A1 (en) 2015-07-30

Family

ID=49005371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014500895A Pending JPWO2013125171A1 (en) 2012-02-20 2013-02-13 Intra prediction mode determination device, intra prediction mode determination method, and intra prediction mode determination program

Country Status (2)

Country Link
JP (1) JPWO2013125171A1 (en)
WO (1) WO2013125171A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6965887B2 (en) * 2016-09-12 2021-11-10 日本電気株式会社 Intra-prediction mode determination method, intra-prediction mode determination device and intra-prediction mode determination program
JP7293263B2 (en) * 2018-06-29 2023-06-19 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Device and method for intra prediction

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318468A (en) * 2004-04-30 2005-11-10 Nippon Hoso Kyokai <Nhk> In-screen predictive coding device, its method, and its program
JP2005348008A (en) * 2004-06-02 2005-12-15 Nippon Telegr & Teleph Corp <Ntt> Moving picture coding method, moving picture coder, moving picture coding program and computer-readable recording medium with record of the program
JP2008193501A (en) * 2007-02-06 2008-08-21 Canon Inc Image encoding device and image encoding method
JP2009510935A (en) * 2005-09-27 2009-03-12 クゥアルコム・インコーポレイテッド Mode selection techniques for multimedia coding.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318468A (en) * 2004-04-30 2005-11-10 Nippon Hoso Kyokai <Nhk> In-screen predictive coding device, its method, and its program
JP2005348008A (en) * 2004-06-02 2005-12-15 Nippon Telegr & Teleph Corp <Ntt> Moving picture coding method, moving picture coder, moving picture coding program and computer-readable recording medium with record of the program
JP2009510935A (en) * 2005-09-27 2009-03-12 クゥアルコム・インコーポレイテッド Mode selection techniques for multimedia coding.
JP2008193501A (en) * 2007-02-06 2008-08-21 Canon Inc Image encoding device and image encoding method

Also Published As

Publication number Publication date
WO2013125171A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
US10250908B2 (en) Adaptive transform size selection for geometric motion partitioning
US7426308B2 (en) Intraframe and interframe interlace coding and decoding
JP2009094828A (en) Device and method for encoding image, and device and method for decoding image
WO2010029850A1 (en) Image coding device, image decoding device, image coding method, image decoding method, and program
WO2011086836A1 (en) Encoder apparatus, decoder apparatus, and data structure
JP2012089905A (en) Image encoder and image encoding method, and image decoder and image decoding method
US10349071B2 (en) Motion vector searching apparatus, motion vector searching method, and storage medium storing motion vector searching program
KR101380460B1 (en) Image processing apparatus and image processing method
WO2013125171A1 (en) Intra-prediction mode determination device, method, and program recording medium
JP2007221201A (en) Moving image coding apparatus and program
JP5887012B2 (en) Image decoding method
JP2015019417A (en) Image decoding method
JP5891333B2 (en) Image decoding method
JP5887013B2 (en) Image decoding method
JP5422681B2 (en) Image decoding method
KR101368732B1 (en) Apparatus for estimating motion for h.264/avc encoder with high performance and method thereof
JP6646125B2 (en) Video prediction decoding method and video prediction decoding device
JP4561701B2 (en) Video encoding device
WO2011142221A1 (en) Encoding device and decoding device
JP5272940B2 (en) Image encoding device
KR20240046574A (en) Method and apparatus for implicitly indicating motion vector predictor precision
KR20240068697A (en) Method and apparatus for motion vector prediction based on subblock motion vectors
JP2013255290A (en) Image decoding method
KR101802304B1 (en) Methods of encoding using hadamard transform and apparatuses using the same
JP2008028882A (en) Moving image encoding apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171003