WO2012176910A1 - オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造 - Google Patents

オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造 Download PDF

Info

Publication number
WO2012176910A1
WO2012176910A1 PCT/JP2012/066082 JP2012066082W WO2012176910A1 WO 2012176910 A1 WO2012176910 A1 WO 2012176910A1 JP 2012066082 W JP2012066082 W JP 2012066082W WO 2012176910 A1 WO2012176910 A1 WO 2012176910A1
Authority
WO
WIPO (PCT)
Prior art keywords
offset
value
pixel
unit
type
Prior art date
Application number
PCT/JP2012/066082
Other languages
English (en)
French (fr)
Inventor
隆紀 山崎
知宏 猪飼
山本 智幸
将伸 八杉
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47422737&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=WO2012176910(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority to KR1020187036558A priority Critical patent/KR102005212B1/ko
Priority to EP12802275.3A priority patent/EP2725797B1/en
Priority to KR1020187020857A priority patent/KR101931675B1/ko
Priority to KR1020147001188A priority patent/KR101785770B1/ko
Priority to SI201231467T priority patent/SI2725797T1/sl
Priority to AU2012274326A priority patent/AU2012274326B2/en
Priority to EP18160110.5A priority patent/EP3361725B1/en
Priority to ES12802275T priority patent/ES2699974T3/es
Priority to KR1020177027760A priority patent/KR101826215B1/ko
Priority to EP19220154.9A priority patent/EP3720127B1/en
Priority to PL18160110T priority patent/PL3361725T3/pl
Priority to CA2840045A priority patent/CA2840045C/en
Priority to JP2013521650A priority patent/JP5973434B2/ja
Priority to KR1020187002934A priority patent/KR101881869B1/ko
Priority to PL12802275T priority patent/PL2725797T3/pl
Priority to DK12802275.3T priority patent/DK2725797T3/da
Priority to EP22194947.2A priority patent/EP4135322B1/en
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Priority to US14/127,889 priority patent/US9497455B2/en
Priority to RS20181435A priority patent/RS58082B1/sr
Priority to EP23155769.5A priority patent/EP4199513B1/en
Priority to CN201280030994.0A priority patent/CN103636210B/zh
Priority to EP22194948.0A priority patent/EP4135323A1/en
Publication of WO2012176910A1 publication Critical patent/WO2012176910A1/ja
Priority to US15/293,078 priority patent/US9866833B2/en
Priority to AU2017204165A priority patent/AU2017204165B2/en
Priority to US15/820,903 priority patent/US10390012B2/en
Priority to AU2018202384A priority patent/AU2018202384B2/en
Priority to US15/997,261 priority patent/US10440362B2/en
Priority to US16/158,602 priority patent/US10477209B2/en
Priority to HRP20181975TT priority patent/HRP20181975T1/hr
Priority to AU2019200704A priority patent/AU2019200704B2/en
Priority to US16/520,735 priority patent/US10764580B2/en
Priority to CY20201100389T priority patent/CY1123096T1/el
Priority to US17/008,475 priority patent/US11089302B2/en
Priority to US17/381,035 priority patent/US11765350B2/en
Priority to US18/354,533 priority patent/US20230370593A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Definitions

  • the present invention relates to an image filter device that performs image filtering.
  • the present invention also relates to an offset decoding apparatus that decodes an offset referred to by an image filter, and an offset encoding apparatus that encodes an offset referred to by an image filter.
  • the present invention also relates to the data structure of encoded data.
  • a moving image encoding device that generates encoded data by encoding the moving image, and decoding by decoding the encoded data
  • a video decoding device (decoding device) that generates an image is used.
  • a specific moving picture encoding method for example, H.264 is used.
  • a method used in AVC a method used in KTA software, which is a joint development codec in VCEG (Video Coding Expert Group), and a method used in TMuC (Test Model Under Consulation) software, which is the successor codec And a method employed in HM (HEVC TestModel) software.
  • an image (picture) constituting a moving image is a slice obtained by dividing the image, a maximum coding unit obtained by dividing the slice (LCU: Largegest Coding Unit, tree block) Hierarchical structure consisting of coding units (CU: Coding ⁇ ⁇ Unit, also called coding node) obtained by dividing the maximum coding unit, and blocks and partitions obtained by dividing the coding unit
  • the block is encoded as a minimum unit.
  • a predicted image is usually generated based on a local decoded image obtained by encoding / decoding an input image, and difference data between the predicted image and the input image is encoded. It becomes.
  • methods for generating a predicted image methods called inter-screen prediction (inter prediction) and intra-screen prediction (intra prediction) are known.
  • intra prediction predicted images in a corresponding frame are sequentially generated based on a locally decoded image in the same frame.
  • one prediction direction is selected from prediction directions included in a predetermined prediction direction (prediction mode) group for each prediction unit (for example, block), and A prediction pixel value on the prediction target region is generated by extrapolating the pixel value of the reference pixel in the locally decoded image in the selected prediction direction.
  • inter prediction by applying motion compensation using a motion vector to a reference image in a reference frame (decoded image) in which the entire frame is decoded, a predicted image in a prediction target frame is converted into a prediction unit ( For example, it is generated for each block).
  • Non-Patent Document 1 and Non-Patent Document 2 describe an adaptive loop filter (“", which is a subsequent stage of a deblocking filter that reduces block distortion of a decoded image and performs filter processing using adaptively determined filter coefficients.
  • An adaptive offset filter (also referred to as an “adaptive offset filter”) introduced before the “adaptive filter” is disclosed. This adaptive offset filter adds an adaptively set offset to each pixel value of an image output from the deblocking filter.
  • JCTVC-D122 Joint Collaborative Team Video Coding
  • JCT-VC Joint Collaborative Team Video Coding
  • ISO / IEC JTC1 / SC29 / WG11 4th Meeting: Daegu, KR, 01/2011 ⁇ JCTVC-E049 ''
  • the offset used in the conventional adaptive offset filter has a problem that a large memory size is required to store the offset because the value range is not set and the number of bits is large. It was.
  • the present invention has been made in view of the above problems, and an object thereof is to realize an image filter device capable of reducing block distortion while suppressing an increase in memory size.
  • an image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and refers to encoded data.
  • an offset value range is set by the offset attribute setting unit, and an offset having a bit width corresponding to the set offset value range is decoded by the offset decoding unit.
  • the memory size for storing the offset can be effectively reduced.
  • An offset decoding apparatus is an offset decoding apparatus that decodes each offset referred to by an image filter that adds an offset to each pixel value of an input image, and each offset residual is calculated from encoded data.
  • Offset residual decoding means for decoding prediction value deriving means for deriving predicted values of each offset from decoded offsets, predicted values derived by the predicted value deriving means for each offset, and the offset residual Offset calculating means for calculating from the offset residual decoded by the decoding means.
  • an offset residual decoding unit that decodes each offset residual from encoded data, and a prediction value derivation that derives a prediction value of each offset from the decoded offset Means and offset calculation means for calculating each offset from the prediction value derived by the prediction value deriving means and the offset residual decoded by the offset residual decoding means.
  • offset can be appropriately decoded from encoded data with a small code amount.
  • the image filter device is an image filter device that acts on an input image, and calculates a difference value between a pixel value of a target pixel in the input image and pixel values of pixels around the target pixel.
  • Means, a pixel value referred to by the calculation means, or a bit shift means for right bit shifting the difference value calculated by the calculation means by a predetermined shift value, and a difference right-bit shifted by the bit shift means Classifying means for classifying the target pixel into one of a plurality of offset classes according to the magnitude relationship between the value and 0, and associating the pixel value of the target pixel with the offset class classified by the classification means And an offset unit for adding the offsets.
  • the target pixel is classified into one of a plurality of offset classes according to the magnitude relationship between the difference value shifted to the right bit and 0, and the target pixel Since the offset associated with the offset class classified by the classification means is added to the pixel value, the class classification process is less susceptible to noise and the coding efficiency is improved.
  • the image filter device is an image filter device that acts on an input image, and calculates a difference value between a pixel value of a target pixel in the input image and pixel values of pixels around the target pixel.
  • the image filter device configured as described above is configured to assign the target pixel to a plurality of offset classes according to a magnitude relationship between the difference value calculated by the calculation unit and a predetermined first and second threshold value. Since the offset associated with the offset class classified by the classification means is added to the pixel value of the target pixel, the class classification process becomes less susceptible to noise and is encoded. Efficiency is improved.
  • the image filter device is an image filter device that operates on an input image composed of a plurality of unit regions, and includes an object that includes a target pixel in the input image among the first and second offset types.
  • a determination unit that determines an offset type to which the unit area belongs, an offset type to which the target unit area belongs, and an offset class to which the offset is not added and an offset are added to the target pixel according to the pixel value of the target pixel.
  • Classification means for classifying into one of a plurality of offset classes, and an offset associated with the offset type to which the target unit region belongs and the offset class classified by the classification means are added to the pixel value of the target pixel.
  • Offset means, and the classification means is an image of the target pixel. When the value is within a predetermined range, the offset is added to the target pixel regardless of whether the offset type to which the unit region including the target pixel belongs is the first offset type or the second offset type. It is characterized by being classified into an offset class.
  • the offset type to which the unit region including the target pixel belongs is the first and second offsets.
  • the target pixel is classified into an offset class to which an offset is added, so that block noise can be effectively removed. Therefore, according to the above configuration, the encoding efficiency can be improved.
  • An image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and among the plurality of offset types, the unit region to be processed is A determination unit that determines an offset type to which the signal belongs; an offset encoding unit that determines an offset having a different bit width according to the offset type; and the determination for each pixel value of the input image. And a filter means for adding the offsets.
  • an offset type to which a unit area to be processed belongs is determined from among a plurality of offset types, and an offset having a different bit width is determined according to the determined offset type.
  • the determined offset is added to each pixel of the input image. Also, the determined offset is encoded.
  • the offset encoding apparatus is an offset encoding apparatus that encodes each offset referenced by an image filter that adds an offset to each pixel value of an input image, and the predicted value of each offset is A predicted value deriving unit derived from an encoded offset, an offset residual calculating unit for calculating an offset residual from each offset and a predicted value derived by the predicted value deriving unit, and the offset residual calculating unit And an offset residual encoding means for encoding the calculated offset residual.
  • a predicted value deriving unit that derives a predicted value of each offset from the encoded offset, and a predicted value derived by each offset and the predicted value deriving unit Offset residual calculating means for calculating the offset residual from the above and offset residual encoding means for encoding the offset residual calculated by the offset residual calculating means.
  • the amount can be reduced.
  • the data structure of the encoded data according to the present invention is a data structure of encoded data that is referred to by an image filter that adds an offset to each pixel value of an input image composed of a plurality of unit regions.
  • Offset type designation information for designating the offset type to which the unit area belongs, and offsets having different bit widths according to the offset type, and the image filter includes the offset type designation information included in the encoded data.
  • the offset type to which the unit region to be processed belongs is determined, and offsets having different bit widths are decoded according to the determined offset type.
  • the code amount of the encoded data is reduced.
  • the image filter that decodes the encoded data refers to the offset type designation information, determines the offset type to which the unit area to be processed belongs, and also has an offset having a different bit width depending on the determined offset type. Since decoding is performed, appropriate offset filter processing can be performed while reducing the memory size for storing the offset.
  • the offset type designation information may be determined for each input image, or may be determined for each unit area. Further, it may be determined for each predetermined set of input images, or may be determined for each predetermined set of unit areas.
  • the image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions.
  • the image filter device refers to encoded data and sets an offset value range. Offset attribute setting means for setting, offset decoding means for decoding an offset limited to the set offset value range, and filter means for adding the offset to each pixel value of the input image.
  • An image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and among the plurality of offset types, the unit region to be processed is A determination unit that determines an offset type to which the signal belongs; an offset encoding unit that determines an offset having a different bit width according to the offset type; and the determination for each pixel value of the input image. Filter means for adding the offsets.
  • the data structure of the encoded data according to the present invention is a data structure of encoded data that is referred to by an image filter that adds an offset to each pixel value of an input image composed of a plurality of unit regions.
  • Offset type designation information for designating the offset type to which the unit area belongs, and offsets having different bit widths according to the offset type, and the image filter includes the offset type designation information included in the encoded data.
  • the offset type to which the unit region to be processed belongs is determined, and an offset having a different bit width is decoded according to the determined offset type.
  • FIG. 3 is a diagram illustrating a data configuration of encoded data generated by the video encoding device according to the first embodiment of the present invention and decoded by the video decoding device, and (a) to (d) are respectively The picture layer, the slice layer, the tree block layer, and the CU layer are shown, (e) shows the structure of QAOU information related to the non-leaf QAOU, and (f) shows the structure of QAOU information related to the QAOU of the leaf. Yes. It is a figure which shows each syntax contained in the offset information OI of the coding data which concerns on the 1st Embodiment of this invention.
  • FIG. 4 is a diagram illustrating an example of a QAOMU number assigned to a QAOMU included in a target processing unit in the first embodiment of the present invention, where (a) is a QAOMU attached to a QAOMU having a division depth of 0.
  • FIG. 1 shows the QAOMU number assigned to the QAOMU having a division depth of 1
  • (c) shows the QAOMU number attached to the QAOMU having a division depth of 2.
  • (D) shows a QAOMU number assigned to a QAOMU having a division depth of 3
  • (e) shows a QAOMU number assigned to a QAOMU having a division depth of 4.
  • (a) is a figure which shows each QAOMU of the division
  • (B) is a figure which shows the offset regarding each class which can be selected in the offset type associated with each of QAOU index 0-9 and each offset type. It is a figure which shows the conversion table which the offset information decoding part which concerns on the said 3rd Embodiment uses.
  • FIG. 7 is a graph showing the magnitude relationship between and the value of the function Sign corresponding to the magnitude relationship
  • (b) shows the magnitude relationship between the pixel value of the processing target pixel x and the pixel values of the pixels a and b.
  • (C) is a diagram showing the correspondence between each graph shown in (b) and class_idx, and (d) to (f) ) Is a diagram showing a conversion table representing conversion from EggeType to class_idx.
  • the said 3rd Embodiment it is a figure which shows an example of the class classification
  • FIG. 10 is a diagram for describing a configuration for switching between EO and BO according to a pixel value in the fourth embodiment according to the present invention, and (a) illustrates an overview of a configuration for switching between EO and BO according to a pixel value.
  • B) is a figure for demonstrating a specific switching value
  • (c) is a figure which shows the content of the list memory stored in the offset information storage part 621. .
  • FIG. 10 is a diagram showing an outline when classifying is subdivided in the sixth embodiment, (a) is a diagram showing a conversion table, and (b) to (d) are for explaining class division.
  • FIG. 10 is a diagram showing an outline when classifying is subdivided in the sixth embodiment, (a) is a diagram showing a conversion table, and (b) to (d) are for explaining class division.
  • the sixth embodiment it is a diagram for explaining the case of performing the class classification according to the color difference
  • (a) is a diagram for explaining the class classification in consideration of the achromatic pixel value
  • (B) is a figure for demonstrating a class classification asymmetrical in two range which pinches
  • (c) and (d) are different class classification for every color channel (Cr or Cb). It is a figure for demonstrating, (e) is a figure for demonstrating the case where the class classification of BO is made into one.
  • it is a block diagram which shows the structure of an offset information decoding part.
  • the said 7th Embodiment it is a figure which shows the outline
  • the said 7th Embodiment it is a figure which shows the syntax in the case of using a prediction candidate flag.
  • (A) is a block diagram which shows the structure of the use offset type selection part which concerns on the said 5th Embodiment
  • (b) is a block diagram which shows the structure of another use offset type selection part.
  • (a) is a figure which shows the syntax of offset information
  • (b) is a figure which shows the syntax of QAOU information
  • (C) is a figure which shows the syntax of the whole adaptive offset filter which calls the syntax shown to (a) and (b).
  • (a) is the block diagram which showed the structure of the transmission device carrying a moving image coding apparatus
  • (B) is a block diagram showing a configuration of a receiving apparatus equipped with a moving picture decoding apparatus.
  • FIG. 8B is a block diagram illustrating a configuration of a playback device equipped with a video decoding device.
  • FIG. 2 is a diagram showing a data structure of encoded data # 1.
  • the encoded data # 1 illustratively includes a sequence and a plurality of pictures constituting the sequence.
  • FIG. 2 shows the hierarchical structure below the picture layer in the encoded data # 1.
  • 2A to 2D are included in the picture layer that defines the picture PICT, the slice layer that defines the slice S, the tree block layer that defines the tree block TBLK, and the tree block TBLK, respectively.
  • Picture layer In the picture layer, a set of data referred to by the video decoding device 1 for decoding a picture PICT to be processed (hereinafter also referred to as a target picture) is defined. As shown in FIG. 2A, the picture PICT includes a picture header PH and slices S1 to SNS (NS is the total number of slices included in the picture PICT).
  • the picture header PH includes a coding parameter group referred to by the video decoding device 1 in order to determine a decoding method of the target picture.
  • the encoding mode information (entropy_coding_mode_flag) indicating the variable length encoding mode used in encoding by the moving image encoding device 2 is an example of an encoding parameter included in the picture header PH.
  • the picture PICT is encoded by CAVLC (Context-based Adaptive Variable Variable Length Coding).
  • CAVLC Context-based Adaptive Variable Variable Length Coding
  • CABAC Context-based Adaptive Binary Arithmetic Coding
  • picture header PH is also referred to as a picture parameter set (PPS).
  • PPS picture parameter set
  • slice layer In the slice layer, a set of data referred to by the video decoding device 1 for decoding the slice S to be processed (also referred to as a target slice) is defined. As shown in FIG. 2B, the slice S includes a slice header SH and a sequence of tree blocks TBLK1 to TBLKNC (NC is the total number of tree blocks included in the slice S).
  • the slice header SH includes a coding parameter group that the moving image decoding apparatus 1 refers to in order to determine a decoding method of the target slice.
  • Slice type designation information (slice_type) for designating a slice type is an example of an encoding parameter included in the slice header SH.
  • I slice that uses only intra prediction at the time of encoding (2) P slice that uses unidirectional prediction or intra prediction at the time of encoding, (3) B-slice using unidirectional prediction, bidirectional prediction, or intra prediction at the time of encoding may be used.
  • the slice header SH includes a filter parameter FP that is referred to by an adaptive filter provided in the video decoding device 1.
  • the filter parameter FP may be included in the picture header PH.
  • Tree block layer In the tree block layer, a set of data referred to by the video decoding device 1 for decoding a processing target tree block TBLK (hereinafter also referred to as a target tree block) is defined. Note that a tree block may be referred to as a maximum coding unit (LCU).
  • LCU maximum coding unit
  • the tree block TBLK includes a tree block header TBLKH and coding unit information CU1 to CUNL (NL is the total number of coding unit information included in the tree block TBLK).
  • NL is the total number of coding unit information included in the tree block TBLK.
  • the tree block TBLK is divided into partitions for specifying a block size for each process of intra prediction or inter prediction and conversion.
  • the above partition of the tree block TBLK is divided by recursive quadtree partitioning.
  • the tree structure obtained by this recursive quadtree partitioning is hereinafter referred to as a coding tree.
  • a partition corresponding to a leaf that is a node at the end of the coding tree is referred to as a coding node.
  • the encoding node is a basic unit of the encoding process, hereinafter, the encoding node is also referred to as an encoding unit (CU).
  • CU encoding unit
  • coding unit information (hereinafter referred to as CU information)
  • CU1 to CUNL is information corresponding to each coding node (coding unit) obtained by recursively dividing the tree block TBLK into quadtrees.
  • the root of the coding tree is associated with the tree block TBLK.
  • the tree block TBLK is associated with the highest node of the tree structure of the quadtree partition that recursively includes a plurality of encoding nodes.
  • each encoding node is half the size of the encoding node to which the encoding node directly belongs (that is, the partition of the node one layer higher than the encoding node).
  • the size that each coding node can take depends on the size designation information of the coding node and the maximum hierarchy depth (maximum hierarchical depth) included in the sequence parameter set SPS of the coded data # 1. For example, when the size of the tree block TBLK is 64 ⁇ 64 pixels and the maximum hierarchical depth is 3, the encoding nodes in the hierarchy below the tree block TBLK have three types of sizes, that is, 64 ⁇ 64. It can take any of a pixel, 32 ⁇ 32 pixel, and 16 ⁇ 16 pixel.
  • the tree block header TBLKH includes an encoding parameter referred to by the video decoding device 1 in order to determine a decoding method of the target tree block. Specifically, as shown in FIG. 2C, tree block division information SP_TBLK that designates a division pattern of the target tree block into each CU, and a quantization parameter difference that designates the size of the quantization step. ⁇ qp (qp_delta) is included.
  • the tree block division information SP_TBLK is information representing a coding tree for dividing the tree block. Specifically, the shape and size of each CU included in the target tree block, and the position in the target tree block Is information to specify.
  • the tree block division information SP_TBLK may not explicitly include the shape or size of the CU.
  • the tree block division information SP_TBLK may be a set of flags (split_coding_unit_flag) indicating whether or not the entire target tree block or a partial area of the tree block is divided into four.
  • the shape and size of each CU can be specified by using the shape and size of the tree block together.
  • the quantization parameter difference ⁇ qp is a difference qp ⁇ qp ′ between the quantization parameter qp in the target tree block and the quantization parameter qp ′ in the tree block encoded immediately before the target tree block.
  • CU layer In the CU layer, a set of data referred to by the video decoding device 1 for decoding a CU to be processed (hereinafter also referred to as a target CU) is defined.
  • the encoding node is a node at the root of a prediction tree (PT) and a transformation tree (TT).
  • PT prediction tree
  • TT transformation tree
  • the encoding node is divided into one or a plurality of prediction blocks, and the position and size of each prediction block are defined.
  • the prediction block is one or a plurality of non-overlapping areas constituting the encoding node.
  • the prediction tree includes one or a plurality of prediction blocks obtained by the above division.
  • Prediction processing is performed for each prediction block.
  • a prediction block that is a unit of prediction is also referred to as a prediction unit (PU).
  • intra prediction There are roughly two types of division in the prediction tree: intra prediction and inter prediction.
  • inter prediction there are 2N ⁇ 2N (the same size as the encoding node), 2N ⁇ N, N ⁇ 2N, N ⁇ N, and the like.
  • the encoding node is divided into one or a plurality of transform blocks, and the position and size of each transform block are defined.
  • the transform block is one or a plurality of non-overlapping areas constituting the encoding node.
  • the conversion tree includes one or a plurality of conversion blocks obtained by the above division.
  • the division in the transformation tree includes the one in which an area having the same size as the encoding node is assigned as the transformation block, and the one in the recursive quadtree division as in the above-described division of the tree block.
  • transform processing is performed for each conversion block.
  • the transform block which is a unit of transform is also referred to as a transform unit (TU).
  • the CU information CU specifically includes a skip flag SKIP, PT information PTI, and TT information TTI.
  • the skip flag SKIP is a flag indicating whether or not the skip mode is applied to the target PU.
  • the value of the skip flag SKIP is 1, that is, when the skip mode is applied to the target CU, PT information PTI and TT information TTI in the CU information CU are omitted. Note that the skip flag SKIP is omitted for the I slice.
  • the PT information PTI is information regarding the PT included in the CU.
  • the PT information PTI is a set of information related to each of one or more PUs included in the PT, and is referred to when the moving image decoding apparatus 1 generates a predicted image.
  • the PT information PTI includes prediction type information PType and prediction information PInfo.
  • Prediction type information PType is information that specifies whether intra prediction or inter prediction is used as a prediction image generation method for the target PU.
  • the prediction information PInfo is composed of intra prediction information or inter prediction information depending on which prediction method is specified by the prediction type information PType.
  • a PU to which intra prediction is applied is also referred to as an intra PU
  • a PU to which inter prediction is applied is also referred to as an inter PU.
  • the prediction information PInfo includes information specifying the shape, size, and position of the target PU. As described above, the generation of the predicted image is performed in units of PU. Details of the prediction information PInfo will be described later.
  • TT information TTI is information related to TT included in the CU.
  • the TT information TTI is a set of information regarding each of one or a plurality of TUs included in the TT, and is referred to when the moving image decoding apparatus 1 decodes residual data.
  • a TU may be referred to as a block.
  • the TT information TTI includes TT division information SP_TT that designates a division pattern for each transform block of the target CU, and quantized prediction residuals QD1 to QDNT (NT is a target CU). The total number of blocks contained in).
  • TT division information SP_TT is information for determining the shape and size of each TU included in the target CU and the position in the target CU.
  • the TT division information SP_TT can be realized from information (split_transform_unit_flag) indicating whether or not the target node is divided and information (trafoDepth) indicating the division depth.
  • each TU obtained by the division can have a size from 32 ⁇ 32 pixels to 2 ⁇ 2 pixels.
  • Each quantization prediction residual QD is encoded data generated by the moving image encoding apparatus 2 performing the following processes 1 to 3 on a target block that is a processing target block.
  • Process 1 DCT transform (Discrete Cosine Transform) of the prediction residual obtained by subtracting the prediction image from the encoding target image;
  • Process 2 Quantize the transform coefficient obtained in Process 1;
  • Process 3 Variable length coding is performed on the transform coefficient quantized in Process 2;
  • prediction information PInfo As described above, there are two types of prediction information PInfo: inter prediction information and intra prediction information.
  • the inter prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an inter predicted image by inter prediction. More specifically, the inter prediction information includes inter PU division information that specifies a division pattern of the target CU into each inter PU, and inter prediction parameters for each inter PU.
  • the inter prediction parameters include a reference image index, an estimated motion vector index, and a motion vector residual.
  • the intra prediction information includes an encoding parameter that is referred to when the video decoding device 1 generates an intra predicted image by intra prediction. More specifically, the intra prediction information includes intra PU division information that specifies a division pattern of the target CU into each intra PU, and intra prediction parameters for each intra PU.
  • the intra prediction parameter is a parameter for designating an intra prediction method (prediction mode) for each intra PU.
  • each picture or each slice is recursively divided into a plurality of offset units (also called QAOU: Quad Adaptive Offset Unit) by a quadtree structure.
  • QAOU is a processing unit of offset filter processing by the adaptive offset filter according to the present embodiment.
  • the QAOU information which is information related to each QAOU, includes sao_split_flag that indicates whether or not it is further divided. More specifically, sao_split_flag is specified by arguments (sao_curr_depth, ys, xs) described later, and is also expressed as sao_split_flag [sao_curr_depth] [ys] [xs].
  • sao_split_flag included in a certain QAOU indicates that the QAOU is further divided (that is, when the QAOU is not a leaf), as shown in FIG. 2 (e), the QAOU
  • the QAOU information related to the QAOU includes offset information OI related to the QAOU.
  • the offset information OI includes offset type designation information OTI for designating an offset type and an offset group determined according to the offset type.
  • the offset group includes a plurality of offsets.
  • the offset in the encoded data is a quantized value.
  • the offset in the encoded data may be a prediction residual obtained by using some prediction, for example, linear prediction.
  • the offset type It is also possible to include the pixel bit depth of the processing target area in the designation information OTI.
  • FIG. 3 is a diagram showing each syntax included in the offset information OI (denoted as sao_offset_param () in FIG. 3).
  • the offset information OI includes the syntax sao_type_idx [sao_curr_depth] [ys] [xs].
  • sao_type_idx [sao_curr_depth] [ys] [xs] is not 0, the offset information OI includes sao_offset [sao_curr_depth] [ys] [xs] [i].
  • sao_curr_depth (Sao_curr_depth, ys, xs)
  • sao_type_idx and sao_offset arguments, sao_curr_depth is an index representing the QAOU division depth
  • ys and xs are indices for representing the position of the QAOU (or QAOMU described later) in the y direction and the position in the x direction, respectively. is there.
  • FIGS. 4A to 4E are diagrams showing aspects of QAOU division according to the value of sao_curr_depth.
  • each QAOU is specified by sao_curr_depth and (xs, ys).
  • sao_type_idx [sao_curr_depth] [ys] [xs] corresponds to the above-described offset type designation information OTI, and is a syntax for designating an offset type for each QAOU.
  • sao_type_idx may be simply referred to as an offset type.
  • sao_type_idx [sao_curr_depth] [ys] [xs] takes an integer value from 0 to 6.
  • sao_offset [sao_curr_depth] [ys] [xs] [i] is a symbol representing a specific value of an offset added to each pixel included in the target QAOU in the offset filter processing by the adaptive offset filter according to the present embodiment. Tax.
  • sao_offset may be simply referred to as an offset.
  • Sao_offset [sao_curr_depth] [ys] [xs] [i] is specified by an index i in addition to the arguments sao_curr_depth, ys and xs.
  • the index i is an index for designating a class, and is also expressed as class_idx.
  • sao_type_idx [sao_curr_depth] [ys] [xs] is any of 5 to 6 (that is, in the case of a band offset)
  • the adaptive offset filter classifies the target pixel included in the target QAOU into one of the plurality of classes, and the class in which the target pixel is classified with respect to the target pixel. Add offset Offset for.
  • Descriptor (descriptor) ue (v) shown in FIG. 3 indicates that the syntax associated with this descriptor is an unsigned numerical value, and the value is variable-length encoded. (v) indicates that the syntax associated with this descriptor is a signed numerical value, and is variable-length encoded into a sign and an absolute value.
  • the moving picture decoding apparatus 1 includes H.264 as a part thereof. H.264 / MPEG-4.
  • a method adopted in AVC a method adopted in KTA software, which is a codec for joint development in VCEG (Video Coding Expert Group), and a method adopted in TMuC (Test Model under Consideration) software, which is the successor codec And the technology employed in HM (HEVC TestModel) software.
  • FIG. 5 is a block diagram showing a configuration of the moving picture decoding apparatus 1.
  • the moving picture decoding apparatus 1 includes a variable length code decoding unit 13, a motion vector restoration unit 14, a buffer memory 15, an inter prediction image generation unit 16, an intra prediction image generation unit 17, and a prediction method determination unit 18. , An inverse quantization / inverse transform unit 19, an adder 20, a deblocking filter 41, an adaptive filter 50, and an adaptive offset filter 60.
  • the moving picture decoding apparatus 1 is an apparatus for generating moving picture # 2 by decoding encoded data # 1.
  • the variable length code decoding unit 13 decodes the prediction parameter PP related to each partition from the encoded data # 1. That is, for the inter prediction partition, the reference image index RI, the estimated motion vector index PMVI, and the motion vector residual MVD are decoded from the encoded data # 1, and these are supplied to the motion vector restoration unit 14. On the other hand, with respect to the intra prediction partition, (1) size designation information for designating the size of the partition and (2) prediction index designation information for designating the prediction index are decoded from the encoded data # 1, and this is decoded into the intra prediction image. This is supplied to the generation unit 17. In addition, the variable length code decoding unit 13 decodes the CU information from the encoded data, and supplies this to the prediction method determination unit 18 (not shown).
  • variable length code decoding unit 13 decodes the quantization prediction residual QD for each block and the quantization parameter difference ⁇ qp for the tree block including the block from the encoded data # 1, and dequantizes and decodes them. This is supplied to the inverse conversion unit 19. Further, the variable length code decoding unit 13 extracts QAOU information from the encoded data # 1 and supplies the extracted QAOU information to the adaptive offset filter 60.
  • the motion vector restoration unit 14 restores the motion vector mv related to each inter prediction partition from the motion vector residual MVD related to that partition and the restored motion vector mv ′ related to another partition. Specifically, (1) the estimated motion vector pmv is derived from the restored motion vector mv ′ according to the estimation method specified by the estimated motion vector index PMVI, and (2) the derived estimated motion vector pmv and the motion vector remaining are derived. The motion vector mv is obtained by adding the difference MVD. It should be noted that the restored motion vector mv ′ relating to other partitions can be read from the buffer memory 15. The motion vector restoration unit 14 supplies the restored motion vector mv together with the corresponding reference image index RI to the inter predicted image generation unit 16. For the inter prediction partition that performs bi-directional prediction (weighted prediction), the restored two motion vectors mv1 and mv2 are supplied to the inter prediction image generation unit 16 together with the corresponding reference image indexes RI1 and RI2.
  • the inter prediction image generation unit 16 generates a motion compensation image mc related to each inter prediction partition. Specifically, using the motion vector mv supplied from the motion vector restoration unit 14, the motion compensated image mc from the filtered decoded image P_FL ′ designated by the reference image index RI also supplied from the motion vector restoration unit 14 is used. Is generated.
  • the filtered decoded image P_FL ′ is obtained by performing deblocking processing by the deblocking filter 41, offset filtering processing by the adaptive offset filter 60, and adaptive filtering processing by the adaptive filter 50 on the decoded image P that has already been decoded.
  • the inter predicted image generation unit 16 can read out the pixel value of each pixel constituting the filtered decoded image P_FL ′ from the buffer memory 15.
  • the motion compensation image mc generated by the inter prediction image generation unit 16 is supplied to the prediction method determination unit 18 as an inter prediction image Pred_Inter.
  • a motion compensated image mc1 is generated from the filtered decoded image P_FL1 ′ specified by the reference image index RI1 using the motion vector mv1.
  • a motion compensated image mc2 is generated from the filtered decoded image P_FL2 ′ specified by the reference image index RI2 using the motion vector mv2, and (3) weighting between the motion compensated image mc1 and the motion compensated image mc2
  • An inter predicted image Pred_Inter is generated by adding an offset value to the average.
  • the intra predicted image generation unit 17 generates a predicted image Pred_Intra related to each intra prediction partition. Specifically, first, the prediction mode decoded from the encoded data # 1 is referred to, and the prediction mode is assigned to the target partition in, for example, raster scan order. Subsequently, a predicted image Pred_Intra is generated from the decoded image P according to the prediction method indicated by the prediction mode. The intra predicted image Pred_Intra generated by the intra predicted image generation unit 17 is supplied to the prediction method determination unit 18.
  • the intra predicted image generation unit 17 supplies the adaptive filter 50 with intra coding mode information IEM, which is information indicating the size of the target partition and the prediction mode assigned to the target partition.
  • IEM intra coding mode information
  • the prediction method determination unit 18 determines whether each partition is an inter prediction partition for performing inter prediction or an intra prediction partition for performing intra prediction based on the CU information.
  • the inter predicted image Pred_Inter generated by the inter predicted image generation unit 16 is supplied to the adder 20 as the predicted image Pred.
  • the inter predicted image generation unit 17 generates the inter predicted image Pred_Inter.
  • the intra predicted image Pred_Intra that has been processed is supplied to the adder 20 as the predicted image Pred.
  • the inverse quantization / inverse transform unit 19 (1) inversely quantizes the quantized prediction residual QD, (2) performs inverse DCT (Discrete Cosine Transform) transform on the DCT coefficient obtained by the inverse quantization, and (3) The prediction residual D obtained by the inverse DCT transform is supplied to the adder 20.
  • the inverse quantization / inverse transform unit 19 derives the quantization step QP from the quantization parameter difference ⁇ qp supplied from the variable length code decoding unit 13.
  • the generation of the prediction residual D by the inverse quantization / inverse transform unit 19 is performed in units of blocks (transform units).
  • the adder 20 generates the decoded image P by adding the prediction image Pred supplied from the prediction method determination unit 18 and the prediction residual D supplied from the inverse quantization / inverse transformation unit 19.
  • the deblocking filter 41 determines that the block boundary in the decoded image P or the block boundary in the decoded image P when the difference between the pixel values of pixels adjacent to each other via the block boundary in the decoded image P or the CU boundary is smaller than a predetermined threshold By performing deblocking processing on the CU boundary, an image near the block boundary or the vicinity of the CU boundary is smoothed.
  • the image subjected to the deblocking process by the deblocking filter 41 is output to the adaptive offset filter 60 as a deblocked decoded image P_DB.
  • the adaptive offset filter 60 performs an offset filter process using an offset decoded from the encoded data # 1 on the deblocked decoded image P_DB supplied from the deblocking filter 41, using QAOU as a processing unit. An offset filtered decoded image P_OF is generated. The generated offset filtered decoded image P_OF is supplied to the adaptive offset filter 60. Since a specific configuration of the adaptive offset filter 60 will be described later, description thereof is omitted here.
  • the adaptive filter 50 performs a filtering process using the filter parameter FP decoded from the encoded data # 1 on the offset filtered decoded image P_OF supplied from the adaptive offset filter 60, thereby obtaining a filtered decoded image P_FL. Is generated.
  • the image that has been filtered by the adaptive filter 50 is output to the outside as a filtered decoded image P_FL, and is associated with the POC designation information decoded from the encoded data by the variable length code decoding unit 13 in the buffer memory 15. Stored.
  • FIG. 1 is a block diagram showing the configuration of the adaptive offset filter 60.
  • the adaptive offset filter 60 includes an adaptive offset filter information decoding unit 61 and an adaptive offset filter processing unit 62.
  • the adaptive offset filter information decoding unit 61 includes an offset information decoding unit 611, a QAOU structure decoding unit 612, and an offset attribute setting unit 613.
  • the offset information decoding unit 611 refers to the QAOU information included in the encoded data # 1, and decodes the offset information OI included in the QAOU information. Also, each value of sao_type_idx [sao_curr_depth] [ys] [xs] and sao_offset [sao_curr_depth] [ys] [xs] [i] obtained by decoding the offset information OI is set to each argument (sao_curr_depth, ys, xs) and (sao_curr_depth, ys, xs, i) are supplied to the offset information storage unit 621 in association with each other.
  • the QAOU structure decoding unit 612 determines the QAOU partition structure by decoding sao_split_flag [sao_curr_depth] [ys] [xs] included in the QAOU information, and represents the determined QAOU partition structure Is supplied to the offset information storage unit 621.
  • the offset attribute setting unit 613 determines an offset bit depth (also referred to as SAO_DEPTH) and an offset value range.
  • the bit depth of the offset is determined from a pixel bit depth (also referred to as PIC_DEPTH) (not shown) input to the offset attribute setting unit 613.
  • the pixel bit depth indicates the range of pixel values constituting the input image of the adaptive offset filter 60 in bit width.
  • the pixel bit depth is N bits
  • the pixel value ranges from 0 to 2 N ⁇ 1.
  • the pixel value can range from 0 to 255.
  • the bit depth of the decoded image / local decoded image is used.
  • the accuracy of the input image and the accuracy of the output image of the adaptive offset filter 60 are pixel bit depths.
  • the pixel bit depth can be used by decoding a value determined using the syntax in the encoded data # 1. For example, in the case of H.264 / AVC, it can be determined using bit_depth_luma_minus8 in the sequence parameter set. Furthermore, as another form, the pixel bit depth may be determined for each unit area to be processed. In this case, the pixel bit depth is decoded from the header of the unit area. The pixel bit depth of the unit area may be included in the parameter information or header in the encoded data # 1 for decoding the input image of the adaptive offset filter 60, or included as part of the QAOU information. Also good.
  • the pixel bit depth may be included in the picture parameter header, slice header, LCU, CU, and the like. Further, as part of the QAOU information, the pixel bit depth may be included in the leaf QAOU, or the pixel bits are included in the QAOU information of a predetermined hierarchy (for example, the QAOU of the highest hierarchy or the QAOU of the first hierarchy). You may include the depth. In addition, it is preferable that the pixel bit depth is encoded as a difference value from 8 bits. In the QAOU information, it is also appropriate to directly encode the shift value in addition to the pixel bit depth. It is also appropriate to encode the shift value only when it exceeds 8 bits.
  • the shift value indicates a bit shift amount necessary for performing inverse quantization.
  • a parameter used for inverse quantization may be a step value in addition to a shift value.
  • the inverse quantization of the offset is performed by a product with the step value, and the quantization of the offset is performed by division by the step value.
  • the bit depth of the offset is a value indicating the accuracy of the offset encoded in the encoded data # 1.
  • the offset included in the encoded data # 1 is quantized, and the quantized offset is dequantized to a bit depth that matches the pixel bit depth by the offset deriving unit 625 described later after decoding.
  • an offset addition unit 626 which will be described later, adds the dequantized offset.
  • the bit depth of the offset has a value less than or equal to the pixel bit depth.
  • the offset value to be encoded means a value quantized using 2 k as the offset quantization step. Conversion from the decoded bit depth to the pixel bit depth is performed by an offset deriving unit 625 described later.
  • the offset attribute setting unit 613 further sets an offset value range according to the determined bit depth of the offset. Furthermore, a shift value is set from the pixel bit depth of the offset and the offset value range.
  • the set offset value range and shift value are supplied to the offset information storage unit 621 and the offset information decoding unit 611.
  • the determination of the offset bit depth and the setting of the shift value are performed in any one of patterns S1 to S6 described later.
  • the setting of the offset value range is performed in one of the patterns C1 and C2 described later. Attributes common to offset, such as an offset value range and a shift value, are called offset attributes. On the other hand, as shown in FIG.
  • the adaptive offset filter processing unit 62 includes an offset information storage unit 621, a QAOU control unit 622, an offset type derivation unit 623.
  • a class classification unit 624, an offset derivation unit 625, and an offset addition unit 626 are provided.
  • the offset information storage unit 621 and the offset type designated for each QAOU This is a configuration for managing and storing a specific value of an offset for each class that can be selected in the offset type, and includes a map memory and a list memory.
  • the map memory stores a QAOU index, which will be described later, assigned to each offset minimum unit (also referred to as QAOMU: Quad-Adaptive-Offset-Minimum-Unit) determined according to the division depth.
  • QAOMU Quad-Adaptive-Offset-Minimum-Unit
  • FIG. 6A is a diagram for explaining an example of the QAOU index stored in the map memory, and is allocated to each QAOMU and each QAOMU having a division depth of 3 constituting a target processing unit (for example, LCU). It is a figure which shows the QAOU index.
  • QAOU is designated for indexes 0 to 9 simply without considering the division depth of QAOU.
  • the thin line in FIG. 6A indicates the QAOMU boundary, and the thick line indicates the QAOU boundary.
  • QAOU0 is composed of four QAOMUs, and 0 is assigned to these four QAOMUs as QAOU indexes.
  • QAOU3 is composed of one QAOMU, and 3 is assigned to this QAOMU as a QAOU index. In this way, the map memory stores the QAOU index assigned to each QAOMU.
  • each QAOU index, an offset type associated with the QAOU index, and a specific value of an offset related to each class selectable in the offset type are stored in association with each other.
  • the offset information storage unit 621 stores an offset whose value range is limited in the offset value range set by the offset attribute setting unit 613.
  • FIG. 6B is a diagram for explaining an example of information stored in the list memory, and relates to the offset type associated with each of the QAOU indexes 0 to 9 and each class selectable in each offset type. Indicates an offset. “Xxx” in FIG. 6B represents specific numerical values that may be different from each other.
  • the offsets are also denoted as BO_1 and 2, respectively.
  • offset 1 to offset 16 are sao_offset [sao_curr_depth] [ys] [xs] [1] to sao_offset [sao_curr_depth] [sao_type_idx [sao_curr_depth] [ys] [xs] when the value is 5 or 6. It refers to the value specified by ys] [xs] [16].
  • the offset type is an edge offset
  • the offset stored in the list memory for the offset type is a total of four offsets 1 to 4.
  • offsets 1 to 4 are sao_offset [sao_curr_depth] [ys] [xs] [1] when the value of sao_type_idx [sao_curr_depth] [ys] [xs] is any one of 1, 2, 3, 4 ⁇ Sao_offset [sao_curr_depth] [ys] [xs] Points to the values specified by [4]. None is stored in offsets 5-16.
  • the memory size of each offset stored in the list memory is determined by the offset value area supplied from the offset attribute setting unit 613.
  • the offset value range is ⁇ 2 4 to 2 4 ⁇ 1
  • it can be expressed by 5 bits per offset, and a memory size of 5 bits is required.
  • Each QAOMU is assigned a QAOMU number, and the QAOMU numbers can be distinguished from each other by the QAOMU number.
  • a QAOMU whose QAOMU number is N Q will also be referred to as QAOMUN Q.
  • the QAOU index is the number of the designated QAOU block from the division depth 0 to the maximum division depth.
  • the offset information storage unit 621 used in the video decoding device 1 it is not necessary to store offsets of all QAOUs of all division depths, so it is not necessary to secure 341 memory areas, and input QAOU information It is sufficient that there are as many memory areas as the number of QAOUs that are actually used in the structure specified in. When the maximum division depth is 4, since the number of blocks is 256 or less, it is sufficient to have 256 map memories and list memories.
  • the QAOU index used in the offset information storage unit 621 is a unique index for identifying the leaf QAOU, for example, an index of 0 to 255 or less that is incremented by 1 every time the lease QAOU is decoded.
  • the offset information storage unit 621 can also store a map list in units of QAOU information corresponding to the maximum division depth.
  • the QAOU index used in the offset information storage unit 621 uses numbers 0 to 255, which correspond to the QAOMU numbers 85 to 340 in FIG.
  • FIGS. 7A to 7E are diagrams showing examples of QAOMU numbers assigned to QAOMUs included in a target processing unit (for example, LCU).
  • FIG. 7A shows QAOMUs whose division depth is zero.
  • B shows the QAOMU number assigned to the QAOMU whose division depth is 1, and
  • c shows the QAOMU number assigned to the QAOMU whose division depth is 2.
  • the QAOMU number is indicated, (d) indicates the QAOMU number assigned to the QAOMU having the division depth of 3, and (e) indicates the QAOMU number assigned to the QAOMU having the division depth of 4. ing.
  • the QAOU control unit 622 controls each unit included in the adaptive offset filter processing unit 62. Further, the QAOU control unit 622 refers to the QAOU structure information, divides the deblocked decoded image P_DB into one or a plurality of QAOUs, and scans each QAOU in a predetermined order. In addition, the QAOMU number representing the target QAOMU to be processed is supplied to the offset type deriving unit 623.
  • the offset type deriving unit 623 derives an offset type specified by the QAOMU number supplied from the QAOU control unit 622 with reference to the map memory and the list memory of the offset information storage unit 621. Further, the derived offset type is supplied to the class classification unit 624.
  • the class classification unit 624 classifies each pixel included in the target QAOU into any of a plurality of classes that can be selected in the offset type supplied from the offset type deriving unit 623.
  • the offset type and a class index indicating a class into which each pixel is classified are supplied to the offset deriving unit 625. The specific classification process performed by the class classification unit 624 will be described later, and will not be described here.
  • the offset deriving unit 625 refers to the list memory of the offset information storage unit 621 and derives an offset specified by the offset type and class index supplied from the class classification unit 624 for each pixel included in the target QAOU. Further, an offset reverse shift unit (not shown) that shifts the offset to the left by the shift value set by the offset attribute setting unit 613 is provided.
  • the offset inverse shift unit performs inverse quantization of the offset so that the bit depth of the offset matches the pixel bit depth. By performing such inverse quantization, it is possible to add the pixel value and the offset at the same bit depth in the adding process of the offset adding unit 626 described later. The offset obtained by inverse quantization for each pixel is supplied to the offset adding unit 626.
  • the offset adding unit 626 adds the offset supplied from the offset deriving unit 625 to each pixel of the deblocked decoded image P_DB in the target QAOU.
  • the offset addition unit 626 outputs an image obtained by performing processing on all the QAOUs included in the deblocked decoded image P_DB as an offset filtered decoded image P_OF.
  • FIG. 8 is a flowchart showing the flow of processing by the adaptive offset filter processing unit 62.
  • Step S101 First, the QAOU control unit 622 acquires QAOU structure information from the offset information storage unit 621.
  • Step S102 Subsequently, the QAOU control unit 622 starts a first loop using the QAOMU number of the target QAOMU to be processed as a loop variable.
  • Step S103 The QAOU control unit 622 supplies the QAOMU number to the offset type deriving unit 623. Based on the control by the QAOU control unit 622, the offset type deriving unit 623 reads the offset type specified by the QAOMU number supplied from the QAOU control unit 622 from the map memory and the list memory of the offset information storage unit 621. Further, the offset type deriving unit 623 supplies the read offset type to the class classification unit 624.
  • Step S104 the QAOU control unit 622 starts a second loop using the pixel number of each pixel included in the target QAOMU as a loop variable.
  • the pixel number is for identifying the pixels included in the target QAOMU from each other.
  • the pixel numbers included in the target QAOMU are assigned with a predetermined scan order. it can.
  • the x coordinate and y coordinate of each pixel included in the target QAOMU may be used as a loop variable.
  • Step S105 the class classification unit 624 classifies the pixel to be processed into any of a plurality of classes that can be selected in the offset type supplied from the offset type deriving unit 623 based on the control by the QAOU control unit 622. Further, the offset type and the class index indicating the class into which the pixel to be processed is classified are supplied to the offset deriving unit 625.
  • the offset deriving unit 625 reads the offset to be added to the pixel to be processed from the offset information storage unit 621 based on the control by the QAOU control unit 622. That is, the offset specified by the offset type and class index supplied from the class classification unit 624 is read. In addition, an offset obtained by dequantizing the offset derived from the pixel to be processed by bit-shifting to the left by the shift value supplied from the offset attribute setting unit 613 is supplied to the offset adding unit 626.
  • Step S107 Subsequently, based on the control by the QAOU control unit 622, the offset addition unit 626 adds the offset supplied from the offset deriving unit 625 to the pixel value of the processing target pixel of the deblocked decoded image P_DB.
  • Step S108 This step is the end of the second loop.
  • Step S109 This step is the end of the first loop.
  • the adder 626 is controlled.
  • SAO_DEPTH and PIC_DEPTH are closely related to each other in terms of quantization error. Since the bit depth of the output image of the adaptive offset filter 60 is the pixel bit depth PIC_DEPTH, and SAO_DEPTH is the bit depth of the offset applied to the pixel, even if an offset with an accuracy exceeding the pixel bit depth is used, it is discarded in the output process. Therefore, SAO_DEPTH, which is the accuracy of the offset, is preferably set to be equal to or less than PIC_DEPTH. Further, when SAO_DEPTH is smaller than PIC_DEPTH, only the correction that is coarser than the accuracy (PIC_DEPTH) that can correct the input image by the filter can be performed, so that the filter effect is reduced.
  • the code amount of the offset increases.
  • the coding efficiency is optimized by minimizing the rate distortion cost D + ⁇ R expressed using the code amount R of the encoded data, the distortion D of the input image, and the weight ⁇ , Since the accuracy of the offset has a negative effect on the distortion D and a positive effect on the rate R, there is a trade-off in the magnitude of the accuracy, and a specific optimum value exists.
  • the bit width for storing the offset quantized by the offset information storage unit 621 is limited by limiting the quantized offset to an offset value range that can be expressed with a constant bit width. Can do. The effect of reducing the memory size can be obtained as compared with the case of not limiting. However, if the offset range is excessively narrowed, the offset reduces the effect of correcting the distortion of the decoded image. Therefore, the offset addition process cannot remove the distortion of the decoded image, and the coding efficiency is reduced. May decrease. Therefore, it is preferable to set an optimum offset value range so that the encoding efficiency does not decrease.
  • the offset attribute setting unit 613 sets the offset bit depth and the offset shift value by any of the patterns S1 to S6, and sets the offset value range by any of the patterns C1 to C3.
  • the offset bit depth SAO_DEPTH is set equal to the pixel bit depth PIC_DEPTH. Since the maximum value of the offset accuracy is the pixel bit depth, the pattern S1 encodes the offset with the maximum accuracy.
  • Pattern S2 In pattern S2, as shown in FIG. 9B, SAO_DEPTH is made equal to PIC_DEPTH when PIC_DEPTH is 10 bits or less, and SAO_DEPTH is set to 10 when PIC_DEPTH is 11 bits or more.
  • the upper limit of the offset bit depth is 10 bits. According to the knowledge of the inventor, when the value of the quantization step QP of the decoded image is small (when the bit rate is high), the bit depth of the offset is reduced when the bit depth of the offset is the same as the pixel bit depth.
  • the coding efficiency is high, and conversely, when the value of the quantization step QP is large, the encoding bit efficiency is smaller when the offset bit depth is smaller than the pixel bit depth than when the pixel bit depth is the same. Becomes higher.
  • the offset bit depth is determined as in the pattern S2, so that the offset bit depth is 8 bits when the pixel bit depth is 9 bits or less.
  • the coding efficiency is improved when the pixel bit depth is 10 bits or more compared to the case where the offset bit depth is 9 bits.
  • the code amount of the offset is changed compared to the case where the bit depth of the offset is equal to the pixel bit depth as in the pattern S1. It can be made small, and high encoding efficiency can be obtained.
  • Pattern S3 In pattern S3, as shown in FIG. 9C, SAO_DEPTH is equal to PIC_DEPTH when PIC_DEPTH is 9 bits or less, and SAO_DEPTH is 9 when PIC_DEPTH is 10 bits or more.
  • the upper limit of the offset bit depth is 9 bits. Also in the pattern S3, similarly to the pattern S2, the offset code amount can be reduced, and high coding efficiency can be obtained.
  • the shift value is represented by a difference value PIC_DEPTH-SAO_DEPTH between PIC_DEPTH and SAO_DEPTH. Since the offset bit depth and the shift value in the patterns S1 to S4 are set without increasing the memory size and the processing amount, the coding efficiency can be improved.
  • the bit depth of the offset is explicitly encoded. Specifically, the difference between the bit depth of the offset and a predetermined value is encoded.
  • the predetermined value is 8 or an appropriate pixel bit depth.
  • SAO_DEPTH-8 is encoded, and in the latter case, PIC_DEPTH-SAO_DEPTH is appropriate.
  • the bit depth of the offset may be encoded as various parameter information or header of encoded data or as a part of QAOU information.
  • the pixel bit depth may be included in the leaf QAOU, or the pixel bit depth may be added to the QAOU information of a predetermined hierarchy (for example, QAOU in the highest hierarchy or QAOU in the first hierarchy). May be included.
  • a predetermined hierarchy for example, QAOU in the highest hierarchy or QAOU in the first hierarchy.
  • the required memory size is reduced by reducing the bit depth when sao_curr_depth is large and increasing the bit depth when sao_curr_depth is small Is possible.
  • sao_curr_depth 0 to 1
  • it is appropriate to set an offset bit depth pixel bit depth (pattern S1)
  • sao_curr_depth 2 to 4
  • an upper limit is set to the offset bit depth (pattern S2).
  • the bit width is encoded in this way. Whether to encode an offset bit width for each QAOU depth or a flag indicating whether to use one offset bit width regardless of the QAOU depth, and whether to encode for each QAOU depth It is also appropriate to switch between.
  • an offset value range is set according to SAO_DEPTH.
  • the maximum bit length representing the value in the offset range is CLIP_BIT.
  • the fact that one offset can be stored in 4 bits means that one offset can be packed and stored in 1 byte by software that handles 8-bit bytes as a unit, and the memory size can be reduced easily. is there.
  • CLIP_BIT N may be set using a constant N that does not depend on SAO_DEPTH.
  • N may be set using a constant N that does not depend on SAO_DEPTH.
  • the offset value range is determined according to the QAOU hierarchy.
  • sao_curr_depth is small (for example, 0 to 1)
  • the offset value range is determined regardless of the offset bit depth
  • sao_curr_depth is large (for example, 2 to 4)
  • CLIP_BIT 8 (pattern C2)
  • SAO_DEPTH-K bit pattern C1
  • the memory size required for the offset information storage unit 621 can be reduced to approximately 3/5 compared to the conventional example.
  • the code amount of the offset included in the encoded data # 1 can be reduced, the encoding efficiency can be improved. Moreover, since an excessive offset is suppressed, an appropriate image quality is ensured.
  • the memory size required for the offset information storage unit 621 can be reduced to about 4/5 compared to the conventional example.
  • the amount of offset code included in the encoded data # 1 can be reduced, the encoding efficiency can be improved. Moreover, since an excessive offset is suppressed, an appropriate image quality is ensured.
  • the code amount of the residual data (pixel value of the residual image) included in the encoded data becomes large.
  • the shift value is set by pattern S2
  • the offset value range of edge offset is set by pattern C2
  • the offset value range of band offset is set by pattern C1. The method to perform is demonstrated.
  • the offset bit depth is set to 10 bits in the pattern S2.
  • An offset belonging to the offset type of edge offset (hereinafter referred to as edge offset offset) is set to a value range of 8 bits from the pattern C2.
  • the offset belonging to the band offset offset type (hereinafter referred to as the band offset offset) is set to a value range of 6 bits from the pattern C1. More generally, when the number of edge offset offset bits is N and the band offset offset number is M bits, the offset bit number is determined so that N ⁇ M is satisfied.
  • the memory size that needs to be secured in the offset information storage unit 621 is the number of offset type classes ⁇ the number of offset bits in units of QAOUs. Therefore, the number of bits of the band offset in which the offset class number is larger than the edge offset should be reduced. For example, the memory area in which the offset is used in the offset information storage unit 621 can be used effectively.
  • the threshold th for limiting the value that can be taken by the offset is greater than 2 m ⁇ 1 and 2 m or less
  • m-bit fixed length encoding / A decoding scheme can be used as an encoding method for encoding the offset.
  • variable length encoding / decoding schemes such as Truncated unary encoding with the maximum value and th and Truncated Rice encoding can be used.
  • the maximum value th is determined by the offset value range supplied from the offset attribute setting unit 613.
  • the moving image decoding apparatus 1 can decode the offset encoded in this way.
  • the offset attribute setting unit 613 sets the offset bit depth, offset value range, and shift value.
  • the adaptive offset filter information decoding unit 61 decodes the quantized offset having a value in the range of the offset value range, and stores the quantized offset in the offset information storage unit 621 having a storage area having a bit width equal to or greater than the offset value range for each offset.
  • the offset value range is determined according to the bit depth of the offset. Further, the bit depth of the offset is determined according to the bit depth of the pixel. Therefore, it is also a feature of this embodiment that the bit depth of the offset is determined according to the bit depth of the pixel.
  • the adaptive offset filter information decoding unit 61 in Embodiment 1 includes a storage unit that stores the decoded offset and an inverse quantization unit that performs inverse quantization on the offset obtained from the storage unit, and an offset derivation unit
  • the inverse quantization process in 625 may be omitted.
  • the storage unit stores the offset limited to the offset value range set by the offset attribute setting unit 613, and the inverse quantization unit shifts to the left according to the shift value set by the offset attribute setting unit 613. And performing an inverse quantization process.
  • the offset information decoding unit 611 decodes each offset referred to by the offset addition unit 626 that adds an offset to each pixel value of an input image composed of a plurality of unit regions from the encoded data # 1, and It can also be expressed as having an offset decoding means for setting an offset value range and a shift value determined according to the pixel bit depth that is not performed, and decoding an offset limited to the offset value range.
  • the adaptive offset filter 60 is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and includes offset type designation information included in encoded data.
  • An offset attribute setting unit 613 that sets an offset attribute in a unit area to be processed, and an offset information decoding unit 611 that decodes an offset having a bit width corresponding to the offset value range included in the set offset attribute, It can also be expressed as an image filter device including an offset addition unit 626 that adds the offset to each pixel value of the input image.
  • the offset information decoding unit 611 determines, in addition to the offset decoding unit, a determination unit that determines an offset type to which a unit area to be processed belongs among a plurality of offset types, and an offset type determined by the determination unit.
  • a determination unit that determines an offset type to which a unit area to be processed belongs among a plurality of offset types, and an offset type determined by the determination unit.
  • an offset decoding unit that decodes offsets having different bit widths may be provided.
  • the offset type designation information includes the bit depth of the pixel value of the input image in each unit area, and the offset information decoding unit 611 decodes an offset having a bit width corresponding to the bit depth of the pixel value. It can be.
  • the class classification unit 624 preferably performs a classification process corresponding to the classification process in the moving picture encoding apparatus that generates the encoded data # 1 among the following classification processing examples.
  • the class classification unit 624 determines whether or not an edge exists in the vicinity of the pixel to be processed and if an edge exists. Determines the type of edge, and classifies the pixel to be processed into one of a plurality of classes according to the determination result.
  • the class classification unit 624 first determines the pixel value pic [x] of the processing target pixel x and the pixel values of two pixels a and b that are adjacent to the processing target pixel or share a vertex.
  • the sign of the difference from pic [a], pic [b] Sign (pic [x] -pic [a]), and Sign (pic [x] -pic [b]) Is calculated.
  • Sign (z) -1 (when z ⁇ 0) It is a function that takes each value of. Further, which pixel is used as the pixel a and the pixel b depends on the offset type and is determined as follows.
  • a pixel adjacent to the left side of the processing target pixel x is defined as a pixel a
  • a pixel adjacent to the right side of the processing target pixel is defined as a pixel b.
  • a pixel sharing the lower left vertex of the processing target pixel x is defined as a pixel a, and a pixel sharing the upper right vertex of the processing target pixel Is a pixel b.
  • FIG. 11A is a graph showing the magnitude relationship between the pixel value pic [x] of the pixel x to be processed and the pixel value of the pixel a or b, and the value of the function Sign corresponding to the magnitude relationship.
  • a black circle with pic [x] indicates a pixel value of the processing target pixel x
  • a black circle without pic [x] indicates the processing target pixel a.
  • the pixel value of b is shown.
  • the vertical direction in the graph shown in FIG. 11A indicates the magnitude of the pixel value.
  • the class classification unit 624 calculates EgdeType based on Sign (pic [x] ⁇ pic [a]) and Sign (pic [x] ⁇ pic [b]) according to the following formula (1-1). To derive.
  • FIG. 11B is a graph showing the magnitude relationship between the pixel value of the processing target pixel x and the pixel values of the pixels a and b, and a diagram showing the value of EgdeType corresponding to the magnitude relationship.
  • the black circle at the center of each graph indicates the pixel value of the processing target pixel x
  • the black circles at both ends indicate the pixel values of the pixels a and b.
  • the vertical direction in the graph shown in FIG. 11B indicates the magnitude of the pixel value.
  • the class classification unit 624 derives the class index (class_idx) of the class to which the processing target pixel x should belong based on the derived EgdeType as follows.
  • class_idx EoTbl [EdgeType]
  • EoTbl [EdgeType] is a conversion table used to derive class_idx from EdgeType.
  • a specific example of the conversion table EoTbl is shown in FIG.
  • FIG. 11C shows the correspondence between each graph shown in FIG. 11B and lass_idx.
  • the class classification unit 624 determines the pixel value of the processing target pixel according to the pixel value pic [x] of the processing target pixel x. Are classified into one of a plurality of classes.
  • the class classification unit 624 determines that the pixel value pic [x] of the processing target pixel x is (Max ⁇ 1/4) ⁇ pic [x] ⁇ (max ⁇ 3/4) Is satisfied, the processing target pixel is classified into a class other than class 0. That is, when the pixel value of the processing target pixel is within the hatched range in FIG. 12A, the processing target pixel is classified into a class other than class 0.
  • the class classification unit 624 determines that the pixel value pic [x] of the processing target pixel x is pic [x] ⁇ (max ⁇ 1/4) or (max ⁇ 3/4) ⁇ pic [x] Is satisfied, the processing target pixel is classified into a class other than class 0. That is, when the pixel value of the processing target pixel is within the hatched range in FIG. 12B, the processing target pixel is classified into a class other than class 0.
  • the class classification process by the class classification unit 624 will be described in more detail as follows.
  • the class classification unit 624 derives the class index (class_idx) of the class to which the processing target pixel x should belong as follows.
  • class_idx EoTbl [sao_type_idx] [pic [x] / 8]
  • EoTbl [sao_type_idx] [pic [x] / 8] is a conversion table used to derive class_idx from the pixel value pic [x] and sao_type_idx of the processing target pixel x.
  • the class classification unit 624 determines that the pixel value pic [x] of the processing target pixel x satisfies 8 ⁇ (pic [x] / 8) ⁇ 23. Depending on the size of pic [x], the processing target pixel x is classified into one of the class indexes 1 to 16.
  • the class classification unit 624 determines that the pixel value pic [x] of the processing target pixel x satisfies pic [x] / 8) ⁇ 7 or 24 ⁇ (pic [x] / 8). , The pixel x to be processed is classified into one of class indexes 1 to 16 according to the size of pic [x].
  • the class classification unit 624 derives the EggeType using the following formula (1-2) instead of the formula (1-1). Others are the same as the classification processing example 1.
  • EgdeType Sign ((pic [x] >> shift) ⁇ (pic [a] >> shift)) + Sign ((pic [x] >> shift) ⁇ (pic [b] >> shift)) + 2... (1-2)
  • “>>” represents a right bit shift
  • “shift” represents the magnitude of the bit shift.
  • a specific value of “shift” can be determined to have a positive correlation with the bit depth of the pixel value, for example.
  • the classification process according to the classification process example 1 even if the gradient of the pixel value is very small, if the gradient of the pixel value is not 0, the value of Sign is non-zero. Therefore, the classification process according to the classification process example 1 has an aspect that it is easily affected by noise.
  • EgdeType Sign ((pic [x] ⁇ pic [a]) >> shift) + Sign ((pic [x] ⁇ pic [b]) >> shift)) + 2 (1-3) That is, the right bit shift may be performed after taking the difference between the pixel values.
  • formula (1-3) also provides the same effect as using the formula (1-2).
  • the class classification unit 624 changes the definition of the function Sign described in the classification processing example 1 as follows. Others are the same as the classification processing example 1.
  • th is a threshold value having a predetermined value. The specific value of the threshold th can be determined so that the absolute value has a positive correlation with the bit depth of the pixel value, for example.
  • the value of EgdeType is less affected by noise, and high coding efficiency can be obtained.
  • the class classification unit 624 replaces the EoTbl [sao_type_idx] [pic [x] / 8] illustrated in FIG. 12C with the EoTbl [sao_type_idx] [pic [x] illustrated in FIG. / 8] is used.
  • the problem can arise. Further, such a problem is that the pixel value of the pre-offset filter image is either 8 or 9 for pic [x] / 8, or 22 or 23 for pic [x] / 8. It can be noticeable in some cases.
  • the class classification unit 624 that performs the classification process of the present processing example has the first and the offset types to which the unit region including the target pixel belongs when the pixel value of the target pixel is within a predetermined range.
  • the target pixel can be expressed as being classified into an offset class to which an offset is added.
  • the moving picture coding apparatus 2 that generates the coded data # 1 by coding the picture to be coded will be described with reference to FIGS. 14 to 18 (a) to (d).
  • the moving image encoding apparatus 2 includes H.264 as a part thereof. H.264 / MPEG-4.
  • a method adopted in AVC a method adopted in KTA software, which is a codec for joint development in VCEG (Video Coding Expert Group), and a method adopted in TMuC (Test Model under Consideration) software, which is the successor codec And the technology employed in HM (HEVC TestModel) software.
  • FIG. 14 is a block diagram showing a configuration of the moving picture coding apparatus 2 according to the present embodiment.
  • the moving image encoding device 2 includes a transform / quantization unit 21, a variable-length code encoding unit 22, an inverse quantization / inverse transform unit 23, a buffer memory 24, an intra-predicted image generation unit 25, The inter prediction image generation unit 26, motion vector detection unit 27, prediction method control unit 28, motion vector redundancy deletion unit 29, adder 31, subtractor 32, deblocking filter 33, adaptive filter 70, and adaptive offset filter 80 are provided. I have.
  • the moving image encoding device 2 is a device that generates encoded data # 1 by encoding moving image # 10 (encoding target image).
  • the transform / quantization unit 21 performs (1) DCT transform (Discrete Cosine Transform) on the prediction residual D obtained by subtracting the predicted image Pred from the encoding target image, and (2) DCT coefficients obtained by the DCT transform. (3) The quantized prediction residual QD obtained by the quantization is supplied to the variable-length code encoding unit 22 and the inverse quantization / inverse transform unit 23.
  • the transform / quantization unit 21 selects (1) a quantization step QP used for quantization for each tree block, and (2) a quantization parameter difference indicating the size of the selected quantization step QP. ⁇ qp is supplied to the variable length code encoding unit 22, and (3) the selected quantization step QP is supplied to the inverse quantization / inverse conversion unit 23.
  • DCT transform Discrete Cosine Transform
  • the variable length code encoding unit 22 includes (1) a quantized prediction residual QD and ⁇ qp supplied from the transform / quantization unit 21, and (2) a quantization parameter PP supplied from a prediction scheme control unit 28 described later, (3)
  • the encoded data # 1 is generated by variable-length encoding the filter set number, filter coefficient group, region designation information, and on / off information supplied from the adaptive filter 70 described later. Further, the variable length code encoding unit 22 encodes the QAOU information supplied from the adaptive offset filter 80 and includes it in the encoded data # 1.
  • the inverse quantization / inverse transform unit 23 (1) inversely quantizes the quantized prediction residual QD, (2) performs inverse DCT (Discrete Cosine Transform) transformation on the DCT coefficient obtained by the inverse quantization, and (3) The prediction residual D obtained by the inverse DCT transform is supplied to the adder 31.
  • the quantization step QP supplied from the transform / quantization unit 21 is used.
  • the prediction residual D output from the inverse quantization / inverse transform unit 23 is obtained by adding a quantization error to the prediction residual D input to the transform / quantization unit 21. Common names are used for this purpose.
  • the intra predicted image generation unit 25 generates a predicted image Pred_Intra related to each partition. Specifically, (1) a prediction mode used for intra prediction is selected for each partition, and (2) a prediction image Pred_Intra is generated from the decoded image P using the selected prediction mode. The intra predicted image generation unit 25 supplies the generated intra predicted image Pred_Intra to the prediction method control unit 28.
  • the intra-predicted image generation unit 25 identifies the prediction index PI for each partition from the size of each partition from the prediction mode selected for each partition, and supplies the prediction index PI to the prediction method control unit 28. .
  • the intra predicted image generation unit 25 supplies the adaptive filter 70 with intra coding mode information IEM that is information indicating the size of the target partition and the prediction mode assigned to the target partition.
  • IEM intra coding mode information
  • the motion vector detection unit 27 detects a motion vector mv related to each partition. Specifically, (1) the filtered decoded image P_FL ′ to be used as a reference image is selected, and (2) the target partition is searched by searching for the region that best approximates the target partition in the selected filtered decoded image P_FL ′. Detects a motion vector mv.
  • the filtered decoded image P_FL ′ is obtained by performing the deblocking process by the deblocking filter 33, the adaptive offset process by the adaptive offset filter 80, and the adaptive filter 70 on the decoded image that has already been decoded.
  • the motion vector detection unit 27 supplies the detected motion vector mv to the inter prediction image generation unit 26 and the motion vector redundancy deletion unit 29 together with the reference image index RI that specifies the filtered decoded image P_FL ′ used as the reference image.
  • the reference image index RI specifies the filtered decoded image P_FL ′ used as the reference image.
  • two filtered decoded images P_FL1 ′ and P_FL2 ′ are selected as reference images, and each of the two filtered decoded images P_FL1 ′ and P_FL2 ′ is selected.
  • Corresponding motion vectors mv1 and mv2 and reference image indexes RI1 and RI2 are supplied to the inter predicted image generation unit 26 and the motion vector redundancy deletion unit 29.
  • the inter prediction image generation unit 26 generates a motion compensation image mc related to each inter prediction partition. Specifically, using the motion vector mv supplied from the motion vector detection unit 27, the motion compensated image mc is obtained from the filtered decoded image P_FL ′ designated by the reference image index RI supplied from the motion vector detection unit 27. Generate. Similar to the motion vector detection unit 27, the inter predicted image generation unit 26 can read out the pixel value of each pixel constituting the filtered decoded image P_FL ′ from the buffer memory 24. The inter prediction image generation unit 26 supplies the generated motion compensated image mc (inter prediction image Pred_Inter) together with the reference image index RI supplied from the motion vector detection unit 27 to the prediction method control unit 28.
  • inter prediction image Pred_Inter inter prediction image Pred_Inter
  • the motion compensated image mc1 is generated from the filtered decoded image P_FL1 ′ specified by the reference image index RI1 using the motion vector mv1, and (2 )
  • a motion compensated image mc2 is generated from the filtered reference image P_FL2 ′ specified by the reference image index RI2 using the motion vector mv2, and (3) an offset value is added to the weighted average of the motion compensated image mc1 and the motion compensated image mc2. Is added to generate the inter predicted image Pred_Inter.
  • the prediction method control unit 28 compares the intra predicted image Pred_Intra and the inter predicted image Pred_Inter with the encoding target image, and selects whether to perform intra prediction or inter prediction.
  • the prediction scheme control unit 28 supplies the intra prediction image Pred_Intra as the prediction image Pred to the adder 31 and the subtracter 32 and also predicts the prediction index PI supplied from the intra prediction image generation unit 25.
  • the parameter PP is supplied to the variable length code encoder 22.
  • the prediction scheme control unit 28 supplies the inter prediction image Pred_Inter as the prediction image Pred to the adder 31 and the subtractor 32, and the reference image index supplied from the inter prediction image generation unit 26.
  • the RI and the estimated motion vector index PMVI and the motion vector residual MVD supplied from the motion vector redundancy deleting unit 29 (described later) are supplied to the variable length code encoding unit as the prediction parameters PP.
  • the prediction residual D is generated by the subtractor 32 by subtracting the prediction image Pred selected by the prediction method control unit 28 from the encoding target image.
  • the prediction residual D generated by the subtractor 32 is DCT transformed / quantized by the transform / quantization unit 21 as described above.
  • the adder 31 by adding the prediction image Pred selected by the prediction method control unit 28 to the prediction residual D generated by the inverse quantization / inverse transformation unit 23, the adder 31 generates a local decoded image P. Generated.
  • the local decoded image P generated by the adder 31 passes through the deblocking filter 33, the adaptive offset filter 80, and the adaptive filter 70, and is then stored in the buffer memory 24 as a filtered decoded image P_FL. Used as
  • the motion vector redundancy deleting unit 29 deletes the redundancy in the motion vector mv detected by the motion vector detecting unit 27. Specifically, (1) an estimation method used for estimating the motion vector mv is selected, (2) an estimated motion vector pmv is derived according to the selected estimation method, and (3) the estimated motion vector pmv is subtracted from the motion vector mv. As a result, a motion vector residual MVD is generated.
  • the motion vector redundancy deletion unit 29 supplies the generated motion vector residual MVD to the prediction method control unit 28 together with the estimated motion vector index PMVI indicating the selected estimation method.
  • the deblocking filter 33 determines whether the block boundary in the decoded image P or the block boundary in the decoded image P or the block boundary in the decoded image P or the block boundary in the decoded image P is smaller than a predetermined threshold value. By performing deblocking processing on the CU boundary, an image near the block boundary or the vicinity of the CU boundary is smoothed. The image subjected to the deblocking process by the deblocking filter 33 is output to the adaptive offset filter 80 as a deblocked decoded image P_DB.
  • the adaptive offset filter 80 generates an offset filtered decoded image P_OF by performing an adaptive offset filter process on the deblocked decoded image P_DB supplied from the deblocking filter 33.
  • the generated offset filtered decoded image P_OF is supplied to the adaptive filter 70. Since a specific configuration of the adaptive offset filter 80 will be described later, description thereof is omitted here.
  • the adaptive filter 70 generates a filtered decoded image P_FL by performing an adaptive filter process on the offset filtered decoded image P_OF supplied from the adaptive offset filter 80.
  • the filtered decoded image P_FL that has been filtered by the adaptive filter 70 is stored in the buffer memory 24.
  • the filter coefficient used by the adaptive filter 70 is determined so that the error between the filtered decoded image P_FL and the encoding target image # 10 becomes smaller, and the filter coefficient thus determined is the filter parameter. It is encoded as FP and transmitted to the video decoding device 1.
  • FIG. 15 is a block diagram showing a configuration of the adaptive offset filter 80.
  • the adaptive offset filter 80 includes an adaptive offset filter information setting unit 81 and an adaptive offset filter processing unit 82.
  • the adaptive offset filter information setting unit 81 includes an offset calculation unit 811, an offset shift unit 816, an offset clip unit 812, an offset information selection unit 813, and an offset attribute setting unit 815.
  • Offset calculation unit 811 calculates offsets for all offset types and all classes for all QAOMUs up to a predetermined division depth included in the target processing unit (for example, LCU).
  • the offset type and class are the same as those described in the description of the video decoding device 1.
  • FIG. 16 is a flowchart showing the flow of processing by the offset calculation unit 811.
  • Step S201 the offset calculation unit 811 starts a first loop using the QAOMU number of the target QAOMU to be processed as a loop variable.
  • Step S202 Subsequently, the offset calculation unit 811 starts a second loop using the offset type that can be selected for the target QAOMU as a loop variable.
  • the second loop is a loop from offset type 1 to offset type 6.
  • Step S203 Subsequently, the offset calculation unit 811 starts a third loop using the pixels included in the target QAOMU as a unit.
  • Step S204 the offset calculation unit 811 classifies the target pixel into one of a plurality of classes. More specifically, when the offset type that is the second loop variable is 1 to 4, the target pixel is classified into one of classes 1 to 4.
  • the classification processing in this step is the same processing as any one of classification processing examples 1 to 4 by the class classification unit 624 included in the adaptive offset filter 60 in the video decoding device 1.
  • part_idx [sao_type_index] [class_idx]
  • part_idx represents a QAOMU number.
  • the offset calculation unit 811 obtains the difference pixel value in the target pixel by taking the difference between the pixel value of the deblocked decoded image P_DB in the target pixel and the pixel value of the encoding target image # 10 in the target pixel. calculate. More specifically, P_DB (x, y) ⁇ Org (x, y) is calculated when the position of the target pixel is (x, y).
  • P_DB (x, y) represents the pixel value of the deblocked decoded image P_DB in the target pixel
  • Org (x, y) represents the pixel value of the encoding target image # 10 in the target pixel. ing.
  • Step S206 This step is the end of the third loop. When this step is completed, the difference pixel values are calculated for all the pixels included in the target QAOMU.
  • the offset calculation unit 811 calculates an offset by dividing the sum of the difference pixel values for each pixel included in the target QAOMU for each class by the number of classifications of the class. More specifically, the offset calculation unit 811 calculates an offset offset [part_idx] [sao_type_idx] [class_idx] for the target QAOMU, the target offset type, and the target class using the following expression.
  • Step S208 This step is the end of the second loop.
  • Step S209 This step is the end of the third loop.
  • the number of bits of each offset is, for example, 10 bits.
  • the offset calculation unit 811 supplies the offset information including the offset, the offset type, the class, and QAOU structure information representing the QAOU division structure calculated by the above processing to the offset shift unit 816.
  • the moving image encoding device 2 is configured to encode a flag indicating which classification processing example according to which classification processing example has been performed in step S204, and the adaptive offset filter 60 included in the moving image decoding device 1 includes: It is possible to refer to the flag and perform the same classification process as the classification process indicated by the flag. Moreover, it is good also as a structure which performs the same classification
  • Offset shift unit 816 quantizes each offset included in the offset information supplied from the offset calculation unit 811. Quantization shifts the offset from the pixel bit depth accuracy to the offset bit depth accuracy by bit shifting the offset to the right. The shift amount in the shift process is determined by a shift value supplied by an offset attribute setting unit 815 described later.
  • Offset clip part 812 The offset clip unit 812 performs the following clip processing 1 and clip processing 2 on the offset supplied from the offset shift unit 816 in order to limit the offset value range supplied from the offset attribute setting unit 815 described later.
  • the clip is processed by any one of the processes.
  • the offset clip unit 812 performs clip processing on each offset included in the offset information supplied from the offset shift unit 816.
  • the offset clip unit 812 represents each offset with 4 bits by clipping each offset supplied from the offset shift unit 816 to a value from ⁇ 8 to 7, for example.
  • Each clipped offset is supplied to the offset information selection unit 813.
  • the bit width to be clipped is set according to the bit depth of the image and the bit depth of the offset, as in the video decoding device 1.
  • each offset the memory size of a memory (not shown) in which each offset is stored can be reduced. Moreover, since the amount of offset codes included in the encoded data # 1 can be reduced, the encoding efficiency can be improved. Moreover, since an excessive offset is suppressed, an appropriate image quality is ensured.
  • the offset clip unit 812 may be configured to set different values for the clip range of each offset supplied from the offset shift unit 816 depending on the offset type.
  • the number of offset bits is 8 bits
  • the number of offset bits is 4 bits. More generally, when the offset bit number is N bits when the offset type is an edge offset and the offset bit number is M bits when the offset type is a band offset, N> M is satisfied. Determines the number of offset bits.
  • m-bit fixed-length encoding is used as an encoding method for encoding the offset.
  • the maximum value th is determined by the offset value range supplied from the offset attribute setting unit 815.
  • clip processing obtained by combining the above clip processing 1 and 2 is also included in the present embodiment.
  • the adaptive offset filter 80 may be configured not to include the offset clip unit 812.
  • Offset information selection unit 813 The offset information selection unit 813 determines an offset type, a class, a combination of offsets, and a corresponding QAOU partition structure with a smaller RD cost (Rate-Distorsion cost), and determines the determined offset type, class, offset, and QAOU information indicating the corresponding QAOM division structure is supplied to the variable-length code encoding unit 22. Further, the offset information selection unit 813 supplies the determined offset to the adaptive offset filter processing unit 82 for each QAOU or each QAOMU.
  • RD cost Rent-Distorsion cost
  • FIG. 17 is a flowchart showing the flow of processing by the offset information selection unit 813.
  • Step S301 First, the offset information selection unit 813 starts a first loop using the QAOMU number of the target QAOMU to be processed as a loop variable.
  • Step S302 the offset information selection unit 813 starts a second loop in which an offset type that can be selected for the target QAOMU is a loop variable.
  • the second loop is a loop from offset type 1 to offset type 6.
  • the offset information selection unit 813 calculates the square error between the offset filtered decoded image P_OF and the encoding target image # 10 in the target QAOMU for the target offset type.
  • Step S304 This step is the end of the second loop.
  • Step S305 This step is the end of the first loop. At the end of the first and second loops, the square error for all offset types is calculated for each QAOMU.
  • the offset information selection unit 813 determines a QAOU partition structure in which the RD cost is smaller among the QAOU partition structures that divide a target processing unit (for example, LCU) into QAOUs.
  • the offset information selection unit 813 calculates the RD cost when the division depth is 0 and the RD cost when the division depth is 1 (FIG. 18A). In FIG. 18A, it is assumed that the RD cost at the division depth 1 is smaller than the RD cost at the division depth 0 (FIG. 18B).
  • the offset information selection unit 813 calculates the RD cost when the division depth is set to 2 (FIG. 18 (c)).
  • the offset information selection unit 813 compares the RD cost of the QAOMU with the division depth 1 with the RD cost of the QAOMU with the division depth 2 included in the QAOMU with the division depth 1, and determines the RD cost of the QAOMU with the division depth 2 If it is smaller, the QAOMU having the division depth 1 is updated to the QAOMU having the division depth 2 (FIG. 18D). This process is repeated until the maximum division depth is reached. As a result, a QAOU partition structure with a smaller RD cost is determined.
  • Offset attribute setting unit 815 receives the pixel bit depth (not shown) and determines the offset bit depth. An offset range and a shift value are set according to the determined bit depth of the offset.
  • the offset value range is supplied to the adaptive offset filter processing unit 82, and the shift value is supplied to the offset shift unit 816. Since the setting of the offset value range and the shift value is the same as that of the offset attribute setting unit 613 described above, description thereof is omitted here.
  • the adaptive offset filter processing unit 82 adds the offset supplied from the offset information selection unit 813 to each pixel of the deblocked decoded image P_DB in the target QAOU.
  • the adaptive offset filter processing unit 82 outputs an image obtained by performing processing on all the QAOUs included in the deblocked decoded image P_DB as an offset filtered decoded image P_OF.
  • the configuration of the adaptive offset filter processing unit 82 is the same as that of the adaptive offset filter processing unit 62, and thus the description thereof is omitted here.
  • Each offset stored in the offset information storage unit included in the adaptive offset filter processing unit 82 not shown here is limited to the offset value range set by the offset attribute setting unit 815.
  • Embodiment 2 In Embodiment 1, sao_offset [sao_curr_depth] [ys] [xs] [i] included in the encoded data # 1 is an offset added to each pixel included in the target QAOU in the offset filter processing by the adaptive offset filter It is assumed that the syntax represents a specific value of.
  • the inventor predictively encodes the offset value used for the offset filter process, that is, encodes the offset residual calculated using the offset value and the predicted value of the offset value.
  • the present inventors have found that the code amount of encoded data can be further reduced.
  • FIGS a moving picture decoding apparatus that performs prediction encoding offset and performs an offset filter process
  • a moving picture encoding apparatus that predictively encodes an offset used for the offset filter process are shown in FIGS.
  • the description will be given with reference. Note that description of portions already described in Embodiment 1 is omitted.
  • Encoded data The encoded data according to the present embodiment is replaced with the offset residual sao_offset_residual [sao_curr_depth] [sao_offset [sao_curr_depth] [ys] [xs] [i] included in the encoded data # 1 according to the first embodiment. Contains ys] [xs] [i].
  • Other configurations of the encoded data according to the present embodiment are the same as the configurations of encoded data # 1 according to the first embodiment.
  • the encoded data according to the present embodiment may be referred to as encoded data # 3.
  • the offset residual sao_offset_residual [sao_curr_depth] [ys] [xs] [i] is the offset value added to each pixel included in the target QAOU in the offset filter processing by the adaptive offset filter according to the present embodiment, and the offset Is a weighted difference value between the predicted value and the sao_offset_residual [sao_type_idx] [class_idx].
  • a is a weighting factor multiplied by the predicted value pred_offset
  • merge_tbl is a function having sao_type_idx as an argument. Since specific examples of a and merge_tbl will be described later, description thereof is omitted here.
  • the moving picture decoding apparatus includes an adaptive offset filter 60 ′ instead of the adaptive offset filter 60 included in the moving picture decoding apparatus 1 according to the first embodiment.
  • Other configurations of the video decoding device according to the present embodiment are the same as those of the video decoding device 1 according to the first embodiment.
  • FIG. 19 is a block diagram showing a configuration of the adaptive offset filter 60 'according to the present embodiment. As illustrated in FIG. 19, the adaptive offset filter 60 ′ includes an offset information decoding unit 611 ′ instead of the offset information decoding unit 611 included in the adaptive offset filter 60.
  • Offset information decoding unit 611 ′ refers to the QAOU information included in the encoded data # 3 and decodes the offset information OI included in the QAOU information.
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx] is a predicted value of Offset [sao_type_idx] [class_idx].
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx]
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx] Offset '[sao_type_idx] [class_idx] Determined by.
  • Offset '[sao_type_idx] [class_idx] is a decoded offset and represents an offset associated with the offset type index sao_type_idx and the class index class_idx.
  • Offset As a predicted value of Offset [sao_type_idx] [class_idx], the offset offset that has been decoded and is associated with the offset type index sao_type_idx and the class index class_idx Offset '[sao_type_idx] [class_idx] ] Is used.
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx]
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx] * W1 + Offset '[sao_type_idx] [class_idx] * W2) >> log 2 (W1 + W2) Determined by.
  • pred_offset '[merge_tbl [sao_type_idx]] [class_idx] represents a predicted value used when calculating the decoded offset Offset' [sao_type_idx] [class_idx].
  • “*” represents an operation symbol that takes a product
  • “>>” represents a right bit shift.
  • pred_offset in order to obtain pred_offset, reference is made to pred_offset 'and Offset', and in order to obtain pred_offset ', reference is made to pred_offset' 'and Offset' '. . . Since the decoded prediction value and offset are recursively referred to as described above, a plurality of decoded offsets contribute to pred_offset. Therefore, excessive fluctuations in the predicted value are suppressed. Thereby, for example, even when an inappropriate prediction value is calculated due to the influence of noise, the influence of such an inappropriate prediction value can be suppressed, so that the encoding efficiency can be improved. I can do it.
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx]
  • pred_offset [merge_tbl [sao_type_idx]] [class_idx] clip3 (-th, th, pred_offset [merge_tbl [sao_type_idx]] [class_idx]) Determined by.
  • clip3 (A, B, C) indicates that the value C is clipped by the lower limit value A and the upper limit value B.
  • pred_offset [merge_tbl [sao_type_idx]] of the clip3 argument is assumed to be determined as in the above specific example 1 or 2, for example.
  • the threshold th is determined as follows depending on the bit depth bit_depth of the pixel value, for example.
  • FIG. 20A is a table showing a first specific example of the function merge_tbl [sao_type_idx].
  • the offset information decoding unit 611 ′ determines the prediction value pred_offset individually for each sao_type_idx and each class_idx, and thus reduces the code amount of the offset residual sao_offset_residual can do.
  • FIG. 20B is a table showing a second specific example of the function merge_tbl [sao_type_idx].
  • the offset information decoding unit 611 By using merge_tbl [sao_type_idx] according to the present example, the offset information decoding unit 611 'performs the following processing for each of the case where the edge offset is designated and the case where the band offset is designated.
  • a predicted value of the decoding target offset is calculated from a decoded offset of the same class as the class associated with the decoding target offset.
  • the offset types may be different. Therefore, since the prediction value set for calculating an offset of a certain offset type can be used for calculating an offset of an offset type different from the certain offset, processing for setting the prediction value is reduced. Is done.
  • a predicted value of the decoding target offset is calculated from an offset type and class offset that are the same as the offset type and class associated with the decoding target offset.
  • weighting factor a multiplied by the prediction value pred_offset 1 may be used regardless of the offset type, or a different value may be used depending on the offset type.
  • a 1 (when edge offset)
  • a 0.5 (when band offset) It is good.
  • the coefficient a when the edge offset is designated is represented as a (edge)
  • the coefficient a when the band offset is designated is represented as a (band).
  • a (edge)> a (band) What satisfies the above may be used.
  • the moving picture coding apparatus includes an adaptive offset filter 80 ′ instead of the adaptive offset filter 80 provided in the moving picture coding apparatus 2 according to the first embodiment.
  • Other configurations of the video encoding apparatus according to the present embodiment are the same as those of the video encoding apparatus 2 according to Embodiment 1.
  • FIG. 21 is a block diagram showing a configuration of the adaptive offset filter 80 'according to the present embodiment.
  • the adaptive offset filter 80 ′ includes an offset residual deriving unit 814 in addition to the units included in the adaptive offset filter 60.
  • Offset residual deriving unit 814 calculates the offset residual by taking the difference between the offset supplied from the offset information selecting unit 813 and the predicted value of the offset.
  • the offset residual is encoded by the variable length code encoding unit 22 as a part of the QAOU information.
  • the prediction value set by the offset residual deriving unit 814 is the same as the prediction value set by the offset information decoding unit 611 ′ included in the video decoding device according to the present embodiment, description thereof is omitted here. .
  • An image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and performs processing with reference to offset type designation information included in encoded data.
  • Offset attribute setting means for setting an offset attribute in the target unit area
  • offset decoding means for decoding an offset having a bit width corresponding to the offset value area included in the set offset attribute, and each pixel value of the input image
  • a filter means for adding the offset.
  • the offset attribute setting means refers to the offset type designation information included in the encoded data, sets the offset attribute in the unit area to be processed, and is set Since the offset having the bit width corresponding to the offset value range included in the offset attribute is decoded by the offset decoding means, the memory size for storing the offset can be effectively reduced.
  • the offset type designation information may be determined for each input image, or may be determined for each unit area. Further, it may be determined for each predetermined set of input images, or may be determined for each predetermined set of unit areas.
  • the offset type designation information includes a bit depth of the pixel value of the input image in each unit area, and the offset decoding means decodes an offset having a bit width corresponding to the bit depth of the pixel value. preferable.
  • the offset decoding unit decodes an offset having a bit width corresponding to the bit depth of the pixel value, so that the memory size for storing the offset can be effectively reduced. it can.
  • the offset type designation information includes the bit depth of the pixel value of the input image in each unit area, and the offset decoding means decodes an offset having a bit width that can represent a range corresponding to the bit depth. It is good also as a structure.
  • the offset decoding unit decodes an offset having a bit width that can represent a range corresponding to the bit depth of the pixel value of the input image in each unit region, the offset is stored in advance. Therefore, the memory size can be effectively reduced.
  • the bit width that can represent a range corresponding to the bit depth refers to a bit width when a value included in the range is represented in binary, for example, a range of ⁇ 2 3 to 2 3 ⁇ 1. Sometimes the representable bit width is 4 bits.
  • the decoded offset is a quantized value
  • the filter means preferably adds a value obtained by dequantizing the offset using a parameter included in the offset attribute to each pixel value.
  • the decoded offset is a quantized value
  • the filter means converts a value obtained by dequantizing the offset using a parameter included in the offset attribute to each pixel value. Since the addition is performed, an offset corresponding to the parameter included in the offset attribute is added to each image value.
  • the offset type designation information may include a shift value of a pixel value, and the filter unit may add a value obtained by dequantizing the offset using the shift value instead of the offset.
  • the offset type designation information includes a shift value of a pixel value
  • the filter means adds a value obtained by dequantizing the offset using the shift value instead of the offset. Therefore, an offset corresponding to the shift value of the pixel value can be obtained. Therefore, it is possible to improve the encoding efficiency while reducing the memory size for storing the offset.
  • the shift value of the pixel value refers to a difference value between the pixel bit depth and the bit depth of the offset.
  • the shift value is used to dequantize the offset, the offset is shifted to the left by the shift value. It refers to converting from offset bit depth to pixel bit depth by performing a bit shift.
  • the offset type designation information is preferably determined for the input image.
  • the image filter device since the offset type designation information is determined for the input image, the image filter device can perform an appropriate offset process on the input image.
  • An offset decoding apparatus is an offset decoding apparatus that decodes each offset referred to by an image filter that adds an offset to each pixel value of an input image, and each offset residual is calculated from encoded data.
  • Offset residual decoding means for decoding prediction value deriving means for deriving predicted values of each offset from decoded offsets, predicted values derived by the predicted value deriving means for each offset, and the offset residual Offset calculating means for calculating from the offset residual decoded by the decoding means.
  • an offset residual decoding unit that decodes each offset residual from encoded data, and a prediction value derivation that derives a prediction value of each offset from the decoded offset Means and offset calculation means for calculating each offset from the prediction value derived by the prediction value deriving means and the offset residual decoded by the offset residual decoding means.
  • offset can be appropriately decoded from encoded data with a small code amount.
  • the input image includes a plurality of unit regions, and the offset residual decoding unit decodes each offset residual in association with an offset type determined for each unit region and an offset class determined for each pixel.
  • the predicted value deriving unit derives a predicted value of each offset from a decoded offset associated with the same offset type and offset class as the offset.
  • the prediction value of each offset is derived from the decoded offset associated with the same offset type and offset class as the offset, so that the prediction accuracy is improved. Therefore, according to the above configuration, the offset can be appropriately decoded from the encoded data with a small code amount.
  • the input image includes a plurality of unit regions, and the offset residual decoding unit decodes each offset residual in association with an offset type determined for each unit region and an offset class determined for each pixel.
  • the predicted value deriving means uses the same first offset type group and the same as the offset value when the offset type associated with the offset belongs to the first offset type group.
  • the offset type associated with the offset class belongs to the second offset type group and is associated with the same offset type and offset class as the offset type. It is preferable to derive from the decoded offset.
  • the predicted value of each offset is the decoded value associated with the same offset type as the offset.
  • the prediction accuracy can be improved while reducing the processing amount. Therefore, according to the above configuration, it is possible to appropriately decode the offset from the encoded data with a small code amount while reducing the processing amount.
  • the first offset type is, for example, any pixel in the unit area associated with the first offset type, for example, any of a plurality of classes in the vicinity of the pixel depending on the edge mode.
  • the second offset type means that each pixel in the unit area associated with the second offset type is one of a plurality of classes according to the pixel value of the pixel, for example. It refers to those that are classified as crab.
  • the offset calculating means calculates each offset as a linear function of the prediction value derived by the prediction value deriving means and the offset residual decoded by the offset residual decoding means, and the prediction When the offset type associated with the offset belongs to the first offset type group, and the offset type associated with the offset belongs to the second offset type group. It is preferable that they are different.
  • the coefficient to be multiplied by the predicted value includes a case where the offset type associated with the offset belongs to the first offset type group and a case where the offset type associated with the offset is the second. Since it differs depending on the case of belonging to the offset type group, the offset can be calculated using a more appropriate coefficient according to the offset type. Thereby, the encoding efficiency can be improved.
  • the predicted value deriving unit derives the predicted value of each offset by taking a weighted average of the decoded offset and the predicted value of the decoded offset.
  • the predicted value of each offset is derived by taking a weighted average of the decoded offset and the predicted value of the decoded offset, the predicted value of each offset includes Multiple offsets will contribute. Therefore, excessive fluctuations in the predicted value are suppressed. Thereby, for example, even when a prediction value that is not appropriate due to the influence of noise is calculated, the influence of such a prediction value that is not appropriate can be suppressed, so that the encoding efficiency can be improved.
  • the prediction value deriving unit includes a clipping unit that clips the derived prediction values with an upper limit value and a lower limit value corresponding to the bit depth of each pixel value in the input image.
  • the derived prediction values are clipped with the upper limit value and the lower limit value according to the bit depth of each pixel value in the input image, so that a prediction value that is too large or too small does not occur.
  • the encoding efficiency can be improved.
  • the image filter device is an image filter device that acts on an input image, and calculates a difference value between a pixel value of a target pixel in the input image and pixel values of pixels around the target pixel.
  • Means, a pixel value referred to by the calculation means, or a bit shift means for right bit shifting the difference value calculated by the calculation means by a predetermined shift value, and a difference right-bit shifted by the bit shift means Classifying means for classifying the target pixel into one of a plurality of offset classes according to the magnitude relationship between the value and 0, and associating the pixel value of the target pixel with the offset class classified by the classification means And an offset unit for adding the offsets.
  • the target pixel is classified into one of a plurality of offset classes according to the magnitude relationship between the difference value shifted to the right bit and 0, and the target pixel Since the offset associated with the offset class classified by the classification means is added to the pixel value, the class classification process is less susceptible to noise and the coding efficiency is improved.
  • the predetermined shift value has a positive correlation with the bit depth of the pixel value of the target pixel.
  • the encoding efficiency can be improved more effectively.
  • the image filter device is an image filter device that acts on an input image, and calculates a difference value between a pixel value of a target pixel in the input image and pixel values of pixels around the target pixel.
  • the image filter device configured as described above is configured to assign the target pixel to a plurality of offset classes according to a magnitude relationship between the difference value calculated by the calculation unit and a predetermined first and second threshold value. Since the offset associated with the offset class classified by the classification means is added to the pixel value of the target pixel, the class classification process becomes less susceptible to noise and is encoded. Efficiency is improved.
  • the absolute values of the first and second threshold values have a positive correlation with the bit depth of the pixel value of the target pixel.
  • the encoding efficiency can be improved more effectively. You can plan.
  • the image filter device is an image filter device that operates on an input image composed of a plurality of unit regions, and includes an object that includes a target pixel in the input image among the first and second offset types.
  • a determination unit that determines an offset type to which the unit area belongs, an offset type to which the target unit area belongs, and an offset class to which the offset is not added and an offset are added to the target pixel according to the pixel value of the target pixel.
  • Classification means for classifying into one of a plurality of offset classes, and an offset associated with the offset type to which the target unit region belongs and the offset class classified by the classification means are added to the pixel value of the target pixel.
  • Offset means, and the classification means is an image of the target pixel. When the value is within a predetermined range, the offset is added to the target pixel regardless of whether the offset type to which the unit region including the target pixel belongs is the first offset type or the second offset type. It is characterized by being classified into an offset class.
  • the offset type to which the unit region including the target pixel belongs is the first and second offsets.
  • the target pixel is classified into an offset class to which an offset is added, so that block noise can be effectively removed. Therefore, according to the above configuration, the encoding efficiency can be improved.
  • An image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and among the plurality of offset types, the unit region to be processed is A determination unit that determines an offset type to which the signal belongs; an offset encoding unit that determines an offset having a different bit width according to the offset type; and the determination for each pixel value of the input image. And a filter means for adding the offsets.
  • an offset type to which a unit area to be processed belongs is determined from among a plurality of offset types, and an offset having a different bit width is determined according to the determined offset type.
  • the determined offset is added to each pixel of the input image. Also, the determined offset is encoded.
  • the offset encoding apparatus is an offset encoding apparatus that encodes each offset referenced by an image filter that adds an offset to each pixel value of an input image, and the predicted value of each offset is A predicted value deriving unit derived from an encoded offset, an offset residual calculating unit for calculating an offset residual from each offset and a predicted value derived by the predicted value deriving unit, and the offset residual calculating unit And an offset residual encoding means for encoding the calculated offset residual.
  • a predicted value deriving unit that derives a predicted value of each offset from the encoded offset, and a predicted value derived by each offset and the predicted value deriving unit Offset residual calculating means for calculating the offset residual from the above and offset residual encoding means for encoding the offset residual calculated by the offset residual calculating means.
  • the amount can be reduced.
  • the data structure of the encoded data according to the present invention is a data structure of encoded data that is referred to by an image filter that adds an offset to each pixel value of an input image composed of a plurality of unit regions.
  • Offset type designation information for designating the offset type to which the unit area belongs, and offsets having different bit widths according to the offset type, and the image filter includes the offset type designation information included in the encoded data.
  • the offset type to which the unit region to be processed belongs is determined, and offsets having different bit widths are decoded according to the determined offset type.
  • the code amount of the encoded data is reduced.
  • the image filter that decodes the encoded data refers to the offset type designation information, determines the offset type to which the unit area to be processed belongs, and also has an offset having a different bit width depending on the determined offset type. Since decoding is performed, appropriate offset filter processing can be performed while reducing the memory size for storing the offset.
  • the offset type designation information may be determined for each input image, or may be determined for each unit area. Further, it may be determined for each predetermined set of input images, or may be determined for each predetermined set of unit areas.
  • FIG. 23A is a diagram illustrating the syntax of the offset information OI (denoted as “sao_offset_param ()” in FIG. 23A).
  • the offset information OI includes a parameter “sao_type_idx [sao_curr_depth] [ys] [xs]”.
  • the offset information OI includes the parameter “sao_offset [sao_curr_depth] [ys] [xs] [i]”.
  • FIG. 23B is a diagram showing the syntax of the QAOU information (indicated as “sao_split_param ()” in FIG. 23B). As shown in the syntax of FIG. 23B, if the division depth “sao_curr_depth” is smaller than the maximum value set by the predetermined “saoMaxDepth”, it is selected whether or not the QAOU is further divided by the parameter “sao_split_flag” Is done. When splitting, “sao_split_param ()” of the next hierarchical depth is recursively called.
  • FIG. 44 shows another example of the syntax of offset information and QAOU information.
  • FIG. 44 (a) shows the syntax of offset information.
  • the argument “sao_offset_param ()” and the subscripts of the arrays “sao_split_flag”, “sao_type_idx”, and “sao_offset” are values that represent color components.
  • component has been added. Thereby, different QAOU division can be performed for each color component such as luminance and color difference, and different offsets can be applied.
  • FIG. 44 (b) shows the syntax of QAOU information. Similar to FIG. 44 (a), this is a syntax in which a color component “component” is added as an argument to FIG. 23 (b).
  • FIG. 44 (c) shows the syntax of the entire adaptive offset filter that calls the syntaxes of FIGS. 44 (a) and 44 (b).
  • the value of “component” is 0 for luminance (Y), 1 for color difference (Cb), and 2 for color difference (Cr) to distinguish each color component. The value of component may be another value as long as the color component to be processed can be distinguished.
  • moving picture decoding apparatus 1 ′ Next, moving picture decoding apparatus 1 ′ according to the present embodiment will be described with reference to FIG. 22 and FIGS. Note that members having the same functions as those shown in the above embodiment are given the same reference numerals, and descriptions thereof are omitted.
  • the moving picture decoding apparatus 1 As with the moving picture decoding apparatus 1, the moving picture decoding apparatus 1 ' H.264 / MPEG-4.
  • a method used in AVC a method used in KTA software, which is a joint development codec in VCEG (Video Coding Expert Group), and a method used in TMuC (Test Model Under Consulation) software, which is the successor codec And the technology adopted in HM (HEVC Test Model) software.
  • the moving picture decoding apparatus 1 ′ is different in that an adaptive offset filter 60 ′ is provided instead of the adaptive offset filter 60 in the moving picture decoding apparatus 1, and other configurations are the same.
  • FIG. 22 is a block diagram showing a configuration of the adaptive offset filter 60 ′.
  • the adaptive offset filter 60 ′ includes an adaptive offset filter information decoding unit 61 ′ and an adaptive offset filter processing unit 62 ′.
  • the adaptive offset filter information decoding unit 61 ′ includes an offset information decoding unit 611 and a QAOU structure decoding unit 612.
  • the offset information decoding unit 611 refers to the QAOU information included in the encoded data # 1, and decodes the offset information OI included in the QAOU information. Also, each value of “sao_type_idx [sao_curr_depth] [ys] [xs] [component]” and “sao_offset [sao_curr_depth] [ys] [xs] [i]” obtained by decoding the offset information OI is respectively Are supplied to the offset information storage unit 621 in association with the arguments (sao_curr_depth, ys, xs) and (sao_curr_depth, ys, xs, i).
  • the offset information decoding unit 611 decodes the code from the encoded data # 1, converts the decoded code into a value of “sao_type_idx”, and supplies the value to the offset information storage unit 621 in association with the argument.
  • the offset information decoding unit 611 changes the code decoding method and the conversion from the code to the value of “sao_type_idx” according to the depth of the QAOU hierarchy to be processed. Conditions such as the depth of the QAOU hierarchy are called parameter conditions. Decoding of offset information according to general parameter conditions will be described later with reference to FIGS. 41 and 42.
  • the code decoding method may be performed using different maximum values when the depth of the QAOU hierarchy to be processed is smaller than the threshold and when the depth of the QAOU hierarchy to be processed is greater than or equal to the threshold.
  • the maximum value may be used only when the depth of the QAOU hierarchy to be processed is equal to or greater than a threshold value.
  • different binarization may be used when the depth of the QAOU hierarchy to be processed is smaller than the threshold and when the depth of the QAOU hierarchy to be processed is greater than or equal to the threshold.
  • different contexts may be used depending on whether the depth of the QAOU hierarchy to be processed is smaller than the threshold value and the depth of the QAOU hierarchy to be processed is greater than or equal to the threshold value.
  • the code when the depth of the QAOU layer to be processed is smaller than the threshold, the code is decoded by variable length coding (ue (v)), and when the depth of the QAOU layer to be processed is equal to or greater than the threshold
  • the code may be decoded by truncated coding (te (v)) according to the number of offset types. If the number of offset types is a power of 2, the code may be decoded by fixed length coding. If the number of offset types is four, it can be expressed in 2 bits, and can be fixed-length encoded in 2 bits.
  • the offset information decoding unit 611 performs conversion from the decoded code to the value of “sao_type_idx” using a conversion table 801 and a conversion table 802 as shown in FIG.
  • the conversion table 801 in FIG. 25A shows two conversion patterns. These two types of conversion patterns are properly used depending on the depth of the QAOU hierarchy to be processed. That is, the offset information decoding unit 611 uses the conversion table 801A when the depth of the QAOU hierarchy to be processed is smaller than the threshold value, and uses the conversion table when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold value. 801B is used.
  • the codes 4 to 6 are not used.
  • the conversion table 801A includes all the offset types used for the adaptive offset (SAO), whereas the conversion table 801B includes a part of the offset types used for the adaptive offset (SAO). Only type is included. Therefore, if the depth of the QAOU hierarchy to be processed is greater than or equal to the threshold value, only some offset types can be used.
  • 25B shows various examples of conversion tables similar to the conversion table 801B that can be used in place of the conversion table 801B. As with the conversion table 801B, the type of each conversion table is limited. A blank indicates that the corresponding code is not used.
  • the conversion table 802A is an example using only an edge offset and does not include a band offset.
  • the number of edge offsets is usually four, and the number of band offsets is usually sixteen.
  • the number of edge offsets is smaller than the number of band offsets. For this reason, by limiting the use of the band offset, the amount of memory used for holding the offset can be reduced.
  • the amount of memory increases because the offset increases.
  • the selectivity of the band offset decreases.
  • the conversion table 802A having only the edge offset when the hierarchy is deep and using the conversion table (for example, 801A) having the edge offset and the band offset when the hierarchy is shallow using the conversion table 802A as the parameter condition, The amount of memory can be reduced without reducing the efficiency. Further, since it is possible to omit the cost calculation of unnecessary options in the encoding device, the processing amount can be reduced.
  • the conversion table 802B is an example using only a band offset and does not include an edge offset.
  • the band offset is characterized in that the amount of calculation is smaller than that of the edge offset, and a line memory or the like for holding the reference pixel is unnecessary because the pixels around the target pixel are not used. Therefore, the above-described effects can be obtained by using the conversion table 802B according to the parameter conditions.
  • the conversion table 802D is an example using one edge offset and two band offsets as in the conversion table 801B.
  • the conversion table 802D is used when the hierarchy is shallow, and a frequently used type is associated with a short code. Thus, encoding efficiency can be improved.
  • an offset type different from any edge offset and band offset of the conversion table 801A can be used alone or in combination with other offset types depending on conditions such as hierarchical depth. Specific examples thereof include an offset type having both EO and BO characteristics, an edge offset that detects an edge at a horizontal sample position different from the conventional edge offset “EO_0”, A band offset by band allocation different from the band offsets “BO — 0” and “BO — 1” can be mentioned.
  • the QAOU structure decoding unit 612 determines the QAOU partition structure by decoding “sao_split_flag [sao_curr_depth] [ys] [xs]” included in the QAOU information, and indicates the determined QAOU partition structure.
  • the structure information is supplied to the offset information storage unit 621.
  • the offset attribute setting unit 613 determines an offset shift value.
  • the offset of the encoded data is encoded with an offset bit depth (also referred to as SAO_DEPTH) that is less accurate than the pixel bit depth (also referred to as PIC_DEPTH). That is, the offset in the encoded data is quantized.
  • the shift value indicates a bit shift amount necessary for performing inverse quantization.
  • the offset attribute setting unit 613 determines the offset bit depth and the offset value range.
  • the bit depth of the offset is determined from a pixel bit depth (also referred to as PIC_DEPTH) (not shown) input to the offset attribute setting unit 613.
  • the pixel bit depth indicates the range of pixel values constituting the input image of the adaptive offset filter 60 in terms of bit width. When the pixel bit depth is N bits, the pixel value ranges from 0 to 2N ⁇ 1. .
  • the SAO bit depth and shift value use the following equations, but other values may be used according to the parameter conditions, as will be described later.
  • the quantization offset value range is determined by the following equation.
  • the adaptive offset filter processing unit 62 ′ includes an offset information storage unit 621, a QAOU control unit 622, an offset type derivation unit 623, a class classification unit 624, an offset derivation unit 625, and an offset addition unit 626. It is the structure containing.
  • the offset information storage unit 621 is designated for each QAOU based on the QAOU structure information, “sao_type_idx [sao_curr_depth] [ys] [xs]”, and “sao_offset [sao_curr_depth] [ys] [xs] [i]”. It manages and stores an offset type and a specific value of an offset relating to each class selectable in the offset type, and has a map memory and a list memory.
  • FIG. 24 is a diagram showing examples stored in the map memory and the list memory
  • FIG. 24A is a diagram for explaining an example of the QAOU index stored in the map memory
  • FIG. FIG. 4 is a diagram for explaining an example of information stored in a list memory.
  • the map memory 601 stores a QAOU index, which will be described later, assigned to each offset minimum unit (also referred to as QAOMU: Quad-Adaptive-Offset-Minimum Unit) determined according to the division depth.
  • FIG. 24A shows each QAOMU having a division depth of 3 that constitutes a target processing unit (for example, LCU) and a QAOU index assigned to each QAOMU.
  • indexes 0 to 9 are simply assigned to QAOUs without considering the division depth of QAOUs.
  • the thin line in FIG. 24A indicates the QAOMU boundary, and the thick line indicates the QAOU boundary.
  • QAOU0 is composed of four QAOMUs, and 0 is assigned to these four QAOMUs as QAOU indexes.
  • QAOU3 is composed of one QAOMU, and 3 is assigned to this QAOMU as a QAOU index. In this way, the map memory stores the QAOU index assigned to each QAOMU.
  • the list memory 602 stores, for each QAOU index, an offset type associated with the QAOU index and a specific value of an offset for each class selectable in the offset type in association with each other. .
  • FIG. 24B shows an offset type associated with each of the QAOU indexes 0 to 9 and an offset for each class selectable in each offset type. “Xxx” in FIG. 24B represents specific numerical values that may be different from each other.
  • “sao_type_idx” 5,6.
  • the band offsets that are offset types are also referred to as “BO_1, 2”.
  • the offset stored in the list memory with respect to the offset type is a total of 16 offsets 1 to 16.
  • the offset 1 to the offset 16 are “sao_offset [sao_curr_depth] [ys] [xs] [1] when the value of“ sao_type_idx [sao_curr_depth] [ys] [xs] ”is“ 5 ”or“ 6 ”. ] ”To“ sao_offset [sao_curr_depth] [ys] [xs] [16] ”.
  • the offset stored in the list memory for the offset type is a total of four offsets 1 to 4.
  • the offsets 1 to 4 are “sao_type_idx [sao_curr_depth] [ys] [xs]” when the value is “1, 2, 3, 4” or “sao_offset [sao_curr_depth] [ys] [ys] [ xs] [1] ”to“ sao_offset [sao_curr_depth] [ys] [xs] [4] ”.
  • nothing is stored in the offsets 5 to 16.
  • Each QAOMU is assigned a QAOMU number, and the QAOMU numbers can be distinguished from each other by the QAOMU number.
  • a QAOMU whose QAOMU number is N Q will also be referred to as QAOMUN Q.
  • the accuracy of the offset may be varied depending on the QAOU hierarchy to be processed.
  • the shift value used for inverse quantization also differs.
  • the offset accuracy and shift value are derived using the pixel bit depth PIC_DEPTH.
  • SAO_DEPTH MIN (PIC_DEPTH, 8)
  • Shift value PIC_DEPTH-MIN (PIC_DEPTH, 8)
  • the offset accuracy can be made different.
  • the accuracy of the offset (offset bit depth, SAO_DEPTH) and the pixel bit depth (PIC_DEPTH) in which the range of pixel values constituting the input image is expressed in bit width are closely related to each other in terms of quantization error. There is a serious relationship. Since the bit depth of the output image of the adaptive offset filter 60 is the pixel bit depth PIC_DEPTH, and SAO_DEPTH is the bit depth of the offset added to the pixel, even if an offset with an accuracy exceeding the pixel bit depth is used, it is discarded in the output process. Therefore, it does not make sense to set SAO_DEPTH beyond PIC_DEPTH. On the other hand, when SAO_DEPTH is smaller than PIC_DEPTH, only the correction that is coarser than the accuracy (PIC_DEPTH) that can correct the input image by the filter can be performed, so that the filter effect is reduced.
  • the bit width for storing the offset quantized by the offset information storage unit 621 can be limited. Therefore, compared with the case where it does not restrict
  • the offset value range is excessively narrowed, the offset reduces the effect of correcting the distortion of the decoded image, and the distortion of the decoded image cannot be removed even by the offset addition process. It will decline.
  • the offset information storage unit 621 switches and secures the unit size of the offset storage area according to the depth of the QAOU hierarchy to be processed. Yes.
  • the offset information storage unit 621 determines that the depth of the processing target QAOU is greater than the threshold value.
  • An area for storing an offset when it is small is secured in n A bit units, and an area for storing an offset when the depth of the QAOU hierarchy to be processed is equal to or greater than a threshold is secured in n B bit units.
  • the offset information storage unit 621 switches the area of the list memory to be secured according to the required number of classes when the required number of classes changes according to the depth of the QAOU hierarchy to be processed. For example, as will be described later, the band offset is classified into 16 classes when the depth of the QAOU hierarchy to be processed is smaller than the threshold, and is classified into 8 classes when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold.
  • the memory capacity necessary for securing the class when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold is half that when the depth of the QAOU hierarchy to be processed is smaller than the threshold. Therefore, the offset information storage unit 621 switches the size of the list memory to be secured when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold to half that when the depth of the QAOU hierarchy to be processed is smaller than the threshold. .
  • the QAOU control unit 622 controls each unit included in the adaptive offset filter processing unit 62. Further, the QAOU control unit 622 refers to the QAOU structure information, divides the deblocked decoded image P_DB into one or a plurality of QAOUs, and scans each QAOU in a predetermined order. In addition, the QAOMU number representing the target QAOMU to be processed is supplied to the offset type deriving unit 623.
  • the offset type deriving unit 623 derives an offset type specified by the QAOMU number supplied from the QAOU control unit 622 with reference to the map memory and the list memory of the offset information storage unit 621. Further, the derived offset type is supplied to the class classification unit 624.
  • the class classification unit 624 classifies each pixel included in the target QAOU into any of a plurality of classes that can be selected in the offset type supplied from the offset type deriving unit 623.
  • the offset type and a class index indicating a class into which each pixel is classified are supplied to the offset deriving unit 625. The specific classification process performed by the class classification unit 624 will be described later, and will not be described here.
  • the offset deriving unit 625 refers to the list memory of the offset information storage unit 621 and derives an offset specified by the offset type and class index supplied from the class classification unit 624 for each pixel included in the target QAOU. Further, an offset reverse shift unit (not shown) that shifts the offset to the left by the shift value set by the offset attribute setting unit 613 is provided.
  • the offset inverse shift unit performs inverse quantization of the offset so that the bit depth of the offset matches the pixel bit depth. By performing such inverse quantization, it is possible to add the pixel value and the offset at the same bit depth in the adding process of the offset adding unit 626 described later. The offset obtained by inverse quantization for each pixel is supplied to the offset adding unit 626.
  • the offset adding unit 626 adds the offset supplied from the offset deriving unit 625 to each pixel of the deblocked decoded image P_DB in the target QAOU.
  • the offset addition unit 626 outputs an image obtained by performing processing on all the QAOUs included in the deblocked decoded image P_DB as an offset filtered decoded image P_OF.
  • FIG. 26 is a diagram for explaining the offset processing by the adaptive offset filter 60.
  • FIG. 26A shows the magnitude relationship between the pixel value pix [x] of the processing target pixel x and the pixel value of the pixel a or b.
  • B is a graph showing the magnitude relationship between the pixel value of the processing target pixel x and the pixel values of the pixels a and b, and the magnitude relationship thereof.
  • C shows the correspondence between each graph shown in (b) and class_idx, and (d) to (f) show conversion tables representing conversion from EgdeType to class_idx. Is shown.
  • FIG. 27 is a diagram for explaining offset processing by the adaptive offset filter 60.
  • FIG. 6 schematically shows the class classification when the number is 6.
  • FIG. 28 is a diagram for explaining the offset processing by the adaptive offset filter 60.
  • FIG. 28A schematically shows the class classification when the depth of the QAOU hierarchy to be processed is smaller than the threshold
  • FIG. ) Schematically shows the class classification when the depth of the QAOU hierarchy to be processed is greater than or equal to a threshold value.
  • FIG. 29 is a diagram illustrating an example of class classification when a band offset is specified.
  • FIG. 29A illustrates an example of class classification when the depth of the QAOU hierarchy to be processed is smaller than a threshold.
  • b) shows an example of class classification when the depth of the QAOU to be processed is greater than or equal to a threshold value.
  • a black circle with pix [x] indicates a pixel value of the processing target pixel x
  • a black circle without pix [x] indicates the processing target pixel a or
  • the pixel value of b is shown.
  • the vertical direction in FIG. 26A indicates the magnitude of the pixel value.
  • the class classification unit 624 calculates EgdeType by the following formula (1-1) based on Sign (pix [x] ⁇ pix [a]) and Sign (pix [x] ⁇ pix [b]). To derive.
  • EgdeType Sign (pix [x] ⁇ pix [a]) + Sign (pix [x] ⁇ pix [b]) + 2 (1-1)
  • EgdeType 0.
  • EgdeType 1.
  • EgdeType 3.
  • the black circle at the center of each graph indicates the pixel value of the processing target pixel x, and the black circles at both ends indicate the pixel values of the pixels a and b. Further, the vertical direction in FIG. 26B indicates the magnitude of the pixel value.
  • the class classification unit 624 derives the class index (class_idx) of the class to which the processing target pixel x should belong based on the derived EgdeType as follows.
  • class_idx EoTbl [EdgeType]
  • EoTbl [EdgeType] is a conversion table used to derive class_idx from EdgeType. Specific examples of the conversion table EoTbl are shown in FIGS.
  • the conversion table 1001X shown in FIG. 26D is a conversion table when the conversion table used is not changed according to the depth of the QAOU hierarchy to be processed.
  • the conversion table 1001A shown in FIG. 26 (e) and the conversion table 1001B shown in FIG. 26 (f) are conversion tables for changing the conversion table used depending on the depth of the QAOU to be processed.
  • the conversion table 1001A is used.
  • the conversion table 1001B is used.
  • the class classification unit 624 performs processing as shown in the conversion table 1001A.
  • the class classification unit 624 sets a plurality of pixel values of the processing target pixel according to the pixel value pix [x] of the processing target pixel x. Classify one of the classes.
  • the class classification unit 624 determines that the pixel value pix [x] of the processing target pixel x is (Max ⁇ 1/4) ⁇ pix [x] ⁇ (max ⁇ 3/4) Is satisfied, the processing target pixel is classified into a class other than class 0. That is, when the pixel value of the processing target pixel is within the hatched range in FIG. 11A, the processing target pixel is classified into a class other than class 0.
  • the class classification unit 624 determines that the pixel value pix [x] of the processing target pixel x is pix [x] ⁇ (max ⁇ 1/4) or (max ⁇ 3/4) ⁇ pix [x] Is satisfied, the processing target pixel is classified into a class other than class 0. That is, when the pixel value of the processing target pixel is within the hatched range in FIG. 11B, the processing target pixel is classified into a class other than class 0.
  • the class classification process by the class classification unit 624 will be described in more detail as follows.
  • class_idx EoTbl [sao_type_idx] [pix [x] / >> BoRefBit32]
  • class_idx EoTbl [sao_type_idx] [pix [x] / >> BoRefBit16]
  • BoTbl [sao_type_idx] [pix [x] / >> BoRefBit32] and BoTbl [sao_type_idx] [pix [x] / >> BoRefBit16] are derived from the pixel values pix [x [x]
  • Class_idx is a conversion table used for deriving.
  • BoRefBit32 and BoRefBit16 are values derived by PIC_DEPTH-5 and PIC_DEPTH-4, respectively, when the image bit depth is set to PIC_DEPTH, and the pixel values are quantized to 32 or 16 values.
  • the quantized pixel value is also described as pixquant. Shifting right by BoRefBit32 and BoRefBit16 corresponds to dividing by 1 ⁇ BoRefBit32 and 1 ⁇ BoRefBit16.
  • This quantization width is called a class width.
  • the class classification unit 624 performs class classification by changing the width of the class to be classified according to the depth of the QAOU hierarchy to be processed. For example, as shown in FIG. 28A, when the depth of the QAOU hierarchy to be processed is smaller than the threshold, the class classification unit 624 classifies the pixel width into 32 pieces with the class width set to “8”. , Classify. Also, as shown in FIG. 28 (b), when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold, the class classification unit 624 classifies the pixel value into 16 with a class width of “16”, and class Perform classification.
  • the conversion table 1301 shown in FIG. 29A is a conversion table used when the depth of the QAOU hierarchy to be processed is smaller than the threshold
  • the conversion table 1302 shown in FIG. This is a conversion table used when the depth of the QAOU hierarchy is greater than or equal to a threshold value.
  • the eyelid class classification unit 624 has a pixel value pix [x] of 8 ⁇ ( The processing target pixel x satisfying pix [x] / 8) ⁇ 23 is classified into any one of class indices 1 to 16 according to the size of pix [x].
  • the class classification unit 624 determines the pixel x to be processed that satisfies the pixel value pix [x] that satisfies pix [x] / 8) ⁇ 7 or 24 ⁇ (pix [x] / 8). , Pix [x] is classified into any one of class indexes 1 to 16 according to the size of pix [x].
  • the eyelid class classification unit 624 has a pixel value pix [x] of 4 ⁇ A pixel x to be processed that satisfies (pix [x] / 16) ⁇ 11 is classified into one of class indexes 1 to 8 according to the size of pix [x].
  • FIG. 41 shows an offset information decoding unit that changes the offset type to be used according to the type (parameter condition) of the parameter for adaptive offset and / or changes the number of class classifications according to the parameter condition for adaptive offset.
  • FIG. 611 is a block diagram of FIG.
  • the offset information decoding unit 611 includes an adaptive offset type decoding unit 6111, a used offset type selection unit 6112, an offset type decoding unit 6113, an adaptive offset decoding unit 6114, a used offset number selection unit 6115, and an offset decoding unit 6116.
  • the parameter condition is a parameter other than a value calculated from the pixel value.
  • the block size (QAOU size) and color components (components) described in the appendix described later are included. ), QP.
  • the adaptive offset type decoding unit 6111 is means for adaptively decoding an offset type according to parameter conditions from QAOU information in the encoded data, and includes a use offset type selection unit 6112 and an offset type decoding unit 6113.
  • the used offset type selection unit 6112 is means for selecting an offset type to be used according to the parameter condition.
  • One of the parameter conditions is a hierarchy as described above.
  • the number of offset types used when the hierarchy is shallow is smaller than the number of offsets used when the hierarchy is deep.
  • the used offset type selection unit 6112 inputs the conversion table as described in FIG. 8 to the offset type decoding unit 6113 according to the parameter condition. Further, the maximum number of usable offset types is input to the offset type decoding unit 6113.
  • the offset type decoding unit 6113 decodes the offset type from the encoded data according to the input conversion table and the maximum number. Assuming that the maximum number of offset types is N, the range of codes that can be taken is limited to N from 0 to N ⁇ 1. Therefore, the number of bits required for code encoding can be reduced. For example, m-bit fixed length coding can be used when the maximum number is greater than 2m-1 and less than or equal to 2m. In addition, Truncated unary encoding with a maximum value of N-1 or Truncated Rice encoding can be used.
  • the adaptive offset decoding unit 6114 is means for adaptively decoding an offset from the QAOU information in the encoded data according to the parameter condition, and includes a used offset number selection unit 6115 and an offset decoding unit 6116.
  • the used offset number selection unit 6115 is means for selecting the maximum value of the number of offsets to be used and the offset accuracy in accordance with the parameter conditions.
  • One of the parameter conditions is a hierarchy, and the number of offsets used when the hierarchy is shallow is larger than the number of offsets used when the hierarchy is deep. For example, when the hierarchy is shallow, the number of offsets can be 16 as shown in FIG. 29 (a), and when the hierarchy is deep, the number of offsets can be 8 as shown in FIG. 29 (b).
  • the offset accuracy (bit depth) can be changed according to the hierarchy.
  • the used offset number selection unit 6115 inputs the maximum offset number and the offset accuracy to the offset decoding unit 6116.
  • the offset decoding unit 6116 decodes the offset according to the maximum number of offsets and the offset accuracy. When the number of offsets is reduced, the code amount of the offset is reduced.
  • the offset type if the accuracy of each offset is determined, the range that can be taken by the code for encoding the offset is also limited, so that the number of bits required for encoding the code can be reduced.
  • FIG. 42A is a block diagram showing the configuration of the used offset type selection unit 6112.
  • the used offset type selection unit 6112 includes an offset type conversion table selection unit 6117, a first offset type conversion table storage unit 6118, and a second offset type conversion table storage unit 6119.
  • the offset type conversion table selection unit 6117 selects the conversion table provided in the first offset type conversion table storage unit 6118 or the conversion table provided in the second offset type conversion table storage unit 6119 according to the parameter condition.
  • 801A corresponds to the conversion table included in the first offset type conversion table storage unit 6118
  • 801B corresponds to the conversion table included in the second offset type conversion table storage unit 6119.
  • FIG. 42 (b) is a block diagram showing another configuration of the used offset type selection unit.
  • the used offset type selection unit 6112 ' includes an offset type conversion table selection unit 6117', an edge offset type and band offset type conversion table storage unit 6118 ', and a horizontal edge offset type and band offset type conversion table storage unit 6119'.
  • FIG. 43 is a block diagram illustrating a configuration of the class classification unit 624.
  • the class classification unit 624 includes an adaptive edge offset class classification unit 6241, a used edge offset class selection unit 6242, an edge offset class classification unit 6243, an adaptive band offset class classification unit 6244, a used band offset class / class width selection unit 6245, The band offset class classification unit 6246 is configured.
  • the class classification unit 624 classifies each pixel into a class according to the parameter condition and the offset type. If the offset type indicates an edge offset, the adaptive edge offset class classifying unit 6241 classifies the pixel. If the offset type is a band offset, the adaptive band offset class classifying unit 6244 classifies the pixel.
  • the adaptive edge offset class classification unit 6241 is a unit that adaptively classifies pixels into classes according to parameter conditions, and includes a used edge offset class selection unit 6242 and an edge offset class classification unit 6243.
  • the used edge offset class selection unit 6242 selects the type of class to be used.
  • the used edge offset class selection unit 6242 inputs the pixel value classification method to the edge offset class classification unit 6243. Specifically, a method of deriving an intermediate value EdgeType that is temporarily derived when classifying pixel values and a conversion table used for deriving class_idx from EdgeType are input.
  • An example of a method for deriving the intermediate value EdgeType has been described with reference to FIGS. 26A and 26B, and this is called a basic edge classification method.
  • An edge classification method as will be described later with reference to FIG. 33 can also be used.
  • One of the parameter conditions is a hierarchy as described above, and the class used when the hierarchy is shallow is selected so as to be larger than the class used when the hierarchy is deep.
  • 1001A and 1001B are examples of conversion tables used to derive class_idx from EdgeType.
  • a method of switching the edge derivation method according to the color component (component) is also appropriate. In this case, for luminance, a basic edge classification method using horizontal, vertical, and diagonal edge classification methods is used, and for color difference, the range of reference pixels used for edge classification to reduce line memory is horizontal when viewed from the target pixel. It is appropriate to use a horizontal edge classification method limited to the direction.
  • the edge offset class classification unit 6243 classifies pixels based on a given classification method and a conversion table used to derive class_idx from EdgeType.
  • the adaptive band offset class classification unit 6244 is means for adaptively classifying pixels into classes according to parameter conditions, and includes a used band offset class / class width selection unit 6245 and a band offset class classification unit 6246.
  • the used band offset class / class width selection unit 6245 inputs the pixel value classification method to the band offset class classification unit 6246.
  • a class width that is a quantization width used when classifying pixel values into intermediate values and a conversion table that is used to derive class_idx from the intermediate values are input.
  • One of the parameter conditions is the hierarchy as described above, and the width of the class used when the hierarchy is shallow is smaller than the width of the class used when the hierarchy is deep.
  • the band offset class classification unit 6246 classifies the pixel values into classes according to the input class width and a conversion table used to derive class_idx from the intermediate value.
  • the coded data is adaptively decoded according to the parameter conditions, and the pixel classification is performed.
  • the number of class classifications is changed according to the depth of the QAOU hierarchy to be processed. More specifically, when the depth of the QAOU to be processed is large, it is classified into a smaller number of classes compared to the case where the depth is small.
  • the area of the QAOU becomes smaller and the characteristics of the pixel values in the QAOU become nearly uniform, so the effect of offset does not change much even if the number of classes is reduced.
  • the accuracy of the offset is changed according to the depth of the QAOU hierarchy to be processed. More specifically, when the depth of the QAOU to be processed is large, the offset accuracy is lowered as compared with the case where the depth is small. This reduces the amount of code when the depth of the QAOU hierarchy to be processed is large.
  • a moving image encoding device 2 ′ that generates encoded data # 1 by encoding an encoding target image will be described with reference to FIGS. Similar to the moving picture coding apparatus 2, the moving picture coding apparatus 2 ' H.264 / MPEG-4.
  • a method adopted in AVC a method adopted in KTA software, which is a codec for joint development in VCEG (Video Coding Expert Group), and a method adopted in TMuC (Test Model under Consideration) software, which is the successor codec And the technology employed in HM (HEVC TestModel) software.
  • the moving picture coding apparatus 2 ′ is different in that an adaptive offset filter 80 ′ is provided instead of the adaptive offset filter 80 in the moving picture coding apparatus 2, and the other configurations are the same.
  • FIG. 30 is a block diagram showing a configuration of the adaptive offset filter 80 ′.
  • the adaptive offset filter 80 ′ includes an adaptive offset filter information setting unit 81 ′ and an adaptive offset filter processing unit 82 ′.
  • the adaptive offset filter information setting unit 81 ′ includes an offset calculation unit 811, an offset shift unit 816, an offset clip unit 812, an offset information selection unit 813, and an offset attribute setting unit 815. is there.
  • Offset calculation unit 811 For all QAOUs up to a predetermined division depth included in the target processing unit (for example, LCU), the offset calculation unit 811 performs all offset types and all classes that exist according to the hierarchy of the processing target QAOU. The offset of is calculated.
  • the offset type and class are the same as those described in the description of the video decoding device 1.
  • the offset calculation unit 811 supplies offset information including the offset, offset type, class, and QAOU structure information representing the QAOU division structure calculated by the above processing to the offset clip unit 812.
  • Offset clip part 812 The offset clip unit 812 performs clip processing on the offset supplied from the offset calculation unit 811 by any one of clip processing 1 and clip processing 2 as described below.
  • the offset clip unit 812 clips each offset supplied from the offset calculation unit 811 to a value from ⁇ 8 to 7, for example, to express each offset with 4 bits.
  • Each clipped offset is supplied to the offset information selection unit 813.
  • the bit width to be clipped is set according to the bit depth of the image and the bit depth of the offset, as in the video decoding device 1.
  • each offset the memory size of a memory (not shown) in which each offset is stored can be reduced. Moreover, since the amount of offset codes included in the encoded data # 1 can be reduced, the encoding efficiency can be improved. Moreover, since an excessive offset is suppressed, an appropriate image quality is ensured.
  • the offset clip unit 812 may be configured to set different values for the clip range of each offset supplied from the offset calculation unit 811 according to the offset type.
  • the number of offset bits is 8 bits
  • the number of offset bits is 4 bits. More generally, when the offset bit number is N bits when the offset type is an edge offset and the offset bit number is M bits when the offset type is a band offset, N> M is satisfied. Determines the number of offset bits.
  • m-bit fixed-length coding is used as a coding method for coding the offset.
  • m-bit fixed-length coding is used as a coding method for coding the offset.
  • clip processing obtained by combining the above clip processing 1 and 2 is also included in this embodiment.
  • the adaptive offset filter 80 may be configured not to include the offset clip unit 812.
  • the offset clip unit 812 switches the clip range according to the depth of the QAOU hierarchy to be processed in accordance with the offset accuracy. Specifically, it is assumed that the accuracy of the offset is n A bits when the depth of the QAOU hierarchy to be processed is smaller than the threshold, and n B bits when the depth of the QAOU hierarchy to be processed is equal to or greater than the threshold. At this time, if the depth of the QAOU layer to be processed is smaller than the threshold, the offset clip unit 812 sets the clip range to ⁇ 2 nA / 2 to 2 nA / 2 ⁇ 1.
  • the clip range is set to ⁇ 2 nA / 2 to 2 nA / 2 ⁇ 1, and the lower (n A ⁇ n B ) bits are set to “0”. " Thereby, the offset clip unit 812 can cause the offset information selection unit 813 that performs processing using the clipped offset to perform processing without considering the offset accuracy.
  • Offset information selection unit 813 The offset information selection unit 813 determines an offset type, a class, a combination of offsets, and a corresponding QAOU partition structure with a smaller RD cost (Rate-Distortion cost), and determines the determined offset type, class, offset, and QAOU information indicating the corresponding QAOM division structure is supplied to the variable-length code encoding unit 22. Also, the offset information selection unit 813 supplies the determined offset to the adaptive offset filter processing unit 82 for each QAOU.
  • RD cost Rent-Distortion cost
  • FIG. 31 is a diagram showing an outline of calculating a square error for each offset type for a QAOU having a QAOU index of “x”.
  • the offset information selection unit 813 calculates a square error for each offset type for all QAOMUs.
  • the offset type that minimizes the calculated square error is set as the offset type of the QAOU.
  • the offset type is determined for all QAOMUs (QAOMU numbers 0 to 340).
  • the offset information selection unit 813 calculates the RD cost when the division depth is 0 and the RD cost when the division depth is 1. A specific calculation method is as described above with reference to FIG.
  • the adaptive offset filter processing unit 82 ′ adds the offset supplied from the offset information selection unit 813 to each pixel of the deblocked decoded image P_DB in the target QAOU.
  • the adaptive offset filter processing unit 82 ′ outputs an image obtained by processing all the QAOUs included in the deblocked decoded image P_DB as an offset filtered decoded image P_OF. Note that the configuration of the adaptive offset filter processing unit 82 ′ is the same as that of the adaptive offset filter processing unit 62 ′, and thus the description thereof is omitted here.
  • an adaptive clip (AC) type may be provided as one of the offset types.
  • the lower limit value and upper limit value of a clip are adaptively given instead of fixed values
  • the lower limit value and upper limit value may be encoded.
  • the upper limit value is a large value, the encoding efficiency is not lowered by doing so.
  • N 64 (LCU size).
  • the number of SAO types is limited, for example, by limiting EO to horizontal and vertical types, using only one type of BO (conversion table 802C), using only EO and not using BO (conversion table 802A), Only one of horizontal type EO and BO can be used (conversion table 801B, conversion table 802D).
  • the offset information decoding unit 611 uses the conversion table shown in parentheses. Note that the SAO class number limitation and the offset accuracy limitation can be performed in the same manner as in the above-described embodiment.
  • the type of SAO type by limiting the type of SAO type, the number of types, the number of classes, and the offset accuracy, it is possible to reduce the amount of memory used and the processing load.
  • the type type when the type type is limited to BO, or when EO is limited to horizontal and vertical types, the processing load on the class classification unit of the encoding device and the decoding device can be reduced.
  • the number of types when the number of types is limited, the cost calculation for selecting the optimum type can be omitted, so that the processing load on the encoding device can be reduced.
  • Limiting the type of type to EO and limiting the number of classes and offset accuracy can reduce the amount of memory used to store offset.
  • Such a limitation is that the operations of the offset information decoding unit 611 and the class classification unit 624 are adaptively performed according to the parameter condition when the parameter condition is set to the size of QAOUN by the configuration of the means shown in FIGS. It can be realized by changing.
  • the size of a QAOU (hereinafter also referred to as a luminance unit) for adding an offset to the luminance value is different from the size of a QAOU (hereinafter also referred to as a color difference unit) for adding an offset to the color difference.
  • the configuration may be such that the type of SAO, the number of types, the number of classes, the offset accuracy, and the maximum division hierarchy are limited rather than the luminance unit.
  • the fineness of the color difference division is as low as the luminance. No longer needed. Therefore, by limiting the types of SAO types, the number of types, the number of classes, the offset accuracy, and the maximum division hierarchy for the color difference unit, it is possible to reduce the amount of memory used and the processing load. Note that the restriction on the maximum hierarchy of the color difference units can be achieved, for example, by making the maximum depth of the SAO tree structure shallower than that of the luminance unit.
  • Such a limitation is that the operations of the offset information decoding unit 611 and the class classification unit 624 are adaptively performed according to the parameter condition when the parameter condition is set to the size of QAOUN by the configuration of the means shown in FIGS. It can be realized by changing.
  • the offset information decoding unit 611 uses conversion tables such as a conversion table 801B and a conversion table 802D.
  • AY> AC the variables AY and AC for controlling accuracy.
  • the accuracy of the luminance component offset is larger than that of the color difference component.
  • the shift value of the luminance component is smaller than the color difference component.
  • the value of the CU quantization parameter QP (Appendix 4)
  • the type of SAO type, the number of types, the number of classes, the offset accuracy, and the maximum division hierarchy may be limited.
  • the QP value the initial QP value of the picture may be used.
  • the SAO processing target QAOU is along the boundary of the LCU or CU
  • the CU value at the position corresponding to the upper left coordinate or the center coordinate of the QAOU is used.
  • a QP value may be used.
  • Such a limitation is that the operation of the offset information decoding unit 611 and the class classification unit 624 is adaptively changed according to the parameter condition when the parameter condition is QP by the configuration of the means shown in FIGS. This can be achieved.
  • the picture quality of the picture has a great influence on the subsequent pictures, so it is necessary to keep the accuracy of the SAO high.
  • the type of SAO, the number of types, the number of classes, the offset accuracy, and the like for these pictures B picture, IDR picture
  • the maximum hierarchy of division may be limited. As a result, the memory usage can be reduced and the processing load can be reduced.
  • Such a limitation is that the operations of the offset information decoding unit 611 and the class classification unit 624 are adaptively performed according to the parameter condition when the parameter condition is a picture type by the configuration of the means shown in FIGS. It can be realized by changing.
  • the configuration may be such that the number of SAO types, the number of classes, the offset accuracy, and the maximum division hierarchy are limited according to the position of the QAOU on the screen.
  • the number of SAO types, the number of classes, the offset accuracy, and the maximum division hierarchy may be limited.
  • the subjective image quality is lowered as it is, but even if the image quality is lowered at the periphery of the screen, the subjective image quality is not lowered as much as the area near the center of the screen.
  • Boundary determination processing can be reduced if the SAO type that requires sample points exceeding the screen edge is not used.
  • Such a limitation is that the operations of the offset information decoding unit 611 and the class classification unit 624 are adaptively performed according to the parameter condition when the parameter condition is set to the position of QAOU by the configuration of the means shown in FIGS. It can be realized by changing.
  • BO is used in the low pixel value region and the high pixel value region, and EO is used in the intermediate gradation region.
  • FIG. 32 is a diagram for explaining a configuration for switching between EO and BO according to pixel values
  • (a) is a diagram for explaining an outline of a configuration for switching between EO and BO according to pixel values.
  • (b) is a diagram for explaining specific switching values, and
  • (c) is a diagram showing the contents of the list memory stored in the offset information storage unit 621.
  • the SAO type is classified according to the pixel value, and when the pixel value is around 0 and around 255, an offset corresponding to the pixel value is added, and in other regions, an offset corresponding to the edge type is added.
  • EO and BO are determined according to the pixel value range, and a single SAO type uses a portion having a high error correction effect in both EO and BO. Thereby, encoding efficiency can be improved. In addition, since the number of SAO types and the total number of classes can be reduced, it is possible to reduce the amount of memory used and the processing load.
  • the present embodiment uses 1 to 4 for “sao_type_idx” and defines them as follows.
  • “Sao_type_idx” 1: (BO_EO_0) Corresponds to EO_0 + BO of the first embodiment
  • “sao_type_idx” 2: (BO_EO_1) Corresponds to EO_1 + BO of the first embodiment
  • “sao_type_idx” 3: (BO_EO_2)
  • Embodiment “Sao_type_idx” 4: (BO_EO_3) Equivalent to EO_3 + BO of the first embodiment
  • EO_0 to 3 and BO_0, 1 of the first embodiment are not used.
  • category part 624 performs a class classification
  • the edge type is determined according to EO_0 to 3 described in the above embodiment, and classification is performed.
  • the class classification unit 624 can classify the class by switching between BO and EO according to the pixel value.
  • the offset calculation unit 811 calculates the offset by the same method as the offset calculation method described in the above embodiment. However, in the present embodiment, since the number of types of offset types is four, this point is calculated differently.
  • the list memory 2101 stored in the offset information storage unit 621 has a QAOU index, an offset type, and a specific offset value for each class that can be selected in the offset type. Stored in association with each other.
  • Embodiment 5 The following will describe another embodiment of the present invention with reference to FIGS.
  • the present embodiment is different from the above embodiment in that, in the EO classification, the pixels used for edge determination are limited to only the pixels existing in the horizontal direction of the determination target pixel.
  • pixels that exist above or below the target pixel are also used for edge determination. For this reason, a line buffer that holds the pixel value of the pixel before the offset processing is necessary for the pixel that exists in the upper direction of the target pixel (pixel that has undergone the offset processing).
  • the pixels used for the edge determination are limited to the pixels existing in the horizontal direction of the target pixel, there is no need to refer to the upper direction, and the amount of memory used for the line buffer can be reduced.
  • the upper boundary determination (such as the screen edge) is unnecessary, the processing amount can be reduced.
  • FIG. 33A shows pixels existing in the horizontal direction, and x0 to x3 are pixel values of the respective pixels.
  • s1 sign (x1-x0) -sign (x2-x1)
  • s2 sign (x2-x1) -sign (x3-x2)
  • s1 and s2 are values used for classifying the edge at x1 and x2.
  • the processing amount can be reduced by this amount.
  • EO edge offset
  • the edge type is determined using a pixel further separated by 1 pixel from both sides of the target pixel in order to facilitate detection of an edge having a shallow angle with respect to the horizontal. is there.
  • the difference between the pixel values is small and may not be determined as an edge. Even in such a case, it is possible to detect an edge having a shallow angle with respect to the horizontal by taking a difference from the adjacent pixel by one pixel.
  • the left side may be the adjacent pixel
  • the right side may be the difference between one pixel and the adjacent pixel (FIG. 34 (a)), or vice versa (FIG. 34 (b)). It may be used. This is particularly effective when the reference pixel hits the edge of the screen.
  • the configuration may be such that only the horizontal pixels are used.
  • only the picture in the horizontal direction is referred to only in the case of a picture that has little influence on other pictures such as a B picture and a non-reference picture, and in other cases, the configuration is the same as in the first embodiment.
  • pixels in the horizontal direction may be referred to, and other configurations may be the same as those in the above embodiment. In this way, the amount of memory used can be reduced and the amount of processing can also be reduced. Further, since no upward reference is performed, the boundary determination process near the screen edge or slice boundary can be reduced.
  • a flag in units of pictures or blocks may be configured to be explicitly specified by a flag in units of pictures or blocks. For example, in the case where there are many horizontal edges (FIG. 34 (c)), if the process is performed by the method described in the above embodiment, it is possible to prevent the performance from being deteriorated.
  • whether or not to use only the pixels that exist in the horizontal direction may be changed according to the condition described in the above embodiment (whether the depth of the QAOU hierarchy is smaller than a threshold). Furthermore, only in the case where BO and EO are used in combination as described in the above embodiment, EO may be configured to use only pixels that exist in the horizontal direction.
  • the type of edge may be derived depending on whether or not the difference from the pixel existing in the horizontal direction is larger (or smaller) than the threshold value.
  • classes may be classified according to the following formula.
  • th is a threshold value having a predetermined value.
  • the effect limited to the horizontal can be obtained only when there is only one horizontal edge classification method, for example, only in the case of FIG.
  • finer edge classification is possible than when one horizontal edge classification method, for example, FIG. 33B is used.
  • the combination in the case of using a plurality of horizontal edge classification methods is not limited to the case of using two examples by changing the distance between the target pixel and the reference pixel as shown in FIGS.
  • a configuration in which two threshold values used in deriving the type of the above are also possible.
  • two horizontal edge classification methods for the case where the threshold th is 0 and 1 may be provided.
  • the configuration for limiting the use of only the pixels in the horizontal direction is the operation of the offset information decoding unit 611 and the class classification unit 624 adaptively according to the parameter conditions by the configuration of the means shown in FIGS. 41 to 43 of the first embodiment. It can be realized by changing.
  • the type of offset type selected by the used offset type selection unit 6112 is limited to only the horizontal edge classification method according to the parameter condition, and is limited by the offset type decoding unit 6113. Decodes the type offset type.
  • the offset type conversion table selection unit 6117 can convert the edge offset type and band offset type storage unit 6118 ′ according to the parameter condition, or the horizontal edge offset type and band offset type conversion.
  • a conversion table provided in the table storage unit 6119 ′ is selected.
  • the conversion table included in the edge offset type and band offset type storage unit 6118 ′ is selected.
  • the horizontal edge offset type and band offset type conversion table storage unit 6119 is selected. Select the conversion table provided by '.
  • the internal use offset type selection unit 6112 selects an edge classification method limited to only the horizontal edge classification method according to the parameter condition, and the edge offset class classification unit 6243 classifies the pixels.
  • the basic edge classification method is selected when the color component is luminance
  • the horizontal edge classification method is selected when the color component is color difference.
  • the error near the achromatic color has a characteristic that it is easily noticeable in the subjective image quality.
  • the achromatic color is the center of the range, and if the bit depth is 8 bits, it is the color of the pixel having a pixel value of 128. Therefore, in the present embodiment, in the case of BO, the offset accuracy is increased or the class division is made finer by using a smaller class width around the pixel value 128 of the color difference.
  • the value range near the achromatic color for the pixel value of the color difference is referred to as an achromatic color value range.
  • the offset accuracy of the achromatic color range is improved and the class division is subdivided, but this is not limiting, and class division is performed for values in a range that is likely to affect subjective image quality.
  • Subjective image quality can be improved by subdividing or improving the offset accuracy.
  • the same effect can be obtained by a configuration in which the offset accuracy is similarly increased or the class division is subdivided in a pixel value range in which image quality degradation is conspicuous in terms of subjective image quality.
  • FIG. 35 is a diagram showing an outline of a case where the offset accuracy is improved.
  • the accuracy of the offset in the vicinity of the pixel value 128 of the color difference is made high, and the accuracy of the offset in other value ranges is made low.
  • the offset clip unit 812 switches the clip range between a value range where the offset is high accuracy and a value range where the offset is low accuracy.
  • the clip range is -2 nA / 2 to 2 nA / 2 -1
  • the clip range is -2 nB / 2 to 2 nB. / 2 ⁇ 1.
  • FIG. 36 is a diagram showing an outline when class classification is subdivided, (a) shows a conversion table, and (b) to (d) are diagrams for explaining class division.
  • an offset storage area corresponding to “sao_type_idx” 5 is secured in the color difference list memory in the offset information storage unit 621 according to the number of class classifications.
  • the class classification unit 624 determines whether the pixel value of the target pixel is in the achromatic value range when deriving the class from the pixel value. Specifically, class classification is performed using, for example, one of the conversion tables 2501 shown in FIG.
  • “BoTbl [BO — 0] [pix / 4] (c)” shows an example in which the class is divided into 18 parts, the value range near the achromatic color is subdivided, and the maximum value of the class width is also maintained ( FIG. 36 (d)).
  • the correction accuracy of the achromatic color range can be improved by making the class width of the intermediate gradation range relatively larger than the class width of the achromatic color range and reducing the total number of classes.
  • the offset storage area can be reduced while keeping the street. This is possible because the frequency of use of offset correction in the intermediate gradation region is lower than that in the achromatic region.
  • a configuration in which the offset accuracy differs between the pixel value indicating luminance and the pixel value indicating color difference that is, a configuration in which the offset accuracy for the pixel value indicating the color difference is coarser than the offset accuracy for the pixel value indicating the luminance. It may be.
  • clip (x, y, z) indicates a process of limiting the value of x to y ⁇ x ⁇ z.
  • the offset may be added to the intermediate gradation range and other value ranges.
  • class classification may be performed in consideration of achromatic pixel values.
  • a class is assigned to an intermediate gradation range
  • a value range other than the intermediate gradation range is assigned.
  • a class is assigned.
  • classification may be performed asymmetrically in two value ranges sandwiching an achromatic pixel value.
  • the class width is the same as in the example shown in FIG. 37B.
  • different class classifications may be used for each color difference channel (Cr and Cb).
  • the class width differs between the color difference (Cr) and the color difference (Cb).
  • the class width can be changed by subdividing the number of classes as in the conversion table 2501.
  • the color difference may be configured to classify with one BO type.
  • the difference from the above embodiment is not the offset value itself, but the offset value is predictively encoded, that is, the offset residual calculated by using the offset value and the predicted value of the offset value.
  • the difference is encoded, and the offset prediction value is set to “0”.
  • an offset is encoded according to a class indicating an area classification. If there is no pixel classified into the class (the class is empty), “0” is encoded. Normally, the offsets of the neighborhood class and the neighborhood region have close values. Therefore, if the difference is encoded using the already-decoded offset value as a predicted value, the amount of codes can be reduced. However, if the class is empty, the code amount increases.
  • the offset prediction value includes “0”, selects one prediction value from a plurality of prediction value candidates including “0”, and encodes the prediction difference to reduce the code amount of the offset. Reduced.
  • the configuration of the offset information decoding unit 611 'according to the present embodiment will be described with reference to FIG.
  • the offset information decoding unit 611 ′ is provided instead of the offset information decoding unit 611 in FIG. 22, and includes an offset residual decoding unit 651, an offset restoration unit 652, and a predicted value derivation unit 653.
  • the predicted value derivation unit 653 includes a prediction candidate flag decoding unit 661, a fixed prediction value calculation unit 662, an encoded prediction value calculation unit 663, and a prediction value candidate selection unit 664.
  • the offset residual decoding unit 651 decodes the offset residual from the QAOU information included in the encoded data # 1, and supplies the decoded offset residual to the offset restoration unit 652.
  • the predicted value deriving unit 653 derives a predicted offset value.
  • the prediction candidate flag decoding unit 661 decodes the prediction candidate flag from the QAOU information, and supplies the decoded prediction candidate flag to the prediction value candidate selection unit 664. Note that the prediction candidate flag decoding unit 661 may be configured not to decode the candidate selection flag when the previously decoded offset value is “0”. ”
  • the fixed prediction value calculation unit 662 calculates a fixed value (here, “0”) that is an offset that is encoded when there is no pixel classified into the class as a prediction value, and supplies the prediction value candidate selection unit 664 with the prediction value. To do.
  • the encoded predicted value calculation unit 663 reads the offset that has already been decoded from the offset information storage unit 621, calculates a predicted value, and supplies the predicted value to the predicted value candidate selection unit 664.
  • the prediction value candidate selection unit 664 supplies the offset restoration unit 652 with the prediction value supplied from the fixed prediction value calculation unit 662 and the prediction value supplied from the encoded prediction value calculation unit 663 according to the prediction candidate flag. Select the predicted value.
  • the offset restoration unit 652 calculates an offset (Offset) from the prediction value (pred) supplied from the prediction value candidate selection unit 664 and the offset residual (sao_offset) supplied from the offset residual decoding unit 651 according to the following equation. ).
  • “Offset” “pred” + “sao_offset”
  • the reason why the code amount increases when there is a class (empty class) with no pixel to be classified will be described with reference to FIG.
  • FIG. 39 is a diagram showing an outline when there is an empty class. As shown in FIG. 39, a non-empty class is encoded with the offset of the class. Then, for each class, the difference between the predicted value and the offset is encoded using the previous offset as the predicted value. However, if there is an empty class, the predicted value becomes “0” and the difference value becomes large. As a result, the code amount increases.
  • the prediction value can be selected from “0” and “previous (other than 0) offset” by the prediction candidate flag.
  • FIG. 40 is a diagram illustrating the syntax 2901 when the prediction candidate flag is used.
  • “sao_offset_delta” represents the difference d from the predicted value
  • “sao_offset [sao_curr_depth] [ys] [xs]” “offsetp + d”.
  • the prediction candidate flag may not be used in the case of EO, and the prediction candidate flag may be used in the case of BO. This is because an empty class often occurs in BO depending on the distribution of pixel values.
  • it may be configured to determine whether or not to perform predictive encoding itself according to the offset type. For example, in the case of EO, prediction encoding may be performed, and in the case of BO, prediction encoding may not be performed.
  • the intra prediction mode may be used to estimate, limit, or rearrange the class of edge offset in units of LCUs.
  • the edge direction selected as the SAO EO type is considered to be correlated with the intra prediction mode. For this reason, if the intra prediction mode of the CU at the position corresponding to the SAO QAOU is referred to, it can be used to select the EO class.
  • EO class is estimated and determined by intra prediction mode, EO class candidates are limited, or the order (index) of EO classes is rearranged in the order of high possibility of selection. Can do.
  • An image filter device is an image filter device that adds an offset selected from a plurality of offsets to each pixel value of an input image composed of a plurality of unit regions, and is included in each unit region.
  • Offset determining means for determining an offset to be added to the pixel value of each pixel for each unit area; and filter means for adding the offset determined by the offset determining means to the pixel value of the pixel included in the unit area.
  • the offset determining means has an offset with a limited number of offsets that can be selected as compared with the case where the size of the unit area is equal to or larger than the predetermined size.
  • An offset to be added to the pixel value of the pixel included in the unit area is determined from the inside.
  • the offset is added from the limited offsets compared to the case where the size of the unit area is equal to or larger than the predetermined size. An offset is determined.
  • the size of the unit area is small, the number of pixels included in the unit area is small, and the pixels are likely to have approximate values. Therefore, when the size of the unit area is small, even if the number of selectable offsets is limited, the influence on the image after the offset application is small. Further, by limiting the number of offsets that can be selected, the required memory capacity can be reduced.
  • an image filter device is an image filter device that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and includes pixels included in each unit region.
  • Offset determining means for determining the offset to be added to the pixel value for each unit region, and filter means for adding the offset determined by the offset determining means to the pixel value of the pixel included in the unit region,
  • the filter means is characterized in that, when the size of the unit area for which the offset is determined is smaller than a predetermined size, an offset with coarser accuracy is added than when the size of the unit area is equal to or larger than the predetermined size. Yes.
  • the size of the unit area is small, the number of pixels included in the unit area is small, and the pixels are likely to have approximate values. Therefore, when the size of the unit region is small, the influence on the quantization error is small even if the offset accuracy is rough. Therefore, the influence on the image after applying the offset is small. In addition, it is possible to reduce the required memory capacity by increasing the accuracy of the offset.
  • An image filter device is an image filter device that applies an adaptive offset (SAO: Sample Adaptive Offset) to each pixel value of an input image composed of a plurality of unit regions, and the pixels included in each unit region
  • An offset determining unit that determines the type of offset to be added to the pixel value for each unit region, and an offset according to the offset type determined by the offset determining unit is added to the pixel value of the pixel included in the unit region
  • the offset determining means determines the offset type as a band offset (BO) when the pixel value of the target pixel to which the offset is added is near the maximum value and the minimum value, and other than that
  • the pixel in the range is characterized by being determined as edge offset (EO).
  • a band offset is applied to pixels in the vicinity of the maximum and minimum pixel values, and an edge offset is applied to pixels in other value ranges. Is done.
  • the pixel value tends to affect the error more easily than the edge. Therefore, the above configuration increases the error correction efficiency and improves the encoding efficiency. .
  • band offset and edge offset are used together in one type, the number of types of adaptive offset can be reduced, and the amount of memory used and the amount of processing can be reduced.
  • the band offset refers to an offset process in which one of a plurality of offsets is added to the pixel value of the processing target pixel according to the size of the pixel value of the processing target pixel ( The same applies below).
  • the edge offset is a plurality of offsets in the pixel value of the processing target pixel according to the difference between the pixel value of the processing target pixel and the pixel values of the pixels around the processing target pixel. This is offset processing for adding any of the above (same below).
  • the offset determining means performs band detection for pixels in a range of pixel values from the minimum value to a quarter of the maximum value and from a range of the maximum value from a quarter to the maximum value.
  • the offset may be determined, and the value range other than this may be determined as the edge offset.
  • the pixel to which the band offset is applied and the pixel to which the edge offset is applied can be clearly separated.
  • An image filter device is an image filter device that applies an adaptive offset (SAO: Sample Adaptive Offset) to an input image, and performs edge determination to determine a class when applying an edge offset (EO).
  • SAO Sample Adaptive Offset
  • Class classification means for making a determination with reference to only pixels present in the horizontal direction of the target pixel, and filter means for adding an offset corresponding to the class classified by the class classification means when applying edge offset (EO) It is characterized by having.
  • the required memory amount can be reduced as compared with the case of referring to the pixels in the upward direction.
  • the processing amount can also be reduced.
  • the class classification unit may perform edge determination with reference to a pixel located at a position two pixels away from the target pixel in the horizontal direction.
  • the edge can be detected even when the edge angle is shallow.
  • An image filter device is an image filter device that applies an adaptive offset (SAO: Sample Adaptive Offset) to an input image, and a pixel value indicating a color difference is a central value between a maximum value and a minimum value.
  • SAO Sample Adaptive Offset
  • the class division means for determining the class when applying the band offset (BO) by subdividing the division width of the class around the value more than the other value ranges, and when applying the band offset (BO), the above class classification Filter means for adding an offset corresponding to the class classified by the means.
  • the pixel value indicating the color difference is subdivided from the division value of the class around the median value that is the median value of the maximum value and the minimum value, and the band offset (BO) is reduced.
  • the class to apply is determined.
  • the pixel value of the color difference is the median value
  • the pixel is achromatic. Achromatic errors are easily noticeable by humans, and the subjective image quality deteriorates. Therefore, if the class width near the median is subdivided as in the above configuration, the offset can be set finely for the pixels near the median. Thereby, subjective image quality can be improved.
  • the filter means uses the pixel value after the offset addition as the median value. You may do.
  • the offset is not added beyond the median value.
  • a pixel whose color difference has a median value is an achromatic color, and colors that can be perceived by human eyes change on both sides of the median value. So, according to said structure, it can prevent that the color which a person approaches is changed by adding offset.
  • An image filter device is an image filter device that applies an adaptive offset (SAO: Sample Adaptive Offset) to an input image, and a pixel value indicating a color difference is a central value between a maximum value and a minimum value. Filter means for adding an offset with higher accuracy to pixels in the vicinity of values than pixels in other value ranges is provided.
  • SAO Sample Adaptive Offset
  • the pixel value indicating the color difference adds an offset with higher accuracy than the pixels in the other value ranges to the pixels in the vicinity of the median value that is the median value of the maximum value and the minimum value.
  • the pixel value of the color difference is the median value
  • the pixel is achromatic. Achromatic errors are easily noticeable by humans, and the subjective image quality deteriorates. Therefore, as in the above configuration, if the accuracy of the offset to be added is improved in the vicinity of the median value, the offset can be finely added to the pixels in the vicinity of the median value. Thereby, subjective image quality can be improved.
  • An offset decoding apparatus is an offset decoding apparatus that decodes each offset referenced by an image filter that adds an offset to each pixel value of an input image, and decodes each offset residual from encoded data.
  • An offset residual decoding means a prediction value deriving means for deriving a predicted value of each offset from a decoded offset or a predetermined value, and a prediction value derived by the prediction value deriving means, And offset calculating means for calculating from the offset residual decoded by the offset residual decoding means.
  • the offset is decoded from the residual, the amount of code can be reduced as compared with the case where the offset is encoded as it is.
  • the prediction value for obtaining the residual is derived from the decoded offset or a predetermined value, by using only the decoded offset, the code amount of the difference data is made as compared with the case of encoding as it is. It can be prevented from becoming large.
  • “0” can be given as a predetermined value.
  • An offset encoding apparatus is an offset encoding apparatus that encodes each offset referenced by an image filter that adds an offset to each pixel value of an input image, and encodes a predicted value of each offset.
  • the offset is decoded from the residual, the amount of code can be reduced as compared with the case where the offset is encoded as it is.
  • the prediction value for obtaining the residual is derived from the decoded offset or a predetermined value, by using only the decoded offset, the code amount of the difference data is made as compared with the case of encoding as it is. It can be prevented from becoming large.
  • the data structure of the encoded data according to the present invention is a data structure of encoded data that is referred to by an image filter that adds an offset to each pixel value of an input image composed of a plurality of unit regions, and that has a predicted value.
  • Predictive value derivation information indicating whether to derive from a decoded offset or a predetermined value
  • the image filter refers to the predictive value derivation information included in the encoded data, It is characterized by deriving and decoding the offset.
  • whether the predicted value is a decoded offset or a predetermined value can be determined from the predicted value derivation information.
  • the above-described moving picture decoding apparatus 1 (1 ′) and moving picture encoding apparatus 2 (2 ′) can be used by being mounted on various apparatuses that perform transmission, reception, recording, and reproduction of moving pictures.
  • the moving image may be a natural moving image captured by a camera or the like, or an artificial moving image (including CG and GUI) generated by a computer or the like).
  • moving picture decoding apparatus 1 and moving picture encoding apparatus 2 can be used for transmission and reception of moving pictures.
  • FIG. 45 (a) is a block diagram showing a configuration of a transmission apparatus A in which the moving picture encoding apparatus 2 is mounted.
  • the transmitter A encodes a moving image, obtains encoded data, and modulates a carrier wave with the encoded data obtained by the encoder A1.
  • a modulation unit A2 that obtains a modulation signal by the transmission unit A2 and a transmission unit A3 that transmits the modulation signal obtained by the modulation unit A2.
  • the moving image encoding device 2 described above is used as the encoding unit A1.
  • the transmission apparatus A has a camera A4 that captures a moving image, a recording medium A5 that records the moving image, an input terminal A6 for inputting the moving image from the outside, as a supply source of the moving image that is input to the encoding unit A1. You may further provide image processing part A7 which produces
  • FIG. 45 (a) a configuration in which all of these are provided in the transmission apparatus A is illustrated, but a part thereof may be omitted.
  • the recording medium A5 may be a recording of a non-encoded moving image, or a recording of a moving image encoded using a recording encoding scheme different from the transmission encoding scheme. It may be a thing. In the latter case, a decoding unit (not shown) for decoding the encoded data read from the recording medium A5 according to the recording encoding method may be interposed between the recording medium A5 and the encoding unit A1.
  • FIG. 45 (b) is a block diagram showing the configuration of the receiving device B on which the moving image decoding device 1 is mounted.
  • the receiving apparatus B includes a receiving unit B1 that receives a modulated signal, a demodulating unit B2 that obtains encoded data by demodulating the modulated signal received by the receiving unit B1, and a demodulating unit.
  • a decoding unit B3 that obtains a moving image by decoding the encoded data obtained by B2.
  • the moving picture decoding apparatus 1 described above is used as the decoding unit B3.
  • the receiving device B has a display B4 for displaying a moving image, a recording medium B5 for recording the moving image, and an output terminal for outputting the moving image as a supply destination of the moving image output from the decoding unit B3.
  • B6 may be further provided.
  • FIG. 45B illustrates a configuration in which the receiving apparatus B includes all of these, but a part of the configuration may be omitted.
  • the recording medium B5 may be for recording an unencoded moving image, or is encoded by a recording encoding method different from the transmission encoding method. May be.
  • an encoding unit (not shown) that encodes the moving image acquired from the decoding unit B3 in accordance with the recording encoding method may be interposed between the decoding unit B3 and the recording medium B5.
  • the transmission medium for transmitting the modulation signal may be wireless or wired.
  • the transmission mode for transmitting the modulated signal may be broadcasting (here, a transmission mode in which the transmission destination is not specified in advance) or communication (here, transmission in which the transmission destination is specified in advance). Refers to the embodiment). That is, the transmission of the modulation signal may be realized by any of wireless broadcasting, wired broadcasting, wireless communication, and wired communication.
  • a terrestrial digital broadcast broadcasting station (such as broadcasting equipment) / receiving station (such as a television receiver) is an example of a transmitting apparatus A / receiving apparatus B that transmits and receives modulated signals by wireless broadcasting.
  • a broadcasting station (such as broadcasting equipment) / receiving station (such as a television receiver) for cable television broadcasting is an example of a transmitting device A / receiving device B that transmits and receives a modulated signal by cable broadcasting.
  • a server workstation etc.
  • Client television receiver, personal computer, smart phone etc.
  • VOD Video On Demand
  • video sharing service using the Internet is a transmitting device for transmitting and receiving modulated signals by communication.
  • a / reception device B usually, either wireless or wired is used as a transmission medium in a LAN, and wired is used as a transmission medium in a WAN.
  • the personal computer includes a desktop PC, a laptop PC, and a tablet PC.
  • the smartphone also includes a multi-function mobile phone terminal.
  • the video sharing service client has a function of encoding a moving image captured by the camera and uploading it to the server. That is, the client of the video sharing service functions as both the transmission device A and the reception device B.
  • FIG. 46A is a block diagram showing a configuration of a recording apparatus C in which the above-described moving picture decoding apparatus 1 is mounted.
  • the recording apparatus C encodes a moving image to obtain encoded data, and writes the encoded data obtained by the encoding unit C1 to the recording medium M.
  • the moving image encoding device 2 described above is used as the encoding unit C1.
  • the recording medium M may be of a type built in the recording device C, such as (1) HDD (Hard Disk Drive) or SSD (Solid State Drive), or (2) SD memory. It may be of the type connected to the recording device C, such as a card or USB (Universal Serial Bus) flash memory, or (3) DVD (Digital Versatile Disc) or BD (Blu-ray Disc: registration) (Trademark) or the like may be mounted on a drive device (not shown) built in the recording apparatus C.
  • the recording apparatus C also serves as a moving image supply source to be input to the encoding unit C1, a camera C3 that captures moving images, an input terminal C4 for inputting moving images from the outside, and reception for receiving moving images.
  • a unit C5 and an image processing unit C6 that generates or processes an image may be further provided.
  • FIG. 46A illustrates a configuration in which the recording apparatus C includes all of these, but a part of the configuration may be omitted.
  • the receiving unit C5 may receive an unencoded moving image, or receives encoded data encoded by a transmission encoding method different from the recording encoding method. You may do. In the latter case, a transmission decoding unit (not shown) that decodes encoded data encoded by the transmission encoding method may be interposed between the reception unit C5 and the encoding unit C1.
  • Examples of such a recording device C include a DVD recorder, a BD recorder, and an HD (Hard Disk) recorder (in this case, the input terminal C4 or the receiving unit C5 is a main source of moving images).
  • a camcorder in this case, the camera C3 is a main source of moving images
  • a personal computer in this case, the receiving unit C5 or the image processing unit C6 is a main source of moving images
  • a smartphone this In this case, the camera C3 or the receiving unit C5 is a main source of moving images).
  • FIG. 46 (b) is a block diagram showing the configuration of the playback device D on which the above-described video decoding device 1 is mounted.
  • the playback device D obtains a moving image by decoding the read data D1 read from the read data D and the read data read by the read unit D1.
  • the moving picture decoding apparatus 1 described above is used as the decoding unit D2.
  • the recording medium M may be of a type built in the playback device D such as (1) HDD or SSD, or (2) such as an SD memory card or USB flash memory. It may be of a type connected to the playback device D, or (3) may be loaded into a drive device (not shown) built in the playback device D, such as DVD or BD. Good.
  • the playback device D has a display D3 for displaying a moving image, an output terminal D4 for outputting the moving image to the outside, and a transmitting unit for transmitting the moving image as a supply destination of the moving image output by the decoding unit D2.
  • D5 may be further provided.
  • FIG. 46B illustrates a configuration in which the playback apparatus D includes all of these, but a part of the configuration may be omitted.
  • the transmission unit D5 may transmit a non-encoded moving image, or transmits encoded data encoded by a transmission encoding method different from the recording encoding method. You may do. In the latter case, an encoding unit (not shown) that encodes a moving image with a transmission encoding method may be interposed between the decoding unit D2 and the transmission unit D5.
  • Examples of such a playback device D include a DVD player, a BD player, and an HDD player (in this case, an output terminal D4 to which a television receiver or the like is connected is a main moving image supply destination).
  • a television receiver in this case, the display D3 is a main destination of moving images
  • a desktop PC in this case, the output terminal D4 or the transmission unit D5 is a main destination of moving images
  • Laptop type or tablet type PC in this case, display D3 or transmission unit D5 is the main supply destination of moving images
  • smartphone in this case, display D3 or transmission unit D5 is the main supply destination of moving images
  • Digital signage also referred to as an electronic signboard or an electronic bulletin board, and the display D3 or the transmission unit D5 is the main supply destination of moving images
  • Digital signage also referred to as an electronic signboard or an electronic bulletin board, and the display D3 or the transmission unit D5 is the main supply destination of moving images
  • the adaptive filter 70 and the adaptive offset filter 80 (80 ′) are realized by hardware by a logic circuit formed on an integrated circuit (IC chip). Alternatively, it may be realized by software using a CPU (central processing unit).
  • the moving picture decoding apparatus 1 and the moving picture encoding apparatus 2 include a CPU that executes instructions of a control program that realizes each function, a ROM (read only memory) that stores the program, and a RAM that expands the program. (Random access memory), a storage device (recording medium) such as a memory for storing the program and various data.
  • An object of the present invention is to provide a computer with program codes (execution format program, intermediate code program, source program) of control programs for the video decoding device 1 and the video encoding device 2 which are software for realizing the functions described above.
  • a readable recording medium is supplied to the moving picture decoding apparatus 1 and the moving picture encoding apparatus 2, and the computer (or CPU or MPU (micro processing unit)) is recorded on the recording medium. This can also be achieved by reading out and executing.
  • Examples of the recording medium include tapes such as magnetic tapes and cassette tapes, magnetic disks such as floppy (registered trademark) disks / hard disks, and CD-ROMs (compact disc read-only memory) / MO discs (magneto-optical discs).
  • IC cards including memory cards
  • EPROM Erasable programmable read-only memory
  • EEPROM electrically erasable and programmable read-only memory
  • semiconductor memory such as flash ROM, or PLD (Programmable logic device) or FPGA (Field Programmable Gate Array) Logic circuits can be used.
  • the moving picture decoding apparatus 1 and the moving picture encoding apparatus 2 may be configured to be connectable to a communication network, and the program code may be supplied via the communication network.
  • the communication network is not particularly limited as long as it can transmit the program code.
  • the Internet an intranet, an extranet, a LAN (local area network), an ISDN (integrated services network), a VAN (value-added network), a CATV (community antenna network / cable network), a virtual private network (virtual private network) network), telephone line network, mobile communication network, satellite communication network, and the like.
  • the transmission medium constituting the communication network may be any medium that can transmit the program code, and is not limited to a specific configuration or type.
  • IEEE institute-of-electrical-and-electronic-engineers 1394, USB, power line carrier, cable TV line, telephone line, ADSL (asymmetric-digital-subscriber-loop) line, etc. wired such as IrDA (infrared-data association) or remote control , Bluetooth (registered trademark), IEEE802.11 wireless, HDR (high data rate), NFC (Near field communication), DLNA (Digital Living Network Alliance), mobile phone network, satellite line, terrestrial digital network, etc. Is possible.
  • the present invention can also be realized in the form of a computer data signal embedded in a carrier wave in which the program code is embodied by electronic transmission.
  • the present invention can be suitably used for an image filter that performs offset filtering on image data. Further, the present invention can be suitably applied to a decoding device that decodes encoded data and an encoding device that encodes encoded data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 適応オフセットフィルタ(60)は、入力画像の各画素値にオフセットを加算するものであり、オフセットタイプ指定情報を参照し、入力画像の対象単位領域におけるオフセット属性を設定し、設定されたオフセット属性に含まれるオフセット値域に応じたビット幅を有するオフセットを復号し、上記入力画像の各画素値に上記オフセットを加算する。

Description

オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造
 本発明は、画像のフィルタリングを行う画像フィルタ装置に関する。また、画像フィルタによって参照されるオフセットを復号するオフセット復号装置、および、画像フィルタによってよって参照されるオフセットを符号化するオフセット符号化装置に関する。また、符号化データのデータ構造に関する。
 動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置(符号化装置)、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置(復号装置)が用いられている。具体的な動画像符号化方式としては、例えば、H.264/MPEG-4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、および、HM(HEVC TestModel)ソフトウェアに採用されている方式などが挙げられる。
 このような符号化方式において、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるスライス、スライスを分割することにより得られる最大符号化単位(LCU:Largest Coding Unit、ツリーブロックとも呼ばれる)、最大符号化単位を分割することにより得られる符号化単位(CU:Coding Unit、符号化ノードとも呼ばれる)、および、符号化単位を分割することより得られるブロックおよびパーティションからなる階層構造により管理され、多くの場合、ブロックを最小単位として符号化される。
 また、このような符号化方式においては、通常、入力画像を符号化/復号化することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像と入力画像との差分データが符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)と呼ばれる方法が知られている。
 イントラ予測においては、同一フレーム内の局所復号画像に基づいて、当該フレームにおける予測画像が順次生成される。具体的には、イントラ予測においては、通常、予測単位(例えば、ブロック)毎に、予め定められた予測方向(予測モード)群に含まれる予測方向から何れかの予測方向が選択されると共に、局所復号画像における参照画素の画素値を、選択された予測方向に外挿することによって、予測対象領域上の予測画素値が生成される。また、インター予測においては、フレーム全体が復号された参照フレーム(復号画像)内の参照画像に対し、動きベクトルを用いた動き補償を適用することによって、予測対象フレーム内の予測画像が予測単位(例えば、ブロック)毎に生成される。
 非特許文献1および非特許文献2には、復号画像のブロック歪みを低減させるデブロッキングフィルタの後段であって、適応的に決定されたフィルタ係数を用いたフィルタ処理を行う適応的ループフィルタ(「適応フィルタ」とも呼ぶ)の前段に導入された適応的オフセットフィルタ(「適応オフセットフィルタ」とも呼ぶ)が開示されている。この適応オフセットフィルタは、デブロッキングフィルタから出力される画像の各画素値に対して、適応的に設定されたオフセットを加算するというものである。
 このような適応オフセットフィルタを備えることによって、ブロック歪みをより効果的に抑制することができる。
「JCTVC-D122」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 4th Meeting: Daegu, KR, 01/2011 「JCTVC-E049」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 5th Meeting: Geneva, CH, 03/2011
 しかしながら、従来の適応オフセットフィルタに用いられるオフセットは、値の範囲が設定されておらず、ビット数が大きいため、オフセットを格納しておくための大きなメモリサイズが必要になるという問題を有していた。
 本発明は、上記の問題に鑑みてなされたものであり、メモリサイズの増大を抑制しつつ、ブロック歪みを低減することのできる画像フィルタ装置を実現することにある。
 上記の問題を解決するために、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、符号化データを参照し、オフセット値域を設定するオフセット属性設定手段と、上記設定されたオフセット値域に制限されたフセットを復号するオフセット復号手段と、上記入力画像の各画素値に上記オフセットを加算するフィルタ手段とを備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、上記オフセット属性設定手段により、オフセット値域を設定し、設定されたオフセット値域に応じたビット幅を有するオフセットを上記オフセット復号手段により復号するので、オフセットを格納しておくためのメモリサイズを効果的に削減することができる。
 したがって、上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。
 また、本発明に係るオフセット復号装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを復号するオフセット復号装置であって、各オフセット残差を、符号化データから復号するオフセット残差復号手段と、各オフセットの予測値を、復号済みのオフセットから導出する予測値導出手段と、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、を備えていることを特徴としている。
 上記のように構成されたオフセット復号装置によれば、各オフセット残差を、符号化データから復号するオフセット残差復号手段と、各オフセットの予測値を、復号済みのオフセットから導出する予測値導出手段と、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、を備えているので、各オフセットをそのまま符号化する場合に比べて、符号量の少ない符号化データから、オフセットを適切に復号することができる。
 また、本発明に係る画像フィルタ装置は、入力画像に作用する画像フィルタ装置であって、入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、上記算出手段によって参照される画素値、または、上記算出手段によって算出された差分値を所定のシフト値だけ右ビットシフトするビットシフト手段と、上記ビットシフト手段によって右ビットシフトされた差分値と0との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、右ビットシフトされた差分値と0との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類し、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するので、クラス分類処理が、ノイズの影響を受けにくくなり符号化効率が向上する。
 また、本発明に係る画像フィルタ装置は、入力画像に作用する画像フィルタ装置であって、入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、上記算出手段によって算出された差分値と、予め定められた第1及び第2の閾値との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えていることを特徴としている。
 上記のように構成された画像フィルタ装置は、上記算出手段によって算出された差分値と、予め定められた第1及び第2の閾値との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類し、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するので、クラス分類処理が、ノイズの影響を受けにくくなり符号化効率が向上する。
 また、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像に作用する画像フィルタ装置であって、第1及び第2のオフセットタイプのうち、入力画像における対象画素を含む対象単位領域が属するオフセットタイプを決定する決定手段と、上記対象単位領域の属するオフセットタイプ、及び上記対象画素の画素値に応じて、上記対象画素を、オフセットを加算しないオフセットクラス、及びオフセットを加算する複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記対象単位領域の属するオフセットタイプ及び上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えており、上記分類手段は、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類する、ことを特徴としている。
 上記のように構成された画像フィルタ装置によれば、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類するので、ブロックノイズを効果的に除去することができる。したがって、上記の構成によれば、符号化効率の向上を図ることができる。
 また、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定する決定手段と、上記オフセットタイプに応じて、異なるビット幅を有するオフセットを決定すると共に、該オフセットを符号化するオフセット符号化手段と、上記入力画像の各画素値に上記決定されたオフセットを加算するフィルタ手段とを備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定し、決定されたオフセットタイプに応じて、異なるビット幅を有するオフセットを決定し、決定されたオフセットを、上記入力画像の各画素に加算する。また、決定されたオフセットを符号化する。
 したがって、上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。また、上記の構成によれば、符号化データの符号量が削減されるので、符号化効率が向上する。
 また、本発明に係るオフセット符号化装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを符号化するオフセット符号化装置であって、各オフセットの予測値を、符号化済みのオフセットから導出する予測値導出手段と、各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段と、を備えていることを特徴としている。
 上記のように構成されたオフセット符号化装置によれば、各オフセットの予測値を、符号化済みのオフセットから導出する予測値導出手段と、各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段とを備えているので、符号化データの符号量を削減することができる。
 また、本発明に係る符号化データのデータ構造は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタによって参照される符号化データのデータ構造であって、各単位領域が属するオフセットタイプを指定するオフセットタイプ指定情報と、該オフセットタイプに応じて異なるビット幅を有するオフセットとを含んでおり、上記画像フィルタは、上記符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号することを特徴としている。
 上記のように構成された符号化データは、オフセットタイプに応じて異なるビット幅を有するオフセットを含んでいるので、符号化データの符号量が削減される。また、上記符号化データを復号する画像フィルタは、上記オフセットタイプ指定情報を参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号するので、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。
 なお、上記オフセットタイプ指定情報は、上記入力画像毎に定められているものであってもよいし、上記単位領域毎に定められているものであってもよい。また、上記入力画像の所定のセット毎に定められているものであってもよいし、上記単位領域の所定のセット毎に定められているものであってもよい。
 以上のように、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、符号化データを参照し、オフセット値域を設定するオフセット属性設定手段と、上記設定されたオフセット値域に制限されたオフセットを復号するオフセット復号手段と、上記入力画像の各画素値に上記オフセットを加算するフィルタ手段とを備えている。
 また、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定する決定手段と、上記オフセットタイプに応じて、異なるビット幅を有するオフセットを決定すると共に、該オフセットを符号化するオフセット符号化手段と、上記入力画像の各画素値に上記決定されたオフセットを加算するフィルタ手段とを備えている。
 また、本発明に係る符号化データのデータ構造は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタによって参照される符号化データのデータ構造であって、各単位領域が属するオフセットタイプを指定するオフセットタイプ指定情報と、該オフセットタイプに応じて異なるビット幅を有するオフセットとを含んでおり、上記画像フィルタは、上記符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号する。
 上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、画像フィルタに適切なオフセットフィルタ処理を行わせることができる。
本発明の第1の実施形態に係る適応オフセットフィルタの構成を示すブロック図である。 本発明の第1の実施形態に係る動画像符号化装置によって生成され、動画像復号装置によって復号される符号化データのデータ構成を示す図であり、(a)~(d)は、それぞれ、ピクチャレイヤ、スライスレイヤ、ツリーブロックレイヤ、およびCUレイヤを示しており、(e)はリーフでないQAOUに関するQAOU情報の構成を示しており、(f)はリーフのQAOUに関するQAOU情報の構成を示している。 本発明の第1の実施形態に係る符号化データのオフセット情報OIに含まれる各シンタックスを示す図である。 本発明の第1の実施形態に係るオフセット単位の分割の態様を示す図であり、(a)はsao_curr_depth=0、(b)はsao_curr_depth=1、(c)はsao_curr_depth=2、(d)はsao_curr_depth=3、(e)はsao_curr_depth=4の場合を示している。 本発明の第1の実施形態に係る動画像復号装置の構成を示すブロック図である。 本発明の第1の実施形態を説明するための図であって、(a)は、対象の処理単位を構成する分割深度3の各QAOMUと各QAOMUに割り付けられたQAOUインデックスとを示しており、(b)は、QAOUインデックス0~9の各々に関連付けられたオフセットタイプ及び各オフセットタイプにおいて選択可能な各クラスに関するオフセットを示している。 本発明の第1の実施形態において、対象の処理単位に含まれるQAOMUに付されたQAOMU番号の一例を示す図であって、(a)は、分割深度が0であるQAOMUに付されたQAOMU番号を示しており、(b)は、分割深度が1であるQAOMUに付されたQAOMU番号を示しており、(c)は、分割深度が2であるQAOMUに付されたQAOMU番号を示しており、(d)は、分割深度が3であるQAOMUに付されたQAOMU番号を示しており、(e)は、分割深度が4であるQAOMUに付されたQAOMU番号を示している。 本発明の第1の実施形態に係る適応オフセットフィルタ処理部による処理の流れを示すフローチャートである。 本発明の第1の実施形態に係る適応フィルタの備えるオフセット属性設定部によって設定されるオフセットのビット深度及びシフト値の例を、画素のビット深度と共に示す図であって、(a)~(d)は、それぞれ、パターンS1~S4に対応する例を示しており、(e)は、(d)において、STEP=2ととったの場合を示している。 本発明の第1の実施形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)~(d)は、それぞれ、sao_type_idx=1~4のときに参照される画素を示している。 本発明の第1の実施形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)は、処理対象画素xの画素値pic[x]と画素aまたはbの画素値との大小関係を示すグラフ、及びその大小関係に応じた関数Signの値を示しており、(b)は、処理対象画素xの画素値と、画素a及びbの画素値との大小関係を示すグラフ、及びその大小関係に応じたEgdeTypeの値を示しており、(c)は、b)に示した各グラフと、class_idxとの対応を示しており、(d)は、EgdeTypeからclass_idxへの変換を表す変換テーブルを示している。 本発明の第1の実施形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)は、sao_type_idx=5であるときのクラス分類を概略的に示しており、(b)sao_type_idx=6であるときのクラス分類を概略的に示しており、(c)は、バンドオフセットが指定された場合のクラス分類の一例を示す表である。 本発明の第1の実施形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、バンドオフセットが指定された場合のクラス分類の他の例を示す表である。 本発明の第1の実施形態に係る動画像符号化装置の構成を示すブロック図である。 本発明の第1の実施形態に係る動画像符号化装置の備える適応オフセットフィルタの構成を示すブロック図である。 本発明の第1の実施形態に係る動画像符号化装置の備える適応オフセットフィルタのオフセット算出部による処理の流れを示すフローチャートである。 本発明の第1の実施形態に係る動画像符号化装置の備える適応オフセットフィルタのオフセット情報選択部による処理の流れを示すフローチャートである。 本発明の第1の実施形態に係る動画像符号化装置の備える適応オフセットフィルタのオフセット情報選択部による処理を説明するための図であって、(a)は、分割深度が0及び1である場合の分割の態様を示しており、(b)は、分割深度が1である場合の分割の態様を示しており、(c)は、分割深度が2である場合の分割の態様を示しており、(d)は、オフセット情報選択部によって決定された分割の一例を示している。 本発明の第2の実施形態に係る動画像復号装置の備える適応オフセットフィルタの構成を示すブロック図である。 本発明の第2の実施形態に係る適応オフセットフィルタを説明するための図であって、(a)は、関数merge_tbl[sao_type_idx]の第1の具体例を示しており、(b)は、関数merge_tbl[sao_type_idx]の第2の具体例を示している。 本発明の第2の実施形態に係る動画像符号化装置の備える適応オフセットフィルタの構成を示すブロック図である。 本発明の第3の実施の形態に係る適応オフセットフィルタの構成を示すブロック図である。 上記第3の実施の形態に係る符号化データのオフセット情報OIのシンタクスを示す図である。 上記第3の実施の形態を説明するための図であって、(a)は、対象の処理単位を構成する分割深度3の各QAOMUと各QAOMUに割り付けられたQAOUインデックスとを示す図であり、(b)は、QAOUインデックス0~9の各々に関連付けられたオフセットタイプおよび各オフセットタイプにおいて選択可能な各クラスに関するオフセットを示す図である。 上記第3の実施の形態に係るオフセット情報復号部が用いる変換テーブルを示す図である。 上記第3の実施の形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)は、処理対象画素xの画素値pix[x]と画素aまたはbの画素値との大小関係を示すグラフ、およびその大小関係に応じた関数Signの値を示す図であり、(b)は、処理対象画素xの画素値と、画素aおよびbの画素値との大小関係を示すグラフ、およびその大小関係に応じたEgdeTypeの値を示す図であり、(c)は、(b)に示した各グラフと、class_idxとの対応を示す図であり、(d)~(f)は、EgdeTypeからclass_idxへの変換を表す変換テーブルを示す図である。 上記第3の実施の形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)は、sao_type_idx=5であるときのクラス分類を概略的に示す図であり、(b)sao_type_idx=6であるときのクラス分類を概略的に示す図である。 上記第3の実施の形態に係る適応オフセットフィルタによるオフセット処理を説明するための図であって、(a)は処理対象のQAOUの階層の深度が閾値よりも小さい場合のクラス分類を概略的に示す図であり、(b)は処理対象のQAOUの階層の深度が閾値以上の場合のクラス分類を概略的に示す図である。 上記第3の実施の形態において、バンドオフセットが指定された場合のクラス分類の一例を示す図であり、(a)は、処理対象のQAOUの階層の深度が閾値よりも小さい場合のクラス分類の一例を示す図であり、(b)は処理対象のQAOUの階層の深度が閾値以上の場合のクラス分類の一例を示す図である。 上記第3の実施形態に係る動画像符号化装置の備える適応オフセットフィルタの構成を示すブロック図である。 上記第3の実施の形態において、QAOUインデックスが「x」のQAOUについて、オフセットタイプそれぞれについての2乗誤差を算出する概要を示す図である。 本発明に係る第4の実施の形態において、画素値によってEOとBOとを切り換える構成を説明するための図であり、(a)は、画素値によってEOとBOとを切り換える構成の概要を説明するための図であり、(b)は、具体的な切り換えの値を説明するための図である、(c)は、オフセット情報格納部621に格納されるリストメモリの内容を示す図である。 本発明に係る第5の実施の形態において、EOのタイプを水平方向に限定する場合を説明するための図であり、(a)は効果の概要を説明するための図であり、(b)は水平方向の画素の位置を説明するための図であり、(c)は(b)とは異なる状態を説明するための図であり、(d)は(c)の効果を説明するための図である。 上記第5の実施の形態において、EOのタイプを水平方向に限定する場合を説明するための図であり、(a)および(b)は参照する画素が非対称の位置にある場合を示す図であり、(c)は水平エッジの概要を示す図である。 本発明に係る第6の実施の形態において、オフセットの精度を向上させる場合についての概要を示す図である。 上記第6の実施の形態において、クラス分類を細分化する場合の概要を示す図であり、(a)は変換テーブルを示す図であり、(b)~(d)はクラス分割を説明するための図である。 上記第6の実施の形態において、色差に応じてクラス分類を行う場合を説明するための図であり、(a)は無彩色の画素値を考慮したクラス分類を説明するための図であり、(b)は無彩色の画素値を挟む2つの値域で非対称なクラス分類を説明するための図であり、(c)はおよび(d)は色彩チャネル(CrまたはCb)毎に異なるクラス分類を説明するための図であり、(e)はBOのクラス分類を1つにする場合を説明するための図である。 本発明に係る第7の実施の形態において、オフセット情報復号部の構成を示すブロック図である。 上記第7の実施の形態において、分類される画素がないクラスがある場合の概要を示す図である。 上記第7の実施の形態において、予測候補フラグを用いる場合のシンタクスを示す図である。 上記第5の実施の形態に係るオフセット情報復号部の構成を示すブロック図である。 (a)は、上記第5の実施の形態に係る使用オフセットタイプ選択部の構成を示すブロック図であり、(b)は、別の使用オフセットタイプ選択部の構成を示すブロック図である。 上記第5の実施の形態に係るクラス分類部の構成を示すブロック図である。 上記第3の実施形態に係るオフセット情報およびQAOU情報のシンタクスを示す図であり、(a)は、オフセット情報のシンタクスを示す図であり、(b)は、QAOU情報のシンタクスを示す図であり、(c)は、(a)および(b)に示すシンタクスを呼び出す適応オフセットフィルタ全体のシンタクスを示す図である。 動画像復号装置および動画像符号化装置が、動画像の送受信に利用できることを説明するための図であり、(a)は、動画像符号化装置を搭載した送信装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した受信装置の構成を示したブロック図である。 動画像復号装置および動画像符号化装置が、動画像の記録および再生に利用できることを説明するための図であり、(a)は、動画像符号化装置2を搭載した記録装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した再生装置の構成を示したブロックである。
 〔実施の形態1〕
 (符号化データ#1)
 本実施形態に係る動画像符号化装置2及び動画像復号装置1の詳細な説明に先立って、動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データ#1のデータ構造について説明を行う。
 図2は、符号化データ#1のデータ構造を示す図である。符号化データ#1は、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
 符号化データ#1におけるピクチャレイヤ以下の階層の構造を図2に示す。図2の(a)~(d)は、それぞれ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤ、ツリーブロックTBLKに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
  (ピクチャレイヤ)
 ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図2の(a)に示すように、ピクチャヘッダPH、及び、スライスS1~SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
 なお、以下、スライスS1~SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化データ#1に含まれるデータであって、添え字を付している他のデータについても同様である。
 ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報(entropy_coding_mode_flag)は、ピクチャヘッダPHに含まれる符号化パラメータの一例である。
 entropy_coding_mode_flagが0の場合、当該ピクチャPICTは、CAVLC(Context-based Adaptive Variable Length Coding)によって符号化されている。また、entropy_coding_mode_flagが1である場合、当該ピクチャPICTは、CABAC(Context-based Adaptive Binary Arithmetic Coding)によって符号化されている。
 なお、ピクチャヘッダPHは、ピクチャー・パラメーター・セット(PPS:Picture Parameter Set)とも称される。
  (スライスレイヤ)
 スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図2の(b)に示すように、スライスヘッダSH、及び、ツリーブロックTBLK1~TBLKNC(NCはスライスSに含まれるツリーブロックの総数)のシーケンスを含んでいる。
 スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
 スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
 また、スライスヘッダSHには、動画像復号装置1の備える適応フィルタによって参照されるフィルタパラメータFPが含まれている。なお、フィルタパラメータFPは、ピクチャヘッダPHに含まれる構成としてもよい。
  (ツリーブロックレイヤ)
 ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。なお、ツリーブロックのことを最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
 ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU1~CUNL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。
 ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのパーティションに分割される。
 ツリーブロックTBLKの上記パーティションは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
 以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するパーティションを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
 つまり、符号化単位情報(以下、CU情報と称する)CU1~CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
 また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
 なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのパーティション)のサイズの縦横とも半分である。
 また、各符号化ノードのとり得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBLKのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTBLK以下の階層における符号化ノードは、3種類のサイズ、すなわち、64×64画素、32×32画素、および16×16画素の何れかをとり得る。
  (ツリーブロックヘッダ)
 ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図2の(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
 ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
 なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグ(split_coding_unit_flag)の集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
 また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp-qp’である。
  (CUレイヤ)
 CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
 ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
 予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
 予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
 予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
 イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
 また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、N×2N、および、N×Nなどがある。
 また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
 変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
 変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
  (CU情報のデータ構造)
 続いて、図2の(d)を参照しながらCU情報CUに含まれるデータの具体的な内容について説明する。図2の(d)に示すように、CU情報CUは、具体的には、スキップフラグSKIP、PT情報PTI、および、TT情報TTIを含む。
 スキップフラグSKIPは、対象のPUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、そのCU情報CUにおけるPT情報PTI、および、TT情報TTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
 PT情報PTIは、CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、図2の(d)に示すように、予測タイプ情報PType、および、予測情報PInfoを含んでいる。
 予測タイプ情報PTypeは、対象PUについての予測画像生成方法として、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
 予測情報PInfoは、予測タイプ情報PTypeが何れの予測方法を指定するのかに応じて、イントラ予測情報、または、インター予測情報より構成される。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
 また、予測情報PInfoは、対象PUの形状、サイズ、および、位置を指定する情報が含まれる。上述のとおり予測画像の生成は、PUを単位として行われる。予測情報PInfoの詳細については後述する。
 TT情報TTIは、CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
 TT情報TTIは、図2の(d)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、および、量子化予測残差QD1~QDNT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
 TT分割情報SP_TTは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象となるノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。
 また、例えば、CUのサイズが、64×64の場合、分割により得られる各TUは、32×32画素から2×2画素までのサイズをとり得る。
 各量子化予測残差QDは、動画像符号化装置2が以下の処理1~3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
 処理1:符号化対象画像から予測画像を減算した予測残差をDCT変換(Discrete Cosine Transform)する;
 処理2:処理1にて得られた変換係数を量子化する;
 処理3:処理2にて量子化された変換係数を可変長符号化する;
 なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
  (予測情報PInfo)
 上述のとおり、予測情報PInfoには、インター予測情報およびイントラ予測情報の2種類がある。
 インター予測情報には、動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータが含まれる。より具体的には、インター予測情報には、対象CUの各インターPUへの分割パターンを指定するインターPU分割情報、および、各インターPUについてのインター予測パラメータが含まれる。
 インター予測パラメータには、参照画像インデックスと、推定動きベクトルインデックスと、動きベクトル残差とが含まれる。
 一方、イントラ予測情報には、動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータが含まれる。より具体的には、イントラ予測情報には、対象CUの各イントラPUへの分割パターンを指定するイントラPU分割情報、および、各イントラPUについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラPUについてのイントラ予測方法(予測モード)を指定するためのパラメータである。
  (オフセット単位)
 また、本実施の形態において、各ピクチャまたは各スライスは、4分木構造によって複数のオフセット単位(QAOU:Quad Adaptive Offset Unitとも呼ぶ)に再帰的に分割される。ここで、QAOUとは、本実施の形態に係る適応オフセットフィルタによるオフセットフィルタ処理の処理単位である。
 図2(e)~(f)に示すように、各QAOUに関する情報であるQAOU情報は、自身が更に分割されるのか否かを示すsao_split_flagを含んでいる。sao_split_flagは、より具体的には、後述する引数(sao_curr_depth、ys、xs)によって指定されるものであり、sao_split_flag[sao_curr_depth][ys][xs]とも表記する。
 あるQAOUに含まれるsao_split_flagが、該QAOUがさらに分割されるものであることを示している場合(すなわち、当該QAOUがリーフではない場合)には、図2(e)に示すように、該QAOUに関するQAOU情報には、該QAOUに含まれる複数のQAOUの各々に関するQAOU情報が含まれる。
 一方で、あるQAOUに含まれるsao_split_flagが、該QAOUがそれ以上分割されないものであることを示している場合(すなわち、当該QAOUがリーフである場合)には、図2(f)に示すように、該QAOUに関するQAOU情報には、該QAOUに関するオフセット情報OIが含まれる。また、オフセット情報OIには、図2(f)に示すように、オフセットタイプを指定するオフセットタイプ指定情報OTI、及び、オフセットタイプに応じて定まるオフセット群が含まれている。さらに、図2(f)に示すように、オフセット群には、複数のオフセットが含まれている。
 なお、符号化データ中のオフセットは量子化された値である。また、符号化データ中のオフセットは、何らかの予測、例えば線形予測を用いることによって得られる予測残差であっても良い。また、一定の単位領域毎に後述する画素ビット深度が異なって指定される場合、画素ビット深度に応じてオフセットのビット深度、オフセット値域、及びシフト値を変更する本実施の形態においては、オフセットタイプ指定情報OTIに処理対象領域の画素ビット深度を含めることも可能である。
 オフセット情報OIについて、参照する図面を代えて説明すれば以下の通りである。
 図3は、オフセット情報OI(図3においてsao_offset_param()と表記)に含まれる各シンタックスを示す図である。
 図3に示すように、オフセット情報OIには、シンタックスsao_type_idx[sao_curr_depth][ys][xs]が含まれている。また、sao_type_idx[sao_curr_depth][ys][xs]が0でない場合、オフセット情報OIには、sao_offset[sao_curr_depth][ys][xs][i]が含まれている。
 (sao_curr_depth、ys、xs)
 sao_type_idx及びsao_offsetの引数であるsao_curr_depthは、QAOUの分割深度を表すインデックスであり、ys及びxsは、それぞれ、QAOU(または後述するQAOMU)のy方向の位置及びx方向の位置を表すためのインデックスである。
 図4(a)~(e)は、sao_curr_depthの値に応じたQAOUの分割の態様を示す図であり、(a)はsao_curr_depth=0、(b)はsao_curr_depth=1、(c)はsao_curr_depth=2、(d)はsao_curr_depth=3、(e)はsao_curr_depth=4の場合を示している。図4(a)~(e)に示すように、各QAOUは、sao_curr_depth、及び(xs、ys)によって指定される。
 また、図4(a)に示すように、sao_curr_depth=0であるとき、xs及びysはそれぞれ0であり、図4(b)に示すように、sao_curr_depth=1であるとき、xs及びysはそれぞれ0及び1の何れかの値をとり得る。また、図4(c)に示すように、sao_curr_depth=2であるとき、xs及びysはそれぞれ0、1、2及び3の何れかの値をとり得る。一般に、与えられたsao_curr_depthに対して、xs及びysは、それぞれ0~2sao_curr_depth-1の値をとり得る。
  (sao_type_idx)
 sao_type_idx[sao_curr_depth][ys][xs]は、上述のオフセットタイプ指定情報OTIに対応するものであり、各QAOUについてのオフセットタイプを指定するためのシンタックスである。以下では、sao_type_idxのことを単にオフセットタイプと呼称することもある。
 本実施の形態において、sao_type_idx[sao_curr_depth][ys][xs]は、0から6までの整数値をとる。sao_type_idx[sao_curr_depth][ys][xs]=0は、対象QAOUにおけるオフセットフィルタ前画像(例えば、後述するデブロック済復号画像P_DB)に対して、オフセットフィルタ処理を行わないことを示しており、sao_type_idx[sao_curr_depth][ys][xs]=1~4は、対象QAOUにおけるオフセットフィルタ前画像に対して、エッジオフセット処理を行うことを示しており、sao_type_idx[sao_curr_depth][ys][xs]=5~6は、対象QAOUにおけるオフセットフィルタ前画像に対して、バンドオフセット処理を行うことを示している。エッジオフセット処理及びバンドオフセット処理の具体的内容については後述する。
  (sao_offset)
 sao_offset[sao_curr_depth][ys][xs][i]は、本実施の形態に係る適応オフセットフィルタによるオフセットフィルタ処理において、対象QAOUに含まれる各画素に加算されるオフセットの具体的な値を表すシンタックスである。本実施の形態では、sao_offsetのことを単にオフセットと呼称することもある。
 sao_offset[sao_curr_depth][ys][xs][i]は、引数sao_curr_depth、ys及びxsに加えて、インデックスiによって指定される。ここで、インデックスiは、クラスを指定するためのインデックスであり、class_idxとも表記する。インデックスiは、sao_type_idx[sao_curr_depth][ys][xs]の値が1~4の何れかである場合(すなわち、エッジオフセットの場合)、i=0~4の何れかの整数値をとる。また、sao_type_idx[sao_curr_depth][ys][xs]の値が5~6の何れかである場合(すなわち、バンドオフセットの場合)、i=0~16の何れかの整数値をとる。なお、後述するように、何れの場合もi=0は、オフセットを加算しないことを表している。
 後述するように、本実施の形態に係る適応オフセットフィルタは、対象QAOUに含まれる対象画素を上記複数のクラスの何れかに分類し、該対象画素に対して、該対象画素が分類されたクラスについてのオフセットOffsetを加算する。
 また、図3に示したDescriptor(記述子)ue(v)は、この記述子に関連付けられたシンタックスは符号なしの数値であり、値が可変長符号化されることを示しており、se(v)は、この記述子に関連付けられたシンタックスは符号付きの数値であり、符号と絶対値に分けて可変長符号化されることを意味している。
 (動画像復号装置1)
 以下では、本実施の形態に係る動画像復号装置1について図1及び図5~図13を参照して説明する。動画像復号装置1は、その一部に、H.264/MPEG-4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、及び、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。
 図5は、動画像復号装置1の構成を示すブロック図である。図5に示すように、動画像復号装置1は、可変長符号復号部13、動きベクトル復元部14、バッファメモリ15、インター予測画像生成部16、イントラ予測画像生成部17、予測方式決定部18、逆量子化・逆変換部19、加算器20、デブロッキングフィルタ41、適応フィルタ50、及び適応オフセットフィルタ60を備えている。動画像復号装置1は、符号化データ#1を復号することによって動画像#2を生成するための装置である。
 可変長符号復号部13は、各パーティションに関する予測パラメータPPを、符号化データ#1から復号する。すなわち、インター予測パーティションに関しては、参照画像インデックスRI、推定動きベクトルインデックスPMVI、及び、動きベクトル残差MVDを符号化データ#1から復号し、これらを動きベクトル復元部14に供給する。一方、イントラ予測パーティションに関しては、(1)パーティションのサイズを指定するサイズ指定情報、および、(2)予測インデックスを指定する予測インデックス指定情報を符号化データ#1から復号し、これをイントラ予測画像生成部17に供給する。また、可変長符号復号部13は、CU情報を符号化データから復号し、これを予測方式決定部18に供給する(図示省略)。更に、可変長符号復号部13は、各ブロックに関する量子化予測残差QD、及び、そのブロックを含むツリーブロックに関する量子化パラメータ差分Δqpを符号化データ#1から復号し、これらを逆量子化・逆変換部19に供給する。また、可変長符号復号部13は、符号化データ#1からQAOU情報を抽出し、抽出したQAOU情報を適応オフセットフィルタ60に供給する。
 動きベクトル復元部14は、各インター予測パーティションに関する動きベクトルmvを、そのパーティションに関する動きベクトル残差MVDと、他のパーティションに関する復元済みの動きベクトルmv’とから復元する。具体的には、(1)推定動きベクトルインデックスPMVIにより指定される推定方法に従って、復元済みの動きベクトルmv’から推定動きベクトルpmvを導出し、(2)導出した推定動きベクトルpmvと動きベクトル残差MVDとを加算することによって動きベクトルmvを得る。なお、他のパーティションに関する復元済みの動きベクトルmv’は、バッファメモリ15から読み出すことができる。動きベクトル復元部14は、復元した動きベクトルmvを、対応する参照画像インデックスRIと共に、インター予測画像生成部16に供給する。なお、双方向予測(重み付き予測)を行うインター予測パーティションについては、復元した2つの動きベクトルmv1及びmv2を、対応する参照画像インデックスRI1及びRI2と共に、インター予測画像生成部16に供給する。
 インター予測画像生成部16は、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル復元部14から供給された動きベクトルmvを用いて、同じく動きベクトル復元部14から供給された参照画像インデックスRIによって指定されるフィルタ済復号画像P_FL’から動き補償画像mcを生成する。ここで、フィルタ済復号画像P_FL’は、既に復号が完了した復号画像Pに対して、デブロッキングフィルタ41によるデブロック処理、適応オフセットフィルタ60によるオフセットフィルタ処理、及び適応フィルタ50による適応的フィルタ処理を施すことによって得られる画像であり、インター予測画像生成部16は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ15から読み出すことができる。インター予測画像生成部16によって生成された動き補償画像mcは、インター予測画像Pred_Interとして予測方式決定部18に供給される。なお、双方向予測(重み付き予測)を行うインター予測パーティションについては、(1)動きベクトルmv1を用いて、参照画像インデックスRI1によって指定されたフィルタ済復号画像P_FL1’から動き補償画像mc1を生成し、(2)動きベクトルmv2を用いて、参照画像インデックスRI2によって指定されたフィルタ済復号画像P_FL2’とから動き補償画像mc2を生成し、(3)動き補償画像mc1と動き補償画像mc2との加重平均にオフセット値を加えることによってインター予測画像Pred_Interを生成する。
 イントラ予測画像生成部17は、各イントラ予測パーティションに関する予測画像Pred_Intraを生成する。具体的には、まず、符号化データ#1から復号された予測モードを参照し、該予測モードを対象パーティションに対して、例えば、ラスタスキャン順に割り付ける。続いて、当該予測モードの示す予測方法に従って、復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部17によって生成されたイントラ予測画像Pred_Intraは、予測方式決定部18に供給される。
 また、イントラ予測画像生成部17は、対象パーティションのサイズ、および、対象パーティションに割り付けられた予測モードを示す情報であるイントラ符号化モード情報IEMを適応フィルタ50に供給する。
 予測方式決定部18は、CU情報に基づいて、各パーティションがインター予測を行うべきインター予測パーティションであるのか、イントラ予測を行うべきイントラ予測パーティションであるのかを決定する。そして、前者の場合には、インター予測画像生成部16にて生成されたインター予測画像Pred_Interを予測画像Predとして加算器20に供給し、後者の場合には、イントラ予測画像生成部17にて生成されたイントラ予測画像Pred_Intraを予測画像Predとして加算器20に供給する。
 逆量子化・逆変換部19は、(1)量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT係数を逆DCT(Discrete Cosine Transform)変換し、(3)逆DCT変換によって得られた予測残差Dを加算器20に供給する。なお、量子化予測残差QDを逆量子化する際に、逆量子化・逆変換部19は、可変長符号復号部13から供給された量子化パラメータ差分Δqpから量子化ステップQPを導出する。量子化パラメータqpは、直前に逆量子化/逆DCT変換したツリーブロックに関する量子化パラメータqp’に量子化パラメータ差分Δqpを加算することによって導出でき、量子化ステップQPは、量子化ステップqpからQP=2pq/6によって導出できる。また、逆量子化・逆変換部19による予測残差Dの生成は、ブロック(変換単位)を単位として行われる。
 加算器20は、予測方式決定部18から供給された予測画像Predと、逆量子化・逆変換部19から供給された予測残差Dとを加算することによって復号画像Pを生成する。
 デブロッキングフィルタ41は、復号画像Pにおけるブロック境界、またはCU境界を介して互いに隣接する画素の画素値の差が予め定められた閾値よりも小さい場合に、復号画像Pにおける当該ブロック境界、または当該CU境界に対してデブロッキング処理を施すことによって、当該ブロック境界、または当該CU境界付近の画像の平滑化を行う。デブロッキングフィルタ41によりデブロッキング処理が施された画像は、デブロック済復号画像P_DBとして、適応オフセットフィルタ60に出力される。
 適応オフセットフィルタ60は、デブロッキングフィルタ41から供給されるデブロック済復号画像P_DBに対して、符号化データ#1から復号されたオフセットを用いたオフセットフィルタ処理を、QAOUを処理単位として施すことによってオフセットフィルタ済復号画像P_OFを生成する。生成されたオフセットフィルタ済復号画像P_OFは、適応オフセットフィルタ60に供給される。適応オフセットフィルタ60の具体的な構成については、後述するため、ここでは説明を省略する。
 適応フィルタ50は、適応オフセットフィルタ60から供給されるオフセットフィルタ済復号画像P_OFに対して、符号化データ#1から復号されたフィルタパラメータFPを用いたフィルタ処理を施すことによって、フィルタ済復号画像P_FLを生成する。適応フィルタ50によりフィルタ処理が施された画像は、フィルタ済復号画像P_FLとして外部に出力されると共に、可変長符号復号部13によって符号化データから復号されたPOC指定情報と関連付けてバッファメモリ15に格納される。
 (適応オフセットフィルタ60)
 図1は、適応オフセットフィルタ60の構成を示すブロック図である。図1に示すように、適応オフセットフィルタ60は、適応オフセットフィルタ情報復号部61及び適応オフセットフィルタ処理部62を備えている。
 また、図1に示すように、適応オフセットフィルタ情報復号部61は、オフセット情報復号部611、QAOU構造復号部612、及びオフセット属性設定部613を備えている。
 オフセット情報復号部611は、符号化データ#1に含まれているQAOU情報を参照し、QAOU情報に含まれているオフセット情報OIを復号する。また、オフセット情報OIを復号することによって得られたsao_type_idx[sao_curr_depth][ys][xs]及びsao_offset[sao_curr_depth][ys][xs][i]の各値を、それぞれの引数(sao_curr_depth、ys、xs)及び(sao_curr_depth、ys、xs、i)に関連付けて、オフセット情報格納部621に供給する。
 QAOU構造復号部612は、QAOU情報に含まれているsao_split_flag[sao_curr_depth][ys][xs]を復号することによって、QAOUの分割構造を決定し、決定されたQAOUの分割構造を表すQAOU構造情報を、オフセット情報格納部621に供給する。
 オフセット属性設定部613は、オフセットのビット深度(SAO_DEPTHとも呼称する)とオフセットの値域とを決定する。ここでは、オフセットのビット深度は、オフセット属性設定部613に入力される図示されない画素ビット深度(PIC_DEPTHとも呼称する)から決定する。画素ビット深度とは、適応オフセットフィルタ60の入力画像を構成する画素値の値域をビット幅で示すものであり、画素ビット深度がNビットのとき、画素値は0から2N-1の範囲を取る。例えば、画素ビット深度が8ビットのとき、画素値は0から255の範囲を取りうる。適応オフセットフィルタ60の入力画像は、動画像復号装置1の復号画像、もしくは、動画像符号化装置2の局所復号画像である場合には、復号画像/局所復号画像のビット深度が用いられる。適応オフセットフィルタ60の入力画像の精度及び出力画像の精度は画素ビット深度である。
 画素ビット深度は、符号化データ#1中のシンタックスを用いて定められる値を復号して用いることができる。例えば、H.264/AVCの場合には、シーケンスパラメータセット中のbit_depth_luma_minus8を用いて定めることができる。さらに、別の形態として、画素ビット深度は処理対象の単位領域毎に定まってもよく、その場合は該単位領域のヘッダから画素ビット深度を復号する。単位領域の画素ビット深度は、適応オフセットフィルタ60の入力画像を復号するための符号化データ#1中のパラメータ情報やヘッダに含まれていても良いし、QAOU情報の一部として含まれていても良い。入力画像を復号するためのパラメータ情報およびヘッダとしては、ピクチャパラメータヘッダ、スライスヘッダ、LCU、CUなどに画素ビット深度を含めておいても良い。また、QAOU情報の一部としては、リーフQAOUに画素ビット深度を含めておいても良いし、所定の階層(例えば最上位階層のQAOU、や、第1階層のQAOU)のQAOU情報に画素ビット深度を含めておいても構わない。また、画素ビット深度の符号化としては、8ビットからの差分値として符号化することが好適である。QAOU情報では、画素ビット深度の他、シフト値を直接符号化することも適当である。また、シフト値は8ビットを超える場合にのみ符号化することが適当である。ここでシフト値とは、逆量子化を行うために必要なビットシフト量を示す。逆量子化に用いるパラメータとしてはシフト値の他、ステップ値でも良い。この場合、オフセットの逆量子化はステップ値との積、オフセットの量子化はステップ値による除算で実行される。
 また、オフセットのビット深度とは、符号化データ#1中に符号化されるオフセットの精度を示す値である。符号化データ#1に含まれるオフセットは量子化されており、この量子化されたオフセットは復号後、後述のオフセット導出部625によって、画素ビット深度に合わせたビット深度に逆量子化される。また、後述のオフセット加算部626にて、逆量子化されたオフセットの加算が行われる。オフセットのビット深度は、画素ビット深度以下の値を持つ。オフセットのビット深度が画素ビット深度よりもkビットだけ小さい場合には、符号化されるオフセットの値は、2kをオフセットの量子化ステップとして量子化された値を意味する。復号したビット深度から画素ビット深度への変換は、後述するオフセット導出部625で行われる。
 オフセット属性設定部613は、さらに、決定したオフセットのビット深度によりオフセット値域を設定する。さらに、オフセットの画素ビット深度とオフセット値域とからシフト値を設定する。設定されたオフセット値域およびシフト値はオフセット情報格納部621およびオフセット情報復号部611に供給される。オフセットのビット深度の決定とシフト値の設定は後述するパターンS1~S6のいずれかの形態で行われる。オフセット値域の設定は後述するパターンC1、パターンC2のいずれかの形態で行われる。オフセット値域及びシフト値などオフセットに共通する属性をオフセット属性と呼ぶ。一方で、図1に示すように、適応オフセットフィルタ処理部62は、オフセット情報格納部621、QAOU制御部622、オフセットタイプ導出部623.クラス分類部624、オフセット導出部625、及びオフセット加算部626を備えている。
 オフセット情報格納部621は、QAOU構造情報、sao_type_idx[sao_curr_depth][ys][xs]、及びsao_offset[sao_curr_depth][ys][xs][i]に基づいて、各QAOUについて指定されたオフセットタイプ及び該オフセットタイプにおいて選択可能な各クラスに関するオフセットの具体的な値を管理及び格納するための構成であり、マップメモリ及びリストメモリを備えている。
 マップメモリには、分割深度に応じて定まる各オフセット最小単位(QAOMU:Quad Adaptive Offset Minimum Unitとも呼称する)に割り付けられた後述するQAOUインデックスが格納されている。図6(a)では、マップメモリについて説明をする。図6(a)は、マップメモリに格納されるQAOUインデックスの一例を説明するためのものであって、対象の処理単位(例えばLCU)を構成する分割深度3の各QAOMUと各QAOMUに割り付けられたQAOUインデックスとを示す図である。図6(a)では、簡易的にインデックス0~9をQAOUの分割深度を考慮せずにQAOUを指定している。図6(a)に示す例においては、QAOUインデックス=Iによって指定されるQAOUをQAOUIと表記している。また、図6(a)における細線はQAOMUの境界を示しており、太線は、QAOUの境界を示している。
 図6(a)に示すように、QAOU0は、4つのQAOMUから構成されており、これら4つのQAOMUには、QAOUインデックスとして0が割り付けられている。一方で、QAOU3は、1つのQAOMUから構成されており、このQAOMUには、QAOUインデックスとして3が割り付けられている。このように、マップメモリには、各QAOMUに割り付けられたQAOUインデックスが格納されている。
 一方で、リストメモリには、各QAOUインデックス、該QAOUインデックスに関連付けられたオフセットタイプ、及び該オフセットタイプにおいて選択可能な各クラスに関するオフセットの具体的な値とが互いに関連付けられて格納されている。オフセット情報格納部621は、オフセット属性設定部613により設定されるオフセット値域に値の範囲が制限されたオフセットを格納する。
 図6(b)は、リストメモリに格納される情報の一例を説明するためのものであって、QAOUインデックス0~9の各々に関連付けられたオフセットタイプ及び各オフセットタイプにおいて選択可能な各クラスに関するオフセットを示している。図6(b)における「xxx」は、互いに異なり得る具体的な数値を表しているものとする。
 また、図6(b)における「BO_1」は、sao_type_idx=5によって指定されるオフセットタイプを表している。また、「EO_1」は、sao_type_idx=1によって指定されるオフセットタイプを表している。このように、sao_type_idx=1、2、3、4によって指定されるオフセットタイプであるエッジオフセットをそれぞれEO_1、2、3、4とも表記し、sao_type_idx=5、6によって指定されるオフセットタイプであるバンドオフセットをそれぞれBO_1、2とも表記する。
 図6(b)に示すように、オフセットタイプがバンドオフセットである場合、該オフセットタイプに関してリストメモリに格納されるオフセットは、オフセット1~オフセット16の合計16個である。ここで、オフセット1~オフセット16は、sao_type_idx[sao_curr_depth][ys][xs]の値が5または6である場合の、sao_offset[sao_curr_depth][ys][xs][1]~sao_offset[sao_curr_depth][ys][xs][16]によってそれぞれ指定される値のことを指す。一方で、オフセットタイプがエッジオフセットである場合、該オフセットタイプに関してリストメモリに格納されるオフセットは、オフセット1~4の合計4個である。ここで、オフセット1~4は、sao_type_idx[sao_curr_depth][ys][xs]の値が1、2、3、4の何れかである場合の、sao_offset[sao_curr_depth][ys][xs][1]~sao_offset[sao_curr_depth][ys][xs][4]によってそれぞれ指定される値のことを指す。オフセット5~16にはなにも格納されない。
 また、リストメモリに格納されている各オフセットのメモリサイズは、オフセット属性設定部613から供給されるオフセット値域により決定される。オフセット値域が-24~24-1である場合、オフセット1個あたり5ビットで表現が可能であり、5ビットのメモリサイズが必要である。
 なお、各QAOMUには、QAOMU番号が付されており、このQAOMU番号によって各QAOMUは互いに識別可能である。以下では、QAOMU番号がNQであるQAOMUをQAOMUNQとも表記する。
 QAOUインデックスは分割深度0から最大の分割深度までを通して、指定されるQAOUのブロックの番号である。最大の分割深度が4の場合は、分割深度の全ブロック(1+4+16+64+256=341個)に対して、図7に示すように、0~340の値がQAOUインデックスによって指定される。
 動画像復号装置1で用いるオフセット情報格納部621においては、全ての分割深度の全てのQAOUのオフセットを格納する必要がないため、341個のメモリ領域を確保する必要がなく、入力されるQAOU情報で指定された構造で実際に用いられるQAOUの数だけのメモリ領域があればよい。最大の分割深度が4のとき、そのブロック数は256以下であるため、256個のマップメモリ及びリストメモリがあれば十分である。この場合、オフセット情報格納部621で用いるQAOUインデックスは、リーフQAOUを識別するための一意のインデックス、例えば、リースQAOUを復号する度に1づつインクリメントする0から255以下のインデックスを用いる。また、オフセット情報格納部621には、最大分割深度に対応するQAOU情報を単位として、マップリストを格納することも可能である。この場合、オフセット情報格納部621で用いるQAOUインデックスは0~255の番号を用い、これは図7におけるQAOMU番号85~340に対応する。
 図7(a)~(e)は、対象の処理単位(例えばLCU)に含まれるQAOMUに付されたQAOMU番号の一例を示す図であって、(a)は、分割深度が0であるQAOMUに付されたQAOMU番号を示しており、(b)は、分割深度が1であるQAOMUに付されたQAOMU番号を示しており、(c)は、分割深度が2であるQAOMUに付されたQAOMU番号を示しており、(d)は、分割深度が3であるQAOMUに付されたQAOMU番号を示しており、(e)は、分割深度が4であるQAOMUに付されたQAOMU番号を示している。
 QAOU制御部622は、適応オフセットフィルタ処理部62に含まれる各部を制御する。また、QAOU制御部622は、QAOU構造情報を参照して、デブロック済復号画像P_DBを1または複数のQAOUに分割し、各QAOUを所定の順序でスキャンする。また、処理対象とする対象QAOMUを表すQAOMU番号をオフセットタイプ導出部623に供給する。
 オフセットタイプ導出部623は、オフセット情報格納部621のマップメモリ及びリストメモリを参照し、QAOU制御部622から供給されたQAOMU番号によって指定されるオフセットタイプを導出する。また、導出したオフセットタイプを、クラス分類部624に供給する。
 クラス分類部624は、対象QAOUに含まれる各画素を、オフセットタイプ導出部623から供給されるオフセットタイプにおいて選択可能な複数のクラスの何れかに分類する。また、当該オフセットタイプと、各画素が分類されたクラスを示すクラスインデックスとをオフセット導出部625に供給する。なお、クラス分類部624による具体的な分類処理については後述するためここでは説明を省略する。
 オフセット導出部625は、オフセット情報格納部621のリストメモリを参照し、対象QAOUに含まれる各画素について、クラス分類部624から供給されるオフセットタイプ及びクラスインデックスによって指定されるオフセットを導出する。さらにオフセット属性設定部613によって設定されたシフト値だけ、オフセットを左側へビットシフトするオフセット逆シフト部(不図示)を備える。オフセット逆シフト部は、オフセットのビット深度と画素ビット深度とを合わせるように、該オフセットの逆量子化を行う。このような逆量子化を行うことで、後述するオフセット加算部626の加算処理において、同一のビット深度にて、画素値とオフセットの加算を行うことが可能である。各画素について逆量子化したオフセットは、オフセット加算部626に供給される。
 オフセット加算部626は、対象QAOUにおけるデブロック済復号画像P_DBの各画素に対して、オフセット導出部625から供給されるオフセットを加算する。オフセット加算部626は、デブロック済復号画像P_DBに含まれる全てのQAOUに対して処理を行って得られる画像をオフセットフィルタ済復号画像P_OFとして出力する。
 図8は、適応オフセットフィルタ処理部62による処理の流れを示すフローチャートである。
 (ステップS101)
 まず、QAOU制御部622は、オフセット情報格納部621からQAOU構造情報を取得する。
 (ステップS102)
 続いて、QAOU制御部622は、処理対象とする対象QAOMUのQAOMU番号をループ変数とする第1のループを開始する。
 (ステップS103)
 QAOU制御部622は、オフセットタイプ導出部623にQAOMU番号を供給する。QAOU制御部622による制御に基づき、オフセットタイプ導出部623は、QAOU制御部622から供給されたQAOMU番号によって指定されるオフセットタイプを、オフセット情報格納部621のマップメモリ及びリストメモリから読み出す。また、オフセットタイプ導出部623は、読み出したオフセットタイプを、クラス分類部624に供給する。
 (ステップS104)
 続いて、QAOU制御部622は、対象QAOMUに含まれる各画素の画素番号をループ変数とする第2のループを開始する。ここで、画素番号とは、対象QAOMUに含まれる画素を互いに識別するためのものであって、例えば、対象QAOMUに含まれる各画素に対して、所定のスキャン順に付されたものを用いることができる。また、そのような画素番号に代えて、対象QAOMUに含まれる各画素のx座標及びy座標をループ変数としてもよい。
 (ステップS105)
 続いて、クラス分類部624は、QAOU制御部622による制御に基づき、処理対象の画素を、オフセットタイプ導出部623から供給されるオフセットタイプにおいて選択可能な複数のクラスの何れかに分類する。また、当該オフセットタイプと、処理対象の画素が分類されたクラスを示すクラスインデックスとをオフセット導出部625に供給する。
 (ステップS106)
 続いて、オフセット導出部625は、QAOU制御部622による制御に基づき、処理対象の画素に対して加算すべきオフセットをオフセット情報格納部621から読み出す。すなわち、クラス分類部624から供給されるオフセットタイプ及びクラスインデックスによって指定されるオフセットを読み出す。また、処理対象の画素について導出されたオフセットをオフセット属性設定部613から供給されるシフト値だけ左側へビットシフトすることで逆量子化したオフセットを、オフセット加算部626に供給する。
 (ステップS107)
 続いて、オフセット加算部626は、QAOU制御部622による制御に基づき、デブロック済復号画像P_DBの処理対象画素の画素値に対して、オフセット導出部625から供給されるオフセットを加算する。
 (ステップS108)
 本ステップは、第2のループの終端である。
 (ステップS109)
 本ステップは、第1のループの終端である。
 なお、ステップS103にて、オフセットタイプ導出部623が読み出したオフセットが0(オフセットタイプ=0)であるとき、QAOU制御部622は、処理対象のQAOMUの各画素に対してオフセットを加算しないようオフセット加算部626を制御する。
 また、ステップS105にて、対象画素がクラス0(クラスインデックス=0)に分類された場合、該対象画素に対しては、オフセットを加算しないようオフセット加算部626を制御する。
 (オフセットの格納に必要なビット数)
 続いて、オフセット(sao_offset)の格納に必要なビット数について説明する。画素ビット深度が10ビットで、オフセットのビット深度が9ビットである場合、オフセットは-29~29-1の値を取り、オフセット1つあたりのビット数は10ビットと大きなビット数を有することになる。このように大きなビット数のオフセットを復号する場合、オフセット情報格納部621は、オフセットを格納しておくためのメモリサイズとして、1ピクチャあたり最大で、
  (1ピクチャあたりのQAOMUの総数)×(クラス数)×(オフセットあたりのビット数)=256×16×10(ビット)=40960(ビット)
を有していることが要求される。1ピクチャあたりのQAOMUの総数は、復号装置では256個であるが、後述する符号化装置では341個用いるため、さらに大きなメモリが必要になる。このように、オフセットの値域を制限せず、オフセットのビット深度で可能な値域を用いる場合には、オフセットのビット数が大きいため、オフセットを格納しておくための大きなメモリサイズが必要になる。
 (SAO_DEPTHと符号化効率の関係)
 SAO_DEPTHとPIC_DEPTHとは、量子化誤差の観点で互いに密接な関係がある。適応オフセットフィルタ60の出力画像のビット深度は、画素ビット深度PIC_DEPTHであり、SAO_DEPTHは画素に加えるオフセットのビット深度であるから、画素ビット深度を超える精度のオフセットを用いても出力過程で捨てられてしまうため、オフセットの精度であるSAO_DEPTHは、PIC_DEPTH以下で設定されることが好ましい。また、SAO_DEPTHがPIC_DEPTHよりも小さい場合には、入力画像をフィルタにより補正可能な精度(PIC_DEPTH)よりも粗い補正しか行うことができないため、フィルタ効果は減少する。
 なお、オフセットの精度SAO_DEPTHが高い場合には、オフセットの符号量が増加する。一般に、符号化効率は符号化データの符号量R、入力画像の歪みD、重みλを用いて表現されるレート歪みコストD+λRを最小化することで最適化されることからも理解できるように、オフセットの精度は、歪みDに対してマイナス、レートRに対してプラスの影響を与えることから、精度の大きさにはトレードオフが存在し特定の最適値が存在する。
 さらに、本実施例において、量子化されたオフセットを一定のビット幅で表現できるオフセット値域に制限することで、オフセット情報格納部621で量子化されたオフセットを格納するためのビット幅を制限することができる。制限しない場合と比較して、メモリサイズ削減の効果を得ることができる。しかし、過度にオフセット値域を狭くすることは、オフセットが復号画像の歪みを補正する効果を小さくしてしまうので、オフセットの加算処理は復号画像の歪みを除去することができず、符号化効率が低下することがある。したがって、符号化効率が低下しないようにオフセット値域を最適な範囲を設定することが好ましい。
 本実施の形態においては、オフセット属性設定部613は、パターンS1~S6の何れかによってオフセットビット深度及びオフセットのシフト値を設定し、パターンC1~C3の何れかによってオフセット値域を設定する。
 (パターンS1)
 パターンS1では、図9(a)に示すように、オフセットのビット深度SAO_DEPTHを画素ビット深度PIC_DEPTHと等しくする。オフセットの精度の最大値は画素ビット深度となることから、パターンS1は最大の精度でオフセットを符号化することになる。
 (パターンS2)
 パターンS2では、図9(b)に示すように、PIC_DEPTHが10ビット以下の時は、SAO_DEPTHをPIC_DEPTHと等しくし、PIC_DEPTHが11ビット以上の時は、SAO_DEPTHを10とする。パターンS2でオフセットのビット深度の上限を10ビットとしている。発明者の知見により、復号画像の量子化ステップQPの値が小さいとき(ビットレートが高いとき)、オフセットのビット深度が画素ビット深度と同一である場合の方が、オフセットのビット深度を小さくする場合に比較して、符号化効率が高く、逆に、量子化ステップQPの値が大きいとき、オフセットのビット深度が画素ビット深度よりも小さい方が、画素ビット深度と同じ場合よりも符号化効率が高くなる。発明者の実験では、量子化パラメータqpが12から27の領域において、オフセットのビット深度をパターンS2のように定めることにより、画素ビット深度が9ビット以下のときにオフセットのビット深度が8ビットであり、画素ビット深度が10ビット以上のときにオフセットのビット深度が9ビットである場合と比較して、符号化効率が向上することが確認された。したがって、パターンS2において、10ビットを境に画素ビット深度への依存性を変化させることで、パターンS1のようにオフセットのビット深度と画素ビット深度を等しくした場合に比べて、オフセットの符号量を小さくすることができ、高い符号化効率を得ることが可能である。
 (パターンS3)
 パターンS3にでは、図9(c)に示すように、PIC_DEPTHが9ビット以下の時は、SAO_DEPTHをPIC_DEPTHと等しくし、PIC_DEPTHが10ビット以上の時は、SAO_DEPTHを9とする。パターンS3でオフセットのビット深度の上限を9ビットとしている。パターンS3においても、パターンS2と同様に、オフセットの符号量を小さくすることができ、高い符号化効率を得ることが可能である。
 (パターンS4)
 パターンS4では、図9(d)に示すように、PIC_DEPTHが10ビット以下の時は、SAO_DEPTHをPIC_DEPTHと等しくし、PIC_DEPTHが11ビット以上の時は、SAO_DEPTHを10-floor((PIC_DEPTH-10)/STEP)とする。ここで関数floor(x)はx以下の最大の整数を与える関数である。パターンS4では、画素ビット深度が10ビット以上において、画素ビットがSTEPビットだけ増加(減少)する毎にオフセットのビット深度が1ビットだけ増加(減少)することを意味する。図9(e)では、パターンS4におけるSTEP=2の場合を示していて、画素ビット深度が2ビット増加する毎に、オフセットのビット深度は1ビット増加している。このような構成とすることで、画素ビット深度の大きさを考慮しつつ、ビットレートの大きさに対して、パターンS2及びパターンS3より自由度の高い対応が可能である。
 また、パターンS1~パターンS4に共通して、シフト値はPIC_DEPTHとSAO_DEPTHとの差分値PIC_DEPTH-SAO_DEPTHで表される。上記のパターンS1~S4におけるオフセットビット深度及びシフト値の変更はメモリサイズ及び処理量の増加をすることなくオフセットビット深度及びシフト値を設定しているので、符号化効率の改善が可能である。
 (パターンS5)
 パターンS5ではオフセットのビット深度を明示的に符号化する。具体的には、オフセットのビット深度と所定の値の差を符号化する。所定の値は8、もしくは、画素ビット深度が適当であり、前者の場合、SAO_DEPTH-8が符号化され、後者の場合はPIC_DEPTH-SAO_DEPTHが適当である。なお、オフセットのビット深度は、符号化データの各種パラメータ情報やヘッダもしくは、QAOU情報の一部として符号化しても構わない。QAOU情報の一部としては、リーフQAOUに画素ビット深度を含めておいても良いし、所定の階層(例えば最上位階層のQAOU、や、第1階層のQAOU)のQAOU情報に画素ビット深度を含めておいても構わない。符号化データの一部として符号化することにより、復号装置および符号化装置でビット深度を最適な値に設定することによって符号化効率を最大化させる効果が得られる。また、ビット深度をQAOU情報で符号化する場合には、QAOUの深度sao_curr_depthに応じてビット深度を変更することによりオフセットを格納するメモリの低減が可能である。多くのオフセットが出現する可能性があるのはsao_curr_depthが大きい場合であるから、sao_curr_depthが大きい場合にビット深度を小さくし、sao_curr_depthが小さい場合にビット深度を大きく設定することによって必要なメモリサイズの削減が可能である。例えば、sao_curr_depth=0~1の場合には、オフセットのビット深度=画素ビット深度(パターンS1)とし、sao_curr_depth=2~4では、オフセットのビット深度に上限を設定する(パターンS2)などが適当であり、このようにビット幅を符号化する。また、QAOUの深度毎にオフセットのビット幅を符号化するか、QAOUの深度によらずオフセットのビット幅を1つ用いるかを示すフラグを符号化し、QAOUの深度毎に符号化するか否かを切り替えることも適当である。
 (パターンS6)
 パターンS6では、明示的な符号化なく、sao_curr_depthに応じてビット深度を決定する。例えば、sao_curr_depth=0~1の場合には、オフセットのビット深度=画素ビット深度(パターンS1)とし、sao_curr_depth=2~4では、オフセットのビット深度に上限を設定する(パターンS2)などが適当である。
 (パターンC1)
 パターンC1では、SAO_DEPTHに応じてオフセット値域を設定する。以下ではオフセット値域の値を表す最大のビット長をCLIP_BITとする。具体的には、CLIP_BIT=SAO_DEPTH-Kの計算により、オフセット値域を-2CLIP_BIT-1~2CLIP_BIT-1-1と定める。発明者の実験によれば、K=4が適当であることが見出された。すなわち、K=4の場合には、オフセット値域によりオフセットの範囲を制限しても符号化効率の低下がないことを確認した。K=4は、最も良く使用される画素のビット深度が8の場合に適当である。画素ビット深度が8の場合、オフセットのビット深度SAO_DEPTHも8であり、CLIP_BIT=8-K=4となる。1つのオフセットが4ビットで格納できることは、8ビットのバイトを単位として扱うソフトウェア等で、1バイトに1つのオフセットをパッキングして格納することが可能であり、簡易にメモリサイズの削減が可能である。
 (パターンC2)
 パターンC2では、SAO_DEPTHに依らずオフセット値域を設定する。具体的には、CLIP_BIT=8として、オフセット値域を-27~27-1と定める。
 また、一般的に、SAO_DEPTHに依らない定数Nを用いてCLIP_BIT=Nとしてもよい。SAO_DEPTHに依らずオフセット値域を設定する場合には、メモリサイズを小さくする効果を得るため、オフセットのビット深度よりも小さな値に設定することが好ましい。
 (パターンC3)
 パターンC3では、オフセット値域を、QAOUの階層に応じて決定する。sao_curr_depthが小さい場合(例えば0~1)には、オフセットのビット深度によらずオフセット値域を決定とし、sao_curr_depthが大きい場合(例えば2~4)にはオフセットのビット深度によって決定する、が適当である。例えば、前者はCLIP_BIT=8(パターンC2)、後者はSAO_DEPTH-Kビット(パターンC1)とする方法がある。なお、オフセットのビット深度をQAOUの階層に応じて変更する場合には、結果として固定のビット数でも構わないことがある。例えば、CLIP_BIT=4とすることが適当である。
 (オフセットのビット数の具体例1)
 続いて、本実施の形態に係るオフセット(sao_offset)のビット数の第1の具体例について説明する。本例においては、画素ビット深度を10ビットとし、シフト値の設定をパターンS2により行い、オフセット値域の設定をパターンC1により行う場合を説明する。パターンS2ではオフセットのビット深度は10ビットに設定され、パターンC1ではオフセット値域は10-4=6ビットに設定される。オフセット1つあたりのビット数が6ビットであるとは、オフセットのとり得る値を、-32から31までの値に制限することに対応する。本例の場合、オフセット情報格納部621は、オフセットを格納しておくためのメモリサイズとして、1ピクチャあたり最大で、
 (1ピクチャあたりのQAOMUの総数)×(クラス数)×(オフセットあたりのビット数)=256×16×6(ビット)=24576(ビット)
を有していれば足りる。
 したがって、オフセットが本例の値域を有する構成とすることによって、従来例に比べて、オフセット情報格納部621に必要なメモリサイズを略3/5に減少させることができる。
 符号化データ#1に含まれるオフセットの符号量を削減することができるので、符号化効率の向上を図ることができる。また、過度なオフセットが加算されることが抑制されるので、適切な画質が保証される。
 (オフセットのビット数の具体例2)
 続いて、本実施の形態に係るオフセット(sao_offset)のビット数の第2の具体例について説明する。本例においては、画素ビット深度を10ビットとし、シフト値の設定をパターンS2により行い、オフセット値域の設定をパターンC2により行う例を説明する。パターンS2よりオフセットのビット深度は10ビットに設定され、パターンC2よりオフセット値域は8ビットに設定される。オフセット1つあたりのビット数が8ビットであるとは、オフセットのとり得る値を、例えば-128から127までの値に制限することに対応する。本例の場合、オフセット情報格納部621は、オフセットを格納しておくためのメモリサイズとして、1ピクチャあたり最大で、
 (1ピクチャあたりのQAOMUの総数)×(クラス数)×(オフセットあたりのビット数)=256×16×8(ビット)=32768(ビット)
を有していれば足りる。
 したがって、オフセットが本例のビット数を有する構成とすることによって、従来例に比べて、オフセット情報格納部621に必要なメモリサイズを略4/5に減少させることができる。
 また、符号化データ#1に含まれるオフセットの符号量を削減することができるので、符号化効率の向上を図ることができる。また、過度なオフセットが加算されることが抑制されるので、適切な画質が保証される。
 なお、オフセットのビット数を制限すれば、符号化データに含まれるオフセット情報の符号量を小さくすることができるが、過度に制限してしまうと、適応オフセットフィルタを備えることのメリットが小さくなってしまい、符号化データに含まれる残差データ(残差画像の画素値)の符号量が大きくなってしまうという問題がある。
 (オフセットのビット数の具体例3)
 続いて、オフセット(sao_offset)のビット数の第3の具体例について説明する。本例パターンC1、C2何れかにおいては、オフセットタイプが、エッジオフセット(オフセットタイプ=1~4)であるのか、バンドオフセット(オフセットタイプ=5~6)であるのかに応じて、オフセットのビット数に対して異なる値を設定する。ここでは、画素ビット深度を10ビットとする場合を例に、シフト値の設定をパターンS2により行い、エッジオフセットのオフセット値域の設定をパターンC2により行い、バンドオフセットのオフセット値域の設定をパターンC1により行う方法を説明する。
 画素ビット深度が10ビットの場合、パターンS2ではオフセットのビット深度は10ビットに設定される。エッジオフセットのオフセットタイプに属するオフセット(以下、エッジオフセットのオフセット)は、パターンC2から8ビットに値域が設定される。バンドオフセットのオフセットタイプに属するオフセット(以下、バンドオフセットのオフセット)はパターンC1から6ビットに値域が設定される。より一般には、エッジオフセットのオフセットのビット数をNビットとし、バンドオフセットのオフセットのビット数をMビットとしたとき、N≧Mが満たされるようにオフセットのビット数を定める。
 オフセット情報格納部621で確保が必要なメモリサイズは、QAOU単位で、オフセットタイプのクラス数×オフセットのビット数であるため、オフセットのクラス数がエッジオフセットよりも大きいバンドオフセットのビット数を小さくすれば、オフセットをオフセット情報格納部621で用いるメモリ領域を有効に活用することができる。
 このようにオフセットタイプに応じて、オフセットのビット数を異ならせることによって、オフセット情報格納部621に過度なメモリサイズを要求することなく、符号化効率の向上を図ることができる。メモリ領域を最も有効的に活用することができる。
 なお、オフセットの取り得る値を制限するための閾値thが2m-1より大きく、2m以下であるとき、当該オフセットを符号化するための符号化方式として、mビットの固定長符号化/復号方式を用いることができる。また、最大値とthとするTruncated unary符号化や、Truncated Rice符号化などの可変長符号化/復号方式を用いることができる。なお、上記の最大値thは、オフセット属性設定部613から供給されるオフセット値域によって決定される。また、動画像復号装置1は、このようにして符号化されたオフセットを復号することができる。
 以上の構成ではオフセット属性設定部613において、オフセットのビット深度、オフセット値域、及び、シフト値が設定される。適応オフセットフィルタ情報復号部61では、オフセット値域の範囲の値を有する量子化オフセットが復号され、個々のオフセットに対して、オフセット値域以上のビット幅の格納領域を有するオフセット情報格納部621に格納される。本実施の形態では、オフセット値域がオフセットのビット深度に応じて決定することを特徴とする。また、オフセットのビット深度は、画素のビット深度に応じて決定する。このため、オフセットのビット深度を画素のビット深度に応じて決定することも、本実施の形態の特徴である。
 また、実施の形態1における適応オフセットフィルタ情報復号部61は、復号後のオフセットを格納する格納部と該格納部から得られるオフセットを逆量子化を行う逆量子化部とを備え、オフセット導出部625における逆量子化処理を省略する形態としてもよい。この場合、格納部はオフセット属性設定部613により設定されるオフセット値域に制限されるオフセットを格納することと、逆量子化部はオフセット属性設定部613により設定されるシフト値に応じて左側へシフトを行って逆量子化処理を行うことを特徴とする。
 オフセット情報復号部611は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算するオフセット加算部626によって参照される各オフセットを符号化データ#1から復号するものであり、図示されない画素ビット深度に応じて定められるオフセット値域及びシフト値を設定し、オフセット値域に制限されるオフセットを復号するオフセット復号手段を備えている、と表現することもできる。
 また、本実施の形態に係る適応オフセットフィルタ60は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域におけるオフセット属性を設定するオフセット属性設定部613と、上記設定されたオフセット属性に含まれるオフセット値域に応じたビット幅を有するオフセットを復号するオフセット情報復号部611と、上記入力画像の各画素値に上記オフセットを加算するオフセット加算部626とを備えている画像フィルタ装置である、と表現することもできる。
 さらに、オフセット情報復号部611は、上記オフセット復号手段に加え、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定する決定手段と、上記決定手段によって決定されたオフセットタイプに応じて異なるビット幅を有するオフセットを復号するオフセット復号手段を備えている、構成としてもよい。
 また、上記オフセットタイプ指定情報は、各単位領域における上記入力画像の画素値のビット深度を含み、オフセット情報復号部611は、上記画素値のビット深度に応じたビット幅を有するオフセットを復号する構成とすることができる。
 以下では、クラス分類部624による分類処理の具体例について説明する。クラス分類部624は、以下の分類処理例のうち、符号化データ#1を生成する動画像符号化装置における分類処理に対応する分類処理を行うことが好ましい。
 (クラス分類部624による分類処理例1)
 クラス分類部624による分類処理の第1の例について、図10(a)~(f)から図12を参照して説明する。
 (オフセットタイプ=1~4(エッジオフセット)のとき)
 オフセットタイプ導出部623から供給されるオフセットタイプが1~4の何れかであるとき、クラス分類部624は、処理対象の画素の近傍にエッジが存在するか否か、及びエッジが存在する場合にはエッジの種類を判定し、判定した結果に応じて、当該処理対象の画素を、複数のクラスの何れかに分類する。
 より具体的には、まず、クラス分類部624は、処理対象画素xの画素値pic[x]と、該処理対象画素に隣接するか、または頂点を共有する2つの画素a、bの画素値pic[a]、pic[b]との差分の符号
  Sign(pic[x]-pic[a])、及び
  Sign(pic[x]-pic[b])
を算出する。ここで、Sign(z)は、
  Sign(z)=+1 (z>0のとき)
  Sign(z)=0  (z=0のとき)
  Sign(z)=-1 (z<0のとき)
の各値をとる関数である。また、何れの画素を画素a及び画素bとして用いるかは、具体的はオフセットタイプに依存し、以下のように定められる。
 ・オフセットタイプ=1(sao_type_idx=1)のとき
 図10(a)に示すように、処理対象画素xの左側に隣接する画素を画素aとし、処理対象画素の右側に隣接する画素を画素bとする。
 ・オフセットタイプ=2(sao_type_idx=2)のとき
 図10(b)に示すように、処理対象画素xの上側に隣接する画素を画素aとし、処理対象画素の下側に隣接する画素を画素bとする。
 ・オフセットタイプ=3(sao_type_idx=3)のとき
 図10(c)に示すように、処理対象画素xの左上の頂点を共有する画素を画素aとし、処理対象画素の右下の頂点を共有する画素を画素bとする。
 ・オフセットタイプ=4(sao_type_idx=4)のとき
 図10(d)に示すように、処理対象画素xの左下の頂点を共有する画素を画素aとし、処理対象画素の右上の頂点を共有する画素を画素bとする。
 図11(a)は、処理対象画素xの画素値pic[x]と画素aまたはbの画素値との大小関係を示すグラフ、及びその大小関係に応じた関数Signの値を示す図である。図11(a)に示すグラフにおいてpic[x]が付されている黒丸は、処理対象画素xの画素値を示すものであり、pic[x]が付されていない黒丸は、処理対象画素aまたはbの画素値を示すものである。また、図11(a)に示すグラフにおける上下方向は、画素値の大小を示している。
 続いて、クラス分類部624は、Sign(pic[x]-pic[a])、及びSign(pic[x]-pic[b])に基づいて、以下の数式(1-1)によってEgdeTypeを導出する。
  EgdeType=Sign(pic[x]-pic[a])+Sign(pic[x]-pic[b])+2   ・・・(1-1)
 図11(b)は、処理対象画素xの画素値と、画素a及びbの画素値との大小関係を示すグラフ、及びその大小関係に応じたEgdeTypeの値を示す図である。図11(b)において、各グラフの中心の黒丸は、処理対象画素xの画素値を示しており、両端の黒丸は、画素a及びbの画素値を示している。また、図11(b)に示すグラフにおける上下方向は、画素値の大小を示している。
 続いて、クラス分類部624は、導出したEgdeTypeに基づいて、処理対象画素xが属するべきクラスのクラスインデックス(class_idx)を以下のように導出する。
  class_idx=EoTbl[EdgeType]
ここで、EoTbl[EdgeType]は、EdgeTypeからclass_idxを導出するために用いられる変換テーブルである。当該変換テーブルEoTblの具体例を図11(d)に示す。
 図11(d)に示すように、クラス分類部624は、処理対象画素x、画素a及び画素bから成る領域にエッジが存在しない場合(以下、平坦な場合とも呼ぶ)、処理対象画素xをクラス0(class_idx=0)に分類する。図11(c)は、図11(b)に示した各グラフと、lass_idxとの対応を示している。
 (オフセットタイプ=5~6(バンドオフセット)のとき)
 オフセットタイプ導出部623から供給されるオフセットタイプが5~6の何れかであるとき、クラス分類部624は、処理対象画素xの画素値pic[x]に応じて、当該処理対象画素の画素値を複数のクラスの何れかに分類する。
 ・オフセットタイプ=5(sao_type_idx=5)のとき
 クラス分類部624は、処理対象画素xの画素値pic[x]が、
  (max×1/4)≦pic[x]≦(max×3/4)
を満たしている場合に、当該処理対象画素をクラス0以外のクラスに分類する。すなわち、処理対象画素の画素値が、図12(a)における斜線の範囲内である場合に、当該処理対象画素をクラス0以外のクラスに分類する。なお、上記maxは、処理対象画素xの画素値の取り得る最大値を表しており、例えば、max=255である。また、max=255であるとき、上記の条件は、
  8≦(pic[x]/8)≦23
と表現することもできる。
 ・オフセットタイプ=6(sao_type_idx=6)のとき
 クラス分類部624は、処理対象画素xの画素値pic[x]が、
  pic[x]≦(max×1/4)または(max×3/4)≦pic[x]
を満たしている場合に、当該処理対象画素をクラス0以外のクラスに分類する。すなわち、処理対象画素の画素値が、図12(b)における斜線の範囲内である場合に、当該処理対象画素をクラス0以外のクラスに分類する。なお、上記maxは、処理対象画素xの画素値の取り得る最大値を表しており、例えば、max=255である。また、max=255であるとき、上記の条件は、
  (pic[x]/8)≦7または24≦(pic[x]/8)
と表現することもできる。
 クラス分類部624によるクラス分類処理をより具体的に説明すれば以下の通りである。
 オフセットタイプが5~6の何れかであるとき、クラス分類部624は、処理対象画素xが属するべきクラスのクラスインデックス(class_idx)を以下のように導出する。
  class_idx=EoTbl[sao_type_idx][pic[x]/8]
ここで、EoTbl[sao_type_idx][pic[x]/8]は、処理対象画素xの画素値pic[x]とsao_type_idxとから、class_idxを導出するために用いられる変換テーブルである。当該変換テーブルEoTblの具体例を図12に示す。図12(c)において「BO_1」は、sao_type_index=5であることを示しており、「BO_2」は、sao_type_index=6であることを示している。
 図12(c)に示すように、sao_type_index=5のとき、クラス分類部624は、処理対象画素xの画素値pic[x]が8≦(pic[x]/8)≦23を満たすとき、pic[x]の大きさに応じて、処理対象画素xをクラスインデックス1から16までの何れかのクラスに分類する。
 一方で、sao_type_index=6のとき、クラス分類部624は、処理対象画素xの画素値pic[x]がpic[x]/8)≦7または24≦(pic[x]/8)を満たすとき、pic[x]の大きさに応じて、処理対象画素xをクラスインデックス1から16までの何れかのクラスに分類する。
 一般的に、画像のビット深度がPIC_DEPTHのとき、max=2PIC_DEPTH-1であり、図12(c)におけるpic/8の代わりにpic/2(PIC_DEPTH-5)を用いてクラスの分類をおこなう。
 (クラス分類部624による分類処理例2)
 続いて、クラス分類部624による分類処理の第2の例について説明する。
 本処理例においては、クラス分類部624は、数式(1-1)に代えて、以下の数式(1-2)を用いてEgdeTypeを導出する。他は分類処理例1と同様である。
  EgdeType=Sign((pic[x]>>shift)-(pic[a]>>shift))+Sign((pic[x]>>shift)-(pic[b]>>shift))+2   ・・・(1-2)
ここで、「>>」は右ビットシフトを表しており、「shift」は、ビットシフトの大きさを表している。「shift」の具体的な値は、例えば、画素値のビット深度と正の相関を有するように定めることができる。
 分類処理例1による分類処理においては、画素値の勾配が非常に小さい場合であっても、画素値の勾配が0でなければ、Signの値は非0となる。したがって、分類処理例1による分類処理は、ノイズの影響を受けやすいという側面を有する。
 本処理例においては、画素値を右シフトしてから差分をとるので、EgdeTypeの値がノイズの影響を受けにくくなり、符号化効率が向上するという効果がある。
 なお、本処理例においては、数式(1-2)に代えて、以下の数式(1-3)を用いてもよい。
  EgdeType=Sign((pic[x]-pic[a])>>shift)+Sign((pic[x]-pic[b])>>shift))+2 ・・・(1-3)
 すなわち、画素値の差分をとった後に、右ビットシフトを行ってもよい。数式(1-3)を用いることによっても、数式(1-2)を用いた場合と同様の効果を奏する。
 (クラス分類部624による分類処理例3)
 続いて、クラス分類部624による分類処理の第3の例について説明する。
 本処理例においては、クラス分類部624は、分類処理例1において説明した関数Signの定義を以下のように変更する。他は分類処理例1と同様である。
  Sign(z)=+1 (z>thのとき)
  Sign(z)=0  (-th≦z≦thのとき)
  Sign(z)=-1 (z<-thのとき)
ここで、thは、予め定められた値を有する閾値である。閾値thの具体的な値は、その絶対値が、例えば、画素値のビット深度と正の相関を有するように定めることができる。
 本処理例においても、EgdeTypeの値がノイズの影響を受けにくくなり、高い符号化効率を得ることができる。
 (クラス分類部624による分類処理例4)
 続いて、クラス分類部624による分類処理の第4の例について説明する。
 本処理例においては、クラス分類部624は、図12(c)に示したEoTbl[sao_type_idx][pic[x]/8]に代えて、図13に示したEoTbl[sao_type_idx][pic[x]/8]を用いる。
 図13に示すように、本処理例においては、pic[x]/8の値が8及び9の何れかである場合、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類される。また、pic[x]/8の値が22及び23の何れかである場合、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類される。
 また、本処理例においては、処理対象画素の画素値は、その値が15以下である場合(pic[x]/8=0または1である場合)、MINにクリップされる。また、処理対象画素の画素値は、その値が240以上である場合(pic[x]/8=30または31である場合)、MAXにクリップされる。ここで、MIN及びMAXとしては、
 ・MIN=15、MAX=240
 ・MIN=16、MAX=239
 ・MIN=16、MAX=235
の何れかの組み合わせを用いることが好ましい。
 分類処理例1においては、sao_type_index=5のときにクラス0に分類される処理対象画素は、sao_type_index=6のときにクラス0でないクラスに分類される。また、sao_type_index=6のときにクラス0に分類される処理対象画素は、sao_type_index=5のときにクラス0でないクラスに分類される。
 したがって、分類処理例1においては、sao_type_index=5であるのか、sao_type_index=6であるのかに応じて、オフセットを加算した後の画素値が大きく異なり得るため、符号化効率が期待されるほど向上しないという問題が生じ得る。また、このような問題は、オフセットフィルタ前画像の画素値がpic[x]/8の値が8及び9の何れか、または、pic[x]/8の値が22及び23の何れかである場合に顕著なものとなり得る。
 本処理例においては、pic[x]/8の値が8及び9の何れかである場合、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類され、pic[x]/8の値が22及び23の何れかである場合、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類されるので、上述の問題が生じにくい。したがって、本処理例の処理を行うことによって、符号化効率の向上を図ることができる。
 なお、本処理例では、pic[x]/8の値が8及び9の何れかである場合、及び、pic[x]/8の値が22及び23の何れかである場合、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類されるものとしたが、これは本処理例を限定するものではなく、pic[x]/8の値が所定の範囲であるときに、処理対象画素xは、sao_type_index=5であっても、sao_type_index=6であっても、クラスインデックスが0でないクラスに分類される処理を行えばよい。
 一般的に、画像の画素ビット深度がPIC_DEPTHのとき、max=2PIC_DEPTH-1であり、図13におけるpic/8の代わりにpic/2(PIC_DEPTH-5)を用いてクラスの分類をおこなう。
 このように、本処理例の分類処理を行うクラス分類部624は、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類する、ものであると表現することもできる。
 (動画像符号化装置2)
 以下では、符号化対象画像を符号化することによって符号化データ#1を生成する動画像符号化装置2について、図14から図18(a)~(d)を参照して説明する。動画像符号化装置2は、その一部に、H.264/MPEG-4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、及び、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。
 図14は、本実施の形態に係る動画像符号化装置2の構成を示すブロック図である。図14に示すように、動画像符号化装置2は、変換・量子化部21、可変長符号符号化部22、逆量子化・逆変換部23、バッファメモリ24、イントラ予測画像生成部25、インター予測画像生成部26、動きベクトル検出部27、予測方式制御部28、動きベクトル冗長性削除部29、加算器31、減算器32、デブロッキングフィルタ33、適応フィルタ70、及び適応オフセットフィルタ80を備えている。動画像符号化装置2は、動画像#10(符号化対象画像)を符号化することによって、符号化データ#1を生成する装置である。
 変換・量子化部21は、(1)符号化対象画像から予測画像Predを減算した予測残差Dをブロック毎にDCT変換(Discrete Cosine Transform)し、(2)DCT変換により得られたDCT係数を量子化し、(3)量子化により得られた量子化予測残差QDを可変長符号符号化部22及び逆量子化・逆変換部23に供給する。なお、変換・量子化部21は、(1)量子化の際に用いる量子化ステップQPを、ツリーブロック毎に選択し、(2)選択した量子化ステップQPの大きさを示す量子化パラメータ差分Δqpを可変長符号符号化部22に供給し、(3)選択した量子化ステップQPを逆量子化・逆変換部23に供給する。ここで、量子化パラメータ差分Δqpとは、DCT変換/量子化するツリーブロックに関する量子化パラメータqp(QP=2pq/6)の値から、直前にDCT変換/量子化したツリーブロックに関する量子化パラメータqp’の値を減算して得られる差分値のことを指す。
 可変長符号符号化部22は、(1)変換・量子化部21から供給された量子化予測残差QD並びにΔqp、(2)後述する予測方式制御部28から供給された量子化パラメータPP、および、(3)後述する適応フィルタ70から供給されたフィルタセット番号、フィルタ係数群、領域指定情報、並びにオンオフ情報を可変長符号化することによって、符号化データ#1を生成する。また、可変長符号符号化部22は、適応オフセットフィルタ80から供給されるQAOU情報を符号化し、符号化データ#1に含める。
 逆量子化・逆変換部23は、(1)量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT係数を逆DCT(Discrete Cosine Transform)変換し、(3)逆DCT変換によって得られた予測残差Dを加算器31に供給する。量子化予測残差QDを逆量子化する際には、変換・量子化部21から供給された量子化ステップQPを利用する。なお、逆量子化・逆変換部23から出力される予測残差Dは、変換・量子化部21に入力される予測残差Dに量子化誤差が加わったものであるが、ここでは簡単のために共通の呼称を用いる。
 イントラ予測画像生成部25は、各パーティションに関する予測画像Pred_Intraを生成する。具体的には、(1)各パーティションついてイントラ予測に用いる予測モードを選択し、(2)選択した予測モードを用いて、復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部25は、生成したイントラ予測画像Pred_Intraを、予測方式制御部28に供給する。
 また、イントラ予測画像生成部25は、各パーティションについて選択された予測モードから、各パーティションのサイズとから各パーティションについての予測インデックスPIを特定し、当該予測インデックスPIを予測方式制御部28に供給する。
 また、イントラ予測画像生成部25は、対象パーティションのサイズ、および、対象パーティションに割り付けられた予測モードを示す情報であるイントラ符号化モード情報IEMを適応フィルタ70に供給する。
 動きベクトル検出部27は、各パーティションに関する動きベクトルmvを検出する。具体的には、(1)参照画像として利用するフィルタ済復号画像P_FL’を選択し、(2)選択したフィルタ済復号画像P_FL’において対象パーティションを最良近似する領域を探索することによって、対象パーティションに関する動きベクトルmvを検出する。ここで、フィルタ済復号画像P_FL’は、既に復号が完了した復号済みの復号画像に対して、デブロッキングフィルタ33によるデブロック処理、適応オフセットフィルタ80による適応的オフセット処理、および、適応フィルタ70による適応的フィルタ処理を施すことによって得られる画像であり、動きベクトル検出部27は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ24から読み出すことができる。動きベクトル検出部27は、検出した動きベクトルmvを、参照画像として利用したフィルタ済復号画像P_FL’を指定する参照画像インデックスRIと共に、インター予測画像生成部26及び動きベクトル冗長性削除部29に供給する。なお、双方向予測(重み付き予測)を行うパーティションについては、参照画像として2枚のフィルタ済復号画像P_FL1’及びP_FL2’を選択し、2枚のフィルタ済復号画像P_FL1’及びP_FL2’の各々に対応する動きベクトルmv1及びmv2、並びに、参照画像インデックスRI1及びRI2をインター予測画像生成部26及び動きベクトル冗長性削除部29に供給する。
 インター予測画像生成部26は、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル検出部27から供給された動きベクトルmvを用いて、動きベクトル検出部27から供給された参照画像インデックスRIによって指定されるフィルタ済復号画像P_FL’から動き補償画像mcを生成する。動きベクトル検出部27と同様、インター予測画像生成部26は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ24から読み出すことができる。インター予測画像生成部26は、生成した動き補償画像mc(インター予測画像Pred_Inter)を、動きベクトル検出部27から供給された参照画像インデックスRIと共に、予測方式制御部28に供給する。なお、双方向予測(重み付き予測)をパーティションについては、(1)動きベクトルmv1を用いて、参照画像インデックスRI1によって指定されたフィルタ済復号画像P_FL1’から動き補償画像mc1を生成し、(2)動きベクトルmv2を用いて、参照画像インデックスRI2によって指定されたフィルタ済参照画像P_FL2’から動き補償画像mc2を生成し、(3)動き補償画像mc1と動き補償画像mc2との加重平均にオフセット値を加えることによってインター予測画像Pred_Interを生成する。
 予測方式制御部28は、イントラ予測画像Pred_Intra及びインター予測画像Pred_Interを符号化対象画像と比較し、イントラ予測を行うかインター予測を行うかを選択する。イントラ予測を選択した場合、予測方式制御部28は、イントラ予測画像Pred_Intraを予測画像Predとして加算器31及び減算器32に供給すると共に、イントラ予測画像生成部25から供給された予測インデックスPIを予測パラメータPPとして可変長符号符号化部22に供給する。一方、インター予測を選択した場合、予測方式制御部28は、インター予測画像Pred_Interを予測画像Predとして加算器31及び減算器32に供給すると共に、インター予測画像生成部26から供給された参照画像インデックスRI、並びに、動きベクトル冗長性削除部29(後述)から供給された推定動きベクトルインデックスPMVI及び動きベクトル残差MVDを予測パラメータPPとして可変長符号符号化部に供給する。
 予測方式制御部28にて選択された予測画像Predを、符号化対象画像から減算することによって、減算器32にて予測残差Dが生成される。減算器32にて生成された予測残差Dは、上述したとおり、変換・量子化部21によってDCT変換/量子化される。一方、予測方式制御部28にて選択された予測画像Predを、逆量子化・逆変換部23にて生成された予測残差Dに加算することによって、加算器31にて局所復号画像Pが生成される。加算器31にて生成された局所復号画像Pは、デブロッキングフィルタ33、適応オフセットフィルタ80および適応フィルタ70を経由したのち、フィルタ済復号画像P_FLとしてバッファメモリ24に格納され、インター予測における参照画像として利用される。
 なお、動きベクトル冗長性削除部29は、動きベクトル検出部27によって検出された動きベクトルmvにおける冗長性を削除する。具体的には、(1)動きベクトルmvの推定に用いる推定方法を選択し、(2)選択した推定方法に従って推定動きベクトルpmvを導出し、(3)動きベクトルmvから推定動きベクトルpmvを減算することにより動きベクトル残差MVDを生成する。動きベクトル冗長性削除部29は、生成した動きベクトル残差MVDを、選択した推定方法を示す推定動きベクトルインデックスPMVIと共に、予測方式制御部28に供給する。
 デブロッキングフィルタ33は、復号画像Pにおけるブロック境界、またはCU境界を介して互いに隣接する画素の画素値の差が予め定められた閾値よりも小さい場合に、復号画像Pにおける当該ブロック境界、または当該CU境界に対してデブロッキング処理を施すことによって、当該ブロック境界、または当該CU境界付近の画像の平滑化を行う。デブロッキングフィルタ33によりデブロッキング処理が施された画像は、デブロック済復号画像P_DBとして、適応オフセットフィルタ80に出力される。
 適応オフセットフィルタ80は、デブロッキングフィルタ33から供給されるデブロック済復号画像P_DBに対して、適応的オフセットフィルタ処理を施すことによってオフセットフィルタ済復号画像P_OFを生成する。生成されたオフセットフィルタ済復号画像P_OFは、適応フィルタ70に供給される。適応オフセットフィルタ80の具体的な構成については、後述するため、ここでは説明を省略する。
 適応フィルタ70は、適応オフセットフィルタ80から供給されるオフセットフィルタ済復号画像P_OFに対して、適応的なフィルタ処理を施すことによって、フィルタ済復号画像P_FLを生成する。適応フィルタ70によりフィルタ処理が施されたフィルタ済復号画像P_FLは、バッファメモリ24に格納される。適応フィルタ70によって用いられるフィルタ係数は、フィルタ済復号画像P_FLと符号化対象画像#10との誤差がより小さくなるように定められたものであり、このようにして定められたフィルタ係数がフィルタパラメータFPとして符号化され、動画像復号装置1に伝送される。
 (適応オフセットフィルタ80)
 図15は、適応オフセットフィルタ80の構成を示すブロック図である。図15に示すように、適応オフセットフィルタ80は、適応オフセットフィルタ情報設定部81及び適応オフセットフィルタ処理部82を備えている。
 また、図15に示すように、適応オフセットフィルタ情報設定部81は、オフセット算出部811、オフセットシフト部816、オフセットクリップ部812、オフセット情報選択部813、及びオフセット属性設定部815を備えている。
 (オフセット算出部811)
 オフセット算出部811は、対象の処理単位(例えばLCU)に含まれる所定の分割深度までの全てのQAOMUに対して、全てのオフセットタイプ及び全てのクラスについてのオフセットを算出する。ここで、オフセットタイプ及びクラスは、動画像復号装置1の説明において説明したものと同じものを指す。
 図16は、オフセット算出部811による処理の流れを示すフローチャートである。
 (ステップS201)
 まず、オフセット算出部811は、処理対象とする対象QAOMUのQAOMU番号をループ変数とする第1のループを開始する。例えば、図7(a)~(e)に示した例の場合、当該第1のループは、QAOMU番号=0からQAOMU番号=340までのループである。
 (ステップS202)
 続いて、オフセット算出部811は、対象QAOMUに対して選択可能なオフセットタイプをループ変数とする第2のループを開始する。当該第2のループは、オフセットタイプ1からオフセットタイプ6までのループである。
 (ステップS203)
 続いて、オフセット算出部811は、対象QAOMUに含まれる画素を単位とする第3のループを開始する。
 (ステップS204)
 続いて、オフセット算出部811は、対象画素を複数のクラスの何れかに分類する。より具体的には、第2のループ変数であるオフセットタイプが1~4であるとき、対象画素をクラス1~4の何れかに分類する。本ステップにおける分類処理は、動画像復号装置1における適応オフセットフィルタ60の備えるクラス分類部624による分類処理例1~分類処理例4の何れかと同じ処理である。
 また、対象QAOMUに関して、クラス毎に、画素が分類された回数である分類回数count[part_idx][sao_type_index][class_idx]を算出する。ここで、part_idxは、QAOMU番号を表す。
 (ステップS205)
 続いて、オフセット算出部811は、対象画素におけるデブロック済復号画像P_DBの画素値と該対象画素における符号化対象画像#10の画素値との差分をとることによって該対象画素における差分画素値を算出する。より具体的には、対象画素の位置を(x、y)としたとき、P_DB(x、y)-Org(x、y)を算出する。ここで、P_DB(x、y)は、対象画素におけるデブロック済復号画像P_DBの画素値を表しており、Org(x、y)は、対象画素における符号化対象画像#10の画素値を表している。
 (ステップS206)
 本ステップは、第3のループの終端である。本ステップが終了した時点で、対象QAOMUに含まれる全ての画素に関して、差分画素値が算出されていることになる。
 (ステップS207)
 続いて、オフセット算出部811は、対象QAOMUに含まれる各画素についての差分画素値のクラス毎の総和を、該クラスの分類回数で除算することによってオフセットを算出する。より具体的には、オフセット算出部811は、対象QAOMU、対象オフセットタイプ、及び対象クラスについてのオフセットoffset[part_idx][sao_type_idx][class_idx]を以下の式を用いて算出する。
  offset[part_idx][sao_type_idx][class_idx] = Σ(P_DB(x、y)-Org(x、y))/count[part_idx][sao_type_idx][class_idx]
ここで、記号Σは、part_idxによって指定される対象QAOMU、及びsao_type_idxによって指定される対象オフセットタイプにおいて、class_idxによって指定される対象クラスに分類された画素についての和をとることを示している。
 (ステップS208)
 本ステップは第2のループの終端である。
 (ステップS209)
 本ステップは第3のループの終端である。
 以上の処理により、オフセット算出部811は、対象LCUに含まれる所定の分割深度までの全てのQAOMUに対して、全てのオフセットタイプ及び全てのクラスについてのオフセットを算出する。例えば、図7(a)~(e)に示す例の場合、オフセット算出部811は、合計で、
  ((分割深度0のQAOMUの総数)+...+(分割深度4のQAOMUの総数))×((EOのオフセットタイプ数)×(EOのクラス数)+(BOのオフセットタイプ数)×(BOのクラス数))=(1+4+16+64+256)×((4×4)+(2×16))=16368(個)
のオフセットを算出することになる。ここで、各オフセットのビット数は例えば10ビットである。
 オフセット算出部811は、上記の処理によって算出したオフセット、オフセットタイプ、クラス、及び、QAOUの分割構造を表すQAOU構造情報からなるオフセット情報をオフセットシフト部816に供給する。
 なお、動画像符号化装置2は、上記ステップS204において何れの分類処理例に係る分類処理を行ったのかを示すフラグを符号化する構成とし、動画像復号装置1の備える適応オフセットフィルタ60は、当該フラグを参照し、当該フラグの示す分類処理と同じ分類処理を行う構成とすることができる。また、そのようなフラグを用いることなく、動画像符号化装置2と動画像復号装置1とで予め定められた同じ分類処理を行う構成としてもよい。
 (オフセットシフト部816)
 オフセットシフト部816は、オフセット算出部811から供給されるオフセット情報に含まれる各オフセットの量子化を行う。量子化はオフセットを右側へビットシフトすることで、オフセットを画素ビット深度の精度からオフセットのビット深度の精度へ変換する。なお、シフト処理におけるシフト量は、後述するオフセット属性設定部815によって供給されるシフト値により決定される。
 (オフセットクリップ部812)
 オフセットクリップ部812は、後述するオフセット属性設定部815から供給されるオフセット値域へ制限するために、オフセットシフト部816から供給されるオフセットに対して以下に示すようなクリップ処理1、クリップ処理2の何れかの処理によってクリップの処理を行う。
 (クリップ処理1)
 オフセットクリップ部812は、オフセットシフト部816から供給されるオフセット情報に含まれる各オフセットに対してクリップ処理を行う。オフセットクリップ部812は、オフセットシフト部816から供給される各オフセットを例えば-8から7までの値にクリップすることによって、各オフセットを4ビットで表現する。クリップされた各オフセットは、オフセット情報選択部813に供給される。クリップするビット幅は、動画像復号装置1と同様、画像のビット深度とオフセットのビット深度に応じて設定される。
 このように、各オフセットをクリップすることによって、各オフセットが格納されるメモリ(不図示)のメモリサイズを削減することができる。また、符号化データ#1に含まれるオフセットの符号量を削減することができるので、符号化効率の向上を図ることができる。また、過度なオフセットが加算されることが抑制されるので、適切な画質が保証される。
 (クリップ処理2)
 また、オフセットクリップ部812は、オフセットシフト部816から供給される各オフセットのクリップ範囲を、オフセットタイプに応じて異なる値を設定する構成としてもよい。
 例えば、オフセットタイプがエッジオフセットである場合には、オフセットのビット数を8ビットとし、オフセットタイプがバンドオフセットである場合には、オフセットのビット数を4ビットとする。より一般には、オフセットタイプがエッジオフセットである場合のオフセットのビット数をNビットとし、オフセットタイプがバンドオフセットである場合のオフセットのビット数をMビットとしたとき、N>Mが満たされるようにオフセットのビット数を定める。
 このようにオフセットタイプに応じて、オフセットのビット数を異ならせることによって、各オフセットを格納するためのメモリに過度なメモリサイズを要求することなく、符号化効率の向上を図ることができる。
 なお、オフセットの取り得る値を制限するための閾値thが2m-1より大きく、2m以下であるとき、当該オフセットを符号化するための符号化方式として、mビットの固定長符号化を用いることができる。より具体的には、最大値とthとするTruncated unary符号化や、Truncated Rice符号化を用いることができる。なお、上記の最大値thは、オフセット属性設定部815から供給されるオフセット値域によって決定される。
 また、上記クリップ処理1及び2を組み合わせて得られるクリップ処理も本実施の形態に含まれる。また、適応オフセットフィルタ80は、オフセットクリップ部812を備えない構成としてもよい。
 (オフセット情報選択部813)
 オフセット情報選択部813は、RDコスト(Rate-Distorsion cost)がより小さくなるオフセットタイプ、クラス、オフセットの組み合わせ、及び、それに対応するQAOU分割構造を決定し、決定したオフセットタイプ、クラス、オフセット及び、それに対応するQAOM分割構造を示すQAOU情報を可変長符号符号化部22に供給する。また、オフセット情報選択部813は、決定したオフセットをQAOU毎又はQAOMU毎に適応オフセットフィルタ処理部82に供給する。
 オフセット情報選択部813の処理について図17~図18を参照してより具体的に説明すれば以下の通りである。図17は、オフセット情報選択部813による処理の流れを示すフローチャートである。
 (ステップS301)
 まず、オフセット情報選択部813は、処理対象とする対象QAOMUのQAOMU番号をループ変数とする第1のループを開始する。
 (ステップS302)
 続いて、オフセット情報選択部813は、対象QAOMUに対して選択可能なオフセットタイプをループ変数とする第2のループを開始する。当該第2のループは、オフセットタイプ1からオフセットタイプ6までのループである。
 (ステップS303)
 続いて、オフセット情報選択部813は、対象オフセットタイプについて、対象QAOMUにおけるオフセットフィルタ済復号画像P_OFと符号化対象画像#10との二乗誤差を対算出する。
 (ステップS304)
 本ステップは第2のループの終端である。
 (ステップS305)
 本ステップは第1のループの終端である。第1及び第2のループが終了した時点で、各QAOMUに関して、全てのオフセットタイプについての二乗誤差が算出されることになる。
 (ステップS306)
 続いて、オフセット情報選択部813は、対象の処理単位(例えばLCU)をQAOUに分割するQAOU分割構造のうち、RDコストがより小さくなるQAOU分割構造を決定する。
 本ステップにおけるオフセット情報選択部813の具体的な処理例を図18(a)~(d)を参照して説明すれば以下の通りである。
 まず、オフセット情報選択部813は、分割深度を0としたときのRDコストと分割深度を1とした場合のRDコストを計算する(図18(a))。図18(a)では、分割深度1のRDコストが分割深度0のRDコストよりも小さいものとする(図18(b))。
 続いて、オフセット情報選択部813は、分割深度を2とした場合のRDコストを計算する(図18(c))。
 続いて、オフセット情報選択部813は、分割深度1のQAOMUのRDコストと該分割深度1のQAOMUに含まれる分割深度2のQAOMUのRDコストとを比較し、分割深度2のQAOMUのRDコストの方が小さい場合には、該分割深度1のQAOMUを分割深度2のQAOMUに更新する(図18(d))。この処理を最大の分割深度に到達するまで繰り返す。これによって、RDコストがより小さくなるQAOU分割構造が決定される。
 (オフセット属性設定部815)
 オフセット属性設定部815は、図示されない画素ビット深度を入力としてオフセットのビット深度を決定する。決定されたオフセットのビット深度により、オフセット値域及びシフト値を設定する。オフセット値域は適応オフセットフィルタ処理部82に供給され、シフト値はオフセットシフト部816に供給される。オフセット値域及びシフト値の設定は上述したオフセット属性設定部613と同一の処理のため、ここでは説明を省略する。
 (適応オフセットフィルタ処理部82)
 適応オフセットフィルタ処理部82は、対象QAOUにおけるデブロック済復号画像P_DBの各画素に対して、オフセット情報選択部813から供給されるオフセットを加算する。適応オフセットフィルタ処理部82は、デブロック済復号画像P_DBに含まれる全てのQAOUに対して処理を行って得られる画像をオフセットフィルタ済復号画像P_OFとして出力する。なお、適応オフセットフィルタ処理部82の構成は、適応オフセットフィルタ処理部62と同一のため、ここでは説明を省略する。ここで図示されない適応オフセットフィルタ処理部82に含まれるオフセット情報格納部に格納される各オフセットは、オフセット属性設定部815によって設定されるオフセット値域に制限される。
 〔実施の形態2〕
 実施の形態1では、符号化データ#1に含まれるsao_offset[sao_curr_depth][ys][xs][i]は、適応オフセットフィルタによるオフセットフィルタ処理において、対象QAOUに含まれる各画素に加算されるオフセットの具体的な値を表すシンタックスであるものとした。
 一方で、発明者は、オフセットフィルタ処理に用いられるオフセットの値を予測符号化、すなわち、オフセットの値と当該オフセットの値の予測値とを用いて算出されるオフセット残差を符号化することによって、符号化データの符号量を更に削減することができるとの知見を得た。
 本実施の形態では、予測符号化されたオフセットし、オフセットフィルタ処理を行う動画像復号装置と、オフセットフィルタ処理に用いたオフセットを予測符号化する動画像符号化装置について、図19~図21を参照して説明する。なお、実施の形態1において既に説明した部分については説明を省略する。
 (符号化データ)
 本実施の形態に係る符号化データは、実施の形態1に係る符号化データ#1に含まれるsao_offset[sao_curr_depth][ys][xs][i]に代えて、オフセット残差sao_offset_residual[sao_curr_depth][ys][xs][i]を含んでいる。本実施の形態に係る符号化データのその他の構成は、実施の形態1に係る符号化データ#1の構成と同様である。以下では、本実施の形態に係る符号化データを符号化データ#3と表記することもある。
 (sao_offset_residual)
 オフセット残差sao_offset_residual[sao_curr_depth][ys][xs][i]は、本実施の形態に係る適応オフセットフィルタによるオフセットフィルタ処理において対象QAOUに含まれる各画素に加算されるオフセットの値と、該オフセットの値の予測値との重みつき差分値であり、sao_offset_residual[sao_type_idx][class_idx]とも表記する。
 対象QAOUに含まれる対象画素に加算されるオフセットをOffset[sao_type_idx][class_idx]と表記したとき、オフセット残差sao_offset_residual[sao_type_idx][class_idx]は、
  sao_offset_residual[sao_type_idx][class_idx]
  = Offset[sao_type_idx][class_idx] 
  - a*pred_offset[merge_tbl[sao_type_idx]][class_idx]
によって与えられる。ここで、aは、予測値pred_offsetに乗ぜられる重み係数であり、merge_tblは、sao_type_idxを引数とする関数である。a及びmerge_tblの具体例については後述するためここでは説明を省略する。
 (動画像復号装置)
 本実施の形態に係る動画像復号装置は、実施の形態1に係る動画像復号装置1の備える適応オフセットフィルタ60に代えて、適応オフセットフィルタ60’を備えている。本実施の形態に係る動画像復号装置のその他の構成は、実施の形態1に係る動画像復号装置1の構成と同様である。
 図19は、本実施の形態に係る適応オフセットフィルタ60’の構成を示すブロック図である。図19に示すように、適応オフセットフィルタ60’は、適応オフセットフィルタ60の備えるオフセット情報復号部611に代えて、オフセット情報復号部611’を備えている。
 (オフセット情報復号部611’)
 オフセット情報復号部611’は、符号化データ#3に含まれているQAOU情報を参照し、QAOU情報に含まれているオフセット情報OIを復号する。また、オフセット情報OIを復号することによって得られたオフセット残差sao_offset_residual[sao_type_idx][class_idx]と、予測値pred_offset[merge_tbl[sao_type_idx]][class_idx]とを用いて、適応オフセットフィルタ処理に用いられるオフセットOffset[sao_type_idx][class_idx]を、
  Offset[sao_type_idx][class_idx]
  =a*pred_offset[merge_tbl[sao_type_idx]][class_idx]
  + sao_offset_residual[sao_type_idx][class_idx]
によって算出し、算出したオフセットOffset[sao_type_idx][class_idx]を、オフセット情報格納部621に格納する。ここで、pred_offset[merge_tbl[sao_type_idx]][class_idx]は、Offset[sao_type_idx][class_idx]の予測値である。merge_tbl[sao_type_idx]は、sao_type_idx=1~6に対して、インデックスが与えられるテーブルであり、1つ以上のsao_type_idxを同一のグループとしてみなすことが可能である。
 (pred_offsetの具体例1)
 pred_offset[merge_tbl[sao_type_idx]][class_idx]の第1の具体例について説明する。本例では、予測値pred_offset[merge_tbl[sao_type_idx]][class_idx]を、
  pred_offset[merge_tbl[sao_type_idx]][class_idx]
  = Offset'[sao_type_idx][class_idx]
によって定める。ここで、Offset'[sao_type_idx][class_idx]は、復号済みのオフセットであって、オフセットタイプインデックスsao_type_idx、及び、クラスインデックスclass_idxに関連付けられたオフセットを表している。
 このように、本例では、Offset[sao_type_idx][class_idx]の予測値として、復号済みのオフセットであって、オフセットタイプインデックスsao_type_idx、及び、クラスインデックスclass_idxに関連付けられたオフセットOffset'[sao_type_idx][class_idx]を用いる。
 (pred_offsetの具体例2)
 pred_offset[merge_tbl[sao_type_idx]][class_idx]の第2の具体例について説明する。本例では、予測値pred_offset[merge_tbl[sao_type_idx]][class_idx]を、
  pred_offset[merge_tbl[sao_type_idx]][class_idx]
  = (pred_offset'[merge_tbl[sao_type_idx]][class_idx]*W1
   + Offset'[sao_type_idx][class_idx]*W2) >> log2(W1+W2)
によって定める。ここで、pred_offset'[merge_tbl[sao_type_idx]][class_idx]は、復号済みのオフセットOffset'[sao_type_idx][class_idx]を算出する際に用いた予測値を表している。また、「*」は、積をとる演算記号を表しており、「>>」は右ビットシフトを表している。また、W1及びW2は、それぞれ重み係数を表しており、例えば、W1=3、W2=1ととることができる。W1及びW2の具体的な値は、符号化効率がより高くなるように定めればよい。
 上式から明らかなように、本例では、pred_offsetを求めるために、pred_offset'及びOffset'を参照し、pred_offset'を求めるためにpred_offset''及びOffset''を参照し、...のように復号済みの予測値及びオフセットが再帰的に参照されるので、pred_offsetには、復号済みの複数のオフセットが寄与することになる。したがって、予測値の過度な変動が抑制される。これにより、例えば、ノイズの影響によって適切でない予測値が算出されるような場合であっても、そのような適切でない予測値の影響を抑制することができるので、符号化効率の向上を図ることが出来る。
 (pred_offsetの具体例3)
 pred_offset[merge_tbl[sao_type_idx]][class_idx]の第3の具体例について説明する。本例では、予測値pred_offset[merge_tbl[sao_type_idx]][class_idx]を、
  pred_offset[merge_tbl[sao_type_idx]][class_idx]
  = clip3(-th、 th、 pred_offset[merge_tbl[sao_type_idx]][class_idx])
によって定める。ここで、clip3(A、B、C)は、値Cを下限値A及び上限値Bでクリップすることを示している。また、clip3の引数のpred_offset[merge_tbl[sao_type_idx]]は、例えば、上記具体例1または2のように定められるものとする。また、閾値thは、例えば、画素値のビット深度bit_depthに依存して以下のように定められる。
 th = 4 (bit_depth = 8)
 th = 8 (bit_depth > 8)
 このように、本例では、上限値及び下限値でクリップした予測値を用いることによって、大きすぎる予測値や小さすぎる予測値が生じることがないので、符号化効率の向上を図ることが出来る。また、上限値及び下限値の絶対値は、画素値のビットが大きいときに大きくなるように設定されているので、画素値のビット深度に応じて、適切なクリップ処理を行うことができ、画質の劣化を防止することができる。
 (merge_tblの具体例1)
 図20(a)は、関数merge_tbl[sao_type_idx]の第1の具体例を示す表である。図20(a)に示すように、本例に係るmerge_tbl[sao_type_idx]は、sao_type_idx=0のときには値をとらず、sao_type_idx=1~6のとき、それぞれ、0~5の値をとる。したがって、本例に係るmerge_tbl[sao_type_idx]は、
  merge_tbl[sao_type_idx] = sao_type_idx - 1
と表現することもできる。
 本例に係るmerge_tbl[sao_type_idx]を用いることによって、オフセット情報復号部611’は、予測値pred_offsetを、各々のsao_type_idx及び各々のclass_idxに対して個別に定めるので、オフセット残差sao_offset_residualの符号量を削減することができる。
 (merge_tblの具体例2)
 図20(b)は、関数merge_tbl[sao_type_idx]の第2の具体例を示す表である。図20(b)に示すように、本例に係るmerge_tbl[sao_type_idx]は、エッジオフセット(sao_type_idx=1~4)のとき、0の値をとり、バンドオフセット(sao_type_idx=5~6)のとき、1~2の値をとる。
 例えば、先のオフセットの算出の際にsao_type_idx=1(merge_tbl[sao_type_idx=1]=0)及びclass_idx=1が指定され、次のオフセットの算出の際にsao_type_idx=2(merge_tbl[sao_type_idx=2]=0)及びclass_idx=1が指定されたとすると、当該次のオフセットを算出する際に用いられる予測値は、当該先のオフセットの算出の際に用いられた予測値と同じものとなる。
 本例に係るmerge_tbl[sao_type_idx]を用いることによって、オフセット情報復号部611’は、エッジオフセットが指定された場合、及びバンドオフセットが指定された場合の各々について、以下の処理を行うことになる。
 ・エッジオフセットが指定された場合
 復号対象のオフセットに関連付けられたクラスと同じクラスの復号済みのオフセットから当該復号対象のオフセットの予測値を算出する。ここで、復号対象のオフセットと予測値とはクラスが同じであれば、オフセットタイプは異なっていてもよい。したがって、あるオフセットタイプのオフセットを算出するために設定された予測値を、当該あるオフセットとは異なるオフセットタイプのオフセットを算出するために用いることができるので、予測値を設定するための処理が軽減される。
 ・バンドオフセットが指定された場合
 復号対象のオフセットに関連付けられたオフセットタイプ及びクラスと同じオフセットタイプ及びクラスのオフセットから当該復号対象のオフセットの予測値を算出する。
 本例に係るmerge_tbl[sao_type_idx]を用いれば、処理量を削減しつつ適切な予測値を算出することができる。
 (係数aの具体例)
 予測値pred_offsetに乗ぜられる重み係数aは、オフセットタイプによらずに1を用いてもよいし、オフセットタイプに依存して異なる値を用いてもよい。
 例えば、
  a=1(エッジオフセットのとき)
  a=0.5(バンドオフセットのとき)
としてもよい。より一般には、エッジオフセットが指定された場合の係数aを、a(edge)と表し、バンドオフセットが指定された場合の係数aを、a(band)と表すことにすると、
  a(edge)>a(band)
を満たすものを用いればよい。
 発明者は、エッジオフセットが指定される場合の、復号済みのオフセットと復号対象のオフセットとの間の相関は、バンドオフセットが指定される場合の、復号済みのオフセットと復号対象のオフセットとの間の相関よりも大きいことを見出した。上記の具体例では、復号済みのオフセットと復号対象のオフセットとの相関の影響を適切に取り込むことができるので、オフセット残差の符号量が削減される。
 (動画像符号化装置)
 本実施の形態に係る動画像符号化装置は、実施の形態1に係る動画像符号化装置2の備える適応オフセットフィルタ80に代えて、適応オフセットフィルタ80’を備えている。本実施の形態に係る動画像符号化装置のその他の構成は、実施の形態1に係る動画像符号化装置2の構成と同様である。
 図21は、本実施の形態に係る適応オフセットフィルタ80’の構成を示すブロック図である。図21に示すように、適応オフセットフィルタ80’は、適応オフセットフィルタ60の備える各部に加えて、オフセット残差導出部814を備えている。
 (オフセット残差導出部814)
 オフセット残差導出部814は、オフセット情報選択部813から供給されるオフセットと、当該オフセットの予測値との差分をとることによって、オフセット残差を算出する。当該オフセット残差は、QAOU情報の一部として、可変長符号符号化部22によって符号化される。
 オフセット残差導出部814により設定される予測値は、本実施の形態に係る動画像復号装置の備えるオフセット情報復号部611’により設定される予測値と同様であるので、ここでは説明を省略する。
 (付記事項1)
 本発明は以下のように記載することもできる。
 本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域におけるオフセット属性を設定するオフセット属性設定手段と、上記設定されたオフセット属性に含まれるオフセット値域に応じたビット幅を有するオフセットを復号するオフセット復号手段と、上記入力画像の各画素値に上記オフセットを加算するフィルタ手段とを備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、上記オフセット属性設定手段により、符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域におけるオフセット属性を設定し、設定されたオフセット属性に含まれるオフセット値域に応じたビット幅を有するオフセットを上記オフセット復号手段により復号するので、オフセットを格納しておくためのメモリサイズを効果的に削減することができる。
 したがって、上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。
 なお、上記オフセットタイプ指定情報は、上記入力画像毎に定められているものであってもよいし、上記単位領域毎に定められているであってもよい。また、上記入力画像の所定のセット毎に定められているものであってもよいし、上記単位領域の所定のセット毎に定められているものであってもよい。
 また、上記オフセットタイプ指定情報は、各単位領域における上記入力画像の画素値のビット深度を含み、上記オフセット復号手段は、上記画素値のビット深度に応じたビット幅を有するオフセットを復号することが好ましい。
 上記の構成によれば、上記オフセット復号手段は、上記画素値のビット深度に応じたビット幅を有するオフセットを復号するので、オフセットを格納しておくためのメモリサイズを効果的に削減することができる。
 なお、上記オフセットタイプ指定情報は、各単位領域における上記入力画像の画素値のビット深度を含み、上記オフセット復号手段は、上記ビット深度に応じた値域を表現可能なビット幅を有するオフセットを復号する構成としてもよい。
 上記の構成によれば、上記オフセット復号手段は、各単位領域における上記入力画像の画素値のビット深度に応じた値域を表現可能なビット幅を有するオフセットを復号するので、オフセットを格納しておくためのメモリサイズを効果的に削減することができる。
 なお、上記ビット深度に応じた値域を表現可能なビット幅とは、値域の範囲に含まれる値を2進数で表現した時のビット幅を指し、例えば値域が-23~23-1のときは表現可能なビット幅は4ビットである。
 また、上記復号されたオフセットは量子化された値であり、上記フィルタ手段は、上記オフセット属性に含まれるパラメータを用いて上記オフセットを逆量子化した値を上記各画素値に加算することが好ましい。
 上記の構成によれば、上記復号されたオフセットは量子化された値であり、上記フィルタ手段は、上記オフセット属性に含まれるパラメータを用いて上記オフセットを逆量子化した値を上記各画素値に加算するので、上記オフセット属性に含まれるパラメータに応じたオフセットが各画像値に加算される。
 したがって、上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、符号化効率を向上させることができる。
 なお、上記オフセットタイプ指定情報は、画素値のシフト値を含み、上記フィルタ手段は、上記オフセットに替えて、該シフト値を用いて上記オフセットを逆量子化した値を加算する構成としてもよい。
 上記の構成によれば、上記オフセットタイプ指定情報は、画素値のシフト値を含み、上記フィルタ手段は、上記オフセットに替えて、該シフト値を用いて上記オフセットを逆量子化した値を加算するので、画素値のシフト値に応じたオフセットを得ることができる。したがって、オフセットを格納しておくためのメモリサイズを削減しつつ、符号化効率を向上させることができる。
 なお、画素値のシフト値とは、画素ビット深度とオフセットのビット深度の差分値のことを指し、該シフト値を用いて上記オフセットを逆量子化するとは、上記オフセットを該シフト値だけ左側へビットシフトを行い、オフセットのビット深度から画素ビット深度へ変換することを指す。
 また、上記オフセットタイプ指定情報は、上記入力画像に対して定まるものであることが好ましい。
 上記の構成によれば、オフセットタイプ指定情報は、上記入力画像に対して定まるものであるため、上記画像フィルタ装置は、上記入力画像に対して、適切なオフセット処理を行うことができる。
 また、本発明に係るオフセット復号装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを復号するオフセット復号装置であって、各オフセット残差を、符号化データから復号するオフセット残差復号手段と、各オフセットの予測値を、復号済みのオフセットから導出する予測値導出手段と、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、を備えていることを特徴としている。
 上記のように構成されたオフセット復号装置によれば、各オフセット残差を、符号化データから復号するオフセット残差復号手段と、各オフセットの予測値を、復号済みのオフセットから導出する予測値導出手段と、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、を備えているので、各オフセットをそのまま符号化する場合に比べて、符号量の少ない符号化データから、オフセットを適切に復号することができる。
 また、上記入力画像は、複数の単位領域から構成されており、上記オフセット残差復号手段は、各オフセット残差を、単位領域毎に定まるオフセットタイプ及び画素毎に定まるオフセットクラスに関連付けて復号し、上記予測値導出手段は、各オフセットの予測値を、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出する、ことが好ましい。
 上記の構成によれば、各オフセットの予測値を、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出するので、予測精度が向上する。したがって、上記の構成によれば、符号量の少ない符号化データから、オフセットを適切に復号することができる。
 また、上記入力画像は、複数の単位領域から構成されており、上記オフセット残差復号手段は、各オフセット残差を、単位領域毎に定まるオフセットタイプ及び画素毎に定まるオフセットクラスに関連付けて復号し、上記予測値導出手段は、各オフセットの予測値を、該オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合に、該オフセットと同一の第1のオフセットタイプ群及び同一のオフセットクラスに関連付けられた復号済みのオフセットから導出し、該オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合に、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出する、ことが好ましい。
 上記の構成によれば、各オフセットの予測値を、該オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合に、該オフセットと同一のオフセットタイプに関連付けられた復号済みのオフセットから導出し、該オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合に、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出するので、処理量を削減しつつ、予測精度を向上させることができる。したがって、上記の構成によれば、処理量を削減しつつ、符号量の少ない符号化データから、オフセットを適切に復号することができる。
 なお、上記第1のオフセットタイプとは、例えば、当該第1のオフセットタイプに関連付けられた単位領域における各画素が、例えば、該画素の近傍にエッジの態様に応じて、複数のクラスの何れかに分類されるものを指し、上記第2のオフセットタイプとは、当該第2のオフセットタイプに関連付けられた単位領域における各画素が、例えば、該画素の画素値に応じて、複数のクラスの何れかに分類されるものを指す。
 また、上記オフセット算出手段は、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差の線形関数として算出するものであり、上記予測値に乗ぜられる係数は、上記オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合と、上記オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合とで異なっている、ことが好ましい。
 上記の構成によれば、上記予測値に乗ぜられる係数は、上記オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合と、上記オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合とで異なっているので、オフセットタイプに応じて、より適切な係数を用いて上記オフセットを算出することができる。これにより符号化効率の向上を図ることができる。
 また、上記予測値導出手段は、各オフセットの予測値を、復号済みのオフセットと該復号済みのオフセットの予測値との加重平均をとることによって導出する、ことが好ましい。
 上記の構成によれば、各オフセットの予測値を、復号済みのオフセットと該復号済みのオフセットの予測値との加重平均をとることによって導出するので、各オフセットの予測値には、復号済みの複数のオフセットが寄与することになる。したがって、予測値の過度な変動が抑制される。これにより、例えば、ノイズの影響によって適切でない予測値が算出された場合であっても、そのような適切でない予測値の影響を抑制することができるので、符号化効率の向上を図ることが出来る。
 また、上記予測値導出手段は、導出した各予測値を、入力画像における各画素値のビット深度に応じた上限値及び下限値でクリップするクリップ手段を備えている、ことが好ましい。
 上記の構成によれば、導出した各予測値を、入力画像における各画素値のビット深度に応じた上限値及び下限値でクリップするので、大きすぎる予測値や小さすぎる予測値が生じることがなく、符号化効率の向上を図ることが出来る。
 また、本発明に係る画像フィルタ装置は、入力画像に作用する画像フィルタ装置であって、入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、上記算出手段によって参照される画素値、または、上記算出手段によって算出された差分値を所定のシフト値だけ右ビットシフトするビットシフト手段と、上記ビットシフト手段によって右ビットシフトされた差分値と0との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、右ビットシフトされた差分値と0との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類し、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するので、クラス分類処理が、ノイズの影響を受けにくくなり符号化効率が向上する。
 また、上記所定のシフト値は、上記対象画素の画素値のビット深度と正の相関を有している、ことが好ましい。
 上記の構成によれば、上記所定のシフト値は、上記対象画素の画素値のビット深度と正の相関を有しているので、符号化効率の向上をより効果的に図ることができる。
 また、本発明に係る画像フィルタ装置は、入力画像に作用する画像フィルタ装置であって、入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、上記算出手段によって算出された差分値と、予め定められた第1及び第2の閾値との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えていることを特徴としている。
 上記のように構成された画像フィルタ装置は、上記算出手段によって算出された差分値と、予め定められた第1及び第2の閾値との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類し、上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するので、クラス分類処理が、ノイズの影響を受けにくくなり符号化効率が向上する。
 また、上記第1及び第2の閾値の絶対値は、上記対象画素の画素値のビット深度と正の相関を有している、ことが好ましい。
 上記の構成によれば、上記第1及び第2の閾値の絶対値は、上記対象画素の画素値のビット深度と正の相関を有しているので、符号化効率の向上をより効果的に図ることができる。
 また、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像に作用する画像フィルタ装置であって、第1及び第2のオフセットタイプのうち、入力画像における対象画素を含む対象単位領域が属するオフセットタイプを決定する決定手段と、上記対象単位領域の属するオフセットタイプ、及び上記対象画素の画素値に応じて、上記対象画素を、オフセットを加算しないオフセットクラス、及びオフセットを加算する複数のオフセットクラスの何れかに分類する分類手段と、上記対象画素の画素値に対して、上記対象単位領域の属するオフセットタイプ及び上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、を備えており、上記分類手段は、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類する、ことを特徴としている。
 上記のように構成された画像フィルタ装置によれば、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類するので、ブロックノイズを効果的に除去することができる。したがって、上記の構成によれば、符号化効率の向上を図ることができる。
 また、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定する決定手段と、上記オフセットタイプに応じて、異なるビット幅を有するオフセットを決定すると共に、該オフセットを符号化するオフセット符号化手段と、上記入力画像の各画素値に上記決定されたオフセットを加算するフィルタ手段とを備えていることを特徴としている。
 上記のように構成された画像フィルタ装置によれば、複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定し、決定されたオフセットタイプに応じて、異なるビット幅を有するオフセットを決定し、決定されたオフセットを、上記入力画像の各画素に加算する。また、決定されたオフセットを符号化する。
 したがって、上記の構成によれば、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。また、上記の構成によれば、符号化データの符号量が削減されるので、符号化効率が向上する。
 また、本発明に係るオフセット符号化装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを符号化するオフセット符号化装置であって、各オフセットの予測値を、符号化済みのオフセットから導出する予測値導出手段と、各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段と、を備えていることを特徴としている。
 上記のように構成されたオフセット符号化装置によれば、各オフセットの予測値を、符号化済みのオフセットから導出する予測値導出手段と、各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段とを備えているので、符号化データの符号量を削減することができる。
 また、本発明に係る符号化データのデータ構造は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタによって参照される符号化データのデータ構造であって、各単位領域が属するオフセットタイプを指定するオフセットタイプ指定情報と、該オフセットタイプに応じて異なるビット幅を有するオフセットとを含んでおり、上記画像フィルタは、上記符号化データに含まれるオフセットタイプ指定情報を参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号することを特徴としている。
 上記のように構成された符号化データは、オフセットタイプに応じて異なるビット幅を有するオフセットを含んでいるので、符号化データの符号量が削減される。また、上記符号化データを復号する画像フィルタは、上記オフセットタイプ指定情報を参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号するので、オフセットを格納しておくためのメモリサイズを削減しつつ、適切なオフセットフィルタ処理を行うことができる。
 なお、上記オフセットタイプ指定情報は、上記入力画像毎に定められているものであってもよいし、上記単位領域毎に定められているものであってもよい。また、上記入力画像の所定のセット毎に定められているものであってもよいし、上記単位領域の所定のセット毎に定められているものであってもよい。
 〔実施の形態3〕
 まず、本実施の形態におけるオフセット情報OIについて、図23を参照して説明する。図23(a)は、オフセット情報OI(図23(a)において“sao_offset_param()”と表記)のシンタクスを示す図である。
 図23(a)に示すように、オフセット情報OIには、パラメータ“sao_type_idx[sao_curr_depth][ys][xs]”が含まれている。また、パラメータ“sao_type_idx[sao_curr_depth][ys][xs]”が「0」でない場合、オフセット情報OIには、パラメータ“sao_offset[sao_curr_depth][ys][xs][i]”が含まれている。
 (sao_curr_depth、ys、xs)
 “sao_type_idx”および“sao_offset”の引数である“sao_curr_depth”は、QAOUの分割深度を表すパラメータであり、“ys”および“xs”は、それぞれ、QAOU(または後述するQAOMU)のy方向の位置およびx方向の位置を表すためのパラメータである。
 “sao_curr_depth”の値に応じたQAOUの分割の態様については、図4を参照して上記で説明したとおりである。
 図23(b)は、QAOU情報(図23(b)において“sao_split_param()”と表記)のシンタクスを示す図である。図23(b)のシンタクスで示すように、分割深度“sao_curr_depth”が所定の“saoMaxDepth”で設定される最大値よりも小さければ、パラメータ“sao_split_flag”によって、QAOUがさらに分割されるかどうかが選択される。分割される場合には、次の階層深度の“sao_split_param()”が再帰的に呼び出される。分割深度が最大値に達した(“sao_curr_depth”が“saoMaxDepth”より小さくない)場合には、“sao_split_flag[sao_curr_depth][ys][xs]”には「0」が設定され、それ以上の分割は行われない。
 図44には、オフセット情報およびQAOU情報のシンタクスの別の例を示す。
 図44(a)は、オフセット情報のシンタクスである。図23(a)と同様の構成となっているが、“sao_offset_param()”の引数および、“sao_split_flag”、“sao_type_idx”、“sao_offset”の配列の添字に、色成分を意味する値である“component”が追加されている。これにより、輝度および色差などの色成分毎に異なるQAOU分割を行い、かつ、異なるオフセットを適用することができる。
 図44(b)は、QAOU情報のシンタクスである。図44(a)と同じく、図23(b)に引数として色成分“component”を追加したシンタクスである。
 図44(c)は、図44(a)および図44(b)のシンタクスを呼び出す、適応オフセットフィルタ全体のシンタクスである。パラメータ“sao_flag”は適応オフセットフィルタを適用するか否か選択するフラグであり、当該フラグが真である場合のみ、後続の適応オフセットフィルタに関するパラメータが用いられる。当該フラグが真である場合、各色成分に対して、シンタクス“sao_split_param()”および“sao_offset_param()”が最上位階層を指定して呼び出される。最上位階層であるため、各シンタクスに与えられる引数は、sao_curr_depth=0、ys=0、xs=0 である。また、“component”の値は、輝度(Y)の場合は0、色差(Cb)の場合は1、色差(Cr)の場合は2として、各色成分を区別している。なお、componentの値は、処理対象の色成分が区別できれば他の値でもよい。
 なお、色差(Cb)および色差(Cr)については、各々に対応するフラグ“sao_flag_cb”“sao_flag_cr”を用いて、適応オフセットフィルタを適用するか否かを選択し、適用しない場合には当該色成分に対応するQAOU情報およびオフセット情報を格納しない。
 上記の図44のシンタクスでは引数“component”が追加されているため、上記図23を用いた説明において、引数[sao_curr_depth][ys][xs]を[sao_curr_depth][ys][xs][component]に置き換えて処理する。以降の説明でも同様である。
 (動画像復号装置1’)
 次に、本実施の形態に係る動画像復号装置1’について、図22および図24~図29を参照して説明する。なお、上記の実施の形態において示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
 動画像復号装置1’は、動画像復号装置1と同様に、その一部に、H.264/MPEG-4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、および、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。また、動画像復号装置1’は動画像復号装置1における適応オフセットフィルタ60の代わりに適応オフセットフィルタ60’が設けられている点が異なり、他の構成は同様である。
 (適応オフセットフィルタ60’)
 次に、適応オフセットフィルタ60’の詳細について、図22を参照して説明する。図22は、適応オフセットフィルタ60’の構成を示すブロック図である。図22に示すように、適応オフセットフィルタ60’は、適応オフセットフィルタ情報復号部61’および適応オフセットフィルタ処理部62’を含む構成である。
 また、図22に示すように、適応オフセットフィルタ情報復号部61’は、オフセット情報復号部611、およびQAOU構造復号部612を含む構成である。
 オフセット情報復号部611は、符号化データ#1に含まれているQAOU情報を参照し、QAOU情報に含まれているオフセット情報OIを復号する。また、オフセット情報OIを復号することによって得られた“sao_type_idx[sao_curr_depth][ys][xs][component]”および“sao_offset[sao_curr_depth][ys][xs][i]”の各値を、それぞれの引数(sao_curr_depth、ys、xs)および(sao_curr_depth、ys、xs、i)に関連付けて、オフセット情報格納部621に供給する。
 より詳細には、オフセット情報復号部611は、符号化データ#1からコードを復号し、復号したコードを“sao_type_idx”の値に変換して、引数に関連付けてオフセット情報格納部621に供給する。ここで、オフセット情報復号部611は、コードの復号方法、およびコードから“sao_type_idx”の値への変換を、処理対象のQAOUの階層の深度によって変更している。このQAOUの階層の深度などの条件をパラメータ条件と呼ぶ。一般のパラメータ条件に応じたオフセット情報の復号については、図41、図42を用いて後述する。
 コードの復号方法は、処理対象のQAOUの階層の深度が閾値よりも小さい場合と処理対象のQAOUの階層の深度が閾値以上の場合とで、異なる最大値を用いて行うものであってもよいし、処理対象のQAOUの階層の深度が閾値以上の場合のみ最大値を用いるものであってもよい。また、処理対象のQAOUの階層の深度が閾値よりも小さい場合と処理対象のQAOUの階層の深度が閾値以上の場合とで、異なるバイナリゼーションを用いて行うものであってもよい。さらに、処理対象のQAOUの階層の深度が閾値よりも小さい場合と処理対象のQAOUの階層の深度が閾値以上の場合とで、異なるコンテキストを用いるものであってもよい。
 例えば、処理対象のQAOUの階層の深度が閾値よりも小さい場合には、可変長符号化(ue(v))でコードを復号し、処理対象のQAOUの階層の深度が閾値以上の場合には、オフセットタイプの数に応じたtruncated符号化(te(v))で、コードを復号してもよい。また、オフセットタイプ数が、2のべき乗であれば、固定長符号化で、コードを復号してもよい。オフセットタイプ数が4つであれば、2bitで表現可能であるので、2bitで固定長符号化とすることができる。
 また、オフセット情報復号部611は、復号したコードから“sao_type_idx”の値への変換は、図25に示すような変換テーブル801および変換テーブル802を用いて行う。図25(a)の変換テーブル801では、2通りの変換パターンを示している。この2通りの変換パターンは、処理対象のQAOUの階層の深度によって、使い分けられる。すなわち、オフセット情報復号部611は、処理対象のQAOUの階層の深度が、閾値よりも小さい場合は、変換テーブル801Aを用い、処理対象のQAOUの階層の深度が、閾値以上の場合は、変換テーブル801Bを用いる。
 図25(a)の変換テーブル801Aでは、コード「1」に対しオフセットタイプ「EO_0」(“sao_type_idx”=1)が対応付けられており、コード「2」に対しオフセットタイプ「EO_1」(“sao_type_idx”=2)が対応付けられており、コード「3」に対しオフセットタイプ「EO_2」(“sao_type_idx”=3)が対応付けられている。以下、コード4~6についても同様である。
 また、図25(a)の変換テーブル801Bでは、コード「1」に対しオフセットタイプ「EO_0」(“sao_type_idx”=1)が対応付けられており、コード「2」に対しオフセットタイプ「BO_0」(“sao_type_idx”=5)が対応付けられており、コード「3」に対しオフセットタイプ「BO_1」(“sao_type_idx”=6)が対応付けられている。そして、変換テーブル801Bでは、コード4~6は用いられていない。
 このように、変換テーブル801Aでは、適応オフセット(SAO)に用いるオフセットタイプの全てが含まれているのに対し、変換テーブル801Bでは、適応オフセット(SAO)に用いるオフセットタイプのうち、一部のオフセットタイプしか含まれていない。よって、処理対象のQAOUの階層の深度が、閾値以上の場合には、一部のオフセットタイプしか用いることができないことになる。
 これは、深い階層では、QAOUの面積が小さくなるため、QAOU内の画素値の特性が一様に近くなり、多くのタイプを用いなくとも、適切なオフセットを導出できるためである。また、これにより、用いるオフセットタイプ数を減らすことができるので、必要なメモリ量を減らすことができるとともに、オフセットタイプを示す符号化データのデータ長等を短くすることにより、符号化効率を向上させることができる。
 なお、変換テーブル801Bにおけるコードとオフセットタイプとの対応付けが、変換テーブル801Aにおけるコードとオフセットタイプとの対応付けの順序と同じなのであれば、変換テーブル801Aのみを用いる構成であってもよい。
 図25(b)の変換テーブル802は、変換テーブル801Bに代えて用いることができる、変換テーブル801Bと同様な変換テーブルの種々の例を示している。いずれの変換テーブルも、変換テーブル801B同様にタイプの種類が制限されている。また、空欄は該当するコードが用いられないことを示す。
 変換テーブル802Aは、エッジオフセットのみを用いる例でありバンドオフセットを含まない。エッジオフセットのオフセット数は通常4個であり、バンドオフセットのオフセット数は通常16個である。このように、エッジオフセットのオフセット数はバンドオフセットのオフセット数と比べ少ない。このため、バンドオフセットの使用を制限することにより、オフセットの保持に用いるメモリ量を削減することができる。特に、階層が深い場合、オフセットが増加するためメモリ量が大きくなる。また、階層が深い場合には、バンドオフセットの選択率が低下する。そのため、階層をパラメータ条件として、階層が深い場合にエッジオフセットのみを備える変換テーブル802Aを用い、階層が浅い場合には、エッジオフセットとバンドオフセットを備える変換テーブル(例えば801A)を用いることによって、符号化効率を低下させることなくメモリ量の削減が可能となる。また、符号化装置において不要な選択肢のコスト計算を省くことができるため処理量を低減することができる。
 変換テーブル802Bは、バンドオフセットのみを用いる例でありエッジオフセットを含まない。バンドオフセットはエッジオフセットに比べ、演算量が小さいこと、対象画素の周囲の画素を用いないため参照画素を保持するためのラインメモリなどが不要である、という特徴を有する。そのため、パラメータ条件に応じて、変換テーブル802Bを用いることで、上記による効果を得ることができる。変換テーブル802Cは、1つのバンドオフセット「BO_0」(“sao_type_idx”=5)のみを用いる例である。
 また、変換テーブル802Dは、変換テーブル801Bと同様に1つのエッジオフセットと2つのバンドオフセットを用いる例である。具体的には、オフセットタイプ「EO_0」(“sao_type_idx”=1)および「BO_0」(“sao_type_idx”=5)、「BO_1」(“sao_type_idx”=6)を用い、バンドオフセットタイプに優先的に短いコード(小さいコード番号)に対応付けた例である。階層が浅い場合は、階層が深い場合に比べバンドオフセットの選択率が高くなるため、階層をパラメータ条件として、階層が浅い場合に変換テーブル802Dを用い、使用頻度の高いタイプに短いコードに対応付けることで、符号化効率を向上させることができる。
 なお、図25に例示した以外にも、パラメータ条件に応じて、コードとオフセットタイプとの対応付けを変更することが可能である。変換テーブル801Aのいずれのエッジオフセットともバンドオフセットとも異なるオフセットタイプを、階層深度などの条件に応じて単独あるいは他のオフセットタイプとともに使用できる。その具体例としては、後述の別の実施形態において説明する、EOとBOの特徴を併せ持つオフセットタイプや、従来のエッジオフセット「EO_0」と異なる水平サンプル位置でエッジを検出するエッジオフセットや、従来のバンドオフセット「BO_0」および「BO_1」とは異なるバンド割り当てによるバンドオフセットが挙げられる。
 QAOU構造復号部612は、QAOU情報に含まれている“sao_split_flag[sao_curr_depth][ys][xs]”を復号することによって、QAOUの分割構造を決定し、決定されたQAOUの分割構造を表すQAOU構造情報を、オフセット情報格納部621に供給する。
 また、次に示すようなオフセット属性設定部613を備えていてもよい。オフセット属性設定部613は、オフセットのシフト値を決定する。符号化データのオフセットは、画素ビット深度(PIC_DEPTHとも呼称する)よりも精度の低いオフセットのビット深度(SAO_DEPTHとも呼称する)で符号化される。すなわち、符号化データ中のオフセットは、量子化されている。シフト値とは、逆量子化を行うために必要なビットシフト量を示す。また、オフセット属性設定部613は、オフセットのビット深度とオフセットの値域とを決定する。ここでは、オフセットのビット深度は、オフセット属性設定部613に入力される図示されない画素ビット深度(PIC_DEPTHとも呼称する)から決定する。画素ビット深度とは、適応オフセットフィルタ60の入力画像を構成する画素値の値域をビット幅で示すものであり、画素ビット深度がNビットのとき、画素値は0から2N-1の範囲を取る。
 SAOのビット深度およびシフト値は、以下の式を用いるが、後述するように、パラメータ条件に応じて他の値を用いても良い。
 SAO_DEPTH = MIN(PIC_DEPTH、10)
 シフト値 = PIC_DEPTH―MIN(PIC_DEPTH、10)
 また、量子化オフセットの値域を以下の式で決定する。
 また、図22に示すように、適応オフセットフィルタ処理部62’は、オフセット情報格納部621、QAOU制御部622、オフセットタイプ導出部623、クラス分類部624、オフセット導出部625、およびオフセット加算部626を含む構成である。
 オフセット情報格納部621は、QAOU構造情報、“sao_type_idx[sao_curr_depth][ys][xs]”、および“sao_offset[sao_curr_depth][ys][xs][i]”に基づいて、各QAOUについて指定されたオフセットタイプ、および該オフセットタイプにおいて選択可能な各クラスに関するオフセットの具体的な値を管理および格納するものであり、マップメモリおよびリストメモリを備えた構成である。
 マップメモリ、およびリストメモリについて、図24を参照して説明する。図24は、マップメモリおよびリストメモリに格納される例を示す図であり、図24(a)はマップメモリに格納されるQAOUインデックスの一例を説明するための図であり、図24(b)はリストメモリに格納される情報の一例を説明するための図である。
 マップメモリ601には、分割深度に応じて定まる各オフセット最小単位(QAOMU:Quad Adaptive Offset Minimum Unitとも呼称する)に割り付けられた後述するQAOUインデックスが格納されている。図24(a)では、対象の処理単位(例えばLCU)を構成する分割深度3の各QAOMUと各QAOMUに割り付けられたQAOUインデックスとを示している。なお、図24(a)では、QAOUの分割深度を考慮せずに、簡易的にインデックス0~9をQAOUに割り付けている。また、図24(a)に示す例においては、QAOUインデックス=Iによって指定されるQAOUをQAOUIと表記している。また、図24(a)における細線はQAOMUの境界を示しており、太線はQAOUの境界を示している。
 図24(a)に示すように、QAOU0は、4つのQAOMUから構成されており、これら4つのQAOMUには、QAOUインデックスとして0が割り付けられている。一方、QAOU3は、1つのQAOMUから構成されており、このQAOMUには、QAOUインデックスとして3が割り付けられている。このように、マップメモリには、各QAOMUに割り付けられたQAOUインデックスが格納されている。
 また、リストメモリ602には、各QAOUインデックスに対し、該QAOUインデックスに関連付けられたオフセットタイプ、および該オフセットタイプにおいて選択可能な各クラスに関するオフセットの具体的な値が互いに関連付けられて格納されている。
 具体的に、図24(b)を参照して説明する。図24(b)では、QAOUインデックス0~9の各々に関連付けられたオフセットタイプおよび各オフセットタイプにおいて選択可能な各クラスに関するオフセットを示している。図24(b)における「xxx」は、互いに異なり得る具体的な数値を表している。
 また、図24(b)における「BO_1」は、“sao_type_idx”=5によって指定されるオフセットタイプを表している。また、「EO_1」は、“sao_type_idx”=1によって指定されるオフセットタイプを表している。このように、“sao_type_idx”=1、2、3、4によって指定されるオフセットタイプであるエッジオフセットをそれぞれ「EO_1、2、3、4」とも表記し、“sao_type_idx”=5、6によって指定されるオフセットタイプであるバンドオフセットをそれぞれ「BO_1、2」とも表記する。
 図24(b)に示すように、オフセットタイプがバンドオフセットである場合、該オフセットタイプに関してリストメモリに格納されるオフセットは、オフセット1~オフセット16の合計16個である。ここで、オフセット1~オフセット16は、“sao_type_idx[sao_curr_depth][ys][xs]”の値が「5」または「6」である場合の、“sao_offset[sao_curr_depth][ys][xs][1]”~“sao_offset[sao_curr_depth][ys][xs][16]”によってそれぞれ指定される値のことを指す。
 一方、オフセットタイプがエッジオフセットである場合、該オフセットタイプに関してリストメモリに格納されるオフセットは、オフセット1~4の合計4個である。ここで、オフセット1~4は、“sao_type_idx[sao_curr_depth][ys][xs]”の値が「1、2、3、4」の何れかである場合の、“sao_offset[sao_curr_depth][ys][xs][1]”~“sao_offset[sao_curr_depth][ys][xs][4]”によってそれぞれ指定される値のことを指す。なお、エッジオフセットの場合、オフセット5~16にはなにも格納されない。
 なお、各QAOMUには、QAOMU番号が付されており、このQAOMU番号によって各QAOMUは互いに識別可能である。以下では、QAOMU番号がNQであるQAOMUをQAOMUNQとも表記する。
 また、本実施形態では、処理対象のQAOUの階層によって、オフセットの精度を異ならせるものであってもよい。オフセットの精度に応じて、逆量子化に用いるシフト値も異なる。この場合も、オフセットの精度及びシフト値は、画素ビット深度PIC_DEPTHを用いて導出する。
 オフセットの精度の例としては、例えば、QAOUの階層の深度が閾値より小さい場合のオフセットの精度、シフト値を、
 SAO_DEPTH = MIN(PIC_DEPTH、10)
 シフト値 = PIC_DEPTH―MIN(PIC_DEPTH、10)
として、QAOUの階層の深度が閾値以上である場合のオフセットの精度を、
 SAO_DEPTH = MIN(PIC_DEPTH、8)
 シフト値 = PIC_DEPTH―MIN(PIC_DEPTH、8)
のようにすれば、オフセットの精度を異なるものとすることができる。
 上述したように、オフセットの精度(オフセットのビット深度、SAO_DEPTH)と、入力画像を構成する画素値の値域をビット幅で表現した画素ビット深度(PIC_DEPTH)とは、量子化誤差の観点で互いに密接な関係がある。適応オフセットフィルタ60の出力画像のビット深度は、画素ビット深度PIC_DEPTHであり、SAO_DEPTHは画素に加えるオフセットのビット深度であるので、画素ビット深度を超える精度のオフセットを用いても出力過程で捨てられてしまい、SAO_DEPTHをPIC_DEPTHを超えて設定しても意味がない。逆に、SAO_DEPTHがPIC_DEPTHよりも小さい場合には、入力画像をフィルタにより補正可能な精度(PIC_DEPTH)よりも粗い補正しか行うことができないため、フィルタ効果は減少する。
 したがって、量子化されたオフセットを一定のビット幅で表現できるオフセット値域に制限することで、オフセット情報格納部621で量子化されたオフセットを格納するためのビット幅を制限することができる。これにより、制限しない場合と比較して、メモリサイズ削減の効果を得ることができる。一方で、過度にオフセット値域を狭くすることは、オフセットが復号画像の歪みを補正する効果を小さくしてしまい、オフセット加算処理によっても復号画像の歪みを除去することができず、符号化効率が低下してしまう。
 そこで、符号化効率が低下しないようにオフセット値域を最適な範囲を設定することにより、メモリの使用量を削減しつつ、フィルタの効果を維持することできる。
 そして、オフセット値域の値を表す最大のビット長をCLIP_BITとし、CLIP_BIT=SAO_DEPTH-Kの計算により、オフセット値域を-2CLIP_BIT-1~2CLIP_BIT-1-1と定めた場合に、発明者の実験によれば、K=4とすると、オフセット値域によりオフセットの範囲を制限しても符号化効率の低下がないことが発見された。
 そして、画素ビット深度=8の場合、オフセットのビット深度SAO_DEPTHも8であり、CLIP_BIT=8-K=4となる。1つのオフセットが4ビットで格納できることは、8ビットのバイトを単位として扱うソフトウェア等で、1バイトに1つのオフセットをパッキングして格納することが可能であり、簡易にメモリサイズの削減が可能となる。
 そして、設定されるオフセットの精度が、処理対象のQAOUの階層によって異なる場合、オフセット情報格納部621は、処理対象のQAOUの階層の深度に応じてオフセット格納領域の単位サイズを切り換えて確保している。
 具体的には、処理対象のQAOUの階層の深度が閾値より小さい場合のオフセットの精度がnビット(例えば、n=8または6)、処理対象のQAOUの階層の深度が閾値以上の場合のオフセットの精度がnビット(n>n、例えば、n=n-2)に設定されているとき、オフセット情報格納部621は、処理対象のQAOUの階層の深度が閾値より小さい場合のオフセットを格納する領域をnビット単位で確保し、処理対象のQAOUの階層の深度が閾値以上の場合のオフセットを格納する領域をnビット単位で確保している。
 なお、処理対象のQAOUの階層の深度が閾値以上の場合は、オフセット情報格納部621に対して、オフセットの読み書きを行うときに、書き込み時は(n-n)ビット切り下げ、読み出し時は(n-n)ビット切り上げて入出力を行う構成が好ましい。この構成によれば、他のモジュールにおいてオフセットの精度の差を考慮して処理を行う必要がなくなるためである。
 また、オフセット情報格納部621は、処理対象のQAOUの階層の深度に応じて、必要なクラス数が変わる場合、必要なクラス数に合わせて、確保するリストメモリの領域を切り換える。例えば、後述するように、処理対象のQAOUの階層の深度が閾値より小さい場合は16クラスに分類され、処理対象のQAOUの階層の深度が閾値以上となる場合は8クラスに分類されるバンドオフセットの場合を考える。この場合、処理対象のQAOUの階層の深度が閾値以上となる場合のクラスの確保に必要なメモリの容量は、処理対象のQAOUの階層の深度が閾値より小さい場合の半分となる。そこで、オフセット情報格納部621は、処理対象のQAOUの階層の深度が閾値以上となる場合に確保するリストメモリの大きさを、処理対象のQAOUの階層の深度が閾値より小さい場合の半分に切り換える。
 QAOU制御部622は、適応オフセットフィルタ処理部62に含まれる各部を制御する。また、QAOU制御部622は、QAOU構造情報を参照して、デブロック済復号画像P_DBを1または複数のQAOUに分割し、各QAOUを所定の順序でスキャンする。また、処理対象とする対象QAOMUを表すQAOMU番号をオフセットタイプ導出部623に供給する。
 オフセットタイプ導出部623は、オフセット情報格納部621のマップメモリおよびリストメモリを参照し、QAOU制御部622から供給されたQAOMU番号によって指定されるオフセットタイプを導出する。また、導出したオフセットタイプを、クラス分類部624に供給する。
 クラス分類部624は、対象QAOUに含まれる各画素を、オフセットタイプ導出部623から供給されるオフセットタイプにおいて選択可能な複数のクラスの何れかに分類する。また、当該オフセットタイプと、各画素が分類されたクラスを示すクラスインデックスとをオフセット導出部625に供給する。なお、クラス分類部624による具体的な分類処理については後述するためここでは説明を省略する。
 オフセット導出部625は、オフセット情報格納部621のリストメモリを参照し、対象QAOUに含まれる各画素について、クラス分類部624から供給されるオフセットタイプおよびクラスインデックスによって指定されるオフセットを導出する。さらにオフセット属性設定部613によって設定されたシフト値だけ、オフセットを左側へビットシフトするオフセット逆シフト部(不図示)を備える。オフセット逆シフト部は、オフセットのビット深度と画素ビット深度とを合わせるように、該オフセットの逆量子化を行う。このような逆量子化を行うことで、後述するオフセット加算部626の加算処理において、同一のビット深度にて、画素値とオフセットの加算を行うことが可能である。各画素について逆量子化したオフセットは、オフセット加算部626に供給される。
 オフセット加算部626は、対象QAOUにおけるデブロック済復号画像P_DBの各画素に対して、オフセット導出部625から供給されるオフセットを加算する。オフセット加算部626は、デブロック済復号画像P_DBに含まれる全てのQAOUに対して処理を行って得られる画像をオフセットフィルタ済復号画像P_OFとして出力する。
 次に、クラス分類部624による分類処理について、図26~29を参照して説明する。なお、以下では、QAOUの階層の深度などの条件をパラメータ条件とする場合を説明するが、一般のパラメータ条件に応じたクラス分類部の構成については図34を用いて後述する。
 図26は、適応オフセットフィルタ60によるオフセット処理を説明するための図であって、(a)は、処理対象画素xの画素値pix[x]と画素aまたはbの画素値との大小関係を示すグラフ、およびその大小関係に応じた関数Signの値を示し、(b)は、処理対象画素xの画素値と、画素aおよびbの画素値との大小関係を示すグラフ、およびその大小関係に応じたEgdeTypeの値を示し、(c)は、(b)に示した各グラフと、class_idxとの対応を示し、(d)~(f)は、EgdeTypeからclass_idxへの変換を表す変換テーブルを示している。
 図27は、適応オフセットフィルタ60によるオフセット処理を説明するための図であって、(a)は“sao_type_idx”=5であるときのクラス分類を概略的に示し、(b)は“sao_type_idx”=6であるときのクラス分類を概略的に示している。
 図28は、適応オフセットフィルタ60によるオフセット処理を説明するための図であって、(a)は処理対象のQAOUの階層の深度が閾値よりも小さい場合のクラス分類を概略的に示し、(b)は処理対象のQAOUの階層の深度が閾値以上の場合のクラス分類を概略的に示している。
 図29は、バンドオフセットが指定された場合のクラス分類の一例を示す図であり、(a)は、処理対象のQAOUの階層の深度が閾値よりも小さい場合のクラス分類の一例を示し、(b)は処理対象のQAOUの階層の深度が閾値以上の場合のクラス分類の一例を示している。
  (オフセットタイプ=1~4(エッジオフセット)のとき)
 オフセットタイプ導出部623から供給されるオフセットタイプが1~4の何れかであるときのクラス分類部624の処理は、上記で図10を参照して説明した通りである。
 よって、図26(a)に示すように、画素値pix[x]と画素aまたはbの画素値との大小関係において、画素値pix[x]の方が、画素aまたはbの画素値よりも小さい場合はSign(pix[x]-pix[a])=-1、同じ場合はSign(pix[x]-pix[a])=0、大きい場合はSign(pix[x]-pix[a])=1となる。なお、図26(a)においてpix[x]が付されている黒丸は、処理対象画素xの画素値を示すものであり、pix[x]が付されていない黒丸は、処理対象画素aまたはbの画素値を示すものである。また、図26(a)における上下方向は、画素値の大小を示している。
 続いて、クラス分類部624は、Sign(pix[x]-pix[a])、およびSign(pix[x]-pix[b])に基づいて、以下の数式(1-1)によってEgdeTypeを導出する。
  EgdeType=Sign(pix[x]-pix[a])+Sign(pix[x]-pix[b])+2   ・・・(1-1)
 これにより、図26(b)に示すように、画素値pix[x]に対し、画素aおよびbのいずれの画素値も大きい場合は、EgdeType=0となる。また、画素値pix[x]に対し、画素aおよびbのうち、一方の画素値が大きく、他方の画素値が同じ場合は、EgdeType=1となる。また、画素値pix[x]に対し、画素aおよびbのうち、一方の画素値が小さく、他方の画素値が同じ場合は、EgdeType=3となる。
また、画素値pix[x]に対し、画素aおよびbのいずれの画素値も小さい場合は、EgdeType=4となる。また、画素値pix[x]に対し、画素aおよびbのうち、一方の画素値が小さく、他方の画素値が大きい場合、または、画素値pix[x]に対し、画素aおよびbのいずれの画素値も同じ場合は、EgdeType=2となる。
 なお、図26(b)において、各グラフの中心の黒丸は、処理対象画素xの画素値を示しており、両端の黒丸は、画素aおよびbの画素値を示している。また、図26(b)における上下方向は、画素値の大小を示している。
 続いて、クラス分類部624は、導出したEgdeTypeに基づいて、処理対象画素xが属するべきクラスのクラスインデックス(class_idx)を以下のように導出する。
  class_idx=EoTbl[EdgeType]
ここで、EoTbl[EdgeType]は、EdgeTypeからclass_idxを導出するために用いられる変換テーブルである。当該変換テーブルEoTblの具体例を図26(d)~(f)に示す。
 図26(d)に示す変換テーブル1001Xは、処理対象のQAOUの階層の深度によって用いる変換テーブルを変更しない場合の変換テーブルである。
 また、図26(e)に示す変換テーブル1001Aと図26(f)に示す変換テーブル1001Bとは、処理対象のQAOUの階層の深度によって用いる変換テーブルを変更する場合の変換テーブルであり、処理対象のQAOUの階層の深度が閾値よりも小さい場合は変換テーブル1001Aを用い、処理対象のQAOUの階層の深度が閾値以上の場合は変換テーブル1001Bを用いる。
 処理対象のQAOUの階層の深度によって用いる変換テーブルを変更しない場合、変換テーブル1001Xに示すように、クラス分類部624は、処理対象画素x、画素aおよび画素bから成る領域にエッジが存在しない場合(以下、平坦な場合とも呼ぶ)、すなわち、EdgeType=2の場合、処理対象画素xをクラス0(“class_idx”=0)に分類する。また、EdgeType=0、1、3、4をそれぞれclass_idx=1、2、3、4に分類する。
 また、処理対象のQAOUの階層の深度によって用いる変換テーブルを変更しない場合で、処理対象のQAOUの階層の深度が閾値より小さいとき、変換テーブル1001Aに示すように、クラス分類部624は、処理対象画素x、画素aおよび画素bから成る領域にエッジが存在しない場合(以下、平坦な場合とも呼ぶ)、すなわち、EdgeType=2の場合、処理対象画素xをクラス0(“class_idx”=0)に分類する。また、EdgeType=0、1、3、4をそれぞれclass_idx=1、3、4、2に分類する。また、処理対象のQAOUの階層の深度が閾値以上のとき、変換テーブル1001Bに示すように、クラス分類部624は、処理対象画素x、画素aおよび画素bから成る領域にエッジが存在しない場合(以下、平坦な場合とも呼ぶ)、すなわち、EdgeType=2の場合、処理対象画素xをクラス0(“class_idx”=0)に分類する。また、EdgeType=0、1をclass_idx=1に、EdgeType=3、4をclass_idx=2に分類する。よって、変換テーブル1001Bでは、複数のEdgeTypeに対し、1つのclass_idxが対応している。
 なお、変換テーブル1001Aについては、変換テーブル1001Xと同じでもよいように考えられる。しかしながら、変換テーブル1001Aを変換テーブル1001Xと同じにすると、変換Sテーブル1001Bとの間で、同じEdgeTypeに対し、異なるclass_idxが割り当てられることになり、階層によって処理が変わってしまうことになる。例えば、EdgeType=3のときに、階層の深度が閾値より小さい場合は、class_idx=4、階層の深度が閾値以上の場合は、class_idx=2となり、階層によって処理が変わってしまうことになる。
 そこで、変換テーブル1001Aを図26(e)に示すようにすることで、変換テーブル1001Bとの間、すなわち階層間によって、処理が変わらないようにしている。
  (オフセットタイプ=5~6(バンドオフセット)のとき)
 オフセットタイプ導出部623から供給されるオフセットタイプが5または6であるとき、クラス分類部624は、処理対象画素xの画素値pix[x]に応じて、当該処理対象画素の画素値を複数のクラスの何れかに分類する。
 ・オフセットタイプ=5(sao_type_idx=5)のとき
 クラス分類部624は、処理対象画素xの画素値pix[x]が、
  (max×1/4)≦pix[x]≦(max×3/4)
を満たしている場合に、当該処理対象画素をクラス0以外のクラスに分類する。すなわち、処理対象画素の画素値が、図11(a)における斜線の範囲内である場合に、当該処理対象画素をクラス0以外のクラスに分類する。なお、上記maxは、処理対象画素xの画素値の取り得る最大値を表しており、例えば、max=255である。また、max=255であるとき、上記の条件は、8≦(pix[x]/8)≦23と表現することもできるし、4≦(pix[x]/16)≦11と表現することもできる。
 ・オフセットタイプ=6(sao_type_idx=6)のとき
 クラス分類部624は、処理対象画素xの画素値pix[x]が、
  pix[x]≦(max×1/4)または(max×3/4)≦pix[x]
を満たしている場合に、当該処理対象画素をクラス0以外のクラスに分類する。すなわち、処理対象画素の画素値が、図11(b)における斜線の範囲内である場合に、当該処理対象画素をクラス0以外のクラスに分類する。なお、上記maxは、処理対象画素xの画素値の取り得る最大値を表しており、例えば、max=255である。また、max=255であるとき、上記の条件は、(pix[x]/8)≦7または24≦(pix[x]/8)と表現することもできるし、(pix[x]/16)≦3または12≦(pix[x]/16)と表現することもできる。
 クラス分類部624によるクラス分類処理をより具体的に説明すれば以下の通りである。
 オフセットタイプが5~6の何れかであるとき、クラス分類部624は、処理対象画素xが属するべきクラスのクラスインデックス(class_idx)を、処理対象のQAOUの階層の深度の応じて、以下のように導出する。
・処理対象のQAOUの階層の深度が閾値よりも小さい場合
  class_idx=EoTbl[sao_type_idx][pix[x]/>>BoRefBit32]
・処理対象のQAOUの階層の深度が閾値以上の場合
  class_idx=EoTbl[sao_type_idx][pix[x]/>>BoRefBit16]
ここで、BoTbl[sao_type_idx][pix[x]/>>BoRefBit32]、およびBoTbl[sao_type_idx][pix[x]/>>BoRefBit16]は、処理対象画素xの画素値pix[x]とsao_type_idxとから、class_idxを導出するために用いられる変換テーブルである。BoRefBit32とBoRefBit16は、画像ビット深度をPIC_DEPTHとする場合に、各々PIC_DEPTH-5、PIC_DEPTH-4で導出される値であり、画素値を32段階もしくは16段階の値に量子化したものである。量子化された画素値はpixquantとも記述する。BoRefBit32およびBoRefBit16で右シフトすることは、1<<BoRefBit32および1<<BoRefBit16で除算することに対応する。この量子化幅は画素値のビット深度が8ビットの場合にはそれぞれ、1<<(8-5)=8、1<<(8-4)=16である。以下、量子化幅が8の場合を説明する。また、この量子化幅をクラスの幅と呼ぶ。
 クラス分類部624は、処理対象のQAOUの階層の深度に応じて分類するクラスの幅を変えて、クラスの分類を行う。例えば、図28(a)に示すように、処理対象のQAOUの階層の深度が閾値よりも小さい場合、クラス分類部624は、クラスの幅を「8」として画素値を32個に分類して、クラス分類を行う。また、図28(b)に示すように、処理対象のQAOUの階層の深度が閾値以上の場合、クラス分類部624は、クラスの幅を「16」として画素値を16個に分類し、クラス分類を行う。
 次に、変換テーブルEoTblの具体例を図29に示す。図29の(a)、(b)それぞれにおいて「BO_1」は、“sao_type_index”=5であることを示しており、「BO_2」は、“sao_type_index”=6であることを示している。また、図29(a)に示す変換テーブル1301は、処理対象のQAOUの階層の深度が閾値よりも小さい場合に用いられる変換テーブルであり、図29(b)に示す変換テーブル1302は、処理対象のQAOUの階層の深度が閾値以上の場合に用いられる変換テーブルである。
 処理対象のQAOUの階層の深度が閾値よりも小さい場合で、“sao_type_index”=5のとき、図29(a)に示すように、 クラス分類部624は、画素値pix[x]が8≦(pix[x]/8)≦23を満たす処理対象画素xについて、pix[x]の大きさに応じて、クラスインデックス1から16までの何れかのクラスに分類する。
 また、“sao_type_index”=6のとき、クラス分類部624は、画素値pix[x]がpix[x]/8)≦7または24≦(pix[x]/8)を満たす処理対象画素xについて、pix[x]の大きさに応じて、クラスインデックス1から16までの何れかのクラスに分類する。
 また、処理対象のQAOUの階層の深度が閾値以上の場合で、“sao_type_index”=5のとき、図29(b)に示すように、 クラス分類部624は、画素値pix[x]が4≦(pix[x]/16)≦11を満たす処理対象画素xについて、pix[x]の大きさに応じて、クラスインデックス1から8までの何れかのクラスに分類する。
 また、“sao_type_index”=6のとき、クラス分類部624は、画素値pix[x]がpix[x]/16)≦3または12≦(pix[x]/16)を満たす処理対象画素xについて、pix[x]の大きさに応じて、クラスインデックス1から8までの何れかのクラスに分類する。
(オフセット情報復号部611の構成)
 図41は、適応オフセットのパラメータの種類(パラメータ条件)に応じて、使用するオフセットタイプを変更する、かつ/もしくは、適応オフセットのパラメータ条件に応じて、クラスの分類数を変更するオフセット情報復号部611のブロック図である。オフセット情報復号部611は、適応的オフセットタイプ復号部6111、使用オフセットタイプ選択部6112、オフセットタイプ復号部6113、適応的オフセット復号部6114、使用オフセット数選択部6115、オフセット復号部6116から構成される。なお、パラメータ条件とは、画素値から算出される値以外のパラメータであり、上記で説明した階層、オフセットタイプの他、後述の付記事項にて説明するブロックサイズ(QAOUサイズ)、色成分(コンポーネント)、QPがある。
 適応的オフセットタイプ復号部6111は、符号化データ中のQAOU情報から、パラメータ条件に応じて適応的にオフセットタイプを復号する手段であり、使用オフセットタイプ選択部6112とオフセットタイプ復号部6113を備える。
 使用オフセットタイプ選択部6112は、パラメータ条件に応じて使用するオフセットタイプを選択する手段である。パラメータ条件の一つは、上述したように階層である。階層が浅い場合に使用するオフセットタイプの数は、階層が深い場合に使用するオフセットの数よりも小さい。使用オフセットタイプ選択部6112は、パラメータ条件に応じて図8で説明したような変換テーブルをオフセットタイプ復号部6113に入力する。また使用可能なオフセットタイプの最大数をオフセットタイプ復号部6113に入力する。
 オフセットタイプ復号部6113は、入力された変換テーブルと最大数に応じて符号化データからオフセットタイプを復号する。オフセットタイプの最大数をNとすると、コードの取り得る範囲が0からN-1までのN個に制限されることから、コードの符号化に要するビット数を低減することができる。例えば、最大数が2m-1より大きく、2m以下であるときmビットの固定長符号化を用いることができる。また、最大値をN-1とするTruncated unary符号化や、Truncated Rice符号化を用いることもできる。
 適応的オフセット復号部6114は、符号化データ中のQAOU情報から、パラメータ条件に応じて適応的にオフセットを復号する手段であり、使用オフセット数選択部6115とオフセット復号部6116とを備える。使用オフセット数選択部6115は、パラメータ条件に応じて、使用するオフセット数の最大値とオフセットの精度を選択する手段である。パラメータ条件の一つは階層であり、階層が浅い場合に使用するオフセットの数は、階層が深い場合に使用するオフセットの数よりも大きい。例えば、階層が浅い場合には図29(a)のようにオフセット数を16個、階層が深い場合には図29(b)のようにオフセット数を8個とすることができる。また、上述したように、階層に応じて、オフセットの精度(ビット深度)を変更することも可能である。使用オフセット数選択部6115は、オフセット最大数とオフセット精度をオフセット復号部6116に入力する。オフセット復号部6116は、オフセットの最大数とオフセットの精度に応じてオフセットを復号する。オフセットの数を少なくする場合には、オフセットの符号量が低減する。また、オフセットタイプと同様、オフセットにおいても各オフセットの精度が決まれば、オフセットを符号化するコードの取り得る範囲も制限されることから、コードの符号化に要するビット数を低減することができる。
 図42(a)は、使用オフセットタイプ選択部6112の構成を示すブロック図である。
 使用オフセットタイプ選択部6112は、オフセットタイプ変換テーブル選択部6117、第1オフセットタイプ変換テーブル格納部6118、第2オフセットタイプ変換テーブル格納部6119を備える。
 オフセットタイプ変換テーブル選択部6117は、パラメータ条件に応じて第1オフセットタイプ変換テーブル格納部6118が備える変換テーブルもしくは、第2オフセットタイプ変換テーブル格納部6119が備える変換テーブルを選択する。上述した例では、801Aが、第1オフセットタイプ変換テーブル格納部6118が備える変換テーブルであり、801Bが、第2オフセットタイプ変換テーブル格納部6119が備える変換テーブルに対応する。
 図42(b)は、使用オフセットタイプ選択部の別の構成を示すブロック図である。
 使用オフセットタイプ選択部6112’は、オフセットタイプ変換テーブル選択部6117’、エッジオフセットタイプ及びバンドオフセットタイプ変換テーブル格納部6118’、水平エッジオフセットタイプ及びバンドオフセットタイプ変換テーブル格納部6119’を備える。
 (クラス分類部624の構成)
 図43は、クラス分類部624の構成を示すブロック図である。
 クラス分類部624は、適応的エッジオフセットクラス分類部6241、使用エッジオフセットクラス選択部6242、エッジオフセットクラス分類部6243、適応的バンドオフセットクラス分類部6244、使用バンドオフセットクラス・クラス幅選択部6245、バンドオフセットクラス分類部6246から構成される。
 クラス分類部624は、パラメータ条件およびオフセットタイプに応じて、各画素をクラスに分類する。オフセットタイプがエッジオフセットを示す場合には、適応的エッジオフセットクラス分類部6241により画素を分類し、オフセットタイプがバンドオフセットの場合には、適応的バンドオフセットクラス分類部6244において、画素を分類する。
 適応的エッジオフセットクラス分類部6241は、パラメータ条件に応じて適応的に、画素をクラスに分類する手段であり、使用エッジオフセットクラス選択部6242とエッジオフセットクラス分類部6243とを備える。使用エッジオフセットクラス選択部6242は、使用するクラスの種類を選択する。使用エッジオフセットクラス選択部6242は、画素値の分類方法をエッジオフセットクラス分類部6243に入力する。具体的には、画素値を分類する場合に一時的に導出される中間値EdgeTypeの導出方法と、EdgeTypeからclass_idxを導出するために用いられる変換テーブルを入力する。中間値EdgeTypeの導出方法の例は図26(a)、図26(b)を用いて説明したものであり、これを基本エッジ分類方法と呼ぶ。図33で後述するようなエッジ分類方法を用いることもできる。パラメータ条件の一つは、上述したように階層であり、階層が浅い場合に使用するクラスを、階層が深い場合に使用するクラスよりも大きい数となるように選択する。EdgeTypeからclass_idxを導出するために用いられる変換テーブルは、1001Aや1001Bが例になる。また、色成分(コンポーネント)に応じて、エッジ導出方法を切り替える方法も適当である。この場合、輝度では、水平、垂直、斜め方向のエッジ分類方法を用いる基本エッジ分類方法を用い、色差では、ラインメモリを削減するためにエッジ分類で用いる参照画素の範囲を、対象画素からみて水平方向に限定した水平エッジ分類方法を用いることが適当である。エッジオフセットクラス分類部6243は与えられた分類方法と、EdgeTypeからclass_idxを導出するために用いられる変換テーブルに基づいて画素を分類する。
 適応的バンドオフセットクラス分類部6244は、パラメータ条件に応じて適応的に、画素をクラスに分類する手段であり、使用バンドオフセットクラス・クラス幅選択部6245とバンドオフセットクラス分類部6246とを備える。使用バンドオフセットクラス・クラス幅選択部6245は、画素値の分類方法をバンドオフセットクラス分類部6246に入力する。具体的には、画素値を中間値に分類する場合に用いられる量子化幅であるクラス幅と、中間値からclass_idxを導出するために用いられる変換テーブルを入力する。パラメータ条件の一つは、既に説明したように階層であり、階層が浅い場合に使用するクラスの幅は、階層が深い場合に使用するクラスの幅よりも小さい。バンドオフセットクラス分類部6246は、入力されたクラス幅と、中間値からclass_idxを導出するために用いられる変換テーブルに応じて画素値をクラスに分類する。入力であるクラス幅は、クラス幅自体ではなく、クラス幅に対応する整数でも構わない。例えば1<<BoRefBit32をクラス幅とする場合、その2を底とする対数である画素の量子化に用いるビット数BoRefBit32や、画素のビット深度から画素を量子化に用いるビット数を求めるための値、例えば、BoRefBit32=PIC_DEPTH-5であれば5を、クラス幅の代わりに用いても構わない。
 このように、パラメータ条件に応じて適応的に符号化データを復号し、画素のクラス分類を行う。
 以上のように、本実施形態では、処理対象のQAOUの階層の深度に応じて、クラスの分類数を変更している。より詳細には、処理対象のQAOUの階層の深度が大きい場合に、小さい場合と比較してより少ないクラス数に分類している。
 一般に、必要なメモリ量は、メモリ量=オフセットのデータ長×クラス数×QAOU数であるので、クラス数を減らすことにより、メモリの使用量を削減することができる。
 また、深い階層では、QAOUの面積が小さくなるとともに、QAOU内の画素値の特性が一様に近くなるので、クラス数を減らしてもオフセットの効果は、あまり変わらない。
 また、本実施形態では、処理対象のQAOUの階層の深度に応じて、オフセットの精度を変更している。より詳細には、処理対象のQAOUの階層の深度が大きい場合に、小さい場合と比較してオフセットの精度を下げている。これにより、処理対象のQAOUの階層の深度が大きい場合の符号量を減らしている。
 深い階層のQAOUでは、含まれる画素数が少なくなるため、QAOU全体でみた量子化誤差が上位の階層と比較して小さくなる。よって、深い階層において、オフセットの精度を下げても、オフセットの効果はあまり変わらない。
 (動画像符号化装置2’)
 次に、符号化対象画像を符号化することによって符号化データ#1を生成する動画像符号化装置2’について、図30、31を参照して説明する。動画像符号化装置2’は、動画像符号化装置2と同様に、その一部に、H.264/MPEG-4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、および、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。
 また、動画像符号化装置2’は、動画像符号化装置2における適応オフセットフィルタ80の代わりに適応オフセットフィルタ80’が設けらている点が異なり、他の構成は同様である。
 (適応オフセットフィルタ80’)
 次に、適応オフセットフィルタ80’について、図30を参照して説明する。図30は、適応オフセットフィルタ80’の構成を示すブロック図である。図30に示すように、適応オフセットフィルタ80’は、適応オフセットフィルタ情報設定部81’および適応オフセットフィルタ処理部82’を含む構成である。
 また、図30に示すように、適応オフセットフィルタ情報設定部81’は、オフセット算出部811、オフセットシフト部816、オフセットクリップ部812、オフセット情報選択部813、およびオフセット属性設定部815を含む構成である。
 (オフセット算出部811)
 オフセット算出部811は、対象の処理単位(例えばLCU)に含まれる所定の分割深度までの全てのQAOUに対して、処理対象のQAOUの階層に応じて存在する全てのオフセットタイプおよび全てのクラスについてのオフセットを算出する。ここで、オフセットタイプおよびクラスは、動画像復号装置1の説明において説明したものと同じものを指す。
 オフセット算出部811は、上記の処理によって算出したオフセット、オフセットタイプ、クラス、および、QAOUの分割構造を表すQAOU構造情報からなるオフセット情報をオフセットクリップ部812に供給する。
 (オフセットクリップ部812)
 オフセットクリップ部812は、オフセット算出部811から供給されるオフセットに対して以下に示すようなクリップ処理1、クリップ処理2の何れかの処理によってクリップの処理を行う。
 (クリップ処理1)
 オフセットクリップ部812は、オフセット算出部811から供給される各オフセットを例えば-8から7までの値にクリップすることによって、各オフセットを4ビットで表現する。クリップされた各オフセットは、オフセット情報選択部813に供給される。クリップするビット幅は、動画像復号装置1と同様、画像のビット深度とオフセットのビット深度に応じて設定される。
 このように、各オフセットをクリップすることによって、各オフセットが格納されるメモリ(不図示)のメモリサイズを削減することができる。また、符号化データ#1に含まれるオフセットの符号量を削減することができるので、符号化効率の向上を図ることができる。また、過度なオフセットが加算されることが抑制されるので、適切な画質が保証される。
 (クリップ処理2)
 また、オフセットクリップ部812は、オフセット算出部811から供給される各オフセットのクリップ範囲を、オフセットタイプに応じて異なる値を設定する構成としてもよい。
 例えば、オフセットタイプがエッジオフセットである場合には、オフセットのビット数を8ビットとし、オフセットタイプがバンドオフセットである場合には、オフセットのビット数を4ビットとする。より一般には、オフセットタイプがエッジオフセットである場合のオフセットのビット数をNビットとし、オフセットタイプがバンドオフセットである場合のオフセットのビット数をMビットとしたとき、N>Mが満たされるようにオフセットのビット数を定める。
 このようにオフセットタイプに応じて、オフセットのビット数を異ならせることによって、各オフセットを格納するためのメモリに過度なメモリサイズを要求することなく、符号化効率の向上を図ることができる。
 なお、オフセットの取り得る値を制限するための閾値thが2m-1より大きく、2m以下であるとき、当該オフセットを符号化するための符号化方式として、mビットの固定長符号化を用いることができる。より具体的には、最大値とthとするTruncated unary符号化や、Truncated Rice符号化を用いることができる。
 また、上記クリップ処理1および2を組み合わせて得られるクリップ処理も本実施形態に含まれる。また、適応オフセットフィルタ80は、オフセットクリップ部812を備えない構成としてもよい。
 また、オフセットクリップ部812は、オフセットの精度に合わせ、処理対象のQAOUの階層の深度に応じて、クリップ範囲を切り換える。具体的に、オフセットの精度が、処理対象のQAOUの階層の深度が閾値よりも小さい場合はnビット、処理対象のQAOUの階層の深度が閾値以上の場合はnビットのときを考える。このとき、オフセットクリップ部812は、処理対象のQAOUの階層の深度が閾値よりも小さければ、クリップ範囲を-2nA/2~2nA/2-1とする。また、処理対象のQAOUの階層の深度が閾値以上であれば、クリップ範囲を-2nA/2~2nA/2-1とした上で、下位の(n-n)ビットを「0」とする。これにより、オフセットクリップ部812によって、クリップ処理されたオフセットを用いて処理を行うオフセット情報選択部813に対し、オフセットの精度を考慮せずに処理を行わせることができる。
 (オフセット情報選択部813)
 オフセット情報選択部813は、RDコスト(Rate-Distortion cost)がより小さくなるオフセットタイプ、クラス、オフセットの組み合わせ、および、それに対応するQAOU分割構造を決定し、決定したオフセットタイプ、クラス、オフセットおよび、それに対応するQAOM分割構造を示すQAOU情報を可変長符号符号化部22に供給する。また、オフセット情報選択部813は、決定したオフセットをQAOU毎に適応オフセットフィルタ処理部82に供給する。
 オフセット情報選択部813の処理について図31を参照してより具体的に説明すれば以下の通りである。
 図31は、QAOUインデックスが「x」のQAOUについて、オフセットタイプそれぞれについての2乗誤差を算出する概要を示す図である。図31に示すように、オフセット情報選択部813は、全てのQAOMUについて、オフセットタイプそれぞれについての2乗誤差を算出する。そして、算出した2乗誤差が最小となるオフセットタイプを当該QAOUのオフセットタイプとする。これにより、全てのQAOMU(QAOMU番号0~340)について、オフセットタイプが決定する。
 次に、オフセット情報選択部813は、分割深度を0としたときのRDコストと分割深度を1とした場合のRDコストを計算する。具体的な計算方法は、上記で図18を参照して説明した通りである。
 (適応オフセットフィルタ処理部82’)
 適応オフセットフィルタ処理部82’は、対象QAOUにおけるデブロック済復号画像P_DBの各画素に対して、オフセット情報選択部813から供給されるオフセットを加算する。適応オフセットフィルタ処理部82’は、デブロック済復号画像P_DBに含まれる全てのQAOUに対して処理を行って得られる画像をオフセットフィルタ済復号画像P_OFとして出力する。なお、適応オフセットフィルタ処理部82’の構成は、適応オフセットフィルタ処理部62’と同一のため、ここでは説明を省略する。
 また、適応クリップタイプを用いる構成であってもよい。すなわち、オフセットタイプの1つとして、適応クリップ(AC)タイプを設けるようにしてもよい。この場合、オフセットタイプは、EO、BO、ACの3種類となる。適応クリップタイプ(AC)では、オフセットを用いず、下限値c1と上限値c2とのクリップを用いて画素値を補正する。下限値c1および上限値c2の例としては、例えば、c1=16、c2=235を挙げることができる。
 適応クリップタイプを用いることにより、オフセットの符号化処理や多数のオフセットを保持するメモリが不要となる。なお、クリップの下限値および上限値を、固定値でなく適応的に与える場合には、下限値と上限値を符号化すればよい。この場合は、それぞれ適当な固定値からの差分、たとえば下限値は16からのオフセット、上限値は235からのオフセットを符号化することが好ましいとよい。特に、上限値は大きな値となるため、このようにすることで、符号化効率を下げることがない。
 (付記事項2)
 また、上述したように、QAOUの階層の深度に応じてとは、QAOUのサイズに応じてということもできる。すなわち、QAOUのサイズに応じてSAOのタイプ数、クラス数やオフセット精度を異ならせてもよい。
 例えば、QAOUのサイズがN×N画素未満の場合は、SAOのタイプ数、クラス数、およびオフセット精度のうち、1または複数を、QAOUのサイズがN×N画素以上の場合よりも制限する構成であってもよい。Nの具体例としては、例えばN=64(LCUのサイズ)を挙げることができる。
 また、SAOのタイプ数の制限としては、例えば、EOを水平および垂直タイプに制限する、BOを1種類にする(変換テーブル802C)、EOのみを用いてBOを用いない(変換テーブル802A)、水平タイプのEOおよびBOのいずれかだけを用いる(変換テーブル801B、変換テーブル802D)、などを挙げることができる。オフセット情報復号部611においては括弧内に示す変換テーブルを用いるなお、SAOのクラス数の制限、およびオフセット精度の制限については、上述した実施形態と同様の方法で行うことができる。
 このように、SAOのタイプの種類、タイプ数、クラス数、およびオフセット精度を制限することにより、メモリの使用量削減や、処理負荷の軽減を行うことができる。特に、タイプの種類をBOに制限する場合や、EOを水平および垂直タイプに制限する場合には、符号化装置、および復号装置のクラス分類部の処理負荷を軽減することができる。また、タイプ数を制限する場合には、最適なタイプを選択するためのコスト計算を省くことができることから、符号化装置の処理負荷を軽減することができる。タイプの種類をEOに制限すること、クラス数およびオフセット精度を制限することによりオフセットを蓄積するメモリの使用量削減ができる。また、タイプの種類を水平タイプのEOおよびBOに制限することにより、クラス分類に用いる参照画素を保持するラインメモリなどの一時的メモリを削減することができ、また、参照画素の復号を待つ間の遅延を短くすることができる。なお、メモリの使用量の削減には、BOのクラス数を制限する方が、EOのクラス数を制限するよりも効果的である。
 このような制限は、図41~図43に示す手段の構成により、パラメータ条件をQAOUNのサイズとした場合に、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。
 (付記事項3)
 また、輝度値に対してオフセットを加えるQAOU(以下、輝度ユニットとも言う)のサイズと、色差に対してオフセットを加えるQAOU(以下、色差ユニットとも言う)のサイズとを異ならせ、色差ユニットでは、輝度ユニットよりも、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限する構成であってもよい。
 例えば、YUV形式の画像フォーマットにおける4:2:0形式等、輝度と色差とで解像度が異なり、色差の解像度が輝度よりも低いデータ形式であれば、色差の分割の細かさは輝度ほどには必要なくなる。そこで、色差ユニットについて、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限することにより、メモリの使用量削減や、処理負荷の軽減を行うことができる。なお、色差ユニットの最大階層の制限は、例えば、SAOのツリー構造の最大深度を、輝度ユニットよりも浅くすることにより可能である。
 このような制限は、図41~図43に示す手段の構成により、パラメータ条件をQAOUNのサイズとした場合に、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。
 特に、輝度と色差のどちらにもSAO処理を行う場合には、色成分毎にクラス分類に用いる参照画素を保持するラインメモリなどの一時的メモリを備える必要がある。輝度成分は色差成分に比べ重要度が低いことから、パラメータ条件を色差成分として、タイプの種類を水平タイプのEOおよびBOに制限することにより、色差成分でのラインメモリを削減することができる。この場合、オフセット情報復号部611では、変換テーブル801B、変換テーブル802Dなどの変換テーブルを用いる。
 また、パラメータ条件を色差成分として、輝度成分に比べオフセットの精度を小さくすることも特に有効である。例えば、輝度成分のオフセットの精度を
 SAO_DEPTH = MIN(PIC_DEPTH、AY)
 シフト値 = PIC_DEPTH―MIN(PIC_DEPTH、AY)
として、色差成分の場合には、オフセットの精度、シフト値を、
 SAO_DEPTH = MIN(PIC_DEPTH、THC)
 シフト値 = PIC_DEPTH―MIN(PIC_DEPTH、AC)
のように求める場合に、精度を制御する変数AY、ACとしてAY>ACを用いることが適当である。例えば、AY=10もしくは9、AC=8とする。この場合、輝度成分のオフセットの精度は、色差成分よりも大きいものとなる。シフト値については輝度成分のシフト値が、色差成分よりも小さい値となる。
 (付記事項4)
 また、CUの量子化パラメータQPの値(QP値)が閾値以上の場合に、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限する構成であってもよい。QP値は、ピクチャの初期のQP値を用いてもよいし、SAOの処理対象QAOUがLCUやCUの境界に沿っている場合には、QAOUの左上座標もしくは中心座標に対応する位置のCUのQP値を用いてもよい。
 QP値は、その値が高いほど予測画像の画質は低くなり、詳細な分類およびオフセットの補正が困難となるため、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限しても、画質に与える影響が小さい。そこで、QP値が閾値以上の場合に、SAOのタイプ数、クラス数、オフセット精度、および分割の最大階層を制限する構成にすれば、画質に影響を与えることなく、メモリの使用量削減や、処理負荷の軽減を行うことができる。
 このような制限は、図41~図43に示す手段の構成により、パラメータ条件をQPとした場合に、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。
 (付記事項5)
 また、特定タイプのピクチャ、例えばBピクチャや非参照ピクチャ(IDRピクチャ)では、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限する構成であってもよい。
 IピクチャやPピクチャでは、そのピクチャの画質が、後のピクチャに大きな影響を与えるためSAOの精度を高く保つ必要がある。一方で、これ以外のピクチャでは、後のピクチャに大きな影響を与えることはないので、これらのピクチャ(Bピクチャ、IDRピクチャ)について、SAOのタイプの種類、タイプ数、クラス数、オフセット精度、および分割の最大階層を制限してもよい。これにより、メモリの使用量削減や、処理負荷の軽減を行うことができる。
 このような制限は、図41~図43に示す手段の構成により、パラメータ条件をピクチャの種類とした場合に、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。
 (付記事項6)
 また、画面上におけるQAOUの位置に応じて、SAOのタイプ数、クラス数、オフセット精度、および分割の最大階層を制限する構成であってもよい。
 例えば、画面の周縁では、SAOのタイプ数、クラス数、オフセット精度、および分割の最大階層を制限してもよい。
 画面の中央付近は、ユーザが注目しやすいため、画質を下げると、そのまま主観画質が低下してしまうが、画面の周縁において画質を下げても、主観画質は画面中央付近ほどは低下しない。
 また、画面端を超えるサンプル点が必要となるSAOタイプを用いなければ、境界判定処理を軽減することができる。
 このような制限は、図41~図43に示す手段の構成により、パラメータ条件をQAOUの位置とした場合に、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。
 〔実施の形態4〕
 本発明の他の実施の形態について図32に基づいて説明すれば、以下のとおりである。本実施形態において、上記実施形態と異なるのは、画素値に応じて、EOとBOとを切り換える点である。
 本願発明者等は、画素において、中間階調域では、BOよりもEOの方が効果が高く、その他の値域(低画素値域・高画素値域)ではBOの方が効果が高いという特性を発見した。そこで、本実施形態では、低画素値域、および高画素値域ではBOを用い、中間階調域はEOを用いている。
 具体的に、図32を参照して説明する。図32は、画素値によってEOとBOとを切り換える構成を説明するための図であり、(a)は、画素値によってEOとBOとを切り換える構成の概要を説明するための図であり、(b)は、具体的な切り換えの値を説明するための図である、(c)は、オフセット情報格納部621に格納されるリストメモリの内容を示す図である。
 図32(a)に示すように、本実施形態では、画素値(輝度値)が0近辺、および255近辺では、BOを用い、それ以外の値域ではEOを用いる。すなわち、画素値によってSAOタイプを分類し、画素値が0近辺、および255近辺では、画素値に応じたオフセットを加算し、それ以外の地域では、エッジの種類に応じたオフセットを加算する。
 本願発明者等の実験の結果、EOとBOとは、用いられる画素値の範囲にそれぞれ偏りがみられた。すなわち、EOは中間階調域に多いということがわかった。これは、低画素値域および高画素値域では、誤差への影響は、エッジの種類よりも画素値の方が大きい傾向があるということを意味している。
 そこで、本実施形態では、EOとBOとを、画素値域に応じて決定し、1つのSAOタイプでEOおよびBOの両者における誤差補正効果が高い部分を利用する構成としている。これにより、符号化効率を向上させることができる。また、SAOタイプ数や総クラス数を減少させることができるので、メモリの使用量の削減、および処理負荷を軽減することができる。
 次に、本実施の形態について、より詳細に説明する。まず、本実施の形態では、上記実施の形態と異なり、“sao_type_idx”について1~4までを用い、これらを次のように定義する。
・“sao_type_idx”=1:(BO_EO_0) 実施の形態1のEO_0+BOに相当
・“sao_type_idx”=2:(BO_EO_1) 実施の形態1のEO_1+BOに相当
・“sao_type_idx”=3:(BO_EO_2) 実施の形態1のEO_2+BOに相当
・“sao_type_idx”=4:(BO_EO_3) 実施の形態1のEO_3+BOに相当
 また、実施の形態1におけるEO_0~3、および BO_0,1は用いない。
 そして、クラス分類部624は、図32(b)に示すように、図29の変換テーブル1301におけるBoTbl[BO_1]を用いてクラス分類を行う。そして、画素値がmaxの1/4以下、およびmaxの3/4以上であれば、変換テーブル1301を用いて、クラス分類を行う。
 また、画素値が、maxの1/4と3/4との間であれば、上記実施の形態に説明したEO_0~3に応じてエッジタイプを判定し、クラス分類を行う。
 これにより、クラス分類部624は、BOとEOとを画素値によって切り換えてクラスを分類することができる。
 また、オフセット算出部811は、上記実施の形態で説明したオフセットの算出方法と同様の方法でオフセットを算出する。ただし、本実施の形態では、オフセットタイプの種類数が4つなので、この点を異ならせて算出する。
 また、オフセット情報格納部621に格納されるリストメモリ2101は、図32(c)に示すように、QAOUインデックスとオフセットタイプと該オフセットタイプにおいて選択可能な各クラスに関するオフセットの具体的な値とが互いに関連付けられて格納されている。
 なお、EOとBOとの特徴を併せ持つオフセットタイプを用いる場合に、まず、EOを用いてクラス分類を行い、特定のクラス(エッジが平坦なクラス)について、BOを用いてさらにクラス分類する構成であってもよい。また、実施の形態に記載したEOおよびBOをそのまま併用する構成であってもよい。さらに、上記実施の形態に記載した条件(QAOUの階層の深度が閾値より小さいか否か)によって、EOとBOとの特徴を併せ持つオフセットタイプを設けるか否かを変更して、タイプ数やクラス数を削減する構成であってもよい。
 〔実施の形態5〕
 本発明の他の実施の形態について図33、34、42に基づいて説明すれば、以下のとおりである。本実施形態において、上記実施形態と異なるのは、EOのクラス分類において、エッジの判定に用いる画素を、判定対象の画素の水平方向に存在する画素のみに限定する点である。
 上記実施の形態では、対象画素の上または下方向に存在する画素についても、エッジの判定に用いられていた。そのため、対象画素の上方向に存在する画素(オフセット処理済みの画素)については、当該画素のオフセット処理前の画素値を保持しておくラインバッファが必要となっていた。
 そこで、エッジの判定に用いる画素を、対象画素の水平方向に存在する画素に限定すれば、上方向への参照がなくなるため、ラインバッファ分のメモリの使用量を削減することができる。また、上方向の境界判定(画面端など)が不要となるので、処理量も削減できる。
 また、水平方向に存在する画素のみを用いる場合、前回までの処理結果を流用することが可能となるため、さらに処理量を削減することができる。図33(a)を参照して説明する。図33(a)は、水平方向に存在する画素を示しており、x0~x3は、それぞれの画素の画素値である。
 まず、画素値x1の画素について、両隣との差分は、以下の通りである。
s1=sign(x1-x0)-sign(x2-x1)
 次に、画素値x2の画素について、両隣との差分を算出すると、以下の通りとなる。
s2=sign(x2-x1)-sign(x3-x2)
 ここで、s1、s2はx1、x2におけるエッジのクラス分類に用いられる値である。
 このように、s2を算出する場合に、s1で用いたsign(x2-x1)を再利用している。よって、この分だけ、処理量を減らすことができる。
 次に、本実施形態の詳細について説明する。本実施形態では、EOのタイプを2種類にしている。すなわち、“sao_type_idx”=1,2の場合のみを、エッジオフセット(EO)としている。そして、“sao_type_idx”=1(EO_0)のときは、対象画素の左右の画素と比較してエッジの種類を導出し(図33(b))、“sao_type_idx”=2(EO’_0)のときは、対象画素の左右で、2画素離れた位置にある画素と比較してエッジの種類を導出する(図33(c))。
 なお、“sao_type_idx”=3、4の場合はバンドオフセット(BO)となる。これは、上記実施の形態1において、“sao_type_idx”=5、6の場合をそれぞれ3、4と読み替えればよい。
 上記“sao_type_idx”=2の場合に、対象画素の両隣からさらに1画素分離れた画素を用いてエッジの種類を判定するのは、水平に対して角度の浅いエッジの検出を容易にするためである。図33(d)に示すように、対象画素の両隣の画素を比較対象とした場合、画素値の差分が小さく、エッジとは判定されない場合がある。このような場合であっても、さらに1画素分隣の画素との差分をとれば、水平に対して角度の浅いエッジを検出することが可能となる。
 また、対象画素の両隣ではなく、左側は隣の画素、右側は1画素さらに隣の画素(図34(a))との差分を用いてもよいし、この逆(図34(b))を用いてもよい。これは、参照画素が画面の端に当たる場合に特に有効である。
 さらに、水平方向の画素のみを用いる場合を限定する構成であってもよい。例えば、Bピクチャや非参照ピクチャなどの他のピクチャへの影響が小さいピクチャの場合のみ、水平方向のみの画素を参照し、これ以外の場合は、上記実施の形態1と同様とする構成であってもよいし、画面端やスライス境界付近などでは、水平方向のみの画素を参照し、これ以外は、上記実施の形態と同様とする構成であってもよい。このようにすれば、メモリの使用量を削減できるとともに、処理量の削減も可能となる。また、上方向の参照を行わないので、画面端やスライス境界付近での境界の判定処理も軽減できる。
 また、ピクチャやブロック単位で、フラグで明示的に指定する構成であってもよい。
例えば、水平エッジ(図34(c)))が多い場合には、上記実施の形態に記載した方法で処理を行うようにすれば、性能が低下することを防止することができる。
 また、上記実施の形態に記載した条件(QAOUの階層の深度が閾値よりも小さいか否か)によって、水平方向に存在する画素のみを用いる構成とするか否かを変更してもよい。さらに、上記実施の形態に記載したような、BOとEOとを併用する場合に限り、EOについては、水平方向に存在する画素のみを用いる構成としてもよい。
 また、水平方向に存在する画素との差分が、閾値よりも大きい(または小さい)か否かによって、エッジの種類を導出してもよい。具体的には、以下の式にしたがって、クラスを分類してもよい。
  Sign(z)=+1 (z>thのとき)
  Sign(z)=0  (-th≦z≦thのとき)
  Sign(z)=-1 (z<-thのとき)
 ここで、thは、予め定められた値を有する閾値である。
 また、色差を表す画素値の場合は、エッジオフセットにおいて、水平方向に存在する画素のみを用いる構成としてもよい。
 水平に限定する効果は、水平エッジ分類方法が1つのみである場合、例えば、図33(b)のみの場合だけでも得ることができる。上記のように、複数の異なる水平エッジ分類方法を組み合わせる場合には、1つの水平エッジ分類方法、例えば図33(b)を用いる場合よりも、より細かいエッジの分類が可能である。なお、複数の水平エッジ分類方法を用いる場合の組み合わせは、図33(b)、(c)のように、対象画素と参照画素の距離を変更して2つの例を用いる場合に限らず、エッジの種類を導出する場合に用いる閾値を2つ用いる構成でも良い。例えば、上記閾値thが0である場合と1である場合の2つの水平エッジ分類方法を備えてもよい。
 水平方向の画素のみを用いる場合を限定する構成は、実施形態1の図41~図43に示す手段の構成により、パラメータ条件に応じて適応的にオフセット情報復号部611、クラス分類部624の動作を変更することで実現できる。例えば、図41のオフセット情報復号部611において、パラメータ条件に応じて、使用オフセットタイプ選択部6112で選択するオフセットタイプの種類を水平エッジ分類方法のみに限定し、オフセットタイプ復号部6113では限定された種類のオフセットタイプを復号する。
 図42(b)で示すように、オフセットタイプ変換テーブル選択部6117は、パラメータ条件に応じてエッジオフセットタイプ及びバンドオフセットタイプ格納部6118’が備える変換テーブルもしくは、水平エッジオフセットタイプ及びバンドオフセットタイプ変換テーブル格納部6119’が備える変換テーブルを選択する。一つの例では、色成分が輝度の場合に、エッジオフセットタイプ及びバンドオフセットタイプ格納部6118’が備える変換テーブルを選択し、色差の場合に、水平エッジオフセットタイプ及びバンドオフセットタイプ変換テーブル格納部6119’が備える変換テーブルを選択する。
 クラス分類部624では、内部の使用オフセットタイプ選択部6112において、パラメータ条件に応じて水平エッジ分類方法のみに限定するようなエッジ分類方法を選択し、エッジオフセットクラス分類部6243において画素を分類する。一つの例では、色成分が輝度の場合においては、基本エッジ分類方法を選択し、色成分が色差の場合には、水平エッジ分類方法を選択する。
 〔実施の形態6〕
 本発明の他の実施の形態について図35~37に基づいて説明すれば、以下のとおりである。本実施形態において、上記実施形態と異なるのは、色差の画素値の中央付近において、オフセット精度を向上させるか、またはクラスの分割を細かくしている点である。
 画像において、無彩色付近の誤差は主観画質において目立ちやすいという特性がある。各色差の画素値において、無彩色とは、値域の中央であり、ビット深度が8ビットの場合であれば、画素値128の画素の色である。そこで、本実施形態では、BOの場合に、色差の画素値128近辺について、オフセット精度を上げるか、またはより小さなクラス幅を用いてクラス分割を細かくしている。お、以下では、色差の画素値について無彩色付近の値域を、無彩色値域と呼ぶ。
 これにより、無彩色値域のオフセット精度を上げることができるので、無彩色値域でのオフセット補正の性能が向上する。よって、無彩色値域での原画像との誤差が減少し、主観画質を向上させることができる。また、無彩色値域において、クラスの分割を他の値域よりも狭く分割することにより、無彩色値域でのオフセット補正をより精密に行うことができる。これにより、原画像との誤差を減少させることができ、主観画質を向上させることができる。
 なお、本実施の形態では、無彩色値域のオフセット精度の向上、およびクラス分割の細分化を行っているが、これに限らず、主観画質に影響しそうな範囲の値に対して、クラス分割を細分化したり、オフセット精度を向上させたりすれば、主観画質を向上させることができる。また、輝度の画素値においても、主観画質上、画質劣化が目立ちやすい画素値域に対して、同様にオフセット精度を上げたり、クラス分割を細分化したりする構成でも同様の効果を奏することができる。
 まず、オフセットの精度を向上させる場合について、図35を参照して説明する。図35は、オフセットの精度を向上させる場合についての概要を示す図である。図35に示すように、オフセットの精度を向上させる場合、色差の画素値128付近のオフセットの精度を高精度にし、これ以外の値域のオフセットの精度を低精度とする。
 また、オフセット情報格納部621は、オフセットが高精度の値域のオフセットについては、nビット(例えばn=8)の格納領域を確保し、オフセットが低精度の値域のオフセットについては、nビット(例えばn=6)の格納領域を確保している。なお、記憶領域に余裕があればnビット統一してもよい。この場合は、実装が容易となる。
 また、オフセットクリップ部812は、オフセットが高精度の値域と低精度の値域とで、クリップ範囲を切り換える。例えば、オフセットが低精度の値域については、クリップ範囲を、-2nA/2~2nA/2-1とし、オフセットが高精度の値域については、クリップ範囲を、-2nB/2~2nB/2-1とする。
 次に、クラス分類を細分化する場合について、図36を参照して説明する。図36はクラス分類を細分化する場合の概要を示す図であり、(a)は変換テーブルを示し、(b)~(d)はクラス分割を説明するための図である。
 そして、クラス分類を細分化する場合は、オフセット情報格納部621における色差用のリストメモリにおいて、“sao_type_idx”=5に相当するオフセット格納領域を、クラス分類数に応じて確保する。
 また、クラス分類部624において、BOの場合に、画素値からクラスを導出する際に、対象画素の画素値が無彩色値域かどうかを含めて判定する。具体的には、例えば図36(a)に示す変換テーブル2501のいずれかを用いて、クラス分類を行う。
 変換テーブル2501では、“class_idx = BoTbl[sao_type_idx][pix[x]/4]”により、クラス分類を行っており、図29の変換テーブル1301、1302よりも、より細かい画素値に対してクラスが割り当てられている。
 また、変換テーブル2501の「BoTbl[BO_0][pix/4](a)」では、クラスを16個に分け、無彩色値域を細分化し、中間階調域(pix/4=16~21,42~47)を粗くした例を示している(図36(b))。また、「BoTbl[BO_0][pix/4](b)」では、クラスを16個に分けるとともに、オフセット有りの値域を狭め、クラス数とクラス幅の最大値を維持しつつ無彩色値域を細分化した例を示している(図36(c))。また、「BoTbl[BO_0][pix/4](c)」では、クラスを18個に分け、無彩色付近の値域を細分化するとともに、クラス幅の最大値も維持した例を示している(図36(d))。また、この他にも例を挙げれば、中間階調域のクラス幅を無彩色値域のクラス幅よりも相対的に大きくし、全体のクラス数を減らすことで、無彩色値域の補正精度を従来通り保ったまま、オフセット格納領域を削減することができる。これは、中間階調域におけるオフセット補正の使用頻度が、無彩色領域よりも低いことから可能である。
 また、オフセットの精度向上と、無彩色値域におけるクラス分類の細分化とを併用した構成であってもよい。
 また、輝度を示す画素値と色差を示す画素値とで、オフセットの精度を異ならせる構成、すなわち、色差を示す画素値に対するオフセットの精度を、輝度を示す画素値に対するオフセットの精度より粗くする構成であってもよい。
 (付記事項7)
 また、オフセットの加算を、無彩色(=色差の画素値128)に近づける方向に行う構成であってもよい。すなわち、オフセット加算部626は、画素値が128以上と128未満とで、加算するオフセットの符号を逆にして扱ってもよい。例えば、オフセットa のとき、x’=x+a(x<128),x’=x-a(x≧128)としてもよい。
 また、オフセット加算後の画素値が128をまたぐような場合、128でクリップする構成であってもよい。例えば、画素値が「126(緑の側)」で、オフセットが「3」のときに、そのままオフセットを加算して、x=126+3=129とせずに、x=clip(126+3,0,128)=128としてもよい。ここで、clip(x,y,z)は、xの値をy≦x≦zに制限する処理を示す。
 また、例えば、画素値が「129(赤の側)」で、オフセットが「-4」のときも、そのままオフセットを加算して、x=129+(-4)=125とせずに、x=clip(129+(-4),128,255)=128としてもよい。
 (付記事項8)
 また、色差において、中間階調域とその他の値域とに分けてオフセットを加算する構成であってもよい。例えば、図37(a)に示すように、無彩色の画素値を考慮してクラス分類を行ってもよい。図37(a)に示す例では、“sao_type_idx”=5(BO_0)の場合、中間階調域にクラスが割り当てられ、“sao_type_idx”=6(BO_1)の場合、中間階調域以外の値域にクラスが割り当てられている。
 また、図37(b)に示すように、無彩色の画素値を挟む2つの値域で非対称にクラス分類されていてもよい。図37(b)に示す例では、図37(a)に示す例とクラスの幅は同じで区切りの位置が変更されている。
 また、図37(c)、(d)に示すように、色差のチャネル(CrおよびCb)ごとに、異なるクラス分類を用いてもよい。図37(c)、(d)に示す例では、色差(Cr)と色差(Cb)とでクラスの幅が異なっている。クラス幅の変更は、変換テーブル2501のようにクラス数を細分化することで可能である。
 また、図37(e)に示すように、色差では、BOのタイプを1つにしてクラス分類を行う構成であってもよい。
 〔実施の形態7〕
 本発明の他の実施の形態について図38~40に基づいて説明すれば、以下のとおりである。本実施形態において、上記実施形態と異なるのは、オフセットの値そのものではなく、オフセットの値を予測符号化、すなわち、オフセットの値と当該オフセットの値の予測値とを用いて算出されるオフセット残差を符号化する点、およびオフセット予測値に「0」を設ける点である。
 一般的にSAOでは、領域分類を示すクラスに応じてオフセットを符号化する。当該クラスに分類される画素が無い(クラスが空である)場合には「0」が符号化される。通常、近傍クラスおよび近傍領域のオフセットは近い値を有するため、既に復号したオフセット値を予測値とし差分を符号化すれば、符号量を削減することが可能である。しかしながら、クラスが空である場合には、逆に符号量が増加してしまう。
 そこで、本実施形態では、オフセットの予測値に「0」を含め、「0」を含む複数の予測値候補から1つの予測値を選択し、予測差分を符号化することによりオフセットの符号量を低減している。
 これにより、クラスが空であっても、当該クラスに分類される画素が有り、オフセットが符号化される場合であっても、適した予測値を割り当てることができるため、予測符号化により符号量を削減することができる。
 本実施形態に係るオフセット情報復号部611’の構成について、図38を参照して説明する。オフセット情報復号部611’は、図22のオフセット情報復号部611の代わりに設けられているものであり、オフセット残差復号部651、オフセット復元部652、予測値導出部653を含む構成である。また、予測値導出部653は、予測候補フラグ復号部661、固定予測値算出部662、符号化予測値算出部663、および予測値候補選択部664を含む構成である。
 オフセット残差復号部651は、符号化データ#1に含まれるQAOU情報からオフセット残差を復号し、復号したオフセット残差をオフセット復元部652へ供給する。
 予測値導出部653は、オフセットの予測値を導出する。予測候補フラグ復号部661は、予測候補フラグをQAOU情報から復号し、復号した予測候補フラグを予測値候補選択部664に供給する。なお、予測候補フラグ復号部661は、以前に復号されたオフセット値が「0」である場合には、候補選択フラグを復号しない構成であってもよい。”
 固定予測値算出部662は、当該クラスに分類される画素が無い場合に符号化されるオフセットである固定値(ここでは「0」)を予測値として算出し、予測値候補選択部664に供給する。
 符号化予測値算出部663は、既に復号されたオフセットをオフセット情報格納部621から読み出し予測値を算出し、予測値候補選択部664に供給する。
 予測値候補選択部664は、予測候補フラグに応じて、固定予測値算出部662から供給された予測値および符号化予測値算出部663から供給された予測値から、オフセット復元部652に供給する予測値を選択する。
 オフセット復元部652は、予測値候補選択部664から供給された予測値(pred)とオフセット残差復号部651から供給されたオフセット残差(sao_offset)とから、次の式にしたがって、オフセット(Offset)を復元する。
“Offset”=“pred”+“sao_offset”
 ここで、分類される画素がないクラス(空のクラス)がある場合に、符号量が増えてしまう理由について、図39を参照して説明する。図39は、空のクラスがある場合の概要を示す図である。図39に示すように、空でないクラスには、当該クラスのオフセットが符号化されている。そして、クラス毎に、前回のオフセットを予測値として該予測値とオフセットとの差分が符号化される。しかしながら、空のクラスがあると、予測値が「0」となり、差分値が大きくなってしまう。これにより、符号量が増大してしまう。
 そこで、本実施形態では、予測候補フラグにより、予測値を「0」と「直前の(0以外の)オフセット」とから選択できるようにしている。
 予測候補フラグを用いる場合のシンタクスについて、図40を参照して説明する。図40は、予測候補フラグを用いる場合のシンタクス2901を示す図である。図40に示すように、予測候補フラグ“sao_pred_flag”を追加し、“sao_pred_flag”=0であれば直前に復号した(0でない)オフセットを予測値offsetpとし、“sao_pred_flag”=1か、または最初のオフセットであれば、予測値offsetp=0とする。なお、シンタクス2901において、“sao_offset_delta”は予測値からの差分dを表し、“sao_offset[sao_curr_depth][ys][xs]”=“offsetp +d”となる。
 なお、オフセットタイプに応じて、予測候補フラグを用いない構成としてもよい。例えば、EOの場合は、予測候補フラグを用いず、BOの場合は、予測候補フラグを用いる構成にしてもよい。これは、BOでは、画素値の分布次第で、空のクラスがしばしば発生するためである。
 また、オフセットタイプに応じて、予測符号化自体を行うか否か決定する構成であってもよい。例えば、EOの場合は、予測符号化を行い、BOの場合は予測符号化を行わない構成であってもよい。
 (付記事項9)
 また、上記実施の形態3~7において、イントラ予測モードを用いて、LCU単位で、エッジオフセットのクラスを推定したり、制限したり、並べ替えを行ったりしてもよい。
 SAOのEOタイプとして選択されるエッジ方向は、イントラ予測モードと相関があると考えられる。このため、SAOのQAOUと対応する位置にあるCUのイントラ予測モードを参照すれば、EOクラスの選択に利用することができる。
 例えば、イントラ予測モードにより、EOクラスを推定して決定したり、EOクラスの候補を制限したり、あるいは、EOクラスの順序(インデックス)を、選択される可能性が高い順に並べ替えたりすることができる。
 これは、SAOの各階層のブQAOUのサイズがCUと同じサイズの場合、例えばSAOのQAOUの最大サイズがLCUサイズに等しくなるように画像が分割される場合であれば、特に容易に実現可能である。
 (付記事項10)
 従来の適応オフセットフィルタでは、オフセットの種類(タイプ、クラス)が多いため、大きなメモリサイズが必要となってしまう可能性がある。そこで、本実施の形態では、メモリサイズの増大を抑制しつつ、ブロック歪みを低減することのできる画像フィルタ装置等を実現している。
 本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値に、複数のオフセットの中から選択したオフセットを加算する画像フィルタ装置であって、各単位領域に含まれる画素の画素値に加算するオフセットを該単位領域ごとに決定するオフセット決定手段と、上記オフセット決定手段が決定したオフセットを、当該単位領域に含まれる画素の画素値に加算するフィルタ手段と、を備え、上記オフセット決定手段は、オフセットの決定対象となる単位領域のサイズが所定の大きさよりも小さい場合、単位領域のサイズが所定の大きさ以上の場合よりも選択できるオフセット数が制限されたオフセットの中から当該単位領域に含まれる画素の画素値に加算するオフセットを決定することを特徴としている。
 上記の構成によれば、オフセットの決定対象となる単位領域のサイズが所定の大きさよりも小さい場合、単位領域のサイズが所定の大きさ以上の場合よりも制限されたオフセットの中から、加算するオフセットが決定される。
 単位領域のサイズが小さい場合、その中に含まれる画素数は少なくなり、また、その画素同士は、近似した値を持っている可能性が高い。よって、単位領域のサイズが小さい場合は、選択可能なオフセット数を制限したとしても、オフセット適用後の画像に与える影響は小さい。また、選択可能なオフセット数を制限することで、必要なメモリの容量を減らすことができる。
 したがって、上記の構成によれば、オフセット適用後の画像に与える影響を低くしつつ、メモリの使用量を削減することができる。また、選択可能なオフセット数が少なくなることで、符号量が削減でき、符号化効率が向上する。
 上記課題を解決するために、本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、各単位領域に含まれる画素の画素値に加算するオフセットを該単位領域ごとに決定するオフセット決定手段と、上記オフセット決定手段が決定したオフセットを、当該単位領域に含まれる画素の画素値に加算するフィルタ手段と、を備え、上記フィルタ手段は、オフセットの決定対象となる単位領域のサイズが所定の大きさよりも小さい場合、単位領域のサイズが所定の大きさ以上の場合よりも精度を粗くしたオフセットを加算することを特徴としている。
 上記の構成によれば、オフセットの決定対象となる単位領域のサイズが所定の大きさよりも小さい場合、単位領域のサイズが所定の大きさ以上の場合よりも精度が粗いオフセットが加算される。
 単位領域のサイズが小さい場合、その中に含まれる画素数は少なくなり、また、その画素同士は、近似した値を持っている可能性が高い。よって、単位領域のサイズが小さい場合は、オフセットの精度を粗くしても、量子化誤差に与える影響が小さい。したがって、オフセット適用後の画像に与える影響も小さい。また、オフセットの精度を粗くすることで、必要なメモリの容量を減らすことができる。
 したがって、上記の構成によれば、オフセット適用後の画像に与える影響を低くしつつ、メモリの使用量を削減することができる。また、オフセットの精度が粗くなることで、符号量が削減でき、符号化効率が向上する。
 本発明に係る画像フィルタ装置は、複数の単位領域から構成される入力画像の各画素値に、適応オフセット(SAO:Sample Adaptive Offset)を施す画像フィルタ装置であって、各単位領域に含まれる画素の画素値に加算するオフセットの種類を該単位領域ごとに決定するオフセット決定手段と、上記オフセット決定手段が決定したオフセットの種類に応じたオフセットを、当該単位領域に含まれる画素の画素値に加算するフィルタ手段と、を備え、上記オフセット決定手段は、オフセットを加算する対象画素の画素値が最大値および最小値の付近については、オフセットの種類をバンドオフセット(BO)に決定し、それ以外の値域の画素についてはエッジオフセット(EO)に決定することを特徴としている。
 上記の構成によれば、適応オフセットを施す場合に、画素値が、最大値および最小値の付近の画素に対しては、バンドオフセットが適用され、これ以外の値域の画素についてはエッジオフセットが適用される。
 高画素値域および低画素値域では、エッジよりも画素値の方が誤差に影響を及ぼし易いという傾向があるので、上記の構成により、誤差補正の効率が高まり、符号化効率を向上させることができる。
 また、1つのタイプでバンドオフセットとエッジオフセットとを併用すれば、適応オフセットのタイプ数を減らすことができ、メモリの使用量および処理量を削減することができる。
 なお、上記の構成において、バンドオフセットとは、処理対象の画素の画素値の大きさに応じて、当該処理対象画素の画素値に複数のオフセットの何れかを加算するオフセット処理のことをいう(以下同様)。また、上記の構成において、エッジオフセットとは、処理対象の画素の画素値と当該処理対象の画素の周辺の画素の画素値との差分に応じて、当該処理対象画素の画素値に複数のオフセットの何れかを加算するオフセット処理のことをいう(以下同様)。
 本発明に係る画像フィルタ装置では、上記オフセット決定手段は、画素値が最小値から最大値の4分の1までと、最大値の4分の3から最大値までの値域の画素については、バンドオフセットに決定し、これ以外の値域についてはエッジオフセットに決定するものであってもよい。
 上記の構成によれば、バンドオフセットが適用される画素とエッジオフセットが適用される画素とを明確に分けることができる。
 本発明に係る画像フィルタ装置は、入力画像に、適応オフセット(SAO:Sample Adaptive Offset)を施す画像フィルタ装置であって、エッジオフセット(EO)を適用するときのクラスを決定するために行うエッジの判定を、対象画素の水平方向に存在する画素のみを参照して行うクラス分類手段と、エッジオフセット(EO)を適用する場合、上記クラス分類手段が分類したクラスに対応するオフセットを加算するフィルタ手段と、を備えていることを特徴としている。
 上記の構成によれば、エッジの判定に、水平方向の画素しか参照しないので、上方向の画素も参照する場合と比較して、必要なメモリ量を削減することができる。また、上方向の境界判定が不要となるので、処理量も削減することができる。
 本発明に係る画像フィルタ装置では、上記クラス分類手段は、対象画素から水平方向に2画素離れた位置にある画素を参照してエッジの判定を行うものであってもよい。
 上記の構成によれば、対象画素から2画素離れた画素を参照するので、エッジの角度が浅い場合であっても、エッジを検出することができる。
 本発明に係る画像フィルタ装置は、入力画像に、適応オフセット(SAO:Sample Adaptive Offset)を施す画像フィルタ装置であって、色差を示す画素値が、最大値および最小値の中央の値である中央値付近のクラスの分割幅を、その他の値域よりも細分化して、バンドオフセット(BO)を適用するときのクラスを決定するクラス分類手段と、バンドオフセット(BO)を適用する場合、上記クラス分類手段が分類したクラスに対応するオフセットを加算するフィルタ手段と、を備えていることを特徴としている。
 上記の構成によれば、色差を示す画素値が、最大値および最小値の中央の値である中央値付近のクラスの分割幅を、その他の値域よりも細分化して、バンドオフセット(BO)を適用するときのクラスを決定される。
 色差の画素値が中央値のとき、当該画素は無彩色となる。無彩色の誤差は、人の目に付き易く、主観画質が低下する。そこで、上記の構成のように、中央値近辺のクラス幅を細分化すれば、中央値近辺の画素に対し、細かくオフセットを設定することができる。これにより、主観画質を向上させることができる。
 本発明に係る画像フィルタ装置では、上記フィルタ手段は、オフセット加算前の画素値と加算後の画素値との間に、上記中央値が存在する場合、オフセット加算後の画素値を上記中央値とするものであってもよい。
 上記の構成によれば、中央値を超えてオフセットが加算されることはなくなる。色差の画素値が中央値の画素は無彩色であり、中央値を挟んだ両側では、人の目で知覚できる色が変わってしまう。そこで、上記の構成によれば、オフセットが加算されたことにより、人が近くする色が変わってしまうことを防止することができる。
 本発明に係る画像フィルタ装置は、入力画像に、適応オフセット(SAO:Sample Adaptive Offset)を施す画像フィルタ装置であって、色差を示す画素値が、最大値および最小値の中央の値である中央値付近の画素に対し、その他の値域の画素よりも精度が高いオフセットを加算するフィルタ手段を備えていることを特徴としている。
 上記の構成によれば、色差を示す画素値が、最大値および最小値の中央の値である中央値付近の画素に対し、その他の値域の画素よりも精度が高いオフセットを加算する。
 色差の画素値が中央値のとき、当該画素は無彩色となる。無彩色の誤差は、人の目に付き易く、主観画質が低下する。そこで、上記の構成のように、中央値近辺では、加算するオフセットの精度を向上させれば、中央値近辺の画素に対し、細かくオフセットを加算することができる。これにより、主観画質を向上させることができる。
 本発明に係るオフセット復号装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを復号するオフセット復号装置であって、各オフセット残差を、符号化データから復号するオフセット残差復号手段と、各オフセットの予測値を、復号済みのオフセット、または予め定められた値から導出する予測値導出手段と、各オフセットを、上記予測値導出手段によって導出された予測値、および上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、を備えていることを特徴としている。
 上記の構成によれば、残差からオフセットを復号するので、オフセットをそのまま符号化する場合よりも、符号量の少なくすることができる。また、残差を求めるための予測値を復号済みのオフセットまたは予め定められた値から導出するので、復号済みのオフセットのみを用いることにより、差分データの符号量が、そのまま符号化するときよりも大きくなってしまうことを防止することができる。
 なお、予め定められた値としては、例えば「0」を挙げることができる。
 本発明に係るオフセット符号化装置は、入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを符号化するオフセット符号化装置であって、各オフセットの予測値を、符号化済みのオフセット、または予め定められた値から導出する予測値導出手段と、各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段と、を備えていることを特徴としている。
 上記の構成によれば、残差からオフセットを復号するので、オフセットをそのまま符号化する場合よりも、符号量の少なくすることができる。また、残差を求めるための予測値を復号済みのオフセットまたは予め定められた値から導出するので、復号済みのオフセットのみを用いることにより、差分データの符号量が、そのまま符号化するときよりも大きくなってしまうことを防止することができる。
 本発明に係る符号化データのデータ構造は、複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタによって参照される符号化データのデータ構造であって、予測値を、復号済みのオフセットおよび予め定められた値のいずれから導出するかを示す予測値導出情報を含み、上記画像フィルタは、上記符号化データに含まれる予測値導出情報を参照して、予測値を導出し、オフセットを復号する、ことを特徴としている。
 上記の構成によれば、予測値を、復号済みのオフセットとするか、または予め定められた値とするかを、予測値導出情報により決定できる。
 (応用例)
 上述した動画像復号装置1(1’)および動画像符号化装置2(2’)は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい)。
 まず、上述した動画像復号装置1および動画像符号化装置2を、動画像の送信および受信に利用できることを、図45を参照して説明する。
 図45(a)は、動画像符号化装置2を搭載した送信装置Aの構成を示したブロック図である。図45(a)に示すように、送信装置Aは、動画像を符号化することによって符号化データを得る符号化部A1と、符号化部A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部A2と、変調部A2が得た変調信号を送信する送信部A3と、を備えている。上述した動画像符号化装置2は、この符号化部A1として利用される。
 送信装置Aは、符号化部A1に入力する動画像の供給源として、動画像を撮像するカメラA4、動画像を記録した記録媒体A5、動画像を外部から入力するための入力端子A6、および画像を生成または加工する画像処理部A7を更に備えていてもよい。図45(a)においては、これら全てを送信装置Aが備えた構成を例示しているが、一部を省略しても構わない。
 なお、記録媒体A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体A5と符号化部A1との間に、記録媒体A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
 図45(b)は、動画像復号装置1を搭載した受信装置Bの構成を示したブロック図である。図45(b)に示すように、受信装置Bは、変調信号を受信する受信部B1と、受信部B1が受信した変調信号を復調することによって符号化データを得る復調部B2と、復調部B2が得た符号化データを復号することによって動画像を得る復号部B3と、を備えている。上述した動画像復号装置1は、この復号部B3として利用される。
 受信装置Bは、復号部B3が出力する動画像の供給先として、動画像を表示するディスプレイB4、動画像を記録するための記録媒体B5、および、動画像を外部に出力するための出力端子B6を更に備えていてもよい。図45(b)においては、これら全てを受信装置Bが備えた構成を例示しているが、一部を省略しても構わない。
 なお、記録媒体B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部B3と記録媒体B5との間に、復号部B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
 なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、および有線通信の何れによって実現してもよい。
 例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置A/受信装置Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置A/受信装置Bの一例である。
 また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置A/受信装置Bの一例である(通常、LANにおいては伝送媒体として無線または有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、およびタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
 なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置Aおよび受信装置Bの双方として機能する。
 次に、上述した動画像復号装置1および動画像符号化装置2を、動画像の記録および再生に利用できることを、図46を参照して説明する。
 図46(a)は、上述した動画像復号装置1を搭載した記録装置Cの構成を示したブロック図である。図46(a)に示すように、記録装置Cは、動画像を符号化することによって符号化データを得る符号化部C1と、符号化部C1が得た符号化データを記録媒体Mに書き込む書込部C2と、を備えている。上述した動画像符号化装置2は、この符号化部C1として利用される。
 なお、記録媒体Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
 また、記録装置Cは、符号化部C1に入力する動画像の供給源として、動画像を撮像するカメラC3、動画像を外部から入力するための入力端子C4、動画像を受信するための受信部C5、および、画像を生成または加工する画像処理部C6を更に備えていてもよい。図46(a)においては、これら全てを記録装置Cが備えた構成を例示しているが、一部を省略しても構わない。
 なお、受信部C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部C5と符号化部C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
 このような記録装置Cとしては、例えば、DVDレコーダ、BDレコーダ、HD(Hard Disk)レコーダなどが挙げられる(この場合、入力端子C4または受信部C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラC3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部C5または画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラC3または受信部C5が動画像の主な供給源となる)なども、このような記録装置Cの一例である。
 図46(b)は、上述した動画像復号装置1を搭載した再生装置Dの構成を示したブロックである。図46(b)に示すように、再生装置Dは、記録媒体Mに書き込まれた符号化データを読み出す読出部D1と、読出部D1が読み出した符号化データを復号することによって動画像を得る復号部D2と、を備えている。上述した動画像復号装置1は、この復号部D2として利用される。
 なお、記録媒体Mは、(1)HDDやSSDなどのように、再生装置Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
 また、再生装置Dは、復号部D2が出力する動画像の供給先として、動画像を表示するディスプレイD3、動画像を外部に出力するための出力端子D4、および、動画像を送信する送信部D5を更に備えていてもよい。図46(b)においては、これら全てを再生装置Dが備えた構成を例示しているが、一部を省略しても構わない。
 なお、送信部D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部D2と送信部D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
 このような再生装置Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイD3が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子D4または送信部D5が動画像の主な供給先となる)、ラップトップ型またはタブレット型PC(この場合、ディスプレイD3または送信部D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイD3または送信部D5が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイD3または送信部D5が動画像の主な供給先となる)なども、このような再生装置Dの一例である。
 (ソフトウェアによる構成)
 最後に、動画像復号装置1(1’)および動画像符号化装置2(2’)の各ブロック、特に可変長符号復号部13、動きベクトル復元部14、インター予測画像生成部16、イントラ予測画像生成部17、予測方式決定部18、逆量子化・逆変換部19、デブロッキングフィルタ41、適応フィルタ50、適応オフセットフィルタ60(60’)、変換・量子化部21、可変長符号符号化部22、逆量子化・逆変換部23、イントラ予測画像生成部25、インター予測画像生成部26、動きベクトル検出部27、予測方式制御部28、動きベクトル冗長性削除部29、デブロッキングフィルタ33、適応フィルタ70、適応オフセットフィルタ80(80’)は、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現していてもよいし、CPU(central processing unit)を用いてソフトウェア的に実現してもよい。
 後者の場合、動画像復号装置1および動画像符号化装置2は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである動画像復号装置1および動画像符号化装置2の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記の動画像復号装置1および動画像符号化装置2に供給し、そのコンピュータ(またはCPUやMPU(micro processing unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
 上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD-ROM(compact disc read-only memory)/MOディスク(magneto-optical disc)/MD(Mini Disc)/DVD(digital versatile disc)/CD-R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(erasable programmable read-only memory)/EEPROM(electrically erasable and programmable read-only memory)(登録商標)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
 また、動画像復号装置1および動画像符号化装置2を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(local area network)、ISDN(integrated services digital network)、VAN(value-added network)、CATV(community antenna television/cable television)通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(institute of electrical and electronic engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(asymmetric digital subscriber loop)回線等の有線でも、IrDA(infrared data association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(high data rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
 本発明は上述した各実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
 本発明は、画像データにオフセットフィルタリングを行う画像フィルタに好適に用いることができる。また、符号化データを復号する復号装置、および、符号化データを符号化する符号化装置に好適に適用することができる。
1         動画像復号装置(復号装置)
41        デブロッキングフィルタ
50        適応フィルタ
60、60’    適応オフセットフィルタ(画像フィルタ装置)
611、611’  オフセット情報復号部(オフセット復号装置、決定手段、オフセット属性設定手段、オフセット復号手段、オフセット残差復号手段、予測値導出手段)
612       QAOU構造復号部
613       オフセット属性設定部(オフセット属性設定手段)
621       オフセット情報格納部
622       QAOU制御部
623       オフセットタイプ導出部
624       クラス分類部(算出手段、ビットシフト手段、分類手段)
625       オフセット導出部(オフセット逆シフト手段)
626       オフセット加算部(オフセット手段)
2         動画像符号化装置(符号化装置)
33        デブロッキングフィルタ
70        適応フィルタ
80、80’    適応オフセットフィルタ(画像フィルタ装置)
811       オフセット算出部
812       オフセットクリップ部
813       オフセット情報選択部
814       オフセット残差導出部
815       オフセット属性設定部(オフセット属性設定手段)
816       オフセットシフト部(オフセットシフト手段)

Claims (19)

  1.  複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、
     符号化データを参照し、オフセット値域を設定するオフセット属性設定手段と、
     上記設定されたオフセット値域に制限されたオフセットを復号するオフセット復号手段と、
     上記入力画像の各画素値に上記オフセットを加算するフィルタ手段と
    を備えていることを特徴とする画像フィルタ装置。
  2.  上記符号化データは、上記入力画像の画素値のビット深度を含み、
     上記オフセット属性設定手段は、上記画素値のビット深度に応じて上記オフセット値域を設定する
    ことを特徴とする請求項1に記載の画像フィルタ装置。
  3.  上記オフセット属性設定手段は、上記オフセットのビット幅であるオフセットビット深度を、前記画素値のビット深度が10ビット以下の場合は画素値のビット深度と等しい値に設定し、前記画素値のビット深度が11ビット以上の場合は10に設定すると共に、上記オフセット値域を2オフセットビット深度-5以下の範囲とすることを特徴とする請求項2に記載の画像フィルタ装置。
  4.  上記復号されたオフセットは量子化された値であり、
     上記フィルタ手段は、上記オフセット属性に含まれるパラメータを用いて上記オフセットを逆量子化した値を上記各画素値に加算する
    ことを特徴とする請求項1から3の何れか1項に記載の画像フィルタ装置。
  5.  上記フィルタ手段は、上記画素値のビット深度から、上記オフセットビット深度を引いた値であるシフト値だけ左シフトをすることにより、復号したオフセットの逆量子化を行うことを特徴とする請求項3に記載の画像フィルタ装置。
  6.  入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを復号するオフセット復号装置であって、
     各オフセット残差を、符号化データから復号するオフセット残差復号手段と、
     各オフセットの予測値を、復号済みのオフセットから導出する予測値導出手段と、
     各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差から算出するオフセット算出手段と、
    を備えていることを特徴とするオフセット復号装置。
  7.  上記入力画像は、複数の単位領域から構成されており、
     上記オフセット残差復号手段は、各オフセット残差を、単位領域毎に定まるオフセットタイプ及び画素毎に定まるオフセットクラスに関連付けて復号し、
     上記予測値導出手段は、各オフセットの予測値を、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出する、
    ことを特徴とする請求項6に記載のオフセット復号装置。
  8.  上記入力画像は、複数の単位領域から構成されており、
     上記オフセット残差復号手段は、各オフセット残差を、単位領域毎に定まるオフセットタイプ及び画素毎に定まるオフセットクラスに関連付けて復号し、
     上記予測値導出手段は、各オフセットの予測値を、
      該オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合に、該オフセットと同一のオフセットタイプに関連付けられた復号済みのオフセットから導出し、
      該オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合に、該オフセットと同一のオフセットタイプ及びオフセットクラスに関連付けられた復号済みのオフセットから導出する、
    ことを特徴とする請求項6に記載のオフセット復号装置。
  9.  上記オフセット算出手段は、各オフセットを、上記予測値導出手段によって導出された予測値、及び上記オフセット残差復号手段によって復号されたオフセット残差の線形関数として算出するものであり、
     上記予測値に乗ぜられる係数は、上記オフセットに関連付けられたオフセットタイプが第1のオフセットタイプ群に属している場合と、上記オフセットに関連付けられたオフセットタイプが第2のオフセットタイプ群に属している場合とで異なっている、
    ことを特徴とする請求項8に記載のオフセット復号装置。
  10.  上記予測値導出手段は、各オフセットの予測値を、復号済みのオフセットと該復号済みのオフセットの予測値との加重平均をとることによって導出する、
    ことを特徴とする請求項6から9の何れか1項に記載のオフセット復号装置。
  11.  上記予測値導出手段は、導出した各予測値を、入力画像における各画素値のビット深度に応じた上限値及び下限値でクリップするクリップ手段を備えている、
    ことを特徴とする請求項6から10の何れか1項に記載のオフセット復号装置。
  12.  入力画像に作用する画像フィルタ装置であって、
     入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、
     上記算出手段によって参照される画素値、または、上記算出手段によって算出された差分値を所定のシフト値だけ右ビットシフトするビットシフト手段と、
     上記ビットシフト手段によって右ビットシフトされた差分値と0との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、
     上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、
    を備えていることを特徴とする画像フィルタ装置。
  13.  上記所定のシフト値は、上記対象画素の画素値のビット深度と正の相関を有している、
    ことを特徴とする請求項12に記載の画像フィルタ装置。
  14.  入力画像に作用する画像フィルタ装置であって、
     入力画像における対象画素の画素値と該対象画素の周辺の画素の画素値との差分値を算出する算出手段と、
     上記算出手段によって算出された差分値と、予め定められた第1及び第2の閾値との大小関係に応じて、上記対象画素を複数のオフセットクラスの何れかに分類する分類手段と、
     上記対象画素の画素値に対して、上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、
    を備えていることを特徴とする画像フィルタ装置。
  15.  上記第1及び第2の閾値の絶対値は、上記対象画素の画素値のビット深度と正の相関を有している、
    ことを特徴とする請求項14に記載の画像フィルタ装置。
  16.  複数の単位領域から構成される入力画像に作用する画像フィルタ装置であって、
     第1及び第2のオフセットタイプのうち、入力画像における対象画素を含む対象単位領域が属するオフセットタイプを決定する決定手段と、
     上記対象単位領域の属するオフセットタイプ、及び上記対象画素の画素値に応じて、上記対象画素を、オフセットを加算しないオフセットクラス、及びオフセットを加算する複数のオフセットクラスの何れかに分類する分類手段と、
     上記対象画素の画素値に対して、上記対象単位領域の属するオフセットタイプ及び上記分類手段によって分類されたオフセットクラスに関連付けられたオフセットを加算するオフセット手段と、
    を備えており、
     上記分類手段は、上記対象画素の画素値が所定の範囲内であるとき、上記対象画素を含む単位領域が属するオフセットタイプが上記第1及び上記第2のオフセットタイプの何れの場合であっても、上記対象画素を、オフセットを加算するオフセットクラスに分類する、
    ことを特徴とする画像フィルタ装置。
  17.  複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタ装置であって、
     複数のオフセットタイプのうち、処理対象の単位領域が属するオフセットタイプを決定する決定手段と、
     上記オフセットタイプに応じて、異なるビット幅を有するオフセットを決定すると共に、該オフセットを符号化するオフセット符号化手段と、
     上記入力画像の各画素値に上記決定されたオフセットを加算するフィルタ手段と
    を備えていることを特徴とする画像フィルタ装置。
  18.  入力画像の各画素値にオフセットを加算する画像フィルタによって参照される各オフセットを符号化するオフセット符号化装置であって、
     各オフセットの予測値を、符号化済みのオフセットから導出する予測値導出手段と、
     各オフセットと上記予測値導出手段によって導出された予測値とからオフセット残差を算出するオフセット残差算出手段と、
     上記オフセット残差算出手段によって算出されたオフセット残差を符号化するオフセット残差符号化手段と、
    を備えていることを特徴とするオフセット符号化装置。
  19.  複数の単位領域から構成される入力画像の各画素値にオフセットを加算する画像フィルタによって参照される符号化データのデータ構造であって、
     各単位領域が属するオフセットタイプに応じて異なるビット幅を有するオフセットを含んでおり、
     上記画像フィルタは、上記符号化データを参照し、処理対象の単位領域が属するオフセットタイプを決定すると共に、決定したオフセットタイプに応じて異なるビット幅を有するオフセットを復号する
    ことを特徴とする符号化データのデータ構造。
PCT/JP2012/066082 2011-06-23 2012-06-22 オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造 WO2012176910A1 (ja)

Priority Applications (35)

Application Number Priority Date Filing Date Title
EP22194948.0A EP4135323A1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
RS20181435A RS58082B1 (sr) 2011-06-23 2012-06-22 Uređaj za dekodiranje pomaka, uređaj za kodiranje pomaka, uređaj za filtriranje slike, i struktura podataka
KR1020187020857A KR101931675B1 (ko) 2011-06-23 2012-06-22 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조
US14/127,889 US9497455B2 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
SI201231467T SI2725797T1 (sl) 2011-06-23 2012-06-22 Naprava za dekodiranje odmika, naprava za kodiranje odmika, naprava za filtriranje slike in struktura podatkov
AU2012274326A AU2012274326B2 (en) 2011-06-23 2012-06-22 Offset decoding device, offset encoding device, image filter device, and data structure
EP18160110.5A EP3361725B1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
ES12802275T ES2699974T3 (es) 2011-06-23 2012-06-22 Dispositivo de decodificación de desplazamiento, dispositivo de codificación de desplazamiento, dispositivo de filtro de imagen y estructura de datos
KR1020177027760A KR101826215B1 (ko) 2011-06-23 2012-06-22 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조
EP19220154.9A EP3720127B1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
PL18160110T PL3361725T3 (pl) 2011-06-23 2012-06-22 Urządzenie do dekodowania przesunięcia, urządzenie do kodowania przesunięcia, urządzenie do filtrowania obrazu i struktura danych
EP12802275.3A EP2725797B1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset encoding device, image filter device, and data structure
JP2013521650A JP5973434B2 (ja) 2011-06-23 2012-06-22 画像フィルタ装置、フィルタ方法および動画像復号装置
KR1020187002934A KR101881869B1 (ko) 2011-06-23 2012-06-22 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조
PL12802275T PL2725797T3 (pl) 2011-06-23 2012-06-22 Urządzenie do dekodowania przesunięcia, urządzenie do kodowania przesunięcia, urządzenie do filtrowania obrazu i struktura danych
DK12802275.3T DK2725797T3 (da) 2011-06-23 2012-06-22 Offset dekoderanordning, offset koderanordning, billedfilteranordning og datastruktur
EP22194947.2A EP4135322B1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
KR1020187036558A KR102005212B1 (ko) 2011-06-23 2012-06-22 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조
KR1020147001188A KR101785770B1 (ko) 2011-06-23 2012-06-22 오프셋 복호 장치, 오프셋 부호화 장치, 화상 필터 장치 및 데이터 구조
CA2840045A CA2840045C (en) 2011-06-23 2012-06-22 Offset decoding device, offset encoding device, image filter device, and data structure
CN201280030994.0A CN103636210B (zh) 2011-06-23 2012-06-22 偏移解码装置、偏移编码装置、图像滤波器装置
EP23155769.5A EP4199513B1 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
US15/293,078 US9866833B2 (en) 2011-06-23 2016-10-13 Offset decoding device, offset coding device, image filtering device
AU2017204165A AU2017204165B2 (en) 2011-06-23 2017-06-20 Offset decoding device, offset encoding device, image filter device, and data structure
US15/820,903 US10390012B2 (en) 2011-06-23 2017-11-22 Offset decoding device, offset coding device, image filtering device
AU2018202384A AU2018202384B2 (en) 2011-06-23 2018-04-04 Offset decoding device, offset coding device, image filtering device, and data structure
US15/997,261 US10440362B2 (en) 2011-06-23 2018-06-04 Offset decoding device, offset coding device, image filtering device
US16/158,602 US10477209B2 (en) 2011-06-23 2018-10-12 Offset decoding device, offset coding device, image filtering device
HRP20181975TT HRP20181975T1 (hr) 2011-06-23 2018-11-23 Uređaj za offset dekodiranje uređaj za offset kodiranje, uređaj za filtriranje slike i struktura podataka
AU2019200704A AU2019200704B2 (en) 2011-06-23 2019-02-01 Offset decoding device, offset coding device, image filtering device, and data structure
US16/520,735 US10764580B2 (en) 2011-06-23 2019-07-24 Offset decoding device, offset coding device, image filtering device
CY20201100389T CY1123096T1 (el) 2011-06-23 2020-04-29 Διαταξη αποκωδικοποιησης μετατοπισης, διαταξη κωδικοποιησης μετατοπισης, διαταξη φιλτραρισματος εικονας, και δομη δεδομενων
US17/008,475 US11089302B2 (en) 2011-06-23 2020-08-31 Offset decoding device, offset coding device, image filtering device
US17/381,035 US11765350B2 (en) 2011-06-23 2021-07-20 Offset decoding device, offset coding device, image filtering device
US18/354,533 US20230370593A1 (en) 2011-06-23 2023-07-18 Offset decoding device, offset coding device, image filtering device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011139961 2011-06-23
JP2011-139961 2011-06-23
JP2011-215476 2011-09-29
JP2011215476 2011-09-29

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/127,889 A-371-Of-International US9497455B2 (en) 2011-06-23 2012-06-22 Offset decoding device, offset coding device, image filtering device, and data structure
US15/293,078 Continuation US9866833B2 (en) 2011-06-23 2016-10-13 Offset decoding device, offset coding device, image filtering device

Publications (1)

Publication Number Publication Date
WO2012176910A1 true WO2012176910A1 (ja) 2012-12-27

Family

ID=47422737

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/066082 WO2012176910A1 (ja) 2011-06-23 2012-06-22 オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造

Country Status (18)

Country Link
US (9) US9497455B2 (ja)
EP (6) EP3720127B1 (ja)
JP (7) JP5973434B2 (ja)
KR (5) KR101826215B1 (ja)
CN (3) CN106851318B (ja)
AU (4) AU2012274326B2 (ja)
CA (1) CA2840045C (ja)
CY (1) CY1123096T1 (ja)
DK (3) DK3720127T3 (ja)
ES (2) ES2788690T3 (ja)
HR (2) HRP20181975T1 (ja)
HU (2) HUE049411T2 (ja)
LT (1) LT3361725T (ja)
PL (2) PL2725797T3 (ja)
PT (5) PT4135322T (ja)
RS (1) RS58082B1 (ja)
SI (2) SI3361725T1 (ja)
WO (1) WO2012176910A1 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013154008A1 (ja) * 2012-04-13 2013-10-17 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP2013255252A (ja) * 2011-06-27 2013-12-19 Panasonic Corp 画像復号方法、及び画像復号装置
JP2014523183A (ja) * 2011-06-28 2014-09-08 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
US20140376608A1 (en) * 2013-06-19 2014-12-25 Apple Inc. Sample adaptive offset control
JP2015502715A (ja) * 2012-01-17 2015-01-22 ジェニップ ピーティーイー. エルティーディー. エッジオフセットを適用する方法
JP2015076866A (ja) * 2013-10-11 2015-04-20 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
JP2015128239A (ja) * 2013-12-27 2015-07-09 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
WO2015116472A1 (en) * 2014-01-30 2015-08-06 Qualcomm Incorporated Low complexity sample adaptive offset encoding
JP2015216626A (ja) * 2014-04-23 2015-12-03 ソニー株式会社 画像処理装置及び画像処理方法
KR20150140729A (ko) * 2013-04-08 2015-12-16 퀄컴 인코포레이티드 비트 심도에 기초한 샘플 적응형 오프셋 스케일링
JP2016015753A (ja) * 2015-08-31 2016-01-28 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
US9300967B2 (en) 2013-06-19 2016-03-29 Apple Inc. Sample adaptive offset control
JP2016082304A (ja) * 2014-10-10 2016-05-16 ソニー株式会社 画像処理装置、画像処理方法及び画像処理システム
JP2016527793A (ja) * 2013-07-15 2016-09-08 聯發科技股▲ふん▼有限公司Mediatek Inc. ビデオ符号化のサンプル適応オフセット処理の方法
JP2017225144A (ja) * 2011-11-07 2017-12-21 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化装置、符号化方法、符号化方法を実行させるプログラム、および記憶媒体
JP2018110313A (ja) * 2016-12-28 2018-07-12 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
US10187664B2 (en) 2011-06-28 2019-01-22 Sony Corporation Image processing device and method
CN113298843A (zh) * 2020-02-24 2021-08-24 中科寒武纪科技股份有限公司 数据量化处理方法、装置、电子设备和存储介质

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2732810A1 (en) 2008-08-04 2010-02-11 Liquidpiston, Inc. Isochoric heat addition engines and methods
US20120294353A1 (en) 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
WO2012155553A1 (en) * 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and method of sample adaptive offset for luma and chroma components
KR102349348B1 (ko) 2011-06-14 2022-01-10 엘지전자 주식회사 영상 정보 인코딩 및 디코딩 방법
PL2725797T3 (pl) 2011-06-23 2019-01-31 Huawei Technologies Co., Ltd. Urządzenie do dekodowania przesunięcia, urządzenie do kodowania przesunięcia, urządzenie do filtrowania obrazu i struktura danych
CN107426579B (zh) 2011-06-24 2020-03-10 Lg 电子株式会社 图像信息编码和解码方法
JP6031736B2 (ja) * 2011-07-21 2016-11-24 富士ゼロックス株式会社 物体識別システム及びプログラム
US9277194B2 (en) * 2011-11-08 2016-03-01 Texas Instruments Incorporated Method and apparatus for image and video coding using hierarchical sample adaptive band offset
JP2014197723A (ja) * 2012-01-06 2014-10-16 ソニー株式会社 画像処理装置および方法
CA2864570A1 (en) * 2012-04-16 2013-10-24 Mediatek Inc. Method and apparatus for sample adaptive offset coding with separate sign and magnitude
KR102164698B1 (ko) * 2013-03-25 2020-10-14 광운대학교 산학협력단 입력 버퍼를 재사용하는 샘플 적응적 오프셋 처리 장치 및 샘플 적응적 오프셋 처리 장치의 동작 방법
US20140301447A1 (en) * 2013-04-08 2014-10-09 Research In Motion Limited Methods for reconstructing an encoded video at a bit-depth lower than at which it was encoded
US9674538B2 (en) * 2013-04-08 2017-06-06 Blackberry Limited Methods for reconstructing an encoded video at a bit-depth lower than at which it was encoded
CN104184645B (zh) * 2013-05-27 2018-05-04 华为技术有限公司 一种生成操作请求的方法、设备及系统
PT3005696T (pt) * 2013-05-30 2023-07-19 Huawei Tech Co Ltd Restrições de intervalo dinâmico de deslocamento para filtragem de sao de deslocamento de arestas
US20150049821A1 (en) * 2013-08-16 2015-02-19 Qualcomm Incorporated In-loop depth map filtering for 3d video coding
CN104980747B (zh) * 2014-04-04 2019-08-09 北京三星通信技术研究有限公司 对像素标识进行处理的方法和装置
US10666975B2 (en) * 2014-04-23 2020-05-26 Sony Corporation Image processing apparatus and image processing method
KR102298599B1 (ko) 2014-04-29 2021-09-03 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 샘플 적응 오프셋 필터링에 대한 인코더측 결정
CN105208300B (zh) * 2014-06-23 2018-06-22 上海箩箕技术有限公司 图像传感器、非晶硅tft像素单元的读取电路及方法
CN104202533B (zh) * 2014-09-24 2019-05-21 中磊电子(苏州)有限公司 移动检测装置及移动检测方法
EP3206403A4 (en) * 2014-11-04 2017-11-01 Samsung Electronics Co., Ltd. Video encoding method and apparatus therefor, and video decoding method and apparatus therefor, in which edge type offset is applied
US10785475B2 (en) * 2014-11-05 2020-09-22 Mediatek Singapore Pte. Ltd. Method and apparatus of video coding with prediction offset
US10057587B2 (en) * 2015-01-31 2018-08-21 Qualcomm Incorporated Coding escape pixels for palette mode coding
CA3226914A1 (en) 2015-03-10 2016-09-15 Liquidpiston, Inc. High power density and efficiency epitrochoidal rotary engine
US20170006283A1 (en) * 2015-06-30 2017-01-05 Microsoft Technology Licensing, Llc Computationally efficient sample adaptive offset filtering during video encoding
CN114697679A (zh) 2015-09-11 2022-07-01 株式会社Kt 图像解码方法、图像编码方法和包括比特流的设备
KR20180064423A (ko) * 2015-11-04 2018-06-14 엘지전자 주식회사 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
CN106817583B (zh) * 2015-12-02 2020-01-10 福州瑞芯微电子股份有限公司 一种hevc sao计算方法和装置
EP3220643A1 (en) * 2016-03-14 2017-09-20 Thomson Licensing Method and device for encoding at least one image unit, and method and device for decoding a stream representative of at least one image unit
JP6634936B2 (ja) * 2016-04-05 2020-01-22 富士通株式会社 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、画像復号プログラムおよび画像伝送システム
US10812791B2 (en) * 2016-09-16 2020-10-20 Qualcomm Incorporated Offset vector identification of temporal motion vector predictor
EP3324543B1 (en) * 2016-11-18 2020-01-08 Nxp B.V. Adaptive filter and method of operating an adaptive filter
EP3324542B1 (en) 2016-11-18 2019-10-23 Nxp B.V. Adaptive filter with manageable resource sharing
KR20180074150A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 Sao 필터링을 포함하는 비디오 데이터의 부호화를 위한 방법 및 장치
CN110100443B (zh) * 2016-12-27 2021-12-28 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法及解码方法
JP7320352B2 (ja) * 2016-12-28 2023-08-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル送信方法、三次元モデル受信方法、三次元モデル送信装置及び三次元モデル受信装置
EP3606077A4 (en) 2017-03-22 2021-01-06 Industry - University Cooperation Foundation Hanyang University LOOP FILTERING PROCESS ACCORDING TO AN ADAPTIVE PIXEL CLASSIFICATION STANDARD
US11593918B1 (en) * 2017-05-16 2023-02-28 Apple Inc. Gradient-based noise reduction
CN116170590A (zh) * 2017-08-10 2023-05-26 夏普株式会社 图像滤波装置、图像解码装置以及图像编码装置
JP6992351B2 (ja) 2017-09-19 2022-01-13 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
US10728549B2 (en) * 2017-11-06 2020-07-28 Dolby Laboratories Licensing Corporation Adaptive loop filtering for high-dynamic range video
CN111587576B (zh) 2018-01-05 2023-03-31 株式会社索思未来 编码方法、解码方法、编码装置、解码装置以及记录介质
MX2020007663A (es) * 2018-01-19 2020-09-14 Interdigital Vc Holdings Inc Procesamiento de una nube de puntos.
WO2019167849A1 (en) * 2018-02-28 2019-09-06 Sharp Kabushiki Kaisha Systems and methods for partitioning regions of a picture for video coding using different coding unit sizes
US11216984B2 (en) * 2019-01-09 2022-01-04 Samsung Electronics Co., Ltd. Patch splitting for improving video-based point cloud compression performance
CN113647105B (zh) * 2019-01-28 2024-08-27 Op方案有限责任公司 指数分区的帧间预测
AU2020237237B2 (en) * 2019-03-12 2022-12-22 Tencent America LLC Method and apparatus for color transform in VVC
US11350108B2 (en) * 2019-03-18 2022-05-31 Tencent America LLC Affine inter prediction refinement with optical flow
CN110225339A (zh) * 2019-05-10 2019-09-10 上海德衡数据科技有限公司 一种hevc视频序列编解码加速方法
KR102655352B1 (ko) * 2019-08-22 2024-04-04 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
US11140388B2 (en) * 2019-09-06 2021-10-05 Tencent America LLC Method and apparatus for non-linear loop filtering
WO2021200921A1 (ja) * 2020-03-31 2021-10-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021246284A1 (ja) * 2020-06-02 2021-12-09 シャープ株式会社 動画像復号装置及び動画像符号化装置
JP7557298B2 (ja) 2020-07-17 2024-09-27 日本放送協会 映像符号化装置、映像復号装置及びこれらのプログラム
US11595644B2 (en) * 2020-10-01 2023-02-28 Tencent America LLC Method and apparatus for offset in video filtering
WO2022126033A1 (en) * 2020-12-29 2022-06-16 Innopeak Technology, Inc. Method and apparatus for extended precision weighted prediction for vvc high bit depth coding
CN117136546A (zh) * 2021-03-30 2023-11-28 创峰科技 用于视频编解码的加权预测
EP4349016A1 (en) * 2021-06-03 2024-04-10 Innopeak Technology, Inc. Quantization level binarization in video coding
US20240244212A1 (en) * 2023-01-13 2024-07-18 Tencent America LLC Adaptive bands for filter offset selection in cross-component sample offset

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4284265B2 (ja) 2004-11-02 2009-06-24 株式会社東芝 動画像符号化装置、動画像符号化方法、動画像復号化装置および動画像復号化方法
US7876833B2 (en) * 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
WO2007114368A1 (ja) * 2006-03-30 2007-10-11 Kabushiki Kaisha Toshiba 画像符号化装置及び方法並びに画像復号化装置及び方法
WO2007116551A1 (ja) * 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
US8774269B2 (en) 2006-10-25 2014-07-08 Franuhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Quality scalable coding with mapping different ranges of bit depths
US7983496B2 (en) 2007-06-26 2011-07-19 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes
US8331663B2 (en) 2007-06-28 2012-12-11 Qualcomm Incorporated Efficient image compression scheme to minimize storage and bus bandwidth requirements
US8208560B2 (en) * 2007-10-15 2012-06-26 Intel Corporation Bit depth enhancement for scalable video coding
KR101365444B1 (ko) 2007-11-19 2014-02-21 삼성전자주식회사 영상의 해상도의 조정을 통하여 동영상을 효율적으로부호화/복호화하는 방법 및 장치
US8750378B2 (en) 2008-09-23 2014-06-10 Qualcomm Incorporated Offset calculation in switched interpolation filters
KR101196920B1 (ko) 2009-04-08 2012-11-05 한국전자통신연구원 적응적 비트 심도 감소를 통한 부호화와 복호화 방법 및 그 장치
US20120251012A1 (en) 2009-12-18 2012-10-04 Tomohiro Ikai Image filter, encoding device, decoding device, and data structure
JP5513221B2 (ja) 2010-04-01 2014-06-04 岡本化学工業株式会社 保護層形成用組成物およびそれを用いた感光性平版印刷版
JP2011223302A (ja) 2010-04-09 2011-11-04 Sony Corp 画像処理装置と画像処理方法
CN101924938B (zh) * 2010-08-11 2012-09-05 上海交通大学 视频解码宏块预测与边界滤波中相邻块信息的处理方法
US9055305B2 (en) 2011-01-09 2015-06-09 Mediatek Inc. Apparatus and method of sample adaptive offset for video coding
EP2700230A4 (en) 2011-04-21 2014-08-06 Mediatek Inc METHOD AND APPARATUS FOR ENHANCED LOOP FILTERING
JP5539258B2 (ja) 2011-04-25 2014-07-02 株式会社イトーキ
US9008170B2 (en) 2011-05-10 2015-04-14 Qualcomm Incorporated Offset type and coefficients signaling method for sample adaptive offset
PL2725797T3 (pl) * 2011-06-23 2019-01-31 Huawei Technologies Co., Ltd. Urządzenie do dekodowania przesunięcia, urządzenie do kodowania przesunięcia, urządzenie do filtrowania obrazu i struktura danych

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CHIH-MING FU ET AL.: "CE13: Sample Adaptive Offset with LCU-Independent Decoding", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/ SC29/WG11 5TH MEETING, 16 March 2011 (2011-03-16), GENEVA, CH, XP030048124 *
CHIH-MING FU ET AL.: "CE8 Subset3: Picture Quadtree Adaptive Offset", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 4TH MEETING, 20 January 2011 (2011-01-20), DAEGU, KR, XP030047443 *
JCTVC-D122, January 2011 (2011-01-01)
JCTVC-E049, March 2011 (2011-03-01)
TAKANORI YAMAZAKI ET AL.: "Improvement of Sample Adaptive Offset with modified bit accuracy and restricted offsets", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH MEETING, 14 July 2011 (2011-07-14), TORINO, IT, XP030049385 *

Cited By (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013255252A (ja) * 2011-06-27 2013-12-19 Panasonic Corp 画像復号方法、及び画像復号装置
US10187664B2 (en) 2011-06-28 2019-01-22 Sony Corporation Image processing device and method
US9438922B2 (en) 2011-06-28 2016-09-06 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
JP2016197890A (ja) * 2011-06-28 2016-11-24 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
US9462288B2 (en) 2011-06-28 2016-10-04 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
JP2014523183A (ja) * 2011-06-28 2014-09-08 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
JP2015128333A (ja) * 2011-06-28 2015-07-09 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
US9438921B2 (en) 2011-06-28 2016-09-06 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
JP2015128332A (ja) * 2011-06-28 2015-07-09 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
JP2015128334A (ja) * 2011-06-28 2015-07-09 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
US10542273B2 (en) 2011-06-28 2020-01-21 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
JP2015164331A (ja) * 2011-06-28 2015-09-10 サムスン エレクトロニクス カンパニー リミテッド ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びに該ビデオ復号化方法及びその装置
US9426483B2 (en) 2011-06-28 2016-08-23 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
US9426482B2 (en) 2011-06-28 2016-08-23 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
US10038911B2 (en) 2011-06-28 2018-07-31 Samsung Electronics Co., Ltd. Video encoding method using offset adjustments according to pixel classification and apparatus therefor, video decoding method and apparatus therefor
JP2017225144A (ja) * 2011-11-07 2017-12-21 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化装置、符号化方法、符号化方法を実行させるプログラム、および記憶媒体
JP2021040333A (ja) * 2011-11-07 2021-03-11 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化方法
JP2020022183A (ja) * 2011-11-07 2020-02-06 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化方法
JP7077385B2 (ja) 2011-11-07 2022-05-30 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化方法
JP2019036982A (ja) * 2011-11-07 2019-03-07 キヤノン株式会社 サンプル適応オフセットの処理を実行するための情報を符号化する符号化方法、および処理方法
US9485522B2 (en) 2012-01-17 2016-11-01 Infobridge Pte. Ltd. Method of applying edge offset
US9172961B2 (en) 2012-01-17 2015-10-27 Infobridge Pte. Ltd. Method of applying edge offset
US9503758B2 (en) 2012-01-17 2016-11-22 Infobridge Pte. Ltd. Method of applying edge offset
JP2015502715A (ja) * 2012-01-17 2015-01-22 ジェニップ ピーティーイー. エルティーディー. エッジオフセットを適用する方法
US9516348B2 (en) 2012-01-17 2016-12-06 Inforbridge Pte. Ltd. Method of applying edge offset
US9491489B2 (en) 2012-01-17 2016-11-08 Infobridge Pte. Ltd. Method of applying edge offset
US9491488B2 (en) 2012-01-17 2016-11-08 Infobridge Pte. Ltd. Method of applying edge offset
US10063859B2 (en) 2012-01-17 2018-08-28 Infobridge Pte. Ltd. Method of applying edge offset
JPWO2013154008A1 (ja) * 2012-04-13 2015-12-17 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2013154008A1 (ja) * 2012-04-13 2013-10-17 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US10009616B2 (en) 2012-04-13 2018-06-26 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
JP2016226035A (ja) * 2012-04-13 2016-12-28 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び符号化ビットストリームを記録した記録媒体
JP2018121352A (ja) * 2012-04-13 2018-08-02 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び符号化ビットストリームのデータ構造を記録した記録媒体
US10334253B2 (en) 2013-04-08 2019-06-25 Qualcomm Incorporated Sample adaptive offset scaling based on bit-depth
JP2016518770A (ja) * 2013-04-08 2016-06-23 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビット深度に基づいたサンプル適応オフセットスケーリング
KR20150140729A (ko) * 2013-04-08 2015-12-16 퀄컴 인코포레이티드 비트 심도에 기초한 샘플 적응형 오프셋 스케일링
KR102318175B1 (ko) 2013-04-08 2021-10-26 퀄컴 인코포레이티드 비트 심도에 기초한 샘플 적응형 오프셋 스케일링
AU2014281169B2 (en) * 2013-06-19 2017-01-19 Apple Inc. Sample adaptive offset control
JP2022174102A (ja) * 2013-06-19 2022-11-22 アップル インコーポレイテッド サンプルアダプティブオフセット制御
JP2018078611A (ja) * 2013-06-19 2018-05-17 アップル インコーポレイテッド サンプルアダプティブオフセット制御
CN111526367A (zh) * 2013-06-19 2020-08-11 苹果公司 样本自适应偏移控制
AU2021204661B2 (en) * 2013-06-19 2022-11-24 Apple Inc. Sample adaptive offset control
US10708588B2 (en) * 2013-06-19 2020-07-07 Apple Inc. Sample adaptive offset control
US20140376608A1 (en) * 2013-06-19 2014-12-25 Apple Inc. Sample adaptive offset control
US11363264B2 (en) 2013-06-19 2022-06-14 Apple Inc. Sample adaptive offset control
US9300967B2 (en) 2013-06-19 2016-03-29 Apple Inc. Sample adaptive offset control
CN111526367B (zh) * 2013-06-19 2023-08-04 苹果公司 具有样本自适应偏移控制的解码方法、系统、介质和装置
AU2017202576B2 (en) * 2013-06-19 2018-03-22 Apple Inc. Sample adaptive offset control
AU2020201584B2 (en) * 2013-06-19 2021-04-08 Apple Inc. Sample adaptive offset control
JP2021044811A (ja) * 2013-06-19 2021-03-18 アップル インコーポレイテッドApple Inc. サンプルアダプティブオフセット制御
JP2016527793A (ja) * 2013-07-15 2016-09-08 聯發科技股▲ふん▼有限公司Mediatek Inc. ビデオ符号化のサンプル適応オフセット処理の方法
JP2018082453A (ja) * 2013-07-15 2018-05-24 寰發股▲ふん▼有限公司HFI Innovation Inc. ビデオ符号化のサンプル適応オフセット処理の方法
US10659817B2 (en) 2013-07-15 2020-05-19 Hfi Innovation Inc. Method of sample adaptive offset processing for video coding
JP2015076866A (ja) * 2013-10-11 2015-04-20 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
JP2015128239A (ja) * 2013-12-27 2015-07-09 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法、及びプログラム
WO2015116472A1 (en) * 2014-01-30 2015-08-06 Qualcomm Incorporated Low complexity sample adaptive offset encoding
JP2017507571A (ja) * 2014-01-30 2017-03-16 クアルコム,インコーポレイテッド 低複雑度サンプル適応オフセット符号化
CN105940677A (zh) * 2014-01-30 2016-09-14 高通股份有限公司 低复杂性样本自适应偏移编码
US9628822B2 (en) 2014-01-30 2017-04-18 Qualcomm Incorporated Low complexity sample adaptive offset encoding
US10477207B2 (en) 2014-04-23 2019-11-12 Sony Corporation Image processing apparatus and image processing method
JP2015216626A (ja) * 2014-04-23 2015-12-03 ソニー株式会社 画像処理装置及び画像処理方法
JP2016082304A (ja) * 2014-10-10 2016-05-16 ソニー株式会社 画像処理装置、画像処理方法及び画像処理システム
JP2016015753A (ja) * 2015-08-31 2016-01-28 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP2018110313A (ja) * 2016-12-28 2018-07-12 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
CN113298843A (zh) * 2020-02-24 2021-08-24 中科寒武纪科技股份有限公司 数据量化处理方法、装置、电子设备和存储介质
CN113298843B (zh) * 2020-02-24 2024-05-14 中科寒武纪科技股份有限公司 数据量化处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CY1123096T1 (el) 2021-12-31
SI2725797T1 (sl) 2018-12-31
DK2725797T3 (da) 2019-01-02
EP4199513B1 (en) 2024-08-14
AU2018202384B2 (en) 2018-11-01
KR102005212B1 (ko) 2019-07-29
EP4135322A1 (en) 2023-02-15
SI3361725T1 (sl) 2020-07-31
KR20180136585A (ko) 2018-12-24
CA2840045C (en) 2019-10-22
KR20180015280A (ko) 2018-02-12
RS58082B1 (sr) 2019-02-28
HRP20200675T1 (hr) 2020-07-24
AU2017204165A1 (en) 2017-07-13
CA2840045A1 (en) 2012-12-27
US20140140416A1 (en) 2014-05-22
JP5973434B2 (ja) 2016-08-23
US11765350B2 (en) 2023-09-19
PT2725797T (pt) 2018-12-05
KR101785770B1 (ko) 2017-10-16
US20210352283A1 (en) 2021-11-11
EP4135323A1 (en) 2023-02-15
HRP20181975T1 (hr) 2019-01-25
US20190349583A1 (en) 2019-11-14
US11089302B2 (en) 2021-08-10
JP2018082463A (ja) 2018-05-24
CN103636210A (zh) 2014-03-12
AU2012274326A1 (en) 2014-02-06
PT3720127T (pt) 2024-09-23
US9497455B2 (en) 2016-11-15
JP2021005904A (ja) 2021-01-14
JP2023024631A (ja) 2023-02-16
AU2017204165B2 (en) 2018-01-04
LT3361725T (lt) 2020-07-10
EP3720127A1 (en) 2020-10-07
CN106604038B (zh) 2020-05-08
US20230370593A1 (en) 2023-11-16
PT4135322T (pt) 2024-09-17
AU2018202384A1 (en) 2018-04-26
EP2725797A1 (en) 2014-04-30
US10440362B2 (en) 2019-10-08
AU2019200704B2 (en) 2019-11-14
EP2725797A4 (en) 2015-06-10
JPWO2012176910A1 (ja) 2015-02-23
PL2725797T3 (pl) 2019-01-31
US20200404265A1 (en) 2020-12-24
JP2016201824A (ja) 2016-12-01
ES2699974T3 (es) 2019-02-13
EP2725797B1 (en) 2018-08-29
KR20170116229A (ko) 2017-10-18
DK3720127T3 (da) 2024-10-14
ES2788690T3 (es) 2020-10-22
PT4199513T (pt) 2024-09-05
KR101881869B1 (ko) 2018-07-26
JP2022017267A (ja) 2022-01-25
HUE049411T2 (hu) 2020-10-28
US10764580B2 (en) 2020-09-01
EP4199513A1 (en) 2023-06-21
AU2012274326B2 (en) 2017-03-23
DK3361725T3 (da) 2020-04-27
KR101931675B1 (ko) 2018-12-21
KR101826215B1 (ko) 2018-03-22
US10477209B2 (en) 2019-11-12
HUE041898T2 (hu) 2019-06-28
EP3361725B1 (en) 2020-01-29
US20180098067A1 (en) 2018-04-05
CN106851318B (zh) 2019-01-08
KR20140045978A (ko) 2014-04-17
PT3361725T (pt) 2020-05-06
CN103636210B (zh) 2016-12-07
EP3720127B1 (en) 2024-08-07
KR20180085827A (ko) 2018-07-27
US20190045187A1 (en) 2019-02-07
JP7200320B2 (ja) 2023-01-06
JP6272402B2 (ja) 2018-01-31
CN106604038A (zh) 2017-04-26
EP3361725A1 (en) 2018-08-15
AU2019200704A1 (en) 2019-02-21
JP6780046B2 (ja) 2020-11-04
US9866833B2 (en) 2018-01-09
JP6496802B2 (ja) 2019-04-10
US20170034511A1 (en) 2017-02-02
EP4135322B1 (en) 2024-08-07
PL3361725T3 (pl) 2020-07-13
JP6957715B2 (ja) 2021-11-02
US20180288414A1 (en) 2018-10-04
CN106851318A (zh) 2017-06-13
US10390012B2 (en) 2019-08-20
JP2019126077A (ja) 2019-07-25

Similar Documents

Publication Publication Date Title
JP6496802B2 (ja) 画像フィルタ装置、フィルタ方法および動画像復号装置
JP2013236358A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
WO2013046990A1 (ja) オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造
JP2013138395A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、および、データ構造
JP2013251827A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12802275

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013521650

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2840045

Country of ref document: CA

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20147001188

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14127889

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2012274326

Country of ref document: AU

Date of ref document: 20120622

Kind code of ref document: A