WO2017115482A1 - ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 - Google Patents

ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 Download PDF

Info

Publication number
WO2017115482A1
WO2017115482A1 PCT/JP2016/069861 JP2016069861W WO2017115482A1 WO 2017115482 A1 WO2017115482 A1 WO 2017115482A1 JP 2016069861 W JP2016069861 W JP 2016069861W WO 2017115482 A1 WO2017115482 A1 WO 2017115482A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
bitstream
bit stream
syntax
conversion
Prior art date
Application number
PCT/JP2016/069861
Other languages
English (en)
French (fr)
Inventor
圭 河村
内藤 整
Original Assignee
Kddi株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kddi株式会社 filed Critical Kddi株式会社
Priority to CN201680076379.1A priority Critical patent/CN108432251B/zh
Priority to EP16881462.2A priority patent/EP3399751B1/en
Publication of WO2017115482A1 publication Critical patent/WO2017115482A1/ja
Priority to US16/010,870 priority patent/US10757448B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Definitions

  • the present invention relates to a bit stream conversion device, a bit stream conversion method, a distribution system, a moving image encoding device, a moving image encoding method, and a computer-readable recording medium.
  • Non-Patent Document 1 A moving picture coding method using intra prediction (intraframe prediction) or inter prediction (interframe prediction), residual transform, and entropy coding has been proposed (see Non-Patent Document 1, for example).
  • an extension method of an encoding device / decoding device called a scalable encoding method has been proposed (see, for example, Non-Patent Document 1).
  • High-resolution video such as 4K video and 8K video has begun to circulate.
  • 4K video is distributed at 15 Mbps to 35 Mbps.
  • 8K video is assumed to be 90 Mbps to 110 Mbps as a broadcasting service.
  • Conventional HD video (2K video) has achieved practical quality at about 3 Mbps to 6 Mbps by HEVC (High Efficiency Video Coding).
  • Non-Patent Document 1 Assuming that these videos are stored for streaming, 4K / 8K video requires 10 times more capacity than 2K video. In particular, storing 4K video and 8K video separately requires storage costs, and therefore, the benefit of capacity reduction by the scalable coding technique described in Non-Patent Document 1 is great.
  • the configuration of the encoding device and the decoding device becomes a plurality of loops, and the processing amount increases.
  • the present invention has been made in view of these problems, and an object thereof is to provide a technique capable of suppressing an increase in processing amount in an encoding device or a decoding device while realizing scalability.
  • the bit stream conversion apparatus includes a syntax analysis unit that analyzes a syntax of a bit stream corresponding to moving image data in which a minimum unit size for decoding processing is defined and a syntax of an accompanying bit stream associated with the bit stream; , A high-level grammar conversion unit that converts a high-level grammar obtained as a result of the analysis by the syntax analysis unit into a new high-level grammar including a resolution lower than the resolution included in the high-level grammar, and information obtained as a result of the analysis by the syntax analysis unit A unit conversion unit that converts information associated with the smallest unit in the bitstream into information associated with the corresponding unit in the accompanying bitstream, and a new high-level grammar from the high-level grammar conversion unit. Combined with the converted information in the unit converter according to the syntax to generate a new bitstream Includes a syntax combining unit that, the.
  • This moving image encoding device converts and quantizes an error signal between an image and a predicted image in units of blocks for an encoding target image divided into a plurality of blocks, and generates a first level value.
  • a downsampling unit for generating a block.
  • the transform quantization unit transforms and quantizes the error signal of the block generated by the downsampling unit to generate a second level value.
  • the encoding unit entropy encodes the second level value generated by the transform quantization unit to generate an accompanying bit stream.
  • FIG. 2 It is a schematic diagram which shows the structure of the delivery system which concerns on embodiment. It is a block diagram which shows the function and structure of the moving image encoder of FIG. It is a schematic diagram which shows an example of the structure of a bit stream and an accompanying bit stream. It is a block diagram which shows the function and structure of BS conversion apparatus of FIG. It is a schematic diagram for demonstrating the conversion process in BS conversion apparatus of FIG. It is a block diagram which shows the function and structure of the moving image decoding apparatus of FIG. 2 is a flowchart showing a series of processes for generating a bitstream in the moving picture encoding apparatus of FIG. 1. 2 is a flowchart showing a series of processes for generating an accompanying bitstream in the moving picture encoding apparatus of FIG. 1.
  • H. Scalability in syntax is realized using the feature that various conversion sizes are defined in H.265 or ISO / IEC 23008-2 HEVC. Consider a case where the resolution is changed to 1/2, such as when converting from 8K to 4K. In order to be able to decode the converted bit stream by a HEVC compliant decoder, the bit stream is H.264. It is necessary to satisfy the constraints of H.265.
  • the CU (Coding Unit, coding unit) size, PU (Prediction Unit, prediction unit) size, and TU (Transform Unit, transform unit) size are each 8 (pixel, the same applies below) x 8 Restricted to 64 ⁇ 64, 4 ⁇ 4 to 32 ⁇ 32, and 4 ⁇ 4 to 32 ⁇ 32. Therefore, when the CU size is less than 16 ⁇ 16 (that is, 8 ⁇ 8), the bit stream when the image is reduced to a CU size of 8 ⁇ 8 is generated on the encoding side as an accompanying bit stream (accompaniing bitstream).
  • the PU size / TU size is less than 8 ⁇ 8 (that is, 4 ⁇ 4)
  • the image is reduced, and an associated bit stream when the PU size / TU size is set to 4 ⁇ 4 is generated on the encoding side. Is done.
  • the motion vector accuracy in the PU is set to 1 ⁇ 4.
  • the change in resolution is not limited to 1 ⁇ 2, and may generally be 2 ( ⁇ n) (n is a natural number).
  • the accompanying bitstream is referred to as such as being attached to the bitstream, but may be referred to as an auxiliary bitstream (complementary bitstream) or an auxiliary bitstream as an auxiliary to the bitstream. It may be referred to as an additional bitstream (additional bitstream).
  • FIG. 1 is a schematic diagram illustrating a configuration of a distribution system 100 according to an embodiment.
  • the distribution system 100 is a system used in a video distribution service that distributes high-resolution video such as 4K video and 8K video.
  • the video distribution service may be, for example, VOD (Video On Demand).
  • the distribution system 100 is connected to a moving image decoding apparatus 102 such as a set top box or a personal computer installed at a user site via a network 106 such as the Internet.
  • the moving picture decoding apparatus 102 is connected to a display apparatus 104 such as a television receiver or a monitor.
  • the moving image decoding apparatus 102 is a decoder conforming to HEVC.
  • the distribution system in the video distribution service is an example, and that the technical idea according to the present embodiment can be applied to any system or service including encoding or decoding of moving images. It is clear to the contractor.
  • the distribution system 100 receives designation of moving image content desired to be viewed from the user via the network 106.
  • the distribution system 100 encodes the data of the specified moving image content to generate a bit stream.
  • the distribution system 100 transmits the generated bit stream to the video decoding device 102 of the requesting user via the network 106.
  • the moving picture decoding apparatus 102 decodes the received bit stream to generate moving picture data, and transmits it to the display apparatus 104.
  • the display device 104 processes the received moving image data and outputs designated moving image content.
  • the distribution system 100 includes a moving image DB (database) 108, a moving image encoding device 110, a moving image storage server 101, a BS (bitstream) conversion device 112, a selection unit 114, an output control device 116, Is provided.
  • the moving image DB 108 holds high-resolution moving image data such as 4K video and 8K video.
  • the moving image encoding device 110 acquires moving image data corresponding to the specified moving image content from the moving image DB 108, encodes the acquired moving image data, and generates a bit stream BS and an accompanying bit stream ABS associated therewith. To do.
  • the bit stream BS is equivalent to a bit stream obtained by encoding the obtained moving image data with an encoder compliant with the conventional HEVC.
  • the bit stream BS can be decoded by a decoder compliant with HEVC such as the video decoding device 102.
  • the accompanying bit stream ABS corresponds to data obtained by down-sampling a part of the acquired moving image data. Therefore, decoding by the moving picture decoding apparatus 102 with only the accompanying bitstream ABS is not possible.
  • the moving image accumulation server 101 accumulates the bit stream BS and the accompanying bit stream ABS generated by the moving image encoding device 110.
  • the BS converter 112 converts the bit stream BS constituting the high-resolution video and the accompanying bit stream ABS accompanying it into a new bit stream NBS of the low-resolution video.
  • the BS conversion device 112 acquires the bit stream BS and the accompanying bit stream ABS stored in the moving image storage server 101.
  • the BS converter 112 processes the acquired bit stream BS and the accompanying bit stream ABS at a syntax level, and generates a new bit stream NBS corresponding to moving image data in which the resolution of the moving image data corresponding to the bit stream BS is reduced. Is generated. For example, when the bit stream BS corresponds to 8K moving image data, the new bit stream NBS corresponds to 4K moving image data.
  • the new bit stream NBS can be decoded by the moving picture decoding apparatus 102.
  • the resolution of moving image data acquired from the moving image DB 108 and input to the moving image encoding device 110 is 8K and the resolution of moving image data corresponding to the new bitstream NBS is 4K, that is, the resolution is 1 /.
  • the case of 2 will be described. Those skilled in the art who have touched this specification will readily understand that the configuration described in this embodiment can be extended to a case where the resolution is 2 (-n) times.
  • the selection unit 114 selects one of the new bit stream NBS generated by the BS converter 112 and the bit stream BS stored in the moving image storage server 101, and selects the selected bit stream via the network 106. To the moving picture decoding apparatus 102.
  • the output control device 116 controls the selection unit 114.
  • the user designates the resolution in consideration of the display capability of the display device 104 when designating the moving image content to be viewed.
  • the output control device 116 acquires the resolution specified via the network 106.
  • the output control device 116 controls the selection unit 114 so that the moving image data having the acquired resolution is output from the selection unit 114.
  • the output control device 116 causes the selection unit 114 to select the bit stream BS if the designated resolution is 8K, and to select a new bit stream NBS if the designated resolution is 4K.
  • the selection unit 114 selects a new bit stream NBS generated by the BS converter 112 when a request is received from the user to request a lower 4K resolution of 8K and 4K.
  • FIG. 2 is a block diagram showing the function and configuration of the moving picture coding apparatus 110 of FIG.
  • Each block shown here can be realized by hardware and other elements such as a computer CPU and a mechanical device, and software can be realized by a computer program or the like.
  • Draw functional blocks Therefore, those skilled in the art who have touched this specification will understand that these functional blocks can be realized in various forms by a combination of hardware and software.
  • the computer program for realizing the moving image encoding device 110 may be stored in a computer-readable recording medium or distributed via a network.
  • the video encoding device 110 includes a frame buffer 202, an in-loop filter 204, an inter prediction unit 206, an intra prediction unit 208, a transform / quantization unit 210, an entropy encoding unit 212, an inverse quantization / An inverse conversion unit 214, a downsampling unit 216, a subtraction unit 218, an addition unit 220, and a block division unit 222 are provided.
  • the block dividing unit 222 divides an image to be encoded, that is, a frame included in moving image data from the moving image DB 108 into a plurality of blocks.
  • the block sizes vary, and the plurality of blocks have a quadtree structure.
  • the division of the image into blocks in the block dividing unit 222 is based on the division of the image into blocks in HEVC. That is, the size of CTU (Coding Tree Unit), which is the largest processing size, is 64 ⁇ 64, and there are 32 ⁇ 32, 16 ⁇ 16, and 8 ⁇ 8 sizes obtained by repeatedly dividing this into four.
  • the block division unit 222 outputs the processing target block to the subtraction unit 218, the inter prediction unit 206, and the intra prediction unit 208.
  • CTU, CU, PU, and TU are units that are units of encoding processing in the moving image encoding device 110 and decoding processing in the moving image decoding device 102, and the minimum sizes thereof are 8 ⁇ 8, 8 ⁇ 8, It is specified as 4 ⁇ 4 and 4 ⁇ 4.
  • the image data of the previous frame is input from the frame buffer 202 to the inter prediction unit 206.
  • the inter prediction unit 206 outputs a prediction block of the processing target block based on inter-frame prediction based on the previous frame.
  • the intra prediction unit 208 receives image data of the already processed block of the same frame as the processing target frame from the addition unit 220.
  • the intra prediction unit 208 outputs a prediction block of the processing target block based on another block in the same frame as the processing target block. Either the output of the inter prediction unit 206 or the output of the intra prediction unit 208 is output to the subtraction unit 218 depending on whether inter-frame prediction or intra-frame prediction is applied to the processing target block.
  • the subtraction unit 218 generates an error (residual) signal between the image to be encoded and the intra predicted image or the inter predicted image in units of blocks.
  • the subtraction unit 218 outputs an error signal indicating an error between the processing target block and the prediction block output by the inter prediction unit 206 or the intra prediction unit 208.
  • the transform / quantization unit 210 transforms (for example, orthogonal transform) and quantizes the error signal in units of blocks, and generates a first level value.
  • the transform / quantization unit 210 outputs the generated first level value to the entropy coding unit 212 and the inverse quantization / inverse transform unit 214.
  • the entropy encoder 212 entropy-encodes the first level value and side information (not shown) generated by the transformer / quantizer 210 to generate a bitstream BS.
  • the side information is information necessary for reconstructing pixel values used in the decoding device, such as a prediction mode indicating whether intra prediction or inter prediction is used, a motion vector, a quantization parameter, a block size, and the like. Contains related information.
  • the inverse quantization / inverse transformation unit 214 performs processing reverse to the processing in the transformation / quantization unit 210 to generate an error signal.
  • the addition unit 220 adds the error signal output from the inverse quantization / inverse conversion unit 214 and the prediction block output from the inter prediction unit 206 or the intra prediction unit 208 to generate a processing target block, and generates an intra prediction unit. 208 and output to the in-loop filter 204.
  • the in-loop filter 204 generates a local decoded image corresponding to the frame and outputs it to the frame buffer 202. This locally decoded image is used for inter-frame prediction in the inter prediction unit 206.
  • the downsampling unit 216 generates a minimum-size conversion block having a resolution (that is, 4K) lower than the resolution (that is, 8K) of the encoding target image from the conversion block having a size larger than the minimum size.
  • the downsampling unit 216 acquires an intra / inter prediction error signal output from the subtraction unit 218 in units of transform blocks.
  • the downsampling unit 216 identifies the size of the transform block of the acquired intra / inter prediction error signal. When the specified size is larger than the minimum size (4 ⁇ 4), the downsampling unit 216 reduces the transform block to the minimum size, and outputs the transform block that has been reduced to the minimum size.
  • the downsampling unit 216 outputs a transform block obtained by reducing the transform block to 4 ⁇ 4 only when the specified size is 8 ⁇ 8 and the transform block is divided into 4 ⁇ 4.
  • the downsampling unit 216 may collect four 4 ⁇ 4 transform blocks generated by quadtree partitioning of the 8 ⁇ 8 transform block and reconstruct an 8 ⁇ 8 block.
  • the downsampling unit 216 may reduce the reconstructed 8 ⁇ 8 block to 4 ⁇ 4.
  • the 4 ⁇ 4 transform block output from the downsampling unit 216 is equivalent to the transform block of the minimum size when the resolution of the encoding target image is reduced to 4K.
  • the transform / quantization unit 210 obtains a transform block of the minimum size generated by the downsampling unit 216, transforms and quantizes the obtained transform block, and generates a second level value.
  • the entropy encoding unit 212 entropy encodes the second level value generated by the transform / quantization unit 210 to generate an associated bitstream ABS. Further, the entropy encoding unit 212 receives the level value and the intra prediction mode (not shown), and outputs the bit stream BS or the accompanying bit stream ABS. In this way, the reduced 4 ⁇ 4 block is also encoded.
  • the bit stream BS corresponds to an image to be encoded having a resolution of 8K
  • the accompanying bit stream ABS accompanying the bit stream BS is a minimum size of a 4K image in which the resolution of the image to be encoded is halved.
  • FIG. 3 is a schematic diagram showing an example of the structure of the bit stream BS and the accompanying bit stream ABS.
  • the accompanying bitstream ABS is attached to the bitstream BS.
  • the accompanying bitstream ABS may have a header 302 for identifying the accompanying bitstream ABS.
  • the video encoding apparatus 110 may output the bit stream BS and the accompanying bit stream ABS together as one bit stream.
  • the bitstream BS is information other than the video coding layer (video coding layer) (for example, VUI (Video Usability Information), SPS (Sequence Parameter Set), PPS (Picture Parameter Set), etc.) and is called a high-level grammar. ), Slice header, CU information, PU information, and TU information. The slice header shall be included in the high level grammar. Information regarding block division and intra prediction modes is stored in the CU information. Information regarding motion vectors is stored in the PU information. A level value is stored in the TU information.
  • the accompanying bitstream ABS has the same configuration as the bitstream BS.
  • FIG. 4 is a block diagram showing the function and configuration of the BS converter 112 of FIG.
  • Each block shown here can be realized by hardware and other elements such as a computer CPU and a mechanical device, and software can be realized by a computer program or the like.
  • Draw functional blocks Therefore, those skilled in the art who have touched this specification will understand that these functional blocks can be realized in various forms by a combination of hardware and software.
  • the computer program that implements the BS conversion device 112 may be stored in a computer-readable recording medium or distributed via a network.
  • the BS conversion device 112 includes a syntax analysis unit (Parser) 402, a unit conversion unit 404, a high-level grammar conversion unit (High Level Syntax Converter) 406, and a syntax synthesis unit (Synthesis) 408.
  • the syntax analysis unit 402 analyzes the syntax of the bitstream BS and the syntax of the accompanying bitstream ABS stored in the moving image storage server 101.
  • the syntax analysis unit 402 includes a BS analysis unit 410 and an ABS analysis unit 412.
  • the BS analysis unit 410 acquires the bit stream BS, analyzes the syntax of the bit stream BS, and decomposes the bit stream BS into high-level grammar, CU information, PU information, and TU information.
  • the BS analysis unit 410 outputs the high-level grammar, CU information, PU information, and TU information obtained as a result of the analysis to the high-level grammar conversion unit 406, CU conversion unit 414, PU conversion unit 416, and TU conversion unit 418, respectively.
  • the ABS analysis unit 412 acquires the accompanying bitstream ABS and analyzes the syntax of the accompanying bitstream ABS.
  • the ABS analysis unit 412 outputs the CU information, PU information, and TU information obtained as a result of the analysis to the CU conversion unit 414, the PU conversion unit 416, and the TU conversion unit 418, respectively.
  • the high-level grammar conversion unit 406 acquires the high-level grammar output from the BS analysis unit 410, and converts the acquired high-level grammar into a new high-level grammar including a resolution lower than the resolution included in the high-level grammar.
  • the high-level grammar conversion unit 406 includes the resolution (that is, 4K) obtained by dividing the resolution (that is, 8K) included in the acquired high-level grammar by 2 in the new high-level grammar. In this way, the high-level grammar conversion unit 406 changes the resolution of the high-level grammar.
  • the unit conversion unit 404 includes a CU conversion unit 414, a PU conversion unit 416, and a TU conversion unit 418.
  • the CU conversion unit 414 acquires CU information in the bitstream BS from the BS analysis unit 410.
  • the CU conversion unit 414 acquires CU information in the accompanying bitstream ABS from the ABS analysis unit 412.
  • the CU conversion unit 414 converts the CU information associated with the CU having the minimum size (8 ⁇ 8) among the CU information in the acquired bitstream BS to the corresponding minimum size CU in the acquired associated bitstream ABS. Is converted into CU information associated with the.
  • the CU conversion unit 414 discards the CU information derived from the bit stream BS and outputs CU information derived from the accompanying bit stream ABS instead.
  • the CU conversion unit 414 outputs the CU information derived from the bit stream BS as it is.
  • the PU conversion unit 416 acquires PU information in the bitstream BS from the BS analysis unit 410.
  • the PU conversion unit 416 acquires PU information in the accompanying bitstream ABS from the ABS analysis unit 412.
  • the PU conversion unit 416 converts the PU information associated with the PU of the minimum size (4 ⁇ 4) among the PU information in the acquired bitstream BS to the corresponding minimum size PU in the acquired associated bitstream ABS. Convert to PU information associated with. For example, the PU conversion unit 416 discards the PU information derived from the bit stream BS when the block size is the minimum PU size, and outputs PU information derived from the accompanying bit stream ABS instead.
  • the PU conversion unit 416 converts the accuracy (or size) of a motion vector associated with a PU having a size larger than the minimum size in the bitstream BS to 1/2, thereby converting the motion vector into accuracy corresponding to 4K. At this time, the PU conversion unit 416 reconstructs a motion vector having a precision of 1 ⁇ 2, encodes it again, and outputs PU information.
  • the TU conversion unit 418 acquires TU information in the bitstream BS from the BS analysis unit 410.
  • the TU converter 418 acquires TU information in the accompanying bitstream ABS from the ABS analyzer 412.
  • the TU conversion unit 418 converts the TU information associated with the TU having the minimum size (4 ⁇ 4) among the TU information in the acquired bitstream BS into the corresponding minimum size TU in the acquired associated bitstream ABS.
  • the TU conversion unit 418 extracts a low frequency component from a set of level values associated with a TU having a block size that is not the minimum TU size, that is, larger than the minimum TU size. Create a set.
  • the TU conversion unit 418 reconstructs the level value matrix to change the block size, extracts only the level values constituting the low frequency component, and outputs the TU information. For example, the TU conversion unit 418 reconstructs the level value matrix to halve the block size, extracts half of the low frequency side of each row and column, sets the number of level values to 1/4, and sets the TU information Is output.
  • the syntax synthesis unit 408 uses the new high-level grammar from the high-level grammar conversion unit 406 and the CU information, PU information, and TU information after conversion in each of the CU conversion unit 414, the PU conversion unit 416, and the TU conversion unit 418. Accordingly, a new bit stream NBS is generated by combining.
  • FIG. 5 is a schematic diagram for explaining the conversion process in the BS converter 112 of FIG.
  • the 16 ⁇ 16 portion of the 8K image is divided into 8 ⁇ 8 TU1, TU2, and TU3 and 4 ⁇ 4 TU4, TU5, TU6, and TU7.
  • the level value associated with each of these TU1 to TU7 is encoded and stored in the TU information of the bitstream BS.
  • 4 ⁇ 4 TU8 is generated by applying the downsampling according to the present embodiment to the 16 ⁇ 16 portion.
  • TU4, TU5, TU6, and TU7 collectively correspond to TU8.
  • the level value associated with TU8 is encoded and stored in the TU information of the accompanying bitstream ABS.
  • TU conversion unit 418 For TU1 having a size (8 ⁇ 8) larger than the minimum TU size (4 ⁇ 4), the low-frequency component of TU1 is extracted, and 4 ⁇ 4 TU9 is generated. Similarly, TU conversion unit 418 generates TU2 to TU10 and TU3 to TU11. The TU4, TU5, TU6, and TU7 having the minimum TU size (4 ⁇ 4) are discarded by the TU conversion unit 418 and replaced with TU8 derived from the accompanying bitstream ABS. The level values associated with each of these TU9, TU10, TU11, and TU8 are encoded and stored in the TU information of the new bitstream NBS.
  • FIG. 6 is a block diagram showing the function and configuration of the moving picture decoding apparatus 102 of FIG.
  • Each block shown here can be realized by hardware and other elements such as a computer CPU and a mechanical device, and software can be realized by a computer program or the like.
  • Draw functional blocks Therefore, those skilled in the art who have touched this specification will understand that these functional blocks can be realized in various forms by a combination of hardware and software.
  • the video decoding apparatus 102 includes an entropy decoding unit 602, an inverse quantization / inverse transform unit 604, an addition unit 606, an inter prediction unit 608, an intra prediction unit 610, a frame buffer 612, and an in-loop filter 614. .
  • the moving picture decoding apparatus 102 obtains output moving picture data from the bit stream BS or the new bit stream NBS by a procedure reverse to the procedure performed by the moving picture encoding apparatus 110.
  • the entropy decoding unit 602 receives a bit stream BS or a new bit stream NBS from the distribution system 100 via the network 106.
  • the entropy decoding unit 602 performs entropy decoding on the received bit stream, and extracts a level value and side information. Note that the process of obtaining side information and level values from the bitstream is referred to as a parse process. Reconstructing the pixel value using the side information and the level value obtained in this way is called a decoding process.
  • the inverse quantization / inverse transform unit 604 generates an error signal by inverse quantization and inverse transform of the level value in units of blocks.
  • the adder 606 determines whether the block corresponding to the error signal generated by the inverse quantization / inverse transform unit 604 is intra-predicted or inter-predicted, depending on whether the block is intra-predicted or inter-predicted.
  • the predicted image of the block output by any one of the prediction units 610 and the error signal of the block are added to reproduce the block.
  • the adding unit 606 outputs the reproduced block to the intra prediction unit 610 and the in-loop filter 614.
  • the intra prediction unit 610 performs intra-frame prediction using the reproduced block to generate an intra prediction image.
  • the in-loop filter 614 is a deblock filter, for example.
  • the in-loop filter 614 receives all the blocks of one frame, the in-loop filter 614 generates a local decoded image corresponding to the frame and outputs it to the frame buffer 612. This locally decoded image is used for inter-frame prediction in the inter prediction unit 608 and simultaneously output to the display device 104 as output moving image data.
  • FIG. 7 is a flowchart showing a series of processes for generating the bitstream BS in the moving picture encoding apparatus 110 of FIG.
  • the moving image encoding device 110 acquires an image to be encoded (S702).
  • the moving image encoding apparatus 110 divides the acquired encoding target image into a plurality of blocks (S704).
  • the moving image encoding device 110 calculates the difference between the image to be encoded and the predicted image in units of divided blocks, and generates an error signal (S706).
  • the moving image encoding device 110 performs orthogonal transform on the error signal for each block and then quantizes the block based on a predetermined quantization parameter (S708).
  • the moving image encoding apparatus 110 entropy-encodes the first level value obtained as a result of quantization, and generates a bitstream BS (S710).
  • the video encoding device 110 outputs the generated bit stream BS (S712).
  • FIG. 8 is a flowchart showing a series of processes for generating the accompanying bitstream ABS in the moving picture encoding apparatus 110 of FIG.
  • the video encoding device 110 acquires a block having a size larger than the minimum size (S802).
  • the moving image encoding apparatus 110 downsamples the acquired block, and generates a block having a minimum size having a resolution that is 1 ⁇ 2 of the resolution of the image to be encoded (S804).
  • the moving image coding apparatus 110 performs orthogonal transformation on the error signal for the generated minimum-size block, and quantizes the block based on a predetermined quantization parameter (S806).
  • the moving image encoding device 110 entropy-encodes the second level value obtained as a result of the quantization, and generates an associated bitstream ABS (S808).
  • the moving picture coding apparatus 110 attaches the generated accompanying bitstream ABS to the bitstream BS and outputs it (S810).
  • FIG. 9 is a flowchart showing a series of processes in the BS converter 112 of FIG.
  • the BS converter 112 acquires the bit stream BS and the accompanying bit stream ABS from the moving image storage server 101 (S902).
  • the BS converter 112 analyzes the acquired syntax of the bitstream BS and the syntax of the accompanying bitstream ABS (S904).
  • the BS converter 112 converts the high-level grammar extracted from the bitstream BS by the syntax analysis so that the resolution is 1 ⁇ 2, and obtains a new high-level grammar (S906).
  • the BS converter 112 transmits the CU information, PU information, and TU information associated with the minimum size CU, PU, and TU in the bitstream BS to the corresponding minimum size CU, PU, and TU in the associated bitstream ABS. Replacement is performed with the associated CU information, PU information, and TU information (S908).
  • the BS converter 112 combines the new high-level grammar with the replaced CU information, PU information, and TU information according to the syntax to generate a new bitstream NBS (S910).
  • the encoding side can generate a bit stream of a low resolution video by adding an accompanying bit stream to the high resolution video. This eliminates the need for separate encoding of low-resolution video. Since it is not necessary to prepare a device or a circuit for changing the resolution of the received video on the decoding side, the device configuration can be simplified.
  • the comparative example relates to a scalable coding scheme (see, for example, Non-Patent Document 1). This is a technique for encoding / decoding a basic video called a base layer and an extended video obtained by adding an extended portion called an enhancement layer to the basic video to expand various elements. Various elements include frame rate, resolution, bit depth, and color gamut.
  • the comparative example particularly relates to spatial scalability, which is scalability of resolution.
  • FIG. 10 is a block diagram showing the function and configuration of the scalable encoding device 130 according to the comparative example.
  • the downsampling unit 132 receives an input image and outputs an image with a resolution reduced to 1 ⁇ 2.
  • the 1/2 resolution video is encoded in the same manner as a normal encoding device.
  • the inter-layer reference image generation unit 134 receives the decoded image and outputs the image that has been doubled to the frame buffer 136.
  • the base layer image can be used as a reference image in the enhancement layer encoding, and the encoding efficiency is improved as compared with the case of encoding each individually.
  • FIG. 11 is a block diagram showing the function and configuration of the scalable decoding device 140 according to the comparative example.
  • the scalable decoding device 140 When decoding only the base layer, it is the same as the existing decoding device.
  • an inter-layer prediction image is added to the reference image buffer 142 of the enhancement layer.
  • the scalable encoding / decoding method according to the comparative example requires a plurality of encoding loops / decoding loops (for example, for low resolution and for high resolution). is there. Therefore, the memory bandwidth and processing amount required for signal processing increase in proportion to the total number of pixels in all layers.
  • a bit stream of a low resolution video for example, 4K video
  • a high resolution video for example, 8K video
  • the resolution is changed at the syntax level, so that the processing amount can be reduced as compared with the case where the resolution is changed at the signal level.
  • examples of the database are a hard disk and a semiconductor memory. Further, based on the description of the present specification, each unit is configured by a CPU (not shown), a module of an installed application program, a module of a system program, a semiconductor memory that temporarily stores the content of data read from the hard disk, or the like. It will be appreciated by those skilled in the art who have touched this specification that this can be achieved.
  • the distribution system 100 on the encoding side includes the BS conversion device 112 .
  • the present invention is not limited to this, and the BS conversion device may be provided on the decoding side.
  • the BS converter provided at the user site may receive an 8K video bitstream and an accompanying bitstream via the network 106 and generate a 4K video bitstream by syntax processing.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビットストリーム変換装置は、復号処理に係るユニットの最小サイズが規定されている動画像データに対応するビットストリームの構文と前記ビットストリームに付随する付随ビットストリームの構文とを解析する構文解析部と、構文解析部による解析の結果得られる高位文法を、該高位文法に含まれる解像度よりも低い解像度を含む新たな高位文法に変換する高位文法変換部と、構文解析部による解析の結果得られる情報であってビットストリーム中の最小サイズのユニットに関連付けられた情報を、付随ビットストリーム中の対応するユニットに関連付けられた情報に変換するユニット変換部と、高位文法変換部からの新たな高位文法とユニット変換部における変換後の情報とを構文にしたがい合成し、新たなビットストリームを生成する構文合成部と、を備える。

Description

ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
 本発明は、ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体に関する。
 イントラ予測(フレーム内予測)またはインター予測(フレーム間予測)と、残差変換と、エントロピー符号化とを用いた動画像符号化方式が提案されている(例えば、非特許文献1参照)。また、スケーラブル符号化方式とよばれる、符号化装置・復号装置の拡張方式が提案されている(例えば、非特許文献1参照)。
 近年、4K映像や8K映像といった高解像度の映像が流通し始めている。映像配信サービスで4K映像は15Mbps~35Mbpsで配信されている。一方、8K映像は放送サービスとして90Mbps~110Mbpsが想定されている。これまでのHD映像(2K映像)については、HEVC(High Efficiency Video Coding)により3Mbps~6Mbps程度で実用的な品質が実現できている。
 これらの映像をストリーミングするために蓄積することを想定すると、4K/8K映像は2K映像の10倍以上の容量が必要となる。特に、4K映像と8K映像とを個別に蓄積するのはストレージコストがかかるため、非特許文献1に記載されるようなスケーラブル符号化技術による容量削減の恩恵は大きい。
ITU-T H.265 High Efficiency Video Coding.
 しかしながら、従来のHEVCのスケーラブル符号化・復号技術では、符号化装置や復号装置の構成が複数ループとなり、処理量が多くなる。
 本発明はこうした課題に鑑みてなされたものであり、その目的は、スケーラビリティを実現しつつ符号化装置または復号装置における処理量の増加を抑えることができる技術の提供にある。
 本発明のある態様は、ビットストリーム変換装置に関する。このビットストリーム変換装置は、復号処理に係るユニットの最小サイズが規定されている動画像データに対応するビットストリームの構文と前記ビットストリームに付随する付随ビットストリームの構文とを解析する構文解析部と、構文解析部による解析の結果得られる高位文法を、該高位文法に含まれる解像度よりも低い解像度を含む新たな高位文法に変換する高位文法変換部と、構文解析部による解析の結果得られる情報であってビットストリーム中の最小サイズのユニットに関連付けられた情報を、付随ビットストリーム中の対応するユニットに関連付けられた情報に変換するユニット変換部と、高位文法変換部からの新たな高位文法とユニット変換部における変換後の情報とを構文にしたがい合成し、新たなビットストリームを生成する構文合成部と、を備える。
 本発明の別の態様は、動画像符号化装置である。この動画像符号化装置は、複数のブロックに分割された符号化対象の画像について、ブロック単位で画像と予測画像との誤差信号を変換および量子化し、第1レベル値を生成する変換量子化部と、変換量子化部によって生成された第1レベル値をエントロピー符号化してビットストリームを生成する符号化部と、最小サイズよりも大きなサイズのブロックから、画像の解像度よりも低い解像度の最小サイズのブロックを生成するダウンサンプリング部と、を備える。変換量子化部はダウンサンプリング部によって生成されたブロックの誤差信号を変換および量子化して第2レベル値を生成する。符号化部は、変換量子化部によって生成された第2レベル値をエントロピー符号化して付随ビットストリームを生成する。
 なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。
 本発明によれば、スケーラビリティを実現しつつ符号化装置または復号装置における処理量の増加を抑えることができる。本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。
実施の形態に係る配信システムの構成を示す模式図である。 図1の動画像符号化装置の機能および構成を示すブロック図である。 ビットストリームおよび付随ビットストリームの構造の一例を示す模式図である。 図1のBS変換装置の機能および構成を示すブロック図である。 図1のBS変換装置における変換処理を説明するための模式図である。 図1の動画像復号装置の機能および構成を示すブロック図である。 図1の動画像符号化装置においてビットストリームを生成する一連の処理を示すフローチャートである。 図1の動画像符号化装置において付随ビットストリームを生成する一連の処理を示すフローチャートである。 図1のBS変換装置における一連の処理を示すフローチャートである。 比較例に係るスケーラブル符号化装置の機能および構成を示すブロック図である。 比較例に係るスケーラブル復号装置の機能および構成を示すブロック図である。
 以下、各図面に示される同一または同等の構成要素、部材、処理、信号には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。
 実施の形態では、H.265またはISO/IEC 23008-2 HEVCにおいて様々な変換サイズが規定されているという特徴を用いて、シンタックスにおけるスケーラビリティが実現される。8Kから4Kに変換する場合などの解像度を1/2に変更する場合を考える。変換されたビットストリームをHEVC準拠のデコーダで復号可能とするため、該ビットストリームはH.265の制約を満たす必要がある。具体的には、HEVCではCU(Coding Unit、コーディングユニット)サイズ、PU(Prediction Unit、プレディクションユニット)サイズ、TU(Transform Unit、トランスフォームユニット)サイズはそれぞれ、8(画素、以下同様)×8~64×64、4×4~32×32、4×4~32×32に制約されている。そこで、CUサイズが16×16未満(すなわち8×8)の時には、画像を縮小してCUサイズを8×8とした時のビットストリームが付随ビットストリーム(accompanying bitstream)として符号化側で生成される。同様に、PUサイズ/TUサイズが8×8未満(すなわち4×4)の時には、画像を縮小して、PUサイズ/TUサイズを4×4とした時の付随ビットストリームが符号化側で生成される。
 一方、CUサイズが16×16以上、またはPUサイズが8×8以上の時には特に変更は加えられず、TUサイズが8×8以上の時には、低周波成分のレベル値のみが再符号化される。また、PUにおける動きベクトル精度は1/4に揃えられる。
 その結果、8Kなどの高解像度映像に付随ビットストリームを追加する(オーバヘッド)ことで、ビットストリームのみからHEVC準拠のデコーダで復号可能な低解像度映像のビットストリームを生成することができる。
 なお、解像度の変更は1/2に限定されず、一般に2(-n)であればよい(nは自然数)。また、付随ビットストリームはビットストリームに付随するものとしてそのように称されているが、ビットストリームを補助するものとして補助ビットストリーム(supplementary bitstream、complementary bitstream)と称されてもよく、またはビットストリームに追加されるものとして追加ビットストリーム(additional bitstream)と称されてもよい。
 図1は、実施の形態に係る配信システム100の構成を示す模式図である。配信システム100は、4K映像や8K映像などの高解像度の映像を配信する映像配信サービスにおいて使用されるシステムである。映像配信サービスは例えばVOD(Video On Demand)であってもよい。配信システム100はインターネットなどのネットワーク106を介して、ユーザサイトに設置されているセットトップボックスやパーソナルコンピュータなどの動画像復号装置102と接続される。動画像復号装置102は、テレビ受像機やモニタなどの表示装置104と接続される。動画像復号装置102は、HEVCに準拠したデコーダである。
 なお、映像配信サービスにおける配信システムは一例であり、動画像の符号化または復号を含む任意のシステムやサービスに、本実施の形態に係る技術的思想を適用できることは、本明細書に触れた当業者には明らかである。
 配信システム100は、ネットワーク106を介してユーザから観たい動画コンテンツの指定を受ける。配信システム100は、指定された動画コンテンツのデータを符号化してビットストリームを生成する。配信システム100は、生成されたビットストリームをネットワーク106を介して要求元のユーザの動画像復号装置102に送信する。動画像復号装置102は受信したビットストリームを復号して動画像データを生成し、表示装置104に送信する。表示装置104は、受信した動画像データを処理し、指定された動画コンテンツを出力する。
 配信システム100は、動画像DB(データベース)108と、動画像符号化装置110と、動画像蓄積サーバ101と、BS(ビットストリーム)変換装置112と、選択部114と、出力制御装置116と、を備える。動画像DB108は、4K映像や8K映像などの高解像度の動画像のデータを保持する。動画像符号化装置110は、指定された動画コンテンツに対応する動画像データを動画像DB108から取得し、取得された動画像データを符号化し、ビットストリームBSおよびそれに付随する付随ビットストリームABSを生成する。ビットストリームBSは、取得された動画像データを従来のHEVCに準拠したエンコーダで符号化して得られるビットストリームと同等である。したがって、ビットストリームBSは動画像復号装置102などのHEVCに準拠したデコーダにより復号可能である。一方、付随ビットストリームABSは取得された動画像データの一部をダウンサンプリングして得られるデータに対応する。したがって、付随ビットストリームABSのみの動画像復号装置102による復号は可能でない。動画像蓄積サーバ101は、動画像符号化装置110によって生成されたビットストリームBSと付随ビットストリームABSとを蓄積する。
 BS変換装置112は、高解像度映像を構成するビットストリームBSとそれに付随する付随ビットストリームABSとを、低解像度映像の新たなビットストリームNBSへと変換する。BS変換装置112は、動画像蓄積サーバ101に蓄積されているビットストリームBSおよび付随ビットストリームABSを取得する。BS変換装置112は、取得されたビットストリームBSおよび付随ビットストリームABSをシンタックスレベルで処理し、ビットストリームBSに対応する動画像データの解像度を低くした動画像データに対応する新たなビットストリームNBSを生成する。例えば、ビットストリームBSが8Kの動画像データに対応するとき、新たなビットストリームNBSは4Kの動画像データに対応する。新たなビットストリームNBSは動画像復号装置102により復号可能である。
 以下、動画像DB108から取得され動画像符号化装置110に入力される動画像データの解像度が8Kであり新たなビットストリームNBSに対応する動画像データの解像度が4Kである場合すなわち解像度を1/2にする場合について説明する。本明細書に触れた当業者には、本実施の形態で説明される構成の、解像度を2(-n)倍にする場合への拡張は自明である。
 選択部114は、BS変換装置112によって生成された新たなビットストリームNBSおよび動画像蓄積サーバ101に蓄積されているビットストリームBSのうちからひとつを選択し、選択されたビットストリームをネットワーク106を介して動画像復号装置102に送信する。
 出力制御装置116は選択部114を制御する。ユーザは、観たい動画コンテンツを指定する際、表示装置104の表示能力等を考慮し、解像度を指定する。出力制御装置116はネットワーク106を介して指定された解像度を取得する。出力制御装置116は、取得された解像度の動画像データが選択部114から出力されるよう、選択部114を制御する。例えば、出力制御装置116は指定された解像度が8Kであれば選択部114にビットストリームBSを選択させ、指定された解像度が4Kであれば新たなビットストリームNBSを選択させる。その結果、選択部114は、8K、4Kのうち低い方の4Kの解像度を所望するというリクエストがユーザからあったときには、BS変換装置112により生成される新たなビットストリームNBSを選択する。
 図2は、図1の動画像符号化装置110の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解される。動画像符号化装置110を実現するコンピュータプログラムは、コンピュータが読み取り可能な記録媒体に記憶されて、又は、ネットワーク経由で配布が可能なものであってもよい。
 動画像符号化装置110は、フレームバッファ202と、インループフィルタ204と、インター予測部206と、イントラ予測部208と、変換・量子化部210と、エントロピー符号化部212と、逆量子化・逆変換部214と、ダウンサンプリング部216と、減算部218と、加算部220と、ブロック分割部222と、を備える。
 ブロック分割部222は、動画像DB108からの動画像データに含まれる符号化対象の画像すなわちフレームを複数のブロックに分割する。ブロックのサイズは様々であり、複数のブロックは四分木構造を有する。ブロック分割部222における画像のブロックへの分割はHEVCにおける画像のブロックへの分割に準じる。すなわち、もっとも大きな処理サイズであるCTU(Coding Tree Unit)のサイズは64×64であり、これを繰り返し四分割した32×32、16×16、8×8のサイズが存在している。ブロック分割部222は処理対象ブロックを減算部218とインター予測部206とイントラ予測部208とに出力する。
 なお、CTU、CU、PU、TUは動画像符号化装置110における符号化処理および動画像復号装置102における復号処理の単位となるユニットであり、それぞれの最小サイズは8×8、8×8、4×4、4×4と規定されている。
 インター予測部206には、フレームバッファ202から以前のフレームの画像データが入力される。インター予測部206は、以前のフレームに基づき、フレーム間予測による処理対象ブロックの予測ブロックを出力する。イントラ予測部208には、処理対象のフレームと同じフレームの既に処理したブロックの画像データが加算部220から入力される。イントラ予測部208は、処理対象ブロックと同じフレームの他のブロックに基づき、処理対象ブロックの予測ブロックを出力する。処理対象ブロックにフレーム間予測を適用するか、フレーム内予測を適用するかに応じて、インター予測部206の出力とイントラ予測部208の出力とのいずれかが減算部218に出力される。
 減算部218は、ブロック単位で符号化対象の画像とイントラ予測画像またはインター予測画像との誤差(残差)信号を生成する。減算部218は、処理対象ブロックと、インター予測部206またはイントラ予測部208が出力した予測ブロックとの誤差を示す誤差信号を出力する。変換・量子化部210は、ブロック単位で誤差信号を変換(例えば、直交変換)および量子化し、第1レベル値を生成する。変換・量子化部210は、生成された第1レベル値をエントロピー符号化部212および逆量子化・逆変換部214に出力する。エントロピー符号化部212は、変換・量子化部210によって生成された第1レベル値とサイド情報(不図示)とをエントロピー符号化して、ビットストリームBSを生成する。なお、サイド情報は、復号装置において使用する画素値の再構成に必要な情報であり、イントラ予測またはインター予測の何れを使用したかを示す予測モード、動きベクトル、量子化パラメータ、ブロックサイズ等の関連情報を含む。
 逆量子化・逆変換部214は、変換・量子化部210における処理とは逆の処理を行って誤差信号を生成する。加算部220は、逆量子化・逆変換部214が出力する誤差信号と、インター予測部206またはイントラ予測部208が出力する予測ブロックと、を加算して処理対象ブロックを生成し、イントラ予測部208と、インループフィルタ204に出力する。インループフィルタ204は、当該フレームに対応する局所復号画像を生成してフレームバッファ202に出力する。この局所復号画像は、インター予測部206におけるフレーム間予測に使用される。
 ダウンサンプリング部216は、最小サイズよりも大きなサイズの変換ブロックから、符号化対象の画像の解像度(すなわち8K)よりも低い解像度(すなわち4K)の最小サイズの変換ブロックを生成する。ダウンサンプリング部216は、変換ブロック単位で減算部218から出力されるイントラ・インター予測誤差信号を取得する。ダウンサンプリング部216は、取得されたイントラ・インター予測誤差信号の変換ブロックのサイズを特定する。ダウンサンプリング部216は、特定されたサイズが最小サイズ(4×4)よりも大きい場合には変換ブロックを最小サイズまで縮小し、縮小され最小サイズとなった変換ブロックを出力する。例えばダウンサンプリング部216は、特定されたサイズが8×8であり、その変換ブロックが4×4に分割されているときにのみ、その変換ブロックを4×4に縮小した変換ブロックを出力する。あるいはまた、ダウンサンプリング部216は、8×8の変換ブロックの4分木分割により生成された4つの4×4の変換ブロックを集めて8×8のブロックを再構成してもよい。ダウンサンプリング部216は、再構成された8×8のブロックを4×4に縮小してもよい。ダウンサンプリング部216から出力される4×4の変換ブロックは、符号化対象の画像の解像度を4Kに落としたときの最小サイズの変換ブロックと同等である。
 変換・量子化部210は、ダウンサンプリング部216によって生成された最小サイズの変換ブロックを取得し、取得された変換ブロックを変換および量子化して第2レベル値を生成する。エントロピー符号化部212は、変換・量子化部210によって生成された第2レベル値をエントロピー符号化して付随ビットストリームABSを生成する。また、エントロピー符号化部212はレベル値とイントラ予測モード(不図示)を入力とし、ビットストリームBSまたは付随ビットストリームABSを出力する。このように、縮小された4×4のブロックについても符号化される。ビットストリームBSは解像度が8Kの符号化対象の画像に対応し、該ビットストリームBSに付随する付随ビットストリームABSは符号化対象の画像の解像度を1/2にした4Kの画像の、最小サイズのCU、PU、TUに関連する情報を含む。
 図3は、ビットストリームBSおよび付随ビットストリームABSの構造の一例を示す模式図である。付随ビットストリームABSはビットストリームBSに付随する。付随ビットストリームABSは、付随ビットストリームABSを識別するためのヘッダ302を有してもよい。動画像符号化装置110は、ビットストリームBSと付随ビットストリームABSとを合わせてひとつのビットストリームとして出力してもよい。
 ビットストリームBSは、映像符号化レイヤ(video coding layer)以外の情報(例えば、VUI(Video Usability Information)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)などであり、高位文法と称される)と、スライスヘッダと、CU情報と、PU情報と、TU情報と、を含む。スライスヘッダは高位文法に含まれるものとする。CU情報にはブロック分割およびイントラ予測モードに関する情報が格納されている。PU情報には動きベクトルに関する情報が格納されている。TU情報にはレベル値が格納されている。付随ビットストリームABSはビットストリームBSと同様の構成を有する。
 図4は、図1のBS変換装置112の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解される。BS変換装置112を実現するコンピュータプログラムは、コンピュータが読み取り可能な記録媒体に記憶されて、又は、ネットワーク経由で配布が可能なものであってもよい。
 BS変換装置112は、構文解析部(Parser)402と、ユニット変換部404と、高位文法変換部(High Level Syntax Converter)406と、構文合成部(Synthesis)408と、を備える。構文解析部402は、動画像蓄積サーバ101に蓄積されているビットストリームBSの構文と付随ビットストリームABSの構文とを解析する。構文解析部402は、BS解析部410とABS解析部412とを含む。BS解析部410はビットストリームBSを取得し、ビットストリームBSの構文を解析し、ビットストリームBSを高位文法、CU情報、PU情報、TU情報に分解する。BS解析部410は、解析の結果得られた高位文法、CU情報、PU情報、TU情報をそれぞれ高位文法変換部406、CU変換部414、PU変換部416、TU変換部418に出力する。ABS解析部412は、付随ビットストリームABSを取得し、付随ビットストリームABSの構文を解析する。ABS解析部412は、解析の結果得られたCU情報、PU情報、TU情報をそれぞれCU変換部414、PU変換部416、TU変換部418に出力する。
 高位文法変換部406は、BS解析部410から出力された高位文法を取得し、取得された高位文法を、該高位文法に含まれる解像度よりも低い解像度を含む新たな高位文法に変換する。例えば高位文法変換部406は、取得された高位文法に含まれる解像度(すなわち8K)を2で除して得られる解像度(すなわち4K)を、新たな高位文法に含める。このようにして、高位文法変換部406において高位文法の解像度が変更される。
 ユニット変換部404は、CU変換部414とPU変換部416とTU変換部418とを含む。CU変換部414は、BS解析部410からビットストリームBS中のCU情報を取得する。CU変換部414は、ABS解析部412から付随ビットストリームABS中のCU情報を取得する。CU変換部414は、取得されたビットストリームBS中のCU情報のうち最小サイズ(8×8)のCUに関連付けられたCU情報を、取得された付随ビットストリームABS中の対応する最小サイズのCUに関連付けられたCU情報に変換する。例えばCU変換部414は、ブロックサイズが最小CUサイズの時にはビットストリームBS由来のCU情報を破棄し、代わりに付随ビットストリームABS由来のCU情報を出力する。CU変換部414は、ブロックサイズが最小CUサイズでない場合にはビットストリームBS由来のCU情報をそのまま出力する。
 PU変換部416は、BS解析部410からビットストリームBS中のPU情報を取得する。PU変換部416は、ABS解析部412から付随ビットストリームABS中のPU情報を取得する。PU変換部416は、取得されたビットストリームBS中のPU情報のうち最小サイズ(4×4)のPUに関連付けられたPU情報を、取得された付随ビットストリームABS中の対応する最小サイズのPUに関連付けられたPU情報に変換する。例えばPU変換部416は、ブロックサイズが最小PUサイズの時にはビットストリームBS由来のPU情報を破棄し、代わりに付随ビットストリームABS由来のPU情報を出力する。PU変換部416は、ビットストリームBS中の最小サイズよりも大きなサイズのPUに関連付けられた動きベクトルの精度(または大きさ)を1/2にすることで、4Kに応じた精度に変換する。この際、PU変換部416は、精度が1/2の動きベクトルを再構築してから再び符号化して、PU情報を出力する。
 TU変換部418は、BS解析部410からビットストリームBS中のTU情報を取得する。TU変換部418は、ABS解析部412から付随ビットストリームABS中のTU情報を取得する。TU変換部418は、取得されたビットストリームBS中のTU情報のうち最小サイズ(4×4)のTUに関連付けられたTU情報を、取得された付随ビットストリームABS中の対応する最小サイズのTUに関連付けられたTU情報に変換する。例えばTU変換部418は、ブロックサイズが最小TUサイズの時にはビットストリームBS由来のTU情報を破棄し、代わりに付随ビットストリームABS由来のTU情報を出力する。
 TU変換部418は、ブロックサイズが最小TUサイズでない、すなわち最小TUサイズより大きなサイズのTUに関連付けられたレベル値の集合から低周波成分を抽出することにより、4Kの解像度に応じたレベル値の集合を生成する。TU変換部418は、ブロックサイズが最小TUサイズでない場合には、ブロックサイズを変更するためレベル値行列を再構成して低周波成分を構成するレベル値のみを抽出してTU情報を出力する。例えばTU変換部418は、ブロックサイズを半分にするためにレベル値行列を再構成して、行と列それぞれの低周波数側の半分を抽出し、レベル値の個数を1/4として、TU情報を出力する。
 構文合成部408は、高位文法変換部406からの新たな高位文法とCU変換部414、PU変換部416、TU変換部418のそれぞれにおける変換後のCU情報、PU情報、TU情報とを構文にしたがい合成し、新たなビットストリームNBSを生成する。
 図5は、図1のBS変換装置112における変換処理を説明するための模式図である。8K画像の16×16の部分は8×8のTU1、TU2、TU3と、4×4のTU4、TU5、TU6、TU7と、に分割されている。これらのTU1~TU7のそれぞれに関連付けられたレベル値は符号化され、ビットストリームBSのTU情報に格納される。また、本実施の形態に係るダウンサンプリングを上記16×16の部分に適用することにより、4×4のTU8が生成される。TU4、TU5、TU6、TU7はまとめてTU8に対応する。TU8に関連付けられたレベル値は符号化され、付随ビットストリームABSのTU情報に格納される。
 TU変換部418において、最小TUサイズ(4×4)よりも大きなサイズ(8×8)のTU1については、TU1の低周波成分が抽出され、4×4のTU9が生成される。同様に、TU変換部418においてTU2からTU10が、TU3からTU11が、それぞれ生成される。最小TUサイズ(4×4)のTU4、TU5、TU6、TU7はTU変換部418によって破棄され、付随ビットストリームABS由来のTU8に置き換えられる。これらのTU9、TU10、TU11、TU8のそれぞれに関連付けられたレベル値は符号化され、新たなビットストリームNBSのTU情報に格納される。
 図6は、図1の動画像復号装置102の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのCPUをはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解される。
 動画像復号装置102は、エントロピー復号部602と、逆量子化・逆変換部604と、加算部606と、インター予測部608と、イントラ予測部610と、フレームバッファ612と、インループフィルタ614と、を備える。動画像復号装置102は、動画像符号化装置110で行われる手順と逆の手順により、ビットストリームBSまたは新たなビットストリームNBSから出力動画像データを得る。
 エントロピー復号部602は、ネットワーク106を介して配信システム100からビットストリームBSまたは新たなビットストリームNBSを受信する。エントロピー復号部602は、受信したビットストリームをエントロピー復号し、レベル値とサイド情報とを取り出す。なお、ビットストリームからサイド情報およびレベル値を得る処理はパース(parse)処理と称される。このようにして得られたサイド情報およびレベル値を用いて画素値を再構成することは、復号処理と称される。
 逆量子化・逆変換部604は、ブロック単位でレベル値を逆量子化および逆変換して誤差信号を生成する。加算部606は、逆量子化・逆変換部604によって生成された誤差信号に対応するブロックがイントラ予測されたものであるかインター予測されたものであるかに応じて、インター予測部608またはイントラ予測部610のいずれか一方が出力する当該ブロックの予測画像と当該ブロックの誤差信号とを加算し、当該ブロックを再生する。加算部606は、再生されたブロックをイントラ予測部610とインループフィルタ614とに出力する。イントラ予測部610は再生されたブロックを使用してフレーム内予測を行いイントラ予測画像を生成する。インループフィルタ614は例えばデブロックフィルタである。インループフィルタ614は、1つのフレームの総てのブロックを受け取ると、当該フレームに対応する局所復号画像を生成してフレームバッファ612に出力する。この局所復号画像は、インター予測部608におけるフレーム間予測に使用されると同時に、出力動画像データとして表示装置104に出力される。
 以上の構成による動画像符号化装置110およびBS変換装置112の動作を説明する。
 図7は、図1の動画像符号化装置110においてビットストリームBSを生成する一連の処理を示すフローチャートである。動画像符号化装置110は、符号化対象の画像を取得する(S702)。動画像符号化装置110は、取得された符号化対象の画像を複数のブロックへ分割する(S704)。動画像符号化装置110は、分割されたブロック単位で、符号化対象の画像と予測画像との差分を演算し、誤差信号を生成する(S706)。動画像符号化装置110は、ブロックごとに誤差信号を直交変換した上で所定の量子化パラメータに基づき量子化する(S708)。動画像符号化装置110は、量子化の結果得られる第1レベル値をエントロピー符号化し、ビットストリームBSを生成する(S710)。動画像符号化装置110は、生成されたビットストリームBSを出力する(S712)。
 図8は、図1の動画像符号化装置110において付随ビットストリームABSを生成する一連の処理を示すフローチャートである。動画像符号化装置110は、最小サイズよりも大きなサイズのブロックを取得する(S802)。動画像符号化装置110は、取得されたブロックをダウンサンプリングし、符号化対象の画像の解像度の1/2の解像度の最小サイズのブロックを生成する(S804)。動画像符号化装置110は、生成された最小サイズのブロックについて誤差信号を直交変換した上で所定の量子化パラメータに基づき量子化する(S806)。動画像符号化装置110は、量子化の結果得られる第2レベル値をエントロピー符号化し、付随ビットストリームABSを生成する(S808)。動画像符号化装置110は、生成された付随ビットストリームABSをビットストリームBSに付随させて出力する(S810)。
 図9は、図1のBS変換装置112における一連の処理を示すフローチャートである。BS変換装置112は、動画像蓄積サーバ101からビットストリームBSおよび付随ビットストリームABSを取得する(S902)。BS変換装置112は、取得されたビットストリームBSの構文と、付随ビットストリームABSの構文と、を解析する(S904)。BS変換装置112は、構文解析によりビットストリームBSから抽出された高位文法を、解像度が1/2になるよう変換し、新たな高位文法を得る(S906)。BS変換装置112は、ビットストリームBS中の最小サイズのCU、PU、TUに関連付けられたCU情報、PU情報、TU情報を、付随ビットストリームABS中の対応する最小サイズのCU、PU、TUに関連付けられたCU情報、PU情報、TU情報で置換する(S908)。BS変換装置112は、新たな高位文法と置換後のCU情報、PU情報、TU情報とを構文にしたがい合成し、新たなビットストリームNBSを生成する(S910)。
 本実施の形態に係る配信システム100によると、信号処理における処理量を削減したスケーラブル符号化方式が実現可能となる。例えば、符号化側では、高解像度映像に付随ビットストリームを追加することで低解像度映像のビットストリームを生成することができる。これにより、低解像度映像の別途の符号化が不要となる。復号側では受信した映像の解像度を変更するための装置や回路を用意する必要はないので、装置構成をシンプルにすることができる。
 比較例を参照することで本実施の形態の作用効果を説明する。比較例は、スケーラブル符号化方式(例えば、非特許文献1参照)に関する。これはベースレイヤと呼ばれる基本映像と、基本映像にエンハンスメントレイヤと呼ばれる拡張部分を追加して様々な要素が拡張された拡張映像とを符号化・復号する手法である。様々な要素としては、フレームレート、解像度、ビット深度、色域などがある。比較例は特に解像度のスケーラビリティである空間スケーラビリティに関する。
 図10は、比較例に係るスケーラブル符号化装置130の機能および構成を示すブロック図である。ダウンサンプリング部132は入力画像を入力とし、解像度を1/2にした画像を出力する。1/2解像度の映像は、通常の符号化装置と同様に符号化される。レイヤ間参照画像生成部134は、復号された画像を入力とし、2倍に拡大した画像をフレームバッファ136に出力する。この結果、エンハンスメントレイヤの符号化における参照画像として、ベースレイヤの画像を利用することができ、それぞれ個別にエンコードするよりも、符号化効率が改善する。
 図11は、比較例に係るスケーラブル復号装置140の機能および構成を示すブロック図である。ベースレイヤのみを復号する場合には、既存の復号装置と同じである。一方、エンハンスメントレイヤまで復号するときには、エンハンスメントレイヤの参照画像バッファ142に、レイヤ間予測画像を追加する。
 図10および図11に示される回路構成からも明らかな通り、比較例に係るスケーラブル符号化・復号方式では、複数の符号化ループ/復号ループ(例えば、低解像度用と高解像度用)が必要である。したがって、信号処理に必要なメモリ帯域や処理量が全レイヤの画素数の合計に比例して増大する。これに対して本実施の形態に係る方式では、高解像度映像(例えば8K映像)のビットストリームから低解像度映像(例えば、4K映像)のビットストリームをシンタックス処理において生成する。したがって、高解像度映像と低解像度映像のどちらも単一ループの復号装置で復号可能となり、メモリ帯域や処理量を低減することができる。また、消費電力も低減できる。
 また、本実施の形態に係る方式では、シンタックスレベルで解像度を変更するので、信号レベルで解像度を変更する場合と比較して処理量を低減できる。
 上述の実施の形態において、データベースの例は、ハードディスクや半導体メモリである。また、本明細書の記載に基づき、各部を、図示しないCPUや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶する半導体メモリなどにより実現できることは本明細書に触れた当業者には理解される。
 以上、実施の形態に係る配信システム100の構成と動作について説明した。この実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解される。
 実施の形態では、符号化側である配信システム100がBS変換装置112を備える場合について説明したが、これに限られず、BS変換装置は復号側に設けられてもよい。例えば、ユーザサイトに設けられたBS変換装置はネットワーク106を介して8K映像のビットストリームおよび付随ビットストリームを受信し、シンタックス処理にて4K映像のビットストリームを生成してもよい。
 本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。
 本願は、2015年12月28日提出の日本国特許出願特願2015-256488を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims (14)

  1.  復号処理に係るユニットの最小サイズが規定されている動画像データに対応するビットストリームの構文と前記ビットストリームに付随する付随ビットストリームの構文とを解析する構文解析部と、
     前記構文解析部による解析の結果得られる高位文法を、該高位文法に含まれる解像度よりも低い解像度を含む新たな高位文法に変換する高位文法変換部と、
     前記構文解析部による解析の結果得られる情報であって前記ビットストリーム中の最小サイズのユニットに関連付けられた情報を、前記付随ビットストリーム中の対応するユニットに関連付けられた情報に変換するユニット変換部と、
     前記高位文法変換部からの前記新たな高位文法と前記ユニット変換部における変換後の情報とを構文にしたがい合成し、新たなビットストリームを生成する構文合成部と、を備えることを特徴とするビットストリーム変換装置。
  2.  前記高位文法変換部は、前記構文解析部による解析の結果得られる高位文法に含まれる解像度を2のn乗(nは自然数)で除して得られる解像度を、前記新たな高位文法に含めることを特徴とする請求項1に記載のビットストリーム変換装置。
  3.  前記ユニット変換部は、前記ビットストリーム中の最小サイズのユニットに関連付けられた情報を破棄し、代わりに前記付随ビットストリーム中の対応するユニットに関連付けられた情報を出力することを特徴とする請求項1または2に記載のビットストリーム変換装置。
  4.  前記ユニットはコーディングユニット(Coding Unit)を含むことを特徴とする請求項1から3のいずれか1項に記載のビットストリーム変換装置。
  5.  前記ユニットはプレディクションユニット(Prediction Unit)を含み、
     前記ユニット変換部は、前記ビットストリーム中の最小サイズよりも大きなサイズのプレディクションユニットに関連付けられた動きベクトルの精度を、前記低い解像度に応じた精度に変換することを特徴とする請求項1から4のいずれか1項に記載のビットストリーム変換装置。
  6.  前記ユニットはトランスフォームユニット(Transform Unit)を含み、
     前記ユニット変換部は、前記ビットストリーム中の最小サイズより大きなサイズのトランスフォームユニットに関連付けられたレベル値の集合を、前記低い解像度に応じたレベル値の集合に変換することを特徴とする請求項1から5のいずれか1項に記載のビットストリーム変換装置。
  7.  前記ユニット変換部は、前記ビットストリーム中の最小サイズより大きなサイズのトランスフォームユニットに関連付けられたレベル値の集合から低周波成分を抽出することにより、前記低い解像度に応じたレベル値の集合を生成することを特徴とする請求項6に記載のビットストリーム変換装置。
  8.  前記ビットストリームは所定の復号装置により復号可能である一方、前記付随ビットストリームのみの前記所定の復号装置による復号は可能でないことを特徴とする請求項1から7のいずれか1項に記載のビットストリーム変換装置。
  9.  請求項1から8のいずれか1項に記載のビットストリーム変換装置と、
     前記低い解像度を所望するというリクエストがあったときには前記ビットストリーム変換装置により生成される新たなビットストリームを選択する選択部と、を備えることを特徴とする配信システム。
  10.  復号処理に係るユニットの最小サイズが規定されている動画像データに対応するビットストリームの構文と前記ビットストリームに付随する付随ビットストリームの構文とを解析することと、
     前記解析の結果得られる高位文法を、該高位文法に含まれる解像度よりも低い解像度を含む新たな高位文法に変換することと、
     前記解析の結果得られる情報であって前記ビットストリーム中の最小サイズのユニットに関連付けられた情報を、前記付随ビットストリーム中の対応するユニットに関連付けられた情報に変換することと、
     前記新たな高位文法と前記変換後の情報とを構文にしたがい合成し、新たなビットストリームを生成することと、を含むことを特徴とするビットストリーム変換方法。
  11.  請求項1から8のいずれか1項に記載のビットストリーム変換装置としてコンピュータを機能させるプログラムを有することを特徴とするコンピュータ可読記録媒体。
  12.  複数のブロックに分割された符号化対象の画像について、ブロック単位で前記画像と予測画像との誤差信号を変換および量子化し、第1レベル値を生成する変換量子化部と、
     前記変換量子化部によって生成された第1レベル値をエントロピー符号化してビットストリームを生成する符号化部と、
     最小サイズよりも大きなサイズのブロックから、前記画像の解像度よりも低い解像度の最小サイズのブロックを生成するダウンサンプリング部と、を備え、
     前記変換量子化部は前記ダウンサンプリング部によって生成されたブロックの誤差信号を変換および量子化して第2レベル値を生成し、
     前記符号化部は、前記変換量子化部によって生成された第2レベル値をエントロピー符号化して付随ビットストリームを生成することを特徴とする動画像符号化装置。
  13.  複数のブロックに分割された符号化対象の画像について、ブロック単位で前記画像と予測画像との誤差信号を変換および量子化し、第1レベル値を生成することと、
     生成された第1レベル値をエントロピー符号化してビットストリームを生成することと、
     最小サイズよりも大きなサイズのブロックから、前記画像の解像度よりも低い解像度の最小サイズのブロックを生成することと、
     生成されたブロックの誤差信号を変換および量子化して第2レベル値を生成することと、
     生成された第2レベル値をエントロピー符号化して付随ビットストリームを生成することと、を含むことを特徴とする動画像符号化方法。
  14.  請求項12に記載の動画像符号化装置としてコンピュータを機能させるプログラムを有することを特徴とするコンピュータ可読記録媒体。
PCT/JP2016/069861 2015-12-28 2016-07-05 ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体 WO2017115482A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201680076379.1A CN108432251B (zh) 2015-12-28 2016-07-05 比特流变换设备、比特流变换方法、分发系统、分发方法以及计算机可读存储介质
EP16881462.2A EP3399751B1 (en) 2015-12-28 2016-07-05 Bitstream transformation apparatus, bitstream transformation method, distribution system, and computer-readable storage medium
US16/010,870 US10757448B2 (en) 2015-12-28 2018-06-18 Bitstream transformation apparatus, bitstream transformation method, distribution system, moving image encoding apparatus, moving image encoding method and computer-readable storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015256488A JP6566864B2 (ja) 2015-12-28 2015-12-28 ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
JP2015-256488 2015-12-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/010,870 Continuation US10757448B2 (en) 2015-12-28 2018-06-18 Bitstream transformation apparatus, bitstream transformation method, distribution system, moving image encoding apparatus, moving image encoding method and computer-readable storage medium

Publications (1)

Publication Number Publication Date
WO2017115482A1 true WO2017115482A1 (ja) 2017-07-06

Family

ID=59225574

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/069861 WO2017115482A1 (ja) 2015-12-28 2016-07-05 ビットストリーム変換装置、ビットストリーム変換方法、配信システム、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Country Status (5)

Country Link
US (1) US10757448B2 (ja)
EP (1) EP3399751B1 (ja)
JP (1) JP6566864B2 (ja)
CN (1) CN108432251B (ja)
WO (1) WO2017115482A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6566865B2 (ja) * 2015-12-28 2019-08-28 Kddi株式会社 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060133502A1 (en) * 2004-11-30 2006-06-22 Yung-Lyul Lee Image down-sampling transcoding method and device
JP2015076765A (ja) * 2013-10-09 2015-04-20 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466032B2 (ja) * 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置
WO2005099276A2 (en) * 2004-04-02 2005-10-20 Thomson Licensing Complexity scalable video encoding
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8594200B2 (en) * 2009-11-11 2013-11-26 Mediatek Inc. Method of storing motion vector information and video decoding apparatus
US9729884B2 (en) * 2012-01-18 2017-08-08 Lg Electronics Inc. Method and device for entropy coding/decoding
WO2015033510A1 (ja) 2013-09-09 2015-03-12 日本電気株式会社 映像符号化装置、映像符号化方法及びプログラム
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
JP6150134B2 (ja) 2014-03-24 2017-06-21 ソニー株式会社 画像符号化装置および方法、画像復号装置および方法、プログラム、並びに記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060133502A1 (en) * 2004-11-30 2006-06-22 Yung-Lyul Lee Image down-sampling transcoding method and device
JP2015076765A (ja) * 2013-10-09 2015-04-20 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム

Also Published As

Publication number Publication date
CN108432251A (zh) 2018-08-21
EP3399751B1 (en) 2023-09-06
JP2017120978A (ja) 2017-07-06
EP3399751A4 (en) 2019-01-02
CN108432251B (zh) 2022-03-08
EP3399751A1 (en) 2018-11-07
JP6566864B2 (ja) 2019-08-28
US10757448B2 (en) 2020-08-25
US20180302652A1 (en) 2018-10-18

Similar Documents

Publication Publication Date Title
JP6416992B2 (ja) ビデオビットストリームをトランスコーディングする方法及び構成
US10291934B2 (en) Modified HEVC transform tree syntax
JP6566865B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
JP6704932B2 (ja) ビデオコーディングシステムにおける残差変換及び逆変換方法
JP6438904B2 (ja) ビデオ信号処理
JP5768180B2 (ja) 画像復号方法及び画像復号装置
KR100843080B1 (ko) 비디오 트랜스코딩 방법 및 장치
US8243798B2 (en) Methods and apparatus for scalable video bitstreams
JP2023158204A (ja) 変換スキップ及びパレットコーディング関連情報のシグナリングベースの映像又はビデオコーディング
KR102284107B1 (ko) 영상을 부호화/복호화하기 위한 파라미터 세트 생성 방법 및 장치
JP6566864B2 (ja) ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
JP2007266750A (ja) 符号化方法
CN116325723B (zh) 用于视频解码的方法、计算机设备及介质
CN111147858B (zh) 视频解码方法、装置、设备及存储介质
KR20150056679A (ko) 다중 계층 비디오 코딩을 위한 계층 간 참조 픽쳐 생성 방법 및 장치
JP2018032913A (ja) 映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システム
JP6577426B2 (ja) トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置
US20150010083A1 (en) Video decoding method and apparatus using the same
EP2498496A1 (en) Multi-format video decoder and methods for use therewith
JP7378035B2 (ja) 変換装置、復号装置、変換方法および復号方法
JP2011109390A (ja) 画像符号化装置、画像符号化方法、画像復号装置、及び、画像復号方法
CN116458159A (zh) 跳过变换标志编码
KR20160148835A (ko) 참조 영상 필터링을 통한 비디오 신호 복호화 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16881462

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE