WO2011115045A1 - 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム - Google Patents

動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム Download PDF

Info

Publication number
WO2011115045A1
WO2011115045A1 PCT/JP2011/055915 JP2011055915W WO2011115045A1 WO 2011115045 A1 WO2011115045 A1 WO 2011115045A1 JP 2011055915 W JP2011055915 W JP 2011055915W WO 2011115045 A1 WO2011115045 A1 WO 2011115045A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
display order
order information
random access
encoding
Prior art date
Application number
PCT/JP2011/055915
Other languages
English (en)
French (fr)
Inventor
ブン チュンセン
鈴木 芳典
暁 藤林
タン ティオ ケン
Original Assignee
株式会社エヌ・ティ・ティ・ドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020177015372A priority Critical patent/KR101867461B1/ko
Priority to KR1020127027048A priority patent/KR101640872B1/ko
Application filed by 株式会社エヌ・ティ・ティ・ドコモ filed Critical 株式会社エヌ・ティ・ティ・ドコモ
Priority to EP11756230.6A priority patent/EP2549758B1/en
Priority to CN201180013583.6A priority patent/CN102792696B/zh
Priority to PL11756230T priority patent/PL2549758T3/pl
Priority to CA2793168A priority patent/CA2793168C/en
Priority to KR1020167012926A priority patent/KR101747195B1/ko
Priority to AU2011228218A priority patent/AU2011228218B2/en
Priority to ES11756230.6T priority patent/ES2655416T3/es
Priority to RU2012144029/08A priority patent/RU2568310C2/ru
Priority to BR112012023322A priority patent/BR112012023322B1/pt
Priority to MX2012010614A priority patent/MX2012010614A/es
Priority to NO11756230A priority patent/NO2549758T3/no
Priority to SG2012068334A priority patent/SG184079A1/en
Publication of WO2011115045A1 publication Critical patent/WO2011115045A1/ja
Priority to US13/618,066 priority patent/US9113171B2/en
Priority to US14/822,657 priority patent/US10178407B2/en
Priority to AU2016200188A priority patent/AU2016200188B2/en
Priority to AU2018202171A priority patent/AU2018202171B2/en
Priority to AU2018202169A priority patent/AU2018202169B2/en
Priority to AU2018202170A priority patent/AU2018202170B2/en
Priority to US16/213,660 priority patent/US10298953B2/en
Priority to US16/213,684 priority patent/US10390042B2/en
Priority to US16/376,966 priority patent/US10715829B2/en
Priority to US16/457,066 priority patent/US10567794B2/en
Priority to AU2019280003A priority patent/AU2019280003B2/en
Priority to AU2019280009A priority patent/AU2019280009B2/en
Priority to AU2021200759A priority patent/AU2021200759B2/en
Priority to AU2021266226A priority patent/AU2021266226B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements

Definitions

  • the present invention relates to a moving picture predictive coding apparatus, method, and program, and a moving picture predictive decoding apparatus, method, and program.
  • Compressive encoding technology is used to efficiently transmit and store moving image data.
  • MPEG1 to 4 and H.264. 261-H. H.264 is widely used.
  • an image to be encoded is divided into a plurality of blocks, and encoding / decoding processing is performed on each block.
  • the following predictive encoding method is used.
  • predictive coding within a screen a prediction signal is generated using an adjacent reproduced image signal (reconstructed image data encoded in the past) in the same screen as the target block, and the predicted signal is used as the target block.
  • the difference signal obtained by subtracting from the signal is encoded.
  • a displacement of a signal is searched with reference to a previously reproduced image signal in a screen different from the target block, a predicted signal is generated by compensating for the displacement, and the predicted signal is converted to the target block.
  • the differential signal obtained by subtraction from the signal is encoded.
  • the already-reproduced image that is referred to for motion search / compensation at this time is called a reference image.
  • the bidirectional inter-screen prediction not only the past image displayed before the target image in the display time order but also a future image displayed after the target image may be referred to (however, The future image must be encoded before the target image and reproduced in advance). And by averaging both the prediction signal acquired from the past image and the prediction signal acquired from the future image, it is effective in predicting the signal of the hidden and newly appearing object. There is an effect of reducing noise contained in the prediction signal.
  • the prediction signal for the target block refers to a plurality of reference images encoded and reproduced in the past, and an image signal with the least error is selected as an optimal prediction signal while performing motion search. . Then, a difference between the pixel signal of the target block and the optimal prediction signal is obtained, and the difference is subjected to discrete cosine transform and quantized, and then entropy-coded. At the same time, information relating to which reference image the optimum prediction signal for the target block is acquired from (reference index) and information relating to which region in the reference image the optimum prediction signal is obtained (motion vector) are also encoded. To do. H. In H.264, 4 to 5 reproduced images are stored in the frame memory as reference images. In the present specification, the frame memory includes a so-called decoded picture buffer.
  • Inter-screen predictive coding can efficiently compress and encode images by utilizing the correlation between images, but in order to be able to view a video program from the middle by switching TV channels, the inter-screen dependency It is necessary to cut off.
  • a portion having no dependency between screens in a compressed bit stream of a moving image is hereinafter referred to as a “random access point”.
  • a random access point is also required when editing moving images and connecting compressed data of different moving images.
  • H.264 an IDR picture is designated, and the designated IDR picture is encoded by the above-described intra prediction encoding method, and at the same time, the reproduction image stored in the frame memory is set to be unnecessary, and the reproduction image is referred to. By disabling it, the frame memory is substantially released (refreshed).
  • Such a process is called “memory refresh” and is sometimes called “frame memory refresh” or “buffer refresh”.
  • FIG. 11A is a schematic diagram illustrating a prediction structure of a moving image including an IDR picture.
  • a plurality of images 901, 902,..., 909 shown in FIG. 11A are part of an image group constituting a moving image, and each image is also referred to as “picture” or “frame”.
  • Each arrow indicates the direction of prediction.
  • the image 902 acquires a prediction signal using the images 903 and 905 that are the starting points of two arrows toward the image 902 as reference images.
  • the image 901 in FIG. 11A is encoded with reference to a past image not shown in FIG.
  • the images 902, 903, and 904 are encoded.
  • the above-described bidirectional predictive encoding method is used to increase the compression rate.
  • the image 905 is first encoded and reproduced, and then the image 903 is encoded with reference to the images 901 and 905 that have already been reproduced (in FIG. 11A, the arrow from the image 901 is omitted).
  • Each of the images 902 and 904 is encoded using the three reproduced images 901, 905, and 903 as reference images (in FIG. 11A, arrows from the image 901 are omitted).
  • images 906, 907, and 908 are encoded with reference to images 905 and 909.
  • the compressed data of each image encoded (compressed) in this way is transmitted or stored in the order as shown in FIG.
  • the compressed data 910 is compressed data of the image 901 with the same code P1
  • the compressed data 911 is compressed data of the image 905 with the same code IDR5.
  • the above-mentioned Patent Document 1 describes the frame memory refresh timing (that is, the timing at which the reference image in the frame memory is set to be unnecessary) as the code of the image encoded after the IDR picture.
  • a method of delaying until the execution time is disclosed.
  • Method 1 Information regarding the number of images to be delayed is added to the IDR picture.
  • Method 2 A signal (flag) instructing execution of the memory refresh is added to the compressed image data corresponding to the timing at which the memory refresh is performed.
  • Method 3 The first P picture (unidirectional prediction image) appearing after the IDR picture is set as the refresh timing.
  • Disadvantage 1 In Method 1 described above, when editing a moving image, some of the plurality of images are discarded and another image is connected, or another image is inserted. There is an inconvenience that “information on the number of images to be delayed” added to the IDR picture is not appropriate and causes a malfunction.
  • Disadvantage 2 In Method 2 above, even when a flag is used, if the compressed data of the corresponding image is deleted by editing the moving image, the flag added to the deleted compressed data disappears, causing a malfunction. Inconvenience.
  • Disadvantage 3 In method 3 above, the memory refresh signal (timing) is limited to the P picture, so that there is a disadvantage that it cannot be encoded by other methods. For example, it cannot be encoded as intra prediction (I picture) at a scene change.
  • the “malfunction” here is due to the fact that the memory refresh is not performed at an appropriate timing, and the reference image necessary for decoding subsequent data is not stored in the frame memory. As a result, it means that subsequent images cannot be reproduced correctly.
  • An object of the present invention is to solve the above-described problems and to efficiently compress and encode images before and after a random access location, and at the same time eliminate the disadvantages associated with the disadvantages of the prior art.
  • a video predictive coding apparatus includes an input unit that inputs a plurality of images constituting a video, and intra-screen prediction or screen of the input image.
  • a restoring means for restoring the reproduced image by decoding the generated compressed image data and an image storing means for storing the restored reproduced image as a reference image used for encoding the subsequent image
  • a memory management unit that controls the image storage unit, and the memory management unit has completed the encoding process for generating the random access image First, for reference images other than the random access image among reference images stored in the image storage unit immediately before or immediately after encoding an image whose display order information is larger than the display order information of the random access image.
  • the image storage means is refreshed by setting it to be unnecessary.
  • the encoding means includes one or more images including display order information larger than display order information of the random access image and an image to be encoded first after completion of the encoding process for generating the random access image.
  • a difference value between the display order information of the encoding target image and the display order information of the random access image may be encoded.
  • the above encoding means completes the encoding process in which the display order information is larger than the display order information of the random access image and the random access image is generated from the image to be encoded next to the random access image.
  • the difference value between the display order information of each image and the display order information of the random access image is encoded as data related to the display order information of each image. May be.
  • the moving picture predictive decoding apparatus is a random access obtained by encoding a plurality of images constituting a moving picture by either an intra prediction or an inter prediction method.
  • Input means for inputting compressed image data including a random access image, which is an image, and display order encoded data obtained by encoding data relating to the display order information of the image, and decoding the compressed image data
  • a restoration means for restoring display order information by decoding the display order encoded data, and a reference picture used for decoding the restored playback picture and subsequent pictures.
  • Image storage means for storing the image storage means, and memory management means for controlling the image storage means, wherein the memory management means stores the random access image.
  • the random image among the reference images stored in the image storage unit immediately before or immediately after decoding an image whose display order information is larger than the display order information of the random access image is refreshed by setting the reference image excluding the access image to be unnecessary.
  • the restoration means includes at least one decoding target image including display order information larger than the display order information of the random access image and an image to be decoded first after completion of the decoding process for decoding the random access image.
  • Display order information obtained by decoding the display order encoded data of the decoding target image, the difference value between the display order information of the decoding target image and the display order information of the random access image, and the random order
  • the display order information of the decoding target image may be restored by adding the display order information of the access image.
  • the restoration unit may include a display order information larger than the display order information of the random access image and an encoding process that generates the random access image from an image to be encoded next to the random access image.
  • the display order information for each image up to the first encoding target image the display order information for each image and the random access image obtained by decoding the display order encoded data for each image.
  • the display order information of each image may be restored by adding the difference value between the display order information and the display order information of the random access image.
  • a moving picture predictive encoding method is executed by a moving picture predictive encoding apparatus including an image storage unit for storing a reference image used for encoding a subsequent image. It is a moving image predictive encoding method, wherein an input step of inputting a plurality of images constituting a moving image and encoding the input image by any one of intra-screen prediction or inter-screen prediction, By generating compressed image data including a random access image that is an image to be random access, an encoding step for encoding data related to display order information of the image, and decoding the generated compressed image data A restoration step for restoring a reproduction image, and the restored reproduction image as a reference image used for encoding a subsequent image in the image storage means.
  • the video predictive coding apparatus has completed the coding process for generating the random access image. Thereafter, the reference image excluding the random access image among the reference images stored in the image storage unit immediately before or immediately after encoding an image whose display order information is larger than the display order information of the random access image.
  • the image storage means is refreshed by setting “no” as unnecessary.
  • the moving image predictive encoding device is the first encoding target after the encoding process for generating the random access image is completed and the display order information is larger than the display order information of the random access image.
  • a difference value between the display order information of the encoding target image and the display order information of the random access image may be encoded as data related to the display order information of one or more encoding target images including an image.
  • the video predictive encoding device has a display order information larger than a display order information of the random access image and an image to be encoded next to the random access image and the random access image.
  • the display order information of each image and the display order of the random access image are used as data related to the display order information of each image.
  • a difference value from information may be encoded.
  • the moving picture predictive decoding method includes a moving picture predictive decoding apparatus including a picture storing unit for storing a reference picture used for decoding a subsequent picture.
  • a decoding method that includes a random access image that is a random access image obtained by encoding a plurality of images constituting a moving image by either intra prediction or inter prediction. While inputting the image data and the display order encoded data obtained by encoding the data related to the display order information of the image, and restoring the reproduced image by decoding the compressed image data, A restoration step of restoring display order information by decoding the display order encoded data, and decoding the restored image and subsequent images.
  • the video predictive decoding device includes the random access image.
  • the image storage means is refreshed by setting the reference image except the random access image to be unnecessary.
  • the video predictive decoding apparatus includes an image that is first displayed after decoding processing is completed, in which display order information is larger than display order information of the random access image and the random access image is decoded.
  • display order information of one or more decoding target images the display order information of the decoding target image and the display order information of the random access image obtained by decoding the display order encoded data of the decoding target image,
  • the display order information of the decoding target image may be restored by adding the difference value and the display order information of the random access image.
  • the video predictive decoding device generates the random access image having display order information larger than the display order information of the random access image, from an image to be encoded next to the random access image.
  • the display order information for each image up to the first encoding target image after completion of the encoding process the display of each image obtained by decoding the display order encoded data of each image
  • the display order information of each image may be restored by adding the difference value between the order information and the display order information of the random access image and the display order information of the random access image.
  • a moving image predictive encoding program includes a computer, an input unit that inputs a plurality of images constituting a moving image, and either the intra prediction or the inter prediction of the input image.
  • encoding means for encoding the data relating to the display order information of the image, and generating compressed image data including a random access image that is an image to be random access Restoring means for restoring a reproduced image by decoding the compressed image data, image storing means for storing the restored reproduced image as a reference image used for encoding a subsequent image, and the image storage
  • the memory management means is operated as a memory management means for controlling the means, and the memory management means has completed the encoding process for generating the random access image First, for reference images other than the random access image among reference images stored in the image storage unit immediately before or immediately after encoding an image whose display order information is larger than the display order information of the random access image.
  • the image storage means is refreshed by setting it as unnecessary.
  • a moving image predictive decoding program is a random number obtained by encoding a plurality of images constituting a moving image by a method of intra prediction or inter prediction.
  • Input means for inputting compressed image data including a random access image that is an image to be accessed, and display order encoded data obtained by encoding data relating to display order information of the image, and the compressed image data
  • reconstructing means for reconstructing display order information by decoding the display order encoded data, and using the reconstructed reconstructed image for decoding subsequent images.
  • Image storage means for storing as a reference image and memory management means for controlling the image storage means, and the memory management means After the decoding process for decoding the random access image is completed, first, the reference image stored in the image storage means immediately before or immediately after decoding the image whose display order information is larger than the display order information of the random access image Of these, the image storage means is refreshed by setting the reference image excluding the random access image to be unnecessary.
  • the images before and after the image that is the location of random access are efficiently compressed and encoded, and at the same time, the disadvantages associated with the disadvantages of the prior art are eliminated.
  • display order information information indicating a display order attached to each image constituting a moving image or compression-encoded image data
  • display order information display time, time reference information, temporal reference, etc. in the prior art
  • timing of memory refresh according to the present invention is not limited to P pictures, and does not depend on the picture coding type (I picture, P picture, B picture), so that coding is performed regardless of whether or not memory refresh is required. It is possible to process with the most efficient coding type, and the disadvantage 3 of the prior art is eliminated.
  • FIG. 1 It is a figure which shows the hardware constitutions of the computer for performing the program recorded on the recording medium. It is a general-view figure of the computer for performing the program memorize
  • FIG. 1 is a functional block diagram showing a configuration of a video predictive coding apparatus 100 according to an embodiment of the present invention.
  • the moving image predictive encoding device 100 includes an input terminal 101, a block divider 102, a prediction signal generator 103, a frame memory 104, a subtractor 105, a converter 106, a quantum, as a functional configuration.
  • the operation of each functional block will be described in the operation of the moving picture predictive encoding device 100 described later.
  • a moving image signal composed of a plurality of images to be encoded is input to an input terminal 101, and each image is divided into a plurality of regions by a block divider 102.
  • each image is divided into a plurality of blocks composed of 8 ⁇ 8 pixels, but may be divided into other block sizes or block shapes.
  • a prediction signal is generated by a prediction method to be described later for a block to be encoded (hereinafter referred to as “target block”).
  • target block a prediction method to be described later for a block to be encoded
  • two types of prediction methods, inter-screen prediction and intra-screen prediction can be used as the prediction method.
  • the bidirectional inter-screen prediction described in the background art can also be used. Yes.
  • the basic operations of inter-screen prediction and intra-screen prediction are outlined below.
  • inter-screen prediction a reproduced image that has been encoded in the past is used as a reference image, and motion information (for example, a motion vector) that gives a prediction signal with the smallest error with respect to the target block is obtained from this reference image.
  • motion detection a process that gives a prediction signal with the smallest error with respect to the target block.
  • the target block may be subdivided, and the inter-screen prediction method may be determined for the subdivided small area. In this case, among the various division methods, the division method of the small area and the motion information of each small area that are most efficient for the entire target block are determined.
  • inter-screen prediction is performed by the prediction signal generator 103, and the target block is input to the prediction signal generator 103 via the line L102, and the reference image is input to the prediction signal generator 103 via the line L104.
  • the reference image a plurality of images encoded and restored in the past are used as the reference image.
  • the details thereof are MPEG-2, MPEG-4, H. It is the same as any of the H.264 methods.
  • the determined subregion division method information and the motion information of each subregion are sent from the prediction signal generator 103 to the entropy encoder 111 via the line L112 and encoded by the entropy encoder 111.
  • the encoded data is sent from the output terminal 112 via the line L111.
  • information (reference index) on which reference image a prediction signal is acquired from among a plurality of reference images is also sent from the prediction signal generator 103 to the entropy encoder 111 via the line L112, and is subjected to entropy encoding.
  • the encoded data is sent from the output terminal 112 via the line L111.
  • four to five reproduced images are stored in the frame memory 104 and used as reference images.
  • the prediction signal generator 103 acquires a reference image from the frame memory 104 based on the small region dividing method, the reference image and motion information for each small region, and generates a prediction signal (inter-screen prediction) from the reference image and the motion information. Is generated in the sense of the prediction signal obtained by the above.
  • the inter-screen prediction signal generated in this way is sent to the subtracter 105 and the adder 110 related to the processing described later via the line L103.
  • the intra prediction signal is generated using the already reproduced pixel values spatially adjacent to the target block.
  • the prediction signal generator 103 obtains a previously reproduced pixel signal in the same screen from the frame memory 104 and extrapolates the already reproduced pixel signal to obtain a prediction signal (obtained by intra prediction). In the meaning of the predicted signal).
  • the generated intra-screen prediction signal is sent from the prediction signal generator 103 to the subtractor 105 via the line L103.
  • a method for generating an intra-screen prediction signal in the prediction signal generator 103 is the conventional technique of H.264. This is the same as the H.264 method.
  • Information relating to the extrapolation method in the intra prediction is sent from the prediction signal generator 103 to the entropy encoder 111 via the line L112, encoded by the entropy encoder 111, and then encoded data is It is sent out from the output terminal 112.
  • the subtractor 105 generates a residual signal by subtracting the prediction signal received via the line L103 from the signal of the target block received via the line L102.
  • This residual signal is subjected to discrete cosine transform by a transformer 106, and each transform coefficient is quantized by a quantizer 107.
  • the quantized transform coefficient is encoded by the entropy encoder 111, and the obtained encoded data is sent from the output terminal 112 via the line L111 together with information on the prediction method.
  • the quantized transform coefficient (the encoded data of the target block) is dequantized by the inverse quantizer 108.
  • the inverse transformer 109 performs inverse discrete cosine transform, thereby restoring the residual signal.
  • the adder 110 adds the restored residual signal and the prediction signal sent from the line L103, thereby reproducing the signal of the target block, and the obtained reproduction signal is stored in the frame memory 104.
  • the converter 106 and the inverse converter 109 are used. However, other conversion processes instead of these may be used. In some cases, the converter 106 and the inverse converter 109 may not be provided.
  • the frame memory 104 is finite, and it is actually impossible to store all the reproduced images. Therefore, only the reproduced image used for encoding the subsequent image is stored in the frame memory 104.
  • the frame memory manager 114 controls the frame memory 104.
  • the frame memory 104 is controlled so that it can be stored.
  • display order information of each image and type information for encoding the image are input to the frame memory manager 114 from the input terminal 113.
  • the frame memory manager 114 Based on these pieces of information, the frame memory manager 114 operates. At this time, the display order information of each image is sent from the frame memory manager 114 to the entropy encoder 111 via the line L114, encoded by the entropy encoder 111, and the encoded display order information is Along with the encoded image data, it is sent out from the output terminal 112 via the line L111.
  • the display order information is attached to each image, and may be information indicating the order of the images or information indicating the time when the images are displayed (for example, display reference time (temporal reference) of the images). In the present embodiment, for example, the display order information is directly encoded by binary encoding. A control method by the frame memory manager 114 will be described later.
  • FIG. 2 is a functional block diagram showing the configuration of the video predictive decoding apparatus 200 according to the embodiment of the present invention.
  • the moving picture predictive decoding apparatus 200 has an input terminal 201, a data analyzer 202, an inverse quantizer 203, an inverse transformer 204, an adder 205, and a prediction signal generator 208 as functional configurations.
  • the decoding means is not limited to the inverse quantizer 203 and the inverse transformer 204, and other means may be used. Further, the means for decoding may be configured only by the inverse quantizer 203 without the inverse transformer 204.
  • the compressed data obtained by the encoding method described above is input from the input terminal 201.
  • This compressed data includes the residual signal of the target block, information related to the generation of the prediction signal, quantization parameters, image display order information, and information related to the image encoding type.
  • information relating to the generation of the prediction signal includes, for example, in the case of inter-screen prediction, information relating to block division (subregion division method information (eg, block size)), motion information of each small region, and reference index
  • subregion division method information eg, block size
  • the data analyzer 202 extracts, from the input compressed data, information on the residual signal of the target block, information related to generation of a prediction signal, quantization parameters, image display order information, and image coding type. .
  • the residual signal and quantization parameter of the target block are sent to the inverse quantizer 203 via the line L202, and the inverse quantizer 203 inverts the residual signal of the target block based on the quantization parameter.
  • the inverse transformer 204 performs inverse discrete cosine transform on the result of the inverse quantization.
  • the residual signal restored in this way is sent to the adder 205 via the line L204.
  • information regarding the generation of the extracted prediction signal is sent to the prediction signal generator 208 via the line L206b.
  • the prediction signal generator 208 acquires an appropriate reference image from a plurality of reference images in the frame memory 207 based on information related to the generation of the prediction signal, and generates a prediction signal based on the appropriate reference image.
  • the generated prediction signal is sent to the adder 205 via the line L208, and is added to the restored residual signal by the adder 205.
  • the signal of the target block is reproduced.
  • the reproduced signal of the target block is output from the output terminal 206 via the line L205 and simultaneously stored in the frame memory 207 as a reproduced image.
  • the frame memory 207 stores a playback image used for decoding and playback of subsequent images.
  • the frame memory manager 209 operates based on the display order information of the target image input via the line L206a and information related to the image encoding type. A control method by the frame memory manager 209 will be described later.
  • an IDR picture instantaneous decoder refresh
  • This name is derived from refreshing the frame memory (decoder buffer) immediately after encoding or decoding the IDR picture.
  • the frame memory is not refreshed, but temporarily.
  • this image is called a DDR picture (deferred decoder refresh or delayed decoder refresh) in order to refresh the frame memory after waiting (or delaying).
  • the refresh timing of the frame memory includes the display order information of the DDR picture, the display order information of the image (hereinafter referred to as “processing target image”) to be processed (encoding or decoding), and Is determined by comparing
  • FIG. 3 is a flowchart showing a video predictive encoding / decoding method according to the present embodiment.
  • FIG. 3 will be described as a video encoding method.
  • FIG. 3 is also applicable to a moving image decoding method.
  • TR is the display order information
  • TR_DDR is the display order information of the DDR image
  • TR_CUR is the display order information of the processing target image at that time
  • RP is a state variable indicating whether or not the refresh of the frame memory 104 is waiting.
  • the frame memory 104 has already been refreshed or does not require refresh processing.
  • TR_DDR and RP are initialized to 0 (step 301).
  • a process of setting the reference image stored in the memory 104 as unnecessary is executed (step 303). However, the reference image set as unnecessary here is only the reference image whose display order information TR is smaller than the display order information (TR_DDR) of the latest DDR picture. Also, the latest DDR picture (or intra prediction encoded image) is not set as unnecessary.
  • step 304 it is confirmed whether or not the processing target image at that time is a DDR picture.
  • information on the picture coding type (DDR, inter-screen predictive coding or bi-directional predictive coding) is given from a control device (not shown) via the input terminal 113 in FIG. Shall be.
  • the processing target image at that time is a DDR picture in step 304
  • the process proceeds to step 306.
  • the condition is not satisfied in step 304, the process proceeds to step 306.
  • step 306 a reproduced image corresponding to the processing target image is obtained.
  • the processing target image is encoded to obtain compressed data
  • the compressed data is further decoded to obtain a reproduction image (reproduction image corresponding to the processing target image).
  • the compressed data obtained by encoding is transmitted to the outside of the video predictive encoding device 100.
  • the compressed data may be stored in a memory (not shown) in the moving picture predictive coding apparatus 100.
  • the DDR picture, the unidirectional predictive encoded image, and the specific bidirectional predictive encoded image are all reference images.
  • the method is not limited to this method.
  • step 307 If it is determined in step 307 that the reproduced image is not used as a reference image, the process proceeds to step 309 without storing the reproduced image in the frame memory 104. On the other hand, if it is determined in step 307 that the reproduced image is used as a reference image, the reproduced image is stored in the frame memory 104 in step 308 and then the process proceeds to step 309.
  • step 309 it is determined whether or not there is a next image (unprocessed image). If there is a next image, the process returns to step 302, and the processing in steps 302 to 308 is repeated for the next image. In this way, the processing of steps 302 to 308 is repeated until the last image, and when the processing of all the images is completed, the processing of FIG. 3 ends.
  • step 303 After the processing of the random access image (here, the latest DDR picture) is completed by the processing of FIG. 3 described above, when processing an image whose display order information TR is larger than TR_DDR for the first time (actually, in step 306) In step 303 immediately before processing), the frame memory is refreshed. Note that the refresh timing of the frame memory may be any time when an image whose display order information TR is larger than TR_DDR is processed first after processing of a random access image (here, the latest DDR picture) is completed. It may be immediately after the process of 306.
  • FIG. 3 corresponds to the processing of the entire moving picture predictive encoding apparatus 100 of FIG. 1, but the processing of steps 302 to 305 is performed by the frame memory manager 114.
  • FIG. 3 has been described as a moving image encoding method, it can also be applied to processing of a moving image decoding method.
  • step 301 the data (bit stream) of the compressed and encoded image is further input.
  • the display order information and encoding type of the target image are extracted from the data, and the control in steps 302 to 305 is performed by the same method as described above.
  • step 306 the compressed data of the target image is decoded and the image is restored.
  • the processing after step 307 is as described above.
  • Such processing corresponds to the processing of the entire moving picture predictive decoding apparatus 200 of FIG. 2, and in particular, the processing of steps 302 to 305 is performed by the frame memory manager 209.
  • FIG. 4 is a schematic diagram for explaining processing of the video predictive encoding / decoding method according to the present embodiment.
  • processing an image means “encoding or decoding an image”.
  • the English characters written in the frames of the images 401 to 409 in FIG. 4 mean the following. That is, P means an image encoded by unidirectional prediction, DDR means an image encoded as a DDR picture, and B and b mean images encoded by bidirectional prediction. In addition, images other than the image indicated by the lowercase letter b (that is, images indicated by the uppercase letters B, P, and DDR) are all used as reference images.
  • TR_DDR corresponding to the image 401 may take an arbitrary value, but a value stored by the preceding process is set.
  • the image 401 indicated by the capital letter P1 is used as a reference image and is stored in the frame memory.
  • the processing of the image 402 will be described with reference to FIG.
  • the image 402 is stored in the frame memory because it is used as a reference image.
  • the images P1 and DDR5 are stored in the frame memory.
  • RP 1
  • the display order TR (n + 3) of the image 403 is smaller than TR_DDR (n + 5) and the image 403 is not a DDR picture.
  • Decoded step 306.
  • the image 403 is stored in the frame memory because it is used as a reference image.
  • the display order information TR (n + 9) of the image 406 is larger than TR_DDR (n + 5), so an affirmative determination is made in step 302 and the reference image is selected in step 303.
  • the reference images set as unnecessary are only reference images having display order information TR smaller than that of the latest DDR picture 402, excluding the latest DDR picture 402. Therefore, as shown in an area 414 in FIG. 4, in the frame memory, the storage areas for the image P1 and the image B3 are released, and only the image DDR5 is stored.
  • the image 406 is stored in the frame memory after the processing of the image 406 is completed, and thereafter, the refresh control of the frame memory is performed in the same manner as described above.
  • the reference image (image P1 in FIG. 4) in the frame memory is not set to be unnecessary, so the processing of the images 403, 404, and 405 processed after the DDR picture 402 is performed.
  • the image P1 can be referred to at this time, which can contribute to the improvement of the coding efficiency.
  • the latest DDR picture 402 (image DDR5) is not set to be unnecessary, so that the latest DDR picture is processed in the subsequent processing of the images 407, 408, and 409. 402 (image DDR5) can be used as a reference image.
  • the present embodiment uses the display order information attached to the image, and uses the display order information to indicate the timing of the memory refresh performed after the processing of the intra prediction image (DDR picture) that is a random access location.
  • DDR picture intra prediction image
  • the display order information is always attached to each image, it is not necessary to send new information (flag), and the disadvantage 2 of the prior art is solved.
  • the display order information of each image constituting the moving image is set appropriately, which may cause a malfunction.
  • the timing of memory refresh according to the present invention is not limited to P pictures, and does not depend on the picture coding type (I picture, P picture, B picture), so that coding is performed regardless of whether or not memory refresh is required. It is possible to process with the most efficient coding type, and the disadvantage 3 of the prior art is eliminated.
  • FIG. 5 shows a flowchart of a modified example of the moving picture predictive encoding / decoding method.
  • the image display order information is encoded as follows. That is, for an image to be processed while waiting for refresh of the frame memory, the difference value between the display order information and the display order information of the DDR picture is encoded.
  • the display order information is encoded by an arbitrary method. For example, the difference from the display order information of the DDR picture may be encoded, or the difference from the display order information of the immediately preceding image in the encoding order may be encoded.
  • FIG. 5 will be described as a moving picture decoding method, but of course, FIG. 5 is also applicable to a moving picture encoding method.
  • compression-encoded image data is input to the moving image predictive decoding device 200, and information regarding the difference value (delta_TR) of the display order information of the target image and the image encoding type from the data. To extract.
  • TR_DDR and RP are initialized to 0.
  • step 503 the display order information TR_CUR of the processing target image at that time is set to the sum (added value) of TR_DDR and delta_TR.
  • step 504 it is confirmed whether TR_CUR is larger than TR_DDR. If this condition is satisfied, it means that the frame memory is in a refresh standby state and the image to be processed is an image after the DDR picture in the display order.
  • the process of setting the reference image stored in 207 as unnecessary is executed (step 505). However, the reference image set as unnecessary here is only the reference image whose display order information TR is smaller than the display order information (TR_DDR) of the latest DDR picture. Also, the latest DDR picture (or intra prediction encoded image) is not set as unnecessary.
  • step 502 if a negative determination is made in step 502, the process proceeds to step 506, where TR_CUR is set to the sum (added value) of the display order information TR_PREV and delta_TR of the previously processed image, and the process proceeds to step 507.
  • step 507 it is confirmed whether or not the processing target image at the time is a DDR picture.
  • the moving picture predictive decoding apparatus 200 can obtain information related to an image coding type (DDR, inter-screen predictive coding or bi-directional predictive coding) from compression-coded data input from the outside.
  • a reproduced image corresponding to the processing target image is obtained.
  • a reproduced image corresponding to the processing target image is obtained by decoding the compressed data of the processing target image by the decoding method described in FIG. Note that the reproduced image obtained here is transmitted to the outside of the moving picture predictive decoding apparatus 200, for example.
  • the DDR picture, the unidirectional predictive encoded image, and the specific bidirectional predictive encoded image are all reference images. However, the method is not limited to this method.
  • step 510 If it is determined in step 510 that the reproduced image is not used as a reference image, the process proceeds to step 512 without storing the reproduced image in the frame memory 207. On the other hand, if it is determined in step 510 that the reproduced image is used as a reference image, the reproduced image is stored in the frame memory 207 in step 511 and then the process proceeds to step 512.
  • step 512 TR_CUR is set to TR_PREV for the processing in the subsequent step 506, and the process proceeds to step 513.
  • step 513 it is determined whether or not there is a next image (unprocessed image). If there is a next image, the process returns to step 502, and the processing in steps 502 to 512 is repeated for the next image. In this way, the processing in steps 502 to 512 is repeated until the last image, and when all the images have been processed, the processing in FIG. 5 is terminated.
  • step 505 the frame memory is refreshed.
  • the refresh timing of the frame memory may be any time when an image whose display order information TR is larger than TR_DDR is processed first after processing of a random access image (here, the latest DDR picture) is completed. It may be immediately after the processing of 509.
  • FIG. 5 corresponds to the processing of the entire moving picture predictive decoding apparatus 200 of FIG. 2, and in particular, steps 502 to 508 are performed by the frame memory manager 209.
  • FIG. 5 demonstrated as a moving image decoding method, it is applicable also to the process of a moving image encoding method.
  • delta_TR is obtained from the difference between TR_CUR and TR_DDR
  • delta_TR is obtained from the difference between TR_CUR and TR_PREV and then entropy-encoded.
  • the target image is encoded and then decoded.
  • processing corresponds to processing of the entire moving picture predictive coding apparatus 100 of FIG. 1, and in particular, processing of steps 502 to 508 is performed by the frame memory manager 114.
  • FIG. 6 is a schematic diagram for explaining the process of the video predictive encoding / decoding method according to the modification.
  • Images 601 to 609 shown in FIG. 6 are part of an image group constituting a moving image, and show the same processing as the images 401 to 409 described in FIG.
  • delta_TR shown in the region 621 is added to FIG.
  • the method of obtaining delta_TR differs depending on the value of RP at the start of encoding processing of the target image (RP value of the previous image). That is, in the encoding process of the images 603 to 606, delta_TR is obtained as a difference value between TR of each image and TR_DDR.
  • delta_TR is obtained as a difference value between the TR of each image and the TR of the immediately preceding image.
  • the display order information TR is restored from the difference value delta_TR in the decoding process of each image, the display order information TR is obtained by adding the difference value delta_TR and TR_DDR obtained by decoding the compressed data of the difference value. To restore.
  • the subsequent processing is the same as in FIG.
  • the display order information TR of the image 606 is obtained from TR_DDR. Can be controlled without malfunction. If the delta_TR of all the images is obtained as a difference value between the display order information of the image and the display order information of the immediately preceding image in the decoding order, the display order information is correctly reproduced when the image 603 is missing. As a result, the frame memory is refreshed at the timing of the image 605 (originally, the timing of the image 606 is the correct timing).
  • FIG. 6 When FIG. 6 is applied to the moving image encoding process, the display order information of the images (images 603 to 606) waiting for the frame memory refresh after completion of the processing of the random access image (here, the latest DDR picture) is displayed.
  • the frame memory refresh timing is encoded by encoding the difference value delta_TR between the display order information TR of the image and the display order information TR_DDR of the DDR picture instead of the display order information TR of the image itself. Can be restored correctly. For this reason, even if an image that is waiting for frame memory refresh is dropped, malfunctions can be avoided and the error tolerance is strong.
  • the difference value delta_TR is to be encoded as an image first after the random access image (here, the latest DDR picture) and whose display order information TR is first larger than TR_DDR (image 606 in FIG. 6).
  • One or more images may be included. That is, for one or more images including first an image having display order information TR larger than TR_DDR (image 606 in FIG. 6) after a random access image (here, the latest DDR picture), the display order information is encoded.
  • the difference value delta_TR between the display order information TR of the image and the display order information TR_DDR of the DDR picture may be encoded instead of the display order information TR of the image.
  • the invention relating to the moving picture predictive coding apparatus can be understood as an invention relating to a moving picture predictive coding program for causing a computer to function as a moving picture predictive coding apparatus.
  • the invention relating to the moving picture predictive decoding apparatus can be regarded as an invention relating to a moving picture predictive decoding program for causing a computer to function as a moving picture predictive decoding apparatus.
  • the moving picture predictive encoding program and the moving picture predictive decoding program are provided by being stored in a recording medium, for example.
  • the recording medium include a recording medium such as a flexible disk, a CD-ROM, a DVD, a recording medium such as a ROM, or a semiconductor memory.
  • FIG. 9 shows a module of a moving picture predictive coding program for causing a computer to function as a moving picture predictive coding apparatus.
  • the moving picture predictive encoding program P100 includes an input module P101, an encoding module P102, a restoration module P103, an image storage module P104, and a memory management module P105.
  • FIG. 10 shows a module of a moving picture predictive decoding program for causing a computer to function as a moving picture predictive decoding apparatus.
  • the moving picture predictive decoding program P200 includes an input module P201, a restoration module P202, an image storage module P203, and a memory management module P204.
  • the moving picture predictive encoding program P100 and the moving picture predictive decoding program P200 configured as described above can be stored in the recording medium 10 shown in FIG. 8, and are executed by the computer 30 described later.
  • FIG. 7 is a diagram showing a hardware configuration of a computer for executing a program recorded on the recording medium
  • FIG. 8 is an overview diagram of the computer for executing the program stored on the recording medium.
  • Examples of the computer include a DVD player, a set top box, a mobile phone, etc. that have a CPU and perform processing and control by software.
  • the computer 30 includes a reading device 12 such as a flexible disk drive device, a CD-ROM drive device, a DVD drive device, a working memory (RAM) 14 in which an operating system is resident, and a recording medium 10.
  • the computer 30 can access the moving image predictive encoding program stored in the recording medium 10 from the reading device 12, and the moving image predictive encoding program can It becomes possible to operate as a moving picture predictive encoding apparatus according to the invention.
  • the computer 30 can access the moving picture predictive decoding program stored in the recording medium 10 from the reading apparatus 12, and the moving picture predictive decoding program can It becomes possible to operate as a moving picture predictive decoding apparatus according to the present invention.
  • the video predictive encoding program or the video predictive decoding program may be provided via a network as a computer data signal 40 superimposed on a carrier wave.
  • the computer 30 can store the moving picture predictive encoding program or the moving picture predictive decoding program received by the communication device 24 in the memory 16 and execute it.
  • Inverse transformer 205 ... Adder 206 ... Output terminal 207 ... Frame memory 208 ... Predictive signal Generator, 209 ... Frame memory manager, P100 ... Video predictive encoding program, P101 ... Input module, P102 ... Encoding module P103 ... restoration module, P104 ... image storing module, P105 ... memory management module, P200 ... moving picture prediction decoding program, P201 ... input module, P202 ... restoration module, P203 ... image storing module, P204 ... memory management module.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

 動画像予測符号化装置は、入力された画像を符号化し、ランダムアクセス画像を含む圧縮画像データを生成するとともに画像の表示順番情報に関するデータを符号化する符号化手段と、圧縮画像データを復号することで再生画像を復元する復元手段と、再生画像を参照画像として格納する画像格納手段と、画像格納手段を制御するメモリ管理手段とを具備し、メモリ管理手段は、ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報がランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、画像格納手段内の参照画像のうち、ランダムアクセス画像を除く参照画像について不要と設定することで、画像格納手段をリフレッシュする。

Description

動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
 本発明は、動画像予測符号化装置、方法、及びプログラム、並びに、動画像予測復号装置、方法、及びプログラムに関する発明である。
 動画像データの伝送や蓄積を効率よく行うために、圧縮符号化技術が用いられる。動画像の場合ではMPEG1~4やH.261~H.264の方式が広く用いられている。
 これらの符号化方式では、符号化の対象となる画像を複数のブロックに分割し、各ブロックに対し符号化・復号処理を行う。符号化効率を高めるため、下記のような予測符号化方法が用いられる。画面内の予測符号化では、対象ブロックと同じ画面内の隣接する既再生の画像信号(過去に符号化された画像データを復元したもの)を用いて予測信号を生成し、予測信号を対象ブロックの信号から引き算して得られた差分信号を符号化する。画面間の予測符号化では、対象ブロックと異なる画面内の既再生の画像信号を参照して信号の変位を検索し、その変位分を補償して予測信号を生成し、予測信号を対象ブロックの信号から引き算して得られた差分信号を符号化する。このとき動きの検索・補償を行うために参照される既再生の画像を、参照画像という。
 また、双方向画面間予測では、表示時間順において対象画像の前に表示される過去の画像だけではなくて、対象画像の後に表示される未来の画像も併せて参照する場合がある(ただし、未来の画像は対象画像よりも先に符号化し、予め再生しておく必要がある)。そして、過去の画像から取得された予測信号と未来の画像から取得された予測信号の両方を平均化することによって、隠されていて新たに現れる物体の信号の予測に有効であるとともに、両方の予測信号に含まれている雑音を軽減する効果がある。
 さらに、H.264の画面間予測符号化では、対象ブロックに対する予測信号は、過去に符号化して再生された複数の参照画像を参照し、動き検索しながら誤差の最も少ない画像信号を最適な予測信号として選択する。そして、対象ブロックの画素信号とこの最適な予測信号との差分を求め、差分に対し離散コサイン変換を施し量子化した上でエントロピー符号化する。同時に、対象ブロックに対する最適な予測信号をどの参照画像から取得するかに関する情報(参照インデックス)及び最適な予測信号を参照画像内のどの領域から取得するかに関する情報(動きベクトル)も併せて符号化する。H.264では、再生された4ないし5枚の画像が参照画像としてフレームメモリに格納される。なお、本明細書ではフレームメモリには、いわゆる再生画像バッファ(decoded picture buffer)を含むものとする。
 画面間予測符号化は、画像間の相関を活かして効率よく圧縮符号化することができるものの、テレビのチャンネルの切り替えで映像番組を途中から視聴できるようにするためには、画面間の依存性を断ち切る必要がある。動画像の圧縮ビットストリームの中で、画面間の依存性のない箇所を、以下「ランダムアクセスポイント」という。チャンネルの切り替えの他に、動画像を編集する場合及び異なる動画像の圧縮データをつなぐ場合にも、ランダムアクセスポイントは必要となる。H.264ではIDRピクチャを指定し、指定されたIDRピクチャを上述の画面内予測符号化方法で符号化すると同時に、フレームメモリ内に格納されている再生画像を不要と設定して、当該再生画像を参照不可とすることで実質的にフレームメモリを開放する(リフレッシュする)。このような処理は「メモリ・リフレッシュ」と呼ばれ、また場合によっては「フレーム・メモリ・リフレッシュ」又は「バッファ・リフレッシュ」とも呼ばれる。
 図11(A)は、IDRピクチャを含む動画像の予測構造を示す模式図である。この図11(A)に示す複数の画像901、902、…、909は、動画像を構成する画像群の一部であり、各画像を「ピクチャ」又は「フレーム」ともいう。各矢印は予測の方向を示す。例えば、画像902は、画像902に向かう2つの矢印の起点である画像903、905を参照画像として予測信号を取得する。なお、図11(A)の画像901は、図11(A)に示されていない過去の画像を参照して符号化されるものとする。次に画像902,903,904を符号化するが、その際、圧縮率を高めるために上述の双方向予測符号化方法を用いる。即ち、先に画像905を符号化・再生して、次に、既に再生された画像901と905を参照して画像903を符号化する(図11(A)では画像901からの矢印は省略している)。そして、画像902、904の各々は、再生された3つの画像901、905、903を参照画像として符号化する(図11(A)では画像901からの矢印は省略している)。同じように画像906、907、908は画像905と909を参照して符号化する。そして、このようにして符号化(圧縮)された各画像の圧縮データは、図11(B)のような順序で伝送もしくは蓄積される。図11(B)の圧縮データと図11(A)の画像とは、P1、IDR5、B3などの共通の符号によって対応関係を示している。例えば、圧縮データ910は、同じ符号P1を付した画像901の圧縮データであり、圧縮データ911は、同じ符号IDR5を付した画像905の圧縮データである。
 さて、ランダムアクセスを考慮して、画像905をIDRピクチャに指定して画面内予測符号化を行う場合を考える。この場合、H.264におけるIDRのルールによれば、圧縮データ911を復号することで画像905を再生した直後に(又は圧縮データ911の復号を開始する直前でもよいが)、フレームメモリに格納されている全ての参照画像(即ち、画像901を含む過去の再生画像)を不要と設定し参照不可にしなければならない。その結果、図11(A)の画像901は参照不可になり、画像902、903、904の符号化では、画像901からの参照ができなくなる。このようなIDRピクチャに係る処理は、例えば下記の非特許文献1に記述されている。
国際公開公報WO2005/006763A1
Iain E.G. Richardson, "H.264 and MPEG-4 Video Compression", John Wiley & Sons, 2003, section6.4.2.
 IDRピクチャの導入によって、上述の予測に用いられる参照画像が制限されるため、画像の表示順においてIDRピクチャよりも前にある画像(図11(A)の画像902、903、904)を効率よく符号化することができなくなる。この点を解決するために上記特許文献1には、フレームメモリのリフレッシュのタイミング(即ち、フレームメモリ内の参照画像を不要と設定するタイミング)を、IDRピクチャよりも後に符号化される画像の符号化実行時まで遅延させる方法が開示されている。フレームメモリのリフレッシュのタイミングを遅延させることにより、図11(A)の画像902、903、904の符号化実行時に画像901がフレームメモリに残っているため、画像902、903、904の符号化において画像901を参照できるようになり、効率よく符号化することができる。
 特許文献1によれば、メモリ・リフレッシュのタイミングを遅延させる方法として、以下の方法が開示されている。
方法1:IDRピクチャに、遅延させる画像の枚数に関する情報を付加する。
方法2:メモリ・リフレッシュを実施するタイミングに対応する画像の圧縮データに、メモリ・リフレッシュの実行を指示する信号(フラグ)を付加する。
方法3:IDRピクチャの後に現れる最初のPピクチャ(片方向予測画像)をリフレッシュのタイミングとする。
 ところが、上記の方法は下記の欠点がある。
欠点1:上記の方法1では、動画像を編集する際に、複数の画像のうち一部の画像を捨てて別の画像をつないだり、別の画像を挿入したりすることが行われるため、IDRピクチャに付加されていた「遅延させる画像の枚数に関する情報」が適切でなくなり、誤動作を招くという不都合がある。
欠点2:上記の方法2では、同様にフラグを用いる場合でも、動画像の編集によって、対応する画像の圧縮データが削除されると、削除された圧縮データに付加されていたフラグがなくなり、誤動作を招くという不都合がある。
欠点3:上記の方法3では、メモリ・リフレッシュの合図(タイミング)はPピクチャに限定されてしまうため、他の方法で符号化できなくなるという不都合がある。例えば、シーンの変わり目に、画面内予測(Iピクチャ)として符号化することができなくなる。
 なお、ここでの「誤動作」とは、メモリ・リフレッシュが適切なタイミングで行われないことに起因し、後続のデータを復号する際に必要となる参照画像がフレームメモリに格納されていない状態となり、その結果、後続の画像が正しく再生できなくなることを意味する。
 本発明は、上記の課題を解決し、ランダムアクセスの箇所となる画像の前後にある画像を効率よく圧縮符号化すると同時に、従来技術の欠点に係る不都合を解消することを目的とする。
 上記目的を達成するために、本発明の一実施形態に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化手段と、生成された前記圧縮画像データを復号することで再生画像を復元する復元手段と、復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として格納する画像格納手段と、前記画像格納手段を制御するメモリ管理手段と、を具備し、前記メモリ管理手段は、前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、ことを特徴とする。
 上記の符号化手段は、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像、を含む1つ以上の符号化対象画像の表示順番情報に関するデータとして、前記符号化対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化してもよい。
 また、上記の符号化手段は、ランダムアクセス画像の次に符号化対象となる画像から、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、の各画像については、各画像の表示順番情報に関するデータとして、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化してもよい。
 本発明の一実施形態に係る動画像予測復号装置は、動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力手段と、前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元手段と、復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として格納する画像格納手段と、前記画像格納手段を制御するメモリ管理手段と、を具備し、前記メモリ管理手段は、前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュすることを特徴とする。
 上記の復元手段は、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を復号する復号処理の完了後に最初に復号対象となる画像、を含む1つ以上の復号対象画像の表示順番情報については、当該復号対象画像の表示順番符号化データを復号して得られた、当該復号対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、前記ランダムアクセス画像の表示順番情報とを、加算することで、当該復号対象画像の表示順番情報を復元してもよい。
 また、上記の復元手段は、ランダムアクセス画像の次に符号化対象となる画像から、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、の各画像についての表示順番情報については、当該各画像の表示順番符号化データを復号して得られた、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、前記ランダムアクセス画像の表示順番情報とを、加算することで、当該各画像の表示順番情報を復元してもよい。
 本発明の一実施形態に係る動画像予測符号化方法は、後続の画像を符号化するために用いられる参照画像を格納するための画像格納手段を備える動画像予測符号化装置、により実行される動画像予測符号化方法であって、動画像を構成する複数の画像を入力する入力ステップと、入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化ステップと、生成された前記圧縮画像データを復号することで再生画像を復元する復元ステップと、復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として前記画像格納手段に格納する画像格納ステップと、前記画像格納手段を制御するメモリ管理ステップと、を具備し、前記メモリ管理ステップにおいて前記動画像予測符号化装置は、前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュすることを特徴とする。
 上記の符号化ステップにおいて前記動画像予測符号化装置は、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像、を含む1つ以上の符号化対象画像の表示順番情報に関するデータとして、前記符号化対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化してもよい。
 また、上記の符号化ステップにおいて前記動画像予測符号化装置は、ランダムアクセス画像の次に符号化対象となる画像から、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、の各画像については、各画像の表示順番情報に関するデータとして、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化してもよい。
 本発明の一実施形態に係る動画像予測復号方法は、後続の画像を復号するために用いられる参照画像を格納するための画像格納手段を備える動画像予測復号装置、により実行される動画像予測復号方法であって、動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力ステップと、前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元ステップと、復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として前記画像格納手段に格納する画像格納ステップと、前記画像格納手段を制御するメモリ管理ステップと、を具備し、前記メモリ管理ステップにおいて前記動画像予測復号装置は、前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュすることを特徴とする。
 上記の復元ステップにおいて前記動画像予測復号装置は、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を復号する復号処理の完了後に最初に復号対象となる画像、を含む1つ以上の復号対象画像の表示順番情報については、当該復号対象画像の表示順番符号化データを復号して得られた、当該復号対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、前記ランダムアクセス画像の表示順番情報とを、加算することで、当該復号対象画像の表示順番情報を復元してもよい。
 また、上記の復元ステップにおいて前記動画像予測復号装置は、ランダムアクセス画像の次に符号化対象となる画像から、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、の各画像についての表示順番情報については、当該各画像の表示順番符号化データを復号して得られた、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、前記ランダムアクセス画像の表示順番情報とを、加算することで、当該各画像の表示順番情報を復元してもよい。
 本発明の一実施形態に係る動画像予測符号化プログラムは、コンピュータを、動画像を構成する複数の画像を入力する入力手段と、入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化手段と、生成された前記圧縮画像データを復号することで再生画像を復元する復元手段と、復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として格納する画像格納手段と、前記画像格納手段を制御するメモリ管理手段、として動作させ、前記メモリ管理手段は、前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュすることを特徴とする。
 本発明の一実施形態に係る動画像予測復号プログラムは、コンピュータを、動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力手段と、前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元手段と、復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として格納する画像格納手段と、前記画像格納手段を制御するメモリ管理手段、として動作させ、前記メモリ管理手段は、前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュすることを特徴とする。
 以上のような本発明により、ランダムアクセスの箇所となる画像の前後にある画像を効率よく圧縮符号化すると同時に、従来技術の欠点に係る不都合を解消する。
 本発明では、動画像を構成する各画像又は圧縮符号化された画像データに付随される表示順番を示す情報(以下「表示順番情報」という(従来技術における表示時間、時間参照情報、テンポラルリファレンスなどに相当))を利用して、ランダムアクセスの箇所となる画面内予測画像(イントラフレーム)より後に行われるメモリ・リフレッシュのタイミングを設定することにより、表示順番においてランダムアクセス画像の前後にある複数の画像を効率よく圧縮符号化すると同時に、従来技術の欠点に係る不都合を以下のように解消することができる。
 即ち、表示順番情報は、各画像には必ず付随するものであるため、新たな情報(フラグ)を送る必要がなく、従来技術の欠点2は解消される。
 また、動画像の編集(例えば一部の画像を捨てる、別の画像をつなぐ等)を行う場合でも、動画像を構成する各画像の表示順番情報は適切に設定されるため、誤動作を引き起こすことはなく、従来技術の欠点1は解消される。
 さらに、本発明によるメモリ・リフレッシュのタイミングは、Pピクチャに限定されず、画像の符号化タイプ(Iピクチャ、Pピクチャ、Bピクチャ)に依存しないため、メモリのリフレッシュの要否にかかわらず符号化効率の最もよい符号化タイプで処理することができ、従来技術の欠点3は解消される。
本発明の実施形態に係る動画像予測符号化装置の構成を示す機能ブロック図である。 本発明の実施形態に係る動画像予測復号装置の構成を示す機能ブロック図である。 本発明の実施形態に係る動画像予測符号化・復号方法を示す流れ図である。 本発明の実施形態に係る動画像予測符号化・復号方法を説明するための模式図である。 本発明の実施形態の変形例に係る動画像予測符号化・復号方法を示す流れ図である。 本発明の実施形態の変形例に係る動画像予測符号化・復号方法を説明するための模式図である。 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である。 記録媒体に記憶されたプログラムを実行するためのコンピュータの概観図である。 動画像予測符号化プログラムの構成例を示すブロック図である。 動画像予測復号プログラムの構成例を示すブロック図である。 従来の動画像予測符号化・復号方法の予測構造を示す模式図である。
 以下、本発明の実施形態について、図1~図10を用いて説明する。
 [動画像予測符号化装置について]
 図1は本発明の実施形態に係る動画像予測符号化装置100の構成を示す機能ブロック図である。図1に示すように、動画像予測符号化装置100は、機能的な構成として、入力端子101、ブロック分割器102、予測信号生成器103、フレームメモリ104、減算器105、変換器106、量子化器107、逆量子化器108、逆変換器109、加算器110、エントロピー符号化器111、出力端子112、入力端子113、及びフレームメモリ管理器114を備える。各機能ブロックの動作は、後述する動画像予測符号化装置100の動作の中で説明する。
 以下、動画像予測符号化装置100の動作を述べる。符号化処理の対象となる複数枚の画像から成る動画像の信号は入力端子101に入力され、各画像はブロック分割器102により、複数の領域に分割される。本実施形態では、各画像は、8×8の画素から成る複数のブロックに分割されるが、これ以外のブロックの大きさ又はブロック形状に分割してもよい。次に、符号化処理の対象となるブロック(以下「対象ブロック」と呼ぶ)を対象として、後述の予測方法により予測信号を生成する。本実施形態では、予測方法として、画面間予測と画面内予測の2種類の予測方法が利用可能とされており、画面間予測では背景技術で述べた双方向画面間予測も利用可能とされている。以下、画面間予測と画面内予測の各々の基本動作を概説する。
 画面間予測では、過去に符号化された後に復元された再生画像を参照画像として用いて、この参照画像から、対象ブロックに対する誤差の最も小さい予測信号を与える動き情報(例えば動きベクトル)を求める。この処理は「動き検出」と呼ばれる。また、場合に応じて、対象ブロックを再分割し、再分割された小領域を対象として画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい、小領域の分割方法及び各小領域の動き情報を決定する。本実施形態では、画面間予測は、予測信号生成器103により行われ、対象ブロックはラインL102経由で、参照画像はラインL104経由で、それぞれ予測信号生成器103に入力される。参照画像としては、過去に符号化され復元された複数の画像を参照画像として用いる。その詳細は従来の技術であるMPEG-2、MPEG-4、H.264のいずれかの方法と同じである。決定された小領域の分割方法情報及び各小領域の動き情報は、予測信号生成器103からラインL112経由でエントロピー符号化器111に送られ、エントロピー符号化器111により符号化された上で、その符号化データはラインL111経由で出力端子112から送出される。また、複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンスインデックス)も、予測信号生成器103からラインL112経由でエントロピー符号化器111に送られ、エントロピー符号化器111により符号化された上で、その符号化データはラインL111経由で出力端子112から送出される。なお、本実施形態では、一例として、4枚ないし5枚の再生画像がフレームメモリ104に格納され、参照画像として用いられる。予測信号生成器103は、小領域の分割方法、及び各小領域についての参照画像と動き情報に基づいて、フレームメモリ104から参照画像を取得し、参照画像及び動き情報から予測信号(画面間予測により得られた予測信号という意味で「画面間予測信号」という)を生成する。このように生成された画面間予測信号は、ラインL103経由で減算器105及び後述の処理に係る加算器110に送られる。
 一方、画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には、予測信号生成器103は、同じ画面内にある既再生の画素信号をフレームメモリ104から取得し、既再生の画素信号を外挿することによって予測信号(画面内予測により得られた予測信号という意味で「画面内予測信号」という)を生成する。生成された画面内予測信号は、予測信号生成器103からラインL103経由で減算器105に送られる。予測信号生成器103における画面内予測信号の生成方法は、従来の技術であるH.264の方法と同じである。なお、画面内予測における外挿の方法に関する情報は、予測信号生成器103からラインL112経由でエントロピー符号化器111に送られ、エントロピー符号化器111により符号化された上で、符号化データは出力端子112から送出される。
 以上、画面間予測と画面内予測の各々の基本動作を概説した。実際には、対象ブロックごとに、上述のように求められた画面間予測信号と画面内予測信号のうち、誤差の最も小さいものが選択され、予測信号生成器103からラインL103経由で減算器105に送られる。
 ところで、符号化される一枚目の画像については、それより前に画像がないため、当該一枚目の画像内の全ての対象ブロックは画面内予測で処理される。また、テレビのチャンネルの切り替えに備えて、ランダムアクセスポイントとして、ある画像内の全ての対象ブロックを画面内予測で定期的に処理する。このような画像はイントラフレームとよび、H.264ではIDRピクチャと呼ぶ。
 減算器105は、ラインL102経由で受け取った対象ブロックの信号から、ラインL103経由で受け取った予測信号を引き算することで、残差信号を生成する。この残差信号は変換器106にて離散コサイン変換され、その各変換係数は量子化器107にて量子化される。最後に、量子化された変換係数はエントロピー符号化器111により符号化され、得られた符号化データは、予測方法に関する情報とともにラインL111経由で出力端子112より送出される。
 一方、後続の対象ブロックに対して画面内予測もしくは画面間予測を行うために、上記量子化された変換係数(対象ブロックの符号化データ)は、逆量子化器108にて逆量子化された後に逆変換器109にて逆離散コサイン変換され、これにより残差信号が復元される。そして、加算器110により、復元された残差信号とラインL103から送られた予測信号とが加算され、これにより対象ブロックの信号が再生され、得られた再生信号はフレームメモリ104に格納される。なお、本実施形態では変換器106と逆変換器109を用いているが、これらに代わる他の変換処理を用いてもよい。また、場合によっては、変換器106と逆変換器109がなくてもよい。
 ところで、フレームメモリ104は有限なものであり、すべての再生画像を格納することは実際には不可能である。そのため、後続の画像の符号化に用いられる再生画像のみがフレームメモリ104に格納される。このフレームメモリ104を制御するのがフレームメモリ管理器114である。フレームメモリ管理器114は、フレームメモリ104に格納されているN枚(例えばN=4)の再生画像の中から、最も古い再生画像を消去することで、参照画像として用いられる直近の再生画像をフレームメモリ104に格納できるように制御する。実際にフレームメモリ管理器114には、入力端子113より各画像の表示順番情報及び画像を符号化するタイプ情報(画面内予測符号化、画面間予測符号化、双方向予測符号化)が入力され、これらの情報に基づいてフレームメモリ管理器114が動作する。このとき、各画像の表示順番情報は、フレームメモリ管理器114からラインL114経由でエントロピー符号化器111に送られ、エントロピー符号化器111により符号化され、この符号化された表示順番情報は、符号化された画像データとともに、ラインL111経由で出力端子112より送出される。なお、表示順番情報は、各画像に付随するものであり、画像の順番を示す情報や、画像を表示する時刻を示す情報(例えば画像の表示参照時間(テンポラルリファレンス))でもいい。本実施形態では、例えば、表示順番情報をそのまま二値符号化により符号化する。また、フレームメモリ管理器114による制御方法については後述する。
 [動画像予測復号装置について]
 次に、本発明に係る動画像予測復号装置について説明する。図2は本発明の実施形態に係る動画像予測復号装置200の構成を示す機能ブロック図である。図2に示すように、動画像予測復号装置200は、機能的な構成として、入力端子201、データ解析器202、逆量子化器203、逆変換器204、加算器205、予測信号生成器208、フレームメモリ207、出力端子206、及びフレームメモリ管理器209を備える。各機能ブロックの動作は、後述する動画像予測復号装置200の動作の中で説明する。なお、復号に係る手段としては、逆量子化器203及び逆変換器204に限定されるものではなく、これら以外のものを用いてもよい。また、復号に係る手段は、逆変換器204を無くし逆量子化器203のみで構成してもよい。
 以下、動画像予測復号装置200の動作を述べる。上述した符号化方法で得られた圧縮データは入力端子201から入力される。この圧縮データには、対象ブロックの残差信号と、予測信号の生成に関する情報と、量子化パラメータと、画像の表示順番情報と、画像の符号化タイプに関する情報とが含まれている。このうち、予測信号の生成に関する情報としては、例えば画面間予測の場合は、ブロック分割に関する情報(小領域の分割方法情報(例えばブロックのサイズ等))、各小領域の動き情報、及びリファレンスインデックスが含まれ、画面内予測の場合は外挿の方法に関する情報が含まれている。
 データ解析器202は、入力された圧縮データから、対象ブロックの残差信号、予測信号の生成に関連する情報、量子化パラメータ、画像の表示順番情報、及び画像の符号化タイプに関する情報を抽出する。これらのうち、対象ブロックの残差信号及び量子化パラメータは、ラインL202経由で逆量子化器203に送られ、逆量子化器203は量子化パラメータをもとに対象ブロックの残差信号を逆量子化し、さらに、逆変換器204は逆量子化の結果を逆離散コサイン変換する。このようにして復元された残差信号はラインL204経由で加算器205に送られる。
 一方、抽出された予測信号の生成に関する情報は、ラインL206b経由で予測信号生成器208に送られる。予測信号生成器208は、予測信号の生成に関する情報をもとに、フレームメモリ207内の複数の参照画像から適当な参照画像を取得し、当該適当な参照画像をもとに予測信号を生成する。生成された予測信号は、ラインL208経由で加算器205に送られ、加算器205により上記復元された残差信号に加算され、その結果、対象ブロックの信号が再生される。再生された対象ブロックの信号は、ラインL205経由で出力端子206から出力されると同時に、再生画像としてフレームメモリ207に格納される。
 フレームメモリ207には、後続の画像の復号や再生に用いられる再生画像が格納されている。フレームメモリ管理器209は、フレームメモリ207に格納されているN枚(ここでは一例としてN=4であるが、予め決められた整数でもよい)の再生画像から最も古い再生画像を消去することで、参照画像として用いられる直近の再生画像をフレームメモリ207に格納できるように制御する。このフレームメモリ管理器209は、ラインL206a経由で入力される対象画像の表示順番情報と画像の符号化タイプに関する情報に基づいて動作する。フレームメモリ管理器209による制御方法については、後述する。
 なお、ランダムアクセスポイントとなるイントラフレーム(画面内予測画像)について、H.264ではIDRピクチャ(instantaneous decoder refresh)と呼ばれているが、この名称は、IDRピクチャを符号化もしくは復号した後すぐに(instantaneous)フレームメモリ(decoder buffer)をリフレッシュすることに由来している。これに対し、本発明によれば、ランダムアクセスポイントとなるイントラフレームを符号化又は復号した後すぐに(又は符号化もしくは復号する直前に)、フレームメモリのリフレッシュを実行するのではなく、一時的に待機(もしくは遅延)させた上でフレームメモリのリフレッシュを実行するため、本発明ではこの画像をDDRピクチャ(deferred decoder refresh又はdelayed decoder refresh)と呼ぶ。以下に詳しく説明するように、フレームメモリのリフレッシュのタイミングは、DDRピクチャの表示順番情報と、処理(符号化又は復号)の対象となる画像(以下「処理対象画像」という)の表示順番情報とを比較することで決定する。
 [動画像予測符号化方法及び動画像予測復号方法の特徴的な処理動作]
 次に図3と図4を用いて、本発明による動画像予測符号化方法及び動画像予測復号方法の動作を説明する。図3は本実施形態に係る動画像予測符号化・復号方法を示す流れ図であり、以下では、図3を動画像の符号化方法として説明する。ただし、図3は動画像の復号方法にも適用可能である。
 まず、図3に用いられる変数の意味を説明する。TRは表示順番情報、TR_DDRはDDR画像の表示順番情報、TR_CURは当該時点の処理対象画像の表示順番情報、RPはフレームメモリ104のリフレッシュが待機中かどうかを示す状態変数である。RP=1の場合は、DDRピクチャが処理対象となり、その後、フレームメモリ104のリフレッシュがまだ実行されていない状態(即ち、フレームメモリ・リフレッシュが待機中の状態)を示しており、RP=0の場合は、フレームメモリ104のリフレッシュが既に実行済みの状態又はリフレッシュ処理を必要としない状態を示す。
 図3において、動画像の符号化が開始するときに、まず、TR_DDRとRPを0に初期化する(ステップ301)。ステップ302では、RP=1であり且つTR_CURがTR_DDRより大きいかどうかを確認する。この条件が満たされると、フレームメモリ・リフレッシュが待機中であり且つ処理対象の画像が表示順番においてDDRピクチャよりも後の画像であることを意味するので、フレームメモリ104のリフレッシュ処理(即ち、フレームメモリ104に格納されている参照画像を不要と設定する処理)を実行する(ステップ303)。ただし、ここで、不要と設定する参照画像は、表示順番情報TRが直近のDDRピクチャの表示順番情報(TR_DDR)よりも小さい参照画像のみである。また、直近のDDRピクチャ(又は画面内予測符号化画像)は、不要と設定しない。以上のようなリフレッシュ処理が終わったことで、状態変数RPをRP=0に設定する。
 一方、ステップ302で上記の条件が満たされない場合は、ステップ304に進み、当該時点の処理対象画像がDDRピクチャであるかどうかを確認する。なお、動画像予測符号化装置100では、画像の符号化タイプ(DDR、画面間予測符号化又は双方向予測符号化)に関する情報は、図1の入力端子113経由で、図示しない制御装置から与えられるものとする。ステップ304で、当該時点の処理対象画像がDDRピクチャである場合は、ステップ305にて当該時点の処理対象画像の表示順番情報TR_CURをTR_DDRに設定し、状態変数RPをRP=1と設定した上でステップ306に進む。一方、ステップ304で条件が満たされない場合はステップ306に進む。
 ステップ306では、処理対象画像に相当する再生画像を得る。ここでは、図1で説明した符号化方法で、処理対象画像を符号化して圧縮データを得て、さらに圧縮データを復号して再生画像(処理対象画像に相当する再生画像)を得る。なお、符号化により得られた圧縮データは、動画像予測符号化装置100の外部へ送出される。又は、圧縮データは動画像予測符号化装置100内の図示しないメモリに蓄積してもよい。次のステップ307では、処理対象画像に相当する再生画像が後続の処理で参照画像として用いられるかどうかを判断する。この判断は、当該画像の符号化タイプに基づいて行われる。なお、本実施形態では、DDRピクチャ、片方向予測符号化画像、及び特定の双方向予測符号化画像はすべて参照画像とする。ただし、この方法に限るものではない。
 ステップ307で再生画像が参照画像として用いられないと判断された場合は、再生画像をフレームメモリ104に格納せずにステップ309に進む。一方、ステップ307で再生画像が参照画像として用いられると判断された場合は、ステップ308にて、再生画像をフレームメモリ104に格納した上で、ステップ309に進む。
 ステップ309では次の画像(未処理の画像)があるか否かを判断し、次の画像があれば、ステップ302へ戻り、次の画像に対しステップ302~308の処理を繰り返す。このようにして最後の画像までステップ302~308の処理を繰り返し、全ての画像の処理が完了すると、図3の処理を終了する。
 上述した図3の処理により、ランダムアクセス画像(ここでは直近のDDRピクチャ)の処理が完了した後、最初に、表示順番情報TRがTR_DDRより大きい画像を処理するときに(実際にはステップ306の処理の直前のステップ303において)、フレームメモリがリフレッシュされる。なお、フレームメモリのリフレッシュのタイミングは、ランダムアクセス画像(ここでは直近のDDRピクチャ)の処理が完了した後、最初に、表示順番情報TRがTR_DDRより大きい画像を処理するときであればよく、ステップ306の処理の直後であってもよい。
 上述した図3の処理は、図1の動画像予測符号化装置100全体の処理に該当するが、とりわけステップ302~305の処理はフレームメモリ管理器114により行われる。
 なお、図3は、動画像の符号化方法として説明したが、動画像復号方法の処理にも適用できる。復号処理を行う場合、ステップ301では、さらに、圧縮符号化された画像のデータ(ビットストリーム)が入力される。当該データから対象画像の表示順番情報や符号化タイプを抽出して、上述と同じ方法でステップ302~305の制御を行う。ステップ306では対象画像の圧縮されたデータを復号し、画像を復元する処理を行う。ステップ307以降の処理は、上述したとおりである。このような処理は、図2の動画像予測復号装置200全体の処理に該当するが、とりわけステップ302~305の処理はフレームメモリ管理器209により行われる。
 図4は、本実施形態に係る動画像予測符号化・復号方法の処理を説明するための模式図である。図4に示す画像401~409は、動画像を構成する画像群の一部であり、画像401はn枚の画像に先行されている様子を示す。したがって、図4の領域418に示すように画像401の表示順番情報TRは(n+1)と表す。また、本実施形態では双方向予測を含む符号化・復号処理を行うため、TR=(n+5)の画像402を先に処理した後に、表示順では画像402よりも先行する画像403、404、405を処理する様子を示している。同様の理由で、表示順が(n+3)の画像403は、表示順が(n+2)の画像404よりも先に処理される。このような順番は図11(B)と同じである。なお、以降で「画像を処理する」とは「画像を符号化又は復号する」ことを意味する。
 図4の画像401~409の枠内に書かれている英文字は、以下を意味する。即ち、Pは片方向予測で符号化される画像、DDRはDDRピクチャとして符号化される画像、Bとbは双方向予測で符号化される画像を、それぞれ意味する。また、小文字bで示されている画像以外(即ち、大文字B、P、DDRで示されている画像)は、全て参照画像として用いられるものとする。図4の領域420に示す各画像に対するRPの値、及び領域419に示すTR_DDRの値は、各画像に対する処理が完了した直後の値であり、各画像に対する処理の開始時(即ち、図3のステップ302に入るとき)の値ではない。例えば、画像402に対する処理の開始時にRP=0であるが、画像402に対する処理の完了直後にはRP=1となる。
 画像401の処理では、画像401がDDRピクチャではないので、RP=0となる。画像401に対応するTR_DDRは任意の値をとってもよいが、先行の処理によって格納されている値が設定されている。また、大文字P1で示される画像401は参照画像として用いるので、フレームメモリに格納される。
 続いて、図3を参照しながら画像402の処理を説明する。このとき、図4の最下段における領域410に示すように、フレームメモリには、再生された画像P1が格納されている。画像402の処理開始時点ではRP=0であるため、ステップ302で否定判定され、ステップ304に進む。画像402はDDRピクチャであるため、ステップ304で肯定判定され、ステップ305にてRP=1、TR_DDR=n+5と設定される。また、画像402は、参照画像として用いられるのでフレームメモリに格納される。
 次に画像403の処理が開始する時点では、図4の領域411に示すように、フレームメモリには画像P1とDDR5が格納されている。このときRP=1であるが、画像403の表示順番TR(n+3)はTR_DDR(n+5)よりも小さく且つ画像403はDDRピクチャではないので、ステップ302、304で否定判定され、そのままで符号化又は復号される(ステップ306)。また、画像403は、参照画像として用いられるため、フレームメモリに格納される。
 画像404と405を処理する際も同じようにフレームメモリのリフレッシュは待機状態(RP=1)のままである。また画像404と405は参照画像として用いられないため、図4の領域412、413に示すようにフレームメモリには、画像404と405は格納されず、画像P1、DDR5、B3が格納されている。
 画像406の処理が開始する時点ではRP=1であるが、画像406の表示順番情報TR(n+9)はTR_DDR(n+5)よりも大きいので、ステップ302で肯定判定され、ステップ303にて参照画像を不要と設定することでフレームメモリをリフレッシュし、RP=0と設定する。このとき不要と設定する参照画像は、直近のDDRピクチャ402を除く、直近のDDRピクチャ402よりも表示順番情報TRが小さい参照画像のみである。したがって、図4の領域414に示すように、フレームメモリでは、画像P1と画像B3の記憶領域が開放され、画像DDR5のみが格納されることになる。画像406は、図4の領域415に示すように、当該画像406の処理が完了した後にフレームメモリに格納され、それ以降は、上記と同様にフレームメモリのリフレッシュ制御が行われる。
 このように、DDRピクチャ402の処理直後もしくは直前では、フレームメモリにある参照画像(図4では画像P1)を不要と設定しないため、DDRピクチャ402の後に処理される画像403、404,405の処理において画像P1を参照することができ、そのため符号化効率の向上に寄与することができる。また、DDRピクチャ402の処理の後にフレームメモリ・リフレッシュを実行する際に、直近のDDRピクチャ402(画像DDR5)を不要と設定しないため、後続の画像407、408、409の処理において直近のDDRピクチャ402(画像DDR5)を参照画像として用いることができる。
 このように本実施形態は、画像に付随する表示順番情報を利用して、ランダムアクセスの箇所となる画面内予測画像(DDRピクチャ)の処理の後に行われるメモリ・リフレッシュのタイミングを表示順番情報によって設定することにより、ランダムアクセス画像の前後にある画像を効率よく圧縮符号化することができる。また、従来技術の欠点に係る不都合を以下のように解消することができる。
 即ち、表示順番情報は、各画像には必ず付随するものであるため、新たな情報(フラグ)を送る必要がなく、従来技術の欠点2は解消される。また、動画像の編集(例えば一部の画像を捨てる、別の画像をつなぐ等)を行う場合でも、動画像を構成する各画像の表示順番情報は適切に設定されるため、誤動作を引き起こすことはなく、従来技術の欠点1は解消される。さらに、本発明によるメモリ・リフレッシュのタイミングは、Pピクチャに限定されず、画像の符号化タイプ(Iピクチャ、Pピクチャ、Bピクチャ)に依存しないため、メモリのリフレッシュの要否にかかわらず符号化効率の最もよい符号化タイプで処理することができ、従来技術の欠点3は解消される。
 [変形例について]
 上述した実施形態では、画像の表示順番情報が「絶対値」として符号化される場合の処理を説明したが、符号化効率を高めるために、画像の表示順番情報が「差分値」として符号化される実施形態もある。以下では、変形例として、表示順番情報が「差分値」として符号化される実施形態を説明する。
 図5は、動画像予測符号化・復号方法の変形例の流れ図を示す。変形例では、画像の表示順番情報は、次のように符号化される。即ち、フレームメモリのリフレッシュの待機中に処理対象となった画像については、その表示順番情報とDDRピクチャの表示順番情報との差分値を符号化する。一方、上記以外の画像については、その表示順番情報を任意の方法で符号化する。例えば、DDRピクチャの表示順番情報との差分を符号化してもいいし、符号化順において直前の画像の表示順番情報との差分を符号化してもよい。
 以下の変形例では、図5を動画像の復号方法として説明するが、もちろん、図5は動画像の符号化方法にも適用可能である。図5のステップ501では、動画像予測復号装置200に、圧縮符号化された画像のデータが入力され、当該データから対象画像の表示順番情報の差分値(delta_TR)及び画像の符号化タイプに関する情報を抽出する。同時に、TR_DDRとRPを0に初期化する。
 次のステップ502では、RP=1であるかどうか確認する。この条件が満たされると、フレームメモリ・リフレッシュが待機中であることを意味するので、ステップ503に進む。ステップ503では、当該時点の処理対象画像の表示順番情報TR_CURを、TR_DDRとdelta_TRとの和(加算した値)に設定する。
 次に、ステップ504にてTR_CURがTR_DDRより大きいかどうか確認する。この条件が満たされると、フレームメモリ・リフレッシュ待機中であり且つ処理対象の画像が表示順番においてDDRピクチャよりも後の画像であることを意味するので、フレームメモリ207のリフレッシュ処理(即ち、フレームメモリ207に格納されている参照画像を不要と設定する処理)を実行する(ステップ505)。ただし、ここで、不要と設定する参照画像は、表示順番情報TRが直近のDDRピクチャの表示順番情報(TR_DDR)よりも小さい参照画像のみである。また、直近のDDRピクチャ(又は画面内予測符号化画像)は、不要と設定しない。以上のようなリフレッシュ処理が終わったことで、状態変数RPをRP=0に設定する。その後、後述するステップ507に進む。また、前述したステップ504で否定判定された場合もステップ507に進む。
 一方、ステップ502で否定判定された場合はステップ506に進み、TR_CURを、前に処理された画像の表示順番情報TR_PREVとdelta_TRとの和(加算した値)に設定して、ステップ507に進む。
 ステップ507では、当該時点の処理対象画像がDDRピクチャであるかどうかを確認する。なお、動画像予測復号装置200は、画像の符号化タイプ(DDR、画面間予測符号化又は双方向予測符号化)に関する情報を、外部から入力された圧縮符号化データから得ることができる。
 ステップ507で、当該時点の処理対象画像がDDRピクチャである場合は、ステップ508にて当該時点の処理対象画像の表示順番情報TR_CURをTR_DDRに設定し、状態変数RPをRP=1と設定した上でステップ509に進む。一方、ステップ507で条件が満たされない場合はステップ509に進む。
 ステップ509では、処理対象画像に相当する再生画像を得る。ここでは、図2で説明した復号方法で、処理対象画像の圧縮データを復号することで、処理対象画像に相当する再生画像を得る。なお、ここで得られた再生画像は、例えば、動画像予測復号装置200の外部へ送出される。次のステップ510では、処理対象画像に相当する再生画像が後続の処理で参照画像として用いられるかどうかを判断する。この判断は、当該画像の符号化タイプに基づいて行われる。なお、ここでは、DDRピクチャ、片方向予測符号化画像、及び特定の双方向予測符号化画像はすべて参照画像とする。ただし、この方法に限るものではない。
 ステップ510で再生画像が参照画像として用いられないと判断された場合は、再生画像をフレームメモリ207に格納せずにステップ512に進む。一方、ステップ510で再生画像が参照画像として用いられると判断された場合は、ステップ511にて、再生画像をフレームメモリ207に格納した上で、ステップ512に進む。
 ステップ512では、後続のステップ506の処理のために、TR_CURをTR_PREVに設定し、ステップ513に進む。ステップ513では次の画像(未処理の画像)があるか否かを判断し、次の画像があれば、ステップ502へ戻り、次の画像に対しステップ502~512の処理を繰り返す。このようにして最後の画像までステップ502~512の処理を繰り返し、全ての画像の処理が完了すると、図5の処理を終了する。
 上述した図5の処理により、ランダムアクセス画像(ここでは直近のDDRピクチャ)の処理が完了した後、最初に、表示順番情報TRがTR_DDRより大きい画像を処理するときに(実際にはステップ509の処理の直前のステップ505において)、フレームメモリがリフレッシュされる。なお、フレームメモリのリフレッシュのタイミングは、ランダムアクセス画像(ここでは直近のDDRピクチャ)の処理が完了した後、最初に、表示順番情報TRがTR_DDRより大きい画像を処理するときであればよく、ステップ509の処理の直後であってもよい。
 上述した図5の処理は、図2の動画像予測復号装置200全体の処理に該当するが、とりわけステップ502~508はフレームメモリ管理器209により行われる。
 なお、図5は動画像の復号方法として説明したが、動画像符号化方法の処理にも適用できる。符号化処理を行う場合、ステップ503ではdelta_TRをTR_CURとTR_DDRとの差分から求め、ステップ506ではdelta_TRをTR_CURとTR_PREVとの差分から求めた上で、エントロピー符号化する。また、ステップ509では対象画像を符号化した上で復号する。このような処理は、図1の動画像予測符号化装置100全体の処理に該当するが、とりわけステップ502~508の処理はフレームメモリ管理器114により行われる。
 図6は、変形例に係る動画像予測符号化・復号方法の処理を説明するための模式図である。図6に示す画像601~609は、動画像を構成する画像群の一部であり、図4で説明した画像401~409と同じ処理を示している。ただし、図6では、図4に対し、領域621に示すdelta_TRが追加されている。この領域621からわかるように、対象画像の符号化処理開始時におけるRPの値(前の画像のRP値)によって、delta_TRの求め方が異なる。即ち、画像603~606の符号化処理では、delta_TRは、各画像のTRとTR_DDRとの差分値として求められる。画像607以降の符号化処理では、delta_TRは、各画像のTRとその直前の画像のTRとの差分値として求められる。一方、各画像の復号処理において差分値delta_TRから表示順番情報TRを復元する場合は、差分値の圧縮データを復号して得られた差分値delta_TRとTR_DDRとを加算することで、表示順番情報TRを復元する。それ以降は図4と同じ処理になるので、省略する。
 図6では、仮に画像603~605が編集により欠落したとしても、画像606の表示順番情報TRは、TR_DDRから求めるので、TR=delta_TR+TR_DDR=4+(n+5)=n+9として正しく再現でき、フレームメモリのリフレッシュを誤動作なく制御することができる。仮に、すべての画像のdelta_TRが、復号順において当該画像の表示順番情報と直前の画像の表示順番情報との差分値として求められるとすると、画像603が欠落した場合に、表示順番情報が正しく再生できなくなり、画像605のタイミングでフレームメモリのリフレッシュが実行されてしまう(本来、画像606のタイミングが正しいタイミングである)。
 図6を動画像符号化処理に適用した場合、ランダムアクセス画像(ここでは直近のDDRピクチャ)の処理完了後に、フレームメモリ・リフレッシュの待機中にある画像(画像603~606)の表示順番情報を符号化する際に、当該画像の表示順番情報TRそのものでなく、当該画像の表示順番情報TRとDDRピクチャの表示順番情報TR_DDRとの差分値delta_TRを符号化することにより、フレームメモリ・リフレッシュのタイミングを正しく復元することができる。このため、たとえフレームメモリ・リフレッシュの待機中にある画像が脱落しても、誤動作を回避でき、エラー耐性が強いという効果がある。
 さらに別の例として、差分値delta_TRを符号化する対象としては、ランダムアクセス画像(ここでは直近のDDRピクチャ)の後の、最初に表示順番情報TRがTR_DDRより大きい画像(図6では画像606)を含む1つ以上の画像であってもよい。即ち、ランダムアクセス画像(ここでは直近のDDRピクチャ)の後の、最初に表示順番情報TRがTR_DDRより大きい画像(図6では画像606)を含む1つ以上の画像について、その表示順番情報を符号化する際に、当該画像の表示順番情報TRそのものでなく、当該画像の表示順番情報TRとDDRピクチャの表示順番情報TR_DDRとの差分値delta_TRを符号化してもよい。
 [動画像予測符号化プログラム、動画像予測復号プログラムについて]
 動画像予測符号化装置に係る発明は、コンピュータを動画像予測符号化装置として機能させるための動画像予測符号化プログラムに係る発明として捉えることができる。同様に、動画像予測復号装置に係る発明は、コンピュータを動画像予測復号装置として機能させるための動画像予測復号プログラムに係る発明として捉えることができる。
 動画像予測符号化プログラム及び動画像予測復号プログラムは、例えば、記録媒体に格納されて提供される。なお、記録媒体としては、フレキシブルディスク、CD-ROM、DVD等の記録媒体、あるいはROM等の記録媒体、あるいは半導体メモリ等が例示される。
 図9には、コンピュータを動画像予測符号化装置として機能させるための動画像予測符号化プログラムのモジュールを示す。図9に示すように、動画像予測符号化プログラムP100は、入力モジュールP101、符号化モジュールP102、復元モジュールP103、画像格納モジュールP104、及びメモリ管理モジュールP105を備えている。
 また、図10には、コンピュータを動画像予測復号装置として機能させるための動画像予測復号プログラムのモジュールを示す。図10に示すように、動画像予測復号プログラムP200は、入力モジュールP201、復元モジュールP202、画像格納モジュールP203、及びメモリ管理モジュールP204を備えている。
 上記のように構成された動画像予測符号化プログラムP100及び動画像予測復号プログラムP200は、図8に示す記録媒体10に記憶可能であり、後述するコンピュータ30により実行される。
 図7は、記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図であり、図8は、記録媒体に記憶されたプログラムを実行するためのコンピュータの概観図である。コンピュータとしては、CPUを具備しソフトウエアによる処理や制御を行うDVDプレーヤ、セットトップボックス、携帯電話などを含む。
 図7に示すように、コンピュータ30は、フレキシブルディスクドライブ装置、CD-ROMドライブ装置、DVDドライブ装置等の読み取り装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受信を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。コンピュータ30は、記録媒体10が読み取り装置12に挿入されると、読み取り装置12から記録媒体10に格納された動画像予測符号化プログラムにアクセス可能になり、当該動画像予測符号化プログラムによって、本発明に係る動画像予測符号化装置として動作することが可能になる。同様に、コンピュータ30は、記録媒体10が読み取り装置12に挿入されると、読み取り装置12から記録媒体10に格納された動画像予測復号プログラムにアクセス可能になり、当該動画像予測復号プログラムによって、本発明に係る動画像予測復号装置として動作することが可能になる。
 図8に示すように、動画像予測符号化プログラム又は動画像予測復号プログラムは、搬送波に重畳されたコンピュータデータ信号40としてネットワークを介して提供されるものであってもよい。この場合、コンピュータ30は、通信装置24によって受信された動画像予測符号化プログラム又は動画像予測復号プログラムをメモリ16に格納して実行することができる。
 10…記録媒体、30…コンピュータ、100…動画像予測符号化装置、101…入力端子、102…ブロック分割器、103…予測信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、113…入力端子、114…フレームメモリ管理器、200…動画像予測復号装置、201…入力端子、202…データ解析器、203…逆量子化器、204…逆変換器、205…加算器、206…出力端子、207…フレームメモリ、208…予測信号生成器、209…フレームメモリ管理器、P100…動画像予測符号化プログラム、P101…入力モジュール、P102…符号化モジュール、P103…復元モジュール、P104…画像格納モジュール、P105…メモリ管理モジュール、P200…動画像予測復号プログラム、P201…入力モジュール、P202…復元モジュール、P203…画像格納モジュール、P204…メモリ管理モジュール。

Claims (14)

  1.  動画像を構成する複数の画像を入力する入力手段と、
     入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化手段と、
     生成された前記圧縮画像データを復号することで再生画像を復元する復元手段と、
     復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として格納する画像格納手段と、
     前記画像格納手段を制御するメモリ管理手段と、を具備し、
     前記メモリ管理手段は、前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測符号化装置。
  2.  前記符号化手段は、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像、を含む1つ以上の符号化対象画像の表示順番情報に関するデータとして、前記符号化対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化する、
     ことを特徴とする請求項1に記載の動画像予測符号化装置。
  3.  前記符号化手段は、
     前記ランダムアクセス画像の次に符号化対象となる画像から、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、
     の各画像については、
     各画像の表示順番情報に関するデータとして、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化する、
     ことを特徴とする請求項1に記載の動画像予測符号化装置。
  4.  動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力手段と、
     前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元手段と、
     復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として格納する画像格納手段と、
     前記画像格納手段を制御するメモリ管理手段と、を具備し、
     前記メモリ管理手段は、前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測復号装置。
  5.  前記復元手段は、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を復号する復号処理の完了後に最初に復号対象となる画像、を含む1つ以上の復号対象画像の表示順番情報については、
     当該復号対象画像の表示順番符号化データを復号して得られた、当該復号対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、
     前記ランダムアクセス画像の表示順番情報とを、
     加算することで、
     当該復号対象画像の表示順番情報を復元する、
     ことを特徴とする請求項4に記載の動画像予測復号装置。
  6.  前記復元手段は、
     前記ランダムアクセス画像の次に符号化対象となる画像から、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、
     の各画像についての表示順番情報については、
     当該各画像の表示順番符号化データを復号して得られた、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、
     前記ランダムアクセス画像の表示順番情報とを、
     加算することで、
     当該各画像の表示順番情報を復元する、
     ことを特徴とする請求項4に記載の動画像予測復号装置。
  7.  後続の画像を符号化するために用いられる参照画像を格納するための画像格納手段を備える動画像予測符号化装置、により実行される動画像予測符号化方法であって、
     動画像を構成する複数の画像を入力する入力ステップと、
     入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化ステップと、
     生成された前記圧縮画像データを復号することで再生画像を復元する復元ステップと、
     復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として前記画像格納手段に格納する画像格納ステップと、
     前記画像格納手段を制御するメモリ管理ステップと、を具備し、
     前記メモリ管理ステップにおいて前記動画像予測符号化装置は、
     前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測符号化方法。
  8.  前記符号化ステップにおいて前記動画像予測符号化装置は、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像、を含む1つ以上の符号化対象画像の表示順番情報に関するデータとして、前記符号化対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化する、
     ことを特徴とする請求項7に記載の動画像予測符号化方法。
  9.  前記符号化ステップにおいて前記動画像予測符号化装置は、
     前記ランダムアクセス画像の次に符号化対象となる画像から、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、
     の各画像については、
     各画像の表示順番情報に関するデータとして、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値を符号化する、
     ことを特徴とする請求項7に記載の動画像予測符号化方法。
  10.  後続の画像を復号するために用いられる参照画像を格納するための画像格納手段を備える動画像予測復号装置、により実行される動画像予測復号方法であって、
     動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力ステップと、
     前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元ステップと、
     復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として前記画像格納手段に格納する画像格納ステップと、
     前記画像格納手段を制御するメモリ管理ステップと、を具備し、
     前記メモリ管理ステップにおいて前記動画像予測復号装置は、
     前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測復号方法。
  11.  前記復元ステップにおいて前記動画像予測復号装置は、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を復号する復号処理の完了後に最初に復号対象となる画像、を含む1つ以上の復号対象画像の表示順番情報については、
     当該復号対象画像の表示順番符号化データを復号して得られた、当該復号対象画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、
     前記ランダムアクセス画像の表示順番情報とを、
     加算することで、
     当該復号対象画像の表示順番情報を復元する、
     ことを特徴とする請求項10に記載の動画像予測復号方法。
  12.  前記復元ステップにおいて前記動画像予測復号装置は、
     前記ランダムアクセス画像の次に符号化対象となる画像から、
     表示順番情報が前記ランダムアクセス画像の表示順番情報より大きく且つ前記ランダムアクセス画像を生成する符号化処理の完了後に最初に符号化対象となる画像まで、
     の各画像についての表示順番情報については、
     当該各画像の表示順番符号化データを復号して得られた、当該各画像の表示順番情報と前記ランダムアクセス画像の表示順番情報との差分値と、
     前記ランダムアクセス画像の表示順番情報とを、
     加算することで、
     当該各画像の表示順番情報を復元する、
     ことを特徴とする請求項10に記載の動画像予測復号方法。
  13.  コンピュータを、
     動画像を構成する複数の画像を入力する入力手段と、
     入力された前記画像を画面内予測又は画面間予測のいずれかの方法で符号化することで、ランダムアクセスとなる画像であるランダムアクセス画像、を含む圧縮画像データを生成するとともに、前記画像の表示順番情報に関するデータを符号化する符号化手段と、
     生成された前記圧縮画像データを復号することで再生画像を復元する復元手段と、
     復元された前記再生画像を、後続の画像を符号化するために用いられる参照画像として格納する画像格納手段と、
     前記画像格納手段を制御するメモリ管理手段、
     として動作させ、
     前記メモリ管理手段は、前記ランダムアクセス画像を生成する符号化処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を符号化する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測符号化プログラム。
  14.  コンピュータを、
     動画像を構成する複数の画像を画面内予測又は画面間予測のいずれかの方法で符号化することで得られた、ランダムアクセスとなる画像であるランダムアクセス画像を含む圧縮画像データ、及び、前記画像の表示順番情報に関するデータを符号化することで得られた表示順番符号化データを入力する入力手段と、
     前記圧縮画像データを復号することで再生画像を復元するとともに、前記表示順番符号化データを復号することで表示順番情報を復元する復元手段と、
     復元された前記再生画像を、後続の画像を復号するために用いられる参照画像として格納する画像格納手段と、
     前記画像格納手段を制御するメモリ管理手段、
     として動作させ、
     前記メモリ管理手段は、前記ランダムアクセス画像を復号する復号処理が完了した後、最初に、表示順番情報が前記ランダムアクセス画像の表示順番情報より大きい画像を復号する直前又は直後に、前記画像格納手段に格納された参照画像のうち、前記ランダムアクセス画像を除く参照画像について不要と設定することで、前記画像格納手段をリフレッシュする、
     ことを特徴とする動画像予測復号プログラム。
PCT/JP2011/055915 2010-03-17 2011-03-14 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム WO2011115045A1 (ja)

Priority Applications (28)

Application Number Priority Date Filing Date Title
SG2012068334A SG184079A1 (en) 2010-03-17 2011-03-14 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
KR1020127027048A KR101640872B1 (ko) 2010-03-17 2011-03-14 동화상 예측 부호화 장치, 동화상 예측 부호화 방법, 동화상 예측 부호화 프로그램, 동화상 예측 복호 장치, 동화상 예측 복호 방법, 및 동화상 예측 복호 프로그램
EP11756230.6A EP2549758B1 (en) 2010-03-17 2011-03-14 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
CN201180013583.6A CN102792696B (zh) 2010-03-17 2011-03-14 动态图像预测编码装置、动态图像预测编码方法、动态图像预测解码装置、动态图像预测解码方法
PL11756230T PL2549758T3 (pl) 2010-03-17 2011-03-14 Urządzenie do predykcyjnego kodowania obrazu ruchomego, sposób predykcyjnego kodowania obrazu ruchomego, program do predykcyjnego kodowania obrazu ruchomego, urządzenie do predykcyjnego dekodowania obrazu ruchomego, sposób predykcyjnego dekodowania obrazu ruchomego i program do predykcyjnego dekodowania obrazu ruchomego
CA2793168A CA2793168C (en) 2010-03-17 2011-03-14 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
KR1020167012926A KR101747195B1 (ko) 2010-03-17 2011-03-14 동화상 예측 부호화 장치, 동화상 예측 부호화 방법, 동화상 예측 부호화 프로그램, 동화상 예측 복호 장치, 동화상 예측 복호 방법, 및 동화상 예측 복호 프로그램
AU2011228218A AU2011228218B2 (en) 2010-03-17 2011-03-14 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
ES11756230.6T ES2655416T3 (es) 2010-03-17 2011-03-14 Dispositivo de codificación de predicción de imagen en movimiento, procedimiento de codificación de predicción de imagen en movimiento, programa de codificación de predicción de imagen en movimiento, dispositivo de descodificación de predicción de imagen en movimiento, procedimiento de descodificación de predicción de imagen en movimiento y programa de descodificación de predicción de imagen en movimiento
RU2012144029/08A RU2568310C2 (ru) 2010-03-17 2011-03-14 Устройство кодирования движущегося изображения с предсказанием, способ кодирования движущегося изображения с предсказанием, программа кодирования движущегося изображения с предсказанием, устройство декодирования движущегося изображения с предсказанием, способ декодирования движущегося изображения с предсказанием и программа декодирования движущегося изображения с предсказанием
BR112012023322A BR112012023322B1 (pt) 2010-03-17 2011-03-14 dispositivo de codificação preditiva de imagem em movimento, método de codificação preditiva de imagem em movimento, dispositivo de decodificação preditiva de imagem em movimento e método de decodificação preditiva de imagem em movimento
MX2012010614A MX2012010614A (es) 2010-03-17 2011-03-14 Dispositivo de codificacion de prediccion de imagen movil, metodo de codificacion de prediccion de imagen movil, programa de codificacion de prediccion de imagen movil, dispositivo de descodificacion de prediccion de imagen movil, metodo de decodificacion de prediccion de imagen movil y programa de descodificacion de prediccion de imagen movil.
NO11756230A NO2549758T3 (ja) 2010-03-17 2011-03-14
KR1020177015372A KR101867461B1 (ko) 2010-03-17 2011-03-14 동화상 예측 부호화 장치, 동화상 예측 부호화 방법, 동화상 예측 부호화 프로그램, 동화상 예측 복호 장치, 동화상 예측 복호 방법, 및 동화상 예측 복호 프로그램
US13/618,066 US9113171B2 (en) 2010-03-17 2012-09-14 Moving image prediction encoding/decoding system
US14/822,657 US10178407B2 (en) 2010-03-17 2015-08-10 Moving image prediction encoding/decoding system
AU2016200188A AU2016200188B2 (en) 2010-03-17 2016-01-13 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2018202171A AU2018202171B2 (en) 2010-03-17 2018-03-27 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2018202169A AU2018202169B2 (en) 2010-03-17 2018-03-27 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2018202170A AU2018202170B2 (en) 2010-03-17 2018-03-27 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
US16/213,684 US10390042B2 (en) 2010-03-17 2018-12-07 Moving image prediction encoding/decoding system
US16/213,660 US10298953B2 (en) 2010-03-17 2018-12-07 Moving image prediction encoding/decoding system
US16/376,966 US10715829B2 (en) 2010-03-17 2019-04-05 Moving image prediction encoding/decoding system
US16/457,066 US10567794B2 (en) 2010-03-17 2019-06-28 Moving image prediction encoding/decoding system
AU2019280003A AU2019280003B2 (en) 2010-03-17 2019-12-11 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2019280009A AU2019280009B2 (en) 2010-03-17 2019-12-11 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2021200759A AU2021200759B2 (en) 2010-03-17 2021-02-05 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program
AU2021266226A AU2021266226B2 (en) 2010-03-17 2021-11-09 Moving image prediction encoding device, moving image prediction encoding method, moving image prediction encoding program, moving image prediction decoding device, moving image prediction decoding method, and moving image prediction decoding program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-061337 2010-03-17
JP2010061337A JP2011199396A (ja) 2010-03-17 2010-03-17 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/618,066 Continuation US9113171B2 (en) 2010-03-17 2012-09-14 Moving image prediction encoding/decoding system

Publications (1)

Publication Number Publication Date
WO2011115045A1 true WO2011115045A1 (ja) 2011-09-22

Family

ID=44649138

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/055915 WO2011115045A1 (ja) 2010-03-17 2011-03-14 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム

Country Status (17)

Country Link
US (6) US9113171B2 (ja)
EP (3) EP2549758B1 (ja)
JP (1) JP2011199396A (ja)
KR (3) KR101747195B1 (ja)
CN (3) CN105187842B (ja)
AU (9) AU2011228218B2 (ja)
BR (1) BR112012023322B1 (ja)
CA (8) CA3169174A1 (ja)
ES (2) ES2655919T3 (ja)
MX (1) MX2012010614A (ja)
NO (2) NO2942965T3 (ja)
PL (2) PL2942965T3 (ja)
PT (2) PT2942965T (ja)
RU (6) RU2601134C2 (ja)
SG (2) SG184079A1 (ja)
TW (7) TWI650002B (ja)
WO (1) WO2011115045A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130235928A1 (en) * 2012-03-06 2013-09-12 Apple Inc. Advanced coding techniques
JP2014524196A (ja) * 2011-07-02 2014-09-18 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
CN104396256A (zh) * 2012-06-29 2015-03-04 索尼公司 解码设备和解码方法
US9113171B2 (en) 2010-03-17 2015-08-18 Ntt Docomo Inc. Moving image prediction encoding/decoding system
CN107105265A (zh) * 2011-10-18 2017-08-29 株式会社Ntt都科摩 动态图像预测解码方法、动态图像预测解码装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10034018B2 (en) 2011-09-23 2018-07-24 Velos Media, Llc Decoded picture buffer management
JP6045222B2 (ja) * 2012-06-28 2016-12-14 株式会社Nttドコモ 動画像予測復号装置、方法及びプログラム
GB2516425B (en) * 2013-07-17 2015-12-30 Gurulogic Microsystems Oy Encoder and decoder, and method of operation
KR102133978B1 (ko) 2013-11-13 2020-07-14 삼성전자주식회사 압축 데이터를 이용하여 패널 셀프 리프레쉬를 수행할 수 있는 타이밍 컨트롤러, 이의 동작 방법, 및 상기 타이밍 컨트롤러를 포함하는 데이터 처리 시스템
WO2017075804A1 (en) * 2015-11-06 2017-05-11 Microsoft Technology Licensing, Llc Flexible reference picture management for video encoding and decoding
JP6641344B2 (ja) * 2017-12-05 2020-02-05 三菱電機株式会社 符号化装置
GB2617790B (en) * 2019-03-20 2024-03-13 V Nova Int Ltd Low complexity enhancement video coding
CN111124337B (zh) * 2019-12-17 2023-08-01 西安万像电子科技有限公司 图像显示方法及系统
CN115336280A (zh) * 2020-03-31 2022-11-11 北京达佳互联信息技术有限公司 用于视频编解码中的高级语法的方法和设备
CN117221604A (zh) * 2020-04-03 2023-12-12 北京达佳互联信息技术有限公司 用于视频编解码中的高级语法的方法和设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004248265A (ja) * 2003-01-20 2004-09-02 Matsushita Electric Ind Co Ltd 画像符号化方法
WO2005006763A1 (en) 2003-07-09 2005-01-20 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images with delayed reference picture refresh
JP2006246277A (ja) * 2005-03-07 2006-09-14 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2161377C2 (ru) * 1992-12-04 2000-12-27 Сони Корпорейшн Устройство и способ подготовки к записи на носителе информации кодируемого с переменным параметром сигнала, устройство и способ последовательного сигнала, способ воспроизведения шаблонов с носителя информации
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
CN101399987B (zh) * 2001-10-17 2010-12-29 松下电器产业株式会社 动态图像编码方法及装置
CN101656882B (zh) * 2001-11-06 2013-04-17 松下电器产业株式会社 运动图像编码方法及运动图像解码方法
JP4355156B2 (ja) * 2002-04-16 2009-10-28 パナソニック株式会社 画像復号化方法及び画像復号化装置
CA2460471C (en) * 2002-07-11 2012-02-07 Matsushita Electric Industrial Co., Ltd. Picture encoding method and picture decoding method
CN101232616B (zh) * 2002-07-16 2015-07-22 诺基亚有限公司 用于在视频编码中随机存取和逐步更新图像的方法
TWI249356B (en) * 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
EP1595405B1 (en) * 2003-02-18 2019-12-04 Nokia Technologies Oy Method and device for transmitting media data in nal units over rtp
JP2004260236A (ja) 2003-02-24 2004-09-16 Matsushita Electric Ind Co Ltd 動画像の符号化方法および復号化方法
MXPA05005087A (es) * 2003-03-03 2005-07-01 Matsushita Electric Ind Co Ltd Metodo de codificacion y decodificacion de imagenes.
JP4591657B2 (ja) * 2003-12-22 2010-12-01 キヤノン株式会社 動画像符号化装置及びその制御方法、プログラム
RU2370909C2 (ru) * 2004-07-01 2009-10-20 Квэлкомм Инкорпорейтед Способ и устройство для использования способов преобразования кадров с повышением частоты кадров при кодировании масштабируемого видео
CN1998242B (zh) * 2004-08-11 2010-07-07 株式会社日立制作所 图像编码装置和图像解码装置
RU2287909C2 (ru) * 2004-12-15 2006-11-20 Московский технический университет связи и информатики Способ преобразования цифрового сигнала изображения и устройство для его реализации
CN100551074C (zh) * 2005-01-17 2009-10-14 松下电器产业株式会社 图像解码方法、图像解码装置和集成电路
EP1839446A1 (en) * 2005-01-19 2007-10-03 THOMSON Licensing Method and apparatus for real time parallel encoding
GB2438776B (en) * 2005-02-09 2010-06-09 March Networks Corp Method and system for low-subband content discrimination
US8036281B2 (en) * 2005-06-01 2011-10-11 Canon Kabushiki Kaisha Image coding apparatus and image coding method
RU2368095C1 (ru) * 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
RU2369038C1 (ru) * 2005-11-30 2009-09-27 Кабусики Кайся Тосиба Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
US8155185B2 (en) * 2005-12-05 2012-04-10 Canon Kabushiki Kaisha Image coding apparatus and method
TW200806040A (en) * 2006-01-05 2008-01-16 Nippon Telegraph & Telephone Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
WO2007077942A1 (ja) * 2006-01-05 2007-07-12 Nippon Telegraph And Telephone Corporation 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
WO2007080223A1 (en) * 2006-01-10 2007-07-19 Nokia Corporation Buffering of decoded reference pictures
US20080165860A1 (en) * 2006-08-31 2008-07-10 Zohair Sahraoui H.264 Data processing
BRPI0717321A2 (pt) * 2006-10-13 2013-10-22 Thomson Licensing Método para gerenciamento de imagens de referência envolvendo codificação de vídeo com mútiplas visualizações
EP2095643A2 (fr) * 2006-12-21 2009-09-02 THOMSON Licensing Procede de decodage d'un bloc d'une image video
JP2008193627A (ja) * 2007-01-12 2008-08-21 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法
JP5023739B2 (ja) * 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
EP1983759A1 (en) * 2007-04-19 2008-10-22 Matsushita Electric Industrial Co., Ltd. Estimation of separable adaptive interpolation filters for hybrid video coding
JP5188875B2 (ja) * 2007-06-04 2013-04-24 株式会社エヌ・ティ・ティ・ドコモ 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム
US9648325B2 (en) * 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8265144B2 (en) * 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8699808B2 (en) * 2007-10-15 2014-04-15 Chih-Ta Star Sung Method and apparatus of temporary image frame compression
FR2924296B1 (fr) * 2007-11-28 2010-05-28 Canon Kk Procede et dispositif de traitement d'un flux de donnees multimedia hierarchique transmis sur un reseau avec perte
JP5056560B2 (ja) * 2008-03-17 2012-10-24 富士通株式会社 符号化装置、復号化装置、符号化方法および復号化方法
JP4935746B2 (ja) * 2008-04-07 2012-05-23 富士通株式会社 動画像符号化装置、動画像復号化装置及びその符号化、復号化方法
JP2009296078A (ja) 2008-06-03 2009-12-17 Victor Co Of Japan Ltd 符号化データ再生装置、符号化データ再生方法、および符号化データ再生プログラム
EP2157799A1 (en) * 2008-08-18 2010-02-24 Panasonic Corporation Interpolation filter with local adaptation based on block edges in the reference frame
JP4962525B2 (ja) * 2009-04-08 2012-06-27 ソニー株式会社 再生装置、再生方法、およびプログラム
JP2010245970A (ja) * 2009-04-08 2010-10-28 Sony Corp 再生装置、再生方法、およびプログラム
US8976871B2 (en) * 2009-09-16 2015-03-10 Qualcomm Incorporated Media extractor tracks for file format track selection
JP2011199396A (ja) 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
KR101750495B1 (ko) * 2010-04-16 2017-06-27 에스케이텔레콤 주식회사 인터 예측 방법 및 그 인터 예측 방법을 이용한 동영상 부호화/복호화 방법
US9516379B2 (en) * 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
WO2013012372A1 (en) * 2011-07-15 2013-01-24 Telefonaktiebolaget L M Ericsson (Publ) An encoder and method thereof for assigning a lowest layer identity to clean random access pictures
US9479774B2 (en) 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
KR102266902B1 (ko) * 2014-01-13 2021-06-18 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004248265A (ja) * 2003-01-20 2004-09-02 Matsushita Electric Ind Co Ltd 画像符号化方法
WO2005006763A1 (en) 2003-07-09 2005-01-20 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images with delayed reference picture refresh
JP2007507128A (ja) * 2003-07-09 2007-03-22 松下電器産業株式会社 参照ピクチャのリフレッシュを遅延させて行うビデオ画像の符号化および復号化
JP2006246277A (ja) * 2005-03-07 2006-09-14 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IAIN E.G RICHARDSON: "H.264 and MPEG-4 Video Compression", 2003, JOHN WILEY & SONS
See also references of EP2549758A4

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10178407B2 (en) 2010-03-17 2019-01-08 Ntt Docomo, Inc Moving image prediction encoding/decoding system
US10715829B2 (en) 2010-03-17 2020-07-14 Ntt Docomo, Inc. Moving image prediction encoding/decoding system
US10567794B2 (en) 2010-03-17 2020-02-18 Ntt Docomo, Inc. Moving image prediction encoding/decoding system
US9113171B2 (en) 2010-03-17 2015-08-18 Ntt Docomo Inc. Moving image prediction encoding/decoding system
US10390042B2 (en) 2010-03-17 2019-08-20 Ntt Docomo, Inc. Moving image prediction encoding/decoding system
US10298953B2 (en) 2010-03-17 2019-05-21 Ntt Docomo, Inc Moving image prediction encoding/decoding system
US9788003B2 (en) 2011-07-02 2017-10-10 Samsung Electronics Co., Ltd. Method and apparatus for multiplexing and demultiplexing video data to identify reproducing state of video data
JP2017192157A (ja) * 2011-07-02 2017-10-19 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
JP2016131391A (ja) * 2011-07-02 2016-07-21 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
JP2014524196A (ja) * 2011-07-02 2014-09-18 サムスン エレクトロニクス カンパニー リミテッド ビデオデータの再生状態識別のためのビデオデータの多重化方法及び装置、逆多重化方法及び装置
CN107105265B (zh) * 2011-10-18 2018-06-26 株式会社Ntt都科摩 动态图像预测解码方法、动态图像预测解码装置
CN107105265A (zh) * 2011-10-18 2017-08-29 株式会社Ntt都科摩 动态图像预测解码方法、动态图像预测解码装置
US20130235928A1 (en) * 2012-03-06 2013-09-12 Apple Inc. Advanced coding techniques
CN104396256B (zh) * 2012-06-29 2018-11-06 威勒斯媒体国际有限公司 解码设备和解码方法
CN104396256A (zh) * 2012-06-29 2015-03-04 索尼公司 解码设备和解码方法

Also Published As

Publication number Publication date
US20190327488A1 (en) 2019-10-24
CA3169174A1 (en) 2011-09-22
TWI678913B (zh) 2019-12-01
AU2019280003A1 (en) 2020-01-16
AU2021200759B2 (en) 2021-09-09
ES2655416T3 (es) 2018-02-20
US9113171B2 (en) 2015-08-18
CN105187842A (zh) 2015-12-23
AU2018202171B2 (en) 2019-09-12
TWI619373B (zh) 2018-03-21
CN104768020A (zh) 2015-07-08
AU2019280003B2 (en) 2021-01-21
CN102792696A (zh) 2012-11-21
AU2018202170A1 (en) 2018-04-26
TW202005374A (zh) 2020-01-16
US20190110069A1 (en) 2019-04-11
PT2942965T (pt) 2018-02-09
KR20170066709A (ko) 2017-06-14
RU2628260C1 (ru) 2017-08-15
AU2018202170B2 (en) 2019-08-29
CA2793168A1 (en) 2011-09-22
KR101747195B1 (ko) 2017-06-14
PT2549758T (pt) 2018-01-15
CA3041891C (en) 2020-11-10
CA3081303A1 (en) 2011-09-22
US20130044813A1 (en) 2013-02-21
TWI670965B (zh) 2019-09-01
CA3094540C (en) 2022-09-20
BR112012023322A2 (pt) 2016-05-24
TW201206202A (en) 2012-02-01
AU2019280009B2 (en) 2021-03-04
EP2549758A1 (en) 2013-01-23
TW201820865A (zh) 2018-06-01
CA2793168C (en) 2016-09-20
NO2942965T3 (ja) 2018-05-12
EP2942965B1 (en) 2017-12-13
AU2021266226A1 (en) 2021-12-02
PL2942965T3 (pl) 2018-05-30
KR20130016289A (ko) 2013-02-14
AU2018202169A1 (en) 2018-04-26
ES2655919T3 (es) 2018-02-22
RU2015122410A (ru) 2015-10-27
US20150350644A1 (en) 2015-12-03
TW201941607A (zh) 2019-10-16
JP2011199396A (ja) 2011-10-06
US10567794B2 (en) 2020-02-18
MX2012010614A (es) 2013-02-26
AU2016200188A1 (en) 2016-02-04
CA3009695C (en) 2020-07-14
US10390042B2 (en) 2019-08-20
EP2549758B1 (en) 2017-12-06
CA2935201C (en) 2019-07-02
RU2568310C2 (ru) 2015-11-20
TWI650002B (zh) 2019-02-01
SG184079A1 (en) 2012-10-30
CA2935201A1 (en) 2011-09-22
TWI611686B (zh) 2018-01-11
TW201515441A (zh) 2015-04-16
AU2016200188B2 (en) 2018-01-04
CA3094541A1 (en) 2011-09-22
US10715829B2 (en) 2020-07-14
RU2690220C1 (ru) 2019-05-31
CN104768020B (zh) 2018-01-16
RU2676408C1 (ru) 2018-12-28
TWI479895B (zh) 2015-04-01
AU2021266226B2 (en) 2023-01-12
TW201808005A (zh) 2018-03-01
CN105187842B (zh) 2018-06-29
PL2549758T3 (pl) 2018-03-30
SG10201501390XA (en) 2015-04-29
CN102792696B (zh) 2015-10-21
AU2011228218A1 (en) 2012-10-18
TW201914301A (zh) 2019-04-01
US10178407B2 (en) 2019-01-08
AU2018202171A1 (en) 2018-04-26
CA3094540A1 (en) 2011-09-22
AU2021200759A1 (en) 2021-03-04
KR101640872B1 (ko) 2016-07-19
US20190116378A1 (en) 2019-04-18
US10298953B2 (en) 2019-05-21
EP2549758A4 (en) 2015-11-25
EP2942965A2 (en) 2015-11-11
US20190238885A1 (en) 2019-08-01
EP2942965A3 (en) 2016-03-09
AU2019280009A1 (en) 2020-01-16
NO2549758T3 (ja) 2018-05-05
RU2012144029A (ru) 2014-05-10
AU2018202169B2 (en) 2019-09-12
KR20160058977A (ko) 2016-05-25
RU2652438C1 (ru) 2018-04-26
CA3094541C (en) 2022-10-25
TWI691198B (zh) 2020-04-11
CA3009695A1 (en) 2011-09-22
BR112012023322B1 (pt) 2018-09-25
AU2011228218B2 (en) 2016-03-31
KR101867461B1 (ko) 2018-06-14
RU2601134C2 (ru) 2016-10-27
EP3300369A1 (en) 2018-03-28
CA3041891A1 (en) 2011-09-22
CA3081303C (en) 2022-06-28

Similar Documents

Publication Publication Date Title
WO2011115045A1 (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
KR101817272B1 (ko) 동화상 예측 부호화 및 복호 장치, 방법, 그리고 프로그램
JP5753595B2 (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
JP6229023B2 (ja) 動画像予測復号方法及び動画像予測復号装置
JP5977852B2 (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
JP2018026872A (ja) 動画像予測復号方法及び動画像予測復号装置
JP6967653B2 (ja) 動画像予測復号方法
JP6637151B2 (ja) 動画像予測復号方法
JP2017073798A (ja) 動画像予測復号装置及び動画像予測復号方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180013583.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11756230

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2793168

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 12012501828

Country of ref document: PH

Ref document number: MX/A/2012/010614

Country of ref document: MX

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011756230

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2011228218

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 8620/CHENP/2012

Country of ref document: IN

ENP Entry into the national phase

Ref document number: 20127027048

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2012144029

Country of ref document: RU

ENP Entry into the national phase

Ref document number: 2011228218

Country of ref document: AU

Date of ref document: 20110314

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112012023322

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112012023322

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20120914

WWE Wipo information: entry into national phase

Ref document number: IDP00201607969

Country of ref document: ID